JP5701911B2 - クエリモデルに基づく誘導検索 - Google Patents

クエリモデルに基づく誘導検索 Download PDF

Info

Publication number
JP5701911B2
JP5701911B2 JP2012557043A JP2012557043A JP5701911B2 JP 5701911 B2 JP5701911 B2 JP 5701911B2 JP 2012557043 A JP2012557043 A JP 2012557043A JP 2012557043 A JP2012557043 A JP 2012557043A JP 5701911 B2 JP5701911 B2 JP 5701911B2
Authority
JP
Japan
Prior art keywords
information
query
model
models
new query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012557043A
Other languages
English (en)
Other versions
JP2013531282A5 (ja
JP2013531282A (ja
Inventor
リアオ・ジエン
リン・フオン
チャン・ショウソーン
チャン・チン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2013531282A publication Critical patent/JP2013531282A/ja
Publication of JP2013531282A5 publication Critical patent/JP2013531282A5/ja
Application granted granted Critical
Publication of JP5701911B2 publication Critical patent/JP5701911B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

[関連出願の相互参照]
本出願は、あらゆる目的のために、参照によって本明細書に組み込まれる、2010年3月10日に出願された、発明の名称を「METHOD FOR IMPLEMENTING GUIDED SEARCH, GUIDED SEARCH SERVER AND INFORMATION PROCESSING SYSTEM(誘導検索を実行するための方法、誘導検索サーバ、及び情報処理システム)」とする中国特許出願第201010123209.9号に基づく優先権を主張する。
本発明は、情報処理の技術に関し、特に、誘導検索に関する。
既存の誘導検索システムにおいて、ユーザは、入力テキストに関連する情報を取得するために、クライアントにおいて何らかのテキストをクエリとして入力するのが一般的である。クライアントから提供されるテキストを取得した後、誘導検索サーバは、そのテキストを解析し、ユーザのクエリ意図を特定し、ユーザによって入力されたテキストに関連する情報をクライアントに提供し、ユーザのクエリ範囲を狭め、ユーザが自身の必要とする情報を取り出せるようにする。
目下のところ、誘導検索サーバは、一般に、クエリ情報と誘導情報との間におけるマッピング関係のマッピングテーブルを事前に記憶している。例えば、クエリ情報は、ユーザがクライアントにおいて入力するテキストであり、誘導情報は、ユーザが入力するテキストに関連する情報である。クエリ情報を取得した後、誘導検索サーバは、クエリ情報に対応する誘導情報をマッピングテーブルで検索し、マッピングテーブルから誘導情報が取り出された場合に、クエリ情報に対応する取り出された誘導情報をクライアントに伝送する。
既存の誘導検索システムにおいて、誘導検索サーバは、ユーザが入力するクエリ情報に対応する誘導情報をマッピングテーブルから取り出し、ユーザが入力するクエリ情報がマッピングテーブルの中のクエリ情報と完全に一致する場合にのみ、取り出された誘導情報をクライアントに伝送するのが一般的である。ユーザが入力するクエリ情報が、マッピングテーブルの中のどのクエリ情報とも一致しない場合は、誘導検索サーバは、ユーザが入力するクエリ情報に対応する誘導情報をマッピングテーブルから取り出すことはできないのが一般的である。したがって、既存の誘導検索において、誘導検索サーバは、マッピングテーブルの中に存在しないクエリ情報に対応する誘導情報をクライアントに提供することはできないのが一般的である。
発明の様々な実施形態が、以下の詳細な説明及び添付の図面で開示される。
誘導検索技術を実行するネットワーク環境の一実施形態を示す概略図である。
誘導検索を実施するためのプロセスの一実施形態を示すフローチャートである。
クエリ情報に基づいて1つ又は2つ以上のモデルを導出するためのプロセスの一実施形態を示すフローチャートである。
モデルの類似度スコアを計算するためのプロセスの一実施形態を示すフローチャートである。
プロセス200を実行するように構成された誘導検索サーバの一実施形態を示すブロック図である。
誘導検索を実施するためのプロセスの別の一実施形態を示すフローチャートである。
プロセス600を実行するように構成された誘導検索サーバの一実施形態を示すブロック図である。
本発明は、プロセス、装置、システム、合成物、コンピュータによって読み取り可能なストレージ媒体に実装されたコンピュータプログラム製品、並びに/又は結合先のメモリに記憶された命令及び/若しくは結合先のメモリによって提供される命令を実行するように構成されたプロセッサなどのプロセッサを含む、数々の形態で実装することができる。本明細書では、これらの実装形態、又は本発明がとりえるその他のあらゆる形態を、技術と称することができる。総じて、開示されたプロセスのステップの順序は、本発明の範囲内で可変である。別途明記されない限り、タスクを実施するように構成されるとして説明されるプロセッサ又はメモリなどのコンポーネントは、所定時にタスクを実施するように一時的に構成される汎用コンポーネントとして、又はタスクを実施するように製造された特殊コンポーネントとして実装することができる。本明細書で使用される「プロセッサ」という用語は、コンピュータプログラム命令などのデータを処理するように構成された1つ又は2つ以上のデバイス、回路、及び/又は処理コアを言う。
本発明の原理を例示す添付の図面とともに、以下で、発明の1つ又は2つ以上の実施形態の詳細な説明が提供される。本発明は、このような実施形態との関連のもとで説明されているが、いかなる実施形態にも限定されない。本発明の範囲は、特許請求の範囲によってのみ限定され、本発明は、数々の代替形態、変更形態、及び均等物を内包している。以下の説明では、本発明の完全な理解を可能にするために、数々の具体的詳細が明記されている。これらの詳細は、例示を目的として提供されるものであり、本発明は、これらの詳細の一部又は全部を伴わずとも、特許請求の範囲にしたがって実施することができる。明瞭さを期するため、本発明に関連する技術分野において知られる技術要素は、本発明が不必要に不明瞭にされないように詳細な説明を省略される。
誘導検索技術が説明される。各種の実施形態において、事前に記憶されたクエリと、対応する誘導情報とのマッピング情報を示す1つ又は2つ以上のモデルが、新しいクエリに基づいて導出される。誘導情報の取り出しを促すために、作成されたモデルと、新しいクエリとの類似度が決定される。
図1は、誘導検索技術を実行するネットワーク環境の一実施形態を示す概略図である。
ユーザは、自身の検索クエリをクライアント102に入力し、クライアント102は、検索を実施するために、インターネットなどのネットワークを通じて誘導検索システム101とやり取りする。各種の実施形態において、クライアント及び誘導検索システムは、パソコン、サーバコンピュータ、スマートフォンなどの手持ち式のすなわち携帯型のデバイス、フラットパネルデバイス、マルチプロセッサシステム、マイクロプロセッサベースのシステム、セットトップボックス、プログラマブル家庭用電子機器、ネットワークPC、ミニコンピュータ、大規模コンピュータ、特殊用途向けデバイス、上記のシステム若しくはデバイスの任意を含む分散コンピューティング環境、又は1つ若しくは2つ以上のプロセッサと、該プロセッサに結合され該プロセッサに命令を提供するように構成されたメモリと、を含むその他のハードウェア/ソフトウェア/ファームウェアの組み合わせなどの、任意の適切なコンピューティングデバイスを使用して実装することができる。
クエリ情報は、1つ又は2つ以上の英数字列や記号などを含む要素を含むことができる。例えば、実際の応用では、環境は、電子商取引プラットフォームであり、クエリ情報は、ユーザが興味を持っている製品の名前及び属性を含むことができる。
誘導検索システムは、クエリ情報に基づいて誘導情報を検索し、取り出された誘導情報を、ユーザへの表示のためにクライアントに提示する。誘導情報をどのように取得するかの詳細が、以下で説明される。
本明細書で使用される誘導情報という用語は、ユーザがより迅速に且つより正確に所望の情報を取り出すことを助ける情報を言う。各種の実施形態において、誘導情報は、カテゴリをベースとした誘導情報(例えば、「電子機器」や「健康管理」など)や、属性をベースとした誘導情報(例えば、「赤」や「充電式バッテリが含まれる」など)などを含む。例示を目的として、以下の実施例では、カテゴリをベースとした誘導情報が広く論じられるが、説明される技術は、属性をベースとした誘導情報又はその他のタイプの誘導情報にも適用することができる。
一部の実施形態では、(図では別々のデータベースとして示されているが、その他の実装形態では統合可能である)カテゴリ誘導データベース104又は属性誘導データベース106などの誘導情報データベースの中に、クエリと、対応するそれぞれの誘導情報との間における対応関係が記憶されている。対応関係は、過去情報(例えば、これまでのユーザクエリと、ユーザによる選択の結果のカテゴリとに関する記録)、システム構成(例えば、システム管理者によってセットアップされた、クエリ情報と、対応するカテゴリとの間におけるマッピング)、又はその他の任意の適切な技術に基づいて確立することができる。クエリと誘導情報との間におけるマッピング関係は、モデルとして言及される。一部の実施形態では、関係の強さを測定するために、すなわち、誘導情報によって指定される特定のカテゴリや属性などに対して特定のクエリがどの程度の可能性でマッピングされそうかを測定するために、信頼度レベルが使用される。
例えば、或る電子商取引サイトが、製品モデル「N95」のNokiaによる携帯電話及び同じ製品モデルの3Mによるフェイスマスクを販売している。誘導情報データベースは、したがって、クエリ「N95」を、「携帯電話」、「電子機器」、及び「健康&医療」などのカテゴリに対してマッピングする。誘導情報データベースは、また、クエリを、「Nokia」及び「3M」(ブランド名)などの属性に対してもマッピングすることができる。
一部の実施形態では、要求したアイテムを検索するために、選択を行うユーザに対して複数の誘導情報が提示される。例えば、「N95」を求めるクエリを入力したユーザには、カテゴリ誘導選択肢「携帯電話」、「電子機器」、及び「健康&医療」を与えられるだろう。ユーザは、検索を遂行するために、自身の意図を最もよく表していると見なされるカテゴリを選択する。例えば、検索エンジンは、興味が持たれている(1つ又は2つ以上の)製品を見つけるために、選択されたカテゴリ情報と、元のクエリとを組み合わせることができる。
図2は、誘導検索を実施するためのプロセスの一実施形態を示すフローチャートである。プロセス200は、図1の100などの誘導検索システムによって実施することができる。
ステップ201では、ユーザによって入れられたクエリ情報が、クライアントから取得される。各種の実施形態において、クエリ情報は、複数のワード、フレーズ、及び/又は記号を含むことができる。
ステップ202では、1つ又は2つ以上のモデルを導出するために、クエリ情報が処理される。
一部の実施形態では、クエリ情報を処理するために及びモデルを導出するために、自然言語処理技術が使用される。クエリ情報を処理してモデルを取得するための技術の例として、構文解析、N−Grams(例えば、クエリ情報に基づいて、Nワードのフレーズを導出する)、Skip−Grams(例えば、クエリ情報に基づいて、ワードをスキップされたフレーズを導出する)などが挙げられる。
一部の実施形態では、誘導検索サーバは、幾つかのモデルを導出するために、複数の処理技術を使用してクエリ情報を解析する。モデルは、クエリ情報から抽出された及び/又はクエリ情報に基づいて変換された情報であってクエリ情報を特徴付ける情報を含む。用いられる抽出技術に応じ、モデルは、クエリ情報の一部分及び/又は翻訳されたクエリ情報を含むことができる。例えば、クエリ情報「FMトランスミッタを伴ったカーMP3プレーヤ」は、クエリ文字列の一部分を含む「カーMP3プレーヤ」、「カープレーヤ」、及び「FMトランスミッタ」などになるかもしれない。別の例では、同じクエリが、翻訳モデル「カーオーディオ機器」になるかもしれない。
ステップ203では、クエリに対するモデルの類似度が決定される。モデルの類似度スコアは、モデルがクエリ情報に類似する程度を表している。類似度は、モデルワードの特性及び/又はスキップされたワードの特性(例えば、品詞や単語間距離など)に基づいて計算することができる。一部の実施形態では、モデルの類似度スコアは、モデルの作成にあたってスキップされたワードに少なくとも部分的に基づいて計算される。各スキップされたワードは、ペナルティスコアをもたらす。類似度スコアを計算するために、スキップされたワードの全てのペナルティスコアの合計が計算される。各種の実装形態において、数々の類似度計算技術を用いることができ、その一例が、以下で示される。
ステップ204では、誘導検索サーバは、計算された類似度に基づいて、それぞれのモデルを順位付けする。それぞれのモデルは、類似度が高い順又は低い順に順位付けすることができる。一部の実施形態では、このステップは、随意に省略され、類似度に基づいて選択がなされる。
クエリ情報「FMトランスミッタを伴ったカーMP3プレーヤ」を例にとると、以下のモデル、「プレーヤ」(中心ワード)、「MP3プレーヤ」(中心フレーズ)、「カーMP3プレーヤ」(指定の長さ3を有するフレーズ)、及び「トランスミッタを伴ったカーMP3プレーヤ」(ワードをスキップされたフレーズ)が取得されるだろう。各モデルは、類似度スコアに関連付けられる。この例では、スコアが高いほど、モデルが元のクエリに類似している。モデルをスコアが高い順に順位付けすると、「トランスミッタを伴ったカーMP3プレーヤ」、「カーMP3プレーヤ」、「MS3プレーヤ」、及び「プレーヤ」になる。
ステップ205では、少なくとも幾つかのモデルに対応する誘導情報が、データベースにおいて探索される。例えば、検索キーワードとしてモデルを使用して、テーブルマッピングクエリ及び検索結果(例えばカテゴリ)を探索することができる。一部の実施形態では、誘導検索サーバは、それぞれのモデルを類似度の高い順に順位付けする。この場合、誘導検索サーバは、順位付けリストの中で1番目のモデルをキーワードとして使用することによって、モデルの中で最も高位のモデルに対応する誘導情報をデータベースにおいて検索することができる。順位付けリストのなかで1番目のモデルに対応する誘導情報が取り出されると、誘導検索サーバは、1番目のモデルに対応する取り出された誘導情報をクライアントに伝送することができ、そうでないならば、誘導検索サーバは、キーワードとしての順位付けリストのなかで2番目のモデルに対応する誘導情報をデータベースで検索することができ、モデルの1つに対応する誘導情報を取り出すまで、又は全てのモデルに対応する誘導情報をデータベースで検索するまで、以下同様に繰り返すことができる。
クエリ情報「トランスミッタ911を伴ったカーMP3プレーヤ」を例にとると、誘導検索サーバは、モデル:「プレーヤ」(中心ワード)、「MP3プレーヤ」(中心フレーズ)、「カーMP3プレーヤ」(指定の長さを有するフレーズ)、及び「トランスミッタを伴ったカーMP3プレーヤ」(ワードをスキップされたフレーズ)を抽出するであろう。類似度は、スコアによって表され、誘導検索サーバは、それぞれのモデルのスコアを計算しており、モデルは、スコアの高い順に、それぞれ、「トランスミッタを伴ったカーMP3プレーヤ」、「カーMP3プレーヤ」、「MS3プレーヤ」、及び「プレーヤ」になるだろう。したがって、誘導検索サーバは、モデル:「トランスミッタを伴ったカーMP3プレーヤ」、「カーMP3プレーヤ」、「MS3プレーヤ」、及び「プレーヤ」を、スコアの高い順に順位付けする。その後、誘導検索サーバは、先ず、「トランスミッタを伴ったカーMP3プレーヤ」をインデックス/キーワードとして使用し、「トランスミッタを伴ったカーMP3プレーヤ」に対応するカテゴリ(誘導情報)をマッピングテーブルで検索し、対応するカテゴリが取り出されたならば、検索を終了させる。取り出されなかったならば、誘導検索テーブルは、「カーMP3プレーヤ」をキーワードとして使用し、「カーMP3プレーヤ」に対応するカテゴリ(誘導情報)をマッピングテーブルで検索し、対応するカテゴリが取り出されたならば、検索を終了させる。取り出されなかったならば、誘導検索テーブルは、「MP3プレーヤ」をキーワードとして使用し、「MP3プレーヤ」に対応するカテゴリ(誘導情報)をマッピングテーブルで検索し、対応するカテゴリが取り出されたならば、検索を終了させる。取り出されなかったならば、誘導検索テーブルは、「プレーヤ」をキーワードとして使用し、「プレーヤ」に対応するカテゴリ(誘導情報)をマッピングテーブルで検索し、対応するカテゴリが取り出されたならば、検索を終了させる。取り出されなかったならば、マッピングテーブルから、クエリ情報「トランスミッタ911を伴ったカーMP3プレーヤ」に対応するカテゴリは取り出されない。
別の例において、誘導検索サーバは、比較的類似度の高い幾つかのモデルに対応する誘導情報を検索することができる、すなわち、誘導検索サーバは、最も類似度の高いモデルに対応する誘導情報がマッピングテーブルから取り出されるかどうかに関係なく、比較的類似度の高い幾つかのモデルに対応する誘導情報をマッピングテーブルから検索することができる。
ステップ206では、取得された誘導情報は、ユーザへの表示のために、クライアントに送信される。誘導情報は、検索入力ボックスに関連付けられたプロンプト内に、クライアントのブラウザの表示エリア内に、又は提供される誘導情報に基づいて更なるユーザ選択がなされえるようなその他のフォーマットで表示することができる。
各種の実施形態において、誘導検索サーバは、取り出された誘導情報を、様々な条件下で様々なやり方でクライアントに伝送することができる。一部の実施形態では、マッピングテーブル記録は、誘導情報に対するクエリ情報の信頼度レベルを含み、これは、クエリ情報と誘導情報との間における関連性の程度を表している。このような信頼度は、確率又はスコア又は別の形態で表すことができる。信頼度スコアが高いほど、クエリ情報は、より強く誘導情報に関連付けられている。誘導検索サーバが、或るモデルに対応する誘導情報を幾つか取り出したならば、サーバは、信頼度の最も高い誘導情報をクライアントに伝送することができる、又は誘導情報を信頼度の順に順位付けし、それぞれの誘導情報を順位付けの順でクライアントに伝送することができる。
尚もクエリ情報「トランスミッタを伴ったカーMP3プレーヤ」を例にとり、誘導検索サーバが、モデル「トランスミッタを伴ったカーMP3プレーヤ」をインデックスとして使用し、マッピングテーブルから、2つのカテゴリ「音楽プレーヤ」及び「電子機器製品」、並びに「トランスミッタを伴ったカーMP3プレーヤ」に対するそれらのそれぞれの信頼度90%及び10%を取り出したならば、サーバは、実装形態に応じ、カテゴリ「音楽プレーヤ」のみをクライアントに伝送することができる、又は「プレーヤ」を「電子機器製品」よりも重要であるとして順位付けし、「プレーヤ」及び「電子機器製品」の両方をクライアントに伝送することができる。
一部の実施形態では、類似度と信頼度との組み合わせにしたがって、クエリ結果がクライアントに返信される。例えば、クエリ情報を取得した後、誘導検索サーバは、クエリ情報を解析して複数のモデルを導出し、それぞれのモデルの類似度を計算し、それらの類似度にしたがってモデルを順位付けする。その後、サーバは、先ず、モデルのなかで1番目のモデルをキーワードとして使用し、その1番目のモデルに対応する誘導情報をマッピングテーブルで検索する。次いで、1番目のモデルに対応する複数の誘導情報、及び1番目のモデルに対するそれらの信頼度が取り出されたならば、サーバは、誘導情報のなかで信頼度の最も高い情報をクライアントに伝送する。
図3は、クエリ情報に基づいて1つ又は2つ以上のモデルを導出するためのプロセスの一実施形態を示すフローチャートである。プロセス300は、プロセス200の202を実行するために使用することができる。
ステップ302では、中心ワード、及び1つ又は2つ以上のワードを含む中心フレーズが抽出される。中心ワード及び中心フレーズは、構文解析及び文法規則に基づいてクエリから抽出される。中心ワード及び中心フレーズは、クエリ情報の基本的な意味を伝える。「トランスミッタを伴ったカーMP3プレーヤ」というクエリを例にとると、構文解析は、中心ワードが「プレーヤ」であること、及び中心フレーズが「MP3プレーヤ」又は「カーMP3プレーヤ」であることを明らかにする。
ステップ304では、中心ワードに基づいて、クエリに対してN−Gramが実施される。言い換えると、クエリの中の中心ワードが維持され、連なるN個のワードがクエリから抽出される。一部の実施形態では、Nとして2が使用される。例えば、中心ワードが「プレーヤ」であるクエリ「トランスミッタを伴ったカーMP3プレーヤ」は、2−Gram「MP3プレーヤ」及び「を伴ったプレーヤ」になる。
ステップ306では、中心フレーズが維持され、(ROUGE評価尺度に基づいて)Skip−Gramが抽出される。中心フレーズに対するスキップ距離がkである1つ又は2つ以上のフレーズが、クエリ情報から抽出される。事前設定が可能であるこのスキップ距離kは、合計でk又はk未満のスキップがN−Gramを構成することを可能にする。クエリ「トランスミッタを伴ったカーMP3プレーヤ」を例にとり、維持される中心フレーズが「カーMP3プレーヤ」であり尚且つスキップ距離が1であるならば、「を伴った」、「FM」、及び「トランスミッタ」をスキップして「カーMP3プレーヤFMトランスミッタ」、「トランスミッタを伴ったカーMP3プレーヤ」、又は「FMを伴ったカーMP3プレーヤ」を取得することが可能である。
図4は、モデルの類似度スコアを計算するためのプロセスの一実施形態を示すフローチャートである。プロセス400は、203を実行するために使用することができる。
ステップ402〜408では、元のクエリと比べてモデルでスキップされている各ワードに関連付けられたペナルティスコアが決定される。
ステップ402では、スキップされたワードの品詞に基づいて、スキップされたワードの第1のペナルティスコアが決定される。元のクエリと比べてモデルでスキップされている各ワードの品詞は、例えば、字句解析技術を使用して決定される。一部の実施形態では、各品詞は、ペナルティスコアfposを事前に割り当てられる。一例では、副詞、形容詞、数詞、動詞、及び名詞が、それぞれ0.2、0.4、0.6、0.8、及び1のスコアを事前に割り当てられる。異なる実施形態では、異なる事前割り当て値を使用することができる。スキップされたワードの第1のペナルティスコアは、スキップされたワードの品詞に関連付けられた事前割り当て値に基づいて決定される。
ステップ404では、元のクエリ情報内の中心ワードに対するスキップされたワードの距離に基づいて、第2のペナルティスコアが決定される。
ステップ406では、元のクエリ情報内の中心フレーズに対するスキップされたワードの距離に基づいて、第3のペナルティスコアが決定される。
ステップ404及びステップ406では、実装形態に応じ、様々な距離式を使用することができる。幾つかの例が、以下で説明される。
ステップ408では、スキップされたワードについて、計算されたペナルティスコアの統合値が決定される。一部の実施形態では、スキップされたワードについて、スコアの平均が決定される。一部の実施形態では、スコアの加重平均が使用される。必要に応じ、その他の統合値を使用することもできる。
スキップされた全てのワードについて、それらのそれぞれのスコアを取得するために、ステップ402〜408を繰り返すことができる。ステップは、例に示されたのと異なる順序で発生することもある。例では、順次処理が示されているが、ステップは、並列に繰り返すこともできる。
ステップ410では、スキップされた全てのワードに関連付けられた統合スコアが決定されたときに、その統合ペナルティスコアに基づいて、モデルの類似度スコアが計算される。この例では、クエリ情報を決定するために、ペナルティスコアの合計が使用される。
上記のプロセスは、元のクエリが6つのワード「w1 w2 w3 w4 w5 w6」を含む例を使用して説明される。
上述された技術を使用して、モデル「w3 w5 w6」が取得され、クエリが、中心フレーズ「w4 w5 w6」及び中心ワード「w6」を有するとする。したがって、モデルを取得するために、元のクエリ情報「w1 w2 w3 w4 w5 w6」から「w1」、「w2」、及び「w4」がスキップされている。
スキップされたワード「w1」、「w2」、及び「w4」について、ペナルティスコアが決定される。
ステップ402では、スキップされたワード「w1」の品詞に基づいて、第1のペナルティスコアが決定される。この例では、w1は、副詞である。上述された、事前割り当てスコアに対する品詞のマッピングの例に基づくと、副詞に対応するスコアは、0.2になる。
ステップ404では、クエリ情報内におけるスキップされたワードの場所と、クエリ情報内における中心ワードの場所との間の距離に基づく第2のペナルティスコアが、式fdw=1−(d−1)xλを使用して計算される。ここで、dは、クエリ内におけるスキップされたワードの場所と、クエリ内における中心ワードの場所との間の距離を表し、λは、fpos、fdw、及びfdpのなかでのfdwの重みを表している。w1の場合、クエリ情報内におけるw1の場所と、クエリ情報内におけるw6(中心ワード)の場所との間の距離は、5であり、λは、0.0002であるとされ、したがって、この場合、fdw=1−(d−1)xλ=1−(5−1)×0.0002=0.9992である。
ステップ406では、クエリ内におけるスキップされたワードの場所と、クエリ情報内における中心フレーズの場所との間の距離に基づく第3のペナルティスコアが、式fdp=1−dxλを使用して計算される。ここで、dは、クエリ内におけるスキップされたワードの場所と、クエリ情報内における中心フレーズの中央ワードの場所との間の距離を表し(一部の実施形態では、dは、中心フレーズが偶数のワードを有するならば四捨五入される)、λは、fpos、fdw、及びfdpのなかでのfdpの重みを表している。一部の実施形態では、クエリ情報内におけるスキップされたワードの場所と、クエリ情報内における中心フレーズの場所との間の距離のスコアは、クエリ情報内における中心フレーズの最終ワードの場所と、クエリ情報内における中心フレーズの冒頭ワードの場所との差を計算し、当該差を2で割り算し、当該割り算の結果を整数に四捨五入し、当該整数に中心フレーズ内における冒頭サードの場所を加算し、そこからクエリ情報内におけるスキップされたワードの場所を減算し、最後にその絶対値をとることによって計算される。w1の場合、クエリ情報内におけるw1の場所と、クエリ情報内におけるw5(中心フレーズの中央ワード)の場所との間の距離は、4であり、λは、0.0001であるとする。したがって、fdp=1−dxλ=1−4×0.0001=0.9996である。
この例では、式:スコア=(fpos+fdw+fdp)/3を使用して、スキップされたワードの統合スコアが計算される。したがって、ワード「w1」をスキップされたクエリのスコアは、スコア1=(0.2+0.9992+0.9996)/3=0.7329である。
ステップ402〜408は、スキップされたワード「w2」の統合スコアを計算するために繰り返される。
w2は、品詞のスコアがfpos=1である名詞であるとする。
クエリ情報内におけるw2の場所と、クエリ情報内におけるw6(中心ワード)の場所との間の距離は、4であり、λは、0.0002であるとされ、この場合、fdw=1−(d−1)xλ=1−(4−1)×0.0002=0.9994である。
クエリ情報内におけるw2の場所と、クエリ情報内におけるw5(中心フレーズの中心ワード)の場所との間の距離は、3であり、λは、0.0001であるとされ、したがって、この場合、fdp=1−dxλ=1−3×0.0001=0.9997である。
スキップされたワード「w2」の統合スコアは、したがって、(1+0.9994+0.9997)/3=0.9997である。
ステップ402〜408は、スキップされたワード「w4」の統合スコアを計算するために繰り返される。
w4は、品詞に基づくスコアがfpos=0である数詞であるとする。
クエリ情報内におけるw4の場所と、クエリ情報内におけるw6(中心ワード)の場所との間の距離は、2であり、λは、0.0002であるとされ、したがって、この場合、fdw=1−(d−1)xλ=1−(2−1)×0.0002=0.9998である。
クエリ情報内におけるw4の場所と、クエリ情報内におけるw5(中心フレーズの中心ワード)の場所との間の距離は、1であり、λは、0.0001であるとされ、したがって、この場合、fdp=1−dxλ=1−1×0.0001=0.9999である。
スキップされたワード「w4」の統合スコアは、したがって、(0.6+0.9998+0.9999)/3=0.8666である。
410では、モデル「w3 w4 w6」の類似度スコアは、したがって、0.7329+0.9997+0.8666=2.5992である。
プロセス400は、全てのモデルの類似度スコアを取得するために繰り返することができる。
それぞれのモデルの類似度は、その他のやり方で取得することもできる。例えば、各モデルについてクエリ情報からスキップされたワードの数を計算し、ワードがスキップされるごとに1ずつスコアを増分し、したがって、スコアが高いほど類似度が低くなるようにすることができる。それぞれのモデルの類似度を計算するその他のやり方は、ここでは例として挙げられない。
一部の実施形態では、誘導情報は、その信頼度レベルに少なくとも部分的に基づいてユーザに送信される。各種の実施形態において、信頼度レベルは、様々なやり方で計算することができる。例えば、信頼度レベルは、手動で指定することができる。言い換えると、マッピングテーブルの中の信頼度は、手動で設定することができる。別の例では、誘導検索サーバが、クエリ情報と、対応する誘導情報とを記録された過去記録を取り出す。過去記録は、誘導検索サーバとは別のデータベースサーバに記憶することができ、誘導検索サーバは、過去記録が必要とされるときにデータベースサーバから過去記録を取り出すことができる。或いは、過去記録は、誘導検索サーバに記憶することができ、誘導検索サーバは、過去記録が必要とされるときに過去記録を自身の中からローカルに直接取り出すことができる。例えば、過去記録は、クエリ情報と、対応する誘導情報とが検索の中で同時的に発生する回数、クエリ情報が単独で発生する回数、対応する誘導情報が単独で発生する回数などを記録している。値の決定は、以下でより詳しく説明される。誘導検索サーバ又は別のサーバが、ユーザによる選択の誘導情報をクライアントから更に取得したならば、その誘導検索サーバ又は別のサーバは、その誘導情報に対するクエリ情報の対応性を決定することができる。過去記録の中のそれぞれのクエリ情報について、誘導検索サーバは、クエリ情報がそれぞれの対応する誘導情報を伴うことの条件付き確率を、対応する誘導情報に対するそのクエリ情報の信頼度として計算する。
一部の実施形態では、過去記録は、クエリ情報と誘導情報との間における直接的対応性、及びクエリ情報と中間情報との間における対応性を記録している。中間情報は、クエリ情報及び誘導情報に対応しているが、クエリ情報と誘導情報とは、互いに対して直接的対応性を有していない。本明細書で使用される中間情報という用語は、或るクエリ情報及び誘導情報の両方から直接的にマッピングされ尚且つクエリ情報と誘導情報との間に非直接的な対応関係を形成することができる同じ情報を言う。例えば、クエリ情報が何らかの特定の情報に対応し、尚且つ誘導情報が同じ情報に対応しているとすると、クエリ情報は、したがって、誘導情報に対応している。クエリ情報と誘導情報とが同時的に発生する回数対クエリ情報が発生する合計回数の比率が計算される。この確率は、条件付き確率Aと称される。或いは、誘導検索サーバは、クエリ情報と中間情報とが同時的に発生する回数対クエリ情報が発生する合計回数の比率を計算する。この比率は、条件付き確率Bと称される。その後、誘導検索サーバは、条件付き確率Aと、該条件付き確率Aに対応する重みとの積、及び条件付き確率Bと、該条件付き確率Bに対応する重みとの積を計算し、これら2つの積を加算して、クエリ情報が誘導情報を伴うことの条件付き確率とする。条件付き確率Aに対応する重み及び条件付き確率Bに対応する重みは、経験的データから又は線形回帰法によって決定することができる。
やはりカテゴリをベースとした誘導情報を例にとり、以下で、誘導情報に対するクエリ情報の信頼度をどのように決定するかの説明が提示される。
ユーザが、カテゴリ誘導データベースの中に対応するカテゴリ集合{カテゴリ1、カテゴリ2、……、カテゴリj、……}を有するクエリ情報:クエリiを入力したならば、そのクエリiがカテゴリjを伴うことの条件付き確率は、p(カテゴリj|クエリi)として定義される。それぞれのカテゴリについて、条件
Figure 0005701911
が満たされる。
提示された検索結果に応えて、ユーザは、提示された誘導情報の中のカテゴリを選択することができる、又はカテゴリの代わりにその他の情報を選択することができる。更に、例えばカテゴリに属する製品に関する情報などのその他の被選択情報と、カテゴリとの間にも対応関係があるかもしれないので、その他の被選択情報は、クエリと誘導情報とを非直接的にマッピングする中間情報である。誘導検索サーバ又は別のサーバは、その他の情報とカテゴリとの間におけるマッピング関係を記録されているマッピングテーブルを伴うように、事前に構成することができる。マッピングテーブルは、更に、リアルタイムで更新することができる。したがって、たとえユーザが、クエリ情報を入力した後にカテゴリではなくその他の中間情報を選択したとしても、誘導検索サーバ又は別のサーバは、クエリ情報とカテゴリとの間における対応関係を決定することができる。その他の被選択情報は、中間情報である。したがって、クエリiがカテゴリjを伴うことの条件付き確率が計算されるときは、クエリ情報とカテゴリとの間における直接的対応関係及び非直接的対応関係の両方が考慮されるだろう。
一実施形態では、過去データの中でクエリiとカテゴリjとが同時的に発生する回数が決定される。ユーザがクエリiを入力し、更にカテゴリjを選択したならば、クエリiとカテゴリjとが同時的に発生する記録回数は、1つ増分される。誘導検索サーバは、更に、クエリiが発生する合計回数を取り出し、これは、それぞれのユーザが検索システムにクエリiを入力する合計回数を意味する。誘導検索サーバは、クエリiがカテゴリjに直接的に対応することの条件付き確率を、
Figure 0005701911
として計算する。ここで、カウント(カテゴリj,クエリi)は、クエリiとカテゴリjとが同時的に発生する回数を表し、カウント(クエリi)は、それぞれのユーザがクエリiを入力する合計回数を表している。
一部の実施形態では、過去記録を取り出した後に、誘導検索サーバは、中間情報とカテゴリとの間におけるマッピング関係を記録されているマッピングテーブルを取り出す。マッピングテーブルは、データベースサーバ又は誘導検索サーバに記憶することができる。誘導検索サーバは、マッピングテーブルを取り出した後に、カテゴリjのカテゴリに対応するそれぞれの中間情報を取り出す。その後、サーバは、クエリiとそれぞれの中間情報とが同時的に発生する回数を過去記録から取り出す。ユーザがクエリiを入力し、更に、特定の中間情報(例えば、クエリに直接的に対応しているカテゴリではなくその他の製品に関する情報)をクリックしたならば、クエリiと中間情報とが同時的に発生する記録回数は、1つ増分される。更に、誘導検索サーバは、クエリiが発生する合計回数を取り出す。この場合、誘導検索サーバは、クエリiが中間情報に非直接的に対応することの条件付き確率を、
Figure 0005701911
として計算する。ここで、カウント(カテゴリj,クエリi|提供)は、クエリiと中間情報とが同時的に発生する回数を表し、中間情報は、カテゴリjに対応する全ての中間情報を表し、カウント(クエリi|提供)は、クエリiが発生する合計回数を表している。
導出された以上2つの条件付き確率は、カテゴリjに対するクエリiの信頼度を導出するために、線形的に加重される。
Figure 0005701911
ここで、λ1及びλ2は、経験的に又は線形回帰技術を使用して決定することができる重みを表している。
なお、プロセス200に示されている方法の実施形態は、発明の一実施形態にすぎず、当業者ならば、その他のヴァリエーションを導き出すことができる。
一部の実施形態では、誘導検索サーバは、ステップ201が実施された後に、先ず、取得されたクエリ情報をキーワードとして使用し、該取得されたクエリ情報に対応する誘導情報を、クエリ情報と誘導情報との間におけるマッピング関係を記録されているマッピングテーブルで検索し、誘導情報が存在するならば、その取り出された誘導情報を直接的にクライアントに伝送し、そうでなければ、更にステップ202を実施する。更に、クエリ情報に対応する複数の誘導情報がマッピングテーブルから取り出され、尚且つそれぞれの誘導情報に対するクエリ情報の信頼度がマッピングテーブルに記録されているならば、誘導情報のなかで信頼度の最も高い情報のみがクライアントに伝送される。
一部の実施形態では、誘導検索サーバは、マッピングテーブルの中のマッピング関係及び信頼度をリアルタイムで又は定期的に更新し、そうして、誘導情報に対するクエリの正確さを更に向上させる。
一部の実施形態では、クエリ情報が、1つの文字、数、記号、又は省略されたフレーズである場合に、誘導検索サーバは、このようなクエリ情報を意味翻訳モードで少なくとも1つのモデルに変換することができる。例えば、誘導検索サーバがクエリ情報「LV」を取得したとすると、誘導検索サーバは、「LV」を「LOUIS VUITTON」に変換することができる。実装の便宜を図るために、誘導検索サーバは、クエリ情報と変換後の情報との間におけるマッピング関係を記録されているマッピングテーブルを事前に記憶しておき、クエリ情報を取得した後に、このクエリ情報をキーワードとして使用して、変換後情報をマッピングテーブルで検索することができる。更に、マッピングテーブルは、クエリ情報と変換後情報との間におけるマッピング関係に加えて、変換後情報に対するクエリ情報の信頼度も記録することができる。この場合に、誘導検索サーバが、クエリ情報に対して複数の変換後情報をマッピングテーブルから取り出したならば、誘導検索サーバは、変換後情報のなかで信頼度の最も高い情報をモデルとして選択することができる。
一部の実施形態では、誘導検索サーバが、モデルを使用してクエリ情報に対応する誘導情報を導出するならば、誘導検索サーバは、取得されたクエリ情報と導出された誘導情報との間におけるマッピング関係を、クエリ情報と誘導情報との間におけるマッピング関係を記録されているマッピングテーブルに記録することができる。サーバが、導出された誘導情報に対する取得されたクエリ情報の信頼度を計算するならば、サーバは、更に、信頼度をマッピングテーブルに記録することができる。したがって、誘導検索サーバは、同じクエリ情報を取得した後に、クエリ情報と誘導情報との間におけるマッピング関係を記録されているマッピングテーブルから対応する誘導情報を直接的に取り出して、クライアントに伝送される誘導情報を信頼度によって選択することができる。
一部の実施形態では、誘導検索サーバが、クエリ情報に対応する複数の誘導情報を、複数のモデルと、それぞれの対応する誘導情報に対するそれぞれのモデルの信頼度とを使用して取り出すならば、誘導検索サーバは、モデルに対応する誘導情報に対する取得されたクエリ情報の、それぞれの信頼度を計算することができる。具体的には、誘導検索サーバが、取り出された特定の誘導情報が1つのモデルのみに対応すると決定したならば、誘導検索サーバは、誘導情報に対するモデルの信頼度を、誘導情報に対する取得されたクエリ情報の信頼度として捉えることができる。誘導検索サーバが、取り出された特定の誘導情報が複数のモデルに対応すると決定したならば、すなわち、同じ誘導情報に各々対応するモデルが複数あるならば、誘導検索サーバは、それぞれのモデルに対する誘導情報の信頼度を加算し、加算結果の平均を、誘導情報に対する取得されたクエリ情報の信頼度とすることができる。
一部の実施形態では、誘導検索サーバが、1つのモデルのみを導出するならば、誘導検索サーバは、そのモデルをキーワード/インデックスとして使用して、すなわち、そのモデルを新しいクエリ情報として使用して、モデルに対応する誘導情報をマッピングテーブルで検索する。マッピングテーブルにモデルが記録されていないならば、誘導検索サーバは、モデルに対応する誘導情報を取り出すことができず、モデルに対応する誘導情報がマッピングテーブルに記録されているならば、誘導検索サーバは、モデルに対応する誘導情報を取り出すことができる。
一部の実施形態では、誘導検索サーバが、モデルに対応する誘導情報を取り出さないならば、誘導検索サーバは、クエリ情報に対応する誘導情報をマシン学習モードで予測することができる。
マシン学習モードでは、取得されたクエリ情報の特徴が特定の誘導情報に属することの確率分布を、過去のクエリ情報の学習及び訓練を通じて計算することができる。例えば、クエリ情報の特徴は、製品のラベル、ブランドのラベル、モデルのラベル、中心ワード、名詞句の集成、中心ワード及びその左隣の名詞句、中心ワード及びその右隣の名詞句などであってよい。
具体的には、カテゴリがカテゴリCであるとすると、現クエリ情報がカテゴリCに分類されることの信頼度は、以下のように表すことができる、すなわち、xが、例えば製品のラベル、ブランドのラベル、モデルのラベル、中心ワード、名詞句の集成、中心ワード及びその左隣の名詞句、中心ワード及びその右隣の名詞句などの、現クエリ情報から抽出される所定の情報を表すときに、該所定の関連情報xを与える条件下で現クエリ情報がカテゴリCに属するとして決定されることの事後確率p(cは正しい|x)として表すことができる。製品のラベルは、現クエリ情報が特定の製品情報であることを示しており、これは、意味特定によって導出される。ブランドのラベルは、現クエリ情報が特定のブランド情報であることを示しており、これは、意味特定によって導出される。モデルのラベルは、現クエリ情報が特定のモデル情報であることを示しており、これは、意味特定によって導出される。
現クエリ情報から導出される特徴の重みは、従来の確率モデルで訓練することができ、現クエリ情報が特定のカテゴリであると決定されることの条件付き確率は、訓練から導出される対応する特徴値及び重みを使用して、従来の確率モデルで計算することができる。
好ましくは、以下の式で表される最大エントロピモデルが、条件付き確率モデルとして選択される。
Figure 0005701911
ここで、y∈{cは正しい、cは正しくない}であり、xは、製品のラベル、ブランドのラベル、モデルのラベル、中心ワード、名詞句の集成、中心ワード及びその左隣の名詞句、中心ワード及びその右隣の名詞句などの、現クエリ情報に対応する所定の情報を表しており、fjは、最大エントロピモデルに対応する特徴値を表しており、例えば、xがワードレベルの特徴を表しているときに、特徴fjは、訓練されたデータのなかで「現クエリ情報のキーワードが「フォン」を含むときは、現クエリ情報はカテゴリCに属する」の一致を得られるならば、「現クエリ情報のキーワードはフォンを含む」という条件下で値1をとり、そうでないならば、値0をとり、λjは、現クエリ情報のそれぞれの特徴に対応する重みを表しており、モデル訓練から導出することができ、Z(x)は、やはりモデル訓練から導出することができる正規化因子を表している。
一部の実施形態では、条件付き確率モデルは、例えば線形回帰などのマシン学習モデルから作成される。実装形態によっては、サポートベクターマシンモデルを代わりに採用することができ、これは、クエリ情報とカテゴリとの間における関連性の程度を表す信頼度としてのスコアを計算するために、条件付き確率モデルに代わって使用することができる。
一部の実施形態では、カテゴリを複数のレベルに分けることができ、したがって、マルチレベルの分類を採用することができる。例えば、「車両」が第1レベルのカテゴリである、すなわちルートカテゴリと呼ばれ、「車両」に続くレベルのカテゴリが「自動車」、「列車」、「飛行機」、及び「船」を含み、「自動車」に続くレベルのカテゴリが「車」及び「トラック」を含むとする。この場合、誘導検索サーバは、先ず、複数の又は全部のルートカテゴリに対するクエリ情報の信頼度をマシン学習モードで計算し、その後、ルートカテゴリのなかで信頼度の最も高いカテゴリに続くレベルのカテゴリに対するクエリ情報の信頼度を計算し、ルートカテゴリのなかで信頼度の最も高いカテゴリに続くレベルのカテゴリに更に続くレベルのカテゴリに対するクエリ情報の信頼度を計算し、以下同様に続く。
誘導情報(例えばカテゴリ)に対するクエリ情報の信頼度をマシン学習モードで導出した後、誘導検索サーバは、最も高い信頼度の又は比較的高い信頼度の誘導情報をクライアントに伝送することができる、又は複数の誘導情報を信頼度の順にクライアントに伝送することができる。当業者ならば、誘導検索サーバからクライアントに伝送するための誘導情報の選択を考え出すことが可能であり、ここでは例として挙げられない。
もちろん、当業者ならば、図2に例示された方法の実施形態の説明をもとにその他の実施形態を考え出すことが可能であり、ここでは例として挙げられない。
図5は、プロセス200を実行するように構成された誘導検索サーバの一実施形態を示すブロック図である。この例では、誘導検索サーバは、クエリ情報と誘導情報との間におけるマッピング関係を記憶されているマッピングテーブルを記憶するように適応されたストレージユニット501と、クライアントから提供されるクエリ情報を取得するように適応された取得ユニット502と、クエリ情報から抽出された又はクエリ情報の意味翻訳を実行することによって得られた情報であってクエリ情報を特徴付ける情報である少なくとも1つのモデルを導出するために、クエリ情報をモデル抽出アルゴリズムで解析するように適応された解析ユニット503と、解析ユニット503がモデルを導出したときに、それらのモデルがクエリ情報に類似する程度を表すそれぞれのモデルの類似度を計算するように適応された計算ユニット504と、それぞれのモデルを類似度の順に順位付けるように適応された順位付けユニット505と、それぞれのモデルを順位付けの順でキーワードとして使用し、それぞれのモデルに対応する誘導情報をマッピングテーブルで検索するための検索ユニット506と、取り出された誘導情報をクライアントに伝送するように適応された伝送ユニット507とを含む。
解析ユニット503は、とりわけ、中心ワード及び/又は中心フレーズをクエリ情報から抽出するように適応することができる。
解析ユニット503は、とりわけ、中心ワード又は中心フレーズを含む指定の長さのフレーズをクエリ情報から抽出するように適応することができる。
モデルについて、計算ユニット504は、とりわけ、クエリ情報と比べてモデルにおいてスキップされたそれぞれのワードのスコアを計算するように及びそれらのスコアの合計をモデルの類似度として計算するように適応することができる。
ストレージユニット501は、更に、品詞とスコアとの間におけるマッピング関係を記憶されているマッピングテーブルを記憶することができる。計算ユニット504は、スキップされたワードの品詞を決定するように適応された決定サブユニットと、ワードの品詞に対応するスコアを第1のスコアとしてマッピングテーブルで検索するように適応された検索サブユニットと、クエリ情報内におけるワードの場所と、クエリ情報内における中心ワードの場所との間の距離のスコアを第2のスコアとして計算するように適応された第1の計算サブユニットと、クエリ情報内におけるワードの場所と、クエリ情報内における中心フレーズの場所との間の距離のスコアを第3のスコアとして計算するように適応された第2の計算サブユニットと、クエリ情報と比べてワードをスキップされたモデルのスコアを、既定のスコアアルゴリズムで第1、第2、及び第3のスコアをもとにして計算するように適応された第3の計算サブユニットとを含むことができる。実際の応用では、当業者ならば、実際面での必要に応じて様々なスコアアルゴリズムを考え出すことができる。例えば、第1、第2、及び第3のスコアの平均が計算される、例えば、任意の2つのスコアの平均が計算される、例えば、任意の2つのスコアの平均が計算され、次いで、残りのスコアと加算される又は残りのスコアで乗算されるなどがある。もちろん、その他の形態のスコアアルゴリズムも可能であり、ここでは例として挙げられない。
検索ユニット506は、モデルのなかで1番目のモデルをキーワードとして使用して、その1番目のモデルに対応する誘導情報をマッピングテーブルで検索し、検索ユニット506が、1番目のモデルに対応する誘導情報を取り出したならば、伝送ユニット507は、取り出された誘導情報をクライアントに伝送し、検索ユニット506が、1番目のモデルに対応する誘導情報を取り出さなかったならば、検索ユニット506は、モデルのなかで2番目のモデルをキーワードとして使用して、その2番目のモデルに対応する誘導情報をマッピングテーブルで検索し、検索ユニット506が、モデルの1つに対応する誘導情報を取り出すまで、又はそれぞれのモデルに対応する誘導情報をデータベースで検索するまで、以下同様に繰り返される。
マッピングテーブルは、更に、クエリ情報と誘導情報との間における関連性の程度を表すものである誘導情報に対するクエリ情報の信頼度を記録することができ、検索ユニット506が、モデルに対応する複数の誘導情報を取り出したならば、伝送ユニット507は、取り出された複数の誘導情報のなかで信頼度の最も高い誘導情報をクライアントに伝送する、又は複数の誘導情報を順位付けしてそれらをクライアントに伝送する。
取得ユニット502は、更に、クライアントから提供されるクエリ情報を取得する前に、クエリ情報及び対応する誘導情報を記録されている過去記録を取り出す。この場合、過去記録の中のそれぞれのクエリ情報について、計算ユニット504は、クエリ情報が対応するそれぞれの誘導情報を伴うことの条件付き確率を、対応する誘導情報に対するクエリ情報の信頼度として計算する。計算ユニット504は、信頼度をストレージユニット501に記憶することができる。
過去記録が、クエリ情報と誘導情報との間、及びクエリ情報と中間情報との間における直接的な対応関係を記録しているならば、計算ユニット504は、クエリ情報と誘導情報とが同時的に発生する回数対クエリ情報が発生する合計回数との比を条件付き確率Aとして計算するように適応された第4の計算ユニットと、クエリ情報と中間情報とが同時的に発生する回数対クエリ情報が発生する合計回数の比率を条件付き確率Bとして計算するように適応された第5の計算ユニットと、条件付き確率Aと、該条件付き確率Aに対応する重みとの積、及び条件付き確率Bと、該条件付き確率Bに対応する重みとの積を計算し、これら2つの積を加算して、クエリ情報が誘導情報を伴うことの条件付き確率を導出するように適応された、第6の計算ユニットとを含むことができる。
図5に示される誘導検索サーバは、更に、検索ユニット506がモデルに対応する誘導情報を取り出さなかったときに、クエリ情報に対応する誘導情報をマシン学習モードで予測するために、検索ユニット506によってトリガされるように適応された、マシン学習ユニット508を含むことができる。
図5に示される誘導検索サーバの実施形態は、図2に示されたプロセスの実施形態に対応しているので、図5に示された誘導検索サーバの中のそれぞれのユニットの機能及び相互的な協調関係の詳細については、図2に示された方法の実施形態における関連の説明を参照することができ、したがって、説明の繰り返しは、ここでは省略される。
誘導検索サーバは、情報処理システムに配備することができるので、本発明の一実施形態は、更に、情報処理システムを含む。図1に示されるように、情報処理システムは、クライアント102と、誘導検索サーバ101とを含み、クライアント102は、誘導検索サーバ101と情報のやり取りを実施するように適応され、誘導検索サーバ101は、クライアント102から提供されるクエリ情報を取得し、クエリ情報から抽出された又はクエリ情報の意味翻訳を実行することによって得られた情報であってクエリ情報を特徴付ける情報である少なくとも1つのモデルを導出するためにモデル抽出アルゴリズムでクエリ情報を解析し、複数のモデルが導出されたならば、それらのモデルがクエリ情報に類似する程度を表すためにそれぞれのモデルの類似度を計算し、それぞれのモデルを類似度の順に順位付け、それらのモデルを順位付けの順でキーワードとして使用して、それぞれのモデルに対応する誘導情報を、クエリ情報と誘導情報との間におけるマッピング関係を記憶されているマッピングテーブルで検索し、取り出された誘導情報をクライアント102に伝送するように適応される。
誘導検索サーバ101及びクライアント102の具体的な機能、並びにそれらの相互的な協調関係の詳細については、図2に示された方法の実施形態及び図5に示された方法の実施形態における関連の説明を参照することができ、したがって、説明の繰り返しは、ここでは省略される。
図6は、誘導検索を実施するためのプロセスの別の一実施形態を示すフローチャートである。プロセス600は、図1の100などの誘導検索システムによって実施することができる。
ステップ601では、クライアントから提供されるクエリ情報が取得される。このステップは、プロセス200の201と同様である。
ステップ602において、誘導検索サーバは、クエリ情報に対応する誘導情報をモード(1)で検索し、クエリ情報に対応する誘導情報をマシン学習モードで予測する。
とりわけモード(1)では、誘導検索サーバは、少なくとも1つのモデルを導出するためにクエリ情報を解析し、複数のモデルが導出されたならば、誘導検索サーバは、それらのモデルがクエリ情報に類似する程度を表すそれぞれのモデルの類似度を計算し、それぞれのモデルを類似度の順に順位付けし、それらのモデルを順位付けの順でキーワードとして使用して、それぞれのモデルに対応する誘導情報を、クエリ情報と誘導情報との間におけるマッピング関係を記憶されているマッピングテーブルで検索する。
モード(1)の詳細については、プロセス200のステップ202〜205の関連の説明を参照することができ、したがって、説明の繰り返しは、ここでは省略される。
誘導検索サーバが、クエリ情報に対応する誘導情報をモード(1)で取り出したならば、603において、誘導検索サーバは、2つのモードで取り出された及び予測された誘導情報をもとに、クライアントに提供される誘導情報を決定し、クライアントに提供されるものと決定されたその誘導情報をクライアントに伝送する。
実際の応用では、誘導検索サーバは、クライアントに提供される誘導情報を様々なやり方で決定することができる。例えば、2つのモードで取り出された及び予測された同じ誘導情報が、クライアントに伝送される。例えば、それぞれのモードで取り出された及び予測された全ての誘導情報が、クライアントに伝送される。別の例では、最も信頼度の高い誘導情報を、上述のように信頼度モードでクライアントに伝送することができる。更なる例では、複数の誘導情報が順位付けされてクライアントに伝送される。
図7は、プロセス600を実行するように構成された誘導検索サーバの一実施形態を示すブロック図である。この例では、誘導検索サーバは、クエリ情報と誘導情報との間におけるマッピング関係を記憶されているマッピングテーブルを記憶するように適応されたストレージユニット701と、クライアントから提供されるクエリ情報を取得するように適応された取得ユニット702と、クエリ情報に対応する誘導情報をモード(1)で検索するように適応された第1の検索ユニット703と、クエリ情報に対応する誘導情報をマシン学習モードで予測するように適応された第2の検索ユニット704と、第1の検索ユニット703が、クエリ情報に対応する誘導情報をモード(1)で取り出すならば、第1の検索ユニット703によって導出された誘導情報及び第2の検索ユニット704によって予測された誘導情報をもとに、クライアントに提供される誘導情報を決定するように適応された誘導情報決定ユニット705と、クライアントに提供されるものと決定された誘導情報をクライアントに伝送するように適応された伝送ユニット706とを含む。とりわけモード(1)では、誘導検索サーバは、少なくとも1つのモデルを導出するためにクエリ情報を解析し、複数のモデルが導出されたならば、誘導検索サーバは、それらのモデルがクエリ情報に類似する程度を表すためにそれぞれのモデルの類似度を計算し、それぞれのモデルを類似度の順に順位付け、それらのモデルを順位付けの順でキーワードとして使用して、それぞれのモデルに対応する誘導情報を、クエリ情報と誘導情報との間におけるマッピング関係を記憶されているマッピングテーブルで検索する。
図7に示された誘導検索サーバの実施形態は、図6に示される方法の実施形態に対応しているので、図7に示された誘導検索サーバの中のそれぞれのユニットの機能及び相互的な協調関係の詳細については、図6に示される方法の実施形態における関連の説明を参照することができ、したがって、説明の繰り返しは、ここでは省略される。
誘導検索サーバは、情報処理システムに配備することができるので、本発明の実施形態は、更に、情報処理システムを含む。図1に示されるように、情報処理システムは、クライアント102と、誘導検索サーバ101とを含み、クライアント102は、誘導検索サーバ101と情報のやり取りを実施するように適応され、誘導検索サーバ101は、クライアント102から提供されるクエリ情報を取得し、クエリ情報に対応する誘導情報をモード(1)で検索するとともにクエリ情報に対応する誘導情報をマシン学習モードで予測し、クエリ情報に対応する誘導情報がモード(1)で取り出されたならば、2つのモードで取り出された及び予測された誘導情報をもとに、クライアントに提供される誘導情報を決定し、クライアントに提供されるものと決定された誘導情報をクライアントに伝送するように適応される。とりわけモード(1)では、誘導検索サーバは、クエリ情報から抽出された又はクエリ情報の意味翻訳を実行することによって得られた情報であってクエリ情報を特徴付ける情報である少なくとも1つのモデルを導出するためにモデル抽出アルゴリズムでクエリ情報を解析し、複数のモデルが導出されたならば、誘導検索サーバは、それらのモデルがクエリ情報に類似する程度を表すためにそれぞれのモデルの類似度を計算し、それぞれのモデルを類似度の順に順位付け、それらのモデルを順位付けの順でキーワードとして使用して、それぞれのモデルに対応する誘導情報をクエリ情報と誘導情報との間におけるマッピング関係を記憶されているマッピングテーブルで検索する。
誘導検索サーバ101及びクライアント102の具体的な機能、並びにそれらの相互的な協調関係の詳細については、図6に示される方法の実施形態及び図7に示される誘導検索サーバの実施形態における関連の説明を参照することができ、したがって、説明の繰り返しは、ここでは省略される。
上述のユニットは、1つ又は2つ以上の汎用プロセッサ上で実行されるソフトウェアコンポーネントとして、プログラマブルロジックデバイス及び/若しくは所定の機能を実施するように設計された特殊用途向け集積回路などのハードウェアとして、又はそれらの組み合わせとして実装することができる。一部の実施形態では、ユニットは、本発明の実施形態で説明された方法をコンピュータデバイス(パソコン、サーバ、ネットワーク機器など)に実行させるための幾つかの命令を含み且つ不揮発性のストレージ媒体(光ディスク、フラッシュストレージデバイス、モバイルハードディスクなど)に記憶させることができるソフトウェア製品の形で具現化することができる。ユニットは、1つのデバイスに実装する又は複数のデバイスに分散させることができる。ユニットの機能は、互いに合体させる又は複数のサブユニットに更に分けることができる。
まとめると、本発明の実施形態では、誘導検索サーバは、クライアントから提供されるクエリ情報を取得した後、少なくとも1つのモデルを導出するためにクエリ情報を解析し、複数のモデルが導出されたならば、誘導検索サーバは、それぞれのモデルの類似度を計算し、類似度の順にそれぞれのモデルを順位付けし、それらのモデルをキーワードとして使用して、それぞれのモデルに対応する誘導情報を、クエリ情報と誘導情報との間のマッピング関係を記録されているマッピングテーブルで検索する。この場合、たとえクライアントから取得されたクエリ情報がマッピングテーブルの中に無いとしても、マッピングテーブルの中に(1つ又は2つ以上の)モデルが存在している可能性があるゆえに、尚も適切な誘導情報を取り出すことが可能であり、ゆえに、マッピングテーブルの中に無いクエリ情報に対応する誘導情報を誘導検索サーバがクライアントに提供できない事態に対処することができる。
更に、誘導検索サーバが、クエリ情報と誘導情報との間におけるマッピング関係を記録されているマッピングテーブルからモデルに対応する誘導情報を取り出さなかったならば、誘導検索サーバは、取得されたクエリ情報に対応する誘導情報をマシン学習モードで導出することができ、そうして、クライアントから提供されるクエリ情報に対して対応する誘導情報を誘導検索サーバが返せるように更に保証することができる。
更に、誘導検索サーバは、(1つ又は2つ以上の)モデルを使用して誘導情報を検索することに加えて、取得されたクエリ情報に対応する誘導情報をマシン学習モードで導出し、2つのモードで取り出された及び予測された誘導情報をもとに、クライアントに返される誘導情報を決定することができ、そうして、クライアントに返される誘導情報の理解度及び正確さを更に向上させる。
実施形態の以上の説明から明らかなように、当業者ならば、本発明が、基本的な汎用ハードウェアプラットフォームと組み合わされたソフトウェアの形で実装可能であることを、はっきり理解することができる。このような理解に基づき、先行技術に寄与する本発明による技術的解決策又はその一部は、基本的に、本発明のそれぞれの実施形態にしたがった又は本発明の実施形態の一部にしたがった方法をコンピュータデバイス(パソコン、サーバ、ネットワークデバイスなどでありえる)に実施させるための幾つかの命令を含み尚且つ例えばROM/RAM、磁気ディスク、光ディスクなどのストレージ媒体に記憶可能であるソフトウェア製品の形で具現化することができる。
本明細書におけるそれぞれの実施形態は、進行的に説明されており、それらの共通の又は同様の部分は、相互に参照可能であり、各実施形態は、(1つ又は2つ以上の)その他の実施形態からのその(1つ又は2つ以上の)違いに重きを置かれている。特に、システムの実施形態の場合は、方法の実施形態と実質的に同様でありそれゆえに簡単に説明されており、その詳細に関しては、方法の実施形態の説明のそれらの部分を参照することができる。
本発明は、例えば、パソコン、サーバコンピュータ、手持ち式のすなわち携帯型のデバイス、フラットパネルデバイス、マルチプロセッサシステム、マイクロプロセッサベースのシステム、セットトップボックス、プログラマブル家庭用電子機器、ネットワークPC、ミニコンピュータ、大型コンピュータ、上記のシステム若しくはデバイスの任意を含む分散コンピューティング環境などの、汎用又は専用の、数々のコンピュータシステム環境又はコンピュータシステム構成に適用することができる。
本発明は、コンピュータによって実行される例えばプログラムモジュールなどのコンピュータ実行可能命令を一般的背景として説明することができる。一般に、プログラムモジュールは、特定のタスクを実行する又は特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを含む。或いは、本発明は、通信ネットワークを通じて接続されたリモート処理デバイスによってタスクを実施され尚且ストレージデバイスを含むローカル若しくはリモートのコンピュータストレージ媒体の中にプログラムモジュールを設置可能である分散コンピューティング環境において実行することができる。
本発明は、その実施形態との関連で説明されてきたが、当業者ならば、本発明の趣旨から逸脱することなく数々の変更及びヴァリエーションが可能であることがわかり、本発明は、その特許請求の範囲内にこれらの変更及びヴァリエーションを含むように意図されている。
以上の実施形態は、理解を明瞭にする目的で幾らか詳細に説明されてきたが、本発明は、提供される詳細に限定されない。本発明の実現には、多くの代替的手法がある。開示された実施形態は、例示のためであって、限定的なものではない。
適用例1:誘導検索の方法であって、新しいクエリを受信し、事前に記憶されたクエリと対応する誘導情報とのマッピング関係を示す複数のモデルを取得するために前記新しいクエリを処理し、前記新しいクエリに関する前記複数のモデルの対応する複数の類似度を決定し、事前に記憶されたクエリと対応する誘導情報との複数のマッピング関係を含むデータベースの中から誘導情報を取得することであって、前記類似度に少なくとも部分的に基づいて前記複数のモデルの少なくとも幾つかを選択し、及び前記データベースを検索するために前記選択されたモデルをインデックスとして使用することを含み、ユーザへの表示のために、前記取得された誘導情報を送信すること、を備える方法。
適用例2:適用例1に記載の方法であって、前記複数のモデルを取得するために前記新しいクエリを処理することは、前記新しいクエリの、複数のワードを含む中心フレーズ又は中心ワードを特定することを含む、方法。
適用例3:適用例2に記載の方法であって、前記複数のモデルを取得するために前記新しいクエリを処理することは、更に、前記中心フレーズ又は前記中心ワードを含む指定の長さのフレーズを抽出することを含む、方法。
適用例4:適用例1に記載の方法であって、前記複数のモデルを取得するために、前記新しいクエリを処理することは、前記複数のモデルを生成するために前記新しいクエリの中の複数のワードをスキップすることを含む、方法。
適用例5:適用例4に記載の方法であって、前記新しいクエリに関する前記複数のモデルの対応する複数の類似度を決定することは、前記スキップされたワードの品詞及び前記品詞に関連付けられた事前割り当てスコアに少なくとも部分的に基づいて、複数の類似度スコアを決定することを含む、方法。
適用例6:適用例4に記載の方法であって、前記新しいクエリに関する前記複数のモデルの対応する複数の類似度を決定することは、前記新しいクエリの中心ワードに対する前記スキップされたワードの距離に少なくとも部分的に基づいて複数の類似度スコアを決定することを含む、方法。
適用例7:適用例4に記載の方法であって、前記新しいクエリに関する前記複数のモデルの対応する複数の類似度を決定することは、前記新しいクエリの中心フレーズに対する前記スキップされたワードの距離に少なくとも部分的に基づいて複数の類似度スコアを決定することを含む、方法。
適用例8:適用例1に記載の方法であって、更に、前記複数のモデルをそれらの類似度にしたがって順位付けすることを備える方法。
適用例9:適用例1に記載の方法であって、前記誘導情報を取得することは、前記データベースを検索するために、前記複数のモデルの少なくとも幾つかのうちの選択された1つのモデルをインデックスとして使用することを含む、方法。
適用例10:適用例1に記載の方法であって、更に、前記新しいクエリに関する前記複数のモデルの対応する複数の信頼度を決定することを備え、前記誘導情報を取得することは、更に、前記信頼度に少なくとも部分的に基づいて前記複数のモデルの少なくとも幾つかを選択することを含む、方法。
適用例11:適用例10に記載の方法であって、前記複数のモデルの前記信頼度は過去データに基づいて特定される、方法。
適用例12:適用例10に記載の方法であって、前記複数のモデルのうちの1つのモデルの信頼度は過去データに基づいて特定され、前記事前に記憶されたクエリに関連付けられた確率値に少なくとも部分的に基づいて決定される、方法。
適用例13:適用例12に記載の方法であって、前記信頼度は、前記事前に記憶されたクエリの合計発生回数を与えられた際の前記事前に記憶されたクエリと前記誘導情報とが同時に発生する発生率に基づいて第1の確率を決定すること、前記事前に記憶されたクエリの合計発生回数を与えられた際の前記事前に記憶されたクエリと中間情報とが同時に発生する発生率に基づいて第2の確率を決定すること、前記信頼度を決定するために前記第1の確率と前記第2の確率との加重和を計算すること、によって決定される、方法。
適用例14:適用例1に記載の方法であって、更に、マシン学習モードで誘導情報を予測することを備える方法。
適用例15:誘導検索を提供するためのシステムであって、1つ又は2つ以上のプロセッサと、前記1つ又は2つ以上のプロセッサに接続され、前記1つ又は2つ以上のプロセッサに命令を提供するように構成されている1つ又は2つ以上のメモリと、を備え、前記1つ又は2つ以上のプロセッサは、新しいクエリを受信し、事前に記憶されたクエリと対応する誘導情報とのマッピング関係を示す複数のモデルを取得するために前記新しいクエリを処理し、前記新しいクエリに関する前記複数のモデルの対応する複数の類似度を決定し、事前に記憶されたクエリと対応する誘導情報との複数のマッピング関係を含むデータベースの中から誘導情報を取得することであって、前記類似度に少なくとも部分的に基づいて前記複数のモデルの少なくとも幾つかを選択すること、及び前記データベースを検索するために前記選択されたモデルをインデックスとして使用することを含み、ユーザへの表示のために前記取得された誘導情報を送信するように、構成される、システム。
適用例16:適用例15に記載のシステムであって、前記複数のモデルを取得するために前記新しいクエリを処理することは、前記新しいクエリの、複数のワードを含む中心フレーズ又は中心ワードを特定することを含む、システム。
適用例17:適用例15に記載のシステムであって、前記複数のモデルを取得するために前記新しいクエリを処理することは、前記複数のモデルを生成するために前記新しいクエリの中の複数のワードをスキップすることを含む、システム。
適用例18:適用例15に記載のシステムであって、前記誘導情報を取得することは、前記データベースを検索するために前記複数のモデルの少なくとも幾つかのうちの選択された1つのモデルをインデックスとして使用することを含む、システム。
適用例19:適用例15に記載のシステムであって、更に、前記1つ又は2つ以上のプロセッサは、更に、前記新しいクエリに関する前記複数のモデルの対応する複数の信頼度を決定するように構成され、前記誘導情報を取得することは、更に、前記信頼度に少なくとも部分的に基づいて、前記複数のモデルの少なくとも幾つかを選択することを含む、システム。
適用例20:誘導検索を提供するためのコンピュータプログラム製品であって、コンピュータによって読み取り可能なストレージ媒体に実装され、新しいクエリを受信するためのコンピュータ命令と、事前に記憶されたクエリと対応する誘導情報とのマッピング関係を示す複数のモデルを取得するために前記新しいクエリを処理するためのコンピュータ命令と、前記新しいクエリに関する前記複数のモデルの対応する複数の類似度を決定するためのコンピュータ命令と、事前に記憶されたクエリと対応する誘導情報との複数のマッピング関係を含むデータベースの中から誘導情報を取得するためのコンピュータ命令であって、前記類似度に少なくとも部分的に基づいて前記複数のモデルの少なくとも幾つかを選択すること、及び前記データベースを検索するために前記選択されたモデルをインデックスとして使用することを含む、コンピュータ命令と、ユーザへの表示のために前記取得された誘導情報を送信するためのコンピュータ命令と、を備えるコンピュータプログラム製品。

Claims (18)

  1. コンピュータによって実行される誘導検索の方法であって、
    新しいクエリを受信し、
    事前に記憶されたクエリと対応する誘導情報とのマッピング関係を示す複数のモデルを取得するために前記新しいクエリを処理し、前記複数のモデルを取得するために前記新しいクエリを処理することは、
    前記新しいクエリの、複数のワードを含む中心フレーズ又は中心ワードを特定することを含み、
    前記モデルは、前記新しいクエリ、前記新しいクエリに基づき変換された情報、またはその双方から抽出された情報を含み、
    前記モデルは、前記新しいクエリを特徴付け、
    前記新しいクエリに関する前記複数のモデルの対応する複数の類似度を決定し、前記新しいクエリに関する前記複数のモデルの対応する複数の類似度を決定することは、
    前記新しいクエリに関する前記複数のモデルの内の一のモデルの類似度を、前記一のモデルにおけるモデルワードの特性、前記一のモデルにおけるスキップされたワードの特性、またはそれらの組合せに基づいて算出し、
    前記スキップされたワードが存在する場合には、前記一のモデルにおける前記スキップされたワードに基づく前記類似度から値を減じることを含み、前記値を減じることは、
    前記中心フレーズが特定された場合には、前記新しいクエリにおける前記中心フレーズに対する前記スキップされたワードの距離に基づいて前記値を決定し、
    前記中心ワードが特定された場合には、前記新しいクエリにおける前記中心ワードに対する前記スキップされたワードの距離に基づいて前記値を決定することを含み、
    記類似度に少なくとも部分的に基づいて前記複数のモデルの少なくとも一つを選択し
    事前に記憶されたクエリと対応する誘導情報の複数のマッピング関係を含むデータベースを検索するために前記選択されたモデルをインデックスとして使用して誘導情報を取得し
    ユーザへの表示のために、前記取得された誘導情報を送信すること、
    を備える方法。
  2. 請求項に記載の方法であって、
    前記複数のモデルを取得するために前記新しいクエリを処理することは、更に、前記中心フレーズ又は前記中心ワードを含む指定の長さのフレーズを抽出することを含む、方法。
  3. 請求項1に記載の方法であって、
    前記複数のモデルを取得するために、前記新しいクエリを処理することは、前記複数のモデルを生成するために前記新しいクエリの中の複数のワードをスキップすることを含む、方法。
  4. 請求項に記載の方法であって、
    前記新しいクエリに関する前記複数のモデルの対応する複数の類似度を決定することは、前記スキップされたワードの品詞及び前記品詞に関連付けられた事前割り当てスコアに少なくとも部分的に基づいて、複数の類似度スコアを決定することを含む、方法。
  5. 請求項1に記載の方法であって、更に、
    前記複数のモデルをそれらの類似度にしたがって順位付けすることを備える方法。
  6. 請求項1に記載の方法であって、更に、
    選択された前記モデルに関連する取得された前記誘導情報の対応する複数の信頼度を決定することを備え、前記誘導情報を取得することは、更に、前記信頼度に少なくとも部分的に基づいて前記誘導情報の少なくとも幾つかを選択することを含む、方法。
  7. 請求項に記載の方法であって、
    前記複数の信頼度は事前に記憶されたクエリ、ユーザ選択誘導情報およびユーザ選択中間情報の過去データに基づいて特定される、方法。
  8. 請求項に記載の方法であって、
    前記複数の信頼度は事前に記憶されたクエリおよびユーザ選択誘導情報の過去データに基づいて特定され、事前に記憶されたクエリと前記ユーザ選択誘導情報が同時に発生する発生率に基づく確率値に少なくとも部分的に基づいて決定される、方法。
  9. 請求項に記載の方法であって、
    前記複数の信頼度は、
    前記事前に記憶されたクエリの合計発生回数を与えられた際の前記事前に記憶されたクエリと前記ユーザ選択誘導情報とが同時に発生する発生率に基づいて第1の確率を決定すること、
    前記事前に記憶されたクエリの合計発生回数を与えられた際の前記事前に記憶されたクエリとユーザ選択中間情報とが同時に発生する発生率に基づいて第2の確率を決定すること、
    前記信頼度を決定するために前記第1の確率と前記第2の確率との加重和を計算すること、
    によって決定される、方法。
  10. 請求項1に記載の方法であって、更に、
    マシン学習モードで誘導情報を予測することを備える方法。
  11. 誘導検索を提供するためのシステムであって、
    1つ又は2つ以上のプロセッサと、
    前記1つ又は2つ以上のプロセッサに接続され、前記1つ又は2つ以上のプロセッサに命令を提供するように構成されている1つ又は2つ以上のメモリと、
    を備え、
    前記1つ又は2つ以上のプロセッサは、
    新しいクエリを受信し、
    事前に記憶されたクエリと対応する誘導情報とのマッピング関係を示す複数のモデルを取得するために前記新しいクエリを処理し、前記複数のモデルを取得するために前記新しいクエリを処理することは、
    前記新しいクエリの、複数のワードを含む中心フレーズ又は中心ワードを特定することを含み、
    前記モデルは、前記新しいクエリ、前記新しいクエリに基づき変換された情報、またはその双方から抽出された情報を含み、
    前記モデルは、前記新しいクエリを特徴付け、
    前記新しいクエリに関する前記複数のモデルの対応する複数の類似度を決定し、前記新しいクエリに関する前記複数のモデルの対応する複数の類似度を決定することは、
    前記新しいクエリに関する前記複数のモデルの内の一のモデルの類似度を、前記一のモデルにおけるモデルワードの特性、前記一のモデルにおけるスキップされたワードの特性、またはそれらの組合せに基づいて算出し、
    前記スキップされたワードが存在する場合には、前記一のモデルにおける前記スキップされたワードに基づく前記類似度から値を減じることを含み、前記値を減じることは、
    前記中心フレーズが特定された場合には、前記新しいクエリにおける前記中心フレーズに対する前記スキップされたワードの距離に基づいて前記値を決定し、
    前記中心ワードが特定された場合には、前記新しいクエリにおける前記中心ワードに対する前記スキップされたワードの距離に基づいて前記値を決定することを含み、
    記類似度に少なくとも部分的に基づいて前記複数のモデルの少なくとも一つを選択し、
    事前に記憶されたクエリと対応する誘導情報の複数のマッピング関係を含むデータベースを検索するために前記選択されたモデルをインデックスとして使用して誘導情報を取得し、
    ユーザへの表示のために前記取得された誘導情報を送信するように、
    構成される、システム。
  12. 請求項11に記載のシステムであって、
    前記複数のモデルを取得するために前記新しいクエリを処理することは、前記複数のモデルを生成するために前記新しいクエリの中の複数のワードをスキップすることを含む、システム。
  13. 請求項11に記載のシステムであって、
    前記誘導情報を取得することは、前記データベースを検索するために前記複数のモデルの少なくとも幾つかのうちの選択された1つのモデルをインデックスとして使用することを含む、システム。
  14. 請求項11に記載のシステムであって、更に、
    前記1つ又は2つ以上のプロセッサは、更に、前記複数のモデルに対する取得された前記誘導情報の対応する複数の信頼度を決定するように構成され、前記誘導情報を取得することは、更に、前記信頼度に少なくとも部分的に基づいて、前記誘導情報の少なくとも幾つかを選択することを含む、システム。
  15. 誘導検索を提供するためのコンピュータプログラムであって、
    新しいクエリを受信するための機能と、
    事前に記憶されたクエリと対応する誘導情報とのマッピング関係を示す複数のモデルを取得するために前記新しいクエリを処理するための機能と、前記複数のモデルを取得するために前記新しいクエリを処理する機能は、
    前記新しいクエリの、複数のワードを含む中心フレーズ又は中心ワードを特定することを含み、
    前記モデルは、前記新しいクエリ、前記新しいクエリに基づき変換された情報、またはその双方から抽出された情報を含み、
    前記モデルは、前記新しいクエリを特徴付け、
    前記新しいクエリに関する前記複数のモデルの対応する複数の類似度を決定するための機能と、前記新しいクエリに関する前記複数のモデルの対応する複数の類似度を決定するための機能は、
    前記新しいクエリに関する前記複数のモデルの内の一のモデルの類似度を、前記一のモデルにおけるモデルワードの特性、前記一のモデルにおけるスキップされたワードの特性、またはそれらの組合せに基づいて算出し、
    前記スキップされたワードが存在する場合には、前記一のモデルにおける前記スキップされたワードに基づく前記類似度から値を減じることを含み、前記値を減じることは、
    前記中心フレーズが特定された場合には、前記新しいクエリにおける前記中心フレーズに対する前記スキップされたワードの距離に基づいて前記値を決定し、
    前記中心ワードが特定された場合には、前記新しいクエリにおける前記中心ワードに対する前記スキップされたワードの距離に基づいて前記値を決定することを含み、
    記類似度に少なくとも部分的に基づいて前記複数のモデルの少なくとも一つを選択するための機能と、
    事前に記憶されたクエリと対応する誘導情報の複数のマッピング関係を含むデータベースを検索するために前記選択されたモデルをインデックスとして使用して誘導情報を取得するための機能と
    ユーザへの表示のために前記取得された誘導情報を送信するための機能と、
    をコンピュータによって実現させるコンピュータプログラム。
  16. 請求項1に記載の方法において、前記ワードが存在する場合には、前記一のモデルにおける前記ワードの特性は品詞であり、
    前記スキップされたワードが存在する場合には、前記一のモデルにおける前記スキップされたワードの特性は品詞である、方法。
  17. 請求項1に記載の方法において、前記モデルを取得することは、前記新しいクエリに対してN−Gram技術またはSkip−Gram技術を実行することを含む、方法。
  18. 請求項1に記載の方法において、前記ワードが存在する場合には、前記一のモデルにおける前記ワードの特性は品詞であり、
    前記スキップされたワードが存在する場合には、前記一のモデルにおける前記スキップされたワードの特性は品詞であり、
    前記品詞は、副詞、形容詞、数詞、動詞または名詞である、方法。
JP2012557043A 2010-03-10 2011-03-09 クエリモデルに基づく誘導検索 Expired - Fee Related JP5701911B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN201010123209.9 2010-03-10
CN201010123209.9A CN102193939B (zh) 2010-03-10 2010-03-10 信息导航的实现方法、信息导航服务器和信息处理***
US12/932,868 US9449075B2 (en) 2010-03-10 2011-03-08 Guided search based on query model
US12/932,868 2011-03-08
PCT/US2011/000442 WO2011112252A1 (en) 2010-03-10 2011-03-09 Guided search based on query model

Publications (3)

Publication Number Publication Date
JP2013531282A JP2013531282A (ja) 2013-08-01
JP2013531282A5 JP2013531282A5 (ja) 2013-11-28
JP5701911B2 true JP5701911B2 (ja) 2015-04-15

Family

ID=44560922

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012557043A Expired - Fee Related JP5701911B2 (ja) 2010-03-10 2011-03-09 クエリモデルに基づく誘導検索

Country Status (6)

Country Link
US (1) US9449075B2 (ja)
EP (1) EP2545441A4 (ja)
JP (1) JP5701911B2 (ja)
CN (1) CN102193939B (ja)
HK (1) HK1157468A1 (ja)
WO (1) WO2011112252A1 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8612361B1 (en) 2006-12-27 2013-12-17 Stamps.Com Inc. System and method for handling payment errors with respect to delivery services
US8775331B1 (en) 2006-12-27 2014-07-08 Stamps.Com Inc Postage metering with accumulated postage
US10373398B1 (en) 2008-02-13 2019-08-06 Stamps.Com Inc. Systems and methods for distributed activation of postage
US9208620B1 (en) 2008-04-15 2015-12-08 Stamps.Com, Inc. Systems and methods for payment of postage indicia after the point of generation
US9978185B1 (en) 2008-04-15 2018-05-22 Stamps.Com Inc. Systems and methods for activation of postage indicia at point of sale
US9911246B1 (en) 2008-12-24 2018-03-06 Stamps.Com Inc. Systems and methods utilizing gravity feed for postage metering
US10713634B1 (en) * 2011-05-18 2020-07-14 Stamps.Com Inc. Systems and methods using mobile communication handsets for providing postage
US9043323B2 (en) * 2011-08-22 2015-05-26 Nokia Corporation Method and apparatus for providing search with contextual processing
US10846650B1 (en) 2011-11-01 2020-11-24 Stamps.Com Inc. Perpetual value bearing shipping labels
US10922641B1 (en) 2012-01-24 2021-02-16 Stamps.Com Inc. Systems and methods providing known shipper information for shipping indicia
US9805329B1 (en) 2012-01-24 2017-10-31 Stamps.Com Inc. Reusable shipping product
CN103310343A (zh) * 2012-03-15 2013-09-18 阿里巴巴集团控股有限公司 商品信息发布方法和装置
CN103577510A (zh) * 2012-07-23 2014-02-12 阿里巴巴集团控股有限公司 搜索结果数据的展现方法,搜索服务器及移动终端
US9367853B2 (en) * 2013-03-13 2016-06-14 Salesforce.Com, Inc. Systems, methods, and apparatuses for implementing data upload, processing, and predictive query API exposure
US9128988B2 (en) * 2013-03-15 2015-09-08 Wal-Mart Stores, Inc. Search result ranking by department
US9721225B1 (en) 2013-10-16 2017-08-01 Stamps.Com Inc. Systems and methods facilitating shipping services rate resale
US10417728B1 (en) 2014-04-17 2019-09-17 Stamps.Com Inc. Single secure environment session generating multiple indicia
WO2017037801A1 (ja) * 2015-08-28 2017-03-09 株式会社日立製作所 監視システムおよび監視方法
US10459993B2 (en) 2015-12-09 2019-10-29 Siemens Product Lifecycle Management Software Inc. Guided progressive search system and method
US10521754B2 (en) 2016-03-08 2019-12-31 Auctane, LLC Concatenated shipping documentation processing spawning intelligent generation subprocesses
CN110020151B (zh) * 2017-12-01 2022-04-26 北京搜狗科技发展有限公司 一种数据处理方法、装置、电子设备以及存储介质
CN109029449B (zh) * 2018-06-29 2020-09-29 英华达(上海)科技有限公司 寻物方法、寻物装置及寻物***
US11574233B2 (en) * 2018-08-30 2023-02-07 International Business Machines Corporation Suggestion and completion of deep learning models from a catalog
KR20200034430A (ko) * 2018-09-21 2020-03-31 삼성전자주식회사 전자 장치, 시스템 및 음성 인식 서비스 이용 방법
CN109299379B (zh) * 2018-10-30 2021-02-05 东软集团股份有限公司 文章推荐方法、装置、存储介质和电子设备
US11507775B2 (en) * 2018-12-05 2022-11-22 Here Global B.V. Method and apparatus for matching heterogeneous feature spaces
CN109947947B (zh) * 2019-03-29 2021-11-23 北京泰迪熊移动科技有限公司 一种文本分类方法、装置及计算机可读存储介质

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7519529B1 (en) 2001-06-29 2009-04-14 Microsoft Corporation System and methods for inferring informational goals and preferred level of detail of results in response to questions posed to an automated information-retrieval or question-answering service
US7403938B2 (en) 2001-09-24 2008-07-22 Iac Search & Media, Inc. Natural language query processing
US20030115191A1 (en) * 2001-12-17 2003-06-19 Max Copperman Efficient and cost-effective content provider for customer relationship management (CRM) or other applications
US7536293B2 (en) 2003-02-24 2009-05-19 Microsoft Corporation Methods and systems for language translation
JP2006072744A (ja) 2004-09-02 2006-03-16 Canon Inc 文書処理装置、その制御方法、プログラム、及び記憶媒体
US8438142B2 (en) 2005-05-04 2013-05-07 Google Inc. Suggesting and refining user input based on original user input
US7634462B2 (en) 2005-08-10 2009-12-15 Yahoo! Inc. System and method for determining alternate search queries
US7640161B2 (en) 2006-05-12 2009-12-29 Nexidia Inc. Wordspotting system
US8788517B2 (en) * 2006-06-28 2014-07-22 Microsoft Corporation Intelligently guiding search based on user dialog
EP2183685A4 (en) * 2007-08-01 2012-08-08 Ginger Software Inc AUTOMATIC CONTEXT-RELATED LANGUAGE CORRECTION AND EXPANSION USING AN INTERNET CORP
US8180624B2 (en) 2007-09-05 2012-05-15 Microsoft Corporation Fast beam-search decoding for phrasal statistical machine translation
US8694483B2 (en) * 2007-10-19 2014-04-08 Xerox Corporation Real-time query suggestion in a troubleshooting context
US20090248669A1 (en) * 2008-04-01 2009-10-01 Nitin Mangesh Shetti Method and system for organizing information
US20100138402A1 (en) 2008-12-02 2010-06-03 Chacha Search, Inc. Method and system for improving utilization of human searchers
US8745039B2 (en) 2009-09-25 2014-06-03 International Business Machines Corporation Method and system for user guided search navigation

Also Published As

Publication number Publication date
US20110225180A1 (en) 2011-09-15
EP2545441A1 (en) 2013-01-16
JP2013531282A (ja) 2013-08-01
WO2011112252A1 (en) 2011-09-15
EP2545441A4 (en) 2016-08-10
CN102193939B (zh) 2016-04-06
US9449075B2 (en) 2016-09-20
CN102193939A (zh) 2011-09-21
HK1157468A1 (zh) 2012-06-29

Similar Documents

Publication Publication Date Title
JP5701911B2 (ja) クエリモデルに基づく誘導検索
CN107993724B (zh) 一种医学智能问答数据处理的方法及装置
US9836511B2 (en) Computer-generated sentiment-based knowledge base
CN107257970B (zh) 从结构化和非结构化数据源进行的问题回答
CN110413734B (zh) 一种医疗服务的智能搜索***及方法
KR101681280B1 (ko) 쿼리 제안들로서 사용자 입력에 관련된 답변 상자들을 선택 및 제시하기 위한 프레임워크
KR101192439B1 (ko) 디지털 콘텐츠 검색 장치 및 방법
JP6118468B2 (ja) 名称を体系的に大量に正規化する方法
US20100205198A1 (en) Search query disambiguation
CN109522465A (zh) 基于知识图谱的语义搜索方法及装置
US9483557B2 (en) Keyword generation for media content
CN105045799A (zh) 可搜索索引
US20110179026A1 (en) Related Concept Selection Using Semantic and Contextual Relationships
US20110196737A1 (en) Semantic advertising selection from lateral concepts and topics
US20120221544A1 (en) Method, apparatus, and system for mobile search
KR101220557B1 (ko) 사람의 활동 지식 데이터베이스를 이용한 모바일 어플리케이션 검색 방법 및 시스템
US10586174B2 (en) Methods and systems for finding and ranking entities in a domain specific system
CN105653562A (zh) 一种文本内容与查询请求之间相关性的计算方法及装置
CN111417940A (zh) 支持复杂答案的证据搜索
CN110990533A (zh) 确定查询文本所对应标准文本的方法及装置
JP2003173352A (ja) 検索ログ解析方法および装置、文書情報検索方法および装置、検索ログ解析プログラム、文書情報検索プログラム、および記録媒体
JP2004355550A (ja) 自然文検索装置、その方法及びプログラム
CN116450776A (zh) 基于知识图谱的油气管网法律法规及技术标准检索***
US20170147679A1 (en) Query expansion system and method using language and language variants
KR101120040B1 (ko) 연관 질의어 추천 장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130731

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131001

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140304

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140602

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150218

R150 Certificate of patent or registration of utility model

Ref document number: 5701911

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees