JP6174099B2 - 検索装置、及び検索方法 - Google Patents

検索装置、及び検索方法 Download PDF

Info

Publication number
JP6174099B2
JP6174099B2 JP2015212240A JP2015212240A JP6174099B2 JP 6174099 B2 JP6174099 B2 JP 6174099B2 JP 2015212240 A JP2015212240 A JP 2015212240A JP 2015212240 A JP2015212240 A JP 2015212240A JP 6174099 B2 JP6174099 B2 JP 6174099B2
Authority
JP
Japan
Prior art keywords
score
query
document
search
calculated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015212240A
Other languages
English (en)
Other versions
JP2016015179A5 (ja
JP2016015179A (ja
Inventor
秀平 宇野
秀平 宇野
中島 泰
泰 中島
洋平 森下
洋平 森下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2015212240A priority Critical patent/JP6174099B2/ja
Publication of JP2016015179A publication Critical patent/JP2016015179A/ja
Publication of JP2016015179A5 publication Critical patent/JP2016015179A5/ja
Application granted granted Critical
Publication of JP6174099B2 publication Critical patent/JP6174099B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、WANDアルゴリズムを用いた検索装置、及び検索方法に関する。
従来、ユーザのクエリに対して検索結果を返す検索アルゴリズムとして、WAND検索アルゴリズムが知られている(例えば、非特許文献1参照)。
非特許文献1に記載のように、WAND検索アルゴリズムでは、各ドキュメントは、クエリに対するスコアを有し、インデックスにそのスコア最大値が記録されている。そして、クエリに設定されたクエリスコアと、インデックスに記録されたスコア最大値とに基づいて、検索目標数(Top−k)の検索結果を得る。
ここで、インデックスに設定されたクエリに対するスコアと、クエリに設定されたクエリスコアとの積をクエリ毎に算出して、算出された積を加算して、当該ドキュメントに対するトータルスコアとする。この際、WANDアルゴリズムでは、上記のように、インデックスに各ドキュメントのクエリに対する最大スコアが記録されているので、1つのドキュメントに対するトータルスコアが算出されると、そのトータルスコアを閾値として、他のドキュメントに対するトータルスコアの算出をスキップ可能か否かを判定できる。
例えば、クエリAに対するクエリスコアが「1」、クエリBに対するクエリスコアが「2」であり、ドキュメント1〜5に対して、以下の表1に示すように、クエリAに対するスコア、クエリBに対するスコアが設定されているとする。なお、説明の簡略のため、k=1とする(最もスコアが高いもの1つを抽出する)。
Figure 0006174099
上記のような例では、インデックスとして、クエリAに対するスコア最大値「4」、クエリBに対するスコア最大値「3」が記録される。
そして、WANDアルゴリズムでは、ドキュメント1に対してクエリA,Bに対するトータルスコアが、1・2+2・1=4として算出される。ここで、閾値が4として設定される。クエリAに対するスコア最大値は「4」であり、クエリスコアが「1」であるため、クエリAのみを含むドキュメントでは、閾値「4」を超えることができない。したがって、クエリAに対するスコアのみを有するドキュメント2はスキップされる。
一方、クエリBに対する最大値は「3」であり、クエリスコアが「2」であるため、クエリBのみを含むドキュメントにおいては、閾値「4」を超える可能性がある。しかしながら、クエリBのみを含むドキュメントでは、スコアが3以上でなければ閾値を越えないので、ドキュメント3もスキップされる。
ドキュメント4は、クエリA,Bに対してスコアを有し、かつ、ドキュメント1よりもスコアが高いため、トータルスコアを算出する価値があると判定される。その結果、ドキュメント4に対してトータルスコア「7」が算出される。ここで、閾値「4」が「7」に更新される。以降、同様にして、残りのドキュメントに対して、スキップの判定が実施され、スキップされない場合は、トータルスコアが算出される。
ところで、近年、ユーザに対してより最適な検索結果を返すために、クエリのスコアや、当該クエリに対するドキュメントのスコアとして負値が用いられることがある。例えば、クエリBを検索に含ませたくない場合、クエリBのスコアを負値とし、クエリBに対するスコアが低いドキュメントを検索する。
しかしながら、上述したようなWANDアルゴリズムでは、負値のスコアを用いると最適な検索結果を返すことができない場合がある。
例えば、クエリAに対するスコアが「1」、クエリBに対するスコアが「−1」であり、ドキュメント1〜2に対して、以下の表2に示すように、クエリAに対するスコア、クエリBに対するスコアが設定されているとする。なお、説明の簡略のため、k=1とする(最もスコアが高いもの1つを抽出する)。
Figure 0006174099
上記のような例においてWANDアルゴリズムによるTop−1検索を実施すると、ドキュメント1に対してクエリA,Bに対するトータルスコアが1・3+(−1)・(−1)=4として算出される。一方、閾値が「4」となるので、従来のWANDアルゴリズムでは、クエリAのスコア最大値「3」、クエリBのスコア最大値「−1」を超えるドキュメントがないため、ドキュメント2に対するトータルスコアの算出がスキップされることになる。
しかしながら、実際のドキュメント2に対するスコアは、1・1+(−1)・(−6)=7であり、ドキュメント1よりもスコアが高いものであり、本来ドキュメント1よりも上位に検索されるべきものとなる。
このように、スコアに負値が含まれる場合では、WANDアルゴリズムを用いた検索では、適切な検索結果を返すことができないという課題がある。
本発明は、WANDアルゴリズムにおいて負値が用いられた場合でも、適切な検索結果を返すことができる検索装置、及び検索方法を提供することを目的する。
本発明の検索装置は、クエリに基づいて、複数のドキュメントから所望のドキュメントを検索する検索装置であって、前記クエリ、及び前記クエリの重み付けであるクエリスコアを取得するクエリ取得手段と、前記ドキュメントの前記クエリに対する関連度を示すドキュメントスコア、及び、クエリ毎前記ドキュメントスコアの最小値を取得するドキュメントスコア取得手段と、前記クエリスコア及び前記ドキュメントスコアにより算出されるトータルスコアに基づいて、クエリに対する所定数のドキュメントを検索する検索手段と、を備え、前記検索手段は、前記クエリスコアが負値である場合に、当該クエリスコア及び前記最小値を用いて、前記トータルスコアを算出する対象のドキュメントを判断することを特徴とする。
本発明では、クエリスコアが負値の場合に、ドキュメントスコアの最小値を用いて、WANDアルゴリズムによる検索処理を実施するため、クエリに対して正確な順位でドキュメントを検索でき、適切な検索結果を返すことができる。
第一実施形態の検索装置の概略を示すブロック図。 第一実施形態の検索処理(検索方法)を示すフローチャート。 図2におけるスキップ判定処理を示すフローチャート。 第二実施形態に係る広告検索システムの概略を示す図。
[第一実施形態]
以下、本発明に係る一実施形態の検索装置に関し、図面に基づいて説明する。
[検索装置の構成]
図1は、本実施形態の検索装置を示すブロック図である。
本実施形態の検索装置10は、コンピュータであり、通信部11と、記憶部12と、制御部13と、等を含んで構成されている。
通信部11は、例えばLAN等を介してネットワークに接続されており、ネットワーク上の他の機器と通信する。
記憶部12は、例えばメモリ、ハードディスク等により構成されたデータ記録装置であり、本発明におけるインデックス記憶部を構成する。
この記憶部12は、検索装置を制御するための各種プログラムや各種データを記憶する。また、記憶部12には、インデックス記憶手段として機能し、検索処理の対象であるドキュメントのインデックスが記憶される。
なお、検索処理の対象となるドキュメントは、ネットワーク上の所定のサーバ装置に記憶されていてもよく、検索装置10の記憶部12に記憶されていてもよい。
このインデックスは、例えばユーザ等から要求されたクエリ(キーワード等の検索条件)に対する最適なドキュメントを迅速に検索するための索引情報であり、例えば表3に示すようなデータが記録される。
Figure 0006174099
表3に示すように、インデックスには、ドキュメントIDと、ドキュメントスコアと、Maxスコアと、Minスコアとが含まれる。
ドキュメントIDは、ドキュメントを特定する識別データである。
ドキュメントスコアは、所定のクエリに対してそれぞれ設定されており、クエリに対する関連度を示す。例えば、クエリとして検索キーワードが設定される場合では、ドキュメントに含まれる当該キーワード数、若しくは当該キーワード数に基づいて算出された数値がドキュメントスコアとして記録される。
また、クエリBに対するドキュメントスコアに示すように、ドキュメントスコアが負値を設定してもよい。例えば、「男性向け」とのクエリに対して、「女性向け」のドキュメントのドキュメントスコアを負値に設定することで、検索順位を低くすることができる。
Maxスコアは、各クエリに対するドキュメントスコアの最大値であり、Minスコアは、各クエリに対するドキュメントスコアの最小値である。
また、インデックスとしては、その他、ドキュメントIDにて特定されるドキュメントの所在等(例えばURL等)が記録されていてもよい。
制御部13は、CPU等の演算回路、RAM等の記憶回路により構成され、記憶部12等に記憶されているプログラム(ソフトウェア)をRAMに展開し、RAMに展開されたプログラムとの協働で、各種処理を実行する。そして、制御部13は、上記各種処理を実行することで、図1に示すように、クエリ取得手段131、インデックス取得手段132、及び検索手段133等として機能する。
クエリ取得手段131は、例えばネットワーク上の端末装置(ユーザ端末)から送信されたクエリ、及び当該クエリの重み付け値であるクエリスコアを取得する。なお、本実施形態では、ネットワーク上の端末装置からクエリ及びクエリスコアを取得する例を示すが、これに限定されない。例えば、検索装置10がキーボードやマウス等の入力装置を備え、検索装置10の利用者が入力装置を介してクエリやクエリスコアを入力してもよい。その他、クエリ及びクエリスコアが記憶部12に記憶されており、クエリ取得手段131は、例えば端末装置や入力装置からのクエリ指定要求に従って、記憶部12に記憶された当該クエリ及びクエリスコアを取得する構成などとしてもよい。
インデックス取得手段132は、記憶部12に記憶されたインデックスを取得する。なお、本実施形態では、記憶部12にインデックスが記憶される例を示すが、例えば、ネットワーク上のその他のサーバ装置からインデックスを取得する構成などとしてもよい。
検索手段133は、クエリ、クエリスコア、及びインデックスに基づいて、クエリに対して最適なドキュメントを、WANDアルゴリズムを用いて検索する。具体的には、検索手段133は、スコア算出手段134、閾値設定手段135、スキップ判定手段136、及び抽出手段137として機能する。
スコア算出手段134は、クエリスコア及びドキュメントスコアに基づいて、所定のドキュメントの所定のクエリに対するスコア(トータルスコア)を算出する。
閾値設定手段135は、WANDアルゴリズムによる検索処理を実施する上での閾値を設定する。
スキップ判定手段136は、インデックスのMaxスコア、Minスコア、クエリスコア、閾値に基づいて、スコア算出手段134によりドキュメントのトータルスコアを算出するか否かを判定する。
抽出手段137は、算出されたトータルスコアに基づき、Top−kの検索対象のドキュメントIDを抽出する。すなわち、トータルスコアが高い上位k個のドキュメントIDを検索結果として抽出する。
なお、各機能構成の詳細な説明は後述する。
[検索方法]
次に、上記のような検索装置10におけるTop−kのドキュメントの検索方法(検索処理)について、図面に基づいて説明する。図2は、本実施形態における検索処理のフローチャートである。
図2に示すように、本実施形態におけるWANDアルゴリズムに基づく検索処理では、まず、クエリ取得手段131は、クエリQ={q,q,q…q}、及び、これらのクエリQに対するクエリスコアS={SQ1,SQ2,SQ3…SQN}を取得する(ステップS1)。
なお、ステップS1では、クエリ取得手段131は、例えば上述したように、ネットワークを介してユーザ端末等の端末装置から入力されるクエリQ及びクエリスコアSQnを取得してもよく、端末装置からの要求に従い、記憶部12に記憶されているクエリQ及びクエリスコアSQnを取得してもよい。
この後、インデックス取得手段132は、記憶部12に記憶されたインデックスを読み込む(ステップS2)。なお、本実施形態では、記憶部12に記憶されたインデックスを読み込むが、上述したように、ネットワークを介してインデックスを取得してもよい。
この後、検索処理における各種パラメータを初期化する(ステップS3)。
ここで、以降の説明にあたり、ドキュメントIDに係るパラメータをi、検索より得たいドキュメントの数(k)に係るパラメータをj、閾値をXとする。ステップS3では、i=1、j=0、X=0として各パラメータを初期化する。
この後、検索手段133のスコア算出手段134は、ドキュメントID(図2,3では、DocIDと表記)iのドキュメントに対するトータルスコアS(i,Q)を下記式(1)により算出する(ステップS4)。式(1)において、S(i,q)は、ドキュメントIDがiのドキュメントのクエリqに対するドキュメントスコアであり、SQnは、クエリqのクエリスコアである。
Figure 0006174099
次に、検索手段133は、パラメータjに「1」を加算し(ステップS5)、当該パラメータjが検索処理により得たいドキュメントの数(k)になったか否かを判定する(ステップS6)。
ステップS6において、「No」と判定された場合、検索手段133は、パラメータiに「1」を加算し(ステップS7)、ステップS4の処理に戻る。
また、ステップS6において、「Yes」と判定された場合、閾値設定手段135は、WANDアルゴリズムにおける閾値Xを設定する(ステップS8)。具体的には、閾値設定手段135は、ステップS4〜7の繰り返しにより算出されたk個のドキュメントに対するトータルスコアS(i,Q)のうちの最小値を、閾値Xとして設定する。
ステップS8の後、パラメータiに「1」を加算し(ステップS9)、スキップ判定処理(ステップS10)を実施する。
[スキップ判定処理]
図3は、スキップ判定処理におけるフローチャートである。
図3に示すように、スキップ判定処理では、スキップ判定手段136は、まずクエリに関するパラメータnを初期化(n=1)する(ステップS101)。
次に、スキップ判定手段136は、クエリqのクエリスコアSQnが負値(0未満)であるか否かを判定する(ステップS102)。
ステップS102において、「Yes」と判定された場合、スキップ判定手段136は、ドキュメントID:iのクエリqに対するドキュメントスコアのMinスコアSDi(Min)、及びクエリqのクエリスコアSQnを用いて、当該ドキュメントのクエリqに対する一部スコアS(i,q)を下記式(2)により算出する(ステップS103)。
Figure 0006174099
一方、ステップS102において、「No」と判定された場合は、クエリqのクエリスコアSQnが正値(0より大きい)であるか否かを判定する(ステップS104)。
ステップS104において、「Yes」と判定された場合、スキップ判定手段136は、ドキュメントID:iのクエリqに対するドキュメントスコアのMaxスコアSDi(Max)、及びクエリqのクエリスコアSQnを用いて、当該ドキュメントのクエリqに対する一部スコアS(i,q)を下記式(3)により算出する(ステップS105)。
Figure 0006174099
一方、ステップS104において、「No」と判定された場合、スキップ判定手段136は、ドキュメントID:iのクエリqに対するドキュメントスコアがない(0である)と判定する。この場合、スキップ判定手段136は、ドキュメントID:iのクエリqに対する一部スコアS(i,q)を0とする(ステップS106)。
この後、スキップ判定手段136は、パラメータnが、クエリの最大数N以上であるか否かを判定する(ステップS107)。
ステップS107において、「No」と判定されると、スキップ判定手段136は、パラメータnに「1」を加算し(ステップS108)、ステップS102に戻る。すなわち、ステップS1において取得された各クエリQに対するドキュメントID:iの一部スコアS(i,q)を取得する。
ステップS107において「Yes」と判定されると、スキップ判定手段136は、下記式(4)のように、各クエリqに対して算出された一部スコアS(i,q)を加算して、ドキュメントID:iに対する仮スコアS(i,Q)を算出する(ステップS109)。
Figure 0006174099
そして、スキップ判定手段136は、算出された仮スコアS(i,Q)が閾値Xより大きいか否かを判定する(ステップS110)。ステップS110において、「No」と判定された場合、スキップ判定手段136は、ドキュメントID:iをスキップ対象とする(ステップS111)。また、ステップS110において、「Yes」と判定された場合、スキップ判定手段136は、ドキュメントID:iをスキップ対象としない(評価対象とする)(ステップS112)。
上記スキップ判定処理について、下記表4に示す具体例に用いて説明する。
Figure 0006174099
本例では、k=1とする。また、クエリAに対するクエリスコアが「1」、クエリBに対するクエリスコアが「−1」であるとする。
上記のような例では、ドキュメント1に対してトータルスコアS(1,Q)が、1・3+(−1)・(−1)=4として算出され、閾値が「4」と設定される。
スキップ判定手段136は、ドキュメント2に対して、クエリAのクエリスコアが正値であるので、Maxスコア「3」を用いて、クエリAに対する一部スコアを1・3=3と算出し、クエリBのクエリスコアが負値であるので、Minスコア「−6」を用いて、(−1)・(−6)=6と算出する。したがって、ドキュメント2に対する仮スコアは、S(2,Q)=9と算出される。これにより、ドキュメント2は、仮スコアが閾値「4」を超えるものであり、評価対象(スキップしない)と判定される。
図2に戻り、ステップS10のスキップ判定処理の後、検索手段133は、スキップ判定手段136によりドキュメントID:iがスキップ対象とされたか否かを判断する(ステップS11)。
ステップS11において、「No」と判定された場合(評価すると判定された場合)、スコア算出手段134は、ステップS4と同様の処理により、ドキュメントID:iのドキュメントに対するトータルスコアS(i,Q)を算出する(ステップS12)。
そして、閾値設定手段135は、ステップS12において算出されたトータルスコアS(i,Q)が、閾値Xより大きいか否かを判定し(ステップS13)、大きいと判定した場合は、閾値Xを再設定する(ステップS14)。つまり、閾値設定手段135は、算出されたトータルスコアS(i,Q)のうち、上位k個を抽出し、その最低値を閾値Xとする。
一方、ステップS11において「Yes」と判定された場合(スキップ対象と判定された場合)は、上記ステップS11〜ステップS14の処理はスキップされる。
つまり、ステップS11において「Yes」と判定された場合、ステップS13において「No」と判定された場合(トータルスコアS(i,Q)が閾値Xを超えない場合)、及びステップS14の後、検索手段133は、パラメータiに「1」を加算し(ステップS15)、パラメータiが最大値Iを超えたか否かを判定する(ステップS16)。つまり、全てのドキュメントに対して、ステップS1〜ステップS14の処理が実施されたか否かを判定する。ステップS16において、「No」と判定された場合、ステップS10の処理に戻る。
また、ステップS16において、「Yes」と判定された場合、抽出手段137は、算出されたトータルスコアS(i,Q)のうち、上位k個を抽出し、抽出したトータルスコアS(i,Q)に対応したドキュメントIDのドキュメントを検索結果とする(ステップS17)。
[本実施形態の作用効果]
本実施形態では、インデックスとして、各クエリに対するドキュメントスコアのMaxスコア及びMinスコアが記録されている。
そして、検索手段133は、ステップS102からステップS103に示すように、クエリスコアが負値である場合に、Minスコアを用い、クエリスコアが正値である場合に、Maxスコアを用いて、WANDアルゴリズムに基づいた検索処理を実施する。
一般に、Maxスコアのみを用いてWANDアルゴリズムを用いた場合では、トータルスコアの算出をスキップされるべきではないドキュメントに対しても、スキップされるおそれがある。これに対して、本実施形態では、上記のようなインデックスを用いてWANDアルゴリズムに基づく検索処理を実施することで、トータルスコアの算出をスキップしてよいか否かを精度よく判定することができる。したがって、クエリに対して正確なランク付けでドキュメントの検索結果を返すことができる。
[第二実施形態]
次に、本発明における第二実施形態について、図面に基づいて説明する。
本実施形態では、上記第一実施形態に示す検索装置を用いた検索処理の一例として、広告検索処理について説明する。
図4は、広告検索を実施する広告検索システムの概略を示す図である。なお、第一実施形態と同様の構成については同符号を付し、その説明を省略又は簡略化する。
図4に示すように、広告検索システム100は、上述した検索装置10と、ユーザにより操作される端末装置(ユーザ端末20)と、広告主により操作される端末装置(広告主端末30)と、を備え、これらの装置10,20,30がネットワークを介して通信可能に接続されている。
[ユーザ端末]
ユーザ端末20は、コンピュータであり、図示は省略するが、キーボード等により構成される入力装置、メモリ等により構成される記憶装置、CPU等により構成される演算装置、及びディスプレイを備えている。
そして、ユーザ端末20は、ユーザが入力装置を操作することで、ユーザデータを取得し、取得したユーザデータをクエリとして検索装置10に送信する。
ここで、ユーザデータとしては、例えば、性別、年齢、居住地域等のユーザ個人のデータであってもよく、ユーザの興味データ等の所望の広告配信を受けるための条件や、広告配信を受けたくない条件等であってもよい。
また、ユーザ端末20は、ユーザが入力装置を操作することで、クエリとして配信されるユーザデータに対する優先度をクエリスコアとして取得し、検索装置10に送信する。
例えば、広告配信を受けたい条件に対して正値の優先度を設定し、広告配信を受けたくないデータに対して負値の優先度を設定することが可能となる。
上記のようなユーザデータ(クエリ)及びクエリスコアの一例を表5に示す。
Figure 0006174099
[広告主端末]
広告主端末30は、コンピュータであり、図示は省略するが、キーボード等により構成される入力装置、メモリ等により構成される記憶装置、CPU等により構成される演算装置、及びディスプレイを備えている。
そして、広告主端末30の記憶装置には、ユーザ端末20に配信する本発明におけるドキュメントである広告(広告データ)が記憶されている。また、広告主端末30は、例えば、広告主が入力装置を操作することで、広告配信データを取得する。この広告配信データは、ユーザデータ(クエリ)に対応した配信条件と、当該配信条件に対する広告の関連度を示すスコア(すなわち、ドキュメントスコア)とを関連付けたデータとなる。そして、広告主端末30は、取得した広告配信データをドキュメントスコアとして検索装置に送信する。
なお、広告主端末30は、記憶装置に記憶された広告を検索装置10に送信してもよい。
表6に広告主端末30から検索装置10に送信される広告配信データの一例を示す。
Figure 0006174099
[検索装置]
検索装置10は、上述した第一実施形態と略同様の構成を有する。検索装置10の制御部13は、記憶部12に記憶されたプログラムを読み込み実行することで、クエリ取得手段131、インデックス取得手段132、及び検索手段133として機能する。
クエリ取得手段131は、ユーザ端末20から上述した表5に示すようなユーザデータ、クエリスコアを取得し、記憶部12に記憶する。
インデックス取得手段132は、広告主端末30から上述した表6に示すような広告配信データを取得する。そして、インデックス取得手段132は、複数の広告主端末30から送信された広告配信データを統合し、広告IDをドキュメントIDとして新規に振り直して、インデックスとして記憶部12に記憶する。この際、インデックス取得手段132は、各クエリ(ユーザデータ)に対するドキュメントスコアの最大値をMaxスコア、最小値をMinスコアとしてインデックスに記憶する。また、新規に広告配信データを取得すると、当該取得した広告配信データをインデックスに追加し、かつ、Maxスコア及びMinスコアを再算出する。
これにより、検索装置10は、ユーザデータをクエリ、ユーザデータに関連付けらえたクエリスコア、インデックスを用い、上述した第一実施形態と同様のWANDアルゴリズムに基づいた検索処理を実施することができ、各ユーザデータ(クエリ)に対して最適なドキュメントIDを抽出することができる。
検索装置10は、抽出されたドキュメントIDに対応した広告データの配信元(広告主端末30)のURLをユーザ端末20に送信する。また、記憶部12に広告データが記憶されている場合、検索装置10は、抽出されたドキュメントIDに対応した広告データを記憶部12から読み出し、ユーザ端末20に送信する。これにより、各ユーザ端末20に、ユーザに対して最適な広告データが配信することができる。
[変形例]
第二実施形態において、検索装置10は、広告主端末30から広告配信データを、ネットワークを介して取得し、取得した広告配信データに基づいてインデックスを作成する例を示したが、例えば検索装置10を操作することで、インデックスを作成する等してもよい。
第一実施形態の検索装置10の適用例として、広告配信システムを例示したが、これに限定されない。本発明は、クエリを用いた検索処理を実施する装置やシステムに適用でき、例えば、検索キーワード等のクエリに基づいたコンテンツやファイルの検索、店舗等の施設検索等、様々な検索用途に適用することができる。
その他、本発明の実施の際の具体的な構造および手順は、本発明の目的を達成できる範囲で他の構造などに適宜変更できる。
10…検索装置、12…記憶部(インデックス記憶手段)、13…制御部、20…ユーザ端末、30…広告主端末、100…広告検索システム、131…クエリ取得手段、132…インデックス取得手段、133…検索手段、134…スコア算出手段、135…閾値設定手段、136…スキップ判定手段、137…抽出手段。

Claims (5)

  1. クエリに基づいて、複数のドキュメントから所望のドキュメントを検索する検索装置であって、
    前記クエリ、及び前記クエリの重み付けであるクエリスコアを取得するクエリ取得手段と、
    前記ドキュメントの前記クエリに対する関連度を示すドキュメントスコア、及び、クエリ毎前記ドキュメントスコアの最小値を取得するドキュメントスコア取得手段と、
    前記クエリスコア及び前記ドキュメントスコアにより算出されるトータルスコアに基づいて、前記クエリに対する所定数のドキュメントを検索する検索手段と、を備え、
    前記検索手段は、前記クエリスコアが負値である場合に、当該クエリスコア及び前記最小値を用いて、前記トータルスコアを算出する対象のドキュメントを判断する
    とを特徴とする検索装置。
  2. 請求項1に記載の検索装置において、
    前記ドキュメントスコア取得手段は、クエリ毎の前記ドキュメントスコアの最大値を取得し
    前記検索手段は、前記クエリスコアが正値である場合に、当該クエリスコア及び前記最大値を用いて、前記トータルスコアを算出する対象のドキュメントを判断する
    ことを特徴とする検索装置。
  3. 請求項2に記載の検索装置において、
    前記検索手段は、各ドキュメントに対して、前記ドキュメントスコアがない場合は「0」を、前記クエリスコアが正値の場合に当該クエリスコア及び前記最大値の積を、前記クエリスコアが負値の場合では当該クエリスコア及び前記最小値の積を、前記クエリに対する一部スコアとして算出し、全クエリに対して算出された前記一部スコアの和が、所定の閾値以下である場合に、当該ドキュメントの前記トータルスコアの算出をスキップする
    ことを特徴とする検索装置。
  4. 請求項1から請求項3のいずれかに記載の検索装置において、
    前記クエリは、ユーザに関するユーザデータであり、
    前記ドキュメントは、広告データであり、
    前記ドキュメントスコア取得手段は、前記ユーザデータの前記広告データに対する関連度を前記ドキュメントスコアとして取得する
    ことを特徴とする検索装置。
  5. コンピュータにより、クエリに基づいて複数のドキュメントから所望のドキュメントを検索する検索方法であって、
    記コンピュータは、
    前記クエリ、及び前記クエリの重み付けであるクエリスコアを取得し、
    前記ドキュメントの前記クエリに対する関連度を示すドキュメントスコア、及び、クエリ毎の前記ドキュメントスコアの最小値を取得し、
    前記クエリスコア及び前記ドキュメントスコアにより算出されるトータルスコアに基づいて、前記クエリに対する所定数のドキュメントを検索し、
    前記トータルスコアの算出に際し、前記クエリスコアが負値である場合に、当該クエリスコア及び前記最小値を用いて、前記トータルスコアを算出する対象のドキュメントを判断する
    ことを特徴とする検索方法。
JP2015212240A 2015-10-28 2015-10-28 検索装置、及び検索方法 Active JP6174099B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015212240A JP6174099B2 (ja) 2015-10-28 2015-10-28 検索装置、及び検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015212240A JP6174099B2 (ja) 2015-10-28 2015-10-28 検索装置、及び検索方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2014007626A Division JP5833150B2 (ja) 2014-01-20 2014-01-20 検索装置、及び検索方法

Publications (3)

Publication Number Publication Date
JP2016015179A JP2016015179A (ja) 2016-01-28
JP2016015179A5 JP2016015179A5 (ja) 2016-03-10
JP6174099B2 true JP6174099B2 (ja) 2017-08-02

Family

ID=55231252

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015212240A Active JP6174099B2 (ja) 2015-10-28 2015-10-28 検索装置、及び検索方法

Country Status (1)

Country Link
JP (1) JP6174099B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1069490A (ja) * 1996-08-28 1998-03-10 Toshiba Corp 文書絞り込み検索装置、文書絞り込み検索方法及び文書検索装置
KR101374651B1 (ko) * 2005-03-18 2014-03-17 써치 엔진 테크놀로지스, 엘엘씨 서치 결과를 향상시키기 위해 사용자로부터의 피드백을 적용하는 서치 엔진

Also Published As

Publication number Publication date
JP2016015179A (ja) 2016-01-28

Similar Documents

Publication Publication Date Title
JP4972358B2 (ja) 文書検索装置、文書検索方法、文書検索プログラム及び記録媒体。
CN106095738B (zh) 推荐表单片段
US8805755B2 (en) Decomposable ranking for efficient precomputing
KR101220557B1 (ko) 사람의 활동 지식 데이터베이스를 이용한 모바일 어플리케이션 검색 방법 및 시스템
CN107911448B (zh) 一种内容推送方法及装置
JP6162664B2 (ja) 抽出装置、検索サーバ、情報処理装置、抽出システム、抽出方法及び抽出プログラム
US9165058B2 (en) Apparatus and method for searching for personalized content based on user's comment
WO2017173801A1 (zh) 一种个性化多媒体推荐方法和装置
JP6664599B2 (ja) 曖昧性評価装置、曖昧性評価方法、及び曖昧性評価プログラム
JP2020170538A (ja) 検索データを処理するための方法、装置及びプログラム
JP5281104B2 (ja) 広告管理装置、広告選択装置、広告管理方法、広告管理プログラム及び広告管理プログラムを記録した記録媒体
JP5579140B2 (ja) 文書検索装置及び方法及びプログラム
JP5296745B2 (ja) クエリサジェスチョン提供装置及び方法
CA2878067C (en) Method and device for pushing media information in real time
JP6174099B2 (ja) 検索装置、及び検索方法
JP5833150B2 (ja) 検索装置、及び検索方法
JP7153500B2 (ja) データ管理装置およびデータ推奨プログラム
JP2010055164A (ja) 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体
JP2011022624A (ja) ウェブページ検索システム、ウェブページ検索方法、ウェブページ検索サーバ及びウェブページ検索プログラム
TWI639093B (zh) Object set and processing method and device thereof
JP2016192067A (ja) 検索装置
JP5801243B2 (ja) 特徴キーワード推薦装置及び方法及びプログラム
JP2000293531A (ja) 情報検索方法及び装置
KR101453623B1 (ko) 추천 시스템에서 유저의 검색 키워드를 이용한 아이템 선호도 추론 방법 및 시스템
JP5792871B1 (ja) 代表スポット出力方法、代表スポット出力装置および代表スポット出力プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151217

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160915

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170705

R150 Certificate of patent or registration of utility model

Ref document number: 6174099

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250