JP5010624B2 - 検索装置 - Google Patents

検索装置 Download PDF

Info

Publication number
JP5010624B2
JP5010624B2 JP2009028129A JP2009028129A JP5010624B2 JP 5010624 B2 JP5010624 B2 JP 5010624B2 JP 2009028129 A JP2009028129 A JP 2009028129A JP 2009028129 A JP2009028129 A JP 2009028129A JP 5010624 B2 JP5010624 B2 JP 5010624B2
Authority
JP
Japan
Prior art keywords
search
search result
search engine
engine
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009028129A
Other languages
English (en)
Other versions
JP2010186214A (ja
Inventor
ゾラン ステイチ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2009028129A priority Critical patent/JP5010624B2/ja
Publication of JP2010186214A publication Critical patent/JP2010186214A/ja
Application granted granted Critical
Publication of JP5010624B2 publication Critical patent/JP5010624B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、クエリに関連するデータを検索する技術に関するものである。特に、本発明は、Web検索に適した検索技術に関するものである。
下記特許文献1には、クエリを用いたWeb検索技術が開示されている。この技術では、クローリングと呼ばれる手法により、予め、Web内に存在する各種の文書(一般にはテキストや画像を含む)が取得され、データベース中に蓄積される。蓄積時には、検索の容易性を考慮した索引付けが行われる。
この技術において、ユーザがユーザ端末にクエリを入力すると、検索エンジンは、クエリに基づいて、データベース内を検索し、類似するWeb文書を検索結果としてユーザ端末に返す。
さらに、この技術では、一つのクエリに基づいて、異なるカテゴリー(例えばニュース、ディスカッション・グループ、イメージなど)におけるそれぞれの検索結果を取得する。そして、それぞれのカテゴリーにおける検索結果をユーザに提示する。
この技術においては、ユーザは、興味のあるカテゴリーを指定することにより、当該カテゴリーに属する検索結果にアクセスすることができる。しかしながら、この技術は、各カテゴリーにおける検索結果を統合して表示するものではない。
一方、下記特許文献2には、複合メディア文書をクエリとして検索を行う技術が記載されている。この技術では、ユーザが指定した複合メディア文書(テキストや画像を含む文書)から特徴を自動的に抽出し、抽出された特徴をキーにしてデータベースを検索する。データベース中に、検索対象となる複合メディア文書と、そこから抽出された特徴とを対応して事前に記録しておくことによって、クエリに類似した複合メディア文書を取得する。
しかしながら、様々な情報を持つ複合メディア文書から検索キーを自動的に抽出すると、検索ノイズが増える傾向がある。このため、この技術を実装する場合は、検索ノイズを抑えるための工夫が必要になると考えられる。
また、一般的なウェブ検索では、文字列が検索キーとして入力される。しかしながら、特許文献2の技術では、各種コンテンツを含む複合メディア文書を検索キーとして入力しなければならない。すると、ユーザは、検索しようとしている文書に類似する複合メディア文書を用意しなければ検索ができず、検索作業が煩雑になる。また、このような複合メディア文書を検索キーとして受け付ける検索装置は、クエリの形態が著しく制約されるために、汎用性に欠ける。
特表2007−517317号公報(段落0039及び0040) 特開2000−148793号公報
本発明は、前記の状況に鑑みてなされたものである。本発明の目的の一つはユーザにおける操作の負担を低く抑えつつ、ユーザの検索意図に沿った高精度の検索が可能になる検索装置ないし手法を提供することである。
本発明は、以下のいずれかの項目に記載の構成とされている。
(項目1)
クエリ受付部と、検索結果取得部と、ランキング調整部と、検索結果出力部とを備えており、
前記クエリ受付部は、ユーザ端末から送られた、検索のためのクエリを受け付けて、第1検索エンジンと、第2検索エンジンとにそれぞれ送る構成となっており、
前記第1検索エンジンは、前記クエリに基づいて、Web文書を検索することにより、ランク付けされた第1検索結果を生成する構成となっており、
前記第2検索エンジンは、前記クエリに基づいて、マルチメディアデータを検索することにより、第2検索結果を生成する構成となっており、
前記マルチメディアデータには、画像又は音声が含まれており、
前記検索結果取得部は、前記第1検索エンジンにおける前記第1検索結果と、前記第2検索エンジンにおける前記第2検索結果とをそれぞれ取得する構成となっており、
前記ランキング調整部は、前記第1検索エンジンによる前記第1検索結果と、前記第2検索エンジンによる前記第2検索結果との類似度を算出する処理と、算出された前記類似度によって、前記第1検索結果におけるランク付けを変更することによって、第3検索結果を生成する処理とを行う構成となっており、
前記検索結果出力部は、前記第1検索エンジンによるランク付けがされた前記第1検索結果と、前記ランキング調整部によってランク付けが変更された前記第3検索結果とを並列に表示するための、表示用文書を生成する処理と、前記表示用文書を前記ユーザ端末に向けて出力する処理とを行う構成となっている
ことを特徴とする検索装置。
この発明によれば、第1検索エンジンによる第1検索結果に対して、第2検索エンジンによる第2検索結果を用いてランク付けを行うことができる。これにより、この発明では、検索精度の向上が期待でき、しかも、操作者への負担を低く抑えることが可能になる。なお、第2検索エンジンが複数存在することは可能である。
(項目2)
前記第2検索エンジンが複数存在しており、
前記ランキング調整部は、
前記第1検索エンジンによる前記第1検索結果と、前記複数の第2検索エンジンによる複数の前記第2検索結果とのそれぞれの類似度を統合し、かつ、統合された類似度に基づいて前記のランク付けを行う構成となっている
項目1に記載の検索装置。
(項目3)
前記第2検索エンジンは、画像検索エンジン、動画検索エンジン及び商品検索エンジンのいずれか、又は、これらの組み合わせである
項目1又は2に記載の検索装置。
(項目4)
前記ランキング調整部は、
前記第1検索エンジンによる検索結果に含まれるコンテンツの種類に応じて、前記第2検索エンジンによる前記第2検索結果を参照する処理と、
前記第2検索エンジンによる前記第2検索結果との類似度が高い場合に、前記前記第1検索エンジンによる前記第1検索結果のランクを高くする処理と
を行う構成となっている
項目1〜3のいずれか1項に記載の検索装置。
(項目5)
前記第1検索エンジンによる検索結果には、テキスト、画像及び音声のいずれか又はこれらの組み合わせが含まれている
項目1〜4のいずれか1項に記載の検索装置。
(項目6)
第1検索エンジンと、第2検索エンジンとが、検索のための共通のクエリを受け取るステップと;
前記第1検索エンジンが、前記クエリに基づいて、Web文書を検索することにより、ランク付けされた第1検索結果を生成するステップと;
前記第2検索エンジンが、前記クエリに基づいて、マルチメディアデータを検索することにより、第2検索結果を生成するステップと、
ここで、前記マルチメディアデータには、画像又は音声が含まれており;
前記第1検索エンジンによる前記第1検索結果と、前記第2検索エンジンによる前記第2検索結果との類似度を算出するステップと;
算出された前記類似度によって、前記第1検索結果におけるランク付けを変更することによって、第3検索結果を生成するステップと;
前記第1検索エンジンによるランク付けがされた前記第1検索結果と、前記ランキング調整部によってランク付けが変更された前記第3検索結果とを並列に表示するための、表示用文書を生成するステップと;
前記表示用文書をユーザ端末に向けて出力するステップと を備えたことを特徴とする検索方法。
(項目7)
項目6に記載のステップをコンピュータに実行させることを特徴とするコンピュータプログラム。
このコンピュータプログラムは、適宜な記録媒体(例えばCD−ROMやDVDディスクのような光学的な記録媒体、ハードディスクやフレキシブルディスクのような磁気的記録媒体、あるいはMOディスクのような光磁気記録媒体)に格納することができる。このコンピュータプログラムは、インターネットなどの通信回線を介して伝送されることができる。
本発明によれば、ユーザにおける操作の負担を低く抑えつつ、高精度の検索が可能になる検索装置ないし手法を提供することである。
本発明の一実施形態に係る検索装置の基本的な構成を示すブロック図である。 図1の検索装置における基本的な動作を説明するためのフローチャートである。 図1の検索装置における基本的な動作を説明するための説明図である。 図1の検索装置におけるランキング手法を説明するためのフローチャートである。 図1の検索装置におけるランキング手法を説明するための説明図である。 図1の検索装置におけるランキング手法を説明するための説明図である。 図1の検索装置におけるランキング手法を説明するための説明図である。図(a)は、Web検索エンジンによる検索結果を示す。図(b)は、再ランキングされた検索結果を示す。 マルチメディア類似度の計算に関する変形例1を説明するための説明図である。 マルチメディア類似度の計算に関する変形例2を説明するための説明図である。
(本実施形態の装置構成)
本発明の一実施形態に係る検索装置を、添付の図面に基づいて説明する。本実施形態の装置は、クエリを用いてWeb検索を行うものである。
本実施形態の検索装置は、検索仲介サーバ1として実装されている(図1参照)。検索仲介サーバ1は、クエリ受付部11と、検索結果取得部12と、ランキング調整部13と、検索結果出力部14とを備えている。
また、検索仲介サーバ1は、インターネット2に接続されている。また、インターネット2には、検索仲介サーバ1にクエリを送るためのユーザ端末3と、検索を実行するための検索実行サーバ4とがさらに接続されている。なお、インターネット以外のネットワークにより、これらの各ノードを接続することも可能である。
(検索仲介サーバ1の説明)
検索仲介サーバ1のクエリ受付部11は、ユーザ端末3から送られた、検索のためのクエリを受け付けて、後述する第1検索エンジン(Web検索エンジン)と、第2検索エンジン(他の検索エンジン)とにそれぞれ送る構成となっている。第1検索エンジンは、前記クエリに基づいて、Web文書を検索することにより、ランク付けされた第1検索結果を生成する構成となっている。また、第2検索エンジンは、前記クエリに基づいて、マルチメディアデータを検索することにより、第2検索結果を生成する構成となっている。これらの検索エンジンの詳細は、本実施形態の動作として追って詳しく説明する。なお、本実施形態におけるマルチメディアデータは、画像又は音声が含まれたものとなっている。
検索結果取得部12は、第1検索エンジンにおける第1検索結果と、第2検索エンジンにおける第2検索結果とをそれぞれ取得する構成となっている。この検索結果取得部12についても追って詳しく説明する。
ランキング調整部13は、第1検索エンジンによる第1検索結果と、第2検索エンジンによる前記第2検索結果との類似度を算出する処理と、算出された類似度によって、第1検索結果におけるランク付けを変更することによって、第3検索結果を生成する処理とを行う構成となっている。これについても追って詳しく説明する。
検索結果出力部14は、第1検索エンジンによるランク付けがされた第1検索結果と、ランキング調整部によってランク付けが変更された第3検索結果とを並列に表示するための、表示用文書を生成する処理と、表示用文書をユーザ端末3に向けて出力する処理とを行う構成となっている。
(ユーザ端末3の説明)
ユーザ端末3は、ユーザによるクエリの入力を受け付け、入力されたクエリを検索サーバ1に送るためのものである。
ユーザ端末3は、端末本体31と、入力部32と、表示部33とを備えている。
端末本体31は、CPU、ネットワーク・インタフェース、入出力インタフェースなどを備えており、ユーザ端末3の動作を制御できるようになっている。このような端末本体31としては、通常のパーソナルコンピュータを用いることができる。
入力部32は、端末本体31に対してユーザが指令を入力するための部分である。入力部32としては、例えばキーボードやマウスを用いることができる。本実施形態においては、ユーザは、入力部32を使ってクエリを入力することができる。
表示部33は、検索仲介サーバ1から返された検索結果(すなわち表示用文書)をユーザに表示できるようになっている。表示部33としては、例えば、各種のディスプレイやプリンタを使用することができる。
(検索実行サーバの説明)
検索実行サーバ4は、Web検索エンジン41と、画像検索エンジン42と、動画検索エンジン43と、商品検索エンジン44とを備えている。各検索エンジン41〜44は、与えられたクエリに基づいて、検索結果をそれぞれ取得する構成となっている。
Web検索エンジン12は、Web文書の検索を行うものである。Web検索エンジンの具体例としては、Yahoo(登録商標)検索がある。Web検索の一例としては、データベース中に、インデックスが付されたWeb文書を蓄積しておき、クエリとインデックスとの類似度に基づいて、Web文書を検索するものがある。インデックスの例は、Web文書から抽出されたテキストである。
画像検索エンジン42は、インターネット上にある画像を検索するものである。その具体例としては、Yahoo(登録商標)画像検索がある。画像検索の一例としては、データベース中に、インデックスが付された画像を蓄積しておき、クエリと画像との類似度に基づいて、画像を検索するものがある。インデックスの例は、画像の特徴を表す文言(いわゆるタグないしラベル)である。ただし、画像の特徴量を用いて蓄積画像を検索することも可能である。
動画検索エンジン43は、インターネット上にある動画を検索するものである。その具体例としては、Yahoo(登録商標)動画検索がある。動画検索の一例としては、データベース中に、インデックスが付された動画を蓄積しておき、クエリと動画との類似度に基づいて、動画を検索するものがある。インデックスの例は、動画の特徴を表す文言(いわゆるタグないしラベル)である。ただし、動画を構成する画像や音声の特徴量を用いて蓄積動画を検索することも可能である。
商品検索エンジン44は、インターネット上にある販売サイト上のテキスト、画像または音声のいずれかを含む情報を検索するものである。その具体例としては、Yahoo(登録商標)商品検索がある。商品検索の一例としては、データベース中に、商品販売用のWeb文書を、インデックスを付した状態で蓄積しておき、クエリとインデックスとの類似度に基づいて、商品販売用のWeb文書を検索するものがある。インデックスの例は、商品販売用のWeb文書から抽出されたテキストである。ただし、商品検索エンジンとしては、商品販売用のWeb文書に含まれる画像や音声情報に基づく検索を行うものであってもよい。
各検索エンジン41〜44は、それぞれ、検索対象となるデータを格納したデータベース411〜441を備えている。各データベース411〜441には、予めインターネット上をクローリングすることによって収集されたデータが格納されている。あるいは、各データベース411〜441には、サービス提供者によって収集されたデータが格納されている。また、各データベース411〜441に格納されたデータには、効率的な検索を行うための索引が付されている。例えば、テキストをクエリとする場合、画像検索用のラベルを、当該画像に対応させた状態で、データベースに登録することが一般に行われている。同様に、検索対象が動画や音声である場合も、このようなラベル付けを行うことができる。このようなデータベース411〜441の構成は、従来の検索エンジンにおけるものと同様でよいので、これ以上詳しい説明は省略する。本実施形態では、Web検索エンジン41が第1検索エンジンの例に相当し、他の検索エンジン42〜44が第2検索エンジンの例に相当している。
(ランキング調整部13)
ランキング調整部13は、Web検索エンジン41による第1検索結果に対して、他の検索エンジン42〜44による第2検索結果との類似度によって、第1検索結果におけるランク付けを変更する構成となっている。ランク付けが変更された結果が、本発明における第3検索結果の例に相当する。このようにして、この実施形態では、第1検索エンジンによる第1検索結果と、第2検索エンジンによる第2検索結果との類似度を算出する処理と、算出された類似度によって、第1検索結果におけるランク付けを変更することによって、第3検索結果を生成する処理とを行う構成となっている。
ランキング調整部13についてのさらに詳しい動作は後述する。
(本実施形態の動作)
ついで、本実施形態に係る検索仲介サーバ1の動作について、図2及び図3を主に参照しながら説明する。
(図2のステップSA−1)
まず、ユーザは、ユーザ端末3の入力部32を用いて、クエリを入力する。クエリとしては、この実施形態では、テキストが用いられている。ユーザ端末3で入力されたクエリは、インターネット2を介して、検索仲介サーバ1のクエリ受付部11に送られる(図3のステップSB−1)。
(図2のステップSA−2)
ついで、クエリ受付部11は、検索実行サーバ4の各検索エンジン41〜44にクエリを送る。
(図2のステップSA−3)
クエリを受け取った各検索エンジン41〜44は、それぞれの検索アルゴリズムに従って、検索結果を取得する(図3のステップSB−2及びSB−3)。各検索エンジンにおける検索処理は、従来の検索エンジンと同様でよいので、詳しい説明は省略する。
これにより、各検索エンジン41〜44における検索に対応して、検索結果のリストを取得することができる。この実施形態では、Web検索エンジン41による検索結果を第1検索結果、他の検索エンジン42〜44による検索結果を第2検索結果と称している。各検索結果は、インターネット2を介して、検索仲介サーバ1の検索結果取得部12に送られる。
(図2のステップSA−4)
検索結果取得部12は、前記の第1検索結果及び第2検索結果を取得した後、これらの検索結果を、ランキング調整部13に送る。ついで、ランキング調整部13は、Web検索エンジン41による第1検索結果に対するランキングを調整する(図3のステップSB−4)。なお、この調整を、「再ランキング」と呼ぶことがある。
再ランキングの詳しい手順を、図4〜図7に基づいて、さらに詳しく説明する。
(図4のステップSC−1)
まず、Web検索エンジン41による第1検索結果と、他の検索エンジン42〜44による第2検索結果とのマルチメディア類似度を計算する。
図5には、Web検索エンジン41による第1検索結果のリスト(図(a))と、画像検索エンジン42による第2検索結果のリスト(図(b))と、動画検索エンジン43による第2検索結果のリスト(図(c))と、商品検索エンジン44による第2検索結果のリスト(図(d))とを示している。
各検索結果のリストでは、図5に示されたように、各検索エンジンのアルゴリズムに従って、ランク付けが行われている。図5では、上位N件(Nは任意の自然数)の検索結果が示されている。Nの値は、各検索エンジンにおいて異なっていても良いし、同じでもよい。
図5の例では、Web検索エンジンによる第1順位の検索結果(いわゆるWeb文書)には、一つのテキストと、二つの画像が含まれている。第2順位の検索結果(いわゆるWeb文書)には、二つの動画と一つのテキストが含まれている。
ここで、Web検索エンジン41による検索リストのうちの一項目が、図6(a)に示されるように、二つの画像と一つの動画をコンテンツとして含むとする。この場合は、含まれるコンテンツに対応して、画像検索エンジン42による検索結果(図6(b))と、動画検索エンジン43による検索結果(図6(c))とが参照される。以下、詳しく説明する。
まず、画像については、Web検索エンジン41による検索結果に含まれる画像と、画像検索エンジン42による検索結果としての画像との類似度を算出する(図6(d))。具体的には、この実施形態では、Web検索結果におけるそれぞれの画像と、画像検索結果におけるそれぞれの画像との類似度を計算する。そして、得られた最大類似度の平均を、画像類似度として用いる。
すなわち、この実施形態での画像類似度は、以下のようになる。なお、ここで、Max{}は、最大値を選ぶ関数を意味し、類似度()は、類似度を算出する関数を意味する。
画像類似度=[MAX{類似度(画像A,画像1),類似度(画像A,画像2),類似度(画像A,画像3),類似度(画像A,画像4)}+MAX{類似度(画像B,画像1),類似度(画像B,画像2),類似度(画像B,画像3),類似度(画像B,画像4)}]/2。
同様にして、動画類似度は、以下のようにして算出される(図6(e))。
動画類似度=MAX{類似度(動画A,動画1),類似度(動画A,動画2)}。
なお、各類似度は、既存の計算手法で算出できる。例えば、画像データの場合は、色、形状、テクスチャーといった視覚的な特徴量を画像データから抽出し、類似度を計算する手法が一般的であ。よって、類似度の計算手法についての詳しい説明は省略する(参考文献:"Content-based Multimedia Information Retrieval: State of the Art and Challenges", ACM Transactions on Multimedia Computing, Communications, and Applications, 2(1):1-19, Feb. 2006.)。なお、各類似度の値は、各メディア(例えばテキストや画像などの種類別)での最大類似度に対して正規化されていることが好ましい。
そして、本実施形態では、マルチメディア類似度を以下のようにして算出する。
マルチメディア類似度=(画像類似度+動画類似度)/2。
つまり、マルチメディア類似度は、得られた各類似度の平均として算出される。このようなマルチメディア類似度の計算を、Web検索エンジンによる各検索結果について行う。検索された項目の中に音声やテキストが含まれる場合も、同様にしてマルチメディア類似度を計算することができる。
(図4のステップSC−2)
ついで、ランキング調整部13は、得られたマルチメディア類似度に基づいて、Web検索エンジン41による第1検索結果のランキングを並べ替える。並び替える前の状態を図7(a)に示し、並び替えた後の状態を図7(b)に示す。ランキングを並べ替えた状態は、本発明における第3検索結果に相当する。
このような処理は、
「ランキング調整部が、第1検索エンジンによる第1検索結果と、第2検索エンジンによる第2検索結果との類似度を算出する処理と、算出された類似度によって、第1検索結果におけるランク付けを変更することによって、第3検索結果を生成する処理とを行う構成」
の一例に相当する。
(図2のステップSA−5)
ついで、検索仲介サーバ1における検索結果出力部14は、Web検索エンジン41によるランク付けがされた第1検索結果と、ランキング調整部13によってランク付けが変更された第3検索結果とを並列に表示するための、表示用文書を生成する。表示用文書の生成例が図7に示されている。図7では、図(a)の部分が、第1検索結果に相当し、図(b)の部分が、第3検索結果に相当している。なお、表示用文書には、各項目を取得した元のWebサイトにアクセスするためのリンクやURL(図示せず)を表示することが好ましい。
このように第1検索結果と第3検索結果とを並列して表示することで、ユーザは、検索結果を容易に理解することができる。また、第3検索結果が第1検索結果と対に表示されることで、検索結果がURLやタイトル等で一覧表示された場合に、クエリに関連した画像や音声、動画が含まれてランキングが変動したWebサイトの確認が容易になる。
さらに、検索結果出力部14は、生成した表示用文書をユーザ端末3に向けて出力する。ユーザ端末3では、ブラウザなどの適宜なソフトウエアにより、検索仲介サーバ1から送られた表示用文書(つまり検索結果)を表示する。ユーザは、検索結果に付されたURLをクリックするなどの適宜な手段により、所望の情報にアクセスすることができる。
本実施形態では、クエリを各検索エンジンに展開し、同じクエリを用いて、Web検索エンジンによる第1検索結果と、他の検索エンジンによる第2検索結果との類似度に基づいて、出力用の第3検索結果の順位を決定している。しかも、第1検索結果に含まれるマルチメディアデータと、第2検索結果に含まれるマルチメディアデータとの類似度を考慮して、第3検索結果のランキングを調整している。このため、本実施形態によれば、ユーザの検索意図に沿った、精度の良い検索結果を、検索ノイズを低く抑えつつ、取得することができる。
また、本実施形態では、クエリを自動的に検索エンジンに展開し、さらに、検索結果の統合も自動的に行うことができるので、ユーザにおける操作の負担を低く抑えることができるという利点もある。
(類似度計算における変形例1)
以下においては、マルチメディア類似度の計算における別の処理手順を、図8を参照して説明する。
(図8の(a))
まず、前記した実施形態と同様に、Web検索エンジン41による第1検索結果を取得し、その上位K件の結果をリストとしてシステム側で取得する。図示の例では、上位4件までがリストとして取得されている。
(図8の(b))
ついで、前記した実施形態と同様に、各検索エンジン42〜44で得た第2検索結果と第1検索結果との類似度を計算する。図8(b)の例では、画像検索結果(第2検索結果)、動画検索結果(第2検索結果)、及び商品検索結果(第2検索結果)と第1検索結果との類似度の計算例がそれぞれ示されている。この例では、第1検索結果において、対応する内容がない場合、「なし」と記載されている。例えば、Web検索結果としての項目(1)では、動画が存在しない(図8(a)参照)ので、「動画類似度」の項目には「なし」と記載されている。
(図8の(c))
ついで、各メディア(上記の例では画像・動画・商品)における類似度をランク(順位)に変換する。ここでは、最も高い類似度をランク=1、その次の類似度をランク=2とし、以下同様にランク付けを行う。類似度が「なし」の場合は、本例では、ランクを「K+1」に設定する。なお、「K」は、ウェブ検索結果リスト(つまり第1検索結果)における項目数であり、この例では、K=4である。さらに、各項目について、平均ランクを計算する(図8(c)の右端の欄を参照)。この平均ランクが、マルチメディア類似度に相当すると考えることができる。
(図8の(d))
ついで、Web検索結果リストにおける項目を、平均ランクの順にソートする。このソートを、ここでは再ランキングと称している。ランクが低いことは、この例では、高い類似度であることを示している。
このようにして再ランキングされた結果は、マルチメディア類似度に基づくランキングを表しているといえる。この手法の場合は、各メディアとの個別の類似度が高くないWeb検索結果であっても、多くのメディア(画像・動画・商品)を含むことにより、再ランキング後の検索結果リスト(つまり第3検索結果)において、上位となる傾向がある。
変形例1の方法では、類似度の正規化を行わなくても、マルチメディア類似度を用いた再ランキングが可能になるという利点がある。
(類似度計算における変形例2)
以下において、マルチメディア類似度の計算におけるさらに別の処理手順を、図9を参照して説明する。
(図9の(a))
まず、前記した変形例1と同様に、Web検索エンジン41による第1検索結果を取得し、その上位K件の結果をリストとしてシステム側で取得する。図示の例では、上位4件までがリストとして取得されている。
(図9の(b))
ついで、前記した変形例1と同様に、各検索エンジン42〜44で得た第2検索結果との類似度を計算する。
(図9の(c))
ついで、前記した変形例1と同様に、各メディア(上記の例では画像・動画・商品)における類似度をランク(順位)に変換する。ただし、この変形例2では、類似度が「なし」の場合は、ランクも「なし」に設定する。さらに、各項目について、平均ランクを計算する(図9(c)の右端の欄を参照)。この平均ランクが、マルチメディア類似度に相当すると考えることができる。
(図9の(d))
ついで、Web検索結果リスト(第1検索結果)における項目を、平均ランクの順にソート、すなわち再ランキングする。ランクが低いことは、高い類似度であることを示している。このようにして再ランキングされた結果は、マルチメディア類似度に基づくランキングを表しているといえる。
この変形例2の手法の場合は、多くのメディアを含まなくても、あるメディアに対する類似度が高いウェブページが、再ランキング後の検索結果リスト(第3検索結果)において上位となる傾向がある。
変形例2の方法においても、類似度の正規化なしで、マルチメディア類似度を用いた再ランキングが可能になるという、変形例1と同様の利点がある。
前記した各実施形態の動作は、コンピュータに適宜のコンピュータソフトウエアを組み込むことにより実施することができる。
なお、本発明の内容は、前記実施形態に限定されるものではない。本発明は、特許請求の範囲に記載された範囲内において、具体的な構成に対して種々の変更を加えうるものである。
例えば、前記した各構成要素は、機能ブロックとして存在していればよく、独立したハードウエアとして存在しなくても良い。また、実装方法としては、ハードウエアを用いてもコンピュータソフトウエアを用いても良い。さらに、本発明における一つの機能要素が複数の機能要素の集合によって実現されても良く、本発明における複数の機能要素が一つの機能要素により実現されても良い。
また、機能要素は、物理的に離間した位置に配置されていてもよい。この場合、機能要素どうしがネットワークにより接続されていても良い。グリッドコンピューティングにより機能を実現し、あるいは機能要素を構成することも可能である。
本実施形態では、クエリとしてテキストを用いたが、検索キーとして利用できるものであれば、画像などの他のクエリを用いることが可能である。
さらに、本実施形態では、Web検索エンジン(第1検索エンジン)以外の第2検索エンジンとして、画像、動画及び商品についての検索エンジンを用いたが、これに代えて、あるいはこれに追加して、音楽、ニュース、ブログ、地図など、他のメディアについての検索エンジンを用いることも可能である。
1 検索仲介サーバ(検索装置)
11 クエリ受付部
12 検索結果取得部
13 ランキング調整部
14 検索結果出力部
3 ユーザ端末
31 端末本体
32 入力部
33 表示部
4 検索実行サーバ
41 Web検索エンジン(第1検索エンジン)
42 画像検索エンジン(第2検索エンジン)
43 動画検索エンジン(第2検索エンジン)
44 商品検索エンジン(第2検索エンジン)

Claims (7)

  1. クエリ受付部と、検索結果取得部と、ランキング調整部と、検索結果出力部とを備えており、
    前記クエリ受付部は、ユーザ端末から送られた、検索のためのクエリを受け付けて、第1検索エンジンと、第2検索エンジンとにそれぞれ送る構成となっており、
    前記第1検索エンジンは、前記クエリに基づいて、Web文書を検索することにより、ランク付けされた第1検索結果を生成する構成となっており、
    前記第2検索エンジンは、前記クエリに基づいて、マルチメディアデータを検索することにより、第2検索結果を生成する構成となっており、
    前記マルチメディアデータには、画像又は音声が含まれており、
    前記検索結果取得部は、前記第1検索エンジンにおける前記第1検索結果と、前記第2検索エンジンにおける前記第2検索結果とをそれぞれ取得する構成となっており、
    前記ランキング調整部は、前記第1検索エンジンによる前記第1検索結果と、前記第2検索エンジンによる前記第2検索結果との類似度を算出する処理と、算出された前記類似度によって、前記第1検索結果におけるランク付けを変更することによって、第3検索結果を生成する処理とを行う構成となっており、
    前記検索結果出力部は、前記第1検索エンジンによるランク付けがされた前記第1検索結果と、前記ランキング調整部によってランク付けが変更された前記第3検索結果とを並列に表示するための、表示用文書を生成する処理と、前記表示用文書を前記ユーザ端末に向けて出力する処理とを行う構成となっている
    ことを特徴とする検索装置。
  2. 前記第2検索エンジンが複数存在しており、
    前記ランキング調整部は、
    前記第1検索エンジンによる前記第1検索結果と、前記複数の第2検索エンジンによる複数の前記第2検索結果とのそれぞれの類似度を統合し、かつ、統合された類似度に基づいて前記のランク付けを行う構成となっている
    請求項1に記載の検索装置。
  3. 前記第2検索エンジンは、画像検索エンジン、動画検索エンジン及び商品検索エンジンのいずれか、又は、これらの組み合わせである
    請求項1又は2に記載の検索装置。
  4. 前記ランキング調整部は、
    前記第1検索エンジンによる検索結果に含まれるコンテンツの種類に応じて、前記第2検索エンジンによる前記第2検索結果を参照する処理と、
    前記第2検索エンジンによる前記第2検索結果との類似度が高い場合に、前記前記第1検索エンジンによる前記第1検索結果のランクを高くする処理と
    を行う構成となっている
    請求項1〜3のいずれか1項に記載の検索装置。
  5. 前記第1検索エンジンによる検索結果には、テキスト、画像及び音声のいずれか又はこれらの組み合わせが含まれている
    請求項1〜4のいずれか1項に記載の検索装置。
  6. 第1検索エンジンと、第2検索エンジンとが、検索のための共通のクエリを受け取るステップと;
    前記第1検索エンジンが、前記クエリに基づいて、Web文書を検索することにより、ランク付けされた第1検索結果を生成するステップと;
    前記第2検索エンジンが、前記クエリに基づいて、マルチメディアデータを検索することにより、第2検索結果を生成するステップと、
    ここで、前記マルチメディアデータには、画像又は音声が含まれており;
    前記第1検索エンジンによる前記第1検索結果と、前記第2検索エンジンによる前記第2検索結果との類似度を算出するステップと;
    算出された前記類似度によって、前記第1検索結果におけるランク付けを変更することによって、第3検索結果を生成するステップと;
    前記第1検索エンジンによるランク付けがされた前記第1検索結果と、前記ランキング調整部によってランク付けが変更された前記第3検索結果とを並列に表示するための、表示用文書を生成するステップと;
    前記表示用文書をユーザ端末に向けて出力するステップと
    を備えたことを特徴とする検索方法。
  7. 請求項6に記載のステップをコンピュータに実行させることを特徴とするコンピュータプログラム。
JP2009028129A 2009-02-10 2009-02-10 検索装置 Active JP5010624B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009028129A JP5010624B2 (ja) 2009-02-10 2009-02-10 検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009028129A JP5010624B2 (ja) 2009-02-10 2009-02-10 検索装置

Publications (2)

Publication Number Publication Date
JP2010186214A JP2010186214A (ja) 2010-08-26
JP5010624B2 true JP5010624B2 (ja) 2012-08-29

Family

ID=42766857

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009028129A Active JP5010624B2 (ja) 2009-02-10 2009-02-10 検索装置

Country Status (1)

Country Link
JP (1) JP5010624B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101950529B1 (ko) * 2011-02-24 2019-02-20 렉시스넥시스, 어 디비젼 오브 리드 엘서비어 인크. 전자 문서를 검색하는 방법 및 전자 문서 검색을 그래픽적으로 나타내는 방법
US8346815B2 (en) * 2011-05-12 2013-01-01 Google Inc. Dynamic image display area and image display within web search results
JP5537616B2 (ja) * 2012-07-20 2014-07-02 株式会社東芝 電子機器、情報提示方法および情報提示プログラム
US9201929B1 (en) 2013-08-09 2015-12-01 Google, Inc. Ranking a search result document based on data usage to load the search result document
US10489448B2 (en) * 2016-06-02 2019-11-26 Baidu Usa Llc Method and system for dynamically ranking images to be matched with content in response to a search query
US10459970B2 (en) * 2016-06-07 2019-10-29 Baidu Usa Llc Method and system for evaluating and ranking images with content based on similarity scores in response to a search query

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000148793A (ja) * 1998-09-11 2000-05-30 Nippon Telegr & Teleph Corp <Ntt> 複合メディア文書の類似検索方法及び装置及び複合メディア文書の類似検索プログラムを格納した記憶媒体
JP2004220267A (ja) * 2003-01-14 2004-08-05 Nippon Telegr & Teleph Corp <Ntt> 画像検索方法および装置と画像検索プログラムおよび該プログラムを記録した記録媒体
JP4836068B2 (ja) * 2005-07-29 2011-12-14 株式会社リコー コンテンツ処理装置、コンテンツ処理プログラムおよびコンテンツ処理方法
JP2007249700A (ja) * 2006-03-16 2007-09-27 Ricoh Co Ltd 文書管理装置、文書検索方法、文書検索プログラム及び記録媒体
JP2008217600A (ja) * 2007-03-06 2008-09-18 Fujitsu Ltd 情報検索装置、情報検索方法、情報検索プログラム、及び記録媒体

Also Published As

Publication number Publication date
JP2010186214A (ja) 2010-08-26

Similar Documents

Publication Publication Date Title
US10275499B2 (en) Tag selection, clustering, and recommendation for content hosting services
US8745039B2 (en) Method and system for user guided search navigation
US8150846B2 (en) Content searching and configuration of search results
US8352396B2 (en) Systems and methods for improving web site user experience
CA2935272C (en) Coherent question answering in search results
US8041709B2 (en) Domain collapsing of search results
JP5256293B2 (ja) 検索結果ページ上に対話要素を含めるためのシステム及び方法
US8429173B1 (en) Method, system, and computer readable medium for identifying result images based on an image query
US20110060717A1 (en) Systems and methods for improving web site user experience
US20080133505A1 (en) Search results presented as visually illustrative concepts
US20090125504A1 (en) Systems and methods for visualizing web page query results
WO2008106667A1 (en) Searching heterogeneous interrelated entities
WO2006039002A1 (en) User interfaces for a document search engine
KR20070038146A (ko) 검색 결과에서 배치 내용 정렬의 개인화
AU2007215296B2 (en) Organizing digitized content on the internet through digitized content reviews
TW201447616A (zh) 依據使用者歷史之自動建議
AU2009257386A1 (en) Searching using patterns of usage
JP5010624B2 (ja) 検索装置
WO2008051882A2 (en) Personal music recommendation mapping
JP2010218181A (ja) 画像検索装置
JP2007334590A (ja) 情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP4544047B2 (ja) Web画像検索結果分類提示方法及び装置及びプログラム及びプログラムを格納した記憶媒体
JP5061137B2 (ja) 画像検索装置
JP5127553B2 (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
US20110264518A1 (en) Learning a ranker to rank entities with automatically derived domain-specific preferences

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120518

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120529

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120601

R150 Certificate of patent or registration of utility model

Ref document number: 5010624

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150608

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350