JP5833499B2 - 高次元の特徴ベクトル集合で表現されるコンテンツを高精度で検索する検索装置及びプログラム - Google Patents

高次元の特徴ベクトル集合で表現されるコンテンツを高精度で検索する検索装置及びプログラム Download PDF

Info

Publication number
JP5833499B2
JP5833499B2 JP2012121454A JP2012121454A JP5833499B2 JP 5833499 B2 JP5833499 B2 JP 5833499B2 JP 2012121454 A JP2012121454 A JP 2012121454A JP 2012121454 A JP2012121454 A JP 2012121454A JP 5833499 B2 JP5833499 B2 JP 5833499B2
Authority
JP
Japan
Prior art keywords
feature vectors
content
reference content
feature
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012121454A
Other languages
English (en)
Other versions
JP2013246739A (ja
Inventor
祐介 内田
祐介 内田
茂之 酒澤
茂之 酒澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2012121454A priority Critical patent/JP5833499B2/ja
Publication of JP2013246739A publication Critical patent/JP2013246739A/ja
Application granted granted Critical
Publication of JP5833499B2 publication Critical patent/JP5833499B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明は、特徴ベクトルの集合で表されるリファレンスコンテンツの集合から、同じく特徴ベクトルの集合で表されるクエリコンテンツ(検索キー)に類似したリファレンスコンテンツを高精度に検索する技術に関する。特に、高次元の特徴ベクトルの集合で表されるマルチメディアコンテンツ(例えば画像)の検索に適する。
近年、オンライン/オフラインに限られず、ストレージの大容量化に伴って、大量のコンテンツを蓄積することが可能となっている。また、携帯電話機やスマートフォンに代表される情報端末機器の普及によって、ユーザ自ら取得した写真データのようなデジタルコンテンツも、データベースに大量かつ容易に蓄積することができる。オフラインデータベースとして、HDD(Hard Disk Drive)、DVD(Digital Versatile Disk)、Blu-ray disc等の記憶装置がある。また、オンラインデータベースとしては、Flickr(登録商標)やMySpace(登録商標)のようなソーシャルネットワークサービスがある。これら記憶装置及びサービスによれば、データベースに蓄積された個人の大量且つ多様なマルチメディアコンテンツを検索するする技術が重要となる。
マルチメディアコンテンツを検索するために、これらコンテンツから多数の特徴ベクトルを抽出し、この特徴ベクトルの集合同士の間の類似度が高いコンテンツを検索結果として出力する技術がある。この技術によれば、マルチメディアコンテンツの特徴ベクトルを量子化し、量子化された特徴ベクトルの頻度からヒストグラムを作成する。そのヒストグラム同士の間のL1ノルム又はL2ノルムの距離によって類似度(距離)を算出する。ノルムとは、2つの点の間の距離を表す。L1ノルムとは、2つの点の各次元の値の絶対値の和を意味し、L2ノルムとは、2つの点の各次元の値を二乗した和を意味する。
また、画像コンテンツから大量の局所特徴ベクトルを抽出し、それらをベクトル量子化し、同一の代表ベクトルにベクトル量子化された局所特徴ベクトルの数で類似度を算出する技術もある(例えば非特許文献1参照)。
更に、画像から複数の局所不変特徴量を抽出し、特徴ベクトルの頻度のヒストグラム化し、そのヒストグラムの重なり率によって画像とカテゴリとの間の類似度を算出する技術もある(例えば特許文献1参照)。この技術によれば、ヒストグラムに基づいて被写体のパターン認識に不要となる特徴(例えば背景の特徴)を除くことができる。これによって、画像中から物体と物体以外とを予め分離することなく、当該物体の特徴を抽出することができる。
従来、局所特徴量を用いた類似画像検索の枠組みは、「Bag-of-Visual Words」(又はBag-of-Features、Bag-of-Keypoints)と称される(例えば非特許文献1参照)。この技術によれば、Bag-of-Wordsモデル及び転置インデックスを用いた文章の検索方法を、類似画像の検索に適用したものである。Bag-of-Wordsは、文章を1つの単語の頻度により定義される特徴ベクトルで表現し、文章集合に基づいて予め導出されたIDF(Inverse Document Frequency)を単語の重みとして文章間の類似度を導出する枠組みである。これに対し、Bag-of-Visual Wordsは、画像の局所特徴量を量子化し、量子化後の局所特徴量を単語と見立て、同様に頻度により定義される1つの特徴ベクトルとして表現し、IDFを用いた重み付けを利用して同一の類推方法を適用することができる。
特開2010−282581号公報 特開2009−020769号公報
J. Sivic et al., "Video Google: A Text Retrieval Approach toObject Matching in Videos," in Proc. ICCV, 2003. H. Jegou, M. Douze, and C. Schmid, "Improving bag-offeaturesfor large scale image search," in IJCV, vol.87, no.3, pp.316-336, 2010. Y. Uchida, M. Agrawal, and S. Sakazawa, "Accurate Content-BasedVideo Copy Detection with Efficient Feature Indexing," in Proc. of ICMR,2011. D. G. Lowe, "Distinctive Image Features from Scale-InvariantKeypoints," International Journal of Computer Vision, vol. 60, no. 2, pp.91-110, 2004. H. Jegou, M. Douze, and C. Schmid, "Product quantization fornearest neighbor search," in IEEE Trans. on PAMI, vol. 33, no. 1, pp117-128, 2011. O. Boiman, E. Shechtman, and M. Irani, "In defense ofnearest-neighbor based image classification," in Proc. of CVPR, 2008.
しかしながら、既存のBag-of-Visual Wordsの技術によれば、特徴ベクトルに基づいてコンテンツ間の類似度のスコアを算出する際に、文章検索におけるIDFを用いている。IDFとは、テキストマイニングの用途について、文章中に出現した特定の単語がどのくらい特徴的であるかを識別するための指標を表す。IDFの場合、例えば固有名詞のような、「各文章は、当該文章内に含まれる少数の単語によって検索される」という前提で設計されている。言い換えれば、「各文章は、当該文章内に含まれない単語によっては検索されない」という前提である。IDFは、具体的には、当該文章の中で特定の単語が出現した回数と、コーパス全体の中でその文章を含む文章数の自然対数とから、そのコーパス中におけるその単語の特徴度として算出される。
一方、画像検索の場合、局所不変特徴領域から、高次元の特徴ベクトルを抽出する必要がある。例えば、物体認識に用いる特徴ベクトルを抽出するために代表的なSIFT(Scale-Invariant Feature Transform)によれば、特徴領域を複数のブロックに分割し、各ブロックから輝度勾配の方向を重み付きヒストグラムとして抽出する。
ここで、リファレンスコンテンツ(検索対象のコンテンツ)に対して、クエリコンテンツ(検索キーのコンテンツ)は、対象物とは無関係な特徴ベクトルが多く含まれる場合がある。具体的には、対象物をカメラで撮影した画像を、クエリコンテンツとした場合である。リファレンスコンテンツには、例えば背景が白で、検索対象物のみが写っているのに対し、クエリコンテンツには、当該対象物だけでなく、その背景に様々な物が写り込む。即ち、クエリコンテンツの背景には、当該対象物とは無関係の様々特徴ベクトルが検出される。これが、検索精度を低下させる原因となっている。
そこで、本発明によれば、高次元の特徴ベクトル集合を検索する際に、クエリコンテンツの特徴ベクトルに、無関係な特徴ベクトルが含まれていることを考慮して、リファレンスコンテンツに対するスコア付けをすることができる検索装置及びプログラムを提供することを目的とする。
本発明によれば、特徴ベクトルの集合で表されるリファレンスコンテンツの集合から、特徴ベクトルの集合で表されるクエリコンテンツに類似したリファレンスコンテンツを検索する検索装置であって、
複数のリファレンスコンテンツRjから抽出された各特徴ベクトルに対応付けて、リファレンスコンテンツ識別子を記憶したリファレンス情報蓄積手段と、
リファレンス情報蓄積手段を用いて、クエリコンテンツの各特徴ベクトルqiについて、類似した特徴ベクトルを持つリファレンスコンテンツの特徴ベクトルの集合Dを、少なくとも1つ以上探索する類似ベクトル探索手段と、
混合パラメータλを用いて、クエリコンテンツの各特徴ベクトルqiが、探索された各リファレンスコンテンツから生成される確率λ・p(qi|Rj)と、当該リファレンスコンテンツと無関係な背景モデルから生成される確率(1-λ)・p(qi)との確率比に基づいて、リファレンスコンテンツRj毎にスコアを加算することを、当該クエリコンテンツの全ての特徴ベクトルqiについて実行し、最終的に、所定閾値以上の上位のスコアを得たリファレンスコンテンツRjを、検索結果として出力する投票手段と
を有することを特徴とする。
本発明の検索装置における他の実施形態によれば、投票手段は、確率比を、探索されたリファレンスコンテンツの特徴ベクトルの集合Dに含まれる、全リファレンスコンテンツの特徴ベクトルの出現数(Ds)に対する、当該リファレンスコンテンツRjの特徴ベクトルの出現数(nj)との比(nj/Ds)に基づいて算出することも好ましい。
本発明の検索装置における他の実施形態によれば、投票手段は、確率比を、更に以下の式における比に基づいて算出する
(集合Dに含まれる当該リファレンスコンテンツRjの特徴ベクトルの数(nj
全リファレンスコンテンツの特徴ベクトルの数(|Rall|))/
(集合Dに含まれる全リファレンスコンテンツの特徴ベクトルの数(Ds
当該リファレンスコンテンツRjの特徴ベクトルの数(Rj))
ことも好ましい。
本発明の検索装置における他の実施形態によれば、
類似ベクトル探索手段は、探索されたリファレンスコンテンツの特徴ベクトルの集合を、クエリコンテンツの特徴ベクトルqiに対する平均的な類似度に応じて1つ以上の部分集合(クラスタ)Dに区分し、上位からの近傍数m(≧1)番目までの部分集合Dを順序付けし、
投票手段は、部分集合Dt(1≦t≦m)毎に各リファレンスコンテンツについてスコアを算出し、当該スコアが最大となる部分集合Dt’におけるスコアを投票に用いる
ことも好ましい。
本発明の検索装置における他の実施形態によれば、
投票手段は、上位からt番目までの特徴ベクトルの集合Dtについて、クエリコンテンツの特徴ベクトルqiに対するリファレンスコンテンツjのスコアsjは、以下の式によって算出される
j=maxj log{λ/(1-λ)・(ntj・|Rall|)/(Σs=1 t|Ds(qi)|・|Rj|)+1)}
tj: t番目までの部分集合Dtに含まれる
リファレンスコンテンツjの特徴ベクトルの数
Σs=1 t|Ds(qi)|: t番目までの部分集合Dtに含まれる
全リファレンスコンテンツjの特徴ベクトルの数
|Rall|: 全リファレンスコンテンツにおける全特徴ベクトルの数
|Rj|: 当該リファレンスコンテンツjにおける全特徴ベクトルの数
λ、1-λ: 混合パラメータ
ことも好ましい。
本発明の検索装置における他の実施形態によれば、
リファレンス情報蓄積手段は、各部分集合(クラスタ)D毎に、特徴ベクトルの平均的な代表ベクトルを更に対応付けて記憶しており、
類似ベクトル探索手段は、クエリコンテンツの各特徴ベクトルqiと、各部分集合Dの代表ベクトルとを比較して、部分集合Dを探索することも好ましい。
本発明の検索装置における他の実施形態によれば、類似ベクトル探索手段は、
クエリコンテンツの各特徴ベクトルqiに類似する、リファレンスコンテンツの特徴ベクトルのうちk個の部分集合を探索する第1の手段と、
近傍数kの部分集合に含まれる、リファレンスコンテンツの特徴ベクトルの数Lを計数する第2の手段
近傍数k個の部分集合に含まれるL個のリファレンスコンテンツの特徴ベクトルのうち、更にqiに類似した上位m(m≦L)個の特徴ベクトルを探索する第3の手段
を有し、
第3の手段における特徴ベクトル数mは、第2の手段によって計数された特徴ベクトルの数Lに応じて更新され、
t(qi)(1≦t≦m)は、t番目の特徴ベクトルのみで構成されることも好ましい。
本発明の検索装置における他の実施形態によれば、第3の手段における特徴ベクトル数mは、第2の手段によって得られる特徴ベクトルの数Lを用いて、αL(α≦1)によって決定されることも好ましい。
本発明の検索装置における他の実施形態によれば、第3の手段における特徴ベクトル数mは、第2の手段によって得られる特徴ベクトルの数Lを用いて、Lα(α≦1)によって決定されることも好ましい。
本発明の検索装置における他の実施形態によれば、
リファレンスコンテンツ及びクエリコンテンツから、特徴ベクトルを抽出する特徴ベクトル集合抽出手段を更に有し、
特徴ベクトル集合抽出手段は、異なる種類のアルゴリズム毎に、複数の特徴ベクトルを出力することができ、
投票手段は、クエリコンテンツ及びリファレンスコンテンツそれぞれについて、異なる種類の特徴ベクトル毎にスコアsを算出し、各リファレンスコンテンツについて異なる種類の特徴ベクトルのスコアsを重み付け和した値を、最終的なスコアとする
ことも好ましい。
本発明の検索装置における他の実施形態によれば、
クエリコンテンツ及びリファレンスコンテンツは、画像であって、
リファレンスコンテンツとしての画像には、同一の物体又は同一カテゴリに属する少なくとも1つのインスタンス(対象物、オブジェクト)が写っている
ことも好ましい。
本発明によれば、特徴ベクトルの集合で表されるリファレンスコンテンツの集合から、特徴ベクトルの集合で表されるクエリコンテンツに類似したリファレンスコンテンツを検索する装置に搭載されたコンピュータを機能させる検索プログラムであって、
複数のリファレンスコンテンツRjから抽出された各特徴ベクトルに対応付けて、リファレンスコンテンツ識別子を記憶したリファレンス情報蓄積手段と、
リファレンス情報蓄積手段を用いて、クエリコンテンツの各特徴ベクトルqiについて、類似した特徴ベクトルを持つリファレンスコンテンツの特徴ベクトルの集合Dを、少なくとも1つ以上探索する類似ベクトル探索手段と、
混合パラメータλを用いて、クエリコンテンツの各特徴ベクトルqiが、探索された各リファレンスコンテンツから生成される確率λ・p(qi|Rj)と、当該リファレンスコンテンツと無関係な背景モデルから生成される確率(1-λ)・p(qi)との確率比に基づいて、リファレンスコンテンツRj毎にスコアを加算することを、当該クエリコンテンツの全ての特徴ベクトルqiについて実行し、最終的に、所定閾値以上の上位のスコアを得たリファレンスコンテンツRjを、検索結果として出力する投票手段と
してコンピュータを機能させることを特徴とする。
本発明の検索装置及びプログラムによれば、高次元の特徴ベクトル集合を検索する際に、クエリコンテンツの特徴ベクトルに、無関係な特徴ベクトルが含まれていることを考慮して、リファレンスコンテンツに対するスコア付けをすることができる。
本発明における検索装置の機能構成図である。 リファレンス情報生成部の処理内容を表す説明図である。 リファレンスコンテンツの特徴ベクトルの1つの集合Dから投票する説明図である。 リファレンスコンテンツの特徴ベクトルの複数の集合Dから投票する説明図である。 階層的なコードブックを表す説明図である。 複数のリファレンスコンテンツの複数の特徴ベクトルから投票する説明図である。
以下では、本発明の実施の形態について、図面を用いて詳細に説明する。
本発明の検索装置及びプログラムによれば、多数のリファレンスコンテンツ(検索対象のコンテンツ)の中から、クエリコンテンツ(検索キーのコンテンツ)に最も類似するリファレンスコンテンツを検索する。
図1は、本発明における検索装置の機能構成図である。
図1によれば、検索装置1は、リファレンス情報蓄積部10と、特徴ベクトル集合抽出部11と、リファレンス情報生成部12と、類似ベクトル探索部13と、投票部14とを有する。これら機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。
検索装置1は、多数のリファレンスコンテンツを予め入力し、リファレンス情報蓄積部10に、リファレンスコンテンツに関する情報を記憶する。また、検索装置1は、検索の際に、検索キーとなるクエリコンテンツを入力し、リファレンス情報蓄積部10を用いて、クエリコンテンツに最も類似するリファレンスコンテンツを検索する。
クエリコンテンツ及びリファレンスコンテンツは、例えば画像である。この場合、リファレンスコンテンツとしての画像には、同一の物体又は同一カテゴリに属する少なくとも1つのインスタンス(対象物、オブジェクト)が写っている。
[特徴ベクトル集合抽出部11]
特徴ベクトル集合抽出部11は、1つのマルチメディアコンテンツから、特徴ベクトルの集合を抽出する。例えばマルチメディアコンテンツが画像である場合、その特徴ベクトルは、画像の局所特徴領域から抽出された局所特徴ベクトルである。
特徴ベクトル集合抽出部11は、具体的には、リファレンスコンテンツRj毎に特徴ベクトルの集合を抽出し、それら特徴ベクトルの集合は、リファレンス情報蓄積部10へ出力される。また、特徴ベクトル集合抽出部11は、クエリコンテンツから特徴ベクトルの集合Q(={qi})を抽出し、それら特徴ベクトルの集合は、類似ベクトル探索部13へ出力される。尚、リファレンスコンテンツの特徴ベクトルと、クエリコンテンツの特徴ベクトルとは、同じ次元数である。
物体認識に用いる特徴ベクトルの抽出アルゴリズムとしては、例えばSIFTやSURF(Speeded Up Robust Features)が用いられる。例えば、SIFTの場合、1枚の画像からは128次元の特徴ベクトルの集合が抽出される(例えば非特許文献4参照)。SIFTとは、スケールスペースを用いて特徴的な局所領域を解析し、そのスケール変化及び回転に不変となる特徴ベクトルを記述する技術である。一方で、SURFの場合、SIFTよりも高速処理が可能であって、1枚の画像から64次元の特徴ベクトルの集合が抽出される。
[リファレンス情報生成部12]
リファレンス情報生成部12は、リファレンスコンテンツの特徴ベクトルの集合Rjに対して、以下の処理を実行し、リファレンス情報蓄積部10へコードブックを出力する。
図2は、リファレンス情報生成部の処理内容を表す説明図である。
(S21)リファレンスコンテンツの特徴ベクトルの集合を、k個のクラスタにクラスタリングする。クラスタリングには、例えばk-meansが用いられる。
(S22)次に、クラスタ毎に、代表ベクトルを導出する(平均ベクトル又は中央値ベクトル)。この代表ベクトルは、"Visual Words"とも称される。
(S23)各代表ベクトルに、一意のIDn(=1〜N)を割り当てたコードブックを生成する。
例えば、入力された特徴ベクトルfとの距離が最も小さくなる代表ベクトルfを算出する。
代表ベクトルf=argmin||f−f||
ここで、コードブックとは、代表ベクトルf毎に、そのクラスタに属する1つ以上のリファレンスコンテンツID(識別子)を対応付けたものである。
[リファレンス情報蓄積部10]
リファレンス情報蓄積部10は、複数のリファレンスコンテンツRjから抽出された各特徴ベクトルに対応付けて、リファレンスコンテンツ識別子を記憶する。ここで、リファレンス情報蓄積部10は、リファレンス情報生成部12から出力されたコードブック(転置インデックス)を記憶するものであってもよい。コードブックは、複数のリファレンスコンテンツRjから抽出された特徴ベクトルを、類似度に応じて複数の集合(クラスタ)Dに区分したものであり、集合毎に、リファレンスコンテンツ識別子と、これら特徴ベクトルの平均的な代表ベクトルとを割り当てたものである。
尚、以下の実施形態によれば、複数のリファレンスコンテンツjから特徴ベクトルの集合Rjを抽出した場合について詳述している。一方で、例えば非特許文献6のように、特徴ベクトルの集合Rjを、特定のカテゴリに基づく特徴ベクトルの集合とすることによって、クエリコンテンツを、カテゴリに分類することもできる。この場合、後述するように、クエリコンテンツに対して、各カテゴリに対するスコアを算出し、最もスコアの高い上位複数件のカテゴリに分類するか、スコアが一定以上のカテゴリのタグを付加することができる。
[類似ベクトル探索部13]
類似ベクトル探索部13は、リファレンス情報蓄積部10を用いて、クエリコンテンツの各特徴ベクトルqiについて、類似した特徴ベクトルを持つリファレンスコンテンツの特徴ベクトルの集合Dを、少なくとも1つ以上探索する。クエリコンテンツの特徴ベクトルqiと、リファレンスコンテンツの特徴ベクトルとの間の距離が短いほど、類似度が高いことを意味する。具体的には、最近傍探索(Approximate Nearest Neighbor)アルゴリズムの1つである直積量子化を用いた方法(例えば非特許文献5参照)やHamming Embeddingを用いた方法(例えば非特許文献2参照)、LSH(Locality-Sensitive Hashing)を用いることも好ましい。探索された1つ以上の特徴ベクトルの集合Dに基づくリファレンスコンテンツIDは、投票部14へ出力される。
[投票部14]
投票部14は、リファレンスコンテンツRj毎にスコアを加算することを、当該クエリコンテンツの全ての特徴ベクトルqiについて実行し、最終的に、所定閾値以上の上位のスコアを得たリファレンスコンテンツRjを、検索結果として出力する。投票部14は、従来技術によればIDFによって投票していたのに対し、本発明によれば、以下に詳述する算出式によって投票される。
本発明によれば、クエリコンテンツを生成したであろう可能性の最も高いリファレンスコンテンツj’を導出する。以下の式は、事後確率を意味し、クエリコンテンツが、j番目のリファレンスコンテンツから生成されたであろう確率pを表す。
j’=argmaxjp(Rj|Q)
Q:クエリコンテンツの特徴ベクトルの集合
j:j番目のリファレンスコンテンツの特徴ベクトルの集合
p(Rj|Q):クエリコンテンツの特徴ベクトルの集合Qから、
リファレンスコンテンツの特徴ベクトルの集合Rjが生成される事後確率
argmaxj:右項の事後確率を最大とするjを導出することを意味する
前述の事後確率の式は、一般的に、ベイズの定理を用いて以下の式が成立する。これは、事前確率に尤度確率を乗算することによって、事後確率を算出するものである。
j’=argmaxj p(Rj|Q)=argmaxj p(Q|Rj)p(Rj)
p(Q|Rj):リファレンスコンテンツの特徴ベクトルの集合Rjから、
クエリコンテンツの特徴ベクトルの集合Qが生成される尤度確率
p(Rj) :リファレンスコンテンツの特徴ベクトルの集合Rjが検索される
事前確率
(p(Rj)が高いほど、検索される確率が高いことを意味する)
尚、ここで、検索されるリファレンスコンテンツには偏りがなく、p(Rj)は、いずれのjであっても一定であると仮定する。そうすると、p(Rj)を削除することができ、単に以下のように表される。
j’=argmaxj p(Q|Rj)
ここで、クエリコンテンツの特徴ベクトルの集合Qは、独立に生成されたものであると仮定する。「独立に生成」とは、ある特徴が出た場合、次に必ず特定の特徴が出るような影響が無い、即ち、以前の結果に影響しないことを意味する。この場合、クエリコンテンツの特徴ベクトルの集合Qの各特徴ベクトルq1,q2,q3,・・・,qnの個々に基づく確率の積となる。この場合、以下の式によって表される。
j’=argmaxj Πi=1 n p(qi|Rj)
更に、確率の積Πは、一般に、logの和Σによって表すことができる。単調増加関数であるために、確率の大小関係は維持されるためである。この場合、以下の式によって表される。
j’=argmaxj Πi=1 n p(qi|Rj)=argmaxj Σi=1 n logp(qi|Rj)
ここで、各クエリ特徴ベクトルが、リファレンスコンテンツの特徴ベクトル集合から生成された確率と、リファレンスコンテンツとは無関係な背景モデルから生成された確率の線形結合としてモデル化を行う。
j’=argmaxj Σi=1 n logp(qi|Rj)
=argmaxj Σi=1 n log(λp(qi|Rj)+(1-λ)・p(qi))
=argmaxj Σi=1 n (log(λp(qi|Rj)+(1-λ)・p(qi))−log(1-λ)・p(qi))
=argmaxj Σi=1 n log{λ/(1-λ)・p(qi|Rj)/p(qi)+1}
i:クエリコンテンツの特徴ベクトルのID
λ:線形結合の混合パラメータ
p(qi):リファレンスコンテンツとは無関係な背景モデルから生成された確率
(クエリコンテンツにおける対象物と無関係な背景画像に基づく)
λp(qi|Rj)+(1-λ)・p(qi):
λにおけるp(qi|Rj)の確率と、(1-λ)におけるp(qi)の確率との和は、
全体の確率を意味する
−log(1-λ)・p(qi):
変形のため全体的なペナルティを引いても、順番は変わらない。
後述する式の変形のためのもの。
λ/(1-λ)・p(qi|Rj)/p(qi)+1:
"loga−logb=loga/b"に基づいて、式を変形したもの
本発明によれば、混合パラメータλを用いて、クエリコンテンツの各特徴ベクトルqiが、探索された各リファレンスコンテンツから生成される確率λ・p(qi|Rj)と、当該リファレンスコンテンツと無関係な背景モデルから生成される確率(1-λ)・p(qi)との確率比を用いる。
ここで、以下の式のように置く。
ij=log{λ/(1-λ)・p(qi|Rj)/p(qi)+1}
i:クエリコンテンツの特徴ベクトルのID
j:リファンレンスコンテンツのID
i:クエリコンテンツの特徴ベクトル
j:リファンレンスコンテンツ
ijとは、クエリコンテンツ特徴ベクトルqiが観測された際に、qiそれぞれが、リファンレンスコンテンツjが得られるスコアを意味する。即ち、qiが観測された時点で、それぞれが、リファレンスコンテンツjから生成された尤もらしさを意味する。
そして、クエリコンテンツの特徴ベクトルi及びリファンレンスコンテンツjの全てについて、「sij」を算出する。そして、スコアΣi=1 n ijが最大となるリファレンスコンテンツRjを検索結果として選択する。
しかしながら、sijは、各iについて全てのjについて算出しなければならないために、大規模データベースを対象とした場合、その計算量が膨大なものとなる。
そこで、本発明によれば、近似法を適用し、クエリコンテンツの特徴ベクトルqiについて、リファレンスコンテンツの特徴ベクトル集合の中から、qiに類似した特徴ベクトル集合D(qi)を抽出する。そして、以下のようにsijの算出を近似する。
D(qi)に対応する特徴ベクトルが含まれるリファレンスコンテンツRjのみについて「sij」を算出する
それ以外のRjについては、p(qi|Rj)=0とする
このとき、sij=log(1)=0となるために、D(qi)に対応する特徴ベクトルが含まれないリファレンスコンテンツのスコアは増減しない。
ここで、D(qi)は更に、m(1〜M)個の互いに素な集合から構成されるとする。
D(qi)=D1(qi)∪D2(qi)∪・・・∪Dm(qi)
リファレンス情報蓄積部10は、コードブックに、多数のリファレンスコンテンツにおける複数の代表ベクトルが登録されている。そして、各代表ベクトルには、リファンレンスコンテンツのIDが紐付けられている。ここで、各代表ベクトルに紐付くリファンレンスコンテンツの特徴ベクトルの集合は、それらm個の中で、特徴ベクトルが互いにオーバラップしない。即ち、「互いに素」であると言える。
また、Dt(qi)及びDs(qi)について、t<sであれば、以下の不等式が成立する。
p(qi|Dt(qi)) > p(qi|Ds(qi))
即ち、t<sのとき、qiは、Ds(qi)よりもDt(qi)から生成された確率が高い。このD1(qi)・・・Dm(qi)それぞれについて、sijを以下のように算出する。
各Dt(qi)について、p(qi|Rj)及びp(qi)は、k近傍密度推定法によって算出される。
p(qi|Rj)=ntj/(|Rj|・Vt)
p(qi)=Σs=1 t|Ds(qi)|/(|Rall|・Vt)
tj:D1(qi)・・・Dt(qi)に出現するRjの特徴ベクトルの数
Rall:リファレンスコンテンツ全ての特徴ベクトル集合
t:qiとr’tの距離を半径とする超球(3次元以上)の体積
(尚、2次元であれば面積、1次元であれば長さを表す)
r’t:Dt(qi)の中で最もqiから遠い特徴ベクトル
ここで、p(qi)は、|Rall|個(k近傍密度推定法におけるN)のうち、Σs=1 t|Ds(qi)|個(k近傍密度推定法におけるk)が落ちる確率を、体積Vtで割ったものであることを表す。
ここで、Vtを算出する場合、多大な計算量が必要となる。そこで、本発明によれば、sijの式に代入することによって、Vtの項を削除し、以下の式によって算出する。
ij=log{λ/(1-λ)・ntj|Rall|/Σs=1 t(|Ds(qi)|・|Rj|)+1}
このスコアは、各画像について、最も大きなスコアのみが加算されることとする。
即ち、本発明の投票部14は、上位からt番目までの特徴ベクトルの集合Dtについて、クエリコンテンツの特徴ベクトルqiに対するリファレンスコンテンツjのスコアsjは、以下の式によって算出される。
j=maxj log{λ/(1-λ)・(ntj・|Rall|)/(Σs=1 ts(qi)・|Rj|)+1)}
tj: t番目までの部分集合Dtに含まれる
リファレンスコンテンツjの特徴ベクトルの数
Σs=1 ts(qi): t番目までの部分集合Dtに含まれる
全リファレンスコンテンツjの特徴ベクトルの数
|Rall|: 全リファレンスコンテンツにおける全特徴ベクトルの数
|Rj|: 当該リファレンスコンテンツjにおける全特徴ベクトルの数
λ、1-λ: 混合パラメータ
上述の式によれば、確率比「ntj/Σs=1 t(|Ds(qi)|」は、探索されたリファレンスコンテンツの特徴ベクトルの集合Dに含まれる、全てのリファレンスコンテンツRjの出現数に対する、各リファレンスコンテンツRjの出現数との比によって表される出現頻度とする。
[類似ベクトル探索部13及び投票部14における具体的な処理内容]
以下では、本発明における類似ベクトル探索部13及び投票部14における具体的な処理内容について詳述する。
検索の際、クエリコンテンツから特徴ベクトルの集合Qが抽出され、各特徴ベクトルqi毎に、ベクトル量子化によって、代表ベクトルに紐付いているリファレンスコンテンツの特徴ベクトルの1つ以上の集合Dが検索される。そして、対応するリファレンスコンテンツIDに投票する。クエリコンテンツの全ての特徴ベクトルqiについて投票した後、スコアの上位のリファレンスコンテンツIDを検索結果とする。
図3は、リファレンスコンテンツの特徴ベクトルの1つの集合Dから投票する説明図である。
類似ベクトル探索部13は、クエリコンテンツの各特徴ベクトルqiに対して類似する順に上位m件の集合Dを探索することも好ましい。図3によれば、上位1つの集合D(qi)が探索されている(m=1,D(qi)=D1(qi))。その1つの集合には、8つのリファレンスコンテンツIDが登録されている。但し、ここで、8件のIDに順序が付けられていないことに注意する。8つのリファレンスコンテンツIDの中で、ユニークなIDは4つ(1,4,5,6)ある。
リファレンスコンテンツID=1: n11=3個
score1=score1+log{λ/(1-λ)・(3|Rall|/8|R1|)+1}
(8個の中で3個が、ID=1であることを意味)
リファレンスコンテンツID=4: n14=2個
score4=score4+log{λ/(1-λ)・(2|Rall|/8|R1|)+1}
(8個の中で2個が、ID=4であることを意味)
リファレンスコンテンツID=5: n15=1個
score5=score5+log{λ/(1-λ)・(1|Rall|/8|R1|)+1}
(8個の中で1個が、ID=5であることを意味)
リファレンスコンテンツID=6: n16=2個
score5=score5+log{λ/(1-λ)・(2|Rall|/8|R1|)+1}
(8個の中で2個が、ID=6であることを意味)
本発明によれば、投票部14は、部分集合Dt(1≦t≦m)毎に各リファレンスコンテンツについてスコアを算出し、当該スコアが最大となる部分集合Dt’におけるスコアを投票に用いる。
図4は、リファレンスコンテンツの特徴ベクトルの複数の集合Dから投票する説明図である。
図3は、最近傍の代表ベクトルに紐付いている集合Dから投票するのに対し、図4は、k近傍の代表ベクトルに紐付いている集合Dから投票する。類似ベクトル探索部13は、探索されたリファレンスコンテンツの特徴ベクトルの集合を、クエリコンテンツの特徴ベクトルqiに対する平均的に類似度に応じて1つ以上の部分集合Dに区分し、上位からの近傍数m(m≧1)番目までの部分集合Dを順序付けするものであってもよい。
図4によれば、類似ベクトル探索部は、クエリコンテンツの1つの特徴ベクトルqiについて、k近傍探索(m=3)によって、リファレンスコンテンツの特徴ベクトルの3つの集合D(qi)を探索する(m=3,D(qi)=D1(qi)、D2(qi)、D3(qi))。図4によれば、D1(qi)の集合には、3つのリファレンスコンテンツIDが登録されており、D2(qi)の集合には、3つのリファレンスコンテンツIDが登録されており、D3(qi)の集合には、2つのリファレンスコンテンツIDが登録されている。図4によれば、D1->D2->D3の順に順序付けられている。
(第1の集合t=1、|D1(qi)|=3個、Σs=1 t|D1(qi)|=3個)
リファレンスコンテンツID=1: n11=2個
score1=score1+log{λ/(1-λ)・(2|Rall|/3|R1|)+1}
リファレンスコンテンツID=4: n14=1個
score4=score4+log{λ/(1-λ)・(1|Rall|/3|R4|)+1}
(第2の集合t=2、|D2(qi)|=3個、Σs=1 t|D2(qi)|=6個)
リファレンスコンテンツID=5: n15=1個
score5=score5+log{λ/(1-λ)・(1|Rall|/6|R5|)+1}
リファレンスコンテンツID=4: n14=1個
×score4=score4+log{λ/(1-λ)・(2|Rall|/6|R4|)+1}
★ここで、先のD1で得られたscore4と同じであるために、採用しない。
リファレンスコンテンツID=1: n11=1個
×score1=score1+log{λ/(1-λ)・(3|Rall|/6|R1|)+1}
★ここで、先のD1で得られたscore1よりも小さい(2/3>3/6)ために、
採用しない。
(第3の集合t=3、|D3(qi)|=2個、Σs=1 t|D3(qi)|=8個)
リファレンスコンテンツID=6: n16=2個
score6=score6+log{λ/(1-λ)・(2|Rall|/8|R6|)+1}
図5は、階層的なコードブックを表す説明図である。
図5によれば、図3及び図4と比較して、コードブックが階層的に構成されている(例えば非特許文献7参照)。このような場合であっても、前述した図3及び図4と同様に、リファレンスコンテンツの特徴ベクトルの集合毎にスコアを投票することができる。
図6は、複数のリファレンスコンテンツの複数の特徴ベクトルから投票する説明図である。
図6によれば、図3及び図4のように複数のリファレンスコンテンツの複数の特徴ベクトルが集合Dとして構成されることなく、個別に分散して構成されたものである。クエリコンテンツの各特徴ベクトルから、直積量子化を用いた方法やHamming Embeddingを用いた方法(例えば非特許文献2参照)、LSH等のアルゴリズムを用いて、単にm近傍探索として、リファレンスコンテンツの近傍特徴ベクトルが探索されたものである。
(第1の特徴ベクトルt=1、|D1(qi)|=1個、Σs=1 t|D1(qi)|=1個)
リファレンスコンテンツID=1: n11=1個
score1=score1+log{λ/(1-λ)・(1|Rall|/1|R1|)+1}
(第2の特徴ベクトルt=2、|D2(qi)|=1個、Σs=1 t|D2(qi)|=2個)
リファレンスコンテンツID=4: n24=1個
score4=score4+log{λ/(1-λ)・(1|Rall|/2|R1|)+1}
(第3の特徴ベクトルt=3、|D3(qi)|=1個、Σs=1 t|D3(qi)|=3個)
リファレンスコンテンツID=1: n31=1個
×score1=score1+log{λ/(1-λ)・(2|Rall|/3|R1|)+1}
★ここで、先のD1で得られたscore1よりも小さい(1/1>2/3)ために、
採用しない。
(第4の特徴ベクトルt=4、|D4(qi)|=1個、Σs=1 t|D4(qi)|=4個)
リファレンスコンテンツID=5: n45=1個
score5=score5+log{λ/(1-λ)・(1|Rall|/4|R1|)+1}
(第5の特徴ベクトルt=5、|D5(qi)|=1個、Σs=1 t|D5(qi)|=5個)
リファレンスコンテンツID=4: n54=1個
score4=score4+log{λ/(1-λ)・(2|Rall|/5|R1|)+1}
★ここで、先のD2で得られたscore4よりも小さい(1/2>2/5)ために、
採用しない。
(第6の特徴ベクトルt=6、|D6(qi)|=1個、Σs=1 t|D6(qi)|=6個)
リファレンスコンテンツID=1: n61=1個
score1=score1+log{λ/(1-λ)・(3|Rall|/6|R1|)+1}
★ここで、先のD1で得られたscore1よりも小さい(1/1>3/6)ために、
採用しない。
(第7の特徴ベクトルt=7、|D7(qi)|=1個、Σs=1 t|D7(qi)|=7個)
リファレンスコンテンツID=6: n76=1個
score6=score6+log{λ/(1-λ)・(1|Rall|/7|R1|)+1}
(第8の特徴ベクトルt=8、|D8(qi)|=1個、Σs=1 t|D8(qi)|=8個)
リファレンスコンテンツID=6: n86=1個
score6=score6+log{λ/(1-λ)・(2|Rall|/8|R1|)+1}
★ここで、先のD7で得られたscore6よりも大きい(1/7<2/8)ために、
先のD7で得られたscore6を採用しない。
[類似ベクトル探索部13における近傍特徴ベクトル数mの決定方法]
(直積量子化を用いた方法やHamming Embeddingを用いた方法、LSH等のような、2段階のm近傍探索を利用する場合)
類似ベクトル探索部13は、近傍特徴ベクトル数mを固定値とすることなく、更新(可変)することも好ましい。この場合、類似ベクトル探索部13は、以下の2つのステップを有する(例えば非特許文献2及び5参照)。
(S1)クエリコンテンツの各特徴ベクトルqiに類似する、リファレンスコンテンツの特徴ベクトルのうちk個の部分集合を探索する。即ち、S1では、大まかな近傍集合を求めることで絞込む。例えばベクトル量子化を用いて大まかな近傍集合を導出することも好ましい(例えば非特許文献2及び5参照)。
(S2)次に、近傍数k個の部分集合に含まれる、リファレンスコンテンツの特徴ベクトルの数Lを計数する。この数Lは、クエリコンテンツの特徴ベクトル周辺の特徴ベクトルの密度を反映している。例えば、S2における距離計算について、特徴ベクトルをバイナリ符号化した符号を用いるものであってもよいし(例えば非特許文献2参照)、特徴ベクトルを直積量子化により符号化したものであってもよい(例えば非特許文献3参照)。
(S3)次に、近傍数k個の部分集合に含まれるL個のリファレンスコンテンツの特徴ベクトルのうち、更にqiに類似した上位m(m≦L)個の特徴ベクトルを探索する。即ち、qiとリファレンスコンテンツの特徴ベクトルとの(近似)距離を更に導出し、更に厳密な近傍集合を導出する。その上で、S1における近似特徴ベクトル数mは、S2によって計数された特徴ベクトルの数Lに応じて更新される。例えば、S2によって計数された特徴ベクトルの数Lが、所定閾値以上であれば、S3における近傍特徴ベクトル数mを増加させることができる。尚、t番目の集合Dt(qi)(1≦t≦m)は、t番目の特徴ベクトルのみで構成される。
また、S1における近傍特徴ベクトル数mを、S2によって得られる特徴ベクトルの数Lを用いて、αL(α≦1)によって決定するものであってもよい。また、Lα(α≦1)によって決定するものであってもよい。
尚、他の実施形態として、特徴ベクトル集合抽出部11は、異なる種類のアルゴリズム毎に、複数の特徴ベクトルを出力することも好ましい。異なる種類のアルゴリズムとしては、例えばSIFT及びSURFの両方に基づくものである。この場合、投票部14は、クエリコンテンツ及びリファレンスコンテンツそれぞれについて、異なる種類の特徴ベクトル毎にスコアsを算出し、各リファレンスコンテンツについて異なる種類の特徴ベクトルのスコアsを重み付け和した値を、最終的なスコアとする。
以上、詳細に説明したように、本発明の検索装置及びプログラムによれば、高次元の特徴ベクトル集合を検索する際に、クエリコンテンツの特徴ベクトルに、無関係な特徴ベクトルが含まれていることを考慮して、リファレンスコンテンツに対するスコア付けをすることができる。
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1 検索装置
10 リファレンス情報蓄積部
11 特徴ベクトル集合抽出部
12 リファレンス情報生成部
13 類似ベクトル探索部
14 投票部

Claims (12)

  1. 特徴ベクトルの集合で表されるリファレンスコンテンツの集合から、特徴ベクトルの集合で表されるクエリコンテンツに類似したリファレンスコンテンツを検索する検索装置であって、
    複数のリファレンスコンテンツRjから抽出された各特徴ベクトルに対応付けて、リファレンスコンテンツ識別子を記憶したリファレンス情報蓄積手段と、
    前記リファレンス情報蓄積手段を用いて、クエリコンテンツの各特徴ベクトルqiについて、類似した特徴ベクトルを持つリファレンスコンテンツの特徴ベクトルの集合Dを、少なくとも1つ以上探索する類似ベクトル探索手段と、
    混合パラメータλを用いて、前記クエリコンテンツの各特徴ベクトルqiが、探索された各リファレンスコンテンツから生成される確率λ・p(qi|Rj)と、当該リファレンスコンテンツと無関係な背景モデルから生成される確率(1-λ)・p(qi)との確率比に基づいて、リファレンスコンテンツRj毎にスコアを加算することを、当該クエリコンテンツの全ての特徴ベクトルqiについて実行し、最終的に、所定閾値以上の上位のスコアを得たリファレンスコンテンツRjを、検索結果として出力する投票手段と
    を有することを特徴とする検索装置。
  2. 前記投票手段は、前記確率比を、探索されたリファレンスコンテンツの特徴ベクトルの集合Dに含まれる、全リファレンスコンテンツの特徴ベクトルの出現数(Ds)に対する、当該リファレンスコンテンツRjの特徴ベクトルの出現数(nj)との比(nj/Ds)に基づいて算出することを特徴とする請求項1に記載の検索装置。
  3. 前記投票手段は、前記確率比を、更に以下の式における比に基づいて算出する
    (集合Dに含まれる当該リファレンスコンテンツRjの特徴ベクトルの数(nj
    全リファレンスコンテンツの特徴ベクトルの数(|Rall|))/
    (集合Dに含まれる全リファレンスコンテンツの特徴ベクトルの数(Ds
    当該リファレンスコンテンツRjの特徴ベクトルの数(Rj))
    ことを特徴とする請求項2に記載の検索装置。
  4. 前記類似ベクトル探索手段は、探索されたリファレンスコンテンツの特徴ベクトルの集合を、クエリコンテンツの特徴ベクトルqiに対する平均的な類似度に応じて1つ以上の部分集合(クラスタ)Dに区分し、上位からの近傍数m(≧1)番目までの部分集合Dを順序付けし、
    前記投票手段は、部分集合Dt(1≦t≦m)毎に各リファレンスコンテンツについてスコアを算出し、当該スコアが最大となる部分集合Dt’におけるスコアを投票に用いる
    ことを特徴とする請求項2又は3に記載の検索装置。
  5. 前記投票手段は、上位からt番目までの特徴ベクトルの集合Dtについて、クエリコンテンツの特徴ベクトルqiに対するリファレンスコンテンツjのスコアsjを、以下の式によって算出する
    j=maxj log{λ/(1-λ)・(ntj・|Rall|)/(Σs=1 t|Ds(qi)|・|Rj|)+1)}
    tj: t番目までの部分集合Dtに含まれる
    リファレンスコンテンツjの特徴ベクトルの数
    Σs=1 t|Ds(qi)|: t番目までの部分集合Dtに含まれる
    全リファレンスコンテンツjの特徴ベクトルの数
    |Rall|: 全リファレンスコンテンツにおける全特徴ベクトルの数
    |Rj|: 当該リファレンスコンテンツjにおける全特徴ベクトルの数
    λ、1-λ: 混合パラメータ
    ことを特徴とする請求項4に記載の検索装置。
  6. 前記リファレンス情報蓄積手段は、各部分集合(クラスタ)D毎に、特徴ベクトルの平均的な代表ベクトルを更に対応付けて記憶しており、
    前記類似ベクトル探索手段は、クエリコンテンツの各特徴ベクトルqiと、各部分集合Dの代表ベクトルとを比較して、部分集合Dを探索する
    ことを特徴とする請求項4又は5に記載の検索装置。
  7. 前記類似ベクトル探索手段は、
    クエリコンテンツの各特徴ベクトルqiに類似する、リファレンスコンテンツの特徴ベクトルのうちk個の部分集合を探索する第1の手段と、
    近傍数kの部分集合に含まれる、リファレンスコンテンツの特徴ベクトルの数Lを計数する第2の手段
    近傍数k個の部分集合に含まれるL個のリファレンスコンテンツの特徴ベクトルのうち、更にqiに類似した上位m(m≦L)個の特徴ベクトルを探索する第3の手段
    を有し、
    第3の手段における特徴ベクトル数mは、第2の手段によって計数された特徴ベクトルの数Lに応じて更新され、
    前記Dt(qi)(1≦t≦m)は、t番目の特徴ベクトルのみで構成される
    ことを特徴とする請求項4から6のいずれか1項に記載の検索装置。
  8. 第3の手段における特徴ベクトル数mは、第2の手段によって得られる特徴ベクトルの数Lを用いて、αL(α≦1)によって決定される
    ことを特徴とする請求項7に記載の検索装置。
  9. 第3の手段における特徴ベクトル数mは、第2の手段によって得られる特徴ベクトルの数Lを用いて、Lα(α≦1)によって決定される
    ことを特徴とする請求項7に記載の検索装置。
  10. リファレンスコンテンツ及びクエリコンテンツから、特徴ベクトルを抽出する特徴ベクトル集合抽出手段を更に有し、
    前記特徴ベクトル集合抽出手段は、異なる種類のアルゴリズム毎に、複数の特徴ベクトルを出力することができ、
    前記投票手段は、クエリコンテンツ及びリファレンスコンテンツそれぞれについて、異なる種類の特徴ベクトル毎にスコアsを算出し、各リファレンスコンテンツについて異なる種類の特徴ベクトルのスコアsを重み付け和した値を、最終的なスコアとする
    ことを特徴とする請求項1から9のいずれか1項に記載の検索装置。
  11. 前記クエリコンテンツ及びリファレンスコンテンツは、画像であって、
    前記リファレンスコンテンツとしての画像には、同一の物体又は同一カテゴリに属する少なくとも1つのインスタンス(対象物、オブジェクト)が写っている
    ことを特徴とする請求項1から10のいずれか1項に記載の検索装置。
  12. 特徴ベクトルの集合で表されるリファレンスコンテンツの集合から、特徴ベクトルの集合で表されるクエリコンテンツに類似したリファレンスコンテンツを検索する装置に搭載されたコンピュータを機能させる検索プログラムであって、
    複数のリファレンスコンテンツRjから抽出された各特徴ベクトルに対応付けて、リファレンスコンテンツ識別子を記憶したリファレンス情報蓄積手段と、
    前記リファレンス情報蓄積手段を用いて、クエリコンテンツの各特徴ベクトルqiについて、類似した特徴ベクトルを持つリファレンスコンテンツの特徴ベクトルの集合Dを、少なくとも1つ以上探索する類似ベクトル探索手段と、
    混合パラメータλを用いて、前記クエリコンテンツの各特徴ベクトルqiが、探索された各リファレンスコンテンツから生成される確率λ・p(qi|Rj)と、当該リファレンスコンテンツと無関係な背景モデルから生成される確率(1-λ)・p(qi)との確率比に基づいて、リファレンスコンテンツRj毎にスコアを加算することを、当該クエリコンテンツの全ての特徴ベクトルqiについて実行し、最終的に、所定閾値以上の上位のスコアを得たリファレンスコンテンツRjを、検索結果として出力する投票手段と
    してコンピュータを機能させることを特徴とする検索プログラム。
JP2012121454A 2012-05-29 2012-05-29 高次元の特徴ベクトル集合で表現されるコンテンツを高精度で検索する検索装置及びプログラム Active JP5833499B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012121454A JP5833499B2 (ja) 2012-05-29 2012-05-29 高次元の特徴ベクトル集合で表現されるコンテンツを高精度で検索する検索装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012121454A JP5833499B2 (ja) 2012-05-29 2012-05-29 高次元の特徴ベクトル集合で表現されるコンテンツを高精度で検索する検索装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2013246739A JP2013246739A (ja) 2013-12-09
JP5833499B2 true JP5833499B2 (ja) 2015-12-16

Family

ID=49846422

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012121454A Active JP5833499B2 (ja) 2012-05-29 2012-05-29 高次元の特徴ベクトル集合で表現されるコンテンツを高精度で検索する検索装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5833499B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6453618B2 (ja) * 2014-11-12 2019-01-16 株式会社東芝 算出装置、方法及びプログラム
WO2017198950A1 (fr) * 2016-05-17 2017-11-23 Kerquest Procédé d'authentification augmentée d'un sujet matériel
WO2020100289A1 (ja) 2018-11-16 2020-05-22 富士通株式会社 類似度計算装置、類似度計算方法および類似度計算プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5436346B2 (ja) * 2010-06-09 2014-03-05 Kddi株式会社 高次元の特徴ベクトルの集合から類似した特徴ベクトルを検索する検索装置及びプログラム

Also Published As

Publication number Publication date
JP2013246739A (ja) 2013-12-09

Similar Documents

Publication Publication Date Title
Zheng et al. SIFT meets CNN: A decade survey of instance retrieval
Zheng et al. Coupled binary embedding for large-scale image retrieval
Zheng et al. $\mathcal {L} _p $-Norm IDF for Scalable Image Retrieval
Yang et al. Dynamic match kernel with deep convolutional features for image retrieval
Huang et al. Object-location-aware hashing for multi-label image retrieval via automatic mask learning
WO2013129580A1 (ja) 近似最近傍探索装置、近似最近傍探索方法およびそのプログラム
JP5598925B2 (ja) 高次元の特徴ベクトルを高精度で検索する検索装置及びプログラム
Wang et al. A unified learning framework for auto face annotation by mining web facial images
Liu et al. An image-based near-duplicate video retrieval and localization using improved edit distance
Zheng et al. Seeing the big picture: Deep embedding with contextual evidences
Vieux et al. Content based image retrieval using bag-of-regions
Dharani et al. Content based image retrieval system using feature classification with modified KNN algorithm
Wang et al. Beauty product image retrieval based on multi-feature fusion and feature aggregation
Battiato et al. Bags of phrases with codebooks alignment for near duplicate image detection
JP6017277B2 (ja) 特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法
JP5833499B2 (ja) 高次元の特徴ベクトル集合で表現されるコンテンツを高精度で検索する検索装置及びプログラム
Shekar et al. An unification of inner distance shape context and local binary pattern for shape representation and classification
Li et al. Near duplicate image detecting algorithm based on bag of visual word model
Liu et al. Multiview Cross-Media Hashing with Semantic Consistency
Hua et al. Cross-modal correlation learning with deep convolutional architecture
Selvam et al. A new architecture for image retrieval optimization with HARP algorithm
Bueno et al. Bayesian approach for near-duplicate image detection
Li et al. A light-weight relevance feedback solution for large scale content-based video retrieval
Liu et al. Deep learning of pre-classification for fast image retrieval
Doulamis et al. 3D modelling of cultural heritage objects from photos posted over the Twitter

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150109

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150929

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150930

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151021

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151029

R150 Certificate of patent or registration of utility model

Ref document number: 5833499

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150