JP5061147B2 - 画像検索装置 - Google Patents

画像検索装置 Download PDF

Info

Publication number
JP5061147B2
JP5061147B2 JP2009099570A JP2009099570A JP5061147B2 JP 5061147 B2 JP5061147 B2 JP 5061147B2 JP 2009099570 A JP2009099570 A JP 2009099570A JP 2009099570 A JP2009099570 A JP 2009099570A JP 5061147 B2 JP5061147 B2 JP 5061147B2
Authority
JP
Japan
Prior art keywords
image
search
search result
images
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009099570A
Other languages
English (en)
Other versions
JP2010250569A (ja
Inventor
ゾラン ステイチ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2009099570A priority Critical patent/JP5061147B2/ja
Publication of JP2010250569A publication Critical patent/JP2010250569A/ja
Application granted granted Critical
Publication of JP5061147B2 publication Critical patent/JP5061147B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、クエリ画像に類似する画像を検索するための装置及び方法に関するものである。
画像検索には、大きく分けて、テキストベースの検索手法と、画像ベースの検索手法とが存在する。
テキストベースの画像検索では、ユーザがテキストクエリを指定し、そのテキストクエリに関連するタグを有する画像をシステムが検索する。この手法によれば、テキストクエリと意味的に関連する画像を検索することができる。しかしながら、この手法を実現するには、画像に対してタグを付す必要がある。このタグ付け作業は、通常、人手に頼る必要がある。また、タグ付与の誤りや、入力されたテキストクエリと付与されているタグとの不一致などにより、検索精度が悪くなる可能性がある。
一方、画像ベースの検索手法では、通常、ユーザが指定したクエリ画像の特徴量と、画像DB中の画像の特徴量とを比較し、特徴量が近いものを類似画像として抽出する。この手法では、画像特徴量の抽出や、特徴量どうしの比較をコンピュータで自動的に行うことができるという利点がある。
しかしながら、画像特徴量を用いた類似画像の検索においては、計算そのものは精度良く実行できるが、検索された画像とクエリ画像とが意味的に整合しない可能性がある。例えば、黄色い箱と黄色い自動車のように、特徴量としてよく似た画像であっても、意味的には全く異なる場合がある。また、画像ベースの検索では、クエリ画像からユーザの意図を読み取ることが一般には難しいので、ユーザの意図に沿わない画像が検索される可能性もある。
下記特許文献1には、画像特徴量を用いて検索した類似画像の表示順位を調整する手法が記載されている。この技術においては、まず、画像特徴量を用いて、画像DBから、K個の類似画像を抽出する。ついで、K個の類似画像のうち、上位M個の類似画像を特定する。ついで、M個の類似画像相互の類似度を計算する。そして、相互類似度が高い順に、M個の類似画像の順位を並べ替えて、ユーザに呈示する。この技術では、相互類似度の高い画像は、ユーザの検索意図に沿っている可能性が高いという仮説を前提にしている。また、この手法は、M個の類似画像の範囲内で、それらの表示順位を調整できるものの、それ以外の画像を新たに検索するものではない。したがって、この手法では、検索結果全体としての正解率の向上は期待しがたい。
特開2004−133947号公報(0028〜0030段落)
本発明は、前記した状況に鑑みてなされたものである。本発明の主な目的は、クエリ画像を用いた画像検索において、ユーザの検索意図に沿った画像の検索が可能な検索装置又は検索方法を提供することである。
本発明は、以下のいずれかの項目に記載の構成とされている。
(項目1)
入力されたクエリ画像を検索エンジンに投入し、前記検索エンジンを用いて画像DB中の類似画像を検索することによって、表示用検索結果を生成するための画像検索装置であって、
前記検索エンジンが前記クエリ画像に基づいて前記画像DB中の類似画像を検索することにより生成され、かつ、ランキングされた複数の画像を含む第1検索結果を、前記検索エンジンから取得する第1検索結果取得部と、
第1検索結果において相対的に上位ランクに位置する画像のうちの少なくとも一部を、前記表示用検索結果に含まれるべき表示用画像として特定する表示用画像特定部と、
前記第1検索結果において相対的に上位ランクに位置する画像に基づいて、前記検索エンジンが前記画像DB中の類似画像を再び検索することによって、ランキングされた複数の画像を含む第2検索結果を前記検索エンジンから取得する第2検索結果取得部と、
前記第1検索結果と前記第2検索結果とを統合することによって、これらの検索結果におけるランキングに基づいてランキングされた複数の画像を含む第3検索結果を生成し、さらに、
前記第3検索結果の全部又は一部を、前記表示用画像特定部における前記第1検索結果として再び入力することにより、前記第3検索結果を更新する検索結果統合部と、
前記表示用画像として特定された画像を用いて、前記表示用検索結果を生成する検索結果生成部と
を含む画像検索装置。
第3検索結果を第1検索結果として再帰的に検索を行うことにより、必要数の表示用画像を収集することができる。収集された表示用画像をユーザに呈示することができる。再帰的な検索において、第3検索結果中の画像を新たなクエリとして扱うことにより、広い範囲での画像検索が可能になる。また、再帰的に特定される各第1検索結果における上位の画像を表示用画像として特定することにより、検索結果における正解率の向上が可能になる。
(項目2)
前記第2検索結果取得部は、前記類似画像を再び検索するために用いる画像として、前記表示用画像特定部において表示用画像として特定された画像以外の画像を用いる構成となっている
項目1に記載の画像検索装置。
(項目3)
前記表示用画像特定部は、前記表示用画像として、前記第1検索結果における最上位ランクの画像を特定する構成となっている
項目1又は2に記載の画像検索装置。
(項目4)
前記第2検索結果取得部は、前記類似画像を再び検索するために用いる画像として、前記第1検索結果における第2順位の画像を用いる構成となっている
項目3に記載の画像検索装置。
(項目5)
前記表示用画像特定部は、前記第3検索結果の全部又は一部を前記第1検索結果として入力することにより特定された前記第1検索結果において、既に表示用画像として特定された画像以外の画像を、前記表示用画像として特定する構成となっている
項目1〜4のいずれか1項に記載の画像検索装置。
(項目6)
項目1〜5のいずれか1項に記載の画像検索装置と、投入された前記クエリ画像を用いて前記画像DB中の類似画像を検索する前記検索エンジンとを備えた画像検索システム。
(項目7)
入力されたクエリ画像を検索エンジンに投入し、前記検索エンジンを用いて画像DB中の類似画像を検索することによって、表示用検索結果を生成するための画像検索方法であって、
(a)前記クエリ画像に基づいて、前記検索エンジンが前記画像DB中の類似画像を検索することにより、ランキングされた複数の画像を含む第1検索結果を前記検索エンジンから取得するステップと、
(b)第1検索結果において相対的に上位ランクに位置する画像のうちの少なくとも一部を、前記表示用検索結果に含まれるべき表示用画像として特定するステップと、
(c)前記第1検索結果において相対的に上位ランクに位置する画像に基づいて、前記検索エンジンが前記画像DB中の類似画像を再び検索することによって、ランキングされた複数の画像を含む第2検索結果を前記検索エンジンから取得するステップと、
(d)前記第1検索結果と前記第2検索結果とを統合することによって、これらの検索結果におけるランキングに基づいてランキングされた複数の画像を含む第3検索結果を生成するステップと、
(e)前記第3検索結果の全部又は一部を前記第1検索結果として特定した上で、前記(b)〜(d)のステップを繰り返すことにより、前記第3検索結果を更新するステップと、
(f)前記表示用画像として特定された画像を用いて、前記表示用検索結果を生成するステップと
を含む画像検索方法。
(項目8)
項目7に記載のステップをコンピュータに実行させることを特徴とするコンピュータプログラム。
このコンピュータプログラムは、適宜な記録媒体(例えばCD−ROMやDVDディスクのような光学的な記録媒体、ハードディスクやフレキシブルディスクのような磁気的記録媒体、あるいはMOディスクのような光磁気記録媒体)に格納することができる。このコンピュータプログラムは、インターネットなどの通信回線を介して伝送されることができる。
本発明によれば、クエリ画像を用いた画像検索において、ユーザの検索意図に沿った画像検索が可能になる。
本発明の一実施形態に係る画像検索装置を用いた検索システムの概略を示すブロック図である。 図1の装置を用いた画像検索方法の概略を示すフローチャートである。 図1の検索装置を用いた検索方法を説明するための説明図である。
(検索システムの構成)
本発明の一実施形態に係る画像検索装置を用いた検索システムを、図1に基づいて説明する。この検索システムは、ユーザ端末1と、画像検索装置2と、検索サーバ3と、インターネット4とを主要な要素として備えている。
(ユーザ端末)
ユーザ端末1は、端末本体11と、入力装置12と、表示装置13とを備えている。端末本体11は、CPU(図示せず)を備えており、ユーザ端末1の動作に必要な計算処理を行うようになっている。入力装置12は、ユーザからの指令を受け取るためのものである。入力装置12としては、例えばキーボードやマウスやトラックボールのような装置を用いることができる。本実施形態の入力装置12は、ユーザによってクエリ画像を指定できるようになっている。表示装置13は、ユーザに対して情報を提示するものである。表示装置13としては、例えばLCDやCRTなどのディスプレイを用いることができる。本実施形態の表示装置13は、画像検索装置2で生成した出力用文書を表示するようになっている。
(画像検索装置)
画像検索装置2は、入力されたクエリ画像を検索エンジンに投入し、この検索エンジンを用いて画像DB中の類似画像を検索することによって、表示用検索結果を生成するためのものである。この画像検索装置は、クエリ受付部21と、第1検索結果取得部22と、表示用画像特定部23と、第2検索結果取得部24と、検索結果統合部25と、検索結果生成部26とを備えている。
クエリ受付部21は、ユーザがユーザ端末1に入力したクエリ画像の情報を受け付ける部分である。さらに、クエリ受付部21は、検索サーバ3の検索エンジン(後述)にクエリ画像を提供することによって、クエリ画像に類似する複数の画像を含む第1検索結果を取得する構成となっている。
第1検索結果取得部22は、検索サーバ3の検索エンジンから、ランキングされた複数の画像を含む第1検索結果を取得するものである。すなわち、後述するとおり、検索エンジンは、クエリ画像に基づいて画像DB(後述)を検索し、類似度順でランキングされた検索結果(これを第1検索結果と称する)を生成する。この第1検索結果を、検索エンジンから、第1検索結果取得部22が取得する。
表示用画像特定部23は、第1検索結果において相対的に上位ランクに位置する画像のうちの少なくとも一部を、表示用検索結果に含まれるべき表示用画像として特定する。具体的には、この実施形態では、第1検索結果における最上位ランクの画像を、表示用画像として特定する。
第2検索結果取得部24は、第1検索結果において相対的に上位ランクに位置する画像に基づく第2検索結果を取得するものである。すなわち、検索サーバ3の検索エンジンは、後述するように、第1検索結果中の上位ランクの画像を用いて、画像DB中の類似画像を再び検索することによって、ランキングされた複数の画像を含む第2検索結果を生成する。この第2検索結果を、第2検索結果取得部24が、検索エンジンから取得する。具体的には、この実施形態では、第1検索結果における第2順位の画像に基づいて、第2検索結果を取得する。また、前記した表示用画像と、第2検索結果を取得するために用いる画像とは、異なっていることが好ましい。
検索結果統合部25は、第1検索結果と第2検索結果とを統合することによって、これらの検索結果におけるランキングに基づいてランキングされた複数の画像を含む第3検索結果を生成する。さらに、検索結果統合部25は、第3検索結果の全部又は一部を第1検索結果として特定した上で、この新たに特定された第1検索結果を、表示用画像特定部23における第1検索結果として入力する。これにより、検索結果統合部25は、第3検索結果を更新するようになっている。
検索結果生成部26は、表示用画像として特定された画像を用いて、表示用検索結果を生成する。
さらに、検索結果生成部26は、表示用検索結果における画像が、検索された順序で配置されている、出力用文書を生成する構成となっている。
なお、画像検索装置2の詳しい動作については、本実施形態の動作において詳しく説明する。
(検索サーバ)
検索サーバ3は、検索エンジン31と、インデックスDB32と、画像DB33とから構成されている。
検索エンジン31は、クエリ画像に基づいた画像検索を行うものである。検索手法としては、例えば、画像毎に特徴量を抽出しておき、この特徴量で表される特徴ベクトルどうしの距離を用いて、画像どうしの類似度を数値化する手法を用いることができる。特徴量としては、画像の色、テクスチャあるいは形状情報を用いることができる。このような画像検索手法自体は、従来から知られているものを利用できるので、これについての詳しい説明は省略する(参考文献:"Content-based Multimedia Information Retrieval: State of the Art and Challenges", ACM Transactions on Multimedia Computing, Communications, and Applications, 2(1):1-19, Feb. 2006.)。クエリ画像を用いた画像検索の手法については、本発明においては、特に制約はなく、各種の方法が利用可能である。
インデックスDB32は、画像DB33に格納されている画像の検索を高速化するための索引を格納したDBである。画像DB33には、検索対象としての多数の画像が格納されている。画像DB33においては、画像毎にIDが付与されている。また、各IDに対応して、画像の特徴量などの情報が記録されている。これらの各DBの構成も、従来と同様でよいので、これ以上詳しい説明は省略する。
(本実施形態の動作)
次に、本実施形態の画像検索装置を用いた検索方法を、図2及び図3をさらに参照しながら説明する。
(図2のステップSA−1)
まず、ユーザは、ユーザ端末1の入力装置12を用いて、クエリ画像を指定する(図3。指定されたクエリ画像の情報は、インターネット4を介して、画像検索装置2のクエリ受付部21に送られる。
画像検索装置2のクエリ受付部21は、クエリ画像の情報を受け取ると、クエリ画像を、検索サーバ3の検索エンジン31に送る。
(図2のステップSA−2)
ついで、検索サーバ3の検索エンジン31は、クエリ画像に基づいて、画像DB33の中の類似画像を検索する。これにより、検索サーバ3の検索エンジン31は、類似画像についての検索結果を取得することができる。このように取得された検索結果を、この明細書では、第1検索結果と称している。第1検索結果においては、クエリ画像と、検索された画像との類似度に応じて、画像へのランク付けがされている。また、本実施形態の第1検索結果は、類似度のランキングが比較的に上位の画像を特定したものである。ここで、上位ランクの画像のうち、どの範囲までを第1検索結果とするかは、適宜に決定できる。したがって、第1検索結果は、クエリ画像に類似する複数の画像を含むものとなっている。図3では、第1検索結果に含まれる画像を、画像1a〜4aとして示している。この例では、簡単のため、四つの画像を例示しているが、これ以上またはこれ以下の数の画像を含むことは可能である。本実施形態においては、検索結果に含まれるべき最低の画像数は2である。検索結果に含まれる画像数が1又は零の場合は、後述する検索終了条件に該当する。
(図2のステップSA−3)
ついで、表示用画像特定部23は、第1検索結果において相対的に上位ランクに位置する画像のうちの少なくとも一部を、表示用検索結果に含まれるべき表示用画像として特定する。具体的には、表示用画像特定部23は、第1検索結果における最上位ランクの画像1a(図3参照)を、表示用画像として特定する。最上位ランクの画像は、クエリ画像との関連性が最も高いと推定できるので、この画像を表示用画像と特定することにより、表示される検索結果の正解率を向上できると考えられる。なお、上位ランクの画像のうち、最上位ランク以外のものを、表示用画像として特定することは、原理的には可能である。また、検索エンジンの設定によっては、最上位ランクの画像が、クエリ画像と同じである可能性もある。そのような場合は、その次のランクの画像を表示用画像特定部23が表示用画像として特定する設定とすることも可能である。
(図2のステップSA−4及びSA−5)
ついで、第2検索結果取得部24は、第1検索結果において相対的に上位ランクに位置する画像を特定する。具体的には、第2検索結果取得部24は、第2検索結果における第2順位の画像2a(図3参照)を特定する。なお、第2順位の画像が既に表示用画像として特定されている場合はその次の順位の画像が特定される。つまり、表示用画像より低い順位にあり、かつ、相対的には上位に位置する画像がここで特定される。
ついで、第2検索結果取得部24は、この画像2aを、検索エンジン31に送る。検索エンジン31は、この画像2aに基づいて、画像DB33中の類似画像を再び検索する。これにより、第2検索結果取得部24は、検索エンジン31から、類似度順でランキングされた複数の画像を含む第2検索結果を取得することができる。このようにして取得された第2検索結果を、図3において、画像1b〜4bとして例示している。
本実施形態では、第2検索結果を取得するための画像と、先に特定した表示用画像とを異ならせている。これらの画像を同じものとすることは、原理的には可能である。しかしながら、これらの画像を同じものとした場合には、第1検索結果と第2検索結果との間で、多くの画像が共通して含まれることになると想定される。すると、後述する終了条件を考慮すると、早期に検索が終了してしまう可能性が高くなり、検索範囲が狭くなるというおそれがある。これに対して、この実施形態では、広い範囲を検索することが可能になるという利点がある。
また、一般の検索エンジンでは、検索結果における最上位の画像とクエリ画像とが同じであることが多い。その理由は、検索エンジンが、検索対象であるデータベースからクエリ画像の候補をユーザに呈示し、それをユーザが選択するような実装が多いためである。この場合、クエリ画像に最も類似する画像は、クエリ画像そのものとなり、それが検索結果の最上位となる。この最上位画像を用いて再検索を行うと、再検索の結果は、クエリ画像を用いた検索結果と同じになってしまう。本実施形態では、このような状態を避けることができ、その結果、広い範囲での検索が可能になるという利点がある。なお、ここで、検索エンジンにおいて、検索結果の最上位からクエリ画像を除く設定がなされていれば、第2検索結果取得部24が最上位画像を用いて再検索を行うという設定も可能になる。
(図2のステップSA−6)
ついで、検索結果統合部25は、第1検索結果と第2検索結果とを統合することによって、これらの検索結果におけるランキングに基づいてランキングされた複数の画像を含む第3検索結果を生成する。このようにして生成された第3検索結果を、図3において、画像1c〜4cとして例示している。
以下、検索結果を統合する処理の一例をさらに具体的に説明する。各検索結果におけるランキング順位を用いて、各画像のスコアを、例えば以下の式で表すことができる。
Figure 0005061147
ここで、記号の意味は以下の通りである。
Figure 0005061147
ここで、Rank(r,i)を2乗にしているのは、ランキングが低いほど(つまり順位の数が大きいほど)スコアを低くするためである。指数の値は、実験的に定めることができる。なお、この実施形態では、ランキング集合Rに含まれるランキングの数は二つである。ただし、例えば、第1検索結果における第3順位以降の画像(1つ又はそれ以上)を用いて、並列的に検索を行うことにより、複数の第2検索結果を取得することは可能である。この場合は、三つ以上のランキングが存在することになる。この場合でも本例のアルゴリズムを用いると、ランキングの統合を容易に行うことができる。
また、Hitcount(i)を乗じることにより、全ランキングに表れる当該画像の総数が多いほど、高いスコアとすることができる。すなわち、この実施形態では、ランキングでの順位と、全ランキングに表れるデータの数(すなわち出現数)とに応じて、スコアを算出することができる。
このようにして各画像について計算されたスコアの値の順序で画像をランキングし、比較的に上位の画像を特定することにより、第3検索結果を生成することができる。
(図2のステップSA−7)
ついで、検索結果統合部25は、第3検索結果が終了条件に合致するか否かを判定する。終了条件は、実装の要求に応じて種々設定できる。この実施形態では、次のいずれかに該当する場合に、終了条件に該当すると判定する。ただし、この条件はあくまで例示である。
・第3検索結果に含まれる全ての画像が、既に表示用画像として特定されていること;
・第3検索結果に含まれる全ての画像が、第1又は第2検索結果を取得するための検索において既に用いられていること;
・必要数の表示用画像が特定されたこと;又は
・第1検索結果に含まれる画像の数が既定数以下(例えば1又は零)であること。
(図2のステップSA−8)
ついで、検索結果統合部25は、第3検索結果の全部又は一部を、前記の第1検索結果として特定する。つまり、統合により生成された第3検索結果を、前記したステップSA−3における第1検索結果として扱う。その上で、検索結果統合部25は、前記したステップSA−3からSA−7を繰り返す。これにより、この実施形態では、第3検索結果を更新することができる。ただし、ここで、新たに特定された第1検索結果から表示用画像を特定する場合において、最上位ランクの画像が既に表示用として特定されていた場合、その次の順位の画像を表示用として特定する。つまり、この繰り返し処理においては、既に表示用として特定された画像を除いた画像のうちで最上位のものを、表示用として特定する。同様に、第2検索結果を生成するための画像を特定する場合は、既に画像検索のために用いられた画像を除いた画像であって、かつ、表示用画像以外の画像のうちで最上位のものを、検索用として特定する。
このような繰り返し処理により、新たに、表示用画像1cを特定することができる。また、図3には、新たに取得した第2検索結果が、画像1d〜4dとして例示されている。そして、統合処理によって新たに生成された第3検索結果を、図3において符号1e〜4eとして例示する。その結果、表示用画像としてさらに画像1eを特定することができる。ついで、新たな第2検索結果として、図3に示す画像1f〜4fを取得できる。その後、前記のようにして、新たな第3検索結果1g〜4gを生成できる。このうち、表示用画像として、画像1gを特定することができる。このような繰り返し処理により、必要数の表示用画像を特定することができる。この繰り返し処理は、ステップSA−7での判断がNOである限り続けられる。
(図2のステップSA−9及びSA−10)
ステップSA−7での判断がYESの場合、検索結果生成部26は、これまでのステップにおいて表示用画像として特定された画像を用いて、表示用検索結果を生成する。具体的には、図3の例では、表示用画像として特定された画像1a、1c、1e及び1gを用いて、出力用の表示用文書(表示用検索結果の具体例に相当)を生成する。この例では、図3に示されたように、先に特定された画像が高い順位となるように、表示用文書を生成する。先に特定された画像は、クエリに対する関連性がより高いと推定できる。ついで、検索結果生成部26は、表示用文書を、インターネット4を介して、ユーザ端末1に送る。ユーザ端末1は、表示装置13により、表示用文書をユーザに呈示する。これにより、本実施形態では、ユーザの検索意図に対する整合性が高い検索結果を呈示することができるという利点がある。なお、本実施形態の方法を実行しても、既定数の表示用画像が収集できないときは、検索エラーのメッセージをユーザ端末1に返すことが可能である。
(実験例)
以下、前記した実施形態の画像検索方法を用いて画像検索を行った例を説明する。実験条件は以下の通りである。
実験で使ったデータベース:http://wang.ist.psu.edu/~jwang/test1.tar又は、http://wang.ist.psu.edu/~jwang/test1.zipから得られる画像データベース。このデータベースは、「Corel-1000 database」または「Wang database」と呼ばれ、評価用のデータベースとして知られている(参考文献:James Z. Wang, Jia Li, Gio Wiederhold, "SIMPLIcity: Semantics-sensitive Integrated Matching for Picture LIbraries," IEEE Trans. on Pattern Analysis and Machine Intelligence, vol 23, no.9, pp. 947-963, 2001.
http://www-db.stanford.edu/~wangz/project/imsearch/SIMPLIcity/TPAMI/)。なお、このデータベースには合計1000枚の画像が含まれており、これらの画像は10個のカテゴリーに分けられている。各カテゴリーには、100枚の画像が含まれている。
正解・不正解の特定:データベースの中の特定の画像をクエリとして使い、クエリ画像と同じカテゴリーに含まれている画像を正解とみなし、それ以外の画像を不正解とみなす。これは標準的な評価方法である。なお、データベースに含まれるどの画像もクエリとして使うことができる。そして、同じカテゴリーに含まれる画像を正解画像と見なすことができる。
正解率:各クエリーに対する検索結果の上位N件の中で、正解画像の比率(=正解数/N)。この「正解率」は検索分野で適合率(retrieval precision)と呼ばれる。
(比較例1)
既存の手法により、クエリ画像(ビーチを撮影した風景画像)を用いて検索を行った。その結果、クエリ画像を風景の画像と把握したとき、正解率は67%、クエリ画像をビーチの画像と把握したとき、正解率は48%であった。
ここで、比較例における検索手法(すなわち検索エンジンでの検索アルゴリズム)の概要を以下に示す。
・まず、各画像を5×5ブロック(同じ大きさの四角い領域)に分割する。
・次に、各ブロックから三つの特徴量(色、形状、テクスチャー)を抽出する。
その結果として、各ブロックから、三つの特徴ベクトルが抽出される。
画像類似度の計算は以下のように行う。
・まず、ブロックごとの特徴ベクトルの類似度(距離)を計算する。
・ついで、特徴ベクトルごとの類似度の平均、つまり
(色類似度 + 形状類似度 + テクスチャー類似度)/3
を「ブロックごとの類似度」とみなす。
・その後、ブロックごとの類似度の平均を計算し、それを全体の類似度とみなす。
つまり、
・「画像間の類似度」=「ブロック間の類似度の平均」、
・「ブロック間の類似度の平均」=「ブロックの特徴ベクトルの類似度の平均」
となる。
このような手法については、下記参考文献にも記載されているので、これ以上詳しい説明は省略する(参考文献:Zoran Stejic, Yasufumi Takama, Kaoru Hirota: "Comprehensive Comparison of Region-Based Image Similarity Models", Flexible Query Answering Systems, 6th International Conference, FQAS 2004, Lyon, France, June 24-26, 2004, Proceedings. Lecture Notes in Computer Science 3055, pp. 390-403)。
(実験例1)
本実施形態の手法により、比較例1と同じクエリ画像を用いて検索を行った。ここで、実験例で使った検索エンジン31の検索アルゴリズムは、比較例と同じとした(後述の各実験例において同じ)。その結果、クエリ画像を風景の画像と把握したとき、正解率は100%、クエリ画像をビーチの画像と把握したとき、正解率は70%であった。
したがって、本実施形態により、ユーザの意図に即した画像を取得できることが判る。
また、本実施形態では、検索エンジンとして、既存のものを用いながら、反復的な検索を行うことにより、検索結果の質を向上させることができる。さらに、本実施形態では、検索エンジンの内部の処理を変更する必要がないので、各種の既存検索エンジンを用いることができる。また、本実施形態の方法は、どのような既存検索エンジンに対して適用しても、検査結果の質の向上が期待できる。
(比較例2)
比較例1と同じ既存手法により、クエリ画像(象の群れを撮影した画像)を用いて検索を行った。その結果、正解率は30%であった。
(実験例2)
本実施形態の手法により、比較例2と同じクエリ画像を用いて検索を行った。その結果、正解率は48%であった。これからも、本実施形態により、ユーザの意図に即した画像を取得できることが判る。
(比較例3)
比較例1と同じ既存手法により、クエリ画像(花を撮影した画像)を用いて検索を行った。その結果、正解率は93%であった。
(実験例3)
本実施形態の手法により、比較例3と同じクエリ画像を用いて検索を行った。その結果、正解率は100%であった。これからも、本実施形態により、ユーザの意図に即した画像を取得できることが判る。
(比較例4)
比較例1と同じ既存手法により、クエリ画像(食べ物を撮影した画像)を用いて検索を行った。その結果、正解率は59%であった。
(実験例4)
本実施形態の手法により、比較例4と同じクエリ画像を用いて検索を行った。その結果、正解率は78%であった。これからも、本実施形態により、ユーザの意図に即した画像を取得できることが判る。
前記した各実施形態の動作は、コンピュータに適宜のコンピュータソフトウエアを組み込むことにより実施することができる。
なお、本発明の内容は、前記実施形態に限定されるものではない。本発明は、特許請求の範囲に記載された範囲内において、具体的な構成に対して種々の変更を加えうるものである。
例えば、前記した各構成要素は、機能ブロックとして存在していればよく、独立したハードウエアとして存在しなくても良い。また、実装方法としては、ハードウエアを用いてもコンピュータソフトウエアを用いても良い。さらに、本発明における一つの機能要素が複数の機能要素の集合によって実現されても良く、本発明における複数の機能要素が一つの機能要素により実現されても良い。
また、機能要素は、物理的に離間した位置に配置されていてもよい。この場合、機能要素どうしがネットワークにより接続されていても良い。グリッドコンピューティングにより機能を実現し、あるいは機能要素を構成することも可能である。
1 ユーザ端末
11 端末本体
12 入力装置
13 表示装置
2 画像検索装置
21 クエリ受付部
22 第1検索結果取得部
23 表示用画像特定部
24 第2検索結果取得部
25 検索結果統合部
26 検索結果生成部
3 検索サーバ
31 検索エンジン
32 インデックスDB
33 画像DB
4 インターネット

Claims (8)

  1. 入力されたクエリ画像を検索エンジンに投入し、前記検索エンジンを用いて画像DB中の類似画像を検索することによって、表示用検索結果を生成するための画像検索装置であって、
    前記検索エンジンが前記クエリ画像に基づいて前記画像DB中の類似画像を検索することにより生成され、かつ、ランキングされた複数の画像を含む第1検索結果を、前記検索エンジンから取得する第1検索結果取得部と、
    第1検索結果において相対的に上位ランクに位置する画像のうちの少なくとも一部を、前記表示用検索結果に含まれるべき表示用画像として特定する表示用画像特定部と、
    前記第1検索結果において相対的に上位ランクに位置する画像に基づいて、前記検索エンジンが前記画像DB中の類似画像を再び検索することによって、ランキングされた複数の画像を含む第2検索結果を前記検索エンジンから取得する第2検索結果取得部と、
    前記第1検索結果と前記第2検索結果とを統合することによって、これらの検索結果におけるランキングに基づいてランキングされた複数の画像を含む第3検索結果を生成し、さらに、
    前記第3検索結果の全部又は一部を、前記表示用画像特定部における前記第1検索結果として再び入力することにより、前記第3検索結果を更新する検索結果統合部と、
    前記表示用画像として特定された画像を用いて、前記表示用検索結果を生成する検索結果生成部と
    を含む画像検索装置。
  2. 前記第2検索結果取得部は、前記類似画像を再び検索するために用いる画像として、前記表示用画像特定部において表示用画像として特定された画像以外の画像を用いる構成となっている
    請求項1に記載の画像検索装置。
  3. 前記表示用画像特定部は、前記表示用画像として、前記第1検索結果における最上位ランクの画像を特定する構成となっている
    請求項1又は2に記載の画像検索装置。
  4. 前記第2検索結果取得部は、前記類似画像を再び検索するために用いる画像として、前記第1検索結果における第2順位の画像を用いる構成となっている
    請求項3に記載の画像検索装置。
  5. 前記表示用画像特定部は、前記第3検索結果の全部又は一部を前記第1検索結果として入力することにより特定された前記第1検索結果において、既に表示用画像として特定された画像以外の画像を、前記表示用画像として特定する構成となっている
    請求項1〜4のいずれか1項に記載の画像検索装置。
  6. 請求項1〜5のいずれか1項に記載の画像検索装置と、投入された前記クエリ画像を用いて前記画像DB中の類似画像を検索する前記検索エンジンとを備えた画像検索システム。
  7. 入力されたクエリ画像を検索エンジンに投入し、前記検索エンジンを用いて画像DB中の類似画像を検索することによって、表示用検索結果を生成するための、画像検索装置を用いた画像検索方法であって、
    (a)前記クエリ画像に基づいて、前記検索エンジンが前記画像DB中の類似画像を検索することにより生成されかつランキングされた複数の画像を含む第1検索結果を、前記画像検索装置の第1検索結果取得部が前記検索エンジンから取得するステップと、
    (b)前記画像検索装置の表示用画像特定部が、第1検索結果において相対的に上位ランクに位置する画像のうちの少なくとも一部を、前記表示用検索結果に含まれるべき表示用画像として特定するステップと、
    (c)前記第1検索結果において相対的に上位ランクに位置する画像に基づいて、前記検索エンジンが前記画像DB中の類似画像を再び検索することによって生成されかつランキングされた複数の画像を含む第2検索結果を、前記画像検索装置の第2検索結果取得部が前記検索エンジンから取得するステップと、
    (d)前記画像検索装置の検索結果統合部が、前記第1検索結果と前記第2検索結果とを統合することによって、これらの検索結果におけるランキングに基づいてランキングされた複数の画像を含む第3検索結果を生成するステップと、
    (e)前記検索結果統合部が、前記第3検索結果の全部又は一部を前記第1検索結果として特定した上で、前記表示用画像特定部と前記第2検索結果取得部と前記検索結果統合部とによる前記(b)〜(d)のステップを繰り返すことにより、前記第3検索結果を更新するステップと、
    (f)前記画像検索装置の検索結果生成部が、前記表示用画像として特定された画像を用いて、前記表示用検索結果を生成するステップと
    を含む画像検索方法。
  8. 請求項7に記載のステップをコンピュータに実行させることを特徴とするコンピュータプログラム。
JP2009099570A 2009-04-16 2009-04-16 画像検索装置 Active JP5061147B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009099570A JP5061147B2 (ja) 2009-04-16 2009-04-16 画像検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009099570A JP5061147B2 (ja) 2009-04-16 2009-04-16 画像検索装置

Publications (2)

Publication Number Publication Date
JP2010250569A JP2010250569A (ja) 2010-11-04
JP5061147B2 true JP5061147B2 (ja) 2012-10-31

Family

ID=43312820

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009099570A Active JP5061147B2 (ja) 2009-04-16 2009-04-16 画像検索装置

Country Status (1)

Country Link
JP (1) JP5061147B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201421267A (zh) * 2012-11-21 2014-06-01 Hon Hai Prec Ind Co Ltd 搜索系統及方法
JP6327918B2 (ja) * 2014-04-14 2018-05-23 キヤノン株式会社 画像検索装置及びその制御方法
JP6321204B2 (ja) * 2014-11-11 2018-05-09 富士フイルム株式会社 商品検索装置及び商品検索方法
CN113297452A (zh) * 2020-05-26 2021-08-24 阿里巴巴集团控股有限公司 多级检索方法、多级检索装置及电子设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11238067A (ja) * 1998-02-19 1999-08-31 Fujitsu Ltd 画像検索システムおよび記録媒体
JP2000331010A (ja) * 1999-05-18 2000-11-30 Nippon Telegr & Teleph Corp <Ntt> 映像検索方法および装置と映像検索プログラムを記録した記録媒体
JP2002169810A (ja) * 2000-12-04 2002-06-14 Minolta Co Ltd 画像検索プログラムを記録したコンピュータ読み取り可能な記録媒体、画像検索方法および画像検索装置
JP4859025B2 (ja) * 2005-12-16 2012-01-18 株式会社リコー 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体
JP4777059B2 (ja) * 2005-12-22 2011-09-21 パナソニック株式会社 画像検索装置および画像検索方法

Also Published As

Publication number Publication date
JP2010250569A (ja) 2010-11-04

Similar Documents

Publication Publication Date Title
JP5229744B2 (ja) 画像分類装置および画像分類プログラム
JP2010218181A (ja) 画像検索装置
JP2007334402A (ja) クラスタリングされたベクトルデータを検索するサーバ、システム及び方法
CN111651641B (zh) 一种图查询方法、装置及存储介质
JP5061147B2 (ja) 画像検索装置
JP2006277166A (ja) 3次元形状比較プログラム及び3次元類似形状検索プログラム
JP2010218479A (ja) 画像検索装置
JP2010286861A (ja) 画像検索装置
JP2018173909A (ja) 学習プログラム、学習方法および学習装置
AU2004218694A1 (en) Systems and methods for indexing and retrieving images
JPWO2019167282A1 (ja) 応答処理プログラム、応答処理方法、応答処理装置および応答処理システム
CN116883740A (zh) 相似图片识别方法、装置、电子设备和存储介质
JP2004192555A (ja) 情報管理方法、情報管理装置及び情報管理プログラム
JP5151394B2 (ja) 情報管理装置、情報管理方法、及びプログラム
JP4544047B2 (ja) Web画像検索結果分類提示方法及び装置及びプログラム及びプログラムを格納した記憶媒体
JP5383776B2 (ja) グラフインデックス更新装置
JP2003316819A (ja) オブジェクト分類検索装置及びそれを実行するためのプログラム
JP5061137B2 (ja) 画像検索装置
CN113761213B (zh) 一种基于知识图谱的数据查询***、方法及终端设备
JP7121706B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP5954742B2 (ja) 文書を検索する装置及び方法
CN113076322A (zh) 一种商品搜索处理方法及装置
KR20220099745A (ko) 지리공간 블록체인 데이터 검색을 위한 공간 분할 기반의 트리 인덱싱 및 질의어 처리 방법 및 장치
CN103577560B (zh) 一种输入数据库操作指令的方法和装置
KR100519768B1 (ko) 반복매칭을 이용한 영상 검색방법 및 장치

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120518

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120529

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120607

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120731

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120806

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150810

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5061147

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350