JP2004318365A - 画像検索システム、画像検索方法およびそのプログラム - Google Patents
画像検索システム、画像検索方法およびそのプログラム Download PDFInfo
- Publication number
- JP2004318365A JP2004318365A JP2003109907A JP2003109907A JP2004318365A JP 2004318365 A JP2004318365 A JP 2004318365A JP 2003109907 A JP2003109907 A JP 2003109907A JP 2003109907 A JP2003109907 A JP 2003109907A JP 2004318365 A JP2004318365 A JP 2004318365A
- Authority
- JP
- Japan
- Prior art keywords
- image
- blocks
- images
- feature parameter
- parameter group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
【解決手段】質問画像を特徴付ける、画像の局所的特徴を含む第1の特徴パラメータ群を算出するパラメータ算出手段115、類似度を算出する類似度算出手段120、質問画像と被検索画像が同一・類似か否かを判定する判定手段125、被検索画像およびこれらを特徴付ける第2の特徴パラメータ群を格納する画像データベース130を含む画像検索システム100を提供する。
【選択図】 図1
Description
【発明の属する技術分野】
本発明は、画像検索システム、画像検索方法およびそのプログラムに関するものである。
【0002】
【従来の技術】
インターネットの普及や記憶装置の大容量化などに伴って、所望の類似画像を大量の画像を格納した大規模な画像データベースからネットワークを介して検索する需要が高まっており、類似画像を検出する各種手法が提案されている。それらが提案する画像の類似度の算出手段は、計算負荷が高い「乗算」が含まれて定義されているものがあり、このような乗算を含む算出手段は高速処理の障害となり得る。特に、データベースのさらなる大規模化が見込まれるため、乗算を含むアルゴリズムでは、応答性が悪化してユーザにリアルタイムで検索結果を提供することは一層困難となる。
【0003】
また、乗算を必要としない手法も提案されているが、それらは主に色情報(RGBまたはCMYKなどの各成分の割合やヒストグラム)を利用して類似画像を検出しているため、視覚的には類似していない画像であっても類似画像と判定するような誤検出が生じる。このような、誤検出を取り除くためにはユーザの労力が必要となり、大量の画像を含むデータベースを検索対象とする場合には、色情報に基づく技術を利用することは困難である。従って、高い検索精度、および、計算量の低減化の両者を満足する検索尺度(即ち、画像の類似度)はいまだ存在していないと言える。
【0004】
画像検索を実現する直接的技術ではないが、従来技術としてJacquinが提案した画像を符号化する技術「フラクタルブロック符号化(非特許文献1、2、3を参照されたい。)」がある。これらは、画像内における部分的な自己相似性を有するフラクタル図形で近似することによって画像を符号化(圧縮)する技法であるが、これらに基づき類似度を算出する手法は提案されていない。
【非特許文献1】
A.E.Jacquin, ”Image Coding Based on a Fractal Theory of Iterated Constractive Image Transformations”, IEEE Trans. on IP Vol.IP−1 No.1 pp.18−30 (Jan.1992)
【非特許文献2】
A.E.Jacquin, ”Fractal Image Coding : A Review”, Proceedings of IEEE Vol.81 No.10 pp.1451−1465 (Oct.1993)
【非特許文献3】
M.F.Barnsley and L.P.Hurd, ”Fractal Image Compression”, AK PETERS (1992)
【0005】
【発明が解決しようとする課題】
上述したように、従来の類似度算出方法は、乗算を含むため計算負荷が大きく大規模な画像データベースで画像検索をリアルタイムで提供することは困難であった。また、色情報を用いた類似度判定では、精度が低く誤検出が多いという問題があった。
従って、本発明の目的は、フラクタルブロック符号化技法を利用して上述した諸課題を解決し、高速かつ高精度の画像検索技法を提供することである。より詳細には、フラクタルブロック符号化技法を発展させた、本発明者が提案する2−DファンクショナルARモデル(これについては後で詳述する。)を用いて高速かつ高精度の画像検索技法を提供することである。
【0006】
【課題を解決するための手段】
本発明による画像検索システムは、
複数(大量)の被検索画像を含む画像データベースから所望の質問画像を検索する画像検索システムであって、
ユーザにユーザが所望する検索対象の質問画像を入力するよう、またはネットワークを介して送信するよう促す入力要求手段(オプション)と、
検索対象の質問画像を受信する受信手段(オプション)と、
前記質問画像を被検索画像と同じ画素サイズおよび階調(例えば256×256画素、255階調のサムネイル画像)に変換する変換する変換手段(オプション)と、
フラクタルブロック符号化技法を用いて、前記質問画像から算出したIFSパラメータに含まれるアフィンパラメータを含む、前記質問画像を特徴付ける第1の特徴パラメータ群を算出するパラメータ算出手段と、
複数の被検索画像、および、これらに関連付けられた複数の第2の特徴パラメータ群を格納する画像データベースであって、前記第2の特徴パラメータ群が、フラクタルブロック符号化技法を用いて、前記複数の被検索画像の各々から算出したIFSパラメータに含まれるアフィンパラメータを含む、予め算出されたこれら複数の被検索画像の各々を特徴付けるような前記第2の特徴パラメータ群である、画像データベースと、
前記第1の特徴パラメータ群と、前記第2の特徴パラメータ群とに基づき、前記質問画像に対する前記被検索画像の各々の類似度を算出する類似度算出手段と、
を含むものである。
本発明によれば、画像の局所的特徴を表す上述したような第1および第2の特徴パラメータ群のみを使用して類似度を算出することにより、従来技法よりも計算負荷を軽減し、高精度な画像データベース検索を可能とする。また、本発明では、種々のアフィンパラメータを利用しており極めて厳密に画像の類似度を算出するため、極めて高い精度で画像が類似・一致するのかを判定することが可能となる。即ち、本発明は画像の完全一致か否かを判定するような用途に適している。しかしながら、本構成では、扱うパラメータがアフィンパラメータを全て含むため、上記のごとく極めて高精度に類似・一致するのか否かを判定可能であるが、その反面、後述する本発明の別構成よりパラメータ量が多いため計算コストが若干多くかかり、曖昧検索などで大まかな検索結果の閲覧を所望するような用途には向かない。この点について後述する別構成の発明で対処可能である。
また、本発明は、フラクタルブロック符号化を利用しているため、フラクタルブロック符号化の性質から、質問画像や被検索画像が何らかの画像処理ソフトによって処理されたり、電子透かしが埋め込まれるなどの改竄処理を施されたり、或いは、様々なノイズを含んだりして画質が劣化・変化していても、高精度に画像の同一性や類似性を判定することを可能にする。
【0007】
また、本発明による画像検索システムは、
前記第1および第2の特徴パラメータ群は、
前記アフィンパラメータのうちの位置パラメータのみを含む、
ことを特徴とする。
本発明によれば、精度をほとんど損なうことなく、「前段落の発明」よりもパラメータを限定しているため、計算コストを大幅に軽減して高速な画像データベース検索を可能とする。
【0008】
また、本発明による画像検索システムは、
前記位置パラメータは、前記フラクタルブロック符号化技法を用いて、前記質問画像から相互に重なり合わない複数のレンジブロックを切り出し(分割)、これらレンジブロックのうち、高周波成分が多い上位複数ブロック、近傍画素との相関が低い上位複数ブロック、或いは、輝度値の分散の大きい上位複数ブロック、の少なくとも1つの上位複数ブロックに関連する、
ことを特徴とする。
本発明によれば、輝度値の分散が大きいものなど「局所的特徴がより大きなデータ」のみに限定することによって、精度をほとんど損なわずに、計算コストを低減でき、さらに高速な画像データベース検索を可能とする。
【0009】
また、本発明による画像検索システムは、
前記パラメータ算出手段は、
前記フラクタルブロック符号化技法を用いて、前記質問画像から相互に重なり合わない複数のレンジブロックを切り出し(分割し)、これらレンジブロックのうち、高周波成分が多い上位複数ブロック、近傍画素との相関が低い上位複数ブロック、或いは、輝度値の分散の大きい上位複数ブロック、の少なくとも1つの上位複数ブロックを選択し、他方、重なり合いを許して前記質問画像から複数のドメインブロックを切り出し、これらを縮小アフィン変換して複数の縮小ドメインブロックを得て、前記選択された上位複数ブロックの各々を(最も良く)近似する縮小ドメインブロックをそれぞれ求め、求めたこれら複数の縮小ドメインブロックの位置パラメータ(例えば当該ブロックの左上の頂点の座標)のみを含むような、前記質問画像を特徴付ける第1の特徴パラメータ群を算出する手段を含み、
前記第2の特徴パラメータ群は、
前記フラクタルブロック符号化技法を用いて、前記被検索画像から相互に重なり合わない複数のレンジブロックを切り出し、これらレンジブロックのうち、高周波成分が多い上位複数ブロック、近傍画素との相関が低い上位複数ブロック、或いは、輝度値の分散の大きい上位複数ブロック、の少なくとも1つの上位複数ブロックを選定し、さらに、前記被検索画像から重なり合いを許して複数のドメインブロックを切り出し、これらを縮小アフィン変換して複数の縮小ドメインブロックを得て、前記上位複数ブロックを(最も良く)近似する縮小ドメインブロックをそれぞれ求め、この求めた複数の縮小ドメインブロックの位置パラメータのみを含むような、予め算出されたこれら複数の被検索画像の各々を特徴付ける、ことを特徴とする。
本発明によれば、上記のごとく「画像の局所的特徴」を効果的に特徴付けるような輝度値の分散の大きい、或いは高周波成分の多い、或いは近傍画素との相関が低い「複数のレンジブロック」や「複数の縮小ドメインブロック」を利用することによって計算コストを大幅に軽減し、精度をほとんど損なわずに、より高速な画像データベース検索を可能とする。また、本発明は、「画像の局所的特徴」を効果的に特徴付けるようなブロックに基づくパラメータを利用しているため、改竄処理、ノイズ、画質劣化・変化などに堅牢な類似度の算出が可能となり、より高精度に画像の同一性や類似性を判定することを可能にする。換言すれば、本構成は、厳密な画像の同一性を判定するよりは、多少ノイズが入ったような画像同士であっても、検索漏れにならずに類似画像として抽出するような用途に適する。
【0010】
また、本発明による画像検索システムは、
前記類似度算出手段は、前記第1の特徴パラメータ群の各成分と前記第2の特徴パラメータ群の各成分との差を二乗したもの(例えばこれらの総和)に基づき、前記類似度を算出する、
ことを特徴とする。
本発明によれば、画像の局所的特徴を表す特徴パラメータ群の各成分同士の差を二乗し総和を求めるといった簡易な計算手法で類似度を求めることができ、高精度かつ高速な画像データベース検索を可能とする。
【0011】
また、本発明による画像検索システムは、
前記類似度算出手段が、前記第1の特徴パラメータ群の各成分と、前記複数の第2の特徴パラメータ群の各々(即ち、個々の画像の特徴パラメータ群)の各成分とが同一か否かによって2進符号化(例えば、同一の場合は1とし、否の場合は0とする)したものの総和に基づき、前記類似度を算出する、
ことを特徴とする。
本発明によれば、乗算を含まないため計算コストを顕著に低減させることができ、大規模の大量の被検索画像から検索する場合であっても高速かつ精度良く所望の画像、或いはこれに類似する画像をリアルタイムで検出することが可能となる。
【0012】
また、本発明による画像検索システムは、
前記類似度が高い上位複数画像(例えば、類似度の上位10個の原画データ或いはサムネイル画像データ)を前記画像データベースから読み出しユーザにネットワークを介して送信する手段、および/または、前記類似度が高い上位複数画像を前記画像データベースから読み出し表示装置に表示する手段、を含む
ことを特徴とする。
本発明によれば、ユーザは、類似度の高い複数の画像を容易かつ簡便に閲覧することが可能となり、検索システムの操作性が顕著に向上する。
【0013】
また、本発明による画像検索システムは、
前記複数の被検索画像から、所定の閾値と前記複数の非検索画像の類似度の各々とを比較して、前記質問画像に一致或いは類似するものを判定(選出)する判定手段、
をも含むこと特徴とする。
これは、類似度の定義によって異なるが、例えば、類似度が0に近いほど類似するという定義の場合は、所定の閾値未満のものを一致或いは類似するものと判定し、類似度が1(100%)に近いほど類似するという定義の場合は、所定の閾値よりも大きなものを一致或いは類似するものと判定する。
【0014】
また、本発明による画像検索システムは、
一致或いは類似するものと判定された画像を前記画像データベースから読み出しユーザにネットワークを介して送信する手段、および/または、一致或いは類似するものと判定された画像を前記画像データベースから読み出し表示装置に表示する手段、を含む
ことを特徴とする。
【0015】
上述したように本発明の解決手段をシステム(装置)として説明してきたが、本発明はこれらに実質的に相当する方法、プログラム、プログラムを記録した記憶媒体としても実現され得るものであり、本発明の範囲にはこれらも包含されるものと理解されたい。
例えば、本発明による複数(大量)の被検索画像を含む画像データベースから所望の画像を検索する画像検索方法は、
ユーザにユーザが所望する検索対象の質問画像を入力するよう、またはネットワークを介して送信するよう促す入力要求ステップ(オプション)と、
検索対象の質問画像を受信する受信ステップ(オプション)と、
前記質問画像を被検索画像と同じ画素サイズおよび階調(例えば256×256画素、255階調のサムネイル画像)に変換する変換する変換手段(オプション)と、
フラクタルブロック符号化技法を用いて、前記質問画像から算出したIFSパラメータに含まれるアフィンパラメータを含む、前記質問画像を特徴付ける第1の特徴パラメータ群を算出するパラメータ算出ステップと、
複数の被検索画像、および、これらに関連付けられた複数の第2の特徴パラメータ群を格納する画像データベースに予め格納する格納ステップであって、前記第2の特徴パラメータ群が、フラクタルブロック符号化技法を用いて、前記複数の被検索画像の各々から演算手段を用いて算出したIFSパラメータに含まれるアフィンパラメータを含む、これら複数の被検索画像の各々を特徴付けるような前記第2の特徴パラメータ群である、格納ステップと、
前記第1の特徴パラメータ群と、前記画像データベースに格納されている前記第2の特徴パラメータ群とに基づき、前記質問画像に対する前記被検索画像の各々の類似度を、演算手段を用いて算出する類似度算出ステップと、
を含むものである。
【0016】
また、本発明による画像検索方法は、
前記第1および第2の特徴パラメータ群が、
前記アフィンパラメータのうちの位置パラメータのみを含み、
前記フラクタルブロック符号化技法を用いて、前記質問画像から相互に重なり合わない複数のレンジブロックを切り出し、これらレンジブロックのうち、高周波成分が多い上位複数ブロック、近傍画素との相関が低い上位複数ブロック、或いは、輝度値の分散の大きい上位複数ブロック、の少なくとも1つの上位複数ブロックに基づき前記位置パラメータを求めるステップ、
をも含むことを特徴とする。
【0017】
例えば、本発明によるプログラムは、
複数(大量)の被検索画像を含む画像データベースから所望の画像を検索する画像検索方法をコンピュータに実行させるためのプログラムであって、
前記方法は、
ユーザにユーザが所望する検索対象の質問画像を入力するよう、またはネットワークを介して送信するよう促す入力要求ステップ(オプション)と、
検索対象の質問画像を受信する受信ステップ(オプション)と、
前記質問画像を被検索画像と同じ画素サイズおよび階調(例えば256×256画素、255階調のサムネイル画像)に変換する変換する変換手段(オプション)と、
フラクタルブロック符号化技法を用いて、前記質問画像から算出したIFSパラメータに含まれるアフィンパラメータを含む、前記質問画像を特徴付ける第1の特徴パラメータ群を算出するパラメータ算出ステップと、
複数の被検索画像、および、これらに関連付けられた複数の第2の特徴パラメータ群を画像データベース(記憶装置)に予め格納する格納ステップであって、前記第2の特徴パラメータ群が、フラクタルブロック符号化技法を用いて、前記複数の被検索画像の各々から演算手段を用いて算出したIFSパラメータに含まれるアフィンパラメータを含む、これら複数の被検索画像の各々を特徴付けるような前記第2の特徴パラメータ群である、格納ステップと、
前記第1の特徴パラメータ群と、前記画像データベースに格納されている前記第2の特徴パラメータ群とに基づき、前記質問画像に対する前記被検索画像の各々の類似度を演算手段を用いて算出する類似度算出ステップと、
を含むことを特徴とするプログラム。
【0018】
また、本発明によるプログラムは、
前記第1および第2の特徴パラメータ群が、
前記アフィンパラメータのうちの位置パラメータのみを含み、
前記方法は、
前記フラクタルブロック符号化技法を用いて、前記質問画像から相互に重なり合わない複数のレンジブロックを切り出し、これらレンジブロックのうち、高周波成分が多い上位複数ブロック、近傍画素との相関が低い上位複数ブロック、或いは、輝度値の分散の大きい上位複数ブロック、の少なくとも1つの上位複数ブロックに基づき前記位置パラメータを求めるステップ、をも含む、
ことを特徴とする。
【0019】
【発明の実施の形態】
以下、諸図面を参照しつつ本発明の実施態様を詳細に説明する。
図1は、本発明による画像検索システムの一例を示すブロック図である。図に示すように、画像検索システム100は、ユーザに所望する質問画像の入力を促す入力要求手段105、入力された質問画像を受信する受信手段110、第1の特徴パラメータ群を算出するパラメータ算出手段115、類似度を算出する類似度算出手段120、質問画像と被検索画像が同一・類似か否かを判定する判定手段125、被検索画像およびこれらを特徴付ける第2の特徴パラメータ群を格納する画像データベース130、一致或いは類似するものと判定された画像をユーザに送信する送信手段135、検索結果を表示する表示手段140を含むものである。本システム100は、直接的にローカルのユーザPC160に接続され、さらに、ネットワーク150を介してリモートの多数のユーザPC160にも接続されている。ユーザはこれらのユーザPC160を用いて本システム100にアクセスし、所望の画像に一致或いは類似する画像を検索・抽出することが可能である。データ容量、計算コスト、著作権上の観点から画像データベース130に格納される非検索画像は画素および階調を劣化させたサムネイル画像を用いることが好適であるが、もちろんオリジナル画像を格納すること可能である。本システム100で得た検索結果に満足し、検索結果の非検索画像のオリジナル画像の入手をユーザが所望する場合は、本システム100は、原画像を含む第2のオリジナル画像データベースから当該画像を取り出して、有料でユーザに提供することも可能である。
【0020】
図2は、本発明による画像検索方法の一例を示すフローチャートである。図に示すように、本方法は、ユーザに質問画像の入力を要求し(S100)、ユーザから送信・入力された質問画像を受信する(S110)。次に質問画像から当該画像の局所的特徴を表す第1の特徴パラメータ群(行列)を算出する(S120)。そして、第1の特徴パラメータ群と、データベースに格納された予め算出してある第2の特徴パラメータ群とに基づき、当該質問画像に対する被検索画像の類似度をそれぞれ算出する(S130)。類似度が上位数個の画像を画像データベースから取り出し表示装置に表示する(S140)。
【0021】
図3は、第1の特徴パラメータ群を算出する手順(図2で示したステップS120に相当する)を詳細に説明するフローチャートである。図に示すように、質問画像を重なり合いを許さずに分割しレンジブロックを得る(S200)。分割したレンジブロックのうち、輝度値の分散の大きい上位L個のブロックを選択する(S210)。次に、質問画像を重なり合いを許して分割しドメインブロックを得る(S220)。選択した輝度値の分散の大きいレンジブロックを近似するドメインブロックを求めるために、各ドメインブロックを縮小アフィン変換して縮小ドメインブロックを得る(S230)。縮小アフィン変換ドメインブロックのうち、前記の輝度値の分散の大きいレンジブロックを近似する上位N個のブロックを求め、これらのブロックの座標を位置パラメータとする(S240)。
【0022】
2−D ファンクショナル AR モデル
本発明によるシステムや方法などは、本発明者が新たに提案する画像識別のための2−DファンクショナルARモデルに基づくものであるがこのモデルについて詳細に説明する。
はじめに、画像xおよび白色ノイズ画像uの輝度値を、それぞれx(i,j)、u(i,j)とする。ここでi=0,…,L、j=0,…,Mとする。画像xを相互に重なり合わないN×N画素のブロックに分割し、[L/N]×[M/N]個(ここでは便宜上”[ ]”を用いたが、これは小数点以下切り捨て、即ち整数化の処理を意図する。)の参照ブロック(即ちレンジブロック)XR i,jを得る。ここでi,jは当該ブロックの左上の頂点のx,y座標をそれぞれ表す。白色ノイズ画像uについても同様にブロックに分割し、[L/N]×[M/N]個のブロックUijを得る。
【0023】
さらに、画像xを相互に重なり合いを許してαN×αN画素(α∈{1,2,…,min([L/N],[M/N])})のブロックを切り出し(分割)、(L−αN+1)×(M−αN+1)個のドメインブロックXD i,j(便宜上、このような表記を用いたが、正確にはDはXの上付き文字、i,jはXの下付き文字であることを意図する。以降、同様の表記がある場合も同じことを意図する)を得る。このようなブロック分割において、2−DファンクショナルARモデルは下式のように定義される。
【数1】
ここで、
【数2】
である。ドメインブロックXD i,jにおける画素(k,l)が輝度値
【数3】
を持ち、ドメインブロック
【数4】
における画素(k,l)が輝度値
【数5】
を持つとき、関数Fs,tは下式のようにXD i,jをXD ’ i,jに変換する。
【0024】
【数6】
ここで、
【数7】
(x’=1,…,N;y’=1,…,N)であり、
【数8】
ここで、θs,t(∈{0,π/2,π,3π/2[rad]})は回転角、λs,t∈{1,−1}、eおよびfはその他のパラメータによって自動的に設定される座標オフセット、θs,tおよびos,tはアフィン変換のパラメータである。θs,t、λs,t、θs,tおよびos,tを2−DファンクショナルARパラメータと称する。
【0025】
式(4)および式(5)で定義される関数Fs,tは、画像符号化(「Fractal Image Compression」Michael Barnsley, and Lyman Hurd AK Peters, 1993)のためのグローバルIFS技法(A. E. Jacquin, Image coding based on a fractal theory of iterated contractive image transformations, IEEE Trans. Image Processing, 1 (1) (January 1992) 18−30))に似ている。この提案したモデルにはいかなる関数も選び得るが、その1つとしてグローバルIFSの定式化を用いることが考えられる。その理由は、グローバルIFS法に基づくFs,tの採用は、画像に対する自己相似性を非常に良く表し得るからであり、この自己相似性の表現(即ち、繰り返し写像による表現)が、このモデルにおける自己回帰スキームに適応するからである。
【0026】
2−D ファンクショナル AR モデルのパラメータの計算
与えられた画像がxである場合、このモデルのパラメータは下式を最小化することによって計算される。
【数9】
(i=0,N,2N,…,N[L/N],j=0,N,2N,…,N[M/N])である。
【0027】
【数10】
ここで、
【数11】
である。
【0028】
上記の最小化によって最適な2−DファンクショナルARパラメータを得ることができる。しかしながら上述した諸式ではまだ計算量も多く、特に最適なθやλを決定するためにはサーチアルゴリズムを必要とする。そこで計算負荷を軽減するために、式(1)のモデル定義を以下のように簡単化する。
【数12】
は下式を満足させる。
【数13】
ここでs=1,…,LM、t=1,…,LMである。
図4は、この簡単化した2−DファンクショナルAR(自己回帰)モデルを表すブロック線図である。この簡単化は画像識別の性能を低下させることなく、計算コストの低減を実現することが可能である。図において、z−s x、z−t yはx、y軸のシフトオペレータであり、これらはz−s xz−t yDi,j=Di−s,j−tで機能する。なお、図に示すように、クリッピングに関しては左上のブロックと記載したが、これは一例であり他のブロックであっても良い。
【0029】
2−D ファンクショナル AR モデルに基づく画像識別
検索対象の画像として質問画像x(i,j)が与えられた場合、これの2−DファンクショナルARパラメータは、前述の諸式で計算され得る。本発明は、この2−DファンクショナルARモデルを利用して、類似度を算出することによって、画像データベース内に格納されている画像が質問画像xと同一或いは類似であるのか否かを識別することを可能にする。
【0030】
(i) 画像識別評価値(類似度) E 1
画像データベースに格納されている被検索画像をgとすると、その輝度値は、g(i,j)(i=1,…,L;j=1,…,M)である。ここで、
【数14】
は、下記のように、質問画像xの2−DファンクショナルARパラメータを適用することによって計算される。
【数15】
(i=0,N,2N,…,N[L/N],j=0,N,2N,…,N[M/N])である。
【数16】
【0031】
【数17】
は質問画像xから計算される2−DファンクショナルARモデルによって決定さる。この識別評価値(類似度)は、下式のように定義され得る。
【数18】
この評価値において、E1=0の場合(即ち、各成分同士の誤差が無い場合)は、gは質問画像xと同一であると評価される。E1<CTH(例えばこの閾値CTH=0.2と設定する。)である場合は、gは質問画像xと類似であると評価される。ここでCTHは予め定義された閾値である。
【0032】
画像検索の用途ではE1のために
【数19】
を計算しなければならないが、画像データベースが巨大であれば計算量が問題と成るケースも考えられるが、その場合は、後述するE2を用いることが好適である。
【0033】
(ii) 画像識別評価値(類似度) E 2
画像データベースに格納されている各画像を2−DファンクショナルARモデルパラメータを事前に計算する場合を考える。画像識別のための計算コストは、下式を用いることによって低減され得る。
【数20】
ここで
【数21】
は検索対象の質問画像xから計算されるパラメータ(即ち第1のパラメータ群)であり、
【数22】
は画像データべース内の画像g(被検索画像)から計算されるパラメータ(即ち第2のパラメータ群)であり、関数I(x)は下式のように2進符号化の形式で定義される。
【数23】
【0034】
このような画像識別においては、E2=(L−N)×(M−N)である場合に被検索画像gは質問画像xと同一であると評価即ち判定される。また、E2>CTHである場合は、被検索画像gは質問画像xと類似であると評価される。この評価値(類似度)の計算式には何ら乗算を含まないため、計算コストを顕著に低減することが可能である。
【0035】
本発明による画像検索システム、方法、プログラムの効果を確認するために以下の評価実験を行った。
まず、24個のオリジナル画像(256×256画素、255階調、人物、動物、植物、地形、風景、景色、船、橋、月面、円や三角などのパターン図形、グラフィック図形、DTP印刷物、CG図形など)を用意し、個々の各画像に対して、メディアンフィルタやスムージングフィルタによるスムージング処理、JPEG圧縮、シャープニングフィルタによるシャープニング処理、或いは、ランダムな幾何学的歪みを施す処理をかけ、1オリジナル画像あたり18個の処理済み画像を得た。従って、24×18=432個の非検索画像を画像データベースに格納した。質問画像にはそれぞれのオリジナル画像を用いた。また、オリジナル画像は元々は画素がより大きなものであり、データ量を軽減化するためにそれらをサムネイル化したものである。
【0036】
また、類似度の計算式を下式のように修正した。
【数24】
ここでRは質問画像を分割した全ての参照ブロックのうち、1番〜10番目に輝度値の分散が高いブロックを含むものである。なお、ここでは10個のブロックに限定したが、この数を増加すればより高精度な類似度判定が可能になるがデータを増加させた分だけ計算コストがかかる。従って、この数は十分な精度が得られ、かつ、精度を損なわない数に、実験結果などを勘案して設定することが望ましい。
【数25】
は式(11)の(si,j,ti,j)に対応する。
【数26】
はk番目に最も小さい
【数27】
から成る。また、2−DファンクショナルARモデルは、N=16、α=2を用いて実現する。各ドメインブロックは16画素未満で重ね合わせた状態で切り出す。計算量を低減するためにλおよびθは0および1に固定する。
【0037】
実験に用いた演算手段CPUは、一般的なPCに搭載されているインテル社のペンティアム(登録商標)IIの450MHzであるが、1つの質問画像を用いて432個の被検索画像に対して検索処理(類似度の計算処理)をするときに約20msを要した。実験結果は、非常に良好であり、ほとんど場合、質問画像に由来する被検索画像の類似度(評価値E’2)は100%近くあり、それ以外の画像に対しては20%未満の類似度であった。
【0038】
図5は、本実験で得られた類似度(評価値)の計算結果の一例を示すグラフである。図に示すように、質問画像(この場合は航空機から移した地形写真)に由来する被検索画像(この場合は画像番号1〜18)の類似度(評価値E’2)は100%であり、それ以外の画像に対してはほとんどが20%未満の類似度であった。
従って、本発明によるシステムは非常に高精度かつ高速に所望の画像を検索して、大量の画像データベースから類似或いは一致する画像を取り出すことが可能である。
【0039】
本明細書では、様々な実施態様で本発明の原理を説明してきたが、本発明は上述した実施例に限定されず幾多の変形および修正を施すことが可能であり、これら変形および修正されたものも本発明に含まれることを理解されたい。
例えば、実施例では、PCというプラットホーム上で本発明を実現させたが、本発明は、ワークステーション、メーンフレームなどでも実現可能である。また、本実施例では、輝度値の分散の高いブロックの位置パラメータに基づき画像の局所的特徴を特徴付けたが、その他に高周波成分の多いブロックなどを用いることも可能であり、さらには位置パラメータ以外のアフィンパラメータをも利用し得ることに留意されたい。
さらに、本発明の様々な構成を組み合わせて検索を段階的に実施することも可能である。例えば、最初に、計算負荷が軽い位置パラメータのみを含む特徴パラメータ群を用いて類似度を算出して、類似候補の画像を絞り込み、その後、この類似候補の画像のみに対して、計算負荷が大きな全てのアフィンパラメータを用いて類似度を算出してより厳密・高精度な検索を行うことも可能である。このような構成を取れば、最初の絞り込みで候補画像を少数に限定できるため、高精度を保持しつつ、高速な検索サービスを提供することが可能である。
【図面の簡単な説明】
【図1】本発明による画像検索システムの一例を示すブロック図である。
【図2】本発明による画像検索方法の一例を示すフローチャートである。
【図3】第1の特徴パラメータ群を算出する手順を詳細に説明するフローチャートである。
【図4】この簡単化した2−DファンクショナルAR(自己回帰)モデルを表すブロック線図である。
【図5】本実験で得られた類似度(評価値)の計算結果の一例を示すグラフである。
【符号の説明】
100 画像検索システム
105 入力要求手段
110 受信手段
115 パラメータ算出手段
120 類似度算出手段
125 判定手段
130 画像データベース
135 送信手段
140 表示手段
Claims (13)
- 複数の被検索画像を含む画像データベースから所望の質問画像を検索する画像検索システムであって、
フラクタルブロック符号化技法を用いて、前記質問画像から算出したIFSパラメータに含まれるアフィンパラメータを含む、前記質問画像を特徴付ける第1の特徴パラメータ群を算出するパラメータ算出手段と、
複数の被検索画像、および、これらに関連付けられた複数の第2の特徴パラメータ群を格納する画像データベースであって、前記第2の特徴パラメータ群が、フラクタルブロック符号化技法を用いて、前記複数の被検索画像の各々から算出したIFSパラメータに含まれるアフィンパラメータを含む、予め算出されたこれら複数の被検索画像の各々を特徴付けるような前記第2の特徴パラメータ群である、画像データベースと、
前記第1の特徴パラメータ群と、前記第2の特徴パラメータ群とに基づき、前記質問画像に対する前記被検索画像の各々の類似度を算出する類似度算出手段と、
を含む画像検索システム。 - 請求項1に記載の画像検索システムにおいて、
前記第1および第2の特徴パラメータ群は、
前記アフィンパラメータのうちの位置パラメータのみを含む、
ことを特徴とする画像検索システム。 - 請求項1または2に記載の画像検索システムにおいて、
前記位置パラメータは、前記フラクタルブロック符号化技法を用いて、前記質問画像から相互に重なり合わない複数のレンジブロックを切り出し、これらレンジブロックのうち、高周波成分が多い上位複数ブロック、近傍画素との相関が低い上位複数ブロック、或いは、輝度値の分散の大きい上位複数ブロック、の少なくとも1つの上位複数ブロックに関連する、
ことを特徴とする画像検索システム。 - 請求項1〜3のいずれか1項に記載の画像検索システムにおいて、
前記パラメータ算出手段は、
前記フラクタルブロック符号化技法を用いて、前記質問画像から相互に重なり合わない複数のレンジブロックを切り出し、これらレンジブロックのうち、高周波成分が多い上位複数ブロック、近傍画素との相関が低い上位複数ブロック、或いは、輝度値の分散の大きい上位複数ブロック、の少なくとも1つの上位複数ブロックを選択し、他方、重なり合いを許して前記質問画像から複数のドメインブロックを切り出し、これらを縮小アフィン変換して複数の縮小ドメインブロックを得て、前記選択された上位複数ブロックの各々を近似する縮小ドメインブロックをそれぞれ求め、求めたこれら複数の縮小ドメインブロックの位置パラメータのみを含むような、前記質問画像を特徴付ける第1の特徴パラメータ群を算出する手段を含み、
前記第2の特徴パラメータ群は、
前記フラクタルブロック符号化技法を用いて、前記被検索画像から相互に重なり合わない複数のレンジブロックを切り出し、これらレンジブロックのうち、
高周波成分が多い上位複数ブロック、近傍画素との相関が低い上位複数ブロック、或いは、輝度値の分散の大きい上位複数ブロック、の少なくとも1つの上位複数ブロックを選定し、さらに、前記被検索画像から重なり合いを許して複数のドメインブロックを切り出し、これらを縮小アフィン変換して複数の縮小ドメインブロックを得て、前記上位複数ブロックを近似する縮小ドメインブロックをそれぞれ求め、この求めた複数の縮小ドメインブロックの位置パラメータのみを含むような、予め算出されたこれら複数の被検索画像の各々を特徴付ける、
ことを特徴とする画像検索システム。 - 請求項1〜4のいずれか1項に記載の画像検索システムにおいて、
前記類似度算出手段は、前記第1の特徴パラメータ群の各成分と前記第2の特徴パラメータ群の各成分との差を二乗したものに基づき、前記類似度を算出する、
ことを特徴とする画像検索システム。 - 請求項1〜4のいずれか1項に記載の画像検索システムにおいて、
前記類似度算出手段は、前記第1の特徴パラメータ群の各成分と前記第2の特徴パラメータ群の各成分とが同一か否かによって2進符号化したものに基づき、前記類似度を算出する、
ことを特徴とする画像検索システム。 - 請求項1〜6のいずれか1項に記載の画像検索システムにおいて、
前記類似度が高い上位複数画像を前記画像データベースから読み出しユーザにネットワークを介して送信する手段、および/または、前記類似度が高い上位複数画像を前記画像データベースから読み出し表示装置に表示する手段、を含む
ことを特徴とする画像検索システム。 - 請求項1〜6のいずれか1項に記載の画像検索システムにおいて、
前記複数の被検索画像から、所定の閾値と前記複数の非検索画像の類似度の各々とを比較して、前記質問画像に一致或いは類似するものを判定する判定手段、をも含むこと特徴とする画像検索システム。 - 請求項8に記載の画像検索システムにおいて、
一致或いは類似するものと判定された画像を前記画像データベースから読み出しユーザにネットワークを介して送信する手段、および/または、一致或いは類似するものと判定された画像を前記画像データベースから読み出し表示装置に表示する手段、を含む
ことを特徴とする画像検索システム。 - 複数の被検索画像を含む画像データベースから所望の画像を検索する画像検索方法であって、
フラクタルブロック符号化技法を用いて、前記質問画像から算出したIFSパラメータに含まれるアフィンパラメータを含む、前記質問画像を特徴付ける第1の特徴パラメータ群を算出するパラメータ算出ステップと、
複数の被検索画像、および、これらに関連付けられた複数の第2の特徴パラメータ群を格納する画像データベースに予め格納する格納ステップであって、前記第2の特徴パラメータ群が、フラクタルブロック符号化技法を用いて、前記複数の被検索画像の各々から算出したIFSパラメータに含まれるアフィンパラメータを含む、これら複数の被検索画像の各々を特徴付けるような前記第2の特徴パラメータ群である、格納ステップと、
前記第1の特徴パラメータ群と、前記画像データベースに格納されている前記第2の特徴パラメータ群とに基づき、前記質問画像に対する前記被検索画像の各々の類似度を演算手段を用いて算出する類似度算出ステップ、
を含むことを特徴とする画像検索方法。 - 請求項10に記載の画像検索方法において、
前記第1および第2の特徴パラメータ群が、
前記アフィンパラメータのうちの位置パラメータのみを含み、
前記フラクタルブロック符号化技法を用いて、前記質問画像から相互に重なり合わない複数のレンジブロックを切り出し、これらレンジブロックのうち、高周波成分が多い上位複数ブロック、近傍画素との相関が低い上位複数ブロック、或いは、輝度値の分散の大きい上位複数ブロック、の少なくとも1つの上位複数ブロックに基づき前記位置パラメータを求めるステップ、
をも含むことを特徴とする画像検索方法。 - 複数の被検索画像を含む画像データベースから所望の画像を検索する画像検索方法をコンピュータに実行させるためのプログラムであって、
前記方法は、
フラクタルブロック符号化技法を用いて、質問画像から算出したIFSパラメータに含まれるアフィンパラメータを含む、前記質問画像を特徴付ける第1の特徴パラメータ群を算出するパラメータ算出ステップと、
複数の被検索画像、および、これらに関連付けられた複数の第2の特徴パラメータ群を格納する画像データベースに予め格納する格納ステップであって、前記第2の特徴パラメータ群が、フラクタルブロック符号化技法を用いて、前記複数の被検索画像の各々から算出したIFSパラメータに含まれるアフィンパラメータを含む、これら複数の被検索画像の各々を特徴付けるような前記第2の特徴パラメータ群である、格納ステップと、
前記第1の特徴パラメータ群と、前記画像データベースに格納されている前記第2の特徴パラメータ群とに基づき、前記質問画像に対する前記被検索画像の各々の類似度を算出する類似度算出ステップと、
を含むことを特徴とするプログラム。 - 請求項12に記載のプログラムにおいて、
前記第1および第2の特徴パラメータ群が、
前記アフィンパラメータのうちの位置パラメータのみを含み、
前記方法は、
前記フラクタルブロック符号化技法を用いて、前記質問画像から相互に重なり合わない複数のレンジブロックを切り出し、これらレンジブロックのうち、高周波成分が多い上位複数ブロック、近傍画素との相関が低い上位複数ブロック、或いは、輝度値の分散の大きい上位複数ブロック、の少なくとも1つの上位複数ブロックに基づき前記位置パラメータを求めるステップ、をも含む、
ことを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003109907A JP2004318365A (ja) | 2003-04-15 | 2003-04-15 | 画像検索システム、画像検索方法およびそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003109907A JP2004318365A (ja) | 2003-04-15 | 2003-04-15 | 画像検索システム、画像検索方法およびそのプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004318365A true JP2004318365A (ja) | 2004-11-11 |
Family
ID=33470906
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003109907A Pending JP2004318365A (ja) | 2003-04-15 | 2003-04-15 | 画像検索システム、画像検索方法およびそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004318365A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007139421A (ja) * | 2005-11-14 | 2007-06-07 | Univ Nihon | 形態分類装置及び方法、並びに変化領域抽出装置及び方法 |
US8311369B2 (en) | 2008-02-13 | 2012-11-13 | Casio Computer Co., Ltd. | Method and apparatus for searching for images |
CN103430179A (zh) * | 2011-02-07 | 2013-12-04 | 英特尔公司 | 在图像数据库中添加新图像和其相关信息的方法、***以及计算机可读存储介质 |
EP2722810A1 (en) | 2012-05-30 | 2014-04-23 | Dongjoo Shin | Commodity display information tabulation method, data structure, and recording medium recording the same |
CN105975552A (zh) * | 2016-04-29 | 2016-09-28 | 广东小天才科技有限公司 | 一种智能设备的题目搜索方法和装置 |
CN105975550A (zh) * | 2016-04-29 | 2016-09-28 | 广东小天才科技有限公司 | 一种智能设备的题目搜索方法和装置 |
CN105975525A (zh) * | 2016-04-29 | 2016-09-28 | 广东小天才科技有限公司 | 一种应用于电子终端的试题搜索方法和装置 |
CN105975560A (zh) * | 2016-04-29 | 2016-09-28 | 广东小天才科技有限公司 | 一种智能设备的题目搜索方法和装置 |
CN106354781A (zh) * | 2016-08-23 | 2017-01-25 | 广东小天才科技有限公司 | 试题搜索方法和装置 |
-
2003
- 2003-04-15 JP JP2003109907A patent/JP2004318365A/ja active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007139421A (ja) * | 2005-11-14 | 2007-06-07 | Univ Nihon | 形態分類装置及び方法、並びに変化領域抽出装置及び方法 |
US8311369B2 (en) | 2008-02-13 | 2012-11-13 | Casio Computer Co., Ltd. | Method and apparatus for searching for images |
CN103430179A (zh) * | 2011-02-07 | 2013-12-04 | 英特尔公司 | 在图像数据库中添加新图像和其相关信息的方法、***以及计算机可读存储介质 |
EP2722810A1 (en) | 2012-05-30 | 2014-04-23 | Dongjoo Shin | Commodity display information tabulation method, data structure, and recording medium recording the same |
CN105975552A (zh) * | 2016-04-29 | 2016-09-28 | 广东小天才科技有限公司 | 一种智能设备的题目搜索方法和装置 |
CN105975550A (zh) * | 2016-04-29 | 2016-09-28 | 广东小天才科技有限公司 | 一种智能设备的题目搜索方法和装置 |
CN105975525A (zh) * | 2016-04-29 | 2016-09-28 | 广东小天才科技有限公司 | 一种应用于电子终端的试题搜索方法和装置 |
CN105975560A (zh) * | 2016-04-29 | 2016-09-28 | 广东小天才科技有限公司 | 一种智能设备的题目搜索方法和装置 |
CN105975552B (zh) * | 2016-04-29 | 2020-01-03 | 广东小天才科技有限公司 | 一种智能设备的题目搜索方法和装置 |
CN105975550B (zh) * | 2016-04-29 | 2020-01-14 | 广东小天才科技有限公司 | 一种智能设备的题目搜索方法和装置 |
CN106354781A (zh) * | 2016-08-23 | 2017-01-25 | 广东小天才科技有限公司 | 试题搜索方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107330439B (zh) | 一种图像中物体姿态的确定方法、客户端及服务器 | |
JP5654127B2 (ja) | インクリメントな特徴抽出を使用するオブジェクト認識 | |
JP4700892B2 (ja) | 画像のマッチング | |
Leichter | Mean shift trackers with cross-bin metrics | |
JP5261501B2 (ja) | 不変の視覚場面及び物体の認識 | |
Shi et al. | Photo album compression for cloud storage using local features | |
JP5848833B2 (ja) | 画像を比較するための方法およびシステム | |
TW201016016A (en) | Feature-based video compression | |
JP4098021B2 (ja) | シーン識別方法および装置ならびにプログラム | |
JP2010079545A (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP2015504215A5 (ja) | ||
CN107169425A (zh) | 一种商品属性的识别方法及装置 | |
Gharde et al. | Robust perceptual image hashing using fuzzy color histogram | |
CN111382298A (zh) | 基于图片内容的图像检索方法、装置与电子设备 | |
CN112561976A (zh) | 一种图像主颜色特征提取方法、图像检索方法、存储介质及设备 | |
CN113051984A (zh) | 视频拷贝检测方法和装置、存储介质和电子装置 | |
JP2004318365A (ja) | 画像検索システム、画像検索方法およびそのプログラム | |
CN113793370A (zh) | 三维点云配准方法、装置、电子设备及可读介质 | |
CN111324766A (zh) | 一种基于lbp特征的加密图像检索方法 | |
CN114973098A (zh) | 一种基于深度学习的短视频去重方法 | |
JP2006501530A (ja) | グラフィカルオブジェクトの境界情報の処理 | |
Merrouche et al. | Accuracy analysis of lossless and lossy disparity map compression | |
CN114140581A (zh) | 一种自动建模方法、装置、计算机设备及存储介质 | |
KR102054211B1 (ko) | 이미지 쿼리 기반의 영상 검색 방법 및 시스템 | |
AU2011254041A1 (en) | Compression of sift vectors for image matching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20040727 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20040826 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040826 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20051220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060421 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060530 |