JP2008542911A - メトリック埋め込みによる画像比較 - Google Patents

メトリック埋め込みによる画像比較 Download PDF

Info

Publication number
JP2008542911A
JP2008542911A JP2008514653A JP2008514653A JP2008542911A JP 2008542911 A JP2008542911 A JP 2008542911A JP 2008514653 A JP2008514653 A JP 2008514653A JP 2008514653 A JP2008514653 A JP 2008514653A JP 2008542911 A JP2008542911 A JP 2008542911A
Authority
JP
Japan
Prior art keywords
image
tree
engine
family
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008514653A
Other languages
English (en)
Other versions
JP2008542911A5 (ja
Inventor
ベンカテサン ラマラスナム
ケアリー マット
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2008542911A publication Critical patent/JP2008542911A/ja
Publication of JP2008542911A5 publication Critical patent/JP2008542911A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/422Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation for representing the structure of the pattern or shape of an object therefor
    • G06V10/426Graphical representations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/196Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
    • G06V30/1983Syntactic or structural pattern recognition, e.g. symbolic string recognition
    • G06V30/1988Graph matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Processing Or Creating Images (AREA)

Abstract

メトリック埋め込みによる画像比較のシステムおよび方法が提示される。一実施形態では、比較される各画像からグラフが作成される。次いで、各画像のツリーファミリーにグラフメトリックが埋め込まれる。異なる画像それぞれのツリーファミリー間の最小差分を行列にまとめ、その行列から画像比較のための類似度が得られる。

Description

本発明は、メトリック埋め込みによる画像比較に関する。
インターネット上あるいはコンピューティングデバイス内のテキスト(文章や文字列)、画像、知識、ウェブサイト等を検索するには、キーワードを入力して検索を開始することができる。従来、コンピューティング環境における画像の検索は、画像を要約したテキストのキーワードを入力するか、または、画像の視覚的対象あるいは視覚的な特徴を要約したテキストを入力することに限られていた。従来は、検索の主要部分の一部をテキストに変換せずに画像を検索することは困難であった。したがって、従来の画像検索は、実際にはテキスト検索となっている。
画像検索をうまく行うことの難しさは、画像自体にある。画像は、単語に比べてはるかに複雑である。これは、画像には、変更を加えた後の画像が元の画像と数学的に異なるように変更を加えることができるが、それら2つの画像は、人間の視覚系にとって見た目では区別がつかないためである。そのため、ユーザが、画像の色合いを明るく、または暗くする、コントラストを変える、色を微調整する、画像をトリミングまたは圧縮等した場合には、画像は同じに見えるかもしれないが、その画像を定量化するパラメータはかなり変化している。この複雑性を回避するには、単に画像を単語で要約してから、その画像に係る単語検索を行う方が容易であった。
必要とされることは、画像そのものを入力することで画像検索を開始し、例えば画像編集ソフトウェアで多くの異なる形で変更が加えられている可能性のある画像の一致するバージョン(改版)を見つけることで成功して終了できるように、画像を数学的、情報的に取り込む方法である。
メトリック埋め込み(metric embeddings)による画像比較、すなわち、比較される画像の視覚的要素に直接依存せずにデジタル処理で比較を行うことができる形態による画像比較のシステムおよび方法を提示する。一実施形態では、比較対象の各画像から、頂点および辺を有する無向グラフなどのグラフ(図表)が作成される。各種のピクセル指標(characteristics of pixels)を用いてこのグラフを作成することができる。画像からのグラフの作成の一部は、ウェーブレット変換技術で係数ベクトル値を得ることによって達成されることができる。比較のために信頼できるグラフを生成するために、ノイズを低減する工程を追加してよい。例えば、ウェーブレット変換工程の後に、重要でない値をゼロにし、画像またはグラフを縮小することができる。
次いで、各画像についての階層的完全分離ツリー(HST)のファミリーなどのツリーにグラフメトリック(graph metrics)が埋め込まれる。1つの画像のHSTは、画像を表すグラフが区分されるまで再帰的にクラスタリング(クラスタ化)することができる。
埋め込まれたグラフ情報を有するツリーファミリー同士を差分化して、それらのツリーファミリーが表す画像の類似度を得る。一実施形態では、画像を表すツリーファミリーは再帰的に作成されるので、ルートHSTとそれらに関連する子ツリーにツリー差分化技術を反復的に適用する。一実施形態では、差分化は、正規化の工程において1つの類似度で画像間の最小差分を要約する平均値または中央値を見つけられるように、画像間の最小差分の行列を作成し、その行列をベクトル化することを含む。
(概要)
本明細書に記載されるシステムおよび方法は、画像比較技術を提供する。これらの画像比較技術を使用して、インターネット上の画像検索を行う、画像のプールの中から原始画像の変更バージョンを特定すること等ができる。例えば、ユーザは、写真編集ソフトウェアを用いて、あるいは電子メールメッセージに画像を含めるための準備として、原始画像をトリミングおよび圧縮することにより、原始画像に変更を加える場合がある。ここに記載されるシステムおよび方法は、他の画像群の中からそのような変更が加えられた画像を検索し、見つける手段を提供する。
図1は、画像100のピクセル値が無向グラフ102で表された画像比較方法の典型的実施形態を示す。無向グラフ102の各頂点は、画像中の対応するピクセルを表す。一実施形態では、グラフ102を形成する画像前処理段階は、係数ベクトル値を設定して、小さ過ぎる値、すなわち選択された閾値を下回る値を破棄するウェーブレット変換を適用することを含む。無向グラフ102の頂点間の辺は、一辺の両端にあるピクセルの対の値の差に従って重み付けすることができる。辺の重み付けを決定するために使用されるピクセル指標は、輝度やエネルギー等の多種のピクセル指標から選択することができる。そして、その結果得られる無向グラフ102を縮小して、処理力を節減し、ノイズを低減することができる。グラフ形成の工程の後にさらに処理が続くので、このような無向グラフ102を本明細書では大まかに前処理画像と呼ぶ場合がある。
上記の画像前処理段階で作成された無向グラフ102から、グラフメトリックが埋め込まれた階層完全分離ツリーなどのツリーのファミリー104を得ることができる。ツリーファミリー104は、十分な反復回数にわたり最初のクラスタを再帰的に処理(recurse)して、前処理画像を完全分離ツリー(well-separated trees)に区分するクラスタリング方法によって、構築される。この方法に係る典型的なツリーファミリー104は、およそ10個の(親と子の)ツリーを含む。
図2に示すように、画像群からある1つの画像を見つけるために、差分化技術で、原始画像のツリーファミリー104と、比較する複数の他の画像の各ツリーファミリー(例えば204、204’、204’’、204’’’)との類似度(similarity measure)を求める。原始画像100との類似度が最も高い画像が、最良の一致として選択される。
一実施形態では、すぐ上記で紹介した差分化技術は、各ツリーの各ノードに形状ベクトルを割り当て、比較される異なる画像に対応するノード間の差が最小になる類似度値を採用して機能する。すなわち、2つの画像を表す2つのツリーファミリーのツリーにまたがって差分行列が集計される。この行列にベクトルが割り当てられ、次いで、そのベクトルの成分を平均するかまたは他の方式で正規化して類似スコア(得点)を確定する。したがって、画像のプールからある画像のコピーまたはその画像の変更されたバージョンを見つけるには、類似スコアを比較して、可能性のある一致相手を明らかにすることができる。
(典型的システム)
図3は、画像を比較する典型的システム300を示す。コンピューティングデバイス302は、インターネット304と通信可能に結合されている。コンピューティングデバイス302は、画像比較エンジン306をホスティングする。この種のネットワークコンピューティング環境は、単に例示の目的で示すものである。他の種のコンピューティングおよびネットワーク環境も、本発明の主題をホスティングすることができる。画像比較エンジン306は、画像検索308を可能にする。対象画像すなわち「原始(ソース)」画像310が、ユーザによって、またはシステム300の構成要素によって選択されることができる。画像比較エンジン306は、原始画像310を、例えばインターネット304上にある他の画像と比較し、比較ごとに類似度の指標を返す。画像比較エンジン306は、原始画像310と、候補画像の集合の要素間の最良のマッチング(一致)を指定することができる。
画像比較エンジン306は、インターネット304上の画像の集合から検索する代わりに、ファイルディレクトリやデータベース内の画像の集合、または電子メールメッセージの添付ファイルとしてフォルダに記憶されている画像の集合等から検索することもできる。
(典型的エンジン)
図4は、図3の典型的画像比較エンジン306をより詳細に示す。図4の画像比較エンジン306は、概観の目的で例示的な構成の1つを提供するものである。図示された構成要素または同様の構成要素の数多くの他の構成が可能である。このような画像比較エンジン306は、ハードウェア、ソフトウェア、またはハードウェアとソフトウェアとファームウェアの組合せ等として実行されることができる。
図示された画像比較エンジン306の例示的構成は、画像グラフ化エンジン(image graphing engine)402と画像コンパレータ404を含む。画像グラフ化エンジン402は、画像を表すグラフとツリーファミリー104を生成し、一方、画像コンパレータ404は、原始画像100に候補画像を突き合わせることを試みるために、ツリーファミリー104間の類似度を求める。
画像グラフ化エンジン402はさらに、画像前処理構成要素である、グレースケーラ(grayscaler)406、ウェーブレット変換エンジン408、およびダウンスケーラ(downscaler)410を含む。これらの構成要素は、前処理画像412、すなわち、画像100を表すツリーファミリー104を生成する元となるグラフを生成し、画像の比較を可能にする。画像グラフ化エンジン402はさらに、ツリー作成エンジン414を含む。ツリー作成エンジン414はさらに、クラスタリカーサ(クラスタ再帰部)416、ツリープルーナ(ツリーの枝切鋏)418、および再実行(rerun)フィルタ420を含む。これらは、異なる画像を表すグラフメトリックが埋め込まれた各種のツリーファミリー(例えば104、104’)を生成する。
上述の画像コンパレータ404はさらに、ツリー差分化エンジン422とアグリゲータ(集積部)424を含む。ツリー差分化エンジン422はさらに、最小差分エンジン426を含み、最小差分エンジン426はさらに、ツリートポロジィコンパレータ428とクラスタトポロジィコンパレータ430を含む。アグリゲータ424はさらに、差分行列432、ならびに、ベクトルエンジン434、および一対の画像間の類似性を定量化した類似度438を生成するノーマライザ(正規化器)436を含む。
(画像グラフ化エンジン)
画像グラフ化エンジン402の画像前処理構成要素の中で、グレースケーラ406は、カラーのRGB画像の入力を受け取り、その入力を、例えばRGB値のL2ノルム(norm:基準)でグレースケール(濃淡)に変換することができる。
一実施形態では、ウェーブレット変換エンジン408は、3段階のハール(Haar)ウェーブレット変換を行う。その結果得られる係数ベクトルのうち小さな値は、閾値で切ってゼロにすることができる。すなわち、絶対値が例えば0.15などの閾値よりも小さい係数はゼロに変えることができる。次いで、ウェーブレット再構築手順がそれらの係数ベクトルに適用され、ダウンスケーラ410が、その結果を幅およそ70ピクセルに縮小して前処理画像412を生成する。
その前処理画像412から、ツリー作成エンジン414が、k個の階層完全分離ツリー(HST)を生成する。通例は、k=10である。このHSTは、再帰的で階層的なクラスタリング分解によって生成することができる。ツリー作成エンジン414は、前処理画像412に等しいグラフノードの初期クラスタC0を設定することから開始する。次いで、クラスタサイズパラメータがrで指定され、前処理画像412中のピクセル数がNで指定される。rの典型的な値は、およそ1からおよそ−2の間である。パラメータrを何らかの形で調整することで結果を改善できる場合がある。
クラスタリカーサ416は、クラスタCiを選択し、無作為の点x∈Ciを選択する。Ciのすべての点がxからr(logN)の距離内にある場合は、それ以上の処理は必要でなく、Ciがツリーとして返される。そうでない場合は、半径dが、逆型分布(inverse-type distribution)から選択される。すなわち、前処理画像412がN個のピクセルを含んでいる場合、クラスタリカーサ416は、パラメータrの任意の値に対して、xの値を一様に[0,1]に選択し、d=−r(logN)(logx)とする。
クラスタリカーサ416は次いで、Ci+1=B(x,d)と設定し、球の中心が、前のxから、半径dのところにある新しいxに来るようにし、Ci+1にツリーを再帰的に構築し、C‘=Ci/Ci+1と設定する。この手順を、CiをC’に置き換えて繰り返す。このようにして構築された再帰ツリーは、Ciが区分されるまでCiの子を形成する。その結果得られるツリーは、前処理画像412のメトリックが埋め込まれたHSTツリーのファミリー104となる。
ツリープルーナ418は、対応するクラスタに含まれるピクセルが一定の閾値数(通例は100ピクセル)よりも少ないノードを除去することにより、画像比較におけるノイズの影響を低減する。C{i+1}=B{x,y}∩Ci、すなわち、クラスタは、球と等しくはなく、球に含まれるピクセルの集合になることに留意されたい。ピクセルの集合は、一般にはあまり球状ではなく、そのため、下記で説明する形状ベクトルが付加的な重要性を帯びる。一実施形態では、ツリープルーナ418は、ツリー作成の最後に小さなノードを除去することにより、クラスタのサイズが最大でもr(logN)になるようにする最初のステップを不要にすることができる。
同様に、再実行フィルタ420は、結果得られたツリーのノード数が閾値よりも少ない場合、例えば6ノード未満である場合には、ツリー作成プロセス全体を再実行することによりノイズを低減する。換言すると、小さなツリーは、クラスタリングがうまく行っていないことの表れであり、そのツリーは別のクラスタリングパラメータで作成し直すべきである。
(画像コンパレータ)
図に示す画像コンパレータ404の例では、ツリー差分化エンジン422は、原始画像(ソース画像)100のツリーファミリー104からHSTなどのツリーを受け取る。ツリー差分化エンジン422は、同様に候補画像のツリーファミリー104’からもツリーを受け取る。
これら2つのツリー、例えばHSTを前提として、ツリー差分化エンジン422は、それらのツリーの差分指標を生成する最小差分エンジン426を有する。一実施形態では、ツリートポロジィコンパレータ428はツリーのトポロジィを考慮に入れ、一方、クラスタトポロジィコンパレータ430は、ツリーノードに関連付けられたクラスタのトポロジィを考慮に入れる。子HSTを与えられると、最小差分エンジン426は、例えば親の直径で各辺の重みを減らす(scale)。最小差分エンジン426は、2つの形状パラメータdminおよびdmaxに、νにあるクラスタの位置を連結することにより、各ノードνにベクトル
Figure 2008542911
を割り当てる。これらは、νにあるクラスタの凸包Hを計算し、dmaxを、H中の任意の2点間の最大距離に設定し、またdmin=minx∈Hmaxy∈Hρ(x,y)(ρ(x,y)は画像グラフにおけるxからyの距離)とすることによって求められる。
図5に示すように、2つのHST、T502およびU502’を与えられて、ツリー差分化エンジン422は、ツリー差分化関数「treediff(T,U)」を再帰的に計算し、子ノードの集合間をマッピングする。T502およびU502’のルートの子は、それぞれ、
Figure 2008542911
Figure 2008542911
に設定される。ツリー差分化エンジン422は、
Figure 2008542911
とし、aνは、上記で説明した
Figure 2008542911
中の形状ベクトルである。次いで、最小差分エンジン426は、δijを最小にする対(i,j)をs1とし、s1の行および列を取り除いた状態でδijを最小にする対をs2等とする。このsiの数列は、T502のルートの子と、U502’のルートの子との突き合わせを表す。kT≠kUの場合は、数個の子ツリーに突き合わせの相手がない。
ツリー差分化エンジン422は、突き合わせられる子(例えば、上位レベルの突き合わせられる子(504、504’);(506、506’);(508、508’)、および(510、510’)等の続くレベルの突き合わせられる子)に対してtreediff関数を再帰的に計算して、対siからdiを生成する。次いで、ツリー差分化エンジン422は、一致した各対の辺の重みの差と、aνベクトルの差をΣdiに加算する。突き合わせの相手がないTまたはUの子がある場合、ツリー差分化エンジン422は、それらの部分ツリーの辺の重みの合計を加算する(しかしaνベクトルは使用しない)。ツリー差分化エンジン422は、その結果合計を得、この合計は、TおよびUについてのtreediff関数の値となる。
一実施形態では、ツリー差分化エンジン422は、形状ベクトルの最小値で子を突き合わせるのに加えて、数段階の全数検索も行う。状況によっては、これが、より良好な結果をもたらす場合がある。treediff(T,U,0)が上述の差分化関数である場合、treediff(T,U,d)は、Tの子とUの子の間の可能な突き合わせをすべて生成することを意図する。したがって、ツリー差分化エンジン422は、上のレベルから、1回の突き合わせの対ごとにtreediff(T,U,d−1)を呼び出し、すべての突き合わせに対して、その突き合わせの合計値の数学的最小値を返す。上記のツリープルーナ418は、一般に、対応するクラスタに含まれるピクセルが所定の閾値ピクセル数よりも少ないノードを除去することによってツリーを最適化するので、TおよびUの子の数は多くない。上位レベルでtreediff(T,U,d)を呼び出す際のdの典型的な値はわずか2または3であるため、徹底した突き合わせを生成することは実現可能である。
2つの画像(例えばGとH)を比較して類似度を得る状況では、上記の画像グラフ化エンジン402は、各画像からk個の(通例はk=10)HSTを計算する。各画像のツリーファミリー(104、104’)は、それぞれ{Ti}および{Ui}であり、1≦i≦kである。アグリゲータ424は、差分行列423としてΔij=treediff(Ti,Uj)を形成する。ベクトルエンジン434は、di=minjΔijによりベクトルdを形成する。一部の実施形態では、この最小演算は対称的でなく、したがってΔij≦Δjiである。次いで、ノーマライザ436が、treediff関数の結果を集計する:Δ(G,H)=mean(d)またはΔ(G,H)=median(d)。実施形態によっては、後者の中央値による集計の方がより良好な結果を得られる場合がある。これは、恐らくは、その方が外れ値の影響を受けにくいためである(ノイズの多い画像に用いられるメディアンフィルタ(中央値フィルタ)と平均化フィルタの違いに似る)。
変形形態では、ツリー作成エンジン414でのクラスタリングにエッジ検出器(図示せず)が使用される。したがって、ウェーブレット変換エンジン408のローパス効果の後に、Cannyエッジフィルタ(図示せず)を通して画像を処理することができ、その結果得られるツリーはクラスタリングされている。Cannyエッジフィルタは、対象物が閉じた輪郭線の曲線で囲まれていることを担保としないので、この場合にHSTに使用される画像グラフは、ガウス平均化を用いてピクセル値の差分を計算することで作成することができる。これには、クラスタリングが、エッジの終点間にある小さな隙間をまたがないようにする効果がある。ツリー差分化エンジン422がこのようにCannyエッジフィルタを適用すると、その結果得られるHSTは、多くの状況で好適な結果をもたらす。
(典型的方法)
図6は、典型的な画像比較の方法600を示す。流れ図では、個々のブロックに動作が要約されている。典型的方法600は、ハードウェア、ソフトウェア、またはその両方の組合せによって行われることができ、例えば典型的な画像比較エンジン306の構成要素によって行われることができる。
ブロック602で、比較対象の各画像からグラフが作成される。他の画像との類似性または非類似性について画像をデジタル的に比較できるようにグラフで画像を表すことは、例えば画像中の隣接ピクセルの差の値でグラフの辺を重み付けすることにより、画像を構成するピクセルを確実に定量化することを伴う。画像がカラーの場合は、ピクセルのカラー成分を用いてグラフを作成することができ、または、カラー画像をグレースケール化して、ピクセルの各種の他のカラー以外の特性を用いてグラフを作成することができる。画像からグラフを作成するエンジン、例えば典型的な画像比較エンジン306は、比較のために、画像の信頼できる指標としてグラフを作る他の前処理構成要素を含んでよい。
画像からのグラフの作成は、係数ベクトル値を得るウェーブレット変換で容易にすることができる。画像を比較する目的で信頼できるグラフを生成する際の主要な要素の1つは、グラフから関連性のないノイズを除去することである。したがって、ウェーブレット変換の後に、重要でない値をゼロにすることにより、この方法が処理すべき情報の総量を減らすことができる。グラフの作成では、画像および/またはグラフを効率的なサイズに縮小することからも益を得られる場合がある。
ブロック604で、各グラフについてツリーファミリーが作成される。典型的方法600のこの部分では、比較される画像を表すグラフは、画像を定量化しているが、まだ、デジタル的に行うことができる数学的な比較技術に容易にかけることはできない。そのため、グラフを直接比較することを試みるのではなく、各グラフのメトリック(metrics:数的指標)がツリーファミリーに埋め込まれる。例えば階層完全分離ツリー(HST)は、デジタル的に効率よく行うことができる数学的比較技術に適している。したがって、画像がグラフになり、そのグラフが、関連付けられたツリーファミリーとなる。ツリーのクラスタとノードは、画像の数学的な比較を可能にし、すなわち、デジタル処理で操作することができ、比較のために画像の視覚的な品質に直接は依存しない形態での比較を可能にする。
ブロック606で、比較する2つの画像のツリーファミリーを互いから差分化して類似度を得る。すなわち、埋め込まれたグラフ情報を持つツリーファミリー同士を比較して、それらのツリーファミリーが表す画像の類似度を得る。一実施形態では、1つの画像を表すツリーファミリーは再帰的に作成されるので、ルートのHSTとそれに関連する子ツリーにツリー差分化技術を反復的に適用する。一実施形態では、差分化は、平均化の工程(または中央値を見つける工程)で1つの類似度で差分を要約できるように、差分行列を作成し、その行列をベクトル化することを含む。
本明細書に記載されるシステムおよび方法は、近似的な低い歪みでツリーのメトリックにグラフのメトリックを埋め込むことができる。メトリックを定義する一般的なグラフを考えると、ツリーのメトリックへの1回の埋め込みは、Ω(n)の歪みを有する(nはGの中の点の数)。しかし、グラフGと、埋め込みG→Tiを伴う(任意の2つの点を与えられた時にx,y∈Gとなるように)ツリーメトリックのファミリー{Ti}では、Tiを無作為に選択した場合のx,y→Tiの予想される歪みは、O(logn)になる。
(結論)
上記の主題は、ハードウェア、ソフトウェア、ファームウェア等、またはそれらの組合せとして実施することができる。特定の実施形態では、この主題は、コンピューティングデバイスや通信デバイスによって実行されるプログラムモジュール等のコンピュータ実行可能命令の一般的文脈で説明することができる。一般に、プログラムモジュールには、特定のタスクを行うか、特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造等が含まれる。この主題は、通信ネットワークを通じて接続された遠隔の処理デバイスにより無線通信を通じてタスクが行われる分散通信環境でも実施することができる。ワイヤレスネットワークでは、プログラムモジュールは、メモリ記憶装置を含む、ローカルおよびリモート両方の通信デバイスの記憶媒体に置くことができる。
上記の記述は、画像比較の典型的システムおよび方法を説明する。構造的特徴および/または方法論的動作に固有の術語で主題について説明したが、頭記の特許請求の範囲に定義される主題は、上記の具体的な特徴または動作に必ずしも限定されないことを理解されたい。上記で説明した具体的な特徴および動作は、特許請求の範囲を実施する例示的形態として開示されるものである。
画像を表す典型的なグラフの図である。 グラフメトリックが埋め込まれたツリーファミリーを差分化することを介した典型的な画像比較の図である。 典型的な画像比較システムの図である。 典型的な画像比較エンジンのブロック図である。 子ノードの集合の反復的な比較を介した典型的な画像比較の図である。 典型的な画像比較方法の流れ図である。

Claims (20)

  1. 第1の画像を第1のグラフとして表し、第2の画像を第2のグラフとして表すステップであって、前記第1および第2のグラフの各頂点は、前記それぞれの画像のピクセルに対応するステップと、
    各無向グラフの頂点間の各辺に重みを割り当てるステップであって、前記重みは、隣接するピクセル値間の差に対応するステップと、
    前記第1のグラフから第1のツリーファミリーを導出し、前記第2のグラフから第2のツリーファミリーを導出するステップであって、前記ツリーファミリーにはグラフメトリックが埋め込まれているステップと、
    前記第1のツリーファミリーと前記第2のツリーファミリー間の差分指標に基づいて、前記第1および前記第2の画像の差分指標を求めるステップと
    を含むことを特徴とする方法。
  2. 前記第1および第2の画像を第1および第2のグラフとして表すステップは、各画像をウェーブレット変換で処理するステップを含むことを特徴とする請求項1に記載の方法。
  3. 前記ウェーブレット変換は、3段階のハールウェーブレット変換からなることを特徴とする請求項2に記載の方法。
  4. 各画像を縮小して、前処理画像に生じるノイズを低減するステップをさらに備えることを特徴とする請求項2に記載の方法。
  5. 各画像を幅およそ70ピクセルに縮小して前処理画像を形成するステップをさらに備えることを特徴とする請求項2に記載の方法。
  6. ツリーファミリーを導出する前記ステップは、画像の再帰的、階層的なクラスタリング分解により階層完全分離ツリーのファミリーを導出するステップを含むことを特徴とする請求項1に記載の方法。
  7. 前記再帰的、階層的なクラスタリング分解は、
    前記前処理画像中のピクセルのクラスタ、前記ピクセルのクラスタ中の無作為のピクセル位置x、クラスタサイズr、および−r(logN)(logx)に等しい半径dを選択するステップであって、Nは、前記前処理画像中のピクセル数であるステップと、
    前記ピクセルのクラスタが区分されるまで前記ピクセルのクラスタの子クラスタを生成するステップであって、該生成するステップは、xからの連続した半径のところに子クラスタを再帰的に構築するステップを含み、各子クラスタは、1回前に得られたクラスタを、現在の半径にあるクラスタで割った比に設定されるステップと
    を含むことを特徴とする請求項6に記載の方法。
  8. 前記第1のツリーファミリーと前記第2のツリーファミリー間の差分を求めるステップは、
    前記第1のツリーファミリーと前記第2のツリーファミリーのトポロジィ(接続形態)を比較するステップ、および、
    前記第1および第2のファミリーのツリーノードに関連付けられたクラスタのトポロジィを比較するステップ
    を含むことを特徴とする請求項1に記載の方法。
  9. 前記第1のツリーファミリーと前記第2のツリーファミリー間の差分を求めるステップは、前記第1のツリーファミリーおよび前記第2のツリーファミリーの各ノードに関連付けられたクラスタの凸閉包を計算してそのノードの形状パラメータを得、各ノードに関連付けられた前記クラスタの位置を前記形状パラメータと連結することにより、前記ノードに形状ベクトルを割り当て、前記第1および第2のツリーファミリーそれぞれの子ノードの集合についての前記形状ベクトル間の差分を最小にする差分指標を見つけるステップを含むことを特徴とする請求項1に記載の方法。
  10. 前記形状ベクトルの最小化差分のベクトルを形成し、前記ベクトルの成分を正規化することにより、前記ツリーのノードに対して差分を集計するステップをさらに含むことを特徴とする請求項9に記載の方法。
  11. 前記第1の画像と画像の集合の要素に対して前記方法を連続的に繰り返して、前記第1の画像との類似度が最も高い前記集合の要素を見つけるステップをさらに含むことを特徴とする請求項1に記載の方法。
  12. コンピューティングデバイスによって実行される、請求項1に記載の方法を実施するための複数の実行可能命令を備えることを特徴とする記憶媒体。
  13. 対応する画像から無向グラフを導出する画像グラフ化エンジンであって、前記無向グラフの頂点は、前記画像中のピクセルに対応する画像グラフ化エンジンと、
    各前記無向グラフからツリーのファミリーを導出するツリー作成エンジンと、
    前記ツリーファミリーの対応ノード間の最小差分を求めるツリー差分化エンジンと、
    前記ツリーファミリー間の差分行列を作成するアグリゲータと、
    前記差分行列から2つの画像についての類似度を導出するベクトルエンジンと
    を備えることを特徴とする画像比較エンジン。
  14. 前記画像グラフ化エンジンは、
    カラー画像を前処理するグレースケーラと、
    ピクセルの係数ベクトル値を求めるウェーブレット変換エンジンと、
    画像サイズを縮小し、ノイズを低減するダウンスケーラと
    を含むことを特徴とする請求項13に記載の画像比較エンジン。
  15. 前記ツリー作成エンジンはさらに、無向グラフで表された画像を十分に分離されたクラスタに区分するクラスタリカーサ(recurser)を含むことを特徴とする請求項13に記載の画像比較エンジン。
  16. 前記ツリー作成エンジンはさらに、所有するノード数が閾値未満である対応クラスタに関連付けられたツリーノードを除去するツリープルーナ(pruner)を含むことを特徴とする請求項13に記載の画像比較エンジン。
  17. 前記ツリー作成エンジンはさらに、ツリーのノード数が閾値未満である場合に前記画像グラフ化エンジンから画像を再開始する再実行フィルタを含むことを特徴とする請求項13に記載の画像比較エンジン。
  18. 前記ツリー差分化エンジンはさらに、ツリートポロジィコンパレータとクラスタトポロジィコンパレータとを含む最小差分エンジンを有することを特徴とする請求項13に記載の画像比較エンジン。
  19. 対応する画像からグラフを導出する手段と、
    各前記グラフからツリーのファミリーを導出する手段と、
    2つの異なる画像の前記ツリーファミリー間の最小差分を求める手段と
    を備えることを特徴とするシステム。
  20. 画像を選択する手段と、
    前記ツリーファミリー間の前記最小差分に基づいて、前記画像の集合から前記選択された画像に最も類似する画像を見つける手段と
    をさらに備えることを特徴とする請求項19に記載のシステム。
JP2008514653A 2005-05-31 2006-04-27 メトリック埋め込みによる画像比較 Pending JP2008542911A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/141,362 US7536064B2 (en) 2005-05-31 2005-05-31 Image comparison by metric embeddings
PCT/US2006/016609 WO2006130292A2 (en) 2005-05-31 2006-04-27 Image comparison by metric embeddings

Publications (2)

Publication Number Publication Date
JP2008542911A true JP2008542911A (ja) 2008-11-27
JP2008542911A5 JP2008542911A5 (ja) 2009-07-09

Family

ID=37463452

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008514653A Pending JP2008542911A (ja) 2005-05-31 2006-04-27 メトリック埋め込みによる画像比較

Country Status (9)

Country Link
US (1) US7536064B2 (ja)
EP (1) EP1886256A2 (ja)
JP (1) JP2008542911A (ja)
KR (1) KR101183391B1 (ja)
CN (1) CN101194272A (ja)
BR (1) BRPI0610739A2 (ja)
IL (1) IL186757A0 (ja)
RU (1) RU2007144501A (ja)
WO (1) WO2006130292A2 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8990198B2 (en) * 2006-11-02 2015-03-24 Ilan Cohn Method and system for computerized management of related data records
US8452108B2 (en) * 2008-06-25 2013-05-28 Gannon Technologies Group Llc Systems and methods for image recognition using graph-based pattern matching
JP2011517358A (ja) * 2009-04-22 2011-06-02 ペキン ユニバーシティ 対話型多ラベル付け画像分割のための連結性類似度に基づくグラフ学習法
US9380292B2 (en) * 2009-07-31 2016-06-28 3Dmedia Corporation Methods, systems, and computer-readable storage media for generating three-dimensional (3D) images of a scene
US8488873B2 (en) * 2009-10-07 2013-07-16 Apple Inc. Method of computing global-to-local metrics for recognition
US8630509B2 (en) * 2009-11-03 2014-01-14 Samsung Electronics Co., Ltd. Structured grids for label propagation on a finite number of layers
WO2011106440A1 (en) * 2010-02-23 2011-09-01 Loma Linda University Medical Center Method of analyzing a medical image
CN101882305B (zh) * 2010-06-30 2014-02-05 中山大学 一种图像增强处理的方法
KR101348904B1 (ko) * 2012-01-20 2014-01-09 한국과학기술원 고차 상관 클러스터링을 이용한 이미지 분할 방법, 이를 처리하는 시스템 및 기록매체
US20130155327A1 (en) * 2012-02-01 2013-06-20 Geoffrey Louis Barrows Method to Process Image Sequences with Sub-Pixel Displacements
CN103559705B (zh) * 2013-10-23 2017-02-22 浙江工业大学 一种比较不同植物形态相似度的计算机方法
US9830567B2 (en) 2013-10-25 2017-11-28 Location Labs, Inc. Task management system and method
US10542961B2 (en) 2015-06-15 2020-01-28 The Research Foundation For The State University Of New York System and method for infrasonic cardiac monitoring
US10762283B2 (en) * 2015-11-20 2020-09-01 Adobe Inc. Multimedia document summarization
US11064219B2 (en) * 2018-12-03 2021-07-13 Cloudinary Ltd. Image format, systems and methods of implementation thereof, and image processing
CN111814781A (zh) * 2019-04-11 2020-10-23 富士通株式会社 用于对图像块识别结果进行校正的方法、设备和存储介质
US11295483B1 (en) * 2020-10-01 2022-04-05 Bank Of America Corporation System for immersive deep learning in a virtual reality environment

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001005976A (ja) * 1999-06-04 2001-01-12 Mitsubishi Electric Inf Technol Center America Inc オブジェクト表面を探索する画像空間を順序付ける方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3141004B2 (ja) * 1998-08-31 2001-03-05 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 動画中のオブジェクトを分類する方法
US6636849B1 (en) * 1999-11-23 2003-10-21 Genmetrics, Inc. Data search employing metric spaces, multigrid indexes, and B-grid trees
US7120297B2 (en) * 2002-04-25 2006-10-10 Microsoft Corporation Segmented layered image system
US7298931B2 (en) 2002-10-14 2007-11-20 Samsung Electronics Co., Ltd. Image retrieval method and apparatus using iterative matching
GB0226787D0 (en) * 2002-11-18 2002-12-24 Qinetiq Ltd Measurement of mitotic activity

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001005976A (ja) * 1999-06-04 2001-01-12 Mitsubishi Electric Inf Technol Center America Inc オブジェクト表面を探索する画像空間を順序付ける方法
US6400846B1 (en) * 1999-06-04 2002-06-04 Mitsubishi Electric Research Laboratories, Inc. Method for ordering image spaces to search for object surfaces

Also Published As

Publication number Publication date
KR20080021592A (ko) 2008-03-07
RU2007144501A (ru) 2009-06-10
US20060269167A1 (en) 2006-11-30
IL186757A0 (en) 2008-04-13
KR101183391B1 (ko) 2012-09-14
WO2006130292A3 (en) 2007-12-21
WO2006130292A2 (en) 2006-12-07
CN101194272A (zh) 2008-06-04
US7536064B2 (en) 2009-05-19
EP1886256A2 (en) 2008-02-13
BRPI0610739A2 (pt) 2010-07-20

Similar Documents

Publication Publication Date Title
JP2008542911A (ja) メトリック埋め込みによる画像比較
JP5506785B2 (ja) 勾配ヒストグラムを用いた指紋表現
US8712154B2 (en) Image processing system and method
CN110088805B (zh) 用于检测和分割多个前景对象的方法
JP6341650B2 (ja) 画像処理装置、画像処理方法及びプログラム
CN110807757B (zh) 基于人工智能的图像质量评估方法、装置及计算机设备
JP2006338313A (ja) 類似画像検索方法,類似画像検索システム,類似画像検索プログラム及び記録媒体
JP2013206187A (ja) 情報変換装置、情報検索装置、情報変換方法、情報検索方法、情報変換プログラム、情報検索プログラム
CN112101364A (zh) 基于参数重要性增量学习的语义分割方法
CN113971644A (zh) 基于数据增强策略选择的图像识别方法及装置
CN114332500A (zh) 图像处理模型训练方法、装置、计算机设备和存储介质
US8611695B1 (en) Large scale patch search
Kharinov Model of the quasi-optimal hierarchical segmentation of a color image
CN107193979B (zh) 一种同源图片检索的方法
CN113792659A (zh) 文档识别方法、装置及电子设备
JP5890340B2 (ja) 画像分類装置及び画像分類プログラム
CN110598727B (zh) 基于迁移学习的模型构建方法、图像识别方法及其装置
CN116543259A (zh) 一种深度分类网络噪声标签建模与纠正方法、***及存储介质
CN111091580A (zh) 一种基于改进ResNet-UNet网络的立木图像分割方法
CN116051924A (zh) 一种图像对抗样本的分治防御方法
CN113139577B (zh) 一种基于可变形卷积网络的深度学习图像分类方法及***
KR102526415B1 (ko) 준지도 학습 방식의 단일 영상 깊이 추정 시스템 및 방법과 이를 위한 컴퓨터 프로그램
CN111695526B (zh) 网络模型生成方法、行人重识别方法及装置
CN114329024A (zh) 一种iconfont图标搜索方法和***
CN113947195A (zh) 模型确定方法、装置、电子设备和存储器

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090324

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090324

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090520

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110527

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111021