JP4394399B2 - 画像解析装置、画像解析プログラム、記憶媒体および画像解析方法 - Google Patents

画像解析装置、画像解析プログラム、記憶媒体および画像解析方法 Download PDF

Info

Publication number
JP4394399B2
JP4394399B2 JP2003304543A JP2003304543A JP4394399B2 JP 4394399 B2 JP4394399 B2 JP 4394399B2 JP 2003304543 A JP2003304543 A JP 2003304543A JP 2003304543 A JP2003304543 A JP 2003304543A JP 4394399 B2 JP4394399 B2 JP 4394399B2
Authority
JP
Japan
Prior art keywords
region
predetermined
image analysis
function
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003304543A
Other languages
English (en)
Other versions
JP2005078149A (ja
Inventor
聖司 石原
利夫 宮澤
優 関口
学平 劉
高志 齋藤
史裕 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2003304543A priority Critical patent/JP4394399B2/ja
Publication of JP2005078149A publication Critical patent/JP2005078149A/ja
Application granted granted Critical
Publication of JP4394399B2 publication Critical patent/JP4394399B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、画像解析装置、画像解析プログラム、記憶媒体および画像解析方法に関する。
テクスチャ画像を対象とする領域分割については、従来から広く研究がなされている。その多くは、共起行列、マルコフ確率場(Markov Random Field:MRF)やフーリエ変換等に基づく統計的アプローチによるものである。この種のアプローチに基づく領域分割の主要な目的の一つは、テクスチャ画像を一様性の評価の下に自由度の高い領域形状で分割することである。
このような一様性の評価に際しては、テクスチャ解析を行う画素の範囲の扱いが一つの大きな焦点となる。より詳細には、画像処理の目的によっては、局所的なテクスチャ特徴に基づいて画像をいくつもの微小な領域に分割するよりも、大域的な特徴量を使っていくつかの大きな領域にまとめた方が望ましい場合が考えられる。例えば柄物のシャツなど、何らかのテクスチャによって構成されるテクスチャ特徴優位なオブジェクトを精度良く切出すような場合である。このような場合に、オブジェクトに相当する領域の内部を細かく分割して解析精度を向上させると、領域境界にひずみが生じてしまう。つまり、テクスチャ解析を行う画素の範囲を広げることによる解析精度の向上と領域境界のひずみとのトレードオフが問題となる。
この種の問題への対処法として、非特許文献1には、一様範囲の推定によって解析の範囲を可変とする方法が提案されている。
内山俊郎,武川直樹,中村太一,金子博,"一様範囲の推定を用いたテクスチャ画像の領域分割,"信学論(D−II),vol.J83−D−II,pp.1446−1459,2000.
しかしながら、非特許文献1に提案されている方法は、濃度値に対する2次のMRFに基づいて特徴をとらえる方法のため、処理の対象は比較的短い周期のテクスチャに限られる。
また、近年においては、濃度値の変動特徴を空間−周波数領域において多様なスケールで効率的にとらえることのできる手段として、ウェーブレットによる多重解像度解析が注目されている。特に、テクスチャ特徴に対するシフト不変な解析手段としてウェーブレットフレームが盛んに取り上げられている。ただし,多様なスケールによって特徴付けられる大域的なテクスチャ特徴をとらえるには、それに相当する範囲の領域を解析する必要がある。
本発明は、解析精度が高く境界のひずみも少ないオブジェクト切出しを行うことができる画像解析装置、画像解析プログラム、記憶媒体および画像解析方法を提供することを目的とする。
本発明の画像解析装置は、画像を所定の領域に分割する領域分割手段と、この領域分割手段により分割された前記領域ごとにウェーブレットフレームによる多重解像度解析を所定のレベルまで繰り返し実行する多重解像度解析手段と、この多重解像度解析手段によって得られるウェーブレット係数から所定の特徴量を抽出する特徴抽出手段と、この特徴抽出手段により抽出された前記特徴量に基づいて前記領域ごとにラベルを設定する領域ラベル設定手段と、所定の領域における所定の特徴量をクラスタ中心として前記各領域をクラスタリングするクラスタリング手段と、前記所定の領域および前記クラスタリングによって得られる所定のクラスタから成る領域とその周辺の領域との境界形状を所定の基準に従って最適化する領域境界最適化手段と、を具備する。
また本発明は、前記画像解析装置において、前記領域分割手段、前記多重解像度解析手段、前記特徴抽出手段並びに前記領域ラベル設定手段を、所定の終了条件が満たされるまで再帰的に実行する。
また本発明は、前記画像解析装置において、前記領域分割手段、前記多重解像度解析手段、前記特徴抽出手段並びに前記クラスタリング手段を、所定の終了条件が満たされるまで再帰的に実行する。
また本発明は、前記何れか一記載の画像解析装置において、前記領域分割手段は、対象とする画像を所定の大きさで所定の数の矩形領域に分割する。
また本発明は、前記何れか一記載の画像解析装置において、前記領域ラベル設定手段は、近傍領域間の特徴量に関する所定の類似度に応じて所定のラベルを付与する。
また本発明は、前記何れか一記載の画像解析装置において、前記領域境界最適化手段は、前記領域とその周辺の領域とにマルコフ確率場モデルをそれぞれ導入し、当該モデルに基づく当該領域の尤度が最大となる境界を探索する。
また本発明は、前記何れか一記載の画像解析装置において、前記特徴抽出手段は、所定の各分解レベルから所定の成分毎に求めた平均エネルギーの各々を要素とするベクトルを特徴量とする。
また本発明の画像解析プログラムは、コンピュータにインストールされ、画像を所定の領域に分割する領域分割機能と、この領域分割機能により分割された前記領域ごとにウェーブレットフレームによる多重解像度解析を所定のレベルまで繰り返し実行する多重解像度解析機能と、この多重解像度解析機能によって得られるウェーブレット係数から所定の特徴量を抽出する特徴抽出機能と、この特徴抽出機能により抽出された前記特徴量に基づいて前記領域ごとにラベルを設定する領域ラベル設定機能と、所定の領域における所定の特徴量をクラスタ中心として前記各領域をクラスタリングするクラスタリング機能と、前記所定の領域および前記クラスタリングによって得られる所定のクラスタから成る領域とその周辺の領域との境界形状を所定の基準に従って最適化する領域境界最適化機能と、をコンピュータに実行させる。
また本発明は、前記画像解析プログラムにおいて、前記領域分割機能、前記多重解像度解析機能、前記特徴抽出機能並びに前記領域ラベル設定機能を、所定の終了条件が満たされるまで再帰的にコンピュータに実行させる。
また本発明は、前記画像解析プログラムにおいて、前記領域分割機能、前記多重解像度解析機能、前記特徴抽出機能並びに前記クラスタリング機能を、所定の終了条件が満たされるまで再帰的にコンピュータに実行させる。
また本発明の記憶媒体は、前記いずれか一記載の画像解析プログラムを記憶する。
また本発明の画像解析方法は、画像を所定の領域に分割する領域分割ステップと、この領域分割ステップにより分割された前記領域ごとにウェーブレットフレームによる多重解像度解析を所定のレベルまで繰り返し実行する多重解像度解析ステップと、この多重解像度解析ステップによって得られるウェーブレット係数から所定の特徴量を抽出する特徴抽出ステップと、この特徴抽出ステップにより抽出された前記特徴量に基づいて前記領域ごとにラベルを設定する領域ラベル設定ステップと、所定の領域における所定の特徴量をクラスタ中心として前記各領域をクラスタリングするクラスタリングステップと、前記所定の領域および前記クラスタリングによって得られる所定のクラスタから成る領域とその周辺の領域との境界形状を所定の基準に従って最適化する領域境界最適化ステップと、を具備する。
また本発明は、前記画像解析方法において、前記領域分割ステップ、前記多重解像度解析ステップ、前記特徴抽出ステップ並びに前記領域ラベル設定ステップを、所定の終了条件が満たされるまで再帰的に実行する。
また本発明は、前記画像解析方法において、前記領域分割ステップ、前記多重解像度解析ステップ、前記特徴抽出ステップ並びに前記クラスタリングステップを、所定の終了条件が満たされるまで再帰的に実行する。
また本発明は、前記何れか一記載の画像解析方法において、前記領域分割ステップは、対象とする画像を所定の大きさで所定の数の矩形領域に分割する。
また本発明は、前記何れか一記載の画像解析方法において、前記領域ラベル設定ステップは、近傍領域間の特徴量に関する所定の類似度に応じて所定のラベルを付与する。
また本発明は、前記何れか一記載の画像解析方法において、前記領域境界最適化ステップは、前記領域とその周辺の領域とにマルコフ確率場モデルをそれぞれ導入し、当該モデルに基づく当該領域の尤度が最大となる境界を探索する。
また本発明は、前記何れか一記載の画像解析方法において、前記特徴抽出ステップは、所定の各分解レベルから所定の成分毎に求めた平均エネルギーの各々を要素とするベクトルを特徴量とする。
本発明によれば、ウェーブレットフレームを用いた多様なスケールでの空間−周波数解析に基づく粗い領域分割の後、領域境界の最適化を行うことによって、解析精度が高く境界のひずみも少ないオブジェクト切出しを行うことができる。
本発明の実施の一形態を図1ないし図6に基づいて説明する。
図1は、本発明が適用される画像解析装置1のハードウェア構成を概略的に示すブロック図である。図1に示すように、画像解析装置1は、例えばパーソナルコンピュータやワークステーションであり、コンピュータの主要部であって各部を集中的に制御するCPU(Central Processing Unit)2を備えている。このCPU2には、BIOSなどを記憶した読出し専用メモリであるROM(Read Only Memory)3と、各種データを書換え可能に記憶するRAM(Random Access Memory)4とがバス5で接続されている。RAM4は、各種データを書換え可能に記憶する性質を有していることから、CPU2の作業エリアとして機能し、例えば入力バッファ等の役割を果たす。
さらにバス5には、外部記憶装置であるHDD(Hard Disk Drive)6と、配布されたプログラムであるコンピュータプログラムを読み取るための機構としてCD(Compact Disc)−ROM7を読み取るCD−ROMドライブ8と、画像解析装置1とネットワーク9との通信を司る通信制御装置10と、入力手段として機能するキーボードやマウスなどの入力装置11と、CRT(Cathode Ray Tube)、LCD(Liquid Crystal Display)などの表示装置12とが、図示しないI/Oを介して接続されている。HDD6には、各種の情報が、コンピュータ上のファイルシステム構造におけるファイルやフォルダなどの形式で記憶されている。
図1に示すCD−ROM7は、この発明の記憶媒体を実施するものであり、Windows(登録商標)などのOS(Operating System)や各種コンピュータプログラムが記憶されている。CPU2は、CD−ROM7に記憶されているコンピュータプログラムをCD−ROMドライブ8で読み取り、HDD6にインストールする。
なお、記憶媒体としては、CD−ROM7のみならず、DVDなどの各種の光ディスク、各種光磁気ディスク、フレキシブル・ディスクなどの各種磁気ディスク等、半導体メモリ等の各種方式のメディアを用いることができる。また、通信制御装置10を介してインターネットなどのネットワーク9からコンピュータプログラムをダウンロードし、HDD6にインストールするようにしてもよい。この場合に、送信側のサーバでコンピュータプログラムを記憶している記憶装置も、この発明の記憶媒体である。なお、コンピュータプログラムは、所定のOS(Operating System)上で動作するものであってもよいし、その場合に後述の各種処理の一部の実行をOSに肩代わりさせるものであってもよいし、所定のアプリケーションソフトやOSなどを構成する一群のプログラムファイルの一部として含まれているものであってもよい。
このシステム全体の動作を制御するCPU2は、このシステムの主記憶として使用されるHDD6上にロードされたコンピュータプログラムに基づいて各種処理を実行する。
次に、画像解析装置1のCPU2がコンピュータプログラムに基づいて実行する演算処理の内容について説明する。ここでは、画像解析装置1のCPU2が実行する各種の演算処理のうち、本実施の形態の特長的な処理について以下に説明する。
図2は、画像解析装置1が実行する処理を概略的に示すフローチャートである。図2に示すように、画像解析装置1のCPU2は、まず、カウンタnを0に初期化する(ステップS1)。
次に、解析対象とする画像(原画像)を所定の大きさで所定の矩形領域(以降、タイルと呼ぶ)に分割する(ステップS2)。例えば、原画像を(2n+1個のタイルに等分割する方法などが考えられる。
次に、タイル毎に、所定の分解レベルまでウェーブレットフレーム分解を実行する(ステップS3)。ウェーブレットフレーム分解の最も簡単な実施法は、ウェーブレット分解におけるダウンサンプリングを省略することである。また、分解レベルの限度は、対象とするタイルの大きさを考慮して決めれば良い。
続いて、タイル毎に特徴ベクトルの抽出を行う(ステップS4)。ステップS3のウェーブレットフレーム分解により、分解レベル毎に、LL成分、HL成分、LH成分そしてHH成分の4種類にそれぞれ対応する係数値がタイルの画素数と同数ずつ得られる。ここで、Lは低域、Hは高域を表すアルファベットである。また、これらが二つ並んだ場合には、前に位置するアルファベットが水平方向、後に位置するアルファベットが垂直方向に対応するものとする。特徴ベクトルの要素には、各成分の平均エネルギーなどを採用すれば良い。なお、必ずしもすべての分解レベルやすべての成分を特徴ベクトルの要素に採用する必要はない。例えば、微細な周期的変動による影響を抑制したい場合には、周期の短いフレームを用いる分解レベルの成分を使用しない方法もある。また、低域成分のエネルギーが高くなりすぎてしまう場合には、各分解レベルのLL成分を使用しないことも考えられる。
次に、カウンタnと繰り返し回数の上限Mを比較する(ステップS5)。カウンタnが繰り返し回数の上限Mに達していないときは(ステップS5のY)、ステップS4にて抽出した特徴ベクトルに基づいて各タイルのラベルを設定する領域ラベル設定処理を行う(ステップS6)。
ここで、ステップS6における領域ラベル設定処理について説明する。図3は、領域ラベル設定処理を概略的に示すフローチャートである。図3に示すように、まず、画像内におけるタイルの位置を表す変数kおよび変数lをそれぞれ0に初期化すると共に、すべてのタイルにラベルの初期値として0を付与する(ステップS21)。そして、カウンタjに0を代入する(ステップS22)。
次に、タイル(k,l)とその近傍に位置するタイル(k+τ,l+τ)(j=0,1,・・・,J−1)との間の誤差dを算出する(ステップS23)。ここで、Jは近傍タイルの数を表す。誤差dの値としては、各タイルの特徴ベクトル同士の二乗誤差等を用いれば良い。また、近傍タイルの範囲は、設計者が任意で設定する。
その後、誤差dと所定の閾値Dを比較する(ステップS24)。誤差dが閾値Dに達しているときは(ステップS24のN)、ステップS26に進む。一方、誤差dが閾値Dに達していないときは(ステップS24のY)、タイル(k,l)と近傍タイル(k+τ,l+τ)とに同一のラベルを新たに付与する(ステップS25)。具体的には、例えば、以下に示すような条件(1)〜(4)にしたがってラベルの値を対応させれば良い。ここで、タイル(k,l)におけるラベルの値を、s(k,l)と表すことにする。
(1) s(k,l)=0、s(k+τ,l+τ)=0であるとき、双方に新規のラベルを与える。
(2) s(k,l)=0、s(k+τ,l+τ)≠0であるとき、s(k,l)←s(k+τ,l+τ)とする。
(3) s(k,l)≠0、s(k+τ,l+τ)=0であるとき、s(k+τ,l+τ)←s(k,l)とする。
(4) s(k,l)≠0、s(k+τ,l+τ)≠0であるとき、s(k+τ,l+τ)との間の誤差が他のいずれの近傍タイルとの間の誤差よりも低い場合、s(k,l)←s(k+τ,l+τ)とする。
なお、前記(4)の場合には、ラベル変更前のs(k,l)と同じ値をもつ他のタイルについても、s(k,l)の変更に伴ってラベルの値を変えることが考えられる。具体的には、そのようなタイルのうち、s(k+τ,l+τ)と同じ値をもつタイルが近傍に存在し、そのタイルとの誤差が他のいずれの近傍タイルとの誤差より低いもののラベルを再帰的に変更していく方法などが挙げられる。
ステップS26では、カウンタjと近傍タイルの数Jを比較する。カウンタjが近傍タイルの数Jに達していないときは(ステップS26のY)、カウンタjを1インクリメントして(ステップS27)、ステップS23以降の処理を繰り返す。一方、カウンタjが近傍タイルの数Jに達しているときは(ステップS26のN)、ステップS28に進む。
ステップS28では、変数kと水平方向のタイル数Kを比較する。変数kが水平方向のタイル数Kに達していないときは(ステップS28のY)、変数kを1インクリメントして(ステップS29)、ステップS22以降の処理を繰り返す。一方、変数kが水平方向のタイル数Kに達しているときは(ステップS28のN)、ステップS30に進む。
ステップS30では、変数lと垂直方向のタイル数Lを比較する。変数lが垂直方向のタイル数Lに達していないときは(ステップS30のY)、変数kに0を代入すると共に変数lを1インクリメントして(ステップS31)、ステップS22以降の処理を繰り返す。一方、変数lが垂直方向のタイル数Lに達しているときは(ステップS30のN)、領域ラベル設定処理を終了する。
このようにして領域ラベル設定処理(ステップS6)を終了すると、カウンタnを1インクリメントして(ステップS7)、ステップS2以降の処理を繰り返す。
一方、カウンタnが繰り返し回数の上限Mに達したときは(ステップS5のN)、ステップS8に進む。
ステップS8では、カウンタnと繰り返し回数の上限Mの異同を判定する。カウンタnと繰り返し回数の上限Mが等しいときは(ステップS8のY)、所定の領域(以降、選択領域と呼ぶ)を選択し(ステップS9)、ステップS11以降のクラスタリングを行う処理に進む。選択領域については、オブジェクト等の切り出したい領域に合致した領域ラベルを選択すれば良い。例えば、あらかじめ画像の重心付近に存在することがわかっているテクスチャ特徴優位なオブジェクトの切り出しを目的とする場合には、画像の重心に相当する座標に近い所定の領域のラベルを選択する方法が考えられる。
一方、カウンタnと繰り返し回数の上限Mが異なるときは(ステップS8のN)、ステップS10に進む。ステップS10では、カウンタnと繰り返し回数の上限Nを比較する。カウンタnが繰り返し回数の上限Nに達していないときは(ステップS10のY)、選択領域内の特徴ベクトルからクラスタ中心を設定する(ステップS11)。なお、クラスタ中心の設定は、k-meansアルゴリズムやLBGアルゴリズムなどに基づいて行えば良い。また、クラスタ中心の数は任意である。
続いて、全タイルを対象にクラスタリング処理を行い(ステップS12)、カウンタnを1インクリメントして(ステップS7)、ステップS2以降の処理を繰り返す。
ここで、ステップS12におけるクラスタリング処理について説明する。図4は、部分空間法を用いたクラスタリング処理を概略的に示すフローチャートである。なお、当該クラスタリングの処理については、LBGアルゴリズムなど他の方法を用いても良い。図4に示すように、まず、選択領域内のクラスタを表す変数c、タイルの配置を表す変数kおよび変数lをそれぞれ0に初期化する(ステップS41)。
次に、選択領域のクラスタcについて、その固有値と固有ベクトルを求め、所定の上位固有値に対応する固有ベクトルによって部分空間を定める(ステップS42)。
その後、当該部分空間に基づいて、タイル(k,l)の特徴ベクトルとクラスタcとの適合度rを測る(ステップS43)。具体的には、当該部分空間を構成する固有ベクトルと当該特徴ベクトルとの内積を求めれば良い。なお、タイル(k,l)が選択領域に含まれる場合、ステップS43の処理をスキップしても良い。
適合度rを算出後、その値を所定の閾値Rと比較する(ステップS44)。適合度rが閾値Rに達しているときは(ステップS44のY)、タイル(k,l)を、選択領域との類似性が高いタイル(以降、類似領域候補タイルと呼ぶ)であると判定し(ステップS45)、ステップS46に進む。一方、適合度rが閾値Rに達していないときは(ステップS44のN)、そのままステップS46に進む。
ステップS46では、変数kと水平方向のタイル数Kを比較する。変数kと水平方向のタイル数Kとの比較の結果、変数kが水平方向のタイル数Kに達していないときは(ステップS46のY)、変数kを1インクリメントして(ステップS47)、ステップS42以降の処理を繰り返す。一方、変数kが水平方向のタイル数Kに達しているときは(ステップS46のN)、ステップS48に進む。
ステップS48では、変数lと垂直方向のタイル数Lを比較する。変数lが垂直方向のタイル数Lに達していないときは(ステップS48のY)、変数kに0を代入すると共に変数lを1インクリメントして(ステップS49)、ステップS42以降の処理を繰り返す。変数lが垂直方向のタイル数Lに達しているときは(ステップS48のN)、ステップS50に進む。
ステップS50では、変数cとクラスタ数の上限Cを比較する。クラスタ数の上限Cの値は、設計者があらかじめ定める。変数cがクラスタ数の上限Cに達していないときは(ステップS50のY)、変数cを1インクリメントして(ステップS51)、ステップS42以降の処理を繰り返す。
一方、変数cがクラスタ数の上限Cに達しているときは(ステップS50のN)、抽出された類似領域候補タイルのうち、選択領域に直接もしくは間接的に隣接するものの集合を類似領域として設定する(ステップS52)。ここで、間接的に隣接するとは、類似領域となるタイルを伝って選択領域に至ることができることを指す。ステップS52の処理は、領域の空間的連続性を保存するために画像空間上で離れた位置にあるタイルを類似領域から除外するためのものであり、選択領域のタイルから隣接する類似領域候補タイルを再帰的に辿っていくことで容易に実行できる。
このようにクラスタリング処理においては、ステップS11で設定したクラスタ中心に基づいて選択領域内で部分空間を構成し、全タイルについて、各部分空間との適合度rを測り、選択領域外のタイルのうち、適合度rの値が閾値を上回るものを類似領域とする。ただし、選択領域に隣接しないタイルは除く。なお、類似領域となるタイルを伝って選択領域に至ることができるタイルは、選択領域に隣接するとみなす。
以上により、ステップS12におけるクラスタリング処理が終了する。
一方、カウンタnが繰り返し回数の上限Nに達しているときは(ステップS10のN)、ステップS13に進む。ステップS13では、選択領域およびステップS12のクラスタリング処理の結果から得られる所定のクラスタから成る領域(以降、類似領域と呼ぶ、また、選択領域と類似領域を合わせて中心領域と呼ぶ)と、その周辺の所定の領域(以降、周辺領域と呼ぶ)との境界を、必要に応じて変形し最適化する。
ここで、ステップS13における尤度関数を用いた領域境界最適化の処理について説明する。図5は、尤度関数を用いた領域境界最適化の処理を概略的に示すフローチャートである。なお、尤度関数の計算には、ガウスマルコフ確率場モデル(ガウシアンMRF(GaussianMRF:GMRF)モデル)を使用する。図5に示すように、まず、中心領域の画素(u,v)((u,v)∈中心領域、i=0,1,・・・,Mc−1)に対応する変数e(u,v)を1に、所定の周辺領域の画素(s,t)((s,t)∈中心領域、j=0,1,・・・,Ma−1)に対応する変数e(s,t)を−1に初期化する(ステップS61)。なお、周辺領域は、中心領域に直接もしくは間接的に隣接する任意のタイルによって構成すれば良い。
次に、変数e'(x,y)にe(x,y)(e(x,y)=1またはe(x,y)=−1、h=0,1,・・・,Mc+Ma−1)の値を代入し、e(x,y)=1となる領域の尤度をp1に、e(x,y)=−1となる領域の尤度をp−1にそれぞれ代入する。さらに、変数m、変数wにそれぞれ0を代入する。(ステップS62)。
その後、画素(x,y)が中心領域と周辺領域の境界に該当するか否かをe(x,y)の値に基づいて調べる(ステップS63)。具体的には、e(x,y)が近傍のe(x+δ,y+δ)(i=0,1,・・・,I)と異なるとき、画素(x,y)を境界と判定すれば良い。ここで、Iは近傍画素の数を表す。なお、近傍画素については、4近傍や8近傍を考えれば良い。
画素(x,y)を境界と判定したときは(ステップS63のY)、e'(x,y)に−e'(x,y)を代入し(ステップS64)、ステップS65に進む。一方、画素(x,y)を境界でないと判定したときは(ステップS63のN)、ステップS69に進む。
ステップS65では、e'(x,y)=1となる領域の尤度をp'に、e'(x,y)=−1となる領域の尤度をp'−1にそれぞれ代入する。
次に、p'p'−1の値を、p−1の値と比較する(ステップS66)。p'p'−1がp−1より大きいときは(ステップS66のY)、e(x,y)に−e(x,y)を代入すると共にwに1を代入し(ステップS67)、ステップS68に進む。一方、p'p'−1がp−1以下であるときは(ステップS66のN)、そのままステップS68に進む。
ステップS68では、e'(x,y)に−e'(x,y)を代入する。
ステップS69では、変数mを、中心領域の画素数Mcと周辺領域の画素数Maの合計と比較する。変数mがMc+Maに達していないときは(ステップS69のY)、変数mを1インクリメントして(ステップS70)、ステップS63以降の処理を繰り返す。一方、変数mがMc+Maに達しているときは(ステップS69のN)、ステップS71に進む。
ステップS71では、変数wと変数lの異同を判定する。変数wが変数lに等しいときは(ステップS71のY)、ステップS62以降の処理を繰り返す。一方、変数wが変数lでないときは(ステップs71のN)、処理を終了する。
このように空間−周波数領域において、中心領域の各クラスタおよび周辺領域の各クラスタそれぞれにガウスマルコフ確率場モデル(ガウシアンMRF(GaussianMRF:GMRF)モデル)をあてはめ、中心領域の境界画素に対するラベルを最適化する。つまり、画像のウェーブレット係数を確率過程とみなした上で各境界画素について、各モデルパラメータに基づく確率を求め、それが最大となるモデルに対応する領域ラベルを付与する処理を繰り返し行うことで、領域境界の最適化を行う。
ここで、図6はウェーブレットフレームを用いた注目テクスチャ切出しの一例を示す説明図である。ここでは、図6(a)のサンプル画像に対して、シャツのオブジェクトを切出すことを想定し、上述した処理を実行した。選択領域については、画像の重心に相当する座標に最も近い領域のラベルを選んだ。特徴ベクトルの要素には、空間−周波数領域における各成分の平均エネルギーを採用した。クラスタリングの際のクラスタ中心については、その数を3とし、k-means法により決定した。なお、領域境界の最適化を行う際には、中心領域全体および周辺領域全体をそれぞれ一つのクラスタとして扱った。図6(b)は切出された領域である。図6(b)に示された領域は、注目オブジェクトを全体的にカバーしているだけでなく、境界のひずみも少ない。ただし、一部ではあるが、シャツに切込みが入ったような境界が見られる。これについては、境界の形状に対する制約やモデル等を新たに設けることによって改善が期待できる。
このように本実施の形態においては、ウェーブレットフレームを用いた多様なスケールでの空間−周波数解析に基づく粗い領域分割の後、領域境界の最適化を行う。これにより、解析精度が高く境界のひずみも少ないオブジェクト切出しを行うことができる。
本発明の実施の一形態の画像解析装置のハードウェア構成を概略的に示すブロック図である。 画像解析装置が実行する処理を概略的に示すフローチャートである。 領域ラベル設定処理を概略的に示すフローチャートである。 部分空間法を用いたクラスタリング処理を概略的に示すフローチャートである。 尤度関数を用いた領域境界最適化の処理を概略的に示すフローチャートである。 ウェーブレットフレームを用いた注目テクスチャ切出しの一例を示す説明図である。
符号の説明
1 画像解析装置
7 記憶媒体

Claims (14)

  1. 画像を所定の領域に分割する領域分割手段と、
    この領域分割手段により分割された前記領域ごとにウェーブレットフレームによる多重解像度解析を所定のレベルまで繰り返し実行する多重解像度解析手段と、
    この多重解像度解析手段によって得られるウェーブレット係数から所定の特徴量を抽出する特徴抽出手段と、
    この特徴抽出手段により抽出された前記特徴量に基づいて、近傍領域間の前記特徴量の誤差を算出し、算出された誤差の類似度に応じて、当該領域と当該領域の近傍に位置する領域とに同一ラベルを付与することにより、前記領域ごとにラベルを設定する領域ラベル設定手段と、
    所定の領域に合致するラベルが付与された領域を選択領域とし、当該選択領域内の所定の特徴量をクラスタ中心として、クラスタ中心に基づき当該選択領域内で部分空間を定め、当該部分空間と各領域との適合度を測り、当該適合度の類似度に応じて、当該選択領域に類似する類似領域とにクラスタリングするクラスタリング手段と、
    前記選択領域および前記クラスタリングによって得られる所定のクラスタから成る前記類似領域を含む中心領域と、その周辺の領域である周辺領域にマルコフ確率場モデルをそれぞれ導入し、当該モデルに基づく当該領域の尤度が最大となる境界を探索することにより、前記中心領域と前記周辺領域との境界形状を最適化する領域境界最適化手段と、
    を具備する画像解析装置。
  2. 前記領域分割手段、前記多重解像度解析手段、前記特徴抽出手段並びに前記領域ラベル設定手段を、所定の終了条件が満たされるまで再帰的に実行する、
    請求項1記載の画像解析装置。
  3. 前記領域分割手段、前記多重解像度解析手段、前記特徴抽出手段並びに前記クラスタリング手段を、所定の終了条件が満たされるまで再帰的に実行する、
    請求項1記載の画像解析装置。
  4. 前記領域分割手段は、対象とする画像を所定の大きさで所定の数の矩形領域に分割する、
    請求項1ないし3の何れか一記載の画像解析装置。
  5. 前記特徴抽出手段は、所定の各分解レベルから所定の成分毎に求めた平均エネルギーの各々を要素とするベクトルを特徴量とする、
    請求項1ないし3の何れか一記載の画像解析装置。
  6. コンピュータにインストールされ、
    画像を所定の領域に分割する領域分割機能と、
    この領域分割機能により分割された前記領域ごとにウェーブレットフレームによる多重解像度解析を所定のレベルまで繰り返し実行する多重解像度解析機能と、
    この多重解像度解析機能によって得られるウェーブレット係数から所定の特徴量を抽出する特徴抽出機能と、
    この特徴抽出機能により抽出された前記特徴量に基づいて、近傍領域間の前記特徴量の誤差を算出し、算出された誤差の類似度に応じて、当該領域と当該領域の近傍に位置する領域とに同一ラベルを付与することにより、前記領域ごとにラベルを設定する領域ラベル設定機能と、
    所定の領域に合致するラベルが付与された領域を選択領域とし、当該選択領域内の所定の特徴量をクラスタ中心として、クラスタ中心に基づき当該選択領域内で部分空間を定め、当該部分空間と各領域との適合度を測り、当該適合度の類似度に応じて、当該選択領域に類似する類似領域とにクラスタリングするクラスタリング機能と、
    前記選択領域および前記クラスタリングによって得られる所定のクラスタから成る前記類似領域を含む中心領域と、その周辺の領域である周辺領域にマルコフ確率場モデルをそれぞれ導入し、当該モデルに基づく当該領域の尤度が最大となる境界を探索することにより、前記中心領域と前記周辺領域との境界形状を最適化する領域境界最適化機能と、
    をコンピュータに実行させる画像解析プログラム。
  7. 前記領域分割機能、前記多重解像度解析機能、前記特徴抽出機能並びに前記領域ラベル設定機能を、所定の終了条件が満たされるまで再帰的にコンピュータに実行させる、
    請求項記載の画像解析プログラム。
  8. 前記領域分割機能、前記多重解像度解析機能、前記特徴抽出機能並びに前記クラスタリング機能を、所定の終了条件が満たされるまで再帰的にコンピュータに実行させる、
    請求項記載の画像解析プログラム。
  9. 請求項ないしのいずれか一記載の画像解析プログラムを記憶する記憶媒体。
  10. 画像を所定の領域に分割する領域分割ステップと、
    この領域分割ステップにより分割された前記領域ごとにウェーブレットフレームによる多重解像度解析を所定のレベルまで繰り返し実行する多重解像度解析ステップと、
    この多重解像度解析ステップによって得られるウェーブレット係数から所定の特徴量を抽出する特徴抽出ステップと、
    この特徴抽出ステップにより抽出された前記特徴量に基づいて、近傍領域間の前記特徴量の誤差を算出し、算出された誤差の類似度に応じて、当該領域と当該領域の近傍に位置する領域とに同一ラベルを付与することにより、前記領域ごとにラベルを設定する領域ラベル設定ステップと、
    所定の領域に合致するラベルが付与された領域を選択領域とし、当該選択領域内の所定の特徴量をクラスタ中心として、クラスタ中心に基づき当該選択領域内で部分空間を定め、当該部分空間と各領域との適合度を測り、当該適合度の類似度に応じて、当該選択領域に類似する類似領域とにクラスタリングするクラスタリングステップと、
    前記選択領域および前記クラスタリングによって得られる所定のクラスタから成る前記類似領域を含む中心領域と、その周辺の領域である周辺領域にマルコフ確率場モデルをそれぞれ導入し、当該モデルに基づく当該領域の尤度が最大となる境界を探索することにより、前記中心領域と前記周辺領域との境界形状を最適化する領域境界最適化ステップと、
    を具備する画像解析方法。
  11. 前記領域分割ステップ、前記多重解像度解析ステップ、前記特徴抽出ステップ並びに前記領域ラベル設定ステップを、所定の終了条件が満たされるまで再帰的に実行する、
    請求項10記載の画像解析方法。
  12. 前記領域分割ステップ、前記多重解像度解析ステップ、前記特徴抽出ステップ並びに前記クラスタリングステップを、所定の終了条件が満たされるまで再帰的に実行する、
    請求項10記載の画像解析方法。
  13. 前記領域分割ステップは、対象とする画像を所定の大きさで所定の数の矩形領域に分割する、
    請求項10ないし12の何れか一記載の画像解析方法。
  14. 前記特徴抽出ステップは、所定の各分解レベルから所定の成分毎に求めた平均エネルギーの各々を要素とするベクトルを特徴量とする、
    請求項10ないし12の何れか一記載の画像解析方法。
JP2003304543A 2003-08-28 2003-08-28 画像解析装置、画像解析プログラム、記憶媒体および画像解析方法 Expired - Fee Related JP4394399B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003304543A JP4394399B2 (ja) 2003-08-28 2003-08-28 画像解析装置、画像解析プログラム、記憶媒体および画像解析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003304543A JP4394399B2 (ja) 2003-08-28 2003-08-28 画像解析装置、画像解析プログラム、記憶媒体および画像解析方法

Publications (2)

Publication Number Publication Date
JP2005078149A JP2005078149A (ja) 2005-03-24
JP4394399B2 true JP4394399B2 (ja) 2010-01-06

Family

ID=34408202

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003304543A Expired - Fee Related JP4394399B2 (ja) 2003-08-28 2003-08-28 画像解析装置、画像解析プログラム、記憶媒体および画像解析方法

Country Status (1)

Country Link
JP (1) JP4394399B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102005037841B4 (de) * 2005-08-04 2010-08-12 Gesellschaft zur Förderung angewandter Informatik e.V. Verfahren und Anordnung zur Bestimmung der relativen Lage eines ersten Objektes bezüglich eines zweiten Objektes, sowie ein entsprechendes Computerprogramm und ein entsprechendes computerlesbares Speichermedium
US7991230B2 (en) * 2005-10-14 2011-08-02 Microsoft Corporation Modeling micro-structure for feature extraction
CN106257498B (zh) * 2016-07-27 2019-12-17 中南大学 基于异构纹理特征的锌浮选工况状态划分方法

Also Published As

Publication number Publication date
JP2005078149A (ja) 2005-03-24

Similar Documents

Publication Publication Date Title
Odena et al. Conditional image synthesis with auxiliary classifier gans
JP3576987B2 (ja) 画像のテンプレートマッチング方法及び画像処理装置
Paul et al. Coupling image restoration and segmentation: A generalized linear model/Bregman perspective
Poggi et al. Supervised segmentation of remote sensing images based on a tree-structured MRF model
CN108073902B (zh) 基于深度学习的视频总结方法、装置及终端设备
US10460232B2 (en) Method and apparatus for classifying data, and method and apparatus for segmenting region of interest (ROI)
CN116686017A (zh) 一种用于视频动作识别的时间瓶颈注意力体系结构
US7721061B1 (en) Method of predicting response time for storage request
US20160364472A1 (en) Functional space-time trajectory clustering
CN109255382B (zh) 用于图片匹配定位的神经网络***,方法及装置
US20220301288A1 (en) Control method and information processing apparatus
JP5123759B2 (ja) パターン検出器の学習装置、学習方法及びプログラム
JP7428927B2 (ja) ノード情報推定方法、ノード情報推定プログラムおよび情報処理装置
JP5311899B2 (ja) パターン検出器の学習装置、学習方法及びプログラム
Lalos et al. Adaptive compression of animated meshes by exploiting orthogonal iterations
US11410065B2 (en) Storage medium, model output method, and model output device
US7171043B2 (en) Image recognition using hidden markov models and coupled hidden markov models
JP4394399B2 (ja) 画像解析装置、画像解析プログラム、記憶媒体および画像解析方法
KR100842215B1 (ko) 서포트 벡터 도메인 묘사를 이용한 다범주 분류 방법 및장치와 그에 사용되는 컴퓨터 판독가능 저장매체
CN115082840B (zh) 基于数据组合和通道相关性的动作视频分类方法和装置
US20090136132A1 (en) Method for improving quality of image and apparatus for the same
KR101919698B1 (ko) 실루엣을 적용한 그룹 탐색 최적화 데이터 클러스터링 방법 및 시스템
EP3038019A1 (en) Designing a choropleth map
Lam et al. Statistical bootstrap-based principal mode component analysis for dynamic background subtraction
US8300936B2 (en) System and method for improving display of tuned multi-scaled regions of an image with local and global control

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20051021

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060621

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060905

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090714

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090914

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091013

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091015

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121023

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131023

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees