JP4586103B2 - 画像抽出方法及び装置 - Google Patents

画像抽出方法及び装置 Download PDF

Info

Publication number
JP4586103B2
JP4586103B2 JP2009209145A JP2009209145A JP4586103B2 JP 4586103 B2 JP4586103 B2 JP 4586103B2 JP 2009209145 A JP2009209145 A JP 2009209145A JP 2009209145 A JP2009209145 A JP 2009209145A JP 4586103 B2 JP4586103 B2 JP 4586103B2
Authority
JP
Japan
Prior art keywords
template
image
local
matching
shape
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009209145A
Other languages
English (en)
Other versions
JP2009289295A (ja
Inventor
優和 真継
俊明 近藤
史明 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2009209145A priority Critical patent/JP4586103B2/ja
Publication of JP2009289295A publication Critical patent/JP2009289295A/ja
Application granted granted Critical
Publication of JP4586103B2 publication Critical patent/JP4586103B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、画像抽出方法及び装置に関し、より具体的には、画像中から特定カテゴリーの対象を抽出する画像抽出方法及び装置並びに記憶媒体に関する。
特開平8−7107号公報 特開平8−16779号公報 特開平7−334675号公報 特公平7−34219号公報 特開平3−240884号公報 特開平7−225847号公報 特開平6−251149号公報 特開平7−107266号公報 特開平8−7075号公報 特開平8−77336号公報 特公平6−42068号公報 特公平8−20725号公報 特許2642368号公報 特開平9−50532号公報 特開平6−168331号公報 特開平5−242160号公報
M.Kass, A.Witkin, D.Terzopoulos, Snakes, "Active Contour Models,International Journal of Computer Vision, pp.321-331, 1988 A.De Bimbo and P.Pa1a, "Visua1 Image Retrieval by Elastic Matching of User Sketches", IEEE Trans. on Pattern Analysis and Machine Intelligence, vol. 19,pp. 121-132, 1997 L.H.Steib and J.S.Duncan, "Boundary Finding with Parametrically Deformable Mode1s", IEEE Trans. on Pattern Analysis and Machine Intelligence, vol. 14, pp. 1061-1075, 1992 F. S. Cohen, Z. Huang, Z. Yang, "Invariant Matching and Identification of Curves Using B-Splines curve Representation", IEEE Trans. on Image Processing, vo1. 4, pp. 1-10, 1995 G. C. H. Chuang and C. C. J. Kuo, "Wave1et Descriptor of Planar Curves:Theory and App1ications", IEEE Trans. on Image Processing, vol. 5, pp. 56-70, 1996
従来、画像から特定の被写体又は対象を切り出す処理として、種々の方式が知られている。第1の方式は、ユーザが指定した物体又は背景上の点の画素値を含む所定範囲の色成分値(又は濃淡値)を有する領域を選択しながら、背景の除去又は抽出被写体の領域指定を繰り返す方法(特開平8−7107号公報、特開平8−16779号公報、特開平7−334675号公報及び特公平7−34219号公報等)、及び、抽出対象の輪郭線を含む大まかな粗輪郭線領域又は局所領域を指定し、その指定領域内で細線化又はクラスタリングなどの処理により対象の境界輪郭線を求めて切り出す方法(特開平3−240884号公報、特開平7−225847号公報、特開平6−251149号公報、特開平7−107266号公報、特開平8−7075号公報、特開平8−77336号公報、特公平6−42068号公報及び特公平8−20725号公報など)がある。
第2の方式として、切り出し対象の画像部分を大まかに囲むように閉曲線(又は多角形の境界線)を設定し、色成分の情報のみを用いて対象物の形状にほぼ近い切り出しマスク画像を生成する方法(特許2642368号公報など)がある。
第3の方式として、画像から対象物体を検出し、その輪郭を抽出する構成(特開平9−50532号公報など)において、多重解像度を利用した粗密探索により入力濃淡画像をモザイク化した画像辞書データを参照しながら対象物体の位置とサイズを求め、それらに基づいて初期輪郭を設定する動的輪郭法(M.Kass, A.Witkin, D.Terzopoulos, Snakes, "Active Contour Models,International Journal of Computer Vision, pp.321−331, 1988)を用いて輪郭を抽出する方法がある。
その他、画像中の特定の物体の有無の判定、又は特定の物体が存在する画像をデータベースから検索して抽出することに利用可能な技術として、予め用意したテンプレートを画像上でスキャンし、各位置でのマッチング度を算出し、そのマッチング度が所定の閾値以上となる位置を探索する方法(特開平6−168331号公報)、画像データベース作成時に画像中の構成要素の領域と構成要素名を入力しておき、所定の特徴を有する画像を高速に検索する方法(特開平5−242160号公報)、ユーザにより与えられた例(スケッチ及び画像等)との類似度を求め、その類似度が高い画像を検索する方法(文献1:A.De Bimbo and P.Pa1a, "Visua1 Image Retrieval by Elastic Matching of User Sketches", IEEE Trans. on Pattern Analysis and Machine Intelligence, vol. 19,pp. 121−132, 1997など)、及び、形状モデルを用いて境界線を検出する方法(文献2:L.H.Steib and J.S.Duncan, "Boundary Finding with Parametrically Deformable Mode1s", IEEE Trans. on Pattern Analysis and Machine Intelligence, vol. 14, pp. 1061−1075, 1992)などがある。
曲線をパラメトリックにモデル化する一手法として、スプライン曲線を用いる方法(F. S. Cohen, Z. Huang, Z. Yang, ”Invariant Matching and Identification of Curves Using B−Splines curve Representation”, IEEE Trans. on Image Processing, vo1. 4, pp. 1−10, 1995)、フーリエ記述子を用いる手法(文献2)、及びウーブレット記述子を用いる方法(G. C. H. Chuang and C. C. J. Kuo, ”Wave1et Descriptor of Planar Curves:Theory and App1ications”, IEEE Trans. on Image Processing, vol. 5, pp. 56−70, 1996)などがある。
しかしながら、上述の第1の方式による画像抽出法は、ユーザの比較的詳細な指示による操作を必要とするので、特定の形状を有する対象物を画像から探索して抽出(切り出し)する処理を自動化できない。
切り出し対象の画像部分を大まかに囲む閉曲線等を指定する方法(特許2642368号公報)に代表される第2の方式では、閉曲線内に含まれる同じ色成分を有する領域の面積の割合を用いるので、閉曲線内の背景中に被写体と同色となる領域がある場合、及び閉曲線領域が切り出し対象領域と比べて2倍以上の面積を有する場合などでは、背景部分が抽出されるなどの誤抽出を生じ易いという問題があり、汎用性に欠ける。
第3の方法を示す特開平9−50532号公報に記載される輪郭検出装置では、いわゆる動的輪郭法を用いるので、入力画像の背景部分(抽出対象以外の部分)が複雑なテクスチャパターンを有する場合などでその影響を受けて、抽出すべき輪郭線の複雑さを反映することが困難な場合が多い。すなわち、本来の輪郭線形状から外れた不自然な凹凸形状が抽出されるという問題があった。
文献2に記載される輪郭抽出法では、輪郭モデルのパラメータ及び輪郭モデルの誤差をガウシアン分布と仮定する確率モデルを前提とするので、実際にそれらの分布が非ガウシアンとなる場合には、正しい輪郭を効率よく抽出することが困難であり、輪郭モデルと抽出対象の形状の差異に関する許容度が低い。
本発明は、このような問題点を解決する画像抽出方法及び装置を提示することを目的とする。
本発明はまた、より高速に所望の画像を精度良く抽出できる画像抽出方法及び装置を提示することを目的とする。
本発明に係る画像抽出方法は、第1のマッチング手段が入力画像と局所的な図形要素を含むテンプレートとの所定の特徴量の値に関す所定の評価関数値を求める第1のマッチング処理を行う第1のマッチングステップと、局所変換手段が前記テンプレート上の所定の代表点の近傍領域について局所的な幾何学的変換を行う局所変換ステップと、変換パラメータ算出手段が前記局所変換ステップの変換パラメータを前記第1のマッチング処理結果、および、所定の変形モードまたは確率分布の少なくとも一方、に基づいて求める変換パラメータ算出ステップと、第2のマッチング手段が前記局所変換ステップにより得られるテンプレートと前記入力画像との第2のマッチング処理を行う第2のマッチングステップと、画像領域抽出手段が前記第2のマッチング処理の結果に基づき記輪郭線を含む画像領域を抽出する画像領域抽出ステップとを具備することを特徴とする。
本発明に係る画像抽出装置は、入力画像と局所的な図形要素を含むテンプレートとの所定の特徴量の値に関す所定の評価関数値を求める第1のマッチング処理を行う第1のマッチング手段と、前記テンプレート上の所定の代表点の近傍領域について局所的な幾何学的変換を行う局所変換手段と、前記局所変換手段の変換パラメータを前記第1のマッチング処理結果、および、所定の変形モードまたは確率分布の少なくとも一方、に基づいて求める変換パラメータ算出手段と、前記局所変換手段により得られるテンプレートと前記入力画像との第2のマッチング処理を行う第2のマッチング手段と、前記第2のマッチング処理の結果に基づき記輪郭線を含む画像領域を抽出する画像領域抽出手段とを具備することを特徴とする。
本発明によれば、テンプレートデータの走査及びその形状に関する適合度評価、並びに拘束条件を与えた変形(移動範囲、形状拘束条件及び局所幾何学的変換など)を実行することにより、形状に関する予め与えられた情報に適合する対象物を画像から自動的に探索することができる。また、適合する範囲において変形の許容度が高く、ノイズに強い輪郭抽出及び画像抽出が可能になる。
テンプレートの変形に際して、変形(代表点の移動)に関する拘束条件の全体的なセットが与えられ、又は幾何学的位相を保存するような局所幾何学的変換の推定を行うので、大域的な形状情報が常に保持され、局所的なノイズ等の影響を受けにくい。従って、背景が複雑なパターンを有していても、不自然な輪郭の抽出が効果的に防止される。
本発明の一実施例の概略構成ブロック図である。 画像処理装置16の概略構成ブロック図である。 テンプレートデータの一例と移動範囲を示す模式図である。 テンプレートデータの例を示す表である。 本実施例の動作フローチャートである。 画像表示装置14の表示画面例である。 太線上でのエッジ割合の説明例の模式図である。 更新テンプレート生成処理過程におけるテンプレート図形の変形の様子を示す模式図である。 P5がP5’に移動したことに伴う、代表点P6,P7の移動の様子を示す模式図である。 更新テンプレート生成処理(図5のS7)を変更した実施例の変更部分の動作フローチャートである。 人体のテンプレートモデルの例である。 幾何学的(アフィン)変換パラメータの推定手順を示すフローチャートである。 不定部分を有するテンプレートモデルの輪郭推定手順を説明する模式図である。 第3実施例におけるテンプレート更新処理のフローチャートである。 図14の説明例である。
以下、図面を参照して、本発明の実施例を詳細に説明する。
図1は、本発明の一実施例の概略構成ブロック図を示す。10は画像入力装置、12は画像データ及びテンプレートモデルータを記憶する画像記憶装置、14は画像表示装置、16は画像処理装置、18はマウスなどのポインティング・デバイスからなる指示選択装置である。画像入力装置10は、イメージ・スキャナ、ディジタル・カメラなどの撮像装置、又は、画像データベースに接続する画像データ転送装置からなる。
本実施例では、画像入力装置10から、背景から分離抽出されるべき対象を含む画像データが入力し、画像記憶装置12に記憶される。画像記憶装置12に記憶される画像データは、画像表示装置14の画面上の所定位置に所定の形式で表示される。
画像処理装置16の概略構成を図2に示す。20は入力画像の特徴量を抽出する特徴量抽出装置、22は、テンプレートモデル選択装置、24は、複数解像度のテンプレートデータを生成するテンプレートデータ生成装置、26は、テンプレートの走査及び入力画像の特徴量との第1のマッチング評価を実行するテンプレート走査装置、28は、テンプレート上の各代表点の移動範囲・条件を更新及び設定する移動範囲・条件更新設定装置、30は更新テンプレート生成装置、32は変形後の形状適合度の評価を画像特徴量との第2のマッチング処理により変形後の形状適合度を評価する形状適合度評価装置、34は、更新テンプレートの代表点間を滑らかにつなぐスプライン補間曲線によりその図形要素の境界線を生成する境界線生成装置、36は更新テンプレートの境界線を画像表示装置14の画面上で入力画像に重畳して表示する境界線表示装置、38は更新テンプレートの境界線内部の領域を示すマスクデータを生成するマスクデータ生成装置である。図示していないが、更に、更新テンプレートの境界線及び/又はマスクデータを記憶する記憶装置を具備する。
先ず、本実施例で用いるテンプレートモデル及びパラメトリックな曲線表現方法を説明する。
テンプレートデータは、抽出カテゴリ(人物、自動車、魚及び飛行機など)を代表する抽象化された図形要素又は代表的な画像(図形)パターンを主たる構成要素とし、典型的にはそれらを構成する輪郭線データ若しくはその輪郭線を含む背景が無地の濃淡画像又はカラー画像等により与えられる。この輪郭線データは、該当するカテゴリーの外形を表わすものに限らず、そのカテゴリーを構成する主要な形状データ(例えば、人物の顔を構成する目、鼻及び口など)を含んでよいことはいうまでもない。
各カテゴリーに属する図形要素の輪郭線は、代表点間を通る曲線又は線分で構成され、予めスプライン曲線、フーリエ記述子及びウェーブレット記述子などにより、パラメトリックに表現されているものとする。
例えば、輪郭線モデルの全体はJ個のスプライン曲線から構成され、j番目のスプライン曲線
rj(t) = [ xj(y), yj(t)]
は、n+1個の制御点を有するm次のBスプラインであるとすると、
Figure 0004586103
ここに、j=0,1,・・・,Jである。また、QN,m+1(t)は、
Figure 0004586103
のように表わされる。C=[Cx,N,Cy,N]は、N番目の制御点位置を示すベクトルである。
フーリエ記述子を用いる場合には、
Figure 0004586103
と表現される。但し、
Figure 0004586103
である。tは、弧長sと全周長Sを用いて、t=2πs/Sのように表わされる。フーリエ記述子を用いて曲線の一部を表現する場合には、その両端点で
x(t) = x(2π−t)
y(t) = y(2π一t)
とし、従って、b=d=0とすればよい。
ウェーブレット記述子を用いる場合は、
Figure 0004586103
ここで、
Figure 0004586103
である。
ウェーブレット関数はそれぞれ周期性を有し、以下のように定義される。すなわち、
Figure 0004586103
ここに、k,m,nは、0又は正の整数であり、関数φ,ψは、双直交3次スプライン関数等が用いられる。
テンプレートを構成する輪郭線は、抽出対象の形状を表わす輪郭線を一つの閉曲線として表わすのではなく、抽出対象のカテゴリーを表わす形状の部分的輪郭線からなる構成(例えば、本出願と同じ出願人による特開平7−320086号公報に記載されたモデル)を用いてもよい。
代表点の粗密分布及びこれら曲線のパラメータ(例えば、Bスプライン関数の次数及び制御点の数など)は、抽出すべき対象の形状に関する複雑さ及び滑らかさなどを表現し、反映するものである。図3(a)は、テンプレートを構成する図形要素の一例を示す。テンプレートデータ生成装置24が、画像データから輪郭線抽出などによりこの図形要素を生成してもよい。
図3(b)及び図4(a),(b)に例示するように、テンプレートデータには、代表点位置とスプライン曲線などのパラメータに関するデータ(曲線の次数及び種別)の他に、各代表点の移動範囲データ又は後述の形状拘束条件が与えられる。
移動範囲を各代表点で明示的に表わすのではなく、単に代表点近傍での形状の凹又は凸が保持されること、若しくは、曲率が保持されること及び新たなループが生成しないことなどの局所形状条件を与えて、それらを移動条件データとして各代表点ごとに与えてもよい。この場合、そのようにして定められる局所形状条件が破られないことと、移動後の更新テンプレートの形状に関する後述する適合度が基準値を満たさないことといいう2つの条件の下で代表点の移動範囲を徐々に拡大して探索し、適合度が基準値以上となった位置で代表点の移動を停止する。
形状拘束条件としては、例えば、図4(a)の4行目に記載されるように、
Figure 0004586103
とする。(x,y)は、j番目の代表点位置を示す。数8は、代表点(x,y)の近傍の形状に関する凹凸及び曲率の保持されるべき範囲の概算値を示す。
サイズに関する拘束条件として、例えば、
Figure 0004586103
とする。これと形状拘束条件により、(xj−1,yj−1),(x,y)が定まれば、(xj+1,yj+1)は、数8及び数9を満たす範囲の平均値として求めることが出来る。数9でdは、点(x,yj)と(xj+1,yj+1)とを結ぶ線分長の基準値、μはその許容する変化幅の基準値をそれぞれ示す。
図3には、j−1,j,j+1番目の各代表点とそれらを連結するパラメトリックに表現された曲線及び各移動範囲が、図示されている。移動範囲データは、テンプレートを構成する代表点の移動に伴う元のテンプレート形状からの変形許容度を与えるものとして予め与えられている。各移動範囲は、抽出対象の各部分の非剛性度(弾性度及び関節の有無など)及びアプリオリな形状に関する知識によって一般的に異なり、また、テンプレートの変形更新過程においても適宜に変化しうる。
例えば、人物の頭部は、通常、2次曲線(楕円形状)関数で近似される凸形状であるが、この頭部を構成する代表点の移動範囲は、移動により新たな凹部が発生しないことを条件に定められる。頭部を構成する外形の曲線を輪郭線に沿った弧長の関数として表わした時、凹部の発生は、2階微分値(又はこれに相当する近似値)が正となることにより検出される。
従って、ある代表点の移動範囲の大きさ及び形状は、その点に隣接する代表点を固定したときに、代表点間を結ぶ曲線が移動後の代表点の近傍において2階微分値(又はその近似値)が正とならない範囲となるように決定される。この範囲は、厳密には、当該代表点を除く他の代表点の移動とともに相対的に変化するが、変形量が大きくなく且つ形状の類似性が保たれる範囲として、予め各代表点ごとに固定(代表点ごとにその範囲の大きさ及び形状が異なっても良い)して、設定されている。
本実施例における画像抽出手順を説明する。図5は、その動作フローチャートを示す。撮影手段などの画像入力装置10から画像データ入力される、画像記憶装置12に格納され、図6に例示するように画像表示装置14の画面上に表示される(S1)。図6で、40は画像表示装置14の画面、42は入力画像、44はテンプレートモデル画像データ、46は目標位置確認インディケータ、48は抽出指示ボタン、50はテンプレートスクロールボタンである。
特徴量抽出装置20は、入力画像の特徴量分布(エッジ強度分布又は各点での局所空間周波数に関する情報など)を求め、所定の閾値で2値化する(S2)。
テンプレート選択装置22は、テンプレートモデル画像データ44を画像表示装置14の表示画面40上に表示する。ユーザが、抽出カテゴリーのテンプレートデータを選択すると、選択されたテンプレートデータの情報(例えば、図4に例示されるデータ)が読み込まれる(S3)。テンプレートモデル画像データ44に表示される一覧からスクロールボタン50によりテンプレートモデル画像データ44の表示内容をスクロールして所望のものを表示させ、指示選択装置18により選択することにより、希望する1つのテンプレートモデル画像データを選択できる。抽出カテゴリーは、例えば、マイクなどの音声入力装置及び音声認識装置により口頭で抽出カテゴリーの名称を指示入力してもよい。ユーザにより所望のテンプレートデータが選択されると、テンプレートデータ生成装置22は、選択されたテンプレートータから互いに大きさが異なる複数(通常は10未満)のテンプレートセットを自動生成する(S4)。
テンプレート走査装置26は、各テンプレートをそれぞれ画像上でその大きさに応じた所定のサンプリングピッチ(例えば、テンプレート図形の横幅の10分の1など)でラスタースキャンし(S5)、各場所で第1の形状適合度を求める(S6)。具体的には、形状の適合度を表わすパラメータとして、テンプレート上の図形要素の輪郭線上又はその輪郭線を所定幅(典型的には、5画素程度)に太線化して得られる太線上で、エッジである点の割合及びエッジ点でのエッジ強度勾配の向きの揃い具合(又はそれらの距離)を表わす勾配ベクトルの内積(の絶対値)の総和(又はエッジ点であって上記内積値が基準値以上の点の割合)を求める。
太線上でのエッジ割合とは、図7に例示するように、太線の中心線上のサンプリング点とそのサンプリング点を含む微小領域(太線領域セル)においてエッジが存在する場合にそのサンプリング点をエッジ点としてカウントする要領で総サンプリング点数に対するエッジ点数の割合である。第1の形状適合度は、画像中の抽出対象とテンプレートとの全体的な形状類似度を表わす。
適合度パラメータとしては、本出願と同じ出願人による特開平9−185719号公報に示されるように、テンプレートモデルの輪郭線近傍の画像データ(色成分の情輝度分布など)に関する誤差の逆数等を適合度の尺度として用いてもよい。
複数の大きさの異なるテンプレートの走査及び適合度評価の過程において、あるテンプレートの適合度パラメータが所定の基準値以上となったとき、そのテンプレートの走査を停止し、ユーザに対しては目標対象確認インディケータ46(図6)が表示される。この段階で、対象の位置と大きさに関する情報が抽出されたことになる。ユーザが抽出ボタン48を押して抽出実行処理の開始を指示すると、次の更新テンプレート生成処理(S7)が実行される。
図8は、更新テンプレート生成処理過程におけるテンプレート図形の変形の様子を示す。図8(a)では、テンプレート図形の初期形状と入力画像の対象物形状とのマッチングの程度(補間曲線上のエッジ割合など)が、小さい部分の代表点P1,P2,・・・,P7のように表示されている。これら以外の代表点は、比較的マッチングが良好な点であり、図3(b)に示すような各移動範囲内で最適な移動先が検出される。
更新テンププレート生成処理(S7)では、テンプレート図形要素変形装置30が、テンプレート図形を構成するある図形要素(曲線セグメント)の代表点を移動範囲内で(又は数8及び数9などの移動条件に従って)移動し(S7a)、テンプレート図形要素変形装置30が移動後の代表点間を結ぶ新たな曲線セグメントを生成し(S7b)、形状適合度評価装置32が各部分で第2の形状適合度を評価することにより(S7c)、第2の形状適合度が所定の基準値以上又は最大となるように代表点が移動され、最終的に、境界線生成装置34が、代表点間を結ぶ曲線(又は線分)を生成する。これらの処理を実行する過程で、移動条件の緩和等(S7d)が必要に応じて行われ、最終的に、移動条件を満足するようにテンプレート全体が変形される(S7e)。
境界線表示装置36が、画像表示装置14の画面上にその境界線を入力画像に重畳して表示する。更新テンプレートデータはその境界線データ又はその領域を示す2値のマスクデータとして生成される。
移動と適合度評価は、各代表点を同時に移動しながら実行するのではなく、エッジ割合の高いセグメントの端点をなす代表点に隣接するエッジ割合の低いセグメントを中継する代表点の移動を優先して行うと効率的である。図8(b)は、そのようにして移動した後の代表点間を結ぶ曲線を表わす更新テンプレートの形状を示す。図8(b)で、図8(a)のPiは、図8(b)では、Pi’に移動している。例えば、図8(a)において、エッジ割合の高いセグメントの端点である代表点Qに隣接する代表点P5について、点Qを中心とする所定の半径(例えば、QからP5までの弧長)の円弧上でP5の移動先を初めに探索する。
代表点位置の移動先探索では、上述した移動範囲を所定の確率分布(特に、移動範囲の外で値が0となるようなもの)により表わし、その分布により与えられる代表点位置を確率的に生成し、その代表点を含む曲線セグメントの形状適合度をその都度評価することにより、値が所定基準値以上(又は量大)となる位置を推定してもよい。
代表点の移動先は、第2の形状適合度の評価結果に基づいて決定される。第2の形状適合度は各代表点について定義され、その代表点に隣接する代表点(通常、2つ)との間を結ぶ曲線(又は線分)上のエッジ割合とその曲線(又は線分)上の特徴量勾配(エッジ強度分布の勾配など)の許容範囲内での一致度(許容範囲内で一致している点の割合)の線形和で表わされる。
移動範囲・条件更新設定装置28は、この第2の形状適合度の値に応じて当該代表点の移動範囲を拡大し、又は移動条件を緩和して(S7d)、未だ探索されていない領域から最適な代表点位置、即ち第2の形状適合度が最大となる代表点位置を探索して移動してもよい。即ち、第2の形状適合度に基づいて上述したテンプレートの図形要素を変形することにより、抽出カテゴリーに属するテンプレートの輪郭線形状データと多少異なる輪郭線を有する対象であっても、非適合部分についての代表点移動範囲の拡大又は移動条件の緩和がなされる結果、全体の輪郭抽出が可能となる。
図8に示す例では、P5がP5’に移動したことに伴い、残りの連続して存在する代表点の移動範囲は、P5’の位置に基づいて更新される。その様子を図9に示す。具体的には、例えば、P5’,P6’,P7’を通る曲線の形状が凸であることと、その曲線の長さと同程度のサイズを維持することの少なくとも一方を拘束条件に移動範囲を設定し、探索を実行する。何れの条件又は両方の条件を用いるかは、抽出対象の非剛性度及び関節の有無などにより異なるが、予めテンプレートデータに定義されているものとする。
図9では、P6とP6’及びP7とP7’の探索範囲の大きさは同程度であり、各探索範囲の配置は、形状が凸であることの拘束条件(例えば、数8及び数9に示す条件)を当てはめて設定されている。新たに設定される移動範囲は、図9(b)に示すように、元の移動範囲と全く重なり合わないような離れた所になる場合もある。
移動範囲を明示的に設定せずに移動の拘束条件のみを与えて代表点を移動する場合には、P5’,P6’,P7’を通る曲線の接線方向の変化率が正であること(数8及び数9参照)等を条件として課せばよい。
移動後の代表点間を結ぶ曲線は、元のテンプレートを構成する曲線と同種の曲線を用いるのが望ましい。但し、パラメータの次数等は、抽出対象の形状に最も適合するように変更可能とする。例えば、Bスプライン曲線を用いる場合、次数及び制御点の数等は変更しても構わない。
更新後のテンプレートを構成する曲線パラメータの決定法の一例を説明する。或る曲線セグメントv(s)=(x(s),y(s))がn階のBスプライン関数を用いてモデル化されているとする。代表点移動後のパラメータの最適値は、例えば、以下のように推定される。即ち、
Figure 0004586103
ここで、Tは転置行列を示し、B(s)はBスプライン行列、tは曲線セグメントの長さ、QはBスプラインパラメータをそれぞれ示す。
曲線セグメントに対応する抽出対象の輪郭線をv’(s)=(x’(s),y’(s))とし、各点での特徴量(エッジ強度値など)をE’(s)とおき、E’(s)がE(s)に対して正規分布をなすとすると、その確率分布密度関数は、
Figure 0004586103
となる。ここで、(σ,(σは、E’(s)=(Ex’(s),Ey’(s))に対する分散を示す。
本実施例では説明を簡単化して理解を容易にするため、E(s)は2値(0又は1)とし、テンプレート図形の輪郭モデルデータは、E(s)=1となる点の集合として与えられるものとする。このとき、最ゆう推定値は、
Figure 0004586103
で与えられる。Qの階数等は、以下に示す情報量基準AIC(Q)が最小となるnなどのようにして求められる。具体的には、
Figure 0004586103
である。Number(Q)は、Qの要素数である。
移動範囲の拡大は、典型的には、元の移動範囲の形状を単純に所定の倍率で拡大する。しかし、テンプレート図形要素の当該代表点を含む曲線の接線方向を大きくとるような非等方的な拡大でもよい。このとき、前述した移動条件を満たす範囲で探索することはいうまでもない。
移動に関する拘束条件の緩和によっても第2の形状適合度が所定の基準値(例えば0.3)未満である代表点の数がその全体の一定数以下(例えば、過半数)ならば、当該テンプレートの変形を停止し、大きさ等の異なる他のテンプレートに切り替えて上述した処理を実行しても良い。
当該代表点の近傍にある代表点間を結ぶテンプレートの曲線セグメント上でエッジ割合が極めて高い場合(例えば、0.9以上)、当該代表点の上述したような移動先の探索を行わなくてもよい。
図8(c)に示すように、代表点間を結ぶ曲線(又は線分)上において、先に抽出された特徴量の非エッジ点がある場合、その非エッジ点を付加代表点として追加し(そのような非エッジ点が連続している場合にはその連続した非エッジ線分上の中点を新たな代表点とする)、その代表点について同様に移動範囲を設定して(又は移動条件を満たすように移動探索を行って)拘束条件を満たす位置へ移動させ、その代表点に隣接する代表点との間を結ぶ曲線を生成してもよい。この代表点の付加は、自動的に行うことができるが、ユーザの指示により実行しても良い。適切な代表点位置が検出されない場合には、同様にして、移動範囲の拡大又は移動条件の緩和を実行する。
最後に、更新後のテンプレート輪郭線を表示し(S8)、輪郭線データからマスクデータを生成し(S9)、必要に応じて輪郭線又はマスクデータを記憶装置に記録して(S10)、処理を終了する。
以上の各処理は、コンピュータで実行可能な所定のプログラム形式により形成されていても良いし、各部の処理を所定のゲートアレイ(FPGA及びASlC等)などのハードウェア、又は所定のコンピュータプログラムと図1に示す一部の要素を実現する部分的ハードウェアジュールとが混在する形式でも実現できることは明らかである。ハードウェアモジュールが含まれる場合、必ずしも各構成要素が図1に示す構成と同一でなくてもよく、その機能が実質的に同一であるもの、又は、一つの要素が図1の複数の要素の機能を備えるものなどは、本発明の技術的範囲に含まれることはいうまでもない。この点は、以下の実施例において同様である。
更新テンプレート生成処理(図5のS7)を変更した実施例を説明する。この変更実施例(第2実施例)では、テンプレートの走査と適合度評価を実行して、抽出対象の位置と適切なテンプレートモデルを選択した後、本実施例に特有の更新テンプレート生成処理を実行する。その具体的処理手順のフローチャートを図10に示す。
先ず、更新前のテンプレートデータから形状適合度の低いセグメントを含む代表点を自動抽出し(S11)、テンプレートデータをその代表点を含むように局所領域に分割する(S12)。予めまとまった形状要素ごとに領域分割されたテンプレートを使う場合には、この領域分割処理は、不要である。
代表点を含む局所領域で、以下に説明するような幾何学的変換パラメータの推定と変換を実行する(S13)。本実施例では、所定の代表点の近傍領域について局所的な幾何学的変形(局所アフィン変換、局所双線形変換及び局所透視変換など)によりテンプレートを更新するが、ここでは、そのためのテンプレートの局所幾何学的変換パラメータを、曲線パラメータに関する確率過程のベイズの推定手法に基づき入力画像中の対象に最も適合するようなパラメータとして求める。
更に、必要に応じて輪郭モデル形状を微調整するために、上述の実施例と同様に、変換後の代表点間を結ぶ曲線セグメントを生成し(S14)、第2の形状適合度を評価し(S15)、テンプレート形状を変形し、更新する(S16)。
この実施例で局所的な幾何学的変形と適合度評価を行う意義は、代表点間の相対的な位置関係(即ち、幾何学的位相及び凹又は凸形状など)を概ね保持しながら、局所的な領域において複数の代表点の位置を一括して所与の変形モードと合致するように変換することにより、抽出対象に適合する輪郭モデルの探索を効率化することにある。
アフィン変換、透視変換及び双線形変換はそれぞれ、下記式で与えられる。すなわち、
Figure 0004586103
Figure 0004586103
Figure 0004586103
x’=xw’、y’=yw’、[uv]は変換前の座標、[xy]は変換後の座標、{aij}{a}{b}及びwは変換パラメータである。
近傍領域としては、複数の代表点を含む所定サイズの矩形領域とするか、又は、予めテンプレートを所定のブロックごとに分割しておき、変形を各ブロックごとに行なうようにしてもよい。例えば、人体を表わすテンプレートでは、頭部、胴部、胸部及び脚部などのように、意味のある形状ごとにブロック分割したものを近傍領域としてもよい。図11は、人体の各部を予め分割しておき、元のデータ図11(a)に対して各部に所定の幾何学的変換を行なった結果図11(b),(c),(d)を例示する。実際に用いる輪郭線データは、図11の各図形の最外郭輪郭線であることはいうまでもない。
近傍領域内の各点(又は代表点)位置を上述の幾何学変換により移動することにより、テンプレートが変形される。アフィン変換を例に、最適な変換パラメータを求める手順を説明する。変換パラメータセット{aij}の事前確率をP(a)、画像データの事前確率をP(b)、変換パラメータが与えられたときに、その変換によって得られるテンプレート図形要素が入力画像の特徴量と一致する事後確率をP(b|a)、画像の特徴量bが与えられたときに、それに対応するテンプレートの変換パラメータセットが{aij}である事後確率をP(a|b)、求めるべき変換パラメータを{aopt}とする。{aopt}は、ベイズの法則に従い、最大事後確率max[P(a|b)]を与えるパラメータとして下記式により与えられる。即ち、
Figure 0004586103
上式の最右辺の対数をとり、またP(b)が定数であることを考慮すると、結局、
Figure 0004586103
となる。
次に、図12を参照して、幾何学的(アフィン)変換パラメータの推定手順を具体的に説明する。幾何学的変換パラメータの事前確率分布P(a)及び変換によって得られるテンプレート図形要素が入力画像の特徴量と一致する事後確率P(b|a)を下記式に示すようにして求め(S21)、それらを数18の右辺に代入して最大事後確率評価関数を求める(S22)。求めた関数の値が最大となるようなパラメータ{aopt}を、連続勾配山登り法などによる最適化法により求める(S23)。
テンプレートデータが線図形からなるものとし、ある代表点を含むテンプレートの図形要素を構成する局所線分(曲線要素)上の点の集合Nにおいて2値のテンプレートデータt(u,v)にアフィン変換{a}を行った結果の誤差がガウシアン分布となると仮定する。この仮定の下では、事後確率P(b|a)は下記式で与えられる。即ち、
Figure 0004586103
ここで、σは分散、a(u,v)はアフィン変換により点(u,v)が移される座標、bは入力画像の2値のエッジマップ(エッジ強度分布を所定の閾値で2値化したもの)をそれぞれ示す。テンプレートデータが濃淡画像の場合、Nは当該代表点を含む局所領域又は予め分割された当該代表点を含む領域上の点の集合となり、bはエッジ強度分布を示す。
事前確率分布P(a)は、水平又は垂直方向への変倍、回転又はシフトを与える変形モードで高い値をとるものとし、
Figure 0004586103
Figure 0004586103
ここで、mij,σijはそれぞれaijの平均及び分散を示し、
Figure 0004586103
である。mode={回転、回転、・・・、倍率、倍率2、・・・、シフト、・・・、その他}のように表わされ、各変形モードごとに、mij及びσijのパラメータ値が与えられる。‘その他’のモードは、特定の名称が与えられない任意の変換モードである。
最適な変換パラメータは、数19、数20、数21及び数22を数18に代入し、Vmode及び{aij}について連続勾配山登り法(continuous gradient ascent)又はPowel法などを用いることにより求められる。以上は、最適な変換パラメータを求める手法の一例であり、他の最適化手法(EMアルゴリズム、動的計画法及び遺伝的アルゴリズムなど)を用いてもよいことはいうまでもない。
上述した方法で求めた変換パラメータにより変換されたテンプレートデータを初期値として、更に第1の実施例に示した第2の形状適合度評価に基づく代表点の移動と代表点間を結ぶ曲線の生成処理を行ってもよい。
上述した方法により抽出対象の輪郭線(閉曲線)が求まったら、その閉曲線データを画像表示装置14の画面上に表示し、必要があれば、閉曲線内部の領域データとしてマスクデータを生成し、その何れかを所定の記憶手段に記録する。
不定部分を一部に有する図形要素からなる可変形状テンプレートを用いてもよい。不定部分とは変形の自由度が大きい部分であり、変形に伴い新たなループ形状が発生しないこと、及び、不定部分に対応する形状が凹か凸かが予め分かっていることを拘束条件として、それ以外の特定の拘束条件が課されない部分をいう。
抽出対象として、例えば人物の胸部及び脚部のように関節を有する部分は、変形の自由度が他の部分に比べて大きいことが予め分かっているから、これらの部分を不定部分として予めテンプレートデータ上で定義しておく。
第1実施例と同様に、テンプレートの走査と適合度評価を実行し、抽出対象の位置と適切なテンプレートモデルを選択する。次に、テンプレートを構成する図形要素の変形と形状適合度評価によるテンプレート更新を実行する。その際に、先ず、不定部分を除いた部分で第1実施例又は第2実施例に示した方法によりテンプレートを変形し、その後、不定部分の輪郭線を推定する。
不定部分の輪郭線を推定する方法として2つの方法を説明する。第1の方法では、不定部分の一方の端点を始点とし、他方を終点とする輪郭追跡を不定部分ごとに実行する。その結果得られる不定部分の輪郭線を近似する曲線を生成してもよい。図13(a),(b)は、第1の方法による不定部分の輪郭形状抽出過程の一例を示す。
第2の方法では、図13(c)に示すように、不定部分の両端点を結ぶ線分を直径とするプローブ円をその不定部分の形状が凸なら外側に、凹なら内側方向に移動させながら、各場所でその円の半径と位置を微少量ずつ変化させて、抽出対象の輪郭がその円と2箇所(p,q)で接するような円の位置と半径を求める。これにより、順次、輪郭線の座標を確定していく。この方法は、分岐のない形状の輪郭線を抽出するのに適している。この方法で概略の形状を抽出してから、抽出された部分を初輪郭モデルとして用い、第1実施例又は第2実施例で説明した手法で細部の形状を抽出してもよい。
図14は、第3実施例におけるテンプレート更新処理のフローチャートを示す。図14に示す処理は、図5のS7に相当する。
先ず、端点を有する曲線セグメントペアを選択し(S31)、不定部分以外のテンプレート図形要素の形状を先の実施例で説明した方法により更新する(S32)。次に、更新後の隣接する図形要素の相対する端点から始点及び終点を設定し(S33)、上述した方法、即ち始点及び終点間を結ぶ輪郭追跡(第1の方法)、又はプローブ円による輪郭位置確定(第2の方法)を実行する(S34)。以上の処理を全ての端点がなくなるまで繰り返し(S35)、テンプレートの図形要素により1つの閉曲線が形成されたら(S35)、更新後のテンプレートデータとして出力する(S36)。
このような構成では、特定部分について形状の不確定性(自由度)が高いことが予め分かっている抽出対象の輪郭を安定して抽出することが出来る。すなわち、与えられたテンプレートの形状とは大きく異なる部分を有する対象が画像中に存在しても、その異なる部分の輪郭について残りの確定した部分形状のギャップを補完するような最も確からしい曲線(例えば、端点での形状連続性又は画像特徴量の連続性の条件を満たすものとして輪郭追跡により求まる曲線)として求めることができる。
第4の実施例として、テンプレート更新処理(図5のS7)に相当する処理として、代表点間を通るテンプレートを構成する図形要素の曲線(又は線分)に沿った(又はその曲線を中心線とする)所定幅の太線を図15に示すように生成し、太線の両側の特徴量(色成分値及び局所空間周波数代表値など)に基づき太線内部の境界位置を推定するようにしてもよい。この場合、テンプレート更新処理の前には、先の実施例と同様の処理が施される。
具体的には、図15に示すように太線化した領域の輪郭線1又は輪郭線2の少なくとも一方の上に、領域成長のための核を設定する。領域成長処理では、その核での画像特徴量の差が所定の閾値より小さい核の近傍領域を核に併合し、その結果得られる輪郭線1からの成長結果と輪郭線2からの成長結果を統合する。又は、いずれかの輪郭線からの成長結果に基づいて1つの境界線を推定する。
境界位置は例えば、太線の方向に略直交するライン上での特徴量の最大エッジ強度位置として、又は、太線の両側の所定サンプリング点からの特徴量(例えば、色成分)の類似度に基づく領域成長による境界位置などとして決定される。
本実施例では、最終的に抽出される輪郭線は必ずしもパラメトリックな曲線で表現されなくても良い。
10:画像入力装置
12:画像記憶装置
14:画像表示装置
16:画像処理装置
18:指示選択装置
20:特徴量抽出装置
22:テンプレートモデル選択装置
24:テンプレートデータ生成装置
26:テンプレート走査装置
28:移動範囲・条件更新設定装置
30:更新テンプレート生成装置
32:形状適合度評価装置
34:境界線生成装置
36:境界線表示装置
38:マスクデータ生成装置
40:画像表示装置14の画面
42:入力画像
44:テンプレートモデル画像データ
46:目標位置確認インディケータ
48:抽出指示ボタン
50:テンプレートスクロールボタン

Claims (2)

  1. 第1のマッチング手段が入力画像と局所的な図形要素を含むテンプレートとの所定の特徴量の値に関す所定の評価関数値を求める第1のマッチング処理を行う第1のマッチングステップと、
    局所変換手段が前記テンプレート上の所定の代表点の近傍領域について局所的な幾何学的変換を行う局所変換ステップと、
    変換パラメータ算出手段が前記局所変換ステップの変換パラメータを前記第1のマッチング処理結果、および、所定の変形モードまたは確率分布の少なくとも一方、に基づいて求める変換パラメータ算出ステップと、
    第2のマッチング手段が前記局所変換ステップにより得られるテンプレートと前記入力画像との第2のマッチング処理を行う第2のマッチングステップと、
    画像領域抽出手段が前記第2のマッチング処理の結果に基づき記輪郭線を含む画像領域を抽出する画像領域抽出ステップ
    とを具備することを特徴とする画像抽出方法。
  2. 入力画像と局所的な図形要素を含むテンプレートとの所定の特徴量の値に関す所定の評価関数値を求める第1のマッチング処理を行う第1のマッチング手段と、
    前記テンプレート上の所定の代表点の近傍領域について局所的な幾何学的変換を行う局所変換手段と、
    前記局所変換手段の変換パラメータを前記第1のマッチング処理結果、および、所定の変形モードまたは確率分布の少なくとも一方、に基づいて求める変換パラメータ算出手段と、
    前記局所変換手段により得られるテンプレートと前記入力画像との第2のマッチング処理を行う第2のマッチング手段と、
    前記第2のマッチング処理の結果に基づき記輪郭線を含む画像領域を抽出する画像領域抽出手段
    とを具備することを特徴とする画像抽出装置。
JP2009209145A 2009-09-10 2009-09-10 画像抽出方法及び装置 Expired - Fee Related JP4586103B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009209145A JP4586103B2 (ja) 2009-09-10 2009-09-10 画像抽出方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009209145A JP4586103B2 (ja) 2009-09-10 2009-09-10 画像抽出方法及び装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP01468199A Division JP4392886B2 (ja) 1999-01-22 1999-01-22 画像抽出方法及び装置

Publications (2)

Publication Number Publication Date
JP2009289295A JP2009289295A (ja) 2009-12-10
JP4586103B2 true JP4586103B2 (ja) 2010-11-24

Family

ID=41458390

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009209145A Expired - Fee Related JP4586103B2 (ja) 2009-09-10 2009-09-10 画像抽出方法及び装置

Country Status (1)

Country Link
JP (1) JP4586103B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5663283B2 (ja) * 2010-12-02 2015-02-04 オリンパス株式会社 内視鏡画像処理装置及びプログラム
CN112926695B (zh) * 2021-04-16 2024-05-24 动员(北京)人工智能技术研究院有限公司 基于模板匹配的图像识别方法和***

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3557659B2 (ja) * 1994-08-22 2004-08-25 コニカミノルタホールディングス株式会社 顔抽出方法
JPH0950532A (ja) * 1995-08-09 1997-02-18 Nippon Telegr & Teleph Corp <Ntt> 輪郭検出装置
GB9625661D0 (en) * 1996-12-11 1997-01-29 Hewlett Packard Co A method and apparatus for compression of electronic ink
JPH10191020A (ja) * 1996-12-20 1998-07-21 Canon Inc 被写体画像切出し方法及び装置

Also Published As

Publication number Publication date
JP2009289295A (ja) 2009-12-10

Similar Documents

Publication Publication Date Title
JP4392886B2 (ja) 画像抽出方法及び装置
Tagliasacchi et al. 3d skeletons: A state‐of‐the‐art report
Enokiya et al. Automatic liver segmentation using U-Net with Wasserstein GANs
Noris et al. Topology-driven vectorization of clean line drawings
Kim et al. Feature detection of triangular meshes based on tensor voting theory
Wei et al. Tensor voting guided mesh denoising
Werghi et al. A functional-based segmentation of human body scans in arbitrary postures
Shang et al. Region competition based active contour for medical object extraction
JP2018195282A (ja) モデルを修正するためのシステムおよび方法
Tagliasacchi Skeletal representations and applications
Chan et al. Two and three dimensional image registration based on B-spline composition and level sets
Ma et al. Kinematic skeleton extraction from 3D articulated models
Amit Graphical shape templates for automatic anatomy detection with applications to MRI brain scans
Wei et al. GeoDualCNN: Geometry-supporting dual convolutional neural network for noisy point clouds
JP4586103B2 (ja) 画像抽出方法及び装置
JP2000216979A (ja) 画像抽出方法及び装置並びに記憶媒体
Kwon et al. Rolled fingerprint construction using MRF-based nonrigid image registration
Garrido et al. Image segmentation with cage active contours
CN113962957A (zh) 医学图像处理方法、骨骼图像处理方法、装置、设备
Yang et al. Scale-aware auto-context-guided Fetal US segmentation with structured random forests
JP2000048212A (ja) 画像処理方法及び装置、記録媒体
CN112837420A (zh) 基于多尺度和折叠结构的兵马俑点云的形状补全方法及***
JP7364959B2 (ja) 被写体別特徴点分離装置、被写体別特徴点分離方法及びコンピュータプログラム
Wilson et al. Bias–Variance Analysis for Controlling Adaptive Surface Meshes
Wang et al. A divide and conquer deformable contour method with a model based searching algorithm

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090910

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090910

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100603

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100615

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100831

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100906

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130910

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees