JP4793698B2 - 画像処理システム、3次元形状推定システム、物***置姿勢推定システム及び画像生成システム - Google Patents

画像処理システム、3次元形状推定システム、物***置姿勢推定システム及び画像生成システム Download PDF

Info

Publication number
JP4793698B2
JP4793698B2 JP2007519086A JP2007519086A JP4793698B2 JP 4793698 B2 JP4793698 B2 JP 4793698B2 JP 2007519086 A JP2007519086 A JP 2007519086A JP 2007519086 A JP2007519086 A JP 2007519086A JP 4793698 B2 JP4793698 B2 JP 4793698B2
Authority
JP
Japan
Prior art keywords
illumination
individual
parameter
image
dimensional shape
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007519086A
Other languages
English (en)
Other versions
JPWO2006129791A1 (ja
Inventor
塁 石山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007519086A priority Critical patent/JP4793698B2/ja
Publication of JPWO2006129791A1 publication Critical patent/JPWO2006129791A1/ja
Application granted granted Critical
Publication of JP4793698B2 publication Critical patent/JP4793698B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01BMEASURING LENGTH, THICKNESS OR SIMILAR LINEAR DIMENSIONS; MEASURING ANGLES; MEASURING AREAS; MEASURING IRREGULARITIES OF SURFACES OR CONTOURS
    • G01B11/00Measuring arrangements characterised by the use of optical techniques
    • G01B11/24Measuring arrangements characterised by the use of optical techniques for measuring contours or curvatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/10Constructive solid geometry [CSG] using solid primitives, e.g. cylinders, cubes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/60Extraction of image or video features relating to illumination properties, e.g. using a reflectance or lighting model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/169Holistic features and representations, i.e. based on the facial image taken as a whole

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Geometry (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Computer Graphics (AREA)
  • Image Generation (AREA)
  • Processing Or Creating Images (AREA)

Description

本発明は、入力した画像を処理する画像処理システム、画像処理方法及び画像処理プログラムに関する。特に、本発明は、位置姿勢や照明条件の分からない入力画像から、その入力画像に写っており且つ形状やテクスチャが分かっていない物体の3次元形状、又はその物体の位置/姿勢を推定する3次元形状推定システム、物***置姿勢推定システム、3次元形状推定方法及び物***置姿勢推定方法に関する。また、本発明は、入力画像を再現した再現画像を生成する画像生成システム及び画像生成方法に関する。
近年、3次元形状データを用いて画像を生成するコンピュータグラフィクス(CG)の技術が発展し、実際の画像に近いリアルな画像を生成することが行われている(例えば、非特許文献1参照)。例えば、非特許文献1に記載されたCG技術を用いる場合、個別の物体の3次元形状データ(3D形状ともいう)と表面の色情報(テクスチャ)とを用意する。そして、カメラに対する位置姿勢を指定し、撮影環境に存在する照明の位置や種類、強度を指定すれば、実際の画像に近いリアルな画像を生成することができる。
一般に、人間の顔等の設計図のない物体の場合、個別の物体の3D形状とテクスチャとを得るために、特殊な計測装置を用いる必要がある。そこで、予め所定の変形モデルを用意し、3D形状とテクスチャとを生成する方法が開発されている。この場合、様々な人物の顔等に類似した物体の集合に対して、予めある程度の数の物体について計測を行い汎用の変形モデルを用意する。そして、用意した汎用の変形モデルに適当な数値パラメータを与えることによって、計測していない個別の物体の3D形状とテクスチャとを生成する。
例えば、所定の変形モデルを用いて3D形状とテクスチャとを推定する技術の一例が非特許文献2に記載されている。非特許文献2に記載された技術では、予め多数の人物の顔の3D形状とテクスチャとを3次元形状計測装置を用いて計測し、計測したデータ群から計測していない任意の人物の顔の3次元形状とテクスチャとを生成できる汎用3次元顔モデルを生成する。この汎用顔モデルは、多数の人物の顔の3D形状とテクスチャとのそれぞれの平均値と、それら平均値からの変化量を表す基底ベクトル群とを記憶しておき、基底ベクトル群に係数パラメータをかけたものをそれら平均値に加算することによって、任意の人物の顔の3D形状とテクスチャとを近似するものである。すなわち、形状及びテクスチャそれぞれのパラメータを指定すれば、個別の人物の顔の3D形状データとテクスチャとが得られる。
この非特許文献2に記載された汎用顔モデルと、非特許文献1に記載されたCG技術とを組み合わせると、所望の画像を再現できることになる。この場合、ある個別の物体について、その3D形状、テクスチャ、位置姿勢及び照明条件のそれぞれのパラメータ群を指定すると、所望の画像を再現できる。
また、非特許文献2に記載された技術を利用して、ある個別物体の1枚の入力画像からその個別物体の3次元形状とテクスチャとを推定することもできる。図11は、汎用顔モデルに基づいて物体の3次元形状を推定する3次元形状推定システムの構成の一例を示すブロック図である。図11に示すように、従来の汎用顔モデルに基づく3次元形状推定システムは、汎用顔モデル生成手段900、照明条件初期値入力手段901、位置姿勢初期値入力手段902、顔モデル生成手段903、透視変換手段904、陰影シャドウ生成手段905及びパラメータ更新手段906を含む。このような構成を有する従来の3次元形状推定システムは、以下のように動作する。
汎用顔モデル生成手段900は、予め汎用顔モデル(汎用3D顔モデルともいう)を生成する。また、汎用顔モデル生成手段900は、生成した汎用3D顔モデルを顔モデル生成手段903に出力する。
照明条件初期値入力手段901は、3次元形状を推定しようとする物体が写っている入力画像について、その入力画像を撮影したときの照明の状態を示す照明パラメータの概略値を初期値として入力する。例えば、照明条件初期値入力手段901は、一例として、1個の無限遠方にある点光源の方向を(lθ,lφ)とし、その点光源の3次元方向ベクトルl、強度L及び拡散光の強度を示す値aを、照明パラメータとして入力する。
また、照明条件初期値入力手段901を用いた入力方法の例として、例えば、入力画像と、非特許文献1に記載されたCG技術によって生成した3次元画像とをコンピュータ端末に並べて表示させる。そして、コンピュータ端末の画面を見ながら、入力画像にできるだけ近い陰影とシャドウとが表示されるように、利用者(例えば、オペレータ)が手動で調整することによって、照明パラメータを入力することができる。
位置姿勢初期値入力手段902は、入力画像に写っている物体の位置と姿勢とを示すパラメータ(位置姿勢パラメータという)の概略値を初期値として入力する。例えば、位置姿勢初期値入力手段902は、一例として、物体の位置を3次元座標ベクトルoとし、物体の向きをx、y、z軸周りの回転角γ、θ、φで表した場合に、それら回転角の回転を示す行列Rを、位置姿勢パラメータとして入力する。
また、顔モデル生成手段903を用いた入力方法の一例として、例えば、非特許文献1に記載されたCG技術によって生成した3次元画像を入力画像と並べてコンピュータ端末に表示させる。そして、コンピュータ端末の画面を見ながら、入力画像にできるだけ近い向きで物体が表示されるように、利用者が手動で調整することによって、位置姿勢パラメータを入力することができる。また、他の入力方法の例として、例えば、利用者は、物体の特徴的な部位の位置を選択して、その選択した部位の画像上の位置を入力する。そして、予め各部位の3次元座標データを記憶しておき、予め記憶する3次元座標データのうち、入力位置に該当する部位の3次元座標データを用いて、物体の位置姿勢パラメータを計算することも可能である。
顔モデル生成手段903は、汎用顔モデル生成手段900が予め計算した汎用3D顔モデルを記憶する。また、顔モデル生成手段903は、3次元形状パラメータとテクスチャパラメータとを入力し、汎用3D顔モデルを用いて、入力したパラメータに記述される人物固有の個別3次元形状と個別テクスチャデータとを算出して出力する。
汎用3D顔モデルは、予め計測を行った多数(例えば、200名程度)の人物の3次元形状{S’}とテクスチャデータ{T’}とから計算された平均値{バーS,バーT}と、それら平均値からのずれを示す基底ベクトル群{S,T}とからなる。汎用顔モデル生成手段900は、まず、平均値を引いた3次元形状ベクトルを並べた行列(共分散行列)Sを、式(1)を用いて作成する。
Figure 0004793698
また、汎用顔モデル生成手段900は、その共分散行列Sの固有値及び固有ベクトルを求め、求めた固有値σS,i が大きいものからn個(例えば、100個程度)分、対応する基底ベクトル群{S}を記憶しておく。すると、n個の固有値を対角成分にもつ行列をΣとし、基底ベクトル群{S}を並べた行列をVとして、汎用顔モデル生成手段900は、式(2)に示す近似を行ったことになる。
Figure 0004793698
また、汎用顔モデル生成手段900は、テクスチャについても3次元形状データと全く同様に計算することによって、100個程度の固有値σT,i と基底ベクトル{T}とを計算し記憶しておく。
以上に示す計算によって、汎用顔モデル生成手段900が求めた基底ベクトルと固有値データとが、汎用3D顔モデルとなる。
ある個別の人物の顔の3次元形状データは、顔表面の各点iの3次元座標値(x,y,z)を並べたベクトルS=[x,y,z,x,y,z,...,x,y,zとテクスチャの輝度値tとを並べたベクトルを、T=[t,t,...,t]とすると、式(3)で表される。
Figure 0004793698
ここで、式(3)において、{s}は形状パラメータであり、{t}はテクスチャパラメータである。すなわち、顔モデル生成手段103は、形状パラメータ{s}及びテクスチャパラメータ{t}を入力し、式(3)を用いて、個別3次元形状S及び個別テクスチャTを算出し出力する。なお、図11に示す3次元形状推定システムは、後述するように、繰り返し各パラメータの更新処理を行い、所定の収束条件が成立した場合の各パラメータ値を3次元形状の推定結果として出力する。この場合、顔モデル生成手段903は、繰り返し処理の初回の処理時には、形状パラメ−タとテクスチャパラメータとの初期値として値0を用いて、個別3次元形状S及び個別テクスチャTを算出する。
透視変換手段904は、個別3次元形状S、個別テクスチャT及び物体の位置姿勢パラメータを入力とし、3次元形状の各データ点が、生成する再現画像中のどの画素に見えるかを示す対応テーブルを計算する。入力画像を撮影したカメラの焦点距離をfとし、画像中心を(c,c)とすると、透視変換手段904は、3次元顔モデルの点iの画像座標(u,v)を、式(4)を用いて計算する。
Figure 0004793698
透視変換手段904は、3次元形状の表面全体を三角形のポリゴンに分割し、ポリゴンの各頂点について(u,v)を計算し、ポリゴン内部の点を埋めてZの値を用いた陰面消去処理を行う。この陰面消去処理はCG技術の標準的手法であり、様々なグラフィクスライブラリプログラムを利用して行うことができる。この陰面消去処理の結果、透視変換手段904は、再現画像の各画素iに対応するポリゴンjの対応関係を示す対応テーブルを求めることができる。
陰影シャドウ生成手段905は、個別3次元形状、対応テーブル及び個別テクスチャを入力とし、再現画像の各画素の輝度値を計算する。陰影シャドウ生成手段905は、例えば、一例として、非特許文献1に記載されたCG技術の標準的手法を利用して、陰影の生成処理を行うことが可能である。まず、陰影シャドウ生成手段905は、個別3次元形状Sの各データ点iについて法線ベクトルnを計算する。また、物体表面上で点iの属する3角ポリゴンの他の2頂点のデータ点を反時計回りに(j,k)とし、点(i,j,k)の3次元座標を表す3次元ベクトルをp、p、pとすると、陰影シャドウ生成手段905は、式(5)を用いて、法線ベクトルnを計算できる。
Figure 0004793698
また、陰影シャドウ生成手段905は、全てのデータ点について法線ベクトルを求めると、画素iの輝度値Iを、Phongの反射モデルを用いて式(6)によって計算する(非特許文献1参照)。
=(a+Lnl)T(j)+ckL(r)v
=2(nl)n−l 式(6)
ただし、式(6)において、T(j)は、対応テーブルによって示される画素iに対応するポリゴンjのテクスチャ輝度値である。また、kは鏡面反射定数(固定値)であり、vは鏡面反射特性(固定値)である。また、cは、ポリゴンjが光源方向lに対してシャドウに覆われるか否かを示す値であり、0又は1の値をとる。陰影シャドウ生成手段905は、光線追跡法等CG技術の標準的手法を用いて計算することによって、キャストシャドウの判定を行うことができる。
以上の処理によって、陰影シャドウ生成手段905は、再現画像の各画素について輝度値を計算し、計算結果に基づいて再現画像を生成する。以下、対応する形状データ点が存在する画素の輝度値を並べたベクトルを、Imodel=(I,I,...,I)とする。また、各画素に対応する入力画像の輝度値を並べたベクトルをIinputとする。
パラメータ更新手段906は、入力画像と陰影シャドウ生成手段905が生成した再現画像とを比較し、再現画像が入力画像に近くなるように、位置姿勢、照明、3次元形状及びテクスチャの各パラメータを変化させる。3次元形状推定システムは、上記に示す顔モデル生成手段903、透視変換手段904、陰影シャドウ生成手段905及びパラメータ更新手段906を用いた処理を繰り返し実行することによって、最適なパラメータ値を探索する。
パラメータ更新手段906は、まず、画像の類似度に関するコスト関数Eを、式(7)を用いて求める。
=|Imodel−Iinput 式(7)
次に、パラメータ更新手段906は、モデルの事前確率分布に従った形状パラメータとテクスチャパラメータとに対するコスト関数Eを、式(8)を用いて求める。
Figure 0004793698
パラメータ更新手段906は、確率的降下法によって、コスト関数Eを最小化するようなパラメータを探索する。そのため、パラメータ更新手段906は、形状、テクスチャ、照明及び位置姿勢のそれぞれのパラメータに対するEの微分値Jを、式(9)を用いて計算する。
Figure 0004793698
全パラメータを並べたベクトルをα=[s,t,lθ,lφ,a,p,θ,γ,φ]とすると、パラメータ更新手段906は、式(10)を用いてパラメータを新しい値αに更新する。
α=α−(JJ)−1JE 式(10)
パラメータ更新手段906は、計算したパラメータの更新量が予め定めた閾値より小さい場合、繰り返し処理が収束したと判定し処理を終了する。また、例えば、パラメータ更新手段906は、更新前のパラメータを用いて生成した再現画像と入力画像との誤差より、更新後のパラメータを用いて生成した再現画像と入力画像との誤差が小さくならない場合、繰り返し処理が収束したと判定し処理を終了する。そして、3次元形状推定システムは、繰り返し処理の過程で最も入力画像に近い画像を生成できた時の個別3次元形状を、3次元形状推定結果として出力する。
Manson Woo, Jackie Neider, Tom Davis, "OpenGLプログラミングガイド(原著第2版)",アジソン・ウェスレイ・パブリッシャーズ・ジャパン株式会社,p.169−195 Volker Blanz, Thomas Vetter, "Face Recognition Based on Fitting a 3D Morphable Model", PAMI, 2003, vol. 25, No. 9, pp.1063-1074
図11に示す従来の3次元形状推定システムでは、第1の課題として、照明条件のパラメータの初期値が必要であり、照明パラメータの初期値の入力負担が大きいという課題がある。また、照明パラメータは、拡散光源の強度や点光源の方向及び強度を表す物理的なパラメータであることによって、入力画像が撮影された現実の照明環境を記述するものでなければならない。一般に、物体の位置姿勢のパラメータは感覚的に理解しやすいので、位置姿勢パラメータの初期値を入力することは困難ではない。しかし、現実の撮影環境では多数の位置に多様な種類の光源が存在しているので、この撮影環境を近似する照明パラメータの値を、利用者(例えば、オペレータ)が人手によって決定するのは困難で手間のかかる作業である。
また、従来の3次元形状推定システムでは、第2の課題として、生成する画像の輝度値と照明パラメータとの関係が非線形であり、処理負担が大きいという課題がある。すなわち、非線形なモデルに対して最適なパラメータを探索するために多くの繰り返し処理を要するので、処理時間がかかり処理負担が大きい。また、非線形なモデルに対して多くの繰り返し処理を要するので、局所解に陥りやすく、パラメータの正確な推定が困難である。
また、従来の3次元形状推定システムでは、第3の課題として、CG技術によって陰影を再現するために法線ベクトルの計算処理が必要となり、またシャドウの生成のために光線追跡処理が必要となるので、処理負担が大きいという課題がある。すなわち、これら法線ベクトルの計算処理や光線追跡処理は極めて計算量が多いので、処理時間がかかり処理負担が大きい。また、図11に示す3次元形状推定システムの場合、確率的降下法によって3次元形状のパラメータを変化させながら画像の生成を繰り返す。そのため、繰り返しの度に画像生成を行う3次元形状が変化し、法線ベクトルやシャドウの状態が変化する。
そこで、本発明は、照明条件のパラメータの初期値を事前に調べたり、利用者が手動で入力したりしなくても、画像を処理できる画像処理システム、3次元形状推定システム、物***置姿勢推定システム、画像生成システム、画像処理方法、3次元形状推定方法、物***置姿勢推定方法、画像生成方法及び画像処理プログラムを提供することを目的とする。
また、本発明は、繰り返し処理の回数を少なくして処理を高速化するとともに、局所解を回避し正確なパラメータを推定できる画像処理システム、3次元形状推定システム、物***置姿勢推定システム、画像生成システム、画像処理方法、3次元形状推定方法、物***置姿勢推定方法、画像生成方法及び画像処理プログラムを提供することを目的とする。
また、本発明は、画像生成における陰影やシャドウの計算処理を高速化できる画像処理システム、3次元形状推定システム、物***置姿勢推定システム、画像生成システム、画像処理方法、3次元形状推定方法、物***置姿勢推定方法、画像生成方法及び画像処理プログラムを提供することを目的とする。さらに、本発明は、線形照明モデルを用いる際に必要となる照明基底の計算を高速に行うことができる画像処理システム、3次元形状推定システム、物***置姿勢推定システム、画像生成システム、画像処理方法、3次元形状推定方法、物***置姿勢推定方法、画像生成方法及び画像処理プログラムを提供することを目的とする。
本発明による画像処理システムは、類似した複数の物体の3次元形状データとテクスチャデータとに基づいて求めた汎用3次元物体モデルを用いて、3次元形状パラメータとテクスチャパラメータとに基づいて、個別の物体の3次元形状を示す個別3次元形状データと、個別の物体のテクスチャを示す個別テクスチャデータとを生成する個別データ生成手段(例えば、顔モデル生成手段103によって実現される)と、個別データ生成手段が生成した個別3次元形状データと個別テクスチャデータとに基づいて、複数の異なる照明条件における個別の物体の3次元表面各部位の輝度値の変動を示す個別照明基底をそれぞれ求める第1の照明基底計算手段(例えば、照明基底計算手段201によって実現される)と、第1の照明基底計算手段が求めた個別照明基底群を用いて、入力画像と同じ照明条件を再現する画像である再現画像を生成する再現画像生成手段(例えば、照明補正手段203によって実現される)と、再現画像生成手段が生成した再現画像入力画像との誤差のコストを示すコスト関数を計算し、確率的降下法によって当該コスト関数を最小化するように、汎用3次元物体モデルに与える3次元形状パラメータ及びテクスチャパラメータを探索して更新し更新後の各パラメータと更新前の各パラメータとの差が予め定めた閾値より小さくなる所定の収束条件(例えば、各パラメータの更新量が所定の閾値より小さくなること)が成立するまで繰り返し更新するパラメータ更新手段(例えば、パラメータ更新手段204によって実現される)とを備えたことを特徴とする。なお、「3次元形状パラメータ」とは、標準的な形状データとテクスチャデータとに、どのような変形を与えると物体の3次元形状になるかを示すパラメータである。また、「テクスチャパラメータ」とは、標準的な形状データとテクスチャデータとに、どのような変動を与えると物体のテクスチャになるかを示すパラメータである。
また、画像処理システムにおいて、第1の照明基底計算手段は、個別データ生成手段が生成した個別3次元形状データに基づいて、球面調和関数を用いて個別照明基底を求めるものであってもよい。
また、画像処理システムにおいて、第1の照明基底計算手段は、複数の異なる照明条件を設定する照明条件設定手段(例えば、プログラムに従って動作する情報処理装置のCPUによって実現される)と、照明条件設定手段が設定した各照明条件における物体表面各部位の輝度値をそれぞれ求める輝度計算手段(例えば、プログラムに従って動作する情報処理装置のCPUによって実現される)と、輝度計算手段が求めた輝度値に基づいて、個別照明基底群を求める計算手段(例えば、プログラムに従って動作する情報処理装置のCPUによって実現される)とを含むものであってもよい。
また、画像処理システムは、類似した複数の物体の3次元形状データとテクスチャデータとに基づいて求めた汎用3次元物体モデルを用いて、3次元形状パラメータとテクスチャパラメータとに基づいて、個別の物体の3次元形状を示す個別3次元形状データと、個別の物体のテクスチャを示す個別テクスチャデータとを生成する個別データ生成手段と、汎用3次元物体モデルに対応する、個別の物体にあてられた照明の方向及び強度の違いによる反射の具合の基本的な変動を示すデータである照明基底を生成するための汎用照明基底モデルを生成する汎用照明基底モデル生成手段(例えば、汎用照明基底モデル生成手段300によって実現される)と、汎用照明基底モデル生成手段が生成した汎用照明基底モデルを用いて、複数の異なる照明条件における個別の物体の3次元表面各部位の輝度値の変動を示す個別照明基底をそれぞれ求める第2の照明基底計算手段(例えば、照明基底モデル計算手段301によって実現される)とを備えたものであってもよい。
また、画像処理システムは、個別データ生成手段が生成した個別3次元形状データと、第2の照明基底計算手段が生成した個別照明基底とを出力する出力手段を備えたものであってもよい。
また、画像処理システムは、第2の照明基底計算手段が求めた個別照明基底群を用いて、入力画像と同じ照明条件を再現する画像である再現画像を生成する再現画像生成手段と、再現画像生成手段が生成した再現画像入力画像との誤差のコストを示すコスト関数を計算し、確率的降下法によって当該コスト関数を最小化するように、汎用3次元物体モデルに与える3次元形状パラメータ及びテクスチャパラメータを探索して更新し更新後の各パラメータと更新前の各パラメータとの差が予め定めた閾値より小さくなる所定の収束条件が成立するまで繰り返し更新するパラメータ更新手段とを備えたものであってもよい。
また、画像処理システムにおいて、第2の照明基底計算手段は、汎用照明基底モデル生成手段が汎用3次元物体モデルを用いて生成する個別3次元形状データに対応する個別照明基底を、汎用3次元物体形状モデルに与える3次元形状パラメータと同一のパラメータを用いて求めるものであってもよい。
また、画像処理システムにおいて、汎用照明基底モデル生成手段は、汎用3次元物体モデルに与えるためのランダムな3次元形状パラメータを設定するパラメータ設定手段(例えば、サンプルパラメータ設定手段3001によって実現される)と、パラメータ設定手段が設定したパラメータ群を汎用3次元物体モデルに与えることによって生成されるサンプル3次元形状群に基づいて、各パラメータそれぞれに対応する照明基底群を求める第3の照明基底計算手段(例えば、照明基底計算手段3002によって実現される)と、第3の照明基底計算手段が求めた照明基底群と、汎用3次元物体モデルの基底ベクトル及び固有値とを用いて、汎用照明基底モデルの基底ベクトルを求める基底計算手段(例えば、基底モデル計算手段3003によって実現される)とを含むものであってもよい。
また、画像処理システムにおいて、第3の照明基底計算手段は、個別3次元形状データに基づいて、球面調和関数を用いて個別照明基底を求めるものであってもよい。
また、画像処理システムにおいて、第3の照明基底計算手段は、複数の異なる照明条件を設定する照明条件設定手段(例えば、プログラムに従って動作する情報処理装置のCPUによって実現される)と、照明条件設定手段が設定した各照明条件における物体表面各部位の輝度値をそれぞれ求める輝度計算手段(例えば、プログラムに従って動作する情報処理装置のCPUによって実現される)と、輝度計算手段が求めた輝度値に基づいて、主成分分析によって個別照明基底群を求める計算手段(例えば、プログラムに従って動作する情報処理装置のCPUによって実現される)とを含むものであってもよい。
本発明による3次元形状推定システムは、画像処理システムを用いた、物体の3次元形状を推定する3次元形状推定システムであって、所定の収束条件が成立すると、収束した時点における3次元形状パラメータ及びテクスチャパラメータに基づいて、汎用3次元物体モデルによって生成される3次元形状を出力する形状出力手段(例えば、画像処理システムを実現する情報処理装置が備える出力手段)を備えたことを特徴とする。
本発明による物***置姿勢推定システムは、画像処理システムを用いた、物体の位置及び姿勢を推定する物***置姿勢推定システムであって、所定の収束条件が成立すると、収束した時点における、物体の位置及び姿勢を示す位置姿勢パラメータを出力する位置姿勢出力手段(例えば、画像処理システムを実現する情報処理装置が備える出力手段)を備えたことを特徴とする。
本発明による画像生成システムは、画像処理システムを用いた、入力画像と同じ照明条件を再現する画像である再現画像を生成する画像生成システムであって、所定の収束条件が成立すると、収束した時点における再現画像を出力する画像出力手段(例えば、画像処理システムを実現する情報処理装置が備える出力手段)を備えたことを特徴とする。
本発明による画像処理方法は、個別データ生成手段が、類似した複数の物体の3次元形状データとテクスチャデータとに基づいて求めた汎用3次元物体モデルを用いて、3次元形状パラメータとテクスチャパラメータとに基づいて、個別の物体の3次元形状を示す個別3次元形状データと、個別の物体のテクスチャを示す個別テクスチャデータとを生成する個別データ生成第1の照明基底計算手段が、生成した個別3次元形状データと個別テクスチャデータとに基づいて、複数の異なる照明条件における個別の物体の3次元表面各部位の輝度値の変動を示す個別照明基底をそれぞれ求め、再現画像生成手段が、求めた個別照明基底群を用いて、入力画像と同じ照明条件を再現する画像である再現画像を生成パラメータ更新手段が、生成した再現画像入力画像との誤差のコストを示すコスト関数を計算し、確率的降下法によって当該コスト関数を最小化するように、汎用3次元物体モデルに与える3次元形状パラメータ及びテクスチャパラメータを探索して更新し更新後の各パラメータと更新前の各パラメータとの差が予め定めた閾値より小さくなる所定の収束条件が成立するまで繰り返し更新することを特徴とする。
また、画像処理方法は、第1の照明基底計算手段が、個別データ生成ステップで生成した個別3次元形状データに基づいて、球面調和関数を用いて個別照明基底を求めるものであってもよい。
また、画像処理方法は、第1の照明基底計算手段が、複数の異なる照明条件を設定し、設定した各照明条件における物体表面各部位の輝度値をそれぞれ求め、求めた輝度値に基づいて、個別照明基底群を求めるものであってもよい。
また、本発明による画像処理方法は、個別データ生成手段が、類似した複数の物体の3次元形状データとテクスチャデータとに基づいて求めた汎用3次元物体モデルを用いて、3次元形状パラメータとテクスチャパラメータとに基づいて、個別の物体の3次元形状を示す個別3次元形状データと、個別の物体のテクスチャを示す個別テクスチャデータとを生成汎用照明基底モデル生成手段が、汎用3次元物体モデルに対応する、個別の物体にあてられた照明の方向及び強度の違いによる反射の具合の基本的な変動を示すデータである照明基底を生成するための汎用照明基底モデルを生成第2の照明基底計算手段が、生成した汎用照明基底モデルを用いて、複数の異なる照明条件における個別の物体の3次元表面各部位の輝度値の変動を示す個別照明基底をそれぞれ求めることを特徴とする
また、画像処理方法は、出力手段が、個別データ生成手段が生成した個別3次元形状データと、第2の照明基底計算手段が生成した個別照明基底とを出力するものであってもよい。
また、画像処理方法は、再現画像生成手段が、第2の照明基底計算手段が求めた個別照明基底群を用いて、入力画像と同じ照明条件を再現する画像である再現画像を生成パラメータ更新手段が、生成した再現画像入力画像との誤差のコストを示すコスト関数を計算し、確率的降下法によって当該コスト関数を最小化するように、汎用3次元物体モデルに与える3次元形状パラメータ及びテクスチャパラメータを探索して更新し更新後の各パラメータと更新前の各パラメータとの差が予め定めた閾値より小さくなる所定の収束条件が成立するまで繰り返し更新するパラメータ更新ステップとを含むものであってもよい。
また、画像処理方法は、第2の照明基底計算手段が、汎用照明基底モデル生成手段が汎用3次元物体モデルを用いて生成する個別3次元形状データに対応する個別照明基底を、汎用3次元物体形状モデルに与える3次元形状パラメータと同一のパラメータを用いて求めるものであってもよい。
また、画像処理方法は、パラメータ設定手段が、汎用3次元物体モデルに与えるためのランダムな3次元形状パラメータを設定第3の照明基底計算手段が、設定したパラメータ群を汎用3次元物体モデルに与えることによって生成されるサンプル3次元形状群に基づいて、各パラメータそれぞれに対応する照明基底群を求め、基底計算手段が、求めた照明基底群と、汎用3次元物体モデルの基底ベクトル及び固有値とを用いて、汎用照明基底モデルの基底ベクトルを求めるものであってもよい。
また、画像処理方法は、第3の照明基底計算手段が、個別3次元形状データに基づいて、球面調和関数を用いて個別照明基底を求めるものであってもよい。
また、画像処理方法は、第3の照明基底計算手段が、複数の異なる照明条件を設定し、設定した各照明条件における物体表面各部位の輝度値をそれぞれ求め、求めた輝度値に基づいて、主成分分析によって個別照明基底群を求めるものであってもよい。
本発明による3次元形状推定方法は、画像処理方法を用いた、物体の3次元形状を推定する3次元形状推定方法であって、形状出力手段が、所定の収束条件が成立すると、収束した時点における3次元形状パラメータ及びテクスチャパラメータに基づいて、汎用3次元物体モデルによって生成される3次元形状を出力する形状出力ステップを含むことを特徴とする。
本発明による物***置姿勢推定方法は、画像処理方法を用いた、物体の位置及び姿勢を推定する物***置姿勢推定方法であって、位置姿勢出力手段が、所定の収束条件が成立すると、収束した時点における、物体の位置及び姿勢を示す位置姿勢パラメータを出力することを特徴とする。
本発明による画像生成方法は、画像処理方法を用いた、入力画像と同じ照明条件を再現する画像である再現画像を生成する画像生成方法であって、画像出力手段が、所定の収束条件が成立すると、収束した時点における再現画像を出力することを特徴とする。
本発明による画像処理プログラムは、コンピュータ、類似した複数の物体の3次元形状データとテクスチャデータとに基づいて求めた汎用3次元物体モデルを用いて、3次元形状パラメータとテクスチャパラメータとに基づいて、個別の物体の3次元形状を示す個別3次元形状データと、個別の物体のテクスチャを示す個別テクスチャデータとを生成する個別データ手段と、生成した個別3次元形状データと個別テクスチャデータとに基づいて、複数の異なる照明条件における個別の物体の3次元表面各部位の輝度値の変動を示す個別照明基底をそれぞれ求める第1の照明基底計算手段と、求めた個別照明基底群を用いて、入力画像と同じ照明条件を再現する画像である再現画像を生成する再現画像生成手段と、生成した再現画像入力画像との誤差のコストを示すコスト関数を計算し、確率的降下法によって当該コスト関数を最小化するように、汎用3次元物体モデルに与える3次元形状パラメータ及びテクスチャパラメータを探索して更新し更新後の各パラメータと更新前の各パラメータとの差が予め定めた閾値より小さくなる所定の収束条件が成立するまで繰り返し更新するパラメータ更新手段として機能させるためのものである
また、本発明による画像処理プログラムは、コンピュータ、類似した複数の物体の3次元形状データとテクスチャデータとに基づいて求めた汎用3次元物体モデルを用いて、3次元形状パラメータとテクスチャパラメータとに基づいて、個別の物体の3次元形状を示す個別3次元形状データと、個別の物体のテクスチャを示す個別テクスチャデータとを生成する個別データ生成手段と、汎用3次元物体モデルに対応する、個別の物体にあてられた照明の方向及び強度の違いによる反射の具合の基本的な変動を示すデータである照明基底を生成するための汎用照明基底モデルを生成する汎用照明基底モデル生成手段と、生成した汎用照明基底モデルを用いて、複数の異なる照明条件における個別の物体の3次元表面各部位の輝度値の変動を示す個別照明基底をそれぞれ求める第2の照明基底計算手段として機能させるためのものである
本発明によれば、照明基底を用いて再現画像の輝度値を計算する。照明による画像輝度値の変動を照明基底の線形和で示す線形照明モデルを利用して処理を実行するので、照明パラメータの初期値を必要とせず、任意の照明条件の画像の輝度値を再現することができる。従って、照明条件のパラメータの初期値を事前に調べたり、利用者が手動で入力したりしなくても、画像を処理することができる。
例えば、一般に、現実の撮影環境では多数の位置に多様な種類の光源が存在しているので、位置姿勢パラメータの値を入力する場合と比較して、撮影環境を近似する照明パラメータの値を利用者(例えば、オペレータ)が入力することは難しい。本発明によれば、照明パラメータの初期値を入力しなくても入力画像を処理できるので、利用者の操作負担を低減することができる。
また、本発明によれば、線形照明モデルを用いることによって、照明パラメータを確率的降下法によって探索する必要がなくなる。そのため、照明パラメータに関して画像生成を繰り返す非線形最適化処理を行う必要をなくすことができる。従って、3次元形状パラメータ及びテクスチャパラメータの推定のための繰り返し処理の回数を少なくして処理を高速化するとともに、局所解を回避し正確なパラメータを推定することができる。
また、本発明において、予め汎用照明基底モデルを計算するように構成すれば、汎用照明基底モデルを用いて、3次元形状パラメータから簡単な線形演算のみを行うことによって照明基底を得ることができる。そのため、汎用照明基底モデルを用いて個別照明基底の計算を行うことによって、法線ベクトルの計算や、シャドウを含めた個別照明基底の計算に必要な学習画像の生成処理を不要とすることができる。従って、画像生成における陰影やシャドウの計算処理を高速化でき、線形照明モデルを用いる際に必要となる照明基底の計算を高速に行うことができる。
本発明による画像処理システムの構成の一例を示すブロック図である。 照明基底計算手段の構成の一例を示すブロック図である。 画像処理システムが入力画像を処理し各パラメータを求める処理の一例を示す流れ図である。 画像処理システムの他の構成例を示すブロック図である。 汎用照明基底モデル生成手段の構成の一例を示すブロック図である。 画像処理システムが予め汎用照明基底モデルを生成する処理の一例を示す流れ図である。 画像処理システムが入力画像を処理し各パラメータを求める処理の他の例を示す流れ図である。 画像処理システムのさらに他の構成例を示すブロック図である。 画像処理システムの一具体例を示す説明図である。 入力画像、及び入力画像をCG技術によって生成した再現画像の例を示す説明図である。 従来の3次元形状推定システムの構成例を示すブロック図である。
符号の説明
102 位置姿勢初期値入力手段
103 顔モデル生成手段
201 照明基底計算手段
202 透視変換手段
203 照明補正手段
204 パラメータ更新手段
300 汎用照明基底モデル生成手段
301 照明基底モデル計算手段
401 画像入力装置
402 処理用コンピュータ
403 記憶装置
404 記憶媒体
2011 法線ベクトル計算手段
2012 調和関数計算手段
3001 サンプルパラメータ設定手段
3002 照明基底計算手段
3003 基底モデル計算手段
(実施の形態1)
以下、本発明の第1の実施の形態について図面を参照して説明する。図1は、本発明による画像処理システムの構成の一例を示すブロック図である。図1に示すように、画像処理システムは、位置姿勢初期値入力手段102と、顔モデル生成手段103と、照明基底計算手段201と、透視変換手段202と、照明補正手段203と、パラメータ更新手段204とを含む。
画像処理システムは、具体的には、ワークステーションやパーソナルコンピュータ等の情報処理装置によって実現される。また、本実施の形態において、画像処理システムは、例えば、物体の3次元形状及びテクスチャを推定する3次元形状推定システムの用途に用いられる。また、画像処理システムは、例えば、物体の位置や姿勢を推定する物***置姿勢推定システムの用途に用いられる。また、画像処理システムは、例えば、入力画像を再現した所定の再現画像(例えば、CG画像)を生成する画像生成システムの用途に用いられる。
位置姿勢初期値入力手段102は、具体的には、プログラムに従って動作する情報処理装置のCPU、及びマウスやキーボード等の入力装置によって実現される。位置姿勢初期値入力手段102は、入力画像中の物体の位置及び姿勢を示すパラメータである位置姿勢パラメータの初期値を入力する機能を備える。例えば、物体の位置を3次元座標ベクトルoとし、物体の向きをx、y、z軸周りの回転角γ、θ、φで表すとする。この場合に、位置姿勢初期値入力手段102は、回転角γ、θ、φの回転を示す行列Rを、位置姿勢パラメータとして入力する。
また、例えば、位置姿勢パラメータの初期値の入力の際に、位置姿勢初期値入力手段102は、CG技術を用いて生成した3次元画像(CG画面ともいう)を入力画像と並べて、ディスプレイ装置等の表示装置に表示させる。この場合、利用者(例えば、オペレータ)は、表示画面を見ながら、キーボードやマウス等の入力装置を操作して、入力画像中の物体の向きに近くなるようにCG画面中の物体の向きを調整することによって、位置姿勢パラメータの初期値を入力指示する。そして、位置姿勢初期値入力手段102は、利用者の入力指示に従って、位置姿勢パラメータの初期値を入力する。
顔モデル生成手段103は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。顔モデル生成手段103は、3次元形状パラメータとテクスチャパラメータを入力とし、汎用3次元顔モデルを用いて、個別の物体(人物)の3次元形状を示す個別3次元形状と、個別の物体のテクスチャを示す個別テクスチャとを計算する機能を備える。
「3次元形状パラメータ」とは、標準的な形状データとテクスチャデータとに、どのような変形を与えると物体の3次元形状になるかを示すパラメータである。本実施の形態では、「3次元形状パラメータ」は、汎用3次元顔モデルに示される平均的な形状に対して、どのような変形を与えるとその人物の顔の3次元形状になるかを示す数値パラメータである。また、「3次元形状パラメータ」は、汎用3次元顔モデルを用いて、個人の顔の3次元形状を記述するためのパラメータである。
また、「テクスチャパラメータ」とは、標準的な形状データとテクスチャデータとに、どのような変動を与えると物体のテクスチャになるかを示すパラメータである。本実施の形態では、「テクスチャパラメータ」は、汎用3次元顔モデルに示される平均的なテクスチャに対して、どのような変動を与えるとその人物の顔のテクスチャになるかを示す数値パラメータである。また、「テクスチャパラメータ」は、汎用3次元顔モデルを用いて、個人の顔の表面のテクスチャを記述するためのパラメータである。
「汎用3次元顔モデル(汎用3D顔モデル)」とは、様々な人物の顔の3次元形状と顔表面のテクスチャとを、パラメータによって記述したモデルである。また、「汎用3次元モデル」は、基本的な人の顔の3次元形状及び顔表面のテクスチャ(反射率又は色)と、それら3次元形状やテクスチャの変形を示すデータとからなる。本実施の形態では、「汎用3次元モデル」は、予め計測を行った複数の人物(例えば、200名程度)の3次元形状とテクスチャデータとから計算された平均値と、それら平均値からのずれを示す基底ベクトル群とからなる。
本実施の形態では、個別の人物に対する3次元形状パラメータとテクスチャパラメータとが分かれば、3次元形状パラメータ及びテクスチャデータを汎用3次元顔モデルに当てはめることによって、個別の人物の顔モデルを求めることができる。以下、3次元形状パラメータ及びテクスチャデータを汎用3次元顔モデルに当てはめることによって、個別の人物の顔モデルを求めることを、「汎用3次元顔モデルに3次元形状パラメータ及びテクスチャパラメータを与える」とも表現する。
例えば、画像処理システムは、予め汎用3次元顔モデルを生成する汎用顔モデル生成手段(図示せず)を備える。汎用顔モデル生成手段は、式(1)及び式(2)を用いて、図11に示した汎用顔モデル生成手段900と同様の処理に従って、予め汎用3次元顔モデルを生成する。また、画像処理システムは、例えば、汎用顔モデル生成手段が生成した汎用3次元顔モデルを蓄積する顔モデル蓄積手段(図示せず)を備える。なお、汎用顔モデル生成手段は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。また、顔モデル蓄積手段は、具体的には、磁気ディスク装置や光ディスク装置等のデータベース装置によって実現される。
本実施の形態では、顔モデル生成手段103は、顔モデル蓄積手段が予め蓄積する汎用3次元顔モデルを用いて、個別の人物の顔モデル(具体的には、個別3次元形状及び個別テクスチャ)を求める。この場合、顔モデル生成手段103は、図11に示した顔モデル生成手段903と同様の処理に従って、式(3)を用いて個別3次元形状及び個別テクスチャを算出する。
なお、画像処理システムは、後述するように、所定の収束条件が成立するまで、繰り返し各パラメータの更新処理を行うことによって、各パラメータ(3次元形状パラメータ、テクスチャパラメータ及び位置姿勢パラメータ)の値の推定値を求める。本実施の形態では、顔モデル生成手段103は、繰り返し処理の初回の処理時には、3次元形状パラメ−タとテクスチャパラメータとの初期値として値0(ゼロ)を用いて、個別3次元形状及び個別テクスチャを算出する。
照明基底計算手段201は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。照明基底計算手段201は、顔モデル生成手段103が求めた個別3次元形状と個別テクスチャとを入力とし、様々な照明条件における個別物体表面の各位置(ポリゴン)の輝度値の変動を記述する個別照明基底を計算する機能を備える。なお、「照明基底」とは、顔にあてられた照明の方向や強度の違いによる反射の具合(輝度値)の基本的な変動を記述するデータである。
ここで、照明基底の計算方法について説明する。一般に、物体の表面反射特性がLambertian(完全散乱)に近い場合、高々9次元程度の照明基底の線形和で任意の照明条件下の画像の輝度値を近似できる。本実施の形態では、物体の表面の反射特性が完全散乱(Lambertian)で近似できる場合には、任意の照明条件下での画像輝度値の変動が、少数の照明基底の線形和で表すことができることを利用する。照明基底計算手段201は、個別の物体の個別3次元形状が既知である場合には、個別3次元形状データから法線ベクトルを計算し、さらに個別テクスチャを用いることにより、照明基底を解析的に計算する。なお、上記の照明基底の計算方法は、例えば、「Ronen Basri, David W. Jacobs, "Lambertian Reflectance and Linear Subspaces", IEEE Trans. PAMI, 2003, Vol. 25, No. 2, pp.218-233 (文献A)」に記載されている。
ただし、文献Aに記載された照明基底計算方法の技術では、シャドウを生成することが無視されている。照明基底を生成する場合に、個別3次元形状と個別テクスチャとが既知であれば、シャドウを再現可能で任意の姿勢の画像に対応できる照明基底を計算することができる。なお、上記のシャドウを再現可能な照明基底の計算方法は、例えば、「Rui Ishiyama, Shizuo Sakamoto, "Geodesic Illumination Basis: Compensating for Illumination Variations in any Pose for Face Recognition", Proc. of ICPR 2002, vol.4, pp.297-301(文献B)」に記載されている。
本実施の形態では、照明基底計算手段201は、これら文献A及び文献Bに記載された照明基底算出技術を画像処理システム(例えば、3次元形状推定システム)に用いることにより、汎用顔モデルに3次元形状パラメータとテクスチャパラメータとを与えて生成した個別3次元形状データ及び個別テクスチャから、個別照明基底を計算する。
図2は、照明基底計算手段201の構成の一例を示すブロック図である。図2に示すように、照明基底計算手段201は、法線ベクトル計算手段2011と、調和関数計算手段2012とを備える。
法線ベクトル計算手段2011は、顔モデル生成手段103が求めた個別3次元形状に基づいて、法線ベクトルを求める機能を備える。本実施の形態では、法線ベクトル計算手段2011は、個別3次元形状の各ポリゴンiについて、式(11)を用いて法線ベクトルnを計算する。
Figure 0004793698
調和関数計算手段2012は、個別3次元形状及び個別テクスチャに基づいて、所定の球面調和関数を用いて個別照明基底を求める機能を備える。本実施の形態では、調和関数計算手段2012は、法線ベクトル計算手段2011が求めた法線ベクトル、及び顔モデル生成手段103が求めた個別テクスチャに基づいて、所定の球面調和関数を用いて個別照明基底を求める。本実施の形態では、第j次元目の個別照明基底のポリゴンiの成分をbjiとし、法線ベクトルの要素をn=(x,y,z)とし、テクスチャ輝度をt(i)とすると、調和関数計算手段2012は、式(12)を用いて照明基底を計算できる。
Figure 0004793698
ここで、式(12)において、次元数を9次元として照明基底を求めたのはあくまで一例であり、例えば、調和関数計算手段2012は、計算の高速化のために次元数を減らして照明基底を求めてもよい。また、調和関数計算手段2012は、精度を向上させるために、次元数を増やして照明基底を求めることも可能である。
なお、照明基底計算手段201は、個別照明基底を算出する際に、まず、様々な照明条件を設定する。また、照明基底計算手段201は、設定した各照明条件における物体表面各部位の輝度値をそれぞれ求める。そして、照明基底計算手段201は、求めた輝度値に基づいて、個別照明基底群を求める。
透視変換手段202は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。透視変換手段202は、3形状データの3次元座標と、顔の位置/姿勢や、カメラ(入力画像の撮像手段)のパラメータとを用いて、3次元表面上の位置と画像上での座標との対応関係を決定する機能を備える。例えば、透視変換手段202は、3次元形状の各データ点が再現画像中のどの画素に見えるかを示す対応テーブルを求める。なお、「再現画像」とは、推定した3次元顔形状、テクスチャ、照明条件及び位置姿勢を用いて、入力画像と同じになるようにコンピュータが計算処理によって再現した画像である。また、「透視変換手段202」は、さらに照明基底ベクトルbの要素を並べ替える機能を備える。
本実施の形態では、透視変換手段202は、個別3次元形状、個別テクスチャ及び物体の位置姿勢パラメータを入力する。そして、透視変換手段202は、図11に示した透視変換手段904と同様の処理に従って、式(4)を用いた計算により、再現画像中の各画素iに対応する個別3次元形状のポリゴンjを決定する。すなわち、透視変換手段202は、3次元顔モデルの点iの画像座標(u,v)を、式(4)を用いて計算する。また、透視変換手段202は、再現画像の各画素に対応するポリゴンの照明基底要素を並べたベクトルb=[b10,b11,...,b1m]をj次元目の照明基底ベクトルとし、照明基底群{b}を出力する。
照明補正手段203は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。照明補正手段203は、照明基底の線形和によって画像における顔表面の輝度値を計算する際に、入力画像の陰影と同じになるように線形和の係数を補正する機能を備える。また、照明補正手段203は、照明基底計算手段201が求めた個別照明基底群を用いて、入力画像と同じ照明条件を再現する画像である再現画像を生成する機能を備える。本実施の形態では、照明補正手段203は、個別照明基底群{b}と入力画像Iinputとを入力とし、再現画像Imodelの輝度値を、式(13)に示す線形モデルによって計算する。
model=Σλ
λ=argmin(|Imodel−Iinput) 式(13)
ここで、式(13)において、{λ}は照明を示す係数であり、照明補正手段203は、線形最小二乗法により繰り返し探索を必要とせずに一意に係数{λ}値を求めることができる。
パラメータ更新手段204は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。パラメータ更新手段204は、入力画像及び照明補正手段203が生成した再現画像に基づいて、各パラメータ(3次元形状パラメータ、テクスチャパラメータ及び位置姿勢パラメータ)を更新する機能を備える。本実施の形態では、パラメータ更新手段204は、再現画像Imodelと入力画像Iinputとを比較し、再現画像が入力画像に近くなるように、位置姿勢、3次元形状及びテクスチャの各パラメータを変化させる。そして、画像処理システムは、所定の収束条件が成立するまで、顔モデル生成手段103以降の各手段が実行する処理を繰り返し、最適なパラメータ値を探索する。
パラメータ更新手段204は、まず、図11に示すパラメータ更新手段906と同様の処理に従って、式(7)を用いて、画像の類似度に関するコスト関数Eを計算する。なお、「コスト関数」とは、再現画像と入力画像との誤差のコストを示す関数である。本実施の形態では、「コスト関数」は、推定した3次元顔形状、テクスチャ、照明条件及び位置姿勢が、入力画像に対してどの程度符合しているかを示す。
また、パラメータ更新手段204は、確率的降下法によって、コスト関数Eを最小化するようなパラメータを探索する。そのため、パラメータ更新手段204は、3次元形状、テクスチャ及び位置姿勢のそれぞれのパラメータに対するEの微分値を、式(14)を用いて計算する。
Figure 0004793698
パラメータ更新手段204は、求めた各パラメータ(3次元形状パラメータ、テクスチャパラメータ及び位置姿勢パラメータ)の更新量が、予め定めた閾値より大きいか否かを判断する。パラメータ更新手段204は、計算したパラメータの更新量が予め定めた閾値より小さい場合、繰り返し処理が収束したと判定し処理を終了する。また、例えば、パラメータ更新手段204は、更新前のパラメータを用いて生成した再現画像と入力画像との誤差より、更新後のパラメータを用いて生成した再現画像と入力画像との誤差が小さくならない場合、繰り返し処理が収束したと判定し処理を終了する。
なお、画像処理システムを3次元形状推定システムに適用する場合、画像処理システムは、繰り返し処理の過程で最も入力画像に近い画像を生成できたとき(処理が収束したとき)の個別3次元形状及び個別テクスチャを、3次元形状推定結果として出力する。この場合、パラメータ更新手段204は、繰り返し処理が収束したと判定すると、更新後の3次元形状パラメータ及びテクスチャパラメータを、3次元形状推定結果として出力する。
また、画像処理システムを物***置姿勢推定システムに適用する場合、画像処理システムは、繰り返し処理の過程で最も入力画像に近い画像を生成できたときの位置/姿勢を、位置姿勢推定結果として出力する。この場合、パラメータ更新手段204は、繰り返し処理が収束したと判定すると、更新後の位置姿勢パラメータを、位置姿勢推定結果として出力する。
また、画像処理システムを画像生成システムに適用する場合、画像処理システムは、繰り返し処理の過程で最も入力画像に近い画像を生成できたときの再現画像を出力する。この場合、パラメータ更新手段204が繰り返し処理が収束したと判定すると、照明補正手段203は、生成した再現画像を出力する。
また、画像処理システムを実現する情報処理装置は、3次元形状推定結果や位置姿勢推定結果、再現画像を、例えば、CD−ROM等の記憶媒体に出力する出力手段(プログラムに従って動作する情報処理装置のCPU及び入出力部によって実現される)を備える。また、画像処理システムを実現する情報処理装置は、3次元形状推定結果や位置姿勢推定結果、再現画像を、例えば、ディスプレイ装置等の表示装置に表示させてもよい。
また、本実施の形態において、画像処理システムを実現する情報処理装置の記憶装置(図示せず)は、入力した画像を処理するための各種プログラムを記憶している。例えば、情報処理装置の記憶装置は、コンピュータに、類似した複数の物体の3次元形状データとテクスチャデータとに基づいて求めた汎用3次元物体モデルを用いて、3次元形状パラメータとテクスチャパラメータとに基づいて、個別の物体の3次元形状を示す個別3次元形状データと、個別の物体のテクスチャを示す個別テクスチャデータとを生成する個別データ処理と、生成した個別3次元形状データと個別テクスチャデータとに基づいて、様々な照明条件における個別の物体の3次元表面各部位の輝度値の変動を示す個別照明基底をそれぞれ求める第1の照明基底計算処理と、求めた個別照明基底群を用いて、入力画像と同じ照明条件を再現する画像である再現画像を生成する再現画像生成処理と、生成した再現画像が入力画像に近くなるように、汎用3次元顔モデルに与える3次元形状パラメータ及びテクスチャパラメータを、所定の収束条件が成立するまで繰り返し更新するパラメータ更新処理とを実行させるための画像処理プログラムを記憶している。
次に、動作について説明する。図3は、画像処理システムが入力画像を処理し各パラメータを求める処理の一例を示す流れ図である。本実施の形態において、画像処理システムは、例えば、カメラ等の撮像手段を備える。そして、画像処理システムは、例えば、利用者の撮影操作に従って、撮像手段を用いて入力画像を撮影すると、入力画像の処理を開始し各パラメータの値を求める。まず、画像処理システムの位置姿勢初期値入力手段102は、利用者の入力指示に従って、位置姿勢パラメータ{p,γ,θ,φ}の初期値を入力する(ステップS11)。
顔モデル生成手段103は、現在の3次元形状パラメータ{s}及びテクスチャパラメータ{t}の値を用いて、式(3)に示す汎用顔モデルを用いて、個別3次元形状及び個別テクスチャを計算する(ステップS12)。この場合、顔モデル生成手段103は、繰り返し処理の最初の処理を行う場合、各パラメータ{s}及び{t}の初期値として値0(ゼロ)を用いて、個別3次元形状及び個別テクスチャを求める。
照明基底計算手段201は、顔モデル生成手段103が求めた個別3次元形状と個別テクスチャとを用いて、式(11)を用いて法線ベクトルを求める。また、照明基底計算手段201は、式(12)を用いて個別照明基底群を計算する(ステップS13)。
透視変換手段202は、顔モデル生成手段103が求めた個別3次元形状と、現在の位置姿勢パラメータとを用いて、式(4)に示す関係に基づいて、再現画像の画素と個別3次元形状のポリゴンとの対応関係を求める(ステップS14)。この場合、透視変換手段202は、繰り返し処理の最初の処理を行う場合、位置姿勢初期値入力手段102が入力した位置姿勢パラメータの初期値を用いて、再現画像の画素と個別3次元形状のポリゴンとの関係を求める。さらに、透視変換手段202は、再現画像の各画素に対応するポリゴンの個別照明基底の値を並べたベクトル群{b}を求め、個別照明基底画像群として生成する。
照明補正手段203は、入力画像Iinputと、照明基底計算手段201が生成した個別照明基底群とを用いて、式(13)を用いて再現画像の輝度値Imodelを計算する(ステップS15)。
パラメータ更新手段204は、入力画像Iinput、照明補正手段203が生成した再現画像Imodel、及び汎用顔モデルの固有値σsi、σtiを用いて、コスト関数Eを計算する。また、パラメータ更新手段204は、コスト関数を最小化するように、確率的降下法を用いて、3次元形状、テクスチャ及び位置姿勢の各パラメータを更新する(ステップS16)。
また、パラメータ更新手段204は、確率的降下法によるパラメータ探索が収束したか否かを判定する(ステップS17)。パラメータ更新手段204は、ステップS16で計算した新しい更新後のパラメータと更新前の元のパラメータとの差が、予め定めた閾値より小さい場合、繰り返し処理が収束したと判定し、処理を終了する。また、パラメータ更新手段204は、コスト関数Eがパラメータ更新前の値より小さくない場合、繰り返し処理が収束したと判定し、処理を終了する。収束しない場合には、ステップS12に戻り、画像処理システムは、更新後のパラメータαを用いて、ステップS12以降の処理を繰り返し行う。
また、繰り返し処理が収束したと判定すると、画像処理システムは、各推定結果として更新後の各パラメータ(3次元形状パラメータやテクスチャパラメータ、位置姿勢パラメータ)や、再現画像を出力する(ステップS18)。例えば、画像処理システムは、更新後の各パラメータや再現画像をCD−ROM等の記憶媒体に出力する。また、例えば、画像処理システムは、更新後の各パラメータや再現画像を表示装置に表示させる。
以上のように、本実施の形態によれば、画像処理システムは、照明基底計算手段201と照明補正手段203とを備え、照明基底を用いて再現画像の輝度値を計算する。照明パラメータを用いずに再現画像の輝度値を計算できるように構成されているので、利用者が照明パラメータの初期値を入力する必要がない。従って、照明条件のパラメータの初期値を事前に調べたり、利用者が手動で入力したりしなくても、画像を処理することができる。
また、本実施の形態によれば、照明パラメータを確率的降下法によって探索する必要がなく、繰り返し処理の回数を少なくし、局所解を回避することができ、各パラメータの推定精度を向上させることができる。従って、繰り返し処理の回数を少なくして処理を高速化するとともに、局所解を回避し正確なパラメータを推定することができる。
(実施の形態2)
次に、本発明の第2の実施の形態について図面を参照して説明する。図4は、画像処理システムの他の構成例を示すブロック図である。図4に示すように、本実施の形態では、画像処理システムは、汎用照明基底モデル生成手段300と、位置姿勢初期値入力手段102と、顔モデル生成手段103と、照明基底モデル計算手段301と、透視変換手段202と、照明補正手段203と、パラメータ更新手段204とを含む。
図4に示すように、本実施の形態では、画像処理システムが、第1の実施の形態で示した構成要素に加えて照明基底モデル生成手段300を備える。また、本実施の形態では、画像処理システムが照明基底計算手段201に代えて照明基底モデル計算手段301を備える点で、第1の実施の形態と異なる。
汎用照明基底モデル生成手段300は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。照明基底モデル生成手段300は、画像処理システムを使用して各パラメータや再現画像を生成する前の準備段階として、予め汎用3D顔モデルを用いて汎用照明基底モデルを生成する処理を行う機能を備える。
「照明基底モデル」とは、各個人の個別照明基底を所定のパラメータを用いて記述するモデルである。また、「照明基底モデル」は、平均的な個別照明基底と、顔の形状によって異なる各個人の顔の個別照明基底が平均的な個別照明基底からどのように変化するかを示すデータとを含む。本実施の形態において、汎用照明基底モデルは、汎用3次元物体形状モデルに対応し、個別の物体にあてられた照明の方向や強度の違いによる反射の具合の基本的な変動を示す照明基底を生成するために用いられる。
例えば、汎用照明基底モデル生成手段300は、画像処理システムが備える顔モデル蓄積手段が蓄積する汎用3次元モデルを用いて、予め汎用照明基底モデルを生成する。また、画像処理システムは、汎用照明基底モデル生成手段300が生成した汎用照明基底モデルを蓄積する照明基底モデル蓄積手段(図示せず)を備える。なお、照明基底モデル蓄積手段は、具体的には、磁気ディスク装置や光ディスク装置等のデータベース装置によって実現される。
図5は、汎用照明基底モデル生成手段300の構成の一例を示すブロック図である。図5に示すように、照明基底モデル生成手段300は、サンプルパラメータ設定手段3001と、照明基底計算手段3002と、基底モデル計算手段3003とを備える。
サンプルパラメータ設定手段3001は、汎用3次元物体形状モデルに与えるためのランダムな3次元形状パラメータを設定する機能を備える。本実施の形態では、サンプルパラメータ設定手段3001は、汎用3D顔モデルに対して、様々な形状パラメータを設定して、多数のサンプル3次元形状とサンプルテクスチャとの組を生成する。サンプルパラメータ設定手段3001は、様々な決定方法を利用してこれらのパラメータを決定することが可能である。本実施の形態では、サンプルパラメータ設定手段3001は、一例として、3次元形状パラメータ{s}を、平均がゼロであり、分散が固有値σsi、σtiのガウス分布に従う乱数であるとして、それぞれ値を決定する。また、サンプルパラメータ設定手段3001は、nセットの3次元形状パラメータ{ski}(k=1,2,...,n)を決定し、式(4)を用いてn個のサンプル3次元形状データを生成する。
照明基底計算手段3002は、サンプルパラメータ設定手段3001が設定したパラメータ群を汎用3次元物体モデルに与えることによって生成されるサンプル3次元形状群に基づいて、各パラメータそれぞれに対応する照明基底群を求める機能を備える。本実施の形態では、照明基底計算手段3002は、サンプルパラメータ設定手段3001が生成したサンプル3次元形状データそれぞれについて、式(12)を用いてサンプル照明基底群{bkj}(k=1,...,n)を計算する。
また、照明基底計算手段3002は、個別3次元形状に基づいて、所定の球面調和関数を用いて個別照明基底を求める。ただし、本実施の形態では、照明基底計算手段3002は、テクスチャデータを用いずに、式(12)においてt(i)の値を1としてサンプル照明基底群を計算する点で、第1の実施の形態で示した調和関数計算手段2012と異なる。すなわち、照明基底計算手段3002がサンプル照明基底群は、画像の輝度変動のうち、3次元形状によって変化する成分のみをもっている。
また、照明基底計算手段3002は、個別照明基底を算出する際に、まず、様々な照明条件を設定する。また、照明基底計算手段3002は、設定した各照明条件における物体表面各部位の輝度値をそれぞれ求める。そして、照明基底計算手段3002は、求めた輝度値に基づいて、個別照明基底群を求める。
基底モデル計算手段3003は、照明基底計算手段3002が求めた照明基底群と、汎用3次元物体モデルの基底ベクトル及び固有値とを用いて、汎用照明基底モデルの基底ベクトルを求める機能を備える。本実施の形態では、基底モデル計算手段3003は、基底モデル計算手段3003が生成したサンプル照明基底群{bkj}を、線形モデルによって表す基底ベクトルを計算する。ここで、サンプル3次元形状データkの照明基底群{bkj}の要素を並べたベクトルをBとし、その平均ベクトルをバーBとする。また、所定の行列Bを式(15)で定義する。
Figure 0004793698
基底モデル計算手段3003は、所定の行列U、Σ(汎用3次元顔モデルの計算に用いる式(2)に示す行列U、Σ)の値を用いて、式(16)を用いて行列Cを計算する。
=Σ −1 −1 式(16)
そして、基底モデル計算手段3003は、行列Cの列ベクトルを汎用照明基底モデルの基底ベクトル群{c}として、照明基底モデル蓄積手段に記憶させる。
この汎用照明基底モデル生成手段300が生成した汎用照明基底モデルを用いることによって、サンプル形状を汎用3D顔モデルから生成した時の形状パラメータ{s}を係数とした{c}の線形和により、サンプル形状の顔の照明基底(ただし、テクスチャを1とした場合)の値を計算できる。従って、照明基底モデル計算手段301は、3次元形状パラメータが{s}であり、個別テクスチャが{T}である物体の個別照明基底群{b}を、式(17)を用いて計算できる。
Figure 0004793698
ここで、式(17)において、(k)は、k番目の要素の値であることを示す。
照明基底モデル計算手段301は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。照明基底モデル計算手段301は、現在の3次元形状パラメータ{s}と、顔モデル生成手段103が求めた個別テクスチャ{T}とを入力とし、汎用照明基底モデル生成手段300が生成した汎用照明基底モデルを用いて照明基底を計算する機能を備える。この場合、照明基底モデル計算手段301は、式(17)を用いて個別照明基底群を求める。本実施の形態では、第1の実施の形態で示した照明基底計算手段201と異なり、照明基底モデル計算手段301は、個別3次元形状から法線ベクトルを計算する必要がなく、式(17)を用いた簡単な線形演算のみで個別照明基底群{b}を求めることができる。
なお、照明基底モデル計算手段301は、汎用照明基底モデル生成手段300が汎用3次元物体形状モデルを用いて生成する個別3次元形状に対応する個別照明基底を、汎用3次元物体形状モデルに与える3次元形状パラメータと同一のパラメータを用いて求める。
位置姿勢初期値入力手段102、顔モデル生成手段103、透視変換手段104、照明補正手段203及びパラメータ更新手段204の機能は、第1の実施の形態で示したそれらの機能と同様である。
次に、動作について説明する。まず、画像処理システムが、各パラメータや再現画像を生成する処理を実行する前に、予め汎用照明基底モデルを計算する処理を事前に行う動作を説明する。図6は、画像処理システムが予め汎用照明基底モデルを生成する処理の一例を示す流れ図である。
汎用照明基底モデル生成手段300は、汎用3次元顔モデルに対して、適当な数のセットのランダムな3次元形状パラメータを決定する(ステップS21)。また、汎用照明基底モデル生成手段300は、決定した3次元形状パラメータの各セットから、汎用3次元顔モデルを用いて個別3次元形状を計算し、求めた個別3次元形状の法線ベクトルを計算する。また、汎用照明基底モデル生成手段300は、テクスチャの輝度が全て1であるとして、照明基底ベクトル群を計算する(ステップS22)。
汎用照明基底モデル生成手段300は、求めた照明基底ベクトル群に対して、式(16)を用いて汎用照明基底モデルの基底ベクトル群を計算する(ステップS23)。また、汎用照明基底モデル生成手段300は、求めた汎用照明基底モデルの基底ベクトル群を、照明基底モデル蓄積手段に記憶させる。
以上の処理が実行されることによって、予め汎用照明基底モデルが生成され照明基底モデル蓄積手段に蓄積される。画像処理システムは、以上に示す照明基底モデル生成処理を行った上で、以下の処理を行う。
図7は、画像処理システムが入力画像を処理し各パラメータを求める処理の他の例を示す流れ図である。画像処理システムは、第1の実施の形態と同様に、例えば、利用者の撮影操作に従って、撮像手段を用いて入力画像を撮影すると、入力画像の処理を開始し各パラメータの値を求める。まず、画像処理システムの位置姿勢初期値入力手段102は、利用者の入力指示に従って、入力画像から位置姿勢パラメータ{p,γ,θ,φ}の初期値を入力する(ステップS31)。
顔モデル生成手段103は、現在の3次元形状パラメータ{s}及びテクスチャパラメータ{t}の値を用いて、式(3)に示す汎用顔モデルを用いて、個別3次元形状及び個別テクスチャを計算する(ステップS32)。この場合、顔モデル生成手段103は、繰り返し処理の最初の処理を行う場合、各パラメータ{s}及び{t}の初期値として値0(ゼロ)を用いて、個別3次元形状及び個別テクスチャを求める。
照明基底モデル計算手段301は、顔モデル生成手段103が求めた3次元形状パラメータ{s}と、照明基底モデル蓄積手段が蓄積する汎用照明基底モデルとに基づいて、式(17)を用いて個別照明基底群を計算する(ステップS33)。
透視変換手段202は、顔モデル生成手段103が求めた個別3次元形状と、現在の位置姿勢パラメータとを用いて、式(4)に示す関係に基づいて、再現画像の画素と個別3次元形状のポリゴンとの対応関係を求める(ステップS34)。この場合、透視変換手段202は、繰り返し処理の最初の処理を行う場合、位置姿勢初期値入力手段102が入力した位置姿勢パラメータの初期値を用いて、再現画像の画素と個別3次元形状のポリゴンとの関係を求める。さらに、透視変換手段202は、再現画像の各画素に対応するポリゴンの個別照明基底の値を並べたベクトル群{b}を求め、個別照明基底画像群として生成する。
照明補正手段203は、入力画像Iinputと、照明基底モデル計算手段301が生成した個別照明基底群とを用いて、式(13)を用いて再現画像の輝度値Imodelを計算する(ステップS35)。
パラメータ更新手段204は、入力画像Iinput、照明補正手段203が生成した再現画像Imodel、及び汎用顔モデルの固有値σsi、σtiを用いて、コスト関数Eを計算する。また、パラメータ更新手段204は、コスト関数を最小化するように、確率的降下法を用いて、3次元形状、テクスチャ及び位置姿勢の各パラメータを更新する(ステップS36)。
パラメータ更新手段204は、確率的降下法によるパラメータ探索が収束したか否かを判定する(ステップS37)。パラメータ更新手段204は、ステップS36で計算した新しい更新後のパラメータと更新前の元のパラメータとの差が、予め定めた閾値より小さい場合、繰り返し処理が収束したと判定し、処理を終了する。また、パラメータ更新手段204は、コスト関数Eがパラメータ更新前の値より小さくない場合、繰り返し処理が収束したと判定し、処理を終了する。収束しない場合には、ステップS32に戻り、画像処理システムは、更新後のパラメータαを用いて、ステップS32以降の処理を繰り返し行う。
また、繰り返し処理が収束したと判定すると、画像処理システムは、各推定結果として更新後の各パラメータ(3次元形状パラメータやテクスチャパラメータ、位置姿勢パラメータ)や、再現画像を出力する(ステップS38)。例えば、画像処理システムは、更新後の各パラメータや再現画像をCD−ROM等の記憶媒体に出力する。また、例えば、画像処理システムは、更新後の各パラメータや再現画像を表示装置に表示させる。
以上のように、本実施の形態によれば、画像処理システムは、汎用照明基底モデル生成手段300を備え、予め汎用照明基底モデルを計算する。そして、汎用照明基底モデルを用いて、3次元形状パラメータから簡単な線形演算のみを行うことによって照明基底を得ることができる。そのため、3次元形状データから法線ベクトルの計算等を行う必要がなく、高速に処理を行うことができる。従って、第1の実施の形態で示した効果に加え、画像生成における陰影やシャドウの計算処理を高速化でき、線形照明モデルを用いる際に必要となる照明基底の計算を高速に行うことができる。
(実施の形態3)
次に、本発明の第3の実施の形態について図面を参照して説明する。図8は、画像処理システムのさらに他の構成例を示すブロック図である。図8に示すように、本実施の形態では、画像処理システムは、第2の実施の形態で示した各構成要素のうち、顔モデル生成手段103と、汎用照明基底モデル生成手段300と、照明基底モデル計算手段301とを含む。また、画像処理システムは、ある人物の顔の3次元形状パラメータとテクスチャパラメータとを入力とし、個別3次元形状と個別照明基底群とを出力する。
まず、汎用照明基底モデル生成手段300は、第2の実施の形態と同様の処理に従って、予め汎用3D顔モデルに対応する汎用照明基底モデルを生成する。また、顔モデル生成手段103は、第2の実施の形態と同様の処理に従って、処理目的とする個人の顔の3次元形状パラメータとテクスチャパラメータとを入力とし、汎用3D顔モデルを用いて、個別3次元形状と個別テクスチャとを計算する。また、照明基底モデル計算手段301は、第2の実施の形態と同様の処理に従って、3次元形状パラメータと汎用照明基底モデルとを入力とし、個別照明基底群を計算する。
本実施の形態では、画像処理システムは、顔モデル生成手段103が生成した個別3次元形状と、照明基底モデル計算手段301が生成した個別照明基底群とを出力する出力手段(プログラムに従って動作する情報処理装置のCPU及び入出力部によって実現される)を備える。
以上のように、本実施の形態によれば、3次元形状パラメータとテクスチャパラメータとに基づいて、個別3次元形状と個別照明基底をと計算する。そのため、多様な位置姿勢/照明条件にある顔画像を生成可能な3次元顔モデル(3次元形状データと照明基底群とのセット)を、高速に計算することができる。
個別3次元形状と個別照明基底群とは、例えば、文献Bに記載された顔照合システムにおいて、処理に必要とされるものである。本実施の形態では、画像処理システムは、個人の顔の3次元形状データと照明基底とを、各パラメータから高速に生成して提供する3次元顔モデル生成システムとしての機能を備える。
文献Bに記載された顔照合システムでは、様々な人物について計測した個別3次元形状データと個別照明基底とをデータベースに記憶しておき、入力した画像に対して各人物のデータを用いて再現画像を生成する。そして、入力画像に最も近い再現画像を生成できたときの人物を本人と判定する。この場合、本実施の形態で示した画像処理システムを、文献Bに記載された顔照合システムのデータベースの代わりに用いることができる。すなわち、顔照合システムにおいて、個別3次元形状データと個別照明基底との代わりに、各人物の3次元形状パラメータとテクスチャパラメータとをデータベースに記憶しておく。そして、本実施の形態で示した画像処理システムを用いることによって、各個人の個別3次元形状データと個別照明基底とを計算すれば、文献Bに記載された顔照合システムを運営できる。
次に、本発明の第1の実施例を図面を参照して説明する。本実施例では、具体的な例を用いて、画像処理システムの動作を説明する。また、本実施例では、画像処理システムを、顔画像に基づいて、その顔画像に写っている人物の顔の3次元形状を推定する3次元形状推定システムに適用する場合について説明する。なお、本実施例で示す画像処理システムの構成は、本発明の第1の実施形態で示した構成(すなわち、図1に示した構成)に相当する。
図9は、画像処理システムの一具体例を示す説明図である。図9に示すように、本実施例では、画像処理システムは、入力画像を撮影し入力する画像入力装置401と、各種処理を実行するコンピュータ402と、各種データを記憶する記憶装置403と、推定結果のデータを記録し出力する記憶媒体404とを含む。
コンピュータ402は、第1の実施の形態で示した位置姿勢初期値入力手段102、顔モデル生成手段103、照明基底計算手段201、透視変換手段202、照明補正手段203及びパラメータ更新手段204を備える。
記憶装置403は、汎用3次元顔モデルを予め記憶する。一例として、記憶装置403は、汎用3次元顔モデルのデータとして、100個の形状基底ベクトルと100個のテクスチャ基底ベクトルと、形状基底ベクトル及びテクスチャ基底ベクトルそれぞれに対応する固有値とを記憶する。なお、画像処理システムは、100個より多くの基底を用いることによって、推定精度を向上させてもよい。また、画像処理システムは、基底数を100個より減らすことによって、処理速度を向上させることも可能である。
まず、画像入力装置401は、利用者の入力指示に従って、人物の顔画像を撮影し、コンピュータ402に入力画像411を出力する。すると、コンピュータ402は、画像入力装置401から入力画像411を入力する。一例として、コンピュータ402は、人物の顔の向きが左40度(姿勢パラメータθ=40)、下10度(γ=10)及び水平向き(φ=0)で、人物がカメラから170cm離れた位置で中央に写っている入力画像411を入力する。また、コンピュータ402は、1つのライトが顔に対して右60度及び上80度の角度から当たっていて、部屋全体の明るさの強度が、このライトの半分程度の強度である入力画像411を入力したとする。もちろん、入力画像411を入力した段階では、顔の正確な向きや照明の配置は、画像処理システムにとって未知である。
コンピュータ402の位置姿勢初期値入力手段102は、画像処理システムの利用者の入力指示に従って、入力画像411の位置姿勢パラメータ{p,γ,θ,φ}の初期値を入力する。位置姿勢パラメータの初期値を入力するには様々な方法があるが、位置姿勢初期値入力手段102は、一例として、コンピュータ402の表示装置の画面に、図10に示すように、平均3次元顔形状と平均テクスチャとを用いてCG技術によって生成した画像を表示させる。この場合、位置姿勢初期値入力手段102は、図10に示すように、表示装置の表示画面に、入力画像411とCG画像412とを並べて表示させる。利用者は、CG画像412を入力画像411と見比べながら位置姿勢パラメータ{p,γ,θ,φ}の値を変化させ、入力画像411に近くなる値を手動で入力指示する。そして、位置姿勢初期値入力手段102は、利用者の入力指示に従って、位置姿勢パラメータ{p,γ,θ,φ}の初期値を入力する。本実施例では、一例として、位置姿勢初期値入力手段102は、位置姿勢パラメータの初期値として、p=[10,5,150]、γ=5、θ=45及びφ=5を入力したとする。
次に、顔モデル生成手段103は、現在の3次元形状パラメータ{s}及びテクスチャパラメータ{t}の値を用いて、式(3)に示す汎用3次元顔モデルを用いて、個別3次元形状及び個別テクスチャを計算する。この場合、顔モデル生成手段103は、予め記憶装置403が記憶する汎用3次元顔モデルを、記憶装置403から読み出して用いて個別3次元形状及び個別テクスチャを計算する。また、顔モデル生成手段103は、繰り返し処理の最初の処理を行う場合、各パラメータ{s}及び{t}の初期値として値0(ゼロ)を用いて、個別3次元形状及び個別テクスチャを求める。
照明基底計算手段201は、顔モデル生成手段103が求めた個別3次元形状と個別テクスチャとを用いて、式(11)を用いて法線ベクトルを求める。また、照明基底計算手段201は、式(12)を用いて個別照明基底群を計算する。本実施例では、照明基底計算手段201は、照明基底の数を9個として個別照明基底群を求める。なお、照明基底計算手段201が求める照明基底の数は様々な値に変更可能であり、処理速度を向上させるために、求める照明基底の数を減らしてもよい。また、パラメータの推定精度を向上させるために、求める照明基底の数を大きくすることもできる。
透視変換手段202は、個別3次元形状と位置姿勢パラメータとを用いて、式(4)に示す関係に基づいて、再現画像の画素と個別3次元形状のポリゴンとの対応関係を求める。さらに、透視変換手段202は、再現画像の各画素に対応するポリゴンの個別照明基底の値を並べたベクトル群{b}を、個別照明基底画像群として生成する。一例として、個別3次元形状に対応する入力画像の画素数が100である場合、透視変換手段202は、100次元のベクトルを含むベクトル群{b}を生成する。
照明補正手段203は、入力画像Iinputと、照明基底計算手段201が生成した個別照明基底群とを用いて、式(13)を用いて再現画像の輝度値Imodelを計算する。
パラメータ更新手段204は、入力画像Iinput、照明補正手段203が生成した再現画像Imodel、及び汎用顔モデルの固有値σsi,σtiを用いて、コスト関数Eを計算する。また、パラメータ更新手段204は、コスト関数を最小化するように、確率的降下法を用いて、3次元形状、テクスチャ及び位置姿勢の各パラメータを更新する。
また、パラメータ更新手段204は、確率的降下法によるパラメータ探索が収束したか否かを判定する。パラメータ更新手段204は、計算した新しい更新後のパラメータと更新前の元のパラメータとの差が、予め定めた閾値より小さい場合、繰り返し処理が収束したと判定し、処理を終了する。また、パラメータ更新手段204は、コスト関数Eがパラメータ更新前の値より小さくない場合、繰り返し処理が収束したと判定し、処理を終了する。一例として、パラメータ更新手段204は、例えば、パラメータ更新量に対する閾値として、要素pの閾値「1cm」、及び顔の角度γ、θ、φの閾値「1°」をそれぞれ用いて、パラメータ探索が収束したか否かを判定する。パラメータ更新手段204は、これらの閾値より変化量が小さい場合には、パラメータ探索が収束したとして判定する。収束しない場合には、画像処理システムは、更新後のパラメータを用いて、顔モデル生成手段103、照明基底計算手段201、透視変換手段202、照明補正手段203及びパラメータ更新手段204が実行する各処理を繰り返し行う。
パラメータが収束すると、画像処理システムは、収束したときの3次元形状パラメータとテクスチャパラメータとから顔モデル生成手段103によって生成された個別3次元顔形状及び個別テクスチャを、記憶媒体404に記録して出力する。なお、画像処理システムは、個別3次元形状及び個別テクスチャを用いてCG画像を生成し、生成したCG画像を記憶媒体404に出力してもよい。また、画像処理システムを顔の向きを推定する顔姿勢推定システムに適用する場合には、画像処理システムは、収束した時の位置姿勢パラメータを出力してもよい。
次に、本発明の第2の実施例を図面を参照して説明する。本実施例では、画像処理システムを、顔画像に基づいて、その顔画像に写っている人物の顔の位置や姿勢を推定する物***置姿勢推定システムに適用する場合について説明する。なお、本実施例で示す画像処理システムの構成は、本発明の第2の実施の形態で示した構成(すなわち、図4に示した構成)に相当する。
本実施例では、コンピュータ402は、第2の実施の形態で示した汎用照明基底モデル生成手段300、位置姿勢初期値入力手段102、顔モデル生成手段103、照明基底モデル計算手段301、透視変換手段202、照明補正手段203及びパラメータ更新手段204を備える。
記憶装置403は、汎用3次元顔モデルを予め記憶する。なお、第1の実施例では汎用顔モデルの基底ベクトルと固有値のみを使用したが、本実施例では、汎用3次元顔モデルを構築する際に、行列US(すなわち、式(2)に示す行列US)の値も合わせて、記憶手段403に記憶させる。
まず、画像処理システムを各パラメータや再現画像を生成する処理に使用する前に、コンピュータ402の汎用照明基底モデル生成手段300は、準備として汎用照明基底モデルを計算する処理を事前に行う。
まず、サンプルパラメータ設定手段3001は、汎用3次元顔モデルに対して、適当な数のセットのランダムな3次元形状パラメータを決定する。本実施例では、一例として、サンプルパラメータ設定手段3001は、100セットのパラメータをランダムに設定する。なお、このパラメータの数は、様々に変更可能である。
また、照明基底計算手段3002は、サンプルパラメータ設定手段3001が決定した3次元形状パラメータの各セットから、汎用3次元顔モデルを用いて個別3次元形状を計算し、求めた個別3次元形状の法線ベクトルを計算する。さらに、照明基底計算手段3002は、テクスチャの輝度が全て1であるとして、照明基底ベクトル群を計算する。
基底ベクトル計算手段3003は、照明基底計算手段3002が求めた照明基底ベクトル群に対して、式(16)を用いて汎用照明基底モデルの基底ベクトル群を計算する。また、基底モデル計算手段3003は、求めた汎用照明基底モデルの基底ベクトル群を、記憶装置403に記憶させる。本実施例では、3次元形状パラメータの数が100であるので、基底モデル計算手段3003は、100個の基底ベクトルを含む基底ベクトル群を計算する。
画像処理システムは、以上に示す処理を予め行った上で、以下の処理を行う。
まず、コンピュータ402の位置姿勢初期値入力手段102は、利用者の入力指示に従って、入力画像から位置姿勢パラメータ{p,γ,θ,φ}の初期値を入力する。この場合、第1の実施例と同様に、CG画像を見ながら利用者が手動で入力する方法もあるが、本実施例では、一例として、入力画像411に対して両目や口の端の位置等を画面を見ながら利用者が入力指示する場合を説明する。本実施例では、予め平均3次元形状データに対しても対応する点の位置を付与しておく(例えば、記憶装置403に、予め対応する点の位置情報を記憶しておく)。そして、位置姿勢初期値入力手段102は、予め記憶する3次元座標と、利用者の操作に従って入力した点の位置データとを用いて、顔の姿勢を計算する。
また、顔モデル生成手段103は、現在の形状パラメータ{s}及びテクスチャパラメータ{t}の値を用いて、式(3)に示す汎用顔モデルを用いて、個別3次元形状及び個別テクスチャを計算する。この場合、顔モデル生成手段103は、繰り返し処理の最初の処理の場合、各パラメータ{s}及び{t}の初期値として値0(ゼロ)を用いて、個別3次元形状及び個別テクスチャを求める。
照明基底モデル計算手段301は、顔モデル生成手段103が求めた3次元形状パラメータ{s}と、記憶装置403が蓄積する汎用照明基底モデルとに基づいて、式(17)を用いて個別照明基底群を計算する。
透視変換手段202は、顔モデル生成手段103が求めた個別3次元形状と、現在の位置姿勢パラメータとを用いて、式(4)に示す関係に基づいて、再現画像の画素と個別3次元形状のポリゴンとの対応関係を求める。さらに、透視変換手段202は、再現画像の各画素に対応するポリゴンの個別照明基底の値を並べたベクトル群{b}を求め、個別照明基底画像群として生成する。
照明補正手段203は、入力画像Iinputと、照明基底モデル計算手段301が生成した個別照明基底群とを用いて、式(13)を用いて再現画像の輝度値Imodelを計算する。
また、パラメータ更新手段204は、入力画像Iinput、照明補正手段203が生成した再現画像Imodel、及び汎用顔モデルの固有値σsi,σtiを用いて、コスト関数Eを計算する。また、パラメータ更新手段204は、コスト関数を最小化するように、確率的降下法を用いて、3次元形状、テクスチャ及び位置姿勢の各パラメータを更新する。
さらに、パラメータ更新手段204は、確率的降下法によるパラメータ探索が収束したか否かを判定する。パラメータ更新手段204は、図7に示すステップS36で計算した新しい更新後のパラメータと更新前の元のパラメータとの差が、予め定めた閾値より小さい場合、繰り返し処理が収束したと判定し、処理を終了する。また、パラメータ更新手段204は、コスト関数Eがパラメータ更新前の値より小さくない場合、繰り返し処理が収束したと判定し、処理を終了する。収束しない場合には、更新後のパラメータを用いて、顔モデル生成手段103、照明基底モデル計算手段301、透視変換手段202、照明補正手段203及びパラメータ更新手段204が実行する各処理を繰り返し行う。
また、繰り返し処理が収束したと判定すると、画像処理システムは、収束したときの位置姿勢パラメータの値を、入力画像中の顔の位置姿勢の推定値として出力する。一例として、画像処理システムは、例えば、記憶媒体404に、位置と姿勢とを示すデータ(位置姿勢パラメータ)を記録して出力する。
以上、本発明の各実施例を詳細に説明したが、本発明は、代表的に例示した上述の各実施例に限定されるものではなく、当業者であれば、請求の範囲の記載内容に基づき、本発明の要旨を逸脱しない範囲内で種々の態様に変形、変更することができる。これらの変形例や変更例も、本発明の権利範囲に属する。
例えば、前述した各実施例を構成する各手段の少なくとも一部の機能をプログラムコードを用いて実現する場合、かかるプログラムコードと、これを記録する記録媒体とは、本発明の範疇に含まれる。この場合のプログラムコードは、オペレーティングシステムや他のアプリケーションソフトウェア等と共同して上記機能が実現される場合は、それらのプログラムコードも含まれる。また、記録媒体としては、例えばディスク型(光ディスク、光磁気ディスク、磁気ディスク等)、テープ型(磁気テープ等)、カード型(メモリカード等)等、いずれのタイプでも用いることができる。
本発明は、1又は複数の顔画像から、写っている人物の顔の3次元形状を推定する3次元形状推定システムの用途に適用できる。また、本発明は、推定した姿勢パラメータを出力することによって、写っている人物の顔の向きを推定する物***置姿勢推定システムの用途にも適用可能である。さらに、本発明は、入力画像を再現した再現画像(例えば、CG画像)を生成する画像生成システムの用途に適用できる。

Claims (28)

  1. 類似した複数の物体の3次元形状データとテクスチャデータとに基づいて求めた汎用3次元物体モデルを用いて、3次元形状パラメータとテクスチャパラメータとに基づいて、個別の物体の3次元形状を示す個別3次元形状データと、前記個別の物体のテクスチャを示す個別テクスチャデータとを生成する個別データ生成手段と、
    前記個別データ生成手段が生成した個別3次元形状データと個別テクスチャデータとに基づいて、複数の異なる照明条件における個別の物体の3次元表面各部位の輝度値の変動を示す個別照明基底をそれぞれ求める第1の照明基底計算手段と、
    前記第1の照明基底計算手段が求めた個別照明基底群を用いて、入力画像と同じ照明条件を再現する画像である再現画像を生成する再現画像生成手段と、
    前記再現画像生成手段が生成した再現画像入力画像との誤差のコストを示すコスト関数を計算し、確率的降下法によって当該コスト関数を最小化するように、前記汎用3次元物体モデルに与える3次元形状パラメータ及びテクスチャパラメータを探索して更新し更新後の各パラメータと更新前の各パラメータとの差が予め定めた閾値より小さくなる収束条件が成立するまで繰り返し更新するパラメータ更新手段とを備えたことを特徴とする画像処理システム。
  2. 前記第1の照明基底計算手段は、前記個別データ生成手段が生成した個別3次元形状データに基づいて、球面調和関数を用いて前記個別照明基底を求める請求項1記載の画像処理システム。
  3. 前記第1の照明基底計算手段は、
    複数の異なる照明条件を設定する照明条件設定手段と、
    前記照明条件設定手段が設定した各照明条件における物体表面各部位の輝度値をそれぞれ求める輝度計算手段と、
    前記輝度計算手段が求めた輝度値に基づいて、前記個別照明基底群を求める計算手段とを含む請求項1記載の画像処理システム。
  4. 類似した複数の物体の3次元形状データとテクスチャデータとに基づいて求めた汎用3次元物体モデルを用いて、3次元形状パラメータとテクスチャパラメータとに基づいて、個別の物体の3次元形状を示す個別3次元形状データと、前記個別の物体のテクスチャを示す個別テクスチャデータとを生成する個別データ生成手段と、
    前記汎用3次元物体モデルに対応する、個別の物体にあてられた照明の方向及び強度の違いによる反射の具合の基本的な変動を示すデータである照明基底を生成するための汎用照明基底モデルを生成する汎用照明基底モデル生成手段と、
    前記汎用照明基底モデル生成手段が生成した汎用照明基底モデルを用いて、複数の異なる照明条件における個別の物体の3次元表面各部位の輝度値の変動を示す個別照明基底をそれぞれ求める第2の照明基底計算手段とを備えたことを特徴とする画像処理システム。
  5. 前記個別データ生成手段が生成した個別3次元形状データと、前記第2の照明基底計算手段が生成した個別照明基底とを出力する出力手段をさらに備えた請求項4記載の画像処理システム。
  6. 前記第2の照明基底計算手段が求めた個別照明基底群を用いて、入力画像と同じ照明条件を再現する画像である再現画像を生成する再現画像生成手段と、
    前記再現画像生成手段が生成した再現画像入力画像との誤差のコストを示すコスト関数を計算し、確率的降下法によって当該コスト関数を最小化するように、前記汎用3次元物体モデルに与える3次元形状パラメータ及びテクスチャパラメータを探索して更新し更新後の各パラメータと更新前の各パラメータとの差が予め定めた閾値より小さくなる収束条件が成立するまで繰り返し更新するパラメータ更新手段とをさらに備えた請求項4又は請求項5記載の画像処理システム。
  7. 前記第2の照明基底計算手段は、前記汎用照明基底モデル生成手段が汎用3次元物体モデルを用いて生成する個別3次元形状データに対応する個別照明基底を、前記汎用3次元物体モデルに与える3次元形状パラメータと同一のパラメータを用いて求める請求項6記載の画像処理システム。
  8. 前記汎用照明基底モデル生成手段は、
    前記汎用3次元物体モデルに与えるためのランダムな3次元形状パラメータを設定するパラメータ設定手段と、
    前記パラメータ設定手段が設定したパラメータ群を前記汎用3次元物体モデルに与えることによって生成されるサンプル3次元形状群に基づいて、各パラメータそれぞれに対応する照明基底群を求める第3の照明基底計算手段と、
    前記第3の照明基底計算手段が求めた照明基底群と、前記汎用3次元物体モデルの基底ベクトル及び固有値とを用いて、前記汎用照明基底モデルの基底ベクトルを求める基底計算手段とを含む請求項7記載の画像処理システム。
  9. 前記第3の照明基底計算手段は、前記個別3次元形状データに基づいて、球面調和関数を用いて前記個別照明基底を求める請求項8記載の画像処理システム。
  10. 前記第3の照明基底計算手段は、
    複数の異なる照明条件を設定する照明条件設定手段と、
    前記照明条件設定手段が設定した各照明条件における物体表面各部位の輝度値をそれぞれ求める輝度計算手段と、
    前記輝度計算手段が求めた輝度値に基づいて、主成分分析によって前記個別照明基底群を求める計算手段とを含む請求項8記載の画像処理システム。
  11. 請求項1又は請求項4記載の画像処理システムを用いた、物体の3次元形状を推定する3次元形状推定システムであって、
    前記収束条件が成立すると、前記収束した時点における3次元形状パラメータ及びテクスチャパラメータに基づいて、前記汎用3次元物体モデルによって生成される3次元形状を出力する形状出力手段を備えたことを特徴とする3次元形状推定システム。
  12. 請求項1又は請求項4記載の画像処理システムを用いた、物体の位置及び姿勢を推定する物***置姿勢推定システムであって、
    前記収束条件が成立すると、前記収束した時点における、物体の位置及び姿勢を示す位置姿勢パラメータを出力する位置姿勢出力手段を備えたことを特徴とする物***置姿勢推定システム。
  13. 請求項1又は請求項4記載の画像処理システムを用いた、入力画像と同じ照明条件を再現する画像である再現画像を生成する画像生成システムであって、
    前記収束条件が成立すると、前記収束した時点における再現画像を出力する画像出力手段を備えたことを特徴とする画像生成システム。
  14. 個別データ生成手段が、類似した複数の物体の3次元形状データとテクスチャデータとに基づいて求めた汎用3次元物体モデルを用いて、3次元形状パラメータとテクスチャパラメータとに基づいて、個別の物体の3次元形状を示す個別3次元形状データと、前記個別の物体のテクスチャを示す個別テクスチャデータとを生成し、
    第1の照明基底計算手段が、生成した前記個別3次元形状データと前記個別テクスチャデータとに基づいて、複数の異なる照明条件における個別の物体の3次元表面各部位の輝度値の変動を示す個別照明基底をそれぞれ求め、
    再現画像生成手段が、求めた前記個別照明基底群を用いて、入力画像と同じ照明条件を再現する画像である再現画像を生成し、
    パラメータ更新手段が、生成した前記再現画像入力画像との誤差のコストを示すコスト関数を計算し、確率的降下法によって当該コスト関数を最小化するように、前記汎用3次元物体モデルに与える3次元形状パラメータ及びテクスチャパラメータを探索して更新し更新後の各パラメータと更新前の各パラメータとの差が予め定めた閾値より小さくなる収束条件が成立するまで繰り返し更新することを特徴とする画像処理方法。
  15. 前記第1の照明基底計算手段が、前記個別データ生成手段で生成した個別3次元形状データに基づいて、球面調和関数を用いて前記個別照明基底を求める請求項14記載の画像処理方法。
  16. 前記第1の照明基底計算手段が、複数の異なる照明条件を設定し、設定した前記各照明条件における物体表面各部位の輝度値をそれぞれ求め、求めた前記輝度値に基づいて、前記個別照明基底群を求める請求項14記載の画像処理方法。
  17. 個別データ生成手段が、類似した複数の物体の3次元形状データとテクスチャデータとに基づいて求めた汎用3次元物体モデルを用いて、3次元形状パラメータとテクスチャパラメータとに基づいて、個別の物体の3次元形状を示す個別3次元形状データと、前記個別の物体のテクスチャを示す個別テクスチャデータとを生成し、
    汎用照明基底モデル生成手段が、前記汎用3次元物体モデルに対応する、個別の物体にあてられた照明の方向及び強度の違いによる反射の具合の基本的な変動を示すデータである照明基底を生成するための汎用照明基底モデルを生成し、
    第2の照明基底計算手段が、生成した前記汎用照明基底モデルを用いて、複数の異なる照明条件における個別の物体の3次元表面各部位の輝度値の変動を示す個別照明基底をそれぞれ求めることを特徴とする画像処理方法。
  18. 出力手段が、前記個別データ生成手段が生成した個別3次元形状データと、前記第2の照明基底計算手段が生成した個別照明基底とを出力することを特徴とする請求項17記載の画像処理方法。
  19. 再現画像生成手段が、前記第2の照明基底計算手段が求めた個別照明基底群を用いて、入力画像と同じ照明条件を再現する画像である再現画像を生成し、
    パラメータ更新手段が、生成した前記再現画像入力画像との誤差のコストを示すコスト関数を計算し、確率的降下法によって当該コスト関数を最小化するように、前記汎用3次元物体モデルに与える3次元形状パラメータ及びテクスチャパラメータを探索して更新し更新後の各パラメータと更新前の各パラメータとの差が予め定めた閾値より小さくなる収束条件が成立するまで繰り返し更新することを特徴とする請求項17又は請求項18記載の画像処理方法。
  20. 前記第2の照明基底計算手段が、前記汎用照明基底モデル生成手段が汎用3次元物体モデルを用いて生成する個別3次元形状データに対応する個別照明基底を、前記汎用3次元物体モデルに与える3次元形状パラメータと同一のパラメータを用いて求める請求項19記載の画像処理方法。
  21. パラメータ設定手段が、前記汎用3次元物体モデルに与えるためのランダムな3次元形状パラメータを設定し、
    第3の照明基底計算手段が、設定したパラメータ群を前記汎用3次元物体モデルに与えることによって生成されるサンプル3次元形状群に基づいて、各パラメータそれぞれに対応する照明基底群を求め、
    基底計算手段が、求めた前記照明基底群と、前記汎用3次元物体モデルの基底ベクトル及び固有値とを用いて、汎用照明基底モデルの基底ベクトルを求めることを特徴とする請求項20記載の画像処理方法。
  22. 前記第3の照明基底計算手段が、前記個別3次元形状データに基づいて、球面調和関数を用いて前記個別照明基底を求める請求項21記載の画像処理方法。
  23. 前記第3の照明基底計算手段が、複数の異なる照明条件を設定し、設定した前記各照明条件における物体表面各部位の輝度値をそれぞれ求め、求めた前記輝度値に基づいて、主成分分析によって前記個別照明基底群を求める請求項21記載の画像処理方法。
  24. 請求項14又は請求項17記載の画像処理方法を用いた、物体の3次元形状を推定する3次元形状推定方法であって、
    形状出力手段が、前記収束条件が成立すると、前記収束した時点における3次元形状パラメータ及びテクスチャパラメータに基づいて、前記汎用3次元物体モデルによって生成される3次元形状を出力することを特徴とする3次元形状推定方法。
  25. 請求項14又は請求項17記載の画像処理方法を用いた、物体の位置及び姿勢を推定する物***置姿勢推定方法であって、
    位置姿勢出力手段が、前記収束条件が成立すると、前記収束した時点における、物体の位置及び姿勢を示す位置姿勢パラメータを出力することを特徴とする物***置姿勢推定方法。
  26. 請求項14又は請求項17記載の画像処理方法を用いた、入力画像と同じ照明条件を再現する画像である再現画像を生成する画像生成方法であって、
    画像出力手段が、前記収束条件が成立すると、前記収束した時点における再現画像を出力することを特徴とする画像生成方法。
  27. コンピュータ
    類似した複数の物体の3次元形状データとテクスチャデータとに基づいて求めた汎用3次元物体モデルを用いて、3次元形状パラメータとテクスチャパラメータとに基づいて、個別の物体の3次元形状を示す個別3次元形状データと、前記個別の物体のテクスチャを示す個別テクスチャデータとを生成する個別データ手段と、
    生成した前記個別3次元形状データと前記個別テクスチャデータとに基づいて、複数の異なる照明条件における個別の物体の3次元表面各部位の輝度値の変動を示す個別照明基底をそれぞれ求める第1の照明基底計算手段と、
    求めた前記個別照明基底群を用いて、入力画像と同じ照明条件を再現する画像である再現画像を生成する再現画像生成手段と、
    生成した前記再現画像入力画像との誤差のコストを示すコスト関数を計算し、確率的降下法によって当該コスト関数を最小化するように、前記汎用3次元物体モデルに与える3次元形状パラメータ及びテクスチャパラメータを探索して更新し更新後の各パラメータと更新前の各パラメータとの差が予め定めた閾値より小さくなる収束条件が成立するまで繰り返し更新するパラメータ更新手段として機能させるための画像処理プログラム。
  28. コンピュータ
    類似した複数の物体の3次元形状データとテクスチャデータとに基づいて求めた汎用3次元物体モデルを用いて、3次元形状パラメータとテクスチャパラメータとに基づいて、個別の物体の3次元形状を示す個別3次元形状データと、前記個別の物体のテクスチャを示す個別テクスチャデータとを生成する個別データ生成手段と、
    前記汎用3次元物体モデルに対応する、個別の物体にあてられた照明の方向及び強度の違いによる反射の具合の基本的な変動を示すデータである照明基底を生成するための汎用照明基底モデルを生成する汎用照明基底モデル生成手段と、
    生成した前記汎用照明基底モデルを用いて、複数の異なる照明条件における個別の物体の3次元表面各部位の輝度値の変動を示す個別照明基底をそれぞれ求める第2の照明基底計算手段として機能させるための画像処理プログラム。
JP2007519086A 2005-06-03 2006-06-02 画像処理システム、3次元形状推定システム、物***置姿勢推定システム及び画像生成システム Active JP4793698B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007519086A JP4793698B2 (ja) 2005-06-03 2006-06-02 画像処理システム、3次元形状推定システム、物***置姿勢推定システム及び画像生成システム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2005164475 2005-06-03
JP2005164475 2005-06-03
PCT/JP2006/311087 WO2006129791A1 (ja) 2005-06-03 2006-06-02 画像処理システム、3次元形状推定システム、物***置姿勢推定システム及び画像生成システム
JP2007519086A JP4793698B2 (ja) 2005-06-03 2006-06-02 画像処理システム、3次元形状推定システム、物***置姿勢推定システム及び画像生成システム

Publications (2)

Publication Number Publication Date
JPWO2006129791A1 JPWO2006129791A1 (ja) 2009-01-08
JP4793698B2 true JP4793698B2 (ja) 2011-10-12

Family

ID=37481718

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007519086A Active JP4793698B2 (ja) 2005-06-03 2006-06-02 画像処理システム、3次元形状推定システム、物***置姿勢推定システム及び画像生成システム

Country Status (5)

Country Link
US (1) US8320660B2 (ja)
EP (1) EP1887511A1 (ja)
JP (1) JP4793698B2 (ja)
CN (1) CN100492409C (ja)
WO (1) WO2006129791A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10878657B2 (en) 2018-07-25 2020-12-29 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same
US11521460B2 (en) 2018-07-25 2022-12-06 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8494286B2 (en) 2008-02-05 2013-07-23 DigitalOptics Corporation Europe Limited Face detection in mid-shot digital images
US7471846B2 (en) 2003-06-26 2008-12-30 Fotonation Vision Limited Perfecting the effect of flash within an image acquisition devices using face detection
US7565030B2 (en) 2003-06-26 2009-07-21 Fotonation Vision Limited Detecting orientation of digital images using face detection information
US7269292B2 (en) 2003-06-26 2007-09-11 Fotonation Vision Limited Digital image adjustable compression and resolution using face detection information
US7440593B1 (en) 2003-06-26 2008-10-21 Fotonation Vision Limited Method of improving orientation and color balance of digital images using face detection information
US7792970B2 (en) 2005-06-17 2010-09-07 Fotonation Vision Limited Method for establishing a paired connection between media devices
US8989453B2 (en) 2003-06-26 2015-03-24 Fotonation Limited Digital image processing using face detection information
US8948468B2 (en) 2003-06-26 2015-02-03 Fotonation Limited Modification of viewing parameters for digital images using face detection information
US8498452B2 (en) 2003-06-26 2013-07-30 DigitalOptics Corporation Europe Limited Digital image processing using face detection information
US7574016B2 (en) 2003-06-26 2009-08-11 Fotonation Vision Limited Digital image processing using face detection information
US7844076B2 (en) 2003-06-26 2010-11-30 Fotonation Vision Limited Digital image processing using face detection and skin tone information
US8503800B2 (en) 2007-03-05 2013-08-06 DigitalOptics Corporation Europe Limited Illumination detection using classifier chains
ATE497218T1 (de) 2006-06-12 2011-02-15 Tessera Tech Ireland Ltd Fortschritte bei der erweiterung der aam- techniken aus grauskalen- zu farbbildern
US8055067B2 (en) 2007-01-18 2011-11-08 DigitalOptics Corporation Europe Limited Color segmentation
EP2115662B1 (en) 2007-02-28 2010-06-23 Fotonation Vision Limited Separating directional lighting variability in statistical face modelling based on texture space decomposition
JP4970557B2 (ja) 2007-03-05 2012-07-11 デジタルオプティックス・コーポレイション・ヨーロッパ・リミテッド デジタル画像取込装置における顔検索及び検出
US7916971B2 (en) 2007-05-24 2011-03-29 Tessera Technologies Ireland Limited Image processing method and apparatus
US7855737B2 (en) 2008-03-26 2010-12-21 Fotonation Ireland Limited Method of making a digital camera image of a scene including the camera user
WO2010012448A2 (en) 2008-07-30 2010-02-04 Fotonation Ireland Limited Automatic face and skin beautification using face detection
CN101499132B (zh) * 2009-03-12 2013-05-01 广东药学院 一种人脸图像中特征点提取的三维变换搜索方法
US8379917B2 (en) 2009-10-02 2013-02-19 DigitalOptics Corporation Europe Limited Face recognition performance using additional image features
EP2590135A1 (en) * 2010-06-30 2013-05-08 Nec Corporation Color image processing method, color image processing device, and color image processing program
KR101885090B1 (ko) * 2010-12-09 2018-08-03 삼성전자주식회사 영상 처리 장치, 조명 처리 장치 및 그 방법
CN102680012B (zh) * 2011-03-16 2015-07-08 鸿富锦精密工业(深圳)有限公司 量测信息自动输出***及方法
US20130201187A1 (en) * 2011-08-09 2013-08-08 Xiaofeng Tong Image-based multi-view 3d face generation
CN103092576A (zh) * 2011-10-28 2013-05-08 鸿富锦精密工业(深圳)有限公司 量测程序输出***及方法
US9123144B2 (en) * 2011-11-11 2015-09-01 Microsoft Technology Licensing, Llc Computing 3D shape parameters for face animation
JP5894426B2 (ja) * 2011-12-13 2016-03-30 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 計測対象抽出装置、顔形状推定装置、計測対象抽出方法および顔形状推定方法
CN103735268B (zh) * 2013-09-29 2015-11-25 沈阳东软医疗***有限公司 一种***检测方法及***
US9953111B2 (en) * 2014-06-06 2018-04-24 Matterport, Inc. Semantic understanding of 3D data
CN105426872B (zh) * 2015-12-17 2019-06-21 电子科技大学 一种基于相关高斯过程回归的面部年龄估计方法
US11157985B2 (en) * 2017-11-29 2021-10-26 Ditto Technologies, Inc. Recommendation system, method and computer program product based on a user's physical features
CN110763150B (zh) * 2018-07-26 2021-05-25 王东 一种面部轮廓测量方法
US10834413B2 (en) * 2018-08-24 2020-11-10 Disney Enterprises, Inc. Fast and accurate block matching for computer generated content
US11475608B2 (en) * 2019-09-26 2022-10-18 Apple Inc. Face image generation with pose and expression control

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994023390A1 (en) * 1993-03-29 1994-10-13 Matsushita Electric Industrial Co., Ltd. Apparatus for identifying person
JP2004054947A (ja) * 2002-07-16 2004-02-19 Nec Corp 物体照合システム、物体照合方法および物体照合プログラム
JP2004086929A (ja) * 2003-12-08 2004-03-18 Nec Corp 画像照合装置
WO2005043466A1 (ja) * 2003-10-30 2005-05-12 Nec Corporation 物体の状態を推定する推定システム、推定方法および推定プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3514945B2 (ja) 1997-05-26 2004-04-05 株式会社ソニー・コンピュータエンタテインメント 画像作成方法および画像作成装置
US6002782A (en) * 1997-11-12 1999-12-14 Unisys Corporation System and method for recognizing a 3-D object by generating a 2-D image of the object from a transformed 3-D model
US6956569B1 (en) * 2000-03-30 2005-10-18 Nec Corporation Method for matching a two dimensional image to one of a plurality of three dimensional candidate models contained in a database
JP2001283216A (ja) * 2000-04-03 2001-10-12 Nec Corp 画像照合装置、画像照合方法、及びそのプログラムを記録した記録媒体
JP4167390B2 (ja) 2000-11-20 2008-10-15 日本電気株式会社 物体照合方法,物体照合装置,およびそのプログラムを記録した記録媒体
US7212664B2 (en) * 2003-08-07 2007-05-01 Mitsubishi Electric Research Laboratories, Inc. Constructing heads from 3D models and 2D silhouettes

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994023390A1 (en) * 1993-03-29 1994-10-13 Matsushita Electric Industrial Co., Ltd. Apparatus for identifying person
JP2004054947A (ja) * 2002-07-16 2004-02-19 Nec Corp 物体照合システム、物体照合方法および物体照合プログラム
WO2005043466A1 (ja) * 2003-10-30 2005-05-12 Nec Corporation 物体の状態を推定する推定システム、推定方法および推定プログラム
JP2004086929A (ja) * 2003-12-08 2004-03-18 Nec Corp 画像照合装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10878657B2 (en) 2018-07-25 2020-12-29 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same
US11455864B2 (en) 2018-07-25 2022-09-27 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same
US11521460B2 (en) 2018-07-25 2022-12-06 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same

Also Published As

Publication number Publication date
CN100492409C (zh) 2009-05-27
WO2006129791A1 (ja) 2006-12-07
US20090129665A1 (en) 2009-05-21
EP1887511A1 (en) 2008-02-13
US8320660B2 (en) 2012-11-27
CN101189637A (zh) 2008-05-28
JPWO2006129791A1 (ja) 2009-01-08

Similar Documents

Publication Publication Date Title
JP4793698B2 (ja) 画像処理システム、3次元形状推定システム、物***置姿勢推定システム及び画像生成システム
Aldrian et al. Inverse rendering of faces with a 3D morphable model
US8406556B2 (en) Light transport reconstruction from sparsely captured images
US9317973B2 (en) Augmented reality method applied to the integration of a pair of spectacles into an image of a face
JP4556873B2 (ja) 画像照合システム及び画像照合方法
Wang et al. Face relighting from a single image under arbitrary unknown lighting conditions
JP4573085B2 (ja) 位置姿勢認識装置とその位置姿勢認識方法、及び位置姿勢認識プログラム
US6956569B1 (en) Method for matching a two dimensional image to one of a plurality of three dimensional candidate models contained in a database
WO2021042208A1 (en) Dynamically estimating light-source-specific parameters for digital images using a neural network
JP2006520055A (ja) 2次元画像からの3次元オブジェクトの不変視点検出および識別
US7672482B2 (en) Shape detection using coherent appearance modeling
Shim et al. A subspace model-based approach to face relighting under unknown lighting and poses
Qin et al. Aura 3D textures
CN112085835A (zh) 三维卡通人脸生成方法、装置、电子设备及存储介质
Kumar et al. Non-Lambertian reflectance modeling and shape recovery of faces using tensor splines
Kartashova et al. Light shapes: Perception-based visualizations of the global light transport
JP2004054947A (ja) 物体照合システム、物体照合方法および物体照合プログラム
Taheri et al. Joint albedo estimation and pose tracking from video
JP2017122993A (ja) 画像処理装置、画像処理方法及びプログラム
Ma et al. A lighting robust fitting approach of 3D morphable model for face reconstruction
JP3910811B2 (ja) テクスチャマッピング方法、テクスチャマッピング処理プログラム及びそのプログラムを記録したコンピュータ読取り可能な記録媒体
Ma et al. A lighting robust fitting approach of 3D morphable model using spherical harmonic illumination
Matsushita Radiometric Response Function
Shim Probabilistic approach to realistic face synthesis with a single uncalibrated image
Aleksandrova et al. Approach for Creating a 3D Model of a Face from its 2D Image

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080701

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090519

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090519

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20101013

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101013

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110412

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110613

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110701

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110714

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4793698

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140805

Year of fee payment: 3