JP4957921B2 - 照合装置および照合方法 - Google Patents

照合装置および照合方法 Download PDF

Info

Publication number
JP4957921B2
JP4957921B2 JP2008511027A JP2008511027A JP4957921B2 JP 4957921 B2 JP4957921 B2 JP 4957921B2 JP 2008511027 A JP2008511027 A JP 2008511027A JP 2008511027 A JP2008511027 A JP 2008511027A JP 4957921 B2 JP4957921 B2 JP 4957921B2
Authority
JP
Japan
Prior art keywords
data
model
parameter
target
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008511027A
Other languages
English (en)
Other versions
JPWO2007119870A1 (ja
Inventor
塁 石山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008511027A priority Critical patent/JP4957921B2/ja
Publication of JPWO2007119870A1 publication Critical patent/JPWO2007119870A1/ja
Application granted granted Critical
Publication of JP4957921B2 publication Critical patent/JP4957921B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Description

本発明は、変動する多様な環境下で撮影された画像や3次元データを参照データと照合し、被写体が何であるか、または、被写体の状態、または、撮影時の環境などを認識する照合装置および照合方法に関する。
画像に含まれる被写体が何であるか、その被写体の状態(姿勢、表情など)、撮影時の環境(照明条件、カメラの種類)などの要素を認識する方法がある。その一方法として、認識対象となる画像と比較対象の参照画像との類似度を評価し、両者の同一性を判定する方法が知られている。
しかし、認識対象画像と参照画像との間で、認識したい要素でないその他の要素が変動する場合、それらによって生じる画像の変動が認識目的の要素に起因する変動よりも大きくなると、認識したい要素が同一であってもそれが同一であると認識することが困難となり、認識性能が低下する問題があった。
一例として、人物の顔画像を入力として個人識別を行う顔照合システムにおいては、認識したい要素は顔の個人性であり、その他の画像変動要素として顔の姿勢、照明条件などがある。姿勢や照明の変化によって生じる画像輝度値の変化が、個人差によって生じる画像輝度値の変動より大きい場合、同一人物の画像データどうしであっても、他人であると判定してしまうといった誤照合が起こる原因となっていた。
このような問題を改善するために、画像変動を生じさせる多様な要素とその結果として生じる画像変動との関係をあらかじめ用意した学習データ群などからモデル化し、各要素をパラメタ(パラメータと同義)として与えると、その状況における画像を生成できる画像変動モデルを利用する方法が種々提案されている。すなわち、与えられた入力画像に対して画像変動モデルによって生成される画像ができるだけ近くなるようなパラメタの値を推定するモデルフィッティング処理を行い、得られたパラメタ値のうち認識対象のパラメタ値に基づいて認識を行う技術である。
以下の先行技術文献2には、上記技術の一例が開示されている。同技術は、あらかじめ集めた多くの人物の3次元顔モデルを元に、個人差の要素すなわち顔の3次元形状とテクスチャとの個性を表すパラメタによって3次元顔モデルを生成するモデルを作成する技術である。
さらに、顔の姿勢と照明条件とを表すパラメタによって、3次元顔モデルデータからコンピュータグラフィクスを用いて前記姿勢および照明パラメタのあらわす状況下での顔画像が生成される。以上のモデルは、個人性、顔の姿勢、照明条件をパラメタとして与えると、それらの状況における顔画像を生成できる画像変動モデルの一例であり、顔のモーファブルモデル(以下MMとも称す)と呼ばれる。
そして、先行技術文献2では、参照画像(以下ギャラリ画像とも称す)と認識対象画像(以下プローブ画像とも称す)とのそれぞれの画像に対してMMをフィッティングして、個人性、姿勢、照明の各要素を表すパラメタを推定し、この推定したパラメタ群に基づいて両画像を照合する技術が示されている。具体的には、以下の2つの技術が示されている。
(1)推定されたパラメタ群のうち、目的パラメタのみの類似度を計算して照合する。(2)目的パラメタの値を認識対象画像から求めた値とし、その他のパラメタを登録画像から推定した値にしたときの画像を比較画像としてMMから生成し、この生成した画像と登録画像との類似度を計算して照合する。
上記(1)の技術は、図1に示されるように構成されている。図1において、モデルフィッティング手段1001は、ギャラリ画像Igにできるだけ類似するように画像変動モデル1003のパラメタを決定する。このとき決定された一連のパラメタのうち、照合の目的に対応するパラメタが目的パラメタptg、それ以外のパラメタが外部パラメタpegである。モデル画像I’gはこのとき生成された画像である。例えば、個人の顔の照合を行う場合、目的パラメタptgは個人性パラメタ、外部パラメタpegは姿勢や照明の各要素を表すパラメタとなる。同様に、モデルフィッティング手段1002によって、プローブ画像Ipにできるだけ類似するようなモデル画像I’pが得られるように、画像変動モデル1003の目的パラメタptpおよび外部パラメタpepが決定される。そして、パラメタ照合手段1004において、目的パラメタptg,ptpどうしの類似度が計算される。この計算結果を当該ギャラリ画像Igとプローブ画像Ipの類似度とする。ギャラリ画像Igが複数存在する場合、他のギャラリ画像について同様の計算を行い、最も類似度の高かったギャラリ画像Igを照合結果とする。
上記(2)の技術では、目的パラメタの値をプローブ画像から求めた目的パラメタptpの値とし、その他のパラメタをギャラリ画像から推定した外部パラメタpegの値としたときの画像が比較画像として、画像変動モデル1003から生成される。この比較画像と元のギャラリ画像Igとの類似度が計算される。この類似度を当該ギャラリ画像Igとプローブ画像Ipの類似度とする。ギャラリ画像Igが複数存在する場合、他のギャラリ画像についても同様の計算が行なわれ、最も類似度の高かったギャラリ画像Igが照合結果となる。
・先行技術文献1:特開2002−157595号公報
・先行技術文献2:Volker Blanz,Thomas Vetter,″Face Recognition Based on Fitting a 3D Morphable Model″,IEEE Trans.PAMI,vol.25,no.9,pp.1063−1074,2003
・先行技術文献3:Sami Romdhani,Volker Blanz,Thomas Vetter,″Face Identification by Fitting a 3D Morphable Model using Linear Shape and Texture Error Functions″,Proc.ECCV 2002,pp.3−19,2002
・先行技術文献4:Andreas Lanitis,Chris J.Taylor,Timothy F.Cootes,″Automatic Interpretation and Coding of Face Images Using Flexible Models″,IEEE Trans.PATTERN ANALYSIS AND MACHINE INTELLIGENCE,VOL.19,NO.7,JULY 1997
しかし、上記した先行技術文献2に記載される技術のフィッティング処理の高速化技術を示している先行技術文献3において指摘されているように、上記(1)および(2)のどちらの技術も推定されたパラメタの値の類似度に基づいて認識を行うため、照合性能がモデルフィッティング処理の絶対的な精度に強く影響される。これは、先行技術文献3の技術を用いた場合も同様である。
モデルフィッティング処理は、多数のパラメタの非線形最適化処理であるため、状況によって推定が不安定になり、また局所解に陥りやすくなり、さらに、与える初期値によって推定値の精度が影響されるなどの問題があり、絶対的な精度を高めるのは難しい。推定されるパラメタの値の精度が低下すると、上記(1)および(2)の技術では、プローブ画像とそれに正しく合致するギャラリ画像との間の類似度と、プローブ画像とその他のギャラリ画像との間の類似度とに明確な差が現れないため、照合精度が大きく低下するという問題があった。
本発明の目的は、認識対象となる画像や3次元データに対して画像変動モデルや3次元データ変動モデルをフィッティングして変動要素を推定する際に、フィッティング処理の絶対的な精度の低下による影響を軽減することにある。
本発明の第1の態様に係る照合装置は、物体の画像または3次元データである対象データと参照データとを照合する装置であって、複数のパラメタの値を調整することにより物体の画像または3次元データであるモデルデータを生成できる変動モデルを記憶する記憶手段と、前記記憶手段に記憶された変動モデルを用い、前記複数のパラメタのうち、前記対象データと前記参照データ間で同一かどうかを判定する対象となるパラメタを目的パラメタ、それ以外のパラメタを外部パラメタとし、対象データと参照データとで目的パラメタを同一の値にした条件の下で、前記対象データに類似する対象モデルデータと前記参照データに類似する参照モデルデータとを前記変動モデルから生成するために最適な前記パラメタの値を推定するモデルフィッティング手段と、前記推定されたパラメタの下での前記対象モデルデータおよび前記参照モデルデータの前記対象データおよび前記参照データに対するモデル適合度を算出するモデル適合度評価手段とを備えることを特徴とする。
本発明の第2の態様に係る照合装置は、前記算出されたモデル適合度と予め定められた閾値とを比較することにより、前記対象データと前記参照データ間における前記目的パラメタの同一性を判定する照合手段を備えることを特徴とする。
本発明の第3の態様に係る照合装置は、複数の参照データのそれぞれと前記対象データとの組み合わせについて前記モデルフィッティング手段およびモデル適合度評価手段による処理を繰り返し、最も良いモデル適合度が得られた組み合わせにおける目的パラメタの値を前記対象データの目的パラメタの推定値とする照合手段を備えることを特徴とする。
本発明の第4の態様に係る照合装置は、複数の参照データのそれぞれと前記対象データとの組み合わせについて前記モデルフィッティング手段およびモデル適合度評価手段による処理を繰り返し、予め定められた閾値以上のモデル適合度が得られた複数の組み合わせにおける目的パラメタから計算した値を、前記対象データの目的パラメタの推定値とする照合手段を備えることを特徴とする。
本発明の第5の態様に係る照合装置は、前記モデル適合度評価手段は、前記生成された前記対象モデルデータと前記対象データとの間の誤差および前記生成された前記参照モデルデータと前記参照データとの間の誤差を計算し、該計算した誤差から前記モデル適合度を算出することを特徴とする。
本発明の第6の態様に係る照合装置は、前記モデル適合度評価手段は、前記推定されたパラメタの値の確からしさを示すパラメタ確信度を予め定められたパラメタ基準情報を参照して計算し、該計算したパラメタ確信度から前記モデル適合度を算出することを特徴とする。
本発明の第7の態様に係る照合装置は、前記モデル適合度評価手段は、前記生成された前記対象モデルデータと前記対象データとの間の誤差および前記生成された前記参照モデルデータと前記参照データとの間の誤差を計算すると共に、前記推定されたパラメタの値の確からしさを示すパラメタ確信度を予め定められたパラメタ基準情報を参照して計算し、前記計算した誤差およびパラメタ確信度から前記モデル適合度を算出することを特徴とする。
本発明の第8の態様に係る照合装置は、前記パラメタ基準情報が、前記パラメタの値の取り得る値域であることを特徴とする。
本発明の第9の態様に係る照合装置は、前記パラメタ基準情報が、前記パラメタの正解値であることを特徴とする。
本発明の第10の態様に係る照合装置は、前記パラメタ基準情報が、前記パラメタの値の確率分布であることを特徴とする。
本発明の第11の態様に係る照合装置は、前記モデルフィッティング手段は、前記対象データに類似する対象個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値、および、前記参照データに類似する参照個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値を、前記対象データと前記参照データとで目的パラメタの値が必ずしも同一でないとの条件の下に推定し、前記モデル適合度評価手段は、前記推定された対象個別モデルデータの前記パラメタの値および前記参照個別モデルデータの前記パラメタの値を、前記パラメタ基準情報とすることを特徴とする。
本発明の第12の態様に係る照合装置は、前記モデルフィッティング手段は、前記対象データに類似する対象個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値、および、前記参照データに類似する参照個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値を、前記対象データと前記参照データとで目的パラメタの値が必ずしも同一でないとの条件の下に推定し、前記モデル適合度評価手段は、前記対象個別モデルデータと前記対象データとの間の誤差、前記参照個別モデルデータと前記参照データとの間の誤差、前記対象モデルデータと前記対象個別モデルデータとの間の誤差、前記参照モデルデータと前記参照個別モデルデータとの間の誤差の少なくとも一つの誤差をさらに考慮に入れて前記モデル適合度を算出することを特徴とする。
本発明の第13の態様に係る照合装置は、前記変動モデルとして、様々な物体の3次元モデルを含み、物体を指定するパラメタに応じて指定の物体の3次元モデルを選択し、該選択した3次元モデルを、物体の状態、姿勢、照明条件、カメラの特性などのパラメタに応じて変形し、さらに、コンピュータグラフィクスを用いて前記パラメタの表す状況下での画像を生成する画像変動モデルを使用することを特徴とする。
本発明の第14の態様に係る照合装置は、前記変動モデルとして、物体の個性や状態を指定するパラメタに応じて該状態における物体の3次元モデルを計算し、該計算した3次元モデルを、物体の姿勢、照明条件、カメラの特性などのパラメタに応じて変形し、さらに、コンピュータグラフィクスを用いて前記パラメタの表す状況下での画像を生成する画像変動モデルを使用することを特徴とする。
本発明の第15の態様に係る照合装置は、前記変動モデルとして、様々な物体の3次元モデルを含み、物体を指定するパラメタに応じて指定の物体の3次元モデルを選択し、該選択した3次元モデルを、物体の状態、姿勢、照明条件、カメラの特性などのパラメタに応じて変形する3次元データ変動モデルを使用することを特徴とする。
本発明の第16の態様に係る照合装置は、前記変動モデルとして、物体の個性や状態を指定するパラメタに応じて該状態における物体の3次元モデルを計算し、該計算した3次元モデルを、物体の姿勢、照明条件、カメラの特性などのパラメタに応じて変形する3次元データ変動モデルを使用することを特徴とする。
本発明の第17の態様に係る照合装置は、前記目的パラメタが物体の種類を記述するパラメタであり、前記照合手段が前記対象データと前記参照データの物体が同一であるかを判定する手段であることを特徴とする。
本発明の第18の態様に係る照合装置は、前記変動モデルが顔の画像または3次元データを生成するモデルであり、前記目的パラメタが人物の個性を記述するパラメタであり、前記照合手段が前記対象データと前記参照データの人物が同一であるかを照合する手段であることを特徴とする。
本発明の第19の態様に係る照合装置は、前記目的パラメタが物体の位置または姿勢を特定するパラメタであり、前記照合手段が前記対象データと前記参照データの物体の位置または姿勢が同一であるかを照合する手段であることを特徴とする。
本発明の第20の態様に係る照合装置は、前記変動モデルが顔の画像または3次元データを生成するモデルであり、前記目的パラメタが人物の顔の表情を特定するパラメタであり、前記照合手段が前記対象データと前記参照データの顔の表情が同一であるかを照合する手段であることを特徴とする。
本発明の第1の態様に係る照合方法は、コンピュータを用いて物体の画像または3次元データである対象データと参照データとを照合する方法であって、前記コンピュータが、複数のパラメタの値を調整することにより物体の画像または3次元データであるモデルデータを生成できる変動モデルを用い、前記複数のパラメタのうち、前記対象データと前記参照データ間で同一かどうかを判定する対象となるパラメタを目的パラメタ、それ以外のパラメタを外部パラメタとし、対象データと参照データとで目的パラメタを同一の値にした条件の下で、前記対象データに類似する対象モデルデータと前記参照データに類似する参照モデルデータとを前記変動モデルから生成するために最適な前記パラメタの値を推定する第1のステップと、前記コンピュータが、前記推定されたパラメタの下での前記対象モデルデータおよび前記参照モデルデータの前記対象データおよび前記参照データに対するモデル適合度を算出する第2のステップとを含むことを特徴とする。
本発明の第2の態様に係る照合方法は、前記コンピュータが、前記算出されたモデル適合度と予め定められた閾値とを比較することにより、前記対象データと前記参照データ間における前記目的パラメタの同一性を判定する第3のステップをさらに含むことを特徴とする。
本発明の第3の態様に係る照合方法は、前記コンピュータが、複数の参照データのそれぞれと前記対象データとの組み合わせについて前記第1および第2のステップを繰り返し、最も良いモデル適合度が得られた組み合わせにおける目的パラメタの値を前記対象データの目的パラメタの推定値とする第3のステップをさらに含むことを特徴とする。
本発明の第4の態様に係る照合方法は、前記コンピュータが、複数の参照データのそれぞれと前記対象データとの組み合わせについて前記第1および第2のステップを繰り返し、予め定められた閾値以上のモデル適合度が得られた複数の組み合わせにおける目的パラメタから計算した値を、前記対象データの目的パラメタの推定値とする第3のステップをさらに含むことを特徴とする。
本発明の第5の態様に係る照合方法は、前記第2のステップにおいては、前記生成された前記対象モデルデータと前記対象データとの間の誤差および前記生成された前記参照モデルデータと前記参照データとの間の誤差を計算し、該計算した誤差から前記モデル適合度を算出することを特徴とする。
本発明の第6の態様に係る照合方法は、前記第2のステップにおいては、前記推定されたパラメタの値の確からしさを示すパラメタ確信度を予め定められたパラメタ基準情報を参照して計算し、該計算したパラメタ確信度から前記モデル適合度を算出することを特徴とする。
本発明の第7の態様に係る照合方法は、前記第2のステップにおいては、前記生成された前記対象モデルデータと前記対象データとの間の誤差および前記生成された前記参照モデルデータと前記参照データとの間の誤差を計算すると共に、前記推定されたパラメタの値の確からしさを示すパラメタ確信度を予め定められたパラメタ基準情報を参照して計算し、前記計算した誤差およびパラメタ確信度から前記モデル適合度を算出することを特徴とする。
本発明の第8の態様に係る照合方法は、前記パラメタ基準情報が、前記パラメタの値の取り得る値域であることを特徴とする。
本発明の第9の態様に係る照合方法は、前記パラメタ基準情報が、前記パラメタの正解値であることを特徴とする。
本発明の第10の態様に係る照合方法は、前記パラメタ基準情報が、前記パラメタの値の確率分布であることを特徴とする。
本発明の第11の態様に係る照合方法は、前記コンピュータが、前記対象データに類似する対象個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値、および、前記参照データに類似する参照個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値を、前記対象データと前記参照データとで目的パラメタの値が必ずしも同一でないとの条件の下に推定し、該推定した対象個別モデルデータの前記パラメタの値および前記参照個別モデルデータの前記パラメタの値を、前記パラメタ基準情報とすることを特徴とする。
本発明の第12の態様に係る照合方法は、前記コンピュータが、前記対象データに類似する対象個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値、および、前記参照データに類似する参照個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値を、前記対象データと前記参照データとで目的パラメタの値が必ずしも同一でないとの条件の下に推定し、前記対象個別モデルデータと前記対象データとの間の誤差、前記参照個別モデルデータと前記参照データとの間の誤差、前記対象モデルデータと前記対象個別モデルデータとの間の誤差、前記参照モデルデータと前記参照個別モデルデータとの間の誤差の少なくとも一つの誤差をさらに考慮に入れて前記モデル適合度を算出することを特徴とする。
本発明では、プローブ画像とギャラリ画像との間での、認識目的とする画像変動要素の類似性判定には、その要素をあらわすパラメタの値自体を推定する必要はなく、両画像においてその要素が同一であるかどうか、すなわち、同一であることの確からしさだけが分かればよいことを利用する。さらに本発明では、ある画像変動要素が同じである複数の画像に対して、当該同じである要素をあらわすパラメタを共通にして、画像変動モデルを両方の画像にフィッティングさせる処理はそれなりの精度で行えるのに対し、逆に、ある画像変動要素が異なっている画像群に対して、当該異なっている要素をあらわすパラメタを共通にして、画像変動モデルを両方の画像にフィッティングさせる処理は極端にその精度が低下する現象を利用する。プローブ画像とギャラリデータ、プローブデータとギャラリ画像、プローブデータとギャラリデータとの類似性判定についても同様である。
すなわち本発明では、複数のパラメタの値を調整することにより物体の画像または3次元データであるモデルデータを生成できる変動モデルを用い、前記複数のパラメタのうち、前記対象データと前記参照データ間で同一かどうかを判定する対象となるパラメタを目的パラメタ、それ以外のパラメタを外部パラメタとし、対象データと参照データとで目的パラメタを同一の値にした条件の下で、前記対象データに類似する対象モデルデータと前記参照データに類似する参照モデルデータとを前記変動モデルから生成するために最適な前記パラメタの値を推定し、前記推定されたパラメタの下での前記対象モデルデータおよび前記参照モデルデータの前記対象データおよび前記参照データに対するモデル適合度を算出し、該算出されたモデル適合度と予め定められた閾値とを比較することにより、前記対象データと前記参照データ間における前記目的パラメタの同一性を判定する。
前記モデル適合度としては、一例として、前記生成された前記対象モデルデータと前記対象データとの間の誤差および前記生成された前記参照モデルデータと前記参照データとの間の誤差を計算し、該計算した誤差から導出される値を用いることができ、また、他の例として、前記推定されたパラメタの値の確からしさを示すパラメタ確信度を予め定められたパラメタ基準情報(例えばパラメタの値の取り得る値域、パラメタの正解値、パラメタの値の確率分布など)を参照して計算し、該計算したパラメタ確信度から導出される値を用いることができ、さらにこれらを組み合わせて使用することもできる。また、前記対象データに類似する対象個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値、および、前記参照データに類似する参照個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値を、前記対象データと前記参照データとで目的パラメタの値が必ずしも同一でないとの条件の下に推定し、この推定された対象個別モデルデータの前記パラメタの値および前記参照個別モデルデータの前記パラメタの値を、前記パラメタ基準情報とすることもできる。
また前記対象データに類似する対象個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値、および、前記参照データに類似する参照個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値を、前記対象データと前記参照データとで目的パラメタの値が必ずしも同一でないとの条件の下に推定し、前記対象個別モデルデータと前記対象データとの間の誤差、前記参照個別モデルデータと前記参照データとの間の誤差、前記対象モデルデータと前記対象個別モデルデータとの間の誤差、前記参照モデルデータと前記参照個別モデルデータとの間の誤差の少なくとも一つの誤差をさらに考慮に入れて前記モデル適合度を算出することもできる。
本発明によれば、認識対象となる画像や3次元データに対して画像変動モデルや3次元データ変動モデルをフィッティングして変動要素を推定する際に、フィッティング処理の絶対的な精度の低下による影響を軽減することができる。その理由は、照合したい目的パラメタの値が対象データと参照データで異なる場合には、目的パラメタを共通にしたフィッティング処理では両データに類似したモデルデータが決して求まらないためにモデル適合度が極端に悪化し、逆に、照合したい目的パラメタの値が両データで同じである場合には、両データに類似したモデルデータが基本的には必ず求まるためにモデル適合度が良い値を示す点を利用し、照合したい目的パラメタが両データで同じであるときと異なるときのモデル適合度の値の隔たりを顕著化させているためである。
図1は、従来技術の説明図である。
図2は、本発明の第1の実施の形態のブロック図である。
図3は、本発明の第1の実施の形態における処理の流れを示す図である。
図4は、本発明の第1の実施の形態における2Dモデルフィッティング手段の構成とその処理の流れを示す図である。
図5は、本発明の第2の実施の形態のブロック図である。
図6は、本発明の第2の実施の形態における処理の流れを示す図である。
図7は、本発明の第2の実施の形態における3Dモデルフィッティング手段の構成とその処理の流れを示す図である。
図8は、本発明の第3の実施の形態のブロック図である。
図9は、本発明の第3の実施の形態における処理の流れを示す図である。
図10は、本発明の第3の実施の形態における2D3Dモデルフィッティング手段の構成とその処理の流れを示す図である。
図11は、本発明の第4の実施の形態のブロック図である。
図12は、本発明の第4の実施の形態における処理の流れを示す図である。
図13は、本発明の第4の実施の形態における2D3Dモデルフィッティング手段の構成とその処理の流れを示す図である。
図14は、本発明の第5の実施の形態のブロック図である。
図15は、本発明の第5の実施の形態における処理の流れを示す図である。
図16は、本発明の第6の実施の形態のブロック図である。
図17は、本発明の第6の実施の形態における処理の流れを示す図である。
図18は、本発明の第7の実施の形態のブロック図である。
図19は、本発明の第7の実施の形態における処理の流れを示す図である。
次に、本発明を実施するための最良の形態について、図面を参照して詳細に説明する。
(第1の実施の形態)
図2を参照すると、本実施の形態は、プログラム制御により動作する処理装置1200と、この処理装置1200に接続された画像入力装置1100、記憶装置1300、入力装置1500および出力装置1600とから構成される。認識対象であるプローブ画像と参照画像であるギャラリ画像とが照合される。
画像入力装置1100は、プローブ画像を処理装置1200に入力する装置であり、カメラであってもよいし、図示しない記憶装置からプローブ画像を読み込んだり、ネットワークを通じてプローブ画像を受信する装置であっても良い。
記憶装置1300は、処理装置1200で実行するプログラムおよび照合に用いる各種のデータを記憶する。各種データには、ギャラリ画像および画像変動モデルに関するデータが含まれる。ギャラリ画像は、あらかじめ記憶装置1300に記憶しておいても良いし、プローブ画像と共に、その都度、読み込まれても良い。
画像変動モデルは、物体の種類、物体の状態、姿勢、照明条件、カメラなどの多様な画像変動要素によって、撮影される画像がどのように変動するかを記述したモデルである。画像変動モデルは、付与される多様な画像変動要素という条件の下におけるモデル画像を生成するために使用される。画像変動モデルに関するデータには、モデル画像を生成する過程で必要とされる一切のデータが含まれる。
画像変動モデルの一例(モデル1と称す)として、上記先行技術文献2に記載されているようなモデルがある。このモデルは、多様な人物の顔画像を、3D形状の個性、テクスチャの個性、表情、顔の姿勢、照明条件、カメラの性質をそれぞれ現すパラメタを与えることによってコンピュータグラフィクスの技術により生成される画像変動モデルである。この場合、あらかじめ多数の人物の顔の3Dデータが集められ、形状およびテクスチャのそれぞれのデータが主成分分析され、基底3Dデータ群および基底テクスチャ群が計算され、記憶部に記憶される。
画像変動モデルの別の例(モデル2と称す)として、上記先行技術文献1に記載されているモデルがある。このモデルは、照合したい人物のそれぞれの3D形状データと照明基底データを備え、人物を指定し、顔の姿勢、照明、カメラの性質をそれぞれあらわすパラメタを与えることによって、該条件での該人物の顔画像を生成するような画像変動モデルである。この場合、各人物の顔の3Dモデルそれぞれについて、多様な照明条件下でのテクスチャ輝度値が計算され、それらデータが主成分分析され、基底テクスチャ群が計算され、記憶部に記憶される。
上記した例としてあげた画像変動モデルはあくまで一例である。このほかにも様々な画像変動モデルを利用することが可能である。3次元データを用いない画像変動モデルの一例として、上記先行技術文献4に記載された「Active Appearance Model」なども同様に利用可能である。
処理装置1200は、2Dモデルフィッティング手段1201と、モデル適合度評価手段1202と、照合手段1203とを備える。
2Dモデルフィッティング手段1201は、図3に示されるように、ギャラリ画像Igおよびプローブ画像IPの両者を入力して、認識目的の要素をあらわす目的パラメタptが両画像Ig,IPで同一の値をとり、その他の変動要素をあらわすパラメタpeが両画像Ig,IPで異なる値をとる場合があると仮定すると、前述したような画像変動モデル1204を用いてそれぞれの画像Ig,IPにできるだけ近い(以下に示したコスト関数の値が小さくなるような)モデル画像I’g,I’Pを生成できるように、各パラメタpt,peの値が計算される。この技術は、上記先行技術文献1に記載の技術のように、プローブ画像IPとギャラリ画像Igのそれぞれに対して独立に目的パラメタptと外部パラメタpeの両者を推定するという技術とは異なる。すなわち、この目的パラメタptが両画像で同じ値を取ると仮定して、両画像に対して同時に目的パラメタptおよび外部パラメタpeが推定される。ここで、ギャラリ画像Igについて推定された外部パラメタpeをpeg、プローブ画像IPについて推定された外部パラメタpeをpepとする。
一例として、顔画像によって人物を識別する個人認識システムを例にすると、目的パラメタptは個人性をあらわすパラメタ、外部パラメタpeは顔の姿勢、照明条件、カメラの性質に関するパラメタである。顔の姿勢のパラメタとして、顔の3次元的な位置座標と、顔の3次元的な向きを表す3つの回転角度がある。照明条件のパラメタとしては、照明の方向と強度をあらわす3次元ベクトルを一例として利用できる。以上のパラメタの設定方法はあくまで一例であり、使用する画像変動モデルに合わせて様々に変更可能である。
別の例として、物体の位置や向きを推定する位置姿勢推定システムを例にすると、目的パラメタptは姿勢パラメタであり、外部パラメタpeは物体の種類、照明条件、カメラの性質に関するパラメタである。ある特定の物体しか認識対象としない場合には、物体の種類のパラメタはなくてもよい。また、照明条件が同じである画像しか認識しない場合には、照明条件のパラメタはなくてもよい。このように、必要に応じてパラメタを設定することができる。
図4を参照すると、2Dモデルフィッティング手段1201は、初期値推定手段2101と、モデル画像生成手段2102と、コスト評価手段2103と、パラメタ推定手段2104とを備える。これらの手段はそれぞれ概略つぎのように動作する。
初期値推定手段2101は、プローブ画像IPおよびギャラリ画像Igのそれぞれについて、画像変動要素のパラメタpt、peg、pepの初期値を求める。これは、あらかじめ与えられた既知の値でもよいし、別途のセンサーなどによって計測される値でもよく、また、各画像IP,Igに付与される情報として入力されるものでもよい。その一例として、顔画像認識の場合は、画像中の顔の目や鼻、口の位置などを示す基準点位置データを付与情報としておくことにより、該付与情報から顔の姿勢の概算値を初期値として計算することができる。
個人性のパラメタは平均値を初期値とすることができる。その他のパラメタも適時値をあらかじめ定めておいてもよい。両画像IP,Igに対する目的パラメタptの初期値、プローブ画像IPに対する外部パラメタpepの初期値、ギャラリ画像Igに対する外部パラメタpegの初期値は、モデル画像生成手段2102へ出力される。
モデル画像生成手段2102では、初回のモデル画像の生成時は、初期値推定手段2101から初期値として出力された目的パラメタptおよび外部パラメタpep,pegが使用され、以後の繰り返し時にはパラメタ推定手段2104によって更新された目的パラメタptおよび外部パラメタpep,pegが使用される。
モデル画像生成手段2102は、画像変動モデル1204を用いて、これらパラメタ{pt,pep,peg}の表す状況下における画像をモデル画像として生成する。パラメタが複数ある場合、{pt,pep,peg}はそれぞれベクトルとなる。
画像変動モデル1204として前記先行技術文献2に記載のモデルを用いた場合、個人性をあらわすパラメタを結合係数とした基底3Dデータおよび基底テクスチャデータそれぞれの線形結合を計算することにより、特定人物の顔の3Dデータが計算される。次に、姿勢、照明、カメラ特性のパラメタにより、コンピュータグラフィクスの技術を用いてモデル画像が生成される。
モデル画像生成手段2102は、画像変動モデル1204として前記先行技術文献1に記載のモデルを用いた場合、個人性をあらわすパラメタを元に、対応する3D形状データと基底テクスチャ群が選択する。モデル画像生成手段2102は、次に、照明パラメタを結合係数として前記基底テクスチャ群の線形結合を計算することにより、該照明条件における3Dデータ表面の輝度値を計算する。次に、姿勢、カメラ特性などのパラメタにより、コンピュータグラフィクスの技術を用いて3Dデータ表面の各点と画像の各画素の位置の対応関係が計算され、対応する3Dデータ表面の輝度値を画素の輝度値とすることにより、モデル画像が生成される。
以上の処理を、プローブ画像Ipおよびギャラリ画像Igそれぞれに対して行うことにより、プローブモデル画像I’pおよびギャラリモデル画像I’gが生成される。ただし、各モデル画像の生成過程において、目的パラメタptは同一の値であると仮定し共通パラメタとする。外部パラメタpeは異なる値をとる可能性があるので異なるパラメタとする。
一例として、顔の画像から人物を特定する個人識別システムの場合は、顔の形状やテクスチャの個人性を現すパラメタが目的パラメタpt、顔の姿勢、照明条件、カメラ特性などを記述するパラメタが外部パラメタpeとなる。また他の例として物体の向きを認識するシステムにおいては、物体の姿勢をあらわすパラメタが目的パラメタptであり、物体の種類や形状、表面色、照明条件、カメラの特性などをあらわすパラメタが外部パラメタpeとなる。
プローブ画像の外部パラメタをpep、ギャラリ画像の外部パラメタをpegとし、上述した画像変動モデルによる画像生成を関数M(pt,pe)であらわすと、プローブモデル画像I’pおよびギャラリモデル画像I’gは次式で与えられる。
Figure 0004957921
コスト評価手段2103は、プローブモデル画像I’pとプローブ画像Ip、ギャラリモデル画像I’gとギャラリ画像Igをそれぞれ比較し、モデルフィッティングのコスト関数を計算する。コスト関数は、一例として次式に示すように、比較する両画像の輝度値の二乗誤差和とすることができる。
C=|I−I’|2
I=[IpT,wgIgT]T …(2)
I’=[I’pT,wgI’gT]T
ただし、式2において、Ipはプローブ画像の各画素の輝度値を並べたベクトル、Igはギャラリ画像の各画素の輝度値を並べたベクトル、I’pはプローブモデル画像の各画素の輝度値を並べたベクトル、I’gはギャラリ画像の各画素の輝度値を並べたベクトルであり、画像ベクトルIはIpとwgIgを並べたベクトル、モデル画像ベクトルI’はI’pとwgI’gを並べたベクトルとする。wgの値はあらかじめ適当な値を定めておけばよいが、一例として、プローブ画像の画素数をギャラリ画像の画素数で割った値としてもよい。
他の例として、前記先行技術文献2の技術のように、各パラメタの値の事前確率を表すコスト項を、式2のコスト関数値に加算することもできる。
パラメタ推定手段2104は、式2のコスト関数値を改良(式2の場合は小さい値に)するように、目的パラメタptおよび外部パラメタpep、pegそれぞれの値を更新する。これには様々な最適化手法が利用可能であるが、一例として最急降下法がある。
各パラメタ(pt,pep,peg)を並べた全パラメタベクトルをpとし、各要素piの値をあらかじめ決めた微小な量Δiだけ変化させて、モデル画像生成手段2102によりそれぞれの要素を微小変化させたときのモデル画像I’(p+Δi)が生成される(Δiは要素iがΔi、他の要素がゼロのベクトル)。次に、コスト評価手段2103によってコスト関数の値C(p+Δi)が次式により計算される。
C(p+Δi)=|I−I’(p+Δi)|2 …(3)
次に、変化後のコスト関数値と元のコスト関数値の差分を前記微小変化量で割ることによって、コスト関数の勾配ベクトル∇Cの値が次式により計算される。
∇C=[(C(p+Δ1)−C(p))/Δ1,(C(p+Δ2)−C(p))/Δ2,…]T …(4)
最急降下法によって、パラメタpの値は次式で更新される。
p(t+1)=p(t)−α∇C …(5)
αは事前に決めたゲイン定数とする。一例として値は1.0でもよい。また、状況に応じて適応的に変化させることもできる。
以上の方法はあくまで一例であり、他にもGauss−Newton法などの様々な最適化手法を利用することが可能である。一例としてGauss−Newton法を用いる場合は、ヤコビ行列Jを次式で求めることができる。
J=[(I−I’(p+Δ1))/Δ1,(I−I’(p+Δ2))/Δ2,…] …(6)
パラメタpは次式で更新される。
p(t+1)=p(t)−α(JTJ)−1J(I−I’(p)) …(7)
この他にも、様々な最適化手法を適用して、コスト関数Cの値を最小にするようなパラメタの値を求めることももちろん可能である。
なお、画像変動モデル1204として前記モデル2を用いた場合、個人性をあらわすパラメタは人物の番号であり連続的な値を取らない。このような場合は、微分値を計算せずに、取りえる値のそれぞれについて(すなわち、個々の人物の顔のそれぞれについて)、モデル画像生成手段2102とコスト評価手段2103の処理を繰り返し行ってコスト関数の値を計算し、最良のコスト値を得た値を推定値とすることができる。このとき、他の連続的な値を取るパラメタについては、上述した方法や様々な最適化手法を適用してコスト関数値を最小にするパラメタの値が求められる。
再び図2および図3を参照すると、モデル適合度評価手段1202は、モデルフィッティング手段1201の処理によってパラメタ推定が適正に行われたかどうかを評価する。すなわち、モデルフィッティング処理においては、目的パラメタptがギャラリ画像とプローブ画像で同じ値であると仮定して処理を行ったが、この仮定が事実と適合したかどうかをはかる尺度であるモデル適合度が計算される。
本実施の形態におけるモデル適合度評価手段1202は、2Dモデルフィッティング手段1201によって生成されたギャラリモデル画像I’gとギャラリ画像Ig、プローブモデル画像I’pとプローブ画像Ipの誤差をそれぞれ計算し、両者を合算した値をモデル適合度Vとして出力する。誤差としては様々な画像特徴量を用いることができるが、一例として、次式に示すように画像の輝度値の二乗誤差和を用いることができる。
V=vp|Ip−I’p|2+vg|Ig−I’g|2 …(8)
式8において、vp,vgはプローブ画像とギャラリ画像それぞれに対する重みを調整する係数であり、あらかじめ適当な値を定めておく。一例として、vp=1,vg=wgとしてもよい。また各画像の画素数の逆数としてもよいし、状況によって適応的に変更することも可能である。モデル適合度Vは誤差を表しているので、Vの値が小さいほど良いという点に注意する。
さらに、プローブ画像を複数のギャラリ画像と照合するシステムにおいて、それぞれのギャラリ画像でモデルフィッティングの精度が大きく変動する(ギャラリ画像とギャラリモデル画像の差分が変動する)場合には、vgを小さくすることで認識性能を向上することができる。その一例として、プローブ画像とそれぞれのギャラリ画像の組に対してモデルフィッティング手段1201の処理を行った結果のギャラリ画像とギャラリモデル画像の誤差(|Ig−Ig’|2)の分散、プローブ画像とプローブモデル画像の誤差(|Ip−Ip’|2)の分散がそれぞれ計算される。前記各分散の逆数がそれぞれvg,vpの値となる。
以上に示したモデル適合度Vの計算方法はあくまで一例であり、このほかにもエッジ画像を生成してその輝度誤差を用いる、輝度値の正規化相関値を用いるなど、様々な画像特徴量を用いることが可能である。すなわち、プローブモデル画像とプローブ画像との間の何らかの画像特徴量の誤差と、ギャラリモデル画像とギャラリ画像との間の何らかの画像特徴量の誤差とを足した量を、モデル適合度Vとすることができる。
照合手段1203は、モデル適合度評価手段1202によって計算されたモデル適合度Vを用いて、ギャラリ画像Igとプローブ画像Ipの照合判定を行う。1セットのギャラリ画像Igとの照合判定を行う場合の一例として、あらかじめ閾値を定めておき、その閾値よりモデル適合度Vが良い(式8の場合は値が小さい)場合に、プローブ画像Ipの目的パラメタptがギャラリ画像Igの目的パラメタptと同じであると判定する方法がある。
他方、プローブ画像Ipを複数セットのギャラリ画像Igと照合する場合には、それぞれのギャラリ画像Igとプローブ画像Ipの組み合わせに対して、2Dモデルフィッティング手段1201とモデル適合度評価手段1202との処理を行って、モデル適合度Vが計算される。もっとも良いモデル適合度(式8を用いる場合にはもっとも小さい値)を得たギャラリ画像Igの目的パラメタptが、プローブ画像の目的パラメタptにもっとも近い値であると判定される。
一例として、顔画像による個人識別システムを例に説明する。3人の人物A,B,Cの顔を撮影したギャラリ画像3枚に対してプローブ画像を照合し、人物Bのギャラリ画像がもっとも良いモデル適合度を得たとすると、プローブ画像に写っている人物は人物Bであると認識される。このとき、ギャラリ画像の3枚それぞれで、顔の向きや照明条件などの外部パラメタが異なっていても、外部パラメタはモデル適合度に影響しないため正しく個人識別を行うことができる。
さらに別の例として、物体の姿勢を認識するシステムを例に説明する。一例として物体を左90度から正面、右90度まで10度間隔の向きに置いて撮影した19枚のギャラリ画像に対してプローブ画像を照合し、右70度の向きのギャラリ画像がもっとも良いモデル適合度を得たとすると、プローブ画像に写っている物体の向きは右70度である、と認識される。このとき、ギャラリ画像の19枚それぞれで、照明条件やカメラの特性といった外部パラメタが異なっていても、外部パラメタはモデル適合度に影響しないため正しく物体の姿勢を認識することができる。
次に本実施の形態の効果を説明する。
本実施の形態では、プローブ画像Ipとギャラリ画像Igの双方の画像を入力とし、照合したい目的パラメタptが両画像Ip,Igで同じであると仮定してモデルフィッティング処理を行い、そのモデルフィッティング処理の精度の尺度であるモデル適合度Vを計算し、このモデル適合度Vを持って照合を行うため、モデルフィッティング処理の絶対的な精度にあまり影響を受けずにプローブ画像とギャラリ画像との照合を行うことができる。その理由は以下の通りである。
照合したい目的パラメタptの値が両画像Ip,Igで異なる場合には、画像Ip,Igに類似したモデル画像I’p,I’gが決して求まらないため、モデル適合度Vは極端に悪化する。他方、照合したい目的パラメタptの値が両画像Ip,Igで同じである場合には、画像Ip,Igに類似したモデル画像I’p,I’gが基本的には必ず求まるため、モデル適合度Vは良い値を示す。したがって、照合したい目的パラメタptが両画像Ip,Igで同じであるときと異なるときのモデル適合度Vの値の隔たりが顕著になる。このため、1セットのギャラリ画像Igとの照合判定では、その中間の値に閾値を設定しておけば、フィッティング処理の精度が多少低下してモデル適合度Vの値が多少上下しても、閾値との距離が大きいためにその影響を受けずに、目的パラメタptがプローブ画像と同じであるギャラリ画像とそうでないギャラリ画像とを明確に区別することができる。また、複数セットのギャラリ画像Igとの照合判定では、目的パラメタptがプローブ画像と同じであるギャラリ画像Igとプローブ画像Ipの組み合わせについて計算されたモデル適合度Vが、それ以外の組み合わせについて計算されたモデル適合度Vより頭一つ抜きん出て良好な値を示す。このため、フィッティング処理の精度が多少低下してモデル適合度Vの値が多少上下しても、その影響を受けずに、目的パラメタptがプローブ画像と一番良く合致しているギャラリ画像を特定することができる。
これに対して、従来技術においては、プローブ画像Ipからその目的パラメタptpと外部パラメタpepと、ギャラリ画像Igからその目的パラメタptgと外部パラメタpegとがそれぞれ独立にフィッティング処理で推定され、ptpとptgの類似度が比較される。このため照合したい目的パラメタptpとptgが両画像Ip,Igで同じであるときと異なるときのptpとptgの類似度の隔たりが、本実施の形態におけるモデル適合度Vの値の隔たりのように顕著にならない。このため、フィッティング処理の絶対的な精度の影響を強く受けることになる。
以上の説明においては、プローブ画像が1枚の画像である場合について説明したが、複数枚の画像を認識する場合についてもまったく同様である。また、ギャラリ画像が複数枚の画像を1セットとしている場合についても同様である。
(第2の実施の形態)
次に、本発明の第2の実施の形態について説明する。前述した第1の実施形態は画像どうしを照合したが、本実施の形態は3次元データどうしを照合する。
図5に示される本実施の形態と図2に示される第1の実施の形態とを比較すると、画像入力装置1100の代わりに3次元データ入力装置1400を備えている点、処理装置1200が2Dモデルフィッティング手段1201およびモデル適合度評価手段1202の代わりに3Dモデルフィッティング手段1221およびモデル適合度評価手段1222を有する点で相違する。
3次元データ入力装置1400は、3次元データであるプローブデータを処理装置1200に入力する装置であり、3次元形状計測装置であってもよいし、図示しない記憶装置からプローブデータを読み込んだり、ネットワークを通じてプローブデータを受信する装置であってもよい。
記憶装置1300には、処理装置1200で実行するプログラムおよび照合に用いる各種のデータが記憶されている。各種データのうちには、3次元データであるギャラリデータおよび3次元データ変動モデルに関するデータが含まれる。ギャラリデータは、あらかじめ記憶装置1300に記憶しておいても良いし、プローブデータと共に、その都度、読み込まれても良い。
3次元データ変動モデルは、物体の種類、物体の状態、姿勢などの多様な変動要素によって、計測される3次元データがどのように変動するかを記述したモデルであり、前記多様な変動要素のパラメタを与えると、該条件における3Dデータが生成されうる。この処理過程で必要とされるデータ群は記憶装置1300に記憶される。
前記3Dデータ変動モデルの一例(モデル3と称す)としては、多様な人物のそれぞれの3D形状データをあらかじめ集めておき、人物を指定するパラメタを与えることによってその人物の3Dデータを出力するというモデルが用いられても良い。さらに、姿勢のパラメタを与えられた場合には、該3Dデータの3次元座標に対し、その姿勢に回転する回転行列をかけることにより、指定された姿勢の3Dデータを生成することができる。
前記3Dデータ変動モデルの別の例(モデル4)としては、前記先行技術文献2に記載されているような、多様な人物の顔の3Dデータを、3D形状の個性、テクスチャの個性、表情、年齢、などをそれぞれあらわすパラメタを与えることによって計算する3Dデータ変動モデルがある。このモデルの場合、あらかじめ多数の人物の顔の3Dデータを集め、形状およびテクスチャのそれぞれのデータを主成分分析し、基底3Dデータ群および基底テクスチャ群を計算し、記憶するという処理ステップが実行される。
さらに、姿勢のパラメタを与えられた場合には、計算された3Dデータの3次元座標に対し、その姿勢に回転する回転行列をかけることにより、指定された姿勢のモデル3Dデータを生成することができる。
該モデルでは、基準3D形状データをS0、基準テクスチャデータをT0、3D形状の個人性をあらわす100個のパラメタをa1,…,a100、各パラメタに対応した基底形状データをS1,…,S100、表情の変化を表す10個のパラメタをc1,…,c10、表情変化による変形を表す基底形状データをS101,…,S110、テクスチャテクスチャの個人性をあらわす100個のパラメタをb1,…,b100、各パラメタに対応した基底テクスチャデータをT1,…,T100、表情変化によるテクスチャの変化を表す基底テクスチャデータをT101,…,T110、姿勢をあらわすパラメタをx,y,z軸それぞれの軸周りの回転角度rx,ry,rzと平行移動量tx,ty,tzとすると、モデル3Dデータの形状データS’の点iの3次元座標S’(i)、テクスチャデータT’は次式で与えられる。
Figure 0004957921
ここでRは回転行列、t=[tx,ty,tz]とする。記憶手段1300には、S0,S1,…,S110,T0,T1,…,T110のデータが記憶される。ここで、個人性のパラメタを100個、表情変化のパラメタを10個としたのはあくまで一例であり、様々に変更可能である。
以上にあげた3Dデータ変動モデルはあくまで一例であり、このほかにも様々な3Dデータ変動モデルを利用可能である。
図6を参照すると、3Dモデルフィッティング手段1221は、ギャラリデータDgおよびプローブデータDpの両3Dデータを入力し、認識目的の要素をあらわす目的パラメタptが両データで同一の値をとると仮定し、その他の変動要素をあらわすパラメタpeは各データで個別に異なる可能性があると仮定した場合、前述したような3Dデータ変動モデル1224を用いてそれぞれの3DデータDg,Dpにできるだけ近い(以下に示したコスト関数の値が小さくなるような)モデルデータD’g,D’pを生成できるように、各パラメタpt,peの値を計算する。すなわち、3Dモデルフィッティング手段1221は、プローブデータDpとギャラリデータDgのそれぞれに対して独立にパラメタを推定し、目的パラメタの推定結果を比較するのではなく、目的パラメタptが両データで同じ値であると仮定し、両データに対して同時に目的パラメタptおよび外部パラメタpeを推定する。
顔の3Dデータを入力として人物を識別する個人認識システムを例にすると、目的パラメタptは個人性をあらわすパラメタ(前記a1,…,a100およびb1,…,b100)、外部パラメタpeは表情および顔の姿勢に関するパラメタ(前記c1,…,c10,rx,ry,rz,tx,ty,tz)となる。
物体の位置や向きを推定する位置姿勢推定システムを例にすると、目的パラメタptは姿勢パラメタ(前記rx,ry,rz,tx,ty,tz)であり、外部パラメタpeは物体の種類と状態(前記a1,…,a100,b1,…,b100,c1,…,c10)、3次元形状計測装置の性質に関するパラメタである。
ある特定の物体しか認識対象としない場合には、物体の種類のパラメタはなくてもよいし、同じ計測装置を用いるなら装置の特性パラメタは不要である。このように、必要に応じてパラメタを設定し、その要素による3Dデータの変形を記述する3Dデータ変動モデルを用意することができる。
図7を参照すると、3Dモデルフィッティング手段1221は、初期値推定手段2121と、3Dモデルデータ生成手段2122と、コスト評価手段2123と、パラメタ推定手段2124とを備える。
初期値推定手段2121は、プローブデータDpおよびギャラリデータDgのそれぞれについて、3Dデータの変動要素の各パラメタPt,Pep,Pegの初期値を求める。これは、あらかじめ与えられた既知の値でもよいし、別途のセンサーなどによって計測される値でもよく、また、3Dデータに付与される情報として入力されるものでもよい。
その一例として、顔認識システムの場合は、3Dデータ中の顔の目や鼻、口の位置などを示す基準点位置データを付与情報としておくことにより、この情報から顔の位置と姿勢(前記rx,ry,rz,tx,ty,tz)や形状(前記a1,…,a100)の概算値を初期値として計算することができる。3D形状やテクスチャの個人性のパラメタ、表情のパラメタなどは多数の人物のデータに対する平均値(一例としてはa1〜a100=0,b1〜b100=0,c1〜c10=0)を初期値としてもよいし、特定の人物の値を初期値としても良い。その他のパラメタも適当な値をあらかじめ定めておいてもよい。プローブデータDpとギャラリデータDgの両3Dデータに対する目的パラメタPtの初期値、プローブデータDpに対する外部パラメタPepの初期値、およびギャラリデータDgに対する外部パラメタPegの初期値は、3Dモデルデータ生成手段2122へ出力される。
3Dモデルデータ生成手段2122は、初回のモデルデータの生成時は、初期値推定手段2121から初期値として出力された目的パラメタptおよび外部パラメタPep,Pegを使用し、以後の繰り返し時にはパラメタ推定手段2124によって更新された目的パラメタptおよび外部パラメタPep,Pegを使用し、それぞれ3Dデータ変動モデル1224を用いて、パラメタPt,Pep,Pegの表す状況下におけるプローブモデルデータD’pおよびギャラリモデルデータD’gを生成し、出力する。
3Dデータ変動モデル1224として前記モデル3を用いた場合、個人性をあらわすパラメタは人物の番号などであり、対応する人物の3Dデータを読み出すことによってモデル3Dデータを生成できる。さらに、姿勢パラメタを用いる場合には、回転行列を適用することで、該姿勢におけるモデル3Dデータを生成できる。このほかにも、表情による変形モデルとそれを記述するパラメタを追加して、3Dデータをさらに変形して表情変化を加味したモデル3Dデータを生成することもできる。
3Dデータ変動モデルとして前記モデル4を用いた場合、個人性、年齢、体型などをあらわすパラメタを結合係数とした基底3Dデータおよび基底テクスチャデータそれぞれの線形結合を計算することにより、特定人物の顔の3Dデータが計算される。次に、姿勢のパラメタにより、前記計算された3Dデータに回転行列を適用することで、該姿勢におけるモデル3Dデータが生成される。
前述したモデル4の一例では、式9によってモデル3Dデータの形状データS’およびテクスチャデータT’が計算される。両者をまとめてモデルデータD’とする。これらのパラメタの設定はあくまで一例であり、このほかにも、表情による変形などのパラメタを追加して、3Dデータをさらに変形してモデル3Dデータを生成することもできる。
以上の処理を、プローブデータDpおよびギャラリデータDgのそれぞれの変動パラメタを用いて行うことにより、プローブモデルデータD’pおよびギャラリモデルデータD’gが生成される。ただし、各モデルデータの生成過程において、目的パラメタptは同一の値であるが、外部パラメタpep,pegは異なる値とする。前述した個人識別システムの例では、pt=[a1,…,a100,b1,…,b100]、pe=[c1,…,c10,rx,ry,rz,tx,ty,tz]となる。プローブデータの外部パラメタの値をpep、ギャラリデータの外部パラメタの値をpegとし、上述した3Dデータ変動モデルによる式9を用いた3D形状データおよびテクスチャデータの生成過程をまとめて関数N(pt,pe)であらわすと、プローブデータDpとギャラリデータDgそれぞれに対するモデルデータD’p,D’gは次式で与えられる。
Figure 0004957921
コスト評価手段2123は、プローブおよびギャラリそれぞれのデータDp,Dgと生成されたモデルデータD’p,D’gを比較し、フィッティングのコスト関数を計算する。このコスト関数は一例として、次式に示すように比較する両データの3次元座標および輝度値の重みつき二乗誤差和とすることができる。
C=|Sp−Sp’|2+wt|Tp−Tp’|2+wg(|Sg−Sg’|2+wt|Tg−Tg’|2) …(11)
ここで、Sp,TpはプローブデータDpの3D形状およびテクスチャデータ、S’p,T’pはプローブモデルデータD’pの3D形状およびテクスチャデータ、Sg,TgはギャラリデータDgの3D形状およびテクスチャデータ、S’g,T’gはギャラリモデルデータD’gの3D形状およびテクスチャデータである。また、wtは3次元座標とテクスチャの重みを調整する係数、wgはプローブとギャラリの重みを調整する係数であり、あらかじめ適当な値を定めておく。wtの値の一例としては、Cを最初に計算する時の(|Sp−Sp’|2/|Tp−Tp’|2)の値、wgの値の一例としては、Cを最初に計算する時の((|Sp−Sp’|2+wt|Tp−Tp’|2)/(|Sg−Sg’|2+wt|Tg−Tg’|2))の値とすることも可能である。また、繰り返し処理の過程で値を更新していくことも可能である。
ここに示したコスト関数はあくまで一例であり、このほかにも様々なコスト関数を利用可能である。例として、各パラメタの事前確率を表すコスト項をコスト関数値に加算することもできる。
たとえばpt,pep,pegの各値がpt0,pep0,peg0に近い値になることがわかっている場合には、次のようなコスト関数を用いることも可能である。
C=|Sp−Sp’|2+wt|Tp−Tp’|2+wg(|Sg−Sg’|2+wt|Tg−Tg’|2)
+wpt(pt−pt0)2+wpep(pep−pep0)2+wpeg(peg−peg0)2 …(12)
ここで、wpt,wpep,wpegの値はあらかじめ適当な値を定めておく。
パラメタ推定手段2124は、コスト関数値を改良するように、目的パラメタptおよび外部パラメタpep,pegそれぞれの値を更新する。これには様々な最適化手法が利用可能であるが、一例として最急降下法がある。
各パラメタ(pt,pep,peg)を並べた全パラメタベクトルをpとし、その各要素piの値をひとつずつあらかじめ決めた微小な量Δiだけ変化させ、モデルデータ生成手段2122によりそれぞれの要素を微小変化させたときのプローブモデルデータD’p(p+Δi)の形状データSp’(p+Δi)とテクスチャデータTp’(p+Δi)、および、ギャラリモデルデータD’g(p+Δi)の形状データSg’(p+Δi)とテクスチャデータTg’(p+Δi)が生成される(Δiは要素iがΔi、他の要素がゼロのベクトルとする)。次に、コスト評価手段2123によって、コスト関数の値C(p+Δi)が次式により計算される。
C(p+Δi)=|Sp−Sp’(p+Δi)|2+wt|Tp−Tp’(p+Δi)|2
+wg(|Sg−Sg’(p+Δi)|2+wt|Tg−Tg’(p+Δi)|2) …(13)
次に、次式に示すように、変化後のコスト関数値と元のコスト関数値の差分を前記微小変化量で割ることによって、コスト関数の勾配ベクトル∇Cの値が計算される。
∇C=[(C(p+Δ1)−C(p))/Δ1,(C(p+Δ2)−C(p))/Δ2,…]T …(14)
最急降下法によって、パラメタpの値は次式で更新される。
p(t+1)=p(t)−α∇C …(15)
αは事前に決めたゲイン定数とする。一例として値は1.0でもよい。また、状況に応じて適応的に変化することもできる。
以上の方法はあくまで一例であり、他にも第1の実施の形態と同様にGauss−Newton法などの様々な最適化手法を利用して、コスト関数Cの値を最小にするようなパラメタの値を求めることも可能である。
なお、3Dデータ変動モデルとして前記モデル3を用いた場合、個人性をあらわすパラメタは人物の番号であり連続的な値を取らない。このような場合は、微分値を計算せずに、取りえる値のそれぞれについて(すなわち、個々の人物それぞれ個別の3Dデータについて)、3Dモデルデータ生成手段2122とコスト評価手段2123の処理を繰り返し行うことによって、コスト関数の値が計算される。このため最良のコスト値を得た値を推定値とすることができる。このとき、他の連続的な値を取るパラメタについては、上述した方法や様々な最適化手法を適用してコスト関数値を最小にするパラメタの値が求められる。
再び図5および図6を参照すると、モデル適合度評価手段1222は、3Dモデルフィッティング手段1221のモデルフィッティング処理の精度を評価する。すなわち、モデルフィッティング処理においては、目的パラメタptが同一であると仮定して処理を行ったが、この仮定の上で、3Dデータ変動モデル1224がプローブデータDpおよびギャラリデータDgに適合したかどうかを表すモデル適合度Vを計算する処理が行なわれる。
本実施の形態の場合、モデル適合度評価手段1222は、3Dモデルフィッティング手段1221によって生成されたギャラリモデルデータD’gとギャラリデータDg、プローブモデルデータD’pとプローブデータDpの誤差をそれぞれ計算し、両者を合算してモデル適合度Vとして出力する。誤差の計算には様々な特徴量を用いることができるが、一例として、次式に示すような3次元座標とテクスチャ輝度値の重みつき二乗誤差和を用いることができる。
V=vp(|Sp−Sp’|2+vt|Tp−Tp’|2)+vg(|Sg−Sg’|2+vt|Tg−Tg’|2) …(16)
ここで、vt,vp,vgは重み定数であり、適当な値をあらかじめ決めておく。値の一例としては、vp=1,vg=wg,vt=wtとしてもよい。ここでは一例として3次元座標とテクスチャ輝度値の誤差を用いたが、このほかにも、法線ベクトルの誤差やテクスチャのエッジなどの特徴量の誤差を用いることももちろん可能である。このモデル適合度Vは誤差を表しているので、Vの値が小さいほど良いという点に注意する。
プローブデータDPを複数のギャラリデータDgと照合するシステムにおいて、各ギャラリデータDgでモデルフィッティングの精度が大きく変動する(ギャラリデータDgとギャラリモデルデータD’gの差分が変動する)場合には、vgを小さくすることで認識性能を向上することができる。その一例として、プローブデータDPとそれぞれのギャラリデータDgの組に対して、3Dモデルフィッティング手段1221の処理を行った結果のギャラリデータDgとギャラリモデルデータD’gの誤差(|Sg−Sg’|2+vt|Tg−Tg’|2)の分散、プローブデータDpとプローブモデルデータD’pの誤差(|Sp−Sp’|2+vt|Tp−Tp’|2)の分散をそれぞれ計算する処理が実行され、その結果それぞれの逆数をvp,vgの値とすることができる。
以上に示したモデル適合度Vの計算方法はあくまで一例であり、式11のコスト関数Cの値を用いてもよい。この他にも、3次元座標の代わりに3次元形状表面の法線ベクトルを計算してその誤差を用いる方法や、3次元座標の正規化相関値を用いる方法、テクスチャのエッジなどの特徴量を用いる方法など、様々な計算方法を用いることができる。
照合手段1203は、第1の実施の形態と同じであり、モデル適合度評価手段1222によって計算されたモデル適合度Vの値を用いて、ギャラリデータDgとプローブデータDpの照合判定を行う。1セットのギャラリデータD’pとの照合判定を行う場合の一例として、あらかじめ閾値を定めておき、その閾値よりモデル適合度Vが良い(式16の場合は小さい値)場合に、プローブデータDpの目的パラメタptがギャラリデータDgの目的パラメタptと同じであると認識する処理があげられる。
ギャラリデータDgが複数セットある場合には、それぞれのギャラリデータDgとプローブデータDpとの組に対して、3Dモデルフィッティング手段1221とモデル適合度評価手段1222における処理が行なわれ、モデル適合度Vを計算する処理が実行される。そして、もっとも良いモデル適合度(式8を用いる場合にはもっとも小さい値)を得た組のギャラリデータDgの目的パラメタptが、プローブデータDpの目的パラメタptにもっとも近い値であると判定される。または、ある閾値より良いモデル適合度を得た複数のギャラリデータDgの目的パラメタptの値を用いて、内挿や補間によってプローブデータDpの目的パラメタptの値を推定しても良い。
顔の3Dデータによる個人識別システムをあげて説明すると、一例として3人の人物A,B,Cのギャラリデータ3個に対してプローブデータを照合し、人物Bのギャラリデータがもっとも良いモデル適合度を得たとすると、プローブデータは人物Bの3Dデータであると認識される。このとき、ギャラリデータの3枚それぞれで、顔の向きなどの外部パラメタが異なっていても、外部パラメタはモデル適合度に影響しないため正しく個人識別を行うことができる。
また別の例として、物体の姿勢を認識するシステムをあげて説明すると、一例として物体を左90度から正面、右90度まで10度間隔の向きに置いて計測した19個のギャラリ3Dデータに対してプローブ3Dデータを照合し、右70度の向きのギャラリデータがもっとも良いモデル適合度を得たとする。この場合、プローブデータを計測したときの物体の向きは右70度であると認識される。このとき、ギャラリデータ19個それぞれで、3次元計測装置の特性などの外部パラメタが異なっていても、外部パラメタはモデル適合度に影響しないため、正しく物体の姿勢を認識することができる。
以上の説明においては、3Dデータとして3D形状データおよびテクスチャデータの両者が含まれるものとして説明したが、テクスチャデータが存在しない3D形状データのみから構成される3Dデータについてもまったく同様に処理を行うことが可能である。
次に本実施の形態の効果を説明する。
本実施の形態では、プローブデータDpとギャラリデータDgの双方の3次元データを入力とし、照合したい目的パラメタptが両データDp,Dgで同じであると仮定してモデルフィッティング処理を行い、そのモデルフィッティング処理の精度の尺度であるモデル適合度Vを計算し、このモデル適合度Vを持って照合を行うため、モデルフィッティング処理の絶対的な精度にあまり影響を受けずにプローブデータとギャラリデータとの照合を行うことができる。その理由は以下の通りである。
照合したい目的パラメタptの値が両データDp,Dgで異なる場合には、データDp,Dgに類似したモデルデータD’p,D’gが決して求まらないため、モデル適合度Vは極端に悪化する。他方、照合したい目的パラメタptの値が両データDp,Dgで同じである場合には、データDp,Dgに類似したモデルデータD’p,D’gが基本的には必ず求まるため、モデル適合度Vも良い値を示す。したがって、照合したい目的パラメタptが両データDp,Dgで同じであるときと異なるときのモデル適合度Vの値の隔たりが顕著になる。このため、1セットのギャラリデータDgとの照合判定では、その中間の値に閾値を設定しておけば、フィッティング処理の精度が多少低下してモデル適合度Vの値が多少上下しても、閾値との距離が大きいためにその影響を受けずに、目的パラメタptがプローブデータと同じであるギャラリデータとそうでないギャラリデータとを明確に区別することができる。また、複数セットのギャラリデータDgとの照合判定では、目的パラメタptがプローブデータと同じであるギャラリデータDgとプローブデータDpの組み合わせについて計算されたモデル適合度Vが、それ以外の組み合わせについて計算されたモデル適合度Vより頭一つ抜きん出て良好な値を示すため、フィッティング処理の精度が多少低下してモデル適合度Vの値が多少上下しても、その影響を受けずに、目的パラメタptがプローブデータと一番良く合致しているギャラリデータを特定することができる。
これに対して、従来技術においては、プローブデータDpからその目的パラメタptpと外部パラメタpepを、ギャラリデータDgからその目的パラメタptgと外部パラメタpegをそれぞれ独立にフィッティング処理で推定し、ptpとptgの類似度を比較する処理が実行される。
したがって、照合したい目的パラメタptpとptgが両データDp,Dgで同じであるときと異なるときのptpとptgの類似度の隔たりが、本実施の形態におけるモデル適合度Vの値の隔たりのように顕著にならない。このため、フィッティング処理の絶対的な精度の影響を強く受けることになる。
(第3の実施の形態)
次に、本発明の第3の実施の形態について説明する。前述した第1の実施形態は画像どうしを照合しているのに対し、本実施の形態に係る照合装置は、プローブ画像を入力し、3次元データであるギャラリデータと照合する。
図8に示される本実施の形態と図2に示される第1の実施の形態とを比較すると、処理装置1200が2Dモデルフィッティング手段1201およびモデル適合度評価手段1202の代わりに2D3Dモデルフィッティング手段1231およびモデル適合度評価手段1232を有する点で相違する。
記憶装置1300には、処理装置1200で実行するプログラムおよび照合に用いる各種のデータが記憶されている。各種データのうちには、3次元データであるギャラリデータ、画像変動モデルおよび3次元データ変動モデルに関するデータが含まれる。ギャラリデータは、あらかじめ記憶装置1300に記憶しておいても良いし、プローブ画像と共に、その都度、図示しない3次元データ入力装置から読み込まれても良い。
3次元データ変動モデルは、物体の種類、物体の状態、姿勢などの多様な変動要素によって、計測される3Dデータがどのように変動するかを記述したモデルである。多様な変動要素のパラメタを与えると、その条件下における3Dデータが生成される。この処理過程で必要とされるデータ群が記憶装置1300に記憶されている。3Dデータ変動モデルの一例としては、第2の実施の形態で説明したモデル3およびモデル4が挙げられるが、これらはあくまで一例であり、このほかにも様々な3Dデータ変動モデルを利用可能である。
画像変動モデルは、3Dデータ変動モデルによって生成される3Dデータから、カメラの向きや位置、照明条件、カメラ特性などをあらわすパラメタによって、その状況下における画像を生成する画像変動モデルである。この画像変動モデルには、様々なカメラのモデル(ピンホールカメラ、平行投影モデルなど)、照明のモデル(完全散乱モデル、Phongのモデルなどのコンピュータグラフィクスの標準技術、または、特許文献1に記載の照明基底を用いる技術など)などを組み合わせて利用することが可能である。
以上にあげた3Dデータ変動モデルと画像変動モデルはあくまで一例であり、このほかにも様々な画像変動モデルを利用可能である。
図9を参照すると、2D3Dモデルフィッティング手段1231は、プローブ画像IpとギャラリデータDgを入力し、認識目的の変動要素をあらわす目的パラメタptが両データIp,Dgで同一の値をとり、その他の変動要素をあらわすパラメタpeは両データIp,Dgで個別に異なる可能性があると仮定する場合、前述した3Dデータ変動モデル1234を用いてギャラリデータDgにできるだけ近い(以下に示したコスト関数の値が小さくなるような)モデルデータD’gを生成し、かつ、前述した画像変動モデル1235を用いてプローブ画像Ipにできるだけ近いモデル画像I’pを生成するような、各パラメタpt,peの値を計算する。ここで、プローブ画像Ipの外部パラメタをpep、ギャラリデータDgの外部パラメタをpegとする。
顔画像を3D顔データと照合し、個人識別を行うシステムを例にすれば、ptは顔の形状やテクスチャの個人性を表すパラメタであり、pepは表情、照明条件、カメラの位置、向き、焦点距離などのパラメタであり、pegは表情、顔の姿勢などのパラメタになる。また、顔画像を3D顔データと照合し、顔の姿勢を認識するシステムを例にすれば、ptは顔の姿勢を表すパラメタであり、pepは個人性、表情、照明条件、カメラの位置、向き、焦点距離などのパラメタであり、pegは個人性、表情などのパラメタになる。ここに示したのはあくまで一例であり、パラメタの数や種類はモデルに応じて様々に変更可能である。
図10を参照すると、2D3Dモデルフィッティング手段1231は、初期値推定手段2131と、2D3Dモデルデータ生成手段2132と、コスト評価手段2133と、パラメタ推定手段2134とを備える。
初期値推定手段2131は、プローブ画像Ipの画像変動要素パラメタ、および、ギャラリデータDgの3Dデータ変動要素パラメタのそれぞれについて初期値を求める。これは、あらかじめ与えられた既知の値でもよいし、別途のセンサーなどによって計測される値でもよく、また、プローブ画像IpやギャラリデータDgに付与される情報として入力されるものでもよい。プローブ画像Ipに対する初期値は第1の実施の形態における初期値推定手段2101と同様な処理で行うことができ、ギャラリデータDgに対する初期値は第2の実施の形態における初期値推定手段2121と同様な処理で行うことができる。以上に述べた初期値の計算方法はあくまで一例であり、様々に変更可能である。
プローブ画像IpとギャラリデータDgの両データに対する目的パラメタptの初期値、プローブ画像Ipに対する外部パラメタpepの初期値、ギャラリデータDgに対する外部パラメタpegの初期値は、2D3Dモデルデータ生成手段2132へ出力される。
2D3Dモデルデータ生成手段2132は、初回のモデルデータの生成時は、初期値推定手段2131から初期値として出力された目的パラメタptおよび外部パラメタPep,Pegを使用し、以後の繰り返し時にはパラメタ推定手段2134によって更新された目的パラメタptおよび外部パラメタPep,Pegを使用し、それぞれ3Dデータ変動モデル1234および画像変動モデル1235を用いて、パラメタPt,Pep,Pegの表す状況下におけるプローブモデル画像I’pおよびギャラリモデルデータD’gを生成し、出力する。
画像変動モデル1235を用いて、目的パラメタptおよび外部パラメタpepの現在の値の表す状況下における画像をプローブモデル画像I’pとして生成する処理は、第1の実施の形態におけるモデル画像生成手段2102とまったく同様に行える。また、3Dデータ変動モデル1234を用いて、目的パラメタptおよびギャラリ外部パラメタpegの現在の値の表す状況下における3DデータをギャラリモデルデータD’gとして生成する処理は、第2の実施の形態における3Dモデルデータ生成手段2122とまったく同様に行える。両処理を式で表すと次式のようになる。
Figure 0004957921
コスト評価手段2133は、プローブ画像Ipとプローブモデル画像I’p、ギャラリデータDgとギャラリモデルデータD’gを比較し、フィッティングのコスト関数Cを計算する。このコスト関数Cは一例として、次式に示すように比較する両データの重みつき二乗誤差和とすることができる。
C=|Ip−I’p|2+wg(|Sg−Sg’|2+wt|Tg−Tg’|2) …(18)
ここで、Sg,Tgはギャラリデータの3D形状およびテクスチャデータ、S’g,T’gはギャラリモデルデータの3D形状およびテクスチャデータ、wtは3次元座標とテクスチャの重みを調整する係数である。また、wgは画像と3Dデータの重みを調整する係数であり、あらかじめ適当な値を定めておく。
wtの値の決定方法はさまざまな方法が利用可能であるが、一例として、Cを最初に計算する時の(|Sg−Sg’|2/|Tp−Tp’|2)の値としてもよい。
wgの値の決定方法はさまざまな方法が利用可能であるが、一例として、Cを最初に計算する時の((|Ip−I’p|2)/(|Sg−Sg’|2+wt|Tg−Tg’|2))の値としてもよい。
また、繰り返し処理の過程でこれらの値を更新していくことも可能である。
ここに示したコスト関数はあくまで一例であり、このほかにも様々なコスト関数を利用可能である。その一例として、各パラメタの事前確率を表すコスト項をコスト関数値に加算することもできる。たとえばpt,pep,pegの各値がpt0,pep0,peg0に近い値になることがわかっている場合には、次のようなコスト関数を用いることも可能である。
C=|Ip−I’p|2+wg(|Sg−Sg’|2+wt|Tg−Tg’|2)
+wpt(pt−pt0)2+wpep(pep−pep0)2+wpeg(peg−peg0)2 …(19)
wpt,wpep,wpegの値はあらかじめ適当な値を定めておく。
パラメタ推定手段2134は、コスト関数Cの値を改良するように、目的パラメタPtおよび外部パラメタPep,Pegそれぞれの値を更新する。これには様々な最適化手法が利用可能であるが、一例として最急降下法がある。
各パラメタ(pt,pep,peg)を並べた全パラメタベクトルをpとし、その各要素piの値をひとつずつあらかじめ決めた微小な量Δiだけ変化させたとき、およびモデルデータ生成手段2132によりそれぞれの要素を微小変化させたときの、プローブモデル画像データI’p(p+Δi)、ギャラリモデルデータD’g(p+Δi)の形状データSg’(p+Δi)、およびテクスチャデータTg’(p+Δi)が生成される(Δiは要素iがΔi、他の要素がゼロのベクトルとする)。次に、コスト評価手段2133によって、コスト関数の値C(p+Δi)を次式により計算する処理が実行される。
C(p+Δi)=|Ip−Ip’(p+Δi)|2
+wg(|Sg−Sg’(p+Δi)|2+wt|Tg−Tg’(p+Δi)|2) …(20)
次に、次式に示すように、変化後のコスト関数値と元のコスト関数値の差分を前記微小変化量で割ることによって、コスト関数の勾配ベクトル∇Cの値を計算する処理が実行される。
∇C=[(C(p+Δ1)−C(p))/Δ1,(C(p+Δ2)−C(p))/Δ2,…]T …(21)
最急降下法によって、パラメタpの値は次式で更新される。
p(t+1)=p(t)−α∇C …(22)
αは事前に決めたゲイン定数とする。一例として値は1.0でもよい。また、状況に応じて適応的に変化することもできる。
以上の方法はあくまで一例であり、他にも第1の実施の形態と同様にGauss−Newton法などの様々な最適化手法を利用して、コスト関数Cの値を最小にするようなパラメタの値を求めることも可能である。
再び図8および図9を参照すると、モデル適合度評価手段1232は、2D3Dモデルフィッティング手段1231のモデルフィッティング処理の精度を評価する。すなわち、モデルフィッティング処理において、目的パラメタptが同一であると仮定して処理を行っていた。モデル適合度評価手段1232は、この仮定の上で、画像変動モデル1235および3Dデータ変動モデル1234がプローブ画像IpおよびギャラリデータDgに適合したかどうかを表すモデル適合度Vを計算する。本実施の形態のモデル適合度評価手段1232は、プローブモデル画像I’pとプローブ画像Ip、ギャラリモデルデータD’gとギャラリデータDgを入力とし、それぞれの誤差を合算してモデル適合度Vとして出力する。
誤差の計算には様々な特徴量を用いることができるが、一例として、次式のような3次元座標とテクスチャ輝度値の重みつき二乗誤差和を用いることができる。
V=vp|Ip−Ip’|2+vg(|Sg−Sg’|2+vt|Tg−Tg’|2) …(23)
ここで、vt,vp,vgは重み定数であり、適当な値をあらかじめ決めておく。値の一例としては、vp=1,vg=wg,vt=wtとしてもよい。ここでは一例として画像輝度値、3次元座標、テクスチャ輝度値のそれぞれの誤差の重み付き和を用いたが、このほかにも、法線ベクトルの誤差や画像・テクスチャのエッジなどの特徴量の誤差などを用いることももちろん可能である。また、式18または式20のコスト関数Cの値をモデル適合度Vとして用いてもよい。モデル適合度Vは誤差を表しているので、Vの値が小さいほど良いという点に注意する。
照合手段1203は、第1の実施の形態と同じであり、モデル適合度評価手段1232によって計算されたモデル適合度Vの値を用いて、ギャラリデータDgとプローブ画像Ipの照合判定を行う。一例として、照合手段1203は、あらかじめ閾値を定めておき、その閾値よりモデル適合度Vが良い(式16の場合は小さい値)場合に、プローブ画像Ipの目的パラメタptがギャラリデータDgの目的パラメタptと同じであると認識する。
ギャラリデータDgが複数セットある場合には、それぞれのギャラリデータに対してプローブ画像Ipを組み合わせて、2D3Dモデルフィッティング手段1231とモデル適合度評価手段1232の処理が行なわれ、それぞれの組についてのモデル適合度Vが計算される。照合手段1203は、もっとも良いモデル適合度を得た組のギャラリデータDgの目的パラメタptの値が、プローブ画像Ipの目的パラメタptの値であると認識する。
または、ある閾値より良いモデル適合度Vを得た複数のギャラリデータDgの目的パラメタptの値を用いて、内挿や補間によってプローブ画像Ipの目的パラメタptの値を推定しても良い。
より具体的な例を持って説明する。顔の3Dデータによる個人識別システムを例にすると、一例として3人の人物A,B,Cのギャラリデータ3個に対してプローブデータを照合し、人物Bのギャラリデータがもっとも良いモデル適合度を得たとすると、プローブデータは人物Bの3Dデータであると認識される。このとき、ギャラリデータの3枚それぞれで、顔の向きなどの外部パラメタが異なっていても、外部パラメタはモデル適合度に影響しないため正しく個人識別を行うことができる。
さらに別の例として、物体の姿勢を認識するシステムを例にすると、一例として物体を左90度から正面、右90度まで10度間隔の向きに置いて計測した19個のギャラリ3Dデータに対してプローブ3Dデータを照合し、右70度の向きのギャラリデータがもっとも良いモデル適合度を得たとすると、プローブデータを計測したときの物体の向きは右70度である、と認識される。
本実施の形態においては、ギャラリデータである3Dデータとして3D形状データおよびテクスチャデータの両者が含まれるものとして説明したが、3D形状データのみから構成されるギャラリデータについてもまったく同様に処理を行うことが可能である。また、プローブ画像とギャラリデータが1つであるとして説明したが、一方または双方が複数である場合にも、外部パラメタpeや式18、式23における重み係数の数が画像または3Dデータの数だけ増えるだけであり、まったく同様に処理可能である。
次に本実施の形態の効果を説明する。
本実施の形態では、プローブ画像IpとギャラリデータDgを入力とし、照合したい目的パラメタptが両データIp,Dgで同じであると仮定してモデルフィッティング処理が行なわれ、そのモデルフィッティング処理の精度の尺度であるモデル適合度Vが計算され、このモデル適合度Vを持って照合が行なわれる。このため、モデルフィッティング処理の絶対的な精度にあまり影響を受けずにプローブ画像とギャラリデータとの照合を行うことができる。その理由は以下の通りである。
照合したい目的パラメタptの値が両データIp,Dgで異なる場合には、データIp,Dgに類似したモデルデータI’p,D’gが決して求まらないため、モデル適合度Vは極端に悪化する。他方、照合したい目的パラメタptの値が両データIp,Dgで同じである場合には、データIp,Dgに類似したモデルデータI’p,D’gが基本的には必ず求まるため、モデル適合度Vも良い値を示す。したがって、照合したい目的パラメタptが両データIp,Dgで同じであるときと異なるときのモデル適合度Vの値の隔たりが顕著になる。このため、1セットのギャラリデータDgとの照合判定では、その中間の値に閾値を設定しておけば、フィッティング処理の精度が多少低下してモデル適合度Vの値が多少上下しても、閾値との距離が大きいためにその影響を受けずに、目的パラメタptがプローブ画像と同じであるギャラリデータとそうでないギャラリデータとを明確に区別することができる。また、複数セットのギャラリデータDgとの照合判定では、目的パラメタptがプローブ画像と同じであるギャラリデータDgとプローブ画像Ipの組み合わせについて計算されたモデル適合度Vが、それ以外の組み合わせについて計算されたモデル適合度Vより頭一つ抜きん出て良好な値を示すため、フィッティング処理の精度が多少低下してモデル適合度Vの値が多少上下しても、その影響を受けずに、目的パラメタptがプローブ画像と一番良く合致しているギャラリデータを特定することができる。
これに対して、プローブ画像Ipからその目的パラメタptpと外部パラメタpepを、ギャラリデータDgからその目的パラメタptgと外部パラメタpegをそれぞれ独立にフィッティング処理で推定し、ptpとptgの類似度を比較する従来技術においては、照合したい目的パラメタptpとptgが両データIp,Dgで同じであるときと異なるときのptpとptgの類似度の隔たりが、本実施の形態におけるモデル適合度Vの値の隔たりのように顕著にならないため、フィッティング処理の絶対的な精度の影響を強く受けることになる。
(第4の実施の形態)
第3の実施の形態では、プローブ画像Ipを入力して3次元データのギャラリデータDgと照合したが、本実施の形態に係る照合装置は、3次元のプローブデータDpを入力してギャラリ画像Igと照合する。
図11に示される本実施の形態と図8に示される第3の実施の形態とを比較すると、画像入力装置1100の代わりに3次元データ入力装置1400を備えている点で両者は相違する。
3次元データ入力装置1400は、3次元データであるプローブデータを処理装置1200に入力する装置であり、3次元形状計測装置であってもよいし、図示しない記憶装置からプローブデータを読み込んだり、ネットワークを通じてプローブデータを受信する装置であってもよい。
記憶装置1300には、処理装置1200で実行するプログラムおよび照合に用いる各種のデータが記憶されている。各種データのうちには、ギャラリ画像、画像変動モデルおよび3次元データ変動モデルに関するデータが含まれる。ギャラリ画像をあらかじめ記憶装置1300に記憶しておいても良い。当該ギャラリ画像はプローブデータと共に、その都度、図示しない画像入力装置から読み込まれても良い。画像変動モデルおよび3次元データ変動モデルは、第3の実施の形態における画像変動モデル1235および3Dデータ変動モデル1234と同じである。
図12を参照すると、2D3Dモデルフィッティング手段1231は、プローブデータDpとギャラリ画像Igを入力し、認識目的の変動要素をあらわす目的パラメタptが両データDp,Igで同一の値をとり、その他の変動要素をあらわすパラメタpeは両データDp,Igで個別に異なる可能性があると仮定した場合、前述した3Dデータ変動モデル1234を用いてプローブデータDpにできるだけ近い(以下に示したコスト関数の値が小さくなるような)モデルデータI’pを生成し、かつ、前述した画像変動モデル1235を用いてギャラリ画像Igにできるだけ近いモデル画像I’gを生成するような、各パラメタpt,peの値を計算する。ここで、プローブデータDpの外部パラメタをpep、ギャラリ画像Igの外部パラメタをpegとする。
図13を参照すると、2D3Dモデルフィッティング手段1231は、第3の実施の形態と同様に、初期値推定手段2131と、2D3Dモデルデータ生成手段2132と、コスト評価手段2133と、パラメタ推定手段2134とを備える。
初期値推定手段2131は、プローブデータDpの3Dデータ変動要素パラメタ、および、ギャラリ画像Igの画像変動要素パラメタのそれぞれについて初期値を求める。これは、あらかじめ与えられた既知の値でもよいし、別途のセンサーなどによって計測される値でもよく、また、画像Igや3DデータDpに付与される情報として入力されるものでもよい。ギャラリ画像Igに対する初期値は第1の実施の形態における初期値推定手段2101と同様な処理で行うことができ、プローブデータDpに対する初期値は第2の実施の形態における初期値推定手段2121と同様な処理で行うことができる。
プローブデータDpとギャラリ画像Igの両データに対する目的パラメタptの初期値、プローブデータDpに対する外部パラメタpepの初期値、ギャラリ画像Igに対する外部パラメタpegの初期値は、2D3Dモデルデータ生成手段2132へ出力される。
2D3Dモデルデータ生成手段2132は、初回のモデルデータの生成時は、初期値推定手段2131から初期値として出力された目的パラメタptおよび外部パラメタPep,Pegを使用し、以後の繰り返し時にはパラメタ推定手段2134によって更新された目的パラメタptおよび外部パラメタPep,Pegを使用し、それぞれ3Dデータ変動モデル1234および画像変動モデル1235を用いて、パラメタPt,Pep,Pegの表す状況下におけるプローブモデルデータD’pおよびギャラリモデル画像I’gを生成し、出力する。
コスト評価手段2133は、プローブデータDpとプローブモデルデータD’p、ギャラリ画像Igとギャラリモデル画像I’gを比較し、フィッティングのコスト関数を計算する。このコスト関数は一例として、第3の実施の形態と同様に、比較する両データの重みつき二乗誤差和とすることができる。
パラメタ推定手段2134は、コスト関数Cの値を改良するように、目的パラメタPtおよび外部パラメタPep,Pegそれぞれの値を更新する。これには様々な最適化手法が利用可能であるが、一例として第3の実施の形態と同様に、最急降下法が利用可能である。
モデル適合度評価手段1232は、2D3Dモデルフィッティング手段1231のモデルフィッティング処理の精度を評価する。すなわち、モデルフィッティング処理において、目的パラメタptが同一であると仮定して処理を行っていた。モデル適合度評価手段1232は、この仮定の上で、画像変動モデル1235および3Dデータ変動モデル1234がギャラリ画像IgおよびプローブデータDpに適合したかどうかを表すモデル適合度Vを計算する。本実施の形態のモデル適合度評価手段1232は、プローブモデルデータD’pとプローブデータDp、ギャラリモデル画像I’gとギャラリ画像Igを入力し、それぞれの誤差を合算してモデル適合度Vとして出力する。誤差の計算には様々な特徴量を用いることができるが、一例として、第3の実施の形態と同様に、3次元座標とテクスチャ輝度値の重みつき二乗誤差和を用いることができる。
照合手段1203は、第3の実施の形態と同様に、モデル適合度評価手段1232によって計算されたモデル適合度Vの値を用いて、ギャラリ画像IgとプローブデータDpの照合判定を行う。
次に本実施の形態の効果を説明する。
本実施の形態では、プローブデータDpとギャラリ画像Igを入力し、照合したい目的パラメタptが両データDp,Igで同じであると仮定してモデルフィッティング処理を行い、そのモデルフィッティング処理の精度の尺度であるモデル適合度Vを計算し、このモデル適合度Vを持って照合を行う。このため、モデルフィッティング処理の絶対的な精度にあまり影響を受けずにプローブデータとギャラリ画像との照合を行うことができる。その理由は以下の通りである。
照合したい目的パラメタptの値が両データDp,Igで異なる場合には、データDp,Igに類似したモデルデータD’p,I’gが決して求まらないため、モデル適合度Vは極端に悪化する。他方、照合したい目的パラメタptの値が両データDp,Igで同じである場合には、データDp,Igに類似したモデルデータD’p,I’gが基本的には必ず求まるため、モデル適合度Vも良い値を示す。したがって、照合したい目的パラメタptが両データDp,Igで同じであるときと異なるときのモデル適合度Vの値の隔たりが顕著になる。このため、1セットのギャラリ画像Igとの照合判定では、その中間の値に閾値を設定しておけば、フィッティング処理の精度が多少低下してモデル適合度Vの値が多少上下しても、閾値との距離が大きいためにその影響を受けずに、目的パラメタptがプローブデータと同じであるギャラリ画像とそうでないギャラリ画像とを明確に区別することができる。また、複数セットのギャラリ画像Igとの照合判定では、目的パラメタptがプローブデータと同じであるギャラリ画像IgとプローブデータDpの組み合わせについて計算されたモデル適合度Vが、それ以外の組み合わせについて計算されたモデル適合度Vより頭一つ抜きん出て良好な値を示す。このため、フィッティング処理の精度が多少低下してモデル適合度Vの値が多少上下しても、その影響を受けずに、目的パラメタptがプローブデータと一番良く合致しているギャラリ画像を特定することができる。
これに対して、従来技術では、プローブデータDpからその目的パラメタptpと外部パラメタpepを、ギャラリ画像Igからその目的パラメタptgと外部パラメタpegをそれぞれ独立にフィッティング処理で推定し、ptpとptgの類似度を比較している。このため、照合したい目的パラメタptpとptgが両データDp,Igで同じであるときと異なるときのptpとptgの類似度の隔たりが、本実施の形態におけるモデル適合度Vの値の隔たりのように顕著にならないため、フィッティング処理の絶対的な精度の影響を強く受けることになる。
(第5の実施の形態)
次に、本発明の第5の実施の形態について説明する。
図14に示される本実施の形態と図2に示した第1の実施の形態とを比較すると、処理装置1200が、モデル適合度評価手段1202の代わりにモデル適合度評価手段1242を備えている点、記憶装置1300に、モデル適合度評価手段1242におけるモデル適合度の計算に使用するギャラリ画像とプローブ画像のパラメタに関する基準情報が格納されている点で両者は相違する。
ギャラリ画像のパラメタに関する基準情報としては様々なものが利用できるが、一例として、各パラメタの取りえる値の範囲、値を取る確率分布、別途推定されたまたは既知の正しい値、などが挙げられる。同様に、プローブ画像のパラメタに関する基準情報としては、一例として、各パラメタの取りえる値の範囲、値を取る確率分布、別途推定されたまたは既知の正しい値、などが挙げられる。
図15を参照すると、モデル適合度評価手段1242は、第1の実施の形態におけるものと同様な動作を行う2Dモデルフィッティング手段1201により推定されたパラメタ群p(目的パラメタpt、プローブ外部パラメタpep、ギャラリ外部パラメタpegを並べたベクトルとする)の値の確からしさ(パラメタ確信度)を、記憶装置1300に記憶されたギャラリ画像パラメタ基準情報1245およびプローブ画像パラメタ基準情報1246を参照して評価し、そのパラメタ確信度をモデル適合度Uとして出力する。以下、モデル適合度Uの計算方法を幾つか説明する。
1)モデル適合度Uの第1の計算方法
この方法の場合、モデル適合度評価手段1242は、2Dモデルフィッティング手段1201により推定されたパラメタpt,pep,pegが、取りえる範囲に入っているかどうかを評価する。この場合、ギャラリ画像パラメタ基準情報1245およびプローブ画像パラメタ基準情報1246として、推定されたi番目のパラメタの値piの取りえる値域を示すデータをあらかじめ記憶装置1300に記憶する処理が実行される。そして、一例として、値域が上下限の値(pi0,pi1)として与えられ、pi0≦pi≦pi1であるとすると、モデル適合度Uを次式で計算し、出力する処理が実行される。
U=Σiwiui
ui=|pi−pi0|2 (if pi<pi0)
=0 (if pi0≦pi≦pi1) …(24)
=|pi−pi1|2 (if pi>pi1)
ここで、wiは各パラメタの重要度を決める重みであり、適当な値を事前に決めておく。一例としては全て1でもよい。
ここでは全てのパラメタ(pt,pep,peg)について値域が与えられている場合を説明したが、一部のパラメタについてしか情報がない場合には、情報のないパラメタは除外して式24を計算すればよい。
2)モデル適合度Uの第2の計算方法
この方法の場合、モデル適合度評価手段1242は、2Dモデルフィッティング手段1201により推定されたパラメタpt,pep,pegの値と、事前にわかっているパラメタの値との誤差を用いてモデル適合度Uを計算する処理が実行される。ギャラリ画像パラメタ基準情報1245およびプローブ画像パラメタ基準情報1246によって、piの正しい値がpi0であることが知られている場合、次式でモデル適合度Uを計算する処理が実行される。
U=Σiwi|pi−pi0|2 …(25)
ただし、一部のパラメタについてしか値がわからない場合、不明なパラメタは除外して計算される。wiは各パラメタの重要度を決める重みであり、適当な値を事前に決めておく。一例としては全て1でもよい。
3)モデル適合度Uの第3の計算方法
この方法では、各パラメタの値の確率分布が与えられており、モデル適合度評価手段1242は、2Dモデルフィッティング手段1201により推定されたパラメタpt,pep,pegの値をとる確率を計算し、モデル適合度Uを計算する。ギャラリ画像パラメタ基準情報1245およびプローブ画像パラメタ基準情報1246によって、パラメタpiが、分散σi、平均値pimの正規分布に従うと指定されている場合、次式でモデル適合度Uが計算される。ただし、確率分布の不明であるパラメタは除外して計算される。
U=−Σi(pi−pim)2/σi …(26)
以上の第1乃至第3の方法で計算されるモデル適合度Uは、値が小さいほど良いことに注意する。また、ここに説明したモデル適合度Uの値の計算方法はあくまで一例であり、様々に変更可能である。
照合手段1203は第1の実施形態と同じであり、モデル適合度Vの値のかわりにモデル適合度Uの値を用いて、プローブ画像とギャラリ画像の目的パラメタが同一であるかどうかを判定し、または、良いモデル適合度を得たギャラリ画像の目的パラメタの値を用いてプローブ画像の目的パラメタの値を推定する。
次に本実施の形態の効果を説明する。
本実施の形態では、プローブ画像Ipとギャラリ画像Igの双方の画像を入力とし、照合したい目的パラメタptが両画像Ip,Igで同じであると仮定してモデルフィッティング処理を行い、そのモデルフィッティング処理の精度の尺度であるモデル適合度Uを計算し、このモデル適合度Uを持って照合を行う処理が実行される。このため、モデルフィッティング処理の絶対的な精度にあまり影響を受けずにプローブ画像とギャラリ画像との照合を行うことができる。その理由は以下の通りである。
照合したい目的パラメタptの値が両画像Ip,Igで異なる場合には、画像Ip,Igに類似したモデル画像I’p,I’gが決して求まらない。このため、推定されるパラメタpt,pep,pegの値が異常な値となり、モデル適合度Uは極端に悪化する。
他方、照合したい目的パラメタptの値が両画像Ip,Igで同じである場合には、画像Ip,Igに類似したモデル画像I’p,I’gが基本的には必ず求まる。このため、推定されるパラメタpt,pep,pegの値も正常な値となり、モデル適合度Uも良い値を示す。したがって、照合したい目的パラメタptが両画像Ip,Igで同じであるときと異なるときのモデル適合度Uの値の隔たりが顕著になる。このため、1セットのギャラリ画像Igとの照合判定では、その中間の値に閾値を設定しておけば、フィッティング処理の精度が多少低下してモデル適合度Uの値が多少上下しても、閾値との距離が大きいためにその影響を受けずに、目的パラメタptがプローブ画像と同じであるギャラリ画像とそうでないギャラリ画像とを明確に区別することができる。
また、複数セットのギャラリ画像Igとの照合判定では、目的パラメタptがプローブ画像と同じであるギャラリ画像Igとプローブ画像Ipの組み合わせについて計算されたモデル適合度Uが、それ以外の組み合わせについて計算されたモデル適合度Uより頭一つ抜きん出て良好な値を示す。このため、フィッティング処理の精度が多少低下してモデル適合度Uの値が多少上下しても、その影響を受けずに、目的パラメタptがプローブ画像と一番良く合致しているギャラリ画像を特定することができる。
これに対して、従来技術では、プローブ画像Ipからその目的パラメタptpと外部パラメタpepを、ギャラリ画像Igからその目的パラメタptgと外部パラメタpegをそれぞれ独立にフィッティング処理で推定し、ptpとptgの類似度を比較している。このため、照合したい目的パラメタptpとptgが両画像Ip,Igで同じであるときと異なるときのptpとptgの類似度の隔たりが、本実施の形態におけるモデル適合度Uの値の隔たりのように顕著にならない。したがって、フィッティング処理の絶対的な精度の影響を強く受けることになる。
なお、本実施の形態は画像と画像を照合するシステムであり、第1の実施の形態との比較によって説明したが、第2の実施の形態において、モデル適合度評価手段1222を本実施の形態のモデル適合度評価手段1242に置き換えた実施の形態も考えられる。また、第3または第4の実施形態において、モデル適合度評価手段1232を本実施の形態のモデル適合度評価手段1242に置き換えた実施の形態も考えられる。
(第6の実施の形態)
次に本発明の第6の実施の形態について説明する。
図16に示される本実施の形態と図14に示した第5の実施の形態とを比較すると、処理装置1200が、モデル適合度評価手段1242に代えてモデル適合度評価手段1252を備えている点で両者は相違する。
図17を参照すると、モデル適合度評価手段1252は、ギャラリ画像Ig、ギャラリモデル画像I’g、プローブ画像Ip、プローブモデル画像I’p、目的パラメタpt、ギャラリ外部パラメタpeg、プローブ外部パラメタpep、ギャラリ画像パラメタ基準情報1245およびプローブ画像パラメタ基準情報1246を入力し、モデル適合度Vとモデル適合度Uを併用してモデル適合度Wを計算し出力する。
モデル適合度評価手段1252は、二つの評価部1253および評価部1254と、統合部1255とを備える。
評価部1253は、第1の実施の形態における図2のモデル適合度評価手段1202に相当し、ギャラリ画像Ig、ギャラリモデル画像I’g、プローブ画像Ip、プローブモデル画像I’pを入力とし、それらの誤差を評価してモデル適合度Vを計算して出力する。
評価部1254は、第5の実施形態における図14のモデル適合度評価手段1242に相当し、ギャラリ画像パラメタ基準情報1245とプローブ画像パラメタ基準情報1246を参照し、モデルフィッティング手段1201の推定した各パラメタpt,peg,pepの確信度を計算し、モデル適合度Uを出力する。
統合部1255は、モデル適合度Vとモデル適合度Uを統合したモデル適合度Wを計算して出力する。モデル適合度Wの計算には様々な方法が利用可能である。モデル適合度Wは次式で計算される。
W=V+wuU …(27)
ここで、wuはモデル適合度Vとモデル適合度Uの重視度を決める重み係数であり、事前に適当な値を決めておく。
照合手段1203は、第1の実施の形態とほぼ同じである。ただし、モデル適合度Vの値の代わりに、モデル適合度Wを用いて、プローブ画像とギャラリ画像の目的パラメタが同一であるかの照合、または、目的パラメタの値の推定を行う点が相違する。この際、第1の実施の形態および第5の実施の形態と同様の理由により、モデルフィッティング処理の絶対的な精度にあまり影響を受けずにプローブ画像とギャラリ画像との照合を行うことができる。
なお、本実施の形態は画像と画像を照合するシステムであり、第5の実施の形態との比較によって説明したが、第2の実施の形態において、モデル適合度評価手段1222を本実施の形態のモデル適合度評価手段1252に置き換えた実施の形態も考えられる。また、第3または第4の実施形態において、モデル適合度評価手段1232を本実施の形態のモデル適合度評価手段1252に置き換えた実施の形態も考えられる。
(第7の実施の形態)
次に本発明の第7の実施の形態について説明する。
図18に示される本実施の形態と図16に示した第6の実施の形態を比較すると、処理装置1200が、2Dモデルフィッティング手段1201を複数備えている点、モデル適合度評価手段1252に代えてモデル適合度評価手段1262を備えている点で両者は相違する。
複数の2Dモデルフィッティング手段1201のうち、第1の2Dモデルフィッティング手段は、第6の実施の形態の2Dモデルフィッティング手段1201と同様にギャラリ画像とプローブ画像との同時フィッティングを行うために使用され、残りの第2の2Dモデルフィッティング手段1201は、ギャラリ画像とプローブ画像の一方のみを入力し、この単一の画像のみに対して画像変動モデルをフィッティングしてモデル画像の生成およびパラメタ推定を行うために使用される。
モデル適合度評価手段1262は、単一画像へのモデルフィッティング結果と、両画像へのモデルフィッティング結果との誤差を、モデル適合度Wとして計算する。
図19を参照すると、第1のモデルフィッティング手段1201は、認識対象であるプローブ画像Ipおよびそれと照合されるギャラリ画像Igの両者を入力とし、画像変動モデルを用い、照合目的となる変動要素を共通のパラメタとしてモデルフィッティング処理を行い、両画像Ip,Igにできるだけ近い画像を生成できるようなパラメタの値を求める。生成されたプローブモデル画像I’p、ギャラリモデル画像I’g、推定された目的パラメタpt、プローブ外部パラメタpep、ギャラリ外部パラメタpegは、モデル適合度評価手段1262に出力される。
1つ目の第2のモデルフィッティング手段1201は、プローブ画像Ipのみを入力とし、画像変動モデルを用いてできるだけそれに近い画像を生成できるようなパラメタの値を求める。これには画像変動モデルに対応した様々な方法が利用可能であり、一例として、先行技術文献1の技術や先行技術文献2の技術を利用することは可能である。推定された目的パラメタをプローブ個別目的パラメタqtp、外部パラメタをプローブ個別外部パラメタqepとし、これらを合わせてプローブ画像パラメタ情報qpとする。これらと共に、生成されたプローブ個別モデル画像I’psが出力される。
2つ目の第2のモデルフィッティング手段1201は、ギャラリ画像Igのみを入力し、画像変動モデルを用いてできるだけそれに近い画像を生成できるようなパラメタの値を求める。画像変動モデルに対応した様々な方法が利用可能である。一例として、先行技術文献1の技術や先行技術文献2の技術が利用できる。推定された目的パラメタをギャラリ個別目的パラメタqtg、外部パラメタをギャラリ個別外部パラメタqegとし、これらを合わせてギャラリ画像パラメタ情報qgとして、これらパラメタとともに、生成されたギャラリ個別モデル画像I’gsが出力される。
モデル適合度評価手段1262は、ギャラリ画像Ig、ギャラリモデル画像I’g、ギャラリ個別モデル画像I’gs、プローブ画像Ip、プローブモデル画像I’p、プローブ個別モデル画像I’ps、目的パラメタpt、ギャラリ外部パラメタpeg、プローブ外部パラメタpep、ギャラリ画像パラメタ情報qgおよびプローブ画像パラメタ情報qpを入力し、モデル適合度Vとモデル適合度Uを併用してモデル適合度Wを計算し出力する。
モデル適合度評価手段1262は、二つの評価部1263および評価部1264と、統合部1265とを備える。
評価部1264と第6の実施の形態における評価部1254とは以下の点を除いて同じである。ギャラリ画像パラメタ基準情報1254およびプローブ画像パラメタ基準情報1246の代わりに第2のモデルフィッティング手段1201の出力したプローブ画像パラメタ情報qgおよびギャラリ画像パラメタ情報qgを参照し、第1のモデルフィッティング手段1201の出力した目的パラメタpt、プローブ外部パラメタpep、ギャラリ外部パラメタpegの値との誤差に基づいてパラメタ確信度を計算し、モデル適合度Uとして出力する点が相違する。
このモデル適合度Uの計算方法は様々あるが、次式でモデル適合度Uを計算してもよい。
U=w1|pt−qtp|2+w2|pt−qtg|2
+w3|pep−qep|2+w4|peg−qeg|2 …(28)
ここで、w1,w2,w3,w4は重み係数であり、あらかじめ適当な値を設定しておく。なお、ここで説明したモデル適合度Uの計算方法はあくまで一例であり、様々な計算方法に変更可能である。
評価部1263は、第6の実施の形態における評価部1253に相当する。評価部1263は、プローブ画像Ip、ギャラリ画像Ig、第1のモデルフィッティング手段1201の出力するプローブモデル画像I’p、ギャラリモデル画像I’g、第2のモデルフィッティング手段1201の出力するプローブ個別モデル画像I’ps、及びギャラリ個別モデル画像I’gsを入力し、この個別に生成されたモデル画像I’ps,I’gsと、プローブおよびギャラリ両画像を併用して生成されたモデル画像I’p,I’gとの誤差をも加味して、モデル適合度Vを計算する。
その計算方法は様々な方法が利用可能である。一例として、次式に示すように画像の輝度値の二乗誤差和を用いることができる。
V=vp|Ip−Ip’|2+vg|Ig−Ig’|2+vps|I’p−I’ps|2+vgs|I’g−I’gs|2 …(29)
ここで、vp,vg,vps,vgsは、重みを調整する係数であり、あらかじめ適当な値に定められている。一例として、各画像の画素数の逆数としてもよい。また、状況によって適応的に変更することも可能である。このほかにも、式29にさらにIpとI’ps、IgとI’gsの誤差を加算するなど様々な計算方法が利用可能である。また、ここでは画像の輝度値の差分を用いたが、エッジや周波数成分など様々な画像特徴量の誤差を用いることも可能である。
統合部1265は、モデル適合度Vとモデル適合度Uを統合したモデル適合度Wを計算して出力する。モデル適合度Wの計算には様々な方法が利用可能であるが、一例として前記式27を使用することができる。
照合手段1203は、モデル適合度Vの値の代わりに、モデル適合度Wを用いて、プローブ画像とギャラリ画像の目的パラメタが同一であるか否かの照合、または、目的パラメタの値の推定を行う点以外は第1の実施の形態と同じである。この際、第1の実施の形態および第5の実施の形態と同様の理由により、モデルフィッティング処理の絶対的な精度にあまり影響を受けずにプローブ画像とギャラリ画像との照合を行うことができる。
なお、本実施の形態は画像と画像を照合するシステムであり、第6の実施の形態との比較によって説明した。なお、第2の実施の形態において、モデル適合度評価手段1222を本実施の形態のモデル適合度評価手段1262に置き換えた実施の形態も考えられる。また、第3または第4の実施形態において、モデル適合度評価手段1232を本実施の形態のモデル適合度評価手段1262に置き換えた実施の形態も考えられる。
以上本発明の実施の形態について説明したが、本発明は以上の例に限定されず、その他各種の付加変更が可能である。また、本発明の照合装置は、その有する機能をハードウェア的に実現することは勿論、コンピュータとプログラムとで実現することができる。プログラムは、磁気ディスクや半導体メモリ等のコンピュータ可読記録媒体に記録されて提供され、コンピュータの立ち上げ時などにコンピュータに読み取られ、そのコンピュータの動作を制御することにより、そのコンピュータを前述した各実施の形態における照合装置として機能させ、前述した処理を実行させる。
本発明は、認識対象となる画像や3次元データに対して画像変動モデルや3次元データ変動モデルをフィッティングして変動要素を推定する際に、フィッティング精度が低下して推定されるパラメタの精度が低下する状況においても、高い認識性能を得ることができる物体認識システム、方法、およびプログラムに利用できる。特に、多様な変動環境において撮影された認識対象画像や3次元データと、登録されている画像や3次元データを比較し、写っている物体が同一であるか、物体の状態、姿勢、照明条件、撮影したカメラなどの状況が同一であるかなどを高精度で認識できる物体認識システム、方法、およびプログラムに利用できる。

Claims (44)

  1. 物体の画像または3次元データである対象データと参照データとを照合する装置であって、
    複数のパラメタの値を調整することにより物体の画像または3次元データであるモデルデータを生成できる変動モデルを記憶する記憶手段と、
    前記記憶手段に記憶された変動モデルを用い、前記複数のパラメタのうち、前記対象データと前記参照データ間で同一かどうかを判定する判定対象を表すパラメタを目的パラメタ、それ以外のパラメタを外部パラメタとし、対象データと参照データとで目的パラメタを同一の値にした条件の下で、前記対象データに最も類似するモデルデータである対象モデルデータと前記参照データに最も類似するモデルデータである参照モデルデータとを前記変動モデルに基づき生成するために最適な前記パラメタ値を推定するモデルフィッティング手段と、
    前記推定されたパラメタの下での前記対象モデルデータと前記対象データとの類似度および前記参照モデルデータと前記参照データとの類似度に基づいて前記対象データおよび前記参照データに対するモデル適合度を算出するモデル適合度評価手段
    を備えることを特徴とする照合装置。
  2. 前記算出されたモデル適合度と予め定められた閾値とを比較することにより、前記対象データにおける前記判定対象と前記参照データにおける前記判定対象の同一性を判定する照合手段を備えることを特徴とする請求項1記載の照合装置。
  3. 複数の参照データのそれぞれと前記対象データとの組み合わせについて前記モデルフィッティング手段およびモデル適合度評価手段による処理を繰り返し、最も良いモデル適合度が得られた組み合わせにおける目的パラメタの値を前記対象データの目的パラメタの推定値とする照合手段を備えることを特徴とする請求項1記載の照合装置。
  4. 複数の参照データのそれぞれと前記対象データとの組み合わせについて前記モデルフィッティング手段およびモデル適合度評価手段による処理を繰り返し、予め定められた閾値以上のモデル適合度が得られた複数の組み合わせにおける目的パラメタから計算した値を、前記対象データの目的パラメタの推定値とする照合手段を備えることを特徴とする請求項1記載の照合装置。
  5. 前記モデル適合度評価手段は、
    前記生成された前記対象モデルデータと前記対象データとの間の誤差および前記生成された前記参照モデルデータと前記参照データとの間の誤差を計算し、
    該計算した誤差から前記モデル適合度を算出する
    ことを特徴とする請求項1記載の照合装置。
  6. 前記モデル適合度評価手段は、
    前記推定されたパラメタの値の確からしさを示すパラメタ確信度を予め定められたパラメタ基準情報を参照して計算し、
    該計算したパラメタ確信度から前記モデル適合度を算出する
    ことを特徴とする請求項1記載の照合装置。
  7. 前記モデル適合度評価手段は、
    前記生成された前記対象モデルデータと前記対象データとの間の誤差および前記生成された前記参照モデルデータと前記参照データとの間の誤差を計算すると共に、前記推定されたパラメタの値の確からしさを示すパラメタ確信度を予め定められたパラメタ基準情報を参照して計算し、
    前記計算した誤差およびパラメタ確信度から前記モデル適合度を算出する
    ことを特徴とする請求項1記載の照合装置。
  8. 前記パラメタ基準情報が、前記パラメタの値の取り得る値域であることを特徴とする請求項6または7記載の照合装置。
  9. 前記パラメタ基準情報が、前記パラメタの正解値であることを特徴とする請求項6または7記載の照合装置。
  10. 前記パラメタ基準情報が、前記パラメタの値の確率分布であることを特徴とする請求項6または7記載の照合装置。
  11. 前記モデルフィッティング手段は、前記対象データに類似する対象個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値、および、前記参照データに類似する参照個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値を、前記対象データと前記参照データとで目的パラメタの値が必ずしも同一でないとの条件の下に推定し、
    前記モデル適合度評価手段は、前記推定された対象個別モデルデータの前記パラメタの値および前記参照個別モデルデータの前記パラメタの値を、前記パラメタ基準情報とすることを特徴とする請求項6または7記載の照合装置。
  12. 前記モデルフィッティング手段は、前記対象データに類似する対象個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値、および、前記参照データに類似する参照個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値を、前記対象データと前記参照データとで目的パラメタの値が必ずしも同一でないとの条件の下に推定し、
    前記モデル適合度評価手段は、前記対象個別モデルデータと前記対象データとの間の誤差、前記参照個別モデルデータと前記参照データとの間の誤差、前記対象モデルデータと前記対象個別モデルデータとの間の誤差、前記参照モデルデータと前記参照個別モデルデータとの間の誤差の少なくとも一つの誤差をさらに考慮に入れて前記モデル適合度を算出することを特徴とする請求項5または7記載の照合装置。
  13. 前記変動モデルとして、様々な物体の3次元モデルを含み、物体を指定するパラメタに応じて指定の物体の3次元モデルを選択し、該選択した3次元モデルを、物体の状態、姿勢、照明条件、カメラの特性などのパラメタに応じて変形し、さらに、コンピュータグラフィクスを用いて前記パラメタの表す状況下での画像を生成する画像変動モデルを使用することを特徴とする請求項1記載の照合装置。
  14. 前記変動モデルとして、物体の個性や状態を指定するパラメタに応じて該状態における物体の3次元モデルを計算し、該計算した3次元モデルを、物体の姿勢、照明条件、カメラの特性などのパラメタに応じて変形し、さらに、コンピュータグラフィクスを用いて前記パラメタの表す状況下での画像を生成する画像変動モデルを使用することを特徴とする請求項1記載の照合装置。
  15. 前記変動モデルとして、様々な物体の3次元モデルを含み、物体を指定するパラメタに応じて指定の物体の3次元モデルを選択し、該選択した3次元モデルを、物体の状態、姿勢、照明条件、カメラの特性などのパラメタに応じて変形する3次元データ変動モデルを使用することを特徴とする請求項1記載の照合装置。
  16. 前記変動モデルとして、物体の個性や状態を指定するパラメタに応じて該状態における物体の3次元モデルを計算し、該計算した3次元モデルを、物体の姿勢、照明条件、カメラの特性などのパラメタに応じて変形する3次元データ変動モデルを使用することを特徴とする請求項1記載の照合装置。
  17. 前記目的パラメタが物体の種類を記述するパラメタであり、前記照合手段が前記対象データと前記参照データの物体が同一であるかを判定する手段であることを特徴とする請求項2または3記載の照合装置。
  18. 前記変動モデルが顔の画像または3次元データを生成するモデルであり、前記目的パラメタが人物の個性を記述するパラメタであり、前記照合手段が前記対象データと前記参照データの人物が同一であるかを照合する手段であることを特徴とする請求項2または3記載の照合装置。
  19. 前記目的パラメタが物体の位置または姿勢を特定するパラメタであり、前記照合手段が前記対象データと前記参照データの物体の位置または姿勢が同一であるかを照合する手段であることを特徴とする請求項2または3記載の照合装置。
  20. 前記変動モデルが顔の画像または3次元データを生成するモデルであり、前記目的パラメタが人物の顔の表情を特定するパラメタであり、前記照合手段が前記対象データと前記参照データの顔の表情が同一であるかを照合する手段であることを特徴とする請求項2または3記載の照合装置。
  21. コンピュータを用いて物体の画像または3次元データである対象データと参照データとを照合する方法であって、
    前記コンピュータが、複数のパラメタの値を調整することにより物体の画像または3次元データであるモデルデータを生成できる変動モデルを用い、前記複数のパラメタのうち、前記対象データと前記参照データ間で同一かどうかを判定する判定対象を表すパラメタを目的パラメタ、それ以外のパラメタを外部パラメタとし、対象データと参照データとで目的パラメタを同一の値にした条件の下で、前記対象データに最も類似するモデルデータである対象モデルデータと前記参照データに最も類似するモデルデータである参照モデルデータとを前記変動モデルに基づき生成するために最適な前記パラメタ値を推定する第1のステップと、
    前記コンピュータが、前記推定されたパラメタの下での前記対象モデルデータと前記対象データとの類似度および前記参照モデルデータと前記参照データとの類似度に基づいて前記対象データおよび前記参照データに対するモデル適合度を算出する第2のステップ
    を含むことを特徴とする照合方法。
  22. 前記コンピュータが、前記算出されたモデル適合度と予め定められた閾値とを比較することにより、前記対象データにおける前記判定対象と前記参照データにおける前記判定対象の同一性を判定する第3のステップをさらに含むことを特徴とする請求項21記載の照合方法。
  23. 前記コンピュータが、複数の参照データのそれぞれと前記対象データとの組み合わせについて前記第1および第2のステップを繰り返し、最も良いモデル適合度が得られた組み合わせにおける目的パラメタの値を前記対象データの目的パラメタの推定値とする第3のステップをさらに含むことを特徴とする請求項21記載の照合方法。
  24. 前記コンピュータが、複数の参照データのそれぞれと前記対象データとの組み合わせについて前記第1および第2のステップを繰り返し、予め定められた閾値以上のモデル適合度が得られた複数の組み合わせにおける目的パラメタから計算した値を、前記対象データの目的パラメタの推定値とする第3のステップをさらに含むことを特徴とする請求項21記載の照合方法。
  25. 前記第2のステップにおいては、前記生成された前記対象モデルデータと前記対象データとの間の誤差および前記生成された前記参照モデルデータと前記参照データとの間の誤差を計算し、該計算した誤差から前記モデル適合度を算出することを特徴とする請求項21記載の照合方法。
  26. 前記第2のステップにおいては、前記推定されたパラメタの値の確からしさを示すパラメタ確信度を予め定められたパラメタ基準情報を参照して計算し、該計算したパラメタ確信度から前記モデル適合度を算出することを特徴とする請求項21記載の照合方法。
  27. 前記第2のステップにおいては、前記生成された前記対象モデルデータと前記対象データとの間の誤差および前記生成された前記参照モデルデータと前記参照データとの間の誤差を計算すると共に、前記推定されたパラメタの値の確からしさを示すパラメタ確信度を予め定められたパラメタ基準情報を参照して計算し、前記計算した誤差およびパラメタ確信度から前記モデル適合度を算出することを特徴とする請求項21記載の照合方法。
  28. 前記パラメタ基準情報が、前記パラメタの値の取り得る値域であることを特徴とする請求項26または27記載の照合方法。
  29. 前記パラメタ基準情報が、前記パラメタの正解値であることを特徴とする請求項26または27記載の照合方法。
  30. 前記パラメタ基準情報が、前記パラメタの値の確率分布であることを特徴とする請求項26または27記載の照合方法。
  31. 前記コンピュータが、前記対象データに類似する対象個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値、および、前記参照データに類似する参照個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値を、前記対象データと前記参照データとで目的パラメタの値が必ずしも同一でないとの条件の下に推定し、
    該推定した対象個別モデルデータの前記パラメタの値および前記参照個別モデルデータの前記パラメタの値が前記パラメタ基準情報となる
    ことを特徴とする請求項26または27記載の照合方法。
  32. 前記コンピュータが、
    前記対象データに類似する対象個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値、および、前記参照データに類似する参照個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値を、前記対象データと前記参照データとで目的パラメタの値が必ずしも同一でないとの条件の下に推定し、
    前記対象個別モデルデータと前記対象データとの間の誤差、前記参照個別モデルデータと前記参照データとの間の誤差、前記対象モデルデータと前記対象個別モデルデータとの間の誤差、前記参照モデルデータと前記参照個別モデルデータとの間の誤差の少なくとも一つの誤差をさらに考慮に入れて前記モデル適合度を算出する
    ことを特徴とする請求項25または27記載の照合方法。
  33. 複数のパラメタの値を調整することにより物体の画像または3次元データであるモデルデータを生成できる変動モデルを記憶する記憶手段を有し、物体の画像または3次元データである対象データと参照データとを照合するコンピュータを、
    前記記憶手段に記憶された変動モデルを用い、前記複数のパラメタのうち、前記対象データと前記参照データ間で同一かどうかを判定する判定対象を表すパラメタを目的パラメタ、それ以外のパラメタを外部パラメタとし、対象データと参照データとで目的パラメタを同一の値にした条件の下で、前記対象データに最も類似するモデルデータである対象モデルデータと前記参照データに最も類似するモデルデータである参照モデルデータとを前記変動モデルに基づき生成するために最適な前記パラメタ値を推定するモデルフィッティング手段として機能させ、
    前記推定されたパラメタの下での前記対象モデルデータと前記対象データとの類似度および前記参照モデルデータと前記参照データとの類似度に基づいて前記対象データおよび前記参照データに対するモデル適合度を算出するモデル適合度評価手段として機能させるためのプログラム。
  34. 前記コンピュータを、さらに、前記算出されたモデル適合度と予め定められた閾値とを比較することにより、前記対象データにおける前記判定対象と前記参照データにおける前記判定対象の同一性を判定する照合手段として機能させるための請求項33記載のプログラム。
  35. 前記コンピュータを、さらに、複数の参照データのそれぞれと前記対象データとの組み合わせについて前記モデルフィッティング手段およびモデル適合度評価手段による処理を繰り返し、最も良いモデル適合度が得られた組み合わせにおける目的パラメタの値を前記対象データの目的パラメタの推定値とする照合手段として機能させるための請求項33記載のプログラム。
  36. 前記コンピュータを、さらに、複数の参照データのそれぞれと前記対象データとの組み合わせについて前記モデルフィッティング手段およびモデル適合度評価手段による処理を繰り返し、予め定められた閾値以上のモデル適合度が得られた複数の組み合わせにおける目的パラメタから計算した値を、前記対象データの目的パラメタの推定値とする照合手段として機能させるための請求項33記載のプログラム。
  37. 前記モデル適合度評価手段は、
    前記生成された前記対象モデルデータと前記対象データとの間の誤差および前記生成された前記参照モデルデータと前記参照データとの間の誤差を計算し、
    該計算した誤差から前記モデル適合度を算出する
    ことを特徴とする請求項33記載のプログラム。
  38. 前記モデル適合度評価手段は、前記推定されたパラメタの値の確からしさを示すパラメタ確信度を予め定められたパラメタ基準情報を参照して計算し、該計算したパラメタ確信度から前記モデル適合度を算出することを特徴とする請求項33記載のプログラム。
  39. 前記モデル適合度評価手段は、
    前記生成された前記対象モデルデータと前記対象データとの間の誤差および前記生成された前記参照モデルデータと前記参照データとの間の誤差を計算すると共に、前記推定されたパラメタの値の確からしさを示すパラメタ確信度を予め定められたパラメタ基準情報を参照して計算し、
    前記計算した誤差およびパラメタ確信度から前記モデル適合度を算出する
    ことを特徴とする請求項33記載のプログラム。
  40. 前記パラメタ基準情報が、前記パラメタの値の取り得る値域であることを特徴とする請求項38または39記載のプログラム。
  41. 前記パラメタ基準情報が、前記パラメタの正解値であることを特徴とする請求項38または39記載のプログラム。
  42. 前記パラメタ基準情報が、前記パラメタの値の確率分布であることを特徴とする請求項38または39記載のプログラム。
  43. 前記モデルフィッティング手段は、前記対象データに類似する対象個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値、および、前記参照データに類似する参照個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値を、前記対象データと前記参照データとで目的パラメタの値が必ずしも同一でないとの条件の下に推定し、
    前記モデル適合度評価手段は、前記推定された対象個別モデルデータの前記パラメタの値および前記参照個別モデルデータの前記パラメタの値を、前記パラメタ基準情報とする
    ことを特徴とする請求項38または39記載のプログラム。
  44. 前記モデルフィッティング手段は、前記対象データに類似する対象個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値、および、前記参照データに類似する参照個別モデルデータを前記変動モデルから生成するための最適な前記パラメタの値を、前記対象データと前記参照データとで目的パラメタの値が必ずしも同一でないとの条件の下に推定し、
    前記モデル適合度評価手段は、前記対象個別モデルデータと前記対象データとの間の誤差、前記参照個別モデルデータと前記参照データとの間の誤差、前記対象モデルデータと前記対象個別モデルデータとの間の誤差、前記参照モデルデータと前記参照個別モデルデータとの間の誤差の少なくとも一つの誤差をさらに考慮に入れて前記モデル適合度を算出する
    ことを特徴とする請求項37または39記載のプログラム。
JP2008511027A 2006-04-14 2007-04-12 照合装置および照合方法 Active JP4957921B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008511027A JP4957921B2 (ja) 2006-04-14 2007-04-12 照合装置および照合方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2006112048 2006-04-14
JP2006112048 2006-04-14
JP2008511027A JP4957921B2 (ja) 2006-04-14 2007-04-12 照合装置および照合方法
PCT/JP2007/058477 WO2007119870A1 (ja) 2006-04-14 2007-04-12 照合装置および照合方法

Publications (2)

Publication Number Publication Date
JPWO2007119870A1 JPWO2007119870A1 (ja) 2009-08-27
JP4957921B2 true JP4957921B2 (ja) 2012-06-20

Family

ID=38609624

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008511027A Active JP4957921B2 (ja) 2006-04-14 2007-04-12 照合装置および照合方法

Country Status (4)

Country Link
US (1) US8295614B2 (ja)
EP (1) EP2012272A1 (ja)
JP (1) JP4957921B2 (ja)
WO (1) WO2007119870A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10878657B2 (en) 2018-07-25 2020-12-29 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same
US11521460B2 (en) 2018-07-25 2022-12-06 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE507537T1 (de) * 2005-12-16 2011-05-15 Technion Res And Dev Of Foundation Ltd Verfahren und vorrichtung zur bestimmung der ähnlichkeit zwischen oberflächen
US8086043B2 (en) * 2007-12-21 2011-12-27 Ati Technologies Ulc System and method of image correlation based on image structure
US8165354B1 (en) * 2008-03-18 2012-04-24 Google Inc. Face recognition with discriminative face alignment
KR101626057B1 (ko) * 2009-11-19 2016-05-31 삼성전자주식회사 3뷰 영상의 디스패리티 추정 방법 및 장치
CN102679867A (zh) * 2011-03-15 2012-09-19 鸿富锦精密工业(深圳)有限公司 测头管理***及方法
US9323980B2 (en) 2011-05-13 2016-04-26 Microsoft Technology Licensing, Llc Pose-robust recognition
US9251402B2 (en) * 2011-05-13 2016-02-02 Microsoft Technology Licensing, Llc Association and prediction in facial recognition
JP5719277B2 (ja) * 2011-11-09 2015-05-13 日本電信電話株式会社 物体座標系変換行列推定成否判定装置および物体座標系変換行列推定成否判定方法ならびにそのプログラム
FR2998402B1 (fr) * 2012-11-20 2014-11-14 Morpho Procede de generation d'un modele de visage en trois dimensions
JP2014164697A (ja) * 2013-02-27 2014-09-08 Canon Inc 画像処理装置および画像処理方法、プログラム、並びに記憶媒体
US9577910B2 (en) * 2013-10-09 2017-02-21 Verisign, Inc. Systems and methods for configuring a probe server network using a reliability model
US20150235073A1 (en) * 2014-01-28 2015-08-20 The Trustees Of The Stevens Institute Of Technology Flexible part-based representation for real-world face recognition apparatus and methods
US10657362B2 (en) * 2015-06-30 2020-05-19 Nec Corporation Of America Facial recognition system
US10534955B2 (en) * 2016-01-22 2020-01-14 Dreamworks Animation L.L.C. Facial capture analysis and training system
JP6991771B2 (ja) * 2017-07-31 2022-01-13 キヤノン株式会社 情報処理装置、情報処理システム、情報処理方法及びプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4167390B2 (ja) 2000-11-20 2008-10-15 日本電気株式会社 物体照合方法,物体照合装置,およびそのプログラムを記録した記録媒体
US7436988B2 (en) * 2004-06-03 2008-10-14 Arizona Board Of Regents 3D face authentication and recognition based on bilateral symmetry analysis
US20060120571A1 (en) * 2004-12-03 2006-06-08 Tu Peter H System and method for passive face recognition
US7609860B2 (en) * 2005-06-14 2009-10-27 Mitsubishi Electric Research Laboratories, Inc. Bilinear illumination model for robust face recognition
US7756325B2 (en) * 2005-06-20 2010-07-13 University Of Basel Estimating 3D shape and texture of a 3D object based on a 2D image of the 3D object

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10878657B2 (en) 2018-07-25 2020-12-29 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same
US11455864B2 (en) 2018-07-25 2022-09-27 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same
US11521460B2 (en) 2018-07-25 2022-12-06 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same

Also Published As

Publication number Publication date
JPWO2007119870A1 (ja) 2009-08-27
EP2012272A1 (en) 2009-01-07
US8295614B2 (en) 2012-10-23
WO2007119870A1 (ja) 2007-10-25
US20090180672A1 (en) 2009-07-16

Similar Documents

Publication Publication Date Title
JP4957921B2 (ja) 照合装置および照合方法
EP1677250B1 (en) Image collation system and image collation method
JP4553141B2 (ja) 重み情報を用いた物体姿勢推定・照合システム
JP4692773B2 (ja) 物体の姿勢推定及び照合システム、物体の姿勢推定及び照合方法、並びにそのためのプログラム
AU762625B2 (en) Face sub-space determination
JP4991317B2 (ja) 顔特徴点検出装置及びその方法
JP5675145B2 (ja) パターン認識装置及びパターン認識方法
US20150356346A1 (en) Feature point position detecting appararus, feature point position detecting method and feature point position detecting program
JP6430102B2 (ja) 人物属性推定装置、人物属性推定方法及びプログラム
Wei et al. Automatic facial pose determination of 3D range data for face model and expression identification
CN116631019B (zh) 基于面部图像的口罩适合性检测方法及装置
JP2009025874A (ja) 顔画像登録装置、顔識別装置、顔画像登録方法、顔識別方法、顔画像登録プログラム
Stankiewicz et al. Automatic detection of features (markers) on a three-dimensional model of a human face
Wimmer et al. Face model fitting based on machine learning from multi-band images of facial components

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100316

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120222

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120306

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150330

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4957921

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150