JP4653606B2 - 画像認識装置、方法およびプログラム - Google Patents

画像認識装置、方法およびプログラム Download PDF

Info

Publication number
JP4653606B2
JP4653606B2 JP2005268983A JP2005268983A JP4653606B2 JP 4653606 B2 JP4653606 B2 JP 4653606B2 JP 2005268983 A JP2005268983 A JP 2005268983A JP 2005268983 A JP2005268983 A JP 2005268983A JP 4653606 B2 JP4653606 B2 JP 4653606B2
Authority
JP
Japan
Prior art keywords
image
dimensional shape
shape information
dimensional
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005268983A
Other languages
English (en)
Other versions
JP2007004767A (ja
Inventor
達夫 小坂谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2005268983A priority Critical patent/JP4653606B2/ja
Priority to US11/438,364 priority patent/US7894636B2/en
Publication of JP2007004767A publication Critical patent/JP2007004767A/ja
Application granted granted Critical
Publication of JP4653606B2 publication Critical patent/JP4653606B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects
    • G06V20/647Three-dimensional objects by matching two-dimensional images to three-dimensional objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Image Generation (AREA)

Description

本発明は、3次元形状情報を用いて入力された画像から3次元モデルを生成し、認識処理を行う画像認識装置及びその方法に関する。
顔画像を用いた認識は、物理的な鍵やパスワードと違い紛失や忘却の心配がないため、セキュリティの面で非常に有用な技術である。しかしながら、ユーザの立ち位置や体格などの個人差により顔の形状は変化する上、顔の向きも一定ではなく、認識時の照明条件も予め決まっていない。そのため、高精度な認識を行うためには、これらに起因する顔パターンの変動を吸収することが不可欠である。
これまで顔画像を用いて個人識別を行う技術としては、例えば非特許文献1の方法などがある。これは動画像を用いることにより顔パターンの変動を抑え、認識を行う方法である。高精度な認識を行うためには動画像から個人の多様な顔パターンを集めることが重要であるが、パターン収集はユーザ自身の顔の動きに依存しているという問題がある。また、入力と辞書の両方に複数枚の画像が必要なため、例えば、写真1枚のみしか認識に利用できない状況ではこの方法は適用できない。
特許文献1の方法では、予め顔の3次元形状を撮影するレンジファインダを用いて計測しておき、照合対象の顔向きと同じになるように顔形状を移動・回転させて照合を行う。個人毎に正確な形状を撮影するために、顔の向きや大きさを補正して照合を行うことができるが、形状を撮影するためには特殊な機材が必要となる。また、例えばパスポートや免許証など、既に通常のカメラで撮影されている画像に関しては形状が得られないため、この方法は適用できない。
非特許文献2の方法によれば、多数の顔形状を予め撮影しておき、それらの線形結合によって入力画像に最も近い顔のモデルを作成し、認識を行うことができる。画像1枚から顔の形状、向き、大きさ、照明条件を推定することができるが、生成される顔モデルの3次元形状情報は予め撮影した顔形状に依存するため、任意の顔に精度良く適用できるとは限らない。また、多数のパラメータを推定し、識別を行うため処理時間がかかる。
山口、福井、「顔向き表情変化にロバストな顔認識システム‘smartface’」, 信学論 (D-II), vol.J84-D-II, No.6,p.1045-1052,2001. V. Blanz and T. Vetter, "A morphable model for the synthesis of 3-D faces," in Proc. SIGGRAPH,1999,pp.187--194. 特開2002−157595公報
上記したように、人物の顔パターンの多様な変動を吸収するためには、多様な顔パターンを何らかの方法で収集もしくは生成して識別を行う方法が有効であるが、従来技術では、複数枚の画像を撮影したり、特殊な機材を必要としたり、適用できる顔が限定されるといった問題があった。
本発明は、上記従来技術の問題点を解決するためになされたものであり、3次元形状情報を利用した3次元顔モデル生成によって、任意の枚数の画像から一般的なカメラを用いて任意の顔に適用可能な画像認識装置及びその方法を提供することを目的とする。
本発明の一側面は、3次元形状を有する物体を撮影した画像を用いて前記物体の画像認識を行う画像認識装置において、前記画像が入力される画像入力手段と、前記物体の3次元モデルの原型となる3次元形状情報を記憶しておく3次元形状情報保持手段と、前記入力画像と前記3次元形状情報とを用いて推定されたテクスチャ画像を生成するモデル生成手段と、前記生成されたテクスチャ画像に対してそれぞれ異なる2次元的な変形を加えて複数のパターン画像を生成するテクスチャ摂動手段と、前記複数のパターン画像から特徴量の抽出を行う特徴抽出手段と、前記物体の特徴量を登録しておく登録辞書保持手段と、前記抽出された特徴量と前記登録された物体の特徴量との類似度を計算し、この計算した類似度に基づいて前記物体の認識を行う類似度計算手段と、を有することを特徴とする画像認識装置である。
本発明によれば、3次元形状情報を利用して3次元モデルを生成することによって、任意の枚数の画像から一般的なカメラを用いて高精度に認識することが可能である。
[第1の実施形態]
以下、図1〜図2を参照して本発明に係わる第1の実施形態の画像認識装置10について述べる。
[1]画像認識装置10の構成
本実施形態の画像認識装置10は、図1のブロック図に示すように、対象となる人物の顔を入力する画像入力部12と、入力された画像内から人物の顔を検出する物体検出部14と、検出された顔と予め保持してある3次元形状情報を用いて3次元顔モデルを生成するモデル生成部16と、3次元顔モデルから顔パターン画像を生成するパターン生成部18と、生成した顔パターン画像から認識に用いる特徴量を抽出する特徴抽出部20と、予め登録してある登録辞書22との類似度を計算する類似度計算部24とを備えている。
以下、図1を用いて、画像認識装置10の動作について説明する。
[2]画像入力部12
まず、画像入力部12は、処理対象となる顔画像を入力する。画像入力部12を構成する装置の一つの例として、USBカメラやデジタルカメラ等が挙げられる。また、予め撮影、保存された顔画像データを保持している記録装置やビデオテープ、DVD等を用いても良いし、顔写真をスキャンするスキャナでも良い。ネットワーク等を経由して画像を入力しても構わない。
画像入力部12より得られた画像は、物体検出部14に逐次送られる。
[3]物体検出部14
物体検出部14では、顔特徴点として、画像中の顔部位の座標を検出する。顔特徴点の検出はどのような方法を用いても構わないが、例えば、非特許文献3(福井、山口、「形状抽出とパターン照合の組合せによる顔特徴点抽出」, 信学論(D-II) vol.J80-D-II, No.9, p.2170-2177,1997.)の方法を用いて検出することができる。
検出する特徴点は、同一平面状に存在しない4点以上の点であれば、瞳、鼻孔、口端、目尻、目頭、鼻頭、口輪郭、口中点、眉端、顔輪郭、顎のどのような部位でも良い。また、出力する特徴点は複数組あってもかまわない。たとえば、検出された特徴点に対して任意の方向に摂動させた別の特徴点を計算し、出力することができる。このとき、モデル生成とパターン生成の処理を出力した特徴点の組の数だけ行い、特徴抽出部20において統合することで、出力した特徴点の組の数によらず処理を行うことができる。
[4]モデル生成部16
モデル生成部16では、予め保持している3次元形状情報を利用して、3次元顔モデルを生成する。
この3次元形状情報は、認識対象である人間の顔の3次元モデルの原型となる3次元形状の座標が記憶され、特に瞳、鼻孔、口端などの顔特徴点の各点の座標(xi’,yi’,zi’)が記憶されている。
物体検出部14から得られた顔特徴点(xi,yi)と、対応するモデル上の顔特徴点(xi’,yi’,zi’)を用いて、カメラ運動行列Mは(1)式、(2)式及び(3)式により定義される。
Figure 0004653606
ただし、(A)式は入力画像上での特徴点の重心であり、(B)式は3次元顔モデル上での特徴点の重心である。(3)式の行列Sの一般化逆行列である(C)式の行列を計算することで、(4)式に基づいてカメラ運動行列Mが算出される。
次に算出されたカメラ運動行列Mを用いて、入力画像から3次元顔モデルのテクスチャを推定する。3次元モデル上の任意の座標(x’,y’,z’)は、(5)式により対応する入力画像上の座標(s,t)に変換することができる。なお、テクスチャとは、座標毎に貼られる色などの画像情報である。
Figure 0004653606
従って、3次元モデル上の座標(x’,y’,z’)におけるテクスチャ画像の画素値T(x’,y’,z’)は、入力画像上の画素値I(x,y)を用いて(6)式によって定義される。
Figure 0004653606
(5)式及び(6)式について、テクスチャ画像上の全ての画素について計算することで、テクスチャ画像を算出することができる。このテクスチャ画像と3次元形状情報を3次元顔モデルとする。
[5]パターン生成部18
次に、パターン生成部18では、得られた3次元顔モデルを用いて顔パターン画像を生成する。
3次元顔モデルを任意の姿勢にしてコンピュータグラフィックスの技術を用いてレンダリングし、任意の姿勢に対する顔パターン画像を抽出することができる。姿勢をいくつか変えて複数の顔パターン画像を生成する。図2は、3次元モデルの姿勢を変えてパターン画像を生成した場合の概念図である。なお、顔パターン画像とは、顔の3次元モデルを複数の異なる向きで平面に射影した画像である。
どのように姿勢を変更しても構わないが、例えば、顔の縦向きや横向きに−5度から+5度の範囲で1度ずつ変更したり、カメラ運動行列からモデルの角度を算出して、そのモデルの角度から相対的に角度を変更したりして顔パターン画像を抽出しても良い。
これら角度のパラメータは、レンダリングの結果、顔が見えるような範囲であれば、どのような値を用いても構わない。
なお、レンダリング後の顔特徴点の座標は幾何学的に計算できることから、レンダリングした結果から任意の顔特徴点を基準として顔パターン画像を抽出することができる。
[6]特徴抽出部20
次に、特徴抽出部20により、識別に必要な特徴を抽出する。
パターン生成部18によって複数の顔パターン画像が得られているので、これらを例えば、画素値を要素とする特徴ベクトルとみなして一般的に知られるK−L展開を行い、得られた正規直交ベクトルを入力画像に対応する人物の特徴量とする。
人物の登録時には、この特徴量を記録しておく。この特徴ベクトルの要素の選び方や生成方法はどのように行っても良いし、特徴ベクトルに対して微分処理やヒストグラム平坦化などのいかなる画像処理を行っても良いし、特徴量生成方法もこれに限らない。
[7]類似度計算部24
次に、類似度計算部24では、予め計算された特徴量と特徴抽出部20で計算された入力に対する特徴量との類似度を計算する。
この類似度計算についてはどのような方法を用いても構わないが、例えば、非特許文献1に述べられている相互部分空間法などがある。このような認識方法により顔特徴量同士の類似度を算出することができる。その類似度をある所定の閾値で判定し、人物を同定する。閾値は事前の認識実験などで定めた値でも良いし、人物の特徴量に応じて増減させることもできる。
[8]本実施形態の効果
このように、第1の実施形態に係わる画像認識装置10によれば、3次元形状情報を利用して3次元顔モデルを生成することによって、任意の枚数の画像から一般的なカメラを用いて高精度に認識することが可能である。
[第2の実施形態]
図3〜図4を参照して本発明に係わる第2の実施形態の画像認識装置10について述べる。
[1]画像認識装置10の構成
本実施形態の画像認識装置10は、図3のブロック図に示すように、対象となる人物の顔を入力する画像入力部12と、入力された画像内から人物の顔を検出する物体検出部14と、検出された顔と予め保持してある3次元形状情報を用いて3次元顔モデルを生成するモデル生成部16と、テクスチャから複数の顔パターン画像を生成するテクスチャ摂動部26と、生成した顔パターン画像から認識に用いる特徴量を抽出する特徴抽出部20と、予め登録してある登録辞書22との類似度を計算する類似度計算部24とを備えている。
なお、画像入力部12、物体検出部14、3次元形状情報、モデル生成部16、特徴抽出部20、登録辞書22、類似度計算部24は第1の実施形態に記載してあるものと同じである。
[2]テクスチャ摂動部26
次に、本実施形態の特徴的な部分であるテクスチャ摂動部26について説明する。
テクスチャ摂動部26では、モデル生成部16から得られたテクスチャを用いて複数の顔パターン画像を生成する。得られたテクスチャ上での座標と3次元顔モデル上での座標は対応が取れているので、テクスチャにおける顔特徴点の座標は既知である。このテクスチャにおける顔特徴点の座標を用いて顔パターン画像を切り出す。
このとき顔特徴点に関しては、物体検出部14から得られた顔特徴点に限らず、モデル生成時に3次元的に全ての座標において対応が取れているため、顔の任意の点を顔特徴点として選び直すこともできる。
顔パターン画像の切り出し方法に関しては、両目の間隔が等しくなるように正規化してもよいし、特徴点の重心がパターン画像の中央に来るようにしても良いし、どのような切り出し方でも構わない。
また、上下左右など任意の方向にパターン画像を伸縮させても構わない。
また、切り出す際の顔特徴点の座標を任意の方向に摂動させることによって、別の顔パターン画像を生成することができる。摂動させる量はどのような範囲でも構わない。
また、摂動させる顔特徴点の種類に関しても、1つまたは全ての特徴点を任意に組み合わせることができ、摂動させる方向についても画像に対して垂直や水平だけでなく、任意の方向に摂動させることができる。例えば、顔特徴点として両目を選んだときに、水平、垂直方向にそれぞれ−2〜+2ピクセルの範囲で摂動させると、モデル生成部16から得られたテクスチャから、625枚の顔パターン画像を生成することができる。図4は、テクスチャ画像を2次元的に変形させた場合の概念図である。
[3]本実施形態の効果
このように、第2の実施形態に係わる画像認識装置10によれば、生成した3次元顔モデルから、コンピュータグラフィックスの技術に基づいてレンダリングせずに、テクスチャから複数の顔パターン画像を生成することによって、高速に認識することが可能である。
[第3の実施形態]
図5を参照して本発明に係わる第3の実施形態の画像認識装置10について述べる。
[1]画像認識装置10の構成
本実施形態の画像認識装置10は、図5のブロック図に示すように、対象となる人物の顔を入力する画像入力部12と、入力された画像内から人物の顔を検出する物体検出部14と、予め保持してある3次元形状情報と、物体検出部14からの結果を用いて適切な3次元形状情報を選択する形状選択部28と、形状選択部28から得られる3次元形状情報を用いて3次元顔モデルを生成するモデル生成部16と、3次元顔モデルから顔パターン画像を生成するパターン生成部18と、生成した顔パターン画像から認識に用いる特徴量を抽出する特徴抽出部20と、予め登録してある登録辞書22との類似度を計算する類似度計算部24とを備えている。
なお、画像入力部12、物体検出部14、3次元形状情報、モデル生成部16、パターン生成部18、特徴抽出部20、登録辞書22、類似度計算部24は第1の実施形態に記載してあるものと同じである。
[2]形状選択部28
次に、本実施形態の特徴的な部分である形状選択部28について説明する。
形状選択部28では、物体検出部14から得られた特徴点に基づいて、予め保持してある複数の3次元形状情報から適切なものを選択する。
物体検出部14から特徴点が得られたときに、それらの特徴点に関する位置関係について、予め3次元形状でも同じ特徴点の距離を測っておき、複数ある3次元形状から最もその距離が近いものを出力する。
特徴点や距離計算の尺度はどのように選択しても構わない。例えば、目と鼻の距離を計算しておき、その比が最も近い3次元形状を出力する。
また、顔の幾何学的な構造だけでなく、男女や人種などが情報として与えられている場合には、それに基づいて男女別や人種別などの3次元形状を用意して適合する3次元形状を出力することもできる。このとき、パターンマッチング等を利用して、男女や人種などの判断を自動的に行ってもよい。
また、出力する3次元形状を1つに絞らず、3次元形状選択の際の閾値を満たす、または全ての3次元形状を出力し、モデル生成などの以降の処理を出力したモデルの分だけ行い、特徴抽出部20において統合しても良い。特徴抽出部20においてはパターン生成部18から複数の画像を統合することができるので、モデルの数や出力されるパターン画像の数によらず、モデル1つのときと全く同様に特徴抽出することができる。
[3]本実施形態の効果
このように、第3の実施形態に係わる画像認識装置10によれば、入力された画像に対して適切な3次元形状を選択することで、より高精度に認識を行うことが可能である。
[第4の実施形態]
図6を参照して本発明に係わる第4の実施形態の画像認識装置10について述べる。
[1]画像認識装置10の構成
本実施形態の画像認識装置10は、図6のブロック図に示すように、対象となる人物の顔を入力する画像入力部12と、入力された画像内から人物の顔を検出する物体検出部14と、検出された顔と予め保持してある3次元形状情報を用いて3次元顔モデルを生成するモデル生成部16と、3次元顔モデルから顔パターン画像を生成するパターン生成部18と、生成した顔パターン画像を用いて物体検出部14から得られた特徴点を検証するパターン画像検証部30と、生成した顔パターン画像から認識に用いる特徴量を抽出する特徴抽出部20と、予め登録してある登録辞書22との類似度を計算する類似度計算部24とを備えている。
なお、画像入力部12、物体検出部14、3次元形状情報、モデル生成部16、パターン生成部18、特徴抽出部20、登録辞書22、類似度計算部24は第1の実施形態に記載してあるものと同じである。
[2]パターン画像検証部30
次に、本実施形態の特徴的な部分であるパターン画像検証部30について説明する。
パターン画像検証部30では、モデル生成部16から得られる顔モデルを用いて、特徴抽出部20で得られた顔特徴点が正しいかどうか検証する。
(4)式で計算されるカメラ運動行列からモデルの角度を参照角度として推定し、モデル生成部16で得られる3次元顔モデルを参照角度に回転してコンピュータグラフィックスの技術に基づいてレンダリングする。
このとき、検出された特徴点が正しい位置からずれて誤って抽出された場合には、レンダリング結果は画像入力部12で入力された画像や標準的な顔パターンとは大きく異なって出力される。このパターン画像の違いを検証し、ある閾値を超えた場合には、特徴点検出が誤りであるとして、再度特徴点検出を行う。パターン画像の違いについては、どのような方法を用いても構わない。例えば、2つのパターン画像の輝度差の絶対値の総和(SAD; Sum of Absolute Difference)などが利用できる。
また、レンダリングしたパターン画像の全体について検証しても構わないし、ある注目する特徴点の近傍のみについて検証しても構わないし、特徴点の近傍を複数組み合わせても良い。
[3]本実施形態の効果
このように、第4の実施形態に係わる画像認識装置10によれば、生成した3次元顔モデルから、検出された顔特徴点を検証することができ、より高精度に認識を行うことが可能である。
[第5の実施形態]
図7および図8を参照して本発明に係わる第5の実施形態の画像認識装置について述べる。
[1]画像認識装置10の構成
本実施形態の画像認識装置10は、図7のブロック図に示すように、対象となる人物の顔を入力する画像入力部12と、入力された画像内から人物の顔を検出する物体検出部14と、対象となる人物の顔の3次元形状を入力する形状入力部72と、予め保持してある参照形状情報74を用いて入力された顔形状を正規化する形状正規化部76と、検出された顔と正規化された3次元形状情報78を用いて3次元顔モデルを生成するモデル生成部16と、3次元顔モデルから顔パターン画像を生成するパターン生成部18と、生成した顔パターン画像から認識に用いる特徴量を抽出する特徴抽出部20と、予め登録してある登録辞書22との類似度を計算する類似度計算部24とを備えている。
なお、画像入力部12、物体検出部14、モデル生成部16、パターン生成部18、特徴抽出部20、登録辞書22、類似度計算部24は第1の実施形態に記載してあるものと同じである。
[2]形状入力部72
形状入力部72では、レンジファインダなど物体の3次元形状を計測可能な装置により取得された対象となる人物の顔の3次元形状(図8の入力形状82)が入力される。レンジファインダには、3次元形状だけでなく、撮影した物体の画像も同時に取得できるものもあるため、画像入力部12と形状入力部72を同一の機器で構成してもかまわない。また、複数の画像からステレオ法により形状を求めてもかまわないし、認識対象の形状を求める方法についてはこれらに限らない。
本実施形態の形状入力部72に入力される形状は、奥行き(z座標値)を画素値とする画像(デプスマップ)であるとする。
尚、形状入力部72に、形状を構成する複数の頂点と頂点間の結合関係が記述されたメッシュ構造(例えばVRML(Virtual Reality Modeling Language))が入力されても構わない。この場合、形状入力部72は、任意の座標における奥行きをメッシュ構造の複数の頂点からの線形関数やスプライン関数などで補間することによりデプスマップを求める。
[3]形状正規化部76
図8は、入力形状82からの形状正規化における概念図である。形状正規化部76は、形状入力部72で入力された3次元形状である入力形状82を、予め保持されている参照形状情報74を用いて正規化することにより、3次元形状情報78を生成する。
まず、形状正規化部76は入力形状82上の特徴点を抽出する。抽出する特徴点の種類は、同一平面状に存在しない4点以上の点であれば、瞳、鼻孔、口端、目尻、目頭、鼻頭、口輪郭、口中点、眉端、顔輪郭、顎のどのような部位でも良い。物体検出部14で抽出する特徴点と同じでも良いし、異なっていても良い。
入力画像84と入力形状82との対応が取れている場合には、物体検出部14が入力画像84から検出した特徴点(図8の特徴点85)をそのまま用いることができる。もし、入力画像84と入力形状82の対応が取れていない場合は、例えばパターンマッチングにより入力形状82上の特徴点を抽出する。あるいは、ポインティングデバイスを用いて人間が指定しても構わない。
先に述べたように入力形状82は画像とみなすことができる。よって、形状正規化部76は、入力形状82または入力画像84から抽出された特徴点85と、入力形状82と、予め保持してある参照形状情報74とを用いて、前述のモデル生成部16と同じ処理を行うことにより、モデルを生成することができる。
生成されたモデルのテクスチャ画像はz座標を輝度値とする画像である。形状正規化部76は、これを正規化された3次元形状である3次元形状情報78に変換する。本実施形態のモデル生成部16は、入力画像84の顔モデルを生成する際には、3次元形状形状78を用いる。
なお、参照形状情報74はどのようなものを用いてもかまわない。例えば、第1の実施例で述べた、認識対象である人間の一般的な顔の3次元形状を利用することができる。また、正規化された入力形状の平均から新しい参照形状を作成し、再度入力形状を生成しなおすという繰り返し処理を行うことで、正規化の精度を高めることもできる。
[4]本実施形態の効果
このように、第5の実施形態に係わる画像認識装置によれば、参照形状情報74を用いて個人ごとに3次元形状情報を正規化し、この正規化された個人ごとの3次元形状情報78に従って顔モデルを生成することができ、より高精度に認識を行うことが可能である。
[変更例]
画像入力部において、レンジファインダなどの3次元形状を計測可能な装置から、奥行きを画素値とする画像(デプスマップ)を入力してもかまわない。その場合、登録辞書もデプスマップから生成した特徴量を用いて類似度の計算を行う。
モデル生成部において、(3)式からカメラ運動行列を求める際に、一般化逆行列を求める方法だけでなく、いかなる方法を用いてもかまわない。例えば、ロバスト推定のひとつであるM推定を用いて、以下のようにしてカメラ運動行列を求めることができる。
Figure 0004653606
カメラ運動行列の推定誤差ε_{M}を(7)式のように定義すると、(8)式に示すように評価基準関数ρ(x)に従って推定誤差を最小にするような<M>を解いて、カメラ運動行列とする。なお「<M>」とは文字「M」の上にチルダ(tilde)を付けた文字である。評価基準関数ρ(x)はどのようなものを用いてもかまわないが、例えば(9)式などが知られている。なお(9)式のσはスケールパラメータである。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。
また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。
さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
例えば、上記各実施形態では、人間の顔を対象として画像認識を行ったが、これに代えて、他の3次元物体の画像認識に用いても良い。3次元物体としては、例えば、人間の全身、自動車、飛行機、船等の乗り物がある。
本発明の第1の実施形態の構成を示すブロック図である。 3次元モデルからのパターン画像生成における概念図である。 本発明の第2の実施形態の構成を示すブロック図である。 テクスチャ画像からのパターン画像生成における概念図である。 本発明の第3の実施形態の構成を示すブロック図である。 本発明の第4の実施形態の構成を示すブロック図である。 本発明の第5の実施形態の構成を示すブロック図である。 入力形状からの形状正規化における概念図である。
符号の説明
10 画像認識装置
12 画像入力部
14 物体検出部
16 モデル生成部
18 パターン生成部
20 特徴抽出部
22 登録辞書
24 類似度計算部

Claims (7)

  1. 3次元形状を有する物体を撮影した画像を用いて前記物体の画像認識を行う画像認識装置において、
    前記画像が入力される画像入力手段と、
    前記物体の3次元モデルの原型となる3次元形状情報を記憶しておく3次元形状情報保持手段と、
    前記入力画像と前記3次元形状情報とを用いて推定されたテクスチャ画像を生成するモデル生成手段と、
    前記生成されたテクスチャ画像に対してそれぞれ異なる2次元的な変形を加えて複数のパターン画像を生成するテクスチャ摂動手段と、
    前記複数のパターン画像から特徴量の抽出を行う特徴抽出手段と、
    前記物体の特徴量を登録しておく登録辞書保持手段と、
    前記抽出された特徴量と前記登録された物体の特徴量との類似度を計算し、この計算した類似度に基づいて前記物体の認識を行う類似度計算手段と、
    を有する
    ことを特徴とする画像認識装置。
  2. 前記モデル生成手段は、前記入力画像の特徴点と対応する前記3次元形状情報における特徴点から計算される射影行列により前記テクスチャ画像を推定する
    ことを特徴とする請求項1記載の画像認識装置。
  3. 前記特徴抽出手段は、前記パターン画像から主成分分析を行うことで特徴量を抽出する
    ことを特徴とする請求項1記載の画像認識装置。
  4. 前記類似度計算手段は、前記抽出された特徴量の一つである部分空間と前記登録された物体の特徴量の一つである部分空間の間の角度を類似度として計算する
    ことを特徴とする請求項1記載の画像認識装置。
  5. 前記3次元形状保持手段にある3次元形状情報は、
    前記物体の3次元形状を計測する形状入力手段と、
    前記物体の3次元モデルの原型となる3次元形状情報を記憶しておく参照形状情報保持手段と、
    前記3次元形状と参照形状情報とを用いて3次元形状情報を正規化する形状正規化手段により求める
    ことを特徴とした請求項1乃至請求項4の何れか1項記載の画像認識装置。
  6. 3次元形状を有する物体を撮影した画像を用いて前記物体の画像認識を行う画像認識方法において、
    前記画像が入力される画像入力ステップと、
    前記物体の3次元モデルの原型となる3次元形状情報を記憶しておく3次元形状情報保持ステップと、
    前記入力画像と前記3次元形状情報とを用いて推定されたテクスチャ画像を生成するモデル生成ステップと、
    前記生成されたテクスチャ画像に対してそれぞれ異なる2次元的な変形を加えて複数のパターン画像を生成するテクスチャ摂動ステップと、
    前記複数のパターン画像から特徴量の抽出を行う特徴抽出ステップと、
    前記物体の特徴量を登録しておく登録辞書保持ステップと、
    前記抽出された特徴量と前記登録された物体の特徴量との類似度を計算し、この計算した類似度に基づいて前記物体の認識を行う類似度計算ステップと、
    を有する
    ことを特徴とする画像認識方法。
  7. 3次元形状を有する物体を撮影した画像を用いて前記物体の画像認識を行う画像認識方法をコンピュータによって実現するプログラムにおいて、
    前記画像が入力される画像入力機能と、
    前記物体の3次元モデルの原型となる3次元形状情報を記憶しておく3次元形状情報保持機能と、
    前記入力画像と前記3次元形状情報とを用いて推定されたテクスチャ画像を生成するモデル生成機能と、
    前記生成されたテクスチャ画像に対してそれぞれ異なる2次元的な変形を加えて複数のパターン画像を生成するテクスチャ摂動機能と、
    前記複数のパターン画像から特徴量の抽出を行う特徴抽出機能と、
    前記物体の特徴量を登録しておく登録辞書保持機能と、
    前記抽出された特徴量と前記登録された物体の特徴量との類似度を計算し、この計算した類似度に基づいて前記物体の認識を行う類似度計算機能と、
    を実現する
    ことを特徴とする画像認識方法のプログラム。
JP2005268983A 2005-05-23 2005-09-15 画像認識装置、方法およびプログラム Active JP4653606B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005268983A JP4653606B2 (ja) 2005-05-23 2005-09-15 画像認識装置、方法およびプログラム
US11/438,364 US7894636B2 (en) 2005-05-23 2006-05-23 Apparatus and method for performing facial recognition from arbitrary viewing angles by texturing a 3D model

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005150213 2005-05-23
JP2005268983A JP4653606B2 (ja) 2005-05-23 2005-09-15 画像認識装置、方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2007004767A JP2007004767A (ja) 2007-01-11
JP4653606B2 true JP4653606B2 (ja) 2011-03-16

Family

ID=37463434

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005268983A Active JP4653606B2 (ja) 2005-05-23 2005-09-15 画像認識装置、方法およびプログラム

Country Status (2)

Country Link
US (1) US7894636B2 (ja)
JP (1) JP4653606B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014032605A (ja) * 2012-08-06 2014-02-20 Nec Corp 画像認識装置、画像認識方法および画像認識プログラム
US9135273B2 (en) 2012-05-24 2015-09-15 Hitachi Kokusai Electric Inc. Similar image search system
US9916495B2 (en) 2014-03-28 2018-03-13 Nec Corporation Face comparison device, method, and recording medium

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100565583C (zh) * 2004-11-12 2009-12-02 欧姆龙株式会社 人脸特征点检测装置、特征点检测装置
JP4991317B2 (ja) * 2006-02-06 2012-08-01 株式会社東芝 顔特徴点検出装置及びその方法
JP4585471B2 (ja) * 2006-03-07 2010-11-24 株式会社東芝 特徴点検出装置及びその方法
JP4093273B2 (ja) * 2006-03-13 2008-06-04 オムロン株式会社 特徴点検出装置、特徴点検出方法および特徴点検出プログラム
JP4241763B2 (ja) * 2006-05-29 2009-03-18 株式会社東芝 人物認識装置及びその方法
JP2008191816A (ja) * 2007-02-02 2008-08-21 Sony Corp 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP4829141B2 (ja) * 2007-02-09 2011-12-07 株式会社東芝 視線検出装置及びその方法
JP4950787B2 (ja) * 2007-07-12 2012-06-13 株式会社東芝 画像処理装置及びその方法
JP5018404B2 (ja) * 2007-11-01 2012-09-05 ソニー株式会社 画像識別装置および画像識別方法、並びに、プログラム
WO2009122760A1 (ja) * 2008-04-04 2009-10-08 富士フイルム株式会社 画像処理装置、画像処理方法、およびコンピュータ読取可能な媒体
JP4569670B2 (ja) * 2008-06-11 2010-10-27 ソニー株式会社 画像処理装置、画像処理方法およびプログラム
JP4613994B2 (ja) * 2008-09-16 2011-01-19 ソニー株式会社 動態推定装置、動態推定方法、プログラム
JP2010108110A (ja) * 2008-10-29 2010-05-13 Mitsubishi Electric Information Systems Corp 人物特定装置、人物特定方法及び人物特定プログラム
KR101577953B1 (ko) * 2008-12-16 2015-12-17 삼성디스플레이 주식회사 접촉 감지 기능이 있는 표시 장치 및 접촉 판단 방법
CN101770579B (zh) * 2008-12-30 2011-11-23 北大方正集团有限公司 一种图像目标的特征描述方法
JP5106459B2 (ja) * 2009-03-26 2012-12-26 株式会社東芝 立体物判定装置、立体物判定方法及び立体物判定プログラム
JP5361524B2 (ja) * 2009-05-11 2013-12-04 キヤノン株式会社 パターン認識システム及びパターン認識方法
US8803950B2 (en) * 2009-08-24 2014-08-12 Samsung Electronics Co., Ltd. Three-dimensional face capturing apparatus and method and computer-readable medium thereof
CN102006402B (zh) * 2009-08-28 2014-02-19 鸿富锦精密工业(深圳)有限公司 摄像装置及其身份识别方法
TWI473025B (zh) * 2009-09-10 2015-02-11 Hon Hai Prec Ind Co Ltd 攝像裝置及其身份識別方法
KR101633620B1 (ko) * 2010-01-04 2016-06-27 삼성전자 주식회사 영상 기반의 위치 인식을 위한 특징점 등록 장치 및 그 방법
JP5560722B2 (ja) * 2010-01-12 2014-07-30 セイコーエプソン株式会社 画像処理装置、画像表示システム、および画像処理方法
KR101697184B1 (ko) * 2010-04-20 2017-01-17 삼성전자주식회사 메쉬 생성 장치 및 그 방법, 그리고, 영상 처리 장치 및 그 방법
JP5259670B2 (ja) 2010-09-27 2013-08-07 株式会社東芝 コンテンツ要約装置およびコンテンツ要約表示装置
KR101681538B1 (ko) * 2010-10-20 2016-12-01 삼성전자주식회사 영상 처리 장치 및 방법
JP5639499B2 (ja) * 2011-02-17 2014-12-10 セコム株式会社 顔画像処理装置
JP5740210B2 (ja) 2011-06-06 2015-06-24 株式会社東芝 顔画像検索システム、及び顔画像検索方法
US9460390B1 (en) * 2011-12-21 2016-10-04 Emc Corporation Analyzing device similarity
JP6026119B2 (ja) * 2012-03-19 2016-11-16 株式会社東芝 生体情報処理装置
JP6046501B2 (ja) * 2013-01-17 2016-12-14 エヌ・ティ・ティ・コミュニケーションズ株式会社 特徴点出力装置、特徴点出力プログラム、特徴点出力方法、検索装置、検索プログラムおよび検索方法
JP6202983B2 (ja) 2013-10-22 2017-09-27 株式会社東芝 本人認証システム
FR3021443B1 (fr) * 2014-05-20 2017-10-13 Essilor Int Procede de construction d'un modele du visage d'un individu, procede et dispositif d'analyse de posture utilisant un tel modele
CN104581047A (zh) * 2014-12-15 2015-04-29 苏州福丰科技有限公司 用于监控录像的三维人脸识别方法
KR102312334B1 (ko) * 2015-02-17 2021-10-13 삼성전자주식회사 프린팅 정보를 생성하는 디바이스 및 프린팅 정보를 생성하는 방법
JP6526527B2 (ja) 2015-09-09 2019-06-05 株式会社東芝 識別装置及び認証システム
FR3060170B1 (fr) * 2016-12-14 2019-05-24 Smart Me Up Systeme de reconnaissance d'objets base sur un modele generique 3d adaptatif
CN110866864A (zh) 2018-08-27 2020-03-06 阿里巴巴集团控股有限公司 人脸姿态估计/三维人脸重构方法、装置及电子设备
JP7204504B2 (ja) * 2019-01-29 2023-01-16 株式会社Subaru 対象物確認装置
JP7380076B2 (ja) * 2019-10-23 2023-11-15 富士フイルムビジネスイノベーション株式会社 3dモデル評価システム
WO2022064644A1 (ja) * 2020-09-25 2022-03-31 日本電気株式会社 画像生成システム、画像生成方法、及び記録媒体

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6167187A (ja) * 1984-09-10 1986-04-07 Hitachi Ltd 画像処理装置
JP2000020735A (ja) * 1998-06-29 2000-01-21 Fujitsu Ltd テクスチャ画像生成装置
JP2003006645A (ja) * 2001-06-20 2003-01-10 Secom Co Ltd 本人認証用の顔画像照合装置
JP2003044873A (ja) * 2001-08-01 2003-02-14 Univ Waseda 顔の3次元モデルの作成方法及びその変形方法
JP2003317099A (ja) * 2002-02-25 2003-11-07 Toshiba Corp パターン認識用辞書生成装置及び方法、パターン認識装置及び方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5164992A (en) * 1990-11-01 1992-11-17 Massachusetts Institute Of Technology Face recognition system
US6989834B2 (en) * 1997-06-03 2006-01-24 At&T Corp. System and apparatus for customizing a computer animation wireframe
WO1999015945A2 (en) * 1997-09-23 1999-04-01 Enroute, Inc. Generating three-dimensional models of objects defined by two-dimensional image data
US6002782A (en) * 1997-11-12 1999-12-14 Unisys Corporation System and method for recognizing a 3-D object by generating a 2-D image of the object from a transformed 3-D model
AU1613599A (en) * 1997-12-01 1999-06-16 Arsev H. Eraslan Three-dimensional face identification system
US6466685B1 (en) * 1998-07-14 2002-10-15 Kabushiki Kaisha Toshiba Pattern recognition apparatus and method
JP4167390B2 (ja) 2000-11-20 2008-10-15 日本電気株式会社 物体照合方法,物体照合装置,およびそのプログラムを記録した記録媒体
US6975750B2 (en) * 2000-12-01 2005-12-13 Microsoft Corp. System and method for face recognition using synthesized training images
CN1137662C (zh) 2001-10-19 2004-02-11 清华大学 基于部件主分量分析的多模式人脸识别方法
US7330591B2 (en) * 2002-02-25 2008-02-12 Kabushiki Kaisha Toshiba Apparatus for generating a pattern recognition dictionary, a method thereof, a pattern recognition apparatus and a method thereof
JP3888676B2 (ja) * 2002-02-25 2007-03-07 株式会社東芝 3次元物体認識装置及びその方法
JP2005339288A (ja) * 2004-05-27 2005-12-08 Toshiba Corp 画像処理装置及びその方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6167187A (ja) * 1984-09-10 1986-04-07 Hitachi Ltd 画像処理装置
JP2000020735A (ja) * 1998-06-29 2000-01-21 Fujitsu Ltd テクスチャ画像生成装置
JP2003006645A (ja) * 2001-06-20 2003-01-10 Secom Co Ltd 本人認証用の顔画像照合装置
JP2003044873A (ja) * 2001-08-01 2003-02-14 Univ Waseda 顔の3次元モデルの作成方法及びその変形方法
JP2003317099A (ja) * 2002-02-25 2003-11-07 Toshiba Corp パターン認識用辞書生成装置及び方法、パターン認識装置及び方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9135273B2 (en) 2012-05-24 2015-09-15 Hitachi Kokusai Electric Inc. Similar image search system
JP2014032605A (ja) * 2012-08-06 2014-02-20 Nec Corp 画像認識装置、画像認識方法および画像認識プログラム
US9916495B2 (en) 2014-03-28 2018-03-13 Nec Corporation Face comparison device, method, and recording medium

Also Published As

Publication number Publication date
US20060269143A1 (en) 2006-11-30
US7894636B2 (en) 2011-02-22
JP2007004767A (ja) 2007-01-11

Similar Documents

Publication Publication Date Title
JP4653606B2 (ja) 画像認識装置、方法およびプログラム
US8086027B2 (en) Image processing apparatus and method
JP5812599B2 (ja) 情報処理方法及びその装置
US9747493B2 (en) Face pose rectification method and apparatus
US7221809B2 (en) Face recognition system and method
JP4167390B2 (ja) 物体照合方法,物体照合装置,およびそのプログラムを記録した記録媒体
KR101647803B1 (ko) 3차원 얼굴모델 투영을 통한 얼굴 인식 방법 및 시스템
EP1059608A2 (en) Device using eigenspace method for recognizing hand shape and position
CN105740778B (zh) 一种改进的三维人脸活体检测方法及其装置
KR101612605B1 (ko) 얼굴 특징점 추출 방법 및 이를 수행하는 장치
KR20160029629A (ko) 얼굴 인식 방법 및 장치
JP6590609B2 (ja) 画像解析装置及び画像解析方法
JP2016099982A (ja) 行動認識装置、行動学習装置、方法、及びプログラム
KR20170092533A (ko) 얼굴 포즈 교정 방법 및 장치
JP6071002B2 (ja) 信頼度取得装置、信頼度取得方法および信頼度取得プログラム
JP2012059030A (ja) 距離画像カメラを用いた人体識別方法および人体識別装置
JP4539519B2 (ja) 立体モデル生成装置および立体モデル生成方法
Bhuyan et al. Trajectory guided recognition of hand gestures having only global motions
CN111652018B (zh) 一种人脸注册方法和认证方法
JP4379459B2 (ja) 物体照合方法,物体照合装置,およびそのプログラムを記録した記録媒体
KR20190069750A (ko) 2d를 3d로 변환하는 기술과 posit 알고리즘을 이용한 증강현실 표현방법
JP2010504575A (ja) 顔を認識するための方法と装置及び顔認識モジュール
KR20230004259A (ko) 얼굴 인증 시스템
Zappa et al. Uncertainty of 3D facial features measurements and its effects on personal identification
JP6606340B2 (ja) 画像検出装置、画像検出方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090901

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100623

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101126

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101217

R151 Written notification of patent or utility model registration

Ref document number: 4653606

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131224

Year of fee payment: 3