WO2006090731A1

WO2006090731A1 - 顔画像分類方法、顔画像分類装置及び顔画像分類プログラム

Info

Publication number: WO2006090731A1
Application number: PCT/JP2006/303151
Authority: WO
Inventors: Atsushi Marugame
Original assignee: Nec Corporation
Priority date: 2005-02-23
Filing date: 2006-02-22
Publication date: 2006-08-31
Also published as: JP4924836B2; JPWO2006090731A1

Abstract

　各照明基底蓄積手段１は、各カテゴリ代表の照明基底１２を予め蓄積する。各照明方向推定手段２は、入力顔画像１１に対して、各照明空間基底１２を用いて、それぞれの誤差ノルムが最小になる照明方向１３を推定する。各誤差評価手段３は、照明基底１２と対応する照明方向１３との内積を求め、求めた内積と入力顔画像１１とのノルム誤差である誤差特徴１４をそれぞれ計算する。そして、カテゴリ識別手段４０は、各誤差特徴１４に基づいて、入力顔画像１１の識別カテゴリ１５を決定する。

Description

顔画像分類方法、顔画像分類装置及び顔画像分類プログラム技術分野

[0001] 本発明は、顔画像をカテゴリに分類する顔画像分類方法、顔画像分類装置及び顔画像分類プログラムに関する。

背景技術

[0002] 顔画像に含まれる人物の属性に従って、顔画像を何らかのカテゴリに分類することが行われている。例えば、性別、年齢別、顔輪郭形状別、頭骨形状別に顔画像を分けることが行われている。この顔画像を分類する手法は、例えば、小売業等で用いる顧客データ収集システムや、入国管理システム等のセキュリティシステムで用いられる。また、顔画像を分類する手法は、例えば、ゲームセンタでエンターテイメントを提供する場合や、携帯電話機用のアプリケーションを用いたエンターテイメントを提供する場合に必要とされる。

[0003] 例えば、特許文献 1には、顔画像に含まれる人物の目の位置や大きさに基づいて、顔画像を大人又は子供に分類する方法が記載されている。また、特許文献 2には、顔画像に含まれる人物の目、鼻及び口の配置と顔の輪郭形状とに基づいて、顔画像を「丸顔」、「面長」又は「四角」等の顔形状に分類する方法が記載されている。また、特許文献 3には、複数の顔向きの画像を用いて三次元的な情報 (特徴ベクトル)も取得し、取得した三次元的な情報を用いて性別や年代別に分類する方法が記載されている。

特許文献 1：特開 2004 - 303150号公報（段落 0049— 0052、図 10)

特許文献 2 :特開 2004— 264893号公報（段落 0084— 0122、図 2、 020- 26) 特許文献 3：特開 2003 - 242486号公報（段落 0031 -0045, 01 - 5) 発明の開示

発明が解決しょうとする課題

[0004] 特許文献 1及び特許文献 2に記載された分類方法では、 2次元の顔特徴だけを用いて顔画像を分類している。そのため、顔の奥行き方向等の特徴 (3次元の顔特徴）を利用して分類を行うことはできず、性別、年齢別又は頭骨形状別等に分類する場合には、高い分類性能を達成することができない。また、特許文献 3に記載された分類方法では、複数の顔向きの画像を用いているので、奥行き方向の情報も用いて顔画像を分類することができる。そのため、性別、年齢別又は頭骨形状別等に分類する場合であって、ある程度高い分類性能を達成することができる。しかし、複数の顔向きの画像を必要とし、処理負担やコストが大きい。また、複数の顔向きの画像を必要とするので、利用できる状況が制限されてしまう。

[0005] そこで、本発明は、顔画像に含まれる人物が属するカテゴリに顔画像を分類することができ、顔画像のカテゴリ分類を 1つの画像だけを用いて行える顔画像分類方法、顔画像分類装置及び顔画像分類プログラムを提供することを目的とする。また、本発明は、顔の奥行き情報を反映させて顔画像のカテゴリ分類を行える顔画像分類方法、顔画像分類装置及び顔画像分類プログラムを提供することを目的とする。

課題を解決するための手段

[0006] 本発明による顔画像分類方法は、顔画像を所定のカテゴリに分類する顔画像分類方法であって、顔の奥行きと顔にあてられた照明による反射の具合とを示すデータである照明空間基底データをカテゴリ毎に予め蓄積された各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定することによって、処理対象の顔画像を！、ずれかのカテゴリに分類する顔画像分類ステップとを少なくとも含むことを特徴とする。

[0007] また、顔画像分類方法は、顔画像を所定のカテゴリに分類する顔画像分類方法であって、顔の奥行きと顔にあてられた照明による反射の具合とを示すデータである照明空間基底データを、カテゴリ毎に予め蓄積する照明空間基底蓄積ステップと、蓄積した各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定することによって、処理対象の顔画像を!ヽずれかのカテゴリに分類する顔画像分類ステップとを含むものであってもよ、。

[0008] また、顔画像分類方法は、照明空間基底データに基づ、て所定の特徴量 (例えば、誤差特徴 14)を求める特徴算出ステップを含み、照明空間基底蓄積ステップで、力テゴリを代表する顔に対応する照明空間基底データを、カテゴリ毎に予め蓄積し、特徴算出ステップで、蓄積した各照明空間基底データに基づいて、処理対象の顔画像に含まれる顔とカテゴリを代表する顔との差の特徴を示す特徴量をカテゴリ毎に求め、顔画像分類ステップで、求めた各特徴量に基づいて、蓄積した各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定し、処理対象の顔画像を、特定した照明空間基底データに対応するカテゴリに分類するものであってもよ、。

[0009] また、顔画像分類方法は、処理対象の顔画像と蓄積した各照明空間基底データとに基づ!/、て、処理対象の顔画像に含まれる顔にあてられてヽる照明の方向をカテゴリ毎に推定する照明方向推定ステップを含み、特徴算出ステップで、蓄積した各照明空間基底データ及び照明の方向の推定結果に基づいて、特徴量をカテゴリ毎に求めるものであってもよい。

[0010] また、顔画像分類方法は、特徴算出ステップで、蓄積した各照明空間基底データと推定した照明の方向とに基づいて、カテゴリを代表する顔に推定した方向から照明をあてた場合の推定顔画像をカテゴリ毎に作成し、特徴量として、処理対象の顔画像と作成した推定顔画像との誤差 (例えば、誤差ノルム)をカテゴリ毎に求め、顔画像分類ステップで、求めた各誤差のうちの最小となる誤差に対応する照明空間基底データを特定するものであってもよ、。

[0011] また、顔画像分類方法は、照明方向推定ステップで、処理対象の顔画像に含まれる顔にあてられている照明の方向の推定結果として、照明の強度及び方向を示す照明ベクトル (例えば、照明強度ベクトル S)をカテゴリ毎に求め、特徴算出ステップで、求めた照明ベクトルと蓄積した各照明空間基底データとの内積を求めることによって、推定顔画像をカテゴリ毎に作成するものであってもよい。

[0012] また、顔画像分類方法は、照明空間基底蓄積ステップで、カテゴリを代表する顔として、カテゴリに含まれる顔の平均顔、又はカテゴリに含まれる顔を主成分分析して求めた主成分顔に対応する照明空間基底データを、カテゴリ毎に予め蓄積するものであってもよい。

[0013] また、顔画像分類方法は、照明空間基底蓄積ステップで、顔の三次元形状と反射率とを盛り込んだ照明空間基底データを、カテゴリ毎に予め蓄積するものであってもよい。

[0014] また、顔画像分類方法は、予めカテゴリが既知である顔画像に基づいて、所定の学習モデルを作成する学習モデル作成ステップを含み、顔画像分類ステップで、作成した学習モデルに基づ、て、処理対象の顔画像を、ずれかのカテゴリに分類するものであってもよい。

[0015] また、顔画像分類方法は、学習モデル作成ステップで、ニューラルネットワークを用

V、て、学習モデルとして所定の重み係数を求めるものであってもよ、。

[0016] また、顔画像分類方法は、学習モデル作成ステップで、サポートベクタマシンを用

V、て、学習モデルとしてサポートベクタを求めるものであってもよ!/、。

[0017] また、顔画像分類方法は、顔画像分類ステップで、学習モデルを作成する処理の逆処理を行うことによって、蓄積した各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定し、処理対象の顔画像を、特定した照明空間基底データに対応するカテゴリに分類するものであってもよ、。

[0018] 本発明による顔画像分類装置は、顔画像を所定のカテゴリに分類する顔画像分類装置であって、顔の奥行きと顔にあてられた照明による反射の具合とを示すデータである照明空間基底データをカテゴリ毎に予め蓄積された各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定することによって、処理対象の顔画像を！、ずれかのカテゴリに分類する顔画像分類手段 (例えば、カテゴリ識別手段 40によって実現される）を少なくとも備えたことを特徴とする。

[0019] また、顔画像分類装置は、顔画像を所定のカテゴリに分類する顔画像分類装置であって、顔の奥行きと顔にあてられた照明による反射の具合とを示すデータである照明空間基底データを、カテゴリ毎に予め蓄積する照明空間基底蓄積手段と、照明空間基底蓄積手段が蓄積する各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定することによって、処理対象の顔画像を、ずれかのカテゴリに分類する顔画像分類手段とを備えたものであってもよ、。

[0020] また、顔画像分類装置は、照明空間基底データに基づいて所定の特徴量を求める特徴算出手段 (例えば、誤差評価手段 3によって実現される）を備え、照明空間基底蓄積手段は、カテゴリを代表する顔に対応する照明空間基底データを、カテゴリ毎に予め蓄積し、特徴算出手段は、照明空間基底蓄積手段が蓄積する各照明空間基底データに基づいて、処理対象の顔画像に含まれる顔とカテゴリを代表する顔との差の特徴を示す特徴量をカテゴリ毎に求め、顔画像分類手段は、特徴算出手段が求めた各特徴量に基づいて、照明空間基底蓄積手段が蓄積する各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定し、処理対象の顔画像を、特定した照明空間基底データに対応するカテゴリに分類するものであってもよい。

[0021] また、顔画像分類装置は、処理対象の顔画像と照明空間基底蓄積手段が蓄積する各照明空間基底データとに基づいて、処理対象の顔画像に含まれる顔にあてられている照明の方向をカテゴリ毎に推定する照明方向推定手段を備え、特徴算出手段は、照明空間基底蓄積手段が蓄積する各照明空間基底データ、及び照明方向推定手段の推定結果に基づいて、特徴量をカテゴリ毎に求めるものであってもよい。

[0022] また、特徴算出手段は、照明空間基底蓄積手段が蓄積する各照明空間基底データと、照方向推定手段が推定した照明の方向とに基づいて、カテゴリを代表する顔に推定した方向カゝら照明をあてた場合の推定顔画像をカテゴリ毎に作成し、特徴量として、処理対象の顔画像と作成した推定顔画像との誤差をカテゴリ毎に求め、顔画像分類手段は、特徴算出手段が求めた各誤差のうちの最小となる誤差に対応する照明空間基底データを特定するものであってもよ、。

[0023] また、照明方向推定手段は、処理対象の顔画像に含まれる顔にあてられている照明の方向の推定結果として、照明の強度及び方向を示す照明ベクトルをカテゴリ毎に求め、特徴算出手段は、照明方向推定手段が求めた照明べ外ルと、照明空間基底蓄積手段が蓄積する各照明空間基底データとの内積を求めることによって、推定顔画像をカテゴリ毎に作成するものであってもよい。

[0024] また、照明空間基底蓄積手段は、カテゴリを代表する顔として、カテゴリに含まれる顔の平均顔、又はカテゴリに含まれる顔を主成分分析して求めた主成分顔に対応する照明空間基底データを、カテゴリ毎に予め蓄積するものであってもよい。

[0025] また、照明空間基底蓄積手段は、顔の三次元形状と反射率とを盛り込んだ照明空間基底データを、カテゴリ毎に予め蓄積するものであってもよい。 [0026] また、顔画像分類装置は、予めカテゴリが既知である顔画像に基づいて、所定の学習モデルを作成する学習モデル作成手段 (例えば、カテゴリ学習手段 50によって実現される)を備え、顔画像分類手段は、学習モデル作成手段が作成した学習モデルに基づ!/、て、処理対象の顔画像を!、ずれかのカテゴリに分類するものであってもよ!/ヽ

[0027] また、顔画像分類手段は、学習モデルを作成する処理の逆処理を行うことによって、照明空間基底蓄積手段が蓄積する各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定し、処理対象の顔画像を、特定した照明空間基底データに対応するカテゴリに分類するものであってもよい。

[0028] 本発明による顔画像分類プログラムは、顔画像を所定のカテゴリに分類するための顔画像分類プログラムであって、カテゴリを代表する顔に対応する、顔の奥行きと顔にあてられた照明による反射の具合とを示すデータである照明空間基底データを、カテゴリ毎に予め蓄積する蓄積手段を備えたコンピュータに、蓄積手段が蓄積する各照明空間基底データに基づいて、処理対象の顔画像に含まれる顔とカテゴリを代表する顔との差の特徴を示す特徴量をカテゴリ毎に求める処理と、求めた各特徴量に基づいて、蓄積手段が蓄積する各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定する処理と、処理対象の顔画像を、特定した照明空間基底データに対応するカテゴリに分類する処理とを実行させることを特徴とする。

[0029] また、顔画像分類プログラムは、コンピュータに、予めカテゴリが既知である顔画像に基づいて、所定の学習モデルを作成する処理と、学習モデルを作成する処理の逆処理を行うことによって、蓄積手段が蓄積する各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定する処理と、処理対象の顔画像を、特定した照明空間基底データに対応するカテゴリに分類する処理とを実行させるものであってもよ、。

[0030] 本発明では、顔画像のカテゴリ分類を 1つの画像だけを用いて顔の奥行き情報を反映させて行うために、照明空間基底と呼ばれる顔の照明の反射情報と顔の形状とを盛り込んだ情報を用いる。照明空間基底と顔画像とに基づいて照明べ外ルの推定計算をできるので、推定により求められる誤差を利用することによって、顔の反射情報 (肌の色情報を含む)と顔の形状とを利用した特徴量を用いることができる。

[0031] 具体的には、各カテゴリの代表的な顔 (平均顔や主成分顔)の照明空間基底を作る。そして、入力顔画像と各カテゴリの照明空間基底とに基づいて、誤差最小法を用いて照明方向ベクトルの推定計算を行い、推定により求められる誤差を特徴量として用いる。顔画像の対象人物が属すべきカテゴリの照明空間基底を用いて求めた誤差であれば、他のカテゴリの顔より反射情報や形状が近いので、求めた誤差力、さくなる。従って、推定により求められる誤差をカテゴリ分類の特徴量に用いることは妥当であり、求めた特徴量には顔の奥行き情報や顔の皮膚の照明反射率が反映されている。

[0032] また、本発明では、照明空間基底を事前に用意しておくことが可能であり、 1つの顔画像だけを用いてカテゴリ分けできる。また、正面から撮影した顔画像（2次元の画像 )であっても、各カテゴリに対応する照明空間基底の中で最も近い照明空間基底を選ぶことによって、近似的に顔の奥行き方向も推定できる。従って、顔の奥行き情報も反映してカテゴリ分類を行うことができる。

[0033] また、本発明では、所属カテゴリの識別は、特徴量が最も小さいカテゴリに顔画像を分類する直接的な方法を用いて、顔画像の所属カテゴリを識別する。また、本発明では、それぞれのカテゴリに対する特徴量をまとめて 1つのベクトルを作成し、ニューラルネットワークやサポートベクタマシン等の学習器を用いて学習する。そして、学習モデルを用いて顔画像の所属カテゴリを識別する。学習モデルを用いる場合、 2次元特徴も特徴量ベクトルに加えることができるので、顔画像をカテゴリ分類する際の分類性能をより高めることができる。

発明の効果

[0034] 本発明によれば、顔の肌の反射の具合や奥行き方向の形状を反映した照明空間基底データを用いて顔画像をカテゴリに分類するので、顔の肌の反射の具合や奥行き方向の形状を考慮して、顔画像をカテゴリに分類できる。また、顔の奥行き方向の形状を反映した照明空間基底データを用いるので、カテゴリ分類対象の顔を複数の方向から撮影した顔画像を用いなくても、 1つの顔画像だけを用いてカテゴリ分類を行うことができる。従って、顔画像に含まれる人物が属するカテゴリに顔画像を分類することができ、顔画像のカテゴリ分類を 1つの画像だけを用いて行うことができる。

[0035] 例えば、一般に、顔の反射の具合や顔の奥行き形状の特徴は、人物がどの人種に属するかに大きく依存する。例えば、人種別に顔画像を分類する場合、各人種の代表的な顔に基づいて作成した照明空間基底データをそれぞれ予め用意する。そして、処理対象の顔画像に含まれる人物の顔の反射の具合や奥行き形状に最も近、力テゴリに、処理対象の顔画像を分類する。各照明空間基底データにはそれぞれ各人種の顔の反射の具合や奥行き形状が反映されて、るので、処理対象の顔画像に含まれる人物の人種に対応するカテゴリに、顔画像を適切に分類することができる。

[0036] また、本発明によれば、処理対象の顔画像に含まれる顔とカテゴリを代表する顔との差の特徴を示す特徴量を用いることによって、処理対象の顔画像に対応する照明空間基底データを容易に特定することができ、処理対象の顔画像を適切なカテゴリに分類することができる。

[0037] また、本発明によれば、照明空間基底データを用いて、処理対象の顔画像に含まれている顔にあてられている照明の方向を推定 (照明べ外ルを計算)し、照明方向を考慮して顔画像をカテゴリに分類する。そのため、照明変動がある場合であっても、顔画像をカテゴリに分類できる。従って、照明の影響を吸収して、顔画像を適切にカテゴリに分類することができる。

[0038] また、本発明によれば、処理対象の顔画像と推定顔画像との誤差を特徴量として用いて、最小となる誤差を特定することによって、処理対象の顔画像に対応する照明空間基底データを容易に特定することができる。

[0039] また、本発明によれば、カテゴリを代表する顔として平均顔や主成分顔を用いるので、カテゴリの標準的な顔に対応する照明空間基底データを用いて分類でき、より適切に顔画像をカテゴリに分類できる。

[0040] また、本発明によれば、予め作成した学習モデルに基づいて、顔画像をカテゴリ〖こ分類する。そのため、各カテゴリを代表する顔の誤差特徴の統計的情報を加味した学習モデルを用いて、顔画像を分類することができる。従って、学習モデルを用いない場合と比較して、統計的情報を加味することによって、より正確に顔画像のカテゴリを識別することができる。図面の簡単な説明

[0041] [図 1]本発明による顔画像分類方法を用いた顔画像分類装置の構成の一例を示すブロック図である。

[図 2]顔画像分類装置が入力顔画像をカテゴリに分類する顔画像分類処理の一例を示す流れ図である。

[図 3]誤差特徴とカテゴリとの関係を説明する説明図である。

[図 4]顔画像分類方法を用いた顔画像分類装置の他の構成例を示すブロック図である。

[図 5]顔画像分類装置が学習モデルを作成する処理の一例を示す流れ図である。

[図 6]顔画像分類装置が入力顔画像をカテゴリに分類する顔画像分類処理の他の例を示す流れ図である。

[図 7]顔画像分類方法を用いた顔画像分類装置の更に他の構成例を示すブロック図である。

[図 8]顔画像分類方法を用いた顔画像分類装置の更に他の構成例を示すブロック図である。

[図 9]計算機がプログラムに従って入力顔画像をカテゴリに分類する顔画像分類処理の一例を示す流れ図である。

[図 10]計算機がプログラムに従って学習モデルを作成する処理の一例を示す流れ図である。

[図 11]計算機がプログラムに従って入力顔画像をカテゴリに分類する顔画像分類処理の他の例を示す流れ図である。

符号の説明

[0042] 1 照明空間基底蓄積手段

2 照明方向推定手段

3 誤差評価手段

11 顔画像

12 照明空間基底

13 照明方向 14 誤差特徴

15 識另リカテゴリ

16 学習用誤差特徴

17 教師カテゴリ

18 学習モデル

40 カテゴリ識別手段

50 カテゴリ学習手段

60 学習モデル蓄積手段

発明を実施するための最良の形態

[0043] 実施の形態 1.

以下、本発明の第 1の実施の形態を図面を参照して説明する。図 1は、本発明による顔画像分類方法を用いた顔画像分類装置の構成の一例を示すブロック図である。図 1に示すように、顔画像分類装置は、複数の照明空間基底蓄積手段 1 1〜1 n と、複数の照明方向推定手段 2— 1〜2— nと、複数の誤差評価手段 3— 1〜3— nと、カテゴリ識別手段 40とを含む。なお、本実施の形態では、照明空間基底蓄積手段 1 1〜1 n、照明方向推定手段 2— 1〜2— n及び誤差評価手段 3— 1〜3— nを包括的に表現する場合に、それぞれ照明空間基底蓄積手段 1、照明方向推定手段 2 及び誤差評価手段 3という。

[0044] 本実施の形態では、顔画像分類装置は、処理対象の顔画像を所定のカテゴリに分類する。例えば、顔画像分類装置は、顔画像に含まれる人物の性別に応じて、顔画像を「男」又は「女」のいずれかのカテゴリに分類する。また、例えば、顔画像分類装置は、顔画像に含まれる人物の年齢に応じて、その人物の年齢に対応するカテゴリに顔画像を分類する。また、例えば、顔画像分類装置は、顔画像に含まれる人物の人種に応じて、顔画像を「コ一力ソイド」、「モンゴロイド」又は「ネグロイド」のいずれかのカテゴリに分類する。

[0045] 本実施の形態では、顔画像分類装置は、例えば、コンビ-エンスストア等の店舗で顧客データを収集する際に、撮影した顧客の顔画像をカテゴリに分類する用途に用いられる。また、顔画像分類装置は、例えば、入国管理を行う際に、入国者の顔画像をカテゴリに分類する用途に用いられる。また、顔画像分類装置は、ゲームセンタで撮影した顧客の顔画像や、携帯電話機用のアプリケーションを用いてエンターティメントを提供する際に撮影した顔画像を、カテゴリに分類する用途に用いられる。

[0046] 照明空間基底蓄積手段 1は、各カテゴリを代表する顔の照明空間基底を、カテゴリ毎に予め蓄積する。「照明空間基底」とは、顔の 3次元形状と反射率とを盛り込んだ情報量であり、顔の奥行きと顔にあてられた照明による反射の具合とを示すデータである。本実施の形態では、顔画像分類装置は、顔画像を分類するための所定のカテゴリを予め設定している。また、顔画像分類装置は、照明空間基底を生成する生成手段（図示せず)を備え、各カテゴリを代表する顔 (既知のサンプルの顔)の照明空間基底を予め生成している。そして、顔画像分類装置は、生成した照明空間基底を、 1 つずつ照明空間基底蓄積手段 1にそれぞれ蓄積している。

[0047] なお、 1つのカテゴリを代表する顔力^つである場合に限らず、顔画像分類装置は、 1つのカテゴリに対して複数の「カテゴリを代表する顔」を用いて照明空間基底を生成し、照明空間基底蓄積手段 1に蓄積してもよい。この場合、顔画像分類装置は、 1つのカテゴリに対して、対応する照明空間基底蓄積手段 1を複数備える。そして、顔画像分類装置は、 1つのカテゴリに対して複数の照明空間基底を生成し、生成した各照明空間基底を対応するカテゴリの照明空間基底蓄積手段 1にそれぞれ 1つずっ蓄積する。

[0048] 照明方向推定手段 2は、入力顔画像と照明空間基底とに基づいて、カテゴリ毎に照明方向を推定する機能を備える。本実施の形態では、照明方向推定手段 2は、顔画像と照明空間基底とに基づいて、顔画像に含まれる顔にあてられている照明の強度及び方向を示す照明強度ベクトルを生成する。なお、図 1に示すように、各照明方向推定手段 2は、いずれかの照明空間基底蓄積手段 1に対応付けられており、対応する照明空間基底蓄積手段 1から照明空間基底を抽出して照明方向を推定する。例えば、照明方向推定手段 2— 1は、対応する照明空間基底蓄積手段 1 1から照明空間基底を抽出し、抽出した照明空間基底に基づいて照明方向を推定する。

[0049] 誤差評価手段 3は、照明方向推定手段 2が推定した照明方向の誤差を評価する機能を備える。本実施の形態では、誤差評価手段 3は、照明空間基底と照明強度べクトルとに基づいて、照明方向推定手段 2が推定した照明方向から、カテゴリを代表する顔に照明をあてた場合を推定した顔画像である推定顔画像をカテゴリ毎に生成する。そして、誤差評価手段 3は、入力顔画像と推定顔画像とに基づいて、入力顔画像に含まれる顔とカテゴリを代表する顔との差の特徴を示す所定の特徴量をカテゴリ毎に求める。本実施の形態では、誤差評価手段 3は、特徴量として、入力顔画像と生成した推定顔画像との誤差を求める。例えば、誤差評価手段 3は、入力顔画像と推定顔画像との所定の誤差ノルムを求める。

[0050] なお、図 1に示すように、各誤差評価手段 3は、いずれかの照明空間基底蓄積手段 1及び照明方向推定手段 2に対応付けられている。そして、誤差評価手段 3は、対応する照明空間基底蓄積手段 1及び照明方向推定手段 2から、それぞれ照明空間基底及び推定した照明方向を入力し、照明方向推定手段 2が推定した照明方向の誤差を評価する。例えば、誤差評価手段 3— 1は、対応する照明空間基底蓄積手段 1 1から照明空間基底を入力し、対応する照明方向推定手段 2— 1から照明方向を入力する。そして、誤差評価手段 3—1は、入力した照明空間基底及び照明方向に基づいて、照明方向推定手段 2— 1が推定した照明方向の誤差を評価する。

[0051] カテゴリ識別手段 40は、各誤差評価手段 3が評価した誤差を特徴量として用いて、所定の識別ルールに従って、入力顔画像が所属すべきカテゴリを識別する機能を備える。すなわち、カテゴリ識別手段 40は、誤差評価手段 3が出力する誤差特徴に基づいて、各照明空間基底蓄積手段 1が蓄積する照明空間基底のうち、いずれの照明空間基底が入力顔画像に対応するかを特定する。そして、カテゴリ識別手段 40は、入力顔画像を、特定した照明空間基底に対応するカテゴリに分類する。

[0052] 本実施の形態では、カテゴリ識別手段 40は、各誤差評価手段 3が求めた誤差ノルムを比較し、最小となる誤差ノルムを特定する。そして、カテゴリ識別手段 40は、特定した誤差ノルムに対応するカテゴリに入力顔画像を分類する。

[0053] 次に、動作について説明する。まず、顔画像分類装置が予め照明空間基底を生成し、蓄積する動作を説明する。本実施の形態では、顔画像分類装置は、ユーザの操作に従って予め m個のカテゴリを設定している。また、本実施の形態では、顔画像分類装置は、以下に示す手順に従って、 n個 (n≥m)の照明空間基底蓄積手段 1に、それぞれカテゴリを代表する顔の照明空間基底を蓄積する。

[0054] 顔画像分類装置が設定するカテゴリの数は、どのような種類のカテゴリを設定する力によって決まる。例えば、顔画像分類装置が性別を示すカテゴリを設定した場合、カテゴリの数は、「男」及び「女」の 2つになる。また、例えば、顔画像分類装置が年齢を示すカテゴリを設定した場合、年齢を何年刻みに設定したかによつてカテゴリの数が決まる。また、例えば、顔画像分類装置が人種を示すカテゴリを設定した場合、「コ一力ソイド系」、「モンゴロイド系」、「ネグロイド系」 ' "のように、分類する人種の数によつてカテゴリの数が定まる。

[0055] また、顔画像分類装置は、カテゴリ毎に、複数の「カテゴリを代表する顔」を用いてそれぞれ照明空間基底を生成してもよい。「カテゴリを代表する顔」として選択する顔は、カテゴリに実際に含まれる実在の人物の顔であってもよぐカテゴリに含まれる顔の平均顔であってもよい。また、顔画像分析装置は、カテゴリに含まれる顔を主成分分析し、分析の結果得られた上位主成分で作成した主成分顔等の人工的に作成した顔を用いて、照明空間基底を生成してもよい。

[0056] 照明空間基底は、顔の 3次元形状と反射率とを盛り込んだ情報量であり、以下のように求められる。顔画像の色及び輝度情報は顔の形状の反射によって決まるので、逆に顔の位置及び姿勢が同じであれば、複数の照明を照射して撮影した顔画像を用いることによって顔形状を推定することが可能になる。本実施の形態では、このような考え方に従って照明空間基底を生成する。

[0057] 照明空間基底のコンセプトは、顔の皮膚を完全散乱面と仮定したとき、顔画像の i番目の画素の輝度値を、式（1)を用いて表すことができると!/、うものである。

[0058] [数 1]

X^ a^ - s 式（1 )

[0059] ここで、式（1)において、 αは、画素 iにおける拡散反射率である。また、ベクトル n

= (η , η , η )は、画素 iにおける法線ベクトルである。また、ベクトル s= (s , s , s )は、画素 iにおける照明強度及び照明方向を示す照明強度ベクトルである。

[0060] 式（1)において、照明の変化に関係のない拡散反射率 αと法線ベクトル ηとは物体に不変な量であり、照明を変えたときに変動するのは照明強度ベクトル sだけである。そのため、ある特定の人物の顔にあてられている照明を変えたときに作成される画像の輝度ベクトル x= {x.}は、 B= {B , B , B }及び B = {b , } =x, y, z)を用いて、式（2)で表すことができる。

[0061] [数 2]

I = x \ X = B s = SxBx + SyBy + SzBz^s] 式（2 )

[0062] ここで、式（2)にお!/ヽて、ベクトル bは、式（3)を用いて表される。

[0063] [数 3]

= (6 A, ，み）式（3 )

[0064] 式（2)において、 Β= {Β , Β , Β }は、照明空間基底と呼ばれ、個々の顔に関する固有の情報量になる。

[0065] 実際に照明空間基底を生成する場合、顔画像分類装置は、レンジファインダ等の三次元形状取得装置を用いて、顔の奥行き方向（三次元形状)を示す距離画像を入力する。また、顔画像分類装置は、入力した距離画像に基づいて、画素 iにおける法線ベクトル η = (η , η , η )を計算する。また、顔画像分類装置は、画像の輝度値を画素 iにおける拡散反射率 αとする。そして、顔画像分類装置は、求めた法線べタトル ηと拡散反射率 αとに基づいて、式 (3)を用いて照明空間基底を計算する。また、顔画像分類装置は、求めた各照明空間基底を、それぞれ照明空間基底蓄積手段 1に蓄積する。

[0066] なお、上記に示した照明空間基底の考え方は、例えば、文献「Peter N. Belhumeur , What Is the bet of Images of an Object Under All Possible Illumination Conditions ？", International Journal of Computer Vision, Vol. no.28, p245- 260, 1998)」に記載されている。

[0067] 実用上では、顔画像分類装置は、各カテゴリのデータのスケールを統一するために、各顔に含まれる両目の位置等を検出し、検出した両目が画像上の一定位置に配置されるように、顔に含まれる両目の間の長さを拡大又は縮小する。 [0068] また、平均顔を用いて照明空間基底を生成する場合、顔画像分類装置は、各顔の距離画像を用いて平均顔を求め、求めた平均顔に基づいて法線ベクトル nを求める。また、顔画像分類装置は、各顔の 3次元データのテクスチャに基づいて拡散反射率 αを求める。そして、顔画像分類装置は、求めた法線ベクトル η及び拡散反射率 aに基づいて、式 (3)を用いて照明空間基底を求める。

[0069] また、主成分分析顔を用いて照明空間基底を生成する場合、顔画像分類装置は、各顔の距離画像を用いて主成分顔を求め、求めた主成分顔に基づいて法線べタトル nを求める。また、顔画像分類装置は、各顔の 3次元データのテクスチャに基づいて拡散反射率 αを求める。そして、顔画像分類装置は、求めた法線ベクトル η及び拡散反射率 αに基づいて、式 (3)を用いて照明空間基底を求める。

[0070] 次に、顔画像分類装置が入力顔画像をカテゴリに分類する動作を説明する。図 2 は、顔画像分類装置が入力顔画像をカテゴリに分類する顔画像分類処理の一例を示す流れ図である。

[0071] 各照明方向推定手段 2は、カテゴリ分類の処理対象の入力顔画像 11を入力する（ステップ S101)。例えば、各照明方向推定手段 2は、ユーザの指示操作に従って、カテゴリ分類対象の入力顔画像 11を入力する。また、入力顔画像 11を入力すると、各照明方向推定手段 2は、各照明空間基底蓄積手段 1から、それぞれ対応する照明空間基底データ (照明空間基底)を入力する (ステップ S 102)。

[0072] 各照明方向推定手段 2は、顔画像 11と、各照明空間基底蓄積手段 1が蓄積する照明空間基底 12— 1〜12— nとに基づいて、照明方向 13— 1〜13— nを推定する (ステツプ S103)。以下、照明空間基底 12— 1〜12— n及び照明方向 13— 1〜13— n を包括的に表現する場合に、それぞれ照明空間基底 12及び照明方向 13という。本実施の形態では、各照明方向推定手段 2は、入力顔画像 11と各照明空間基底 12とに基づいて、それぞれ照明強度ベクトル sを求めることによって、照明方向 13を推定する。

[0073] ここで、顔画像 11は、各画素の輝度値を縦に一列に並べた画像サイズ (すなわち、

(画像縦サイズ） X (画像縦サイズ)）次元の列ベクトル x= {x }であるとする。また、顔画像に対応する照明空間基底 12は、（画像サイズ X 3)次元の行列である照明空間基底行列 B= [B , B , B ] (B , B , Bは、それぞれは画像サイズ次元の列ベクトル）であるとする。また、照明方向 13は、照明の強度と方向とを示すベクトル s = (s , s , s

)であるとする。この場合、ベクトル χ= {χ }と B= [B , B , B ]とがそれぞれ同一人物に対するデータであり、顔の反射特性が理想的な状態 (例えば、顔の皮膚が完全散乱面である状態)であるとすると、式（2)の関係がそのまま成り立つことになる。

[0074] しかし、入力顔画像 11のベクトル x= {x }と照明空間基底 B= [B , B , B ]とは、同一人物に対するデータであるとは限らない。また、顔の反射特性が理想的な状態でなかったり、その他の様々な要因によって、式（2)は通常成立しないことが多い。

[0075] ここで、式 (2)は、未知数が 3であり、方程式数が画像サイズ数である連立方程式となる。そのため、ベクトル x= {x }と B= [B , B , B ]とが与えられると、照明方向推定手段 2は、所定の誤差ノルム Error ( の最小化を行うことによって、照明強度べタトル3 = (s , s , s )を推定することができる。例えば、誤差ノルムとして 2乗ノルムを用いるとすると、照明方向推定手段 2は、誤差ノルムを式 (4)を用いて求める。

[0076] [数 4] hrror{U∑) = \x- Bs 0 式（4 )

[0077] 各照明方向推定手段 2は、求めた 2乗ノルムを用いて、最小 2乗誤差推定を行うことによって、照明強度ベクトル s = (s , s , s )を推定することができる。また、各照明方向推定手段 2は、推定して求めた照明強度ベクトル s= (s , s , s )を、照明方向 13としてそれぞれ誤差評価手段 3に出力する。

[0078] 各誤差評価手段 3は、照明空間基底 Bと、照明方向推定手段 2が求めた照明強度ベクトル sとの内積 Bs (sはベクトル）を求める。また、各誤差評価手段 3は、ベクトル Xと内積（sはベクトル）との差を、所定の誤差ノルム Error ( を用いて計算する (ステップ S 104)。この場合、各誤差評価手段 3は、例えば、誤差ノルムとして、照明方向推定手段 2がベクトル s= (s , s , s )の推定に用いた誤差ノルムと同じ種類のノルムを計算してもよい。また、各誤差評価手段 3は、例えば、照明方向推定手段 2が用いた誤差ノルムと必ずしも同じノルムを用いる必要はなく、異なる種類の誤差ノルムを計算してちよい。 [0079] 例えば、照明方向推定手段 2が式 (5)に示すノルムを用いて照明方向を推定した場合であっても、誤差評価手段 3は、式 (6)に示すように、誤差ノルムとして絶対値ノルムを計算してもよい。

[0080] [数 5]

Error(L ) = x 式 ( 5 )

[0081] [数 6] 式 ( 6 )

[0082] また、各誤差評価手段 3は、求めた誤差ノルムを、誤差特徴 14— 1〜14— nとしてカテゴリ識別手段 40に出力する。以下、誤差特徴 14— 1〜14— nを包括的に表現する場合に、単に誤差特徴 14という。

[0083] 誤差評価手段 3が求める誤差ノルムは、以下に示す理由によって、カテゴリ識別の特徴量として有用である。照明方向推定手段 2が推定する照明強度ベクトル s= (s , s , s )は、各人物の顔画像ベクトル x= {x }と、カテゴリを代表する顔の照明空間基底 B= [B , B , B ]とに基づいて求めたものである。そのため、推定結果の照明強度ベクトル Sは、必ずしも正確な照明の強度と方向とを表すものとなっているとは限らない。

[0084] ここで、照明方向推定手段 2が誤差ノルムの最小化により求めた照明強度ベクトル s

= (s , s , s )の推定誤差について、カテゴリの違いによる要因力他の要因（例えば

、顔の反射特性による要因)よりも大きく寄与しているとする。この場合、入力顔画像のベクトル x= {x }と、その入力顔画像に含まれる顔が属すべきカテゴリに対応する照明空間基底 B= [B , B , B ]とに基づいて、照明強度ベクトル sを求めたとすると、誤差評価手段 3が求めた誤差ノルム Error ( は小さくなる。また、入力顔画像に含まれる顔が本来属すべきカテゴリではないが、本来属すべきカテゴリに近いカテゴリの照明空間基底 Bに基づいて照明強度ベクトル sを求めたとすると、本来属すべきカテゴリを用いた場合よりも誤差ノルムがやや大きくなる。また、本来属すべきカテゴリから遠、カテゴリの照明空間基底 Bに基づ、て照明強度べクトル sを求めたとすると、本来属すべきカテゴリを用いた場合よりも誤差ノルムが更に大きくなる。

[0085] 図 3は、誤差特徴とカテゴリとの関係を説明する説明図である。図 3において、カテゴリ 1は、入力顔画像 11が本来属すべきカテゴリである。図 3に示すように、本来属すべきカテゴリ 1の照明空間基底 Bを用いたとすると、誤差ノルム 101が小さくなる。一方、カテゴリ 1に近いカテゴリ 2の照明空間基底を用いたとすると、誤差ノルム 102がやや大きくなる。また、カテゴリ 1から遠いカテゴリ 3の照明空間基底 Bを用いたとすると、誤差ノルム 103が更に大きくなる。

[0086] このように、誤差ノルムの最小化によって小さな誤差を抑えることから、カテゴリ間の差より小さい影響 (例えば、同じカテゴリ内における個人差による影響)は、照明方向推定時の誤差最小化によって目立たなくなる。このことは、誤差ノルムを用いることがカテゴリ判別を行う際に有利に働くことを意味し、誤差ノルムカ Sカテゴリ分類の際の優れた特徴量になることを示す。図 3に示す例では、誤差ノルムの最小化による照明推定で推定される顔の領域（図 3に示す点線の円）が、各カテゴリの領域（図 3に示す実線の楕円）よりも十分小さいとき、誤差ノルムによる個人の同定が可能になる。

[0087] 更に、上記のように照明空間基底は、顔の 3次元形状と反射率とを盛り込んだ情報量であるので、 3次元の奥行き方向も含んだ特徴量になる。図 3に示すように、照明空間基底を用いることは、誤差ノルムの最小制約の中で入力顔画像に最も近い顔画像を作成して分類することと等価であるので、入力顔画像とカテゴリ代表顔画像とを直接比較してカテゴリ分類する場合と比較して、より正確な分類を行うことができる。

[0088] カテゴリ識別手段 40は、各誤差評価手段 3が出力する誤差特徴 14を用いて、入力顔画像 11のカテゴリ 15を識別する (ステップ S 105)。そして、カテゴリ識別手段 40は、識別した識別カテゴリ 15を出力する。

[0089] ステップ S105において、テゴリ識別手段 40は、予め定めたルールに従って、顔画像 11のカテゴリを識別する。例えば、カテゴリ識別手段 40は、各誤差評価手段 3が出力する誤差特徴 14に基づいて、誤差特徴 14が最も小さいカテゴリ代表の所属するカテゴリを選択する。この誤差特徴が最も小さいカテゴリを選択する方法は、各カテゴリがカテゴリ代表中心にコンパクトに集中するときや、 1つのカテゴリについて複数のカテゴリ代表に対する照明空間基底を用いることが可能であるときに有効である。 [0090] 一方、カテゴリが広範囲である場合や複数のカテゴリ代表を用いることが不可能な場合には、カテゴリ間に何らかの相関関係があることがある。この場合、カテゴリ識別手段 40は、誤差特徴 14が最も小さいカテゴリを選択するのでなぐ 2番目以降に小さいカテゴリ代表に対応するカテゴリを選択してもよい。また、カテゴリ識別手段 40は、誤差特徴 14の値だけを用いてカテゴリ分類するのでなぐ誤差特徴 14の差等も用いてカテゴリ分類してもよい。

[0091] また、例えば、カテゴリ 1がカテゴリ 3よりカテゴリ 4に近ぐカテゴリ 2がカテゴリ 3より力テゴリ 4に近いという関係が既知であるとする。この場合、カテゴリ識別手段 40は、力テゴリ 1とカテゴリ 2との誤差特徴 14が同程度で最も小さぐカテゴリ 3の誤差特徴 14 力 Sカテゴリ 4の誤差特徴 14より小さ、とすると、カテゴリ 1を選択してもよ!/、。

[0092] 以上のように、本実施の形態によれば、顔画像分類装置は、顔の反射の具合や奥行き方向の形状を反映した照明空間基底 12を用いて、入力顔画像 11をカテゴリに分類する。そのため、顔の反射の具合や奥行き方向の形状を考慮して、入力顔画像 11をカテゴリに分類することができる。また、顔の奥行き方向の形状を反映した照明空間基底 12を用いるので、カテゴリ分類対象の顔を複数の方向から撮影した顔画像を用いなくても、 1つの入力顔画像 11だけを用いてカテゴリ分類を行うことができる。従って、顔画像に含まれる人物が属するカテゴリに顔画像を分類することができ、顔画像のカテゴリ分類を 1つの画像だけを用いて行えるようにすることができる。

[0093] また、本実施の形態によれば、顔画像分類装置は、照明空間基底 12を用いて、処理対象の入力顔画像 11に含まれてヽる顔にあてられてヽる照明方向 13を推定する。そして、顔画像分類装置は、照明方向 13を考慮して入力顔画像 11をカテゴリに分類する。そのため、照明変動がある場合であっても、顔画像をカテゴリに分類できる。従って、照明の影響を吸収して、顔画像を適切にカテゴリに分類することができる。

[0094] 実施の形態 2.

次に、本発明の第 2の実施の形態を図面を参照して説明する。図 4は、顔画像分類方法を用いた顔画像分類装置の他の構成例を示すブロック図である。本実施の形態では、図 4に示すように、顔画像分類装置は、第 1の実施の形態で示した構成要素に加えて、カテゴリ学習手段 50及び学習モデル蓄積手段 60を含む。また、本実施の形態では、カテゴリ識別手段 40Aの機能が、第 1の実施の形態で示したカテゴリ識別手段 40の機能と異なる。

[0095] カテゴリ学習手段 50は、予めカテゴリが既知である顔画像 (以下、学習用顔画像ともいう）に基づいて、所定の学習器 (学習アルゴリズム）を用いて、所定の学習モデルを生成する機能を備える。例えば、カテゴリ学習手段 50は、学習器として-ユーラルネットワークを用いて、学習モデルを生成する。この場合、カテゴリ学習手段 50は、学習モデルとして、学習ユニットの所定の重み係数を求める。また、例えば、カテゴリ学習手段 50は、学習器としてサポートベクタマシンを用いて、学習モデルを生成する。この場合、カテゴリ学習手段 50は、学習モデルとして、サポートベクタと呼ばれる識別境界を作成するためのベクトルを求める。また、学習モデル蓄積手段 60は、カテゴリ学習手段 50が生成した学習モデルを蓄積する。

[0096] なお、上記に示した-ユーラルネットワークやサポートベクタマシン等の学習アルゴリズムは、例えば、文献「R.O.Duda, P.E.Hart, D.G.Stork原著，尾上守夫監訳， "パターン識別"，新技術コミュニケーションズ」に記載されている。

[0097] また、カテゴリ学習手段 50は、学習用顔画像が入力される毎に、繰り返し学習モデルを生成し、学習モデル蓄積手段 60が蓄積する学習モデルを更新させる。すなわち、顔画像分類装置は、学習用顔画像を入力する毎に繰り返し学習を行い、蓄積する学習モデルを更新している。顔画像分類装置は、ある程度繰り返し学習を行うことによって、より正確な学習モデルを生成し蓄積することができる。

[0098] カテゴリ識別手段 40Aは、学習モデル蓄積手段 60が蓄積する学習モデルを用いて、所定の識別器 (識別アルゴリズム)を用いて、入力顔画像が所属すべきカテゴリを識別する機能を備える。本実施の形態では、カテゴリ識別手段 40Aは、学習モデルと各誤差評価手段 3が求めた誤差特徴 14とを用いて、カテゴリ学習手段 50が行う学習処理の逆処理を行うことによって、入力顔画像をカテゴリに分類する。例えば、カテゴリ識別手段 40Aは、識別器として-ユーラルネットワークを用いて、学習処理の逆処理を行うことによって、入力画像のカテゴリを識別する。また、例えば、カテゴリ識別手段 40Aは、識別器としてサポートベクタマシンを用いて、学習処理の逆処理を行うこと〖こよって、入力画像のカテゴリを識別する。 [0099] なお、本実施の形態において、各照明空間基底蓄積手段 1、各照明方向推定手段 2及び各誤差評価手段 3の機能は、第 1の実施の形態で示したそれらの機能と同様である。

[0100] 次に、動作について説明する。本実施の形態では、顔画像分類装置は、カテゴリの識別に学習モデルを用いる。本実施の形態では、図 4に示すように、カテゴリが既知である顔画像 (学習用顔画像）に対して、カテゴリ識別手段 40Aは、学習用顔画像に対応するカテゴリである教師カテゴリ 16を入力し、学習モデル 17を予め作成している。また、カテゴリが未知である顔画像 (カテゴリ分類対象の顔画像)が入力されると、力テゴリ識別手段 40Aは、学習モデル蓄積手段 50が蓄積する学習モデル 17を用いて、入力顔画像 11のカテゴリを識別する。

[0101] まず、予め既知の学習用顔画像に基づいて学習モデルを生成する学習プロセスの動作を説明する。学習プロセスでは、顔画像分類装置は、予めカテゴリが既知の顔画像に対して、各照明方向推定手段 2及び各誤差評価手段 3を用いて、学習用の誤差特徴 16— 1〜16— nをそれぞれ求める。以下、学習用の誤差特徴 16— 1〜16— nを包括的に表現する場合に、単に学習用誤差特徴 16という。また、顔画像分類装置は、求めた各学習用誤差特徴 16を、所定の学習器を搭載したカテゴリ学習手段 5 0を用いて、既知のカテゴリを教師カテゴリ 17として学習する。例えば、顔画像分類装置は、ニューラルネットワークやサポートベクタマシンに代表される学習器を用いて学習する。そして、顔画像分類装置は、求めた学習モデル 18を学習モデル蓄積手段 6 0に蓄積する。

[0102] 図 5は、顔画像分類装置が学習モデルを作成する処理の一例を示す流れ図である。各照明方向推定手段 2は、カテゴリが既知である学習用の入力顔画像 (学習用顔画像)を入力する (ステップ S201)。例えば、各照明方向推定手段 2は、ユーザの指示操作に従って、学習用顔画像を入力する。また、学習用顔画像を入力すると、各照明方向推定手段 2は、各照明空間基底蓄積手段 1から、それぞれ対応する照明空間基底データ (照明空間基底)を入力する (ステップ S 202)。

[0103] 各照明方向推定手段 2は、学習用顔画像と、各照明空間基底蓄積手段 1が蓄積する照明空間基底 12とに基づいて、学習用顔画像に含まれる顔にあてられている照明の照明方向（照明強度ベクトル） 13を推定する (ステップ S203)。なお、各照明方向推定手段 2が照明方向 13を推定する処理は、第 1の実施の形態におけるステップ S 103の処理と同様である。

[0104] カテゴリ学習手段 50は、学習用顔画像に対応するカテゴリ（教師カテゴリ） 17を入力する。例えば、カテゴリ学習手段 50は、ユーザの指示操作に従って、教師カテゴリ 17を入力する。教師カテゴリ 17を入力すると、カテゴリ学習手段 50は、入力した教師カテゴリ 17と各誤差評価手段 3が出力する学習用誤差特徴 16とを用いて学習を行い、学習モデル 18を生成する（ステップ S205)。そして、カテゴリ学習手段 50は、生成した学習モデル 18を学習モデル蓄積手段 60に蓄積させる。

[0105] 例えば、学習器として-ユーラルネットワークを用いる場合、カテゴリ学習手段 50は、教師カテゴリ 17と各学習用誤差特徴 16とを用いて、学習モデル 18として学習ュニットの所定の重み係数を求める。学習器として-ユーラルネットワークを用いる場合、学習モデル 18は、入力ユニットから中間ユニット及び中間ユニットから出力ユニットへの加重和の重みに相当する。この場合、カテゴリ学習手段 50は、バックプロパゲーシヨン等の手法を用いた学習を行い、学習ユニットの重み係数を求める。

[0106] また、例えば、学習器としてサポートベクタマシンを用いる場合、カテゴリ学習手段 5 0は、教師カテゴリ 17と学習用誤差特徴 16とを用いて、学習モデル 18としてサポートベクタを求める。

[0107] 顔画像分類装置は、全ての学習用顔画像について学習を行った力否かを判断する (ステップ S206)。全ての学習用顔画像について学習を完了したと判断すると、顔画像分類装置は、処理を終了する。また、学習すべき学習用顔画像が存在すると判断すると、顔画像分類装置は、ステップ S201からステップ S206までの処理を繰り返し実行し、各カテゴリの学習モデル 18を生成して学習モデル蓄積手段 60に蓄積する。なお、顔画像分類装置は、同じカテゴリに対応する複数の学習用顔画像について繰り返し学習を行うことによって、学習モデル蓄積手段 60が蓄積する学習モデル 1 8を順次更新する。

[0108] 次に、カテゴリ分類対象の入力顔画像 11をカテゴリに分類する識別プロセスの動作を説明する。識別プロセスでは、顔画像分類装置は、各照明方向推定手段 2及び各誤差評価手段 3を用いて、識別用の誤差特徴 14をそれぞれ求める。また、顔画像分類装置は、求めた各誤差特徴 14を特徴量として、学習モデル蓄積手段 60が蓄積する学習モデル 18に基づ、て、カテゴリ識別手段 40を用いて識別カテゴリ 15を求める。

[0109] 図 6は、顔画像分類装置が入力顔画像をカテゴリに分類する顔画像分類処理の他の例を示す流れ図である。図 6において、ステップ S301からステップ S304までの処理は、第 1の実施の形態におけるステップ S101からステップ S104までの処理と同様である。

[0110] 各誤差評価手段 3が誤差特徴 14を出力すると、カテゴリ識別手段 40Aは、各誤差特徴 14と、学習モデル蓄積手段 60が蓄積する学習モデル 18とを用いて、入力顔画像 11のカテゴリを識別する (ステップ S305)。この場合、カテゴリ識別手段 40Aは、所定の識別器を用いて、カテゴリ学習手段 50が行う学習処理の逆処理を行うことによって、入力顔画像 11のカテゴリを識別する。そして、カテゴリ識別手段 40Aは、識別した識別カテゴリ 15を出力する。

[0111] なお、サポートベクタマシン等の 2分類問題を想定した学習器を用いる場合、まず、カテゴリ識別手段 40Aは、入力顔画像 11が、カテゴリ 1と、カテゴリ 1以外のカテゴリとのいずれに属するかを分類する。カテゴリ 1に属すると判断すると、カテゴリ識別手段 40Aは、入力顔画像 11をカテゴリ 1に分類する。カテゴリ 1以外に属すると判断すると、カテゴリ識別手段 40は、入力顔画像 11が、カテゴリ 2と、カテゴリ 2以外のカテゴリとのいずれに属するかを判断する。このように、カテゴリ識別手段 40Aは、 2分類問題による処理を繰り返し実行することによって、入力顔画像 11をいずれかのカテゴリに分類する。

[0112] 以上のように、本実施の形態によれば、予め所定の学習モデル 18を作成し、学習モデル 18に基づいて顔画像をいずれかのカテゴリに分類する。そのため、各カテゴリを代表する顔の誤差特徴の統計的情報を加味した学習モデルを用いて、顔画像を分類することができる。従って、学習モデルを用いない場合と比較して、統計的情報をカロ味することによって、より正確に顔画像のカテゴリを識別することができる。

[0113] なお、学習モデル 18を用いる場合、各誤差評価手段 3は、特徴量として、誤差特徴 14や学習用誤差特徴 16に加えて、顔特徴部画素の色や輝度値の差等の 2次元の顔特徴量を出力してもよい。この場合、例えば、各誤差評価手段 3は、誤差特徴 14 や学習用誤差特徴 16のベクトルと色や輝度のベクトルとを連結した連結ベクトルを出力する。そして、カテゴリ学習手段 50は、各誤差評価手段 3が出力する連結ベクトルを用いて学習モデル 18を生成する。また、カテゴリ識別手段 40Aは、各誤差評価手段 3が出力する連結ベクトルを用いて、入力顔画像 11のカテゴリを識別する。

[0114] 実施の形態 3.

次に、本発明の第 3の実施の形態を図面を参照して説明する。図 7は、顔画像分類方法を用いた顔画像分類装置の更に他の構成例を示すブロック図である。本実施の形態では、図 7に示すように、顔画像分類装置は、照明空間基底蓄積装置 10aと、照明方向推定装置 20aと、誤差評価装置 30aと、カテゴリ識別装置 40aとを含む。なお、本実施の形態は、第 1の実施の形態で示した顔画像分類方法を用いた顔画像分類装置の各構成要素を具体的に装置化したものに相当する。

[0115] 照明空間基底蓄積装置 10aは、第 1の実施の形態で示した各照明空間基底蓄積手段 1を装置化したものである。図 7に示すように、照明空間基底蓄積装置 10aは、メモリやハードディスク装置等の複数のストレージ装置 10b— l〜10b—nによって実現される。各ストレージ装置 10b— 1〜： LOb— nは、第 1の実施の形態で示した各照明空間基底蓄積手段 1と同様に、予め照明空間基底データを蓄積する。

[0116] 照明方向推定装置 20aは、第 1の実施の形態で示した各照明方向推定手段 2を装置化したものである。図 7に示すように、照明方向推定装置 20aは、複数のストレージ装置 20b— l〜20b— nと、複数の演算装置 20c— l〜20c— nとを含む。各ストレージ装置201)—1〜201)—11は、具体的には、高速アクセスが可能な DRAM等の記憶装置である。各ストレージ装置 20b— l〜20b— nは、外部から入力した顔画像フアイルと、照明空間基底蓄積装置 10aからの照明空間基底データファイルとを一時的に蓄積する。

[0117] 各演算装置 20c— l〜20c— nは、具体的には、 CPU等の装置である。各演算装置 20c— l〜20c— nは、各ストレージ装置 20b— l〜20b—nが蓄積する蓄積データにアクセスし、第 1の実施の形態で示した各照明方向推定手段 2と同様に、誤差ノルム Error( ')を最小にする照明強度ベクトル s= (s , s , s )の推定計算を行う。

X y z

[0118] 誤差評価装置 30aは、第 1の実施の形態で示した各誤差評価手段 3を装置化したものである。図 7に示すように、誤差評価装置 30aは、複数のストレージ装置 30b— 1 〜30b— nと、複数の演算装置 30c— l〜30c— nとを含む。各ストレージ装置 30b— 1〜30— nは、具体的には、高速アクセスが可能な DRAM等の記憶装置である。各ストレージ装置 30b— l〜30b— nは、入力した顔画像ファイル、照明空間基底データファイル、及び照明方向推定装置 20aが推定した照明方向ベクトル s= (s , s , s ) x y z を一時的に蓄積する。

[0119] 各演算装置 30c— l〜30c— nは、具体的には、 CPU等の装置である。各演算装置 30c— l〜30c— nは、各ストレージ装置 30b— l〜30b—nが蓄積する蓄積データにアクセスし、第 1の実施の形態で示した各誤差評価手段 3と同様に、ベクトル Xと内積（sはベクトル）との差を所定の誤差ノルム Error ( を用いて計算する。

[0120] カテゴリ識別装置 40aは、第 1の実施の形態で示したカテゴリ識別手段 40を装置化したものである。図 7に示すように、カテゴリ識別装置 40aは、ストレージ装置 40bと、演算装置 40cとを含む。ストレージ装置 40bは、具体的には、 DRAM等の記憶装置である。ストレージ装置 40bは、誤差評価装置 30aが計算した誤差ノルムデータ (誤差特徴)、及びカテゴリ識別を行うための識別処理データを蓄積する。なお、ストレージ装置 40bは、識別処理データとして、学習を行わずにカテゴリ識別を行うための固定のプログラムデータを記憶する。

[0121] 演算装置 40cは、具体的には、 CPU等の装置である。演算装置 40cは、第 1の実施の形態で示したカテゴリ識別手段 40と同様に、入力顔画像をカテゴリに分類する識別計算処理を行う。

[0122] 実施の形態 4.

次に、本発明の第 4の実施の形態を図面を参照して説明する。図 8は、顔画像分類方法を用いた顔画像分類装置の更に他の構成例を示すブロック図である。本実施の形態では、図 8に示すように、顔画像分類装置は、第 3の実施の形態で示した構成要素に加えて、カテゴリ学習装置 50a及び学習モデル蓄積装置 60aを含む。また、本実施の形態では、カテゴリ識別装置 40dの機能が、第 3の実施の形態で示したカテゴリ識別装置 40aの機能と異なる。なお、本実施の形態は、第 2の実施の形態で示した顔画像分類方法を用いた顔画像分類装置の各構成要素を具体的に装置化したものに相当する。

[0123] 本実施の形態において、照明空間基底蓄積装置 10a、照明方向推定装置 20a及び誤差評価装置 30aの機能は、第 3の実施の形態で示したそれらの機能と同様である。

[0124] カテゴリ学習装置 50aは、第 2の実施の形態で示したカテゴリ学習手段 50を装置化したものである。図 8に示すように、カテゴリ学習装置 50aは、ストレージ装置 50bと、演算装置 50cとを含む。ストレージ装置 50bは、具体的には、メモリゃノヽードディスク装置等の記憶装置である。ストレージ装置 50bは、誤差評価装置 30aが計算した誤差ノルムデータ (誤差特徴)、及び教師カテゴリデータを一時蓄積する。

[0125] 演算装置 50cは、具体的には、 CPU等の装置である。演算装置 50cは、第 2の実施の形態で示したカテゴリ学習手段 50と同様に、所定の学習器を用いて学習モデルを生成する学習計算処理を行う。

[0126] 学習モデル蓄積装置 60aは、第 2の実施の形態で示した学習モデル蓄積手段 60 を装置化したものである。図 8に示すように、学習モデル蓄積装置 60aは、メモリゃハードディスク装置等のストレージ装置 60bによって実現される。学習モデル蓄積装置 60aは、第 2の実施の形態で示した学習モデル蓄積手段 60と同様に、カテゴリ学習装置 50aが計算によって求めた学習モデルデータを蓄積する。

[0127] カテゴリ識別装置 40dは、第 2の実施の形態で示したカテゴリ識別手段 40Aを装置化したものである。図 8に示すように、カテゴリ識別装置 40dは、演算装置 40fと、ストレージ装置 40eとを含む。演算装置 40fは、具体的には、 CPU等の装置である。演算装置 40fは、誤差評価装置 30aが計算した誤差ノルムデータ (誤差特徴)と、学習モデル蓄積装置 60aが蓄積する学習モデルとを用いて、第 2の実施の形態で示したカテゴリ識別手段 40Aと同様に、入力顔画像をカテゴリに分類する識別計算処理を行う。

[0128] ストレージ装置 40eは、具体的には、 DRAM等の記憶装置である。ストレージ装置 40eは、誤差評価装置 30aが求めた各誤差特徴、及び学習モデル蓄積装置 60aからの学習モデルデータを一時記憶する。また、ストレージ装置 40eは、演算装置 40f の処理結果である識別カテゴリを含む識別処理データを蓄積する。

[0129] 実施の形態 5.

次に、本発明の第 5の実施の形態を図面を参照して説明する。本実施の形態では、第 1の実施の形態で示した顔画像分類方法による各処理を実行するための顔画像分類プログラムを、計算機上で実行可能なプログラムとして構成する。また、本実施の形態では、顔画像分類プログラムを計算機で読み取り可能な情報記憶媒体 (例えば、 CD-ROM)に格納する。

[0130] 本実施の形態では、情報記憶媒体は、例えば、コンピュータに、蓄積手段が蓄積する各照明空間基底データに基づいて、処理対象の顔画像に含まれる顔とカテゴリを代表する顔との差の特徴を示す特徴量をカテゴリ毎に求める処理と、求めた各特徴量に基づいて、蓄積手段が蓄積する各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定する処理と、処理対象の顔画像を、特定した照明空間基底データに対応するカテゴリに分類する処理とを実行させるための顔画像分類プログラムを記憶している。そして、計算機は、情報記録媒体力プログラムを読み込み、読み込んだプログラムに従って、第 1の実施の形態で示した顔画像を分類する処理を実行する。

[0131] 次に、動作について説明する。図 9は、計算機がプログラムに従って入力顔画像をカテゴリに分類する顔画像分類処理の一例を示す流れ図である。計算機は、第 1の実施の形態で示した処理と同様に分類対象の入力顔画像を入力し、バッファにロードする (ステップ S101a)。すると、計算機は、各カテゴリの代表照明空間基底データを抽出し、バッファにロードする（ステップ S102a)。

[0132] また、計算機は、ロードした入力顔画像及び各照明空間基底データに基づいて、誤差ノルムが最小となる照明方向を推定する (ステップ S103a)。また、計算機は、推定した照明方向と代表照明空間基底データとの内積を求め、入力顔画像と求めた内積との誤差ノルムを誤差特徴として計算する (ステップ S104a)。そして、計算機は、求めた全ての誤差特徴に基づいて、予め定めた識別ルールに従って、入力顔画像のカテゴリを識別する (ステップ S 105a)。 [0133] 実施の形態 6.

次に、本発明の第 6の実施の形態を図面を参照して説明する。本実施の形態では、第 2の実施の形態で示した顔画像分類方法による各処理を実行するための顔画像分類プログラムを計算機上で実行可能なプログラムとして構成する。また、本実施の形態では、顔画像分類プログラムを計算機で読み取り可能な情報記憶媒体に格納する。

[0134] 本実施の形態では、情報記憶媒体は、例えば、コンピュータに、予めカテゴリが既知である顔画像に基づいて、所定の学習モデルを作成する処理と、学習モデルを作成する処理の逆処理を行うことによって、蓄積手段が蓄積する各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定する処理と、処理対象の顔画像を、特定した照明空間基底データに対応するカテゴリに分類する処理とを実行させるための顔画像分類プログラムを記憶して、る。そして、計算機は、情報記録媒体からプログラムを読み込み、読み込んだプログラムに従つて、第 2の実施の形態で示した顔画像を分類する処理を実行する。

[0135] 次に、動作について説明する。まず、学習モデルを作成する学習プロセスの動作を説明する。図 10は、計算機がプログラムに従って学習モデルを作成する処理の一例を示す流れ図である。計算機は、第 2の実施の形態で示した処理と同様にカテゴリが既知の学習用の入力顔画像を入力し、ノッファにロードする (ステップ S 201a)。すると、計算機は、各カテゴリの代表照明空間基底データを抽出し、ノッファにロードする (ステップ S202a)。

[0136] また、計算機は、ロードした学習用顔画像及び各照明空間基底データに基づいて、誤差ノルムが最小となる照明方向を推定する (ステップ S203a)。また、計算機は、推定した照明方向と代表照明空間基底データとの内積を求め、入力顔画像と求めた内積との誤差ノルムを学習用誤差特徴として計算する (ステップ S204a)。そして、計算機は、求めた全ての学習用誤差特徴と既知のカテゴリラベルとを所定の学習器に入力し、学習モデルを構築する (ステップ S 205a)。また、計算機は、全ての学習用顔画像について学習を行った力否かを判断し (ステップ S206a)、未処理の学習用顔画像が存在する場合には、ステップ S201a以降の処理を繰り返し実行する。 [0137] 次に、入力顔画像をカテゴリに分類する分類プロセスの動作を説明する。図 11は、計算機がプログラムに従って入力顔画像をカテゴリに分類する顔画像分類処理の他の例を示す流れ図である。計算機は、第 2の実施の形態で示した処理と同様に分類対象の入力顔画像を入力し、バッファにロードする (ステップ S301a)。すると、計算機は、各カテゴリの代表照明空間基底データを抽出し、ノッファにロードする (ステツプ S302a)。

[0138] また、計算機は、ロードした入力顔画像及び各照明空間基底データに基づいて、誤差ノルムが最小となる照明方向を推定する (ステップ S303a)。また、計算機は、推定した照明方向と代表照明空間基底データとの内積を求め、入力顔画像と求めた内積との誤差ノルムを誤差特徴として計算する (ステップ S304a)。そして、計算機は、求めた全ての誤差特徴と学習モデルとに基づいて、所定の学習アルゴリズムを用いて、入力顔画像のカテゴリを識別する (ステップ S305a)。

産業上の利用可能性

[0139] 本発明は、コンビ-エンスストア等の顧客データ収集システム、入国管理システム等のセキュリティシステム、ゲームセンタや携帯電話機用のアプリケーションを用いたエンターテイメントの提供等の用途に適用できる。本発明によれば、顧客データ収集や入国管理、エンターテイメントの提供の際に、人物の顔を撮影して人物データを分類する場合にぉ、て、顔形状による影響を考慮して顔分類を行うことができる。

Claims

請求の範囲

[1] 顔画像を所定のカテゴリに分類する顔画像分類方法であって、

顔の奥行きと顔にあてられた照明による反射の具合とを示すデータである照明空間基底データをカテゴリ毎に予め蓄積された各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定することによって、前記処理対象の顔画像を！、ずれかのカテゴリに分類する顔画像分類ステップとを少なくとも含む

ことを特徴とする顔画像分類方法。

[2] 顔画像を所定のカテゴリに分類する顔画像分類方法であって、

顔の奥行きと顔にあてられた照明による反射の具合とを示すデータである照明空間基底データを、カテゴリ毎に予め蓄積する照明空間基底蓄積ステップと、

前記蓄積した各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定することによって、前記処理対象の顔画像をいずれかのカテゴリに分類する顔画像分類ステップとを含む

ことを特徴とする顔画像分類方法。

[3] 照明空間基底データに基づいて所定の特徴量を求める特徴算出ステップを含み、照明空間基底蓄積ステップで、カテゴリを代表する顔に対応する照明空間基底データを、カテゴリ毎に予め蓄積し、

前記特徴算出ステップで、前記蓄積した各照明空間基底データに基づいて、処理対象の顔画像に含まれる顔とカテゴリを代表する顔との差の特徴を示す特徴量を力テゴリ毎に求め、

顔画像分類ステップで、

前記求めた各特徴量に基づいて、前記蓄積した各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定し、

前記処理対象の顔画像を、前記特定した照明空間基底データに対応するカテゴリに分類する

請求項 2記載の顔画像分類方法。

[4] 処理対象の顔画像と蓄積した各照明空間基底データとに基づいて、処理対象の顔画像に含まれる顔にあてられている照明の方向をカテゴリ毎に推定する照明方向推定ステップを含み、

特徴算出ステップで、蓄積した各照明空間基底データ及び前記照明の方向の推定結果に基づいて、特徴量をカテゴリ毎に求める

請求項 3記載の顔画像分類方法。

[5] 特徴算出ステップで、

蓄積した各照明空間基底データと推定した照明の方向とに基づいて、カテゴリを代表する顔に前記推定した方向から照明をあてた場合の推定顔画像をカテゴリ毎に作成し、

特徴量として、処理対象の顔画像と前記作成した推定顔画像との誤差をカテゴリ毎に求め、

顔画像分類ステップで、前記求めた各誤差のうちの最小となる誤差に対応する照明空間基底データを特定する

請求項 4記載の顔画像分類方法。

[6] 照明方向推定ステップで、処理対象の顔画像に含まれる顔にあてられている照明の方向の推定結果として、照明の強度及び方向を示す照明ベクトルをカテゴリ毎に求め、

特徴算出ステップで、前記求めた照明べ外ルと蓄積した各照明空間基底データとの内積を求めることによって、推定顔画像をカテゴリ毎に作成する

請求項 5記載の顔画像分類方法。

[7] 照明空間基底蓄積ステップで、カテゴリを代表する顔として、前記カテゴリに含まれる顔の平均顔、又は前記カテゴリに含まれる顔を主成分分析して求めた主成分顔に対応する照明空間基底データを、カテゴリ毎に予め蓄積する請求項 3から請求項 6のうちのいずれか 1項に記載の顔画像分類方法。

[8] 照明空間基底蓄積ステップで、顔の三次元形状と反射率とを盛り込んだ照明空間基底データを、カテゴリ毎に予め蓄積する請求項 2から請求項 7のうちのいずれか 1 項に記載の顔画像分類方法。

[9] 予めカテゴリが既知である顔画像に基づいて、所定の学習モデルを作成する学習モデル作成ステップを含み、

顔画像分類ステップで、前記作成した学習モデルに基づいて、処理対象の顔画像を!、ずれかのカテゴリに分類する

請求項 2から請求項 8のうちのいずれか 1項に記載の顔画像分類方法。

[10] 学習モデル作成ステップで、ニューラルネットワークを用いて、学習モデルとして所定の重み係数を求める請求項 9記載の顔画像分類方法。

[11] 学習モデル作成ステップで、サポートベクタマシンを用いて、学習モデルとしてサポートベクタを求める請求項 9記載の顔画像分類方法。

[12] 顔画像分類ステップで、

学習モデルを作成する処理の逆処理を行うことによって、蓄積した各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定し、

請求項 9から請求項 11のうちのいずれか 1項に記載の顔画像分類方法。

[13] 顔画像を所定のカテゴリに分類する顔画像分類装置であって、

顔の奥行きと顔にあてられた照明による反射の具合とを示すデータである照明空間基底データをカテゴリ毎に予め蓄積された各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定することによって、前記処理対象の顔画像をいずれかのカテゴリに分類する顔画像分類手段を少なくとも備えた

ことを特徴とする顔画像分類装置。

[14] 顔画像を所定のカテゴリに分類する顔画像分類装置であって、

顔の奥行きと顔にあてられた照明による反射の具合とを示すデータである照明空間基底データを、カテゴリ毎に予め蓄積する照明空間基底蓄積手段と、

前記照明空間基底蓄積手段が蓄積する各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定することによって、前記処理対象の顔画像を！、ずれかのカテゴリに分類する顔画像分類手段とを備えたことを特徴とする顔画像分類装置。

[15] 照明空間基底データに基づいて所定の特徴量を求める特徴算出手段を備え、照明空間基底蓄積手段は、カテゴリを代表する顔に対応する照明空間基底データを、カテゴリ毎に予め蓄積し、

前記特徴算出手段は、前記照明空間基底蓄積手段が蓄積する各照明空間基底データに基づいて、処理対象の顔画像に含まれる顔とカテゴリを代表する顔との差の特徴を示す特徴量をカテゴリ毎に求め、

顔画像分類手段は、

前記特徴算出手段が求めた各特徴量に基づいて、前記照明空間基底蓄積手段が蓄積する各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定し、

請求項 14記載の顔画像分類装置。

[16] 処理対象の顔画像と照明空間基底蓄積手段が蓄積する各照明空間基底データとに基づ!/、て、処理対象の顔画像に含まれる顔にあてられてヽる照明の方向をカテゴリ毎に推定する照明方向推定手段を備え、

特徴算出手段は、前記照明空間基底蓄積手段が蓄積する各照明空間基底データ、及び前記照明方向推定手段の推定結果に基づいて、特徴量をカテゴリ毎に求める請求項 15記載の顔画像分類装置。

[17] 特徴算出手段は、

照明空間基底蓄積手段が蓄積する各照明空間基底データと、照明方向推定手段が推定した照明の方向とに基づいて、カテゴリを代表する顔に前記推定した方向から照明をあてた場合の推定顔画像をカテゴリ毎に作成し、

顔画像分類手段は、前記特徴算出手段が求めた各誤差のうちの最小となる誤差に対応する照明空間基底データを特定する請求項 16記載の顔画像分類装置。

[18] 照明方向推定手段は、処理対象の顔画像に含まれる顔にあてられている照明の方向の推定結果として、照明の強度及び方向を示す照明ベクトルをカテゴリ毎に求め、特徴算出手段は、前記照明方向推定手段が求めた照明べ外ルと、照明空間基底蓄積手段が蓄積する各照明空間基底データとの内積を求めることによって、推定顔画像をカテゴリ毎に作成する

請求項 17記載の顔画像分類装置。

[19] 照明空間基底蓄積手段は、カテゴリを代表する顔として、前記カテゴリに含まれる顔の平均顔、又は前記カテゴリに含まれる顔を主成分分析して求めた主成分顔に対応する照明空間基底データを、カテゴリ毎に予め蓄積する請求項 15から請求項 18 のうちのいずれか 1項に記載の顔画像分類装置。

[20] 照明空間基底蓄積手段は、顔の三次元形状と反射率とを盛り込んだ照明空間基底データを、カテゴリ毎に予め蓄積する請求項 14力も請求項 19のうちのいずれか 1 項に記載の顔画像分類装置。

[21] 予めカテゴリが既知である顔画像に基づいて、所定の学習モデルを作成する学習モデル作成手段を備え、

顔画像分類手段は、前記学習モデル作成手段が作成した学習モデルに基づ、て、処理対象の顔画像をいずれかのカテゴリに分類する

請求項 14から請求項 20のうちのいずれか 1項に記載の顔画像分類装置。

[22] 顔画像分類手段は、

学習モデルを作成する処理の逆処理を行うことによって、照明空間基底蓄積手段が蓄積する各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定し、

請求項 21記載の顔画像分類装置。

[23] 顔画像を所定のカテゴリに分類するための顔画像分類プログラムであって、

カテゴリを代表する顔に対応する、顔の奥行きと顔にあてられた照明による反射の具合とを示すデータである照明空間基底データを、カテゴリ毎に予め蓄積する蓄積手段を備えたコンピュータに、

前記蓄積手段が蓄積する各照明空間基底データに基づいて、処理対象の顔画像に含まれる顔とカテゴリを代表する顔との差の特徴を示す特徴量をカテゴリ毎に求める処理と、

前記求めた各特徴量に基づいて、前記蓄積手段が蓄積する各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定する処理と、

前記処理対象の顔画像を、前記特定した照明空間基底データに対応するカテゴリに分類する処理とを

実行させる顔画像分類プログラム。

コンピュータに、

予めカテゴリが既知である顔画像に基づいて、所定の学習モデルを作成する処理と、

学習モデルを作成する処理の逆処理を行うことによって、蓄積手段が蓄積する各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定する処理と、

前記処理対象の顔画像を、前記特定した照明空間基底データに対応するカテゴリに分類する処理とを実行させる

請求項 23記載の顔画像分類プログラム。