JP4468756B2 - 画像の相関ベース類似度を演算する類似度演算装置、認識装置、類似度演算方法、認識方法、照合用プログラム及びそれを記録した記録媒体 - Google Patents

画像の相関ベース類似度を演算する類似度演算装置、認識装置、類似度演算方法、認識方法、照合用プログラム及びそれを記録した記録媒体 Download PDF

Info

Publication number
JP4468756B2
JP4468756B2 JP2004209052A JP2004209052A JP4468756B2 JP 4468756 B2 JP4468756 B2 JP 4468756B2 JP 2004209052 A JP2004209052 A JP 2004209052A JP 2004209052 A JP2004209052 A JP 2004209052A JP 4468756 B2 JP4468756 B2 JP 4468756B2
Authority
JP
Japan
Prior art keywords
image
feature
region
value
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004209052A
Other languages
English (en)
Other versions
JP2006031388A (ja
Inventor
睦 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Motor Co Ltd
Original Assignee
Yamaha Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Motor Co Ltd filed Critical Yamaha Motor Co Ltd
Priority to JP2004209052A priority Critical patent/JP4468756B2/ja
Publication of JP2006031388A publication Critical patent/JP2006031388A/ja
Application granted granted Critical
Publication of JP4468756B2 publication Critical patent/JP4468756B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Collating Specific Patterns (AREA)
  • Image Analysis (AREA)

Description

この発明は、たとえば顔画像その他の画像認識に適用可能な画像類似度演算装置およびそれを利用した画像認識装置、画像類似度演算方法およびそれを利用した画像認識方法、ならびに画像照合用コンピュータプログラムおよびそれを記録した記録媒体に関する。
特定の区域への立ち入りを制限する場合、入口での個人認証が行われる。個人認証のために従来から用いられてきた装置の一つの例は、カード読取装置である。この場合、立ち入りが許可された者に予め磁気カードのような識別カードが配布される。立ち入り制限区域に立ち入ろうとする者は、入口に配置されたカード読取装置により、識別カードに記録された識別情報を読み取らせる。読み取られた識別情報が予め登録されている識別情報と一致すれば、立ち入りが許可され、入口に設置されたゲートが開かれるか、またはドアロックが解錠される。
しかし、このようなシステムでは、カードの携行を忘れたり、カードを紛失したりすると、たとえ立ち入りが許可された者であっても、入場ができなくなる。また、カードの盗難により、セキュリティが容易に破られてしまうという問題もある。
個人認証のための従来の装置の他の例は、パスワード入力装置である。この場合、立ち入りが許可された者には、予めパスワードが教示される。立ち入り制限区域に入場しようとする者は、入口に配置されたパスワード入力装置からパスワードを入力する。その入力結果が予め登録されているパスワードと一致すれば、立ち入りが許可され、入口に設置されたゲートが開かれるか、ドアロックが解錠される。
このシステムでは、カードの携行忘れや紛失のおそれはない。しかし、立ち入りが許可されている者がパスワードを失念してしまえば、やはりその者の入場が不可能になる。また、パスワードが漏洩すれば、セキュリティが破られてしまう。
最近では、人間の生体情報(バイオメトリクスデータ)を用いた個人認証技術の開発が盛んに行われている。生体情報を用いた個人認証であれば、前述のような問題はいずれも解消される。
生体情報を用いた個人認証技術には、指紋を利用するもの、虹彩を利用するもの、顔画像を利用するものなどがある。ところが、指紋を利用する場合には、指紋を予め登録しておく必要がある。そのため、抵抗感を持つ使用者が少なくない。また、虹彩を利用した個人認証のためには、使用者は、認証時に、カメラに極近接した位置に目の位置を合わさなければならない。したがって、使用者は、個人認証手続を強く意識することになり、煩わしさを感じることになる。顔画像を利用した個人認証にはこのような欠点がなく、抵抗感の少ない個人認証システムを構築できる可能性がある。
顔画像を用いた個人認証には、顔画像を認識するために、たとえばコンピュータシステムによって構成された画像認識装置が用いられる(特許文献1および特許文献2)。この画像認識装置は、立ち入り制限区域への入場が許可されている人物の顔画像の画像データまたはその画像データの特徴量データを照合データとして予め登録した照合データ記憶手段を備えている。さらに、画像認識装置は、認識対象の人物の顔画像を撮像して画像データに変換する撮像装置と、この撮像装置が出力する画像データと照合データ記憶手段の登録データとを照合する照合手段と、この照合手段による照合結果に基づいて認識結果を出力する判定手段とを有している。
照合手段は、撮像装置によって撮像された顔画像と照合データ記憶手段に登録された照合データに対応する顔画像との類似度を演算する。判定手段は、演算された類似度を所定の認識しきい値と比較し、その類似度が認識しきい値を超える場合に、認識対象の人物が照合データ記憶手段に登録されている人物の一人と一致する旨の判定結果を出力する。
顔画像の照合のための先行技術は、たとえば、下記非特許文献1に示されている。この非特許文献1に開示された先行技術では、ブースティングアルゴリズムを用いた学習によって予め選択された複数のフィルタが用いられる。この複数のフィルタは、形状、大きさおよび位置のいずれかが異なるフィルタ領域を顔画像中に設定する。フィルタ領域内は2つの部分領域に分割され、それぞれの部分領域内の画素値の総和が求められる。そして、2つの部分領域の画素値総和の差がフィルタ応答値として求められる。このフィルタ応答値が、被照合顔画像と登録顔画像との間で近似していれば、それらは同一人物の画像ペアである可能性が高いと判断でき、フィルタ応答値が近似していなければ他人の画像ペアである可能性が高いと判断できる。
このようなフィルタがブースティングによって複数個求められ、個々のフィルタを用いた識別結果(弱仮説)を重み付けして加算することにより、画像ペアの類似度が求められる。この類似度が所定のしきい値よりも高ければ、当該画像ペアは同一人物のものであると判断され、類似度が当該しきい値以下であれば、当該画像ペアは他人のものであると判断される。
特開2003−346149号公報 特開2001−266151号公報 Michael J. Jonesら著、「Face Recognition Using Boosted Local Features」、2003年、MITSUBISHI ELECTRIC RESEARCH LABORATORIES、[2004年6月28日検索]、インターネット<URL: http://www.merl.com/reports/docs/TR2003-25.pdf> Yoav Freundら著、「A decision-theoretic generalization of on-line learning and an application to boosting」、Journal of Computer and System Sciences、1997年、p.119-139
しかし、フィルタ応答値の差を特徴量として画像を認識する前述の先行技術では、必ずしも類似度(同一人物らしさ)を正確に検出できない場合がある。また、認識対象人物の撮像時の照明条件、認識対象人物の姿勢およびその表情のような変動要因に対する頑健さの点でも必ずしも十分ではない。
たとえば、同一人物の画像I1,I2のペアに関して、これらの画像中に共通に設定した第1および第2領域P1,P2内の各複数箇所の画素値が、図21に示すような値をとる場合を想定する。この場合、第1領域P1の画像が大きな変化を含んでいるのに対して、第2領域P2の画像はノイズのような微小な変化を含んでいるに過ぎない。すなわち、第1領域P1の方が明らかに重要な情報を含んでいる。
ところが、第1領域P1におけるフィルタ応答値の画像I1,I2間の差は、|(6−1)−(7−0)|=2であり、第2領域P2におけるフィルタ応答値の画像I1,I2間の差は、|(1−0)−(1−1)|=1である。フィルタ応答値は、絶対値が小さいほど同一人物らしいという意味合いを持つから、学習の過程において、フィルタ領域として、第1領域P1は選択されずに第2領域P2が選択されることになる。
これにより、類似度の演算が必ずしも正確に行えなくなるとともに、ノイズ等の変動に対して過敏な顔画像認識処理が行われるおそれがあり、変動に対する頑健さが不足するおそれがある。
そこで、この発明の目的は、一対の画像の類似度を正確に演算することができる画像類似度演算装置および画像類似度演算方法、ならびにこれらを利用した画像認識装置および画像認識方法を提供することである。
また、この発明の他の目的は、一対の画像の照合を正確に行うことができる装置としてコンピュータを動作させることができるコンピュータプログラムおよびそれを記録した記録媒体を提供することである。
上記の目的を達成するための請求項1記載の発明は、第1画像Iと第2画像Iとの類似度を求めるための装置であって、前記第1画像Iおよび第2画像I中に共通に設定可能なT個(Tは2以上の自然数)の特徴領域A(jは1≦j≦Tの自然数)のそれぞれに関して、前記第1画像I中の特徴領域A内におけるp個(pは2以上の自然数)の部分領域a(kは1≦k≦pの自然数)の領域値x1 kおよび前記第2画像I中の当該特徴領域A内における対応するp個の部分領域aの領域値x2 kに基づいて、前記第1画像Iおよび第2画像Iの当該特徴領域A内の相関値
を演算する相関値演算手段と、この相関値演算手段によって求められたT個の特徴領域Aに関する前記相関値Cに基づいて、前記第1画像Iおよび第2画像Iの類似度を演算する相関ベース類似度演算手段とを含み、前記部分領域a は、所定の一方向のみに関して特徴領域A を分割して得られる領域であり、前記相関ベース類似度演算手段は、前記相関値演算手段によって求められた相関値C を所定のしきい値θ と比較し、前記相関値C が前記しきい値θ を超えていれば、前記第1画像I および第2画像I が類似していることを表す第1弱識別値h (I 1 ,I 2 )=H を出力し、前記相関値C が前記しきい値θ 以下であれば、前記第1および第2画像I ,I が非類似であることを表す第2弱識別値h (I 1 ,I 2 )=H (ただし、H >H )を出力する比較手段と、前記T個の特徴領域A についての前記比較手段の出力値h (I 1 ,I 2 )を、重み付け係数w を乗じて線形結合することにより、前記第1画像I および第2画像I の類似度
を演算する重み付け加算手段とを含むことを特徴とする画像類似度演算装置である。
この構成によれば、第1および第2画像I1,I2中に共通に設定したT個の特徴領域A1〜ATに関する第1および第2画像I1,I2間の相関値C1〜CTに基づいて第1および第2画像I1,I2の類似度が求められる。
たとえば、前述の図21のような画像ペアについて第1および第2領域P1,P2の相関値を求める場合を考える。第1領域P1についての相関値は、1×0+6×7=43であり、第2領域P2についての相関値は、0×1+1×1=1である。相関値は、その値が大きいほど、同一人物らしいという意味合いを持つ。したがって、たとえば、学習によって特徴領域Ajを選択するとすれば、第1領域P1が優先的に選択されることになる。
このように、相関値を用いることで、学習によって特徴領域を決める際に、より重要な情報が含まれる領域を特徴領域として選択でき、ノイズ程度の情報しか含まない領域の優先度を低くすることができる。したがって、正確に類似度を求めることができ、かつ、変動に対して頑健な(ロバストな)画像類似度演算装置を実現できる。
「類似度」とは、第1および第2画像I1,I2が同一対象物の画像である蓋然性(同一対象物らしさ)、または同種対象物の画像である蓋然性(同種対象物らしさ)の度合いをいう。また、「領域値」とは、領域内の画素値の平均値であってもよいし、領域内の画素値の総和であってもよい。一般に、この領域値は、部分領域の輝度に対応する。
前記T個の特徴領域は、サイズ、形状、位置および部分領域のうちの少なくともいずれか1つが異なるものであることが好ましい。部分領域akは、特徴領域Ajをpj個に分割(たとえば、pj個に等分)して得られる領域であることが好ましい。この場合、特徴領域Ajの分割の態様が異なれば、サイズ、形状および位置が同じであっても、異なる特徴領域として取り扱われることが好ましい。
前記係数αは、α=β/p(βは定数。たとえば、β=1)のように定められてもよい。ただし、pがT個の特徴領域A〜Aに関して等しい値をとる場合(すなわち、p=p=……=p)には、α=γ(γは定数)のように定めればよい。
請求項2記載の発明は、第1画像Iと第2画像Iとの類似度を求めるための装置であって、T個(Tは2以上の自然数)の特徴領域A(jは1≦j≦Tの自然数)を、前記第1画像Iおよび第2画像I中に共通に設定する特徴領域設定手段と、この特徴領域設定手段によって設定されたT個の特徴領域Aのそれぞれに関して、前記第1画像I中の特徴領域A内におけるp個(pは2以上の自然数)の部分領域a(kは1≦k≦pの自然数)の領域値x1 kおよび前記第2画像I中の当該特徴領域A内における対応するp個の部分領域aの領域値x2 kに基づいて、前記第1画像Iおよび第2画像Iの当該特徴領域A内の相関値
を演算する相関値演算手段と、この相関値演算手段によって求められたT個の特徴領域Aに関する前記相関値Cに基づいて、前記第1画像Iおよび第2画像Iの類似度を演算する相関ベース類似度演算手段とを含み、前記部分領域a は、所定の一方向のみに関して特徴領域A を分割して得られる領域であり、前記相関ベース類似度演算手段は、前記相関値演算手段によって求められた相関値C を所定のしきい値θ と比較し、前記相関値C が前記しきい値θ を超えていれば、前記第1画像I および第2画像I が類似していることを表す第1弱識別値h (I 1 ,I 2 )=H を出力し、前記相関値C が前記しきい値θ 以下であれば、前記第1および第2画像I ,I が非類似であることを表す第2弱識別値h (I 1 ,I 2 )=H (ただし、H >H )を出力する比較手段と、前記T個の特徴領域A についての前記比較手段の出力値h (I 1 ,I 2 )を、重み付け係数w を乗じて線形結合することにより、前記第1画像I および第2画像I の類似度
を演算する重み付け加算手段とを含むことを特徴とする画像類似度演算装置である。
この構成により、請求項1の発明と同様な効果を実現できる。
また、この発明では、特徴領域設定手段によって第1および第2画像I1,I2に共通に特徴領域A1〜ATを設定し、各特徴領域Ajについて、第1および第2画像I1,I2間の相関値Cjが求められる。したがって、たとえば、第1画像I1を予め登録しておき、第2画像I2と照合する際に、第1画像I1の画像データ自体を登録しておけばよい。つまり、事前の処理を少なくすることができる。
請求項3記載の発明は、第1画像Iと第2画像Iとの類似度を求めるための装置であって、前記第1画像Iおよび第2画像I中に共通に設定可能なT個(Tは2以上の自然数)の特徴領域A(jは1≦j≦Tの自然数)のそれぞれに関して、前記第1画像I中の特徴領域A内におけるp個(pは2以上の自然数)の部分領域a(kは1≦k≦pの自然数)の領域値x1 kを、前記第1画像Iの特徴量を表す照合データとして記憶した照合データ記憶手段と、前記T個の特徴領域Aを、前記第2画像I中に設定する特徴領域設定手段と、この特徴領域設定手段によって設定されたT個の特徴領域Aのそれぞれに関して、前記第2画像I中の当該特徴領域A内におけるp個の部分領域aの領域値x2 kを前記第2画像Iの特徴量として演算する特徴量演算手段と、前記T個の特徴領域Aのそれぞれに関して、前記照合データ記憶手段に記憶された第1画像Iの領域値x1 k-と、前記特徴量演算手段によって演算された第2画像Iの領域値x2 kとに基づいて、前記第1画像Iおよび第2画像Iの当該特徴領域A内の相関値
を演算する相関値演算手段と、この相関値演算手段によって求められたT個の特徴領域Aに関する前記相関値Cに基づいて、前記第1画像Iおよび第2画像Iの類似度を演算する相関ベース類似度演算手段とを含み、前記部分領域a は、所定の一方向のみに関して特徴領域A を分割して得られる領域であり、前記相関ベース類似度演算手段は、前記相関値演算手段によって求められた相関値C を所定のしきい値θ と比較し、前記相関値C が前記しきい値θ を超えていれば、前記第1画像I および第2画像I が類似していることを表す第1弱識別値h (I 1 ,I 2 )=H を出力し、前記相関値C が前記しきい値θ 以下であれば、前記第1および第2画像I ,I が非類似であることを表す第2弱識別値h (I 1 ,I 2 )=H (ただし、H >H )を出力する比較手段と、前記T個の特徴領域A についての前記比較手段の出力値h (I 1 ,I 2 )を、重み付け係数w を乗じて線形結合することにより、前記第1画像I および第2画像I の類似度
を演算する重み付け加算手段とを含むことを特徴とする画像類似度演算装置である。
この構成により、請求項1の発明と同様な効果を実現できる。
また、この発明では、第1画像I1については、特徴領域A1〜ATの各部分領域akの領域値x1 kが照合データとして予め演算され、照合データ記憶手段に格納されている。したがって、第1および第2画像I1,I2の類似度を演算するときの演算量を少なくすることができ、短時間の処理で類似度を演算できる。これにより、第1画像I1を予め登録しておき、第2画像I2を当該装置に入力して類似度を求めるときの処理時間を短縮できる。
さらに、請求項1〜3の発明によれば、複数の特徴領域A〜Aについてそれぞれ求められた複数の相関値C〜Cを所定のしきい値θ〜θとそれぞれ比較する比較手段が設けられている。そして、複数の相関値C〜Cによる比較結果を表す弱識別値h(I1,I2)〜 h(I1,I2)を重み付けして加算することにより、第1および第2画像I,Iの類似度が求められる。
特徴領域A〜Aに対応した弱識別値h(I1,I2)〜 h(I1,I2)にそれぞれ乗じられる重み付け係数w〜wは、たとえば、学習によって求めることができる。これにより、第1および第2画像I,Iの類似/非類似の判断に有効な特徴領域の弱識別値ほど大きく重み付けすることができるから、類似度を正確に求めることができる。
さらにまた、請求項1〜3の発明によれば、所定の一方向に関して特徴領域Aを分割して部分領域aが定められ、このような部分領域aに関する相関値(単方向相関値)が求められるから、変動要因に対してより頑健な構成とすることができる。これは、画像を一次元的に分割することにより、画像の特徴を抽出しやすくなるからである。より具体的には、画像中の領域を直交する2方向(x方向およびy方向)の両方に分割(すなわち、格子状に分割)して画像の特徴を抽出する場合に比較して、その画像を第1方向(x方向)についてのみ分割して特徴を抽出し、さらにその画像を第2方向(y方向)についてのみ分割して特徴を抽出する方が、その画像からより多くの特徴を抽出することができる。つまり、画像の特徴をx方向成分およびy方向成分に成分分解して、抽出することができる。
前記部分領域aは、前記所定の一方向に直交する分割線(直線)によって特徴領域Aを分割して得られる領域であってもよい。
請求項記載の発明は、請求項1ないしのいずれかに記載の画像類似度演算装置と、この画像類似度演算装置によって演算された類似度が所定の認識しきい値を超えていれば、前記第1画像Iと第2画像Iとが類似している(より具体的には、同一対象または同種対象の画像である)と判断し、前記画像類似度演算装置によって演算された類似度が前記認識しきい値以下であれば、前記第1画像Iと第2画像Iとが非類似である(より具体的には、同一対象または同種対象の画像ではない)と判断する判断手段とを含むことを特徴とする画像認識装置である。
この構成によれば、第1および第2画像I1,I2の類似/非類似(具体的には、同一対象または同種対象の画像か否か)を、正確に演算された類似度に基づいて判定できる。しかも、類似度の演算のための構成が変動要因に対して頑健である。よって、画像の認識を正確に行うことができ、かつ、変動要因に対して頑健な画像認識装置を実現できる。
画像認識の認識対象物は、それ自体の外観が変化する物であってもよい。外観の変化の要因の例は、対象物自身の形態の変化(動的な変化や経年変化)、照度に依存する見かけ上の変化、付属物(眼鏡や化粧など)の有無による変化を含む。このような認識対象物の例は、動物(とくに人間)の顔および動物の体格を含む。「形態」とは、形状、模様もしくは色彩、またはこれらの任意の組み合わせを含む概念を意味する。
また、認識対象物は、様々な外観を呈する同種物(一定の範囲で形態等が異なる物)であってもよい。このような認識対象物の例は、果物、空き瓶、自動車、機械部品、および航空機から見た地上の物体(建造物等)を含む。
処理対象の画像の画像データは、認識対象物を撮像して画像データを出力する撮像装置(カメラ)から入力されてもよいし、メモリ、光ディスクその他の記録媒体に記録された画像データを再生する画像再生装置から入力されてもよく、通信によって取得されてもよい。
請求項記載の発明は、第1画像Iと第2画像Iとの類似度をコンピュータによって求めるための方法であって、前記コンピュータにより、T個(Tは2以上の自然数)の特徴領域A(jは1≦j≦Tの自然数)を、前記第1画像I中に設定する第1特徴領域設定ステップと、前記コンピュータにより、前記T個の特徴領域Aを前記第2画像I中に設定する第2特徴領域設定ステップと、前記コンピュータにより、前記第1画像Iに設定されたT個の特徴領域Aのそれぞれに関して、前記第1画像I中の特徴領域A内におけるp個(pは2以上の自然数)の部分領域a(kは1≦k≦pの自然数)の領域値x1 kを演算する第1領域値演算ステップと、前記コンピュータにより、前記第2画像Iに設定されたT個の特徴領域Aのそれぞれに関して、前記第2画像I中の特徴領域A内におけるp個の部分領域aの領域値x2 kを演算する第2領域値演算ステップと、前記コンピュータにより、前記T個の特徴領域Aのそれぞれに関して、前記第1画像I中の特徴領域A内におけるp個の部分領域aの領域値x1 kおよび前記第2画像I中の当該特徴領域A内における対応するp個の部分領域aの領域値x2 kに基づいて、前記第1画像Iおよび第2画像Iの当該特徴領域A内の相関値
を演算する相関値演算ステップと、前記コンピュータにより、T個の特徴領域Aに関する前記相関値Cに基づいて、前記第1画像Iおよび第2画像Iの類似度を演算する相関ベース類似度演算ステップとを含み、前記部分領域a は、所定の一方向のみに関して特徴領域A を分割して得られる領域であり、前記相関ベース類似度演算ステップは、前記コンピュータにより、特徴領域A に関して前記相関値演算ステップによって求められた相関値C を所定のしきい値θ と比較し、前記相関値C が前記しきい値θ を超えていれば、前記第1画像I および第2画像I が類似していることを表す第1弱識別値h (I 1 ,I 2 )=H を当該特徴領域A に関する識別値とし、前記相関値C が前記しきい値θ 以下であれば、前記第1および第2画像I ,I が非類似であることを表す第2弱識別値h (I 1 ,I 2 )=H を当該特徴領域A に関する識別値とする比較ステップと、前記コンピュータにより、前記T個の特徴領域A についての前記識別値h (I 1 ,I 2 )を、重み付け係数w を乗じて線形結合することにより、前記第1画像I および第2画像I の類似度
を演算する重み付け加算ステップとを含むことを特徴とする画像類似度演算方法である。
この方法により、画像間の相関を利用することにより、第1および第2画像I,Iの類似度を正確に求めることができる
また、第1および第2画像I,Iの類似/非類似の判断に有効な特徴領域ほど大きく重み付けされるように適切に係数wを定めることにより、正確な類似度を求めることができる
さらに、単方向相関値に基づいて類似度が演算されるので、変動要因に対して頑健な類似度演算が可能になる。
請求項記載の発明は、前記コンピュータにより請求項記載の画像類似度演算方法を実行する類似度演算ステップと、前記コンピュータにより、前記類似度演算ステップによって演算された類似度が所定の認識しきい値を超えていれば、前記第1画像Iと第2画像Iとが類似していると判断し、前記画像類似度演算装置によって演算された類似度が前記認識しきい値以下であれば、前記第1画像Iと第2画像Iとが非類似であると判断する判断ステップとを含むことを特徴とする画像認識方法である。
この方法により、正確でかつ変動要因に対して頑健な類似度演算処理によって求められた類似度を用いているため、第1および第2画像I,Iの類似/非類似を正確に判断でき、かつ、変動要因による影響も少なくすることができる。
請求項記載の発明は、第1画像Iと第2画像Iとを照合するための装置としてコンピュータを動作させるためのコンピュータプログラムであって、前記コンピュータプログラムは、前記コンピュータを、前記第1画像Iおよび第2画像I中に共通に設定可能なT個(Tは2以上の自然数)の特徴領域A(jは1≦j≦Tの自然数)のそれぞれに関して、前記第1画像I中の特徴領域A内におけるp個(pは2以上の自然数)の部分領域a(kは1≦k≦pの自然数)の領域値x1 kおよび前記第2画像I中の当該特徴領域A内における対応するp個の部分領域aの領域値x2 kに基づいて、前記第1画像Iおよび第2画像Iの当該特徴領域A内の相関値
を演算する相関値演算手段、ならびにこの相関値演算手段によって求められたT個の特徴領域Aに関する前記相関値Cに基づいて、前記第1画像Iおよび第2画像Iの類似度を演算する相関ベース類似度演算手段として機能させるものであり、前記部分領域a は、所定の一方向のみに関して特徴領域A を分割して得られる領域であり、前記相関ベース類似度演算手段は、前記相関値演算手段によって求められた相関値C を所定のしきい値θ と比較し、前記相関値C が前記しきい値θ を超えていれば、前記第1画像I および第2画像I が類似していることを表す第1弱識別値h (I 1 ,I 2 )=H を出力し、前記相関値C が前記しきい値θ 以下であれば、前記第1および第2画像I ,I が非類似であることを表す第2弱識別値h (I 1 ,I 2 )=H (ただし、H >H )を出力する比較手段と、前記T個の特徴領域A についての前記比較手段の出力値h (I 1 ,I 2 )を、重み付け係数w を乗じて線形結合することにより、前記第1画像I および第2画像I の類似度
を演算する重み付け加算手段とを含むものであることを特徴とするコンピュータプログラムである。
このコンピュータプログラムをコンピュータ上で実行することにより、請求項1の画像類似度演算装置を構成できる。
請求項記載の発明は、第1画像Iと第2画像Iとを照合するための装置としてコンピュータを動作させるためのコンピュータプログラムであって、前記コンピュータプログラムは、前記コンピュータを、T個(Tは2以上の自然数)の特徴領域A(jは1≦j≦Tの自然数)を、前記第1画像Iおよび第2画像I中に共通に設定する特徴領域設定手段、この特徴領域設定手段によって設定されたT個の特徴領域Aのそれぞれに関して、前記第1画像I中の特徴領域A内におけるp個(pは2以上の自然数)の部分領域a(kは1≦k≦pの自然数)の領域値x1 kおよび前記第2画像I中の当該特徴領域A内における対応するp個の部分領域aの領域値x2 kに基づいて、前記第1画像Iおよび第2画像Iの当該特徴領域A内の相関値
を演算する相関値演算手段、ならびにこの相関値演算手段によって求められたT個の特徴領域Aに関する前記相関値Cに基づいて、前記第1画像Iおよび第2画像Iの類似度を演算する相関ベース類似度演算手段として機能させるものであり、前記部分領域a は、所定の一方向のみに関して特徴領域A を分割して得られる領域であり、前記相関ベース類似度演算手段は、前記相関値演算手段によって求められた相関値C を所定のしきい値θ と比較し、前記相関値C が前記しきい値θ を超えていれば、前記第1画像I および第2画像I が類似していることを表す第1弱識別値h (I 1 ,I 2 )=H を出力し、前記相関値C が前記しきい値θ 以下であれば、前記第1および第2画像I ,I が非類似であることを表す第2弱識別値h (I 1 ,I 2 )=H (ただし、H >H )を出力する比較手段と、前記T個の特徴領域A についての前記比較手段の出力値h (I 1 ,I 2 )を、重み付け係数w を乗じて線形結合することにより、前記第1画像I および第2画像I の類似度
を演算する重み付け加算手段とを含むものであることを特徴とするコンピュータプログラムである。
このコンピュータプログラムをコンピュータ上で実行することにより、請求項2の画像類似度演算装置を構成できる。
請求項記載の発明は、第1画像Iと第2画像Iとを照合するための装置としてコンピュータを動作させるためのコンピュータプログラムであって、前記コンピュータは、前記第1画像Iおよび第2画像I中に共通に設定可能なT個(Tは2以上の自然数)の特徴領域A(jは1≦j≦Tの自然数)のそれぞれに関して、前記第1画像I中の特徴領域A内におけるp個(pは2以上の自然数)の部分領域a(kは1≦k≦pの自然数)の領域値x1 kを、前記第1画像Iの特徴量を表す照合データとして記憶した照合データ記憶手段を含み、前記コンピュータプログラムは、前記コンピュータを、前記T個の特徴領域Aを、前記第2画像I中に設定する特徴領域設定手段、この特徴領域設定手段によって設定されたT個の特徴領域Aのそれぞれに関して、前記第2画像I中の当該特徴領域A内におけるp個の部分領域aの領域値x2 kを前記第2画像Iの特徴量として演算する特徴量演算手段、前記T個の特徴領域Aのそれぞれに関して、前記照合データ記憶手段に記憶された第1画像Iの領域値x1 k-と、前記特徴量演算手段によって演算された第2画像Iの領域値x2 kとに基づいて、前記第1画像Iおよび第2画像Iの当該特徴領域A内の相関値
を演算する相関値演算手段、ならびにこの相関値演算手段によって求められたT個の特徴領域Aに関する前記相関値Cに基づいて、前記第1画像Iおよび第2画像Iの類似度を演算する相関ベース類似度演算手段として機能させるものであり、前記部分領域a は、所定の一方向のみに関して特徴領域A を分割して得られる領域であり、前記相関ベース類似度演算手段は、前記相関値演算手段によって求められた相関値C を所定のしきい値θ と比較し、前記相関値C が前記しきい値θ を超えていれば、前記第1画像I および第2画像I が類似していることを表す第1弱識別値h (I 1 ,I 2 )=H を出力し、前記相関値C が前記しきい値θ 以下であれば、前記第1および第2画像I ,I が非類似であることを表す第2弱識別値h (I 1 ,I 2 )=H (ただし、H >H )を出力する比較手段と、前記T個の特徴領域A についての前記比較手段の出力値h (I 1 ,I 2 )を、重み付け係数w を乗じて線形結合することにより、前記第1画像I および第2画像I の類似度
を演算する重み付け加算手段とを含むものであることを特徴とするコンピュータプログラムである。
このコンピュータプログラムをコンピュータ上で実行することにより、請求項3の画像類似度演算装置を構成できる
請求項10記載の発明は、前記コンピュータを、さらに、前記重み付け加算手段によって演算された類似度が所定の認識しきい値を超えていれば、前記第1画像Iと第2画像Iとが類似していると判断し、前記画像類似度演算装置によって演算された類似度が前記認識しきい値以下であれば、前記第1画像Iと第2画像Iとが非類似であると判断する判断手段として機能させることを特徴とする請求項ないしのいずれかに記載のコンピュータプログラムである。
このコンピュータプログラムをコンピュータ上で実行することにより、請求項の画像認識装置を構成できる。
請求項11記載の発明は、請求項ないし10のいずれかに記載のコンピュータプログラムが記録されたコンピュータ読取可能な記録媒体である。
この記録媒体に記録されたコンピュータプログラムをコンピュータに実行させることにより、このコンピュータを前述のような画像認識装置として機能させることができる。
コンピュータプログラムは、どのような形式で記録媒体に記録されていてもよく、たとえば、圧縮した形式で記録されていてもよい。記録媒体には、磁気記録媒体、光記録媒体および光磁気記録媒体を含む任意の記録形式のものを適用できる。
以下では、この発明の実施の形態を、添付図面を参照して詳細に説明する。
図1は、この発明の一実施形態に係る個人認証システムの構成を示す図解的なブロック図である。この個人認証システムは、たとえば、立ち入り制限がされた特定の区域への入場管理のために用いられる。この個人認証システムは、当該立ち入り制限区域への入口に配置され、この入口に現れた者の顔画像を撮像する撮像装置としてのカメラ1と、このカメラ1にケーブル2を介して接続されたコンピュータ3と、入口に配置された表示器4と、入口に設置されたゲートを開閉(またはドアロックを解錠/施錠)するゲート開閉器7とを備えている。
コンピュータ3には、マンマシンインタフェースとしてのディスプレイ5および入力操作部6(たとえば、キーボードおよびマウス)が接続されている。表示器4は、たとえば、コンピュータ3からの指令信号を受けてメッセージを表示することができる二次元表示デバイスであってもよいし、たとえば、コンピュータ3によって制御される複数色のLEDランプを備えたランプ表示デバイスであってもよい。ゲート開閉器7は、コンピュータ3からの制御信号に応じて、ゲートを開閉(またはドアロックを解錠/施錠)し、入口に現れた者の入場を許可したり禁止したりする。
コンピュータ3は、CPU10、ROM11およびRAM12を備え、これらがバス13に接続された一般的な構成のものである。バス13には、さらに、外部記憶装置としてのハードディスクドライブ(HDD)14、記録媒体の一例であるCD−ROM8に記録されたデータを読み取ることができる記録媒体読取装置としてのCD−ROMドライブ15、ディスプレイ5の制御のためのディスプレイコントローラ16、および入力操作部6の制御のための入力部コントローラ17(たとえば、キーボードコントローラおよびマウスコントローラ)が接続されている。また、カメラ1から生成される撮像画像に対応した画像データを受け入れるための画像入力インタフェース部18、表示器4に制御信号を出力するための表示制御インタフェース部19、およびゲート開閉器7に制御信号を出力するためのゲート開閉制御インタフェース部20が、バス13に接続されている。
当該立ち入り制限区域への立ち入りが許可された者の顔画像は、たとえば、予めカメラ1によって撮像され、その顔画像に対応した個別照合データが予めハードディスクドライブ14内の所定の記憶領域である照合データ記憶部25に登録される。この照合データ記憶部25には、後述するように、各人の個別照合データを代表する代表照合データが併せて登録される。
一方、入口に現れた者の画像は、カメラ1によって撮像される。撮像された画像を表す画像データは、コンピュータ3へと伝送され、この画像データからその者の顔画像データが抽出される。この抽出された顔画像データが、ハードディスクドライブ14の照合データ記憶部25に予め登録されている個別照合データと照合される。この照合の結果、個別照合データの形態で登録されたいずれかの顔画像と入口に現れた者の顔画像とが符合すれば、すなわち、両顔画像の類似度が予め定める認識しきい値を超えていれば、コンピュータ3は、ゲート開閉器7によってゲートを開き(またはドアロックを解錠し)、その者の入場を許可する。
コンピュータ3によるこのような働きを実現するためのコンピュータプログラムは、たとえば、記録媒体の一例であるCD−ROM8に記録されて提供されてもよい。この場合、このCD−ROM8をCD−ROMドライブ15に装填し、所定のインストール操作を行って、当該コンピュータプログラムをコンピュータ3にインストールすることによって、コンピュータ3は、前述のような機能を実現可能となる。
インストールされたそのコンピュータプログラムをコンピュータ3上で実行すると、たとえば、図2に示すような画面がディスプレイ5に表示される。前記コンピュータプログラムの実行中のコンピュータ3は、画像認識装置として動作し、立ち入りが許可された者の顔画像を登録するための登録モードと、カメラ1によって撮像された画像から顔画像を抽出して認識処理を行う認識モードとのいずれかのモードで動作する。
前記立ち入り制限区域への立ち入りが許可された者の顔画像の個別照合データを照合データ記憶部25に登録するときには、操作者は、入力操作部6を操作して、コンピュータ3を登録モードで動作させる。この状態で、立ち入りが許可された者がカメラ1によって撮像される。このときにカメラ1から生成される画像データがコンピュータ3へと伝送され、RAM12内の記憶領域(必要に応じてさらにハードディスクドライブ14内の仮想メモリ領域)で構成される画像メモリ12aに格納される。さらに、その画像データから顔画像データが抽出される。この抽出された顔画像データに対応する個別照合データが照合データ記憶部25に登録される。個別照合データは、顔画像データ自体であってもよいし、顔画像データから抽出された所定の特徴量を表す特徴量データであってもよい。
人間の顔画像は、表情によって様々に変化し、眼鏡のような付属物の有無によっても大きく変化するうえ、撮像条件(照度等)の影響も受ける。そこで、立ち入りが許可された者の個別照合データの登録時には、その者に様々な表情をさせて顔画像を撮像したり、付属物有りおよび付属物なしの状態でそれぞれ撮像を行ったり、様々な撮像条件での撮像を行ったりする。こうして、各人に対して複数枚(たとえば、50枚〜100枚)の顔画像が撮像され、個々の顔画像に対応した個別照合データが照合データ記憶部25に登録される。
以下では、前述のようにして個別照合データの登録を終えた者を、「登録者」といい、個別照合データの登録をしていない者を「未登録者」という。
図3は、前記コンピュータプログラムの実行状態におけるコンピュータ3の機能的な構成を説明するためのブロック図である。コンピュータ3は、CPU10によって前記コンピュータプログラムを実行させることにより、このCPU10がROM11およびRAM12と協働することによって実現される複数の機能処理部を実質的に備えることになる。この複数の機能処理部は、カメラ1が生成した画像データから顔画像の領域を抽出して顔画像データを生成する顔画像検出部30と、この顔画像検出部30が抽出した顔画像データを予め登録された個別照合データと照合する顔認識処理部40とを備えている。
顔画像検出部30は、入力画像データから顔画像領域を切り出し、さらに、サイズおよび傾き(左右の傾き)を正規化した顔画像データを被照合顔画像データとして出力する。切り出される顔画像領域は、たとえば、髪型の影響を受けにくく、かつ、発話時の顎の上下動の影響を受けにくい領域である。より具体的には、たとえば、左右方向に関しては両目尻の間を含み、上下方向に関しては眉から口元までの範囲を含む矩形領域が顔画像領域として切り出される。正規化された顔画像データは、たとえば、32画素×32画素の正方形画像に対応する。
顔認識処理部40は、被照合顔画像データといずれかの個別照合データとの間に一定程度以上の符合が見られれば、被照合顔画像データが当該個別照合データに対応する登録者の顔画像であると判定する。この場合、カメラ1によって撮像された者は登録者であると判定され、コンピュータ3は、ゲート開閉器7によってゲートを開き(または、ドアロックを解錠し)、その者の入場を許可する。一方、顔認識処理部40は、被照合顔画像データと一定程度以上の符合が見られる個別照合データが照合データ記憶部25に登録されていなければ、被照合顔画像は登録者の顔画像ではないと判定する。この場合、カメラ1によって撮像された者は未登録者であると判定され、コンピュータ3は、ゲート開閉器7によってゲートを閉状態に保持(または、ドアロックを施錠状態に保持)し、その者の入場を禁止する。
顔認識処理部40は、被照合顔画像と照合データ(個別照合データまたは代表照合データ)に対応した顔画像との類似度(同一人物らしさ)を演算する類似度演算部41と、照合データ記憶部25に登録されている照合データのうちいずれの照合データを照合対象とするかを選択する照合データ選択部42と、類似度演算部41によって演算された類似度を所定の認識しきい値と比較することによって被照合顔画像が登録者の顔画像かどうかを判断する判断部43(判断手段、判断ステップ)とを有している。
判断部43は、複数の個別照合データに対して求められた類似度のうちの最高値(最高類似度)が前記認識しきい値を超えていれば、被照合顔画像の人物が登録者であると判断し、そのことを表す認識結果データを出力する。認識結果データは、当該最高類似度の個別照合データに対応する登録者を特定するための情報(たとえば、当該登録者の氏名情報や登録番号情報)を含んでいてもよい。この認識結果データを受けて、表示器4には、認識結果が表示される。この表示は、単に、登録者である旨を表す表示であってもよく、登録者の特定情報(たとえば氏名)の表示であってもよい。
一方、類似度が前記認識しきい値を超える個別照合データが存在しなければ、判断部43は、被照合顔画像の人物が登録者でないと判断し、その旨を表す識別結果データが出力される。この場合、表示器4は、その人物の登録が確認できない旨を表示する。
類似度演算部41は、照合データ記憶部25に格納された照合データと、ハードディスクドライブ14内の記憶領域で構成された照合用辞書記憶部26に格納された照合用特徴辞書とに基づいて、被照合顔画像と登録された顔画像(照合データの形式で記憶されたもの)との類似度を演算する。照合用特徴辞書は、2つの画像の類似度を演算する際の指標となるデータ(照合用特徴データ)を一定のデータ構造で保持している。類似度演算部41は、照合用特徴辞書に保持された照合用特徴データに基づいて、被照合顔画像データから特徴量を抽出し、かつ照合データと照合する。
図4は、照合データ記憶部25における照合データの登録状態を説明するための図解図である。この図4には、m人の登録者があり、各登録者に対してn枚の顔画像に対応したn個の個別照合データを登録した例が示されている。より具体的には、個々の登録者に対して登録番号1,2,……,mが付与され、この登録番号にそれぞれ対応して、登録者の名前(名前1、名前2、……、名前m)と、各1個の代表照合データ(代表照合データ1、代表照合データ2、……、代表照合データm)と、各n個の個別照合データ(個別照合データ1−1,1−2,…,1−n;2−1,2−2,…,2−n;……;m−1,m−2,…,m−n)が登録されている。むろん、登録者毎に個別照合データの数が異なっていても差し支えない。
各登録者の代表照合データは、当該登録者に対応したn個の個別照合データを代表する照合データである。より具体的には、各登録者の代表照合データは、当該登録者に対応して登録されたn個の個別照合データの平均値データであってもよい。
このような代表照合データは、個別照合データを照合データ記憶部25に登録する際に、CPU10などの働きによって自動で生成されて照合データ記憶部25に書き込まれてもよい。また、代表照合データは、登録される顔画像の画像データまたは個別照合データを用いた操作者の手動操作によって作成されたうえで、同じく操作者の手動操作によって照合データ記憶部25に書き込まれてもよい。
図5は、照合データ記憶部25における照合データの登録状態をより直感的に表した図である。この例では、9人の登録者A〜Iに対して、各1枚の代表顔画像データが代表照合データとして登録されており、さらに、各3枚の顔画像データが個別照合データとして登録されている。この例のように、各登録者に対して複数の顔画像データを個別照合データとして登録し、この複数の顔画像データの平均値演算によって得られる代表顔画像データを代表照合データとして登録してもよい。また、画像データ自体ではなく、類似度演算部41による類似度の演算に用いられる特徴量を予め個々の顔画像から抽出し、この特徴量を個別照合データとして照合データ記憶部25に登録しておき、各登録者に対する個別照合データ(特徴量)の平均値を代表照合データとして照合データ記憶部25に登録してもよい。
このように、照合データ記憶部25は、被照合顔画像データと照合される照合データを記憶する照合データ記憶手段としての働きを有している。
図6は、顔認識処理部40による処理の一例を説明するためのフローチャートである。被照合顔画像データが顔認識処理部40に入力されると、照合データ選択部42は、照合データ記憶部25を参照して、登録者の代表照合データを順に選択する(ステップS1)。類似度演算部41は、照合データ選択部42によって選択された代表照合データに対応する代表顔画像と、被照合顔画像との類似度を演算し、RAM12内の代表類似度記憶領域12b(図1および図3参照)に書き込む(ステップS2)。 こうして、照合データ記憶部25に登録されたすべての登録者の代表照合データに関して類似度が求まると、照合データ選択部42は、被照合顔画像データと照合すべき個別照合データを抽出するための処理を実行する(ステップS3)。この処理は、端的には、被照合顔画像データと明らかに符合しないと考えられる登録者の個別照合データを照合対象から除外するための処理である。
照合対象の個別照合データを抽出するための処理内容の1つの具体例は、図7に示されている。この例では、照合データ選択部42は、代表照合データに対して求められた前記の類似度を所定の棄却しきい値と比較する(ステップS11)。照合データ選択部42は、類似度が前記棄却しきい値を超えない代表照合データに対応する登録者については、照合対象から除外(棄却)する(ステップS12)。つまり、その登録者に関して照合データ記憶部25に登録された複数の個別照合データが一括して棄却される。これにより、類似度が棄却しきい値を超える代表照合データに対応する登録者についてのみ、その個別照合データが照合対象とされる(ステップS13)。照合データ選択部42は、全ての代表照合データに関して同様な処理を行って(ステップS14)、照合対象の個別照合データの抽出を終了する。
照合対象の個別照合データを抽出するための処理の他の例は、図8に示されている。この例では、照合データ選択部42は、代表類似度記憶領域12bに記憶された全登録者の代表照合データを順位付け(ソート)し、(ステップS15)、上位の所定数または所定割合の登録者については、その個別照合データを照合対象として抽出する(ステップS16)。照合データ選択部42は、残余の登録者の各複数の個別照合データについては、一括して照合対象から除外する(ステップS17)。なお、この場合にも、上位所定数以内または上位所定割合以内の類似度のうち、所定の棄却しきい値を超えないものがあれば、そのような類似度に対応した登録者の個別照合データは照合対象から除外してもよい。
照合データ選択部42は、このようにして抽出された一部の登録者の個別照合データを、類似度演算部41による照合演算の対象として、1つずつ順次選択する(図6のステップS4)。類似度演算部41は、選択された個別照合データに対応する顔画像と、被照合顔画像との類似度を演算する。こうして、照合データ選択部42によって抽出された個別照合データのすべてに関して類似度の演算が行われる(ステップS5)。演算された類似度は、RAM12内の個別類似度記憶領域12cに書き込まれる。
次に、判断部43は、個別類似度記憶領域12cを参照して、演算された類似度の最高値(最高類似度)を検索する(ステップS6)。そして、判断部43は、この検索された最高類似度を所定の認識しきい値と比較する(ステップS7)。その結果、その最高類似度が認識しきい値を超えていれば(ステップS6のYES)、判断部43は、被照合顔画画像が登録者の顔画像であると判定し、当該最高類似度の個別照合データに対応する登録者を被照合顔画像の人物であると特定する(ステップS8)。一方、当該最高類似度が前記認識しきい値以下であるときには、被照合顔画像の人物は未登録であると判定する(ステップS9)。
このようにして、被照合顔画像データと代表照合データとの照合によって照合対象の個別照合データを絞ることができる。これにより、被照合顔画像データと個別照合データとの照合演算を大幅に削減することができ、認識処理に要する時間を大幅に短縮することができる。また、登録者一人あたりの個別照合データの数を増やして認識精度の向上を図る場合にも、認識に要する時間が大幅に増加することがない。したがって、短時間の処理で正確に顔画像を認識できるようになる。
図9は、顔認識処理部40による処理の他の例を説明するためのフローチャートである。被照合顔画像データが顔認識処理部40に入力されると、照合データ選択部42は、照合データ記憶部25を参照して、登録者の代表照合データを順に選択する(ステップS21)。類似度演算部41は、照合データ選択部42によって選択された代表照合データに対応する代表画像と被照合顔画像との類似度を演算し、代表類似度記憶領域12bに書き込む(ステップS22)。
こうして、照合データ記憶部25に登録されたすべての登録者の代表照合データに関して類似度が求まると、照合データ選択部42は、照合すべき個別照合データを抽出するための処理を実行する。この処理は、端的には、被照合顔画像データと明らかに符合しないと考えられる登録者の個別照合データを照合対象から除外するための処理である。
より具体的には、照合データ選択部42は、前記代表類似度記憶領域12bを参照して、全登録者の代表照合データを類似度によって降順にソートする(ステップS23)。さらに、照合データ選択部42は、類似度の順序に従って、登録者を複数のグループに分ける(ステップS24)。たとえば、図5の例のような照合データが照合データ記憶部25に登録されているとすると、類似度が上位の3人を第1グループに分類し、類似度が中位の3人を第2グループに分類し、類似度が下位の3人を第3グループに分類してもよい。むろん、類似度に基づく登録者のグループ分けは、複数のグループ間で人数が等しくなるようにする必要はない。
照合データ選択部42は、さらに、最上位のグループ(たとえば前述の第1グループ)の登録者の個別照合データを照合対象として抽出し(ステップS25)、他のグループ(前述の例では第2および第3グループ)の登録者の個別照合データは、暫定的に、照合対象から除外する(ステップS26)。
照合データ選択部42は、このようにして抽出された最上位のグループの登録者の個別照合データを照合対象として、1つずつ順次選択する(ステップS27)。類似度演算部41は、選択された個別照合データに対応する顔画像と、被照合顔画像との類似度を演算する。こうして、最上位のグループの登録者の個別照合データのすべてに関して類似度の演算が行われる(ステップS28)。演算された類似度は、RAM12内の個別類似度記憶領域12cに書き込まれる。
次に、判断部43は、個別類似度記憶領域12cを参照して、演算された類似度の最大値(最高類似度)を検索する(ステップS29)。そして、この検索された最高類似度を所定の認識しきい値と比較する(ステップS30)。その結果、その最高類似度が認識しきい値を超えていれば(ステップS30のYES)、判断部43は、被照合顔画像が登録者の顔画像であると判定し、当該最高類似度の個別照合データに対応する登録者を、被照合顔画像の人物であると特定する(ステップS31)。
一方、当該最高類似度が前記認識しきい値以下であるときには(ステップS30のNO)、照合データ選択部42は、照合データ記憶部25に登録されている全登録者に関して個別照合データの照合が完了したかどうかを判断する(ステップS32)。この判断は、登録者を代表照合データの類似度の大小によって分類した前記の全てのグループに関して照合処理を完了したかどうかの判断と等価である。いずれかの登録者についての照合処理が未完了である場合には(ステップS32のNO)、照合データ選択部42は、暫定的に候補から除外していたグループ中で最も最上位のグループ(すなわち、次位のグループ。たとえば前述の例では第2グループ)に属する登録者を照合対象候補とし、ステップS27からの処理を繰り返す。すなわち、当該次位のグループの登録者の個別照合データが順次選択される。
前述の場合と同様に、類似度演算部41は、選択された個別照合データに対応する顔画像と、被照合顔画像との類似度を演算する。こうして、次位のグループの登録者の照合データのすべてに関して類似度の演算が行われる(ステップS28)。
次に、判断部43は、演算された類似度の最高値(最高類似度)を検索する(ステップS29)。そして、この検索された最高類似度を前記認識しきい値と比較する(ステップS30)。その結果、その最大の類似度が認識しきい値を超えていれば、当該類似度の個別照合データに対応した登録者を、被照合顔画像の人物であると特定する(ステップS31)。
このようにして、認識しきい値を超える類似度を有する個別照合データが見つかるまで、同様の処理が行われる。もしも、照合データ記憶部25に格納されたすべての個別照合データに対して照合処理を行ったにもかかわらず、類似度が前記認識しきい値を超える個別照合データが見つからなかった場合には(ステップS32のYES)、判断部43は、被照合顔画像の人物は未登録であると判定する(ステップS34)。
この図9に示した処理では、適切な認識結果が得られない場合には、一旦棄却された個別照合データが照合対象として復活させられる。これにより、登録者が認識されなくなるなどという事態を確実に回避できる。
図9の例では、被照合顔画像の人物が未登録であると判定する場合に、登録者の全てに関して個別照合データに対する照合処理が行われる。しかし、被照合顔画像データと代表照合データとの照合結果として得られる類似度が著しく低い場合には、個別照合データとの照合による認識しきい値よりも高い類似度が得られる確率は低い。したがって、代表顔画像データに対して演算された類似度が所定の棄却しきい値に達しないグループに関しては、登録者の個別照合データを照合対象として復活させないようにしてもよい。
なお、この実施形態では、一人の登録者に対して1つの代表照合データが登録される例が示されているが、一人の登録者に対して複数(2つ以上)の代表照合データが照合データ記憶部25に登録されるようにしてもよい。たとえば、眼鏡を使用する登録者の場合に、眼鏡を装着した状態の個別照合データを代表する第1代表照合データと、眼鏡を装着していない状態の個別照合データを代表する第2代表照合データとを登録しておいてもよい。この場合にも、代表照合データに関して求められた類似度に基づいて、代表照合データごとに、対応する一群の個別照合データを照合対象とするか否かを決定すればよい。
次に、顔画像の類似度の計算について説明する。
図10に示すように、サイズおよび傾きが正規化された第1顔画像I1および第2顔画像I2の類似度を求める場合について説明する。第1顔画像I1は、たとえば、照合データ記憶部25に格納された個別照合データに対応する登録顔画像であり、第2顔画像I2は、たとえば、カメラ1によって撮像された画像から顔画像検出部30によって抽出された被照合顔画像データに対応する。
まず、サイズ、形状、位置および後述する種類のうちの少なくともいずれか1つが異なるT個(Tは2以上の自然数)の特徴領域Aj(jは1≦j≦Tの自然数)を、順次、第1顔画像I1および第2顔画像I2中に共通に設定する。特徴領域Ajは、少なくとも2画素を含み、かつ、第1および第2顔画像I1,I2と同じ大きさか、またはそれよりも小さな領域である。特徴領域Ajの形状としては、矩形(正方形を含む。)、円形、鉤形など、任意の形状を選択することができ、複数の特徴領域A1〜AT間で形状が異なっていてもよい。
たとえば、特徴領域の形状を正方形とすることにし、第1および第2顔画像I1,I2が32画素×32画素の正方形であるとし、さらに、特徴領域を2分割して分析(すなわち、後述の分割数pjを「2」に固定)する場合を想定すると、最小の特徴領域は2画素×2画素の大きさの正方形であり、最大の特徴領域は32画素×32画素の大きさの正方形であって、さらに、サイズ(正方形領域の一辺にならぶ画素数で表される。)が偶数画素の場合のみが許容される。ただし、2画素×2画素の特徴領域は小さすぎてあまり意味を持たないことが経験的にわかっているので、実際は、最小の特徴領域の大きさは4画素×4画素である。4画素×4画素の特徴領域は32画素×32画素の正方形領域内で29×29個の異なる位置をとることができ、次の大きさの6画素×6画素の特徴領域は32画素×32画素の正方形領域内で27×27個の異なる位置をとることができる。同様の考察により、32画素×32画素の第1および第2顔画像I1,I2中には、合計で4495個の特徴領域が設定可能となる。さらに、位置およびサイズが同じ領域を横方向(水平方向)xに2分して分析する場合と、縦方向(垂直方向)yに2分して分析する場合とを区別して、別の特徴領域とみなすこととすれば、合計で8990個の特徴領域の設定が可能となる。これらの特徴領域の一部または全部が、類似度の計算のための特徴領域Aj(j=1,2,……,T)として用いられる。
特徴領域Ajが設定されると、次に、第1顔画像I1における特徴領域Aj中のpj個(pjは2以上の自然数)の部分領域ak(kは1≦k≦pjの自然数)内の領域値x1 kおよび前記第2画像I2中の当該特徴領域Aj中の対応するpj個の部分領域ak内の領域値x2 kが求められる。特徴領域Ajの分割数pjは、特徴領域毎に異なる数であってもよく、特徴領域A1〜ATで共通の値p(=p1=p2=……=pT)としてもよい。
部分領域akは、たとえば、図11(a)に示すように、特徴領域Aj内を水平方向xに沿う水平分割線55で垂直方向にpj個に等分して得られる領域(図11(a)ではx方向に長い矩形領域)であってもよい。また、部分領域akは、図11(b)に示すように特徴領域Aj内を垂直方向yに沿う垂直分割線56で水平方向にpj個に等分して得られる領域(図11(b)ではy方向に長い矩形領域)であってもよい。また、複数の特徴領域A1ないしAT間で、領域の分割方向が異なっていてもよい。以下では、領域分割の方向が異なる特徴領域は、形状および大きさならびに位置が同じであっても、異なる特徴領域として取り扱う。
部分領域ak内の領域値x1 k,x2 kは、たとえば、当該部分領域ak内に含まれる複数の画素のデータの平均値(平均画素値)であり、当該部分領域akの輝度値に相当する。ただし、当該部分領域akにただ一つの画素が含まれる場合(たとえば、2画素×1画素の特徴領域の場合)には、その画素のデータ自身がその部分領域akの領域値となる。特徴領域Ajの各部分領域akの領域値x1 k,x2 kは、当該特徴領域Ajに関する第1および第2顔画像I1,I2の特徴量である。
j個の部分領域akについて前述の領域値x1 k,x2 kが求まると、次に、第1および第2顔画像I1,I2の当該特徴領域Aj内の相関が求められる。より具体的には、次式により、相関値Cjが演算される。
ただし、すべての特徴領域A1〜ATにおける分割数pjがいずれも等しい場合には、右辺の係数1/pjは省かれてもよい。
画像間の相関を求める操作は、特徴領域をx方向およびy方向の2方向について分割(すなわち、格子状に分割)して得られる部分領域を用いて行われてもよい。しかし、この実施形態では、x方向またはy方向のいずれか一方向について特徴領域Ajを分割して得られる部分領域akを用いて、相関を求める操作が行われる。以下では、このようにして求められる相関を「単方向相関」という。
このような単方向相関を求める操作が、前記複数の特徴領域A1〜ATに関して実行され、これにより、相関値C1,C2,……,CTが求められる。
こうして求められた各特徴領域Ajの相関値Cjは、特徴領域Aj毎に定めた次式の弱識別器(Weak Classifier)hj(I1,I2)にかけられる。
すなわち、各特徴領域Ajに関する相関値Cjは、特徴領域Aj毎に予め定めた所定のしきい値θjと比較される。その結果、相関値Cjがしきい値θjを超えていれば、第1および第2顔画像I1,I2が同一人物の顔画像であることを表す第1識別値「+1」(肯定的結論を表す弱仮説(Weak Hypothesis))が生成される。一方、前記相関値Cjがしきい値θj以下であれば、第1および第2顔画像I1,I2が同一人物の顔画像ではないことを表す第2識別値「−1」(否定的結論を表す弱仮説)が生成される。
前記T個の特徴領域A1〜ATの個々についての前記弱識別器の出力値h1(I1,I2)〜hT(I1,I2)(弱仮説)が求められると、次に、これらは、個々の特徴領域Aj毎に定めた重み付け係数wjを乗じて加算(線形結合)される。これにより、第1および第2顔画像I1,I2の類似度(同一人物らしさ)が求められる。すなわち、類似度は、次式で与えられる。
前記単方向相関値Cjの演算に適用される特徴領域A1〜ATの選択、弱識別器におけるしきい値θj、および重み付け係数wjは、事前の学習によって定められる。この学習には、たとえば、非特許文献2に記載されたブースティング学習アルゴリズム(アダブースト:AdaBoost)が適用される。
具体的には、図12のフローチャートに示すように、予め、同一人物の異なる顔画像データのペアをポジティブサンプル(同一人物であるとの結論が正解となるサンプル)として複数個準備し、また、他人同士の顔画像データのペアをネガティブサンプル(同一人物であるとの結論が不正解となるサンプル)として複数個準備しておき、初期化処理として、これらのサンプルに一律に(均等に)ウエイト(weight)を配分する(ステップS50)。
次に、正規化された顔画像データ中に特徴領域A(たとえば、正方形の特徴領域)を設定し、前記第(1)式で表される単方向相関値Cが、全てのサンプル(ポジティブサンプルおよびネガティブサンプル)に関して演算される。この演算が、正規化された顔画像中に設定可能な全ての特徴領域A(たとえば、位置、大きさおよび領域の分割方向のうちの少なくともいずれか1つが異なる正方形領域)に関して実行される(ステップS51)。そして、T個の特徴領域A1〜ATを選択し、かつT個の弱識別器h1(I1,I2)〜hT(I1,I2)を定めるためのT回の学習(for t=1 to T ループ)が開始される(ステップS52)。
具体的には、まず、未選択の個々の特徴領域A(t=1のときは全ての特徴領域A)ごとに、ウエイト(t=1のときは均一なウエイト)が与えられた全ポジティブサンプルおよび全ネガティブサンプルに関し、それぞれ、単方向相関値Cについてのヒストグラム(ウエイトが与えられたサンプルに対応した重み付けヒストグラム)が作成される(ステップS53)。このヒストグラムの例を図13に示す。
一般に、相関値Cの値の比較的小さな範囲にネガティブサンプルの分布が現れ、相関値Cの値の比較的大きな範囲にポジティブサンプルの分布が現れる。しきい値θは、当該しきい値と相関値Cとを比較したときの誤識別率(エラー率)が最小となるように定められる(ステップS54)。
たとえば、しきい値θを大きな値θLに定めると、異なる人物の画像ペア(ネガティブサンプル)を同一人物の画像ペアであるとする誤識別(他人受入れ(False Accept)エラー、フォルスポジティブエラー)は少なくなるが、同一人物の画像ペア(ポジティブサンプル)を異なる人物の画像ペアであるとする誤識別(本人棄却(False Reject)エラー、フォルスネガティブエラー)が多くなる。逆に、しきい値θを小さな値θSに定めると、異なる人物の画像ペア(ネガティブサンプル)を同一人物の画像ペアであるとする誤識別(他人受入れエラー、フォルスポジティブエラー)が多くなる反面、同一人物の画像ペア(ポジティブサンプル)を異なる人物の画像ペアであるとする誤識別(本人棄却エラー、フォルスネガティブエラー)は少なくなる。
しきい値θは、前記の誤識別が全体として最小となる値に定められる。一般的には、ポジティブサンプルの分布範囲とネガティブサンプルの分布範囲の間、またはそれらの重なり区間の値がしきい値θとされる。このしきい値θとともに、当該しきい値θに対応した誤識別率が求められる。
このようにして未選択の全ての特徴領域Aのしきい値θを定めることによって、全特徴領域Aに対応した弱識別器hが作成されることになる。
これらの弱識別器hのなかで最も誤識別率(エラー率)の低い弱識別器が第t番目の識別器ht(t=1のときは第1の識別器h1(特徴領域A1に対応))として選択され(ステップS55)、その誤識別率に応じた重み付け係数wt(t=1のときは重み付け係数w1)が定められる(ステップS56)。
次いで、第t弱識別器htにより正解が得られるサンプルには小さなウエイトを与え、第t弱識別器htにより不正解となるサンプルには大きなウエイトを与えるように重みの再配分(re-weighting)を行い、これに対してステップS52以降の学習を実行する(ステップS57)。すなわち、未選択の全ての特徴領域(特徴領域A1〜At以外の特徴領域A)について、前記ウエイトが与えられたサンプルに対する重み付けヒストグラムが作成される(ステップS53)。そして、それらの特徴領域Aに対応した弱識別器のうちで誤識別率が最も小さくなる弱識別器が第(t+1)の識別器ht+1とされる(ステップS55)。つまり、たとえば、第2の識別器h2には、第1の識別器h1が誤識別しやすいサンプルに対して高確率で正解を与える弱識別器が選択される。そして、この第(t+1)の弱識別器ht+1の誤識別率に応じた重み付け係数wt+1が定められる(ステップS56)。
同様の操作を、T個の弱識別器h1〜hTが得られるまで繰り返し、T回の学習を行うことにより、類似度の演算に適したT個の特徴領域A1〜ATが選択されることになる。そして、T個の弱識別器h1〜hTに各重み付け係数w1〜wTを乗じて線形結合することにより、前記第(3)式による類似度演算式が得られる。
そして、前記第(3)式によって求められた類似度が所定の認識しきい値Rthと比較される。求められた類似度が認識しきい値Rthを超える場合には、第1および第2顔画像I1,I2が同一人物の顔画像である判定され、認識しきい値Rth以下の場合には、第1および第2顔画像I1,I2は異なる人物の顔画像であると判定される。
つまり、次式により、判定結果が与えられる。
図14は、照合用辞書記憶部26(図1および図3参照)の保持内容を説明するための図である。照合用辞書記憶部26には、前記第(3)式の類似度演算式に対応した特徴領域A1〜ATの情報が格納されている。すなわち、特徴番号1〜Tに対応して、特徴領域A1〜ATを指定するための特徴領域指定情報と、各特徴領域A1〜ATの相関値C1〜CTに対して適用されるしきい値θ1〜θTと、各特徴領域A1〜ATの弱識別器h1〜hTに対して与えられる重み付け係数w1〜wTとが格納されている。
特徴領域指定情報は、特徴領域の位置、形状、サイズおよび種類を指定するための情報である。図14には、特徴領域の形状を一定形状(たとえば正方形)に固定し、かつ、特徴領域の分割数pjを一定値pに固定する場合の例が示されている。したがって、特徴領域指定情報として、位置、サイズおよび種類が登録されている。特徴領域の位置は、照合される2つの顔画像I1,I2中における位置を表す。具体的には、たとえば、図11に示すように、特徴領域が矩形形状の場合、その左下角を原点とみなし、この原点のx座標およびy座標によって、当該特徴領域の位置が表される。サイズは、たとえば正方形の特徴領域の場合における一辺の長さ(画素数)で表される。種類は、特徴領域をx方向(水平方向)に分割(図11(b)参照)するか、y方向(垂直方向)に分割(図11(a)参照)するかを表す情報である。
図15は、類似度演算部41(図3参照)の構成例を説明するためのブロック図である。この構成例の類似度演算部41は、照合対象の第1顔画像I1(たとえば、代表照合データに対応した代表顔画像または個別照合データに対応した登録顔画像)および第2顔画像I2(たとえば、カメラ1で撮像された被照合顔画像)に対して共通に特徴領域Ajを設定する特徴領域設定部45(特徴領域設定手段)と、第1顔画像I1の特徴量を演算する第1特徴量演算部46(特徴量演算手段)と、第2顔画像I2の特徴量を演算する第2特徴量演算部47(特徴量演算手段)とを備えている。
特徴領域設定部45は、照合用辞書記憶部26から特徴領域A1〜ATを読み出し、第1および第2顔画像I1,I2中に順次設定する(第1および第2特徴領域設定ステップ)。
第1特徴量演算部46は、照合用辞書記憶部26を参照し、特徴領域設定部45によって設定された第1顔画像I1内の特徴領域Ajについて、その「種類」の情報に従って領域を分割し、その分割された部分領域ak毎の領域値x1 kを特徴量として求める(第1領域値演算ステップ)。同様に、第2特徴量演算部47は、照合用辞書記憶部26を参照し、特徴領域設定部45によって設定された第2顔画像I2内の特徴領域Ajについて、その「種類」の情報に従って領域を分割し、その分割された部分領域ak毎の領域値x2 kを特徴量として求める(第2領域値演算ステップ)。
類似度演算部41は、さらに、第1および第2特徴量演算部46,47によって求められた領域値x1 k,x2 kに基づいて相関値Cjを演算する相関値演算部48(相関値演算手段、相関値演算ステップ)と、この相関値演算部48によって求められた相関値Cjを当該特徴領域Ajに対応したしきい値θjと比較する比較部49(比較手段、比較ステップ)と、この比較部49による比較結果hj(I1,I2)に重み付け係数wjを乗じて加算する重み付け加算部50(重み付け加算手段、重み付け加算ステップ)とを備えている。これらの比較部49および重み付け加算部50は、本願発明における相関ベース類似度演算手段を構成しており、これらの働きによって相関ベース類似度演算ステップが実行される。
比較部49は、照合用辞書記憶部26を参照し、特徴領域Ajに対応したしきい値θjを読み出す。そして、比較部49は、相関値Cjがしきい値θjよりも大きければ第1識別値「+1」(第1および第2顔画像が同一人物の顔画像であることを表す弱仮説)を出力する。一方、相関値Cjがしきい値θj以下であれば、比較部49は、第2識別値「−1」(第1および第2顔画像が他人の顔画像であることを表す弱仮説)を出力する。
重み付け加算部50は、比較部49の出力値に対して特徴領域Ajに対応した重み付け係数を乗じ、特徴領域A1〜ATに関する比較部49の出力値を線形結合して、前記(3)式で表される類似度を求めて出力する。すなわち、重み付け加算部50は、比較部49から与えられる特徴領域A1〜ATについての比較結果hj(I1,I2)に対して重み付け係数wjを乗じ、これらを加算する。
図16は、類似度演算部41の他の構成例を説明するためのブロック図である。この図16において、前述の図15に示された各部と同等の機能部分には、図15の場合と同一の参照符号を付して示す。この図16の構成は、照合データ記憶部25に、顔画像の照合データ(代表照合データおよび個別照合データ)が特徴量の形式で登録されている場合に好適である。この場合、照合データ記憶部25には、各登録顔画像について特徴領域A1〜ATに関する特徴量が個別照合データとして記憶されている。同様に、代表照合データとしては、代表顔画像についての特徴領域A1〜ATに関する特徴量が記憶されている。これら特徴量は、個々の照合データに対して、特徴領域A1〜ATごとに照合データ記憶部に25記憶されている。記憶される特徴量は、各特徴領域Ajを分割して得られる部分領域akの領域値x1 kである。
特徴領域設定部45A(特徴領域設定手段)は、照合用辞書記憶部26を参照して、第2顔画像I2内に特徴領域A1〜ATを順次設定する。特徴量演算部47は、照合用辞書記憶部26を参照して、第2顔画像I2中に設定された特徴領域Ajについて、その部分領域akごとの領域値x2 kを特徴量として演算する。
この演算された領域値x2 kは、相関値演算部48に与えられる。この相関値演算部48は、照合データ記憶部25から第1顔画像I1の当該特徴領域Ajに対応した領域値x1 kを読み出す。そして、相関値演算部48は、照合データ記憶部25から読み出された領域値x1 kと特徴量演算部47によって演算された領域値x2 kとに基づいて、相関値Cjを演算する。
比較部49および重み付け加算部50の働きは、図11の構成の場合と同様である。
この構成例の場合には、第1顔画像I1(登録顔画像または代表顔画像)については、領域値x1 kが予め求められて、照合データとして照合データ記憶部25に登録されている。したがって、類似度の計算のための演算量を少なくすることができる。それに応じて、演算時間を短縮できるから、顔画像の認識に要する時間を短縮できる。
次に、顔画像検出部30(図3参照)による処理について概説する。
図17は、顔画像検出部30の機能的な構成を説明するための機能ブロック図である。顔画像検出部30は、カメラ1によって撮像された入力画像から顔画像領域を抽出して、サイズおよび傾きが正規化された顔画像データ(被照合顔画像データ)を生成するものである。この顔画像検出部30は、第1段階の処理としての粗検出処理と、第2段階の処理としての精密検出処理とを実行する。粗検出処理は、カメラ1によって撮像された画像の全領域を粗くスキャンして、顔画像が含まれている蓋然性の高い一部の領域を顔画像周辺領域として抽出し、残余の領域を棄却して精密検出処理対象から除外する処理である。すなわち、精密検出処理は、粗検出処理によって抽出された顔画像周辺領域内で、顔画像の領域を抽出して切り出す処理である。
粗検出処理の実行のために、顔画像検出部30には、撮像画像中の部分領域を処理対象領域(粗検出ウィンドウ)として設定する粗検出ウィンドウ設定部31と、この粗検出ウィンドウ設定部31によって設定された粗検出ウィンドウが顔画像を内包する顔画像周辺領域であるかどうかを識別する周辺領域識別部32と、この周辺領域識別部32による判定のための情報を記憶した周辺領域特徴辞書33とが備えられている。周辺領域特徴辞書33は、図1に示すように、ハードディスクドライブ14内の記憶領域に格納されている。
また、精密検出処理の実行のために、顔画像検出部30には、さらに、周辺領域識別部32によって抽出された顔画像周辺領域のなかの部分領域を処理対象領域(精密検出ウィンドウ)として設定する精密検出ウィンドウ設定部34と、この精密検出ウィンドウ設定部34によって設定された精密検出ウィンドウが顔画像領域に該当するかどうかを識別する顔画像識別部35と、この顔画像識別部35による判定のための情報を記憶した顔画像特徴辞書36とが備えられている。顔画像特徴辞書36は、図1に示すように、ハードディスクドライブ14内の記憶領域に格納されている。
さらに、顔画像検出部30は、顔画像識別部35によって顔画像領域であると判定された精密検出ウィンドウ内の画像を正規化して出力する顔画像出力処理部37を備えている。この顔画像出力処理部37は、当該精密検出ウィンドウ内の画像を、一定のサイズ(たとえば32画素×32画素)に正規化し、かつ、当該精密ウィンドウ内の顔画像の傾きを補正して、被照合顔画像データを生成する。
撮像画像から抽出して切り出される顔画像は、たとえば、図18の中央列の3つの画像(縦方向にならぶ3つの画像)のように、人の顔の両目尻の内側の所定形状の矩形領域(顔認識処理部40で照合される画像と同形状の領域。たとえば、正方形領域)の画像である。つまり、撮像画像中にさまざまな大きさで含まれる顔画像が、縦横比が一定の矩形領域によって切り出される。図18の中央列中段の顔画像は、両目尻を結ぶ線分が矩形領域の横辺にほぼ平行な場合(0degree)を示し、図18の中央列上段の顔画像は、同列中段の画像に対して5度だけ左回転(−5degrees)されており、図18の中央列下段の顔画像は、同列中段の画像に対して5度だけ右回転(+5degrees)されている。
この場合、顔画像特徴辞書36には、図18の中央列に示されるような矩形の画像を顔画像として識別するための情報が保持されることになる。より具体的には、顔画像の特徴パターンに対応した顔画像検出フィルタに関する情報が顔画像特徴辞書36に保持されている。顔画像検出フィルタは、たとえば、図19に示すように、処理ウィンドウ70内に設定された一対の矩形領域71,72のそれぞれに関して、それらの領域71,72に含まれる各複数画素の平均輝度値を求め、それらの平均輝度値の差を所定のしきい値と比較するものである。
処理ウィンドウ70内における矩形領域71,72の位置、形状(縦横長)、および平均輝度値に対するしきい値は、学習によって予め定められる。この学習は、多数の画像サンプルを用いて実行される。より具体的には、処理ウィンドウ70と同形状および同サイズの多数の画像サンプルが収集されて、ハードディスクドライブ14(図1参照)の記憶領域内の顔画像サンプル格納部61(図17参照)に格納される。この場合の画像サンプルは、顔画像を含む顔画像サンプル(真サンプル)と、顔画像を含まない非顔画像サンプル(偽サンプル)とを含む。
コンピュータ3内の機能処理部である顔画像特徴計算部63は、顔画像サンプル格納部61に格納された画像サンプルに基づいて学習を行い、真偽のサンプルを最もよく分離することができる顔画像検出フィルタを求める。すなわち、処理ウィンドウ70内における矩形領域71,72の位置およびそれら縦横長の組み合わせを様々に設定し、真偽のサンプルを最もよく分離することができる組み合わせが選択される。この場合、「真偽のサンプルを最もよく分離することができる」とは、真サンプルを偽サンプルとする誤識別および偽サンプルを真サンプルとする誤識別が最少となることを意味する。こうして選択された矩形領域71,72の組み合わせに対して、さらに、誤識別率が最小となるしきい値が設定されることにより、顔画像検出フィルタが得られる。この顔画像検出フィルタに関する情報が、顔画像特徴辞書36に予め格納される。
一方、周辺領域特徴辞書33には、図18の中央列の顔画像のほかに、図18の左列および右列の各3個の顔画像を顔画像周辺領域として識別するための情報が保持されることになる。図18左列の3つの画像は、顔画像の抽出枠を、図18中央列の3つの画像の位置からそれぞれ左方向に所定画素分(図18の例では1画素分。−1pixel)だけシフトさせて得られる画像である。また、図18右列の3つの画像は、顔画像の抽出枠を、図18中央列の3つの画像の位置からそれぞれ右方向に所定画素分(図18の例では1画素分。+1pixel)だけシフトして得られる画像である。
周辺領域特徴辞書33には、顔画像検出フィルタの場合と同様な周辺画像検出フィルタに関する情報が保持されている。この周辺画像検出フィルタは、顔画像検出フィルタの場合と同様な学習によって定められる。ただし、この学習には、顔画像周辺領域サンプル(真サンプル)として、図18中央列のような顔画像のほかにその左右列に示されるような顔画像も用いられる。このような真サンプルと、顔画像を含まない偽サンプルとが、ハードディスクドライブ14内の記憶領域である周辺領域画像サンプル格納部62に、予め、多数格納される。
この周辺領域画像サンプル格納部62に格納された真偽のサンプルを最もよく分離することができる周辺領域検出フィルタが、コンピュータ3内の機能処理部である周辺領域特徴計算部64によって、顔画像検出フィルタの場合と同様な学習によって求められる。この周辺領域検出フィルタの情報が、周辺領域特徴辞書33に予め格納されることになる。
顔画像サンプル格納部61、周辺領域画像サンプル格納部62、顔画像特徴計算部63および周辺領域特徴計算部64は、事前の学習のための構成である。すなわち、これらの機能処理部は、周辺領域特徴辞書33および顔画像特徴辞書36とともに、オフライン実行系51を形成している。
一方、撮像画像中の顔画像の抽出処理は、粗検出ウィンドウ設定部31、周辺領域識別部32、精密検出ウィンドウ設定部34、顔画像識別部35および顔画像出力処理部37によって実行される。すなわち、これらの機能処理部は、周辺領域特徴辞書33および顔画像特徴辞書36とともに、オンライン実行系52を形成している。
粗検出ウィンドウ設定部31は、処理ウィンドウ70と相似形の様々な大きさの粗検出ウィンドウによって撮像画像の全域を走査するように、それらの粗検出ウィンドウを撮像画像中に順次設定する。より具体的には、粗検出ウィンドウ設定部31は、図20に示すように、撮像画像80内の左下角のスタート位置81から開始して、右上角のストップ位置82に至るまで、撮像画像80の全範囲を走査するように粗検出ウィンドウ77を設定していく。つまり、粗検出ウィンドウ設定部31は、最初の粗検出ウィンドウ77をスタート位置81に設定し、以後、右方向に所定の複数画素(たとえば、3画素)ずつ移動させながら順に粗検出ウィンドウ77を設定していく。この粗検出ウィンドウ77が撮像画像80の右端に達すると、粗検出ウィンドウ設定部31は、粗検出ウィンドウの設定位置を左端に戻し、1画素だけ上方に移動して、新たな粗検出ウィンドウ77を設定する。以後、同様の操作が、粗検出ウィンドウ77がストップ位置82に達するまで繰り返される。
粗検出ウィンドウ設定部31は、周辺領域検出フィルタによる処理が可能な最小の大きさのウィンドウを初期粗検出ウィンドウ77として前述の操作を実行し、以後、順次、粗検出ウィンドウ77の大きさを所定ステップずつ(たとえば、1画素ずつ)大きくしながら、同様の操作を繰り返す。最終的には、撮像画像80と同じ大きさの粗検出ウィンドウ77が設定される。
こうして順次設定される粗検出ウィンドウ77内の部分画像に対して、周辺領域識別部32は、前述の周辺領域検出フィルタによる処理を実行し、各粗検出ウィンドウ77が顔画像周辺領域に該当するか否かを判定する。粗検出ウィンドウ77内の画像に対して周辺領域検出フィルタを適用する際には、当該画像は、周辺領域検出フィルタのウィイドウサイズと一致するように拡大または縮小される。顔画像周辺領域である判定された粗検出ウィンドウ77については、その位置情報および大きさの情報が生成されて、RAM12(図1参照)に格納される。
周辺領域検出フィルタは、前述のとおり、ウィンドウの中央に顔画像が収まっているサンプルだけでなく、左右に1画素ずつずらした顔画像サンプルをも用いて学習を行って求められている。そのため、粗検出ウィンドウ77を3画素以下のシフト幅で撮像画像80内でずらして順次設定していけば、顔画像が含まれる領域を精度よく抽出することができる。むろん、最大のシフト幅である3画素ずつずらして順次粗検出ウィンドウ77を設定すれば、最短時間で顔画像周辺領域の判定を完了できる。
一般に、図18の中央列の顔画像とともに、これらを左右にu画素(ただし、uは自然数)だけそれぞれずらした顔画像を用いた学習によって周辺領域検出フィルタが求められている場合には、2u+1画素以下のシフト幅で粗検出ウィンドウ77をシフトしていくことができる。
精密検出ウィンドウ設定部34は、周辺領域識別部32によって顔画像周辺領域と判定された領域の近傍で精密検出ウィンドウを設定する。たとえば、精密検出ウィンドウ設定部34は、顔画像周辺領域およびその左右に1画素ずつシフトした範囲で、粗検出ウィンドウ77と同サイズの精密検出ウィンドウを設定する。この設定された精密検出ウィンドウに対して、顔画像識別部35による処理、すなわち、顔検出フィルタによる処理が実行される。精密検出ウィンドウ内の画像に対して顔検出フィルタを適用する際には、当該画像は、顔画像検出フィルタのウィンドウサイズと一致するように拡大または縮小される。
顔識別処理部35によって顔画像領域であると判定された精密検出ウィンドウについては、その位置およびサイズを表す情報が顔画像識別部35によって出力される。これを受けて、顔画像出力処理部は、当該精密検出ウィンドウ内の画像に対して、サイズおよび傾きの正規化を行って、被照合顔画像データを生成する。この場合、「傾きの正規化」とは、たとえば、図18の上段または下段のような傾きのある画像を、図18中段のように実質的に傾きのない画像に回転することをいう。
以上、この発明の一実施形態について説明したが、この発明は他の形態で実施することもできる。たとえば、前述の実施形態では、複数人の顔画像の照合データが照合データ記憶部25に登録される例について説明したが、ただ一人の顔画像の照合データが照合データ記憶部25に登録されてもよい。この場合、たとえば、処理対象の画像データと代表照合データとの類似度を所定のしきい値と比較し、その類似度が当該しきい値を超えない場合には、個別照合データとの照合を行わずに認識処理を終了すればよい。これにより、照合対象の顔画像が登録人物の顔画像と明らかに異なる場合には、複数の個別照合データに関する照合処理を省くことができるので、当該照合対象の顔画像の者が未登録者であるとの判定をすみやかに下すことができる。
また、前記の実施形態では、立ち入り制限区域への入場制限のためこの発明が適用される例について説明したが、たとえば、家庭用ロボットや接客ロボットのように対人対応の可能なロボットにこの発明の画像認識装置を組み込んで用いることもできる。これにより、ロボットは、登録されている人物の顔を短時間で正確に認識できるから、迅速かつ的確な対人対応が可能になる。たとえば、このようなロボットは、認識した人物に応じた適切な対応を優れた応答性で実行できる。
顔画像の認識は、他にも、膨大な画像データ(静止画または動画)から特定人物の顔画像を抽出したりする処理に用いることもできる。具体的には、犯罪捜査において、ビデオカメラで撮像された映像から容疑者の顔画像を抽出したりする処理に顔画像認識処理を適用できる。
さらに、前記の実施形態では、認識対象物が顔画像である場合について説明したが、既述のとおり、この発明は、顔画像以外の認識対象物の認識にも適用可能である。
その他、特許請求の範囲に記載された事項の範囲で種々の設計変更を施すことが可能である。
この発明の一実施形態に係る個人認証システムの構成を示す図解的なブロック図である。 画像認識装置を構成するコンピュータに接続されたディスプレイの表示例を示す図である。 前記コンピュータプログラムの実行状態におけるコンピュータの機能的な構成を説明するためのブロック図である。 照合データ記憶部における照合データの登録状態を説明するための図解図である。 照合データ記憶部における照合データの登録状態をより直感的に表した図である。 顔認識処理部による処理の一例を説明するためのフローチャートである。 照合対象の個別照合データを抽出するための処理内容の一具体例を示すフローチャートである。 照合対象の個別照合データを抽出するための処理の他の具体例を示すフローチャートである。 顔認識処理部による処理の他の例を説明するためのフローチャートである。 一対の顔画像の類似度を求める演算を説明するための図である。 顔画像の類似度を求めるために用いられる特徴領域を説明するための図である。 学習によって類似度演算式を定めるための処理を説明するためのフローチャートである。 一対の顔画像に共通の特徴領域を設定し、当該特徴領域内における一対の顔画像の相関値を求めたときの重み付けヒストグラムの一例を示す図である。 照合用辞書記憶部の保持内容を説明するための図である。 類似度演算部の構成例を説明するためのブロック図である。 類似度演算部の他の構成例を説明するためのブロック図である。 顔画像検出部の機能的な構成を説明するための機能ブロック図である。 撮像画像から抽出される顔画像の例と、顔画像の周辺領域として検出される画像の例を示す図である。 顔画像検出処理のためのフィルタの例を示す図である。 粗検出ウィンドウによる撮像画像の走査を説明するための図である。 フィルタ処理を用いた類似度演算処理と相関値を用いた類似度演算処理との対比説明のための図である。
符号の説明
1 カメラ
2 ケーブル
3 コンピュータ
4 表示器
5 ディスプレイ
6 入力操作部
7 ゲート開閉器
8 CD−ROM
10 CPU
11 ROM
12 RAM
12a 画像メモリ
12b 代表類似度記憶領域
12c 個別類似度記憶領域
13 バス
14 ハードディスクドライブ
15 CD−ROMドライブ
16 ディスプレイコントローラ
17 入力部コントローラ
18 画像インタフェース部
19 表示制御インタフェース部
20 ゲート開閉制御インタフェース部
25 照合データ記憶部
26 照合用辞書記憶部
30 顔画像検出部
31 粗検出ウィンドウ設定部
32 周辺領域識別部
33 周辺領域特徴辞書
34 精密検出ウィンドウ設定部
35 顔画像識別部
36 顔画像特徴辞書
37 顔画像出力処理部
40 顔認識処理部
41 類似度演算部
42 照合データ選択部
43 判断部
45 特徴領域設定部
45A 特徴領域設定部
46 第1特徴量演算部
47 第2特徴量演算部
48 相関値演算部
49 比較部
50 重み付け加算部
51 オフライン実行系
52 オンライン実行系
55 水平分割線
56 垂直分割線
61 顔画像サンプル格納部
62 周辺領域画像サンプル格納部
63 顔画像特徴計算部
64 周辺領域特徴計算部
70 処理ウィンドウ
71 矩形領域
72 矩形領域
77 粗検出ウィンドウ
80 撮像画像
j 特徴領域
k 部分領域
1 k 領域値
2 k 領域値
j 相関値
1 顔画像
2 顔画像

Claims (11)

  1. 第1画像Iと第2画像Iとの類似度を求めるための装置であって、
    前記第1画像Iおよび第2画像I中に共通に設定可能なT個(Tは2以上の自然数)の特徴領域A(jは1≦j≦Tの自然数)のそれぞれに関して、前記第1画像I中の特徴領域A内におけるp個(pは2以上の自然数)の部分領域a(kは1≦k≦pの自然数)の領域値x1 kおよび前記第2画像I中の当該特徴領域A内における対応するp個の部分領域aの領域値x2 kに基づいて、前記第1画像Iおよび第2画像Iの当該特徴領域A内の相関値
    を演算する相関値演算手段と、
    この相関値演算手段によって求められたT個の特徴領域Aに関する前記相関値Cに基づいて、前記第1画像Iおよび第2画像Iの類似度を演算する相関ベース類似度演算手段とを含み、
    前記部分領域a は、所定の一方向のみに関して特徴領域A を分割して得られる領域であり、
    前記相関ベース類似度演算手段は、
    前記相関値演算手段によって求められた相関値C を所定のしきい値θ と比較し、前記相関値C が前記しきい値θ を超えていれば、前記第1画像I および第2画像I が類似していることを表す第1弱識別値h (I 1 ,I 2 )=H を出力し、前記相関値C が前記しきい値θ 以下であれば、前記第1および第2画像I ,I が非類似であることを表す第2弱識別値h (I 1 ,I 2 )=H (ただし、H >H )を出力する比較手段と、前記T個の特徴領域A についての前記比較手段の出力値h (I 1 ,I 2 )を、重み付け係数w を乗じて線形結合することにより、前記第1画像I および第2画像I の類似度
    を演算する重み付け加算手段とを含むことを特徴とする画像類似度演算装置。
  2. 第1画像Iと第2画像Iとの類似度を求めるための装置であって、
    T個(Tは2以上の自然数)の特徴領域A(jは1≦j≦Tの自然数)を、前記第1画像Iおよび第2画像I中に共通に設定する特徴領域設定手段と、
    この特徴領域設定手段によって設定されたT個の特徴領域Aのそれぞれに関して、前記第1画像I中の特徴領域A内におけるp個(pは2以上の自然数)の部分領域a(kは1≦k≦pの自然数)の領域値x1 kおよび前記第2画像I中の当該特徴領域A内における対応するp個の部分領域aの領域値x2 kに基づいて、前記第1画像Iおよび第2画像Iの当該特徴領域A内の相関値
    を演算する相関値演算手段と、
    この相関値演算手段によって求められたT個の特徴領域Aに関する前記相関値Cに基づいて、前記第1画像Iおよび第2画像Iの類似度を演算する相関ベース類似度演算手段とを含み、
    前記部分領域a は、所定の一方向のみに関して特徴領域A を分割して得られる領域であり、
    前記相関ベース類似度演算手段は、
    前記相関値演算手段によって求められた相関値C を所定のしきい値θ と比較し、前記相関値C が前記しきい値θ を超えていれば、前記第1画像I および第2画像I が類似していることを表す第1弱識別値h (I 1 ,I 2 )=H を出力し、前記相関値C が前記しきい値θ 以下であれば、前記第1および第2画像I ,I が非類似であることを表す第2弱識別値h (I 1 ,I 2 )=H (ただし、H >H )を出力する比較手段と、前記T個の特徴領域A についての前記比較手段の出力値h (I 1 ,I 2 )を、重み付け係数w を乗じて線形結合することにより、前記第1画像I および第2画像I の類似度
    を演算する重み付け加算手段とを含むことを特徴とする画像類似度演算装置。
  3. 第1画像Iと第2画像Iとの類似度を求めるための装置であって、
    前記第1画像Iおよび第2画像I中に共通に設定可能なT個(Tは2以上の自然数)の特徴領域A(jは1≦j≦Tの自然数)のそれぞれに関して、前記第1画像I中の特徴領域A内におけるp個(pは2以上の自然数)の部分領域a(kは1≦k≦pの自然数)の領域値x1 kを、前記第1画像Iの特徴量を表す照合データとして記憶した照合データ記憶手段と、
    前記T個の特徴領域Aを、前記第2画像I中に設定する特徴領域設定手段と、
    この特徴領域設定手段によって設定されたT個の特徴領域Aのそれぞれに関して、前記第2画像I中の当該特徴領域A内におけるp個の部分領域aの領域値x2 kを前記第2画像Iの特徴量として演算する特徴量演算手段と、
    前記T個の特徴領域Aのそれぞれに関して、前記照合データ記憶手段に記憶された第1画像Iの領域値x1 k-と、前記特徴量演算手段によって演算された第2画像Iの領域値x2 kとに基づいて、前記第1画像Iおよび第2画像Iの当該特徴領域A内の相関値
    を演算する相関値演算手段と、
    この相関値演算手段によって求められたT個の特徴領域Aに関する前記相関値Cに基づいて、前記第1画像Iおよび第2画像Iの類似度を演算する相関ベース類似度演算手段とを含み、
    前記部分領域a は、所定の一方向のみに関して特徴領域A を分割して得られる領域であり、
    前記相関ベース類似度演算手段は、
    前記相関値演算手段によって求められた相関値C を所定のしきい値θ と比較し、前記相関値C が前記しきい値θ を超えていれば、前記第1画像I および第2画像I が類似していることを表す第1弱識別値h (I 1 ,I 2 )=H を出力し、前記相関値C が前記しきい値θ 以下であれば、前記第1および第2画像I ,I が非類似であることを表す第2弱識別値h (I 1 ,I 2 )=H (ただし、H >H )を出力する比較手段と、前記T個の特徴領域A についての前記比較手段の出力値h (I 1 ,I 2 )を、重み付け係数w を乗じて線形結合することにより、前記第1画像I および第2画像I の類似度
    を演算する重み付け加算手段とを含むことを特徴とする画像類似度演算装置。
  4. 請求項1ないしのいずれかに記載の画像類似度演算装置と、
    この画像類似度演算装置によって演算された類似度が所定の認識しきい値を超えていれば、前記第1画像Iと第2画像Iとが類似していると判断し、前記画像類似度演算装置によって演算された類似度が前記認識しきい値以下であれば、前記第1画像Iと第2画像Iとが非類似であると判断する判断手段とを含むことを特徴とする画像認識装置。
  5. 第1画像Iと第2画像Iとの類似度をコンピュータによって求めるための方法であって、
    前記コンピュータにより、T個(Tは2以上の自然数)の特徴領域A(jは1≦j≦Tの自然数)を、前記第1画像I中に設定する第1特徴領域設定ステップと、
    前記コンピュータにより、前記T個の特徴領域Aを前記第2画像I中に設定する第2特徴領域設定ステップと、
    前記コンピュータにより、前記第1画像Iに設定されたT個の特徴領域Aのそれぞれに関して、前記第1画像I中の特徴領域A内におけるp個(pは2以上の自然数)の部分領域a(kは1≦k≦pの自然数)の領域値x1 kを演算する第1領域値演算ステップと、
    前記コンピュータにより、前記第2画像Iに設定されたT個の特徴領域Aのそれぞれに関して、前記第2画像I中の特徴領域A内におけるp個の部分領域aの領域値x2 kを演算する第2領域値演算ステップと、
    前記コンピュータにより、前記T個の特徴領域Aのそれぞれに関して、前記第1画像I中の特徴領域A内におけるp個の部分領域aの領域値x1 kおよび前記第2画像I中の当該特徴領域A内における対応するp個の部分領域aの領域値x2 kに基づいて、前記第1画像Iおよび第2画像Iの当該特徴領域A内の相関値
    を演算する相関値演算ステップと、
    前記コンピュータにより、T個の特徴領域Aに関する前記相関値Cに基づいて、前記第1画像Iおよび第2画像Iの類似度を演算する相関ベース類似度演算ステップとを含み、
    前記部分領域a は、所定の一方向のみに関して特徴領域A を分割して得られる領域であり、
    前記相関ベース類似度演算ステップは、
    前記コンピュータにより、特徴領域A に関して前記相関値演算ステップによって求められた相関値C を所定のしきい値θ と比較し、前記相関値C が前記しきい値θ を超えていれば、前記第1画像I および第2画像I が類似していることを表す第1弱識別値h (I 1 ,I 2 )=H を当該特徴領域A に関する識別値とし、前記相関値C が前記しきい値θ 以下であれば、前記第1および第2画像I ,I が非類似であることを表す第2弱識別値h (I 1 ,I 2 )=H を当該特徴領域A に関する識別値とする比較ステップと、
    前記コンピュータにより、前記T個の特徴領域A についての前記識別値h (I 1 ,I 2 )を、重み付け係数w を乗じて線形結合することにより、前記第1画像I および第2画像I の類似度
    を演算する重み付け加算ステップとを含むことを特徴とする画像類似度演算方法。
  6. コンピュータによって請求項記載の画像類似度演算方法を実行する類似度演算ステップと、
    前記コンピュータにより、前記類似度演算ステップによって演算された類似度が所定の認識しきい値を超えていれば、前記第1画像Iと第2画像Iとが類似していると判断し、前記画像類似度演算装置によって演算された類似度が前記認識しきい値以下であれば、前記第1画像Iと第2画像Iとが非類似であると判断する判断ステップとを含むことを特徴とする画像認識方法。
  7. 第1画像Iと第2画像Iとを照合するための装置としてコンピュータを動作させるためのコンピュータプログラムであって、
    前記コンピュータプログラムは、前記コンピュータを、
    前記第1画像Iおよび第2画像I中に共通に設定可能なT個(Tは2以上の自然数)の特徴領域A(jは1≦j≦Tの自然数)のそれぞれに関して、前記第1画像I中の特徴領域A内におけるp個(pは2以上の自然数)の部分領域a(kは1≦k≦pの自然数)の領域値x1 kおよび前記第2画像I中の当該特徴領域A内における対応するp個の部分領域aの領域値x2 kに基づいて、前記第1画像Iおよび第2画像Iの当該特徴領域A内の相関値
    を演算する相関値演算手段、ならびに
    この相関値演算手段によって求められたT個の特徴領域Aに関する前記相関値Cに基づいて、前記第1画像Iおよび第2画像Iの類似度を演算する相関ベース類似度演算手段
    として機能させるものであり、
    前記部分領域a は、所定の一方向のみに関して特徴領域A を分割して得られる領域であり、
    前記相関ベース類似度演算手段は、
    前記相関値演算手段によって求められた相関値C を所定のしきい値θ と比較し、前記相関値C が前記しきい値θ を超えていれば、前記第1画像I および第2画像I が類似していることを表す第1弱識別値h (I 1 ,I 2 )=H を出力し、前記相関値C が前記しきい値θ 以下であれば、前記第1および第2画像I ,I が非類似であることを表す第2弱識別値h (I 1 ,I 2 )=H (ただし、H >H )を出力する比較手段と、
    前記T個の特徴領域A についての前記比較手段の出力値h (I 1 ,I 2 )を、重み付け係数w を乗じて線形結合することにより、前記第1画像I および第2画像I の類似度
    を演算する重み付け加算手段とを含むものであることを特徴とするコンピュータプログラム。
  8. 第1画像Iと第2画像Iとを照合するための装置としてコンピュータを動作させるためのコンピュータプログラムであって、
    前記コンピュータプログラムは、前記コンピュータを、
    T個(Tは2以上の自然数)の特徴領域A(jは1≦j≦Tの自然数)を、前記第1画像Iおよび第2画像I中に共通に設定する特徴領域設定手段、
    この特徴領域設定手段によって設定されたT個の特徴領域Aのそれぞれに関して、前記第1画像I中の特徴領域A内におけるp個(pは2以上の自然数)の部分領域a(kは1≦k≦pの自然数)の領域値x1 kおよび前記第2画像I中の当該特徴領域A内における対応するp個の部分領域aの領域値x2 kに基づいて、前記第1画像Iおよび第2画像Iの当該特徴領域A内の相関値
    を演算する相関値演算手段、ならびに
    この相関値演算手段によって求められたT個の特徴領域Aに関する前記相関値Cに基づいて、前記第1画像Iおよび第2画像Iの類似度を演算する相関ベース類似度演算手段
    として機能させるものであり、
    前記部分領域a は、所定の一方向のみに関して特徴領域A を分割して得られる領域であり、
    前記相関ベース類似度演算手段は、
    前記相関値演算手段によって求められた相関値C を所定のしきい値θ と比較し、前記相関値C が前記しきい値θ を超えていれば、前記第1画像I および第2画像I が類似していることを表す第1弱識別値h (I 1 ,I 2 )=H を出力し、前記相関値C が前記しきい値θ 以下であれば、前記第1および第2画像I ,I が非類似であることを表す第2弱識別値h (I 1 ,I 2 )=H (ただし、H >H )を出力する比較手段と、
    前記T個の特徴領域A についての前記比較手段の出力値h (I 1 ,I 2 )を、重み付け係数w を乗じて線形結合することにより、前記第1画像I および第2画像I の類似度
    を演算する重み付け加算手段とを含むものであることを特徴とするコンピュータプログラム。
  9. 第1画像Iと第2画像Iとを照合するための装置としてコンピュータを動作させるためのコンピュータプログラムであって、
    前記コンピュータは、前記第1画像Iおよび第2画像I中に共通に設定可能なT個(Tは2以上の自然数)の特徴領域A(jは1≦j≦Tの自然数)のそれぞれに関して、前記第1画像I中の特徴領域A内におけるp個(pは2以上の自然数)の部分領域a(kは1≦k≦pの自然数)の領域値x1 kを、前記第1画像Iの特徴量を表す照合データとして記憶した照合データ記憶手段を含み、
    前記コンピュータプログラムは、前記コンピュータを、
    前記T個の特徴領域Aを、前記第2画像I中に設定する特徴領域設定手段、
    この特徴領域設定手段によって設定されたT個の特徴領域Aのそれぞれに関して、前記第2画像I中の当該特徴領域A内におけるp個の部分領域aの領域値x2 kを前記第2画像Iの特徴量として演算する特徴量演算手段、
    前記T個の特徴領域Aのそれぞれに関して、前記照合データ記憶手段に記憶された第1画像Iの領域値x1 k-と、前記特徴量演算手段によって演算された第2画像Iの領域値x2 kとに基づいて、前記第1画像Iおよび第2画像Iの当該特徴領域A内の相関値
    を演算する相関値演算手段、ならびに
    この相関値演算手段によって求められたT個の特徴領域Aに関する前記相関値Cに基づいて、前記第1画像Iおよび第2画像Iの類似度を演算する相関ベース類似度演算手段
    として機能させるものであり、
    前記部分領域a は、所定の一方向のみに関して特徴領域A を分割して得られる領域であり、
    前記相関ベース類似度演算手段は、
    前記相関値演算手段によって求められた相関値C を所定のしきい値θ と比較し、前記相関値C が前記しきい値θ を超えていれば、前記第1画像I および第2画像I が類似していることを表す第1弱識別値h (I 1 ,I 2 )=H を出力し、前記相関値C が前記しきい値θ 以下であれば、前記第1および第2画像I ,I が非類似であることを表す第2弱識別値h (I 1 ,I 2 )=H (ただし、H >H )を出力する比較手段と、
    前記T個の特徴領域A についての前記比較手段の出力値h (I 1 ,I 2 )を、重み付け係数w を乗じて線形結合することにより、前記第1画像I および第2画像I の類似度
    を演算する重み付け加算手段とを含むものであることを特徴とするコンピュータプログラム。
  10. 前記コンピュータを、さらに、
    前記重み付け加算手段によって演算された類似度が所定の認識しきい値を超えていれば、前記第1画像Iと第2画像Iとが類似していると判断し、前記画像類似度演算装置によって演算された類似度が前記認識しきい値以下であれば、前記第1画像Iと第2画像Iとが非類似であると判断する判断手段
    として機能させることを特徴とする請求項ないしのいずれかに記載のコンピュータプログラム。
  11. 請求項ないし10のいずれかに記載のコンピュータプログラムが記録されたコンピュータ読取可能な記録媒体。
JP2004209052A 2004-07-15 2004-07-15 画像の相関ベース類似度を演算する類似度演算装置、認識装置、類似度演算方法、認識方法、照合用プログラム及びそれを記録した記録媒体 Expired - Fee Related JP4468756B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004209052A JP4468756B2 (ja) 2004-07-15 2004-07-15 画像の相関ベース類似度を演算する類似度演算装置、認識装置、類似度演算方法、認識方法、照合用プログラム及びそれを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004209052A JP4468756B2 (ja) 2004-07-15 2004-07-15 画像の相関ベース類似度を演算する類似度演算装置、認識装置、類似度演算方法、認識方法、照合用プログラム及びそれを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2006031388A JP2006031388A (ja) 2006-02-02
JP4468756B2 true JP4468756B2 (ja) 2010-05-26

Family

ID=35897652

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004209052A Expired - Fee Related JP4468756B2 (ja) 2004-07-15 2004-07-15 画像の相関ベース類似度を演算する類似度演算装置、認識装置、類似度演算方法、認識方法、照合用プログラム及びそれを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP4468756B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007272435A (ja) * 2006-03-30 2007-10-18 Univ Of Electro-Communications 顔特徴抽出装置及び顔特徴抽出方法
JP4705511B2 (ja) * 2006-04-28 2011-06-22 セコム株式会社 顔画像照合装置
JP4705512B2 (ja) * 2006-04-28 2011-06-22 セコム株式会社 顔画像照合装置
JP4752660B2 (ja) * 2006-07-28 2011-08-17 沖電気工業株式会社 個人認証方法及び個人認証装置
JP5010905B2 (ja) * 2006-12-13 2012-08-29 パナソニック株式会社 顔認証装置
JP5109564B2 (ja) * 2007-10-02 2012-12-26 ソニー株式会社 画像処理装置、撮像装置、これらにおける処理方法およびプログラム
JP5181825B2 (ja) * 2008-05-19 2013-04-10 株式会社ニコン 画像処理装置、画像処理方法およびプログラム
JP5185803B2 (ja) * 2008-12-26 2013-04-17 富士フイルム株式会社 特定対象画像判別システム
JP2011013732A (ja) * 2009-06-30 2011-01-20 Sony Corp 情報処理装置、情報処理方法、およびプログラム
JP5598694B2 (ja) * 2009-08-25 2014-10-01 スズキ株式会社 物標検出装置および物標検出方法
JP5917964B2 (ja) * 2012-03-19 2016-05-18 富士ゼロックス株式会社 錠剤、錠剤の製造方法、錠剤管理装置、錠剤照合装置及びプログラム
JP6161279B2 (ja) * 2012-12-20 2017-07-12 キヤノン株式会社 認証装置、撮像装置、認証方法およびプログラム
JP6573354B2 (ja) * 2014-11-28 2019-09-11 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Also Published As

Publication number Publication date
JP2006031388A (ja) 2006-02-02

Similar Documents

Publication Publication Date Title
Abdullah et al. Face recognition for criminal identification: An implementation of principal component analysis for face recognition
Bolle et al. Guide to biometrics
US7006671B2 (en) Personal identification apparatus and method
JP5010905B2 (ja) 顔認証装置
US8150109B2 (en) Large volume face recognition apparatus and method
JP2007206833A (ja) 生体照合方法および生体照合装置
Connaughton et al. Fusion of face and iris biometrics
KR100944247B1 (ko) 얼굴 인식 방법 및 시스템
JP2006031387A (ja) 画像認識装置、画像認識方法、画像認識プログラムおよび画像認識プログラムを記録した記録媒体
JP4351982B2 (ja) 個人認証方法、装置及びプログラム
JP4468756B2 (ja) 画像の相関ベース類似度を演算する類似度演算装置、認識装置、類似度演算方法、認識方法、照合用プログラム及びそれを記録した記録媒体
KR101087765B1 (ko) 얼굴 인식 기반의 범죄 용의자 탐지 및 식별 시스템
JP2010152706A (ja) 生体認証装置
Tran et al. Using cross-examples in viola-jones algorithm for thermal face detection
JP2004078686A (ja) 個人認証装置、個人認証方法、通行制御装置および通行制御方法
Yogalakshmi et al. Review on digital image processing techniques for face recognition
KR101116737B1 (ko) 요주의 인물 식별 시스템
JP2005084979A (ja) 顔認証システムおよび方法並びにプログラム
Phillips et al. A cancellable and privacy-preserving facial biometric authentication scheme
Rahim et al. Biometric authentication using face recognition algorithms for a class attendance system
Gambhir et al. Person recognition using multimodal biometrics
WO2021157023A1 (ja) 認証方法、情報処理装置、及び認証プログラム
Nithyasundari et al. Experimental Evaluation of Secured IRIS Recognition System using Learning Assisted Classification and Prediction Methodology
Singh et al. Adapted Facial Recognition And Spoofing Detection For Management Decision Making System: A Visually Impaired People Perspective
Vala et al. Facial biometrics for forensics

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091203

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100218

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100225

R150 Certificate of patent or registration of utility model

Ref document number: 4468756

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130305

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130305

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140305

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees