JP2012221061A - 画像認識装置、画像認識方法、及びプログラム - Google Patents
画像認識装置、画像認識方法、及びプログラム Download PDFInfo
- Publication number
- JP2012221061A JP2012221061A JP2011084009A JP2011084009A JP2012221061A JP 2012221061 A JP2012221061 A JP 2012221061A JP 2011084009 A JP2011084009 A JP 2011084009A JP 2011084009 A JP2011084009 A JP 2011084009A JP 2012221061 A JP2012221061 A JP 2012221061A
- Authority
- JP
- Japan
- Prior art keywords
- image
- local
- local region
- similarity
- face
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
【解決手段】入力画像から複数の局所領域を切り出して特徴量を抽出する抽出手段と、抽出手段で切り出された局所領域ごとに登録画像との類似度を算出する照合手段と、抽出手段で切り出された局所領域の状態をもとに局所領域を選択する選択手段と、選択手段で選択された局所領域をもとに登録画像との距離を算出するメトリック行列を選択し、選択したメトリック行列と選択手段で選択された局所領域の照合手段で算出された類似度とを用いて入力画像が登録画像と同じカテゴリの画像であるかを識別する識別手段とを有することによって課題を解決する。
【選択図】図1
Description
この技術は、例えば、カメラに写っている人物が登録者であると認証されたときにオフィスへの入室を許可する等のセキュリティ用途に使用されている。一方、この技術を同一人物が写っている写真の検索に利用したいといった要望もある。
前者の用途においては、人物を撮影する際の条件に制約を付けて高精度の認識を可能としている。しかしながら、後者の場合においては、人物の撮影条件が多岐におよび、認識の精度が低下するといった問題がある。例えば、顔の向き、表情、撮影時の照明が異なった写真間では同一人物が写っていても、別人物であると誤判定されてしまうことがある。
一方、入力の顔画像と登録の顔画像との類似度を評価するメトリック関数を予め収集した同一人物、及び非同一人物の顔画像の組を用いて学習しておき、メトリック関数を用いて照合を行うことで識別性能を向上させている方法が公開されている(非特許文献2)。即ち、顔画像の類似性の判定を単なる主成分分析ではなく、顔画像の特徴量における同一人物と非同一人物との間の識別に適した成分を学習用のサンプルから抽出するという方法がとられている。
端点検出部130は、顔検出部120で切り出された顔画像から顔の特徴を表す目、鼻、口などの顔部品の端点を検出する。局所特徴抽出部140は、顔検出部120で切り出された顔画像から端点検出部130で検出された端点位置に基づいて局所領域を切り出し、切り出した局所領域から顔を認識するための特徴量を求める。
統合識別部180は、局所領域選択部170で選択された局所領域の類似度を統合し、入力の顔画像の人物が登録された画像(登録画像)の人物であるかの判定を行う。この際、統合識別部180は、局所領域選択部170で選択された局所領域に応じて認識パラメータ記憶部210に記憶されているメトリック行列を選択的に適用する。
登録顔データ記憶部220は、特徴量照合部160で使用される予め登録された特定の人物の顔画像(登録画像の一例)から得られた特徴量などを記憶するメモリである。
まず、画像取得部110は、カメラ等の撮像部で撮像された画像データ(入力画像)を取得する(S101)。取得された画像データは、画像取得部110内部のメモリに記憶される。このとき、取得された画像データは、輝度画像であるとする。なお、画像取得部110は、RGB等のカラー画像を取得した場合、輝度画像に変換して記憶する。
端点検出部130は、顔検出部120で切り出された顔画像から顔の特徴を表す目、鼻、口などの顔部品の端点を検出する(S103)。例えば、端点検出部130は、図3のように両目の目尻、目頭、口の左右の両端点の位置を検出する。これらの特徴点を検出する技術としては、例えば、非特許文献4に開示されている方法を用いる。検出された端点位置の座標は、端点検出部130内部のメモリに記憶される。
例えば、局所特徴抽出部140は、左目の領域を切り出す場合は、端点検出部130内部のメモリに記憶されている左目の目尻、及び目頭の位置の座標を参照して顔検出部120内部のメモリに記憶されている顔画像から切り出す。即ち、局所特徴抽出部140は、左目の目尻、及び目頭の位置の座標から顔画像中の左目領域の四隅の位置の座標を所定の幾何学的関係に基づいて求め、左目領域が所定の矩形になるように幾何変換を施して局所領域画像を得る。なお、局所領域は、例えば30×31画素の矩形領域になるように変換される。
求められた特徴量は、30×30画素、1ビット、即ち、900ビットで局所特徴抽出部140内部のメモリに記憶される。同様にして、局所特徴抽出部140は、その他の局所領域に対しても夫々参照すべき端点位置の座標に基づいて顔検出部120内部のメモリに記憶されている顔画像から画像データを切り出して特徴量を求める。
また、局所領域のサイズは、局所領域毎に適切なサイズで求めるようにしてもよいし、全局所領域で同じサイズにしてもよい。また、さらに多くの局所領域から特徴量を求めるようにしてもよい。また、ここでは、特徴量として増分符号を用いる場合について説明したが、その他、輝度勾配ヒストグラム、ガボールウェーブレットなどの特徴量を用いるようにしてもよいし、それらを組合せた特徴量を用いるようにしてもよい。
射影行列については、予め局所領域毎に学習用のサンプルから得た特徴量を主成分分析して求めておく。即ち、多くの顔画像を予め数千から数万サンプルのオーダーで収集しておき、前述のS101〜S104の処理を行い、局所領域毎に900ビットで表現された900次元の特徴ベクトルとして求めておく。そして、求めた特徴ベクトルの集合に対して主成分分析を行い、上位の主成分(規定の数であり、例えば、50個)に射影する射影ベクトルを局所領域毎に求めて認識パラメータ記憶部210に記憶しておく。
特徴量照合部160は、次元圧縮部150で圧縮された特徴量と予め登録顔データ記憶部220に登録されている特徴量とを照合し、これらの類似度を求める(S106)。ここで、登録顔(登録の顔画像)の特徴量は、入力の顔画像と同様に前述のS101〜S105の処理により求められた特徴量である。特徴量同士の照合は、局所領域毎にマンハッタン距離の計算により行われ、その逆数が類似度を表す。
なお、距離計算の方法は、マンハッタン距離の他、ユークリッド距離、データの分散を考慮したマハラノビス距離などを用いてもよい。また、コサイン類似度で類似度を求める方法を用いてもよい。
図5は、顔の左目及び左眉の部分に髪の毛がかかり、隠れが生じた場合の入力の顔画像を示す図である。この場合、入力の顔画像の人物と登録の顔画像の人物とが同一人物であったとしても、隠れの発生した局所領域において類似度が極度に低くなる。このように、入力の顔画像の一部に隠れがあった場合に、その局所領域の特徴量を使ってしまうと認識の精度の低下を招くため、そのような局所領域の状態によって精度が低下する影響を回避するようにしている。同様のことが、顔が正面でなく、斜め向きであった場合、外部環境により顔の一部に強烈な陰影が生じた場合にも言える。
なお、本実施形態では、登録の顔画像との局所特徴量の類似度をもとに局所領域を選択するかどうかを判断するようにしたが、他の方法によって選択するようにしてもよい。例えば、局所領域選択部170は、局所領域選択部170内に局所領域毎に入力の顔画像の局所領域の状態が精度の低下を招くものかどうかを入力の顔画像の局所特徴量をもとに判定する。換言するならば、局所領域選択部170は、局所領域の状態をもとに顔の識別に使う局所領域を選択するものである。
例えば、図5に示したような隠れが生じた場合や顔が斜め向きであった場合、局所領域選択部170は、強烈な陰影が生じた場合に得られる特徴量であるか否かという判定を行い、その場合には局所領域を選択しないようにする。
まず、メトリック行列について説明する。メトリック行列とは、非特許文献2で説明されているように2つの特徴ベクトル間の距離を測るための行列である。
通常は、データの分散共分散行列を用いてマハラノビス距離を測定するが、近年、教師付きデータをもとに目的関数を設定し、この目的関数の誤差を最小化するように距離を測る行列を学習により求める方法が提案されている。
例えば、非特許文献2では、LDML(Logistic Discriminant based Metric Learning)を顔画像の特徴量に適用してメトリック行列を求めている。また、例えば、非特許文献2では、ITML(Information Theoretic Metric Learning)を顔画像の特徴量に適用してメトリック行列を求めている。本実施形態においてもLDMLやITMLでメトリック行列を学習し、テスト画像について結果のよいものを採用する。
dM = xTMx (式1)
ここで、Mは、D行D列の対称正定値行列で、Dは、特徴ベクトルxの次元、Tは、転置を表す。また、x=(x1,x2,x3, ・・・,xN)T で、xiは、i番目の局所領域の入力画像と登録画像との類似度である。
また、メトリック行列による類似度の算出では、(式1)に従い、局所領域毎に求められた類似度が結合されて構成される特徴ベクトルから距離dMが求められる。ただし、本実施形態では、S107で有効な局所領域のみが選択され、それに対して顔全体の類似度が算出されるようにする。そのため、メトリック行列の学習が局所領域の選択ケースの全ての場合について行われ、求められたメトリック行列を認識パラメータ記憶部210に記憶しておく。
そして、局所領域選択部170で選択された局所領域に応じて認識パラメータ記憶部210に記憶されているメトリック行列が選択されるようにする。例えば、図5に示した顔画像の場合には左目、及び左眉を除いた4つの領域の類似度を用いて顔全体の類似度を算出するメトリック行列が選択されるようにする。
そのような場合は、より多くの局所領域に対応した要素数の多いメトリック行列のみを認識パラメータ記憶部210に記憶し、S107で選択された局所領域が包含されるメトリック行列が選択されるようにする。
そして、選択されたメトリック行列から選択された局所領域に対応する要素のみを使用して顔全体の類似度が算出されるようにする。
dM′ = x′TM′x′ (式2)
ここで、M′は、S108で選択されたメトリック行列、x′は、S107で選択された局所領域間の特徴量の類似度が結合されて構成される特徴ベクトルである。
以上は、登録人物が一人の場合について説明したが、登録人物が複数である場合にも本実施形態は適用できる。前述したS106〜S109の処理を登録人物の顔画像毎に繰り返し、類似度が所定の値以上の登録の顔画像が複数あった場合に、類似度が最大の登録の顔画像の人物を該当人物と判断するようにする。
また、統合識別部180は、認識結果を出力する(S110)。
したがって、局所領域の類似性に基づいた隠れや顔の向き、照明の影響にロバストな認識方法とメトリック行列による高精度の類似度の判定との両方のメリットを生かした高精度の顔認識を行うことができる。
なお、本実施形態では、顔の認識を例に説明したが、本実施形態は入力画像が所定のカテゴリの物体であるかを識別するアプリケーションに広く適用できる。例えば、本実施形態は、顔画像が犬の顔であるか、猫の顔であるか、或いはどの犬種の顔であるか等、動物の顔の分類に適用することができる。
画像認識装置は、CPU、ROM、RAM、ハードディスク等を有する情報処理装置(コンピュータ)、情報処理装置を有するカメラ等であってもよい。この場合、基本的には、CPUにより、ROM、ハードディスク等に記憶されているプログラムがRAMにロードされて実行されることで、画像認識装置の機能、フローチャートに係る処理が実現される。
ただし、画像認識装置の機能、フローチャートに係る処理の一部、又は全部を専用のハードウェアを用いて構成してもよい。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (6)
- 入力画像から複数の局所領域を切り出して特徴量を抽出する抽出手段と、
前記抽出手段で切り出された局所領域ごとに登録画像との類似度を算出する照合手段と、
前記抽出手段で切り出された局所領域の状態をもとに局所領域を選択する選択手段と、
前記選択手段で選択された局所領域をもとに前記登録画像との距離を算出するメトリック行列を選択し、選択したメトリック行列と前記選択手段で選択された局所領域の前記照合手段で算出された類似度とを用いて前記入力画像が前記登録画像と同じカテゴリの画像であるかを識別する識別手段とを有することを特徴とする画像認識装置。 - 前記選択手段は、前記照合手段で算出された類似度が高いものから規定の数の局所領域を選択することを特徴とする請求項1に記載の画像認識装置。
- 前記メトリック行列は、予め収集した画像サンプルに対して前記局所領域をカテゴリ別に分類し、同じカテゴリの画像間の距離が小さく、異なるカテゴリの画像間の距離が大きくなるように求められたものであることを特徴とする請求項1に記載の画像認識装置。
- 前記登録画像は、人物の顔画像であることを特徴とする請求項1に記載の画像認識装置。
- 入力画像から複数の局所領域を切り出して特徴量を抽出する抽出工程と、
前記抽出工程で切り出された局所領域ごとに登録画像との類似度を算出する照合工程と、
前記抽出工程で切り出された局所領域の状態をもとに局所領域を選択する選択工程と、
前記選択工程で選択された局所領域をもとに前記登録画像との距離を算出するメトリック行列を選択し、選択したメトリック行列と前記選択工程で選択された局所領域の前記照合工程で算出された類似度とを用いて前記入力画像が前記登録画像と同じカテゴリの画像であるかを識別する識別工程とを有することを特徴とする画像認識方法。 - 請求項5に記載の画像認識方法の各工程をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011084009A JP5777380B2 (ja) | 2011-04-05 | 2011-04-05 | 画像認識装置、画像認識方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011084009A JP5777380B2 (ja) | 2011-04-05 | 2011-04-05 | 画像認識装置、画像認識方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012221061A true JP2012221061A (ja) | 2012-11-12 |
JP5777380B2 JP5777380B2 (ja) | 2015-09-09 |
Family
ID=47272547
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011084009A Expired - Fee Related JP5777380B2 (ja) | 2011-04-05 | 2011-04-05 | 画像認識装置、画像認識方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5777380B2 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015106197A (ja) * | 2013-11-28 | 2015-06-08 | キヤノン株式会社 | 画像処理装置、画像処理方法 |
JP2015133085A (ja) * | 2014-01-15 | 2015-07-23 | キヤノン株式会社 | 情報処理装置およびその方法 |
WO2015146241A1 (ja) * | 2014-03-27 | 2015-10-01 | Nkワークス株式会社 | 画像処理装置 |
JP2016018422A (ja) * | 2014-07-09 | 2016-02-01 | キヤノン株式会社 | 画像処理方法、画像処理装置、プログラム、記録媒体、生産装置、及び組立部品の製造方法 |
JP2017167987A (ja) * | 2016-03-17 | 2017-09-21 | ヤフー株式会社 | 判定装置、および判定方法 |
CN110088765A (zh) * | 2016-12-21 | 2019-08-02 | 松下知识产权经营株式会社 | 对照装置和对照方法 |
WO2020121425A1 (ja) * | 2018-12-12 | 2020-06-18 | 三菱電機株式会社 | 状態判定装置、状態判定方法、及び状態判定プログラム |
CN112513926A (zh) * | 2018-07-31 | 2021-03-16 | 奥林巴斯株式会社 | 图像解析装置及图像解析方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102221118B1 (ko) | 2016-02-16 | 2021-02-26 | 삼성전자주식회사 | 영상의 특징을 추출하여 객체를 인식하는 방법 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09134432A (ja) * | 1995-07-17 | 1997-05-20 | Nec Corp | パターン認識方法 |
JPH10177650A (ja) * | 1996-12-16 | 1998-06-30 | Nec Corp | 画像特徴抽出装置,画像特徴解析装置,および画像照合システム |
JP2003296735A (ja) * | 2002-03-29 | 2003-10-17 | Nec Corp | 顔メタデータ生成方法および顔メタデータ生成装置 |
JP2008152789A (ja) * | 2006-12-18 | 2008-07-03 | Samsung Electronics Co Ltd | 顔映像の類似度の算出方法及び装置とこれを利用した顔映像の検索方法及び装置、並びに顔合成方法 |
JP2009211178A (ja) * | 2008-02-29 | 2009-09-17 | Canon Inc | 画像処理装置、画像処理方法、プログラム及び記憶媒体 |
JP2010257158A (ja) * | 2009-04-23 | 2010-11-11 | Canon Inc | オブジェクト識別装置及びオブジェクト識別方法 |
-
2011
- 2011-04-05 JP JP2011084009A patent/JP5777380B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09134432A (ja) * | 1995-07-17 | 1997-05-20 | Nec Corp | パターン認識方法 |
JPH10177650A (ja) * | 1996-12-16 | 1998-06-30 | Nec Corp | 画像特徴抽出装置,画像特徴解析装置,および画像照合システム |
JP2003296735A (ja) * | 2002-03-29 | 2003-10-17 | Nec Corp | 顔メタデータ生成方法および顔メタデータ生成装置 |
JP2008152789A (ja) * | 2006-12-18 | 2008-07-03 | Samsung Electronics Co Ltd | 顔映像の類似度の算出方法及び装置とこれを利用した顔映像の検索方法及び装置、並びに顔合成方法 |
JP2009211178A (ja) * | 2008-02-29 | 2009-09-17 | Canon Inc | 画像処理装置、画像処理方法、プログラム及び記憶媒体 |
JP2010257158A (ja) * | 2009-04-23 | 2010-11-11 | Canon Inc | オブジェクト識別装置及びオブジェクト識別方法 |
Non-Patent Citations (1)
Title |
---|
MATTHIEU GUILLAUMIN, JAKOB VERBEEK AND CORDELIA SCHMID: "Is that you? Metric Learning Approaches for Face Identification", IEEE CONFERENCE ON COMPUTER VISION, JPN6015006424, October 2009 (2009-10-01), ISSN: 0003010183 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015106197A (ja) * | 2013-11-28 | 2015-06-08 | キヤノン株式会社 | 画像処理装置、画像処理方法 |
JP2015133085A (ja) * | 2014-01-15 | 2015-07-23 | キヤノン株式会社 | 情報処理装置およびその方法 |
US10469793B2 (en) | 2014-03-27 | 2019-11-05 | Noritsu Precision Co., Ltd. | Image processing device |
WO2015146241A1 (ja) * | 2014-03-27 | 2015-10-01 | Nkワークス株式会社 | 画像処理装置 |
JP2016018422A (ja) * | 2014-07-09 | 2016-02-01 | キヤノン株式会社 | 画像処理方法、画像処理装置、プログラム、記録媒体、生産装置、及び組立部品の製造方法 |
JP2017167987A (ja) * | 2016-03-17 | 2017-09-21 | ヤフー株式会社 | 判定装置、および判定方法 |
CN110088765A (zh) * | 2016-12-21 | 2019-08-02 | 松下知识产权经营株式会社 | 对照装置和对照方法 |
CN110088765B (zh) * | 2016-12-21 | 2023-01-03 | 松下知识产权经营株式会社 | 对照装置和对照方法 |
CN112513926A (zh) * | 2018-07-31 | 2021-03-16 | 奥林巴斯株式会社 | 图像解析装置及图像解析方法 |
WO2020121425A1 (ja) * | 2018-12-12 | 2020-06-18 | 三菱電機株式会社 | 状態判定装置、状態判定方法、及び状態判定プログラム |
JPWO2020121425A1 (ja) * | 2018-12-12 | 2021-05-20 | 三菱電機株式会社 | 状態判定装置、状態判定方法、及び状態判定プログラム |
DE112018008131B4 (de) | 2018-12-12 | 2022-10-27 | Mitsubishi Electric Corporation | Zustandsbestimmungseinrichtung, zustandsbestimmungsverfahren und zustandsbestimmungsprogramm |
US11963759B2 (en) | 2018-12-12 | 2024-04-23 | Mitsubishi Electric Corporation | State determination device, state determination method, and recording medium |
Also Published As
Publication number | Publication date |
---|---|
JP5777380B2 (ja) | 2015-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5777380B2 (ja) | 画像認識装置、画像認識方法、及びプログラム | |
Soltanpour et al. | A survey of local feature methods for 3D face recognition | |
Narzillo et al. | Peculiarities of face detection and recognition | |
Lei et al. | A two-phase weighted collaborative representation for 3D partial face recognition with single sample | |
Arashloo et al. | Class-specific kernel fusion of multiple descriptors for face verification using multiscale binarised statistical image features | |
Biswas et al. | Pose-robust recognition of low-resolution face images | |
Pedagadi et al. | Local fisher discriminant analysis for pedestrian re-identification | |
Kumar et al. | Real time face recognition using adaboost improved fast PCA algorithm | |
Xu et al. | Automatic 3D face recognition from depth and intensity Gabor features | |
Barnouti et al. | Face recognition: A literature review | |
JP5202148B2 (ja) | 画像処理装置、画像処理方法、及びコンピュータプログラム | |
Geng et al. | Face recognition based on the multi-scale local image structures | |
Kahou et al. | Facial expression analysis based on high dimensional binary features | |
Wei et al. | Dynamic image-to-class warping for occluded face recognition | |
Li et al. | Learning compact feature descriptor and adaptive matching framework for face recognition | |
Danelakis et al. | A survey on facial expression recognition in 3D video sequences | |
Ouanan et al. | Facial landmark localization: Past, present and future | |
US8861803B2 (en) | Image recognition apparatus, image recognition method, and program | |
Ramalingam et al. | Robust face recognition using enhanced local binary pattern | |
JP2013218605A (ja) | 画像認識装置、画像認識方法及びプログラム | |
Kaushik et al. | Recognition of facial expressions extracting salient features using local binary patterns and histogram of oriented gradients | |
Acevedo et al. | Facial expression recognition based on static and dynamic approaches | |
JP5286574B2 (ja) | オブジェクト検出認識装置、オブジェクト検出認識方法、および、プログラム | |
Deepa et al. | Challenging aspects for facial feature extraction and age estimation | |
Shinwari et al. | A comparative study of face recognition algorithms under occlusion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140407 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150224 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150427 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150609 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150707 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5777380 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |