JP2009110486A - 画像処理装置、画像処理方法および画像処理プログラム、並びに、撮像装置および撮像装置の制御方法 - Google Patents

画像処理装置、画像処理方法および画像処理プログラム、並びに、撮像装置および撮像装置の制御方法 Download PDF

Info

Publication number
JP2009110486A
JP2009110486A JP2007285022A JP2007285022A JP2009110486A JP 2009110486 A JP2009110486 A JP 2009110486A JP 2007285022 A JP2007285022 A JP 2007285022A JP 2007285022 A JP2007285022 A JP 2007285022A JP 2009110486 A JP2009110486 A JP 2009110486A
Authority
JP
Japan
Prior art keywords
image data
face
rectangular area
image
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007285022A
Other languages
English (en)
Inventor
Yoshihiro Suzuki
義弘 鈴木
Kyoko Fukuda
京子 福田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007285022A priority Critical patent/JP2009110486A/ja
Priority to US12/290,317 priority patent/US8340367B2/en
Publication of JP2009110486A publication Critical patent/JP2009110486A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/21Intermediate information storage
    • H04N1/2166Intermediate information storage for mass storage, e.g. in document filing systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2101/00Still video cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/633Control of cameras or camera modules by using electronic viewfinders for displaying additional information relating to control or operation of the camera
    • H04N23/635Region indicators; Field of view indicators

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

【課題】撮像された画像の中の顔をより正確に検出する。
【解決手段】顔候補データベースから読み出された矩形領域F31の顔候補画像データに対して、水平および垂直方向にそれぞれ幅Mだけ距離を持たせた同一判定枠F30を設け、重複すると判定された矩形領域画像データが同一判定枠F30内に含まれるか否かを判定する。重複すると判定された矩形領域F32の画像データが同一判定枠F30内に含まれる場合には、矩形領域F32の画像データが矩形領域F31の顔候補画像データと同一の顔に対する矩形領域画像データであると判定する。一方、重複すると判定された矩形領域F33の画像データが同一判定枠F30内に含まれない場合には、矩形領域F33の画像データが矩形領域F31の顔候補画像データと同一の顔に対する矩形領域画像データではない、または、確度値の低い矩形領域画像データであると判定する。
【選択図】図9

Description

この発明は、画像の中から顔領域を検出する画像処理装置、画像処理方法および画像処理プログラム、並びに、撮像装置および撮像装置の制御方法に関する。
近年、静止画像の撮影を主とするディジタルスチルカメラや動画像の撮影を主とするディジタルビデオカメラには、撮影対象となる人物の顔を検出し、検出結果をAF(Auto Focus)やAE(Auto Exposure)、AWB(Auto White Balance)の制御に用いたり、撮影画像の肌色の色合いの調整を行ったりする機能が搭載されてきている。
このような機能を正確に利用するためには、顔の検出率が高いことに加えて、顔の位置および大きさを正確に検出する必要がある。顔の位置や大きさが正確に検出できない場合には、検出された部分に背景の一部などの顔以外の画像が写りこんでしまい、顔以外の部分の画像がAFやAE、AWB、色合い調整の制御パラメータの算出に影響を及ぼしてしまうためである。
例えば、下記の特許文献1には、顔らしさを示す確度値に基づき、対象物が顔であるか否かを判断する方法が記載されている。
特開2005−157679号公報
また、下記の特許文献2には、画像を段階的に縮小させて走査を行い、画像の中から顔の位置およびサイズを検索する方法が記載されている。
特開2004−30629号公報
特許文献1および特許文献2では、例えば図4に示すように、撮像された画像の左上の端から右下の端まで、所定サイズの矩形領域を水平方向にΔx、垂直方向にΔyだけ移動させて走査することにより、顔の位置を求める。また、例えば図3に示すように、撮像された画像を所定の縮小率Δr毎に段階的に縮小させた縮小画像を生成し、生成された縮小画像に対して走査を繰り返すことにより、顔のサイズを求める。
そして、所定サイズの矩形領域内の全ての画素の中から、予め学習によって定められた2点の画素の輝度値の差分を全て算出し、算出結果に基づき顔らしさを示す確度値をそれぞれ求める。矩形領域の画像の確度値には、対象物が顔であるか否かを判断するための閾値が予め設けられており、算出された確度値が閾値以上であれば、対象物が顔であると判断し、閾値よりも低ければ、対象物が顔でないと判断する。
例えば、図5に示すように、画像に対して水平方向に走査した場合、矩形領域の画像の確度値は、実際の顔のX座標に近いほど高く、実際の顔のX座標から遠ざかるに従って低くなる。この例において、矩形領域F2,F3およびF4の確度値は、予め設定された閾値以上であるため、顔であると判断される。また、矩形領域F1およびF5の確度値は、閾値よりも低いため、顔でないと判断される。
また、例えば、図6に示すように、画像に対して垂直方向に走査した場合、矩形領域の画像の確度値は、実際の顔のY座標に近いほど高く、実際の顔のY座標から遠ざかるに従って低くなる。この例において、矩形領域F12,F13およびF14の確度値は、閾値以上であるため、顔であると判断される。また、矩形領域F11およびF15の確度値が閾値よりも低いため、顔でないと判断される。
さらに、例えば、図7に示すように画像を縮小した場合、矩形領域の画像の確度値は、実際の顔のサイズに近いほど高く、実際の顔のサイズから遠ざかるに従って低くなる。この例では、矩形領域F22,F23,F24およびF25の確度値は、閾値以上であるため、顔であると判断される。また、矩形領域F21の確度値は、閾値よりも低いため、顔でないと判断される。
このように、画像の中から顔を検索し、対象物が顔であるか否かを判断する方法では、画像を走査することによって、同一の顔に対して確度値が異なる顔が複数個検出されることになるため、検出された顔の中から正しい顔を抽出する必要がある。正しい顔を抽出する方法としては、例えば、検出された複数の顔の中から確度値が一番高いものを選択する方法が用いられる。
しかしながら、上述の特許文献1および特許文献2に記載の方法では、画像に対して矩形領域を走査する際に、離散的に走査することになるため、検出された顔の中で最も確度値の高いものが実際の顔の位置およびサイズであるとは限らない。
例えば、検出された顔の中で最も確度値の高いものを検出結果とする場合、図5に示す例では、矩形領域F3の顔が抽出され、図6に示す例では、矩形領域F13の顔が抽出される。また、図7に示す例では、矩形領域F23の顔が抽出される。ここで抽出された顔は、画像の中で最も確度値の高いもの、すなわち、確度値を示すグラフの頂点における顔ではないため、実際の顔の位置およびサイズと異なる。したがって、実際の顔の位置およびサイズと検出結果の顔の位置およびサイズとの差が誤差となるという問題点があった。
この問題点を解決する方法としては、走査の際に移動する移動量ΔxおよびΔyを限りなく0に近づけるとともに、画像を縮小する際の縮小率Δrを限りなく等倍に近づけ、ほぼ連続的な走査を行う方法が考えられるが、連続的な走査を行うと、顔を検出するための処理の回数が大幅に増加してしまい、処理に時間を要してしまう。
また、この問題を解決するための別の方法として、検出された顔の位置およびサイズの平均をとったものを検出結果とする方法が考えられる。しかしながら、例えば、検出された顔のうち、閾値付近のものは確度値が低く、顔の位置およびサイズの信頼性が低いため、閾値付近の確度値が低い画像を平均化する要素に含めてしまうと、実際の顔の位置およびサイズとの誤差が大きくなってしまうおそれがある。
さらに、特許文献1および特許文献2に記載の方法では、確度値の大きさに基づき顔であるか否かを判断するようにしているため、人物同士が寄り添って顔を近づけている場合など、複数の人物の顔が隣接している場合に、検出された複数の人物の顔が同一人物の顔であると判断され、異なる人物の顔を検出結果としてしまう場合がある。
例えば、図13に示すように、2人の人物aおよび人物bが寄り添って顔を近づけている場合について考える。このような画像から顔を検出する場合には、隣接する2人の人物aおよび人物bの顔の近辺に複数の顔を検出し、検出された顔の確度値を比較して最も確度値が高い顔を検出結果として抽出する。この例では、人物aの顔の検出結果を示す矩形領域F61と人物bの顔の検出結果を示す矩形領域F62とを比較し、確度値の高い矩形領域F62の画像を人物aの顔の検出結果として抽出してしまう。すなわち、隣の人物bの顔を人物aの顔として検出してしまうことになる。
このように、従来は、複数の人物の顔が隣接している場合に、隣接する人物の顔を誤って検出してしまうという問題点があった。
したがって、この発明の目的は、撮像された画像の中の顔領域をより正確に検出することができる画像処理装置、画像処理方法および画像処理プログラム、並びに、撮像装置および撮像装置の制御方法を提供することにある。
上述した課題を解決するために、第1の発明は、入力された画像データのサイズを変換する画像変換部と、
サイズ変換された画像データを記憶し、サイズ変換された画像データに対して所定サイズの矩形領域を移動させて走査処理を行い、矩形領域画像データを順次切り出す画像メモリと、
切り出された矩形領域画像データから顔領域を検出する顔検出処理部と
を有し、
画像メモリには、複数の顔候補についての顔領域を含む複数の顔候補画像データがそれぞれ記憶され、
顔検出処理部は、
矩形領域画像データが顔領域を含むか否かを判定する顔判定処理を行い、
矩形領域画像データが顔領域を含むと判定された場合に、画像メモリに記憶された所定の顔候補に対する顔候補画像データに対して水平方向および垂直方向に所定幅を加えた同一判定枠を設定し、同一判定枠を基準として矩形領域画像データが同一判定枠内に含まれるか否かを判定する同一判定処理を行う
ことを特徴とする画像処理装置である。
また、第2の発明は、入力された画像データのサイズを変換する画像変換ステップと、
サイズ変換された画像データを画像メモリに記憶し、サイズ変換された画像データに対して所定サイズの矩形領域を移動させて走査処理を行い、矩形領域画像データを順次切り出す走査ステップと、
切り出された矩形領域画像データから顔領域を検出する顔検出処理ステップと
を有し、
画像メモリには、複数の顔候補についての顔領域を含む複数の顔候補画像データがそれぞれ記憶され、
顔検出処理ステップは、
矩形領域画像データが顔領域を含むか否かを判定する顔判定処理を行い、
矩形領域画像データが顔領域を含むと判定された場合に、画像メモリに記憶された所定の顔候補に対する顔候補画像データに対して水平方向および垂直方向に所定幅を加えた同一判定枠を設定し、同一判定枠を基準として矩形領域画像データが同一判定枠内に含まれるか否かを判定する同一判定処理を行う
ことを特徴とする画像処理方法である。
また、第3の発明は、入力された画像データのサイズを変換する画像変換ステップと、
サイズ変換された画像データを画像メモリに記憶し、サイズ変換された画像データに対して所定サイズの矩形領域を移動させて走査処理を行い、矩形領域画像データを順次切り出す走査ステップと、
切り出された矩形領域画像データから顔領域を検出する顔検出処理ステップと
を有し、
画像メモリには、複数の顔候補についての顔領域を含む複数の顔候補画像データがそれぞれ記憶され、
顔検出処理ステップは、
矩形領域画像データが顔領域を含むか否かを判定する顔判定処理を行い、
矩形領域画像データが顔領域を含むと判定された場合に、画像メモリに記憶された所定の顔候補に対する顔候補画像データに対して水平方向および垂直方向に所定幅を加えた同一判定枠を設定し、同一判定枠を基準として矩形領域画像データが同一判定枠内に含まれるか否かを判定する同一判定処理を行う画像処理方法をコンピュータ装置に実行させる
ことを特徴とする画像処理プログラムである。
また、第4の発明は、被写体からの光を撮像して取得された撮像信号を出力する撮像部と、
撮像部から出力された撮像信号に対して信号処理を施し画像データとして出力するカメラ信号処理部と、
画像データに対して顔検出処理を施す顔検出部と
を備え、
顔検出部は、
画像データのサイズを変換する画像変換部と、
サイズ変換された画像データを記憶し、サイズ変換された画像データに対して所定サイズの矩形領域を移動させて走査処理を行い、矩形領域画像データを順次切り出す画像メモリと、
切り出された矩形領域画像データから顔領域を検出する顔検出処理部と
を有し、
画像メモリには、複数の顔候補についての顔領域を含む複数の顔候補画像データがそれぞれ記憶され、
顔検出処理部は、
矩形領域画像データが顔領域を含むか否かを判定する顔判定処理を行い、
矩形領域画像データが顔領域を含むと判定された場合に、画像メモリに記憶された所定の顔候補に対する顔候補画像データに対して水平方向および垂直方向に所定幅を加えた同一判定枠を設定し、同一判定枠を基準として矩形領域画像データが同一判定枠内に含まれるか否かを判定する同一判定処理を行う
ことを特徴とする撮像装置である。
また、第5の発明は、
被写体からの光を撮像して取得された撮像信号を出力する撮像ステップと、
撮像部から出力された撮像信号に対して信号処理を施し画像データとして出力するカメラ信号処理ステップと、
画像データに対して顔検出処理を施す顔検出ステップと
を備え、
顔検出ステップは、
画像データのサイズを変換する画像変換ステップと、
サイズ変換された画像データを画像メモリに記憶し、サイズ変換された画像データに対して所定サイズの矩形領域を移動させて走査処理を行い、矩形領域画像データを順次切り出す走査ステップと、
切り出された矩形領域画像データから顔領域を検出する顔検出処理ステップと
を有し、
画像メモリには、複数の顔候補についての顔領域を含む複数の顔候補画像データがそれぞれ記憶され、
顔検出処理ステップは、
矩形領域画像データが顔領域を含むか否かを判定する顔判定処理を行い、
矩形領域画像データが顔領域を含むと判定された場合に、画像メモリに記憶された所定の顔候補に対する顔候補画像データに対して水平方向および垂直方向に所定幅を加えた同一判定枠を設定し、同一判定枠を基準として矩形領域画像データが同一判定枠内に含まれるか否かを判定する同一判定処理を行う
ことを特徴とする撮像装置の制御方法である。
上述したように、第1、第2および第3の発明では、入力された画像データのサイズを変換し、サイズ変換された画像データを画像メモリに記憶し、サイズ変換された画像データに対して所定サイズの矩形領域を移動させて走査処理を行い、矩形領域画像データを順次切り出し、切り出された矩形領域画像データから顔領域を検出する顔検出処理を行い、画像メモリには、複数の顔候補についての顔領域を含む複数の顔候補画像データがそれぞれ記憶され、顔検出処理において、矩形領域画像データが顔領域を含むか否かを判定する顔判定処理を行い、矩形領域画像データが顔領域を含むと判定された場合に、画像メモリに記憶された所定の顔候補に対する顔候補画像データに対して水平方向および垂直方向に所定幅を加えた同一判定枠を設定し、同一判定枠を基準として矩形領域画像データが同一判定枠内に含まれるか否かを判定する同一判定処理を行うようにしているため、隣接する顔と判定対象の顔とを識別することができる。
また、第4および第5の発明では、被写体からの光を撮像して取得された撮像信号を出力し、撮像部から出力された撮像信号に対して信号処理を施し画像データとして出力し、画像データに対して顔検出処理を施し、顔検出処理において、画像データのサイズを変換し、サイズ変換された画像データを画像メモリに記憶し、サイズ変換された画像データに対して所定サイズの矩形領域を移動させて走査処理を行い、矩形領域画像データを順次切り出し、切り出された矩形領域画像データから顔領域を検出する顔検出処理を行い、画像メモリには、複数の顔候補についての顔領域を含む複数の顔候補画像データがそれぞれ記憶され、顔検出処理において、矩形領域画像データが顔領域を含むか否かを判定する顔判定処理を行い、矩形領域画像データが顔領域を含むと判定された場合に、画像メモリに記憶された所定の顔候補に対する顔候補画像データに対して水平方向および垂直方向に所定幅を加えた同一判定枠を設定し、同一判定枠を基準として矩形領域画像データが同一判定枠内に含まれるか否かを判定する同一判定処理を行うようにしているため、隣接する顔と判定対象の顔とを識別することができる。
この発明は、顔判定処理によって顔領域を含むと判定された矩形領域画像データに対して、画像メモリに記憶された顔候補画像データとの同一判定処理を行うようにしているため、隣接する顔と判定対象の顔とを識別することによって誤検出を防ぎ、より正確に判定対象の顔を検出することができるという効果がある。
以下、この発明の実施の一形態について、図面を参照して説明する。図1は、この発明の実施の一形態による撮像装置1の一例の構成を示す。撮像装置1は、画像バス10、光学ブロック11、信号変換部12、カメラ信号処理部13、顔検出部14、表示処理部15、画像信号処理部16、記憶部17、表示部18、画像RAM(Random Access Memory)19、CPU(Central Processing Unit)21、ROM(Read Only Memory)22およびRAM23を備える。
光学ブロック11は、内部に、被写体を撮像するためのレンズ群、絞り調整機構、フォーカス調整機構、ズーム機構、シャッター機構およびフラッシュ機構などを備え、後述するCPU21からの制御信号に応じてズーム制御、シャッター制御および露出制御などの制御が行われる。
信号変換部12は、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)イメージセンサなどの撮像素子により構成され、その結像面に、光学ブロック11を通じた像が結像される。この信号変換器12は、例えば、シャッター操作に応じてCPU21から供給される画像取り込みタイミング信号を受けて、結像面に結像されている被写体像を撮像信号に変換し、カメラ信号処理部13に供給する。
カメラ信号処理部13は、CPU21からの制御信号に基づき、信号変換部12から出力された撮像信号に対して各種の信号処理を施す。具体的には、例えば、信号変換部12からの撮像信号に対して、ガンマ補正やAGC(Auto Gain Control)などの処理を行うとともに、撮像信号をディジタル信号としての映像信号に変換する処理を行う。また、カメラ信号処理部13は、CPU21からの制御信号に基づき、この映像信号に対してホワイトバランス制御や露出補正制御などをさらに行う。
顔検出部14は、カメラ信号処理部13から出力された画像データを画像RAM19を介して受け取り、受け取った画像データの中から人物の顔が存在する領域を検出し、その検出結果をCPU21に供給する。なお、顔検出部14の構成や、顔検出部14における顔検出処理の詳細については、後述する。
表示処理部15は、カメラ信号処理部13および後述する画像信号処理部16から出力された画像データを画像RAM19を介して受け取り、例えば表示に適した解像度の画像に変換して、表示部18に供給する。表示部18は、撮像装置1におけるビューファインダとして用いられるとともに、記憶部17から再生された画像のモニタとして用いられる。表示部18としては、例えばLCD(Liquid Crystal Display)を用いることができる。
画像信号処理部16は、カメラ信号処理部13から出力された画像データを画像RAM19を介して受け取り、この画像データを圧縮符号化して、動画像あるいは静止画像のデータファイルとして記憶部17に出力する。また、画像信号処理部16は、後述する記憶部17から読み出された画像データファイルを復号し、画像RAM19を介して表示処理部15に供給する。なお、例えば、動画像の符号化方式としては、MPEG(Moving Picture Experts Group)方式、静止画像の符号化方式としては、JPEG(Joint Photographic Experts Group)方式を適用することができる。
記憶部17は、画像信号処理部16により符号化されて生成された画像ファイルを記憶する。記憶部17としては、例えば、磁気テープや光ディスクなどの可搬型記録媒体のドライブ装置、あるいはHDD(Hard Disc Drive)などを用いることができる。この記憶部17は、記憶された画像データファイルを画像信号処理部16に読み出すことの他に、その画像データファイルに付随した情報をCPU21に供給する。
画像RAM19は、カメラ信号処理部13、顔検出部14、表示処理部15および画像信号処理部16に対して画像バス10を介して接続されている。画像RAM19は、接続されたこれらの処理ブロックにより共有され、各ブロック間では、画像RAM19を介して画像データが受け渡される。なお、この例では、これらの処理ブロックは、画像RAM19を介して画像データを受け渡すものとして説明しているが、これはこの例に限られず、例えば、顔検出部14および表示処理部15は、カメラ信号処理部13および画像信号処理部16からの出力画像データを、画像バス10を介さずに直接受け取ることができるようにしてもよい。
CPU21は、ROM22に予め格納されたプログラムに従い、RAM23をワークメモリとして、この撮像装置1全体を制御する。例えば、CPU21は、撮像装置1の各部とコマンドやデータのやりとりを行い、それぞれを制御する。また、CPU21は、図示されない操作部に対する操作に応じた制御信号や撮像信号などに基づき、光学ブロック11のフォーカス、絞り、ズームなどを制御するための制御信号を生成し、光学ブロック11に供給する。
図2は、顔検出部14の一例の構成を示す。顔検出部14は、画像変換部としてのスケーリング部31、画像メモリ32、顔検出処理部としての顔検出コア33、コントローラ34を備える。スケーリング部31は、画像RAM19から画像バス10を介して読み出した画像データのサイズ(水平方向および垂直方向の各画素数)を、顔検出コア33における顔検出処理に適するように拡大または縮小するスケーリング処理を行い、画像メモリ32に供給する。
画像メモリ32は、スケーリング部31によってサイズ変換された画像データを一時的に保持する。そして、コントローラ34の制御に基づき、画像データの中から指示された位置における所定サイズの矩形領域の画像データを切り出す走査処理を行い、顔検出コア33に供給する。
顔検出コア33は、画像メモリ32から供給された矩形領域画像データに対して顔検出処理を施す。顔検出コア33では、顔検出処理として、顔判定処理、重複判定処理、同一判定処理、検出確度判定処理および検出結果補正処理の各処理を行う。なお、顔検出コア33における各処理の詳細については、後述する。コントローラ34は、CPU21の制御に基づき、スケーリング部31に対する画像データの縮小率(または拡大率)の指示や、画像メモリ32に対する書き込みまたは読み出しのメモリアドレスの指示など、顔検出部14の各部を制御する。
このような構成による撮像装置1における一例の動作について、概略的に説明する。先ず、画像の記録時には、被写体からの光が光学ブロック11を介して撮像素子に入射され、光電変換により電気信号に変換された撮像信号が、順次カメラ信号処理部13に供給され、ディジタル変換や画質補正処理などが施される。各種処理が施された画像データは、画像バス10を介して画像RAM19に一旦記憶される。
表示処理部15は、カメラ信号処理部13からの画像データを画像RAM19を介して受け取り、表示用の画像信号を生成して表示部18に供給する。これにより、現在撮像中の画像が表示部18に表示され、撮影者は、この画像を視認して画角を確認することができる。
また、画像信号処理部16は、カメラ信号処理部13から出力された画像データを画像RAM19を介して順次受け取り、例えばMPEG方式を用いて圧縮符号化処理を施して動画像ファイルを生成し、記憶部17に記録する。
また、図示しない操作部に設けられたシャッターボタンの押下などに応じて、カメラ信号処理部13からの1フレーム分の画像データが、画像信号処理部16において、例えばJPEG方式により圧縮符号化されることで、静止画像ファイルを記憶部17に記録することもできる。
さらに、画像の再生時には、記憶部17に記憶された画像ファイルが画像信号処理部16に読み出されて復号され、表示処理部15に供給されて表示用の信号に変換される。これにより、動画像または静止画像を表示部18に再生表示することができる。
ところで、上述のような画像の記録時において、顔検出部14は、カメラ信号処理部13からの出力画像データを画像RAM19を介して受け取り、顔の検出処理を実行する。顔検出部14での顔の検出結果は、CPU21に供給される。
CPU21は、例えば、検出結果に基づきAE、AF、ホワイトバランス調整などの制御を行う。例えば、検出された顔の明るさや色を最適にするように絞り量やホワイトバランスゲインを調整する、あるいは、検出された顔にフォーカスを合わせるといった制御を行うことができる。
なお、顔検出部14は、記憶部17内の画像ファイルの再生時において、画像信号処理部16により復号された画像データを画像RAM19を介して受け取り、顔の検出処理を実行してもよい。この場合の各処理ブロックによる顔の検出処理としては、画像の記録時と同様に行うことが可能である。
次に、この発明の実施の一形態による顔検出方法について説明する。顔検出部14における顔検出処理では、画像データ内の顔をより正確に検出するため、顔検出部14に入力された画像データのサイズを変更した画像データを生成するスケーリング処理、画像データに対して走査を行い所定サイズの画像データを切り出す走査処理、切り出された画像データが顔領域を含むか否かを判定する顔判定処理、顔領域を含むと判定された画像データが顔の候補である画像データと重複するか否かを判定する重複判定処理、重複すると判定された画像データが顔の候補である画像データと同一であるか否かを判定する同一判定処理、顔の候補である複数の画像データおよび同一であると判定された画像データのうち、より顔の領域に近いと判断される複数の画像データを選択する検出確度判定処理、選択された画像データの位置およびサイズの平均を算出する検出結果補正処理といった各種処理が行われる。
顔検出の際に行われる各処理について、以下の順序で詳細に説明する。
(1)スケーリング処理
(2)走査処理
(3)顔判定処理
(4)重複判定処理
(5)同一判定処理
(6)検出確度判定処理
(7)検出結果補正処理
(1)スケーリング処理
スケーリング処理では、撮像された画像データを所定の縮小率(または拡大率)で縮小(または拡大)した画像データを生成する。なお、以下では、スケーリング処理によって画像データを縮小させた場合について説明する。
例えば、画像RAM19を介して顔検出部14に画像データが入力されると、スケーリング部31は、図3に示すように、画像データに対して縮小率Δrだけ縮小させた縮小画像データを生成する。生成された縮小画像データは、画像メモリ32に記憶される。また、スケーリング部31は、画像RAM19を介して顔検出部14に入力された画像データに対して、別の縮小率で縮小させた縮小画像データを生成したり、上述の縮小画像データに対して、さらに所定の縮小率Δrで縮小させた縮小画像データを生成することもできる。
(2)走査処理
走査処理では、縮小画像データに対して所定サイズの矩形領域を水平方向および垂直方向に所定量だけ移動させながら走査し、矩形領域の画像データを切り出す。
画像メモリ32は、コントローラ34の制御に基づき、スケーリング処理によって得られた縮小画像データに対して、図4に示すように、所定サイズの矩形領域を左上の端から水平方向に移動量Δxだけ移動させ、縮小画像データの右端に到達すると、左端に戻るとともに、垂直方向に移動量Δyだけ位置を変更し、水平方向に走査する。この動作を繰り返して縮小画像データの右下端まで走査を行い、矩形領域画像データを順次切り出す。走査によって切り出された矩形領域画像データは、顔検出コア33に供給される。
なお、走査処理の際に走査される矩形領域のサイズは、画像データのサイズによらず、常に同一のサイズとする。顔検出部14に入力された画像データのサイズを変更し、サイズが変更された画像データに対して所定サイズの矩形領域を走査させることで矩形領域内で検出される顔のサイズが変わるため、実際の顔のサイズを検出することができる。
(3)顔判定処理
顔判定処理では、走査処理によって切り出した矩形領域画像データにおける所定の画素に対して所定の演算処理を施し、矩形領域画像データが顔領域を含むか否かを判定する。
走査処理によって縮小画像データから矩形領域画像データが切り出されると、顔検出コア33は、画像メモリ32から供給された矩形領域画像データ内の画素のうち、予め学習によって定められた2点の画素における輝度値の差分を算出する。また、学習によって定められた他の2点の画素における輝度値の差分を同様に算出し、算出されたこれらの輝度値の差分に基づき、矩形領域画像データにおける顔らしさを示す確度値を決定する。そして、この確度値に対して所定の閾値を設定し、確度値が閾値以上であれば、矩形領域画像データが顔領域を含むと判定し、確度値が閾値よりも低ければ、矩形領域画像データが顔領域を含まないと判定する。
このように、縮小画像データを走査することによって得られる矩形領域画像データに対して顔判定処理を行うことにより、確度値に応じて縮小画像データ中の顔の位置を求めることができる。
図5は、縮小画像データに対して水平方向に走査した場合における矩形領域画像データの確度値を示すグラフである。また、図6は、画像データに対して垂直方向に走査した場合における矩形領域画像データの確度値を示すグラフである。矩形領域画像データの確度値は、図5および図6に示すように、矩形領域が実際の人物の顔の位置に近づくに従って高くなり、確度値が閾値以上となる矩形領域画像データが顔領域を含むと判定し、閾値よりも低い矩形領域画像データが顔領域を含まないと判定する。
例えば、縮小画像データに対して水平方向に走査した場合には、図5に示すように、矩形領域F2,F3およびF4の矩形領域画像データにおける確度値が閾値以上であるため、矩形領域画像データが顔領域を含むと判定し、矩形領域F1およびF5の矩形領域画像データにおける確度値が閾値より低いため、矩形領域画像データが顔領域を含まないと判定する。そして、この例では、走査処理によって得られた矩形領域画像データのうち、矩形領域F3の矩形領域画像データにおける確度値が最も高いため、矩形領域F3の矩形領域画像データが実際の顔の位置に最も近いことが判断できる。
また、例えば、縮小画像データに対して垂直方向に走査した場合には、図6に示すように、矩形領域F12,F13およびF14の矩形領域画像データにおける確度値が閾値以上であるため、矩形領域画像データが顔領域を含むと判定し、矩形領域F11およびF15の矩形領域画像データにおける確度値が閾値より低いため、矩形領域画像データが顔領域を含まないと判定する。そして、この例では、走査処理によって得られた矩形領域画像データのうち、矩形領域F13の矩形領域画像データにおける確度値が最も高いため、矩形領域F13の矩形領域画像データが実際の顔の位置に最も近いことが判断できる。
また、スケーリング処理において縮小画像に対してさらに縮小率Δrで縮小された縮小画像について、同様の顔判定処理を順次行うことにより、画像データ中の顔のサイズを求めることができる。
図7は、画像データを所定の縮小率で段階的に縮小した場合における矩形領域画像データの確度値を示すグラフである。矩形領域画像データの確度値は、図7に示すように、矩形領域のサイズが人物の顔のサイズに近づくに従って高くなり、確度値が閾値以上となる矩形領域画像データが顔領域を含むと判定し、閾値よりも低い矩形領域画像データが顔領域を含まないと判定する。
例えば、スケーリング処理によって画像データを段階的に縮小した場合には、図7に示すように、矩形領域F22,F23,F24およびF25の矩形領域画像データにおける確度値が閾値以上であるため、矩形領域画像データが顔領域を含むと判定し、矩形領域F21の矩形領域画像データにおける確度値が閾値より低いため、矩形領域画像データが顔領域を含まないと判定する。そして、この例では、スケーリング処理によって得られた縮小画像データのうち、矩形領域F23の矩形領域画像データにおける確度値が最も高いため、矩形領域F23の矩形領域画像データが実際の顔のサイズに最も近いことが判断できる。
なお、確度値を示すグラフのピークの値は、人物の顔の条件によって異なり、例えば、髪型やメガネの有無、人物の顔に照射される光の強さなどによって異なる。
ところで、背景技術の項でも説明したように、走査処理において矩形領域の水平方向の移動量Δxおよび垂直方向の移動量Δyを限りなく0に近づけるとともに、縮小率Δrを限りなく等倍に近づけ、ほぼ連続的に走査することにより、顔の位置およびサイズの検出精度を高くすることができる。しかしながら、このように連続的に走査すると、顔判定処理の回数が大幅に増加してしまい、顔判定処理に要する時間が膨大なものとなってしまう。そこで、この発明の実施の一形態では、1つの画像データに対して必要とされる顔判定処理の時間および顔検出の精度に見合うように、顔判定処理の回数が適切な回数となるように、離散的な走査を行うようにする。
ここで、この発明の実施の一形態では、スケーリング処理によって生成された所定の縮小画像に対して走査処理を行い、切り出された矩形領域画像データについて顔判定処理を順次行う。そして、矩形領域画像データが顔領域を含むと判定される毎に、この矩形領域画像データに対して次の処理である重複判定処理を行う。矩形領域画像データが顔領域を含まないと判定された場合には、走査処理によって次の矩形領域画像データを切り出し、同様に顔判定処理を行う。
所定の縮小画像における全ての矩形領域画像データに対して顔判定処理が完了すると、スケーリング処理によって次の縮小画像データを生成し、生成された縮小画像データに対して走査処理を行い、切り出された矩形領域画像データについて顔判定処理を順次行う。このようにして、スケーリング処理および走査処理を、予め決められた回数だけ行うまで繰り返し、新たに切り出された矩形領域画像データに対する顔判定処理を行う。
(4)重複判定処理
重複判定処理では、顔検出部14に入力された画像データ内の顔の候補である矩形領域画像データ(以下、顔候補画像データと適宜称する)が記憶された顔候補データベースを用い、顔領域を含むと判定された矩形領域画像データと顔候補データベースに記憶された顔候補画像データとが重複しているか否かを判定する。
顔候補データベースについて説明する。顔候補データベースは、画像メモリ32に設けられており、図8に示すように、顔判定処理において顔領域を含むと判定された複数の顔候補、この例ではn個の顔候補に対する矩形領域画像データである顔候補画像データが記憶されている。
また、顔候補データベースには、1つの顔候補に対して、顔判定処理において決定された確度値が上位のデータである複数の顔候補画像データが記憶されている。この例では、1つの顔候補に対して、確度値が上位の3つの顔候補画像データがそれぞれ記憶されている。
それぞれの顔候補画像データには、画像データの位置情報、サイズ情報、ならびに、顔候補画像データの確度値が関連付けられている。位置情報としては、例えば、矩形領域の左上の画素における水平方向および垂直方向の座標(X座標およびY座標)を縮小率Δrを用いて撮像された画像データ上の座標へ変換したものが記憶されている。サイズ情報としては、例えば、矩形領域の水平方向および垂直方向の各画素数を縮小率Δrを用いて撮像された画像データ上の画素数へ変換したものが記憶されている。
例えば、顔候補1に対しては、X座標がX11、Y座標がY11、サイズがS11、確度値が確度値11である顔候補画像データP11と、X座標がX12、Y座標がY12、サイズがS12、確度値が確度値12である顔候補画像データP12と、X座標がX13、Y座標がY13、サイズがS13、確度値が確度値13である顔候補画像データP13とが記憶されている。なお、この例では、顔候補画像データP11、P12、P13の順に確度値が高いものとする。
顔判定処理により、縮小画像データから切り出した矩形領域画像データが顔領域を含むと判定されると、顔候補データベースに記録されている所定の顔に対する顔候補画像データのうち、最も確度値の高い顔候補画像データ、この例では、顔候補1に対する顔候補画像データP11を読み出す。そして、顔であると判定された矩形領域画像データと顔候補データベースから読み出された顔候補画像データP11との重なり度合いを比較し、2つの画像データが重複しているか否かを判定する。
例えば、顔領域を含むと判定された矩形領域画像データと顔候補データベースから読み出された顔候補画像データとが重なる面積に対して閾値を設け、重なる面積が閾値以上、例えば33%以上であれば、顔領域を含むと判定された矩形領域画像データと顔候補データベースから読み出された顔候補画像データとが重複していると判定し、重なる面積が閾値未満、例えば33%未満であれば、重複していないと判定する。
顔領域を含むと判定された矩形領域画像データと顔候補データベースから読み出された顔候補画像データとが重複していないと判定された場合には、顔候補データベースから、次の顔に対する顔候補画像データのうち最も確度値の高い顔候補画像データ、この例では、顔候補2に対する顔候補画像データP21を読み出し、重複する面積に基づいて同様に重複判定処理を行う。
以下、顔候補データベースに記憶されている全ての種類の顔候補画像データとの重複を判定した結果、どの顔候補画像データとも重複していない場合には、顔領域を含むと判定された矩形領域画像データを新たな顔候補に対する顔候補画像データとして、顔候補データベースに記憶する。
入力された画像データのサイズを変更しながら矩形領域を走査させて人物の顔を検出する場合には、実際の顔の周囲に確度値の異なる多数の矩形領域画像データが検出される。これは、顔判定処理の際に、矩形領域画像データの確度値に対して閾値を設け、確度値が閾値以上となる矩形領域画像データを顔であると判定するようにしており、確度値に対して幅を持たせているためである。
したがって、このように検出された多数の矩形領域画像データの中から正しい顔を検出する必要がある。この重複判定処理では、人物の顔に対して検出された多数の矩形領域画像データの中から最も正しい顔に近い矩形領域画像データを検出することを目的としている。
(5)同一判定処理
同一判定処理では、顔候補データベースに記憶された顔候補画像データと重複していると判定された矩形領域画像データが、顔候補データベースに記憶された顔候補画像データと同一の画像データであるか否かを判定する。
重複判定処理により、顔領域を含むと判定された矩形領域画像データが顔候補データベースに記憶された所定の顔候補画像データと重複していると判定されると、重複判定処理の際に重複していると判定された顔候補画像データを顔候補データベースから読み出す。そして、図9Aに示すように、読み出された矩形領域F31の顔候補画像データに対して、水平方向および垂直方向にそれぞれ幅Mだけ距離を持たせた同一判定枠F30を設け、重複していると判定された矩形領域画像データがこの同一判定枠F30内に含まれるか否かを判定する。
例えば、図9Bに示すように、重複していると判定された矩形領域F32の矩形領域画像データがこの同一判定枠F30内に含まれる場合には、重複していると判定された矩形領域F32の矩形領域画像データが矩形領域F31の顔候補画像データと同一の顔に対する矩形領域画像データであると判定する。
一方、例えば、図9Cに示すように、重複していると判定された矩形領域F33の矩形領域画像データが同一判定枠F30内に含まれない場合には、矩形領域F33の矩形領域画像データが矩形領域F31の顔候補画像データと同一の顔に対する矩形領域画像データではない、または、確度値の低い矩形領域画像データであると判定する。
なお、同一判定枠F30の幅Mは、顔検出部14の感度に応じて可変とすることができる。例えば、顔検出部14による顔の検出精度が高い場合には、幅Mを広く設定し、検出精度が低い場合には、幅Mを狭く設定する。これは、顔検出部14による顔の検出精度が高い場合は、顔判定処理において隣接する顔と判定対象の顔とを識別する能力が高いためである。また、顔検出部14による顔の検出精度が低い場合は、隣接する顔と判定対象の顔とを識別する能力が低いため、幅Mを狭くすることにより識別する範囲を狭め、誤検出を防止する。
ところで、人物の顔に対する確度値を示すグラフのピークの値は、実際の顔の位置およびサイズを示している。例えば、図10に示すように、2人の人物aおよび人物bが寄り添って顔を近づけている場合などでは、人物aおよび人物bの顔の位置およびサイズが異なる。そのため、それぞれの人物の顔に対する確度値を示すグラフのピークが重なることはない。
このことから、同一判定処理では、同一判定枠を用いて検出結果をグラフのピーク付近に絞ることにより、例えば人物aの顔を検出する際に人物bの顔が誤って検出されてしまうというように、隣接する別の人物の顔が誤って検出されてしまうということを防止する。
(6)検出確度判定処理
検出確度判定処理では、顔候補データベースに記憶された所定の顔候補に対する顔候補画像データと、これらの画像データと同一であると判定された矩形領域画像データの中から、確度値がより高い画像データ、すなわち、実際の顔により近い矩形領域画像データを選択する。
顔候補データベースに記録されている所定の顔に対する確度値の高い上位3つの顔候補画像データを全て読み出し、この確度値の高い上位3つの顔候補画像データと、同一判定処理において同一の顔であると判定された矩形領域画像データとの4つの矩形領域画像データから、確度値の高い上位3つの矩形領域画像データを選択する。選択された3つの矩形領域画像データは、所定の顔に対する新たな顔候補画像データとして顔候補データベースに書き戻され、選択されなかった残りの1つの矩形領域画像データは、破棄される。
(7)検出結果補正処理
検出結果補正処理では、顔候補データベースに記録されている所定の顔に対する確度値の高い上位3つの顔候補画像データに基づき、実際の顔の領域に近い領域を検出する。
顔検出部14に入力された画像データを矩形領域で走査する場合の水平方向の移動量Δxおよび垂直方向の移動量Δyを限りなく0に近づけるとともに、画像データの縮小率Δrを限りなく等倍に近づけた場合、水平方向、垂直方向および縮小率に対する検出結果は、図5、図6および図7に示すように、それぞれの確度値のグラフにおけるピークを中心として軸対称に現れる。すなわち、実際の顔の位置およびサイズを示す確度値のグラフにおけるピークの位置およびサイズは、全ての検出結果の平均であると考えられる。
したがって、確度値の高い上位3つの矩形領域画像データの位置およびサイズの平均を算出することにより、離散的な検出結果であっても、より実際の顔に近い位置およびサイズを求めることができる。
例えば、図11Aに示すように、矩形領域F51,F52およびF53の矩形領域画像データが、所定の顔に対する確度値の高い上位3つの顔候補画像データとして顔候補データベースに記憶されている場合には、これらの顔候補画像データを顔候補データベースから読み出し、それぞれの顔候補画像データに関連付けられた位置情報およびサイズ情報に基づき水平方向の位置、垂直方向の位置およびサイズの平均を算出する。そして、図11Bに示すように、算出された水平方向の位置、垂直方向の位置およびサイズの平均に基づく矩形領域F54が実際の顔の領域に近い領域として検出される。
矩形領域F51,F52およびF53における水平方向の位置をそれぞれXF51,XF52,XF53とすると、検出結果の矩形領域F54の水平方向の位置XF54は、数式(1)に基づき算出される。
F54=(XF51+XF52+XF53)/3 ・・・(1)
また、矩形領域F51,F52およびF53における垂直方向の位置をそれぞれYF51,YF52,YF53とすると、検出結果の矩形領域F54の垂直方向の位置YF54は、数式(2)に基づき算出される。
F54=(YF51+YF52+YF53)/3 ・・・(2)
さらに、矩形領域F51,F52およびF53のサイズをそれぞれSF51,SF52,SF53とすると、検出結果の矩形領域F54のサイズSF54は、数式(3)に基づき算出される。
F54=(SF51+SF52+SF53)/3 ・・・(3)
このように、検出結果補正処理では、顔候補データベースに記憶されている所定の顔に対する確度値の高い上位3つの顔候補画像データに関連付けられた位置情報およびサイズ情報に基づき、所定の顔の矩形領域の水平方向の位置、垂直方向の位置およびサイズの平均を算出することにより、実際の顔の領域により近い領域を検出することができる。
なお、この3つの顔候補画像データから実際の顔の位置およびサイズの平均を算出する処理は、顔候補データベースに記憶された全ての顔候補に対して行う。こうすることにより、入力された画像データ内で検出された複数の顔について、実際の顔の領域により近い領域を検出することができる。
次に、顔検出部14における顔検出処理の流れについて、図12に示すフローチャートを参照して説明する。ステップS1において、撮像された画像データが画像RAM19を介して顔検出部14に入力され、ステップS2において、顔検出部14に入力された画像データに対してスケーリング処理が行われ、画像データを所定の縮小率Δrで縮小した縮小画像データが生成される。生成された縮小画像データは、画像メモリ32に記憶される。
ステップS3では、縮小画像データに対して走査処理が行われ、画像メモリ32に記憶された縮小画像データに対して走査を行い、左上の端から右下の端に向かって水平方向にΔx、垂直方向にΔyだけ所定サイズの矩形領域を移動させることによって矩形領域画像データが切り出される。
ステップS4では、走査処理によって切り出された矩形領域画像データに対して顔判定処理が行われ、矩形領域画像データに対して所定の演算処理が施され、矩形領域画像データが顔領域を含むか否かが判定される。ステップS5において、矩形領域画像データが顔領域を含むと判定された場合には、処理がステップS6に移行する。
ステップS6では、顔判定処理において顔領域を含むと判定された矩形領域画像データと、顔候補データベースに記憶された全ての顔候補に対する顔候補画像データとの重複判定処理が行われたか否かが判断される。全ての顔候補に対する顔候補画像データとの重複判定処理が行われていないと判断された場合には、処理がステップS7に移行する。
ステップS7では、顔判定処理において顔領域を含むと判定された矩形領域画像データに対して重複判定処理が行われ、顔であると判定された矩形領域画像データと顔候補データベースに記憶された顔候補画像データとが重複しているか否かが判定される。ステップS8において、顔であると判定された矩形領域画像データが顔候補データベースに記憶された顔候補画像データと重複していると判定された場合には、処理がステップS9に移行する。
一方、ステップS8において、顔領域を含むと判定された矩形領域画像データが記憶された顔候補画像データと重複していないと判定された場合には、処理がステップS6に戻り、顔であると判定された矩形領域画像データと顔候補データベースに記憶された次の顔候補画像データとの重複判定処理が行われる。
ステップS9では、顔候補データベースに記憶された顔候補画像データと重複していると判定された矩形領域画像データに対して同一判定処理が行われ、重複していると判定された矩形領域画像データが、顔候補データベースに記憶された顔候補画像データと同一の画像データであるか否かが判定される。ステップS10において、同一判定処理によって、記憶された顔候補画像データと重複していると判定された矩形領域画像データが、記憶された顔候補画像データと同一であると判定された場合には、処理がステップS11に移行する。
ステップS11では、顔候補データベースに記憶された顔候補画像データと同一であると判定された矩形領域画像データに対して検出確度判定処理が行われ、顔候補データベースに記憶された所定の顔候補に対する全ての顔候補画像データ、および顔候補データベースに記憶された所定の顔候補に対する顔候補画像データと同一であると判定された矩形領域画像データのうち、確度値が上位の所定数の画像データが選択される。ステップS12では、選択された所定数の画像データが新たな顔候補画像データとして顔候補データベースに上書きされる。
一方、ステップS6において、顔判定処理において顔領域を含むと判定された矩形領域画像データと顔候補データベースに記憶された全ての顔候補画像データとの重複判定処理が行われたと判断された場合には、処理がステップS17に移行し、顔領域を含むと判定された矩形領域画像データが新たな顔候補に対する顔候補画像データとして顔候補データベースに記憶される。
また、ステップS5において、走査処理によって切り出された矩形領域画像データが顔領域を含まないと判定された場合、および、ステップS10において、顔候補データベースに記憶された顔候補画像データと重複していると判定された画像が、顔候補データベースに記憶された顔候補画像データと同一ではないと判定された場合には、処理がステップS13に移行する。
ステップS13では、スケーリング処理で生成された縮小画像データの全ての領域を矩形領域によって走査したか否かが判断される。縮小画像データ全ての領域を走査したと判断された場合には、処理がステップS14に移行する。
一方、ステップS13において、スケーリング処理で生成された拡大または縮小された画像に対して、全ての矩形領域を走査していないと判断された場合には、処理がステップS3に戻って走査処理が行われ、走査によって得られた次の矩形領域画像データに対して、上述の各ステップにおける処理が行われる。
ステップS14では、設定された全てのサイズの画像データについて処理したか否かが判断される。全てのサイズの画像データについて処理したと判断された場合には、処理がステップS15に移行する。一方、全てのサイズの画像データについて処理していないと判断された場合には、処理がステップS2に戻り、次に拡大または縮小された画像データに対して、上述の各ステップにおける処理が行われる。
ステップS15では、顔候補データベースに記憶された、確度値が上位の複数の顔候補画像データに対して検出結果補正処理が施され、数式(1)、数式(2)および数式(3)に基づき顔の位置およびサイズの平均が算出される。そして、ステップS16において、検出結果として得られた顔の位置およびサイズに関する情報がCPU21に出力され、一連の処理が終了する。
このように、この発明の実施の一形態では、所定の顔に対して検出された矩形領域画像データの中から、所定の顔に対する確度値の高い複数の矩形領域画像データのみを記憶させておき、これらの矩形領域画像データの位置およびサイズの平均を算出し、算出結果に基づき顔の領域を検出するようにしているため、実際の顔の領域により近い領域を顔として検出することができる。
また、この実施の一形態では、確度値を示すグラフのピーク付近、すなわち実際の顔の位置およびサイズに近い位置で検出した画像データを顔候補の画像データとするようにしているため、隣接する別の顔などが誤って検出されてしまうことを防ぎ、顔検出の誤差を小さくすることができる。
以上、この発明の実施の一形態について説明したが、この発明は、上述したこの発明の実施の一形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。例えば、1つの顔候補に対して記憶されている顔候補画像データの数は、3つに限られず、画像メモリ32の記憶容量に応じて増減させてもよい。
この発明の実施の一形態による撮像装置の一例の構成を示すブロック図である。 顔検出部の一例の構成を示すブロック図である。 スケーリング処理について説明するための略線図である。 走査処理について説明するための略線図である。 画像データに対して水平方向に走査した場合における矩形領域画像データの確度値について説明するための略線図である。 画像データに対して垂直方向に走査した場合における矩形領域画像データの確度値について説明するための略線図である。 画像データを所定の縮小率で段階的に縮小した場合における矩形領域画像データの確度値について説明するための略線図である。 顔候補データベースの一例を示す略線図である。 同一判定処理について説明するための略線図である。 顔が隣接する場合における顔の検出方法について説明するための略線図である。 検出結果補正処理について説明するための略線図である。 顔検出部における顔検出処理の流れを説明するためのフローチャートである。 顔が隣接する場合における顔の検出方法について説明するための略線図である。
符号の説明
1 撮像装置
10 画像バス
11 光学ブロック
12 信号変換部
13 カメラ信号処理部
14 顔検出部
15 表示処理部
16 画像信号処理部
17 記憶部
18 表示部
19 画像メモリ
21 CPU
22 ROM
23 RAM
31 スケーリング部
32 画像メモリ
33 顔検出コア
34 コントローラ

Claims (12)

  1. 入力された画像データのサイズを変換する画像変換部と、
    上記サイズ変換された画像データを記憶し、該サイズ変換された画像データに対して所定サイズの矩形領域を移動させて走査処理を行い、矩形領域画像データを順次切り出す画像メモリと、
    切り出された上記矩形領域画像データから顔領域を検出する顔検出処理部と
    を有し、
    上記画像メモリには、複数の顔候補についての顔領域を含む複数の顔候補画像データがそれぞれ記憶され、
    上記顔検出処理部は、
    上記矩形領域画像データが顔領域を含むか否かを判定する顔判定処理を行い、
    上記矩形領域画像データが顔領域を含むと判定された場合に、上記画像メモリに記憶された所定の顔候補に対する顔候補画像データに対して水平方向および垂直方向に所定幅を加えた同一判定枠を設定し、該同一判定枠を基準として上記矩形領域画像データが上記同一判定枠内に含まれるか否かを判定する同一判定処理を行う
    ことを特徴とする画像処理装置。
  2. 請求項1に記載の画像処理装置において、
    上記顔検出処理部は、
    上記画像メモリに記憶された上記所定の顔候補に対する顔候補画像データと、上記矩形領域画像データとを比較し、それぞれの画像データが所定の面積比率で重複するか否かを判定する重複判定処理を行い、
    重複すると判定された場合に上記矩形領域画像データに対して上記同一判定処理をさらに行う
    ことを特徴とする画像処理装置。
  3. 請求項2に記載の画像処理装置において、
    上記顔検出処理部は、
    上記重複判定処理において上記所定の顔候補に対する顔候補画像データと上記矩形領域画像データとが重複していないと判定された場合に、次の顔候補に対する顔候補画像データと上記矩形領域画像データとが重複しているか否かを判定する
    ことを特徴とする画像処理装置。
  4. 請求項3に記載の画像処理装置において、
    上記顔検出処理部は、
    上記重複判定処理において全ての顔候補に対する顔候補画像データと上記矩形領域画像データとが重複していないと判定された場合に、上記矩形領域画像データを新たな顔候補に対する顔候補画像データとして、上記画像メモリに記憶する
    ことを特徴とする画像処理装置。
  5. 請求項1に記載の画像処理装置において、
    上記顔候補画像データの位置情報、サイズ情報および顔らしさを示す確度値が上記顔候補画像データに対して関連付けられて上記画像メモリに記憶されている
    ことを特徴とする画像処理装置。
  6. 請求項5に記載の画像処理装置において、
    上記顔検出処理部は、
    上記同一判定処理において上記矩形領域画像データが上記同一判定枠内に含まれていると判定された場合に、上記画像メモリに記憶された上記所定の顔候補についての上記複数の顔候補画像データと上記矩形領域画像データとの中から、上記顔らしさを示す確度値が上位である所定数の画像データを選択する検出確度判定処理を行い、
    上記選択された所定数の画像データを上記所定の顔候補についての新たな顔候補画像データとして上記画像メモリに記憶する
    ことを特徴とする画像処理装置。
  7. 請求項6に記載の画像処理装置において、
    上記検出確度判定処理では、上記画像メモリに記憶された上記所定の顔候補についての上記複数の顔候補画像データと上記矩形領域画像データとの中から、上記確度値が上位である3つの画像データを選択する
    ことを特徴とする画像処理装置。
  8. 請求項6に記載の画像処理装置において、
    上記顔検出処理部は、
    上記画像メモリに記憶された上記複数の顔候補画像データの位置情報およびサイズ情報に基づき、上記複数の顔候補画像データの位置およびサイズの平均を算出する検出結果補正処理を行う
    ことを特徴とする画像処理装置。
  9. 入力された画像データのサイズを変換する画像変換ステップと、
    上記サイズ変換された画像データを画像メモリに記憶し、該サイズ変換された画像データに対して所定サイズの矩形領域を移動させて走査処理を行い、矩形領域画像データを順次切り出す走査ステップと、
    切り出された上記矩形領域画像データから顔領域を検出する顔検出処理ステップと
    を有し、
    上記画像メモリには、複数の顔候補についての顔領域を含む複数の顔候補画像データがそれぞれ記憶され、
    上記顔検出処理ステップは、
    上記矩形領域画像データが顔領域を含むか否かを判定する顔判定処理を行い、
    上記矩形領域画像データが顔領域を含むと判定された場合に、上記画像メモリに記憶された所定の顔候補に対する顔候補画像データに対して水平方向および垂直方向に所定幅を加えた同一判定枠を設定し、該同一判定枠を基準として上記矩形領域画像データが上記同一判定枠内に含まれるか否かを判定する同一判定処理を行う
    ことを特徴とする画像処理方法。
  10. 入力された画像データのサイズを変換する画像変換ステップと、
    上記サイズ変換された画像データを画像メモリに記憶し、該サイズ変換された画像データに対して所定サイズの矩形領域を移動させて走査処理を行い、矩形領域画像データを順次切り出す走査ステップと、
    切り出された上記矩形領域画像データから顔領域を検出する顔検出処理ステップと
    を有し、
    上記画像メモリには、複数の顔候補についての顔領域を含む複数の顔候補画像データがそれぞれ記憶され、
    上記顔検出処理ステップは、
    上記矩形領域画像データが顔領域を含むか否かを判定する顔判定処理を行い、
    上記矩形領域画像データが顔領域を含むと判定された場合に、上記画像メモリに記憶された所定の顔候補に対する顔候補画像データに対して水平方向および垂直方向に所定幅を加えた同一判定枠を設定し、該同一判定枠を基準として上記矩形領域画像データが上記同一判定枠内に含まれるか否かを判定する同一判定処理を行う画像処理方法をコンピュータ装置に実行させる
    ことを特徴とする画像処理プログラム。
  11. 被写体からの光を撮像して取得された撮像信号を出力する撮像部と、
    上記撮像部から出力された上記撮像信号に対して信号処理を施し画像データとして出力するカメラ信号処理部と、
    上記画像データに対して顔検出処理を施す顔検出部と
    を備え、
    上記顔検出部は、
    上記画像データのサイズを変換する画像変換部と、
    上記サイズ変換された画像データを記憶し、該サイズ変換された画像データに対して所定サイズの矩形領域を移動させて走査処理を行い、矩形領域画像データを順次切り出す画像メモリと、
    切り出された上記矩形領域画像データから顔領域を検出する顔検出処理部と
    を有し、
    上記画像メモリには、複数の顔候補についての顔領域を含む複数の顔候補画像データがそれぞれ記憶され、
    上記顔検出処理部は、
    上記矩形領域画像データが顔領域を含むか否かを判定する顔判定処理を行い、
    上記矩形領域画像データが顔領域を含むと判定された場合に、上記画像メモリに記憶された所定の顔候補に対する顔候補画像データに対して水平方向および垂直方向に所定幅を加えた同一判定枠を設定し、該同一判定枠を基準として上記矩形領域画像データが上記同一判定枠内に含まれるか否かを判定する同一判定処理を行う
    ことを特徴とする撮像装置。
  12. 被写体からの光を撮像して取得された撮像信号を出力する撮像ステップと、
    上記撮像部から出力された上記撮像信号に対して信号処理を施し画像データとして出力するカメラ信号処理ステップと、
    上記画像データに対して顔検出処理を施す顔検出ステップと
    を備え、
    上記顔検出ステップは、
    上記画像データのサイズを変換する画像変換ステップと、
    上記サイズ変換された画像データを画像メモリに記憶し、該サイズ変換された画像データに対して所定サイズの矩形領域を移動させて走査処理を行い、矩形領域画像データを順次切り出す走査ステップと、
    切り出された上記矩形領域画像データから顔領域を検出する顔検出処理ステップと
    を有し、
    上記画像メモリには、複数の顔候補についての顔領域を含む複数の顔候補画像データがそれぞれ記憶され、
    上記顔検出処理ステップは、
    上記矩形領域画像データが顔領域を含むか否かを判定する顔判定処理を行い、
    上記矩形領域画像データが顔領域を含むと判定された場合に、上記画像メモリに記憶された所定の顔候補に対する顔候補画像データに対して水平方向および垂直方向に所定幅を加えた同一判定枠を設定し、該同一判定枠を基準として上記矩形領域画像データが上記同一判定枠内に含まれるか否かを判定する同一判定処理を行う
    ことを特徴とする撮像装置の制御方法。
JP2007285022A 2007-11-01 2007-11-01 画像処理装置、画像処理方法および画像処理プログラム、並びに、撮像装置および撮像装置の制御方法 Pending JP2009110486A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007285022A JP2009110486A (ja) 2007-11-01 2007-11-01 画像処理装置、画像処理方法および画像処理プログラム、並びに、撮像装置および撮像装置の制御方法
US12/290,317 US8340367B2 (en) 2007-11-01 2008-10-29 Image processing apparatus, image processing method, image processing program, image capturing apparatus, and controlling method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007285022A JP2009110486A (ja) 2007-11-01 2007-11-01 画像処理装置、画像処理方法および画像処理プログラム、並びに、撮像装置および撮像装置の制御方法

Publications (1)

Publication Number Publication Date
JP2009110486A true JP2009110486A (ja) 2009-05-21

Family

ID=40588138

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007285022A Pending JP2009110486A (ja) 2007-11-01 2007-11-01 画像処理装置、画像処理方法および画像処理プログラム、並びに、撮像装置および撮像装置の制御方法

Country Status (2)

Country Link
US (1) US8340367B2 (ja)
JP (1) JP2009110486A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012098980A (ja) * 2010-11-04 2012-05-24 Seiko Epson Corp 画像処理方法および画像処理装置
JP2012109896A (ja) * 2010-11-19 2012-06-07 Seiko Epson Corp 画像処理装置および画像処理方法
JP2013008154A (ja) * 2011-06-23 2013-01-10 Canon Inc 画像処理装置、画像処理方法及びプログラム
JP2013062688A (ja) * 2011-09-13 2013-04-04 Canon Inc 画像処理装置、画像処理方法
WO2014192182A1 (ja) * 2013-05-31 2014-12-04 富士ゼロックス株式会社 画像処理装置、プログラム、記憶媒体及び画像処理方法
JP2019185616A (ja) * 2018-04-16 2019-10-24 Kddi株式会社 画像抽出装置、画像抽出方法及び画像抽出プログラム
JP7419993B2 (ja) 2020-07-02 2024-01-23 コニカミノルタ株式会社 信頼度推定プログラム、信頼度推定方法、および信頼度推定装置

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009110486A (ja) * 2007-11-01 2009-05-21 Sony Corp 画像処理装置、画像処理方法および画像処理プログラム、並びに、撮像装置および撮像装置の制御方法
JP2011090569A (ja) * 2009-10-23 2011-05-06 Sony Corp 画像処理装置および画像処理方法
CN103563350B (zh) * 2011-05-31 2016-09-28 松下知识产权经营株式会社 图像处理装置、图像处理方法以及数码相机
US9025835B2 (en) 2011-10-28 2015-05-05 Intellectual Ventures Fund 83 Llc Image recomposition from face detection and facial features
US8938100B2 (en) 2011-10-28 2015-01-20 Intellectual Ventures Fund 83 Llc Image recomposition from face detection and facial features
US20130108119A1 (en) * 2011-10-28 2013-05-02 Raymond William Ptucha Image Recomposition From Face Detection And Facial Features
US8811747B2 (en) * 2011-10-28 2014-08-19 Intellectual Ventures Fund 83 Llc Image recomposition from face detection and facial features
US20130108170A1 (en) * 2011-10-28 2013-05-02 Raymond William Ptucha Image Recomposition From Face Detection And Facial Features
US9008436B2 (en) * 2011-10-28 2015-04-14 Intellectual Ventures Fund 83 Llc Image recomposition from face detection and facial features
US9025836B2 (en) 2011-10-28 2015-05-05 Intellectual Ventures Fund 83 Llc Image recomposition from face detection and facial features
CN103310181B (zh) * 2012-03-07 2016-08-03 华晶科技股份有限公司 人脸辨识***及其人脸辨识方法
TWI488128B (zh) * 2012-03-07 2015-06-11 Altek Corp 人臉辨識系統及其人臉辨識方法
US20130335587A1 (en) * 2012-06-14 2013-12-19 Sony Mobile Communications, Inc. Terminal device and image capturing method
CN109002776B (zh) * 2018-06-29 2021-06-15 金蝶软件(中国)有限公司 人脸识别方法、***、计算机设备和计算机可读存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3436473B2 (ja) * 1997-06-20 2003-08-11 シャープ株式会社 画像処理装置
JP4329398B2 (ja) 2002-05-10 2009-09-09 ソニー株式会社 顔検出装置及び方法、並びにプログラム及び記録媒体
US7469072B2 (en) * 2003-07-18 2008-12-23 Canon Kabushiki Kaisha Image processing apparatus and method
JP4517633B2 (ja) 2003-11-25 2010-08-04 ソニー株式会社 対象物検出装置及び方法
KR100559471B1 (ko) * 2003-12-17 2006-03-10 한국전자통신연구원 대칭축을 이용한 얼굴 검출 시스템 및 방법
KR100668303B1 (ko) * 2004-08-04 2007-01-12 삼성전자주식회사 피부색 및 패턴 매칭을 이용한 얼굴 검출 방법
US7522768B2 (en) * 2005-09-09 2009-04-21 Hewlett-Packard Development Company, L.P. Capture and systematic use of expert color analysis
JP4540661B2 (ja) * 2006-02-28 2010-09-08 三洋電機株式会社 物体検出装置
JP4808578B2 (ja) * 2006-09-22 2011-11-02 富士フイルム株式会社 デジタルカメラおよびその制御方法
US7693301B2 (en) * 2006-10-11 2010-04-06 Arcsoft, Inc. Known face guided imaging method
JP2009110486A (ja) * 2007-11-01 2009-05-21 Sony Corp 画像処理装置、画像処理方法および画像処理プログラム、並びに、撮像装置および撮像装置の制御方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012098980A (ja) * 2010-11-04 2012-05-24 Seiko Epson Corp 画像処理方法および画像処理装置
JP2012109896A (ja) * 2010-11-19 2012-06-07 Seiko Epson Corp 画像処理装置および画像処理方法
JP2013008154A (ja) * 2011-06-23 2013-01-10 Canon Inc 画像処理装置、画像処理方法及びプログラム
JP2013062688A (ja) * 2011-09-13 2013-04-04 Canon Inc 画像処理装置、画像処理方法
WO2014192182A1 (ja) * 2013-05-31 2014-12-04 富士ゼロックス株式会社 画像処理装置、プログラム、記憶媒体及び画像処理方法
JP2014235033A (ja) * 2013-05-31 2014-12-15 富士ゼロックス株式会社 画像処理装置及びプログラム
US9858662B2 (en) 2013-05-31 2018-01-02 Fuji Xerox Co., Ltd. Image processing device, computer storage medium, and method for detecting and displaying nucleated target cells
JP2019185616A (ja) * 2018-04-16 2019-10-24 Kddi株式会社 画像抽出装置、画像抽出方法及び画像抽出プログラム
JP7073179B2 (ja) 2018-04-16 2022-05-23 Kddi株式会社 画像抽出装置、画像抽出方法及び画像抽出プログラム
JP7419993B2 (ja) 2020-07-02 2024-01-23 コニカミノルタ株式会社 信頼度推定プログラム、信頼度推定方法、および信頼度推定装置

Also Published As

Publication number Publication date
US8340367B2 (en) 2012-12-25
US20090116705A1 (en) 2009-05-07

Similar Documents

Publication Publication Date Title
JP2009110486A (ja) 画像処理装置、画像処理方法および画像処理プログラム、並びに、撮像装置および撮像装置の制御方法
US9456135B2 (en) Image synthesizing apparatus, image synthesizing method, and image synthesizing program
JP4735742B2 (ja) 撮像装置、ストロボ画像生成方法、および、プログラム
US8629915B2 (en) Digital photographing apparatus, method of controlling the same, and computer readable storage medium
JP4218712B2 (ja) 顔検出装置、撮像装置および顔検出方法
JP4912117B2 (ja) 追跡機能付き撮像装置
JP5760324B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム並びにこの画像処理プログラムが記録された記録媒体
JP2006211139A (ja) 撮像装置
TW201316760A (zh) 攝像裝置、及其之控制方法
JP2009193421A (ja) 画像処理装置、カメラ装置、画像処理方法、およびプログラム
JP2006293782A (ja) 画像処理装置及び画像処理プログラム
JP2008176152A (ja) 撮像装置
CN102006485B (zh) 图像处理装置及图像处理方法
JP2016019249A (ja) 表示制御装置
JP2012034069A (ja) 画像処理装置、および画像処理プログラム
JP2008211534A (ja) 顔検知装置
US9710897B2 (en) Image processing apparatus, image processing method, and recording medium
JP2005266223A (ja) カメラ装置およびプログラム
JP6592881B2 (ja) 面検出方法、面検出装置、及び撮像装置
JP2020086216A (ja) 撮像制御装置、撮像装置及び撮像制御プログラム
JP5024033B2 (ja) 被写対象追跡装置、被写対象追跡プログラム及び被写対象追跡方法
JP7458723B2 (ja) 画像処理装置、撮像装置、制御方法、およびプログラム
JP7020387B2 (ja) 撮像制御装置、撮像装置及び撮像制御プログラム
JP2011253099A (ja) 焦点検出装置
JP2009130840A (ja) 撮像装置及びその制御方法及びプログラム