JP5664559B2

JP5664559B2 - 撮像装置、及び、特定画像検出プログラム

Info

Publication number: JP5664559B2
Application number: JP2012000937A
Authority: JP
Inventors: 永友　正一; 正一永友
Original assignee: Casio Computer Co Ltd
Current assignee: Casio Computer Co Ltd
Priority date: 2012-01-06
Filing date: 2012-01-06
Publication date: 2015-02-04
Anticipated expiration: 2027-06-27
Also published as: JP2012108530A

Description

本発明は、撮影中における特定顔画の検出機能を備えた撮像装置、及び、特定画像検出プログラムに関する。

近年、撮影中における顔検出機能を備えたデジタルカメラが登場するに至っている。この種の機能を備えたデジタルカメラは、顔画像を特定するための情報を予め記憶し、撮影モードにおいて、逐次スルー表示される撮像画像に前記情報で特定可能な顔画像が含まれているか否かを判断する。そして、含まれている場合は、シャッターキーの半押しを検出した時点で、顔画像が含まれている画像領域を特定し、この画像領域に対して合焦処理を行うとともにＡＥ処理を行う（例えば、特許文献１参照）。

特開２００７−１０８９８号公報

しかしながら、前述した機能を有するデジタルカメラにおいては、スルー表示される撮像画像中に顔画像が複数存在すると、撮影者が合焦処理させたい被写体人物の顔画像を検出せず、記録を意図しない被写体人物の顔画像を検出したり、あるいはスルー表示される撮像画像中の全ての被写体人物の顔画像が検出されてしまう場合が生ずる。その結果、撮影者がデジタルカメラに対し合焦処理を指示すべくシャッターキーを半押し操作すると、撮影者が意図しない人物の顔画像領域を合焦すべき領域として判断してしまう可能性がある。

この場合、撮影者は、合焦すべき領域として指示したい人物の顔画像が検出されるまで、シャッターキーの半押し操作、及びその解除を繰り返さなくてはならず、その結果、撮影記録までに時間を要してしまうという問題が生じる可能性があった。

本発明は、かかる従来の課題に鑑みてなされたものであり、撮影者が望む検出精度で特定画像の検出を伴う記録を可能とする撮像装置、及び、顔領域検出プログラムを提供することを目的とする。

前記課題を解決するため請求項１記載の発明にあっては、撮像手段と、この撮像手段によって逐次撮像される画像に合焦すべき特定画像が含まれているか否かを判断する判断手段と、この判断手段により前記特定画像が含まれていると判断された場合、この特定画像の個数を計数する計数手段と、合焦処理を指示する第１の指示手段と、この第１の指示手段により合焦処理が指示されると、前記判断手段により前記特定画像が含まれていると判断された場合には、この特定画像が存在する画像領域を合焦位置として合焦処理を行う合焦手段と、この合焦手段による合焦処理の後、前記画像の記録を指示する第２の指示手段と、この第２の指示手段により記録が指示されたと判断すると前記画像を記録手段に記録する一方、記録が指示されずに前記第１の指示手段による指示が解除されたと判断し、且つ、前記計数手段によって計数された個数が所定値以上のときには、前記判断手段による前記合焦すべき特定画像の検出の精度を下げるよう制御する制御手段と、を備えることを特徴とする。

また、請求項２記載の発明にあっては、請求項１記載の発明において、前記制御手段は、前記計数手段によって計数した個数が前記所定値未満であるときに、前記判断手段による前記合焦すべき特定画像の検出の精度を上げるよう制御することを特徴とする。

また、請求項３記載の発明にあっては、請求項１又は２記載の発明において、前記特定画像は特定量で定義付けられた情報であり、この情報を前記精度毎に複数記憶する特定画像情報記憶手段と、この特定画像情報記憶手段より所定の精度に対応する情報を読み出す読出手段と、を更に備え、前記判断手段は、前記読出手段によって読み出された情報に基づいて前記逐次撮像される画像に合焦すべき特定画像が含まれるか否かを判断することを特徴とする。

また、請求項４記載の発明にあっては、請求項１乃至３のいずれか記載の発明において、前記撮像画像が人物を撮像したものであるとき、前記特定画像は当該人物の顔画像であることを特徴とする。

また、請求項５記載の発明にあっては、撮像手段を備える装置が有するコンピュータを、前記撮像手段によって逐次撮像される画像に合焦すべき特定画像が含まれているか否かを判断する判断手段、この判断手段により前記特定画像が含まれていると判断された場合、この特定画像の個数を計数する計数手段、合焦処理を指示する第１の指示手段、この第１の指示手段により合焦処理が指示されると、前記判断手段により前記特定画像が含まれていると判断された場合には、この特定画像が存在する画像領域を合焦位置として合焦処理を行う合焦手段、この合焦手段による合焦処理の後、前記画像の記録を指示する第２の指示手段と、この第２の指示手段により記録が指示されたと判断すると前記画像を記録手段に記録する一方、記録が指示されずに前記第１の指示手段による指示が解除されたと判断し、且つ、前記計数手段によって計数された個数が所定値以上のときには、前記判断手段による前記合焦すべき特定画像の検出の精度を下げるよう制御する制御手段、として機能させることを特徴とする。

本発明によれば、撮影者が望む検出精度で特定画像を検出し、記録することができる。

本発明の一実施の実施形態に係るデジタルカメラのブロック図である。顔用辞書セットの構成を示す概念図である。回転角度を示す説明図である。（ａ）は画素領域範囲を示す説明図であり、（ｂ）は画素領域範囲とされる大領域、中領域、小領域を示す図である。検出精度設定部の設定内容を示す図である。第１の実施の形態における表示遷移図である。第１の実施の形態における処理手順を示すフローチャートである。第２の実施の形態における処理手順を示すフローチャートである。第３の実施の形態における表示遷移図である。第３の実施の形態における処理手順を示すフローチャートである。

以下、本発明の一実施の形態を図にしたがって説明する。
（第１の実施の形態）
図１は、本発明の各実施の形態に共通するデジタルカメラの概略構成を示すブロック図である。このデジタルカメラはＡＥ（自動露出）、ＡＦ（オートフォーカス）、顔領域検出の各機能を備えたものであって、主として以下の各部から構成されている。

すなわちデジタルカメラは、光学系１により結像された被写体の光学像を光電変換し撮像信号として出力する撮像手段としてＣＣＤ２を有している。ＣＣＤ２は、タイミングジェネレータ（ＴＧ）３により生成されるタイミング信号に基づきＣＣＤ駆動回路４によって生成される駆動信号により駆動される。ＣＣＤ２の出力信号はＡ／Ｄ変換器５でデジタル信号に変換された後、画像処理部６へ送られる。

前記光学系１には、フォーカスレンズ及びそれを光軸上で移動させるためのレンズモータが含まれ、レンズモータが制御部７の指令に従いレンズ駆動回路８により生成される駆動信号によって駆動されることによりフォーカスレンズが光軸上での位置を制御される。

前記画像処理部６は、Ａ／Ｄ変換後の撮像信号に対して、画素毎のＲ，Ｇ，Ｂの色成分データ（ＲＧＢデータ）を生成するＲＧＢ補間処理、ＲＧＢデータから輝度信号（Ｙ）と色差信号（Ｕ、Ｖ）からなるＹＵＶデータを画素毎に生成するＹＵＶ変換処理、さらにオートホワイトバランスや輪郭強調などの画品質向上のためのデジタル信号処理を行う。画像処理部６で変換されたＹＵＶデータは順次ＳＤＲＡＭ９に格納される。

また、デジタルカメラは、液晶モニタ及びその駆動回路から構成される表示部１０を有している。撮影用の記録モードが設定されているときＳＤＲＡＭ９に格納されたＹＵＶデータは、ＳＤＲＡＭ９において１フレーム分が蓄積される毎に画像処理部６においてビデオ信号に変換された後、表示部１０（液晶モニタ）においてスルー画像として画面表示される。そして、記録モードにおける撮影時には、ＳＤＲＡＭ９に一時記憶された画像データがＪＰＥＧ変換部１１においてＪＰＥＧ方式により圧縮符号化された後、外部メモリＩ／Ｆ１２を介して、例えば各種のメモリカードにより構成される外部メモリ１３に静止画ファイルとして記録される。

前記外部メモリ１３に記録された静止画ファイルは、再生モードにおいてユーザーの選択操作に応じて適宜読み出されるとともに、ＪＰＥＧ変換部１１において伸張されＹＵＶデータとしてＳＤＲＡＭ９に展開された後、表示部１０において静止画像として表示される。

キー入力ブロック１４は、シャッターキー１４１や図示しないモード選択キー、電源キーやＭＥＮＵキー等の複数キーを含み、各キーの操作状態を制御部７により随時スキャンされる。尚、シャッターキー１４１は、ユーザーが撮影予告を行うための半押し位置と、実際の撮影動作を指示するための全押し位置との２段階の操作が可能な所謂ハーフシャッター機能を有するものである。

制御部７は、ＣＰＵ及びその周辺回路等とから構成され、デジタルカメラの各部の制御、及び、撮像信号に含まれる輝度情報に基づいたＡＥ制御や、コントラスト検出方式によるＡＦ制御、後述の顔領域検出制御等を行う。尚、これらの制御を制御部７に行わせるための各種のプログラムや、各々の制御に必要な各種データは、記憶データの書き換えが可能な不揮発性メモリであるフラッシュメモリ１６に記憶されている。また、フラッシュメモリ１６には、顔検出モード設定テーブル１６１を含め、当該デジタルカメラの各種の機能に関する設定情報等も記憶されている。顔検出モード設定テーブル１６１は、顔画像の検出精度Ｌｖ.１〜Ｌｖ.３をフラグ情報で記憶するテーブルであり、
Ｌｖ.１〜Ｌｖ.３は、
Ｌｖ.１＝検出精度は荒い（低い）が、検出速度は速い。
Ｌｖ.２＝検出精度ほぼ中間レベル
Ｌｖ.３＝検出精度は細かい（高い）が、検出速度は遅い。
という関係にある。

顔認識処理部１５は、画像処理部６によって生成された１フレーム分の画像データにおいて、後述の顔特徴辞書を用いて被写体像の顔画像を検出する顔画像検出処理を行う。より具体的には、前記１フレーム分の画像データを一時記憶するフレームメモリと、顔画像検出動作に必要な各種の画像処理を行うための画像処理回路が設けられているとともに、辞書セット１５１、検出個数設定部１５２、回転角度設定部１５３、範囲設定部１５４、及び検出精度設定部１５５が設けられている。

図２は、前記辞書セット１５１を示す構成図である。この辞書セット１５１は、複数個（Ｎ個）の特徴辞書Ａ〜Ｎが記憶されている。特徴辞書Ａ〜Ｎは、夫々が、例えば顔画像の複数の部位（目、鼻、口）の形状や大きさ、顔画像の輪郭、略正面方向から見た場合の各部位の位置等を特徴量情報として、年齢別等に分けて複数個登録されている。顔認識処理部１５は、撮像した結果得られたＹＵＶデータについて所定面積の画像領域（後述する画素領域範囲２１）を順次読み出し、この画像領域（画素領域範囲２１）に対してエッジ抽出等を行って特徴量を算出し、この算出した特徴量と辞書セット１５１内の特徴辞書Ａ〜Ｎに登録される特徴量との夫々の一致度を評価して評価値を制御部７に出力する。制御部７はこれらの評価値が入力されることにより、所定面積の画像領域のうち最も評価値の高いもの、すなわち略一致している場合に、顔画像が存在するものとして判断する。

検出個数設定部１５２は、１フレーム分の画像データにおける顔画像の検出個数の上限を設定するものであり、本実施の形態において設定される上限の個数は「１」、「３」、「８」のいずれかである。

回転角度設定部１５３には、顔の許容回転角度を設定するものであり、本実施の形態において設定される許容回転角度は、図３に示すように、「±α」、「±β（＞α）」、「±γ（＞β）」のいずれかである。

範囲設定部１５４は、１フレーム分の画像における顔画像を検出するための領域を設定するものであり、本実施の形態における検出領域は、「大領域」、「中領域」、「小領域」の三種類である。すなわち、図４（ａ）に示すように、ＣＣＤ２の撮像面２０において、検出すべき顔画像の大きさに対応する矩形の検出領域２１を設定し、この検出領域２１を順次移動させることにより顔画像の検出を試みる。この検出領域２１については、図４（ｂ）に示すように、最も大きい領域（−ｘ３，−ｙ３）−（ｘ３，ｙ３）を大領域２１０とし、次に大きい領域（−ｘ２，−ｙ２）−（ｘ２，ｙ２）を中領域２１１とし、最も小さい領域（−ｘ１，−ｙ１）−（ｘ１，ｙ１）を小領域２１２とする。

検出精度設定部１５５は、以上の辞書セット１５１、検出個数設定部１５２、範囲設定部１５４の設定内容を前記検出精度Ｌｖ.１〜Ｌｖ.３に対応してフラグ情報で記憶するものである。

したがって、検出精度設定部１５５には、図５に示すように、検出精度は荒い（低い）が検出速度は速い＝Ｌｖ.１に対応して、参照する特徴辞書には「Ａ」に、許容回転角度には「±α」に、検出個数の上限には「１」に、検出領域には大領域２１０（−ｘ３,−ｙ３）−（ｘ３,ｙ３）に、各々検出精度レベルフラグ＝１が記憶されている。また、検出精度が中間レベル＝Ｌｖ.２に対応して、参照する特徴辞書には「Ａ」と「Ｂ」に、許容回転角度には「±β（＞α）」に、検出個数の上限には「３」に、検出領域には大領域２１０（−ｘ３,−ｙ３）−（ｘ３,ｙ３）と中領域２１１（−ｘ２,−ｙ２）−（ｘ２,ｙ２）に、各々検出精度レベルフラグ＝１が記憶されている。さらに、検出精度は細かい（高い）が検出速度は遅い＝Ｌｖ.３に対応して、参照する特徴辞書には「Ａ」、「Ｂ」、「Ｃ〜Ｎ」に、許容回転角度には「±γ（＞β）」に、検出個数の上限には「８」に、検出領域には大領域２１０（−ｘ３,−ｙ３）−（ｘ３,ｙ３）、中領域２１１（−ｘ２,−ｙ２）−（ｘ２,ｙ２）、小領域２１２（−ｘ１,−ｙ１）−（ｘ１,ｙ１）に、各々検出精度レベルフラグ＝１が記憶されている。

次に、以上の構成からなるデジタルカメラの動作について説明する。電源スイッチをＯＮにして、撮影モードを設定すると、制御部７は図６（ａ）に示すように、表示部１０には被写体画像１０１（スルー画像）を表示させるとともに、フラッシュメモリ１６に記憶されている制御プログラムに基づき、図７のフローチャートに示すように処理を実行する。

先ず、顔検出モード設定テーブル１６１を参照する（ステップＳ１０１）。このとき、顔検出モード設定テーブル１６１においては、初期値として例えばＬｖ.１にフラグ＝１が設定されていると、図６（ａ）に示すように、検出精度レベルアイコン１０５として「Ｌｖ.１」を表示部１０に表示させる。

次に、この参照した顔検出モード設定テーブル１６１のフラグの状態にしたがって、特徴辞書（ステップＳ１０２）、許容回転角度（ステップＳ１０３）、検出領域（ステップＳ１０４）を各々読み出す。

つまり、顔検出モード設定テーブル１６１において検出精度がＬｖ.１であるならば、図５に示した検出精度設定部１５５においてＬｖ.１で参照する特徴辞書は「Ａ」であるので、特徴辞書Ａを読み出し（ステップＳ１０２）、許容回転角度は「±α」であるので、許容回転角度±αを読み出し（ステップＳ１０３）検出領域は「大領域２１０（−ｘ３,−ｙ３）−（ｘ３,ｙ３）」であるので、検出領域２１として大領域２１０（−ｘ３,−ｙ３）−（ｘ３,ｙ３）を読み出す（ステップＳ１０４）。

このように、顔検出モード設定テーブル１６１を参照して、検出精度設定部１５５からデータを読み出す簡単な処理により、後述する顔画像の検出処理（ステップＳ１０５）において用いるデータを予め容易することができる。

次に、顔画像の検出処理を実行する（ステップＳ１０５）。この検出処理に際しては、検出精度がＬｖ.１である場合には、ＳＤＲＡＭ９に格納されスルー表示される１フレーム分の画像データを出力するＣＣＤ２の撮像面２０において、検出領域２１をステップＳ１０４で読み出した大領域２１０（−ｘ３,−ｙ３）−（ｘ３,ｙ３）とする。そして、この大領域２１０を順次移動させることにより、大領域２１０を単位として撮像面２０を走査（スキャン）し、顔画像の検出を試みる。また、このとき、許容回転角度をステップＳ１０３で読み出した±αとして、ステップＳ１０２で読み出した特徴辞書Ａに記憶されている特徴量を有するか否かを判断する。

引き続き、シャッターキー１４１の半押し操作が検出されたか否かを判断し（ステップＳ１０６）、シャッターキー１４１の半押し操作が検出されたならば、顔画像を検出しているか否かを判断する（ステップＳ１０７）。つまり、スキャンしたＣＣＤ２の撮像面２０におけるいずれかの大領域２１０において、許容回転角度±α内で特徴辞書Ａに記憶されている特徴量を有する領域、すなわち、顔画像が検出されているか否かを判断する。

そして、このステップＳ１０７での判断の結果、顔画像を検出していない場合、すなわち図６（ａ）に示す人物の顔画像１０３が前記大領域２１０をよりも遙かに小さく、許容回転角度±α内で特徴辞書Ａに記憶されている特徴量を有する領域として検出されない場合には、ステップＳ１０７からステップＳ１０９に進み、画像のコントランスト評価値にしたがって、合焦領域を決定し、合焦処理、ＡＥ処理、ＷＢ調整処理を実行する。

引き続き、シャッターキー１４１から全押し操作と操作解除のいずれが検出されたか否かを判断する（ステップＳ１１０）。シャッターキー１４１の操作解除が検出された場合には、検出精度を一段上げて（ステップＳ１１２）、ステップＳ１１からの処理を繰り返す。

したがって、現時点の検出精度が前述のようにＬｖ.１であったとすると、今回のステップＳ１１２での処理により、顔検出モード設定テーブル１６１において、Ｌｖ.１＝０にリセットされ、Ｌｖ.２＝１にセットされ、Ｌｖ.３＝０はそのまま維持されることにより、検出精度はＬｖ.２に設定される。

そして、このように顔検出モード設定テーブル１６１の検出精度がＬｖ.２に設定されると、ステップＳ１０１からの処理が再度実行された際、図６（ｂ）に示すように、検出精度レベルアイコン１０５として「Ｌｖ.２」を表示部１０に表示させる。また、図５に示した検出精度設定部１５５においてＬｖ.２で参照する特徴辞書は「Ａ」「Ｂ」であるので、特徴辞書Ａ、Ｂを読み出し（ステップＳ１０２）、許容回転角度は「±β（＞α）」であるので、許容回転角度±β（＞α）を読み出し（ステップＳ１０３）、検出領域は「大領域２１０（−ｘ３,−ｙ３）−（ｘ３,ｙ３）」及び「中領域２１１（−ｘ２,−ｙ２）−（ｘ２,ｙ２）」であるので、検出領域２１として大領域２１０（−ｘ３,−ｙ３）−（ｘ３,ｙ３）と中領域２１１（−ｘ２,−ｙ２）−（ｘ２,ｙ２）を読み出す（ステップＳ１０４）。引き続き、前述したステップＳ１０５以降の処理を実行する。

このとき、検出精度Ｌｖ.２においては、検出領域が大領域２１０と中領域２１１であるので、ステップＳ１０７の顔画像の検出処理においては、ＣＣＤ２の撮像面２０において、検出領域２１を大領域２１０と中領域２１１とする。そして、この大領域２１０と中領域２１１とを順次移動させることにより、撮像面２０を大領域２１０と中領域２１１とを単位として走査（スキャン）し、大領域２１０と中領域２１１毎に顔画像の検出を試みる。また、このとき、許容回転角度±βとして特徴辞書Ａ、Ｂに記憶されている特徴量を有するか否かを判断する。

そして、ステップＳ１０７での判断の結果、顔画像を検出していない場合、すなわち図６（ｂ）に示す人物の顔画像１０３が未だ前記中領域２１１をよりも小さく、許容回転角度±β内で特徴辞書Ａ、Ｂに記憶されている特徴量を有する領域として検出されない場合には、ステップＳ１０７からステップＳ１０９に進む。このとき、シャッターキー１４１が全押し解除が検出されると、ステップＳ１０９からステップＳ１１０、ステップＳ１１２と進むことになる。

このステップＳ１１２の処理が実行される際の検出精度が、前述のように前回のステップＳ１１２での処理よりＬｖ.２になっていると、今回のステップＳ１１２での検出精度を一段上げる処理により、顔検出モード設定テーブル１６１においてＬｖ.１＝０はそのまま維持され、Ｌｖ.２＝０にリセットされるとともにＬｖ.３＝１にセットされて、検出精度がＬｖ.３に設定される。

そして、このように顔検出モード設定テーブル１６１の検出精度がＬｖ.３に設定されると、ステップＳ１０１からの処理が再度実行された際、図６（ｃ）に示すように、検出精度レベルアイコン１０５として「Ｌｖ.３」を表示部１０に表示させる。また、図５に示した検出精度設定部１５５においてＬｖ.３で参照する特徴辞書は「Ａ」「Ｂ」「Ｃ〜Ｎ」であるので、特徴辞書Ａ〜Ｎを読み出し（ステップＳ１０２）、許容回転角度は「±γ（＞β）」であるので、許容回転角度±γ（＞β）を読み出し（ステップＳ１０３）、検出領域は「大領域２１０（−ｘ３,−ｙ３）−（ｘ３,ｙ３）」、「中領域２１１（−ｘ２,−ｙ２）−（ｘ２,ｙ２）」及び「小領域２１２（−ｘ１,−ｙ１）−（ｘ１,ｙ１）」であるので、検出対領域２１として大領域２１０（−ｘ３,−ｙ３）−（ｘ３,ｙ３）、中領域２１１（−ｘ２,−ｙ２）−（ｘ２,ｙ２）及び小領域２１２（−ｘ１,−ｙ１）−（ｘ１,ｙ１）を読み出し（ステップＳ１０４）、引き続き前述したステップＳ１０５以降の処理を実行する。

このとき、検出精度Ｌｖ.３においては、検出領域が大領域２１０、中領域２１１及び小領域２１２であるので、ステップＳ１０５の検出処理においては、ＣＣＤ２の撮像面２０において、検出領域２１を大領域２１０、中領域２１１及び小領域２１２とする。そして、この大領域２１０、中領域２１１及び小領域２１２を順次移動させることにより、撮像面２０を大領域２１０、中領域２１１及び小領域２１２を単位として走査（スキャン）し、大領域２１０、中領域２１１及び小領域２１２毎に顔画像の検出を試みる。また、このとき、許容回転角度±γとして特徴辞書Ａ〜Ｎに記憶されている特徴量を有するか否かを判断する。

また、ステップＳ１０７での判断は、顔画像を検出している場合、すなわち図６（ｃ）に示す人物の顔画像１０３が小領域２１２内に収まり、許容回転角度±β内で特徴辞書Ａ、Ｂに記憶されている特徴量を有する領域として検出された場合には、ＹＥＳとなる。したがって、ステップＳ１０７からステップＳ１０８に進む。そして、このステップＳ１０８で、図６（ｃ）に示すように、検出した顔画像を含む領域を囲繞する顔枠１０４を重畳表示するともに、この領域に対し、合焦処理、ＡＥ処理、ＷＢ調整処理を実行する。

すなわち、顔枠１０４内の顔画像のデータをコントラスト評価値の取得領域（ＡＦ評価領域）として使用し、顔画像に合焦するように、ＡＦ制御を実行しレンズ駆動回路８を駆動するとともに、検出した顔画像のデータで露出計測、露出調整処理を実行して、この領域内の撮像信号に含まれる輝度情報に基づいたＡＥ制御し、更に検出した顔領域でホワイトバランス調整処理を実行して、顔画像が適正に記録できるように、ホワイトバランスを調整する。

そして、このステップＳ１０８に続くステップＳ１１０において、シャッターキー１４１の全押し操作が検出されると、ステップＳ１１０からステップＳ１１１に進み圧縮符号化・記録処理を実行する。つまり、シャッターキー１４１の全押し操作が検出され時点における１フレーム分の撮像データをＳＤＲＡＭ９に取り込み、このＳＤＲＡＭ９に一時記憶された撮像データをＪＰＥＧ変換部１１においてＪＰＥＧ方式により圧縮符号化し、引き続き、この圧縮符号化した撮像データを外部メモリＩ／Ｆ１２を介して、外部メモリ１３に静止画ファイルとして書き込む。しかる後に、ステップＳ１０６からの処理を実行する。

したがって、顔画像を検出している場合には、前述したステップＳ１０８での処理により、顔画像で合焦処理するとともに、当該画像部分にて露出調整及びホワイトバランス調整が成される。よって、顔画像を検出している場合には、被写体人物の顔画像にピントが合い、かつ露出及びホワイトバランスが適正な画像を静止画ファイルとして記録することができる。

また、シャッターキー１４１の半押しを解除すれば、検出精度が変更されることから、誤検出を無くすべく、撮影者が撮影記録の準備を中断して設定変更を行うという煩わしさを解消し、所望する検出精度で特定画像を検出し、記録することができる。

（第２の実施の形態）
本発明の第２の実施の形態においては、図１に示すように、制御部７にはカウンター７１と照合部７２とが設けられる。カウンター７１は、シャッターキー１４１が半押し操作された後シャッターキーの操作が解除された回数を計数するものである。照合部７２は、このカウンター７１のカウント値と所定数とを照合するものであり、カウント値が所定数を超えたか否かを判断する際に用いられる。

図８は、第２の実施の形態における処理手順を示すフローチャートである。このフローチャートにおいて、ステップＳ２０１〜Ｓ２１１及びＳ２１４の処理は、前述した図７のフローチャートにおける全てのステップ、つまりステップＳ２０１〜Ｓ２１２と同一の処理である。

そして、ステップＳ２１０での判断の結果、シャッターキー１４１の操作解除が検出された場合には、カウンター７１のカウント値をアップさせる（ステップＳ２１２）。引き続き、このアップさせたカウンター７１のカウント値が所定数を超えたか否かを判断し（ステップＳ２１３）、超えていない場合には、ステップＳ２０５からの処理を繰り返す。

このとき、撮影者は、シャッターキー１４１を半押しても表示部１０に前記顔枠１０４（図６（ｃ）参照）が表示されないので、顔画像が検出されなかったと判断する。そして、シャッターキー１４１の操作を解除して、デジタルカメラの向きや画角を調整し、再度所望の顔画像を検出するように、シャッターキー１４１の半押し操作を行うこととなる。

また、撮影者による操作の結果、表示部１０に前記顔枠１０４が表示されて顔画像が検出された場合には、撮影者がシャッターキー１４１を全押しすることにより、ステップＳ２１０の判断がＹＥＳとなる。よって、ステップＳ２１０からステップＳ２１１に進み、前述した圧縮符号化・記録処理が実行されることとなる。

しかし、撮影者が複数回デジタルカメラの向きや画角を調整し、その都度シャッターキー１４１を半押ししても顔画像が検出されなかった場合には、その都度シャッターキー１４１の操作が解除され、カウント値がアップされることとなる（ステップＳ２１２）。その結果、ステップＳ２１３の判断がＹＥＳとなり、また、このようにステップＳ２１３の判断がＹＥＳとなるのは、現時点の顔画像の検出精度が低すぎることに起因する。したがって、このようにステップＳ２１３の判断がＹＥＳとなった場合には、検出精度を一段上げて（ステップＳ２１４）、ステップＳ２０１からの処理を繰り返す。

したがって、本実施の形態によれば、シャッターキー１４１が半押しされてからの解除の回数に応じて検出精度を変更するので、撮影者の撮影操作（意思）に応じた適切な検出精度で撮影することができる。

（第３の実施の形態）
本発明の第３の実施の形態において、図１に示す制御部７に設けられたカウンター７１は、顔画像検出処理より検出された顔画像の個数を計数するものである。また、照合部７２はカウンター７１により計数された個数と図５に示した検出精度設定部１５５の検出個数の上限（「１」、「３」、「８」）とを照合するものであり、計数された個数が上限以上となったか否かを判断する際に用いられる。

次に、第３の実施の形態に係るデジタルカメラの動作について説明する。電源スイッチをＯＮにして、撮影モードを設定すると、制御部７は図９（ａ）に示すように、表示部１０に被写体画像をスルー表示させるとともに、フラッシュメモリ１６に記憶されている制御プログラムに基づき、図１０のフローチャートに示すように処理を実行する。

先ず、顔検出モード設定テーブル１６１を参照する（ステップＳ１０１）。このとき、顔検出モード設定テーブル１６１においては、初期値として例えばＬｖ.２にフラグ＝１が設定されていると、図９（ａ）に示すように、検出精度レベルアイコン１０５として「Ｌｖ.２」を表示部１０に表示させる。

次に、この参照した顔検出モード設定テーブル１６１のフラグの状態にしたがって、特徴辞書（ステップＳ３０２）、許容回転角度（ステップＳ３０３）、検出個数の上限（ステップＳ３０４）、検出領域（ステップＳ３０５）を各々読み出す。

つまり、顔検出モード設定テーブル１６１において検出精度がＬｖ.２であるならば、図５に示した検出精度設定部１５５においてＬｖ.２で参照する特徴辞書は「Ａ」「Ｂ」であるので、特徴辞書Ａ、Ｂを読み出し（ステップＳ３０２）、許容回転角度は「±β（＞α）」であるので、許容回転角度±β（＞α）を読み出す（ステップＳ３０３）。また、検出個数の上限は「３」であるので、検出個数の上限「３」を読み出し（ステップＳ３０４）、検出領域は「大領域２１０（−ｘ３,−ｙ３）−（ｘ３,ｙ３）」及び「中領域２１１（−ｘ２,−ｙ２）−（ｘ２,ｙ２）」であるので、検出領域２１として大領域２１０（−ｘ３,−ｙ３）−（ｘ３,ｙ３）と中領域２１１（−ｘ２,−ｙ２）−（ｘ２,ｙ２）を読み出す（ステップＳ３０５）。

次に、顔画像検出処理を実行する（ステップＳ３０６）。この顔画像検出処理に際しては、検出精度がＬｖ.２である場合には、ＳＤＲＡＭ９に格納されスルー画像として表示される１フレーム分の画像データを出力するＣＣＤ２の撮像面２０において、検出領域２１を大領域２１０（−ｘ３,−ｙ３）−（ｘ３,ｙ３）と中領域２１１（−ｘ２,−ｙ２）−（ｘ２,ｙ２）とする。そして、この大領域２１０と中領域２１１とを順次移動させることにより、撮像面２０を大領域２１０と中領域２１１とを単位として走査（スキャン）し、大領域２１０と中領域２１１毎に顔画像の検出を試みる。また、このとき、許容回転角度を±βとして特徴辞書Ａ、Ｂに記憶されている特徴量を有するか否かを判断する。

引き続き、シャッターキー１４１の半押し操作が検出されたか否かを判断し（ステップＳ３０７）、シャッターキー１４１の半押し操作が検出されたならば、顔画像を検出しているか否かを判断する（ステップＳ３０８）。つまり、スキャンしたＣＣＤ２の撮像面２０におけるいずれかの大領域２１０又は中領域２１１において、許容回転角度を±β内で特徴辞書Ａ又はＢに記憶されている特徴量を有する領域、すなわち、顔画像が検出されたか否かを判断する。

このステップＳ３０８での判断の結果、顔画像を検出している場合にはステップＳ９に進む。すなわち図９（ａ）に示すように、被写体画像１０１中に人物Ａの顔画像１１１、この人物Ａの顔画像１１１よりも小さい人物Ｂの顔画像１１２及び人物Ｃの顔画像１１２が存在した場合には、人物Ａの顔画像１１１は大領域２１０によるスキャンにより検出され、人物Ｂの顔画像１１２及び人物Ｃの顔画像１１３は、中領域２１１によるスキャンにより検出されることとなる。これによりステップＳ３０８の判断はＹＥＳとなり、ステップＳ３０８からステップＳ３０９に進む。

そして、このステップＳ３０９で、図９（ａ）に示すように、検出した顔画像を囲繞する顔枠１０４を顔画像１１１、１１２、１１３毎に重畳表示するとともに、顔画像に対し、合焦処理、ＡＥ処理、ＷＢ調整処理を実行する。すなわち、大領域２１０で検出した顔画像１１１内の画像データをコントラスト評価値の取得領域（ＡＦ評価領域）として使用し、顔画像に合焦するように、ＡＦ制御を実行しレンズ駆動回路８を駆動するとともに、検出した顔画像で露出計測、露出調整処理を実行して、顔画像内の撮像信号に含まれる輝度情報に基づいたＡＥ制御し、更に検出した顔領域でホワイトバランス調整処理を実行して、顔領域が適正となるように、ホワイトバランスを調整する。

また、ステップＳ３０８での判断の結果、顔画像を検出していない場合には、画像のコントランスト評価値にしたがって、合焦領域を決定し、合焦処理、ＡＥ処理、ＷＢ調整処理を実行する（ステップＳＳ３１０）。

引き続き、シャッターキー１４１から全押し操作と操作解除のいずれが検出されたか否かを判断する（ステップＳＳ３１１）。シャッターキー１４１の操作解除が検出された場合には、顔画像を検出していたか否かを判断する（ステップＳ３１３）。したがって、図９（ａ）に示した本例のように、顔画像が検出されていると、ステップＳ３１３の判断がＹＥＳとなって、ステップＳ３１３からステップＳ３１４に進み、検出された顔画像の個数をカウンター７１により計数する（ステップＳ３１４）。このとき、図９（ａ）に示した本例においては、３つの顔画像が検出されていることから、カウンター７１により個数「３」が計数されることとなる。

次に、検出された個数がこの検出精度で設定されている検出個数の上限と同数であるか否かを判断する（ステップＳ３１５）。ここで、本例においては前述のように検出された個数は「３」であり、また、図５の検出精度設定部１５５においてＬｖ.２の検出個数の上限も「３」である。したがって、ステップＳ３１５の判断がＹＥＳとなり、検出精度を一段下げて（ステップＳ３１６）、ステップＳ３０１からの処理を繰り返す。

したがって、現時点の顔検出モードにおける検出精度が前述のようにＬｖ.２であったとすると、今回のステップＳ３１６での処理により、顔検出モード設定テーブル１６１において検出精度Ｌｖ.３＝０はそのまま維持され、Ｌｖ.２＝０にリセットされるとともにＬｖ.１＝１にセットされて、検出精度Ｌｖ.１が設定される。

そして、このように顔検出モード設定テーブル１６１において検出精度Ｌｖ.１＝１にセットされて、検出精度Ｌｖ.１が設定されると、ステップＳ３０１からの処理が再度実行された際、図５に示した検出精度設定部１５５においてＬｖ.１の参照する特徴辞書は「Ａ」であるので、特徴辞書Ａを読み出す（ステップＳ３０２）。また、許容回転角度は「±α」であるので、許容回転角度±αを読み出し（ステップＳ３０３）、検出個数の上限は「１」であるので、検出個数の上限「１」を読み出す（ステップＳ３０４）。また、検出領域は「大領域２１０（−ｘ３,−ｙ３）−（ｘ３,ｙ３）」であるので、検出領域２１として大領域２１０（−ｘ３,−ｙ３）−（ｘ３,ｙ３）を読み出し（ステップＳ３０５）、引き続き前述したステップＳ３０６以降の処理を実行する。

このとき、検出精度Ｌｖ.１においては、検出領域が大領域２１０のみであるので、ステップＳ３０６の顔画像の検出処理においては、ＣＣＤ２の撮像面２０において、検出領域２１を大領域２１０とする。そして、この大領域２１０を順次移動させることにより、大領域２１０を単位として撮像面２０を走査（スキャン）し、大領域２１０毎に顔画像の検出を試みる。また、このとき、許容回転角度を±αとして特徴辞書Ａに記憶されている特徴量を有するか否かを判断する。

引き続き、シャッターキー１４１の半押し操作が検出されたか否かを判断し（ステップＳ３０７）、シャッターキー１４１の半押し操作が検出されたならば、顔画像を検出しているか否かを判断する（ステップＳ３０８）。つまり、スキャンしたＣＣＤ２の撮像面２０における大領域２１０において、許容回転角度を±α内で特徴辞書Ａに記憶されている特徴量を有する領域が検出されたか否かを判断する。

このステップＳ３０８での判断の結果、顔画像を検出している場合にはステップＳ９に進む。すなわち図９（ｂ）に示すように、被写体画像１０１中に人物Ａの顔画像１１１、この人物Ａの顔画像１１１よりも小さい人物Ｂの顔画像１１２及び人物Ｃの顔画像１１２が存在した場合には、人物Ｂの顔画像１１２及び人物Ｃの顔画像１１は、前述したＬｖ.２での中領域２１１によるスキャンでは検出されたが、今回のＬｖ.１での大領域２１０によるスキャンにより検出されない。一方、人物Ａの顔画像１１１は今回のＬｖ.１での大領域２１０によるスキャンにより検出される。したがって、ステップＳ３０８の判断はＹＥＳとなり、ステップＳ３０８からステップＳ３０９に進む。

そして、このステップＳ３０９で、図９（ｂ）に示すように、検出した顔画像を囲繞する顔枠１０４を人物Ａの顔画像１１１に重畳表示するともに、顔画像に対し、合焦処理、ＡＥ処理、ＷＢ調整処理を実行する。引き続き、シャッターキー１４１から全押し操作と操作解除のいずれが検出されたか否かを判断し（ステップＳＳ３１１）、シャッターキー１４１の操作解除が検出された場合には、前述したステップＳ３１３に進む。

シャッターキー１４１の全押し操作が検出された場合には、このステップＳ３１１からステップＳ３１２に進み圧縮符号化・記録処理を実行する。つまり、シャッターキー１４１の全押し操作が検出され時点における１フレーム分の撮像データをＳＤＲＡＭ９に取り込み、このＳＤＲＡＭ９に一時記憶された撮像データをＪＰＥＧ変換部１１においてＪＰＥＧ方式により圧縮符号化し、引き続き、この圧縮符号化した撮像データを外部メモリＩ／Ｆ１２を介して、外部メモリ１３に静止画ファイルとして書き込む。しかる後に、ステップＳ３０６からの処理を実行する。

したがって、図９（ｂ）に示すように、人物Ａの顔画像１１１を検出している場合には、前述したステップＳ３０９での処理により、顔画像１１１で合焦処理するとともに、当該顔画像１１１にて露出調整及びホワイトバランス調整が成される。したがって、顔画像を検出している場合には、人物Ａにおいて顔にピントが合い、かつ露出及びホワイトバランスが適正な画像を静止画ファイルとして記録することができる。

他方、ステップＳ３１３で顔画像を検出していなかったと判断された場合、及びステップＳ３１５で計数された個数が予め設定された検出個数の上限の未満であると判断された場合には、ステップＳ３１７に進んで、検出精度を一段階上げ、しかる後にステップＳ３０１からの処理を繰り返す。

したがって、現時点の検出精度が前述のようにＬｖ.２であったとすると、ステップＳ３１７での処理により、顔検出モード設定テーブル１６１において、Ｌｖ.２＝０にリセットされ、Ｌｖ.３＝１にセットされ、Ｌｖ.１＝０はそのまま維持されることにより、検出精度はＬｖ.３に設定される。

そして、このように顔検出モード設定テーブル１６１の検出精度がＬｖ.３に設定されると、ステップＳ１０１からの処理が再度実行された際、検出精度レベルアイコン１０５として「Ｌｖ.３」を表示部１０に表示させる。また、図５に示した検出精度設定部１５５においてＬｖ.３で参照する特徴辞書は「Ａ」「Ｂ」「Ｃ〜Ｎ」であるので、特徴辞書Ａ〜Ｎを読み出し（ステップＳ３０２）、許容回転角度は「±γ（＞β）」であるので、許容回転角度±γ（＞β）を読み出し（ステップＳ３０３）、検出個数の上限は「８」であるので、検出個数の上限「８」を読み出し（ステップＳ３０４）、検出領域は「大領域２１０（−ｘ３,−ｙ３）−（ｘ３,ｙ３）」、「中領域２１１（−ｘ２,−ｙ２）−（ｘ２,ｙ２）」及び「小領域２１２（−ｘ１,−ｙ１）−（ｘ１,ｙ１）」であるので、検出領域２１として大領域２１０（−ｘ３,−ｙ３）−（ｘ３,ｙ３）、中領域２１１（−ｘ２,−ｙ２）−（ｘ２,ｙ２）及び小領域２１２（−ｘ１,−ｙ１）−（ｘ１,ｙ１）を読み出し（ステップＳ３０４）、引き続き前述したステップＳ３０６以降の処理を実行する。

このとき、検出精度Ｌｖ.３においては、検出対象となる画素領域範囲が大領域２１０、中領域２１１及び小領域２１２であるので、ステップＳ３０６の顔画像の検出処理においては、ＣＣＤ２の撮像面２０において、検出対象とする画素領域範囲２１を大領域２１０、中領域２１１及び小領域２１２とする。そして、この大領域２１０、中領域２１１及び小領域２１２を順次移動させることにより、撮像面２０を大領域２１０、中領域２１１及び小領域２１２を単位として走査（スキャン）し、大領域２１０、中領域２１１及び小領域２１２毎に顔画像の検出を試みる。また、このとき、許容回転角度±γとして特徴辞書Ａ〜Ｎに記憶されている特徴量を有するか否かを判断する。

引き続き、シャッターキー１４１の半押し操作が検出されたか否かを判断し（ステップＳ３０７）、シャッターキー１４１の半押しが検出されたならば、顔画像を検出しているか否かを判断する（ステップＳ３０８）。つまり、スキャンしたＣＣＤ２の撮像面２０におけるいずれかの大領域２１０、中領域２１１又は小領域２１２において、許容回転角度を±β内で特徴辞書Ａ又はＢに記憶されている特徴量を有する領域が検出されたか否かを判断する。

このステップＳ３０８での判断の結果、顔画像を検出している場合、すなわち人物の顔画像が小領域２１２内に収まり、許容回転角度±γ内で特徴辞書Ａ〜Ｎに記憶されている特徴量を有する領域として検出された場合には、ステップＳ３０８からステップＳ３０９に進む。そして、このステップＳ３０９で、検出した顔画像を囲繞する顔枠１０４を重畳表示するとともに、顔画像に対し、合焦処理、ＡＥ処理、ＷＢ調整処理を実行する。

そして、このステップＳ３０９に続くステップＳ３１１において、シャッターキー１４１の全押し操作が検出されると、ステップＳ３１１からステップＳ３１２に進み圧縮符号化・記録処理を実行する。

したがって本実施の形態においては、計数された顔画像の個数がその検出精度で設定された検出個数の上限と同じであった場合には、検出モードにおける検出精度を一段下げ（ステップＳ３１６）、上限未満であった場合には、検出モードにおける検出精度を一段上げることから（ステップＳ３１７）、撮影者の撮影操作（意思）に応じた適切な検出精度で撮影することができる。

尚、各実施の形態においては、検出精度をＬｖ.１〜３の三段階設けるようにしたが、より少段階であってもより多段階であってもよい。また、本実施の形態においては、検出精度に応じて、使用する特徴辞書の数のみならず、許容回転角度も異ならせるようにした。しかし、許容回転角度に関する制御は行わずに、使用する特徴辞書の数のみを異ならせるようにしてもよい。

また、実施の形態では、合焦すべき特定画像が人物の顔画像である場合を示したが、特定画像は人物の顔画像に限ることなく、物体の部分画像であってもよい。さらに、実施の形態では、本発明をデジタルカメラに適用させた場合について詳述したがこれに限ることなく、撮像部を有する、若しくは、撮像処理を含むプログラムを実行できる装置であればこれに限定されることなく適用可能である。

１光学系
２ＣＣＤ
４ＣＣＤ駆動回路
６画像処理部
７制御部
１０表示部
１１ＪＰＥＧ変換部
１５顔認識処理部
１６フラッシュメモリ
２０撮像面
２１画素領域範囲
７１カウンター
７２照合部
１０１被写体画像
１０３顔画像
１０４顔枠
１０５検出精度レベルアイコン
１４１シャッターキー
１５１辞書セット
１５２検出個数設定部
１５３回転角度設定部
１５４範囲設定部
１５５検出精度設定部
１６１顔検出モード設定テーブル
２１０大領域
２１１中領域
２１２小領域

Claims

撮像手段と、
この撮像手段によって逐次撮像される画像に合焦すべき特定画像が含まれているか否かを判断する判断手段と、
この判断手段により前記特定画像が含まれていると判断された場合、この特定画像の個数を計数する計数手段と、
合焦処理を指示する第１の指示手段と、
この第１の指示手段により合焦処理が指示されると、前記判断手段により前記特定画像が含まれていると判断された場合には、この特定画像が存在する画像領域を合焦位置として合焦処理を行う合焦手段と、
この合焦手段による合焦処理の後、前記画像の記録を指示する第２の指示手段と、
この第２の指示手段により記録が指示されたと判断すると前記画像を記録手段に記録する一方、記録が指示されずに前記第１の指示手段による指示が解除されたと判断し、且つ、前記計数手段によって計数された個数が所定値以上のときには、前記判断手段による前記合焦すべき特定画像の検出の精度を下げるよう制御する制御手段と、
を備えることを特徴とする撮像装置。
前記制御手段は、前記計数手段によって計数した個数が前記所定値未満であるときに、前記判断手段による前記合焦すべき特定画像の検出の精度を上げるよう制御することを特徴とする請求項１記載の撮像装置。
前記特定画像は特定量で定義付けられた情報であり、この情報を前記精度毎に複数記憶する特定画像情報記憶手段と、
この特定画像情報記憶手段より所定の精度に対応する情報を読み出す読出手段と、
を更に備え、
前記判断手段は、前記読出手段によって読み出された情報に基づいて前記逐次撮像される画像に合焦すべき特定画像が含まれるか否かを判断することを特徴とする請求項１又は２記載の撮像装置。
前記撮像画像が人物を撮像したものであるとき、前記特定画像は当該人物の顔画像であることを特徴とする請求項１乃至３のいずれか記載の撮像装置。
撮像手段を備える装置が有するコンピュータを、
前記撮像手段によって逐次撮像される画像に合焦すべき特定画像が含まれているか否かを判断する判断手段、
この判断手段により前記特定画像が含まれていると判断された場合、この特定画像の個数を計数する計数手段、
合焦処理を指示する第１の指示手段、
この第１の指示手段により合焦処理が指示されると、前記判断手段により前記特定画像が含まれていると判断された場合には、この特定画像が存在する画像領域を合焦位置として合焦処理を行う合焦手段、
この合焦手段による合焦処理の後、前記画像の記録を指示する第２の指示手段と、
この第２の指示手段により記録が指示されたと判断すると前記画像を記録手段に記録する一方、記録が指示されずに前記第１の指示手段による指示が解除されたと判断し、且つ、前記計数手段によって計数された個数が所定値以上のときには、前記判断手段による前記合焦すべき特定画像の検出の精度を下げるよう制御する制御手段、
として機能させることを特徴とする特定画像検出プログラム。