JP5004876B2 - 撮像装置 - Google Patents

撮像装置 Download PDF

Info

Publication number
JP5004876B2
JP5004876B2 JP2008145845A JP2008145845A JP5004876B2 JP 5004876 B2 JP5004876 B2 JP 5004876B2 JP 2008145845 A JP2008145845 A JP 2008145845A JP 2008145845 A JP2008145845 A JP 2008145845A JP 5004876 B2 JP5004876 B2 JP 5004876B2
Authority
JP
Japan
Prior art keywords
face
sound
detecting
imaging
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008145845A
Other languages
English (en)
Other versions
JP2009296142A5 (ja
JP2009296142A (ja
Inventor
匠 上原
収一 加藤
啓太 園田
雄一 中瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008145845A priority Critical patent/JP5004876B2/ja
Publication of JP2009296142A publication Critical patent/JP2009296142A/ja
Publication of JP2009296142A5 publication Critical patent/JP2009296142A5/ja
Application granted granted Critical
Publication of JP5004876B2 publication Critical patent/JP5004876B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)

Description

本発明は、入射した光を電気信号に変換する撮像素子の出力をデジタル値に変換して画像データを得る撮像装置に関する。特に、被写体の顔を検出する機能を備える撮像装置に関する。
従来、人物撮影を行う場合において、主被写体である人物とその背景のコントラストの関係から焦点が人物に合わずに、背景に合ってしまうという問題があった。このような問題を解決するために、画面内の顔を検出し、検出した顔の位置に合焦させることで、人物に焦点を合わせる撮像装置が開発されている(特許文献1参照)。
しかし特許文献1によると、撮影画面内に人物がいるかいないかに関わらず顔検出処理を実行するため、撮影に時間がかかるという問題があった。
この問題を解決するために、撮像装置に設けられているマイクで撮影者の音声を検出すると、顔検出を実行する撮像装置が提案されている(特許文献2参照)。
特許文献2によると、撮像装置が風景撮影モードのときは顔検出処理を実行せず、人物撮影モードのときは顔検出処理を実行し、どちらのモードでもないときは撮影者の音声を検出したときだけ顔検出処理を実行する。
尚、画像データからの顔検出については、非特許文献1、2に記載されたものが知られている。更に、特許文献3〜6に記載されている手法で目を検出することにより、顔の位置や大きさを推定することもできる。
特開2001−215403号公報 特開2005−318084号公報 特開平3−17696号公報 特開平4−255015号公報 特開平5−300601号公報 特開平9−251342号公報 テレビジョン学会誌Vol.49,No.6,pp.787−797(1995)、「顔領域抽出に有効な修正HSV表色系の提案」 電子情報通信学会誌Vol.74−D−II,No.11,pp.1625−1627(1991)、「静止濃淡情景画像から顔領域を抽出する手法」
しかしながら、上記従来の撮像装置では、確実に人物撮影である場合の顔検出処理と、人物撮影であるかどうか撮像装置が判定できない場合の顔検出処理に違いが無く、状況に応じて、顔検出処理が最適化されていなかった。
本発明の目的は、顔検出処理の精度を向上させることができる撮像装置を提供することにある。
上記目的を達成するために、本発明による撮像装置は、被写体像を光電変換することにより画像データを取得する撮像手段と、前記撮像手段によって得られた撮影画像から、顔を検出するための評価値を演算し、前記評価値をしきい値と比較して顔判定を行い、評価値がしきい値より大きければ顔であると判定する顔検出手段と、音声を検出する音声検出手段とを備え、前記顔検出手段は、前記音声検出手段の検出結果に応じて、前記しきい値を変更することを特徴とする。
本発明の撮像装置によれば、顔検出処理の精度を向上させることができる。
以下、本発明の実施の形態を図面を参照しながら詳細に説明する。
図1は、本発明の実施の形態に係る撮像装置としてのデジタルカメラの外観斜視図である。
装置本体1は、光学ファインダ2、電源スイッチ(ボタン)3、静止画または動画を撮影する際に押下するレリーズスイッチ4、撮影の画角を変更するためのズームレバー5、モード切替スイッチ6を備える。
モード切替スイッチ6は、装置本体1における各種モードを切り替える。より具体的には、装置本体1の背面に印刷されたアイコンマーク1aにモード切替スイッチ6を合わせると、静止画記録モードへの切り替えが可能である。また、アイコンマーク1bにモード切替スイッチ6を合わせると、動画記録モードへの切り替えが可能である。また、アイコンマーク1cにモード切替スイッチ6を合わせると、再生モードにモードの切り替えが可能である。
液晶パネル7は、装置本体1の背面に備えられた表示手段であり、撮影レンズを介して撮像素子の受光面に結像した撮影前の被写体像をスルー画像として表示し、あるいは、撮影後記録された画像を再生して表示する。
操作部8は、操作者が各種操作を行う操作スイッチであり、具体的には、液晶パネル7上の表示を切り替える表示スイッチや、メニュースイッチ、印刷スイッチ、SETスイッチである。
十字スイッチ9は、十字に配置された4方向スイッチ(上スイッチ、下スイッチ、右スイッチ、左スイッチ)である。
図2は、図1のデジタルカメラのブロック図である。
以下、その構成を動作(機能)と併せて説明する。
図2において、バリア101は、装置本体1の、撮影レンズ102を含む撮像系を覆うことにより、撮像系の汚れや破損を防止する。撮影レンズ102、絞り機能を備えるシャッター103、光学像を電気信号に変換(光電変換)するCCDやCMOS素子等で構成される撮像部(撮像素子)104がある。
A/D変換器105は、アナログ信号をデジタル信号に変換する。A/D変換器105は、撮像部104から出力されるアナログ信号をデジタル信号に変換する場合や、音声制御部106から出力されるアナログ信号をデジタル信号に変換する場合に用いられる。
タイミング発生部107は、撮像部104、A/D変換器105、音声制御部106、D/A変換器108にクロック信号や制御信号を供給する。タイミング発生部107は、メモリ制御部109及びシステム制御部110により制御される。
画像処理部111は、A/D変換器105からのデータ、または、メモリ制御部109からのデータに対し所定の画素補間、縮小といったリサイズ処理や色変換処理を行う。
また、画像処理部111では、撮影した画像データを用いて所定の演算処理が行われ、得られた演算結果に基づいてシステム制御部110が露光制御、測距制御を行う。これにより、TTL(スルー・ザ・レンズ)方式のAF(オートフォーカス)処理、AE(自動露出)処理、EF(フラッシュプリ発光)処理が行われる。
システム制御部110は、撮像手段としての撮像部104によって得られた撮影画像から、顔を検出するための評価値を演算し、評価値をしきい値と比較して顔判定を行い、評価値がしきい値より大きければ顔であると判定する顔検出手段として機能する。その詳細については、後述する図3のステップS301で説明する。
画像処理部111では更に、撮影した画像データを用いて所定の演算処理を行い、得られた演算結果に基づいてTTL方式のAWB(オートホワイトバランス)処理も行っている。
A/D変換器105からの出力データは、画像処理部111及びメモリ制御部109を介して、あるいは、直接メモリ制御部109を介して、メモリ112に書き込まれる。メモリ112は、撮像部104によって得られ、A/D変換器105によりデジタルデータに変換された画像データや、液晶パネル7を含む画像表示部23に表示するための画像データを格納する。
尚、メモリ112は、マイク21(21a、21b)において録音された音声データ、静止画像、動画像及び画像ファイルを構成する場合のファイルヘッダを格納するのにも用いられる。従って、メモリ112は、所定枚数の静止画像や所定時間の動画像及び音声を格納するのに十分な記憶容量を備えている。
圧縮/伸張部113は、適応離散コサイン変換(ADCT)等により画像データを圧縮、伸張する。圧縮/伸張部113は、シャッター103をトリガにしてメモリ112に格納された撮影画像を読み込んで圧縮処理を行い、処理を終えたデータをメモリ112に書き込む。
また、圧縮/伸張部113は、記録媒体200の記録部201等からメモリ112に読み込まれた圧縮画像に対して伸張処理を行い、処理を終えたデータをメモリ112に書き込む。
圧縮/伸張部113によりメモリ112に書き込まれた画像データは、システム制御部110のファイル部においてファイル化される。そして、インターフェース(I/F)114、コネクタ115、記録媒体200側のコネクタ203、インターフェース(I/F)202を介して、記録部201に記録される。また、メモリ112は、画像表示用のメモリ(ビデオメモリ)を兼ねている。
D/A変換器108は、メモリ112に格納されている画像表示用のデータをアナログ信号に変換して画像表示部23に供給する。画像表示部23は、液晶パネル7等の表示器上に、メモリ112に書き込まれた表示用の画像データをD/A変換器108を介してアナログ信号に変換して表示を行う。
マイク21から出力された音声信号は、アンプ等で構成される音声制御部106を介してA/D変換器105に供給され、A/D変換器105においてデジタル信号に変換された後、メモリ制御部109によってメモリ112に格納される。
一方、記録媒体200に記録されている音声データは、メモリ112に読み込まれた後、D/A変換器108によりアナログ信号に変換される。音声制御部106は、このアナログ信号によりスピーカ22を駆動し、音声出力する。
不揮発性メモリ116は、電気的に消去・記録可能なメモリであり、例えばEEPROM等が用いられる。不揮発性メモリ116には、システム制御部110の動作用の定数、プログラム等が記憶(記録)される。ここでいう、プログラムとは、本実施の形態にて後述する各種フローチャートを実行するためのプログラムのことである。
システム制御部110は、不揮発性メモリ116に記憶されたプログラムを実行することで、後述する本実施の形態の各処理を実現する。システムメモリ117は、RAMが用いられる。システムメモリ117には、システム制御部110の動作用の定数、変数、不揮発性メモリ116から読み出したプログラム等を展開(記憶)する。
ズームレバー5、モード切替スイッチ6、第1シャッタースイッチ51、第2シャッタースイッチ52、操作部8及び十字スイッチ9はシステム制御部110に各種の動作指示を入力するための操作手段である。
モード切替スイッチ6は、システム制御部110の動作モードを静止画記録モード、動画記録モード、再生モード等のいずれかに切り替えることができる。第1シャッタースイッチ51は、装置本体1に設けられたレリーズスイッチ4の操作途中(半押し)でオンとなり第1シャッタースイッチ信号SW1を発生する。
システム制御部110は、第1シャッタースイッチ信号SW1により、AF処理、AE処理、AWB処理、EF処理等の動作を開始する。
第2シャッタースイッチ52は、レリーズスイッチ4の操作完了(全押し)でオンとなり、第2シャッタースイッチ信号SW2を発生する。システム制御部110は、第2シャッタースイッチ信号SW2により、撮像部104からの信号読み出しから記録媒体200に画像データを書き込むまでの一連の撮影処理の動作を開始する。
操作部8の各操作部材は、画像表示部23に表示される種々の機能アイコンを選択操作すること等により、場面毎に適宜機能が割り当てられ、各種機能スイッチとして作用する。機能スイッチとしては、例えば、終了スイッチ、戻るスイッチ、画像送りスイッチ、ジャンプスイッチ、絞込みスイッチ、属性変更スイッチ等がある。
例えば、メニュースイッチが押されると各種設定が可能なメニュー画面が画像表示部23に表示される。操作者は、画像表示部23に表示されたメニュー画面と、十字スイッチ9やSETスイッチとを用いて直感的に各種設定を行うことができる。電源スイッチ3は、電源オン、電源オフを切り替える。
電源制御部118は、電池検出回路、DC−DCコンバータ、通電するブロックを切り替えるスイッチ回路等により構成され、電池の装着の有無、電池の種類、電池残量の検出を行う。また、電源制御部118は、その検出結果及びシステム制御部110の指示に基づいてDC−DCコンバータを制御し、必要な電圧を必要な期間、記録媒体200を含む各部へ供給する。
電源部119は、アルカリ電池やリチウム電池等の一次電池やNiCd電池やNiMH電池、Li電池等の二次電池、ACアダプター等からなる。コネクタ54及び55は電源部119と電源制御部118とを接続する。
RTC(Real Time Clock)120は、日付及び時刻を計時する。RTC120は、電源制御部118とは別に内部に電源部を保持しており、電源部119が落ちた状態であっても、計時状態を続ける。システム制御部110は、起動時にRTC120より取得した日時を用いてシステムタイマを設定し、タイマ制御を実行する。
インターフェース114は、メモリカードやハードディスク等の記録媒体200またはチューナーカードと、装置本体1とのインターフェースを司る。コネクタ115は、記録媒体200やチューナーカードとインターフェース114との接続を行う。記録媒体着脱検出部121は、コネクタ115に記録媒体200やチューナーカードが装着されているか否かを検出する。
記録媒体200は、図2においてはメモリカードやハードディスク等である。記録媒体200は、半導体メモリや磁気ディスク等から構成される記録部201、装置本体1とのインターフェース202、及び、記録媒体200と装置本体1とを接続するためのコネクタ203を備えている。
また、コネクタ115、203はSDI/Oカードの拡張規格に準拠しており、先述の記録媒体の他、SDI/Oカードの拡張規格に準拠したチューナーカードが着脱可能となっている。
通信部122は、RS232CやUSB、IEEE1394、P1284、SCSI、モデム、LAN、無線通信等の各種通信処理を行う。コネクタ(無線通信の場合はアンテナ)123は、通信部122を介して装置本体1を他の機器と接続する。
図3は、図2のデジタルカメラによって実行される撮影(撮像)処理の手順を示すフローチャートである。
図3に示される処理は、システム制御部110により実行される。例えば、システム制御部110は不図示のCPUを備え、例えば、システムメモリ117に格納された制御プログラムを実行することにより図3に示される処理を実現する。
図3において撮影動作が開始されると、ステップS301において、システム制御部110は、スルー表示される画像信号中に人の顔が存在するか否かを検出する顔検出処理を行う。この顔検出処理については図4を用いて後述する。
システム制御部110は、顔検出処理において人の顔が検出された場合、画像信号中において検出した顔の位置座標、サイズ(幅、高さ)、検出個数、信頼性係数等を顔情報としてシステムメモリ117に記憶する。顔検出処理において顔が検出されなかった場合は、システムメモリ117内の位置座標、サイズ(幅、高さ)、検出個数、信頼性係数等の領域に0を設定する。
続いてステップS302において、第1シャッタースイッチ信号SW1がONされたか否か判定される。第1シャッタースイッチ信号SW1がOFFであれば、再度ステップS301の顔検出処理が実行され、ONであれば、次のステップS303に進む。
ステップS303において、システム制御部110は、測距処理を行って撮影レンズ102の焦点を被写体に合わせるとともに、測光処理を行って絞り値及びシャッター時間(シャッタースピード)を決定する。
尚、測光処理において、必要であればフラッシュの設定も行われる。このとき、ステップS301において顔が検出されていれば、検出した顔の範囲で測距を行うようにすることも可能である。
次に、ステップS304では、第2シャッタースイッチ信号SW2のON/OFF状態を判定する。第1シャッタースイッチ信号SW1がONした状態で、第2シャッタースイッチ信号SW2がONになると、処理はステップS304からステップS306へ進む。
第2シャッタースイッチ信号SW2がONせずに、更に第1シャッタースイッチ信号SW1も解除された場合(ステップS305)、処理はステップS305からステップS301へ戻る。
また、第1シャッタースイッチ信号SW1がON、第2シャッタースイッチ信号SW2がOFFの間は、ステップS303〜S305の処理が繰り返される。
第2シャッタースイッチSW2が押されると(第2シャッタースイッチ信号SW2がONされると)、ステップS306において、システム制御部110は、露光処理や現像処理を含む撮影処理(露光処理)を実行する。
尚、露光処理では、撮像部104、A/D変換器105を経て得られた画像データが、画像処理部111及びメモリ制御部109を介して、或いはA/D変換器105から直接メモリ制御部109を介して、メモリ112に書き込まれる。
また、現像処理では、システム制御部110が、メモリ制御部109そして必要に応じて画像処理部111を用いて、メモリ112に書き込まれた画像データを読み出して各種処理を行う。
撮影後、ステップS307において、システム制御部110は、撮影処理で得られた画像データを画像ファイルとして記録媒体200に対して書き込む記録処理を実行する。
(第1の実施の形態)
図4は、図3のステップS301で実行される顔検出処理の第1の実施の形態の手順を示すフローチャートである。
顔検出処理がスタートすると、ステップS401で、画像の顔評価値を算出する。顔評価値とは、画像に含まれる領域の顔らしさを表す数値であり、例えば、パターンマッチング法における顔テンプレートとのマッチング度であり、目・鼻・口等の特徴点のレイアウトから演算される特徴量である。
顔テンプレートとのマッチング度を求める場合、画像の内、顔検出処理を行う領域内でエッジ抽出を行い、予め決められた顔テンプレートを、抽出したエッジと比較し、顔テンプレートとの類似度を算出する。
顔テンプレートは、顔検出処理を行う領域内で走査され、顔テンプレートとの類似度が対象画素ごとに順次算出される。これらの顔評価値を求める技術は公知であり、例えば、特開平8−63597号公報等に開示されている。
次に、ステップS402で、ステップS401で算出した顔評価値を、予め決められていたしきい値と比較する。
顔検出処理を行う画像内に、顔評価値がしきい値以上となる領域が含まれていれば、ステップS403に進み、対象領域は顔であると判定し、顔検出処理を終了する。ステップS402で、顔評価値がしきい値以上となる領域が存在しなければ、ステップS404に進む。
ステップS404では、装置本体1に備えられたマイク21を用いて、音声検出が行われる。
ステップS405では、音声の有無が判定され、音声が検出されれば、ステップS406に進む。
ステップS406では、顔評価値と比較するしきい値を下げる。これは音声が検出されていることから、撮影範囲内に人物が存在すると想定されるためである。
しきい値を変更した後、ステップS407において、改めてステップS401で求めた顔評価値としきい値を比較する。ここで顔評価値がしきい値以上であれば、ステップS403に進み、対象領域は顔であると判定される。
一方、ステップS405で音声が検出されなかった場合、またはステップS407で顔評価値がしきい値以上となる領域が存在しなかった場合は、顔を検出することなく顔検出処理を終了する。
以上説明したように、第1の実施の形態では、音声を検出した場合に顔判定の基準となるしきい値を下げる。そのため、例えば、暗がりでの撮影や、横向き、目瞑り等の、通常の顔検出処理では検出できない対象物も検出可能となり、顔検出率の向上に寄与する。
尚、第1の実施の形態では、顔評価値がしきい値以上か否かで顔判定の基準としたが、例えば、顔評価値が上限と下限の間の一定範囲内に入っていれば顔であると判定する技術も公知である。その場合、音声を検出した際に顔であると判定する範囲の上限と下限をそれぞれ変更して、範囲を広げることで、顔検出率の向上を図ることができる。
(第2の実施の形態)
第2の実施の形態では、人物の発声音を検出することで、しきい値を下げるものとする。また音源位置を検出して、音源位置を含む一部の領域のみのしきい値を下げるものとする。
図5は、図3のステップS301で実行される顔検出処理の第2の実施の形態の手順を示すフローチャートである。
顔検出処理がスタートすると、ステップS501で、音声検出処理を実行し、ステップS502で音声の有無を判定する。音声ありと判定されれば、次にステップS503で、音声が人物の発声音であるか否かを判定する。人物の発声音であると判定された場合には、ステップS504で、撮影画角内であるかどうかを判定する。
これら一連の音声・音源判定技術は公知であり、例えば特開平05−215833号公報にて開示されている。
図6は、図5のステップS501で実行される音源方向検出処理に用いられる音源方向検出手段の構成例を示す図である。
図6において、指向性の高いマイク21(21a、21b)の出力信号は、バンドパスフィルタ602(602a、602b)によって、特定周波数のみ減衰無く通過する。音圧差検出回路603では、各マイク21a、21bが出力した音圧レベルを比較し、音圧レベルの差値がシステム制御部110へ出力される。
音源601がマイク21の指向特性パターンから離れる程、マイク21の出力する音圧レベルは下がる。このため、各マイク21a、21bの出力する音圧レベルに差があれば、高いレベルを出力するマイク側に音声信号を発する音源601があることが検出でき、両出力レベルの差が小さい程音源が真正面にあることが検出できる。
ここで、バンドパスフィルタ602が減衰無く通過させる特定帯域の周波数を、例えば、人の発声する周波数帯域である2KHz前後とすることで、人の発声音の音源位置を検出することが可能となる。
また、指向性のマイク21を、装置本体1の左右に1個ずつ計2個を用いることにより、装置本体1に対して左右方向の音源位置を検出することができる。更に、上下方向において異なる位置に更にもう1つ、マイク21を備えることにより、装置本体1に対して上下方向についても音源位置を検出することができる。マイク21の数を増やせば音源位置の検出精度は更に高まる。
音源位置を検出する他の技術として、装置本体1に設けられた複数のマイク21a、21bの出力する音声信号の位相差を利用する技術も知られている。これは、音源601から各マイク21a、21bまでの距離に差があると、マイク21の出力信号に位相差が生じるため、既知のマイク間距離と音速から、音源の方向を演算によって特定する技術である。詳しくは、特開平07−140527号公報に開示されている。
更に、撮影レンズ102の焦点距離によって上記の音源位置検出方法を使い分けても良い。
音源601が装置本体1の正面から横に寄るほど、音源601から各マイク21a、21bまでの距離に差が生じるため、位相差が大きくなる。そのため、広角寄りでは位相差方式での音源位置検出が好適である。
一方、音源601が装置本体1の正面付近の場合、音声検出範囲の狭い指向性のマイク21であれば、音源位置のわずかな違いでも音圧差が生じる。そのため、望遠寄りでは指向性のマイク21による音圧差方式での音源位置検出が好適である。
図5に戻り、ステップS504で、音源601画角内であると判定されたら、ステップS505に進む。ステップS505では、音源方向を含む撮影範囲の一部領域を設定し、次のステップS506では、ステップS505で設定した音源位置を含む領域内のみ顔判定の基準となるしきい値を下げる処理を行う。
顔検出の基準となるしきい値を下げる処理を行うか、あるいはステップS502からステップS504において、音源601を検出できない、音声は人物の発声音ではない、音源601は撮影画各内ではない等の判定がなされると、ステップS507に進む。
ステップS507では、第1の実施の形態のステップS401と同様に、撮影領域の顔評価値の算出が行われる。
ステップS508では、算出された顔評価値としきい値の比較が行われる。顔評価値がしきい値以上となる領域があれば、ステップS509において、顔であると判定された上で顔検出処理は終了し、顔評価値がしきい値以上となる領域が無ければ、顔を検出することなく顔検出処理は終了する。
以上説明した通り、第2の実施の形態では、音声の種類を人物の発声音か否かで区別する。そのため、撮影画角内に人物が存在する場合のみ、しきい値を下げて顔検出率を向上することが可能となり、人物が存在しない場合には、不必要にしきい値を下げることが無いため、誤検出の増加を抑えることができる。
また、音源方向を検出し、音源を含む一部領域のみしきい値を下げるため、人物が存在しない領域では誤検出の増加を抑えることができる。
更に、撮影レンズ102の焦点距離によって音源方向検出方法を変えるため、音源方向の検出精度をより高めることができる。
本発明の実施の形態に係る撮像装置としてのデジタルカメラの外観斜視図である。 図1のデジタルカメラのブロック図である。 図2のデジタルカメラによって実行される撮影(撮像)処理の手順を示すフローチャートである。 図3のステップS301で実行される顔検出処理の第1の実施の形態の手順を示すフローチャートである。 図3のステップS301で実行される顔検出処理の第2の実施の形態の手順を示すフローチャートである。 図5のステップS501で実行される音源方向検出処理に用いられる音源方向検出手段の構成例を示す図である。
符号の説明
1 装置本体
21 マイク
104 撮像部
106 音声制御部
110 システム制御部
111 画像処理部
603 音圧差検出回路

Claims (11)

  1. 被写体像を光電変換することにより画像データを取得する撮像手段と、
    前記撮像手段によって得られた撮影画像から、顔を検出するための評価値を演算し、前記評価値をしきい値と比較して顔判定を行い、評価値がしきい値より大きければ顔であると判定する顔検出手段と、
    音声を検出する音声検出手段とを備え、
    前記顔検出手段は、前記音声検出手段の検出結果に応じて、前記しきい値を変更することを特徴とする撮像装置。
  2. 被写体像を光電変換することにより画像データを取得する撮像手段と、
    前記撮像手段によって得られた撮影画像から、顔を検出するための評価値を演算し、前記評価値が所定の範囲内であれば顔であると判定する顔検出手段と、
    音声を検出する音声検出手段とを備え、
    前記顔検出手段は、前記音声検出手段の検出結果に応じて、前記所定の範囲を変更することを特徴とする撮像装置。
  3. 前記音声検出手段は、人の発声音を前記音声として検出することを特徴とする請求項1または2記載の撮像装置。
  4. 前記音声検出手段は、人の発声の周波数帯域の周波数を検出することで、人の発声音を前記音声として検出することを特徴とする請求項3記載の撮像装置。
  5. 前記音声検出手段は、前記音声の検出結果からその音源の方向を検出することを特徴とする請求項1乃至4のいずれかに記載の撮像装置。
  6. 前記音声検出手段は、複数のマイクの出力信号の位相差を利用して前記音源の方向を検出することを特徴とする請求項5記載の撮像装置。
  7. 前記音声検出手段は、複数のマイクの出力信号の音圧差を利用して前記音源の方向を検出することを特徴とする請求項5記載の撮像装置。
  8. 装置本体に備えられる撮影レンズの焦点距離が広角寄りのときは、前記音声検出手段は、複数のマイクの出力信号の位相差を利用して前記音源の方向を検出することを特徴とする請求項記載の撮像装置。
  9. 装置本体に備えられる撮影レンズの焦点距離が望遠寄りのときは、前記音声検出手段は、複数のマイクの出力信号の音圧差を利用して前記音源の方向を検出することを特徴とする請求項記載の撮像装置。
  10. 前記顔検出手段は、前記音声検出手段が検出した音源方向を含む領域を選択し、選択された領域において前記しきい値又は前記所定の範囲を変更することを特徴とする請求項5乃至のいずれかに記載の撮像装置。
  11. 前記顔を検出するための評価値は、パターンマッチング法におけるテンプレートとの類似度であることを特徴とする請求項1乃至10のいずれかに記載の撮像装置。
JP2008145845A 2008-06-03 2008-06-03 撮像装置 Expired - Fee Related JP5004876B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008145845A JP5004876B2 (ja) 2008-06-03 2008-06-03 撮像装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008145845A JP5004876B2 (ja) 2008-06-03 2008-06-03 撮像装置

Publications (3)

Publication Number Publication Date
JP2009296142A JP2009296142A (ja) 2009-12-17
JP2009296142A5 JP2009296142A5 (ja) 2011-07-21
JP5004876B2 true JP5004876B2 (ja) 2012-08-22

Family

ID=41543954

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008145845A Expired - Fee Related JP5004876B2 (ja) 2008-06-03 2008-06-03 撮像装置

Country Status (1)

Country Link
JP (1) JP5004876B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10979669B2 (en) * 2018-04-10 2021-04-13 Facebook, Inc. Automated cinematic decisions based on descriptive models

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2737682B2 (ja) * 1995-02-13 1998-04-08 日本電気株式会社 テレビ会議システム
JPH1079877A (ja) * 1996-09-04 1998-03-24 Hitachi Ltd カメラ一体型vtr
JP2002252805A (ja) * 2001-02-22 2002-09-06 Ricoh Co Ltd 撮像装置、撮像方法、プログラムおよび記録媒体
JP2003122394A (ja) * 2001-10-16 2003-04-25 Yamatake Corp 識別対象を認識する方法と装置及び該装置を搭載したロボット
JP2003348425A (ja) * 2002-05-28 2003-12-05 Fuji Photo Film Co Ltd 撮影装置
JP4127521B2 (ja) * 2003-05-20 2008-07-30 富士フイルム株式会社 ディジタル・カメラおよびその制御方法
JP2007052547A (ja) * 2005-08-16 2007-03-01 Kddi Corp 顔検出装置
JP2007165947A (ja) * 2005-12-09 2007-06-28 Fujifilm Corp 撮像装置,被写体像の逆光補正装置,対象画像検出装置およびそれらの制御方法
JP4864502B2 (ja) * 2006-03-23 2012-02-01 富士フイルム株式会社 撮像装置および撮像条件案内方法
JP4686406B2 (ja) * 2006-06-14 2011-05-25 富士フイルム株式会社 撮像装置およびその制御方法
JP4197019B2 (ja) * 2006-08-02 2008-12-17 ソニー株式会社 撮像装置および表情評価装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10979669B2 (en) * 2018-04-10 2021-04-13 Facebook, Inc. Automated cinematic decisions based on descriptive models

Also Published As

Publication number Publication date
JP2009296142A (ja) 2009-12-17

Similar Documents

Publication Publication Date Title
US7791668B2 (en) Digital camera
JP5046788B2 (ja) 撮像装置及びその制御方法
JP4574459B2 (ja) 撮影装置及びその制御方法及びプログラム及び記憶媒体
JP5005570B2 (ja) 画像処理装置およびプログラム
US8760568B2 (en) Image pickup and focus detection apparatus, control method, and storage medium
JP6148431B2 (ja) 撮像装置およびその制御方法
JP2010288240A (ja) 撮像装置、その制御方法及びプログラム
JP2011182252A (ja) 撮像装置および画像撮影方法
JP2007281647A (ja) 電子カメラおよび画像処理装置
JP2007081732A (ja) 撮像装置
JP2005266784A (ja) 撮像装置、その制御方法、その制御プログラムおよび記憶媒体
JP5043787B2 (ja) 撮影装置及びその制御方法
KR20110090610A (ko) 디지털 촬영 장치, 그 제어 방법, 및 컴퓨터 판독가능 매체
JP2009038749A (ja) 画像処理装置、画像処理装置の制御方法、および、これを実行させるためのプログラム
JP5004876B2 (ja) 撮像装置
JP2010008711A (ja) 撮像装置、撮像方法及びプログラム
JP5116494B2 (ja) 撮像装置
JP2009296143A (ja) 撮像装置
JP5075288B2 (ja) 撮像装置及びその制御方法
JP5264426B2 (ja) 撮像装置及びその制御方法、並びにプログラム
JP5968386B2 (ja) 撮像装置及びその制御方法
JP2016167088A (ja) 撮像装置及びその制御方法
JP2024082891A (ja) 画像処理装置、撮像装置、画像処理方法、プログラム、および記憶媒体
JP5245604B2 (ja) 画像処理装置およびプログラム
JP4909009B2 (ja) 撮像装置及び画像処理方法及びプログラム及び記憶媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110602

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110602

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120424

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120522

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150601

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 5004876

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150601

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees