JP2012119872A - 撮像装置 - Google Patents

撮像装置 Download PDF

Info

Publication number
JP2012119872A
JP2012119872A JP2010266943A JP2010266943A JP2012119872A JP 2012119872 A JP2012119872 A JP 2012119872A JP 2010266943 A JP2010266943 A JP 2010266943A JP 2010266943 A JP2010266943 A JP 2010266943A JP 2012119872 A JP2012119872 A JP 2012119872A
Authority
JP
Japan
Prior art keywords
sound source
tracking target
subject
tracking
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010266943A
Other languages
English (en)
Inventor
Shinya Haraga
慎也 原賀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2010266943A priority Critical patent/JP2012119872A/ja
Publication of JP2012119872A publication Critical patent/JP2012119872A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Studio Devices (AREA)

Abstract

【課題】特に夜間撮影時などにおいて(表示画面では人物等を認識し難いときにおいて)、ユーザによる被写体の認識等を支援する。
【解決手段】複数のマイクロホンの出力音響信号に基づき音源として機能する被写体SUBを検出し、検出被写体SUBを追尾対象に設定した上で画像信号に基づく追尾処理を実行する。表示画面には、被写体SUBの動画像が表示されると共に、追尾対象の位置を指し示す追尾対象枠F及び追尾対象の音量を示す音量アイコンICが表示される。
【選択図】図11

Description

本発明は、デジタルカメラ等の撮像装置に関する。
一般的なデジタルカメラでは、撮影範囲内の映像がモニタの表示画面に表示される。撮影者としてのユーザは、モニタの表示内容を見て注目被写体を構図の中央に配置したり、注目被写体が大きく映し出されるようにズーム倍率の調整を行ったりする。
尚、下記特許文献1には、音源の位置を突き止め、音源の位置を含む音源に関する情報を可視情報に変換し、該音源周辺の実画像とリアルタイムに重ね合わせて表示する方法が示されている。また、下記特許文献2には、魚眼又は超広角レンズのカメラと、複数の無指向性マイクロホンを配列した可変指向性マイクロホンと、前記可変指向性マイクロホンにより、音源位置の方向を判定して、該音源位置方向を追尾する手段と、前記音源位置方向の画面を切り出して映像信号を生成する手段と、を備えたテレビカメラ装置が開示されている。
特開2004−77277号公報 特開平11−331827号公報
デジタルカメラに関し、幾つかの撮影環境においては、注目被写体を実空間上及び表示画面上で認識しにくいこともある。例えば、夜又は夕方の屋外撮影では注目被写体を肉眼で認識しにくいことある。また例えば、注目被写体までの距離が相当に遠く、結果、注目被写体が表示画面上のどこにいるのかを認識しづらいこともある。
図20に、夜間において森の前に立っている人物901を撮影範囲内に収めたときの表示画面の様子を示す。図20では、図示の便宜上、人物901が表示画面上のどこにいるのかが明確になっているが、実際の表示画面上では、人物901と木とが区別し難いことがある、或いは、人物901が暗闇にまぎれて肉眼ではあまり見えないこともある。撮影者が人物901を大きく映し出した画像の撮影を望む場合、人物901を撮影範囲の中央に配置した状態でズーム倍率を増大させる構図調整が必要となるが、図20に示すような映像だけでは人物901がどこにいるのかを明確に判断し難く、上述のような構図調整が困難である。また、カメラにとっても、人物901に注目したカメラ制御(オートフォーカス制御など)が困難となる。
尚、上記特許文献1及び2では、このような問題に対応することはできない。特許文献2の方法によれば、可変指向性マイクロホンにより音源位置方向の追尾が成されるが、可変指向性マイクロホンによる音源位置方向の追尾を継続するためには、音源としての被写体(人物等)が常に音を発し続けなければならない。音源としての被写体が常に音を発していることは稀である。
そこで本発明は、被写体の認識支援等に寄与する撮像装置を提供することを目的とする。
本発明に係る撮像装置は、被写体の動画像の画像信号を出力する撮像部と、複数のマイクロホンから成るマイク部と、前記複数のマイクロホンの出力音響信号に基づき音源として機能する音源被写体を検出する音源検出部と、前記音源被写体を追尾対象に設定し、前記画像信号を用いて前記動画像上で前記追尾対象を追尾する追尾処理部と、を備えたことを特徴とする。
撮影者としてのユーザの注目被写体は、一般的に音源被写体(例えば、人物、犬、猫)であることが多い。音源被写体を追尾対象に設定した追尾処理によって、音源被写体の位置をユーザに認識させたり、音源被写体に注目したカメラ制御(オートフォーカス制御など)を成したりすることが可能となる。
具体的には例えば、表示画面を有し、前記動画像を前記表示画面に表示するとともに前記表示画面上における前記追尾対象の位置を表示する表示部を、当該撮像装置に更に設けておくとよい。
追尾対象としての音源被写体の位置が追尾処理によって表示され続けるため、ユーザは音源被写体に注目した構図調整を容易に行うことが可能となる。
また例えば、前記音源検出部において、前記音源被写体として複数の音源被写体が検出された場合、前記追尾処理部は、前記複数の音源被写体の内の何れか1以上の音源被写体を選択的に前記追尾対象に設定してもよい。
より具体的には例えば、前記複数の音源被写体の夫々の音量を検出する音量検出部を、当該撮像装置に更に設けておいてもよい。この際、前記追尾処理部は、前記音量検出部の検出結果に基づき前記追尾対象を設定してもよい。
或いは具体的には例えば、前記複数の音源被写体の内の何れか1以上の音源被写体を指定する操作を受ける操作受付部を、当該撮像装置に更に設けておいてもよい。この際、前記追尾処理部は、前記操作の内容に基づき前記追尾対象を設定してもよい。
また例えば、前記追尾対象の音量を検出する音量検出部を、当該撮像装置に更に設けておいてもよい。この際、前記表示部は、前記音量検出部の検出結果をも表示しても良い。
本発明によれば、被写体の認識支援等に寄与する撮像装置を提供することが可能となる。
本発明の第1実施形態に係る撮像装置の概略全体ブロック図である。 図1の撮像部の内部構成図である。 図1のマイク部の内部構成とマイク部に接続された部位を示す図である。 図1の撮像装置の外観斜視図である。 2つのマイクロホンと音源との位置関係を示す図である。 図1の撮像装置の一部ブロック図であって、追尾機能に関与する部位のブロック図である。 対象動画像の構成を示す図である。 対象動画像を形成するフレーム画像の例である。 本発明の第1実施形態に係る撮像装置の動作フローチャートである。 音源被写体の画像信号を内包するフレーム画像の例である。 本発明の第1実施形態に係り、追尾処理の実行中における表示画面の様子を示す図である。 本発明の第1実施形態に係る音量アイコンを示す図である。 本発明の第2実施形態に係る撮像装置の動作フローチャートである。 3つの音源被写体の画像信号を内包するフレーム画像の例である。 本発明の第2実施形態に係り、追尾処理の実行中における表示画面の様子を示す図である。 本発明の第3実施形態に係る撮像装置の動作フローチャートである。 本発明の第4実施形態に係る撮像装置の動作フローチャートである。 本発明の第4実施形態に係り、表示画像の例を示す図である。 音量アイコンの変形表示方法を示す図である。 従来技術に係り、夜間撮影におけるカメラの表示画面例を示す図である。
以下、本発明の実施形態の例を、図面を参照して具体的に説明する。参照される各図において、同一の部分には同一の符号を付し、同一の部分に関する重複する説明を原則として省略する。
<<第1実施形態>>
本発明の第1実施形態を説明する。図1は、本発明の第1実施形態に係る撮像装置1の概略全体ブロック図である。撮像装置1は、静止画像を撮影及び記録可能なデジタルスチルカメラ、又は、静止画像及び動画像を撮影及び記録可能なデジタルビデオカメラである。
撮像装置1には、撮像部11、AFE12、画像処理部13、マイク部14、音響信号処理部15、表示部16、スピーカ部17、操作部18、記録媒体19及び主制御部20が設けられている。
図2に、撮像部11の内部構成図を示す。撮像部11は、光学系35と、絞り32と、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)イメージセンサなどから成る撮像素子33と、光学系35や絞り32を駆動制御するためのドライバ34と、を有している。光学系35は、ズームレンズ30及びフォーカスレンズ31を含む複数枚のレンズから形成される。ズームレンズ30及びフォーカスレンズ31は光軸方向に移動可能である。ドライバ34は、主制御部20からの制御信号に基づいてズームレンズ30及びフォーカスレンズ31の各位置並びに絞り32の開度を駆動制御することにより、撮像部11の焦点距離(画角)及び焦点位置並びに撮像素子33への入射光量(換言すれば、絞り値)を制御する。
撮像素子33は、光学系35及び絞り32を介して入射した被写体を表す光学像を光電変換し、該光電変換によって得られた電気信号をAFE12に出力する。AFE12は、撮像部11(撮像素子33)から出力されるアナログ信号を増幅し、増幅されたアナログ信号をデジタル信号に変換する。AFE12は、このデジタル信号をRAWデータとして画像処理部13に出力する。AFE12における信号増幅の増幅度は、主制御部20によって制御される。
画像処理部13は、AFE12からのRAWデータに基づいて、撮像部11によって撮影された画像(以下、撮影画像とも言う)を表す画像信号を生成する。ここで生成される画像信号には、例えば、輝度信号及び色差信号が含まれる。但し、RAWデータそのものも画像信号の一種であり、撮像部11から出力されるアナログ信号も画像信号の一種である。
マイク部14は、撮像装置1の周辺音を音響信号に変換する。マイク部14を、複数のマイクロホンにて形成することができる。ここでは、図3に示す如く、マイク部14が2つのマイクロホン14L及び14Rから成るものとする。A/D変換器51L及び51Rを、音響信号処理部15に設けておくことができる。図4に、撮像装置1の外観斜視図を示す。マイクロホン14L及び14Rは、撮像装置1の筐体上の互いに異なる位置に配置される。図4には、撮像装置1によって撮影される物体である、撮像装置1の被写体も示されている。被写体の撮影画像が表示部16に表示されることで、ユーザは撮像装置1の撮影範囲等を確認することができる。
図4に示す如く、撮像装置1にて撮影可能な被写体が存在する方向を前方と定義し、その逆の方向を後方と定義する。前方及び後方は、撮像部11の光軸に沿った方向である。また、右及び左とは、後方側から前方側を見たときの右及び左を意味するものとする。また、上及び下とは、被写体に正対する撮影者にとっての上及び下を意味するものとする。前後方向、左右方向及び上下方向は、互いに直交する。
マイクロホン14L及び14Rの夫々は、自身が収音した音をアナログの音響信号に変換して出力する。図3のA/D変換器51L及び51Rは、夫々、マイクロホン14L及び14Rから出力されるアナログの音響信号を所定のサンプリング周期(例えば48キロヘルツ)にてデジタルの音響信号に変換して出力する。A/D変換器51Lの出力信号を特に左原信号と呼び、A/D変換器51Rの出力信号を特に右原信号と呼ぶ。
図1の音響信号処理部15は、左原信号及び右原信号に必要な音響信号処理を施すことができる。この処理内容については後述する。
表示部16は、液晶ディスプレイパネル等の表示画面を有する表示装置であり、主制御部20の制御の下、撮影画像や記録媒体19に記録されている画像などを表示する。スピーカ部17は、1又は複数のスピーカから成り、マイク部14の出力音響信号、音響信号処理部15にて生成された音響信号、記録媒体19から読み出された音響信号など、任意の音響信号を音として再生出力する。操作部18は、ユーザからの様々な操作を受け付ける部位である。操作部18に対する操作内容は、主制御部20等に伝達される。記録媒体19は、カード状半導体メモリや磁気ディスク等の不揮発性メモリであり、主制御部20による制御の下、撮影画像などを記憶する。主制御部20は、操作部18への操作内容に従いつつ、撮像装置1内の各部位の動作を統括的に制御する。
撮像装置1の動作モードには、静止画像又は動画像を撮影可能な撮影モードと記録媒体19に記録された静止画像又は動画像を表示部16上で再生可能な再生モードとが含まれる。以下に述べられる動作は、特に記述なき限り、撮影モードにおける動作である。撮影モードでは、所定のフレーム周期にて周期的に被写体の撮影が行われ、撮像部11から(より詳細にはAFE12から)被写体の撮影画像列を表すRAWデータが出力される。撮影画像列に代表される画像列とは、時系列で並ぶ画像の集まりを指す。1つのフレーム周期分の画像信号によって1枚分の画像が表現される。AFE12からの1フレーム周期分の画像信号によって表現される1枚分の撮影画像を、フレーム画像とも呼ぶ。RAWデータによる撮影画像に対して所定の画像処理(デモサイキング処理、ノイズ除去処理、色補正処理など)を施して得られる画像がフレーム画像である、と解釈しても良い。
マイクロホン14L及び14Rとして、指向性を有さない無指向性マイクロホンを採用することができる。マイクロホン14L及び14Rが無指向性マイクロホンである場合、左原信号及び右原信号は無指向性の音響信号(指向性を有さない音響信号)である。音響信号処理部15は、公知の指向性制御を用いて無指向性の左原信号及び右原信号から、任意の方向に指向軸を持つ音響信号を生成することができる。
図5に示すような、X軸及びY軸を座標軸としたXY座標面(XY座標系)を定義する。X軸は、マイクロホン14Lの中心とマイクロホン14Rの中心とを通る軸であり、それらの中心の中間に原点Oが位置する。Y軸は、原点OにてX軸と直交する。Y軸に沿った方向は、撮像部11の光軸(撮像素子33にとっての光軸)の方向と一致する。X軸及びY軸は水平面と平行であるとする。原点Oからマイクロホン14Rに向かう方向(即ち、撮像装置1の右方向)がX軸の正方向であるとし、原点Oから撮像装置1の前方に向かう方向がY軸の正方向であるとする。線分305は、原点Oと任意の音源である音源SSとを結ぶ線分である。X軸と線分305との成す角度をθで表す。但し、角度θは、原点Oとマイクロホン14Rの中心とを結ぶ線分から反時計周り方向に線分305を見たときの、X軸及び線分305間の角度であるとする。反時計周り方向とは、原点Oからマイクロホン14Rの中心に伸びる線分を、撮像装置1の前方側に回転させる方向を指す。音源SSの角度θは、音源SSの位置する方向(即ち、音源SSについての音源方向)を表す。
撮像装置1には、追尾対象を動画像上で追尾する機能を備える。この機能に特に関与する部位のブロック図を図6に示す。追尾対象設定部61を内包する追尾処理部62は、図1の画像処理部13によって実現される、或いは、画像処理部13及び音響信号処理部15によって実現される。音源検出部63は、図1の音響信号処理部15によって実現される、或いは、画像処理部13及び音響信号処理部15によって実現される。音量検出部64を音響信号処理部15に設けておくことができる。表示画面66は、図1の表示部16に設けられた表示画面である。表示制御部65は、主制御部20又は表示部16に設けられる。
追尾処理部62には、対象動画像の画像信号が入力される。対象動画像とは、撮像部11の撮影によって得られた動画像であり、図7に示す如く、時刻t、t、t・・・及びtのフレーム画像を含むフレーム画像列から形成される(nは2以上の整数)。時刻tのフレーム画像とは、時刻tにて撮影されたフレーム画像を指す(iは整数)。時刻ti+1は時刻tよりも後の時刻であり、時刻t及びti+1間の時間間隔は、対象動画像のフレーム周期の整数倍である。追尾対象設定部61は、撮像装置1の撮影範囲内に収まっている被写体の中から追尾対象を設定する。追尾処理部62は、対象動画像の画像信号に基づき各フレーム画像内における追尾対象の位置を逐次検出していくことにより、対象動画像上において追尾対象の位置を追尾する。この追尾を実行する処理を追尾処理と呼ぶ。
音源検出部63は、対象音響信号に基づき音源として機能する被写体(音を発する被写体)を検出する。対象音響信号は、マイク部14に設けられた各マイクロホンの出力音響信号から成る。本実施形態の例では、対象音響信号は、左原信号及び右原信号から成る。音源検出部63は、無指向性の左原信号及び右原信号の位相差に基づき音源(音源SS)の角度θを検出する。複数の無指向性マイクロホンの出力信号の位相差から音源の位置する方向(角度θに相当)を推定する方法は周知であるため、その方法の詳細な説明を割愛する。音源として機能する被写体を音源被写体と呼ぶ。そうすると、音源検出部63は、対象音響信号に基づき音源被写体の角度θを求めることができ、対象動画像の撮影条件(撮像部11の焦点距離など)を用いて角度θを画像空間上の位置に変換することにより、フレーム画像上の音源被写体の位置を検出することができる。
例として、音源被写体311について検出された位置312を図8に示す。図8において、画像310は対象動画像を形成するフレーム画像である。位置312は、音源被写体311の角度θを上記画像空間上の位置に変換したものである。
音源被写体の角度θに基づけば、フレーム画像310上における音源被写体311の水平位置を決定することができる。音源検出部63は、その水平位置の決定後、フレーム画像310の画像信号に基づいて音源被写体311の画像信号が存在する画像領域を検出し、検出した画像領域の中心位置又は重心位置を位置312として検出することができる。音源被写体の画像信号が存在する画像領域を音源被写体領域と呼ぶ。上記決定された水平位置を基準として、フレーム画像310の画像信号に基づくエッジ検出、顔検出処理、輪郭抽出、領域統合などを行うことより、音源被写体311についての音源被写体領域を検出することができる。
また、本実施形態では、マイク部14が左右方向に並べられた2つのマイクロホン14L及び14Rから形成されているが、マイク部14において、左右方向だけでなく上下方向にも沿って複数の無指向性マイクロホンを並べるようにしてもよい。例えば、マイクロホン14L及び14Rと同様のマイクロホン14L’及び14R’(不図示)を、マイクロホン14L及び14Rに加えて、マイクロホン14L及び14Rの下方側に(地面側に)設けておき、マイクロホン14L、14R、14L’及び14R’の出力音響信号に基づきフレーム画像310上の音源被写体311の水平位置及び垂直位置を検出するようにしてもよい。
音量検出部64は、対象音響信号に基づいて音源被写体の音量を検出する。音量検出部64は、対象音響信号の信号レベルを検出することで対象音響信号における音源被写体の音量を検出する。信号レベルとは、注目した信号のパワーを表す。但し、信号レベルを、注目した信号の振幅と捉えることも可能である。
表示制御部65は、表示画面66の表示内容を制御し、対象動画像を表示画面66に表示させる。この際、対象動画像と共に、映像上の様々な指標を表示画面66に表示させることができる(詳細は後述)。
図9は、第1実施形態に係る撮像装置1の動作フローチャートである。図9を参照し、第1実施形態に係る撮像装置1の動作手順を説明する。対象動画像の撮影開始後、まず、ステップS11において音源検出部63による音源検出が成される。ここでは、少なくとも時刻t以前及び時刻tにおいて、人物である被写体SUBが声を発していることを想定する。音源検出部63は、時刻t以前及び時刻tに得られた対象音響信号に基づき、又は、時刻t以前及び時刻tに得られた対象音響信号及び対象動画像の画像信号に基づき、被写体SUBの位置を音源被写体の位置として検出する。図10の画像330は、時刻tのフレーム画像であり、フレーム画像330に対して音源被写体SUBの位置331が検出される。また、ステップS11において、音源被写体SUBについての音源被写体領域が検出される。音源被写体SUBについての音源被写体領域を、記号SUBR1で表す。音源被写体SUB及び位置331は、夫々、図8の被写体311及び位置312に相当する。説明の具体化上、位置331は、音源被写体SUBの中心位置であると共に音源被写体領域SUBR1の中心位置であるとする。
音源被写体SUB及び音源被写体領域SUBR1の検出後、ステップS12において、追尾対象設定部61は、追尾対象及び追尾対象領域を設定する。第1実施形態では、音源被写体が1つしか存在していないことが想定されている。従って、追尾対象設定部61は、ステップS11において検出された音源被写体SUBを追尾対象に設定すると共に、音源被写体領域SUBR1を追尾対象領域に設定する。
その後、ステップS13において、追尾処理部62は、対象動画像の画像信号に基づく追尾処理を開始する。追尾処理を、例えば、ユーザから所定の操作が成されるまで、又は、追尾対象が撮影範囲の外に出るまで継続実行することができる。具体的に例えば、追尾対象領域の画像特徴を時刻tのフレーム画像の画像信号から抽出し、抽出した画像特徴に類似する画像特徴を有する画像領域を時刻ti+1のフレーム画像の追尾対象領域に設定する。このように、フレーム画像が取得される度に追尾対象領域の位置を順次更新してゆくことで追尾対象の位置も更新してゆく。
尚、追尾対象の位置及び追尾対象領域の位置とは、例えば、夫々、フレーム画像上における追尾対象の中心位置及び追尾対象領域の中心位置を指し、且つ、それらの中心位置は同じである。また、追尾処理を、対象動画像の画像信号だけでなく対象音響信号をも利用して行うようにしても良い(後述の他の実施形態においても同様)。追尾対象は音源として機能する被写体であるから、対象音響信号に基づく音源検出をも利用することで追尾精度の向上が図られる。
追尾処理の開始後、ステップS14において、音量検出部64は、現時点の対象音響信号に基づき追尾対象の音量を検出する。ここでは、音源被写体SUBの音量が検出される。続くステップS15において、表示制御部65は、現時点のフレーム画像を追尾対象枠及び音量アイコンと共に表示画面66に表示する。追尾対象枠は、追尾対象領域に応じた枠であり、対応する追尾対象の全部又は一部を取り囲む。音量アイコンはステップS14にて検出された音量を表すアイコンである。ステップS14及びS15は、所定の周期にて繰り返し実行される。このため、ステップS14及びS15の繰り返しによって、表示画面66上に対象動画像が表示されると共に追尾対象枠及び音量アイコンが逐次更新されながら表示される。
図11に、追尾処理の実行中における表示画面66の様子を示す。図11において、画像341、342及び343は、夫々、時刻t、t及びtにおいて表示画面66に表示される画像であり、破線枠F、F及びFは、夫々、時刻t、t及びtにおける追尾対象枠であり、アイコンIC、IC及びICは、夫々、時刻t、t及びtにおける音量アイコンである。時刻t及びt間において、追尾対象としての音源被写体SUBが対象動画像上で移動するにつれて追尾対象枠も表示画面66上で移動する。各時刻における音量アイコンは、追尾対象としての音源被写体SUBの音量を表す。音量アイコンは、表示画面66上の追尾対象に対応付けて表示される。例えば、図11に示す如く、音量アイコンICを追尾対象枠Fの中に表示する。或いは例えば、音量アイコンを追尾対象枠に隣接して表示するようにしても良い。
図12に、任意の時刻に表示される音量アイコンICの例を示す。音量アイコンICの状態(大きさ、色、形状など)は、対応する追尾対象の音量に依存する。例えば、対応する追尾対象の音量が増大すればするほど音量アイコンICの表示サイズを大きくする。図11の例では、追尾対象の音量に応じて音量アイコンICの表示サイズを変更している。表示サイズではなく、音量アイコンICの色や形状の変化によって、対応する音量の変化を表現してもよい。また、音量アイコンICの代わりに、バー形状のアイコンを表示することによって或いは数値などを表示することによって、追尾対象の音量を表示するようにしてもよい。図11の例において、時刻tの音量アイコンICの状態は、時刻t及び時刻t周辺における追尾対象の音量に依存し、時刻tの音量アイコンICの状態は、時刻t及び時刻t周辺における追尾対象の音量に依存する。他の時刻の音量アイコンも同様である。
撮像装置1は、追尾処理の結果を利用して様々なカメラ制御を成すことができる。カメラ制御には、例えば、追尾対象にフォーカスを合わせるオートフォーカス制御、追尾対象の明るさを適正にするオートアイリス制御、追尾対象のホワイトバランスを適正にするオートホワイトバランス制御が含まれる。また、夫々のフレーム画像から追尾対象領域内の画像を切り出し画像として切り出し、得られた切り出し画像列を切り出し動画像として記録媒体19に記録するようにしても良い。
また、追尾対象枠の表示によって音源被写体(例えば、撮影対象となるべき人物)の位置が示されるので、撮影者としてのユーザは、必要に応じて、音源被写体に注目した構図調整を行うことができる。例えば、音源被写体が画面の中央に大きく映し出されるように撮影方向やズーム倍率を調整することが可能となる。
撮影者としてのユーザの注目被写体は、一般的に音源被写体(例えば、人物、犬、猫)であることが多い。第1実施形態によれば、追尾対象としての音源被写体の位置が追尾処理によって表示され続けるため、暗い撮影環境などにおいてもユーザは音源被写体に注目した構図調整を容易に行うことが可能となる。また、音源被写体に注目したカメラ制御(オートフォーカス制御など)を成すことも可能となる。
<<第2実施形態>>
本発明の第2実施形態を説明する。第2実施形態及び後述の他の実施形態は、第1実施形態を基礎とする実施形態であり、第2実施形態及び後述の他の実施形態において、特に述べない事項に関しては第1実施形態の記載が適用される。
第2実施形態では、撮像装置1の撮影範囲内に音源被写体が複数存在することを想定する。音源検出部63は、各音源被写体からの音響信号を対象音響信号から分離抽出する音源分離処理を実行することができる。音源分離処理によって抽出された各々の音源被写体からの音響信号を単位音響信号と呼ぶ。m個の音源被写体が存在する場合、対象音響信号は、音源被写体SUBからの音を表す第1の単位音響信号と、音源被写体SUBからの音を表す第2の単位音響信号と、・・・、音源被写体SUBからの音を表す第mの単位音響信号と、を含む音響信号である(mは2以上の整数)。ここでは、説明の具体化のため、m=3である場合を想定する。
例えば、音源検出部63は、対象音響信号に含まれる信号成分の内、特定の方向から到来した音の信号成分を指向性制御によって強調することにより、各単位音響信号を生成することができる。より具体的には例えば、対象音響信号に含まれる信号成分の内、音源被写体SUBから到来した音の信号成分を指向性制御によって強調することにより、第iの単位音響信号を生成することできる。指向性制御の方法として様々な方法が既に提案されており、音源検出部63は、公知の方法を含む任意の指向性制御方法(例えば、特開2000−81900号公報、特開平10−313497号公報に記載の方法)を用いて各単位音響信号を生成することができる。
或いは、独立成分分析(Independent Component Analysis)を用いて、対象音響信号から各単位音響信号を生成するようにしてもよい。独立成分分析では、同一の時刻に同一の音源からの音響信号は複数個存在しないという仮定の下、音源の独立性を用いて各音源の音響信号が分離抽出される。
音源検出部63は、音源被写体ごとに、単位音響信号に基づき音源被写体の位置を検出すると共に音源被写体についての音源被写体領域を検出する。音源被写体SUBについての音源被写体領域を記号SUBRiにて表す。第iの単位音響信号に基づき音源被写体SUBの位置が検出されると共に音源被写体領域SUBRiが検出される。第iの単位音響信号に基づき音源被写体SUBの位置を検出する方法は、第1実施形態で述べた対象音響信号に基づき音源被写体311の位置312を検出する方法と同様である(図8参照)。或る音源被写体についての音源被写体領域を検出する方法も、第1実施形態で述べたものと同様である。
音量検出部64は、音源被写体ごとに、単位音響信号に基づき音源被写体の音量を検出する。第iの単位音響信号に基づき音源被写体SUBの音量が検出される。
図13は、第2実施形態に係る撮像装置1の動作フローチャートである。図13を参照し、第2実施形態に係る撮像装置1の動作手順を説明する。対象動画像の撮影開始後、まず、ステップS21において音源検出部63による音源検出が成される。ここでは、少なくとも時刻t以前及び時刻tにおいて、人物である被写体SUB及びSUBが声を発していると共に犬である被写体SUBが音を発していることを想定する。音源検出部63は、時刻t以前及び時刻tに得られた対象音響信号に基づき、又は、時刻t以前及び時刻tに得られた対象音響信号及び対象動画像の画像信号に基づき、被写体SUB〜SUBの位置を3つの音源被写体の位置として検出する。図14の画像430は、時刻tのフレーム画像であり、フレーム画像430に対して音源被写体SUBの位置431、音源被写体SUBの位置432及び音源被写体SUBの位置433が検出される。また、ステップS21において、音源被写体SUB〜SUBについての音源被写体領域SUBR1〜SUBR3が検出される。尚、例えば、位置431は、音源被写体SUBの中心位置であると共に音源被写体領域SUBR1の中心位置であり、位置432は、音源被写体SUBの中心位置であると共に音源被写体領域SUBR2の中心位置であり、位置433は、音源被写体SUBの中心位置であると共に音源被写体領域SUBR3の中心位置である。
続くステップS22において、追尾対象設定部61は、検出された各音源被写体を追尾対象に設定すると共に検出された各音源被写体領域を追尾対象領域に設定する。その後、ステップS23において、追尾処理部62は、対象動画像の画像信号に基づく追尾処理を開始する。追尾処理は追尾対象ごとに実行される。
追尾処理の開始後、ステップS24において、音量検出部64は、現時点の対象音響信号に基づき、追尾対象ごとに追尾対象の音量を検出する。ここでは、第1の単位音響信号に基づき音源被写体SUBの音量が第1の追尾対象の音量として検出され、且つ、第2の単位音響信号に基づき音源被写体SUBの音量が第2の追尾対象の音量として検出され、且つ、第3の単位音響信号に基づき音源被写体SUBの音量が第3の追尾対象の音量として検出される。続くステップS25において、表示制御部65は、現時点のフレーム画像を追尾対象枠及び音量アイコンと共に表示画面66に表示する。追尾対象枠及び音量アイコンは、追尾対象ごとに表示される。ステップS24及びS25は、所定の周期にて繰り返し実行される。このため、ステップS24及びS25の繰り返しによって、表示画面66上に対象動画像が表示されると共に各追尾対象の追尾対象枠及び音量アイコンが逐次更新されながら表示される。
図15に、追尾処理の実行中における表示画面66の様子を示す。図15において、画像441、442及び443は、夫々、時刻t、t及びtにおいて表示画面66に表示される画像である。破線枠F11、F12及びF13は、夫々、時刻t、t及びtにおける第1の追尾対象(即ち音源被写体SUB)の追尾対象枠であり、破線枠F21、F22及びF23は、夫々、時刻t、t及びtにおける第2の追尾対象(即ち音源被写体SUB)の追尾対象枠であり、破線枠F31、F32及びF33は、夫々、時刻t、t及びtにおける第3の追尾対象(即ち音源被写体SUB)の追尾対象枠である。アイコンIC11、IC12及びIC13は、夫々、時刻t、t及びtにおける第1の追尾対象(即ち音源被写体SUB)の音量アイコンであり、アイコンIC21、IC22及びIC23は、夫々、時刻t、t及びtにおける第2の追尾対象(即ち音源被写体SUB)の音量アイコンであり、アイコンIC31、IC32及びIC33は、夫々、時刻t、t及びtにおける第3の追尾対象(即ち音源被写体SUB)の音量アイコンである。時刻t及びt間において、追尾対象としての音源被写体SUB〜SUBが対象動画像上で移動するにつれて各追尾対象の追尾対象枠も表示画面66上で移動する。各時刻における音量アイコンICi1は、第iの追尾対象としての音源被写体SUBの音量を表し、表示画面66上の第iの追尾対象に対応付けて表示される。例えば、図15に示す如く、音量アイコンICi1を追尾対象枠Fi1の中に表示する。或いは例えば、音量アイコンICi1を追尾対象枠Fi1に隣接して表示するようにしても良い。音源被写体ごとに、第1実施形態と同様、音源被写体の音量に応じて音量アイコンの状態を変化させることができる。
撮像装置1は、追尾処理の結果を利用して様々なカメラ制御を成すことができる。カメラ制御には、例えば、1以上の追尾対象にフォーカスを合わせるオートフォーカス制御、1以上の追尾対象の明るさを適正にするオートアイリス制御、1以上の追尾対象のホワイトバランスを適正にするオートホワイトバランス制御が含まれる。また、夫々のフレーム画像から第iの追尾対象についての追尾対象領域内の画像を切り出し画像として切り出し、得られた切り出し画像列を切り出し動画像として記録媒体19に記録するようにしても良い(iは、1、2又は3)。
また、追尾対象枠の表示によって音源被写体(例えば、撮影対象となるべき人物)の位置が示されるので、撮影者としてのユーザは、必要に応じて、音源被写体に注目した構図調整を行うことができる。例えば、注目した音源被写体(例えば、SUB及びSUB)が画面の中央に大きく映し出されるように撮影方向やズーム倍率を調整することが可能となる。
第2実施形態においても、第1実施形態と同様、追尾対象としての音源被写体の位置が追尾処理によって表示され続けるため、暗い撮影環境などにおいてもユーザは音源被写体に注目した構図調整を容易に行うことが可能となる。また、音源被写体に注目したカメラ制御(オートフォーカス制御など)を成すことも可能となる。
<<第3実施形態>>
本発明の第3実施形態を説明する。第2実施形態と同様、第3実施形態においても、撮像装置1の撮影範囲内に3つの音源被写体SUB〜SUBが存在することを想定する。第3実施形態は、第2実施形態の変形例に相当する。以下、第2実施形態との相違点を説明する。
図16は、第3実施形態に係る撮像装置1の動作フローチャートである。図16を参照し、第3実施形態に係る撮像装置1の動作手順を説明する。対象動画像の撮影開始後、まず、ステップS31において音源検出部63による音源検出が成される。ステップS31の処理内容は図13のステップS21のそれと同様である。第2実施形態と同様、例えば、時刻tのフレーム画像430(図14参照)に対して、音源被写体SUB〜SUBの位置431〜433が検出され、更に音源被写体SUB〜SUBについての音源被写体領域SUBR1〜SUBR3が検出される。
ステップS31の後、ステップS36における音量検出が成される。ステップS36では、現時点の対象音響信号に基づき音源被写体ごとに音源被写体の音量を検出する。ここで検出された音量検出結果を音量アイコンとして表示するようにしても良い。ステップS36で検出された音源被写体SUB、SUB及びSUBの音量を、夫々、音量VOL、VOL及びVOLと呼ぶ。
ステップS36の処理後、ステップS32において、追尾対象設定部61は追尾対象及び追尾対象領域を設定する。この際、ステップS36で検出された音量に基づき、音源被写体SUB〜SUBの内、何れか1以上の音源被写体を選択的に追尾対象に設定することができる。例えば、音量が比較的大きい音源被写体のみを追尾対象に設定することができる。より具体的には例えば、音量VOL、VOL及びVOLの夫々を、所定の基準音量VOLTHと比較する。そして、音量VOLが基準音量VOLTH以上である場合に、音源被写体SUBを追尾対象に設定し、音量VOLが基準音量VOLTH未満である場合には、音源被写体SUBを追尾対象に設定しない。同様に、音量VOLが基準音量VOLTH以上である場合に、音源被写体SUBを追尾対象に設定し、音量VOLが基準音量VOLTH未満である場合には、音源被写体SUBを追尾対象に設定しない。音源被写体SUBについても同様である。
ステップS32にて追尾対象及び追尾対象領域を設定した後、ステップS33の処理が実行され、その後、S34及びS35の処理が繰り返し実行される。ステップS33〜S35の処理は、図13のステップS23〜S25のそれらと同じである。
<<第4実施形態>>
本発明の第4実施形態を説明する。第2実施形態と同様、第4実施形態においても、撮像装置1の撮影範囲内に3つの音源被写体SUB〜SUBが存在することを想定する。第4実施形態は、第2実施形態の変形例に相当する。以下、第2実施形態との相違点を説明する。
図17は、第4実施形態に係る撮像装置1の動作フローチャートである。図17を参照し、第4実施形態に係る撮像装置1の動作手順を説明する。対象動画像の撮影開始後、まず、ステップS41において音源検出部63による音源検出が成される。ステップS41の処理内容は図13のステップS21のそれと同様である。第2実施形態と同様、例えば、時刻tのフレーム画像430(図14参照)に対して、音源被写体SUB〜SUBの位置431〜433が検出され、更に音源被写体SUB〜SUBについての音源被写体領域SUBR1〜SUBR3が検出される。
ステップS41の後、ステップS46における音量検出が成される。ステップS46における音量検出は、図16のステップS36のそれと同様である。その後、ステップS47において、表示制御部65は、現時点のフレーム画像と共に、ステップS41にて検出された音源被写体SUB〜SUBの位置を表示画面66に表示する。
図18の画像500は、ステップS47にて表示されるフレーム画像の例である。図18において、破線枠501〜503は、夫々、フレーム画像500上における音源被写体SUB〜SUBの位置を基準とする音源被写体枠である。音源被写体枠501〜503の表示によって、ユーザは音源被写体SUB〜SUBの位置を表示画面66上で認識することができる。音源被写体枠501〜503は、例えば、それぞれ、音源被写体領域SUBR1〜SUBR3そのものである、或いは、音源被写体領域SUBR1〜SUBR3を基準とする枠である、或いは、ステップS41にて検出された位置431〜433(図14参照)を中心とする所定形状の枠である。図18に示す如く、ステップS47において、音源被写体枠501〜503に対応付けて音量アイコン511〜513を更に表示するようにしても良い。音量アイコン511〜513は、夫々、ステップS46にて検出された音源被写体SUB〜SUBの音量を表す。
ステップS47の表示を行っている状態において、ステップS48の分岐処理を実行する。ステップS48では、ユーザによる追尾対象指定操作を受け付ける。追尾対象指定操作は、音源被写体SUB〜SUBの内の何れか1以上の音源被写体を追尾対象に指定する操作である。ユーザは、図1の操作部18に対して追尾対象指定操作を成すことができる。この場合、操作部18が追尾対象指定操作を受ける操作受付部として機能する。或いは、表示部16にタッチパネルが設けられている場合、ユーザは該タッチパネルに対して追尾対象指定操作を成すこともできる。この場合には、タッチパネルが上記の操作受付部として機能する。例えば、図18のフレーム画像500が表示されているとき、音源被写体枠501を指にて触れることで音源被写体SUBを追尾対象に指定することができる。複数の音源被写体を追尾対象に指定することもできる。
追尾対象指定操作が成されるまでステップS42への遷移が待機され、追尾対象指定操作が成されるとステップS48からステップS42への遷移が発生する。追尾対象指定操作が成されるまでの間、表示画面66に表示される各音源被写体の位置が最新のものに順次更新されてゆくように、ステップS46〜S48の処理(或いは、ステップS41及びS46〜S48の処理)を繰り返し実行するようにしても良い。
ステップS42において、追尾対象設定部61は、追尾対象指定操作の内容に従って追尾対象及び追尾対象領域を設定する。即ち、追尾対象指定操作の内容に基づき、音源被写体SUB〜SUBの内、何れか1以上の音源被写体を選択的に追尾対象に設定する。例えば、追尾対象指定操作によって音源被写体SUBが追尾対象に指定されている場合、実際に音源被写体SUBを追尾対象に設定する。
ステップS42にて追尾対象及び追尾対象領域を設定した後、ステップS43の処理が実行され、その後、S44及びS45の処理が繰り返し実行される。ステップS43〜S45の処理は、図13のステップS23〜S25のそれらと同じである。
<<変形等>>
本発明の実施形態は、特許請求の範囲に示された技術的思想の範囲内において、適宜、種々の変更が可能である。以上の実施形態は、あくまでも、本発明の実施形態の例であって、本発明ないし各構成要件の用語の意義は、以上の実施形態に記載されたものに制限されるものではない。上述の説明文中に示した具体的な数値は、単なる例示であって、当然の如く、それらを様々な数値に変更することができる。上述の実施形態に適用可能な注釈事項として、以下に、注釈1〜注釈4を記す。各注釈に記載した内容は、矛盾なき限り、任意に組み合わせることが可能である。
[注釈1]
追尾対象枠(図11の破線枠F等)及び音源被写体枠(図18の破線枠501等)の表示によって追尾対象及び音源被写体の位置(対象動画像上の位置)が表示されることになるが、追尾対象及び音源被写体の位置の表示方法はこれに限定されない。例えば、追尾対象枠及び音源被写体枠の表示を停止し、代わりに、図19に示す如く、追尾対象又は音源被写体である被写体SUBが表示されている位置に音量アイコンICを重畳表示することで被写体SUBの位置表示を実現しても良い。更に、追尾対象又は音源被写体が表示されている位置に重畳表示されるアイコンは音量アイコン以外のアイコンであってもよい。
[注釈2]
第1実施形態で述べた内容と一部重複するが、マイク部14に設けられるマイクロホンの個数は3以上であっても良い。マイク部14に設けられる複数のマイクロホンは、撮像装置1の筐体上の互いに異なる位置に設置される。マイクロホンの個数を増大させることで、音源被写体の位置(対象動画像上における位置)の検出精度を高めることができる。
[注釈3]
撮像装置1は、任意の電子機器(例えば、携帯電話機又は情報端末)に搭載されるものであっても良い。
[注釈4]
図1の撮像装置1を、ハードウェア、或いは、ハードウェアとソフトウェアの組み合わせによって構成することができる。ソフトウェアを用いて撮像装置1を構成する場合、ソフトウェアにて実現される部位についてのブロック図は、その部位の機能ブロック図を表すことになる。ソフトウェアを用いて実現される機能をプログラムとして記述し、該プログラムをプログラム実行装置(例えばコンピュータ)上で実行することによって、その機能を実現するようにしてもよい。
1 撮像装置
11 撮像部
13 画像処理部
14 マイク部
15 音響信号処理部
16 表示部
61 追尾対象設定部
62 追尾処理部
63 音源検出部
64 音量検出部
65 表示制御部
66 表示画面

Claims (6)

  1. 被写体の動画像の画像信号を出力する撮像部と、
    複数のマイクロホンから成るマイク部と、
    前記複数のマイクロホンの出力音響信号に基づき音源として機能する音源被写体を検出する音源検出部と、
    前記音源被写体を追尾対象に設定し、前記画像信号を用いて前記動画像上で前記追尾対象を追尾する追尾処理部と、を備えた
    ことを特徴とする撮像装置。
  2. 表示画面を有し、前記動画像を前記表示画面に表示するとともに前記表示画面上における前記追尾対象の位置を表示する表示部を更に備えた
    ことを特徴とする請求項1に記載の撮像装置。
  3. 前記音源検出部において、前記音源被写体として複数の音源被写体が検出された場合、
    前記追尾処理部は、前記複数の音源被写体の内の何れか1以上の音源被写体を選択的に前記追尾対象に設定する
    ことを特徴とする請求項1又は請求項2に記載の撮像装置。
  4. 前記複数の音源被写体の夫々の音量を検出する音量検出部を更に備え、
    前記追尾処理部は、前記音量検出部の検出結果に基づき前記追尾対象を設定する
    ことを特徴とする請求項3に記載の撮像装置。
  5. 前記複数の音源被写体の内の何れか1以上の音源被写体を指定する操作を受ける操作受付部を更に備え、
    前記追尾処理部は、前記操作の内容に基づき前記追尾対象を設定する
    ことを特徴とする請求項3に記載の撮像装置。
  6. 前記追尾対象の音量を検出する音量検出部を更に備え、
    前記表示部は、前記音量検出部の検出結果をも表示する
    ことを特徴とする請求項2又は請求項3に記載の撮像装置。
JP2010266943A 2010-11-30 2010-11-30 撮像装置 Pending JP2012119872A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010266943A JP2012119872A (ja) 2010-11-30 2010-11-30 撮像装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010266943A JP2012119872A (ja) 2010-11-30 2010-11-30 撮像装置

Publications (1)

Publication Number Publication Date
JP2012119872A true JP2012119872A (ja) 2012-06-21

Family

ID=46502244

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010266943A Pending JP2012119872A (ja) 2010-11-30 2010-11-30 撮像装置

Country Status (1)

Country Link
JP (1) JP2012119872A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114926378A (zh) * 2022-04-01 2022-08-19 浙江西图盟数字科技有限公司 一种声源跟踪的方法、***、装置和计算机存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114926378A (zh) * 2022-04-01 2022-08-19 浙江西图盟数字科技有限公司 一种声源跟踪的方法、***、装置和计算机存储介质

Similar Documents

Publication Publication Date Title
JP5748422B2 (ja) 電子機器
US9179059B2 (en) Image capture device and image display method
JP6157242B2 (ja) 画像処理装置及び画像処理方法
JP5946970B2 (ja) 撮像装置及び撮像方法
US20120044400A1 (en) Image pickup apparatus
JP2012027408A (ja) 電子機器
JP2005241805A (ja) オートフォーカス装置及びそのプログラム
KR101710626B1 (ko) 디지털 촬영 장치 및 이의 제어 방법
JP2008193196A (ja) 撮像装置および指定音声出力方法
KR20120025872A (ko) 적절한 밝기를 갖는 입체 영상을 생성하는 디지털 영상 촬영 장치 및 이의 제어 방법
KR101739379B1 (ko) 디지털 촬영 장치 및 이의 제어 방법
JP6739064B1 (ja) 撮像装置
JP2012002951A (ja) 撮像装置、合焦位置検出方法および合焦位置検出プログラム
US20120218377A1 (en) Image sensing device
KR101728042B1 (ko) 디지털 촬영 장치 및 이의 제어 방법
JP2013153330A (ja) 電子機器及び撮影制御方法
JP2019176249A (ja) 画像処理装置、画像処理方法、画像処理プログラム及び撮像装置
KR101760345B1 (ko) 동영상 촬영 방법 및 동영상 촬영 장치
KR101737086B1 (ko) 디지털 촬영 장치 및 이의 제어 방법
KR20120080376A (ko) 디지털 영상 촬영 장치 및 이의 제어 방법
KR20120019703A (ko) 디지털 촬영 장치의 제어 방법 및 디지털 촬영 장치
KR101630304B1 (ko) 디지털 촬영 장치, 그 제어 방법, 및 컴퓨터 판독가능 매체
JP2012119872A (ja) 撮像装置
KR101635102B1 (ko) 디지털 촬영 장치 및 이의 제어 방법
JP2009239460A (ja) 焦点制御方法、測距装置、撮像装置

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20130404