JP2006203860A - 撮像装置、撮像方法、再生装置、再生方法、及びプログラム - Google Patents

撮像装置、撮像方法、再生装置、再生方法、及びプログラム Download PDF

Info

Publication number
JP2006203860A
JP2006203860A JP2005341031A JP2005341031A JP2006203860A JP 2006203860 A JP2006203860 A JP 2006203860A JP 2005341031 A JP2005341031 A JP 2005341031A JP 2005341031 A JP2005341031 A JP 2005341031A JP 2006203860 A JP2006203860 A JP 2006203860A
Authority
JP
Japan
Prior art keywords
unit
sound
volume
storage unit
imaging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005341031A
Other languages
English (en)
Inventor
Ichigaku Mino
一学 三野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Holdings Corp
Original Assignee
Fuji Photo Film Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Photo Film Co Ltd filed Critical Fuji Photo Film Co Ltd
Priority to JP2005341031A priority Critical patent/JP2006203860A/ja
Priority to US11/303,923 priority patent/US7668455B2/en
Publication of JP2006203860A publication Critical patent/JP2006203860A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)

Abstract

【課題】望ましい音声と画像をユーザが容易に得ることができる撮像装置又は再生装置を提供すること。
【解決手段】被写体を撮像する撮像部と、撮像部の周囲の音声を録音する録音部と、設定された閾値音量を格納する閾値音量格納部と、録音部が録音した音声のうちで、閾値音量格納部が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出部と、撮像部が撮像した複数の撮像画像のそれぞれと、音声抽出部が抽出した複数の音声のそれぞれとを、撮像及び録音された順に対応づけて格納するデータ格納部と、データ格納部が対応づけて格納する撮像画像と音声とを同期させて出力するデータ出力部とを備える。
【選択図】図2

Description

本発明は、撮像装置、撮像方法、再生装置、再生方法、及びプログラムに関する。特に本発明は、画像を撮像する撮像装置及び撮像方法、並びに画像を再生する再生装置及び再生方法、並びに当該撮像装置及び再生装置用のプログラムに関する。
従来、静止画だけでなく動画もメモリカードに記録することができ、また、静止画や動画の撮影記録時にマイクロホンで検出した音声を画像に対応させて記録できるデジタルスチルカメラがある(例えば、特許文献1参照。)。
特開平7−154734号公報
しかしながら、このようなカメラを用いて、例えば山で鳥を撮影したとき、鳥の鳴き声の他に周囲の雑音も一緒に録音されてしまい、画像を再生したときの音声が面白くないものになってしまう場合がある。このような場合には、鳥の鳴き声以外の音をカットしたり、周囲の雑音が少ないときの音声を再生するようにしたりして、より楽しく画像を観賞することができることが望ましい。さらに、ユーザにとっては撮影後に画像と音声の編集処理等の煩雑な作業をすることなく、容易に画像と音声とを鑑賞することができることが望ましい。
そこで本発明は、上記の課題を解決することができる撮像装置、撮像方法、再生装置、再生方法、及びプログラムを提供することを目的とする。この目的は特許請求の範囲における独立項に記載の特徴の組み合わせにより達成される。また従属項は本発明の更なる有利な具体例を規定する。
本発明の第1の形態における撮像装置は、被写体を撮像する撮像部と、撮像部の周囲の音声を録音する録音部と、設定された閾値音量を格納する閾値音量格納部と、録音部が録音した音声のうちで、閾値音量格納部が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出部と、撮像部が撮像した撮像画像と、音声抽出部が抽出した音声とを対応づけて格納するデータ格納部と、データ格納部が対応づけて格納している撮像画像と音声とを同期させて出力するデータ出力部とを備える。
データ格納部は、撮像部が撮像した複数の撮像画像のそれぞれと、音声抽出部が抽出した複数の音声のそれぞれとを、撮像及び録音された順に対応づけて格納してよい。
録音部が録音した音声を格納する音声格納部と、音声格納部が格納している音声の音量分布に基づいて、閾値音量格納部が格納している閾値音量を設定する閾値音量設定部とをさらに備えてよい。閾値音量設定部は、音声格納部が格納している音声の音量の平均値がより大きい場合に、閾値音量格納部が格納している閾値音量をより大きく設定してよい。
音声抽出部が抽出する複数の音声の期間の合計が、撮像部が撮像した複数の撮像画像の数に、予め定められた撮像画像の再生時間を乗じた期間と同一となるように、閾値音量格納部が格納している閾値音量を設定する閾値音量設定部をさらに備えてよい。閾値音量格納部は、複数の周波数帯域のそれぞれに対応づけて帯域別閾値音量を格納し、音声抽出部は、録音部が録音した音声の音量を周波数帯域毎に、閾値音量格納部が格納している帯域別閾値音量と比較し、特定の周波数帯域において帯域別閾値音量より大きい音量が含まれる一部の期間の音声を抽出してよい。
当該撮像装置の周囲の環境を特定する環境特定部と、設定された帯域周波数の音声を透過させる可変フィルタ部と、環境特定部が特定した環境に応じて、可変フィルタ部が透過させる音声の帯域周波数を設定する帯域制御部とをさらに備え、録音部は、フィルタ部が透過させた音声を録音してよい。
当該撮像装置の位置を検出する位置検出部と、位置を示す情報に対応づけて、環境を示す情報を格納する環境情報格納部とをさらに備え、環境特定部は、位置検出部が検出した位置に基づいて環境情報格納部を検索し、当該撮像装置の周囲の環境を特定してよい。
時刻を検出する時刻検出部と、時刻を示す情報に対応づけて、環境を示す情報を格納する環境情報格納部とをさらに備え、環境特定部は、時刻検出部が検出した時刻に基づいて環境情報格納部を検索し、当該撮像装置の周囲の環境を特定してよい。
本発明の第2の形態における撮像方法は、撮像部を用いて被写体を撮像する段階と、撮像部の周囲の音声を録音する録音段階と、設定された閾値音量を格納する閾値音量格納段階と、録音段階において録音された音声のうちで、閾値音量格納段階において格納される閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出段階と、撮像部が撮像した撮像画像と、音声抽出段階で抽出された音声とを対応づけて格納するデータ格納段階と、データ格納段階において対応づけて格納される撮像画像と音声とを同期させて出力するデータ出力段階とを備える。
本発明の第3の形態によると、画像を撮像する撮像装置用のプログラムであって、撮像装置を被写体を撮像する撮像部、撮像部の周囲の音声を録音する録音部、設定された閾値音量を格納する閾値音量格納部、録音部が録音した音声のうちで、閾値音量格納部が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出部、撮像部が撮像した撮像画像と、音声抽出部が抽出した音声とを対応づけて格納するデータ格納部、データ格納部が対応づけて格納している撮像画像と音声とを同期させて出力するデータ出力部として機能させる。
本発明の第4の形態における再生装置は、撮像装置によって撮像された撮像画像を格納する撮像画像格納部と、撮像装置によって録音された音声を格納する音声格納部と、閾値音量を格納する閾値音量格納部と、音声格納部が格納している音声のうちで、閾値音量格納部が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出部と、撮像画像格納部が格納する撮像画像と、音声抽出部が抽出した音声とを対応づけて格納するデータ格納部と、データ格納部が対応づけて格納している撮像画像と音声とを同期させて出力するデータ出力部とを備える。
設定された許容時間を格納する許容時間格納部をさらに備え、撮像画像格納部は、撮像装置によって撮像された時刻に対応づけて撮像画像を格納し、音声格納部は、撮像装置によって録音された時刻に対応づけて音声を格納し、音声抽出部は、撮像画像格納部が格納している撮像画像が撮像された時刻から、許容時間格納部が格納している許容時間の範囲内の時刻に録音された音声のうちで、閾値音量格納部が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出してよい。
撮像画像格納部が格納している撮像画像を再生するべき旨の指示を受け付ける指示受付部と、指示受付部が指示を受け付けたときの時刻を検出する時刻検出部と、撮像画像格納部が格納している撮像画像が撮像された時刻と、時刻検出部が検出した時刻との差が大きいほど、許容時間格納部が格納している許容時間を長く設定する許容時間制御部をさらに備えてよい。
音声格納部が格納している音声の音量分布に基づいて、閾値音量格納部が格納している閾値音量を設定する閾値音量設定部をさらに備えてよい。閾値音量設定部は、音声格納部が格納している音声の音量の平均値がより大きい場合に、閾値音量格納部が格納している閾値音量をより大きく設定してよい。
本発明の第5の形態における再生方法は、撮像装置によって撮像された撮像画像を格納する撮像画像格納段階と、撮像装置によって録音された音声を格納する音声格納段階と、閾値音量を格納する閾値音量格納段階と、音声格納段階において格納される音声のうちで、閾値音量格納段階において格納される閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出段階と、撮像画像格納段階において格納される撮像画像と、音声抽出段階において抽出される音声とを対応づけて格納するデータ格納段階と、データ格納段階において対応づけて格納される撮像画像と音声とを同期させて出力するデータ出力部とを備える。
本発明の第6の形態によると、画像を再生する再生装置用のプログラムであって、再生装置を撮像装置によって撮像された撮像画像を格納する撮像画像格納部、撮像装置によって録音された音声を格納する音声格納部、閾値音量を格納する閾値音量格納部、音声格納部が格納している音声のうちで、閾値音量格納部が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出部、撮像画像格納部が格納している撮像画像と、音声抽出部が抽出した音声とを対応づけて格納するデータ格納部、データ格納部が対応づけて格納している撮像画像と音声とを同期させて出力するデータ出力部として機能させる。
なお上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではなく、これらの特徴群のサブコンビネーションもまた発明となりうる。
本発明によれば、望ましい音声と画像をユーザが容易に得ることができる撮像装置又は再生装置を提供することができる。
以下、発明の実施形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
図1は、本発明の第1実施形態に係る撮像装置100及び再生装置140の利用環境の一例を示す。この例では、撮像装置100は、海岸に遊びにきている人の画像を撮像する。また、撮像装置100は、撮像装置100の周囲の音をマイクロホン102で録音する。撮像装置100は、撮像装置100が撮像した画像及び録音した音声を、インターネット等の通信回線150を通じて再生装置140に出力する。再生装置140は、撮像装置100から受け取った画像を再生しつつ、撮像装置100から受け取った音声を再生する。
このとき、撮像装置100は、撮像画像を撮像したときの撮像場所、撮像時刻において録音された特徴的な音声を、撮像画像とともに再生装置140に出力する。また、再生装置140は、撮像装置100が撮像画像を再生するときに、録音された音声のうち撮像画像を撮像したときの特徴的な音声を、撮像画像とともに再生する。このため、ユーザ180は、望ましい音声と画像を容易に得ることができる。
撮像装置100は、例えば、ユーザ180が所持するデジタルスチルカメラ、カメラ付携帯電話等であってよい。また、再生装置140は、例えば、画像及び音声を再生することのできるHDTV、フォトスタンド等であってよい。他にも、再生装置140は、画像及び音声を再生するコンピュータであってもよい。撮像装置100は、再生装置140が有する画像又は音声を再生する機能を持ってもよい。また、撮像装置100は画像及び音声データを記録媒体に記録し、再生装置140は当該記録媒体からデータを受け取って、画像及び音声を再生してもよい。また、撮像装置100は、画像及び音声データを、通信回線150に接続されたサーバの、ユーザ180毎にそれぞれ設けられたディレクトリ、例えば撮像装置100と関連付けられたディレクトリに格納してもよい。そして再生装置140は、ユーザ180毎にサーバに格納された画像及び音声データを受け取ってもよい。
図2は、撮像装置100のブロック構成の一例を示す。撮像装置100は、撮像部212、録音部214、音声格納部216、音声抽出部218、閾値音量設定部220、閾値音量格納部222、データ格納部232、データ出力部234、可変フィルタ部242、帯域制御部244、環境特定部252、環境情報格納部246、位置検出部248、及び時刻検出部250を備える。
撮像部212は、被写体を撮像する。具体的には、撮像部212は、被写体からの光をCCD等の撮像デバイスで受光して、被写体を撮像する。なお、撮像部212は、所定の時間間隔で連続的に被写体を撮像してもよい。そして、撮像部212は、連続的に撮像して得られる所定の個数の画像を保持しておいてよい。そして、撮像部212は、保持した画像の中から、撮像を指示された時刻に最も近いタイミングで撮像された画像を、当該時刻に撮像された撮像画像として選択してもよい。
録音部214は、撮像部212の周囲の音声を録音する。例えば録音部214は、マイクロホン102で集音される音声を録音する。音声格納部216は、録音部214が録音した音声を格納する。
閾値音量格納部222は、設定された閾値音量を格納する。そして、音声抽出部218は、録音部214が録音した音声のうちで、閾値音量格納部222が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する。
データ格納部232は、撮像部212が撮像した撮像画像と、音声抽出部218が抽出した音声とを対応づけて格納する。具体的には、データ格納部232は、撮像部212が撮像した複数の撮像画像のそれぞれと、音声抽出部218が抽出した複数の音声のそれぞれとを、撮像及び録音された順に対応づけて格納する。データ出力部234は、データ格納部232が対応づけて格納している撮像画像と音声とを同期させて出力する。このため、ユーザ180は、撮像画像と音声を容易に鑑賞することができる。
なお、閾値音量格納部222は、撮像装置100のユーザ180が設定した閾値音量を格納してもよい。また、閾値音量設定部220によって設定された閾値音量を格納してもよい。閾値音量設定部220は、音声抽出部218が抽出する複数の音声の期間の合計が、撮像部212が撮像した複数の撮像画像の数に、予め定められた撮像画像の再生時間を乗じた期間と同一となるように、閾値音量格納部222が格納している閾値音量を設定する。
また、閾値音量設定部220は、音声格納部216が格納している音声の音量分布に基づいて、閾値音量格納部222が格納している閾値音量を設定してもよい。具体的には、閾値音量設定部220は、音声格納部216が格納している音声の音量分布がより大きい方に偏っている場合に、閾値音量格納部222が格納している閾値音量をより大きく設定してもよい。具体的には、閾値音量設定部220は、音声格納部216が格納している音声の音量の平均値がより大きい場合に、閾値音量格納部222が格納している閾値音量をより大きく設定してよい。
また、閾値音量格納部222は、複数の周波数帯域のそれぞれに対応づけて帯域別閾値音量を格納してもよい。そして、音声抽出部218は、録音部214が録音した音声の音量を周波数帯域毎に、閾値音量格納部222が格納している帯域別閾値音量と比較し、特定の周波数帯域において帯域別閾値音量より大きい音量が含まれる一部の期間の音声を抽出してもよい。このため、ユーザ180は、撮像画像に対して望ましい周波数帯域の音声を撮像画像とともに鑑賞することができる。例えば、100Hzから4000Hzの周波数帯域の閾値音量を低く設定することによって、遊園地で遊んでいる人物が撮像された画像を、人物の声と容易に対応づけて鑑賞することができる。
環境情報格納部246は、位置を示す情報に対応づけて、環境を示す情報を格納する。具体的には、環境情報格納部246は、緯度及び経度情報と、当該緯度及び経度における環境情報とを対応づけて格納する。環境情報とは、例えば、海、山、川等の自然の環境を示す情報であってよい。他にも、環境情報とは、遊園地、球技場、音楽ホール等、人間による利用環境を示す情報であってよい。
位置検出部248は、撮像装置100の位置を検出する。例えば、位置検出部248は、GPS衛星からの緯度及び経度情報を受信することによって、撮像装置100が存在する緯度及び経度を特定する。
環境特定部252は、位置検出部248が検出した位置に基づいて環境情報格納部246を検索し、撮像装置100の周囲の環境を特定する。例えば、環境特定部252は、位置検出部248によって検出された緯度及び経度情報に合致する環境情報を、環境情報格納部246を検索することによって特定する。
他にも、環境情報格納部246は、時刻を示す情報に対応づけて、環境を示す情報を格納する。例えば、環境情報格納部246は、日付を含む時刻と季節とを対応づけて格納する。
時刻検出部250は、時刻を検出する。そして、環境特定部252は、時刻検出部250が検出した時刻に基づいて環境情報格納部246を検索し、撮像装置100の周囲の環境を特定する。例えば、時刻検出部250が検出する時刻に該当する季節を、環境情報格納部246を検索することによって特定する。
帯域制御部244は、環境特定部252が特定した撮像装置100の周囲の環境に応じて、可変フィルタ部242が透過させる音声の帯域周波数を設定する。可変フィルタ部242は、帯域制御部244によって設定された帯域周波数の音声を透過させる。そして、録音部214は、可変フィルタ部242が透過させた音声を録音する。
このため、ユーザ180は、撮像装置100を用いて撮像するときの環境、時刻に応じた望ましい周波数帯域の音声を録音することができる。
図3は、再生装置140のブロック構成の一例を示す。再生装置140は、音声格納部316、音声抽出部318、撮像画像格納部320、データ格納部332、データ出力部334、指示受付部312、許容時間制御部362、許容時間格納部364、時刻検出部360、閾値音量格納部322、及び閾値音量設定部324を備える。
撮像画像格納部320は、撮像装置100によって撮像された撮像画像を格納する。また、音声格納部316は、撮像装置100によって録音された音声を格納する。具体的には、撮像画像格納部320は、撮像装置100によって撮像された時刻に対応づけて撮像画像を格納する。また、音声格納部316は、撮像装置100によって録音された時刻に対応づけて音声を格納する。
閾値音量格納部322は、閾値音量を格納する。音声抽出部318は、音声格納部316が格納している音声のうちで、閾値音量格納部322が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する。
データ格納部332は、撮像画像格納部320が格納している撮像画像と、音声抽出部318が抽出した音声とを対応づけて格納する。指示受付部312は、撮像画像格納部320が格納している撮像画像を再生するべき旨の指示を受け付ける。指示受付部312は、例えばユーザ180からの指示を受け付ける。データ出力部334は、指示受付部312が指示を受け付けた場合に、データ格納部232が対応づけて格納している撮像画像と音声とを同期させて出力する。
許容時間格納部364は、設定された許容時間を格納する。音声抽出部318は、撮像画像格納部320が格納している撮像画像が撮像された時刻から、許容時間格納部364が格納している許容時間の範囲内の時刻に録音された音声のうちで、閾値音量格納部222が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する。
具体的には、音声抽出部318は、撮像画像格納部320が格納している撮像画像が撮像された時刻から、許容時間格納部364が格納している許容時間だけ前及び/又は後の時間範囲内の時刻に録音された音声のうちで、閾値音量格納部222が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する。
閾値音量設定部324は、音声抽出部318が抽出する複数の音声の期間の合計が、予め定められた撮像画像の再生時間と同一となるように、閾値音量格納部322が格納している閾値音量を設定する。
時刻検出部360は、指示受付部312が指示を受け付けたときの時刻を検出する。そして、許容時間制御部362は、撮像画像格納部320が格納している撮像画像が撮像された時刻と、時刻検出部360が検出した時刻との差が大きいほど、許容時間格納部364が格納している許容時間を長く設定する。このため、再生装置140は、より広い時間範囲で録音された音声の中から選択されるより特徴的な音声とともに、遠い過去の撮像画像を再生することができる。また、再生装置140は、より近い過去に撮像された撮像画像を、撮像時刻の近くで録音された音声の中から選択して再生することができるので、撮像画像に対して再生される音声が不自然なものになることを防ぐことができる。
閾値音量設定部324は、音声格納部316が格納している音声の音量分布に基づいて、閾値音量格納部322が格納している閾値音量を設定してよい。具体的には、閾値音量設定部324は、音声格納部316が格納している音声の音量分布がより大きい方に偏っている場合に、閾値音量格納部322が格納している閾値音量をより大きく設定してもよい。より具体的には、閾値音量設定部324は、音声格納部316が格納している音声の音量の平均値がより大きい場合に、閾値音量格納部322が格納している閾値音量をより大きく設定してよい。
図4は、撮像画像と音声との対応関係の一例を示す。撮像部212は、時刻t3、t4、t7、t9、t13、t14の順に撮像された6個の画像を格納している。そして、音声格納部216には、録音部214によって録音した音声を時刻に対応づけて、音量波形402で示される音量の音声が格納されている。
閾値音量格納部222には、閾値音量L412が設定されている。そして、音声抽出部218は、音量波形402の音声のうち、閾値音量格納部222が格納している閾値音量L412より大きい音量の音声を抽出する。このとき、閾値音量設定部220は、音量波形402のうち閾値音量L412より大きい期間(t1〜t2、t5〜t10、及びt12〜t16)を合計した期間と、撮像部212によって撮像された6個の画像を再生する再生時間の合計時間とが同一になるように、閾値音量L412を設定する。そして、データ格納部232は、撮像部212が撮像した撮像画像のそれぞれが撮像された順に、音声抽出部218によって抽出された期間の音声のうち再生時間毎の期間の音声を順に対応づけて格納する。
具体的には、データ格納部232は、時刻t3に撮像された画像を、時刻(t1〜t2)に録音された音声と対応づけて格納する。また、データ格納部232は、時刻(t4、t7、t9)に撮像された画像を、期間(t5〜t10)に録音された音声のうち、それぞれ再生時間で分割した期間(t5〜t6)、期間(t6〜t8)、期間(t8〜t10)の音声と対応づけて格納する。同様に、データ格納部232は、時刻t13及び時刻t14に撮像された画像を、それぞれ期間(t12〜t15)、及び期間(t15〜t16)に録音された音声と対応づける。なお、説明を簡単にするために、時刻(t1〜t2)、期間(t5〜t6)、期間(t6〜t8)、期間(t8〜t10)、期間(t12〜t15)、及び期間(t15〜t16)のそれぞれは、予め設定された再生時間と同一の期間であるとした。このため、ユーザ180は、撮像装置100を用いて撮像しながら周囲の音声を録音しておくだけで、撮像画像と音声とを容易に対応づけることができる。
なお、音量及び閾値音量は、音圧を意味してよい。他にも、音量及び閾値音量は、人間の聴覚に対応する音の大きさを意味してもよい。
図5は、撮像画像と音声との対応関係の他の一例を示す。撮像部212は、時刻t3、t4、t7、t9、t13、t14の順に撮像された6個の画像を格納している。そして、音声格納部216には、録音部214が録音した音量波形402で示される音量の音声が格納されている。この場合、閾値音量設定部220は、音声格納部216が格納する音量波形から、時間についての平均音量Lavを算出する。そして、閾値音量設定部220は算出した平均音量Lavに、予め定めれた係数(例えば、1以上の係数)を乗じた音量閾値L412を閾値音量格納部222に格納させる。そして、音声抽出部218は、音量波形402の音声のうち、閾値音量格納部222が格納している閾値音量L412より大きい音量の音声、例えば、期間(t1〜t2、t5〜t10、及びt12〜t16)を抽出する。なお、データ格納部232は、図4に関連して説明した音声と画像との対応付けと同様にして、音声抽出部218が抽出した期間の音声と画像とを、画像の撮像時刻の順に対応付けて格納する。
このように、閾値音量設定部220は、音声格納部216に格納されている音声の平均的な音量に応じた適切な閾値を設定することができる。なお、閾値音量設定部220が設定した閾値音量L412より大きい音量の音声の期間の合計が1つの画像の再生時間に画像の数を乗じた期間より短い場合には、データ格納部232は、当該期間の合計値を画像の数で除した期間の音声のそれぞれと画像とを、画像の撮像時刻の順に対応づけて格納してよい。なお、閾値音量設定部220が設定した閾値音量L412より大きい音量の音声の期間の合計が1つの画像の再生時間に画像の数を乗じた期間より長い場合には、データ格納部232は、複数の画像のそれぞれについて、画像が撮像された時刻に最も近い、他の画像に対応づけられた音声の期間とは異なる期間の音声を選択して、選択した音声と画像とを対応づけて格納してよい。
図6は、周波数帯域毎に設定される閾値音量の一例を示す。例えば、閾値音量格納部222は、周波数f551〜f552、周波数f552〜f553、及び周波数f553〜f554の周波数帯域の音声に対する閾値音量として、それぞれ閾値音量L501、閾値音量L502、及び閾値音量L503を格納する。図6の音量波形520、音量波形530、及び音量波形540は、それぞれ周波数f551〜f552、周波数f552〜f553、及び周波数f553〜f554の周波数帯域の成分の音量の時間発展を示す。
そして、音声抽出部218は、周波数f551〜f552における閾値音量L501より大きい音量を含む期間(t50〜t51)及び期間(t55〜t57)、並びに、周波数f552〜f553の周波数帯域における量閾値L502より大きい音量を含む期間(t56〜t58)を検出する。そして、音声抽出部218は、いずれかの周波数帯域において閾値音量よりも大きい音量を有する期間(t50〜t51)及び期間(t55〜t58)の音声を抽出する。
この場合、f553〜f554の周波数帯域の閾値音量L503を、閾値音量L502及び閾値音量L501よりも高く設定することで、例えば、時刻t53の付近における、周波数f553〜f554の周波数帯域に大きい音量を持つ期間の音声が、音声抽出部218によって抽出されることを防ぐことができる。このため、例えば、鳥を被写体として撮像装置100が撮像した撮像画像に対して、撮像装置100の周囲の人間の囁き声等が対応づけられてしまうことを防ぐことができる。したがって、撮像装置100は、望ましい周波数帯域の音量が大きい期間の音声を撮像画像と対応づけてユーザ180に提供することができる。
図7は、可変フィルタ部242が透過する音声の帯域周波数の一例を示す。帯域制御部244は、環境特定部252によって特定される撮像装置100の周囲の環境に応じて、可変フィルタ部242が透過させる音声の帯域周波数を設定する。具体的には、環境情報格納部246は、緯度及び経度情報と、当該緯度及び経度における環境情報とを対応づけて格納する。環境情報とは、例えば、海、山、川等の自然の環境を示す情報であってよい。他にも、環境情報とは、遊園地、球技場、音楽ホール等、人間による利用環境を示す情報であってよい。
そして、位置検出部248は、例えばGPS衛星からの緯度及び経度情報を受信することによって、撮像装置100が存在する緯度及び経度を特定する。そして、環境特定部252は、位置検出部248によって検出された緯度及び経度情報に合致する環境を、環境情報格納部246を検索することによって特定する。帯域制御部244は、環境特定部252によって検出される環境情報に応じた周波数帯域の音声を録音させるべく、可変フィルタ部242が透過させる周波数帯域を決定する。
例えば、帯域制御部244は、環境特定部252によって特定された環境が山である場合に、例えば山に生息する虫の鳴き声、鳥の鳴き声等を主として録音部214に録音させるべく、3000Hz〜20000Hzの間の周波数帯域の音声を可変フィルタ部242に透過させる。他にも、帯域制御部244は、環境特定部252によって特定された環境が遊園地である場合には、例えば人間の歓声等を録音部214に録音させるべく、100Hz〜4000Hzの間の周波数帯域を含む音声を可変フィルタ部242に透過させる。
また、帯域制御部244は、時刻検出部250によって検出される時刻に応じて、可変フィルタ部242が透過する音声の周波数帯域を制御してもよい。具体的には、環境情報格納部246は、日付を含む時刻と季節とを対応づけて格納する。そして、環境特定部252は、時刻検出部250が検出する時刻に該当する季節を、環境情報格納部246を検索することによって特定する。そして、例えば環境特定部252によって季節が夏であると特定された場合には、帯域制御部244は、例えばセミの鳴き声の周波数帯域(4000Hz〜5000Hz)を含む周波数帯域を可変フィルタ部242に透過させる。
このため、ユーザ180は、撮像装置100によって撮像する環境又は時刻に応じた望ましい音声を容易に録音することができる。
本実施形態の撮像装置100によれば、望ましい音声が対応づけられた撮像画像をユーザ180に容易に提供することができる。したがって、ユーザ180は、撮像画像に対して録音させるべき音声を意識することなく、楽しく撮像することができる。
図8は、撮像画像と音声の対応関係の一例を示す。撮像画像格納部320は、撮像装置100によって時刻t3、t4、t7、t9、t13、t14の順に撮像された6個の画像を格納している。そして、音声格納部316は、撮像装置100によって録音された音声を時刻に対応づけて、音量波形402で示される音量の音声が格納されている。
閾値音量格納部322には、閾値音量L412が設定されている。そして、音声抽出部318は、音量波形402の音声のうち、閾値音量格納部322が格納している閾値音量L412より大きい音量の音声を抽出する。このとき、閾値音量設定部324は、音量波形402のうち閾値音量L412より大きい期間(t1〜t2、t5〜t10、及びt12〜t16)を合計した期間と、撮像装置100によって撮像された6個の画像を再生する再生時間の合計時間とが同一になるように、閾値音量L412を設定する。そして、データ格納部332は、撮像装置100が撮像した撮像画像のそれぞれが撮像された順に、音声抽出部318によって抽出された期間の音声のうち再生時間毎の期間の音声を順に対応づけて格納する。
具体的には、データ格納部332は、時刻t3に撮像された画像を、時刻(t1〜t2)に録音された音声と対応づけて格納する。また、データ格納部332は、時刻(t4、t7、t9)に撮像された画像を、期間(t5〜t10)に録音された音声のうち、それぞれ再生時間毎の期間(t5〜t6)、期間(t6〜t8)、期間(t8〜t10)の音声と対応づけて格納する。同様に、データ格納部332は、時刻t13及び時刻t14に撮像された画像を、それぞれ期間(t12〜t15)、及び期間(t15〜t16)に録音された音声と対応づける。なお、説明を簡単にするために、時刻(t1〜t2)、期間(t5〜t6)、期間(t6〜t8)、期間(t8〜t10)、期間(t12〜t15)、及び期間(t15〜t16)のそれぞれは、予め設定された再生時間と同一の期間であるとした。このため、再生装置140は、撮像装置100を用いて撮像しながら周囲の音声を録音しておくことによって、撮像画像と音声とを容易に対応づけて再生することができる。
また、閾値音量格納部322は、複数の周波数帯域のそれぞれに対応づけて帯域別の閾値音量を格納してもよい。そして、音声抽出部318は、音声格納部316が格納した音声の音量を周波数帯域毎に、閾値音量格納部322が格納する帯域別の閾値音量と比較し、特定の周波数帯域において帯域別の閾値音量より大きい音量が含まれる一部の期間の音声を抽出してもよい。
この場合、例えば、鳥を被写体として撮像装置100によって撮像された撮像画像に対して、撮像装置100によって録音された周囲の人間の囁き声等が対応づけられて再生されてしまうことを防ぐことができる。したがって、再生装置140は、望ましい周波数帯域の音声が大きい期間の音声を撮像画像と対応づけて再生することができる。
図9は、再生される画像と音声の対応関係の一例を示す。指示受付部312は、ユーザ180から、画像を再生する指示を受け付ける。例えば、時刻t83で撮像された画像を再生する指示を指示受付部312が受け付けた場合に、音声抽出部318は、時刻t83から、許容時間格納部364に格納されている許容時間Δt803後のt84までの時間範囲内で、閾値音量L824より大きい音量の音声が含まれる期間の音声を抽出することによって、音量波形838の一部分の音声を抽出する。
また、許容時間制御部362は、撮像画像格納部320が格納する撮像画像が撮像された時刻と、再生する指示を受け付けた時刻との差が大きいほど、許容時間格納部364が格納する許容時間を長く設定する。例えば、許容時間制御部362は、撮像時刻t83よりも前の時刻t81に撮像された撮像画像を再生する場合に、許容時間Δt803に比べてより長い許容時間Δt802を、許容時間格納部364に格納する。そして、音声抽出部318は、時刻t81から、許容時間Δt802後のt82までの時間範囲内で、閾値音量L834より大きい音量の音声が含まれる期間の音声を抽出することによって、音量波形834の一部分の音声を抽出する。
例えば、再生装置140は、一週間前に撮影した画像を再生するときには、撮影した当日に録音された音声の中から抽出される音声を再生する。また、20年前の小学校の入学式、運動会、卒業式等の画像及び音声が記録されている場合に、再生装置140によって運動会の様子を撮影した画像を再生するときには、例えば運動会の日の前後6年間の範囲で録音された音声の中から再生する音声を抽出する。この場合、例えば小学校の運動会の時の音声の他に、入学式、卒業式で録音された音声も再生装置140によって再生される。このため、ユーザ180は、小学生時代の運動会の様子を鑑賞しながら、小学校への入学式、卒業式等における記憶を沢山思い出すことができるので、より楽しく画像を鑑賞することができる。
なお、閾値音量設定部324は、許容時間格納部364に格納される範囲内で、再生される音声の時間が、予め定められた撮像画像の再生時間と一致するように、閾値音量格納部322が格納している閾値音量を設定してもよい。例えば、閾値音量設定部324は、時刻t81〜t82までの時間範囲内で、閾値音量格納部322が格納している閾値音量よりも大きい音量の音声が含まれる期間が、予め定めた撮像画像の再生時間と一致するよう、閾値音量格納部322が格納している閾値音量をL822に設定する。
また、音声抽出部318は、時刻t81に撮像された撮像画像を再生する指示を受け付けた場合に、時刻t83から許容時間Δt802だけ前の時刻t80から時刻t81までの時間範囲で、閾値音量より大きい音量の音声が含まれる範囲の音声を抽出することによって、音声波形832の一部の音声を抽出してもよい。また、音声抽出部318は、時刻t81で撮像された撮像画像を再生する場合に、時刻t81から、許容時間Δt802だけ前及び後の時間範囲(時刻t80〜t82)で、閾値音量より大きい音量の音声が含まれる範囲の音声を抽出してもよい。
図10は、第2実施形態に係る撮像装置900のブロック構成の一例を示す。なお、第2実施形態の撮像装置900の利用環境の一例は、図1で説明した撮像装置100の利用環境と、以下の点を除いて同一であるので説明を省略する。すなわち、第2実施形態に係る撮像装置900は、撮像装置900の利用状態、例えば撮像状態、待機状態等の利用状態に応じて、撮像装置900の録音動作を調整する。例えば、撮像装置900は、被写体を撮像しているときには、被写体からのより特徴的な音声を録音する。
第2実施形態の撮像装置900は、撮像部912、録音部914、音声格納部916、モード設定部962、録音音量設定部910、録音制御部922、距離測定部970、集音方向制御部964、及び音声集音部980を備える。録音音量設定部910は、閾値音量設定部920を有する。また、音声集音部980は、第1集音部966及び第2集音部968を有する。なお、第2実施形態に係る撮像装置900の動作及び機能は、以下に説明する部分を除き、第1実施形態に係る撮像装置100の動作及び機能と同一であるので説明を省略する。例えば、撮像部912及び録音部914の動作及び機能は、撮像部212及び録音部214の動作と同一であってよい。なお、第1実施形態の撮像装置100及び第2実施形態の撮像装置900の動作及び機能を組み合わせた撮像装置もまた発明となり得る。
音声集音部980は、撮像部912の周囲の音声を集音して録音部914に録音させる。録音制御部922は、撮像部912の周囲の音声のうちで、予め設定された設定音量より大きい音声を録音部914に録音させる。具体的には、録音制御部922は、撮像部912の周囲の音声のうちで、予め設定された閾値音量より大きい音量の音声を録音部914に録音させる。そして、音声格納部916は、録音部914が録音した音声を格納する。
モード設定部962は、撮像部912及び録音部914の動作状態の種類を示す動作モードを設定する。録音音量設定部910は、モード設定部962が設定した動作モードに基づいて、設定音量を設定する。具体的には、音音量設定部910は、モード設定部962が設定した動作モードに基づいて、録音部914が録音すべき音声の閾値音量を変更することによって、設定音量を設定する。より具体的には、閾値音量設定部920は、モード設定部962が設定した動作モードに基づいて、閾値音量を設定する。なお、録音音量設定部910は、モード設定部962が設定した動作モードに基づいて、音声集音部980の感度を変更することによって、設定音量を設定する。
具体的には、モード設定部962は、撮像部912がユーザの操作を受け付け得る状態にある待機モード、及び撮像部912がユーザの操作を受けて動作している状態にある撮像モードを選択的に設定する。録音音量設定部910は、モード設定部962が待機モードに設定した場合に、録音部914が録音すべき音量の第1の設定音量を設定し、モード設定部962が撮像モードに設定した場合に、第1の設定音量より小さい第2の設定音量を設定する。具体的には、閾値音量設定部920は、モード設定部962が待機モードに設定した場合に、第1の閾値音量を設定し、モード設定部962が撮像モードに設定した場合に、第1の閾値音量より小さい第2の閾値音量を設定する。なお、録音音量設定部910は、モード設定部962が待機モードに設定した場合に、音声集音部980が集音する第1の感度を設定し、モード設定部962が撮像モードに設定した場合に、第1の感度より大きい第2の感度を設定してよい。
距離測定部970は、撮像部912と被写体との距離を測定する。具体的には、距離測定部970は、レーザ光、赤外線等を被写体に対して照射して、被写体から反射した光に基づいて距離を測定する測距センサであってよい。他にも、距離測定部970は、撮像部912による撮像画像のコントラストを検出して、最もコントラストの大きい撮像画像を撮像したときの撮像部912の制御値に基づいて、撮像部912と被写体との距離を測定してもよい。
録音音量設定部910は、距離測定部970が測定した距離に基づいて設定音量を設定する。具体的には、録音音量設定部910は、距離測定部970が測定した距離がより大きい場合に、設定音量をより小さく設定する。例えば、閾値音量設定部920は、距離測定部970が測定した距離に基づいて閾値音量を設定する。具体的には、閾値音量設定部920は、距離測定部970が測定した距離がより大きい場合に、閾値音量をより小さく設定する。なお、録音音量設定部910は、距離測定部970が測定した距離がより大きい場合に、音声集音部980が集音する感度をより大きく設定してよい。
第1集音部966は、撮像部912の撮像方向と略同一の方向に集音指向性を有する。第2集音部968は、第1集音部966より広い集音指向性を有する。
集音方向制御部964は、モード設定部962が撮像モードに設定した場合に、撮像部912の撮像方向と略同一方向の音声を集音して録音部914に録音させ、モード設定部962が待機モードに設定した場合に、モード設定部962が撮像モードに設定したより広い方向の音声を集音して録音部914に録音させる。具体的には、集音方向制御部964は、モード設定部962が撮像モードに設定した場合に、第1集音部966が集音した音声を録音部914に録音させ、モード設定部962が待機モードに設定した場合に、第2集音部968が集音した音声を録音部914に録音させる。
他にも、撮像装置900は、集音指向性を変化させることのできる一の集音部を備えてもよい。そして、集音方向制御部964は、モード設定部962が撮像モードに設定した場合に、当該集音部の集音指向性を制御することによって撮像部912の撮像方向と略同一方向からの音声を集音して録音部914に録音させてもよい。そして、集音方向制御部964は、モード設定部962が待機モードに設定した場合に、モード設定部962が撮像モードに設定したより広い方向の音声を集音して録音部914に録音させてもよい。
図11は、動作モード毎の閾値音量の時間変化の一例を示す。撮像装置900は、動作モードとして、待機モード、撮像モード、及び再生モードを有する。撮像モードは、例えば、撮像装置900が撮像及び/又は録音することのできる動作モードであってよい。また、再生モードは、例えば、撮像装置900が画像及び/又は音声を再生することのできる動作モードであってよい。なお、撮像装置900が起動された直後は、撮像装置900は待機モードに設定される。
図11の例では、撮像部912及び録音部914は、期間(t1001〜t1002)に待機モードに設定される。そして、閾値音量設定部920は、撮像部912及び録音部914が待機モードに設定されている期間には、閾値音量をL1026に設定する。そして、閾値音量設定部920は、撮像部912及び録音部914が撮像モードに設定されている期間(t1002〜t1005)には、閾値音量として、閾値音量L1026よりも低い閾値音量L1022を設定する。この期間では、録音部914は、音量波形1016の音声が入力された場合に、閾値音量L1022よりも大きい音量の音声が入力される期間(t1003〜t1004)の音声を録音する。
そして、閾値音量設定部920は、撮像部912及び録音部914が再生モードに設定されている期間(t1005〜t1008)には、閾値音量として、閾値音量L1022又は閾値音量L1024と異なる閾値音量を設定してもよい。例えば、閾値音量設定部920は、再生モードに設定された期間には、閾値音量L1022よりも値の大きく、閾値音量L1026よりも値の小さい閾値音量L1024に閾値音量を設定する。この期間では、録音部914は、音量波形1016の音声が入力された場合に、閾値音量L1024よりも大きい音量の音声が入力される期間(t1006〜t1007)の音声を録音する。
撮像装置900が撮像モードに設定されているときには低い閾値音量が設定されるので、ユーザ180は撮像画像を撮像しているときの音声を容易に録音することができる。また、撮像装置900が待機モードに設定されているときには高い閾値音量が設定されるので、例えばユーザ180が鳥を撮像しに山に行ったときに、自動車のエンジン音等が待機モード時に録音されることを防ぐことができる。
また、集音方向制御部964は、撮像部912及び録音部914の動作モードに応じて、録音部914が録音する音声を集音する方向を制御する。具体的には、撮像部912及び録音部914が撮像モードに設定されている場合には、撮像部912の撮像方向と略同一方向の音声を第1集音部966を用いて集音して、録音部914に録音させる。また、撮像部912及び録音部914が待機モードに設定されている場合には、撮像モードに設定された集音方向よりも広い方向の音声を第2集音部968を用いて集音して、録音部914に録音させる。
このため、撮像装置900が撮像モードに設定されている場合には、撮像対象である被写体の方向からの音声をより大きな音量で録音することができる。また、撮像装置900が待機モードに設定されている場合には、広い方向の音声を集音して録音するので、例えばユーザ180が撮像せずに遊園地で遊んでいるときには、撮像装置900の周囲の自然な音声を録音することができる。
また、閾値音量設定部920は、距離測定部970によって測定される撮像部912と被写体との距離が大きいほど、小さい閾値音量を設定する。このため、録音部914は、遠くの距離の被写体を撮像している場合でも、被写体の方向からの音声をより容易に録音することができる。
なお、撮像部912及び録音部914が再生モードに設定されている場合には、画像を表示させる方向と略同一方向の音声を集音して録音部914に録音させてよい。このため、例えば撮像装置900で表示される撮像画像をユーザ180が参照しながら、ユーザ180が撮像画像に関するナレーション等を録音する場合に、ユーザ180のナレーションをより適切に録音することができる。
なお、撮像装置900は、動作モードが待機モード又は再生モードに設定されている場合に、ユーザ180によって撮像動作又は録音動作に関する操作がなされた場合に撮像モードに遷移する。撮像動作に関する操作は、例えば、画像を撮像する操作、シャッタスピード、焦点距離等の撮像条件を調整する操作等を含む。また、録音動作に関する操作は、例えば、音声を録音する操作、録音感度の調整等の録音条件を調整する操作等を含む。また、撮像装置900は、動作モードが待機モード又は撮像モードに設定されている場合に、ユーザ180によって撮像装置900の再生動作に関する操作がなされた場合に、再生モードに遷移する。再生動作に関する操作は、例えば、画像を再生する操作、再生する画像を選択する操作、再生速度の調節等の再生条件を調整する操作等を含む。なお、撮像装置900は、撮像装置900が撮像モード又は再生モードに設定されている場合に、ユーザによる撮像装置900の操作が所定の期間操作されなかったことを条件として、待機モードに遷移してよい。
図12は、撮像モードに応じて設定される閾値音量の一例を示す。撮像装置900は、撮像モードとして、接写モード、中距離撮像モード、及び遠景撮像モードを有する。本図の例において、期間(t1002〜t1005)において撮像部912及び録音部914が接写モードである撮像モードに設定されるとき、閾値音量設定部920は、中距離撮像モードの場合に設定される閾値音量L1022より小さい閾値音量L1222を設定する。このとき、閾値音量設定部920は、予め定められた1より小さい係数を閾値音量L1022に乗じて得られる音量を閾値音量L1222としてよい。
また、期間(t1002〜t1005)において撮像部912及び録音部914が遠景撮像モードである撮像モードに設定されるときには、閾値音量設定部920は、中距離撮像モードの場合に設定される閾値音量L1022より大きい閾値音量L1223を設定する。このとき、閾値音量設定部920は、予め定められた1より大きい係数を閾値音量L1022に乗じて得られる音量を閾値音量L1223としてよい。なお、閾値音量設定部920は、閾値音量L1024及びL1026より小さい閾値音量L1223を設定してよい。なお、閾値音量設定部920は、接写モード、遠景撮像モード等の撮像モードの他に、夜景モード、昼間撮影モード等の、様々な撮像モードに応じて閾値音量を設定してよいことは言うまでもない。
なお、閾値音量設定部920は、撮像モードに対応付けて閾値音量を格納してよい。この場合、録音制御部922は、撮像部912の撮像モードに対応付けて閾値音量設定部920が格納している閾値音量より大きい音量の音声を録音部914に録音させてよい。以上説明したように、閾値音量設定部920は、撮像モードのそれぞれに応じた望ましい閾値音量を設定することができる。したがって、例えばユーザが小さな虫を接写モードで撮像するような場合において、小さな虫の音が録音部914によって録音され易くなる。また、ユーザが風景を撮像するような場合には、周囲の騒々しい音声が録音されにくくなる。
図13は、撮像条件に応じて設定される閾値音量の一例を示す。本図の例において、期間(t1002〜t1005)における撮像部912の撮像条件として、フラッシュを用いて撮像する旨が設定されると、閾値音量設定部920は、閾値音量L1022より小さい閾値音量L1322を設定する。このとき、閾値音量設定部920は、予め定められた1より小さい係数を閾値音量L1022に乗じて得られる音量を閾値音量L1322としてよい。
また、期間(t1002〜t1005)における撮像部912の撮像条件として、絞り値を大きくして撮影する旨が設定されるとき、閾値音量設定部920は、閾値音量L1022より大きい閾値音量L1323を設定する。このとき、閾値音量設定部920は、予め定められた、絞り値の応じた1より大きい係数を閾値音量L1022に乗じて得られる音量を閾値音量L1323としてよい。なお、閾値音量設定部920は、閾値音量L1024及びL1026より小さい閾値音量L1323を設定してよい。なお、閾値音量設定部920は、フラッシュ、絞り値等の他に、様々な撮像条件に応じて閾値音量を設定してよいことは言うまでもない。
なお、閾値音量設定部920は、撮像条件の制御値に対応付けて閾値音量を格納してよい。この場合、録音制御部922は、撮像部912の撮像条件の制御値に対応付けて閾値音量設定部920が格納している閾値音量より大きい音量の音声を録音部914に録音させてよい。また、閾値音量設定部920は、撮像条件の制御値に対応付けて閾値音量L1022に乗じるべき係数を格納してよい。以上説明したように、閾値音量設定部920は、撮像条件のそれぞれに応じた望ましい閾値音量を設定することができる。例えば、夜は昼間に比べて静かな場合が多い。そして、夜にはフラッシュを用いて撮像されることが多く、昼間には夜より絞り値を大きくして撮像される場合が多い。したがって、フラッシュ撮影時には閾値音量設定部920が閾値音量を小さく設定することによって、静かな夜における撮像装置900の周囲の小さな音を録音部914に録音させ易くすることができる。なお、閾値音量設定部920は、撮像部912による撮像時刻に応じて閾値音量を設定してよい。例えば、閾値音量設定部920は、撮像時刻が昼間であると判断される場合には、撮像時刻が夜であると判断される場合より大きい閾値音量を設定してよい。その他、閾値音量設定部920は、撮像装置900の周囲の明るさを判断して、撮像装置900の周囲の明るさが予め定められた明るさより明るい場合に、撮像装置900の周囲の明るさが予め定められた明るさより暗い場合より大きい閾値音量を設定してよい。
なお、図11から図13にかけて、動作モード、撮像モード、撮像条件、撮像環境等に応じて閾値音量を設定することによって、録音部914が録音すべき音声を決定する例について説明した。このような閾値音量による決定方法の他に、音声集音部980における集音感度を動作モード、撮像モード、撮像条件、撮像環境等に応じて設定することによって、録音部914が録音すべき音声を決定することできる。例えば図11から図13の説明において閾値音量を大きく設定するケースにおいては音声集音部980の集音感度を小さくし、閾値音量を小さく設定するケースにおいては音声集音部980の集音感度を大きくすることによって、動作モード、撮像モード、撮像条件、撮像環境等に応じた音声を録音部914に録音させることができる。
図14は、第1実施形態の撮像装置100及び再生装置140、並びに第2実施形態の撮像装置900に係るコンピュータ1500のハードウェア構成の一例を示す。コンピュータ1500は、ホスト・コントローラ1582により相互に接続されるCPU1505、RAM1520、グラフィック・コントローラ1575、及び表示装置1580を有するCPU周辺部と、入出力コントローラ1584によりホスト・コントローラ1582に接続される通信インターフェイス1530、ハードディスクドライブ1540、及びCD−ROMドライブ1560を有する入出力部と、入出力コントローラ1584に接続されるROM1510、フレキシブルディスク・ドライブ1550、及び入出力チップ1570を有するレガシー入出力部とを備える。
ホスト・コントローラ1582は、RAM1520と、高い転送レートでRAM1520をアクセスするCPU1505、及びグラフィック・コントローラ1575とを接続する。CPU1505は、ROM1510、及びRAM1520に格納されたプログラムに基づいて動作し、各部の制御を行う。グラフィック・コントローラ1575は、CPU1505等がRAM1520内に設けたフレーム・バッファ上に生成する画像データを取得し、表示装置1580上に表示させる。これに代えて、グラフィック・コントローラ1575は、CPU1505等が生成する画像データを格納するフレーム・バッファを、内部に含んでもよい。
入出力コントローラ1584は、ホスト・コントローラ1582と、比較的高速な入出力装置であるハードディスクドライブ1540、通信インターフェイス1530、CD−ROMドライブ1560を接続する。ハードディスクドライブ1540は、コンピュータ1500内のCPU1505が使用するプログラム、及びデータを格納する。通信インターフェイス1530は、ネットワークを介して撮像装置100、再生装置140、又は撮像装置900と通信し、撮像装置100、再生装置140、又は撮像装置900にプログラム、及びデータを提供する。CD−ROMドライブ1560は、CD−ROM1595からプログラムまたはデータを読み取り、RAM1520を介してハードディスクドライブ1540、及び通信インターフェイス1530に提供する。
また、入出力コントローラ1584には、ROM1510と、フレキシブルディスク・ドライブ1550、及び入出力チップ1570の比較的低速な入出力装置とが接続される。ROM1510は、コンピュータ1500が起動時に実行するブート・プログラムや、コンピュータ1500のハードウェアに依存するプログラム等を格納する。フレキシブルディスク・ドライブ1550は、フレキシブルディスク1590からプログラムまたはデータを読み取り、RAM1520を介してハードディスクドライブ1540、及び通信インターフェイス1530に提供する。入出力チップ1570は、フレキシブルディスク・ドライブ1550や、例えばパラレル・ポート、シリアル・ポート、キーボード・ポート、マウス・ポート等を介して各種の入出力装置を接続する。
RAM1520を介して通信インターフェイス1530に提供されるプログラムは、フレキシブルディスク1590、CD−ROM1595、またはICカード等の記録媒体に格納されて利用者によって提供される。プログラムは、記録媒体から読み出され、RAM1520を介して通信インターフェイス1530に提供され、ネットワークを介して撮像装置100、再生装置140、又は撮像装置900に送信される。撮像装置100、再生装置140、又は撮像装置900に送信されたプログラムは、撮像装置100、再生装置140、又は撮像装置900においてインストールされて実行される。
撮像装置100にインストールされて実行されるプログラムは、撮像装置100を、図1、図2、及び図4から図7において説明した撮像装置100として機能させる。また、再生装置140にインストールされて実行されるプログラムは、再生装置140を、図1、図3、図8、及び図9において説明した再生装置140として機能させる。また、撮像装置900にインストールされて実行されるプログラムは、撮像装置900を、図10から図13において説明した撮像装置900として機能させる。
以上に示したプログラムは、外部の記憶媒体に格納されてもよい。記憶媒体としては、フレキシブルディスク1590、CD−ROM1595の他に、DVDやPD等の光学記録媒体、MD等の光磁気記録媒体、テープ媒体、ICカード等の半導体メモリ等を用いることができる。また、専用通信ネットワークやインターネットに接続されたサーバシステムに設けたハードディスクまたはRAM等の記憶装置を記録媒体として使用し、ネットワークを介してプログラムをコンピュータ1500に提供してもよい。
以上、実施形態を用いて本発明を説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。上記実施形態に、多様な変更又は改良を加えることができる。そのような変更又は改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
撮像装置100及び再生装置140の利用環境の一例を示す図である。 撮像装置100のブロック構成の一例を示す図である。 再生装置140のブロック構成の一例を示す図である。 撮像画像と音声との対応関係の一例を示す図である。 撮像画像と音声との対応関係の他の一例を示す図である。 周波数帯域毎に設定される閾値音量の一例を示す図である。 可変フィルタ部242が透過する音声の帯域周波数の一例を示す図である。 撮像画像と音声の対応関係の一例を示す図である。 再生される画像と音声の対応関係の一例を示す図である。 撮像装置900のブロック構成の一例を示す図である。 動作モード毎の閾値音量の時間変化の一例を示す図である。 撮像モード毎の閾値音量の時間変化の一例を示す図である。 撮像条件毎の閾値音量の時間変化の一例を示す図である。 コンピュータ1500のハードウェア構成の一例を示す図である。
符号の説明
100 撮像装置
102 マイクロホン
140 再生装置
150 通信回線
180 ユーザ
212 撮像部
214 録音部
216 音声格納部
218 音声抽出部
220 閾値音量設定部
222 閾値音量格納部
232 データ格納部
234 データ出力部
242 可変フィルタ部
244 帯域制御部
246 環境情報格納部
248 位置検出部
250 時刻検出部
252 環境特定部
312 指示受付部
316 音声格納部
318 音声抽出部
320 撮像画像格納部
322 閾値音量格納部
324 閾値音量設定部
332 データ格納部
334 データ出力部
360 時刻検出部
362 許容時間制御部
364 許容時間格納部
900 撮像装置
910 録音音量設定部
912 撮像部
914 録音部
916 音声格納部
920 閾値音量設定部
922 録音制御部
962 モード設定部
964 集音方向制御部
966 第1集音部
968 第2集音部
970 距離測定部
980 音声集音部

Claims (18)

  1. 被写体を撮像する撮像部と、
    前記撮像部の周囲の音声を録音する録音部と、
    設定された閾値音量を格納する閾値音量格納部と、
    前記録音部が録音した音声のうちで、前記閾値音量格納部が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出部と、
    前記撮像部が撮像した撮像画像と、前記音声抽出部が抽出した音声とを対応づけて格納するデータ格納部と、
    前記データ格納部が対応づけて格納している撮像画像と音声とを同期させて出力するデータ出力部と
    を備える撮像装置。
  2. 前記データ格納部は、前記撮像部が撮像した複数の撮像画像のそれぞれと、前記音声抽出部が抽出した複数の音声のそれぞれとを、撮像及び録音された順に対応づけて格納する
    請求項1に記載の撮像装置。
  3. 前記音声抽出部が抽出する複数の音声の期間の合計が、前記撮像部が撮像した複数の撮像画像の数に、予め定められた撮像画像の再生時間を乗じた期間と同一となるように、前記閾値音量格納部が格納している閾値音量を設定する閾値音量設定部
    をさらに備える請求項1に記載の撮像装置。
  4. 前記録音部が録音した音声を格納する音声格納部と、
    前記音声格納部が格納している音声の音量分布に基づいて、前記閾値音量格納部が格納している閾値音量を設定する閾値音量設定部と
    をさらに備える
    請求項1に記載の撮像装置。
  5. 前記閾値音量設定部は、前記音声格納部が格納している音声の音量の平均値がより大きい場合に、前記閾値音量格納部が格納している閾値音量をより大きく設定する
    請求項4に記載の撮像装置。
  6. 前記閾値音量格納部は、複数の周波数帯域のそれぞれに対応づけて帯域別閾値音量を格納し、
    前記音声抽出部は、前記録音部が録音した音声の音量を周波数帯域毎に、前記閾値音量格納部が格納している帯域別閾値音量と比較し、特定の周波数帯域において帯域別閾値音量より大きい音量が含まれる一部の期間の音声を抽出する
    請求項1に記載の撮像装置。
  7. 当該撮像装置の周囲の環境を特定する環境特定部と、
    設定された帯域周波数の音声を透過させる可変フィルタ部と、
    前記環境特定部が特定した環境に応じて、前記可変フィルタ部が透過させる音声の帯域周波数を設定する帯域制御部と
    をさらに備え、
    前記録音部は、前記フィルタ部が透過させた音声を録音する
    請求項1に記載の撮像装置。
  8. 当該撮像装置の位置を検出する位置検出部と、
    位置を示す情報に対応づけて、環境を示す情報を格納する環境情報格納部と
    をさらに備え、
    前記環境特定部は、前記位置検出部が検出した位置に基づいて前記環境情報格納部を検索し、当該撮像装置の周囲の環境を特定する
    請求項7に記載の撮像装置。
  9. 時刻を検出する時刻検出部と、
    時刻を示す情報に対応づけて、環境を示す情報を格納する環境情報格納部と
    をさらに備え、
    前記環境特定部は、前記時刻検出部が検出した時刻に基づいて前記環境情報格納部を検索し、当該撮像装置の周囲の環境を特定する
    請求項7に記載の撮像装置。
  10. 撮像部を用いて被写体を撮像する段階と、
    前記撮像部の周囲の音声を録音する録音段階と、
    設定された閾値音量を格納する閾値音量格納段階と、
    前記録音段階において録音された音声のうちで、前記閾値音量格納段階において格納される閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出段階と、
    前記撮像部が撮像した撮像画像と、前記音声抽出段階で抽出された音声とを対応づけて格納するデータ格納段階と、
    前記データ格納段階において対応づけて格納される撮像画像と音声とを同期させて出力するデータ出力段階と
    を備える撮像方法。
  11. 画像を撮像する撮像装置用のプログラムであって、前記撮像装置を
    被写体を撮像する撮像部、
    前記撮像部の周囲の音声を録音する録音部、
    設定された閾値音量を格納する閾値音量格納部、
    前記録音部が録音した音声のうちで、前記閾値音量格納部が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出部、
    前記撮像部が撮像した撮像画像と、前記音声抽出部が抽出した音声とを対応づけて格納するデータ格納部、
    前記データ格納部が対応づけて格納している撮像画像と音声とを同期させて出力するデータ出力部
    として機能させるプログラム。
  12. 撮像装置によって撮像された撮像画像を格納する撮像画像格納部と、
    前記撮像装置によって録音された音声を格納する音声格納部と、
    閾値音量を格納する閾値音量格納部と、
    前記音声格納部が格納する音声のうちで、前記閾値音量格納部が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出部と、
    前記撮像画像格納部が格納している撮像画像と、前記音声抽出部が抽出した音声とを対応づけて格納するデータ格納部と、
    前記データ格納部が対応づけて格納している撮像画像と音声とを同期させて出力するデータ出力部と
    を備える再生装置。
  13. 設定された許容時間を格納する許容時間格納部
    をさらに備え、
    前記撮像画像格納部は、前記撮像装置によって撮像された時刻に対応づけて撮像画像を格納し、
    前記音声格納部は、前記撮像装置によって録音された時刻に対応づけて音声を格納し、
    前記音声抽出部は、前記撮像画像格納部が格納している撮像画像が撮像された時刻から、前記許容時間格納部が格納している許容時間の範囲内の時刻に録音された音声のうちで、前記閾値音量格納部が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する
    請求項12に記載の再生装置。
  14. 前記撮像画像格納部が格納している撮像画像を再生するべき旨の指示を受け付ける指示受付部と、
    前記指示受付部が指示を受け付けたときの時刻を検出する時刻検出部と、
    前記撮像画像格納部が格納している撮像画像が撮像された時刻と、前記時刻検出部が検出した時刻との差が大きいほど、前記許容時間格納部が格納している許容時間を長く設定する許容時間制御部
    をさらに備える請求項13に記載の再生装置。
  15. 前記音声格納部が格納している音声の音量分布に基づいて、前記閾値音量格納部が格納している閾値音量を設定する閾値音量設定部
    をさらに備える
    請求項12に記載の再生装置。
  16. 前記閾値音量設定部は、前記音声格納部が格納している音声の音量の平均値がより大きい場合に、前記閾値音量格納部が格納している閾値音量をより大きく設定する
    請求項15に記載の再生装置。
  17. 撮像装置によって撮像された撮像画像を格納する撮像画像格納段階と、
    前記撮像装置によって録音された音声を格納する音声格納段階と、
    閾値音量を格納する閾値音量格納段階と、
    前記音声格納段階において格納される音声のうちで、前記閾値音量格納段階において格納される閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出段階と、
    前記撮像画像格納段階において格納される撮像画像と、前記音声抽出段階において抽出される音声とを対応づけて格納するデータ格納段階と、
    前記データ格納段階において対応づけて格納される撮像画像と音声とを同期させて出力するデータ出力部と
    を備える再生方法。
  18. 画像を再生する再生装置用のプログラムであって、前記再生装置を
    撮像装置によって撮像された撮像画像を格納する撮像画像格納部、
    前記撮像装置によって録音された音声を格納する音声格納部、
    閾値音量を格納する閾値音量格納部、
    前記音声格納部が格納している音声のうちで、前記閾値音量格納部が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出部、
    前記撮像画像格納部が格納している撮像画像と、前記音声抽出部が抽出した音声とを対応づけて格納するデータ格納部、
    前記データ格納部が対応づけて格納している撮像画像と音声とを同期させて出力するデータ出力部
    として機能させるプログラム。
JP2005341031A 2004-12-20 2005-11-25 撮像装置、撮像方法、再生装置、再生方法、及びプログラム Pending JP2006203860A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005341031A JP2006203860A (ja) 2004-12-24 2005-11-25 撮像装置、撮像方法、再生装置、再生方法、及びプログラム
US11/303,923 US7668455B2 (en) 2004-12-20 2005-12-19 Image capturing apparatus, image capturing method, reproducing apparatus, reproducing method and program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004374691 2004-12-24
JP2005341031A JP2006203860A (ja) 2004-12-24 2005-11-25 撮像装置、撮像方法、再生装置、再生方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2006203860A true JP2006203860A (ja) 2006-08-03

Family

ID=36961414

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005341031A Pending JP2006203860A (ja) 2004-12-20 2005-11-25 撮像装置、撮像方法、再生装置、再生方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2006203860A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008271082A (ja) * 2007-04-19 2008-11-06 Casio Comput Co Ltd 音データ付き画像記録装置及びプログラム
JP2009141942A (ja) * 2007-11-14 2009-06-25 Canon Inc 情報処理装置及び情報処理方法及びプログラム及び記憶媒体
JP2010528546A (ja) * 2007-05-29 2010-08-19 トムソン ライセンシング パノラマ式音像の生成及び再生方法並びにパノラマ式音像の再生装置
JP2011120306A (ja) * 2011-03-11 2011-06-16 Casio Computer Co Ltd 撮像装置、撮像方法及びプログラム
US8218026B2 (en) 2008-05-22 2012-07-10 Fujifilm Corporation Imaging apparatus, imaging method, reproducing apparatus and reproducing method, and recording medium for associating sound data with image data
US8411166B2 (en) 2009-03-18 2013-04-02 Casio Computer Co., Ltd. Digital camera for recording still image with speech

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008271082A (ja) * 2007-04-19 2008-11-06 Casio Comput Co Ltd 音データ付き画像記録装置及びプログラム
JP2010528546A (ja) * 2007-05-29 2010-08-19 トムソン ライセンシング パノラマ式音像の生成及び再生方法並びにパノラマ式音像の再生装置
JP2009141942A (ja) * 2007-11-14 2009-06-25 Canon Inc 情報処理装置及び情報処理方法及びプログラム及び記憶媒体
US8218026B2 (en) 2008-05-22 2012-07-10 Fujifilm Corporation Imaging apparatus, imaging method, reproducing apparatus and reproducing method, and recording medium for associating sound data with image data
US8411166B2 (en) 2009-03-18 2013-04-02 Casio Computer Co., Ltd. Digital camera for recording still image with speech
JP2011120306A (ja) * 2011-03-11 2011-06-16 Casio Computer Co Ltd 撮像装置、撮像方法及びプログラム

Similar Documents

Publication Publication Date Title
US7668455B2 (en) Image capturing apparatus, image capturing method, reproducing apparatus, reproducing method and program
US10367997B2 (en) Enriched digital photographs
JP2006238220A (ja) 撮像装置、撮像方法、及びプログラム
WO2012027186A1 (en) Audio processing based on scene type
JP2006203860A (ja) 撮像装置、撮像方法、再生装置、再生方法、及びプログラム
JP5155092B2 (ja) カメラ、再生装置、および再生方法
JP2012100216A (ja) カメラおよび動画撮影プログラム
JP2014086849A (ja) コンテンツ取得装置及びプログラム
JP2008236644A (ja) 撮影装置および画像再生装置
JP2006203867A (ja) 撮像装置、撮像方法、及びプログラム
JP2014122978A (ja) 撮像装置、音声認識方法、及びプログラム
KR20140072785A (ko) 동영상 처리 장치 및 그 방법.
JP6229356B2 (ja) 撮像装置、撮像方法及びプログラム
JP4741362B2 (ja) 出力装置、出力方法、及びプログラム
JP2004221666A (ja) 撮像記録装置
JP4922445B2 (ja) システム、方法、装置及びプログラム
JP2005006059A (ja) 動画像処理装置およびそのプログラム
JP2010130403A (ja) 映像制御装置およびそれを備えた撮像装置、表示装置
CN113992836A (zh) 变焦视频的音量调节方法、装置和视频拍摄设备
JP2006238219A (ja) 出力装置、出力方法、及びプログラム
JP6340785B2 (ja) 動画処理装置、動画処理方法、及び、プログラム
JP2011019000A (ja) 情報処理装置、音声選択方法及びそのプログラム
US10102880B2 (en) Information processing device, shooting apparatus and information processing method
JP2006238357A (ja) 出力装置、出力方法、プログラム、及び音声提供システム
JP2008278315A (ja) 撮像装置及びそのプログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20061212