JP2006203860A - Imaging apparatus, imaging method, reproducing apparatus, reproducing method and program - Google Patents
Imaging apparatus, imaging method, reproducing apparatus, reproducing method and program Download PDFInfo
- Publication number
- JP2006203860A JP2006203860A JP2005341031A JP2005341031A JP2006203860A JP 2006203860 A JP2006203860 A JP 2006203860A JP 2005341031 A JP2005341031 A JP 2005341031A JP 2005341031 A JP2005341031 A JP 2005341031A JP 2006203860 A JP2006203860 A JP 2006203860A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- sound
- volume
- storage unit
- imaging
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
- Studio Devices (AREA)
Abstract
Description
本発明は、撮像装置、撮像方法、再生装置、再生方法、及びプログラムに関する。特に本発明は、画像を撮像する撮像装置及び撮像方法、並びに画像を再生する再生装置及び再生方法、並びに当該撮像装置及び再生装置用のプログラムに関する。 The present invention relates to an imaging device, an imaging method, a playback device, a playback method, and a program. In particular, the present invention relates to an imaging device and an imaging method for capturing an image, a reproducing device and a reproducing method for reproducing an image, and a program for the imaging device and the reproducing device.
従来、静止画だけでなく動画もメモリカードに記録することができ、また、静止画や動画の撮影記録時にマイクロホンで検出した音声を画像に対応させて記録できるデジタルスチルカメラがある(例えば、特許文献1参照。)。
しかしながら、このようなカメラを用いて、例えば山で鳥を撮影したとき、鳥の鳴き声の他に周囲の雑音も一緒に録音されてしまい、画像を再生したときの音声が面白くないものになってしまう場合がある。このような場合には、鳥の鳴き声以外の音をカットしたり、周囲の雑音が少ないときの音声を再生するようにしたりして、より楽しく画像を観賞することができることが望ましい。さらに、ユーザにとっては撮影後に画像と音声の編集処理等の煩雑な作業をすることなく、容易に画像と音声とを鑑賞することができることが望ましい。 However, when a bird is photographed using such a camera, for example, the surrounding noise is recorded together with the sound of the bird, and the sound when the image is reproduced is not interesting. May end up. In such a case, it is desirable to be able to enjoy the image more happily by cutting the sound other than the bird's cry or reproducing the sound when the surrounding noise is low. Furthermore, it is desirable for the user to be able to easily appreciate the image and sound without performing complicated operations such as image and sound editing processing after shooting.
そこで本発明は、上記の課題を解決することができる撮像装置、撮像方法、再生装置、再生方法、及びプログラムを提供することを目的とする。この目的は特許請求の範囲における独立項に記載の特徴の組み合わせにより達成される。また従属項は本発明の更なる有利な具体例を規定する。 Accordingly, an object of the present invention is to provide an imaging device, an imaging method, a playback device, a playback method, and a program that can solve the above-described problems. This object is achieved by a combination of features described in the independent claims. The dependent claims define further advantageous specific examples of the present invention.
本発明の第1の形態における撮像装置は、被写体を撮像する撮像部と、撮像部の周囲の音声を録音する録音部と、設定された閾値音量を格納する閾値音量格納部と、録音部が録音した音声のうちで、閾値音量格納部が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出部と、撮像部が撮像した撮像画像と、音声抽出部が抽出した音声とを対応づけて格納するデータ格納部と、データ格納部が対応づけて格納している撮像画像と音声とを同期させて出力するデータ出力部とを備える。 An imaging apparatus according to a first aspect of the present invention includes an imaging unit that images a subject, a recording unit that records sound around the imaging unit, a threshold volume storage unit that stores a set threshold volume, and a recording unit. Among the recorded voices, a voice extraction unit that extracts voices of a part of a period in which voices having a volume higher than the threshold volume stored in the threshold volume storage unit are included, a captured image captured by the imaging unit, and a voice A data storage unit that stores the audio extracted by the extraction unit in association with each other, and a data output unit that outputs the captured image and the audio stored in association with each other in synchronization with each other.
データ格納部は、撮像部が撮像した複数の撮像画像のそれぞれと、音声抽出部が抽出した複数の音声のそれぞれとを、撮像及び録音された順に対応づけて格納してよい。 The data storage unit may store each of the plurality of captured images captured by the imaging unit and each of the plurality of sounds extracted by the sound extraction unit in association with each other in the order of imaging and recording.
録音部が録音した音声を格納する音声格納部と、音声格納部が格納している音声の音量分布に基づいて、閾値音量格納部が格納している閾値音量を設定する閾値音量設定部とをさらに備えてよい。閾値音量設定部は、音声格納部が格納している音声の音量の平均値がより大きい場合に、閾値音量格納部が格納している閾値音量をより大きく設定してよい。 A voice storage unit that stores the voice recorded by the recording unit, and a threshold volume setting unit that sets the threshold volume stored in the threshold volume storage unit based on the volume distribution of the voice stored in the voice storage unit. Furthermore, you may prepare. The threshold sound volume setting unit may set the threshold sound volume stored in the threshold sound volume storage unit larger when the average value of the sound volume stored in the sound storage unit is larger.
音声抽出部が抽出する複数の音声の期間の合計が、撮像部が撮像した複数の撮像画像の数に、予め定められた撮像画像の再生時間を乗じた期間と同一となるように、閾値音量格納部が格納している閾値音量を設定する閾値音量設定部をさらに備えてよい。閾値音量格納部は、複数の周波数帯域のそれぞれに対応づけて帯域別閾値音量を格納し、音声抽出部は、録音部が録音した音声の音量を周波数帯域毎に、閾値音量格納部が格納している帯域別閾値音量と比較し、特定の周波数帯域において帯域別閾値音量より大きい音量が含まれる一部の期間の音声を抽出してよい。 The threshold volume is set so that the sum of the periods of the plurality of sounds extracted by the sound extraction unit is equal to the period obtained by multiplying the number of the plurality of captured images captured by the imaging unit by the reproduction time of a predetermined captured image. A threshold volume setting unit for setting the threshold volume stored in the storage unit may be further provided. The threshold volume storage unit stores the threshold volume for each band in association with each of the plurality of frequency bands, and the voice extraction unit stores the volume of the voice recorded by the recording unit for each frequency band. Compared with the threshold sound volume for each band, the sound of a part of the period in which the sound volume larger than the threshold sound volume for each band is included in a specific frequency band may be extracted.
当該撮像装置の周囲の環境を特定する環境特定部と、設定された帯域周波数の音声を透過させる可変フィルタ部と、環境特定部が特定した環境に応じて、可変フィルタ部が透過させる音声の帯域周波数を設定する帯域制御部とをさらに備え、録音部は、フィルタ部が透過させた音声を録音してよい。 An environment specifying unit that specifies the environment around the imaging device, a variable filter unit that transmits sound of a set band frequency, and a voice band that the variable filter unit transmits according to the environment specified by the environment specifying unit A band control unit for setting a frequency, and the recording unit may record the sound transmitted through the filter unit.
当該撮像装置の位置を検出する位置検出部と、位置を示す情報に対応づけて、環境を示す情報を格納する環境情報格納部とをさらに備え、環境特定部は、位置検出部が検出した位置に基づいて環境情報格納部を検索し、当該撮像装置の周囲の環境を特定してよい。 The environment detection unit further includes a position detection unit that detects the position of the imaging device and an environment information storage unit that stores information indicating the environment in association with the information indicating the position. The environment information storage unit may be searched based on the information to identify the environment around the imaging device.
時刻を検出する時刻検出部と、時刻を示す情報に対応づけて、環境を示す情報を格納する環境情報格納部とをさらに備え、環境特定部は、時刻検出部が検出した時刻に基づいて環境情報格納部を検索し、当該撮像装置の周囲の環境を特定してよい。 A time detection unit for detecting the time; and an environment information storage unit for storing information indicating the environment in association with the information indicating the time. The environment specifying unit is configured to generate an environment based on the time detected by the time detection unit. The information storage unit may be searched to identify the environment around the imaging device.
本発明の第2の形態における撮像方法は、撮像部を用いて被写体を撮像する段階と、撮像部の周囲の音声を録音する録音段階と、設定された閾値音量を格納する閾値音量格納段階と、録音段階において録音された音声のうちで、閾値音量格納段階において格納される閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出段階と、撮像部が撮像した撮像画像と、音声抽出段階で抽出された音声とを対応づけて格納するデータ格納段階と、データ格納段階において対応づけて格納される撮像画像と音声とを同期させて出力するデータ出力段階とを備える。 An imaging method according to a second aspect of the present invention includes a step of imaging a subject using an imaging unit, a recording step of recording sound around the imaging unit, and a threshold volume storage step of storing a set threshold volume. The voice extraction stage for extracting the voice of a part of the period including the voice of the volume higher than the threshold volume stored in the threshold volume storage stage among the voices recorded in the recording stage, and the imaging captured by the imaging unit A data storage stage for storing the image and the voice extracted in the voice extraction stage in association with each other; and a data output stage for synchronizing and outputting the captured image and the voice stored in correspondence in the data storage stage .
本発明の第3の形態によると、画像を撮像する撮像装置用のプログラムであって、撮像装置を被写体を撮像する撮像部、撮像部の周囲の音声を録音する録音部、設定された閾値音量を格納する閾値音量格納部、録音部が録音した音声のうちで、閾値音量格納部が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出部、撮像部が撮像した撮像画像と、音声抽出部が抽出した音声とを対応づけて格納するデータ格納部、データ格納部が対応づけて格納している撮像画像と音声とを同期させて出力するデータ出力部として機能させる。 According to a third aspect of the present invention, there is provided a program for an imaging device that captures an image, the imaging device capturing an image of a subject with the imaging device, a recording unit recording sound around the imaging unit, and a set threshold volume A sound volume extraction unit for extracting a sound of a part of a period including sound having a volume larger than the threshold sound volume stored in the threshold sound volume storage unit among sound recorded by the recording unit, A data storage unit that stores the captured image captured by the imaging unit in association with the audio extracted by the audio extraction unit, and data that is output by synchronizing the captured image and audio stored in association with the data storage unit It functions as an output unit.
本発明の第4の形態における再生装置は、撮像装置によって撮像された撮像画像を格納する撮像画像格納部と、撮像装置によって録音された音声を格納する音声格納部と、閾値音量を格納する閾値音量格納部と、音声格納部が格納している音声のうちで、閾値音量格納部が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出部と、撮像画像格納部が格納する撮像画像と、音声抽出部が抽出した音声とを対応づけて格納するデータ格納部と、データ格納部が対応づけて格納している撮像画像と音声とを同期させて出力するデータ出力部とを備える。 A playback device according to a fourth aspect of the present invention includes a captured image storage unit that stores a captured image captured by an imaging device, an audio storage unit that stores sound recorded by the imaging device, and a threshold value that stores a threshold volume. A volume storage unit, and a voice extraction unit that extracts voices of a part of a period including voices having a volume higher than the threshold volume stored in the threshold volume storage unit among the voices stored in the voice storage unit; The data storage unit stores the captured image stored in the captured image storage unit in association with the audio extracted by the audio extraction unit, and the captured image and audio stored in association with the data storage unit are synchronized. And a data output unit for outputting.
設定された許容時間を格納する許容時間格納部をさらに備え、撮像画像格納部は、撮像装置によって撮像された時刻に対応づけて撮像画像を格納し、音声格納部は、撮像装置によって録音された時刻に対応づけて音声を格納し、音声抽出部は、撮像画像格納部が格納している撮像画像が撮像された時刻から、許容時間格納部が格納している許容時間の範囲内の時刻に録音された音声のうちで、閾値音量格納部が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出してよい。 It further includes an allowable time storage unit that stores the set allowable time, the captured image storage unit stores the captured image in association with the time taken by the imaging device, and the audio storage unit is recorded by the imaging device The voice is stored in association with the time, and the voice extraction unit moves from the time when the captured image stored in the captured image storage unit is captured to a time within the allowable time range stored in the allowable time storage unit. Of the recorded voices, voices of a part of a period in which voices having a volume larger than the threshold volume stored in the threshold volume storage unit may be extracted.
撮像画像格納部が格納している撮像画像を再生するべき旨の指示を受け付ける指示受付部と、指示受付部が指示を受け付けたときの時刻を検出する時刻検出部と、撮像画像格納部が格納している撮像画像が撮像された時刻と、時刻検出部が検出した時刻との差が大きいほど、許容時間格納部が格納している許容時間を長く設定する許容時間制御部をさらに備えてよい。 An instruction reception unit that receives an instruction to reproduce a captured image stored in the captured image storage unit, a time detection unit that detects a time when the instruction reception unit receives the instruction, and a captured image storage unit And a permissible time control unit that sets the permissible time stored in the permissible time storage unit to be longer as the difference between the time when the captured image is captured and the time detected by the time detection unit is larger. .
音声格納部が格納している音声の音量分布に基づいて、閾値音量格納部が格納している閾値音量を設定する閾値音量設定部をさらに備えてよい。閾値音量設定部は、音声格納部が格納している音声の音量の平均値がより大きい場合に、閾値音量格納部が格納している閾値音量をより大きく設定してよい。 You may further provide the threshold volume setting part which sets the threshold volume stored in the threshold volume storage part based on the volume distribution of the voice stored in the voice storage part. The threshold sound volume setting unit may set the threshold sound volume stored in the threshold sound volume storage unit larger when the average value of the sound volume stored in the sound storage unit is larger.
本発明の第5の形態における再生方法は、撮像装置によって撮像された撮像画像を格納する撮像画像格納段階と、撮像装置によって録音された音声を格納する音声格納段階と、閾値音量を格納する閾値音量格納段階と、音声格納段階において格納される音声のうちで、閾値音量格納段階において格納される閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出段階と、撮像画像格納段階において格納される撮像画像と、音声抽出段階において抽出される音声とを対応づけて格納するデータ格納段階と、データ格納段階において対応づけて格納される撮像画像と音声とを同期させて出力するデータ出力部とを備える。 The reproduction method according to the fifth aspect of the present invention includes a captured image storage stage for storing a captured image captured by an imaging apparatus, an audio storage stage for storing sound recorded by the imaging apparatus, and a threshold for storing a threshold volume. A sound volume extraction stage, a sound extraction stage for extracting a sound of a part of a period in which a sound having a volume larger than the threshold volume stored in the threshold volume storage stage is included among the sounds stored in the sound storage stage, and imaging A data storage stage that associates and stores a captured image stored in the image storage stage and a sound that is extracted in the sound extraction stage, and a captured image and a sound that are stored in association in the data storage stage A data output unit for outputting.
本発明の第6の形態によると、画像を再生する再生装置用のプログラムであって、再生装置を撮像装置によって撮像された撮像画像を格納する撮像画像格納部、撮像装置によって録音された音声を格納する音声格納部、閾値音量を格納する閾値音量格納部、音声格納部が格納している音声のうちで、閾値音量格納部が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出部、撮像画像格納部が格納している撮像画像と、音声抽出部が抽出した音声とを対応づけて格納するデータ格納部、データ格納部が対応づけて格納している撮像画像と音声とを同期させて出力するデータ出力部として機能させる。 According to a sixth aspect of the present invention, there is provided a program for a playback device that plays back an image, the captured image storage unit storing a captured image captured by the playback device, and the sound recorded by the imaging device. Among the voices stored in the voice storage unit, the threshold volume storage unit that stores the threshold volume, and the voices stored in the voice storage unit, some of the voices that are louder than the threshold volume stored in the threshold volume storage unit are included A voice extraction unit that extracts voice during the period of time, a captured image stored in the captured image storage unit, and a data storage unit that stores the voice extracted by the voice extraction unit in association with each other, and a data storage unit stores them in association with each other It functions as a data output unit that outputs the captured image and the sound that are synchronized with each other.
なお上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではなく、これらの特徴群のサブコンビネーションもまた発明となりうる。 Note that the above summary of the invention does not enumerate all the necessary features of the present invention, and sub-combinations of these feature groups can also be the invention.
本発明によれば、望ましい音声と画像をユーザが容易に得ることができる撮像装置又は再生装置を提供することができる。 ADVANTAGE OF THE INVENTION According to this invention, the imaging device or reproducing | regenerating apparatus which can obtain a desired audio | voice and an image easily can be provided.
以下、発明の実施形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。 Hereinafter, the present invention will be described through embodiments of the invention. However, the following embodiments do not limit the claimed invention, and all combinations of features described in the embodiments are inventions. It is not always essential to the solution.
図1は、本発明の第1実施形態に係る撮像装置100及び再生装置140の利用環境の一例を示す。この例では、撮像装置100は、海岸に遊びにきている人の画像を撮像する。また、撮像装置100は、撮像装置100の周囲の音をマイクロホン102で録音する。撮像装置100は、撮像装置100が撮像した画像及び録音した音声を、インターネット等の通信回線150を通じて再生装置140に出力する。再生装置140は、撮像装置100から受け取った画像を再生しつつ、撮像装置100から受け取った音声を再生する。
FIG. 1 shows an example of the usage environment of the
このとき、撮像装置100は、撮像画像を撮像したときの撮像場所、撮像時刻において録音された特徴的な音声を、撮像画像とともに再生装置140に出力する。また、再生装置140は、撮像装置100が撮像画像を再生するときに、録音された音声のうち撮像画像を撮像したときの特徴的な音声を、撮像画像とともに再生する。このため、ユーザ180は、望ましい音声と画像を容易に得ることができる。
At this time, the
撮像装置100は、例えば、ユーザ180が所持するデジタルスチルカメラ、カメラ付携帯電話等であってよい。また、再生装置140は、例えば、画像及び音声を再生することのできるHDTV、フォトスタンド等であってよい。他にも、再生装置140は、画像及び音声を再生するコンピュータであってもよい。撮像装置100は、再生装置140が有する画像又は音声を再生する機能を持ってもよい。また、撮像装置100は画像及び音声データを記録媒体に記録し、再生装置140は当該記録媒体からデータを受け取って、画像及び音声を再生してもよい。また、撮像装置100は、画像及び音声データを、通信回線150に接続されたサーバの、ユーザ180毎にそれぞれ設けられたディレクトリ、例えば撮像装置100と関連付けられたディレクトリに格納してもよい。そして再生装置140は、ユーザ180毎にサーバに格納された画像及び音声データを受け取ってもよい。
The
図2は、撮像装置100のブロック構成の一例を示す。撮像装置100は、撮像部212、録音部214、音声格納部216、音声抽出部218、閾値音量設定部220、閾値音量格納部222、データ格納部232、データ出力部234、可変フィルタ部242、帯域制御部244、環境特定部252、環境情報格納部246、位置検出部248、及び時刻検出部250を備える。
FIG. 2 shows an example of a block configuration of the
撮像部212は、被写体を撮像する。具体的には、撮像部212は、被写体からの光をCCD等の撮像デバイスで受光して、被写体を撮像する。なお、撮像部212は、所定の時間間隔で連続的に被写体を撮像してもよい。そして、撮像部212は、連続的に撮像して得られる所定の個数の画像を保持しておいてよい。そして、撮像部212は、保持した画像の中から、撮像を指示された時刻に最も近いタイミングで撮像された画像を、当該時刻に撮像された撮像画像として選択してもよい。
The
録音部214は、撮像部212の周囲の音声を録音する。例えば録音部214は、マイクロホン102で集音される音声を録音する。音声格納部216は、録音部214が録音した音声を格納する。
The
閾値音量格納部222は、設定された閾値音量を格納する。そして、音声抽出部218は、録音部214が録音した音声のうちで、閾値音量格納部222が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する。
The threshold
データ格納部232は、撮像部212が撮像した撮像画像と、音声抽出部218が抽出した音声とを対応づけて格納する。具体的には、データ格納部232は、撮像部212が撮像した複数の撮像画像のそれぞれと、音声抽出部218が抽出した複数の音声のそれぞれとを、撮像及び録音された順に対応づけて格納する。データ出力部234は、データ格納部232が対応づけて格納している撮像画像と音声とを同期させて出力する。このため、ユーザ180は、撮像画像と音声を容易に鑑賞することができる。
The
なお、閾値音量格納部222は、撮像装置100のユーザ180が設定した閾値音量を格納してもよい。また、閾値音量設定部220によって設定された閾値音量を格納してもよい。閾値音量設定部220は、音声抽出部218が抽出する複数の音声の期間の合計が、撮像部212が撮像した複数の撮像画像の数に、予め定められた撮像画像の再生時間を乗じた期間と同一となるように、閾値音量格納部222が格納している閾値音量を設定する。
The threshold
また、閾値音量設定部220は、音声格納部216が格納している音声の音量分布に基づいて、閾値音量格納部222が格納している閾値音量を設定してもよい。具体的には、閾値音量設定部220は、音声格納部216が格納している音声の音量分布がより大きい方に偏っている場合に、閾値音量格納部222が格納している閾値音量をより大きく設定してもよい。具体的には、閾値音量設定部220は、音声格納部216が格納している音声の音量の平均値がより大きい場合に、閾値音量格納部222が格納している閾値音量をより大きく設定してよい。
Further, the threshold
また、閾値音量格納部222は、複数の周波数帯域のそれぞれに対応づけて帯域別閾値音量を格納してもよい。そして、音声抽出部218は、録音部214が録音した音声の音量を周波数帯域毎に、閾値音量格納部222が格納している帯域別閾値音量と比較し、特定の周波数帯域において帯域別閾値音量より大きい音量が含まれる一部の期間の音声を抽出してもよい。このため、ユーザ180は、撮像画像に対して望ましい周波数帯域の音声を撮像画像とともに鑑賞することができる。例えば、100Hzから4000Hzの周波数帯域の閾値音量を低く設定することによって、遊園地で遊んでいる人物が撮像された画像を、人物の声と容易に対応づけて鑑賞することができる。
Further, the threshold
環境情報格納部246は、位置を示す情報に対応づけて、環境を示す情報を格納する。具体的には、環境情報格納部246は、緯度及び経度情報と、当該緯度及び経度における環境情報とを対応づけて格納する。環境情報とは、例えば、海、山、川等の自然の環境を示す情報であってよい。他にも、環境情報とは、遊園地、球技場、音楽ホール等、人間による利用環境を示す情報であってよい。 The environment information storage unit 246 stores information indicating the environment in association with information indicating the position. Specifically, the environment information storage unit 246 stores latitude and longitude information and environment information at the latitude and longitude in association with each other. The environmental information may be information indicating a natural environment such as the sea, a mountain, and a river. In addition, the environmental information may be information indicating a use environment by humans, such as an amusement park, a ball game ground, and a music hall.
位置検出部248は、撮像装置100の位置を検出する。例えば、位置検出部248は、GPS衛星からの緯度及び経度情報を受信することによって、撮像装置100が存在する緯度及び経度を特定する。
The position detection unit 248 detects the position of the
環境特定部252は、位置検出部248が検出した位置に基づいて環境情報格納部246を検索し、撮像装置100の周囲の環境を特定する。例えば、環境特定部252は、位置検出部248によって検出された緯度及び経度情報に合致する環境情報を、環境情報格納部246を検索することによって特定する。
The
他にも、環境情報格納部246は、時刻を示す情報に対応づけて、環境を示す情報を格納する。例えば、環境情報格納部246は、日付を含む時刻と季節とを対応づけて格納する。 In addition, the environment information storage unit 246 stores information indicating the environment in association with information indicating the time. For example, the environment information storage unit 246 stores the time including the date and the season in association with each other.
時刻検出部250は、時刻を検出する。そして、環境特定部252は、時刻検出部250が検出した時刻に基づいて環境情報格納部246を検索し、撮像装置100の周囲の環境を特定する。例えば、時刻検出部250が検出する時刻に該当する季節を、環境情報格納部246を検索することによって特定する。
The
帯域制御部244は、環境特定部252が特定した撮像装置100の周囲の環境に応じて、可変フィルタ部242が透過させる音声の帯域周波数を設定する。可変フィルタ部242は、帯域制御部244によって設定された帯域周波数の音声を透過させる。そして、録音部214は、可変フィルタ部242が透過させた音声を録音する。
The
このため、ユーザ180は、撮像装置100を用いて撮像するときの環境、時刻に応じた望ましい周波数帯域の音声を録音することができる。
For this reason, the
図3は、再生装置140のブロック構成の一例を示す。再生装置140は、音声格納部316、音声抽出部318、撮像画像格納部320、データ格納部332、データ出力部334、指示受付部312、許容時間制御部362、許容時間格納部364、時刻検出部360、閾値音量格納部322、及び閾値音量設定部324を備える。
FIG. 3 shows an example of a block configuration of the
撮像画像格納部320は、撮像装置100によって撮像された撮像画像を格納する。また、音声格納部316は、撮像装置100によって録音された音声を格納する。具体的には、撮像画像格納部320は、撮像装置100によって撮像された時刻に対応づけて撮像画像を格納する。また、音声格納部316は、撮像装置100によって録音された時刻に対応づけて音声を格納する。
The captured
閾値音量格納部322は、閾値音量を格納する。音声抽出部318は、音声格納部316が格納している音声のうちで、閾値音量格納部322が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する。
The threshold
データ格納部332は、撮像画像格納部320が格納している撮像画像と、音声抽出部318が抽出した音声とを対応づけて格納する。指示受付部312は、撮像画像格納部320が格納している撮像画像を再生するべき旨の指示を受け付ける。指示受付部312は、例えばユーザ180からの指示を受け付ける。データ出力部334は、指示受付部312が指示を受け付けた場合に、データ格納部232が対応づけて格納している撮像画像と音声とを同期させて出力する。
The
許容時間格納部364は、設定された許容時間を格納する。音声抽出部318は、撮像画像格納部320が格納している撮像画像が撮像された時刻から、許容時間格納部364が格納している許容時間の範囲内の時刻に録音された音声のうちで、閾値音量格納部222が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する。
The allowable
具体的には、音声抽出部318は、撮像画像格納部320が格納している撮像画像が撮像された時刻から、許容時間格納部364が格納している許容時間だけ前及び/又は後の時間範囲内の時刻に録音された音声のうちで、閾値音量格納部222が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する。
Specifically, the
閾値音量設定部324は、音声抽出部318が抽出する複数の音声の期間の合計が、予め定められた撮像画像の再生時間と同一となるように、閾値音量格納部322が格納している閾値音量を設定する。
The threshold
時刻検出部360は、指示受付部312が指示を受け付けたときの時刻を検出する。そして、許容時間制御部362は、撮像画像格納部320が格納している撮像画像が撮像された時刻と、時刻検出部360が検出した時刻との差が大きいほど、許容時間格納部364が格納している許容時間を長く設定する。このため、再生装置140は、より広い時間範囲で録音された音声の中から選択されるより特徴的な音声とともに、遠い過去の撮像画像を再生することができる。また、再生装置140は、より近い過去に撮像された撮像画像を、撮像時刻の近くで録音された音声の中から選択して再生することができるので、撮像画像に対して再生される音声が不自然なものになることを防ぐことができる。
The
閾値音量設定部324は、音声格納部316が格納している音声の音量分布に基づいて、閾値音量格納部322が格納している閾値音量を設定してよい。具体的には、閾値音量設定部324は、音声格納部316が格納している音声の音量分布がより大きい方に偏っている場合に、閾値音量格納部322が格納している閾値音量をより大きく設定してもよい。より具体的には、閾値音量設定部324は、音声格納部316が格納している音声の音量の平均値がより大きい場合に、閾値音量格納部322が格納している閾値音量をより大きく設定してよい。
The threshold
図4は、撮像画像と音声との対応関係の一例を示す。撮像部212は、時刻t3、t4、t7、t9、t13、t14の順に撮像された6個の画像を格納している。そして、音声格納部216には、録音部214によって録音した音声を時刻に対応づけて、音量波形402で示される音量の音声が格納されている。
FIG. 4 shows an example of the correspondence between the captured image and the sound. The
閾値音量格納部222には、閾値音量L412が設定されている。そして、音声抽出部218は、音量波形402の音声のうち、閾値音量格納部222が格納している閾値音量L412より大きい音量の音声を抽出する。このとき、閾値音量設定部220は、音量波形402のうち閾値音量L412より大きい期間(t1〜t2、t5〜t10、及びt12〜t16)を合計した期間と、撮像部212によって撮像された6個の画像を再生する再生時間の合計時間とが同一になるように、閾値音量L412を設定する。そして、データ格納部232は、撮像部212が撮像した撮像画像のそれぞれが撮像された順に、音声抽出部218によって抽出された期間の音声のうち再生時間毎の期間の音声を順に対応づけて格納する。
A threshold volume L412 is set in the threshold
具体的には、データ格納部232は、時刻t3に撮像された画像を、時刻(t1〜t2)に録音された音声と対応づけて格納する。また、データ格納部232は、時刻(t4、t7、t9)に撮像された画像を、期間(t5〜t10)に録音された音声のうち、それぞれ再生時間で分割した期間(t5〜t6)、期間(t6〜t8)、期間(t8〜t10)の音声と対応づけて格納する。同様に、データ格納部232は、時刻t13及び時刻t14に撮像された画像を、それぞれ期間(t12〜t15)、及び期間(t15〜t16)に録音された音声と対応づける。なお、説明を簡単にするために、時刻(t1〜t2)、期間(t5〜t6)、期間(t6〜t8)、期間(t8〜t10)、期間(t12〜t15)、及び期間(t15〜t16)のそれぞれは、予め設定された再生時間と同一の期間であるとした。このため、ユーザ180は、撮像装置100を用いて撮像しながら周囲の音声を録音しておくだけで、撮像画像と音声とを容易に対応づけることができる。
Specifically, the
なお、音量及び閾値音量は、音圧を意味してよい。他にも、音量及び閾値音量は、人間の聴覚に対応する音の大きさを意味してもよい。 Note that the sound volume and the threshold sound volume may mean sound pressure. In addition, the sound volume and the threshold sound volume may mean a loudness level corresponding to human hearing.
図5は、撮像画像と音声との対応関係の他の一例を示す。撮像部212は、時刻t3、t4、t7、t9、t13、t14の順に撮像された6個の画像を格納している。そして、音声格納部216には、録音部214が録音した音量波形402で示される音量の音声が格納されている。この場合、閾値音量設定部220は、音声格納部216が格納する音量波形から、時間についての平均音量Lavを算出する。そして、閾値音量設定部220は算出した平均音量Lavに、予め定めれた係数(例えば、1以上の係数)を乗じた音量閾値L412を閾値音量格納部222に格納させる。そして、音声抽出部218は、音量波形402の音声のうち、閾値音量格納部222が格納している閾値音量L412より大きい音量の音声、例えば、期間(t1〜t2、t5〜t10、及びt12〜t16)を抽出する。なお、データ格納部232は、図4に関連して説明した音声と画像との対応付けと同様にして、音声抽出部218が抽出した期間の音声と画像とを、画像の撮像時刻の順に対応付けて格納する。
FIG. 5 shows another example of the correspondence between the captured image and the sound. The
このように、閾値音量設定部220は、音声格納部216に格納されている音声の平均的な音量に応じた適切な閾値を設定することができる。なお、閾値音量設定部220が設定した閾値音量L412より大きい音量の音声の期間の合計が1つの画像の再生時間に画像の数を乗じた期間より短い場合には、データ格納部232は、当該期間の合計値を画像の数で除した期間の音声のそれぞれと画像とを、画像の撮像時刻の順に対応づけて格納してよい。なお、閾値音量設定部220が設定した閾値音量L412より大きい音量の音声の期間の合計が1つの画像の再生時間に画像の数を乗じた期間より長い場合には、データ格納部232は、複数の画像のそれぞれについて、画像が撮像された時刻に最も近い、他の画像に対応づけられた音声の期間とは異なる期間の音声を選択して、選択した音声と画像とを対応づけて格納してよい。
As described above, the threshold
図6は、周波数帯域毎に設定される閾値音量の一例を示す。例えば、閾値音量格納部222は、周波数f551〜f552、周波数f552〜f553、及び周波数f553〜f554の周波数帯域の音声に対する閾値音量として、それぞれ閾値音量L501、閾値音量L502、及び閾値音量L503を格納する。図6の音量波形520、音量波形530、及び音量波形540は、それぞれ周波数f551〜f552、周波数f552〜f553、及び周波数f553〜f554の周波数帯域の成分の音量の時間発展を示す。
FIG. 6 shows an example of the threshold volume set for each frequency band. For example, the threshold
そして、音声抽出部218は、周波数f551〜f552における閾値音量L501より大きい音量を含む期間(t50〜t51)及び期間(t55〜t57)、並びに、周波数f552〜f553の周波数帯域における量閾値L502より大きい音量を含む期間(t56〜t58)を検出する。そして、音声抽出部218は、いずれかの周波数帯域において閾値音量よりも大きい音量を有する期間(t50〜t51)及び期間(t55〜t58)の音声を抽出する。
The
この場合、f553〜f554の周波数帯域の閾値音量L503を、閾値音量L502及び閾値音量L501よりも高く設定することで、例えば、時刻t53の付近における、周波数f553〜f554の周波数帯域に大きい音量を持つ期間の音声が、音声抽出部218によって抽出されることを防ぐことができる。このため、例えば、鳥を被写体として撮像装置100が撮像した撮像画像に対して、撮像装置100の周囲の人間の囁き声等が対応づけられてしまうことを防ぐことができる。したがって、撮像装置100は、望ましい周波数帯域の音量が大きい期間の音声を撮像画像と対応づけてユーザ180に提供することができる。
In this case, by setting the threshold volume L503 in the frequency band of f553 to f554 higher than the threshold volume L502 and the threshold volume L501, for example, there is a large volume in the frequency band of the frequencies f553 to f554 in the vicinity of time t53. The
図7は、可変フィルタ部242が透過する音声の帯域周波数の一例を示す。帯域制御部244は、環境特定部252によって特定される撮像装置100の周囲の環境に応じて、可変フィルタ部242が透過させる音声の帯域周波数を設定する。具体的には、環境情報格納部246は、緯度及び経度情報と、当該緯度及び経度における環境情報とを対応づけて格納する。環境情報とは、例えば、海、山、川等の自然の環境を示す情報であってよい。他にも、環境情報とは、遊園地、球技場、音楽ホール等、人間による利用環境を示す情報であってよい。
FIG. 7 shows an example of the band frequency of the sound transmitted through the
そして、位置検出部248は、例えばGPS衛星からの緯度及び経度情報を受信することによって、撮像装置100が存在する緯度及び経度を特定する。そして、環境特定部252は、位置検出部248によって検出された緯度及び経度情報に合致する環境を、環境情報格納部246を検索することによって特定する。帯域制御部244は、環境特定部252によって検出される環境情報に応じた周波数帯域の音声を録音させるべく、可変フィルタ部242が透過させる周波数帯域を決定する。
And the position detection part 248 specifies the latitude and longitude in which the
例えば、帯域制御部244は、環境特定部252によって特定された環境が山である場合に、例えば山に生息する虫の鳴き声、鳥の鳴き声等を主として録音部214に録音させるべく、3000Hz〜20000Hzの間の周波数帯域の音声を可変フィルタ部242に透過させる。他にも、帯域制御部244は、環境特定部252によって特定された環境が遊園地である場合には、例えば人間の歓声等を録音部214に録音させるべく、100Hz〜4000Hzの間の周波数帯域を含む音声を可変フィルタ部242に透過させる。
For example, when the environment specified by the
また、帯域制御部244は、時刻検出部250によって検出される時刻に応じて、可変フィルタ部242が透過する音声の周波数帯域を制御してもよい。具体的には、環境情報格納部246は、日付を含む時刻と季節とを対応づけて格納する。そして、環境特定部252は、時刻検出部250が検出する時刻に該当する季節を、環境情報格納部246を検索することによって特定する。そして、例えば環境特定部252によって季節が夏であると特定された場合には、帯域制御部244は、例えばセミの鳴き声の周波数帯域(4000Hz〜5000Hz)を含む周波数帯域を可変フィルタ部242に透過させる。
Further, the
このため、ユーザ180は、撮像装置100によって撮像する環境又は時刻に応じた望ましい音声を容易に録音することができる。
Therefore, the
本実施形態の撮像装置100によれば、望ましい音声が対応づけられた撮像画像をユーザ180に容易に提供することができる。したがって、ユーザ180は、撮像画像に対して録音させるべき音声を意識することなく、楽しく撮像することができる。
According to the
図8は、撮像画像と音声の対応関係の一例を示す。撮像画像格納部320は、撮像装置100によって時刻t3、t4、t7、t9、t13、t14の順に撮像された6個の画像を格納している。そして、音声格納部316は、撮像装置100によって録音された音声を時刻に対応づけて、音量波形402で示される音量の音声が格納されている。
FIG. 8 shows an example of the correspondence between the captured image and the sound. The captured
閾値音量格納部322には、閾値音量L412が設定されている。そして、音声抽出部318は、音量波形402の音声のうち、閾値音量格納部322が格納している閾値音量L412より大きい音量の音声を抽出する。このとき、閾値音量設定部324は、音量波形402のうち閾値音量L412より大きい期間(t1〜t2、t5〜t10、及びt12〜t16)を合計した期間と、撮像装置100によって撮像された6個の画像を再生する再生時間の合計時間とが同一になるように、閾値音量L412を設定する。そして、データ格納部332は、撮像装置100が撮像した撮像画像のそれぞれが撮像された順に、音声抽出部318によって抽出された期間の音声のうち再生時間毎の期間の音声を順に対応づけて格納する。
The threshold volume L412 is set in the threshold
具体的には、データ格納部332は、時刻t3に撮像された画像を、時刻(t1〜t2)に録音された音声と対応づけて格納する。また、データ格納部332は、時刻(t4、t7、t9)に撮像された画像を、期間(t5〜t10)に録音された音声のうち、それぞれ再生時間毎の期間(t5〜t6)、期間(t6〜t8)、期間(t8〜t10)の音声と対応づけて格納する。同様に、データ格納部332は、時刻t13及び時刻t14に撮像された画像を、それぞれ期間(t12〜t15)、及び期間(t15〜t16)に録音された音声と対応づける。なお、説明を簡単にするために、時刻(t1〜t2)、期間(t5〜t6)、期間(t6〜t8)、期間(t8〜t10)、期間(t12〜t15)、及び期間(t15〜t16)のそれぞれは、予め設定された再生時間と同一の期間であるとした。このため、再生装置140は、撮像装置100を用いて撮像しながら周囲の音声を録音しておくことによって、撮像画像と音声とを容易に対応づけて再生することができる。
Specifically, the
また、閾値音量格納部322は、複数の周波数帯域のそれぞれに対応づけて帯域別の閾値音量を格納してもよい。そして、音声抽出部318は、音声格納部316が格納した音声の音量を周波数帯域毎に、閾値音量格納部322が格納する帯域別の閾値音量と比較し、特定の周波数帯域において帯域別の閾値音量より大きい音量が含まれる一部の期間の音声を抽出してもよい。
The threshold
この場合、例えば、鳥を被写体として撮像装置100によって撮像された撮像画像に対して、撮像装置100によって録音された周囲の人間の囁き声等が対応づけられて再生されてしまうことを防ぐことができる。したがって、再生装置140は、望ましい周波数帯域の音声が大きい期間の音声を撮像画像と対応づけて再生することができる。
In this case, for example, it is possible to prevent a surrounding human whisper recorded by the
図9は、再生される画像と音声の対応関係の一例を示す。指示受付部312は、ユーザ180から、画像を再生する指示を受け付ける。例えば、時刻t83で撮像された画像を再生する指示を指示受付部312が受け付けた場合に、音声抽出部318は、時刻t83から、許容時間格納部364に格納されている許容時間Δt803後のt84までの時間範囲内で、閾値音量L824より大きい音量の音声が含まれる期間の音声を抽出することによって、音量波形838の一部分の音声を抽出する。
FIG. 9 shows an example of the correspondence between reproduced images and sound. The
また、許容時間制御部362は、撮像画像格納部320が格納する撮像画像が撮像された時刻と、再生する指示を受け付けた時刻との差が大きいほど、許容時間格納部364が格納する許容時間を長く設定する。例えば、許容時間制御部362は、撮像時刻t83よりも前の時刻t81に撮像された撮像画像を再生する場合に、許容時間Δt803に比べてより長い許容時間Δt802を、許容時間格納部364に格納する。そして、音声抽出部318は、時刻t81から、許容時間Δt802後のt82までの時間範囲内で、閾値音量L834より大きい音量の音声が含まれる期間の音声を抽出することによって、音量波形834の一部分の音声を抽出する。
In addition, the allowable
例えば、再生装置140は、一週間前に撮影した画像を再生するときには、撮影した当日に録音された音声の中から抽出される音声を再生する。また、20年前の小学校の入学式、運動会、卒業式等の画像及び音声が記録されている場合に、再生装置140によって運動会の様子を撮影した画像を再生するときには、例えば運動会の日の前後6年間の範囲で録音された音声の中から再生する音声を抽出する。この場合、例えば小学校の運動会の時の音声の他に、入学式、卒業式で録音された音声も再生装置140によって再生される。このため、ユーザ180は、小学生時代の運動会の様子を鑑賞しながら、小学校への入学式、卒業式等における記憶を沢山思い出すことができるので、より楽しく画像を鑑賞することができる。
For example, when playing back an image shot one week ago, the
なお、閾値音量設定部324は、許容時間格納部364に格納される範囲内で、再生される音声の時間が、予め定められた撮像画像の再生時間と一致するように、閾値音量格納部322が格納している閾値音量を設定してもよい。例えば、閾値音量設定部324は、時刻t81〜t82までの時間範囲内で、閾値音量格納部322が格納している閾値音量よりも大きい音量の音声が含まれる期間が、予め定めた撮像画像の再生時間と一致するよう、閾値音量格納部322が格納している閾値音量をL822に設定する。
It should be noted that the threshold
また、音声抽出部318は、時刻t81に撮像された撮像画像を再生する指示を受け付けた場合に、時刻t83から許容時間Δt802だけ前の時刻t80から時刻t81までの時間範囲で、閾値音量より大きい音量の音声が含まれる範囲の音声を抽出することによって、音声波形832の一部の音声を抽出してもよい。また、音声抽出部318は、時刻t81で撮像された撮像画像を再生する場合に、時刻t81から、許容時間Δt802だけ前及び後の時間範囲(時刻t80〜t82)で、閾値音量より大きい音量の音声が含まれる範囲の音声を抽出してもよい。
In addition, when receiving an instruction to reproduce the captured image captured at time t81, the
図10は、第2実施形態に係る撮像装置900のブロック構成の一例を示す。なお、第2実施形態の撮像装置900の利用環境の一例は、図1で説明した撮像装置100の利用環境と、以下の点を除いて同一であるので説明を省略する。すなわち、第2実施形態に係る撮像装置900は、撮像装置900の利用状態、例えば撮像状態、待機状態等の利用状態に応じて、撮像装置900の録音動作を調整する。例えば、撮像装置900は、被写体を撮像しているときには、被写体からのより特徴的な音声を録音する。
FIG. 10 shows an example of a block configuration of an
第2実施形態の撮像装置900は、撮像部912、録音部914、音声格納部916、モード設定部962、録音音量設定部910、録音制御部922、距離測定部970、集音方向制御部964、及び音声集音部980を備える。録音音量設定部910は、閾値音量設定部920を有する。また、音声集音部980は、第1集音部966及び第2集音部968を有する。なお、第2実施形態に係る撮像装置900の動作及び機能は、以下に説明する部分を除き、第1実施形態に係る撮像装置100の動作及び機能と同一であるので説明を省略する。例えば、撮像部912及び録音部914の動作及び機能は、撮像部212及び録音部214の動作と同一であってよい。なお、第1実施形態の撮像装置100及び第2実施形態の撮像装置900の動作及び機能を組み合わせた撮像装置もまた発明となり得る。
The
音声集音部980は、撮像部912の周囲の音声を集音して録音部914に録音させる。録音制御部922は、撮像部912の周囲の音声のうちで、予め設定された設定音量より大きい音声を録音部914に録音させる。具体的には、録音制御部922は、撮像部912の周囲の音声のうちで、予め設定された閾値音量より大きい音量の音声を録音部914に録音させる。そして、音声格納部916は、録音部914が録音した音声を格納する。
The
モード設定部962は、撮像部912及び録音部914の動作状態の種類を示す動作モードを設定する。録音音量設定部910は、モード設定部962が設定した動作モードに基づいて、設定音量を設定する。具体的には、音音量設定部910は、モード設定部962が設定した動作モードに基づいて、録音部914が録音すべき音声の閾値音量を変更することによって、設定音量を設定する。より具体的には、閾値音量設定部920は、モード設定部962が設定した動作モードに基づいて、閾値音量を設定する。なお、録音音量設定部910は、モード設定部962が設定した動作モードに基づいて、音声集音部980の感度を変更することによって、設定音量を設定する。
The
具体的には、モード設定部962は、撮像部912がユーザの操作を受け付け得る状態にある待機モード、及び撮像部912がユーザの操作を受けて動作している状態にある撮像モードを選択的に設定する。録音音量設定部910は、モード設定部962が待機モードに設定した場合に、録音部914が録音すべき音量の第1の設定音量を設定し、モード設定部962が撮像モードに設定した場合に、第1の設定音量より小さい第2の設定音量を設定する。具体的には、閾値音量設定部920は、モード設定部962が待機モードに設定した場合に、第1の閾値音量を設定し、モード設定部962が撮像モードに設定した場合に、第1の閾値音量より小さい第2の閾値音量を設定する。なお、録音音量設定部910は、モード設定部962が待機モードに設定した場合に、音声集音部980が集音する第1の感度を設定し、モード設定部962が撮像モードに設定した場合に、第1の感度より大きい第2の感度を設定してよい。
Specifically, the
距離測定部970は、撮像部912と被写体との距離を測定する。具体的には、距離測定部970は、レーザ光、赤外線等を被写体に対して照射して、被写体から反射した光に基づいて距離を測定する測距センサであってよい。他にも、距離測定部970は、撮像部912による撮像画像のコントラストを検出して、最もコントラストの大きい撮像画像を撮像したときの撮像部912の制御値に基づいて、撮像部912と被写体との距離を測定してもよい。
The
録音音量設定部910は、距離測定部970が測定した距離に基づいて設定音量を設定する。具体的には、録音音量設定部910は、距離測定部970が測定した距離がより大きい場合に、設定音量をより小さく設定する。例えば、閾値音量設定部920は、距離測定部970が測定した距離に基づいて閾値音量を設定する。具体的には、閾値音量設定部920は、距離測定部970が測定した距離がより大きい場合に、閾値音量をより小さく設定する。なお、録音音量設定部910は、距離測定部970が測定した距離がより大きい場合に、音声集音部980が集音する感度をより大きく設定してよい。
The recording volume setting unit 910 sets a set volume based on the distance measured by the
第1集音部966は、撮像部912の撮像方向と略同一の方向に集音指向性を有する。第2集音部968は、第1集音部966より広い集音指向性を有する。
The first
集音方向制御部964は、モード設定部962が撮像モードに設定した場合に、撮像部912の撮像方向と略同一方向の音声を集音して録音部914に録音させ、モード設定部962が待機モードに設定した場合に、モード設定部962が撮像モードに設定したより広い方向の音声を集音して録音部914に録音させる。具体的には、集音方向制御部964は、モード設定部962が撮像モードに設定した場合に、第1集音部966が集音した音声を録音部914に録音させ、モード設定部962が待機モードに設定した場合に、第2集音部968が集音した音声を録音部914に録音させる。
When the
他にも、撮像装置900は、集音指向性を変化させることのできる一の集音部を備えてもよい。そして、集音方向制御部964は、モード設定部962が撮像モードに設定した場合に、当該集音部の集音指向性を制御することによって撮像部912の撮像方向と略同一方向からの音声を集音して録音部914に録音させてもよい。そして、集音方向制御部964は、モード設定部962が待機モードに設定した場合に、モード設定部962が撮像モードに設定したより広い方向の音声を集音して録音部914に録音させてもよい。
In addition, the
図11は、動作モード毎の閾値音量の時間変化の一例を示す。撮像装置900は、動作モードとして、待機モード、撮像モード、及び再生モードを有する。撮像モードは、例えば、撮像装置900が撮像及び/又は録音することのできる動作モードであってよい。また、再生モードは、例えば、撮像装置900が画像及び/又は音声を再生することのできる動作モードであってよい。なお、撮像装置900が起動された直後は、撮像装置900は待機モードに設定される。
FIG. 11 shows an example of a temporal change in the threshold volume for each operation mode. The
図11の例では、撮像部912及び録音部914は、期間(t1001〜t1002)に待機モードに設定される。そして、閾値音量設定部920は、撮像部912及び録音部914が待機モードに設定されている期間には、閾値音量をL1026に設定する。そして、閾値音量設定部920は、撮像部912及び録音部914が撮像モードに設定されている期間(t1002〜t1005)には、閾値音量として、閾値音量L1026よりも低い閾値音量L1022を設定する。この期間では、録音部914は、音量波形1016の音声が入力された場合に、閾値音量L1022よりも大きい音量の音声が入力される期間(t1003〜t1004)の音声を録音する。
In the example of FIG. 11, the imaging unit 912 and the
そして、閾値音量設定部920は、撮像部912及び録音部914が再生モードに設定されている期間(t1005〜t1008)には、閾値音量として、閾値音量L1022又は閾値音量L1024と異なる閾値音量を設定してもよい。例えば、閾値音量設定部920は、再生モードに設定された期間には、閾値音量L1022よりも値の大きく、閾値音量L1026よりも値の小さい閾値音量L1024に閾値音量を設定する。この期間では、録音部914は、音量波形1016の音声が入力された場合に、閾値音量L1024よりも大きい音量の音声が入力される期間(t1006〜t1007)の音声を録音する。
The threshold
撮像装置900が撮像モードに設定されているときには低い閾値音量が設定されるので、ユーザ180は撮像画像を撮像しているときの音声を容易に録音することができる。また、撮像装置900が待機モードに設定されているときには高い閾値音量が設定されるので、例えばユーザ180が鳥を撮像しに山に行ったときに、自動車のエンジン音等が待機モード時に録音されることを防ぐことができる。
Since the low threshold volume is set when the
また、集音方向制御部964は、撮像部912及び録音部914の動作モードに応じて、録音部914が録音する音声を集音する方向を制御する。具体的には、撮像部912及び録音部914が撮像モードに設定されている場合には、撮像部912の撮像方向と略同一方向の音声を第1集音部966を用いて集音して、録音部914に録音させる。また、撮像部912及び録音部914が待機モードに設定されている場合には、撮像モードに設定された集音方向よりも広い方向の音声を第2集音部968を用いて集音して、録音部914に録音させる。
The sound collection
このため、撮像装置900が撮像モードに設定されている場合には、撮像対象である被写体の方向からの音声をより大きな音量で録音することができる。また、撮像装置900が待機モードに設定されている場合には、広い方向の音声を集音して録音するので、例えばユーザ180が撮像せずに遊園地で遊んでいるときには、撮像装置900の周囲の自然な音声を録音することができる。
For this reason, when the
また、閾値音量設定部920は、距離測定部970によって測定される撮像部912と被写体との距離が大きいほど、小さい閾値音量を設定する。このため、録音部914は、遠くの距離の被写体を撮像している場合でも、被写体の方向からの音声をより容易に録音することができる。
The threshold
なお、撮像部912及び録音部914が再生モードに設定されている場合には、画像を表示させる方向と略同一方向の音声を集音して録音部914に録音させてよい。このため、例えば撮像装置900で表示される撮像画像をユーザ180が参照しながら、ユーザ180が撮像画像に関するナレーション等を録音する場合に、ユーザ180のナレーションをより適切に録音することができる。
Note that when the imaging unit 912 and the
なお、撮像装置900は、動作モードが待機モード又は再生モードに設定されている場合に、ユーザ180によって撮像動作又は録音動作に関する操作がなされた場合に撮像モードに遷移する。撮像動作に関する操作は、例えば、画像を撮像する操作、シャッタスピード、焦点距離等の撮像条件を調整する操作等を含む。また、録音動作に関する操作は、例えば、音声を録音する操作、録音感度の調整等の録音条件を調整する操作等を含む。また、撮像装置900は、動作モードが待機モード又は撮像モードに設定されている場合に、ユーザ180によって撮像装置900の再生動作に関する操作がなされた場合に、再生モードに遷移する。再生動作に関する操作は、例えば、画像を再生する操作、再生する画像を選択する操作、再生速度の調節等の再生条件を調整する操作等を含む。なお、撮像装置900は、撮像装置900が撮像モード又は再生モードに設定されている場合に、ユーザによる撮像装置900の操作が所定の期間操作されなかったことを条件として、待機モードに遷移してよい。
Note that when the operation mode is set to the standby mode or the playback mode, the
図12は、撮像モードに応じて設定される閾値音量の一例を示す。撮像装置900は、撮像モードとして、接写モード、中距離撮像モード、及び遠景撮像モードを有する。本図の例において、期間(t1002〜t1005)において撮像部912及び録音部914が接写モードである撮像モードに設定されるとき、閾値音量設定部920は、中距離撮像モードの場合に設定される閾値音量L1022より小さい閾値音量L1222を設定する。このとき、閾値音量設定部920は、予め定められた1より小さい係数を閾値音量L1022に乗じて得られる音量を閾値音量L1222としてよい。
FIG. 12 shows an example of the threshold volume set according to the imaging mode. The
また、期間(t1002〜t1005)において撮像部912及び録音部914が遠景撮像モードである撮像モードに設定されるときには、閾値音量設定部920は、中距離撮像モードの場合に設定される閾値音量L1022より大きい閾値音量L1223を設定する。このとき、閾値音量設定部920は、予め定められた1より大きい係数を閾値音量L1022に乗じて得られる音量を閾値音量L1223としてよい。なお、閾値音量設定部920は、閾値音量L1024及びL1026より小さい閾値音量L1223を設定してよい。なお、閾値音量設定部920は、接写モード、遠景撮像モード等の撮像モードの他に、夜景モード、昼間撮影モード等の、様々な撮像モードに応じて閾値音量を設定してよいことは言うまでもない。
In addition, when the imaging unit 912 and the
なお、閾値音量設定部920は、撮像モードに対応付けて閾値音量を格納してよい。この場合、録音制御部922は、撮像部912の撮像モードに対応付けて閾値音量設定部920が格納している閾値音量より大きい音量の音声を録音部914に録音させてよい。以上説明したように、閾値音量設定部920は、撮像モードのそれぞれに応じた望ましい閾値音量を設定することができる。したがって、例えばユーザが小さな虫を接写モードで撮像するような場合において、小さな虫の音が録音部914によって録音され易くなる。また、ユーザが風景を撮像するような場合には、周囲の騒々しい音声が録音されにくくなる。
The threshold
図13は、撮像条件に応じて設定される閾値音量の一例を示す。本図の例において、期間(t1002〜t1005)における撮像部912の撮像条件として、フラッシュを用いて撮像する旨が設定されると、閾値音量設定部920は、閾値音量L1022より小さい閾値音量L1322を設定する。このとき、閾値音量設定部920は、予め定められた1より小さい係数を閾値音量L1022に乗じて得られる音量を閾値音量L1322としてよい。
FIG. 13 shows an example of the threshold volume set according to the imaging conditions. In the example of this figure, when the effect of imaging using a flash is set as the imaging condition of the imaging unit 912 in the period (t1002 to t1005), the threshold
また、期間(t1002〜t1005)における撮像部912の撮像条件として、絞り値を大きくして撮影する旨が設定されるとき、閾値音量設定部920は、閾値音量L1022より大きい閾値音量L1323を設定する。このとき、閾値音量設定部920は、予め定められた、絞り値の応じた1より大きい係数を閾値音量L1022に乗じて得られる音量を閾値音量L1323としてよい。なお、閾値音量設定部920は、閾値音量L1024及びL1026より小さい閾値音量L1323を設定してよい。なお、閾値音量設定部920は、フラッシュ、絞り値等の他に、様々な撮像条件に応じて閾値音量を設定してよいことは言うまでもない。
In addition, when the fact that shooting is performed with a larger aperture value is set as the imaging condition of the imaging unit 912 in the period (t1002 to t1005), the threshold
なお、閾値音量設定部920は、撮像条件の制御値に対応付けて閾値音量を格納してよい。この場合、録音制御部922は、撮像部912の撮像条件の制御値に対応付けて閾値音量設定部920が格納している閾値音量より大きい音量の音声を録音部914に録音させてよい。また、閾値音量設定部920は、撮像条件の制御値に対応付けて閾値音量L1022に乗じるべき係数を格納してよい。以上説明したように、閾値音量設定部920は、撮像条件のそれぞれに応じた望ましい閾値音量を設定することができる。例えば、夜は昼間に比べて静かな場合が多い。そして、夜にはフラッシュを用いて撮像されることが多く、昼間には夜より絞り値を大きくして撮像される場合が多い。したがって、フラッシュ撮影時には閾値音量設定部920が閾値音量を小さく設定することによって、静かな夜における撮像装置900の周囲の小さな音を録音部914に録音させ易くすることができる。なお、閾値音量設定部920は、撮像部912による撮像時刻に応じて閾値音量を設定してよい。例えば、閾値音量設定部920は、撮像時刻が昼間であると判断される場合には、撮像時刻が夜であると判断される場合より大きい閾値音量を設定してよい。その他、閾値音量設定部920は、撮像装置900の周囲の明るさを判断して、撮像装置900の周囲の明るさが予め定められた明るさより明るい場合に、撮像装置900の周囲の明るさが予め定められた明るさより暗い場合より大きい閾値音量を設定してよい。
The threshold
なお、図11から図13にかけて、動作モード、撮像モード、撮像条件、撮像環境等に応じて閾値音量を設定することによって、録音部914が録音すべき音声を決定する例について説明した。このような閾値音量による決定方法の他に、音声集音部980における集音感度を動作モード、撮像モード、撮像条件、撮像環境等に応じて設定することによって、録音部914が録音すべき音声を決定することできる。例えば図11から図13の説明において閾値音量を大きく設定するケースにおいては音声集音部980の集音感度を小さくし、閾値音量を小さく設定するケースにおいては音声集音部980の集音感度を大きくすることによって、動作モード、撮像モード、撮像条件、撮像環境等に応じた音声を録音部914に録音させることができる。
11 to 13, the example in which the
図14は、第1実施形態の撮像装置100及び再生装置140、並びに第2実施形態の撮像装置900に係るコンピュータ1500のハードウェア構成の一例を示す。コンピュータ1500は、ホスト・コントローラ1582により相互に接続されるCPU1505、RAM1520、グラフィック・コントローラ1575、及び表示装置1580を有するCPU周辺部と、入出力コントローラ1584によりホスト・コントローラ1582に接続される通信インターフェイス1530、ハードディスクドライブ1540、及びCD−ROMドライブ1560を有する入出力部と、入出力コントローラ1584に接続されるROM1510、フレキシブルディスク・ドライブ1550、及び入出力チップ1570を有するレガシー入出力部とを備える。
FIG. 14 illustrates an example of a hardware configuration of a
ホスト・コントローラ1582は、RAM1520と、高い転送レートでRAM1520をアクセスするCPU1505、及びグラフィック・コントローラ1575とを接続する。CPU1505は、ROM1510、及びRAM1520に格納されたプログラムに基づいて動作し、各部の制御を行う。グラフィック・コントローラ1575は、CPU1505等がRAM1520内に設けたフレーム・バッファ上に生成する画像データを取得し、表示装置1580上に表示させる。これに代えて、グラフィック・コントローラ1575は、CPU1505等が生成する画像データを格納するフレーム・バッファを、内部に含んでもよい。
The
入出力コントローラ1584は、ホスト・コントローラ1582と、比較的高速な入出力装置であるハードディスクドライブ1540、通信インターフェイス1530、CD−ROMドライブ1560を接続する。ハードディスクドライブ1540は、コンピュータ1500内のCPU1505が使用するプログラム、及びデータを格納する。通信インターフェイス1530は、ネットワークを介して撮像装置100、再生装置140、又は撮像装置900と通信し、撮像装置100、再生装置140、又は撮像装置900にプログラム、及びデータを提供する。CD−ROMドライブ1560は、CD−ROM1595からプログラムまたはデータを読み取り、RAM1520を介してハードディスクドライブ1540、及び通信インターフェイス1530に提供する。
The input /
また、入出力コントローラ1584には、ROM1510と、フレキシブルディスク・ドライブ1550、及び入出力チップ1570の比較的低速な入出力装置とが接続される。ROM1510は、コンピュータ1500が起動時に実行するブート・プログラムや、コンピュータ1500のハードウェアに依存するプログラム等を格納する。フレキシブルディスク・ドライブ1550は、フレキシブルディスク1590からプログラムまたはデータを読み取り、RAM1520を介してハードディスクドライブ1540、及び通信インターフェイス1530に提供する。入出力チップ1570は、フレキシブルディスク・ドライブ1550や、例えばパラレル・ポート、シリアル・ポート、キーボード・ポート、マウス・ポート等を介して各種の入出力装置を接続する。
The input /
RAM1520を介して通信インターフェイス1530に提供されるプログラムは、フレキシブルディスク1590、CD−ROM1595、またはICカード等の記録媒体に格納されて利用者によって提供される。プログラムは、記録媒体から読み出され、RAM1520を介して通信インターフェイス1530に提供され、ネットワークを介して撮像装置100、再生装置140、又は撮像装置900に送信される。撮像装置100、再生装置140、又は撮像装置900に送信されたプログラムは、撮像装置100、再生装置140、又は撮像装置900においてインストールされて実行される。
A program provided to the
撮像装置100にインストールされて実行されるプログラムは、撮像装置100を、図1、図2、及び図4から図7において説明した撮像装置100として機能させる。また、再生装置140にインストールされて実行されるプログラムは、再生装置140を、図1、図3、図8、及び図9において説明した再生装置140として機能させる。また、撮像装置900にインストールされて実行されるプログラムは、撮像装置900を、図10から図13において説明した撮像装置900として機能させる。
A program installed and executed in the
以上に示したプログラムは、外部の記憶媒体に格納されてもよい。記憶媒体としては、フレキシブルディスク1590、CD−ROM1595の他に、DVDやPD等の光学記録媒体、MD等の光磁気記録媒体、テープ媒体、ICカード等の半導体メモリ等を用いることができる。また、専用通信ネットワークやインターネットに接続されたサーバシステムに設けたハードディスクまたはRAM等の記憶装置を記録媒体として使用し、ネットワークを介してプログラムをコンピュータ1500に提供してもよい。
The program shown above may be stored in an external storage medium. As the storage medium, in addition to the
以上、実施形態を用いて本発明を説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。上記実施形態に、多様な変更又は改良を加えることができる。そのような変更又は改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。 As mentioned above, although this invention was demonstrated using embodiment, the technical scope of this invention is not limited to the range as described in the said embodiment. Various modifications or improvements can be added to the above embodiment. It is apparent from the scope of the claims that the embodiments added with such changes or improvements can be included in the technical scope of the present invention.
100 撮像装置
102 マイクロホン
140 再生装置
150 通信回線
180 ユーザ
212 撮像部
214 録音部
216 音声格納部
218 音声抽出部
220 閾値音量設定部
222 閾値音量格納部
232 データ格納部
234 データ出力部
242 可変フィルタ部
244 帯域制御部
246 環境情報格納部
248 位置検出部
250 時刻検出部
252 環境特定部
312 指示受付部
316 音声格納部
318 音声抽出部
320 撮像画像格納部
322 閾値音量格納部
324 閾値音量設定部
332 データ格納部
334 データ出力部
360 時刻検出部
362 許容時間制御部
364 許容時間格納部
900 撮像装置
910 録音音量設定部
912 撮像部
914 録音部
916 音声格納部
920 閾値音量設定部
922 録音制御部
962 モード設定部
964 集音方向制御部
966 第1集音部
968 第2集音部
970 距離測定部
980 音声集音部
100
Claims (18)
前記撮像部の周囲の音声を録音する録音部と、
設定された閾値音量を格納する閾値音量格納部と、
前記録音部が録音した音声のうちで、前記閾値音量格納部が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出部と、
前記撮像部が撮像した撮像画像と、前記音声抽出部が抽出した音声とを対応づけて格納するデータ格納部と、
前記データ格納部が対応づけて格納している撮像画像と音声とを同期させて出力するデータ出力部と
を備える撮像装置。 An imaging unit for imaging a subject;
A recording unit for recording sound around the imaging unit;
A threshold volume storage section for storing the set threshold volume;
Among the voices recorded by the recording unit, a voice extraction unit that extracts voices of a part of a period including voices with a volume larger than the threshold volume stored in the threshold volume storage unit;
A data storage unit that stores the captured image captured by the imaging unit and the audio extracted by the audio extraction unit in association with each other;
An image pickup apparatus comprising: a data output unit that outputs a captured image and sound that are stored in association with each other in the data storage unit.
請求項1に記載の撮像装置。 The data storage unit stores each of the plurality of captured images captured by the imaging unit and each of the plurality of sounds extracted by the sound extraction unit in association with each other in the order of imaging and recording. The imaging device described.
をさらに備える請求項1に記載の撮像装置。 The total of a plurality of sound periods extracted by the sound extraction unit is equal to a period obtained by multiplying the number of the plurality of picked-up images picked up by the image pickup unit by a reproduction time of a predetermined picked-up image. The imaging apparatus according to claim 1, further comprising a threshold volume setting unit that sets a threshold volume stored in the threshold volume storage unit.
前記音声格納部が格納している音声の音量分布に基づいて、前記閾値音量格納部が格納している閾値音量を設定する閾値音量設定部と
をさらに備える
請求項1に記載の撮像装置。 A voice storage unit for storing the voice recorded by the recording unit;
The imaging apparatus according to claim 1, further comprising: a threshold volume setting unit configured to set a threshold volume stored in the threshold volume storage unit based on a volume distribution of audio stored in the audio storage unit.
請求項4に記載の撮像装置。 The threshold sound volume setting unit sets the threshold sound volume stored in the threshold sound volume storage unit larger when the average value of the sound volume stored in the sound storage unit is larger. Imaging device.
前記音声抽出部は、前記録音部が録音した音声の音量を周波数帯域毎に、前記閾値音量格納部が格納している帯域別閾値音量と比較し、特定の周波数帯域において帯域別閾値音量より大きい音量が含まれる一部の期間の音声を抽出する
請求項1に記載の撮像装置。 The threshold volume storage unit stores a threshold volume for each band in association with each of a plurality of frequency bands,
The voice extraction unit compares the volume of the voice recorded by the recording unit for each frequency band with the threshold volume for each band stored in the threshold volume storage unit, and is larger than the threshold volume for each band in a specific frequency band. The imaging apparatus according to claim 1, wherein a sound of a part of a period including a volume is extracted.
設定された帯域周波数の音声を透過させる可変フィルタ部と、
前記環境特定部が特定した環境に応じて、前記可変フィルタ部が透過させる音声の帯域周波数を設定する帯域制御部と
をさらに備え、
前記録音部は、前記フィルタ部が透過させた音声を録音する
請求項1に記載の撮像装置。 An environment identification unit that identifies the environment around the imaging device;
A variable filter that transmits sound of a set band frequency; and
According to the environment specified by the environment specifying unit, further comprising a band control unit for setting a band frequency of the sound transmitted by the variable filter unit,
The imaging device according to claim 1, wherein the recording unit records the sound transmitted through the filter unit.
位置を示す情報に対応づけて、環境を示す情報を格納する環境情報格納部と
をさらに備え、
前記環境特定部は、前記位置検出部が検出した位置に基づいて前記環境情報格納部を検索し、当該撮像装置の周囲の環境を特定する
請求項7に記載の撮像装置。 A position detector for detecting the position of the imaging device;
An environment information storage unit that stores information indicating the environment in association with the information indicating the position;
The imaging apparatus according to claim 7, wherein the environment identification unit searches the environment information storage unit based on the position detected by the position detection unit, and identifies an environment around the imaging apparatus.
時刻を示す情報に対応づけて、環境を示す情報を格納する環境情報格納部と
をさらに備え、
前記環境特定部は、前記時刻検出部が検出した時刻に基づいて前記環境情報格納部を検索し、当該撮像装置の周囲の環境を特定する
請求項7に記載の撮像装置。 A time detection unit for detecting time;
An environment information storage unit that stores information indicating the environment in association with the information indicating the time;
The imaging device according to claim 7, wherein the environment identification unit searches the environment information storage unit based on the time detected by the time detection unit, and identifies an environment around the imaging device.
前記撮像部の周囲の音声を録音する録音段階と、
設定された閾値音量を格納する閾値音量格納段階と、
前記録音段階において録音された音声のうちで、前記閾値音量格納段階において格納される閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出段階と、
前記撮像部が撮像した撮像画像と、前記音声抽出段階で抽出された音声とを対応づけて格納するデータ格納段階と、
前記データ格納段階において対応づけて格納される撮像画像と音声とを同期させて出力するデータ出力段階と
を備える撮像方法。 Imaging a subject using an imaging unit;
A recording stage for recording sound around the imaging unit;
A threshold volume storage stage for storing a set threshold volume;
A voice extraction step for extracting a portion of the voice that includes a volume of sound that is larger than the threshold volume stored in the threshold volume storage step among the voices recorded in the recording stage;
A data storage stage for storing the captured image captured by the imaging unit and the voice extracted in the voice extraction stage in association with each other;
An image pickup method comprising: a data output step of synchronizing and outputting a picked-up image and sound stored in association with each other in the data storage step.
被写体を撮像する撮像部、
前記撮像部の周囲の音声を録音する録音部、
設定された閾値音量を格納する閾値音量格納部、
前記録音部が録音した音声のうちで、前記閾値音量格納部が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出部、
前記撮像部が撮像した撮像画像と、前記音声抽出部が抽出した音声とを対応づけて格納するデータ格納部、
前記データ格納部が対応づけて格納している撮像画像と音声とを同期させて出力するデータ出力部
として機能させるプログラム。 A program for an imaging device that captures an image, the imaging device capturing an image of a subject,
A recording unit for recording sound around the imaging unit;
A threshold volume storage for storing the set threshold volume;
Among the voices recorded by the recording unit, a voice extraction unit that extracts voices of a part of a period including voices having a volume larger than the threshold volume stored in the threshold volume storage unit,
A data storage unit that stores the captured image captured by the imaging unit and the audio extracted by the audio extraction unit in association with each other;
A program that functions as a data output unit that outputs a captured image and sound that are stored in association with each other in the data storage unit.
前記撮像装置によって録音された音声を格納する音声格納部と、
閾値音量を格納する閾値音量格納部と、
前記音声格納部が格納する音声のうちで、前記閾値音量格納部が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出部と、
前記撮像画像格納部が格納している撮像画像と、前記音声抽出部が抽出した音声とを対応づけて格納するデータ格納部と、
前記データ格納部が対応づけて格納している撮像画像と音声とを同期させて出力するデータ出力部と
を備える再生装置。 A captured image storage unit that stores a captured image captured by the imaging device;
An audio storage unit for storing audio recorded by the imaging device;
A threshold volume storage for storing the threshold volume;
A voice extraction unit that extracts a voice of a part of a period including a voice having a volume larger than the threshold volume stored in the threshold volume storage unit among the voices stored in the voice storage unit;
A data storage unit that stores the captured image stored in the captured image storage unit in association with the audio extracted by the audio extraction unit;
A playback apparatus comprising: a data output unit that synchronizes and outputs captured images and audio stored in association with each other in the data storage unit.
をさらに備え、
前記撮像画像格納部は、前記撮像装置によって撮像された時刻に対応づけて撮像画像を格納し、
前記音声格納部は、前記撮像装置によって録音された時刻に対応づけて音声を格納し、
前記音声抽出部は、前記撮像画像格納部が格納している撮像画像が撮像された時刻から、前記許容時間格納部が格納している許容時間の範囲内の時刻に録音された音声のうちで、前記閾値音量格納部が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する
請求項12に記載の再生装置。 It further includes an allowable time storage unit for storing the set allowable time,
The captured image storage unit stores the captured image in association with the time of image capturing by the imaging device,
The audio storage unit stores audio in association with the time recorded by the imaging device,
The voice extraction unit includes voices recorded at a time within a range of an allowable time stored in the allowable time storage unit from a time when the captured image stored in the captured image storage unit is captured. The playback apparatus according to claim 12, wherein a sound of a part of a period in which a sound having a volume larger than the threshold sound volume stored in the threshold sound volume storage unit is included is extracted.
前記指示受付部が指示を受け付けたときの時刻を検出する時刻検出部と、
前記撮像画像格納部が格納している撮像画像が撮像された時刻と、前記時刻検出部が検出した時刻との差が大きいほど、前記許容時間格納部が格納している許容時間を長く設定する許容時間制御部
をさらに備える請求項13に記載の再生装置。 An instruction receiving unit for receiving an instruction to reproduce the captured image stored in the captured image storage unit;
A time detection unit for detecting a time when the instruction receiving unit receives an instruction;
The allowable time stored in the allowable time storage unit is set longer as the difference between the time when the captured image stored in the captured image storage unit is captured and the time detected by the time detection unit is larger. The playback device according to claim 13, further comprising an allowable time control unit.
をさらに備える
請求項12に記載の再生装置。 The playback apparatus according to claim 12, further comprising a threshold volume setting unit that sets a threshold volume stored in the threshold volume storage unit based on a volume distribution of audio stored in the audio storage unit.
請求項15に記載の再生装置。 The threshold sound volume setting unit sets the threshold sound volume stored in the threshold sound volume storage unit larger when an average value of sound volume stored in the sound storage unit is larger. Playback device.
前記撮像装置によって録音された音声を格納する音声格納段階と、
閾値音量を格納する閾値音量格納段階と、
前記音声格納段階において格納される音声のうちで、前記閾値音量格納段階において格納される閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出段階と、
前記撮像画像格納段階において格納される撮像画像と、前記音声抽出段階において抽出される音声とを対応づけて格納するデータ格納段階と、
前記データ格納段階において対応づけて格納される撮像画像と音声とを同期させて出力するデータ出力部と
を備える再生方法。 A captured image storage stage for storing a captured image captured by the imaging device;
A voice storage step for storing voice recorded by the imaging device;
A threshold volume storage stage for storing the threshold volume;
A voice extraction stage for extracting a voice of a part of a period including a voice having a volume larger than the threshold volume stored in the threshold volume storage stage among the voices stored in the voice storage stage;
A data storage stage for storing the captured image stored in the captured image storage stage and the voice extracted in the voice extraction stage in association with each other;
A reproduction method comprising: a data output unit that outputs a captured image and sound that are stored in association with each other in the data storage step.
撮像装置によって撮像された撮像画像を格納する撮像画像格納部、
前記撮像装置によって録音された音声を格納する音声格納部、
閾値音量を格納する閾値音量格納部、
前記音声格納部が格納している音声のうちで、前記閾値音量格納部が格納している閾値音量より大きい音量の音声が含まれる一部の期間の音声を抽出する音声抽出部、
前記撮像画像格納部が格納している撮像画像と、前記音声抽出部が抽出した音声とを対応づけて格納するデータ格納部、
前記データ格納部が対応づけて格納している撮像画像と音声とを同期させて出力するデータ出力部
として機能させるプログラム。
A program for a playback device that plays back an image, the captured image storage unit storing the captured image captured by the imaging device.
An audio storage unit for storing audio recorded by the imaging device;
A threshold volume storage for storing the threshold volume;
A voice extraction unit that extracts a voice of a part of a period in which a voice having a volume larger than the threshold volume stored in the threshold volume storage unit is included among the voices stored in the voice storage unit;
A data storage unit that stores the captured image stored in the captured image storage unit in association with the voice extracted by the voice extraction unit;
A program that functions as a data output unit that outputs a captured image and sound that are stored in association with each other in the data storage unit.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005341031A JP2006203860A (en) | 2004-12-24 | 2005-11-25 | Imaging apparatus, imaging method, reproducing apparatus, reproducing method and program |
US11/303,923 US7668455B2 (en) | 2004-12-20 | 2005-12-19 | Image capturing apparatus, image capturing method, reproducing apparatus, reproducing method and program |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004374691 | 2004-12-24 | ||
JP2005341031A JP2006203860A (en) | 2004-12-24 | 2005-11-25 | Imaging apparatus, imaging method, reproducing apparatus, reproducing method and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006203860A true JP2006203860A (en) | 2006-08-03 |
Family
ID=36961414
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005341031A Pending JP2006203860A (en) | 2004-12-20 | 2005-11-25 | Imaging apparatus, imaging method, reproducing apparatus, reproducing method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006203860A (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008271082A (en) * | 2007-04-19 | 2008-11-06 | Casio Comput Co Ltd | Apparatus for recording images with sound data, and program |
JP2009141942A (en) * | 2007-11-14 | 2009-06-25 | Canon Inc | Information processing apparatus, information processing method, and computer-readable storage medium |
JP2010528546A (en) * | 2007-05-29 | 2010-08-19 | トムソン ライセンシング | Panorama sound image generation and reproduction method and panoramic sound image reproduction apparatus |
JP2011120306A (en) * | 2011-03-11 | 2011-06-16 | Casio Computer Co Ltd | Imaging apparatus, imaging method and program |
US8218026B2 (en) | 2008-05-22 | 2012-07-10 | Fujifilm Corporation | Imaging apparatus, imaging method, reproducing apparatus and reproducing method, and recording medium for associating sound data with image data |
US8411166B2 (en) | 2009-03-18 | 2013-04-02 | Casio Computer Co., Ltd. | Digital camera for recording still image with speech |
-
2005
- 2005-11-25 JP JP2005341031A patent/JP2006203860A/en active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008271082A (en) * | 2007-04-19 | 2008-11-06 | Casio Comput Co Ltd | Apparatus for recording images with sound data, and program |
JP2010528546A (en) * | 2007-05-29 | 2010-08-19 | トムソン ライセンシング | Panorama sound image generation and reproduction method and panoramic sound image reproduction apparatus |
JP2009141942A (en) * | 2007-11-14 | 2009-06-25 | Canon Inc | Information processing apparatus, information processing method, and computer-readable storage medium |
US8218026B2 (en) | 2008-05-22 | 2012-07-10 | Fujifilm Corporation | Imaging apparatus, imaging method, reproducing apparatus and reproducing method, and recording medium for associating sound data with image data |
US8411166B2 (en) | 2009-03-18 | 2013-04-02 | Casio Computer Co., Ltd. | Digital camera for recording still image with speech |
JP2011120306A (en) * | 2011-03-11 | 2011-06-16 | Casio Computer Co Ltd | Imaging apparatus, imaging method and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7668455B2 (en) | Image capturing apparatus, image capturing method, reproducing apparatus, reproducing method and program | |
US10367997B2 (en) | Enriched digital photographs | |
JP2006238220A (en) | Imaging apparatus, imaging method, and program | |
WO2012027186A1 (en) | Audio processing based on scene type | |
JP2006203860A (en) | Imaging apparatus, imaging method, reproducing apparatus, reproducing method and program | |
JP5155092B2 (en) | Camera, playback device, and playback method | |
JP2012100216A (en) | Camera and moving image capturing program | |
JP2014086849A (en) | Content acquisition device and program | |
JP2008236644A (en) | Photographing device and image reproduction device | |
JP2006203867A (en) | Imaging apparatus, imaging method, and program | |
JP2014122978A (en) | Imaging device, voice recognition method, and program | |
KR20140072785A (en) | Video processing apparatus and method | |
JP6229356B2 (en) | Imaging apparatus, imaging method, and program | |
JP4741362B2 (en) | Output device, output method, and program | |
JP2004221666A (en) | Imaging recording apparatus | |
JP4922445B2 (en) | System, method, apparatus and program | |
JP2005006059A (en) | Dynamic image processor and its program | |
JP2010130403A (en) | Video control device, imaging apparatus and display apparatus which are provided with same | |
CN113992836A (en) | Volume adjusting method and device for zoom video and video shooting equipment | |
JP2006238219A (en) | Output device, output method, and program | |
JP6340785B2 (en) | Movie processing apparatus, movie processing method, and program | |
JP2011019000A (en) | Information processor, sound selection method, and sound selection program | |
US10102880B2 (en) | Information processing device, shooting apparatus and information processing method | |
JP2006238357A (en) | Output device, output method, program, and voice providing system | |
JP2008278315A (en) | Imaging apparatus and program thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20061212 |