JP2009065587A - 音声記録装置及び音声再生装置 - Google Patents

音声記録装置及び音声再生装置 Download PDF

Info

Publication number
JP2009065587A
JP2009065587A JP2007233675A JP2007233675A JP2009065587A JP 2009065587 A JP2009065587 A JP 2009065587A JP 2007233675 A JP2007233675 A JP 2007233675A JP 2007233675 A JP2007233675 A JP 2007233675A JP 2009065587 A JP2009065587 A JP 2009065587A
Authority
JP
Japan
Prior art keywords
audio
image
unit
voice
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007233675A
Other languages
English (en)
Inventor
Masahiro Yoshida
昌弘 吉田
Tomoki Oku
智岐 奥
Makoto Yamanaka
誠 山中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2007233675A priority Critical patent/JP2009065587A/ja
Priority to US12/202,855 priority patent/US8218033B2/en
Publication of JP2009065587A publication Critical patent/JP2009065587A/ja
Priority to US13/487,953 priority patent/US20130021502A1/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)

Abstract

【課題】画像中の特定物を検出可能な音声記録装置において、特定物の大きさに基づいて音声処理を行い、撮影者の画像撮影の意図に応じた音声とする。
【解決手段】特定物を検出可能な音声記録装置100において、画像中のその特定物の大きさすなわち音声記録装置100からその特定物までの距離に応じた角度にマイクの指向角(正面指向性)θ2の変化、音声信号の特定の帯域の強調等の音声処理を行う。
【選択図】図13

Description

音声及び映像の記録が可能な音声記録装置及び音声及び映像の出力が可能な音声再生装置に関し、特に映像に基づいて記録又は出力する音声を処理する音声記録装置及び音声再生装置に関する。
現在、映像とともに音声の記録が可能な音声記録装置であるビデオカメラが一般に広く普及している。このようなビデオカメラにおいては画質、音質の向上が図られており、例えば特許文献1では、レンズのズーム倍率の変化に合わせてマイクロホンから収録する音の音量や周波数特性を補正して、映像と音声の一体感を増すようにする方法が提案されている。
特開2000−278581号公報
ビデオカメラで特定の被写体、例えば人物を撮影する場合の撮影者の撮影の意図は、多くの場合、ズーム倍率と画面中に占めるその被写体である人物の大きさに反映されている。
画面中に占める人物の顔が大きい場合は、撮影者は対象となる人物を特に重視していると考えられる。そのため、画像とともに収録される音声は人間の声の帯域を強調した物とすることが好ましい。逆に、画面中に占める人物の顔の大きさが小さい場合は、撮影者は人物のみならず周りの雰囲気をも重視して撮影していると考えられる。そのため、画像とともに収録される音声を、人間の声の帯域だけを強調したものとしたのでは周りの雰囲気を削ぐこととなり好ましくない。
しかし、特許文献1で開示されたビデオカメラでは、人物のような特定の被写体の大きさや有無に関わらずレンズのズーム倍率のみに基づいて、マイクロホンから収録する音声を補正するため、必ずしも上述のような撮影者の意図に沿った音声の補正がなされるとは限らない。
そこで本発明は、音声の補正を、画面中の特定の被写体の大きさ、又は音声の補正を画面中の特定の被写体の大きさとズーム倍率とを関連づけたものに基づいて行い、撮影者の画像の撮影の意図に沿うような音声の補正を施すことができる音声記録装置を提供することを目的とする。更に、画像とともに再生する音声を撮影者の画像の撮影の意図に沿うようなものとすることができる音声再生装置を提供することを目的とする。
上記目的を達成するために、本発明の音声記録装置は、レンズ部を通じて被写体が含まれる撮像画像を取得する撮像部と、音声を取得する音声取得部と、前記撮像画像中から前記被写体の特定部分を検出する特定部分検出部とを備える音声記録装置において、前記特定部分検出部で検出された前記特定部分の前記撮像画像中での大きさに基づいて、前記音声取得部で取得する音声に対して音声処理を施すことを特徴とする。
又、前記レンズ部のズーム倍率が変更可能であり、前記特定部分の前記撮像画像中での大きさ及び前記ズーム倍率に基づいて、前記音声取得部で取得する音声に対して音声処理を施すものとしても構わない。
又、前記レンズ部の合焦距離が変更可能であり、前記特定部分の前記撮像画像中での大きさ及び前記合焦距離に基づいて、前記音声取得部で取得する音声に対して音声処理を施すものとしても構わない。
又、前記音声処理が、前記音声取得部の指向特性の調整、前記音声の信号レベルの調整及び前記音声の特定の帯域レベルの調整のうち少なくとも一つであるものとしても構わない。
又、前記特定部分を有する被写体が、音を発する物体であるものとしても構わない。
又、前記特定部分が、人物の顔であるものとしても構わない。
又、本発明の音声再生装置は、被写体を含む画像および音声を再生可能な音声再生装置において、前記画像中から前記被写体の特定部分を検出する特定部分検出部を備え、前記特定部分検出部で検出された前記特定部分の前記画像中での大きさに基づいて、前記音声に対して音声処理を施して再生することを特徴とする。
又、本発明の音声再生装置は、レンズ部を通じて被写体が含まれる撮像画像を取得する撮像部と、音声を取得する音声取得部と、前記レンズ部のズーム倍率及び合焦距離が変更可能であり、前記ズーム倍率情報及び前記合焦距離情報の少なくとも一方を、前記撮像画像及び前記音声とともに記録する記録部と、を備えた音声記録装置によって記録された前記撮像画像及び前記音声を再生可能な音声再生装置であって、前記撮像画像中から前記被写体の特定部分を検出する特定部分検出部を備え、前記特定部分検出部で検出された前記特定部分の前記撮像画像中での大きさ及び前記レンズ部のズーム倍率情報又は前記合焦距離情報に基づいて、再生する前記音声に対して音声処理を施すことを特徴とする。
本発明によると、例えば被写体の特定部分として人物の顔を検出し、その顔の画像中での大きさに基づいて、又はその顔の画像中での大きさ及びレンズ部のズーム倍率情報又は合焦距離情報に基づいて音声を処理する。そのため、音声記録装置において、撮影者の画像の撮影の意図に沿うような音声の補正を施すことができる。
又、本発明によると、画像中の人物の顔を検出し、その顔の画像中での大きさに基づいて、又はその顔の画像中での大きさ及び画像とともに記録されたレンズ部のズーム倍率情報又は合焦距離情報に基づいて音声を処理する。そのため、音声再生装置において、撮影者の画像の撮影の意図に沿うような音声の補正を施すことができる。
〈第1の実施形態〉
本発明の第1の実施の形態について、図面を参照して説明する。尚、以下では、本発明における撮影方法を行うデジタルカメラやデジタルビデオなどの、音声及び映像の記録が可能な音声記録装置を例に挙げて説明する。音声記録装置は動画を撮影できるものであれば、静止画の撮影が可能なものであっても構わない。
(音声記録装置の構成)
まず、音声記録装置の内部構成について、図面を参照して説明する。図1は、第1の実施形態に係る音声記録装置の内部構成を示すブロック図である。
図1の音声記録装置は、入射される光を電気信号に変換するCCD又はCMOSセンサなどの固体撮像素子(イメージセンサ)1と、被写体の光学像をイメージセンサ1に結像させるズームレンズとズームレンズの焦点距離すなわち光学ズーム倍率を変化させるモータとズームレンズの焦点を被写体に合わせるためのモータとを有するレンズ部2と、イメージセンサ1から出力されるアナログ信号である画像信号をデジタル信号に変換するAFE(Analog Front End)3と、音声記録装置の前方の左右方向から入力された音声を独立して電気信号に変換するステレオマイク4と、AFE3からのデジタル信号となる画像信号に対して、階調補正等の各種画像処理を施す画像処理部5と、ステレオマイク4からのアナログ信号である音声信号をデジタル信号に変換する音声処理部6と、静止画を撮影する場合は画像処理部5からの画像信号に対してJPEG(Joint Photographic Experts Group)圧縮方式など、動画を撮影する場合は画像処理部5からの画像信号と音声処理部6からの音声信号とに対してMPEG(Moving Picture Experts Group)圧縮方式などの圧縮符号化処理を施す圧縮処理部7と、圧縮処理部7で圧縮符号化された圧縮符号化信号をSDカードなどの外部メモリ22に記録するドライバ部8と、ドライバ部8で外部メモリ22から読み出した圧縮符号化信号を伸長して復号する伸長処理部9と、伸長処理部9で復号されて得られた画像信号をアナログ信号に変換するビデオ出力回路部10と、ビデオ出力回路部10で変換された信号を出力するビデオ出力端子11と、ビデオ出力回路部10からの信号に基づく画像の表示を行うLCD等を有するディスプレイ部12と、伸長処理部9からの音声信号をアナログ信号に変換する音声出力回路部13と、音声出力回路部13で変換された信号を出力する音声出力端子14と、音声出力回路部13からの音声信号に基づいて音声を再生出力するスピーカ部15と、各ブロックの動作タイミングを一致させるためのタイミング制御信号を出力するタイミングジェネレータ(TG)16と、音声記録装置内全体の駆動動作を制御するCPU(Central Processing Unit)17と、各動作のための各プログラムを記憶するとともにプログラム実行時のデータの一時保管を行うメモリ18と、静止画撮影用のシャッターボタンを含むユーザからの指示が入力される操作部19と、CPU17と各ブロックとの間でデータのやりとりを行うためのバス回線20と、メモリ18と各ブロックとの間でデータのやりとりを行うためのバス回線21と、を備える。レンズ部2は、画像処理部5で検出した画像信号に応じてCPU17が、モータを駆動して焦点、絞りの制御を行うものである。
(音声記録装置の基本動作 静止画撮影時)
次に、この音声記録装置の静止画撮影時の基本動作について図2のフローチャートを用いて説明する。まず、ユーザが音声記録装置を静止画撮影用に設定して電源をONにすると(STEP201)、音声記録装置の駆動モードつまりイメージセンサ1の駆動モードがプレビューモードに設定される(STEP202)。プレビューモードとは、撮影対象となる画像を記録することなくディスプレイ部12に表示するモードであり、撮影対象を定め、構図を決定するために用いることができる。続いて撮影モードの入力待ち状態となり、人物撮影に適したモードや移動物の撮影に適したモード、逆光での撮影に適したモード等、音声記録装置の機能に応じたモードが選択される。撮影モードが入力されない場合は通常撮影用のモードが選択されたものとする(STEP203)。プレビューモードでは、イメージセンサ1の光電変換動作によって得られたアナログ信号である画像信号がAFE3においてデジタル信号に変換されて、画像処理部5で画像処理が施され、圧縮処理部7で圧縮された現時点の画像に対する画像信号が外部メモリ22に一時的に記録される。この圧縮信号は、ドライバ部8を経て、伸長処理部9で伸長され、現時点で設定されているレンズ部2のズーム倍率での画角の画像がディスプレイ部12に表示される。
続いてユーザが、撮影の対象とする被写体に対して所望の画角となるように、光学ズームでのズーム倍率を設定する(STEP204)。その際、画像処理部5に入力された画像信号を基にCPU17によってレンズ部2を制御して、最適な露光制御(Automatic Exposure;AE)・焦点合わせ制御(オートフォーカス、Auto Focus;AF)が行われる(STEP205)。ユーザが撮影画角、構図を決定し、操作部19のシャッターボタンを半押しすると(STEP206)、AEの調整を行い(STEP207)、AFの最適化処理を行う(STEP208)。
その後、シャッターボタンが全押しされると(STEP209)、TG16より、イメージセンサ1、AFE3、画像処理部5及び圧縮処理部7それぞれに対してタイミング制御信号が与えられ、各部の動作タイミングを同期させ、イメージセンサ1の駆動モードを静止画撮影モードに設定し(STEP210)、イメージセンサ1から出力されるアナログ信号である画像信号(生データ)をAFE3でデジタル信号に変換して一旦画像処理部5内のフレームメモリに書き込む(STEP211)。このデジタル信号がこのフレームメモリから読み込まれ、画像処理部5において輝度信号及び色差信号の生成を行う信号変換処理などの各種画像処理が施され、画像処理が施された信号が圧縮処理部7においてJPEG(Joint Photographic Experts Group)形式に圧縮された(STEP212)後、外部メモリ22に圧縮画像を書き込み(STEP213)、撮影を完了する。その後、プレビューモードに戻る(STEP202)。
(音声記録装置の基本動作 動画撮影、再生時)
次に、この音声記録装置の動画撮影時の基本動作について図3のフローチャートを用いて説明する。まず、ユーザが音声記録装置を静止画撮影用に設定して電源をONにすると(STEP301)、音声記録装置の駆動モードつまりイメージセンサ1の駆動モードがプレビューモードに設定される(STEP302)。続いて撮影モードの入力待ち状態となる。撮影モードが入力されない場合は通常撮影用のモードが選択されたものとする(STEP303)。プレビューモードでは、イメージセンサ1の光電変換動作によって得られたアナログ信号である画像信号がAFE3においてデジタル信号に変換されて、画像処理部5で画像処理が施され、圧縮処理部7で圧縮された現時点の画像に対する画像信号が外部メモリ22に一時的に記録される。この圧縮信号は、ドライバ部8を経て、伸長処理部9で伸長され、現時点で設定されているレンズ部2のズーム倍率での画角の画像がディスプレイ部12に表示される。
続いてユーザが、撮影の対象とする被写体に対して所望の画角となるように、光学ズームでのズーム倍率を設定する(STEP304)。その際、画像処理部5に入力された画像信号を基にCPU17によってレンズ部2を制御して、最適な露光制御(Automatic Exposure;AE)・焦点合わせ制御(オートフォーカス、Auto Focus;AF)が行われる(STEP305)。
その後、操作部19の録画開始ボタン(シャッターボタン兼用でも構わない)が全押しされ、撮像動作を行うことが指示されると(STEP306)、音声補正制御が行われる(STEP307)。この音声補正制御については後述する。続いてイメージセンサ1の光電変換動作によって得られたアナログ信号である画像信号がAFE3に出力される。このとき、イメージセンサ1では、TG16からのタイミング制御信号が与えられることによって、水平走査及び垂直走査が行われて、画素毎のデータとなる画像信号が出力される。そして、AFE3において、アナログ信号である画像信号(生データ)がデジタル信号に変換されて、画像処理部5内のフレームメモリに書き込む(STEP308)。
画像処理部5では輝度信号及び色差信号の生成を行う信号変換処理などの各種画像処理が施され、その画像処理が施された画像信号が圧縮処理部7に与えられる。このとき、ステレオマイク4に音声入力されることで得られたアナログ信号である音声信号が、音声処理部6でデジタル信号に変換されて、圧縮処理部7に与えられる。これにより、圧縮処理部7では、デジタル信号である画像信号及び音声信号に対して、MPEG圧縮符号方式に基づいて、圧縮符号化し(STEP309)、ドライバ部8に与えて、外部メモリ22に記録させる(STEP310)。画像信号及び音声補正制御を施した音声信号と共に、音声補正制御を施していない音声信号とインデックスとしてその信号を取得した時点のズーム倍率情報も記録してもよい。又、このとき、外部メモリ22に記録された圧縮信号がドライバ部8によって読み出されて伸長処理部9に与えられて、伸長処理が施されて画像信号が得られる。この画像信号がディスプレイ部12に与えられて、現在、イメージセンサ1を通じて撮影されている被写体画像が表示される。その後、再び操作部19の録画開始ボタンが全押しされるとプレビューモードに戻る(STEP302)。
このように撮像動作を行うとき、TG16によって、AFE3、画像処理部5、音声処理部6、圧縮処理部7、及び伸長処理部9に対してタイミング制御信号が与えられ、イメージセンサ1による1フレームごとの撮像動作に同期した動作が行われる。
又、外部メモリ22に記録された動画を再生することが、操作部19を通じて指示されると、外部メモリ22に記録された圧縮信号は、ドライバ部8によって読み出されて伸長処理部9に与えられる。そして、伸長処理部9において、MPEG圧縮符号方式に基づいて、伸長復号されて、画像信号及び音声信号が取得される。そして、画像信号がディスプレイ部12に与えられて画像が再生されるとともに、音声信号が音声出力回路部13を介してスピーカ部15に与えられて音声が再生される。これにより、外部メモリ22に記録された圧縮信号に基づく動画が音声とともに再生される。
静止画像を再生することが指示された場合は、外部メモリ22に記録された圧縮信号が伸長処理部9において、JPEG圧縮符号方式に基づいて、伸長復号されて、画像信号が取得される。そして、画像信号がディスプレイ部12に与えられて画像が再生される。
(音声補正制御)
次に、本実施形態に係る音声補正制御について説明する。図4は本実施形態の音声処理部6の構成を示すブロック図、図5はステレオ角及び指向角についての模式図である。
音声処理部6は、図4に示すように、画像処理部5からの顔検出信号を受けて音の補正制御方法を決定する音声補正制御方法決定部61と、音声補正制御方法決定部61から出力された音声補正制御信号を受信し、ステレオマイク4から出力された複数の音声信号の出力先を切り換える制御切替部62と、制御切替部62から出力された複数の音声信号を所定の割合で加算してモノラル化する第1の加算器63と、第1の加算器63でモノラル化された音声信号のうち特定の帯域を強調する音声帯域強調フィルタ64と、制御切替部62から出力された複数の音声信号にステレオ化処理を施すステレオ化処理部65と、制御切替部62から出力された複数の音声信号に指向性処理を施す指向性処理部66と、ステレオ化処理部65でステレオ化処理が施された複数の音声信号のそれぞれと指向性処理部66で指向性処理が施された音声信号とを所定の割合で加算する、音声信号の数に対応した個数の第2の加算器67と、複数の第2の加算器67で加算された音声信号のそれぞれと音声帯域強調フィルタ64で特定の帯域が強調されたモノラル音声信号とを所定の割合で加算する、音声信号の数に対応した個数の第3の加算器68と、を備える。第3の加算器68で加算された音声信号は圧縮処理部7に出力される。
音声補正制御を開始すると、まず初期化動作として指向性処理部66でステレオ角を最大値又は最小値に設定する。尚、この初期化動作は行わなくても構わない。本実施形態においてステレオ角とは、図5に示す、音声記録装置100のステレオマイク4の3個の集音方向のうち、右方向の指向方向Rと左方向の指向方向Lとのなす角度θ1のことである。又、ステレオマイク4の正面方向については、主な集音の範囲を示す角度である指向角θ2を変化させることができる。指向角θ2は以下において正面指向性とも表すことがある。尚、図5には、左右方向の指向角θR、θLも示している。ステレオ角θ1、正面指向性θ2は、音声処理部6に設けられた指向性処理部66で変化させることができる。
続いて画像を読み込み、その画像中に、特定の被写体である人物の顔があるかどうかを検出する。本実施形態では特定の被写体が人物である場合について説明するが、音を発するものであれば、特定の被写体は人物に限らず動物などであってもよい。
(顔検出処理)
ここで、この音声記録装置の顔検出処理について説明する。画像処理部5は顔検出装置50を備え、入力された画像信号から人物の顔を検出することができる。顔検出装置50の構成及び動作について以下に説明する。
図6は、顔検出装置50の構成を示すブロック図である。顔検出装置50は、AFE3によって得られた画像データに基づいて1又は複数の縮小画像を生成する縮小画像生成部52、入力画像および縮小画像から構成される各階層画像とメモリ18に記憶された顔検出用の重みテーブルとを用いて入力画像に顔が存在するか否かを判定する顔判定部55、および顔判定部55の検出結果を出力する検出結果出力部56を備えている。検出結果出力部56は、顔が検出された場合には、検出された顔の入力画像を基準とする大きさと位置及び顔の大きさから推定したその顔までの距離を出力する。
又、メモリ18に記憶された重みテーブルは、大量の教師サンプル(顔および非顔のサンプル画像)から求められたものである。このような重みテーブルは、例えば、Adaboostと呼ばれる公知の学習方法を利用して作成することができる(Yoav Freund, Robert E. Schapire,"A decision-theoretic generalization of on-line learning and an application to boosting", European Conference on Computational Learning Theory, September 20,1995.)。
尚、Adaboostは、適応的なブースティング学習方法の1つで、大量の教師サンプルをもとに、複数の弱識別器候補の中から識別に有効な弱識別器を複数個選択し、それらを重み付けして統合することによって高精度な識別器を実現する学習方法である。ここで、弱識別器とは、全くの偶然よりは識別能力は高いが、十分な精度を満たすほど高精度ではない識別器のことをいう。弱識別器の選択時には、既に選択した弱識別器がある場合、選択済の弱識別器によって誤認識してしまう教師サンプルに対して学習を重点化することによって、残りの弱識別器候補の中から最も効果の高い弱識別器を選択する。
図7は、縮小画像生成部52によって得られる階層画像の一例を示している。この例では、縮小率を0.8に設定した場合に、生成される複数の階層画像を示している。図7において、150は入力画像を、151〜155は縮小画像を示している。161は判定領域を示している。この例では、判定領域は縦24画素、横24画素の大きさに設定されている。判定領域の大きさは、入力画像および各縮小画像においても同じである。又、この例では、矢印で示すように、階層画像上で判定領域を左から右に移動させる、水平方向走査を、上方から下方に向かって行うことで、判定領域とマッチングする顔画像の検出を行う。ただし、走査順はこれに限られるものではない。入力画像150の他に、複数の縮小画像151〜155を生成しているのは、1種類の重みテーブルを用いて大きさが異なる顔を検出するためである。
図8は顔検出処理を説明するための図である。顔判定部55による顔検出処理は、各階層画像毎に行なわれるが、処理方法は同様なので、ここでは入力画像150に対して行なわれる顔検出処理についてのみ説明する。図8には、入力画像150と、入力画像内に設定された判定領域161とを示している。
各階層画像毎に行なわれる顔検出処理は、画像内に設定された判定領域に対応する画像と重みテーブルとを用いて行なわれる。顔検出処理は粗い判定から順次細かい判定に移行する複数の判定ステップからなり、ある判定ステップにおいて、顔が検出されなかった場合には、次の判定ステップには移行せず、当該判定領域には顔は存在しないと判定する。全ての判定ステップにおいて、顔が検出された場合にのみ、当該判定領域に顔が存在すると判定し、判定領域を走査して次の判定領域での判定に移行する。そして、顔が検出されたとき、いずれの階層画像が用いられていたかによって、入力画像を基準とする顔の大きさ及び顔までの距離を推定することができる。このようにして、検出された顔の位置、大きさ及びその顔を有する人物までの距離は検出結果出力部56によって出力される。尚、このような顔検出処理については、本願出願人による特許出願である特願2006−053304号に詳しく記載されている。
この顔検出処理において読み込んだ画像中に顔を検出しなかった場合、音声補正制御方法決定部61では、人物のない画像を撮影していると判断し、環境音を臨場感のあるものとして収録するように音声処理を施す。このような音声処理の一例として、指向性処理部66でステレオ角θ1を広いもの(例えば90°)とすると共に、ステレオ化処理部65でステレオマイク4で収集された音声をステレオ化させるものが挙げられる。尚、本実施形態では音声処理に、音声信号の加工のみならずステレオ角の変更も含む。
人物の大きさが所定の大きさ(例えば画像中での顔の占める面積が30%又は50%など。図9は30%の場合である)以上の場合は、撮影者が人物の強調を意図して撮影したものと考えられるため、映像に映った人物の音声を明確とする音声処理を施す。又、人物の大きさが所定の大きさ未満の場合(図10は5%の場合である)は、撮影者が人物と共に周囲の雰囲気を重視することを意図して撮影したものと考えられるため、映像に映った人物の音声を強調すると同時に環境音を臨場感のあるものとする音声処理を施す。画像中での顔の占める割合は、顔検出装置50においていずれの階層画像で顔を検出したかによって求めることができる。表1に本実施形態における音声処理の一例を示す。
Figure 2009065587
人物の大きさが所定の大きさ以上の場合には、ステレオマイク4で収集された音声信号を第1の加算器63でモノラル化させ、モノラル化した音声信号を音声帯域強調フィルタ64で人間の声の周辺の帯域(例えば80Hz〜1kHz)を強調する処理を施す。その上で、適宜ステレオ化処理部65でステレオ化処理が施された複数の音声信号及び指向性処理部66で指向性処理が施された音声信号を第2の加算器67及び第3の加算器68で適宜信号レベルを調整して加算する。尚、音声信号をモノラル化して特定の帯域を強調する代わりに指向性処理部66において正面指向性θ2を広いもの(例えば90°)としてもよい。又、音声処理部6を、正面指向性θ2を変化させると共にステレオマイク4で収集された音声をモノラル化させる構成としてもよい。
人物の大きさが所定の大きさ未満の場合には、ステレオマイク4で収集された音声信号を、指向性処理部66で正面指向性θ2を狭いもの(例えば60°や45°)とし、ステレオ化処理部65でステレオ化する処理を施し、これらの音声信号を第2の加算器67で加算する。その上で、適宜音声帯域強調フィルタ64で特定の帯域を強調したモノラルの音声信号を第3の加算器68で加算してもよい。又、音声処理部6で、ステレオ角θ1を広いもの(例えば120°)として広い範囲の環境音を収録するとともに、正面指向性θ2を狭いもの(例えば60°や45°)として人物からの音声を強調し、これらの環境音と人物の音声を適宜信号レベルを調整して加算できる構成としてもよい。
このように、人物の有無、大きさに応じた処理を施した音声信号を適宜ミキシングすることによって、映像の変化に追従した音声を得ることができる。
以上のように、画像中の所定の被写体である人物の顔の大きさに応じた音声処理を施すことによって、画像とともに収録される音声を、撮影者の画像を撮影の仕方の意図に応じたものとすることができる。
〈第2の実施形態〉
本発明の第2の実施形態について、図面を参照して説明する。本実施形態は、音声補正制御を、特定の被写体の大きさのみならずレンズのズーム倍率にも基づいて行う点が異なる以外は第1の実施形態と同様であり、実質上同一の部分には同一の符号を付している。
図11は本実施形態の音声処理部6の構成を示すブロック図である。本実施形態の音声処理部6は、レンズ部2からのズーム倍率情報と画像処理部5からの顔検出信号とを受けて音の補正制御方法を決定する音声補正制御方法決定部61と、音声補正制御方法決定部61から出力された音声補正制御信号を受信し、制御切替部62から出力された複数の音声信号に指向性処理を施す指向性処理部66と、音声補正制御方法決定部61から出力された音声補正制御信号を受信し、ステレオマイク4から出力された複数の音声信号の出力先を切り換える制御切替部62と、制御切替部62から出力された複数の音声信号にステレオ化処理を施すステレオ化処理部65と、ステレオ化処理部65でステレオ化処理が施された複数の音声信号のそれぞれと指向性処理部66で指向性処理が施された音声信号とを所定の割合で加算する、音声信号の数に対応した個数の第3の加算器68と、制御切替部62から出力されたそれぞれの音声信号と指向性処理部66で指向性処理が施された音声信号とを所定の割合で加算する、音声信号の数に対応した個数の第4の加算器69と、第3の加算器68のそれぞれで加算された音声信号のうち特定の帯域を強調する、音声信号の数に対応した個数の音声帯域強調フィルタ64と、を備える。第4の加算器69で加算された音声信号及び音声帯域強調フィルタ64で処理された音声信号は、圧縮処理部7に出力される。
音声補正制御を開始すると、まず初期化動作として指向性処理部66でステレオ角を最大値又は最小値に設定する。尚、この初期化動作は行わなくても構わない。続いて画像を読み込み、その画像中に、人物の顔があるかどうかを検出する。
読み込んだ画像中に顔を検出しなかった場合、音声補正制御方法決定部61では、人物のない画像を撮影していると判断し、第1の実施形態と同様に、環境音を臨場感のあるものとして収録するように音声処理を施す。
一方、人物の顔を検出した場合、画像中の人物の大きさ及びレンズ部4のズーム倍率に応じた音声処理を施す。
人物の大きさが所定の大きさ以上の場合は、撮影者が人物の強調を意図して撮影したものと考えられる。さらに画像中の人物の大きさが同じでもズーム倍率によっては音声記録装置から人物までの距離が異なるため、人物の音声と背景音との音量比率や、適切なステレオ角θ1、正面指向性θ2が異なる。
まず、音声記録装置から人物までの距離と適するステレオ角θ1について説明する。図12は音声記録装置から人物までの距離と適切なステレオ角θ1との関係を示す模式図である。図12において、人物が位置Aにいる場合と位置Aよりも音声記録装置100から遠い位置Bにいる場合とを比較すると、位置人物とその周囲の環境音を臨場感のあるものとして含むようにするための適切なステレオ角θ1は位置Aではθ1A、位置Bではθ1Bであり、位置Aの方が広い。つまり、対象とする被写体(この場合は人物)が近いほど適切なステレオ角θ1は広い。ここで、音声記録装置100のステレオマイク4の3個の集音方向のうち右方向の指向方向Rと左方向の指向方向Lは、ステレオ角θ1AについてはそれぞれRA、LAであり、ステレオ角θ1BについてはそれぞれRB、LBである。又、画像中の対象とする被写体の大きさが同じであれば、ズーム倍率が小さいほど適切なステレオ角θ1は広い。
次に音声記録装置から人物までの距離と適する正面指向性θ2について説明する。図13は音声記録装置から人物までの距離と適切な正面指向性θ2との関係を示す模式図である。図13において、人物が位置Aにいる場合と位置Aよりも音声記録装置100から遠い位置Bにいる場合とを比較すると、人物の全体を含むための適切な正面指向性θ2は位置Aではθ2A、位置Bではθ2Bであり、位置Aの方が広い。つまり、対象とする被写体(この場合は人物)が近いほど、適切な正面指向性θ2は広い。
人物の大きさが所定の大きさ以上の場合は、撮影者が人物の強調を意図して撮影したものと考えられるため、映像に映った人物の音声を明確とする音声処理を施す。一方、人物の大きさが所定の大きさ未満の場合は、人物と共に周囲の風景やその場の雰囲気も対象として撮影したものと考えられるため、人物の音声を強調すると共にその周囲の環境音を臨場感のあるものとする音声処理を施す。人物の大きさの基準としては、画像中での顔の占める面積を利用することができる。
表2に本実施形態における音声処理の一例を示す。
Figure 2009065587
人物の大きさが所定の大きさ以上の場合には、制御切替部62で出力方向が切り替えられたステレオマイク4で収集されたままの音声信号と指向性処理部66で処理が施された音声信号とが第4の加算器69で加算された音声信号を、音声帯域強調フィルタ64において人間の声の周辺の帯域(例えば80Hz〜1kHz)を強調する処理を施し、圧縮処理部7に出力する。このとき、正面指向性θ2は、ズーム倍率が小さいほど広いものとする。これは、ズーム倍率が小さいほど人物が近いからである。又、音声信号の人間の声の周辺の帯域を高音質の符号化を行ってもよい。更に、ズーム倍率が小さいほど人物が音声記録装置に近いため、人物の音声の大きさを適切なものとするため、音声信号の人間の声の周辺の帯域についてズーム倍率が小さいほど音量を減衰させ、ズーム倍率が大きいほど音量を増幅させてもよい。
人物の大きさが所定の大きさ未満の場合には、ステレオ化処理部65でステレオ化処理が施された音声信号と指向性処理部66で指向性処理が施された音声信号とが第3の加算器68で加算された音声信号を、圧縮処理部7に出力する。このとき、正面指向性θ2は、人物の大きさが所定の大きさ以上の場合よりも狭いものとする。また、撮影の主な対象はズーム倍率が大きい場合は画角が狭いため遠くの風景であり、ズーム倍率が小さい場合は画角が広角でありその場の雰囲気を含めた音声記録装置付近の風景であると考えられるため、ステレオ角θ1は、上述の通り、ズーム倍率が小さいほど広いものとする。又、音声信号を広い帯域で符号化を行ってもよい。更に、ズーム倍率が小さいほど人物が音声記録装置に近いため、人物の音声の大きさを適切なものとするため、音声信号の人間の声の周辺の帯域についてズーム倍率が小さいほど音量を減衰させ、ズーム倍率が大きいほど音量を増幅させてもよい。
尚、本実施形態において、レンズ部2のズーム倍率情報に代えて、AFの最適化処理で得られた合焦距離が、所定の距離以上かそれ未満かを基準にして音声を処理してもよい。この場合も、合焦距離情報をインデックスとして記録してもよい。又、レンズ部2のズーム倍率情報とAFの最適化処理で得られた合焦距離との両方を基準にして音声を処理してもよい。
尚、第1の実施形態及び第2の実施形態において、ステレオ角θ1や正面指向性θ2を制御したり、人物の音声を強調したりする場合、音声を強調している方向やステレオ角の開く方向を示す音声強調マークを、ディスプレイ部12に表示される画像中に表示してもよい。例えば図14に示すような十字型の音声強調マーク70を、正面指向性θ2を制御している場合や人物の音声を強調している場合はディスプレイ部12の画面の中央部に、ステレオ角θ1を制御している場合にはステレオ角の開く方向すなわち画面の左右に表示させる。これによって、撮影者に音声の強調がどのように行われているかを知らせることができ、安心感を与えることができる。又、撮影者が、ディスプレイ部12の音声強調マーク70を見ながら操作部19を操作して、ステレオ角θ1や正面指向性θ2を制御したり、人物の音声を強調したりできるようにしても構わない。
又、第1の実施形態及び第2の実施形態において、画像中の対象とする被写体の大きさやズーム倍率に基づいて、対象とする被写体が音声記録装置よりも所定の距離以上遠くにあると判断した場合に、所定の大きさ以上の音声信号を検出すると記録する音声信号レベルを低減するようにしてもよい。これにより、例えば対象とする被写体として人物を撮影している際に撮影者が話したような場合に、その撮影者の声を抑えることができ、本来必要とする人物の声を明瞭なものとして記録することができる。
(音声再生装置)
又、第1の実施形態及び第2の実施形態において、図1に示すような構成の音声記録装置を例に挙げて、本発明における音声処理方法について説明したが、音声記録装置に限らず、液晶ディスプレイやプラズマテレビなどに接続したDVDプレーヤやビデオデッキなどのような、音声及び映像の出力が可能可能な音声再生装置においても、本発明における音声処理方法を利用可能である。図15に、例として第2の実施形態に係る音声処理方法を行う音声処理装置(「音声処理部」に相当)を備えた音声再生装置を示す。第1の実施形態に係る音声処理方法を行う音声再生装置も同様にして得ることができる。
図15に示す音声再生装置は、図1に示す音声記録装置と同様に、ドライバ部8、伸長処理部9、ビデオ出力回路部10、ビデオ出力端子11、ディスプレイ部12、音声出力回路部13、音声出力端子14、スピーカ部15、TG16、CPU17、メモリ18、操作部19、及び外部メモリ22を備える。そして、図1の音声記録装置とは異なり、画像処理部5に代えて伸長処理部9で取得した画像信号を処理する画像処理装置5aを、音声処理部6に代えて伸長処理部9で取得した音声信号を処理する音声処理装置6aを備える。画像処理装置5aは、図6に示す顔検出装置50を備え、音声処理装置6aは、図12の音声処理部6と同様の構成である。外部メモリ22は、第1の実施形態及び第2の実施形態において記録された画像信号及び音声補正制御を施した音声信号と、これらの信号と共に記録された、音声補正制御を施していない音声信号とインデックスとしてその信号を取得した時点のズーム倍率情報を保持する。画像処理装置5aの顔検出装置50から出力された顔検出信号と、外部メモリ22から出力された音声補正制御を施していない音声信号とズーム倍率情報とから、音声処理装置6aにおいて第2の実施形態に係る音声処理方法を行うことができる。
尚、外部メモリ22で保持する信号が、第1の実施形態及び第2の実施形態以外の音声記録装置で記録された画像信号のようにズーム倍率情報が含まれていない場合は、音声処理装置6aにおいて対象となる被写体の画像中での大きさに基づいて音声補正制御を施せばよい。
(ステレオ化処理について)
第1の実施形態、第2の実施形態におけるステレオ化処理の一例について説明する。ここでは、ステレオ化処理として、加算型指向性制御を利用して左右の2方向の音を強調する処理について説明する。図16は、この場合のステレオ化処理部65のブロック図である。ステレオ化処理部65は、右チャンネル(Rch)の音声信号を遅延させる遅延回路651Rと左チャンネル(Lch)の音声信号を遅延させる遅延回路651Lとを備え、入力されたままの右チャンネルの音声信号と遅延回路651Lで遅延させた左チャンネルの音声信号とを合成して右チャンネルの音声信号として、入力されたままの左チャンネルの音声信号と遅延回路651Rで遅延させた右チャンネルの音声信号とを合成して左チャンネルの音声信号として出力する。
図17に示すように、2個のマイク4R、4Lに対して特定の方向から音が到来した場合、音の到来が音源からそれぞれのマイク4R、4Lまでの行路差dだけずれることとなる。この場合、音源から近い方のマイク4Rで検出した右チャンネルの音声信号に対して、遅延回路651Rでこの行路差dに相当する遅延をかけ、音源から遠い方のマイク4Lで検出した左チャンネルの音声信号に加算すると、音源方向の音に対して同期加算することとなり、最も左右の音を強調することとなる。逆にマイク4Lで検出した音声信号に遅延回路651Lで同様の遅延をかけて、マイク4Rで検出した音声信号に加算すると、逆方向の音を強調していることとなる。
(指向性制御について)
次に、第1の実施形態、第2の実施形態における指向性制御の一例について説明する。指向性制御については様々な方法が提案されている。上記のステレオ化処理で説明した加算型、差分型といった単純な遅延と加算処理からなる方法もその一つであり、その他にマイクロホンアレーを用いたビームフォーミングや2次元ファンフィルタなどがある。ここでは、2個のマイクで検出した音声信号間の位相情報をもとに特定方向からの音を強調する方法について説明する。
図18はこの方法に使用することができる指向性処理部66のブロック図である。指向性処理部66は、図18に示すように、右チャンネルの音声信号及び左チャンネルの音声信号を独立して高速フーリエ変換(Fast Fourier Transform;FFT)する2個のFFT部661R、661Lと、FFT部661R、661LでFFTされた右チャンネルの音声信号及び左チャンネルの音声信号の位相差を検出する位相差検出部662と、位相差検出部662で検出された位相差情報から帯域別に指向性の制御量を決定する帯域別制御量決定部663と、帯域別制御量決定部663で決定された制御量に基づいて、FFTされた右チャンネルの音声信号及び左チャンネルの音声信号を独立して帯域別にゲイン制御する2個の帯域別ゲイン制御部664R、664Lと、帯域別ゲイン制御部664R、664Lでゲイン制御された右チャンネルの音声信号及び左チャンネルの音声信号のそれぞれを逆高速フーリエ変換(Inverse Fourier Transform;IFFT)するIFFT部665R、665Lと、を備える。
FFT部661R、661Lでは右チャンネルの音声信号及び左チャンネルの音声信号が入力されるとFFTして周波数帯域別に位相情報を算出する。位相差検出部662では右チャンネルの音声信号及び左チャンネルの音声信号の位相情報から位相差を算出して、この位相差とその周波数から音の到来方向を算出する。帯域別制御量決定部663では、位相差検出部662で算出した音成分の到来方向が、目的とする方向、例えば画像中の所定の被写体の方向であるかどうかを判断する。帯域別制御量決定部663において目的とする方向以外から来た音成分であると判断した場合は、FFTしたスペクトラル系数を、帯域別ゲイン制御部664R、664Lにおいて低減させ、目的とする方向から来た音成分であると判断した場合は増大させる。その後、変化させたスペクトラル系数をIFFT部665R、665LでIFFTを行って時間信号に戻して出力する。
この方法では、2個のマイクの設置間隔が半波長となる周波数を指向性制御の上限周波数とすることにより、位相差から正確な音成分の到来方向すなわち音源方向を算出することが可能であるため、指向角の微細な調整を行うことができる。
(インデックスについて)
ズーム倍率情報を記録するインデックスは、音声信号を圧縮記録する際に、その処理単位であるフレーム毎に記録する。例えばMPEG−AACで48kHzのサンプリング信号として記録する場合、処理単位である1フレームは、1024サンプルであり1024÷(48×103)≒2.13×10-2より約21.3msecに相当する。したがって、記録開始と同期して21.3msec毎に映像のズーム倍率情報を記録すればよい。又、ドルビーデジタル方式では1フレームが1536サンプルであり、48kHzのサンプリング信号として記録する場合は、1536÷(48×103)=3.2×10-2より32msec毎に映像のズーム倍率情報を記録すればよい。
本発明は、被写体の特定部位を検出する機能を有する音声記録装置及び音声再生装置に適用することができる。更にズーム機能のついたレンズを有する音声記録装置に適用することができる。
は、第1の実施形態に係る音声記録装置の内部構成を示すブロック図である。 は、第1の実施形態に係る音声記録装置の静止画撮影時の基本動作を説明するためのフローチャートである。 は、第1の実施形態に係る音声記録装置の動画撮影時の基本動作を説明するためのフローチャートである。 は、第1の実施形態に係る音声処理部の構成を示すブロック図である。 は、ステレオ角及び指向角について説明するための模式図である。 は、顔検出装置の構成を示すブロック図である。 は、縮小画像生成手段によって得られる階層画像の一例である。 は、顔検出処理を説明するための図である。 は、特定の被写体である人物が大きく映った画像の例である。 は、特定の被写体である人物が小さく映った画像の例である。 は、第2の実施形態に係る音声処理部の構成を示すブロック図である。 は、ステレオ角と対象物の位置との関係について説明するための模式図である。 は、指向角と対象物の位置との関係について説明するための模式図である。 は、音声強調マークを表示した画像の例である。 は、本発明の実施形態に係る音声再生装置の内部構成を示すブロック図である。 は、ステレオ化処理部のブロック図の一例である。 は、マイクと音源との位置関係について説明するための模式図である。 は、指向性処理部のブロック図の一例である。
符号の説明
1 固体撮像素子(イメージセンサ)
2 レンズ部
3 AFE
4 ステレオマイク
4L マイク
4R マイク
5 画像処理部
5a 画像処理装置
6 音声処理部
6a 音声処理装置
7 圧縮処理部
8 ドライバ部
9 伸長処理部
10 ビデオ出力回路部
11 ビデオ出力端子
12 ディスプレイ部
13 音声出力回路部
14 音声出力端子
15 スピーカ部
16 タイミングジェネレータ(TG)
17 CPU
18 メモリ
19 操作部
20 バス回線
21 バス回線
22 外部メモリ
50 顔検出装置
52 縮小画像生成部
55 顔判定部
56 検出結果出力部
61 音声補正制御方法決定部
62 制御切替部
63 第1の加算器
64 音声帯域強調フィルタ
65 ステレオ化処理部
651L 遅延回路
651R 遅延回路
66 指向性処理部
661L FFT部
661R FFT部
662 位相差検出部
663 帯域別制御量決定部
664L 帯域別ゲイン制御部
664R 帯域別ゲイン制御部
665L IFFT部
665R IFFT部
67 第2の加算器
68 第3の加算器
69 第4の加算器
70 音声強調マーク
100 音声記録装置
150 入力画像
151 縮小画像
152 縮小画像
153 縮小画像
154 縮小画像
155 縮小画像
161 判定領域

Claims (8)

  1. レンズ部を通じて被写体が含まれる撮像画像を取得する撮像部と、
    音声を取得する音声取得部と、
    前記撮像画像中から前記被写体の特定部分を検出する特定部分検出部とを備える音声記録装置において、
    前記特定部分検出部で検出された前記特定部分の前記撮像画像中での大きさに基づいて、前記音声取得部で取得する音声に対して音声処理を施すことを特徴とする音声記録装置。
  2. 前記レンズ部のズーム倍率が変更可能であり、前記特定部分の前記撮像画像中での大きさ及び前記ズーム倍率に基づいて、前記音声取得部で取得する音声に対して音声処理を施すことを特徴とする請求項1に記載の音声記録装置。
  3. 前記レンズ部の合焦距離が変更可能であり、前記特定部分の前記撮像画像中での大きさ及び前記合焦距離に基づいて、前記音声取得部で取得する音声に対して音声処理を施すことを特徴とする請求項1又は請求項2に記載の音声記録装置。
  4. 前記音声処理が、前記音声取得部の指向特性の調整、前記音声の信号レベルの調整及び前記音声の特定の帯域のレベル調整のうち少なくとも一つであることを特徴とする請求項1〜3のいずれかに記載の音声記録装置。
  5. 前記特定部分を有する被写体が、音を発する物体であることを特徴とする請求項1〜4のいずれかに記載の音声記録装置。
  6. 前記特定部分が、人物の顔であることを特徴とする請求項1〜6のいずれかに記載の音声記録装置。
  7. 被写体を含む画像および音声を再生可能な音声再生装置において、
    前記画像中から前記被写体の特定部分を検出する特定部分検出部を備え、
    前記特定部分検出部で検出された前記特定部分の前記画像中での大きさに基づいて、前記音声に対して音声処理を施して再生することを特徴とする音声再生装置。
  8. レンズ部を通じて被写体が含まれる撮像画像を取得する撮像部と、
    音声を取得する音声取得部と、
    前記レンズ部のズーム倍率及び合焦距離が変更可能であり、前記ズーム倍率情報及び前記合焦距離情報の少なくとも一方を、前記撮像画像及び前記音声とともに記録する記録部と、
    を備えた音声記録装置によって記録された前記撮像画像及び前記音声を再生可能な音声再生装置であって、
    前記撮像画像中から前記被写体の特定部分を検出する特定部分検出部を備え、
    前記特定部分検出部で検出された前記特定部分の前記撮像画像中での大きさ及び前記レンズ部のズーム倍率情報又は前記合焦距離情報に基づいて、再生する前記音声に対して音声処理を施すことを特徴とする音声再生装置。
JP2007233675A 2007-09-10 2007-09-10 音声記録装置及び音声再生装置 Pending JP2009065587A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007233675A JP2009065587A (ja) 2007-09-10 2007-09-10 音声記録装置及び音声再生装置
US12/202,855 US8218033B2 (en) 2007-09-10 2008-09-02 Sound corrector, sound recording device, sound reproducing device, and sound correcting method
US13/487,953 US20130021502A1 (en) 2007-09-10 2012-06-04 Sound corrector, sound recording device, sound reproducing device, and sound correcting method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007233675A JP2009065587A (ja) 2007-09-10 2007-09-10 音声記録装置及び音声再生装置

Publications (1)

Publication Number Publication Date
JP2009065587A true JP2009065587A (ja) 2009-03-26

Family

ID=40559732

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007233675A Pending JP2009065587A (ja) 2007-09-10 2007-09-10 音声記録装置及び音声再生装置

Country Status (1)

Country Link
JP (1) JP2009065587A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2230597A1 (en) 2009-03-18 2010-09-22 NEC Corporation Thin client server system and method of managing a driver of a USB device
JP2010245695A (ja) * 2009-04-02 2010-10-28 Nikon Corp 撮影装置
JP2011041096A (ja) * 2009-08-14 2011-02-24 Nec Corp 携帯端末、並びにこれに用いる集音制御方法及びプログラム
JP2011050009A (ja) * 2009-08-28 2011-03-10 Fujifilm Corp 画像記録装置及び方法
US8401364B2 (en) 2009-08-28 2013-03-19 Sanyo Electric Co., Ltd. Imaging device and playback device
US8908099B2 (en) 2012-05-22 2014-12-09 Kabushiki Kaisha Toshiba Audio processing apparatus and audio processing method
JP2020156076A (ja) * 2019-03-13 2020-09-24 パナソニックIpマネジメント株式会社 撮像装置
JP2021082968A (ja) * 2019-11-20 2021-05-27 パナソニックIpマネジメント株式会社 撮像装置
US11463615B2 (en) 2019-03-13 2022-10-04 Panasonic Intellectual Property Management Co., Ltd. Imaging apparatus
CN115590480A (zh) * 2022-12-15 2023-01-13 首都医科大学附属北京同仁医院(Cn) 一种声带运动矫正***及控制方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0461571A (ja) * 1990-06-29 1992-02-27 Nec Home Electron Ltd ビデオカメラ
JPH05300419A (ja) * 1992-04-16 1993-11-12 Sanyo Electric Co Ltd ビデオカメラ
JP2000278581A (ja) * 1999-03-26 2000-10-06 Matsushita Electric Ind Co Ltd ビデオカメラ
JP2007013255A (ja) * 2005-06-28 2007-01-18 Sony Corp 信号処理装置および方法、プログラム、並びに記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0461571A (ja) * 1990-06-29 1992-02-27 Nec Home Electron Ltd ビデオカメラ
JPH05300419A (ja) * 1992-04-16 1993-11-12 Sanyo Electric Co Ltd ビデオカメラ
JP2000278581A (ja) * 1999-03-26 2000-10-06 Matsushita Electric Ind Co Ltd ビデオカメラ
JP2007013255A (ja) * 2005-06-28 2007-01-18 Sony Corp 信号処理装置および方法、プログラム、並びに記録媒体

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2230597A1 (en) 2009-03-18 2010-09-22 NEC Corporation Thin client server system and method of managing a driver of a USB device
JP2010245695A (ja) * 2009-04-02 2010-10-28 Nikon Corp 撮影装置
JP2011041096A (ja) * 2009-08-14 2011-02-24 Nec Corp 携帯端末、並びにこれに用いる集音制御方法及びプログラム
JP2011050009A (ja) * 2009-08-28 2011-03-10 Fujifilm Corp 画像記録装置及び方法
US8401364B2 (en) 2009-08-28 2013-03-19 Sanyo Electric Co., Ltd. Imaging device and playback device
US8908099B2 (en) 2012-05-22 2014-12-09 Kabushiki Kaisha Toshiba Audio processing apparatus and audio processing method
JP2020156076A (ja) * 2019-03-13 2020-09-24 パナソニックIpマネジメント株式会社 撮像装置
US11463615B2 (en) 2019-03-13 2022-10-04 Panasonic Intellectual Property Management Co., Ltd. Imaging apparatus
JP2021082968A (ja) * 2019-11-20 2021-05-27 パナソニックIpマネジメント株式会社 撮像装置
US11445106B2 (en) 2019-11-20 2022-09-13 Panasonic Intellectual Property Management Co., Ltd. Imaging apparatus
CN115590480A (zh) * 2022-12-15 2023-01-13 首都医科大学附属北京同仁医院(Cn) 一种声带运动矫正***及控制方法
CN115590480B (zh) * 2022-12-15 2023-03-14 首都医科大学附属北京同仁医院 一种声带运动矫正***及控制方法

Similar Documents

Publication Publication Date Title
US8401364B2 (en) Imaging device and playback device
US8218033B2 (en) Sound corrector, sound recording device, sound reproducing device, and sound correcting method
JP2009156888A (ja) 音声補正装置及びそれを備えた撮像装置並びに音声補正方法
JP2009065587A (ja) 音声記録装置及び音声再生装置
JP4804398B2 (ja) 撮像装置及び撮影方法
JP4934968B2 (ja) カメラ装置、カメラ制御プログラム及び記録音声制御方法
KR101753715B1 (ko) 촬영장치 및 이를 이용한 촬영방법
JP5202211B2 (ja) 画像処理装置及び電子機器
JP5345025B2 (ja) 画像記録装置及び方法
US20110007187A1 (en) Imaging Device And Image Playback Device
JP2010103972A (ja) 画像処理装置及び電子機器
JP2008109336A (ja) 画像処理装置および撮像装置
JP2006303961A (ja) 撮像装置
JP2009124644A (ja) 画像処理装置、撮像装置及び画像再生装置
JP5214394B2 (ja) カメラ
JP5063489B2 (ja) 判定装置及びそれを備えた電子機器並びに判定方法
JP5230164B2 (ja) 音声記録装置
JP2008172395A (ja) 撮像装置、画像処理装置、方法およびプログラム
JP4806470B2 (ja) 撮像装置
JP2011188055A (ja) 撮像装置
JP2005202037A (ja) 立体カメラ
JP4806471B2 (ja) 撮像装置
JP5750668B2 (ja) カメラ、再生装置、および再生方法
JP2011119934A (ja) 画像撮影装置及び画像撮影方法
JP2009021893A (ja) 撮像装置及び撮像方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110617

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110621

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110822

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111222

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120327

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20120720