JP2013168878A - 録音機器 - Google Patents

録音機器 Download PDF

Info

Publication number
JP2013168878A
JP2013168878A JP2012031975A JP2012031975A JP2013168878A JP 2013168878 A JP2013168878 A JP 2013168878A JP 2012031975 A JP2012031975 A JP 2012031975A JP 2012031975 A JP2012031975 A JP 2012031975A JP 2013168878 A JP2013168878 A JP 2013168878A
Authority
JP
Japan
Prior art keywords
sound
display
volume
unit
control unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012031975A
Other languages
English (en)
Inventor
Tomomi Kamimura
友美 上村
Hiroaki Miura
啓彰 三浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Imaging Corp
Original Assignee
Olympus Imaging Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Imaging Corp filed Critical Olympus Imaging Corp
Priority to JP2012031975A priority Critical patent/JP2013168878A/ja
Publication of JP2013168878A publication Critical patent/JP2013168878A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】対象物からの音と環境音とをバランスをよく録音することを支援して、雰囲気豊かな録音を可能にする。
【解決手段】 録音機器は、被写体を撮像する撮像部と、音を収音する収音部と、前記撮像部によって撮像された撮像画像に基づく表示を行う表示部と、前記収音部によって収音された音のうち録音の対象となる対象物からの対象物音声に基づく第1の音量レベルとその他の環境音に基づく第2の音量レベルとを検出する検出部と、前記検出部によって検出された前記第1の音量レベルを示す第1の音量表示と前記第2の音量レベルを示す第2の音量表示との少なくとも一方を前記表示部に表示する表示制御部とを具備する。
【選択図】図1

Description

本発明は、表示機能を有する録音機器に関する。
近年、画像及び音声のデジタル処理、符号化技術、IC化技術等の発展によって、画像や音声を長時間記録可能な装置が普及している。例えば、携帯型のデジタルレコーダ、デジタルカメラ、携帯電話等においても、画像及び音声を記録することができるものが多い。これらの記録機器では、記録媒体として半導体メモリを用いて、小型・軽量化されている。
また、録音機能を重視した録音機器であっても、撮影機能及び表示パネルを備えて、音声だけでなく画像を記録すると共に表示することができるものも多い。このような録音機器は、携帯性に優れていることから、音楽の録音だけでなく、会議、野鳥の声、せせらぎ等の種々の音の録音に利用しやすくなっている。このような録音では、一般に、鳥の鳴き声や人の声等の録音の対象物からの音の他に、対象物の周囲から発せられる環境音も収録される。そこで、録音時にノイズを除去する装置も開発されている。また、特許文献1では、顔画像で音声を分離する技術が開示されている。
特開2009−186840号公報
しかしながら、環境音は、再生時において撮影時の様子を臨場感豊かに再現する手助けとなることもあり、必ずしも不要とは限らない。ところが、対象物の録音レベルと環境音の録音レベルとのバランスが適切となっていないことがあり、再生時に録音時の雰囲気を捉えることができないことがある。例えば、録音時には対象物である鳥の声を確認しながら記録を行ったとしても、再生時には、録音した周囲の雑音が大きすぎて、鳥の声が殆ど聞こえないこともある。
録音時に耳で聞いた音とマイクが捉えた音とでは、対象物からの声と環境音との混ざり具合が異なり、従来の録音機器では、録音時の雰囲気を捉えることができないという問題があった。
本発明は、対象物からの音と環境音とをバランスをよく録音することを支援して、雰囲気豊かな録音を可能にすることができる録音機器を提供することを目的とする。
本発明に係る録音機器は、被写体を撮像する撮像部と、音を収音する収音部と、前記撮像部によって撮像された撮像画像に基づく表示を行う表示部と、前記収音部によって収音された音のうち録音の対象となる対象物からの対象物音声に基づく第1の音量レベルとその他の環境音に基づく第2の音量レベルとを検出する検出部と、前記検出部によって検出された前記第1の音量レベルを示す第1の音量表示と前記第2の音量レベルを示す第2の音量表示との少なくとも一方を前記表示部に表示する表示制御部とを具備する。
本発明によれば、対象物からの音と環境音とをバランスをよく録音することを支援して、雰囲気豊かな録音を可能にすることができるという効果を有する。
本発明の第1の実施の形態に係る録音機器の回路構成を示すブロック図。 録画・録音機能を有する録音機器の例を示す説明図。 音声方向判定部21aによる音声方向の判定方法を説明するための説明図。 対象音声期間判定部21bの判定及び音声制御部21cの制御を説明するためのフローチャート。 対象音声期間判定部21bの判定を説明するための波形図。 カメラ制御を示すフローチャート。 図6中のステップS27における表示制御を示すフローチャート。 音声信号の音量表示の表示例を示す説明図。 図6中のステップS35におけるゲイン制御を示すフローチャート。 音量表示の他の表示例を示す説明図。 本発明の第2の実施の形態を示すブロック図。 図11中の対象物音声レベル判定部81a、環境音レベル判定部81b及び音声レベル変更部81cの具体的な構成の一例を示すブロック図。 第2の実施の形態の動作を説明するためのフローチャート。 本発明の第3の実施の形態を示すブロック図。 音量表示の他の例を示す説明図。 音量表示の他の例を示す説明図。 音量表示及び音量調整操作の他の例を示す説明図。 音量表示及び音量調整操作の他の例を示す説明図。 音量表示及び音量調整操作の他の例を示す説明図。 音量表示及び音量調整操作の他の例を示す説明図。 音量表示及び音量調整操作の他の例を示す説明図。 音量調整操作の他の例を示す説明図。 音量調整操作の他の例を示す説明図。
以下、図面を参照して本発明の実施の形態について詳細に説明する。
(第1の実施の形態)
図1は本発明の第1の実施の形態に係る録音機器の回路構成を示すブロック図である。本実施の形態は対象物からの音が含まれる期間と環境音のみの期間とを時間的に分割することで、対象物からの音と環境音とをバランスよく録音することを可能にするものである。
図1において、録音機器10は、マイク11及び撮像部31を有しており、録音だけでなく撮影も可能である。図2は録画・録音機能を有する録音機器の例を示す説明図である。図2(a)はカメラ及び表示パネルを有するデジタルレコーダを示し、図2(b)はデジタルレコーダを取り付け可能な録音機能付きのカメラを示している。
図2(a)に示すように、デジタルレコーダの筐体41の一端には、右用(R)及び左用(L)の一対のマイク42R,42Lと撮像部43とが配設されている。また、筐体41の表面には、表示パネル44が設けられおり、表示パネル44によって、撮像部43で撮像した画像を表示することができるようになっている。
図2(b)に示すように、カメラの筐体51の前面には、図示しない撮影レンズが配設され、筐体51の背面には、撮像画像を表示する表示パネル52が配設されている。筐体51の上端には、アクセサリーシュー53が設けられている。このアクセサリーシュー53に、デジタルレコーダ54が着脱自在に取り付けられている。デジタルレコーダ54のマイク55R,55Lによって録音された音声信号は、筐体51内に設けられた処理回路(図示せず)に供給されて、画像に同期して音声が記録されるようになっている。
図1において、マイク11は、右用(R)及び左用(L)の一対のステレオマイクであり、マイク11からの音声信号は、アンプ12によって増幅された後A/D変換器13に与えられる。A/D変換器13は入力された音声信号をデジタル信号に変換し音声処理部14に出力する。
音声処理部14は、例えば、デジタルシグナルプロセッサ等によって構成されており、システム制御部21に制御されて、入力された音声信号に対して所定のデジタル音声信号処理を施す。例えば、音声処理部14は、入力された音声信号に対してノイズキャンセル処理や、圧縮伸張処理等を行う。音声処理部14による信号処理後の音声信号はD/A変換器15に与えられる。
D/A変換器15は入力された音声信号をアナログ信号に変換した後LPF16に出力する。LPF16は、入力された音声信号をフィルタリングする。LPF16の出力はアンプ17によって増幅された後、スピーカ18に供給される。スピーカ18は、入力された音声信号に基づく音響を出力する。
音声処理部14によって信号処理された音声信号は、システム制御部21にも供給される。システム制御部21は、信号処理後の音声信号を記録再生部24に与える。記録再生部24は入力された音声信号をメモリカード等の記録媒体(図示せず)に記録することができるようになっている。また、記録再生部24は、記録媒体から再生した音声信号をシステム制御部21に出力することができる。システム制御部21は、再生された音声信号を音声処理部14に与えて復号化させることができる。こうして、再生信号についてもスピーカ18から音響出力させることが可能である。
通信I/F23は、USB等の所定の通信規格のインタフェースであり、システム制御部21からの信号を外部に出力すると共に、外部からの信号を取り込んでシステム制御部21に与えるようになっている。
撮像部31は、CCDやCMOSセンサ等によって構成され、入射光を光電変換して画像信号を画像処理部23に出力する。画像処理部23は、入力された画像信号をデジタル信号に変換した後、所定の画像信号処理を施す。例えば、画像処理部32は、同時化処理、色信号生成処理、ホワイトバランス処理、γ変換処理、マトリックス変換処理、その他各種のデジタル画像信号処理を行う。
画像処理部32には、表示制御部32aが設けられている。表示制御部32aは、信号処理後の画像信号をLCD等によって構成された表示部33に与える。こうして、表示部33は、撮像された画像を図示しない表示画面上に表示することができる。
画像処理部32によって信号処理された画像信号は、システム制御部21にも供給される。システム制御部21は、信号処理後の画像信号を記録再生部24に与える。記録再生部24は入力された画像信号をメモリカード等の記録媒体(図示せず)に記録することができるようになっている。また、記録再生部24は、記録媒体から再生した画像信号をシステム制御部21に出力することができる。システム制御部21は、再生された画像信号を表示部8に与えて表示させることができる。
なお、画像処理部32は、画像信号の記録及び再生に際して、画像信号を圧縮処理又は伸張処理するようにしてもよい。また、表示制御部32aは、システム制御部21及び画像処理部32に制御されて、各種操作を行うためのメニュー表示等を表示部33に表示させることもできるようになっている。
録音機器10には、操作部22及びタッチパネル34も配設されている。操作部22は、記録開始終了ボタンや記録モード設定等の図示しない各種スイッチに対するユーザ操作に基づく操作信号を発生して、システム制御部21に出力するようになっている。タッチパネル34は、ユーザのタッチ操作に基づく操作信号を発生して、システム制御部21に出力するようになっている。システム制御部21は、操作信号に基づいて、各部を制御する。
なお、タッチパネル34を表示部33の表示画面上に配設することも可能である。タッチパネル34は、ユーザが指で指し示した位置に応じた操作信号を発生する。タッチパネル34を表示部33の表示画面上に設けた場合には、ユーザは、表示部33の表示画面上に表示された各種コマンドボタンを、タッチパネル34により指示することができる。これにより、タッチパネル34は表示部33の表示画面上に表示された各種コマンドボタンに対応した操作信号をシステム制御部21に出力することができる。
本実施の形態においては、システム制御部21には、音声方向判定部21aが設けられている。マイク11はステレオマイクであり、マイク11からの音声信号には、右音声信号(R信号)及び左音声信号(L信号)が含まれる。音声方向判定部21aは、入力されたL,R信号によって、収音中の音が発せられた方向(音声方向)を判定する。
図3は音声方向判定部21aによる音声方向の判定方法を説明するための説明図である。
図3は撮像部31による撮像範囲内において2人の人物62R,62Lが撮像可能であることを示している。これらの2人の人物62R,62Lは、夫々撮像範囲61の右側と左側に位置し、人物62Rは口63Rを閉じており、人物62Lは口63Lを開いている状態を示している。マイク11のうちの右用マイク11Rと左用マイク11Lは、夫々破線64R,64Lにて示す指向特性を有しており、指向特性のピーク方向は、相互に略90度の向きとなるように配置されている。この場合には、人物62Rからの音声については、マイク11Rにより取得されるR信号のレベルとマイク11Lにより取得されるL信号のレベルとでは、R信号のレベルの方が大きくなる。逆に、人物62Lからの音声については、マイク11Rにより取得されるR信号のレベルとマイク11Lにより取得されるL信号のレベルとでは、L信号のレベルの方が大きくなる。
従って、人物62R,62Lのいずれか一方のみが話をしている場合には、マイク11R,11Lによって得られるR,L信号の差分を求めることで、人物62R,62Lのいずれが話をしているかを判定することができる。音声方向判定部21aは、音声処理部14から与えられるR,L信号の差分に基づいて、音声方向を判定する。
なお、一方の人物から、マイク11Rまでの距離とマイク11Lまでの距離とは相互に異なる。従って、マイク11R,11Lに入力されるR信号とL信号との位相は異なる。この位相差を検出することで、音声方向を判定することも可能である。
一方、画像処理部32には、特徴検出部32bが設けられている。特徴検出部32bは、撮像画像に対する画像認識処理によって、撮像画像中から対象物を検出する。例えば、対象物が人物の場合には、特徴検出部32bは、公知の顔検出の手法によって、撮影画像中の人物の顔を検出してもよい。例えば、特徴検出部32bは、顔の明るさの特徴をモデル化した複数の濃淡画像と撮影画像とを順次比較することで、人物の顔を検出する手法を採用してもよい。
また、特徴検出部32bは、検出した対象物の撮像画像中の位置から顔等の対象物が存在する方向(顔方向)を判定する。更に、特徴検出部32bは、顔パーツの特徴を記憶したデータベースを利用すると共にフレーム相関を求めることで、話中のように口を開閉しているか否かを判定することもできる。特徴検出部32bは、これらの判定結果をシステム制御部21に出力する。
システム制御部21は、音声方向判定部21aの判定結果及び特徴検出部32bの判定結果を記憶部25に記憶させる。システム制御部21の対象音声期間判定部21bは、記憶部25から音声方向判定部21aの判定結果及び特徴検出部32bの判定結果を読み出す。対象音声期間判定部21bは、音声方向の判定結果によって話中であると判定された撮像画像中の人物と、顔方向及び口の開閉の判定結果によって、話中であると判定された撮像画像中の人物とが同一人物である場合には、当該人物が話中であると判定し、そうでない場合には、撮像中のいずれの人物も話中ではないと判定する。
図4は対象音声期間判定部21bの判定及び音声制御部21cの制御を説明するためのフローチャートであり、図5は対象音声期間判定部21bの判定を説明するための波形図である。
いま、撮像部31によって図3に示す撮像画像が撮像されている状態であるものとして説明する。特徴検出部32bは、撮像画像中の人物62R,62Lを検出し、図4のステップS1における顔方向判定によって、各人物62R,62Lが左側に位置するか右側に位置するかを判定する。更に、特徴検出部32bは、ステップS2において、各人物62R,62Lの口の開閉を検出する。例えば、特徴検出部32bは、人物62R,62Lの口の部分における前後のフレームの相関によって、口の開閉を検出する。
図5(a)は、顔方向が左側の左側に位置する人物についての口部分のフレーム相関結果を示しており、図5(a)ではレベルが高いほど相関が低いことを示している。また、図5(b)は、顔方向が右側の左側に位置する人物についての口部分のフレーム相関結果を示しており、図5(b)ではレベルが高いほど相関が低いことを示している。
即ち、図5(a)では、フレーム相関結果の山の部分において、左側の人物62Lが口を開閉させていることを示しており、図5(b)では、フレーム相関結果の山の期間において、右側の人物62Rが口を開閉させていることを示している。
音声方向判定部21aは、L信号のレベル(L)からR信号のレベル(R)を減算する。図5(c)はこの減算結果を示している。環境音についてのL,R信号のレベルが略同一であるものとすると、(L−R)の山の部分は、L信号がR信号よりも十分に大きく、音声方向は左方向であることを示している。同様に、(L−R)の谷の部分は、R信号がL信号よりも十分に大きく、音声方向は右方向であることを示している。
対象音声期間判定部21bは、ステップS4において、音声処理によって求めた音声方向と同一の顔方向の人物の口が開閉していると判定した場合には、その期間を撮像中の人物が話中である(以下、対象音声期間という)と判定し、そうでない場合の期間を撮像中のいずれの人物も話中ではなく環境音のみが収音されている期間(以下、環境音期間という)と判定する。
図5の例では、顔方向が左の顔についてのフレーム相関結果(図5(a))が山であると共に、(L−R)(図5(c))が山である期間、及び、顔方向が右の顔についてのフレーム相関結果(図5(b))が山であると共に、(L−R)(図5(c))が山である期間が対象音声期間と判定され、その他の期間は環境音期間と判定される。
音声制御部21cは、対象音声期間判定部21bの判定結果が与えられ、対象音声期間と環境音期間とについて、音声信号に対するゲイン調整を音声処理部14に指示するようになっている(ステップS5,S6)。この場合には、音声制御部21cは、ユーザ操作に基づいて、対象音声期間の音声信号に対するゲインと、環境音期間の音声信号に対するゲインとを制御することができるようになっている。音声処理部14は、音声制御部21cに制御されて、対象音声期間の音声信号に対するゲインと、環境音期間の音声信号に対するゲインとを変化させる。
本実施の形態においては、システム制御部21は、対象物の方向と、音声制御部21cが設定した対象音声期間及び環境音期間における音声信号のレベルとを表示制御部32aに与えるようになっている。表示制御部32aは、表示部33の表示画面上に、対象音声期間における音声信号レベルに対応した対象物の音量表示及び環境音期間における音声信号レベルに対応した環境音の音量表示を表示させることができるようになっている。
ユーザは表示部33の音量表示を参照しながら、対象音声期間又は環境音期間の音声信号に対するゲインを制御するための操作を行うことができる。この操作に応答して、音声制御部21cは、対象音声期間及び環境音期間の音声信号に対するゲインを制御するようになっている。
次に、このように構成された実施の形態の動作について図6乃至図9を参照して説明する。図6はカメラ制御を示し、図7は図6中のステップS27における表示制御を示し、図9は図6中のステップS35におけるゲイン制御を示している。また、図8は音声信号の音量表示の表示例を示す説明図である。
録音機器10の電源がオンになると、システム制御部21は、図6のステップS1において、録音モードであるか否かを判定する。システム制御部21は、録音モードでない場合には、ステップS12において再生モードが指定されたか否かを判定する。再生ボタン等が操作された場合には、システム制御部21は、ステップS13において、再生モードに移行し、記録再生部24によって記録されたファイルの一覧の情報を読み出し、ファイル一覧表示を表示部33に表示させる。
ファイル一覧の表示時に、ユーザがファイル選択を行うと(ステップS14)、システム制御部21は、選択されたファイルを記録再生部24により読み出し、復号化処理を行って、画像信号及び音声信号を再生する(ステップS15)。システム制御部21は、再生した画像信号及び音声信号を表示部33に与えて表示させる。
なお、ファイル一覧表示時に、終了操作が行われた場合には、システム制御部21は、処理をステップS16からステップS12に移行して再生モードを終了する。
システム制御部21は、ステップS11において録音モードが指示されているものと判定した場合には、ステップS21においてスルー画を表示する。即ち、システム制御部21は、撮像部31からの撮像画像を取込み、所定の信号処理を施した後、表示制御部32aによって表示部33に出力する。こうして、表示部33の表示画面上においてスルー画が表示される。
本実施の形態においては、システム制御部21は、ステップS22,S23,S25〜S27において対象音声期間と環境音期間とを判定する。なお、ステップS22,S23,S25〜S27の処理は、表現は異なるが、図4のステップS1〜S4の処理と同様の処理である。
ステップS22では、特徴検出部32bによって撮像画像中の対象物が判定される。なお、図6では対象物として人物の顔を判定する例を示している。顔が存在する場合には、特徴検出部32bは、ステップS23において顔の撮像画像中の位置から顔方向を判定する。なお、顔位置の情報を表示制御部32aに与えることで、表示制御部32aは、顔の位置を示す枠表示を画面上に表示させることができる(ステップS24)。更に、特徴検出部32bは、顔の下部、即ち、口部の画像の変化を判定し(ステップS25)、口部の画像部分に動きがある場合には、処理をステップS26からステップへS27に移行する。
ステップS27においては、音声方向判定部21aは、マイク11R,11Lによって収音されたR信号とL信号とレベル差を、2つの閾値TH1,TH2と比較する。音声方向判定部21aは、L−R>TH1の場合には、音声方向は左方向と判定し、L−R<TH2の場合には、音声方向は右方向と判定し、それ以外の場合には、対象物から音声は発せられていない、即ち、環境音期間であると判定する。
なお、対象音声期間判定部21bは、ステップS22,S26,S27の判定が“NO”の場合には、いずれも環境音期間であると判定する。なお、対象音声期間判定部21bは、ステップS26において口の動きを検出することができなかった場合及びステップS27において、音声方向を判定することができなかった場合には、ステップS32における音量の判定結果をステップS33において記録し、以後の音声方向の判定に用いる。また、ステップS34では、求めた音量を示す音量表示を画面周辺に表示させる。また、ステップS22において対象物が検出されなかった場合にも、ステップS34において、画面周辺に音量表示が表示される。
対象音声期間判定部21bは、ステップS27の条件を満足する場合には、対象音声期間であるものと判定する。システム制御部21は、対象物の方向と対象音声期間及び環境音期間の音声信号レベルとを表示制御部32aに与える。これにより、表示制御部32aは、ステップS28において、対象物である顔近傍に対応音声期間の音量表示を表示させ、ステップS29において、画面周辺に環境音音量表示を表示させる。
即ち、図7のステップS51において、表示制御部32aは、対象物の方向が右寄りであるか否かを判定する。顔が撮像画像中の右寄りの場合には、顔の右側に音量表示である声用バー表示を表示させ(ステップS52)、撮像画像の左端に環境音の音量表示である環境音用バー表示を表示させる(ステップS53)。
図8(a)はこの場合の表示例を示しており、撮像画像71中に、対象物である人物72が右側に映し出されている。また、撮像画像71中の左側には、昆虫74が留まった樹木73が映し出されている。表示制御部32aは、人物72の右側に声用バー表示75を表示させ、撮像画像71の左端に環境音用バー表示76を表示させる。声用バー表示75及び環境音用バー表示76は、図8では塗り潰して示すように、表示色や濃さを変化させることでレベルを表しており、図8の例では、対象音声期間の音量レベルは13段階中の9であり、環境音期間の音量レベルは13段階中の6である。
なお、表示制御部32aは、対象物の方向が右寄りでない場合には、顔の左側に対象音声期間の音量表示である声用バー表示を表示させ(ステップS54)、撮像画像の右端に環境音期間の音量表示である環境音用バー表示を表示させる(ステップS55)。
図8(b)は対象音声期間及び環境音期間の音量表示の他の例を示している。図8(b)の例では、表示制御部32aは、表示部33の表示画面70中の中央に撮像画像71を表示するようになっている。表示制御部32aは、表示画面70の両端に、対象音声期間及び環境音期間の音量表示を表示させる。図8(b)では、表示画面70の右端に、対象音声期間の音量表示である声用バー表示75を表示させ、表示画面70の左端に、環境音期間の音量表示である環境音用バー表示76を表示させた例を示している。また、表示制御部32aは、対象音声期間の音量表示が視覚的に分かりやすいように、声用バー表示75であることを示すマーク77を声用バー表示75の上方に表示させている。
本実施の形態においては、対象音声期間及び環境音期間の音量表示を行うだけでなく、対象音声期間及び環境音期間のレベルを変更することもできるようになっている。例えば、ユーザは声用バー表示75の表示位置に対するタッチ操作によって対象音声期間の音量レベルの変更を指示することができ、環境音用バー表示76の表示位置に対するタッチ操作によって環境音期間の音量レベルの変更を指示することができる。
音声制御部21cは、ステップS35においてユーザによる音量調整操作(タッチ操作)があったか否かを判定しており、タッチ操作があった場合には、ステップS36においてゲイン変更を行う。
図9は音量制御部21cによるゲイン制御の一例を示している。図9のステップS61において、音量制御部21cは、ユーザが指示した音量変更の変更量を判定する。例えば、音量制御部21cは、ユーザがバー表示75,76上を指でスライドさせて音量変更を指示する場合には、このスライド量を判定する。次に、音量制御部21cは、音量の変更操作が対象音声期間に対するものであるか環境音期間に対するものであるかを判定する。
例えば、音量制御部21cは、指がバー表示75上をスライドした場合には対象音声期間の音量変更操作であると判定し、指がバー表示76上をスライドした場合には環境音期間の音量変更操作であると判定してもよい。また、例えば、音量制御部21cは、ユーザの音量変更のためのスライド操作の後、対象物以外の部分(背景)をタッチしたか否かによって、対象音声期間と環境音期間のいずれの期間に対する音量制御操作であったかを判定してもよい(ステップS62)。
ユーザが背景をタッチした場合には、音量制御部12cは、ステップS63において環境音期間のゲインの変更を指示し、ユーザが対象物をタッチした場合には、音量制御部12cは、ステップS64において対象音声期間のゲインの変更を指示する。音量制御部12cの指示に従って、音声処理部14は対象音声期間及び環境音期間のゲインを変更する(ステップS65)。
システム制御部21は、ステップS37,S39において、録音の開始又は終了操作があったか否かを判定する。録音開始操作があった場合には、システム制御部21は、記録再生部24において、撮像画像及び収音した音声の録音を開始する。なお、この場合には、音声制御部21cは、ユーザによって設定されたゲインで対象音声期間及び環境音期間の音声信号を増幅する。これにより、ユーザが希望するバランスで対象音声期間及び環境音期間の音声が増幅されて記録が行われる。録音終了操作があった場合には、システム制御部21は、記録再生部24における録音を終了して、ファイル化する。
図10は音量表示の他の表示例を示す説明図である。図10は表示画面70の中央に撮像画像71を表示する例である。撮像画像71中には、対象物である人物72R,72Lが左右に映し出されている。また、撮像画像71中の中央には、昆虫74が留まった樹木73が映し出されている。表示制御部32aは、撮像画像71の下方に声用バー表示75Dを表示させ、撮像画像71の上方に環境音用バー表示75Uを表示させる。声用バー表示75D及び環境音用バー表示75Uは、図10では塗り潰して示すように、表示色や濃さを変化させることでレベルを表しており、図10の例では、対象音声期間の音量レベルは13段階中の9であり、環境音期間の音量レベルは13段階中の6である。
このように本実施の形態においては、対象物からの音声が収音される対象音声期間と対象物からの音声が含まれない環境音期間とを判定し、各期間における音量を表示させるようになっている。これにより、ユーザは対象音声期間と環境音期間とがどのようなバランスで録音されるかを把握することができる。更に、ユーザはこの音量表示を参照しながら、各期間のゲインの変更操作を行うことができ、簡単に各期間の音量バランスを所望のバランスとなるように設定し録音することができる。これにより、簡単な操作で、雰囲気豊かな録音を可能にすることができる。
(第2の実施の形態)
図11は本発明の第2の実施の形態を示すブロック図である。図11において図1と同一の構成要素には同一符号を付して説明を省略する。
第1の実施の形態においては、対象音声期間及び環境音期間における音量に関する表示を行うと共に、これらの期間の音量レベルを変更するゲイン調整を可能にした。これに対し、本実施の形態は対象物からの音声(対象物音声)と環境音とを分離して各音量に関する表示を行うと共に、対象物音声と環境音の音量レベルを変更するゲイン調整を可能にするものである。
本実施の形態における録音機器100は、音声処理部14及びシステム制御部21に夫々代えて音声処理部81及びシステム制御部82を採用した点が図1の録音機器10と異なる。音声処理部81は、対象物音声レベル判定部81a、環境音レベル判定部81b及び音声レベル変更部81cを備えた点が音声処理部14と異なる。音声処理部81は、対象物音声レベル判定部81a、環境音レベル判定部81b及び音声レベル変更部81cによって、入力された音声信号から対象物音声と環境音とを分離して、対象物音声及び環境音の各レベルを判定して判定結果を出力すると共に、各レベルをユーザ操作に応じて制御することができるようになっている。
また、システム制御部82は、音声方向判定部21a及び対象音声期間判定部21bを省略すると共に、音声制御部21cに変えて音声制御部82aを採用した点が、システム制御部21と異なる。音声制御部82aは、ユーザによる対象物音声のレベル及び環境音のレベルの変更操作を受付け、音声処理部81に、対象物音声のレベル及び環境音のレベルの変更を指示するようになっている。
図12は図11中の対象物音声レベル判定部81a、環境音レベル判定部81b及び音声レベル変更部81cの具体的な構成の一例を示すブロック図である。
A/D変換器13からの入力音声信号は、高速フーリエ変換部90に入力される。高速フーリエ変換部90は、入力された音声信号に対して高速フーリエ変換処理を施し、時間領域の信号を周波数領域の信号に変換して、帯域分割部93に出力する。例えば、高速フーリエ変換部90は、定時間長ずつ、例えば128個の入力されたディジタル音声信号x(t)をフレームに分割し、分割したフレーム毎に高速フーリエ変換処理を行い、これにより振幅スペクトルX(k)(k=0〜N−1 、Nはフレーム長)を得る。
帯域分割部93は、周波数領域の信号を低域から高域まで所定の帯域毎に分割して対象物音声検出部94及び環境音検出部95に出力する。対象物音声検出部94は、帯域分割部93からの各帯域信号のうち対象物の帯域を検出する。例えば、対象物が人の場合には、人の声の周波数帯域は、100Hz〜1kHz程度であり、対象物音声検出部94は、帯域信号のうち人の声の帯域に対応する帯域信号を検出する。対象物音声検出部94は検出した対象物の帯域信号を環境音検出部95に出力する。環境音検出部95は、帯域分割部93及び対象物音声検出部94の出力から、環境音の帯域信号を検出する。
対象物音声検出部94の出力は対象物音声レベル出力部96に与えられる。対象物音声レベル出力部96は、対象物の帯域信号が入力され、入力された帯域信号の平均をとって帯域パワーを求め、対象物の音声レベル信号として出力する。
環境音検出部95の出力は環境音レベル出力部97に与えられる。環境音レベル出力部97は、環境音の帯域信号が入力され、入力された帯域信号の平均をとって帯域パワーを求め、環境音の音声レベル信号として出力する。
対象物音声レベル出力部96及び環境音レベル出力部97からの出力は、表示制御部32aに供給され、表示制御部32aは、対象物音声レベル信号に基づいて対象物音声の音量表示を行い、環境音声レベル信号に基づいて環境音の音量表示を行う。
また、対象物音声検出部94の出力は対象物音声制御部98にも与えられる。対象物音声制御部98は、対象物の帯域信号に対して、ユーザのレベル操作に応じた係数を乗算して、スペクトル振幅制御部91に出力する。また、環境音検出部95の出力は環境音制御部99にも与えられる。環境音制御部99は、環境音の帯域信号に対して、ユーザのレベル操作に応じた係数を乗算して、スペクトル振幅制御部91に出力する。
スペクトル振幅制御部91は、高速フーリエ変換部90の出力と、対象物音声制御部98の出力及び環境音制御部99の出力とを合成する。スペクトル振幅制御部91の出力は、対象物音声制御部98において正の係数が用いられることで、対象物音声帯域のレベルが大きくなり、負の係数が用いられることで対象物音声帯域のレベルが低くなる。また、スペクトル振幅制御部91の出力は、環境音制御部99において正の係数が用いられることで、環境音帯域のレベルが大きくなり、負の係数が用いられることで環境音帯域のレベルが低くなる。
スペクトル振幅制御部91の出力は、IFFT92に与えられる。IFFT92は、入力された帯域信号を逆高速フーリエ変換することで時間領域の信号に変換して、出力音声信号として出力する。
次に、このように構成された実施の形態の動作について図13のフローチャートを参照して説明する。図13において図6と同一の手順には同一符号を付して説明を省略する。
図13のフローは、ステップS31,S33を省略し、ステップS27〜S29に代えてステップS71〜S73を採用した点が図6のフローと異なる。第1の実施の形態においては、音声方向を判定するために音量を記録する必要があったが、本実施の形態においては音量をリアルタイムに検出可能であるので、音量を記録するための手順を省略することができる。
ステップS71では、対象物音声検出部94によって対象物音声が分離可能であるか否かが判定される。対象物音声が分離不能の場合には、処理はステップS32に移行して、対象物音声及び環境音を含む音声の音量判定が行われて、その結果が画面周辺に音量表示される(ステップS34)。
対象物音声が分離可能な場合には、処理がステップS72に移行して、顔近傍に対象物音声の音量を示す対象物音量表示が表示される。表示制御部32aは、対象物音声レベル出力部96の出力に基づいて、対象物音量表示を表示部33に表示させる。なお、対象物音量表示は、画面周辺に表示してもよく、例えば、対象物音量表示としては、図8及び図10等の声用バー表示75を採用することができる。
次に、ステップS72において、画面周辺に環境音の音量を示す環境音音量表示が表示される。表示制御部32aは、環境音レベル出力部97の出力に基づいて、環境音音量表示を表示部33に表示させる。なお、環境音音量表示は、画面周辺の適宜の位置に表示することができ、例えば、環境音音量表示としては、図8及び図10の環境音用バー表示76,75U等を採用することができる。
なお、ステップS36においては、音声制御部82aは、ユーザ操作に基づいて、対象物音声のゲイン及び環境音のゲインを対象物音声制御部98及び環境音制御部99に設定する。対象物音声制御部98及び環境音制御部99は、設定されたゲインに応じた係数を夫々対象物音声の帯域信号、環境音の帯域信号に掛けて、スペクトル振幅制御部91に出力する。こうして、スペクトル振幅制御部91は、高速フーリエ変換部90の出力と、対象物音声制御部98及び環境音制御部99からの帯域信号とを合成することで、ユーザが指定した音量の対象物音声及び環境音を得る。
他の作用は、第1の実施の形態と同様である。
このように本実施の形態においては、対象物からの音声と対象物からの音声が含まれない環境音とを分離し、各音の音量を表示させるようになっている。これにより、ユーザは対象物音声と環境音とがどのようなバランスで録音されるかを把握することができる。更に、ユーザはこの音量表示を参照しながら、各音のゲインの変更操作を行うことができ、簡単に各音の音量バランスを所望のバランスとなるように設定して録音することができる。これにより、簡単な操作で、雰囲気豊かな録音を可能にすることができる。
なお、第2の実施の形態においては、入力音声信号から対象物音声と環境音とを帯域信号によって分離する例について説明したが、予め環境音を録音しておくことで、この環境音を用いて入力音声信号から対象物音声を分離することも可能である。
(第3の実施の形態)
図14は本発明の第3の実施の形態を示すブロック図である。図14において図1及び図11と同一の構成要素には同一符号を付して説明を省略する。本実施の形態は、第1及び第2の実施の形態を組み合わせることにより、撮像画像中の複数の対象物が存在する場合に、各対象物からの音の音量を夫々表示すると共に、各音の音量を制御可能にしたものである。
例えば、撮像範囲中の右側及び左側に対象物である2人の人物が存在するものとして説明する。この場合には、システム制御部111の音声方向判定部21aは、左側の対象物(以下、左対象人物)と右側の対象物(以下、右対象人物)からの音声方向を判定し、対象音声期間判定部21bは、左対象人物が話中である期間(左対象音声期間)と右対象人物が話中である期間(右対象音声期間)とを判定する。
音声処理部81の対象物音声レベル判定部81a及び環境音レベル判定部81bは、左対象音声期間における左対象人物からの音声と環境音とを分離すると共に、右対象音声期間における右対象人物からの音声と環境音とを分離する。
対象物音声レベル出力部96及び環境音レベル出力部97(図12参照)からの出力は、表示制御部32aに供給され、表示制御部32aは、左対象人物及び右対象人物からの音声の音量表示を行うと共に、環境音声レベル信号に基づいて環境音の音量表示を行う。
音声制御部82aは、ユーザ操作に基づいて、左対象音声期間における左対象人物からの音声信号に対するゲイン調整、右対象音声期間における右対象人物からの音声信号に対するゲイン調整及び各音声期間における環境音のゲイン調整を指示するようになっている。
音声レベル変更部81cは、音声制御部82aの指示に従って、左対象人物からの音声信号のゲイン、右対象人物からの音声信号のゲイン及び環境音のゲインを変更する。
このように構成された実施の形態においては、撮像画像中の左右の人物からの音声と環境音との音声レベルを個別に取得して、各音声の音量を表示部33の表示画面上に表示することができる。また、この音量表示を参照したユーザによる操作によって、撮像画像中の左右の人物からの音声と環境音との音声レベルを個別に調整することが可能である。
このように本実施の形態においては、上記各実施の形態と同様の効果が得られると共に、撮像画像中に複数の対象物が存在する場合でも、各対象物からの音の音量を夫々表示すると共に、各音の音量を制御可能である。
なお、上記実施の形態において、マイク11の指向性を制御する指向特性制御部を備えることも可能である。指向特性制御部は、公知の手法によって、入力される音声信号から音声の到来方向を判定し、判定結果に基づいてマイク11の特性を到来方向にピークを有する狭指向特性に変化させることが可能である。第2の実施の形態の構成にこのような指向特性制御部を追加することで、撮像画像中の複数の対象物からの音声方向を判定し、判定結果に基づいて狭指向特性を設定することで、各対象物からの音声のみを抽出可能である。
従って、撮像画像中の複数の対象物から同時に音声が発せられた場合でも、各対象物方向の音声、即ち、各対象物からの音声と各対象物方向から発せられる環境音とを、個別に抽出することができる。これにより、撮像画像中の複数の対象物について、各対象物から同時に音声が発せられている場合でも、その音声と環境音との音声レベルを個別に音量表示として表示すると共に、音量の調整が可能である。
また、この場合において、本実施の形態においては、画像解析処理によって、撮像画像中の人物等の口の開閉を検出して、対象物方向の特定を補助しており、各対象物からの音声のみの抽出をより高精度に行うことができる。
(音量表示と音量調整操作の他の例)
図15乃至図23は音量表示及び音量調整操作の他の例を示す説明図であり、上記各実施の形態の音量表示及び音量調整操作に適用することができる。
図15の例は、各種音量表示を示している。図15は表示部33の表示画面上に表示された撮像画像121中に、2人の人物122L,122R及び樹木123に留まっている昆虫124が撮像されている例を示している。図15(a)は色の違いによって、対象物音声を示す音量表示125L,125Rであるか環境音を示す音量表示126であるかを区別する例を示している。なお、図15(a)はハッチングの種類によって色が相違することを示している。また、図15(a)では人物122L,122Rの顔部において、丸い形状の音量表示125L,125Rを行っている。
図15(b)は形の違いによって、対象物音声を示す音量表示125L,125Rであるか環境音を示す音量表示126であるかを区別する例を示している。図15(b)の例は、円形状が対象物音声を示し、バー形状が環境音を示している。なお、円形状によって環境音を示し、バー形状によって対象物音声を示してもよい。
図15(c)は表示位置の違いによって、対象物音声を示す音量表示125L,125Rであるか環境音を示す音量表示126であるかを区別する例を示している。図15(c)の例は、対象物の音量表示を撮像画像121中に示し、環境音の音量表示を撮像画像121外に示している。なお、撮像画像中に環境音の音量表示を示し、撮像画像外に対象物音声の音量表示を示してもよい。
図16は図15(a)乃至(c)で示した音量表示における音量レベルの表現方法の一例を示している。図16(a),(b)はサイズの大小によって音量が相違することを示す例である。また、図16(c)は図面上はハッチングの種類によって示しているが、音量表示の色や濃淡によって音量が相違することを示す例である。
また、図17の例は図15と同一の撮像画像121を用いて他の音量表示の例を示すものである。図17は撮像画像121の下方に、音量表示用の同軸状のバー表示141を表示させたものである。
図18は図17中のバー表示141を拡大して示すものであり、バー表示141上には、対象物音声及び環境音の音量を示す3つのカーソル表示143が配置されると共に、3つのカーソル表示143のうちいずれのカーソル表示が対象物音声についてのものであるかを示すアイコン表示142が配置される。
図17及び図18の例では、例えば、アイコン表示142の下方のカーソル表示143によって、対象物音声の音量を示し、アイコン表示142が上方に表示されていないカーソル表示143によって環境音の音量を示している。なお、環境音の音量を示すカーソル表示の上方にアイコン表示142とは異なる種類のアイコン表示を表示させてもよく、また、環境音の音量を示すカーソル表示の上方にアイコン表示を表示し、対象物の音量を示すカーソル表示の上方にアイコン表示を配置しないようにしてもよい。
図18ではバー表示141の色の変化や濃淡(図18ではハッチングで示す)によって、音量レベルの変化を示している。図18において、バー表示141の右側程音量が大きいことを示すものとすると、図18では、2つの対象物音声に比べて環境音の音量が大きいことが分かる。
図17では、2つの対象物である人物122L,122Rが検出されたことを、対象物を囲む枠表示131L,131Rを表示することによって示している。例えば、図17(a)の例では、バー表示141によって、人物222L,122Rの一方の音量レベルは高く他方の音量レベルは低く、環境音の音量レベルは両者の中間のレベルであることを示している。
この状態で、ユーザが指145によりカーソル表示143上をタッチしてスライドさせることで、音量調整操作を行うことができる。例えば、図17(b)はバー表示141上の最も左の位置のカーソル表示143上を指145でタッチした状態を示している。このタッチ操作によって、カーソル表示143に対応する対象物を示す表示を行うことができる。例えば、図17(b)では、枠表示の色を変化(図17では線幅を変化させて示す)させることで、左端のカーソル表示143に対応する枠表示が枠表示131Lであることを示している。なお、音量調整の対象となる対象物を画像中で指定することによって、対応するカーソル表示143の色等を変化させて、対象物とカーソル表示143との対応をユーザに認識させるようにしてもよい。
ユーザが指145によりカーソル表示143上をタッチしてスライドさせることで、スライドさせたカーソル表示143に対応する対象物の音量が変化する。音量の変化量は、スライド量に対応する。図17(c)はカーソル表示143を矢印に示す量だけ右側にスライドさせたことを示している。図17(c)の例では、ユーザの音量調整操作によって、人物122Rからの音声の音量が一番大きく、次に人物122Lからの音声の音量が大きく、環境音の音量が一番小さくなったことを示している。
図19乃至図23は音量調整操作の操作方法の例を示している。
図19はスライド操作によって音量調整を可能にする3つの例を示すものである。音量表示として水平方向に伸びたバー表示152を採用する場合には、ユーザの指151をバーに沿って矢印153方向にスライドさせることにより、音量調整が可能である。例えば、バー表示152の右側にスライドさせることにより音量を増加させ、左側にスライドさせることにより音量を減少させることができる。
また、音量表示として円形状の表示155を採用する場合には、ユーザの指154を表示155の径方向に沿った矢印156方向にスライドさせることにより、音量調整が可能である。例えば、円形の中心方向にスライドさせることで音量を増加させ、中心から離間する方向にスライドさせることによって音量を減少させることができる。
また、音量表示として垂直方向に延びたバー表示158を採用する場合には、ユーザの指157を矢印159の方向にスライドさせることにより、音量調整が可能である。例えば、バー表示158の上側にスライドさせることにより音量を増加させ、下側にスライドさせることにより音量を減少させることができる。
図20はタッチ操作によって音量調整を可能にする例を示すものである。例えば、音量表示として円形状の表示161を採用するものとする。図20の左側の例は音量を増加させる場合の音量調整操作を示しており、ユーザは指162によって表示161上を所定時間タッチ(長押し)することで音量を増大させることができる。図20の右側の例は音量を減少させる場合の音量調整操作を示しており、ユーザは指162を表示161に対してタッチ状態(指162a)から離間状態(指162b)に短時間で移行する、即ち、指162によって表示161をタップする操作によって、音量を減少させることができる。なお、長押しによって音量を減少させ、タップによって音量を増加させるようにしてもよい。
図21はピントアウト操作によって音量調整を可能にする2つの例を示すものである。例えば、音量表示として円形状の表示を採用するものとする。図21の表示171a,171bは円形状の音量表示における所定の2つの状態を示しており、径が大きいほど音量が大きいことを示している。ユーザは円形状の音量表示近傍の表示画面上において、矢印174に示す径方向に、2本の指を近接又は離間させる。図21の指172a,173aは近接状態を示し、指172b,173bは離間状態を示している。2本の指をスライドさせながら離間させることにより音量を増大させ、2本の指をスライドさせながら近接させることにより音量を減少させることができる。
また、例えば、音量表示としてバー表示を採用するものとする。図21の表示175a,175bはバー表示における所定の2つの状態を示しており、バーの長さが長いほど音量が大きいことを示している。ユーザはバー表示近傍の表示画面上において、バー表示に沿った矢印178に示す方向に、2本の指を近接又は離間させる。図21の指176a,177aは近接状態を示し、指176b,177bは離間状態を示している。2本の指をスライドさせながら離間させることにより音量を増大させ、2本の指をスライドさせながら近接させることにより音量を減少させることができる。
図22は画面上のスライド操作によって音量調整を可能にする例を示すものである。図22の例では、ユーザが指182aによって撮像画像中の対象物の表示近傍をタッチすることにより、タッチした対象物に対する音量調整操作が可能となる。なお、この場合には、音量調整対象となったことを示す表示181を表示する。
ユーザは指182aで表示画面をタッチ(対象物を選択)した状態で、他の指182cで表示画面上に触れて円弧状(矢印183)にスライドさせる。スライド方向によって音量の増減を指示することができる。例えば、指182cを時計方向にスライドさせることによって音量を増大させ、指182cを反時計方向にスライドさせることによって音量を減少させることができる。
図23は画面上のタッチ操作によって音量調整を可能にする例を示すものである。図23の例においても、ユーザが指でタッチした近傍に表示された対象物が、音量調整の対象となる。ユーザがタッチする指の本数によって音量の増減を指示することができる。例えば、ユーザが指192aで対象物の表示191をタッチすることで比較的小さい音量を指示し、2本の指192a,192bで対象物の表示191をタッチすることで中間音量を指示し、3本の指192a〜192cで対象物の表示191をタッチすることで比較的大きい音量を指示することができる。
なお、図15乃至図23に示す音量表示、音量調整操作の検出及び音量調整操作に基づく音量制御は、上記各実施の形態における表示制御部32a及びシステム制御部21,82,11等によって実現可能である。また、図15乃至図23においては、表示する色や濃淡の変化をハッチングの密度の変化等によって表しており、色や濃淡は連続的に変化するものであってよい。
さらに、本発明の各実施形態においては、撮影のための機器として、デジタルカメラを用いて説明したが、カメラとしては、デジタル一眼レフカメラでもコンパクトデジタルカメラでもよく、ビデオカメラ、ムービーカメラのような動画用のカメラでもよく、さらに、携帯電話やスマートフォンなど携帯情報端末(PDA:Personal Digital Assist)等に内蔵されるカメラでも勿論構わない。
本発明は、上記各実施形態にそのまま限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記各実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素の幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
なお、特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。また、これらの動作フローを構成する各ステップは、発明の本質に影響しない部分については、適宜省略も可能であることは言うまでもない。
11…マイク、14…音声処理部、21…システム制御部、21a…音声方向判定部、21b…対象音声期間判定部、21c…音声制御部、22…操作部、24…記録再生部、25…記録部、31…撮像部、32…画像処理部、32a…表示制御部、32b…特徴検出部、33…表示部、34…タッチパネル。

Claims (6)

  1. 被写体を撮像する撮像部と、
    音を収音する収音部と、
    前記撮像部によって撮像された撮像画像に基づく表示を行う表示部と、
    前記収音部によって収音された音のうち録音の対象となる対象物からの対象物音声に基づく第1の音量レベルとその他の環境音に基づく第2の音量レベルとを検出する検出部と、
    前記検出部によって検出された前記第1の音量レベルを示す第1の音量表示と前記第2の音量レベルを示す第2の音量表示との少なくとも一方を前記表示部に表示する表示制御部と
    を具備することを特徴とする録音機器。
  2. 前記表示制御部は、前記第1の音量表示を前記撮像画像中の前記対象物の表示位置に対応した位置に表示する
    ことを特徴とする請求項1に記載の録音機器。
  3. ユーザ操作に基づいて、前記第1及び第2の音量レベルの少なくとも一方を制御する音量制御部
    を具備することを特徴とする請求項1又は2に記載の録音機器。
  4. 前記検出部は、前記収音部によって収音された音のうち前記対象物音声が含まれる対象音声期間において収音された音に基づいて前記第1の音量レベルを求め、前記対象音声期間以外の期間である環境音期間において収音された音に基づいて前記第2の音量レベルを求める
    ことを特徴とする請求項1乃至3のいずれ1つに記載の録音機器。
  5. 前記検出部は、前記収音部によって収音された音のうち前記対象物音声を検出して前記第1の音量レベルを求め、前記環境音を検出して前記第2の音量レベルを求める
    ことを特徴とする請求項1乃至3のいずれか1つに記載の録音機器。
  6. 前記撮像部によって撮像された撮像画像に対する画像処理によって前記撮像画像中の前記対象物を検出すると共に前記対象物音声が発生する期間を検出する画像処理部を具備し、
    前記検出部は、前記収音された音に対する音声信号処理の処理結果及び前記画像処理部の検出結果に基づいて、前記対象物音声及び前記環境音を検出する
    ことを特徴とする請求項5に記載の録音機器。
JP2012031975A 2012-02-16 2012-02-16 録音機器 Pending JP2013168878A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012031975A JP2013168878A (ja) 2012-02-16 2012-02-16 録音機器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012031975A JP2013168878A (ja) 2012-02-16 2012-02-16 録音機器

Publications (1)

Publication Number Publication Date
JP2013168878A true JP2013168878A (ja) 2013-08-29

Family

ID=49178948

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012031975A Pending JP2013168878A (ja) 2012-02-16 2012-02-16 録音機器

Country Status (1)

Country Link
JP (1) JP2013168878A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015049470A (ja) * 2013-09-04 2015-03-16 ヤマハ株式会社 信号処理装置及びそのプログラム
JP2015198413A (ja) * 2014-04-03 2015-11-09 日本電信電話株式会社 収音システム及び放音システム
WO2017119284A1 (ja) * 2016-01-08 2017-07-13 日本電気株式会社 信号処理装置、利得調整方法および利得調整プログラム
US10499156B2 (en) * 2015-05-06 2019-12-03 Xiaomi Inc. Method and device of optimizing sound signal

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015049470A (ja) * 2013-09-04 2015-03-16 ヤマハ株式会社 信号処理装置及びそのプログラム
JP2015198413A (ja) * 2014-04-03 2015-11-09 日本電信電話株式会社 収音システム及び放音システム
US10499156B2 (en) * 2015-05-06 2019-12-03 Xiaomi Inc. Method and device of optimizing sound signal
WO2017119284A1 (ja) * 2016-01-08 2017-07-13 日本電気株式会社 信号処理装置、利得調整方法および利得調整プログラム
US10825465B2 (en) 2016-01-08 2020-11-03 Nec Corporation Signal processing apparatus, gain adjustment method, and gain adjustment program

Similar Documents

Publication Publication Date Title
US20230315380A1 (en) Devices with enhanced audio
TWI496480B (zh) 偕同一可攜式電子裝置用於產生多頻道音訊之系統和方法
JP6289121B2 (ja) 音響信号処理装置、動画撮影装置およびそれらの制御方法
JP2013106298A (ja) 撮像制御装置、撮像制御方法、撮像制御方法のプログラムおよび撮像装置
CN104991754B (zh) 录音方法及装置
WO2019000721A1 (zh) 视频文件录制方法、音频文件录制方法及移动终端
CN113365012A (zh) 一种音频处理方法及设备
JP2010278725A (ja) 画像音響処理装置及び撮像装置
US10607625B2 (en) Estimating a voice signal heard by a user
WO2014061931A1 (ko) 음향 재생 장치 및 음향 재생 방법
JP5155092B2 (ja) カメラ、再生装置、および再生方法
JP5020845B2 (ja) 音声処理装置
JP2013168878A (ja) 録音機器
JP5214394B2 (ja) カメラ
WO2012086485A1 (ja) 音声制御装置および撮像装置
JP4241544B2 (ja) 電子機器、及びプログラム
JP6835205B2 (ja) 撮影収音装置、収音制御システム、撮影収音装置の制御方法、及び収音制御システムの制御方法
JP2013183280A (ja) 情報処理装置、撮像装置、及びプログラム
JP5750668B2 (ja) カメラ、再生装置、および再生方法
JP2007251355A (ja) 対話システム用中継装置、対話システム、対話方法
CN115942108A (zh) 一种视频处理方法及电子设备
JP2012068419A (ja) カラオケ装置
KR20220036210A (ko) 영상의 음질을 향상시키는 디바이스 및 방법
CN111696566A (zh) 语音处理方法、装置和介质
KR100661450B1 (ko) 복합 동영상 기기