JP6143887B2 - 方法、電子機器およびプログラム - Google Patents
方法、電子機器およびプログラム Download PDFInfo
- Publication number
- JP6143887B2 JP6143887B2 JP2015554416A JP2015554416A JP6143887B2 JP 6143887 B2 JP6143887 B2 JP 6143887B2 JP 2015554416 A JP2015554416 A JP 2015554416A JP 2015554416 A JP2015554416 A JP 2015554416A JP 6143887 B2 JP6143887 B2 JP 6143887B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- balance information
- sound
- volume
- setting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 35
- 230000001965 increasing effect Effects 0.000 claims description 28
- 238000000926 separation method Methods 0.000 claims description 17
- 238000001914 filtration Methods 0.000 claims description 8
- 238000012937 correction Methods 0.000 description 65
- 238000012545 processing Methods 0.000 description 61
- 230000005236 sound signal Effects 0.000 description 43
- 238000012805 post-processing Methods 0.000 description 32
- 230000000694 effects Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 17
- 230000007423 decrease Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 2
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 2
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 2
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000005534 acoustic noise Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012880 independent component analysis Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/028—Voice signal separating using properties of sound source
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/01—Aspects of volume control, not necessarily automatic, in sound systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/11—Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/15—Transducers incorporated in visual displaying devices, e.g. televisions, computer displays, laptops
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Television Receiver Circuits (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
本発明の実施形態は、方法、電子機器およびプログラムに関する。
テレビジョン装置やPC(Personal Computer)、タブレット端末等から音響信号を出力する際に、音響信号の音量バランスを制御することにより、音響信号の声成分の強調や背景音成分の強調を行う技術が知られている。
このような従来技術において声成分の強調や背景成分の強調を行う場合に、音響信号の音量バランスの制御だけでは十分な効果が得られない場合がある。このため、従来から、効果的に声成分の強調や背景成分の強調を行うことが望まれている。
実施形態の方法は、入力される音響信号に含まれる声と背景音のうち声に対応する第1音の大きさ、または背景音に対応する第2音の大きさのいずれか少なくとも一方のユーザの設定操作に従って、第1音の大きさと、第2音の大きさとの大小関係を設定するためのバランス情報を設定し、入力される音響信号を、第1音に対応する第1信号と第2音に対応する第2信号とに分離し、第1信号を、バランス情報に基づく第1ゲインに従って出力し、第2信号を、バランス情報に基づく第1ゲインとは異なる第2ゲインに従って出力し、第1信号と、第2信号とを、少なくとも一部重複して出力することを含む。また、バランス情報が、第1信号の音の大きさを第2信号の音の大きさに比べて大きくするためのものである場合、バランス情報の設定がなされた後、バランス情報が設定された電子機器の電源が切断され、その後電源が投入された後も、バランス情報に対応する設定を有効とするが、バランス情報が、第2信号の音の大きさを第1信号の音の大きさに比べて大きくするためのものである場合、バランス情報の設定がなされた後、バランス情報が設定された電子機器の電源が切断され、その後電源が投入された後は、バランス情報に対応する設定を無効とする。
以下に示す実施形態は、電子機器を適用したテレビジョン装置の例について説明する。しかしながら、本実施形態は、電子機器をテレビジョン装置に制限するものではなく、例えば、PCやタブレット端末等の音響を出力可能な装置であれば任意の装置に適用することができる。
(実施形態1)
本実施形態のテレビジョン装置100は、図1に示すように、デジタル放送の放送波を受信し、受信した放送波から取り出した映像信号を用いて番組の映像を表示する据置型の映像表示装置であり、録画再生機能も備えていてもよい。
本実施形態のテレビジョン装置100は、図1に示すように、デジタル放送の放送波を受信し、受信した放送波から取り出した映像信号を用いて番組の映像を表示する据置型の映像表示装置であり、録画再生機能も備えていてもよい。
テレビジョン装置100は、図1に示すように、アンテナ112、入力端子113、チューナ114および復調器115を有している。アンテナ112は、デジタル放送の放送波を捕らえ、その放送波の放送信号を、入力端子113を介してチューナ114に供給する。
チューナ114は、入力されたデジタル放送の放送信号から所望のチャンネルの放送信号を選局する。そして、チューナ114から出力された放送信号は復調器115に供給される。復調器115は、放送信号に復調処理を施し、デジタル映像信号および音声信号を復調して、後述するセレクタ116に供給する。
また、テレビジョン装置100は入力端子121,123、A/D変換部122、信号処理部124、スピーカ125および映像表示パネル102を有している。
入力端子121は外部からアナログの映像信号および音声信号が入力され、入力端子123は外部からデジタルの映像信号および音響信号が入力される。A/D変換部122は入力端子121から供給されるアナログの映像信号および音響信号をデジタル信号に変換し、セレクタ116に供給する。
セレクタ116は、復調器115、A/D変換部122および入力端子123から供給されるデジタルの映像信号及び音声信号から1つを選択して、信号処理部124に供給する。
信号処理部124は、音響処理部1241と映像処理部1242とを備えている。映像処理部1242は、入力される映像信号について、所定の信号処理やスケーリング処理等を施し、処理後の映像信号を映像表示パネル102に供給する。さらに、映像処理部1242は、映像表示パネル102に表示させるためのOSD(On Screen display)信号も生成している。また、テレビジョン装置100は、少なくともTSデマルチプレクサおよびMPEGデコーダを有し、MPEGデコーダによってデコードされた後の信号が信号処理部124に入力される。
また、音響処理部1241は、セレクタ116から入力されたデジタル音響信号に所定の信号処理を施し、アナログ音響信号に変換してスピーカ125に出力する。音響処理部1241の詳細については、後述する。スピーカ125は、信号処理部124から供給される音響信号を入力し、その音響信号を用いて音声を出力する。
そして、映像表示パネル102は、液晶ディスプレイやプラズマディスプレイ等のフラットパネルディスプレイから構成される。映像表示パネル102は、信号処理部124から供給される映像信号を用いて映像を表示する。
さらに、テレビジョン装置100は制御部127、操作部128、受光部129、HDD(Hard Disk Drive)130、メモリ131、及び通信I/F132を有している。
制御部127は、テレビジョン装置100における種々の動作を統括的に制御する。制御部127は、CPU(Central Processing Unit)等を内蔵したマイクロプロセッサであり、操作部128からの操作情報を入力する一方、リモートコントローラ150から送信された操作情報を、受光部129を介して入力し、それらの操作情報にしたがい各部をそれぞれ制御する。本実施形態の受光部129は、リモートコントローラ150からの赤外線を受光する。
この場合、制御部127は、メモリ131を使用している。メモリ131は、主として、制御部127に内蔵されているCPUが実行する制御プログラムを格納したROM(Read Only Memory)と、CPUに作業エリアを提供するためのRAM(Random Access Memory)と、各種の設定情報及び制御情報等が格納される不揮発性メモリとを有している。
HDD130は、セレクタ116で選択されたデジタルの映像信号及び音声信号を記録する記憶部としての機能を有している。テレビジョン装置100はHDD130を有するため、セレクタ116で選択されたデジタルの映像信号及び音声信号を録画データとしてHDD130により記録することができる。さらに、テレビジョン装置100は、HDD130に記録されたデジタルの映像信号及び音響信号を用いて映像および音声を再生することもできる。
通信I/F132は、公衆ネットワーク160を介して様々な通信装置(例えばサーバ)と接続されており、テレビジョン装置100で利用可能なプログラムやサービスを受信するほか、様々な情報を送信することができる。
次に、制御部127の機能的構成について説明する。本実施形態の制御部127は、図2に示すように、入力制御部201と、設定部202とを主に備えている。
入力制御部201は、ユーザからのリモートコントローラ150による操作入力を、受光部129を介して受け付けるとともに、操作部128にいる操作入力を受け付ける。本実施形態では、入力制御部201は、入力される音響信号に含まれる声成分の信号と背景成分の信号のうち、声成分の信号の音量(大きさ)の設定入力を受付ける。
ここで、音響信号は、人間の声の成分の信号と音楽等の声以外の背景音の成分の信号とから構成される。声成分の信号は、第1音の一例であり、背景音成分の信号は第2音の一例である。なお、これ以降、声成分の信号を声信号と称し、背景音成分の信号を背景音信号と称する。声信号は第1信号の一例であり、背景音信号は第2信号の一例である。
本実施形態では、信号処理部124の映像処理部1242が、声の音量指定画面をOSDとして映像表示パネル102に表示する。図3は、実施形態1にかかる声の音量指定画面の一例を示す図である。図3に示す例では、声の音量は、バー302上の目盛りで「0」から「10」までの10段階で指定可能となっている。
声の音量「0」は、声成分が殆ど出力されず、背景音成分のみが出力される値である。この場合、背景音の音量は「10」となる。声の音量「5」は、声成分と背景音成分とが均等な強さ(音量)で出力される標準の値(基準値)であり、音量「5」がデフォルト値となっている。この場合、背景音の音量も「5」となる。声の音量「10」は、声成分のみが出力され、背景音成分が殆ど出力されない値である。この場合、背景音の音量は「0」となる。
ユーザはこの声の音量指定画面において、バー302上で指示ボタン301を動かして、所望の声の音量を設定する。入力制御部201は、声の音量指定画面から指定された声の音量の設定入力を受け付ける。なお、声の音量指定画面、音量の段階は、図3に示したものに限定されるものではなく、任意に定めることができる。
図2に戻り、設定部202は、入力制御部201で入力を受け付けた声の音量(大きさ)から、背景音の音量(大きさ)を求める。ここで、設定部202は、最大の音量「10」から設定された声の音量を減算した値を背景音の音量として求める。言い換えれば、設定部202は、ユーザにより声の音量を増大する設定の入力があった場合に、背景音の音量を低減するための設定を行っている。例えば、声の音量が「5」で、従って背景音の音量も「5」に設定されている状態で、ユーザの操作により声の音量が「7」のように増加する設定がなされた場合には、設定部202は背景音の音量を「3」のように「5」から低減した値に設定する。
そして、設定部202は、声の音量と背景音の音量から、声成分と背景音成分のバランスを示すバランス情報を決定する。バランス情報は、「−1」から「+1」までの範囲の値である。−方向が声成分を大きくする方向であり、+方向が背景音成分を大きくする方向である。
すなわち、バランス情報が「−1」のときは、声成分が最も強調されて、声の音量「10」がユーザにより指定され、背景音の音量が「0」となる場合である。また、バランス情報が「+1」のときは、背景音成分が最も強調されて、声の音量「0」がユーザにより指定され、背景音の音量が「10」となる場合である。バランス情報が「0」のときは、声成分と背景音成分とが均等に強調されており、声の音量「5」で、背景音の音量も「5」となる場合である。ここで、本実施形態では、バランス情報が「0」、すなわち、声の音量が「5」で背景音の音量も「5」である場合を、デフォルト値(基準値)としているが、これに限定されるものではない。
次に、信号処理部124の音響処理部1241について説明する。本実施形態の音響処理部1241は、図4に示すように、音源分離部401と、声補正フィルタ403と、背景音補正フィルタ404と、ゲインGv405と、ゲインGb406と、加算部407とを備えている。
音源分離部402は、入力される音響信号を声成分V(声信号V)と背景音成分B(背景音信号B)に分離する。音源分離部402による音響信号の分離手法は、任意の手法を用いることができる。例えば、Boll,S.,”Suppression of acoustic noise in speech using spectral subtraction,”IEEE ASSP Trans.,27,pp.113−120,1979.(文献1)、Ephraim,Y.and Malah,D.,”Speech enhancement using a minimum−mean square error short−time spectral amplitude estimator,”IEEE ASSP Trans.,32, pp.1109−1121.(文献2)、Comon,P.,”Independent component analysis,A new concept?,” Signal Processing,Vol.36,No.3,pp.287−314,1994.(文献3)、Daniel D.Lee and H.Sebastian Seung,”Learning the parts of objects by non−negative matrix factorization”.Nature 401(6755): pp.788−791,1999(文献4)等に記載の手法を用いることができる。特に、文献4に記載のNMFの手法は、楽音や音声の分離技術として近年研究が盛んである。
声補正フィルタ403は、声信号Vの特性を補正して、補正後の声信号V’を出力する。背景音補正フィルタ404は、背景音信号Bの特性を補正して、補正後の背景音信号B’を出力する。
このような補正フィルタ403、404としては、定数値(利得調整のみ)からサラウンド等のチャネル間の相関を利用するもの等種々のものがある。例えば、声補正フィルタ403に、声信号Vに補聴器などで用いられている声の周波数特性を強調するフィルタを用いることで背景成分に影響を与えず声だけを聞こえやすくすることができる。また、背景音補正フィルタ404に、音源分離処理によって過剰に抑圧された周波数帯域を強めるフィルタや、音楽プレーヤ等に附属しているイコライザと同様な手法で聴覚的な効果を加えるフィルタなどを用いたり、背景音信号がステレオ信号である場合にはいわゆる疑似サラウンドの技術を用いたフィルタを適用することもできる。
強度による補正フィルタの制御方法として、例えば、声補正フィルタ403の振幅特性のdB値を|Hv(f)|とした場合、補正後の声信号V’は以下の(1)式で示される。なお、fは周波数インデックスである。
V’=|Hv(f)|・V ・・・(1)
V’=|Hv(f)|・V ・・・(1)
ここで、声信号の周波数特性を強調するフィルタのdB値を|Fv(f)|とした場合、|Hv(f)|は次の(2)式で示される。
|Hv(f)|=Jv(I)・|Fv(f)| ・・・(2)
|Hv(f)|=Jv(I)・|Fv(f)| ・・・(2)
強度JvをFv(f)に乗じることでJvの減少とともにフィルタ特性が平坦化し、Jv=0で|Hv(f)|=0dBとなり平坦な特性になり、フィルタ処理を行わないことと等価になる。
同様に、背景音補正フィルタ404の振幅特性のdB値を|Hb(f)|とした場合、補正後の背景音信号B’は以下の(3)式で示される。
B’=|Hb(f)|・B ・・・(3)
B’=|Hb(f)|・B ・・・(3)
ここで、背景音信号の周波数特性を強調するフィルタのdB値を|Fb(f)|とした場合、|Hb(f)|は次の(4)式で示される。
|Hb(f)|=Jb(I)・|Fb(f)| ・・・(4)
|Hb(f)|=Jb(I)・|Fb(f)| ・・・(4)
なお、強度Jvは第1パラメータの一例であり、強度Jbは第2パラメータの一例である。
声補正フィルタ403による補正後の声信号V’にはゲインGv405が乗算され、 背景音補正フィルタ404による補正後の背景音信号B’にはゲインGb406が乗算される。
ここで、本実施形態の音響処理部1241は、制御部127の設定部202からバランス情報Iを入力し、声補正フィルタ403、背景音フィルタ404の補正の強度をバランス情報Iの値に応じて変化させるとともに、ゲインGv405とGb406をバランス情報Iの値に応じて変化させている。
図5は、実施形態1のバランス情報IとゲインGv405、ゲインGb406との関係の一例を示す図である。図5において、横軸はバランス情報Iであり、縦軸はゲインGv405、ゲインGb406である。図5に示すように、バランス情報Iが−1の場合、すなわちユーザが声の音量を最大に指定した場合に、ゲインGbが0となり声のみが聞こえる状態(声強調モード)になる。
バランス情報Iが−1から0に増加するに従って、ゲインGvは一定値を維持するが、ゲインGbは、0から徐々に増加する。そして、バランス情報Iが0となった場合、すなわち、ユーザが声の音量を標準値に設定した場合に、ゲインGv、Gbはともに1となり、声と背景音のバランスを変えずに均等に出力される。
バランス情報Iが0から+1に増加するに従って、ゲインGbは一定値を維持するが、ゲインGvは、1から徐々に減少する。そして、バランス情報Iが1となった場合、すなわちユーザが声の音量を最小に指定した場合に、ゲインGvが0となり背景音のみが聞こえる状態(背景強調モード)になる。
図6は、実施形態1のバランス情報Iと声補正フィルタ403の強度Jv、背景音補正フィルタ404の強度Jbとの関係の一例を示す図である。図6において、横軸はバランス情報Iであり、縦軸は強度Jv、Jbである。図6に示すように、バランス情報Iが−1の場合、すなわちユーザが声の音量を最大に指定した場合に、声補正フィルタ403の強度Jvは最大となり、背景音補正フィルタ404の強度Jbは0となる。
バランス情報Iが−1から0に増加するに従って、声補正フィルタ403の強度Jvは徐々にへ減少し、背景音フィルタ404の強度Jbは0を維持する。そして、バランス情報Iが0となった場合、すなわち、ユーザが声の音量を標準値に設定した場合に、強度Jv、Jbはともに0となり、声と背景音はともに補正されない。
バランス情報Iが0から+1に増加するに従って、強度Jbは0から徐々に増加し、強度Jvは、0を維持する。そして、バランス情報Iが1となった場合、すなわちユーザが声の音量を最小に指定した場合に、背景音補正フィルタ404の強度Jbは最大となる。
図5、6に示すように、バランス情報Iが0の場合、Gv=Gb=1, Jv=Jb=0となり、声補正フィルタ403、背景音補正フィルタ404によるフィルタ処理(補正)は行われず、声と背景音のバランスも変えずに混合することを意味し、合成信号Yは入力音響信号Xと同一になる。図7は、声信号の周波数インデックスfと声補正フィルタ403の振幅特性のdB値|Hv(f)|の関係の一例を示している。横軸が声信号の周波数インデックスfを示し、縦軸が声補正フィルタ403の振幅特性のdB値|Hv(f)|を示している。そして、図7では、声補正フィルタ403の強度Jvの値ごとに、声信号の周波数インデックスfと声補正フィルタ403の振幅特性のdB値|Hv(f)|の関係を示す曲線を表している。
バランス情報Iが−1に向かって減少するに従い背景音のゲインGbが減少し、反対に声の強度Jvは増加するため、背景音が減少するにしたがい声の強度Jvが増加する。背景音を抑圧することで全体の音量が下がるため、声の音量も下がってしまうように錯覚される場合があるが、本実施形態では、このように、声補正フィルタ403により声の音量を上げたり、周波数特性を強調することで聴覚的な品質を改善することができる。
バランス情報Iが0から+1に向かって増加した場合も同様であり、声信号のゲインGvの減少と反対に背景音補正フィルタ404の強度Jbが増加することで背景音を効果的に強調することができる。
図4に戻り、加算部407はゲインGv405が乗算された声信号とゲインGb406が乗算された背景音信号とを加算することにより合成して一部重複させる。そして、加算部407は、両信号を合成することで得られる合成信号Yを出力する。加算部407は、出力部の一例である。
ここで、信号の表記について説明する。離散時間信号の場合、入力される音響信号XはX=x(n)(nは整数)である。音響処理部1241が音響信号Xをフレーム単位に分割して処理する場合には、X=x(m,n)で示される。ここで、mはフレーム番号、nはサンプル番号である。
また、音響処理部1241は、x(m,n)をフーリエ変換等で周波数領域に変換してX(m,f)とすることも可能である。ここで、mはフレーム番号、fは周波数インデックスとすることも可能である。また、連続時間信号 X=x(t)で実現することも可能である。
音響信号X以外の信号も同様である。マルチチャネルの場合、音響信号Xはベクトルとして表すこととし、例えば、音響信号がステレオ信号等の場合、X=(xl(n),xr(n))で表し、Nチャネルの場合は、X=(x1(n),x2(n),…,xN(n) )と表す。音響信号がステレオ信号の場合、LR信号をMS信号で表す場合がある。M信号、S信号はそれぞれ、以下の(5)、(6)式で表される。
xm(n)=(xl(n)+xr(n))/2 ・・・(5)
xs(n)=(xl(n)−xr(n))/2 ・・・(6)
xs(n)=(xl(n)−xr(n))/2 ・・・(6)
そして、X=(xm(n),xs(n))である。MS信号をフーリエ変換して用いることもできる。本実施形態では、MS信号を入力した場合でも実現可能であり、得られた合成信号Yは、(7)式から(8)、(9)式にMS逆変換されてLS信号を得ることができる。
Y=(ym(n),ys(n)) ・・・(7)
yl(n)=ym(n)+ys(n) ・・・(8)
yr(n)=ym(n)−ys(n) ・・・(9)
yl(n)=ym(n)+ys(n) ・・・(8)
yr(n)=ym(n)−ys(n) ・・・(9)
MS逆変換は処理の途中で行い、それ以降をLR信号で処理することも可能である。これ以降、特別な記述がない場合、これらをまとめてXと表記する。
次に、以上のように構成された本実施形態のテレビビジョン装置100の音響出力処理について図8を用いて説明する。
ユーザが、図3に示す声の音量設定画面から所望の声の音量の設定入力を行うと、制御部127の入力制御部201は、この声の音量の設定入力を受け付ける(ステップS11)。次に、制御部127の設定部202は、声の音量から、背景音の音量を決定する(ステップS12)。設定部202は、声の音量と背景音の音量からバランス情報を算出する(ステップS13)。さらに、設定部202は、算出したバランス情報を、メモリ131等に保存する(ステップS14)。
次に、音響処理部1241は、セレクタ116から音響信号を入力する(ステップS15)。音響処理部1241の音源分離部402は、入力された音響信号を声信号Vと背景音信号Bとに分離する(ステップS16)。
声補正フィルタ403は、上述のようにバランス情報に応じた強度Jvを算出して、強度Jvを用いて声信号Vのフィルタ処理を行う(ステップS17)。そして、音響処理部1241は、フィルタ処理後の声信号V’にバランス情報に応じたゲインGvを乗算する(ステップS18)。
一方、背景音補正フィルタ404は、上述のようにバランス情報に応じた強度Jbを算出して、強度Jbを用いて背景音信号Bのフィルタ処理を行う(ステップS19)。そして、音響処理部1241は、フィルタ処理後の背景音信号B’にバランス情報に応じたゲインGbを乗算する(ステップS20)。
そして、加算部407は、ゲインGv乗算後の声信号V’とゲインGb乗算後の背景音信号B’とを合成する(ステップS21)。そして、音響処理部1241は、合成した音響信号Yをスピーカ125に出力する(ステップS22)。
このように本実施形態では、ユーザに音響信号のうち声の成分の音量を設定させるだけで、背景音の音量が決定された上で、所望の音量に基づくバランス情報に応じたゲインの音量で音響信号が出力される。このため、本実施形態によれば、効果的に声の強調や背景音の強調を行うことができる。
また、音源分離機能を用いて声の音量や背景音の音量の増加等の強調を行う場合に音量バランスだけの制御では十分な効果が得られない場合がある。例えば、声の強調の場合、背景音が抑圧されるため全体の音量が下がり声自体も小さくなったような印象を受ける場合がある。また、背景音の強調では分離性能が完全ではないため音声と共に一部の背景音が抑圧され、音質が変わる場合がある。本実施形態では、テレビジョン装置100は、音声信号を音源分離した後に声信号と背景音信号に補正フィルタやゲインGv,ゲインGbを適用し、その際に声信号と背景音信号の音量バランスを制御するバランス情報を用いて各補正フィルタ403、404の強度およびゲインGv,ゲインGbを制御している。このため、本実施形態によれば、声と背景音のバランスに応じて効果的に声の強調や背景音の強調を行うことができる。
なお、本実施形態では、テレビジョン装置100は、音源分離後に声信号と背景音信号に対して、補正フィルタによるバランス情報に応じたフィルタ処理を行うとともに、バランス情報に応じたゲインを乗算しているが、音源分離後に声信号と背景音信号に対してフィルタ処理を行わずに、バランス情報に応じたゲインを乗算するように構成してもよい。
また、本実施形態では、ユーザが声の音量を指定して入力制御部201が当該声の音量の指定を受け付けて、設定部202がユーザより設定された声の音量から背景音の音量を決定してバランス情報を求めているが、声と背景音のいずれか少なくとも一方の音量を指定すればよく、これに限定されるものではない。例えば、ユーザに背景音の音量の設定を行わせ、入力された背景音の音量から声の音量を決定してバランス情報を求めるように入力制御部201と設定部202を構成してもよい。この場合には、設定部202がユーザより設定された背景音の音量を増大するための設定があった場合に、声の音量を減少させるように設定するように設定部202を構成することができる。
また、本実施形態では、設定部202がユーザより設定された声の音量を増大するための設定があった場合に、背景音の音量を減少させて決定していたが、ユーザより設定された声の音量を標準より増大するための設定があった場合に、背景音の音量を標準の音量に設定するように設定部202を構成してもよい。
また、声の音量と背景音の音量の双方をユーザが指定して受け付けるように入力制御部201を構成してもよい。この場合には、設定部202は、入力された、声の音量および背景音の音量からバランス情報を決定すればよい。
(実施形態2)
実施形態1では、音源分離後に声信号と背景音信号に対して、補正フィルタによるバランス情報に応じたフィルタ処理を行うとともに、バランス情報に応じたゲインを乗算していた。テレビジョン装置100等の電子機器では、音声信号に対してサラウンド等の音響効果を施す後処理が加えられる場合がある。しかしながら、後処理によっては不適切な効果や過剰な効果を音声信号に施してしまい、音声信号の品質を劣化させてしまう場合もある。これを回避すべく、この実施形態2では、さらに、合成後の音響信号に対して、バランス情報に応じた後処理を行っている。
実施形態1では、音源分離後に声信号と背景音信号に対して、補正フィルタによるバランス情報に応じたフィルタ処理を行うとともに、バランス情報に応じたゲインを乗算していた。テレビジョン装置100等の電子機器では、音声信号に対してサラウンド等の音響効果を施す後処理が加えられる場合がある。しかしながら、後処理によっては不適切な効果や過剰な効果を音声信号に施してしまい、音声信号の品質を劣化させてしまう場合もある。これを回避すべく、この実施形態2では、さらに、合成後の音響信号に対して、バランス情報に応じた後処理を行っている。
本実施形態のテレビジョン装置100の構成は実施形態1と同様である。本実施形態は、音響処理部1241の構成が実施形態1と異なっている。
本実施形態の音響処理部1241は、図9に示すように、音源分離部401と、声補正フィルタ403と、背景音補正フィルタ404と、ゲインGv405と、ゲインGb406と、加算部407と、後処理フィルタ408とを備えている。ここで、音源分離部401、声補正フィルタ403、背景音補正フィルタ404、ゲインGv405、ゲインGb406、加算部407の機能および構成は実施形態1と同様である。
図10は、実施形態2にかかる音響出力処理の手順の一例を示すフローチャートである。声の音量の設定入力の受付けから声信号と背景音信号の合成までの処理(ステップS11〜S21)は実施形態1と同様に行われる。
声信号と背景音信号とが合成されたら、後処理フィルタ408は、合成後の音響信号に対してバランス情報に応じた強度で後処理を行う(ステップS41)。そして、音響処理部1241は、後処理後の音響信号をスピーカ125に出力する(ステップS22)。
後処理フィルタ408は、サラウンドやバスブースト(低音強調)などの後処理を行うものである。後処理が合成された音響信号Yの品質を劣化させる場合がある。通常、後処理は入力される音響信号Xに行うように設計されているため、声と背景音のバランスを変えた状態では適切な効果が得られない場合がある。
また、補正フィルタ403,404と後処理フィルタ408で類似の処理を行った場合、効果が過剰となり品質劣化を招く場合がある。例えば、背景音補正フィルタ404と後処理フィルタ408の双方で音の広がり感を強調する処理(サラウンド処理)を行う処理を行う場合、背景音信号に対して双方のフィルタで二重にサラウンド処理が施され、ユーザが音質に違和感を感じる場合がある。
このため、本実施形態では、後処理フィルタ408においても、バランス情報Iに基づいた強度Jpを用いて後処理を行っている。
図11は、実施形態2の後処理フィルタの強度Jpと、声補正フィルタの強度Jv、背景音補正フィルタの強度Jbと、バランス情報Iとの関係の一例を示す図である。
図11に示すように、バランス情報Iが0から背景音を強調する+方向に増加した場合、背景音補正フィルタ404の強度Jbが増加する一方、後処理フィルタの強度Jpが低下し、バランス情報Iが1となると、強度Jpが0となって背景音補正フィルタ404のみの効果となり、後処理フィルタ408は事実上効果がなくなる。
このように強度Jpをバランス情報Iに応じて変化させることで、声と背景音のバランス情報の値によらずサラウンドの効果を一定に維持することができる。
ここで、サラウンド効果を一定に維持するだけであれば、背景音補正フィルタ404を用いずに、常に後処理フィルタ408のサラウンド効果を強度Jp=1とすることも考えられるが、この場合、後処理フィルタ408は、入力される音響信号に対して設計されるため、バランス調整により背景音を強調した音響信号に対しては効果が不適切な場合がある点である。また、声成分にもサラウンドが強度Jp=1に後処理が行われてしまう。
これに対し本実施形態では、バランス情報の値を大きくするに従い強度Jpが減少して、後処理フィルタ408によるサラウンドの効果が減少するため、背景音成分の音量と相反して不適切な後処理フィルタ408の強度は減衰する。また、声成分に対しては音量のみならず、サラウンド効果をも減少させることができる。
図12は、実施形態2の後処理フィルタ408の他の強度Jpと、声補正フィルタの強度Jv、背景音補正フィルタの強度Jbと、バランス情報Iとの関係の一例を示す図である。図12は、背景音補正フィルタ404がサラウンド効果の処理を行い、後処理フィルタ408は低音強調の後処理を行う場合の例を示している。
図12に示す例では、バランス情報Iが0から背景音を強調する方向(+方向)に増加した場合、低音強調の強度Jpを低減させる必要はない。一方、バランス情報Iが減少して声成分を強調する場合は、低音があまり強いと聞き取りにくいことも考えられるため、バランス情報Iの減少に従って強度Jpを低下させ、バランス情報Iが−1となった場合に強度Jpを0として低音強調の効果をなくし、これにより聞き取りやすい音声を出力することができる。
なお、バランス情報Iを大きくした場合に、低音強調が不自然に聞こえる場合は、サラウンドの場合と同様にバランス情報Iの増加に対して強度Jpを低下させるように構成すれば良い。このようにバランス情報Iに応じて補正フィルタ403,404の他と後処理フィルタ408の強度Jpを変化させて制御することで全体の音響効果を向上させることができる。
このように本実施形態では、補正フィルタによるバランス情報に応じたフィルタ処理を行うとともに、バランス情報に応じたゲインを乗算したが、この実施形態2では、さらに、合成後の音響信号に対して、バランス情報に応じた後処理を行っているので、後処理フィルタ408による不適切な効果や過剰な効果を抑制し全体の音響効果を高めることができる。
なお、声補正フィルタ403、背景音補正フィルタ404、後処理フィルタ408の演算を一括して行うように構成することができる。すなわち、次の(10)式のような、後処理フィルタと補正フィルタの双方の演算を行う合成したフィルタを設計して用いることができる。これにより、音響処理部1241の演算処理の負荷を低減することができる。
Z=Jp・Hp・Y=Jp・Hp(Gv・Jv・Hv・V+Gb・Jb・Hb・B)
=Gv・Jp・Hp・Jv・Hv・V+Gb・Jp・Hp・Jb・Hb・B
・・・(10)
=Gv・Jp・Hp・Jv・Hv・V+Gb・Jp・Hp・Jb・Hb・B
・・・(10)
(実施形態3)
本実施形態では、バランス情報を設定して音響出力を行った後、テレビジョン装置100の電源切断し、その後、電源オンした場合に、バランス情報が通常の視聴形態と異なる設定である場合には、バランス情報の値をデフォルト値に戻している。
本実施形態では、バランス情報を設定して音響出力を行った後、テレビジョン装置100の電源切断し、その後、電源オンした場合に、バランス情報が通常の視聴形態と異なる設定である場合には、バランス情報の値をデフォルト値に戻している。
実施形態3のテレビジョン装置100の構成は実施形態1と同様である。また、実施形態3の音響処理部1241の構成は実施形態1と同様である。
本実施形態の設定部202は、バランス情報が、声の音量を背景音の音量に比べて大きくするためのものである場合、例えば、声の音量が標準の値より大きく、背景音の音量が標準の値より小さい場合、バランス情報の設定がなされた後、テレビジョン装置100の電源が切断され、その後電源が投入された後も、バランス情報に対応する設定を有効とする。
一方、設定部202は、バランス情報が、背景音の音量を声の音量に比べて大きくするためのものである場合、例えば、背景音の音量が標準の値より大きく、声の音量が標準の値より小さい場合、バランス情報の設定がなされた後、テレビジョン装置100の電源が切断され、その電源が投入された後は、バランス情報に対応する設定を無効とする。
図13は、実施形態3の制御部127の機能的構成を示すブロック図である。本実施形態の制御部127は、図13に示すように、入力制御部201と、設定部202と、判断部209とを備えている。入力制御部201の機能は実施形態1と同様である。
図14は、実施形態3の制御処理の手順の一例を示すフローチャートである。図14の処理は、テレビジョン装置100が電源切断された後、電源投入された場合に実行される。ここで、前回のバランス情報決定後のバランス情報は、実施形態1で説明したステップS14でメモリ131に保存されている。
まず、判断部209が、メモリ131から電源切断前に保存された前回のバランス情報を読み出す(ステップS51)。そして、判断部209は、バランス情報が0より大きいか否かを判断することにより、背景音信号の音量が基準値である標準(音量5)より大きいか否かを判断する(ステップS52)。
そして、背景音信号の音量が標準より大きい場合には(ステップS52:Yes)、声の音量が標準より低く、判断部209は、通常の視聴形態と異なる状態であると判断する。すなわち、声の音量を低くしてカラオケ等で番組を使用している等の特別な視聴形態であると考えられる。
このため、設定部202は、このような通常の視聴形態とは異なる音量の設定によるバランス情報を無効にして用いずに、バランス情報をデフォルト値の0に設定し(ステップS53)、バランス情報をメモリ131に保存する(ステップS54)。これにより、声と背景音とが均等に出力される。
一方、ステップS52で背景音信号の音量が標準以下である場合には(ステップS52:No)、判断部209は、前回の視聴形態は通常の視聴形態であると判断し、ステップS53、S54の処理は行われない。言い換えれば、設定部202は、設定されているバランス情報を有効として用いる。
このように、バランス情報を設定して音響出力を行った後、テレビジョン装置100の電源切断し、その後、電源オンした場合に、バランス情報が通常の視聴形態と異なる設定である場合には、バランス情報の値をデフォルト値に戻しているので、一時的に特別な視聴形態で番組を視聴していた場合でも、電源オン後に通常の視聴形態での視聴を効果的に行うことができる。
なお、本実施形態では、電源オン後に、図14の処理を実行しているが、これに限定されるものではない。例えば、番組の開始ごとに、図14の処理を実行して、バランス情報が通常の視聴形態と異なる設定であるか否かを判断して、デフォルト値に戻すように判断部209および設定部202を構成してもよい。
すなわち、バランス情報が、声の音量を背景音の音量に比べて大きくするためのものである場合、ユーザが第1番組の視聴中にバランス情報の設定がなされた場合には、設定部202は、第1番組が終了した後で第2番組が開始された場合も、バランス情報に対応する設定を有効とする。
一方、バランス情報が、背景音の音量を声の音量に比べて大きくするためのものである場合、設定部202は、ユーザが第1番組の視聴中にバランス情報の設定がなされた後、第1番組が終了した後で第2番組が開始された場合は、バランス情報に対応する設定を無効とする。ここで、設定部202は、番組の終了、開始を、外部サーバ等から受信する電子番組表(EPG:Electronic Program Guide)等を参照して判断することができるが、これに限定されるものではない。
また、ユーザがチャンネルを変更するごとに、図14の処理を実行して、バランス情報が通常の視聴形態と異なる設定であるか否かを判断して、デフォルト値に戻すように判断部209および設定部202を構成してもよい。
すなわち、バランス情報が、声の音量を背景音の音量に比べて大きくするためのものである場合、ユーザが第1チャンネルの視聴中にバランス情報の設定がなされた場合には、設定部202は、ユーザが第1チャンネルから第2チャンネルに変更した後も、このチャンネルの変更を検出して、バランス情報に対応する設定を有効とする。
一方、バランス情報が、背景音の音量を声の音量に比べて大きくするためのものである場合、設定部202は、ユーザが第1チャンネルの視聴中にバランス情報の設定がなされた後、ユーザが第1チャンネルから第2チャンネルに変更した後は、このチャンネルの変更を検出して、バランス情報に対応する設定を無効とする。
また、バランス情報が最大値の+1で、声信号の音量が第1閾値としての0に設定されているような特別な視聴形態を前回行っていた場合において、ユーザが操作部やリモートコントローラにより音量を増加する設定をした場合に、バランス情報の値をデフォルト値(標準)の0に設定するように設定部202、判断部209を構成してもよい。
図15は、この実施形態3の変形例の制御処理の手順の一例を示すフローチャートである。まず、判断部209が、メモリ131から電源切断前に保存された前回のバランス情報を読み出す(ステップS71)。そして、判断部209は、前回設定したバランス情報が+1であるか否かを判断する(ステップS72)。
そして、前回設定したバランス情報が+1である場合には(ステップS72:Yes)、ユーザが操作部等で声の音量を所定の第2閾値以上に増加させる操作を行ったか否かを判断する(ステップS73)。そして、声の音量を所定の第2閾値以上に増加させる操作を行った場合には(ステップS73:Yes)、判断部209は、前回の設定は通常の視聴形態と異なる状態であり、ユーザが通常の視聴形態を希望していると判断する。そして、設定部202は、バランス情報をデフォルト値の0に設定する(ステップS74)。
ステップS73でユーザが声の音量を所定の第2閾値まで増加させる操作を行っていない場合には(ステップS73:No)、判断部209は、ユーザが前回の設定での視聴を希望していると判断し、ステップS74の処理は行われない。
また、ステップS72で、前回設定したバランス情報が+1でない場合には(ステップS72:No)、判断部209は、前回の視聴形態は、通常の視聴形態であると判断し、ステップS73、S74の処理は行われない。
本変形例によれば、一時的に特別な視聴形態で番組を視聴していた場合でも、電源オン後に通常の視聴形態での視聴を効果的に行うことができる。
なお、この変形例では、バランス情報が最大値の+1で、声信号の音量が第1閾値として0に設定されているか否かを判断しているが、第1閾値として0以外の声信号の音量を用いるように構成してもよい。
上述した実施形態では、図3に示す声の音量設定画面によりユーザが声の音量を設定しているが、これに限定されるものではない。例えば、予め、声の音量を定めた複数のプリセットメニューを用意し、かかるプリセットメニューの中から、ユーザに所望の声の音量のプリセットメニューを選択させるように構成してもよい。このようなプリセットメニューとしては、例えば、声の音声を0に設定したカラオケの設定ボタン等があげられる。
上記実施形態のテレビジョン装置100で実行される音響出力処理プログラムは、メモリ131等のROM等に予め組み込まれてコンピュータプログラムプロダクトとして提供される。
上記実施形態のテレビジョン装置100で実行される音響出力処理プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録してコンピュータプログラムプロダクトとして提供するように構成してもよい。
さらに、上記実施形態のテレビジョン装置100で実行される音響出力処理プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることによりコンピュータプログラムプロダクトとして提供するように構成しても良い。また、上記実施形態のテレビジョン装置100で実行される音響出力処理プログラムをコンピュータプログラムプロダクトとしてインターネット等のネットワーク経由で提供または配布するように構成しても良い。
上記実施形態のテレビジョン装置100で実行される音響出力処理プログラムは、上述した各部(入力制御部201、設定部202、判断部209、音源分離部401、声補正フィルタ403、背景音補正フィルタ404、加算部407、後処理フィルタ408)を含むモジュール構成となっており、実際のハードウェアとしてはCPUが上記ROMから音響出力プログラムを読み出して実行することにより上記各部がメモリ131等のRAM上にロードされ、入力制御部201、設定部202、判断部209、音源分離部401、声補正フィルタ403、背景音補正フィルタ404、加算部407、後処理フィルタ408がRAM上に生成されるようになっている。
さらに、ここに記述されたシステムの種々のモジュールは、ソフトウェア・アプリケーション、ハードウェアおよび/またはソフトウェア・モジュール、あるいはサーバのような1台以上のコンピュータ上のコンポーネントとしてインプリメントすることができる。種々のモジュールは、別々に説明されているが、それらは同じ根本的なロジックかコードのうちのいくつかあるいはすべてを共有してもよい。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、請求の範囲に記載された発明とその均等の範囲に含まれる。
Claims (12)
- 入力される音響信号に含まれる声と背景音のうち声に対応する第1音の大きさ、または背景音に対応する第2音の大きさのいずれか少なくとも一方のユーザの設定操作に従って、前記第1音の大きさと、前記第2音の大きさとの大小関係を設定するためのバランス情報を設定し、
入力される音響信号を、前記第1音に対応する第1信号と前記第2音に対応する第2信号とに分離し、
前記第1信号を、前記バランス情報に基づく第1ゲインに従って出力し、
前記第2信号を、前記バランス情報に基づく前記第1ゲインとは異なる第2ゲインに従って出力し、
前記第1信号と、前記第2信号とを、少なくとも一部重複して出力する、ことを含み、
前記バランス情報が、前記第1信号の音の大きさを前記第2信号の音の大きさに比べて大きくするためのものである場合、前記バランス情報の設定がなされた後、前記バランス情報が設定された電子機器の電源が切断され、その後電源が投入された後も、前記バランス情報に対応する設定を有効とするが、
前記バランス情報が、前記第2信号の音の大きさを前記第1信号の音の大きさに比べて大きくするためのものである場合、前記バランス情報の設定がなされた後、前記バランス情報が設定された電子機器の電源が切断され、その後電源が投入された後は、前記バランス情報に対応する設定を無効とする、方法。 - 入力される音響信号に含まれる声と背景音のうち声に対応する第1音の大きさ、または背景音に対応する第2音の大きさのいずれか少なくとも一方のユーザの設定操作に従って、前記第1音の大きさと、前記第2音の大きさとの大小関係を設定するためのバランス情報を設定し、
入力される音響信号を、前記第1音に対応する第1信号と前記第2音に対応する第2信号とに分離し、
前記第1信号を、前記バランス情報に基づく第1ゲインに従って出力し、
前記第2信号を、前記バランス情報に基づく前記第1ゲインとは異なる第2ゲインに従って出力し、
前記第1信号と、前記第2信号とを、少なくとも一部重複して出力する、ことを含み、
前記バランス情報が、前記第1信号の音の大きさを前記第2信号の音の大きさに比べて大きくするためのものである場合、第1番組の視聴中に前記バランス情報の設定がなされ、前記第1番組が終了した後も、前記バランス情報に対応する設定を有効とするが、
前記バランス情報が、前記第2信号の音の大きさを前記第1信号の音の大きさに比べて大きくするためのものである場合、前記第1番組の視聴中に前記バランス情報の設定がなされた後、前記第1番組が終了した後は、前記バランス情報に対応する設定を無効とする、方法。 - 前記第1信号に対して、前記バランス情報に基づく第1パラメータを用いてフィルタ処理を行うとともに、前記第2信号に対して前記バランス情報に基づく第2パラメータでフィルタ処理を行う、
ことをさらに含む請求項1または2に記載の方法。 - ユーザによって前記第1信号または前記第2信号の一方の音の大きさを増大するための設定がなされた場合に、前記第1信号または前記第2信号の他方の音の大きさを低減するための設定を自動的に行う、
ことをさらに含む請求項1から3のいずれか一項に記載の方法。 - 入力される音響信号に含まれる声と背景音のうち声に対応する第1音の大きさ、または背景音に対応する第2音の大きさのいずれか少なくとも一方のユーザの設定操作に従って、前記第1音の大きさと、前記第2音の大きさとの大小関係を設定するためのバランス情報を設定する設定部と、
入力される音響信号を、前記第1音に対応する第1信号と前記第2音に対応する第2信号とに分離する分離部と、
前記第1信号を、前記バランス情報に基づく第1ゲインに従って出力し、前記第2信号を、前記バランス情報に基づく前記第1ゲインとは異なる第2ゲインに従って出力する増幅部と、
前記第1信号と、前記第2信号とを、少なくとも一部重複して出力する出力部と、を備え、
前記設定部は、前記バランス情報が、前記第1信号の音の大きさを前記第2信号の音の大きさに比べて大きくするためのものである場合、前記バランス情報の設定がなされた後、前記バランス情報が設定された電子機器の電源が切断され、その後電源が投入された後も、前記バランス情報に対応する設定を有効とするが、前記バランス情報が、前記第2信号の音の大きさを前記第1信号の音の大きさに比べて大きくするためのものである場合、前記バランス情報の設定がなされた後、前記バランス情報が設定された電子機器の電源が切断され、その後電源が投入された後は、前記バランス情報に対応する設定を無効とする、電子機器。 - 入力される音響信号に含まれる声と背景音のうち声に対応する第1音の大きさ、または背景音に対応する第2音の大きさのいずれか少なくとも一方のユーザの設定操作に従って、前記第1音の大きさと、前記第2音の大きさとの大小関係を設定するためのバランス情報を設定する設定部と、
入力される音響信号を、前記第1音に対応する第1信号と前記第2音に対応する第2信号とに分離する分離部と、
前記第1信号を、前記バランス情報に基づく第1ゲインに従って出力し、前記第2信号を、前記バランス情報に基づく前記第1ゲインとは異なる第2ゲインに従って出力する増幅部と、
前記第1信号と、前記第2信号とを、少なくとも一部重複して出力する出力部と、を備え、
前記設定部は、前記バランス情報が、前記第1信号の音の大きさを前記第2信号の音の大きさに比べて大きくするためのものである場合、第1番組の視聴中に前記バランス情報の設定がなされ、前記第1番組が終了した後も、前記バランス情報に対応する設定を有効とするが、前記バランス情報が、前記第2信号の音の大きさを前記第1信号の音の大きさに比べて大きくするためのものである場合、前記第1番組の視聴中に前記バランス情報の設定がなされた後、前記第1番組が終了した後は、前記バランス情報に対応する設定を無効とする、電子機器。 - 前記第1音の信号に対して、前記バランス情報に基づく第1パラメータを用いてフィルタ処理を行うとともに、前記第2音の信号に対して前記バランス情報に基づく第2パラメータでフィルタ処理を行うフィルタ部、
をさらに備えた請求項5または6に記載の電子機器。 - 前記設定部は、ユーザによって前記第1信号または前記第2信号の一方の音の大きさを増大するための設定がなされた場合に、前記第1信号または前記第2信号の他方の音の大きさを低減するための設定を自動的に行う、
請求項5から7のいずれか一項に記載の電子機器。 - 入力される音響信号に含まれる声と背景音のうち声に対応する第1音の大きさ、または背景音に対応する第2音の大きさのいずれか少なくとも一方のユーザの設定操作に従って、前記第1音の大きさと、前記第2音の大きさとの大小関係を設定するためのバランス情報を設定し、
入力される音響信号を、前記第1音に対応する第1信号と前記第2音に対応する第2信号とに分離し、
前記第1信号を、前記バランス情報に基づく第1ゲインに従って出力し、
前記第2信号を、前記バランス情報に基づく前記第1ゲインとは異なる第2ゲインに従って出力し、
前記第1信号と、前記第2信号とを、少なくとも一部重複して出力する、ことをコンピュータに実行させるとともに、
前記バランス情報が、前記第1信号の音の大きさを前記第2信号の音の大きさに比べて大きくするためのものである場合、前記バランス情報の設定がなされた後、前記バランス情報が設定された電子機器の電源が切断され、その後電源が投入された後も、前記バランス情報に対応する設定を有効とするが、
前記バランス情報が、前記第2信号の音の大きさを前記第1信号の音の大きさに比べて大きくするためのものである場合、前記バランス情報の設定がなされた後、前記バランス情報が設定された電子機器の電源が切断され、その後電源が投入された後は、前記バランス情報に対応する設定を無効とする、ことをさらに前記コンピュータに実行させるためのプログラム。 - 入力される音響信号に含まれる声と背景音のうち声に対応する第1音の大きさ、または背景音に対応する第2音の大きさのいずれか少なくとも一方のユーザの設定操作に従って、前記第1音の大きさと、前記第2音の大きさとの大小関係を設定するためのバランス情報を設定し、
入力される音響信号を、前記第1音に対応する第1信号と前記第2音に対応する第2信号とに分離し、
前記第1信号を、前記バランス情報に基づく第1ゲインに従って出力し、
前記第2信号を、前記バランス情報に基づく前記第1ゲインとは異なる第2ゲインに従って出力し、
前記第1信号と、前記第2信号とを、少なくとも一部重複して出力する、ことをコンピュータに実行させるとともに、
前記バランス情報が、前記第1信号の音の大きさを前記第2信号の音の大きさに比べて大きくするためのものである場合、第1番組の視聴中に前記バランス情報の設定がなされ、前記第1番組が終了した後も、前記バランス情報に対応する設定を有効とするが、
前記バランス情報が、前記第2信号の音の大きさを前記第1信号の音の大きさに比べて大きくするためのものである場合、前記第1番組の視聴中に前記バランス情報の設定がなされた後、前記第1番組が終了した後は、前記バランス情報に対応する設定を無効とする、ことをさらに前記コンピュータに実行させるためのプログラム。 - 前記第1音の信号に対して、前記バランス情報に基づく第1パラメータを用いてフィルタ処理を行うとともに、前記第2音の信号に対して前記バランス情報に基づく第2パラメータでフィルタ処理を行う、
ことをさらに前記コンピュータに実行させるための請求項9または10に記載のプログラム。 - ユーザによって前記第1信号または前記第2信号の一方の音の大きさを増大するための設定がなされた場合に、前記第1信号または前記第2信号の他方の音の大きさを低減するための設定を自動的に行う、
ことをさらに前記コンピュータに実行させるための請求項9から11のいずれか一項に記載のプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2013/084976 WO2015097829A1 (ja) | 2013-12-26 | 2013-12-26 | 方法、電子機器およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2015097829A1 JPWO2015097829A1 (ja) | 2017-03-23 |
JP6143887B2 true JP6143887B2 (ja) | 2017-06-07 |
Family
ID=53477765
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015554416A Expired - Fee Related JP6143887B2 (ja) | 2013-12-26 | 2013-12-26 | 方法、電子機器およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9865279B2 (ja) |
JP (1) | JP6143887B2 (ja) |
WO (1) | WO2015097829A1 (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8984431B2 (en) | 2009-03-16 | 2015-03-17 | Apple Inc. | Device, method, and graphical user interface for moving a current position in content at a variable scrubbing rate |
US10706096B2 (en) | 2011-08-18 | 2020-07-07 | Apple Inc. | Management of local and remote media items |
US9002322B2 (en) | 2011-09-29 | 2015-04-07 | Apple Inc. | Authentication with secondary approver |
WO2014143776A2 (en) | 2013-03-15 | 2014-09-18 | Bodhi Technology Ventures Llc | Providing remote interactions with host device using a wireless device |
EP3108342B1 (en) | 2014-05-30 | 2019-10-23 | Apple Inc. | Transition from use of one device to another |
CN106462340B (zh) | 2014-06-27 | 2019-09-13 | 苹果公司 | 尺寸减小的用户界面 |
US10339293B2 (en) | 2014-08-15 | 2019-07-02 | Apple Inc. | Authenticated device used to unlock another device |
CN110072131A (zh) | 2014-09-02 | 2019-07-30 | 苹果公司 | 音乐用户界面 |
DK179186B1 (en) | 2016-05-19 | 2018-01-15 | Apple Inc | REMOTE AUTHORIZATION TO CONTINUE WITH AN ACTION |
DK201670622A1 (en) | 2016-06-12 | 2018-02-12 | Apple Inc | User interfaces for transactions |
GB2559212B (en) * | 2016-10-19 | 2019-02-20 | Cirrus Logic Int Semiconductor Ltd | Controlling an audio system |
US11431836B2 (en) | 2017-05-02 | 2022-08-30 | Apple Inc. | Methods and interfaces for initiating media playback |
US10992795B2 (en) * | 2017-05-16 | 2021-04-27 | Apple Inc. | Methods and interfaces for home media control |
US20220279063A1 (en) | 2017-05-16 | 2022-09-01 | Apple Inc. | Methods and interfaces for home media control |
EP3952317A1 (en) * | 2017-05-16 | 2022-02-09 | Apple Inc. | Methods and interfaces for home media control |
CN111343060B (zh) | 2017-05-16 | 2022-02-11 | 苹果公司 | 用于家庭媒体控制的方法和界面 |
EP3671739A1 (en) * | 2018-12-21 | 2020-06-24 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Apparatus and method for source separation using an estimation and control of sound quality |
CA3131489A1 (en) | 2019-02-27 | 2020-09-03 | Louisiana-Pacific Corporation | Fire-resistant manufactured-wood based siding |
DK201970533A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Methods and user interfaces for sharing audio |
EP4231124A1 (en) | 2019-05-31 | 2023-08-23 | Apple Inc. | User interfaces for audio media control |
US11010121B2 (en) | 2019-05-31 | 2021-05-18 | Apple Inc. | User interfaces for audio media control |
US10904029B2 (en) | 2019-05-31 | 2021-01-26 | Apple Inc. | User interfaces for managing controllable external devices |
US11079913B1 (en) | 2020-05-11 | 2021-08-03 | Apple Inc. | User interface for status indicators |
CN111612441B (zh) * | 2020-05-20 | 2023-10-20 | 腾讯科技(深圳)有限公司 | 虚拟资源的发送方法、装置以及电子设备 |
US11392291B2 (en) | 2020-09-25 | 2022-07-19 | Apple Inc. | Methods and interfaces for media control with dynamic feedback |
US11847378B2 (en) | 2021-06-06 | 2023-12-19 | Apple Inc. | User interfaces for audio routing |
GB2613185A (en) * | 2021-11-26 | 2023-05-31 | Nokia Technologies Oy | Object and ambience relative level control for rendering |
CN114615534A (zh) * | 2022-01-27 | 2022-06-10 | 海信视像科技股份有限公司 | 显示设备及音频处理方法 |
WO2023142363A1 (zh) * | 2022-01-27 | 2023-08-03 | 海信视像科技股份有限公司 | 显示设备及音频处理方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6311155B1 (en) * | 2000-02-04 | 2001-10-30 | Hearing Enhancement Company Llc | Use of voice-to-remaining audio (VRA) in consumer applications |
JP4051607B2 (ja) * | 2002-03-06 | 2008-02-27 | 船井電機株式会社 | テレビジョン受信装置 |
JP3960834B2 (ja) | 2002-03-19 | 2007-08-15 | 松下電器産業株式会社 | 音声強調装置及び音声強調方法 |
JP4018571B2 (ja) | 2003-03-24 | 2007-12-05 | 富士通株式会社 | 音声強調装置 |
JP4583781B2 (ja) * | 2003-06-12 | 2010-11-17 | アルパイン株式会社 | 音声補正装置 |
JP2007336210A (ja) * | 2006-06-14 | 2007-12-27 | Mitsubishi Electric Corp | 車載用オーディオ機器の音量制御装置 |
JP5231139B2 (ja) | 2008-08-27 | 2013-07-10 | 株式会社日立製作所 | 音源抽出装置 |
KR101624652B1 (ko) * | 2009-11-24 | 2016-05-26 | 삼성전자주식회사 | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치, 잡음 환경에서 음성 신호를 강화하는 방법 및 그 장치 |
JP2011155541A (ja) * | 2010-01-28 | 2011-08-11 | Toshiba Corp | 音量調整装置 |
JP5662276B2 (ja) | 2011-08-05 | 2015-01-28 | 株式会社東芝 | 音響信号処理装置および音響信号処理方法 |
JP5737808B2 (ja) * | 2011-08-31 | 2015-06-17 | 日本放送協会 | 音響処理装置およびそのプログラム |
US9208772B2 (en) * | 2011-12-23 | 2015-12-08 | Bose Corporation | Communications headset speech-based gain control |
-
2013
- 2013-12-26 JP JP2015554416A patent/JP6143887B2/ja not_active Expired - Fee Related
- 2013-12-26 WO PCT/JP2013/084976 patent/WO2015097829A1/ja active Application Filing
-
2016
- 2016-02-22 US US15/050,188 patent/US9865279B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
WO2015097829A1 (ja) | 2015-07-02 |
US20160210983A1 (en) | 2016-07-21 |
JPWO2015097829A1 (ja) | 2017-03-23 |
US9865279B2 (en) | 2018-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6143887B2 (ja) | 方法、電子機器およびプログラム | |
JP5085769B1 (ja) | 音響制御装置、音響補正装置、及び音響補正方法 | |
TWI535299B (zh) | 低音強化系統及其方法 | |
JP6253671B2 (ja) | 電子機器、制御方法およびプログラム | |
TWI431613B (zh) | 資源受限的客戶端裝置之上游品質增強信號處理 | |
JP5802753B2 (ja) | マルチチャンネルオーディオ再生のためのアップミキシング方法及びシステム | |
US20110002467A1 (en) | Dynamic enhancement of audio signals | |
JP5012995B2 (ja) | オーディオ信号処理装置及びオーディオ信号処理方法 | |
JP2009055079A (ja) | 信号処理装置、信号処理方法、プログラム | |
JP2009288669A (ja) | 音質補正装置、音質補正方法及び音質補正用プログラム | |
JP2015050685A (ja) | オーディオ信号処理装置および方法、並びにプログラム | |
US9071215B2 (en) | Audio signal processing device, method, program, and recording medium for processing audio signal to be reproduced by plurality of speakers | |
JP4982617B1 (ja) | 音響制御装置、音響補正装置、及び音響補正方法 | |
JP6039108B2 (ja) | 電子機器、制御方法およびプログラム | |
KR102522567B1 (ko) | 전자 장치 및 그 동작 방법 | |
JP2023544253A (ja) | バイノーラル記録を処理するための方法及びデバイス | |
JP2013106197A (ja) | 音質制御装置、音質制御方法及び音質制御用プログラム | |
JP2012134842A (ja) | 音質制御装置、音質制御方法及び音質制御用プログラム | |
JP2012027101A (ja) | 音声再生装置、音声再生方法、プログラム、及び、記録媒体 | |
JP2018173442A (ja) | 効果付与装置及び効果付与プログラム | |
JP2008304635A (ja) | 音声信号処理装置、音声再生装置および音声信号処理方法 | |
JP2009206819A (ja) | 音声信号処理装置、音声信号処理方法、音声信号処理プログラム、記録媒体、表示装置、並びに、表示装置用ラック | |
WO2019155603A1 (ja) | 音響信号処理装置及び音響信号処理方法 | |
JP2010191302A (ja) | 音声出力装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170411 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170509 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6143887 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |