JP6143887B2

JP6143887B2 - 方法、電子機器およびプログラム

Info

Publication number: JP6143887B2
Application number: JP2015554416A
Authority: JP
Inventors: 天田　皇; 皇天田; 竹内　広和; 広和竹内
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2013-12-26
Filing date: 2013-12-26
Publication date: 2017-06-07
Anticipated expiration: 2033-12-26
Also published as: WO2015097829A1; US20160210983A1; JPWO2015097829A1; US9865279B2

Description

本発明の実施形態は、方法、電子機器およびプログラムに関する。

テレビジョン装置やＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）、タブレット端末等から音響信号を出力する際に、音響信号の音量バランスを制御することにより、音響信号の声成分の強調や背景音成分の強調を行う技術が知られている。

特開２００４−２８９６１４号公報

このような従来技術において声成分の強調や背景成分の強調を行う場合に、音響信号の音量バランスの制御だけでは十分な効果が得られない場合がある。このため、従来から、効果的に声成分の強調や背景成分の強調を行うことが望まれている。

実施形態の方法は、入力される音響信号に含まれる声と背景音のうち声に対応する第１音の大きさ、または背景音に対応する第２音の大きさのいずれか少なくとも一方のユーザの設定操作に従って、第１音の大きさと、第２音の大きさとの大小関係を設定するためのバランス情報を設定し、入力される音響信号を、第１音に対応する第１信号と第２音に対応する第２信号とに分離し、第１信号を、バランス情報に基づく第１ゲインに従って出力し、第２信号を、バランス情報に基づく第１ゲインとは異なる第２ゲインに従って出力し、第１信号と、第２信号とを、少なくとも一部重複して出力することを含む。また、バランス情報が、第１信号の音の大きさを第２信号の音の大きさに比べて大きくするためのものである場合、バランス情報の設定がなされた後、バランス情報が設定された電子機器の電源が切断され、その後電源が投入された後も、バランス情報に対応する設定を有効とするが、バランス情報が、第２信号の音の大きさを第１信号の音の大きさに比べて大きくするためのものである場合、バランス情報の設定がなされた後、バランス情報が設定された電子機器の電源が切断され、その後電源が投入された後は、バランス情報に対応する設定を無効とする。

図１は、実施形態１にかかるデジタルテレビの構成を示すブロック図である。図２は、実施形態１の制御部の機能的構成の一例を示すブロック図である。図３は、実施形態１にかかる声の音量指定画面の一例を示す図である。図４は、実施形態１の音響処理部の構成の一例を示す図である。図５は、実施形態１のバランス情報とゲインＧｖ、Ｇｂとの関係の一例を示す図である。図６は、実施形態１のバランス情報と声補正フィルタの強度、背景音補正フィルタの強度との関係の一例を示す図である。図７は、声信号の周波数インデックスと声補正フィルタの振幅特性のｄＢ値｜Ｈｖ（ｆ）｜の関係の一例を示す図である。図８は、実施形態１にかかる音響出力処理の手順の一例を示すフローチャートである。図９は、実施形態２にかかる音響処理部の構成の一例を示す図である。図１０は、実施形態２にかかる音響出力処理の手順の一例を示すフローチャートである。図１１は、実施形態２の後処理フィルタの強度Ｊｐと、声補正フィルタの強度Ｊｖ、背景音補正フィルタの強度Ｊｂと、バランス情報Ｉとの関係の一例を示す図である。図１２は、実施形態２の後処理フィルタの他の強度Ｊｐと、声補正フィルタの強度Ｊｖ、背景音補正フィルタの強度Ｊｂと、バランス情報Ｉとの関係の一例を示す図である。図１３は、実施形態３の制御部の機能的構成を示すブロック図である。図１４は、実施形態３の制御処理の手順の一例を示すフローチャートである。図１５は、実施形態３の変形例の制御処理の手順の一例を示すフローチャートである。

以下に示す実施形態は、電子機器を適用したテレビジョン装置の例について説明する。しかしながら、本実施形態は、電子機器をテレビジョン装置に制限するものではなく、例えば、ＰＣやタブレット端末等の音響を出力可能な装置であれば任意の装置に適用することができる。

（実施形態１）
本実施形態のテレビジョン装置１００は、図１に示すように、デジタル放送の放送波を受信し、受信した放送波から取り出した映像信号を用いて番組の映像を表示する据置型の映像表示装置であり、録画再生機能も備えていてもよい。

テレビジョン装置１００は、図１に示すように、アンテナ１１２、入力端子１１３、チューナ１１４および復調器１１５を有している。アンテナ１１２は、デジタル放送の放送波を捕らえ、その放送波の放送信号を、入力端子１１３を介してチューナ１１４に供給する。

チューナ１１４は、入力されたデジタル放送の放送信号から所望のチャンネルの放送信号を選局する。そして、チューナ１１４から出力された放送信号は復調器１１５に供給される。復調器１１５は、放送信号に復調処理を施し、デジタル映像信号および音声信号を復調して、後述するセレクタ１１６に供給する。

また、テレビジョン装置１００は入力端子１２１，１２３、Ａ／Ｄ変換部１２２、信号処理部１２４、スピーカ１２５および映像表示パネル１０２を有している。

入力端子１２１は外部からアナログの映像信号および音声信号が入力され、入力端子１２３は外部からデジタルの映像信号および音響信号が入力される。Ａ／Ｄ変換部１２２は入力端子１２１から供給されるアナログの映像信号および音響信号をデジタル信号に変換し、セレクタ１１６に供給する。

セレクタ１１６は、復調器１１５、Ａ／Ｄ変換部１２２および入力端子１２３から供給されるデジタルの映像信号及び音声信号から１つを選択して、信号処理部１２４に供給する。

信号処理部１２４は、音響処理部１２４１と映像処理部１２４２とを備えている。映像処理部１２４２は、入力される映像信号について、所定の信号処理やスケーリング処理等を施し、処理後の映像信号を映像表示パネル１０２に供給する。さらに、映像処理部１２４２は、映像表示パネル１０２に表示させるためのＯＳＤ（ＯｎＳｃｒｅｅｎｄｉｓｐｌａｙ）信号も生成している。また、テレビジョン装置１００は、少なくともＴＳデマルチプレクサおよびＭＰＥＧデコーダを有し、ＭＰＥＧデコーダによってデコードされた後の信号が信号処理部１２４に入力される。

また、音響処理部１２４１は、セレクタ１１６から入力されたデジタル音響信号に所定の信号処理を施し、アナログ音響信号に変換してスピーカ１２５に出力する。音響処理部１２４１の詳細については、後述する。スピーカ１２５は、信号処理部１２４から供給される音響信号を入力し、その音響信号を用いて音声を出力する。

そして、映像表示パネル１０２は、液晶ディスプレイやプラズマディスプレイ等のフラットパネルディスプレイから構成される。映像表示パネル１０２は、信号処理部１２４から供給される映像信号を用いて映像を表示する。

さらに、テレビジョン装置１００は制御部１２７、操作部１２８、受光部１２９、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）１３０、メモリ１３１、及び通信Ｉ／Ｆ１３２を有している。

制御部１２７は、テレビジョン装置１００における種々の動作を統括的に制御する。制御部１２７は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）等を内蔵したマイクロプロセッサであり、操作部１２８からの操作情報を入力する一方、リモートコントローラ１５０から送信された操作情報を、受光部１２９を介して入力し、それらの操作情報にしたがい各部をそれぞれ制御する。本実施形態の受光部１２９は、リモートコントローラ１５０からの赤外線を受光する。

この場合、制御部１２７は、メモリ１３１を使用している。メモリ１３１は、主として、制御部１２７に内蔵されているＣＰＵが実行する制御プログラムを格納したＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）と、ＣＰＵに作業エリアを提供するためのＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）と、各種の設定情報及び制御情報等が格納される不揮発性メモリとを有している。

ＨＤＤ１３０は、セレクタ１１６で選択されたデジタルの映像信号及び音声信号を記録する記憶部としての機能を有している。テレビジョン装置１００はＨＤＤ１３０を有するため、セレクタ１１６で選択されたデジタルの映像信号及び音声信号を録画データとしてＨＤＤ１３０により記録することができる。さらに、テレビジョン装置１００は、ＨＤＤ１３０に記録されたデジタルの映像信号及び音響信号を用いて映像および音声を再生することもできる。

通信Ｉ／Ｆ１３２は、公衆ネットワーク１６０を介して様々な通信装置（例えばサーバ）と接続されており、テレビジョン装置１００で利用可能なプログラムやサービスを受信するほか、様々な情報を送信することができる。

次に、制御部１２７の機能的構成について説明する。本実施形態の制御部１２７は、図２に示すように、入力制御部２０１と、設定部２０２とを主に備えている。

入力制御部２０１は、ユーザからのリモートコントローラ１５０による操作入力を、受光部１２９を介して受け付けるとともに、操作部１２８にいる操作入力を受け付ける。本実施形態では、入力制御部２０１は、入力される音響信号に含まれる声成分の信号と背景成分の信号のうち、声成分の信号の音量（大きさ）の設定入力を受付ける。

ここで、音響信号は、人間の声の成分の信号と音楽等の声以外の背景音の成分の信号とから構成される。声成分の信号は、第１音の一例であり、背景音成分の信号は第２音の一例である。なお、これ以降、声成分の信号を声信号と称し、背景音成分の信号を背景音信号と称する。声信号は第１信号の一例であり、背景音信号は第２信号の一例である。

本実施形態では、信号処理部１２４の映像処理部１２４２が、声の音量指定画面をＯＳＤとして映像表示パネル１０２に表示する。図３は、実施形態１にかかる声の音量指定画面の一例を示す図である。図３に示す例では、声の音量は、バー３０２上の目盛りで「０」から「１０」までの１０段階で指定可能となっている。

声の音量「０」は、声成分が殆ど出力されず、背景音成分のみが出力される値である。この場合、背景音の音量は「１０」となる。声の音量「５」は、声成分と背景音成分とが均等な強さ（音量）で出力される標準の値（基準値）であり、音量「５」がデフォルト値となっている。この場合、背景音の音量も「５」となる。声の音量「１０」は、声成分のみが出力され、背景音成分が殆ど出力されない値である。この場合、背景音の音量は「０」となる。

ユーザはこの声の音量指定画面において、バー３０２上で指示ボタン３０１を動かして、所望の声の音量を設定する。入力制御部２０１は、声の音量指定画面から指定された声の音量の設定入力を受け付ける。なお、声の音量指定画面、音量の段階は、図３に示したものに限定されるものではなく、任意に定めることができる。

図２に戻り、設定部２０２は、入力制御部２０１で入力を受け付けた声の音量（大きさ）から、背景音の音量（大きさ）を求める。ここで、設定部２０２は、最大の音量「１０」から設定された声の音量を減算した値を背景音の音量として求める。言い換えれば、設定部２０２は、ユーザにより声の音量を増大する設定の入力があった場合に、背景音の音量を低減するための設定を行っている。例えば、声の音量が「５」で、従って背景音の音量も「５」に設定されている状態で、ユーザの操作により声の音量が「７」のように増加する設定がなされた場合には、設定部２０２は背景音の音量を「３」のように「５」から低減した値に設定する。

そして、設定部２０２は、声の音量と背景音の音量から、声成分と背景音成分のバランスを示すバランス情報を決定する。バランス情報は、「−１」から「＋１」までの範囲の値である。−方向が声成分を大きくする方向であり、＋方向が背景音成分を大きくする方向である。

すなわち、バランス情報が「−１」のときは、声成分が最も強調されて、声の音量「１０」がユーザにより指定され、背景音の音量が「０」となる場合である。また、バランス情報が「＋１」のときは、背景音成分が最も強調されて、声の音量「０」がユーザにより指定され、背景音の音量が「１０」となる場合である。バランス情報が「０」のときは、声成分と背景音成分とが均等に強調されており、声の音量「５」で、背景音の音量も「５」となる場合である。ここで、本実施形態では、バランス情報が「０」、すなわち、声の音量が「５」で背景音の音量も「５」である場合を、デフォルト値（基準値）としているが、これに限定されるものではない。

次に、信号処理部１２４の音響処理部１２４１について説明する。本実施形態の音響処理部１２４１は、図４に示すように、音源分離部４０１と、声補正フィルタ４０３と、背景音補正フィルタ４０４と、ゲインＧｖ４０５と、ゲインＧｂ４０６と、加算部４０７とを備えている。

音源分離部４０２は、入力される音響信号を声成分Ｖ（声信号Ｖ）と背景音成分Ｂ（背景音信号Ｂ）に分離する。音源分離部４０２による音響信号の分離手法は、任意の手法を用いることができる。例えば、Ｂｏｌｌ，Ｓ．，”Ｓｕｐｐｒｅｓｓｉｏｎｏｆａｃｏｕｓｔｉｃｎｏｉｓｅｉｎｓｐｅｅｃｈｕｓｉｎｇｓｐｅｃｔｒａｌｓｕｂｔｒａｃｔｉｏｎ，”ＩＥＥＥＡＳＳＰＴｒａｎｓ．，２７，ｐｐ．１１３−１２０，１９７９．（文献１）、Ｅｐｈｒａｉｍ，Ｙ．ａｎｄＭａｌａｈ，Ｄ．，”Ｓｐｅｅｃｈｅｎｈａｎｃｅｍｅｎｔｕｓｉｎｇａｍｉｎｉｍｕｍ−ｍｅａｎｓｑｕａｒｅｅｒｒｏｒｓｈｏｒｔ−ｔｉｍｅｓｐｅｃｔｒａｌａｍｐｌｉｔｕｄｅｅｓｔｉｍａｔｏｒ，”ＩＥＥＥＡＳＳＰＴｒａｎｓ．，３２，ｐｐ．１１０９−１１２１．（文献２）、Ｃｏｍｏｎ，Ｐ．，”Ｉｎｄｅｐｅｎｄｅｎｔｃｏｍｐｏｎｅｎｔａｎａｌｙｓｉｓ，Ａｎｅｗｃｏｎｃｅｐｔ？，” ＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ，Ｖｏｌ．３６，Ｎｏ．３，ｐｐ．２８７−３１４，１９９４．（文献３）、ＤａｎｉｅｌＤ．ＬｅｅａｎｄＨ．ＳｅｂａｓｔｉａｎＳｅｕｎｇ，”Ｌｅａｒｎｉｎｇｔｈｅｐａｒｔｓｏｆｏｂｊｅｃｔｓｂｙｎｏｎ−ｎｅｇａｔｉｖｅｍａｔｒｉｘｆａｃｔｏｒｉｚａｔｉｏｎ”．Ｎａｔｕｒｅ４０１（６７５５）：ｐｐ．７８８−７９１，１９９９（文献４）等に記載の手法を用いることができる。特に、文献４に記載のＮＭＦの手法は、楽音や音声の分離技術として近年研究が盛んである。

声補正フィルタ４０３は、声信号Ｖの特性を補正して、補正後の声信号Ｖ’を出力する。背景音補正フィルタ４０４は、背景音信号Ｂの特性を補正して、補正後の背景音信号Ｂ’を出力する。

このような補正フィルタ４０３、４０４としては、定数値（利得調整のみ）からサラウンド等のチャネル間の相関を利用するもの等種々のものがある。例えば、声補正フィルタ４０３に、声信号Ｖに補聴器などで用いられている声の周波数特性を強調するフィルタを用いることで背景成分に影響を与えず声だけを聞こえやすくすることができる。また、背景音補正フィルタ４０４に、音源分離処理によって過剰に抑圧された周波数帯域を強めるフィルタや、音楽プレーヤ等に附属しているイコライザと同様な手法で聴覚的な効果を加えるフィルタなどを用いたり、背景音信号がステレオ信号である場合にはいわゆる疑似サラウンドの技術を用いたフィルタを適用することもできる。

強度による補正フィルタの制御方法として、例えば、声補正フィルタ４０３の振幅特性のｄＢ値を｜Ｈｖ（ｆ）｜とした場合、補正後の声信号Ｖ’は以下の（１）式で示される。なお、ｆは周波数インデックスである。
Ｖ’＝｜Ｈｖ（ｆ）｜・Ｖ・・・（１）

ここで、声信号の周波数特性を強調するフィルタのｄＢ値を｜Ｆｖ（ｆ）｜とした場合、｜Ｈｖ（ｆ）｜は次の（２）式で示される。
｜Ｈｖ（ｆ）｜＝Ｊｖ（Ｉ）・｜Ｆｖ（ｆ）｜・・・（２）

強度ＪｖをＦｖ（ｆ）に乗じることでＪｖの減少とともにフィルタ特性が平坦化し、Ｊｖ＝０で｜Ｈｖ（ｆ）｜＝０ｄＢとなり平坦な特性になり、フィルタ処理を行わないことと等価になる。

同様に、背景音補正フィルタ４０４の振幅特性のｄＢ値を｜Ｈｂ（ｆ）｜とした場合、補正後の背景音信号Ｂ’は以下の（３）式で示される。
Ｂ’＝｜Ｈｂ（ｆ）｜・Ｂ・・・（３）

ここで、背景音信号の周波数特性を強調するフィルタのｄＢ値を｜Ｆｂ（ｆ）｜とした場合、｜Ｈｂ（ｆ）｜は次の（４）式で示される。
｜Ｈｂ（ｆ）｜＝Ｊｂ（Ｉ）・｜Ｆｂ（ｆ）｜・・・（４）

なお、強度Ｊｖは第１パラメータの一例であり、強度Ｊｂは第２パラメータの一例である。

声補正フィルタ４０３による補正後の声信号Ｖ’にはゲインＧｖ４０５が乗算され、背景音補正フィルタ４０４による補正後の背景音信号Ｂ’にはゲインＧｂ４０６が乗算される。

ここで、本実施形態の音響処理部１２４１は、制御部１２７の設定部２０２からバランス情報Ｉを入力し、声補正フィルタ４０３、背景音フィルタ４０４の補正の強度をバランス情報Ｉの値に応じて変化させるとともに、ゲインＧｖ４０５とＧｂ４０６をバランス情報Ｉの値に応じて変化させている。

図５は、実施形態１のバランス情報ＩとゲインＧｖ４０５、ゲインＧｂ４０６との関係の一例を示す図である。図５において、横軸はバランス情報Ｉであり、縦軸はゲインＧｖ４０５、ゲインＧｂ４０６である。図５に示すように、バランス情報Ｉが−１の場合、すなわちユーザが声の音量を最大に指定した場合に、ゲインＧｂが０となり声のみが聞こえる状態（声強調モード）になる。

バランス情報Ｉが−１から０に増加するに従って、ゲインＧｖは一定値を維持するが、ゲインＧｂは、０から徐々に増加する。そして、バランス情報Ｉが０となった場合、すなわち、ユーザが声の音量を標準値に設定した場合に、ゲインＧｖ、Ｇｂはともに１となり、声と背景音のバランスを変えずに均等に出力される。

バランス情報Ｉが０から＋１に増加するに従って、ゲインＧｂは一定値を維持するが、ゲインＧｖは、１から徐々に減少する。そして、バランス情報Ｉが１となった場合、すなわちユーザが声の音量を最小に指定した場合に、ゲインＧｖが０となり背景音のみが聞こえる状態（背景強調モード）になる。

図６は、実施形態１のバランス情報Ｉと声補正フィルタ４０３の強度Ｊｖ、背景音補正フィルタ４０４の強度Ｊｂとの関係の一例を示す図である。図６において、横軸はバランス情報Ｉであり、縦軸は強度Ｊｖ、Ｊｂである。図６に示すように、バランス情報Ｉが−１の場合、すなわちユーザが声の音量を最大に指定した場合に、声補正フィルタ４０３の強度Ｊｖは最大となり、背景音補正フィルタ４０４の強度Ｊｂは０となる。

バランス情報Ｉが−１から０に増加するに従って、声補正フィルタ４０３の強度Ｊｖは徐々にへ減少し、背景音フィルタ４０４の強度Ｊｂは０を維持する。そして、バランス情報Ｉが０となった場合、すなわち、ユーザが声の音量を標準値に設定した場合に、強度Ｊｖ、Ｊｂはともに０となり、声と背景音はともに補正されない。

バランス情報Ｉが０から＋１に増加するに従って、強度Ｊｂは０から徐々に増加し、強度Ｊｖは、０を維持する。そして、バランス情報Ｉが１となった場合、すなわちユーザが声の音量を最小に指定した場合に、背景音補正フィルタ４０４の強度Ｊｂは最大となる。

図５、６に示すように、バランス情報Ｉが０の場合、Ｇｖ＝Ｇｂ＝１，Ｊｖ＝Ｊｂ＝０となり、声補正フィルタ４０３、背景音補正フィルタ４０４によるフィルタ処理（補正）は行われず、声と背景音のバランスも変えずに混合することを意味し、合成信号Ｙは入力音響信号Ｘと同一になる。図７は、声信号の周波数インデックスｆと声補正フィルタ４０３の振幅特性のｄＢ値｜Ｈｖ（ｆ）｜の関係の一例を示している。横軸が声信号の周波数インデックスｆを示し、縦軸が声補正フィルタ４０３の振幅特性のｄＢ値｜Ｈｖ（ｆ）｜を示している。そして、図７では、声補正フィルタ４０３の強度Ｊｖの値ごとに、声信号の周波数インデックスｆと声補正フィルタ４０３の振幅特性のｄＢ値｜Ｈｖ（ｆ）｜の関係を示す曲線を表している。

バランス情報Ｉが−１に向かって減少するに従い背景音のゲインＧｂが減少し、反対に声の強度Ｊｖは増加するため、背景音が減少するにしたがい声の強度Ｊｖが増加する。背景音を抑圧することで全体の音量が下がるため、声の音量も下がってしまうように錯覚される場合があるが、本実施形態では、このように、声補正フィルタ４０３により声の音量を上げたり、周波数特性を強調することで聴覚的な品質を改善することができる。

バランス情報Ｉが０から＋１に向かって増加した場合も同様であり、声信号のゲインＧｖの減少と反対に背景音補正フィルタ４０４の強度Ｊｂが増加することで背景音を効果的に強調することができる。

図４に戻り、加算部４０７はゲインＧｖ４０５が乗算された声信号とゲインＧｂ４０６が乗算された背景音信号とを加算することにより合成して一部重複させる。そして、加算部４０７は、両信号を合成することで得られる合成信号Ｙを出力する。加算部４０７は、出力部の一例である。

ここで、信号の表記について説明する。離散時間信号の場合、入力される音響信号ＸはＸ＝ｘ（ｎ）（ｎは整数）である。音響処理部１２４１が音響信号Ｘをフレーム単位に分割して処理する場合には、Ｘ＝ｘ（ｍ，ｎ）で示される。ここで、ｍはフレーム番号、ｎはサンプル番号である。

また、音響処理部１２４１は、ｘ（ｍ，ｎ）をフーリエ変換等で周波数領域に変換してＸ（ｍ，ｆ）とすることも可能である。ここで、ｍはフレーム番号、ｆは周波数インデックスとすることも可能である。また、連続時間信号Ｘ＝ｘ（ｔ）で実現することも可能である。

音響信号Ｘ以外の信号も同様である。マルチチャネルの場合、音響信号Ｘはベクトルとして表すこととし、例えば、音響信号がステレオ信号等の場合、Ｘ＝（ｘｌ（ｎ），ｘｒ（ｎ））で表し、Ｎチャネルの場合は、Ｘ＝（ｘ１（ｎ），ｘ２（ｎ），…，ｘＮ（ｎ））と表す。音響信号がステレオ信号の場合、ＬＲ信号をＭＳ信号で表す場合がある。Ｍ信号、Ｓ信号はそれぞれ、以下の（５）、（６）式で表される。

ｘｍ（ｎ）＝（ｘｌ（ｎ）＋ｘｒ（ｎ））／２・・・（５）
ｘｓ（ｎ）＝（ｘｌ（ｎ）−ｘｒ（ｎ））／２・・・（６）

そして、Ｘ＝（ｘｍ（ｎ），ｘｓ（ｎ））である。ＭＳ信号をフーリエ変換して用いることもできる。本実施形態では、ＭＳ信号を入力した場合でも実現可能であり、得られた合成信号Ｙは、（７）式から（８）、（９）式にＭＳ逆変換されてＬＳ信号を得ることができる。

Ｙ＝（ｙｍ（ｎ），ｙｓ（ｎ））・・・（７）
ｙｌ（ｎ）＝ｙｍ（ｎ）＋ｙｓ（ｎ）・・・（８）
ｙｒ（ｎ）＝ｙｍ（ｎ）−ｙｓ（ｎ）・・・（９）

ＭＳ逆変換は処理の途中で行い、それ以降をＬＲ信号で処理することも可能である。これ以降、特別な記述がない場合、これらをまとめてＸと表記する。

次に、以上のように構成された本実施形態のテレビビジョン装置１００の音響出力処理について図８を用いて説明する。

ユーザが、図３に示す声の音量設定画面から所望の声の音量の設定入力を行うと、制御部１２７の入力制御部２０１は、この声の音量の設定入力を受け付ける（ステップＳ１１）。次に、制御部１２７の設定部２０２は、声の音量から、背景音の音量を決定する（ステップＳ１２）。設定部２０２は、声の音量と背景音の音量からバランス情報を算出する（ステップＳ１３）。さらに、設定部２０２は、算出したバランス情報を、メモリ１３１等に保存する（ステップＳ１４）。

次に、音響処理部１２４１は、セレクタ１１６から音響信号を入力する（ステップＳ１５）。音響処理部１２４１の音源分離部４０２は、入力された音響信号を声信号Ｖと背景音信号Ｂとに分離する（ステップＳ１６）。

声補正フィルタ４０３は、上述のようにバランス情報に応じた強度Ｊｖを算出して、強度Ｊｖを用いて声信号Ｖのフィルタ処理を行う（ステップＳ１７）。そして、音響処理部１２４１は、フィルタ処理後の声信号Ｖ’にバランス情報に応じたゲインＧｖを乗算する（ステップＳ１８）。

一方、背景音補正フィルタ４０４は、上述のようにバランス情報に応じた強度Ｊｂを算出して、強度Ｊｂを用いて背景音信号Ｂのフィルタ処理を行う（ステップＳ１９）。そして、音響処理部１２４１は、フィルタ処理後の背景音信号Ｂ’にバランス情報に応じたゲインＧｂを乗算する（ステップＳ２０）。

そして、加算部４０７は、ゲインＧｖ乗算後の声信号Ｖ’とゲインＧｂ乗算後の背景音信号Ｂ’とを合成する（ステップＳ２１）。そして、音響処理部１２４１は、合成した音響信号Ｙをスピーカ１２５に出力する（ステップＳ２２）。

このように本実施形態では、ユーザに音響信号のうち声の成分の音量を設定させるだけで、背景音の音量が決定された上で、所望の音量に基づくバランス情報に応じたゲインの音量で音響信号が出力される。このため、本実施形態によれば、効果的に声の強調や背景音の強調を行うことができる。

また、音源分離機能を用いて声の音量や背景音の音量の増加等の強調を行う場合に音量バランスだけの制御では十分な効果が得られない場合がある。例えば、声の強調の場合、背景音が抑圧されるため全体の音量が下がり声自体も小さくなったような印象を受ける場合がある。また、背景音の強調では分離性能が完全ではないため音声と共に一部の背景音が抑圧され、音質が変わる場合がある。本実施形態では、テレビジョン装置１００は、音声信号を音源分離した後に声信号と背景音信号に補正フィルタやゲインＧｖ，ゲインＧｂを適用し、その際に声信号と背景音信号の音量バランスを制御するバランス情報を用いて各補正フィルタ４０３、４０４の強度およびゲインＧｖ，ゲインＧｂを制御している。このため、本実施形態によれば、声と背景音のバランスに応じて効果的に声の強調や背景音の強調を行うことができる。

なお、本実施形態では、テレビジョン装置１００は、音源分離後に声信号と背景音信号に対して、補正フィルタによるバランス情報に応じたフィルタ処理を行うとともに、バランス情報に応じたゲインを乗算しているが、音源分離後に声信号と背景音信号に対してフィルタ処理を行わずに、バランス情報に応じたゲインを乗算するように構成してもよい。

また、本実施形態では、ユーザが声の音量を指定して入力制御部２０１が当該声の音量の指定を受け付けて、設定部２０２がユーザより設定された声の音量から背景音の音量を決定してバランス情報を求めているが、声と背景音のいずれか少なくとも一方の音量を指定すればよく、これに限定されるものではない。例えば、ユーザに背景音の音量の設定を行わせ、入力された背景音の音量から声の音量を決定してバランス情報を求めるように入力制御部２０１と設定部２０２を構成してもよい。この場合には、設定部２０２がユーザより設定された背景音の音量を増大するための設定があった場合に、声の音量を減少させるように設定するように設定部２０２を構成することができる。

また、本実施形態では、設定部２０２がユーザより設定された声の音量を増大するための設定があった場合に、背景音の音量を減少させて決定していたが、ユーザより設定された声の音量を標準より増大するための設定があった場合に、背景音の音量を標準の音量に設定するように設定部２０２を構成してもよい。

また、声の音量と背景音の音量の双方をユーザが指定して受け付けるように入力制御部２０１を構成してもよい。この場合には、設定部２０２は、入力された、声の音量および背景音の音量からバランス情報を決定すればよい。

（実施形態２）
実施形態１では、音源分離後に声信号と背景音信号に対して、補正フィルタによるバランス情報に応じたフィルタ処理を行うとともに、バランス情報に応じたゲインを乗算していた。テレビジョン装置１００等の電子機器では、音声信号に対してサラウンド等の音響効果を施す後処理が加えられる場合がある。しかしながら、後処理によっては不適切な効果や過剰な効果を音声信号に施してしまい、音声信号の品質を劣化させてしまう場合もある。これを回避すべく、この実施形態２では、さらに、合成後の音響信号に対して、バランス情報に応じた後処理を行っている。

本実施形態のテレビジョン装置１００の構成は実施形態１と同様である。本実施形態は、音響処理部１２４１の構成が実施形態１と異なっている。

本実施形態の音響処理部１２４１は、図９に示すように、音源分離部４０１と、声補正フィルタ４０３と、背景音補正フィルタ４０４と、ゲインＧｖ４０５と、ゲインＧｂ４０６と、加算部４０７と、後処理フィルタ４０８とを備えている。ここで、音源分離部４０１、声補正フィルタ４０３、背景音補正フィルタ４０４、ゲインＧｖ４０５、ゲインＧｂ４０６、加算部４０７の機能および構成は実施形態１と同様である。

図１０は、実施形態２にかかる音響出力処理の手順の一例を示すフローチャートである。声の音量の設定入力の受付けから声信号と背景音信号の合成までの処理（ステップＳ１１〜Ｓ２１）は実施形態１と同様に行われる。

声信号と背景音信号とが合成されたら、後処理フィルタ４０８は、合成後の音響信号に対してバランス情報に応じた強度で後処理を行う（ステップＳ４１）。そして、音響処理部１２４１は、後処理後の音響信号をスピーカ１２５に出力する（ステップＳ２２）。

後処理フィルタ４０８は、サラウンドやバスブースト（低音強調）などの後処理を行うものである。後処理が合成された音響信号Ｙの品質を劣化させる場合がある。通常、後処理は入力される音響信号Ｘに行うように設計されているため、声と背景音のバランスを変えた状態では適切な効果が得られない場合がある。

また、補正フィルタ４０３，４０４と後処理フィルタ４０８で類似の処理を行った場合、効果が過剰となり品質劣化を招く場合がある。例えば、背景音補正フィルタ４０４と後処理フィルタ４０８の双方で音の広がり感を強調する処理（サラウンド処理）を行う処理を行う場合、背景音信号に対して双方のフィルタで二重にサラウンド処理が施され、ユーザが音質に違和感を感じる場合がある。

このため、本実施形態では、後処理フィルタ４０８においても、バランス情報Ｉに基づいた強度Ｊｐを用いて後処理を行っている。

図１１は、実施形態２の後処理フィルタの強度Ｊｐと、声補正フィルタの強度Ｊｖ、背景音補正フィルタの強度Ｊｂと、バランス情報Ｉとの関係の一例を示す図である。

図１１に示すように、バランス情報Ｉが０から背景音を強調する＋方向に増加した場合、背景音補正フィルタ４０４の強度Ｊｂが増加する一方、後処理フィルタの強度Ｊｐが低下し、バランス情報Ｉが１となると、強度Ｊｐが０となって背景音補正フィルタ４０４のみの効果となり、後処理フィルタ４０８は事実上効果がなくなる。

このように強度Ｊｐをバランス情報Ｉに応じて変化させることで、声と背景音のバランス情報の値によらずサラウンドの効果を一定に維持することができる。

ここで、サラウンド効果を一定に維持するだけであれば、背景音補正フィルタ４０４を用いずに、常に後処理フィルタ４０８のサラウンド効果を強度Ｊｐ＝１とすることも考えられるが、この場合、後処理フィルタ４０８は、入力される音響信号に対して設計されるため、バランス調整により背景音を強調した音響信号に対しては効果が不適切な場合がある点である。また、声成分にもサラウンドが強度Ｊｐ＝１に後処理が行われてしまう。

これに対し本実施形態では、バランス情報の値を大きくするに従い強度Ｊｐが減少して、後処理フィルタ４０８によるサラウンドの効果が減少するため、背景音成分の音量と相反して不適切な後処理フィルタ４０８の強度は減衰する。また、声成分に対しては音量のみならず、サラウンド効果をも減少させることができる。

図１２は、実施形態２の後処理フィルタ４０８の他の強度Ｊｐと、声補正フィルタの強度Ｊｖ、背景音補正フィルタの強度Ｊｂと、バランス情報Ｉとの関係の一例を示す図である。図１２は、背景音補正フィルタ４０４がサラウンド効果の処理を行い、後処理フィルタ４０８は低音強調の後処理を行う場合の例を示している。

図１２に示す例では、バランス情報Ｉが０から背景音を強調する方向（＋方向）に増加した場合、低音強調の強度Ｊｐを低減させる必要はない。一方、バランス情報Ｉが減少して声成分を強調する場合は、低音があまり強いと聞き取りにくいことも考えられるため、バランス情報Ｉの減少に従って強度Ｊｐを低下させ、バランス情報Ｉが−１となった場合に強度Ｊｐを０として低音強調の効果をなくし、これにより聞き取りやすい音声を出力することができる。

なお、バランス情報Ｉを大きくした場合に、低音強調が不自然に聞こえる場合は、サラウンドの場合と同様にバランス情報Ｉの増加に対して強度Ｊｐを低下させるように構成すれば良い。このようにバランス情報Ｉに応じて補正フィルタ４０３，４０４の他と後処理フィルタ４０８の強度Ｊｐを変化させて制御することで全体の音響効果を向上させることができる。

このように本実施形態では、補正フィルタによるバランス情報に応じたフィルタ処理を行うとともに、バランス情報に応じたゲインを乗算したが、この実施形態２では、さらに、合成後の音響信号に対して、バランス情報に応じた後処理を行っているので、後処理フィルタ４０８による不適切な効果や過剰な効果を抑制し全体の音響効果を高めることができる。

なお、声補正フィルタ４０３、背景音補正フィルタ４０４、後処理フィルタ４０８の演算を一括して行うように構成することができる。すなわち、次の（１０）式のような、後処理フィルタと補正フィルタの双方の演算を行う合成したフィルタを設計して用いることができる。これにより、音響処理部１２４１の演算処理の負荷を低減することができる。

Ｚ＝Ｊｐ・Ｈｐ・Ｙ＝Ｊｐ・Ｈｐ（Ｇｖ・Ｊｖ・Ｈｖ・Ｖ＋Ｇｂ・Ｊｂ・Ｈｂ・Ｂ）
＝Ｇｖ・Ｊｐ・Ｈｐ・Ｊｖ・Ｈｖ・Ｖ＋Ｇｂ・Ｊｐ・Ｈｐ・Ｊｂ・Ｈｂ・Ｂ
・・・（１０）

（実施形態３）
本実施形態では、バランス情報を設定して音響出力を行った後、テレビジョン装置１００の電源切断し、その後、電源オンした場合に、バランス情報が通常の視聴形態と異なる設定である場合には、バランス情報の値をデフォルト値に戻している。

実施形態３のテレビジョン装置１００の構成は実施形態１と同様である。また、実施形態３の音響処理部１２４１の構成は実施形態１と同様である。

本実施形態の設定部２０２は、バランス情報が、声の音量を背景音の音量に比べて大きくするためのものである場合、例えば、声の音量が標準の値より大きく、背景音の音量が標準の値より小さい場合、バランス情報の設定がなされた後、テレビジョン装置１００の電源が切断され、その後電源が投入された後も、バランス情報に対応する設定を有効とする。

一方、設定部２０２は、バランス情報が、背景音の音量を声の音量に比べて大きくするためのものである場合、例えば、背景音の音量が標準の値より大きく、声の音量が標準の値より小さい場合、バランス情報の設定がなされた後、テレビジョン装置１００の電源が切断され、その電源が投入された後は、バランス情報に対応する設定を無効とする。

図１３は、実施形態３の制御部１２７の機能的構成を示すブロック図である。本実施形態の制御部１２７は、図１３に示すように、入力制御部２０１と、設定部２０２と、判断部２０９とを備えている。入力制御部２０１の機能は実施形態１と同様である。

図１４は、実施形態３の制御処理の手順の一例を示すフローチャートである。図１４の処理は、テレビジョン装置１００が電源切断された後、電源投入された場合に実行される。ここで、前回のバランス情報決定後のバランス情報は、実施形態１で説明したステップＳ１４でメモリ１３１に保存されている。

まず、判断部２０９が、メモリ１３１から電源切断前に保存された前回のバランス情報を読み出す（ステップＳ５１）。そして、判断部２０９は、バランス情報が０より大きいか否かを判断することにより、背景音信号の音量が基準値である標準（音量５）より大きいか否かを判断する（ステップＳ５２）。

そして、背景音信号の音量が標準より大きい場合には（ステップＳ５２：Ｙｅｓ）、声の音量が標準より低く、判断部２０９は、通常の視聴形態と異なる状態であると判断する。すなわち、声の音量を低くしてカラオケ等で番組を使用している等の特別な視聴形態であると考えられる。

このため、設定部２０２は、このような通常の視聴形態とは異なる音量の設定によるバランス情報を無効にして用いずに、バランス情報をデフォルト値の０に設定し（ステップＳ５３）、バランス情報をメモリ１３１に保存する（ステップＳ５４）。これにより、声と背景音とが均等に出力される。

一方、ステップＳ５２で背景音信号の音量が標準以下である場合には（ステップＳ５２：Ｎｏ）、判断部２０９は、前回の視聴形態は通常の視聴形態であると判断し、ステップＳ５３、Ｓ５４の処理は行われない。言い換えれば、設定部２０２は、設定されているバランス情報を有効として用いる。

このように、バランス情報を設定して音響出力を行った後、テレビジョン装置１００の電源切断し、その後、電源オンした場合に、バランス情報が通常の視聴形態と異なる設定である場合には、バランス情報の値をデフォルト値に戻しているので、一時的に特別な視聴形態で番組を視聴していた場合でも、電源オン後に通常の視聴形態での視聴を効果的に行うことができる。

なお、本実施形態では、電源オン後に、図１４の処理を実行しているが、これに限定されるものではない。例えば、番組の開始ごとに、図１４の処理を実行して、バランス情報が通常の視聴形態と異なる設定であるか否かを判断して、デフォルト値に戻すように判断部２０９および設定部２０２を構成してもよい。

すなわち、バランス情報が、声の音量を背景音の音量に比べて大きくするためのものである場合、ユーザが第１番組の視聴中にバランス情報の設定がなされた場合には、設定部２０２は、第１番組が終了した後で第２番組が開始された場合も、バランス情報に対応する設定を有効とする。

一方、バランス情報が、背景音の音量を声の音量に比べて大きくするためのものである場合、設定部２０２は、ユーザが第１番組の視聴中にバランス情報の設定がなされた後、第１番組が終了した後で第２番組が開始された場合は、バランス情報に対応する設定を無効とする。ここで、設定部２０２は、番組の終了、開始を、外部サーバ等から受信する電子番組表（ＥＰＧ：ＥｌｅｃｔｒｏｎｉｃＰｒｏｇｒａｍＧｕｉｄｅ）等を参照して判断することができるが、これに限定されるものではない。

また、ユーザがチャンネルを変更するごとに、図１４の処理を実行して、バランス情報が通常の視聴形態と異なる設定であるか否かを判断して、デフォルト値に戻すように判断部２０９および設定部２０２を構成してもよい。

すなわち、バランス情報が、声の音量を背景音の音量に比べて大きくするためのものである場合、ユーザが第１チャンネルの視聴中にバランス情報の設定がなされた場合には、設定部２０２は、ユーザが第１チャンネルから第２チャンネルに変更した後も、このチャンネルの変更を検出して、バランス情報に対応する設定を有効とする。

一方、バランス情報が、背景音の音量を声の音量に比べて大きくするためのものである場合、設定部２０２は、ユーザが第１チャンネルの視聴中にバランス情報の設定がなされた後、ユーザが第１チャンネルから第２チャンネルに変更した後は、このチャンネルの変更を検出して、バランス情報に対応する設定を無効とする。

また、バランス情報が最大値の＋１で、声信号の音量が第１閾値としての０に設定されているような特別な視聴形態を前回行っていた場合において、ユーザが操作部やリモートコントローラにより音量を増加する設定をした場合に、バランス情報の値をデフォルト値（標準）の０に設定するように設定部２０２、判断部２０９を構成してもよい。

図１５は、この実施形態３の変形例の制御処理の手順の一例を示すフローチャートである。まず、判断部２０９が、メモリ１３１から電源切断前に保存された前回のバランス情報を読み出す（ステップＳ７１）。そして、判断部２０９は、前回設定したバランス情報が＋１であるか否かを判断する（ステップＳ７２）。

そして、前回設定したバランス情報が＋１である場合には（ステップＳ７２：Ｙｅｓ）、ユーザが操作部等で声の音量を所定の第２閾値以上に増加させる操作を行ったか否かを判断する（ステップＳ７３）。そして、声の音量を所定の第２閾値以上に増加させる操作を行った場合には（ステップＳ７３：Ｙｅｓ）、判断部２０９は、前回の設定は通常の視聴形態と異なる状態であり、ユーザが通常の視聴形態を希望していると判断する。そして、設定部２０２は、バランス情報をデフォルト値の０に設定する（ステップＳ７４）。

ステップＳ７３でユーザが声の音量を所定の第２閾値まで増加させる操作を行っていない場合には（ステップＳ７３：Ｎｏ）、判断部２０９は、ユーザが前回の設定での視聴を希望していると判断し、ステップＳ７４の処理は行われない。

また、ステップＳ７２で、前回設定したバランス情報が＋１でない場合には（ステップＳ７２：Ｎｏ）、判断部２０９は、前回の視聴形態は、通常の視聴形態であると判断し、ステップＳ７３、Ｓ７４の処理は行われない。

本変形例によれば、一時的に特別な視聴形態で番組を視聴していた場合でも、電源オン後に通常の視聴形態での視聴を効果的に行うことができる。

なお、この変形例では、バランス情報が最大値の＋１で、声信号の音量が第１閾値として０に設定されているか否かを判断しているが、第１閾値として０以外の声信号の音量を用いるように構成してもよい。

上述した実施形態では、図３に示す声の音量設定画面によりユーザが声の音量を設定しているが、これに限定されるものではない。例えば、予め、声の音量を定めた複数のプリセットメニューを用意し、かかるプリセットメニューの中から、ユーザに所望の声の音量のプリセットメニューを選択させるように構成してもよい。このようなプリセットメニューとしては、例えば、声の音声を０に設定したカラオケの設定ボタン等があげられる。

上記実施形態のテレビジョン装置１００で実行される音響出力処理プログラムは、メモリ１３１等のＲＯＭ等に予め組み込まれてコンピュータプログラムプロダクトとして提供される。

上記実施形態のテレビジョン装置１００で実行される音響出力処理プログラムは、インストール可能な形式又は実行可能な形式のファイルでＣＤ−ＲＯＭ、フレキシブルディスク（ＦＤ）、ＣＤ−Ｒ、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋ）等のコンピュータで読み取り可能な記録媒体に記録してコンピュータプログラムプロダクトとして提供するように構成してもよい。

さらに、上記実施形態のテレビジョン装置１００で実行される音響出力処理プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることによりコンピュータプログラムプロダクトとして提供するように構成しても良い。また、上記実施形態のテレビジョン装置１００で実行される音響出力処理プログラムをコンピュータプログラムプロダクトとしてインターネット等のネットワーク経由で提供または配布するように構成しても良い。

上記実施形態のテレビジョン装置１００で実行される音響出力処理プログラムは、上述した各部（入力制御部２０１、設定部２０２、判断部２０９、音源分離部４０１、声補正フィルタ４０３、背景音補正フィルタ４０４、加算部４０７、後処理フィルタ４０８）を含むモジュール構成となっており、実際のハードウェアとしてはＣＰＵが上記ＲＯＭから音響出力プログラムを読み出して実行することにより上記各部がメモリ１３１等のＲＡＭ上にロードされ、入力制御部２０１、設定部２０２、判断部２０９、音源分離部４０１、声補正フィルタ４０３、背景音補正フィルタ４０４、加算部４０７、後処理フィルタ４０８がＲＡＭ上に生成されるようになっている。

さらに、ここに記述されたシステムの種々のモジュールは、ソフトウェア・アプリケーション、ハードウェアおよび／またはソフトウェア・モジュール、あるいはサーバのような１台以上のコンピュータ上のコンポーネントとしてインプリメントすることができる。種々のモジュールは、別々に説明されているが、それらは同じ根本的なロジックかコードのうちのいくつかあるいはすべてを共有してもよい。

本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、請求の範囲に記載された発明とその均等の範囲に含まれる。

Claims

入力される音響信号に含まれる声と背景音のうち声に対応する第１音の大きさ、または背景音に対応する第２音の大きさのいずれか少なくとも一方のユーザの設定操作に従って、前記第１音の大きさと、前記第２音の大きさとの大小関係を設定するためのバランス情報を設定し、
入力される音響信号を、前記第１音に対応する第１信号と前記第２音に対応する第２信号とに分離し、
前記第１信号を、前記バランス情報に基づく第１ゲインに従って出力し、
前記第２信号を、前記バランス情報に基づく前記第１ゲインとは異なる第２ゲインに従って出力し、
前記第１信号と、前記第２信号とを、少なくとも一部重複して出力する、ことを含み、
前記バランス情報が、前記第１信号の音の大きさを前記第２信号の音の大きさに比べて大きくするためのものである場合、前記バランス情報の設定がなされた後、前記バランス情報が設定された電子機器の電源が切断され、その後電源が投入された後も、前記バランス情報に対応する設定を有効とするが、
前記バランス情報が、前記第２信号の音の大きさを前記第１信号の音の大きさに比べて大きくするためのものである場合、前記バランス情報の設定がなされた後、前記バランス情報が設定された電子機器の電源が切断され、その後電源が投入された後は、前記バランス情報に対応する設定を無効とする、方法。
入力される音響信号に含まれる声と背景音のうち声に対応する第１音の大きさ、または背景音に対応する第２音の大きさのいずれか少なくとも一方のユーザの設定操作に従って、前記第１音の大きさと、前記第２音の大きさとの大小関係を設定するためのバランス情報を設定し、
入力される音響信号を、前記第１音に対応する第１信号と前記第２音に対応する第２信号とに分離し、
前記第１信号を、前記バランス情報に基づく第１ゲインに従って出力し、
前記第２信号を、前記バランス情報に基づく前記第１ゲインとは異なる第２ゲインに従って出力し、
前記第１信号と、前記第２信号とを、少なくとも一部重複して出力する、ことを含み、
前記バランス情報が、前記第１信号の音の大きさを前記第２信号の音の大きさに比べて大きくするためのものである場合、第１番組の視聴中に前記バランス情報の設定がなされ、前記第１番組が終了した後も、前記バランス情報に対応する設定を有効とするが、
前記バランス情報が、前記第２信号の音の大きさを前記第１信号の音の大きさに比べて大きくするためのものである場合、前記第１番組の視聴中に前記バランス情報の設定がなされた後、前記第１番組が終了した後は、前記バランス情報に対応する設定を無効とする、方法。
前記第１信号に対して、前記バランス情報に基づく第１パラメータを用いてフィルタ処理を行うとともに、前記第２信号に対して前記バランス情報に基づく第２パラメータでフィルタ処理を行う、
ことをさらに含む請求項１または２に記載の方法。
ユーザによって前記第１信号または前記第２信号の一方の音の大きさを増大するための設定がなされた場合に、前記第１信号または前記第２信号の他方の音の大きさを低減するための設定を自動的に行う、
ことをさらに含む請求項１から３のいずれか一項に記載の方法。
入力される音響信号に含まれる声と背景音のうち声に対応する第１音の大きさ、または背景音に対応する第２音の大きさのいずれか少なくとも一方のユーザの設定操作に従って、前記第１音の大きさと、前記第２音の大きさとの大小関係を設定するためのバランス情報を設定する設定部と、
入力される音響信号を、前記第１音に対応する第１信号と前記第２音に対応する第２信号とに分離する分離部と、
前記第１信号を、前記バランス情報に基づく第１ゲインに従って出力し、前記第２信号を、前記バランス情報に基づく前記第１ゲインとは異なる第２ゲインに従って出力する増幅部と、
前記第１信号と、前記第２信号とを、少なくとも一部重複して出力する出力部と、を備え、
前記設定部は、前記バランス情報が、前記第１信号の音の大きさを前記第２信号の音の大きさに比べて大きくするためのものである場合、前記バランス情報の設定がなされた後、前記バランス情報が設定された電子機器の電源が切断され、その後電源が投入された後も、前記バランス情報に対応する設定を有効とするが、前記バランス情報が、前記第２信号の音の大きさを前記第１信号の音の大きさに比べて大きくするためのものである場合、前記バランス情報の設定がなされた後、前記バランス情報が設定された電子機器の電源が切断され、その後電源が投入された後は、前記バランス情報に対応する設定を無効とする、電子機器。
入力される音響信号に含まれる声と背景音のうち声に対応する第１音の大きさ、または背景音に対応する第２音の大きさのいずれか少なくとも一方のユーザの設定操作に従って、前記第１音の大きさと、前記第２音の大きさとの大小関係を設定するためのバランス情報を設定する設定部と、
入力される音響信号を、前記第１音に対応する第１信号と前記第２音に対応する第２信号とに分離する分離部と、
前記第１信号を、前記バランス情報に基づく第１ゲインに従って出力し、前記第２信号を、前記バランス情報に基づく前記第１ゲインとは異なる第２ゲインに従って出力する増幅部と、
前記第１信号と、前記第２信号とを、少なくとも一部重複して出力する出力部と、を備え、
前記設定部は、前記バランス情報が、前記第１信号の音の大きさを前記第２信号の音の大きさに比べて大きくするためのものである場合、第１番組の視聴中に前記バランス情報の設定がなされ、前記第１番組が終了した後も、前記バランス情報に対応する設定を有効とするが、前記バランス情報が、前記第２信号の音の大きさを前記第１信号の音の大きさに比べて大きくするためのものである場合、前記第１番組の視聴中に前記バランス情報の設定がなされた後、前記第１番組が終了した後は、前記バランス情報に対応する設定を無効とする、電子機器。
前記第１音の信号に対して、前記バランス情報に基づく第１パラメータを用いてフィルタ処理を行うとともに、前記第２音の信号に対して前記バランス情報に基づく第２パラメータでフィルタ処理を行うフィルタ部、
をさらに備えた請求項５または６に記載の電子機器。
前記設定部は、ユーザによって前記第１信号または前記第２信号の一方の音の大きさを増大するための設定がなされた場合に、前記第１信号または前記第２信号の他方の音の大きさを低減するための設定を自動的に行う、
請求項５から７のいずれか一項に記載の電子機器。
入力される音響信号に含まれる声と背景音のうち声に対応する第１音の大きさ、または背景音に対応する第２音の大きさのいずれか少なくとも一方のユーザの設定操作に従って、前記第１音の大きさと、前記第２音の大きさとの大小関係を設定するためのバランス情報を設定し、
入力される音響信号を、前記第１音に対応する第１信号と前記第２音に対応する第２信号とに分離し、
前記第１信号を、前記バランス情報に基づく第１ゲインに従って出力し、
前記第２信号を、前記バランス情報に基づく前記第１ゲインとは異なる第２ゲインに従って出力し、
前記第１信号と、前記第２信号とを、少なくとも一部重複して出力する、ことをコンピュータに実行させるとともに、
前記バランス情報が、前記第１信号の音の大きさを前記第２信号の音の大きさに比べて大きくするためのものである場合、前記バランス情報の設定がなされた後、前記バランス情報が設定された電子機器の電源が切断され、その後電源が投入された後も、前記バランス情報に対応する設定を有効とするが、
前記バランス情報が、前記第２信号の音の大きさを前記第１信号の音の大きさに比べて大きくするためのものである場合、前記バランス情報の設定がなされた後、前記バランス情報が設定された電子機器の電源が切断され、その後電源が投入された後は、前記バランス情報に対応する設定を無効とする、ことをさらに前記コンピュータに実行させるためのプログラム。
入力される音響信号に含まれる声と背景音のうち声に対応する第１音の大きさ、または背景音に対応する第２音の大きさのいずれか少なくとも一方のユーザの設定操作に従って、前記第１音の大きさと、前記第２音の大きさとの大小関係を設定するためのバランス情報を設定し、
入力される音響信号を、前記第１音に対応する第１信号と前記第２音に対応する第２信号とに分離し、
前記第１信号を、前記バランス情報に基づく第１ゲインに従って出力し、
前記第２信号を、前記バランス情報に基づく前記第１ゲインとは異なる第２ゲインに従って出力し、
前記第１信号と、前記第２信号とを、少なくとも一部重複して出力する、ことをコンピュータに実行させるとともに、
前記バランス情報が、前記第１信号の音の大きさを前記第２信号の音の大きさに比べて大きくするためのものである場合、第１番組の視聴中に前記バランス情報の設定がなされ、前記第１番組が終了した後も、前記バランス情報に対応する設定を有効とするが、
前記バランス情報が、前記第２信号の音の大きさを前記第１信号の音の大きさに比べて大きくするためのものである場合、前記第１番組の視聴中に前記バランス情報の設定がなされた後、前記第１番組が終了した後は、前記バランス情報に対応する設定を無効とする、ことをさらに前記コンピュータに実行させるためのプログラム。
前記第１音の信号に対して、前記バランス情報に基づく第１パラメータを用いてフィルタ処理を行うとともに、前記第２音の信号に対して前記バランス情報に基づく第２パラメータでフィルタ処理を行う、
ことをさらに前記コンピュータに実行させるための請求項９または１０に記載のプログラム。
ユーザによって前記第１信号または前記第２信号の一方の音の大きさを増大するための設定がなされた場合に、前記第１信号または前記第２信号の他方の音の大きさを低減するための設定を自動的に行う、
ことをさらに前記コンピュータに実行させるための請求項９から１１のいずれか一項に記載のプログラム。