JP2011101284A

JP2011101284A - 音声信号処理装置及び方法

Info

Publication number: JP2011101284A
Application number: JP2009255914A
Authority: JP
Inventors: Noriaki Suzuki; 紀明鈴木
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2009-11-09
Filing date: 2009-11-09
Publication date: 2011-05-19

Abstract

【課題】マルチチャンネル音声信号を、音場拡大処理を行なった場合に制作者の意図したサラウンド再生に近い音像定位が得られる2チャンネルステレオ音声信号にダウンミック
ス処理する音声処理装置及び方法を提供する。
【解決手段】マルチチャンネル音声信号の各音声信号に所定の係数をかけて振幅を調整する振幅調整部と、振幅調整された各音声信号を加算してステレオL/R音声信号を生成する
加算部と、前記ステレオL/R音声信号に対して、ステレオスピーカで再生した場合にサラ
ウンド音場が形成されるよう音場拡大処理を施す音声処理部と、を備え、前記振幅調整部は、ステレオL音声信号を生成するために加算される音声信号にかける係数とステレオR音声信号を生成するために加算される当該音声信号にかける係数との比が当該音声信号の再生が意図されているスピーカの方向と聴取位置の正面方向とのなす角度が小さいほど1に
近い値になるように係数を設定する。
【選択図】図1

Description

本発明は、聴取者の周囲に定位させることを意図して制作されたマルチチャンネル音声信号を、2チャンネルステレオ音声信号にダウンミックスをする音声信号処理装置及び音
声信号処理方法に関する。

デジタル放送やDVDコンテンツには、図2（A）に示すようなマルチチャンネルサラウン
ドスピーカで再生することを意図して制作されたマルチチャンネル音声信号が含まれることがある。このようなマルチチャンネル音声信号を、図2（B）に示すような2チャンネル
ステレオスピーカでも再生できるように、ダウンミックス処理を施して2チャンネルステ
レオ音声信号に変換する技術が公知である。

例えば、非特許文献1に記載されているダウンミック処理では、マルチチャンネル音声
信号のフロントL、リアL及びセンターの各チャンネルの音声信号を係数によりレベル調整して加算してステレオLチャンネルの音声信号Ltを生成する。また、マルチチャンネル音
声信号のフロントR、リアR及びセンターの各チャンネルｎ音声信号を係数によりレベル調整して加算してステレオRチャンネルの音声信号Rtを生成する。このようなダウンミック
ス処理により得られたLtチャンネル及びRtチャンネルの音声信号を2チャンネルステレオ
スピーカで再生すると、図8（A）のような音像定位が得られる。

また、特許文献1には、頭部伝達関数処理とダウンミックス処理によりサラウンド音響
効果を有するステレオ音声信号を生成し、各処理に関連する情報を多重化して出力する装置が提案されている。

特開2007-104601号公報

ARIB STD-B21 4.7版改訂2008年12月12日、p.32〜p.34

2チャンネルステレオスピーカによって再生した時に聴取者の周囲に音像定位させるこ
とで擬似的なサラウンド再生が行なわれるように、2チャンネルステレオ音声信号に対し
て音場拡大処理を行なう技術が知られている。しかし、非特許文献1に記載のダウンミッ
クス処理で生成した2チャンネルステレオ音声信号に対して音場拡大処理を行なうと、聴
取者の前方左右のスピーカでの再生が意図されたフロントL/Rの音像が聴取者の横等に定
位してしまうことがある（図8（B）参照）。これは、非特許文献1に記載のダウンミック
ス処理により生成された2チャンネルステレオ音声信号には、フロントLチャンネルとリアLチャンネルとを区別する情報及びフロントRチャンネルとリアRチャンネルとを区別する
情報が無いからである。このように、従来のダウンミックス処理では、音場拡大処理を行なった場合に制作者の意図したサラウンド再生とは大きく乖離した音像定位になってしまうような2チャンネルステレオ音声信号しか得られない場合があった。

本発明の目的は3以上の音声信号から構成されるマルチチャンネル音声信号を、音場拡
大処理を行なった場合に制作者の意図したサラウンド再生に近い音像定位が得られる2チ
ャンネルステレオ音声信号にダウンミックス処理する音声処理装置及び方法の提供である。

本発明の音声信号処理装置は、
3以上の音声信号から構成されるマルチチャンネル音声信号を2チャンネルステレオ音声信号にダウンミックスする音声信号処理装置であって、
マルチチャンネル音声信号を構成する各音声信号に音声信号毎に設定される所定の係数をかけて各音声信号の振幅を調整する振幅調整部と、
前記振幅調整部により振幅を調整された前記各音声信号を加算して2チャンネルステレ
オ音声信号を構成するステレオLチャンネル音声信号及びステレオRチャンネル音声信号を生成する加算部と、
前記加算部が生成した2チャンネルステレオ音声信号に対して、2チャンネルステレオスピーカで再生した場合に擬似的なマルチチャンネルサラウンド音場が形成されるように音場拡大処理を施す音声処理部と、
を備え、
前記振幅調整部は、ステレオLチャンネル音声信号を生成するために加算されるマルチ
チャンネル音声信号を構成する音声信号にかける係数と、ステレオRチャンネル音声信号
を生成するために加算される当該音声信号にかける係数と、の比が、サラウンドスピーカによって該マルチチャンネル音声信号を再生する場合に当該音声信号が再生されることが意図されているスピーカの位置に応じて異なる値になるように係数を設定するものであって、聴取位置として意図されている位置を基準とする該スピーカの方向と該聴取位置の正面方向とのなす角度が小さいほど、前記係数の比が1に近い値になるように係数を設定す
ることを特徴とする。

本発明の音声信号処理方法は、
3以上の音声信号から構成されるマルチチャンネル音声信号を2チャンネルステレオ音声信号にダウンミックスする音声信号処理方法であって、
マルチチャンネル音声信号を構成する各音声信号に音声信号毎に設定される所定の係数をかけて各音声信号の振幅を調整する振幅調整工程と、
前記振幅調整工程において振幅を調整された前記各音声信号を加算して2チャンネルス
テレオ音声信号を構成するステレオLチャンネル音声信号及びステレオRチャンネル音声信号を生成する加算工程と、
前記加算工程において生成した2チャンネルステレオ音声信号に対して、2チャンネルステレオスピーカで再生した場合に擬似的なマルチチャンネルサラウンド音場が形成されるように音場拡大処理を施す音声処理工程と、
を有し、
前記振幅調整工程は、ステレオLチャンネル音声信号を生成するために加算されるマル
チチャンネル音声信号を構成する音声信号にかける係数と、ステレオRチャンネル音声信
号を生成するために加算される当該音声信号にかける係数と、の比が、サラウンドスピーカによって該マルチチャンネル音声信号を再生する場合に当該音声信号が再生されることが意図されているスピーカの位置に応じて異なる値になるように係数を設定する工程であって、聴取位置として意図されている位置を基準とする該スピーカの方向と該聴取位置の正面方向とのなす角度が小さいほど、前記係数の比が1に近い値になるように係数を設定
することを特徴とする。

本発明によれば、3以上の音声信号から構成されるマルチチャンネル音声信号を、音場
拡大処理を行なった場合に制作者の意図したサラウンド再生に近い音像定位が得られる2
チャンネルステレオ音声信号に、ダウンミックス処理することができる。

実施例1の音声信号処理装置の機能ブロック図マルチチャンネルサラウンドスピーカ及びステレオスピーカの配置例実施例1のマルチチャンネル音声信号のステレオL/R音声信号における係数比実施例1のダウンミックス出力及び音場拡大処理再生時の音像定位実施例2の音声信号処理装置の機能ブロック図実施例2の音声信号処理装置の処理フロー実施例2の各振幅調整部の係数設定例実施例2の音場拡大オフ時のダウンミックス出力及び再生時の音像定位実施例2の音場拡大弱時のダウンミックス出力及び再生時の音像定位実施例2の音場拡大強時のダウンミックス出力及び再生時の音像定位

（実施例1）
本発明の具体的な実施例について図面を参照して説明する。以下の実施例の記載は本発明の実施形態の一例を説明するためのものであって、本発明の技術的な範囲を実施例の記載に限定する趣旨のものではない。

図1は、実施例1の音声信号処理装置の機能ブロック図である。この音声信号処理装置は、例えば、ステレオスピーカを内蔵したデジタルテレビ等に適用することができる。
アンテナ51はデジタル放送波を受信し、受信部50はデジタル放送波を映像データ、音声データ、その他制御データ等が多重化された放送データストリームに復調する。
受信部50は、放送データストリームに含まれる音声データをマルチチャンネルデコード部31に送出する。
マルチチャンネルデコード部31は、受信部50から入力される音声データを3以上の音声
信号から構成されるマルチチャンネル音声信号（C, L, R, SL, SR）にデコードする。そ
して、各音声信号をセンターチャネル111、フロントLチャンネル112、フロントRチャンネル113、リアLチャンネル114及びリアRチャンネル115へ出力する。
振幅調整部1は、第1〜第10の振幅調整部（101〜110）を有する。第1〜第10の振幅調整
部（101〜110）は、マルチチャンネルデコード部31から入力されるマルチチャンネル音声信号（C, L, R, SL, SR）に対して、音声信号毎に設定された所定の係数をかけて振幅を
調整して出力する。
第1の加算部2は、第1から第5の振幅調整部（101〜105）の出力を加算してステレオLチ
ャンネル4へ音声信号Lt（ステレオLチャンネル音声信号）を出力する。
第2の加算部3は、第6から第10の振幅調整部（106〜110）の出力を加算してステレオRチャンネル5へ音声信号Rt（ステレオRチャンネル音声信号）を出力する。
振幅調整部1、第1の加算部2及び第2の加算部3により、マルチチャンネル音声信号（C, L, R, SL, SR）が2チャンネルステレオ音声信号（Lt, Rt）にダウンミックス処理される
。
音声処理部43は、ダウンミックス処理により生成された2チャンネルステレオ音声信号
（Lt, Rt）に対して、音場拡大処理を行なう。この音場拡大処理は、2チャンネルステレ
オスピーカで再生した場合に擬似的なマルチチャンネルサラウンド音場を形成する2チャ
ンネルステレオ音声信号を生成する。音場拡大処理は、例えばテレビセットにおいてスピーカが画面下部に配置される場合など、左右のステレオスピーカの間隔が確保できないことにより損なわれがちな音場の広がり感を補償する目的で行なわれる。音声処理部43が行なう処理としては、頭部伝達関数処理やクロストークキャンセル処理などが有る。
音声処理部43は、音場拡大処理を施したステレオLチャンネル4の音声信号LtをステレオLスピーカ7に出力し、音場拡大処理を施したステレオRチャンネル5の音声信号RtをステレオRスピーカ8へ出力する。
ステレオLスピーカ7及びステレオRスピーカ8は、入力された音声信号を可聴音に変換する装置であり、図2（B）に示すように、ステレオLスピーカ7は聴取者の前方左に配置され、ステレオRスピーカ8は聴取者の前方右に配置される。

図2（A）は、マルチチャンネルサラウンドスピーカの一般的な配置例を示す図である。
図2（A）の例では、各スピーカの配置位置を、聴取位置として意図されている位置（図中「聴取者6」で表す）を基準とする各スピーカの方向と、該聴取位置の正面方向と、の
なす角度によって表している。聴取位置の正面に向かって左側の角度を負、右側の角度を正とすると、センタースピーカ11は0度、フロントLスピーカ12は-30度、フロントRスピーカ13は+30度、リアLスピーカ14は-110度、リアRスピーカ15は+110度である。以下、スピ
ーカの位置や音像定位の位置は、図2（A）と同様に定義された角度を用いて表現する。

センタースピーカ11から再生されることが意図された音声信号「C」は、図1におけるセンターチャンネル111に入力され、係数「d」が設定された第1の振幅調整部101により「d
×C」に振幅調整されて、第1の加算部2に入力される。また、音声信号「C」は、係数「d
」が設定された第6の振幅調整部106により「d×C」に振幅調整されて、第2の加算部3に入力される。
フロントLスピーカ12から再生されることが意図された音声信号「L」は、図1における
フロントLチャンネル112に入力され、係数「f」が設定された第2の振幅調整部102により
「f×L」に振幅調整されて第1の加算部2に入力される。また、音声信号「L」は、係数「g」（0＜g＜f）が設定された第7の振幅調整部107により「g×L」に振幅調整されて第2の加算部3に入力される。
フロントRスピーカ13から再生されることが意図された音声信号「R」は、図1における
フロントRチャンネル113に入力され、係数「g」が設定された第3の振幅調整部103により
「g×R」に振幅調整されて第1の加算部2に入力される。また、音声信号「R」は、係数「f」が設定された第8の振幅調整部108により「f×R」に振幅調整されて第2の加算部3に入力される。
リアLスピーカ14から再生されることが意図された音声信号「SL」は、図1におけるリアLチャンネル114に入力され、係数「e」が設定された第4の振幅調整部104により「e×SL」に振幅調整されて第1の加算部2に入力される。一方、第9の振幅調整部109の係数が「0」
に設定されているため、音声信号「SL」は第2の加算部3には入力されない。
リアRスピーカ15から再生されることが意図された音声信号「SR」は、図1におけるリアRチャンネル115に入力され、係数「e」が設定された第10の振幅調整部110により「e×SR
」に振幅調整されて第2の加算部3に入力される。一方、第5の振幅調整部105の係数が「0
」が設定されているため、音声信号「SL」は第1の加算部2には入力されない。

第1の加算部2は、第1〜第5の振幅調整部（101〜105）の出力をそれぞれ加算して生成した音声信号「Lt」を、ステレオLチャンネル4に出力する。音声信号「Lt」は次の式1によ
って表される。
（式1） Lt = d×C + e×SL + f×L + g×R （0＜g＜f）
第2の加算部3は、第6〜第10の振幅調整部（106〜110）の出力をそれぞれ加算して生成
した音声信号「Rt」を、ステレオRチャンネル5に出力する。音声信号「Rt」は次の式2に
よって表される。
（式2） Rt = d×C + e×SR + f×R + g×L （0＜g＜f）

図3は、マルチチャンネル音声信号の各々について、マルチチャンネルサラウンドスピ
ーカでの再生で意図されているスピーカの配置角度の絶対値、音声信号Ltに加算する際にかける係数、音声信号Rtに加算する際にかける係数、その係数の比を示す。
センターチャンネル111の音声信号Cについては、意図されたスピーカ配置角度の絶対値は0度、ダウンミックス処理によって音声信号Ltに加算する際にかける係数はd、音声信号
Rtに加算する際にかける係数はd、係数比rはd/dより1である。ステレオLチャンネルとス
テレオRチャンネルの振幅比δはd/d=1/1である。
フロントLチャンネル112の音声信号Lについては、意図されたスピーカ配置角度の絶対
値は30度、ダウンミックス処理によって音声信号Ltに加算する際にかける係数はf、音声
信号Rtに加算する際にかける係数はg、係数比rはf/gである。前記振幅比δは、0＜g＜fの条件より1＜f/g＜∞、よって1＜δ＜∞である。
フロントRチャンネル113の音声信号Rについては、意図されたスピーカ配置角度の絶対
値は30度、ダウンミックス処理によって音声信号Ltに加算する際にかける係数はg、音声
信号Rtに加算する際にかける係数はf、係数比rはg/fである。前記振幅比δは、0＜g＜fの条件より0＜g/f＜1、よって1/∞＜δ＜1である。
リアLチャンネル114の音声信号SLについては、意図されたスピーカ配置角度の絶対値は110度、ダウンミックス処理によって音声信号Ltに加算する際にかける係数はe、音声信号Rtに加算する際にかける係数は0、係数比rはe/0より∞である。前記振幅比δは∞である
。
リアRチャンネル115の音声信号SRについては、意図されたスピーカ配置角度の絶対値は110度、ダウンミックス処理によって音声信号Ltに加算する際にかける係数は0、音声信号Rtに加算する際にかける係数はe、係数比rは0/eより0である。前記振幅比δは0=1/∞である。

本実施例のダウンミックス処理では、音声信号Ltを生成するために第1の加算部2で加算する音声信号Xにかける係数と、音声信号Rtを生成するために第2の加算部3で加算する該
音声信号Xにかける係数と、の比を以下のように定める。すなわち、図2（A）に示すよう
なマルチチャンネルサラウンドスピーカでマルチチャンネル音声信号を再生する場合に当該音声信号Xが再生されることが意図されているスピーカの位置に応じて、前記係数の比
が異なる値になるように定められている。具体的には、聴取位置として意図されている位置を基準とする音声信号X用のスピーカの方向と、聴取位置の正面方向と、のなす角度が
小さいほど、前記係数の比が1に近い値になるように、各振幅調整部の係数が設定される
。なお、XはC, L, R, SL, SRのいずれかである。

詳細には、意図されたスピーカの配置角度が負のチャンネルについては、配置角度の絶対値が大きくなるほど、音声信号Ltに加算される音声信号Xにかける係数と音声信号Rtに
加算される音声信号Xにかける係数との比が1より大きくなるように設定される。逆に意図されたスピーカの配置角度が正のチャンネルについては、配置角度の絶対値が大きくなるほど、音声信号Ltに加算される音声信号Xにかける係数と音声信号Rtに加算される音声信
号Xにかける係数との比が1より小さくなるに設定される。そして、意図されたスピーカの配置角度が0度のセンターチャンネルについては、音声信号Ltに加算される音声信号Xにかける係数と音声信号Rtに加算される音声信号Xにかける係数との比は1に設定される。

このようなダウンミックス処理を行なうことにより、2チャンネルステレオスピーカで
再生した場合に図4（A）に示す音像定位が得られる2チャンネルステレオ音声信号Lt/Rtが生成される。図4（A）に示すように、この音像定位では、フロントLチャンネルがセンタ
ーチャンネルとリアLチャンネルの間に定位し、フロントRチャンネルがセンターチャンネルとリアRチャンネルの間に定位する。すなわち、マルチチャンネルサラウンドスピーカ
での再生で意図されたスピーカの方向が聴取者の正面に近いチャンネルほど、センター寄りに定位するようにダウンミックス処理が行なわれる。これにより、マルチチャンネルサラウンドスピーカでの再生で意図されたスピーカの方向が異なるフロントLとリアL及びフロントRとリアRとが区別される。

更に、このようなダウンミックス処理によって得られる2チャンネルステレオ音声信号Lt及びRtに対して、音声処理部43による音場拡大処理を行なう。これにより、マルチチャ
ンネルサラウンドスピーカでの再生で意図されたスピーカの配置角度の絶対値が小さいチャンネルが、音場拡大処理の結果聴取者6の真横や後方に定位してしまうことを抑制でき
る。従って、図4（B）に示すような、マルチチャンネルサラウンドスピーカで再生した場合に近いサラウンド音場が得られる。よって、音場拡大処理を行なった場合に、制作者の意図したサラウンド再生に近い音像定位を実現することができる。

このように、本実施例の音声信号処理装置によれば、マルチチャンネル音声信号を、音場拡大処理を行なった場合に制作者の意図したサラウンド再生に近い音像定位が得られる2チャンネルステレオ音声信号にダウンミックス処理することが可能になる。

なお、図1〜図3では図示していないが、マルチチャンネル音声信号に低域再生用スピーカから再生されることが意図された低域効果信号「LFE」が含まれている場合にも、本実
施例のダウンミックス処理を適用可能である。その場合、低域効果信号LFEは方向性のな
い効果音のチャンネルであるから、ダウンミックス処理において音声信号Lt及び音声信号Rtに係数比1で加算すればよい。また、音声信号処理装置の構成として、低域効果信号LFEが入力されるチャンネル及び低域効果信号LFEの振幅を調整するための振幅調整部を追加
する。音声信号LFEは、他の音声信号を低域濾波して生成しても良いし、放送データスト
リームに多重化されている低域効果信号LFEをデコードして用いても良い。

（実施例2）
次に、本発明の第2の実施例について説明する。本実施例において実施例1と同等の構成要素については詳細な説明を省略し、実施例1との相違点を中心に説明する。

図5は、実施例2の音声信号処理装置の機能ブロック図である。音声出力部30は音声信号を出力する。音声再生部40は音声信号をスピーカにより再生する。インターフェースケーブル20は、音声出力部30から出力される音声信号を音声再生部40に伝送する。音声出力部30は、例えば、DVDレコーダなどに内蔵され、音声再生部40は、スピーカを備えたテレビ
などに内蔵され、インターフェースケーブル20は、HDMIケーブル等である。
音声出力部30は以下の構成を有する。
マルチチャンネルデコード部31は、光ディスク再生や放送受信などにより得た音声データをデコードし、マルチチャンネル音声信号（C, L, R, SL, SR）を振幅調整部1の各振幅調整部（第1〜第10の振幅調整部101〜110）へ出力する。
振幅調整部1のうち、第2の振幅調整部102、第3の振幅調整部103、第7の振幅調整部107
、第8の振幅調整部108の係数は制御部32により設定される。
制御部32は、音声再生部40の記憶部41を読み出して音声再生部40が入力可能な音声信号のフォーマットや再生チャネル数などの情報を取得する。更に、制御部32は、制御部42と通信して音声処理部43の設定に関する情報を取得し、取得した情報に基づいて第2の振幅
調整部102、第3の振幅調整部103、第7の振幅調整部107、第8の振幅調整部108の各係数を
設定する。
振幅調整部1、第1の加算部2及び第2の加算部3により、実施例1と同様、マルチチャンネル音声信号（C, L, R, SL, SR）が2チャンネルステレオ音声信号（Lt, Rt）にダウンミックス処理される。本実施例では、第1の加算部2及び第2の加算部3の出力する音声信号Lt及びRtは、インターフェースケーブル20に出力される。

インターフェースケーブル20は、ステレオLチャンネル信号線21、ステレオRチャンネル信号線22、制御通信信号線23、記憶部信号線24を物理的に集合して構成される。
ステレオLチャンネル信号線21は、第1の加算部2が出力する音声信号Ltを伝送する。
ステレオRチャンネル信号線22は、第2の加算部3が出力する音声信号Rtを伝送する。
制御通信信号線23は、音声出力部30の制御部32と音声再生部40の制御部42との間の制御信号を伝送する。この制御信号により音声出力部30及び音声再生部40の動作を相互に制御
することができる。
記憶部信号線24は、音声再生部40が入力可能な音声信号のフォーマットや再生チャネル数などの情報を伝送する。

音声再生部40は以下の構成を有する。
記憶部41は、音声再生部40が入力可能な信号フォーマットや再生チャネル数などの情報を記憶する。
制御部42は、操作入力部44へ入力されたユーザの操作に応じて音声処理部43を設定するとともに、音声処理部43の設定に関する情報を音声出力部30の制御部32に通知する。
音声処理部43は、インターフェースケーブル20を介して入力される2チャンネルステレ
オ音声信号Lt及びRtに対して、制御部42からの制御に応じた設定で音場拡大処理を行なう。音場拡大処理後の音声信号のステレオLスピーカ7及びステレオRスピーカ8への出力については実施例1と同様である。
操作入力部44は、例えばリモコンなどによる音場拡大処理の設定（オフ・弱・強）に関するユーザの操作が入力される。

図6は、音声出力部30及び音声再生部40で行なわれる処理を表すフローチャートである
。
＜音声出力部30の処理＞
音声出力部30は、電源投入などにより処理を開始すると、音声再生部40の記憶部41を読み出し、音声再生部40が入力可能な音声信号のフォーマットや再生チャネル数などの情報を取得する（記憶部読み出し処理（S101））。
音声出力部30は、記憶部読み出し処理（S101）により取得した情報から、マルチチャンネル音声信号をダウンミックス処理して生成される2チャンネルステレオ音声信号の入力
に音声再生部40が対応しているか判断する。また、音声再生部40が2チャンネルステレオ
スピーカによる再生に対応しているか判断する（チャンネル対応判断（S102））。
チャンネル対応判断（S102）の結果が対応不可の場合（S102:N）、音声出力部30は、音声再生部40の対応可能な構成のものへの交換を検出するため、インターフェースケーブル20の挿抜を監視する（挿抜判断（S103））。チャンネル対応判断（S102）の結果が対応可能の場合（S102:Y）、音声出力部30は、音声再生部40の制御部42が送信する音声処理部43の設定に関する情報を受信する（状態受信処理（S104））。
音声出力部30は、状態受信処理（S104）により受信した情報から、音声処理部43の音場拡大処理の設定（オフ・弱・強）に応じて、各振幅調整部の係数を図7のように設定する
（係数設定処理（S105））。図7に示すように、本実施例では、実施例1と同様、マルチチャンネルサラウンドスピーカでの再生で意図されたスピーカ配置角度の絶対値に応じて係数を設定する。すなわち、意図されたスピーカ配置角度の絶対値が小さいチャンネルほど、音声信号Ltに加算する音声信号にかける係数と音声信号Rtに加算する音声信号にかける係数との比が1に近い値になるように係数を設定する。更に、音場拡大処理の強度の設定
が強いほど、音声信号Ltに加算するフロントL/R音声信号にかける係数と音声信号Rtに加
算するフロントL/R音声信号にかける係数との比が1に近くなるように、第2、第3、第7及
び第8の振幅調整部の係数を設定する。
係数設定処理（S105）により係数設定された第1〜第5の振幅調整部（101〜105）の出力は第1の加算部2により加算される。また、第6〜第10の振幅調整部（106〜110）の出力は
第2の加算部3により加算される。こうして、マルチチャンネル音声信号が2チャンネルス
テレオ音声信号にダウンミックスされる。
ダウンミックスされた2チャンネルステレオ音声信号は、電源判断（S106）により電源
オンであることが確認されたのち（S106:N）、音声出力部30から出力される（音声出力処理（S107））。一方、電源判断（S106）により電源オフであると判断された場合（S106:Y）、音声出力部30は、ノイズの出力を防止するために音声出力を停止する（音声出力停止処理（S108））。
以上の音声出力部30におけるダウンミックス処理により、音場拡大処理の設定が「オフ」の場合は図8（A）、「弱」の場合は図9（A）、「強」の場合は図10（A）に示すような
音像定位となる2チャンネルステレオ音声信号が音声出力部30から出力される。すなわち
、実施例1と同様、マルチチャンネルサラウンドスピーカでの再生で意図されたスピーカ
配置方向が聴取者の正面に近いチャンネルほど、センター寄りに定位するようにダウンミックス処理が行なわれる。これにより、マルチチャンネルサラウンドスピーカでの再生で意図されたスピーカ配置方向が異なるフロントLチャンネルとリアLチャンネル及びフロントRチャンネルとリアRチャンネルとが区別される。更に、図9（A）と図10（A）とを比較
して分るように、音場拡大処理の設定が強いほど、フロントL/Rチャンネルがよりセンタ
ーチャンネル寄りに音像定位するようにダウンミックス処理が行なわれる。

＜音声再生部40の処理＞
音声再生部40は、電源投入などにより処理を開始すると、制御部42が操作入力部44へ入力された音場拡大処理の設定（オフ・弱・強）に関するユーザの操作を監視する（操作判断（S201））。
操作判断（S201）により検出した音場拡大処理の設定（オフ・弱・強）に応じて、音声再生部40は音声処理部43を設定する（（音声処理設定処理（S202））。更に、音声再生部40は、音声出力部30の制御部32へ当該設定に関する情報を送信する（状態送信処理（S203））。
状態送信処理（S203）ののち、音声再生部40は、音声出力部30から出力される2チャン
ネルステレオ音声信号の入力を開始する（音声入力処理（S204））。そして、入力された2チャンネルステレオ音声信号に対して上記設定（オフ・弱・強）に応じた音場拡大処理
をする（音声処理（S205））。
音声処理（S205）をされた音声信号は、電源判断（S206）により電源オンであることが確認されたのち（S206:N）、ステレオLスピーカ7及びステレオRスピーカ8から出力される（音声出力処理（S207））。一方、電源判断（S206）により電源オフであると判断された場合（S206:Y）、音声再生部40は、ノイズの出力を防止するために音声出力を停止する（音声出力停止処理（S208））。
以上の音声再生部40における音場拡大処理により、音場拡大処理の設定が「オフ」の場合は図8（A）、「弱」の場合は図9（B）、「強」の場合は図10（B）に示すような音像定
位となる。

このように、本実施例の音声信号処理装置のダウンミックス処理によれば、マルチチャンネル音声信号を、フロントL及びRがそれぞれリアL及びRよりセンター寄りに定位する2
チャンネルステレオ音声信号にダウンミックスすることが可能になる。よって、実施例1
と同様に、音場拡大処理を施した場合においても、フロントL及びRがそれぞれリアL及びRよりもセンター寄りに定位するように音場を拡大することができる。

更に、音場拡大処理の設定が強いほど、フロントL及びRがより一層センター寄りに音像定位するようにダウンミックス処理が行なわれる。よって、ダウンミックス処理により生成された2チャンネルステレオ音声信号に対して強い音場拡大処理を施した場合において
も、フロントL及びRの音声信号が聴取者の横や後方などの制作者の意図した位置から大きくずれた位置に定位してしまうことを抑制できる。これにより、マルチチャンネルサラウンドスピーカで再生した場合に近い音像定位が得られる。よって、音場拡大処理を行なった場合に、制作者の意図したサラウンド再生に近い音像定位を実現することができる。

本実施例によれば、マルチチャンネル音声信号を、音場拡大処理を行なった場合に制作者の意図したサラウンド再生に近い音像定位が得られる2チャンネルステレオ音声信号に
、音場拡大処理の強度設定に応じて適切にダウンミックス処理することが可能になる。

（実施例3）
次に、本発明に第3の実施例について説明する。本実施例は実施例2の構成を簡略化したものである。本実施例において、実施例2と同等の部分については詳細な説明を省略する
。

本実施例と実施例2との相違点は、本実施例の音声出力部30では、ダウンミックス処理
において、マルチチャンネルデコード部31から出力されるマルチチャンネル音声信号のうちセンターチャンネルの音声信号Cを用いない点である。すなわち、本実施例では、音声
出力部30は、マルチチャンネル音声信号（L, R, SL, SR）に対して係数をかけて第1の加
算部2及び第2の加算部3で加算してダウンミックス処理を行う。また、センターチャンネ
ルの音声信号Cはそのまま音声再生部40に出力する。
従って、本実施例では、センターチャンネルの音声信号Cは振幅調整部1を通過しないため、実施例2においてセンターチャンネルの音声信号Cの振幅調整を行なった第1及び第6の振幅調整部（101、106）は本実施例の音声出力部30では無くした。また、実施例２において第1の加算部2にはリアRチャンネルの音声信号SRは入力されず、第2の加算部3にはリアLチャンネルの音声信号SLは入力されなかった。そこで、実施例2においてこれらの音声信
号に対する振幅調整を行なった第5及び第9の振幅調整部（105、109）も本実施例の音声出力部30では無くした。
本実施例の音声出力部30の振幅調整部1は、第2、第3、第4、第7、第8及び第10の6個の
振幅調整部（102、103、104、107、108、110）を有して構成される。また、本実施例では、音声出力部30の制御部32は、図7の係数設定テーブルにおいて第1、第5、第6及び第9の
振幅調整部（101、105、106、109）の係数を記憶する部分を削除した係数設定テーブルに基づいて、各振幅調整部の係数設定を行なう。

以上の音声出力部30への変更に伴い、インターフェースケーブル20には、センターチャンネルの音声信号Cをそのまま伝送するためのセンターチャンネル信号線を追加した（図
示省略）。

更に、音声再生部40には、インターフェースケーブル20のセンターチャンネル信号線を介して入力されるセンターチャンネルの音声信号Cにより直接駆動されるセンタースピー
カを追加した（図示省略）。また、音声再生部40において、センターチャンネルの音声信号Cは、音場拡大処理を行なう音声処理部43を通過しないこととした。これは、センター
チャンネルの音声信号Cは、もともと聴取者6の正面のセンタースピーカから再生されることが意図されているため、センタースピーカがある場合には音場拡大処理は不要だからである。

実施例1及び2の処理において、センターチャンネルの音声信号Cは、音声信号Ltに加算
される音声信号にかける係数と音声信号Rtに加算される音声信号にかける係数とが等しい。よって、ダウンミックス処理においてセンターチャンネルの音声信号Cに関する部分を
省略することで、振幅調整部1の構成を簡素化できる。また、センターチャンネルの音声
信号Cに対する音場拡大処理を省略することにより、音場拡大処理後の音声が明瞭になる
という利点もある。

以上説明した各実施例において示した、マルチチャンネルサラウンドスピーカの配置角度、マルチチャンネル音声信号毎に設定されるダウンミックス処理時の係数の値は、一例であり、これらに限定されない。また、実施例では5つのスピーカで再生することが意図
されたマルチチャンネル音声信号について例示したが、7つのスピーカや9つのスピーカで再生することが意図されたマルチチャンネル音声信号等にも本発明を適用できる。その場合も、サラウンドスピーカでの再生する場合に意図されているスピーカの配置角度の絶対値が小さい音声信号ほど、ステレオL音声信号に加算する際の係数とステレオR音声信号に
加算する際の係数との比が1に近くなるように係数を設定すれば良い。また、音場拡大処
理の強度設定はオフ・強・弱の3段階に限らない。

1：振幅調整部、2：第1の加算部、3：第2の加算部、43：音声処理部

Claims

3以上の音声信号から構成されるマルチチャンネル音声信号を2チャンネルステレオ音声信号にダウンミックスする音声信号処理装置であって、
マルチチャンネル音声信号を構成する各音声信号に音声信号毎に設定される所定の係数をかけて各音声信号の振幅を調整する振幅調整部と、
前記振幅調整部により振幅を調整された前記各音声信号を加算して2チャンネルステレ
オ音声信号を構成するステレオLチャンネル音声信号及びステレオRチャンネル音声信号を生成する加算部と、
前記加算部が生成した2チャンネルステレオ音声信号に対して、2チャンネルステレオスピーカで再生した場合に擬似的なマルチチャンネルサラウンド音場が形成されるように音場拡大処理を施す音声処理部と、
を備え、
前記振幅調整部は、ステレオLチャンネル音声信号を生成するために加算されるマルチ
チャンネル音声信号を構成する音声信号にかける係数と、ステレオRチャンネル音声信号
を生成するために加算される当該音声信号にかける係数と、の比が、サラウンドスピーカによって該マルチチャンネル音声信号を再生する場合に当該音声信号が再生されることが意図されているスピーカの位置に応じて異なる値になるように係数を設定するものであって、聴取位置として意図されている位置を基準とする該スピーカの方向と該聴取位置の正面方向とのなす角度が小さいほど、前記係数の比が1に近い値になるように係数を設定す
ることを特徴とする音声信号処理装置。
前記音声処理部の前記音場拡大処理による音場拡大の強度を設定する制御部を更に備え、
前記振幅調整部は、前記制御部により設定された前記強度が強くなるほど、前記係数の比が1に近い値になるように、係数を設定することを特徴とする請求項1に記載の音声信号処理装置。
3以上の音声信号から構成されるマルチチャンネル音声信号を2チャンネルステレオ音声信号にダウンミックスする音声信号処理方法であって、
マルチチャンネル音声信号を構成する各音声信号に音声信号毎に設定される所定の係数をかけて各音声信号の振幅を調整する振幅調整工程と、
前記振幅調整工程において振幅を調整された前記各音声信号を加算して2チャンネルス
テレオ音声信号を構成するステレオLチャンネル音声信号及びステレオRチャンネル音声信号を生成する加算工程と、
前記加算工程において生成した2チャンネルステレオ音声信号に対して、2チャンネルステレオスピーカで再生した場合に擬似的なマルチチャンネルサラウンド音場が形成されるように音場拡大処理を施す音声処理工程と、
を有し、
前記振幅調整工程は、ステレオLチャンネル音声信号を生成するために加算されるマル
チチャンネル音声信号を構成する音声信号にかける係数と、ステレオRチャンネル音声信
号を生成するために加算される当該音声信号にかける係数と、の比が、サラウンドスピーカによって該マルチチャンネル音声信号を再生する場合に当該音声信号が再生されることが意図されているスピーカの位置に応じて異なる値になるように係数を設定する工程であって、聴取位置として意図されている位置を基準とする該スピーカの方向と該聴取位置の正面方向とのなす角度が小さいほど、前記係数の比が1に近い値になるように係数を設定
することを特徴とする音声信号処理方法。
前記音声処理工程の前記音場拡大処理による音場拡大の強度を設定する制御工程を更に有し、
前記振幅調整工程は、前記制御工程において設定された前記強度が強くなるほど、前記係数の比が1に近い値になるように、係数を設定することを特徴とする請求項3に記載の音声信号処理方法。