WO2007029412A1

WO2007029412A1 - マルチチャンネル音響信号処理装置

Info

Publication number: WO2007029412A1
Application number: PCT/JP2006/313574
Authority: WO
Inventors: Yoshiaki Takagi; Kok Seng Chong; Takeshi Norimatsu; Shuji Miyasaka; Akihisa Kawamura; Kojiro Ono
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2005-09-01
Filing date: 2006-07-07
Publication date: 2007-03-15
Also published as: EP1921605A1; CN101253555B; KR101277041B1; KR20080039445A; US20090262949A1; JPWO2007029412A1; US8184817B2; EP1921605B1; CN101253555A; EP1921605A4; JP5053849B2

Abstract

　演算負荷を軽減したマルチチャンネル音響信号処理装置を提供する。　マルチチャンネル音響信号処理装置（１００）は、入力信号ｘに対して残響処理を行うことにより、入力信号ｘの示す音に残響が含まれるような音を示す無相関信号ｗ’を生成する無相関信号生成部（１８１）と、その無相関信号生成部（１８１）により生成された無相関信号ｗ’および入力信号ｘに対して、信号強度レベルの配分および残響の配分を示す行列Ｒ３を用いた演算を行うことにより、ｍチャンネルのオーディオ信号を生成するマトリックス演算部（１８７）および第３演算部（１８６）とを備える。

Description

明細書

マルチチャンネル音響信号処理装置

技術分野

[0001] 本発明は、複数のオーディオ信号をダウンミックスし、そのダウンミックスされた信号を元の複数のオーディオ信号に分離するマルチチャンネル音響信号処理装置に関する。

背景技術

[0002] 従来より、複数のオーディオ信号をダウンミックスし、そのダウンミックスされた信号を元の複数のオーディオ信号に分離するマルチチャンネル音響信号処理装置が提供されている。

[0003] 図 1は、マルチチャンネル音響信号処理装置の構成を示すブロック図である。

[0004] マルチチャンネル音響信号処理装置 1000は、オーディオ信号の組に対する空間音響符号ィ匕を行って音響符号ィ匕信号を出力するマルチチャンネル音響符号ィ匕部 11 00と、その音響符号ィ匕信号を復号ィ匕するマルチチャンネル音響復号ィ匕部 1200とを備えている。

[0005] マルチチャンネル音響符号化部 1100は、 1024サンプルや 2048サンプルなどによって示されるフレーム単位でオーディオ信号 (例えば、 2チャンネルのオーディオ信号 L, R)を処理するものであって、ダウンミックス部 1110と、ノイノーラルキュー算出部 1120と、オーディオエンコーダ部 1150と、多重化部 1190とを備えている。

[0006] ダウンミックス部 1110は、 2チャンネルのスペクトル表現されたオーディオ信号 L, R の平均をとることによって、つまり、 M= (L+R) Z2によって、オーディオ信号 L,尺がダウンミックスされたダウンミックス信号 Mを生成する。

[0007] ノイノーラルキュー算出部 1120は、スペクトルバンドごとに、オーディオ信号 L, R およびダウンミックス信号 Mを比較することによって、ダウンミックス信号 Mをオーディォ信号 L, Rに戻すためのバイノーラルキュー情報を生成する。

[0008] バイノーラルキュー情報は、チャンネル間レベル差（inter- channel level/intensity di fference) IID、チャンネノレ間相関 (inter- channel coherence/correlation) ICC、チャンネル間位相差（inter- channel phase/delay difference) IPD、およびチャンネル予測係数（Channel Prediction Coefficients) CPCを示す。

[0009] 一般に、チャンネル間レベル差 IIDは、音のバランスや定位を制御するための情報であって、チャンネル間相関 ICCは、音像の幅や拡散性を制御するための情報である。これらは、共に聴き手が聴覚的情景を頭の中で構成するのを助ける空間パラメ一タである。

[0010] スペクトル表現されたオーディオ信号 L, Rおよびダウンミックス信号 Mは、「パラメ一タバンド」力もなる通常複数のグループに区分されている。したがって、バイノーラルキュー情報は、それぞれのパラメータバンド毎に算出される。なお、「バイノーラルキュ一情報」と「空間パラメータ」 t 、う用語はしばしば同義的に用いられる。

[0011] オーディオエンコーダ部 1150は、例えば、 MP3 (MPEG Audio Layer- 3)や、 AAC

(Advanced Audio Coding)などによって、ダウンミックス信号 Mを圧縮符号化する。

[0012] 多重化部 1190は、ダウンミックス信号 Mと、量子化されたバイノーラルキュー情報とを多重化することによりビットストリームを生成し、そのビットストリームを上述の音響符号化信号として出力する。

[0013] マルチチャンネル音響復号ィ匕部 1200は、逆多重化部 1210と、オーディオデコーダ部 1220と、分析フィルタ部 1230と、マルチチャンネル合成部 1240と、合成フィルタ部 1290とを備えている。

[0014] 逆多重化部 1210は、上述のビットストリームを取得し、そのビットストリームから量子化されたバイノーラルキュー情報と、符号化されたダウンミックス信号 Mとを分離して出力する。なお、逆多重化部 1210は、量子化されたバイノーラルキュー情報を逆量子化して出力する。

[0015] オーディオデコーダ部 1220は、符号化されたダウンミックス信号 Mを復号化して分析フィルタ部 1230に出力する。

[0016] 分析フィルタ部 1230は、ダウンミックス信号 Mの表現形式を、時間 Z周波数ハイブリツド表現に変換して出力する。

[0017] マルチチャンネル合成部 1240は、分析フィルタ部 1230から出力されたダウンミックス信号 Mと、逆多重化部 1210から出力されたバイノーラルキュー情報とを取得する。そして、マルチチャンネル合成部 1240は、そのバイノーラルキュー情報を用いて、ダゥンミックス信号 Mから、 2つのオーディオ信号 L, Rを時間 Z周波数ノヽイブリツド表現で復元する。

[0018] 合成フィルタ部 1290は、復元されたオーディオ信号の表現形式を、時間 Z周波数ハイブリッド表現から時間表現に変換し、その時間表現のオーディオ信号 L, Rを出力する。

[0019] なお、上述では、 2チャンネルのオーディオ信号を符号ィ匕して復号ィ匕する例を挙げてマルチチャンネル音響信号処理装置 1000を説明したが、マルチチャンネル音響信号処理装置 1000は、 2チャンネルよりも多、チャンネルのオーディオ信号 (例えば、 5. 1チャンネル音源を構成する、 6つのチャンネルのオーディオ信号)を、符号ィ匕および復号ィ匕することもできる。

[0020] 図 2は、マルチチャンネル合成部 1240の機能構成を示す機能ブロック図である。

[0021] マルチチャンネル合成部 1240は、例えば、ダウンミックス信号 Mを 6つのチャンネルのオーディオ信号に分離する場合、第 1分離部 1241と、第 2分離部 1242と、第 3 分離部 1243と、第 4分離部 1244と、第 5分離部 1245とを備える。なお、ダウンミックス信号 Mは、聴取者の正面に配置されるスピーカに対する正面オーディオ信号 Cと、視聴者の左前方に配置されるスピーカに対する左前オーディオ信号 Lと、視聴者の f

右前方に配置されるスピーカに対する右前オーディオ信号 R

fと、視聴者の左横方に配置されるスピーカに対する左横オーディオ信号 Lと、視聴者の右横方に配置されるスピーカに対する右横オーディオ信号 Rと、低音出力用サブウーファースピーカに対する低域オーディオ信号 LFEとがダウンミックスされて構成されている。

[0022] 第 1分離部 1241は、ダウンミックス信号 M力も第 1ダウンミックス信号 Mと第 4ダウン

1 ミックス信号 Mとを分離して出力する。第 1ダウンミックス信号 Mは、正面オーディオ

4 1

信号 Cと左前オーディオ信号 Lと右前オーディオ信号 Rと低域オーディオ信号 LFE f f

とがダウンミックスされて構成されている。第 4ダウンミックス信号 Mは、左横オーディ

4

ォ信号 Lと右横オーディオ信号 Rとがダウンミックスされて構成されている。

[0023] 第 2分離部 1242は、第 1ダウンミックス信号 M力も第 2ダウンミックス信号 Mと第 3

1 2 ダウンミックス信号 Mとを分離して出力する。第 2ダウンミックス信号 Mは、左前ォーディォ信号 Lと右前オーディオ信号 Rとがダウンミックスされて構成されて、る。第 3ダ f f

ゥンミックス信号 Mは、正面オーディオ信号 Cと低域オーディオ信号 LFEとがダウン

3

ミックスされて構成されて、る。

[0024] 第 3分離部 1243は、第 2ダウンミックス信号 Mから左前オーディオ信号 Lと右前ォ

2 f 一ディォ信号 R

fとを分離して出力する。

[0025] 第 4分離部 1244は、第 3ダウンミックス信号 M力正面オーディオ信号 Cと低域ォ

3

一ディォ信号 LFEとを分離して出力する。

[0026] 第 5分離部 1245は、第 4ダウンミックス信号 Mから左横オーディオ信号 Lと右横ォ

4 s 一ディォ信号 R

sとを分離して出力する。

[0027] このように、マルチチャンネル合成部 1240は、マルチステージの方法によって、各分離部で 1つの信号を 2つの信号に分離し、単一のオーディオ信号が分離されるまで再帰的に信号の分離を繰り返す。

[0028] 図 3は、バイノーラルキュー算出部 1120の構成を示すブロック図である。

[0029] バイノーラルキュー算出部 1120は、第 1レベル差算出部 1121、第 1位相差算出部 1122および第 1相関算出部 1123と、第 2レベル差算出部 1124、第 2位相差算出部 1125および第 2相関算出部 1126と、第 3レベル差算出部 1127、第 3位相差算出部 1128および第 3相関算出部 1129と、第 4レベル差算出部 1130、第 4位相差算出部 1131および第 4相関算出部 1132と、第 5レベル差算出部 1133、第 5位相差算出部 1134および第 5ネ目関算出咅 1135と、カロ算器 1136, 1137, 1138, 1139とを備えている。

[0030] 第 1レベル差算出部 1121は、左前オーディオ信号 Lと右前オーディオ信号尺との

f f 間のレベル差を算出して、その算出結果であるチャンネル間レベル差 IIDを示す信号を出力する。第 1位相差算出部 1122は、左前オーディオ信号 Lと右前オーディオ

f

信号 Rとの間の位相差を算出して、その算出結果であるチャンネル間位相差 IPDを f

示す信号を出力する。第 1相関算出部 1123は、左前オーディオ信号 Lと右前ォー

f

ディォ信号 Rとの間の相関を算出して、その算出結果であるチャンネル間相関 ICC

f

を示す信号を出力する。加算器 1136は、左前オーディオ信号 Lと右前オーディオ信

f

号 Rとを加算して所定の係数を乗算することで、第 2ダウンミックス信号 Mを生成して出力する。

[0031] 第 2レベル差算出部 1124、第 2位相差算出部 1125および第 2相関算出部 1126 は、上述と同様に、左横オーディオ信号 Lと右横オーディオ信号 Rとの間のチャンネ s s

ル間レベル差 IID、チャンネル間位相差 IPDおよびチャンネル間相関 ICCのそれぞれを示す信号を出力する。加算器 1137は、左横オーディオ信号 Lと右横オーディ s

ォ信号 Rとを加算して所定の係数を乗算することで、第 3ダウンミックス信号 Mを生 s 3 成して出力する。

[0032] 第 3レベル差算出部 1127、第 3位相差算出部 1128および第 3相関算出部 1129 は、上述と同様に、正面オーディオ信号 Cと低域オーディオ信号 LFEとの間のチャンネル間レベル差 IID、チャンネル間位相差 IPDおよびチャンネル間相関 ICCのそれぞれを示す信号を出力する。加算器 1138は、正面オーディオ信号 Cと低域オーディォ信号 LFEとを加算して所定の係数を乗算することで、第 4ダウンミックス信号 Mを

4 生成して出力する。

[0033] 第 4レベル差算出部 1130、第 4位相差算出部 1131および第 4相関算出部 1132 は、上述と同様に、第 2ダウミックス信号 Mと第 3ダウンミックス信号 Mとの間のチャン

2 3

ネル間レベル差 IID、チャンネル間位相差 IPDおよびチャンネル間相関 ICCのそれぞれを示す信号を出力する。加算器 1139は、第 2ダウミックス信号 Mと第 3ダウンミ

2

ックス信号 Mとを加算して所定の係数を乗算することで、第 1ダウンミックス信号 Mを

3 1 生成して出力する。

[0034] 第 5レベル差算出部 1133、第 5位相差算出部 1134および第 5相関算出部 1135 は、上述と同様に、第 1ダウミックス信号 Mと第 4ダウンミックス信号 Mとの間のチャン

1 4

ネル間レベル差 IID、チャンネル間位相差 IPDおよびチャンネル間相関 ICCのそれぞれを示す信号を出力する。

[0035] 図 4は、マルチチャンネル合成部 1240の構成を示す構成図である。

[0036] マルチチャンネル合成部 1240は、プレマトリックス処理部 1251と、ポストマトリックス処理部 1252と、第 1演算部 1253および第 2演算部 1255と、無相関信号生成部 1

254とを備えている。

[0037] プレマトリックス処理部 1251は、信号強度レベルの各チャンネルへの配分を示す行列 Rを、バイノーラルキュー情報を用いて生成する。

1

[0038] 例えば、プレマトリックス処理部 1251は、ダウンミックス信号 Mの信号強度レベルと、第 1ダウンミックス信号 M、第 2ダウンミックス信号 M、第 3ダウンミックス信号 Mお

1 2 3 よび第 4ダウンミックス信号 Mの信号強度レベルとの比率を示すチャンネル間レベル

4

差 IIDを用いて、ベクトル要素 R [0] R [4]によって構成される行列 Rを生成する。

1 1 1

[0039] 第 1演算部 1253は、分析フィルタ部 1230から出力された時間 Z周波数ハイブリツド表現のダウンミックス信号 Mを入力信号 Xとして取得し、例えば (数 1)および (数 2) に示すように、その入力信号 Xと行列 Rとの積を算出する。そして、第 1演算部 1253

1

は、その行列演算結果を示す中間信号 Vを出力する。つまり、第 1演算部 1253は、分析フィルタ部 1230から出力された時間 Z周波数ハイブリッド表現のダウンミックス信号 Mから、 4つのダウンミックス信号 M Mを分離する。

1 4

[0040] [数 1]

[0041] [数 2]

M, ^L_f +R_f +C + LFE

M₂ =L_{f +}R_f

A4₃ =C÷ LFE

M_A =L +R.

[0042] 無相関信号生成部 1254は、中間信号 Vに対してオールパスフィルタ処理を施すことによって、（数 3)に示すように、無相関信号 wを出力する。なお、無相関信号 wの構成要素 M および M は、ダウンミックス信号 M, Mに対して無相関処理が施された

rev irev ι

信号である。また、信号 M および信号 M は、ダウンミックス信号 M, Mと同じエネ

rev irev ι

ルギーを有し、音が広がって、るかのような印象を与える残響を含む。

[0043] [数 3] M

M

M M

W：

decorr(v) M₂

M,

M

[0044] 図 5は、無相関信号生成部 1254の構成を示すブロック図である。

[0045] 無相関信号生成部 1254は、初期遅延部 D100と、オールパスフィルタ D200とを備えている。

[0046] 初期遅延部 D100は、中間信号 Vを取得すると、その中間信号 Vを予め定められた時間だけ遅延させて、つまり位相を遅らせて、オールパスフィルタ D200に出力する。

[0047] オールパスフィルタ D200は、周波数一振幅特性には変化がなぐ周波数一位相特性のみ変化させるオールパス特性を有し、 IIR (Infinite Impulse Response)フィルタとして構成されている。

[0048] このようなオールパスフィルタ D200は、乗算器 D201〜D207と、遅延器 D221〜

D223と、カロ減算器 D211〜D223とを備えている。

[0049] 図 6は、無相関信号生成部 1254のインパルス応答を示す図である。

[0050] 無相関信号生成部 1254は、図 6に示すように、時刻 0にインパルス信号を取得しても、時刻 tlOまで信号を出力せずに遅延させ、時刻 tlOから次第に振幅が小さくなるような信号を残響として時刻 ti lまで出力する。つまり、このように無相関信号生成部 1254から出力される信号 M , M は、ダウンミックス信号 M, Mの音に残響が付 rev ，rev

加された音を示す。

[0051] ポストマトリックス処理部 1252は、残響の各チャンネルへの配分を示す行列 Rを、

2 ノイノーラルキュー情報を用いて生成する。

[0052] 例えば、ポストマトリックス処理部 1252は、音像の幅や拡散性を示すチャンネル間相関 ICCカゝらミキシング係数 Hを導出し、そのミキシング係数 Hから構成される行列

R

2を生成する。

[0053] 第 2演算部 1255は、無相関信号 wと行列 Rとの積を算出し、その行列演算結果を

2

示す出力信号 yを出力する。つまり、第 2演算部 1255は、無相関信号 wから、 6つのオーディオ信号 L , R , L , R , C, LFEを分離する _c

f f

[0054] 例えば、図 2に示すように、左前オーディオ信号 Lは、第 2ダウンミックス信号 M力 f 2 分離されるため、その左前オーディオ信号 Lの分離には、第 2ダウンミックス信号 Mと f 2

、それに対応する無相関信号 wの構成要素 M とが用いられる。同様に、第 2ダウン

2, rev

ミックス信号 Mは、第 1ダウンミックス信号 M力分離されるため、その第 2ダウンミツ

2 1

タス信号 Mの算出には、第 1ダウンミックス信号 Mと、それに対応する無相関信号 w

2 1

の構成要素 M とが用いられる。

l'rev

[0055] したがって、左前オーディオ信号 Lは、下記の（数 4)〖こより示される。

f

[0056] [数 4]

L_} = H、レ Mつ + H、つ _A M^ ,

M】 = H_{n £} x + H_{]2 £} x _m,

[0057] ここで、（数 4)中の Η は、第 3分離部 1243におけるミキシング係数であり、 Η は ij,A ij,D

、第 2分離部 1242におけるミキシング係数であり、 Η は、第 1分離部 1241における ϋ,Ε

ミキシング係数である。（数 4)に示す 3つの数式は、以下の（数 5)に示す一つのベタトル乗算式にまとめることができる。

[0058] [数 5]

Μ

Μ,

Μ、,

Η 0 0

Μ₂

Μ₃

Μ、

[0059] 左前オーディオ信号 L以外の他のオーディオ信号 R , C, LFE, L , Rも、上述のよ f f s s うな行列と無相関信号 wの行列との演算によって算出される。つまり、出力信号 yは、下記の（数 6)によって示される。

[0060] [数 6]

[0061] 図 7は、ダウンミックス信号を説明するための説明図である。

[0062] ダウンミックス信号は、通常、図 7に示されるように時間 Z周波数ハイブリッド表現で表現される。つまり、ダウンミックス信号は、時間軸方向に沿って時間単位であるパラメータセット psに分けられ、さらに、空間軸方向に沿ってサブバンド単位であるパラメータバンド pbに分けられて表現される。したがって、バイノーラルキュー情報は、バンド (ps, pb)ごとに算出される。また、プレマトリックス処理部 1251およびポストマトリツタス処理部 1252はそれぞれ、ノンド (ps, pb)ごとに行列 R (ps, pb)と行列 R (ps, p

1 2 b)とを算出する。

[0063] 図 8は、プレマトリックス処理部 1251およびポストマトリックス処理部 1252の詳細な構成を示すブロック図である。

[0064] プレマトリックス処理部 1251は、行列式生成部 1251aと内挿部 1251bとを備えている。

[0065] 行列式生成部 125 laは、ノンド (ps, pb)ごとのバイノーラルキュー情報から、バンド (ps, pb)ごとの行列 R (ps, pb)を生成する。

1

[0066] 内挿部 1251bは、バンド (ps, pb)ごとの行列 R (ps, pb)を、周波数高分解能時間

1

インデックス n、およびハイブリッド表現の入力信号 Xのサブ ·サブバンドインデックス s bに従ってマッピング、つまり内挿する。その結果、内挿部 1251bは、（n, sb)ごとの行列 R (n, sb)を生成する。このように内挿部 1251bは、複数のバンドの境界に渡る

1

行列 Rの遷移が滑らかであることを保証する。

1

[0067] ポストマトリックス処理部 1252は、行列式生成部 1252aと内挿部 1252bとを備えている。

[0068] 行列式生成部 1252aは、ノンド (ps, pb)ごとのバイノーラルキュー情報から、バンド (ps, pb)ごとの行列 R (ps, pb)を生成する。

2

[0069] 内挿部 1252bは、バンド (ps, pb)ごとの行列 R (ps, pb)を、周波数高分解能時間

2

インデックス n、およびハイブリッド表現の入力信号 Xのサブ ·サブバンドインデックス s bに従ってマッピング、つまり内挿する。その結果、内挿部 1252bは、（n, sb)ごとの行列 R (n, sb)を生成する。このように内挿部 1252bは、複数のバンドの境界に渡る

2

行列 Rの遷移が滑らかであることを保証する。

2

非特許文献 1 :J. Herre、 et al、 "The Reference Model Architecture f or MPEG Spatial Audio Coding ^J\ 118th AES Convention, Barcel ona

発明の開示

発明が解決しょうとする課題

[0070] し力しながら、従来のマルチチャンネル音響信号処理装置では演算負荷が多大であるという問題がある。

[0071] つまり、従来のマルチチャンネル合成部 1240のプレマトリックス処理部 1251、ポストマトリックス処理部 1252、第 1演算部 1253、および第 2演算部 1255における演算負荷は多大なものとなる。

[0072] そこで、本発明は、力かる問題に鑑みてなされたものであって、演算負荷を軽減したマルチチャンネル音響信号処理装置を提供することを目的とする。

課題を解決するための手段

[0073] 上記目的を達成するために、本発明に係るマルチチャンネル音響信号処理装置は、 mチャンネル (m> 1)のオーディオ信号がダウンミックスされて構成される入力信号から、前記 mチャンネルのオーディオ信号を分離するマルチチャンネル音響信号処理装置であって、前記入力信号に対して残響処理を行うことにより、前記入力信号の示す音に残響が含まれるような音を示す無相関信号を生成する無相関信号生成手段と、前記無相関信号生成手段により生成された無相関信号および前記入力信号に対して、信号強度レベルの配分および残響の配分を示す行列を用いた演算を行うことにより、前記 mチャンネルのオーディオ信号を生成する行列演算手段とを備えることを特徴とする。 [0074] これにより、無相関信号が生成された後に、信号強度レベルの配分および残響の配分を示す行列を用いた演算が行われるため、従来のように、信号強度レベルの配分を示す行列の演算と残響の配分を示す行列の演算とを、無相関信号の生成の前後で分けて行うことなぐこれらの行列演算をまとめて行うことができる。その結果、演算負荷を軽減することができる。つまり、信号強度レベルの配分を行う処理が無相関信号の生成の後に行われて分離されたオーディオ信号と、信号強度レベルの配分を行う処理が無相関信号の生成の前に行われて分離されたオーディオ信号とは類似している。したがって、本発明では、近似計算を適用することにより、行列演算をまとめることができるのである。その結果、演算に用いられるメモリの容量を減らすことができ、装置の小型化を図ることができる。

[0075] また、前記行列演算手段は、前記信号強度レベルの配分を示すレベル配分行列と、前記残響の配分を示す残響調整行列との積を示す統合行列を生成するマトリックス生成手段と、前記無相関信号および前記入力信号により示される行列と、前記マトリックス生成手段によって生成された統合行列との積を算出することにより、前記 mチヤンネルのオーディオ信号を生成する演算手段とを備えることを特徴としてもよい。

[0076] これにより、統合行列を用いた行列演算を 1回だけ行えば、入力信号から mチャンネルのオーディオ信号が分離されるため、演算負荷を確実に軽減することができる。

[0077] また、前記マルチチャンネル音響信号処理装置は、さらに、前記無相関信号および統合行列に対する前記入力信号の位相を調整する位相調整手段を備えることを特徴としてもよい。例えば、前記位相調整手段は、経時的に変化する前記統合行列または前記入力信号を遅延させる。

[0078] これにより、無相関信号の生成に遅延が生じても、入力信号の位相が調整されるため、無相関信号および入力信号に対して、適切な統合行列を用いた演算を行うことができ、 mチャンネルのオーディオ信号を適切に出力することができる。

[0079] また、前記位相調整手段は、前記無相関信号生成手段により生成される前記無相関信号の遅延時間だけ、前記統合行列または前記入力信号を遅延させることを特徴としてもよい。または、前記位相調整手段は、前記無相関信号生成手段により生成される前記無相関信号の遅延時間に最も近い、予め定められた処理単位の整数倍の処理に要する時間だけ、前記統合行列または前記入力信号を遅延させることを特徴としてちよい。

[0080] これにより、統合行列または入力信号の遅延量が、無相関信号の遅延時間と略等しくなるため、無相関信号および入力信号に対して、より適切な統合行列を用いた演算を行うことができ、 mチャンネルのオーディオ信号をより適切に出力することができる。

[0081] また、前記位相調整手段は、予め定められた検知限度以上にプリエコーが発生する場合に、前記位相を調整することを特徴としてもょヽ。

[0082] これにより、プリエコーが検知されるのを確実に防ぐことができる。

[0083] なお、本発明は、このようなマルチチャンネル音響信号処理装置として実現することができるだけでなぐ集積回路や、方法、プログラム、そのプログラムを格納する記憶媒体としても実現することができる。

発明の効果

[0084] 本発明のマルチチャンネル音響信号処理装置は、演算負荷を軽減することができるという作用効果を奏する。つまり、本発明では、ビットストリームシンタクスの変形や、認識可能なほどの音質の低下を引き起こすことなく、マルチチャンネル音響デコーダの処理の複雑性を軽減することができる。

図面の簡単な説明

[0085] [図 1]図 1は従来のマルチチャンネル音響信号処理装置の構成を示すブロック図である。

[図 2]図 2は同上のマルチチャンネル合成部の機能構成を示す機能ブロック図である

[図 3]図 3は同上のノイノーラルキュー算出部の構成を示すブロック図である。

[図 4]図 4は同上のマルチチャンネル合成部の構成を示す構成図である。

[図 5]図 5は同上の無相関信号生成部の構成を示すブロック図である。

[図 6]図 6は同上の無相関信号生成部のインパルス応答を示す図である。

[図 7]図 7は同上のダウンミックス信号を説明するための説明図である。

[図 8]図 8は同上のプレマトリックス処理部およびポストマトリックス処理部の詳細な構成を示すブロック図である。

[図 9]図 9は本発明の実施の形態におけるマルチチャンネル音響信号処理装置の構成を示すブロック図である。

[図 10]図 10は同上のマルチチャンネル合成部の構成を示すブロック図である。

[図 11]図 11は同上のマルチチャンネル合成部の動作を示すフローチャートである。

[図 12]図 12は同上の簡略ィ匕されたマルチチャンネル合成部の構成を示すブロック図である。

[図 13]図 13は同上の簡略ィ匕されたマルチチャンネル合成部の動作を示すフローチヤートである。

[図 14]図 14は同上のマルチチャンネル合成部によって出力される信号を説明するための説明図である。

[図 15]図 15は同上の変形例 1に係るマルチチャンネル合成部の構成を示すブロック図である。

[図 16]図 16は同上の変形例 1に係るマルチチャンネル合成部によって出力される信号を説明するための説明図である。

[図 17]図 17は同上の変形例 1に係るマルチチャンネル合成部の動作を示すフローチャートである。

[図 18]図 18は同上の変形例 2に係るマルチチャンネル合成部の構成を示すブロック図である。

[図 19]図 19は同上の変形例 2に係るマルチチャンネル合成部の動作を示すフローチャートである。

符号の説明

100 マルチチャンネル音響信号処理装置

100a マルチチャンネル音響符号ィ匕部

100b マルチチャンネル音響復号ィ匕部

110 ダウンミックス部

120 ノイノーラルキュー算出部

130 オーディオエンコーダ部 140 多重化部

150 逆多重化部

160 オーディオデコーダ部

170 分析フィルタ部

180 マルチチャンネル合成部

181 無相関信号生成部

182 第 1演算部

183 第 2演算部

184 プレマトリックス処理部

185 ポストマトリックス処理部

186 第 3演算部

187 マトリックス処理部

190 合成フィルタ部

発明を実施するための最良の形態

[0087] 以下、本発明の実施の形態におけるマルチチャンネル音響信号処理装置について図面を参照しながら説明する。

[0088] 図 9は、本発明の実施の形態におけるマルチチャンネル音響信号処理装置の構成を示すブロック図である。

[0089] 本実施の形態におけるマルチチャンネル音響信号処理装置 100は、演算負荷を軽減したものであって、オーディオ信号の組に対する空間音響符号ィ匕を行って音響符号ィ匕信号を出力するマルチチャンネル音響符号ィ匕部 100aと、その音響符号ィ匕信号を復号ィ匕するマルチチャンネル音響復号ィ匕部 100bとを備えている。

[0090] マルチチャンネル音響符号化部 100aは、 1024サンプルや 2048サンプルなどによって示されるフレーム単位で入力信号 (例えば、入力信号 L, R)を処理するものであって、ダウンミックス部 110と、バイノーラルキュー算出部 120と、オーディオェンコーダ部 130と、多重化部 140とを備えている。

[0091] ダウンミックス部 110は、 2チャンネルのスペクトル表現されたオーディオ信号 L, R の平均をとることによって、つまり、 M= (L+R) Z2によって、オーディオ信号 L,尺がダウンミックスされたダウンミックス信号 Mを生成する。

[0092] ノイノーラルキュー算出部 120は、スペクトルバンドごとに、オーディオ信号 L,尺およびダウンミックス信号 Mを比較することによって、ダウンミックス信号 Mをオーディオ信号 L, Rに戻すためのノイノーラルキュー情報を生成する。

[0093] バイノーラルキュー情報は、チャンネル間レベル差（inter- channel level/intensity di fference) IID、チャンネノレ間相関 (inter- channel coherence/correlation) ICC、チャンネル間位相差（inter- channel phase/delay difference) IPD、およびチャンネル予測係数（Channel Prediction Coefficients) CPCを示す。

[0094] 一般に、チャンネル間レベル差 IIDは、音のバランスや定位を制御するための情報であって、チャンネル間相関 ICCは、音像の幅や拡散性を制御するための情報である。これらは、共に聴き手が聴覚的情景を頭の中で構成するのを助ける空間パラメ一タである。

[0095] スペクトル表現されたオーディオ信号 L, Rおよびダウンミックス信号 Mは、「パラメ一タバンド」力もなる通常複数のグループに区分されている。したがって、バイノーラルキュー情報は、それぞれのパラメータバンド毎に算出される。なお、「バイノーラルキュ一情報」と「空間パラメータ」 t 、う用語はしばしば同義的に用いられる。

[0096] オーディオエンコーダ部 130は、例えば、 MP3 (MPEG Audio Layer- 3)や、 AAC ( Advanced Audio Coding)などによって、ダウンミックス信号 Mを圧縮符号化する。

[0097] 多重化部 140は、ダウンミックス信号 Mと、量子化されたバイノーラルキュー情報とを多重化することによりビットストリームを生成し、そのビットストリームを上述の音響符号化信号として出力する。

[0098] マルチチャンネル音響復号ィ匕部 100bは、逆多重化部 150と、オーディオデコーダ部 160と、分析フィルタ部 170と、マルチチャンネル合成部 180と、合成フィルタ部 19 0とを備えている。

[0099] 逆多重化部 150は、上述のビットストリームを取得し、そのビットストリームから量子化されたバイノーラルキュー情報と、符号化されたダウンミックス信号 Mとを分離して出力する。なお、逆多重化部 150は、量子化されたバイノーラルキュー情報を逆量子化して出力する。 [0100] オーディオデコーダ部 160は、符号化されたダウンミックス信号 Mを復号化して分析フィルタ部 170に出力する。

[0101] 分析フィルタ部 170は、ダウンミックス信号 Mの表現形式を、時間 Z周波数ハイプリッド表現に変換して出力する。

[0102] マルチチャンネル合成部 180は、分析フィルタ部 170から出力されたダウンミックス信号 Mと、逆多重化部 150から出力されたバイノーラルキュー情報とを取得する。そして、マルチチャンネル合成部 180は、そのバイノーラルキュー情報を用いて、ダウンミックス信号 Mから、 2つのオーディオ信号 L, Rを時間 Z周波数ハイブリッド表現で復元する。

[0103] 合成フィルタ部 190は、復元されたオーディオ信号の表現形式を、時間 Z周波数ハイブリッド表現から時間表現に変換し、その時間表現のオーディオ信号 L, Rを出力する。

[0104] なお、上述では、 2チャンネルのオーディオ信号を符号ィ匕して復号ィ匕する例を挙げて本実施の形態のマルチチャンネル音響信号処理装置 100を説明したが、本実施の形態のマルチチャンネル音響信号処理装置 100は、 2チャンネルよりも多!、チャンネルのオーディオ信号（例えば、 5. 1チャンネル音源を構成する、 6つのチャンネルのオーディオ信号)を、符号ィ匕および復号ィ匕することもできる。

[0105] ここで本実施の形態では、マルチチャンネル音響復号処理部 100bのマルチチャンネル合成部 180に特徴がある。

[0106] 図 10は、本発明の実施の形態におけるマルチチャンネル合成部 180の構成を示すブロック図である。

[0107] 本実施の形態におけるマルチチャンネル合成部 180は、演算負荷を軽減したものであって、無相関信号生成部 181と、第 1演算部 182と、第 2演算部 183と、プレマトリックス処理部 184と、ポストマトリックス処理部 185とを備えている。

[0108] 無相関信号生成部 181は、上述の無相関信号生成部 1254と同様に構成され、ォールパスフィルタ D200などを備えている。このような無相関信号生成部 181は、時間 Z周波数ハイブリッド表現のダウンミックス信号 Mを入力信号 Xとして取得する。そして、無相関信号生成部 181は、その入力信号 Xに対して残響処理を行なうことにより、その入力信号 xの示す音に残響が含まれるような音を示す無相関信号 w'を生成して出力する。つまり、無相関信号生成部 181は、入力信号 Xを示すベクトルを x= ( M, M, M, M、 M)として、（数 7)に示すように無相関信号 w'を生成する。なお、無相関信号 w 'は、入力信号 Xに対して相互相関が低い信号である。

[0109] [数 7]

M_r

it'¹ = decorr(x) = M_r

M_r

M,

[0110] プレマトリックス処理部 184は、行列式生成部 184aと内挿部 184bとを備え、ノイノ一ラルキュー情報を取得し、そのバイノーラルキュー情報を用いて、信号強度レベルの各チャンネルへの配分を示す行列 R

1を生成する。

[0111] 行列式生成部 184aは、バイノーラルキュー情報のチャンネル間レベル差 IIDを用いて、ベクトル要素 R [1]

1 〜R [5]によって構成される上述の行列 Rをバンド（ps, pb

1 1

)ごとに生成する。つまり、行列 Rは時間経過に伴って変化する。

1

[0112] 内挿部 184bは、バンド (ps, pb)ごとの行列 R (ps, pb)を、周波数高分解能時間ィ

1

ンデッタス n、およびハイブリッド表現の入力信号 Xのサブ'サブバンドインデックス sb に従ってマッピング、つまり内挿する。その結果、内挿部 184bは、（n, sb)ごとの行列 R (n, sb)を生成する。このように内挿部 184bは、複数のバンドの境界に渡る行列

1

R

1の遷移が滑らかであることを保証する。

[0113] 第 1演算部 182は、無相関信号 w'の行列と行列 Rとの積を算出することにより、 (

1

数 8)に示すように中間信号 zを生成して出力する。

[0114] [数 8] R, [l] 0 0 0 0 M

0 R_} [l] 0 0 0 M

R^decorr x) = 0 0 R、 [3] 0 0 M

0 0 0 ] 0 M

0 0 0 0 ]— M

[0115] ポストマトリックス処理部 185は、行列式生成部 185aと内挿部 185bとを備え、バイノーラルキュー情報を取得し、そのバイノーラルキュー情報を用いて、残響の各チヤンネルへの配分を示す行列 Rを生成する。

2

[0116] 行列式生成部 185aは、バイノーラルキュー情報のチャンネル間相関 ICC力もミキシング係数 Hを導出し、そのミキシング係数 Hカゝら構成される上述の行列 Rをバンド

2

(ps, pb)ごとに生成する。つまり、行列 Rは時間経過に伴って変化する。

2

[0117] 内挿部 185bは、バンド (ps, pb)ごとの行列 R (ps, pb)を、周波数高分解能時間ィ

2

ンデッタス n、およびハイブリッド表現の入力信号 Xのサブ'サブバンドインデックス sb に従ってマッピング、つまり内挿する。その結果、内挿部 185bは、（n, sb)ごとの行列 R (n, sb)を生成する。このように内挿部 185bは、複数のバンドの境界に渡る行列

2

Rの遷移が滑らかであることを保証する。

2

[0118] 第 2演算部 183は、（数 9)に示すように、中間信号 zの行列と行列 Rとの積を算出し

2

、その演算結果を示す出力信号 yを出力する。つまり、第 2演算部 183は、中間信号 z力ら、 6つのオーディオ信号 L , R , L , R , C, LFEを分離する。

[0119] [数 9] つ-, c C

A"- —LFE

[0120] このように本実施の形態では、入力信号 Xに対して無相関信号 w'が生成されて、その無相関信号 w'に対して行列 Rを用いた行列演算が行われる。つまり、従来では、

1

入力信号 Xに対して行列 R

1を用いた行列演算が行われて、その演算結果である中間信号 Vに対して無相関信号 Wが生成されるが、本実施の形態では、その逆の順序で処理が行われる。

[0121] しかし、このように処理順序を逆にしても、（数 8)に示す R decorr (x)が、（数 3)に

1

示す decorr (V)つまり decorr (R x)に略等しいことが経験上分かっている。即ち、本

1

実施の形態における第 2演算部 183で行列 Rの行列演算の対象とされる中間信号 z

2

は、従来の第 2演算部 1255で行列 Rの行列演算の対象とされる無相関信号 wと略

2

等しい。

[0122] したがって、本実施の形態のように、処理順序を従来と逆にしても、マルチチャンネル合成部 180は、従来と同様の出力信号 yを出力することができる。

[0123] 図 11は、本実施の形態におけるマルチチャンネル合成部 180の動作を示すフローチャートである。

[0124] まず、マルチチャンネル合成部 180は、入力信号 Xを取得して (ステップ S100)、その入力信号 Xに対する無相関信号 w'を生成する (ステップ S 102)。また、マルチチヤンネル合成部 180は、ノイノーラルキュー情報に基づいて行列 Rおよび行列 Rを生

1 2 成する（ステップ S 104)。

[0125] そして、マルチチャンネル合成部 180は、ステップ S 104で生成された行列 Rと、入

1 力信号 Xおよび無相関信号 w'により示される行列との積を算出することにより、つまり行列 Rによる行列演算を行うことにより、中間信号 zを生成する (ステップ S 106)。

1

[0126] さらに、マルチチャンネル合成部 180は、ステップ S104で生成された行列 Rと、その中間信号 zにより示される行列との積を算出することにより、つまり行列 Rによる行

2 列演算を行うことにより、出力信号 yを生成する (ステップ S106)。

[0127] このように本実施の形態では、無相関信号が生成された後に、信号強度レベルの配分および残響の配分を示す行列 Rおよび行列 Rを用いた演算が行われるため、

1 2

従来のように、信号強度レベルの配分を示す行列 Rを用いた演算と残響の配分を示

1

す行列 Rを用いた演算とを、無相関信号の生成の前後で分けて行うことなぐこれら

2

の行列演算をまとめて行うことができる。その結果、演算負荷を軽減することができる

[0128] ここで、本実施の形態におけるマルチチャンネル合成部 180では、上述のように処理順序が変更されているため、図 10に示すマルチチャンネル合成部 180の構成をさらに簡略ィ匕することができる。

[0129] 図 12は、簡略ィ匕されたマルチチャンネル合成部 180の構成を示すブロック図である。

[0130] このマルチチャンネル合成部 180は、第 1演算部 182および第 2演算部 183の代わりに第 3演算部 186を備えるとともに、プレマトリックス処理部 184およびポストマトリツタス処理部 185の代わりにマトリックス処理部 187を備える。

[0131] マトリックス処理部 187は、プレマトリックス処理部 184とポストマトリックス処理部 18

5とを統合して構成されており、行列式生成部 187aと内挿部 187bとを備えている。

[0132] 行列式生成部 187aは、バイノーラルキュー情報のチャンネル間レベル差 IIDを用いて、ベクトル要素 R [1]〜R [5]によって構成される上述の行列 Rをバンド（ps, pb

1 1 1

)ごとに生成する。さらに、行列式生成部 187aは、バイノーラルキュー情報のチャンネル間相関 ICCカゝらミキシング係数 Hを導出し、そのミキシング係数 Hから構成される上述の行列 Rをバンド (ps, pb)ごとに生成する。

2

[0133] さらに、行列式生成部 187aは、上述のように生成された行列 Rと行列 Rとの積を

1 2 算出することで、その算出結果である行列 Rを統合行列としてバンド (ps, pb)ごとに

3

生成する。

[0134] 内挿部 187bは、バンド (ps, pb)ごとの行列 R (ps, pb)を、周波数高分解能時間ィ

3

ンデックス n、およびハイブリッド表現の入力信号 Xのサブ ·サブバンドインデックス sb に従ってマッピング、つまり内挿する。その結果、内挿部 187bは、（n, sb)ごとの行列 R (n, sb)を生成する。このように内挿部 187bは、複数のバンドの境界に渡る行列

3

Rの遷移が滑らかであることを保証する。

3

[0135] 第 3演算部 186は、（数 10)に示すように、無相関信号 w'および入力信号 xにより示される行列と、行列 R

3との積を算出することにより、その算出結果を示す出力信号 yを出力する。

[0136] [数 10]

[0137] このように本実施の形態では、内挿部 187bにおける内挿回数 (補間回数）は、従来の内挿部 125 lbおよび内挿部 1252bにおける内挿回数 (補間回数）と比較して略半分となり、第 3演算部 186における乗算回数 (行列演算の回数）は、従来の第 1演算部 1253および第 2演算部 1255における乗算回数 (行列演算の回数)と比較して略半分となる。つまり、本実施の形態では、行列 R

3を用いた行列演算を 1回だけ行えば、入力信号 Xから複数のチャンネルのオーディオ信号が分離される。一方、本実施の形態では、行列式生成部 187aの処理が若干増加する。ところが、行列式生成部 1 87aにおけるバイノーラルキュー情報のバンド分解能 (ps, pb)は、内挿部 187bや第 3演算部 186において扱われるバンド分解能 (n, sb)よりも粗い。したがって、行列式生成部 187aの演算負荷は、内挿部 187bや第 3演算部 186に比べて小さぐ全体の演算負荷に占める割合は小さい。よって、マルチチャンネル合成部 180の全体およびマルチチャンネル音響信号処理装置 100の全体の演算負荷を大幅に削減することがでさる。

[0138] 図 13は、簡略化されたマルチチャンネル合成部 180の動作を示すフローチャートである。 [0139] まず、マルチチャンネル合成部 180は、入力信号 Xを取得して (ステップ S120)、その入力信号 Xに対する無相関信号 w'を生成する (ステップ S 120)。また、マルチチヤンネル合成部 180は、ノイノーラルキュー情報に基づいて、行列 Rおよび行列 Rの

1 2 積を示す行列 Rを生成する (ステップ S 124)。

3

[0140] そして、マルチチャンネル合成部 180は、ステップ S 124で生成された行列 Rと、入

3 力信号 Xおよび無相関信号 W'により示される行列との積を算出することにより、つまり行列 Rによる行列演算を行うことにより、出力信号 yを生成する (ステップ S 126)。

3

[0141] (変形例 1)

ここで本実施の形態における第 1の変形例について説明する。

[0142] 上記実施の形態におけるマルチチャンネル合成部 180では、無相関信号生成部 1 81が無相関信号 w'を入力信号 Xに対して遅延させて出力するため、第 3演算部 18 6において、演算の対象となる入力信号 Xと無相関信号 w'と行列 Rを構成する行列 R

3

との間でずれが生じて同期が取れない。なお、無相関信号 W'の遅延は、その無相

1

関信号 w'の生成のために必然的に発生する。一方、従来例では、第 1演算部 1253 において、演算の対象となる入力信号 Xと行列 Rとの間でずれは生じていない。

1

[0143] したがって、上記実施の形態におけるマルチチャンネル合成部 180では、本来出力すべき理想的な出力信号 yを出力することができない可能性がある。

[0144] 図 14は、上記実施の形態におけるマルチチャンネル合成部 180によって出力される信号を説明するための説明図である。

[0145] 例えば、入力信号 Xは、図 14に示すように、時刻 t = 0から出力される。また、行列 R を構成する行列 Rには、オーディオ信号 Lに寄与する成分である行列 R1と、ォー

3 1 し

ディォ信号 Rに寄与する成分である行列 R1

Rとが含まれている。例えば、行列 R1

しおよび行列 R1は、バイノーラルキュー情報に基づいて、図 14に示すように、時刻 t=0

R

以前ではオーディオ信号 Rにレベルが大きく配分され、時刻 t=0〜tlの時間ではォ一ディォ信号 Lにレベルが大きく配分され、時刻 t = tl以降ではオーディオ信号尺にレベルが大きく配分されるように設定されて!ヽる。

[0146] ここで、従来のマルチチャンネル合成部 1240では、入力信号 Xと上述の行列 Rと

1 の間で同期が取れているため、入力信号 X力行列 R1と行列 R1に応じて中間信号 vが生成されると、オーディオ信号 Lにレベルが大きく偏るような中間信号 Vが生成される。そして、この中間信号 Vに対して無相関信号 wが生成される。その結果、入力信号 Xから、無相関信号生成部 1254による無相関信号 wの遅延時間 tdだけ遅れて、残響を含む出力信号 yがオーディオ信号 Lとして出力され、オーディオ信号 Rであし

る出力信号 yは出力されない。このような出力信号 y , yが理想的な出力の一例とさ

R L R

れる。

[0147] 一方、上記実施の形態におけるマルチチャンネル合成部 180では、まず、入力信号 Xカゝら遅延時間 tdだけ遅れて、残響を含む無相関信号 w'が出力される。ここで、第 3演算部 186によって扱われる行列 Rには、上述の行列 R (行列 R1および行列

3 1 し

R1 )が含まれている。したがって、入力信号 Xと無相関信号 w，に行列 Rを用いた行

R 3 列演算が行われると、入力信号 χ、無相関信号 w'および行列 Rとの間で同期が取れ

1

ていないため、オーディオ信号 Lである出力信号 yは、時刻 t = td〜tlの間だけ出力し

され、オーディオ信号 Rである出力信号 yは、時刻 t=tl以降に出力される。

R

[0148] このように、マルチチャンネル合成部 180では、出力信号 yのみを出力すべきとこし

ろ、出力信号 yも出力してしまう。即ち、チャンネルセパレーシヨンの劣化が発生する

R

[0149] そこで、本変形例に力かるマルチチャンネル合成部は、無相関信号 w，および行列 R

3に対する入力信号 Xの位相を調整する位相調整手段を備え、この位相調整手段は行列式生成部 187dから出力される行列 Rを遅延させる。

3

[0150] 図 15は、本変形例に係るマルチチャンネル合成部の構成を示すブロック図である

[0151] 本変形例に係るマルチチャンネル合成部 180aは、無相関信号生成部 181aと、第

3演算部 186と、マトリックス処理部 187cとを備えている。

[0152] 無相関信号生成部 181aは、上述の無相関信号生成部 181と同様の機能を有するとともに、無相関信号 w，のパラメータバンド pbにおける遅延量 TD (pb)をマトリックス処理部 187cに通知する。例えば、遅延量 TD (pb)は、無相関信号 w'の入力信号 X に対する遅延時間 tdと等 U 、。

[0153] マトリックス処理部 187cは、行列式生成部 187dと内挿部 187bとを備えている。行列式生成部 187dは、上述の行列式生成部 187aと同様の機能を有するとともに上述の位相調整手段を備え、無相関信号生成部 181aから通知された遅延量 TD (pb)に応じた行列 Rを生成する。つまり、行列式生成部 187dは、（数 11)に示すような行列

3

R

3を生成する。

[0154] [数 11]

R₃ (ps_: pb) = R₂ {ps, pb)R_x {ps - TD{pb pb)

[0155] 図 16は、本変形例に係るマルチチャンネル合成部 180aによって出力される信号を説明するための説明図である。

[0156] 行列 Rに含まれる行列 R (行列 R1および行列 R1 )は、入力信号 xのパラメータバ

3 1 L R

ンド pbに対して遅延量 TD (pb)だけ遅れて行列式生成部 187dから生成される。

[0157] その結果、無相関信号 w'が入力信号 X力遅延時間 tdだけ遅れて出力されても、行列 Rに含まれる行列 R (行列 R1および行列 R1 )も遅延量 TD (pb)だけ遅れてい

3 1 L R

る。したがって、このような行列 Rと入力信号 Xと無相関信号 w'との間のずれを解消

1

して同期を取ることができる。その結果、マルチチャンネル合成部 180aの第 3演算部 186は、出力信号 yのみを時刻 t=tdから出力して、出力信号 yを出力しない。つまし R

り、第 3演算部 186は、理想的な出力信号 y , yを出力することができる。したがってし R

、本変形例では、チャンネルセパレーシヨンの劣化を抑えることができる。

[0158] なお、本変形例では、遅延時間 td=遅延量 TD (pb)としたが、これらを異ならせてもよい。また、行列式生成部 187dは、所定処理単位 (例えば、ノンド (ps, pb) )ごとに行列 Rを生成しているので、遅延量 TD (pb)を、遅延時間 tdに最も近い、その所

3

定処理単位の整数倍の処理に要する時間にしてもよい。

[0159] 図 17は、本変形例に係るマルチチャンネル合成部 180aの動作を示すフローチヤートである。

[0160] まず、マルチチャンネル合成部 180aは、入力信号 xを取得して（ステップ S140)、その入力信号 Xに対する無相関信号 w'を生成する (ステップ S 142)。また、マルチチヤンネル合成部 180aは、ノイノーラルキュー情報に基づいて、行列 Rおよび行列 R

1 2 の積を示す行列 Rを、遅延量 TD (pb)だけ遅延させて生成する (ステップ S 144)。言い換えれば、マルチチャンネル合成部 180aは、行列 Rに含まれる行列 Rを位相調

3 1 整手段によって遅延量 TD (pb)だけ遅延させる。

[0161] そして、マルチチャンネル合成部 180aは、ステップ S 144で生成された行列 Rと、

3 入力信号 Xおよび無相関信号 W'により示される行列との積を算出することにより、つまり行列 Rによる行列演算を行うことにより、出力信号 yを生成する (ステップ S 146)。

3

[0162] このように、本変形例では、行列 Rに含まれる行列 Rを遅延させることで、入力信

3 1

号 Xの位相を調整するため、無相関信号 W'および入力信号 Xに対して、適切な行列

R

3を用いた演算を行うことができ、出力信号 yを適切に出力することができる。

[0163] (変形例 2)

ここで本実施の形態における第 2の変形例について説明する。

[0164] 本変形例に係るマルチチャンネル合成部は、上述の変形例 1に係るマルチチャンネル合成部と同様に、無相関信号 w'および行列 Rに対する入力信号 Xの位相を調

3

整する位相調整手段を備える。そして、本変形例に係る位相調整手段は、入力信号 Xの第 3演算部 186への入力を遅延させる。これにより本変形例においても、上述と同様に、チャンネルセパレーシヨンの劣化を抑えることができる。

[0165] 図 18は、本変形例に係るマルチチャンネル合成部の構成を示すブロック図である

[0166] 本変形例に係るマルチチャンネル合成部 180bは、入力信号 Xの第 3演算部 186への入力を遅延させる位相調整手段たる信号遅延部 189を備えている。信号遅延部 1 89は、例えば無相関信号生成部 181の遅延時間 tdだけ入力信号 Xを遅延させる。

[0167] これにより、本変形例では、無相関信号 w'が入力信号 Xから遅延時間 tdだけ遅れて出力されても、入力信号 Xの第 3遅延部 186への入力も遅延時間 tdだけ遅延されるため、行列 Rを構成する行列 Rと入力信号 Xと無相関信号 w'との間のずれを解消

3 1

して同期を取ることができる。その結果、マルチチャンネル合成部 180aの第 3演算部 186は、図 16に示すように、出力信号 yのみを時刻 t=tdから出力し、出力信号 yをし R 出力しない。つまり、第 3演算部 186は、理想的な出力信号 y , yを出力することがでし R

きる。したがって、チャンネルセパレーシヨンの劣化を抑えることができる。

[0168] なお、本変形例でも、遅延時間 td=遅延量 TD (pb)としたが、これらを異ならせてもよい。また、信号遅延部 189が所定処理単位 (例えば、ノンド (ps, pb) )ごとに遅延処理をしているような場合には、遅延量 TD (pb)を、遅延時間 tdに最も近い、その所定処理単位の整数倍の処理に要する時間にしてもよい。

[0169] 図 19は、本変形例に係るマルチチャンネル合成部 180bの動作を示すフローチヤートである。

[0170] まず、マルチチャンネル合成部 180bは、入力信号 Xを取得して (ステップ S160)、その入力信号 Xに対する無相関信号 w'を生成する (ステップ S162)。さらに、マルチチャンネル合成部 180bは入力信号 Xを遅延させる (ステップ S164)。

[0171] また、マルチチャンネル合成部 180bは、ノイノーラルキュー情報に基づいて、行列 Rおよび行列 Rの積を示す行列 Rを生成する（ステップ S 166)。

1 2 3

[0172] そして、マルチチャンネル合成部 180bは、ステップ S 166で生成された行列 Rと、

3 ステップ S164で遅延された入力信号 Xおよび無相関信号 w'により示される行列との積を算出することにより、つまり行列 R

3による行列演算を行うことにより、出力信号 yを生成する（ステップ S 168)。

[0173] このように、本変形例では、入力信号 Xを遅延させることで、入力信号 Xの位相を調整するため、無相関信号 w'および入力信号 Xに対して、適切な行列 R

[0174] 以上、本発明に係るマルチチャンネル音響信号処理装置にっヽて、実施の形態およびその変形例を用いて説明したが、本発明は、これらに限定されるものではない。

[0175] 例えば、変形例 1および変形例 2における位相調整手段は、予め定められた検知限度以上にプリエコーが発生する場合に限って、位相を調整してもよい。

[0176] つまり、上述の変形例 1では、行列式生成部 187dに含まれる位相調整手段が行列

Rを遅延させ、上述の変形例 2では、位相調整手段たる信号遅延部 189が入力信号

3

Xを遅延させた。しかし、それらの位相遅延手段は、プリエコーが上記検知限度以上に発生する場合に限って遅延させてもよい。このプリエコーは、衝撃音の直前に発生するノイズであって、無相関信号 w'の遅延時間 tdに応じて発生しやすくなる。これにより、プリエコーが検知されるのを確実に防ぐことができる。

[0177] また、マルチチャンネル音響信号処理装置 100や、マルチチャンネル音響符号ィ匕部 100a、マルチチャンネル音響復号化部 100b、マルチチャンネル合成部 180, 18 Oa, 180b,さらにこれらに含まれる各構成要素を、 LSI (Large Scale Integration)などの集積回路によって構成してもよい。さらに、本発明は、これらの装置および各構成要素における動作をコンピュータに実行させるプログラムとしても実現することができる。

産業上の利用可能性

本発明のマルチチャンネル音響信号処理装置は、演算負荷を軽減することができるという効果を奏し、例えば、ホームシアターシステム、車載音響システムおよび電子ゲームシステムなどに適用可能であり、特に放送等の低ビットレートの応用において有用である。

Claims

請求の範囲

[1] mチャンネル (m> 1)のオーディオ信号がダウンミックスされて構成される入力信号から、前記 mチャンネルのオーディオ信号を分離するマルチチャンネル音響信号処理装置であって、

前記入力信号に対して残響処理を行うことにより、前記入力信号の示す音に残響が含まれるような音を示す無相関信号を生成する無相関信号生成手段と、

前記無相関信号生成手段により生成された無相関信号および前記入力信号に対して、信号強度レベルの配分および残響の配分を示す行列を用いた演算を行うことにより、前記 mチャンネルのオーディオ信号を生成する行列演算手段と

を備えることを特徴とするマルチチャンネル音響信号処理装置。

[2] 前記行列演算手段は、

前記信号強度レベルの配分を示すレベル配分行列と、前記残響の配分を示す残響調整行列との積を示す統合行列を生成するマトリックス生成手段と、

前記無相関信号および前記入力信号により示される行列と、前記マトリックス生成手段によって生成された統合行列との積を算出することにより、前記 mチャンネルのオーディオ信号を生成する演算手段とを備える

ことを特徴とする請求項 1記載のマルチチャンネル音響信号処理装置。

[3] 前記マルチチャンネル音響信号処理装置は、さらに、

前記無相関信号および統合行列に対する前記入力信号の位相を調整する位相調整手段を備える

ことを特徴とする請求項 2記載のマルチチャンネル音響信号処理装置。

[4] 前記位相調整手段は、経時的に変化する前記統合行列または前記入力信号を遅延させる

ことを特徴とする請求項 3記載のマルチチャンネル音響信号処理装置。

[5] 前記位相調整手段は、前記無相関信号生成手段により生成される前記無相関信号の遅延時間だけ、前記統合行列または前記入力信号を遅延させる

ことを特徴とする請求項 4記載のマルチチャンネル音響信号処理装置。

[6] 前記位相調整手段は、前記無相関信号生成手段により生成される前記無相関信号の遅延時間に最も近い、予め定められた処理単位の整数倍の処理に要する時間だけ、前記統合行列または前記入力信号を遅延させる

[7] 前記位相調整手段は、予め定められた検知限度以上にプリエコーが発生する場合に、前記位相を調整する

[8] mチャンネル (m> 1)のオーディオ信号がダウンミックスされて構成される入力信号から、前記 mチャンネルのオーディオ信号を分離するマルチチャンネル音響信号処理方法であって、

前記入力信号に対して残響処理を行うことにより、前記入力信号の示す音に残響が含まれるような音を示す無相関信号を生成する無相関信号生成ステップと、前記無相関信号生成ステップで生成された無相関信号および前記入力信号に対して、信号強度レベルの配分および残響の配分を示す行列を用いた演算を行うことにより、前記 mチャンネルのオーディオ信号を生成する行列演算ステップと

を含むことを特徴とするマルチチャンネル音響信号処理方法。

[9] 前記行列演算ステップでは、

前記信号強度レベルの配分を示すレベル配分行列と、前記残響の配分を示す残響調整行列との積を示す統合行列を生成するマトリックス生成ステップと、

前記無相関信号および前記入力信号により示される行列と、前記マトリックス生成ステップで生成された統合行列との積を算出することにより、前記 mチャンネルのォ一ディォ信号を生成する演算ステップとを含む

ことを特徴とする請求項 8記載のマルチチャンネル音響信号処理方法。

[10] 前記マルチチャンネル音響信号処理方法は、さらに、

前記無相関信号および統合行列に対する前記入力信号の位相を調整する位相調整ステップを含む

ことを特徴とする請求項 9記載のマルチチャンネル音響信号処理装置。

[11] 前記位相調整ステップでは、経時的に変化する前記統合行列または前記入力信号を遅延させることを特徴とする請求項 10記載のマルチチャンネル音響信号処理方法。

[12] 前記位相調整ステップでは、前記無相関信号生成ステップで生成される前記無相関信号の遅延時間だけ、前記統合行列または前記入力信号を遅延させる

ことを特徴とする請求項 11記載のマルチチャンネル音響信号処理方法。

[13] 前記位相調整ステップでは、前記無相関信号生成ステップで生成される前記無相関信号の遅延時間に最も近い、予め定められた処理単位の整数倍の処理に要する時間だけ、前記統合行列または前記入力信号を遅延させる

[14] 前記位相調整ステップでは、予め定められた検知限度以上にプリエコーが発生する場合に、前記位相を調整する

ことを特徴とする請求項 10記載のマルチチャンネル音響信号処理方法。