JP2006323314A - マルチチャネル音声信号をバイノーラルキュー符号化する装置 - Google Patents

マルチチャネル音声信号をバイノーラルキュー符号化する装置 Download PDF

Info

Publication number
JP2006323314A
JP2006323314A JP2005148771A JP2005148771A JP2006323314A JP 2006323314 A JP2006323314 A JP 2006323314A JP 2005148771 A JP2005148771 A JP 2005148771A JP 2005148771 A JP2005148771 A JP 2005148771A JP 2006323314 A JP2006323314 A JP 2006323314A
Authority
JP
Japan
Prior art keywords
channel
signal
downmix
mixing
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005148771A
Other languages
English (en)
Inventor
Sen Chon Kok
セン・チョン コク
Naoya Tanaka
直也 田中
Hon Neo Sua
ホン・ネオ スア
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2005148771A priority Critical patent/JP2006323314A/ja
Publication of JP2006323314A publication Critical patent/JP2006323314A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Stereophonic System (AREA)

Abstract

【課題】 従来のマルチチャネル音声信号符号化では、ダウンミックス信号と“残響信号”とをミキシングすることで音の拡がりを実現していた。しかしながら、このミキシング方法は、ダウンミックス信号とオリジナル信号との間のベクトル関係を完全に活用しているとはいえない。
【解決手段】本発明は、最初にダウンミックスチャネルとオリジナルチャネルとの間の所望のベクトル関係をバイノーラルキューから導出した後、ダウンミックス信号と、その直交的であり無相関的である信号との間の正確なベクトル関係をシミュレーションするという新しいミキシング方法を提案する。さらに本発明は、上記ミキシング方法をマルチチャネルに応用する方法を提案する。
【選択図】 図2

Description

本発明は、符号化処理においてバイノーラルキューを抽出して、ダウンミックス信号を生成し、復号化処理において前記バイノーラルキューを前記ダウンミックス信号に付加することでマルチチャネル音声信号を圧縮する装置に関する。本発明は、ホームシアターシステム、カーオーディオシステム、電子ゲームシステム等に適用可能である。
本発明は、マルチチャネル音声信号の符号化に関する。主たる目的は、ビットレートに制約がある場合でも、デジタル音声信号の聴覚上のクオリティーを最大限に保ちつつ当該デジタル音声信号の符号化を行うことである。ビットレートが低くなると、伝送帯域幅および記憶容量を小さくするという点で有利である。
従来より、上記のようにビットレート低減を実現するための方法が多く存在する。
”MSステレオ”による方法では、ステレオチャネルLおよびRが、それらの”和”(L+R)および”差分”(L−R)という形で表現される。これらのステレオチャネルの相関性が高い場合、”差分”信号に含まれるのは、”和”信号よりも少ないビットで粗い量子化を施せる重要度の低い情報である。L=Rとなるような極端な例では、差分信号に関する情報を送信する必要はない。
”インテンシティステレオ”による方法では、耳が持つ音響心理学的特性を利用し、高周波数領域に対しては、周波数に対応するスケールファクタと共に”和”信号のみを送信し、デコーダ側でそのスケールファクタを”和”信号に適用して、LチャネルおよびRチャネルを合成する。
”バイノーラルキュー符号化”による方法では、復号化処理においてダウンミックス信号の形成を行うために、バイノーラルキューが生成される。バイノーラルキューは、例えば、チャネル間レベル/強度差(ILD)、チャネル間位相/遅延差(IPD)、チャネル間干渉性/相関性(ICC)等である。ILDキューからは相対的な信号のパワーを測定でき、IPDキューからは音が両耳に届くまでの時間差を測定でき、ICCキューからは類似性を測定できる。一般に、レベル/強度キューおよび位相/遅延キューにより音声のバランスや方向性を制御でき、干渉性/相関性キューにより音声の幅や拡がりを制御できる。これらのキューは一体となって、聴き手が聴覚的情景を頭の中で構成するのを助ける空間的パラメータとなる。
図1は、バイノーラルキュー符号化による方法を用いた典型的なコーデックを示す図である。符号化処理において、音声信号はフレームごとに処理される。モジュール(100)は、左チャネルLおよび右チャネルRをダウンミックスし、M=(L+R)/2を生成する。バイノーラルキュー抽出モジュール(102)は、L、RおよびMを処理し、バイノーラルキューを生成する。バイノーラル抽出モジュール(102)は、通常、時間−周波数変換モジュールを備え、当該モジュールにおいてL、RおよびMを例えば、FFT、MDCT等の完全なスペクトル表現に変換するか、またはQMF等のような時間と周波数とのハイブリッド表現に変換する。あるいは、スペクトル表現されたLおよびRの平均値をとることにより、スペクトル変換後にLおよびRからMを生成することもできる。バイノーラルキューは、上記のように表現されたL、RおよびMを、スペクトル帯域ごとに比較することで求めることができる。
オーディオエンコーダ(104)は、M信号を符号化し、圧縮ビットストリームを生成する。オーディオエンコーダの例として、MP3、AACなどがある。バイノーラルキューは、モジュール(106)において量子化されてから、圧縮されたMに多重化され、完全なビットストリームが形成される。復号化処理において、デマルチプレクサ(108)はMのビットストリームをバイノーラルキュー情報から分離する。オーディオデコーダ(110)はMのビットストリームを復号し、ダウンミックス信号Mを復元する。マルチチャネル合成モジュール(112)は、当該ダウンミックス信号および逆量子化されたバイノーラルキューを処理し、マルチチャネル信号を復元する。
ISO/IEC 14496-3:2001/AMD2, "Parametric Coding for high Quality Audio" US2003/0219130A1, "Coherence-based Audio Coding and Synthesis" Karls, M., Brandenburg, K., et al, "Applications of Digital Signal Processing to Audio and Acoustics", Kluwear Academic Press. JP2004/248989, "Encoding and Decoding Devices for Audio Signals"
本発明は、従来技術におけるバイノーラルキュー符号化に基づく方法を改良することを目的とする。
本発明は、符号化処理においてQMFフィルタバンクを用いてLチャネルおよびRチャネルを時間−周波数(T/F)表現に変換するバイノーラルキュー符号化方法に関する。
非特許文献1では、ダウンミックス信号と”残響信号”とをミキシングすることで音の拡がりを実現している。残響信号は、ダウンミックス信号をShroederのオールパスリンクを用いて処理することで得ることができる。しかしながら、このミキシング方法は、ダウンミックス信号とオリジナル信号との間のベクトル関係を完全に活用しているとはいえない。
特許文献1では、ILDキューおよびIPDキューに対して”ランダムシーケンス”を挿入することで、音の拡がり(すなわち、サラウンド効果)を実現している。ランダムシーケンスは、ICCキューによって制御される。
本発明の実施の形態1では、最初にダウンミックスチャネルとオリジナルチャネルとの間の所望のベクトル関係をバイノーラルキューから導出した後、ダウンミックス信号とその直交信号との間の正確なベクトル関係をシミュレーションするという新しいミキシング方法を提案する。
実施の形態2では、チャネル分離方法をマルチチャネルに応用する方法を提案する。
本発明では、バイノーラルキューを抽出し、オリジナル信号をダウンミキシングする符号化処理において、オリジナル信号が持つ、マルチチャネルならではの効果を高品位に再現することができる。これは、復号化処理において前記バイノーラルキューをダウンミックス信号に適用することで可能となる。
以下に示す実施の形態は、本発明の様々な進歩性の原理を例示しているにすぎず、以下に示す詳細な説明に対して種々変形を加えることが可能であることは、当業者であれば容易に理解するところである。従って、本発明は特許請求の範囲によってのみ制限されるものであって、以下に示す詳細な具体例よって限定されるものではない。
さらに、ここではステレオ−モノラル−ステレオ(以降、“2-1-2ケース”と記す)および5チャネル−モノラル−5チャネル(以降、“5-1-5ケース”と記す)の2つのケースのみを示しているが、本発明はこれに限定されるものではない。これを、MオリジナルチャネルおよびNダウンミックスチャネルとして一般化することができる。
図2は2-1-2ケースにおける符号化処理を示す図である。変換モジュール(200)は、オリジナルチャネルL(t)およびR(t)を処理し、それぞれの時間−周波数表現L(t,f) およびR(t,f)を得る。ここで、tは時間指標を示し、fは周波数指標を示す。変換モジュール(200)は、例えば、MPEG Audio Extension 1,2で用いられるような複素QMFフィルタバンク等である。L(t,f)およびR(t,f)は連続する複数のサブバンドを含んでおり、それぞれのサブバンドはオリジナル信号の狭い周波数帯域を表している。QMFフィルタバンクは、低周波数サブバンドでは狭い周波数帯域とし、高周波数サブバンドでは広い帯域に対応するため、複数のステージで構成することができる。
ダウンミックスモジュール(202)は、L(t,f) およびR(t,f)を処理し、ダウンミックス信号M(t,f)を生成する。本実施の形態では、”重み付け”を用いた単純な方法を示す。
本発明では、ILDキューを用いてレベル調整を行う。ILDキューを計算するために、モジュール(204)は、L(t,f)およびR(t,f)をさらに処理し、ILD(l,b)およびBorderを生成する。図3に示されるように、まず、時間―周波数表現L(t,f)を周波数方向に複数の帯域(300)に分割する。それぞれの帯域は複数のサブバンドを含む。耳が持つ音響心理学的特性を利用して、低周波数帯域は、高周波数帯域よりもサブバンドの数が少なくなっている。例えば、サブバンドを帯域にグループ分けする際に、音響心理学の分野でよく知られている”バーク尺度”または”臨界帯域”を用いることができる。
L(t,f)およびR(t,f)はさらに時間方向に境界Border(302)で周波数帯域(l,b)に分割され、これに対してEL(l,b)およびER(l,b)を計算する。ここで、lは時間的区分の指標であり、bは帯域の指標を示す。Borderの最適な配置場所は、EL(l,b)およびER(l,b)の比率が急激に変化する時間的位置である。ILD(l,b)は次のように算出される。
Figure 2006323314
符号化処理においてチャネル間干渉性キューを求めるため、モジュール(206)はL(t,f)およびR(t,f)を処理し、以下の数式を用いてICC(b)を求める。
Figure 2006323314
さらに、符号化処理において高周波数サブバンド(>1.5kHzのみ)に対する高周波数チャネル間相関性キューを求めるため、(208)はL(t,f)およびR(t,f)を処理し、以下の数式を用いてICCH(b)を求める。
Figure 2006323314
後述するが、ICC(l,b)をILD(l,b)と組み合わせて用いることでゲインファクターを導出し、Mに対するLおよびRの実際の信号強度を復元する。さらに、ICC(l,b)を用いて低周波数におけるLとRとの間の位相関係を計測するが、これはLとRと分離の度合いを計測するのにも役立つ。しかしながら高周波数においては、音が分離していることによってもたらされる効果は、位相差ではなく、LおよびRの波形の類似度に影響される。例えば、L=cos(ωt+θ)、R=cos(ωt)である場合、ωの値が大きければ、θの値に関わらず同じ立体音響的効果がもたらされる。このような波形相関性の計測にはICCH(l,b)の利用がより適している。
上記バイノーラルキューは全て、符号化処理における副情報の一部となる。図4に示すように、バイノーラルキュー生成のための全処理は、上述の入力・出力を用いてモジュール(400)に含めることができる。
図5は、上記のように生成されたバイノーラルキューを用いた復号化処理を示す図である。変換モジュール(500)はダウンミックス信号M(t)を処理し、時間−周波数表現M(t,f)に変換する。本実施の形態で示す変換モジュールは、複素QMFフィルタバンクである。
無相関器(502)はM(t,f)を処理し、直交信号を二つ生成する。図6において、従来技術における直交信号生成方法の例を二つ示す。非特許文献1ではBlock(600)を用い、分数遅延オールパスフィルタを用いて、ダウンミックス信号M(t,f)に対して直交である残響信号を導出している。Block(604)は直列接続されたオールパスフィルタを示している。なお、上記以外の無相関器を用いることも可能である。例えば、非特許文献2ではBlock(602)を用い、共通オールパスフィルタ(606)においてM(t,f)を処理した後、処理されたM(t,f)を、互いに素の関係となる遅延特性を持つ二つの櫛形フィルタ(608)、(610)において無相関する(mutually-prime orders)。以下では無相関器(600)を想定して説明を行う。
本発明の実施の形態1において、モジュール(504)は(l,b)として示される帯域それぞれについて、バイノーラルキューBorder、ILD(l,b)、ICC(l,b)、およびICCH(l,b)からミキシング係数gL(l,b)、gR(l,b)、θL(l,b)、およびθR(l,b)を求める。次にモジュール(506)は、求められたミキシング係数に基づいてミキシングファクターgL1(l,b)、gL2(l,b)、gR1(l,b)、およびgR2(l,b)を算出する。
記載の簡略化を図るため、以下では数式において(l,b)の表記を省略する。
符号化器でのダウンミックス処理に基づき、L、R、およびMのエネルギー間の関係を以下のように導出する。
Figure 2006323314
従来、ILDおよびICCは以下のように定義されている。
Figure 2006323314
このため、上記ILDおよびICCの定義を数式EMに代入すると、分離されたチャネルL’およびR’のレベルにまでMを増幅するのに必要なゲイン係数は以下のようになる。
Figure 2006323314
Figure 2006323314
図7は、ベクトル関係において、MからLおよびRを“分離”する様子を幾何学的に示した図である(特許文献2)。同図において、θLおよびθRは分離の度合いを示す。低周波数に対しては(θL+θR)をθ=cos-1(ICC)に設定し、高周波数(>1.5kHz)に対しては(θL+θR)をθ=cos-1(ICCH)に設定するが、その理由は上に述べたとおりである。図7に示す垂直三角形に対して三角関数を適用すると、
Figure 2006323314
同様に、
Figure 2006323314
復号化器ではオリジナルのLおよびRを利用できないため、相関性のない二つの信号 をモジュール(506)においてミックスして、上記分離をシミュレーションする。図 8に示すように、前記相関性のない二つの信号は直交的なベクトル関係を有している。
非特許文献1においては、相関のない二つの信号は、ダウンミックス信号S1=M と、Mから導出される無相関信号S2=Mrevとである。本発明 においては、ミキシングファクターgL1、gL2、gR1、およ びgR2を用いてMおよびMrevをスケーリングすることでミ キシングを行い、続いてベクトル加算を行う。gL1、gL2、gR1 、およびgR2は、gL、gR、θL、およびθRから導出される 。これは、MrevはMのオールパスバージョンであるため、|M |=|Mrev|となるためである。
左チャネルL’を合成する前提として、次の2つの要件が満たされている必要がある。
Figure 2006323314
Figure 2006323314
上記二つの連立方程式を解くことで、左チャネルを導出するためのミキシングファクターを求めることができる。
Figure 2006323314
同様にして、右チャネルを導出するためのミキシングファクターを求めることができる。
Figure 2006323314
最後に、二つのチャネルL’およびR’を合成するために、次のようにミキシングファクターを用いる。
Figure 2006323314
モジュール(508)において、分離されたチャネルL’(l,b)およびR’(l,b)を逆変換し、時間領域信号L’(t)およびR’(t)を形成する。
本発明の実施の形態2では、上記チャネル分離方法をマルチチャネルにも応用する方法を示す。本実施の形態では、5-1-5ケースを用いて説明を行う。また、以下の数式をダウンミックス用の数式として想定する。
Figure 2006323314
上記数式において、LおよびRは二つのフロント(前方)チャネルを示し、LSおよびRSは二つのリア(後方)チャネルを示し、Cはセントラル(中央)チャネルを示す。
図9に示す5-1-5ケースにおける符号化処理では、図4に示すモジュール(400)において、4通りのチャネルの組合せに対して4回処理を行うことで4つのバイノーラルキューセットを生成する。例えば、一つ目のバイノーラルキューセットを生成するために、ブロック(900)(図4におけるモジュール(400)と同じ)に対してCチャネルと中間ダウンミックスチャネル(L+0.707SLS+R+0.707RS)を入力する。モジュール(902)〜(906)においても同様の処理が行われる。生成された4つのバイノーラルキューセットは、マルチステージ復号化処理においてダウンミックスチャネルMを、L、R、LS、RSおよびCに分離するために用いられる。
図10はそのマルチステージ復号化処理を示す図である。図5に示す2-1-2ケースと同様に、ダウンミックスチャネルMに対してQMF変換(1000)および無相関処理(1002)を行ってMrevを生成する。
バイノーラルキューセット1をミキシング係数算出モジュール(1004)において処理し、二つのミキシングファクターセット(gL1、gL2)および(gR1、gR2)を生成する。この処理は、MをCとM1=(L+0.707Ls+R+0.707Rs)とに分離するために行われる。[数15]より、M=0.293C+0.707M1を求めることは容易であり、重み付けの値として0.293および0.707を用いる。
バイノーラルキューセット2をミキシング係数算出モジュール(1006)において処理し、二つのミキシングファクターセット(gL3、gL4)および(gR3、gR4)を生成する。この処理はM1をM2=(L+R)/2とM3=(Ls+Rs)/2とに分離するために行われる。[数15]より、M1=0.586M2+0.414M3を求めることは容易であり、重み付けの値として0.586および0.414を用いる。
バイノーラルキューセット3をミキシング係数算出モジュール(1008)において処理し、二つのミキシングファクターセット(gL5、gL6)および(gR5、gR6)を生成する。この処理はM2をLとRとに分離するために行われる。M2=0.5L+0.5Rであるため、重み付けの値として0.5を用いる。
バイノーラルキューセット4をミキシング係数算出モジュール(1010)において処理し、二つのミキシングファクターセット(gL7、gL8)および(gR7、gR8)を生成する。この処理はM3をLsとRsとに分離するために行われる。M3=0.5Ls+0.5Rsであるため、重み付けの値として0.5を用いる。
チャネルミキシングモジュール(1012)〜(1020)は、一連の行列演算においてミキシングファクターを組み合わせ、全体のミキシングファクターを求める。ここで、まず次の点に留意されたい。
Figure 2006323314
である場合、その直交信号(+π/2で回転)は以下のようになる。
Figure 2006323314
よって、行列形式で表わすと、
Figure 2006323314
L’を求めるため、一連のチャネル分離処理に用いられるミキシングファクターM‐>M1‐>M2を組み合わせる。L’に対するミキシング用の数式は、
Figure 2006323314
同様にして、モジュール(1014)〜(1020)において他のミキシング用の数式を求めることができる。
M‐>M1‐>M2から
Figure 2006323314
M‐>M1‐>M3から
Figure 2006323314
M‐>M1‐>M3から
Figure 2006323314
Mから
Figure 2006323314
逆QMFモジュール(1022)〜(1030)は、全ての合成チャネルを時間領域信号に変換する。
(その他変形例)
なお、本発明を上記実施の形態に基づいて説明してきたが、本発明は、上記の実施の形態に限定されないのはもちろんである。以下のような場合も本発明に含まれる。
(1)上記の各装置は、具体的には、マイクロプロセッサ、ROM、RAM、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムである。前記RAMまたはハードディスクユニットには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
(2)上記の各装置を構成する構成要素の一部または全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムである。前記RAMには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、システムLSIは、その機能を達成する。
(3)上記の各装置を構成する構成要素の一部または全部は、各装置に脱着可能なICカードまたは単体のモジュールから構成されているとしてもよい。前記ICカードまたは前記モジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。前記ICカードまたは前記モジュールは、上記の超多機能LSIを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、前記ICカードまたは前記モジュールは、その機能を達成する。このICカードまたはこのモジュールは、耐タンパ性を有するとしてもよい。
(4)本発明は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるデジタル信号であるとしてもよい。
また、本発明は、前記コンピュータプログラムまたは前記デジタル信号をコンピュータ読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、CD−ROM、MO、DVD、DVD−ROM、DVD−RAM、BD(Blu−ray Disc)、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されている前記デジタル信号であるとしてもよい。
また、本発明は、前記コンピュータプログラムまたは前記デジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。
また、本発明は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、前記メモリは、上記コンピュータプログラムを記憶しており、前記マイクロプロセッサは、前記コンピュータプログラムにしたがって動作するとしてもよい。
また、前記プログラムまたは前記デジタル信号を前記記録媒体に記録して移送することにより、または前記プログラムまたは前記デジタル信号を前記ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。
(5)上記実施の形態及び上記変形例をそれぞれ組み合わせるとしてもよい。
本発明は、ホームシアターシステム、カーオーディオシステム、電子ゲームシステム等に適用可能である。
典型的なバイノーラルキュー符号化システム。 2-1-2ケースにおける空間音声符号化処理。 周波数帯域を形成するための時間・周波数の分割。 バイノーラルキュー抽出ブロック。 2-1-2ケースにおける空間音声復号化処理。 二つの無相関器。 音声信号のペアとそれらのダウンミックス信号と間のベクトル関係。 二つの直交信号ベクトルの和による信号合成。 5-1-5ケースにおける空間音声符号化処理の一部。 5-1-5ケースにおける空間音声復号化処理。
符号の説明
200 変換モジュール
202 ダウンミックスモジュール
204 ILDモジュール
206 ICCモジュール
208 ICCHモジュール
400 2−1BCC符号化モジュール
500 QMFフィルタバンク
502 無相関器
504 ミキシング係数算出モジュール
506 チャネルミキシングモジュール
508 QMF-1フィルタバンク

Claims (15)

  1. 複数の音声チャネルを空間的音声情報として符号化する装置であって、
    (a) ダウンミックスチャネルを算出し、
    (b) 前記複数の音声チャネルとダウンミックスチャネルとを時間−周波数表現に変換し、それらを周波数軸に沿って中間周波数帯域に分割し、
    (c)前記ダウンミックスチャネルをマルチステージ復号化処理において個々の音声チャネルに分離するためのチャネル分離ステップを導出し、
    (d) 各チャネル分離ステップについて、前記中間周波数帯域をさらに周波数帯域に分割するための、時間方向における境界を決定し、
    (e) 各チャネル分離ステップおよび各周波数帯域について、チャネル間レベル差キュー(ILD)を算出し、
    (f) 各チャネル分離ステップおよび各周波数帯域について、チャネル間干渉性キュー(ICC)を算出し、
    (g) 各チャネル分離ステップおよび各高周波数の周波数帯域について、高周波数チャネル間相関性キュー(ICCH)を算出する
    ことを特徴とする装置。
  2. 請求項1に記載の装置であって、各チャネル分離ステップについて、複数の信号からなる一つの複合ダウンミックス信号を入力とし、前記一つの複合ダウンミックス信号を、それぞれが一または複数の信号からなる二つの複合ダウンミックス信号に分割する
    ことを特徴とする装置。
  3. 請求項1に記載の装置であって、前記境界は、時間方向においてILDに大きな変化が現れる時間的位置に配置される
    ことを特徴とする装置。
  4. 請求項1に記載の装置であって、前記ILDキューは、周波数帯域における二つの複合信号のエネルギーの比率である
    ことを特徴とする装置。
  5. 請求項1に記載の装置であって、前記ICCキューは、周波数帯域における二つの複合信号間の、位相の相関性を計測するために用いられる
    ことを特徴とする装置。
  6. 請求項1に記載の装置であって、前記ICCHキューは、周波数帯域における二つの複合信号間の、位相ではなく波形の相関性を計測するために用いられる
    ことを特徴とする装置。
  7. 空間的音声情報を複数の音声チャネルに復号する装置であって、
    (a) ダウンミックスチャネルを時間−周波数表現に変換し、それらを周波数軸に沿って中間周波数帯域に分割し、
    (b) 前記ダウンミックスチャネルに対して相関器による処理を施し、前記ダウンミックス信号の逆相関チャネルを形成し、
    (c) 各チャネル分離ステップについて、Border、ILD,ICC、およびICCHをそれぞれが含む全てのバイノーラルキューセットをミキシング係数算出(MCC)モジュールに入力して、ミキシングファクターを導出し、
    (d) チャネルミキシング(CM)モジュールにおいて、前記ミキシングファクターを組み合わせることで、個々のチャネルに対する全体のミキシングファクターを算出し、
    (e) 前記CMモジュールにおいて、無相関信号と前記全体のミキシングファクターとをミキシングして、前記個々の信号を生成し、
    (f) 全ての個々の信号を時間−周波数表現から時間領域に逆変換してマルチチャネル音声を復元する
    ことを特徴とする装置。
  8. 請求項7に記載の装置であって、前記無相関信号は互いに直交である
    ことを特徴とする装置。
  9. 請求項7に記載の装置であって、前記MCCは、対応するチャネル分離ステップについて出力された二つの複合信号にそれぞれに付加される2つのミキシングファクターセット生成する
    ことを特徴とする装置。
  10. 請求項7および9に記載の装置であって、前記ミキシングファクターは、ゲインファクターおよび分離の度合いの関数である
    ことを特徴とする装置。
  11. 請求項7、9および10に記載の装置であって、前記ゲインファクターおよび分離の度合は、ILD、ICC、およびICCHから予測される、二つの複合信号間のベクトル関係を考慮して算出される
    ことを特徴とする装置。
  12. 請求項7に記載の装置であって、前記全体のミキシングファクターは、対応するチャネル分離ステージでそれぞれ導出されるミキシングファクターを、一連の行列演算によって合算することで算出する
    ことを特徴とする装置。
  13. 請求項7に記載の装置であって、前記ミキシング処理において、前記ダウンミックス信号と、ベクトル的な関係において、直交かつ無相関な信号とを用いることによって、ダウンミックス信号と分離された信号との間の、所望の分離度合いを実現する
    ことを特徴とする装置。
  14. 請求項7および13に記載の装置であって、前記ミキシング処理において、前記ミキシングファクターを用いてダウンミックス信号と無相関信号とをスケーリングし、それらの信号がベクトル空間に追加された場合であっても、ダウンミックス信号からの分離の度合いが所望の度合いであり、信号強度が所望の強度である分離信号を生成できるようにする、
    ことを特徴とする装置。
  15. 請求項12、13および14に記載の装置であって、前記行列演算において、入力ダウンミックス信号とその無相関信号とに到達するまで、現在のチャネル分離ステージのダウンミックス信号と無相関信号とを、前回のチャネル分離ステージのダウミックス信号と無相関信号との関数として繰り返し導出する。
    ことを特徴とする装置。
JP2005148771A 2005-05-20 2005-05-20 マルチチャネル音声信号をバイノーラルキュー符号化する装置 Pending JP2006323314A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005148771A JP2006323314A (ja) 2005-05-20 2005-05-20 マルチチャネル音声信号をバイノーラルキュー符号化する装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005148771A JP2006323314A (ja) 2005-05-20 2005-05-20 マルチチャネル音声信号をバイノーラルキュー符号化する装置

Publications (1)

Publication Number Publication Date
JP2006323314A true JP2006323314A (ja) 2006-11-30

Family

ID=37543018

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005148771A Pending JP2006323314A (ja) 2005-05-20 2005-05-20 マルチチャネル音声信号をバイノーラルキュー符号化する装置

Country Status (1)

Country Link
JP (1) JP2006323314A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009050896A1 (ja) * 2007-10-16 2009-04-23 Panasonic Corporation ストリーム合成装置、復号装置、方法
CN101350197B (zh) * 2007-07-16 2011-05-11 华为技术有限公司 立体声音频编/解码方法及编/解码器
JP5340378B2 (ja) * 2009-02-26 2013-11-13 パナソニック株式会社 チャネル信号生成装置、音響信号符号化装置、音響信号復号装置、音響信号符号化方法及び音響信号復号方法
WO2020009082A1 (ja) * 2018-07-03 2020-01-09 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置及び符号化方法
JP2020034920A (ja) * 2015-03-09 2020-03-05 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャンネル信号を符号化又は復号化するための装置と方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101350197B (zh) * 2007-07-16 2011-05-11 华为技术有限公司 立体声音频编/解码方法及编/解码器
WO2009050896A1 (ja) * 2007-10-16 2009-04-23 Panasonic Corporation ストリーム合成装置、復号装置、方法
US8391513B2 (en) 2007-10-16 2013-03-05 Panasonic Corporation Stream synthesizing device, decoding unit and method
JP5340378B2 (ja) * 2009-02-26 2013-11-13 パナソニック株式会社 チャネル信号生成装置、音響信号符号化装置、音響信号復号装置、音響信号符号化方法及び音響信号復号方法
US9053701B2 (en) 2009-02-26 2015-06-09 Panasonic Intellectual Property Corporation Of America Channel signal generation device, acoustic signal encoding device, acoustic signal decoding device, acoustic signal encoding method, and acoustic signal decoding method
JP2020034920A (ja) * 2015-03-09 2020-03-05 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャンネル信号を符号化又は復号化するための装置と方法
CN112233684A (zh) * 2015-03-09 2021-01-15 弗劳恩霍夫应用研究促进协会 用于对多声道信号进行编码或解码的装置与方法
US11508384B2 (en) 2015-03-09 2022-11-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding a multi-channel signal
JP7208126B2 (ja) 2015-03-09 2023-01-18 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャンネル信号を符号化又は復号化するための装置と方法
CN112233684B (zh) * 2015-03-09 2024-03-19 弗劳恩霍夫应用研究促进协会 用于对多声道信号进行编码或解码的装置与方法
US11955131B2 (en) 2015-03-09 2024-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding a multi-channel signal
WO2020009082A1 (ja) * 2018-07-03 2020-01-09 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置及び符号化方法

Similar Documents

Publication Publication Date Title
US20200335115A1 (en) Audio encoding and decoding
JP4934427B2 (ja) 音声信号復号化装置及び音声信号符号化装置
RU2388068C2 (ru) Временное и пространственное генерирование многоканальных аудиосигналов
JP5934922B2 (ja) 復号装置
RU2409911C2 (ru) Декодирование бинауральных аудиосигналов
RU2376655C2 (ru) Зависящее от энергии квантование для эффективного кодирования пространственных параметров звука
JP4589962B2 (ja) レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
JP4918490B2 (ja) エネルギー整形装置及びエネルギー整形方法
RU2509442C2 (ru) Способ и устройство для применения реверберации к многоканальному звуковому сигналу с использованием параметров пространственных меток
NO344760B1 (no) Kompatibel flerkanal-koding/dekoding.
JPWO2006022190A1 (ja) オーディオエンコーダ
JP4988716B2 (ja) オーディオ信号のデコーディング方法及び装置
WO2007080225A1 (en) Decoding of binaural audio signals
JP2006323314A (ja) マルチチャネル音声信号をバイノーラルキュー符号化する装置
JP2006325162A (ja) バイノーラルキューを用いてマルチチャネル空間音声符号化を行うための装置
JP2007104601A (ja) マルチチャンネル符号化における頭部伝達関数をサポートするための装置
JP2009151183A (ja) マルチチャネル音声音響信号符号化装置および方法、並びにマルチチャネル音声音響信号復号装置および方法
WO2007080224A1 (en) Decoding of binaural audio signals