JP6479786B2

JP6479786B2 - オーディオ信号のパラメトリック再構成

Info

Publication number: JP6479786B2
Application number: JP2016524490A
Authority: JP
Inventors: ヴィレモーズ，ラルス; レヒトーネン，ヘイディ−マリア; プルンハーゲン，ヘイコ; ヒルヴォーネン，トニ
Original assignee: ドルビー・インターナショナル・アーベー
Priority date: 2013-10-21
Filing date: 2014-10-21
Publication date: 2019-03-06
Anticipated expiration: 2034-10-21
Also published as: US11450330B2; CN105917406A; US10614825B2; BR112016008817B1; KR20220044619A; RU2648947C2; US20160247514A1; EP3061089B1; CN111192592B; CN111179956B; CN105917406B; KR102486365B1; CN111192592A; KR102244379B1; EP3061089A1; KR20210046848A; CN111179956A; WO2015059153A1; US11769516B2; KR20230011480A

Description

関連出願への相互参照
本願は2013年10月21日に出願された米国仮特許出願第61/893,770号；2014年4月3日に出願された米国仮特許出願第61/974,544号；および2014年8月15日に出願された米国仮特許出願第62/037,693号の優先権を主張するものである。各出願の内容はここに参照によってその全体において組み込まれる。

発明の技術分野
本稿に開示される発明は概括的にはオーディオ信号のエンコードおよびデコードに、特にダウンミックス信号および関連するメタデータからのマルチチャネル・オーディオ信号のパラメトリック再構成に関する。

複数のラウドスピーカーを含むオーディオ再生システムは、マルチチャネル・オーディオ信号によって表わされるオーディオ・シーンを再現するためにしばしば使われる。ここで、マルチチャネル・オーディオ信号のそれぞれのチャネルはそれぞれのラウドスピーカーで再生される。マルチチャネル・オーディオ信号はたとえば、複数の音響トランスデューサを介して記録されたものであってもよく、あるいはオーディオ・オーサリング設備によって生成されたものであってもよい。多くの状況において、オーディオ信号を再生設備に伝送するための帯域幅制限および／またはオーディオ信号をコンピュータ・メモリもしくはポータブル記憶装置に記憶するための制限されたスペースがある。必要とされる帯域幅または記憶サイズを低減するよう、オーディオ信号のパラメトリック符号化のためのオーディオ符号化システムが存在する。エンコーダ側では、これらのシステムは典型的にはマルチチャネル・オーディオ信号をダウンミックスして、典型的にはモノ（一チャネル）またはステレオ（二チャネル）ダウンミックスであるダウンミックス信号にし、レベル差および相互相関のようなパラメータによってチャネルの属性を記述するサイド情報を抽出する。次いで、ダウンミックスおよびサイド情報はエンコードされて、デコーダ側に送られる。デコーダ側では、該ダウンミックスから、サイド情報のパラメータの制御のもとで、マルチチャネル・オーディオ信号が再構成される、すなわち近似される。

家庭におけるエンドユーザーをねらいとする台頭しつつあるセグメントを含めマルチチャネル・オーディオ・コンテンツの再生のために利用可能な装置およびシステムの異なる型の幅広い範囲に鑑み、帯域幅要求および／または記憶のための必要とされるメモリ・サイズを低減するおよび／またはデコーダ側での前記マルチチャネル・オーディオ信号の再構成を容易にするよう、マルチチャネル・オーディオ・コンテンツを効率的にエンコードするための新しい、代替的な方法が必要とされている。

下記では、例示的実施形態が、付属の図面を参照して、より詳細に記述される。
ある例示的実施形態に基づく、単一チャネル・ダウンミックス信号および付随するドライおよびウェット・アップミックス・パラメータに基づいてマルチチャネル・オーディオ信号を再構成するためのパラメトリック再構成部の一般化されたブロック図である。ある例示的実施形態に基づく、図１に描かれたパラメトリック再構成部を有するオーディオ・デコード・システムの一般化されたブロック図である。ある例示的実施形態に基づく、マルチチャネル・オーディオ信号を、単一チャネル・ダウンミックス信号および付随するメタデータとしてエンコードするためのパラメトリック・エンコード部の一般化されたブロック図である。ある例示的実施形態に基づく、図３に描かれたパラメトリック・エンコード部を有するオーディオ・エンコード・システムの一般化されたブロック図である。例示的実施形態に基づく、諸ダウンミックス・チャネルによって11.1チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。例示的実施形態に基づく、諸ダウンミックス・チャネルによって11.1チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。例示的実施形態に基づく、諸ダウンミックス・チャネルによって11.1チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。例示的実施形態に基づく、諸ダウンミックス・チャネルによって11.1チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。例示的実施形態に基づく、諸ダウンミックス・チャネルによって11.1チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。例示的実施形態に基づく、諸ダウンミックス・チャネルによって11.1チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。例示的実施形態に基づく、諸ダウンミックス・チャネルによって11.1チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。例示的実施形態に基づく、諸ダウンミックス・チャネルによって13.1チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。例示的実施形態に基づく、諸ダウンミックス・チャネルによって13.1チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。例示的実施形態に基づく、諸ダウンミックス・チャネルによって22.2チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。例示的実施形態に基づく、諸ダウンミックス・チャネルによって22.2チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。例示的実施形態に基づく、諸ダウンミックス・チャネルによって22.2チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。すべての図面は概略的であり、一般に、本開示を明快にするために必要な部分を示すのみである。一方、他の部分は省略されたり示唆されるだけであったりすることがある。

本稿での用法では、オーディオ信号は純粋なオーディオ信号、オーディオビジュアル信号またはマルチメディア信号のオーディオ部分またはメタデータと組み合わせたこれらの任意のものでありうる。

本稿での用法では、チャネルは、あらかじめ定義された／固定された空間位置／配向または「左」または「右」のような定義されない空間位置に関連付けられたオーディオ信号である。

〈Ｉ．概観〉
第一の側面によれば、例示的実施形態は、オーディオ信号を再構成するためのオーディオ・デコード・システムならびに方法およびコンピュータ・プログラム・プロダクトを提案する。該第一の側面に基づく提案されるデコード・システム、方法およびコンピュータ・プログラム・プロダクトは一般に同じ特徴および利点をもつことがある。

例示的実施形態によれば、Nチャネル・オーディオ信号を再構成するための方法が提供される。ここで、N≧3である。本方法は、単一チャネル・ダウンミックス信号またはマルチチャネル・ダウンミックス信号のあるチャネルであってより多くのオーディオ信号の再構成のためのデータを担持しているものを、関連付けられたドライおよびウェットのアップミックス・パラメータと一緒に受領する段階と；ドライ・アップミックス信号と称される、複数（N個）のチャネルをもつ第一の信号を、前記ダウンミックス信号の線形マッピングとして計算する段階であって、前記ドライ・アップミックス信号の計算の一部として、ドライ・アップミックス係数の集合が前記ダウンミックス信号に適用される、段階と；前記ダウンミックス信号に基づいて(N−1)チャネルの脱相関された信号を生成する段階と；ウェット・アップミックス信号と称される、複数（N個）のチャネルをもつさらなる信号を、前記脱相関された信号の線形マッピングとして計算する段階であって、前記ウェット・アップミックス信号の計算の一部として、ウェット・アップミックス係数の集合が前記脱相関された信号の諸チャネルに適用される、段階と；前記ドライ・アップミックス信号および前記ウェット・アップミックス信号を組み合わせて、再構成されるべき前記Nチャネル・オーディオ信号に対応する多次元の再構成された信号を得る段階とを含む、方法が提供される。本方法はさらに、受領されたドライ・アップミックス・パラメータに基づいてドライ・アップミックス係数の前記集合を決定する段階と；受領されたウェット・アップミックス・パラメータの数より多くの要素をもつ中間行列に値を入れる段階であって、前記受領されたウェット・アップミックス・パラメータおよび該中間行列があらかじめ定義された行列クラスに属することを知ることに基づく、段階と；前記中間行列にあらかじめ定義された行列を乗算することによってウェット・アップミックス係数の前記集合を得る段階とを含み、前記ウェット・アップミックス係数の前記集合は前記乗算から帰結する行列に対応し、前記中間行列の要素の数より多い係数を含む。

この例示的実施形態において、前記Nチャネル・オーディオ信号を再構成するために用いられるウェット・アップミックス係数の数は、受領されるウェット・アップミックス・パラメータの数より多い。前記受領されたウェット・アップミックス・パラメータから前記ウェット・アップミックス係数を取得するために前記あらかじめ定義された行列および前記あらかじめ定義された行列クラスの知識を活用することにより、前記Nチャネル・オーディオ信号の再構成を可能にするために必要とされる情報の量が低減されうる。これは、ダウンミックス信号と一緒にエンコーダ側から伝送されるメタデータの量の削減を許容する。パラメトリック再構成のために必要とされるデータの量を減らすことによって、前記Nチャネル・オーディオ信号のパラメトリック再構成の伝送のための必要とされる帯域幅および／またはそのような表現を記憶するための必要とされるメモリ・サイズが低減されうる。

前記(N−1)チャネルの脱相関された信号は、聴取者によって知覚される再構成されたNチャネル・オーディオ信号の内容の次元性を高めるはたらきをする。前記(N−1)チャネルの脱相関された信号の諸チャネルは、前記単一チャネル・ダウンミックス信号と、少なくとも近似的には同じスペクトルを有していてもよく、あるいは前記単一チャネル・ダウンミックス信号のスペクトルの再スケーリング／規格化されたバージョンに対応するスペクトルを有していてもよく、前記単一チャネル・ダウンミックス信号と一緒に、N個の少なくとも近似的には、互いに無相関なチャネルをなしてもよい。前記Nチャネル・オーディオ信号の忠実な再構成を提供するために、脱相関信号の各チャネルは、好ましくは、聴取者によって前記ダウンミックス信号と同様であると知覚されるような属性をもつ。よって、たとえば白色雑音から、所与のスペクトルをもつ相互に相関していない諸信号を合成することが可能であるが、前記脱相関信号のチャネルは、好ましくは、前記ダウンミックス信号を処理することによって導出される。これはたとえば、前記ダウンミックス信号にそれぞれの全通過フィルタを適用することまたは前記ダウンミックス信号の諸部分を再結合することを含む。それにより、音色のような前記ダウンミックス信号の相対的により微妙な、音響心理学的に条件付けられる属性を含む前記ダウンミックス信号のできるだけ多くの属性、特にローカルに静的な属性を保存するようにするのである。

ウェットおよびドライ・アップミックス信号を組み合わせることは、ウェット・アップミックス信号のそれぞれのチャネルからのオーディオ・コンテンツをドライ・アップミックス信号のそれぞれの対応するチャネルのオーディオ・コンテンツに加えること、たとえばサンプル毎または変換係数毎の加法的混合を含んでいてもよい。

前記あらかじめ定義された行列クラスは、クラス内のすべての行列について有効である、少なくともいくつかの行列要素の既知の属性に関連していてもよい。たとえば、行列要素のいくつかの間のある種の関係またはいくつかの行列要素が0であることなどである。これらの属性の知識は、中間行列における行列要素の総数よりも少数のウェット・アップミックス・パラメータに基づいて中間行列に値を入れることを許容する。デコーダ側は、少なくとも、前記より少数のウェット・アップミックス・パラメータに基づいてすべての行列要素を計算するために必要とする要素の属性および要素間の関係についての知識を有している。

ドライ・アップミックス信号が前記ダウンミックス信号の線形マッピングであるとは、ドライ・アップミックス信号が、ダウンミックス信号に第一の線形変換を適用することによって得られることを意味する。この第一の変換は、一つのチャネルを入力として取り、N個のチャネルを出力として提供する。前記ドライ・アップミックス係数は、この第一の線形変換の定量的属性を定義する係数である。

ウェット・アップミックス信号が前記脱相関信号の線形マッピングであるとは、ウェット・アップミックス信号が、脱相関信号に第二の線形変換を適用することによって得られることを意味する。この第二の変換は、N−1個のチャネルを入力として取り、N個のチャネルを出力として提供する。前記ウェット・アップミックス係数は、この第二の線形変換の定量的属性を定義する係数である。

ある例示的実施形態では、前記ウェット・アップミックス・パラメータを受領する段階は、N(N−1)/2個のウェット・アップミックス・パラメータを受領することを含んでいてもよい。本例示的実施形態では、中間行列に値を入れることは、受領されたN(N−1)/2個のウェット・アップミックス・パラメータおよび中間行列が前記あらかじめ定義された行列クラスに属するという知識に基づいて、(N−1)²個の行列要素についての値を得ることを含んでいてもよい。これは、前記ウェット・アップミックス・パラメータの値をそのまま行列要素として挿入することまたは前記ウェット・アップミックス・パラメータを、前記行列要素のための値を導出するために好適な仕方で処理することを含んでいてもよい。本例示的実施形態では、前記あらかじめ定義された行列はN(N−1)個の要素を含んでいてもよく、ウェット・アップミックス係数の前記集合はN(N−1)個の係数を含んでいてもよい。たとえば、前記ウェット・アップミックス・パラメータを受領することは、高々N(N−1)/2個の独立に割り当て可能なウェット・アップミックス・パラメータを受領することを含んでいてもよく、および／または受領されたウェット・アップミックス・パラメータの数が、前記Nチャネル・オーディオ信号を再構成するために用いられるウェット・アップミックス係数の数の高々半分であってもよい。

ウェット・アップミックス信号を脱相関信号のチャネルの線形マッピングとして形成するときの脱相関信号のあるチャネルからの寄与を省略することは、そのチャネルに値0をもつ係数を適用することに対応することは理解される。すなわち、あるチャネルからの寄与を省略することは、線形マッピングの一部として適用される係数の数に影響しない。

ある例示的実施形態では、中間行列に値を入れることは、受領されたウェット・アップミックス・パラメータを中間行列における要素として用いることを含んでいてもよい。受領されたアップミックス・パラメータがそれ以上処理されることなく中間行列における要素として用いられるので、中間行列に値を入れるためおよびアップミックス係数を得るために必要とされる計算の複雑さが低減されうる。これは、前記Nチャネル・オーディオ信号のより計算効率のよい再構成を許容する。

ある例示的実施形態では、前記ドライ・アップミックス・パラメータを受領する段階は、(N−1)個のドライ・アップミックス・パラメータを受領することを含んでいてもよい。本例示的実施形態では、ドライ・アップミックス係数の前記集合はN個の係数を含んでいてもよく、ドライ・アップミックス係数の前記集合は、受領された(N−1)個のドライ・アップミックス・パラメータに基づき、かつドライ・アップミックス係数の前記集合内の係数間のあらかじめ定義された関係に基づいて決定される。たとえば、前記ドライ・アップミックス・パラメータを受領することは、高々(N−1)個の独立に割り当て可能なドライ・アップミックス・パラメータを受領することを含んでいてもよい。たとえば、ダウンミックス信号は、あらかじめ定義された規則に従って、再構成されるべきNチャネル・オーディオ信号の線形マッピングとして取得可能であってもよく、ドライ・アップミックス係数の間の前記あらかじめ定義された関係は前記あらかじめ定義された規則に基づいていてもよい。

ある例示的実施形態では、前記あらかじめ定義された行列クラスは：下三角行列または上三角行列（ここで、クラス内のすべての行列の既知の属性は、あらかじめ定義された行列要素が0であることを含む）；対称行列（ここで、クラス内のすべての行列の既知の属性は、（主対角線のそれぞれの側の）あらかじめ定義された行列要素が等しいことを含む）；直交行列と対角行列の積（ここで、クラス内のすべての行列の既知の属性は、あらかじめ定義された行列要素の間の既知の関係を含む）のうちの一つであってもよい。換言すれば、前記あらかじめ定義された行列クラスは、下三角行列のクラス、上三角行列のクラス、対称行列のクラスまたは直交行列と対角行列の積のクラスであってもよい。上記の各クラスの共通の属性は、その次元性が行列要素の総数より低いということである。

ある例示的実施形態では、ダウンミックス信号は、あらかじめ定義された規則に従って、再構成されるべきNチャネル・オーディオ信号の線形マッピングとして取得可能であってもよい。本例示的実施形態では、前記あらかじめ定義された規則は、あらかじめ定義されたダウンミックス動作を定義してもよく、前記あらかじめ定義された行列は、前記あらかじめ定義されたダウンミックス動作のカーネル空間を張るベクトルに基づいていてもよいたとえば、前記あらかじめ定義された行列の行または列は、前記あらかじめ定義されたダウンミックス動作のカーネル空間についての基底、たとえば正規直交基底をなすベクトルであってもよい。

ある例示的実施形態では、前記単一チャネル・ダウンミックス信号を関連付けられたドライおよびウェット・アップミックス・パラメータと一緒に受領することは、前記ダウンミックス信号の時間セグメントまたは時間／周波数タイルを、その時間セグメントまたは時間／周波数タイルと関連付けられたドライおよびウェット・アップミックス・パラメータと一緒に受領することを含んでいてもよい。本例示的実施形態では、前記多次元の再構成された信号は、再構成されるべきNチャネル・オーディオ信号の時間セグメントまたは時間／周波数タイルに対応してもよい。換言すれば、前記Nチャネル・オーディオ信号の再構成は、少なくともいくつかの実施形態では、一時に一つの時間セグメントまたは時間／周波数タイルずつ実行されてもよい。オーディオ・エンコード／デコード・システムは典型的には、たとえば入力オーディオ信号に好適なフィルタバンクを適用することによって、時間‐周波数空間を時間／周波数タイルに分割する。時間／周波数タイルとは、一般に、ある時間区間／セグメントおよびある周波数サブバンドに対応する、時間‐周波数空間の一部を意味する。

例示的実施形態によれば、第一の単一チャネル・ダウンミックス信号および関連付けられたドライおよびウェットのアップミックス・パラメータに基づいてNチャネル・オーディオ信号を再構成するよう構成された第一のパラメトリック再構成部を有するオーディオ・デコード・システムが提供される。ここで、N≧3である。第一のパラメトリック再構成部は、第一のダウンミックス信号を受領して、それに基づいて第一のN−1チャネル脱相関信号を出力するよう構成された第一の脱相関部を有する。第一のパラメトリック再構成部はまた、ドライ・アップミックス・パラメータおよび前記ダウンミックス信号を受領し；前記ドライ・アップミックス・パラメータに基づいてドライ・アップミックス係数の第一の集合を決定し；前記第一のダウンミックス信号をドライ・アップミックス係数の前記第一の集合に基づいて線形にマッピングすることによって計算される第一のドライ・アップミックス信号を出力するよう構成された第一のドライ・アップミックス部をも有する。換言すれば、前記第一のドライ・アップミックス信号のチャネルは、前記単一チャネル・ダウンミックス信号にそれぞれの係数を乗算することによって得られ、該係数は、前記ドライ・アップミックス係数自身であってもよいし、あるいは前記ドライ・アップミックス係数を介して制御可能な係数であってもよい。前記第一のパラメトリック再構成部はさらに、ウェット・アップミックス・パラメータおよび前記第一の脱相関信号を受領する段階と；受領されたウェット・アップミックス・パラメータの数より多くの要素をもつ第一の中間行列に値を入れる段階であって、受領されたウェット・アップミックス・パラメータおよび前記第一の中間行列が第一のあらかじめ定義された行列クラスに属していると知っていることに基づく、すなわち前記あらかじめ定義された行列クラスにおけるすべての行列について成り立つとわかっているある種の行列要素の属性を用いることによる、段階と；前記第一の中間行列に第一のあらかじめ定義された行列を乗算することによってウェット・アップミックス係数の第一の集合を得る段階であって、前記ウェット・アップミックス係数の前記集合は前記乗算から帰結する行列に対応し、前記第一の中間行列の要素の数より多い係数を含む、段階と；前記第一の脱相関信号をウェット・アップミックス係数の前記第一の集合に従って線形にマッピングすることによって、すなわち前記ウェット・アップミックス係数を用いて前記脱相関信号のチャネルの線形結合を形成することによって計算された第一のウェット・アップミックス信号を出力する段階とを実行するよう構成されている第一のウェット・アップミックス部を有している。第一のパラメトリック再構成部はまた、前記第一のドライ・アップミックス信号および前記第一のウェット・アップミックス信号を受領し、これらの信号を組み合わせて、再構成されるべき前記N次元オーディオ信号に対応する第一の多次元の再構成された信号を得るよう構成された第一の組み合わせ部をも有する。

ある例示的実施形態では、オーディオ・デコード・システムは、前記第一のパラメトリック再構成部とは独立に動作可能であり、第二の単一チャネル・ダウンミックス信号および関連付けられたドライおよびウェットのアップミックス・パラメータに基づいてN₂チャネル・オーディオ信号を再構成するよう構成された第二のパラメトリック再構成部を有していてもよい。ここで、N₂≧2である。たとえば、N₂＝2またはN₂≧3が成り立ってもよい。本例示的実施形態では、第二のパラメトリック再構成部は、第二の脱相関部、第二のドライ・アップミックス部、第二のウェット・アップミックス部および第二の組み合わせ部を有していてもよく、第二のパラメトリック再構成部のこれらの部は、第一のパラメトリック再構成部の対応する各部と類似の構成であってもよい。本例示的実施形態では、第二のウェット・アップミックス部は、第二のあらかじめ定義された行列クラスに属する第二の中間行列および第二のあらかじめ定義された行列を用いるよう構成されていてもよい。第二のあらかじめ定義された行列クラスおよび第二のあらかじめ定義された行列は、第一のあらかじめ定義された行列クラスおよび第一のあらかじめ定義された行列と異なっていても、あるいは等しくてもよい。

ある例示的実施形態では、オーディオ・デコード・システムは、複数のダウンミックス・チャネルおよび関連付けられたドライおよびウェット・アップミックス・パラメータに基づいてマルチチャネル・オーディオ信号を再構成するよう適応されていてもよい。本例示的実施形態では、オーディオ・デコード・システムは：それぞれのダウンミックス・チャネルおよびそれぞれの関連付けられたドライおよびウェットのアップミックス・パラメータに基づいてオーディオ信号チャネルのそれぞれの集合を独立して再構成するよう動作可能なパラメトリック再構成部を含む複数の再構成部と；前記マルチチャネル・オーディオ信号のチャネルの、それぞれのダウンミックス・チャネルおよび少なくとも該ダウンミックス・チャネルのいくつかについてはそれぞれの関連付けられたドライおよびウェット・アップミックス・パラメータによって表わされるチャネルの諸集合への分割に対応する、前記マルチチャネル・オーディオ信号の符号化フォーマットを示す信号伝達を受領するよう構成された制御部とを有していてもよい。本例示的実施形態では、符号化フォーマットはさらに、それぞれのウェット・アップミックス・パラメータに基づいてチャネルの前記それぞれの集合のうち少なくともいくつかの集合に関連付けられたウェット・アップミックス係数を得るためのあらかじめ定義された行列の集合にさらに対応してもよい。任意的に、前記符号化フォーマットはさらに、それぞれの中間行列がウェット・アップミックス・パラメータの前記それぞれの集合に基づいてどのように値を入れられるべきかを示すあらかじめ定義された行列クラスの集合に対応していてもよい。

本例示的実施形態では、前記デコード・システムは、前記受領された信号伝達が第一の符号化フォーマットを示すことに応答して、前記複数の再構成部の第一の部分集合を使って前記マルチチャネル・オーディオ信号を再構成するよう構成されていてもよい。本例示的実施形態では、前記デコード・システムは、前記受領された信号伝達が第二の符号化フォーマットを示すことに応答して、前記複数の再構成部の第二の部分集合を使って前記マルチチャネル・オーディオ信号を再構成するよう構成されていてもよい。前記再構成部の前記第一および第二の部分集合の少なくとも一方は、前記第一のパラメトリック再構成部を含んでいてもよい。

前記マルチチャネル・オーディオ信号のオーディオ・コンテンツの組成、エンコーダ側からデコーダ側への伝送のための利用可能な帯域幅、聴取者によって知覚される要求される再生品質および／またはデコーダ側で再構成されたオーディオ信号の要求される忠実度に依存して、最も適切な符号化フォーマットは、異なる応用および／または時間期間の間で異なることがありうる。前記マルチチャネル・オーディオ信号について複数の符号化フォーマットをサポートすることによって、本例示的実施形態におけるオーディオ・デコード・システムは、エンコーダ側が、現在の状況により特定的に好適である符号化フォーマットを用いることを許容する。

ある例示的実施形態では、前記複数の再構成部は、高々単一のオーディオ・チャネルがエンコードされたダウンミックス・チャネルに基づいて単一のオーディオ・チャネルを独立して再構成するよう動作可能な単一チャネル再構成部を含んでいてもよい。本例示的実施形態では、再構成部の前記第一および第二の部分集合の少なくとも一方は、前記単一チャネル再構成部を有していてもよい。前記マルチチャネル・オーディオ信号のいくつかのチャネルは、聴取者によって知覚される前記マルチチャネル・オーディオ信号の全体的な印象にとって特に重要でありうる。前記単一チャネル再構成部を用いて、他がチャネルは他の諸ダウンミックス・チャネルにおいて一緒にパラメトリックにエンコードされる一方、たとえばそのようなチャネルをその独自のダウンミックスにおいて別個にエンコードすることによって、再構成されるマルチチャネル・オーディオ信号の忠実度が高められてもよい。いくつかの例示的実施形態では、前記マルチチャネル・オーディオ信号の一つのチャネルのオーディオ・コンテンツは、前記マルチチャネル・オーディオ信号の他のチャネルのオーディオ・コンテンツとは異なる型であってもよく、再構成されるマルチチャネル・オーディオ信号の忠実度は、そのチャネルがそれ自身のダウンミックス・チャネルにおいて別個にエンコードされる符号化フォーマットを用いることによって、向上されうる。

ある例示的実施形態では、前記第一の符号化フォーマットは、前記第二の符号化フォーマットより、少数のダウンミックス・チャネルからの前記マルチチャネル・オーディオ信号の再構成に対応してもよい。より少数のダウンミックス・チャネルを用いることによって、エンコーダ側からデコーダ側への伝送のための要求される帯域幅が低減されうる。より多数のダウンミックス・チャネルを用いることによって、再構成されるマルチチャネル・オーディオ信号の忠実度および／または知覚されたオーディオ品質は増大されてもよい。

第二の側面によれば、例示的実施形態は、マルチチャネル・オーディオ信号をエンコードするためのオーディオ・エンコード・システムならびに方法およびコンピュータ・プログラム・プロダクトを提案する。該第二の側面に基づく提案されるエンコード・システム、方法およびコンピュータ・プログラム・プロダクトは一般に同じ特徴および利点を共有することがある。さらに、第一の側面に基づくデコード・システム、方法およびコンピュータ・プログラム・プロダクトの特徴について上記で呈示した利点は、一般に、第二の側面に基づくエンコード・システム、方法およびコンピュータ・プログラム・プロダクトの対応する特徴についても有効でありうる。

例示的実施形態によれば、Nチャネル・オーディオ信号を単一チャネル・ダウンミックス信号およびメタデータとしてエンコードする方法が提供される。前記メタデータは、該ダウンミックス信号および該ダウンミックス信号に基づいて決定される(N−1)チャネルの脱相関された信号からのオーディオ信号のパラメトリック再構成のために好適なものである。ここで、N≧3である。本方法は、前記オーディオ信号を受領する段階と；あらかじめ定義された規則に従って、前記単一チャネル・ダウンミックス信号を前記オーディオ信号の線形マッピングとして計算する段階と；前記オーディオ信号を近似する前記ダウンミックス信号の線形マッピングを定義するためのドライ・アップミックス係数の集合を、たとえば前記ダウンミックス信号のみが再構成のために利用可能であるという想定の下に最小平均平方誤差近似を介して決定する段階とを含む。本方法はさらに、受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似されるオーディオ信号の共分散との間の差に基づいて中間行列を決定する段階を含む。ここで、前記中間行列は、あらかじめ定義された行列を乗算したとき、前記オーディオ信号のパラメトリック再構成の一部として前記脱相関信号の線形マッピングを定義するウェット・アップミックス係数の集合に対応する。ウェット・アップミックス係数の前記集合は、前記中間行列の要素の数より多くの係数を含む。本方法はさらに、ドライ・アップミックス係数の前記集合が導出可能であるもとになるドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に前記ダウンミックス信号を出力する段階を含む。ここで、前記中間行列は出力ウェット・アップミックス・パラメータの数より多くの要素をもつ。前記中間行列は、該中間行列があらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義される。

デコーダ側での前記オーディオ信号のパラメトリック再構成コピーは、一つの寄与として、前記ダウンミックス信号の前記線形マッピングによって形成されるドライ・アップミックス信号と、さらなる寄与として、前記脱相関信号の前記線形マッピングによって形成されたウェット・アップミックス信号とを含む。ドライ・アップミックス係数の前記集合は前記ダウンミックス信号の前記線形マッピングを定義し、ウェット・アップミックス係数の前記集合は前記脱相関信号の前記線形マッピングを定義する。前記あらかじめ定義された行列および前記あらかじめ定義された行列クラスに基づいてウェット・アップミックス係数が導出可能であるもとになる、ウェット・アップミックス係数の数より少数のウェット・アップミックス・パラメータを出力することによって、Nチャネル・オーディオ信号の再構成を可能にするためにデコーダ側に送られる情報の量が低減されうる。パラメトリック再構成のために必要とされるデータの量を低減することによって、Nチャネル・オーディオ信号のパラメトリック表現の伝送のための要求される帯域幅および／またはそのような表現を記憶するための要求されるメモリ・サイズが低減されうる。

中間行列は、受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似されるオーディオ信号の共分散との間の差に基づいて、たとえば、前記ダウンミックス信号の前記線形マッピングによって近似されるオーディオ信号の共分散を補足するための前記脱相関信号の前記線形マッピングによって得られる前記信号の共分散について、決定されてもよい。

ある例示的実施形態では、前記中間行列を決定する段階は、ウェット・アップミックス係数の前記集合によって定義される、前記脱相関信号の前記線形マッピングによって得られる前記信号の共分散が、受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似されるオーディオ信号の共分散との間の差を近似するまたは該差と実質的に一致するよう、前記中間行列を決定することを含んでいてもよい。換言すれば、前記中間行列は、前記ダウンミックス信号の前記線形マッピングによって形成されるドライ・アップミックス信号および前記脱相関信号の前記線形マッピングによって形成されるウェット・アップミックス信号の和として得られるオーディオ信号の再構成コピーが、完全にまたは少なくとも近似的に、受領された前記オーディオ信号の共分散を再現するよう、決定されてもよい。

ある例示的実施形態では、前記ウェット・アップミックス・パラメータを出力する段階は、高々N(N−1)/2個の独立して割り当て可能なウェット・アップミックス・パラメータを出力することを含んでいてもよい。本例示的実施形態では、中間行列は(N−1)²個の行列要素を有していてもよく、前記中間行列が前記あらかじめ定義された行列クラスに属することが与えられれば、前記出力ウェット・アップミックス・パラメータによって一意的に定義されてもよい。本例示的実施形態では、ウェット・アップミックス係数の前記集合はN(N−1)個の係数を含んでいてもよい。

ある例示的実施形態では、ドライ・アップミックス係数の前記集合はN個の係数を含んでいてもよい。本例示的実施形態では、ドライ・アップミックス・パラメータを出力することは、高々(N−1)個のドライ・アップミックス・パラメータを出力することを含んでいてもよく、ドライ・アップミックス係数の前記集合は、(N−1)個のドライ・アップミックス・パラメータから、前記あらかじめ定義された規則を使って導出可能であってもよい。

ある例示的実施形態では、ドライ・アップミックス係数の決定された集合は、前記オーディオ信号の最小平均平方誤差近似に対応する前記ダウンミックス信号の線形マッピングを定義してもよい。すなわち、前記ダウンミックス信号の線形マッピングの集合の間で、ドライ・アップミックス係数の決定された集合は、最小平均平方の意味で前記オーディオ信号を最もよく近似する線形マッピングを定義しうる。

例示的実施形態によれば、Nチャネル・オーディオ信号を単一チャネル・ダウンミックス信号およびメタデータとしてエンコードするよう構成されたパラメトリック・エンコード部を有するオーディオ・エンコード・システムが提供される。前記メタデータは、該ダウンミックス信号および該ダウンミックス信号に基づいて決定される(N−1)チャネルの脱相関された信号からのオーディオ信号のパラメトリック再構成のために好適なものである。ここで、N≧3である。パラメトリック・エンコード部は：前記オーディオ信号を受領し、あらかじめ定義された規則に従って、前記単一チャネル・ダウンミックス信号を前記オーディオ信号の線形マッピングとして計算するよう構成されたダウンミックス部と；前記オーディオ信号を近似する前記ダウンミックス信号の線形マッピングを定義するためのドライ・アップミックス係数の集合を決定するよう構成された第一の解析部とを有する。パラメトリック・エンコード部はさらに、受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似されるオーディオ信号の共分散との間の差に基づいて中間行列を決定するよう構成されている第二の解析部を有する。ここで、前記中間行列は、あらかじめ定義された行列を乗算したとき、前記オーディオ信号のパラメトリック再構成の一部として前記脱相関信号の線形マッピングを定義するウェット・アップミックス係数の集合に対応する。ウェット・アップミックス係数の前記集合は、前記中間行列の要素の数より多くの係数を含む。パラメトリック・エンコード部はさらに、ドライ・アップミックス係数の前記集合が導出可能であるもとになるドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に前記ダウンミックス信号を出力するよう構成される。ここで、前記中間行列は出力ウェット・アップミックス・パラメータの数より多くの要素をもつ。前記中間行列は、該中間行列があらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義される。

ある例示的実施形態では、本オーディオ・エンコード・システムは、複数のダウンミックス・チャネルおよび付随するドライおよびウェット・アップミックス・パラメータの形でマルチチャネル・オーディオ信号の表現を提供するよう構成されてもよい。本例示的実施形態では、オーディオ・エンコード・システムは：それぞれのダウンミックス・チャネルおよびそれぞれの付随したアップミックス・パラメータを、オーディオ信号チャネルのそれぞれの集合に基づいて独立して計算するよう動作可能なパラメトリック・エンコード部を含む複数のエンコード部を有していてもよい。本例示的実施形態では、本オーディオ・エンコード・システムはさらに、前記マルチチャネル・オーディオ信号のチャネルの、それぞれのダウンミックス・チャネルおよび少なくとも該ダウンミックス・チャネルの少なくともいくつかについてはそれぞれの関連付けられたドライおよびウェット・アップミックス・パラメータによって表わされるチャネルの諸集合への分割に対応する、前記マルチチャネル・オーディオ信号の符号化フォーマットを決定するよう構成された制御部を有していてもよい。本例示的実施形態では、符号化フォーマットはさらに、それぞれのダウンミックス・チャネルのうちの少なくともいくつかを計算するためのあらかじめ定義された規則の集合に対応してもよい。本例示的実施形態では、本オーディオ・エンコード・システムは、決定された符号化フォーマットが第一の符号化フォーマットであることに応答して、前記複数のエンコード部の第一の部分集合を使って前記マルチチャネル・オーディオ信号をエンコードするよう構成されていてもよい。本例示的実施形態では、本オーディオ・エンコード・システムは、決定された符号化フォーマットが第二の符号化フォーマットであることに応答して、前記複数のエンコード部の第二の部分集合を使って前記マルチチャネル・オーディオ信号をエンコードするよう構成されていてもよい。前記エンコード部の前記第一および第二の部分集合の少なくとも一方は、前記第一のパラメトリック・エンコード部を含んでいてもよい。本例示的実施形態では、制御部は、たとえば、符号化フォーマットを、前記マルチチャネル・オーディオ信号のエンコードされたバージョンをデコーダ側に送信するための利用可能な帯域幅に基づいて、前記マルチチャネル・オーディオ信号のチャネルのオーディオ・コンテンツに基づいておよび／または所望される符号化フォーマットを示す入力信号に基づいて、符号化フォーマットを決定してもよい。

ある例示的実施形態では、前記複数のエンコード部は、高々単一のオーディオ・チャネルをダウンミックス・チャネルにおいて独立してエンコードするよう動作可能な単一チャネル・エンコード部を含んでいてもよい。前記エンコード部の前記第一および第二の部分集合の少なくとも一方は、前記単一チャネル・エンコード部を含んでいてもよい。

例示的実施形態によれば、第一および第二の側面内の諸方法のいずれかを実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクトが提供される。

例示的実施形態によれば、第一および第二の側面の方法、エンコード・システム、デコード・システムおよびコンピュータ・プログラム・プロダクトの任意のものにおいて、N＝3またはN＝4が成り立ってもよい。

さらなる例示的実施形態が従属請求項において定義される。例示的実施形態は、たとえ互いに異なる請求項に記載されるものであっても特徴のすべての組み合わせを含むことが注意される。

〈ＩＩ．例示的実施形態〉
図３および図４を参照して記述されるエンコーダ側では、Nチャネル・オーディオ信号X＝[x₁…x_N]^Tの線形マッピングとして、

に従って単一チャネル・ダウンミックス信号Yが計算される。ここで、d_n、n＝1,…,Nはダウンミックス行列Dによって表わされるダウンミックス係数である。図１および図２を参照して記述されるデコーダ側では、前記Nチャネル・オーディオ信号Xのパラメトリック再構成が

に従って実行される。ここで、c_n、n＝1,…,Nは行列ドライ・アップミックス行列Cによって表わされるドライ・アップミックス係数であり、p_n,k、n＝1,…,N、k＝1,…,N−1はウェット・アップミックス行列Pによって表わされるウェット・アップミックス係数であり、z_k、k＝1,…,N−1は、ダウンミックス信号Yに基づいて生成された(N−1)チャネル脱相関信号Zのチャネルである。各オーディオ信号のチャネルが行として表わされるとすると、もとのオーディオ信号Xの共分散行列はR＝XX^Tとして表わされてもよく、再構成されたオーディオ信号〔＾付きのX〕の共分散行列は

として表わされてもよい。オーディオ信号が複素数値の変換係数を有する行として表わされる場合には、X*は行列Xの複素共役転置であるとして、XX*の実部がたとえばXX^Tの代わりに考えられてもよいことを注意しておく。

もとのオーディオ信号Xの忠実な再構成を提供するために、式(2)によって与えられる再構成が完全な共分散を再現することが有利でありうる。すなわち、

となるようなドライおよびウェット・アップミックス行列CおよびPを用いることが有利でありうる。

一つのアプローチは、通常の式
CYY^T＝XY^T (4)
を解くことによって、まず最小二乗の意味で可能な最良の「ドライ」アップミックス

を与えるドライ・アップミックス行列Cを見出すことである。式(4)の解となる行列Cによる

については、

が成り立つ。脱相関信号Zのチャネルが互いに無相関であり、みな単一チャネル・ダウンミックス信号Yのエネルギーに等しい同じエネルギー‖Y‖²をもつとすると、正定値の欠損共分散ΔRは
ΔR＝PP^T‖Y‖² (6)
と因子分解できる。

式(4)の解となるドライ・アップミックス行列Cおよび式(6)の解となるウェット・アップミックス行列Pを用いることによって、式(3)に従って完全な共分散が再現されうる。式(1)および(4)はDCYY^T＝YY^Tであることを含意し、それにより非縮退ダウンミックス行列Dについては

となる。式(5)および(7)は、D(X₀−X)＝DCY−Y＝0および

を含意する。よって、欠損共分散ΔRは階数N−1をもち、実際、N−1個の互いに無相関なチャネルをもつ脱相関信号Zを用いることによって提供されうる。式(6)および(8)はDP＝0であることを含意し、よって、式(6)を解くウェット・アップミックス行列Pの列がダウンミックス行列Dのカーネル空間を張るベクトルから構築できる。したがって、好適なウェット・アップミックス行列Pを見出すための計算は、より低次元の空間に移されてもよい。

Vはダウンミックス行列Dのカーネル空間、すなわちDv＝0となるベクトルvの線形空間についての正規直交基底を含むサイズN(N−1)の行列であるとする。N＝2、N＝3、N＝4についてのそのようなあらかじめ定義された行列Vの例はそれぞれ

Vによって与えられる基底において、欠損共分散はR_v＝V^T(ΔR)Vと表わすことができる。したがって、式(6)を解くウェット・アップミックス行列Pを見出すために、まず、R_v＝HH^Tを解くことによって行列Hを見出し、次いでPをP＝VH/‖Y‖として得てもよい。ここで、‖Y‖は単一チャネル・ダウンミックス信号Yのエネルギーの平方根である。他の好適なアップミックス行列PはP＝VHO/‖Y‖として得てもよい。ここで、Oは直交行列である。あるいはまた、欠損共分散R_vを単一チャネル・ダウンミックス信号Yのエネルギー‖Y‖²によって再スケーリングし、代わりに、H＝H_R‖Y‖であるとして式

を解いて、Pを

として得てもよい。

H_Rの要素が量子化され、所望される出力が無音チャネルをもつときは、上記のあらかじめ定義された行列Vの属性は便利でないことがある。例として、N＝3について、(9)の二番目の行列についてのよりよい選択は次のようなものであろう。

幸い、行列Vの列がペア毎に直交であるという要求は、これらの列が線形独立である限り、落とすことができる。すると、ΔR＝VR_vV^Tへの所望される解R_vは、R_v＝W^T(ΔR)Wによって得られ、ここで

はVの擬似逆行列である。

行列R_vはサイズ(N−1)²の準正定値行列であり、式(10)への解を見出すにはいくつかのアプローチがあり、それぞれ次元N(N−1)/2の行列クラス内の解につながる。次元N(N−1)/2とはすなわち、行列がN(N−1)/2個の行列要素によって一意的に定義されるということである。解はたとえば、
ａ．コレスキー分解（下三角行列H_Rにつながる）；
ｂ．正の平方根（対称的な準正定値のH_Rにつながる）；または
ｃ．ポーラー（polar）（Oは直交行列、Λは対角行列であるとして、H_R＝OΛの形のH_Nにつながる）
を用いることによって得られてもよい。

さらに、Λは対角行列、H₀はすべての対角要素が1に等しいとして、オプションａ）およびｂ）の、H_RがH_R＝ΛH₀として表わされうる規格化バージョンがある。上記の代替ａ，ｂ，ｃは、異なる行列クラス、すなわち下三角行列、対称行列および対角行列と直交行列の積における解H_Rを与える。H_Rが属する行列クラスがデコーダ側において知られている場合には、すなわち、H_Rがあらかじめ定義された行列クラスに属することがわかっている場合には、たとえば上記の代替ａ、ｂ、ｃの任意のものに従って、H_Rはその要素のN(N−1)/2個のみに基づいて値を入れられてもよい。行列Vもデコーダ側で知られている場合には、たとえば、Vが(9)で与えられる行列のうちの一つであることがわかっている場合には、式(2)に基づく再構成のために必要とされるウェット・アップミックス行列Pは、式(11)を介して得られてもよい。

図３は、ある例示的実施形態に基づく、パラメトリック・エンコード部３００の一般化されたブロック図である。パラメトリック・エンコード部３００は、Nチャネル・オーディオ信号Xを単一チャネル・ダウンミックス信号Yおよびメタデータとしてエンコードするよう構成されている。前記メタデータは、式(2)に基づくオーディオ信号Xのパラメトリック再構成のために好適なものである。パラメトリック・エンコード部３００は、前記オーディオ信号Xを受領し、あらかじめ定義された規則に従って、前記単一チャネル・ダウンミックス信号Yを前記オーディオ信号Xの線形マッピングとして計算するよう構成されたダウンミックス部３０１を有する。本例示的実施形態では、ダウンミックス部３０１は、ダウンミックス信号Yを式(1)に従って計算する。ここで、ダウンミックス行列Dはあらかじめ定義されており、前記あらかじめ定義された規則に対応する。第一の解析部３０２は、前記オーディオ信号Xを近似する前記ダウンミックス信号Yの線形マッピングを定義するためのドライ・アップミックス行列Cによって表わされるドライ・アップミックス係数の集合を決定する。ダウンミックス信号Yのこの線形マッピングは式(2)ではCYによって表わされている。本例示的実施形態では、N個のドライ・アップミックス係数Cは式(4)に従って、ダウンミックス信号Yの線形マッピングCYがオーディオ信号Xの最小平均平方近似に対応するよう決定される。第二の解析部３０３は、受領された前記オーディオ信号Xの共分散行列と前記ダウンミックス信号Yの前記線形マッピングによって近似されるオーディオ信号CYの共分散行列との間の差に基づいて中間行列H_Rを決定する。本例示的実施形態では、これらの共分散行列は、それぞれ第一および第二の処理部３０４、３０５によって計算され、次いで第二の解析部３０３に与えられる。本例示的実施形態において、前記中間行列H_Rは、式(10)を解くための上記のアプローチｂに従って決定され、対称的な中間行列H_Rにつながる。式(1)および(11)において示されるように、中間行列H_Rは、あらかじめ定義された行列Vを乗算したとき、ウェット・アップミックス・パラメータPの集合を介して、デコーダ側における前記オーディオ信号Xのパラメトリック再構成の一部として脱相関信号Zの線形マッピングPZを定義する。本例示的実施形態では、中間行列VはN＝3の場合については(9)における二番目の行列であり、N＝4の場合については(9)における三番目の行列である。パラメトリック・エンコード部３００はダウンミックス信号Yをドライ・アップミックス・パラメータ

およびウェット・アップミックス・パラメータ

と一緒に出力する。本例示的実施形態では、N個のドライ・アップミックス係数CのうちのN−1個が前記ドライ・アップミックス・パラメータ〔チルダ付きのC〕であり、残りの一つのドライ・アップミックス係数は、前記あらかじめ定義されたダウンミックス行列Dが既知であれば、ドライ・アップミックス・パラメータから式(7)を介して導出可能である。中間行列H_Rが対称行列のクラスに属するので、その(N−1)²個の要素のうちのN(N−1)/2個によって一意的に定義される。本例示的実施形態において、中間行列H_Rの要素のN(N−1)/2個はウェット・アップミックス・パラメータ〔チルダ付きのP〕であり、それから、対称行列であることを知っているので、中間行列H_Rの残りが導出可能である。

図４は、ある例示的実施形態に基づく、図３を参照して述べたパラメトリック・エンコード部３００を有するオーディオ・エンコード・システム４００の一般化されたブロック図である。本例示的実施形態では、たとえば一つまたは複数の音響トランスデューサ４０１によって記録されたまたはオーディオ・オーサリング設備４０１によって生成されたオーディオ・コンテンツが前記Nチャネル・オーディオ信号Xの形で提供される。直交ミラー・フィルタ（QMF）解析部４０２は、時間／周波数タイルの形でのオーディオ信号Xのパラメトリック・エンコード部３００による処理のために、オーディオ信号Xを時間セグメントごとにQMF領域に変換する。パラメトリック・エンコード部３００によって出力されるダウンミックス信号Yは、QMF合成部４０３によってQMF領域から変換し戻され、変換部４０４によって修正離散コサイン変換（MDCT）領域に変換される。量子化部４０５および４０６は、それぞれドライ・アップミックス・パラメータ〔チルダ付きのC〕およびウェット・アップミックス・パラメータ〔チルダ付きのP〕を量子化する。たとえば、きざみサイズ0.1または0.2（無次元）をもつ一様量子化が用いられてもよく、それに、ハフマン符号化の形のエントロピー符号化が続いてもよい。きざみサイズ0.2をもつ、より粗い量子化は、たとえば、伝送帯域幅を節約するために用いられてもよく、きざみサイズ0.1をもつ、より細かい量子化は、デコーダ側での再構成の忠実度を改善するために用いられてもよい。次いで、MDCT変換されたダウンミックス信号Yおよび量子化されたドライ・アップミックス・パラメータ〔チルダ付きのC〕およびウェット・アップミックス・パラメータ〔チルダ付きのP〕は、デコーダ側への伝送のために、マルチプレクサ４０７によってビットストリームBに組み合わされる。オーディオ・エンコード・システム４００は、ダウンミックス信号Yがマルチプレクサ４０７に与えられる前に、ドルビー・デジタルまたはMPEG AACのような知覚的オーディオ・コーデックを使ってダウンミックス信号Yをエンコードするよう構成されたコア・エンコーダ（図４には示さず）をも有していてもよい。

図１は、単一チャネル・ダウンミックス信号Yおよび付随するドライ・アップミックス・パラメータ〔チルダ付きのC〕およびウェット・アップミックス・パラメータ〔チルダ付きのP〕に基づいてNチャネル・オーディオ信号Xを再構成するよう構成された、ある例示的実施形態に基づくパラメトリック再構成部１００の一般化されたブロック図である。パラメトリック再構成部１００は、式(2)に従って、すなわちドライ・アップミックス・パラメータCおよびウェット・アップミックス・パラメータPを使って再構成を実行するよう適応されている。しかしながら、ドライ・アップミックス・パラメータCおよびウェット・アップミックス・パラメータP自身を受領するのではなく、ドライ・アップミックス・パラメータCおよびウェット・アップミックス・パラメータPが導出可能となるもとになるドライ・アップミックス・パラメータ〔チルダ付きのC〕およびウェット・アップミックス・パラメータ〔チルダ付きのP〕が受領される。脱相関部１０１は、ダウンミックス信号Yを受領して、それに基づいて(N−1)チャネル脱相関信号Z＝[z₁…z_N-1]^Tを出力する。本例示的実施形態では、脱相関信号Zは、ダウンミックス信号Yを処理することによって導出される。該処理は、ダウンミックス信号Yにそれぞれの全通過フィルタを適用して、ダウンミックス信号Yに相関しておらず、ダウンミックス信号Yのオーディオ・コンテンツとスペクトル的に同様であり聴取者によっても同様であると知覚されるオーディオ・コンテンツをもつチャネルを提供することによることを含む。前記(N−1)チャネルの脱相関された信号Zは、聴取者によって知覚されるNチャネル・オーディオ信号Xの再構成されたバージョン〔＾付きのX〕の次元性を高めるはたらきをする。本例示的実施形態では、前記脱相関信号Zの諸チャネルは、前記単一チャネル・ダウンミックス信号Yと少なくとも近似的には同じスペクトルを有し、前記単一チャネル・ダウンミックス信号Yと一緒に、N個の少なくとも近似的には互いに無相関なチャネルをなす。ドライ・アップミックス部１０２は、ドライ・アップミックス・パラメータ〔チルダ付きのC〕およびダウンミックス信号Yを受領する。本例示的実施形態では、ドライ・アップミックス・パラメータ〔チルダ付きのC〕はN個のドライ・アップミックス係数Cの最初のN−1個と一致し、残りのドライ・アップミックス係数は、式(7)によって与えられるドライ・アップミックス係数Cの間のあらかじめ定義された関係に基づいて決定される。ドライ・アップミックス部１０２は、ダウンミックス信号Yを、ドライ・アップミックス係数Cの集合に従って線形にマッピングすることによって計算され、式(2)ではCYによって表わされているドライ・アップミックス信号を出力する。ウェット・アップミックス部１０３は、ウェット・アップミックス・パラメータ〔チルダ付きのP〕および脱相関信号Zを受領する。本例示的実施形態では、ウェット・アップミックス・パラメータ〔チルダ付きのP〕は、式(10)に従ってエンコーダ側で決定された中間行列H_RのN(N−1)/2個の要素である。本例示的実施形態では、ウェット・アップミックス部１０３は、中間行列H_Rがあらかじめ定義された行列クラスに属すること、すなわち対称的であることを知って、行列の要素間の対応する関係を活用して、中間行列H_Rの残りの要素の値を入れる。次いで、ウェット・アップミックス部１０３は式(11)を用いることによって、すなわち、中間行列H_Rにあらかじめ定義された行列V、すなわちN＝3の場合については(9)における二番目の行列、N＝4の場合については(9)における三番目の行列、を乗算することによって、ウェット・アップミックス係数Pの集合を得る。よって、N(N−1)個のウェット・アップミックス係数Pは、受領されたN(N−1)/2個の独立して割り当て可能なウェット・アップミックス・パラメータ〔チルダ付きのP〕から導出される。ウェット・アップミックス部１０３は、前記脱相関信号Zをウェット・アップミックス係数の前記集合Pに従って線形にマッピングすることによって計算され、式(2)ではPZによって表わされるウェット・アップミックス信号を出力する。組み合わせ部１０４は、ドライ・アップミックス信号CYおよびウェット・アップミックス信号PZを受領し、これらの信号を組み合わせて、再構成されるべき前記N次元オーディオ信号Xに対応する第一の多次元の再構成された信号〔＾付きのX〕を得る。本例示的実施形態では、組み合わせ部１０４は、式(2)に従って、ドライ・アップミックス信号CYのそれぞれのチャネルのオーディオ・コンテンツを、ウェット・アップミックス信号PZのそれぞれのチャネルと組み合わせることによって、再構成された信号〔＾付きのX〕のそれぞれのチャネルを得る。

図２は、ある例示的実施形態に基づくオーディオ・デコード・システム２００の一般化されたブロック図である。オーディオ・デコード・システム２００は、図１を参照して述べたパラメトリック再構成部１００を有する。たとえばデマルチプレクサを含む受領部２０１は、図４を参照して述べたオーディオ・エンコード・システム４００から伝送されたビットストリームBを受領し、ビットストリームBからダウンミックス信号Yおよび関連するドライ・アップミックス・パラメータ〔チルダ付きのC〕およびウェット・アップミックス・パラメータ〔チルダ付きのP〕を抽出する。ダウンミックス信号Yがドルビー・デジタルまたはMPEG AACのような知覚的オーディオ・コーデックを使ってビットストリームBにエンコードされている場合には、オーディオ・デコード・システム２００は、ビットストリームBから抽出されるときにダウンミックス信号Yをデコードするよう構成されたコア・デコーダ（図２には示さず）を有していてもよい。変換部２０２は、逆MDCTを実行することによってダウンミックス信号Yを変換し、QMF分解部２０３は、時間／周波数タイルの形のダウンミックス信号Yのパラメトリック再構成部１００による処理のために、ダウンミックス信号YをQMF領域に変換する。量子化解除部２０４および２０５は、ドライ・アップミックス・パラメータ〔チルダ付きのC〕およびウェット・アップミックス・パラメータ〔チルダ付きのP〕を、パラメトリック再構成部１００に供給する前に、たとえばエントロピー符号化されたフォーマットから、量子化解除する。図４を参照して述べたように、量子化は、二つの異なるきざみサイズ、たとえば0.1または0.2のうちの一方を用いて実行されたものであってもよい。用いられた実際のきざみサイズは、あらかじめ定義されていてもよく、あるいはエンコーダ側からオーディオ・デコード・システム２００に、たとえばビットストリームBを介して、信号伝達されてもよい。いくつかの例示的実施形態では、ドライ・アップミックス・パラメータ〔チルダ付きのC〕およびウェット・アップミックス・パラメータ〔チルダ付きのP〕からそれぞれドライ・アップミックス係数Cおよびウェット・アップミックス係数Pが、それぞれの量子化解除部２０４および２０５においてすでに導出されてもよい。これらの量子化解除部は任意的に、それぞれドライ・アップミックス部１０２およびウェット・アップミックス部１０３の一部と見なされてもよい。本例示的実施形態では、パラメトリック再構成部１００によって出力される再構成されたオーディオ信号〔＾付きのX〕は、QMF合成部２０６によってQMF領域から変換し戻されてから、オーディオ・デコード・システム２００の出力として、マルチスピーカー・システム２０７での再生のために提供される。

図５〜図１１は、例示的実施形態に基づく、諸ダウンミックス・チャネルによって11.1チャネル・オーディオ信号を表現する代替的な諸方法を示している。本例示的実施形態では、11.1チャネル・オーディオ信号は次のチャネルを含む：左（L）、右（R）、中央（C）、低域効果（LFE）、左側方（LS）、右側方（RS）、左後方（LB）、右後方（RB）、上前方左（TFL）、上前方右（TFR）、上後方左（TBL）および上後方右（TBR）。これらは図５〜図１１では大文字によって示されている。11.1チャネル・オーディオ信号を表わすための代替的な諸方法は、これらのチャネルの諸チャネル集合への代替的な分割に対応する。各集合は、単一のダウンミックス信号によって、任意的にはそれに加えて付随するウェットおよびドライ・アップミックス・パラメータによって表わされる。各チャネル集合のそれぞれの単一チャネル・ダウンミックス信号（およびメタデータ）へのエンコードは、独立して並列に実行されてもよい。同様に、それぞれの単一チャネル・ダウンミックス信号からのそれぞれのチャネル集合の再構成は独立して並列に実行されてもよい。

図５〜図１１を参照して（また下記で図１３〜図１６を参照して）記述される例示的実施形態では、再構成されるチャネルのいずれも二つ以上のダウンミックス・チャネルからの寄与を含まなくてもよく、パラメトリック再構成の間、その単一のダウンミックス信号から導出されるいかなる脱相関信号も組み合わされない／混合されない、すなわち複数のダウンミックス・チャネルからの寄与は組み合わされない／混合されないことが理解される。

図５では、チャネルLS、TBLおよびLBが、単一のダウンミックス・チャネルls（およびその付随するメタデータ）によって表わされるチャネルのグループ５０１をなす。図３を参照して述べたパラメトリック・エンコード部３００は、単一のダウンミックス・チャネルlsおよび関連付けられたドライおよびウェット・アップミックス・パラメータによって三つのオーディオ・チャネルLS、TBLおよびLBを表わすために、N＝3として用いられてもよい。いずれもパラメトリック・エンコード部３００において実行されるエンコードに関連しているあらかじめ定義された行列Vおよび中間行列H_Rのあらかじめ定義された行列クラスがデコーダ側でわかっているとすると、図１を参照して述べたパラメトリック再構成部１００は、ダウンミックス信号lsおよび関連付けられたドライおよびウェット・アップミックス・パラメータから三つのチャネルLS、TBLおよびLBを再構成するために用いられることができる。同様に、チャネルRS、TBRおよびRBが、単一のダウンミックス・チャネルrsによって表わされるチャネルのグループ５０２をなし、パラメトリック・エンコード部３００の別のインスタンスが前記第一のエンコード部と並列に用いられて、三つのチャネルRS、TBRおよびRBを単一のダウンミックス・チャネルrsおよび関連付けられたドライおよびウェット・アップミックス・パラメータによって表わしてもよい。さらに、いずれもパラメトリック・エンコード部３００の上記第二のインスタンスに関連しているあらかじめ定義された行列Vおよび中間行列H_Rが属するあらかじめ定義された行列クラスがデコーダ側でわかっているとすると、パラメトリック再構成部１００の別のインスタンスは、ダウンミックス信号rsおよび関連付けられたドライおよびウェット・アップミックス・パラメータから三つのチャネルRS、TBRおよびRBを再構成するために用いられることができる。もう一つのチャネル・グループ５０３は、ダウンミックス・チャネルlによって表わされる二つのチャネルLおよびTFLのみを含む。これら二つのチャネルをダウンミックス・チャネルlおよび関連付けられたウェットおよびドライ・アップミックス・パラメータにエンコードすることは、それぞれ図３および図１を参照して述べたのと同様だがN＝2についてのエンコード部および再構成部によって実行されてもよい。もう一つのチャネル・グループ５０４は、ダウンミックス・チャネルlfeによって表わされる単一のチャネルLFEのみを含む。この場合、ダウンミックスは必要とされず、ダウンミックス・チャネルlfeはチャネルLFE自身であってもよく、任意的にはMDCT領域に変換したものおよび／または知覚的オーディオ・コーデックを使ってエンコードしたものであってもよい。

11.1チャネル・オーディオ信号を表わすために図５〜図１１において用いられるダウンミックス・チャネルの総数は多様である。たとえば、図５に示される例は6個のダウンミックス・チャネルを用いる一方、図７の例は10個のダウンミックス・チャネルを用いる。異なる状況については、たとえばダウンミックス信号および付随するアップミックス・パラメータの伝送のための利用可能な帯域幅および／または11.1チャネル・オーディオ信号の再構成がどのくらい忠実であるべきかについての要件に依存して、異なるダウンミックス構成が好適であることがある。

例示的実施形態によれば、図４を参照して述べたオーディオ・エンコード・システム４００は、図３を参照して述べたパラメトリック・エンコード部３００を含む複数のパラメトリック・エンコード部を有していてもよい。オーディオ・エンコード・システム４００は、図５〜図１１に示される11.1チャネル・オーディオ信号のそれぞれの分割に対応する符号化フォーマットのコレクションから、11.1チャネル・オーディオ信号についての符号化フォーマットを決定／選択するよう構成された制御部（図４には示さず）を有していてもよい。符号化フォーマットはさらに、それぞれのダウンミックス・チャネルを計算するためのあらかじめ定義された規則（その少なくともいくつかが一致していてもよい）の集合、中間行列H_Rについてのあらかじめ定義された行列クラス（その少なくともいくつかが一致していてもよい）の集合およびそれぞれの付随するウェット・アップミックス・パラメータに基づいてそれぞれのチャネル集合の少なくともいくつかに関連付けられたウェット・アップミックス係数を得るためのあらかじめ定義された行列V（その少なくともいくつかが一致していてもよい）の集合に対応する。本例示的実施形態によれば、オーディオ・エンコード・システムは、決定された符号化フォーマットに適切な前記複数のエンコード部の部分集合を使って11.1チャネル・オーディオ信号をエンコードするよう構成されている。たとえば、決定された符号化フォーマットが図１に示される11.1チャネルの分割に対応する場合、エンコード・システムは、それぞれ単一のダウンミックス・チャネルによって3チャネルのそれぞれの集合を表わすよう構成されているエンコード部二つと、それぞれ単一のダウンミックス・チャネルによって2チャネルのそれぞれの集合を表わすよう構成されているエンコード部二つと、それぞれ単一のダウンミックス・チャネルによってそれぞれの単一チャネルを表わすよう構成されているエンコード部二つとを用いてもよい。すべてのダウンミックス信号および付随するウェットおよびドライ・アップミックス・パラメータは、デコーダ側への送達のために、同じビットストリームBにエンコードされてもよい。ダウンミックス・チャネルに伴うメタデータ、すなわちウェット・アップミックス・パラメータおよびウェット・アップミックス・パラメータのコンパクトなフォーマットがいくつかのエンコード部によって用いられてもよいことを注意しておく。一方、少なくともいくつかの例示的実施形態では、他のメタデータ・フォーマットが用いられてもよい。たとえば、エンコード部のいくつかは、ウェットおよびドライ・アップミックス・パラメータではなく、完全な数のウェットおよびドライ・アップミックス係数を出力してもよい。いくつかのチャネルがN−1個より少数の脱相関されたチャネルを用いる（またさらには全く脱相関を用いない）再構成のためにエンコードされる実施形態も考えられる。ここでは、パラメトリック再構成のためのメタデータは異なる形を取りうる。

例示的実施形態によれば、図２を参照して述べたオーディオ・デコード・システム２００は、それぞれのダウンミックス信号によって表わされる11.1チャネル・オーディオ信号のチャネルのそれぞれの集合を再構成するために図１を参照して述べたパラメトリック再構成部１００を含む対応する複数の再構成部を有していてもよい。オーディオ・デコード・システム２００は、決定された符号化フォーマットを指示するエンコーダ側からの信号伝達を受領するよう構成された制御部（図２には示さず）を有していてもよい。オーディオ・デコード・システム２００は、受領されたダウンミックス信号および付随するドライおよびウェット・アップミックス・パラメータから11.1チャネル・オーディオ信号を再構成するために前記複数の再構成部の適切な部分集合を用いてもよい。

図１２〜図１３は、例示的実施形態に基づくダウンミックス・チャネルによって13.1チャネル・オーディオ信号を表わす代替的な諸方法を示している。13.1チャネル・オーディオ信号は次のチャネルを含む：左スクリーン（LSCRN）、左ワイド（LW）、右スクリーン（RSCRN）、右ワイド（RW）、中央（C）、低域効果（LFE）、左側方（LS）、右側方（RS）、左後方（LB）、右後方（RB）、上前方左（TFL）、上前方右（TFR）、上後方左（TBL）および上後方右（TBR）。それぞれのチャネル・グループのそれぞれのダウンミックス・チャネルとしてのエンコードは、図５〜図１１を参照して上記したような、独立して並列に動作するそれぞれのエンコード部によって実行されてもよい。同様に、それぞれのダウンミックス・チャネルおよび付随するアップミックス・パラメータに基づくそれぞれのチャネル・グループの再構成は、独立して並列に動作するそれぞれの再構成部によって実行されてもよい。

図１４〜図１６は、例示的実施形態に基づくダウンミックス信号によって22.2チャネル・オーディオ信号を表わす代替的な諸方法を示している。22.2チャネル・オーディオ信号は次のチャネルを含む：低域効果１（LFE1）、低域効果２（LFE2）、下前方中央（BFC）、中央（C）、上前方中央（TFC）、左ワイド（LW）、下前方左（BFL）、左（L）、上前方左（TFL）、上側方左（TSL）、上後方左（TBL）、左側方（LS）、左後方（LB）、***（TC）、上後方中央（TBC）、中央後方（CB）、下前方右（BFR）、右（R）、右ワイド（RW）、上前方右（TFR）、上側方右（TSR）、上後方右（TBR）、右側方（RS）、右後方（RB）。図１６に示される22.2チャネル・オーディオ信号の分割は、四つのチャネルを含むチャネルのグループ１６０１を含む。図３を参照して述べたパラメトリック・エンコード部３００、ただしN＝4として実装したものが、これらのチャネルをダウンミックス信号および付随するウェットおよびドライ・アップミックス・パラメータとしてエンコードするために用いられてもよい。同様に、図１を参照して述べたパラメトリック再構成部１００、ただしN＝4として実装したものが、ダウンミックス信号および付随するウェットおよびドライ・アップミックス・パラメータからこれらのチャネルを再構成するために用いられてもよい。

〈ＩＩＩ．等価物、拡張、代替その他〉
上記の記述を吟味すれば、当業者には本開示のさらなる実施形態が明白になるであろう。本稿および図面は実施形態および例を開示しているが、本開示はこれらの個別的な例に制約されるものではない。付属の請求項によって定義される本開示の範囲から外れることなく数多くの修正および変形をなすことができる。請求項に現われる参照符号があったとしても、その範囲を限定するものと理解されるものではない。

さらに、図面、本開示および付属の請求項の吟味から、本開示を実施する当業者によって、開示される実施形態に対する変形が理解され、実施されることができる。請求項において、「有する／含む」の語は他の要素またはステップを排除するものではなく、単数形の表現は複数を排除するものではない。ある種の施策が互いに異なる従属請求項に記載されているというだけの事実がこれらの施策の組み合わせが有利に使用できないことを示すものではない。

上記で開示された装置および方法は、ソフトウェア、ファームウェア、ハードウェアまたはそれらの組み合わせとして実装されうる。ハードウェア実装では、上記の記述で言及された機能ユニットの間でのタスクの分割は必ずしも物理的なユニットへの分割に対応しない。逆に、一つの物理的コンポーネントが複数の機能を有していてもよく、一つのタスクが協働するいくつかの物理的コンポーネントによって実行されてもよい。ある種のコンポーネントまたはすべてのコンポーネントは、デジタル信号プロセッサまたはマイクロプロセッサによって実行されるソフトウェアとして実装されてもよく、あるいはハードウェアとしてまたは特定用途向け集積回路として実装されてもよい。そのようなソフトウェアは、コンピュータ記憶媒体（または非一時的な媒体）および通信媒体（または一時的な媒体）を含みうるコンピュータ可読媒体上で頒布されてもよい。当業者にはよく知られているように、コンピュータ記憶媒体という用語は、コンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータのような情報の記憶のための任意の方法または技術において実装される揮発性および不揮発性、リムーバブルおよび非リムーバブル媒体を含む。コンピュータ記憶媒体は、これに限られないが、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD-ROM、デジタル多用途ディスク（DVD）または他の光ディスク記憶、磁気カセット、磁気テープ、磁気ディスク記憶または他の磁気記憶デバイスまたは、所望される情報を記憶するために使用されることができ、コンピュータによってアクセスされることができる他の任意の媒体を含む。さらに、通信媒体が典型的にはコンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータを、搬送波または他の転送機構のような変調されたデータ信号において具現し、任意の情報送達媒体を含むことは当業者にはよく知られている。
いくつかの態様を記載しておく。
〔態様１〕
Nチャネル・オーディオ信号を再構成するための方法であって、N≧3であり、当該方法は：
単一チャネル・ダウンミックス信号を、関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に受領する段階と；
ドライ・アップミックス信号を、前記ダウンミックス信号の線形マッピングとして計算する段階であって、ドライ・アップミックス係数の集合が前記ダウンミックス信号に適用される、段階と；
前記ダウンミックス信号に基づいて(N−1)チャネルの脱相関信号を生成する段階と；
ウェット・アップミックス信号を、前記脱相関信号の線形マッピングとして計算する段階であって、ウェット・アップミックス係数の集合が前記脱相関信号の諸チャネルに適用される、段階と；
前記ドライ・アップミックス信号および前記ウェット・アップミックス信号を組み合わせて、再構成されるべき前記Nチャネル・オーディオ信号に対応する多次元の再構成された信号を得る段階とを含み、当該方法はさらに：
受領されたドライ・アップミックス・パラメータに基づいてドライ・アップミックス係数の前記集合を決定する段階と；
受領されたウェット・アップミックス・パラメータの数より多くの要素をもつ中間行列に値を入れる段階であって、前記受領されたウェット・アップミックス・パラメータおよび該中間行列があらかじめ定義された行列クラスに属することを知っていることに基づく、段階と；
前記中間行列にあらかじめ定義された行列を乗算することによってウェット・アップミックス係数の前記集合を得る段階とを含み、前記ウェット・アップミックス係数の前記集合は前記乗算から帰結する行列に対応し、前記中間行列の要素の数より多い係数を含む、
方法。
〔態様２〕
前記ウェット・アップミックス・パラメータを受領する段階は、N(N−1)/2個のウェット・アップミックス・パラメータを受領することを含み、
前記中間行列に値を入れることは、受領されたN(N−1)/2個のウェット・アップミックス・パラメータおよび前記中間行列が前記あらかじめ定義された行列クラスに属することを知っていることに基づいて、(N−1) ² 個の行列要素についての値を得ることを含み、
前記あらかじめ定義された行列はN(N−1)個の要素を含み、ウェット・アップミックス係数の前記集合はN(N−1)個の係数を含む、
態様１記載の方法。
〔態様３〕
前記中間行列に値を入れることは、受領されたウェット・アップミックス・パラメータを前記中間行列における要素として用いることを含む、態様１または２記載の方法。
〔態様４〕
前記ドライ・アップミックス・パラメータを受領する段階は、(N−1)個のドライ・アップミックス・パラメータを受領することを含み、ドライ・アップミックス係数の前記集合はN個の係数を含み、ドライ・アップミックス係数の前記集合は、受領された(N−1)個のドライ・アップミックス・パラメータに基づき、かつドライ・アップミックス係数の前記集合内の係数間のあらかじめ定義された関係に基づいて決定される、態様１ないし３のうちいずれか一項記載の方法。
〔態様５〕
前記あらかじめ定義された行列クラスは：
クラス内のすべての行列の既知の属性があらかじめ定義された行列要素が0であることを含む、下三角行列または上三角行列；
クラス内のすべての行列の既知の属性があらかじめ定義された行列要素が等しいことを含む、
対称行列；および
クラス内のすべての行列の既知の属性があらかじめ定義された行列要素の間の既知の関係を含む、直交行列と対角行列の積
のうちの一つである、態様１ないし４のうちいずれか一項記載の方法。
〔態様６〕
前記ダウンミックス信号は、あらかじめ定義された規則に従って、再構成されるべき前記Nチャネル・オーディオ信号の線形マッピングとして取得可能であり、前記あらかじめ定義された規則は、あらかじめ定義されたダウンミックス動作を定義し、前記あらかじめ定義された行列は、前記あらかじめ定義されたダウンミックス動作のカーネル空間を張るベクトルに基づく、態様１ないし５のうちいずれか一項記載の方法。
〔態様７〕
前記単一チャネル・ダウンミックス信号を関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に受領する段階は、前記ダウンミックス信号の時間セグメントまたは時間／周波数タイルを、関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に受領することを含み、前記多次元の再構成された信号は、再構成されるべき前記Nチャネル・オーディオ信号の時間セグメントまたは時間／周波数タイルに対応する、態様１ないし６のうちいずれか一項記載の方法。
〔態様８〕
第一の単一チャネル・ダウンミックス信号および関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータに基づいてNチャネル・オーディオ信号を再構成するよう構成された第一のパラメトリック再構成部を有するオーディオ・デコード・システムであって、N≧3であり、前記第一のパラメトリック再構成部は：
前記第一のダウンミックス信号を受領して、それに基づいて第一の(N−1)チャネル脱相関信号を出力するよう構成された第一の脱相関部と；
第一のドライ・アップミックス部であって、
前記ドライ・アップミックス・パラメータおよび前記ダウンミックス信号を受領し；
前記ドライ・アップミックス・パラメータに基づいてドライ・アップミックス係数の第一の集合を決定し；
前記第一のダウンミックス信号をドライ・アップミックス係数の前記第一の集合に基づいて線形にマッピングすることによって計算される第一のドライ・アップミックス信号を出力するよう構成されている、第一のドライ・アップミックス部と；
第一のウェット・アップミックス部であって、
前記ウェット・アップミックス・パラメータおよび前記第一の脱相関信号を受領する段階と；
受領されたウェット・アップミックス・パラメータの数より多くの要素をもつ第一の中間行列に値を入れる段階であって、受領されたウェット・アップミックス・パラメータおよび前記第一の中間行列が第一のあらかじめ定義された行列クラスに属していると知っていることに基づく、段階と；
前記第一の中間行列に第一のあらかじめ定義された行列を乗算することによってウェット・アップミックス係数の第一の集合を得る段階であって、ウェット・アップミックス係数の前記第一の集合は前記乗算から帰結する行列に対応し、前記第一の中間行列の要素の数より多い係数を含む、段階と；
前記第一の脱相関信号をウェット・アップミックス係数の前記第一の集合に従って線形にマッピングすることによって計算された第一のウェット・アップミックス信号を出力する段階とを実行するよう構成されている第一のウェット・アップミックス部と；
前記第一のドライ・アップミックス信号および前記第一のウェット・アップミックス信号を受領し、これらの信号を組み合わせて、再構成されるべき前記Nチャネル・オーディオ信号に対応する第一の多次元の再構成された信号を得るよう構成された第一の組み合わせ部を有する、
オーディオ・デコード・システム。
〔態様９〕
前記第一のパラメトリック再構成部とは独立に動作可能であり、第二の単一チャネル・ダウンミックス信号および関連付けられたドライ・アップミックス・パラメータおよびウェットのアップミックス・パラメータに基づいてN ₂ チャネル・オーディオ信号を再構成するよう構成された第二のパラメトリック再構成部をさらに有しており、N ₂ ≧2であり、前記第二のパラメトリック再構成部は、第二の脱相関部、第二のドライ・アップミックス部、第二のウェット・アップミックス部および第二の組み合わせ部を有しており、前記第二のパラメトリック再構成部のこれらの部は、前記第一のパラメトリック再構成部の対応する各部と類似の構成であり、前記第二のウェット・アップミックス部は、第二のあらかじめ定義された行列クラスに属する第二の中間行列および第二のあらかじめ定義された行列を用いるよう構成されている、態様８記載のオーディオ・デコード・システム。
〔態様１０〕
当該オーディオ・デコード・システムは、複数のダウンミックス・チャネルおよび関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータに基づいてマルチチャネル・オーディオ信号を再構成するよう適応されており、当該オーディオ・デコード・システムは：
それぞれのダウンミックス・チャネルおよびそれぞれの関連付けられたドライ・アップミックス・パラメータおよびウェットのアップミックス・パラメータに基づいてオーディオ信号チャネルのそれぞれの集合を独立して再構成するよう動作可能なパラメトリック再構成部を含む複数の再構成部と；
前記マルチチャネル・オーディオ信号のチャネルの、それぞれのダウンミックス・チャネルおよび少なくとも該ダウンミックス・チャネルのいくつかについてはそれぞれの関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータによって表わされるチャネルの諸集合への分割に対応する、前記マルチチャネル・オーディオ信号の符号化フォーマットを示す信号伝達を受領するよう構成された制御部であって、前記符号化フォーマットはさらに、それぞれの関連付けられたウェット・アップミックス・パラメータに基づいてチャネルの前記それぞれの集合のうち少なくともいくつかの集合に関連付けられたウェット・アップミックス係数を得るためのあらかじめ定義された行列の集合にさらに対応する、制御部とを有しており、
当該デコード・システムは、前記受領された信号伝達が第一の符号化フォーマットを示すことに応答して、前記複数の再構成部の第一の部分集合を使って前記マルチチャネル・オーディオ信号を再構成するよう構成されており、当該デコード・システムは、前記受領された信号伝達が第二の符号化フォーマットを示すことに応答して、前記複数の再構成部の第二の部分集合を使って前記マルチチャネル・オーディオ信号を再構成するよう構成されていており、前記再構成部の前記第一および第二の部分集合の少なくとも一方は、前記第一のパラメトリック再構成部を含む、
態様８または９記載のオーディオ・デコード・システム。
〔態様１１〕
前記複数の再構成部は、高々単一のオーディオ・チャネルがエンコードされたダウンミックス・チャネルに基づいて単一のオーディオ・チャネルを独立して再構成するよう動作可能な単一チャネル再構成部を含み、前記再構成部の前記第一および第二の部分集合の少なくとも一方は、前記単一チャネル再構成部を有する、態様１０記載のオーディオ・デコード・システム。
〔態様１２〕
前記第一の符号化フォーマットは、前記第二の符号化フォーマットより、少数のダウンミックス・チャネルからの前記マルチチャネル・オーディオ信号の再構成に対応する、態様１０または１１記載のオーディオ・デコード・システム。
〔態様１３〕
Nチャネル・オーディオ信号を単一チャネル・ダウンミックス信号およびメタデータとしてエンコードする方法であって、前記メタデータは、該ダウンミックス信号および該ダウンミックス信号に基づいて決定される(N−1)チャネルの脱相関信号からの前記オーディオ信号のパラメトリック再構成のために好適なものであり、N≧3であり、当該方法は：
前記オーディオ信号を受領する段階と；
あらかじめ定義された規則に従って、前記単一チャネル・ダウンミックス信号を前記オーディオ信号の線形マッピングとして計算する段階と；
前記オーディオ信号を近似する前記ダウンミックス信号の線形マッピングを定義するためのドライ・アップミックス係数の集合を決定する段階と；
受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似される前記オーディオ信号の共分散との間の差に基づいて中間行列を決定する段階であって、前記中間行列は、あらかじめ定義された行列を乗算されたとき、前記オーディオ信号のパラメトリック再構成の一部として前記脱相関信号の線形マッピングを定義するウェット・アップミックス係数の集合に対応し、ウェット・アップミックス係数の前記集合は、前記中間行列の要素の数より多くの係数を含む、段階と；
ドライ・アップミックス係数の前記集合が導出可能であるもとになるドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に前記ダウンミックス信号を出力する段階であって、前記中間行列は出力ウェット・アップミックス・パラメータの数より多くの要素をもち、前記中間行列は、該中間行列があらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義される、段階とを含む、
方法。
〔態様１４〕
前記中間行列を決定する段階が、ウェット・アップミックス係数の前記集合によって定義される、前記脱相関信号の前記線形マッピングによって得られる信号の共分散が、受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似される前記オーディオ信号の共分散との間の差を近似するよう、前記中間行列を決定することを含む、態様１３記載の方法。
〔態様１５〕
前記ウェット・アップミックス・パラメータを出力する段階は、高々N(N−1)/2個のウェット・アップミックス・パラメータを出力することを含み、前記中間行列は(N−1) ² 個の行列要素を有し、前記中間行列が前記あらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義され、ウェット・アップミックス係数の前記集合はN(N−1)個の係数を含む、態様１３または１４記載の方法。
〔態様１６〕
ドライ・アップミックス係数の前記集合はN個の係数を含み、ドライ・アップミックス・パラメータを出力することは、高々(N−1)個のドライ・アップミックス・パラメータを出力することを含み、ドライ・アップミックス係数の前記集合は、前記(N−1)個のドライ・アップミックス・パラメータから、前記あらかじめ定義された規則を使って導出可能である、態様１３ないし１５のうちいずれか一項記載の方法。
〔態様１７〕
ドライ・アップミックス係数の決定された集合は、前記オーディオ信号の最小平均平方誤差近似に対応する前記ダウンミックス信号の線形マッピングを定義する、態様１３ないし１６のうちいずれか一項記載の方法。
〔態様１８〕
Nチャネル・オーディオ信号を単一チャネル・ダウンミックス信号およびメタデータとしてエンコードするよう構成されたパラメトリック・エンコード部を有するオーディオ・エンコード・システムであって、前記メタデータは、該ダウンミックス信号および該ダウンミックス信号に基づいて決定される(N−1)チャネルの脱相関信号からの前記オーディオ信号のパラメトリック再構成のために好適なものであり、N≧3であり、前記パラメトリック・エンコード部は：
前記オーディオ信号を受領し、あらかじめ定義された規則に従って、前記単一チャネル・ダウンミックス信号を前記オーディオ信号の線形マッピングとして計算するよう構成されたダウンミックス部と；
前記オーディオ信号を近似する前記ダウンミックス信号の線形マッピングを定義するためのドライ・アップミックス係数の集合を決定するよう構成された第一の解析部と；
受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似される前記オーディオ信号の共分散との間の差に基づいて中間行列を決定するよう構成されている第二の解析部であって、前記中間行列は、あらかじめ定義された行列を乗算されたとき、前記オーディオ信号のパラメトリック再構成の一部として前記脱相関信号の線形マッピングを定義するウェット・アップミックス係数の集合に対応し、ウェット・アップミックス係数の前記集合は、前記中間行列の要素の数より多くの係数を含む、第二の解析部とを有しており、
前記パラメトリック・エンコード部は、ドライ・アップミックス係数の前記集合が導出可能であるもとになるドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に前記ダウンミックス信号を出力するよう構成されており、前記中間行列は出力ウェット・アップミックス・パラメータの数より多くの要素をもり、前記中間行列は、該中間行列があらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義される、
オーディオ・エンコード・システム。
〔態様１９〕
当該オーディオ・エンコード・システムは、複数のダウンミックス・チャネルおよび関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータの形でマルチチャネル・オーディオ信号の表現を提供するよう適応されており、当該オーディオ・エンコード・システムは：
それぞれのダウンミックス・チャネルおよびそれぞれの関連付けられたアップミックス・パラメータを、オーディオ信号チャネルのそれぞれの集合に基づいて独立して計算するよう動作可能なパラメトリック・エンコード部を含む複数のエンコード部と；
前記マルチチャネル・オーディオ信号のチャネルの、それぞれのダウンミックス・チャネルおよび少なくとも該ダウンミックス・チャネルの少なくともいくつかについてはそれぞれの関連付けられたアップミックス・パラメータによって表わされるチャネルの諸集合への分割に対応する、前記マルチチャネル・オーディオ信号の符号化フォーマットを決定するよう構成された制御部であって、前記符号化フォーマットはさらに、それぞれのダウンミックス・チャネルのうちの少なくともいくつかを計算するためのあらかじめ定義された規則の集合に対応する、制御部とを有しており、
当該オーディオ・エンコード・システムは、決定された符号化フォーマットが第一の符号化フォーマットであることに応答して、前記複数のエンコード部の第一の部分集合を使って前記マルチチャネル・オーディオ信号をエンコードするよう構成されており、当該オーディオ・エンコード・システムは、決定された符号化フォーマットが第二の符号化フォーマットであることに応答して、前記複数のエンコード部の第二の部分集合を使って前記マルチチャネル・オーディオ信号をエンコードするよう構成されており、前記エンコード部の前記第一および第二の部分集合の少なくとも一方は、前記第一のパラメトリック・エンコード部を含む、
態様１８記載のオーディオ・エンコード・システム。
〔態様２０〕
前記複数のエンコード部は、高々単一のオーディオ・チャネルをダウンミックス・チャネルにおいて独立してエンコードするよう動作可能な単一チャネル・エンコード部を含み、前記エンコード部の前記第一および第二の部分集合の少なくとも一方は、前記単一チャネル・エンコード部を含む、態様１９記載のオーディオ・エンコード・システム。
〔態様２１〕
態様１ないし７および１３ないし１７のうちいずれか一項記載の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔態様２２〕
N＝3またはN＝4である、態様１ないし７および１３ないし１７のうちいずれか一項記載の方法、態様８ないし１２のうちいずれか一項記載のオーディオ・デコード・システム、態様１８ないし２０のうちいずれか一項記載のオーディオ・エンコード・システムまたは態様２１記載のコンピュータ・プログラム・プロダクト。

Claims

Nチャネル・オーディオ信号を再構成するための方法であって、N≧3であり、当該方法は：
単一チャネル・ダウンミックス信号を、関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に受領する段階と；
ドライ・アップミックス信号を、前記ダウンミックス信号の線形マッピングとして計算する段階であって、ドライ・アップミックス係数の集合が前記ダウンミックス信号に適用される、段階と；
前記ダウンミックス信号に基づいて脱相関信号を生成する段階であって、前記脱相関信号は(N−1)個のチャネルをもつ、段階と；
ウェット・アップミックス信号を、前記脱相関信号の前記(N−1)個のチャネルの線形マッピングとして計算する段階であって、ウェット・アップミックス係数の集合が前記脱相関信号の諸チャネルに適用される、段階と；
前記ドライ・アップミックス信号および前記ウェット・アップミックス信号を組み合わせて、再構成されるべき前記Nチャネル・オーディオ信号に対応する多次元の再構成された信号を得る段階とを含み、当該方法はさらに：
受領されたドライ・アップミックス・パラメータに基づいてドライ・アップミックス係数の前記集合を決定する段階と；
受領されたウェット・アップミックス・パラメータの数より多くの要素をもつ中間行列に、前記受領されたウェット・アップミックス・パラメータおよび該中間行列があらかじめ定義された行列クラスに属することを知っていることに基づいて値を入れる段階であって、前記あらかじめ定義された行列クラス内のすべての行列の既知の属性が、あらかじめ定義された行列要素の間の既知の関係またはあらかじめ定義された行列要素が0であることを含む、段階と；
前記中間行列にあらかじめ定義された行列を乗算することによってウェット・アップミックス係数の前記集合を得る段階とを含み、前記ウェット・アップミックス係数の前記集合は前記乗算から帰結する行列に対応し、前記中間行列の要素の数より多い係数を含む、
方法。
前記ウェット・アップミックス・パラメータを受領する段階は、N(N−1)/2個のウェット・アップミックス・パラメータを受領することを含み、
前記中間行列に値を入れることは、受領されたN(N−1)/2個のウェット・アップミックス・パラメータおよび前記中間行列が前記あらかじめ定義された行列クラスに属することを知っていることに基づいて、(N−1)²個の行列要素についての値を得ることを含み、
前記あらかじめ定義された行列はN(N−1)個の要素を含み、ウェット・アップミックス係数の前記集合はN(N−1)個の係数を含む、
請求項１記載の方法。
前記中間行列に値を入れることは、受領されたウェット・アップミックス・パラメータを前記中間行列における要素として用いることを含む、請求項１または２記載の方法。
前記ドライ・アップミックス・パラメータを受領する段階は、(N−1)個のドライ・アップミックス・パラメータを受領することを含み、ドライ・アップミックス係数の前記集合はN個の係数を含み、ドライ・アップミックス係数の前記集合は、受領された(N−1)個のドライ・アップミックス・パラメータに基づき、かつドライ・アップミックス係数の前記集合内の係数間のあらかじめ定義された関係に基づいて決定される、請求項１ないし３のうちいずれか一項記載の方法。
前記あらかじめ定義された行列クラスは：
クラス内のすべての行列の既知の属性があらかじめ定義された行列要素が0であることを含む、下三角行列または上三角行列；
クラス内のすべての行列の既知の属性があらかじめ定義された行列要素が等しいことを含む、
対称行列；および
クラス内のすべての行列の既知の属性があらかじめ定義された行列要素の間の既知の関係を含む、直交行列と対角行列の積
のうちの一つである、請求項１ないし４のうちいずれか一項記載の方法。
前記ダウンミックス信号は、あらかじめ定義された規則に従って、再構成されるべき前記Nチャネル・オーディオ信号の線形マッピングとして取得可能であり、前記あらかじめ定義された規則は、あらかじめ定義されたダウンミックス動作を定義し、前記あらかじめ定義された行列は、前記あらかじめ定義されたダウンミックス動作のカーネル空間を張るベクトルに基づく、請求項１ないし５のうちいずれか一項記載の方法。
前記単一チャネル・ダウンミックス信号を関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に受領する段階は、前記ダウンミックス信号の時間セグメントまたは時間／周波数タイルを、関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に受領することを含み、前記多次元の再構成された信号は、再構成されるべき前記Nチャネル・オーディオ信号の時間セグメントまたは時間／周波数タイルに対応する、請求項１ないし６のうちいずれか一項記載の方法。
第一の単一チャネル・ダウンミックス信号および関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータに基づいてNチャネル・オーディオ信号を再構成するよう構成された第一のパラメトリック再構成部を有するオーディオ・デコード・システムであって、N≧3であり、前記第一のパラメトリック再構成部は：
前記第一のダウンミックス信号を受領して、それに基づいて(N−1)個のチャネルをもつ第一の脱相関信号を出力するよう構成された第一の脱相関部と；
第一のドライ・アップミックス部であって、
前記ドライ・アップミックス・パラメータおよび前記ダウンミックス信号を受領し；
前記ドライ・アップミックス・パラメータに基づいてドライ・アップミックス係数の第一の集合を決定し；
前記第一のダウンミックス信号をドライ・アップミックス係数の前記第一の集合に基づいて線形にマッピングすることによって計算される第一のドライ・アップミックス信号を出力するよう構成されている、第一のドライ・アップミックス部と；
第一のウェット・アップミックス部であって、
前記ウェット・アップミックス・パラメータおよび前記第一の脱相関信号を受領する段階と；
受領されたウェット・アップミックス・パラメータの数より多くの要素をもつ第一の中間行列に、受領されたウェット・アップミックス・パラメータおよび前記第一の中間行列が第一のあらかじめ定義された行列クラスに属していると知っていることに基づいて値を入れる段階であって、前記第一のあらかじめ定義された行列クラス内のすべての行列の既知の属性が、あらかじめ定義された行列要素の間の既知の関係またはあらかじめ定義された行列要素が0であることを含む、段階と；
前記第一の中間行列に第一のあらかじめ定義された行列を乗算することによってウェット・アップミックス係数の第一の集合を得る段階であって、ウェット・アップミックス係数の前記第一の集合は前記乗算から帰結する行列に対応し、前記第一の中間行列の要素の数より多い係数を含む、段階と；
前記第一の脱相関信号の前記(N−1)個のチャネルをウェット・アップミックス係数の前記第一の集合に従って線形にマッピングすることによって計算された第一のウェット・アップミックス信号を出力する段階とを実行するよう構成されている第一のウェット・アップミックス部と；
前記第一のドライ・アップミックス信号および前記第一のウェット・アップミックス信号を受領し、これらの信号を組み合わせて、再構成されるべき前記Nチャネル・オーディオ信号に対応する第一の多次元の再構成された信号を得るよう構成された第一の組み合わせ部を有する、
オーディオ・デコード・システム。
前記第一のパラメトリック再構成部とは独立に動作可能であり、第二の単一チャネル・ダウンミックス信号および関連付けられたドライ・アップミックス・パラメータおよびウェットのアップミックス・パラメータに基づいてN₂チャネル・オーディオ信号を再構成するよう構成された第二のパラメトリック再構成部をさらに有しており、N₂≧2であり、前記第二のパラメトリック再構成部は、第二の脱相関部、第二のドライ・アップミックス部、第二のウェット・アップミックス部および第二の組み合わせ部を有しており、前記第二のパラメトリック再構成部のこれらの部は、前記第一のパラメトリック再構成部の対応する各部と類似の構成であり、前記第二のウェット・アップミックス部は、第二のあらかじめ定義された行列クラスに属する第二の中間行列および第二のあらかじめ定義された行列を用いるよう構成されており、前記第二のあらかじめ定義された行列クラス内のすべての行列の既知の属性が、あらかじめ定義された行列要素の間の既知の関係またはあらかじめ定義された行列要素が0であることを含む、請求項８記載のオーディオ・デコード・システム。
当該オーディオ・デコード・システムは、複数のダウンミックス・チャネルおよび関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータに基づいてマルチチャネル・オーディオ信号を再構成するよう適応されており、当該オーディオ・デコード・システムは：
それぞれのダウンミックス・チャネルおよびそれぞれの関連付けられたドライ・アップミックス・パラメータおよびウェットのアップミックス・パラメータに基づいてオーディオ信号チャネルのそれぞれの集合を独立して再構成するよう動作可能なパラメトリック再構成部を含む複数の再構成部と；
前記マルチチャネル・オーディオ信号のチャネルの、それぞれのダウンミックス・チャネルおよび少なくとも該ダウンミックス・チャネルのいくつかについてはそれぞれの関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータによって表わされるチャネルの諸集合への分割に対応する、前記マルチチャネル・オーディオ信号の符号化フォーマットを示す信号伝達を受領するよう構成された制御部であって、前記符号化フォーマットはさらに、それぞれの関連付けられたウェット・アップミックス・パラメータに基づいてチャネルの前記それぞれの集合のうち少なくともいくつかの集合に関連付けられたウェット・アップミックス係数を得るためのあらかじめ定義された行列の集合にさらに対応する、制御部とを有しており、
当該デコード・システムは、前記受領された信号伝達が第一の符号化フォーマットを示すことに応答して、前記複数の再構成部の第一の部分集合を使って前記マルチチャネル・オーディオ信号を再構成するよう構成されており、当該デコード・システムは、前記受領された信号伝達が第二の符号化フォーマットを示すことに応答して、前記複数の再構成部の第二の部分集合を使って前記マルチチャネル・オーディオ信号を再構成するよう構成されていており、前記再構成部の前記第一および第二の部分集合の少なくとも一方は、前記第一のパラメトリック再構成部を含む、
請求項８または９記載のオーディオ・デコード・システム。
前記複数の再構成部は、高々単一のオーディオ・チャネルがエンコードされたダウンミックス・チャネルに基づいて単一のオーディオ・チャネルを独立して再構成するよう動作可能な単一チャネル再構成部を含み、前記再構成部の前記第一および第二の部分集合の少なくとも一方は、前記単一チャネル再構成部を有する、請求項１０記載のオーディオ・デコード・システム。
前記第一の符号化フォーマットは、前記第二の符号化フォーマットより、少数のダウンミックス・チャネルからの前記マルチチャネル・オーディオ信号の再構成に対応する、請求項１０または１１記載のオーディオ・デコード・システム。
Nチャネル・オーディオ信号を単一チャネル・ダウンミックス信号およびメタデータとしてエンコードする方法であって、前記メタデータは、該ダウンミックス信号および該ダウンミックス信号に基づいて決定される脱相関信号からの前記オーディオ信号のパラメトリック再構成のために好適なものであり、N≧3であり、前記脱相関信号は(N−1)個のチャネルをもち、当該方法は：
前記オーディオ信号を受領する段階と；
あらかじめ定義された規則に従って、前記単一チャネル・ダウンミックス信号を前記オーディオ信号の線形マッピングとして計算する段階と；
前記オーディオ信号を近似する前記ダウンミックス信号の線形マッピングを定義するためのドライ・アップミックス係数の集合を決定する段階と；
受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似される前記オーディオ信号の共分散との間の差に基づいて中間行列を決定する段階であって、前記中間行列は、あらかじめ定義された行列を乗算されたとき、前記オーディオ信号のパラメトリック再構成の一部として前記脱相関信号の前記(N−1)個のチャネルの線形マッピングを定義するウェット・アップミックス係数の集合に対応し、ウェット・アップミックス係数の前記集合は、前記中間行列の要素の数より多くの係数を含む、段階と；
ドライ・アップミックス係数の前記集合が導出可能であるもとになるドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に前記ダウンミックス信号を出力する段階であって、前記中間行列は出力ウェット・アップミックス・パラメータの数より多くの要素をもち、前記中間行列は、該中間行列があらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義され、前記あらかじめ定義された行列クラス内のすべての行列の既知の属性が、あらかじめ定義された行列要素の間の既知の関係またはあらかじめ定義された行列要素が0であることを含む、段階とを含む、
方法。
前記中間行列を決定する段階が、ウェット・アップミックス係数の前記集合によって定義される、前記脱相関信号の前記線形マッピングによって得られる信号の共分散が、受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似される前記オーディオ信号の共分散との間の差を近似するよう、前記中間行列を決定することを含む、請求項１３記載の方法。
前記ウェット・アップミックス・パラメータを出力する段階は、高々N(N−1)/2個のウェット・アップミックス・パラメータを出力することを含み、前記中間行列は(N−1)²個の行列要素を有し、前記中間行列が前記あらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義され、ウェット・アップミックス係数の前記集合はN(N−1)個の係数を含む、請求項１３または１４記載の方法。
ドライ・アップミックス係数の前記集合はN個の係数を含み、ドライ・アップミックス・パラメータを出力することは、高々(N−1)個のドライ・アップミックス・パラメータを出力することを含み、ドライ・アップミックス係数の前記集合は、前記(N−1)個のドライ・アップミックス・パラメータから、前記あらかじめ定義された規則を使って導出可能である、請求項１３ないし１５のうちいずれか一項記載の方法。
ドライ・アップミックス係数の決定された集合は、前記オーディオ信号の最小平均平方誤差近似に対応する前記ダウンミックス信号の線形マッピングを定義する、請求項１３ないし１６のうちいずれか一項記載の方法。
Nチャネル・オーディオ信号を単一チャネル・ダウンミックス信号およびメタデータとしてエンコードするよう構成されたパラメトリック・エンコード部を有するオーディオ・エンコード・システムであって、前記メタデータは、該ダウンミックス信号および該ダウンミックス信号に基づいて決定される脱相関信号からの前記オーディオ信号のパラメトリック再構成のために好適なものであり、N≧3であり、前記脱相関信号は(N−1)個のチャネルをもち、前記パラメトリック・エンコード部は：
前記オーディオ信号を受領し、あらかじめ定義された規則に従って、前記単一チャネル・ダウンミックス信号を前記オーディオ信号の線形マッピングとして計算するよう構成されたダウンミックス部と；
前記オーディオ信号を近似する前記ダウンミックス信号の線形マッピングを定義するためのドライ・アップミックス係数の集合を決定するよう構成された第一の解析部と；
受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似される前記オーディオ信号の共分散との間の差に基づいて中間行列を決定するよう構成されている第二の解析部であって、前記中間行列は、あらかじめ定義された行列を乗算されたとき、前記オーディオ信号のパラメトリック再構成の一部として前記脱相関信号の前記(N−1)個のチャネルの線形マッピングを定義するウェット・アップミックス係数の集合に対応し、ウェット・アップミックス係数の前記集合は、前記中間行列の要素の数より多くの係数を含む、第二の解析部とを有しており、
前記パラメトリック・エンコード部は、ドライ・アップミックス係数の前記集合が導出可能であるもとになるドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に前記ダウンミックス信号を出力するよう構成されており、前記中間行列は出力ウェット・アップミックス・パラメータの数より多くの要素をもち、前記中間行列は、該中間行列があらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義され、前記あらかじめ定義された行列クラス内のすべての行列の既知の属性が、あらかじめ定義された行列要素の間の既知の関係またはあらかじめ定義された行列要素が0であることを含む、
オーディオ・エンコード・システム。
当該オーディオ・エンコード・システムは、複数のダウンミックス・チャネルおよび関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータの形でマルチチャネル・オーディオ信号の表現を提供するよう適応されており、当該オーディオ・エンコード・システムは：
それぞれのダウンミックス・チャネルおよびそれぞれの関連付けられたアップミックス・パラメータを、オーディオ信号チャネルのそれぞれの集合に基づいて独立して計算するよう動作可能なパラメトリック・エンコード部を含む複数のエンコード部と；
前記マルチチャネル・オーディオ信号のチャネルの、それぞれのダウンミックス・チャネルおよび少なくとも該ダウンミックス・チャネルの少なくともいくつかについてはそれぞれの関連付けられたアップミックス・パラメータによって表わされるチャネルの諸集合への分割に対応する、前記マルチチャネル・オーディオ信号の符号化フォーマットを決定するよう構成された制御部であって、前記符号化フォーマットはさらに、それぞれのダウンミックス・チャネルのうちの少なくともいくつかを計算するためのあらかじめ定義された規則の集合に対応する、制御部とを有しており、
当該オーディオ・エンコード・システムは、決定された符号化フォーマットが第一の符号化フォーマットであることに応答して、前記複数のエンコード部の第一の部分集合を使って前記マルチチャネル・オーディオ信号をエンコードするよう構成されており、当該オーディオ・エンコード・システムは、決定された符号化フォーマットが第二の符号化フォーマットであることに応答して、前記複数のエンコード部の第二の部分集合を使って前記マルチチャネル・オーディオ信号をエンコードするよう構成されている、
請求項１８記載のオーディオ・エンコード・システム。
前記複数のエンコード部は、高々単一のオーディオ・チャネルをダウンミックス・チャネルにおいて独立してエンコードするよう動作可能な単一チャネル・エンコード部を含み、前記複数のエンコード部の前記第一および第二の部分集合の少なくとも一方は、前記単一チャネル・エンコード部を含む、請求項１９記載のオーディオ・エンコード・システム。
コンピュータに請求項１ないし７のうちいずれか一項記載の方法を実行させるためのコンピュータ・プログラム。
コンピュータに請求項１３ないし１７のうちいずれか一項記載の方法を実行させるためのコンピュータ・プログラム。