JP6479786B2 - オーディオ信号のパラメトリック再構成 - Google Patents

オーディオ信号のパラメトリック再構成 Download PDF

Info

Publication number
JP6479786B2
JP6479786B2 JP2016524490A JP2016524490A JP6479786B2 JP 6479786 B2 JP6479786 B2 JP 6479786B2 JP 2016524490 A JP2016524490 A JP 2016524490A JP 2016524490 A JP2016524490 A JP 2016524490A JP 6479786 B2 JP6479786 B2 JP 6479786B2
Authority
JP
Japan
Prior art keywords
signal
matrix
upmix
downmix
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016524490A
Other languages
English (en)
Other versions
JP2016537669A5 (ja
JP2016537669A (ja
Inventor
ヴィレモーズ,ラルス
レヒトーネン,ヘイディ−マリア
プルンハーゲン,ヘイコ
ヒルヴォーネン,トニ
Original Assignee
ドルビー・インターナショナル・アーベー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー・インターナショナル・アーベー filed Critical ドルビー・インターナショナル・アーベー
Publication of JP2016537669A publication Critical patent/JP2016537669A/ja
Publication of JP2016537669A5 publication Critical patent/JP2016537669A5/ja
Application granted granted Critical
Publication of JP6479786B2 publication Critical patent/JP6479786B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Stereophonic System (AREA)

Description

関連出願への相互参照
本願は2013年10月21日に出願された米国仮特許出願第61/893,770号;2014年4月3日に出願された米国仮特許出願第61/974,544号;および2014年8月15日に出願された米国仮特許出願第62/037,693号の優先権を主張するものである。各出願の内容はここに参照によってその全体において組み込まれる。
発明の技術分野
本稿に開示される発明は概括的にはオーディオ信号のエンコードおよびデコードに、特にダウンミックス信号および関連するメタデータからのマルチチャネル・オーディオ信号のパラメトリック再構成に関する。
複数のラウドスピーカーを含むオーディオ再生システムは、マルチチャネル・オーディオ信号によって表わされるオーディオ・シーンを再現するためにしばしば使われる。ここで、マルチチャネル・オーディオ信号のそれぞれのチャネルはそれぞれのラウドスピーカーで再生される。マルチチャネル・オーディオ信号はたとえば、複数の音響トランスデューサを介して記録されたものであってもよく、あるいはオーディオ・オーサリング設備によって生成されたものであってもよい。多くの状況において、オーディオ信号を再生設備に伝送するための帯域幅制限および/またはオーディオ信号をコンピュータ・メモリもしくはポータブル記憶装置に記憶するための制限されたスペースがある。必要とされる帯域幅または記憶サイズを低減するよう、オーディオ信号のパラメトリック符号化のためのオーディオ符号化システムが存在する。エンコーダ側では、これらのシステムは典型的にはマルチチャネル・オーディオ信号をダウンミックスして、典型的にはモノ(一チャネル)またはステレオ(二チャネル)ダウンミックスであるダウンミックス信号にし、レベル差および相互相関のようなパラメータによってチャネルの属性を記述するサイド情報を抽出する。次いで、ダウンミックスおよびサイド情報はエンコードされて、デコーダ側に送られる。デコーダ側では、該ダウンミックスから、サイド情報のパラメータの制御のもとで、マルチチャネル・オーディオ信号が再構成される、すなわち近似される。
家庭におけるエンドユーザーをねらいとする台頭しつつあるセグメントを含めマルチチャネル・オーディオ・コンテンツの再生のために利用可能な装置およびシステムの異なる型の幅広い範囲に鑑み、帯域幅要求および/または記憶のための必要とされるメモリ・サイズを低減するおよび/またはデコーダ側での前記マルチチャネル・オーディオ信号の再構成を容易にするよう、マルチチャネル・オーディオ・コンテンツを効率的にエンコードするための新しい、代替的な方法が必要とされている。
下記では、例示的実施形態が、付属の図面を参照して、より詳細に記述される。
ある例示的実施形態に基づく、単一チャネル・ダウンミックス信号および付随するドライおよびウェット・アップミックス・パラメータに基づいてマルチチャネル・オーディオ信号を再構成するためのパラメトリック再構成部の一般化されたブロック図である。 ある例示的実施形態に基づく、図1に描かれたパラメトリック再構成部を有するオーディオ・デコード・システムの一般化されたブロック図である。 ある例示的実施形態に基づく、マルチチャネル・オーディオ信号を、単一チャネル・ダウンミックス信号および付随するメタデータとしてエンコードするためのパラメトリック・エンコード部の一般化されたブロック図である。 ある例示的実施形態に基づく、図3に描かれたパラメトリック・エンコード部を有するオーディオ・エンコード・システムの一般化されたブロック図である。 例示的実施形態に基づく、諸ダウンミックス・チャネルによって11.1チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。 例示的実施形態に基づく、諸ダウンミックス・チャネルによって11.1チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。 例示的実施形態に基づく、諸ダウンミックス・チャネルによって11.1チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。 例示的実施形態に基づく、諸ダウンミックス・チャネルによって11.1チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。 例示的実施形態に基づく、諸ダウンミックス・チャネルによって11.1チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。 例示的実施形態に基づく、諸ダウンミックス・チャネルによって11.1チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。 例示的実施形態に基づく、諸ダウンミックス・チャネルによって11.1チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。 例示的実施形態に基づく、諸ダウンミックス・チャネルによって13.1チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。 例示的実施形態に基づく、諸ダウンミックス・チャネルによって13.1チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。 例示的実施形態に基づく、諸ダウンミックス・チャネルによって22.2チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。 例示的実施形態に基づく、諸ダウンミックス・チャネルによって22.2チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。 例示的実施形態に基づく、諸ダウンミックス・チャネルによって22.2チャネル・オーディオ信号を表現する代替的な方法の一つを示す図である。 すべての図面は概略的であり、一般に、本開示を明快にするために必要な部分を示すのみである。一方、他の部分は省略されたり示唆されるだけであったりすることがある。
本稿での用法では、オーディオ信号は純粋なオーディオ信号、オーディオビジュアル信号またはマルチメディア信号のオーディオ部分またはメタデータと組み合わせたこれらの任意のものでありうる。
本稿での用法では、チャネルは、あらかじめ定義された/固定された空間位置/配向または「左」または「右」のような定義されない空間位置に関連付けられたオーディオ信号である。
〈I.概観〉
第一の側面によれば、例示的実施形態は、オーディオ信号を再構成するためのオーディオ・デコード・システムならびに方法およびコンピュータ・プログラム・プロダクトを提案する。該第一の側面に基づく提案されるデコード・システム、方法およびコンピュータ・プログラム・プロダクトは一般に同じ特徴および利点をもつことがある。
例示的実施形態によれば、Nチャネル・オーディオ信号を再構成するための方法が提供される。ここで、N≧3である。本方法は、単一チャネル・ダウンミックス信号またはマルチチャネル・ダウンミックス信号のあるチャネルであってより多くのオーディオ信号の再構成のためのデータを担持しているものを、関連付けられたドライおよびウェットのアップミックス・パラメータと一緒に受領する段階と;ドライ・アップミックス信号と称される、複数(N個)のチャネルをもつ第一の信号を、前記ダウンミックス信号の線形マッピングとして計算する段階であって、前記ドライ・アップミックス信号の計算の一部として、ドライ・アップミックス係数の集合が前記ダウンミックス信号に適用される、段階と;前記ダウンミックス信号に基づいて(N−1)チャネルの脱相関された信号を生成する段階と;ウェット・アップミックス信号と称される、複数(N個)のチャネルをもつさらなる信号を、前記脱相関された信号の線形マッピングとして計算する段階であって、前記ウェット・アップミックス信号の計算の一部として、ウェット・アップミックス係数の集合が前記脱相関された信号の諸チャネルに適用される、段階と;前記ドライ・アップミックス信号および前記ウェット・アップミックス信号を組み合わせて、再構成されるべき前記Nチャネル・オーディオ信号に対応する多次元の再構成された信号を得る段階とを含む、方法が提供される。本方法はさらに、受領されたドライ・アップミックス・パラメータに基づいてドライ・アップミックス係数の前記集合を決定する段階と;受領されたウェット・アップミックス・パラメータの数より多くの要素をもつ中間行列に値を入れる段階であって、前記受領されたウェット・アップミックス・パラメータおよび該中間行列があらかじめ定義された行列クラスに属することを知ることに基づく、段階と;前記中間行列にあらかじめ定義された行列を乗算することによってウェット・アップミックス係数の前記集合を得る段階とを含み、前記ウェット・アップミックス係数の前記集合は前記乗算から帰結する行列に対応し、前記中間行列の要素の数より多い係数を含む。
この例示的実施形態において、前記Nチャネル・オーディオ信号を再構成するために用いられるウェット・アップミックス係数の数は、受領されるウェット・アップミックス・パラメータの数より多い。前記受領されたウェット・アップミックス・パラメータから前記ウェット・アップミックス係数を取得するために前記あらかじめ定義された行列および前記あらかじめ定義された行列クラスの知識を活用することにより、前記Nチャネル・オーディオ信号の再構成を可能にするために必要とされる情報の量が低減されうる。これは、ダウンミックス信号と一緒にエンコーダ側から伝送されるメタデータの量の削減を許容する。パラメトリック再構成のために必要とされるデータの量を減らすことによって、前記Nチャネル・オーディオ信号のパラメトリック再構成の伝送のための必要とされる帯域幅および/またはそのような表現を記憶するための必要とされるメモリ・サイズが低減されうる。
前記(N−1)チャネルの脱相関された信号は、聴取者によって知覚される再構成されたNチャネル・オーディオ信号の内容の次元性を高めるはたらきをする。前記(N−1)チャネルの脱相関された信号の諸チャネルは、前記単一チャネル・ダウンミックス信号と、少なくとも近似的には同じスペクトルを有していてもよく、あるいは前記単一チャネル・ダウンミックス信号のスペクトルの再スケーリング/規格化されたバージョンに対応するスペクトルを有していてもよく、前記単一チャネル・ダウンミックス信号と一緒に、N個の少なくとも近似的には、互いに無相関なチャネルをなしてもよい。前記Nチャネル・オーディオ信号の忠実な再構成を提供するために、脱相関信号の各チャネルは、好ましくは、聴取者によって前記ダウンミックス信号と同様であると知覚されるような属性をもつ。よって、たとえば白色雑音から、所与のスペクトルをもつ相互に相関していない諸信号を合成することが可能であるが、前記脱相関信号のチャネルは、好ましくは、前記ダウンミックス信号を処理することによって導出される。これはたとえば、前記ダウンミックス信号にそれぞれの全通過フィルタを適用することまたは前記ダウンミックス信号の諸部分を再結合することを含む。それにより、音色のような前記ダウンミックス信号の相対的により微妙な、音響心理学的に条件付けられる属性を含む前記ダウンミックス信号のできるだけ多くの属性、特にローカルに静的な属性を保存するようにするのである。
ウェットおよびドライ・アップミックス信号を組み合わせることは、ウェット・アップミックス信号のそれぞれのチャネルからのオーディオ・コンテンツをドライ・アップミックス信号のそれぞれの対応するチャネルのオーディオ・コンテンツに加えること、たとえばサンプル毎または変換係数毎の加法的混合を含んでいてもよい。
前記あらかじめ定義された行列クラスは、クラス内のすべての行列について有効である、少なくともいくつかの行列要素の既知の属性に関連していてもよい。たとえば、行列要素のいくつかの間のある種の関係またはいくつかの行列要素が0であることなどである。これらの属性の知識は、中間行列における行列要素の総数よりも少数のウェット・アップミックス・パラメータに基づいて中間行列に値を入れることを許容する。デコーダ側は、少なくとも、前記より少数のウェット・アップミックス・パラメータに基づいてすべての行列要素を計算するために必要とする要素の属性および要素間の関係についての知識を有している。
ドライ・アップミックス信号が前記ダウンミックス信号の線形マッピングであるとは、ドライ・アップミックス信号が、ダウンミックス信号に第一の線形変換を適用することによって得られることを意味する。この第一の変換は、一つのチャネルを入力として取り、N個のチャネルを出力として提供する。前記ドライ・アップミックス係数は、この第一の線形変換の定量的属性を定義する係数である。
ウェット・アップミックス信号が前記脱相関信号の線形マッピングであるとは、ウェット・アップミックス信号が、脱相関信号に第二の線形変換を適用することによって得られることを意味する。この第二の変換は、N−1個のチャネルを入力として取り、N個のチャネルを出力として提供する。前記ウェット・アップミックス係数は、この第二の線形変換の定量的属性を定義する係数である。
ある例示的実施形態では、前記ウェット・アップミックス・パラメータを受領する段階は、N(N−1)/2個のウェット・アップミックス・パラメータを受領することを含んでいてもよい。本例示的実施形態では、中間行列に値を入れることは、受領されたN(N−1)/2個のウェット・アップミックス・パラメータおよび中間行列が前記あらかじめ定義された行列クラスに属するという知識に基づいて、(N−1)2個の行列要素についての値を得ることを含んでいてもよい。これは、前記ウェット・アップミックス・パラメータの値をそのまま行列要素として挿入することまたは前記ウェット・アップミックス・パラメータを、前記行列要素のための値を導出するために好適な仕方で処理することを含んでいてもよい。本例示的実施形態では、前記あらかじめ定義された行列はN(N−1)個の要素を含んでいてもよく、ウェット・アップミックス係数の前記集合はN(N−1)個の係数を含んでいてもよい。たとえば、前記ウェット・アップミックス・パラメータを受領することは、高々N(N−1)/2個の独立に割り当て可能なウェット・アップミックス・パラメータを受領することを含んでいてもよく、および/または受領されたウェット・アップミックス・パラメータの数が、前記Nチャネル・オーディオ信号を再構成するために用いられるウェット・アップミックス係数の数の高々半分であってもよい。
ウェット・アップミックス信号を脱相関信号のチャネルの線形マッピングとして形成するときの脱相関信号のあるチャネルからの寄与を省略することは、そのチャネルに値0をもつ係数を適用することに対応することは理解される。すなわち、あるチャネルからの寄与を省略することは、線形マッピングの一部として適用される係数の数に影響しない。
ある例示的実施形態では、中間行列に値を入れることは、受領されたウェット・アップミックス・パラメータを中間行列における要素として用いることを含んでいてもよい。受領されたアップミックス・パラメータがそれ以上処理されることなく中間行列における要素として用いられるので、中間行列に値を入れるためおよびアップミックス係数を得るために必要とされる計算の複雑さが低減されうる。これは、前記Nチャネル・オーディオ信号のより計算効率のよい再構成を許容する。
ある例示的実施形態では、前記ドライ・アップミックス・パラメータを受領する段階は、(N−1)個のドライ・アップミックス・パラメータを受領することを含んでいてもよい。本例示的実施形態では、ドライ・アップミックス係数の前記集合はN個の係数を含んでいてもよく、ドライ・アップミックス係数の前記集合は、受領された(N−1)個のドライ・アップミックス・パラメータに基づき、かつドライ・アップミックス係数の前記集合内の係数間のあらかじめ定義された関係に基づいて決定される。たとえば、前記ドライ・アップミックス・パラメータを受領することは、高々(N−1)個の独立に割り当て可能なドライ・アップミックス・パラメータを受領することを含んでいてもよい。たとえば、ダウンミックス信号は、あらかじめ定義された規則に従って、再構成されるべきNチャネル・オーディオ信号の線形マッピングとして取得可能であってもよく、ドライ・アップミックス係数の間の前記あらかじめ定義された関係は前記あらかじめ定義された規則に基づいていてもよい。
ある例示的実施形態では、前記あらかじめ定義された行列クラスは:下三角行列または上三角行列(ここで、クラス内のすべての行列の既知の属性は、あらかじめ定義された行列要素が0であることを含む);対称行列(ここで、クラス内のすべての行列の既知の属性は、(主対角線のそれぞれの側の)あらかじめ定義された行列要素が等しいことを含む);直交行列と対角行列の積(ここで、クラス内のすべての行列の既知の属性は、あらかじめ定義された行列要素の間の既知の関係を含む)のうちの一つであってもよい。換言すれば、前記あらかじめ定義された行列クラスは、下三角行列のクラス、上三角行列のクラス、対称行列のクラスまたは直交行列と対角行列の積のクラスであってもよい。上記の各クラスの共通の属性は、その次元性が行列要素の総数より低いということである。
ある例示的実施形態では、ダウンミックス信号は、あらかじめ定義された規則に従って、再構成されるべきNチャネル・オーディオ信号の線形マッピングとして取得可能であってもよい。本例示的実施形態では、前記あらかじめ定義された規則は、あらかじめ定義されたダウンミックス動作を定義してもよく、前記あらかじめ定義された行列は、前記あらかじめ定義されたダウンミックス動作のカーネル空間を張るベクトルに基づいていてもよいたとえば、前記あらかじめ定義された行列の行または列は、前記あらかじめ定義されたダウンミックス動作のカーネル空間についての基底、たとえば正規直交基底をなすベクトルであってもよい。
ある例示的実施形態では、前記単一チャネル・ダウンミックス信号を関連付けられたドライおよびウェット・アップミックス・パラメータと一緒に受領することは、前記ダウンミックス信号の時間セグメントまたは時間/周波数タイルを、その時間セグメントまたは時間/周波数タイルと関連付けられたドライおよびウェット・アップミックス・パラメータと一緒に受領することを含んでいてもよい。本例示的実施形態では、前記多次元の再構成された信号は、再構成されるべきNチャネル・オーディオ信号の時間セグメントまたは時間/周波数タイルに対応してもよい。換言すれば、前記Nチャネル・オーディオ信号の再構成は、少なくともいくつかの実施形態では、一時に一つの時間セグメントまたは時間/周波数タイルずつ実行されてもよい。オーディオ・エンコード/デコード・システムは典型的には、たとえば入力オーディオ信号に好適なフィルタバンクを適用することによって、時間‐周波数空間を時間/周波数タイルに分割する。時間/周波数タイルとは、一般に、ある時間区間/セグメントおよびある周波数サブバンドに対応する、時間‐周波数空間の一部を意味する。
例示的実施形態によれば、第一の単一チャネル・ダウンミックス信号および関連付けられたドライおよびウェットのアップミックス・パラメータに基づいてNチャネル・オーディオ信号を再構成するよう構成された第一のパラメトリック再構成部を有するオーディオ・デコード・システムが提供される。ここで、N≧3である。第一のパラメトリック再構成部は、第一のダウンミックス信号を受領して、それに基づいて第一のN−1チャネル脱相関信号を出力するよう構成された第一の脱相関部を有する。第一のパラメトリック再構成部はまた、ドライ・アップミックス・パラメータおよび前記ダウンミックス信号を受領し;前記ドライ・アップミックス・パラメータに基づいてドライ・アップミックス係数の第一の集合を決定し;前記第一のダウンミックス信号をドライ・アップミックス係数の前記第一の集合に基づいて線形にマッピングすることによって計算される第一のドライ・アップミックス信号を出力するよう構成された第一のドライ・アップミックス部をも有する。換言すれば、前記第一のドライ・アップミックス信号のチャネルは、前記単一チャネル・ダウンミックス信号にそれぞれの係数を乗算することによって得られ、該係数は、前記ドライ・アップミックス係数自身であってもよいし、あるいは前記ドライ・アップミックス係数を介して制御可能な係数であってもよい。前記第一のパラメトリック再構成部はさらに、ウェット・アップミックス・パラメータおよび前記第一の脱相関信号を受領する段階と;受領されたウェット・アップミックス・パラメータの数より多くの要素をもつ第一の中間行列に値を入れる段階であって、受領されたウェット・アップミックス・パラメータおよび前記第一の中間行列が第一のあらかじめ定義された行列クラスに属していると知っていることに基づく、すなわち前記あらかじめ定義された行列クラスにおけるすべての行列について成り立つとわかっているある種の行列要素の属性を用いることによる、段階と;前記第一の中間行列に第一のあらかじめ定義された行列を乗算することによってウェット・アップミックス係数の第一の集合を得る段階であって、前記ウェット・アップミックス係数の前記集合は前記乗算から帰結する行列に対応し、前記第一の中間行列の要素の数より多い係数を含む、段階と;前記第一の脱相関信号をウェット・アップミックス係数の前記第一の集合に従って線形にマッピングすることによって、すなわち前記ウェット・アップミックス係数を用いて前記脱相関信号のチャネルの線形結合を形成することによって計算された第一のウェット・アップミックス信号を出力する段階とを実行するよう構成されている第一のウェット・アップミックス部を有している。第一のパラメトリック再構成部はまた、前記第一のドライ・アップミックス信号および前記第一のウェット・アップミックス信号を受領し、これらの信号を組み合わせて、再構成されるべき前記N次元オーディオ信号に対応する第一の多次元の再構成された信号を得るよう構成された第一の組み合わせ部をも有する。
ある例示的実施形態では、オーディオ・デコード・システムは、前記第一のパラメトリック再構成部とは独立に動作可能であり、第二の単一チャネル・ダウンミックス信号および関連付けられたドライおよびウェットのアップミックス・パラメータに基づいてN2チャネル・オーディオ信号を再構成するよう構成された第二のパラメトリック再構成部を有していてもよい。ここで、N2≧2である。たとえば、N2=2またはN2≧3が成り立ってもよい。本例示的実施形態では、第二のパラメトリック再構成部は、第二の脱相関部、第二のドライ・アップミックス部、第二のウェット・アップミックス部および第二の組み合わせ部を有していてもよく、第二のパラメトリック再構成部のこれらの部は、第一のパラメトリック再構成部の対応する各部と類似の構成であってもよい。本例示的実施形態では、第二のウェット・アップミックス部は、第二のあらかじめ定義された行列クラスに属する第二の中間行列および第二のあらかじめ定義された行列を用いるよう構成されていてもよい。第二のあらかじめ定義された行列クラスおよび第二のあらかじめ定義された行列は、第一のあらかじめ定義された行列クラスおよび第一のあらかじめ定義された行列と異なっていても、あるいは等しくてもよい。
ある例示的実施形態では、オーディオ・デコード・システムは、複数のダウンミックス・チャネルおよび関連付けられたドライおよびウェット・アップミックス・パラメータに基づいてマルチチャネル・オーディオ信号を再構成するよう適応されていてもよい。本例示的実施形態では、オーディオ・デコード・システムは:それぞれのダウンミックス・チャネルおよびそれぞれの関連付けられたドライおよびウェットのアップミックス・パラメータに基づいてオーディオ信号チャネルのそれぞれの集合を独立して再構成するよう動作可能なパラメトリック再構成部を含む複数の再構成部と;前記マルチチャネル・オーディオ信号のチャネルの、それぞれのダウンミックス・チャネルおよび少なくとも該ダウンミックス・チャネルのいくつかについてはそれぞれの関連付けられたドライおよびウェット・アップミックス・パラメータによって表わされるチャネルの諸集合への分割に対応する、前記マルチチャネル・オーディオ信号の符号化フォーマットを示す信号伝達を受領するよう構成された制御部とを有していてもよい。本例示的実施形態では、符号化フォーマットはさらに、それぞれのウェット・アップミックス・パラメータに基づいてチャネルの前記それぞれの集合のうち少なくともいくつかの集合に関連付けられたウェット・アップミックス係数を得るためのあらかじめ定義された行列の集合にさらに対応してもよい。任意的に、前記符号化フォーマットはさらに、それぞれの中間行列がウェット・アップミックス・パラメータの前記それぞれの集合に基づいてどのように値を入れられるべきかを示すあらかじめ定義された行列クラスの集合に対応していてもよい。
本例示的実施形態では、前記デコード・システムは、前記受領された信号伝達が第一の符号化フォーマットを示すことに応答して、前記複数の再構成部の第一の部分集合を使って前記マルチチャネル・オーディオ信号を再構成するよう構成されていてもよい。本例示的実施形態では、前記デコード・システムは、前記受領された信号伝達が第二の符号化フォーマットを示すことに応答して、前記複数の再構成部の第二の部分集合を使って前記マルチチャネル・オーディオ信号を再構成するよう構成されていてもよい。前記再構成部の前記第一および第二の部分集合の少なくとも一方は、前記第一のパラメトリック再構成部を含んでいてもよい。
前記マルチチャネル・オーディオ信号のオーディオ・コンテンツの組成、エンコーダ側からデコーダ側への伝送のための利用可能な帯域幅、聴取者によって知覚される要求される再生品質および/またはデコーダ側で再構成されたオーディオ信号の要求される忠実度に依存して、最も適切な符号化フォーマットは、異なる応用および/または時間期間の間で異なることがありうる。前記マルチチャネル・オーディオ信号について複数の符号化フォーマットをサポートすることによって、本例示的実施形態におけるオーディオ・デコード・システムは、エンコーダ側が、現在の状況により特定的に好適である符号化フォーマットを用いることを許容する。
ある例示的実施形態では、前記複数の再構成部は、高々単一のオーディオ・チャネルがエンコードされたダウンミックス・チャネルに基づいて単一のオーディオ・チャネルを独立して再構成するよう動作可能な単一チャネル再構成部を含んでいてもよい。本例示的実施形態では、再構成部の前記第一および第二の部分集合の少なくとも一方は、前記単一チャネル再構成部を有していてもよい。前記マルチチャネル・オーディオ信号のいくつかのチャネルは、聴取者によって知覚される前記マルチチャネル・オーディオ信号の全体的な印象にとって特に重要でありうる。前記単一チャネル再構成部を用いて、他がチャネルは他の諸ダウンミックス・チャネルにおいて一緒にパラメトリックにエンコードされる一方、たとえばそのようなチャネルをその独自のダウンミックスにおいて別個にエンコードすることによって、再構成されるマルチチャネル・オーディオ信号の忠実度が高められてもよい。いくつかの例示的実施形態では、前記マルチチャネル・オーディオ信号の一つのチャネルのオーディオ・コンテンツは、前記マルチチャネル・オーディオ信号の他のチャネルのオーディオ・コンテンツとは異なる型であってもよく、再構成されるマルチチャネル・オーディオ信号の忠実度は、そのチャネルがそれ自身のダウンミックス・チャネルにおいて別個にエンコードされる符号化フォーマットを用いることによって、向上されうる。
ある例示的実施形態では、前記第一の符号化フォーマットは、前記第二の符号化フォーマットより、少数のダウンミックス・チャネルからの前記マルチチャネル・オーディオ信号の再構成に対応してもよい。より少数のダウンミックス・チャネルを用いることによって、エンコーダ側からデコーダ側への伝送のための要求される帯域幅が低減されうる。より多数のダウンミックス・チャネルを用いることによって、再構成されるマルチチャネル・オーディオ信号の忠実度および/または知覚されたオーディオ品質は増大されてもよい。
第二の側面によれば、例示的実施形態は、マルチチャネル・オーディオ信号をエンコードするためのオーディオ・エンコード・システムならびに方法およびコンピュータ・プログラム・プロダクトを提案する。該第二の側面に基づく提案されるエンコード・システム、方法およびコンピュータ・プログラム・プロダクトは一般に同じ特徴および利点を共有することがある。さらに、第一の側面に基づくデコード・システム、方法およびコンピュータ・プログラム・プロダクトの特徴について上記で呈示した利点は、一般に、第二の側面に基づくエンコード・システム、方法およびコンピュータ・プログラム・プロダクトの対応する特徴についても有効でありうる。
例示的実施形態によれば、Nチャネル・オーディオ信号を単一チャネル・ダウンミックス信号およびメタデータとしてエンコードする方法が提供される。前記メタデータは、該ダウンミックス信号および該ダウンミックス信号に基づいて決定される(N−1)チャネルの脱相関された信号からのオーディオ信号のパラメトリック再構成のために好適なものである。ここで、N≧3である。本方法は、前記オーディオ信号を受領する段階と;あらかじめ定義された規則に従って、前記単一チャネル・ダウンミックス信号を前記オーディオ信号の線形マッピングとして計算する段階と;前記オーディオ信号を近似する前記ダウンミックス信号の線形マッピングを定義するためのドライ・アップミックス係数の集合を、たとえば前記ダウンミックス信号のみが再構成のために利用可能であるという想定の下に最小平均平方誤差近似を介して決定する段階とを含む。本方法はさらに、受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似されるオーディオ信号の共分散との間の差に基づいて中間行列を決定する段階を含む。ここで、前記中間行列は、あらかじめ定義された行列を乗算したとき、前記オーディオ信号のパラメトリック再構成の一部として前記脱相関信号の線形マッピングを定義するウェット・アップミックス係数の集合に対応する。ウェット・アップミックス係数の前記集合は、前記中間行列の要素の数より多くの係数を含む。本方法はさらに、ドライ・アップミックス係数の前記集合が導出可能であるもとになるドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に前記ダウンミックス信号を出力する段階を含む。ここで、前記中間行列は出力ウェット・アップミックス・パラメータの数より多くの要素をもつ。前記中間行列は、該中間行列があらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義される。
デコーダ側での前記オーディオ信号のパラメトリック再構成コピーは、一つの寄与として、前記ダウンミックス信号の前記線形マッピングによって形成されるドライ・アップミックス信号と、さらなる寄与として、前記脱相関信号の前記線形マッピングによって形成されたウェット・アップミックス信号とを含む。ドライ・アップミックス係数の前記集合は前記ダウンミックス信号の前記線形マッピングを定義し、ウェット・アップミックス係数の前記集合は前記脱相関信号の前記線形マッピングを定義する。前記あらかじめ定義された行列および前記あらかじめ定義された行列クラスに基づいてウェット・アップミックス係数が導出可能であるもとになる、ウェット・アップミックス係数の数より少数のウェット・アップミックス・パラメータを出力することによって、Nチャネル・オーディオ信号の再構成を可能にするためにデコーダ側に送られる情報の量が低減されうる。パラメトリック再構成のために必要とされるデータの量を低減することによって、Nチャネル・オーディオ信号のパラメトリック表現の伝送のための要求される帯域幅および/またはそのような表現を記憶するための要求されるメモリ・サイズが低減されうる。
中間行列は、受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似されるオーディオ信号の共分散との間の差に基づいて、たとえば、前記ダウンミックス信号の前記線形マッピングによって近似されるオーディオ信号の共分散を補足するための前記脱相関信号の前記線形マッピングによって得られる前記信号の共分散について、決定されてもよい。
ある例示的実施形態では、前記中間行列を決定する段階は、ウェット・アップミックス係数の前記集合によって定義される、前記脱相関信号の前記線形マッピングによって得られる前記信号の共分散が、受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似されるオーディオ信号の共分散との間の差を近似するまたは該差と実質的に一致するよう、前記中間行列を決定することを含んでいてもよい。換言すれば、前記中間行列は、前記ダウンミックス信号の前記線形マッピングによって形成されるドライ・アップミックス信号および前記脱相関信号の前記線形マッピングによって形成されるウェット・アップミックス信号の和として得られるオーディオ信号の再構成コピーが、完全にまたは少なくとも近似的に、受領された前記オーディオ信号の共分散を再現するよう、決定されてもよい。
ある例示的実施形態では、前記ウェット・アップミックス・パラメータを出力する段階は、高々N(N−1)/2個の独立して割り当て可能なウェット・アップミックス・パラメータを出力することを含んでいてもよい。本例示的実施形態では、中間行列は(N−1)2個の行列要素を有していてもよく、前記中間行列が前記あらかじめ定義された行列クラスに属することが与えられれば、前記出力ウェット・アップミックス・パラメータによって一意的に定義されてもよい。本例示的実施形態では、ウェット・アップミックス係数の前記集合はN(N−1)個の係数を含んでいてもよい。
ある例示的実施形態では、ドライ・アップミックス係数の前記集合はN個の係数を含んでいてもよい。本例示的実施形態では、ドライ・アップミックス・パラメータを出力することは、高々(N−1)個のドライ・アップミックス・パラメータを出力することを含んでいてもよく、ドライ・アップミックス係数の前記集合は、(N−1)個のドライ・アップミックス・パラメータから、前記あらかじめ定義された規則を使って導出可能であってもよい。
ある例示的実施形態では、ドライ・アップミックス係数の決定された集合は、前記オーディオ信号の最小平均平方誤差近似に対応する前記ダウンミックス信号の線形マッピングを定義してもよい。すなわち、前記ダウンミックス信号の線形マッピングの集合の間で、ドライ・アップミックス係数の決定された集合は、最小平均平方の意味で前記オーディオ信号を最もよく近似する線形マッピングを定義しうる。
例示的実施形態によれば、Nチャネル・オーディオ信号を単一チャネル・ダウンミックス信号およびメタデータとしてエンコードするよう構成されたパラメトリック・エンコード部を有するオーディオ・エンコード・システムが提供される。前記メタデータは、該ダウンミックス信号および該ダウンミックス信号に基づいて決定される(N−1)チャネルの脱相関された信号からのオーディオ信号のパラメトリック再構成のために好適なものである。ここで、N≧3である。パラメトリック・エンコード部は:前記オーディオ信号を受領し、あらかじめ定義された規則に従って、前記単一チャネル・ダウンミックス信号を前記オーディオ信号の線形マッピングとして計算するよう構成されたダウンミックス部と;前記オーディオ信号を近似する前記ダウンミックス信号の線形マッピングを定義するためのドライ・アップミックス係数の集合を決定するよう構成された第一の解析部とを有する。パラメトリック・エンコード部はさらに、受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似されるオーディオ信号の共分散との間の差に基づいて中間行列を決定するよう構成されている第二の解析部を有する。ここで、前記中間行列は、あらかじめ定義された行列を乗算したとき、前記オーディオ信号のパラメトリック再構成の一部として前記脱相関信号の線形マッピングを定義するウェット・アップミックス係数の集合に対応する。ウェット・アップミックス係数の前記集合は、前記中間行列の要素の数より多くの係数を含む。パラメトリック・エンコード部はさらに、ドライ・アップミックス係数の前記集合が導出可能であるもとになるドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に前記ダウンミックス信号を出力するよう構成される。ここで、前記中間行列は出力ウェット・アップミックス・パラメータの数より多くの要素をもつ。前記中間行列は、該中間行列があらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義される。
ある例示的実施形態では、本オーディオ・エンコード・システムは、複数のダウンミックス・チャネルおよび付随するドライおよびウェット・アップミックス・パラメータの形でマルチチャネル・オーディオ信号の表現を提供するよう構成されてもよい。本例示的実施形態では、オーディオ・エンコード・システムは:それぞれのダウンミックス・チャネルおよびそれぞれの付随したアップミックス・パラメータを、オーディオ信号チャネルのそれぞれの集合に基づいて独立して計算するよう動作可能なパラメトリック・エンコード部を含む複数のエンコード部を有していてもよい。本例示的実施形態では、本オーディオ・エンコード・システムはさらに、前記マルチチャネル・オーディオ信号のチャネルの、それぞれのダウンミックス・チャネルおよび少なくとも該ダウンミックス・チャネルの少なくともいくつかについてはそれぞれの関連付けられたドライおよびウェット・アップミックス・パラメータによって表わされるチャネルの諸集合への分割に対応する、前記マルチチャネル・オーディオ信号の符号化フォーマットを決定するよう構成された制御部を有していてもよい。本例示的実施形態では、符号化フォーマットはさらに、それぞれのダウンミックス・チャネルのうちの少なくともいくつかを計算するためのあらかじめ定義された規則の集合に対応してもよい。本例示的実施形態では、本オーディオ・エンコード・システムは、決定された符号化フォーマットが第一の符号化フォーマットであることに応答して、前記複数のエンコード部の第一の部分集合を使って前記マルチチャネル・オーディオ信号をエンコードするよう構成されていてもよい。本例示的実施形態では、本オーディオ・エンコード・システムは、決定された符号化フォーマットが第二の符号化フォーマットであることに応答して、前記複数のエンコード部の第二の部分集合を使って前記マルチチャネル・オーディオ信号をエンコードするよう構成されていてもよい。前記エンコード部の前記第一および第二の部分集合の少なくとも一方は、前記第一のパラメトリック・エンコード部を含んでいてもよい。本例示的実施形態では、制御部は、たとえば、符号化フォーマットを、前記マルチチャネル・オーディオ信号のエンコードされたバージョンをデコーダ側に送信するための利用可能な帯域幅に基づいて、前記マルチチャネル・オーディオ信号のチャネルのオーディオ・コンテンツに基づいておよび/または所望される符号化フォーマットを示す入力信号に基づいて、符号化フォーマットを決定してもよい。
ある例示的実施形態では、前記複数のエンコード部は、高々単一のオーディオ・チャネルをダウンミックス・チャネルにおいて独立してエンコードするよう動作可能な単一チャネル・エンコード部を含んでいてもよい。前記エンコード部の前記第一および第二の部分集合の少なくとも一方は、前記単一チャネル・エンコード部を含んでいてもよい。
例示的実施形態によれば、第一および第二の側面内の諸方法のいずれかを実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクトが提供される。
例示的実施形態によれば、第一および第二の側面の方法、エンコード・システム、デコード・システムおよびコンピュータ・プログラム・プロダクトの任意のものにおいて、N=3またはN=4が成り立ってもよい。
さらなる例示的実施形態が従属請求項において定義される。例示的実施形態は、たとえ互いに異なる請求項に記載されるものであっても特徴のすべての組み合わせを含むことが注意される。
〈II.例示的実施形態〉
図3および図4を参照して記述されるエンコーダ側では、Nチャネル・オーディオ信号X=[x1…xN]Tの線形マッピングとして、
Figure 0006479786
に従って単一チャネル・ダウンミックス信号Yが計算される。ここで、dn、n=1,…,Nはダウンミックス行列Dによって表わされるダウンミックス係数である。図1および図2を参照して記述されるデコーダ側では、前記Nチャネル・オーディオ信号Xのパラメトリック再構成が
Figure 0006479786
に従って実行される。ここで、cn、n=1,…,Nは行列ドライ・アップミックス行列Cによって表わされるドライ・アップミックス係数であり、pn,k、n=1,…,N、k=1,…,N−1はウェット・アップミックス行列Pによって表わされるウェット・アップミックス係数であり、zk、k=1,…,N−1は、ダウンミックス信号Yに基づいて生成された(N−1)チャネル脱相関信号Zのチャネルである。各オーディオ信号のチャネルが行として表わされるとすると、もとのオーディオ信号Xの共分散行列はR=XXTとして表わされてもよく、再構成されたオーディオ信号〔^付きのX〕の共分散行列は
Figure 0006479786
として表わされてもよい。オーディオ信号が複素数値の変換係数を有する行として表わされる場合には、X*は行列Xの複素共役転置であるとして、XX*の実部がたとえばXXTの代わりに考えられてもよいことを注意しておく。
もとのオーディオ信号Xの忠実な再構成を提供するために、式(2)によって与えられる再構成が完全な共分散を再現することが有利でありうる。すなわち、
Figure 0006479786
となるようなドライおよびウェット・アップミックス行列CおよびPを用いることが有利でありうる。
一つのアプローチは、通常の式
CYYT=XYT (4)
を解くことによって、まず最小二乗の意味で可能な最良の「ドライ」アップミックス
Figure 0006479786
を与えるドライ・アップミックス行列Cを見出すことである。式(4)の解となる行列Cによる
Figure 0006479786
については、
Figure 0006479786
が成り立つ。脱相関信号Zのチャネルが互いに無相関であり、みな単一チャネル・ダウンミックス信号Yのエネルギーに等しい同じエネルギー‖Y‖2をもつとすると、正定値の欠損共分散ΔRは
ΔR=PPT‖Y‖2 (6)
と因子分解できる。
式(4)の解となるドライ・アップミックス行列Cおよび式(6)の解となるウェット・アップミックス行列Pを用いることによって、式(3)に従って完全な共分散が再現されうる。式(1)および(4)はDCYYT=YYTであることを含意し、それにより非縮退ダウンミックス行列Dについては
Figure 0006479786
となる。式(5)および(7)は、D(X0−X)=DCY−Y=0および
Figure 0006479786
を含意する。よって、欠損共分散ΔRは階数N−1をもち、実際、N−1個の互いに無相関なチャネルをもつ脱相関信号Zを用いることによって提供されうる。式(6)および(8)はDP=0であることを含意し、よって、式(6)を解くウェット・アップミックス行列Pの列がダウンミックス行列Dのカーネル空間を張るベクトルから構築できる。したがって、好適なウェット・アップミックス行列Pを見出すための計算は、より低次元の空間に移されてもよい。
Vはダウンミックス行列Dのカーネル空間、すなわちDv=0となるベクトルvの線形空間についての正規直交基底を含むサイズN(N−1)の行列であるとする。N=2、N=3、N=4についてのそのようなあらかじめ定義された行列Vの例はそれぞれ
Figure 0006479786
Vによって与えられる基底において、欠損共分散はRv=VT(ΔR)Vと表わすことができる。したがって、式(6)を解くウェット・アップミックス行列Pを見出すために、まず、Rv=HHTを解くことによって行列Hを見出し、次いでPをP=VH/‖Y‖として得てもよい。ここで、‖Y‖は単一チャネル・ダウンミックス信号Yのエネルギーの平方根である。他の好適なアップミックス行列PはP=VHO/‖Y‖として得てもよい。ここで、Oは直交行列である。あるいはまた、欠損共分散Rvを単一チャネル・ダウンミックス信号Yのエネルギー‖Y‖2によって再スケーリングし、代わりに、H=HR‖Y‖であるとして式
Figure 0006479786
を解いて、Pを
Figure 0006479786
として得てもよい。
HRの要素が量子化され、所望される出力が無音チャネルをもつときは、上記のあらかじめ定義された行列Vの属性は便利でないことがある。例として、N=3について、(9)の二番目の行列についてのよりよい選択は次のようなものであろう。
Figure 0006479786
幸い、行列Vの列がペア毎に直交であるという要求は、これらの列が線形独立である限り、落とすことができる。すると、ΔR=VRvVTへの所望される解Rvは、Rv=WT(ΔR)Wによって得られ、ここで
Figure 0006479786
はVの擬似逆行列である。
行列Rvはサイズ(N−1)2の準正定値行列であり、式(10)への解を見出すにはいくつかのアプローチがあり、それぞれ次元N(N−1)/2の行列クラス内の解につながる。次元N(N−1)/2とはすなわち、行列がN(N−1)/2個の行列要素によって一意的に定義されるということである。解はたとえば、
a.コレスキー分解(下三角行列HRにつながる);
b.正の平方根(対称的な準正定値のHRにつながる);または
c.ポーラー(polar)(Oは直交行列、Λは対角行列であるとして、HR=OΛの形のHNにつながる)
を用いることによって得られてもよい。
さらに、Λは対角行列、H0はすべての対角要素が1に等しいとして、オプションa)およびb)の、HRがHR=ΛH0として表わされうる規格化バージョンがある。上記の代替a,b,cは、異なる行列クラス、すなわち下三角行列、対称行列および対角行列と直交行列の積における解HRを与える。HRが属する行列クラスがデコーダ側において知られている場合には、すなわち、HRがあらかじめ定義された行列クラスに属することがわかっている場合には、たとえば上記の代替a、b、cの任意のものに従って、HRはその要素のN(N−1)/2個のみに基づいて値を入れられてもよい。行列Vもデコーダ側で知られている場合には、たとえば、Vが(9)で与えられる行列のうちの一つであることがわかっている場合には、式(2)に基づく再構成のために必要とされるウェット・アップミックス行列Pは、式(11)を介して得られてもよい。
図3は、ある例示的実施形態に基づく、パラメトリック・エンコード部300の一般化されたブロック図である。パラメトリック・エンコード部300は、Nチャネル・オーディオ信号Xを単一チャネル・ダウンミックス信号Yおよびメタデータとしてエンコードするよう構成されている。前記メタデータは、式(2)に基づくオーディオ信号Xのパラメトリック再構成のために好適なものである。パラメトリック・エンコード部300は、前記オーディオ信号Xを受領し、あらかじめ定義された規則に従って、前記単一チャネル・ダウンミックス信号Yを前記オーディオ信号Xの線形マッピングとして計算するよう構成されたダウンミックス部301を有する。本例示的実施形態では、ダウンミックス部301は、ダウンミックス信号Yを式(1)に従って計算する。ここで、ダウンミックス行列Dはあらかじめ定義されており、前記あらかじめ定義された規則に対応する。第一の解析部302は、前記オーディオ信号Xを近似する前記ダウンミックス信号Yの線形マッピングを定義するためのドライ・アップミックス行列Cによって表わされるドライ・アップミックス係数の集合を決定する。ダウンミックス信号Yのこの線形マッピングは式(2)ではCYによって表わされている。本例示的実施形態では、N個のドライ・アップミックス係数Cは式(4)に従って、ダウンミックス信号Yの線形マッピングCYがオーディオ信号Xの最小平均平方近似に対応するよう決定される。第二の解析部303は、受領された前記オーディオ信号Xの共分散行列と前記ダウンミックス信号Yの前記線形マッピングによって近似されるオーディオ信号CYの共分散行列との間の差に基づいて中間行列HRを決定する。本例示的実施形態では、これらの共分散行列は、それぞれ第一および第二の処理部304、305によって計算され、次いで第二の解析部303に与えられる。本例示的実施形態において、前記中間行列HRは、式(10)を解くための上記のアプローチbに従って決定され、対称的な中間行列HRにつながる。式(1)および(11)において示されるように、中間行列HRは、あらかじめ定義された行列Vを乗算したとき、ウェット・アップミックス・パラメータPの集合を介して、デコーダ側における前記オーディオ信号Xのパラメトリック再構成の一部として脱相関信号Zの線形マッピングPZを定義する。本例示的実施形態では、中間行列VはN=3の場合については(9)における二番目の行列であり、N=4の場合については(9)における三番目の行列である。パラメトリック・エンコード部300はダウンミックス信号Yをドライ・アップミックス・パラメータ
Figure 0006479786
およびウェット・アップミックス・パラメータ
Figure 0006479786
と一緒に出力する。本例示的実施形態では、N個のドライ・アップミックス係数CのうちのN−1個が前記ドライ・アップミックス・パラメータ〔チルダ付きのC〕であり、残りの一つのドライ・アップミックス係数は、前記あらかじめ定義されたダウンミックス行列Dが既知であれば、ドライ・アップミックス・パラメータから式(7)を介して導出可能である。中間行列HRが対称行列のクラスに属するので、その(N−1)2個の要素のうちのN(N−1)/2個によって一意的に定義される。本例示的実施形態において、中間行列HRの要素のN(N−1)/2個はウェット・アップミックス・パラメータ〔チルダ付きのP〕であり、それから、対称行列であることを知っているので、中間行列HRの残りが導出可能である。
図4は、ある例示的実施形態に基づく、図3を参照して述べたパラメトリック・エンコード部300を有するオーディオ・エンコード・システム400の一般化されたブロック図である。本例示的実施形態では、たとえば一つまたは複数の音響トランスデューサ401によって記録されたまたはオーディオ・オーサリング設備401によって生成されたオーディオ・コンテンツが前記Nチャネル・オーディオ信号Xの形で提供される。直交ミラー・フィルタ(QMF)解析部402は、時間/周波数タイルの形でのオーディオ信号Xのパラメトリック・エンコード部300による処理のために、オーディオ信号Xを時間セグメントごとにQMF領域に変換する。パラメトリック・エンコード部300によって出力されるダウンミックス信号Yは、QMF合成部403によってQMF領域から変換し戻され、変換部404によって修正離散コサイン変換(MDCT)領域に変換される。量子化部405および406は、それぞれドライ・アップミックス・パラメータ〔チルダ付きのC〕およびウェット・アップミックス・パラメータ〔チルダ付きのP〕を量子化する。たとえば、きざみサイズ0.1または0.2(無次元)をもつ一様量子化が用いられてもよく、それに、ハフマン符号化の形のエントロピー符号化が続いてもよい。きざみサイズ0.2をもつ、より粗い量子化は、たとえば、伝送帯域幅を節約するために用いられてもよく、きざみサイズ0.1をもつ、より細かい量子化は、デコーダ側での再構成の忠実度を改善するために用いられてもよい。次いで、MDCT変換されたダウンミックス信号Yおよび量子化されたドライ・アップミックス・パラメータ〔チルダ付きのC〕およびウェット・アップミックス・パラメータ〔チルダ付きのP〕は、デコーダ側への伝送のために、マルチプレクサ407によってビットストリームBに組み合わされる。オーディオ・エンコード・システム400は、ダウンミックス信号Yがマルチプレクサ407に与えられる前に、ドルビー・デジタルまたはMPEG AACのような知覚的オーディオ・コーデックを使ってダウンミックス信号Yをエンコードするよう構成されたコア・エンコーダ(図4には示さず)をも有していてもよい。
図1は、単一チャネル・ダウンミックス信号Yおよび付随するドライ・アップミックス・パラメータ〔チルダ付きのC〕およびウェット・アップミックス・パラメータ〔チルダ付きのP〕に基づいてNチャネル・オーディオ信号Xを再構成するよう構成された、ある例示的実施形態に基づくパラメトリック再構成部100の一般化されたブロック図である。パラメトリック再構成部100は、式(2)に従って、すなわちドライ・アップミックス・パラメータCおよびウェット・アップミックス・パラメータPを使って再構成を実行するよう適応されている。しかしながら、ドライ・アップミックス・パラメータCおよびウェット・アップミックス・パラメータP自身を受領するのではなく、ドライ・アップミックス・パラメータCおよびウェット・アップミックス・パラメータPが導出可能となるもとになるドライ・アップミックス・パラメータ〔チルダ付きのC〕およびウェット・アップミックス・パラメータ〔チルダ付きのP〕が受領される。脱相関部101は、ダウンミックス信号Yを受領して、それに基づいて(N−1)チャネル脱相関信号Z=[z1…zN-1]Tを出力する。本例示的実施形態では、脱相関信号Zは、ダウンミックス信号Yを処理することによって導出される。該処理は、ダウンミックス信号Yにそれぞれの全通過フィルタを適用して、ダウンミックス信号Yに相関しておらず、ダウンミックス信号Yのオーディオ・コンテンツとスペクトル的に同様であり聴取者によっても同様であると知覚されるオーディオ・コンテンツをもつチャネルを提供することによることを含む。前記(N−1)チャネルの脱相関された信号Zは、聴取者によって知覚されるNチャネル・オーディオ信号Xの再構成されたバージョン〔^付きのX〕の次元性を高めるはたらきをする。本例示的実施形態では、前記脱相関信号Zの諸チャネルは、前記単一チャネル・ダウンミックス信号Yと少なくとも近似的には同じスペクトルを有し、前記単一チャネル・ダウンミックス信号Yと一緒に、N個の少なくとも近似的には互いに無相関なチャネルをなす。ドライ・アップミックス部102は、ドライ・アップミックス・パラメータ〔チルダ付きのC〕およびダウンミックス信号Yを受領する。本例示的実施形態では、ドライ・アップミックス・パラメータ〔チルダ付きのC〕はN個のドライ・アップミックス係数Cの最初のN−1個と一致し、残りのドライ・アップミックス係数は、式(7)によって与えられるドライ・アップミックス係数Cの間のあらかじめ定義された関係に基づいて決定される。ドライ・アップミックス部102は、ダウンミックス信号Yを、ドライ・アップミックス係数Cの集合に従って線形にマッピングすることによって計算され、式(2)ではCYによって表わされているドライ・アップミックス信号を出力する。ウェット・アップミックス部103は、ウェット・アップミックス・パラメータ〔チルダ付きのP〕および脱相関信号Zを受領する。本例示的実施形態では、ウェット・アップミックス・パラメータ〔チルダ付きのP〕は、式(10)に従ってエンコーダ側で決定された中間行列HRのN(N−1)/2個の要素である。本例示的実施形態では、ウェット・アップミックス部103は、中間行列HRがあらかじめ定義された行列クラスに属すること、すなわち対称的であることを知って、行列の要素間の対応する関係を活用して、中間行列HRの残りの要素の値を入れる。次いで、ウェット・アップミックス部103は式(11)を用いることによって、すなわち、中間行列HRにあらかじめ定義された行列V、すなわちN=3の場合については(9)における二番目の行列、N=4の場合については(9)における三番目の行列、を乗算することによって、ウェット・アップミックス係数Pの集合を得る。よって、N(N−1)個のウェット・アップミックス係数Pは、受領されたN(N−1)/2個の独立して割り当て可能なウェット・アップミックス・パラメータ〔チルダ付きのP〕から導出される。ウェット・アップミックス部103は、前記脱相関信号Zをウェット・アップミックス係数の前記集合Pに従って線形にマッピングすることによって計算され、式(2)ではPZによって表わされるウェット・アップミックス信号を出力する。組み合わせ部104は、ドライ・アップミックス信号CYおよびウェット・アップミックス信号PZを受領し、これらの信号を組み合わせて、再構成されるべき前記N次元オーディオ信号Xに対応する第一の多次元の再構成された信号〔^付きのX〕を得る。本例示的実施形態では、組み合わせ部104は、式(2)に従って、ドライ・アップミックス信号CYのそれぞれのチャネルのオーディオ・コンテンツを、ウェット・アップミックス信号PZのそれぞれのチャネルと組み合わせることによって、再構成された信号〔^付きのX〕のそれぞれのチャネルを得る。
図2は、ある例示的実施形態に基づくオーディオ・デコード・システム200の一般化されたブロック図である。オーディオ・デコード・システム200は、図1を参照して述べたパラメトリック再構成部100を有する。たとえばデマルチプレクサを含む受領部201は、図4を参照して述べたオーディオ・エンコード・システム400から伝送されたビットストリームBを受領し、ビットストリームBからダウンミックス信号Yおよび関連するドライ・アップミックス・パラメータ〔チルダ付きのC〕およびウェット・アップミックス・パラメータ〔チルダ付きのP〕を抽出する。ダウンミックス信号Yがドルビー・デジタルまたはMPEG AACのような知覚的オーディオ・コーデックを使ってビットストリームBにエンコードされている場合には、オーディオ・デコード・システム200は、ビットストリームBから抽出されるときにダウンミックス信号Yをデコードするよう構成されたコア・デコーダ(図2には示さず)を有していてもよい。変換部202は、逆MDCTを実行することによってダウンミックス信号Yを変換し、QMF分解部203は、時間/周波数タイルの形のダウンミックス信号Yのパラメトリック再構成部100による処理のために、ダウンミックス信号YをQMF領域に変換する。量子化解除部204および205は、ドライ・アップミックス・パラメータ〔チルダ付きのC〕およびウェット・アップミックス・パラメータ〔チルダ付きのP〕を、パラメトリック再構成部100に供給する前に、たとえばエントロピー符号化されたフォーマットから、量子化解除する。図4を参照して述べたように、量子化は、二つの異なるきざみサイズ、たとえば0.1または0.2のうちの一方を用いて実行されたものであってもよい。用いられた実際のきざみサイズは、あらかじめ定義されていてもよく、あるいはエンコーダ側からオーディオ・デコード・システム200に、たとえばビットストリームBを介して、信号伝達されてもよい。いくつかの例示的実施形態では、ドライ・アップミックス・パラメータ〔チルダ付きのC〕およびウェット・アップミックス・パラメータ〔チルダ付きのP〕からそれぞれドライ・アップミックス係数Cおよびウェット・アップミックス係数Pが、それぞれの量子化解除部204および205においてすでに導出されてもよい。これらの量子化解除部は任意的に、それぞれドライ・アップミックス部102およびウェット・アップミックス部103の一部と見なされてもよい。本例示的実施形態では、パラメトリック再構成部100によって出力される再構成されたオーディオ信号〔^付きのX〕は、QMF合成部206によってQMF領域から変換し戻されてから、オーディオ・デコード・システム200の出力として、マルチスピーカー・システム207での再生のために提供される。
図5〜図11は、例示的実施形態に基づく、諸ダウンミックス・チャネルによって11.1チャネル・オーディオ信号を表現する代替的な諸方法を示している。本例示的実施形態では、11.1チャネル・オーディオ信号は次のチャネルを含む:左(L)、右(R)、中央(C)、低域効果(LFE)、左側方(LS)、右側方(RS)、左後方(LB)、右後方(RB)、上前方左(TFL)、上前方右(TFR)、上後方左(TBL)および上後方右(TBR)。これらは図5〜図11では大文字によって示されている。11.1チャネル・オーディオ信号を表わすための代替的な諸方法は、これらのチャネルの諸チャネル集合への代替的な分割に対応する。各集合は、単一のダウンミックス信号によって、任意的にはそれに加えて付随するウェットおよびドライ・アップミックス・パラメータによって表わされる。各チャネル集合のそれぞれの単一チャネル・ダウンミックス信号(およびメタデータ)へのエンコードは、独立して並列に実行されてもよい。同様に、それぞれの単一チャネル・ダウンミックス信号からのそれぞれのチャネル集合の再構成は独立して並列に実行されてもよい。
図5〜図11を参照して(また下記で図13〜図16を参照して)記述される例示的実施形態では、再構成されるチャネルのいずれも二つ以上のダウンミックス・チャネルからの寄与を含まなくてもよく、パラメトリック再構成の間、その単一のダウンミックス信号から導出されるいかなる脱相関信号も組み合わされない/混合されない、すなわち複数のダウンミックス・チャネルからの寄与は組み合わされない/混合されないことが理解される。
図5では、チャネルLS、TBLおよびLBが、単一のダウンミックス・チャネルls(およびその付随するメタデータ)によって表わされるチャネルのグループ501をなす。図3を参照して述べたパラメトリック・エンコード部300は、単一のダウンミックス・チャネルlsおよび関連付けられたドライおよびウェット・アップミックス・パラメータによって三つのオーディオ・チャネルLS、TBLおよびLBを表わすために、N=3として用いられてもよい。いずれもパラメトリック・エンコード部300において実行されるエンコードに関連しているあらかじめ定義された行列Vおよび中間行列HRのあらかじめ定義された行列クラスがデコーダ側でわかっているとすると、図1を参照して述べたパラメトリック再構成部100は、ダウンミックス信号lsおよび関連付けられたドライおよびウェット・アップミックス・パラメータから三つのチャネルLS、TBLおよびLBを再構成するために用いられることができる。同様に、チャネルRS、TBRおよびRBが、単一のダウンミックス・チャネルrsによって表わされるチャネルのグループ502をなし、パラメトリック・エンコード部300の別のインスタンスが前記第一のエンコード部と並列に用いられて、三つのチャネルRS、TBRおよびRBを単一のダウンミックス・チャネルrsおよび関連付けられたドライおよびウェット・アップミックス・パラメータによって表わしてもよい。さらに、いずれもパラメトリック・エンコード部300の上記第二のインスタンスに関連しているあらかじめ定義された行列Vおよび中間行列HRが属するあらかじめ定義された行列クラスがデコーダ側でわかっているとすると、パラメトリック再構成部100の別のインスタンスは、ダウンミックス信号rsおよび関連付けられたドライおよびウェット・アップミックス・パラメータから三つのチャネルRS、TBRおよびRBを再構成するために用いられることができる。もう一つのチャネル・グループ503は、ダウンミックス・チャネルlによって表わされる二つのチャネルLおよびTFLのみを含む。これら二つのチャネルをダウンミックス・チャネルlおよび関連付けられたウェットおよびドライ・アップミックス・パラメータにエンコードすることは、それぞれ図3および図1を参照して述べたのと同様だがN=2についてのエンコード部および再構成部によって実行されてもよい。もう一つのチャネル・グループ504は、ダウンミックス・チャネルlfeによって表わされる単一のチャネルLFEのみを含む。この場合、ダウンミックスは必要とされず、ダウンミックス・チャネルlfeはチャネルLFE自身であってもよく、任意的にはMDCT領域に変換したものおよび/または知覚的オーディオ・コーデックを使ってエンコードしたものであってもよい。
11.1チャネル・オーディオ信号を表わすために図5〜図11において用いられるダウンミックス・チャネルの総数は多様である。たとえば、図5に示される例は6個のダウンミックス・チャネルを用いる一方、図7の例は10個のダウンミックス・チャネルを用いる。異なる状況については、たとえばダウンミックス信号および付随するアップミックス・パラメータの伝送のための利用可能な帯域幅および/または11.1チャネル・オーディオ信号の再構成がどのくらい忠実であるべきかについての要件に依存して、異なるダウンミックス構成が好適であることがある。
例示的実施形態によれば、図4を参照して述べたオーディオ・エンコード・システム400は、図3を参照して述べたパラメトリック・エンコード部300を含む複数のパラメトリック・エンコード部を有していてもよい。オーディオ・エンコード・システム400は、図5〜図11に示される11.1チャネル・オーディオ信号のそれぞれの分割に対応する符号化フォーマットのコレクションから、11.1チャネル・オーディオ信号についての符号化フォーマットを決定/選択するよう構成された制御部(図4には示さず)を有していてもよい。符号化フォーマットはさらに、それぞれのダウンミックス・チャネルを計算するためのあらかじめ定義された規則(その少なくともいくつかが一致していてもよい)の集合、中間行列HRについてのあらかじめ定義された行列クラス(その少なくともいくつかが一致していてもよい)の集合およびそれぞれの付随するウェット・アップミックス・パラメータに基づいてそれぞれのチャネル集合の少なくともいくつかに関連付けられたウェット・アップミックス係数を得るためのあらかじめ定義された行列V(その少なくともいくつかが一致していてもよい)の集合に対応する。本例示的実施形態によれば、オーディオ・エンコード・システムは、決定された符号化フォーマットに適切な前記複数のエンコード部の部分集合を使って11.1チャネル・オーディオ信号をエンコードするよう構成されている。たとえば、決定された符号化フォーマットが図1に示される11.1チャネルの分割に対応する場合、エンコード・システムは、それぞれ単一のダウンミックス・チャネルによって3チャネルのそれぞれの集合を表わすよう構成されているエンコード部二つと、それぞれ単一のダウンミックス・チャネルによって2チャネルのそれぞれの集合を表わすよう構成されているエンコード部二つと、それぞれ単一のダウンミックス・チャネルによってそれぞれの単一チャネルを表わすよう構成されているエンコード部二つとを用いてもよい。すべてのダウンミックス信号および付随するウェットおよびドライ・アップミックス・パラメータは、デコーダ側への送達のために、同じビットストリームBにエンコードされてもよい。ダウンミックス・チャネルに伴うメタデータ、すなわちウェット・アップミックス・パラメータおよびウェット・アップミックス・パラメータのコンパクトなフォーマットがいくつかのエンコード部によって用いられてもよいことを注意しておく。一方、少なくともいくつかの例示的実施形態では、他のメタデータ・フォーマットが用いられてもよい。たとえば、エンコード部のいくつかは、ウェットおよびドライ・アップミックス・パラメータではなく、完全な数のウェットおよびドライ・アップミックス係数を出力してもよい。いくつかのチャネルがN−1個より少数の脱相関されたチャネルを用いる(またさらには全く脱相関を用いない)再構成のためにエンコードされる実施形態も考えられる。ここでは、パラメトリック再構成のためのメタデータは異なる形を取りうる。
例示的実施形態によれば、図2を参照して述べたオーディオ・デコード・システム200は、それぞれのダウンミックス信号によって表わされる11.1チャネル・オーディオ信号のチャネルのそれぞれの集合を再構成するために図1を参照して述べたパラメトリック再構成部100を含む対応する複数の再構成部を有していてもよい。オーディオ・デコード・システム200は、決定された符号化フォーマットを指示するエンコーダ側からの信号伝達を受領するよう構成された制御部(図2には示さず)を有していてもよい。オーディオ・デコード・システム200は、受領されたダウンミックス信号および付随するドライおよびウェット・アップミックス・パラメータから11.1チャネル・オーディオ信号を再構成するために前記複数の再構成部の適切な部分集合を用いてもよい。
図12〜図13は、例示的実施形態に基づくダウンミックス・チャネルによって13.1チャネル・オーディオ信号を表わす代替的な諸方法を示している。13.1チャネル・オーディオ信号は次のチャネルを含む:左スクリーン(LSCRN)、左ワイド(LW)、右スクリーン(RSCRN)、右ワイド(RW)、中央(C)、低域効果(LFE)、左側方(LS)、右側方(RS)、左後方(LB)、右後方(RB)、上前方左(TFL)、上前方右(TFR)、上後方左(TBL)および上後方右(TBR)。それぞれのチャネル・グループのそれぞれのダウンミックス・チャネルとしてのエンコードは、図5〜図11を参照して上記したような、独立して並列に動作するそれぞれのエンコード部によって実行されてもよい。同様に、それぞれのダウンミックス・チャネルおよび付随するアップミックス・パラメータに基づくそれぞれのチャネル・グループの再構成は、独立して並列に動作するそれぞれの再構成部によって実行されてもよい。
図14〜図16は、例示的実施形態に基づくダウンミックス信号によって22.2チャネル・オーディオ信号を表わす代替的な諸方法を示している。22.2チャネル・オーディオ信号は次のチャネルを含む:低域効果1(LFE1)、低域効果2(LFE2)、下前方中央(BFC)、中央(C)、上前方中央(TFC)、左ワイド(LW)、下前方左(BFL)、左(L)、上前方左(TFL)、上側方左(TSL)、上後方左(TBL)、左側方(LS)、左後方(LB)、***(TC)、上後方中央(TBC)、中央後方(CB)、下前方右(BFR)、右(R)、右ワイド(RW)、上前方右(TFR)、上側方右(TSR)、上後方右(TBR)、右側方(RS)、右後方(RB)。図16に示される22.2チャネル・オーディオ信号の分割は、四つのチャネルを含むチャネルのグループ1601を含む。図3を参照して述べたパラメトリック・エンコード部300、ただしN=4として実装したものが、これらのチャネルをダウンミックス信号および付随するウェットおよびドライ・アップミックス・パラメータとしてエンコードするために用いられてもよい。同様に、図1を参照して述べたパラメトリック再構成部100、ただしN=4として実装したものが、ダウンミックス信号および付随するウェットおよびドライ・アップミックス・パラメータからこれらのチャネルを再構成するために用いられてもよい。
〈III.等価物、拡張、代替その他〉
上記の記述を吟味すれば、当業者には本開示のさらなる実施形態が明白になるであろう。本稿および図面は実施形態および例を開示しているが、本開示はこれらの個別的な例に制約されるものではない。付属の請求項によって定義される本開示の範囲から外れることなく数多くの修正および変形をなすことができる。請求項に現われる参照符号があったとしても、その範囲を限定するものと理解されるものではない。
さらに、図面、本開示および付属の請求項の吟味から、本開示を実施する当業者によって、開示される実施形態に対する変形が理解され、実施されることができる。請求項において、「有する/含む」の語は他の要素またはステップを排除するものではなく、単数形の表現は複数を排除するものではない。ある種の施策が互いに異なる従属請求項に記載されているというだけの事実がこれらの施策の組み合わせが有利に使用できないことを示すものではない。
上記で開示された装置および方法は、ソフトウェア、ファームウェア、ハードウェアまたはそれらの組み合わせとして実装されうる。ハードウェア実装では、上記の記述で言及された機能ユニットの間でのタスクの分割は必ずしも物理的なユニットへの分割に対応しない。逆に、一つの物理的コンポーネントが複数の機能を有していてもよく、一つのタスクが協働するいくつかの物理的コンポーネントによって実行されてもよい。ある種のコンポーネントまたはすべてのコンポーネントは、デジタル信号プロセッサまたはマイクロプロセッサによって実行されるソフトウェアとして実装されてもよく、あるいはハードウェアとしてまたは特定用途向け集積回路として実装されてもよい。そのようなソフトウェアは、コンピュータ記憶媒体(または非一時的な媒体)および通信媒体(または一時的な媒体)を含みうるコンピュータ可読媒体上で頒布されてもよい。当業者にはよく知られているように、コンピュータ記憶媒体という用語は、コンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータのような情報の記憶のための任意の方法または技術において実装される揮発性および不揮発性、リムーバブルおよび非リムーバブル媒体を含む。コンピュータ記憶媒体は、これに限られないが、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)または他の光ディスク記憶、磁気カセット、磁気テープ、磁気ディスク記憶または他の磁気記憶デバイスまたは、所望される情報を記憶するために使用されることができ、コンピュータによってアクセスされることができる他の任意の媒体を含む。さらに、通信媒体が典型的にはコンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータを、搬送波または他の転送機構のような変調されたデータ信号において具現し、任意の情報送達媒体を含むことは当業者にはよく知られている。
いくつかの態様を記載しておく。
〔態様1〕
Nチャネル・オーディオ信号を再構成するための方法であって、N≧3であり、当該方法は:
単一チャネル・ダウンミックス信号を、関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に受領する段階と;
ドライ・アップミックス信号を、前記ダウンミックス信号の線形マッピングとして計算する段階であって、ドライ・アップミックス係数の集合が前記ダウンミックス信号に適用される、段階と;
前記ダウンミックス信号に基づいて(N−1)チャネルの脱相関信号を生成する段階と;
ウェット・アップミックス信号を、前記脱相関信号の線形マッピングとして計算する段階であって、ウェット・アップミックス係数の集合が前記脱相関信号の諸チャネルに適用される、段階と;
前記ドライ・アップミックス信号および前記ウェット・アップミックス信号を組み合わせて、再構成されるべき前記Nチャネル・オーディオ信号に対応する多次元の再構成された信号を得る段階とを含み、当該方法はさらに:
受領されたドライ・アップミックス・パラメータに基づいてドライ・アップミックス係数の前記集合を決定する段階と;
受領されたウェット・アップミックス・パラメータの数より多くの要素をもつ中間行列に値を入れる段階であって、前記受領されたウェット・アップミックス・パラメータおよび該中間行列があらかじめ定義された行列クラスに属することを知っていることに基づく、段階と;
前記中間行列にあらかじめ定義された行列を乗算することによってウェット・アップミックス係数の前記集合を得る段階とを含み、前記ウェット・アップミックス係数の前記集合は前記乗算から帰結する行列に対応し、前記中間行列の要素の数より多い係数を含む、
方法。
〔態様2〕
前記ウェット・アップミックス・パラメータを受領する段階は、N(N−1)/2個のウェット・アップミックス・パラメータを受領することを含み、
前記中間行列に値を入れることは、受領されたN(N−1)/2個のウェット・アップミックス・パラメータおよび前記中間行列が前記あらかじめ定義された行列クラスに属することを知っていることに基づいて、(N−1) 2 個の行列要素についての値を得ることを含み、
前記あらかじめ定義された行列はN(N−1)個の要素を含み、ウェット・アップミックス係数の前記集合はN(N−1)個の係数を含む、
態様1記載の方法。
〔態様3〕
前記中間行列に値を入れることは、受領されたウェット・アップミックス・パラメータを前記中間行列における要素として用いることを含む、態様1または2記載の方法。
〔態様4〕
前記ドライ・アップミックス・パラメータを受領する段階は、(N−1)個のドライ・アップミックス・パラメータを受領することを含み、ドライ・アップミックス係数の前記集合はN個の係数を含み、ドライ・アップミックス係数の前記集合は、受領された(N−1)個のドライ・アップミックス・パラメータに基づき、かつドライ・アップミックス係数の前記集合内の係数間のあらかじめ定義された関係に基づいて決定される、態様1ないし3のうちいずれか一項記載の方法。
〔態様5〕
前記あらかじめ定義された行列クラスは:
クラス内のすべての行列の既知の属性があらかじめ定義された行列要素が0であることを含む、下三角行列または上三角行列;
クラス内のすべての行列の既知の属性があらかじめ定義された行列要素が等しいことを含む、
対称行列;および
クラス内のすべての行列の既知の属性があらかじめ定義された行列要素の間の既知の関係を含む、直交行列と対角行列の積
のうちの一つである、態様1ないし4のうちいずれか一項記載の方法。
〔態様6〕
前記ダウンミックス信号は、あらかじめ定義された規則に従って、再構成されるべき前記Nチャネル・オーディオ信号の線形マッピングとして取得可能であり、前記あらかじめ定義された規則は、あらかじめ定義されたダウンミックス動作を定義し、前記あらかじめ定義された行列は、前記あらかじめ定義されたダウンミックス動作のカーネル空間を張るベクトルに基づく、態様1ないし5のうちいずれか一項記載の方法。
〔態様7〕
前記単一チャネル・ダウンミックス信号を関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に受領する段階は、前記ダウンミックス信号の時間セグメントまたは時間/周波数タイルを、関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に受領することを含み、前記多次元の再構成された信号は、再構成されるべき前記Nチャネル・オーディオ信号の時間セグメントまたは時間/周波数タイルに対応する、態様1ないし6のうちいずれか一項記載の方法。
〔態様8〕
第一の単一チャネル・ダウンミックス信号および関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータに基づいてNチャネル・オーディオ信号を再構成するよう構成された第一のパラメトリック再構成部を有するオーディオ・デコード・システムであって、N≧3であり、前記第一のパラメトリック再構成部は:
前記第一のダウンミックス信号を受領して、それに基づいて第一の(N−1)チャネル脱相関信号を出力するよう構成された第一の脱相関部と;
第一のドライ・アップミックス部であって、
前記ドライ・アップミックス・パラメータおよび前記ダウンミックス信号を受領し;
前記ドライ・アップミックス・パラメータに基づいてドライ・アップミックス係数の第一の集合を決定し;
前記第一のダウンミックス信号をドライ・アップミックス係数の前記第一の集合に基づいて線形にマッピングすることによって計算される第一のドライ・アップミックス信号を出力するよう構成されている、第一のドライ・アップミックス部と;
第一のウェット・アップミックス部であって、
前記ウェット・アップミックス・パラメータおよび前記第一の脱相関信号を受領する段階と;
受領されたウェット・アップミックス・パラメータの数より多くの要素をもつ第一の中間行列に値を入れる段階であって、受領されたウェット・アップミックス・パラメータおよび前記第一の中間行列が第一のあらかじめ定義された行列クラスに属していると知っていることに基づく、段階と;
前記第一の中間行列に第一のあらかじめ定義された行列を乗算することによってウェット・アップミックス係数の第一の集合を得る段階であって、ウェット・アップミックス係数の前記第一の集合は前記乗算から帰結する行列に対応し、前記第一の中間行列の要素の数より多い係数を含む、段階と;
前記第一の脱相関信号をウェット・アップミックス係数の前記第一の集合に従って線形にマッピングすることによって計算された第一のウェット・アップミックス信号を出力する段階とを実行するよう構成されている第一のウェット・アップミックス部と;
前記第一のドライ・アップミックス信号および前記第一のウェット・アップミックス信号を受領し、これらの信号を組み合わせて、再構成されるべき前記Nチャネル・オーディオ信号に対応する第一の多次元の再構成された信号を得るよう構成された第一の組み合わせ部を有する、
オーディオ・デコード・システム。
〔態様9〕
前記第一のパラメトリック再構成部とは独立に動作可能であり、第二の単一チャネル・ダウンミックス信号および関連付けられたドライ・アップミックス・パラメータおよびウェットのアップミックス・パラメータに基づいてN 2 チャネル・オーディオ信号を再構成するよう構成された第二のパラメトリック再構成部をさらに有しており、N 2 ≧2であり、前記第二のパラメトリック再構成部は、第二の脱相関部、第二のドライ・アップミックス部、第二のウェット・アップミックス部および第二の組み合わせ部を有しており、前記第二のパラメトリック再構成部のこれらの部は、前記第一のパラメトリック再構成部の対応する各部と類似の構成であり、前記第二のウェット・アップミックス部は、第二のあらかじめ定義された行列クラスに属する第二の中間行列および第二のあらかじめ定義された行列を用いるよう構成されている、態様8記載のオーディオ・デコード・システム。
〔態様10〕
当該オーディオ・デコード・システムは、複数のダウンミックス・チャネルおよび関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータに基づいてマルチチャネル・オーディオ信号を再構成するよう適応されており、当該オーディオ・デコード・システムは:
それぞれのダウンミックス・チャネルおよびそれぞれの関連付けられたドライ・アップミックス・パラメータおよびウェットのアップミックス・パラメータに基づいてオーディオ信号チャネルのそれぞれの集合を独立して再構成するよう動作可能なパラメトリック再構成部を含む複数の再構成部と;
前記マルチチャネル・オーディオ信号のチャネルの、それぞれのダウンミックス・チャネルおよび少なくとも該ダウンミックス・チャネルのいくつかについてはそれぞれの関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータによって表わされるチャネルの諸集合への分割に対応する、前記マルチチャネル・オーディオ信号の符号化フォーマットを示す信号伝達を受領するよう構成された制御部であって、前記符号化フォーマットはさらに、それぞれの関連付けられたウェット・アップミックス・パラメータに基づいてチャネルの前記それぞれの集合のうち少なくともいくつかの集合に関連付けられたウェット・アップミックス係数を得るためのあらかじめ定義された行列の集合にさらに対応する、制御部とを有しており、
当該デコード・システムは、前記受領された信号伝達が第一の符号化フォーマットを示すことに応答して、前記複数の再構成部の第一の部分集合を使って前記マルチチャネル・オーディオ信号を再構成するよう構成されており、当該デコード・システムは、前記受領された信号伝達が第二の符号化フォーマットを示すことに応答して、前記複数の再構成部の第二の部分集合を使って前記マルチチャネル・オーディオ信号を再構成するよう構成されていており、前記再構成部の前記第一および第二の部分集合の少なくとも一方は、前記第一のパラメトリック再構成部を含む、
態様8または9記載のオーディオ・デコード・システム。
〔態様11〕
前記複数の再構成部は、高々単一のオーディオ・チャネルがエンコードされたダウンミックス・チャネルに基づいて単一のオーディオ・チャネルを独立して再構成するよう動作可能な単一チャネル再構成部を含み、前記再構成部の前記第一および第二の部分集合の少なくとも一方は、前記単一チャネル再構成部を有する、態様10記載のオーディオ・デコード・システム。
〔態様12〕
前記第一の符号化フォーマットは、前記第二の符号化フォーマットより、少数のダウンミックス・チャネルからの前記マルチチャネル・オーディオ信号の再構成に対応する、態様10または11記載のオーディオ・デコード・システム。
〔態様13〕
Nチャネル・オーディオ信号を単一チャネル・ダウンミックス信号およびメタデータとしてエンコードする方法であって、前記メタデータは、該ダウンミックス信号および該ダウンミックス信号に基づいて決定される(N−1)チャネルの脱相関信号からの前記オーディオ信号のパラメトリック再構成のために好適なものであり、N≧3であり、当該方法は:
前記オーディオ信号を受領する段階と;
あらかじめ定義された規則に従って、前記単一チャネル・ダウンミックス信号を前記オーディオ信号の線形マッピングとして計算する段階と;
前記オーディオ信号を近似する前記ダウンミックス信号の線形マッピングを定義するためのドライ・アップミックス係数の集合を決定する段階と;
受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似される前記オーディオ信号の共分散との間の差に基づいて中間行列を決定する段階であって、前記中間行列は、あらかじめ定義された行列を乗算されたとき、前記オーディオ信号のパラメトリック再構成の一部として前記脱相関信号の線形マッピングを定義するウェット・アップミックス係数の集合に対応し、ウェット・アップミックス係数の前記集合は、前記中間行列の要素の数より多くの係数を含む、段階と;
ドライ・アップミックス係数の前記集合が導出可能であるもとになるドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に前記ダウンミックス信号を出力する段階であって、前記中間行列は出力ウェット・アップミックス・パラメータの数より多くの要素をもち、前記中間行列は、該中間行列があらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義される、段階とを含む、
方法。
〔態様14〕
前記中間行列を決定する段階が、ウェット・アップミックス係数の前記集合によって定義される、前記脱相関信号の前記線形マッピングによって得られる信号の共分散が、受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似される前記オーディオ信号の共分散との間の差を近似するよう、前記中間行列を決定することを含む、態様13記載の方法。
〔態様15〕
前記ウェット・アップミックス・パラメータを出力する段階は、高々N(N−1)/2個のウェット・アップミックス・パラメータを出力することを含み、前記中間行列は(N−1) 2 個の行列要素を有し、前記中間行列が前記あらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義され、ウェット・アップミックス係数の前記集合はN(N−1)個の係数を含む、態様13または14記載の方法。
〔態様16〕
ドライ・アップミックス係数の前記集合はN個の係数を含み、ドライ・アップミックス・パラメータを出力することは、高々(N−1)個のドライ・アップミックス・パラメータを出力することを含み、ドライ・アップミックス係数の前記集合は、前記(N−1)個のドライ・アップミックス・パラメータから、前記あらかじめ定義された規則を使って導出可能である、態様13ないし15のうちいずれか一項記載の方法。
〔態様17〕
ドライ・アップミックス係数の決定された集合は、前記オーディオ信号の最小平均平方誤差近似に対応する前記ダウンミックス信号の線形マッピングを定義する、態様13ないし16のうちいずれか一項記載の方法。
〔態様18〕
Nチャネル・オーディオ信号を単一チャネル・ダウンミックス信号およびメタデータとしてエンコードするよう構成されたパラメトリック・エンコード部を有するオーディオ・エンコード・システムであって、前記メタデータは、該ダウンミックス信号および該ダウンミックス信号に基づいて決定される(N−1)チャネルの脱相関信号からの前記オーディオ信号のパラメトリック再構成のために好適なものであり、N≧3であり、前記パラメトリック・エンコード部は:
前記オーディオ信号を受領し、あらかじめ定義された規則に従って、前記単一チャネル・ダウンミックス信号を前記オーディオ信号の線形マッピングとして計算するよう構成されたダウンミックス部と;
前記オーディオ信号を近似する前記ダウンミックス信号の線形マッピングを定義するためのドライ・アップミックス係数の集合を決定するよう構成された第一の解析部と;
受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似される前記オーディオ信号の共分散との間の差に基づいて中間行列を決定するよう構成されている第二の解析部であって、前記中間行列は、あらかじめ定義された行列を乗算されたとき、前記オーディオ信号のパラメトリック再構成の一部として前記脱相関信号の線形マッピングを定義するウェット・アップミックス係数の集合に対応し、ウェット・アップミックス係数の前記集合は、前記中間行列の要素の数より多くの係数を含む、第二の解析部とを有しており、
前記パラメトリック・エンコード部は、ドライ・アップミックス係数の前記集合が導出可能であるもとになるドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に前記ダウンミックス信号を出力するよう構成されており、前記中間行列は出力ウェット・アップミックス・パラメータの数より多くの要素をもり、前記中間行列は、該中間行列があらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義される、
オーディオ・エンコード・システム。
〔態様19〕
当該オーディオ・エンコード・システムは、複数のダウンミックス・チャネルおよび関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータの形でマルチチャネル・オーディオ信号の表現を提供するよう適応されており、当該オーディオ・エンコード・システムは:
それぞれのダウンミックス・チャネルおよびそれぞれの関連付けられたアップミックス・パラメータを、オーディオ信号チャネルのそれぞれの集合に基づいて独立して計算するよう動作可能なパラメトリック・エンコード部を含む複数のエンコード部と;
前記マルチチャネル・オーディオ信号のチャネルの、それぞれのダウンミックス・チャネルおよび少なくとも該ダウンミックス・チャネルの少なくともいくつかについてはそれぞれの関連付けられたアップミックス・パラメータによって表わされるチャネルの諸集合への分割に対応する、前記マルチチャネル・オーディオ信号の符号化フォーマットを決定するよう構成された制御部であって、前記符号化フォーマットはさらに、それぞれのダウンミックス・チャネルのうちの少なくともいくつかを計算するためのあらかじめ定義された規則の集合に対応する、制御部とを有しており、
当該オーディオ・エンコード・システムは、決定された符号化フォーマットが第一の符号化フォーマットであることに応答して、前記複数のエンコード部の第一の部分集合を使って前記マルチチャネル・オーディオ信号をエンコードするよう構成されており、当該オーディオ・エンコード・システムは、決定された符号化フォーマットが第二の符号化フォーマットであることに応答して、前記複数のエンコード部の第二の部分集合を使って前記マルチチャネル・オーディオ信号をエンコードするよう構成されており、前記エンコード部の前記第一および第二の部分集合の少なくとも一方は、前記第一のパラメトリック・エンコード部を含む、
態様18記載のオーディオ・エンコード・システム。
〔態様20〕
前記複数のエンコード部は、高々単一のオーディオ・チャネルをダウンミックス・チャネルにおいて独立してエンコードするよう動作可能な単一チャネル・エンコード部を含み、前記エンコード部の前記第一および第二の部分集合の少なくとも一方は、前記単一チャネル・エンコード部を含む、態様19記載のオーディオ・エンコード・システム。
〔態様21〕
態様1ないし7および13ないし17のうちいずれか一項記載の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔態様22〕
N=3またはN=4である、態様1ないし7および13ないし17のうちいずれか一項記載の方法、態様8ないし12のうちいずれか一項記載のオーディオ・デコード・システム、態様18ないし20のうちいずれか一項記載のオーディオ・エンコード・システムまたは態様21記載のコンピュータ・プログラム・プロダクト。

Claims (22)

  1. Nチャネル・オーディオ信号を再構成するための方法であって、N≧3であり、当該方法は:
    単一チャネル・ダウンミックス信号を、関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に受領する段階と;
    ドライ・アップミックス信号を、前記ダウンミックス信号の線形マッピングとして計算する段階であって、ドライ・アップミックス係数の集合が前記ダウンミックス信号に適用される、段階と;
    前記ダウンミックス信号に基づいて脱相関信号を生成する段階であって、前記脱相関信号は(N−1)個のチャネルをもつ、段階と;
    ウェット・アップミックス信号を、前記脱相関信号の前記(N−1)個のチャネルの線形マッピングとして計算する段階であって、ウェット・アップミックス係数の集合が前記脱相関信号の諸チャネルに適用される、段階と;
    前記ドライ・アップミックス信号および前記ウェット・アップミックス信号を組み合わせて、再構成されるべき前記Nチャネル・オーディオ信号に対応する多次元の再構成された信号を得る段階とを含み、当該方法はさらに:
    受領されたドライ・アップミックス・パラメータに基づいてドライ・アップミックス係数の前記集合を決定する段階と;
    受領されたウェット・アップミックス・パラメータの数より多くの要素をもつ中間行列に、前記受領されたウェット・アップミックス・パラメータおよび該中間行列があらかじめ定義された行列クラスに属することを知っていることに基づいて値を入れる段階であって、前記あらかじめ定義された行列クラス内のすべての行列の既知の属性が、あらかじめ定義された行列要素の間の既知の関係またはあらかじめ定義された行列要素が0であることを含む、段階と;
    前記中間行列にあらかじめ定義された行列を乗算することによってウェット・アップミックス係数の前記集合を得る段階とを含み、前記ウェット・アップミックス係数の前記集合は前記乗算から帰結する行列に対応し、前記中間行列の要素の数より多い係数を含む、
    方法。
  2. 前記ウェット・アップミックス・パラメータを受領する段階は、N(N−1)/2個のウェット・アップミックス・パラメータを受領することを含み、
    前記中間行列に値を入れることは、受領されたN(N−1)/2個のウェット・アップミックス・パラメータおよび前記中間行列が前記あらかじめ定義された行列クラスに属することを知っていることに基づいて、(N−1)2個の行列要素についての値を得ることを含み、
    前記あらかじめ定義された行列はN(N−1)個の要素を含み、ウェット・アップミックス係数の前記集合はN(N−1)個の係数を含む、
    請求項1記載の方法。
  3. 前記中間行列に値を入れることは、受領されたウェット・アップミックス・パラメータを前記中間行列における要素として用いることを含む、請求項1または2記載の方法。
  4. 前記ドライ・アップミックス・パラメータを受領する段階は、(N−1)個のドライ・アップミックス・パラメータを受領することを含み、ドライ・アップミックス係数の前記集合はN個の係数を含み、ドライ・アップミックス係数の前記集合は、受領された(N−1)個のドライ・アップミックス・パラメータに基づき、かつドライ・アップミックス係数の前記集合内の係数間のあらかじめ定義された関係に基づいて決定される、請求項1ないし3のうちいずれか一項記載の方法。
  5. 前記あらかじめ定義された行列クラスは:
    クラス内のすべての行列の既知の属性があらかじめ定義された行列要素が0であることを含む、下三角行列または上三角行列;
    クラス内のすべての行列の既知の属性があらかじめ定義された行列要素が等しいことを含む、
    対称行列;および
    クラス内のすべての行列の既知の属性があらかじめ定義された行列要素の間の既知の関係を含む、直交行列と対角行列の積
    のうちの一つである、請求項1ないし4のうちいずれか一項記載の方法。
  6. 前記ダウンミックス信号は、あらかじめ定義された規則に従って、再構成されるべき前記Nチャネル・オーディオ信号の線形マッピングとして取得可能であり、前記あらかじめ定義された規則は、あらかじめ定義されたダウンミックス動作を定義し、前記あらかじめ定義された行列は、前記あらかじめ定義されたダウンミックス動作のカーネル空間を張るベクトルに基づく、請求項1ないし5のうちいずれか一項記載の方法。
  7. 前記単一チャネル・ダウンミックス信号を関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に受領する段階は、前記ダウンミックス信号の時間セグメントまたは時間/周波数タイルを、関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に受領することを含み、前記多次元の再構成された信号は、再構成されるべき前記Nチャネル・オーディオ信号の時間セグメントまたは時間/周波数タイルに対応する、請求項1ないし6のうちいずれか一項記載の方法。
  8. 第一の単一チャネル・ダウンミックス信号および関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータに基づいてNチャネル・オーディオ信号を再構成するよう構成された第一のパラメトリック再構成部を有するオーディオ・デコード・システムであって、N≧3であり、前記第一のパラメトリック再構成部は:
    前記第一のダウンミックス信号を受領して、それに基づいて(N−1)個のチャネルをもつ第一の脱相関信号を出力するよう構成された第一の脱相関部と;
    第一のドライ・アップミックス部であって、
    前記ドライ・アップミックス・パラメータおよび前記ダウンミックス信号を受領し;
    前記ドライ・アップミックス・パラメータに基づいてドライ・アップミックス係数の第一の集合を決定し;
    前記第一のダウンミックス信号をドライ・アップミックス係数の前記第一の集合に基づいて線形にマッピングすることによって計算される第一のドライ・アップミックス信号を出力するよう構成されている、第一のドライ・アップミックス部と;
    第一のウェット・アップミックス部であって、
    前記ウェット・アップミックス・パラメータおよび前記第一の脱相関信号を受領する段階と;
    受領されたウェット・アップミックス・パラメータの数より多くの要素をもつ第一の中間行列に、受領されたウェット・アップミックス・パラメータおよび前記第一の中間行列が第一のあらかじめ定義された行列クラスに属していると知っていることに基づいて値を入れる段階であって、前記第一のあらかじめ定義された行列クラス内のすべての行列の既知の属性が、あらかじめ定義された行列要素の間の既知の関係またはあらかじめ定義された行列要素が0であることを含む、段階と;
    前記第一の中間行列に第一のあらかじめ定義された行列を乗算することによってウェット・アップミックス係数の第一の集合を得る段階であって、ウェット・アップミックス係数の前記第一の集合は前記乗算から帰結する行列に対応し、前記第一の中間行列の要素の数より多い係数を含む、段階と;
    前記第一の脱相関信号の前記(N−1)個のチャネルをウェット・アップミックス係数の前記第一の集合に従って線形にマッピングすることによって計算された第一のウェット・アップミックス信号を出力する段階とを実行するよう構成されている第一のウェット・アップミックス部と;
    前記第一のドライ・アップミックス信号および前記第一のウェット・アップミックス信号を受領し、これらの信号を組み合わせて、再構成されるべき前記Nチャネル・オーディオ信号に対応する第一の多次元の再構成された信号を得るよう構成された第一の組み合わせ部を有する、
    オーディオ・デコード・システム。
  9. 前記第一のパラメトリック再構成部とは独立に動作可能であり、第二の単一チャネル・ダウンミックス信号および関連付けられたドライ・アップミックス・パラメータおよびウェットのアップミックス・パラメータに基づいてN2チャネル・オーディオ信号を再構成するよう構成された第二のパラメトリック再構成部をさらに有しており、N2≧2であり、前記第二のパラメトリック再構成部は、第二の脱相関部、第二のドライ・アップミックス部、第二のウェット・アップミックス部および第二の組み合わせ部を有しており、前記第二のパラメトリック再構成部のこれらの部は、前記第一のパラメトリック再構成部の対応する各部と類似の構成であり、前記第二のウェット・アップミックス部は、第二のあらかじめ定義された行列クラスに属する第二の中間行列および第二のあらかじめ定義された行列を用いるよう構成されており、前記第二のあらかじめ定義された行列クラス内のすべての行列の既知の属性が、あらかじめ定義された行列要素の間の既知の関係またはあらかじめ定義された行列要素が0であることを含む、請求項8記載のオーディオ・デコード・システム。
  10. 当該オーディオ・デコード・システムは、複数のダウンミックス・チャネルおよび関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータに基づいてマルチチャネル・オーディオ信号を再構成するよう適応されており、当該オーディオ・デコード・システムは:
    それぞれのダウンミックス・チャネルおよびそれぞれの関連付けられたドライ・アップミックス・パラメータおよびウェットのアップミックス・パラメータに基づいてオーディオ信号チャネルのそれぞれの集合を独立して再構成するよう動作可能なパラメトリック再構成部を含む複数の再構成部と;
    前記マルチチャネル・オーディオ信号のチャネルの、それぞれのダウンミックス・チャネルおよび少なくとも該ダウンミックス・チャネルのいくつかについてはそれぞれの関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータによって表わされるチャネルの諸集合への分割に対応する、前記マルチチャネル・オーディオ信号の符号化フォーマットを示す信号伝達を受領するよう構成された制御部であって、前記符号化フォーマットはさらに、それぞれの関連付けられたウェット・アップミックス・パラメータに基づいてチャネルの前記それぞれの集合のうち少なくともいくつかの集合に関連付けられたウェット・アップミックス係数を得るためのあらかじめ定義された行列の集合にさらに対応する、制御部とを有しており、
    当該デコード・システムは、前記受領された信号伝達が第一の符号化フォーマットを示すことに応答して、前記複数の再構成部の第一の部分集合を使って前記マルチチャネル・オーディオ信号を再構成するよう構成されており、当該デコード・システムは、前記受領された信号伝達が第二の符号化フォーマットを示すことに応答して、前記複数の再構成部の第二の部分集合を使って前記マルチチャネル・オーディオ信号を再構成するよう構成されていており、前記再構成部の前記第一および第二の部分集合の少なくとも一方は、前記第一のパラメトリック再構成部を含む、
    請求項8または9記載のオーディオ・デコード・システム。
  11. 前記複数の再構成部は、高々単一のオーディオ・チャネルがエンコードされたダウンミックス・チャネルに基づいて単一のオーディオ・チャネルを独立して再構成するよう動作可能な単一チャネル再構成部を含み、前記再構成部の前記第一および第二の部分集合の少なくとも一方は、前記単一チャネル再構成部を有する、請求項10記載のオーディオ・デコード・システム。
  12. 前記第一の符号化フォーマットは、前記第二の符号化フォーマットより、少数のダウンミックス・チャネルからの前記マルチチャネル・オーディオ信号の再構成に対応する、請求項10または11記載のオーディオ・デコード・システム。
  13. Nチャネル・オーディオ信号を単一チャネル・ダウンミックス信号およびメタデータとしてエンコードする方法であって、前記メタデータは、該ダウンミックス信号および該ダウンミックス信号に基づいて決定される脱相関信号からの前記オーディオ信号のパラメトリック再構成のために好適なものであり、N≧3であり、前記脱相関信号は(N−1)個のチャネルをもち、当該方法は:
    前記オーディオ信号を受領する段階と;
    あらかじめ定義された規則に従って、前記単一チャネル・ダウンミックス信号を前記オーディオ信号の線形マッピングとして計算する段階と;
    前記オーディオ信号を近似する前記ダウンミックス信号の線形マッピングを定義するためのドライ・アップミックス係数の集合を決定する段階と;
    受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似される前記オーディオ信号の共分散との間の差に基づいて中間行列を決定する段階であって、前記中間行列は、あらかじめ定義された行列を乗算されたとき、前記オーディオ信号のパラメトリック再構成の一部として前記脱相関信号の前記(N−1)個のチャネルの線形マッピングを定義するウェット・アップミックス係数の集合に対応し、ウェット・アップミックス係数の前記集合は、前記中間行列の要素の数より多くの係数を含む、段階と;
    ドライ・アップミックス係数の前記集合が導出可能であるもとになるドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に前記ダウンミックス信号を出力する段階であって、前記中間行列は出力ウェット・アップミックス・パラメータの数より多くの要素をもち、前記中間行列は、該中間行列があらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義され、前記あらかじめ定義された行列クラス内のすべての行列の既知の属性が、あらかじめ定義された行列要素の間の既知の関係またはあらかじめ定義された行列要素が0であることを含む、段階とを含む、
    方法。
  14. 前記中間行列を決定する段階が、ウェット・アップミックス係数の前記集合によって定義される、前記脱相関信号の前記線形マッピングによって得られる信号の共分散が、受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似される前記オーディオ信号の共分散との間の差を近似するよう、前記中間行列を決定することを含む、請求項13記載の方法。
  15. 前記ウェット・アップミックス・パラメータを出力する段階は、高々N(N−1)/2個のウェット・アップミックス・パラメータを出力することを含み、前記中間行列は(N−1)2個の行列要素を有し、前記中間行列が前記あらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義され、ウェット・アップミックス係数の前記集合はN(N−1)個の係数を含む、請求項13または14記載の方法。
  16. ドライ・アップミックス係数の前記集合はN個の係数を含み、ドライ・アップミックス・パラメータを出力することは、高々(N−1)個のドライ・アップミックス・パラメータを出力することを含み、ドライ・アップミックス係数の前記集合は、前記(N−1)個のドライ・アップミックス・パラメータから、前記あらかじめ定義された規則を使って導出可能である、請求項13ないし15のうちいずれか一項記載の方法。
  17. ドライ・アップミックス係数の決定された集合は、前記オーディオ信号の最小平均平方誤差近似に対応する前記ダウンミックス信号の線形マッピングを定義する、請求項13ないし16のうちいずれか一項記載の方法。
  18. Nチャネル・オーディオ信号を単一チャネル・ダウンミックス信号およびメタデータとしてエンコードするよう構成されたパラメトリック・エンコード部を有するオーディオ・エンコード・システムであって、前記メタデータは、該ダウンミックス信号および該ダウンミックス信号に基づいて決定される脱相関信号からの前記オーディオ信号のパラメトリック再構成のために好適なものであり、N≧3であり、前記脱相関信号は(N−1)個のチャネルをもち、前記パラメトリック・エンコード部は:
    前記オーディオ信号を受領し、あらかじめ定義された規則に従って、前記単一チャネル・ダウンミックス信号を前記オーディオ信号の線形マッピングとして計算するよう構成されたダウンミックス部と;
    前記オーディオ信号を近似する前記ダウンミックス信号の線形マッピングを定義するためのドライ・アップミックス係数の集合を決定するよう構成された第一の解析部と;
    受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似される前記オーディオ信号の共分散との間の差に基づいて中間行列を決定するよう構成されている第二の解析部であって、前記中間行列は、あらかじめ定義された行列を乗算されたとき、前記オーディオ信号のパラメトリック再構成の一部として前記脱相関信号の前記(N−1)個のチャネルの線形マッピングを定義するウェット・アップミックス係数の集合に対応し、ウェット・アップミックス係数の前記集合は、前記中間行列の要素の数より多くの係数を含む、第二の解析部とを有しており、
    前記パラメトリック・エンコード部は、ドライ・アップミックス係数の前記集合が導出可能であるもとになるドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に前記ダウンミックス信号を出力するよう構成されており、前記中間行列は出力ウェット・アップミックス・パラメータの数より多くの要素をもち、前記中間行列は、該中間行列があらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義され、前記あらかじめ定義された行列クラス内のすべての行列の既知の属性が、あらかじめ定義された行列要素の間の既知の関係またはあらかじめ定義された行列要素が0であることを含む、
    オーディオ・エンコード・システム。
  19. 当該オーディオ・エンコード・システムは、複数のダウンミックス・チャネルおよび関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータの形でマルチチャネル・オーディオ信号の表現を提供するよう適応されており、当該オーディオ・エンコード・システムは:
    それぞれのダウンミックス・チャネルおよびそれぞれの関連付けられたアップミックス・パラメータを、オーディオ信号チャネルのそれぞれの集合に基づいて独立して計算するよう動作可能なパラメトリック・エンコード部を含む複数のエンコード部と;
    前記マルチチャネル・オーディオ信号のチャネルの、それぞれのダウンミックス・チャネルおよび少なくとも該ダウンミックス・チャネルの少なくともいくつかについてはそれぞれの関連付けられたアップミックス・パラメータによって表わされるチャネルの諸集合への分割に対応する、前記マルチチャネル・オーディオ信号の符号化フォーマットを決定するよう構成された制御部であって、前記符号化フォーマットはさらに、それぞれのダウンミックス・チャネルのうちの少なくともいくつかを計算するためのあらかじめ定義された規則の集合に対応する、制御部とを有しており、
    当該オーディオ・エンコード・システムは、決定された符号化フォーマットが第一の符号化フォーマットであることに応答して、前記複数のエンコード部の第一の部分集合を使って前記マルチチャネル・オーディオ信号をエンコードするよう構成されており、当該オーディオ・エンコード・システムは、決定された符号化フォーマットが第二の符号化フォーマットであることに応答して、前記複数のエンコード部の第二の部分集合を使って前記マルチチャネル・オーディオ信号をエンコードするよう構成されている
    請求項18記載のオーディオ・エンコード・システム。
  20. 前記複数のエンコード部は、高々単一のオーディオ・チャネルをダウンミックス・チャネルにおいて独立してエンコードするよう動作可能な単一チャネル・エンコード部を含み、前記複数のエンコード部の前記第一および第二の部分集合の少なくとも一方は、前記単一チャネル・エンコード部を含む、請求項19記載のオーディオ・エンコード・システム。
  21. コンピュータに請求項1ないし7のうちいずれか一項記載の方法を実行させるためのコンピュータ・プログラム。
  22. コンピュータに請求項13ないし17のうちいずれか一項記載の方法を実行させるためのコンピュータ・プログラム。
JP2016524490A 2013-10-21 2014-10-21 オーディオ信号のパラメトリック再構成 Active JP6479786B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201361893770P 2013-10-21 2013-10-21
US61/893,770 2013-10-21
US201461974544P 2014-04-03 2014-04-03
US61/974,544 2014-04-03
US201462037693P 2014-08-15 2014-08-15
US62/037,693 2014-08-15
PCT/EP2014/072570 WO2015059153A1 (en) 2013-10-21 2014-10-21 Parametric reconstruction of audio signals

Publications (3)

Publication Number Publication Date
JP2016537669A JP2016537669A (ja) 2016-12-01
JP2016537669A5 JP2016537669A5 (ja) 2017-11-24
JP6479786B2 true JP6479786B2 (ja) 2019-03-06

Family

ID=51845388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016524490A Active JP6479786B2 (ja) 2013-10-21 2014-10-21 オーディオ信号のパラメトリック再構成

Country Status (9)

Country Link
US (6) US9978385B2 (ja)
EP (1) EP3061089B1 (ja)
JP (1) JP6479786B2 (ja)
KR (4) KR102244379B1 (ja)
CN (3) CN111192592B (ja)
BR (1) BR112016008817B1 (ja)
ES (1) ES2660778T3 (ja)
RU (1) RU2648947C2 (ja)
WO (1) WO2015059153A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG11201602628TA (en) 2013-10-21 2016-05-30 Dolby Int Ab Decorrelator structure for parametric reconstruction of audio signals
US9955276B2 (en) 2014-10-31 2018-04-24 Dolby International Ab Parametric encoding and decoding of multichannel audio signals
TWI587286B (zh) 2014-10-31 2017-06-11 杜比國際公司 音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體
US9986363B2 (en) 2016-03-03 2018-05-29 Mach 1, Corp. Applications and format for immersive spatial sound
CN106851489A (zh) * 2017-03-23 2017-06-13 李业科 在小房间摆放多声道音箱的方法
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
ES2965741T3 (es) 2017-07-28 2024-04-16 Fraunhofer Ges Forschung Aparato para codificar o decodificar una señal multicanal codificada mediante una señal de relleno generada por un filtro de banda ancha
JP7107727B2 (ja) * 2018-04-17 2022-07-27 シャープ株式会社 音声処理装置、音声処理方法、プログラム、及び、プログラムの記録媒体
CN111696625A (zh) * 2020-04-21 2020-09-22 天津金域医学检验实验室有限公司 一种fish室荧光计数***
CA3240986A1 (en) 2021-12-20 2023-06-29 Dolby International Ab Ivas spar filter bank in qmf domain
WO2024073401A2 (en) * 2022-09-30 2024-04-04 Sonos, Inc. Home theatre audio playback with multichannel satellite playback devices
WO2024097485A1 (en) 2022-10-31 2024-05-10 Dolby Laboratories Licensing Corporation Low bitrate scene-based audio coding

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6111958A (en) * 1997-03-21 2000-08-29 Euphonics, Incorporated Audio spatial enhancement apparatus and methods
CN1307853C (zh) * 2000-08-31 2007-03-28 杜比实验特许公司 音频矩阵解码设备的方法
CA3026283C (en) * 2001-06-14 2019-04-09 Dolby Laboratories Licensing Corporation Reconstructing audio signals with multiple decorrelation techniques
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
SE0402652D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
SE0402651D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signalling
SE0402649D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
WO2006079086A2 (en) 2005-01-24 2006-07-27 Thx, Ltd. Ambient and direct surround sound system
DE102005010057A1 (de) 2005-03-04 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
KR101271069B1 (ko) * 2005-03-30 2013-06-04 돌비 인터네셔널 에이비 다중채널 오디오 인코더 및 디코더와, 인코딩 및 디코딩 방법
WO2006108543A1 (en) * 2005-04-15 2006-10-19 Coding Technologies Ab Temporal envelope shaping of decorrelated signal
WO2006126844A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
ATE433182T1 (de) * 2005-07-14 2009-06-15 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
ATE455348T1 (de) * 2005-08-30 2010-01-15 Lg Electronics Inc Vorrichtung und verfahren zur dekodierung eines audiosignals
CN101253556B (zh) * 2005-09-02 2011-06-22 松下电器产业株式会社 能量整形装置以及能量整形方法
KR100888474B1 (ko) * 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
JP2007178684A (ja) * 2005-12-27 2007-07-12 Matsushita Electric Ind Co Ltd マルチチャンネルオーディオ復号装置
TWI333642B (en) * 2006-01-19 2010-11-21 Lg Electronics Inc Method and apparatus for processing a media signal
CA2646961C (en) 2006-03-28 2013-09-03 Sascha Disch Enhanced method for signal shaping in multi-channel audio reconstruction
BRPI0709235B8 (pt) * 2006-03-29 2019-10-29 Dolby Int Ab decodificador de áudio, método de decodificação de áudio, receptor para receber um sinal de n canais, sistema de transmissão para transmitir um sinal de áudio, método para receber um sinal de áudio, método para transmitir e receber um sinal de áudio, mídia de armazenamento legível por computador, e, dispositivo de reprodução de áudio
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
KR20080086549A (ko) 2006-04-03 2008-09-25 엘지전자 주식회사 미디어 신호 처리 방법 및 장치
US8041041B1 (en) * 2006-05-30 2011-10-18 Anyka (Guangzhou) Microelectronics Technology Co., Ltd. Method and system for providing stereo-channel based multi-channel audio coding
WO2007146424A2 (en) 2006-06-15 2007-12-21 The Force Inc. Condition-based maintenance system and method
US7876904B2 (en) 2006-07-08 2011-01-25 Nokia Corporation Dynamic decoding of binaural audio signals
UA94117C2 (ru) * 2006-10-16 2011-04-11 Долби Свиден Ав Усовершенстованное кодирование и отображение параметров многоканального кодирования микшированных объектов
DE102007018032B4 (de) * 2007-04-17 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung dekorrelierter Signale
JP5133401B2 (ja) * 2007-04-26 2013-01-30 ドルビー・インターナショナル・アクチボラゲット 出力信号の合成装置及び合成方法
CN101821799B (zh) * 2007-10-17 2012-11-07 弗劳恩霍夫应用研究促进协会 使用上混合的音频编码
BRPI0908630B1 (pt) * 2008-05-23 2020-09-15 Koninklijke Philips N.V. Aparelho de 'upmix' estéreo paramétrico, decodificador estéreo paramétrico, método para a geração de um sinal esquerdo e de um sinal direito a partir de um sinal de 'downmix' mono com base em parâmetros espaciais, dispositivo de execução de áudio, aparelho de 'downmix' estéreo paramétrico, codificador estéreo paramétrico, método para a geração de um sinal residual de previsão para um sinal de diferença a partir de um sinal esquerdo e de um sinal direito com base nos parâmetros espaciais, e, produto de programa de computador
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
US8346380B2 (en) 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
EP2169665B1 (en) 2008-09-25 2018-05-02 LG Electronics Inc. A method and an apparatus for processing a signal
WO2010036059A2 (en) 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
EP2175670A1 (en) 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
EP2214161A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal
EP2214162A1 (en) 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Upmixer, method and computer program for upmixing a downmix audio signal
US8666752B2 (en) 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
MY160545A (en) 2009-04-08 2017-03-15 Fraunhofer-Gesellschaft Zur Frderung Der Angewandten Forschung E V Apparatus, method and computer program for upmixing a downmix audio signal using a phase value smoothing
RU2011147119A (ru) * 2009-04-21 2013-05-27 Конинклейке Филипс Электроникс Н.В. Синтез аудиосигнала
US8705769B2 (en) 2009-05-20 2014-04-22 Stmicroelectronics, Inc. Two-to-three channel upmix for center channel derivation
SG177277A1 (en) * 2009-06-24 2012-02-28 Fraunhofer Ges Forschung Audio signal decoder, method for decoding an audio signal and computer program using cascaded audio object processing stages
MX2012004261A (es) * 2009-10-16 2012-05-29 Fraunhofer Ges Forschung Aparato, metodo y programa de computadora para proveer uno o más parámetros ajustados para provisión de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendente y una informacion lateral paramétrica asociada con la representación de señal de mezcla descendente, usando un valor promedio.
PL2491551T3 (pl) * 2009-10-20 2015-06-30 Fraunhofer Ges Forschung Urządzenie do dostarczania reprezentacji sygnału upmixu w oparciu o reprezentację sygnału downmixu, urządzenie do dostarczania strumienia bitów reprezentującego wielokanałowy sygnał audio, sposoby, program komputerowy i strumień bitów wykorzystujący sygnalizację sterowania zniekształceniami
US9026450B2 (en) 2011-03-09 2015-05-05 Dts Llc System for dynamically creating and rendering audio objects
CN102446507B (zh) * 2011-09-27 2013-04-17 华为技术有限公司 一种下混信号生成、还原的方法和装置
WO2013120510A1 (en) * 2012-02-14 2013-08-22 Huawei Technologies Co., Ltd. A method and apparatus for performing an adaptive down- and up-mixing of a multi-channel audio signal
CN103325383A (zh) * 2012-03-23 2013-09-25 杜比实验室特许公司 音频处理方法和音频处理设备
WO2013181272A2 (en) 2012-05-31 2013-12-05 Dts Llc Object-based audio system using vector base amplitude panning
DE102012210525A1 (de) 2012-06-21 2013-12-24 Robert Bosch Gmbh Verfahren zur Funktionskontrolle eines Sensors zur Detektion von Teilchen und Sensor zur Detektion von Teilchen
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal

Also Published As

Publication number Publication date
US11450330B2 (en) 2022-09-20
CN105917406A (zh) 2016-08-31
US10614825B2 (en) 2020-04-07
BR112016008817B1 (pt) 2022-03-22
KR20220044619A (ko) 2022-04-08
RU2648947C2 (ru) 2018-03-28
US20160247514A1 (en) 2016-08-25
EP3061089B1 (en) 2018-01-17
CN111192592B (zh) 2023-09-15
CN111179956B (zh) 2023-08-11
CN105917406B (zh) 2020-01-17
KR102486365B1 (ko) 2023-01-09
CN111192592A (zh) 2020-05-22
KR102244379B1 (ko) 2021-04-26
EP3061089A1 (en) 2016-08-31
KR20210046848A (ko) 2021-04-28
CN111179956A (zh) 2020-05-19
WO2015059153A1 (en) 2015-04-30
US11769516B2 (en) 2023-09-26
KR20230011480A (ko) 2023-01-20
US20240087584A1 (en) 2024-03-14
US9978385B2 (en) 2018-05-22
ES2660778T3 (es) 2018-03-26
US20190325885A1 (en) 2019-10-24
US10242685B2 (en) 2019-03-26
US20230104408A1 (en) 2023-04-06
BR112016008817A2 (ja) 2017-08-01
RU2016119563A (ru) 2017-11-28
JP2016537669A (ja) 2016-12-01
KR102381216B1 (ko) 2022-04-08
US20200302943A1 (en) 2020-09-24
US20180268831A1 (en) 2018-09-20
KR20160099531A (ko) 2016-08-22

Similar Documents

Publication Publication Date Title
JP6479786B2 (ja) オーディオ信号のパラメトリック再構成
JP6686015B2 (ja) オーディオ信号のパラメトリック混合
JP6201047B2 (ja) オーディオ信号のパラメトリック再構成のための脱相関器構造
BR122020018172B1 (pt) Método para reconstruir um sinal de áudio de n canais, sistema de decodificação de áudio e meio legível por computador não transitório

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171010

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171010

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181211

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190206

R150 Certificate of patent or registration of utility model

Ref document number: 6479786

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250