JP2011018060A - マルチチャネルオーディオ信号を表示するための装置と方法 - Google Patents

マルチチャネルオーディオ信号を表示するための装置と方法 Download PDF

Info

Publication number
JP2011018060A
JP2011018060A JP2010183775A JP2010183775A JP2011018060A JP 2011018060 A JP2011018060 A JP 2011018060A JP 2010183775 A JP2010183775 A JP 2010183775A JP 2010183775 A JP2010183775 A JP 2010183775A JP 2011018060 A JP2011018060 A JP 2011018060A
Authority
JP
Japan
Prior art keywords
channel
parameter
balance
channels
balance parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010183775A
Other languages
English (en)
Other versions
JP5185340B2 (ja
Inventor
Heiko Purnhagen
ハイコ プルンハーゲン
Lars Villemoes
ラルス ヴィレモース
Jonas Engdegard
ヨナス エングデガルド
Johas Roeden
ヨナス レーデン
Kristofer Kjoerling
クリストファー クジェルリング
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Publication of JP2011018060A publication Critical patent/JP2011018060A/ja
Application granted granted Critical
Publication of JP5185340B2 publication Critical patent/JP5185340B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Radio Relay Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Circuits Of Receivers In General (AREA)

Abstract

【課題】マルチチャネル再生を目的として、選択的な数の出力チャネルをスケーラブルな状態で生成する。
【解決手段】少なくとも3つのオリジナルチャネルを有するマルチチャネル入力信号は、そのマルチチャネル信号のパラメータ表示によって示される。第1チャネル・ペア間の第1バランス・パラメータ(r1)、第1コヒーレンス・パラメータ又は第1チャネル間時間差と、第2チャネル・ペア間の第2バランス・パラメータ(r2)、第2コヒーレンス・パラメータ又は第2チャネル間時間差パラメータとが計算される。第1チャネル・ペア(102,104)は第2チャネル・ペア(102,104,103)が有する2つのチャネルとは異なる2つのチャネルを有し、2つのチャネル・ペアの各チャネルは、オリジナルチャネルのうちの1つか、重み付けされた組合せであり、第1チャネル・ペアと第2チャネル・ペアとは3つのオリジナルチャネルに関する情報を含む。
【選択図】図6

Description

本発明は、空間パラメータを使用した、オーディオ信号のマルチチャネル表示の符号化に関する。本発明は、出力チャネルの個数よりも少ない個数のチャネルから、1つのマルチチャネル信号を再生するための適切なパラメータを計算し、かつ定義するための新たな方法を提供する。特に本発明は、マルチチャネル表示のためのビットレートを最小化することを目的とし、かつ全てのチャネル構成のためのデータを容易に符号化及び復号化することを可能にする、マルチチャネル信号の符号化された表示を提供することを目的とする。
「低ビットレートディオ符号化のための効率的かつスケーラブルなパラメトリックステレオ符号化」と題する特許文献1には、ステレオ画像の非常に凝縮された表現を与えられたモノラル信号から、オリジナルステレオ画像に酷似するステレオ画像を再現することが可能であることが示されている。その基本原理は、入力信号を周波数帯と時間セグメントとに分割し、これらの周波数帯及び時間セグメントについて、チャネル間強度差(IID)及びチャネル間コヒーレンス(ICC)を推定することにある。第1のパラメータは、特定の周波数帯における2チャネル間のパワー配分の測定値であり、第2のパラメータは、特定の周波数帯における2チャネル間の相関関係の推定値である。デコーダ側では、IIDデータに従って2つの出力チャネル間でモノラル信号を配分し、かつオリジナルステレオ・チャネルのチャネル相関関係を保持するために非相関化された信号を加算することにより、モノラル信号からステレオ画像が再現される。
マルチチャネルの場合(ここで言うマルチチャネルは、2つ以上の出力チャネルを意味する)では、幾つかの追加事項を考慮しなければならない。マルチチャネル構成は幾つか存在する。最もよく知られているものは、5.1構成(中央チャネル、前左/右、サラウンド左/右及びLFEチャネル)である。但し、他にも多くの構成が存在する。完全なエンコーダ/デコーダ・システムの観点からすると、全てのチャネル構成に対して同じパラメータ・セット(例えばIID及びICC)またはそのサブセットを使用できるシステムを有することが望ましい。ITU(国際電気通信連合会)−R BS.775では、所定のチャネル構成からより少ないチャネルを含むチャネル構成を達成できる幾つかのダウンミックス・スキームが定義された。常に全てのチャネルを復号する必要があり、かつダウンミックスに頼る代わりに、受信機が、チャネル復号の以前に、当面のチャネル構成に関連のあるパラメータを抽出可能にするマルチチャネル表示を有することが望ましい場合がある。さらに、例えばサラウンド・チャネルに対応するデータをビットストリーム内のエンハンスレイヤの中に格納することが可能である場合は、スケーラブル符号化または埋込み式(embedded)符号化の観点から、パラメータ・セットは本質的にスケーラブルであることが望ましい。
また、上記とは対照的に、処理されつつある信号の特徴に基づいて、様々なパラメータ定義を使用できることが望ましい場合もある。この場合、パラメータ化間での切換が実行され、その結果、その時点で処理されつつあるカレント信号セグメントにとって、最低のビットレート負荷で済むことができる。
和信号またはダウンミックス信号及び追加的なパラメトリックサイド情報を使用するマルチチャネル信号の他の表示は、当業者間においては、「バイノーラル・キュー・コーディング(BCC)」として周知である。この技術は、非特許文献1と非特許文献2に記載されている。
概して、バイノーラル・キュー・コーディングは、1つのダウンミックスされたオーディオチャネルとサイド情報とを基礎とするマルチチャネル空間レンダリングのための方法である。オーディオの再現またはオーディオレンダリングのために、BCCエンコーダにより計算されかつBCCデコーダにより使用されるべき複数のパラメータには、チャネル間のレベル差、チャネル間の時間差及びチャネル間のコヒーレンス・パラメータが含まれる。これらのチャネル間キューは、空間画像の知覚にとっては決定的な因子である。これらのパラメータは、オリジナル・マルチチャネル信号の時間サンプル・ブロックに与えられ、かつ周波数選択的に与えられることから、マルチチャネル信号サンプルの各ブロックが、複数の周波数帯のための複数のキューを有することになる。C再生チャネルの一般的な場合では、チャネル間のレベル差及びチャネル間の時間差は、チャネル・ペア間の各サブバンドについて、即ち、各チャネルとある参照チャネルとの比較において考慮される。各チャネル間レベル差の考慮のために、1つのチャネルがこの参照チャネルとして定義される。これらチャネル間のレベル差及びチャネル間の時間差により、使用される再生セットアップ内の一対のスピーカペアの間で、任意の方向に音源を配置することが可能となる。配置された音源の幅または拡散性の決定に際しては、全てのオーディオチャネルに対し、1つのサブバンドにつき1つのパラメータを考慮すれば十分である。このパラメータは、チャネル間のコヒーレンス・パラメータである。配置される音源の幅は、全ての可能なチャネル・ペアが同一のチャネル間コヒーレンス・パラメータを有するように、サブバンド信号を修正することによって制御される。
BCCコーディングでは、参照チャネル1と他のチャネルとの間で、全てのチャネル間レベル差が決定される。例えば、中央チャネルが参照チャネルであると決定されると、左チャネルとこの中央チャネルとの間の第1のチャネル間レベル差、右チャネルと中央チャネルとの間の第2のチャネル間レベル差、左サラウンド・チャネルと中央チャネルとの間の第3のチャネル間レベル差、及び右サラウンド・チャネルと中央チャネルとの間の第4のチャネル間レベル差が計算される。このシナリオは、5チャネル・スキームを説明するものである。この5チャネル・スキームが、「サブウーファ」チャネルとしても知られる低周波強化(low frequency enhancement)チャネルを追加的に含む場合には、この低周波強化チャネルと、単一の参照チャネルである中央チャネルとの間の第5のチャネル間レベル差が計算される。
「モノラル」チャネルとも称される単一のダウンミックス・チャネルと、ICLD(チャネル間レベル差)、ICTD(チャネル間時間差)及びICC(チャネル間コヒーレンス)等の送信されるキューとを使用してオリジナル・マルチチャネルを復元する場合には、上記モノラル信号のスペクトル係数がこれらのキューを使用して修正される。このレベル修正は、各スペクトル係数のレベル修正を決定する正の実数を使用して実行される。チャネル間時間差は、各スペクトル係数のための位相修正を決定する大きさ1の複素数を使用して生成される。別の関数は、コヒーレンスの影響を決定する。各チャネルのレベル修正のためのファクタの算出は、まず参照チャネルのためのファクタを計算することから始まる。参照チャネルのためのファクタは、各周波数区分について、全チャネルのパワーの総和が和信号のパワーと同じであるように計算される。次に、この参照チャネルのためのレベル修正ファクタに基づいて、他のチャネルのためのレベル修正ファクタが、個々のICLDパラメータを使用して計算される。
このように、BCC合成を実行するためには、参照チャネルのレベル修正ファクタが計算される必要がある。この計算には、1つの周波数帯についての全てのICLDパラメータが必要である。次に、この1つのチャネルに関するレベル修正に基づいて、他のチャネル、即ち参照チャネルでないチャネルのレベル修正ファクタを計算することができる。
上述の手法は、完全な再現のためには、各々全てのチャネル間レベル差が必要とされる点で不利である。エラーが多発する送信チャネルが存在する場合、この要件はさらに問題を発生させやすいものとなる。マルチチャネル出力信号の各々の計算にはチャネル間レベル差の各々が必要であることから、送信されるチャネル間レベル差におけるエラーは悉く、再現されるマルチチャネル信号のエラーを引き起こす。さらに、送信中にチャネル間レベル差が失われた場合にも、再現は全く不可能となる。これはたとえ、このチャネル間レベル差が、マルチチャネルの再生にはあまり重要でない、例えば左サラウンド・チャネルまたは右サラウンド・チャネルにしか必要でないようなチャネル間レベル差であった場合でも、再現不可能となる。ここで、これらのサラウンド・チャネルがマルチチャネル再生にとってそれほど重要でないという理由は、情報の大部分は、以下に左チャネルと呼ぶ前左チャネル、以下に右チャネルと呼ぶ前右チャネル、または中央チャネル内に含まれるからである。低周波強化チャネルのチャネル間レベル差が送信中に失われた場合、この状況はさらに悪くなる。この状況では、マルチチャネル再生は不可能となるか、あるいはエラーを含む再生のみが可能となる。但し、低周波強化チャネルは、リスナーの耳に届く快適さにはさほど決定的なものではない。従って、1つのチャネル間レベル差におけるエラーは、再現される出力チャネルの各々の中におけるエラーとなって伝搬される。
さらに、非特許文献3に示される現在のBCCスキームは、直観的なリスニングのシナリオを考えた場合、参照チャネルが単一であるという理由で最適とはいえない。全てが単一の参照チャネルに関連付けられるということは、人間の耳にとって自然でなく、勿論全てのオーディオ処理の究極的な目標でもない。現実に人間は2つの耳を持ち、これら耳は人間の頭部の異なる側面に位置しているのである。よって、人間の自然なリスニングの印象は、信号のバランスが左側に大きいか、右側に大きいか、あるいは前後の間でのバランスがどうであるかによって決まるものである。それにも関わらず、音場の中の所定の音源が、単一の参照スピーカに対する関係において、各スピーカ間で所定のバランス内にあるか否かを感じ取るということは、人間の耳には不自然である。この相違、即ち、人間の自然なリスニングの印象を一方とし、BCCの数学的/物理学的なモデルを他方とするずれが、ビットレートの条件、スケーラビリティの条件、柔軟性の条件、再現アーチファクトの条件、またはエラーロバスト性の条件等を考慮する時、符号化スキームにおいて否定的な結果をもたらす可能性もある。
PCT/SE02/01372
F.Baumgarte、C.Faller共著「バイノーラル・キュー・コーディング−第1部:聴覚心理学の基本と設計原理」音声及び音響処理に関するIEEE論文集、第11巻第6号、2003年11月 C.Faller、F.Baumgarte共著「バイノーラル・キュー・コーディング−第2部:スキームと応用」音声及び音響処理に関するIEEE論文集、第11巻第6号、2003年11月 C. Faller, F. Baumgarte共著「ステレオ及びマルチチャネル音響圧縮に適用されたバイノーラル・キュー・コーディング」2002年5月10−13日ドイツ、ミュンヘン市におけるAES会議の報告書5574号
本発明の目的は、マルチチャネルオーディオ信号を表示するための発展的な概念を提供することにある。
この目的は、マルチチャネル入力信号のパラメータ表示を生成するための請求項1に記載の装置、再現されたマルチチャネル表現を生成するための請求項21に記載の装置、請求項31または32に記載の方法、請求項33に記載のコンピュータ・プログラムまたは請求項34に記載のパラメータ表示によって達成される。
本発明は、マルチチャネル表現のためには、チャネル・ペア間のバランス・パラメータが重要であるという知見を基礎とする。さらに、マルチチャネル信号のパラメータ表示は少なくとも2つの異なるバランス・パラメータを提供することで可能となり、これらのバランス・パラメータは2つの異なるチャネル・ペア間のバランスを示すものである。特に、第1のバランス・パラメータの基礎となる第1のチャネル・ペアと、第2のバランス・パラメータの基礎となる第2のチャネル・ペアとが異なり、これらのチャネル・ペアを形成している4つのチャネルが全て互いに異なるという事実から、柔軟性、スケーラビリティ、エラーロバスト性さらにはビットレート効率までもが結果として得られることになる。
上述のように、本発明の好適な概念は、単一の参照チャネルの概念とは異なり、人間の音の印象にとってより直感的でより自然な、マルチバランスまたはスーパーバランス概念を使用する。特に、第1及び第2のバランス・パラメータの基礎を成すチャネル・ペアには、オリジナル・チャネル、ダウンミックス・チャネルまたは好ましくは入力チャネル間の所定の組合せが含まれてもよい。
中央チャネルをチャネル・ペアの第1のチャネルとし、左オリジナル・チャネル及び右オリジナル・チャネルの和をチャネル・ペアの第2のチャネルとして導出されるバランス・パラメータは、中央チャネルと左右チャネルとの間の正確なエネルギー配分をもたらす上で特に有益であることが知られている。ここで留意すべきは、これらの3チャネルは、一般にオーディオ・シーンの大部分の情報を含むが、特に左右のステレオ定位(stereo localization)は、左右間のバランスによって影響されるだけでなく、中央と左右の和とのバランスによっても影響されるという点である。この知見は、本発明の好適な一実施形態において、このバランス・パラメータを使用することにより反映されている。
好ましくは、単一のモノラル・ダウンミックス信号が送信される場合、柔軟性とエラー・ロバスト性を有し、かつアーチファクトの発生が大きく抑制された、ビットレート効率の良いパラメータ表示のためには、中央/左プラス右のバランス・パラメータに加えて、左/右のバランス・パラメータと、後左/後右のバランス・パラメータと、前/後のバランス・パラメータとを使用することが、最適な解決策であることは知られている。
レシーバ側では、各チャネルが送信された情報のみによって計算されるBCC合成とは対照的に、本発明の好ましいマルチ−バランス表示においては、ダウンミックス・チャネルの生成に使用されたダウンミックス・スキームに関する情報をさらに利用する。つまり、本発明においては、先行技術のシステムでは使用されていないダウンミックス・スキームに関する情報が、アップミックスにおいても、バランス・パラメータに加えて使用される。従って、アップミックスの操作は、再現されるマルチチャネル信号内でバランス・パラメータのチャネル・ペアを形成するチャネル間のバランスが、上記バランス・パラメータによって決定されるように実行される。
この概念、即ち、異なるバランス・パラメータのために異なるチャネル・ペアを使用するという概念は、送信されるバランス・パラメータの各個を全て知ることなく、幾つかのチャネルを生成することを可能にする。特に、本発明においては、左、右及び中央の各チャネルは、後左/後右の如何なるバランスも一切知ることなく、または前/後の如何なるバランスも一切知ることなく再現されることが可能である。この効果として、微同調されたスケーラビリティが可能になる。なぜなら、ビットストリームから追加的なパラメータを抽出すること、または追加的なバランス・パラメータをレシーバへ送信することが、結果的には1つまたは複数の追加チャネルの再構築を可能にするからである。これは、先行技術による単一参照システム、即ち、再生出力チャネルの全てまたはその1つのサブグループのみを再生するために、各チャネル間レベル差を全て必要とするシステムとは対照的である。
また本発明の概念は、バランス・パラメータの選択を所定の再現環境に適応させることができる点でも柔軟性がある。例えば、オリジナルのマルチチャネル・セットアップが5チャネルであり、かつ再現マルチチャネル・セットアップが4チャネルであり、後者が例えばリスナーの背後に配置される単一のサラウンド・スピーカのみを有する場合、前後のバランス・パラメータは、左サラウンド・チャネル及び右サラウンド・チャネルに関する一切の知識なしに、結合されたサラウンド・チャネルの計算を可能にする。これは、データストリームから左サラウンド・チャネルのチャネル間レベル差と右サラウンド・チャネルのチャネル間レベル差とを抽出しなければならない単一参照チャネル・システムとは対照的であり、同システムでは、次に、左サラウンド・チャネルと右サラウンド・チャネルとを計算する必要があり、最終的に、両チャネルを加算して、4チャネル再現セットアップ用の単一のサラウンド・スピーカ・チャネルを取得しなければならない。より直感的かつよりユーザ指向的な本発明のバランス・パラメータ表示では、これらのステップは全て行う必要がない。なぜなら、このバランス・パラメータ表示が、結合されたサラウンド・チャネルを自動的に供給するためである。このバランス・パラメータ表示は、単一の参照チャネルに束縛されず、オリジナル・チャネルの組み合せをバランス・パラメータのチャネル・ペアの1チャネルとして使用することをも可能にするものである。
本発明は、オーディオ信号のパラメータ化されたマルチチャネル表示の課題に関する。本発明は、マルチチャネル表示のための適切なパラメータを定義する効率的な方法を提供し、かつ全てのチャネルを復号する必要なしに、所望されるチャネル構成を表示するパラメータを抽出する能力を提供する。本発明はさらに、与えられた信号セグメントの空間パラメータを符号化するために必要なビットレートを最小限に抑えるために、上記与えられた信号セグメントの最適なパラメータ構成を選択するという課題を解決する。また本発明は、従前では2チャネルの場合にのみ適用可能であった非相関化方法を、一般的なマルチチャネル環境において適用する方法を提供する。
好適な実施形態において、本発明は下記の特徴を有する。
−エンコーダ側で、マルチチャネル信号を1または2チャネル表示へダウンミックスし、
−マルチチャネル信号が与えられた時、マルチチャネル信号を表示するパラメータを、ビットレートを最小限に抑えるためにフレーム毎のベースで定義するか、またはデコーダがチャネル構成を抽出可能にするためにビットストリーム・レベルで定義するか、いずれかの方法で柔軟に定義し、
−デコーダ側で、そのデコーダにより現時点でサポートされているチャネル構成が与えられたとき、関連するパラメータ・セットを抽出し、
−当該のチャネル構成が与えられたとき、所望する個数の相互に非相関化された信号を生成し、
−ビットストリーム・データから復号されるパラメータ・セット及び非相関化信号が与えられたとき、出力信号を再生し、
−同じパラメータまたはパラメータのサブセットをチャネル構成に関わりなく使用できるように、マルチチャネルオーディオ信号のパラメータ化を定義し、
−パラメータ・セットのサブセットがスケーラブルストリームの異なるレイヤで送信されるようなスケーラブル符号化のスキームにおいて、上記パラメータを使用できるように、マルチチャネルオーディオ信号のパラメータ化を定義し、
−デコーダからの出力信号のエネルギー再生が、ダウンミックスされた信号の符号化に使用された基本的なオーディオ・コーデックによって害されないように、マルチチャネルオーディオ信号のパラメータ化を定義し、
−パラメータ化を符号化するためのビットレート負荷が最小限に抑えられるように、マルチチャネルオーディオ信号の様々なパラメータ化を切換えし、
−ダウンミックスされた信号のエネルギー補正ファクタを表示するパラメータが含まれるように、マルチチャネルオーディオ信号のパラメータ化を定義し、
−マルチチャネル信号を再生するために、相互に非相関化された複数のデコリレータを使用し、
−送信されたパラメータ・セットに基づいて計算されるアップミックス行列Hから、マルチチャネル信号を再生する。
本発明が適用される5.1チャネル構成に使用される命名法を示す。 本発明の好適な一実施形態による可能なエンコーダの構成を示す。 本発明の好適な一実施形態による可能なデコーダの構成を示す。 本発明によるマルチチャネル信号の好適なパラメータ化の一例を示す。 本発明によるマルチチャネル信号の好適なパラメータ化の他の例を示す。 本発明によるマルチチャネル信号の好適なパラメータ化のさらに他の例を示す。 1つまたは2つのベース・チャネルを生成するダウンミックス・スキームのセットアップを示す略図である。 本発明によるバランス・パラメータとダウンミックス・スキームに関する情報とを基礎とするアップミックス・スキームを略示したものである。 エンコーダ側のレベル・パラメータの決定方法を示す略図である。 デコーダ側のレベル・パラメータの使用方法を示す略図である。 ビットストリームの異なるレイヤにマルチチャネル・パラメータ化の異なる部分を有する、スケーラブルなビットストリームを示す。 バランス・パラメータと、このバランス・パラメータを使用して再生されるチャネルと、不使用または計算されないパラメータ及びチャネルとの関係を示すスケーラビリティ表である。 本発明によるアップミックス行列の適用例を示す。
次に、添付の図面を参照して、本発明を、その範囲または概念を限定するものではなく、一例として説明する。
以下に説明する実施形態は、オーディオ信号のマルチチャネル表示に関する本発明の原理を単に例示するものである。他の当業者にとって、本明細書において説明している装置及び詳細の修正及び変形が可能であることは自明である。従って、本発明は、添付の特許請求の範囲に記載されている範囲によってのみ限定されるべきものであり、本明細書において実施形態を記述しかつ説明するために示した特定の詳細によって限定されるべきではない。
以下に、IID及びICCパラメータのパラメータ化の方法、及びオーディオ信号のマルチチャネル表示を再現するために上記パラメータの使用方法について概説する。本発明に関する下記の説明において、言及される全ての信号は、フィルタバンク内のサブバンド信号、または対応するチャネルのための周波数範囲全体のうちの一部を示す他の何らかの周波数選択的表示であることが想定されている。従って、本発明は特定のフィルタバンクに限定されないこと、下記で概説する本発明は信号のサブバンド表示の1つの周波数帯に関して説明したものであること、及び同じ操作を全てのサブバンド信号に適用できること、に留意すべきである。
バランス・パラメータは「チャネル間強度差(IID)」パラメータとも称されるが、チャネル・ペア間のバランス・パラメータが、必ずしもチャネル・ペアの第1のチャネルにおけるエネルギーまたは強度と、チャネル・ペアにおける第2のチャネルのエネルギーまたは強度との間の比率である必要はない点は強調されるべきである。概して、バランス・パラメータは、チャネル・ペアの2チャネル間の音源の定位を指す。通常、この定位はエネルギー/レベル/強度の各差分によって与えられるが、両チャネルのパワー測定値またはチャネルの時間または周波数包絡線等の、信号の他の特徴を使用することもできる。
図1は5.1チャネル構成の様々なチャネルを視覚化したものであり、101は左サラウンド・チャネルa(t)を表し、102は左前チャネルb(t)を表し、103は中央チャネルc(t)を表し、104は右前チャネルd(t)を表し、105は右サラウンド・チャネルe(t)を表し、106はLFE(低周波強化)チャネルf(t)を表す。
期待演算子を、
Figure 2011018060
と定義するものと仮定すれば、先に概説したチャネルのエネルギーは、
Figure 2011018060
と定義することができる(この場合は、左サラウンド・チャネルにより例示している)。
エンコーダ側では、5つのチャネルが2チャネル表示または1チャネル表示へダウンミックスされる。ダウンミックスは幾つかの方法で実行可能であるが、一般に使用される一方法はITUダウンミックスであり、下記のように定義される。
5.1チャネルから2チャネルへのダウンミックス:
Figure 2011018060
5.1チャネルから1チャネルへのダウンミックス:
Figure 2011018060
定数α、β、γ及びδとして通常使用される値は、
Figure 2011018060
である。
IIDパラメータは、任意に選択される2チャネルまたは重み付けされたチャネル・グループのエネルギー比率として定義される。先に概説した5.1チャネル構成のためのチャネルのエネルギーを用いて、幾つかのIIDパラメータ・セットを定義することができる。
図7は、上述の式を使用して単一のベース・チャネルmまたは好適にはステレオ・ベースである2つのチャネルld及びrdを計算する、一般的なダウンミキサ700を示す。概して、上記ダウンミキサは所定のダウンミックス情報を使用する。線形ダウンミックスのこの好適な実施形態では、このダウンミックス情報は、重み付けファクタα、β、γ及びδを含む。当業者においては、一定または一定でない重み付けファクタを使用できることは、技術上周知である。
ITU推奨ダウンミックスでは、αは1に設定され、β及びγは等しく、かつ0.5の平方根に設定され、δは0に設定される。概して、係数αは1.5乃至0.5の範囲で変わってもよい。さらに、係数β及びγは互いに異なり、0乃至1の範囲で変わってもよい。低周波強化チャネルf(t)についても同様であり、このチャネルのファクタδは0乃至1の範囲で変わってもよい。さらに、左ダウンミックス及び右ダウンミックスのファクタは互いに同じである必要はない。これは、例えばサウンド・エンジニアによって実行される非自動ダウンミックスが考慮される場合に明確となる。サウンド・エンジニアは、任意の数学的法則によって導かれるダウンミックスよりも、より創造的なダウンミックスを指向し、彼自身の創造的なフィーリングによって導かれていく。この「創造的な」ダウンミックスが、所定のパラメータ・セットによって記録される場合、そのダウンミックスは、本発明に従う図8に示すアップミキサ800により使用され、このアップミキサはパラメータだけでなく、ダウンミックス・スキームに関する追加情報によっても作動される。
図7に示すように、線形ダウンミックスが実行された場合、重み付けパラメータはダウンミックス・スキームに関する好適な情報であり、アップミキサによって使用されるべき情報である。しかしながら、ダウンミックス・スキームで使用される他の情報が存在していれば、アップミキサは、この他の情報もダウンミックス・スキームに関する情報として使用することができる。このような他の情報は、例えば、所定の行列要素、または例えば図11に示すようなアップミックス行列の行列要素内の所定のファクタまたは関数であってもよい。
図1に略示した5.1チャネル構成を備えた場合、他のチャネル構成とこの5.1チャネル構成との関連性について考察すると、3チャネルの場合では、サラウンド・チャネルが利用不可となり、先の表記法によればB、C及びDが利用可能となる。4チャネル構成では、B、C及びDが利用可能であるが、加えて単一のサラウンド・チャネルを表す、またはより一般的には後チャネルと称されるA+Eも利用可能となる。
本発明は、これら全てのチャネルに適用されるIIDパラメータを使用する。即ち、5.1チャネル構成の4チャネル・サブセットは、5.1チャネルを記述するIIDパラメータ・セット内に対応したサブセットを有する。下記のIIDパラメータ・セットは、この課題を解決する。
Figure 2011018060
上式から明らかに、r1パラメータは左ダウンミックス・チャネルと右ダウンミックス・チャネルとの間のエネルギー比率に対応し、r2パラメータは中央チャネルと左右前チャネルとの間のエネルギー比率に対応し、r3パラメータは2つのサラウンド・チャネルと3つの前チャネルとの間のエネルギー比率に対応し、r4パラメータは2つのサラウンド・チャネル間のエネルギー比率に対応し、r5パラメータはLFEチャネルと他の全チャネルとの間のエネルギー比率に対応している。
上述のエネルギー比率を、図4に示す。様々な出力チャネルは、図1と同じく101乃至105で示し、よってここでは詳述を省く。スピーカのセットアップは左右半分に分割され、中央チャネル103は双方の半分の一部である。左半面と右半面との間のエネルギー比率を、本発明に係るパラメータr1で示す。図4では、これをr1の下の実線矢印で示す。さらに、中央チャネル103と左前チャネル102及び右前チャネル104との間のエネルギー配分を、本発明に係るパラメータr2で示す。最後に図4では、前チャネルのセットアップ全体(102,103及び104)と後チャネル(101及び105)との間のエネルギー配分をr3パラメータの矢印で示す。
上述のパラメータ化と、送信される単一のダウンミックス・チャネルのエネルギー:
Figure 2011018060
とが与えられた場合、再現されるチャネルのエネルギーは、
Figure 2011018060
で表すことができる。
従って、M信号のエネルギーは再現チャネルへ配分されることが可能であり、オリジナル・チャネルと同じエネルギーを有する再現チャネルがもたらされる。
上述の好適なアップミックス・スキームを、図8に示す。上記F、A、E、C、B及びDの式から明らかなように、アップミキサによって使用されるべきダウンミックス・スキームに関する情報は、重み付けファクタα、β、γ及びδであり、これらファクタは、オリジナル・チャネルの数より少ない数のダウンミックス・チャネルを得るために、重み付けされ、または重み付けされないチャネルが互いに加算され、もしくは減算される前に、オリジナル・チャネルへの重み付けに使用される。従って、図8から明らかなように、本発明によれば、再現されたチャネルのエネルギーは、エンコーダ側からデコーダ側へ送信されるバランス・パラメータによって決定されるだけでなく、ダウンミックス・ファクタα、β、γ及びδよっても決定される。
図8を考慮すると、左右のエネルギーB及びDを計算するために、既に算出されているチャネル・エネルギーF、A、E、Cが式内に使用されることが明らかである。但しこれは、必ずしも逐次的なアップミックス・スキームを意味しない。代わりに、例えば、所定のアップミックス行列要素を有する所定のアップミックス行列を使用して実行される完全並行型のアップミックス・スキームを達成するために、A、C、E及びFの式がB及びDの式へ挿入されてもよい。従って、再現されたチャネルのエネルギーは、バランス・パラメータと、ダウンミックス・チャネルと、ダウンミックス・スキームに関するダウンミックス・ファクタ等の情報とによってのみ決定されることが明らかになる。
上述のIIDパラメータがある場合、幾つかのチャネル構成に使用可能なIIDパラメータのパラメータ・セットを定義するという課題は、後述の説明から明らかとなるように、解決済みであることは明白である。例として、3チャネル構成(即ち、利用可能な1チャネルから3つの前チャネルを再生するもの)について考慮すると、A、E及びFは存在しないことから、パラメータr3、r4及びr5がもはや使用されないことは明らかである。また、r1は左右前チャネル間のエネルギー比率を表し、r2は中央チャネルと左右前チャネルとの間のエネルギー比率を表すことから、パラメータr1及びr2が、ダウンミックスされた1つのチャネルから3つのチャネルを再生するために十分であることも明らかである。
より一般的な場合でも、先に定義したようなIIDパラメータ(r1...r5)がm個のチャネルからn個のチャネルを再生する全てのサブセットに適用されることが容易に分る。但し、m<n≦6である。図10bから分るように、
−1チャネルから2チャネルを再生するシステムでは、チャネル間の正しいエネルギー比率に関する十分な情報がr1パラメータから得られ、
−1チャネルから3チャネルを再生するシステムでは、チャネル間の正しいエネルギー比率に関する十分な情報がr1及びr2パラメータから得られ、
−1チャネルから4チャネルを再生するシステムでは、チャネル間の正しいエネルギー比率に関する十分な情報がr1、r2及びr3パラメータから得られ、
−1チャネルから5チャネルを再生するシステムでは、チャネル間の正しいエネルギー比率に関する十分な情報がr1、r2、r3及びr4パラメータから得られ、
−1チャネルから5.1チャネルを再生するシステムでは、チャネル間の正しいエネルギー比率に関する十分な情報がr1、r2、r3、r4及びr5パラメータから得られ、
−2チャネルから5.1チャネルを再生するシステムでは、チャネル間の正しいエネルギー比率に関する十分な情報がr2、r3、r4及びr5パラメータから得られる。
上述のスケーラビリティの特徴を、図10bの表に示す。図10aに示しかつ後段で説明するスケーラブル・ビットストリームもこの図10bの表に適応させることができ、この場合、図10aに示すものより細かいスケーラビリティを達成することができる。
本発明の好適な概念は、左右のチャネルを、単一のバランス・パラメータr1から、他のいずれのバランス・パラメータを認識または抽出することなく、容易に再現できる点で特に効果的である。この目的に沿って、図8におけるB、Dの式では、チャネルA、C、F及びEが単にゼロに設定される。
バランス・パラメータr2のみを考慮すれば、再現されるチャネルは、一方は中央チャネルと低周波チャネル(このチャネルがゼロに設定されていないとき)との和であり、他方は左右のチャネルの和である。従って、単一のパラメータのみを使用して、一方では中央チャネルを、他方ではモノラル信号を再現することができる。この特徴は、左右の信号が左右の和から二分等により導出され、かつ中央と左右の和との間のエネルギーがバランス・パラメータr2によって正確に決定される単純な3チャネル表示にとって、既に有益であると言える。
上述の場合、バランス・パラメータr1またはr2は、低いスケーリングレイヤに位置づけられる。
図10bの記入欄の中で2行目について説明すれば、これは3つのチャネルB、D及びCとFの和が、5つのバランス・パラメータの全てでなく2つのバランス・パラメータr1及びr2のみを使用してどのように生成され得るかを示す。これらのパラメータの一方は、低位のスケーリングレイヤに位置づけられる他方のパラメータより高位のスケーリングレイヤに存在する可能性がある。
図8における式を考慮すると、Cを計算するために、非抽出パラメータr5及び他の非抽出パラメータr3が0に設定されることが明らかになる。さらに、不使用チャネルA、E、Fも0に設定され、よって3つのチャネルB、D及び中央チャネルCと低周波強化チャネルFとの組合せを計算することができる。
4チャネル表示をアップミックスする場合は、パラメータ・データストリームからパラメータr1、r2及びr3を抽出するだけで十分である。この時、r3は、他のパラメータr1またはr2よりも一段高位のスケーリングレイヤに存在する可能性もある。4チャネル構成は、本発明のスーパーバランス・パラメータ表示との関連で特に適しているが、その理由は、後に図6に関連して記述するように、第3のバランス・パラメータr3が、前チャネルを一方とし後チャネルを他方とする組合せから既に導出されているためである。4チャネル構成が本発明に適しているのは、パラメータr3が前後のバランス・パラメータであり、このバランス・パラメータは、第1のチャネルとして後チャネルA及びEの組合せを有し、前チャネルとして左チャネルB、右チャネルE及び中央チャネルCの組合せを有するチャネル・ペアから導出される、と言う事実に起因する。
従って、両サラウンド・チャネルの結合されたチャネル・エネルギーは、単一参照チャネルのセットアップにおける場合と同様に、さらなる別の計算及び後続の組合せなしに自動的に得られる。
単一チャネルから5チャネルを再現しなければならない場合は、さらにバランス・パラメータr4が必要である。このパラメータr4もやはり、次に高位のスケーリングレイヤに存在していてもよい。
5.1チャネルの再現を実行しなければならない場合は、全てのバランス・パラメータが必要である。従って、次のバランス・パラメータr5を含む次に高位のスケーリングレイヤがレシーバへ送られ、そのレシーバにより復号される必要がある。
しかしながら、チャネル数の増大に従ってIIDパラメータを増大させるこの手法を同様に使用すれば、5.1構成より多いチャネル数を有するチャネル構成をカバーするように、上述のIIDパラメータを増大させることができる。従って、本発明は、上述の実施例に限定されるものではない。
次に、最も一般的に使用される場合の1つである、チャネル構成が5.1チャネル構成である場合について考察する。この5.1チャネルは2つのチャネルから再生されるものとする。この場合に関しては、パラメータr3及びr4を、
Figure 2011018060
に置き換えることにより、異なるパラメータ・セットを定義することができる。パラメータq3及びq4は、前/後左チャネル間のエネルギー比率、及び前/後右チャネル間のエネルギー比率を表す。他にも、幾つかのパラメータ化を想定することができる。
図5は上記修正されたパラメータ化を描いたものである。(図4ではr3により示された)前/後チャネル間のエネルギー配分を略示する1つのパラメータと、(図4ではr4により示された)左サラウンド・チャネルと右サラウンド・チャネルとの間のエネルギー配分を記述するパラメータとに代えて、左前102と左サラウンド・チャネル101との間のエネルギー比率、及び右前チャネル104と右サラウンド・チャネル105との間のエネルギー比率を記述するパラメータq3及びq4が使用される。
本発明においては、マルチチャネル信号を表示するために、複数のパラメータ・セットが使用可能であることが望ましい。本発明のさらなる特徴は、使用されるパラメータの量子化タイプに依存して、様々なパラメータ化を選択できる点にある。
一例として、高いビットレートを使用できないという制約に起因してパラメータ化の粗い量子化を使用するシステムでは、アップミックス処理の中でエラーを増幅しないパラメータ化を使用すべきである。
1つのチャネルから5.1チャネルを再生するシステムにおける、上記再現エネルギーの式のうち、次の2つの式
Figure 2011018060
を考慮すると、M、A、C及びFパラメータの極めて小さい量子化効果に起因して、減算がB及びDエネルギーの大幅な変動をもたらし得ることは明らかである。
本発明によれば、パラメータの量子化による影響が小さい、異なるパラメータ化を使用すべきである。故に、粗い量子化が使用されれば、先に定義したようなr1パラメータ、即ち、
Figure 2011018060
は、次の代替定義によって置換することが可能である。
Figure 2011018060
その結果、
Figure 2011018060
という再現エネルギーの式をもたらし、A、E、C及びFの再現エネルギーの式は上述のままである。量子化の観点から、このパラメータ化はより良好なシステムをもたらすことは明らかである。
図6は先に説明したエネルギー比率を示す。様々な出力チャネルを101乃至105で示し、図1と同じであることからここでは詳述しない。スピーカのセットアップは、前部分と後部分とに分割される。図6では、前チャネル・セットアップ全体(102,103及び104)と後チャネル(101及び105)との間のエネルギー配分を、r3パラメータで表される矢印で示す。
本発明の他の重要かつ顕著な特徴は、パラメータ化、
Figure 2011018060
を考慮すると、これらパラメータ化は、単に量子化の観点から良好なシステムであるだけではない。これらのパラメータ化には、3つの前チャネルの再現に使用されるパラメータは、サラウンド・チャネルの影響を受けることなく導出される、という優位点もある。また、中央チャネルと他の全チャネルとの関係を記述するパラメータr2を想定することも可能である。但しこれには、サラウンド・チャネルが前チャネルを記述するパラメータの計算に含まれる、という欠点があると思われる。
本発明において記述されているパラメータ化は、チャネル間の相関性またはコヒーレンスの計測にも適用できることを念頭に置けば、r2の計算に後チャネルを含むことが、前チャネルの正確な再生にとって重大な悪影響を及ぼすことは明らかである。
一例として、全ての前チャネルでは信号が同一であり、後チャネルでは信号が完全に非相関であるという状況を想像することができる。オリジナル・サウンドの雰囲気情報の再生に後チャネルが頻繁に使用される場合、このような状況は珍しいことではない。
もし中央チャネルが他の全チャネルとの関連で記述されれば、後チャネルは完全に非相関であることから、中央と他の全チャネルの和との間の相関関係の値は比較的低くなる。前左/右チャネルと後左/右チャネルとの間の相関関係を計算するパラメータの場合にも、同じことが言える。
このような場合、エネルギーを正確に再現することができるが、しかし、全前チャネルが同一であった、即ち強力に相関されていたという情報を含まないパラメータ化に到達してしまう。これは確かに、左右前チャネルが後チャネルと非相関であるという情報と、中央チャネルも後チャネルと非相関であるという情報とを含む。但し、このようなパラメータ化から、全ての前チャネルが同一であるという事実を導出することはできない。
これは、本発明に従う下記のパラメータ化、
Figure 2011018060
を使用することにより克服することができる。なぜなら、デコーダ側で前チャネルを再生するために使用されるパラメータの計算の中に、後チャネルが包含されないからである。
本発明では、中央チャネル103と左前チャネル102及び右前チャネル104との間のエネルギー配分をr2で示す。左サラウンド・チャネル101と右サラウンド・チャネル105との間のエネルギー配分をr4で示し、最後に左前チャネル102と右前チャネル104との間のエネルギー配分をr1で示す。図から明らかであるように、パラメータは全て図4に略示したものと同じであるが、但し、本図におけるr1は、左側全体と右側全体ではなく、左前スピーカと右前スピーカとの間のエネルギー配分に対応している。完全性を期して、中央チャネル103とLFE(低周波強化)チャネル106との間のエネルギー配分を略示するパラメータr5も示している。
図6は本発明のパラメータ化の好適な実施形態の概略を示す。第1のバランス・パラメータr1(実線で示す)は、前左/前右のバランス・パラメータを構成する。第2のバランス・パラメータr2は、中央/左右のバランス・パラメータである。第3のバランス・パラメータr3は前/後のバランス・パラメータを構成し、第4のバランス・パラメータr4は後左/後右のバランス・パラメータを構成し、最後に第5のバランス・パラメータr5は中央/LFEのバランス・パラメータを構成する。
図4は関連する状況を示す。図4では実線で示されている、ダウンミックス・左/右バランスの場合の第1のバランス・パラメータr1は、チャネルB及びD間で基本的なチャネル・ペアとして定義されるオリジナル・前左/前右のバランス・パラメータによって置換されてもよい。図4ではこれは点線r1で示され、図5及び6における実線r1に対応する。
2つのベース・チャネル状況においては、パラメータr3及びr4、即ち前/後のバランス・パラメータ及び後左/右のバランス・パラメータは、2つの片側の前/後・パラメータによって置換される。第1の片側の前/後・パラメータq3は、左サラウンド・チャネルA及び左チャネルBより成るチャネル・ペアから導出される第1のバランス・パラメータと見なすこともできる。第2の片側の前/後バランス・パラメータq4は、右チャネルD及び右サラウンド・チャネルEより成る第2のチャネル・ペアに基づく第2のパラメータと見なすことができる。この場合もやはり、これらのチャネル・ペアは互いに独立している。第1のチャネルとして中央チャネルCを有し、第2のチャネルとして左右のチャネルB及びDの和を有する中央/左右のバランス・パラメータr2の場合にも、同じことが言える。
1つまたは2つのチャネルから5.1チャネルを再生するシステムの粗い量子化に適した、本発明の他のパラメータ化を、下記のように定義する。
1チャネルから5.1チャネルへの場合:
Figure 2011018060
2チャネルから5.1チャネルへの場合:
Figure 2011018060
上述のパラメータ化は、厳密に理論的な視点からすれば、送信される信号のエネルギーを再生される信号へ正確に再配分するために必要とされるものより多くのパラメータを含むことは明らかである。しかしながら、このパラメータ化は量子化エラーからの影響が極めて少ない。
2ベース・チャネルのセットアップの場合の上記パラメータ・セットは、複数の参照チャネルを利用する。但し、図6に示すパラメータ構成とは対照的に、図7に示すパラメータ・セットは、参照チャネルとしてオリジナル・チャネルではなく専らダウンミックス・チャネルに依存する。バランス・パラメータq1、q3及びq4は、全く異なるチャネル・ペアから導出される。
以上、本発明のいくつかの実施の形態について説明した。すなわち、バランス・パラメータを導出するためのチャネル・ペアが、オリジナル・チャネルのみを含む場合(図4、図5、図6)、またはオリジナル・チャネル及びダウンミックス・チャネルを含む場合(図4、図5)、もしくは図7の下部に示すように、参照チャネルとして専らダウンミックス・チャネルに依存する場合である。しかし、図2のサラウンド・データ・エンコーダ206内に包含されるパラメータ生成器は、バランス・パラメータが基礎とするチャネル・ペアのためのチャネルとして、1つのベース・チャネルまたはベース・チャネルの組合せではなく、オリジナル・チャネルまたはオリジナル・チャネルの組合せのみを使用するように作動することが望ましい。これは、単一のベース・チャネルまたは2つのステレオ・ベース・チャネルに対し、そのサラウンド・エンコーダからサラウンド・デコーダへの送信中に、エネルギー変化が発生しないことを完全に保証することはできない、という事実に起因する。単一または複数のダウンミックス・チャネルに対するこのようなエネルギー変動は、低ビットレート条件下で動作するオーディオ・エンコーダ205(図2)またはオーディオ・デコーダ302(図3)によって引き起こされる可能性がある。このような状況はモノラル・ダウンミックス・チャネルまたはステレオ・ダウンミックス・チャネルのエネルギー操作をもたらす可能性があるが、この操作は左右のステレオ・ダウンミックス・チャネル間で異なる場合もあれば、周波数選択的及び時間選択的である場合もある。
本発明によれば、このようなエネルギー変動に対して完全に安全であるために、全てのダウンミックス・チャネルの各ブロック及び各周波数帯毎に、追加的なレベル・パラメータが送信されてもよい。バランス・パラメータがダウンミックス信号ではなくオリジナル信号を基礎とする場合、いかなるエネルギー補正もオリジナル・チャネル間のバランス状況に影響しないことから、各帯域に対して単一の補正ファクタで十分である。追加的なレベル・パラメータが送信されない場合でも、ダウンミックス・チャネルのエネルギー変動が音像における音源定位の歪みをもたらすことはなく、全体的なラウドネス変化をもたらすだけであり、この変化はバランス条件の変動によって引き起こされる音源の移動ほど厄介ではない。
(ダウンミックスされたチャネルの)エネルギーMは、先に概説したように、エネルギーB、D、A、E、C及びFの和になるように注意する必要があることは重要である。しかし、1チャネルにダウンミックスされつつある様々なチャネル間の位相依存性に起因して、必ずしもこの通りにいくものではない。エネルギー補正ファクタが追加的なパラメータrMとして送信されることも可能であり、この時、デコーダ側で受信されるダウンミックスされた信号のエネルギーは、
Figure 2011018060
と定義することができる。
追加的なパラメータrM の適用例を、図9に示す。ダウンミックスされた入力信号は、アップミックス・モジュールへ送信される前に、レベル補正器902でrMパラメータにより修正される。この点は、図7と同じであり、よって詳述を省く。当業者にとって、上述のような単一チャネルのダウンミックス例のためのパラメータrMが、各ダウンミックス・チャネルにつき1つづつ与えられるように応用可能であり、よって単一のダウンミックス・チャネルに限定されないことは明らかである。
図9aは本発明のレベル・パラメータ計算器900を示し、図9bは本発明のレベル補正器902を示す。図9aはエンコーダ側の状況を示し、図9bはデコーダ側の対応する状況を示す。レベル・パラメータまたは「追加的な」パラメータrMは、所定のエネルギー比率を与える補正ファクタである。これを説明するために、次のような例示的シナリオを想定する。あるオリジナル・マルチチャネル信号のために、一方で「マスタ・ダウンミックス」が存在し、他方で「パラメータ・ダウンミックス」が存在する。マスタ・ダウンミックスは、サウンド・スタジオにおいてサウンド・エンジニアにより、例えば主観的な音質の印象に基づいて生成されている。加えて、あるオーディオ記憶媒体がパラメータ・ダウンミックスを含み、このパラメータ・ダウンミックスは、例えば図2のサラウンド・エンコーダ203によって与えられる。このパラメータ・ダウンミックスは、1個または2個のベース・チャネルを含み、これらのベース・チャネルは、バランス・パラメータ・セットまたは他のいずれかのオリジナル・マルチチャネル信号のパラメトリック表示を使用して行う、マルチチャネル再現のための基礎を形成する。
例えば、放送者が、パラメータ・ダウンミックスの送信は希望しないが、マスタ・ダウンミックスを送信機からレシーバへと送信することを希望する場合はあり得る。さらに、マスタ・ダウンミックスをマルチチャネル表示へアップグレードするために、放送者はオリジナル・マルチチャネル信号のパラメトリック表示も送信する。(1つの帯域及び1つのブロックにおける)エネルギーは、マスタ・ダウンミックスとパラメータ・ダウンミックスとの間で変わる可能性がある(かつ典型的には変わる)ことから、ブロック900において相対的なレベル・パラメータrMが生成され、追加的なパラメータとしてレシーバへと送信される。このレベル・パラメータはマスタ・ダウンミックスとパラメータ・ダウンミックスとから導出され、好適には、マスタ・ダウンミックスとパラメータ・ダウンミックスとの間における、1ブロック及び1帯域内のエネルギーの比率である。
概して、レベル・パラメータは、オリジナル・チャネルのエネルギーの和(Eorig)とダウンミックス・チャネルのエネルギーとの比率として計算される。このダウンミックス・チャネルは、パラメータ・ダウンミックス(EPD)であっても、マスタ・ダウンミックス(EMD)または他の任意のダウンミックス信号であってもよい。典型的には、特定のダウンミックス信号のエネルギーが使用され、エンコーダからデコーダへ送信される。
図9bはレベル・パラメータを使用したデコーダ側の構成を示す。レベル・パラメータ及びダウンミックス信号は、レベル補正器のブロック902へ入力される。このレベル補正器は、レベル・パラメータに依存して、単一または複数ベース・チャネルを補正する。追加のパラメータrMは相対値であることから、この相対値は対応するベース・チャネルのエネルギーに対して乗算される。
図9a及び図9bは、レベル補正が1つまたは複数のダウンミックス・チャネルに適用された状況を示しているが、レベル・パラメータはまたアップミックス行列に統合されてもよい。この場合、図8の式に現出するMは、全て項「rMM」に置換される。
2つのチャネルから5.1チャネルを再生する場合について考慮すると、下記のような知見が得られる。
本発明を、図2及び図3内の205及び302で略示したような、基本的なオーディオ・コーデックと共に使用する場合は、さらなる考慮を行う必要がある。上記定義のIIDパラメータ、すなわち、r1
Figure 2011018060
と定義するIIDパラメータを考慮すると、このパラメータは潜在的にデコーダ側で利用可能である。なぜなら、このシステムは、送信される2チャネルがサラウンド・チャネルのステレオ・ダウンミックスであることを条件として、2つのチャネルから5.1チャネルを再生するものであるからである。
しかしながら、ビットレート制約下で動作するオーディオ・コーデックは、スペクトル分布を修正する可能性があり、その結果、デコーダ側で測定される左右のエネルギーはエンコーダ側でのエネルギーとは異なる。本発明によれば、再生されるチャネルのエネルギー分布に与えるこのような影響は、2チャネルから5.1チャネルを再現する場合にも、パラメータ
Figure 2011018060
を送信することによって解消される。
信号化手段が装備されていれば、エンコーダは様々なパラメータ・セットを使用して当該の信号セグメントを符号化し、処理されつつある特定の信号セグメントにとって最低の負荷を与えるIIDパラメータ・セットを選ぶことができる。この時、右の前/後チャネル間のエネルギー・レベルが類似し、かつ左の前/後チャネル間のエネルギー・レベルは類似しているが右の前/後チャネルのレベルとは著しく異なる、という可能性はある。パラメータのデルタ符号化及び後続のエントロピー符号化を実施する場合には、r3及びr4の代わりにq3及びq4を使用することがより効率的である可能性がある。異なる特徴を有する別の信号セグメントに対しては、異なるパラメータ・セットを用いてビットレート負荷を減少させることができる。本発明は、信号セグメントの上記特徴によって、その時点で符号化される信号セグメントのビットレート負荷を最小限に抑えるために、様々なパラメトリック表示の中での自由な切換えを可能にする。最低限度のビットレート負荷を達成するために、IIDパラメータの様々なパラメータ化の中で切換えを実行し、かつその時点でどのパラメータ化が使用されているかを示す信号化手段を提供できる点は、本発明の本質的な特徴である。
さらに、パラメータのデルタ符号化並びに様々なパラメータ間のデルタ符号化は、周波数軸または時間軸の何れかで行うことができる。本発明によれば、使用される特定のデルタ符号化を示す信号化手段を提供できる場合には、パラメータは他の任意のパラメータに関してデルタ符号化されてもよい。
任意の符号化スキームに関する望ましい特徴として、スケーラブル符号化を実行する能力が挙げられる。これは、符号化されたビットストリームを複数の異なるレイヤに分割できることを意味する。コアレイヤはそれ自身で復号可能であり、より高位のレイヤは復号されたコアレイヤ信号を補強するように復号されることが可能である。異なる環境下では利用可能なレイヤの数は変わる可能性があるが、コアレイヤが利用可能である限り、デコーダは出力サンプルを生成することができる。上述のr1乃至r5パラメータを使用するマルチチャネル符号化のためのパラメータ化は、スケーラブル符号化によく適合する。故に、例えばエンハンスレイヤにおける2つのサラウンド・チャネル(A及びE)のためのデータ、即ちパラメータr3及びr4と、コアレイヤ内の前チャネルに対応するr1及びr2で表示されるパラメータとを格納することが可能である。
図10に本発明によるスケーラブル・ビットストリームの構成を示す。ビットストリームレイヤは1001及び1002で示され、1001は、波形符号化されたダウンミックス信号と、前チャネル(102,103及び104)の再生に必要なパラメータr1及びr2とを持つコアレイヤである。1002で示すエンハンスレイヤは、後チャネル(101及び105)を再生するためのパラメータr3,r4を持つ。
本発明の他の重要な態様は、マルチチャネル構成におけるデコリレータの使用である。デコリレータを使用する概念は、特許文献1において、1から2チャネルの場合に関して詳述されている。しかしながら、この理論を2以上のチャネルの場合へと拡大すると、幾つかの問題が発生する。本発明は、これらの問題を解決する。
初等数学によれば、N個の信号からM個の相互に非相関な信号を実現するためには、M−N個のデコリレータが必要となる。但し、異なるデコリレータは全て、共通の入力信号から相互に直交する出力信号を生成する関数器である。デコリレータは、典型的には全域通過フィルタまたは全域通過に近いフィルタであり、入力x(t)が与えられた時、E[|y|2]=E[|x|2]及び略零に近い相互相関関係E[yx*]を有する出力y(t)を生成する。優れたデコリレータの設計にはさらなる知覚的基準が加わるが、設計方法の幾つかの例は、オリジナル信号を非相関信号へ加算する際にコムフィルタの特徴を最小限に抑え、かつ過渡信号の中で時として長すぎるインパルス応答の効果を最小限に抑えるものであってもよい。先行技術によるデコリレータの中には、人工残響器(artificial reverberator)を使用して非相関にするものがある。また先行技術は、より高いエコー密度、ひいてはさらなる時間冗長を達成するために、例えば複合サブバンド・サンプルの位相を修正するような非整数遅延(fractional delays)処理も含む。
本発明は、1つの残響ベースのデコリレータを修正して、共通の入力信号から相互に非相関な出力信号を生成する複数のデコリレータを達成するための方法を提案する。2つのデコリレータは、同じ入力が与えられた時、それらの出力y1(t)及びy2(t)が、零かまたは略零に近い相互相関性を有していれば、相互に非相関と言える。入力が定常性のホワイトノイズであるものと仮定すれば、インパルス応答h1及びh2は、E[h12 *]が零かまたは略零に近いという意味で、直交していなければならないことになる。ペア単位で相互に非相関であるデコリレータのセットは、幾つかの方法で構築することができる。このような修正の効率的な実行方法の1つは、上記非整数遅延の一部である位相回転ファクタqを変化させることである。
本発明では、位相回転ファクタは、全域通過フィルタ内の遅延ラインの一部であってもよいし、または単に全体的な非整数遅延であってもよい、と規定している。後者の場合、この方法は全域通過フィルタまたは残響状のフィルタに限定されず、例えば非整数遅延部分を含む単純遅延に適用することもできる。デコリレータにおける全域通過フィルタ・リンクは、Zドメインにおいて、
Figure 2011018060
と記述することができる。但し、qは複素数値による位相回転ファクタ(|q|=1)であり、mはサンプル内の遅延ラインの長さであり、aはフィルタ係数である。安定性を理由として、フィルタ係数の大きさは、|a|<1に限定されなければならない。しかしながら、代替フィルタ係数a'=−aを使用することで、同じ残響減衰特性を有し、他方でその出力は非修正残響器からの出力とは著しく非相関である、新たな残響器が定義される。さらに、位相回転ファクタqの修正は、例えば一定の位相オフセットq'=qejcを加算することで実行することができる。定数Cは、一定の位相オフセットとして使用されてもよいが、それが適用される全ての周波数帯のための一定の時間オフセットに対応するように、スケーリングされてもよい。また位相オフセット定数Cは、全ての周波数帯で異なるランダム値であってもよい。
本発明によれば、m個のチャネルからのn個のチャネルの生成は、サイズn×(m+p)を有するアップミックス行列Hを、信号
Figure 2011018060
のサイズ(m+p)×1を有する列ベクトルに適用することにより実行される。但し、mはmダウンミックスされかつ符号化された信号であり、s内のp信号は、相互に非相関であり、かつm内の全信号と非相関である。これらの非相関信号は、m内の信号からデコリレータによって生成される。次に、n個の再現信号a’,b’,...は、列ベクトルx’=Hyに包含される。
上述の説明は図11に示され、非相関信号はデコリレータ1102、1103及び1104によって生成される。アップミックス行列Hは1101で示され、ベクトルyに作用して出力信号x’を生成する。
R=E[xx*]をオリジナル信号ベクトルの相関行列とし、R’=E[x’x’*]を再現された信号の相関行列とする。この場合、及びこれ以降、複素数成分を有する行列またはベクトルXに関して、X*は随伴行列、即ちXの複素共軛転置行列を指す。Rの対角はエネルギー値A,B,C,...を含み、上述のように定義したエネルギーの割当量から合計エネルギーレベルへと復号化されることが可能である。R*=Rであることから、アップミックス行列Hの調整によって完全または部分的に再現されるべき情報を含む異なる非対角の相互相関値は、n(n−1)/2個しか存在しない。完全相関構成の再現は、R’=Rの場合に相当する。正確なエネルギー・レベルの再現は、R’及びRがその対角上で等しい場合に対してのみ対応する。
m=1チャネルからnチャネルを再現する場合では、完全な相関構成の再現は、p=n−1個の相互に非相関なデコリレータと、条件、
Figure 2011018060
を満たすアップミックス行列Hとを使用することにより達成される。但し、Mは単一の送信された信号のエネルギーである。Rは半正値(positive semidefinite)であることから、このような手法が存在することは周知である。さらに、Hの設計に関してはn(n−1)/2の自由度が残され、本発明ではこれを使用してアップミックス行列の望ましいさらなる特性が得られる。中心的な設計基準は、送信される相関データに対するHの依存性は略平坦である、というものである。
アップミックス行列をパラメータ化する簡便な方法の1つは、H=UDVである。但し、U及びVは直交行列であり、Dは対角行列である。Dの絶対値の平方は、R/Mの固有値に等しくなるように選ぶことができる。第1の座標へ最大値が適用されるように、Vを省いて固有値をえり分けることで、出力における非相関信号の全体エネルギーは最小限に抑えられる。現実の場合には、直交行列Uはn(n−1)/2の回転角でパラメータ化される。これらの角度の形式を持つ相関データとDのn個の対角値とを送信すれば、Hの好ましい平坦化された依存性が即座にもたらされるであろう。しかしながら、この手法では、エネルギーデータが固有値に変換されなければならないことから、スケーラビリティが犠牲にされる。
本発明が提供する第2の方法は、正規化された相関行列R0をR=GR0Gで定義することにより、Rにおける相関部分からエネルギー部分を分離する方法である。但し、GはRの対角成分の平方根に等しい対角値を有する対角行列、即ち√A,√B...であり、R0は対角上に1を有する。等しいエネルギーを有する完全に非相関な信号の場合において、H0を、好適な正規化されたアップミックスを定義する直交アップミックス行列であるとする。このような好適なアップミックス行列の例は、
Figure 2011018060
である。
この時、アップミックスは、
Figure 2011018060
で定義される。但し、行列SはSS*=R0の解である。R0における正規化された相互相関値に対するこの解の依存性は、連続性を有するように、かつR0=Iの場合においてSが恒等行列(identity matrix)Iに等しくなるように選択される。
n個のチャネルをより少ないチャネル・グループに分割することは、部分的な相互相関構成を再現する簡便な方法である。本発明によれば、1チャネルから5.1チャネルを再現する場合にとって特に効果的なグループ分けは、{a,e},{c},{b,d},{f}である。但し、グループ{c},{f}に非相関化は適用されず、グループ{a,e},{b,d}は同じようにダウンミックス化/非相関化されたペアのアップミックスによって生成される。これら2つのサブシステムのために、完全に非相関化された場合における好ましい正規化されたアップミックスは、各々、
Figure 2011018060
として選定される。従って、合計15個の相互相関関係うちの僅か2つ、即ちチャネル{a,e}及び{b,d}の間の相互相関関係だけが送信され、再現されることになる。上述の説明で使用した用語上では、n=6,m=1及びp=1の場合に関する設計の一例となる。アップミックス行列Hは6×2のサイズを持ち、出力c’及びf’に対応する、第3行及び第6行の第2の列における2つの成分にゼロを有する。
本発明が提供する非相関化された信号を組み込む第3の手法は、より単純な視点から、各出力チャネルが、非相関化された信号sa,sb...を発生させる異なるデコリレータを備える、というものである。従って、再現される信号は、
Figure 2011018060
として形成される。
パラメータφa,φb...は、出力チャネルa’,b’,...内に存在する非相関化された信号の量を制御する。相関データは、これらの角度の形式で送信される。例えば、チャネルa’及びb’間に結果的に生じる正規化された相互相関関係が積cosφacosφbに等しい、という計算は容易である。ペア単位の相互相関関係の数がn(n−1)/2であり、かつn個のデコリレータが存在することから、n>3である場合には、概してこの手法では与えられた相関構成に適合することができない。しかし、復号方法が極めて単純かつ安定していて、各出力チャネル内に存在する非相関化された信号の生成量を直接制御できるという優位点がある。これにより、非相関化された信号のミキシングは、例えばチャネル・ペアのエネルギーレベル差を組み込む知覚的基準に基づいて実行することが可能になる。
m>1個のチャネルからn個のチャネルを再現する場合では、相関行列Ry=E[yy*]をもはや対角であるとすることはできず、この点は、R’=HRy*を目標Rへ整合させる際に考慮されなければならない。Ryは、ブロック行列構成、
Figure 2011018060
を有することから、単純化することができる。但し、Rm=E[mm*]であり、Rs=E[ss*]である。さらに、相互非相関化されたデコリレータを想定すると、行列Rsは対角である。この点は、正確なエネルギーの再現に関連して、アップミックスの設計にも影響を与えることに留意されたい。解決法としては、ダウンミックスされた信号の相関構成Rmに関する情報をデコーダにおいて計算するか、またはエンコーダから送信することが挙げられる。
2つのチャネルから5.1チャネルを再現する場合では、アップミックスの好適な方法は、
Figure 2011018060
である。但し、s1はm1=ldの非相関化から得られ、s2はm2=rdの非相関化から得られる。
この場合、グループ{a,b}及び{d,e}は、ペア単位の相互相関関係を考慮しながら、別個の1→2チャネル・システムとして扱われる。チャネルc及びfに関しては、重みが、
Figure 2011018060
であるように調整される。
本発明は、ハードウェア・チップ及びDSPの双方において、様々な種類のシステムのために、アナログまたはデジタルの信号の記憶または送信に、任意のコーデックを使用して適用することができる。図2及び図3は、本発明の可能な適用例を示す。この例では、6つの入力信号(5.1チャネル構成)に作用するシステムが表示されている。図2はエンコーダ側を示し、別々のチャネル用のアナログ入力信号がデジタル信号に変換201され、各チャネル毎にフィルタバンクを使用して解析202される。フィルタバンクからの出力はサラウンド・エンコーダ203へ供給され、このサラウンド・エンコーダ203に含まれるパラメータ生成器がダウンミックスを実行して、オーディオ・エンコーダ205により符号化されるべき1つまたは2つのチャネルが生成される。さらに本発明により、IIDパラメータ及びICCパラメータ等のサラウンド・パラメータが抽出され、かつ制御データ204が抽出され、この制御データは、上記データの時間周波数グリッドと、どのパラメータ化が使用されるかを略示する。抽出されたパラメータは、本発明によれば、様々なパラメータ化間での切換か、またはパラメータのスケーラブルな配置かの何れかの方法によって符号化206される。サラウンド・パラメータ207と、制御信号と、ダウンミックスされ符号化された信号208とは、多重化209されて連続的なビットストリームとなる。
図3はデコーダの典型的な適用例、即ちマルチチャネル再現を実現するための装置を表示している。ここでは、オーディオ・デコーダは、QMF合成フィルタバンクに先立って、周波数ドメイン表示の信号、例えばMPEG−4高効率AACデコーダからの出力信号を出力することが想定されている。上記連続的なビットストリームは逆多重化301され、符号化されたサラウンド・データはサラウンド・データ・デコーダ303へと供給され、ダウンミックスされ符号化されたチャネルは、本例ではMPEG−4高効率AACデコーダであるオーディオ・デコーダ302へと供給される。上記サラウンド・データ・デコーダはサラウンド・データを復号し、それをサラウンド・デコーダ305へと供給する。サラウンド・デコーダ305はアップミキサを含み、アップミキサは、復号されたダウンミックス・チャネルと、サラウンド・データと、制御信号304とに基づいて6つのチャネルを再生する。サラウンド・デコーダからの周波数ドメインの出力は、合成306されて時間ドメイン信号となり、この信号は続いてDAC307によりアナログ信号に変換される。
以上、主にバランス・パラメータの生成及び使用に関連して本発明を説明してきたが、好適には、バランス・パラメータを導出するための同じチャネル・ペアのグループ分けが、これらの2つのチャネル・ペア間のチャネル間コヒーレンス・パラメータまたは「幅」パラメータの計算にも使用される点は強調されるべきである。さらに、チャネル間の時間差またはある種の「位相キュー」も、バランス・パラメータの計算に使用される同じチャネル・ペアを使用して導出することができる。レシーバ側では、これらのパラメータをバランス・パラメータに追加して、またはその代替として使用し、マルチチャネル再現を実現することができる。或いは、チャネル間コヒーレンス・パラメータまたはチャネル間時間差をも、他の参照チャネルによって決定される他のチャネル間レベル差に追加して使用することができる。但し、図10a及び図10bに関連して上述したような、本発明のスケーラビリティに関する特徴の観点からすると、全てのパラメータに同一のチャネル・ペアを使用することが好適である。その場合、スケーラブル・ビットストリーム内において、各スケーリングレイヤが、出力チャネルのサブグループを再現するための全パラメータを含み、それら出力チャネルのサブグループは、図10bの表における最後から2番目の列に略示しているような個々のスケーリングレイヤにより生成され得るものである。本発明は、個々のチャネル・ペア間のコヒーレンス・パラメータまたは時間差パラメータのみが計算されてデコーダへ送信される場合に有益である。この場合、レベル・パラメータは、マルチチャネル再現が実行される時、デコーダに既に存在して使用可能となっている。
本発明の方法を実施する際には所定の要件に依存するが、本発明の方法はハードウェアまたはソフトウェアにおいて実装することができる。これらの実装は、デジタル式の記憶媒体、特に本発明の方法が実行されるようにプログラム可能なコンピュータ・システムと共働する、内部に格納された電子的に読取り可能な制御信号を有するディスクまたはCDを使用して、実行することができる。従って、概して本発明は、機械で読取り可能なキャリア上に記憶されるプログラム・コードを有するコンピュータ・プログラムの製品であり、このプログラム・コードは、上記コンピュータ・プログラムの製品がコンピュータ上で使用される際に本発明の方法を実行するように動作する。換言すれば、本発明の方法は、上記コンピュータ・プログラムがコンピュータ上で使用される際に、少なくとも1つの本発明の方法を実行するためのプログラム・コードを有するコンピュータ・プログラムである。
101 後左チャネル(左サラウンド・チャネル)
102 前左チャネル
103 前中央チャネル
104 前右チャネル
105 後右チャネル(右サラウンド・チャネル)
106 LFE(低周波強化)チャネル
203 サラウンド・エンコーダ
205 オーディオ・エンコーダ
206 サラウンド・データ・エンコーダ
209 マルチプレクサ
301 デマルチプレクサ
302 オーディオ・デコーダ
303 サラウンド・データ・デコーダ
305 サラウンド・デコーダ
700 ダウンミキサ
900 レベル・パラメータ計算器
902 レベル補正器

Claims (30)

  1. 少なくとも3つのオリジナル・チャネルを有するマルチチャネル入力信号のパラメータ表示を生成するための装置であって、
    第1チャネル・ペア間の第1バランス・パラメータ、第1コヒーレンス・パラメータ又は第1時間差パラメータと、第2チャネル・ペア間の第2バランス・パラメータ、第2コヒーレンス・パラメータ又は第2時間差パラメータとを生成するためのパラメータ生成器(203)を備え、
    上記バランス・パラメータ、コヒーレンス・パラメータ又は時間差パラメータは上記パラメータ表示を構成するものであり、
    上記第1チャネル・ペアは、上記第2チャネル・ペアの2つのチャネルとは異なる2つのチャネルを有し、
    上記2つのチャネル・ペアの各チャネルは、上記オリジナル・チャネルのうちの1つか、上記オリジナル・チャネルの重み付けされ又は重み付けされていない組合せか、ダウンミックス・チャネルか、あるいは少なくとも2つのダウンミックス・チャネルの重み付けされ又は重み付けされていない組合せであり、
    上記第1チャネル・ペアと上記第2チャネル・ペアとは、上記3つのオリジナル・チャネルに関する情報を含み、
    上記パラメータ生成器はパラメータの様々なセットを生成し、各セットは少なくとも2つのパラメータを含み、上記様々なセットの中のパラメータを計算するために使用されるチャネル・ペアは互いに異なり、
    上記パラメータ生成器はさらに、所定のパラメータ符号化スキームが与えられた時、低いビットレートに抑えられるように上記様々なセットの中の1つのセットを現時点で符号化されつつある信号セグメントのための出力として選択し、
    上記装置は、上記選択されたセットを所定のパラメータ符号化スキームを用いて符号化するためのパラメータ・エンコーダと、上記選択されたパラメータ・セットの特性を示す制御情報を生成するためのパラメータ制御情報生成器とをさらに備え、
    上記選択されたパラメータ・セットを特徴付ける上記制御情報(204)は、出力ビットストリームの中に含まれることを特徴とする装置。
  2. 上記オリジナル・チャネルは左チャネル(B)と右チャネル(D)と中央チャネル(C)とを含み、
    上記第2バランス・パラメータ(r2 )は中央バランス・パラメータであり、上記第2チャネル・ペアは、第1チャネルとして上記中央チャネルを有し、第2チャネルとして上記左チャネルと上記右チャネルとを含むチャネルの組合せを有することを特徴とする、請求項1に記載の装置。
  3. 上記パラメータ生成器は上記中央バランス・パラメータを次式により計算し、
    Figure 2011018060
    2 は上記中央バランス・パラメータであり、Cは上記中央チャネルを示し、Bは左チャネルを示し、Dは右チャネルを示し、γとαとはダウンミックス・ファクタを示すことを特徴とする、請求項2に記載の装置。
  4. 上記第1バランス・パラメータ(r1 )は左/右バランス・パラメータであり、上記第1チャネル・ペアは、第1チャネルとして左チャネル又は左ダウンミックス・チャネルを有し、第2チャネルとして右チャネル又は右ダウンミックス・チャネルを有することを特徴とする、請求項1乃至3のいずれか1項に記載の装置。
  5. 上記パラメータ生成器は上記第1のバランス・パラメータを次式により計算し、
    Figure 2011018060
    1 は上記第1バランス・パラメータであり、Lは第1ダウンミックス・チャネルを示し、Rは第2ダウンミックス・チャネルを示し、Bは左チャネルを示し、Dは右チャネルを示し、Aは後左チャネルを示し、Eは後右チャネルを示し、Cは中央チャネルを示し、Fは低周波強化チャネルを示し、α,β,γ,δはダウンミックス・ファクタを示すことを特徴とする、請求項4に記載の装置。
  6. 上記オリジナル・チャネルは後左チャネル(A)と後右チャネル(E)とを含み、
    上記パラメータ生成器は、第3バランス・パラメータ(r3)として、又は第1および第2バランス・パラメータのうちの1つとして、前/後のチャネル・ペア間における前/後のバランス・パラメータを生成し、上記前/後のチャネル・ペアは、第1チャネルとして上記後左チャネルと上記後右チャネルとを含むチャネルの組合せを有し、第2チャネルとして左チャネルと右チャネルとを含むチャネルの組合せを有することを特徴とする、請求項1乃至5のいずれか1項に記載の装置。
  7. 上記パラメータ生成器は上記前/後のバランス・パラメータ(r3)を次式により計算し、
    Figure 2011018060
    3 は上記前/後のバランス・パラメータであり、Aは後左チャネルを示し、Eは後右チャネルを示し、Bは左チャネルを示し、Dは右チャネルを示し、Cは中央チャネルを示し、α,β,γはダウンミックス・ファクタを示すことを特徴とする、請求項6に記載の装置。
  8. 上記オリジナル・マルチチャネル信号は後左チャネルと後右チャネルとを含み、
    上記パラメータ生成器は、追加的なバランス・パラメータとして、あるいは第1又は第2バランス・パラメータとして、後の左/右チャネル・ペア間における後の左/右バランス・パラメータ(r4)を生成し、上記後の左/右チャネル・ペアは、第1チャネルとして上記後左チャネルを有し、第2チャネルとして上記後右チャネルを有することを特徴とする、請求項1乃至7のいずれか1項に記載の装置。
  9. 上記オリジナル・マルチチャネル信号は低周波強化チャネルと中央チャネルとを含み、
    上記パラメータ生成器は、追加的なバランス・パラメータとして、あるいは第1又は第2バランス・パラメータとして、低周波強化チャネル・ペア間における低周波強化バランス・パラメータを生成し、上記低周波強化チャネル・ペアは、第1チャネルとして上記低周波強化チャネルを有し、第2チャネルとして上記中央チャネルか、又はこの中央チャネルとオリジナル・チャネルの左右のチャネルとを含むチャネルの組合せを有することを特徴とする、請求項1乃至8のいずれか1項に記載の装置。
  10. 上記パラメータ生成器は上記低周波強化バランス・パラメータを次式により計算し、
    Figure 2011018060
    Aは後左チャネルを示し、Eは後右チャネルを示し、Bは左チャネルを示し、Dは右チャネルを示し、Cは中央チャネルを示し、Fは低周波強化チャネルを示し、α,β,γ,δはダウンミックス・ファクタを示し、r5 は上記低周波強化バランス・パラメータを示すことを特徴とする、請求項9に記載の装置。
  11. 上記パラメータ生成器は、上記第1および第2バランス・パラメータの内の1つとして、あるいは追加的なバランス・パラメータとして、片側の前/後のチャネル・ペア間で少なくとも1つの片側の前/後のバランス・パラメータ(q3 ,q4)を生成し、上記片側の前/後のチャネル・ペアは、第1チャネルとして後左チャネルを有しかつ第2チャネルとして左チャネルを有するか、又は第1チャネルとして後右チャネルを有しかつ第2チャネルとして右チャネルを有することを特徴とする、請求項1乃至10のいずれか1項に記載の装置。
  12. 上記第1および第2バランス・パラメータの内の1つは第1の左又は右のバランス・パラメータであり、そのチャネル・ペアは、第1チャネルとして左ダウンミックス・チャネルを有し、第2チャネルとして左オリジナル・チャネル又は後左オリジナル・チャネルを有し、
    上記第1および第2バランス・パラメータの内の1つは右のバランス・パラメータであり、そのチャネル・ペアは、第1チャネルとして右ダウンミックス・チャネルを有し、第2チャネルとして右オリジナル・チャネル又は後右オリジナル・チャネルを有し、
    上記第1又は第2バランス・パラメータ又は追加的なバランス・パラメータのうちの1つは中央バランス・パラメータであり、そのチャネル・ペアは、第1チャネルとして左右のダウンミックス・チャネルの合計を有し、第2チャネルとしてオリジナル中央チャネルを有することを特徴とする、請求項1乃至11のいずれか1項に記載の装置。
  13. 上記パラメータ生成器は、第1バランス・パラメータとして左バランス・パラメータを生成し、第2バランス・パラメータとして右バランス・パラメータを生成し、第3バランス・パラメータとして中央バランス・パラメータを生成することを特徴とする、請求項12に記載の装置。
  14. 上記パラメータ生成器は、第4バランス・パラメータとして左/左サラウンドのバランス・パラメータを生成し、第5バランス・パラメータとして右/右サラウンドのバランス・パラメータを生成することを特徴とする、請求項12に記載の装置。
  15. 上記パラメータ・エンコーダは量子化器を含むことを特徴とする、請求項1乃至14のいずれか1項に記載の装置。
  16. 上記パラメータ生成器は、上記チャネル・ペアに含まれるチャネルとして、ベース・チャネル又はベース・チャネルの組合せを使用せず、オリジナル・チャネル又はオリジナル・チャネルの組合せだけを使用することを特徴とする、請求項1乃至15のいずれか1項に記載の装置。
  17. 上記パラメータ・エンコーダは、上記選択されたセットのデルタ符号化およびそれに続くエントロピー符号化を実行するよう構成されていることを特徴とする、請求項1乃至16のいずれか1項に記載の装置。
  18. 上記デルタ符号化は、周波数軸及び時間軸のいずれか、又は異なるパラメータ間で実行され、
    上記使用されたデルタ符号化を示す信号化手段をさらに備えていることを特徴とする、請求項17に記載の装置。
  19. 少なくとも3つのオリジナル・チャネルを有するオリジナル・マルチチャネル信号の再生マルチチャネル表示を生成するための装置であって、この装置は、ダウンミックス・スキームを用いて上記オリジナル・マルチチャネル信号を変換することで生成された1つ又は複数のベース・チャネルと、第1チャネル・ペア間の第1バランス・パラメータ、第1コヒーレンス・パラメータ又は第1時間差パラメータと、第2チャネル・ペア間の第2バランス・パラメータ、第2コヒーレンス・パラメータ又は第2時間差パラメータとを使用しており、
    上記第1と第2のバランス・パラメータ、コヒーレンス・パラメータ又は時間差パラメータはパラメータ表示を構成するものであり、上記第1チャネル・ペアは、上記第2チャネル・ペアが有する2つのチャネルとは異なる2つのチャネルを有し、上記2つのチャネル・ペアの各チャネルは、上記オリジナル・チャネルのうちの1つか、上記オリジナル・チャネルの重み付けされ又は重み付けされていない組合せか、ダウンミックス・チャネルか、あるいは少なくとも2つのダウンミックス・チャネルの重み付けされ又は重み付けされていない組合せであり、上記第1チャネル・ペアと上記第2チャネル・ペアとは、上記3つのオリジナル・チャネルに関する情報を含み、
    さらに選択されたパラメータ・セットを特徴付ける制御情報(304)を用いる装置において、
    複数のアップミックス・チャネルを生成するためのアップミキサ(305)を備え、上記アップミックス・チャネルの数はベース・チャネルの数よりも多くかつオリジナル・チャネルの数よりも少ないか同数であり、
    上記ダウンミックス・スキームに関する情報に基づき、かつ、第1のチャネル・ペア間のバランス、コヒーレンス又はチャネル間時間差が上記第1バランス・パラメータに基づいて決定され、かつ第2のチャネル・ペア間のバランス、チャネル間コヒーレンス又はチャネル間の時間差が上記第2バランス・パラメータに基づいて決定されるように、上記バランス・パラメータ、コヒーレンス・パラメータ又はチャネル間時間差を使用して、上記アップミキサは再生チャネルを生成し、
    上記アップミキサ(305)がパラメータ・セット制御情報によって示されたパラメータ・セットを適用するように、上記アップミキサを制御するためのパラメータ・セット選択器をさらに備えることを特徴とする装置。
  20. 上記オリジナル・チャネルは左チャネル(B)と右チャネル(D)と中央チャネル(C)とを含み、
    上記第2バランス・パラメータ(r2 )は中央バランス・パラメータであり、上記第2チャネル・ペアは、第1チャネルとして上記中央チャネルを有し、第2チャネルとして上記左チャネルと上記右チャネルとを含むチャネルの組合せを有し、
    上記アップミキサは、上記第2バランス・パラメータ(r2)に基づいて、再生中央チャネルを生成することを特徴とする、請求項19に記載の装置。
  21. 上記第1バランス・パラメータ(r1)は左/右バランス・パラメータであり、上記第1チャネル・ペアは、第1チャネルとして左チャネル又は左ダウンミックス・チャネルを有し、第2チャネルとして右チャネル又は右ダウンミックス・チャネルを有し、
    上記アップミキサは、上記第1バランス・パラメータ(r1)に基づいて、再生左チャネルと再生右チャネルとを生成することを特徴とする、請求項19又は20に記載の装置。
  22. 上記オリジナル・チャネルは後左チャネル(A)と後右チャネル(E)とを含み、
    上記パラメータ表示は、第3バランス・パラメータ(r3)として、又は第1および第2バランス・パラメータの内の1つとして、前/後のチャネル・ペア間における前/後のバランス・パラメータを含み、上記前/後のチャネル・ペアは、第1チャネルとして上記後左チャネルと上記後右チャネルとを含むチャネルの組合せを有し、第2チャネルとして左チャネルと右チャネルとを含むチャネルの組合せを有し、
    上記アップミキサは、前/後のバランス・パラメータ(r3)を用いて、再生組合せ後チャネルを生成することを特徴とする、請求項19乃至21のいずれか1項に記載の装置。
  23. 上記オリジナル・マルチチャネル信号は後左チャネルと後右チャネルとを含み、
    上記パラメータ表示は、追加的なバランス・パラメータとして、あるいは第1又は第2バランス・パラメータとして、後の左/右チャネル・ペア間における後の左/右バランス・パラメータ(r4)を含み、上記後の左/右チャネル・ペアは、第1チャネルとして上記後左チャネルを有し、第2チャネルとして上記後右チャネルを有することを特徴とする、請求項19乃至22のいずれか1項に記載の装置。
  24. 上記装置に供給されるパラメータ情報は、第1バランス・パラメータとして左/右のバランス・パラメータを含み、第2バランス・パラメータとして中央バランス・パラメータを含み、第3バランス・パラメータとして前/後のバランス・パラメータを含み、第4バランス・パラメータとして後の左/右バランス・パラメータを含み、第5バランス・パラメータとして低周波強化バランス・パラメータを含み、上記データストリームは、上記第1および第2バランス・パラメータを低位のスケーリングレイヤの中に含み、上記第3および第4バランス・パラメータ、対応するコヒーレンス・パラメータ又は対応する時間差を単一又は複数の高位のスケーリングレイヤの中に含み、かつ
    上記アップミキサは、上記第1バランス・パラメータと上記第2バランス・パラメータとを用いて、左出力チャネルと、右出力チャネルと、上記中央出力チャネルを含む出力チャネルとを生成するか、又は
    上記アップミキサは、上記前/後のバランス・パラメータをさらに用いて、上記後左チャネルと上記後右チャネルとの合計をさらに再現するか、又は
    上記アップミキサは、追加的に、上記後の左/右バランス・パラメータを用いて、後左チャネルと後右チャネルとを再現することを特徴とする、請求項19乃至23のいずれか1項に記載の装置。
  25. 上記アップミキサは上記再生マルチチャネル信号を次式により生成し、
    Figure 2011018060
    Fは低周波強化チャネルを示し、Aは左サラウンド・チャネルを示し、Eは右サラウンド・チャネルを示し、Cは中央チャネルを示し、Bは左チャネルを示し、Dは右チャネルを示し、r1 は左/右バランス・パラメータであり、r2 は中央/左+右バランス・パラメータであり、r3 は前/後のバランス・パラメータであり、r4 は後の左/右バランス・パラメータであり、r5 は中央/低周波強化バランス・パラメータであり、α,β,γ, δはダウンミックス・ファクタを示すことを特徴とする、請求項24に記載の装置。
  26. 上記ベース・チャネルの数は2以下であり、上記パラメータ表示は、第1および第2バランス・パラメータのうちの1つとして、又は追加的なバランス・パラメータとして、片側の前/後のチャネル・ペア間で少なくとも1つの片側の前/後のバランス・パラメータ(q3 ,q4)を含み、上記片側の前/後のチャネル・ペアは、第1チャネルとして後左チャネルを有しかつ第2チャネルとして左チャネルを有するか、又は第1チャネルとして後右チャネルを有しかつ第2チャネルとして右チャネルを有し、
    上記アップミキサは、左チャネル又は右チャネルと対応する片側の前/後のバランス・パラメータとに基づいて、再生の後左チャネル又は再生の後右チャネルを生成することを特徴とする、請求項19乃至25のいずれか1項に記載の装置。
  27. 上記第1および第2バランス・パラメータの内の1つは第1の左又は右のバランス・パラメータであり、そのチャネル・ペアは、第1チャネルとして左ダウンミックス・チャネルを有し、第2チャネルとして左オリジナル・チャネル又は後左オリジナル・チャネルを有し、あるいは、
    上記第1および第2バランス・パラメータの内の1つは右のバランス・パラメータであり、そのチャネル・ペアは、第1チャネルとして右ダウンミックス・チャネルを有し、第2チャネルとして右オリジナル・チャネル又は後右オリジナル・チャネルを有し、あるいは、
    上記第1又は第2バランス・パラメータ又は追加的なバランス・パラメータのうちの1つは中央バランス・パラメータであり、そのチャネル・ペアは、第1チャネルとして左右のダウンミックス・チャネルの合計を有し、第2チャネルとしてオリジナル中央チャネルを有し、かつ
    上記アップミキサは、上記パラメータと、上記第1ベース・チャネル又は上記第2ベース・チャネル又は上記第1および第2ベース・チャネルの組合せとを用いて、上記再生チャネルを生成することを特徴とする、請求項19乃至26のいずれか1項に記載の装置。
  28. 上記パラメータ・セットは、r3及びr4の代わりにq3及びq4 を含み、
    上記q3 は、第1チャネルとして後−左チャネルを持ち、第2チャネルとして左チャネルを持つ、片側の前/後のチャネル・ペア間の第1の片側の前/後のバランス・パラメータであり、
    上記q4 は、第1チャネルとして後−右チャネルを持ち、第2チャネルとして右チャネルを持つ、片側の前/後のチャネル・ペア間の第2の片側の前/後のバランス・パラメータであり、
    上記r3 は前/後のバランスパラメータであり、
    上記r4 は後の左/右バランスパラメータであることを特徴とする請求項19乃至27のいずれか1項に記載の装置。
  29. 少なくとも3つのオリジナル・チャネルを有するマルチチャネル入力信号のパラメータ表示を生成するための方法であって、
    第1チャネル・ペア間の第1バランス・パラメータ、第1コヒーレンス・パラメータ又は第1時間差パラメータを生成する工程(203)と、
    第2チャネル・ペア間の第2バランス・パラメータ、第2コヒーレンス・パラメータ又は第2時間差パラメータを生成する工程とを備え、
    上記バランス・パラメータ、コヒーレンス・パラメータ又は時間差パラメータは上記パラメータ表示を構成するものであり、
    上記第1チャネル・ペアは上記第2チャネル・ペアが有する2つのチャネルとは異なる2つのチャネルを有し、
    上記2つのチャネル・ペアの各チャネルは、上記オリジナル・チャネルのうちの1つか、上記オリジナル・チャネルの重み付けされ又は重み付けされていない組合せか、ダウンミックス・チャネルか、あるいは少なくとも2つのダウンミックス・チャネルの重み付けされ又は重み付けされていない組合せであり、
    上記第1チャネル・ペアと上記第2チャネル・ペアとは上記3つのオリジナル・チャネルに関する情報を含み、
    パラメータの様々なセットを生成し、各セットは少なくとも2つのパラメータを含み、上記様々なセットの中のパラメータを計算するために使用されるチャネル・ペアは互いに異なり、
    所定のパラメータ符号化スキームのもとで低いビットレートに抑えられるように、上記様々なセットの中の1つのセットを、現時点で符号化されつつある信号セグメントのための出力として選択し、
    上記方法は、上記選択されたセットを所定のパラメータ符号化スキームを用いて符号化し、上記選択されたパラメータ・セットの特性を示す制御情報を生成するステップをさらに備え、
    上記選択されたパラメータ・セットを特徴付ける上記制御情報は、出力ビットストリームの中に含まれることを特徴とする方法。
  30. 少なくとも3つのオリジナル・チャネルを有するオリジナル・マルチチャネル信号の再生マルチチャネル表示を生成する方法であって、
    上記方法は、ダウンミックス・スキームを用いて上記オリジナル・マルチチャネル信号を変換することで生成された1つ又は複数のベース・チャネルと、第1チャネル・ペア間の第1バランス・パラメータ、第1コヒーレンス・パラメータ又は第1時間差パラメータと、第2チャネル・ペア間の第2バランス・パラメータ、第2コヒーレンス・パラメータ又は第2時間差パラメータとを使用し、
    上記第1と第2のバランス・パラメータ、コヒーレンス・パラメータ又は時間差パラメータはパラメータ表示を構成するものであり、上記第1チャネル・ペアは、上記第2チャネル・ペアが有する2つのチャネルとは異なる2つのチャネルを有し、上記2つのチャネル・ペアの各チャネルは、上記オリジナル・チャネルのうちの1つか、上記オリジナル・チャネルの重み付けされ又は重み付けされていない組合せか、ダウンミックス・チャネルか、あるいは少なくとも2つのダウンミックス・チャネルの重み付けされ又は重み付けされていない組合せであり、上記第1チャネル・ペアと上記第2チャネル・ペアとは、上記3つのオリジナル・チャネルに関する情報を含み、
    さらに現時点で符号化されつつある信号セグメントのために選択されたパラメータ・セットを特徴付ける制御情報(304)を用いる方法において、
    ベース・チャネルの数よりも多くかつオリジナル・チャネルの数よりも少ないか同じである数のアップミックス・チャネルを生成する工程(305)を備え、上記生成工程(305)は、パラメータ・セット制御情報によって示された上記選択されたパラメータ・セットが上記信号セグメントに適用されるように制御され、
    上記アップミックス・チャネルを生成する工程は、上記ダウンミックス・スキームに関する情報に基づき、かつ、第1のチャネル・ペア間のバランス、コヒーレンス又はチャネル間時間差が上記第1バランス・パラメータに基づいて決定され、かつ第2のチャネル・ペア間のバランス、チャネル間コヒーレンス又はチャネル間時間差が上記第2のバランス・パラメータに基づいて決定されるように、上記バランス・パラメータ、コヒーレンス・パラメータ又はチャネル間時間差を使用して、上記アップミキサは再生チャネルを生成することを特徴とする方法。
JP2010183775A 2004-04-16 2010-08-19 マルチチャネルオーディオ信号を表示するための装置と方法 Active JP5185340B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE0400998A SE0400998D0 (sv) 2004-04-16 2004-04-16 Method for representing multi-channel audio signals
SE0400998-1 2004-04-16

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2007507735A Division JP4603037B2 (ja) 2004-04-16 2005-04-12 マルチチャネルオーディオ信号を表示するための装置と方法

Publications (2)

Publication Number Publication Date
JP2011018060A true JP2011018060A (ja) 2011-01-27
JP5185340B2 JP5185340B2 (ja) 2013-04-17

Family

ID=32294334

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2007507735A Active JP4603037B2 (ja) 2004-04-16 2005-04-12 マルチチャネルオーディオ信号を表示するための装置と方法
JP2007505521A Active JP4589962B2 (ja) 2004-04-16 2005-04-12 レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
JP2010178268A Active JP5185337B2 (ja) 2004-04-16 2010-08-09 レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
JP2010183775A Active JP5185340B2 (ja) 2004-04-16 2010-08-19 マルチチャネルオーディオ信号を表示するための装置と方法

Family Applications Before (3)

Application Number Title Priority Date Filing Date
JP2007507735A Active JP4603037B2 (ja) 2004-04-16 2005-04-12 マルチチャネルオーディオ信号を表示するための装置と方法
JP2007505521A Active JP4589962B2 (ja) 2004-04-16 2005-04-12 レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
JP2010178268A Active JP5185337B2 (ja) 2004-04-16 2010-08-09 レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法

Country Status (13)

Country Link
US (24) US8223976B2 (ja)
EP (2) EP1735775B8 (ja)
JP (4) JP4603037B2 (ja)
KR (2) KR100848365B1 (ja)
CN (4) CN1930608B (ja)
AT (2) ATE376240T1 (ja)
DE (2) DE602005002942T2 (ja)
ES (2) ES2294703T3 (ja)
HK (3) HK1093594A1 (ja)
PL (2) PL1695338T3 (ja)
SE (1) SE0400998D0 (ja)
TW (1) TWI334736B (ja)
WO (2) WO2005101370A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008522551A (ja) * 2004-11-30 2008-06-26 アギア システムズ インコーポレーテッド 被送出チャネルに基づくキューを用いる空間オーディオのパラメトリック・コーディング
JP2020510341A (ja) * 2017-03-08 2020-04-02 ディーティーエス・インコーポレイテッドDTS,Inc. 分散オーディオ仮想化システム

Families Citing this family (156)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60129742T2 (de) * 2000-12-19 2008-04-30 Azoteq (Proprietary) Ltd. Verfahren und vorrichtung zum datentransfer
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
WO2006008697A1 (en) * 2004-07-14 2006-01-26 Koninklijke Philips Electronics N.V. Audio channel conversion
TWI497485B (zh) * 2004-08-25 2015-08-21 Dolby Lab Licensing Corp 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
SE0402649D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7840411B2 (en) * 2005-03-30 2010-11-23 Koninklijke Philips Electronics N.V. Audio encoding and decoding
RU2416129C2 (ru) * 2005-03-30 2011-04-10 Конинклейке Филипс Электроникс Н.В. Масштабируемое многоканальное кодирование звука
BRPI0608945C8 (pt) * 2005-03-30 2020-12-22 Coding Tech Ab codificador de áudio de multi-canal, decodificador de áudio de multi-canal, método de codificar n sinais de áudio em m sinais de áudio e dados paramétricos associados, método de decodificar k sinais de áudio e dados paramétricos associados, método de transmitir e receber um sinal de áudio de multi-canal codificado, mídia de armazenamento legível por computador, e, sistema de transmissão
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2006126843A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
US8270439B2 (en) * 2005-07-08 2012-09-18 Activevideo Networks, Inc. Video game system using pre-encoded digital audio mixing
US8626503B2 (en) * 2005-07-14 2014-01-07 Erik Gosuinus Petrus Schuijers Audio encoding and decoding
US8074248B2 (en) 2005-07-26 2011-12-06 Activevideo Networks, Inc. System and method for providing video content associated with a source image to a television in a communication network
US8019614B2 (en) * 2005-09-02 2011-09-13 Panasonic Corporation Energy shaping apparatus and energy shaping method
KR101165640B1 (ko) 2005-10-20 2012-07-17 엘지전자 주식회사 오디오 신호의 디코딩 및 인코딩 방법 및 그 장치
CN1993002B (zh) * 2005-12-28 2010-06-16 雅马哈株式会社 声像定位设备
KR100803212B1 (ko) 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
TWI469133B (zh) 2006-01-19 2015-01-11 Lg Electronics Inc 媒體訊號處理方法及裝置
CN102693727B (zh) 2006-02-03 2015-06-10 韩国电子通信研究院 用于控制音频信号的渲染的方法
KR20080110920A (ko) 2006-02-07 2008-12-19 엘지전자 주식회사 부호화/복호화 장치 및 방법
KR100773560B1 (ko) 2006-03-06 2007-11-05 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
KR100773562B1 (ko) 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
US8059824B2 (en) * 2006-03-13 2011-11-15 France Telecom Joint sound synthesis and spatialization
US8370138B2 (en) * 2006-03-17 2013-02-05 Panasonic Corporation Scalable encoding device and scalable encoding method including quality improvement of a decoded signal
US7965848B2 (en) 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
US8619998B2 (en) * 2006-08-07 2013-12-31 Creative Technology Ltd Spatial audio enhancement processing method and apparatus
EP2410523B1 (en) * 2006-07-04 2013-01-30 Electronics and Telecommunications Research Institute Apparatus for restoring multi-channel audio signal using an MPEG surround decoder
PL2038878T3 (pl) 2006-07-07 2012-06-29 Fraunhofer Ges Forschung Urządzenie i sposób do łączenia wielu zakodowanych parametrycznie źródeł audio
FR2903562A1 (fr) 2006-07-07 2008-01-11 France Telecom Spatialisation binaurale de donnees sonores encodees en compression.
KR100763920B1 (ko) 2006-08-09 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치
CN101518103B (zh) * 2006-09-14 2016-03-23 皇家飞利浦电子股份有限公司 多通道信号的甜点操纵
JP4946305B2 (ja) * 2006-09-22 2012-06-06 ソニー株式会社 音響再生システム、音響再生装置および音響再生方法
JP5451394B2 (ja) * 2006-09-29 2014-03-26 韓國電子通信研究院 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法
KR20090013178A (ko) 2006-09-29 2009-02-04 엘지전자 주식회사 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치
WO2008044916A2 (en) * 2006-09-29 2008-04-17 Avinity Systems B.V. Method for streaming parallel user sessions, system and computer software
UA94117C2 (ru) * 2006-10-16 2011-04-11 Долби Свиден Ав Усовершенстованное кодирование и отображение параметров многоканального кодирования микшированных объектов
AU2007312597B2 (en) * 2006-10-16 2011-04-14 Dolby International Ab Apparatus and method for multi -channel parameter transformation
WO2008069596A1 (en) 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US9826197B2 (en) 2007-01-12 2017-11-21 Activevideo Networks, Inc. Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device
EP2632164A3 (en) * 2007-01-12 2014-02-26 ActiveVideo Networks, Inc. Interactive encoded content system including object models for viewing on a remote device
EP2111618A4 (en) * 2007-02-13 2010-04-21 Lg Electronics Inc METHOD AND APPARATUS FOR PROCESSING AUDIO SIGNAL
US20100106271A1 (en) 2007-03-16 2010-04-29 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US8612237B2 (en) * 2007-04-04 2013-12-17 Apple Inc. Method and apparatus for determining audio spatial quality
EP2278582B1 (en) * 2007-06-08 2016-08-10 LG Electronics Inc. A method and an apparatus for processing an audio signal
US8112388B2 (en) * 2007-08-03 2012-02-07 Sap Ag Dependency processing of computer files
US8295494B2 (en) 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
CN101889307B (zh) * 2007-10-04 2013-01-23 创新科技有限公司 相位-幅度3d立体声编码器和解码器
DE102007048973B4 (de) 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
EP2128856A4 (en) * 2007-10-16 2011-11-02 Panasonic Corp DEVICE FOR PRODUCING A STREAM AND DECODING DEVICE AND CORRESPONDING METHOD
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
WO2009068087A1 (en) * 2007-11-27 2009-06-04 Nokia Corporation Multichannel audio coding
US8204235B2 (en) * 2007-11-30 2012-06-19 Pioneer Corporation Center channel positioning apparatus
US8615088B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal using preset matrix for controlling gain or panning
EP2083585B1 (en) 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
WO2009125046A1 (en) * 2008-04-11 2009-10-15 Nokia Corporation Processing of signals
KR101381513B1 (ko) 2008-07-14 2014-04-07 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
JP5258967B2 (ja) * 2008-07-15 2013-08-07 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
TWI496479B (zh) 2008-09-03 2015-08-11 Dolby Lab Licensing Corp 增進多聲道之再生
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
EP2345027B1 (en) 2008-10-10 2018-04-18 Telefonaktiebolaget LM Ericsson (publ) Energy-conserving multi-channel audio coding and decoding
DE102008056704B4 (de) * 2008-11-11 2010-11-04 Institut für Rundfunktechnik GmbH Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates
WO2010082471A1 (ja) * 2009-01-13 2010-07-22 パナソニック株式会社 音響信号復号装置及びバランス調整方法
AU2015246158B2 (en) * 2009-03-17 2017-10-26 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding.
GB2470059A (en) * 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
CN101556799B (zh) * 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
CN102428512A (zh) * 2009-06-02 2012-04-25 松下电器产业株式会社 下混装置、编码装置以及其方法
US9393412B2 (en) 2009-06-17 2016-07-19 Med-El Elektromedizinische Geraete Gmbh Multi-channel object-oriented audio bitstream processor for cochlear implants
WO2010148169A1 (en) * 2009-06-17 2010-12-23 Med-El Elektromedizinische Geraete Gmbh Spatial audio object coding (saoc) decoder and postprocessor for hearing aids
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
US8194862B2 (en) * 2009-07-31 2012-06-05 Activevideo Networks, Inc. Video game system with mixing of independent pre-encoded digital audio bitstreams
JP2011066868A (ja) * 2009-08-18 2011-03-31 Victor Co Of Japan Ltd オーディオ信号符号化方法、符号化装置、復号化方法及び復号化装置
US8786852B2 (en) 2009-12-02 2014-07-22 Lawrence Livermore National Security, Llc Nanoscale array structures suitable for surface enhanced raman scattering and methods related thereto
TWI444989B (zh) 2010-01-22 2014-07-11 Dolby Lab Licensing Corp 針對改良多通道上混使用多通道解相關之技術
CN102859590B (zh) * 2010-02-24 2015-08-19 弗劳恩霍夫应用研究促进协会 产生增强下混频信号的装置、产生增强下混频信号的方法以及计算机程序
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
DE102010015630B3 (de) * 2010-04-20 2011-06-01 Institut für Rundfunktechnik GmbH Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates
CN102314882B (zh) * 2010-06-30 2012-10-17 华为技术有限公司 声音信号通道间延时估计的方法及装置
WO2012009851A1 (en) 2010-07-20 2012-01-26 Huawei Technologies Co., Ltd. Audio signal synthesizer
US8908874B2 (en) 2010-09-08 2014-12-09 Dts, Inc. Spatial audio encoding and reproduction
KR101697550B1 (ko) * 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
EP2628306B1 (en) 2010-10-14 2017-11-22 ActiveVideo Networks, Inc. Streaming digital video between video devices using a cable television system
TWI573131B (zh) * 2011-03-16 2017-03-01 Dts股份有限公司 用以編碼或解碼音訊聲軌之方法、音訊編碼處理器及音訊解碼處理器
US9204203B2 (en) 2011-04-07 2015-12-01 Activevideo Networks, Inc. Reduction of latency in video distribution networks using adaptive bit rates
TWI450266B (zh) * 2011-04-19 2014-08-21 Hon Hai Prec Ind Co Ltd 電子裝置及音頻資料的解碼方法
EP2523472A1 (en) 2011-05-13 2012-11-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method and computer program for generating a stereo output signal for providing additional output channels
EP2530956A1 (en) * 2011-06-01 2012-12-05 Tom Van Achte Method for generating a surround audio signal from a mono/stereo audio signal
TW202339510A (zh) 2011-07-01 2023-10-01 美商杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
EP2727379B1 (en) * 2011-07-01 2015-02-18 Dolby Laboratories Licensing Corporation Equalization of speaker arrays
KR101842257B1 (ko) * 2011-09-14 2018-05-15 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
JP5505395B2 (ja) * 2011-10-28 2014-05-28 ヤマハ株式会社 音響処理装置
CN103890841B (zh) * 2011-11-01 2017-10-17 皇家飞利浦有限公司 音频对象编码和解码
CN103188595B (zh) * 2011-12-31 2015-05-27 展讯通信(上海)有限公司 处理多声道音频信号的方法和***
US10409445B2 (en) 2012-01-09 2019-09-10 Activevideo Networks, Inc. Rendering of an interactive lean-backward user interface on a television
CN103220058A (zh) * 2012-01-20 2013-07-24 旭扬半导体股份有限公司 音频数据与视觉数据同步装置及其方法
US9436929B2 (en) * 2012-01-24 2016-09-06 Verizon Patent And Licensing Inc. Collaborative event playlist systems and methods
ITTO20120067A1 (it) 2012-01-26 2013-07-27 Inst Rundfunktechnik Gmbh Method and apparatus for conversion of a multi-channel audio signal into a two-channel audio signal.
US9395304B2 (en) 2012-03-01 2016-07-19 Lawrence Livermore National Security, Llc Nanoscale structures on optical fiber for surface enhanced Raman scattering and methods related thereto
US9800945B2 (en) 2012-04-03 2017-10-24 Activevideo Networks, Inc. Class-based intelligent multiplexing over unmanaged networks
US9123084B2 (en) 2012-04-12 2015-09-01 Activevideo Networks, Inc. Graphical application integration with MPEG objects
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
US9830917B2 (en) 2013-02-14 2017-11-28 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
US20150371646A1 (en) * 2013-02-14 2015-12-24 Dolby Laboratories Licensing Corporation Time-Varying Filters for Generating Decorrelation Signals
WO2014126689A1 (en) * 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for controlling the inter-channel coherence of upmixed audio signals
US9093064B2 (en) 2013-03-11 2015-07-28 The Nielsen Company (Us), Llc Down-mixing compensation for audio watermarking
WO2014145921A1 (en) 2013-03-15 2014-09-18 Activevideo Networks, Inc. A multiple-mode system and method for providing user selectable video content
RU2625444C2 (ru) 2013-04-05 2017-07-13 Долби Интернэшнл Аб Система обработки аудио
US9659569B2 (en) 2013-04-26 2017-05-23 Nokia Technologies Oy Audio signal encoder
US9666198B2 (en) 2013-05-24 2017-05-30 Dolby International Ab Reconstruction of audio scenes from a downmix
CA3211308A1 (en) 2013-05-24 2014-11-27 Dolby International Ab Coding of audio scenes
WO2014191793A1 (en) * 2013-05-28 2014-12-04 Nokia Corporation Audio signal encoder
US9219922B2 (en) 2013-06-06 2015-12-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
EP3005712A1 (en) 2013-06-06 2016-04-13 ActiveVideo Networks, Inc. Overlay rendering of user interface onto source video
US9294785B2 (en) 2013-06-06 2016-03-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9386558B2 (en) * 2013-06-27 2016-07-05 Microsoft Technology Licensing, Llc Radio channel utilization
JP6242489B2 (ja) 2013-07-29 2017-12-06 ドルビー ラボラトリーズ ライセンシング コーポレイション 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法
CN103413553B (zh) 2013-08-20 2016-03-09 腾讯科技(深圳)有限公司 音频编码方法、音频解码方法、编码端、解码端和***
EP3044783B1 (en) 2013-09-12 2017-07-19 Dolby International AB Audio coding
WO2015038522A1 (en) * 2013-09-12 2015-03-19 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content
JP6476192B2 (ja) 2013-09-12 2019-02-27 ドルビー ラボラトリーズ ライセンシング コーポレイション 多様な再生環境のためのダイナミックレンジ制御
BR112016008426B1 (pt) 2013-10-21 2022-09-27 Dolby International Ab Método para reconstrução de uma pluralidade de sinais de áudio, sistema de decodificação de áudio, método para codificação de uma pluralidade de sinais de áudio, sistema de codificação de áudio, e mídia legível por computador
JP6479786B2 (ja) * 2013-10-21 2019-03-06 ドルビー・インターナショナル・アーベー オーディオ信号のパラメトリック再構成
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
US9391575B1 (en) * 2013-12-13 2016-07-12 Amazon Technologies, Inc. Adaptive loudness control
WO2015089468A2 (en) * 2013-12-13 2015-06-18 Wu Tsai-Yi Apparatus and method for sound stage enhancement
CN106104684A (zh) 2014-01-13 2016-11-09 诺基亚技术有限公司 多通道音频信号分类器
US9779739B2 (en) 2014-03-20 2017-10-03 Dts, Inc. Residual encoding in an object-based audio system
US9788029B2 (en) 2014-04-25 2017-10-10 Activevideo Networks, Inc. Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks
EP2980789A1 (en) * 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhancing an audio signal, sound enhancing system
US10140996B2 (en) 2014-10-10 2018-11-27 Qualcomm Incorporated Signaling layers for scalable coding of higher order ambisonic audio data
US9984693B2 (en) * 2014-10-10 2018-05-29 Qualcomm Incorporated Signaling channels for scalable coding of higher order ambisonic audio data
WO2016196211A1 (en) 2015-05-29 2016-12-08 Armo Biosciences, Inc. Methods of using interleukin-10 for treating diseases and disorders
WO2017049397A1 (en) 2015-09-25 2017-03-30 Voiceage Corporation Method and system using a long-term correlation difference between left and right channels for time domain down mixing a stereo sound signal into primary and secondary channels
JP6620235B2 (ja) * 2015-10-27 2019-12-11 アンビディオ,インコーポレイテッド サウンドステージ拡張のための機器及び方法
ES2834083T3 (es) 2016-11-08 2021-06-16 Fraunhofer Ges Forschung Aparato y método para la mezcla descendente o mezcla ascendente de una señal multicanal usando compensación de fase
CN108665902B (zh) 2017-03-31 2020-12-01 华为技术有限公司 多声道信号的编解码方法和编解码器
CN109215667B (zh) * 2017-06-29 2020-12-22 华为技术有限公司 时延估计方法及装置
EP3422738A1 (en) * 2017-06-29 2019-01-02 Nxp B.V. Audio processor for vehicle comprising two modes of operation depending on rear seat occupation
CN117854515A (zh) * 2017-07-28 2024-04-09 弗劳恩霍夫应用研究促进协会 用于使用宽频带滤波器生成的填充信号对已编码的多声道信号进行编码或解码的装置
US10535357B2 (en) * 2017-10-05 2020-01-14 Qualcomm Incorporated Encoding or decoding of audio signals
GB201718341D0 (en) * 2017-11-06 2017-12-20 Nokia Technologies Oy Determination of targeted spatial audio parameters and associated spatial audio playback
GB2572650A (en) 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
GB2574239A (en) 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
GB2574667A (en) * 2018-06-15 2019-12-18 Nokia Technologies Oy Spatial audio capture, transmission and reproduction
FR3101741A1 (fr) * 2019-10-02 2021-04-09 Orange Détermination de corrections à appliquer à un signal audio multicanal, codage et décodage associés
KR20210060253A (ko) 2019-11-18 2021-05-26 삼성전자주식회사 메모리 컨트롤러, 메모리 시스템 및 이의 동작 방법
US11451919B2 (en) * 2021-02-19 2022-09-20 Boomcloud 360, Inc. All-pass network system for colorless decorrelation with constraints
EP4320615A1 (en) * 2021-04-06 2024-02-14 Dolby International AB Encoding of envelope information of an audio downmix signal
CN113301329B (zh) * 2021-05-21 2022-08-05 康佳集团股份有限公司 基于图像识别的电视声场校正方法、装置及显示设备
CN116962955A (zh) * 2022-04-15 2023-10-27 华为技术有限公司 多通道的混音方法、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0865169A (ja) * 1994-06-13 1996-03-08 Sony Corp 符号化方法及び装置、復号化装置、並びに記録媒体
JP2001100792A (ja) * 1999-09-28 2001-04-13 Sanyo Electric Co Ltd 符号化方法、符号化装置およびそれを備える通信システム
JP2005533426A (ja) * 2002-07-12 2005-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符合化方法
JP4786987B2 (ja) * 2001-07-10 2011-10-05 ドルビー インターナショナル アクチボラゲット 低ビットレートオーディオ符号化用の効率的かつスケーラブルなパラメトリックステレオ符号化

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5091945A (en) * 1989-09-28 1992-02-25 At&T Bell Laboratories Source dependent channel coding with error protection
SG49883A1 (en) * 1991-01-08 1998-06-15 Dolby Lab Licensing Corp Encoder/decoder for multidimensional sound fields
US5291557A (en) * 1992-10-13 1994-03-01 Dolby Laboratories Licensing Corporation Adaptive rematrixing of matrixed audio signals
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
EP0688113A2 (en) * 1994-06-13 1995-12-20 Sony Corporation Method and apparatus for encoding and decoding digital audio signals and apparatus for recording digital audio
US6029129A (en) * 1996-05-24 2000-02-22 Narrative Communications Corporation Quantizing audio data using amplitude histogram
EP0924962B1 (en) * 1997-04-10 2012-12-12 Sony Corporation Encoding method and device, decoding method and device, and recording medium
US5890125A (en) 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6437944B2 (en) 1997-10-20 2002-08-20 Fujitsu Limited Head slider supporting device, disk device and suspension
US6122619A (en) 1998-06-17 2000-09-19 Lsi Logic Corporation Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
US6322189B1 (en) * 1999-01-13 2001-11-27 Hewlett-Packard Company Multiple printhead apparatus with temperature control and method
US6578074B1 (en) 1999-06-25 2003-06-10 Mediaone Group, Inc. Provisioning server enhancement
JP4424566B2 (ja) 1999-10-26 2010-03-03 ザ・インクテック株式会社 アルカリ可溶性接着剤
JP2002175097A (ja) * 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
JP3951690B2 (ja) * 2000-12-14 2007-08-01 ソニー株式会社 符号化装置および方法、並びに記録媒体
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
TW569551B (en) 2001-09-25 2004-01-01 Roger Wallace Dressler Method and apparatus for multichannel logic matrix decoding
GB0124580D0 (en) 2001-10-12 2001-12-05 Univ Reading New composition
EP1451809A1 (en) 2001-11-23 2004-09-01 Koninklijke Philips Electronics N.V. Perceptual noise substitution
US6890125B1 (en) 2002-01-30 2005-05-10 Calder Brothers Corporation Adjustable screed system
WO2003075609A2 (en) 2002-03-07 2003-09-12 Koninklijke Philips Electronics N.V. User controlled multi-channel audio conversion system
BRPI0308691A2 (pt) * 2002-04-10 2016-11-16 Koninkl Philips Electronics Nv métodos para codificar um sinal de canal múltiplo e para decodificar informação de sinal de canal múltiplo, arranjos para codificar e decodificar um sinal de canal múltiplo, sinal de dados, meio legível por computador, e, dispositivo para comunicar um sinal de canal múltiplo.
CN1647156B (zh) * 2002-04-22 2010-05-26 皇家飞利浦电子股份有限公司 参数编码方法、参数编码器、用于提供音频信号的设备、解码方法、解码器、用于提供解码后的多声道音频信号的设备
ES2323294T3 (es) * 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
AU2003216682A1 (en) * 2002-04-22 2003-11-03 Koninklijke Philips Electronics N.V. Signal synthesizing
WO2003094369A2 (en) * 2002-05-03 2003-11-13 Harman International Industries, Incorporated Multi-channel downmixing device
US20050255191A1 (en) 2002-07-23 2005-11-17 Shandera Donald L Process for treating corn and millets
KR20040043743A (ko) * 2002-11-19 2004-05-27 주식회사 디지털앤디지털 멀티채널 검색장치와 방법
WO2005025241A2 (en) 2003-09-10 2005-03-17 A.D.I. Video Technologies Ltd. Device, system and method of multi-channel processing
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US20050169846A1 (en) 2004-01-31 2005-08-04 Bart Kennington Enhancement of fragrance release from candles
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US7508947B2 (en) * 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
US7961890B2 (en) 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
JP2007096002A (ja) * 2005-09-29 2007-04-12 Matsushita Electric Ind Co Ltd 半導体装置の製造方法および半導体装置
TWI469133B (zh) * 2006-01-19 2015-01-11 Lg Electronics Inc 媒體訊號處理方法及裝置
JP2008003007A (ja) * 2006-06-23 2008-01-10 Fujitsu Ltd 個体認識方法及び装置、個体認識範囲調整方法、及びプログラム
JP5228305B2 (ja) 2006-09-08 2013-07-03 ソニー株式会社 表示装置、表示方法
AU2007312597B2 (en) 2006-10-16 2011-04-14 Dolby International Ab Apparatus and method for multi -channel parameter transformation
WO2009049896A1 (en) 2007-10-17 2009-04-23 Fraunhofer-Fesellschaft Zur Förderung Der Angewandten Forschung E.V. Audio coding using upmix
JP5428564B2 (ja) 2009-06-18 2014-02-26 東洋紡株式会社 車両内装材用部材およびそれを用いた車両用内装材

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0865169A (ja) * 1994-06-13 1996-03-08 Sony Corp 符号化方法及び装置、復号化装置、並びに記録媒体
JP2001100792A (ja) * 1999-09-28 2001-04-13 Sanyo Electric Co Ltd 符号化方法、符号化装置およびそれを備える通信システム
JP4786987B2 (ja) * 2001-07-10 2011-10-05 ドルビー インターナショナル アクチボラゲット 低ビットレートオーディオ符号化用の効率的かつスケーラブルなパラメトリックステレオ符号化
JP4878384B2 (ja) * 2001-07-10 2012-02-15 ドルビー インターナショナル アクチボラゲット 低ビットレートオーディオ符号化用の効率的かつスケーラブルなパラメトリックステレオ符号化
JP2005533426A (ja) * 2002-07-12 2005-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符合化方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008522551A (ja) * 2004-11-30 2008-06-26 アギア システムズ インコーポレーテッド 被送出チャネルに基づくキューを用いる空間オーディオのパラメトリック・コーディング
JP4856653B2 (ja) * 2004-11-30 2012-01-18 アギア システムズ インコーポレーテッド 被送出チャネルに基づくキューを用いる空間オーディオのパラメトリック・コーディング
JP2020510341A (ja) * 2017-03-08 2020-04-02 ディーティーエス・インコーポレイテッドDTS,Inc. 分散オーディオ仮想化システム
JP7206211B2 (ja) 2017-03-08 2023-01-17 ディーティーエス・インコーポレイテッド 分散オーディオ仮想化システム

Also Published As

Publication number Publication date
US20230345176A1 (en) 2023-10-26
HK1144043A1 (zh) 2011-01-21
HK1163911A1 (en) 2012-09-14
JP2007531027A (ja) 2007-11-01
JP4589962B2 (ja) 2010-12-01
WO2005101371A1 (en) 2005-10-27
US9972330B2 (en) 2018-05-15
US9621990B2 (en) 2017-04-11
US8693696B2 (en) 2014-04-08
TWI334736B (en) 2010-12-11
JP5185337B2 (ja) 2013-04-17
KR20070001226A (ko) 2007-01-03
US20160203822A1 (en) 2016-07-14
US10244321B2 (en) 2019-03-26
ES2294703T3 (es) 2008-04-01
CN1965351B (zh) 2011-05-11
DE602005002451D1 (de) 2007-10-25
US10244319B2 (en) 2019-03-26
CN1965351A (zh) 2007-05-16
US8223976B2 (en) 2012-07-17
US10250985B2 (en) 2019-04-02
ATE376240T1 (de) 2007-11-15
SE0400998D0 (sv) 2004-04-16
US10271142B2 (en) 2019-04-23
US10250984B2 (en) 2019-04-02
US10129645B2 (en) 2018-11-13
US9635462B2 (en) 2017-04-25
US20130236021A1 (en) 2013-09-12
CN101860784A (zh) 2010-10-13
US20170238113A1 (en) 2017-08-17
JP2011030228A (ja) 2011-02-10
US20170148450A1 (en) 2017-05-25
CN1930608B (zh) 2010-05-05
DE602005002942T2 (de) 2008-07-24
US20110075848A1 (en) 2011-03-31
US7986789B2 (en) 2011-07-26
EP1695338A1 (en) 2006-08-30
US20170236523A1 (en) 2017-08-17
DE602005002451T2 (de) 2008-06-12
HK1093594A1 (en) 2007-03-02
US20170229131A1 (en) 2017-08-10
US20170229127A1 (en) 2017-08-10
CN102157155B (zh) 2014-07-02
PL1735775T3 (pl) 2009-04-30
US20220159379A1 (en) 2022-05-19
US20160203823A1 (en) 2016-07-14
US20170229128A1 (en) 2017-08-10
US20070002971A1 (en) 2007-01-04
US9743185B2 (en) 2017-08-22
US20170229132A1 (en) 2017-08-10
US11647333B2 (en) 2023-05-09
EP1695338B1 (en) 2007-09-12
US10440474B2 (en) 2019-10-08
PL1695338T3 (pl) 2008-02-29
EP1735775B8 (en) 2008-11-19
US20200304913A1 (en) 2020-09-24
US10244320B2 (en) 2019-03-26
US20170229129A1 (en) 2017-08-10
CN1930608A (zh) 2007-03-14
US20170229126A1 (en) 2017-08-10
US8538031B2 (en) 2013-09-17
US10499155B2 (en) 2019-12-03
US20190320263A1 (en) 2019-10-17
TW200637415A (en) 2006-10-16
US20110002470A1 (en) 2011-01-06
KR20070001162A (ko) 2007-01-03
US20170238112A1 (en) 2017-08-17
ES2293578T3 (es) 2008-03-16
ATE373301T1 (de) 2007-09-15
US9972329B2 (en) 2018-05-15
US9972328B2 (en) 2018-05-15
KR100848365B1 (ko) 2008-07-24
US20200021915A1 (en) 2020-01-16
US20070258607A1 (en) 2007-11-08
CN101860784B (zh) 2016-02-17
JP2007532960A (ja) 2007-11-15
US10623860B2 (en) 2020-04-14
US10015597B2 (en) 2018-07-03
CN102157155A (zh) 2011-08-17
JP5185340B2 (ja) 2013-04-17
US11184709B2 (en) 2021-11-23
KR100848367B1 (ko) 2008-07-24
EP1735775A1 (en) 2006-12-27
JP4603037B2 (ja) 2010-12-22
US20140236604A1 (en) 2014-08-21
EP1735775B1 (en) 2007-10-17
WO2005101370A1 (en) 2005-10-27
US20170229130A1 (en) 2017-08-10
DE602005002942D1 (de) 2007-11-29
US20180054676A9 (en) 2018-02-22

Similar Documents

Publication Publication Date Title
JP5185340B2 (ja) マルチチャネルオーディオ信号を表示するための装置と方法
TWI313857B (en) Apparatus for generating a parameter representation of a multi-channel signal and method for representing multi-channel audio signals

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120508

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120802

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130117

R150 Certificate of patent or registration of utility model

Ref document number: 5185340

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160125

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250