JP2008535015A - オーディオ符号化および復号化 - Google Patents

オーディオ符号化および復号化 Download PDF

Info

Publication number
JP2008535015A
JP2008535015A JP2008503634A JP2008503634A JP2008535015A JP 2008535015 A JP2008535015 A JP 2008535015A JP 2008503634 A JP2008503634 A JP 2008503634A JP 2008503634 A JP2008503634 A JP 2008503634A JP 2008535015 A JP2008535015 A JP 2008535015A
Authority
JP
Japan
Prior art keywords
channel
signal
data
reinforcement
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008503634A
Other languages
English (en)
Other versions
JP5106383B2 (ja
JP2008535015A5 (ja
Inventor
ヘラルド エイチ ホソ
フランソワ ピー マイブルグ
アルノルダス ダブリュ ジェイ オーメン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=36607294&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2008535015(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2008535015A publication Critical patent/JP2008535015A/ja
Publication of JP2008535015A5 publication Critical patent/JP2008535015A5/ja
Application granted granted Critical
Publication of JP5106383B2 publication Critical patent/JP5106383B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

単独でまたは何らかの組み合わせで上述した欠点の1つまたはそれ以上を好ましくは緩和するか、軽減するか、または排除すること。マルチ・チャンネル・オーディオ符号器は、Nチャンネル・オーディオ信号を符号化する。第1の装置110は、Nチャンネル信号について、第1の符号化Mチャンネル信号、例えば、空間的ステレオ・ダウン・ミックスを生成する(N>M)。ダウン・ミキサ115、116、117は、Nチャンネル・オーディオ信号に対する信号用第1の補強データを生成する。芸術的ステレオ・ミックスなど、第2のMチャンネル信号は、Nチャンネル信号について生成される。その後、プロセッサ123は、第1のMチャンネル信号に対する第2のMチャンネル信号用第2の補強データを生成する。第2の装置120は、第2のMチャンネル信号と、第1の補強データと、第2の補強データとを含む出力信号を生成する。発生器123は、第2の符号化Mチャンネル信号に対して、絶対補強データとしての第2の補強データの生成、または、相対補強データとしての第2の補強データの生成から動的に選択することができる。復号器20は、逆の動作を行なうことができ、受信ビット・ストリーム内の表示によって、絶対補強データまたは相対補強データとして第2の補強データを適用することができる。

Description

本発明は、マルチ・チャンネル信号のオーディオ符号化および復号化もしくはオーディオ符号化または復号化に関するものである。
マルチ・チャンネル・オーディオ信号とは、2つまたはそれ以上のオーディオ・チャンネルを有するオーディオ信号である。マルチ・チャンネル・オーディオ信号のよく知られている例は、2チャンネル・ステレオ・オーディオ信号、および、2つのフロント・オーディオ・チャンネルと、2つのリヤ・オーディオ・チャンネルと、1つのセンター・オーディオ信号と、更に、低音補強(LFE)チャンネルを有する5.1チャンネル・オーディオ信号である。このような5.1チャンネル・オーディオ信号は、DVD(デジタル・バーサタイル・ディスク)システムおよびSACD(スーパー・オーディオ・コンパクト・ディスク)システムで使用されている。マルチ・チャンネル素材の人気が高まっているために、マルチ・チャンネル素材の効率的なコーディングがより重要になっている。
オーディオ処理の分野においては、幾つかのオーディオ・チャンネルを別の数のオーディオ・チャンネルに変換することがよく知られている。このような変換は、様々な理由から行われると考えられる。例えば、オーディオ信号は、別のフォーマットに変換して高度なユーザー体験を実現することができる。例えば、これまでのステレオ録音には、2つのチャンネルだけが含まれ、一方、最新の高度オーディオ・システムでは、一般的に、人気のある5.1サラウンド・サウンド・システムのように、5つまたは6つのチャンネルが使用される。したがって、2つのステレオ・チャンネルは、高度オーディオ・システムを余すところなく利用するために、5つまたは6つのチャンネルに変換することができる。
チャンネル変換の別の理由は、コーディング効率である。例えば、サラウンド・サウンド・オーディオ信号は、オーディオ信号のマルチ・チャンネル空間特性を記述するパラメータ・ビット・ストリームと組み合わせたステレオ・チャンネル・オーディオ信号に符号化することができることが既にわかっている。復号器は、非常に良好な精度でサラウンド・サウンド・オーディオ信号を再生することができる。このようにして、実質的なビット・レート節約を行うことができる。
5.1−2−5.1マルチ・チャンネル・オーディオ・コーディング・システムが公知である。この公知のオーディオ・コーディング・システムにおいては、5.1入力オーディオ信号は、2つのダウン・ミックス・チャンネルと関連パラメータとに符号化されて、かつ、2つのダウン・ミックス・チャンネルと関連パラメータとで表される。また、ダウン・ミックス信号は、空間的ダウン・ミックスと総称される。公知のシステムにおいては、空間的ダウン・ミックスは、品質に関しては5.1入力チャンネルの固定ITUダウン・ミックスに匹敵するステレオ画像を有するステレオ・オーディオ信号を成す。ステレオ設備しか持たないユーザーは、この空間的ステレオ・ダウン・ミックスを聴くことができ、一方、5.1チャンネル設備を有するリスナーは、この空間的ステレオ・ダウン・ミックスと関連パラメータとによって行われる5.1チャンネル再生を聴くことができる。5.1チャンネル設備は、空間的ステレオ・ダウン・ミックス(即ち、ステレオ・オーディオ信号)と関連パラメータとから5.1チャンネル・オーディオ信号を復号化/再構築する。
しかしながら、空間的ステレオ・ダウン・ミックスは、元のステレオ信号または明示的に生成されるステレオ信号と比較すると質が劣ると考えられることが多い。例えば、プロのスタジオ技師は、空間的ステレオ・ダウン・ミックスを多少退屈で面白くないと捉えがちであることが多い。このような理由から、空間的ステレオ・ダウン・ミックスと異なる芸術的ステレオ・ダウン・ミックスが生成されることが多い。例えば、特別な残響またはソースの追加、ステレオ画像の拡幅などが行われる。ユーザーが芸術的ステレオ・ダウン・ミックスを楽しむことができるように、空間的ダウン・ミックスではなく、この芸術的ダウン・ミックスは、送信手段を介して送信するか、または、記憶媒体上に格納することができる。しかしながら、ステレオ信号から5.1信号を生成するパラメータ・データは、元のダウン・ミックス信号を基本とするため、この方法は、5.1チャンネル・オーディオ信号再生の質に重大な影響を与える。具体的には、入力5.1チャンネル・オーディオ信号は、空間的ステレオ・ダウン・ミックスと関連パラメータとに符号化されたものである。空間的ステレオ・ダウン・ミックスの代わりに芸術的ステレオ・ダウン・ミックスを使用すれば、空間的ステレオ・ダウン・ミックスは、システムの復号化端ではもはや利用不可能になる恐れがあり、5.1チャンネル・オーディオ信号の質の高い再構築が不可能である。
5.1チャンネル・オーディオ信号の質を向上させる考えられる方法は、空間的ステレオ・ダウン・ミックス信号の更なるデータを含めることである。例えば、芸術的ステレオ・ダウン・ミックスに加えて、空間的ステレオ・ダウン・ミックスを同じビット・ストリーム内に含めることができるか、または、パラレルで送信することができる。しかしながら、これによって、データ転送速度が大幅に速くなり、したがって、通信帯域幅または記憶要件が大きくなり、符号化されたマルチ・チャンネル信号の質とデータ転送速度との比率が劣化することになる。
したがって、マルチ・チャンネル・オーディオ用改良型符号化/復号化システムであれば有利となり、特に、性能、質、および質とデータ転送速度との比率もしくは性能、質、または質とデータ転送速度との比率の向上を可能にするシステムであれば有利となる。
したがって、本発明は、単独でまたは何らかの組み合わせで上述した欠点の1つまたはそれ以上を好ましくは緩和するか、軽減するか、または排除しようとするものである。
本発明の第1の態様によれば、Nチャンネル・オーディオ信号を符号化するマルチ・チャンネル・オーディオ符号器であって、Nチャンネル・オーディオ信号用第1のMチャンネル信号を生成する手段であって、Mは、Nより小さい手段と、Nチャンネル・オーディオ信号に対して、第1のMチャンネル信号用第1の補強データを生成する手段と、Nチャンネル・オーディオ信号用第2のMチャンネル信号を生成する手段と、第1のMチャンネル信号に対して、第2のMチャンネル信号用第2の補強データを生成する補強手段と、第2のMチャンネル信号と、第1の補強データと、第2の補強データとを含む符号化出力信号を生成する手段とを含み、補強手段が、第2のMチャンネル信号に対して、絶対補強データとしての第2の補強データの生成、または、相対補強データとして第2の補強データの生成とから動的に選択するように構成されるマルチ・チャンネル・オーディオ符号器を提供する。
本発明は、マルチ・チャンネル信号の効率的な符号化を可能にすることができる。特に、質とデータ転送速度との比率が増大した効率的な符号化を達成することができる。本発明は、第1のMチャンネル信号に関する補強データに基づいてマルチ・チャンネル生成に及ぼす影響を低減して1つのMチャンネル信号が別のMチャンネル信号に取って代わることを可能にすることができる。具体的には、空間的ダウン・ミックスに関連した補強データに基づいて復号器にて効率的なマルチ・チャンネル再生を可能にしながら空間的ダウン・ミックスではなく芸術的ダウン・ミックス送信することができる。補強データの動的選択によって、補強データの大幅な縮小および生成することができる信号の質の向上もしくは補強データの大幅な縮小または生成することができる信号の質の向上が可能となる。
絶対補強データは、第2のMチャンネル信号を参照することなく第1のMチャンネル信号を記述するものであり、一方、相対補強データは、第2のMチャンネル信号を参照しながら第1のMチャンネル信号を記述するものである。
第1のMチャンネル信号および第2のMチャンネル信号もしくは第1のMチャンネル信号または第2のMチャンネル信号を生成する手段は、Nチャンネル信号を処理することによって、または、例えば、内部または外部ソースからMチャンネル信号を受信することによって、信号を生成することができる。
本発明の任意選択的な特長によれば、補強手段は、絶対補強データとしての第2の部分の生成、または、相対補強データとしての第2の部分の生成からのみ動的に選択するように構成される。
これは、効率的な性能を可能にすることができ、特に、質とデータ転送速度の比率が向上した符号化信号を実現することができる。上記の選択は、例えば、Nチャンネル信号のセグメントの特性から導出された1つまたはそれ以上のパラメータを評価することによって、特に、第1のMチャンネル信号および第2のMチャンネル信号もしくは第1のMチャンネル信号または第2のMチャンネル信号(それ自体、Nチャンネル信号から導出することができる)から導出された1つまたはそれ以上のパラメータに基づいて行うことができる。
本発明の任意選択的な特長によれば、補強手段は、絶対補強データと相対補強データの相対特性に応答して、絶対補強データと相対補強データとから選択するように構成される。
これは、効率的な性能を可能にすることができ、特に、質とデータ転送速度の比率が向上した符号化信号を実現することができる。あるいは、または、更に、効率的および複雑性が低い、もしくは効率的または複雑性が低い実行を可能にすることができる。
本発明の任意選択的な特長によれば、相対特性は、相対補強データの信号エネルギーに対する絶対補強データの信号エネルギーである。
これは、効率的な性能を可能にすることができ、特に、質とデータ転送速度の比率が向上した符号化信号を実現することができる。あるいは、または、更に、効率的および複雑性が低い、もしくは効率的または複雑性が低い実行を可能にすることができる。具体的には、補強手段は、信号エネルギーが最も低いタイプの補強データを選択することができる。
本発明の任意選択的な特長によれば、補強手段は、第2のMチャンネル信号を信号ブロックに分割し、かつ、各信号ブロックについて絶対補強データと相対補強データとから個々に選択するように構成される。
これは、効率的な性能を可能にすることができ、特に、質とデータ転送速度の比率が向上した符号化信号を実現することができる。あるいは、または、更に、効率的および複雑性が低い、もしくは効率的または複雑性が低い実行を可能にすることができる。信号ブロックは、時間ドメインおよび周波数ドメインもしくは時間ドメインまたは周波数ドメインにおいて分割することができ、かつ、各信号ブロックは、具体的には、時間/周波数タイルの群を含むことができる。信号ブロックへの分割は、第1のMチャンネル信号およびNチャンネル信号もしくは第1のMチャンネル信号またはNチャンネル信号に適用することができる。
本発明の任意選択的な特長によれば、補強手段は、信号ブロックに関連した特性のみに基づいて信号ブロックについて絶対補強データと相対補強データとから選択するように構成される。
これは、効率的な性能を可能にすることができ、特に、質とデータ転送速度の比率が向上した符号化信号を実現することができる。あるいは、または、更に、効率的および複雑性が低い、もしくは効率的または複雑性が低い実行を可能にすることができる。具体的には、補強手段は、信号エネルギーが最低であるタイプの補強データを選択することができる。
本発明の任意選択的な特長によれば、補強手段は、絶対補強データとしての前記補強データの生成と相対補強データとしての前記補強データの生成との切り替えの切り替え時間間隔中に、絶対補強データと相対補強データの組み合わせとして補強データを生成するように構成される。
これは、スイッチングの向上を可能にすることができ、かつ、特に、スイッチングに関連した人為的影響を低減することができる。音質の向上を達成することができる。切り替え時間間隔中の組み合わせは、絶対補強データから相対補強データにおよび相対補強データから絶対補強データに、もしくは絶対補強データから相対補強データにまたは相対補強データから絶対補強データに切り替わるときに適用することができる。組み合わせは、重複加算法を用いて達成することができる。
本発明の任意選択的な特長によれば、組み合わせは、絶対補強データと相対補強データとの間の補間を含む。
これは、質の高い実際的かつ効率的な実行を可能にすることができる。音質の向上を達成することができる。
本発明の任意選択的な特長によれば、符号化出力信号を生成する手段は、相対補強データが使用されるのかそれとも絶対補強データが使用されるのかを示すデータを含むように構成される。
これは、効率的な性能を可能にすることができ、特に、質とデータ転送速度の比率が向上した符号化信号を実現することができる。あるいは、または、更に、効率的および複雑性が低い、もしくは効率的または複雑性が低い実行を可能にすることができる。表示データは、具体的には、各信号ブロックについて選択表示を含むことができる。
本発明の任意選択的な特長によれば、第2の補強データは、補強データの第1の部分と補強データの第2の部分とを含み、第2の部分は、第1の部分より質の高い第1のMチャンネル信号表現を行う。
これは、効率的な性能を可能にすることができ、特に、質とデータ転送速度の比率が向上した符号化信号を実現することができる。第1の部分は、第2の部分より遅いデータ転送速度を有することができる。第2の部分は、復号器が第1のMチャンネル信号を再生するのをより正確に可能にするデータを含むことができる。
本発明の任意選択的な特長によれば、補強手段は、絶対補強データとして、または、相対補強データとしての第2の部分のみを動的に選択するように構成される。
これは、効率的な性能を可能にすることができ、特に、質とデータ転送速度の比率が向上した符号化信号を実現することができる。
本発明の任意選択的な特長によれば、補強手段は、第1の部分の補強データを第1のMチャンネル信号に適用することによって生成された基準信号に対して、第2の部分の相対データを生成するように構成される。
これは、効率的な性能を可能にすることができ、特に、質とデータ転送速度の比率が向上した符号化信号を実現することができる。
本発明の別の態様によれば、Nチャンネル・オーディオ信号を復号化するマルチ・チャンネル・オーディオ復号器であって、Nチャンネル・オーディオ信号用第1のMチャンネル信号であって、Mが、Nより小さい信号と、第1のMチャンネル信号と異なる第2のMチャンネル信号に対するマルチ・チャンネル拡張用第1の補強データと、第1のMチャンネル信号に対する絶対補強データと相対補強データとを含む、第2のMチャンネル信号に対する第1のMチャンネル信号用第2の補強データと、信号ブロックに関する第2の補強データが絶対補強データであるのかそれとも相対補強データであるのかを示す表示データとを含む符号化オーディオ信号を受信する手段と、第1のMチャンネル信号と第2の補強データとに応答してMチャンネル・マルチ・チャンネル拡張信号を生成する生成手段と、Mチャンネル・マルチ・チャンネル拡張信号と、第1の補強データとに応答してNチャンネル復号化信号を生成する手段とを含み、生成手段が、表示データに応答して、絶対補強データとしての第2の補強データの適用、または、相対補強データとしての第2の補強データの適用から選択するように構成されるマルチ・チャンネル・オーディオ復号器を提供する。
本発明は、効率的かつ高性能なマルチ・チャンネル信号復号化を可能にすることができる。特に、特定のデータ転送速度について質が向上した信号の効率的な復号化を達成することができる。本発明は、1つのMチャンネル信号が、第1のMチャンネル信号に関係する補強データに基づいてマルチ・チャンネル生成に及ぼす影響を低減して別のMチャンネル信号に取って代わることを可能にすることができる。具体的には、空間的ダウン・ミックスに関連した補強データに基づいて復号器にて効率的なマルチ・チャンネル再生を可能にしながら空間的ダウン・ミックスではなく芸術的ダウン・ミックス送信することができる。
絶対補強データは、第1のMチャンネル信号を参照することなく第2のMチャンネル信号を記述し、一方、相対補強データは、第1のMチャンネル信号を参照しながら第2のMチャンネル信号を記述する。
本発明の任意選択的な特長によれば、生成手段は、時間ドメインにおいて第2の補強データを第1のMチャンネル信号に適用するように構成される。
これは、効率的な性能を可能にすることができ、特に、特定のデータ転送速度について質が向上した復号化信号を実現することができる。あるいは、または、更に、効率的および複雑性が低い、もしくは効率的または複雑性が低い実行を可能にすることができる。
本発明の任意選択的な特長によれば、生成手段は、周波数ドメインにおいて第2の補強データを第1のMチャンネル信号に適用するように構成される。
これは、効率的な性能を可能にすることができ、特に、特定のデータ転送速度について質が向上した復号化信号を実現することができる。あるいは、または、更に、効率的および複雑性が低い、もしくは効率的または複雑性が低い実行を可能にすることができる。
特に、多くの実施形態においては、周波数ドメインの適用によって、時間から周波数への変換所要回数を少なくすることができる。周波数ドメインは、例えば、直交ミラーフィルタバンク(QMF)ドメインまたは修正離散コサイン変換(MDCT)ドメインとすることができる。
本発明の任意選択的な特長によれば、第2の補強データは、補強データの第1の部分と補強データの第2の部分とを含み、第2の部分は、第1の部分より質の高い第1のMチャンネル信号表現を行う。
これは、効率的な性能を可能にすることができ、特に、特定のデータ転送速度について質が向上した復号化信号を実現することができる。あるいは、または、更に、効率的および複雑性が低い、もしくは効率的または複雑性が低い実行を可能にすることができる。第2の部分は、復号器が第1のMチャンネル信号を再生することをより正確に可能にするデータを含むことができる。
本発明の任意選択的な特長によれば、生成手段は、絶対補強データとしての第2の部分の第2の補強データの適用、または、相対補強データとしての第2の部分の第2の補強データの適用からのみ選択するように構成される。
これは、効率的な性能を可能にすることができ、特に、特定のデータ転送速度について質が向上した復号化信号を実現することができる。あるいは、または、更に、効率的および複雑性が低い、もしくは効率的または複雑性が低い実行を可能にすることができる。
本発明の任意選択的な特長によれば、生成手段は、第1の部分の補強データを第1のMチャンネル信号に適用することによって生成された信号に第2の部分の相対補強データを適用することによってMチャンネル・マルチ・チャンネル拡張部を生成するように構成される。
これは、効率的な性能を可能にすることができ、特に、特定のデータ転送速度について質が向上した復号化信号を実現することができる。あるいは、または、更に、効率的および複雑性が低い、もしくは効率的または複雑性が低い実行を可能にすることができる。
本発明の別の態様によれば、Nチャンネル・オーディオ信号を符号化する方法であって、Nチャンネル・オーディオ信号用第1のMチャンネル信号を生成するステップであって、MがNより小さいステップと、Nチャンネル・オーディオ信号に対して第1のMチャンネル信号用第1の補強データを生成するステップと、Nチャンネル・オーディオ信号用第2のMチャンネル信号を生成するステップと、第1のMチャンネル信号に対して第2のMチャンネル信号用第2の補強データを生成するステップと、第2のMチャンネル信号と、第1の補強データと、第2の補強データとを含む符号化出力信号を生成するステップとを含み、第2の補強データの生成ステップが、第2のMチャンネル信号に対して、絶対補強データとしての第2の補強データの生成、または、相対補強データとしての第2の補強データの生成から動的に選択するステップを含む方法を提供する。
本発明の別の態様によれば、Nチャンネル・オーディオ信号を復号化する方法であって、Nチャンネル・オーディオ信号用第1のMチャンネル信号であって、MがNより小さい信号と、第1のMチャンネル信号と異なる第2のMチャンネル信号に対するマルチ・チャンネル拡張用第1の補強データと、第1のMチャンネル信号に対する絶対補強データと相対補強データとを含む、第2のMチャンネル信号用第1のMチャンネル信号に対する第2の補強データと、信号ブロックに関する第2の補強データが絶対補強データであるのかそれとも相対補強データであるのかを示す表示データとを含む符号化オーディオ信号を受信するステップと、第1のMチャンネル信号と第2の補強データとに応答してMチャンネル・マルチ・チャンネル拡張信号を生成するステップと、Mチャンネル・マルチ・チャンネル拡張信号と、第1の補強データとに応答してNチャンネル復号化信号を生成するステップとを含み、Mチャンネル・マルチ・チャンネル拡張信号の生成ステップが、表示データに応答して、絶対補強データとしての第2の補強データの適用、または、相対補強データとしての第2の補強データの適用から選択するステップを含む方法を提供する。
本発明の別の態様によれば、Nチャンネル・オーディオ信号用符号化マルチ・チャンネル・オーディオ信号であって、Nチャンネル・オーディオ信号用Mチャンネル信号データであって、MがNより小さい信号データと、第1のMチャンネル信号と異なる第2のMチャンネル信号に対するマルチ・チャンネル拡張用第1の補強データと、第1のMチャンネル信号に対する絶対補強データと相対補強データとを含む、第2のMチャンネル信号に対する第1のMチャンネル信号用第2の補強データと、信号ブロックに関する第2の補強データが絶対補強データであるのかそれとも相対補強データであるのかを示す表示データとを含む符号化マルチ・チャンネル・オーディオ信号を提供する。
本発明の別の態様によれば、上述したような信号が格納された記憶媒体を提供する。
本発明の別の態様によれば、上述したようなマルチ・チャンネル・オーディオ符号器を含む、符号化マルチ・チャンネル・オーディオ信号を送信する送信器を提供する。
本発明の別の態様によれば、上述したようなマルチ・チャンネル・オーディオ復号器を含む、マルチ・チャンネル・オーディオ信号を受信する受信器を提供する。
本発明の別の態様によれば、符号化マルチ・チャンネル・オーディオ信号を送信チャンネルを介して受信器に送信する送信器を含む送信システムであって、上述したようなマルチ・チャンネル・オーディオ符号器を含む送信器と、上述したようなマルチ・チャンネル・オーディオ復号器を含む受信器とを含む送信システムを提供する。
本発明の別の態様によれば、符号化マルチ・チャンネル・オーディオ信号を送信する方法であって、Nチャンネル・オーディオ信号を符号化するステップを含み、符号化するステップが、Nチャンネル・オーディオ信号用第1のMチャンネル信号を生成するステップであって、MがNより小さいステップと、Nチャンネル・オーディオ信号に対して第1のMチャンネル信号用第1の補強データを生成するステップと、Nチャンネル・オーディオ信号用第2のMチャンネル信号を生成するステップと、第1のMチャンネル信号に対して第2のMチャンネル信号用第2の補強データを生成するステップと、第2のMチャンネル信号と、第1の補強データと、第2の補強データとを含む、符号化出力信号を生成するステップとを含み、第2の補強データの生成ステップが、第2のMチャンネル信号に対して、絶対補強データとしての第2の補強データの生成、または、相対補強データとしての第2の補強データの生成から動的に選択するステップを含む方法を提供する。
本発明の別の態様によれば、符号化マルチ・チャンネル・オーディオ信号を受信する方法であって、符号化マルチ・チャンネル・オーディオ信号を復号化するステップを含み、復号化するステップが、Nチャンネル・オーディオ信号用第1のMチャンネル信号であって、MがNより小さい信号と、第1のMチャンネル信号と異なる第2のMチャンネル信号に対するマルチ・チャンネル拡張用第1の補強データと、第1のMチャンネル信号に対する絶対補強データと相対補強データとを含む、第2のMチャンネル信号に対する第1のMチャンネル信号用第2の補強データと、信号ブロックに関する第2の補強データが絶対補強データであるのかそれとも相対補強データであるのかを示す表示データとを含む符号化マルチ・チャンネル・オーディオ信号を受信するステップと、第1のMチャンネル信号と第2の補強データとに応答してMチャンネル・マルチ・チャンネル拡張信号を生成する生成ステップと、Mチャンネル・マルチ・チャンネル拡張信号と、第1の補強データとに応答してNチャンネル復号化信号を生成するステップとを含み、Mチャンネル・マルチ・チャンネル拡張信号の生成ステップが、表示データに応答して、絶対補強データとしての第2の補強データの適用、または、相対補強データとしての第2の補強データの適用から選択するステップを含む方法を提供する。
本発明の別の態様によれば、オーディオ信号を送受信する方法であって、Nチャンネル・オーディオ信号用第1のMチャンネル信号を生成するステップであって、MがNより小さいステップと、Nチャンネル・オーディオ信号に対して第1のMチャンネル信号用第1の補強データを生成するステップと、Nチャンネル・オーディオ信号用第2のMチャンネル信号を生成するステップと、第1のMチャンネル信号に対して第2のMチャンネル信号用第2の補強データを生成するステップであって、第2のMチャンネル信号に対して、絶対補強データとしての第2の補強データの生成、または、相対補強データとしての第2の補強データの生成から動的に選択するステップを含むステップと、第2のMチャンネル信号と、第1の補強データと、第2の補強データとを含む符号化出力信号を生成するステップとを含む、Nチャンネル・オーディオ信号を符号化するステップと;送信器から受信器に符号化出力信号を送信するステップと;受信器にて符号化出力信号を受信するステップと;第2のMチャンネル信号と第2の補強データとに応答してMチャンネル・マルチ・チャンネル拡張信号を生成するステップであって、絶対補強データとしての第2の補強データの適用、または、相対補強データとしての第2の補強データの適用から選択するステップを含むステップと、Mチャンネル・マルチ・チャンネル拡張信号と第1の補強データに応答してNチャンネル復号化信号を生成するステップとを含む、符号化出力信号を復号化するステップとを含む方法を提供する。
本発明の別の態様によれば、上述した方法のステップをプロセッサに実行させるように動作するコンピュータプログラムを提供する。
本発明の別の態様によれば、上述したようなマルチ・チャンネル・オーディオ符号器を含むマルチ・チャンネルオーディオレコーダを提供する。
本発明の別の態様によれば、上述したようなマルチ・チャンネル・オーディオ復号器を含むマルチ・チャンネルオーディオプレーヤ(60)を提供する。
本発明の上記およびその他の態様、特長および利点は、以下で説明する実施形態から明らかになるであろうし、かつ、以下で説明する実施形態を参照すれば明らかにされるであろう。
本発明の種々の実施形態を、例としてのみ、図面を参照しながら説明する。
以下の説明は、5.1チャンネルから2チャンネルへの符号器および2チャンネルから5.1チャンネルの復号器もしくは5.1チャンネルから2チャンネルの符号器または2チャンネルから5.1チャンネルの復号器に適用可能な本発明の実施形態が中心となっている。しかしながら、本発明は、この適用に限定されないことが理解されるであろう。
図1は、本発明の一部の実施形態によるマルチ・チャンネル・オーディオ符号器10の実施形態のブロック図を示す。このマルチ・チャンネル・オーディオ符号器10は、N個のオーディオ信号101をM個のオーディオ信号102と関連パラメータ・データ104、105とに符号化するために構成される。これにおいては、MとNは、整数であり、N>M、かつ、M≧1である。マルチ・チャンネル・オーディオ符号器10の例は、Nは、6、即ち、5+1チャンネルに等しく、Mは、2に等しい5.1チャンネルから2チャンネルへの符号器である。このようなマルチ・チャンネル・オーディオ符号器は、5.1チャンネル入力オーディオ信号を2チャンネル出力オーディオ信号、例えば、ステレオ出力オーディオ信号と関連パラメータとに符号化する。マルチ・チャンネル・オーディオ符号器10の他の例は、5.1チャンネルから1チャンネルへの符号器、6.1チャンネルから2チャンネルへの符号器、6.1チャンネルから1チャンネルへの符号器、7.1チャンネルから2チャンネルへの符号器、7.1チャンネルから1チャンネルへの符号器である。また、NがMより大きい限り、かつ、Mが1より大きいか、または1に等しい限り、NとMについて他の値を有する符号器が可能である。
符号器10は、第1の符号化装置110と、それに連結された状態で、第2の符号化装置120を含む。第1の符号化装置110は、N個の入力オーディオ信号101を受信して、N個のオーディオ信号101をM個のオーディオ信号102と第1の関連パラメータ・データ104に符号化する。M個のオーディオ信号102と第1の関連パラメータ・データ104は、N個のオーディオ信号101を表す。第1の装置110によって行われるようなM個のオーディオ信号102へのN個のオーディオ信号101の符号化は、ダウン・ミックスともいうことができ、M個のオーディオ信号102は、空間的ダウン・ミックス102ともいうことができる。装置110は、マルチ・チャンネル・オーディオ信号101をモノまたはステレオ・ダウン・ミックス・オーディオ信号102と関連パラメータ104に符号化する従来のパラメータ系マルチ・チャンネル・オーディオ符号器とすることができる。関連パラメータ104によって、復号器は、モノまたはステレオ・ダウン・ミックス・オーディオ信号102からマルチ・チャンネル・オーディオ信号101を再構築することができる。なお、ダウン・ミックス102は、3つ以上のチャンネルを有することもできる。
第1の装置110は、空間的ダウン・ミックス102を第2の装置120に供給する。第2の装置120は、空間的ダウン・ミックス102から、第2の関連パラメータ・データ105の形で第2の補強データを生成する。第2の関連パラメータ・データ105は、空間的ダウン・ミックス102を表す、即ち、これらのパラメータ105は、復号器が例えば、空間的ダウン・ミックス102に似た信号を合成することによって空間的ダウン・ミックス102の少なくとも一部を再構築することを可能にする空間的ダウン・ミックス102の特性を含む。関連パラメータ・データは、第1および第2の関連パラメータ・データ104、105を含む。
第2の関連パラメータ・データ105は、K個(M個)の更なるオーディオ信号103からの空間的ダウン・ミックス102の再構築を可能にする修正パラメータを含む。このようにして、復号器は、空間的ダウン・ミックス102のなお一層良好な再構築を行うことができる。この再構築は、代替ダウン・ミックス103、即ち、芸術的ダウン・ミックスなど、K個の更なるオーディオ信号103に基づいて行なうことができる。復号器は、代替ダウン・ミックス信号103が空間的ダウン・ミックス102により酷似するように修正パラメータを代替ダウン・ミックス信号103に適用することができる。
第2の装置120は、入力として、代替ダウン・ミックス103を受信することができる。代替ダウン・ミックス103は、符号器10の外部にあるソース(図1に示すような)から受信することができるか、あるいは、代替ダウン・ミックス103は、例えば、N個のオーディオ信号101から、符号器10(図示せず)の内側に生成することができる。第2の装置120は、空間的ダウン・ミックス102の少なくとも一部を代替ダウン・ミックス103と比較して、空間的ダウン・ミックス102と代替ダウン・ミックス103の差、例えば、空間的ダウン・ミックス102の特性と代替ダウン・ミックス103の特性の差を表す修正パラメータ105を生成することができる。この例においては、代替ダウン・ミックス103は、具体的には、空間的ダウン・ミックスに関連した芸術的ダウン・ミックスである。
この例においては、第2の装置120は、代替ダウン・ミックス103を参照することなく空間的ダウン・ミックス102を直接に表す絶対値として修正パラメータを更に生成することができる。更に、第2の装置120は、符号化出力信号について相対修正パラメータと絶対修正パラメータとから選択する機能性を含む。具体的には、この選択は、動的に行われ、信号およびパラメータ・データもしくは信号またはパラメータ・データによって、個々の信号ブロックについて行なうことができる。
更に、第2の装置120は、符号化信号の異なる信号セクションについてどの修正パラメータ(絶対または相対)が使用されたのかの表示を含める機能性を含むことができる。例えば、各信号ブロックについて、データ・ビットを含めて、その信号ブロックについて、相対パラメータまたは絶対パラメータが含まれているのか示すことができる。
修正パラメータ105は、分散、共分散、および相関などの1つまたはそれ以上の統計的な信号特性(の差)、またはこれらの特性、またはダウン・ミックス信号(の差)の比率を含むことが好ましい。なお、信号の分散は、その信号のエネルギーまたは電力と同等である。これらの統計的な信号特性によって、空間的ダウン・ミックスの良好な再構築が可能である。
図2は、本発明の一部の実施形態によるマルチ・チャンネル・オーディオ復号器20の実施形態のブロック図を示す。復号器20は、K個のオーディオ信号103と関連パラメータ・データ104、105とをN個のオーディオ信号203に復号化するように構成される。これにおいては、KとNは、整数であり、N>K、K≧1である。K個のオーディオ信号103、即ち、代替ダウン・ミックス103と関連パラメータ・データ104、105は、N個のオーディオ信号203、即ち、マルチ・チャンネル・オーディオ信号203を表す。マルチ・チャンネル・オーディオ復号器20の例は、Nが6、即ち、5+1チャンネルに等しく、Kが2に等しい2チャンネルから5.1チャンネルへの復号器である。このようなマルチ・チャンネル・オーディオ復号器は、2チャンネル入力オーディオ信号、例えば、ステレオ入力オーディオ信号と関連パラメータとを5.1チャンネル出力オーディオ信号に復号化する。マルチ・チャンネル・オーディオ復号器20の他の例は、1チャンネルから5.1チャンネルへの復号器、2チャンネルから6.1チャンネルへの復号器、1チャンネルから6.1チャンネルへの復号器、2チャンネルから7.1チャンネルへの復号器、1チャンネルから7.1チャンネルへの復号器である。また、NがKより大きい限り、かつ、Kが1より大きいか、または1に等しい限り、NとKについて他の値を有する復号器が可能である。
マルチ・チャンネル・オーディオ復号器20は、第1の装置210と、それに連結された状態で、第2の装置220とを含む。第1の装置210は、代替ダウン・ミックス103と修正パラメータ105の形である補強データとを受信し、代替ダウン・ミックス103と修正パラメータ105とから、M個の更なるオーディオ信号202、即ち、空間的ダウン・ミックス202、または、その近似値を再構築する。これにおいては、Mは、整数であり、M≧1である。修正パラメータ105は、空間的ダウン・ミックス202を表す。第1の装置210は、具体的には、修正パラメータ105が 絶対修正パラメータまたは相対修正パラメータであるかを判断し、相応にパラメータを適用するように構成される。具体的には、第1の装置210は、個々の信号ブロックに関する修正パラメータ105が受信ビットストリームの明示的データに基づいて相対パラメータまたは絶対パラメータであるか判断することができる。例えば、パラメータがその信号ブロックにおいて絶対修正パラメータまたは相対修正パラメータであるかを示す各信号ブロックについて単一のデータビットを含むことができる。
第2の装置220は、第1の装置210と修正パラメータ104とから空間的ダウン・ミックス202を受信する。第2の装置220は、空間的ダウン・ミックス202と修正パラメータ104とをマルチ・チャンネル・オーディオ信号203に復号化する。第2の装置220は、モノまたはステレオ・ダウン・ミックス・オーディオ信号202と関連パラメータ104をマルチ・チャンネル・オーディオ信号203とに復号化する従来のパラメータ系マルチ・チャンネル・オーディオ復号器とすることができる。
第1の装置210は、入力信号103から信号202を再構築することが必要または望ましいか判断するように構成される。このような再構築は、代替ダウン・ミックス103ではなく、空間的ダウン・ミックス信号202が第1の装置210に供給されるときには適用不可能である場合がある。第1の装置210は、入力信号103から、修正パラメータ105に含まれるのと類似のまたは同じ信号特性を生成することによって、かつ、これらの生成された信号特性を修正パラメータ105と比較することによってこれを判断することができる。この比較によって生成信号特性が修正パラメータ105と等しいかまたは実質的に等しいとわかった場合、入力信号103は、空間的ダウン・ミックス信号202と十分に類似するものであり、第1の装置210は、入力信号103を第2の装置220に転送することができる。この比較によって生成信号特性が修正パラメータ105と等しくないかまたは実質的に等しくないとわかった場合、入力信号103は、空間的ダウン・ミックス信号202に十分に類似するものではなく、第1の装置210は、入力信号103と修正パラメータ105とから空間的ダウン・ミックス信号202を再構築/近似処理することができる。
第1の装置210は、代替ダウン・ミックスから、代替ダウン・ミックス103を表す更なる修正パラメータ/特性を生成することができる。このような場合、第1の装置210は、代替ダウン・ミックス103と修正パラメータ105および更なる修正パラメータ(の差)とから空間的ダウン・ミックス202を再構築することができる。
修正パラメータ105と更なる修正パラメータは、それぞれ、空間的ダウン・ミックス202、代替ダウン・ミックス103の統計的特性を含むことができる。分散、相関、共分散などのこれらの統計的特性によって、これらのパラメータの導出元である信号が良好に表される。これらの統計的特性は、関連特性が修正パラメータ105内に含まれる特性と適合するように代替ダウン・ミックスを変換させることによって空間的ダウン・ミックス202を再構築する際に有用である。
図3は、本発明の一部の実施形態による送信システム70の実施形態のブロック図を示す。送信システム70は、送信チャンネル30、例えば、有線または無線通信リンクを介して符号化マルチ・チャンネル・オーディオ信号を受信器50に送信する送信器40を含む。送信器40は、上述したように、マルチ・チャンネル・オーディオ信号101を、空間的ダウン・ミックス102と、関連パラメータ104、105とに符号化するマルチ・チャンネル・オーディオ符号器10を含む。送信器40は、パラメータ104、105と、空間的ダウン・ミックス102または代替ダウン・ミックス103とを含む符号化マルチ・チャンネル・オーディオ信号を送信チャンネル30を介して受信器50に送信する手段41を更に含む。受信器50は、符号化マルチ・チャンネル・オーディオ信号を受信する手段51と、上述したように、代替ダウン・ミックス103または空間的ダウン・ミックス102と関連パラメータ104、105とをマルチ・チャンネル・オーディオ信号203に復号化するマルチ・チャンネル・オーディオ復号器20を含む。
図4は、本発明の一部の実施形態によるマルチ・チャンネル・オーディオプレーヤ/レコーダ60の実施形態のブロック図を示す。オーディオプレーヤ/レコーダ60は、本発明の一部の実施形態によるマルチ・チャンネル・オーディオ復号器20およびマルチ・チャンネル・オーディオ符号器10もしくは本発明の一部の実施形態によるマルチ・チャンネル・オーディオ復号器20またはマルチ・チャンネル・オーディオ符号器10を含む。オーディオプレーヤ/レコーダ60は、独自の記憶装置、例えば、固体メモリまたはハードディスクを有することができる。また、オーディオプレーヤ/レコーダ60は、(記録可能)DVDディスクまたは(記録可能)CDディスクなどの着脱式記憶手段を容易にすることができる。代替ダウン・ミックス103とパラメータ104、105とを含む格納された符号化マルチ・チャンネル・オーディオ信号は、復号器20によって復号化して、オーディオプレーヤ/レコーダ60によってプレイつまり再生することができる。符号器10は、記憶手段上での格納に向けてマルチ・チャンネル・オーディオ信号を復号化することができる。
図5は、本発明の一部の実施形態によるマルチ・チャンネル・オーディオ符号器10のブロック図を示す。図5の符号器は、具体的には、図1の符号器10とすることができる。符号器10は、第1の装置110と、それに連結された状態で、第2の装置120とを含む。第1の装置110は、それぞれ、左前、左後、右前、右後、中央を含む5.1マルチ・チャンネル・オーディオ信号101と、低周波補強オーディオ信号lf、lr、rf、rr、co、lfeを受信する。第2の装置120は、それぞれ、左芸術的オーディオ信号と右芸術的オーディオ信号la、raとを含む芸術的ステレオ・ダウン・ミックス103を受信する。マルチ・チャンネル・オーディオ信号101と芸術的ダウン・ミックス103は、時間ドメイン・オーディオ信号である。第1および第2の装置110、120においては、これらの信号101、103は、セグメント化されて、周波数ドメインに変換される。
第1の装置110においては、パラメータ・データ104を3段階で導出する。第1の段階においては、3対のオーディオ信号lfとrf、rfとrr、coとlfeをそれぞれセグメント化して、セグメント化信号を、それぞれ、セグメント化・変換装置112、113、114において周波数ドメインに変換させる。セグメント信号の結果的に得られる周波数ドメイン表現は、それぞれ、周波数ドメイン信号Lf、Lr、Rf、Rr、Co、LFEとして示される。第2の段階においては、3対のこれらの周波数ドメイン信号LfとLr、RfとRr、CoとLFEを、それぞれ、ダウン・ミキサ115、116、117においてダウンミックス処理して、それぞれ、モノ・オーディオ信号L、R、Cと、それぞれ、関連パラメータ141、142、143とを生成する。ダウン・ミキサ115、116、117は、従来のMPEG4パラメータ系ステレオ符号器とすることができる。最後に、第3の段階において、3つのモノ・オーディオ信号L、R、Cをダウン・ミキサ118内でダウン・ミックス処理して空間的ステレオ・ダウン・ミックス102と関連パラメータ144とを取得する。空間的ダウン・ミックス102は、信号LoとRoを含む。
パラメータ・データ141、142、143、144は、第1の関連パラメータ・データ104の形で第1の補強データ内に含まれる。パラメータ・データ104と空間的ダウン・ミックス102は、5.1入力信号101を表す。
第2の装置においては、それぞれ、オーディオ信号laとraによって時間ドメインにおいて表される芸術的ダウン・ミックス信号103は、まず、セグメント化装置121内でセグメント化される。結果的に得られるセグメント化オーディオ信号127は、それぞれ、信号lasとrasを含む。次に、このセグメント化オーディオ信号127は、変換器122によって周波数ドメインに変換される。結果的に得られる周波数ドメイン信号126は、信号LaとRaを含む。最後に、セグメント化された芸術的ダウン・ミックス103の周波数ドメイン表現である周波数ドメイン信号126とセグメント化空間的ダウン・ミックス102の周波数ドメイン表現は、発生器123に供給され、発生器123は、芸術的ダウン・ミックス103が空間的ダウン・ミックス102により酷似するように、復号器が芸術的ダウン・ミックス103を修正/変換することを可能にする修正パラメータ105の形で更なる(第2の)補強データを生成する。
特定の例においては、また、セグメント化時間ドメイン信号127は、セレクター124に供給される。セレクター124への他の2つの入力は、空間的ステレオ・ダウン・ミックス102の周波数ドメイン表現と制御信号128である。制御信号128は、セレクター124が芸術的ダウン・ミックス103または空間的ダウン・ミックス102を符号化マルチ・チャンネル・オーディオ信号の一部として出力するべきであるか判断する。空間的ダウン・ミックス102は、芸術的ダウン・ミックスがないときに選択することができる。制御信号128は、手作業で設定することができるか、または、芸術的ダウン・ミックス103の存在を感知することによって自動的に生成することができる。制御信号128は、対応する復号器20が後述するように制御信号128を利用することができるようにパラメータ・ビット・ストリーム内に含めることができる。したがって、この例示的な符号器によって、空間的ダウン・ミックス102または芸術的ダウン・ミックス103を含む信号を生成することができる。
セレクター124の出力信号102、103は、信号loとroとして示される。芸術的ステレオ・ダウン・ミックス127がセレクター124によって出力されなければならない場合、セグメント化時間ドメイン信号lasとrasは、重複加算によってセレクター124内で信号loとroに結合される。空間的ステレオ・ダウン・ミックス102が制御信号128によって表示されるように出力されなければならない場合、セレクター124は、信号LoとRoを時間ドメインに変換して、重複加算によって信号loとroに結合する。時間ドメイン信号loとroは、5.1チャンネルから2チャンネルへの符号器10のステレオ・ダウン・ミックスを成す。
発生器123を以下で更に詳細に説明する。発生器123の機能は、第2の補強データ、具体的には、芸術的ダウン・ミックス103がある意味で元の空間的ダウン・ミックス102に類似するように、芸術的ダウン・ミックス103の変換を記述する修正パラメータを判断することである。
一般に、この変換は、以下のように記述することができる。
Figure 2008535015
ここで、
Figure 2008535015

Figure 2008535015
は、芸術的ダウン・ミックス103の左右のチャンネルの時間/周波数タイルのサンプルを含むベクトルであり、
Figure 2008535015

Figure 2008535015
は、修正芸術的ダウン・ミックスの左右のチャンネルの時間/周波数タイルのサンプルを含むベクトルであり、
Figure 2008535015
は、任意選択的補助チャンネルの時間/周波数タイルのサンプルを含み、
Figure 2008535015
は、変換行列である。なお、任意のベクトル
Figure 2008535015
が、列ベクトルと定義される。修正芸術的ダウン・ミックスは、元の空間的ダウン・ミックス102と類似するように、この変換によって変換される芸術的ダウン・ミックス103である。補助チャンネル
Figure 2008535015
は、説明するシステムにおいては、空間的ダウン・ミックス信号またはその低周波コンテンツである。
(N+2)×2変換行列
Figure 2008535015
は、修正芸術的ダウン・ミックスへの芸術的ダウン・ミックス103と補助チャンネルの変換を記述する。変換行列
Figure 2008535015
またはその要素は、復号器20が変換行列
Figure 2008535015
の少なくとも一部を再構築することができるように修正パラメータ105に含まれることが好ましい。その後、復号器20は、変換行列
Figure 2008535015
を芸術的ダウン・ミックス103に適用して空間的ダウン・ミックス102を再構築することができる(以下で説明するように)。
あるいは、修正パラメータ105は、信号特性、例えば、空間的ダウン・ミックス102のエネルギーまたは電力値および相関値もしくはエネルギーまたは電力または相関値を含む。その後、復号器20は、芸術的ダウン・ミックス103から当該の信号特性を生成することができる。空間的ダウン・ミックス102と芸術的ダウン・ミックス103の信号特性によって、復号器20は、変換行列
Figure 2008535015
(以下で説明)を構築し、かつ、それを芸術的ダウン・ミックス103に適用して空間的ダウン・ミックス102を再構築することができる(やはり以下で説明)。
具体的には、発生器123は、相対修正データも絶対修正データも生成し、かつ、個々の信号ブロック(またはセグメント)についてこのデータから選択するように構成される。したがって、符号化信号に関する修正パラメータ105は、異なる信号ブロックに向けて絶対修正データも相対修正データも含む。絶対修正データとは対照的に、相対修正データは、芸術的ダウン・ミックス103に対して空間的ダウン・ミックス102を記述する。具体的には、相対修正データは、空間的ダウン・ミックス・サンプルに(より密接に)対応するように芸術的ダウン・ミックス・サンプルを修正することを可能にする差分データとすることができ、一方、絶対ダウン・ミックス・データは、芸術的ダウン・ミックス・サンプルを参照または芸術的ダウン・ミックス・サンプルに依存することなく、直接、空間的ダウン・ミックス・サンプルに対応することができる。
以下を含め、元のステレオ・ダウン・ミックス102に似るように芸術的ダウン・ミックス103を修正する方法が幾つかあることが理解されるであろう。
I.波形の適合。
II.統計的特性の適合。
a.左右のチャンネルのエネルギーまたは電力の適合。
b.左右のチャンネルの共分散行列の適合。
III.左右のチャンネルのエネルギーまたは電力の拘束下での波形の可能な最良の適合を取得する。
IV.上述した方法IからIIIを混合する。
明確にするために、(1)の補助チャンネル
Figure 2008535015
は、変換行列
Figure 2008535015

Figure 2008535015
のように書くことができるように初めは考慮されず、相対補強データは、例えば、以下として生成することができる。
I.波形適合(方法I)
芸術的ダウン・ミックス103と空間的ダウン・ミックス102の波形の適合は、修正芸術的ダウン・ミックスの左信号も右信号も芸術的ステレオ・ダウン・ミックス103の左右の信号の線形結合として表すことによって得ることができる。
Figure 2008535015
その後、(2)の行列
Figure 2008535015
は、以下のように書くことができる。
Figure 2008535015
パラメータα、α、βおよびβを選ぶ方法は、空間的ダウン・ミックス信号LとRとその推定値(即ち、修正芸術的ダウン・ミックス信号
Figure 2008535015

Figure 2008535015
)とのユークリッド距離の2乗を最小限に抑えることである。したがって、
Figure 2008535015
および
Figure 2008535015
II.統計的特性の適合(方法II)
方法II.a:左右の信号のエネルギーを適合させることをここで論じる。それぞれ、
Figure 2008535015

Figure 2008535015
によって示す、修正左芸術的ダウン・ミックス信号と修正右芸術的ダウン・ミックス信号をここで以下の要領で計算する。
Figure 2008535015
ここで、真のパラメータの場合、αとβは、以下によって示される。
Figure 2008535015
その結果、変換行列
Figure 2008535015
は、以下のように書くことができる。
Figure 2008535015
これらの選択で、それぞれ、信号
Figure 2008535015

Figure 2008535015
は、それぞれ、信号
Figure 2008535015

Figure 2008535015
と同じエネルギーを有することを確認することができる。
方法II.b:芸術的ステレオ・ダウン・ミックス103と空間的ダウン・ミックス102の共分散行列を適合させるには、これらの行列を以下のように固有値分解を使用して分解することができる。
Figure 2008535015
ここで、芸術的ステレオ・ダウン・ミックス103の共分散行列
Figure 2008535015
は、以下によって示される。
Figure 2008535015
Figure 2008535015
は、ユニタリ行列であり、
Figure 2008535015
は、対角行列である。
Figure 2008535015
は、空間的ステレオ・ダウン・ミックス102の共分散行列であり、
Figure 2008535015
は、ユニタリ行列であり、
Figure 2008535015
は、対角行列である。
Figure 2008535015
を計算するとき、2つの相互無相関信号
Figure 2008535015

Figure 2008535015
が得られ(行列
Figure 2008535015
との乗算により)、これらの信号は、単位エネルギー(行列
Figure 2008535015
のにより)を有する。
Figure 2008535015
を計算することによって、まず、
Figure 2008535015
の共分散行列は、恒等行列、即ち、
Figure 2008535015
に等しい共分散行列に変換される。いずれかの任意のユニタリ行列
Figure 2008535015
を適用すれば、共分散構造が変えられないことになり、
Figure 2008535015
を適用すると、結果的に、空間的ステレオ・ダウン・ミックス102と等しい共分散構造が得られる。
行列
Figure 2008535015
と信号
Figure 2008535015

Figure 2008535015
を以下のように定義してみよう。
Figure 2008535015
行列
Figure 2008535015
は、可能な最良の波形適合が、最小のユークリッド距離2乗に関して、信号
Figure 2008535015

Figure 2008535015
と信号
Figure 2008535015

Figure 2008535015
との間で得られるように選ぶことができ、
Figure 2008535015

Figure 2008535015
は、(11)によって示される。
Figure 2008535015
に関するこの選択については、統計的方法内での波形適合を用いることができる。
(12)から、変換行列
Figure 2008535015
は、以下によって示されることがわかる。
Figure 2008535015
III.エネルギー拘束下での最良の波形適合(方法III)
(3)を仮定すると、パラメータα、α、βおよびβは、エネルギー拘束下で(4)と(5)を最小限に抑えることによって得ることができる。
Figure 2008535015
IV.混合方法(方法IV)
異なる方法の混合に関して、可能な組み合わせとして、方法II.aと方法II.bの混合または方法II.aと方法IIIの混合が挙げられる。以下のように進むことができる。
a)方法II.b/IIIを使用したときに得られる
Figure 2008535015

Figure 2008535015
間と
Figure 2008535015

Figure 2008535015
間の波形適合が良好である場合、方法II.b/IIIを使用する。
b)この波形適合が不良である場合、方法II.aを使用する。
c)この波形適合の質の関数として、変換行列を混合させることによって、2つの方法の漸進的な移行を確保する。
これを、数学的に以下のように表すことができる。
(3)と(2)を使用して、変換行列
Figure 2008535015
を以下のように一般的な形で書くことができる。
Figure 2008535015
この行列は、2つのベクトル
Figure 2008535015

Figure 2008535015
を使用して以下のように書き換えることができる。
Figure 2008535015
方法II.bまたは方法IIIのいずれかを使用して得られた
Figure 2008535015

Figure 2008535015
の波形適合の質は、
Figure 2008535015
で表される。以下のように定義される。
Figure 2008535015
方法II.bまたは方法IIIのいずれかを使用して得られた
Figure 2008535015

Figure 2008535015
の波形適合の質は、
Figure 2008535015
で表される。以下のように定義される。
Figure 2008535015

Figure 2008535015

Figure 2008535015
は両方とも、0と1の間にある。左チャンネルの混合係数
Figure 2008535015
と右チャンネルの混合係数
Figure 2008535015
は、以下のように定義することができる。
Figure 2008535015
ここで、
Figure 2008535015

Figure 2008535015

Figure 2008535015

Figure 2008535015
は、0と1の間の値であり、
Figure 2008535015

Figure 2008535015
である。方程式(20)は、混合係数
Figure 2008535015

Figure 2008535015
が0と1の間であることを確保するものである。
方法II.a、II.b、IIIの変換行列
Figure 2008535015
は、それぞれ、(8)によって示めされる
Figure 2008535015
、(14)によって示される
Figure 2008535015

Figure 2008535015
と定義しよう。各変換行列は、以下のように2つのベクトルで分割することができ、これは、(17)における
Figure 2008535015
の分割に似たものである。
Figure 2008535015
方法II.aと方法II.bを混合する変換行列
Figure 2008535015
は、以下のように得られる。
Figure 2008535015
方法II.aと方法IIIを混合する変換行列
Figure 2008535015
は、以下のように得られる。
Figure 2008535015
ここで、2つの補強層チャンネルに対応する2つの補助チャンネルを考慮すると、上記の方程式(1)は、以下のように書き換えることができる。
Figure 2008535015
ここで、
Figure 2008535015

Figure 2008535015
(前と同様)は、それぞれ、芸術的ダウン・ミックスの左右のチャンネルの時間/周波数タイルのサンプルを含み、
Figure 2008535015

Figure 2008535015
は、それぞれ、修正芸術的ダウン・ミックスの左右のチャンネルの時間/周波数タイルのサンプルを含み、
Figure 2008535015

Figure 2008535015
は、補強層信号の時間/周波数タイルのサンプルを含む。したがって、4×2変換行列T'は、芸術的ダウン・ミックスと補強層信号から修正芸術的ダウン・ミックスへの変換を記述する。方程式(1)に関して、ここで使用される2つのみの補助チャンネルは、補強層信号
Figure 2008535015

Figure 2008535015
である。
特定の例示的なシステムにおいては、第2の補強層は、2つの異なるタイプのデータを含むことができる。
第1のタイプのデータは、方程式(1)の行列T内に含まれたパラメータを含む。これらのパラメータは、この例においては、信号帯域全体について計算され、ある意味で空間的ダウン・ミックスに似るように芸術的ステレオ・ダウン・ミックスを変換させるものである。したがって、この種のパラメータは、元の空間的ダウン・ミックスにより酷似する修正芸術的ダウン・ミックスを実現することができるが、(必ずしも)復号器が空間的ダウン・ミックスを正確に生成することを可能にするわけではない。各時間/周波数タイルについては、4つのパラメータのみが必要であり、即ち、Tの値が必要とされる(T11、T12、T21、T22)。これらのパラメータは、絶対コーディングまたは差分コーディングすることができ、符号器10は、具体的には絶対符号化と差分符号化との間で切り替わることができる。
第2のタイプのデータは、実際の空間的ダウン・ミックスに対応するものであり、この特定の例においては、空間的ダウン・ミックスの帯域限定バージョンの表現である。具体的には、このタイプのデータは、空間的ダウン・ミックスの低周波部分(例えば、1.7kHzを下回る周波数)を表す。これによって、同じ、例えば、統計的特性を有する信号をただ生成するのではなく、復号器にて空間的ダウン・ミックスのこの部分を非常に正確に再構築することが可能になる(行列Tの場合と同様に)。この種のデータは、芸術的ダウン・ミックスに絶対的にまたは相対的にコーディングすることができる。具体的には、このタイプのデータを差分符号化することができる。例えば、変換行列Tを芸術的ダウン・ミックスに適用すると(例えば、方程式(26)を参照されたい)、その信号と空間的ダウン・ミックスの差を符号化することができる。
したがって、一部の実施形態においては、第2の補強データは、補強データの第1の部分と第2の部分に分割され、第1の部分は、第2の部分ほど正確には空間的ダウン・ミックスを記述しない。一般的に、第2の補強データの第1の部分の対応するデータ転送速度は、第2の部分より遅い。第2の補強データの第2の部分の補強データは、ダウン・ミックスの一部のみに関連することができ、具体的には、低周波部分にのみ関連することができる。
一部の実施形態においては、発生器123は、第2の補強データの第1の部分と第2の部分の両方について、個別にまたはまとめて、絶対データと相対データとから選択するように配置することができる。他の実施形態においては、発生器123は、データの部分の1つのみについて絶対データと相対データから選択することができる。具体的には、以下では、第2の補強データの第1の部分がTのパラメータを含み、一方、第2の部分が空間的ダウン・ミックスの低周波表現を含み、絶対データと相対データとからの動的な選択は、第2の補強データの第2の部分にのみ適用される種々の実施形態について説明する。
第2の補強データの第2の部分の相対データは、これらの実施形態においては、例えば、第1の部分の補強データが適用された後の芸術的ダウン・ミックスに対する差分値(即ち、修正芸術的ダウン・ミックスに対する差分値)として生成することができる。
以下においては、発生器123が第2の補強データの第2の部分について絶対データと相対データとからのみ選択する実施形態について以下で説明する。
第2の補強データの第1の部分と第2の部分の一部に関する絶対補強データは、この例においては、以下を設定することによって関連時間/周波数タイルについて導出することができる。
Figure 2008535015
ここで、
Figure 2008535015

Figure 2008535015
は、それぞれ、空間的ステレオ・ダウン・ミックスの左右のチャンネルの時間/周波数タイルのサンプルを含む。したがって、この特定の例においては、絶対補強データは、単に、芸術的ダウン・ミックス103の対応する時間/周波数タイル・サンプルに取って代わることができる空間的ダウン・ミックス102の実際の時間/周波数タイル・サンプルだけである。
更に、第2の補強データの第1および第2の部分のその部分については、関連時間/周波数タイルに関する相対補強データは、具体的には、以下を設定することによって差分データとして導出することができる。
Figure 2008535015
ここで、パラメータT11、T12、T21、T22は、方程式(2)の行列Tを構成する。
Figure 2008535015
このようにして、発生器123は、芸術的ダウン・ミックス103について絶対補強データと相対補強データの両方を生成することができ、復号器は、マルチ・チャンネル補強データの生成に使用される空間的ダウン・ミックス102により酷似する修正芸術的ダウン・ミックスを生成することができる。
発生器123は、更に、絶対補強データと相対補強データとから選択するように構成される。この選択は、この特定の例においては、個々の信号ブロック(例えば、個々のセグメント)について、かつ、これらの信号ブロック内の信号の特性に基づいて行われる。具体的には、発生器123は、任意の信号ブロックについて絶対補強データと相対補強データの特性を評価することができ、任意の信号ブロックについてどちらのデータを補強層に含めるべきか判断することができる。更に、発生器123は、どちらのデータが選択されたかの表示を含むことができ、その結果、復号器は、受信補強データを正しく適用することができる。
一部の実施形態においては、発生器123は、符号化を評価して、絶対補強データまたは相対補強データを最も効率的に符号化することができる(例えば、任意の精度を得るための最少数のビットで)か判断することができる。強引な方法として、実際に両方のタイプの補強データを符号化して符号化データサイズを比較することができる。しかしながら、これは、一部の実施形態においては複雑な方法となる恐れがあり、例示的な符号器10においては、発生器123は、相対補強データの信号エネルギーに対する絶対補強データの信号エネルギーを評価して、2つの比較に基づいてどちらのタイプのデータを含めるべきか選択する。
具体的には、オーディオ・コーダについては、ビットレートに関して、できるだけ小さなエネルギーで信号を符号化することが有益であることが多い。したがって、発生器123は、最低信号エネルギーを有するタイプの補強データを選択する。特に、相対補強データは、
Figure 2008535015
のときに選択され、それ以外の場合には、絶対補強データが選択される。
異なる補強データ間の切り替えに関する問題は、一部の顕著な人為的影響が起こる恐れがあるということである。例示的符号器10においては、発生器123は、異なる補強データ間で漸進的に切り替わる機能性も含む。したがって、切り替わりは、1つの信号ブロック内の1つのタイプの補強データから次の信号ブロック内の別のタイプに直に切り替わるのではなく、一方のセットのデータから他方のセットに漸進的に行われる。
したがって、(1つの信号ブロックを下回るかまたは上回る持続時間を有する)時間間隔中、発生器123は、絶対補強データと相対補強データの結合として補強データを生成する。この結合は、例えば、異なるタイプのデータ間の補間によって達成することができるか、または、この結合では、重複加算法を用いることができる。
特定の例として、異なるタイプの補強データ間で急に切り替わる
Figure 2008535015
ではなく、送信される補強データは、
Figure 2008535015
として生成することができ、ここでは、k番目のデータ・フレームのαの値は、以下と判断することができる。
Figure 2008535015
現在のフレームが絶対コーディングされる場合。
現在のフレームが差分コーディングされる場合。

ここで、αは、k番目のフレーム内のαの値を示し、δは、適応速度である。δ=0.33という値は、多くのシナリオにおいて確実に人為的影響がない符号化を実現することができる。方程式(29)内に示す信号
Figure 2008535015

Figure 2008535015
は、パラメータ補間または重複加算法を用いて取得することができ、符号化されてビット・ストリームに追加される。更に、差分補強データまたは絶対補強データに関する判断が、ビット・ストリーム内に含まれ、その結果、復号器が、符号器内で使用されるのと同じα値を導出することが可能になる。
ここの説明では個別にこれらのM個のチャンネルの各々の(チャンネル間の)コーディングと共に差分モードと絶対モードを用いることが中心となっているが、他の実施形態では、異なる符号化法を用いることができることが理解されるであろう。例えば、M=2の場合、次のステップは、例えば、ステレオ信号の(チャンネル間の)コーディングを行うときにはM/Sコーディング(Mid/Sideコーディング、したがって、和信号と差信号をコーディング)を適用することとすることができる。多くの実施形態においては、これは、個々のチャンネルの(チャンネル間の)コーディングの差分モードと絶対モードの両方において有利であろう。
変換行列T'の諸要素は、実数値または複素数値とすることができる。これらの諸要素は、以下のように修正パラメータに符号化することができる。実数でありかつ正である変換行列
Figure 2008535015
の諸要素は、MPEG4 Parametric Stereo内で使用されるIIDパラメータなど、対数で定量化することができる。小さな信号の過剰増幅を回避するためにパラメータの値について上限値を設定することが可能である。この上限値は、固定であるか、または、自動生成される左チャンネルと芸術的左チャンネル間の相関および自動生成される右チャンネルと芸術的右チャンネル間の相関の関数とすることができる。複雑である
Figure 2008535015
の諸要素のうち、大きさは、IIDパラメータを用いて定量化することができ、位相は、線形に定量化することができる。T'の諸要素は、実数であり、恐らくは負は、負の値と正の値の区別を確保しながら、要素の絶対値の対数を取ることによって、コーディングすることができる。
図6は、図5の発生器123の例をより詳細に示す。この例においては、発生器123は、信号ブロック・プロセッサ145を含み、信号ブロック・プロセッサ145は、周波数ドメイン空間的ダウン・ミックス102と周波数ドメイン芸術的ダウン・ミックス126とを受信して、信号を信号ブロックに分割する。各信号ブロックは、所定の持続時間の時間間隔に対応することができる。一部の実施形態においては、信号ブロックは、あるいはまたは更に、周波数ドメイン内で分割することができ、かつ、例えば、変換サブチャンネルは、異なる信号ブロックでまとめてグループ化することができる。
信号ブロック・プロセッサ145は、絶対補強データ・プロセッサ146に連結され、絶対補強データ・プロセッサ146は、先述したように、個々の信号ブロックについて絶対補強データを生成する。更に、信号ブロック・プロセッサ145は、相対補強データ・プロセッサ147に連結され、相対補強データ・プロセッサ147は、先述したように、個々の信号ブロックについて相対補強データを生成する。相対補強データと絶対補強データは、信号ブロック内の信号特性に基づいて判断され、具体的には、任意の時間/周波数タイル・グループに関する補強データは、その時間/周波数タイル・グループのみに基づいて判断することができる。
絶対補強データ・プロセッサ146は、第1の信号エネルギー・プロセッサ148に連結され、第1の信号エネルギー・プロセッサ148は、先述したように、各信号ブロック内の絶対補強データの信号エネルギーを判断する。同様に、相対補強データ・プロセッサ147は、第2の信号エネルギー・プロセッサ149に連結され、第2の信号エネルギー・プロセッサ149は、先述したように、各信号ブロック内の相対補強データの信号エネルギーを判断する。
第1および第2の信号エネルギー・プロセッサ148、149は、選択プロセッサ150に連結され、選択プロセッサ150は、各信号ブロックについて、どちらのタイプが最低信号エネルギーを有するかによって絶対補強データまたは相対補強データから選択する。
選択プロセッサ150は、補強データ・プロセッサ151に供給され、補強データ・プロセッサ151は、更に、補強データ・プロセッサ146と相対補強データ・プロセッサ147とに連結される。選択プロセッサ151は、どちらのタイプの補強データが選択されたかを示す制御信号を受信して、相応に、その補強データを選択補強データとして生成する。更に、選択プロセッサ151は、切り替え時間間隔中の絶対パラメータと相対パラメータ間の補間を含む漸進的な切り替えを行うように配置される。
選択プロセッサ151は、符号化プロセッサ152に連結され、符号化プロセッサ152は、特定のプロトコルに従って補強データを符号化する。更に、符号化プロセッサ152は、例えば、各信号ブロックについてビットを設定してデータタイプを表示することによって、どちらのタイプのデータが選択されているかを示すデータを符号化する。符号化プロセッサ152からのこの符号化データは、符号器10によって生成された符号化ビット・ストリーム内に含まれる。
図7は、具体的には図2のオーディオ復号器20とすることができる、本発明の一部の実施形態によるマルチ・チャンネル・オーディオ復号器の別の実施形態のブロック図を示す。
復号器20は、第1の装置210と、それに連結された状態で、第2の装置220を含む。第1の装置210は、ダウン・ミックス信号loとroおよび修正パラメータ105を入力として受信する。この入力は、例えば、図1または図5の符号器10からの単一のビット・ストリームとして受信することができる。ダウン・ミックス信号loとroは、空間的ダウン・ミックス102または芸術的ダウン・ミックス103の一部とすることができる。
第1の装置210は、セグメント化・変換装置211とダウン・ミックス修正装置212とを含む。ダウン・ミックス信号loとroは、それぞれ、セグメント化され、セグメント化信号は、セグメント化・変換装置211内で周波数ドメインに変換される。セグメント化ダウン・ミックス信号の結果的に得られる周波数ドメイン表現は、それぞれ、周波数ドメイン信号LoとRoとして示される。次に、周波数ドメイン信号LoとRoは、ダウン・ミックス修正装置212内で処理される。ダウン・ミックス修正装置212の機能は、空間的ダウン・ミックス202に似るように入力ダウン・ミックスを修正すること、即ち、芸術的ダウン・ミックス103と修正パラメータ105から空間的ダウン・ミックス202を再構築することである。
空間的ダウン・ミックス102が復号器20によって受信された場合、ダウン・ミックス修正装置212は、ダウン・ミックス信号LoとRoを修正する必要はなく、これらのダウン・ミックス信号LoとRoは、単に、空間的ダウン・ミックス202のダウン・ミックス信号LdとRdとして第2の装置220に渡すことができる。制御信号217は、入力ダウン・ミックスの修正の必要性があるかどうか、即ち、入力ダウン・ミックスが空間的ダウン・ミックスであるのかそれとも代替ダウン・ミックスであるのかを表示することができる。制御信号217の生成は、例えば、入力ダウン・ミックスと、所望の空間的ダウン・ミックスの信号特性を記述することができる関連パラメータ105とを分析することによって、復号器20内で内部的に行なうことができる。入力ダウン・ミックスが所望の信号特性に適合する場合、修正が不要であることを表示するように制御信号217を設定することができる。あるいは、制御信号217は、手作業で設定することができるか、または、その設定は、例えば、パラメータセット105において符号化マルチ・チャンネル・オーディオ信号の一部として受信することができる。
符号器20が芸術的ダウン・ミックス103を受信し、制御信号217が、受信ダウン・ミックス信号LoとRoはダウン・ミックス修正装置212によって修正されるべきであると表示する場合、復号器は、受信修正パラメータの表現によって2通りに動作することができる。パラメータが芸術的ダウン・ミックスから空間的ダウン・ミックスへの相対変換を表す場合(即ち、パラメータが相対補強データである場合)、符号器内で行われる動作と逆に修正パラメータを芸術的ダウン・ミックスに適用することによって、直接、変換変数が取得される。異なる実施形態においては、これは、例えば、第2の補強データの第2の部分に適用することができる。
一方、送信パラメータが空間的ダウン・ミックスの絶対特性を表す場合、復号器は、直接、空間的ダウン・ミックス・サンプルによって芸術的ダウン・ミックス・サンプルを置き換えることができる。例えば、第2の補強データの第2の部分が単に空間的ダウン・ミックスの時間/周波数タイル・サンプルにある場合、復号器は、直接、芸術的ダウン・ミックスの対応する時間/周波数タイル・サンプルをこれらで置き換えることができる。復号器が、まず、実際に送信された芸術的ダウン・ミックスの対応する特性を計算することも可能であることが理解されるであろう。この情報(送信パラメータと送信芸術的ダウン・ミックスの算出特性)を用いて、送信芸術的ダウン・ミックス(の特性)から空間的ダウン・ミックス(の特性)への変換を記述する変換変数が判断される。より具体的にいうと、変換行列Tの判断は、先述した方法II.aまたは(若干修正された)II.bを用いて行なうことができる。
方法II.aは、絶対エネルギーが第2の補強データの第1の部分において送信された場合に用いることができる。送信(絶対)パラメータ
Figure 2008535015

Figure 2008535015
は、それぞれ、空間的ダウン・ミックスの左右の信号のエネルギーを表し、以下によって示される。
Figure 2008535015
送信ダウン・ミックス
Figure 2008535015

Figure 2008535015
のエネルギーは、復号器にて計算される。この変数を用いて、以下のように、(7)のパラメータαとβを計算することができる。
Figure 2008535015
変換行列
Figure 2008535015
は、以下によって示される。
Figure 2008535015
具体的には、ダウン・ミックス修正装置212は、芸術的ダウン・ミックスと修正パラメータ105を受信ビット・ストリームから抽出する機能性を含む。芸術的ダウン・ミックスは、(復号器によって使用される信号ブロックに対応する)信号ブロックに分割される。各信号ブロックについては、ダウン・ミックス修正装置212は、ビット・ストリームの受信データの表示を評価して、この信号ブロックについて第1および第2の部分には相対第2の補強データまたは絶対第2の補強データが供給されているか判断する。その後、ダウン・ミックス修正装置212は、表示データに応答して、絶対補強データまたは相対補強データとして第2の補強データの第1および第2の部分を適用する。
変換行列要素T12とT21が0に設定されたとき、複雑性は低いが高い性能を達成することができることが既にわかっている。以下においては、ダウン・ミックス修正装置212の一部の特定の実行例について、この制限と共に説明する。しかしながら、種々の実行例は、T12およびT21もしくはT12またはT21が0と異なる場合に容易に拡張することができることが理解されるであろう。
芸術的ダウン・ミックス信号向けに送信された第2の補強データの第2の部分の補強データがない場合、第1の装置210を図8に示すように実行することができる。時間ドメイン・ステレオ・ダウン・ミックス信号loとroが、まず、セグメント化されて、QMF変換によって周波数ドメインに変換され、その結果、芸術的ステレオ・ダウン・ミックスの時間/周波数タイルを表す信号LとRが得られる。次に、これらの信号は、変換行列Tを用いて変換され、その結果、信号T11LaとT12Raが得られる。
補強データは、時間ドメインおよび周波数ドメインもしくは時間ドメインまたは周波数ドメインにおいて生成しかつ適用することができることが理解されるであろう。したがって、コーディングされた時間ドメイン補強データ(Lenh、Renh)をビット・ストリーム内に含めることが可能である。しかしながら、一部の適用においては、時間ドメイン補強データではなく、コーディングされた周波数ドメイン補強データ含めることが有利である可能性がある。例えば、多くの符号器においては、補強データは、時間/周波数タイルに関しては周波数ドメイン内で生成され、かつ、時間ドメイン信号を生成するために、周波数ドメインから時間ドメインへの変換が符号器にて必要とされる。更に、当該の補強データを適用するために、復号器は、データを時間ドメインから周波数ドメインに変換する。したがって、ドメイン変換回数は、補強データを周波数ドメインに含めることによって少なくすることができる。
一部の実施形態においては、芸術的ダウン・ミックスと補強データとを生成するために、異なる時間から周波数への変換を用いることができる。例えば、芸術的ダウン・ミックスの符号化では、QMF変換を用いることができ、一方、補強データでは、MDCT変換が用いられる。この場合、補強データは、(MDCT)周波数ドメイン内に含めることができ、2つの周波数ドメイン間で直接行われる変換は、図9に示すように、ダウン・ミックス修正装置212によって行なうことができる。
この例においては、変換行列Tは、単に、方程式(2)の変換行列Tとすることができる。しかしながら、スイッチング時の人為的影響を低減するために、Tは、方程式(2)の変換行列Tに対応することができるが、漸進的な切り替えに向けて修正される。具体的には、行列Tは、方程式(30)によって求められるような因数αを含むことができ、その場合、絶対補強データまたは相対補強データに関する判断は、ビット・ストリームから検索される。この方法は、第2の補強データの第2の部分の補強層データが存在する信号ブロック/周波数帯域に使用され、その他の場合、図8の方法を用いることができる。
補強データ(Lenh、Renh)が時間ドメインにおいて提供された場合、図10に示すように、図9と類似の方法を用いることができる。しかしながら、この場合、周波数から周波数への変換の代わりに、時間から周波数への変換が用いられ、この時間から周波数への変換は、具体的には、芸術的ダウン・ミックスの符号化にQMF変換が用いられるときに時間からQMFへのドメイン変換によるものとすることができる。したがって、この例においては、補強データは、周波数ドメインにおいて適用される。
多くの実施形態においては、第1の装置210において1回の時間ドメインから周波数ドメインへの変換しか用いられない時間ドメイン補強データに関する復号器の実行を用いることができる。
具体的には、以下の差分補強データ・パラメータを使用することができる。
Figure 2008535015
ただし、方程式(27)によって示めされる行列Tは、正則行列である(したがって、その逆が存在する)ことを条件とする。ここで、方程式(1)を以下に変えることができる。
Figure 2008535015
図11は、方程式(34)と方程式(35)に基づく時間ドメイン補強データに関するダウン・ミックス修正装置212の効率的な実行が行われることを示す。明瞭さを期すために、行列TのT12とT21は、0に設定される。図10の実行例と比較すると、図11の実行例によって必要とされる時間からQMFへのドメイン変換は1回だけである。
したがって、上述したように、ダウン・ミックス修正装置212は、マルチ・チャンネル補強データに使用される空間的ダウン・ミックスに非常に酷似している信号202を生成する。これは、第2の装置220によって効果的に使用して2チャンネル・オーディオ信号を完全サラウンド・サウンド・マルチ・チャンネル信号に拡張することができる。更に、各信号ブロックについて最も妥当なタイプの補強データ(相対または絶対)を動的にかつ柔軟に選択することによって、実質的により効率的な符号化が達成され、かつ、質とデータ転送速度との比率が向上したマルチ・チャンネル符号化/復号化が達成される。
第2の装置220は、再構築空間的ダウン・ミックス202と関連パラメータ104とを5.1チャンネル出力信号203に復号化する従来の2チャンネルから5.1チャンネルへの復号器とすることができる。先述したように、パラメータ・データ104は、パラメータ・データ141、142、143、144を含む。第2の装置220は、符号器10内の第1の装置110の逆の処理を行う。第2の装置220は、アップ・ミキサ221を含み、アップ・ミキサ221は、ステレオ・ダウン・ミックスと関連パラメータ144とを3つのモノ・オーディオ信号L、R、Cに変換し、それぞれ、モノ・オーディオ信号L、R、Cの各々は、それぞれ、相関分離器222、225、228内で相関分離される。その後、混合行列223によってモノ・オーディオ信号、その相関分離オーディオ信号、関連パラメータ141が信号LfとLrに変換される。同様に、混合行列226によって、モノ・オーディオ信号R、その相関分離オーディオ信号、関連パラメータ142が、信号RfとRrに変換され、混合行列229によって、モノ・オーディオ信号C、その相関分離オーディオ信号、関連パラメータ143が信号CoとLFEに変換される。最後に、3つの対のセグメント化周波数ドメイン信号LfとLr、RfとRf、CoとLFEは、それぞれ、3つの対の出力信号lfとlr、rfとrr、coとlfeを取得するために、それぞれ、逆変換器224、227、230において時間ドメインに変換され、かつ、重複加算によって結合される。出力信号lfとlr、rfとrr、coとlfeは、復号化マルチ・チャンネル・オーディオ信号203を成す。
マルチ・チャンネル・オーディオ符号器10とマルチ・チャンネル・オーディオ復号器20は、デジタル・ハードウェアによって、または、デジタル信号プロセッサまたは汎用マイクロプロセッサによって実行されるソフトウェアによって実行することができる。
以上の説明では、明瞭さを期すために、異なる機能装置およびプロセッサを参照しながら本発明の種々の実施形態を説明したことが理解されるであろう。しかしながら、本発明から逸脱することなく、異なる機能装置またはプロセッサ間での機能性の任意の適切な配分を用いることができることが明らかであろう。例えば、別個のプロセッサまたは制御装置によって実行されるように示した機能性は、同じプロセッサまたは制御装置によって実行することができる。したがって、特定の機能装置への言及は、厳密な論理的または物理的構造または構成を示すのではなく、説明した機能性を実現する適切な手段への言及としてのみ見るべきである。
本発明は、ハードウェア、ソフトウェア、ファームウェアまたはこれらの任意の組み合わせを含む任意の適切な形態で実行することができる。本発明は、任意選択的に、1つまたはそれ以上のデータ・プロセッサおよびデジタル信号プロセッサもしくは1つまたはそれ以上のデータ・プロセッサまたはデジタル信号プロセッサ上で実行されるコンピュータ・ソフトウェアとして、少なくとも部分的に実行することができる。本発明の実施形態の要素および構成品は、任意の適切な方法で物理的、機能的、および論理的に実行することができる。実際、機能性は、単一の装置内で、複数の装置内で、または他の機能装置の一部として実行することができる。この点を踏まえると、本発明は、単一の装置内で実行することができるか、または、異なる装置およびプロセッサ間に物理的かつ機能的に配分することができる。
本発明を一部の実施形態に関連して説明してきたが、本明細書で定める特定の形態に限定されることを意図するものではない。むしろ、本発明の範囲は、添付の特許請求の範囲によってのみ限定される。更に、機能は特定の実施形態に関連して説明されているように思われる場合があるが、当業者は、説明した種々の実施形態の様々な特長は、本発明に従って組み合わせることができることを認識するであろう。特許請求の範囲においては、「を含む」という用語は、他の要素またはステップの存在を除外するものではない。
更に、個別に記載しているが、複数の手段、要素または方法のステップは、例えば、単一の装置またはプロセッサによって実行することができる。更に、個々の特長は、異なる請求項に含むことができるが、これらは、恐らくは有利に組み合わせることができ、異なる請求項に含めることは、種々の特長の組み合わせが実現不可能および不利もしくは実現不可能または不利であることを意味するものではない。また、1つのカテゴリーの請求項内に特長を含めることは、このカテゴリーへの限定を意味するのではなく、その特長が必要に応じて他の請求項のカテゴリーに等しく適用可能であることを示すものである。更に、請求項内での種々の特長の順番は、種々の特長を加工しなければならない何らかの特定の順番を意味するものではなく、特に、方法に関する請求項における個々のステップの順番は、この順番で個々のステップを実行しなければならないことを意味するものではない。むしろ、個々のステップは、任意の適切な順番で実行することができる。更に、単数での言及は、複数を排除するものではない。したがって、「1つの」、「第1の」、「第2の」などの言及は、複数を排除するものではない。請求項内の各種参照符号は、単に、明確にする例として提示されているものであり、いかなる点においても種々の請求項の範囲を限定すると解釈すべきではない。
本発明の一部の実施形態によるマルチ・チャンネル・オーディオ符号器のブロック図である。 本発明の一部の実施形態によるマルチ・チャンネル・オーディオ復号器のブロック図である。 本発明の一部の実施形態による送信システムのブロック図である。 本発明の一部の実施形態によるマルチ・チャンネル・オーディオ・プレーヤ/レコーダのブロック図である。 本発明の一部の実施形態によるマルチ・チャンネル・オーディオ符号器のブロック図である。 本発明の一部の実施形態による補強データ発生器のブロック図である。 本発明の一部の実施形態によるマルチ・チャンネル・オーディオ復号器のブロック図である。 マルチ・チャンネル・オーディオ復号器の諸要素のブロック図である。 本発明の一部の実施形態によるマルチ・チャンネル・オーディオ復号器の諸要素のブロック図である。 本発明の一部の実施形態によるマルチ・チャンネル・オーディオ復号器の諸要素のブロック図である。 本発明の一部の実施形態によるマルチ・チャンネル・オーディオ復号器の諸要素のブロック図である。
符号の説明
10 マルチ・チャンネル・オーディオ符号器
20 マルチ・チャンネル・オーディオ復号器
30 送信チャンネル
40 送信器
50 受信器
60 マルチ・チャンネル・オーディオプレーヤ/レコーダ
70 送信システム
101 マルチ・チャンネル・オーディオ信号
102 ダウン・ミックス・オーディオ信号
103 代替ダウン・ミックス信号
104 第1の関連パラメータ・データ
105 第2の関連パラメータ・データ
110 第1の符号化装置
112〜114 セグメント化・変換装置
115〜118 ダウン・ミキサ
120 第2の符号化装置
121 セグメント化装置
122 変換器
123 発生器
124 セレクター
126 周波数ドメイン信号
127 セグメント化オーディオ信号
128 制御信号
141〜144 パラメータ・データ
145 信号ブロック・プロセッサ
146 絶対補強データ・プロセッサ
147 相対補強データ・プロセッサ
148 第1の信号エネルギー・プロセッサ
149 第2の信号エネルギー・プロセッサ
150 選択プロセッサ
151 補強データ・プロセッサ
152 符号化プロセッサ
202 空間的ダウン・ミックス
203 マルチ・チャンネル・オーディオ信号
210 第1の装置
211 セグメント化・変換装置
212 ダウン・ミックス修正装置
217 制御信号
220 第2の装置
221 アップ・ミキサ
222、225、228 相関分離器
223、226、229 混合行列
224、227、230 逆変換器

Claims (31)

  1. Nチャンネル・オーディオ信号を符号化するマルチ・チャンネル・オーディオ符号器であって、
    前記Nチャンネル・オーディオ信号用第1のMチャンネル信号を生成する手段であって、Mは、Nより小さい前記手段と、
    前記Nチャンネル・オーディオ信号に対して、前記第1のMチャンネル信号用第1の補強データを生成する手段と、
    前記Nチャンネル・オーディオ信号用第2のMチャンネル信号を生成する手段と、
    前記第1のMチャンネル信号に対して、前記第2のMチャンネル信号用第2の補強データを生成する補強手段と、
    前記第2のMチャンネル信号と、前記第1の補強データと、前記第2の補強データとを含む符号化出力信号を生成する手段と
    を含み、
    前記補強手段が、前記第2のMチャンネル信号に対して、絶対補強データとしての前記第2の補強データの生成、または、相対補強データとして前記第2の補強データの生成とから動的に選択するように構成されるマルチ・チャンネル・オーディオ符号器。
  2. 前記補強手段が、前記Nチャンネル信号の特性に応答して、前記絶対補強データと前記相対補強データとから選択するように構成される、請求項1に記載のマルチ・チャンネル・オーディオ符号器。
  3. 前記補強手段が、前記絶対補強データと前記相対補強データの相対特性に応答して、前記絶対補強データと前記相対補強データとから選択するように構成される、請求項1に記載のマルチ・チャンネル・オーディオ符号器。
  4. 前記相対特性が、前記相対補強データの信号エネルギーに対する前記絶対補強データの信号エネルギーである、請求項1に記載のマルチ・チャンネル・オーディオ符号器。
  5. 前記補強手段が、前記第2のMチャンネル信号を信号ブロックに分割し、かつ、各信号ブロックについて前記絶対補強データと前記相対補強データとから個々に選択するように構成される、請求項1に記載のマルチ・チャンネル・オーディオ符号器。
  6. 前記補強手段が、信号ブロックに関連した特性にのみ基づいて、該信号ブロックについて、前記絶対補強データと前記相対補強データとから選択するように構成される、請求項5に記載のマルチ・チャンネル・オーディオ符号器。
  7. 前記補強手段が、絶対補強データとしての前記補強データの生成と相対補強データとしての前記補強データの生成との切り替えの切り替え時間間隔中に、前記絶対補強データと前記相対補強データの組み合わせとして前記補強データを生成するように構成される、請求項1に記載のマルチ・チャンネル・オーディオ符号器。
  8. 前記組み合わせが、前記絶対補強データと前記相対補強データとの間の補間を含む、請求項7に記載のマルチ・チャンネル・オーディオ符号器。
  9. 前記符号化出力信号を生成する前記手段が、相対補強データ使用されるのかそれとも絶対補強データが使用されるのかを示すデータを含むように構成される、請求項1に記載のマルチ・チャンネル・オーディオ符号器。
  10. 前記第2の補強データが、補強データの第1の部分と補強データの第2の部分とを含み、前記第2の部分が、前記第1の部分より質の高い前記第1のMチャンネル信号表現を行う、請求項1に記載のマルチ・チャンネル・オーディオ符号器。
  11. 前記補強手段が、絶対補強データとして、または相対補強データとして前記第2の部分の生成することのみを動的に選択するように構成される、請求項10に記載のマルチ・チャンネル・オーディオ符号器。
  12. 前記補強手段が、前記第1の部分の補強データを前記第1のMチャンネル信号に適用することによって生成された基準信号に対して、前記第2の部分の相対データを生成するように構成される、請求項10に記載のマルチ・チャンネル・オーディオ符号器。
  13. Nチャンネル・オーディオ信号を復号化するマルチ・チャンネル・オーディオ復号器であって、
    前記Nチャンネル・オーディオ信号用第1のMチャンネル信号であって、Mが、Nより小さい前記信号と、
    前記第1のMチャンネル信号と異なる第2のMチャンネル信号に対するマルチ・チャンネル拡張用第1の補強データと、
    前記第1のMチャンネル信号に対する絶対補強データと相対補強データとを含む、前記第2のMチャンネル信号に対する前記第1のMチャンネル信号用第2の補強データと、
    信号ブロックに関する前記第2の補強データが絶対補強データであるのかそれとも相対補強データであるのかを示す表示データと
    を含む符号化オーディオ信号を受信する手段と、
    前記第1のMチャンネル信号と前記第2の補強データとに応答してMチャンネル・マルチ・チャンネル拡張信号を生成する生成手段と、
    前記Mチャンネル・マルチ・チャンネル拡張信号と、前記第1の補強データとに応答してNチャンネル復号化信号を生成する手段と
    を含み、
    前記生成手段が、前記表示データに応答して、絶対補強データとしての前記第2の補強データの適用、または、相対補強データとしての前記第2の補強データの適用から選択するように構成されるマルチ・チャンネル・オーディオ復号器。
  14. 前記生成手段が、時間ドメインにおいて前記第2の補強データを前記第1のMチャンネル信号に適用するように構成される、請求項13に記載のマルチ・チャンネル・オーディオ復号器。
  15. 前記生成手段が、周波数ドメインにおいて前記第2の補強データを前記第1のMチャンネル信号に適用するように構成される、請求項13に記載のマルチ・チャンネル・オーディオ復号器。
  16. 前記第2の補強データが、補強データの第1の部分と補強データの第2の部分とを含み、前記第2の部分が、前記第1の部分より質の高い前記第1のMチャンネル信号表現を行う、請求項13に記載のマルチ・チャンネル・オーディオ復号器。
  17. 前記生成手段が、絶対補強データとしての前記第2の部分の第2の補強データの適用、または、相対補強データとしての前記第2の部分の第2の補強データの適用からのみ選択するように構成される、請求項13に記載のマルチ・チャンネル・オーディオ復号器。
  18. 前記生成手段が、前記第1の部分の補強データを前記第1のMチャンネル信号に適用することによって生成された信号に前記第2の部分の相対補強データを適用することによって前記Mチャンネル・マルチ・チャンネル拡張部を生成するように構成される、請求項13に記載のマルチ・チャンネル・オーディオ復号器。
  19. Nチャンネル・オーディオ信号を符号化する方法であって、
    前記Nチャンネル・オーディオ信号用第1のMチャンネル信号を生成するステップであって、MがNより小さい前記ステップと、
    前記Nチャンネル・オーディオ信号に対して前記第1のMチャンネル信号用第1の補強データを生成するステップと、
    前記Nチャンネル・オーディオ信号用第2のMチャンネル信号を生成するステップと、
    前記第1のMチャンネル信号に対して前記第2のMチャンネル信号用第2の補強データを生成するステップと、
    前記第2のMチャンネル信号と、前記第1の補強データと、前記第2の補強データとを含む符号化出力信号を生成するステップと
    を含み、
    前記第2の補強データの生成ステップが、前記第2のMチャンネル信号に対して、絶対補強データとしての前記第2の補強データの生成、または、相対補強データとしての前記第2の補強データの生成から動的に選択するステップを含む方法。
  20. Nチャンネル・オーディオ信号を復号化する方法であって、
    前記Nチャンネル・オーディオ信号用第1のMチャンネル信号であって、MがNより小さい前記信号と、
    前記第1のMチャンネル信号と異なる第2のMチャンネル信号に対するマルチ・チャンネル拡張用第1の補強データと、
    前記第1のMチャンネル信号に対する絶対補強データと相対補強データとを含む、前記第2のMチャンネル信号に対する前記第1のMチャンネル信号用第2の補強データと、
    信号ブロックに関する前記第2の補強データが絶対補強データであるのかそれとも相対補強データであるのかを示す表示データと
    を含む符号化オーディオ信号を受信するステップと、
    前記第1のMチャンネル信号と前記第2の補強データとに応答してMチャンネル・マルチ・チャンネル拡張信号を生成するステップと、
    前記Mチャンネル・マルチ・チャンネル拡張信号と、前記第1の補強データとに応答してNチャンネル復号化信号を生成するステップと
    を含み、
    前記Mチャンネル・マルチ・チャンネル拡張信号の生成ステップが、前記表示データに応答して、絶対補強データとしての前記第2の補強データの適用、または、相対補強データとしての前記第2の補強データの適用から選択するステップを含む方法。
  21. Nチャンネル・オーディオ信号用符号化マルチ・チャンネル・オーディオ信号であって、
    前記Nチャンネル・オーディオ信号用Mチャンネル信号データであって、MがNより小さい前記信号データと、
    前記第1のMチャンネル信号と異なる第2のMチャンネル信号に対するマルチ・チャンネル拡張用第1の補強データと、
    前記第1のMチャンネル信号に対する絶対補強データと相対補強データとを含む、前記第2のMチャンネル信号に対する前記第1のMチャンネル信号用第2の補強データと、
    信号ブロックに関する前記第2の補強データが絶対補強データであるのかそれとも相対補強データであるのかを示す表示データと
    を含む符号化マルチ・チャンネル・オーディオ信号。
  22. 請求項21に記載の信号が格納された記憶媒体。
  23. 請求項1に記載のマルチ・チャンネル・オーディオ符号器を含む、符号化マルチ・チャンネル・オーディオ信号を送信する送信器。
  24. 請求項13に記載のマルチ・チャンネル・オーディオ復号器を含む、マルチ・チャンネル・オーディオ信号を受信する受信器。
  25. 符号化マルチ・チャンネル・オーディオ信号を送信チャンネルを介して受信器に送信する送信器を含む送信システムであって、請求項1に記載のマルチ・チャンネル・オーディオ符号器と、請求項13に記載のマルチ・チャンネル・オーディオ復号器を含む前記受信器を含む送信システム。
  26. 符号化マルチ・チャンネル・オーディオ信号を送信する方法であって、前記方法が、Nチャンネル・オーディオ信号を符号化するステップを含み、
    前記符号化するステップが、
    前記Nチャンネル・オーディオ信号用第1のMチャンネル信号を生成するステップであって、MがNより小さい前記ステップと、
    前記Nチャンネル・オーディオ信号に対して前記第1のMチャンネル信号用第1の補強データを生成するステップと、
    前記Nチャンネル・オーディオ信号用第2のMチャンネル信号を生成するステップと、
    前記第1のMチャンネル信号に対して前記第2のMチャンネル信号用第2の補強データを生成するステップと、
    前記第2のMチャンネル信号と、前記第1の補強データと、前記第2の補強データとを含む、符号化出力信号を生成するステップと
    を含み、
    前記第2の補強データの生成ステップが、前記第2のMチャンネル信号に対して、絶対補強データとしての前記第2の補強データの生成、または、相対補強データとしての前記第2の補強データの生成から動的に選択するステップを含む方法。
  27. 符号化マルチ・チャンネル・オーディオ信号を受信する方法であって、前記方法が、前記符号化マルチ・チャンネル・オーディオ信号を復号化するステップを含み、
    前記復号化するステップが、
    前記Nチャンネル・オーディオ信号用第1のMチャンネル信号であって、MがNより小さい前記信号と、
    前記第1のMチャンネル信号と異なる第2のMチャンネル信号に対するマルチ・チャンネル拡張用第1の補強データと、
    前記第1のMチャンネル信号に対する絶対補強データと相対補強データとを含む、前記第2のMチャンネル信号に対する前記第1のMチャンネル信号用第2の補強データと、
    信号ブロックに関する前記第2の補強データが絶対補強データであるのかそれとも相対補強データであるのかを示す表示データと
    を含む前記符号化マルチ・チャンネル・オーディオ信号を受信するステップと、
    前記第1のMチャンネル信号と前記第2の補強データとに応答してMチャンネル・マルチ・チャンネル拡張信号を生成する生成ステップと、
    前記Mチャンネル・マルチ・チャンネル拡張信号と、前記第1の補強データとに応答してNチャンネル復号化信号を生成するステップと
    を含み、
    前記Mチャンネル・マルチ・チャンネル拡張信号の生成ステップが、前記表示データに応答して、絶対補強データとしての前記第2の補強データの適用、または、相対補強データとしての前記第2の補強データの適用から選択するステップを含む方法。
  28. オーディオ信号を送受信する方法であって、
    前記方法が、Nチャンネル・オーディオ信号を符号化するステップを備え、
    前記符号化するステップが、
    前記Nチャンネル・オーディオ信号用第1のMチャンネル信号を生成するステップであって、MがNより小さい前記ステップと、
    前記Nチャンネル・オーディオ信号に対して前記第1のMチャンネル信号用第1の補強データを生成するステップと、
    前記Nチャンネル・オーディオ信号用第2のMチャンネル信号を生成するステップと、
    前記第1のMチャンネル信号に対して前記第2のMチャンネル信号用第2の補強データを生成するステップであって、前記第2のMチャンネル信号に対して、絶対補強データとしての前記第2の補強データの生成、または、相対補強データとしての前記第2の補強データの生成から動的に選択するステップを含む前記ステップと、
    前記第2のMチャンネル信号と、前記第1の補強データと、前記第2の補強データとを含む符号化出力信号を生成するステップと;
    送信器から受信器に前記符号化出力信号を送信するステップと;
    前記受信器にて前記符号化出力信号を受信するステップと;
    前記第2のMチャンネル信号と前記第2の補強データとに応答してMチャンネル・マルチ・チャンネル拡張信号を生成するステップであって、絶対補強データとしての前記第2の補強データの適用、または、相対補強データとしての前記第2の補強データの適用から選択するステップを含む前記ステップと、
    前記Mチャンネル・マルチ・チャンネル拡張信号と前記第1の補強データに応答してNチャンネル復号化信号を生成するステップと
    を含む、方法。
  29. プロセッサに、請求項19、請求項20、請求項26、請求項27、および請求項28の何れかに記載の方法のステップを実行させるように動作するコンピュータプログラム。
  30. 請求項1に記載のマルチ・チャンネル・オーディオ符号器を含むマルチ・チャンネルオーディオレコーダ。
  31. 請求項13に記載のマルチ・チャンネル・オーディオ復号器を含むマルチ・チャンネルオーディオレコーダ。
JP2008503634A 2005-03-30 2006-03-16 オーディオ符号化および復号化 Active JP5106383B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
EP05102515.3 2005-03-30
EP05102515 2005-03-30
EP05103085.6 2005-04-18
EP05103085 2005-04-18
EP06100245 2006-01-11
EP06100245.7 2006-01-11
PCT/IB2006/050826 WO2006103586A1 (en) 2005-03-30 2006-03-16 Audio encoding and decoding

Publications (3)

Publication Number Publication Date
JP2008535015A true JP2008535015A (ja) 2008-08-28
JP2008535015A5 JP2008535015A5 (ja) 2009-05-07
JP5106383B2 JP5106383B2 (ja) 2012-12-26

Family

ID=36607294

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008503634A Active JP5106383B2 (ja) 2005-03-30 2006-03-16 オーディオ符号化および復号化

Country Status (11)

Country Link
US (1) US7840411B2 (ja)
EP (1) EP1866913B1 (ja)
JP (1) JP5106383B2 (ja)
KR (2) KR101346120B1 (ja)
CN (2) CN101151660B (ja)
AT (1) ATE406651T1 (ja)
BR (1) BRPI0608756B1 (ja)
DE (1) DE602006002501D1 (ja)
ES (1) ES2313646T3 (ja)
MX (1) MX2007011995A (ja)
WO (1) WO2006103586A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016035567A1 (ja) * 2014-09-01 2016-03-10 ソニー株式会社 音声処理装置
JP2017501440A (ja) * 2013-11-28 2017-01-12 ドルビー・インターナショナル・アーベー 特異値分解を用いる高次Ambisonics符号化と復号の方法と装置

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006035705A1 (ja) * 2004-09-28 2006-04-06 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法
CN101167124B (zh) * 2005-04-28 2011-09-21 松下电器产业株式会社 语音编码装置和语音编码方法
RU2007139784A (ru) * 2005-04-28 2009-05-10 Мацусита Электрик Индастриал Ко., Лтд. (Jp) Устройство кодирования звука и способ кодирования звука
US7461106B2 (en) * 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
CN101589623B (zh) * 2006-12-12 2013-03-13 弗劳恩霍夫应用研究促进协会 对表示时域数据流的数据段进行编码和解码的编码器、解码器以及方法
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US8639519B2 (en) * 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
CN101809656B (zh) * 2008-07-29 2013-03-13 松下电器产业株式会社 音响编码装置、音响解码装置、音响编码解码装置及会议***
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8175888B2 (en) * 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8140342B2 (en) * 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
EP2578000A1 (en) * 2010-06-02 2013-04-10 Koninklijke Philips Electronics N.V. System and method for sound processing
DK2691951T3 (en) 2011-03-28 2016-11-14 Dolby Laboratories Licensing Corp TRANSFORMATION WITH REDUCED COMPLEXITY OF AN Low-Frequency
CN102802112B (zh) * 2011-05-24 2014-08-13 鸿富锦精密工业(深圳)有限公司 具有音频文件格式转换功能的电子装置
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP2830050A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhanced spatial audio object coding
EP2830047A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2830333A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
EP2830052A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
CN103413553B (zh) 2013-08-20 2016-03-09 腾讯科技(深圳)有限公司 音频编码方法、音频解码方法、编码端、解码端和***
US9067135B2 (en) * 2013-10-07 2015-06-30 Voyetra Turtle Beach, Inc. Method and system for dynamic control of game audio based on audio analysis
CN105206278A (zh) * 2014-06-23 2015-12-30 张军 一种基于流水线的三维音频编码加速方法
BR112021025420A2 (pt) * 2019-07-08 2022-02-01 Voiceage Corp Método e sistema para codificar metadados em fluxos de áudio e para adaptação de taxa de bits intraobjeto e interobjeto flexível

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005101371A1 (en) * 2004-04-16 2005-10-27 Coding Technologies Ab Method for representing multi-channel audio signals
WO2006008683A1 (en) * 2004-07-14 2006-01-26 Koninklijke Philips Electronics N.V. Method, device, encoder apparatus, decoder apparatus and audio system
WO2006026452A1 (en) * 2004-08-25 2006-03-09 Dolby Laboratories Licensing Corporation Multichannel decorrelation in spatial audio coding
WO2006048204A1 (en) * 2004-11-02 2006-05-11 Coding Technologies Ab Multi parametrisation based multi-channel reconstruction
WO2006060280A2 (en) * 2004-11-30 2006-06-08 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
WO2006084916A2 (en) * 2005-02-14 2006-08-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Parametric joint-coding of audio sources
WO2006089570A1 (en) * 2005-02-22 2006-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Near-transparent or transparent multi-channel encoder/decoder scheme

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
SG54379A1 (en) * 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
US5946352A (en) * 1997-05-02 1999-08-31 Texas Instruments Incorporated Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain
US6122619A (en) * 1998-06-17 2000-09-19 Lsi Logic Corporation Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
SE519985C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
CN1705980A (zh) * 2002-02-18 2005-12-07 皇家飞利浦电子股份有限公司 参数音频编码
BRPI0308691B1 (pt) * 2002-04-10 2018-06-19 Koninklijke Philips N.V. “Métodos para codificar um sinal de canal múltiplo e para decodificar informação de sinal de canal múltiplo, e arranjos para codificar e decodificar um sinal de canal múltiplo”
JP4322207B2 (ja) * 2002-07-12 2009-08-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化方法
KR100528325B1 (ko) * 2002-12-18 2005-11-15 삼성전자주식회사 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005101371A1 (en) * 2004-04-16 2005-10-27 Coding Technologies Ab Method for representing multi-channel audio signals
WO2006008683A1 (en) * 2004-07-14 2006-01-26 Koninklijke Philips Electronics N.V. Method, device, encoder apparatus, decoder apparatus and audio system
WO2006026452A1 (en) * 2004-08-25 2006-03-09 Dolby Laboratories Licensing Corporation Multichannel decorrelation in spatial audio coding
WO2006048204A1 (en) * 2004-11-02 2006-05-11 Coding Technologies Ab Multi parametrisation based multi-channel reconstruction
WO2006060280A2 (en) * 2004-11-30 2006-06-08 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
WO2006084916A2 (en) * 2005-02-14 2006-08-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Parametric joint-coding of audio sources
WO2006089570A1 (en) * 2005-02-22 2006-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Near-transparent or transparent multi-channel encoder/decoder scheme

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017501440A (ja) * 2013-11-28 2017-01-12 ドルビー・インターナショナル・アーベー 特異値分解を用いる高次Ambisonics符号化と復号の方法と装置
US10244339B2 (en) 2013-11-28 2019-03-26 Dolby International Ab Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition
US10602293B2 (en) 2013-11-28 2020-03-24 Dolby International Ab Methods and apparatus for higher order ambisonics decoding based on vectors describing spherical harmonics
WO2016035567A1 (ja) * 2014-09-01 2016-03-10 ソニー株式会社 音声処理装置
JPWO2016035567A1 (ja) * 2014-09-01 2017-06-08 ソニーセミコンダクタソリューションズ株式会社 音声処理装置
US10547960B2 (en) 2014-09-01 2020-01-28 Sony Semiconductor Solutions Corporation Audio processing apparatus

Also Published As

Publication number Publication date
ATE406651T1 (de) 2008-09-15
CN101151658B (zh) 2011-07-06
ES2313646T3 (es) 2009-03-01
WO2006103586A1 (en) 2006-10-05
CN101151660A (zh) 2008-03-26
KR20070116174A (ko) 2007-12-06
KR20130079627A (ko) 2013-07-10
KR101346120B1 (ko) 2014-01-02
US20100153118A1 (en) 2010-06-17
BRPI0608756B1 (pt) 2019-06-04
EP1866913B1 (en) 2008-08-27
JP5106383B2 (ja) 2012-12-26
BRPI0608756A2 (pt) 2011-03-15
DE602006002501D1 (de) 2008-10-09
US7840411B2 (en) 2010-11-23
CN101151658A (zh) 2008-03-26
CN101151660B (zh) 2011-10-19
MX2007011995A (es) 2007-12-07
EP1866913A1 (en) 2007-12-19

Similar Documents

Publication Publication Date Title
JP5106383B2 (ja) オーディオ符号化および復号化
RU2411594C2 (ru) Кодирование и декодирование аудио
JP5311597B2 (ja) マルチチャンネル・エンコーダ
US9865270B2 (en) Audio encoding and decoding
US8433583B2 (en) Audio decoding
JP4616349B2 (ja) ステレオ互換性のあるマルチチャネルオーディオ符号化
JP5455647B2 (ja) オーディオデコーダ
JP5179881B2 (ja) オーディオソースのパラメトリックジョイント符号化
US9966080B2 (en) Audio object encoding and decoding
JP4772279B2 (ja) オーディオ信号のマルチチャネル/キュー符号化/復号化
TWI455614B (zh) 方法、器件、編碼器裝置、解碼器裝置及聲訊系統
CN109448741B (zh) 一种3d音频编码、解码方法及装置
JP2009523259A (ja) マルチチャンネル信号の復号化及び符号化方法、記録媒体及びシステム
JP2008535014A (ja) スケーラブルマルチチャネル音声符号化方法
JPWO2006022190A1 (ja) オーディオエンコーダ

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090313

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090313

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110920

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111219

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120319

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120904

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121002

R150 Certificate of patent or registration of utility model

Ref document number: 5106383

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151012

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250