JP5249408B2

JP5249408B2 - オーディオ信号の処理方法及び装置

Info

Publication number: JP5249408B2
Application number: JP2011504929A
Authority: JP
Inventors: オー，ヒェン−オ; ウォンジュン，ヤン
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 2008-04-16
Filing date: 2009-04-16
Publication date: 2013-07-31
Anticipated expiration: 2029-04-16
Also published as: WO2009128663A2; CN102007532B; JP2011518353A; WO2009128663A3; CN102007532A; US20090262957A1; US8175295B2; EP2111060A1; EP2111060B1

Description

本発明は、オーディオ信号の処理方法及び装置に係り、特に、デジタル媒体、放送信号などから受信されたオーディオ信号を処理できるオーディオ信号の処理方法及び装置に関するものである。

複数個のオブジェクトを含むオーディオ信号を、モノまたはステレオ信号にダウンミキシングしてダウンミックス信号を生成する過程において、オブジェクトからパラメータが抽出される。これらのパラメータは、ダウンミキシングされた信号をデコーディングする過程で用いられる。更に、オブジェクトの位置（position）及びゲイン（gain）は、パラメータの他に、ユーザーの選択によってコントロールすることもできる。

ダウンミックス信号に含まれているオブジェクトは、ユーザーの選択によって調節しなければならない。しかし、ユーザーがオブジェクトを制御する場合、直接すべてのオブジェクト信号を制御しなければならないという不便さがあり、専門家によって制御される場合に比べて、オーディオ信号を最適の状態に再現することは困難である。

従って、本発明は、オーディオ信号を処理するための装置とその方法に関するものであり、関連技術における制限と不利点による１つ以上の問題を実質的に取り除く。

本発明の目的は、既に設定されたプリセット情報及びプリセットメタデータを用いてオブジェクトのレベルと位置を制御することができるオーディオ信号処理方法及び装置を提供することにある。

本発明の他の目的は、音源の特性によってプリセット情報及びプリセットメタデータをダウンミックス信号の全データ領域にまたはダウンミックス信号の一つのデータ領域に適用することによって、ダウンミックス信号に含まれたオブジェクトを調節できるオーディオ信号処理方法及び装置を提供することにある。

本発明のさらに他の目的は、ユーザーの選択に基づいてディスプレイ部に表示されたプリセットメタデータのうち一つを選択し、これに対応するプリセット情報を用いてオブジェクトのレベル及び位置をコントロールすることができるオーディオ信号処理方法及び装置を提供することにある。

本発明のさらに他の目的は、プリセット情報が適用されて調節されたオブジェクト及び選択されたプリセットメタデータをディスプレイ部に表示することによって、ユーザーから選択信号を受信することができるオーディオ信号処理方法及び装置を提供することにある。

本発明は、下記の効果及び利点を提供する。

第一に、それぞれのオブジェクトに対するユーザーの設定なしに、既に設定された複数個のプリセット情報のうちの一つを複数個のプリセットメタデータを用いて選択することによって容易にオブジェクトの出力チャネルのレベルを調節することができる。

第二に、音源の特性によってプリセット情報をデータ領域単位に個別に選択して適用したり、ダウンミックス信号の全データ領域に同一のプリセット情報を選択して適用したりすることによって、オーディオ信号を効率的に復元することができる。

第三に、プリセット情報が適用されて調節されたオブジェクト及び選択されたプリセットメタデータをディスプレイ部から確認することによって、より適切なプリセット情報を選択してオブジェクトの出力チャネルのレベルまたは位置を調節することができる。

本発明の更なる理解を提供するために添付され、組み込まれ、及び本明細書の一部を構成する図面は、本発明の実施例を説明し、明細書と共に、本発明の原理を説明する。

本発明の一実施例による、ダウンミックス信号に含まれたオブジェクトに適用されるプリセットモードの概念図である。本発明の一実施例による、プリセット属性情報に基づいてプリセット情報を適用することによって、ダウンミックス信号に含まれたオブジェクトを調節する概念図である。本発明の一実施例による、プリセット属性情報に基づいてプリセット情報を適用することによって、ダウンミックス信号に含まれたオブジェクトを調節する概念図である。本発明の一実施例によるオーディオ信号処理装置を示す図である。本発明の一実施例によってプリセット情報がレンダリング部に適用される方法を示すブロック図である。本発明の一実施例によってプリセット情報がレンダリング部に適用される方法を示すブロック図である。本発明の他の実施例による変動プリセット情報受信部及び固定プリセット情報受信部の概略的な構成を示すブロック図である。本発明の他の実施例によるオーディオ信号処理装置を示す図である。本発明の他の実施例によるオーディオ信号処理方法においてプリセット情報と関連したシンタックス（syntax）を様々な方法で表現したものである。本発明の他の実施例によるオーディオ信号処理方法においてプリセット情報と関連したシンタックス（syntax）を様々な方法で表現したものである。本発明の他の実施例によるオーディオ信号処理方法においてプリセット情報と関連したシンタックス（syntax）を様々な方法で表現したものである。本発明の他の実施例によるオーディオ信号処理方法においてプリセット情報と関連したシンタックス（syntax）を様々な方法で表現したものである。本発明の他の実施例によるオーディオ信号処理方法においてプリセット情報と関連したシンタックス（syntax）を様々な方法で表現したものである。本発明のさらに他の実施例によるオーディオ信号処理装置を示す図である。本発明のさらに他の実施例によるオーディオ信号処理装置のディスプレイ部の一例を示す図である。本発明のさらに他の実施例によってプリセット情報が適用されたオブジェクトを表示する一つ以上の図形要素を示す図である。本発明のさらに他の実施例による変動プリセット情報受信部と固定プリセットモード受信部が具現された製品の概略的な構成を示す図である。本発明のさらに他の実施例による変動プリセットモード受信部及び固定プリセットモード受信部が具現された製品間の関係を示す図である。本発明のさらに他の実施例による変動プリセットモード受信部及び固定プリセットモード受信部が具現された製品間の関係を示す図である。本発明のさらに他の実施例による変動プリセットモード受信部及び固定プリセットモード受信部が具現された放送信号デコーディング装置の概略的な構成を示す図である。

本発明の更なる特徴及び利点は、以下の詳細な説明で記述され、部分的には、詳細な説明から明らかになるか、発明の実行から理解されるであろう。発明の目的及びその他の利点は、添付図面の他に、明細書及び請求項に特に記載された構成によって実現または獲得されるであろう。

上記目的を達成するために、本発明によるオーディオ信号処理方法は、一つ以上のオブジェクトを含むダウンミックス信号、前記ダウンミックス信号をレンダリングするためにプリセット情報及び前記プリセット情報の属性を表すプリセット属性情報を受信する段階と、前記プリセット属性情報に基づいて前記プリセット情報が構成情報領域に含まれた場合、前記プリセット情報を前記ダウンミックス信号の全データ領域に適用することによって前記ダウンミックス信号をレンダリングする段階と、前記プリセット属性情報に基づいてプリセット情報がデータ領域に含まれた場合、前記プリセット情報を前記ダウンミックス信号の対応する一つのデータ領域に適用することによって前記ダウンミックス信号をレンダリングする段階と、を含み、前記プリセット情報は、前記プリセット情報の個数を表すプリセット個数情報及び前記レンダリングされたダウンミックス信号の出力チャネルの個数を表す出力チャネル情報に基づいて獲得される。

前記プリセット情報は、前記オブジェクトの個数及び前記出力チャネルの個数に基づくプリセットマトリクスで構成することができる。

前記プリセット情報は、モノプリセット情報、ステレオプリセット情報及びマルチチャネルプリセット情報を含むことができる。

前記ダウンミックス信号をレンダリングする段階は、前記プリセット情報を用いて前記オブジェクトの出力レベルを調節する段階をさらに含むことができる。

前記プリセット属性情報は、前記プリセット情報が変動であるかまたは固定であるかを表すことができる。

前記プリセット情報は、前記構成情報領域の拡張領域または前記データ領域の拡張領域に含まれることができる。

また、上記目的を達成するために、本発明によるオーディオ信号処理装置は、一つ以上のオブジェクトを含むダウンミックス信号、前記ダウンミックス信号をレンダリングするためにプリセット情報及び前記プリセット情報の属性を表すプリセット属性情報を受信する信号受信部と、前記プリセット属性情報に基づいて前記プリセット情報が構成情報領域に含まれた場合、前記ダウンミックス信号の全データ領域に対応するプリセット情報及び前記プリセット情報に対応するプリセットメタデータを受信する固定プリセットモード受信部と、前記プリセット属性情報に基づいて前記プリセット情報がデータ領域に含まれた場合、前記ダウンミックス信号の一つのデータ領域に対応するプリセット情報及び前記プリセット情報に対応するプリセットメタデータを受信する変動プリセットモード受信部と、前記プリセット情報を前記ダウンミックス信号の全データ領域または一つのデータ領域に適用して前記ダウンミックス信号をレンダリングするレンダリング部と、を含み、前記プリセットメタデータは、前記プリセットメタデータの長さを表すプリセットメタデータ長情報に基づいて獲得し、前記プリセット情報は、前記プリセット情報の個数を表すプリセット個数情報及び前記レンダリングされたダウンミックス信号の出力チャネルの個数を表す出力チャネル情報に基づいて獲得することができる。

当然のことであるが、前記の一般的な記載、及び以下の詳細な記載は、典型的なもの、及び説明のためのものであり、請求項に記載される本発明の更なる説明を提供することを目的としている。

以下、添付の図面を参照しつつ、本発明の好適な実施例を詳細に説明する。ただし、本明細書及び請求の範囲に使われた用語や単語は、通常的または辞書的な意味に限定して解釈されるものではなく、発明者は自身の発明を最善の方法で説明するために用語の概念を適切に定義することができるという原則に立って、本発明の技術的思想に符合する意味と概念として解釈しなければならない。したがって、本明細書に記載された実施例と図面に示された構成は、本発明の最も好適な実施例に過ぎず、本発明の技術的思想を全部示すものではないため、本出願時点においてそれらに代替可能な様々な均等物と変形例が存在することができる。

特に、本明細書で情報（information）は、値（values）、パラメータ（parameters）、係数（coefficients）、成分（elements）などを総称する用語であり、その意味は場合によって適宜解釈すればいい。したがって、本発明はこれに限定されない。

図１は、本発明の実施例による、ダウンミックス信号に含まれたオブジェクトに適用されるプリセットモードの概念図である。オブジェクトを調節するために既に設定された情報の集合を本明細書ではプリセットモード（preset mode）と称する。プリセットモードは、オーディオ信号の特性または聴取環境によってユーザーが選択できる様々なモードを表すことができ、一つ以上を含むことができる。また、プリセットモードは、オブジェクトを調節するために適用されるプリセット情報（preset information）と、プリセット情報の属性などを表現するためのメタデータであるプリセットメタデータ（preset metadata）とを含む。プリセットメタデータは、テキストで表示することができ、プリセット情報の属性（例えば、コンサートホールモード、カラオケモード、ニュースモード等）を表す他、プリセット情報の作成者、作成日、プリセット情報の適用されるオブジェクト名などをはじめとする、プリセット情報を表現するための関連情報を含むことができる。一方、プリセット情報は、実質的にオブジェクトに適用されるデータで、プリセットメタデータと互いに対応し、様々な形態、例えば、マトリクス形態で表現することができる。

図１を参照すると、プリセットモード１は、音楽信号をコンサートホールで聞くような音場感を提供するコンサートホールモード（concert hall mode）とし、プリセットモード２は、オーディオ信号からボーカル（vocal）オブジェクトのレベルを減少させたカラオケモード（karaoke mode）とし、プリセットモードｎは、音声オブジェクトのレベルを増加させたニュースモード（news mode）とすることができる。また、プリセットモードは、プリセットメタデータ及びプリセット情報を含む。もし、ユーザーによりプリセットモード２が選択された場合、プリセットメタデータ２のカラオケモード（karaoke mode）が表示され、このプリセットメタデータ２と関連したプリセット情報２がオブジェクトに適用されてレベルを調節することができる。

この場合、プリセット情報は、モノプリセット情報（mono preset information）、ステレオプリセット情報（stereo preset information）及びマルチチャネルプリセット情報（multi-channel preset information）を含むことができる。プリセット情報は、オブジェクトの出力チャネルによって決定される。モノプリセット情報は、オブジェクトの出力チャネルがモノである場合に適用されるプリセット情報であり、ステレオプリセット情報は、オブジェクトの出力チャネルがステレオである場合に適用されるプリセット情報であり、マルチチャネルプリセット情報は、オブジェクトの出力チャネルがマルチチャネルである場合に適用されるプリセット情報である。オブジェクトの出力チャネルが構成情報によって決定されると、決定された出力チャネルを用いてプリセット情報のタイプが決定され、当該プリセット情報をオブジェクトに適用してレベルまたはパニングを調節することができる。

図２Ａ及び図２Ｂは、本発明の一実施例によるプリセット属性情報によってプリセット情報を適用して、ダウンミックス信号に含まれたオブジェクトを調節する概念図である。

まず、本発明のオーディオ信号は、エンコーダによりダウンミックス信号及びオブジェクト情報にエンコーディングされ、これらは一つのビットストリームまたは別個のビットストリームの形態でデコーダに転送される。

図２Ａ及び図２Ｂを参照すると、ビットストリームに含まれたオブジェクト情報は、具体的に、構成情報領域と複数個のデータ領域（データ領域１、データ領域２、…、データ領域ｎ）とで構成される。構成情報領域は、オブジェクト情報のビットストリームにおいて前部に位置している領域であり、オブジェクト情報の全データ領域に共通して適用される情報を含む。例えば、ツリー構造などを含む構成情報（configuration information）、データ領域長情報（data region length information）及びオブジェクトの個数情報（object number information）などを含むことができる。一方、データ領域は、データ領域長情報に基づいて全体オーディオ信号の時間ドメインを分割したユニットであり、フレームを含むことができる。オブジェクト情報のデータ領域は、ダウンミックス信号のデータ領域に対応し、対応するダウンミックス信号のデータ領域をアップミキシングするために用いられるオブジェクト情報を含む。オブジェクト情報は、オブジェクトレベル情報及びオブジェクトゲイン情報などを含む。

まず、本発明の一実施例によるオーディオ信号処理方法では、ビットストリームのオブジェクト情報からプリセット属性情報（preset_attribute_information）が読まれる。このプリセット属性情報は、プリセット情報がビットストリームのいずれの領域に含まれているかを表すもので、特に、プリセット情報がオブジェクト情報の構成情報領域に含まれるかまたはデータ領域に含まれるかを表す。プリセット属性情報の詳細な意味は、下記の表１の通りである。

まず、図２Ａを参照すると、プリセット属性情報が０であって、プリセット情報が構成情報領域に含まれることを表す場合、構成情報領域から抽出されたプリセット情報はダウンミックス信号の全データ領域に同一に適用されてレンダリングを行う。

一方、図２Ｂを参照すると、プリセット属性情報が１であって、プリセット情報がデータ領域に含まれることを表す場合、データ領域から抽出されたプリセット情報は、対応するダウンミックス信号のデータ領域に適用されてレンダリングを行う。例えば、データ領域１から抽出されたプリセット情報は、ダウンミックス信号のデータ領域１に適用され、データ領域ｎから抽出されたプリセット情報は、ダウンミックス信号のデータ領域ｎに適用されることができる。

また、プリセット属性情報は、プリセット情報が変動（dynamic）であるかあるいは固定（static）であるかを表すことができる。プリセット属性情報が０に設定され、プリセット情報が構成情報領域に含まれることを示す場合、プリセット情報は固定（static）とされうる。一方、プリセット属性情報が１に設定され、プリセット情報がデータ領域に含まれる場合、プリセット情報は変動（dynamic）とされうる。この場合、プリセット情報は該当のデータ領域にのみ適用されて、対応するデータ領域のダウンミックス信号をレンダリングするので、データ領域別に変動的に適用される。この時、プリセット情報は、変動（dynamic）である場合は、データ領域の拡張領域（extension region）に存在することが好ましく、固定（static）である場合は、構成情報領域の拡張領域に存在することが好ましい。

したがって、本発明の一実施例によるオーディオ信号処理方法は、プリセット属性情報によって、音源の特性に基づいてデータ領域別に適切なプリセット情報を用いたり、同一のプリセット情報を全データ領域に用いたりして、ダウンミックス信号をレンダリングすることが可能になる。

図３は、本発明の実施例によるオーディオ信号処理装置３００を示す図である。

図３を参照すると、オーディオ信号処理装置３００は、プリセットモード生成部３１０、情報受信部（図示せず）、変動プリセットモード受信部３２０、固定プリセットモード受信部３３０、レンダリング部３４０を含むことができる。

プリセットモード生成部３１０は、オーディオ信号に含まれたオブジェクトをレンダリング時に調節するためのプリセットモードを生成し、プリセット属性情報生成部３１１、プリセットメタデータ生成部３１２及びプリセット情報生成部３１３を含むことができる。

プリセット属性情報生成部３１１は、上述した通り、プリセット情報を構成情報領域に含めて全データ領域に適用するか、あるいは、データ領域に含めてデータ領域別に適用するかを表すプリセット属性情報を決定する。

続いて、プリセットメタデータ生成部３１２及びプリセット情報生成部３１３は、一つのプリセットメタデータ及びプリセット情報、またはダウンミックス信号のデータ領域数だけのプリセットメタデータ及びプリセット情報を生成することができる。

プリセットメタデータ生成部３１２は、プリセット情報を表現するテキストを受信してプリセットメタデータ（preset metadata）を生成することができる。一方、オブジェクトのレベルを調節するためのゲイン及び／またはオブジェクトの位置がプリセット情報生成部３１３に入力される場合、当該オブジェクトに適用されるプリセット情報を生成することができる。

プリセット情報は、オブジェクトごとに適用されるように生成することができ、様々なタイプとすることができ、例えば、チャネルレベル差（CLD：Channel Level Difference）パラメータ、マトリクス（matrix）などを含むことができる。

また、プリセット情報生成部３１３は、オブジェクトの出力チャネルの数を表す出力チャネル情報（output channel information）をさらに生成することができる。

プリセットメタデータ生成部３１２で生成されたプリセットメタデータ及びプリセット情報生成部３１３で生成されたプリセット情報、出力チャネル情報などは、一つのビットストリームに含まれて転送されることができ、特に、ダウンミックス信号を含むビットストリームの補助領域（ancillary region）に含まれて転送されることができる。

一方、プリセットモード生成部３１０は、プリセットメタデータ、プリセット情報及び出力チャネル情報がビットストリームに含まれたことを表すプリセット存在情報（preset presence information）をさらに生成することができる。プリセット存在情報は、プリセット情報などがビットストリームのどの領域に含まれているかを表すコンテナタイプ（container type）とすることもでき、どの領域に含まれているかを表さずに、単にビットストリームに含まれたか否かを表すフラグタイプ（flag type）とすることもできるが、これに限定されることはない。

また、プリセットモード生成部３１０は、複数個のプリセットモードを生成することができ、それぞれのプリセットモードは、プリセット情報、プリセットメタデータ及び出力チャネル情報を含む。ここで、プリセットモード生成部３１０は、プリセットモードの個数を表すプリセット個数情報（preset number information）をさらに生成することができる。

このように、プリセットモード生成部３１０は、プリセット属性情報、プリセットメタデータ及びプリセット情報をビットストリームの形態にして出力することができる。

ビットストリームは、図２Ａ及び図２Ｂに示すような形態を有し、情報受信部（図示せず）に入力される。情報受信部（図示せず）に入力されたビットストリームからまずプリセット属性情報を獲得し、プリセット情報が、転送されたビットストリームのどの領域に含まれたかを決定する。

変動プリセットモード受信部３２０は、プリセット属性情報生成部３１１から出力されるプリセット属性情報に基づいて、プリセット情報がデータ領域に含まれる場合（表１のpreset_attribute_flag=1の場合）、作動する。

変動プリセットモード受信部３２０は、該当のデータ領域に対応するプリセットメタデータを受信する変動プリセットメタデータ受信部３２１及びデータ領域別プリセット情報を受信する変動プリセット情報受信部３２２を含むことができる。変動プリセットメタデータ受信部３２１は、選択されたプリセットメタデータを受信して出力し、変動プリセット情報受信部３２２はプリセット情報を受信する。これについての詳細は、図４Ａ乃至図５を参照して後述する。

固定プリセットモード受信部３３０は、プリセット属性情報に基づいて、プリセット情報が構成情報領域に含まれる場合（表１のpreset_attribute_flag=0の場合）、作動する。

固定プリセットモード受信部３３０は、全データ領域に対応するプリセットメタデータを受信する固定プリセットメタデータ受信部３３１及びプリセット情報を受信する固定プリセット情報受信部３３２を含むことができる。

固定プリセットモード受信部３３０の固定プリセットメタデータ受信部３３１及び固定プリセット情報受信部３３２は、変動プリセットモード受信部３２０の変動プリセットメタデータ受信部３２１及び変動プリセット情報受信部３２２と略同様の構成及び機能を有しているが、受信されて出力されるプリセット情報及びプリセットメタデータに対応するダウンミックス信号の範囲が異なる。

レンダリング部３４０は、複数個のオブジェクトを含むオーディオ信号をダウンミキシングして生成されたダウンミックス信号と変動プリセット情報受信部３２２から出力されたプリセット情報または固定プリセット情報受信部３３２から出力されたプリセット情報を受信する。このプリセット情報は、ダウンミックス信号に含まれたオブジェクトに適用されてオブジェクトのレベルを調節したりオブジェクトの位置を調節したりすることができる。

また、オーディオ信号処理装置３００がディスプレイ部（図示せず）を含む場合、変動プリセットメタデータ受信部３２１から出力される選択されたプリセットメタデータまたは固定プリセットメタデータ受信部３３１から出力される選択されたプリセットメタデータは、ディスプレイ部に表示されることができる。

図４Ａ及び図４Ｂは、本発明の実施例によるプリセット情報がレンダリング部に適用される方法を示すブロック図である。

まず、図４Ａは、変動プリセットモード受信部３２０から出力されたプリセット情報が、レンダリング部４４０に適用される方法を示す図である。変動プリセットモード受信部３２０は、図３における変動プリセットモード受信部３２０と同一であり、変動プリセットメタデータ受信部３２１及び変動プリセット情報受信部３２２を含む。

変動プリセットモード受信部３２０は、データ領域ごとにプリセットメタデータ及びプリセット情報を受信して出力し、このプリセット情報はレンダリング部４４０に入力される。

レンダリング部４４０は、プリセット情報の他に、ダウンミックス信号も受信して、データ領域別にレンダリングを行い、データ領域１のレンダリング部４４１、データ領域２のレンダリング部４４２、…、データ領域ｎのレンダリング部４４ｎを含む。ここで、レンダリング部４４０のそれぞれのデータ領域レンダリング部４４Ｘは、それぞれデータ領域に対応するプリセット情報を受信してダウンミックス信号に適用することによってレンダリングする。

例えば、１番目のデータ領域は、スタジアムモードであるプリセット情報＿１が適用され、２番目のデータ領域は、カラオケモードであるプリセット情報＿３が適用され、６番目のデータ領域は、ニュースモードであるプリセット情報＿２（ここで、プリセット情報＿ｎのｎは、データ領域モードのインデックスを表す。）が適用されることができる。この場合、プリセットメタデータもデータ領域ごとに出力されることは勿論である。

図４Ｂは、固定プリセットモード受信部３３０から出力されたプリセット情報が、レンダリング部４４０で適用される方法を示す図である。固定プリセットモード受信部３３０は、図３の固定プリセットモード受信部３３０と同一に構成される。

固定プリセットモード受信部３３０は、ダウンミックス信号の全データ領域に対応するプリセットメタデータ及びプリセット情報を受信して出力する。レンダリング部４４０は、プリセット情報を受信する。

図４Ｂに示されるレンダリング部４４０は、図４Ａのレンダリング部と同様に、データ領域数だけのデータ領域レンダリング部４４Ｘを含む。レンダリング部４４０は、固定プリセットモード受信部３３０からプリセット情報を受信する場合、全てのデータ領域レンダリング部４４Ｘが受信したプリセット情報をダウンミックス信号に同一に適用することによってレンダリングする。

例えば、固定プリセット情報受信部３３２から出力されたプリセット情報がニュースモードを表すプリセット情報２の場合、１番目のデータ領域からｎ番目のデータ領域まで全データ領域にニュースモードを適用することができる。

図５は、本発明のオーディオ信号処理装置３００の変動プリセットモード受信部３２０に含まれる変動プリセット情報受信部３２２、及び固定プリセットモード受信部３３０に含まれる固定プリセット情報受信部３３２の概略的な構成を示す図である。

変動または固定プリセット情報受信部３２２，３３２は、出力チャネル情報受信部３２２ａ，３３２ａ及びプリセット情報決定部３２２ｂ，３３２ｂを含む。

出力チャネル情報受信部３２２ａ，３３２ａは、ダウンミックス信号に含まれたオブジェクトがいくつの出力チャネルに再生されるかを表す出力チャネル情報を受信して出力する。この出力チャネル情報は、モノチャネル、ステレオチャネルまたはマルチチャネル（５．１チャネル）とすることができるが、これに限定されることはない。

プリセット情報決定部３２２ｂ，３３２ｂは、出力チャネル情報受信部３２２ａ，３３２ｂから入力された出力チャネル情報に基づいて、該当するプリセット情報を受信して出力する。このプリセット情報は、モノプリセット情報、ステレオプリセット情報またはマルチチャネルプリセット情報のうちの一つとすることができる。

プリセット情報がマトリクスタイプである場合は、該プリセット情報の次元は、オブジェクトの数及び出力チャネルの数に基づいて決定することができ、プリセットマトリクスは、（オブジェクトの数）＊（出力チャネルの数）の形態を有することができる。例えば、ダウンミックス信号に含まれたオブジェクトがｎ個であり、出力チャネル情報受信部３２２ａ，３３２ａからの出力チャネルが５．１チャネル、すなわち、６個のチャネルである場合、プリセット情報決定部３２２ｂ，３３２ｂは、ｎ＊６形態としたマルチチャネルプリセット情報を出力することができる。ここで、マトリクスの成分（element）は、ａ番目のオブジェクトがｉ番目のチャネルに含まれる程度を表すゲイン値である。

図６は、本発明の他の実施例によるオーディオ信号処理装置６００を示す図である。

オーディオ信号処理装置６００は、主に、ダウンミキシング部６１０、オブジェクト情報生成部６２０、プリセットモード生成部６３０、ダウンミックス信号処理部６４０、情報処理部６５０及びマルチチャネルデコーディング部６６０を含む。

複数個のオブジェクトはダウンミキシング部６１０に入力されて、モノまたはステレオダウンミックス信号を生成する。また、複数個のオブジェクトは、オブジェクト情報生成部６２０に入力されて、オブジェクトのレベルを表すオブジェクトレベル情報と、ダウンミックス信号に含まれるオブジェクトのゲイン値及びステレオダウンミックス信号である場合にダウンミックスチャネルに含まれるオブジェクトの程度を含むオブジェクトゲイン情報と、オブジェクト間の関連有無を表すオブジェクト関連情報と、を含むオブジェクト情報を生成する。

その後、ダウンミックス信号及びオブジェクト情報は、プリセットモード生成部６３０に入力されて、プリセット情報がビットストリームにおいてデータ領域に含まれるかまたはビットストリームにおいて構成情報領域に含まれるかを表すプリセット属性情報、オブジェクトのレベルを調節するためのプリセット情報、及びプリセット情報を表現するためのプリセットメタデータを含むプリセットモードを生成する。プリセット属性情報、プリセット情報及びプリセットメタデータを生成する過程は、図１乃至図５におけるオーディオ信号処理装置及び方法で上述した通りであるから、その詳細な説明は省略する。

また、プリセットモード生成部６３０は、プリセット情報がビットストリームに存在するか否かを表すプリセット存在情報、プリセット情報の個数を表すプリセット個数情報及びプリセットメタデータの長さを表すプリセットメタデータ長情報をさらに生成することができる。

オブジェクト情報生成部６２０で生成されたオブジェクト情報とプリセットモード生成部６３０で生成されたプリセット属性情報、プリセット情報、プリセットメタデータ、プリセット存在情報、プリセット個数情報及びプリセットメタデータ長情報は、ＳＡＯＣビットストリームに含まれて転送されることができ、ダウンミックス信号も含まれた一つのビットストリームの形態として転送されることができる。この場合、ダウンミックス信号及びプリセット関連情報を含むビットストリームは、デコーディング装置の信号受信部（図示せず）に入力されることができる。

情報処理部６５０は、オブジェクト情報処理部６５１、変動プリセットモード受信部６５２及び固定プリセットモード受信部６５３を含み、ＳＡＯＣビットストリームを受信する。ＳＡＯＣビットストリームが変動プリセットモード受信部６５２に入力されるかまたは固定プリセットモード受信部６５３に入力されるかは、図２乃至図５を参照して上述した通り、ＳＡＯＣビットストリームに含まれたプリセット属性情報に基づいて決定される。

変動プリセットモード受信部６５２及び固定プリセットモード受信部６５３は、ＳＡＯＣビットストリームから上記のプリセット属性情報、プリセット存在情報、プリセット個数情報、プリセットメタデータ、出力チャネル情報及びプリセット情報（例えば、プリセットマトリクス）を受信し、図１乃至図５のオーディオ信号処理方法及び装置で説明された様々な実施例による方法を用いる。

変動プリセットモード受信部６５２または固定プリセットモード受信部６５３は、プリセットメタデータとプリセット情報を出力する。

オブジェクト情報処理部６５１は、出力されたプリセットメタデータとプリセット情報を受信し、ＳＡＯＣビットストリームに含まれるオブジェクト情報と共に、受信したプリセットメタデータとプリセット情報を用いて、ダウンミックス信号を前処理（pre-processing）するためのダウンミックス処理情報とダウンミックス信号をレンダリングするためのマルチチャネル情報を生成する。この場合、変動プリセットモード受信部６５２から出力されるプリセット情報及びプリセットメタデータは、ダウンミックス信号の一つのデータ領域に対応するもので、固定プリセットモード受信部６５３から出力されるプリセット情報及びプリセットメタデータは、ダウンミックス信号の全体データ領域に対応するものである。

その後、ダウンミックス処理情報は、ダウンミックス信号処理部６４０に入力され、ダウンミックス信号に含まれたオブジェクトが含まれるチャネルを変動させることによってパニングを行うことができる。このように前処理されたダウンミックス信号は、情報処理部６５０から出力されたマルチチャネル情報と一緒にマルチチャネルデコーディング部６６０に入力されてアップミキシングされることで、マルチチャネルオーディオ信号を生成することができる。

このように、本発明のオーディオ信号処理装置は、複数個のオブジェクトを含むダウンミックス信号を、オブジェクト情報を用いてマルチチャネル信号にデコーディングする際に、既に設定されたプリセット情報及びプリセットメタデータをさらに用いることによって容易にオブジェクトのレベルを調節することができる。また、この時、オブジェクトに適用されるプリセット情報は、プリセット属性情報に基づいてデータ領域ごとに個別に適用されたり、全体データ領域に同一に適用されることによって、音源の特性によって適切に音場感を向上させることができる。

図７乃至図１１は、本発明の他の実施例によるオーディオ信号処理方法を示すシンタックス（syntax）を様々な方法で表現したものである。

図７を参照すると、プリセット情報と関連した情報は、ビットストリームの構成情報領域（SAOC Specific Config()）に存在することができる。

まず、ビットストリームの構成情報領域からプリセット個数情報（bsNumPresets）を獲得することができる。また、プリセット個数情報に基づいてプリセット情報（ｉ番目のプリセット情報）ごとにプリセット情報が適用されるオブジェクトの出力チャネルを表す出力チャネル情報（bsPresetLevel[i]）を獲得することができる。この出力チャネル情報の意味は、下記の表２の通りである。

その後、プリセット情報が構成情報領域に含まれるのか或いはデータ領域に含まれるかを表すプリセット属性情報（bsPresetDynamic[i]）を獲得することができる。図７に示すように、プリセット属性情報（bsPresetDynamic[i]）が０の場合、固定プリセットモード（static preset mode）を表し、全データ領域に対応してダウンミックス信号のオブジェクトレベルまたはパニングを調節するためのプリセット情報（getPreset()）を獲得する。この時、プリセットメタデータ（PresetMetaData(numPresets)）もプリセット情報に対応して構成情報領域に含まれることができる。このプリセット属性情報の意味は、下記表３の通りである。

図８は、図７に示されるプリセット属性情報（bsPresetDynamic[i]）が、プリセット情報がデータ領域に含まれることを示す場合、データ領域情報に対するシンタックスを表現したものである。

図８を参照すると、図７のプリセット属性情報（bsPresetDynamic[i]）が１の場合、「if(!bsPresetDynamic[i])」ループを外れるので、構成情報領域からプリセット情報を獲得しない。その後、図８に示すように、データ領域で（SAOCFrame() ｛if(bsPresetDynamic[i])｝）条件を満たすので、プリセット情報（getPreset()）を獲得することができる。このプリセット情報はデータ領域から獲得されるので、図７のプリセット情報が全体データ領域に同一に適用されることと違い、該当のデータ領域にのみ適用されることができる。

一方、図７及び図８では、プリセット情報が構成情報領域（SAOCSpecificConfig()）及びデータ領域（SAOCFrame()）に含まれているが、構成情報領域拡張領域（SAOCExtensionConfig()）及びデータ領域拡張領域（SAOCEXtensionFrame()）に含まれることもできる。

この時、構成情報領域拡張領域及びデータ領域拡張領域に含まれるプリセット情報は、図７及び図８を参照して説明されたプリセット情報と同一である。また、構成情報領域拡張領域及びデータ領域拡張領域は、プリセット情報の他に、プリセット情報に対応するプリセットメタデータ、出力チャネル情報、プリセット存在情報などをさらに含むこともできる。

図９は、本発明の他の実施例によるプリセット情報を表すシンタックスである。

図９を参照すると、プリセット情報は、EcDataを用いて生成されたものとすることができる。一方、プリセット情報は、EcDataではなくゲイン値自体を転送して用いる方法を利用することができ、チャネル差情報（ＣＬＤ）テーブルを用いて量子化する方法の他、別の独立したテーブルを用いて量子化することもできる。

図１０は、本発明の他の実施例によるプリセットメタデータを表すシンタックスである。

図１０に示すように、プリセットメタデータは、まず、プリセット情報に対応するメタデータの長さを表すプリセットメタデータ長情報（bsNumCharMetaData[prst]）を獲得する。以降、プリセットメタデータ長情報に基づいてプリセット情報ごとに各プリセット情報に対応するプリセットメタデータ（bsMetaData[prst]）を獲得することができる。

このように、プリセット情報を表現するプリセットメタデータを、メタデータの長さを表すプリセット長情報に基づいてテキスト形態で表現することによって、本発明のオーディオ信号処理方法及び装置は余分のコーディングを減らすことができる。

図１１は、本発明のさらに他の実施例によるプリセット情報を含むデータ領域のシンタックスである。

図１１を参照すると、プリセット情報は、オブジェクトの数（numObjects）に基づいてオブジェクト別に出力チャネル（numRenderingChannel[i]）にマッピングされる情報を転送することができる。図１１に示すように、プリセット情報は、ビットストリームのデータ領域から獲得することができるが、データ領域拡張領域に含まれた場合にはデータ領域拡張領域（SAOCExtensionFrame()）、ビットストリームの構成情報領域に含まれた場合には構成情報領域から獲得することができる。

図１２は、本発明のさらに他の実施例によるオーディオ信号処理装置１２００を示す図である。

オーディオ信号処理装置１２００は、主に、プリセットモード生成部１２１０、情報受信部（図示せず）、プリセットモード入力部１２２０、プリセットモード選択部１２３０、変動プリセットモード受信部１２４０、固定プリセットモード受信部１２５０、レンダリング部１２６０及びディスプレイ部１２７０を含む。

図１２のプリセットモード生成部１２１０、情報受信部（図示せず）、変動プリセットモード受信部１２４０、固定プリセットモード受信部１２５０及びレンダリング部１２６０は、図３のプリセットモード生成部３１０、変動プリセットモード受信部３２０、固定プリセットモード受信部３３０及びレンダリング部３４０と同一の構成及び機能を有するので、詳細な説明は省略する。

図１２を参照すると、プリセットモード入力部１２２０は、プリセットメタデータ生成部１２１２から受信した複数個のプリセットメタデータをまずディスプレイ部１２７０の画面に表示し、これらのうち一つのプリセットメタデータを選択する選択信号を受信する。プリセットモード選択部１２３０は、選択信号によって選択された一つのプリセットメタデータと該プリセットメタデータに対応するプリセット情報を選択する。

この時、プリセット属性情報生成部１２１１から受信するプリセット属性情報（preset_attribute_information）が、プリセット情報がデータ領域に含まれることを表す場合、プリセットモード選択部１２３０で選択されたプリセットメタデータと該プリセットメタデータと対応するプリセット情報を、変動プリセットモード受信部１２４０の変動プリセットメタデータ受信部１２４１及び変動プリセット情報受信部１２４２にそれぞれ入力する。この場合、ディスプレイ部１２７０、プリセットモード入力部１２２０及びプリセットモード選択部１２３０は、データ領域の数だけ反復して上記動作を行うことができる。

一方、プリセット属性情報生成部１２１１から受信するプリセット属性情報が、プリセット情報が構成情報領域に含まれることを表す場合、プリセットモード選択部１２２０で選択されたプリセットメタデータと該プリセットメタデータと対応するプリセット情報を、固定プリセットモード受信部１２５０の固定プリセットメタデータ受信部１２５１及び固定プリセット情報受信部１２５２にそれぞれ入力する。

また、選択されたプリセット情報は、レンダリング部１２６０に出力される反面、選択されたプリセットメタデータはディスプレイ部１２７０に出力されて画面に表示される。

ディスプレイ部１２７０は、プリセットモード入力部１２２０が選択信号を受信できるように複数個のプリセットメタデータを表示するユニットと同一のユニットとすることができ、それぞれ異なるユニットとすることもできる。ディスプレイ部１２７０とプリセットモード入力部１２２０のためにプリセットメタデータを表示するディスプレイ部が同一のユニットを用いる場合、画面に表示される説明（例えば、「プリセットモードを選択してください」、「プリセットモードＸが選択されました」等）、視覚オブジェクト、文字などを異ならせて構成することによって、それぞれの動作を区別することができる。

図１３は、オーディオ信号処理装置１２００のディスプレイ部１２７０の一例を示す図である。

ディスプレイ部１２７０は、選択されたプリセットメタデータの他に、プリセットメタデータに対応するプリセット情報を用いて調節されたオブジェクトのレベルまたは位置を表す一つ以上の図形要素を含むことができる。

図１３を参照すると、まず、図１２のディスプレイ部１２７０に表示された複数個のプリセットメタデータ（例えば、スタジアムモード、洞窟（cave）モード、ニュースモード、ライブモード等）のうち、プリセットモード選択部１２３０を通じてニュースモードが選択された場合、ニュースモードに対応するプリセット情報が、ダウンミックス信号に含まれた各オブジェクトに適用される。この場合、ボーカルのレベルは増加し、他のオブジェクト（ギター、バイオリン、ドラム、…、チェロ）のレベルは減少する。

ディスプレイ部１２７０に含まれた図形要素は、オブジェクトのレベルまたは位置の差動または変化を表すために変形される。例えば、図１３に示すように、ボーカルを表す図形要素のスイッチは右に移動し、他のオブジェクトを表す図形要素のスイッチは左に移動することができる。

図形要素は、様々な方法でプリセット情報を用いて調節されたオブジェクトのレベルまたは位置を表すことができる。各オブジェクトを表す図形要素は一つ以上とすることができ、この場合、第１図形要素は、プリセット情報を適用する前のオブジェクトのレベルまたは位置を表し、第２図形要素は、プリセット情報を適用して調節されたオブジェクトのレベルまたは位置を表すことができる。この場合、プリセット情報を適用する前後のオブジェクトのレベルまたは位置を容易に比較できるので、プリセット情報が各オブジェクトをどのように調節するかが容易にわかる。

図１４は、プリセット情報が適用されたオブジェクトを表す他の形状の一つ以上の図形要素を示す図である。

図１４を参照すると、第１図形要素はバー（bar）形態とし、第２図形要素は、第１図形要素内の延長線（extensive line）とすることができる。ここで、第１図形要素は、プリセット情報を適用する前のオブジェクトのレベルまたは位置を表し、第２図形要素は、プリセット情報を適用して調節されたオブジェクトのレベルまたは位置を表す。

図１４に示すように、上端の図形要素は、プリセット情報が適用される前のオブジェクトのレベルが、適用された後のオブジェクトのレベルと同一の場合を示す。中央の図形要素は、プリセット情報が適用されて調節されたオブジェクトのレベルが、適用前よりも大きい場合を示し、下端の図形要素は、プリセット情報が適用されることによってオブジェクトのレベルが減少した場合を示す。

このように、プリセット情報を適用する前と適用した後のオブジェクトのレベルまたは位置を表す一つ以上の図形要素を使用することによって、プリセット情報が各オブジェクトをどのように調節するかが容易にわかる。なお、これにより、プリセット情報の特徴を容易に把握できるので、必要に応じてユーザーが適切なプリセットモードを選択するのに役立つことができる。

図１５は、本発明のさらに他の実施例による変動プリセットモード受信部及び固定プリセットモード受信部が具現された製品の概略的な構成を示す図であり、図１６Ａ及び図１６Ｂは、本発明の実施例による変動プリセットモード受信部及び固定プリセットモード受信部が具現された製品間の関係を示す図である。

図１５を参照すると、有無線通信部１５１０は、有無線通信方式を通じてビットストリームを受信する。具体的に、有無線通信部１５１０は、有線通信部１５１１、赤外線通信部１５１２、ブルトゥース部１５１３、無線ＬＡＮ通信部１５１４のうち一つ以上を含むことができる。

ユーザー認証部１５２０は、ユーザー情報を受信してユーザー認証を行うもので、指紋認識部１５２１、虹彩認識部１５２２、顔面認識部１５２３、及び音声認識部１５２４のうち一つ以上を含むことができる。この場合、ユーザー認証は、それぞれ、指紋、虹彩情報、顔面輪郭情報、音声情報を受信してユーザー情報に変換し、ユーザー情報と既存登録されているユーザーデータとが一致するか否か判断して、ユーザー認証を行うことができる。

入力部１５３０は、ユーザーが様々な種類の命令を入力するための入力装置であり、キーパッド部１５３１、タッチパッド部１５３２、リモコン部１５３３のうちの一つ以上を含むことができるが、本発明はこれに限定されるわけではない。一方、後述する変動プリセットモード受信部１５４１から出力される複数個のプリセット情報に対するプリセットメタデータが、ディスプレイ部１５６２を通じて画面に表示される場合、入力部１５３０を通じてユーザーがプリセットメタデータを選択することができ、選択されたプリセットメタデータに関する情報が制御部１５５０に入力される。

信号デコーディング部１５４０は、変動プリセットモード受信部１５４１及び固定プリセットモード受信部１５４２を含み、変動プリセットモード受信部１５４１は、プリセット属性情報に基づいて、各データ領域に対応するプリセット情報及びプリセットメタデータを受信する。また、固定プリセットモード受信部１５４２は、プリセット属性情報に基づいて、全データ領域に対応するプリセット情報及びプリセットメタデータを受信する。また、プリセットメタデータは、メタデータの長さを表すプリセットメタデータ長情報に基づいて受信され、プリセット情報は、プリセット情報が存在するか否かを表すプリセット存在情報、プリセット情報の個数を表すプリセット個数情報及び出力チャネルの個数に基づく、例えば、出力チャネルがモノ、ステレオ及びマルチチャネルのうち一つであることを表す出力チャネル情報に基づいて獲得される。もし、プリセット情報がマトリクスで表現された場合、出力チャネル情報を受信し、これに基づいてプリセットマトリクスを受信する。

信号デコーディング部１５４０は、受信したビットストリーム、プリセットメタデータ、及びプリセット情報を用いてオーディオ信号をデコーディングして出力信号を生成し、プリセットメタデータをテキストの形態として出力する。

制御部１５５０は、入力装置から入力信号を受信し、信号デコーディング部１５４０と出力部１５６０のプロセス全般を制御する。上述の通り、制御部１５５０に、入力部１５３０から選択されたプリセットメタデータに関する情報が入力信号の形態として入力され、有無線通信部１５１０から、プリセット情報がビットストリームのどの領域に含まれるかを表すプリセット属性情報（preset_attribute_information）が入力される場合、変動プリセットモード受信部１５４１及び固定プリセットモード受信部１５４２は、プリセット属性情報及び入力信号に基づいて、選択されたプリセットメタデータと対応するプリセット情報を受信し、これを用いてオーディオ信号をデコーディングする。

出力部１５６０は、信号デコーディング部１５４０により生成された出力信号などが出力される構成要素で、スピーカー部１５６１及びディスプレイ部１５６２を含むことができる。出力信号がオーディオ信号の場合、出力信号はオーディオ信号出力部１５６１から出力され、ビデオ信号の場合、出力信号はディスプレイ部１５６２から出力される。また、制御部１５５０から入力されたプリセットメタデータをディスプレイ部１５６２を通じて画面に表示する。

図１６は、図１５に示す製品に該当する端末間の関係及び端末とサーバーとの関係をそれぞれ示す図である。

図１６の（Ａ）を参照すると、第１端末１６１０及び第２端末１６２０が、有無線通信部を通じてデータまたはビットストリームを両方向に通信できることがわかる。

有無線通信部を通じて通信するデータまたはビットストリームは、図２Ａ及び図２Ｂに示すビットストリームの形態としても良く、図１乃至図１５を参照して説明した本発明のプリセット属性情報、プリセット情報、プリセットメタデータなどを含むデータとしても良い。

図１６の（Ｂ）を参照すると、サーバー１６３０及び第１端末１６４０も互いに有無線通信を行うことができる。

図１７は、本発明の一実施例によるメタデータ受信部及びプリセットレンダリングデータ受信部を含むプリセット受信部が具現された放送信号デコーディング装置１７００の概略的な構成を示す図である。

図１７を参照すると、デマルチプレクサ１７２０は、チューナー１７１０からＴＶ放送と関連したデータを受信する。受信されたデータはデマルチプレクサ１７２０で分離され、データデコーダ１７３０でデコーディングされる。一方、デマルチプレクサ１７２０で分離されたデータは、ＨＤＤのような記憶媒体１７５０に記憶されることができる。

デマルチプレクサ１７２０で分離されたデータは、オーディオデコーダ１７４１及びビデオデコーディング部１７４２を含むデコーダ１７４０に入力されて、オーディオ信号及びビデオ信号をデコーディングする。オーディオデコーダ１７４１は、本発明の一実施例による変動プリセットモード受信部１７４１Ａ及び固定プリセットモード受信部１７４１Ｂを含み、変動プリセットモード受信部１７４１Ａは、プリセット属性情報に基づいて各データ領域に対応するプリセット情報及びプリセットメタデータを受信する。また、固定プリセットモード受信部１７４１Ｂは、プリセット属性情報に基づいて全データ領域に対応するプリセット情報及びプリセットメタデータを受信する。

また、プリセットメタデータは、メタデータの長さを表すプリセットメタデータ長情報に基づいて受信され、プリセット情報は、プリセット情報が存在するか否かを表すプリセット存在情報、プリセット情報の個数を表すプリセット個数情報、及び出力チャネルがモノ、ステレオ及びマルチチャネルのうち一つであることを表す出力チャネル情報に基づいて獲得される。もし、プリセット情報がマトリクスで表現された場合、出力チャネル情報を受信してこれに基づいてプリセットマトリクスを受信する。

オーディオデコーダ１７４１は、受信されたビットストリーム、プリセットメタデータ、及びプリセット情報を用いてオーディオ信号をデコーディングして出力信号を生成し、プリセットメタデータをテキスト形態として出力する。

ディスプレイ部１７７０は、ビデオデコーディング部１７４２から出力されたビデオ信号とオーディオデコーダ１７４１から出力されたプリセットメタデータを画面に表示する。また、ディスプレイ部１７７０は、スピーカー部（図示せず）を含み、オーディオデコーダ１７４１から出力されるオブジェクトのレベルがプリセット情報を用いて調節されたオーディオ信号を、ディスプレイ部１７７０に含まれたスピーカー部から出力する。また、デコーダ１７４０でデコーディングされたデータは、ＨＤＤのような記憶媒体１７５０に記憶することができる。

一方、放送信号デコーディング装置１７００は、ユーザーから情報を受信し、受信したデータを制御できるアプリケーションマネジャー１７６０をさらに含むことができる。

アプリケーションマネジャー１７６０は、ユーザーインターフェースマネジャー１７６１及びサービスマネジャー１７６２を含む。ユーザーインターフェースマネジャー１７６１は、ユーザーから情報を受信するためのインターフェース（interface）を制御する。例えば、ディスプレイ部１７７０に表示されるテキストの書体、画面の明るさ、メニュー構成などを制御することができる。一方、サービスマネジャー１７６２は、デコーダ１７４０及びディスプレイ部１７７０で放送信号をデコーディングして出力する場合、受信される放送信号を、ユーザーから入力される情報を用いて制御できる。例えば、放送チャネルの設定、アラーム機能設定、成人認証機能などを提供することができる。アプリケーションマネジャー１７６０から出力されるデータは、デコーダ１７４０の他に、ディスプレイ部１７７０にも転送されて利用可能である。

以上では具体的な実施例及び図面に基づいて本発明を説明してきたが、本発明は、それらの具体例に限定されず、本発明の属する技術分野における通常の知識を有する者にとっては、本発明の技術思想及び添付の特許請求の範囲とその均等範囲内で様々な修正及び変形が可能であるということは明らかである。

本発明は、オーディオ信号をエンコーディング及びデコーディングするのに適用することができる。

Claims

少なくとも一つのオブジェクトを含むダウンミックス信号と、プリセット情報及びプリセット属性情報を含むプリセットモードを受信する段階であって、前記プリセット情報は前記ダウンミックス信号をレンダリングし、前記プリセット属性情報は前記プリセット情報の属性を表す段階と、
前記プリセット属性情報に基づいて、構成情報領域内の前記プリセット情報を、該構成情報領域内の前記プリセット情報が適用される前記ダウンミックス信号のデータ領域に適用することによって前記ダウンミックス信号をレンダリングする段階と、
前記プリセット属性情報に基づいて、データ領域内の前記プリセット情報を、前記ダウンミックス信号の対応する一つのデータ領域に適用することによって前記ダウンミックス信号をレンダリングする段階と、
を含み、
前記プリセット情報は、前記プリセットモードの個数を表すプリセット個数情報及び前記レンダリングされたダウンミックス信号の出力チャネルの個数を表す出力チャネル情報に基づいて獲得されることを特徴とするオーディオ信号処理方法。
前記プリセット情報は、前記オブジェクトの個数及び前記出力チャネルの個数に基づくプリセットマトリクスであることを特徴とする、請求項１に記載のオーディオ信号処理方法。
前記プリセット情報は、モノプリセット情報、ステレオプリセット情報及びマルチチャネルプリセット情報を含むことを特徴とする、請求項１に記載のオーディオ信号処理方法。
前記ダウンミックス信号をレンダリングする段階は、前記プリセット情報を用いて前記オブジェクトの出力レベルを調節する段階をさらに含むことを特徴とする、請求項１に記載のオーディオ信号処理方法。
前記プリセット属性情報は、前記プリセット情報が変動であるか固定であるかを表すことを特徴とする、請求項１に記載のオーディオ信号処理方法。
前記プリセット情報は、前記構成情報領域の拡張領域または前記データ領域の拡張領域に含まれることを特徴とする、請求項１に記載のオーディオ信号処理方法。
少なくとも一つのオブジェクトを含むダウンミックス信号と、プリセット情報及びプリセット属性情報を含むプリセットモードを受信する信号受信部であって、前記プリセット情報は前記ダウンミックス信号をレンダリングし、前記プリセット属性情報は前記プリセット情報の属性を表す、信号受信部と、
前記プリセット属性情報に基づいて、構成情報領域内の前記プリセット情報を、該構成情報領域内の前記プリセット情報が適用される前記ダウンミックス信号のデータ領域に適用し、データ領域内の前記プリセット情報を前記ダウンミックス信号の対応する一つのデータ領域に適用することにより、前記ダウンミックス信号をレンダリングするレンダリング部と、
を含み、
前記プリセット情報は、前記プリセットモードの個数を表すプリセット個数情報及び前記レンダリングされたダウンミックス信号の出力チャネルの個数を表す出力チャネル情報に基づいて獲得されることを特徴とするオーディオ信号処理装置。
前記プリセット情報は、前記オブジェクトの個数及び前記出力チャネルの個数に基づくプリセットマトリクスを表すことを特徴とする、請求項７に記載のオーディオ信号処理装置。
前記プリセット情報は、モノプリセット情報、ステレオプリセット情報及びマルチチャネルプリセット情報を含むことを特徴とする、請求項７に記載のオーディオ信号処理装置。
前記レンダリング部は、前記プリセット情報を用いて前記オブジェクトの出力レベルを調節することを特徴とする、請求項９に記載のオーディオ信号処理装置。
前記プリセット情報は、前記構成情報領域の拡張領域または前記データ領域の拡張領域に含まれることを特徴とする、請求項７に記載のオーディオ信号処理装置。
前記プリセット属性情報は、前記プリセット情報が変動であるか固定であるかを表すことを特徴とする、請求項７に記載のオーディオ信号処理装置。
少なくとも一つのオブジェクトをダウンミキシングしてダウンミックス信号を生成する段階と、
前記ダウンミックス信号に適用して前記オブジェクトを調節するためのプリセット情報を生成する段階であって、該プリセット情報は構成情報領域又はデータ領域に含まれる段階と、
プリセットモードの個数を表すプリセット個数情報及びアップミキシングされたダウンミックス信号の出力チャネルがモノ、ステレオまたはマルチチャネルの一つであることを表す出力チャネル情報を生成する段階と、
前記プリセット情報に対応するプリセットメタデータを生成する段階と、
前記プリセット情報の属性を表すプリセット属性情報を決定する段階と、
を含み、
前記プリセットモードは、前記プリセット情報、前記プリセットメタデータ及び前記プリセット属性情報を有することを特徴とするオーディオ信号処理方法。
少なくとも一つのオブジェクトをダウンミキシングしてダウンミックス信号を生成するダウンミキシング部と、
前記ダウンミックス信号に適用して前記オブジェクトを調節するためのプリセット情報を生成するプリセット情報生成部であって、該プリセット情報は構成情報領域又はデータ領域に含まれる、プリセット情報生成部と、
プリセットモードの個数を表すプリセット個数情報及びアップミキシングされたダウンミックス信号の出力チャネルがモノ、ステレオまたはマルチチャネルの一つであることを表す出力チャネル情報を生成する情報生成部と、
前記プリセット情報に対応するプリセットメタデータを生成するプリセットメタデータ生成部と、
前記プリセット情報の属性を表すプリセット属性情報を決定するプリセット属性情報決定部と、
を含み、
前記プリセットモードは、前記プリセット情報、前記プリセットメタデータ及び前記プリセット属性情報を有することを特徴とするオーディオ信号処理装置。