JP5249408B2 - オーディオ信号の処理方法及び装置 - Google Patents

オーディオ信号の処理方法及び装置 Download PDF

Info

Publication number
JP5249408B2
JP5249408B2 JP2011504929A JP2011504929A JP5249408B2 JP 5249408 B2 JP5249408 B2 JP 5249408B2 JP 2011504929 A JP2011504929 A JP 2011504929A JP 2011504929 A JP2011504929 A JP 2011504929A JP 5249408 B2 JP5249408 B2 JP 5249408B2
Authority
JP
Japan
Prior art keywords
preset
information
downmix signal
unit
preset information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011504929A
Other languages
English (en)
Other versions
JP2011518353A (ja
Inventor
オー,ヒェン−オ
ウォン ジュン,ヤン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020090032216A external-priority patent/KR101061128B1/ko
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2011518353A publication Critical patent/JP2011518353A/ja
Application granted granted Critical
Publication of JP5249408B2 publication Critical patent/JP5249408B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、オーディオ信号の処理方法及び装置に係り、特に、デジタル媒体、放送信号などから受信されたオーディオ信号を処理できるオーディオ信号の処理方法及び装置に関するものである。
複数個のオブジェクトを含むオーディオ信号を、モノまたはステレオ信号にダウンミキシングしてダウンミックス信号を生成する過程において、オブジェクトからパラメータが抽出される。これらのパラメータは、ダウンミキシングされた信号をデコーディングする過程で用いられる。更に、オブジェクトの位置(position)及びゲイン(gain)は、パラメータの他に、ユーザーの選択によってコントロールすることもできる。
ダウンミックス信号に含まれているオブジェクトは、ユーザーの選択によって調節しなければならない。しかし、ユーザーがオブジェクトを制御する場合、直接すべてのオブジェクト信号を制御しなければならないという不便さがあり、専門家によって制御される場合に比べて、オーディオ信号を最適の状態に再現することは困難である。
従って、本発明は、オーディオ信号を処理するための装置とその方法に関するものであり、関連技術における制限と不利点による1つ以上の問題を実質的に取り除く。
本発明の目的は、既に設定されたプリセット情報及びプリセットメタデータを用いてオブジェクトのレベルと位置を制御することができるオーディオ信号処理方法及び装置を提供することにある。
本発明の他の目的は、音源の特性によってプリセット情報及びプリセットメタデータをダウンミックス信号の全データ領域にまたはダウンミックス信号の一つのデータ領域に適用することによって、ダウンミックス信号に含まれたオブジェクトを調節できるオーディオ信号処理方法及び装置を提供することにある。
本発明のさらに他の目的は、ユーザーの選択に基づいてディスプレイ部に表示されたプリセットメタデータのうち一つを選択し、これに対応するプリセット情報を用いてオブジェクトのレベル及び位置をコントロールすることができるオーディオ信号処理方法及び装置を提供することにある。
本発明のさらに他の目的は、プリセット情報が適用されて調節されたオブジェクト及び選択されたプリセットメタデータをディスプレイ部に表示することによって、ユーザーから選択信号を受信することができるオーディオ信号処理方法及び装置を提供することにある。
本発明は、下記の効果及び利点を提供する。
第一に、それぞれのオブジェクトに対するユーザーの設定なしに、既に設定された複数個のプリセット情報のうちの一つを複数個のプリセットメタデータを用いて選択することによって容易にオブジェクトの出力チャネルのレベルを調節することができる。
第二に、音源の特性によってプリセット情報をデータ領域単位に個別に選択して適用したり、ダウンミックス信号の全データ領域に同一のプリセット情報を選択して適用したりすることによって、オーディオ信号を効率的に復元することができる。
第三に、プリセット情報が適用されて調節されたオブジェクト及び選択されたプリセットメタデータをディスプレイ部から確認することによって、より適切なプリセット情報を選択してオブジェクトの出力チャネルのレベルまたは位置を調節することができる。
本発明の更なる理解を提供するために添付され、組み込まれ、及び本明細書の一部を構成する図面は、本発明の実施例を説明し、明細書と共に、本発明の原理を説明する。
本発明の一実施例による、ダウンミックス信号に含まれたオブジェクトに適用されるプリセットモードの概念図である。 本発明の一実施例による、プリセット属性情報に基づいてプリセット情報を適用することによって、ダウンミックス信号に含まれたオブジェクトを調節する概念図である。 本発明の一実施例による、プリセット属性情報に基づいてプリセット情報を適用することによって、ダウンミックス信号に含まれたオブジェクトを調節する概念図である。 本発明の一実施例によるオーディオ信号処理装置を示す図である。 本発明の一実施例によってプリセット情報がレンダリング部に適用される方法を示すブロック図である。 本発明の一実施例によってプリセット情報がレンダリング部に適用される方法を示すブロック図である。 本発明の他の実施例による変動プリセット情報受信部及び固定プリセット情報受信部の概略的な構成を示すブロック図である。 本発明の他の実施例によるオーディオ信号処理装置を示す図である。 本発明の他の実施例によるオーディオ信号処理方法においてプリセット情報と関連したシンタックス(syntax)を様々な方法で表現したものである。 本発明の他の実施例によるオーディオ信号処理方法においてプリセット情報と関連したシンタックス(syntax)を様々な方法で表現したものである。 本発明の他の実施例によるオーディオ信号処理方法においてプリセット情報と関連したシンタックス(syntax)を様々な方法で表現したものである。 本発明の他の実施例によるオーディオ信号処理方法においてプリセット情報と関連したシンタックス(syntax)を様々な方法で表現したものである。 本発明の他の実施例によるオーディオ信号処理方法においてプリセット情報と関連したシンタックス(syntax)を様々な方法で表現したものである。 本発明のさらに他の実施例によるオーディオ信号処理装置を示す図である。 本発明のさらに他の実施例によるオーディオ信号処理装置のディスプレイ部の一例を示す図である。 本発明のさらに他の実施例によってプリセット情報が適用されたオブジェクトを表示する一つ以上の図形要素を示す図である。 本発明のさらに他の実施例による変動プリセット情報受信部と固定プリセットモード受信部が具現された製品の概略的な構成を示す図である。 本発明のさらに他の実施例による変動プリセットモード受信部及び固定プリセットモード受信部が具現された製品間の関係を示す図である。 本発明のさらに他の実施例による変動プリセットモード受信部及び固定プリセットモード受信部が具現された製品間の関係を示す図である。 本発明のさらに他の実施例による変動プリセットモード受信部及び固定プリセットモード受信部が具現された放送信号デコーディング装置の概略的な構成を示す図である。
本発明の更なる特徴及び利点は、以下の詳細な説明で記述され、部分的には、詳細な説明から明らかになるか、発明の実行から理解されるであろう。発明の目的及びその他の利点は、添付図面の他に、明細書及び請求項に特に記載された構成によって実現または獲得されるであろう。
上記目的を達成するために、本発明によるオーディオ信号処理方法は、一つ以上のオブジェクトを含むダウンミックス信号、前記ダウンミックス信号をレンダリングするためにプリセット情報及び前記プリセット情報の属性を表すプリセット属性情報を受信する段階と、前記プリセット属性情報に基づいて前記プリセット情報が構成情報領域に含まれた場合、前記プリセット情報を前記ダウンミックス信号の全データ領域に適用することによって前記ダウンミックス信号をレンダリングする段階と、前記プリセット属性情報に基づいてプリセット情報がデータ領域に含まれた場合、前記プリセット情報を前記ダウンミックス信号の対応する一つのデータ領域に適用することによって前記ダウンミックス信号をレンダリングする段階と、を含み、前記プリセット情報は、前記プリセット情報の個数を表すプリセット個数情報及び前記レンダリングされたダウンミックス信号の出力チャネルの個数を表す出力チャネル情報に基づいて獲得される。
前記プリセット情報は、前記オブジェクトの個数及び前記出力チャネルの個数に基づくプリセットマトリクスで構成することができる。
前記プリセット情報は、モノプリセット情報、ステレオプリセット情報及びマルチチャネルプリセット情報を含むことができる。
前記ダウンミックス信号をレンダリングする段階は、前記プリセット情報を用いて前記オブジェクトの出力レベルを調節する段階をさらに含むことができる。
前記プリセット属性情報は、前記プリセット情報が変動であるかまたは固定であるかを表すことができる。
前記プリセット情報は、前記構成情報領域の拡張領域または前記データ領域の拡張領域に含まれることができる。
また、上記目的を達成するために、本発明によるオーディオ信号処理装置は、一つ以上のオブジェクトを含むダウンミックス信号、前記ダウンミックス信号をレンダリングするためにプリセット情報及び前記プリセット情報の属性を表すプリセット属性情報を受信する信号受信部と、前記プリセット属性情報に基づいて前記プリセット情報が構成情報領域に含まれた場合、前記ダウンミックス信号の全データ領域に対応するプリセット情報及び前記プリセット情報に対応するプリセットメタデータを受信する固定プリセットモード受信部と、前記プリセット属性情報に基づいて前記プリセット情報がデータ領域に含まれた場合、前記ダウンミックス信号の一つのデータ領域に対応するプリセット情報及び前記プリセット情報に対応するプリセットメタデータを受信する変動プリセットモード受信部と、前記プリセット情報を前記ダウンミックス信号の全データ領域または一つのデータ領域に適用して前記ダウンミックス信号をレンダリングするレンダリング部と、を含み、前記プリセットメタデータは、前記プリセットメタデータの長さを表すプリセットメタデータ長情報に基づいて獲得し、前記プリセット情報は、前記プリセット情報の個数を表すプリセット個数情報及び前記レンダリングされたダウンミックス信号の出力チャネルの個数を表す出力チャネル情報に基づいて獲得することができる。
当然のことであるが、前記の一般的な記載、及び以下の詳細な記載は、典型的なもの、及び説明のためのものであり、請求項に記載される本発明の更なる説明を提供することを目的としている。
以下、添付の図面を参照しつつ、本発明の好適な実施例を詳細に説明する。ただし、本明細書及び請求の範囲に使われた用語や単語は、通常的または辞書的な意味に限定して解釈されるものではなく、発明者は自身の発明を最善の方法で説明するために用語の概念を適切に定義することができるという原則に立って、本発明の技術的思想に符合する意味と概念として解釈しなければならない。したがって、本明細書に記載された実施例と図面に示された構成は、本発明の最も好適な実施例に過ぎず、本発明の技術的思想を全部示すものではないため、本出願時点においてそれらに代替可能な様々な均等物と変形例が存在することができる。
特に、本明細書で情報(information)は、値(values)、パラメータ(parameters)、係数(coefficients)、成分(elements)などを総称する用語であり、その意味は場合によって適宜解釈すればいい。したがって、本発明はこれに限定されない。
図1は、本発明の実施例による、ダウンミックス信号に含まれたオブジェクトに適用されるプリセットモードの概念図である。オブジェクトを調節するために既に設定された情報の集合を本明細書ではプリセットモード(preset mode)と称する。プリセットモードは、オーディオ信号の特性または聴取環境によってユーザーが選択できる様々なモードを表すことができ、一つ以上を含むことができる。また、プリセットモードは、オブジェクトを調節するために適用されるプリセット情報(preset information)と、プリセット情報の属性などを表現するためのメタデータであるプリセットメタデータ(preset metadata)とを含む。プリセットメタデータは、テキストで表示することができ、プリセット情報の属性(例えば、コンサートホールモード、カラオケモード、ニュースモード等)を表す他、プリセット情報の作成者、作成日、プリセット情報の適用されるオブジェクト名などをはじめとする、プリセット情報を表現するための関連情報を含むことができる。一方、プリセット情報は、実質的にオブジェクトに適用されるデータで、プリセットメタデータと互いに対応し、様々な形態、例えば、マトリクス形態で表現することができる。
図1を参照すると、プリセットモード1は、音楽信号をコンサートホールで聞くような音場感を提供するコンサートホールモード(concert hall mode)とし、プリセットモード2は、オーディオ信号からボーカル(vocal)オブジェクトのレベルを減少させたカラオケモード(karaoke mode)とし、プリセットモードnは、音声オブジェクトのレベルを増加させたニュースモード(news mode)とすることができる。また、プリセットモードは、プリセットメタデータ及びプリセット情報を含む。もし、ユーザーによりプリセットモード2が選択された場合、プリセットメタデータ2のカラオケモード(karaoke mode)が表示され、このプリセットメタデータ2と関連したプリセット情報2がオブジェクトに適用されてレベルを調節することができる。
この場合、プリセット情報は、モノプリセット情報(mono preset information)、ステレオプリセット情報(stereo preset information)及びマルチチャネルプリセット情報(multi-channel preset information)を含むことができる。プリセット情報は、オブジェクトの出力チャネルによって決定される。モノプリセット情報は、オブジェクトの出力チャネルがモノである場合に適用されるプリセット情報であり、ステレオプリセット情報は、オブジェクトの出力チャネルがステレオである場合に適用されるプリセット情報であり、マルチチャネルプリセット情報は、オブジェクトの出力チャネルがマルチチャネルである場合に適用されるプリセット情報である。オブジェクトの出力チャネルが構成情報によって決定されると、決定された出力チャネルを用いてプリセット情報のタイプが決定され、当該プリセット情報をオブジェクトに適用してレベルまたはパニングを調節することができる。
図2A及び図2Bは、本発明の一実施例によるプリセット属性情報によってプリセット情報を適用して、ダウンミックス信号に含まれたオブジェクトを調節する概念図である。
まず、本発明のオーディオ信号は、エンコーダによりダウンミックス信号及びオブジェクト情報にエンコーディングされ、これらは一つのビットストリームまたは別個のビットストリームの形態でデコーダに転送される。
図2A及び図2Bを参照すると、ビットストリームに含まれたオブジェクト情報は、具体的に、構成情報領域と複数個のデータ領域(データ領域1、データ領域2、…、データ領域n)とで構成される。構成情報領域は、オブジェクト情報のビットストリームにおいて前部に位置している領域であり、オブジェクト情報の全データ領域に共通して適用される情報を含む。例えば、ツリー構造などを含む構成情報(configuration information)、データ領域長情報(data region length information)及びオブジェクトの個数情報(object number information)などを含むことができる。一方、データ領域は、データ領域長情報に基づいて全体オーディオ信号の時間ドメインを分割したユニットであり、フレームを含むことができる。オブジェクト情報のデータ領域は、ダウンミックス信号のデータ領域に対応し、対応するダウンミックス信号のデータ領域をアップミキシングするために用いられるオブジェクト情報を含む。オブジェクト情報は、オブジェクトレベル情報及びオブジェクトゲイン情報などを含む。
まず、本発明の一実施例によるオーディオ信号処理方法では、ビットストリームのオブジェクト情報からプリセット属性情報(preset_attribute_information)が読まれる。このプリセット属性情報は、プリセット情報がビットストリームのいずれの領域に含まれているかを表すもので、特に、プリセット情報がオブジェクト情報の構成情報領域に含まれるかまたはデータ領域に含まれるかを表す。プリセット属性情報の詳細な意味は、下記の表1の通りである。
Figure 0005249408
まず、図2Aを参照すると、プリセット属性情報が0であって、プリセット情報が構成情報領域に含まれることを表す場合、構成情報領域から抽出されたプリセット情報はダウンミックス信号の全データ領域に同一に適用されてレンダリングを行う。
一方、図2Bを参照すると、プリセット属性情報が1であって、プリセット情報がデータ領域に含まれることを表す場合、データ領域から抽出されたプリセット情報は、対応するダウンミックス信号のデータ領域に適用されてレンダリングを行う。例えば、データ領域1から抽出されたプリセット情報は、ダウンミックス信号のデータ領域1に適用され、データ領域nから抽出されたプリセット情報は、ダウンミックス信号のデータ領域nに適用されることができる。
また、プリセット属性情報は、プリセット情報が変動(dynamic)であるかあるいは固定(static)であるかを表すことができる。プリセット属性情報が0に設定され、プリセット情報が構成情報領域に含まれることを示す場合、プリセット情報は固定(static)とされうる。一方、プリセット属性情報が1に設定され、プリセット情報がデータ領域に含まれる場合、プリセット情報は変動(dynamic)とされうる。この場合、プリセット情報は該当のデータ領域にのみ適用されて、対応するデータ領域のダウンミックス信号をレンダリングするので、データ領域別に変動的に適用される。この時、プリセット情報は、変動(dynamic)である場合は、データ領域の拡張領域(extension region)に存在することが好ましく、固定(static)である場合は、構成情報領域の拡張領域に存在することが好ましい。
したがって、本発明の一実施例によるオーディオ信号処理方法は、プリセット属性情報によって、音源の特性に基づいてデータ領域別に適切なプリセット情報を用いたり、同一のプリセット情報を全データ領域に用いたりして、ダウンミックス信号をレンダリングすることが可能になる。
図3は、本発明の実施例によるオーディオ信号処理装置300を示す図である。
図3を参照すると、オーディオ信号処理装置300は、プリセットモード生成部310、情報受信部(図示せず)、変動プリセットモード受信部320、固定プリセットモード受信部330、レンダリング部340を含むことができる。
プリセットモード生成部310は、オーディオ信号に含まれたオブジェクトをレンダリング時に調節するためのプリセットモードを生成し、プリセット属性情報生成部311、プリセットメタデータ生成部312及びプリセット情報生成部313を含むことができる。
プリセット属性情報生成部311は、上述した通り、プリセット情報を構成情報領域に含めて全データ領域に適用するか、あるいは、データ領域に含めてデータ領域別に適用するかを表すプリセット属性情報を決定する。
続いて、プリセットメタデータ生成部312及びプリセット情報生成部313は、一つのプリセットメタデータ及びプリセット情報、またはダウンミックス信号のデータ領域数だけのプリセットメタデータ及びプリセット情報を生成することができる。
プリセットメタデータ生成部312は、プリセット情報を表現するテキストを受信してプリセットメタデータ(preset metadata)を生成することができる。一方、オブジェクトのレベルを調節するためのゲイン及び/またはオブジェクトの位置がプリセット情報生成部313に入力される場合、当該オブジェクトに適用されるプリセット情報を生成することができる。
プリセット情報は、オブジェクトごとに適用されるように生成することができ、様々なタイプとすることができ、例えば、チャネルレベル差(CLD:Channel Level Difference)パラメータ、マトリクス(matrix)などを含むことができる。
また、プリセット情報生成部313は、オブジェクトの出力チャネルの数を表す出力チャネル情報(output channel information)をさらに生成することができる。
プリセットメタデータ生成部312で生成されたプリセットメタデータ及びプリセット情報生成部313で生成されたプリセット情報、出力チャネル情報などは、一つのビットストリームに含まれて転送されることができ、特に、ダウンミックス信号を含むビットストリームの補助領域(ancillary region)に含まれて転送されることができる。
一方、プリセットモード生成部310は、プリセットメタデータ、プリセット情報及び出力チャネル情報がビットストリームに含まれたことを表すプリセット存在情報(preset presence information)をさらに生成することができる。プリセット存在情報は、プリセット情報などがビットストリームのどの領域に含まれているかを表すコンテナタイプ(container type)とすることもでき、どの領域に含まれているかを表さずに、単にビットストリームに含まれたか否かを表すフラグタイプ(flag type)とすることもできるが、これに限定されることはない。
また、プリセットモード生成部310は、複数個のプリセットモードを生成することができ、それぞれのプリセットモードは、プリセット情報、プリセットメタデータ及び出力チャネル情報を含む。ここで、プリセットモード生成部310は、プリセットモードの個数を表すプリセット個数情報(preset number information)をさらに生成することができる。
このように、プリセットモード生成部310は、プリセット属性情報、プリセットメタデータ及びプリセット情報をビットストリームの形態にして出力することができる。
ビットストリームは、図2A及び図2Bに示すような形態を有し、情報受信部(図示せず)に入力される。情報受信部(図示せず)に入力されたビットストリームからまずプリセット属性情報を獲得し、プリセット情報が、転送されたビットストリームのどの領域に含まれたかを決定する。
変動プリセットモード受信部320は、プリセット属性情報生成部311から出力されるプリセット属性情報に基づいて、プリセット情報がデータ領域に含まれる場合(表1のpreset_attribute_flag=1の場合)、作動する。
変動プリセットモード受信部320は、該当のデータ領域に対応するプリセットメタデータを受信する変動プリセットメタデータ受信部321及びデータ領域別プリセット情報を受信する変動プリセット情報受信部322を含むことができる。変動プリセットメタデータ受信部321は、選択されたプリセットメタデータを受信して出力し、変動プリセット情報受信部322はプリセット情報を受信する。これについての詳細は、図4A乃至図5を参照して後述する。
固定プリセットモード受信部330は、プリセット属性情報に基づいて、プリセット情報が構成情報領域に含まれる場合(表1のpreset_attribute_flag=0の場合)、作動する。
固定プリセットモード受信部330は、全データ領域に対応するプリセットメタデータを受信する固定プリセットメタデータ受信部331及びプリセット情報を受信する固定プリセット情報受信部332を含むことができる。
固定プリセットモード受信部330の固定プリセットメタデータ受信部331及び固定プリセット情報受信部332は、変動プリセットモード受信部320の変動プリセットメタデータ受信部321及び変動プリセット情報受信部322と略同様の構成及び機能を有しているが、受信されて出力されるプリセット情報及びプリセットメタデータに対応するダウンミックス信号の範囲が異なる。
レンダリング部340は、複数個のオブジェクトを含むオーディオ信号をダウンミキシングして生成されたダウンミックス信号と変動プリセット情報受信部322から出力されたプリセット情報または固定プリセット情報受信部332から出力されたプリセット情報を受信する。このプリセット情報は、ダウンミックス信号に含まれたオブジェクトに適用されてオブジェクトのレベルを調節したりオブジェクトの位置を調節したりすることができる。
また、オーディオ信号処理装置300がディスプレイ部(図示せず)を含む場合、変動プリセットメタデータ受信部321から出力される選択されたプリセットメタデータまたは固定プリセットメタデータ受信部331から出力される選択されたプリセットメタデータは、ディスプレイ部に表示されることができる。
図4A及び図4Bは、本発明の実施例によるプリセット情報がレンダリング部に適用される方法を示すブロック図である。
まず、図4Aは、変動プリセットモード受信部320から出力されたプリセット情報が、レンダリング部440に適用される方法を示す図である。変動プリセットモード受信部320は、図3における変動プリセットモード受信部320と同一であり、変動プリセットメタデータ受信部321及び変動プリセット情報受信部322を含む。
変動プリセットモード受信部320は、データ領域ごとにプリセットメタデータ及びプリセット情報を受信して出力し、このプリセット情報はレンダリング部440に入力される。
レンダリング部440は、プリセット情報の他に、ダウンミックス信号も受信して、データ領域別にレンダリングを行い、データ領域1のレンダリング部441、データ領域2のレンダリング部442、…、データ領域nのレンダリング部44nを含む。ここで、レンダリング部440のそれぞれのデータ領域レンダリング部44Xは、それぞれデータ領域に対応するプリセット情報を受信してダウンミックス信号に適用することによってレンダリングする。
例えば、1番目のデータ領域は、スタジアムモードであるプリセット情報_1が適用され、2番目のデータ領域は、カラオケモードであるプリセット情報_3が適用され、6番目のデータ領域は、ニュースモードであるプリセット情報_2(ここで、プリセット情報_nのnは、データ領域モードのインデックスを表す。)が適用されることができる。この場合、プリセットメタデータもデータ領域ごとに出力されることは勿論である。
図4Bは、固定プリセットモード受信部330から出力されたプリセット情報が、レンダリング部440で適用される方法を示す図である。固定プリセットモード受信部330は、図3の固定プリセットモード受信部330と同一に構成される。
固定プリセットモード受信部330は、ダウンミックス信号の全データ領域に対応するプリセットメタデータ及びプリセット情報を受信して出力する。レンダリング部440は、プリセット情報を受信する。
図4Bに示されるレンダリング部440は、図4Aのレンダリング部と同様に、データ領域数だけのデータ領域レンダリング部44Xを含む。レンダリング部440は、固定プリセットモード受信部330からプリセット情報を受信する場合、全てのデータ領域レンダリング部44Xが受信したプリセット情報をダウンミックス信号に同一に適用することによってレンダリングする。
例えば、固定プリセット情報受信部332から出力されたプリセット情報がニュースモードを表すプリセット情報2の場合、1番目のデータ領域からn番目のデータ領域まで全データ領域にニュースモードを適用することができる。
図5は、本発明のオーディオ信号処理装置300の変動プリセットモード受信部320に含まれる変動プリセット情報受信部322、及び固定プリセットモード受信部330に含まれる固定プリセット情報受信部332の概略的な構成を示す図である。
変動または固定プリセット情報受信部322,332は、出力チャネル情報受信部322a,332a及びプリセット情報決定部322b,332bを含む。
出力チャネル情報受信部322a,332aは、ダウンミックス信号に含まれたオブジェクトがいくつの出力チャネルに再生されるかを表す出力チャネル情報を受信して出力する。この出力チャネル情報は、モノチャネル、ステレオチャネルまたはマルチチャネル(5.1チャネル)とすることができるが、これに限定されることはない。
プリセット情報決定部322b,332bは、出力チャネル情報受信部322a,332bから入力された出力チャネル情報に基づいて、該当するプリセット情報を受信して出力する。このプリセット情報は、モノプリセット情報、ステレオプリセット情報またはマルチチャネルプリセット情報のうちの一つとすることができる。
プリセット情報がマトリクスタイプである場合は、該プリセット情報の次元は、オブジェクトの数及び出力チャネルの数に基づいて決定することができ、プリセットマトリクスは、(オブジェクトの数)*(出力チャネルの数)の形態を有することができる。例えば、ダウンミックス信号に含まれたオブジェクトがn個であり、出力チャネル情報受信部322a,332aからの出力チャネルが5.1チャネル、すなわち、6個のチャネルである場合、プリセット情報決定部322b,332bは、n*6形態としたマルチチャネルプリセット情報を出力することができる。ここで、マトリクスの成分(element)は、a番目のオブジェクトがi番目のチャネルに含まれる程度を表すゲイン値である。
図6は、本発明の他の実施例によるオーディオ信号処理装置600を示す図である。
オーディオ信号処理装置600は、主に、ダウンミキシング部610、オブジェクト情報生成部620、プリセットモード生成部630、ダウンミックス信号処理部640、情報処理部650及びマルチチャネルデコーディング部660を含む。
複数個のオブジェクトはダウンミキシング部610に入力されて、モノまたはステレオダウンミックス信号を生成する。また、複数個のオブジェクトは、オブジェクト情報生成部620に入力されて、オブジェクトのレベルを表すオブジェクトレベル情報と、ダウンミックス信号に含まれるオブジェクトのゲイン値及びステレオダウンミックス信号である場合にダウンミックスチャネルに含まれるオブジェクトの程度を含むオブジェクトゲイン情報と、オブジェクト間の関連有無を表すオブジェクト関連情報と、を含むオブジェクト情報を生成する。
その後、ダウンミックス信号及びオブジェクト情報は、プリセットモード生成部630に入力されて、プリセット情報がビットストリームにおいてデータ領域に含まれるかまたはビットストリームにおいて構成情報領域に含まれるかを表すプリセット属性情報、オブジェクトのレベルを調節するためのプリセット情報、及びプリセット情報を表現するためのプリセットメタデータを含むプリセットモードを生成する。プリセット属性情報、プリセット情報及びプリセットメタデータを生成する過程は、図1乃至図5におけるオーディオ信号処理装置及び方法で上述した通りであるから、その詳細な説明は省略する。
また、プリセットモード生成部630は、プリセット情報がビットストリームに存在するか否かを表すプリセット存在情報、プリセット情報の個数を表すプリセット個数情報及びプリセットメタデータの長さを表すプリセットメタデータ長情報をさらに生成することができる。
オブジェクト情報生成部620で生成されたオブジェクト情報とプリセットモード生成部630で生成されたプリセット属性情報、プリセット情報、プリセットメタデータ、プリセット存在情報、プリセット個数情報及びプリセットメタデータ長情報は、SAOCビットストリームに含まれて転送されることができ、ダウンミックス信号も含まれた一つのビットストリームの形態として転送されることができる。この場合、ダウンミックス信号及びプリセット関連情報を含むビットストリームは、デコーディング装置の信号受信部(図示せず)に入力されることができる。
情報処理部650は、オブジェクト情報処理部651、変動プリセットモード受信部652及び固定プリセットモード受信部653を含み、SAOCビットストリームを受信する。SAOCビットストリームが変動プリセットモード受信部652に入力されるかまたは固定プリセットモード受信部653に入力されるかは、図2乃至図5を参照して上述した通り、SAOCビットストリームに含まれたプリセット属性情報に基づいて決定される。
変動プリセットモード受信部652及び固定プリセットモード受信部653は、SAOCビットストリームから上記のプリセット属性情報、プリセット存在情報、プリセット個数情報、プリセットメタデータ、出力チャネル情報及びプリセット情報(例えば、プリセットマトリクス)を受信し、図1乃至図5のオーディオ信号処理方法及び装置で説明された様々な実施例による方法を用いる。
変動プリセットモード受信部652または固定プリセットモード受信部653は、プリセットメタデータとプリセット情報を出力する。
オブジェクト情報処理部651は、出力されたプリセットメタデータとプリセット情報を受信し、SAOCビットストリームに含まれるオブジェクト情報と共に、受信したプリセットメタデータとプリセット情報を用いて、ダウンミックス信号を前処理(pre-processing)するためのダウンミックス処理情報とダウンミックス信号をレンダリングするためのマルチチャネル情報を生成する。この場合、変動プリセットモード受信部652から出力されるプリセット情報及びプリセットメタデータは、ダウンミックス信号の一つのデータ領域に対応するもので、固定プリセットモード受信部653から出力されるプリセット情報及びプリセットメタデータは、ダウンミックス信号の全体データ領域に対応するものである。
その後、ダウンミックス処理情報は、ダウンミックス信号処理部640に入力され、ダウンミックス信号に含まれたオブジェクトが含まれるチャネルを変動させることによってパニングを行うことができる。このように前処理されたダウンミックス信号は、情報処理部650から出力されたマルチチャネル情報と一緒にマルチチャネルデコーディング部660に入力されてアップミキシングされることで、マルチチャネルオーディオ信号を生成することができる。
このように、本発明のオーディオ信号処理装置は、複数個のオブジェクトを含むダウンミックス信号を、オブジェクト情報を用いてマルチチャネル信号にデコーディングする際に、既に設定されたプリセット情報及びプリセットメタデータをさらに用いることによって容易にオブジェクトのレベルを調節することができる。また、この時、オブジェクトに適用されるプリセット情報は、プリセット属性情報に基づいてデータ領域ごとに個別に適用されたり、全体データ領域に同一に適用されることによって、音源の特性によって適切に音場感を向上させることができる。
図7乃至図11は、本発明の他の実施例によるオーディオ信号処理方法を示すシンタックス(syntax)を様々な方法で表現したものである。
図7を参照すると、プリセット情報と関連した情報は、ビットストリームの構成情報領域(SAOC Specific Config())に存在することができる。
まず、ビットストリームの構成情報領域からプリセット個数情報(bsNumPresets)を獲得することができる。また、プリセット個数情報に基づいてプリセット情報(i番目のプリセット情報)ごとにプリセット情報が適用されるオブジェクトの出力チャネルを表す出力チャネル情報(bsPresetLevel[i])を獲得することができる。この出力チャネル情報の意味は、下記の表2の通りである。
Figure 0005249408
その後、プリセット情報が構成情報領域に含まれるのか或いはデータ領域に含まれるかを表すプリセット属性情報(bsPresetDynamic[i])を獲得することができる。図7に示すように、プリセット属性情報(bsPresetDynamic[i])が0の場合、固定プリセットモード(static preset mode)を表し、全データ領域に対応してダウンミックス信号のオブジェクトレベルまたはパニングを調節するためのプリセット情報(getPreset())を獲得する。この時、プリセットメタデータ(PresetMetaData(numPresets))もプリセット情報に対応して構成情報領域に含まれることができる。このプリセット属性情報の意味は、下記表3の通りである。
Figure 0005249408
図8は、図7に示されるプリセット属性情報(bsPresetDynamic[i])が、プリセット情報がデータ領域に含まれることを示す場合、データ領域情報に対するシンタックスを表現したものである。
図8を参照すると、図7のプリセット属性情報(bsPresetDynamic[i])が1の場合、「if(!bsPresetDynamic[i])」ループを外れるので、構成情報領域からプリセット情報を獲得しない。その後、図8に示すように、データ領域で(SAOCFrame() {if(bsPresetDynamic[i])})条件を満たすので、プリセット情報(getPreset())を獲得することができる。このプリセット情報はデータ領域から獲得されるので、図7のプリセット情報が全体データ領域に同一に適用されることと違い、該当のデータ領域にのみ適用されることができる。
一方、図7及び図8では、プリセット情報が構成情報領域(SAOCSpecificConfig())及びデータ領域(SAOCFrame())に含まれているが、構成情報領域拡張領域(SAOCExtensionConfig())及びデータ領域拡張領域(SAOCEXtensionFrame())に含まれることもできる。
この時、構成情報領域拡張領域及びデータ領域拡張領域に含まれるプリセット情報は、図7及び図8を参照して説明されたプリセット情報と同一である。また、構成情報領域拡張領域及びデータ領域拡張領域は、プリセット情報の他に、プリセット情報に対応するプリセットメタデータ、出力チャネル情報、プリセット存在情報などをさらに含むこともできる。
図9は、本発明の他の実施例によるプリセット情報を表すシンタックスである。
図9を参照すると、プリセット情報は、EcDataを用いて生成されたものとすることができる。一方、プリセット情報は、EcDataではなくゲイン値自体を転送して用いる方法を利用することができ、チャネル差情報(CLD)テーブルを用いて量子化する方法の他、別の独立したテーブルを用いて量子化することもできる。
図10は、本発明の他の実施例によるプリセットメタデータを表すシンタックスである。
図10に示すように、プリセットメタデータは、まず、プリセット情報に対応するメタデータの長さを表すプリセットメタデータ長情報(bsNumCharMetaData[prst])を獲得する。以降、プリセットメタデータ長情報に基づいてプリセット情報ごとに各プリセット情報に対応するプリセットメタデータ(bsMetaData[prst])を獲得することができる。
このように、プリセット情報を表現するプリセットメタデータを、メタデータの長さを表すプリセット長情報に基づいてテキスト形態で表現することによって、本発明のオーディオ信号処理方法及び装置は余分のコーディングを減らすことができる。
図11は、本発明のさらに他の実施例によるプリセット情報を含むデータ領域のシンタックスである。
図11を参照すると、プリセット情報は、オブジェクトの数(numObjects)に基づいてオブジェクト別に出力チャネル(numRenderingChannel[i])にマッピングされる情報を転送することができる。図11に示すように、プリセット情報は、ビットストリームのデータ領域から獲得することができるが、データ領域拡張領域に含まれた場合にはデータ領域拡張領域(SAOCExtensionFrame())、ビットストリームの構成情報領域に含まれた場合には構成情報領域から獲得することができる。
図12は、本発明のさらに他の実施例によるオーディオ信号処理装置1200を示す図である。
オーディオ信号処理装置1200は、主に、プリセットモード生成部1210、情報受信部(図示せず)、プリセットモード入力部1220、プリセットモード選択部1230、変動プリセットモード受信部1240、固定プリセットモード受信部1250、レンダリング部1260及びディスプレイ部1270を含む。
図12のプリセットモード生成部1210、情報受信部(図示せず)、変動プリセットモード受信部1240、固定プリセットモード受信部1250及びレンダリング部1260は、図3のプリセットモード生成部310、変動プリセットモード受信部320、固定プリセットモード受信部330及びレンダリング部340と同一の構成及び機能を有するので、詳細な説明は省略する。
図12を参照すると、プリセットモード入力部1220は、プリセットメタデータ生成部1212から受信した複数個のプリセットメタデータをまずディスプレイ部1270の画面に表示し、これらのうち一つのプリセットメタデータを選択する選択信号を受信する。プリセットモード選択部1230は、選択信号によって選択された一つのプリセットメタデータと該プリセットメタデータに対応するプリセット情報を選択する。
この時、プリセット属性情報生成部1211から受信するプリセット属性情報(preset_attribute_information)が、プリセット情報がデータ領域に含まれることを表す場合、プリセットモード選択部1230で選択されたプリセットメタデータと該プリセットメタデータと対応するプリセット情報を、変動プリセットモード受信部1240の変動プリセットメタデータ受信部1241及び変動プリセット情報受信部1242にそれぞれ入力する。この場合、ディスプレイ部1270、プリセットモード入力部1220及びプリセットモード選択部1230は、データ領域の数だけ反復して上記動作を行うことができる。
一方、プリセット属性情報生成部1211から受信するプリセット属性情報が、プリセット情報が構成情報領域に含まれることを表す場合、プリセットモード選択部1220で選択されたプリセットメタデータと該プリセットメタデータと対応するプリセット情報を、固定プリセットモード受信部1250の固定プリセットメタデータ受信部1251及び固定プリセット情報受信部1252にそれぞれ入力する。
また、選択されたプリセット情報は、レンダリング部1260に出力される反面、選択されたプリセットメタデータはディスプレイ部1270に出力されて画面に表示される。
ディスプレイ部1270は、プリセットモード入力部1220が選択信号を受信できるように複数個のプリセットメタデータを表示するユニットと同一のユニットとすることができ、それぞれ異なるユニットとすることもできる。ディスプレイ部1270とプリセットモード入力部1220のためにプリセットメタデータを表示するディスプレイ部が同一のユニットを用いる場合、画面に表示される説明(例えば、「プリセットモードを選択してください」、「プリセットモードXが選択されました」等)、視覚オブジェクト、文字などを異ならせて構成することによって、それぞれの動作を区別することができる。
図13は、オーディオ信号処理装置1200のディスプレイ部1270の一例を示す図である。
ディスプレイ部1270は、選択されたプリセットメタデータの他に、プリセットメタデータに対応するプリセット情報を用いて調節されたオブジェクトのレベルまたは位置を表す一つ以上の図形要素を含むことができる。
図13を参照すると、まず、図12のディスプレイ部1270に表示された複数個のプリセットメタデータ(例えば、スタジアムモード、洞窟(cave)モード、ニュースモード、ライブモード等)のうち、プリセットモード選択部1230を通じてニュースモードが選択された場合、ニュースモードに対応するプリセット情報が、ダウンミックス信号に含まれた各オブジェクトに適用される。この場合、ボーカルのレベルは増加し、他のオブジェクト(ギター、バイオリン、ドラム、…、チェロ)のレベルは減少する。
ディスプレイ部1270に含まれた図形要素は、オブジェクトのレベルまたは位置の差動または変化を表すために変形される。例えば、図13に示すように、ボーカルを表す図形要素のスイッチは右に移動し、他のオブジェクトを表す図形要素のスイッチは左に移動することができる。
図形要素は、様々な方法でプリセット情報を用いて調節されたオブジェクトのレベルまたは位置を表すことができる。各オブジェクトを表す図形要素は一つ以上とすることができ、この場合、第1図形要素は、プリセット情報を適用する前のオブジェクトのレベルまたは位置を表し、第2図形要素は、プリセット情報を適用して調節されたオブジェクトのレベルまたは位置を表すことができる。この場合、プリセット情報を適用する前後のオブジェクトのレベルまたは位置を容易に比較できるので、プリセット情報が各オブジェクトをどのように調節するかが容易にわかる。
図14は、プリセット情報が適用されたオブジェクトを表す他の形状の一つ以上の図形要素を示す図である。
図14を参照すると、第1図形要素はバー(bar)形態とし、第2図形要素は、第1図形要素内の延長線(extensive line)とすることができる。ここで、第1図形要素は、プリセット情報を適用する前のオブジェクトのレベルまたは位置を表し、第2図形要素は、プリセット情報を適用して調節されたオブジェクトのレベルまたは位置を表す。
図14に示すように、上端の図形要素は、プリセット情報が適用される前のオブジェクトのレベルが、適用された後のオブジェクトのレベルと同一の場合を示す。中央の図形要素は、プリセット情報が適用されて調節されたオブジェクトのレベルが、適用前よりも大きい場合を示し、下端の図形要素は、プリセット情報が適用されることによってオブジェクトのレベルが減少した場合を示す。
このように、プリセット情報を適用する前と適用した後のオブジェクトのレベルまたは位置を表す一つ以上の図形要素を使用することによって、プリセット情報が各オブジェクトをどのように調節するかが容易にわかる。なお、これにより、プリセット情報の特徴を容易に把握できるので、必要に応じてユーザーが適切なプリセットモードを選択するのに役立つことができる。
図15は、本発明のさらに他の実施例による変動プリセットモード受信部及び固定プリセットモード受信部が具現された製品の概略的な構成を示す図であり、図16A及び図16Bは、本発明の実施例による変動プリセットモード受信部及び固定プリセットモード受信部が具現された製品間の関係を示す図である。
図15を参照すると、有無線通信部1510は、有無線通信方式を通じてビットストリームを受信する。具体的に、有無線通信部1510は、有線通信部1511、赤外線通信部1512、ブルトゥース部1513、無線LAN通信部1514のうち一つ以上を含むことができる。
ユーザー認証部1520は、ユーザー情報を受信してユーザー認証を行うもので、指紋認識部1521、虹彩認識部1522、顔面認識部1523、及び音声認識部1524のうち一つ以上を含むことができる。この場合、ユーザー認証は、それぞれ、指紋、虹彩情報、顔面輪郭情報、音声情報を受信してユーザー情報に変換し、ユーザー情報と既存登録されているユーザーデータとが一致するか否か判断して、ユーザー認証を行うことができる。
入力部1530は、ユーザーが様々な種類の命令を入力するための入力装置であり、キーパッド部1531、タッチパッド部1532、リモコン部1533のうちの一つ以上を含むことができるが、本発明はこれに限定されるわけではない。一方、後述する変動プリセットモード受信部1541から出力される複数個のプリセット情報に対するプリセットメタデータが、ディスプレイ部1562を通じて画面に表示される場合、入力部1530を通じてユーザーがプリセットメタデータを選択することができ、選択されたプリセットメタデータに関する情報が制御部1550に入力される。
信号デコーディング部1540は、変動プリセットモード受信部1541及び固定プリセットモード受信部1542を含み、変動プリセットモード受信部1541は、プリセット属性情報に基づいて、各データ領域に対応するプリセット情報及びプリセットメタデータを受信する。また、固定プリセットモード受信部1542は、プリセット属性情報に基づいて、全データ領域に対応するプリセット情報及びプリセットメタデータを受信する。また、プリセットメタデータは、メタデータの長さを表すプリセットメタデータ長情報に基づいて受信され、プリセット情報は、プリセット情報が存在するか否かを表すプリセット存在情報、プリセット情報の個数を表すプリセット個数情報及び出力チャネルの個数に基づく、例えば、出力チャネルがモノ、ステレオ及びマルチチャネルのうち一つであることを表す出力チャネル情報に基づいて獲得される。もし、プリセット情報がマトリクスで表現された場合、出力チャネル情報を受信し、これに基づいてプリセットマトリクスを受信する。
信号デコーディング部1540は、受信したビットストリーム、プリセットメタデータ、及びプリセット情報を用いてオーディオ信号をデコーディングして出力信号を生成し、プリセットメタデータをテキストの形態として出力する。
制御部1550は、入力装置から入力信号を受信し、信号デコーディング部1540と出力部1560のプロセス全般を制御する。上述の通り、制御部1550に、入力部1530から選択されたプリセットメタデータに関する情報が入力信号の形態として入力され、有無線通信部1510から、プリセット情報がビットストリームのどの領域に含まれるかを表すプリセット属性情報(preset_attribute_information)が入力される場合、変動プリセットモード受信部1541及び固定プリセットモード受信部1542は、プリセット属性情報及び入力信号に基づいて、選択されたプリセットメタデータと対応するプリセット情報を受信し、これを用いてオーディオ信号をデコーディングする。
出力部1560は、信号デコーディング部1540により生成された出力信号などが出力される構成要素で、スピーカー部1561及びディスプレイ部1562を含むことができる。出力信号がオーディオ信号の場合、出力信号はオーディオ信号出力部1561から出力され、ビデオ信号の場合、出力信号はディスプレイ部1562から出力される。また、制御部1550から入力されたプリセットメタデータをディスプレイ部1562を通じて画面に表示する。
図16は、図15に示す製品に該当する端末間の関係及び端末とサーバーとの関係をそれぞれ示す図である。
図16の(A)を参照すると、第1端末1610及び第2端末1620が、有無線通信部を通じてデータまたはビットストリームを両方向に通信できることがわかる。
有無線通信部を通じて通信するデータまたはビットストリームは、図2A及び図2Bに示すビットストリームの形態としても良く、図1乃至図15を参照して説明した本発明のプリセット属性情報、プリセット情報、プリセットメタデータなどを含むデータとしても良い。
図16の(B)を参照すると、サーバー1630及び第1端末1640も互いに有無線通信を行うことができる。
図17は、本発明の一実施例によるメタデータ受信部及びプリセットレンダリングデータ受信部を含むプリセット受信部が具現された放送信号デコーディング装置1700の概略的な構成を示す図である。
図17を参照すると、デマルチプレクサ1720は、チューナー1710からTV放送と関連したデータを受信する。受信されたデータはデマルチプレクサ1720で分離され、データデコーダ1730でデコーディングされる。一方、デマルチプレクサ1720で分離されたデータは、HDDのような記憶媒体1750に記憶されることができる。
デマルチプレクサ1720で分離されたデータは、オーディオデコーダ1741及びビデオデコーディング部1742を含むデコーダ1740に入力されて、オーディオ信号及びビデオ信号をデコーディングする。オーディオデコーダ1741は、本発明の一実施例による変動プリセットモード受信部1741A及び固定プリセットモード受信部1741Bを含み、変動プリセットモード受信部1741Aは、プリセット属性情報に基づいて各データ領域に対応するプリセット情報及びプリセットメタデータを受信する。また、固定プリセットモード受信部1741Bは、プリセット属性情報に基づいて全データ領域に対応するプリセット情報及びプリセットメタデータを受信する。
また、プリセットメタデータは、メタデータの長さを表すプリセットメタデータ長情報に基づいて受信され、プリセット情報は、プリセット情報が存在するか否かを表すプリセット存在情報、プリセット情報の個数を表すプリセット個数情報、及び出力チャネルがモノ、ステレオ及びマルチチャネルのうち一つであることを表す出力チャネル情報に基づいて獲得される。もし、プリセット情報がマトリクスで表現された場合、出力チャネル情報を受信してこれに基づいてプリセットマトリクスを受信する。
オーディオデコーダ1741は、受信されたビットストリーム、プリセットメタデータ、及びプリセット情報を用いてオーディオ信号をデコーディングして出力信号を生成し、プリセットメタデータをテキスト形態として出力する。
ディスプレイ部1770は、ビデオデコーディング部1742から出力されたビデオ信号とオーディオデコーダ1741から出力されたプリセットメタデータを画面に表示する。また、ディスプレイ部1770は、スピーカー部(図示せず)を含み、オーディオデコーダ1741から出力されるオブジェクトのレベルがプリセット情報を用いて調節されたオーディオ信号を、ディスプレイ部1770に含まれたスピーカー部から出力する。また、デコーダ1740でデコーディングされたデータは、HDDのような記憶媒体1750に記憶することができる。
一方、放送信号デコーディング装置1700は、ユーザーから情報を受信し、受信したデータを制御できるアプリケーションマネジャー1760をさらに含むことができる。
アプリケーションマネジャー1760は、ユーザーインターフェースマネジャー1761及びサービスマネジャー1762を含む。ユーザーインターフェースマネジャー1761は、ユーザーから情報を受信するためのインターフェース(interface)を制御する。例えば、ディスプレイ部1770に表示されるテキストの書体、画面の明るさ、メニュー構成などを制御することができる。一方、サービスマネジャー1762は、デコーダ1740及びディスプレイ部1770で放送信号をデコーディングして出力する場合、受信される放送信号を、ユーザーから入力される情報を用いて制御できる。例えば、放送チャネルの設定、アラーム機能設定、成人認証機能などを提供することができる。アプリケーションマネジャー1760から出力されるデータは、デコーダ1740の他に、ディスプレイ部1770にも転送されて利用可能である。
以上では具体的な実施例及び図面に基づいて本発明を説明してきたが、本発明は、それらの具体例に限定されず、本発明の属する技術分野における通常の知識を有する者にとっては、本発明の技術思想及び添付の特許請求の範囲とその均等範囲内で様々な修正及び変形が可能であるということは明らかである。
本発明は、オーディオ信号をエンコーディング及びデコーディングするのに適用することができる。

Claims (14)

  1. 少なくとも一つのオブジェクトを含むダウンミックス信号と、プリセット情報及びプリセット属性情報を含むプリセットモードを受信する段階であって、前記プリセット情報は前記ダウンミックス信号をレンダリング前記プリセット属性情報は前記プリセット情報の属性を表す段階と、
    前記プリセット属性情報に基づいて、構成情報領域内の前記プリセット情報を、該構成情報領域内の前記プリセット情報が適用される前記ダウンミックス信号のデータ領域に適用することによって前記ダウンミックス信号をレンダリングする段階と、
    前記プリセット属性情報に基づいて、データ領域内の前記プリセット情報を、前記ダウンミックス信号の対応する一つのデータ領域に適用することによって前記ダウンミックス信号をレンダリングする段階と、
    を含み、
    前記プリセット情報は、前記プリセットモードの個数を表すプリセット個数情報及び前記レンダリングされたダウンミックス信号の出力チャネルの個数を表す出力チャネル情報に基づいて獲得されることを特徴とするオーディオ信号処理方法。
  2. 前記プリセット情報は、前記オブジェクトの個数及び前記出力チャネルの個数に基づくプリセットマトリクスであることを特徴とする、請求項1に記載のオーディオ信号処理方法。
  3. 前記プリセット情報は、モノプリセット情報、ステレオプリセット情報及びマルチチャネルプリセット情報を含むことを特徴とする、請求項1に記載のオーディオ信号処理方法。
  4. 前記ダウンミックス信号をレンダリングする段階は、前記プリセット情報を用いて前記オブジェクトの出力レベルを調節する段階をさらに含むことを特徴とする、請求項1に記載のオーディオ信号処理方法。
  5. 前記プリセット属性情報は、前記プリセット情報が変動であるか固定であるかを表すことを特徴とする、請求項1に記載のオーディオ信号処理方法。
  6. 前記プリセット情報は、前記構成情報領域の拡張領域または前記データ領域の拡張領域に含まれることを特徴とする、請求項1に記載のオーディオ信号処理方法。
  7. 少なくとも一つのオブジェクトを含むダウンミックス信号と、プリセット情報及びプリセット属性情報を含むプリセットモードを受信する信号受信部であって、前記プリセット情報は前記ダウンミックス信号をレンダリング前記プリセット属性情報は前記プリセット情報の属性を表す、信号受信部と、
    前記プリセット属性情報に基づいて、構成情報領域内の前記プリセット情報を、該構成情報領域内の前記プリセット情報が適用される前記ダウンミックス信号のデータ領域に適用し、データ領域内の前記プリセット情報を前記ダウンミックス信号の対応する一つのデータ領域に適用することにより、前記ダウンミックス信号をレンダリングするレンダリング部と、
    を含み、
    前記プリセット情報は、前記プリセットモードの個数を表すプリセット個数情報及び前記レンダリングされたダウンミックス信号の出力チャネルの個数を表す出力チャネル情報に基づいて獲得されることを特徴とするオーディオ信号処理装置。
  8. 前記プリセット情報は、前記オブジェクトの個数及び前記出力チャネルの個数に基づくプリセットマトリクスを表すことを特徴とする、請求項7に記載のオーディオ信号処理装置。
  9. 前記プリセット情報は、モノプリセット情報、ステレオプリセット情報及びマルチチャネルプリセット情報を含むことを特徴とする、請求項7に記載のオーディオ信号処理装置。
  10. 前記レンダリング部は、前記プリセット情報を用いて前記オブジェクトの出力レベルを調節することを特徴とする、請求項9に記載のオーディオ信号処理装置。
  11. 前記プリセット情報は、前記構成情報領域の拡張領域または前記データ領域の拡張領域に含まれることを特徴とする、請求項7に記載のオーディオ信号処理装置。
  12. 前記プリセット属性情報は、前記プリセット情報が変動であるか固定であるかを表すことを特徴とする、請求項7に記載のオーディオ信号処理装置。
  13. 少なくとも一つのオブジェクトをダウンミキシングしてダウンミックス信号を生成する段階と、
    前記ダウンミックス信号に適用して前記オブジェクトを調節するためのプリセット情報を生成する段階であって、該プリセット情報は構成情報領域又はデータ領域に含まれる段階と、
    プリセットモードの個数を表すプリセット個数情報及びアップミキシングされたダウンミックス信号の出力チャネルがモノ、ステレオまたはマルチチャネルの一つであることを表す出力チャネル情報を生成する段階と、
    前記プリセット情報に対応するプリセットメタデータを生成する段階と、
    前記プリセット情報の属性を表すプリセット属性情報を決定する段階と、
    を含み、
    前記プリセットモードは、前記プリセット情報、前記プリセットメタデータ及び前記プリセット属性情報を有することを特徴とするオーディオ信号処理方法。
  14. 少なくとも一つのオブジェクトをダウンミキシングしてダウンミックス信号を生成するダウンミキシング部と、
    前記ダウンミックス信号に適用して前記オブジェクトを調節するためのプリセット情報を生成するプリセット情報生成部であって、該プリセット情報は構成情報領域又はデータ領域に含まれる、プリセット情報生成部と、
    プリセットモードの個数を表すプリセット個数情報及びアップミキシングされたダウンミックス信号の出力チャネルがモノ、ステレオまたはマルチチャネルの一つであることを表す出力チャネル情報を生成する情報生成部と、
    前記プリセット情報に対応するプリセットメタデータを生成するプリセットメタデータ生成部と、
    前記プリセット情報の属性を表すプリセット属性情報を決定するプリセット属性情報決定部と、
    を含み、
    前記プリセットモードは、前記プリセット情報、前記プリセットメタデータ及び前記プリセット属性情報を有することを特徴とするオーディオ信号処理装置。
JP2011504929A 2008-04-16 2009-04-16 オーディオ信号の処理方法及び装置 Active JP5249408B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US4528708P 2008-04-16 2008-04-16
US61/045,287 2008-04-16
US4856108P 2008-04-29 2008-04-29
US61/048,561 2008-04-29
KR10-2009-0032216 2009-04-14
KR1020090032216A KR101061128B1 (ko) 2008-04-16 2009-04-14 오디오 신호 처리 방법 및 이의 장치
PCT/KR2009/001981 WO2009128663A2 (en) 2008-04-16 2009-04-16 A method and an apparatus for processing an audio signal

Publications (2)

Publication Number Publication Date
JP2011518353A JP2011518353A (ja) 2011-06-23
JP5249408B2 true JP5249408B2 (ja) 2013-07-31

Family

ID=40707764

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011504929A Active JP5249408B2 (ja) 2008-04-16 2009-04-16 オーディオ信号の処理方法及び装置

Country Status (5)

Country Link
US (1) US8175295B2 (ja)
EP (1) EP2111060B1 (ja)
JP (1) JP5249408B2 (ja)
CN (1) CN102007532B (ja)
WO (1) WO2009128663A2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8798776B2 (en) * 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
EP2522016A4 (en) * 2010-01-06 2015-04-22 Lg Electronics Inc DEVICE FOR PROCESSING AN AUDIO SIGNAL AND METHOD THEREFOR
US9530421B2 (en) 2011-03-16 2016-12-27 Dts, Inc. Encoding and reproduction of three dimensional audio soundtracks
TWI530941B (zh) 2013-04-03 2016-04-21 杜比實驗室特許公司 用於基於物件音頻之互動成像的方法與系統
CN105247611B (zh) 2013-05-24 2019-02-15 杜比国际公司 对音频场景的编码
EP3270375B1 (en) 2013-05-24 2020-01-15 Dolby International AB Reconstruction of audio scenes from a downmix
US9779739B2 (en) 2014-03-20 2017-10-03 Dts, Inc. Residual encoding in an object-based audio system
US10051364B2 (en) 2014-07-03 2018-08-14 Qualcomm Incorporated Single channel or multi-channel audio control interface
HUE042582T2 (hu) * 2014-09-12 2019-07-29 Sony Corp Adóeszköz, adási eljárás, vevõeszköz, vételi eljárás
GB2574238A (en) * 2018-05-31 2019-12-04 Nokia Technologies Oy Spatial audio parameter merging
CN113301525A (zh) * 2021-05-07 2021-08-24 上海小鹏汽车科技有限公司 通话控制方法、装置、电子控制器以及车辆
WO2023025143A1 (zh) * 2021-08-24 2023-03-02 北京字跳网络技术有限公司 音频信号的处理方法和装置

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US174548A (en) * 1876-03-07 Improvement in ranges
JP3397001B2 (ja) * 1994-06-13 2003-04-14 ソニー株式会社 符号化方法及び装置、復号化装置、並びに記録媒体
EP0688113A2 (en) 1994-06-13 1995-12-20 Sony Corporation Method and apparatus for encoding and decoding digital audio signals and apparatus for recording digital audio
US7072726B2 (en) 2002-06-19 2006-07-04 Microsoft Corporation Converting M channels of digital audio data into N channels of digital audio data
CN1186909C (zh) * 2003-04-01 2005-01-26 西安大唐电信有限公司 一种多通道联合声码器及其实现方法
SE0400997D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
KR100663729B1 (ko) 2004-07-09 2007-01-02 한국전자통신연구원 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치
SE0402650D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
DE602006015294D1 (de) 2005-03-30 2010-08-19 Dolby Int Ab Mehrkanal-audiocodierung
US8917874B2 (en) * 2005-05-26 2014-12-23 Lg Electronics Inc. Method and apparatus for decoding an audio signal
WO2007040361A1 (en) * 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
CN101297353B (zh) 2005-10-26 2013-03-13 Lg电子株式会社 编码和解码多声道音频信号的方法及其装置
KR100802179B1 (ko) 2005-12-08 2008-02-12 한국전자통신연구원 프리셋 오디오 장면을 이용한 객체기반 3차원 오디오서비스 시스템 및 그 방법
EP1974344A4 (en) * 2006-01-19 2011-06-08 Lg Electronics Inc METHOD AND APPARATUS FOR DECODING A SIGNAL
EP1853092B1 (en) * 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
EP2369836B1 (en) * 2006-05-19 2014-04-23 Electronics and Telecommunications Research Institute Object-based 3-dimensional audio service system using preset audio scenes
KR20090013178A (ko) 2006-09-29 2009-02-04 엘지전자 주식회사 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치
KR100891666B1 (ko) 2006-09-29 2009-04-02 엘지전자 주식회사 믹스 신호의 처리 방법 및 장치
US8364497B2 (en) 2006-09-29 2013-01-29 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
RU2419168C1 (ru) * 2007-03-09 2011-05-20 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ обработки аудиосигнала и устройство для его осуществления
CN101067931B (zh) * 2007-05-10 2011-04-20 芯晟(北京)科技有限公司 一种高效可配置的频域参数立体声及多声道编解码方法与***

Also Published As

Publication number Publication date
WO2009128663A2 (en) 2009-10-22
CN102007532B (zh) 2013-06-19
JP2011518353A (ja) 2011-06-23
WO2009128663A3 (en) 2010-01-14
CN102007532A (zh) 2011-04-06
US20090262957A1 (en) 2009-10-22
US8175295B2 (en) 2012-05-08
EP2111060A1 (en) 2009-10-21
EP2111060B1 (en) 2014-12-03

Similar Documents

Publication Publication Date Title
JP5249408B2 (ja) オーディオ信号の処理方法及び装置
JP5258967B2 (ja) オーディオ信号の処理方法及び装置
KR101171314B1 (ko) 오디오 신호의 처리 방법 및 이의 장치
US9787266B2 (en) Method and an apparatus for processing an audio signal
JP5457430B2 (ja) オーディオ信号の処理方法及び装置
JP5319704B2 (ja) オーディオ信号の処理方法及び装置
WO2009093866A2 (en) A method and an apparatus for processing an audio signal
KR101062351B1 (ko) 오디오 신호 처리 방법 및 이의 장치
JP5406276B2 (ja) オーディオ信号の処理方法及び装置
EP2111062B1 (en) A method and an apparatus for processing an audio signal

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120822

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120925

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130125

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130411

R150 Certificate of patent or registration of utility model

Ref document number: 5249408

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160419

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250