KR101021079B1

KR101021079B1 - 파라메트릭 다채널 오디오 표현

Info

Publication number: KR101021079B1
Application number: KR1020047017069A
Authority: KR
Inventors: 우멘아놀더스더블유.제이.; 슈아이저스에릭지.피.; 브리바르트더크제이.; 반데파르스티븐엘.제이.디.이.
Original assignee: 코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date: 2002-04-22
Filing date: 2003-04-22
Publication date: 2011-03-14
Also published as: EP1500083A1; KR20040102163A; US8498422B2; AU2003216686A1; WO2003090207A1; US20050226426A1; ATE332003T1; EP1500083B1; ES2268340T3; JP2005523479A; CN1647156A; DE60306512T2; CN1647156B; JP4714415B2; DE60306512D1; BRPI0304542B1; BR0304542A

Abstract

다채널 오디오 신호들은 모노럴 오디오 신호 및 모노럴 오디오 신호와 정보로부터 다채널 오디오 신호를 복원하도록 허용하는 정보로 코딩된다. 정보는 다채널 오디오 신호의 제 1 주파수 영역에 대한 정보의제 1 부분을 결정함으로써, 및 다채널 오디오 신호의 제 2 주파수 영역에 대한 정보의 제 2 부분을 결정함으로써 생성된다. 제 2 주파수 영역은 제 1 주파수 영역의 일부이고, 따라서, 제 2 주파수 영역은 제 1 주파수 영역의 부분-범위이다. 정보는 비트 레이트에 대한 디코딩 품질이 조정 가능한 다층이다.

모노럴, 바이노럴, 다채널 오디오 신호, 인코더, 디코더

Description

파라메트릭 다채널 오디오 표현{Parametric multi-channel audio representation}

본 발명은, 다채널 오디오 신호를 인코딩하는 방법, 다채널 오디오 신호를 인코딩하기 위한 인코더, 및 오디오 신호, 인코딩된 오디오 신호, 인코딩된 신호가 저장되는 저장 매체를 공급하기 위한 장치에 관한 것으로, 인코딩된 오디오 신호를 디코딩하는 방법, 인코딩된 오디오 신호를 디코딩하기 위한 디코더, 및 디코딩된 오디오 신호를 공급하기 위한 장치에 관한 것이다.

제 EP-A-1107232호는 좌채널 신호 및 우채널 신호로 이루어진 스테레오 오디오 신호 표현을 생성하기 위해 파라메트릭 코딩 스킴(parametric coding scheme)을 개시한다. 효율적으로 전송 대역폭을 이용하기 위해, 이러한 표현은 좌채널 신호 또는 우채널 신호 중 하나인 모노럴(monaural) 신호에만 관한 정보, 및 파라메트릭 정보를 구비한다. 다른 스테레오 신호는 파라메트릭 정보와 함께 모노럴 신호를 기초로 복원될 수 있다. 파라메트릭 정보는 좌채널 및 우채널의 진폭 및 위상 특성들을 포함하는 스테레오 오디오 신호의 로컬리제이션 큐들(localization cues)을 포함한다.

본 발명의 목적은 유효한 비트 레이트로 인코딩된 오디오 신호의 품질을 조정(scale), 또는 디코더의 복잡성 또는 유효한 전송 대역폭으로 디코딩된 오디오 신호의 품질을 조정할 수 있는 파라메트릭 다채널 오디오 시스템을 제공하는 것이다.

본 발명의 제 1 양상은 청구항 제 1 항에서 청구된 바와 같이 다채널 오디오 신호를 인코딩하는 방법을 제공한다. 본 발명의 제 2 양상은 청구항 제 2 항에서 청구된 바와 같이 다채널 오디오 신호의 인코딩 방법을 제공한다. 본 발명의 제 3 양상은 청구항 제 14 항에서 청구된 바와 같이 다채널 오디오 신호의 인코딩하기 위한 인코더를 제공한다. 본 발명의 제 4 양상은 청구항 제 15 항에서 청구된 바와 같이 다채널 오디오 신호를 인코딩하기 위한 인코더를 제공한다. 본 발명의 제 5 양상은 청구항 제 16 항에서 청구된 바와 같이 오디오 신호를 공급하기 위한 장치를 제공한다. 본 발명의 제 6 양상은 청구항 제 17 항에서 청구된 바와 같이 인코딩된 오디오 신호를 제공한다. 본 발명의 제 7 양상은 청구항 제 18 항에서 청구된 바와 같이 인코딩된 신호가 저장되는 저장 매체를 제공한다. 본 발명의 제 8 양상은 청구항 제 19 항에서 청구된 바와 같이 디코딩 방법을 제공한다. 본 발명의 제 9 양상은 청구항 제 20 항에서 청구된 바와 같이 인코딩된 오디오 신호를 디코딩하기 위한 디코더를 제공한다. 본 발명의 제 10 양상은 청구항 제 21 항에서 청구된 바와 같이 디코딩된 오디오 신호를 공급하기 위한 장치를 제공한다. 유익한 실시예들이 종속 청구항들에서 규정된다.

본 발명의 제 1 양상에 따라 다채널 오디오 신호를 인코딩하는 방법에서, 단일 채널 오디오 신호가 생성된다. 더욱이, 정보는 단일 채널 오디오 신호 및 상기 정보로부터, 요구된 품질의 레벨로, 다채널 오디오 신호의 복원을 허용하는 다채널 오디오 신호로부터 생성된다. 바람직하게, 상기 정보는 예컨대, 제 EP-A-1107232로부터 알려진 파라미터들의 세트들을 포함한다.

본 발명의 제 1 양상에 따라, 정보는 다채널 오디오 신호의 제 1 주파수 영역에 대한 정보의 제 1 부분을 결정함으로써, 및 다채널 오디오 신호의 제 2 주파수 영역에 대한 정보의 제 2 부분을 결정함으로써 생성된다. 제 2 주파수 영역은 제 1 주파수 영역의 일부이고, 따라서, 제 2 주파수 영역은 제 1 주파수 영역의 부분 범위(sub-range)다. 이제, 2개의 레벨들의 품질의 디코딩이 가능하다. 낮은 품질의 레벨의 디코딩 다채널 오디오 신호를 위해, 디코더는 인코딩된 단일 채널 오디오 신호, 및 정보의 제 1 부분을 사용한다. 높은 품질의 레벨을 위해, 디코더는 인코딩된 단일 채널 오디오 신호, 및 정보의 제 1 및 제 2 부분 양자를 사용한다. 명백하게, 상이한 주파수 영역에서 각각 연관된 정보의 다수의 부분들이 존재하면, 다수의 레벨들로부터 디코딩 품질을 선택하는 것은 가능하다. 예컨대, 제 1 부분은 다채널 오디오 신호의 전체 대역폭을 커버하는 주파수 영역내에서 결정된 파라미터들의 단일 세트를 포함할 수 있다. 그리고, 제 2 부분은 파라미터들의 여러 세트들을 포함할 수 있고, 파라미터들의 각각의 세트는 전체 대역폭의 부분 범위 또는 일부에 대해 결정된다. 부분들은 함께 전체 대역폭을 커버하는 것이 바람직하다. 그러나, 다른 많은 가능성들이 존재한다. 예컨대, 제 1 부분은 파라미터들의 2 개 세트들을 포함할 수 있고, 여기서 제 1 세트는 전체 대역폭의 더 낮은 부분을 커버하는 주파수 영역에 대해 결정되고, 제 2 세트는 전체 대역폭의 다른 부분을 커버하는 주파수 영역에 대해 결정된다. 제 2 부분은 전체 대역폭의 더 낮은 부분내의 2 개의 주파수 영역들에 대해 결정된 파라미터들의 2 개 세트들을 포함할 수 있다. 전체 대역폭의 더 낮은 부분과 더 높은 부분에 대한 파라미터들의 세트들의 수가 동일하도록 요구되지는 않는다.

인코딩된 오디오 신호의 이 표현은 디코딩된 오디오 신호의 품질이 디코더의 복잡성에 의존하도록 허용한다. 예컨대, 단순한 휴대용 디코더에서, 낮은 전력 소비를 갖고, 따라서, 정보의 일부만을 사용할 수 있는 낮은 복잡성의 디코더가 사용될 수 있다. 하이 엔드 애플리케이션에서는, 코딩된 신호내에서 유효한 모든 정보를 사용하는 복잡한 디코더가 사용된다.

디코딩된 오디오의 품질은 또한, 유효한 전송 대역폭에 의존할 수 있다. 전송 대역폭이 크다면, 모두 전송되므로, 디코더는 모든 유효한 층들을 디코딩할 수 있다. 대역폭이 작다면, 송신기는 제한된 수의 층들만을 전송하도록 결정할 수 있다.

본 발명의 제 2 양상에서, 인코더는 디코딩된 다채널 오디오 신호의 최대 허용가능 비트 레이트를 수신한다. 이 최대 허용가능 비트 레이트는, 인터넷과 같은 전송 채널 또는 저장 매체의 유효한 비트 레이트에 의해 규정될 수 있다. 전송 대역폭이 가변이고 따라서 최대 허용가능 비트 레이트가 시간에 따라 변하는 애플리케이션들에서, 너무 낮은 품질의 디코딩된 오디오 신호를 방지하기 위해 전송 대역폭의 이들 감쇠량들(fluctuations)을 적합화시킬 수 있는 것은 중요하다. 일반적으로, 인코더는 모든 유효한 층들을 인코딩한다. 어떤 층들이 전송될 것인지는 유효한 채널 용량에 의존하여 전송 종단(transmitting-end)에서 결정된다. 이는 루프내의 인코더로 가능하지만, 전송 전에 일부 층들을 제거하는 것보다 더 복잡하게 된다.

단일 채널 오디오 신호, 및 정보의 제 1 및 제 2 부분을 포함하는 인코딩된 다채널 오디오 신호의 비트 레이트가 최대 허용가능 비트 레이트보다 높지 않다면, 인코더는 다채널 오디오 신호의 제 2 주파수 영역에 대한, 정보의 제 2 부분만을 인코딩된 오디오 신호에 부가한다. 따라서, 전송 대역폭이 제 2 부분의 전송을 지원하도록 충분히 크지 않다면, 제 2 부분은 코딩된 오디오 신호에 존재하지 않는다.

청구항 제 4 항에서 규정된 바와 같은 실시예에서, 정보는 파라미터들의 세트들을 포함하고, 정보의 부분들 각각은 파라미터들의 하나 이상의 세트들에 의해 표현된다. 주파수 영역들의 수에 의존한 파라미터들의 세트들의 수는 정보의 부분들에 존재한다.

청구항 제 6 항에서 규정된 바와 같은 실시예에서, 파라미터들의 세트들은 적어도 하나의 로컬리제이션 큐들을 포함한다.

청구항 제 7 항에서 규정된 바와 같은 실시예에서, 제 1 주파수 영역은 실질적으로 다채널 오디오 신호의 전체 대역폭을 커버한다. 이 방식에서, 파라미터들의 1개 세트는 단일 채널 오디오 신호를 다채널 오디오 신호로 디코딩하도록 요구된 기본 정보를 제공하기에 충분하다. 이 방식에서, 디코딩된 오디오 신호의 품질의 기본 레벨은 보증된다. 제 2 주파수 범위는 전체 대역폭의 일부를 커버한다. 이 방식에서, 제 2 부분이 코딩된 오디오 신호내에 존재할 때, 제 2 부분은 이 주파수 범위에서 디코딩된 오디오 신호의 품질을 향상시킨다.

청구항 제 8 항에서 규정된 바와 같은 실시예에서, 정보의 제 2 부분은 실질적으로 다채널 오디오 신호의 전체 대역폭을 함께 커버하는 적어도 2 개의 주파수 범위들을 포함한다. 이 방식에서, 제 2 부분에 의해 제공된 품질 향상은 완전한 대역폭에 걸쳐 존재한다.

청구항 제 9 항에서 규정된 바와 같은 실시예에서, 단일 채널 오디오 신호 및 정보의 제 1 부분을 포함하는 기본 층은 인코딩된 오디오 신호내에 항상 존재한다. 정보의 제 2 부분을 포함하는 향상 층은 인코딩된 오디오 신호의 비트 레이트가 최대로 허용가능 비트 레이트를 초과하지 않아야만 인코딩된다. 이 방식에서, 디코딩된 오디오 신호의 품질은 최대로 허용가능 비트 레이트에 의존할 것이다. 최대로 허용가능 비트 레이트가 향상층을 수용하기에 너무 낮다면, 코딩된 오디오의 예측할 수 없는 부분들이 디코더에 도달하지 못할 경우에 비해 더 좋은 품질의 디코딩된 오디오를 제공할 것인 기본층으로부터 디코딩된 오디오 신호를 얻게 될 것이다.

청구항들 제 10 항 내지 제 12 항 중 어느 한 항에서 규정된 바와 같은 실시예들에서, 다음 프레임에서의 정보(파라미터들의 세트들을 통상적으로 구비하고, 각각의 주파수 대역 당 1개 세트로 표현되는)의 부분들은 이전 프레임의 파라미터들에 기초하여 코딩된다. 통상적으로, 이는, 2 개의 연속하는 프레임들내의 정보가 실질적으로 다르지 않을 것인, 상관관계로 인하여, 정보의 인코딩된 부분들의 비트 레이트를 감소시킨다.

청구항 제 13 항에서 규정된 바와 같은 실시예들에서, 2 개의 연속하는 프레임들의 파라미터들의 차는 파라미터들 대신에 코딩된다.

스테레오 프로그램 자료의 비트 레이트를 감소시키기 위해 제안되어온 오디오 코더들의 이전 해결책들은 인텐시티 스테레오 및 M/S 스테레오를 포함한다.

인텐시티 스테레오 알고리즘에서, 고주파수들(통상적으로, 5kHz 이상)은 이들 스테레오 영역들에 대한 원 스테레오 신호를 닮은 디코딩된 오디오 신호를 복원하도록 허용하는 시변 및 주파수 의존 조정 인자들 또는 인텐시티 인자들과 조합된 단일 오디오 신호(즉, 모노)에 의해 표현된다. M/S 알고리즘에서, 신호는 합(또는 중간, 또는 공통) 신호와 차(또는 측면(side), 또는 공통이 아닌) 신호로 분해된다. 상기 분해는 종종 주성분분석(principle component analysis) 또는 시변 조정 인자들과 조합된다. 그 다음에, 이들 신호들은 변환 코더 또는 서브-대역 코더[둘 다 파형 코더들인] 중 하나에 의해 개별적으로 코딩된다. 상기 알고리즘에 의해 달성된 정보 감소량은 소스 신호의 공간적 성질들에 상당히 의존한다. 예컨대, 소스 정보가 모노럴이면, 차 신호는 영이며 폐기될 수 있다. 그러나, 좌측 및 우측 오디오 신호들의 상관관계가 낮다면(고주파수 영역들에서 종종 발생하는 경우인), 상기 스킴은 작은 비트 레이트 감소만을 제공한다. 더 낮은 주파수 영역들에 대해, M/S 코딩은 일반적으로 중요한 장점을 제공한다.

오디오 신호들의 파라메트릭 기술들은 특히 오디오 코딩 분야에서 지난 몇 년 동안 관심을 받아왔다. 오디오 신호들을 기술하는 전송 파라미터들은 수신단에서 지각력의 동일한 신호를 재합성하기 위해 적은 전송 용량만을 요구한다. 그러나, 모노럴 신호들, 및 스테레오 신호들에 초점을 맞추는 현재의 파라메트릭 오디오 코더들은 듀얼 모노 신호들(dual mono signals)로서 처리된다.

본 발명의 이들 및 다른 양상들은 이후에 기술될 실시예들로부터 명료해지고, 하기 실시예들에 관련하여 설명될 것이다.

도 1은 스테레오 오디오를 위한 다채널 인코더의 블록도.

도 2는 스테레오 오디오를 위한 다채널 디코더의 블록도.

도 3은 인코딩된 데이터 스트림의 표현을 도시하는 도면.

도 4는 본 발명에 따라 주파수 범위들의 실시예를 도시하는 도면.

도 5는 본 발명에 따라 주파수 범위들의 다른 실시예를 도시하는 도면.

도 6은 본 발명에 따라 이전 프레임에서의 파라미터들에 기초하여 파라미터들의 세트들의 결정을 도시하는 도면.

도 7은 파라미터들의 세트를 도시하는 도면.

도 8은 기본층의 파라미터들의 상이한 결정을 도시하는 도면.

도 9는 향상층의 주파수 영역에 대응하는 파라미터들의 상이한 결정을 도시하는 도면.

도 1은 다채널 인코더의 블록도를 도시한다. 인코더는 스테레오 신호 RI, LI로서 도시된 다채널 오디오 신호를 수신하고, 인코더는 인코딩된 다채널 오디오 신호 EBS를 공급한다.

다운 믹서(1)는 단일 채널 오디오 신호(모노럴 신호로도 또한 칭해짐) SC에 스테레오 신호 또는 스테레오 채널들 RI, LI를 조합한다. 예컨대, 다운 믹서(1)는 입력 오디오 신호들 RI, LI의 평균을 결정할 수 있다.

인코더(3)는 인코딩된 모노럴 신호 ESC를 얻기 위해 모노럴 신호 SC를 인코딩한다. 인코더(3)는 예컨대, MPEG 코더(MPEG-LⅡ, MPEG-LⅢ(mp3), 또는 MPEG2-AAC)와 같은 알려진 종류로 이루어질 수 있다.

파라미터 결정 회로(2)는 입력 오디오 신호들 RI, LI에 기초하여 정보 INF를 특징 짓는 파라미터들의 세트들 S1, S2, 등등을 결정한다. 선택적으로, 파라미터 결정 회로(2)는, 파라미터 코더(4)에 의해 코딩될 때, 인코딩된 모노럴 신호 ESC와 함께 최대 허용가능 비트 레이트 MBR을 초과하지 않는 파라미터 세트들 S1, S2, 등등만을 결정하기 위해 최대 허용가능 비트 레이트 MBR을 수신한다. 인코딩된 파라미터들은 EIN으로서 표시된다.

포맷기(5)는 인코딩된 다채널 오디오 신호 EBS를 얻기 위해, 요망하는 포맷으로 데이터 스트림에서의 인코딩된 파라미터들 EIN과 인코딩된 모노럴 신호 SC를 조합한다.

인코더의 동작은 실시예에 관련하여 예로서 이후 더 상세히 설명될 것이다. 다채널 오디오 신호 LI, RI는 단일 모노럴 신호 SC(이후 단일 채널 오디오 신호로서도 또한 칭해짐)로 인코딩된다. 다채널 오디오 신호들 LI, RI의 공간적 속성들의 파라미터화(parameterization)는 파라미터 결정 회로(2)에 의해 수행된다. 파라미터들은 어떻게 모노럴 신호 SC로부터 다채널 오디오 신호 LI, RI를 복원하는가에 관한 정보를 구비한다. 파라미터들은 인코딩된 단일 모노럴 신호 ESC와 조합되기 전에 파라미터 인코더(4)에 의해 통상적으로 인코딩된다. 따라서, 일반 오디오 코딩 애플리케이션들을 위해, 1 개의 모노럴 오디오 신호와만 조합된 이들 파라미터들이 전송되거나 또는 저장된다. 조합된 코딩된 신호는 인코딩된 다채널 오디오 신호 EBS다. 인코딩된 다채널 오디오 신호 EBS를 전송 또는 저장하기 위해 필요한 전송 또는 저장 용량은, 독립적으로 다채널들을 처리하는 오디오 코더들에 비해 크게 감소된다. 그럼에도 불구하고, 원 공간적 효과는 파라미터들(의 세트들)을 구비하는 정보 INF에 의해 유지된다.

특히, 다채널 오디오 RI, LI의 파라메트릭 기술(description)은 바이노럴 청각 시스템(binaural auditory system)의 효과적인 신호 처리를 기술하는 것을 겨냥한 바이노럴 처리 모델에 관한 것이다.

상기 모델은 인입 오디오 LI, RI를, 바람직하게 ERB-레이트(ERB-rate) 크기로 직선으로 간격을 띄운 여러 대역-제한 신호들로 분리한다. 이들 신호들의 대역폭은 ERB-레이트에 따른 중심 주파수(center frequency)에 의존한다. 실질적으로, 바람직하게, 모든 주파수 대역에서, 인입 신호들의 하기 성질들이 분석된다:

- 좌측 및 우측 귀들로부터 기인하는 대역-제한 신호의 관련 레벨들에 의해 규정되는 인터로럴(interaural) 레벨차, 또는 ILD,

- 인터로럴 상호 상관 함수의 최대치(peak)에 대응하는 인터로럴 지연(또는 위상 편이)에 의해 규정되는, 인터로럴 시간(또는 위상) 차 ITD(또는 IPD), 및

- 최대 인터로럴 상호 상관 IC(예컨대, 최대 첨두의 위치에서 상호 상관의 값)에 의해 파라미터화될 수 있는, ITD들 또는 ILD들에 의해, 설명될 수 있는 파형들의 동일함(비동일함).

각각의 주파수 대역 FR1, FR2, 등등 당 1개 세트인 이들 파라미터들의 세트들 S1, S2, 등등은 시간에 대해 변한다. 그러나, 바이노럴 청각 시스템은 처리에 있어서 느리므로, 이들 성질들의 업데이트 레이트는 다소 낮을 것이다.

시변 파라미터들이 바이노럴 청각 시스템이 가진 유일한 유효한 공간적 신호 성질들이고, 이들 시간 및 주파수 종속 파라미터들로부터, 감지되는 청각 세계가 청각 시스템의 더 높은 레벨들에 의해 복원된다.

도 2는 다채널 디코더의 블록도를 도시한다. 디코더는 인코딩된 다채널 오디오 신호 EBS를 수신하고 스테레오 신호 RO, LO로서 도시된 복원된 디코딩 다채널 오디오 신호를 공급한다.

디포맷기(deformatter)(6)는 데이터 스트림 EBS로부터 인코딩된 모노럴 신호 ESC' 및 인코딩된 파라미터들 EIN'을 복구한다. 디코더(7)는 인코딩된 모노럴 신호 ESC'를 출력 모노럴 신호 SCO로 디코딩한다. 디코더(7)는, 예컨대, 디코더(7)가 MPEG 디코더일 수 있는, 알려진 종류(물론, 사용되던 인코더에 정합되는)로 이루질 수 있다. 디코더(8)는 인코딩된 파라미터들 EIN'을 출력 파라미터들 INO로 디코딩한다.

역다중화기(9)는 출력 모노럴 신호 SCO에 출력 파라미터들 INO의 파라미터 세트들 S1, S2, 등등을 적용함으로써, 출력 스테레오 오디오 신호들 LO 및 RO를 복원한다.

도 3은 인코딩된 데이터 스트림의 표현을 도시한다. 예컨대, 각각의 프레임 F1, F2, 등등에서, 데이터 패키지는, 이제 A로 표시되는 코딩된 모노럴 신호 ECS, 인코딩된 정보 EIN의 제 1 부분 P1, 인코딩된 정보 EIN의 제 2 부분 P2, 및 인코딩된 정보 EIN의 제 3 부분 P3이 뒤따르는 헤더 H로 시작한다.

프레임 F1, F2, 등등이 헤더 H 및 코딩된 모노럴 신호 ECS만을 포함한다면, 모노럴 신호 SC만이 전송된다.

제EP-A-1107232호에서 개시된 바와 같이, 입력 오디오 신호가 발생하는 전체 주파수 대역은 전체 주파수 대역을 함께 커버하는 복수의 서브-주파수 대역들로 나뉘어진다. 본 발명에 따른 용어(terminology)에서, 다채널 정보 INF는 각각의 서브-주파수 대역 FR1, FR2, 등등 당 1개 세트인 복수의 파라미터 세트들 S1, S2, 등등으로 인코딩된다. 이 복수의 파라미터 세트들 S1, S2, 등등은 인코드 정보 EIN의 제 1 부분 P1로 코딩된다. 따라서, 기본 레벨 품질의 다채널 오디오 신호를 전송하기 위해, 비트 스트림은 헤더 H, 코딩된 모노럴 신호 ECS인 부분 A, 및 제 1 부분 P1을 포함한다.

본 발명의 실시예에 따른 비트 스트림에서, 제 1 부분 P1은 단일 세트 파라미터들 S1로만 이루어진다. 단일 세트는 전체 대역폭 FR1에 대해 결정된다. 헤더 H, 및 부분들 A 및 P1을 포함하는 이 비트 스트림은 도 3에서 BL로 표시된, 품질의 기본층을 제공한다.

향상된 품질을 유지하기 위해, 코딩된 정보 EIN의 다른 부분들 P2, P3이 비트 스트림에 존재한다. 이들 다른 부분들은 향상층 EL을 형성한다. 비트 스트림은 단일 다른 부분 P2 또는 하나 이상의 다른 부분을 포함할 수 있다. 다른 부분 P2는 각각의 서브-주파수 대역 FR2, FR3, 등등 당 1개 세트인, 파라미터들의 복수의 세트들 S2, S3, 등등을 포함하는 것이 바람직하고, 서브-주파수 대역들 FR2, FR3, 등등은 전체 주파수 대역 FR1을 커버하는 것이 바람직하다. 향상된 품질은 또한 단계-방식(step-wise) 수단으로 존재할 수 있고, 제 1 향상 레벨은 제 1 부분을 포함하는 향상층 EL1에 의해 제공된다. 그리고 제 2 향상층 EL은 제 1 향상층 EL1 및 부분 P3을 포함하는 제 2 향상층 EL2를 포함한다.

다른 부분 P2는 전체 주파수 대역 FR1의 서브-대역인 단일 주파수 대역 FR2에 대응하는 파라미터들의 단일 세트 S2를 또한 포함할 수 있다. 다른 부분 P2는, 완전한 전체 주파수 대역 FR1을 함께 커버하지 않는 주파수 대역들 FR2, FR3, 등등에 대응하는 파라미터들 S2, S3, 등등의 다수의 세트들을 또한 포함할 수 있다.

다른 부분 P3은 다른 부분 P2의 서브-대역들 중 적어도 하나를 세분(sub-divide)하는 주파수 대역들에 대한 파라미터 세트들을 구비하는 것이 바람직하다.

본 발명에 따른 비트 스트림의 이 포맷은, 전송 채널에서, 또는 디코더에서 전송 채널의 비트 레이트 또는 디코더의 디코딩 복잡성으로 디코딩된 오디오 신호의 품질을 조정하도록 허용한다. 예컨대, 오디오 디코더가, 휴대용 애플리케이션들에서 중요한, 낮은 전력 소비를 가져야 한다면, 디코더는 낮은 복잡성을 가질 수 있고, 부분들 H, A 및 P1만을 사용한다. 사용자가 디코딩된 오디오의 더 높은 품질을 요망함을 인지한다면, 디코더는 더 높은 전력 소비에서 더 복잡한 동작들을 수행하는 것도 가능하다.

인코더가 전송 채널을 통해 전송될 수 있고 또는 저장 매체에 저장될 수 있는 최대 허용가능 비트 레이트 MBR을 감지하고 있는 것이 또한 가능하다. 이제, 인코더는, 존재한다면, 얼마나 많은 다른 부분들 P1, P2, 등등이 최대 허용가능 비트 레이트 MBR내에 적당한지 결정할 수 있다. 인코더는 비트 스트림에서의 이들 허용가능 부분들 P1, P2만을 코딩한다.

도 4는 본 발명에 따른 주파수 범위들의 실시예를 도시한다. 이 실시예에서, 주파수 대역 FR1은 다채널 오디오 신호 LI, RI의 전체 대역폭 FBW와 동일하고, 주파수 대역 FR2는 전체 대역폭 FBW의 서브-주파수 대역이다.

이들만이 파라미터 세트들 S1, S2, 등등이 결정되는 주파수 범위들이면, 단일 파라미터 세트 S1은 주파수 대역 FR1에 대해 결정되고 부분 P1에 존재하고, 및 단일 파라미터 세트 S2는 주파수 대역 FR2에 대해 결정되고 부분 P2에 존재한다. 품질의 조정은 부분 P2를 사용하거나 또는 사용하지 않음으로써 가능하다.

도 5는 본 발명에 따른 주파수 범위들의 다른 실시예를 도시한다. 이 실시예에서, 주파수 대역 FR1은 다시 전체 대역폭 FBW와 동일하고, 서브-주파수 대역들 FR2 및 FR3은 함께 전체 대역폭 FBW를 커버한다. 다시 말하면, 주파수 대역 FR1은 서브-주파수 대역들 FR2 및 FR3으로 세분화된다.

이들만이 파라미터 세트들 S1, S2, 등등이 결정되는 주파수 범위들이면, 부분 P1은 주파수 대역 FR1에 대해 결정된 단일 파라미터 세트 S1을 포함하고, 부분 P2는 주파수 대역 FR2 및 FR3에 대해 각각 결정된 2개의 파라미터 세트들 S2 및 S3을 포함한다. 품질의 조정은 부분 P2를 사용하거나 또는 사용하지 않음으로써 가능하다.

도 6은 본 발명의 실시예에 따라 이전 프레임의 파라미터들에 기초하여 파라미터들의 세트들의 결정을 도시한다.

도 6은, 기본층 BL의 일부인 부분 P1 및 향상층 EL을 형성하는 부분 P2를 포함하는 코딩된 정보 EIN인, 각각의 프레임 F1, F2, 등등을 포함하는 데이터 스트림을 도시한다.

프레임 F1에서, 부분 P1은 전체 대역폭 FR1에 대해 결정되는 파라미터들의 단일 세트 S1을 포함한다. 부분 P2는, 예로서, 부 대역들 FR2, FR3, FR4 및 FR5에 대해 각각 결정되는, 파라미터들의 4개 세트들 S2, S3, S4 및 S5를 포함한다. 4개의 서브-주파수 대역들 FR2, FR3, FR4 및 FR5는 주파수 대역 FR1을 세분화한다.

프레임 F1의 뒤를 잇는 프레임 F2에서, 부분 P1은, 전체 대역폭 FR1에 대해 결정되고 기본층 BL'의 일부인 파라미터들의 단일 세트 S1'을 포함한다. 부분 P2는, 서브-주파수 대역들 FR2, FR3, FR4 및 FR5에 대해 다시 각각 결정되고, 향상층 EL'를 형성하는, 파라미터들의 4개의 세트들 S2', S3', S4' 및 S5'를 포함한다.

프레임들 F1, F2, 등등에 대한 파라미터들의 세트들 S1, S2, 등등의 각각을 개별적으로 코딩하는 것은 가능하다. 부분 P1의 파라미터들에 관련하여 부분 P2의 파라미터들의 세트들을 코딩하는 것도 가능하다. 이는 프레임 F1의 S1에서 시작하고 S2 내지 S5에서 중단하는 화살표들에 의해 표시된다. 이것은 다른 프레임들 F2, 등등(도시되지 않음)에서도 또한 가능하다. 동일한 수단에서, S1에 관련하여 파라미터들의 세트 S1'를 코딩하는 것은 가능하다. 마지막으로, 파라미터들의 세트들 S2', S3', S4' 및 S5'는 파라미터들의 세트들 S2, S3, S4 및 S5에 관련하여 코딩될 수 있다.

상기 수단에서, 인코딩된 정보 EIN의 비트 레이트는 파라미터들의 세트들 Si간의 덧붙임(redundancy) 또는 상관 관계(correlation)가 사용되므로 감소될 수 있다.

바람직하게, 파라미터들의 새로운 세트들의 새로운 파라미터들 S1', S2', S3', S4' 및 S5'는 그것들의 값과 파라미터들의 이전 세트들 S1, S2, S3, S4 및 S5의 값의 차로서 코딩된다.

정규 시간 간격들에서, 최소한 파라미터 세트 S1은 오류들이 너무 길게 퍼지는 것을 방지하기 위해 완전하고 차이가 없도록 코딩되어야 한다.

도 7은 파라미터들의 세트를 도시한다. 파라미터들의 각각의 세트 Si는 하나 이상의 파라미터들을 포함할 수 있다. 일반적으로, 파라미터들은 오디오 정보에서 사운드 오브젝트들의 로컬리제이션에 관한 정보를 제공하는 로컬리제이션 큐들이다. 일반적으로 로컬리제이션 큐들은 인터로럴 레벨차 ILD, 인터로럴 시간 또는 위상차 ITD 또는 IPD, 및 인터로럴 상호 상관 IC다. 이들 파라미터들에 관한 더욱 상세한 정보는, Christof Faller 등에 의해, 112th Convention 2002 May 10-13 Munich, Germany에서 발표된 Audio Engineering Society Convention Paper 5574 "Binaural Cue Coding Applied to Stereo and Multi-channel Audio Compression"에서 제공된다.

도 8은 기본층의 파라미터의 차등 결정(differencial determination)을 도시한다. 수평축은 연속하는 프레임들 F1 내지 F5를 표시한다. 수직축은 기본층 BL의 파라미터들의 세트 S1의 파라미터의 값 PVG를 도시한다. 이 파라미터는 프레임들 F1 내지 F5에 대해 값들 A1 내지 A5를 각각 갖는다. 파라미터의 실제 값들 A2 내지 A5가 코딩되지 않고, 더 작은 차들 D1, D2, 등등이 코딩된다면, 코딩된 정보 EIN의 비트 레이트에 대한 이 파라미터의 기여는 감소할 것이다.

도 9는 향상층의 주파수 영역에 대응하는 파라미터들의 차등 결정을 도시한다. 수평축은 2 개의 연속하는 프레임들 F1 및 F2를 표시한다. 수직축은 기본층 BL 및 향상층 EL의 특정 파라미터의 값을 표시한다. 예컨대, 기본층 BL은 전체 주파수 범위 FBW에 대해 결정된 파라미터들의 단일 세트를 갖는 정보 INF의 부분 P1을 포함하고, 부분 P1의 특정 파라미터는 프레임 F1에 대한 값 A1 및 프레임 F2에 대한 A2를 갖는다. 향상층 EL은 함께 전체 주파수 범위 FBW를 채우는 3개의 각 주파수 범위들 FR2, FR3 및 FR4에 대해 결정된 파라미터들의 3개의 세트들을 갖는 정보 INF의 부분 P2를 포함한다. 3개의 특정 파라미터들(예컨대, ILD를 나타내는 파라미터)은 프레임 F1의 값 B11, B12 및 B13, 및 프레임 F2의 값 B21, B22 및 B23을 갖는다.

코딩된 정보 EIN의 비트 레이트에 대한 이들 파라미터들의 기여는, 특정 파라미터의 실제 값들 B11 내지 B23이 코딩되지 않고 차들 D11, D12, 등등이 코딩된다면 감소될 것이며, 이는 이들 차들이 실제 값들보다 효율적으로 인코딩될 수 있기 때문이다.

요약하면, 본 발명에 따른 바람직한 실시예에서, 기본층 BL이 다채널 오디오 신호 LI, RI의 전체 대역폭 FBW에 대해 결정된 파라미터들의 1개 세트 S1을 구비하도록 스테레오 파라미터 정보 INF를 체계화(organize)하는 것이 제안된다. 향상층 EL은 전체 대역폭 FBW내의 일련의 주파수 간격들 FR2, FR3, 등등에 대응하는 파라미터들의 다수의 세트들 S2, S3, 등등을 구비한다. 비트 레이트 효율을 위해, 향상층 EL의 파라미터들의 세트들 S2, S3, 등등은 기본층 BL의 파라미터들의 세트 S1에 관련하여 차등으로 인코딩될 수 있다.

정보 INF는 비트 레이트에 대한 디코딩 품질의 조정이 가능하도록 다층 수단(multi-layered manner)으로 인코딩된다.

결과로, 이하에서, 본 발명에 따른 바람직한 실시예는 프로그램 코드 및 설명에 관련하여 설명된다.

먼저, 모든 프레임들 F1, F2 등에서의 서브프레임들(부분 P1, P2, 등등)을 위해, 모노럴 표현 SC에 대한 데이터 ESC, 전체 대역폭 FBW에 대한 스테레오 파라미터들의 세트 S1에 대한 데이터 EIN, 및 주파수 빈들(또는 영역들) FR2, FR3, 등등에 대한 스테레오 파라미터들 S2, S3, 등등이 결정된다.

프로그램 코드는 좌측 끝에 도시되고, 프로그램 코드의 설명은 우측 끝에 설명하에 제공된다.

코드 설명

{

for(f=0;f<nrof_frames;f++) 모든 프레임들에 대해

{

example_mono_frame(f) 모노럴 신호 표현을

위한 데이터를 얻는다

(도3의 부분 A)

example_stereo_extension_layer_1(f) 전체 대역폭(부분 P1)

스테레오 파라미터들

데이터를 얻는다

example_stereo_extension_layer_2(f) 주파수 빈들(부분 P2)

스테레오 파라미터들

데이터를 얻는다

}

둘째, 비트 refresh_stereo의 값에 의존하여, 전체 대역폭에 대한 스테레오 파라미터들은 완전히(실제 값이 코딩된다) 코딩되거나 또는 이전 값들과의 차가 코딩된다. 하기 코드는 인터로럴 레벨차 ILD에 유효하다.

코드 설명

example_stereo_extension_layer_1(f)

{

refresh_stereo 데이터가 완전히 코딩

되었는지 여부를 표시

하는 1 비트

if(refresh_stereo==1) 데이터가 완전히 코딩

된다면

{

ild_global[f] 전체 주파수 영역(global

)에 대한 실제 인터로럴

인텐시티 차(ild)를 코딩

}

else 그렇지 않다면 리프레시

{

ild_global_diff[f] 이전 프레임에 관련하여

ild 코딩

}

제 3 번째, 비트 refresh_stereo의 값에 의존하여, 모든 주파수 빈들에 대한 스테레오 파라미터들은 완전히(실제 값이 코딩된다) 코딩되거나 또는 전체 대역폭에 대한 대응하는 파라미터들과의 차가 코딩된다. 하기 코드는 인터로럴 레벨차 ILD에 유효하다.

코드 설명

example_stereo_extension_layer_2(f)

{

if(refresh_stereo==1) 리프레시된다면

{

for(b=0;b<nrof_bins;b++) 모든 주파수 빈들에 대해

{

ild_bin[f,b] global 값에 관하여 상기

빈 내의 ild를 코딩

}

else 리프레시가 아니라면

{

for(b=0;b<nrof_bins;b++) 모든 빈들에 대해

{

ild_bin_diff[f,b] 이전 프레임의 특정 빈

내의 값에 관하여 특정

빈내에서 ild 코딩

}

여기서:

용어 "refresh_stereo"는 스테레오 파라미터들이 리프레시되는지 여부

(0= 거짓, 1= 참)를 표시하는 플래그이다.

용어 "ild_global[sf]"는 프레임 f에 대한 전체 주파수 영역에 대한 ILD의 호프만 인코딩 절대 표현 레벨(Huffman encoded absolute representation level)을 나타낸다.

용어 "ild_global_diff[f]"는 프레임 f에 대한 전체 주파수 영역에 대한 ILD의 호프만 인코딩 상대(relative) 표현 레벨을 나타낸다.

용어 "ild_bin[f,b]"는 프레임 f 및 빈 b에 대한 ILD의 호프만 인코딩 상대 표현 레벨을 나타낸다.

용어 "ild_bin_diff[f,b]"는 프레임 f 및 빈 b에 대한 ILD의 호프만 인코딩 상대 표현 레벨을 나타낸다.

상술된 실시예들은 본 발명을 제한하려고 예시한 것이 아니고, 당업자는 첨부된 청구의 범위를 벗어나지 않고 많은 대안 실시예들을 이루어낼 수 있을 것이다.

본 발명이 스테레오 신호에 관련하여 도면들에서 설명되었지만, 2개 이상의 채널 오디오 신호의 확장이 당업자에 의해 용이하게 이루어질 수 있다.

청구의 범위에서, 괄호간에 위치된 참조 부호들은 청구를 제한하는 것으로서 해석해서는 안될 것이다. 단어 "포함하는(comprising)"은 청구항에 나열된 것들외의 요소들 또는 단계들의 존재를 배제하는 것이 아니다. 본 발명은 여러 별개의 요소들을 포함하는 하드웨어의 수단, 및 적절하게 프로그램된 컴퓨터의 수단에 의해 구현될 수 있다. 여러 수단들을 열거하는 장치 청구항에서, 이들 여러 수단들은 하드웨어의 단일 및 동일한 아이템에 의해 실시될 수 있다. 일정 측정들이 상호간에 상이한 종속 청구항들에서 인용되는 단순한 사실은 이들 측정들의 조합이 유익하게 사용될 수 없다는 것을 표시하는 것이 아니다.

요약하면, 다채널 오디오 신호들은 모노럴 오디오 신호 및 정보로부터 다채널 오디오 신호를 복원하도록 허용하는 모노럴 오디오 신호 및 정보로 코딩된다. 정보는 다채널 오디오 신호의 제 1 주파수 영역에 대한 정보의 제 1 부분을 결정함으로서, 다채널 오디오 신호의 제 2 주파수 영역에 대한 정보의 제 2 부분을 결정함으로서 생성된다. 제 2 주파수 영역은 제 1 주파수 영역의 일부이고, 따라서, 제 2 주파수 영역은 제 1 주파수 영역의 부분-범위이다. 정보는 비트 레이트에 대한 디코딩 품질의 조정이 가능하도록 다층이 된다.

Claims

적어도 2개의 오디오 채널들을 포함하는 다채널 오디오 신호를 인코딩하는 방법에 있어서:

단일 채널 오디오 신호를 생성하고, 상기 단일 채널 오디오 신호를 비트 스트림으로 인코딩하여, 인코딩된 단일 채널 오디오 신호를 생성하는 단계; 및

상기 적어도 2개의 오디오 채널들로부터 정보를 생성하는 단계로서, 상기 단일 채널 오디오 신호 및 상기 정보로부터 상기 다채널 오디오 신호를 요구된 품질의 레벨로 복원하도록 허용하는, 상기 정보 생성 단계를 포함하고, 상기 정보 생성 단계는:

상기 다채널 오디오 신호의 제 1 주파수 영역에 대한 상기 정보의 제 1 부분을 결정하고, 상기 정보의 제 1 부분을 상기 비트 스트림으로 인코딩하여, 상기 정보의 인코딩된 제 1 부분을 생성하는 단계; 및

상기 다채널 오디오 신호의 제 2 주파수 영역에 대한 상기 정보의 제 2 부분을 결정하고, 상기 제 2 주파수 영역은 상기 제 1 주파수 영역의 일부이고, 상기 정보의 제 2 부분을 상기 비트 스트림으로 인코딩하여, 상기 정보의 인코딩된 제 2 부분을 생성하는 단계를 포함하는, 다채널 오디오 신호 인코딩 방법.
적어도 2개의 오디오 채널들을 포함하는 다채널 오디오 신호를 인코딩하는 방법에 있어서,

단일 채널 오디오 신호를 생성하는 단계; 및

상기 적어도 2개의 오디오 채널들로부터 정보를 생성하는 단계로서, 상기 단일 채널 오디오 신호 및 상기 정보로부터 상기 다채널 오디오 신호를 요구된 품질의 레벨로 복원하도록 허용하는, 상기 정보 생성 단계를 포함하고, 상기 정보 생성 단계는:

상기 인코딩된 다채널 오디오 신호의 최대 허용가능 비트 레이트를 수신하는 단계; 및

상기 단일 채널 오디오 신호 및 상기 정보의 제 1 부분을 포함하는 상기 인코딩된 다채널 오디오 신호의 비트 레이트가 상기 최대 허용가능 비트 레이트보다 높지 않다면, 상기 다채널 오디오 신호의 제 1 주파수 영역에 대한 상기 정보의 제 1 부분만을 결정하는 단계를 포함하는, 다채널 오디오 신호 인코딩 방법.
제 1 항 또는 제 2 항에 있어서,

상기 단일 채널 오디오 신호는 상기 적어도 2개의 오디오 채널들의 특정 조합인, 다채널 오디오 신호 인코딩 방법.
제 1 항에 있어서,

상기 정보는 파라미터들의 세트들을 포함하고, 상기 제 1 부분은 상기 파라미터들의 세트들 중 적어도 제 1 세트를 포함하고, 상기 제 2 부분은 상기 파라미터들의 세트들 중 적어도 제 2 세트를 포함하며, 파라미터들의 각각의 세트는 대응하는 주파수 영역에 연관되는 것을 특징으로 하는, 다채널 오디오 신호 인코딩 방법.
제 4 항에 있어서,

상기 파라미터들의 세트들은 적어도 하나의 로컬리제이션 큐(localization cue)를 포함하는 것을 특징으로 하는, 다채널 오디오 신호 인코딩 방법.
제 5 항에 있어서,

상기 적어도 하나의 로컬리제이션 큐는:

인터로럴(interaural) 레벨차, 인터로럴 시간 또는 위상차, 또는 인터로럴 상호 상관으로부터 선택되는 것을 특징으로 하는, 다채널 오디오 신호 인코딩 방법.
제 1 항 또는 제 2 항에 있어서,

상기 제 1 주파수 영역은 상기 다채널 오디오 신호의 전체 대역폭을 커버하는 것을 특징으로 하는, 다채널 오디오 신호 인코딩 방법.
제 1 항에 있어서,

상기 제 1 주파수 영역은 상기 다채널 오디오 신호의 전체 대역폭을 커버하고, 상기 제 2 주파수 영역은 상기 전체 대역폭의 일부를 커버하고,

상기 정보의 제 2 부분의 결정 단계는, 상기 제 2 주파수 영역 및 다른 주파수 영역들의 세트 둘 다에 대한 파라미터들의 세트들을 결정하고, 상기 제 2 주파수 영역 및 상기 다른 주파수 영역들의 세트는 상기 전체 대역폭을 커버하고, 상기 다른 주파수 영역들의 세트는 적어도 하나의 다른 주파수 영역을 포함하는 것을 특징으로 하는, 다채널 오디오 신호 인코딩 방법.
제 8 항에 있어서,

상기 단일 채널 오디오 신호 및 상기 정보의 제 1 부분은 상기 인코딩된 다채널 오디오 신호에 항상 존재하는 정보의 기본층을 형성하고; 및

상기 방법은 상기 인코딩된 다채널 오디오 신호의 최대 허용가능 비트 레이트를 수신하는 단계를 포함하고, 상기 정보의 제 2 부분은, 상기 인코딩된 기본층 및 향상층의 비트 레이트가 상기 최대 허용가능 비트 레이트보다 높지 않을 때만 인코딩되는 정보의 향상층을 형성하는 것을 특징으로 하는, 다채널 오디오 신호 인코딩 방법.
제 4 항에 있어서,

인코딩된 정보의 특정 프레임에서의 상기 정보의 제 1 부분의 상기 결정 단계는 상기 특정 프레임에서의 상기 파라미터들의 세트들 중 상기 제 1 세트를 결정하는 단계, 및 상기 특정 프레임 이전의 프레임의 상기 파라미터들의 세트들 중 상기 제 1 세트에 기초하여 상기 파라미터들의 세트들 중 상기 제 1 세트를 코딩하는 단계를 포함하는 것을 특징으로 하는, 다채널 오디오 신호 인코딩 방법.
제 8 항에 있어서,

상기 인코딩된 정보의 특정 프레임에서의 상기 정보의 제 2 부분의 상기 결정 단계는 상기 특정 프레임에서의 상기 제 2 부분의 상기 파라미터들의 세트들을 결정하는 단계, 및 상기 특정 프레임 이전의 프레임의 상기 파라미터들의 세트들에 기초하여 상기 특정 프레임에서의 상기 제 2 부분의 상기 파라미터들의 세트들을 코딩하는 단계를 포함하는 것을 특징으로 하는, 다채널 오디오 신호 인코딩 방법.
제 8 항에 있어서,

상기 인코딩된 정보의 특정 프레임에서의 상기 정보의 제 2 부분의 상기 결정 단계는 상기 특정 프레임에서의 상기 제 2 부분의 상기 파라미터들의 세트들을 결정하는 단계, 및 상기 특정 프레임 이전의 프레임의 상기 파라미터들의 세트들 중 상기 제 1 세트에 기초하여 상기 특정 프레임에서의 상기 제 2 부분의 상기 파라미터들의 세트들을 코딩하는 단계를 포함하는 것을 특징으로 하는, 다채널 오디오 신호 인코딩 방법.
제 10 항 내지 제 12 항 중 어느 한 항에 있어서,

상기 결정 단계는 상기 특정 프레임에서의 상기 대응하는 파라미터들과 상기 특정 프레임 이전의 상기 프레임간의 차를 계산하는 단계를 포함하는 것을 특징으로 하는, 다채널 오디오 신호 인코딩 방법.
적어도 2 개의 오디오 채널들을 포함하는 다채널 오디오 신호를 코딩하기 위한 인코더에 있어서:

단일 채널 오디오 신호를 생성하기 위한 수단; 및

상기 적어도 2개의 오디오 채널들로부터 정보를 생성하기 위한 수단으로서, 상기 단일 채널 오디오 신호 및 상기 정보로부터 상기 다채널 오디오 신호를 요구된 품질의 레벨로 복원하도록 허용하는, 상기 정보 생성 수단을 포함하고, 상기 정보 생성 수단은:

상기 다채널 오디오 신호의 제 1 주파수 영역에 대한 상기 정보의 제 1 부분을 결정하기 위한 수단; 및

상기 다채널 오디오 신호의 제 2 주파수 영역에 대한 상기 정보의 제 2 부분을 결정하기 위한 수단으로서, 상기 제 2 주파수 영역은 상기 제 1 주파수 영역의 일부인, 상기 제 2 부분 결정 수단을 포함하는, 인코더.
적어도 2개의 오디오 채널들을 포함하는 다채널 오디오 신호를 인코딩하기 위한 인코더에 있어서:

단일 채널 오디오 신호를 생성하기 위한 수단; 및

상기 적어도 2개의 오디오 채널들로부터 정보를 생성하기 위한 수단으로서, 상기 단일 채널 오디오 신호 및 상기 정보로부터 상기 다채널 오디오 신호를 요구된 품질의 레벨로 복원하도록 허용하는, 상기 정보 생성 수단을 포함하고, 상기 정보 생성 수단은:

상기 인코딩된 다채널 오디오 신호의 최대 허용가능 비트 레이트를 수신하기 위한 수단; 및

상기 단일 채널 오디오 신호 및 상기 정보의 제 1 부분을 포함하는 상기 인코딩된 다채널 오디오 신호의 비트 레이트가 상기 최대 허용가능 비트 레이트보다 높지 않다면, 상기 다채널 오디오 신호의 제 1 주파수 영역에 대한 상기 정보의 제 1 부분만을 결정하기 위한 수단을 포함하는, 인코더.
오디오 신호를 공급하기 위한 장치에 있어서:

오디오 신호를 수신하기 위한 입력;

인코딩된 오디오 신호를 얻기 위해 상기 오디오 신호를 인코딩하기 위한 제 14 항 또는 제 15 항에서 청구된 인코더; 및

상기 인코딩된 오디오 신호를 공급하기 위한 출력을 포함하는, 오디오 신호 공급 장치.
인코딩된 오디오 신호에 있어서:

단일 채널 오디오 신호; 및

적어도 2개의 오디오 채널들로부터의 정보로서, 상기 단일 채널 오디오 신호 및 상기 정보로부터 다채널 오디오 신호를 요구된 품질의 레벨로 복원하도록 허용하는, 상기 정보를 포함하고, 상기 정보는:

상기 다채널 오디오 신호의 제 1 주파수 영역에 대한 상기 정보의 제 1 부분; 및

상기 다채널 오디오 신호의 제 2 주파수 영역에 대한 상기 정보의 제 2 부분으로서, 상기 제 2 주파수 영역은 상기 제 1 주파수 영역의 일부인, 상기 정보의 제 2 부분을 포함하는, 인코딩된 오디오 신호.
제 17 항에서 청구된 인코딩된 오디오 신호가 저장되는 저장 매체.
제 17 항에서 청구된 인코딩된 다채널 오디오 신호를 디코딩하는 방법에 있어서:

디코딩된 단일 채널 오디오 신호를 얻는 단계;

상기 정보로부터 디코딩된 정보를 얻는 단계로서, 상기 디코딩된 단일 채널 오디오 신호 및 상기 디코딩된 정보로부터 상기 다채널 오디오 신호를 복원하도록 허용하고, 상기 디코딩된 정보는 상기 정보의 제 1 부분 및 상기 정보의 제 2 부분을 포함하는, 상기 디코딩된 정보를 얻는 단계; 및

상기 디코딩된 다채널 오디오 신호를 생성하기 위해, 상기 정보의 제 1 부분 또는 상기 정보의 제 1 부분 및 상기 제 2 부분을 상기 단일 채널 오디오 신호에 적용하는 단계를 포함하는, 디코딩 방법.
인코딩된 오디오 신호를 디코딩하기 위한 디코더에 있어서:

디코딩된 단일 채널 오디오 신호를 얻기 위한 수단;

정보로부터 디코딩된 정보를 얻기 위한 수단으로서, 상기 디코딩된 단일 채널 오디오 신호 및 상기 디코딩된 정보로부터 다채널 오디오 신호를 복원하도록 허용하고, 상기 디코딩된 정보는 상기 정보의 제 1 부분 및 상기 정보의 제 2 부분을 포함하는, 상기 디코딩된 정보를 얻기 위한 수단; 및

상기 디코딩된 다채널 오디오 신호를 생성하기 위해, 상기 정보의 제 1 부분 및 상기 정보의 제 2 부분을 상기 단일 채널 오디오 신호에 적용하기 위한 수단을 포함하는, 디코더.
디코딩된 오디오 신호를 공급하기 위한 장치에 있어서,

인코딩된 오디오 신호를 수신하기 위한 입력;

다채널 출력 신호를 얻기 위해, 상기 인코딩된 오디오 신호를 디코딩하기 위한 제 20 항에서 청구된 디코더; 및

상기 다채널 출력 신호를 공급하거나 또는 재생하기 위한 출력을 포함하는, 디코딩된 오디오 신호 공급 장치.