KR100857920B1

KR100857920B1 - 멀티채널 신호를 복원하기 위한 장치 및 방법과 이를 위한파라미터 데이터 세트를 발생하기 위한 장치 및 방법

Info

Publication number: KR100857920B1
Application number: KR1020077005307A
Authority: KR
Inventors: 랄프 스페르슈나이더; 쥐르겐 헤르; 요한니스 힐퍼트; 크리스챤 에르텔; 스테판 게이-에르스버거
Original assignee: 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우.
Priority date: 2004-09-08
Filing date: 2005-08-10
Publication date: 2008-09-10
Also published as: US20070206690A1; IL181743A0; JP4601669B2; NO338932B1; NO20071132L; JP2008512708A; KR20070065314A; CN101014999B; PT1687809E; US8731204B2; ATE409938T1; CN101014999A; EP1687809B1; HK1093595A1; BRPI0515651A; CA2579114C; CA2579114A1; AU2005281966A1; DE502005005522D1; EP1687809A1

Abstract

멀티채널 파라미터 복원 동작 중에 동기 모드 또는 비동기 모드에 대한 융통성 있는 시그널링 동작을 수행하기 위해, 파라미터 구성 명령을 데이터 흐름 내에 삽입하고 이 명령을 멀티채널 복원 수단을 구성하기 위해 멀티채널 디코더 측에 마련한 구성 수단에서 사용하게 한다. 파라미터 구성 명령이 제1의 의미를 가질 때, 구성 수단은 입력 데이터 중 부가 구성 정보 항목을 검색한다. 한편, 파라미터 구성 명령이 다른 의미를 가질 때, 구성 수단은 전송 채널 데이터를 코딩한 인코딩 알고리즘에 관한 정보 항목에 근거하여 멀티채널 복원 수단에 대한 구성 설정을 수행한다. 이에 의해 파라미터 데이터와 디코딩된 전송 채널 데이터 간의 정확한 조합이 항상 유지되게 하는 것을 효율적으로 그리고 융통성 있게 보장한다.

멀티채널 파라미터 복원, MP3 디코더, 데이터 신택스, 파라미터 구성 정보

Description

멀티채널 신호를 복원하기 위한 장치 및 방법과 이를 위한 파라미터 데이터 세트를 발생하기 위한 장치 및 방법{Device and method for reconstructing a multichannel audio signal and for generating a parameter data record therefor}

본 발명은 파라메트릭 멀티채널 처리 방법에 관한 것이며, 특히 융통성 있는 데이터 신택스를 발생 및/또는 읽어내고 또 파라미터 데이터를 다운믹스된 데이터 및/또는 전송 채널 데이터와 조합하기 위한 인코더/디코더에 관한 것이다.

2개의 스테레오 채널에 부가하여, 권장할 만한 멀티채널 서라운드 시스템은 중앙 채널 C와 2개의 서라운드 채널, 즉 좌측 서라운드 채널 Ls 및 우측 서라운드 채널 Rs, 그리고 가능하면 LFE 채널(저주파 증강 채널)이라 부르는 서브우퍼 채널을 포함한다. 이와 같은 기준 사운드 포맷은 쓰리/투(플러스 LFE) 스테레오라 불리며 근래 5.1 멀티채널이라 불리기도 한다. 이는 3개의 전방 채널과 2개의 서라운드 채널이 있음을 뜻한다. 여기서, 5개 또는 6개의 전송 채널이 필요하다. 재생 환경에서, 적어도 5개의 라우드스피커가 각각 서로 다른 5개 위치에 놓일 때 바르게 위 치한 5개 라우드스피커로부터 소정 거리에서 최적의 듣기 좋은 지점(sweet spot)을 얻게 된다. 그러나, 위치 설정에 관한 한, 서브우퍼는 비교적 자유롭게 사용될 수 있다.

멀티채널 오디오 신호를 전송하는데 필요한 데이터 량을 줄이기 위한 몇 가지 방법이 있다. 이들 방법은 소위 조인트 스테레오 기술이라고도 불린다. 조인트 스테레오 기술을 설명하기 위해 도 5를 참고한다. 도 5는 조인트 스테레오 장치(60)를 보인 것이다. 이 장치는 예를 들어 인텐시티 스테레오 기술(IS 기술) 또는 바이노럴 큐 코딩 기술(BCC 기술)을 구현한 장치일 수 있다. 이 장치는 일반적으로 적어도 2개의 채널(CH1,CH2,...CHn)을 입력 신호로 받아들이고, 적어도 하나의 단일 캐리어 채널(다운믹스) 및 파라미터 데이터, 즉 1개 또는 그 이상의 파라미터 세트를 출력한다. 파라미터 데이터가 정의됨으로써 디코더에서 각각의 오리지날 채널(CH1,CH2,...CHn)에 대한 근사가 계산될 수 있다.

일반적으로, 캐리어 채널은 서브밴드 샘플, 스펙트럼 계수 또는 시간 영역 샘플 등을 포함하여 기본 신호에 대해 비교적 자세한 표현을 제공하는 반면, 파라미터 데이터 및/또는 파라미터 세트는 위와 같은 샘플 또는 스펙트럼 계수를 포함하지 않는다. 대신에, 파라미터 데이터는 단지 곱에 의한 가중, 시간 편이, 주파수 편이 등과 같은 소정의 복원 알고리즘을 제어하기 위한 제어 파라미터를 포함한다. 따라서, 파라미터 데이터는 신호 또는 관련 채널의 비교적 거친 표현만을 포함한다. 수치로 말하자면, 예를 들어 AAC 압축 방법을 사용하여 코딩된 캐리어 채널에서 필요한 데이터의 양은 60 - 70 kbit/s 정도인 반면, 하나의 채널에 대한 파라미 터 부수 정보가 필요로 하는 데이터의 양은 1.5 kbit/s 정도이다. 파라미터 데이터에 대한 예는, 이후에 설명될 공지의 스케일링 팩터, 인텐시티 스테레오 정보 또는 바이노럴 큐(binaural cue) 파라미터이다.

인텐시티 스테레오 코딩 방법은 AES Preprint 3799호 논문 "Intensity Stereo Coding", J.Herre, K.H.Brandenburg, D.Lederer, at 96th AES, February 1994, Amsterdam 에 설명되어 있다. 일반적으로, 인텐시티 스테레오의 개념은 양쪽 스테레오 오디오채널의 데이터에 적용될 주축 변환(main axis transform)방법에 기초하고 있다. 대부분의 데이터 포인트가 제1 주축 근방에 배치되어 있을 때, 코딩 이득은 양 스테레오 신호를 코딩하기 전에 소정의 각도로 회전시킴에 의해 얻을 수 있다. 그러나 이 방법은 실제 스테레오 재생 방법에 항상 적용되는 것은 아니다. 좌측 및 우측 채널에 대해 복원된 신호는 같이 전송되는 신호에 서로 다른 가중치를 주고 크기조정을 한 변형물로 구성된다. 그럼에도, 그 복원된 신호는 진폭이 서로 다르지만 각각의 위상정보에 대해서는 동일하다. 그러나, 양쪽의 원래 오디오 채널에 대한 에너지-시간 엔벌로프는 전형적으로 주파수 선택 방식으로 동작하는 선택적 스케일링 동작에 의해 유지된다. 이 방법은 우세한 공간적 큐가 에너지 엔벌로프에 의해 결정되고 있는 고주파 영역에서 인간의 소리 지각 능력에 합치한다.

더구나, 실제 적용에 있어, 전송된 신호, 즉 캐리어 채널은 좌우 채널 성분을 회전시키는 대신 좌측 채널과 우측 채널의 합 신호로부터 형성된다. 더욱이, 이 처리, 즉 크기조정 동작을 수행하기 위해 인텐시티 스테레오 파라미터를 발생하는 동작은 주파수 선택적으로, 다시 말해 각각의 스케일 팩터 밴드에 대해 서로 독립 적으로, 인코더 주파수 분할 방식으로 수행된다. 바람직하게, 좌우 채널은 결합하여 결합 또는 "캐리어" 채널을 형성한다. 이 결합 채널에 부가하여 인텐시티 스테레오 정보가 결정된다. 인텐시티 스테레오 정보는 제1 채널의 에너지, 제2 채널의 에너지 및 결합 채널의 에너지에 따라서 결정된다.

바이노럴 큐 코딩(BCC) 방법은 AES convention paper 5574호 논문, "Binaural cue coding applied to stereo and multi-channel audio compression", C. Faller, F. Baumgarte, May 2002, Munich 에 설명되어 있다. BCC 코딩 방법에서, 다수의 오디오 입력채널은 윈도 중첩과 함께 DFT 기반 변환방법을 사용하여 스펙트럼 표현으로 변환된다. 그 결과로 생긴 스펙트럼은 비중첩 파티션으로 분할된다. 각 파티션은 동등한 직각 대역폭(ERB)에 비례한 대역폭을 갖는다. 채널간 레벨 차(ICLD) 및 채널간 시간 차(ICTD)가 각 파티션 별로, 즉 각각의 밴드에 대해 및 프레임 k에 대해, 즉 시간 샘플 블록에 대해 계산된다. ICLD 및 ICTD 파라미터는 양자화되고 코딩되어 BCC 비트열로 만들어진다. 채널간 레벨 차 및 채널간 시간 차가 기준 채널에 비례하여 각 채널에 주어진다. 특히, 파라미터들이 처리될 신호의 특정 분할에 따라 미리 정해진 공식에 의해 계산된다.

디코더 측에서 본다면, 디코더는 모노 신호 및 BCC 비트열, 즉 채널간 시간 차에 대한 제1의 파라미터 세트 및 프레임당 채널간 레벨 차에 대한 제2의 파라미터 세트를 수신한다. 모노 신호는 주파수 영역으로 변환되고 나서 합성 블록으로 입력된다. 합성 블록은 또한 디코딩된 ICLD 및 ICTD 값을 받는다. 합성 블록 또는 복원 블록에서, BCC 파라미터(ICLD 및 ICTD)는 멀티채널 신호를 합성하기 위해 모 노 신호에 대한 가중 연산을 수행하는 데 사용된다. 이 동작은 주파수/시간 변환 후 원본 멀티채널 오디오 신호가 복원됨을 나타낸다.

BCC 코딩 방법에 있어서, 조인트 스테레오 모듈(60)은 채널 부수 정보를 출력하도록 동작하여 파라메트릭 채널 데이터가 양자화되고 ICLD 및 ICTD 파라미터가 코딩된다. 여기서 오리지날 채널 중 어느 하나가 채널 부수 정보를 코딩하기 위한 기준 채널로 사용된다. 일반적으로, 캐리어 채널은 관여한 원래 채널의 합으로 형성된다.

물론, 상기한 기술은 디코더에 대해 모노 신호를 제공하여 단지 캐리어 채널을 디코딩할 수 있을 뿐, 하나 이상의 입력 채널에 대해 하나 또는 그 이상의 근사를 발생시키기 위한 파라미터 데이터를 생성하지는 못한다.

BCC 기술이라 알려진 오디오 코딩 기술은 부가적으로 미합중국 특허출원 공개 US 2003/0219130 A1, 2003/0026441 A1, 2003/0035553 A1에 상세히 설명되어 있다. 부가적인 참고 문헌으로서는 IEEE 회보에 게재된 논문 "Binaural Cue Coding. Part II: Schemes and Applications" C.Faller, F.Baumgarte, Transactions on Audio and Speech Proc., Vol.11, No.6, Nov. 2003 을 들 수 있다. 또한 다음의 논문 "Binaural Cue Coding applied to Stereo and Multi-Channel Audio compression" C. Faller and F. Baumgarte, Preprint, 112th Convention of the Audio Engineering Society (AES), May 2002, 및 "MP3 Surround: Efficient and Compatible Coding of Multi-Channel Audio" J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, C. Spenger, 116th AES Convention, Berlin, 2004, Preprint 6049 를 참고하라.

이하에, 멀티채널 오디오 코딩을 위한 일반적인 BCC 코딩 방법에 대해서 도 6 내지 도 8을 참고하여 상세히 설명한다. 도 6은 멀티채널 오디오 신호의 코딩 및 전송을 위한 일반적인 바이노럴 큐 코딩(BCC) 방법의 개요를 나타낸다. 멀티채널 오디오 입력신호는 BCC 인코더(112)의 입력단(110)으로 입력되고, 다운믹스 블록(114)에서 "믹스 다운(mix down)" 된다. 즉, 단일의 합 채널로 변환된다. 이 예에서, 입력(110)에서의 멀티채널 신호는 전방 좌측 채널, 전방 우측 채널, 좌측 서라운드 채널, 우측 서라운드 채널 및 중앙 채널로 구성된 5-채널 서라운드 신호이다. 통상적으로, 다운믹스 블록은 상기 5개 채널 신호를 단순히 모노 신호에 더하는 것에 의해 합 신호를 생성한다. 이와 다른 공지된 다운믹싱 방법은, 멀티채널 입력신호를 사용하여 어떤 경우라도 원시 입력 채널의 수보다 작은 수의 다운믹스 채널을 갖는 다운믹스 신호를 발생하는 것이다. 이 예에서, 5개의 입력 채널로부터 4개의 캐리어 채널이 생성되었다면 다운믹스 동작은 이미 수행된 것이다. 이 단일 출력 채널 및/또는 수개의 출력 채널은 합 신호 출력 라인(115)으로 출력된다.

BCC 분석 블록(116)에서 얻어진 부수정보는 부수정보 출력 라인(117)으로 출력된다. BCC 분석 블록(116)에서, 채널간 레벨 차(ICLD), 채널간 시간 차(ICTD) 또는 채널간 상관값(ICC 값)이 계산될 수 있다. 따라서, BCC 합성 블록(122)에서 복원 동작을 위해 3가지 서로 다른 파라미터 세트, 즉 채널간 레벨 차(ICLD), 채널간 시간 차(ICTD) 및 채널간 상관값(ICC)이 사용된다.

합 신호 및 부수 정보는 파라미터 세트와 함께, 통상 양자화 및 코딩된 형태 로서 BCC 디코더(120)로 전송된다. BCC 디코더는 전송된(코딩된 전송인 경우 디코딩된) 합 신호를 다수의 서브밴드로 분해하고, 스케일링, 지연 및 부가적 처리를 가하여 복원될 수개 채널에 대한 서브밴드를 생성한다. 이 처리는 출력(121)에서 복원된 멀티채널 신호의 ICLD, ICTD 및 ICC 파라미터(큐)가 BCC 인코더(112)의 입력단(10)에 입력되는 원시 멀티채널 신호에 대한 각각의 큐와 유사하게 하는 식으로 수행된다. 이를 위해, BCC 디코더(120)는 BCC 합성 블록(122)과 부수 정보 처리 블록(123)을 포함한다.

다음에, 도 7을 참고하여 BCC 합성 블록(122)의 내부 구성을 설명한다. 합 신호 라인(115) 상의 합 신호는 통상 오디오 필터 뱅크(FB: 125)로 구현되는 시간/주파수 변환 장치로 입력된다. FB(125)의 출력에는 N개의 서브밴드 신호가 존재하거나, 극단적인 경우, 오디오 필터 뱅크(125)가 N개의 시간 영역 샘플로부터 N개의 스펙트럼 계수를 발생하는 변환을 수행할 경우 일단의 스펙트럼 계수가 나타난다.

BCC 합성 블록(122)은 지연 단(126), 레벨 수정 단(127), 상관관계 처리 단(128) 및 역 필터 뱅크 단(IFB: 129)을 더 포함한다. IFB(129)의 출력에서, 5-채널 서라운드 시스템인 경우, 예를 들어 5개 채널을 갖는 멀티채널 오디오 신호가 복원되어 도 6에 나타낸 것과 같은 일단의 라우드 스피커(124)로 출력된다.

도 7에 나타낸 것과 같이, 입력 신호 s(n)는 FB(125)를 통해 주파수 영역 또는 필터 뱅크 영역으로 변환된다. FB(125)의 출력 신호는 승산 되어, 도면에 곱 노드(130)로 표시된 것과 같은 동일한 신호의 수 개의 변형을 얻게 된다. 원시 신호에 대한 변형의 개수는 복원될 출력 신호에서 출력 채널의 개수와 동일하다. 노 드(130)에서 원시 신호에 대한 각각의 변형이 소정의 지연 d₁, d₂, ..., d_i, ..., d_n 을 거친다면, 지연 단(126)의 출력에서 동일한 신호의 변형이지만 서로 다른 지연을 갖는 신호를 얻게 된다. 지연 파라미터들은 도 6의 부수 정보 처리블록(123)에서 산출되며, 이들 파라미터는 BCC 분석 블록(116)에서 결정된 채널간 시간 차로부터 유도된다.

유사하게, 레벨 수정 단(127)에서의 곱셈 파라미터들 a₁, a₂,..., a_i,..., a_n 역시 BCC 분석 블록(116)에서 계산된 채널간 레벨 차에 근거하여 부수 정보 처리 블록(123)에서 산출된다.

BCC 분석 블록(116)에서 계산된 ICC 파라미터는 상관관계 처리 단(128)의 동작을 제어하여 지연 및 레벨 조작된 신호들 사이에서 결정된 상관 값이 상관관계 처리 단(128)의 출력에 나타날 수 있게 한다. 주목할 것은, 처리 단(126), (127), (128)의 배치 순서가 도 7에 보인 것과 다를 수도 있다.

더욱 주목해야 할 것은, 오디오신호가 블록 방식 처리에서는 BCC 분석 또한 블록에 관해 수행된다는 것이다. 더욱이, BCC 분석 또한 주파수에 관계하여, 즉 주파수 선택적 방법으로 수행된다. 이것은 다시 말해, 각 스펙트럼 밴드에 대해 각 블록에 관한 ICLD 파라미터, ICTD 파라미터 및 ICC 파라미터가 구해진다는 것을 의미한다. 따라서 모든 밴드에 걸쳐 적어도 하나의 채널에서의 적어도 하나의 블록에 대한 ICTD 파라미터는 ICTD 파라미터 세트를 나타낸다. 같은 식으로, ICLD 파라미터 세트는 적어도 하나의 출력 채널을 복원하기 위해 모든 주파수 밴드의 적어도 하나의 블록에 대한 모든 ICLD 파라미터를 대표한다. 다시, ICC 파라미터 세트 역시 적어도 하나의 출력 채널을 복원하기 위해 입력 채널 또는 합 채널에 기초하여 여러 밴드의 적어도 하나의 블록에 대한 수 개의 개별적인 ICC 파라미터를 포함한다.

다음에, 도 8을 참조하여 BCC 파라미터를 결정하기 위한 과정을 설명한다. 일반적으로, ICLD, ICTD 및 ICC 파라미터들은 어떠한 채널 쌍 사이에서도 결정될 수 있다. 통상, ICLD 및 ICTD 파라미터는 기준 채널과 각각의 다른 입력 채널 간에서 결정되고 있으며, 이에 따라 기준 채널을 제외하고 입력 채널 각각에 대한 독특한 파라미터 세트가 존재한다. 이에 대해 도 8의 A로 나타내었다.

그러나, ICC 파라미터는 다른 방식으로 결정될 수 있다. 일반적으로, 도 8의 B에 나타낸 것과 같이, ICC 파라미터는 인코더에서 어떠한 채널 쌍 사이에서도 생성될 수 있다. 이 경우, 디코더는 ICC 파라미터가 어떠한 채널 쌍 사이에서 원시 멀티채널 신호에서와 거의 동일하게 되도록 ICC 파라미터를 합성한다. 그러나, 이것은 매번, 즉 각 시간 프레임에 있어 가장 강한 2개 채널 사이에서만 ICC 파라미터를 산출하기로 계획한 것이다. 이 방법은 도 8의 C에 일 예로서 도시되어 있다. 여기서, 1회에 ICC 파라미터가 채널 1과 2 사이에서 산출 및 전송되고, 2회에 채널 1과 5 사이에서 산출된다. 그리고 디코더는 디코더에서 가장 강한 채널 사이의 채널간 상관 값을 종합하고 나서 나머지 채널 쌍에 대해 채널간 긴밀도를 산출 및 합성하도록 소정의 경험적 법칙을 가한다.

예를 들어, 전송된 ICLD 파라미터에 근거하여 곱셈 파라미터 a₁, ..., a_n의 계산에 대해서는 앞서 인용하였던 AES 총회 논문 5574호를 참조한다. ICLD 파라미터는 어떤 원시 멀티채널 신호에 내재한 에너지 분포를 나타낸다. 보편적으로, 도 8의 A는 정면 좌측 채널과 다른 모든 채널 간의 에너지 차이를 표현하는 4개의 ICLD 파라미터를 표시한다. 부수 정보 처리 블록(123)에서, 곱셈 파라미터들 a₁, ..., a_n은 ICLD 파라미터로부터 유도되어 모든 복원된 출력 채널의 전체 에너지가 전송된 합 신호의 에너지와 동일하게 또는 적어도 이와 비례하게 되도록 한다. 곱셈 파라미터를 결정하는 방법은 간단히 2단계 처리로서 수행될 수 있다. 제1 단계에서, 정면 좌측 채널에 대한 곱셈 계수를 1로 놓는 한편, 도 8의 C에서의 다른 채널들에 대한 곱셈 계수는 전송된 ICLD 값으로 설정한다. 다음 제2 단계에서, 모든 5개 채널의 에너지를 산출하고나서 전송된 합 신호의 에너지와 비교한다. 그 후, 모든 채널에 대해 동등한 크기조정 계수를 적용하여 모든 채널을 축소(downscaling)한다. 여기서, 크기조정 계수는 축소 후 모든 복원된 출력 채널의 전체 에너지가 전송된 합 신호 및/또는 전송된 합 신호들의 전체 에너지와 동일하게 되도록 선택된다.

부가적인 파라미터 세트로서, BCC 인코더로부터 BCC 디코더로 전송된 채널간 긴밀도 측정값 ICC에 대하여 주목할 점은, 긴밀도 처리가, 모든 서브밴드에 대한 가중치 팩터를 20 log 10^-6 과 20 log 10⁶ 사이의 값으로 되는 난수로 곱하는 식으 로 곱셈 팩터 a₁, ..., a_n를 수정하는 것에 의해 수행될 수 있다는 것이다. 유사 난수열의 선택은 바람직하게 모든 밴드에 대해 편차가 거의 동일하게 되고 각 밴드에서의 평균값이 0으로 되는 것을 선택한다. 이 유사 난수열이 각각의 서로 다른 프레임 또는 블록의 스펙트럼 계수에 대해 사용된다. 따라서, 청각 이미지의 폭은 유사 난수열의 편차를 수정하는 것에 의해 제어된다. 보다 큰 편차는 보다 큰 청각 이미지 폭을 만들어낸다. 편차의 수정은 임계 밴드 폭을 가진 개개의 밴드에서 수행될 수 있다. 이것은 청취 현장에서 동시에 복수의 인식 대상이 존재하도록 만든다. 여기서, 각각의 인식 대상은 서로 다른 청각 이미지 폭을 갖는다. 유사 난수열에 대한 적절한 크기 분배는 미합중국 특허출원 공개 제2003/0219130호에 설명된 것과 같은 대수적 눈금에 의한 균일 분배를 이용한다.

예를 들어 일반적 스테레오 디코더에 사용하기 적합한 비트열 형식과 같은 호환가능한 방식으로 5개 채널을 전송하기 위해 매트릭스 기술을 사용할 수 있다. 매트릭싱(matrixing) 방법은 논문, "MUSICAM Surround: A universal multi-channel coding system compatible with ISO/IEC 11172-3" G. Theile, G. Stoll, AES Preprint, October 1992, San Francisco 에 상세히 기재된 바 있다.

더욱이, 부가적인 멀티채널 코딩 방법에 대해, 논문 "Improved MPEG 2 Audio multi-channel encoding", B. Grill, J. Herre, K. H. Brandenburg, E. Eberlein, J. Koller, J. Miller, AES Preprint 3865, February 1994, Amsterdam 을 참조하면, 호환성 매트릭스를 사용하여 원시 입력 채널로부터 다운믹스 채널을 만들어 내 고 있다.

요약하면, BCC 방법은 멀티채널 오디오을 코딩하는 데 있어 효율적이고 하향 호환성을 가진 것이라고 말할 수 있으며, 이에 대해 논문 "Low-Complexity Parametric Stereo Coding", E. Schuijer, J. Breebaart, H. Purnhagen, J. Engdegard, 119th AES Convention, Berlin, 2004, Preprint 6073 에도 설명되어 있다. 이러한 관계에 있어서, MPEG-4 기술표준과 특히 파라메트릭 오디오 기술에 대해서는 ISO/IEC 14496-3: 2001/FDAM 2 (Parametric Audio)로 지정된 표준이 알려져 있다. 여기서, 특히 "Syntax of the ps_-data()"라는 제하의 MPEG-4 표준의 표 8.9에 기재된 신택스를 주목한다. 이 예에서, 신택스 요소 "enable_icc" 및 "enable_ipdopd"에 대해 설명한다. 이들 신택스 요소는 ICC 파라미터 및 채널간 시간 차에 대응하는 위상을 전송하는 동작을 턴 온 및 턴 오프하기 위해 사용된다. 부가적인 신택스 요소로는 "icc_data()", "ipd_data()" 및 "opd_data()"가 있다.

요약하면, 일반적으로 위와 같은 파라메트릭 멀티채널 기술들은 하나 또는 수개의 전송된 캐리어 채널을 채용하고 있다는 것이며, 이때 M개의 전송 채널들은 N개의 오리지날 채널로부터 형성된 것이어서 N개의 출력 채널 또는 K 만큼의 출력 채널을 다시 복원한다. 여기서 K는 오리지날 채널의 수 N과 동일하거나 그보다 작은 수이다.

도 6에서 알 수 있는 바와 같이, BCC 분석은 전형적인 별개의 전처리 과정으로서, N개의 오리지날 채널을 가진 멀티채널 신호로부터 파라미터 데이터를 발생하 는 한편, 하나 또는 그 이상의 전송 채널(다운믹스 채널)을 발생한다. 통상, 그 다운믹스 채널들은 도 6에 도시되지는 않았지만 예를 들어 통상의 MP3 또는 AAC 스테레오/모노 인코더를 통해 압축된다. 이에 따라 출력 측에서 압축된 형태로서 전송 채널 데이터를 표현하는 비트열이 제공되는 한편 파라미터 데이터를 표현하는 부가적인 다른 비트열이 제공된다. 따라서, BCC 분석은 도 6의 다운믹스 채널 및/또는 합 신호(115)의 실제 오디오 코딩 동작과는 별개로 수행된다.

디코더 측에서의 처리도 유사하다. 멀티채널 처리능력을 가진 디코더는 먼저 압축된 다운믹스 신호를 포함하는 비트열을 사용된 코딩 알고리즘에 의거하여 디코딩하고 나서 출력측에서 통상 PCM(펄스 부호 변조) 데이터의 시간 연속으로서 하나 또는 그 이상의 전송 채널을 제공한다. 다음에 BCC 합성이 독립적이고 분리된 후처리 동작으로서 수행된다. BCC 합성은 파라미터 데이터 열을 자체적으로 시그널링하여 데이터를 공급받고, 출력측에서 바람직하게 오디오 디코딩된 다운믹스 신호로부터 원시 입력 채널의 수와 동일한 수개의 출력 채널을 발생한다.

따라서, BCC 분석의 이점은 BCC 분석용으로 별개의 필터 뱅크를 가지며, BCC 합성용으로도 별개의 필터 뱅크를 가짐으로써, 오디오 인코더/디코더용의 필터 뱅크가 독립적으로 오디오 압축 및 멀티채널 복원에 관련한 동작에서 어떠한 상호 약속을 할 필요가 없다. 따라서, 일반적으로 말할 때 오디오 압축이 멀티채널 파라미터 처리와는 독립적으로 수행됨으로써, 양자 처리를 위한 최적의 방법이 될 수 있다는 것이다.

그러나, 이 방법은 멀티채널 복원 및 오디오 디코딩 모두를 위해 전체적인 시그널링이 전송되어야 한다는 단점이 있다. 이것은 통상적 경우로서 오디오 디코더 및 멀티채널 복원 수단 모두가 동일하거나 유사한 처리단계를 수행하고 동일 및/또는 상호 의존적 구성 설정을 필요로 하는 경우 특히 불리하다. 이는 완전히 별개의 방법이기 때문에 시그널링 데이터는 2회 전송되어야 하고 따라서 데이터 량이 인위적으로 "확장"된다. 이것은 전적으로 오디오 코딩/디코딩 및 멀티채널 분석/합성에서 별개의 방법을 채택한 것에 기인한다.

다른 한편, 멀티채널 복원을 오디오 디코딩과 전체적으로 "연결"시키는 것은 융통성을 매우 제한하는 것이다. 그 이유는, 그와 같이 했을 때, 양쪽 처리 단계를 분리하여 최적의 방법으로 각각의 처리 단계를 수행한다는 실제 중요한 목적을 포기하지 않으면 안 되기 때문이다. 따라서, 특히 수회의 연속적인 코딩/디코딩 처리단계("탠덤" 코딩이라고도 부름)에서는 상당한 품질 손실이 발생한다. BCC 데이터가 코딩된 오디오 데이터와 완전히 연결될 경우, 멀티채널 복원은 각 디코딩과 함께 수행되어 레코딩시 멀티채널 합성을 다시 수행해야 한다. 모든 파라메트릭 방법에 본질적으로 손실이 있기 때문에, 반복되는 분석과 합성에 의해 손실이 누적되어 각 인코더/디코더 처리단 마다 상당한 오디오신호의 품질이 저하된다.

이 경우, 파라미터 데이터를 동시에 분석/합성 처리를 하지 않고 오디오 데이터를 디코딩/인코딩하는 것은, 탠덤 체인에서 각각의 오디오 코덱이 동일하게 동작, 즉 동일한 샘플링 비율, 동일한 블록 길이, 동일한 어드밴스 길이, 동일한 윈도우잉, 동일한 변환 방식 등을 가질 때, 다시 말해 동일한 구성을 가질 때, 그리고 부가적으로 각각의 블록 경계가 유지되고 있을 때 가능하다. 그러나, 이와 같은 방법은 전체적으로 기술적 융통성을 매우 제한하는 것이다. 특히, 파라메트릭 멀티채널 기술이 예를 들어 파라미터 데이터를 부가하는 것에 의해 기존의 스테레오 데이터를 보완하도록 설계된 것을 감안할 때 위와 같은 제한은 더욱 견디기 어려운 것이다. 기존의 스테레오 데이터가 다수의 서로 다른 인코더로부터 발생하고, 이 인코더들이 모두 서로 다른 블록 길이를 사용하거나 또는 주파수 영역에서 동작하지 않고 다만 시간 영역 등에서 동작하기 때문에, 위와 같은 제한은 처음부터 나중에 보완해야할 극단적인 예의 방법이라 할 수밖에 없다.

본 발명의 목적은 멀티채널 오디오 신호 또는 복원 파라미터 데이터 세트를 발생하기 위한 융통성 있고 효율적인 방법을 제공하는 데 있다.

이 목적은 청구항 1에 따른 멀티채널 신호를 발생하기 위한 장치와, 청구항 14에 따른 멀티채널 신호를 발생하는 방법, 청구항 15에 따른 파라미터 데이터 세트를 발생하기 위한 장치, 청구항 18에 따른 파라미터 데이터 세트를 발생하기 위한 방법, 청구항 19에 따른 파라미터 데이터 출력을 발생하기 위한 장치, 청구항 20에 따른 파라미터 데이터 출력을 발생하기 위한 방법, 또는 청구항 21에 따른 컴퓨터 프로그램에 의해 달성된다.

본 발명은 전송 채널 데이터와 파라미터 데이터를 구비한 데이터 열이 파라미터 구성 큐를 포함하게 하여 효율성과 융통성을 실현할 수 있다는 발견에 근거를 두고 있다. 파라미터 구성 큐는 인코더 측에 삽입되고 디코더 측에서 평가된다. 이 큐 신호는 멀티채널 복원 수단이 입력 데이터, 즉 인코더에서 디코더로 전송된 데이터로부터 구성될 것인지, 또는 멀티채널 복원 수단이 코딩된 전송 채널 데이터가 디코딩된 코딩 알고리즘에 관한 큐에 의해 구성될 것인지를 나타낸다. 멀티채널 복원 수단은 오디오 디코더의 구성 설정과 동일한 구성 설정을 가짐으로써 코딩된 전송 채널 데이터를 디코딩하거나 적어도 이 설정에 의존한다.

디코더가 제1의 상태, 즉 파라미터 구성 정보가 제1의 의미를 가진 것을 검출했을 때, 디코더는 수신된 입력 데이터에서 부가적인 구성 정보를 찾아내어 멀티채널 복원 수단을 적절히 구성하고, 그 정보를 사용하여 멀티채널 복원 수단의 구성 설정을 실행한다. 이와 같은 구성 설정은 예를 들어 블록 길이, 어드밴스, 샘플링 주파수, 필터 뱅크 제어 데이터, 입도 정보(하나의 프레임 내에 얼마나 많은 BCC 블록이 존재하는가), 채널 구성(예를 들어, MP3의 경우 5.1 출력으로 발생), 스케일드 케이스에서 파라미터 데이터가 필수적인 정보(예를 들어 ICLD) 및 그렇지 않은 정보(ICTD) 등이 될 수 있다.

그러나, 디코더가 파라미터 구성 큐가 제1의 의미와 다른 제2의 의미를 갖는 것으로 결정하였을 때 멀티채널 복원 수단은 전송 채널, 즉 다운믹스 채널의 코딩/디코딩이 기초하고 있는 코딩 알고리즘에 관한 정보에 의거하여 멀티채널 복원 수단의 구성 설정을 선택한다.

한편 파라미터 데이터와 다른 한편으로 압축된 다운믹스 데이터의 개별 개념에 대비할 때, 본 발명의 멀티채널 오디오 신호를 발생하는 장치는 자기 구성을 위해 실제 완전하게 분리되고 자급할 수 있는 오디오 데이터 및/또는 자급할 수 있게 동작하는 업스트림 오디오 디코더에서 멀티채널 복원 수단의 구성을 위해 말하자면 "차용" 한 것이다.

본 발명의 개념은 본 발명의 실시예에서 서로 다른 오디오 코딩 알고리즘이 사용될 때 더욱 강력해 진다. 이 경우, 동기 동작을 수행하기 위해 대량의 명시적인 시그널링 정보가 전송되어야 한다. 동기 동작은 멀티채널 복원 수단이 서로 다른 코딩 알고리즘에 대해 오디오 디코더와 동시에 동작, 즉 대응하는 어드밴스 길이 등을 가지고 동작하고 이에 따라 실제 독립적인 멀티채널 복원 알고리즘이 오디오 디코딩 알고리즘과 일치하여 실행된다.

본 발명에 따르면, 파라미터 구성 큐는 단일 비트로 충분하고 디코더로 시그널링되는데 있어 그 구성을 위해 어떤 오디오 인코더가 다운스트림에 있는지를 탐색한다. 이 후, 디코더는 어떤 오디오 인코더가 다수의 서로 다른 오디오 인코더에 대해 현재 업스트림으로 있는 지에 대한 정보를 수신한다. 이 정보를 수신하였을 때, 멀티채널 디코더에 저장된 구성 테이블에 오디오 코딩 알고리즘의 식별자를 기재하여 각각의 오디오 코딩 알고리즘에 대해 미리 결정된 구성 정보를 검색하고 멀티채널 복원 수단의 적어도 하나의 구성 설정을 실행한다. 이것은 구성이 데이터 열에 명시적으로 시그널링되는, 멀티채널 복원 수단과 오디오 디코더 사이에서 아무런 고려도 하지 않은, 그리고 멀티채널 복원 수단에 의해 본 발명의 오디오 디코더의 "차용"이 존재하지 않는 경우와 비교할 때 막대한 데이터 비율의 절감을 가져온다.

다른 한편, 본 발명의 개념은 구성 정보의 명시적 시그널링이 본래 가지고 있는 매우 높은 융통성을 제공한다. 이것은 파라미터 구성 큐가 데이터 열에서 단일 비트로서 충분하고, 모든 구성 정보를 데이터 열 형태로 전송할 수 있으며, 필요시, 또는 혼합된 형태로 파라미터 구성 정보의 적어도 일부를 데이터 열 형태로 전송할 수 있고, 일단의 레이다운 정보로부터 필요한 정보의 다른 일부를 취할 수 있다.

본 발명의 양호한 실시예에서, 인코더로부터 디코더로 전송된 데이터는 부가적으로 디코더에 대한 연속 큐 시그널링을 포함한다. 연속 큐 시그널링은 현재 또는 이전의 시그널링된 구성 설정에 비추어 구성 설정을 모두 변경시켜야 할 것인지, 또는 구성 설정이 이전과 같이 계속되어야 하는지, 또는 연속 큐 신호의 소정의 설정 값에 반응하여 파라미터 구성 큐를 읽어들일 것인지에 관한 것이다. 파라미터 구성 큐를 읽어들인 뒤 오디오 디코더에 대해 멀티채널 복원 수단을 정렬할 것인지 또는 구성에 관한 적어도 부분적으로 명시적인 정보가 전송 데이터에 포함될 것인지를 결정한다.

도 1은 인코더 측에서 사용할 수 있는 파라미터 데이터 세트를 발생하기 위한 본 발명의 장치를 나타내는 블록 회로도.

도 2는 디코더 측에서 사용할 수 있는 멀티채널 오디오 신호를 발생하기 위한 장치의 블록 회로도.

도 3은 본 발명의 바람직한 실시예에서 도 2의 구성 수단의 동작을 나타내는 주 플로우 챠트.

도 4a는 오디오 디코더와 멀티채널 복원 수단 간의 동기 동작에 사용될 데이터 열을 나타낸 간략도.

도 4b는 오디오 디코더와 멀티채널 복원 수단 간의 비동기 동작에 사용될 데이터 열을 나타낸 간략도.

도 4c는 멀티채널 오디오 신호를 신택스 형태로 발생하기 위한 장치의 바람직한 실시예를 나타낸 도면.

도 5는 멀티채널 인코더의 일반적 구성도.

도 6은 BCC 인코더/BCC 디코더 결합관계를 표현하는 블록도.

도 7은 도 6의 BCC 합성 블록의 구성도.

도 8의 A,B,C는 파라미터 세트 ICLD, ICTD 및 ICC를 산출하기 위한 일반적인 방법을 표현하는 개략도.

본 발명의 바람직한 실시예를 첨부 도면에 관련하여 이하 상세히 설명한다.

도 1은 파라미터 데이터 세트를 발생하기 위한 본 발명의 장치를 나타낸 것이다. 여기서, 파라미터 데이터 세트는 도 1에 나타낸 장치의 출력단(10)에서 출력된다. 파라미터 데이터 세트는, 도 1에 표현하지 않았지만 나중에 설명될 전송 채널 데이터와 함께 파라미터 데이터를 포함한다. 파라미터 데이터는 N개의 오리지날 채널을 대표한다. 여기서, 전송 채널 데이터는 일반적으로 M개의 전송 채널을 포함 하며, 이 전송채널의 수 M은 오리지날 채널의 수 N보다 작고 또한 1과 같거나 크다.

도 1에 나타낸 장치는 인코더 측에 설치되며, 예를 들어 BCC 분석 또는 인텐시티 스테레오 분석 등을 수행하기 위해 설계된 멀티채널 파라미터 장치(11)를 포함한다. 여기서 멀티채널 파라미터 장치(11)는 입력(12)에서 N개의 오리지날 채널을 수신한다. 그러나, 이와 달리 멀티채널 파라미터 장치(11)는 트랜스코더(transcoder) 장치로 설계될 수 있다. 트랜스코더 장치는 미가공 파라미터 입력(13)으로 입력되는 현재 미가공 파라미터 데이터를 사용하여 멀티채널 파라미터 장치(11)의 출력에서 파라미터 데이터를 발생한다. 또한, 멀티채널 파라미터 장치(11)은 미가공 파라미터 데이터 열의 신택스를 변경할 수 있도록 설계될 수 있으며, 그 변경은 예를 들어 미가공 파라미터 데이터 열의 신택스에 시그널링 데이터를 부가하거나, 디코딩될 수 있는 파라미터 세트 또는 현재 미가공 파라미터 데이터와 서로 적어도 부분적으로 무관하여 스킵될 수 있는 파라미터 세트를 기입하는 것이다.

도 1의 장치는 파라미터 구성 큐 PKH를 결정하고 이를 멀티채널 파라미터 장치(11)의 출력에서 파라미터 데이터와 조합하기 위한 시그널링 수단(14)을 더 포함한다. 특히, 시그널링 수단(14)은 파라미터 데이터 세트에 포함된 구성 정보가 멀티채널 복원에 관해 사용될 경우 제1의 의미를 갖는 것으로 파라미터 구성 큐를 결정한다. 이와 달리, 시그널링 수단(14)은 전송 채널을 코딩하기 위해 사용할 또는 코딩에 사용된 코딩 알고리즘에 기초하고 있는 구성 데이터가 멀티채널 복원용으로 사용될 경우에 제2의 의미를 갖는 것으로 하여 파라미터 구성 큐를 결정한다.

끝으로, 도 1에 나타낸 본 발명의 장치는 구성 데이터 기입 수단(15)을 포함한다. 구성 데이터 기입 수단(15)은 구성 정보를 파라미터 데이터와 조합하는 한편 파라미터 구성 큐를 최종 구한 파라미터 데이터 세트에 결합시키도록 설계된다. 따라서, 출력(10)에서 얻어진 파라미터 데이터 세트는 멀티채널 파라미터 장치(11)로부터의 파라미터 데이터, 시그널링 수단(14)으로부터의 파라미터 구성 큐 PKH, 그리고 적용가능하다면 구성 데이터 기입 수단(15)에서 출력된 구성 데이터를 포함한다. 파라미터 데이터 세트에서, 그 데이터 세트의 요소들은 결정된 신택스에 따라 배열되며, 일반적으로 도 1에서 합 장치(16)로 나타낸 것과 같은 장치에 의해 시간 다중화 과정을 거친다.

본 발명의 바람직한 실시예에서, 시그널링 수단(14)은 제어 라인(17)을 통해 구성 데이터 기입 수단(15)과 결합하여, 파라미터 구성 큐가 제1의 의미를 가질 때, 즉 멀티채널 복원에서 디코더에 아무런 구성 정보도 액세스 되지 않지만 명백한 시그널링이 존재할 때, 즉 부가적인 구성 정보가 파라미터 데이터 세트에 나타날 때 구성 데이터 기입 수단(15)을 활성화한다. 한편, 파라미터 구성 큐가 제2의 의미를 가질 경우, 구성 데이터 기입 수단(15)은 출력단(10)에서 파라미터 데이터 세트로 데이터를 공급하지 않는 것과 같이 활성화되지 않는다. 이것은 이후에 설명되겠지만 그 데이터가 디코더에 의해 독출되지 않거나 디코더에서 필요한 것이 아니기 때문이다. 혼합된 솔루션에서, 데이터 열의 모든 정보를 시그널링하는 것 대신에, 나머지 일부가 예를 들어 디코더 내의 구성 테이블에서 참조 될 때 구성 정 보의 일부분만이 시그널링될 수 있다.

시그널링 수단(14)은 제어 입력(18)을 포함하고, 이를 통해 시그널링 수단(14)은 파라미터 구성 큐가 제1의 의미를 가질 것인지 아니면 제2의 의미를 가질 것인지에 대한 제어신호를 받는다. 도 4a 및 도 4b를 참고로 상세히 설명되겠지만, "동기" 동작에 있어서, 디코더 측에서 사용하는 코딩 알고리즘에 관한 정보를 얻고 또 이에 의거하여 디코더 측 멀티채널 복원 수단의 구성 설정을 수행하기 위해서는 파라미터 구성 큐가 제1의 의미를 갖도록 선택하는 것이 바람직하다. 그러나, "비동기" 동작에 있어서, 제어 입력(18)은 파라미터 구성 큐가 제2의 의미를 갖도록 시그널링 수단(14)을 제어한다. 이와 같은 파라미터 구성 큐는 데이터 자체에 구성 정보가 존재한다는 것 그리고 전송 채널 데이터가 근거로 하고 있는 오디오 코딩 알고리즘이 사용되지 않을 것이라는 의미로 디코더에서 해석하게 된다.

여기서 주목해야 할 것은 파라미터 데이터 세트 및/또는 파라미터 데이터 출력이 양자 고정된 형태로 존재하지 않는다는 것이다. 따라서, 파라미터 구성 큐, 구성 데이터 및 파라미터 데이터가 함께 하나의 데이터 열 또는 패킷으로 전송될 필요가 없고, 서로 독립적으로 디코더로 제공될 수 있다.

이하 도 4a를 참고하여 "동기" 동작에 대해 설명한다. 단지 설명을 위해 파라미터 데이터가 일련의 프레임(40)으로 도시되었다. 프레임 열(40)에 선행하여 헤더(41)가 위치하며, 이곳에 시그널링 수단(14)에서 발생한 파라미터 구성 큐 PKH가 존재한다. 또 선택적으로, 헤더는 구성 데이터 기입 수단(15)에 의해 발생한 부가 구성 정보를 포함한다. 멀티채널 파라미터 장치(11)의 출력에 발생한 파라미터 데 이터가 프레임 1, 2, 3, 4에 수용된다. 이것을 도 4a에서 페이로드 데이터라 칭한다.

도 1의 시그널링 수단(14)의 출력에 표시한 연속 큐 FSH가 도 4a의 헤더(41)에 나타나 있다. 이 연속 큐 신호 FSH는 어떤 결정된 의미를 가질 때 디코더가 이전에 보내진 구성 설정을 계속 유지하게 한다. 한편, 연속 큐 신호 FSH가 다른 의미를 가질 때, 파라미터 구성 큐에 근거하여 다음과 같은 결정을 수행한다. 즉, 데이터 열에서의 구성 정보에 근거하여 멀티채널 구성 수단에서 구성 설정을 실행할 것인지 아니면 디코더 측에서 오디오 코딩 알고리즘에 전달된 큐에 의해 검색된 구성 데이터에 근거하여 구성 설정을 실행할 것인지를 결정한다.

도 4b는 시간에 관련하여 코딩된 전송 데이터를 일련의 블록(42)으로 나타낸 것이다. 이 블록 열(42) 역시 4개의 프레임을 가진다. 파라미터 데이터와 코딩된 전송 채널 데이터 간의 시간 관계가 도 4a에서 화살표로 표시되었다. 따라서, 코딩된 전송 채널 데이터의 블록은 항상 입력 데이터의 블록에 관계하고, 또는 중첩 윈도우가 사용될 때 이전 블록과 비교하여 하나의 블록에서 얼마나 많은 데이터가 새로 처리되었는지의 진행(advance)을 기록하고, 동기 동작에 있어서 블록 길이에 일치 및/또는 파라미터 데이터가 구해진 진행 시점에 일치시킨다. 이 관계는 파라미터 복원와 전송 채널 데이터 간의 연결을 잃지 않도록 보장한다.

이에 대해 간단한 예를 들어 설명한다. 5개 채널 입력 신호가 존재한다고 가정할 때, 이 5개 채널 입력신호는 시간 x에서 시간 y까지의 시간 샘플들을 각각 포함하는 5개의 서로 다른 오디오 채널을 갖는다. 도 6의 다운믹스 단(114)에서, 적 어도 하나의 전송 채널이 발생하고 이는 멀티채널 입력 데이터와 동기 된다. 시간 x에서 시간 y까지 전송 채널 데이터의 일부분은 따라서 시간 x에서 시간 y까지 각각의 멀티채널 입력 데이터의 일부분에 대응한다. 더욱이, 도 6의 BCC 분석 장치(116)는 예를 들어 시간 x에서 시간 y까지 전송 채널 데이터의 시간 구분에 대한 파라미터 데이터를 발생한다. 이에 따라, 디코더 측에서도, 시간 x에서 시간 y까지의 전송 채널 데이터로부터 시간 x에서 시간 y까지 각각의 출력 채널 데이터와 시간 x에서 시간 y까지의 파라미터 데이터가 발생한다.

파라미터 데이터가 발생 및 기재되는 프레임 구성이 오디오 인코더가 하나 또는 그 이상의 전송 채널을 압축하게 하는 프레임 구성과 동일할 때, 동기 동작은 자동으로 이루어진다. 따라서, 파라미터 데이터와 코딩된 전송 채널 데이터(도 4a의 40 및 42)의 프레임 모두 항상 같은 시간 구분에 관계되어 있다면, 멀티채널 복원 수단은 항상 오디오 프레임에 해당하는 데이터를 쉽게 처리할 수 있으며 동시에 파라미터 프레임을 처리할 수 있다.

동기 동작에 있어서, 다운믹스 데이터의 전송용으로 사용되는 오디오 인코더의 프레임 길이는 파라메트릭 멀티채널 기술에서 사용되는 프레임 길이와 동일하게 된다. 유사하게, 프레임 길이, 파라미터 데이터, 그리고 코딩된 전송 채널 데이터 사이에는 정수 관계가 성립될 수 있다. 이 경우, 파라메트릭 멀티채널 코딩을 위한 부수 정보가 오디오 다운믹스 신호의 코딩된 비트열로 다중화되고, 이에 의해 단일의 비트열이 발생할 수 있다. 이미 존재하는 스테레오 데이터를 "갱신"하는 경우, 아직도 2개의 서로 다른 데이터 열이 존재하게 된다. 그러나, 2개 프레임 열 간에 는 1:1 및/또는 m:1 또는 m:n의 관계가 성립한다. 여기서 상호 간에 프레임 래스터는 변하지 않는다. 따라서, 오디오 데이터 프레임들과 대응하는 파라미터 부수 정보 데이터 프레임들 간에 명확한 관계 조합이 이루어진다. 이러한 동기 모드 동작은 다양한 응용에 매우 유리하다.

본 발명에 따르면, 파라미터 구성 큐는 위와 같은 경우 제1의 의미를 갖게 된다. 이것은 멀티채널 복원 수단에 근원 오디오 인코더에 관한 정보가 제공되고 이에 의거하여 그 구성 설정, 예를 들어 진척에 대한 또는 블록 길이 등에 대한 시간 샘플들을 선택하기 때문에 헤더(41)에는 구성정보가 존재하지 않거나 일부만이 존재함을 의미한다.

한편, 도 4b는 비동기 동작을 나타낸다. 비동기 동작은 전송 채널(42')이 예를 들어 프레임 구조를 가지지 않고 다만 PCM 샘플 열로 발생할 때 이루어진다. 이와 달리, 비동기 동작은 오디오 인코더가 불규칙한 프레임 구조를 가질 때 또는 그 프레임 길이 및/또는 프레임 래스터가 파라미터 데이터(40)의 프레임 래스터와 상이한 단순한 프레임 구조를 가질 때 발생한다. 따라서, 파라메트릭 멀티채널 코딩 방법과 오디오 코딩/디코딩 장치는 서로 의존하지 않는 별개의 분리된 처리 단으로 간주할 수 있다. 이것은 특히 수개의 연속적인 코딩/디코딩 처리 단이 존재하는 탠덤 코딩 방법에서 유리하게 적용된다. 파라미터 데이터가 압축된 오디오 데이터와 고정적으로 결합하여 있는 경우, 멀티채널 합성 및 후속하는 멀티채널 분석은 각각의 코딩/디코딩 과정에서 동시에 이루어질 수 있다. 이들 동작 과정이 손실을 내포하고 있기 때문에, 손실이 점차 누적되어 멀티채널 효과에 점진적인 저하를 가져온 다.

상기와 같은 탠덤 처리 단에서, 파라미터 구성 큐가 제2의 의미를 가지게 설정하고 데이터 열에 구성 정보를 기입하는 것은 디코더 내 멀티채널 복원 수단의 구성 설정을 기본 오디오 인코더와 독립적으로 수행하게 한다. 다운믹스 데이터는 따라서 멀티채널 합성 또는 멀티채널 분석을 동시에 수행하지 않더라도 항상 디코딩/인코드 될 수 있다. 구성 정보를 데이터 열 바람직하게 파라미터 데이터 신택스에 따라 파라미터 데이터 열에 도입하는 것은, 말하자면 파라미터 데이터를 디코딩된 전송 채널 데이터의 시간 샘플들과의 확고한 조합, 즉 자체적으로 충분하고 동기 동작에서와 같은 인코더 프레임 처리 방식에 관계하지 않는 연결을 이루게 한다.

따라서, 비동기 동작에서 멀티채널 분석/합성이 항상 수행되지 않기 때문에 멀티채널 소리 특성의 저하가 방지된다. 또한 파라메트릭 멀티채널 코딩/디코딩에 사용할 프레임 크기가 오디오 인코더의 프레임 크기에 연계될 필요가 없다.

도 1의 장치는 인코더 및 소위 "상향 트랜스코더(forward transcoder)" 모두에 적용할 수 있다. 첫 번째 경우에, 멀티채널 파라미터 장치는 파라미터 데이터 자체를 산출한다. 두 번째 경우, 멀티채널 파라미터 장치는 파라미터 데이터를 미리 결정된 형태로 수신하여 본 발명에 따른 파라미터 데이터 출력을 파라미터 구성 큐 및 연결된 구성 데이터와 함께 제공한다.

이 방법의 반전은 소위 "하향 트랜스코더(backward transcoder)"에 의해 이루어질 수 있다. 하향 트랜스코더는 본 발명의 파라미터 데이터 출력으로부터, 파 라미터 구성 큐가 포함되어 있지 않지만 구성 데이터 전부는 포함되어 있는 출력을 발생한다. 이에 의해 구성을 위한 멀티채널 복원에 오디오 코딩 알고리즘을 사용할 필요가 없어진다.

본 발명에 따르면, 상기 하향 트랜스코더는 입력 데이터를 사용하여 N개의 원시채널을 표현하는 M개의 전송 채널(여기서 M은 N보다 작고 1과 같거나 크다)과 함께 파라미터 데이터 출력을 발생하기 위한 장치로 설계된다. 여기서, 입력 데이터는 제1 또는 제2의 의미를 갖는 파라미터 구성 큐(41)를 포함한다. 파라미터 구성 큐(41)가 가진 제1의 의미는 입력 데이터에 멀티채널 복원 수단에 사용할 구성 정보가 포함되었다는 것이고, 제2의 의미는 전송 채널 데이터를 그 코딩된 버전으로부터 디코딩한 코딩 알고리즘(23)에 의존하여 멀티채널 복원 수단이 상기 구성 정보를 사용해야할 것을 뜻한다. 이 장치는 구성 데이터를 기재하기 위한 기입 수단을 포함한다. 여기서 기입 수단은 먼저 입력 데이터를 읽어내어 파라미터 구성 큐를 해석(도 3의 단계 30)하고, 이 파라미터 구성 큐가 제2의 의미를 가질 때, 전송 채널 데이터를 그 코딩된 버전으로부터 디코딩한 코딩 알고리즘(23)에 관한 정보를 복원한 다음 이 정보를 구성 데이터로서 출력한다.

이하 도 2의 블록다이어그램을 참고하여 본 발명의 바람직한 실시예에 따른 멀티채널 오디오 신호 발생장치를 설명한다. 멀티채널 오디오 신호를 발생하기 위하여, M개 전송 채널을 표현하는 전송 채널 데이터를 포함하는 입력 데이터가 사용된다. 입력 데이터는 K 개 출력 채널을 얻기 위한 파라미터 데이터(21)를 더 포함한다. M개 전송 채널과 파라미터 데이터는 함께 N개의 오리지날 채널을 나타낸다. 여기서 M은 N보다 작고 1과 같거나 크고, K는 M보다 크다. 더욱이, 입력 데이터는 전술한 바와 같은 파라미터 구성 큐 PKH를 포함하고, 전송 채널 데이터(20)는 코딩 알고리즘에 따라 코딩된 전송 채널 데이터(22)의 디코딩된 버전이다. 도 2에 나타낸 실시예에서, 디코딩 알고리즘은 코딩 알고리즘을 가진 오디오 디코더(23)에 의해 구현된다. 이 디코더의 코딩 알고리즘은 예를 들어 MP3 기준에 따라 동작하거나 MPEG-2 (AAC) 또는 기타 코딩 기준에 따라 동작한다.

도 2에 보인 디코더 측에서 사용될 장치는 출력단(25)에서 전송 채널 데이터(20)와 파라미터 데이터(21)로부터 K개의 출력 채널을 발생하도록 설계된 멀티채널 복원 수단(24)을 포함한다.

더욱이, 도 2에 나타낸 본 발명의 장치는 신호 라인(27)을 통해 구성 설정 값을 시그널링하는 것에 의해 멀티채널 복원 수단(24)을 구성하기 위한 구성 수단(26)을 포함한다. 구성 수단(26)은 입력 데이터와 바람직하게 파라미터 데이터(21)를 수신하여 파라미터 구성 큐와, 연속 큐 FSH, 및 가능하면 현재 구성 데이터를 읽어내고 이에 따라 처리한다. 더욱이, 구성 수단(26)은 코딩 알고리즘 시그널링 입력단(28)을 포함한다. 이 입력단을 통해 디코딩된 전송 채널 데이터가 근거하고 있는, 즉 오디오 디코더(23)에서 실행하는 코딩 알고리즘에 관한 정보를 얻는다. 이 정보는 다른 방식 즉, 예를 들어 디코딩된 전송 채널 데이터를 관찰하고 그로부터 어떤 코딩 알고리즘을 가지고 그 데이터가 코딩/디코딩되었는지 알 수 있다면 이와 같은 방식으로 얻을 수도 있다. 이와 달리, 오디오 디코더(23)가 자신의 정체를 구성 수단(26)으로 바로 전달하도록 구성할 수도 있다. 또다시, 구성 수 단(26)는 코딩된 전송 채널 데이터(22)를 분석하여 어떤 코딩 알고리즘에 의한 코딩이 수행되었는지에 따라 그 코딩된 전송 채널 데이터로부터 큐 정보를 결정한다. 위와 같은 "코딩 알고리즘 서명"은 통상적으로 인코더의 각 출력 데이터 열에 포함된다.

이하, 도 3을 참고하여 구성 수단의 바람직한 실시예를 블록 흐름도에 따라 상세히 설명한다. 구성 수단(26)는 입력 데이터로부터 파라미터 구성 큐 PKH를 읽어내어 이를 해독한다(도 3의 단계 30). 파라미터 구성 큐가 제1의 의미를 가진 것으로 판단된 경우, 구성 수단은 파라미터 데이터 열에서 읽기를 계속하여 파라미터 데이터 열에 포함된 구성 정보 (또는 적어도 구성 정보의 일부)를 추출한다(단계 31). 그러나 단계 30에서 파라미터 구성 큐 PKH가 제2의 의미를 가진 것으로 판단되었을 때, 구성 수단은 디코딩된 전송 채널 데이터가 근거하고 있는 코딩 알고리즘에 관한 정보를 얻는다(단계 32).

만일 본 발명의 장치가 멀티채널 신호를 발생하기 위해 몇 가지 다른 코딩 알고리즘을 사용할 수 있는 것으로 설계되었다면, 단계 32에 후속하여 단계 33에서 멀티채널 복원 수단은 디코더 측에 존재하는 정보에 기초하여 구성 설정을 결정한다. 그 정보는 예를 들어 룩-업 테이블(LUT)의 형태로 존재할 수 있다. 단계 32가 종료되고 오디오 인코더의 식별 정보(큐)가 얻어졌다면 이 오디오 인코더의 식별 큐를 이용하여 단계 33에서 룩-업 테이블이 등록된다. 이때 오디오 인코더의 식별 큐는 색인으로 사용된다. 그 색인과 조합하여, 오디오 인코더에 연관된 블록 길이, 샘플링 비율, 어드밴스, 등과 같은 다양한 구성 설정이 존재한다.

다음 단계 34에서, 구성 설정이 멀티채널 복원 수단에 적용된다. 그러나, 단계 30에서 파라미터 구성 큐가 제1의 의미를 갖는 것으로 결정된 경우, 도 3에서 블록 단계 31과 단계 34 사이에서 화살표로 연결한 것으로 나타낸 바와 같이 동일한 구성 설정이 파라미터 데이터 열에 포함된 구성 정보에 근거하여 이루어진다.

본 발명의 방법은 명시적 및 묵시적 구성 정보의 시그널링 방법 모두를 지원한다는 점에서 융통성이 있다. 이것은 파라미터 구성 큐 PKH가 최선의 결과를 얻는 데 있어서 구성 정보 그 자체의 시그널링을 표시하기 위해 바람직하게 플래그로서 삽입되는 단지 하나의 비트를 필요로 한다는 것이다. 파라메트릭 멀티채널 디코더는 그 후에 이 플래그를 평가한다. 명시적 구성 정보가 그 플래그와 함께 시그널링 되어야 할 때 이 구성 정보가 사용된다. 한편, 플래그가 묵시적 시그널링을 표시한다면, 디코더는 사용된 오디오 또는 오디오 코딩 방법에 관한 정보를 사용하고 또한 그 시그널링된 코딩 방법에 근거하여 구성 정보를 사용한다. 이를 위해, 파라메트릭 멀티채널 디코더 및/또는 멀티채널 복원 수단은 바람직하게 오디오 인코더의 결정된 수에 대한 표준 구성 정보를 포함하는 룩-업 테이블을 갖는다. 그러나, 룩-업 테이블 대신에 예를 들어 하드웨어 솔루션 등을 포함하는 다른 방법을 사용할 수도 있다. 일반적으로 말해, 디코더는 현존하는 인코더 식별 정보에 의존하는 그 자체에 존재하는 미리 결정된 정보와 함께 구성 정보를 제공할 수 있다는 것이다.

이 방법은 파라미터의 전체적 구성을 최소한의 부가적 노력으로 이룰 수 있다는 점에서 특히 유리하다. 여기서, 극단적인 경우, 단일 비트를 사용하는 것으로 충분하다. 이것은 모든 구성정보가 비트에 관련하여 상당히 많은 노력을 가지고 명 시적으로 데이터 열에 기재되어야 하는 상황과 비교할 때 고무적이다.

본 발명에 따르면, 시그널링은 후방 및 전방으로 스위치 될 수 있다. 이것은 예를 들어 전송 채널 데이터가 디코딩되고 나서 다시 인코드 될 때, 즉 탠덤 코딩 방식에서 전송 채널 데이터의 표시가 변화하더라도 단순하게 멀티채널 데이터를 처리할 수 있게 한다.

따라서, 본 발명의 방법은 동기 동작의 경우 및 필요할 때 동기 동작으로의 전환시 시그널링 비트의 절감을 가능케 한다. 즉, 효과적인 비트-절약 동작의 실행 그리고 현재의 스테레오 데이터에 대한 "보완" 내지는 멀티채널 표시에 관련하여 특히 유리한 유연한 처리를 가능하게 한다.

이하 도 4c를 참고로, 유사 코드 신택스의 예를 가지고 본 발명의 멀티채널 오디오 신호를 발생하기 위한 장치의 실시예에 대해 설명한다. 먼저, 변수 "useSameBccConfig"의 값이 독출된다. 이 변수는 연속 큐로서 작용한다. 따라서, 이 변수, 즉 연속 큐가 예를 들어 1과 동일한 값을 가질 때 파라미터 구성 큐를 해석하기 위해 단지 하나의 연속이 존재한다. 그러나, 연속 큐가 1과 같지 않으면, 즉 다른 의미를 가질 때, 이전에 전송된 구성이 사용된다. 멀티채널 복원 수단에 아직 아무런 구성도 존재하지 않을 경우, 최초의 구성 정보 및/또는 구성 설정을 얻을 때까지 기다려야 한다.

다음은 파라미터 구성 큐를 검사하기 위한 동작을 설명한다. 변수 "codecToBccConfigAlignment"는 파라미터 구성 큐 PKH로서 작용한다. 이 변수가 1과 동일, 즉 제2의 의미를 가질 때, 디코더는 더 이상 구성 정보를 사용하지 않고 단지 도 4c에서 "case"로 시작하는 라인에서 알 수 있는 것과 같이 MP3, CoderX 또는 CoderY와 같은 인코더 식별자에 근거하여 구성 정보를 결정한다. 도 4c에 나타낸 신택스는 예를 들어 MP3, CoderX 및 CoderY 만을 지원한다. 그러나, 이와 다른 코딩 명칭/식별자를 부가할 수 있다.

예를 들어, MP3가 인코더 정보로 결정되었을 때, 변수 bccConfigID 는 예를 들어 MP3_V1 으로 설정된다. MP3_V1은 신택스 버전 V1을 가지고 있는 기본 MP3에 대한 구성을 의미한다. 이 후에, 디코더는 BCC 구성 식별자에 근거하여 결정된 파라미터 세트를 가지고 구성된다. 따라서, 예를 들어 576개 샘플의 블록 길이가 구성 설정 값으로 활성화된다. 따라서, 이 블록 길이를 가진 프레임 구성이 시그널링 된다. 다른/부가적인 구성 설정으로는 샘플링 비율 등에 관한 것이다. 그러나, 파라미터 구성 큐 codecToBccConfigAlignment가 제1의 의미를 갖는, 즉 예를 들어 값 0을 가지는 경우, 디코더는 데이터 열로부터 구성 정보를 명시적으로 수신한다. 즉, 디코더는 데이터 열, 즉 입력 데이터로부터 bccConfigID를 수신한다. 후속 처리과정은 위에 설명한 바와 같다. 그러나, 이때, 멀티채널 복원 수단을 구성한다는 목적에 비추어 코딩된 전송 채널 데이터를 디코딩하기 위한 디코더의 식별은 사용하지 않는다.

따라서, 멀티채널 복원 수단을 구성하기 위해 MP3 오디오 디코더를 사용할 경우 전송 채널 데이터를 디코딩하기 위한 목적으로 bccConfigID가 사용될 수 있다. 한편, 현재 오디오 인코더가 MP3 인코더인지 여부를 떠나 데이터 열에 다른 어떤 구성 정보가 존재할 수 있으며 이를 평가할 수 있다. 이와 같은 개념은 CoderX 및 CoderY 와 같은 다른 소정의 구성 설정에도 적용되며, 또한 구성 정보 bccConfigID가 개인으로 설정되는 자유 구성에도 적용된다. 바람직한 실시예에서, 데이터 열에 부가적인 구성 정보가 존재할 수 있다. 이 구성 정보는 디코더에 존재하는 미리 결정된 구성 정보와 명시적으로 전송된 구성 정보의 혼합을 사용할 것을 디코더에 다시 알려준다.

상술한 실시예와는 달리, 본 발명은 파라미터적으로 코딩된 비디오 신호 등과 같이 오디오 신호가 없는 다른 멀티채널 신호에도 적용될 수 있다.

상황에 따라서, 멀티채널 신호를 발생 및/또는 이를 코딩/디코딩하기 위한 본 발명의 방법은 하드웨어로 구현되거나 또는 소프트웨어로 구현될 수 있다. 그 구현은 디지털 기억 매체, 특히 플로피 디스크 또는 컴팩트 디스크(CD)에서 이루어질 수 있다. 그 매체는 전자적으로 독출될 수 있는 제어 신호를 가지며, 프로그램 가능한 컴퓨터 시스템과 협동하여 본 발명의 방법을 실행하게 된다. 일반적으로, 본 발명은 따라서 컴퓨터 프로그램 제품으로 구성된다. 이 컴퓨터 프로그램 제품은 컴퓨터 프로그램 제품이 컴퓨터에서 실행될 때, 기계 판독가능한 매체에 저장된 방법을 수행하기 위한 프로그램 코드를 가진다. 다시 말해, 본 발명은 컴퓨터 프로그램 제품이 컴퓨터에서 실행될 때, 본 발명의 방법을 수행하는 프로그램 코드를 갖는 컴퓨터 프로그램으로 구현된다.

Claims

M개의 전송 채널을 표현하는 전송 채널 데이터와 K 개 출력 채널을 얻기 위한 파라미터 데이터를 포함하는 입력 데이터를 사용하여 멀티채널 신호를 발생하기 위한 장치로서, 여기서 M개 전송 채널과 파라미터 데이터는 함께 N개의 오리지날 채널을 표현하며, M은 N보다 작고 1과 같거나 크고, K는 M보다 크고, 상기 입력 데이터는 파라미터 구성 큐(41)를 포함하고, 상기 장치는:

상기 전송 채널 데이터와 파라미터 데이터로부터 K개의 출력 채널을 발생하는 멀티채널 복원 수단(24)과, 그리고

상기 멀티채널 복원 수단을 설정구성하기 위한 구성 수단(26)을 포함하여 이루어지고,

상기 구성 수단은,

상기 입력 데이터를 읽어서 상기 파라미터 구성 큐를 해석하고(30),

상기 파라미터 구성 큐가 제1의 의미를 가질 때, 상기 입력 데이터에 포함된 구성 정보를 추출하고(31), 상기 멀티채널 복원 수단의 구성 설정을 실행하고(34),

상기 파라미터 구성 큐가 제1의 의미와 다른 제2의 의미를 가질 때, 코딩된 전송 채널 데이터로부터 디코딩된 전송 채널 데이터가 근거하고 있는 코딩 알고리즘(23)에 관한 정보를 사용하여, 상기 멀티채널 복원 수단의 구성 설정을 상기 코딩 알고리즘(23)의 구성 설정과 동일하게 하거나 또는 상기 코딩 알고리즘(23)의 구성 설정에 의존하도록 구성(34)하는 것인 멀티채널 신호 발생 장치.
청구항 1에 있어서,

상기 전송 채널 데이터는 전송 채널 데이터 신택스를 갖는 전송 채널 데이터 열을 포함하고,

상기 파라미터 데이터는, 상기 전송 채널 데이터 신택스 상이한 파라미터 데이터 신택스를 가지는, 파라미터 데이터 열을 포함하고, 그리고

상기 파라미터 구성 큐는 이 신택스에 따라 파라미터 데이터에 삽입되고,

상기 구성 수단(26)은 상기 파라미터 데이터 신택스에 따라 파라미터 데이터를 읽어내어 파라미터 구성 큐를 추출하는(30) 것인 멀티채널 신호 발생 장치.
청구항 1 또는 청구항 2에 있어서,

상기 멀티채널 복원 수단(24)은 블록 단위의 처리를 수행하고,

상기 전송 채널 데이터는 일련의 샘플들이며, 상기 구성 설정은 블록 길이 또는 블록을 처리할 때마다 멀티채널 복원 수단(24)이 새로이 처리한 샘플들의 진행 개수를 포함하는 것인 멀티채널 신호 발생 장치.
청구항 3에 있어서,

상기 전송 채널 데이터는 적어도 하나의 전송 채널이 가진 시간 샘플들이며, 상기 멀티채널 복원 수단(24)은 전송 채널 데이터의 시간 샘플 블록을 주파수 영역 표현으로 변환하는 필터 뱅크를 포함하는 것인 멀티채널 신호 발생 장치.
청구항 1에 있어서,

상기 파라미터 데이터는 파라미터 값들로 된 일련의 블록들을 포함하고, 이 파라미터 값들의 하나의 블록은 적어도 하나의 전송 채널의 시간 부분과 조합되고, 상기 멀티채널 복원 수단(24)은 구성 설정이 상기 파라미터 값들의 하나의 블록과 상기 조합된 적어도 하나의 전송 채널의 시간 부분을 K개의 출력 채널을 발생하는데 사용하게 하는 것인 멀티채널 신호 발생 장치.
청구항 1에 있어서,

상기 코딩 알고리즘(23)은 다수의 여러 가지 코딩 알고리즘 중의 어느 하나이며, 그리고

상기 구성 수단(26)은 색인과 코딩 알고리즘에 대한 색인과 조합되고 각각 코딩 알고리즘에 대한 구성 설정을 가진 일단의 구성 정보를 포함하는 룩-업 테이블을 포함하고,

상기 구성 수단(26)은 코딩 알고리즘에 관한 정보로부터 룩-업 테이블용 색인을 결정하고 이로부터 멀티채널 복원 수단에 대한 구성 정보를 결정하는(33) 것인 멀티채널 신호 발생 장치.
청구항 1에 있어서,

상기 입력 데이터는 상기 파라미터 구성 큐가 제1의 의미를 가질 때 상기 멀티채널 복원 수단(24)에 대한 구성 정보를 포함하고, 상기 파라미터 구성 큐가 제2의 의미를 가질 때, 상기 멀티채널 복원 수단에 대한 구성 정보의 일부를 포함하거나 또는 아무런 구성 정보도 포함하지 않는 것인 멀티채널 신호 발생 장치.
청구항 1에 있어서,

상기 구성 수단(26)은 상기 파라미터 구성 큐가 제2의 의미를 가질 때, 입력 데이터로부터 필요한 구성 정보의 일부분만을 추출하고, 상기 멀티채널 복원 수단에 알려진 미리 설정된 구성 정보로부터 필요한 구성 정보의 나머지 부분을 사용하는 것인 멀티채널 신호 발생 장치.
청구항 1에 있어서,

상기 구성 수단(26)은 상기 파라미터 구성 큐가 제2의 의미를 가질 때, 코딩된 전송 채널 데이터로부터 전송 채널 데이터를 발생하는 디코더에 상기 구성 수단을 연결하는 라인을 통해 코딩 알고리즘에 관한 정보를 얻고, 또는 전송 채널 데이터 또는 코딩된 전송 채널 데이터를 읽어내는 것에 의해 코딩 알고리즘에 관한 정보를 얻게 설계된 것인 멀티채널 신호 발생 장치.
청구항 1에 있어서,

입력 데이터는 연속 큐(41)를 더 포함하고, 그리고

상기 구성 수단(26)은 연속 큐를 읽고 해석하여(29) 상기 연속 큐가 제1의 의미를 가질 때 멀티채널 복원 수단을 고정적으로 설정하거나 이전에 시그널링된 구성 설정을 실행하고, 상기 연속 큐가 제1의 의미와 다른 제2의 의미를 가질 때 상기 파라미터 구성 큐에 기초하여 멀티채널 복원 수단을 설정하도록(30) 설계된 것인 멀티채널 신호 발생 장치.
청구항 10에 있어서,

상기 연속 큐는 파라미터 데이터 신택스에 의거하여 파라미터 데이터와 조합되고, 파라미터 데이터 열의 플래그로 되는 것인 멀티채널 신호 발생 장치.
청구항 1에 있어서,

상기 파라미터 구성 큐는 파라미터 데이터 신택스에 의거하여 파라미터 데이터와 조합되고, 파라미터 데이터 열의 플래그로 되는 것인 멀티채널 신호 발생 장치.
청구항 11에 있어서,

상기 연속 큐 또는 파라미터 구성 큐는 각각 단일 비트로 구성되는 것인 멀티채널 신호 발생 장치.
M개의 전송 채널을 표현하는 전송 채널 데이터와 K 개 출력 채널을 얻기 위한 파라미터 데이터를 포함하는 입력 데이터를 사용하여 멀티채널 신호를 발생하기 위한 방법으로서, 여기서 M개 전송 채널과 파라미터 데이터는 함께 N개의 오리지날 채널을 표현하며, M은 N보다 작고 1과 같거나 크고, K는 M보다 크고, 상기 입력 데이터는 파라미터 구성 큐(41)를 포함하고, 상기 방법은:

상기 전송 채널 데이터와 파라미터 데이터로부터 복원 알고리즘에 의거하여 K개의 출력 채널을 복원하는 단계(24)와,

상기 복원 알고리즘을 구성하는 단계(26)를 포함하는데, 상기 구성 단계(26)는:

상기 입력 데이터를 읽고 상기 파라미터 구성 큐를 해독하는 단계(30),

상기 파라미터 구성 큐가 제1의 의미를 가질 때, 상기 입력 데이터에 포함된 구성 정보를 추출하고(31), 그리고 상기 복원 알고리즘의 구성 설정을 실행하는 단계(34),

상기 파라미터 구성 큐가 제1의 의미와 다른 제2의 의미를 가질 때, 코딩된 전송 채널 데이터로부터 디코딩된 전송 채널 데이터가 근거하고 있는 코딩 알고리즘(23)에 관한 정보를 사용하여, 상기 멀티채널 복원 수단의 구성 설정을 상기 코딩 알고리즘(23)의 구성 설정과 동일하게 하거나 또는 상기 코딩 알고리즘(23)의 구성 설정에 의존하도록 실행(34)하는 단계를 포함하여 이루어지는 멀티채널 신호를 발생하기 위한 방법.
M개의 전송 채널을 포함하는 전송 채널 데이터와 함께 N개 오리지날 채널을 표현하는 파라미터 데이터 출력을 발생하는 장치로서, 여기서 M은 N보다 작고 1보다 크거나 동일한, 상기 장치는:

파라미터 데이터를 제공하기 위한 멀티채널 파라미터 수단(11)과;

파라미터 구성 큐를 결정하는 시그널링 수단(14)과, 여기서 파라미터 구성 큐는 파라미터 데이터 출력에 포함된 구성 정보가 멀티채널 복원 수단에서 사용될 경우 제1의 의미를 갖고, 또 파라미터 구성 큐는 구성 데이터가 M개 전송 채널을 코딩 또는 디코딩하는데 사용될 코딩 알고리즘에 근거한 멀티채널 복원에 사용될 경우 제2의 의미를 가지며; 그리고

상기 파라미터 데이터 출력을 얻기 위해 구성 정보를 출력하는 구성 데이터 기입 수단(15)을 포함하는 것인 파라미터 데이터 출력을 발생하는 장치.
청구항 15에 있어서,

상기 구성 데이터 기입 수단(15)은 연속 큐를 파라미터 데이터 세트에 삽입하도록 설계되고,

상기 연속 큐는 제1의 의미를 가질 때 이전에 시그널링된 구성 설정이 고정 설정으로 멀티채널 복원에 사용되게 하고, 그리고 연속 큐가 제2의 의미를 가질 때, 파라미터 구성 큐를 사용하여 멀티채널 복원의 구성이 실행되게 하는 것인 파라미터 데이터 출력을 발생하는 장치.
청구항 15 또는 청구항 16에 있어서,

상기 구성 데이터 기입 수단은 상기 파라미터 구성 큐가 제2의 의미를 가질 때(17), 필요한 구성 정보의 일부를 파라미터 데이터 세트와 조합하도록 설계된 것인 파라미터 데이터 출력을 발생하는 장치.
M개의 전송 채널을 포함하는 전송 채널 데이터와 함께 N개 오리지날 채널을 표현하는 파라미터 데이터 출력을 발생하는 방법으로서, 여기서 M은 N보다 작고 1보다 크거나 동일하며, 상기 방법은:

파라미터 데이터를 제공하고(11);

파라미터 구성 큐를 결정하고(14), 여기서 파라미터 구성 큐는 파라미터 데이터 출력에 포함된 구성 정보가 멀티채널 복원 알고리즘에 대해 사용될 경우 제1의 의미를 갖고, 또 파라미터 구성 큐는 구성 데이터가 M개 전송 채널을 코딩 또는 디코딩하는데 사용될 코딩 알고리즘에 근거한 멀티채널 복원에 사용될 경우 제2의 의미를 가지며; 그리고

상기 파라미터 데이터 출력을 얻기 위해 구성 정보를 출력하는(15) 단계를 포함하는 것인 파라미터 데이터 출력을 발생하는 방법.
입력 데이터를 이용하여 M개의 전송 채널을 포함하는 전송 채널 데이터와 함께 N개 오리지날 채널을 표현하는 파라미터 데이터 출력을 발생하는 장치로서, 여기서 M은 N보다 작고 1보다 크거나 동일하며, 상기 입력 데이터는 멀티채널 복원 수단에 대한 구성 정보가 입력 데이터에 포함되어 있다는 제1의 의미를 가지거나, 멀티채널 복원 수단이 전송 채널 데이터를 디코딩한 코딩 알고리즘에 의거하여 구성 정보를 사용할 것을 표현하는 제2의 의미를 갖는, 상기 장치는:

구성 데이터를 기입하기 위한 기입 수단을 포함하고,

상기 기입 수단은,

입력 데이터를 읽어내어 파라미터 구성 큐를 해석하고(30), 그리고

상기 파라미터 구성 큐가 제2의 의미를 가질 때, 전송 채널 데이터를 그 코딩된 버전으로부터 디코딩한 코딩 알고리즘(23)에 관한 정보를 구성 데이터 정보로서 복원하고 출력하는 것인 파라미터 데이터 출력을 발생하는 장치.
입력 데이터를 이용하여 M개의 전송 채널을 포함하는 전송 채널 데이터와 함께 N개 오리지날 채널을 표현하는 파라미터 데이터 출력을 발생하는 방법으로서, 여기서 M은 N보다 작고 1보다 크거나 동일하며, 상기 입력 데이터는 멀티채널 복원 수단에 대한 구성 정보가 입력 데이터에 포함되어 있다는 제1의 의미를 가지거나, 멀티채널 복원 수단이 전송 채널 데이터를 디코딩한 코딩 알고리즘에 의거하여 구성 정보를 사용할 것을 표현하는 제2의 의미를 갖는, 상기 방법은:

입력 데이터를 읽어내어 파라미터 구성 큐를 해석하는 단계(30)와, 그리고

상기 파라미터 구성 큐가 제2의 의미를 가질 때, 코딩된 전송 채널 데이터로부터 디코딩된 전송 채널 데이터가 근거하고 있는 코딩 알고리즘(23)에 관한 정보를 찾아내어서 이 찾아낸 정보를 출력하는 단계를 포함하는 것인 파라미터 데이터 출력을 발생하는 방법.
컴퓨터에서 실행될 때 청구항 14, 청구항 18, 또는 청구항 20에 따른 방법을 수행하는 프로그램 코드를 갖는 컴퓨터 프로그램이 저장된 컴퓨터 판독가능한 저장매체.