KR101029076B1

KR101029076B1 - 오디오 데이터 부호화 및 복호화 장치와 방법

Info

Publication number: KR101029076B1
Application number: KR1020070054025A
Authority: KR
Inventors: 김미영; 김상욱; 김도형; 이시화
Original assignee: 삼성전자주식회사
Priority date: 2005-04-14
Filing date: 2007-06-01
Publication date: 2011-04-18
Also published as: JP2006293375A; DE602006002538D1; JP4781153B2; US7813932B2; EP1713061A3; JP5254933B2; JP2010033084A; KR20070070137A; CN1878001A; US8046235B2; ATE407423T1; US20100332239A1; KR100818268B1; EP1713061B1; US20060235678A1; KR101162572B1; KR20060108520A; EP1713061A2; CN1878001B; KR20070063493A

Abstract

오디오 데이터 부호화 및 복호화 장치와 방법이 개시된다. 그 오디오 복호화 장치는, 부호화된 대역폭확장 데이터 및 하나 이상의 계층을 가지며 상기 계층마다 소정 개수의 비트로 표현되고 부호화된 오디오 데이터를 주어진 비트스트림으로부터 추출하는 비트스트림 분석부와, 부호화된 상기 오디오 데이터를 하위 계층을 상위 계층보다 먼저 복호화하며 상위 비트를 하위 비트보다 먼저 복호화함으로써 복호화하는 계층적 복호화부와, 부호화된 상기 대역폭확장 데이터를 복호화하고, 복호화된 상기 오디오 데이터와 복호화된 상기 대역폭확장 데이터를 이용하여, 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 상기 오디오 데이터를 추측하는 대역폭확장 복호화부 및 복호화된 상기 오디오 데이터와 추측된 상기 오디오 데이터를 이용하여 합성데이터를 생성하고, 생성된 합성 데이터를 상기 제2 소정 주파수 이하의 상기 오디오 데이터로서 출력하는 데이터 합성부로 구성되고, 상기 제2 소정 주파수는 상기 하나 이상의 계층의 최대 주파수 이상이고, 상기 대역폭확장 데이터는 상기 제1 소정 주파수 이상 및 상기 제2 소정 주파수 이하의 상기 오디오 데이터에 관한 정보를 갖는 것이 바람직하다.

Description

오디오 데이터 부호화 및 복호화 장치와 방법{Apparatus and method for audio encoding/decoding with scalability}

도 1은 본 발명에 의한 오디오 데이터 부호화 장치를 설명하기 위한 블록도이다.

도 2는 기본 계층 및 하나 이상의 확장 계층을 설명하기 위한 참고도이다.

도 3은 대역폭확장 데이터의 주파수 대역과 본 발명에 의한 복호화 장치에 전송되는 일부 계층의 주파수 대역을 비교하기 위한 참고도이다.

도 4는 본 발명에 의한 오디오 데이터 부호화 장치에 의해 생성된 비트스트림의 구조를 나타내는 도면이다.

도 5는 도 1에 도시된 계층적 부호화부(110)를 설명하기 위한 본 발명에 의한 바람직한 일 실시예(110A)의 블록도이다.

도 6은 본 발명에 의한 오디오 데이터 부호화 장치가 부호화하는 데이터의 신택스(syntax)를 나타내는 도면이다.

도 7은 본 발명에 의한 오디오 데이터 부호화 장치에 의해 생성된 대역폭확장 데이터의 신택스를 나타내는 도면이다.

도 8은 본 발명에 의한 오디오 데이터 복호화 장치를 설명하기 위한 블록도이다.

도 9a 내지 도 9d는 본 발명에 의한 오디오 데이터 복호화 장치에 의해 합성 데이터가 생성되는 원리를 설명하기 위한 참고도들이다.

도 10은 도 8에 도시된 계층적 복호화부(820)를 설명하기 위한 본 발명에 의한 바람직한 일 실시예(820A)의 블록도이다.

도 11은 도 8에 도시된 대역폭확장 복호화부(830)를 설명하기 위한 본 발명에 의한 바람직한 일 실시예(830A)의 블록도이다.

도 12는 도 8에 도시된 데이터 합성부(840)를 설명하기 위한 본 발명에 의한 바람직한 일 실시예(840A)의 블록도이다.

도 13은 본 발명에 의한 오디오 데이터 부호화 방법을 설명하기 위한 플로우챠트이다.

도 14는 본 발명에 의한 오디오 데이터 복호화 방법을 설명하기 위한 플로우챠트이다.

도 15는 도 14에 도시된 제1430 단계에 대한 본 발명에 의한 바람직한 일 실시예(1430A)의 플로우챠트이다.

본 발명은 오디오 데이터의 처리에 관한 것으로, 보다 상세하게는, 부호화된 오디오 데이터의 비트율(bit rate) 조절이 가능하고, 복호화하고자 하는 비트스트림에 포함된 오디오 데이터가 일부 계층의 부호화된 오디오 데이터일지라도 모든 계층의 오디오 데이터를 복원하는 오디오 데이터 부호화 및 복호화 장치와 방법에 관한 것이다.

본 출원인이 제안한 바 있는 비섹(BSAC : Bit Sliced Arithmetic Coding)은 고급 오디오 부호화(AAC : Advanced Audio Coding) 기법과 달리, FGS(Fine Grain Salability)를 제공하는 계층적 부호화 기법이며, 엠펙(MPEG : Moving Picture Experts Group)-4에 표준으로 채택된 오디오 압축 기법이다. 이러한 비섹의 세부 내용은 한국특허공보 제261253호에 개시되어 있다.

오디오 데이터를 고급 오디오 부호화 기법을 이용하여 부호화하는 부호화기는, 오디오 데이터를 부호화함에 있어, 오디오 데이터 중 일부 주파수 대역의 오디오 데이터만을 부호화하여 복호화기에 전송할 수 있다.

이 경우, 고급 오디오 부호화 기법을 이용하여 일부 주파수 대역만이 부호화된 오디오 데이터로부터, 전체 주파수 대역의 오디오 데이터를 복원하기 위해, 대역폭확장(SBR : Spectral Band Replication) 기법이 고려될 수 있다. 즉, 그 부호화기는 그 일부 주파수 대역 이외의 주파수 대역에서의 오디오 데이터에 관한 정보를 갖는 대역폭확장 데이터를 생성 및 부호화하고, 그 부호화된 대역폭확장 데이터를 그 일부 주파수 대역만이 부호화된 오디오 데이터와 함께 복호화기에 전송한다. 이로써, 복호화기는 그 일부 주파수 대역 이외의 주파수 대역에서의 오디오 데이터를 추측하여 복원할 수 있다. 이처럼, 고급 오디오 부호화 기법과 대역폭확장 기법은 결합 가능하다.

한편, 오디오 데이터를 비섹을 이용하여 부호화하는 부호화기는, 오디오 데 이터를 고급 오디오 부호화 기법을 이용하여 부호화하는 부호화기와 달리, 오디오 데이터를 부호화함에 있어, 그 오디오 데이터를 주파수 대역별로 분할하여 기본 계층(base layer) 및 하나 이상의 확장 계층(enhancement layer)을 생성하고, 모든 계층의 오디오 데이터를 부호화하고, 그 부호화된 오디오 데이터 중 기본 계층을 포함한 일부 계층의 부호화된 오디오 데이터만을 복호화기에 전송할 수 있다. 이 때, 그 일부 계층은 가변적이므로, 비섹을 이용하여 부호화된 오디오 데이터의 비트율(bit rate)은 조절 가능하다.

고급 오디오 부호화 기법과 대역폭확장 기법의 결합이 용이한 것과 달리, 비섹과 대역폭확장 기법은 결합이 곤란하다. 이는, 부호화된 오디오 데이터 중 복호화기에 전송될 일부 계층이 매 경우마다 다를 수 있어, 그 모든 가능한 경우마다 대역폭확장 데이터를 달리 마련하여야 하기 때문이다.

이에 따라, 계층적 구조를 갖는 부호화된 오디오 데이터 중 복호화기에 전송될 일부 계층이 어떠한 계층인가와 관계없이 동일한 대역폭확장 데이터를 이용하여 모든 계층의 오디오 데이터를 복원할 수 있는 방안이 요구되고 있다.

본 발명이 이루고자 하는 제1 기술적 과제는, 부호화된 대역폭확장 데이터 및 복수의 계층을 가져 비트율 조절이 가능한 부호화된 오디오 데이터로 이루어진 비트스트림을 생성하는 오디오 데이터 부호화 장치를 제공하는 데 있다.

본 발명이 이루고자 하는 제2 기술적 과제는, 복호화하고자 하는 비트스트림에 포함된 오디오 데이터를 복호화하여 그 포함된 오디오 데이터의 주파수 대역의 오디오 데이터를 복원하고, 그 포함된 오디오 데이터가 어떠한 계층인지에 관계없이 동일하며 그 비트스트림에 포함된 대역폭확장 데이터를 이용하여 그 포함된 오디오 데이터의 최대 주파수 이상의 주파수 대역의 오디오 데이터를 추측하여 복원하는 오디오 데이터 복호화 장치를 제공하는 데 있다.

본 발명이 이루고자 하는 제3 기술적 과제는, 부호화된 대역폭확장 데이터 및 복수의 계층을 가져 비트율 조절이 가능한 부호화된 오디오 데이터로 이루어진 비트스트림을 생성하는 오디오 데이터 부호화 방법을 제공하는 데 있다.

본 발명이 이루고자 하는 제4 기술적 과제는, 복호화하고자 하는 비트스트림에 포함된 오디오 데이터를 복호화하여 그 포함된 오디오 데이터의 주파수 대역의 오디오 데이터를 복원하고, 그 포함된 오디오 데이터가 어떠한 계층인지에 관계없이 동일하며 그 비트스트림에 포함된 대역폭확장 데이터를 이용하여 그 포함된 오디오 데이터의 최대 주파수 이상의 주파수 대역의 오디오 데이터를 추측하여 복원하는 오디오 데이터 복호화 방법을 제공하는 데 있다.

본 발명이 이루고자 하는 제5 기술적 과제는, 부호화된 대역폭확장 데이터 및 복수의 계층을 가져 비트율 조절이 가능한 부호화된 오디오 데이터로 이루어진 비트스트림을 생성하는 컴퓨터 프로그램을 저장하는 컴퓨터로 읽을 수 있는 기록매체를 제공하는 데 있다.

본 발명이 이루고자 하는 제6 기술적 과제는, 복호화하고자 하는 비트스트림에 포함된 오디오 데이터를 복호화하여 그 포함된 오디오 데이터의 주파수 대역의 오디오 데이터를 복원하고, 그 포함된 오디오 데이터가 어떠한 계층인지에 관계없 이 동일하며 그 비트스트림에 포함된 대역폭확장 데이터를 이용하여 그 포함된 오디오 데이터의 최대 주파수 이상의 주파수 대역의 오디오 데이터를 추측하여 복원하는 컴퓨터 프로그램을 저장하는 컴퓨터로 읽을 수 있는 기록매체를 제공하는 데 있다.

상기 제1 기술적 과제를 이루기 위해, 본 발명에 의한 오디오 데이터 부호화 장치는, 오디오 데이터를 분할하여 복수의 계층을 생성하고, 생성된 계층마다 상기 오디오 데이터를 소정 개수의 비트로 표현하고, 하위 계층을 상위 계층보다 먼저 부호화하며 상위 비트를 하위 비트보다 먼저 부호화함으로써 상기 오디오 데이터를 부호화하는 계층적 부호화부와, 소정 주파수 이상의 상기 오디오 데이터에 관한 정보를 갖는 대역폭확장 데이터를 생성하고, 생성된 대역폭확장 데이터를 부호화하는 대역폭확장 부호화부 및 상기 부호화된 대역폭확장 데이터 및 소정 비트율에 상응하는 상기 부호화된 오디오 데이터를 이용하여 비트스트림을 생성하는 비트스트림 생성부로 구성되는 것이 바람직하다.

상기 제2 기술적 과제를 이루기 위해, 본 발명에 의한 오디오 데이터 복호화 장치는, 부호화된 대역폭확장 데이터 및 하나 이상의 계층을 가지며 상기 계층마다 소정 개수의 비트로 표현되고 부호화된 오디오 데이터를 주어진 비트스트림으로부터 추출하는 비트스트림 분석부와, 부호화된 상기 오디오 데이터를 하위 계층을 상위 계층보다 먼저 복호화하며 상위 비트를 하위 비트보다 먼저 복호화함으로써 복호화하는 계층적 복호화부와, 부호화된 상기 대역폭확장 데이터를 복호화하고, 복 호화된 상기 오디오 데이터와 복호화된 상기 대역폭확장 데이터를 이용하여, 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 상기 오디오 데이터를 추측하는 대역폭확장 복호화부 및 복호화된 상기 오디오 데이터와 추측된 상기 오디오 데이터를 이용하여 합성데이터를 생성하고, 생성된 합성 데이터를 상기 제2 소정 주파수 이하의 상기 오디오 데이터로서 출력하는 데이터 합성부로 구성되고, 상기 제2 소정 주파수는 상기 하나 이상의 계층의 최대 주파수 이상이고, 상기 대역폭확장 데이터는 상기 제1 소정 주파수 이상 및 상기 제2 소정 주파수 이하의 상기 오디오 데이터에 관한 정보를 갖는 것이 바람직하다.

상기 제3 기술적 과제를 이루기 위해, 본 발명에 의한 오디오 데이터 부호화 방법은, 오디오 데이터를 분할하여 복수의 계층을 생성하고, 생성된 계층마다 상기 오디오 데이터를 소정 개수의 비트로 표현하고, 하위 계층을 상위 계층보다 먼저 부호화하며 상위 비트를 하위 비트보다 먼저 부호화함으로써 상기 오디오 데이터를 부호화하는 (a) 단계와, 소정 주파수 이상의 상기 오디오 데이터에 관한 정보를 갖는 대역폭확장 데이터를 생성하고, 생성된 대역폭확장 데이터를 부호화하는 (b) 단계 및 상기 부호화된 대역폭확장 데이터 및 소정 비트율에 상응하는 상기 부호화된 오디오 데이터를 이용하여 비트스트림을 생성하는 (c) 단계로 이루어지는 것이 바람직하다.

상기 제4 기술적 과제를 이루기 위해, 본 발명에 의한 오디오 데이터 복호화 방법은, 부호화된 대역폭확장 데이터 및 하나 이상의 계층을 가지며 상기 계층마다 소정 개수의 비트로 표현되고 부호화된 오디오 데이터를 주어진 비트스트림으로부 터 추출하는 (a) 단계와, 부호화된 상기 오디오 데이터를 하위 계층을 상위 계층보다 먼저 복호화하며 상위 비트를 하위 비트보다 먼저 복호화함으로써 복호화하는 (b) 단계와, 부호화된 상기 대역폭확장 데이터를 복호화하고, 복호화된 상기 오디오 데이터와 복호화된 상기 대역폭확장 데이터를 이용하여, 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 상기 오디오 데이터를 추측하는 (c) 단계 및 복호화된 상기 오디오 데이터와 추측된 상기 오디오 데이터를 이용하여 합성데이터를 생성하고, 생성된 합성 데이터를 상기 제2 소정 주파수 이하의 상기 오디오 데이터로서 결정하는 (d) 단계로 이루어지고, 상기 제2 소정 주파수는 상기 하나 이상의 계층의 최대 주파수 이상이고, 상기 대역폭확장 데이터는 상기 제1 소정 주파수 이상 및 상기 제2 소정 주파수 이하의 상기 오디오 데이터에 관한 정보를 갖는 것이 바람직하다.

상기 제5 기술적 과제를 이루기 위해, 본 발명에 의한 컴퓨터로 읽을 수 있는 기록매체에 저장된 하나 이상의 컴퓨터 프로그램은, 오디오 데이터를 분할하여 복수의 계층을 생성하고, 생성된 계층마다 상기 오디오 데이터를 소정 개수의 비트로 표현하고, 하위 계층을 상위 계층보다 먼저 부호화하며 상위 비트를 하위 비트보다 먼저 부호화함으로써 상기 오디오 데이터를 부호화하는 (a) 단계와, 소정 주파수 이상의 상기 오디오 데이터에 관한 정보를 갖는 대역폭확장 데이터를 생성하고, 생성된 대역폭확장 데이터를 부호화하는 (b) 단계 및 상기 부호화된 대역폭확장 데이터 및 소정 비트율에 상응하는 상기 부호화된 오디오 데이터를 이용하여 비트스트림을 생성하는 (c) 단계를 수행하는 것이 바람직하다.

상기 제6 기술적 과제를 이루기 위해, 본 발명에 의한 컴퓨터로 읽을 수 있는 기록매체에 저장된 하나 이상의 컴퓨터 프로그램은, 부호화된 대역폭확장 데이터 및 하나 이상의 계층을 가지며 상기 계층마다 소정 개수의 비트로 표현되고 부호화된 오디오 데이터를 주어진 비트스트림으로부터 추출하는 (a) 단계와, 부호화된 상기 오디오 데이터를 하위 계층을 상위 계층보다 먼저 복호화하며 상위 비트를 하위 비트보다 먼저 복호화함으로써 복호화하는 (b) 단계와, 부호화된 상기 대역폭확장 데이터를 복호화하고, 복호화된 상기 오디오 데이터와 복호화된 상기 대역폭확장 데이터를 이용하여, 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 상기 오디오 데이터를 추측하는 (c) 단계 및 복호화된 상기 오디오 데이터와 추측된 상기 오디오 데이터를 이용하여 합성데이터를 생성하고, 생성된 합성 데이터를 상기 제2 소정 주파수 이하의 상기 오디오 데이터로서 결정하는 (d) 단계를 수행하는 것이 바람직하다.

본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시예를 예시하는 첨부 도면 및 그 첨부 도면을 설명하는 내용을 참조하여야만 한다.

이하, 본 발명에 의한 오디오 데이터 부호화 및 복호화 장치와 방법을 첨부한 도면들을 참조하여 다음과 같이 설명한다.

도 1은 본 발명에 의한 오디오 데이터 부호화 장치를 설명하기 위한 블록도로서, 계층적 부호화부(110), 대역폭확장 부호화부(120) 및 비트스트림 생성부(130)로 이루어진다. 이하, 도 1의 동작을 도 2 내지 도 4를 참조하며 설명하기 로 한다.

계층적 부호화부(110)는 입력단자 IN 1을 통해 입력된 오디오 데이터를 분할하여 복수의 계층을 생성하고, 생성된 계층마다 그 오디오 데이터를 소정 개수의 비트로 표현하고, 하위 계층을 상위 계층보다 먼저 부호화하며 상위 비트를 하위 비트보다 먼저 부호화함으로써 그 오디오 데이터를 부호화한다.

구체적으로, 계층적 부호화부(110)는 시간 영역의 오디오 데이터를 주파수 영역의 오디오 데이터로 변환한다. 예컨대, 계층적 부호화부(110)는 개선 이산 여현 변환(MDCT : Modified Discrete Cosine Transform)을 이용하여 그러한 변환을 수행할 수 있다.

또한, 계층적 부호화부(110)는 그 변환된 오디오 데이터를 분할하여 복수의 계층을 생성한다. 여기서, 복수의 계층은 기본 계층(base layer) 및 하나 이상의 확장 계층(enhancement layer)을 의미한다. 이러한 복수의 계층은 주파수 대역(frequency band)에 따라 구별된다. 도 2는 기본 계층(210-0) 및 하나 이상의 확장 계층(210-1, 210-2, ..., 210-N-1)을 설명하기 위한 참고도이다. 도 2에 도시된 바에서, 복수의 계층(210-0, 210-1, 210-2, ..., 210-N-1)은 N(단, N은 2이상의 정수)개의 계층이고, 하나 이상의 확장 계층(210-1, 210-2, ..., 210-N-1)은 제1 확장 계층(210-1) 내지 제N-1 확장 계층(210-N-1)이고, 오디오 데이터(200)의 주파수 대역은 0 [kHz]~ fN [kHz]이고, 식별번호 205는 오디오 데이터(200)가 나타내는 포락선(envelope)을 의미한다. 결국, 그 복수의 계층에서 최하위 계층은 기본 계층(210-0)이며, 최상위 계층은 제N-1 확장 계층(210-N-1)이다.

계층적 부호화부(110)는 그 분할된 오디오 데이터를 양자화(quantization)한다. 예컨대, 계층적 부호화부(110)는 도 2에 점으로 도시된 각각의 오디오 데이터(200)를 양자화한다.

계층적 부호화부(110)는 그 양자화된 오디오 데이터를 소정 개수의 비트(bit)로 표현한다. 이 때, 그 소정 개수는 계층마다 달리 설정될 수 있다.

계층적 부호화부(110)는 그 양자화된 오디오 데이터를 계층적으로 부호화한다. 예컨대, 계층적 부호화부(110)는 그 양자화된 오디오 데이터를 전술한 비섹(BSAC : Bit Sliced Arithmetic Coding)을 이용하여 부호화할 수 있다.

그 부호화된 모든 계층의 오디오 데이터 중 본 발명에 의한 오디오 데이터 복호화 장치로 전송되는 오디오 데이터는 일부 계층의 오디오 데이터일 수도 있고, 모든 계층의 오디오 데이터일 수도 있다. 이 때, 일부 계층은 기본 계층(210-0)을 포함한 하나 이상의 계층을 의미한다. 이와 같이, 그 부호화된 모든 계층의 오디오 데이터 중 본 발명에 의한 오디오 데이터 복호화 장치로 전송되는 오디오 데이터가 일부 계층의 오디오 데이터인 경우, 그 일부 계층의 오디오 데이터는 나머지 계층의 오디오 데이터보다 먼저 부호화되는 것이 바람직하다.

이를 위해, 계층적 부호화부(110)는 그 양자화된 오디오 데이터를 부호화함에 있어, 하위 계층을 상위 계층보다 먼저 부호화하며 상위 비트를 하위 비트보다 먼저 부호화한다. 그에 따라, 계층적 부호화부(110)는 그 복수의 계층(210-0, 210-1, 210-2, ..., 210-N-1) 중 최하위 계층(210-0)에 속하는 오디오 데이터를 가장 먼저 부호화하고, 최상위 계층(210-N-1)에 속하는 오디오 데이터를 가장 나중에 부 호화한다. 또한, 계층적 부호화부(110)는 각각의 계층(210-0, 210-1, 210-2, ...., 210-N-1 중 하나)마다 그 계층에 속한 오디오 데이터 중 하나 이상의 최상위 비트(MSB : Most Significant Bit)를 가장 먼저 부호화하고, 하나 이상의 최하위 비트(LSB : Least Significant Bit)를 가장 나중에 부호화한다. 이러한 부호화 순서는, 오디오 데이터에서 중요한 정보는 상위 계층보다는 하위 계층에, 하위 비트보다는 상위 비트에 많이 분포함이 일반적이라는 사실을 이용하여 도출된 순서이다.

한편, 계층적 부호화부(110)는 모든 계층의 오디오 데이터를 부호화한다.

대역폭확장 데이터(120)는 대역폭확장 데이터(SBR data : Spectral Band Replication data)를 생성하고, 생성된 대역폭확장 데이터를 부호화한다. 본 발명에 의한 대역폭확장 데이터는 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 오디오 데이터에 관한 정보를 갖는 데이터를 의미한다. 이 때, 제1 소정 주파수는 기본 계층(210-0)의 최대 주파수(f1) 이상일 수도 있으나, 기본 계층의 최대 주파수임이 바람직하다. 또한, 제2 소정 주파수는 그 부호화된 모든 계층 중 본 발명에 의한 오디오 데이터 복호화 장치에 전송되는 일부 계층 중 최상위 계층의 최대 주파수 이상임이 바람직하고, 그 부호화된 모든 계층의 최대 주파수(fN)임이 보다 바람직하다. 도 3은 대역폭확장 데이터의 주파수 대역(f1~ fN)과 본 발명에 의한 복호화 장치에 전송되는 일부 계층의 주파수 대역(0~ fk)을 비교하기 위한 참고도이다. 도 3에 도시된 바에서 k는 2이상 N이하의 정수이나, 본 발명에 의한 오디오 데이터 복호화 장치에 전송되는 일부 계층이 기본 계층(210-0)뿐이라면, k는 1일 수 있다.

한편, 그 오디오 데이터에 관한 정보는 그 오디오 데이터의 노이즈(noise)에 관한 정보를 의미할 수도 있고 포락선(envelope)(205)에 관한 정보를 의미할 수도 있다.

구체적으로, 대역폭확장 데이터(120)는 제1 소정 주파수 이상 및 제2 소정 주파수 이하에 속하는 오디오 데이터의 포락선(205)에 관한 정보를 이용하여 대역폭확장 데이터를 생성하고, 그 생성된 대역폭 확장 데이터를 무손실 부호화(lossless encoding)할 수 있다. 이 때, 무손실 부호화는 엔트로피 부호화(entropy encoding)일 수도 있고, 호프만 부호화(Huffman encoding)일 수도 있다.

비트스트림 생성부(130)는 그 부호화된 대역폭확장 데이터 및 소정 비트율에 상응하는 그 부호화된 오디오 데이터를 이용하여 비트스트림(bitstream)을 생성하고, 생성된 비트스트림을 출력단자 OUT 1을 통해 출력한다. 도 4는 본 발명에 의한 오디오 데이터 부호화 장치에 의해 생성된 비트스트림(410)의 구조를 나타내는 도면이다. 도 4에 도시된 바와 같이, 비트스트림(410)은 헤더(header)(420), 기본 계층(210-0)에 속한 각각의 오디오 데이터를 표현하는 비트의 개수에 관한 정보(430-0), 기본 계층에 속한 부호화된 오디오 데이터 및 기본 계층에서의 양자화 스텝 크기(step size)에 관한 정보(440-0), 제n 확장 계층(210-n)(단, n은 1≤n≤N-1인 정수)에 속한 각각의 오디오 데이터를 표현하는 비트의 개수에 관한 정보(430-n), 제n 확장 계층에 속한 부호화된 오디오 데이터 및 제n 확장 계층에서의 양자화 스텝 크기에 관한 정보(440-n), 및 대역폭확장 데이터(450)를 포함한다. 도 4에 도시된 바와 같이, 부호화된 오디오 데이터(430-0, 430-1, ..., 430-N-1)는 비트스트림(410)에 하나 이상의 계층(210-0, 210-1, ..., 210-N-1) 각각마다 마련되나, 부호화된 대역폭확장 데이터(450)는 비트스트림(410)에 계층별로 마련되지 않는다.

한편, 그 소정 비트율은 부호화된 모든 계층의 오디오 데이터 중 본 발명에 의한 오디오 데이터 복호화 장치에 전송하고자 하는 일부 계층의 오디오 데이터가 갖는 비트율을 의미한다. 즉, 그 소정 비트율은 기본 계층(210-0)의 비트율 이상이다.

도 5는 도 1에 도시된 계층적 부호화부(110)를 설명하기 위한 본 발명에 의한 바람직한 일 실시예(110A)의 블록도로서, 시간/주파수 매핑부(510), 심리음향부(520), 양자화부(530), 및 다운 샘플링부(540)로 이루어진다.

시간/주파수 매핑부(510)는 입력단자 IN 2로 입력된 시간 영역의 오디오 데이터를 주파수 영역의 오디오 데이터로 변환한다. 여기서, 입력단자 IN 2는 전술한 입력단자 IN 1과 동일할 수 있다. 또한, 그 시간 영역의 오디오 데이터는, 소정 샘플링 주파수(Fs)를 가지며, 이산적(discrete)으로 존재하는 오디오 데이터임이 바람직하다.

심리음향부(520)는 시간/주파수 매핑부(510)에 의해 변환된 오디오 데이터를 주파수 대역별로 묶어 복수의 계층을 생성한다.

양자화부(530)는 그 각각의 계층마다 오디오 데이터를 양자화하고, 모든 계층에 속한 모든 양자화된 오디오 데이터를 부호화하되, 하위 계층을 상위 계층보다 먼저 부호화하며 상위 비트를 하위 비트보다 먼저 부호화한다. 양자화부(530)는 그 부호화된 결과를 출력단자 OUT 2를 통해 비트스트림 생성부(130)로 출력한다.

한편, 본 발명에 의한 계층적 부호화부(110)에는 다운 샘플링부(540)가 마련될 수 있다. 이러한 다운 샘플링부(540)는 그 시간 영역의 오디오 데이터를 그 소정 샘플링 주파수(Fs) 미만의 샘플링 주파수 예를 들어, Fs/2 로 샘플링하고, 샘플링된 결과를 시간/주파수 매핑부(510) 및 심리음향부(520)로 출력한다.

도 6은 본 발명에 의한 오디오 데이터 부호화 장치가 부호화하는 데이터의 신택스(syntax)를 나타내는 도면이다. 도시된 바에서, 식별번호 610은 비섹에 의해 부호화되는 오디오 데이터를 의미하고, 식별번호 620은 비섹에 의해 부호화되는 오디오 데이터(610)와 결합 가능한 데이터를 의미한다. 멀티채널확장 데이터(EXT_BSAC_CHANNEL)(650), 대역폭확장 데이터(EXT_BSAC_SBR_DATA)(660), 및 '에러검출 데이터 및 대역폭확장 데이터(EXT_BSAC_SBR_DATA_CRC)'(670)는 그러한 결합 가능한 데이터의 일 례들이다.

여기서, 멀티채널확장 데이터(EXT_BSAC_CHANNEL)(650)는 제3 채널 내지 제M 채널(단, M은 3이상의 정수) 각각의 오디오 데이터를 의미한다. 본 명세서 상에서, 제3 채널 내지 제M 채널은 본 발명에 의한 오디오 데이터 부호화 장치에 주어지는 오디오 데이터가 3개 이상의 채널(channel)을 통해 주어지는 오디오 데이터일 경우, 모노(mono) 방식의 채널(제1 채널) 및 스테레오(stereo) 방식의 채널(제1 채널 및 제2 채널)을 제외한 나머지 채널을 의미한다. 이처럼, 오디오 데이터가 3개 이상의 채널을 통해 주어진다면, 본 발명에 의한 계층적 부호화부(110)는 모노/스테레오 부호화부(미 도시) 및 멀티채널확장 부호화부(미 도시)를 포함하는 것이 바람 직하다. 이 때, 모노/스테레오 부호화부(미 도시)는 제1 채널 또는 제2 채널의 오디오 데이터를 부호화한다. 또한, 멀티채널확장 부호화부(미 도시)는 제3 채널 내지 제M 채널 각각의 오디오 데이터를 부호화한다. 한편, 에러검출 데이터는 그 대역폭확장 데이터(EXT_BSAC_SBR_DATA)(660)의 에러 검출(error detection)에 사용되는 데이터를 의미하고, EXT_BSAC_SBR_DATA_CRC(670)는 그 대역폭확장 데이터(EXT_BSAC_SBR_DATA)(660) 및 그 에러검출 데이터를 의미한다.

한편, 본 발명에 의한 오디오 데이터 부호화 장치가 부호화하는 데이터에는, 비섹에 의해 부호화되는 오디오 데이터(610), 및 그 결합 가능한 데이터(620) 뿐만 아니라, 그 결합 가능한 데이터(620)의 시작을 알리는 시작코드(630, 640)도 포함되는 것이 바람직하다. 여기서, 시작코드(630, 640)는 제1 시작코드, 제2 시작코드, 및 제3 시작코드 중 하나의 코드인 것이 바람직하다.

제1 시작코드는 대역폭확장 데이터(EXT_BSAC_SBR_DATA)(660)의 시작을 나타내는 시작코드를 의미한다. 구체적으로, 제1 시작코드는 32 비트의 연속된 0으로 이루어진 제로코드(zero_code)(630) 및 '1111 0000'으로 이루어진 확장코드(extension_type)(640)로 구성될 수 있다. 본 발명에 의한 대역폭확장 부호화부(120)는 이러한 제1 시작코드를 부호화하는 제1 시작코드 부호화부(미 도시)를 포함할 수 있다.

제2 시작코드는 에러검출 데이터 및 대역폭확장 데이터(EXT_BSAC_SBR_DATA_CRC)(670)의 시작을 나타내는 시작코드를 의미한다. 구체적으로, 제2 시작코드는 32비트의 0으로 이루어진 제로코드(zero_code)(630) 및 '1111 0001'로 이루어진 확장코드(extension_type)(640)로 구성될 수 있다. 본 발명에 의한 대역폭확장 부호화부(120)는 이러한 제2 시작코드를 부호화하는 제2 시작코드 부호화부(미 도시)를 포함할 수 있다.

제3 시작코드는 제3 채널 내지 제M 채널(단, M은 3이상의 정수)의 오디오 데이터의 시작을 나타내는 시작코드를 의미한다. 구체적으로, 제3 시작코드는 32 비트의 0으로 이루어진 제로코드(zero_code)(630) 및 '1111 1111'로 이루어진 확장코드(extension_type)(640)로 구성될 수 있다. 본 발명에 의한 멀티채널확장 부호화부(미 도시)는 이러한 제3 시작코드를 부호화하는 제3 시작코드 부호화부(미 도시)를 포함할 수 있다.

도 7은 본 발명에 의한 오디오 데이터 부호화 장치에 의해 생성된 대역폭확장 데이터의 신택스를 나타내는 도면이다. 본 발명에 의한 오디오 데이터 부호화 장치에 주어지는 오디오 데이터는 제1 채널 또는 제2 채널을 통해 주어질 수 있고, 도시된 바에서 bsac_sbr_data(nch, bs_amp_res); (710)은 '대역폭확장 부호화부(120)는 채널별로 대역폭확장 데이터를 부호화함'을 의미한다.

도 8은 본 발명에 의한 오디오 데이터 복호화 장치를 설명하기 위한 블록도로서, 비트스트림 분석부(810), 계층적 복호화부(820), 대역폭확장 복호화부(830), 및 데이터 합성부(840)로 이루어진다.

비트스트림 분석부(810)는 입력단자 IN 3을 통해 입력된 비트스트림으로부터, '부호화된 대역폭확장 데이터' 및 '하나 이상의 계층을 가지며 각 계층마다 소정 개수의 비트로 표현되고 부호화된 오디오 데이터'를 추출한다. 여기서, 입력단 자 IN 3을 통해 입력된 비트스트림은 출력단자 OUT 1을 통해 출력된 비트스트림인 것이 바람직하다. 즉, 비트스트림 분석부(810)는 입력단자 IN 3을 통해 입력된 비트스트림으로부터, '대역폭확장 부호화부(120)에 의해 생성된 대역폭확장 데이터' 및 '계층적 부호화부(110)에 의해 생성된 모든 계층의 부호화된 오디오 데이터 중 하나 이상의 계층의 오디오 데이터'를 추출한다.

계층적 복호화부(820)는 그 추출된 오디오 데이터를, 하위 계층을 상위 계층보다 먼저 복호화하며 상위 비트를 하위 비트보다 먼저 복호화함으로써 복호화한다. 다만, 계층적 복호화부(820)는 그 추출된 오디오 데이터를, 소정 비트율 내에서 복호화할 수 있다. 예컨대, 계층적 부호화부(110)에서 부호화된 오디오 데이터 중 비트스트림 생성부(130)에 의해 비트스트림에 포함된 오디오 데이터는 기본 계층(210-0), 제1 확장 계층(210-1), 및 제2 확장 계층(210-2)에 속한 오디오 데이터 뿐인 경우, 계층적 복호화부(820)는 기본 계층(210-0), 제1 확장 계층(210-1) 및 제2 확장 계층(210-2)에 속한 오디오 데이터 모두를 복호화할 수도 있고, 기본 계층(210-0), 및 제1 확장 계층(210-1)에 속한 오디오 데이터 모두를 복호화할 수도 있고, 기본 계층(210-0)에 속한 오디오 데이터만을 복호화할 수도 있다. 그 소정 비트율은 기본 계층(210-0)의 비트율 이상인 것이 바람직하다.

한편, 부호화된 오디오 데이터가 그 입력된 비트스트림에 제1 채널 내지 제M 채널 각각마다 마련되는 경우에 대비해, 계층적 복호화부(820)는 모노/스테레오 복호화부(미 도시), 멀티채널확장 복호화부(미 도시) 및 제3 시작코드 복호화부(미 도시)를 포함하는 것이 바람직하다. 여기서, 모노/스테레오 복호화부(미 도시)는 제1 채널 또는 제2 채널의 부호화된 오디오 데이터를 복호화하고, 멀티채널확장 복호화부(미 도시)는 제3 채널 내지 제M 채널 각각의 부호화된 오디오 데이터를 복호화하고, 제3 시작코드 복호화부(미 도시)는 부호화된 제3 시작코드를 복호화한다. 이처럼, 계층적 복호화부(820)에 멀티채널확장 복호화부(미 도시)가 포함된다면, 비트스트림 분석부(810)는 부호화된 제3 시작코드가 그 입력된 비트스트림에 존재하는지 검사한다. 만일, 부호화된 제3 시작코드가 그 입력된 비트스트림에 존재한다고 검사되면, 비트스트림 분석부(810)는 그 부호화된 제3 시작코드를 그 입력된 비트스트림으로부터 추출하고, 제3 시작코드 복호화부(미 도시)는 그 추출된 제3 시작코드를 복호화하고 멀티채널확장 복호화부(미 도시)의 동작을 지시한다.

대역폭확장 복호화부(830)는 그 추출된 대역폭확장 데이터를 복호화한다. 또한, 대역폭확장 복호화부(830)는 '계층적 복호화부(820)로부터 입력된 오디오 데이터' 및 '그 복호화된 대역폭확장 데이터'를 이용하여, 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 오디오 데이터를 추측한다.

한편, 본 발명에 의한 오디오 데이터 복호화 장치에는, 제1 시작코드 복호화부(미 도시)와 제2 시작코드 복호화부(미 도시)가 마련될 수 있다. 이 경우, 비트스트림 분석부(810)는 부호화된 제1 시작코드 및 부호화된 제2 시작코드가 그 입력된 비트스트림에 존재하는지 검사한다. 만일, 부호화된 제1 시작코드 및 부호화된 제2 시작코드가 그 입력된 비트스트림에 존재한다고 검사되면, 비트스트림 분석부(810)는 그 부호화된 제1 시작코드 및 그 부호화된 제2 시작코드를 그 입력된 비트스트림으로부터 추출하고, 제1 시작코드 복호화부(미 도시)는 그 부호화된 제1 시작코드를 복호화하고, 제2 시작코드 복호화부(미 도시)는 그 부호화된 제2 시작코드를 복호화한다. 이 후, 제1 시작코드 복호화부(미 도시) 및 제2 시작코드 복호화부(미 도시)는 대역폭확장 복호화부(830)의 동작을 지시한다.

데이터 합성부(840)는 '계층적 복호화부(820)로부터 입력된 오디오 데이터' 및 '대역폭확장 복호화부(830)에서 추측된 오디오 데이터'를 이용하여, 합성 데이터를 생성한다. 또한, 데이터 합성부(840)는 합성 데이터가 주파수 영역의 데이터이므로 그 합성 데이터를 시간 영역으로 변환하고, 변환된 합성 데이터를 출력단자 OUT 3을 통해 '0 이상 및 제2 소정 주파수 이하의 오디오 데이터'로서 출력한다. 즉, 본 발명에 의한 오디오 데이터 부호화 장치에 의해 부호화된 오디오 데이터의 최대 주파수가 제2 소정 주파수라면, 데이터 합성부(840)는 비트스트림에 포함된 오디오 데이터가 그 부호화된 오디오 데이터 중 일부 계층의 오디오 데이터일지라도, 모든 계층의 오디오 데이터를 복원한다.

도 9a 내지 도 9d는 도 8에 도시된 데이터 합성부(840)의 동작을 보다 구체적으로 설명하기 위한 참고도들이다. 구체적으로, 도 9a는 본 발명에 의한 계층적 부호화부(110)에 입력된 오디오 데이터(910)를 나타내고, 도 9b는 본 발명에 의한 계층적 복호화부(820)에 의해 복호화된 오디오 데이터(920)를 나타내고, 도 9c는 본 발명에 의한 대역폭확장 복호화부(830)에 의해 추측된 오디오 데이터(930)를 나타내고, 도 9d는 본 발명에 의한 데이터 합성부(840)에 의해 생성된 합성 데이터(940) 즉, 0이상 제2 소정 주파수 이하의 부호화된 오디오 데이터를 복원한 결과(940)를 나타낸다.

도시된 바에서, 오디오 데이터(910, 920, 930, 940)는 연속적으로 존재하듯이 도시되었으나, 이는 설명의 편의를 위한 것이며, 실제로 오디오 데이터(910, 920, 930, 940)는 이산적으로 존재한다.

도시된 바에서, 본 발명에 의한 계층적 부호화부(110)에 입력된 오디오 데이터(910)는 0~ f10 [kHz] 이하의 주파수 대역에 존재한다. 한편, 본 발명에 의한 계층적 복호화부(820)에 의해 복호화된 오디오 데이터(920)는 0~ f3 [kHz] 의 주파수 대역에 존재한다. 비트스트림에는 그 부호화된 오디오 데이터 중 모든 계층의 오디오 데이터가 포함될 수도 있고, 일부 계층의 오디오 데이터만이 포함될 수도 있으며, 도 9b에 도시된 바에서, 비트스트림에는 일부 계층(0~ f3 [kHz] )의 오디오 데이터만이 포함되었다. 한편, 그 일부 계층에 기본 계층(0~ f1 [kHz])은 항상 포함되는 것이 바람직하다.

본 발명에 의한 대역폭확장 복호화부(830)에 의해 추측된 오디오 데이터(930)는 f1~ f10 [kHz]의 주파수 대역에 존재한다. 한편, 본 발명에 의한 데이터 합성부(840)에 의해 생성된 합성 데이터(940)는 0~ f10 [kHz]의 주파수 대역에 존재한다. 즉, 도 9d에 도시된 바(940)는 도 9a에 도시된 바(910)를 복원한 결과이다. 양 자는 어느 정도 다를 수도 있으나, 바람직하게는 서로 동일하다.

데이터 합성부(840)는 '계층적 복호화부(820)에 의해 복호화된 오디오 데이터(920)가 존재하는 주파수 대역(0~ f3 [kHz])'의 경우, 그 복호화된 오디오 데이터(920)를 합성 데이터로서 출력한다.

그와 달리, 데이터 합성부(840)는 '계층적 복호화부(820)에 의해 복호화된 오디오 데이터(920)가 존재하지 않는 주파수 대역(f3~ f10 [kHz])'의 경우, 그 추측된 오디오 데이터(930)를 합성 데이터로서 출력한다.

결국, '그 복호화된 오디오 데이터(920)'와 '그 추측된 오디오 데이터(930)'가 모두 존재하는 주파수 대역(f1~ f3 [kHz])의 경우, 데이터 합성부(840)는 그 복호화된 오디오 데이터(920)가 합성 데이터라고 결정한다.

도 10은 도 8에 도시된 계층적 복호화부(820)를 설명하기 위한 본 발명에 의한 바람직한 일 실시예(820A)의 블록도로서, 역양자화부(1010) 및 주파수/시간 매핑부(1020)를 포함할 수 있다.

역양자화부(1010)는 입력단자 IN 4를 통해 입력된 '그 추출된 오디오 데이터'를 복호화하고, 복호화된 오디오 데이터를 역양자화한다. 한편, 주파수/시간 매핑부(1020)는 주파수 영역의 그 역양자화된 오디오 데이터를 시간 영역의 오디오 데이터로 변환하고, 변환된 오디오 데이터를 출력단자 OUT 4를 통해 출력한다.

도 11은 도 8에 도시된 대역폭확장 복호화부(830)를 설명하기 위한 본 발명에 의한 바람직한 일 실시예(830A)의 블록도로서, 무손실 복호화부부(1110), 고주파 발생부(1120), 분석 뱅크(Analysis QMF Bank)(1130), 및 포락선 조정부(1140)로 이루어진다.

무손실 복호화부(1110)는 입력단자 IN 5를 통해 입력된 '그 추출된 대역폭확장 데이터'를 무손실 복호화(lossless decoding)한다. 이 때, 무손실 복호화는 엔트로피 복호화(entropy decoding)일 수도 있고, 호프만 복호화(Huffman decoding)일 수도 있다. 이로써, 무손실 복호화부(1110)는 그 추출된 대역폭확장 데이터에 담긴 '제1 소정 주파수 이상 및 제2 소정 주파수 이하의 오디오 데이터에 관한 정보'를 획득한다. 예컨대, 무손실 복호화부(1110)는 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 오디오 데이터의 포락선에 관한 정보를 획득한다.

고주파 발생부(1120)는 '계층적 복호화부(820)에 의해 복호화된 오디오 데이터(920)'를 그 '계층적 복호화부(820)에 의해 복호화된 오디오 데이터(920)'의 최대 주파수(도 9에서, f3) 이상의 주파수 대역(도 9에서, f3~ f6, f6~ f9, f9~ f10)에 발생시킨다. 다만, 그 복호화된 오디오 데이터는 시간 영역의 오디오 데이터이므로, 그 복호화된 오디오 데이터를 그 복호화된 오디오 데이터의 최대 주파수 이상의 주파수 대역에 발생시키기 위해서는, 그 복호화된 오디오 데이터를 주파수 영역으로 변환하는 것이 바람직하다. 이를 위해, 본 발명에 의한 대역폭확장 복호화부(830)에는 분석 뱅크(1130)가 마련될 수 있다.

분석 뱅크(1130)는 입력단자 IN 6을 통해 입력된 '그 복호화된 오디오 데이터'를 주파수 영역의 오디오 데이터로 변환하고, 변환된 오디오 데이터를 출력단자 OUT 6을 통해 출력한다.

포락선 조정부(1140)는 고주파 발생부(1120)에서 발생된 오디오 데이터의 포락선을 무손실 복호화부(1110)가 획득한 정보를 이용하여 조정한다. 즉, 포락선 조정부(1140)는 고주파 발생부(1120)에서 발생된 오디오 데이터의 포락선이 본 발명에 의한 계층적 부호화부(110)에 의해 부호화된 오디오 데이터의 포락선과 일치하도록, 그 발생된 오디오 데이터를 조정한다. 그 조정된 오디오 데이터는 출력단자 OUT 5를 통해 출력되고, 계층적 부호화부(110)에 입력된 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 오디오 데이터는 그 조정된 오디오 데이터라고 추측된다.

도 12는 도 8에 도시된 데이터 합성부(840)를 설명하기 위한 본 발명에 의한 바람직한 일 실시예(840A)의 블록도로서, 오버래핑부(1210) 및 합성 뱅크(Synthesis QMF Bank)(1220)로 이루어진다.

오버래핑부(1210)는 입력단자 IN 7을 통해 입력된 '계층적 복호화부(820)에 의해 복호화된 오디오 데이터(920)' 및 입력단자 IN 8을 통해 입력된 '대역폭확장 복호화부(830)에 의해 추측된 오디오 데이터(930)'를 이용하여 합성 데이터를 생성한다.

구체적으로, 오버래핑부(1210)는 '그 복호화된 오디오 데이터(920)가 존재하는 주파수 대역(도 9에서, 0~ f3 [kHz])'의 경우, 그 복호화된 오디오 데이터(920)를 합성 데이터로서 출력하고, '그 추측된 오디오 데이터(930)만이 존재하는 주파수 대역(도 9에서, f3~ f10)'의 경우, 그 추측된 오디오 데이터(930)를 합성 데이터로서 출력한다.

한편, 입력단자 IN 7을 통해 입력된 '계층적 복호화부(820)에 의해 복호화된 오디오 데이터(920)' 및 입력단자 IN 8을 통해 입력된 '대역폭확장 복호화부(830)에 의해 추측된 오디오 데이터(930)' 모두, 주파수 영역의 오디오 데이터이다. 그러므로, 그 복호화된 오디오 데이터가 시간 영역의 오디오 데이터라면, 그 복호화된 오디오 데이터는 분석 뱅크(1130)를 거쳐 입력단자 IN 7에 입력되는 것이 바람직하다.

합성 뱅크(1220)는 주파수 영역의 합성 데이터를 시간 영역의 합성 데이터로 변환하고, 변환된 결과를 출력단자 OUT 7을 통해 출력한다.

도 13은 본 발명에 의한 오디오 데이터 부호화 방법을 설명하기 위한 플로우챠트로서, 오디오 데이터를 비섹을 이용하여 부호화하고, 대역폭확장 데이터를 부호화하고, 그 부호화된 오디오 데이터와 그 부호화된 대역폭확장 데이터를 이용하여 비트스트림을 생성하는 단계들(제1310~ 1330 단계들)로 이루어진다.

계층적 부호화부(110)는 오디오 데이터를 분할하여 복수의 계층을 생성하고, 생성된 계층마다 그 오디오 데이터를 소정 개수의 비트로 표현하고, 모든 계층의 오디오 데이터를 부호화하되, 하위 계층을 상위 계층보다 먼저 부호화하며 상위 비트를 하위 비트보다 먼저 부호화한다(제1310 단계).

대역폭확장 부호화부(120)는 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 오디오 데이터에 관한 정보를 갖는 대역폭확장 데이터를 생성하고, 생성된 대역폭확장 데이터를 호프만 부호화한다(제1320 단계).

여기서, 제1320 단계는 도시된 바와 같이 제1310 단계가 수행된 후에 수행될 수도 있고, 도시된 바와 달리 제1310 단계보다 먼저 수행되거나 제1310 단계와 동시에 수행될 수도 있다.

제1310 단계 및 제1320 단계 후에, 비트스트림 생성부(130)는 제1310 단계에서 부호화된 오디오 데이터와 제1320 단계에서 부호화된 대역폭확장 데이터를 이용하여 비트스트림을 생성한다(제1330 단계).

도 14는 본 발명에 의한 오디오 데이터 복호화 방법을 설명하기 위한 플로우챠트로서, 복호화하고자 하는 비트스트림에 포함된 오디오 데이터를 복호화하여 그 포함된 오디오 데이터의 주파수 대역의 오디오 데이터를 복원하고, 그 포함된 오디오 데이터가 어떠한 계층인지에 관계없이 동일하며 그 비트스트림에 포함된 대역폭확장 데이터를 이용하여 그 포함된 오디오 데이터의 최대 주파수 이상의 주파수 대역의 오디오 데이터를 추측하여 복원하는 단계들(제1410~ 1440 단계들)로 이루어진다.

비트스트림 분석부(810)는 주어진 비트스트림으로부터 제1310 단계에서 부호화된 대역폭확장 데이터 및 제1320 단계에서 부호화된 오디오 데이터를 추출한다(제1410 단계).

계층적 복호화부(820)는 제1310 단계에서 부호화된 오디오 데이터를, 하위 계층을 상위 계층보다 먼저 복호화하며 상위 비트를 하위 비트보다 먼저 복호화함으로써 복호화한다(제1420 단계).

대역폭확장 복호화부(830)는 제1320 단계에서 부호화된 대역폭확장 데이터를 복호화하고, 복호화된 대역폭확장 데이터 및 제1420 단계에서 복호화된 오디오 데이터를 이용하여, 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 오디오 데이터를 추측한다(제1430 단계).

데이터 합성부(840)는 제1420 단계에서 복호화된 오디오 데이터와 제1430 단계에서 추측된 오디오 데이터를 이용하여 합성데이터를 생성하고, 생성된 합성 데이터를 0이상 및 제2 소정 주파수 이하의 오디오 데이터로서 결정한다(제1440 단계).

도 15는 도 14에 도시된 제1430 단계에 대한 본 발명에 의한 바람직한 일 실 시예(1430A)의 플로우챠트로서, 제1420 단계에서 복호화된 오디오 데이터와 제1320 단계에서 부호화된 대역폭확장 데이터를 이용하여, 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 오디오 데이터를 추측하는 단계들(제1510~ 1530 단계들)로 이루어진다.

무손실 복호화부(1110)는 복호화하고자 하는 비트스트림에 포함된 부호화된 대역폭확장 데이터를 무손실 복호화하여, 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 오디오 데이터가 나타내는 포락선에 관한 정보를 획득한다(제1510 단계).

제1510 단계 후에, 고주파 발생부(1120)는 제1420 단계에서 복호화된 오디오 데이터를 그 제1420 단계에서 복호화된 오디오 데이터가 존재하는 최대 주파수 이상의 주파수 대역에 발생시킨다(제1520 단계).

제1520 단계 후에, 포락선 조정부(1140)는 제1520 단계에서 발생된 오디오 데이터의 포락선을 제1510 단계에서 획득된 정보를 이용하여 조정하고, 제1440 단계로 진행한다(제1530 단계).

본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있으며, 또한 캐리어 웨이브 (예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있 는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.

이상 도면과 명세서에서 최적 실시예들이 개시되었다. 여기서 특정한 용어들이 사용되었으나, 이는 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미 한정이나 특허청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.

이상에서 설명한 바와 같이, 본 발명에 의한 오디오 데이터 부호화 및 복호화 장치와 방법은, 복호화하고자 하는 비트스트림에 포함된 오디오 데이터를 복호화하여 그 포함된 오디오 데이터의 주파수 대역의 오디오 데이터를 복원하고, 그 비트스트림에 포함된 대역폭확장 데이터를 이용하여 그 포함된 오디오 데이터의 최대 주파수 이상의 주파수 대역의 오디오 데이터를 추측하여 복원하므로, 그 포함된 오디오 데이터가 일부 계층의 부호화된 오디오 데이터일지라도 모든 계층의 오디오 데이터를 복원할 수 있는 효과를 갖는다. 나아가, 본 발명에 의하면, 그 포함된 대역폭확장 데이터가 그 포함된 오디오 데이터가 어떠한 계층인지에 관계없이 동일하므로, 비섹(BSAC)과 같은 계층적 코덱(scalable codec) 기법에 대역폭확장 기법이 용이하게 결합할 수 있다.

Claims

계층적으로 부호화된 오디오 데이터를 복호화하는 단계;

상기 오디오 데이터의 페이로드가 종결되었다는 것을 나타내는 코드를 검출하는 단계;

확장 데이터의 페이로드가 시작되었다는 것을 나타내는 코드를 검출하는 단계;

확장 데이터의 타입을 검출하는 단계;

상기 검출된 타입이 대역폭 확장 데이터를 나타내는지 여부를 판단하는 단계; 및

상기 판단하는 단계에서 나타낸다고 판단되면, 상기 대역폭 확장 데이터를 복호화하는 단계를 포함하는 것을 특징으로 하는 오디오 데이터 복호화 방법.
계층적으로 부호화된 오디오 데이터를 복호화하는 단계;

‘zero_code’를 검출하는 단계;

‘extension_type’을 검출하는 단계; 및

상기 검출된 ‘extension_type’이 대역폭 확장 데이터를 나타내는지 여부를 판단하는 단계; 및

상기 판단하는 단계에서 나타낸다고 판단되면, 상기 대역폭 확장 데이터를 복호화하는 단계를 포함하는 것을 특징으로 하는 오디오 데이터 복호화 방법.