KR20070121568A

KR20070121568A - 오디오 데이터 부호화 방법 및 장치

Info

Publication number: KR20070121568A
Application number: KR1020070060997A
Authority: KR
Inventors: 김미영; 이시화; 김도형
Original assignee: 삼성전자주식회사
Priority date: 2006-06-21
Filing date: 2007-06-21
Publication date: 2007-12-27
Also published as: KR101393299B1

Abstract

본 발명에 의한 오디오 데이터 부호화 방법 및 장치는, 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 초기값을 그 주파수 대역들 각각의 양자화 에러와 최대허용가능 왜곡도를 고려하여 결정하고, 그 주파수 대역들 각각마다, 상기 결정된 초기값과 미리 설정된 전대역 스케일팩터의 값을 비교하고 비교된 결과를 고려하여 대역별 스케일팩터의 최종값을 결정하고, 그 오디오 데이터를 그 주파수 대역들의 그 결정된 최종값들을 고려하여 양자화하고, 양자화된 그 오디오 데이터를 부호화함으로써, 그 오디오 데이터의 부호화를 보다 신속히 완료하는 효과, 보다 구체적으로는, 그 오디오 데이터의 양자화를 보다 신속히 완료하는 효과를 갖는다.

Description

오디오 데이터 부호화 방법 및 장치{Method and apparatus for encoding an audio data}

도 1은 본 발명에 의한 오디오 데이터 부호화 장치를 설명하기 위한 블록도이다.

도 2는 도 1에 도시된 비트율 결정부(130)에 대한 바람직한 일 실시예의 블록도이다.

도 3은 본 발명에 의한 오디오 데이터 부호화 방법을 설명하기 위한 플로우챠트이다.

본 발명은 오디오 데이터의 압축에 관한 것으로, 특히, 비트율(bit rate)을 조절할 수 있는 오디오 데이터 부호화 방법 및 장치에 관한 것이다.

오디오 데이터를 부호화하는 과정은, 시간 영역의 오디오 데이터를 주파수 영역의 오디오 데이터로 변환하는 변환 과정, 사람의 청각 특성을 반영하여 주파수 대역별로 최대허용가능 왜곡도를 계산하는 계산 과정, 주파수 대역별로 계산된 최대허용가능 왜곡도를 고려하여 주파수 영역의 오디오 데이터를 양자화하는 양자화 과정, 양자화된 오디오 데이터에 대해 무손실 부호화를 수행하는 코딩 과정을 포함한다.

한편, 오디오 데이터를 부호화하는 과정의 세부 과정들 중, 오디오 데이터를 부호화하는데 소요되는 시간의 대부분을 차지하는 과정은, 양자화 과정이다. 이에 따라, 오디오 데이터의 부호화를 보다 신속히 완료하기 위한 방안으로서, 양자화 과정을 보다 신속히 완료하기 위한 방안이 절실히 요구되고 있다.

본 발명이 이루고자 하는 기술적 과제는, 오디오 데이터의 부호화를 보다 신속히 완료하는, 보다 구체적으로는, 그 오디오 데이터의 양자화를 보다 신속히 완료하는 오디오 데이터 부호화 방법을 제공하는 데 있다.

본 발명이 이루고자 하는 다른 기술적 과제는, 오디오 데이터의 부호화를 보다 신속히 완료하는, 보다 구체적으로는, 그 오디오 데이터의 양자화를 보다 신속히 완료하는 오디오 데이터 부호화 장치를 제공하는 데 있다.

본 발명이 이루고자 하는 또 다른 기술적 과제는, 컴퓨터가 오디오 데이터의 부호화를 보다 신속히 완료하도록 하는, 보다 구체적으로는, 컴퓨터가 그 오디오 데이터의 양자화를 보다 신속히 완료하도록 하는 컴퓨터 프로그램을 저장한 컴퓨터로 읽을 수 있는 기록매체를 제공하는 데 있다.

상기 과제를 이루기 위해, 본 발명에 의한 오디오 데이터 부호화 방법은, 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 초기값을 상기 주파수 대역들 각각의 양자화 에러와 최대허용가능 왜곡도를 고려하여 결정하는 단계; 상기 주파수 대역들 각각마다, 상기 결정된 초기값과 미리 설정된 전대역 스케일팩터의 값을 비교하고 비교된 결과를 고려하여 상기 대역별 스케일팩터의 최종값을 결정하는 단계; 상기 오디오 데이터를 상기 주파수 대역들의 상기 결정된 최종값들을 고려하여 양자화하는 단계; 및 양자화된 상기 오디오 데이터를 부호화하는 단계를 포함하는 것이 바람직하다.

상기 다른 과제를 이루기 위해, 본 발명에 의한 오디오 데이터 부호화 장치는, 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 초기값을 상기 주파수 대역들 각각의 양자화 에러와 최대허용가능 왜곡도를 고려하여 결정하는 제1 스케일팩터 결정부; 상기 주파수 대역들 각각마다, 상기 결정된 초기값과 미리 설정된 전대역 스케일팩터의 값을 비교하고 비교된 결과를 고려하여 상기 대역별 스케일팩터의 최종값을 결정하는 제2 스케일팩터 결정부; 상기 오디오 데이터를 상기 주파수 대역들의 상기 결정된 최종값들을 고려하여 양자화하는 양자화부; 및 양자화된 상기 오디오 데이터를 부호화하는 무손실 부호화부를 포함하는 것이 바람직하다.

상기 또 다른 과제를 이루기 위해, 본 발명에 의한 컴퓨터로 읽을 수 있는 기록매체는, 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 초기값을 상기 주파수 대역들 각각의 양자화 에러와 최대허용가능 왜곡도를 고려하여 결정하는 단계; 상기 주파수 대역들 각각마다, 상기 결정된 초기값과 미리 설정된 전대역 스케일팩터의 값을 비교하고 비교된 결과를 고려하여 상기 대역별 스케일팩터의 최 종값을 결정하는 단계; 상기 오디오 데이터를 상기 주파수 대역들의 상기 결정된 최종값들을 고려하여 양자화하는 단계; 및 양자화된 상기 오디오 데이터를 부호화하는 단계를 컴퓨터에서 실행시키기 위한 컴퓨터 프로그램을 저장한 컴퓨터로 읽을 수 있는 기록매체를 제공하는 데 있다.

본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시예를 예시하는 첨부 도면 및 그 첨부 도면을 설명하는 내용을 참조하여야만 한다.

이하, 본 발명에 의한 오디오 데이터 부호화 방법 및 장치를 첨부한 도면들을 참조하여 다음과 같이 설명한다.

도 1은 본 발명에 의한 오디오 데이터 부호화 장치를 설명하기 위한 블록도로서, 도메인(domain) 변환부(110), 심리음향 모델부(120), 비트율 결정부(130), 및 무손실 부호화부(140)를 포함할 수 있다.

도메인 변환부(110)는 입력단자 IN 1을 통해 입력된 시간 영역의 오디오 데이터(예를 들어, PCM(Pulse Code Modulation) 데이터)를 주파수 영역의 오디오 데이터로 변환한다. 이를 위해, 도메인 변환부(110)는 입력단자 IN 1을 통해 입력된 시간 영역의 오디오 데이터에 대해 MDCT(Modified Discrete Cosine Transform)을 수행할 수 있다.

한편, 사람의 청력이 오디오 데이터에 민감하게 반응하는 정도는, 그 오디오 데이터의 주파수 대역들 각각마다 상이한 것이 일반적이다. 이에 따라, 오디오 데이터를 양자화함에 있어, 그 오디오 데이터의 주파수 대역들 각각마다 사람의 청력 이 인식하지 못할 정도의 왜곡을 허용하면서 양자화한다면, 그 오디오 데이터의 부호화된 결과의 비트율은 그와 같은 왜곡을 허용하지 않으면서 그 오디오 데이터를 양자화할 때에 비해 낮아지게 된다.

심리음향(psychoacoustic) 모델부(120)는 입력단자 IN 1을 통해 입력된 시간 영역의 오디오 데이터를 주파수 영역의 오디오 데이터로 변환하고, 변환된 오디오 데이터의 주파수 대역들 각각의 최대허용가능 왜곡도를, 사람의 청각 특성을 고려하여 계산한다. 여기서, 최대허용가능 왜곡도란, 사람의 청력이 인식하지 못할 정도의 왜곡 중 최대 왜곡을 의미한다.

비트율 결정부(130)는 도메인 변환부(110)로부터 입력된 오디오 데이터를 양자화한다. 한편, 어떠한 데이터를 양자화하기 위해서는, 그 데이터가 양자화될 경우의 그 양자화된 결과들간의 간격(소위, '양자화 스텝(step) 사이즈(size)')이 결정되어야 한다.

즉, 비트율 결정부(130)는 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 값을 결정한 뒤, 그 오디오 데이터를 양자화한다. 본 명세서에서, 대역별 스케일팩터란 양자화 스텝 사이즈를 의미하며, 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 값은 서로 상이할 수 있다.

구체적으로, 비트율 결정부(130)는, 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 값을 그 오디오 데이터의 주파수 대역들 각각의 최대허용가능 왜곡도를 초과하지 않는 수준의 왜곡을 허용하면서 그 오디오 데이터를 양자화하기 위한 값으로서 결정할 수 있다. 이 때, 최대허용가능 왜곡도는, 전술한 바와 같이, 심리음향 모델부(120)에서 계산된 값이다. 이 후, 비트율 결정부(130)는, 그 오디오 데이터의 주파수 대역들 각각의 그 결정된 값을, 그 오디오 데이터의 부호화시 필요한 비트의 개수인 사용 비트량이 최대가용 비트량을 초과하지 않도록 하면서 그 오디오 데이터를 양자화하기 위한 값으로 조정할 수 있다. 여기서, 최대가용 비트량이란, 오디오 데이터를 부호화하는데 사용될 수 있는 최대 비트수를 의미한다. 이 후, 비트율 결정부(130)는, 그 오디오 데이터를 그 오디오 데이터의 주파수 대역들의 대역별 스케일팩터들의 값들을 고려하여 양자화할 수 있다. 이로써, 오디오 데이터의 부호화된 결과의 비트율은 미리 설정된 어떤 비트율을 만족할 수 있다. 즉, 오디오 데이터의 부호화된 결과의 비트율은 미리 설정된 어떤 비트율을 항상 초과하지 않을 수 있다.

무손실 부호화부(140)는 비트율 결정부(130)로부터 입력된 '양자화된 오디오 데이터'에 대해 무손실 부호화(lossless coding)를 수행하고, 무손실 부호화된 결과를 출력단자 OUT 1을 통해 출력한다. 예컨대, 무손실 부호화부(140)는 '양자화된 오디오 데이터'에 대해 엔트로피 부호화(entropy coding)를 수행할 수 있다.

도 2는 도 1에 도시된 비트율 결정부(130)에 대한 바람직한 일 실시예의 블록도로서, 제1 스케일팩터 결정부(210), 제2 스케일팩터 결정부(220), 양자화부(230), 사용비트량 계산부(240), 비트량 비교부(250), 및 스케일팩터 갱신부(260)를 포함할 수 있다.

제1 스케일팩터 결정부(210)는 입력단자 IN 2를 통해 입력된 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 초기값을 그 주파수 대역들 각각의 양자화 에러(quantization error)와 최대허용가능 왜곡도를 고려하여 결정한다. 여기서, 입력단자 IN 2를 통해 입력된 오디오 데이터는, 도메인 변환부(110)로부터 입력된 오디오 데이터이다.

구체적으로, 제1 스케일팩터 결정부(210)는, 오디오 데이터의 어떤 주파수 대역의 대역별 스케일팩터의 초기값을, 그 어떤 주파수 대역의 '양자화 에러'와 '최대허용가능 왜곡도'를 고려하여 결정한다. 여기서, 그 어떤 주파수 대역의 '양자화 에러'란, 그 어떤 주파수 대역의 오디오 데이터가 양자화로 인해 왜곡되는 정도를 의미한다. 이러한 '양자화 에러'의 값은, 제1 스케일팩터 결정부(210)가 오디오 데이터가 양자화된 후에 그 양자화된 결과를 이용하여 계산한 값일 수도 있고, 제1 스케일팩터 결정부(210)가 오디오 데이터가 양자화되었다고 가정한 상태에서 예측한 값일 수도 있다. 한편, 그 어떤 주파수 대역의 '최대허용가능 왜곡도'는, 전술한 바와 같이, 심리음향 모델부(120)에서 계산된 값이다.

보다 구체적으로, 제1 스케일팩터 결정부(210)는, 어떤 주파수 대역의 '양자화 에러'가 그 어떤 주파수 대역의 '최대허용가능 왜곡도'를 초과하지 않도록 하는 그 어떤 주파수 대역의 대역별 스케일팩터의 가능한 값들 중 최대값을, 그 어떤 주파수 대역의 대역별 스케일팩터의 초기값으로서 결정할 수 있다.

결국, 제1 스케일팩터 결정부(210)가 어떤 주파수 대역의 대역별 스케일팩터의 초기값을 결정하기 위해서는, 제1 스케일팩터 결정부(210)는 대역별 스케일팩터의 가능한 값들 각각마다, 그 가능한 값에 따른 '양자화 에러'가 그 어떤 주파수 대역의 최대허용가능 왜곡도를 초과하는지의 여부를 검사하여, 그 가능한 값들 중, 그 가능한 값에 따른 '양자화 에러'가 그 어떤 주파수 대역의 최대허용가능 왜곡도를 초과하지 않는다고 검사된 값들을 찾아내고, 그 찾아낸 값들 중 최대값을 찾아내야 한다.

한편, 제1 스케일팩터 결정부(210)는, 오디오 데이터의 어떤 주파수 대역의 디폴트(default)로 설정된 값을, '그 어떤 주파수 대역의 대역별 스케일팩터의 디폴트로 설정된 값에 따른 양자화 에러'와 '그 어떤 주파수 대역의 최대허용가능 왜곡도'를 고려하여 조정하고, 조정된 결과를 '그 어떤 주파수 대역의 대역별 스케일팩터의 초기값'으로서 결정할 수도 있다. 이 경우, '그 어떤 주파수 대역의 대역별 스케일팩터의 디폴트로 설정된 값에 따른 양자화 에러'와 '그 어떤 주파수 대역의 최대허용가능 왜곡도'간의 차이가 클수록, '그 어떤 주파수 대역의 대역별 스케일팩터의 디폴트로 설정된 값'과 '그 어떤 주파수 대역의 대역별 스케일팩터의 결정될 값'간의 차이도 크다.

제2 스케일팩터 결정부(220)는, 입력단자 IN 2를 통해 입력된 오디오 데이터의 주파수 대역들 각각마다, '그 주파수 대역들 각각의 제1 스케일팩터 결정부(210)에서 결정된 초기값'과 '미리 설정된 전대역 스케일팩터(common scalefactor)의 값'을 비교하고, 비교된 결과를 고려하여 그 주파수 대역들 각각의 대역별 스케일팩터의 최종값을 결정한다. 여기서, 전대역 스케일팩터의 값이란, 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 값으로서, 그 주파수 대역들 각각의 대역별 스케일팩터의 값이 서로 동일하도록 설정된 값을 의미한다.

구체적으로, 제2 스케일팩터 결정부(220)는, 오디오 데이터의 '어떤 주파수 대역의 대역별 스케일팩터의 초기값'과 '그 오디오 데이터에 대해 미리 설정된 전대역 스케일팩터의 값' 중 크지 않은 값을, '그 어떤 주파수 대역의 대역별 스케일팩터의 최종값'으로서 결정할 수 있다.

즉, 그 어떤 주파수 대역의 대역별 스케일팩터의 초기값이 전대역 스케일팩터의 값보다 크면, 제2 스케일팩터 결정부(220)는 전대역 스케일팩터의 값을 그 어떤 주파수 대역의 대역별 스케일팩터의 최종값으로서 결정한다. 또한, 그 어떤 주파수 대역의 대역별 스케일팩터의 초기값이 전대역 스케일팩터의 값보다 작으면, 제2 스케일팩터 결정부(220)는 그 어떤 주파수 대역의 대역별 스케일팩터의 초기값을 그 어떤 주파수 대역의 대역별 스케일팩터의 최종값으로서 결정한다. 다만, 그 어떤 주파수 대역의 대역별 스케일팩터의 초기값이 전대역 스케일팩터의 값과 동일하다면, 제2 스케일팩터 결정부(220)는 그 어떤 주파수 대역의 대역별 스케일팩터의 초기값, 즉, 전대역 스케일팩터의 값을, 그 어떤 주파수 대역의 대역별 스케일팩터의 최종값으로서 결정한다.

이러한 제1 스케일팩터 결정부(210) 및 제2 스케일팩터 결정부(220)의 동작은, 비트율 결정부(130)가, 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 값을 그 오디오 데이터의 주파수 대역들 각각의 최대허용가능 왜곡도를 초과하지 않는 수준의 왜곡을 허용하면서 그 오디오 데이터를 양자화하기 위한 값으로서 결정하는 동작이다.

앞서 언급한 바와 같이, 제2 스케일팩터 결정부(220)는 어떤 주파수 대역의 대역별 스케일팩터의 초기값과 미리 설정된 전대역 스케일팩터의 값을 단순히 비교 하기만 하면, 그 어떤 주파수 대역의 최대허용가능 왜곡도를 초과하지 않는 수준의 왜곡을 허용하면서 그 어떤 주파수 대역의 오디오 데이터를 양자화하기 위한 대역별 스케일팩터의 값을 결정할 수 있다. 즉, 제2 스케일팩터 결정부(220)는 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 최종값을 신속히 결정할 수 있다.

양자화부(230)는 입력단자 IN 2를 통해 입력된 오디오 데이터를 그 오디오 데이터의 모든 주파수 대역들의 대역별 스케일팩터들의 최종값들을 고려하여 양자화한다.

사용비트량 계산부(240)는 입력단자 IN 2를 통해 입력된 오디오 데이터의 부호화시 필요한 비트의 개수인 사용 비트량을, 양자화부(230)로부터 입력된 '양자화된 오디오 데이터'를 고려하여 계산한다.

비트량 비교부(250)는 사용비트량 계산부(240)에서 계산된 사용 비트량과 '미리 설정된 최대가용 비트량'을 비교한다. 구체적으로, 비트량 비교부(250)는 그 계산된 사용 비트량이 최대가용 비트량을 초과하는지 검사한다.

만일, 그 계산된 사용 비트량이 최대가용 비트량을 초과한다고 검사되면, 비트량 비교부(250)는 스케일팩터 갱신부(260)의 동작을 지시한다. 이 경우, 스케일팩터 갱신부(260)는 전대역 스케일팩터의 값을 갱신한다. 구체적으로, 스케일팩터 갱신부(260)는 전대역 스케일팩터의 값을 일정 수치만큼 증가시킨다. 이 후, 스케일팩터 갱신부(260)는 제어신호를 생성하고 생성된 제어신호를 제2 스케일팩터 결정부(220)로 출력한다. 이 경우, 제2 스케일팩터 결정부(220)는 제어신호에 응답하 여 동작함으로써, 재동작하게 된다.

그에 반해, 그 계산된 사용 비트량이 최대가용 비트량을 초과하지 않는다고 검사되면, 양자화부(230)는 가장 최근에 양자화된 결과를 출력단자 OUT 2를 통해 무손실 부호화부(140)로 출력한다.

이러한 사용비트량 계산부(240) 내지 스케일팩터 갱신부(260)의 동작은, 비트율 결정부(130)가, 오디오 데이터의 주파수 대역들 각각의 최대허용가능 왜곡도를 초과하지 않는 수준의 왜곡을 허용하면서 그 오디오 데이터를 양자화하기 위해 결정된 '그 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 값'을, 그 오디오 데이터의 사용 비트량이 최대가용 비트량을 초과하지 않도록 하면서 그 오디오 데이터를 양자화하기 위한 값으로 조정하는 동작이다.

도 3은 본 발명에 의한 오디오 데이터 부호화 방법을 설명하기 위한 플로우챠트로서, 오디오 데이터를, 그 오디오 데이터의 주파수 대역들 각각마다 최대허용가능 왜곡도를 초과하지 않는 수준의 왜곡을 허용하면서도, 그 오디오 데이터의 사용 비트량이 최대가용 비트량을 초과하지 않도록 하면서 양자화하는 단계(제310~ 제324 단계들) 및 그 양자화된 결과에 대해 무손실 부호화를 수행하는 단계들(제326 단계)을 포함할 수 있다.

제1 스케일팩터 결정부(210)는 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 초기값을 그 주파수 대역들 각각의 '양자화 에러' 및 '최대허용가능 왜곡도'를 고려하여 결정한다(제310 단계).

제310 단계 후에, 제2 스케일팩터 결정부(220)는 오디오 데이터의 어떤 주파 수 대역에 대해 제310 단계에서 결정된 초기값이 전대역 스케일팩터의 값보다 작은지 판단한다(제312 단계).

만일, 제312 단계에서 그 어떤 주파수 대역에 대해 제310 단계에서 결정된 초기값이 전대역 스케일팩터의 값보다 작다고 판단되면, 제2 스케일팩터 결정부(220)는 제310 단계에서 결정된 초기값을 그 어떤 주파수 대역에서의 대역별 스케일팩터의 최종값으로서 결정한다(제314 단계).

그에 반해, 제312 단계에서 그 어떤 주파수 대역에 대해 제310 단계에서 결정된 초기값이 전대역 스케일팩터의 값보다 작지 않다고 판단되면, 제2 스케일팩터 결정부(220)는 전대역 스케일팩터의 값을 그 어떤 주파수 대역에서의 대역별 스케일팩터의 최종값으로서 결정한다(제316 단계).

제314 단계 또는 제316 단계 후에, 제2 스케일팩터 결정부(220)는 제312 단계가 모든 주파수 대역들에 대해 수행되었는가 판단한다(제318 단계).

이 경우, 오디오 데이터의 주파수 대역들 중 제312 단계가 수행되지 않은 주파수 대역이 존재한다고 판단되면(제318 단계), 제312 단계로 진행한다. 이에 따라, 제312 단계가 수행되지 않은 주파수 대역에 대해, 제312 단계와 제314 단계 또는, 제312 단계와 제316 단계가 수행된다.

반면, 오디오 데이터의 주파수 대역들 중 제312 단계가 수행되지 않은 주파수 대역이 존재하지 않는다고 판단되면(제318 단계), 양자화부(230)는 오디오 데이터를 그 오디오 데이터의 주파수 대역들의 대역별 스케일팩터들의 최종값들을 고려하여 양자화한다(제320 단계).

제320 단계 후에, 사용비트량 계산부(240)는 오디오 데이터의 부호화시 필요한 비트의 개수인 사용 비트량을, 그 오디오 데이터의 제320 단계에서 가장 최근에 양자화된 결과를 고려하여 계산한다(제322 단계).

제322 단계 후에, 비트량 비교부(250)는 제322 단계에서 계산된 사용 비트량이 최대가용 비트량보다 큰가 판단한다(제324 단계).

이 경우, 제322 단계에서 계산된 사용 비트량이 최대가용 비트량보다 크다고 판단되면(제324 단계), 스케일팩터 갱신부(260)는 전대역 스케일팩터의 값을 갱신하고(제326 단계), 제312 단계로 진행한다.

반면, 제322 단계에서 계산된 사용 비트량이 최대가용 비트량보다 크지 않다고 판단되면(제324 단계), 무손실 부호화부(140)는 그 오디오 데이터의 제320 단계에서 가장 최근에 양자화된 결과에 대해 무손실 부호화를 수행한다(제328 단계).

이상에서 언급된 본 발명에 의한 오디오 데이터 부호화 방법을 컴퓨터에서 실행시키기 위한 프로그램은 컴퓨터로 읽을 수 있는 기록매체에 저장될 수 있다. 여기서, 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬(ROM), 플로피 디스크, 하드 디스크 등), 및 광학적 판독 매체(예를 들면, 시디롬(CD-ROM), 디브이디(DVD: Digital Versatile Disc))와 같은 저장매체를 포함한다.

이제까지 본 발명을 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로, 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점들은 본 발명에 포함된 것으로 해석되어야 할 것이다.

이상에서 설명한 바와 같이, 본 발명에 의한 오디오 데이터 부호화 방법 및 장치는, 오디오 데이터의 주파수 대역들 각각마다, 대역별 스케일팩터의 초기값과 미리 설정된 전대역 스케일팩터의 값을 단순히 비교하기만 하면, 그 주파수 대역들 각각마다, 최대허용가능 왜곡도를 초과하지 않는 수준의 왜곡을 허용하면서 그 오디오 데이터를 양자화하기 위한 대역별 스케일팩터의 값을 결정할 수 있으므로, 그 주파수 대역들 각각의 대역별 스케일팩터의 값을 신속히 결정하는 효과를 갖는다. 이에 따라, 본 발명에 의한 오디오 데이터 부호화 방법 및 장치는, 오디오 데이터의 부호화를 보다 신속히 완료하는 효과, 보다 구체적으로는, 그 오디오 데이터의 양자화를 보다 신속히 완료하는 효과를 갖는다.

한편, 종래의 오디오 데이터 부호화 장치는, 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 값이 서로 동일하다고 가정하고, 그 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 값을 그 오디오 데이터의 부호화시 필요한 비트의 개수인 사용 비트량이 최대가용 비트량을 초과하지 않도록 하면서 그 오디오 데이터를 양자화하기 위한 값으로서 결정한다. 이 후, 종래의 오디오 데이터 부호화 장치는, 그 오디오 데이터의 주파수 대역들 각각의 그 결정된 값을, 그 오디오 데이터의 주파수 대역들 각각의 최대허용가능 왜곡도를 초과하지 않는 수준의 왜곡을 허용하면서 그 오디오 데이터를 양자화하기 위한 값으로 조정한다. 여기서, 오디오 데이터의 주파수 대역들 각각의 최대허용가능 왜곡도가 서로 다를 수 있음은 이미 전술한 바이다. 이 후, 종래의 오디오 데이터 부호화 장치는, 그 오디오 데이터를 그 오디오 데이터의 주파수 대역들의 대역별 스케일팩터들의 값들을 고려하여 양자화한다. 결국, 종래의 오디오 데이터 부호화 장치에 의해 오디오 데이터를 부호화하면, 오디오 데이터의 부호화된 결과의 비트율이 미리 설정된 어떤 비트율(예를 들어, 오디오 데이터 부호화 장치의 사용자가 당초 원했던 비트율)을 초과할 수 있다.

그에 반해, 본 발명에 의한 오디오 데이터 부호화 방법 및 장치는, 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 값을 그 오디오 데이터의 주파수 대역들 각각의 최대허용가능 왜곡도를 초과하지 않는 수준의 왜곡을 허용하면서 그 오디오 데이터를 양자화하기 위한 값으로서 결정한다. 이 후, 본 발명에 의한 오디오 데이터 부호화 방법 및 장치는, 그 오디오 데이터의 주파수 대역들 각각의 그 결정된 값을, 그 오디오 데이터의 부호화시 필요한 비트의 개수인 사용 비트량이 최대가용 비트량을 초과하지 않도록 하면서 그 오디오 데이터를 양자화하기 위한 값으로 조정한다. 이 후, 본 발명에 의한 오디오 데이터 부호화 방법 및 장치는, 그 오디오 데이터를 그 오디오 데이터의 주파수 대역들의 대역별 스케일팩터들의 값들을 고려하여 양자화한다. 결국, 본 발명에 의한 오디오 데이터 부호화 방법 및 장치는, 오디오 데이터의 부호화된 결과의 비트율이 미리 설정된 어떤 비트율 (예를 들어, 오디오 데이터 부호화 장치의 사용자가 당초 원했던 비트율)을 항상 초과하지 않음을 보장하는 효과를 갖는다.

Claims

(a) 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 초기값을 상기 주파수 대역들 각각의 양자화 에러와 최대허용가능 왜곡도를 고려하여 결정하는 단계;

(b) 상기 주파수 대역들 각각마다, 상기 결정된 초기값과 미리 설정된 전대역 스케일팩터의 값을 비교하고 비교된 결과를 고려하여 상기 대역별 스케일팩터의 최종값을 결정하는 단계;

(c) 상기 오디오 데이터를 상기 주파수 대역들의 상기 결정된 최종값들을 고려하여 양자화하는 단계; 및

(d) 양자화된 상기 오디오 데이터를 부호화하는 단계를 포함하는 것을 특징으로 하는 오디오 데이터 부호화 방법.
제1 항에 있어서, 상기 (a) 단계는

상기 양자화 에러가 상기 최대허용가능 왜곡도를 초과하지 않도록 하는 상기 대역별 스케일팩터의 값들 중 최대값을 상기 대역별 스케일팩터의 초기값으로서 결정하는 것을 특징으로 하는 오디오 데이터 부호화 방법.
제1 항에 있어서, 상기 (a) 단계는

상기 대역별 스케일팩터의 디폴트로 설정된 값을 상기 대역별 스케일팩터의 디폴트로 설정된 값에 따른 상기 양자화 에러와 상기 최대허용가능 왜곡도를 고려하여 조정하고, 조정된 결과를 상기 대역별 스케일팩터의 초기값으로서 결정하는 것을 특징으로 하는 오디오 데이터 부호화 방법.
제1 항에 있어서, 상기 (b) 단계는

상기 결정된 초기값과 상기 전대역 스케일팩터 중 크지 않은 값을 상기 대역별 스케일팩터의 최종값으로서 결정하는 것을 특징으로 하는 오디오 데이터 부호화 방법.
제1 항에 있어서, 상기 오디오 데이터 부호화 방법은

(e) 상기 오디오 데이터의 부호화시 필요한 비트의 개수인 사용 비트량을 계산하는 단계;

(f) 상기 계산된 사용 비트량이 미리 설정된 최대가용 비트량을 초과하는가 판단하는 단계; 및

(g) 상기 계산된 사용 비트량이 상기 최대가용 비트량을 초과한다고 판단되면, 상기 전대역 스케일팩터의 값을 갱신하고 상기 (b) 단계로 진행하는 단계를 더 포함하는 것을 특징으로 하는 오디오 데이터 부호화 방법.
제5 항에 있어서, 상기 오디오 데이터에 대한 상기 (e) 단계의 수행은, 상기 오디오 데이터에 대한 상기 (b) 단계의 수행이 최초로 완료된 이후에 최초로 개시 되는 것을 특징으로 하는 오디오 데이터 부호화 방법.
오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 초기값을 상기 주파수 대역들 각각의 양자화 에러와 최대허용가능 왜곡도를 고려하여 결정하는 제1 스케일팩터 결정부;

상기 주파수 대역들 각각마다, 상기 결정된 초기값과 미리 설정된 전대역 스케일팩터의 값을 비교하고 비교된 결과를 고려하여 상기 대역별 스케일팩터의 최종값을 결정하는 제2 스케일팩터 결정부;

상기 오디오 데이터를 상기 주파수 대역들의 상기 결정된 최종값들을 고려하여 양자화하는 양자화부; 및

양자화된 상기 오디오 데이터를 부호화하는 무손실 부호화부를 포함하는 것을 특징으로 하는 오디오 데이터 부호화 장치.
제7 항에 있어서, 상기 제1 스케일팩터 결정부는

상기 양자화 에러가 상기 최대허용가능 왜곡도를 초과하지 않도록 하는 상기 대역별 스케일팩터의 값들 중 최대값을 상기 대역별 스케일팩터의 초기값으로서 결정하는 것을 특징으로 하는 오디오 데이터 부호화 장치.
제7 항에 있어서, 상기 제1 스케일팩터 결정부는

상기 대역별 스케일팩터의 디폴트로 설정된 값을 상기 대역별 스케일팩터의 디폴트로 설정된 값에 따른 상기 양자화 에러와 상기 최대허용가능 왜곡도를 고려하여 조정하고, 조정된 결과를 상기 대역별 스케일팩터의 초기값으로서 결정하는 것을 특징으로 하는 오디오 데이터 부호화 장치.
제7 항에 있어서, 상기 제2 스케일팩터 결정부는

상기 결정된 초기값과 상기 전대역 스케일팩터 중 크지 않은 값을 상기 대역별 스케일팩터의 최종값으로서 결정하는 것을 특징으로 하는 오디오 데이터 부호화 장치.
제7 항에 있어서, 상기 오디오 데이터 부호화 장치는

상기 오디오 데이터의 부호화시 필요한 비트의 개수인 사용 비트량을 계산하는 사용비트량 계산부;

상기 계산된 사용 비트량이 미리 설정된 최대가용 비트량을 초과하는지 검사하는 비트량 비교부; 및

상기 검사된 결과를 고려하여, 상기 전대역 스케일팩터의 값을 선택적으로 갱신하며 제어신호를 선택적으로 생성하는 스케일팩터 갱신부를 더 포함하고,

상기 제2 스케일팩터 결정부는 상기 제어신호에 응답하여 동작하는 것을 특징으로 하는 오디오 데이터 부호화 장치.
제11 항에 있어서, 상기 오디오 데이터에 대한 상기 사용비트량 계산부의 동 작은, 상기 오디오 데이터에 대한 상기 제2 스케일팩터 결정부의 동작이 최초로 완료된 이후에 최초로 개시되는 것을 특징으로 하는 오디오 데이터 부호화 장치.
제1 항 내지 제6 항 중 어느 한 항의 방법을 컴퓨터에서 실행시키기 위한 컴퓨터 프로그램을 저장한 컴퓨터로 읽을 수 있는 기록매체.