KR101029076B1 - 오디오 데이터 부호화 및 복호화 장치와 방법 - Google Patents

오디오 데이터 부호화 및 복호화 장치와 방법 Download PDF

Info

Publication number
KR101029076B1
KR101029076B1 KR1020070054025A KR20070054025A KR101029076B1 KR 101029076 B1 KR101029076 B1 KR 101029076B1 KR 1020070054025 A KR1020070054025 A KR 1020070054025A KR 20070054025 A KR20070054025 A KR 20070054025A KR 101029076 B1 KR101029076 B1 KR 101029076B1
Authority
KR
South Korea
Prior art keywords
audio data
data
encoded
layer
frequency
Prior art date
Application number
KR1020070054025A
Other languages
English (en)
Other versions
KR20070063493A (ko
Inventor
김미영
김상욱
김도형
이시화
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Publication of KR20070063493A publication Critical patent/KR20070063493A/ko
Application granted granted Critical
Publication of KR101029076B1 publication Critical patent/KR101029076B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

오디오 데이터 부호화 및 복호화 장치와 방법이 개시된다. 그 오디오 복호화 장치는, 부호화된 대역폭확장 데이터 및 하나 이상의 계층을 가지며 상기 계층마다 소정 개수의 비트로 표현되고 부호화된 오디오 데이터를 주어진 비트스트림으로부터 추출하는 비트스트림 분석부와, 부호화된 상기 오디오 데이터를 하위 계층을 상위 계층보다 먼저 복호화하며 상위 비트를 하위 비트보다 먼저 복호화함으로써 복호화하는 계층적 복호화부와, 부호화된 상기 대역폭확장 데이터를 복호화하고, 복호화된 상기 오디오 데이터와 복호화된 상기 대역폭확장 데이터를 이용하여, 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 상기 오디오 데이터를 추측하는 대역폭확장 복호화부 및 복호화된 상기 오디오 데이터와 추측된 상기 오디오 데이터를 이용하여 합성데이터를 생성하고, 생성된 합성 데이터를 상기 제2 소정 주파수 이하의 상기 오디오 데이터로서 출력하는 데이터 합성부로 구성되고, 상기 제2 소정 주파수는 상기 하나 이상의 계층의 최대 주파수 이상이고, 상기 대역폭확장 데이터는 상기 제1 소정 주파수 이상 및 상기 제2 소정 주파수 이하의 상기 오디오 데이터에 관한 정보를 갖는 것이 바람직하다.

Description

오디오 데이터 부호화 및 복호화 장치와 방법{Apparatus and method for audio encoding/decoding with scalability}
도 1은 본 발명에 의한 오디오 데이터 부호화 장치를 설명하기 위한 블록도이다.
도 2는 기본 계층 및 하나 이상의 확장 계층을 설명하기 위한 참고도이다.
도 3은 대역폭확장 데이터의 주파수 대역과 본 발명에 의한 복호화 장치에 전송되는 일부 계층의 주파수 대역을 비교하기 위한 참고도이다.
도 4는 본 발명에 의한 오디오 데이터 부호화 장치에 의해 생성된 비트스트림의 구조를 나타내는 도면이다.
도 5는 도 1에 도시된 계층적 부호화부(110)를 설명하기 위한 본 발명에 의한 바람직한 일 실시예(110A)의 블록도이다.
도 6은 본 발명에 의한 오디오 데이터 부호화 장치가 부호화하는 데이터의 신택스(syntax)를 나타내는 도면이다.
도 7은 본 발명에 의한 오디오 데이터 부호화 장치에 의해 생성된 대역폭확장 데이터의 신택스를 나타내는 도면이다.
도 8은 본 발명에 의한 오디오 데이터 복호화 장치를 설명하기 위한 블록도이다.
도 9a 내지 도 9d는 본 발명에 의한 오디오 데이터 복호화 장치에 의해 합성 데이터가 생성되는 원리를 설명하기 위한 참고도들이다.
도 10은 도 8에 도시된 계층적 복호화부(820)를 설명하기 위한 본 발명에 의한 바람직한 일 실시예(820A)의 블록도이다.
도 11은 도 8에 도시된 대역폭확장 복호화부(830)를 설명하기 위한 본 발명에 의한 바람직한 일 실시예(830A)의 블록도이다.
도 12는 도 8에 도시된 데이터 합성부(840)를 설명하기 위한 본 발명에 의한 바람직한 일 실시예(840A)의 블록도이다.
도 13은 본 발명에 의한 오디오 데이터 부호화 방법을 설명하기 위한 플로우챠트이다.
도 14는 본 발명에 의한 오디오 데이터 복호화 방법을 설명하기 위한 플로우챠트이다.
도 15는 도 14에 도시된 제1430 단계에 대한 본 발명에 의한 바람직한 일 실시예(1430A)의 플로우챠트이다.
본 발명은 오디오 데이터의 처리에 관한 것으로, 보다 상세하게는, 부호화된 오디오 데이터의 비트율(bit rate) 조절이 가능하고, 복호화하고자 하는 비트스트림에 포함된 오디오 데이터가 일부 계층의 부호화된 오디오 데이터일지라도 모든 계층의 오디오 데이터를 복원하는 오디오 데이터 부호화 및 복호화 장치와 방법에 관한 것이다.
본 출원인이 제안한 바 있는 비섹(BSAC : Bit Sliced Arithmetic Coding)은 고급 오디오 부호화(AAC : Advanced Audio Coding) 기법과 달리, FGS(Fine Grain Salability)를 제공하는 계층적 부호화 기법이며, 엠펙(MPEG : Moving Picture Experts Group)-4에 표준으로 채택된 오디오 압축 기법이다. 이러한 비섹의 세부 내용은 한국특허공보 제261253호에 개시되어 있다.
오디오 데이터를 고급 오디오 부호화 기법을 이용하여 부호화하는 부호화기는, 오디오 데이터를 부호화함에 있어, 오디오 데이터 중 일부 주파수 대역의 오디오 데이터만을 부호화하여 복호화기에 전송할 수 있다.
이 경우, 고급 오디오 부호화 기법을 이용하여 일부 주파수 대역만이 부호화된 오디오 데이터로부터, 전체 주파수 대역의 오디오 데이터를 복원하기 위해, 대역폭확장(SBR : Spectral Band Replication) 기법이 고려될 수 있다. 즉, 그 부호화기는 그 일부 주파수 대역 이외의 주파수 대역에서의 오디오 데이터에 관한 정보를 갖는 대역폭확장 데이터를 생성 및 부호화하고, 그 부호화된 대역폭확장 데이터를 그 일부 주파수 대역만이 부호화된 오디오 데이터와 함께 복호화기에 전송한다. 이로써, 복호화기는 그 일부 주파수 대역 이외의 주파수 대역에서의 오디오 데이터를 추측하여 복원할 수 있다. 이처럼, 고급 오디오 부호화 기법과 대역폭확장 기법은 결합 가능하다.
한편, 오디오 데이터를 비섹을 이용하여 부호화하는 부호화기는, 오디오 데 이터를 고급 오디오 부호화 기법을 이용하여 부호화하는 부호화기와 달리, 오디오 데이터를 부호화함에 있어, 그 오디오 데이터를 주파수 대역별로 분할하여 기본 계층(base layer) 및 하나 이상의 확장 계층(enhancement layer)을 생성하고, 모든 계층의 오디오 데이터를 부호화하고, 그 부호화된 오디오 데이터 중 기본 계층을 포함한 일부 계층의 부호화된 오디오 데이터만을 복호화기에 전송할 수 있다. 이 때, 그 일부 계층은 가변적이므로, 비섹을 이용하여 부호화된 오디오 데이터의 비트율(bit rate)은 조절 가능하다.
고급 오디오 부호화 기법과 대역폭확장 기법의 결합이 용이한 것과 달리, 비섹과 대역폭확장 기법은 결합이 곤란하다. 이는, 부호화된 오디오 데이터 중 복호화기에 전송될 일부 계층이 매 경우마다 다를 수 있어, 그 모든 가능한 경우마다 대역폭확장 데이터를 달리 마련하여야 하기 때문이다.
이에 따라, 계층적 구조를 갖는 부호화된 오디오 데이터 중 복호화기에 전송될 일부 계층이 어떠한 계층인가와 관계없이 동일한 대역폭확장 데이터를 이용하여 모든 계층의 오디오 데이터를 복원할 수 있는 방안이 요구되고 있다.
본 발명이 이루고자 하는 제1 기술적 과제는, 부호화된 대역폭확장 데이터 및 복수의 계층을 가져 비트율 조절이 가능한 부호화된 오디오 데이터로 이루어진 비트스트림을 생성하는 오디오 데이터 부호화 장치를 제공하는 데 있다.
본 발명이 이루고자 하는 제2 기술적 과제는, 복호화하고자 하는 비트스트림에 포함된 오디오 데이터를 복호화하여 그 포함된 오디오 데이터의 주파수 대역의 오디오 데이터를 복원하고, 그 포함된 오디오 데이터가 어떠한 계층인지에 관계없이 동일하며 그 비트스트림에 포함된 대역폭확장 데이터를 이용하여 그 포함된 오디오 데이터의 최대 주파수 이상의 주파수 대역의 오디오 데이터를 추측하여 복원하는 오디오 데이터 복호화 장치를 제공하는 데 있다.
본 발명이 이루고자 하는 제3 기술적 과제는, 부호화된 대역폭확장 데이터 및 복수의 계층을 가져 비트율 조절이 가능한 부호화된 오디오 데이터로 이루어진 비트스트림을 생성하는 오디오 데이터 부호화 방법을 제공하는 데 있다.
본 발명이 이루고자 하는 제4 기술적 과제는, 복호화하고자 하는 비트스트림에 포함된 오디오 데이터를 복호화하여 그 포함된 오디오 데이터의 주파수 대역의 오디오 데이터를 복원하고, 그 포함된 오디오 데이터가 어떠한 계층인지에 관계없이 동일하며 그 비트스트림에 포함된 대역폭확장 데이터를 이용하여 그 포함된 오디오 데이터의 최대 주파수 이상의 주파수 대역의 오디오 데이터를 추측하여 복원하는 오디오 데이터 복호화 방법을 제공하는 데 있다.
본 발명이 이루고자 하는 제5 기술적 과제는, 부호화된 대역폭확장 데이터 및 복수의 계층을 가져 비트율 조절이 가능한 부호화된 오디오 데이터로 이루어진 비트스트림을 생성하는 컴퓨터 프로그램을 저장하는 컴퓨터로 읽을 수 있는 기록매체를 제공하는 데 있다.
본 발명이 이루고자 하는 제6 기술적 과제는, 복호화하고자 하는 비트스트림에 포함된 오디오 데이터를 복호화하여 그 포함된 오디오 데이터의 주파수 대역의 오디오 데이터를 복원하고, 그 포함된 오디오 데이터가 어떠한 계층인지에 관계없 이 동일하며 그 비트스트림에 포함된 대역폭확장 데이터를 이용하여 그 포함된 오디오 데이터의 최대 주파수 이상의 주파수 대역의 오디오 데이터를 추측하여 복원하는 컴퓨터 프로그램을 저장하는 컴퓨터로 읽을 수 있는 기록매체를 제공하는 데 있다.
상기 제1 기술적 과제를 이루기 위해, 본 발명에 의한 오디오 데이터 부호화 장치는, 오디오 데이터를 분할하여 복수의 계층을 생성하고, 생성된 계층마다 상기 오디오 데이터를 소정 개수의 비트로 표현하고, 하위 계층을 상위 계층보다 먼저 부호화하며 상위 비트를 하위 비트보다 먼저 부호화함으로써 상기 오디오 데이터를 부호화하는 계층적 부호화부와, 소정 주파수 이상의 상기 오디오 데이터에 관한 정보를 갖는 대역폭확장 데이터를 생성하고, 생성된 대역폭확장 데이터를 부호화하는 대역폭확장 부호화부 및 상기 부호화된 대역폭확장 데이터 및 소정 비트율에 상응하는 상기 부호화된 오디오 데이터를 이용하여 비트스트림을 생성하는 비트스트림 생성부로 구성되는 것이 바람직하다.
상기 제2 기술적 과제를 이루기 위해, 본 발명에 의한 오디오 데이터 복호화 장치는, 부호화된 대역폭확장 데이터 및 하나 이상의 계층을 가지며 상기 계층마다 소정 개수의 비트로 표현되고 부호화된 오디오 데이터를 주어진 비트스트림으로부터 추출하는 비트스트림 분석부와, 부호화된 상기 오디오 데이터를 하위 계층을 상위 계층보다 먼저 복호화하며 상위 비트를 하위 비트보다 먼저 복호화함으로써 복호화하는 계층적 복호화부와, 부호화된 상기 대역폭확장 데이터를 복호화하고, 복 호화된 상기 오디오 데이터와 복호화된 상기 대역폭확장 데이터를 이용하여, 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 상기 오디오 데이터를 추측하는 대역폭확장 복호화부 및 복호화된 상기 오디오 데이터와 추측된 상기 오디오 데이터를 이용하여 합성데이터를 생성하고, 생성된 합성 데이터를 상기 제2 소정 주파수 이하의 상기 오디오 데이터로서 출력하는 데이터 합성부로 구성되고, 상기 제2 소정 주파수는 상기 하나 이상의 계층의 최대 주파수 이상이고, 상기 대역폭확장 데이터는 상기 제1 소정 주파수 이상 및 상기 제2 소정 주파수 이하의 상기 오디오 데이터에 관한 정보를 갖는 것이 바람직하다.
상기 제3 기술적 과제를 이루기 위해, 본 발명에 의한 오디오 데이터 부호화 방법은, 오디오 데이터를 분할하여 복수의 계층을 생성하고, 생성된 계층마다 상기 오디오 데이터를 소정 개수의 비트로 표현하고, 하위 계층을 상위 계층보다 먼저 부호화하며 상위 비트를 하위 비트보다 먼저 부호화함으로써 상기 오디오 데이터를 부호화하는 (a) 단계와, 소정 주파수 이상의 상기 오디오 데이터에 관한 정보를 갖는 대역폭확장 데이터를 생성하고, 생성된 대역폭확장 데이터를 부호화하는 (b) 단계 및 상기 부호화된 대역폭확장 데이터 및 소정 비트율에 상응하는 상기 부호화된 오디오 데이터를 이용하여 비트스트림을 생성하는 (c) 단계로 이루어지는 것이 바람직하다.
상기 제4 기술적 과제를 이루기 위해, 본 발명에 의한 오디오 데이터 복호화 방법은, 부호화된 대역폭확장 데이터 및 하나 이상의 계층을 가지며 상기 계층마다 소정 개수의 비트로 표현되고 부호화된 오디오 데이터를 주어진 비트스트림으로부 터 추출하는 (a) 단계와, 부호화된 상기 오디오 데이터를 하위 계층을 상위 계층보다 먼저 복호화하며 상위 비트를 하위 비트보다 먼저 복호화함으로써 복호화하는 (b) 단계와, 부호화된 상기 대역폭확장 데이터를 복호화하고, 복호화된 상기 오디오 데이터와 복호화된 상기 대역폭확장 데이터를 이용하여, 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 상기 오디오 데이터를 추측하는 (c) 단계 및 복호화된 상기 오디오 데이터와 추측된 상기 오디오 데이터를 이용하여 합성데이터를 생성하고, 생성된 합성 데이터를 상기 제2 소정 주파수 이하의 상기 오디오 데이터로서 결정하는 (d) 단계로 이루어지고, 상기 제2 소정 주파수는 상기 하나 이상의 계층의 최대 주파수 이상이고, 상기 대역폭확장 데이터는 상기 제1 소정 주파수 이상 및 상기 제2 소정 주파수 이하의 상기 오디오 데이터에 관한 정보를 갖는 것이 바람직하다.
상기 제5 기술적 과제를 이루기 위해, 본 발명에 의한 컴퓨터로 읽을 수 있는 기록매체에 저장된 하나 이상의 컴퓨터 프로그램은, 오디오 데이터를 분할하여 복수의 계층을 생성하고, 생성된 계층마다 상기 오디오 데이터를 소정 개수의 비트로 표현하고, 하위 계층을 상위 계층보다 먼저 부호화하며 상위 비트를 하위 비트보다 먼저 부호화함으로써 상기 오디오 데이터를 부호화하는 (a) 단계와, 소정 주파수 이상의 상기 오디오 데이터에 관한 정보를 갖는 대역폭확장 데이터를 생성하고, 생성된 대역폭확장 데이터를 부호화하는 (b) 단계 및 상기 부호화된 대역폭확장 데이터 및 소정 비트율에 상응하는 상기 부호화된 오디오 데이터를 이용하여 비트스트림을 생성하는 (c) 단계를 수행하는 것이 바람직하다.
상기 제6 기술적 과제를 이루기 위해, 본 발명에 의한 컴퓨터로 읽을 수 있는 기록매체에 저장된 하나 이상의 컴퓨터 프로그램은, 부호화된 대역폭확장 데이터 및 하나 이상의 계층을 가지며 상기 계층마다 소정 개수의 비트로 표현되고 부호화된 오디오 데이터를 주어진 비트스트림으로부터 추출하는 (a) 단계와, 부호화된 상기 오디오 데이터를 하위 계층을 상위 계층보다 먼저 복호화하며 상위 비트를 하위 비트보다 먼저 복호화함으로써 복호화하는 (b) 단계와, 부호화된 상기 대역폭확장 데이터를 복호화하고, 복호화된 상기 오디오 데이터와 복호화된 상기 대역폭확장 데이터를 이용하여, 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 상기 오디오 데이터를 추측하는 (c) 단계 및 복호화된 상기 오디오 데이터와 추측된 상기 오디오 데이터를 이용하여 합성데이터를 생성하고, 생성된 합성 데이터를 상기 제2 소정 주파수 이하의 상기 오디오 데이터로서 결정하는 (d) 단계를 수행하는 것이 바람직하다.
본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시예를 예시하는 첨부 도면 및 그 첨부 도면을 설명하는 내용을 참조하여야만 한다.
이하, 본 발명에 의한 오디오 데이터 부호화 및 복호화 장치와 방법을 첨부한 도면들을 참조하여 다음과 같이 설명한다.
도 1은 본 발명에 의한 오디오 데이터 부호화 장치를 설명하기 위한 블록도로서, 계층적 부호화부(110), 대역폭확장 부호화부(120) 및 비트스트림 생성부(130)로 이루어진다. 이하, 도 1의 동작을 도 2 내지 도 4를 참조하며 설명하기 로 한다.
계층적 부호화부(110)는 입력단자 IN 1을 통해 입력된 오디오 데이터를 분할하여 복수의 계층을 생성하고, 생성된 계층마다 그 오디오 데이터를 소정 개수의 비트로 표현하고, 하위 계층을 상위 계층보다 먼저 부호화하며 상위 비트를 하위 비트보다 먼저 부호화함으로써 그 오디오 데이터를 부호화한다.
구체적으로, 계층적 부호화부(110)는 시간 영역의 오디오 데이터를 주파수 영역의 오디오 데이터로 변환한다. 예컨대, 계층적 부호화부(110)는 개선 이산 여현 변환(MDCT : Modified Discrete Cosine Transform)을 이용하여 그러한 변환을 수행할 수 있다.
또한, 계층적 부호화부(110)는 그 변환된 오디오 데이터를 분할하여 복수의 계층을 생성한다. 여기서, 복수의 계층은 기본 계층(base layer) 및 하나 이상의 확장 계층(enhancement layer)을 의미한다. 이러한 복수의 계층은 주파수 대역(frequency band)에 따라 구별된다. 도 2는 기본 계층(210-0) 및 하나 이상의 확장 계층(210-1, 210-2, ..., 210-N-1)을 설명하기 위한 참고도이다. 도 2에 도시된 바에서, 복수의 계층(210-0, 210-1, 210-2, ..., 210-N-1)은 N(단, N은 2이상의 정수)개의 계층이고, 하나 이상의 확장 계층(210-1, 210-2, ..., 210-N-1)은 제1 확장 계층(210-1) 내지 제N-1 확장 계층(210-N-1)이고, 오디오 데이터(200)의 주파수 대역은 0 [kHz]~ fN [kHz]이고, 식별번호 205는 오디오 데이터(200)가 나타내는 포락선(envelope)을 의미한다. 결국, 그 복수의 계층에서 최하위 계층은 기본 계층(210-0)이며, 최상위 계층은 제N-1 확장 계층(210-N-1)이다.
계층적 부호화부(110)는 그 분할된 오디오 데이터를 양자화(quantization)한다. 예컨대, 계층적 부호화부(110)는 도 2에 점으로 도시된 각각의 오디오 데이터(200)를 양자화한다.
계층적 부호화부(110)는 그 양자화된 오디오 데이터를 소정 개수의 비트(bit)로 표현한다. 이 때, 그 소정 개수는 계층마다 달리 설정될 수 있다.
계층적 부호화부(110)는 그 양자화된 오디오 데이터를 계층적으로 부호화한다. 예컨대, 계층적 부호화부(110)는 그 양자화된 오디오 데이터를 전술한 비섹(BSAC : Bit Sliced Arithmetic Coding)을 이용하여 부호화할 수 있다.
그 부호화된 모든 계층의 오디오 데이터 중 본 발명에 의한 오디오 데이터 복호화 장치로 전송되는 오디오 데이터는 일부 계층의 오디오 데이터일 수도 있고, 모든 계층의 오디오 데이터일 수도 있다. 이 때, 일부 계층은 기본 계층(210-0)을 포함한 하나 이상의 계층을 의미한다. 이와 같이, 그 부호화된 모든 계층의 오디오 데이터 중 본 발명에 의한 오디오 데이터 복호화 장치로 전송되는 오디오 데이터가 일부 계층의 오디오 데이터인 경우, 그 일부 계층의 오디오 데이터는 나머지 계층의 오디오 데이터보다 먼저 부호화되는 것이 바람직하다.
이를 위해, 계층적 부호화부(110)는 그 양자화된 오디오 데이터를 부호화함에 있어, 하위 계층을 상위 계층보다 먼저 부호화하며 상위 비트를 하위 비트보다 먼저 부호화한다. 그에 따라, 계층적 부호화부(110)는 그 복수의 계층(210-0, 210-1, 210-2, ..., 210-N-1) 중 최하위 계층(210-0)에 속하는 오디오 데이터를 가장 먼저 부호화하고, 최상위 계층(210-N-1)에 속하는 오디오 데이터를 가장 나중에 부 호화한다. 또한, 계층적 부호화부(110)는 각각의 계층(210-0, 210-1, 210-2, ...., 210-N-1 중 하나)마다 그 계층에 속한 오디오 데이터 중 하나 이상의 최상위 비트(MSB : Most Significant Bit)를 가장 먼저 부호화하고, 하나 이상의 최하위 비트(LSB : Least Significant Bit)를 가장 나중에 부호화한다. 이러한 부호화 순서는, 오디오 데이터에서 중요한 정보는 상위 계층보다는 하위 계층에, 하위 비트보다는 상위 비트에 많이 분포함이 일반적이라는 사실을 이용하여 도출된 순서이다.
한편, 계층적 부호화부(110)는 모든 계층의 오디오 데이터를 부호화한다.
대역폭확장 데이터(120)는 대역폭확장 데이터(SBR data : Spectral Band Replication data)를 생성하고, 생성된 대역폭확장 데이터를 부호화한다. 본 발명에 의한 대역폭확장 데이터는 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 오디오 데이터에 관한 정보를 갖는 데이터를 의미한다. 이 때, 제1 소정 주파수는 기본 계층(210-0)의 최대 주파수(f1) 이상일 수도 있으나, 기본 계층의 최대 주파수임이 바람직하다. 또한, 제2 소정 주파수는 그 부호화된 모든 계층 중 본 발명에 의한 오디오 데이터 복호화 장치에 전송되는 일부 계층 중 최상위 계층의 최대 주파수 이상임이 바람직하고, 그 부호화된 모든 계층의 최대 주파수(fN)임이 보다 바람직하다. 도 3은 대역폭확장 데이터의 주파수 대역(f1~ fN)과 본 발명에 의한 복호화 장치에 전송되는 일부 계층의 주파수 대역(0~ fk)을 비교하기 위한 참고도이다. 도 3에 도시된 바에서 k는 2이상 N이하의 정수이나, 본 발명에 의한 오디오 데이터 복호화 장치에 전송되는 일부 계층이 기본 계층(210-0)뿐이라면, k는 1일 수 있다.
한편, 그 오디오 데이터에 관한 정보는 그 오디오 데이터의 노이즈(noise)에 관한 정보를 의미할 수도 있고 포락선(envelope)(205)에 관한 정보를 의미할 수도 있다.
구체적으로, 대역폭확장 데이터(120)는 제1 소정 주파수 이상 및 제2 소정 주파수 이하에 속하는 오디오 데이터의 포락선(205)에 관한 정보를 이용하여 대역폭확장 데이터를 생성하고, 그 생성된 대역폭 확장 데이터를 무손실 부호화(lossless encoding)할 수 있다. 이 때, 무손실 부호화는 엔트로피 부호화(entropy encoding)일 수도 있고, 호프만 부호화(Huffman encoding)일 수도 있다.
비트스트림 생성부(130)는 그 부호화된 대역폭확장 데이터 및 소정 비트율에 상응하는 그 부호화된 오디오 데이터를 이용하여 비트스트림(bitstream)을 생성하고, 생성된 비트스트림을 출력단자 OUT 1을 통해 출력한다. 도 4는 본 발명에 의한 오디오 데이터 부호화 장치에 의해 생성된 비트스트림(410)의 구조를 나타내는 도면이다. 도 4에 도시된 바와 같이, 비트스트림(410)은 헤더(header)(420), 기본 계층(210-0)에 속한 각각의 오디오 데이터를 표현하는 비트의 개수에 관한 정보(430-0), 기본 계층에 속한 부호화된 오디오 데이터 및 기본 계층에서의 양자화 스텝 크기(step size)에 관한 정보(440-0), 제n 확장 계층(210-n)(단, n은 1≤n≤N-1인 정수)에 속한 각각의 오디오 데이터를 표현하는 비트의 개수에 관한 정보(430-n), 제n 확장 계층에 속한 부호화된 오디오 데이터 및 제n 확장 계층에서의 양자화 스텝 크기에 관한 정보(440-n), 및 대역폭확장 데이터(450)를 포함한다. 도 4에 도시된 바와 같이, 부호화된 오디오 데이터(430-0, 430-1, ..., 430-N-1)는 비트스트림(410)에 하나 이상의 계층(210-0, 210-1, ..., 210-N-1) 각각마다 마련되나, 부호화된 대역폭확장 데이터(450)는 비트스트림(410)에 계층별로 마련되지 않는다.
한편, 그 소정 비트율은 부호화된 모든 계층의 오디오 데이터 중 본 발명에 의한 오디오 데이터 복호화 장치에 전송하고자 하는 일부 계층의 오디오 데이터가 갖는 비트율을 의미한다. 즉, 그 소정 비트율은 기본 계층(210-0)의 비트율 이상이다.
도 5는 도 1에 도시된 계층적 부호화부(110)를 설명하기 위한 본 발명에 의한 바람직한 일 실시예(110A)의 블록도로서, 시간/주파수 매핑부(510), 심리음향부(520), 양자화부(530), 및 다운 샘플링부(540)로 이루어진다.
시간/주파수 매핑부(510)는 입력단자 IN 2로 입력된 시간 영역의 오디오 데이터를 주파수 영역의 오디오 데이터로 변환한다. 여기서, 입력단자 IN 2는 전술한 입력단자 IN 1과 동일할 수 있다. 또한, 그 시간 영역의 오디오 데이터는, 소정 샘플링 주파수(Fs)를 가지며, 이산적(discrete)으로 존재하는 오디오 데이터임이 바람직하다.
심리음향부(520)는 시간/주파수 매핑부(510)에 의해 변환된 오디오 데이터를 주파수 대역별로 묶어 복수의 계층을 생성한다.
양자화부(530)는 그 각각의 계층마다 오디오 데이터를 양자화하고, 모든 계층에 속한 모든 양자화된 오디오 데이터를 부호화하되, 하위 계층을 상위 계층보다 먼저 부호화하며 상위 비트를 하위 비트보다 먼저 부호화한다. 양자화부(530)는 그 부호화된 결과를 출력단자 OUT 2를 통해 비트스트림 생성부(130)로 출력한다.
한편, 본 발명에 의한 계층적 부호화부(110)에는 다운 샘플링부(540)가 마련될 수 있다. 이러한 다운 샘플링부(540)는 그 시간 영역의 오디오 데이터를 그 소정 샘플링 주파수(Fs) 미만의 샘플링 주파수 예를 들어, Fs/2 로 샘플링하고, 샘플링된 결과를 시간/주파수 매핑부(510) 및 심리음향부(520)로 출력한다.
도 6은 본 발명에 의한 오디오 데이터 부호화 장치가 부호화하는 데이터의 신택스(syntax)를 나타내는 도면이다. 도시된 바에서, 식별번호 610은 비섹에 의해 부호화되는 오디오 데이터를 의미하고, 식별번호 620은 비섹에 의해 부호화되는 오디오 데이터(610)와 결합 가능한 데이터를 의미한다. 멀티채널확장 데이터(EXT_BSAC_CHANNEL)(650), 대역폭확장 데이터(EXT_BSAC_SBR_DATA)(660), 및 '에러검출 데이터 및 대역폭확장 데이터(EXT_BSAC_SBR_DATA_CRC)'(670)는 그러한 결합 가능한 데이터의 일 례들이다.
여기서, 멀티채널확장 데이터(EXT_BSAC_CHANNEL)(650)는 제3 채널 내지 제M 채널(단, M은 3이상의 정수) 각각의 오디오 데이터를 의미한다. 본 명세서 상에서, 제3 채널 내지 제M 채널은 본 발명에 의한 오디오 데이터 부호화 장치에 주어지는 오디오 데이터가 3개 이상의 채널(channel)을 통해 주어지는 오디오 데이터일 경우, 모노(mono) 방식의 채널(제1 채널) 및 스테레오(stereo) 방식의 채널(제1 채널 및 제2 채널)을 제외한 나머지 채널을 의미한다. 이처럼, 오디오 데이터가 3개 이상의 채널을 통해 주어진다면, 본 발명에 의한 계층적 부호화부(110)는 모노/스테레오 부호화부(미 도시) 및 멀티채널확장 부호화부(미 도시)를 포함하는 것이 바람 직하다. 이 때, 모노/스테레오 부호화부(미 도시)는 제1 채널 또는 제2 채널의 오디오 데이터를 부호화한다. 또한, 멀티채널확장 부호화부(미 도시)는 제3 채널 내지 제M 채널 각각의 오디오 데이터를 부호화한다. 한편, 에러검출 데이터는 그 대역폭확장 데이터(EXT_BSAC_SBR_DATA)(660)의 에러 검출(error detection)에 사용되는 데이터를 의미하고, EXT_BSAC_SBR_DATA_CRC(670)는 그 대역폭확장 데이터(EXT_BSAC_SBR_DATA)(660) 및 그 에러검출 데이터를 의미한다.
한편, 본 발명에 의한 오디오 데이터 부호화 장치가 부호화하는 데이터에는, 비섹에 의해 부호화되는 오디오 데이터(610), 및 그 결합 가능한 데이터(620) 뿐만 아니라, 그 결합 가능한 데이터(620)의 시작을 알리는 시작코드(630, 640)도 포함되는 것이 바람직하다. 여기서, 시작코드(630, 640)는 제1 시작코드, 제2 시작코드, 및 제3 시작코드 중 하나의 코드인 것이 바람직하다.
제1 시작코드는 대역폭확장 데이터(EXT_BSAC_SBR_DATA)(660)의 시작을 나타내는 시작코드를 의미한다. 구체적으로, 제1 시작코드는 32 비트의 연속된 0으로 이루어진 제로코드(zero_code)(630) 및 '1111 0000'으로 이루어진 확장코드(extension_type)(640)로 구성될 수 있다. 본 발명에 의한 대역폭확장 부호화부(120)는 이러한 제1 시작코드를 부호화하는 제1 시작코드 부호화부(미 도시)를 포함할 수 있다.
제2 시작코드는 에러검출 데이터 및 대역폭확장 데이터(EXT_BSAC_SBR_DATA_CRC)(670)의 시작을 나타내는 시작코드를 의미한다. 구체적으로, 제2 시작코드는 32비트의 0으로 이루어진 제로코드(zero_code)(630) 및 '1111 0001'로 이루어진 확장코드(extension_type)(640)로 구성될 수 있다. 본 발명에 의한 대역폭확장 부호화부(120)는 이러한 제2 시작코드를 부호화하는 제2 시작코드 부호화부(미 도시)를 포함할 수 있다.
제3 시작코드는 제3 채널 내지 제M 채널(단, M은 3이상의 정수)의 오디오 데이터의 시작을 나타내는 시작코드를 의미한다. 구체적으로, 제3 시작코드는 32 비트의 0으로 이루어진 제로코드(zero_code)(630) 및 '1111 1111'로 이루어진 확장코드(extension_type)(640)로 구성될 수 있다. 본 발명에 의한 멀티채널확장 부호화부(미 도시)는 이러한 제3 시작코드를 부호화하는 제3 시작코드 부호화부(미 도시)를 포함할 수 있다.
도 7은 본 발명에 의한 오디오 데이터 부호화 장치에 의해 생성된 대역폭확장 데이터의 신택스를 나타내는 도면이다. 본 발명에 의한 오디오 데이터 부호화 장치에 주어지는 오디오 데이터는 제1 채널 또는 제2 채널을 통해 주어질 수 있고, 도시된 바에서 bsac_sbr_data(nch, bs_amp_res); (710)은 '대역폭확장 부호화부(120)는 채널별로 대역폭확장 데이터를 부호화함'을 의미한다.
도 8은 본 발명에 의한 오디오 데이터 복호화 장치를 설명하기 위한 블록도로서, 비트스트림 분석부(810), 계층적 복호화부(820), 대역폭확장 복호화부(830), 및 데이터 합성부(840)로 이루어진다.
비트스트림 분석부(810)는 입력단자 IN 3을 통해 입력된 비트스트림으로부터, '부호화된 대역폭확장 데이터' 및 '하나 이상의 계층을 가지며 각 계층마다 소정 개수의 비트로 표현되고 부호화된 오디오 데이터'를 추출한다. 여기서, 입력단 자 IN 3을 통해 입력된 비트스트림은 출력단자 OUT 1을 통해 출력된 비트스트림인 것이 바람직하다. 즉, 비트스트림 분석부(810)는 입력단자 IN 3을 통해 입력된 비트스트림으로부터, '대역폭확장 부호화부(120)에 의해 생성된 대역폭확장 데이터' 및 '계층적 부호화부(110)에 의해 생성된 모든 계층의 부호화된 오디오 데이터 중 하나 이상의 계층의 오디오 데이터'를 추출한다.
계층적 복호화부(820)는 그 추출된 오디오 데이터를, 하위 계층을 상위 계층보다 먼저 복호화하며 상위 비트를 하위 비트보다 먼저 복호화함으로써 복호화한다. 다만, 계층적 복호화부(820)는 그 추출된 오디오 데이터를, 소정 비트율 내에서 복호화할 수 있다. 예컨대, 계층적 부호화부(110)에서 부호화된 오디오 데이터 중 비트스트림 생성부(130)에 의해 비트스트림에 포함된 오디오 데이터는 기본 계층(210-0), 제1 확장 계층(210-1), 및 제2 확장 계층(210-2)에 속한 오디오 데이터 뿐인 경우, 계층적 복호화부(820)는 기본 계층(210-0), 제1 확장 계층(210-1) 및 제2 확장 계층(210-2)에 속한 오디오 데이터 모두를 복호화할 수도 있고, 기본 계층(210-0), 및 제1 확장 계층(210-1)에 속한 오디오 데이터 모두를 복호화할 수도 있고, 기본 계층(210-0)에 속한 오디오 데이터만을 복호화할 수도 있다. 그 소정 비트율은 기본 계층(210-0)의 비트율 이상인 것이 바람직하다.
한편, 부호화된 오디오 데이터가 그 입력된 비트스트림에 제1 채널 내지 제M 채널 각각마다 마련되는 경우에 대비해, 계층적 복호화부(820)는 모노/스테레오 복호화부(미 도시), 멀티채널확장 복호화부(미 도시) 및 제3 시작코드 복호화부(미 도시)를 포함하는 것이 바람직하다. 여기서, 모노/스테레오 복호화부(미 도시)는 제1 채널 또는 제2 채널의 부호화된 오디오 데이터를 복호화하고, 멀티채널확장 복호화부(미 도시)는 제3 채널 내지 제M 채널 각각의 부호화된 오디오 데이터를 복호화하고, 제3 시작코드 복호화부(미 도시)는 부호화된 제3 시작코드를 복호화한다. 이처럼, 계층적 복호화부(820)에 멀티채널확장 복호화부(미 도시)가 포함된다면, 비트스트림 분석부(810)는 부호화된 제3 시작코드가 그 입력된 비트스트림에 존재하는지 검사한다. 만일, 부호화된 제3 시작코드가 그 입력된 비트스트림에 존재한다고 검사되면, 비트스트림 분석부(810)는 그 부호화된 제3 시작코드를 그 입력된 비트스트림으로부터 추출하고, 제3 시작코드 복호화부(미 도시)는 그 추출된 제3 시작코드를 복호화하고 멀티채널확장 복호화부(미 도시)의 동작을 지시한다.
대역폭확장 복호화부(830)는 그 추출된 대역폭확장 데이터를 복호화한다. 또한, 대역폭확장 복호화부(830)는 '계층적 복호화부(820)로부터 입력된 오디오 데이터' 및 '그 복호화된 대역폭확장 데이터'를 이용하여, 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 오디오 데이터를 추측한다.
한편, 본 발명에 의한 오디오 데이터 복호화 장치에는, 제1 시작코드 복호화부(미 도시)와 제2 시작코드 복호화부(미 도시)가 마련될 수 있다. 이 경우, 비트스트림 분석부(810)는 부호화된 제1 시작코드 및 부호화된 제2 시작코드가 그 입력된 비트스트림에 존재하는지 검사한다. 만일, 부호화된 제1 시작코드 및 부호화된 제2 시작코드가 그 입력된 비트스트림에 존재한다고 검사되면, 비트스트림 분석부(810)는 그 부호화된 제1 시작코드 및 그 부호화된 제2 시작코드를 그 입력된 비트스트림으로부터 추출하고, 제1 시작코드 복호화부(미 도시)는 그 부호화된 제1 시작코드를 복호화하고, 제2 시작코드 복호화부(미 도시)는 그 부호화된 제2 시작코드를 복호화한다. 이 후, 제1 시작코드 복호화부(미 도시) 및 제2 시작코드 복호화부(미 도시)는 대역폭확장 복호화부(830)의 동작을 지시한다.
데이터 합성부(840)는 '계층적 복호화부(820)로부터 입력된 오디오 데이터' 및 '대역폭확장 복호화부(830)에서 추측된 오디오 데이터'를 이용하여, 합성 데이터를 생성한다. 또한, 데이터 합성부(840)는 합성 데이터가 주파수 영역의 데이터이므로 그 합성 데이터를 시간 영역으로 변환하고, 변환된 합성 데이터를 출력단자 OUT 3을 통해 '0 이상 및 제2 소정 주파수 이하의 오디오 데이터'로서 출력한다. 즉, 본 발명에 의한 오디오 데이터 부호화 장치에 의해 부호화된 오디오 데이터의 최대 주파수가 제2 소정 주파수라면, 데이터 합성부(840)는 비트스트림에 포함된 오디오 데이터가 그 부호화된 오디오 데이터 중 일부 계층의 오디오 데이터일지라도, 모든 계층의 오디오 데이터를 복원한다.
도 9a 내지 도 9d는 도 8에 도시된 데이터 합성부(840)의 동작을 보다 구체적으로 설명하기 위한 참고도들이다. 구체적으로, 도 9a는 본 발명에 의한 계층적 부호화부(110)에 입력된 오디오 데이터(910)를 나타내고, 도 9b는 본 발명에 의한 계층적 복호화부(820)에 의해 복호화된 오디오 데이터(920)를 나타내고, 도 9c는 본 발명에 의한 대역폭확장 복호화부(830)에 의해 추측된 오디오 데이터(930)를 나타내고, 도 9d는 본 발명에 의한 데이터 합성부(840)에 의해 생성된 합성 데이터(940) 즉, 0이상 제2 소정 주파수 이하의 부호화된 오디오 데이터를 복원한 결과(940)를 나타낸다.
도시된 바에서, 오디오 데이터(910, 920, 930, 940)는 연속적으로 존재하듯이 도시되었으나, 이는 설명의 편의를 위한 것이며, 실제로 오디오 데이터(910, 920, 930, 940)는 이산적으로 존재한다.
도시된 바에서, 본 발명에 의한 계층적 부호화부(110)에 입력된 오디오 데이터(910)는 0~ f10 [kHz] 이하의 주파수 대역에 존재한다. 한편, 본 발명에 의한 계층적 복호화부(820)에 의해 복호화된 오디오 데이터(920)는 0~ f3 [kHz] 의 주파수 대역에 존재한다. 비트스트림에는 그 부호화된 오디오 데이터 중 모든 계층의 오디오 데이터가 포함될 수도 있고, 일부 계층의 오디오 데이터만이 포함될 수도 있으며, 도 9b에 도시된 바에서, 비트스트림에는 일부 계층(0~ f3 [kHz] )의 오디오 데이터만이 포함되었다. 한편, 그 일부 계층에 기본 계층(0~ f1 [kHz])은 항상 포함되는 것이 바람직하다.
본 발명에 의한 대역폭확장 복호화부(830)에 의해 추측된 오디오 데이터(930)는 f1~ f10 [kHz]의 주파수 대역에 존재한다. 한편, 본 발명에 의한 데이터 합성부(840)에 의해 생성된 합성 데이터(940)는 0~ f10 [kHz]의 주파수 대역에 존재한다. 즉, 도 9d에 도시된 바(940)는 도 9a에 도시된 바(910)를 복원한 결과이다. 양 자는 어느 정도 다를 수도 있으나, 바람직하게는 서로 동일하다.
데이터 합성부(840)는 '계층적 복호화부(820)에 의해 복호화된 오디오 데이터(920)가 존재하는 주파수 대역(0~ f3 [kHz])'의 경우, 그 복호화된 오디오 데이터(920)를 합성 데이터로서 출력한다.
그와 달리, 데이터 합성부(840)는 '계층적 복호화부(820)에 의해 복호화된 오디오 데이터(920)가 존재하지 않는 주파수 대역(f3~ f10 [kHz])'의 경우, 그 추측된 오디오 데이터(930)를 합성 데이터로서 출력한다.
결국, '그 복호화된 오디오 데이터(920)'와 '그 추측된 오디오 데이터(930)'가 모두 존재하는 주파수 대역(f1~ f3 [kHz])의 경우, 데이터 합성부(840)는 그 복호화된 오디오 데이터(920)가 합성 데이터라고 결정한다.
도 10은 도 8에 도시된 계층적 복호화부(820)를 설명하기 위한 본 발명에 의한 바람직한 일 실시예(820A)의 블록도로서, 역양자화부(1010) 및 주파수/시간 매핑부(1020)를 포함할 수 있다.
역양자화부(1010)는 입력단자 IN 4를 통해 입력된 '그 추출된 오디오 데이터'를 복호화하고, 복호화된 오디오 데이터를 역양자화한다. 한편, 주파수/시간 매핑부(1020)는 주파수 영역의 그 역양자화된 오디오 데이터를 시간 영역의 오디오 데이터로 변환하고, 변환된 오디오 데이터를 출력단자 OUT 4를 통해 출력한다.
도 11은 도 8에 도시된 대역폭확장 복호화부(830)를 설명하기 위한 본 발명에 의한 바람직한 일 실시예(830A)의 블록도로서, 무손실 복호화부부(1110), 고주파 발생부(1120), 분석 뱅크(Analysis QMF Bank)(1130), 및 포락선 조정부(1140)로 이루어진다.
무손실 복호화부(1110)는 입력단자 IN 5를 통해 입력된 '그 추출된 대역폭확장 데이터'를 무손실 복호화(lossless decoding)한다. 이 때, 무손실 복호화는 엔트로피 복호화(entropy decoding)일 수도 있고, 호프만 복호화(Huffman decoding)일 수도 있다. 이로써, 무손실 복호화부(1110)는 그 추출된 대역폭확장 데이터에 담긴 '제1 소정 주파수 이상 및 제2 소정 주파수 이하의 오디오 데이터에 관한 정보'를 획득한다. 예컨대, 무손실 복호화부(1110)는 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 오디오 데이터의 포락선에 관한 정보를 획득한다.
고주파 발생부(1120)는 '계층적 복호화부(820)에 의해 복호화된 오디오 데이터(920)'를 그 '계층적 복호화부(820)에 의해 복호화된 오디오 데이터(920)'의 최대 주파수(도 9에서, f3) 이상의 주파수 대역(도 9에서, f3~ f6, f6~ f9, f9~ f10)에 발생시킨다. 다만, 그 복호화된 오디오 데이터는 시간 영역의 오디오 데이터이므로, 그 복호화된 오디오 데이터를 그 복호화된 오디오 데이터의 최대 주파수 이상의 주파수 대역에 발생시키기 위해서는, 그 복호화된 오디오 데이터를 주파수 영역으로 변환하는 것이 바람직하다. 이를 위해, 본 발명에 의한 대역폭확장 복호화부(830)에는 분석 뱅크(1130)가 마련될 수 있다.
분석 뱅크(1130)는 입력단자 IN 6을 통해 입력된 '그 복호화된 오디오 데이터'를 주파수 영역의 오디오 데이터로 변환하고, 변환된 오디오 데이터를 출력단자 OUT 6을 통해 출력한다.
포락선 조정부(1140)는 고주파 발생부(1120)에서 발생된 오디오 데이터의 포락선을 무손실 복호화부(1110)가 획득한 정보를 이용하여 조정한다. 즉, 포락선 조정부(1140)는 고주파 발생부(1120)에서 발생된 오디오 데이터의 포락선이 본 발명에 의한 계층적 부호화부(110)에 의해 부호화된 오디오 데이터의 포락선과 일치하도록, 그 발생된 오디오 데이터를 조정한다. 그 조정된 오디오 데이터는 출력단자 OUT 5를 통해 출력되고, 계층적 부호화부(110)에 입력된 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 오디오 데이터는 그 조정된 오디오 데이터라고 추측된다.
도 12는 도 8에 도시된 데이터 합성부(840)를 설명하기 위한 본 발명에 의한 바람직한 일 실시예(840A)의 블록도로서, 오버래핑부(1210) 및 합성 뱅크(Synthesis QMF Bank)(1220)로 이루어진다.
오버래핑부(1210)는 입력단자 IN 7을 통해 입력된 '계층적 복호화부(820)에 의해 복호화된 오디오 데이터(920)' 및 입력단자 IN 8을 통해 입력된 '대역폭확장 복호화부(830)에 의해 추측된 오디오 데이터(930)'를 이용하여 합성 데이터를 생성한다.
구체적으로, 오버래핑부(1210)는 '그 복호화된 오디오 데이터(920)가 존재하는 주파수 대역(도 9에서, 0~ f3 [kHz])'의 경우, 그 복호화된 오디오 데이터(920)를 합성 데이터로서 출력하고, '그 추측된 오디오 데이터(930)만이 존재하는 주파수 대역(도 9에서, f3~ f10)'의 경우, 그 추측된 오디오 데이터(930)를 합성 데이터로서 출력한다.
한편, 입력단자 IN 7을 통해 입력된 '계층적 복호화부(820)에 의해 복호화된 오디오 데이터(920)' 및 입력단자 IN 8을 통해 입력된 '대역폭확장 복호화부(830)에 의해 추측된 오디오 데이터(930)' 모두, 주파수 영역의 오디오 데이터이다. 그러므로, 그 복호화된 오디오 데이터가 시간 영역의 오디오 데이터라면, 그 복호화된 오디오 데이터는 분석 뱅크(1130)를 거쳐 입력단자 IN 7에 입력되는 것이 바람직하다.
합성 뱅크(1220)는 주파수 영역의 합성 데이터를 시간 영역의 합성 데이터로 변환하고, 변환된 결과를 출력단자 OUT 7을 통해 출력한다.
도 13은 본 발명에 의한 오디오 데이터 부호화 방법을 설명하기 위한 플로우챠트로서, 오디오 데이터를 비섹을 이용하여 부호화하고, 대역폭확장 데이터를 부호화하고, 그 부호화된 오디오 데이터와 그 부호화된 대역폭확장 데이터를 이용하여 비트스트림을 생성하는 단계들(제1310~ 1330 단계들)로 이루어진다.
계층적 부호화부(110)는 오디오 데이터를 분할하여 복수의 계층을 생성하고, 생성된 계층마다 그 오디오 데이터를 소정 개수의 비트로 표현하고, 모든 계층의 오디오 데이터를 부호화하되, 하위 계층을 상위 계층보다 먼저 부호화하며 상위 비트를 하위 비트보다 먼저 부호화한다(제1310 단계).
대역폭확장 부호화부(120)는 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 오디오 데이터에 관한 정보를 갖는 대역폭확장 데이터를 생성하고, 생성된 대역폭확장 데이터를 호프만 부호화한다(제1320 단계).
여기서, 제1320 단계는 도시된 바와 같이 제1310 단계가 수행된 후에 수행될 수도 있고, 도시된 바와 달리 제1310 단계보다 먼저 수행되거나 제1310 단계와 동시에 수행될 수도 있다.
제1310 단계 및 제1320 단계 후에, 비트스트림 생성부(130)는 제1310 단계에서 부호화된 오디오 데이터와 제1320 단계에서 부호화된 대역폭확장 데이터를 이용하여 비트스트림을 생성한다(제1330 단계).
도 14는 본 발명에 의한 오디오 데이터 복호화 방법을 설명하기 위한 플로우챠트로서, 복호화하고자 하는 비트스트림에 포함된 오디오 데이터를 복호화하여 그 포함된 오디오 데이터의 주파수 대역의 오디오 데이터를 복원하고, 그 포함된 오디오 데이터가 어떠한 계층인지에 관계없이 동일하며 그 비트스트림에 포함된 대역폭확장 데이터를 이용하여 그 포함된 오디오 데이터의 최대 주파수 이상의 주파수 대역의 오디오 데이터를 추측하여 복원하는 단계들(제1410~ 1440 단계들)로 이루어진다.
비트스트림 분석부(810)는 주어진 비트스트림으로부터 제1310 단계에서 부호화된 대역폭확장 데이터 및 제1320 단계에서 부호화된 오디오 데이터를 추출한다(제1410 단계).
계층적 복호화부(820)는 제1310 단계에서 부호화된 오디오 데이터를, 하위 계층을 상위 계층보다 먼저 복호화하며 상위 비트를 하위 비트보다 먼저 복호화함으로써 복호화한다(제1420 단계).
대역폭확장 복호화부(830)는 제1320 단계에서 부호화된 대역폭확장 데이터를 복호화하고, 복호화된 대역폭확장 데이터 및 제1420 단계에서 복호화된 오디오 데이터를 이용하여, 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 오디오 데이터를 추측한다(제1430 단계).
데이터 합성부(840)는 제1420 단계에서 복호화된 오디오 데이터와 제1430 단계에서 추측된 오디오 데이터를 이용하여 합성데이터를 생성하고, 생성된 합성 데이터를 0이상 및 제2 소정 주파수 이하의 오디오 데이터로서 결정한다(제1440 단계).
도 15는 도 14에 도시된 제1430 단계에 대한 본 발명에 의한 바람직한 일 실 시예(1430A)의 플로우챠트로서, 제1420 단계에서 복호화된 오디오 데이터와 제1320 단계에서 부호화된 대역폭확장 데이터를 이용하여, 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 오디오 데이터를 추측하는 단계들(제1510~ 1530 단계들)로 이루어진다.
무손실 복호화부(1110)는 복호화하고자 하는 비트스트림에 포함된 부호화된 대역폭확장 데이터를 무손실 복호화하여, 제1 소정 주파수 이상 및 제2 소정 주파수 이하의 오디오 데이터가 나타내는 포락선에 관한 정보를 획득한다(제1510 단계).
제1510 단계 후에, 고주파 발생부(1120)는 제1420 단계에서 복호화된 오디오 데이터를 그 제1420 단계에서 복호화된 오디오 데이터가 존재하는 최대 주파수 이상의 주파수 대역에 발생시킨다(제1520 단계).
제1520 단계 후에, 포락선 조정부(1140)는 제1520 단계에서 발생된 오디오 데이터의 포락선을 제1510 단계에서 획득된 정보를 이용하여 조정하고, 제1440 단계로 진행한다(제1530 단계).
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있으며, 또한 캐리어 웨이브 (예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있 는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
이상 도면과 명세서에서 최적 실시예들이 개시되었다. 여기서 특정한 용어들이 사용되었으나, 이는 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미 한정이나 특허청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.
이상에서 설명한 바와 같이, 본 발명에 의한 오디오 데이터 부호화 및 복호화 장치와 방법은, 복호화하고자 하는 비트스트림에 포함된 오디오 데이터를 복호화하여 그 포함된 오디오 데이터의 주파수 대역의 오디오 데이터를 복원하고, 그 비트스트림에 포함된 대역폭확장 데이터를 이용하여 그 포함된 오디오 데이터의 최대 주파수 이상의 주파수 대역의 오디오 데이터를 추측하여 복원하므로, 그 포함된 오디오 데이터가 일부 계층의 부호화된 오디오 데이터일지라도 모든 계층의 오디오 데이터를 복원할 수 있는 효과를 갖는다. 나아가, 본 발명에 의하면, 그 포함된 대역폭확장 데이터가 그 포함된 오디오 데이터가 어떠한 계층인지에 관계없이 동일하므로, 비섹(BSAC)과 같은 계층적 코덱(scalable codec) 기법에 대역폭확장 기법이 용이하게 결합할 수 있다.

Claims (2)

  1. 계층적으로 부호화된 오디오 데이터를 복호화하는 단계;
    상기 오디오 데이터의 페이로드가 종결되었다는 것을 나타내는 코드를 검출하는 단계;
    확장 데이터의 페이로드가 시작되었다는 것을 나타내는 코드를 검출하는 단계;
    확장 데이터의 타입을 검출하는 단계;
    상기 검출된 타입이 대역폭 확장 데이터를 나타내는지 여부를 판단하는 단계; 및
    상기 판단하는 단계에서 나타낸다고 판단되면, 상기 대역폭 확장 데이터를 복호화하는 단계를 포함하는 것을 특징으로 하는 오디오 데이터 복호화 방법.
  2. 계층적으로 부호화된 오디오 데이터를 복호화하는 단계;
    ‘zero_code’를 검출하는 단계;
    ‘extension_type’을 검출하는 단계; 및
    상기 검출된 ‘extension_type’이 대역폭 확장 데이터를 나타내는지 여부를 판단하는 단계; 및
    상기 판단하는 단계에서 나타낸다고 판단되면, 상기 대역폭 확장 데이터를 복호화하는 단계를 포함하는 것을 특징으로 하는 오디오 데이터 복호화 방법.
KR1020070054025A 2005-04-14 2007-06-01 오디오 데이터 부호화 및 복호화 장치와 방법 KR101029076B1 (ko)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US67111105P 2005-04-14 2005-04-14
US60/671,111 2005-04-14
US70644105P 2005-08-09 2005-08-09
US60/706,441 2005-08-09
US70754605P 2005-08-12 2005-08-12
US60/707,546 2005-08-12
KR1020050135837 2005-12-30
KR20050135837 2005-12-30

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020060033208A Division KR100818268B1 (ko) 2005-04-14 2006-04-12 오디오 데이터 부호화 및 복호화 장치와 방법

Publications (2)

Publication Number Publication Date
KR20070063493A KR20070063493A (ko) 2007-06-19
KR101029076B1 true KR101029076B1 (ko) 2011-04-18

Family

ID=36754313

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020060033208A KR100818268B1 (ko) 2005-04-14 2006-04-12 오디오 데이터 부호화 및 복호화 장치와 방법
KR1020070054024A KR101162572B1 (ko) 2005-04-14 2007-06-01 오디오 데이터 부호화 및 복호화 장치와 방법
KR1020070054025A KR101029076B1 (ko) 2005-04-14 2007-06-01 오디오 데이터 부호화 및 복호화 장치와 방법

Family Applications Before (2)

Application Number Title Priority Date Filing Date
KR1020060033208A KR100818268B1 (ko) 2005-04-14 2006-04-12 오디오 데이터 부호화 및 복호화 장치와 방법
KR1020070054024A KR101162572B1 (ko) 2005-04-14 2007-06-01 오디오 데이터 부호화 및 복호화 장치와 방법

Country Status (7)

Country Link
US (2) US7813932B2 (ko)
EP (1) EP1713061B1 (ko)
JP (2) JP4781153B2 (ko)
KR (3) KR100818268B1 (ko)
CN (1) CN1878001B (ko)
AT (1) ATE407423T1 (ko)
DE (1) DE602006002538D1 (ko)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7835904B2 (en) * 2006-03-03 2010-11-16 Microsoft Corp. Perceptual, scalable audio compression
KR100923156B1 (ko) * 2006-05-02 2009-10-23 한국전자통신연구원 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법
EP1852848A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
US9159333B2 (en) * 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US20080004883A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Scalable audio coding
KR101438387B1 (ko) * 2006-07-12 2014-09-05 삼성전자주식회사 서라운드 확장 데이터 부호화 및 복호화 방법 및 장치
US8571875B2 (en) 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
JP4918841B2 (ja) * 2006-10-23 2012-04-18 富士通株式会社 符号化システム
GB2443911A (en) * 2006-11-06 2008-05-21 Matsushita Electric Ind Co Ltd Reducing power consumption in digital broadcast receivers
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
WO2008066071A1 (en) * 2006-11-29 2008-06-05 Panasonic Corporation Decoding apparatus and audio decoding method
US9153241B2 (en) * 2006-11-30 2015-10-06 Panasonic Intellectual Property Management Co., Ltd. Signal processing apparatus
US8560328B2 (en) * 2006-12-15 2013-10-15 Panasonic Corporation Encoding device, decoding device, and method thereof
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
US8116486B2 (en) * 2008-03-04 2012-02-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Mixing of input data streams and generation of an output data stream therefrom
EP2287836B1 (en) * 2008-05-30 2014-10-15 Panasonic Intellectual Property Corporation of America Encoder and encoding method
KR20100136890A (ko) * 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
US20110087494A1 (en) * 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme
KR101309671B1 (ko) 2009-10-21 2013-09-23 돌비 인터네셔널 에이비 결합된 트랜스포저 필터 뱅크에서의 오버샘플링
MY166998A (en) 2009-12-16 2018-07-27 Dolby Int Ab Sbr bitstream parameter downmix
US10515643B2 (en) 2011-04-05 2019-12-24 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder, decoder, program, and recording medium
JP5714180B2 (ja) 2011-05-19 2015-05-07 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーディング方式の鑑識検出
CN103650036B (zh) * 2012-07-06 2016-05-11 深圳广晟信源技术有限公司 对多声道数字音频编码的方法
CN104704825B (zh) 2012-08-21 2019-08-30 Emc 公司 分段图像数据的无损压缩
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
TWI758146B (zh) * 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10395664B2 (en) 2016-01-26 2019-08-27 Dolby Laboratories Licensing Corporation Adaptive Quantization
WO2017164881A1 (en) * 2016-03-24 2017-09-28 Harman International Industries, Incorporated Signal quality-based enhancement and compensation of compressed audio signals
TWI752166B (zh) 2017-03-23 2022-01-11 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
CN111630593B (zh) * 2018-01-18 2021-12-28 杜比实验室特许公司 用于译码声场表示信号的方法和装置
KR101921083B1 (ko) * 2018-02-20 2018-11-22 주식회사 인터엠 네트워크 기반의 선택적 품질의 음원 방송을 위한 기법
KR102049348B1 (ko) * 2018-11-13 2019-11-27 주식회사 인터엠 VoIP를 활용한 네트워크 기반의 선택적 품질의 음원 방송을 위한 기법
CN113113032A (zh) 2020-01-10 2021-07-13 华为技术有限公司 一种音频编解码方法和音频编解码设备
CN111865952B (zh) * 2020-07-10 2023-04-18 腾讯音乐娱乐科技(深圳)有限公司 数据处理方法、装置、存储介质及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040086879A (ko) * 2003-03-22 2004-10-13 삼성전자주식회사 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2156889C (en) * 1994-09-30 1999-11-02 Edward L. Schwartz Method and apparatus for encoding and decoding data
JP3139602B2 (ja) * 1995-03-24 2001-03-05 日本電信電話株式会社 音響信号符号化方法及び復号化方法
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
KR100261253B1 (ko) 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
IL122714A (en) * 1997-04-02 2011-06-30 Samsung Electronics Co Ltd Digital data coding/decoding method and apparatus
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JPH11136225A (ja) * 1997-10-30 1999-05-21 Matsushita Electric Ind Co Ltd ビットストリームにおけるスタートコードを検出する方法および装置
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
EP1049312A3 (en) * 1999-04-28 2004-05-19 Um, Sang-seop Multi-functional mobile communication terminal
JP2001034299A (ja) * 1999-07-21 2001-02-09 Yamaha Corp 音声合成装置
US6504496B1 (en) * 2001-04-10 2003-01-07 Cirrus Logic, Inc. Systems and methods for decoding compressed data
US7200561B2 (en) * 2001-08-23 2007-04-03 Nippon Telegraph And Telephone Corporation Digital signal coding and decoding methods and apparatuses and programs therefor
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
KR100433984B1 (ko) * 2002-03-05 2004-06-04 한국전자통신연구원 디지털 오디오 부호화/복호화 장치 및 방법
US7110941B2 (en) * 2002-03-28 2006-09-19 Microsoft Corporation System and method for embedded audio coding with implicit auditory masking
US7275036B2 (en) * 2002-04-18 2007-09-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7330812B2 (en) * 2002-10-04 2008-02-12 National Research Council Of Canada Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
JP4067526B2 (ja) * 2002-10-24 2008-03-26 エージェンシー フォー サイエンス,テクノロジー アンド リサーチ データソースにより生成されたビットシンボルの処理方法及び装置、コンピュータ読取可能媒体、並びにコンピュータプログラム要素
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
KR100917464B1 (ko) 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
JP2005024756A (ja) * 2003-06-30 2005-01-27 Toshiba Corp 復号処理回路および移動端末装置
JPWO2005081229A1 (ja) * 2004-02-25 2007-10-25 松下電器産業株式会社 オーディオエンコーダ及びオーディオデコーダ
US7536302B2 (en) * 2004-07-13 2009-05-19 Industrial Technology Research Institute Method, process and device for coding audio signals
JP4618634B2 (ja) * 2004-10-07 2011-01-26 Kddi株式会社 圧縮オーディオデータ処理方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040086879A (ko) * 2003-03-22 2004-10-13 삼성전자주식회사 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치

Also Published As

Publication number Publication date
JP2006293375A (ja) 2006-10-26
DE602006002538D1 (de) 2008-10-16
JP4781153B2 (ja) 2011-09-28
US7813932B2 (en) 2010-10-12
EP1713061A3 (en) 2006-12-27
JP5254933B2 (ja) 2013-08-07
JP2010033084A (ja) 2010-02-12
KR20070070137A (ko) 2007-07-03
CN1878001A (zh) 2006-12-13
US8046235B2 (en) 2011-10-25
ATE407423T1 (de) 2008-09-15
US20100332239A1 (en) 2010-12-30
KR100818268B1 (ko) 2008-04-02
EP1713061B1 (en) 2008-09-03
US20060235678A1 (en) 2006-10-19
KR101162572B1 (ko) 2012-07-05
KR20060108520A (ko) 2006-10-18
EP1713061A2 (en) 2006-10-18
CN1878001B (zh) 2012-07-18
KR20070063493A (ko) 2007-06-19

Similar Documents

Publication Publication Date Title
KR101029076B1 (ko) 오디오 데이터 부호화 및 복호화 장치와 방법
KR101664434B1 (ko) 오디오 신호의 부호화 및 복호화 방법 및 그 장치
EP1749296B1 (en) Multichannel audio extension
US7460990B2 (en) Efficient coding of digital media spectral data using wide-sense perceptual similarity
EP1904999B1 (en) Frequency segmentation to obtain bands for efficient coding of digital media
EP2346029B1 (en) Audio encoder, method for encoding an audio signal and corresponding computer program
KR101435893B1 (ko) 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
US7245234B2 (en) Method and apparatus for encoding and decoding digital signals
KR100945219B1 (ko) 인코딩된 신호의 처리
US20080140393A1 (en) Speech coding apparatus and method
Liebchen An introduction to MPEG-4 audio lossless coding
Yu et al. A scalable lossy to lossless audio coder for MPEG-4 lossless audio coding
Li et al. Efficient stereo bitrate allocation for fully scalable audio codec

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E701 Decision to grant or registration of patent right
FPAY Annual fee payment
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160330

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170330

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee