KR20070003546A - 멀티채널 오디오 코딩에서 클리핑복원정보를 이용한 클리핑복원방법 - Google Patents

멀티채널 오디오 코딩에서 클리핑복원정보를 이용한 클리핑복원방법 Download PDF

Info

Publication number
KR20070003546A
KR20070003546A KR1020060030672A KR20060030672A KR20070003546A KR 20070003546 A KR20070003546 A KR 20070003546A KR 1020060030672 A KR1020060030672 A KR 1020060030672A KR 20060030672 A KR20060030672 A KR 20060030672A KR 20070003546 A KR20070003546 A KR 20070003546A
Authority
KR
South Korea
Prior art keywords
information
audio signal
clipping
bitstream
spatial information
Prior art date
Application number
KR1020060030672A
Other languages
English (en)
Inventor
방희석
오현오
김동수
임재현
정양원
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of KR20070003546A publication Critical patent/KR20070003546A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)

Abstract

본 발명은 멀티채널 오디오 신호의 공간 정보에 대한 부호-복호화(encoding-decoding)방법에 관한 것으로서, 더욱 상세하게는 하드 클리핑에 의한 클리핑 복원방법을 갖는 멀티채널 오디오 신호의 부호화-복호화 방법에 대한 것이다.
본 발명에 따른 멀티채널 오디오 신호를 코딩하는데 있어서, 클리핑복원정보를 포함하도록 비트스트림을 구성하고, 상기 클리핑복원정보를 이용하여 다운믹스 오디오 신호의 클리핑된 부분을 복원함으로써, 멀티채널 오디오 신호를 다운믹스하는 과정에서 발생되는 클리핑 문제를 효과적으로 방지할 수 있는 방법 및 장치를 제공한다.
또한, 본 발명은 다운믹스 오디오 신호로부터 클리핑복원게인을 추정하고, 추정된 상기 클리핑복원게인을 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원함으로써, 멀티채널 오디오 신호를 다운믹스하는 과정에서 발생되는 클리핑 문제를 효과적으로 방지할 수 있는 방법 및 장치를 제공한다.
멀티채널 오디오, 공간 정보, 클리핑

Description

멀티채널 오디오 코딩에서 클리핑복원정보를 이용한 클리핑 복원방법{CLIPPING RESTORATION BY CLIPPING RESTORATION INFORMATION FOR MULTI-CHANNEL AUDIO CODING}
도 1은 본 발명에서의 오디오 신호에 대한 공간 정보를 인간이 인식하는 방법을 나타내는 도면.
도 2는 클리핑 발생과정을 나타내는 도면.
도 3은 본 발명에 따른 클리핑복원정보를 이용하여 클리핑을 방지하기 위한 인코딩 방법에 대한 도면.
도 4는 본 발명에 따른 클리핑복원정보를 이용하여 클리핑을 방지하기 위한 제1 디코딩 방법에 대한 도면.
도 5는 본 발명에 따른 클리핑복원정보를 이용하여 클리핑을 방지하기 위한 제2 디코딩 방법에 대한 도면.
도 6은 본 발명에 따른 클리핑복원정보를 이용하여 클리핑을 방지하기 위한 제3 디코딩 방법에 대한 도면.
도 7a 및 7b는 상기 제2 디코딩 방법에 대한 신택스.
도 8은 본 발명에 따른 클리핑복원정보를 이용하는 제1 인코딩 방법에 대한 흐름도.
도 9는 본 발명에 따른 클리핑복원정보를 이용하는 제2 인코딩 방법에 대한 흐름도.
도 10은 본 발명에 따른 클리핑복원정보를 이용하는 제1 디코딩 방법에 대한 흐름도.
도 11은 본 발명에 따른 클리핑복원정보를 이용하는 제2 디코딩 방법에 대한 흐름도.
도 12는 본 발명에 따른 클리핑복원정보를 이용하는 제3 디코딩 방법에 대한 흐름도.
*도면의 주요부분에 대한 부호의 설명
101.원거리 음원 102.직접적인 음파
104.반사된 음파 301.멀티채널 오디오 신호
302.다운믹스부 303.공간정보발생부
402.비트스트림수신부 403.클리핑탐색부
404.클리핑복원정보독출부 404.클리핑복원부
406.멀티채널생성부 408.공간 디코더
604.클리핑복원게인 추정부
본 발명은 멀티채널 오디오 신호의 공간 정보에 대한 부호-복호화(encoding- decoding)방법에 관한 것으로서, 더욱 상세하게는 클리핑복원정보를 이용한 클리핑 복원방법을 갖는 멀티채널 오디오 신호의 부호화-복호화 방법에 대한 것이다.
최근에 디지털 오디오 신호에 대한 다양한 코딩기술 및 방법들이 개발되고 있으며, 이와 관련된 제품들이 생산되고 있다. 또한 심리음향 모델(Psychoacoustic model)을 이용한 멀티채널 오디오 신호(multi-channel audio signal)의 코딩방법들이 개발되고 있으며, 이에 대한 표준화 작업이 진행되고 있다. 상기 심리음향 모델은 인간이 소리를 인식하는 방식, 예를 들면 큰 소리 다음에 오는 작은 소리는 들리지 않으며, 20Hz 내지 20000Hz의 주파수에 해당되는 소리만 들을 수 있다는 사실을 이용하여, 코딩과정에서 불필요한 부분에 대한 오디오 신호를 제거함으로써 필요한 데이터의 양을 효과적으로 줄일 수 있는 것이다.
현재 MPEG-1 오디오(MEPG-1 레이어 Ⅲ), MPEG-4 AAC(Advanced Audio Coding) 및 MPEG-4 HE-AAC(High-Efficiency AAC)와 같은 오디오 표준 기술이 개발되어 상용화되고 있다. 또한 공간 정보를 이용하는 멀티채널 오디오 신호의 코딩방법이 개발되고 있다. 상기 멀티채널 오디오 신호의 코딩방법은 압축된 오디오 신호(예를 들면, 모노 또는 스테레오 오디오 신호) 및 낮은 비트-레이트의 부가정보(low-rate side information)(예를 들면, 공간 정보) 채널을 이용하여 멀티채널 오디오 신호의 전송 효율을 매우 효과적으로 향상시키는 것이다.
그러나, 상기 멀티채널 오디오 신호의 비트스트림을 구성하는데 있어서, 종래에는 멀티채널을 모노 또는 스테레오 오디오 신호로 다운믹스하면 클리핑(Clipping) 문제가 발생하였었다. 특히 부호화된 신호는 16비트 등으로 크기가 제한되어야하므로, 상기 부호화된 신호는 코어 코덱 인코딩 이후에도 클리핑이 지속된다. 상기 클리핑은 오디오 신호의 출력에도 영향을 주며, 음질 저하의 원인이 되었었다.
따라서 상기와 같은 문제점을 해결하기 위해 제안된 본 발명은, 멀티채널 오디오 신호를 코딩하는데 있어서, 클리핑복원정보를 포함하도록 비트스트림을 구성하고, 상기 클리핑복원정보를 이용하여 클리핑된 부분을 복원함으로써, 멀티채널 오디오 신호에서 일어나는 클리핑 문제를 해결하는 방법 및 장치를 제공하는데 그 목적이 있다.
상기의 목적을 달성하기 위하여, 본 발명은 상기 멀티채널 오디오 신호를 다운믹스하여 다운믹스 오디오 신호를 생성하는 단계와; 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하는 단계와; 상기 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 생성하는 단계를 포함하되, 상기 공간 정보 비트스트림의 헤더내에 클리핑복원(Clipping Restoration)의 사용 여부에 관한 제1 정보를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호의 인코딩 방법을 제공한다. 만일 상기 인코딩 방법은 상기 제1 정보가 사용상태를 표시하는 경우, 상기 공간 정보 비트스트림내에 프레임별로 상기 클리핑복원정보(Clipping Restoration Information)를 포함하는 단계를 더 포함할 수 있다. 또한, 만일 상기 인코딩 방법은 상기 제1 정보가 사용상태를 표시하는 경우, 상기 공간 정보 비트스 트림내에 프레임별로 상기 클리핑복원를 위한 데이터의 존재 여부에 관한 제2 정보를 포함할 수 있다. 이때, 상기 제2 정보가 존재상태를 표시하는 경우, 상기 공간 정보 비트스트림내에 프레임별로 상기 클리핑복원정보를 포함할 수 있다.
상기 클리핑복원정보는 상기 다운믹스 오디오 신호의 시간 포락선(Time envelope) 또는 주파수 포락선(frequency envelope) 정보이거나, 시간 포락선(Time envelope) 또는 주파수 포락선(frequency envelope) 모델의 파라미터에 관한 정보이거나, 또는, 상기 클리핑복원정보는 클리핑이 일어난 위치정보 또는 클리핑을 보정하기 위한 게인정보 중 하나 이상을 포함하는 정보가 될 수 있다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 수신하는 단계와; 상기 다운믹스 오디오 신호에서 클리핑된 부분을 찾는 단계와; 상기 클리핑된 부분에 대하여 상기 공간 정보 비트스트림으로부터 클리핑복원정보를 독출하는 단계와; 독출된 상기 클리핑복원정보를 이용하여, 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원하는 단계;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호로 디코딩하는 방법을 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 수신하는 단계와; 상기 공간 정보 비트스트림으로부터 클리핑된 부분의 위치정보 및 클리핑복원정보를 독출하는 단계와; 상기 위치정보 및 클리핑복원정보를 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원하는 단계;를 포함하는 것을 특징으로 하는 멀티채널 오디 오 신호로 디코딩하는 방법을 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 수신하는 단계와; 상기 다운믹스 오디오 신호에서 클리핑된 부분을 찾는 단계와; 상기 클리핑된 부분에 대하여 클리핑복원게인(Clipping Restoration Gain)을 추정하는 단계와; 추정된 상기 클리핑복원게인을 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원하는 단계;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호로 디코딩하는 방법을 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 오디오 신호가 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하도록 생성하되, 상기 공간 정보 비트스트림내에 클리핑복원정보를 포함하도록 생성되는 것을 특징으로 하는 오디오 신호의 생성방법을 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 상기 멀티채널 오디오 신호를 다운믹스하여 다운믹스 오디오 신호를 생성하는 다운믹스부; 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하는 공간정보발생부; 및 상기 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하도록 전체 비트스트림을 생성하는 비트스트림포맷터를 포함하되, 상기 공간 정보 비트스트림내에 클리핑복원정보(Guided Clipping Restoration Information)를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호의 인코딩 장치를 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 수신하는 비트스트림수신부; 상기 다운믹스 오디오 신호에서 클리핑된 부분을 찾는 클리핑탐색부; 상기 클리핑된 부분에 대하여 상기 공간 정보 비트스트림으로부터 클리핑복원정보를 독출하는 클리핑복원정보독출부; 및 독출된 상기 클리핑복원정보를 이용하여, 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원하는 클리핑복원부;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호의 디코딩 장치를 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 수신하는 비트스트림수신부; 상기 공간 정보 비트스트림으로부터 클리핑된 부분의 위치정보 및 클리핑복원정보를 독출하는 클리핑복원정보독출부; 및 상기 위치정보 및 클리핑복원정보를 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원하는 클리핑복원부;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호로 디코딩하는 방법을 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 수신하는 비트스트림수신부; 상기 다운믹스 오디오 신호에서 클리핑된 부분을 찾는 클리핑탐색부; 상기 클리핑된 부분에 대하여 클리핑복원게인(Clipping Restoration Gain)을 추정하는 클리핑복원게인추정부; 및 추정된 상기 클리핑복원게인을 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원하는 클리핑복원부;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호의 디코딩 장치를 제공한다.
이하 상기의 목적을 구체적으로 실현할 수 있는 본 발명의 바람직한 실시예 를 첨부한 도면을 참조하여 설명한다.
도 1 은 본 발명에서의 오디오 신호에 대한 공간 정보를 인간이 인식하는 방법을 도시한다. 멀티채널 오디오 신호에 대한 코딩방법은 인간이 오디오 신호를 3차원적 공간으로 인지한다는 사실을 바탕으로, 복수의 파라미터 세트(parameter sets)를 통하여 상기 오디오 신호를 3차원적 공간 정보로 표현할 수 있다는 것을 이용한다. 멀티채널 오디오 신호의 공간 정보를 표시하기 위한 "공간 파라미터"라고 불리는 상기 파라미터에는 ICLD(Inter Channel level differences), ICC(Inter Channel Coherences) 및 ICTD(Inter Channel Time Difference)등이 있다. 상기 ICLD는 두 채널간의 에너지 차이를 의미하고, 상기 ICC는 두 채널 간의 상관관계(correlation)를 의미하며, ICTD는 두 채널간의 시간 차이를 의미한다.
인간이 오디오 신호를 어떻게 공간적으로 인식하며, 상기 공간 파라미터의 개념이 어떻게 생성되는지가 도 1에 도시된다. 원거리에 있는 음원(105)으로부터의 직접적인 음파(direct sound wave)(103)가 인간의 왼쪽 귀(107)에 도달하고, 또 다른 직접적인 음파(102)는 머리 주위에서 회절되어 오른쪽 귀(106)에 도달하게 된다. 상기 두 음파(102 및 103)는 도달시간 및 에너지 레벨에서 차이를 보이게 되며, 이와 같은 차이가 상기 CLD, CPC 및 CTD 파라미터를 생성하게 된다.
또한 만일 반사된 음파(104 및 105)가 양 귀에 도달되거나, 또는 상기 음원(105)이 분산되어 있다면, 서로 상관관계가 없는 음파가 양 귀에 도달될 것이고, 이것이 상기 ICC 파라미터를 생성하게 된다. 상기와 같이 원리로 생성된 공간 파라미터들은 멀티채널 오디오 신호를 모노 또는 스테레오 신호로 전송한 후 다시 멀티 채널로 출력하는데 있어서, 강력한 비트 수 감소를 가능하게 한다는 것이 알려져 있다. 본 발명은 상기 공간 정보를 이용하는 멀티채널 오디오 신호에 있어서, 멀티채널을 다운믹스하여 코딩하는 과정에서 발생할 수 있는 클리핑(Clipping) 현상을 방지하기 위한 방법을 제시한다.
도 2는 클리핑 발생과정을 도시한다. 클리핑은 주로 두 가지 원인으로 발생한다. 첫 번째는 원래 신호(original signal)의 음량(sound level)이 높은 경우에 발생한다. 두 번째는 다운믹스 과정 중에 입력 채널(input channel)의 수가 많은 경우에 발생한다. 예를 들면, 3개의 채널을 1개의 채널도 다운믹스하는 경우보다, 7개의 채널을 1개의 채널도 다운믹스하는 경우에 클리핑이 더 자주 발생한다. 도 2의 클리핑 발생과정은 5개 채널을 1개의 채널로 다운믹스하는 경우를 도시하나, 본 발명은 이 경우에만 한정되지는 않는다. 도 2의 (a)는 5개의 채널로 구성된 원래 신호의 음량을 도시한다. 각각의 채널은 제한된 크기(예를 들면, 16비트)의 거의 전 범위를 사용할 수 있다. 도 2의 (b)는 상기 5개의 채널을 다운믹스하여 생성된 다운믹스 오디오 신호를 도시한다. 도시된 것처럼, 상기 다운믹스 오디오 신호는 많은 클리핑 지점들을 가질 수 있다. 도 2의 (c)는 상기 다운믹스 오디오 신호를 코어 코덱(예를 들면, AAC 코덱)을 이용하여 인코딩/디코딩한 오디오 신호를 도시한다. 상기 코어 코덱을 이용하여 인코딩/디코딩된 오디오 신호도 제한된 크기(예를 들면, 16비트)로 표현되므로, 클리핑이 지속될 수 있다. 상기 클리핑은 멀티채널 오디오 신호의 재생부에서의 출력에도 영향을 주며, 음질 저하의 원인이 될 수 있다.
도 3은 본 발명에 따른 클리핑복원정보를 이용하여 클리핑을 방지하기 위한 인코딩 방법을 도시한다. 도시된 것처럼, 멀티채널 오디오 신호(301)는 다운믹스부(302)에서 다운믹스되어 다운믹스 오디오 신호를 생성한다. 또한, 공간정보발생부(303)에서 상기 멀티채널 오디오 신호(301)로부터 공간 정보가 추출되고, 추출된 상기 공간 정보를 이용하여 공간 정보 비트스트림을 생성한다. 그 다음에 비트스트림포맷터(304)에서 상기 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하도록 전체 비트스트림을 생성한다. 본 발명에 따른 인코딩 방법에서는 상기 공간 정보 비트스트림 내에 프레임별로 클리핑복원정보(Clipping Restoration Information, CRI)를 포함하고, 상기 클리핑복원정보를 이용하여 클리핑복원(Clipping Restoration)를 수행할 수 있다. 상기 인코딩 방법은 상기 클리핑복원정보가 어떠한 정보를 가지는지에 따라서 여러 가지 형태로 구현될 수 있다.
제1 인코딩 방법은 클리핑복원를 사용할 것인가 아닌가의 제1 정보를 공간 정보 비트스트림의 헤더에 가지고, 상기 제1 정보가 사용상태를 나타낼 때(즉, 사용한다는 것을 의미할 때), 프레임별로 클리핑복원정보를 상기 공간 정보 비트스트림에 포함한다. 상기 클리핑복원정보에는 클리핑복원이 필요하지 않다는 경우도 포함할 수 있으며, 클리핑된 부분의 위치정보 및 크기정보를 포함할 수 있다. 상기 제1 정보는 독립적인 신택스를 정의하고 사용할 수도 있고, 이미 가지고 있는 신택스를 확장하여(예를 들면, bsFixedGains의 예비필드(reserved field)) 사용할 수도 있다.
제2 인코딩 방법은 클리핑복원를 사용할 것인가 아닌가의 제1 정보를 공간 정보 비트스트림의 헤더에 가지고, 상기 제1 정보가 사용상태를 나타낼 때, 프레임별로 클리핑복원를 위한 데이터가 있는지 없는지에 대한 제2 정보를 표현하는 신택스를 정의하고, 상기 제2 정보가 상기 데이터가 존재한다는 것을 나타낼 때, 추가적으로 클리핑복원정보를 공간 정보 비트스트림내에 포함한다. 이 경우, 클리핑이 일어나지 않는 프레임의 빈도가 높기 때문에 정보량을 줄일 수 있다.
상기 클리핑복원정보의 예로는 다음과 같은 것이 있다. 첫 번째는 다운믹스 오디오 신호의 시간에 따른 시간포락선(Time envelope) 또는 주파수포락선(Frequency envelope) 정보의 양자화된 값을 이용하는 것이다. 일반적으로 클리핑은 허용된 최대값보다 큰 값이 나올 때 발생한다. 예를 들면, 16비트 PCM 신호이면 그 값이 32767 ~ -32768 범위에 있어야 하는데, 다운믹스 과정에서 상기 범위를 넘는 데이터 값은 잘리게 된다. 따라서 잘린 값의 정보를 보내주어야 하는데, 샘플 단위로 잘린 정보를 보내주면 정보량이 지나치게 많아진다. 정보량을 줄이기 위해, 포락선을 이용하여 잘린 정보를 보내주면 정보량이 훨씬 줄어들게 된다. 상기 포락선은 시간포락선(Time envelope) 또는 주파수포락선(Frequency envelope)을 포함할 수 있다. 두 번째는 상기 시간포락선 또는 주파수포락선을 모델링하고, 상기 모델의 파라미터를 양자화한 값을 이용하는 것이다. 예를 들면, 상기 포락선 정보를 선형예측모델링(Linear Prediction Modeling)하고, 그 계수인 선형예측계수(Linear Prediction Coefficient)를 양자화하여 보내는 것이다. 세 번째는 클리핑이 일어난 시간 위치에 대한 위치정보 또는 클리핑을 보정하기 위한 크기(즉, 게인(gain)) 정보 중 하나 이상을 이용하는 것이다. 클리핑이 아주 가끔 일어난다면, 모든 구간에 대한 정보를 보내지 않고, 상기 클리핑이 일어난 구간에 대한 시작과 끝의 정보만 보내주면 된다. 만일 복원단계에서의 시작 및 끝 정보와 복원크기 정보를 함께 사용한다면, 상기 위치정보와 게인정보를 함께 보내야 한다. 만일 복원크기가 미리 정해져 있다면(예를 들면, 클리핑이 일어난 구간은 무조건 1/2로 줄여서 압축하는 경우), 상기 복원크기 정보는 필요하지 않을 수 있다.
도 4는 본 발명에 따른 클리핑복원정보를 이용하여 클리핑을 방지하기 위한 제1 디코딩 방법을 도시한다. 도시된 것처럼, 공간 디코더(408)를 구성하는 비트스트림수신부(402)는 클리핑복원정보가 포함된 전체 비트스트림(401)을 수신하고, 상기 전체 비트스트림으로부터 다운믹스 오디오 신호와 공간 정보 비트스트림을 추출한다. 그 다음에 클리핑탐색부(403)는 상기 다운믹스 오디오 신호에서 클리핑된 부분을 찾는다. 클리핑복원정보독출부(404)는 상기 클리핑된 부분에 해당되는 클리핑복원정보를 상기 공간 정보 비트스트림으로부터 독출한다. 그 다음에 클리핑복원부(405)는 상기 클리핑복원정보를 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원한다. 멀티채널생성부(406)는 상기 공간 정보 비트스트림을 디코딩하여 얻어진 공간 정보를 이용하여 클리핑된 부분이 복원된 상기 다운믹스 오디오 신호를 멀티채널 오디오 신호(407)로 변환할 수 있다.
도 5는 본 발명에 따른 클리핑복원정보를 이용하여 클리핑을 방지하기 위한 제2 디코딩 방법을 도시한다. 도시된 것처럼, 공간 디코더(507)를 구성하는 비트스트림수신부(502)는 클리핑복원정보가 포함된 전체 비트스트림(501)을 수신하고, 상기 전체 비트스트림(501)으로부터 다운믹스 오디오 신호와 공간 정보 비트스트림을 추출한다. 그 다음에 클리핑복원정보독출부(503)는 상기 공간 정보 비트스트림으로부터 클리핑복원정보를 독출한다. 상기 클리핑복원정보는 클리핑된 부분의 위치정보 또는 클리핑복원크기정보 중 하나 이상을 포함할 수 있다. 클리핑복원부(504)는 독출된 상기 클리핑복원정보를 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원한다. 예를 들면, 상기 공간 정보 비트스트림에서 클리핑된 위치를 찾은 후에 상기 공간 정보 비트스트림으로부터 독출된 클리핑복원정보를 이용하여 클리핑된 부분을 복원하거나, 또는 상기 공간 정보 비트스트림으로부터 독출된 클리핑된 부분의 위치정보 및 클리핑복원크기정보를 이용하여 클리핑된 부분을 복원할 수 있다. 이 경우에, 클리핑된 부분을 복원하기 이전에 상기 공간 정보 비트스트림에서 클리핑복원가 필요한 구간을 찾을 수 있다. 그 다음에 멀티채널생성부(505)는 상기 공간 정보 비트스트림을 디코딩하여 얻어진 공간 정보를 이용하여 클리핑된 부분이 복원된 상기 다운믹스 오디오 신호를 멀티채널 오디오 신호(506)로 변환할 수 있다. 전체 신호에 대하여 상기 제1 인코딩 방법과 상기 제2 인코딩 방법 중에서 어느 한 가지만 사용할 수 있으며, 또한, 상기 제1 인코딩 방법과 상기 제2 인코딩 방법 중 선택기준을 두고, 프레임별로 상기 선택기준에 따라 상기 제1 인코딩 방법과 상기 제2 인코딩 방법 중 하나를 선택적으로 사용하거나, 또는 상기 두 가지 방법을 조합하여 사용할 수 있다.
도 6은 본 발명에 따른 클리핑복원정보를 이용하여 클리핑을 방지하기 위한 제3 디코딩 방법을 도시한다. 도시된 것처럼, 공간 디코더(608)를 구성하는 비트스트림수신부(602)는 전체 비트스트림(601)을 수신하고, 상기 전체 비트스트림(601) 으로부터 다운믹스 오디오 신호와 공간 정보 비트스트림을 추출한다. 그 다음에 클리핑탐색부(603)는 상기 다운믹스 오디오 신호에서 클리핑된 부분을 찾는다. 클리핑복원게인추정부(604)는 상기 클리핑된 부분에 대해 클리핑복원게인을 추정한다. 예를 들면, 상기 클리핑복원게인을 추정하기 위해 시간, 주파수 또는 기타 다른 영역에서의 분석방법을 이용할 수 있다. 구체적으로 시간축에서는 파형 분석을 통해 파형이 너무 급격하게 변하지 않고 부드럽게 변할 수 있도록 상기 클리핑복원게인을 추정할 수 있다. 그 다음에 클리핑복원부(605)는 상기 클리핑복원게인을 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원한다. 그 다음에 멀티채널생성부(606)는 상기 공간 정보 비트스트림을 디코딩하여 얻어진 공간 정보를 이용하여 클리핑된 부분이 복원된 상기 다운믹스 오디오 신호를 멀티채널 오디오 신호(607)로 변환할 수 있다. 상기 제3 디코딩 방법은 상기 제1 디코딩 방법 또는 제2 디코딩 방법과 조합하여 사용할 수 있다. 이 경우 상기 제1, 제2 또는 제3 디코딩 방법들 중 하나를 선택적으로 사용하거나, 또는, 제1 또는 제2 디코딩 방법과 상기 제3 디코딩 방법을 조합하여 사용할 수 있다.
도 7a 및 7b는 상기 제2 디코딩 방법에 대한 신택스를 도시한다. 도 7a의 (a)에 도시되는 것처럼, 클리핑복원정보는 공간 정보 비트스트림의 프레임(이하, "공간 프레임"이라 한다)내에 삽입된다. 상기 클리핑복원정보는 클리핑된 부분의 위치정보 또는 클피핑복원크기정보 중 하나 이상을 포함할 수 있다. 두 가지 정보는 다양한 실시예로 이용될 수 있다. 각각의 실시예에서, 먼저 프레임내에 클리핑이 일어났는지 여부를 먼저 확인하여야 한다. 이는 클리핑발생여부정보(즉, bsClippingPresent")를 읽어서 판단한다. 예를 들면, 상기 클리핑발생여부정보 값이 1이면 클리핑이 있다는 의미이므로 추가적인 비트를 읽어 클리핑된 부분을 복원하게 되고, 상기 클리핑발생여부정보 값이 0이면 클리핑이 없다는 의미이므로 추가적인 비트를 읽을 필요가 없다.
도 7a의 (b)는 클리핑복원정보를 이용하는 제1 실시예를 나타낸다. 여기서는 프레임을 미리 정해진 일정한 구간으로 나눈 후, 상기 구간마다 클리핑복원크기정보(즉, "bsRestorationAmp[i]")를 통해 클리핑을 복원할 크기정보를 받을 수 있다. 상기 크기정보는 시간포락선 또는 주파수포락선 크기정보를 포함할 수 있다. 예를 들면, 상기 구간마다 클리핑이 있을 수도 있고 없을 수도 있으므로, 상기 클리핑복원크기정보 값이 0이면 클리핑이 없는 것으로 사용하고, 상기 클리핑복원크기정보 값이 1~7이면 특정한 클리핑복원크기정보로 사용할 수 있다.
도 7a의 (c)는 클리핑복원정보를 이용하는 제2 실시예를 나타낸다. 여기서는 프레임내에서 클리핑이 일어나는 횟수(즉, "FixedNumber")를 미리 정한 후, 상기 횟수마다 클리핑된 부분의 위치정보(즉, "bsRestorationPos[i]) 및 클리핑복원크기정보(즉, "bsRestorationAmp[i])를 읽는다. 상기 클리핑된 부분의 위치정보 및 클리핑복원크기정보를 이용하여 클리핑된 부분을 복원할 수 있는데, 이 방법은 클리핑이 발생하는 횟수가 적은 경우에 상기 제1 실시예보다 효율적일 수 있다.
도 7b의 (d)는 클리핑복원정보를 이용하는 제3 실시예를 나타낸다. 여기서는 구간개수정보(즉, "bsNumRestoration")를 읽어서 프레임을 몇 개의 구간으로 나눌지를 결정할 수 있다. 여기서, "FixedNumber"는 상기 구간개수정보에 의해 결정되 는 값이 될 수 있다. 그 다음에 구간마다 클리핑복원크기정보(즉, "bsRestorationAmp[i]")를 통해 클리핑된 부분을 복원할 크기정보를 받아, 클리핑된 부분을 복원하는데 이용할 수 있다.
도 7b의 (e)는 클리핑복원정보를 이용하는 제4 실시예를 나타낸다. 여기서는 클리핑이 일어난 횟수를 "bsNumRestoration"를 읽어서 결정할 수 있다. 즉, 여기서 "FixedNumber"는 클리핑이 일어난 횟수를 의미하며, 상기 "bsNumRestoration"에 의해 결정될 수 있다. 그 다음에 상기 횟수마다 클리핑된 부분의 위치정보(즉, "bsRestorationPos[i]) 및 클리핑복원크기정보(즉, "bsRestorationAmp[i])를 읽는다. 상기 클리핑된 부분의 위치정보 및 클리핑복원크기정보를 이용하여 클리핑된 부분을 복원할 수 있다.
도 8은 본 발명에 따른 클리핑복원정보를 이용하는 제1 인코딩 방법에 대한 흐름도를 나타낸다. 먼저 멀티채널 오디오 신호(801)를 다운믹스(802)하여 다운믹스 오디오 신호를 생성하고, 상기 멀티채널 오디오 신호로부터 공간 정보를 추출(803)한다. 만일 클리핑복원를 사용한다면(804), 클리핑복원정보를 포함(805)하도록 공간 정보 비트스트림을 생성(806)할 수 있다. 만일 클리핑복원를 사용하지 않는다면(804), 클리핑복원정보를 포함하지 않도록 공간 정보 비트스트림을 생성(806)할 수 있다. 그 다음에 상기 다운믹스 오디오 신호 및 공간 정보를 포함하는 전체 비트스트림을 전송(807)한다.
도 9은 본 발명에 따른 클리핑복원정보를 이용하는 제2 인코딩 방법에 대한 흐름도를 나타낸다. 먼저 멀티채널 오디오 신호(901)를 다운믹스(902)하여 다운믹 스 오디오 신호를 생성하고, 상기 멀티채널 오디오 신호로부터 공간 정보를 추출(903)한다. 만일 클리핑복원를 사용한다면(904), 클리핑복원를 위한 데이터가 존재하는지 판단(905)한다. 만일 클리핑복원를 위한 데이터가 존재한다면 클리핑복원정보를 포함(906)하도록 공간 정보 비트스트림을 생성(907)한다. 만일 클리핑복원를 사용하지 않거나, 클리핑복원를 위한 데이터가 존재하지 않는다면, 클리핑복원정보를 포함하지 않도록 공간 정보 비트스트림을 생성(907)할 수 있다. 그 다음에 상기 다운믹스 오디오 신호 및 공간 정보를 포함하는 전체 비트스트림을 전송(908)한다.
도 10은 본 발명에 따른 클리핑복원정보를 이용하는 제1 디코딩 방법에 대한 흐름도이다. 먼저 다운믹스 오디오 신호 및 공간 정보를 포함하는 비트스트림을 수신(1001)하고, 상기 비트스트림으로부터 다운믹스 오디오 신호 및 공간 정보 비트스트림을 추출(1002 및 1003)한다. 그 다음에 상기 다운믹스 오디오 신호에서 클리핑된 부분을 찾는다(1004). 그 다음에 공간 정보 비트스트림으로부터 상기 클리핑된 부분에 해당하는 클리핑복원정보를 독출(1006)하고, 독출된 상기 클리핑복원정보를 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원(1005)한다. 상기 클피핑복원정보는 클리핑복원크기정보를 포함할 수 있다. 그 다음에 상기 공간 정보 비트스트림을 디코딩하여 얻어진 공간 정보를 이용하여 클리핑된 부분이 복원된 상기 다운믹스 오디오 신호를 멀티채널 오디오 신호로 변환(1007)한다.
도 11은 본 발명에 따른 클리핑복원정보를 이용하는 제2 디코딩 방법에 대한 흐름도이다. 먼저 다운믹스 오디오 신호 및 공간 정보를 포함하는 비트스트림을 수 신(1101)하고, 상기 비트스트림으로부터 다운믹스 오디오 신호 및 공간 정보 비트스트림을 추출(1102 및 1103)한다. 그 다음에 상기 공간 정보 비트스트림으로부터 클리핑된 부분에 대한 클리핑복원정보를 독출(1105)한다. 상기 클리핑복원정보는 클리핑된 부분의 위치정보 또는 클리핑복원크기정보 중 하나 이상을 포함할 수 있다. 독출된 상기 클리핑복원정보를 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원(1104)한다. 그 다음에 상기 공간 정보 비트스트림을 디코딩하여 얻어진 공간 정보를 이용하여 클리핑된 부분이 복원된 상기 다운믹스 오디오 신호를 멀티채널 오디오 신호로 변환(1106)한다.
도 12는 본 발명에 따른 클리핑복원정보를 이용하는 제3 디코딩 방법에 대한 흐름도이다. 먼저 다운믹스 오디오 신호 및 공간 정보를 포함하는 비트스트림을 수신(1201)하고, 상기 비트스트림으로부터 다운믹스 오디오 신호 및 공간 정보 비트스트림을 추출(1202 및 1203)한다. 그 다음에 상기 다운믹스 오디오 신호에서 클리핑된 부분을 찾는다(1204). 그 다음에 상기 다운믹스 오디오 신호로부터 클리핑복원게인을 추정(1205)하고, 추정된 클리핑복원게인을 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원(1206)한다. 그 다음에 상기 공간 정보 비트스트림을 디코딩하여 얻어진 공간 정보를 이용하여 클리핑된 부분이 복원된 상기 다운믹스 오디오 신호를 멀티채널 오디오 신호로 변환(1207)한다.
지금까지 본 발명에 대하여 몇몇 실시예들을 들어 구체적으로 설명하였으나, 상기 실시예들은 본 발명을 이해하기 위한 설명을 위해 제시된 것이며, 본 발명의 범위가 상기 실시예에 제한되는 것은 아니다. 당업자라면 본 발명의 기술적 사상의 범위를 벗어나지 않고도 다양한 변형이 가능함을 이해할 수 있을 것이며, 본 발명의 범위는 첨부된 특허청구범위에 의해서 해석되어야 할 것이다.
이상에서 기술된 것과 같이, 본 발명에 따른 멀티채널 오디오 신호를 코딩하는데 있어서, 클리핑복원정보를 포함하도록 비트스트림을 구성하고, 상기 클리핑복원정보를 이용하여 다운믹스 오디오 신호의 클리핑된 부분을 복원함으로써 멀티채널 오디오 신호를 다운믹스하는 과정에서 발생되는 클리핑 문제를 효과적으로 방지할 수 있다.
또한, 상기 다운믹스 오디오 신호로부터 클리핑복원게인을 추정하고, 추정된 상기 클리핑복원게인을 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원함으로써 멀티채널 오디오 신호를 다운믹스하는 과정에서 발생되는 클리핑 문제를 효과적으로 방지할 수 있다.

Claims (29)

  1. 멀티채널 오디오 신호를 인코딩하는 방법에 있어서,
    (a) 상기 멀티채널 오디오 신호를 다운믹스하여 다운믹스 오디오 신호를 생성하는 단계;
    (b) 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하는 단계; 및
    (c) 상기 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 생성하는 단계를 포함하되, 상기 공간 정보 비트스트림의 헤더내에 클리핑복원(Clipping Restoration)의 사용 여부에 관한 제1 정보를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  2. 제 1 항에 있어서,
    상기 (c)단계는,
    상기 제1 정보가 사용상태를 표시하는 경우, 상기 공간 정보 비트스트림내에 프레임별로 상기 클리핑복원정보(Clipping Restoration Information)를 포함하는 단계를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  3. 제 1 항에 있어서,
    상기 (c)단계는,
    상기 제1 정보가 사용상태를 표시하는 경우, 상기 공간 정보 비트스트림내에 프레임별로 상기 클리핑복원를 위한 데이터의 존재 여부에 관한 제2 정보를 포함하는 단계를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  4. 제 3 항에 있어서,
    상기 제2 정보가 존재상태를 표시하는 경우, 상기 공간 정보 비트스트림내에 프레임별로 상기 클리핑복원정보를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  5. 제 2 항 또는 제 4 항에 있어서,
    상기 클리핑복원정보는 상기 다운믹스 오디오 신호의 시간 포락선(Time envelope) 또는 주파수 포락선(frequency envelope) 정보인 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  6. 제 2 항 또는 제 4 항에 있어서,
    상기 클리핑복원정보는 시간 포락선(Time envelope) 또는 주파수 포락선(frequency envelope) 모델의 파라미터에 관한 정보인 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  7. 제 2 항 또는 제 4 항에 있어서,
    상기 클리핑복원정보는 클리핑이 일어난 위치정보 또는 클리핑을 보정하기 위한 게인정보 중 하나 이상을 포함하는 정보인 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  8. 멀티채널 오디오 신호로 디코딩하는 방법에 있어서,
    (a) 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 수신하는 단계;
    (b) 상기 다운믹스 오디오 신호에서 클리핑된 부분을 찾는 단계;
    (c) 상기 클리핑된 부분에 대하여 상기 공간 정보 비트스트림으로부터 클리핑복원정보를 독출하는 단계; 및
    (d) 독출된 상기 클리핑복원정보를 이용하여, 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원하는 단계;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  9. 제 8 항에 있어서,
    상기 클리핑복원정보는 상기 다운믹스 오디오 신호의 시간 포락선(Time envelope) 또는 주파수 포락선(frequency envelope) 정보인 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  10. 제 8 항에 있어서,
    상기 클리핑복원정보는 시간 포락선(Time envelope) 또는 주파수 포락 선(frequency envelope) 모델의 파라미터에 관한 정보인 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  11. 제 8 항에 있어서,
    상기 클리핑복원정보는 클리핑이 일어난 위치정보 또는 클리핑을 보정하기 위한 게인정보 중 하나 이상을 포함하는 정보인 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  12. 제 8 항에 있어서,
    상기 디코딩 방법은,
    상기 공간 정보 비트스트림으로부터 공간 정보를 추출하고, 추출된 상기 공간 정보를 이용하여 클리핑된 부분이 복원된 상기 다운믹스 오디오 신호를 멀티채널 오디오 신호로 변환하는 단계를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  13. 멀티채널 오디오 신호로 디코딩하는 방법에 있어서,
    (a) 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 수신하는 단계;
    (b) 상기 공간 정보 비트스트림으로부터 클리핑복원정보를 독출하는 단계; 및
    (c) 상기 클리핑복원정보를 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원하는 단계;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  14. 제 13 항에 있어서,
    상기 디코딩 방법은,
    상기 (b)단계 이전에, 상기 공간 정보 비트스트림으로부터 프레임별로 클리핑 존재여부에 관한 정보를 독출하는 단계를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  15. 제 13 항에 있어서,
    상기 클리핑복원정보는,
    클리핑된 부분의 클리핑복원크기정보를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  16. 제 13 항에 있어서,
    상기 클리핑복원정보는,
    상기 클리핑된 부분의 위치정보 및 클리핑복원크기정보를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  17. 제 13 항에 있어서,
    상기 클리핑복원정보는 상기 다운믹스 오디오 신호의 시간 포락선(Time envelope) 또는 주파수 포락선(frequency envelope) 정보인 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  18. 제 13항에 있어서,
    상기 클리핑복원크기정보는 시간 포락선(Time envelope) 또는 주파수 포락선(frequency envelope) 모델의 파라미터에 관한 정보인 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  19. 제 13 항에 있어서,
    상기 디코딩 방법은,
    상기 공간 정보 비트스트림으로부터 공간 정보를 추출하고, 추출된 상기 공간 정보를 이용하여 클리핑된 부분이 복원된 상기 다운믹스 오디오 신호를 멀티채널 오디오 신호로 변환하는 단계를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  20. 멀티채널 오디오 신호로 디코딩하는 방법에 있어서,
    (a) 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 수신하는 단계;
    (b) 상기 다운믹스 오디오 신호에서 클리핑된 부분을 찾는 단계;
    (c) 상기 클리핑된 부분에 대하여 클리핑복원게인(Clipping Restoration Gain)을 추정하는 단계; 및
    (d) 추정된 상기 클리핑복원게인을 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원하는 단계;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  21. 제 19 항에 있어서,
    상기 클리핑복원게인은 시간 포락선 또는 주파수 포락선을 이용하여 추정되는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  22. 제 20 항에 있어서,
    상기 디코딩 방법은,
    상기 공간 정보 비트스트림으로부터 공간 정보를 추출하고, 추출된 상기 공간 정보를 이용하여 클리핑된 부분이 복원된 상기 다운믹스 오디오 신호를 멀티채널 오디오 신호로 변환하는 단계를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  23. 멀티채널 오디오 신호로 디코딩하는 방법에 있어서,
    (a) 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하는 전체 비트스 트림을 수신하는 단계;
    (b) 상기 공간 정보 비트스트림으로부터 프레임별로 클리핑복원정보의 독출방법을 선택하는 단계;
    (c) 선택된 상기 독출방법을 이용하여 상기 공간 정보 비트스트림으로부터 클리핑복원정보를 독출하는 단계; 및
    (d) 독출된 상기 클리핑복원정보를 이용하여, 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원하는 단계;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  24. 제 23 항에 있어서,
    상기 클리핑복원정보의 독출방법은,
    상기 다운믹스 오디오 신호에서 클리핑된 부분을 찾은 후에 상기 공간 정보 비트스트림으로부터 클리핑복원정보를 독출하는 방법, 상기 공간 정보 비트스트림으로부터 클리핑된 부분의 위치정보 및 크기정보를 포함하는 클리핑복원정보를 독출하는 방법, 또는 상기 다운믹스 오디오 신호에서 클리핑된 부분을 찾은 후에 클리핑복원게인을 추정하는 방법 중에서 하나를 선택하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  25. 오디오 신호를 생성함에 있어서,
    상기 오디오 신호는 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함 하도록 생성하되,
    상기 공간 정보 비트스트림내에 클리핑복원정보를 포함하도록 생성되는 것을 특징으로 하는, 오디오 신호의 생성방법.
  26. 멀티채널 오디오 신호의 인코딩 장치에 있어서,
    (a) 상기 멀티채널 오디오 신호를 다운믹스하여 다운믹스 오디오 신호를 생성하는 다운믹스부;
    (b) 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하는 공간정보발생부; 및
    (c) 상기 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하도록 전체 비트스트림을 생성하는 비트스트림포맷터를 포함하되, 상기 공간 정보 비트스트림내에 클리핑복원정보(Guided Clipping Restoration Information)를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 장치.
  27. 멀티채널 오디오 신호의 디코딩 장치에 있어서,
    (a) 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 수신하는 비트스트림수신부;
    (b) 상기 다운믹스 오디오 신호에서 클리핑된 부분을 찾는 클리핑탐색부;
    (c) 상기 클리핑된 부분에 대하여 상기 공간 정보 비트스트림으로부터 클리핑복원정보를 독출하는 클리핑복원정보독출부; 및
    (d) 독출된 상기 클리핑복원정보를 이용하여, 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원하는 클리핑복원부;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 디코딩 장치.
  28. 멀티채널 오디오 신호의 디코딩 장치에 있어서,
    (a) 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 수신하는 비트스트림수신부;
    (b) 상기 공간 정보 비트스트림으로부터 클리핑된 부분의 위치정보 및 클리핑복원정보를 독출하는 클리핑복원정보독출부; 및
    (c) 상기 위치정보 및 클리핑복원정보를 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원하는 클리핑복원부;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  29. 멀티채널 오디오 신호의 디코딩 장치에 있어서,
    (a) 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 수신하는 비트스트림수신부;
    (b) 상기 다운믹스 오디오 신호에서 클리핑된 부분을 찾는 클리핑탐색부;
    (c) 상기 클리핑된 부분에 대하여 클리핑복원게인(Clipping Restoration Gain)을 추정하는 클리핑복원게인추정부; 및
    (d) 추정된 상기 클리핑복원게인을 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원하는 클리핑복원부;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 디코딩 장치.
KR1020060030672A 2005-06-30 2006-04-04 멀티채널 오디오 코딩에서 클리핑복원정보를 이용한 클리핑복원방법 KR20070003546A (ko)

Applications Claiming Priority (14)

Application Number Priority Date Filing Date Title
US69500705P 2005-06-30 2005-06-30
US60/695,007 2005-06-30
US74860805P 2005-12-09 2005-12-09
US60/748,608 2005-12-09
US75700406P 2006-01-09 2006-01-09
US60/757,004 2006-01-09
US75823606P 2006-01-12 2006-01-12
US60/758,236 2006-01-12
US75860906P 2006-01-13 2006-01-13
US60/758,609 2006-01-13
US75962306P 2006-01-18 2006-01-18
US60/759,623 2006-01-18
US76035906P 2006-01-20 2006-01-20
US60/760,359 2006-01-20

Publications (1)

Publication Number Publication Date
KR20070003546A true KR20070003546A (ko) 2007-01-05

Family

ID=37870364

Family Applications (5)

Application Number Title Priority Date Filing Date
KR1020060030673A KR20070003547A (ko) 2005-06-30 2006-04-04 소프트클리핑에 의한 멀티채널 오디오 코딩에서의 클리핑복원방법
KR1020060030653A KR20070003544A (ko) 2005-06-30 2006-04-04 아비트러리다운믹스게인을 이용한 클리핑복원
KR1020060030652A KR20070003543A (ko) 2005-06-30 2006-04-04 레지듀얼 코딩에 의한 클리핑복원
KR1020060030672A KR20070003546A (ko) 2005-06-30 2006-04-04 멀티채널 오디오 코딩에서 클리핑복원정보를 이용한 클리핑복원방법
KR1020060030671A KR20070003545A (ko) 2005-06-30 2006-04-04 멀티채널 오디오 코딩에서 클리핑 복원방법

Family Applications Before (3)

Application Number Title Priority Date Filing Date
KR1020060030673A KR20070003547A (ko) 2005-06-30 2006-04-04 소프트클리핑에 의한 멀티채널 오디오 코딩에서의 클리핑복원방법
KR1020060030653A KR20070003544A (ko) 2005-06-30 2006-04-04 아비트러리다운믹스게인을 이용한 클리핑복원
KR1020060030652A KR20070003543A (ko) 2005-06-30 2006-04-04 레지듀얼 코딩에 의한 클리핑복원

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020060030671A KR20070003545A (ko) 2005-06-30 2006-04-04 멀티채널 오디오 코딩에서 클리핑 복원방법

Country Status (1)

Country Link
KR (5) KR20070003547A (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101614160B1 (ko) 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
KR100936126B1 (ko) * 2009-05-25 2010-01-12 주식회사 이머시스 휴대기기의 음향 퀄리티를 향상시키는 장치 및 방법
CN101605111B (zh) 2009-06-25 2012-07-04 华为技术有限公司 一种削波控制的方法和装置
US9479886B2 (en) * 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
CN103795448B (zh) * 2012-10-31 2017-09-08 ***通信集团公司 接口速率的调整方法、数据处理方法、基站设备与***
CN116665683A (zh) * 2013-02-21 2023-08-29 杜比国际公司 用于参数化多声道编码的方法
CN104267259B (zh) * 2014-09-30 2017-01-18 广东电网有限责任公司电力科学研究院 电力谐波测量方法和***
CN104267257B (zh) * 2014-09-30 2017-02-01 广东电网有限责任公司电力科学研究院 基于点频滤波器的信号幅频谱检测方法和***

Also Published As

Publication number Publication date
KR20070003547A (ko) 2007-01-05
KR20070003545A (ko) 2007-01-05
KR20070003543A (ko) 2007-01-05
KR20070003544A (ko) 2007-01-05

Similar Documents

Publication Publication Date Title
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
KR101276849B1 (ko) 오디오 신호의 처리 방법 및 장치
US8804967B2 (en) Method for encoding and decoding multi-channel audio signal and apparatus thereof
KR101455915B1 (ko) 일반 오디오 및 음성 프레임을 포함하는 오디오 신호용 디코더
KR20070003546A (ko) 멀티채널 오디오 코딩에서 클리핑복원정보를 이용한 클리핑복원방법
KR20070003594A (ko) 멀티채널 오디오 신호에서 클리핑된 신호의 복원방법
KR20110036023A (ko) 부가정보 비트스트림 변환을 포함하는 다양한 채널로 구성된 다객체 오디오 신호의 부호화 및 복호화 장치 및 방법
US20080288263A1 (en) Method and Apparatus for Encoding/Decoding
EP1999745B1 (en) Apparatuses and methods for processing an audio signal
KR102288111B1 (ko) 스테레오 신호의 인코딩 및 디코딩 방법과, 인코딩 및 디코딩 장치
AU2007218453B2 (en) Method and apparatus for processing an audio signal
KR20070075237A (ko) 멀티채널 오디오 신호의 인코딩 및 디코딩 방법
KR20070108313A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination