KR100871999B1 - 오디오 코딩 - Google Patents

오디오 코딩 Download PDF

Info

Publication number
KR100871999B1
KR100871999B1 KR1020037000276A KR20037000276A KR100871999B1 KR 100871999 B1 KR100871999 B1 KR 100871999B1 KR 1020037000276 A KR1020037000276 A KR 1020037000276A KR 20037000276 A KR20037000276 A KR 20037000276A KR 100871999 B1 KR100871999 B1 KR 100871999B1
Authority
KR
South Korea
Prior art keywords
signal
encoded
noise filling
audio
frequency band
Prior art date
Application number
KR1020037000276A
Other languages
English (en)
Other versions
KR20030014752A (ko
Inventor
타오리라케시
제이. 디. 이. 반데파르스티븐엘.
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20030014752A publication Critical patent/KR20030014752A/ko
Application granted granted Critical
Publication of KR100871999B1 publication Critical patent/KR100871999B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

본 발명은 오디오 인코딩 방법들에 관한 것으로, 보다 상세하게는 청취할 수는 있지만 지각적으로 관련이 적은 원 오디오 신호로부터 선택된 정보의 주파수 대역들은 인코딩될 필요가 없고, 잡음 채움 파라미터로 대체될 수 있는 효율적인 수단에 관한 것이다. 지각적으로 보다 관련이 많은 콘텐트를 갖는 신호 대역들은 대조적으로 완전히 인코딩된다. 인코딩 비트들은 수신된 신호의 주파수 스펙트럼 내에 빈 공간들을 남기지 않고 이러한 방식으로 절약될 수 있다. 이러한 방식으로, 본 방법은 전 대역폭 오디오가 각 주파수 대역 내의 신호를 나타내기에는 너무 낮은 비트 버짓으로 인코딩될 때 발생할 수 있는 성가신 대역폭 스위칭 아티팩트들을 피하게 된다. 따라서, 이러한 방법은 성가신 대역폭 스위칭 아티팩트들을 도입하지 않고 인코딩된 오디오 대역폭의 증가를 허용한다. 잡음 채움 파라미터는 해당 대역 내의 RMS 신호 값의 척도이고, 해당 주파수 대역에 삽입되는 잡음의 양을 나타내기 위하여 디코딩 알고리즘에 의해 수신단에서 사용된다.
양자화 레벨, 주파수 대역, 파라미터, 인코딩, 잡음

Description

오디오 코딩{Audio coding}
본 발명은 오디오 코딩에 관한 것이다.
종래 기술에 있어서, 많은 음성 및 음악 코딩 기술들이 개시되어 있다. 오디오 코딩을 위한 알려진 기술들 중에서 적응형 비트 할당(adaptive bit allocation)을 이용하는 변환 기반 오디오 코딩 시스템들이 있다. 이러한 적응형 비트 할당 시스템들에서, 주어진 이용 가능한 비트 버짓(budget)하의 인코딩될 수 있는 대역폭은 임의의 주어진 오디오 프레임에 대한 오디오 신호의 여러 세그먼트들의 스펙트럼 구성에 따라 변화한다. 오디오 프레임은, 예를 들면 20ms 오디오 블록과 같은 오디오의 특정한 연속 블록을 의미한다. 주어진 비트 레이트에서 오디오 품질에 관하여, 모든 오디오 프레임들에 대해 최적인 인코딩된 대역폭의 단일 값을 찾는 것은 불가능하기 때문에, 프레임에서 프레임으로의 대역폭 스위칭이 발생한다. 불행하게도, 인코딩된 대역폭의 스위칭은 종종 성가신 아티팩트들(annoying artefacts)을 도입할 수 있다.
일부 현재의 방법들에 있어서, 높은 비트 레이트에서, 전(full) 오디오 대역폭(여기서는 44.1kHz의 샘플링 레이트에 대응하는 22.04kHz인 것으로 가정됨)이 인코딩되어 재구성된다. 그러나, 낮은 비트 레이트에서, 전 대역폭을 인코딩하려는 시도가 이루어지는 경우, 왜곡이 증가한다. 어떤 점에서, 오디오 대역폭을 특정량 만큼 감소시키고, 비트들을 재할당하여 감소된 대역폭을 보다 정확한 형식으로 인코딩함으로써, 그에 따라 비록 제한된 주파수 범위에 걸쳐서 이기는 하지만 아티팩트들을 감소시키는 것이 타당하다. 예를 들면, MPEG-1 층 3 코더들(MP3 코더들)에서, 원하는 비트 레이트들이 32KBPS로 낮아질 때 대역폭은 (약 11kHz로) 반감된다. 또한, AAC는 비트 레이트들이 점점 감소될 때 대역폭을 감소시킨다. 이는 계충화된 코딩 방법들을 사용함으로써 달성되고, 그에 따라 높은 주파수들을 나타내는 층들이 먼저 탈락(drop)된다. 따라서, 신호 대역폭을 감소시키는 것은 파형 코더들에서 통상적으로 채택되는 해결책이다.
WO 97/31367(AT&T사)는 음성을 코딩하기 위해 LPC(선형 예측 코딩) 및 별도의 피치 추출기(pitch extractor)를 사용하는 음성 코더를 개시하고 있다. 잔류물(residue)은 변환 코더에 의해 연속적으로 인코딩된다. 잔류물의 코딩에서, 이용 가능한 비트들이 거의 없으므로 특정 변환 계수들은 비트들을 전혀 얻을 수 없어, 0으로 설정되는 일이 발생할 수 있다. 잔류물의 코딩이 발생하는 경우, 이러한 잔류물 정보에 대해 잡음 채움(noise filling)이 수행되지만, 해당 대역들에는 주요 부분에 대해 사용된 특정 LPC 코딩 방법 이외의 방법들을 인에이블하기 위한 임의의 독립적으로 디코딩될 수 있는 정보가 제공되지 않는다. 더욱이, 이러한 잡음 채움 알고리즘은 입력 신호 자체의 레벨들에 대해 체계적인 기준으로 수행되지 않고, 잔류물에 대해서만 수행되어 다양한 결과들이 얻어진다.
본 발명의 실시예들의 목표는 스위칭 아티팩트들을 피하기 위해 필요한 안전한 어림값(conservative value)으로 인코딩 대역폭을 제한하지 않고 대역폭 스위칭 문제에 의해 유발된 아티팩트들 도입의 문제를 감소시키는 것이다.
본 발명의 제 1 양상에 따라, 신호를 복수의 주파수 대역들로 분할하는 단계; 복수의 주파수 분할된 대역들 내 신호의 진폭들을 각 임계값들과 비교하는 단계; 및 특정 주파수 대역 내 신호의 진폭이 그 대역 각자의 임계값을 최대량만큼 초과하는 주파수 대역들이 주어진 코딩 방식에 따라 코딩되도록, 우선 순위에 기초하여 분할된 주파수 대역들의 신호를 코딩하는 단계를 포함하고, 다른 주파수 대역들에 대해서는 잡음 채움 파라미터가 선택적으로 할당되는 오디오 신호 코딩 방법이 제공된다.
제 1 양상의 방법은 덜 중요한 대역들의 잡음 채움이 중요한 대역들에 대해 사용된 인코딩 방법과 비교적 독립적인 방식으로 행해질 수 있다는 점에서 특정한 장점들을 갖는다. 즉, 잡음 채움 원리는 대부분의 인코딩 방법들에 적용될 수 있다.
이 방법은 시간 프레임당 고정된 비트 버짓으로 동작하는 인코딩 방법들에 특히 효율적이다. 그러한 경우들에서, 비트 버짓은, 완전한 오디오 대역폭 신호를 완전히 인코딩하기에는 남아있는 비트들이 너무 적을 때 나머지 비트들이 인코딩되지 않고 지각적으로 관련이 적은 대역들에 잡음 채움 파라미터들을 제공하기 위해 이용되도록, 적은 비트들이 예약되는 우선 순위로 할당된다.
바람직하게는, 주어진 주파수 대역에 대한 임계값은 사이코-음향 모델에 따른 해당 대역에 대해 인간의 청력이 그 이상에서 잡음을 지각할 수 있고, 그 이하에서 지각할 수 없다.
비트 버짓이 가변적이어야 되지만, 미리 결정된 양 이상 만큼 임계값을 초과하는 진폭들을 갖는 주파수 대역들만이 인코딩되는, 몇몇 방법들이 관찰될 수도 있다.
임의의 사이코-음향 모델은 단지 평균적인 청취자의 청취 능력을 표시하기 때문에, 고품질 방법들은 일부 대역들이 임계값 미만의 신호 진폭 레벨을 갖더라도 완전히 인코딩될 수 있는 경우에 관찰될 수 있다. 동등하게, 품질의 손실이 허용될 수 있는 경우-각 임계값 레벨보다 약간 높은 신호 진폭들을 갖는 일부 대역들의 코딩이 허용될 수 있는 경우-에 보다 효율적인 방법들이 구현될 수 있다. 따라서, 상술된 미리 결정된 양이 바람직하게는 0인 한, 그것은 약간 양의 값이거나 또는 약간 음의 값일 수 있다.
바람직하게는, 주어진 주파수 대역의 신호의 진폭이 각 임계값을 미리 결정된 양만큼 초과하지 않는 각 주파수 대역에 단일 잡음 채움 파라미터가 할당된다.
바람직하게는, 잡음 채움 파라미터는 각 주파수 대역에 삽입될 잡음의 크기 표시를 포함한다.
주파수 대역과 직접 연관되도록 이러한 크기 표시를 제공하는 것은 고도로 효율적인 잡음 채움 동작이 수행될 수 있도록 하고-이것은 항상 크기 표시가 용이하게 검색될 수 있는 위치에서, 즉, 그 대역에 대한 신호 정보가 통상적으로 발견될 수 있는 지점에서 인코딩되는 경우이다.
바람직하게, 크기 표시는 각 주파수 대역에 걸쳐 수신된 오디오 신호의 평균 진폭을 나타내는 RMS 값을 포함한다.
바람직하게, 잡음 채움 파라미터가 할당되는 주파수 대역들에 대해, 잡음 채움 파라미터가 인코딩되어, 잡음 채움 파라미터가 존재하지 않으면 인코딩된 신호 정보가 존재하게 될 출력 신호의 위치에 제공된다.
바람직하게, 잡음 채움 파라미터가 존재하는지 또는 인코딩된 신호 정보가 존재하는지의 여부를 나타내기 위해 각 대역과 연관된 식별자가 제공된다.
바람직하게, 식별자는 인코딩된 신호 정보의 양자화 레벨들의 개수를 나타내기 위해 통상적으로 사용되는 파라미터이다.
식별자가 양자화 레벨들의 개수가 0임을 나타내면, 이것은 인코딩된 신호 정보보다는 잡음 채움 파라미터가 각 대역에 대해 포함되는 것을 의미하는 것으로서 해석될 수 있다.
본 발명의 제 2 양상에 따라, 코딩된 오디오 신호를 수신하는 단계; 코딩된 신호의 주어진 주파수 대역에 대해, 수신된 신호가 주어진 주파수 대역 내에 전송된 신호의 진폭에 관한 인코딩된 신호 정보를 포함하는지 또는 잡음 채움 파라미터를 포함하는지의 여부를 결정하는 단계; 수신된 신호가 인코딩된 신호 정보를 포함하는 경우, 그 주파수 대역에 대한 출력 오디오 신호 부분을 생성하기 위해 정보를 디코딩하는 단계; 및 수신된 신호가 잡음 채움 파라미터를 포함하는 경우, 그 주파수 대역의 주파수 범위에 걸쳐 잡음 신호를 잡음 채움 파라미터에 의해 지시된 진폭으로 출력함으로써 그 주파수 대역에 대한 출력 오디오 신호 부분을 합성하는 단계를 포함하는, 신호가 제 1 양상의 방법에 따라 인코딩된 경우의 신호 디코딩 방법이 제공된다.
제 3 양상에 따라, 신호를 복수의 주파수 대역들로 분할하기 위한 분할 수단; 복수의 주파수 분할된 대역들 내 신호의 진폭들을 각 임계값들과 비교하기 위한 비교 수단; 및 특정 주파수 대역 내 신호의 진폭이 각 그 대역 각자의 임계값을 최대량만큼 초과하는 주파수 대역들이 주어진 코딩 방식에 따라 코딩되도록, 우선 순위에 기초하여 분할된 주파수 대역들의 신호를 코딩하기 위한 코더를 포함하고, 다른 주파수 대역들에 대해 잡음 채움 파라미터가 선택적으로 할당되는 것을 특징으로 하는, 입력 신호를 코딩하도록 구성된 오디오 코딩 장치가 제공된다.
본 발명의 제 4 양상에 따라, 코딩된 오디오 신호를 수신하기 위한 수신 수단; 코딩된 신호의 주어진 주파수 대역에 대해, 수신된 신호가 주어진 주파수 대역 내에 전송된 신호의 진폭에 관한 인코딩된 신호 정보를 포함하는지 또는 잡음 채움 파라미터를 포함하는지의 여부를 결정하도록 구성된 처리 수단; 수신된 신호가 인코딩된 신호 정보를 포함하는 경우, 그 주파수 대역에 대한 출력 오디오 신호 부분을 생성하기 위해 정보를 디코딩하기 위한 제 1 디코딩 수단; 및 수신된 신호가 잡음 채움 파라미터를 포함하는 경우, 그 주파수 대역의 주파수 범위에 걸쳐 잡음 신호를 잡음 채움 파라미터에 의해 지시된 진폭으로 출력함으로써 그 주파수 대역에 대해 출력 오디오 신호 부분을 합성하기 위한 제 2 디코딩 수단을 포함하는, 인코딩된 오디오 신호를 디코딩하기 위한 오디오 디코딩 장치가 제공된다.
본 발명의 제 5 양상에 따라, 인코딩된 오디오 신호로서, 신호가 다수의 주 파수 대역들로 분할되고, 제 1 복수의 상기 주파수 대역들은 주어진 코딩 방식에 따라 코딩되는 인코딩된 신호 정보를 포함하고, 제 2 복수의 주파수 대역들은 잡음 채움 파라미터를 포함하는, 상기 인코딩된 오디오 신호가 제공된다.
본 발명의 제 6 양상에 따라, 제 5 양상에 따른 인코딩된 오디오 신호가 저장되는 저장 매체가 제공된다.
본 발명을 보다 잘 이해하고, 본 발명의 실시예들이 어떻게 효과적으로 수행될 수 있는지 보여주기 위해, 이하 예로서 수반되는 도면들을 참조하게 될 것이다.
도 1은 전형적인 오디오 세그먼트의 주파수 집중(build-up) 및 마스킹 임계값을 도시하는 도면.
도 2는 도 1과 동일한 신호로, 지각적으로 덜 중요한 주파수 대역들을 음영으로 도시하는 도면.
도 3은 본 발명의 일 실시예에 따른 오디오 인코딩 방법을 예시하는 블록도.
도 4는 본 발명의 일 실시예에 따른 오디오 디코딩 방법을 예시하는 블록도.
도 5는 오디오 코더 및 디코더를 포함하는 장치의 개략 블록도.
도 1을 참조하면, 통상의 오디오 세그먼트 집중의 양식화된 도면이 도시되며, 여기서, 진폭(a)은 주파수 f의 함수로서 주어진다. 이 도면에서 각각의 막대는 전체 신호의 주파수 대역(또는 주파수 빈(bin))을 나타낸다. 통상적으로, 오디오 신호들을 인코딩하는 변환 코더들은 수신된 오디오 신호를 이러한 주파수 대역 들에 따라 분할한다.
대쉬로 나타낸 곡선은 마스킹 임계값을 나타낸다. 이러한 마스킹 임계값은 청취자가 잡음을 지각하지 못한 채 오디오 신호에 도입될 수 있고, 사이코-음향 모델링에 의해 결정될 수 있는 양자화 잡음의 레벨을 나타낸다.
임의의 종래 코딩 방법은 특정 제약 사항들을 가질 것이다. 예를 들면, 제 1 코딩 방법은 각각의 주파수 대역을 포함하는 전체 신호를 취하고, 각 대역에 가변적인 수의 비트들을 할당하여 신호를 완전히 코딩하며, 가장 큰 진폭 신호를 갖는 주파수 대역에는 대부분의 비트들이 할당되고, 가장 낮은 진폭 신호들에는 가장 적은 수의 비트들이 할당된다. 다른 방법들은, 인코딩을 위한 전체 고정 비트 버짓을 가질 수도 있고, 사이코-음향 모델에 따라 가장 의미있게 지각되는 주파수 대역들에 먼저 비트들을 할당할 수도 있다.
전자의 코딩 방법은, 비트 버짓이 가변적이고, 전달할 신호 정보의 양이 중요한 신호 구간들에 대해, 각 시간 프레임 동안 전송될 전체 정보가 매우 넓게 변동할 수 있는 비트 레이트 문제점에 직면할 수 있다는 점에서 불리하다. 이 점에 있어서, 이러한 방법에 대역폭 제한이 부과되는 경우, 및 가장 낮은 주파수에서 가장 높은 주파수에 기초하여 각 주파수 대역에 가변 비트 할당이 이루어지는 경우, 대역폭 제한이 부과될 필요가 있고, 이는 도 1에 대쉬로 된 수직선으로 도시된다. 여기서, 모든 대역들은 원하는 비트 레이트에 대해 충분히 정확하게 인코딩될 수 없기 때문에, 높은 주파수 신호들이 버려진다. 따라서, 이러한 대역폭 제한을 넘는 모든 대역들은, 이들 중 적어도 하나(도면에 A로 표시됨)가 분명히 마스킹 임계 값 이상임에도 불구하고, 전혀 인코딩되지 않는다.
이전의 특정 방법들에서, 도 1의 대역 A를 인코딩하기 위한 선택이 이루어지는 경우, 인코딩 대역폭은 보다 큰 값으로 일시적으로 스위칭되어야 할 것이다. 그러나, 이것은 허용되지 않고, 선행 프레임들에 사용된 대역폭과 충돌하여 스위칭 아티팩트들을 야기할 것이다.
2개의 상술된 인코딩 방법들 중 제 2 방법에 있어서, 우선 순위에 기초하여 청각적으로 보다 잘 지각할 수 있는 대역들의 인코딩은, 일부 경우들에 있어서, 어떠한 비트들도 할당되지 않은 덜 의미있는 1개 이상의 대역들(도 2에서 음영으로 나타낸 것들)을 유도한다. 그러나, 특정 주파수 대역들에 할당된 비트들이 없다는 것은 스펙트럼의 특정 부분들이 어떠한 에너지도 전혀 포함하지 않는 것을 의미하고, 주파수 스펙트럼 내의 이러한 빈 공간들(voids)은 청취자들이 거슬리는 것으로서 지각하는 신호를 생성할 수 있고, 또한 에너지를 수신하는 가장 높은 대역들은 프레임간에 변화할 수 있기 때문에 대역폭 스위칭 아티팩트들을 유발할 것이다.
본 발명의 방법들에 따라 제안된 인코딩 방법에서, 비트들은 청취자가 가장 잘 지각할 수 있는 신호들을 갖는 주파수 대역들(즉, 주어진 양만큼 마스킹 임계값을 초과하는 것들)에 우선 순위에 기초하여 할당된다. 마스킹 임계값 근처의 진폭의 신호들을 갖는 주파수 대역들에 대해서 및 비트 버짓 기반 방법에서 완전히 인코딩하기에 나머지 비트들이 불충분한 것에 대해, 해당 대역들에는 1개 이상의 잡음 채움 파라미터들이 할당된다. 대안적으로, 가변 비트 버짓이 존재하는 방법이 사용되는 경우, 미리 결정된 양 이상 만큼 마스킹 임계값을 초과하는 대역들만을 완전히 코딩하기 위한 선택이 이루어질 수 있고, 미리 결정된 양만큼 임계값을 초과하지 않는 대역들에 대해서는 잡음 채움 파라미터가 선택적으로 할당된다. 인코더 상에 부과된 특정 평균 비트 레이트를 얻기 위해 필요하다면, 이러한 미리 결정된 양은 프레임마다 변화하도록 허용될 수 있다.
도 2의 문자 B로 나타낸 주파수 대역을 고려해 보자. 여기서, 이 주파수 대역은 평균하여 마스킹 레벨 미만인 신호를 포함한다는 것을 유념해야 한다. 그러나, 그 신호의 진폭은 비교적 크고, 도 2의 주파수 대역(C)의 신호 진폭에 필적한다. 그러나, 대역 B와 C 사이의 구별은, 대역 C의 주파수 영역에서, 인간의 귀가 보다 민감하고, 따라서, 그 신호가 보다 중요하다는 것이다. 비트들의 효율적인 할당을 제공하기 위해 고정된 비트 버짓을 갖는 방법에 있어서, 보다 많은 양만큼 각 임계 레벨들을 초과하는 대역들을 우선 순위에 기초하여 인코딩함으로써 유용한 절감이 이루어질 수 있고, 완전한 인코딩을 위한 나머지 할당 가능한 비트들이 작게 되면, 대역 B와 같은 연관이 적은 나머지 대역들은 잡음 채움 파라미터를 사용하여 표현되고, 이 파라미터는 주어진 진폭에 이르기까지, 해당 주파수 대역에 걸쳐 잡음이 삽입됨을 재생단에 표시한다.
가변 비트 버짓 방법들에서, 마스킹 레벨을 미리 결정된 양만큼 초과하는 각 주파수 대역에 대해 완전한 인코딩이 발생하는 반면에, 다른 대역들에 대해 잡음 채움 파라미터들이 할당될 것이라는 결정이 내려질 수 있다.
여기서 신호 레벨이 실제로 마스킹 임계값 이하이면, 현실적으로 쓸모없고, 잡음을 삽입하여도 여전히 청취 불가능하기 때문에 어떠한 해도 없다는 것을 유념 하는 것이 중요하다. 음질 개선을 위해 잡음을 삽입할 가치가 있음을 입증하는 것은 특히 마스킹 임계값 바로 위의 주파수 빈들이다. 그러나, 본 발명의 설명은 인코딩되지 않은 모든 대역을 잡음 채움 파라미터들로 표현하고, 이들 인코딩되지 않은 대역을 제외한, 지각적으로 무관한 신호 진폭을 갖는 대역을 빈 상태로 표현하는 두 방법들을 포함한다.
상기 주어진 설명에 따라, 오디오 신호의 인코딩 방법은 이하 도 3을 참조하여 보다 상세히 기술될 것이다.
도 3에서, 다음 라벨들은 다음 단계들에 적용된다:
S1 = 시작;
S2 = 입력 신호를 N 주파수 대역들로 분할함;
S3 = C=1로 설정함;
S4 = C번째 주파수 대역의 진폭을 C번째 대역 임계 레벨과 비교함;
S5 = 대역 진폭 > 임계 진폭 ?;
S6 = YES인 경우, 주어진 코딩 방법을 사용하여 C 대역을 인코딩함;
S7 = NO인 경우, 잡음 채움 파라미터들을 삽입함;
S8 = C → C+1;
S9 = "C=N?";
S10 = 종료
이들 목적들에 대해, 가변 비트 버짓 방법을 나타내는 것으로 가정되는 도 3을 참조하면, 인코딩 모듈은 입력 신호를 수신하고, 단계 S2에서 그러한 입력 신호 를 N 주파수 대역들로 분할한다. 이어서, 각 주파수 대역에 대해 그 주파수 대역의 진폭이 각 임계값 레벨과 비교되는 반복 처리가 수행된다. 각 주파수 대역에 대한 임계 레벨은 통상적으로 상이하고, 사이코-음향 모델에 의해 주어진 임계값에 대응하고, 요구되는 코딩 효율에 의존하는 특정 오프셋을 포함할 수 있다.
상기 비교 단계 S4에 이은 단계 S5에서, 주어진 주파수 대역의 진폭이 임계 진폭보다 큰지의 여부에 의존하여 두 동작들 중 한 동작이 수행된다. 신호 진폭이 특정 대역에 대한 임계 진폭보다 큰 제 1 경우(단계 S6)에, 상기 주파수 대역의 정보는 주어진 코딩 방법을 사용하여 인코딩된다. 반면에, 단계 S7에서, 대역 진폭이 임계 진폭보다 크지 않으면, 잡음 채움 파라미터들이 코딩된 신호에 삽입된다.
각 주파수 대역은 주어진 주파수 범위를 갖고, 이상적인 임계값은 그 범위에 걸쳐 변화한다는 것을 인식해야 할 것이다. 코딩 목적상, 비교를 위해 설정되고 사용되는 임계 진폭은 실제로 특정 대역에 대해 계산된, 예를 들면, 룩업 메모리에 저장된 단일의 평균값일 것이다.
각 인코딩 또는 삽입 동작들에 이어, 단계 S8에서 카운트값이 증가되고, 단계 S9에서 모든 주파수 대역들이 인코딩되었는지의 여부가 체크된다. 카운트 값이 인코딩되어야 하는 보다 많은 주파수 대역들이 존재하는 것을 나타내면, 그 방법은 다음 주파수 대역의 신호 진폭이 상기 다음 주파수 대역에 대한 임계 레벨의 진폭과 비교되도록 진행된다. 다른 한편, 모든 주파수 대역들이 인코딩되어 있는 경우, 절차는 S10의 종료 단계로 진행되거나, 또는 보다 정확하게는, 특정 시간 프레임에 대한 절차가 완료되고, 정보의 다음 시간 프레임에 대한 인코딩 동작이 수행 될 수 있다.
시간 프레임당 고정 비트 버짓이 존재하는 시스템에서, 주파수 대역들은 우선 순위에 기초하여 인코딩된다. 즉, 임계값을 최대량만큼 초과하는 신호 진폭들을 갖는 대역들은 완전히 인코딩되는 반면, 임계값에 근접한 신호 진폭들을 갖는 대역들에는 비트 버짓에 남아있는 비트들의 수에 의존하여 잡음 채움 파라미터들이 선택적으로 할당될 수 있다.
인코딩 방법을 고려할 때, 주어진 주파수 대역들의 인코딩을 위한 특정 인코딩 방법은 임의의 수의 코딩 방법들 중의 하나일 수 있고 임의의 특정 압축 시스템으로 제한되지 않는다는 것을 이해하는 것이 중요하다. 그러나, 인코딩을 위해 이용되는 시스템은 통상적으로 적응형 예측 코딩(APC) 또는 선형 예측 코딩(LPC)의 일부 형태와 같은 어떤 종류의 예측 코더일 수 있다.
이하, 덜 중요하거나, 지각적으로 더 무관한 주파수 대역 코딩을 위해 사용될 수 있는 잡음 채움 파라미터들의 가능한 구현이 기술될 것이다.
주어진 간단한 변환 인코더에 대해, 그러한 코더의 한가지 특성은 지각적으로 가장 중요한 대역들에 비트들이 먼저 할당된다는 것이다. 결과적으로, 이미 설명한 바와 같이, 단순한 변환 인코딩 처리는 그들에 할당된 어떠한 비트들도 갖지 않는 특정 주파수 대역들을 초래할 수 있다. 그러한 변환 인코더에 관한 잡음 채움을 구현하기 위해, 전체 비트 레이트 버짓으로부터 적은 수의 비트들이, 빈 대역들을 위한 잡음 채움 파라미터들을 인코딩하기 위해 사용될 수 있다. 잡음 채움이 없었다면, 이들 대역들은 빈 대역으로 남았을 것이다. 실제로, 빈 대역이었을 각 대역 내 잡음을 기술하는데 하나의 파라미터만이 요구된다. 해당 중요한 파라미터는 그 대역에 삽입될 잡음 신호 진폭의 RMS 값이다.
스펙트럼의 도메인에 빈 대역들은 RMS 값 A를 갖는 균일한 분포로부터 발생된 랜덤한 잡음으로 채워진다.
RMS 값 A는 다음 수학식 1을 사용하여 얻는다.
Figure 112003000603297-pct00001
수학식 1에서, Xn은 고려중인 n번째 주파수 대역(또는 빈)의 샘플 값이다. RMS 값들은 1 데시벨 그리드로 양자화되고 허프만(Huffman) 코딩을 사용하여 인코딩되었다.
즉, 인코더 측에서, 잡음이 주입되어야 하는 대역에 대응하는 원 입력 샘플들 Xn이 수학식 1에 입력되고, 값 A가 계산된다. 이 값은 dB 값들로 변환되고 1dB 그리드 상으로 양자화된다. 양자화된 파라미터는 비트스트림 내로 인코딩되고 수신기에 의해 디코딩된다. 이어서, 랜덤 발생기가, 랜덤 샘플들의 예측 RMS 값(dB로)이 A의 디코딩된 값에 대응하도록, 균일한 확률 밀도 함수에 따라 랜덤 샘플들을 발생한다. 즉, 수신기 측에서, 파라미터 A에 의해 정의된 적절한 레벨에서 랜덤 잡음이 발생된다.
상기 구현에서, 허프만 코딩된 RMS 값들을 전송하기 위해 비트스트림의 일부를 사용하는 것은, 나머지 대역들의 샘플 값들을 코딩하는데 이용할 수 있는 비트들의 희생을 동반한다는 것을 유념해야 할 것이다. 그러나, 시험은, 빈 대역들을 채우기 위해 비트들이 강탈되는 이러한 시나리오를 비교하면, 지각된 결과는 대역들이 빈 채로 남아있는 상황에 대하여 개선된 것을 보여준다. 그러나, 이러한 방법은, 특정 대역들이 낮은 정확도로 인코딩된 것을 의미할 것이므로, 이는 또한 파형 인코딩된 부분의 품질이 잡음 채움 파라미터들의 인코딩을 위해 추가의 비트들을 제공함으로써 절충되지 않는 시스템을 구현하는 본 발명의 범위 내에 있다.
잡음 파라미터들은 신호 정보가 통상적으로 발견되는 지점의 위치에서 인코딩된다. 그러나, 비트스트림에서 신호 정보 대신에 잡음 파라미터가 다음에 오게될 것임을 나타내는 일부 시그널링이 디코더를 위해 필요하다. 본 발명의 방법에서, 이것은 양자화 레벨들의 개수, 예를 들면, 신호 정보의 각 빈을 저장하기 위해 사용되는 레벨들의 개수를 인코딩하는 식별자를 통해 행해질 수 있다. 양자화 레벨들의 개수가 0보다 클 때, 이는 신호 정보가 이어질 것이라는 것을 의미하고, 양자화 레벨이 0일 때, 이는 어떠한 신호 정보도 이어지지 않을 것이라는 것을 의미한다. 종래의 방법들에서, 잡음 채움이 없다면, 양자화 레벨들의 개수가 0인 식별자 다음에 빈 대역이 존재할 것이다. 이러한 방법에서, 양자화 레벨들의 개수가 0인 것은 잡음 채움 파라미터(그 자체는 지각적으로 무의미한 신호 진폭들에 대해 0일 수 있음)가 이어질 것이라는 것을 나타낸다.
이하 도 4를 참조하면, 디코딩 모듈이 도 3의 방법에 따라 인코딩된 신호를 디코딩할 수 있는 방법이 설명된다.
도 4에서, 라벨들 S1 내지 S9는 다음 용어들을 의미한다:
S1 = 시작;
S2 = N 주파수 대역들의 인코딩된 신호를 수신함;
S3 = C=1로 설정함;
S4 = C번째 인코딩된 대역이 잡음 채움 파라미터들을 포함하는가 ?
S5 = NO인 경우, 디코딩 방법에 따라 C번째 디코딩된 대역의 신호를 디코딩함;
S6 = YES인 경우, 상기 C번째 대역에 잡음 신호를 삽입함으로써 C번째 대역의 신호를 주어진 진폭으로 합성함;
S7 = C는 C+1이 됨;
S8 = C=N ?;
S10 = 종료
도 4의 단계 S2에서, N 주파수 대역들의 인코딩된 신호가 수신된다. 카운트 값은 S3에서 초기값 1로 설정되고, N 주파수 대역들의 제 1 대역에 대해, S4에서 그 대역이 잡음 채움 파라미터를 포함하는지의 여부가 결정된다.
제 1 인코딩된 주파수 대역이 잡음 채움 파라미터를 포함하면, 단계 S6에서, 상기 파라미터가 디코딩되고, 제 1 대역에 관한 출력 신호는 잡음 채움 파라미터에 의해 주어진 진폭에 잡음 신호를 제공함으로써 합성된다.
한편, 제 1 인코딩된 대역의 신호가 잡음 채움 파라미터를 포함하지 않으면, S5에서, 인코딩된 신호가 그의 특정 디코딩 방법에 따라 디코딩된다.
단계 S7에서, 카운트 값이 증가되고, 다음 인코딩 대역이 디코딩된다. 카운트 값이 S8에서, 해당 특정 시간 프레임의 모든 인코딩된 주파수 대역들이 디코딩되었다는 것을 나타내면, 디코딩 서브-루틴은 S9에서 종료된다. 보다 정확하게는, 특정 시간 프레임의 모든 신호들이 디코딩되었을 때, 디코딩 방법은 다음 시간 프레임에 대한 수신된 코딩 신호의 주파수 대역들을 디코딩하는 작업에 착수한다.
상기 설명으로부터, 지각적으로 관련이 적은 부분들이 완전히 인코딩되지는 않지만, 대신에 하나 이상의 잡음 채움 파라미터들에 의해 표시되는, 오디오 신호들을 효율적으로 인코딩하고 디코딩하는 방법이 제공되었다는 것이 인식될 것이다. 그러한 잡음 채움 파라미터들은, 주어진 진폭에서의 잡음 신호를 제공함으로써 지각적으로 무관한 신호 부분들을 합성하기 위해 알고리즘의 디코딩단에서 디코딩된다.
도 5를 참조하면, 오디오 코더(20) 및 오디오 디코더(30)를 포함하는 장치(10)가 개략적인 포맷으로 도시되어 있다.
오디오 코더(20)는, 지각적으로 관련이 적은 신호 대역들을 선택적으로 대체할 잡음 채움 파라미터들을 제공하기 위해 본 발명의 방법을 이용하고, 주어진 코딩 포맷에 따라 인입 오디오 스트림을 코딩하기 위해, 본 명세서에 상술된 오디오 코딩 방법에 따라 작동한다.
오디오 코더(20)는 분할 수단(21), 비교 수단(22) 및 코더(23)를 포함한다.
분할 수단(21)은 신호를 복수의 주파수 대역들로 분할한다. 비교 수단(22)은 복수의 주파수 분할된 대역들 내 신호의 진폭들을 각 임계값들과 비교한다. 코딩 수단(23)은, 특정 주파수 대역 내 신호의 진폭이 최대량만큼 각 임계값을 초과하는 주파수 대역들이 주어진 코딩 방법에 따라 코딩되고, 다른 주파수 대역들에는 잡음 채움 파라미터가 선택적으로 할당되도록 하는 우선 순위에 기초하여 분할된 주파수 대역들의 신호를 코딩한다.
오디오 디코더(30)는 그의 입력에서 코딩된 데이터를 수신하고 그의 출력단에 디코딩된 데이터를 제공하도록 기능한다. 디코더(30)는, 지시된 대역들을 주파수 대역 제한 잡음으로, 주어진 신호 진폭 레벨까지 소망에 따라 채우기 위해 사용될 수 있는 잡음 발생기(40)를 포함한다.
오디오 디코더(30)는 수신 수단(31), 처리 수단(32), 제 1 디코딩 수단(33) 및 제 2 디코딩 수단(34)을 더 포함한다.
수신 수단(31)은 코딩된 오디오 신호를 수신한다. 처리 수단(32)은, 코딩된 신호의 각 주어진 주파수 대역에 대해, 상기 대역이 전송된 신호의 진폭에 관한 인코딩된 신호 정보를 주어진 주파수 대역 내에 포함하는지 또는 잡음 채움 파라미터를 포함하는지의 여부를 결정한다. 처리 수단(32)이 수신된 신호가 인코딩된 신호 정보를 포함하는 것으로 결정하면, 제 1 디코딩 수단(33)은 각 주파수 대역들에 대한 출력 오디오 신호 부분을 생성하기 위해 상기 정보를 디코딩하도록 배열된다. 한편, 처리 수단(32)이 주어진 주파수 대역이 잡음 채움 파라미터를 포함하는 것으로 결정하면, 상술된 바와 같이 제 2 디코딩 수단(34)은 잡음 발생기(40)의 보조 하에 상기 주파수 대역의 주파수 범위에 걸쳐 잡음 신호를 잡음 채움 파라미터에 의해 지시된 진폭으로 출력함으로써 상기 주파수 대역에 대한 출력 신호 부분을 합성한다.
도 5는 또한 오디오 코더에 따라 인코딩된 신호가 저장되고 그로부터 오디오 디코더(30)가 오디오 신호를 재구성할 수 있는 저장 매체(50)를 도시한다.
상기로부터 명백한 바와 같이, 본 발명의 실시예들은 모든 주파수가 적어도 소정 레벨의 정확도로 주어진 수의 가용 비트들로 인코딩될 수 있음을 보증하는 안전한 어림값으로 인코딩 대역폭을 제한하지 않고, 대역폭 스위칭의 성가신 영향들을 극복하는 것을 목적으로 한다. 즉, 본 발명의 실시예들은 매우 제한된 비트 버짓을 이용하는 누구나가 직면하는 성가신 대역폭 스위칭 아티팩트들을 도입하지 않고 오디오 대역폭을 효과적으로 증가시킬 수 있도록 한다.
당분야의 숙련자들에게는, 하드웨어 소자들이 언급되는 경우, 이들은 적절한 경우에 소프트웨어 소자들로 대체될 수 있음이 명백할 것이다. 역으로, 소프트웨어 소자들이 언급되는 경우, 적절한 경우에 이들 소자는 하드웨어 등가물들로 대체될 수 있다.
잘 이해되는 바와 같이, 본 발명의 방법은 많은 상이한 유형의 일반화된 오디오 인코딩 방법들에 따라 사용될 수 있고, 이는 매우 비트 효율적이다.
상술된 실시예들은 본 발명을 제한하기보다는 오히려 예시하려는 것으로, 당업자들은 첨부된 특허 청구의 범위에서 벗어나지 않는 많은 대안적인 실시예들을 설계할 수 있다는 것을 유념해야 한다. 특허 청구의 범위에서, 괄호 안의 참조 부호는 특허 청구의 범위를 제한하는 것으로서 해석되지 않아야 한다. 단어 "포함하는"은 특허 청구의 범위에 나열된 것들 이외의 다른 소자들 또는 단계들의 존재를 배제하지 않는다. 본 발명은 여러 독특한 소자들을 포함하는 하드웨어 및 적절히 프로그램된 컴퓨터에 의해 구현될 수 있다. 여러 수단들을 열거하는 장치 청구의 범위에서, 여러 개의 이들 수단은 동일한 하드웨어 항목에 의해 구현될 수 있다. 특정 수단들이 서로 상이한 종속항들에 인용되었다는 점은 이 수단들의 조합이 유리하게 사용될 수 없다는 것을 나타내지 않는다.

Claims (23)

  1. 오디오 신호를 코딩하는 방법에 있어서,
    상기 신호를 복수의 주파수 대역들로 분할하는 단계;
    상기 복수의 주파수 분할된 대역들 내 상기 신호의 진폭들을 각 임계값들과 비교하는 단계; 및
    특정 주파수 대역 내 상기 신호의 진폭이 그 대역 각자의 임계값을 최대량만큼 초과하는 주파수 대역들이 주어진 코딩 방식에 따라 코딩되도록, 우선 순위에 기초하여 상기 분할된 주파수 대역들의 신호를 코딩하는 단계를 포함하고,
    다른 주파수 대역들에 대해서는 잡음 채움 파라미터(noise fill parameter)가 선택적으로 할당되는 것을 특징으로 하는, 오디오 신호 코딩 방법.
  2. 제 1 항에 있어서,
    주어진 주파수 대역에 대한 상기 임계값은, 사이코-음향 모델(psycho-acoustical model)에 따라 해당 대역에 대해 인간의 청력이 그 이상에서 잡음을 지각할 수 있고, 그 이하에서 지각할 수 없는 진폭인, 오디오 신호 코딩 방법.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 우선 순위는, 신호 진폭이 상기 각자의 임계값을 미리 결정된 값 이상 초과하는 주파수 대역들이 주어진 코딩 방식에 따라 코딩되도록 하지만, 상기 신호 진폭이 상기 각자의 임계값을 미리 결정된 값만큼 초과하지 않는 주파수 대역들에는 잡음 채움 파라미터가 선택적으로 할당되도록 하는, 오디오 신호 코딩 방법.
  4. 제 1 항 또는 제 2 항에 있어서,
    상기 신호 진폭이 상기 각자의 임계값 미만인 주파수 대역들에 대해, 인코딩이나 잡음 채움 파라미터의 할당이 수행되지 않는, 오디오 신호 코딩 방법.
  5. 제 1 항 또는 제 2 항에 있어서,
    상기 신호가 완전히 인코딩되지 않은 주파수 대역들 각각에 대해, 잡음 채움 파라미터가 할당되는, 오디오 신호 코딩 방법.
  6. 제 1 항 또는 제 2 항에 있어서,
    상기 주어진 코딩 방식은 고정된 비트 버짓(bit budget)을 갖고, 상기 신호 진폭이 상기 각자의 임계값을 상기 최대량만큼 초과하는 주파수 대역들의 신호들을 코딩하기 위해 우선 순위에 기초하여 비트들이 할당되고, 나머지 비트 버짓이 최소량 미만으로 떨어지면 나머지 코딩되지 않은 주파수 대역들의 신호들에는 잡음 채움 파라미터들이 할당되는, 오디오 신호 코딩 방법.
  7. 제 1 항 또는 제 2 항에 있어서,
    상기 잡음 채움 파라미터는 각 주파수 대역에 삽입될 상기 잡음의 크기 표시를 포함하는, 오디오 신호 코딩 방법.
  8. 제 1 항 또는 제 2 항에 있어서,
    상기 잡음 채움 파라미터는 상기 각 주파수 대역에 걸쳐 상기 수신된 오디오 신호의 평균 진폭을 나타내는 인코딩된 RMS 값을 포함하는, 오디오 신호 코딩 방법.
  9. 제 1 항 또는 제 2 항에 있어서,
    잡음 채움 파라미터가 할당되는 주파수 대역들에 대해, 상기 잡음 채움 파라미터가 인코딩되어, 상기 잡음 채움 파라미터가 존재하지 않으면 인코딩된 신호 정보가 존재하게 될 출력 신호의 위치에 제공되는, 오디오 신호 코딩 방법.
  10. 제 9 항에 있어서,
    잡음 채움 파라미터가 존재하는지 또는 인코딩된 신호 정보가 존재하는지의 여부를 나타내기 위해 각 대역과 연관된 식별자가 제공되는, 오디오 신호 코딩 방법.
  11. 제 10 항에 있어서,
    상기 식별자는 인코딩된 신호 정보에서 양자화 레벨들의 개수를 나타내기 위해 통상 사용되는 파라미터인, 오디오 신호 코딩 방법.
  12. 제 11 항에 있어서,
    상기 식별자가 양자화 레벨들의 개수가 0임을 나타내면, 이것은 인코딩된 신호 정보보다는 잡음 채움 파라미터가 상기 각 대역에 대해 포함되는 것을 의미하는 것으로 해석되는, 오디오 신호 코딩 방법.
  13. 제 1 항 또는 제 2 항에 따라 인코딩된 신호를 디코딩하는 방법에 있어서,
    코딩된 오디오 신호를 수신하는 단계;
    상기 코딩된 신호의 주어진 주파수 대역에 대해, 수신된 신호가 상기 주어진 주파수 대역 내에, 전송된 신호의 진폭에 관한 인코딩된 신호 정보를 포함하는지 또는 잡음 채움 파라미터를 포함하는지의 여부를 결정하는 단계;
    상기 수신된 신호가 인코딩된 신호 정보를 포함하는 경우, 상기 주파수 대역에 대한 출력 오디오 신호 부분을 생성하기 위해 상기 정보를 디코딩하는 단계; 및
    상기 수신된 신호가 잡음 채움 파라미터를 포함하는 경우, 상기 주파수 대역의 주파수 범위에 걸쳐 잡음 신호를 상기 잡음 채움 파라미터에 의해 지시된 진폭으로 출력함으로써 상기 주파수 대역에 대한 출력 오디오 신호 부분을 합성하는 단계를 포함하는, 신호 디코딩 방법.
  14. 입력 신호를 코딩하도록 구성된 오디오 코딩 장치(20)에 있어서,
    상기 신호를 복수의 주파수 대역들로 분할하는 분할 수단(21);
    상기 복수의 주파수 분할된 대역들 내 상기 신호의 진폭들을 각 임계값들과 비교하는 비교 수단(22); 및
    특정 주파수 대역 내 상기 신호의 진폭이 그 대역 각자의 임계값을 최대량만큼 초과하는 주파수 대역들이 주어진 코딩 방식에 따라 코딩되도록, 우선 순위에 기초하여 상기 분할된 주파수 대역들의 상기 신호를 코딩하는 코더(23)를 포함하고,
    다른 주파수 대역들에 대해서는 잡음 채움 파라미터가 선택적으로 할당되는 것을 특징으로 하는, 오디오 코딩 장치(20).
  15. 인코딩된 오디오 신호를 디코딩하는 오디오 디코딩 장치(30)에 있어서,
    코딩된 오디오 신호를 수신하는 수신 수단(31);
    상기 코딩된 신호의 주어진 주파수 대역에 대해, 수신된 신호가 상기 주어진 주파수 대역 내에, 전송된 신호의 진폭에 관한 인코딩된 신호 정보를 포함하는지 또는 잡음 채움 파라미터를 포함하는지의 여부를 결정하도록 구성된 처리 수단(32);
    상기 수신된 신호가 인코딩된 신호 정보를 포함하는 경우, 상기 주파수 대역에 대한 출력 오디오 신호 부분을 생성하기 위해 상기 정보를 디코딩하는 제 1 디코딩 수단(33); 및
    상기 수신된 신호가 잡음 채움 파라미터를 포함하는 경우, 상기 주파수 대역의 주파수 범위에 걸쳐 잡음 신호를 상기 잡음 채움 파라미터에 의해 표시된 진폭으로 출력함으로써 상기 주파수 대역에 대한 출력 오디오 신호 부분을 합성하는 제 2 디코딩 수단(34)을 포함하는, 오디오 디코딩 장치(30).
  16. 제 14 항에 따른 오디오 코더(20) 및/또는 제 15 항에 따른 오디오 디코더(30)를 포함하는 오디오 장치(10).
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
KR1020037000276A 2001-05-08 2002-04-18 오디오 코딩 KR100871999B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP01201689 2001-05-08
EP01201689.5 2001-05-08
PCT/IB2002/001388 WO2002091363A1 (en) 2001-05-08 2002-04-18 Audio coding

Publications (2)

Publication Number Publication Date
KR20030014752A KR20030014752A (ko) 2003-02-19
KR100871999B1 true KR100871999B1 (ko) 2008-12-05

Family

ID=8180274

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020037000276A KR100871999B1 (ko) 2001-05-08 2002-04-18 오디오 코딩

Country Status (9)

Country Link
US (1) US7483836B2 (ko)
EP (1) EP1395980B1 (ko)
JP (1) JP2004522198A (ko)
KR (1) KR100871999B1 (ko)
CN (1) CN1244904C (ko)
AT (1) ATE320651T1 (ko)
DE (1) DE60209888T2 (ko)
ES (1) ES2260426T3 (ko)
WO (1) WO2002091363A1 (ko)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003065353A1 (en) * 2002-01-30 2003-08-07 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device and methods thereof
SE527670C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
US7725324B2 (en) * 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
US7809579B2 (en) * 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
CN101107650B (zh) * 2005-01-14 2012-03-28 松下电器产业株式会社 语音切换装置及语音切换方法
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
WO2006091139A1 (en) * 2005-02-23 2006-08-31 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
KR100707186B1 (ko) * 2005-03-24 2007-04-13 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
JP2007264154A (ja) * 2006-03-28 2007-10-11 Sony Corp オーディオ信号符号化方法、オーディオ信号符号化方法のプログラム、オーディオ信号符号化方法のプログラムを記録した記録媒体及びオーディオ信号符号化装置
DK1869669T3 (da) * 2006-04-24 2008-12-01 Nero Ag Avanceret audiokodningsapparat
JP2008058667A (ja) * 2006-08-31 2008-03-13 Sony Corp 信号処理装置および方法、記録媒体、並びにプログラム
WO2008041954A1 (en) * 2006-10-06 2008-04-10 Agency For Science, Technology And Research Method for encoding, method for decoding, encoder, decoder and computer program products
JP5071479B2 (ja) 2007-07-04 2012-11-14 富士通株式会社 符号化装置、符号化方法および符号化プログラム
PT2571024E (pt) * 2007-08-27 2014-12-23 Ericsson Telefon Ab L M Frequência de transição adaptativa entre preenchimento de ruído e extensão da largura de banda
US8370133B2 (en) * 2007-08-27 2013-02-05 Telefonaktiebolaget L M Ericsson (Publ) Method and device for noise filling
JP5262171B2 (ja) 2008-02-19 2013-08-14 富士通株式会社 符号化装置、符号化方法および符号化プログラム
EP2104096B1 (en) * 2008-03-20 2020-05-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for converting an audio signal into a parameterized representation, apparatus and method for modifying a parameterized representation, apparatus and method for synthesizing a parameterized representation of an audio signal
US9276787B2 (en) 2008-03-28 2016-03-01 Qualcomm Incorporated Transmission of signaling messages using beacon signals
US8995559B2 (en) 2008-03-28 2015-03-31 Qualcomm Incorporated Signaling message transmission in a wireless communication network
EP3937167B1 (en) 2008-07-11 2023-05-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and audio decoder
PL2346029T3 (pl) 2008-07-11 2013-11-29 Fraunhofer Ges Forschung Koder sygnału audio, sposób kodowania sygnału audio i odpowiadający mu program komputerowy
BR122021003142B1 (pt) 2008-07-11 2021-11-03 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio, e fluxo de áudio
US8364471B2 (en) 2008-11-04 2013-01-29 Lg Electronics Inc. Apparatus and method for processing a time domain audio signal with a noise filling flag
KR101271430B1 (ko) * 2009-11-30 2013-06-05 한국전자통신연구원 무선 통신 시스템에서의 수신 신호 검출 방법 및 장치
CN102194457B (zh) * 2010-03-02 2013-02-27 中兴通讯股份有限公司 音频编解码方法、***及噪声水平估计方法
US9236063B2 (en) 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
WO2012037515A1 (en) 2010-09-17 2012-03-22 Xiph. Org. Methods and systems for adaptive time-frequency resolution in digital data coding
US8838442B2 (en) 2011-03-07 2014-09-16 Xiph.org Foundation Method and system for two-step spreading for tonal artifact avoidance in audio coding
US9009036B2 (en) 2011-03-07 2015-04-14 Xiph.org Foundation Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding
US9015042B2 (en) * 2011-03-07 2015-04-21 Xiph.org Foundation Methods and systems for avoiding partial collapse in multi-block audio coding
MX2013013261A (es) * 2011-05-13 2014-02-20 Samsung Electronics Co Ltd Asignacion de bits, codificacion y decodificacion de audio.
JP5986565B2 (ja) * 2011-06-09 2016-09-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
US8731949B2 (en) 2011-06-30 2014-05-20 Zte Corporation Method and system for audio encoding and decoding and method for estimating noise level
JP5416173B2 (ja) * 2011-07-07 2014-02-12 中興通訊股▲ふん▼有限公司 周波数帯コピー方法、装置及びオーディオ復号化方法、システム
CN103368682B (zh) 2012-03-29 2016-12-07 华为技术有限公司 信号编码和解码的方法和设备
CN105976824B (zh) * 2012-12-06 2021-06-08 华为技术有限公司 信号解码的方法和设备
CN110223704B (zh) * 2013-01-29 2023-09-15 弗劳恩霍夫应用研究促进协会 对音频信号的频谱执行噪声填充的装置
EP3046104B1 (en) 2013-09-16 2019-11-20 Samsung Electronics Co., Ltd. Signal encoding method and signal decoding method
KR20150032390A (ko) * 2013-09-16 2015-03-26 삼성전자주식회사 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법
KR102315920B1 (ko) * 2013-09-16 2021-10-21 삼성전자주식회사 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
US10395663B2 (en) 2014-02-17 2019-08-27 Samsung Electronics Co., Ltd. Signal encoding method and apparatus, and signal decoding method and apparatus
KR102625143B1 (ko) * 2014-02-17 2024-01-15 삼성전자주식회사 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
EP4293666A3 (en) 2014-07-28 2024-03-06 Samsung Electronics Co., Ltd. Signal encoding method and apparatus and signal decoding method and apparatus
CN105374363B (zh) * 2014-08-25 2019-06-04 广东美的集团芜湖制冷设备有限公司 音频信号编码方法和***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997031367A1 (en) * 1996-02-26 1997-08-28 At & T Corp. Multi-stage speech coder with transform coding of prediction residual signals with quantization by auditory models
WO2001006494A1 (en) * 1999-07-19 2001-01-25 Qualcomm Incorporated Method and apparatus for identifying frequency bands to compute linear phase shifts between frame prototypes in a speech coder
WO2002058052A1 (en) * 2001-01-19 2002-07-25 Koninklijke Philips Electronics N.V. Wideband signal transmission system

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
EP0551705A3 (en) * 1992-01-15 1993-08-18 Ericsson Ge Mobile Communications Inc. Method for subbandcoding using synthetic filler signals for non transmitted subbands
DE69428119T2 (de) * 1993-07-07 2002-03-21 Picturetel Corp Verringerung des hintergrundrauschens zur sprachverbesserung
US5632003A (en) * 1993-07-16 1997-05-20 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for coding method and apparatus
US5790759A (en) * 1995-09-19 1998-08-04 Lucent Technologies Inc. Perceptual noise masking measure based on synthesis filter frequency response
FR2747225B1 (fr) * 1996-04-03 1998-04-30 France Telecom Systeme de codage et systeme de decodage d'un signal, notamment d'un signal audionumerique
GB9611425D0 (en) * 1996-05-31 1996-08-07 Tracker Network Uk Ltd Digital communications
JP2995037B2 (ja) * 1997-07-04 1999-12-27 三洋電機株式会社 音声符号化復号化装置
US6144937A (en) * 1997-07-23 2000-11-07 Texas Instruments Incorporated Noise suppression of speech by signal processing including applying a transform to time domain input sequences of digital signals representing audio information
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US6195633B1 (en) * 1998-09-09 2001-02-27 Sony Corporation System and method for efficiently implementing a masking function in a psycho-acoustic modeler
US6418404B1 (en) * 1998-12-28 2002-07-09 Sony Corporation System and method for effectively implementing fixed masking thresholds in an audio encoder device
TW477119B (en) * 1999-01-28 2002-02-21 Winbond Electronics Corp Byte allocation method and device for speech synthesis
DE19959038A1 (de) * 1999-12-08 2001-06-28 Bosch Gmbh Robert Verfahren zur Dekodierung von digitalen Audiodaten
US6393338B1 (en) * 2000-03-17 2002-05-21 Tadeusz Kemnitz Apparatus and control method for accurate rotary peristaltic pump filling
US6968564B1 (en) * 2000-04-06 2005-11-22 Nielsen Media Research, Inc. Multi-band spectral audio encoding
US6801886B1 (en) * 2000-06-22 2004-10-05 Sony Corporation System and method for enhancing MPEG audio encoder quality

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997031367A1 (en) * 1996-02-26 1997-08-28 At & T Corp. Multi-stage speech coder with transform coding of prediction residual signals with quantization by auditory models
WO2001006494A1 (en) * 1999-07-19 2001-01-25 Qualcomm Incorporated Method and apparatus for identifying frequency bands to compute linear phase shifts between frame prototypes in a speech coder
WO2002058052A1 (en) * 2001-01-19 2002-07-25 Koninklijke Philips Electronics N.V. Wideband signal transmission system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Kim, SY, Improved Performance of DSBC Speech coder by subband weighting and modified bit allocation, IEICE, Vol.E74 no.10, pp.3029-3033, 1991.10.01.

Also Published As

Publication number Publication date
EP1395980A1 (en) 2004-03-10
CN1462429A (zh) 2003-12-17
EP1395980B1 (en) 2006-03-15
JP2004522198A (ja) 2004-07-22
CN1244904C (zh) 2006-03-08
DE60209888T2 (de) 2006-11-23
DE60209888D1 (de) 2006-05-11
US7483836B2 (en) 2009-01-27
ATE320651T1 (de) 2006-04-15
WO2002091363A1 (en) 2002-11-14
KR20030014752A (ko) 2003-02-19
ES2260426T3 (es) 2006-11-01
US20030061055A1 (en) 2003-03-27

Similar Documents

Publication Publication Date Title
KR100871999B1 (ko) 오디오 코딩
AU716982B2 (en) Method for signalling a noise substitution during audio signal coding
US20040186735A1 (en) Encoder programmed to add a data payload to a compressed digital audio frame
US6725192B1 (en) Audio coding and quantization method
USRE46082E1 (en) Method and apparatus for low bit rate encoding and decoding
US20030215013A1 (en) Audio encoder with adaptive short window grouping
KR20010021226A (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
KR20070037945A (ko) 오디오 신호의 부호화/복호화 방법 및 장치
US20080052085A1 (en) Sound encoder and sound decoder
WO1999053479A1 (en) Fast frame optimisation in an audio encoder
KR20080032240A (ko) 오디오 부호화 장치 및 오디오 부호화 방법
US7583804B2 (en) Music information encoding/decoding device and method
US6240379B1 (en) System and method for preventing artifacts in an audio data encoder device
US20040158472A1 (en) Method and apparatus for encoding or decoding an audio signal that is processed using multiple subbands and overlapping window functions
KR20110138367A (ko) 보조 데이터의 삽입 및 추출
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
KR100754389B1 (ko) 음성 및 오디오 신호 부호화 장치 및 방법
EP1398760A1 (en) Signaling of window switchings in a MPEG layer 3 audio data stream

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee