KR100893281B1 - 오디오 코딩을 위해 이득-적응형 양자화 및 비균일 심볼길이를 사용하는 방법 및 장치 - Google Patents

오디오 코딩을 위해 이득-적응형 양자화 및 비균일 심볼길이를 사용하는 방법 및 장치 Download PDF

Info

Publication number
KR100893281B1
KR100893281B1 KR1020017013223A KR20017013223A KR100893281B1 KR 100893281 B1 KR100893281 B1 KR 100893281B1 KR 1020017013223 A KR1020017013223 A KR 1020017013223A KR 20017013223 A KR20017013223 A KR 20017013223A KR 100893281 B1 KR100893281 B1 KR 100893281B1
Authority
KR
South Korea
Prior art keywords
components
subband
signal
component
gain
Prior art date
Application number
KR1020017013223A
Other languages
English (en)
Other versions
KR20010112434A (ko
Inventor
그랜트알렌 데이비드손
찰스 큐이토 로빈슨
마이클 미드 트루만
Original Assignee
돌비 레버러토리즈 라이쎈싱 코오포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=26968028&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR100893281(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Priority claimed from US09/349,645 external-priority patent/US6246345B1/en
Application filed by 돌비 레버러토리즈 라이쎈싱 코오포레이션 filed Critical 돌비 레버러토리즈 라이쎈싱 코오포레이션
Publication of KR20010112434A publication Critical patent/KR20010112434A/ko
Application granted granted Critical
Publication of KR100893281B1 publication Critical patent/KR100893281B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

호프만 코딩 같은 기술들은 균일한 길이 심볼들을 사용하는 다른 코딩 기술들에 의해 표시될 수 있는 비-균일 길일 심볼들을 보다 효율적으로 사용하여 디지털 오디오 신호 성분들을 표시하도록 사용될 수 있다. 불행하게도, 호프만 코딩에 의해 달성될 수 있는 코딩 효율은 코딩되어야 할 정보의 확률 밀도 함수에 의존하고 상기 호프만 코딩 처리 자체는 고려가능한 프로세싱 및 메모리 자원들을 필요로 한다. 본 발명에 따른 이득-적응형 양자화를 사용하는 코딩 처리는 호프만 코딩의 결점을 극복하면서 비균일 길이 심볼들의 장점을 실현할 수 있다. 이득-적응형 양자화에서, 부호화될 신호 성분들의 크기들이 하나 이상의 임계값들에 비교되고 비교 결과에 따라 클래스들에 위치된다. 클래스들 중 하나에 위치된 성분들의 크기들은 성분들을 분류하기 위해 사용된 임계값에 관련되는 이득 계수에 따라 수정된다. 바람직하게는, 이득 계수가 임계값만의 함수로서 표현될 수 있다. 이득-적응형 양자화는 분할-대역 오디오 코딩 시스템들의 주파수 서브밴드 신호들을 부호화하기 위해 사용될 수 있다. 캐스케이드 이득-적응형 양자화, 내부-프레임 코딩, 분할-간격 및 비-오버로딩 양자화기들을 포함하는 추가적인 특징들이 개시되어 있다.

Description

오디오 코딩을 위해 이득-적응형 양자화 및 비균일 심볼 길이를 사용하는 방법 및 장치{USING GAIN-ADAPTIVE QUANTIZATION AND NON-UNIFORM SYMBOL LENGTHS FOR AUDIO CODING}
본 발명은 일반적으로 부호화 및 복호화 신호들에 관한 것이다. 본 발명은 주파수-서브밴드 신호들이 독단적으로 코딩되는 분할-대역 부호화 및 복호화에 대해 이롭게 사용될 것이다. 특히, 본 발명은 지각 오디오 코딩 시스템에서 유용하다.
부호화 오디오 신호들을 고레벨의 본래의 품질로 전달할 수 있는 저장 매체 및 전송 채널들상에 낮은 정보 용량 조건을 부과하는 형태의 디지털 오디오 신호들을 부호화시키는 것이 지속적인 관심사항이다. 지각 코딩 시스템들은 오디오 신호내의 더 커다란 스펙트럼 성분들을 사용하는 방식으로 오디오 신호들을 부호화 및 양자화시키는 프로세스를 사용함으로서 이러한 모순적 목적을 달성하고자 합성 양자화 잡음을 마스크하거나 들을 수 없게 한다. 일반적으로, 부호화되는 신호의 싸이코어쿠스틱 마스킹 임계값 아래에 있도록 양자화 잡음 스펙트럼의 형상 및 진폭(amplitude)을 제어하는 것이 이롭다.
지각 부호화 프로세스는, 사람 청각 시스템의 임계 대역에 상응하는 대역폭 을 갖는 서브밴드 신호들을 획득하기 위해 분석 필터들의 뱅크를 오디오 신호에 적용하며, 지각 모델을 서브밴드 신호들 또는 일부 다른 범위의 오디오 신호 스펙트럼 컨텐트(content)에 적용하여 오디오 신호의 마스킹 임계값을 추정하며, 결과의 양자화 잡음이 추정된 오디오 신호의 마스킹 임계값 아래에 있도록 충분히 작은 서브밴드 신호를 양자화시키기 위한 양자화 스텝 사이즈를 설정하며, 설정된 양자화 스텝 사이즈에 따라 서브밴스 신호들을 양자화시키고, 양자화 서브밴드 신호들을 나타내는 다수의 심볼을 부호화 신호로 어셈블링하는 소위 분할-대역 부호기에 의해 실행될 것이다. 상보형 지각 복호화 프로세스는, 부호화 신호로부터 양자화 서브밴드 신호들을 추출 및 그로부터 양자화 서브밴드 신호들을 복원시키며, 양자환 서브밴드 신호들의 탈양자화 표현을 획득하고, 오리지날 오디오 신호로부터 지각적으로 구별할 수 없는 오디오 신호를 발생시키도록 합성 필터들의 뱅크를 탈양자화된 표현에 적용하는, 분할-대역 복호기에 의해 실행될 수 있다.
이러한 코딩 시스템들의 코딩 프로세스들은 각 서브밴드 신호안에 양자화 신호 요소(element)들 또는 성분들을 나타내기 위해 종종 균일한 길이 심볼을 사용한다. 불행히도, 균일한 길이 심볼들의 사용은 필요 이상의 더 높은 정보 용량을 부과한다. 필요한 정보 용량은 각 서브밴드 신호에 양자화 성분들을 나타내기 위해 비균일한 길이 심볼들을 사용함으로서 감소될 수 있다.
비균일한 길이 심볼들을 사용하는 한가지 기술은 양자화 서브밴드-신호 성분의 허프만(Huffman) 부호화 기술이다. 일반적으로, 허프만 코드 레이블은 실제 활용에서 부호화될 신호들을 나타내기 위해서 선택되었던 "트레이닝 신호(training signals)"를 사용하여 설계된다. 만일 트레이닝 신호들의 평균 확률 밀도 함수(probability density function;PDF)가 부호화된 실제 신호의 PDF에 상당히 근접하다면, 그리고 PDF가 평활하지 않다면, 허프만 코딩은 매우 양호한 코딩 이득을 제공할 수 있다.
만일 부호화된 실제 신호의 PDF가 트레이닝 신호들의 평균 PDF에 근접하지 않다면, 허프만 코딩은 코딩 이득을 실현하지 못하고 부호화 신호의 정보 용량 조건을 증가시키는 코딩 불이익을 초래할 것이다. 이러한 문제점은 서로 다른 신호 PDF들에 상응하는 다중 코드 북을 사용함으로서 최소화될 수 있다; 그러나, 코드 북을 저장하기 위한 추가적인 저장 공간이 필요하며 각 코드 북에 따라 신호를 부호화하고 그때 최상의 결과를 제공하는 하나를 선택하기 휘해서 추가적인 프로세싱이 필요하다.
어느 특징 성분값들의 PDF에 좌우되지 않는 각 서브밴드 신호내의 비균일한 길이 심볼을 사용하여 양자화 서브밴드-신호 성분들의 블럭을 나타낼 수 있으며, 최소 연산 및 메모리 자원을 사용하여 효율적으로 실행될 수 있는 코딩 기술에 대한 필요성이 존재한다.
본 발명의 목적은 분할-대역 코딩 시스템에 각 주파수 서브밴드의 서브밴드-신호 성분들과 같은 양자화 신호 성분들을 나타내기 위해 비-균일한 길이 심볼들을 사용함으로서 실현될 수 있는 이점들을 제공하는 것이다.
본 발명은 양호한 코딩 이득을 달성하기 위해서 성분값들의 특정 PDF에 좌우 되지 않으며 최소 연산과 메모리 자원을 사용하여 효율적으로 실행될 수 있는 기술을 사용하여 이러한 목적을 달성한다. 일부 활용에서, 코딩 시스템들은 허프만 코딩과 같은 다른 기술들에 관련하여 본 발명의 특징들을 사용할 것이다.
본 발명의 일 태양의 교시에 따라, 입력 신호를 코딩하는 방법은 입력 신호를 수신하고 상기 입력 신호의 주파수 서브밴드를 나타내는 서브밴드-신호 성분들의 서브밴드-신호 블럭을 생성시키는 단계; 상기 서브밴드-신호 블럭의 성분들의 크기(magnitude)들을 임계값과 비교하며, 각 성분을 성분 크기에 따라 2개 이상의 클래스중 하나에 위치시키고, 이득 계수를 획득하는 단계; 상기 서브밴드-신호 블럭의 소정의 성분들의 크기들을 수정하기 위해서 상기 클래스들중 하나에 위치된 성분들에 상기 이득 계수를 적용하는 단계; 상기 서브밴드-신호 블럭의 상기 성분들을 양자화하는 단계; 및 상기 성분들의 분류를 전송하는 제어 정보 및 양자화 서브밴드-신호 성분들을 나타내는 비-균일 길이 심볼들을 부호화 신호로 어셈블링하는 단계를 포함한다.
본 발명의 다른 태양의 교시에 따라, 부호화 신호를 복호화하기 위한 방법은 부호화 신호를 수신하며 그로부터 제어 정보 및 비-균일 길이 심볼들을 획득하고, 상기 비-균일 길이 심볼들로부터 입력 신호의 주파수 서브밴드를 나타내는 양자화 서브밴드-신호 성분들을 획득하는 단계; 서브밴드-신호 탈양자화 성분들을 획득하기 위해 서브밴드-신호 성분들을 탈양자화시키는 단계; 상기 제어 정보에 따라 소정의 탈양자화 성분들의 크기들을 수정하기 위해 이득 계수를 적용하는 단계; 및 상기 서브밴드-신호 탈양자화 성분들에 응답하여 출력 신호를 발생시키는 단계를 포함한다.
이러한 방법들은 본 발명을 수행하기 위한 장치에 의해 실행될 수 있는 프로그램 명령어로서 매체에 구현될 것이다.
본 발명의 또 다른 태양의 교시에 따라, 입력 신호를 부호화하기 위한 장치는 상기 입력 신호를 수신하는 입력을 가지며 상기 입력 신호의 주파수 서브밴드를 나타내는 서브밴드-신호 성분들의 서브밴드-신호 블럭을 통해 제공되는 출력을 가지는 분석 필터; 상기 서브밴드-신호 블럭의 성분들의 크기들을 임계값과 비교하고, 성분 크기에 따라 각 성분들을 2개 이상의 클래스들중 하나에 위치시키며, 이득 계수를 획득하는 상기 분석 필터에 결합된 서브밴드-신호 블럭 애널라이저; 상기 서브밴드-신호 블럭의 소정의 성분들의 크기들을 수정하기 위하여 상기 이득 계수를 상기 클래스들중 하나에 위치시킨 상기 성분에 적용하는 상기 서브밴드-신호 블럭 애널라이저에 결합된 서브밴드-신호 성분 프로세서; 상기 이득 계수에 따라 수정된 크기들을 갖는 상기 서브밴드-신호 블럭의 상기 성분들을 양자화시키는 상기 서브밴드-신호 프로세서에 결합된 제 1 양자화기; 및 상기 양자화 서브밴드-신호 성분들을 나타내는 비-균일 길이 심볼들 및 상기 성분들의 분류를 전송하는 제어 정보를 부호화 신호로 어셈블링하는 제 1 양자화기에 결합된 포맷터를 포함한다.
본 발명의 또 다른 태양의 교시에 따라, 부호화 신호를 복호화하기 위한 장치에 있어서, 상기 장치는 상기 부호화 신호를 수신하며 이로부터 제어 정보 및 비-균일 길이 심볼들을 획득하고, 상기 비-균일 길이 심볼들로부터 양자화 서브밴 드-신호 길이 심볼들로부터 양자화 서브밴드-신호 성분들을 획득하는 디포맷터; 제 1 탈양자화 성분들을 획득하기 위해 상기 제어 정보에 따라 상기 블럭의 소정의 상기 서브밴드-신호 성분들을 탈양자화하는 상기 디포맷터에 결합된 제 1 탈양자화기; 상기 제어 정보에 따라 상기 서브밴드-신호 블럭의 소정의 제 1 탈양자화 성분들의 크기들을 수정하기 위해 이득 계수를 적용하는 상기 제 1 탈양자화기에 결합된 서브밴드-신호 블럭 프로세서; 및 상기 서브밴드-신호 프로세서에 결합된 입력을 가지며 출력 신호가 제공되는 출력을 가지는 합성 필터를 포함한다.
본 발명의 또 다른 태양의 교시에 따라, 매체는 (1)오디오 신호의 주파수 서브밴드를 나타내는 서브밴드 신호 블럭의 요소에 상응하여 양자화 서브밴드-신호 성분들을 나타내는 비-균일 길이 심볼들; (2)상기 상응하는 서브밴드-신호 블럭 요소의 크기들에 따라 상기 양자화 서브밴드-신호 성분들의 분류를 가리키는 제어 정보; 및 (3)상기 제어 정보에 따라 상기 양자화 서브밴드-신호 성분들의 크기들에 적합한 이득 계수의 표시를 전송한다.
본 발명의 다양한 특징 및 그 바람직한 실시예들은 하기의 설명 및 유사한 참조 번호들이 몇개의 도면에서 유사한 요소를 참조하는 첨부 도면을 참조함으로서 잘 이해될 것이다. 하기 설명의 내용들 및 도면들은 단지 예로서 진술되어 있으며 본 발명의 범위에 대해 제한을 가하는 것으로 이해되지 말아야 한다.
도 1은 이득-적응형 양자화를 채용하는 분할-대역 부호기의 블럭도.
도 2는 이득-적응형 탈양자화를 채용하는 분할-대역 복호기의 블럭도.
도 3은 반복 비트-할당 프로세스의 단계를 도시하는 순서도.
도 4 및 도 5는 서브밴드 신호 성분들의 가상 블럭들과 이득을 성분들에 적용한 결과의 그래픽도.
도 6은 이득-적응형 양자화용 캐스캐이스형 이득단의 블럭도.
도 7 및 도 8은 양자화 함수들의 그래픽도.
도 9A 내지 9C는 맵핑 변환을 사용하여 어떻게 분할-간격 양자화 함수가 구현될 수 있는 가를 도시한다.
도 10 내지 12는 양자화 함수들의 그래픽도.
도 13은 본 발명의 다양한 태양을 수행하기 위해 사용될 수 있는 장치의 블럭도.
A. 코딩 시스템
본 발명은 오디오 정보와 같은 양자화 정보를 나타내는 효율성을 개선시키는 쪽으로 진행되며 분할-대역 부호기 및 분할-대역 복호기를 사용하는 코딩 시스템에서 이로운 활용점을 찾는 것이다. 본 발명의 다양한 태양을 채용하는 분할-대역 부호기 및 분할-대역 복호기의 실시예들은 도 1 및 2에 각각 도시되어 있다.
1. 부호기
a) 분석 필터링
도 1에서, 분석 필터뱅크(12)는 경로(11)로부터 입력 신호를 수신하며, 상기 입력 신호를 입력 신호의 주파수 서브밴드들을 나타내는 서브밴드 신호들로 분할하 고, 상기 서브밴드 신호들을 경로(13 및 23)을 따라 패스한다. 도면의 명확성을 위해, 도 1 및 2에 도시된 실시예들은 단지 2개의 서브밴드들에 대한 구성요소들을 도시하고 있다; 그러나, 일반적으로 지각 코딩 시스템의 분할-대역 부호기 및 복호기는 인간의 청각 시스템의 임계 대역폭들과 대등한 대역폭들을 갖는 수 많은 서브밴드들을 처리할 수 있다.
분석 필터뱅크(12)는 다상 필터, 격자 필터, 직각 미러 필터(QMF), 퓨리에-시리즈형 변환을 포함하는 다양한 시간-영역 대 주파수-영역 변환, 코사인-변조 필터뱅크 변환 및 웨이브릿 변환을 포함하는 다양한 방식으로 구현될 것이다. 바람직한 실시예에서, 필터들의 뱅크는 오버랩핑된 디지털 오디오 샘플들의 블럭들을 분석 윈도우 함수로 가중 또는 변조시키고 특정의 변형 이산 여현 변환(MDCT)을 윈도우-가중 블럭들에 적용함으로서 구현된다. 이러한 MDCT는 시간-영역 엘리어싱 소거(TDAC) 변형으로서 인용되며 1987년 5월 음향, 음색 및 신호의 국제 회의 회보, pp.2161-2164에 프린센(Princen), 존슨(Johnson) 및 브레드레이(Bradley)의 논문 "Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation"이 기술되어 있다. 비록 구현의 범위는 코딩 시스템의 성능에 대해 심원한 영향을 가질 수 있지만, 상기 분석 필터뱅크의 어떠한 특정 구현도 본 발명의 개념에 중요하지 않다.
경로(13 및 23)를 따라 패스되는 서브밴드 신호들 각각은 블럭에 배열된 서브밴드-신호 성분들을 포함한다. 바람직한 실시예에서, 각 서브밴드-신호 블럭은 상기 성분들이 스케일 계수에 관하여 일정 비율로된 블럭-스케일 형태로 나타내여 진다. 예를 들면, 블럭-부동-포인트(block-floating-point;BFP) 형태가 사용될 것이다.
예를 들면, 만일 분석 필터뱅크(12)가 블럭 변환으로 구현되면, 변환 계수들의 블럭을 발생시키기 위해 상기 변환을 입력 신호 샘플의 블럭에 적용하고, 그 후 서브밴드-신호 블럭들을 형성하기 위해 1개 이상의 인접 변환 계수들을 그룹지움으로서 서브밴드 신호들이 발생된다. 예를 들면, 만일 분석 필터뱅크(12)가 QMF와 같은 다른 유형의 디지털 필터에 의해 구현되면, 각 주파수 서브밴드에 대한 일련의 서브밴드-신호 샘플들을 발생시키기 위해 상기 필터를 일련의 입력 신호 샘플들에 적용하고 그 후 상기 서브밴드-신호 샘플들을 블럭들로 그룹지움으로서 서브밴드 신호들이 발생된다. 이들 2가지 예에 대한 서브밴드-신호 성분들은 각각 변환 계수들 및 서브밴드-신호 샘플들이다.
b)지각 모델링
지각 코딩 모델링에 대한 바람직한 실시예에서, 부호기는 지각 모델을 사용하여 각 서브밴드 신호를 양자화시키기 위해 개별 양자화 스텝 사이즈를 설정한다. 적절하게 비트들을 할당하기 위해서 지각 모델을 사용하는 한가지 방법이 도 3에 도시되어 있다. 이러한 방법에 따라, 단계 51은 입력 신호의 특성을 나타내는 정보에 지각 모델을 적용하여 소정의 양자화 잡음 스펙트럼을 설정한다. 수 많은 실시예에 있어서, 이러한 스펙트럼내의 잡음 레벨들은 상기 입력 신호의 추정된 싸이코어쿠스틱 마스킹 임계값에 상응한다. 단계 52은 상기 서브밴드-신호 블럭의 성분들을 양자화시키기 위해서 초기 제시된 양자화 스텝 사이즈를 설정한다. 단계 53은 모든 서브밴드-신호 성분들에 대한 제시된 양자화 스텝 사이즈를 획득하는데 필요한 할당 비트들을 결정한다. 바람직하게는, 상기 부호화 신호를 복호화하기 위해 사용된 분할-대역 복호기의 합성 필터뱅크의 잡음-확산 효과에 대한 허용이 이루어진다. 그러한 허용을 하는 몇가지 방법들이 미국 특허 제 5,623,577호 및 표제 "Quantization in Perceptual Audio Coders with Compensation for Synthesis Filter Noise Spreading"인 우발레(Ubale) 등의 미국 특허 출원 제 09/289,865 호에 기술되어 있으며, 그 모두는 참조로 본문에 채용되어 있다.
단계 54는 필요한 할당의 총 수가 양자화에 유용한 비트의 총 수와 상당히 다른지를 결정한다. 총 할당이 너무 높다면, 단계 55는 제시된 양자화 스텝 사이즈를 증가시킨다. 총 할당이 너무 낮다면, 단계 55는 제시된 양자화 스텝 사이즈를 감소시킨다. 상기 프로세스는 단계 53으로 복귀하고 제시된 양자화 스텝 사이즈를 획득하는데 필요한 총 할당이 이용가능한 비트의 총 수에 충분히 근접함을 단계 54가 결정할 때까지 이러한 프로세스를 반복한다. 그 후에, 단계 56은 상기 설정된 양자화 스텝 사이즈에 따라 서브밴드-신호 성분들을 양자화시킨다.
c)이득-적응형 양자화
이득-적응형 양자화는, 예를 들면, 본 발명의 다양한 태양을 단계 53에 포함시킴으로써 상술된 방법에 채용될 수 있다. 상술된 방법은 수 많은 지각 코딩 시스템에 전형적이지만, 본 발명에 채용할 수 있는 코딩 프로세스의 한가지 예일 뿐이다. 본 발명은 본질상 주관적 및/또는 객관적 기준을 사용하는 코딩 시스템에 사용되어 신호 성분들을 양자화시키기 위한 스텝 사이즈를 설정한다. 논의를 용이하게 하기 위해서, 간단한 실시예들은 본 발명의 다양한 태양을 설명하기 위해서 본문에 사용되어 있다.
한가지 주파수 서브밴드에 대한 서브밴드-신호 블럭은 경로(13)를 따라 서브밴드-신호 애널라이저(14)로 패스되며, 이는 각 블럭내의 서브밴드-신호 성분들의 크기(magnitude)와 임계값(threshold)을 비교하고 각 성분을 성분 크기에 따라 2개 클래스중 1개로 위치시킨다. 성분들의 클래스들을 전달하는 제어 정보는 포맷터(19)로 패스된다. 바람직한 실시예에서, 상기 임계값 이하의 크기를 갖는 성분들은 제 1 클래스로 위치된다. 서브밴드-신호 애널라이저(14)는 또한 다음에 사용하기 위한 이득 계수(gain factor)를 획득한다. 후술되는 것처럼, 바람직하게는 이득 계수의 값은 일부 방식에서 임계값의 레벨에 관련된다. 예를 들면, 임계값은 이득 계수만의 함수로 표현될 수 있다. 이와 달리, 상기 임계값은 이득 계수와 다른 고려사항의 함수로서 표현될 수 있다.
제 1 클래스에 위치되는 서브밴드-신호 성분들은 이득 요소(15)로 패스되며, 이는 서브밴드-신호 애널라이저(14)에 의해 획득된 이득 계수를 제 1 클래스의 각 성분에 제공하며, 이득-변형된 성분들은 그때 양자화기(17)로 패스된다. 양자화기(17)는 제 1 양자화 스텝 사이즈에 따라 이득-변형된 성분들을 양자화시키며 결과의 양자화 성분들을 포맷터(19)로 패스한다. 바람직한 실시예에서, 제 1 양자화 스텝 사이즈는 지각 모델과 서브밴드-신호 애널라이저(14)에 의해 획득된 임계값의 값에 따라 설정된다.
제 1 클래스로 위치되지 않은 서브밴드-신호 성분들은 경로(16)를 따라 양자 화기(18)로 패스되며, 이는 제 2 양자화 스텝 사이즈에 따라 이러한 성분들을 양자화시킨다. 제 2 양자화 스텝 사이즈는 제 1 양자화 스텝 사이와 같을 것이다; 그러나, 바람직한 실시예에서, 제 1 양자화 스텝 사이즈는 제 1 양자화 스텝 사이즈보다 작다.
제 2 주파수 서브밴드에 대한 서브밴스-신호 블럭은 경로(23)를 따라 패스되고 서브밴드-신호 애널라이저(24), 이득 요소(25), 및 양자화기(27 및 28)에 의하여 제 1 주파수 서브밴드에 대하여 상술된 것과 같은 동일한 방식으로 처리된다. 바람직한 실시예에서, 각 주파수 서브밴드에 대하여 사용된 임계값은 적합하며 다른 주파수 서브밴드 주파수들에 대해 사용된 임계값와 무관하다.
d) 부호화 신호 포맷팅
포맷터(19)는 성분들의 분류를 전송하는 제어 정보와 양자화 서브밴드-신호 성분들을 나타내는 비-균일 길이 심볼들을 부호화 신호로 어셈블링하고 초음파 내지 자외선 주파수를 포함하는 스펙트럼을 통하여 기저대역 또는 변조 통신 경로를 포함하는 전송 매체, 또는 자기 또는 광학 레코딩 기술을 사용하여 정보를 전달하는 자기 테이프, 자기 디스크 및 광학 디스크를 포함하는 저장 매체에 의해 전달되는 경로(20)를 따라 상기 부호화 신호를 패스한다.
양자화 성분들을 나타내는데 사용된 심볼들은 양자화 값들과 동일하거나 상기 양자화 값들로부터 도출된 코드의 유형일 것이다. 예를 들면, 상기 심볼들은 양자화기로부터 직접 획득되거나 상기 양자화 값들을 부호화하는 허프만과 같은 소정의 처리에 의해 획득될 것이다. 상기 양자화 값들 자체는 비-균일한 길이 심볼들로 서 쉽게 사용될 수 있는데, 왜냐하면 비-균일한 비트의 수가 서브밴드의 양자화 서브밴드 신호 성분들에 할당될 수 있기 때문이다.
2. 복호기
a) 부호화 신호 디포맷팅
도 2에서, 디포맷터(32)는 경로(31)로부터 부호화 신호를 수신하고 그로부터 양자화 서브밴드-신호 성분들 및 상기 성분들의 분류를 전송하는 제어 정보를 나타내는 심볼들을 획득한다. 복호화 프로세스들은 필요에 따라 상기 심볼들로부터 양자화 성분들을 도출하기 위해 적용될 수 있다. 바람직한 실시예에서, 이득-변형된 성분들은 제 1 클래스로 위치된다. 디포맷터(32)는 또한, 예를 들면 임의의 지각 모델 또는 비트 할당 프로세스들에 의해 필요할 수 있는 임의의 정보를 획득한다.
b) 이득-적응형 탈양자화
탈양자화기(33)는 제 1 클래스에 위치된 1개의 서브밴드-신호 블럭에 대한 성분들을 수신하며, 그것들을 제 1 양자화 스텝 사이즈에 따라 탈양자화시키고, 그 결과를 이득 요소(35)로 패스한다. 바람직한 실시예에서, 제 1 양자화 스텝 사이즈는 지각 모델 및 서브밴드-신호 성분들을 분류하는데 사용되었던 임계값에 따라 설정된다.
이득 요소(35)는 이득 계수를 탈양자화기(33)로부터 수신된 탈양자화 성분들에 적용하고, 상기 이득-변형된 성분들을 통합부(merge)(37)로 패스한다. 이득 요소(35)의 연산은 동반 부호기의 이득 요소(15)에 의해 제공된 이득 변형을 역전시 킨다. 상술된 것처럼, 바람직하게 이러힌 이득 계수는 서브밴드-신호 성분들을 분류하는데 사용되었던 한계값과 관련된다.
제 1 클래스에 위치되지 않은 서브밴드-신호 성분들은 탈양자화기(34)로 패스되며, 이는 그러한 성분들을 제 2 양자화 스텝 사이즈에 따라 탈양자화시키고, 그 결과를 통합부(37)로 패스한다. 제 2 양자화 스텝 사이즈는 제 1 양자화 스텝 사이즈와 같을 수 있다; 그러나, 바람직한 실시예에서, 제 2 양자화 스텝 사이즈는 제 1 양자화 스텝 사이즈보다 작다.
통합부(37)는 이득 요소(35)로부터 수신된 이득-변형된 탈양자화 성분들과 탈양자화기(36)로부터 수신된 탈양자화 성분들을 병합함으로서 서브밴드-신호 블럭을 형성하고, 그 결과의 서브밴드-신호 블럭을 경로(38)를 따라 합성 필터뱅크(39)로 패스한다.
제 2 주파수 서브밴드에 대한 서브밴드-신호 블럭의 양자화 성분들은 탈양자화기(43 및 44), 이득 요소(element)(45) 및 통합부(47)에 의하여 제 1 주파수 서브밴드에 대하여 상술된 것과 동일한 방식으로 처리되고, 그 결과의 서브밴드-신호 블럭을 경로(48)를 따라 합성 필터뱅크(39)로 패스한다.
c) 합성 필터링
합성 필터뱅크(39)는 블럭 필터뱅크(12)를 구현하기 위해 상술된 방식에 상보적인 다양한 방식으로 구현될 수 있다. 출력 신호는 경로(38 및 48)로부터 수신된 서브밴드-신호 성분들의 블럭들에 응답하여 경로(40)를 따라 발생된다.
B. 특징
1. 서브밴드-신호 성분 분류
a) 간략한 서브밴드 임계값 함수
이득-적응형 양자화의 효과는 도 4를 참조함으로서 평가될 수 있으며, 이는 서브밴드-신호 성분들의 가상 블럭(111, 112 및 113)을 도시하고 있다. 도시된 예에서, 각 서브밴드-신호 블럭은 1에서 8까지 번호매겨진 8개의 성분들로 이루어져 있다. 각 성분은 수직선으로 표현되어 있으며 각 성분의 크기는 각 라인의 높이로 표현되어 있다. 예를 들면, 블럭(111)의 성분(1)은 그래프의 세로좌표 축상에 도시된 것처럼 값 0.25보다 약간 더 큰 크기를 갖고 있다.
라인(102)은 0.50 레벨에서의 임계값을 나타낸다. 블럭(111)의 각 성분은 각 성분 크기와 상기 임계값을 비교함으로서 2가지 클래스중 하나에 위치될 것이다. 임계값 이하의 크기를 갖는 성분들은 제 1 클래스으로 위치되어 있다. 나머지 성분들은 제 2 클래스에 위치되어 있다. 이와 달리, 만일 성분들이 임계값보다 적전으로 적은 크기를 갖는 그러한 성분들을 제 1 클래스으로 위치시킴으로서 분류된다면, 약간 다른 결과들이 획득될 것이다. 논의를 용이하게 하기 위해서, 제 1 예에 따라 이루어진 임계값 비교가 가정될 것이며 본문에 더 상세히 언급될 것이다.
블럭(112)의 성분들은 이득 계수를 제 1 클래스에 위치된 각 블럭(111) 성분에 적용함으로서 획득된다. 예를 들면, 블럭(112)의 성분(1)의 크기는, 0.500 보다 약간 더 크며, 블럭(111)의 성분(1)의 크기를 그와 같은 이득 계수와 곱함으로서 획득된다. 반대로, 블럭(112)내의 성분(2)의 크기는 블럭(111)내의 성분(2)의 크기와 같은데, 왜냐하면 이러한 성분은 제 2 클래스에 위치되었으며 이득 계수에 의해 변형되지 않기 때문이다.
라인(104)은 0.25 레벨에서의 임계값을 나타낸다. 블럭(111)의 각 성분은 각 성분 크기와 이 임계값을 비교하고 상기 임계값 이하의 크기를 갖는 성분들을 제 1 클래스에 위치시킴으로서 2개 클래스중 하나에 위치될 것이다. 나머지 성분들은 제 2 클래스으로 위치된다.
블럭(113)의 성분들은 이득 계수 4를 제 1 클래스에 위치된 각 블럭(111) 성분에 적용함으로서 획득된다. 예를 들면, 블럭(113)의 성분(3)의 크기는, 약 0.44이며, 블럭(111)의 성분(3)의 크기, 약 0.11과 이득 계수 4를 곱함으로서 획득된다. 반대로, 블럭(113)의 성분(1)의 크기는 블럭(111)내의 성분(1)의 크기와 같은데, 왜냐하면 이러한 성분은 제 2 클래스에 위치되었으며 이득 계수에 위해 변형되지 않기 때문이다.
상기 임계값은 이득 계수만의 함수로서 표현될 것이다. 이러한 2가지 예들에 의해 도시된 것처럼, 상기 임계값은 다음과 같이 표현될 것이다.
Figure 112001026494617-pct00001
(1)
Th=임계값; 및
G=이득 계수.
b) 변형 임계값 함수
불행히도, 식 1로부터 획득된 임계값은 너무 큰데, 왜냐하면 쓰레서홀드(Th)보다 약간 적은 크기를 갖는 서브밴드-신호 성분이 이득 계수(G)에 의해 변형될 때, 양자화기를 오버로드하기 때문이다.
그 값의 양자화 오차가 양자화 스텝 사이즈의 반을 초과한다면 양자화기를 오버로드하도록 값이 호출된다. 대략 -1 내지 +1의 범위로 값들을 양자화시키는 균일한 양자화 스텝 사이즈를 갖는 대칭 양자화기에 대하여, 양자화기를 오버로드하는 양(+)의 분량의 영역은 다음과 같이 표현될 것이며,
Figure 112001026494617-pct00002
(2a)
양자화기를 오버로드하는 음(-)의 값들의 영역은 다음과 같이 표현될 것이다
Figure 112001026494617-pct00003
(2b)
QOL=양자화기를 오버로드하는 값;
QMAX=최대 양의 양자화값; 및
△Q=양자화 스텝 사이즈.
값들을 대략 -1 내지 +1의 범위로 양자화시키는 균일한 양자화 스텝 사이즈를 갖는 b-비트 대칭 중앙-트레드(mid-tread) 부호 양자화기에 대하여, 최대 양(+)의 양자화 값(QMAX)은 1-21-b이며, 양자화 스텝 사이즈(△Q)는 21-b이다; 상기 양자화 스텝 사이즈의 반은 2-b이다. 양(+)의 오버로드 값에 대한 식 2a는 다음과 같이 재작성될 수 있으며,
Figure 112001026494617-pct00004
(3a)
음(-)의 오버로드 값에 대한 식 2b는 다음과 같이 재작성될 수 있다.
Figure 112001026494617-pct00005
(3b)
도 4의 라인(100)은 3-비트 대칭 중앙-트레드 부호 양자화기에 대한 양(+)의 오버로드 값의 경계를 나타낸다. 이러한 양자화기의 음(-)의 범위는 도시되어 있지 않다. 이러한 양자화기에 대한 최대 양(-)의 양자화 값은 0.75=(1-21-3)이며 양자화 스텝 사이즈의 반은 0.125=2-3이다; 따라서, 이러한 양자화기에 대하여 양(+)의 오버로드 값들에 대한 경계는 0.875=(1-2-3)이다. 음(-)의 오버로드 값들에 대한 경계는 -0.875이다.
블럭(111)의 성분(5)은 값 0.500에서의 임계값보다 약간 적은 크기를 갖는다. 이득 계수 2가 이러한 성분에 적용될 때 그 결과의 크기는 양자화기의 오버로드 경계를 초과한다. 스레스홀드 0.25가 이득 계수 4와 사용될 때 유사한 문제점은 성분(6)에 대해 초래한다.
오버로드를 회피하며 제 1 클래스에 양(+)의 성분값들의 영역을 양자화기의 양(+)의 범위로 최적으로 맵핑하는 양(+)의 분량에 대한 임계값은 다음과 같이 표현된다.
Figure 112001026494617-pct00006
(4a)
음의 분량에 대한 임계값은 다음과 같이 표현된다.
Figure 112001026494617-pct00007
(4b)
이러한 논의의 나머지를 통하여, 양(+)의 임계값만이 논의될 것이다. 이러한 간략화가 어떠한 일반성을 상실시키는 것은 아닌데, 왜냐하면 성분 크기들과 양(+)의 임계값을 비교하는 그러한 연산은 성분 크기들과 양 및 음의 임계값을 비교하는 다른 연산과 동일하기 때문이다.
상술된 b-비트 대칭 중앙-트레드 부호 양자화기에 대하여, 식 4a의 임계값 함수는 다음과 같이 재작성될 수 있다.
Figure 112001026494617-pct00008
(5)
이러한 변형 임계값을 사용하는 이득-적응형 양자화의 효과는 도 5에 도시되어 있으며, 이는 서브밴드 신호 성분들의 가상 블럭(121, 122, 123 및 124)을 도시하고 있다. 도시된 예에서, 각 서브밴드 신호 블럭은 1에서 8까지 번호매겨진 8개의 성분들로 이루어지며, 그 크기들은 각 수직선의 길이로 표현되어 있다. 라인(102 및 104)은 각각 2 및 4와 같은 이득 계수에 대한 3-비트 대칭 중앙 트레드 부호 양자화기에 대한 임계값을 나타낸다. 라인(100)은 이러한 양자화기의 양의 오버로드 값들의 경계를 나타낸다.
서브밴드-신호 블럭(122)의 성분들은 블럭(121)의 성분들의 크기와 임계값(102)를 비교하고 이득 G=2를 임계값 이하의 크기를 갖는 성분들에 적용함으 로서 획득될 것이다. 유사하게, 서브밴드-신호 블럭(123)의 성분들은 블럭(102)의 성분들의 크기와 임계값(104)를 비교하고 이득 G=4를 이러한 임계값 이하의 크기를 갖는 성분들에 적용함으로서 획득될 것이다. 서브밴드-신호 블럭(124)의 성분들은 하기된 캐스캐이드형 기술을 사용하여 획득될 것이다. 도 4에 도시된 예들과는 달리, 상술된 제 1 임계값에 대하여, 도 5에 도시된 이득-변형된 성분의 어떠한 것도 양자화기의 오버로드 경계를 초과하지 않는다.
한편으로, 식 5에 따른 변형 임계값이 바람직한데, 왜냐하면 제 1 클래스의 작은-크기 성분들에 대한 양자화기 오버로드를 회피하고 적절하게 양자화기를 로드하기 때문이다. 다른 한편으로, 이러한 임계값은 최적 양자화 스텝 사이즈를 찾는 일부 실시예에서 바람직하지 않은데, 왜냐하면 상기 임계값은 양자화 스텝 사이즈가 설정될 때까지 결정될 수 없기 때문이다. 비트를 할당함으로서 양자화 스텝 사이즈를 적합하게 하는 실시예에서, 상기 양자화 스텝 사이즈는 각 서브밴드 신호 블럭에 대한 비트 할당이 알려질 때까지 설정될 수 없다. 이러한 단점은 아래에 더 상세히 설명되어 있다.
2. 양자화
바람직하게, 서브밴드-신호 블럭의 성분들을 양자화시키는데 사용되는 양자화기의 양자화 스텝 사이즈는 그 블럭에 대한 이득 계수에 응답하여 적합하게 된다. 상술되고 도 3에 도시된 것과 유사한 프로세스를 사용하는 일 실시예에서, 비트(b)의 수가 서브밴드-신호 블럭내의 각 성분에 할당되고 그 후 양자화 스텝 사이즈 및 어쩌면 비트 할당은 그 블럭에 대해 선택된 이득 계수에 따라 각 성분에 대 해 적합하게 된다. 이러한 실시예에 대하여, 상기 이득 계수는 1, 2, 4 및 8의 이득을 나타내는 4가지 가능한 값들로부터 선택된다. 그 블럭의 성분들은 대칭 중앙-트레드 부호 양자화기를 사용하여 양자화된다.
제 1 클래스에 위치되어 있지 않으며 이득이 변형되지 않은 더 큰-크기의 성분들은 본 발명의 이점과는 상관없이 할당되는 비트의 동수(b)를 할당한다. 하기에 논의되는 분할-간격 양자화 함수를 사용하는 변형 실시예에서, 이러한 더 큰-크기의 성분들에 대한 비트 할당은 일부 이득 계수들에 대해서는 감소될 수 있다.
제 1 클래스에 위치되어 있으며 이득이 변형되는 더 작은-크기의 성분들은 표 I에 도시된 값들에 따라 비트의 수를 할당한다.
이득 할당
1 b
2 b-1
4 b-2
8 b-3
특정 서브밴드-신호 블럭에 대하여 이득 계수 1이 그 블럭에 적용되지 않음을 가리킨다; 따라서, 동수의 비트(b)는 본 발명의 이점과 관계없이 할당되는 각 성분에 할당된다. 특정 서브밴드-신호 블럭에 대하여 이득 계수 G=2, 4 및 8의 사용은 잠재적으로 각각 1, 2 및 3비트의 할당을 감소시키는 이점을 그 서스밴드 블럭의 각각 더 작은-크기의 성분에 잠재적으로 제공할 수 있다.
표 I에 도시된 할당은 각 성분에 할당되는 비트의 수가 1보다 적을 수 없다는 제한에 적용된다. 예를 들면, b=3을 특정 서브밴드-신호 블럭의 성분들에 할당하는 비트-할당 프로세스와 이득 계수 G=8이 그 블럭에 대해 선택되면, 더 작은-크 기의 성분들에 대한 비트 할당은 표 I에 의해 제시된 것처럼 제로 비트보다는 1비트로 감소될 것이다. 비트 할당에 이득 변형 및 조정의 의도된 효과는 적은 비트를 사용하여 동일 신호-양잡화 잡음비를 유지시키는 것이다. 바람직하다면, 실시예는 할당된 비트의 수를 감소시키지 않는 이득 계수를 선택하는 것을 회피할 것이다.
3. 제어정보
상기된 바와 같이, 서브밴드-신호 애널라이저(14)는 상기 부호화 신호로 어셈블링하기 위해 포맷터(19)에 제어 정보를 제공한다. 이런 제어 정보는 서브밴드-신호 블럭의 각각의 성분을 위한 분류(classification)를 전송한다. 이런 제어 정보는 다양한 방식으로 부호화 신호에 포함될 수 있다.
제어 정보를 포함하기 위한 한가지 방식은 한 비트가 블럭내 각각의 성분에 상응하는 각각의 서브밴드-신호 블럭에 대한 비트들의 스트링을 부호화 신호에 포함되도록 하는 것이다. 하나의 값으로 세트된 비트, 예를 들면 값 1은 그 상응하는 성분이 이득 수정된 성분이 아니라는 것을 지시하고, 실예로 값 0인, 다른 값으로 세트된 비트는 상응하는 성분이 이득 수정된 성분이라는 것을 지시한다. 이득 정보를 포함하기 위한 다른 방식은 이득 수정된 또는 변형적으로 이득 수정되지 않은 각각의 성분 바로 이전의 부호화 신호에 특별한 "이스케이프 코드(escape code)"를 포함해야 한다.
대칭 미드-트래드 부호 양자화기(symmetric mid-tread signed quantizer)를 사용하는 상기 바람직한 실시예에 있어, 이득 수정되지 않은 각각의 큰-크기 성분은 사용되지 않은 양자화 값과 등가의 이스케이프 코드에 의해 진행된다. 예를 들 면, 3-비트 2의 보수 부호 양자화기에 대한 양자화 값들은 3비트 2진 스트링 b'101로 표시된 -0,750의 최소치로부터 2진 스트링 b'011로 표시된 +0.75의 최대치까지의 범위이다. -1.000에 상응하는 2진 스트링 b'100은 양자화를 위해 사용되지 않고 제어 정보로 사용하는데 유효하다. 유사하게, 4-비트 2의 보수 부호 양자화기에 대한 비사용(unused) 2진 스트링은 b'1000이다.
도5의 서브밴드-신호 블럭(121)을 참고하면, 성분(4,5)들은 임계값(102)을 초과하는 큰-크기 성분들이다. 이런 임계값이 이득 계수 G=2와 관련하여 사용되면, 제1 클래스에 위치된 모든 작은-크기 성분들에 대한 비트 할당은 상기 표1에 표시되는 b-1이다. 비트-할당 처리가 블럭(121)의 각각의 성분에 b=4 비트들을 할당한다면, 예를 들면, 각각의 서브밴드-신호 성분에 대한 할당은 3=(b-1) 비트들로 감소되고 3-비트 양자화기는 작은-크기 성분들을 양자화하기 위해 사용된다. 이런 실시예에서 성분(4,5)들인, 각각의 큰-크기 성분은 4-비트 양자화기로 양자화되고 3-비트 양자화기의 비사용 2진 스트링, 또는 b'100과 동일한 제어 정보에 의해 식별된다. 각각의 큰-크기 성분에 대한 이런 제어 정보는 각각의 큰-크기 성분 바로 이전의 부호화 신호로 편리하게 어셈블링될 수 있다.
본 발명이 전술한 문단에서 논의된 실시예에서 어떤 이익도 제공하지 않는 것을 지적하도록 교시될 수 있다. 이런 실시예에서 6비트인 제어 정보를 전송하도록 요구된 비용 또는 총경비(overhead)는 작은-크기 성분들에 대한 비트 할당을 감소시킴으로써 절감되는 비트들의 수와 동일하다. 상기 실시예를 참고하면, 블럭(121)의 오직 하나의 성분만 큰-크기 성분이라면, 본 발명은 이런 블럭을 전송 하도록 요구된 비트들의 수를 4정도 감소시킨다. 7비트는 7개의 작은-크기 성분들까지 감소된 할당들에 의해 감소되고 3비트만이 하나의 큰-크기 성분을 위한 제어 정보를 전송하도록 요구된다.
이 마지막 실시예는 하나의 추가적인 양상을 무시하고 있다. 4개의 이득 계수들이 그 블럭을 위해 사용되는 것을 전송하기 위해 이런 실시예의 각각의 서브밴드-신호 블럭을 위해 2비트가 요구된다. 상기된 바와 같이, 1과 등가인 이득 계수는 본 발명의 특징이 특정 서브밴드-신호 블럭에 대해 적용되지 않는 것을 지시하도록 사용될 수 있다.
본 발명은 4개 이하의 성분들을 갖는 서브밴드-신호 블럭들을 양자화하기 위해서는 어떤 장점도 제공하지 않는다. 인간 청각 기관의 임계 대역폭에 상응하는 밴드폭을 가지는 서브밴드 신호들을 발생시키는 지각 코딩 시스템들에 있어, 저-주파수 서브밴드들에 대한 서브밴드-신호 블럭들의 성분들의 수는 아마 블럭 마다 하나의 성분만으로 낮지만 서브밴드-신호 블럭 마다 성분들의 수는 서브밴드 주파수를 증가시켜 증가된다. 결과적으로, 바람직한 실시예에서, 본 발명의 구현 특징에 대해 요구된 처리가 보다 광폭의 서브밴드들에 대해 제한적일 수 있다. 제어 정보의 추가적인 피스는 이득-적응형 양자화가 사용되는 최저 주파수 서브밴드를 지시하도록 부호화 신호에 포함될 수 있다. 부호기는 입력 신호 특성들에 따라 이런 서브밴드를 적절하게 선택할 수 있다. 이런 기법은 이득-적응형 양자화를 사용하지 못하는 서브밴드들을 위해 제어정보를 제공하기 위한 필요성을 회피한다.
4.복호기 특징
본 발명의 특징을 채용하는 복호기는 필수적으로 임의의 방식으로 그 탈양자화기의 양자화 스텝 사이즈를 적절하게 변화시킬 수 있다. 예를 들면, 상기 된 실시예들에 의해 발생된 부호화 신호를 복호화하기 위해 고안되는 복호기가 상기 양자화 스텝 사이즈를 설정하도록 적응형 비트 할당을 사용할 수 있다. 복호기는 비트 할당치들이 상기 부호화 신호로부터 직접 획득될 수 있는, 소위 포워드-적응형(forward-adaptive) 시스템에서 작동할 수 있고, 그것은 비트 할당치들이 부호기에 사용되었던 동일한 할당 처리를 반복함으로써 획득되는 소위 백워드-적응형(backward-adaptive) 시스템에서 작동할 수 있으며, 또는 그것은 두 시스템들의 합성으로 작동할 수 있다. 이런 방식으로 획득된 할당 값들은 "통상적인" 비트 할당치들로서 명칭된다.
복호기는 이득 계수들 및 각각의 서브밴드-신호 블럭의 성분들의 분류를 식별하기 위해 부호화 신호로부터 제어 정보를 획득한다. 상기 실시예를 계속들면, 이득계수 G=1를 저송하는 제어정보는 이득-적응형 특징이 사용되지 않았음을 지시하고 통상적인 비트 할당치 b는 그 특정 서브밴드-신호 블럭의 성분들을 탈양자화하기 위해 사용되어야 한다. 다른 이득 계수 값들에 대해, 블럭에 대한 통상적인 비트 할당치 b는 "이스케이프 코드" 또는 큰-크기 성분들을 식별하는 제어정보의 값을 결정하기 위해 사용된다. 상기 실시예에서, 이득 계수 G=2를 갖는 b=4의 할당치는 제어 정보가 3=(b-1) 비트의 길이를 가지는 2진 스트링b'100임을 나타낸다. 부호화 신호에의 이런 제어정보의 존재는 바로 이하의 큰-크기 성분을 지시한다.
각각의 이득-수정된 성분에 대한 비트 할당은 표1에 도시되고 상기된 바와 같이 조정된다. 탈양자화는 적절한 양자화 스텝 사이즈를 사용하여 수행되고 이득-수정된 성분들은 부호기에서 이득 수정을 수행하도록 사용된 이득 계수의 역수인 이득계수에 종속된다. 예를 들면, 작은-크기 성분들이 부호기의 이득계수 G=2로 곱해지면, 복호기는 역수 이득 G = 0.5를 상응하는 탈양자화 성분들에 적용한다.
C. 추가적인 특징
상기 변형들에 추가하여, 다수의 변형들이 이하 기술된다.
1. 추가적인 분류들
하나의 변형에 따라, 서브밴드-신호 블럭의 성분들의 크기들은 둘 이상의 임계값들에 비교되고 두 클래스들 이상에 위치된다. 도5를 참고하면, 예를 들면, 블럭(121)의 각 성분의 크기가 임계값(102,104)들에 비교될 수 있고 세 클래스들 중 하나에 위치될 수 있다. 이득 계수들은 두개의 클래스들에 대해 획득되고 적절한 성분들에 적용된다. 예를 들면, 이득 계수 G=4는 임계값(102)과 동일하거나 또는 그 이하이지만 임계값(104) 이상인 크기를 가지는 성분들에 적용될 수 있다. 변형적으로, 이득 계수 G=2는 임계값(102)과 동일하거나 또는 그 이하의 크기들을 가지는 모든 성분들에 적용될 수 있고 이득 계수 G=2는 임계값(104)과 등가 또는 그 이하의 크기들을 가지는 성분들에 대해 다시 적용될 수 있다.
2.캐스케이드 작동(Cascaded Operation)
상기 이득 수정 처리는 양자화 이전에 다수 번 시행된다. 도6은 캐스케이드의 두 이득 단들 중 하나의 실시예를 도시하는 블럭 다이어그램이다. 이 실시예에 서, 서브밴드-신호 애널라이저(61)는 서브밴드-신호 블럭의 성분들의 크기들을 제1 임계값과 비교하고 상기 성분들을 두 클래스들중 하나에 위치시킨다. 이득 요소(62)는 클래스들 중 하나에 위치된 성분들에 제1 이득 계수를 적용한다. 제1 이득 계수의 값은 제1 임계값과 관련된다.
서브밴드-신호 애널라이저(64)는 이득-수정된 성분들의 크기들 및 가능하게는 블럭의 나머지 성분들을 제2 임계값과 비교하며 성분들을 두 클래스들 중 하나에 위치시킨다. 이득 요소(65)는 제2 이득 계수를 클래스들 중 하나에 위치된 성분들에 적용한다. 제2 이득 계수의 값은 제2 임계값과 연관된다. 제2 임계값이 제1 임계값과 동일하거나 또는 그 이하라면, 서브밴드-신호 애널라이저(64)는 애널라이저(61)가 제1 임계값 이상의 크기들에 대해 클래스에 위치되었던 성분들을 분석할 필요가 없다.
서브밴드-신호 블럭 성분들은 상기된 것과 유사한 방식으로 양자화기(67,68)들에 의해 양자화된다.
도5를 참고하면, 서브밴드-신호 블럭(124)의 성분들은 서브밴드-신호 애널라이저(61) 및 이득 요소(62)가 이득 계수 G=2를 임계값(102)과 동일하거나 또는 그 이하의 크기를 가지는 성분들에 적용하고, 서브밴드-신호 애널라이저(62) 및 이득 요소(65)가 이득 계수 G=2를 임계값(102)과 동일하거나 또는 그 이하인 크기를 가지는 이득-수정된 성분들에 적용하는 이득 단들의 연속적인 적용으로 획득된다. 예를 들면, 블럭(121)의 성분(1 내지 3 및 6 내지 8)들은 블럭(122)에 도시되는 중간 결과를 생성하는, 제1 단의 이득 계수 G=2로 수정된다. 성분(1,3,7,8)들은 블 럭(124)에 대해 도시된 결과를 획득하기 위해 제2 단의 이득 계수 G=2로 수정된다.
캐스케이드의 이득 단들을 사용하는 실시예에서, 적절한 제어 정보는 복호기가 캐스케이드의 이득 단들의 상보적인 세트를 수행할 수 있도록 부호화 신호에 제공되어야 한다.
3.최적화 비트 할당
이득-적응형 양자화(gain-adaptive quantization)를 적용하기 위한 다수개의 가능한 전략들이 있다. 하나의 단순한 전략은 제1 임계값 및 관련된 제1 이득 계수 G=2로 시작함으로써 개개의 서브밴드-신호 블럭의 성분들을 분석하고, 제1임계값 및 제1이득 계수에 따른 이득-적응형 양자화가 비트 할당 요건들의 감소를 야기하는지를 결정한다. 그것이 그렇지 않다면, 분석이 중지되고 이득-적응형 양자화는 수행되지 않는다. 그것이 감소를 야기한다면, 분석은 제2 임계값 및 관련 제2 이득 계수 G=4를 가지고 계속된다. 제2임계값 및 관련 이득 계수의 사용이 비트 할당의 감소를 야기하지 않는다면, 이득 적응형 양자화는 제1 임계값 및 제1 이득 계수를 사용하여 수행된다. 제2 임계값 및 제2 이득계수의 사용이 감소를 야기한다면, 분석은 제3임계값 및 관련 제3 이득 계수 G=8을 가지고 계속된다. 이런 처리는 임계값 및 관련 이득 계수의 사용이 비트 할당의 감소를 야기하지 않거나, 또는 임계값들 및 관련 이득 계수들의 모든 조합들이 고려될 때까지 계속된다.
다른 전략은 각각의 가능한 임계값 및 관련 이득 계수에 의해 제공된 비용(cost) 및 이익(benefit)을 계산하고 최대의 순 이익을 야기하는 임계값 및 이득 계수를 사용함으로써 이득 계수의 선택을 최적화하도록 한다. 상기 실시예에 대해, 특정 임계값 및 관련 이득 계수에 대한 순 이익(net benefit)은 비용을 뺀 총 이익이다. 총 이익(gross benefit)은 이득 수정되는 작은-크기 성분들에 대한 비트 할당을 감소시킴으로써 절약되는 비트들의 수이다. 비용은 이득 수정되지 않는 큰-크기 성분들에 대한 제어 정보를 전송하도록 요구되는 비트들의 수이다.
이 바람직한 전략이 구현될 수 있는 한가지 방식은 이하 프로그램 부분에 도시되어 있다. 이 프로그램 부분은 C, FORTRAN 및 BASIC 프로그래밍 언어들의 다소의 구문론적 특징을 포함하는 구문을 사용하는 의사-코드(pseudo-code)로 표현되어 있다. 본문에 도시된 이 프로그램 부분 및 다른 프로그램들은 컴파일에 적절한 소스 코드 세그먼트들이도록 의도되지 않았지만 가능한 구현체들의 약간의 양태들을 전송하도록 구비되어 진다.
Gain(X,N,b) {
Th2=(1-2^(-b)) / gf[1]; //이득계수 G=2에 대한 임계값 초기화
Th4=Th2/2; //이득계수 G=4에 대한 임계값 초기화
Th8=Th4/2; //이득계수 G=8에 대한 임계값 초기화
n2=n4=n8=0; //카운터 초기화
for(k=1 to N) { //각 성분 k에 대해..
CompMag=Abs(X[k]); //성분 크기 얻기
if(CompMag > Th2)
n2=n2+1; //Th2 이상 성분들 카운트
else if(CompMag > Th4)
n4=n4 + 1; //Th4와 Th2 사이 성분들 카운트
else if(CompMag > Th8)
n8=n8+1; //Th8과 Th4 사이 성분들 카운트
}
n24=n2+n4; //Th4 이상 큰 성분들의 수
n248=n24+n8; //Th8 이상 큰 성분들의 수
benefit2=Min(b-1,1); //G=2를 사용하여 절약된 작은 성분당 비트들
benefit4=Min(b-1,2); //G=4를 사용하여 절약된 작은 성분당 비트들
benefit8=Min(b-1,3); //G=8를 사용하여 절약된 작은 성분당 비트들
net[0]=0; //무 이득 수정에 대한 순 이익
net[1]=(N-n2)*benefit2-n2*(b-benefit2);//G=2를 사용하는 순이익
net[2]=(N-n24)*benefit4-n24*(b-benefit4);//G=4를 사용하는 순이익
net[3]=(N-n248)*benefit8-n248*(b-benefit8);//G=8을 사용하는 순이익
j=IndexMax(net[j],j=0 to 3); //최대 이익의 지수 얻기
Gain=gf[j]; //이득 계수 얻기
}
함수 Gain에는 서브밴드-신호 블럭 성분들의 어레이 X, 블럭의 성분들의 갯수 N, 및 성분들의 블럭에 대한 통상적인 비트 할당치 b가 제공된다. 함수의 제1 스테이트먼트(statement)는 어레이 gf로부터 획득되는 이득 계수 G=2에 관련되는 임계값을 나타내도록 변수 Th2를 초기화하기 위해 상기의 식5에 따른 계산을 사용 한다. 이런 실시예에서, 이득 계수들 gf[1],gf[2] 및 gf[3]은 각각 G=2,4,8이다. 다음의 스테이트먼트는 이득계수 G=4,8과 관련되는 임계값(threshold)들에 대한 변수들을 초기화한다. 다음으로, 카운터들이 0으로 초기화되어 다양한 클래스들의 큰-크기 성분들의 수를 결정하기 위해 사용된다.
for루프의 스테이트먼트는 어레이 X의 각각의 서브밴드-신호 블럭 성분에 대한 크기를 획득하기 위해 함수 Abs를 호출하고 성분 크기를 임계값들과 비교하여, 최상의 임계값에서 시작한다. 예를 들어, 크기가 임계값 Th2 이상이라면, 변수 n2는 하나씩 증가한다. for루프가 종료될 때, 변수 n2는 임계값 Th2 이상의 크기를 가지는 성분들의 수를 포함하며, 변수 n4는 임계값 Th4 이상이지만 임계값Th2와 동일하거나 또는 그 이하인 크기를 가지는 성분들의 수를 포함하고, 변수 n8은 임계값 Th8 이상이지만 임계값 Th4와 등가이거나 또는 그 이하인 크기를 가지는 성분들의 수를 포함한다.
바로 이하의 for루프의 두 개의 스테이트먼트는 상기 개개의 임계값들인 성분들의 총 갯수를 계산한다. 변수 n24의 수는 임계값 Th4 이상의 크기를 가지는 성분들의 갯수를 표시하며, 변수 n248의 수는 임계값 Th8 이상의 크기를 가지는 성분들의 수를 표시한다.
다음의 세 스테이트먼트는 각 이득 계수를 사용하는 작은-크기 성분 마다의 이익을 계산한다. 이런 이익은 표1에 도시된 바와 같이 성분 마다 1,2 또는 3 비트 정도일 수 있지만, 이익은 또한 각 성분에 대한 할당이 1비트의 최소치로 한정되기 때문에 성분당 b-1 비트를 넘지 않도록 제한된다. 예를 들면, 변수 benefit2 의 수는 이득 계수 G=2를 사용하여 절약되는 작은-크기 성분마다의 비트들의 수를 표시한다. 표1에 도시된 바와 같이, 이런 이익은 1비트 정도일 수 있지만, 그러나, 이익은 통상적인 비트 할당치 b - 1을 넘지않도록 또한 제한된다. 이런 이익의 계산은 두 값들 b-1 및 1 중 최소치를 리턴하도록 함수 Min을 사용하여 제공된다.
그후 순 이익들이 계산되며 어레이 net의 요소들에 할당된다. 요소 net[0]는 제로인, 이득-적응형 양자화를 사용하지 않는 순 이익을 표시한다. 이득 계수 G=2를 사용하는 순 이익은 적절한 수의 작은-크기 성분들(N-n2)과 작은-크기 성분 benefit2 당 적절한 이익을 곱하여, 제어 정보에 대해 사용된 비사용(unused) 양자화기 값의 길이로 곱해진 큰-크기 성분들 n2 의 갯수인, 비용을 감산함으로써 net[1]에 할당된다. 이런 길이는 작은-크기 성분 마다 절약된 비트들에 의해 감소된 통상적인 비트 할당치b로부터 획득될 수 있는 작은-크기 성분들의 비트-길이 이다. 예를 들면, 이득 계수 G=2일 때 작은-크기 성분들의 비트-길이는 량(b-benefit2)이다. 유사한 계산은 이득 계수 G=4 및 8을 사용하는 순 이익을 변수들 net[2] 및 net[3]에 각각 할당하여 이행된다.
함수 IndexMax는 어레이 net의 최대 순 이익에 대해 어레이 지수 j를 획득하도록 호출된다. 이런 지수는 함수 Gain에 의해 리턴되는 gf 어레이로부터 적절한 이득 계수를 획득하도록 사용된다.
4.단순화된 임계값 함수를 사용하는 개선된 효율
본 발명의 다양한 특징들이 도3에 도시된 것과 같은 지각(perceptual) 비트 할당 처리에 도입될 수 있음이 상기 언급되었다. 특히, 이런 특징들이 단계53에서 이행될 수 있다. 단계 53은 부호화될 각 서브밴드-신호 블럭의 성분들을 양자화하기 위해 제시된 비트 할당치들을 반복 결정하는 루프내에서 이행된다. 이 때문에, 단계 53에서 이행된 연산들의 효율은 매우 중요하다.
각각의 블럭에 대한 최적의 이득 계수를 결정하는, 함수 Gain에 대한 상기 처리는 그것이 다양한 클래스들에 위치되는 서브밴드-신호 블럭 성분들의 수를 카운트해야하기 때문에 상대적으로 비효율적이다. 성분 카운트는 식 5에 따라 얻어지는 임계값들이 각각의 반복을 위해 제시된 비트 할당치 b가 공지될 때까지 계산되지 않기 때문에 각각의 반복동안 계산되어야만 한다.
식5에 따라 획득된 임계값들과 대조적으로, 식 1에 따라 획득된 임계값들은 덜 정확하지만 제시된 비트 할당치 b가 공지되기 전에 계산될 수 있다. 이것은 임계값들 및 성분 카운트들이 반복을 넘어서(outside the reiteration) 계산되도록 한다. 도3에 도시된 방법을 참고하여, 예를 들면, 임계값들 Th1,Th2 및 Th3, 및 성분 카운트들 n2, n24 및 n248은 단계 52에서 계산될 수 있다.
이 실시예에 사용될 수 있는, 상기 함수 Gain의 변형형이 이하 프로그램 부분에 도시되어 있다.
Gain2(X,N) {
benefit2=Min(b-1,1); //G=2를 사용하여 절약된 작은 성분 마다의 비트들
benefit4=Min(b-1,2); //G=4를 사용하여 절약된 작은 성분 마다의 비트들
benefit8=Min(b-1,3); //G=8를 사용하여 절약된 작은 성분 마다의 비트들
net[0]=0; //무 이득 수정에 대한 순 이익
net[1]=(N-n2)*benefit2-n2*(b-benefit2);//G=2를 사용하는 순 이익
net[2]=(N-n24)*benefit4-n24*(b-benefit4);//G=4를 사용하는 순 이익
net[3]=(N-n248)*benefit8-n248*(b-benefit8);//G=8을 사용하는 순 이익
j=IndexMax(net[j], j=0 to 3); //최대 이익의 지수 얻기
Gain=gf[j]; //이득 계수 얻기
}
함수 Gain2의 스테이트먼트(statements)들은 각각의 이득 계수에 대한 순 이익들을 계산하여 최적의 이득 계수를 선택하는 상기 함수 Gain의 상응하는 선언과 동일하다.
5. 양자화 함수
a) 분할간격 함수
큰-크기 성분의 양자화 정확도는 두 개의 비접촉 간격 사이의 입력값을 양자화하는 분할간격 양자화 함수를 사용함으로써 개선되어질 수 있다.
도7의 라인(105)는 3 비트 대칭 미드-트래드 부호 양자기와 상보적 양자기의 종단간(end-to-end) 효과를 나타내는 함수의 도면이다. x축의 값은 양자기에 대한 입력값을 나타내는 것이고 q(x)축의 값은 탈양자기로부터 산출되는 상응하는 출력값을 나타낸다. 라인(100, 109)는 각각 양자화기를 위한 양(positive), 음(negative) 오버로드 값의 경계선을 나타낸다. 라인(102,108)은 표 1에 따른 도4에 나타나는 이득계수 G=2용 양, 음 임계값을 나타낸다. 라인(104,107)은 각각 이득계수 G=4의 양, 음 임계값을 나타낸다.
도1을 참조하면, 서브밴드 신호 애널라이저(14)를 임계값(102)에 따른 서브밴드 신호 블럭 성분을 분류하면, 양자화기(18)에 따른 성분의 크기가 임계값(102)보다 모두 크다는 것이 인지된다. 즉 양자화기(18)는 임계값(108)과 (102)사이에 해당되는 어떤값도 양자화하기 위해 사용되어질 수 없다. 이러한 무효(void)는 양자화기의 양자화기의 사용하에 있음(under utilization)을 나타낸다.
이러한 사용하에 있음은 분할-간격 양자화 함수를 구현하는 양자화기를 사용함으로써 극복될 수 있다. 다양한 분할-간격 함수가 가능하다. 도8은 한 개의 분할-간격 3-bit 부호 양자화기와 상보적 탈양자화기의 종단간 효과를 나타내는 함수의 도면이다. 라인(101)은 포지티브 양(positive quantities)들의 함수를 나타내고 라인(106)은 네거티브 양(negative quantities)들의 함수를 나타낸다.
도8에 되시되는 함수는 도7에 되시된, 7 양자화 레벨만 가지고 있는 함수와 대조되는 8레벨의 양자화를 가지고 있다. 추가적인 양자화 레벨은 -1에 상응하는 미드-트레드 양자화 함수를 위한, 상기 설명된 레벨을 사용해서 획득된다.
b)비오버로딩 양자화기
도8에 되시된 함수를 구현하는 3비트 양자화기와 상보적 탈양자화기는 양자화기가 오버로드 될 수 없기 때문에 -1.0부터 약-0.5와 +0.5부터 +1.0까지의 분할-간격내의 값들을 양자화하기 위해 선호된다. 상기한 바와 같이, 값의 양자화 오류가 1/2 양자화 스텝 사이즈를 넘어가면 그 값은 양자화기를 오버로드 하게된다. 도8에 나타난 예에서 볼 수 있듯이, 탈양자화기 출력은 -0.9375, -0.8125, - 0.6875, -0.5625, +0.5625, +0.6875, +0.8125 및 +0.9375와 동일한 값으로 한정된다. 상기 분할-간격 내의 모든 값의 탈양자화 오류의 크기는 1/2 양자화 스텝 사이즈와 동일한 0.0625보다 크지않다. 그런 양자화기는 그것이 오버로드되지 않기 때문에 본문에서 "비-오버로딩 양자화기"로 칭해진다.
필수적으로 어떠한 양자화 스텝 사이즈에서라도 비오버로딩 싱글- 및 분할- 간격 양자화기는 양자화될 값 정도의 간격 이내로 적절하게 이격된 양자화기 "결정 포인트"로 한정되어진 양자화기 출력을 갖는 양자화 함수를 구현함으로써 실현되어질 수 있다. 일반적으로 결정 포인트들은 다른 것과 약간의 거리 d정도 이격되고, 입력값 간격의 각 단부에 가장 가까운 결정 포인트들은 각각의 끝에서부터 d 정도까지 이격되어 있다. 이러한 공간은 상보적 탈양자화기와 사용될 때, 특정 양자화 스텝 사이즈정도 서로 분리된 균일하게 이격되고, 특정 양자화 1/2 스텝 사이즈의 최대 양자화 오류를 갖는 균일하게 이격된 출력 값을 제공하는 양자화기를 제공한다.
c) 맵핑 함수
분할간격 양자화기는 다양한 방법으로 구현되어질 수 있다. 어떠한 특정한 구현이 중요한 것은 아니다. 도9A에 나타난 하나의 구현체는 양자화기(74)와 종속된(cascade) 맵핑 변환부(72)로 구성되어있다. 맵핑 변환부(72)는 경로(71)로부터 입력값을 수신하고, 이러한 입력값들을 적정 간격으로 맵핑하고 경로(73)을 따라 맵핑된 값을 양자화기(74)로 보낸다.
양자화기(74)가 비대칭 미드-트레드 부호 양자화기라면, 도9B에 도시된 라인 (80,81)에 나타난 맵핑 함수는 맵핑 함수(72)에 적합하게 된다. 이러한 맵핑 함수에 따라, -1.0 내지 -0.5사이 간격내의 값은 -1.0-½ΔQ 부터 -1/2 ΔQ 간격으로 선형적으로 맵핑되어지고, 여기에서 ΔQ는 양자화기(74)의 양자화 스텝 사이즈이고 간격 +0.5부터 +1.0내의 값은 -1/2ΔQ부터 +1.0 -1/2ΔQ의 간격으로 선형적으로 맵핑된다. 이런 실예에서, 큰-크기 성분도 이값들을 갖는 성분이 작은-크기 성분으로 분류되어지기 때문에, -0.5 또는 +0.5와 정확히 동일한 값을 가질 수 없다. 이러한 이유로 맵핑 변환부(72)는 어떤 입력값도 정확하게 -1/2ΔQ에 맵핑되지 않는다; 그러나, -1/2ΔQ의 어느 한쪽이나 거기에 가까운 입력값을 임의로 맵핑할 수 있다.
이러한 맵핑의 효과는 도9B와 9C를 참고해서 인지될 수 있다. 도9B를 참조하면, 맵핑 변환부(72)가 입력 포인트(82,84)를 맵핑된 포인트(86,88)에 맵핑된 것을 인지할 수 있다. 3비트 비대칭 미드-트레드 부호 양자화기와 보충적 탈양자화기의 종단간(end-to-end) 효과를 나타내는 함수를 도시한 도9C를 참조하면, 맵핑된 포인트(86,88)들이 -1/2ΔQ값을 갖는 양자화기 결정 포인트(87)의 어느 한쪽 편에 놓여진 것을 인지할 수 있다.
상보적 분할-간격 탈양자화기는 맵핑 변환부(72)의 역인 맵핑 변환이 수반된 양자화기(74)에 상보적인 비대칭 미드-트레드 부호 탈양자화기에 의해 구현될 수 있다.
d) 복합 함수
상기된 예에서, 이득계수 G=2를 갖는 이득 적응형 양자화는 통상적인 비트 할당치 b가 3 비트와 동일한 서브밴드 신호의 성분을 양자화 시키는데 사용된다. 표 I과 연결해서 상기한 바와 같이, 3비트가 큰-크기 성분 비트를 양자화 시키는데 사용되고, 2=(b-1) 비트는 작은-크기 이득-수정된 성분을 양자화 시키는데 사용된다. 바람직하게는, 도8의 양자화 함수를 구현하는 양자화기가 큰-크기 성분을 양자화 시키는데 사용된다.
도10에 도시된 함수(111)을 구현하는 2 비트 대칭 미드-트레드 부호 양자화기와 상보적 탈양자화기는 작은-크기 이득-수정 성분들을 위해 사용된다. 도시된 함수(111)는 양자화기, 탈양자화기 각각과 연결되어져서 사용된 이득계수 G=2의 스케일링 및 디스케일링 효과를 고려하고 있다. 탈양자화기의 출력값은 -0.3333 ..., 0.0 및 +0.3333...이고 양자화기 결정 포인트는 -0.1666 ... 및 +0.1666... 에 있다.
큰-크기 및 작은-크기 성분용 복합 함수는 도11에 도시되어있다.
e)변형 분할-간격함수
이득계수 G=2와 약 0.500정도의 임계값을 갖는 분할-간격 양자화기의 사용은 약1비트의 양자화 해상도의 향상을 제공한다. 이러한 향상된 해상도는 이 성분들에 1 비트만큼의 비트 할당치를 감소시켜면서 대규모 성분의 양자화 해상도를 보존하기 위해 사용될 수 있다. 상기 실시예 2에서 2비트 양자화기들은 큰-크기 및 작은-크기 성분들을 양자화하기 위해 사용될 수 있다. 두 양자화기들에 의해 구현된 양자화 함수들의 복합이 도12에 도시되어져 있다. 양자화 함수(112, 113)를 구현하는 양자화기들은 양 및 음 진폭을 각각 가지고 있는 큰-크기 성분들을 양자화하 기 위해 사용되어질 수도 있고 양자화 함수(111)를 구현하는 양자화기는 작은-크기 성분들을 양자화하기 위해 사용될 수 있다.
더 큰 이득계수와 더 작은 임계값을 갖는 분할-간격 양자화 함수의 사용은 향상된 양자화 해상도의 전체 비트를 제공하지는 않는다; 따라서 비트 할당은 양자화 해상도의 희생없이는 감소될 수 없다. 바람직한 실시예에서 큰-크기 가수(mantissas)를 위한 비트 할당치 b는 이득계수 G=2를 이용해서 이득 적응형 양자화된 블럭을 위해 1 비트정도 축소된다.
복호기에 제공된 탈양자화 함수는 부호기에 사용된 양자화 함수에 상보적이어야 한다.
6.내부-프레임 코딩(Intra-Frame Coding)
용어 "부호화 신호 블럭(encoded signal block)은 본문에서 입력신호의 유용한 밴드폭을 가로지르는 주파수 서브밴드들에 대한 모든 서브밴드-신호 블럭들을 나타내는 부호화 정보를 칭하도록 사용된다. 몇 코딩 시스템들은 부호화 신호의 프레임으로 분문에서 칭해지는, 보다 큰 유닛으로 다중 부호화신호 블럭들을 어셈블링한다. 프레임 구조는 부호화 신호 블럭들을 가로질러 정보를 공유하여 정보 총경비(overhead)를 감소시키거나, 또는 오디오 및 비디오 신호들 같은 신호들을 동기화하는 것이 용이하도록하기 위해 다수의 에플리케이션들에 사용된다. 오디오/비디오 에플리케이션들을 위한 프레임들속으로 오디오 정보를 부호화하여 포함된 다수의 이슈들은 본문에 참고로 인용되는, 1998년 10월 17일자로 제출된 미국 특허번호 PCT/US98/20751호에 기술되어 있다.
상기 이득-적응형 양자화의 특징은 다른 부호화 신호블럭들에 있는 서브밴드-신호 블럭들의 그룹들에 적용될 수 있다. 이런 양태는 예를 들면 부호화 신호 블럭들을 프레임들로 그룹화하는 에플리케이션들에서 유리하게 사용될 수 있다. 이런 기술은 다중 서브밴드-신호 블럭들의 성분들을 프레임내에 필히 그룹화하여 그 성분들을 분류하고(classifies) 상기 이런 그룹의 성분들에 이득 계수를 적용한다. 이런 소위 내부-프레임 코딩 기법은 프레임 내의 블럭들 사이에 정보를 공유할 수 있다. 부호화 신호 블럭들의 어떤 특정 그룹화도 이런 기법을 시행하도록 크리티컬하지 않다.
D.구현
본 발명은 일반 목적 컴퓨터 시스템에 구비된 것들과 유사한 성분들에 결합된 디지털 신호 처리기(DSP) 회로 같은 보다 특정화된 성분들을 포함하는 일반-목적 컴퓨터 시스템 또는 소정의 다른 장치의 소프트웨어를 포함하는 광범위한 방식으로 구현될 수 있다. 도13은 본 발명의 다양한 양태를 실현하기 위해 사용될 수 있는 디바이스(90)의 블럭 다이어그램이다. DSP(92)는 컴퓨팅 자원을 제공한다. RAM(93)은 시스템 램(RAM)이다. ROM(94)은 디바이스(90)를 작동하고 본 발명의 다양한 양태를 수행하기 위해 필요한 프로그램들을 저장하기 위한 읽기 전용 메모리(ROM) 같은 소정 형태의 영구 저장체를 나타낸다. I/O 제어체(95)는 통신 채널(96)을 통해 오디오 신호들을 송신 및 수신하도록 인터페이스 회로를 표시한다. 아날로그-디지털 컨버터들 및 디지털-아날로그 컨버터들은 아날로그 오디오 신호들을 수신 및/또는 송신하도록 요구되는 I/O 제어체(95)에 포함될 수 있다. 도시된 실시예에서, 모든 주 시스템은 하나 이상의 물리적 버스를 표시할 수 있는 버스(91)에 연결되고; 그러나, 버스 아키텍처는 본 발명을 구현하기 위해 요구되지 않는다.
일반 목적 컴퓨터 시스템에 구현된 실시예들에서, 추가적인 성분들이 키보드 또는 마우스 및 디스플레이 같은 디바이스들에 인터페이싱하기 위해 포함되고, 자기 테이프 또는 디스크 같은 저장 매체, 또는 광학 매체를 가지는 저장 디바이스를 제어하기 위해 포함될 수 있다. 저장 매체는 연산 시스템을 위한 명령어들의 프로그램, 유틸리티, 및 응용프로그램을 기록하기 위해 사용되고 본 발명의 다양한 양태들을 실현하는 프로그램들의 실시예들을 포함할 수 있다.
본 발명의 실질적 다양한 양태들에 필요한 기능들은 불연속 로직 성분들, 하나 이상의 ASIC 및/또는 프로그램-제어 프로세서를 포함하는 다양한 방식으로 구현되는 성분들에 의해 이행될 수 있다. 이들 성분들이 구현되는 방식은 본 발명에 중요하지 않다.
본 발명의 소프트웨어 구현들은 초음파로부터 자외선 주파수까지를 포함하는 스펙트럼을 통한 베이스밴드 또는 변조된 통신 경로들 같은 다양한 기계 판독가능한 매체, 또는 자기 테이프, 자기 디스크 및 광 디스크를 포함하는 임의의 자기 또는 광학 기록 기술을 필히 사용하는 정보를 전송하는 것들을 포함하는 저장 매체에 의해 전송할 수 있다. 다양한 양태들이 ASIC 같은 처리 회로, 일반-목적 집적회로, 읽기전용 메모리(ROM), 또는 RAM 의 다양한 형태로 포함된 프로그램들에 의해 제어되는 마이크로프로세서, 및 다른 기술들에 의해 컴퓨터 시스템(90)의 다양한 성분들로 구현될 수 있다.

Claims (42)

  1. 입력 신호를 부호화하는 방법에 있어서,
    입력 신호를 수신하고 상기 입력 신호의 주파수 서브밴드를 나타내는 서브밴드-신호 성분들의 서브밴드-신호 블럭을 발생시키는 단계;
    상기 서브밴드-신호 블럭의 성분들의 크기를 임계값과 비교하고, 각각의 성분을 각 성분 크기에 따라 둘 이상의 클래스(class)들 중 하나에 위치시키고, 이득 계수를 획득하는 단계;
    상기 서브밴드-신호 블럭의 소정의 성분들의 크기들을 수정하기 위하여 상기 클래스들 중 하나에 위치된 상기 성분들에 상기 이득 계수를 적용하는 단계;
    상기 서브밴드-신호 블럭의 상기 성분들을 양자화 하는 단계; 및
    성분 크기에 따라 상기 성분들이 위치된 클래스를 전송하는 제1 제어 정보 및 양자화 서브밴드-신호 성분들을 나타내는 비-균일(non-uniform) 길이의 심볼들을 부호화 신호로 어셈블링하는 단계;
    를 포함하는 것을 특징으로 하는 입력 신호 부호화 방법.
  2. 제1항에 있어서, 상기 이득 계수에 따라 수정되지 않은 크기들을 갖는 양자화 서브밴드-신호 성분들을 지시하는 부호화 신호로 제2 제어 정보를 어셈블링하되, 상기 제2 제어정보는 양자화 서브밴드-신호 성분들을 나타내기 위해 사용되지 않은 하나 이상의 예비 심볼들에 의해 전송되는 것을 특징으로 하는 입력 신호 부호화 방법.
  3. 제1항 또는 제2항에 있어서, 상기 양자화 성분들의 양자화 스텝 사이즈와 무관하지만 이득 계수에 의존하는 함수로부터 상기 임계값을 획득하는 단계를 포함하는 것을 특징으로 하는 입력 신호 부호화 방법.
  4. 제1항 또는 제2항에 있어서, 이득 계수 및 상기 양자화 성분들의 양자화 스텝 사이즈에 의존하는 함수로부터 상기 임계값을 획득하는 단계를 포함하는 것을 특징으로 하는 입력 신호 부호화 방법.
  5. 제1항에 있어서,
    상기 서브밴드-신호 블럭의 각 성분에 할당되는 비트들의 수를 변화시킴으로써 상기 성분이 위치된 클래스에 따라 상기 서브밴드-신호 블럭의 각 성분을 위한 각 양자화 스텝 사이즈가 변화되는 단계; 및
    수정된 크기들을 갖는 상기 성분들에 할당된 비트들의 수가 상기 각 양자화 스텝 사이즈를 보존하면서 감소되도록 상기 이득 계수를 획득하는 단계;
    를 포함하는 것을 특징으로 하는 입력 신호 부호화 방법.
  6. 제1항, 제2항 또는 제5항 중 어느 한 항에 있어서, 분할-간격 양자화 함수에 따라 상기 클래스들 중 하나에 위치된 상기 성분들을 양자화하는 단계를 포함하는 것을 특징으로 하는 입력 신호 부호화 방법.
  7. 제1항, 제2항 또는 제5항 중 어느 한 항에 있어서, 각각의 성분을 성분 크기에 따라 셋 이상의 클래스들 중 하나에 위치시키고,
    각 클래스와 각각 관련된 하나 이상의 추가 이득 계수들을 획득하는 단계; 및
    상기 관련된 각 클래스에 위치된 상기 성분들에 각각의 상기 추가 이득 계수들을 적용하는 단계;
    더 를 포함하는 것을 특징으로 하는 입력 신호 부호화 방법.
  8. 제1항, 제2항 또는 제5항 중 어느 한 항에 있어서,
    상기 서브밴드-신호 블럭의 적어도 소정의 상기 성분들의 크기들을 제2 임계값과 비교하고, 각각의 성분을 각 성분 크기에 따라 둘 이상의 제2 클래스들 중 하나에 위치시키며, 제2 이득 계수를 획득하는 단계; 및
    상기 서브밴드-신호 블럭의 소정의 성분들의 크기들을 수정하기 위하여 제2 클래스들 중 하나에 위치된 상기 성분들에 상기 제2 이득 계수를 적용하는 단계를 포함하며,
    상기 비-균일 길이 심볼들은 상기 이득 계수 및 상기 제2 이득 계수에 의해 수정된 양자화 성분들을 나타내는 것을 특징으로 하는 입력 신호 부호화 방법.
  9. 제1항, 제2항 또는 제5항 중 어느 한 항에 있어서, 하나 이상의 비-오버로딩 양자화기들을 사용하여 적어도 소정의 상기 성분들을 양자화하는 것을 특징으로 하는 입력 신호 부호화 방법.
  10. 부호화 신호를 복호화하기 위한 방법에 있어서,
    상기 부호화 신호를 수신하고, 그로부터 제1 제어 정보 및 비-균일 길이 심볼들을 획득하며, 상기 비-균일 길이 심볼들로부터 입력 신호의 주파수 서브밴드를 나타내는 양자화 서브밴드-신호 성분들을 획득하는 단계;
    서브밴드-신호 블럭의 탈양자화 성분들을 얻기 위해 상기 서브밴드-신호 성분들을 탈양자화하는 단계;
    수정된 서브밴드-신호 블럭의 탈양자화 성분들을 획득하기 위해서 제1 제어 정보에 따라 소정의 탈양자화 성분들의 크기들을 수정하도록 이득 계수를 적용하는 단계로서, 상기 수정된 서브밴드-신호 블럭의 각각의 탈양자화 성분은 임계값에 비하여 각 탈양자화 성분 크기에 따라 둘 이상의 클래스들 중에 하나에 있으며 이득 계수에 의해 수정된 모든 탈양자화 성분들은 동일한 클래스에 있는, 이득 계수 적용 단계; 및
    상기 수정된 서브밴드-신호 블럭의 탈양자화 성분들에 응답하여 출력신호를 발생시키는 단계;
    를 포함하는 것을 특징으로 하는 부호화 신호 복호화 방법.
  11. 제10항에 있어서, 상기 이득 계수에 따라 수정되지 않아야 하는 크기들을 가지는 양자화 서브밴드-신호 성분들을 지시하는 상기 부호화 신호로부터 제2 제어 정보를 획득하고, 상기 제2 제어 정보는 양자화 서브밴드-신호 성분들을 나타내는데 사용되지 않은 하나 이상의 예비 심볼들에 의해 전송되는 것을 특징으로 하는 입력 신호 부호화 방법.
  12. 제10항 또는 제11항에 있어서, 분할-간격 양자화 함수에 대응(對應)하는(complementary) 탈양자화 함수에 따라 상기 서브밴드-신호 블럭의 상기 소정의 양자화 성분들을 탈양자화하는 단계를 포함하는 것을 특징으로 하는 입력 신호 부호화 방법.
  13. 제10항 또는 제11항에 있어서, 상기 제1 제어 정보에 따라 소정의 상기 탈양자화 성분들의 크기들을 수정하도록 제2 이득 계수를 적용하는 단계를 포함하는 것을 특징으로 하는 입력 신호 부호화 방법.
  14. 제10항 또는 제11항에 있어서, 각 비-오버로딩 양자화기에 대응(對應)하는(complementary) 하나 이상의 탈양자화기를 사용하여 적어도 소정의 양자화 성분들을 탈양자화하는 것을 특징으로 하는 입력 신호 부호화 방법.
  15. 입력 신호를 부호화하기 위한 장치에 있어서,
    상기 입력 신호를 수신하는 입력을 가지며 상기 입력 신호의 주파수 서브밴드를 나타내는 서브밴드-신호 성분들의 서브밴드-신호 블럭을 제공하는 출력을 가지는 분석 필터;
    상기 서브밴드-신호 블럭의 성분들의 크기들을 임계값과 비교하고, 각각의 성분을 성분 크기에 따라 둘 이상의 클래스들 중 하나에 위치시키며, 이득 계수를 획득하는 상기 분석 필터에 결합된 서브밴드-신호 블럭 애널라이저;
    상기 서브밴드-신호 블럭의 소정의 성분들의 크기들을 수정하기 위하여 상기 이득 계수를 상기 클래스들 중 하나에 위치된 상기 성분들에 적용하는 상기 서브밴드-신호 블럭 애널라이저에 결합된 서브밴드-신호 성분 프로세서;
    상기 이득 계수에 따라 수정된 크기들을 가지는 상기 서브밴드-신호 블럭의 상기 성분들을 양자화하는 상기 서브밴드-신호 프로세서에 결합된 제1 양자화기; 및
    성분 크기에 따라 상기 성분들이 위치된 클래스를 전송하는 제1 제어 정보 및 양자화 서브밴드-신호 성분들을 나타내는 비-균일 길이 심볼들을 부호화 신호에 어셈블링하는 제1 양자화기에 결합된 포맷터;
    를 포함하는 것을 특징으로 하는 입력 신호 부호화 장치.
  16. 제15항에 있어서, 분할-간격 양자화 함수에 따라 상기 클래스들 중 하나에 위치된 상기 성분들을 양자화하는 상기 서브밴드-신호 블럭 애널라이저에 결합된 제2 양자화기를 포함하며, 상기 포맷터는 또한 상기 제2 양자화기에 결합되는 것을 특징으로 하는 입력 신호 부호화 장치.
  17. 제15항 또는 제16항에 있어서, 상기 포맷터는 제2 제어 정보를 상기 이득 계수에 따라 수정되지 않은 크기들을 가지는 양자화 서브밴드-신호 성분들을 지시하는 상기 부호화 신호로 어셈블링하며, 상기 제2 제어 정보는 양자화 서브밴드-신호 성분들을 나타내는데 사용되지 않은 하나 이상의 예비 심볼들에 의해 전송되는 것을 특징으로 하는 입력 신호 부호화 장치.
  18. 제15항 또는 제16항에 있어서, 이득 계수에 의존하지만 상기 양자화 성분들의 양자화 스텝 사이즈와는 무관한 함수로부터 상기 임계값을 획득하는 것을 특징으로 하는 입력 신호 부호화 장치.
  19. 제15항 또는 제16항에 있어서, 이득 계수 및 상기 양자화 성분들의 양자화 스텝 사이즈에 의존하는 함수로부터 상기 임계값을 획득하는 것을 특징으로 하는 입력 신호 부호화 장치.
  20. 제15항에 있어서, 상기 서브밴드-신호 블럭의 각 성분에 할당되는 비트들의 수를 변화시킴으로써 상기 성분이 위치된 클래스에 따라 상기 서브밴드-신호 블럭의 각 성분을 위한 각 양자화 스텝 사이즈가 변화되고, 그리고 수정된 크기들을 갖는 상기 성분들에 할당된 비트들의 수가 상기 각 양자화 스텝 사이즈를 보존하면서 감소되도록 상기 이득 계수를 획득하는 것을 특징으로 하는 입력 신호 부호화 장치.
  21. 제15항, 제16항 또는 제20항 중 어느 한 항에 있어서, 성분 크기에 따라 셋 이상의 클래스들 중 하나에 각각의 성분을 위치시키고, 각 클래스와 각각 관련된 하나 이상의 추가 이득 계수들을 획득하며, 상기 관련된 각 클래스에 위치된 상기 성분들에 각각의 상기 추가 이득 계수들을 적용하는 것을 특징으로 하는 입력 신호 부호화 장치.
  22. 제15항, 제16항 또는 제20항 중 어느 한 항에 있어서,
    상기 서브밴드-신호 블럭 애널라이저는 상기 서브밴드-신호 블럭의 적어도 소정의 상기 성분들을 제2 임계값과 비교하고, 각각의 성분을 성분 크기에 따라 두개 이상의 제2 클래스들 중 하나에 위치시키며, 제2 이득 계수를 획득하고;
    상기 서브밴드-신호 성분 프로세서는 상기 서브밴드-신호 블럭의 소정의 성분들의 크기들을 수정하기 위하여 상기 제2 클래스들 중 하나에 위치된 상기 성분들에 상기 제2 이득 계수를 적용하며;
    상기 비-균일 길이 심볼들은 상기 이득 계수 및 상기 제2 이득 계수에 의해 수정된 상기 양자화 성분들을 나타내는 것을 특징으로 하는 입력 신호 부호화 장치.
  23. 제15항, 제16항 또는 제20항 중 어느 한 항에 있어서, 하나 이상의 비-오버로딩 양자화기들을 사용하여 적어도 소정의 상기 성분들을 양자화하는 것을 특징으로 하는 입력 신호 부호화 장치.
  24. 부호화 신호를 복호화하기 위한 장치에 있어서,
    상기 부호화 신호를 수신하여 이로부터 제1 제어 정보 및 비-균일 길이 심볼들을 획득하며, 상기 비-균일 길이 심볼들로부터 양자화 서브밴드-신호 성분들을 획득하는 디포맷터;
    제1 탈양자화 성분들의 서브밴드-신호 블럭을 획득하기 위해 상기 제1 제어 정보에 따라 상기 블럭의 소정의 상기 서브밴드-신호 성분들을 탈양자화하는 상기 디포맷터에 결합된 제1 탈양자화기;
    상기 제1 제어 정보에 따라 상기 서브밴드-신호 블럭의 소정의 제1 탈양자화 성분들의 크기들을 수정하기 위하여 이득 계수를 적용하는 상기 제1 탈양자화기에 결합되어, 탈양자화 성분들의 수정된 서브밴드-신호 블럭을 획득하는 서브밴드-신호 블럭 프로세서로서, 상기 수정된 서브밴드-신호 블럭의 각각의 탈양자화 성분은 임계값에 비하여 각 탈양자화 성분 크기에 따라 둘 이상의 클래스들 중 하나에 있으며 그리고 이득 계수에 의해 수정된 모든 탈양자화 성분들은 동일 클래스에 있는, 서브밴드-신호 블럭 프로세서; 및
    상기 서브밴드-신호 프로세서에 결합된 입력을 가지며 출력 신호가 제공되는 출력을 가지는 합성 필터;
    를 포함하는 것을 특징으로 하는 부호화 신호 복호화 장치.
  25. 제24항에 있어서, 제2 탈양자화 성분들을 획득하기 위해 분할-간격 양자화 함수에 대응(對應)하는(complementary) 탈양자화 함수에 따라 블럭의 다른 서브밴드-신호 성분들을 탈양자화하는 상기 디포맷터에 결합된 제2 탈양자화기를 포함하며, 상기 합성 필터는 상기 제2 탈양자화기에 결합된 입력을 갖는 것을 특징으로 하는 부호화 신호 복호화 장치.
  26. 제24항 또는 제25항에 있어서, 상기 디포맷터는 상기 이득 계수에 따라 수정되지 않아야 하는 크기들을 가지는 양자화 서브밴드-신호 성분들을 지시하는 상기 부호화 신호로부터 제2 제어 정보를 획득하며, 상기 제2 제어 정보는 양자화 서브밴드-신호 성분들을 나타내는데 사용되지 않은 하나 이상의 예비 심볼들에 의해 전달되는 것을 특징으로 하는 부호화 신호 복호화 장치.
  27. 제24항 또는 제25항에 있어서, 상기 서브밴드-신호 블럭 프로세서는 상기 제1 제어정보에 따라 소정의 상기 탈양자화 성분들의 크기를 수정하기 위하여 제2 이득 계수를 적용하는 것을 특징으로 하는 부호화 신호 복호화 장치.
  28. 제24항 또는 제25항에 있어서, 각 비-오버로딩 양자화기에 대응(對應)하는(complementary) 하나 이상의 탈양자화기들을 사용하여 적어도 소정의 상기 양자화 성분들을 탈양자화하는 것을 특징으로 하는 부호화 신호 복호화 장치.
  29. 입력 신호를 부호화하기 위한 방법을 이행하는 장치가 실행하기 위한 컴퓨터 프로그램 명령어들을 포함하는 컴퓨터 판독가능 매체에 있어서,
    상기 방법은,
    상기 입력 신호를 수신하고 상기 입력신호의 주파수 서브밴드를 나타내는 서브밴드-신호 성분들의 서브밴드-신호 블럭을 발생시키는 단계;
    상기 서브밴드-신호 블럭의 성분들의 크기들을 임계값과 비교하고, 각각의 성분을 성분 크기에 따라 둘 이상의 클래스들 중 하나에 위치시키고, 이득 계수를 획득하는 단계;
    상기 서브밴드-신호 블럭의 소정의 성분들의 크기들을 수정하기 위하여 상기 클래스들 중 하나에 위치된 상기 성분들에 상기 이득 계수를 적용하는 단계;
    상기 서브밴드-신호 블럭의 상기 성분들을 양자화 하는 단계; 및
    성분 크기에 따라 상기 성분들이 위치된 클래스를 전송하는 제1 제어 정보 및 및 양자화 서브밴드-신호 성분들을 나타내는 비-균일 길이의 심볼들을 부호화 신호로 어셈블링하는 단계;
    를 포함하는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  30. 제29항에 있어서, 상기 방법은 상기 이득 계수에 따라 수정되지 않은 크기들을 갖는 양자화 서브밴드-신호 성분들을 지시하는 부호화 신호로 제2 제어 정보를 어셈블링하며, 상기 제2 제어정보는 양자화 서브밴드-신호 성분들을 나타내기 위해 사용되지 않은 하나 이상의 예비 심벌들에 의해 전송되는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  31. 제29항 또는 제30항에 있어서, 상기 방법은 상기 양자화 성분들의 양자화 스텝 사이즈와 무관하지만 이득 계수에 의존하는 함수로부터 상기 임계값을 획득하는 단계를 포함하는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  32. 제29항 또는 제30항에 있어서, 상기 방법은 이득 계수 및 상기 양자화 성분들의 양자화 스텝 사이즈에 의존하는 함수로부터 상기 임계값을 획득하는 단계를 포함하는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  33. 제29항에 있어서, 상기 방법은
    상기 서브밴드-신호 블럭의 각 성분에 할당되는 비트들의 수를 변화시킴으로써 상기 성분이 위치된 클래스에 따라 상기 서브밴드-신호 블럭의 각 성분을 위한 각 양자화 스텝 사이즈가 변화되는 단계; 및
    수정된 크기들을 가지는 상기 성분들에 할당된 비트들의 수가 상기 각 양자화 스텝 사이즈를 보존하면서 감소되도록 상기 이득계수를 획득하는 단계;
    를 포함하는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  34. 제29항, 제30항 또는 제33항 중 어느 한 항에 있어서, 상기 방법은 분할-간격 양자화 함수에 따라 상기 클래스들 중 하나에 위치된 상기 성분들을 양자화하는 단계를 포함하는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  35. 제29항, 제30항 또는 제33항 중 어느 한 항에 있어서, 상기 방법은 각각의 성분을 성분 크기에 따라 셋 이상의 클래스들 중 하나에 위치시키고,
    각 클래스와 각각 관련된 하나 이상의 추가 이득 계수들을 획득하는 단계; 및
    상기 관련된 각 클래스에 위치된 상기 성분들에 각각의 상기 추가 이득 계수들을 적용하는 단계;
    더 를 포함하는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  36. 제29항, 제30항 또는 제33항 중 어느 한 항에 있어서, 상기 방법은
    상기 서브밴드-신호 블럭의 적어도 소정의 상기 성분들의 크기들을 제2 임계값과 비교하고, 각각의 성분을 성분 크기에 따라 둘 이상의 제2 클래스들 중 하나에 위치시키며, 제2 이득 계수를 획득하는 단계; 및
    상기 제2 이득 계수를 상기 서브밴드-신호 블럭의 소정의 성분들의 크기들을 수정하기 위하여 제2 클래스들 중 하나에 위치된 상기 성분들에 적용하는 단계;를 포함하며,
    상기 비-균일 길이 심볼들은 상기 이득 계수 및 상기 제2 이득 계수에 의해 수정되는 상기 양자화 성분들을 나타내는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  37. 제29항, 제30항 또는 제33항 중 어느 한 항에 있어서, 상기 방법은 하나 이상의 비-오버로딩 양자화기들을 사용하여 적어도 소정의 상기 성분들을 양자화하는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  38. 부호화 신호를 복호화하기 위한 방법을 이행하는 장치가 실행하기 위한 컴퓨터 프로그램 명령어들을 포함하는 컴퓨터 판독가능 매체에 있어서,
    상기 방법은
    상기 부호화 신호를 수신하여 이로부터 제1 제어정보 및 비-균일 길이 심볼들을 획득하며, 상기 비-균일 길이 심볼들로부터 입력 신호의 주파수 서브밴드를 나타내는 양자화 서브밴드-신호 성분들을 획득하는 단계;
    서브밴드-신호 블럭의 탈양자화 성분들을 얻기 위해 상기 서브밴드-신호 성분들을 탈양자화하는 단계;
    수정된 서브밴드-신호 블럭의 탈양자화 성분들을 획득하기 위해서 상기 제1 제어 정보에 따라 소정의 탈양자화 성분들의 크기들을 수정하도록 이득 계수를 적용하는 단계로서, 상기 수정된 서브밴드-신호 블럭의 각각의 탈양자화 성분은 임계값에 비하여 각 탈양자화 성분 크기에 따라 둘 이상의 클래스들 중에 하나에 있으며 이득 계수에 의해 수정된 모든 탈양자화 성분들은 동일한 클래스에 있는, 이득 계수 적용 단계; 및
    상기 수정된 서브밴드-신호 블럭의 탈양자화 성분들에 응답하여 출력신호를 발생시키는 단계;
    를 포함하는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  39. 제38항에 있어서, 상기 방법은 상기 이득 계수에 따라 수정되지 않아야 하는 크기들을 가지는 양자화 서브밴드-신호 성분들을 지시하는 상기 부호화 신호로부터 제2 제어 정보를 획득하고, 상기 제2 제어 정보는 양자화 서브밴드-신호 성분들을 나타는데 사용되지 않은 하나 이상의 예비 심볼들에 의해 전송되는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  40. 제38항 또는 제39항에 있어서, 상기 방법은 분할-간격 양자화 함수에 대응(對應)하는(complementary) 탈양자화 함수에 따라 상기 서브밴드-신호 블럭의 상기 소정의 양자화 성분들을 탈양자화하는 단계를 포함하는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  41. 제38항 또는 제39항에 있어서, 상기 방법은 상기 제1 제어 정보에 따라 소정의 상기 탈양자화 성분들의 크기들을 수정하기 위하여 제2 이득 계수를 적용하는 단계를 포함하는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  42. 제38항 또는 제39항에 있어서, 상기 방법은 각각의 비-오버로딩 양자화기에 대응(對應)하는(complementary) 하나 이상의 탈양자화기들을 사용하여 적어도 소정의 양자화 성분들을 탈양자화하는 것을 특징으로 하는 컴퓨터 판독가능 매체.
KR1020017013223A 1999-04-16 2000-04-11 오디오 코딩을 위해 이득-적응형 양자화 및 비균일 심볼길이를 사용하는 방법 및 장치 KR100893281B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US29357799A 1999-04-16 1999-04-16
US09/293,577 1999-04-16
US09/349,645 US6246345B1 (en) 1999-04-16 1999-07-08 Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding
US09/349,645 1999-07-08

Publications (2)

Publication Number Publication Date
KR20010112434A KR20010112434A (ko) 2001-12-20
KR100893281B1 true KR100893281B1 (ko) 2009-04-17

Family

ID=26968028

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020017013223A KR100893281B1 (ko) 1999-04-16 2000-04-11 오디오 코딩을 위해 이득-적응형 양자화 및 비균일 심볼길이를 사용하는 방법 및 장치

Country Status (17)

Country Link
EP (1) EP1175670B2 (ko)
JP (1) JP4843142B2 (ko)
KR (1) KR100893281B1 (ko)
CN (1) CN1158646C (ko)
AR (1) AR023444A1 (ko)
AT (1) ATE269574T1 (ko)
AU (1) AU771454B2 (ko)
BR (1) BRPI0010672B1 (ko)
CA (1) CA2368453C (ko)
DE (1) DE60011606T3 (ko)
DK (1) DK1175670T4 (ko)
ES (1) ES2218148T5 (ko)
HK (1) HK1045747B (ko)
MX (1) MXPA01010447A (ko)
MY (1) MY122486A (ko)
TW (1) TW536692B (ko)
WO (1) WO2000063886A1 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
DE102004007200B3 (de) 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
DE102004007191B3 (de) 2004-02-13 2005-09-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
DE102004007184B3 (de) 2004-02-13 2005-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Quantisieren eines Informationssignals
JP5235684B2 (ja) * 2006-02-24 2013-07-10 フランス・テレコム 信号包絡線の量子化インデックスをバイナリ符号化する方法、信号包絡線を復号化する方法、および、対応する符号化および復号化モジュール
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
WO2008013672A2 (en) * 2006-07-24 2008-01-31 Marvell World Trade Ltd. Magnetic and optical rotating storage systems with audio monitoring
ATE548727T1 (de) * 2007-03-02 2012-03-15 Ericsson Telefon Ab L M Nachfilter für geschichtete codecs
US8924222B2 (en) * 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
KR101210892B1 (ko) * 2011-08-29 2012-12-11 주식회사 아이벡스피티홀딩스 Amvp 모드에서의 예측 블록 생성 방법
MX341885B (es) 2012-12-13 2016-09-07 Panasonic Ip Corp America Dispositivo de codificacion de sonido de voz, dispositivo de decodificacion de sonido de voz, metodo de codificacion de sonido de voz y metodo de decodificacion de sonido de voz.
CN116366411B (zh) * 2023-03-28 2024-03-08 扬州宇安电子科技有限公司 一种多比特信号量化自适应门限生成及量化方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0717392A1 (en) * 1994-05-25 1996-06-19 Sony Corporation Encoding method, decoding method, encoding-decoding method, encoder, decoder, and encoder-decoder
US5924064A (en) * 1996-10-07 1999-07-13 Picturetel Corporation Variable length coding using a plurality of region bit allocation patterns

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5365553A (en) * 1990-11-30 1994-11-15 U.S. Philips Corporation Transmitter, encoding system and method employing use of a bit need determiner for subband coding a digital signal
JP3307138B2 (ja) * 1995-02-27 2002-07-24 ソニー株式会社 信号符号化方法及び装置、並びに信号復号化方法及び装置
US6006179A (en) * 1997-10-28 1999-12-21 America Online, Inc. Audio codec using adaptive sparse vector quantization with subband vector classification

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0717392A1 (en) * 1994-05-25 1996-06-19 Sony Corporation Encoding method, decoding method, encoding-decoding method, encoder, decoder, and encoder-decoder
US5924064A (en) * 1996-10-07 1999-07-13 Picturetel Corporation Variable length coding using a plurality of region bit allocation patterns

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
International Standard ISO/IEC 11172-3, First Edition, 1993-08-01: Information technology-Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s-Part3:Audio *
International Standard ISO/IEC 11172-3, First Edition, 1993-08-01: Information technology-Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s-Part3:Audio*

Also Published As

Publication number Publication date
DE60011606T2 (de) 2005-06-23
HK1045747B (zh) 2004-12-31
WO2000063886A1 (en) 2000-10-26
HK1045747A1 (en) 2002-12-06
JP2002542522A (ja) 2002-12-10
EP1175670A1 (en) 2002-01-30
DE60011606T3 (de) 2008-01-24
KR20010112434A (ko) 2001-12-20
CA2368453C (en) 2009-12-08
AR023444A1 (es) 2002-09-04
JP4843142B2 (ja) 2011-12-21
ES2218148T5 (es) 2008-02-16
BR0010672A (pt) 2002-02-19
CN1347549A (zh) 2002-05-01
EP1175670B2 (en) 2007-09-19
ES2218148T3 (es) 2004-11-16
CN1158646C (zh) 2004-07-21
MY122486A (en) 2006-04-29
DE60011606D1 (de) 2004-07-22
AU771454B2 (en) 2004-03-25
CA2368453A1 (en) 2000-10-26
AU4227900A (en) 2000-11-02
MXPA01010447A (es) 2002-07-30
EP1175670B1 (en) 2004-06-16
TW536692B (en) 2003-06-11
DK1175670T4 (da) 2007-11-19
ATE269574T1 (de) 2004-07-15
DK1175670T3 (da) 2004-10-11
BRPI0010672B1 (pt) 2016-06-07

Similar Documents

Publication Publication Date Title
US6246345B1 (en) Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding
KR100991450B1 (ko) 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템
US6308150B1 (en) Dynamic bit allocation apparatus and method for audio coding
US5752225A (en) Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands
US7613603B2 (en) Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model
US6064954A (en) Digital audio signal coding
CN100367348C (zh) 低比特速率音频编码
JP5175028B2 (ja) デジタル信号の符号化方法及び装置ならびに復号化方法及び装置
US4914701A (en) Method and apparatus for encoding speech
EP1701452B1 (en) System and method for masking quantization noise of audio signals
KR100893281B1 (ko) 오디오 코딩을 위해 이득-적응형 양자화 및 비균일 심볼길이를 사용하는 방법 및 장치
RU2505921C2 (ru) Способ и устройство кодирования и декодирования аудиосигналов (варианты)
US20090132238A1 (en) Efficient method for reusing scale factors to improve the efficiency of an audio encoder
KR100738109B1 (ko) 입력 신호의 양자화 및 역양자화 방법과 장치, 입력신호의부호화 및 복호화 방법과 장치
JPH03167927A (ja) 心理的聴覚基準で適応形量子化する変換ディジタルオーディオ放送信号用の信号圧縮装置
US8149927B2 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
US6466912B1 (en) Perceptual coding of audio signals employing envelope uncertainty
US7613609B2 (en) Apparatus and method for encoding a multi-channel signal and a program pertaining thereto
JPH08307281A (ja) 非線形量子化方法及び非線形逆量子化方法
KR970006827B1 (ko) 오디오신호 부호화장치
KR940010542A (ko) 가변비트할당 방식의 부호화시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
A107 Divisional application of patent
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130325

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140325

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20160325

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20180328

Year of fee payment: 10