KR20130047643A - 통신 시스템에서 신호 코덱 장치 및 방법 - Google Patents

통신 시스템에서 신호 코덱 장치 및 방법 Download PDF

Info

Publication number
KR20130047643A
KR20130047643A KR1020120120422A KR20120120422A KR20130047643A KR 20130047643 A KR20130047643 A KR 20130047643A KR 1020120120422 A KR1020120120422 A KR 1020120120422A KR 20120120422 A KR20120120422 A KR 20120120422A KR 20130047643 A KR20130047643 A KR 20130047643A
Authority
KR
South Korea
Prior art keywords
coefficients
subband
quantization
indices
quantizer
Prior art date
Application number
KR1020120120422A
Other languages
English (en)
Inventor
성종모
김도영
이병선
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Publication of KR20130047643A publication Critical patent/KR20130047643A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은, 통신 시스템에서 음성 및 오디오 신호를 부호화하는 코덱(codec) 장치 및 방법에 관한 것으로, 시간 영역의 음성 및 오디오 신호를 주파수 영역으로 변환하여, 상기 음성 및 오디오 신호의 주파수 계수들을 산출하고, 상기 주파수 계수들을 복수의 부대역들 별로 분할한 후, 상기 주파수 계수들로부터 상기 부대역들 별 부대역 계수들을 산출하며, 상기 부대역들 별 특성에 따라 상기 부대역 계수들을 양자화하여 부대역 양자화 인덱스들을 산출한다.

Description

통신 시스템에서 신호 코덱 장치 및 방법{Apparatus and method for codec signal in a communication system}
본 발명은, 통신 시스템에 관한 것으로, 특히 통신 시스템에서 음성 및 오디오 신호를 부호화하는 코덱(codec) 장치 및 방법에 관한 것이다.
통신 시스템에서는 고속의 전송 속도를 가지는 다양한 서비스 품질(QoS: Quality of Service, 이하 'QoS'라 칭하기로 함)의 서비스들을 사용자들에게 제공하기 위한 활발한 연구가 진행되고 있다. 이러한 통신 시스템은, 다양한 형태의 QoS를 가지는 데이터를 한정된 자원을 통해 빠르게 전송하기 위한 방안들이 제안되고 있으며, 최근 네트워크의 발달과 고품질 서비스에 대한 사용자 요구가 증가함에 따라 네트워크에서 음성 및 오디오 신호를 송수신하기 위해 상기 음성 및 오디오 신호를 압축 및 복원하는 방안들이 제안되었으며, 이러한 음성 및 오디오 신호의 압축 및 복원을 위해 많은 음성/오디오 코덱(codec)들이 개발되었다.
한편, 통신 시스템에서는, 음성 및 오디오 신호를 디지털 통신망을 통해 송수신하기 위해, 디지털 신호로 변환된 음성 및 오디오 신호를 압축하는 인코더와, 압축된 데이터로부터 음성 및 오디오 신호를 복원하는 디코더가 필수적으로 필요하다. 여기서, 일반적으로 인코더와 디코더를 합하여 코덱 또는 코더라고 한다. 최근 통신 시스템에서의 음성/오디오 코덱은, 기존 전화망 대역에 해당하는 협대역 음성을 부호화/복호화하는데서 벗어나 보다 나은 자연성과 명료성을 제공하기 위해 광대역 혹은 슈퍼와이드밴드 음성 및 오디오 신호를 부호화/복호화하기 위한 연구가 이루어지고 있다. 특히, 다양한 형태의 네트워크 환경을 수용하기 위해서 하나의 부호화기에서 여러 가지 전송율을 지원하는 다중 비트율 부호화기가 제안되고 있으며, 이러한 다중 비트율 지원뿐만 아니라 동시에 여러 대역폭을 가진 신호를 수용하기 위한 대역폭 확장성과 각 전송율 간의 호환성을 가지는 비트율 확장성을 제공하는 임베디드(embedded) 가변 비트율을 지원하는 부호화기도 제안되었다. 여기서, 상기 임베디드 가변 비트율 부호화기에서는 높은 전송율의 비트스트림이 낮은 전송율의 비트스트림을 포함하는 형태로 구성되어 있으며, 이러한 비트스트림 구조를 지원하기 위해 계층적으로 부호화를 수행한다.
또한, 최근 통신 시스템에서의 음성/오디오 코덱은, 신호 대역폭이 확장됨에 따라 음악과 같음 오디오 신호에 대한 부호화/복호화 성능이 중요하게 고려되고 있으며, 이를 위해 전체 신호 대역을 저대역과 고대역으로 분할하여, 저대역 신호에는 파형 부호화 및 코드 여기 선형 예측(CELP: Code Excited Linear Prediction, 이하 'CELP'라 칭하기로 함) 부호화를 적용하고, 고대역 신호에 대해서는 변환 부호화를 기반으로 한 하이브리드(hybrid) 부호화를 적용한다.
이러한 상기 음성/오디오 코덱들은, 전술한 바와 같은, 음성 및 오디오 신호의 부호화 시에, 음성 및 오디오 신호를 시간 영역에서 변형 이산코사인 변환(MDCT: Modified Discrete Cosine Transform, 이하 'MDCT'라 칭하기로 함) 또는 이산 퓨리에 변환(DFT: Discrete Fourier Transform, 이하 'DFT'라 칭하기로 함)을 통해 주파수 영역으로 변환하여 양자화한다.
하지만, 현재 통신 시스템에서 음성 및 오디오 신호를 음성/오디오 코덱을 이용하여 부호화할 경우, 전술한 바와 같이, 음성 및 오디오 신호를 주파수 영역으로 변환하여 양자화하여야 하나, 현재 음성/오디오 코덱에서 주파수 영역의 음성 및 오디오 신호를 양자화하는 방안, 특히 음성/오디오 코덱에서 음성 및 오디오 신호의 주파수 계수들을 양자화하는 구체적인 방안이 제안되지 못하고 있으며, 그에 따라 음성/오디오 코덱을 이용한 음성 및 오디오 신호의 부호화를 정상적으로 수행하지 못함으로써, 음성 및 오디오 신호의 부호화 성능이 저하되어 고품질의 음성 및 오디오 서비스를 사용자들에게 제공하지 못하는 문제점이 있다.
따라서, 통신 시스템에서 고품질의 음성 및 오디오 서비스를 제공하기 위해, 음성/오디오 코덱에서 주파수 영역으로 변환된 음성 및 오디오 신호의 주파수 계수들을 양자화하여, 상기 음성/오디오 코덱을 기반으로 음성 및 오디오 신호를 정상적으로 부호화하는 방안이 필요하다.
따라서, 본 발명의 목적은, 통신 시스템에서 신호를 부호화하는 코덱(codec) 장치 및 방법을 제공함에 있다.
또한, 본 발명의 다른 목적은, 통신 시스템에서 음성/오디오 코덱을 이용하여 음성 및 오디오 신호를 부호화하는 코덱 장치 및 방법을 제공함에 있다.
그리고, 본 발명의 다른 목적은, 통신 시스템에서 음성/오디오 코덱을 이용한 음성 및 오디오 신호의 부호화 시에, 상기 음성/오디오 코덱에서 주파수 영역으로 변환된 음성 및 오디오 신호의 주파수 계수들을 양자화하여, 상기 음성/오디오 코덱을 기반으로 음성 및 오디오 신호를 정상적으로 부호화하는 신호 코덱 장치 및 방법을 제공함에 있다.
아울러, 본 발명의 또 다른 목적은, 통신 시스템에서 음성/오디오 코덱을 이용한 음성 및 오디오 신호의 부호화 시에, 상기 음성/오디오 코덱에서 변형 이산코사인 변환(MDCT: Modified Discrete Cosine Transform)을 통해 주파수 영역으로 변환된 음성 및 오디오 신호의 주파수 계수들을 부대역들 별 특성을 고려하여 양자화함으로써, 상기 음성/오디오 코덱을 기반으로 음성 및 오디오 신호를 정상적으로 부호화하여, 음성 및 오디오 서비스 품질을 향상시키는 신호 코덱 장치 및 방법을 제공함에 있다.
상기한 목적들을 달성하기 위한 본 발명의 장치는, 통신 시스템에서 신호를 부호화하는 코덱(codec) 장치에 있어서, 시간 영역의 음성 및 오디오 신호를 주파수 영역으로 변환하여, 상기 음성 및 오디오 신호의 주파수 계수들을 산출하는 변환기; 상기 주파수 계수들을 복수의 부대역들 별로 분할한 후, 상기 주파수 계수들로부터 상기 부대역들 별 부대역 계수들을 산출하는 대역 분할기; 및 상기 부대역들 별 특성에 따라 상기 부대역 계수들을 양자화하여 부대역 양자화 인덱스들을 산출하는 부대역 계수 양자화기;를 포함한다.
상기한 목적들을 달성하기 위한 본 발명의 방법은, 통신 시스템에서 신호를 부호화하는 코덱(codec) 방법에 있어서, 시간 영역의 음성 및 오디오 신호를 주파수 영역으로 변환하여, 상기 음성 및 오디오 신호의 주파수 계수들을 산출하는 단계; 상기 주파수 계수들을 복수의 부대역들 별로 분할한 후, 상기 주파수 계수들로부터 상기 부대역들 별 부대역 계수들을 산출하는 단계; 및 상기 부대역들 별 특성에 따라 상기 부대역 계수들을 양자화하여 부대역 양자화 인덱스들을 산출하는 단계;를 포함한다.
본 발명은, 통신 시스템에서 음성/오디오 코덱을 이용한 음성 및 오디오 신호의 부호화 시에, 상기 음성/오디오 코덱에서 MDCT를 통해 주파수 영역으로 변환된 음성 및 오디오 신호의 주파수 계수들을 부대역들 별 특성을 고려하여 양자화함으로써, 상기 음성 및 오디오 신호의 주파수 계수들에 대한 양자화 오류를 최소화하며, 그에 따라 상기 음성/오디오 코덱을 기반으로 음성 및 오디오 신호의 부호화 성능을 향상시켜 고품질의 음성 및 오디오 서비스를 제공할 수 있다.
도 1은 본 발명의 실시 예에 따른 통신 시스템에서 코덱 장치의 구조를 개략적으로 도시한 도면.
도 2, 도 3, 및 도 5는 본 발명의 실시 예에 따른 통신 시스템에서 코덱 장치의 부대역 계수 양자화기 구조를 개략적으로 도시한 도면.
도 4는 본 발명의 실시 예에 따른 통신 시스템에서 코덱 장치의 부대역 계수 양자화기에서의 이득-모양 양자화기 구조를 개략적으로 도시한 도면.
도 6은 본 발명의 실시 예에 따른 통신 시스템에서 코덱 장치의 코덱 과정을 개략적으로 도시한 도면.
이하, 본 발명에 따른 바람직한 실시 예를 첨부한 도면을 참조하여 상세히 설명한다. 하기의 설명에서는 본 발명에 따른 동작을 이해하는데 필요한 부분만이 설명되며 그 이외 부분의 설명은 본 발명의 요지를 흩뜨리지 않도록 생략될 것이라는 것을 유의하여야 한다.
본 발명은, 통신 시스템에서 신호 코덱(codec) 장치 및 방법을 제안한다. 여기서, 본 발명의 실시 예에서는, 통신 시스템에서 다양한 서비스 품질(QoS: Quality of Service, 이하 'QoS'라 칭하기로 함)의 서비스들, 예컨대 음성 및 오디오 서비스를 제공하기 위한 음성 및 오디오 신호를 부호화하는 코덱 장치 및 방법을 일 예로 하여 설명하지만, 본 발명에서 제안하는 코덱은, 다른 서비스들에 해당하는 신호를 부호화하는 경우에도 동일하게 적용될 수 있다.
또한, 본 발명의 실시 예에서는, 통신 시스템에서 음성/오디오 코덱을 이용하여 음성 및 오디오 신호를 부호화하는 코덱 장치 및 방법을 제안한다. 여기서, 본 발명의 실시 예에서는, 음성/오디오 코덱을 이용한 음성 및 오디오 신호의 부호화 시에, 상기 음성/오디오 코덱에서 주파수 영역의 음성 및 오디오 신호를 양자화하여, 상기 음성/오디오 코덱을 기반으로 하여 음성 및 오디오 신호를 정상적으로 부호화한다.
그리고, 본 발명의 실시 예에서는, 통신 시스템의 음성/오디오 코덱에서, 변형 이산코사인 변환(MDCT: Modified Discrete Cosine Transform, 이하 'MDCT'라 칭하기로 함) 또는 이산 퓨리에 변환(DFT: Discrete Fourier Transform, 이하 'DFT'라 칭하기로 함)을 통해 주파수 영역으로 변환한 음성 및 오디오 신호를 양자화하여, 상기 음성/오디오 코덱으로 상기 음성 및 오디오 신호를 정상적으로 부호화하며, 그에 따라 고품질의 음성 및 오디오 서비스를 제공한다. 여기서, 본 발명의 실시 예에서는, 상기 음성/오디오 코덱에서 상기 MDCT를 통해 음성 및 오디오 신호를 주파수 영역으로 변환하는 경우를 중심으로 설명하지만, 본 발명에서 제안하는 음성/오디오 코덱 기반의 코덱은, 상기 DFT를 통해 상기 음성 및 오디오 신호를 주파수 영역으로 변환하는 경우 뿐만 아니라 상기 음성 및 오디오 신호를 다른 변환 방식을 통해 주파수 영역으로 변환하는 경우에도 동일하게 적용될 수 있다.
아울러, 본 발명의 실시 예에 따른 통신 시스템에서는, 상기 음성/오디오 코덱에서, 주파수 영역으로 변환된 음성 및 오디오 신호, 예컨대 상기 MDCT를 통해 주파수 영역으로 변환된 음성 및 오디오 신호의 주파수 계수들을 선형 예측을 기반으로 양자화하여, 상기 음성 및 오디오 신호를 정상적으로 부호화하며, 그에 따라 상기 음성 및 오디오 신호의 부호화 성능이 향상되어, 고품질의 음성 및 오디오 서비스를 제공한다. 여기서, 본 발명의 실시 예에 따른 통신 시스템에서는, 상기 음성/오디오 코덱에서 MDCT를 통해 주파수 영역으로 변환된 음성 및 오디오 신호의 주파수 계수들을, 선형 예측을 기반으로 부대역들 별 특성을 고려하여 양자화함으로써, 상기 음성 및 오디오 신호의 주파수 계수들에 대한 양자화 오류를 최소화하며, 그에 따라 상기 음성/오디오 코덱을 기반으로 음성 및 오디오 신호의 부호화 성능을 향상시켜 고품질의 음성 및 오디오 서비스를 제공한다. 그러면 여기서, 도 1을 참조하여 본 발명의 실시 예에 따른 통신 시스템에서 음성/오디오 코덱에서의 코덱 장치에 대해 보다 구체적으로 설명하기로 한다.
도 1은 본 발명의 실시 예에 따른 통신 시스템에서 코덱 장치의 구조를 개략적으로 도시한 도면이다.
도 1을 참조하면, 시간 영역의 음성 및 오디오 신호를 주파수 영역의 음성 및 오디오 신호로 변환하는 변환기(102), 상기 주파수 영역의 음성 및 오디오 신호에 대한 주파수 계수들을 이용하여 선형 예측 계수들을 계산하는 선형 예측 계수 계산기(104), 상기 선형 예측 계수들을 양자화하는 선형 예측 계수 양자화기(106), 상기 선형 예측 계수 양자화기(106)에서 산출된 선형 예측 계수 양자화 인덱스들로부터 양자화된 선형 예측 계수들을 산출하는 선형 예측 계수 역양자화기(108), 상기 양자화된 선형 예측 계수들을 이용하여 상기 주파수 계수에 대한 잔차 주파수 계수들을 산출하는 선형 예측 분석 필터(110), 상기 잔차 주파수 계수들을 부대역으로 분할하여 부대역 계수들을 산출하는 대역 분할기(112), 상기 부대역 계수들을 부대역들 별로 양자화하는 부대역 계수 양자화기들, 다시 말해 제1부대역 계수 양자화기(114), 제2부대역 계수 양자화기(116), 및 제N부대역 계수 양자화기(118), 및 상기 부대역 계수 양자화기에서 양자화된 부대역 계수들의 부대역 양자화 인덱스들과 상기 선형 예측 계수 양자화 인덱스들을 다중화하여 비트스트림을 출력하는 다중화기(120)를 포함한다.
보다 구체적으로 설명하면, 상기 변환기(102)는, 상기 시간 영역에서 입력되는 음성 및 오디오 신호를 주파수 영역으로 변환, 예컨대 상기 음성 및 오디오 신호를 MDCT를 통해 주파수 영역의 음성 및 오디오 신호로 변환하여, 상기 주파수 영역의 음성 및 오디오 신호에 대한 주파수 계수들, 예컨대 MDCT 계수들을 산출한다. 여기서, 본 발명의 실시 예에서는, 전술한 바와 같이, 상기 변환기(102)가 상기 MDCT를 통해 상기 음성 및 오디오 신호를 주파수 영역으로 변환하여, 주파수 계수들, 즉 MDCT 계수들을 산출하는 경우를 일 예로 하여 설명하지만, 상기 변환기(102)가 상기 MDCT가 아닌 다른 변환 방식, 예컨대 DFT 등과 같은 변환 방식을 통해 상기 음성 및 오디오 신호를 주파수 영역으로 변환하여, 상기 음성 및 오디오 신호에 대한 주파수 계수들을 산출할 수도 있다.
여기서, 상기 변환기(102)는, 전술한 바와 같이, 시간 영역의 음성 및 오디오 신호를 MDCT를 통해 주파수 영역으로 변환하여 음성 및 오디오 신호의 주파수 계수들, 즉 MDCT 계수들을 산출하며, 상기 MDCT 계수들은, 하기 수학식 1과 같이 나타낼 수 있다.
Figure pat00001
수학식 1에서,
Figure pat00002
은, 시간 영역의 음성 및 오디오 신호를 상기 MDCT를 통해 주파수 영역으로의 변환 시에 블록 단위로 처리하기 위한 상기 음성 및 오디오 신호의 프레임의 길이를 의미하고,
Figure pat00003
은 윈도우 함수를 의미하며,
Figure pat00004
은 시간 영역의 음성 및 오디오 신호를 의미한다. 그리고, 수학식 1에서,
Figure pat00005
는, MDCT 계수들, 즉 주파수 계수들을 의미하고, n은 시간 영역의 인덱스를 의미하며, k는 주파수 영역의 인덱스를 의미한다.
상기 선형 예측 계수 계산기(104)는, 상기 변환기(102)에서 산출한 상기 주파수 계수들, 즉 상기 MDCT 계수들을 이용하여 선형 예측 계수들을 산출한다. 여기서, 상기 선형 예측 계수 계산기(104)는, 상기 주파수 계수들, 즉 상기 MDCT 계수들에 대해, 수학식 2에 나타낸 바와 같이, 과거 임의의 p개의 MDCT 계수들의 가중합으로 획득한 현재 MDCT 계수들의 예측값(
Figure pat00006
)과, 실제 MDCT 계수들() 간, 오차의 합을 최소화하는 p개의 계수들 세트(
Figure pat00008
)를 계산한다. 즉, 상기 선형 예측 계수 계산기(104)는, 상기 주파수 계수들, 즉 상기 MDCT 계수들에 대해, 과거 MDCT 계수들로부터 예측한 현재 MDCT 계수들과, 상기 변환기(102)에서 산출한 실제 MDCT 계수들 간, 최소 오차를 갖는 계수들 세트, 즉 상기 선형 예측 계수들을 계산한다.
Figure pat00009
수학식 2에서,
Figure pat00010
는, 선형 예측 계수들을 의미하고, p는 선형 예측 차수를 의미한다. 이때, 상기 선형 예측 계수 계산기(104)는, 자기 상관 함수와 레빈-더빈(Levinson-Durbin) 알고리즘을 이용하여, 상기 주파수 계수들로부터 상기 선형 예측 계수들을 계산한다.
상기 선형 예측 계수 양자화기(106)는, 상기 선형 예측 계수들을 양자화 하여 선형 예측 계수 양자화 인덱스들을 산출한다. 여기서, 상기 선형 예측 계수 양자화기(106)는, 상기 선형 예측 계수들을 선 스펙트럼 쌍(LSP: Line Spectrum Pair, 이하 'LSP'라 칭하기로 함) 계수들로 변환한 후, 상기 LSP 계수들을 미리 훈련된 양자화 테이블을 이용하여 벡터 양자화하며, 이렇게 상기 LSP 계수들을 상기 양자화 테이블을 통해 벡터 양자화하여 상기 선형 예측 계수 양자화 인덱스들을 산출한다.
상기 선형 예측 계수 역양자화기(108)는, 상기 선형 예측 계수 양자화 인덱스들로부터 상기 양자화 테이블을 조회하여, 양자화된 LSP 계수들을 복원한 후, 상기 복원한 LSP 계수들을 다시 선형 예측 계수들로 변환하여 양자화된 선형 예측 계수들을 산출한다.
상기 선형 예측 분석 필터(110)는, 상기 변환기(102)에서 산출된 주파수 계수들, 즉 상기 MDCT 계수들을, 상기 양자화된 선형 예측 계수들을 이용하여 잔차 주파수 계수들, 예컨대 잔차 MDCT 계수들을 산출한다. 여기서, 상기 잔차 주파수 계수들, 즉 상기 잔차 MDCT 계수들은 하기 수학식 3과 같이 나타낼 수 있다.
Figure pat00011
수학식 3에서,
Figure pat00012
는, 상기 양자화된 선형 예측 계수들을 의미하고,
Figure pat00013
는, 상기 잔차 주파수 계수들, 즉 상기 잔차 MDCT 계수들을 의미한다.
상기 대역 분할기(112)는, 상기 잔차 주파수 계수들, 즉 상기 MDCT 잔차 계수들을 임의의 부대역으로 분할, 예컨대 상기 MDCT 잔차 계수들을
Figure pat00014
개의 부대역들로 분할한 후, 상기
Figure pat00015
개의 부대역들 각각에 해당하는 부대역 계수들을 산출한다. 여기서, 상기 대역 분할기(112)는, 상기 MDCT 잔차 계수들의 전체 대역을 일정한 간격의 부대역들로 분할하거나, 또는 음성 및 오디오 서비스를 제공받는 사용자 특성, 예컨대 사용자의 청각 특성을 고려하여 상기 전체 대역을 임계 대역을 기준으로 하여 부대역들로 분할한다. 이때, 상기 대역 분할기(112)가 상기 MDCT 잔차 계수들의 전체 대역을 상기
Figure pat00016
개의 부대역들로 분할할 경우, 상기 대역 분할기(112)는 상기
Figure pat00017
개의 부대역들 각각에 대한 부대역 계수들을 각각 산출하며, 상기 부대역 계수들은 하기 수학식 4와 같이 나타낼 수 있다.
Figure pat00018
수학식 4에서, b는 부대역 인덱스를 의미하고, M은 각 부대역에 해당하는 MDCT 계수(
Figure pat00019
)를 의미하며, 상기
Figure pat00020
는 부대역 개수를 의하고,
Figure pat00021
는 임의의 b번째 부대역에 해당하는 부대역 계수를 의미한다.
그리고, 상기 대역 분할기(112)는, 수학식 4에서 설명한 바와 같이, 상기
Figure pat00022
개의 부대역들 각각에 대해 각각 산출한 상기 부대역 계수들을 부대역 계수 양자화기들로 출력하며, 특히 상기 대역 분할기(112)는, 상기 부대역 계수들을 상기 부대역 계수 양자화기들에서 각각 대응하는 부대역 계수 양자화기로 출력한다.
즉, 상기 부대역 계수 양자화기들은, 각각 자신에게 해당하는 부대역 계수를 상기 대역 분할기(112)로부터 수신, 즉 상기 부대역 계수 양자화기들에서 제1부대역 계수 양자화기(114)는 상기 대역 분할기(112)로부터 제1부대역 계수를 수신하고, 제2부대역 계수 양자화기(116)는 상기 대역 분할기(112)로부터 제2부대역 계수를 수신하며, 제N부대역 계수 양자화기(118)는 상기 대역 분할기(112)로부터 제N부대역 계수를 수신한다.
그리고, 상기 부대역 계수 양자화기들은, 자신에게 해당하는 부대역 계수들을 양자화하여 부대역 양자화 인덱스들을 산출한다. 다시 말해, 상기 제1부대역 계수 양자화기(114)는 상기 제1부대역 계수를 양자화하여 제1부대역 양자화 인덱스를 산출하고, 상기 제2부대역 계수 양자화기(116)는 상기 제2부대역 계수를 양자화하여 제2부대역 양자화 인덱스를 산출하며, 상기 제N부대역 계수 양자화기(118)는 상기 제N부대역 계수를 양자화하여 제N부대역 양자화 인덱스를 산출한다.
상기 다중화기(120)는, 상기 선형 예측 계수 양자화기(106)에서 산출한 상기 선형 예측 계수 양자화 인덱스들과, 상기 부대역 계수 양자화기들에서 산출한 상기 부대역 양자화 인덱스들을 다중화하여, 비트스트림을 출력한다. 그러면 여기서, 도 2를 참조하여 본 발명의 실시 예에 따른 통신 시스템에서 코덱 장치의 상기 부대역 계수 양자화기들에 대해 보다 구체적으로 설명하기로 한다.
도 2는 본 발명의 실시 예에 따른 통신 시스템에서 코덱 장치의 부대역 계수 양자화기 구조를 개략적으로 도시한 도면이다. 여기서, 도 2는, 도 1에서 도시한 코덱 장치에서, 상기 음성 및 오디오 신호의 잔차 주파수 계수들, 다시 말해 상기 MDCT 계수들을 부대역들로 분할하여, 부대역들 별 부대역 계수들을 각각 양자화하는 임의의 부대역 계수 양자화기 구조를 개략적으로 도시한 도면이다. 그리고, 도 2는, 전술한 바와 같이, 선형 예측 기반으로 주파수 계수들, 즉 상기 MDCT 계수들을 양자화할 경우, 트랙-펄스 부호화를 이용하여 상기 MDCT 계수들에 대한 부대역 계수들을 양자화하는 부대역 계수 양자화기 구조를 개략적으로 도시한 도면이다.
도 2를 참조하면, 상기 부대역 계수 양자화기는, 전술한 바와 같이 트랙-펄스 부호화에 상응하여, 부대역 계수에 대해 트랙 구조로 펄스를 검색하여 펄스 정보를 산출하는 트랙-펄스 검색기(202), 상기 부대역 계수들의 각 트랙에서 검색된 펄스의 위치 정보를 부호화하여 위치 인덱스들을 산출하는 위치 양자화기(204), 상기 부대역 계수들의 각 트랙에서 검색된 펄스의 크기 정보를 양자화하여 크기 인덱스들을 산출하는 크기 양자화기(206), 및 상기 부대역 계수들의 각 트랙에서 검색된 펄스의 부호를 양자화하여 부호 인덱스들을 산출하는 부호 양자화기(208)를 포함한다. 여기서, 상기 트랙-펄스 검색기(202)에서의 상기 부대역 계수에 대한 트랙 구조의 펄스에 따라 산출되는 펄스 정보는, 상기 부대역 계수들의 각 트랙에서 검색된 펄스의 위치 정보, 크기 정보, 및 부호 정보를 포함한다.
보다 구체적으로 설명하면, 전술한 바와 같이, 상기 부대역 계수 양자화기가 선형 예측 기반의 상기 주파수 계수들, 즉 상기 MDCT 계수들을 트랙-펄스 부호화를 통해 상기 부대역 계수들을 양자화함에 따라, 상기 트랙-펄스 검색기(202)는, 상기 부대역 계수들을 이미 결정된 트랙 구조를 이용하여 결정된 개수의 최적 계수, 즉 상기 부대역 계수들에 대한 펄스를 검색하여, 펄스 정보를 산출한다. 예컨대, 상기 트랙-펄스 검색기(202)에서, 임의의 특정 부대역에 해당하는 MDCT 계수의 개수가 40(M=40)이고, 트랙당 8개의 계수로 이루어진 5개의 트랙을 구성하며, 각 트랙당 1개의 펄스를 검색할 경우, 트랙 구조는 하기 표 1에 나타낸 바와 같다.
Figure pat00023
그에 따라, 상기 트랙-펄스 검색기(202)는, 각 트랙의 펄스 위치를 검색하며, 상기 각 트랙 펄스의 위치는 하기 수학식 5와 같이 나타낼 수 있다.
Figure pat00024
수학식 5에서,
Figure pat00025
는, 임의의 t번째 트랙의 펄스 위치를 의미하며,
Figure pat00026
는 트랙 개수(예컨대,
Figure pat00027
= 5)를 의미하며,
Figure pat00028
는 임의의t번째 트랙에 해당하는 계수 인덱스 집합(예컨대, 0번째 트랙의 경우 U0 = {0, 5, 10, 15, 20, 25, 30, 35})을 의미한다.
상기 위치 양자화기(204)는, 상기 트랙-펄스 검색기(202)에서의 트랙-펄스 검색에 따른 펄스 정보를 이용, 다시 말해 상기 트랙-펄스 검색기(202)에서의 트랙-펄스 검색에 따라, 상기 부대역 계수들의 각 트랙에서 검색된 펄스의 위치 정보를 부호화하여 위치 인덱스들을 산출한다. 여기서, 상기 위치 인덱스들은 하기 수학식 6과 같이 나타낼 수 있다.
Figure pat00029
수학식 6에서,
Figure pat00030
는, 상기 부대역 계수들의 각 트랙에서 검색된 펄스의 위치 정보가 부호화되어 산출된 상기 위치 인덱스들을 의미한다.
이때, 상기 부대역 계수들의 각 트랙에서 검색된 펄스(
Figure pat00031
)는, 크기 정보와 부호 정보로 분할되어 부호화되며, 상기 크기 양자화기(206)는, 상기 부대역 계수들의 각 트랙에서 검색된 펄스(
Figure pat00032
)의 크기 정보를 양자화하여 크기 인덱스(
Figure pat00033
)를 산출한다. 여기서, 상기 크기 양자화기(206)는, 상기 부대역 계수들의 각 트랙에서 검색된 펄스(
Figure pat00034
)의 크기를 개별적으로 스칼라 양자화하거나, 또는 상기 부대역 계수들의 각 트랙에서 검색된 펄스(
Figure pat00035
)의 크기들을 벡터로 그룹화하여 벡터 양자화한다.
상기 부호 양자화기(208)는, 상기 부대역 계수들의 각 트랙에서 검색된 펄스(
Figure pat00036
)의 부호를 양자화하여 부호 인덱스들을 산출한다. 여기서, 상기 부호 인덱스들은 하기 수학식 7과 같이 나타낼 수 있다.
Figure pat00037
수학식 7에서,
Figure pat00038
는, 상기 부대역 계수들의 각 트랙에서 검색된 펄스(
Figure pat00039
)의 부호가 양자화된 부호 인덱스들을 의미한다.
이렇게 본 발명의 실시 예에 따른 통신 시스템에서 코덱 장치의 부대역 계수 양자화기가, 전술한 바와 같이, 선형 예측 기반으로 주파수 계수들, 즉 상기 MDCT 계수들의 양자화 시에, 트랙-펄스 부호화를 이용하여 상기 MDCT 계수들에 대한 부대역 계수들을 양자화할 경우, 상기 MDCT 계수들의 부대역들 별 특성을 고려하지 않고 단일 트랙-펄스 부호화를 통해 양자화함에 따라, 음성/오디오 코덱을 통한 음성 및 오디오 신호를 정상적으로 부호화함에는 한계가 존재한다. 즉, 전술한 바와 같이, 상기 MDCT 계수들의 부대역들 별 특성을 고려하지 않고 단일 트랙-펄스 부호화하여 상기 MDCT 계수들을 양자화할 경우에는, 고품질의 음성 및 오디오 서비스를 제공함에 한계가 있다.
그러므로, 본 발명의 실시 예에 따른 통신 시스템에서는, 전술한 바와 같이, 선형 예측을 기반으로 주파수 계수들, 다시 말해 MDCR 계수들의 부대역들 별 특성을 고려하여 양자화함으로써, 상기 음성 및 오디오 신호의 주파수 계수들에 대한 양자화 오류를 최소화하며, 그에 따라 상기 음성/오디오 코덱을 기반으로 음성 및 오디오 신호의 부호화 성능을 향상시켜 고품질의 음성 및 오디오 서비스를 제공한다. 그러면 여기서, 도 3을 참조하여 본 발명의 실시 예에 따른 통신 시스템에서 코덱 장치의 상기 부대역 계수 양자화기들에 대해 보다 구체적으로 설명하기로 한다.
도 3은 본 발명의 실시 예에 따른 통신 시스템에서 코덱 장치의 부대역 계수 양자화기 구조를 개략적으로 도시한 도면이다. 여기서, 도 3은, 도 1에서 도시한 코덱 장치에서, 상기 음성 및 오디오 신호의 잔차 주파수 계수들, 다시 말해 상기 MDCT 계수들을 부대역들로 분할하여, 부대역들 별 부대역 계수들을 각각 양자화하는 임의의 부대역 계수 양자화기 구조를 개략적으로 도시한 도면이다. 그리고, 도 3은, 전술한 바와 같이, 선형 예측 기반으로 주파수 계수들, 즉 상기 MDCT 계수들을 양자화할 경우, 상기 MDCT 계수들에 대한 부대역 계수들을 부대역들 별 선택적 양자화 방식을 이용한 개루프 부대역 계수 양자화기 구조를 개략적으로 도시한 도면이다.
도 3을 참조하면, 상기 부대역 계수 양자화기는, 상기 부대역 계수들의 특징에 따라 양자화 모드값을 산출하는 개루프 양자화 모드 선택기(304), 상기 양자화 모드값에 따라 상기 부대역 계수들을 에너지 포락선에 해당하는 이득(gain)과 상기 부대역 계수들의 형태에 해당하는 모양(shape)으로 분할한 후 각각 양자화하여 이득-모양 인덱스들을 산출하는 이득-모양 양자화기(306), 상기 부대역 계수들의 각 트랙에서 펄스를 검색한 후 양자화하여 트랙-펄스 인덱스들을 산출하는 트랙-펄스 양자화기(308), 및 상기 양자화 모드값에 따라 상기 이득-모양 양자화기(306) 또는 상기 트랙-펄스 양자화기(308)를 통한 상기 부대역 계수들의 양자화를 선택하는 스위치들(302,310)를 포함한다.
보다 구체적으로 설명하면, 상기 개루프 양자화 모드 선택기(304)는, 상기 부대역 계수들에서 임의의 해당 부대역 계수의 특징에 따라, 상기 이득-모양 양자화기(306) 또는 상기 트랙-펄스 양자화기(308)를 통한 상기 부대역 계수들의 양자화를 선택하도록 하는 상기 양자화 모드값을 산출한다. 예컨대, 상기 개루프 양자화 모드 선택기(304)는, 상기 부대역 계수들의 특징으로 상기 부대역 계수들의 평탄화 척도에 따라 상기 양자화 모드값을 산출한다. 여기서, 상기 개루프 양자화 모드 선택기(304)는, 상기 부대역 계수들의 평탄화 척도(scale)를 지시하는 스펙트럼 평탄화 측도(SFM: Spectral Flatness Measure, 이하 'SFM'이라 칭하기로 함) 또는 첨도(kurtosis)를 이용하여 상기 양자화 모드값을 산출한다. 여기서, 상기 SFM은, 하기 수학식 8과 같이 나타낼 수 있으며, 상기 첨도는 하기 수학식 9와 같이 나타낼 수 있다.
Figure pat00040
Figure pat00041
수학식 8 및 수학식 9에서,
Figure pat00042
는, 임의의 b번째 부대역의 SFM을 의미하고,
Figure pat00043
는, 임의의 b번째 부대역의 첨도를 의미하며,
Figure pat00044
는 임의의 b번째 부대역의 잔차 MDCT 계수의 평균값을 의미한다.
즉, 상기 개루프 양자화 모드 선택기(304)는, 전술한 바와 같은 평탄와 척도, 다시 말해 SFM 또는 첨도를 기 설정된 임계값과 비교한 후, 상기 비교 결과에 따라 결정된 양자화 모드값을 산출한다. 여기서, 상기 양자화 모드값은 하기 수학식 10과 같이 나타낼 수 있다.
Figure pat00045
수학식 10에서,
Figure pat00046
는, 임의의 b번째 부대역의 양자화 모드값을 의미하고,
Figure pat00047
은, 상기 SFM의 임계값을 의미하며,
Figure pat00048
은, 상기 첨도의 임계값을 의미한다.
이렇게 상기 개루프 양자화 모드 선택기(304)에서 산출된 양자화 모드값에 따라, 상기 스위치들(302,310)은, 상기 이득-모양 양자화기(306)와 상기 트랙-펄스 양자화기(308) 중 하나의 양자화기가 상기 부대역 계수들을 양자화하여 부대역 양자화 인덱스들을 산출하도록 한다.
예컨대, 상기 개루프 양자화 모드 선택기(304)는, 상기 부대역 계수들이 잡음과 유사하게 평탄한 경우(
Figure pat00049
), 다시 말해 상기 부대역 계수들의 평탄화 척도가 클 경우로, 상기 SFM이 임계값보다 크거나 상기 첨도가 임계값보다 작을 경우에는, 상기 이득-모양 양자화기(306)를 통해 상기 부대역 계수들을 양자화하여 상기 부대역 양자화 인덱스들을 산출하도록, 상기 양자화 모드값을 산출한다. 그리고, 상기 개루프 양자화 모드 선택기(304)는, 상기 부대역 계수들이 톤(tone) 신호와 유사하게 평탄하지 않는 경우(
Figure pat00050
), 다시 말해 상기 부대역 계수들의 평탄화 척도가 작을 경우로 상기 SFM이 임계값보다 작거나 상기 첨도가 임계값보다 클 경우에는, 상기 트랙-펄스 양자화기(308)를 통해 상기 부대역 계수들을 양자화하여 상기 부대역 양자화 인덱스들을 산출하도록, 상기 양자화 모드값을 산출한다. 즉, 상기 스위치들(302,310)은, 전술한 바와 같이 상기 양자화 모드값에 따라 상기 이득-모양 양자화기(306)와 상기 트랙-펄스 양자화기(308) 중 하나의 양자화기를 선택한다.
상기 이득-모양 양자화기(306)는, 상기 부대역 계수들의 대략적인 에너지 포락선에 해당하는 이득과, 상기 부대역 계수들의 세부적인 형태에 해당하는 모양으로 분할한 후, 상기 이득과 상기 모양을 각각 양자화하여 이득-모양 인덱스들을 산출한다. 즉, 상기 이득-모양 양자화기(306)는, 상기 부대역 계수들의 이득과 상기 이득 부대역 계수들의 모양을 각각 양자화하여, 상기 이득-모양 인덱스들을 산출하며, 상기 이득-모양 인덱스들은, 상기 부대역 양자화 인덱스들로 출력된다.
상기 트랙-펄스 양자화기(308)는, 상기 부대역 계수들을 복수의 트랙들로 분할한 후, 상기 부대역 계수들의 각 트랙에서 결정된 개수의 펄스를 검색, 다시 말해 상기 부대역 계수의 각 트랙에서 펄스를 검색한 후, 상기 검색된 펄스를 양자화하여 트랙-펄스 인덱스들을 산출하며, 상기 트랙-펄스 인덱스들은 상기 부대역 양자화 인덱스들로 출력된다. 즉, 상기 트랙-펄스 양자화기(308)는, 도 2에서 설명한 부대역 계수 양자화기와 같이, 상기 부대역 양자화 인덱스들을 산출하며, 앞선 도 2에서 트랙-펄스 부호화를 이용한 부대역 계수들의 양자화에 대해 구체적으로 설명하였음으로, 여기서는 그에 관한 구체적인 설명을 생략하기로 한다. 그러면 여기서, 도 4를 참조하여 본 발명의 실시 예에 따른 통신 시스템에서 코덱 장치의 부대역 계수 양자화기에서의 상기 이득-모양 양자화기에 대해 보다 구체적으로 설명하기로 한다.
도 4는 본 발명의 실시 예에 따른 통신 시스템에서 코덱 장치의 부대역 계수 양자화기에서의 이득-모양 양자화기 구조를 개략적으로 도시한 도면이다. 여기서, 도 4는, 앞선 도 3에서 설명한 이득-모양 양자화기(306)의 구조를 보다 구체적으로 도시한 도면이다.
도 4를 참조하면, 상기 이득-모양 양자화기는, 상기 부대역 계수들의 이득을 산출하는 이득 계산기(402), 상기 이득을 양자화하여 이득 인덱스들을 산출하는 이득 양자화기(404), 상기 이득 인덱스들로부터 양자화된 이득을 복원하는 이득 역-양자화기(406), 상기 부대역 계수들을 상기 양자화된 이득을 통해 정규화하여 모양 계수들을 산출하는 계수 정규화기(408), 및 상기 모양 계수들 양자화하여 모양 인덱스들을 산출하는 모양 양자화기(410)를 포함한다. 여기서, 상기 이득 양자화기(404)와 상기 모양 양자화기(410)에서 상기 이득 인덱스들과 상기 모양 인덱스들이 산출되어 출력됨에 따라, 상기 이득-모양 양자화기(306)에서 출력되는 이득-모양 인덱스들이 출력된다.
보다 구체적으로 설명하면, 상기 이득 계산기(402)는, 상기 부대역 계수들의이득을 산출하며, 상기 부대역 계수들의 이득은 하기 수학식 11과 같이 나타낼 수 있다.
Figure pat00051
수학식 11에서,
Figure pat00052
는, 임의의 b번째 부대역의 이득을 의미한다.
상기 이득 양자화기(404)는, 상기 부대역 계수들의 이득을 양자화하여 이득 인덱스들을 산출한다. 예컨대, 상기 이득 양자화기(404)는, 상기 부대역 계수들을 부대역들 별로 각각의 이득을 스칼라 양자화 하거나, 또는 상기 부대역 계수들의 이득들을 그룹화하여 벡터 양자화한다.
상기 이득 역-양자화기(406)는, 상기 이득 인덱스들로부터 양자화된 이득을 복원한다.
상기 계수 정규화기(408)는, 상기 부대역 계수들을 상기 양자화된 이득을 이용하여 정규화한 후, 상기 모양 계수들을 산출한다. 즉 상기 계수 정규화기(408)은, 상기 부대역 계수들을 정규화하여 상기 모양 계수들을 산출한다. 여기서, 상기 계수 정규화기(408)에서 정규화한 부대역 계수들, 즉 상기 모양 계수들은, 하기 수학식 12와 같이 나타낼 수 있다.
Figure pat00053
수학식 12에서,
Figure pat00054
는, 상기 계수 정규화기(408)에서 정규화한 부대역 계수들, 즉 상기 모양 계수들을 의미하고,
Figure pat00055
는 상기 양자화된 이득을 의미한다.
상기 모양 양자화기(410)는, 상기 모양 계수들을 양자화하여 상기 모양 인덱스들을 산출하며, 상기 모양 양자화기(410)에서 산출된 상기 모양 인덱스들과, 상기 이득 양자화기(404)에서 산출된 상기 이득 인덱스들이, 전술한 바와 같이, 상기 이득-모양 양자화기(306)에서 출력되는 이득-모양 인덱스들이 된다. 그러면 여기서, 도 5를 참조하여 본 발명의 실시 예에 따른 통신 시스템에서 코덱 장치의 상기 부대역 계수 양자화기들에 대해 보다 구체적으로 설명하기로 한다.
도 5는 본 발명의 실시 예에 따른 통신 시스템에서 코덱 장치의 부대역 계수 양자화기 구조를 개략적으로 도시한 도면이다. 여기서, 도 5는, 도 1에서 도시한 코덱 장치에서, 상기 음성 및 오디오 신호의 잔차 주파수 계수들, 다시 말해 상기 MDCT 계수들을 부대역들로 분할하여, 부대역들 별 부대역 계수들을 각각 양자화하는 임의의 부대역 계수 양자화기 구조를 개략적으로 도시한 도면이다. 그리고, 도 5는, 전술한 바와 같이, 선형 예측 기반으로 주파수 계수들, 즉 상기 MDCT 계수들을 양자화할 경우, 상기 MDCT 계수들에 대한 부대역 계수들을 부대역들 별 선택적 양자화 방식을 이용한 폐루프 부대역 계수 양자화기 구조를 개략적으로 도시한 도면이다.
도 5를 참조하면, 상기 부대역 계수 양자화기는, 상기 부대역 계수들을 에너지 포락선에 해당하는 이득(gain)과 상기 부대역 계수들의 형태에 해당하는 모양(shape)으로 분할한 후 각각 양자화하여 이득-모양 인덱스들을 산출하는 이득-모양 양자화기(502), 상기 부대역 계수들의 각 트랙에서 펄스를 검색한 후 양자화하여 트랙-펄스 인덱스들을 산출하는 트랙-펄스 양자화기(504), 상기 이득-모양 양자화기(502)에서 산출된 상기 이득-모양 인덱스들을 복호화하여 제1양자화된 부대역 계수를 복원하는 이득-모양 역-양자화기(506), 상기 트랙-펄스 양자화기(504)에서 산출된 상기 트랙-펄스 인덱스들을 복호화하여 제2양자화된 부대역 계수를 복원하는 트랙-펄스 역-양자화기(508), 상기 제1양자화된 부대역 계수와 상기 제2양자화된 부대역 계수를 비교하여 최적의 양자화 모드값을 산출하는 폐루프 양자화 모드 선택기(510), 상기 최적의 양자화 모드값에 따라, 상기 이득-모양 양자화기(502) 또는 상기 트랙-펄스 양자화기(504)를 통한 상기 부대역 계수들의 양자화를 선택하는 스위치(512)를 포함한다.
여기서, 상기 이득-모양 양자화기(502) 및 상기 트랙-펄스 양자화기(504)에 대해서는 앞서 구체적으로 설명하였음으로, 여기서는 그에 관한 구체적인 설명을 생략하기로 한다. 즉, 상기 이득-모양 양자화기(502) 및 상기 트랙-펄스 양자화기(504)는, 도 3에서 설명한 이득-모양 양자화기(306)와 트랙-플서 양자화기(308)과 동일하게, 상기 부대역 계수들을 양자화하여, 상기 이득-모양 인덱스들과 트랙=펄스 인덱스들을 산출한다.
그러면, 상기 이득-모양 역-양자화기(506)는, 상기 이득-모양 양자화기(502)에서 상기 부대역 계수들을 양자화하여 산출한 상기 이득-모양 인덱스들을, 복호화하여 상기 제1양자화된 부대역 계수를 산출한다.
상기 트랙-펄스 역-양자화기(508)는, 상기 트랙-펄스 양자화기(504)에서 상기 부대역 계수들을 양자화하여 산출한 상기 트랙-펄스 인덱스들을, 복호화하여 상기 제2양자화된 부대역 계수를 산출한다.
상기 폐루프 양자화 모드 선택기(510)는, 상기 제1양자화된 부대역 계수와 상기 제2양자화된 부대역 계수를 비교하여, 상기 최적의 양자화 모드값을 산출하며, 특히 상기 이득-모양 양자화기(502)에서의 상기 부대역 계수들의 양자화와, 상기 트랙-펄스 양자화기(504)에서의 상기 부대역 계수들의 양자화 간의, 양자화 오류를 이용하여, 상기 최적의 양자화 모드값을 산출한다. 여기서, 상기 제1양자화된 부대역 계수와 상기 양자화된 제2부대역 계수는, 상기 주파수 계수들, 즉 상기 MDCT 계수들의 부대역들에서 동일한 부대역 계수가 양자화된 이득-모양 인덱스와 트랙-펄스 인덱스를 복호화한, 부대역 계수들임이 바람직하다.
즉, 상기 폐루프 양자화 모드 선택기(510)는, 상기 이득-모양 양자화기(502)와 상기 트랙-펄스 양자화기(504) 간의 양자화 오류 척도, 또는 세그멘트 신호대 잡음비(SSNR: Segmental Signal-to-Noise Ratio, 이하 'SSNR'이라 칭하기로 함) 등의 척도를 이용하여 상기 최적의 양자화 모드값을 산출, 즉 상기 이득-모양 양자화기(502)와 상기 트랙-펄스 양자화기(504) 중 하나의 양자화기를 통해 상기 부대역 계수들의 양자화를 선택하도록 하는 상기 양자화 모드값을 산출한다. 여기서, 상기 양자화 오류는, 하기 수학식 13과 같이 나타낼 수 있으며, 상기 SSNR은 하기 수학식 14와 같이 나타낼 수 있다.
Figure pat00056
Figure pat00057
수학식 13 및 수학식 14에서,
Figure pat00058
은, 임의의 b번째 부대역의 m번째 최적의 양자화 모드값에 대한 양자화 오류를 의미하고,
Figure pat00059
은, 임의의 b번째 부대역의 m번째 최적의 양자화 모드값에 대한 SSNR을 의미하며,
Figure pat00060
는, 임의의 b번째 부대역의 m번째 최적의 양자화 모드값으로 양자화된 부대역 계수들, 예컨대 상기 제1양자화된 부대역 계수 및 상기 제2양자화된 부대역 계수를 의미한다. 여기서, 상기 폐루프 양자화 모드 선택기(510)는, 상기 최적의 양자화 모드값을, 상기 양자화 오류를 최소화하거나, 또는 상기 SSNR이 보다 큰 상기 하나의 양자화기를 선택하도록 산출한다. 즉, 상기 폐루프 양자화 모드 선택기(510)는, 상기 양자화 오류를 최소화 또는 상기 SSNR을 극대화하는 상기 하나의 양자화기를 선택하도록 상기 최적의 양자화 모드값을 산출한다.
이렇게 상기 폐루프 양자화 모드 선택기(510)에서 산출된 최적의 양자화 모드값에 따라, 상기 스위치(512)는, 상기 이득-모양 양자화기(502)와 상기 트랙-펄스 양자화기(504) 중 하나의 양자화기가 상기 부대역 계수들을 양자화하여 부대역 양자화 인덱스들을 산출하도록 한다. 즉, 상기 스위치(512)는, 상기 이득-모양 인덱스들을 상기 부대역 양자화 인덱스들로 출력하거나, 상기 트랙-펄스 인덱스들을 상기 부대역 양자화 인덱스들로 출력한다. 그러면 여기서, 도 6을 참조하여 본 발명의 실시 예에 따른 통신 시스템에서 코덱 동작에 대해 보다 구체적으로 설명하기로 한다.
도 6은 본 발명의 실시 예에 따른 통신 시스템에서 코덱 장치의 코덱 과정을 개략적으로 도시한 도면이다. 여기서, 도 6은, 본 발명의 실시 예에 따른 통신 시스템에서 주파수 계수들, 다시 말해 MDCT 계수들을 양자화하는 코덱 장치의 동작 과정을 개략적으로 도시한 도면이다.
도 6을 참조하면, 610단계에서, 상기 코덱 장치는, 전술한 바와 같이, 시간 영역의 음성 및 오디오 신호를 주파수 영역의 음성 및 오디오 신호로 변환하여, 상기 음성 및 오디오 신호들의 주파수 계수들을 산출한다. 여기서, 상기 시간 영의 음성 및 오디오 신호를 MDCT를 통해 주파수 영역으로 변환하여, 상기 주파수 계수들, 다시 말해 MDCT 계수들을 산출한다.
그리고, 620단계에서, 상기 주파수 계수들, 즉 상기 MDCT 계수들을 이용하여 선형 예측 계수들을 산출한 후, 상기 선형 예측 계수들을 양자화 하여 선형 예측 계수 양자화 인덱스들을 산출한다.
다음으로, 630단계에서, 상기 선형 예측 계수 양자화 인덱스들로부터 양자화된 선형 예측 계수들을 산출한 후, 상기 주파수 계수들, 즉 상기 MDCT 계수들을, 상기 양자화된 선형 예측 계수들을 이용하여 잔차 주파수 계수들, 예컨대 잔차 MDCT 계수들을 산출한다.
그런 다음, 640단계에서, 상기 잔차 주파수 계수들, 즉 상기 MDCT 잔차 계수들을 부대역들로 분할한 후, 상기 잔차 주파수 계수들로부터 각 부대역들의 부대역 계수들을 산출하며, 상기 부대역 계수들을 부대역 양자화 인덱스들로 양자화한다. 여기서, 상기 부대역 계수들은, 각 부대역들의 특성에 따라 상기 부대역 양자화 인덱스들로 양자화되며, 상기 부대역 계수들의 양자화에 대해서는 앞서 구체적으로 설명하였음으로 여기서는 그에 관한 구체적인 설명을 생략하기로 한다.
이렇게 본 발명의 실시 예에 따른 통신 시스템에서는, 상기 음성/오디오 코덱에서, 주파수 영역으로 변환된 음성 및 오디오 신호, 예컨대 상기 MDCT를 통해 주파수 영역으로 변환된 음성 및 오디오 신호의 주파수 계수들을 양자화하여, 상기 음성 및 오디오 신호를 정상적으로 부호화하며, 그에 따라 상기 음성 및 오디오 신호의 부호화 성능이 향상되어, 고품질의 음성 및 오디오 서비스를 제공한다. 특히, 본 발명의 실시 예에 따른 통신 시스템에서는, 상기 음성/오디오 코덱에서 MDCT를 통해 주파수 영역으로 변환된 음성 및 오디오 신호의 주파수 계수들을 부대역들 별 특성을 고려하여 양자화함으로써, 상기 음성 및 오디오 신호의 주파수 계수들에 대한 양자화 오류를 최소화하며, 그에 따라 상기 음성/오디오 코덱을 기반으로 음성 및 오디오 신호의 부호화 성능을 향상시켜 고품질의 음성 및 오디오 서비스를 제공한다.
한편, 본 발명의 상세한 설명에서는 구체적인 실시 예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로, 본 발명의 범위는 설명된 실시 예에 국한되어 정해져서는 안되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.

Claims (20)

  1. 통신 시스템에서 신호를 부호화하는 코덱(codec) 장치에 있어서,
    시간 영역의 음성 및 오디오 신호를 주파수 영역으로 변환하여, 상기 음성 및 오디오 신호의 주파수 계수들을 산출하는 변환기;
    상기 주파수 계수들을 복수의 부대역들 별로 분할한 후, 상기 주파수 계수들로부터 상기 부대역들 별 부대역 계수들을 산출하는 대역 분할기; 및
    상기 부대역들 별 특성에 따라 상기 부대역 계수들을 양자화하여 부대역 양자화 인덱스들을 산출하는 부대역 계수 양자화기;를 포함하는 것을 특징으로 하는 코덱 장치.
  2. 제1항에 있어서, 상기 부대역 계수 양자화기는,
    상기 부대역들 별 특성을 고려하여 양자화 모드값을 산출하는 모드 선택기;
    상기 양자화 모드값에 따라 상기 부대역 계수들을 양자화하여, 이득(gain)-모양(shape) 인덱스들을 상기 부대역 양자화 인덱스들로 산출하는 제1양자화기; 및
    상기 양자화 모드값에 따라 상기 부대역 계수들을 양자화하여, 트랙-펄스 인덱스를 상기 부대역 양자화 인덱스들로 산출하는 제2양자화기;를 포함하는 것을 특징으로 하는 코덱 장치.
  3. 제2항에 있어서,
    상기 모드 선택기는, 상기 부대역 계수들의 평탄화 척도(scale)를 지시하는 스펙트럼 평탄화 측도(SFM: Spectral Flatness Measure) 또는 첨도(kurtosis)를 이용하여 상기 양자화 모드값을 산출하는 것을 특징으로 하는 코덱 장치.
  4. 제3항에 있어서,
    상기 부대역 계수들의 평탄화 척도가 클 경우에는, 상기 제1양자화기가 상기 부대역 양자화 인덱스들을 산출하고;
    상기 부대역 계수들의 평탄화 척도가 작을 경우에는, 상기 제2양자화기가 상기 부대역 양자화 인덱스들을 산출하는 것을 특징으로 하는 코덱 장치.
  5. 제2항에 있어서,
    상기 모드 선택기는, 상기 이득-모양 인덱스들과 상기 트랙-펄스 인덱스들의 복호화를 통해 양자화된 부대역 계수들 간을 비교하여, 상기 양자화 모드값을 산출하는 것을 특징으로 하는 코덱 장치.
  6. 제5항에 있어서,
    상기 모드 선택기는, 상기 양자화된 부대역 계수들 간 비교를 통해, 상기 제1양자화기와 상기 제2양자화기 간의 양자화 오류 또는 세그멘트 신호대 잡음비(SSNR: Segmental Signal-to-Noise Ratio)를 확인하여, 상기 양자화 모드값을 산출하는 것을 특징으로 하는 코덱 장치.
  7. 제6항에 있어서,
    상기 모드 선택기는, 상기 제1양자화기 및 상기 제2양자화기 중에서, 상기 양자화 오류를 최소화하거나 상기 세그멘트 신호대 잡음비를 극대화하는 양자화기가, 상기 부대역 양자화 인덱스들을 산출하도록 상기 양자화 모드값을 산출하는 것을 특징으로 하는 코덱 장치.
  8. 제2항에 있어서, 상기 제1양자화기는,
    상기 부대역 계수들의 이득을 산출하는 이득 계산기;
    상기 부대역 계수들의 이득을 양자화하여 이득 인덱스들을 산출하는 이득 양자화기;
    상기 이득 인덱스들의 복원을 통해 양자화된 이득을 이용해, 상기 부대역 계수들을 정규화하여 모양 계수들을 산출하는 계수 정규화기; 및
    상기 모양 계수들을 양자화하여 모양 인덱스들을 산출하는 모양 양자화기;를 포함하는 것을 특징으로 하는 코덱 장치.
  9. 제2항에 있어서, 상기 제2양자화기는,
    상기 부대역 계수들의 트랙-펄스 검색하여, 상기 부대역 계수들의 펄스를 검색하는 검색기;
    상기 부대역들의 각 트랙에서 검색된 펄스의 위치 정보를 부호화하여 위치 인덱스들을 산출하는 위치 양자화기;
    상기 부대역들의 각 트랙에서 검색된 펄스의 크기 정보를 양자화하여 크기 인덱스들을 산출하는 크기 양자화기; 및
    상기 부대역들의 각 트랙에서 검색된 펄스의 부호를 양자화하여 부호 인덱스들을 산출하는 부호 양자화기;를 포함하는 것을 특징으로 하는 코덱 장치.
  10. 제1항에 있어서,
    상기 주파수 계수들을 이용하여 선형 예측 계수들을 계산하는 선형 예측 계수 계산기;
    상기 선형 예측 계수들을 양자화하여 선형 예측 계수 양자화 인덱스들을 산출하는 선형 예측 계수 양자화기;
    상기 선형 예측 계수 양자화 인덱스들로부터 양자화된 선형 예측 계수들을 이용하여, 상기 주파수 계수에 대한 잔차 주파수 계수들을 산출하는 선형 예측 분석 필터; 및
    상기 선형 예측 계수 양자화 인덱스들과 상기 부대역 양자화 인덱스들을 다중화하여 비트스트림을 산출하는 다중화기;를 더 포함하는 것을 특징으로 하는 코덱 장치.
  11. 통신 시스템에서 신호를 부호화하는 코덱(codec) 방법에 있어서,
    시간 영역의 음성 및 오디오 신호를 주파수 영역으로 변환하여, 상기 음성 및 오디오 신호의 주파수 계수들을 산출하는 단계;
    상기 주파수 계수들을 복수의 부대역들 별로 분할한 후, 상기 주파수 계수들로부터 상기 부대역들 별 부대역 계수들을 산출하는 단계; 및
    상기 부대역들 별 특성에 따라 상기 부대역 계수들을 양자화하여 부대역 양자화 인덱스들을 산출하는 단계;를 포함하는 것을 특징으로 하는 코덱 방법.
  12. 제11항에 있어서, 상기 부대역 양자화 인덱스들을 산출하는 단계는,
    상기 부대역들 별 특성을 고려하여 양자화 모드값을 산출하는 단계;
    상기 양자화 모드값에 따라 상기 부대역 계수들을 양자화하여, 이득(gain)-모양(shape) 인덱스들을 상기 부대역 양자화 인덱스들로 산출하는 제1양자화 단계; 및
    상기 양자화 모드값에 따라 상기 부대역 계수들을 양자화하여, 트랙-펄스 인덱스를 상기 부대역 양자화 인덱스들로 산출하는 제2양자화 단계;를 포함하는 것을 특징으로 하는 코덱 방법.
  13. 제12항에 있어서,
    상기 양자화 모드값을 산출하는 단계는, 상기 부대역 계수들의 평탄화 척도(scale)를 지시하는 스펙트럼 평탄화 측도(SFM: Spectral Flatness Measure) 또는 첨도(kurtosis)를 이용하여 상기 양자화 모드값을 산출하는 것을 특징으로 하는 코덱 장치.
  14. 제13항에 있어서,
    상기 부대역 계수들의 평탄화 척도가 클 경우에는, 상기 제1양자화 단계에서 상기 부대역 양자화 인덱스들을 산출하고;
    상기 부대역 계수들의 평탄화 척도가 작을 경우에는, 상기 제2양자화 단계에서 상기 부대역 양자화 인덱스들을 산출하는 것을 특징으로 하는 코덱 방법.
  15. 제12항에 있어서,
    상기 양자화 모드값을 산출하는 단계는, 상기 이득-모양 인덱스들과 상기 트랙-펄스 인덱스들의 복호화를 통해 양자화된 부대역 계수들 간을 비교하여, 상기 양자화 모드값을 산출하는 것을 특징으로 하는 코덱 방법.
  16. 제15항에 있어서,
    상기 양자화 모드값을 산출하는 단계는, 상기 양자화된 부대역 계수들 간 비교를 통해, 양자화 오류 또는 세그멘트 신호대 잡음비(SSNR: Segmental Signal-to-Noise Ratio)를 확인하여, 상기 양자화 모드값을 산출하는 것을 특징으로 하는 코덱 방법.
  17. 제16항에 있어서,
    상기 양자화 모드값을 산출하는 단계는, 상기 양자화 오류를 최소화하거나 상기 세그멘트 신호대 잡음비를 극대화하여, 상기 부대역 양자화 인덱스들을 산출하도록 상기 양자화 모드값을 산출하는 것을 특징으로 하는 코덱 방법.
  18. 제12항에 있어서, 상기 제1양자화 단계는,
    상기 부대역 계수들의 이득을 산출하는 단계;
    상기 부대역 계수들의 이득을 양자화하여 이득 인덱스들을 산출하는 단계;
    상기 이득 인덱스들의 복원을 통해 양자화된 이득을 이용해, 상기 부대역 계수들을 정규화하여 모양 계수들을 산출하는 단계; 및
    상기 모양 계수들을 양자화하여 모양 인덱스들을 산출하는 단계;를 포함하는 것을 특징으로 하는 코덱 방법.
  19. 제12항에 있어서, 상기 제2양자화 단계는,
    상기 부대역 계수들의 트랙-펄스 검색하여, 상기 부대역 계수들의 펄스를 검색하는 단계;
    상기 부대역들의 각 트랙에서 검색된 펄스의 위치 정보를 부호화하여 위치 인덱스들을 산출하는 단계;
    상기 부대역들의 각 트랙에서 검색된 펄스의 크기 정보를 양자화하여 크기 인덱스들을 산출하는 단계; 및
    상기 부대역들의 각 트랙에서 검색된 펄스의 부호를 양자화하여 부호 인덱스들을 산출하는 단계;를 포함하는 것을 특징으로 하는 코덱 방법.
  20. 제11항에 있어서,
    상기 주파수 계수들을 이용하여 선형 예측 계수들을 계산하는 단계;
    상기 선형 예측 계수들을 양자화하여 선형 예측 계수 양자화 인덱스들을 산출하는 단계;
    상기 선형 예측 계수 양자화 인덱스들로부터 양자화된 선형 예측 계수들을 이용하여, 상기 주파수 계수에 대한 잔차 주파수 계수들을 산출하는 단계; 및
    상기 선형 예측 계수 양자화 인덱스들과 상기 부대역 양자화 인덱스들을 다중화하여 비트스트림을 산출하는 단계;를 더 포함하는 것을 특징으로 하는 코덱 방법.
KR1020120120422A 2011-10-28 2012-10-29 통신 시스템에서 신호 코덱 장치 및 방법 KR20130047643A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020110111486 2011-10-28
KR20110111486 2011-10-28

Publications (1)

Publication Number Publication Date
KR20130047643A true KR20130047643A (ko) 2013-05-08

Family

ID=48427779

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120120422A KR20130047643A (ko) 2011-10-28 2012-10-29 통신 시스템에서 신호 코덱 장치 및 방법

Country Status (2)

Country Link
US (1) US20130132100A1 (ko)
KR (1) KR20130047643A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140106917A (ko) * 2013-02-27 2014-09-04 한국전자통신연구원 소스 필터를 이용한 주파수 스펙트럼 처리 장치 및 방법

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2773958T3 (es) * 2013-11-12 2020-07-15 Ericsson Telefon Ab L M Codificación vectorial de forma de ganancia dividida
CN105336339B (zh) 2014-06-03 2019-05-03 华为技术有限公司 一种语音频信号的处理方法和装置
JP6140747B2 (ja) * 2015-03-09 2017-05-31 パナソニック株式会社 送信装置及び量子化方法
US10366698B2 (en) 2016-08-30 2019-07-30 Dts, Inc. Variable length coding of indices and bit scheduling in a pyramid vector quantizer
US10146500B2 (en) 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing
US10506523B2 (en) * 2016-11-18 2019-12-10 Qualcomm Incorporated Subband set dependent uplink power control
TWI726822B (zh) * 2019-10-08 2021-05-01 創未來科技股份有限公司 訊號轉換裝置
KR20210158108A (ko) 2020-06-23 2021-12-30 한국전자통신연구원 양자화 잡음을 줄이는 오디오 신호의 부호화 및 복호화 방법과 이를 수행하는 부호화기 및 복호화기
KR20220009563A (ko) 2020-07-16 2022-01-25 한국전자통신연구원 오디오 신호의 부호화 및 복호화 방법과 이를 수행하는 부호화기 및 복호화기

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0163829B1 (en) * 1984-03-21 1989-08-23 Nippon Telegraph And Telephone Corporation Speech signal processing system
WO2005004113A1 (ja) * 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
DE102004009955B3 (de) * 2004-03-01 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140106917A (ko) * 2013-02-27 2014-09-04 한국전자통신연구원 소스 필터를 이용한 주파수 스펙트럼 처리 장치 및 방법

Also Published As

Publication number Publication date
US20130132100A1 (en) 2013-05-23

Similar Documents

Publication Publication Date Title
KR20130047643A (ko) 통신 시스템에서 신호 코덱 장치 및 방법
US7876966B2 (en) Switching between coding schemes
KR100818268B1 (ko) 오디오 데이터 부호화 및 복호화 장치와 방법
JP4731775B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
KR101604774B1 (ko) 멀티-레퍼런스 lpc 필터 양자화 및 역 양자화 장치 및 방법
CN1235190C (zh) 改善音频信号编码效率的方法
CN103594090A (zh) 使用时间分辨率能选择的低复杂性频谱分析/合成
US9786292B2 (en) Audio encoding apparatus, audio decoding apparatus, audio encoding method, and audio decoding method
JP5190445B2 (ja) 符号化装置および符号化方法
JP3344962B2 (ja) オーディオ信号符号化装置、及びオーディオ信号復号化装置
US9454972B2 (en) Audio and speech coding device, audio and speech decoding device, method for coding audio and speech, and method for decoding audio and speech
JP2007515677A (ja) 最適化された複合的符号化方法
US9240192B2 (en) Device and method for efficiently encoding quantization parameters of spectral coefficient coding
JP5863765B2 (ja) 符号化方法および装置、そして、復号化方法および装置
KR20220051028A (ko) 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
EP2490216B1 (en) Layered speech coding
US20090018823A1 (en) Speech coding
Bouzid et al. Switched split vector quantizer applied for encoding the LPC parameters of the 2.4 Kbits/s MELP speech coder
EP2500901B1 (en) Audio encoder apparatus and audio encoding method
Merouane Efficient encoding of the MELP LSF parameters: Application of the switched split vector quantization
KR20160098597A (ko) 통신 시스템에서 신호 코덱 장치 및 방법
KR20130047630A (ko) 통신 시스템에서 신호 부호화 장치 및 방법
KR20140106917A (ko) 소스 필터를 이용한 주파수 스펙트럼 처리 장치 및 방법
KR20130080271A (ko) Klt 기반 도메인 스위치 스플릿 벡터 양자화 방법 및 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application