KR20020075592A - 광대역 음성 부호화기용 lsf 양자화기 - Google Patents

광대역 음성 부호화기용 lsf 양자화기 Download PDF

Info

Publication number
KR20020075592A
KR20020075592A KR1020010015675A KR20010015675A KR20020075592A KR 20020075592 A KR20020075592 A KR 20020075592A KR 1020010015675 A KR1020010015675 A KR 1020010015675A KR 20010015675 A KR20010015675 A KR 20010015675A KR 20020075592 A KR20020075592 A KR 20020075592A
Authority
KR
South Korea
Prior art keywords
vector
quantizer
lsf
memory
quantization
Prior art date
Application number
KR1020010015675A
Other languages
English (en)
Inventor
윤병식
강상원
지상현
김형중
최송인
김대식
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020010015675A priority Critical patent/KR20020075592A/ko
Priority to US10/033,649 priority patent/US6988067B2/en
Publication of KR20020075592A publication Critical patent/KR20020075592A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 광대역 음성 부호화기의 LSF 양자화에 사용될 수 있는 예측피라미드 벡터양자화(predictive pyramid vector quantization : PPVQ)와 피라미드 벡터양자화(pyramid vector quantization : PVQ) 방식을 이용한 광대역 음성 부호화기용 LSF 양자화기를 제안함으로써, 코드북에 필요한 메모리의 요구를 없애고, 코드북 탐색시 요구되는 계산량을 줄이며, 원외 양자화영역(outlier)의 수를 줄이는 방법에 관한 것이다.
AMR_WB 음성 부호화기에서는 LSF 계수 양자화시 DC성분이 제거된 LSF 계수 벡터와 1차 MA 예측기로 예측된 벡터간의 차인 에러신호를 Split-MSVQ (Multi-Stage Vector Quantization)을 사용하여 벡터 양자화를 한다.
본 발명에 따른 양자화기는 LSF 계수 벡터를 입력받아 DC성분을 제거하는 감산기와, 상기 DC성분이 제거된 LSF 계수 벡터를 각각 입력받아 양자화하는 메모리기반 피라미드 벡터양자화기 및 비메모리 피라미드 벡터양자화기와, 상기 메모리기반 피라미드 벡터양자화기와 비메모리 피라미드 벡터양자화기에서 각각 양자화된 양자화벡터 중에서 입력 LSF 계수벡터와의 유클리디안 거리가 적은 양자화벡터를 선택하여 출력하는 스위칭수단과, 상기 스위칭수단에서 선택된 양자화벡터와 상기 LSF 계수 벡터의 DC성분을 가산하는 가산기를 포함한다. 본 발명은 LSF 계수 양자화에 많은 비트를 할당하는 광대역 음성 부호화기에서 LSF 양자화시 predictive PVQ와 memoryless PVQ를 사용함으로써 코드북에 대한 메모리 요구를 없애고,outlier를 줄일 수 있다.

Description

광대역 음성 부호화기용 LSF 양자화기 {LSF quantization for wideband speech coder}
본 발명은 광대역 음성 부호화기의 LSF 양자화에 사용될 수 있는 예측피라미드벡터양자화(predictive pyramid vector quantization : PPVQ) 와 피라미드벡터양자화(pyramid vector quantization : PVQ) 방식을 이용한 광대역 음성 부호화기용 LSF 양자화기에 관한 것이다.
음성 부호화기에서 고음질의 음성 부호화를 위해서는 음성 신호의 단구간 상관도를 나타내는 라인스펙트럼주파수(line spectral frequency : LSF) 계수를 효율적으로 양자화하는 것이 매우 중요하다. LPC(Linear Predictive Coefficient) 필터의 최적 선형예측계수값은 입력 음성신호를 프레임 단위로 나누어 각 프레임별로예측 오차의 에너지를 최소화시키는 개념으로 구해진다. Nokia사에서 3GPP IMT-2000 시스템용 광대역 음성부호화기로 표준화한 AMR_WB(Adaptive Multi-Rate_Wideband) 음성 부호화기의 LPC 필터는 16차 all-pole 필터이며, 이때 사용되는 16개의 선형예측계수들의 양자화를 위하여 많은 비트가 할당된다.
예를 들어, CDMA 이동통신시스템에 사용되는 음성부호화방식인 IS-96A QCELP (Qualcomm Code Excited Linear Prediction)는 전체 비트의 25%를 LPC 양자화에 사용하고 있으며, Nokia사의 AMR_WB 음성 부호화기는 총 9개의 모드 중에서 전체 비트의 최고 27.3%에서 최저 9.6%를 LPC 양자화에 사용하고 있다. 그 동안 많은 종류의 효율적인 LPC 양자화방법이 개발되었고, 실제로 음성 압축기에 다양한 양자화 방법들이 사용되고 있다. LPC 필터의 계수를 직접 양자화할 경우, 필터의 특성이 계수의 양자화 오차에 매우 민감하고 계수 양자화 후의 LPC 필터의 안정성이 보장되지 않는 문제점이 있다. 따라서, LPC 계수를 양자화 성질이 좋은 다른 파라미터로 변환하여 양자화 하여야 하며, 주로 반사 계수(reflection coefficient) 또는 LSF로 변환하여 양자화 한다. 특히, LSF 값은 음성의 주파수 특성과 밀접하게 연관되는 성질이 있어 최근에 개발된 표준 음성 압축기들은 대부분 LSF 양자화 방법을 사용한다.
효율적인 양자화를 위하여 LSF 계수의 프레임간 상관관계를 이용한다. 즉, 현재 프레임의 LSF를 직접 양자화하지 않고 과거 프레임의 LSF값 정보로부터 현재 프레임의 LSF를 예측하고 예측 오차를 양자화한다. LSF값은 음성 신호의 주파수 특성과 밀접한 관계가 있으며, 따라서 시간적으로 예측이 가능하고 상당히 큰 예측이득을 얻을 수 있다.
예측 방법은 auto-regressive(AR)필터와 moving average(MA)필터를 사용하는 두 가지 방법이 있는데, AR 필터는 예측 성능이 우수한 반면 계수 전달 오류의 영향이 수신측에서 프레임의 진행에 따라 계속 전파되는 단점이 있다. MA 필터는 AR 필터에 비하여 예측 성능은 떨어지지만 전달 오류의 영향이 시간적으로 제한되는 장점이 있다. 따라서, 무선통신과 같이 전달 오류가 많이 발생하는 환경에 사용되는 AMR, CS-ACELP, EVRC 등의 음성 압축기에는 MA 필터를 이용한 예측이 이용되고 있다. 본 발명에서는 AR 예측기와 safety-net을 같이 사용함으로써 이 문제를 해결하고 있다. 프레임간의 LSF 예측 이외에 프레임 내에서 이웃한 LSF 요소값 사이의 상관도를 이용한 양자화 방법도 개발되었다. 특히, LSF 값들은 항상 순서 성질을 만족하므로 이 방법을 이용하면 양자화의 효율을 더욱 증대시킬 수 있다.
일반적인 벡터 양자화에서 전체 벡터를 한꺼번에 양자화하는 것은 벡터 테이블의 크기가 너무 커지고 검색 시간이 많이 소요되므로 사용 불가능하다. 이를 해결하기 위하여 전체 벡터를 여러 개의 부벡터로 나누어 각각을 독립적으로 벡터양자화하는 방법이 개발되었는데, 이를 격자 벡터양자화(split vector quantization : SVQ)방법이라고 한다. 예를 들어, 20비트를 이용한 10차 벡터 양자화에서 한 번에 양자화할 경우 벡터 테이블의 크기가 10 x 220이 되지만 2개의 5차 부벡터로 나누어 각각 10 비트씩 할당하는 격자 벡터양자화 방법을 이용하면 벡터 테이블의 크기가 단지 5 x 210x 2로 된다. 보다 많은 부벡터로 나누면 벡터 테이블의 크기가줄어들어 메모리를 절약할 수 있고 검색 시간을 줄일 수 있는 장점이 있으나, 벡터 값들의 상관 관계를 충분히 활용하지 못하여 성능이 떨어지는 단점이 있다.
예를 들어, 10차 벡터 양자화는 10개의 1차 벡터로 나누면 스칼라 양자화가 된다. 만약, 격자 벡터양자화 방법을 이용하고 20msec 프레임 사이의 LSF 예측없이 LSF를 직접 양자화할 경우 24비트가 필요한 양자화 성능을 얻을 수 있다. 그러나 격자 벡터양자화 방법은 각 부벡터를 독립적으로 양자화하므로 부벡터 사이의 상관 관계를 충분히 이용하지 못하고 전체 벡터에 대한 최적화를 하지 못하는 단점이 있다. 이 외에도 벡터양자화를 여러 단계로 나누어 하는 방법, 두 개의 테이블을 이용하여 선택적으로 양자화하는 선택적 벡터양자화 방법, 각 부벡터의 경계값을 보고 사용할 테이블을 선택하는 링크된 격자 벡터양자화 방법 등이 개발되어 있다.
일반적인 벡터 양자화기는 코드북을 저장해야 하지만, 격자 벡터양자화기는 단지 코드북의 인덱스만 저장하고, 부호화시에도 모든 가능한 출력부호와 비교하지 않고 손쉽게 출력벡터를 계산해 낼 수 있다.
일반적으로 격자는 수학식 1과 같이 정의되는 n-차원 벡터들의 집합이다.
격자 벡터양자화기는 크게 균일 격자 벡터양자화기와 의사 균일 격자 벡터양자화기로 나누어지고, 코드북의 형태에 따라 구형 격자 벡터양자화기와 피라미드형 격자 벡터양자화기가 있다. 구형 격자 벡터양자화기는 가우시안(Gaussian) 분포를갖는 소스에 적합하며, 피라미드형 격자 벡터양자화기는 라플라시안(Laplacian) 분포를 갖는 소스에 적합하다.
상기와 같은 종래 기술의 문제점을 해결하기 위한 본 발명의 목적은, LPC 차수의 증가에 따라 LPC 계수 양자화에 요구되는 메모리량과 코드북 탐색 계산량을 감소시키고 outlier를 줄이며 향상된 성능을 위한 광대역 음성 부호화기용 LSF 양자화기를 제공하기 위한 것이다.
도 1은 본 발명의 한 실시예에 따른 광대역 음성 부호화기용 LSF 양자화기의 구조도이다.
상기한 목적을 달성하기 위한 본 발명에 따른 광대역 음성 부호화기용 LSF 양자화기는, LSF 계수 벡터를 입력받아 DC성분을 제거하는 감산기와,
상기 DC성분이 제거된 LSF 계수 벡터를 각각 입력받아 양자화하는 메모리기반 벡터양자화기 및 비메모리 벡터양자화기와,
상기 메모리기반 피라미드 벡터양자화기와 비메모리 피라미드 벡터양자화기에서 각각 양자화된 양자화벡터 중에서 입력 LSF 계수벡터와의 유클리디안 거리가 적은 양자화벡터를 선택하여 출력하는 스위칭수단과,
상기 스위칭수단에서 선택된 양자화벡터와 상기 LSF 계수 벡터의 DC성분을 가산하는 가산기를 포함한 것을 특징으로 한다.
이하, 첨부된 도면을 참조하면서 본 발명의 한 실시예에 따른 광대역 음성 부호화기용 LSF 양자화기를 보다 상세하게 설명하기로 한다.
AMR_WB 음성 부호화기에서 LSF 양자화는 DC 성분을 제거한 후에 16차의 LSF 계수와 1차 MA 예측기로 예측한 벡터와의 차이값인 16차의 예측 에러벡터를 각각 9차 및 7차의 부벡터로 분할(split)하여 벡터양자화를 수행한 다음, 각각의 양자화 에러벡터를 9차는 세 개의 3차 부벡터로 다시 분할(split)하고, 7차는 3차 및 4차의 부벡터로 분할(split)하여 양자화하는 Split-Multi Stage VQ(S-MSVQ) 구조를 사용한다. 이러한 S-MSVQ 구조는 46 bits가 할당된 LSF 계수 양자화에 요구되는 메모리와 코드북 탐색 시간을 감소시키기 위한 구조로, full VQ 보다는 훨씬 적은 메모리와 코드북 탐색 계산량을 가지나 여전히 많은 메모리량(28+ 28+ 26+ 27+ 27+ 25+ 25)과 코드북 탐색의 복잡성에 의한 많은 계산량이 요구된다.
본 발명에서 전체적인 LSF 양자화의 흐름은, 우선 LSF값에서 DC 성분을 제거하고 메모리 기반(memory-based) 격자 양자화기(Predictive PVQ)와 memoryless 격자 양자화기(PVQ)에 DC값이 제거된 LSF 계수 벡터가 입력된다. 정교한 양자화를 위해 설계된 메모리 기반 격자 양자화기 Predictive PVQ에서는 입력 벡터를 1차 AR 예측기를 사용하여 예측한 벡터와의 에러 벡터를 PVQ로 양자화한다. Outlier 감소를 위해 설계된 memoryless 격자 양자화기에서는 입력 벡터를 PVQ로 직접 양자화한다. 각각의 양자화기에서 양자화된 두 후보벡터 중 원래 입력 벡터와의 유클리든 거리(Euclidean distance)를 최소화하는 후보벡터를 최종적인 양자화 벡터로 선택한다. 따라서 정교한 양자화를 위한 메모리 기반 격자양자화기의의 특성과 Outlier 감소를 위한 비메모리 기반 격자 양자화기의 특성을 함께 공유하는 장점을 가진다.
PVQ는 입력 벡터의 차수가 충분히 클 때 우수한 성능을 나타낸다. 즉, 입력 벡터의 차수가 약 20 이상일 때, n의 값에 상관없이이 상수값에 가까운 값을 갖게 된다. 그러나, 벡터 차수가 20 이하일 때에는의 분산값이 커져서 상수값으로 볼 수 없는 단점을 가진다. 그렇기 때문에 단일 피라미드를 사용하여 양자화할 때 많은 오차가 발생하게 된다. 이러한 단점을 보완하기 위하여 적산 코드 PVQ (Product Code PVQ) 가 제안되었는데, 이 Product code PVQ(PCPVQ)는 양자화기 입력 벡터를 정규화(normalization)한 후 단일 피라미드를 사용하여 양자화하고, 정규화 요소값을 사용하여 양자화된 피라미드를 indexing하는 방식이다. 여기서,는 스칼라 양자화기를 의미한다. 만약,이 PVQ의 출력 벡터이고,이 스칼라 양자화기의 출력값이라면, product code PVQ의 출력 벡터은 아래의 수학식 2와 같이 구할 수 있다.
이렇게 함으로써, 스칼라 양자화기의 양자화 레벨수 만큼의 피라미드를 사용하는 효과를 얻을 수 있다. PVQ의 평균 벡터 차수당 비트율을, 스칼라 양자화기에 할당된 비트를이라 하면 전체 비트율 R은 아래의 수학식 3을 만족한다.
도 1은 본 발명의 한 실시예에 따른 메모리기반의 예측 피라미드 벡터양자화(Predictive Pyramid VQ)와 비메모리의 피라미드 벡터양자화(Pyramid VQ)를 이용한 광대역 LSF 양자화기를 도시한 블록도이다.
이 광대역 LSF 양자화기는, LSF 계수 벡터를 입력받아 DC성분을 제거하는 감산기(11)와, DC성분이 제거된 LSF 계수 벡터(R(n))를 각각 입력받아 양자화하는 메모리기반 PVQ(12) 및 비메모리의 PVQ(13)와, 상기 메모리기반 PVQ(12)와 비메모리의 PVQ(13)에서 각각 양자화된 양자화 벡터 중에서 입력 LSF 계수벡터와의 유클리디안 거리가 적은 벡터를 선택하여 출력하는 스위칭수단(14)과, 스위칭수단(14)에서 선택된 벡터와 LSF 계수 벡터의 DC성분을 가산하는 가산기(15)를 포함한다.
앞서 설명한 바와 같이 AMR_WB 음성 부호화기의 LSF 계수 양자화기 구조는, split VQ와 multi-stage VQ를 같이 사용함으로써 full VQ보다는 휠씬 적은 메모리와 코드북 탐색 계산량을 가지나, 여전히 많은 메모리와 계산량이 요구된다. 또한, memory VQ 구조로 인해 error propagation이 야기된다. 이러한 문제를 개선시키기 위하여 본 발명에서는 outlier를 줄이고 많은 메모리를 필요로 하지 않으며 부호화 과정이 간편한 격자 벡터 양자화기를 사용한다. 특히, LSF 계수의 분포가 라플라시안(Laplacian) 신호의 성격을 띄고 있다는 점에 착안하여 Laplacian 신호의 양자화에 적합한 피라미드형 격자 벡터양자화기를 사용한 PVQ LSF 계수 양자화기를 제안한다.
도 1의 양자화기 동작을 살펴보면 다음과 같다. 우선, LSF 계수 벡터가 입력되면 감산기(11)는 LSF 계수 벡터에서 DC 성분을 제거한다. DC 성분이 제거된 LSF 계수 벡터는 메모리기반 PVQ(12)와 비메모리 PVQ(13)에 동시에 입력되며, 각각의 벡터 양자화기에서 독립적으로 양자화가 이루어진다. 메모리기반 PVQ인 예측 피라미드 VQ에서는 입력된 벡터를 1차 AR 예측기를 사용하여 예측하고, 예측된 벡터와 입력 벡터와의 차이인 예측 에러 벡터를 피라미드 VQ(PVQ)를 사용하여 양자화한다. 비메모리 PVQ인 Pyramid VQ(PVQ)에서는 입력 벡터가 outlier에 초점을 맞추어 설계된 pyramid VQ에 full 벡터의 형태로 양자화한다. 각 양자화기에서 양자화된 벡터들과 원래 입력 벡터와의 차이인 양자화 에러는 유클리디안 거리(Euclidean distance)를 이용하여 판정되고, 양자화 에러가 작은 후보벡터를 양자화 벡터로 선택한다. 양자화 프로그램에서 2개의 양자화기에 의한 양자화 결과값이 있으며, LSF가 양자화되기 이전의 값과 양자화된 값과의 양자화 에러값인 2개의 유크리디안 거리값이 나오게 된다. 둘 중 작은 유크리디안 거리값을 표현하는 양자화기의 양자화 결과를 선택한다.
이상과 같이 본 발명은 AMR_WB 음성 부호화기의 LSF 계수 양자화기를 새로운 구조의 격자 벡터 양자화기로 대체 사용함으로써, LSF 계수 양자화기에 필요로 하는 메모리 양과 코드북 탐색 계산량을 줄이고, 할당되는 비트율과 SD(Spectral Distortion)를 개선시킬 수 있다.
위에서 양호한 실시예에 근거하여 이 발명을 설명하였지만, 이러한 실시예는 이 발명을 제한하려는 것이 아니라 예시하려는 것이다. 이 발명이 속하는 분야의 숙련자에게는 이 발명의 기술사상을 벗어남이 없이 위 실시예에 대한 다양한 변화나 변경 또는 조절이 가능함이 자명할 것이다. 그러므로, 이 발명의 보호범위는 첨부된 청구범위에 의해서만 한정될 것이며, 위와 같은 변화예나 변경예 또는 조절예를 모두 포함하는 것으로 해석되어야 할 것이다.
이상과 같이 본 발명에 의하면, 격자 벡터양자화기의 사용과 safety-net을 LSF 계수 양자화기에 도입함으로써 SD 성능 감쇄없이 코드북 탐색시 요구되는 계산량과 메모리량을 크게 줄일 수 있다. 실험적으로 이러한 구조를 갖는 양자화기를 이용하여 1dB의 SD 성능을 얻기 위해 사용되는 총 비트수가 39bits로써 AMR_WB 음성 부호화기에서 요구되는 46bits에 비하여 약 7bits를 절약할 수 있다.

Claims (3)

  1. LSF 계수 벡터를 입력받아 DC성분을 제거하는 감산기와,
    상기 DC성분이 제거된 LSF 계수 벡터를 각각 입력받아 양자화하는 메모리기반 벡터양자화기 및 비메모리 벡터양자화기와,
    상기 메모리기반 벡터양자화기와 비메모리 벡터양자화기에서 각각 양자화된 양자화벡터 중에서 입력 LSF 계수벡터와의 유클리디안 거리가 적은 양자화벡터를 선택하여 출력하는 스위칭수단과,
    상기 스위칭수단에서 선택된 양자화벡터와 상기 LSF 계수 벡터의 DC성분을 가산하는 가산기를 포함한 것을 특징으로 하는 광대역 음성 부호화기용 LSF 양자화기.
  2. 제 1 항에 있어서,
    상기 메모리기반 벡터양자화기는, 상기 입력 LSF 계수벡터를 1차 AR 예측기를 사용하여 예측하고, 예측된 벡터와 입력 LSF 계수벡터와의 차이인 예측에러벡터를 피라미드 벡터양자화하는 것을 특징으로 하는 광대역 음성 부호화기용 LSF 양자화기.
  3. 제 1 항에 있어서,
    상기 비메모리 벡터양자화기는, 상기 입력 LSF 계수벡터를 풀(full) 벡터의 형태로 피라미드 벡터양자화하는 것을 특징으로 하는 광대역 음성 부호화기용 LSF 양자화기.
KR1020010015675A 2001-03-26 2001-03-26 광대역 음성 부호화기용 lsf 양자화기 KR20020075592A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020010015675A KR20020075592A (ko) 2001-03-26 2001-03-26 광대역 음성 부호화기용 lsf 양자화기
US10/033,649 US6988067B2 (en) 2001-03-26 2001-12-27 LSF quantizer for wideband speech coder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020010015675A KR20020075592A (ko) 2001-03-26 2001-03-26 광대역 음성 부호화기용 lsf 양자화기

Publications (1)

Publication Number Publication Date
KR20020075592A true KR20020075592A (ko) 2002-10-05

Family

ID=19707417

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020010015675A KR20020075592A (ko) 2001-03-26 2001-03-26 광대역 음성 부호화기용 lsf 양자화기

Country Status (2)

Country Link
US (1) US6988067B2 (ko)
KR (1) KR20020075592A (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100463577B1 (ko) * 2002-11-01 2004-12-29 한국전자통신연구원 음성 부호화기용 선스펙트럼주파수 벡터 양자화 장치
KR100903110B1 (ko) * 2007-04-13 2009-06-16 한국전자통신연구원 트렐리스 부호 양자화 알고리듬을 이용한 광대역 음성 부호화기용 lsf 계수 양자화 장치 및 방법
KR101016115B1 (ko) * 2008-12-03 2011-02-17 주식회사 삼천리 가스배관 철거시스템 및 이를 이용한 가스배관 철거방법
CN111788628A (zh) * 2018-03-02 2020-10-16 日本电信电话株式会社 编码装置、编码方法、程序以及记录介质
CN112927703A (zh) * 2014-05-07 2021-06-08 三星电子株式会社 对线性预测系数量化的方法和装置及解量化的方法和装置
CN117423348A (zh) * 2023-12-19 2024-01-19 山东省计算中心(国家超级计算济南中心) 基于深度学习和矢量预测的语音压缩方法及***

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8090577B2 (en) * 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
KR100486732B1 (ko) * 2003-02-19 2005-05-03 삼성전자주식회사 블럭제한된 트렐리스 부호화 양자화방법과 음성부호화시스템에있어서 이를 채용한 라인스펙트럼주파수 계수양자화방법 및 장치
KR100487719B1 (ko) * 2003-03-05 2005-05-04 한국전자통신연구원 광대역 음성 부호화를 위한 엘에스에프 계수 벡터 양자화기
KR100656788B1 (ko) * 2004-11-26 2006-12-12 한국전자통신연구원 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더
CN100421370C (zh) * 2005-10-31 2008-09-24 连展科技(天津)有限公司 一种amr语音编码的源控制速率中降低sid帧传输速率的方法
CA2729752C (en) 2008-07-10 2018-06-05 Voiceage Corporation Multi-reference lpc filter quantization and inverse quantization device and method
GB2466666B (en) * 2009-01-06 2013-01-23 Skype Speech coding
CN102081926B (zh) 2009-11-27 2013-06-05 中兴通讯股份有限公司 格型矢量量化音频编解码方法和***
KR101747917B1 (ko) 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
US10109287B2 (en) * 2012-10-30 2018-10-23 Nokia Technologies Oy Method and apparatus for resilient vector quantization
US10366698B2 (en) 2016-08-30 2019-07-30 Dts, Inc. Variable length coding of indices and bit scheduling in a pyramid vector quantizer

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5271089A (en) * 1990-11-02 1993-12-14 Nec Corporation Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
US5675701A (en) * 1995-04-28 1997-10-07 Lucent Technologies Inc. Speech coding parameter smoothing method
KR100322706B1 (ko) * 1995-09-25 2002-06-20 윤종용 선형예측부호화계수의부호화및복호화방법
US5774839A (en) * 1995-09-29 1998-06-30 Rockwell International Corporation Delayed decision switched prediction multi-stage LSF vector quantization
US5826225A (en) * 1996-09-18 1998-10-20 Lucent Technologies Inc. Method and apparatus for improving vector quantization performance
US6006179A (en) * 1997-10-28 1999-12-21 America Online, Inc. Audio codec using adaptive sparse vector quantization with subband vector classification
US6463407B2 (en) * 1998-11-13 2002-10-08 Qualcomm Inc. Low bit-rate coding of unvoiced segments of speech
US6516297B1 (en) * 1998-12-23 2003-02-04 At&T Corp. Multiple description lattice vector quantization
US6504877B1 (en) * 1999-12-14 2003-01-07 Agere Systems Inc. Successively refinable Trellis-Based Scalar Vector quantizers
KR100324204B1 (ko) * 1999-12-24 2002-02-16 오길록 예측분할벡터양자화 및 예측분할행렬양자화 방식에 의한선스펙트럼쌍 양자화기의 고속탐색방법

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100463577B1 (ko) * 2002-11-01 2004-12-29 한국전자통신연구원 음성 부호화기용 선스펙트럼주파수 벡터 양자화 장치
KR100903110B1 (ko) * 2007-04-13 2009-06-16 한국전자통신연구원 트렐리스 부호 양자화 알고리듬을 이용한 광대역 음성 부호화기용 lsf 계수 양자화 장치 및 방법
KR101016115B1 (ko) * 2008-12-03 2011-02-17 주식회사 삼천리 가스배관 철거시스템 및 이를 이용한 가스배관 철거방법
CN112927703A (zh) * 2014-05-07 2021-06-08 三星电子株式会社 对线性预测系数量化的方法和装置及解量化的方法和装置
CN111788628A (zh) * 2018-03-02 2020-10-16 日本电信电话株式会社 编码装置、编码方法、程序以及记录介质
CN111788628B (zh) * 2018-03-02 2024-06-07 日本电信电话株式会社 声音信号的编码装置、声音信号的编码方法以及记录介质
CN117423348A (zh) * 2023-12-19 2024-01-19 山东省计算中心(国家超级计算济南中心) 基于深度学习和矢量预测的语音压缩方法及***
CN117423348B (zh) * 2023-12-19 2024-04-02 山东省计算中心(国家超级计算济南中心) 基于深度学习和矢量预测的语音压缩方法及***

Also Published As

Publication number Publication date
US20020138260A1 (en) 2002-09-26
US6988067B2 (en) 2006-01-17

Similar Documents

Publication Publication Date Title
KR20020075592A (ko) 광대역 음성 부호화기용 lsf 양자화기
KR100712056B1 (ko) 가변 비트율 음성 부호화에서의 선형 예측 매개변수들의견실한 예측 벡터 양자화를 위한 방법 및 장치
CA2443443C (en) Method and system for line spectral frequency vector quantization in speech codec
EP2313887B1 (en) Variable bit rate lpc filter quantizing and inverse quantizing device and method
US8229749B2 (en) Wide-band encoding device, wide-band LSP prediction device, band scalable encoding device, wide-band encoding method
JPH08263099A (ja) 符号化装置
EP1326235A2 (en) Efficient excitation quantization in noise feedback coding with general noise shaping
US8090577B2 (en) Bandwidth-adaptive quantization
JP2023169294A (ja) 符号化及び復号化のための符号化装置、復号化装置、システム及び方法
KR100486732B1 (ko) 블럭제한된 트렐리스 부호화 양자화방법과 음성부호화시스템에있어서 이를 채용한 라인스펙트럼주파수 계수양자화방법 및 장치
CN117316168A (zh) 用于对音频信号进行编码的音频编码器以及方法
KR100487719B1 (ko) 광대역 음성 부호화를 위한 엘에스에프 계수 벡터 양자화기
KR20080092770A (ko) 트렐리스 부호 양자화 알로리즘을 이용한 광대역 음성부호화기용 lsf 계수 양자화 장치 및 방법
US8706481B2 (en) Multi-path trellis coded quantization method and multi-path coded quantizer using the same
EP1326237A2 (en) Excitation quantisation in noise feedback coding
US7110942B2 (en) Efficient excitation quantization in a noise feedback coding system using correlation techniques
US8502708B2 (en) Encoding method and decoding method, and devices, program and recording medium for the same
KR100341398B1 (ko) 씨이엘피형 보코더의 코드북 검색 방법
KR100463577B1 (ko) 음성 부호화기용 선스펙트럼주파수 벡터 양자화 장치
Chi et al. Safety-net pyramid VQ of LSF parameters for wideband speech codecs
JPH08179800A (ja) 音声符号化装置
JPH06202697A (ja) 励振信号の利得量子化方法
Chatterjee et al. Gaussian mixture model based switched split vector quantization of LSF parameters
JP3700310B2 (ja) ベクトル量子化装置及びベクトル量子化方法
WO1999041736A2 (en) A system and method for providing split vector quantization data coding

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application