KR100872538B1 - Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, lpc 계수의 복호화 장치, 기록 매체,음성 부호화 장치, 음성 복호화 장치, 음성 신호 송신장치, 및 음성 신호 수신 장치 - Google Patents

Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, lpc 계수의 복호화 장치, 기록 매체,음성 부호화 장치, 음성 복호화 장치, 음성 신호 송신장치, 및 음성 신호 수신 장치 Download PDF

Info

Publication number
KR100872538B1
KR100872538B1 KR1020037007206A KR20037007206A KR100872538B1 KR 100872538 B1 KR100872538 B1 KR 100872538B1 KR 1020037007206 A KR1020037007206 A KR 1020037007206A KR 20037007206 A KR20037007206 A KR 20037007206A KR 100872538 B1 KR100872538 B1 KR 100872538B1
Authority
KR
South Korea
Prior art keywords
vector
lpc
code
order
lsf
Prior art date
Application number
KR1020037007206A
Other languages
English (en)
Other versions
KR20030062361A (ko
Inventor
가즈토시 야스나가
도시유키 모리이
히로유키 에하라
가즈노리 마노
유스케 히와사키
Original Assignee
파나소닉 주식회사
니폰덴신뎅와 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 파나소닉 주식회사, 니폰덴신뎅와 가부시키가이샤 filed Critical 파나소닉 주식회사
Publication of KR20030062361A publication Critical patent/KR20030062361A/ko
Application granted granted Critical
Publication of KR100872538B1 publication Critical patent/KR100872538B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3082Vector coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms
    • G10L2019/0014Selection criteria for distances

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

LSF 코드북(101)에 저장된 많은 LPC 코드 벡터에 대하여, 가중치 부여 유클리드 거리를 척도로 하여 LPC 코드 벡터를 예비 선택하고, 예비 선택에 의해 남겨진 LPC 코드 벡터에 대해서는 스펙트럼 공간에서의 왜곡량을 척도로 하여 부호 최종 선택을 한다. 이것에 의해, LPC 파라미터의 벡터 양자화기의 양자화 성능을 높여, 음성 부호화·복호화 장치에서의 합성 음성의 품질 향상을 도모할 수 있다.

Description

LPC 파라미터의 벡터 양자화 장치, LPC 파라미터 복호화 장치, LPC 계수의 복호화 장치, 기록 매체, 음성 부호화 장치, 음성 복호화 장치, 음성 신호 송신 장치, 및 음성 신호 수신 장치{VECTOR QUANTIZING DEVICE FOR LPC PARAMETERS}
본 발명은 인터넷 통신으로 대표되는 패킷 통신 시스템이나, 이동 통신 시스템 등의 분야에서 음성 신호의 전송 효율을 높이기 위해서 이용되는 음성 부호화·복호화 장치에 적용하는 LPC 파라미터의 벡터 양자화 장치에 관한 것이다.
인터넷 통신으로 대표되는 패킷 통신 시스템이나, 이동 통신 시스템 등에서 음성 신호를 전송하는 경우, 음성 신호의 전송 효율을 높이기 위해서 압축·부호화 기술이 잘 사용된다. 지금까지 많은 음성 부호화 방식이 개발되어 있고, 최근 개발된 저비트 레이트 음성 부호화 방식의 대부분은 음성 신호를 스펙트럼 포락 정보와 스펙트럼의 미세 구조 정보로 분리하고, 분리한 정보를 각각 압축·부호화하는 방식이다. 예컨대, 문헌 1(M.R.Schroeder, B.S.Atal, "Code Excited Linear Prediction : High Quality Speech at Low Bit Rate1", IEEEproc., ICASSP'85 pp.937-940)에 기재된 CELP 방식이 그 일례이다.
여기서, CELP 방식의 음성 부호화 장치의 개요에 대해 도 1을 이용하여 설명한다. 또, 입력 음성 신호는 20㎳ 정도의 시간 간격으로 구분된 처리 프레임마다 음성 부호화 장치에 순차적으로 입력되는 것으로 한다.
처리 프레임마다 음성 부호화 장치에 입력된 입력 음성 신호는 먼저 LPC 분석부(11)에 공급된다. LPC 분석부(11)는 입력 음성 신호를 LPC(Linear Predictive Coding) 분석하여 LPC 계수를 얻고, 얻어진 LPC 계수를 벡터 양자화하여 LPC 부호로 해서, 이 LPC 부호를 복호화하여 복호화 LPC 계수를 얻는다.
음원 작성부(14)는 적응 부호 리스트(12) 및 고정 부호 리스트(13)로부터 각각 적응 코드 벡터 및 고정 코드 벡터를 판독하여 LPC 합성부(15)로 보낸다. LPC 합성부(15)는 음원 작성부(14)로부터 공급되는 적응 코드 벡터 및 고정 코드 벡터를, LPC 분석부(11)로부터 인가되는 복호화 LPC 계수를 필터 계수로 갖는 전극형(全極型)의 합성 필터에 의해 각각 합성 필터링하여 합성 적응 코드 벡터 및 합성 고정 코드 벡터를 얻는다.
비교부(16)는 LPC 합성부(15)로부터 출력되는 합성 적응 코드 벡터와 합성 고정 코드 벡터와 입력 음성 신호의 관계를 분석하여, 합성 적응 코드 벡터에 곱하는 적응 부호 리스트 최적 이득과 합성 고정 코드 벡터에 곱하는 고정 부호 리스트 최적 이득을 각각 구한다. 또, 비교부(16)는 합성 적응 코드 벡터에 적응 부호 리스트 최적 이득을 곱해 얻어지는 벡터와, 합성 고정 코드 벡터에 고정 부호 리스트 최적 이득을 곱해 얻어지는 벡터를 가산하여 합성 음성 벡터를 얻어, 얻어진 합성 음성 벡터와 입력 음성 신호와의 거리 계산을 실행한다.
또, 비교부(16)는 적응 부호 리스트(12)가 저장하고 있는 적응 코드 벡터와, 고정 부호 리스트(13)가 저장하고 있는 고정 코드 벡터의 모든 조합에 대해 음원 작성부(14) 및 LPC 합성부(15)를 기능시켜 얻어지는 많은 합성 음성 벡터와 입력 음성 신호와의 거리 계산을 실행하여, 그 중에서 거리를 최소화하는 적응 코드 벡터의 인덱스와 고정 코드 벡터의 인덱스를 구하여, 각 부호 리스트로부터 출력되는 코드 벡터의 인덱스, 인덱스에 대응하는 각각의 코드 벡터, 및 인덱스에 대응하는 적응 부호 리스트 최적 이득 및 고정 부호 리스트 최적 이득을 파라미터 부호화부(17)로 보낸다.
파라미터 부호화부(17)는 적응 부호 리스트 최적 이득과 고정 부호 리스트 최적 이득을 부호화하여 이득 부호를 얻고, 얻어진 이득 부호와, LPC 분석부(11)로부터 인가된 LPC 부호와, 각 부호 리스트의 인덱스를 처리 프레임마다 통합하여 출력한다.
또, 파라미터 부호화부(17)는 적응 부호 리스트의 인덱스에 대응하는 적응 코드 벡터에 이득 부호에 대응하는 적응 부호 리스트 이득을 곱하여 얻어지는 벡터와, 고정 부호 리스트의 인덱스에 대응하는 고정 코드 벡터에 이득 부호에 대응하는 고정 부호 리스트 이득을 곱한 벡터와의 2개 벡터를 가산하여 구동 음원 벡터를 얻어, 얻어진 구동 음원 벡터에 의해 적응 부호 리스트(12) 내의 오래된 적응 코드 벡터를 갱신한다.
또, LPC 합성부(15)에서의 합성 필터링은 선형 예측 계수나, 고역(高域) 강 조 필터나, 입력 음성을 장기 예측 분석하여 얻어지는 장기 예측 계수를 이용한 청감 가중치 부여 필터를 병용하는 것이 일반적이다. 또한, 적응 부호 리스트와 고정 부호 리스트의 최적 인덱스의 탐색, 최적 이득의 산출, 최적 이득의 부호화 처리는 프레임을 더 분할한 서브프레임 단위로 행하여지는 것이 일반적이다.
다음에, LPC 분석부(11)가 실행하는 "LPC 계수의 벡터 양자화"의 처리 개요에 대해 도 2를 이용하여 더 상세하게 설명한다. 또, LPC 코드북(22)에는 많은 처리 프레임의 입력 음성 신호를 실제로 LPC 분석하여 얻어지는 많은 LPC 계수에 대해 LBG 알고리즘을 적용함으로써 미리 획득된 복수 종류의 대표적 LPC 계수가 저장되어 있는 것으로 한다. LBG 알고리즘에 대해서는, 문헌 2(Y. Linde, A. Buzo, R. M. Gray, "An Algorithm for Vector Quantizer Design," IEEE trans. Comm., Vol. COM-28, No.1, pp84-95, Jan., 1980)에 그 기술 상세가 개시되어 있다.
도 2의 벡터 양자화기에 입력된 양자화 타겟(처리 프레임 구간의 음성 신호를 LPC 분석하여 얻은 LPC 계수가 양자화 타겟에 상당함)은 거리 계산부(21)에 공급된다. 다음에, 거리 계산부(21)가, LPC 코드북(22)에 저장된 LPC 코드 벡터와 상기 양자화 타겟과의 유클리드 거리를 하기 수학식 1에 의해 계산한다.
Figure 112003019175763-pct00001
단, 수학식 1에서, XT는 양자화 타겟, Cm은 LPC 코드북 내의 m(1≤m ≤M)번째 의 LPC 코드 벡터, i는 벡터의 요소 번호, N은 벡터의 차수(LPC 분석 차수와 대응하고 있음), dm은 XT과 Cm간의 유클리드 거리이다.
거리 계산부(21)는 LPC 코드북(22)이 저장하는 모든 LPC 코드 벡터와 양자화 타겟간의 유클리드 거리를 순차적으로 계산하여, 계산 결과를 LPC 부호 탐색부(23)로 순차적으로 출력한다. LPC 부호 탐색부(23)는 거리 계산부(21)로부터 공급되는 각각의 유클리드 거리를 대소 비교하여, 유클리드 거리를 최소화하는 LPC 코드 벡터의 인덱스를 LPC 부호(처리 프레임의 스펙트럼 포락 정보를 표현하는 부호)로서 출력한다.
한편, LPC 부호로부터 복호화 LPC 계수를 생성하는(LPC 파라미터의 복호화 처리) 경우에는, LPC 부호가 나타내는 인덱스와 대응하는 LPC 코드 벡터를 LPC 코드북으로부터 판독하면 된다. 또, LPC 부호로부터 복호화 LPC 계수를 생성하는 처리는, 복호화 LPC 계수를 필터 계수로 하는 전극형 LPC 합성 필터를 구성하기 때문에, 음성 부호화 장치 및 음성 복호화 장치의 쌍방에서 행하여지는 것이 일반적이다.
최근 개발된 많은 음성 부호화·복호화 장치에서는, LPC 계수가 그대로 벡터 양자화되는 경우는 없고, LPC 계수는 그것과 1대1로 상호 변환 가능한 주파수 영역의 파라미터인 LSF(Line Spectral Frequency) 파라미터나 LSP(Line Spectral Pairs) 파라미터로 변환된 후에 주파수 영역에서 벡터 양자화되는 것이 일반적이다. LPC 계수를 직접 벡터 양자화하는 경우보다도, 주파수 영역으로 변환한 후에 벡터 양자화한 쪽이 양자화 효율, 보간 특성이 높기 때문이다. 또, LSF(또는 LSP) 파라미터의 특징, LPC 계수와의 상호 변환 방법에 대해서는, 문헌 3(F. Itakura, "Line Spectrum Representation of Linear Predictive Coefficients of Speech Signal," J. Acoust. Soc. Amer., vol57, p.S35, Apr.1975)나, 문헌 4(L. K. Paliwal and B. S. Atal, "Efficient Vector Quantization of LPC Parameter at 24 Bits/Frame," IEEE trans. on Speech and Audio Processing, vol.1, PP.3-14, Jan. 1993)에 개시되어 있다.
예컨대, LSF 파라미터를 벡터 양자화하는 경우에는, LPC 계수를 변환하여 얻어지는 주파수 영역의 LSF 파라미터 LSFT[i](i=1, …, N)가 양자화 타겟으로서 벡터 양자화기에 입력된다. 이 경우, LPC 코드북에 LSF 파라미터 표현된 코드 벡터 LSFm[i](i=1, …, N)를 저장해 두면, LPC 계수를 벡터 양자화하는 경우와 마찬가지의 순서로, LSF 파라미터를 벡터 양자화하는 것이 가능하다. 단, LSF(또는 LSP) 파라미터를 벡터 양자화하는 경우에는, LPC 부호 탐색의 척도로서는 상기 수학식 1 대신에 하기 수학식 2의 가중치 부여 유클리드 거리 dm이 사용되는 경우가 많다.
Figure 112003019175763-pct00002
가중치 부여 유클리드 거리에 대해서는, 예컨대 상기 문헌 4나 문헌 5(A. Kataoka, T. Moriya and S. Hayashi, "An 8-kb/s Conjugate Structure CELP(CS-CELP) Speech Coder," IEEE trans. Speech and Audio Processing, vol.4, No.6, pp.401-411, Nov. 1996)나 문헌 6(R. Hagen, E. Paksoy, and A. Gersho, "Voicing-Specific LPC Quantization for Variable-Rate Speech Coding," IEEE trans. Speech and Audio Processing, vol.7, no.5, pp.485-494, Sept., 1999)에 그 상세가 개시되어 있다.
또, LPC 부호로부터 복호화 LSF 파라미터를 생성하는 처리(LSF 파라미터의 복호화 처리)에 대해서도, LPC 부호로부터 복호화 LPC 계수를 생성하는 경우와 마찬가지의 방법, 즉 LPC 부호에 관한 LSF 코드 벡터를 코드북으로부터 판독함으로써 실현할 수 있다. 단 이 경우, LPC 부호에 근거하여 판독된 복호화 LSF 파라미터는 주파수 영역의 파라미터이다. 따라서, 전극형 구조의 LPC 합성 필터의 필터 계수를 획득하기 위해서는, 복호화 LSF 파라미터를 복호화 LPC 계수로 변환할 필요가 별도로 필요하게 된다.
CELP 방식 등의 음성 부호화·복호화 장치에서는, 음성 신호의 단시간적인 스펙트럼 포락 정보를 나타내는 LPC 파라미터(이하, LPC 계수나, LPC 계수와 상호 변환 가능한 LSF 등의 파라미터를 "LPC 파라미터"라고 총칭함)는 벡터 양자화기에 의해 압축·부호화되는 것이 일반적이다. 그러나, 도 2와 같은 단순한 구성의 벡터 양자화기를 그대로 적용한 경우에는, 처리 프레임마다 발생하는 양자화 왜곡이 커져, 양호한 합성 음성을 얻을 수 없다. 그 때문에, 「예측 벡터 양자화 기술」, 「다단 벡터 양자화 기술」, 「스플릿트 벡터 양자화 기술」 등, 벡터 양자화기의 성능을 향상시키기 위한 연구·개발이 지금까지 많이 이루어지고 있으며, 고성능인 벡터 양자화기를 설계하기 위해서는, 그들 많은 기술을 병용하는 것이 불가결하게 되어 있다.
그런데, LPC 파라미터의 벡터 양자화기를 새로이 설계(또는 개량)한 경우에는, 그 양자화기의 성능을 비교 평가하기 위한 평가 척도가 필요해진다. 성능 평가 시에는, LPC 파라미터가 본래적으로 음성 신호의 단시간적인 스펙트럼 포락 정보를 표현하는 파라미터인 것을 고려한 평가 척도를 이용하는 것이 바람직하다. 그 때문에, 양자화 타겟을 벡터 양자화했을 때에 발생하는 왜곡을 LPC 모델의 스펙트럼에 대응한 LPC 켑스트럼(cepstrum) 공간에서 비교하는 하기 수학식 3의 CD(Cepstral Distortion)나, FFT(Fast Fourier Transformation) 스펙트럼 공간에서 비교하는 하기 수학식 4의 SD(Spectral Distortion)이 평가 척도로서 잘 이용된다.
Figure 112003019175763-pct00003
단, 수학식 3에서, L은 평가 데이터의 프레임 수, l(엘)은 프레임 번호, Nc는 LPC 켑스트럼 차수(LPC 분석 차수 N이 10차인 경우, Nc는 16차수 정도인 경우가 많음), CEPt (l)[i]는 1번째 처리 프레임의 양자화 타겟을 변환하여 얻어지는 LPC 켑스트럼, CEPq (l)[i]는 1번째 처리 프레임의 복호화 LPC 파라미터를 변환하여 얻어지는 LPC 켑스트럼이다. LPC 켑스트럼의 특징이나, LPC 계수와 LPC 켑스트럼간의 상호 변환 방법은, 예컨대 문헌 7(M R.Shroeder, "Direct(Nonrecursive) Relations Between Cepstrum and Predictor Coefficients," IEEE trans. on vol. ASSP-29, No.2, pp.297-301, Apr., 1981)에 그 기술의 상세가 개시되어 있다.
Figure 112003019175763-pct00004
단, 수학식 4에서, L은 평가 데이터의 프레임 수, 1(엘)은 프레임 번호, K는 FFT점 수, SPt (l)(ωj)는 1번째 처리 프레임의 양자화 타겟의 FFT 파워 스펙트럼, SPq (l)(ωj)는 1번째 처리 프레임의 복호화 LPC 파라미터의 FFT 파워 스펙트럼, ωj=2πj/K이다. SD의 특징은, 예컨대 상기 문헌 4에 그 기술의 상세가 개시되어 있다.
수학식 3의 CD나 수학식 4의 SD는 모두 처리 프레임마다 발생하는 양자화 왜곡을 평가 데이터 전체에 걸쳐 가산한 후, 가산 결과를 평가 데이터 내의 프레임 수로 평균한 것이다. 따라서, CD나 SD가 작을수록, 벡터 양자화기의 성능은 높은 것으로 된다.
LPC 파라미터를 벡터 양자화하는 경우, 유클리드 거리 수학식 1이나, 가중치 부여 유클리드 거리 수학식 2가 부호 탐색의 기준 척도로서 이용되고 있다. 한편, LPC 파라미터의 벡터 양자화기의 성능은 수학식 3에 기재된 CD나 수학식 4에 기재된 SD를 척도로서 평가되는 것이 일반적이다. 즉, 지금까지 개발된 LPC 파라미터의 벡터 양자화기에서는, 벡터 양자화기가 부호 탐색 시에 이용하는 기준 척도와, 벡터 양자화기의 성능 평가에 이용하는 평가 척도가 상이하다. 그 때문에, LPC 파라미터를 벡터 양자화하여 선택된 LPC 부호가, 평가 척도인 CD나 SD를 실제로 최소화하는 인덱스이라고는 한정하지 않고, 이것이 고성능인 벡터 양자화기를 구성하는데 있어 과제로 되어 있다.
상기 과제에 대한 가장 간단한 해결 방법안으로서는, LPC 코드 벡터를 상호 변환 가능한 LPC 켑스트럼 코드 벡터(또는 FFT 파워 스펙트럼 코드 벡터)로 미리 변환하고 나서 코드북에 저장해 두고, 다음에 양자화 타겟이 입력될 때마다 그것을 LPC 켑스트럼(또는 FFT 파워 스펙트럼)으로 변환하여, CD(또는 SD)을 거리 척도로서 LPC 켑스트럼 코드 벡터(또는 FFT 파워 스펙트럼 코드 벡터)를 선택하면 좋다고 생각된다.
그러나, 상기 해결 방법안에서는, 코드 벡터를 저장하기 위한 메모리 용량이 대폭 증가해 버린다. 또한, 저비트 레이트 음성 부호화 방식에서 빈번히 이용되는 「예측 벡터 양자화 기술」이나 「다단 벡터 양자화 기술」을 병용한 벡터 양자화기를 생각한 경우, LPC 켑스트럼과 상호 변환성이 없는 벡터(예측 잔차 벡터나 양자화 오차 벡터)를 코드북에 저장해 두어야 하기 때문에, 상기 해결 방법안을 채용하는 것은 불가능하다.
발명의 개시
본 발명의 목적은, LPC 파라미터의 벡터 양자화기의 양자화 성능을 높여, 음성 부호화·복호화 장치에서의 합성 음성의 품질 향상을 도모할 수 있는 LPC 파라 미터의 벡터 양자화 장치를 제공하는 것이다.
이 목적은, 양자화 타겟인 LSF 파라미터를 벡터 양자화할 때에, LSF 코드북이 저장하는 다수의 LSF 코드 벡터로부터, 가중치 부여 유클리드 거리를 척도로 하여, 미리 설정한 소수개의 코드 벡터로 예비 선택하여, 선택한 소수개의 LSF 코드 벡터로부터 CD 최소화를 척도로서 최종적인 부호를 최종 선택하는 것에 의해 달성된다.
도 1은 CELP 방식의 음성 부호화 장치의 구성을 나타내는 블럭도,
도 2는 종래의 LPC 파라미터의 벡터 양자화 장치의 기본 구성을 나타내는 블럭도,
도 3은 본 발명의 실시예 1에 따른 LPC 파라미터의 벡터 양자화 장치의 구성을 나타내는 블럭도,
도 4는 본 발명의 실시예 1에 따른 복호화 LPC 파라미터의 생성 방법을 설명하기 위한 블럭도,
도 5는 본 발명의 실시예 2에 따른 LSF 파라미터의 벡터 양자화 장치의 구성을 나타내는 블럭도,
도 6은 본 발명의 실시예 3에 따른 LSF 파라미터의 벡터 양자화 장치의 구성을 나타내는 블럭도,
도 7은 본 발명의 실시예 4에 따른 음성 신호 송신 장치 및 음성 신호 수신 장치의 구성을 나타내는 블럭도,
도 8은 본 발명의 실시예 4에 따른 음성 부호화 장치의 구성을 나타내는 블럭도,
도 9는 본 발명의 실시예 4에 따른 음성 복호화 장치의 구성을 나타내는 블럭도이다.
발명을 실시하기 위한 최선의 형태
이하, 본 발명의 실시예에 대해 도면을 이용하여 설명한다.
(실시예 1)
본 발명에 따른 LPC 파라미터의 벡터 양자화 장치에 대해 도 3을 이용하여 설명한다. 도 3은 본 발명의 실시예 1에 따른 벡터 양자화 장치의 구성을 나타내는 블럭도이다.
이 벡터 양자화 장치는 LSF 코드 벡터를 저장하는 LSF 코드북(101)과, LSF 코드북(101)의 LSF코드 벡터와 양자화 타겟 벡터 사이의 거리 계산을 실행하는 거리 계산부(102)와, 거리 계산부(102)에 의해 구해진 거리에 근거하여 LPC 부호를 예비 선택하는 LPC 부호 예비 선택부(103)와, LSF 파라미터를 LPC 계수로 변환하는 LSF·LPC 계수 변환부(104, 106)와, LPC 계수를 LPC 켑스트럼으로 변환하는 LPC 계수·LPC 켑스트럼 변환부(105, 107)와, LPC 켑스트럼 공간에서의 왜곡 평가 결과에 근거하여 LPC 부호를 최종 선택하는 LPC 부호 최종 선택부(108)를 구비하고 있다.
또, 상기 구성의 벡터 양자화 장치에 있어서, LSF 코드북(101)에는, LBG 알고리즘에 의해서 미리 획득된 M개의 LSF 코드 벡터가 저장되어 있는 것으로 한다. 또한, 본 실시예에서의 LPC 파라미터의 벡터 양자화 장치에서는, 처리 프레임 구간의 음성 신호를 LPC 분석하여 LPC 계수를 얻고, 얻어진 LPC 계수를 더 변환하여 얻어지는 LSF 파라미터가 양자화 타겟으로서 입력되는 것으로 한다. 이하, 양자화 타겟을 LSFT[i](i=1, …, N)으로 기호 표현하는 것도 있다. 또한, N은 LPC 분석 차수이다.
벡터 양자화 장치에 입력된 양자화 타겟(LSFT[i](i=1, …, N))은 먼저 거리 계산부(102) 및 LSF·LPC 계수 변환부(106)에 공급된다. 한편, LSF 코드북(101)은 LPC 부호 예비 선택부(103)로부터 공급된 지시 정보(인덱스 m이 정보로서 공급됨)에 대응하는 LSF 코드 벡터 LSFm[i](i=1, …, N)를 거리 계산부(102)로 공급한다.
거리 계산부(102)는 양자화 타겟 벡터(LSFT[i](i=1, …, N))와 LSF 코드 벡터(LSFm[i](i=1, …, N)) 사이의 가중치 부여 유클리드 거리를 상기 수학식 2에 의해 계산하여, 계산 결과 dm을 LPC 부호 예비 선택부(103)로 출력한다. LPC 부호 예비 선택부(103)는 인덱스 m에 관한 거리 dm을 수리(受理)한 후, LSF 코드북(101)에 대하여, 다음 인덱스(m+1)에 관한 LSF 코드 벡터를 출력하도록 지시한다.
LPC 부호 예비 선택부(103)에서의 처리는, LSF 코드북(101)이 저장하는 모든 LSF 코드 벡터(여기서는, 총수가 M개라고 함), 양자화 타겟 및 가중치 부여 유클리 드 거리가 LPC 부호 예비 선택부(103)에 출력될 때까지, M회 반복하여 행하여지는 것으로 한다. 이 때문에, LPC 부호 예비 선택부(103)의 처리의 완료 시점에서는, LPC 부호 예비 선택부(103)에는 M개의 거리 dm(m=1, …, M)이 입력되게 된다.
LPC 부호 예비 선택부(103)는 입력된 M개의 가중치 부여 유클리드 거리를 대소 비교하여, 그 값을 작게 하는 인덱스를 상위로부터 S개 선택(본 실시예에 있어서, S의 값은 미리 설정되어 있는 것으로 함)하여, Ncand[j](j=1, …, S)에 기록한다(Ncand[j]에는 1부터 M까지의 인덱스 중 어느 하나가 기록됨). 그리고, Ncand[j](j=1, …, S)에 기록된 인덱스를 LSF 코드북(101)에 지시하여, 해당하는 LSF 코드 벡터 LSF 코드북 LSFNcand[j][i](i=1, …, N, j=1, …, S)을 LSF 코드북(101)으로부터 수취한다. 그리고, 수취한 S개의 LSF 코드 벡터를 LSF·LPC 계수 변환부(104)로 출력한다.
LSF·LPC 계수 변환부(104)는 LPC 부호 예비 선택부(103)로부터 공급된 S개(예비 선택수)의 LSF 코드 벡터 LSFNcand[j][i](i=1, …, N, j=1, …, S)을 각각 LPC 계수로 변환하여 LPCNcand[j][i](i=1, …, N, j=1, …, S)을 얻고, 얻어진 S개의 LPC 계수를 LPC 계수·LPC 켑스트럼 변환부(105)로 출력한다.
LPC 계수·LPC 켑스트럼 변환부(105)는 LSF·LPC 계수 변환부(104)로부터 공급된 S개의 LPC 계수 LPCNcand[j][i](i=1, …, N, j=1, …, S)을 각각 LPC 켑스트럼으로 변환하여 CEPNcand[j][i](i=1, …, Nc, j=1, …, S : Nc는 LPC 켑스트럼 차수)를 얻고, 얻어진 S개의 LPC 켑스트럼을 LPC 부호 최종 선택부(108)로 출력한다.
한편, LSF·LPC 계수 변환부(106)는 양자화 타겟 LSFT[i](i=1, …, N)를 LPC 계수로 변환하여 LPCT[i](i=1, …, N)를 얻고, 얻어진 LPC 계수를 LPC 계수·LPC 켑스트럼 변환부(107)로 출력한다. LPC 계수·LPC 켑스트럼 변환부(107)는 LSF·LPC 계수 변환부(106)로부터 공급된 LPC 계수 LPCT[i](i=1, …, N)를 LPC 켑스트럼으로 변환하여 CEPT[i](i=1, …, Nc)를 얻고, 얻어진 LPC 켑스트럼을 LPC 부호 최종 선택부(108)로 출력한다.
그리고, LPC 부호 최종 선택부(108)는 LPC 계수·LPC 켑스트럼 변환부(105)로부터 공급되는 CEPNcand[j][i](i=1, …, Nc, j=1, …, S)와, LPC 계수·LPC 켑스트럼 변환부(107)로부터 공급되는 CEPT[i](i=1, …, N, j=1, …, S) 사이의 왜곡을 하기 수학식 5에 의해 계산하여 각각의 계산 결과를 Dj(j=1, …, S)로 유지한다.
Figure 112003019175763-pct00005
그리고 Dj(j=1, …, S)를 각각 대소 비교하여, Dj를 최소화하는 번호 j를 하나 특정하여(특정된 j를 J라고 여기서는 표현함), 특정된 J에 관한 Ncand[J]를 당해 처리 프레임의 LPC 부호(처리 프레임 내의 음성 신호의 스펙트럼 포락 정보를 표현하기 위한 부호)로서 출력한다. 또, 상기 수학식 5의 최소화를 기준으로 하여 선택한 「J」와, 상기 수학식 3의 CD를 최소화를 기준으로 하여 선택한 경우에 얻어지는 LPC 부호(「J'」이라고 함)가 동일하게 되는 것은 수학식 5와 수학식 3의 관계로부터 분명하다.
또, 본 실시예의 설명에서는, 설명에 일반성을 갖게 하기 위해서, LSF 코드북(101)이 저장하는 LSF 코드 벡터의 개수를 M, LPC 부호 예비 선택부(103)가 예비 선택하는 코드 벡터의 수를 S개로 하여 설명하고 있다. 이 중 상기 M의 값은 LPC 파라미터의 벡터 양자화 장치에 배분되는 비트 수에 의해서 결정된다. 예를 들어, 도 3에 나타내는 벡터 양자화 장치에, 예컨대 프레임당 21 비트의 비트가 배분된 경우에는, M의 값은 221이라고 한 대단히 큰 수로 된다. 또한, 상기 S의 값은 자유롭게 설정하는 것이 가능하지만, 경험적으로 또는 사전의 성능 평가 시험을 통해서 8, 16 또는 32마다 설정되는 것이 많다.
다음에, 도 3에 나타내는 벡터 양자화 장치로부터 출력되는 LPC 부호(Ncand[J])로부터 복호화 LPC 계수를 생성하는 처리(LPC 파라미터의 복호화 처리라고도 함)를 도 4에 나타내는 LPC 파라미터의 복호화 장치를 이용하여 설명한다. 단, 도 4에 나타내는 복호화 장치는 벡터 양자화 장치 내와 동일한 LSF 코드북(201)과, LSF 코드북(201)으로부터 LSF 코드 벡터를 판독하는 코드 벡터 판독부(202)를 구비하고 있다.
도 4에 나타내는 LPC 파라미터의 복호화 장치에 입력된 LPC 부호(Ncand[J])는 먼저 코드 벡터 판독부(202)에 공급된다. 다음에, 코드 벡터 판독부(202)는 LPC 부호(Ncand[J])에 대응하는 LSF 코드 벡터를 출력하도록 LSF 코드북(201)에 지시한다. 그렇게 하면, LSF 코드북(201)은 LSFNcand[J][i](i=1, …, N)을 코드 벡터 판독부(202)로 출력한다. 코드 벡터 판독부(202)는 LSF 코드북(201)으로부터 공급된 벡터를 복호화 LSF 파라미터로서 출력한다.
또, 상기 LPC 파라미터 복호화 장치로부터 출력되는 복호화 LSF 파라미터는 LSF 공간의 신호이기 때문에, 전극형 LPC 합성 필터를 구성하기 위해서는 상기 복호화 LSF 파라미터를 LPC 계수 공간의 신호인 복호화 LPC 계수로 변환하는 처리가 별도로 필요하다.
이상 설명한 LPC 파라미터의 벡터 양자화 장치에 따르면, 양자화 타겟인 LSF 파라미터를 벡터 양자화할 때에, LSF 코드북이 저장하는 다수의 LSF 코드 벡터로부터, 가중치 부여 유클리드 거리를 척도로 하여, 미리 설정한 소수개의 코드 벡터로 예비 선택하는 것이 가능하며, 예비 선택에 의해서 남은 소수개의 LSF 코드 벡터로부터는 CD 최소화를 척도로 하여 최종적인 부호를 최종 선택하는 것이 가능해진다.
따라서, 상기 실시예에 따른 벡터 양자화 장치를 이용하면, LPC 부호 탐색에 소요되는 연산량을 대폭 증가시키는 일없이, 종래 기술의 과제(벡터 양자화 장치에 의해 선택되는 LPC 부호와, CD를 최소화하는 코드 벡터의 인덱스가 일치하지 않은 것이 많다고 하는 과제)를 완화시킬 수 있어, LPC 파라미터의 벡터 양자화 장치의 성능을 향상시키는 것이 가능해진다.
또, 본 실시예에 따르면, 본 발명에 따른 벡터 양자화 장치와 종래기술 설명 의 항에서 설명한 벡터 양자화 장치를 비교한 경우, 본 발명에 따른 벡터 양자화 장치쪽이 부호 탐색에 소요되는 연산량이 조금 증가한다. 연산량 증가분은 이하의 6개로 정리된다.
(1) 양자화 타겟을 LPC 계수로 변환하는 연산량
(2) (1)에 의한 LPC 계수를 LPC 켑스트럼으로 변환하는 연산량
(3) 예비 선택된 코드 벡터를 LPC 계수로 변환하는 연산량
(4) (3)에 의한 LPC 계수를 LPC 켑스트럼으로 변환하는 연산량
(5) (2)와 (4)에 의한 LPC 켑스트럼간의 왜곡을 계산하는 연산량
(6) (5)에 의한 왜곡을 대소 비교하여, 왜곡을 최소화하는 코드 벡터의 인덱스를 특정하기 위한 연산량
이 경우, 상기 연산량 증가분의 대소는 대략 예비 선택하여 남은 코드 벡터의 후보 수로 제어할 수 있다((1)부터 (6)의 연산량을 실질적으로 지배하는 것은 (3), (4), (5), (6)이며, 이들이 예비 선택의 후보 수에 직접 의존하기 때문에). 즉, 본 발명의 벡터 양자화 장치에 따르면, LPC 부호 탐색에 소요되는 연산량의 증가분과, 벡터 양자화 장치의 성능 향상과의 절충의 관계를 LPC 부호 예비 선택부(103)에 설정하는 예비 선택 후보 수의 증감으로 자유롭게 조정 가능하다. 이와 같이, 본 실시예에 따르면, LPC 부호 탐색에 소요되는 연산량의 증가분을 배려하면서 벡터 양자화 장치의 성능 향상을 도모하는 것이 가능해진다.
또, 본 실시예에서는 LPC 부호 예비 선택부가 남기는 LSF 코드 벡터의 후보 수가 미리 정해져 있는 경우에 대하여 설명하고 있지만, 예컨대 가중치 부여 유클 리드 거리에 임계값을 설정해 두고, 설정한 임계값보다 가중치 부여 유클리드 거리가 작은 후보를 예비 선택 후의 후보로서 남기는 등, 다른 예비 선택 방법을 이용하는 것도 가능하며, 그 경우에도 마찬가지의 효과·작용을 얻는 것이 가능하다.
또, 본 실시예에서는, LPC 부호 예비 선택부가 상기 수학식 2의 가중치 부여 유클리드 거리를 척도로 하여 LSF 코드 벡터를 예비 선택하는 경우에 대하여 설명하고 있지만, 예컨대, 상기 문헌 4 내의 수학식 8이나 수학식 10 등, 상기 수학식 2와는 수식적으로 다른 가중치 부여 유클리드 거리를 이용하는 경우에 대해서도 본 발명은 실시 가능하며, 그 경우에도 본 실시예와 마찬가지의 효과·작용을 얻는 것이 가능하다.
또, 가중치 부여 유클리드 거리의 "가중치"에 대해서도, 지금까지 여러 산출 방법이 제안(예컨대, LSF 파라미터의 인접하는 요소 사이의 거리에 따라 가중치 부여하는 문헌 5에 기재된 방법이나, 양자화 타겟의 파워 스펙트럼에 따라 가중치 부여하는 문헌 6에 기재된 방법 등)되어 있지만, 본 발명은 "가중치"의 산출 방법의 여하에 관계없이 적용 가능하며, 그 경우에도 마찬가지의 효과·작용을 얻을 수 있다.
또, 본 발명의 실시예에서는 벡터 양자화 장치에 입력되는 LPC 파라미터가 LSF인 경우에 대하여 설명하고 있지만, LSP 파라미터, PARCOR 계수, LPC 계수 등, 음성 신호의 단시간적인 스펙트럼 포락 정보를 표현하는 다른 파라미터가 타겟 벡터로서 벡터 양자화 장치에 입력되는 경우에 대해서도 본 발명은 적용 가능하며, 그 경우에도 마찬가지의 효과·작용을 얻을 수 있다.
단, 예컨대 LSP가 양자화 타겟으로서 입력되는 경우에는, LSF·LPC 계수 변환부(104, 106)를 LSP·LPC 계수 변환부로, LSF 코드북(101)을 LSP 코드북으로 변경해 놓아야 한다.
또, 본 발명의 실시예에서는, 부호 최종 선택부가 CD(Cepstral Distortion)를 척도로 하여 최종적인 LPC 부호를 특정하는 경우에 대하여 설명하고 있지만, LPC 계수·LPC 켑스트럼 변환부(105, 107)를 LPC 계수로부터 FFT 파워 스펙트럼을 계산하는 기능을 갖는 LPC 계수·FFT 파워 스펙트럼 산출부로 치환하고, 또한 LPC 부호 최종 선택부(108)가 실행하는 계산식을 상기 수학식 5로부터, 수학식 4의 평방근 내부의 계산식으로 치환해 놓으면, SD(Spectral Distortion)를 최종적인 LPC 부호를 특정하는 척도로서 이용하는 것도 가능하며, 이 경우에도 마찬가지의 효과·작용을 얻을 수 있다.
이상 설명한 바와 같이 본 실시예에 따르면, CELP 방식이나 Vocoder 방식 등의 음성 부호화·복호화 장치에서의 음성 신호의 단시간적인 스펙트럼 포락 정보의 부호화·복호화하는 개소에 본 벡터 양자화 장치를 적용하는 것이 바람직하다는 것을 알 수 있다.
(실시예 2)
본 실시예로서는 예측 벡터 양자화 기술, 다단 벡터 양자화 기술, 스플릿트 벡터 양자화 기술을 병용한 LPC 파라미터의 벡터 양자화 장치에 본 발명에 따른 기술을 적용했을 때의 벡터 양자화 장치의 구성, 처리 순서, 그 효과·작용에 대하여 설명한다.
또, 벡터 양자화 장치의 구성은 음성 부호화·복호화 장치 전체의 비트 레이트나, 그 중에서 LPC 파라미터의 벡터 양자화 장치에 배분되는 비트 수에 크게 의존한다. 여기서는, 설명을 간단화하기 위해서, 20㎳ 간격의 처리 프레임당 21 비트의 비트 정보가 할당된 벡터 양자화 장치를 구체예로 하여 이하의 설명을 진행시킨다.
또, 구체적으로는, 당해 설명에서 이용하는 벡터 양자화 장치에서는 3차의 MA(Moving Average) 예측 기술을 이용하여, 처리 프레임당 4세트(전환 정보로서 2 비트 필요)의 MA 예측 계수가 사용되는 것으로 한다. 또, 당해 설명에서 이용하는 벡터 양자화 장치는 2단 벡터 양자화 기술을 이용하는 것으로 한다. 또, 당해 설명에서 이용하는 벡터 양자화 장치에서는 2단 벡터 양자화 장치의 제 2 단째에 스플릿트 벡터 양자화 기술이 사용되고 있는 것으로 한다. 또, 1단째 벡터 양자화기, 2단째 저차(低次) 성분의 벡터 양자화기 및 2단째 고차 성분의 벡터 양자화기 각각에는 7 비트, 6 비트 및 6 비트가 각각 할당되어 있는 것으로 한다.
도 5는 본 발명의 실시예 2에 따른 벡터 양자화 장치의 구성을 나타내는 블럭도이다. 도 5에 도시하는 바와 같이, 본 발명에 따른 기술을 적용한 3차 MA 예측을 이용한 2단 스플릿트 구성의 벡터 양자화 장치는 가중치 산출부(301)와, 예측 계수 코드북(302)과, MA 예측기(303)와, 예측 잔차 산출부(304)와, 1단째 코드북(305)과, 1단째 거리 계산부(306)와, 1단째 VQ 예비 선택부(307)와, 1단째 VQ 잔차 계산부(308)와, 2단째 저차 코드북(309)과, 2단째 저차 거리 계산부(310) 와, 2단째 고차 거리 계산부(311)와, 2단째 고차 코드북(312)과, 2단째 저차 부호 탐색부(313)와, 2단째 고차 부호 탐색부(314)와, 예측 잔차 복호화부(315)와, 복호화 LSF 생성부(316)와, LSF·LPC 계수 변환부(317, 319)와, LPC 계수·LPC 켑스트럼 변환부(318, 320)와, LPC 부호 최종 선택부(321)를 구비하고 있다.
도 5의 설명에서는, 먼저 처음에 LSF 파라미터가 입력되고 나서 1단째 벡터 양자화기의 타겟 벡터가 얻어지기까지의 처리(가중치 산출부(301), 예측 계수 코드북(302), MA 예측기(303), 예측 잔차 산출부(304)에 관한 처리)를 상세히 설명한다.
도 5의 벡터 양자화 장치에 입력된 LSF 파라미터는 가중치 산출부(301), 예측 잔차 산출부(304) 및 LSF·LPC 계수 변환부(319)에 공급된다. 가중치 산출부(301)는 LSF 파라미터에 근거하여 가중치 부여 유클리드 거리 계산 시에 이용하는 "가중치"를 산출하여, 이 가중치를 1단째 거리 계산부(306), 2단째 저차 거리 계산부(310) 및 2단째 고차 거리 계산부(311)에 출력한다.
또, 가중치 산출부(301)에서 "가중치"를 산출하는 방법으로서는, LSF 파라미터의 인접하는 요소 사이의 거리에 따라 "가중치"를 산출하는 문헌 5에 기재된 방법이나, LSF 파라미터의 파워 스펙트럼에 따라 "가중치"를 산출하는 문헌 6에 기재된 방법 등을 이용할 수 있다. 본 발명의 실시예에서는 "가중치"의 산출에는 특별히 한정을 가하지 않는 것으로 한다.
MA 예측기(303)는 복호화 예측 잔차 저장부(322)가 저장하고 있는 과거 3 프레임만큼의 복호화 예측 잔차 벡터와, 예측 계수 코드북(302)이 저장하고 있는 3차의 MA 예측 계수를 이용하여 예측 벡터를 산출하고, 산출한 예측 벡터를 예측 잔차 산출부(304)에 출력한다.
또, 예측 벡터를 산출·출력하는 상기 처리는 예측 계수 코드북(302)이 저장하고 있는 4 세트의 3차 MA 예측 계수 각각에 대해 실행하는 것으로 한다. 따라서, MA 예측기(303)로부터는 총 4 종류의 예측 벡터가 출력되게 된다. 또한, MA 예측기(303)에 저장되어 있는 4 세트의 예측 계수는 임의로 초기 설정한 4 세트의 MA 예측 계수에 대하여, 문헌 8(S.P.Lloyd, "Least Square Quantization in PCM," IEEE trans. Inform. Theory IT-28, pp.129-137, 1982) 등에 개시되어 있는 일반화 Lloyd 알고리즘을 적용하여 미리 획득된 것이다. 이후에서는, 설명을 알고 쉽게 하기 위해서, 4 세트의 3차 MA 예측 계수를 MAk[j][i]로 기호 표시하는 것도 있다.
단, 상기 기호 표시에 있어서, k(=1, …, 4)는 3차 MA 예측 계수의 세트 번호에 대응하고 있고, j(=0, …, 3)는 프레임 번호에 대응하고 있으며(j=0이 현 처리 프레임, j=1이 현 처리 프레임보다 하나 과거의 처리 프레임, j=2가 현 처리 프레임보다 2개 과거의 처리 프레임, j=3이 현 처리 프레임보다 3개 과거의 처리 프레임), i(=1, …, N : N은 LPC 분석 차수)는 예측 계수의 벡터 요소 번호에 대응하고 있다.
예측 잔차 산출부(304)는 먼저 LSF 파라미터로부터, 평균 LSF 저장부(323)가 저장하고 있는 평균 LSF 파라미터(AV[i], i=1, …, N)를 차분한다. 또, 상기한 평균 LSF 파라미터(AV[i], i=1, …, N)는 복수 프레임에 관한 음성 신호 전체의 LSP 파라미터를 평균화하여 구하는 파라미터이며, 실제의 부호화·복호화 처리하기 이전의 단계에서 미리 획득되어, 평균 LSF 저장부(323)에 저장되고 있는 것으로 한다. 그리고 다음에, 상기 차분에 의해서 얻어진 벡터로부터, MA 예측기(303)로부터 공급된 예측 벡터를 차분하여 예측 잔차 벡터를 산출하고, 산출된 예측 잔차 벡터를 1단째 벡터 양자화기의 타겟 벡터로서 1단째 거리 계산부(306), 1단째 VQ 잔차 계산부(308), 복호화 LSF 생성부(316)로 출력한다.
또, 예측 잔차 벡터의 산출·출력을 행하는 상기 처리는 4 세트의 MA 예측 계수 각각의 경우에 대하여 행하여진다. 따라서, 예측 잔차 산출부(304)로부터는 1단째 벡터 양자화기의 타겟 벡터가 총 4 종류 출력되게 된다.
여기까지, LSF 파라미터가 입력되고 나서 1단째 벡터 양자화기의 타겟 벡터가 얻어질 때까지의 처리를 상세히 설명하였다. 다음에, 2단 벡터 양자화기에서의 1단째 벡터 양자화기의 처리(1단째 코드북(305), 1단째 거리 계산부(306), 1단째 VQ 예비 선택부(307), 1단째 VQ 잔차 계산부(308)에 관한 처리)를 상세히 설명한다.
1단째 코드북(305)은 128 종류의 예측 잔차 코드 벡터를 저장하고 있다. 또, 128 종류의 예측 잔차 코드 벡터는 양자화 타겟을 산출할 때까지의 상기 일련의 처리를 많은 처리 프레임 내의 음성 신호에 대해 실행하여 많은 예측 잔차 벡터를 얻고, 얻어진 많은 예측 잔차 벡터에 대하여 LBG 알고리즘을 적용해서 예측 잔차 벡터의 대표적인 샘플을 128 종류 추출하고, 추출된 128 종류의 대표적인 벡터에 대하여 상기 문헌 8 등에 개시되어 있는 일반화 Lloyd 알고리즘을 또한 적용하 여 미리 획득된 것이다.
1단째 거리 계산부(306)는 예측 잔차 산출부(304)로부터 공급된 1단째 벡터 양자화기의 타겟 벡터(Xk[i], i=1, …, N)와, 1단째 코드북(305)으로부터 판독한 인덱스 m의 예측 잔차 코드 벡터(Cm[i], i=1, …, N)에 MA 예측 계수의 현 처리 프레임 성분(MAk[0][i], i=1, …, N)을 곱한 벡터(MAk[0][i] * Cm[i], i=1, …, N) 사이의 가중치 부여 유클리드 거리를 하기 수학식 6에 의해 산출하고, 산출된 거리의 값을 1단째 VQ 예비 선택부(307)에 출력한다.
Figure 112003019175763-pct00006
단, 수학식 6에 있어서, w[i]는 가중치 산출부(301)에서 산출한 "가중치", k는 MA 예측 계수의 세트 번호(k=1, …,4), m은 1단째의 코드북 내의 예측 잔차 코드 벡터의 인덱스(m=1, …, 128)이다.
1단째 거리 계산부(306)에서의 상기 가중치 부여 유클리드 거리의 계산은 1단째 코드북(305)이 저장하고 있는 128 종류(m=1, …,128)의 예측 잔차 코드 벡터(Cm[i], i=1, …, N)와, 예측 잔차 산출부(304)로부터 공급되는 타겟 벡터(Xk[i], i=1, …, N)를 생성할 때에 이용한 4 세트(k=1, …,4)의 MA 예측 계수의 전체 조합(512 = 128 ×4)에 대하여 행하여진다. 따라서, 1단째 거리 계산부(306)로부터 1단째 VQ 예비 선택부(307)에는 전부 512개의 거리 dk,m(k=1, …, 4, m=1, …, 128)이 출력된다.
1단째 VQ 예비 선택부(307)는 1단째 거리 계산부(306)로부터 공급되는 상기 512개의 거리 dk,m(k=1, …, 4, m=1, …, 128)을 작은 순서대로 분류하여, 거리를 작게 하는 k(4 세트 소정의 3차 MA 예측 계수 중 어떤 3차 예측 계수 세트를 사용했는지)와 m(128 종류 소정의 1단째 코드북(305) 내의 코드 벡터 중 어떤 코드 벡터를 사용했는지)의 조합 정보를, 미리 설정된 N1번째까지 N1cand_k[j]와 N1can1_m[j](j=1, …, N1)에 각각 기록하고, 기록한 N1cand_k[j]와 N1cand[j](j=1, …, N1)를 1단째 VQ 잔차 계산부(308), 예측 잔차 복호화부(315) 및 복호화 LSF 생성부(316)로 출력한다.
1단째 VQ 잔차 산출부(308)는 1단째 VQ 예비 선택부(307)로부터 공급되는 N1가지의 N1cand_k[j]와 N1cand_m[j](j=1, …, N1)의 조합 정보에 대응하는 3차 예측 계수 세트(예측 계수 코드북(302)으로부터 판독함)와 1단째 코드북 내의 코드 벡터(1단째 코드북(305)으로부터 판독함)를 사용하여 예비 선택 처리를 한 후에 잔존하는 1단째 VQ 잔차 벡터 Xj (2)[i](i=1, …, N, j=1, …, N1)을 하기 수학식 7에 의해 N1가지 산출하여, 산출한 N1가지의 벡터를 2단째 저차 거리 계산부(310) 및 2단째 고차 거리 계산부(311)로 출력한다.
Figure 112003019175763-pct00007
또, 본 실시예에서는, 2단째 벡터 양자화기는 1단째 VQ 잔차 벡터를 저차 성 분(i=1, …, NL)과 고차 성분(i=NL+1, …, N)으로 분해(스플릿트)하고, 분해에 의해서 얻어진 각각의 벡터를 개별적으로 벡터 양자화하는 스플릿트 구성으로 되어 있다.
따라서, 1단째 VQ 잔차 벡터 산출부(308)에 의해 산출된 Xj (2)[i](i=1, …, N, j=1, …, N1)는 2단째 벡터 양자화기의 구성에 맞춘 형태로 2단째 저차 거리 계산부(310) 및 2단째 고차 거리 계산부(311)에 출력되게 된다. 구체적으로는, Xj (2)[i](i=1, …, NL, j=1, …, N1)가 2단째 저차 거리 계산부(310)에 출력되고, Xj(2)[i](i=NL+1, …, N, j=1, …, N1)가 2단째 고차 거리 계산부(311)에 출력된다.
여기까지, 2단 벡터 양자화기에서의 1단째 벡터 양자화기의 처리를 상세히 설명하였다. 다음에, 2단째 벡터 양자화기에서의 2단째 벡터 양자화기의 처리(2단째 저차 코드북(309), 2단째 저차 거리 계산부(310), 2단째 고차 거리 계산부(311), 2단째 고차 코드북(312), 2단째 저차 부호 탐색부(313), 2단째 고차 부호 탐색부(314)에 관한 처리)에 대하여 상세히 설명한다.
2단째 저차 코드북(309)은 64 종류의 2단째 저차 코드 벡터(C2Lm2L[i], i=1, …, NL, m2L=1, …, 64)를 저장하고 있다. 또, 상기 64 종류의 코드 벡터는 1단째 VQ 잔차 벡터를 산출하는 1단째 벡터 양자화기의 최후의 처리까지를 많은 처리 프레임 내의 음성 신호에 대해 실행하여 많은 1단째 VQ 잔차 벡터의 저차 성분을 얻 고, 얻어진 많은 예측 잔차 벡터 저차 성분에 대해 LBG 알고리즘을 적용하여 1단째 VQ 잔차 벡터 저차 성분의 대표적인 샘플을 64 종류 추출하고, 추출된 64 종류의 대표적인 벡터 저차 성분에 대하여 상기 문헌 8 등에 개시되어 있는 일반화 Lloyd 알고리즘을 또한 적용하여 미리 획득된 것이다.
한편, 2단째 고차 코드북(312)은 2단째 저차 코드북(309)이 1단째 VQ 잔차 코드 벡터 저차 성분을 획득하는 것과 마찬가지의 방법을 벡터 고차 성분에 적용하여 획득한 64 종류의 2단째 고차 코드 벡터(C2Hm2H[i], i=NL+1, …, N, m2H=1, …, 64)를 저장하고 있다.
2단째 저차 거리 계산부(310)는 1단째 VQ 잔차 계산부(308)로부터 공급된 1단째 VQ 잔차분 벡터의 저차 성분 Xj (2)[i](i=1, …, NL, j=1, …, N1)과, 2단째 저차 코드북(309)으로부터 판독한 인덱스 m2L의 2단째 저차 코드 벡터(C2Lm2L[i], i=1, …, NL)에 MA 예측 계수의 현 처리 프레임 성분(MAN1cand_k[j][0][i], i=1, …, NL)을 곱한 벡터(MAN1cand_k[j][0][i]*C2Lm2L[i], i=1, …, NL) 사이의 가중치 부여 유클리드 거리를 하기 수학식 8에 의해 산출하고, 산출된 거리의 값 d2Lj,m2L을 2단째 저차 부호 탐색부(313)에 출력한다.
Figure 112003019175763-pct00008
단, 수학식 8에서의 [i]는 수학식 6과 동일한 "가중치"이다.
또, 2단째 저차 거리 계산부(310)에서는, 각 j에 대하여, 2단째 저차 코드북(309)이 저장하는 64 종류의 코드 벡터에 대해 상기 수학식 8의 거리 계산이 행하여져, 구해진 가중치 부여 유클리드 거리 d2Lj,m2L(j=1, …, N1, m2L=1, …, 64)은 모두 2단째 저차 부호 탐색부(313)에 출력되는 것으로 한다(전부 N1*64개의 d2Lj,m2L이 출력됨).
2단째 고차 거리 계산부(311)는 2단째 저차 거리 계산부(310)와 마찬가지의 처리를 벡터 고차수 성분에 대해 실행하여, 가중치 부여 유클리드 거리 d2Hj,m2H(j=1, …, N1, m2H=1, …, 64)을 2단째 고차 부호 탐색부(314)에 출력한다(총 N1*64개의 d2Hj,m2H가 출력됨).
2단째 저차 부호 탐색부(313)는 2단째 저차 거리 계산부(310)로부터 공급되는 가중치 부여 유클리드 거리 d2Lj,m2L(j=1, …, N1, m2L=1, …, 64)에 대하여, 거리를 최소화하는 인덱스 m2L을 각 j마다 하나 특정하고, 특정한 N1개(j=1, …, N1)의 인덱스를 각각 N2Lcand[j](j=1, …, N1)에 기록하고, 기록한 N1개의 N2Lcand[j](j=1,…, N1)를 예측 잔차 복호화부(315)로 출력한다.
2단째 고차 부호 탐색부(314)는 2단째 고차 거리 계산부(311)로부터 공급되는 가중치 부여 유클리드 거리 d2Hj,m2H(j=1, …, N1, m2H=1, …, 64)에 대하여 거리를 최소화하는 인덱스 m2H를 각 j마다 하나 특정하고, 특정한 N1개(j=1, …, N1)의 인덱스를 N2Hcand[j](j=1, …, N1)에 기록하고, 기록한 N1개의 N2Hcand[j](j=1, …, N1)를 예측 잔차 복호화부(315)로 출력한다.
여기까지가, 2단째 벡터 양자화기에서의 2단째 벡터 양자화기의 처리의 상세 설명이다. 또, 상기의 2단째 벡터 양자화기의 처리를 종료한 시점에서, 예측 잔차 복호화부(315)에는 이하의 4 정보의 조합 정보가 N1가지(j=1, …, N1) 공급되어 있게 된다.
(1) N1cand_k[j] : 4 세트 있는 MA 예측 계수 중 어느 것이 예비 선택되었는지
(2) N1cand_m[j] : 128 종류의 1단째 코드 벡터 중 어느 것이 예비 선택되었는지
(3) N2Lcand[j] : 64 종류의 2단째 저차 코드 벡터 중 어느 것이 예비 선택되었는지
(4) N2Hcand[j] : 64 종류의 2단째 고차 코드 벡터 중 어느 것이 예비 선택되었는지
본 실시예에서의 이후의 설명에서는, 지금까지의 처리에 의해 예측 잔차 복호화부(315)에 공급되고 있는 N1가지의 조합 정보 중에서, CD를 최소화하는 조합 정보의 조합 번호를 특정하는 처리(예측 잔차 복호화부(315), 복호화 LSF 생성부(316), LSF·LPC 계수 변환부(317, 319), LPC 계수·LPC 켑스트럼 변환부(318, 320), LPC 부호 최종 선택부(321)에 관한 처리)에 대하여 상세히 설명한다.
예측 잔차 복호화부(315)는 3 종류의 인덱스 정보(N1cand_m[j], N2Lcand[j] 및 N2Hcand[j])에 대응하는 코드 벡터(CN1cand_m[j], C2LN2Lcand[j] 및 C2HN2Hcand[j] )를 1단째 코드북(305), 2단째 저차 코드북(309) 및 2단째 고차 코드북(312)으로부터 각각 판독하여, 그것들을 이용해서 하기 수학식 9에 의해 N1개(J=1, …, N1)의 복호화 예측 잔차분 벡터 Cqj[i](i=1, …, N)를 산출하고, 산출한 복호화 예측 잔차 벡터를 기록 유지하고 또한 복호화 LSF 생성부(316)에 출력한다.
Figure 112003019175763-pct00009
단, 수학식 9에서, C2LN2Lcand[j][i]=0.0(i=NL+1, …, N), C2HN2Hcand[j][i]=0.0(i=1, …, N)이다.
또, 예측 잔차 복호화부(315)는 N1cand_k[j](j=1=1, …, N1)를 복호화 LSF 생성부(316)에 출력한다.
복호화 LSF 생성부(316)는 예측 잔차 복호화부(315)로부터 공급된 N1cand_k[j](j=1, …, N1)에 대응하는 MAN1cand_k[j][0][i]를 예측 계수 코드북(302)으로부터 판독하여, 상기 판독한 MAN1cand_k[j][0][i]와, 평균 LSF 저장부(323)로부터 판독한 평균 LSF 파라미터 AV[i](i=1, …, N)와, 예측 잔차 산출부(304)로부터 공급된 양자화 타겟 벡터의 N1cand_k[j]에 관한 XN1cand_k[j][j]과, 예측 잔차 복호화부(315)로부터 공급된 Cqj[i](i=1, …, N)를 이용한 하기 수학식 10에 의해 N1개(j=1, …, N1)의 복호화 LSF 파라미터(이하, LSFqj[i], j=1, …, N1, i=1, …, N으로 함)를 산출하고, 산출한 복호화 LSF 파라미터를 LSF·LPC 계수 변환부(317)에 출력한다.
Figure 112003019175763-pct00010
LSF·LPC 계수 변환부(317)는 복호화 LSF 생성부(316)로부터 공급된 N1개(j=1, …, N1)의 복호화 LSF 파라미터(LSFqj[i], j=1, …, N1, i=1, …, N)를 각각 복호화 LPC 계수(이하, LPCqj[i], j=1, …, N1, i=1, …, N으로 함)로 변환하여 LPC 계수·LPC 켑스트럼 변환부(318)에 출력한다.
LPC 계수·LPC 켑스트럼 변환부(318)는 LSF·LPC 계수 변환부(317)로부터 공급된 N1개(j=1, …, N1)의 복호화 LPC 계수(LPCqj[i], i=1, …, N)를 각각 복호화 LPC 켑스트럼(이하, QCEPj[i], i=1, …, Nc, j=1, …, N1로 함)으로 변환하여 LPC 부호 최종 선택부(321)에 출력한다.
LSF·LPC 계수 변환부(319)는 LSF 파라미터를 LPC 계수로 변환하여 LPC 계수·LPC 켑스트럼 변환부(320)에 출력한다. LPC 계수·LPC 켑스트럼 변환부(320)는 LSF·LPC 계수 변환부(319)로부터 공급된 LPC 계수를 LPC 켑스트럼(이하, CEPt[i], i=1, …, Nc로 함)으로 변환하여 LPC 부호 최종 선택부(321)에 출력한다.
LPC 부호 최종 선택부(321)는 먼저 LPC 계수·LPC 켑스트럼 변환부(320)로부 터 공급되는 LPC 켑스트럼 계수(CEPt[i], i=1, …, Nc)와, LPC 계수·LPC 켑스트럼 변환부(318)로부터 공급되는 N1개(j=1, …, N1)의 복호화 LPC 켑스트럼(QCEPj[i], i=1, …, Nc, j=1, …, N1)과의 거리 DISj(j=1, …, N1)을 하기 수학식 11에 의해 산출하고, 산출한 N1개의 DISj를 대소 비교하여, 그것을 최소화하는 번호 「J」를 하나 특정한다.
Figure 112003019175763-pct00011
또, 상기 수학식 11의 최소화를 번호 특정의 기준 척도로 이용한 경우와, 수학식 3의 CD의 최소화를 번호 특정의 기준 척도로 이용한 경우에서는, 동일한 번호가 선택되는 것은 수학식 11과 수학식 3의 관계로부터 분명하다.
그리고, 특정된 번호 「J」에 관한 이하의 4개의 정보, 즉
(1) N1cand_k[J] : 4세트 있는 MA 예측 계수 중 어느 것이 최적인지(2 비트 사용)
(2) N1cand-k[J] : 128 종류의 1단째 코드 벡터 중에서 어느 것이 최적인지(7 비트 사용)
(3) N2Lcand[J] : 64 종류의 2단째 저차 코드 벡터 중에서 어느 것이 최적인지(6 비트 사용)
(4) N2Hcand[J] : 64 종류의 2단째 고차 코드 벡터 중에서 어느 것이 최적인 지(6 비트 사용)
를 통합한 것인 21 비트의 정보를 당해 처리 프레임의 LPC 부호(처리 프레임 구간의 스펙트럼 포락 정보를 표현하기 위한 부호)로서 출력한다.
LPC 부호 탐색에서는 DISj를 최소화하는 번호 J를 예측 잔차 복호화부(315)에 공급한다. 그리고, 예측 잔차 복호화부(315)는 유지 저장하고 있는 N1개(j=1, …, N1)의 복호화 예측 잔차분 벡터 Cqj[i](i=1, …, N) 중에서 번호 J에 관한 벡터 CqJ[i](i=1, …, N)를 선택하여 복호화 예측 잔차 저장부(322)에 출력한다.
복호화 예측 잔차 저장부(322)는 저장하고 있는 과거 복수 프레임만큼의 복호화 예측 잔차 벡터 중(본 실시예에서는 3차의 MA 예측을 하고 있기 때문에, 과거 3 프레임 만큼의 복호화 예측 잔차 벡터가 저장되어 있음), 가장 오래된 복호화 예측 잔차 벡터를 파기하고 예측 잔차 복호화부(315)로부터 새롭게 공급되는 CqJ[i](i=1, …, N)를 다음 처리 프레임에서의 MA 예측용으로 새롭게 유지한다.
이상까지의 설명이, LSF 파라미터가 벡터 양자화 장치에 입력되고 나서 LPC 부호가 출력될 때까지의 일련의 처리 내용이다. 한편, 상기한 벡터 양자화 장치로부터 출력되는 LSF 파라미터의 복호화 장치(또한 그것을 변환하여 얻어지는 LPC 계수의 복호화 장치)는, LPC 부호를 분해하여 얻어지는 4개의 인덱스 정보(N1cand_k[J], N1cand_m[J], N2Lcand[J], N2Hcand[J])로 분해하는 공정과, LPC 부호를 분해하는 공정에 의해서 얻어지는 각 인덱스 정보를 기초로 복호화 예측 잔차 벡터를 산출하는 공정과, 상기한 복호화 예측 잔차 벡터를 산출하는 공정에 의 해서 얻어지는 복호화 예측 잔차 벡터를 기초로 복호화 LSF 벡터를 생성하는 공정에 의해서 구성하는 것이 가능하다. 구체적으로는, 먼저 LPC 부호를 분해하는 공정에 의해서 LPC 부호가 4개의 인덱스 정보(N1cand_k[J], N1cand_m[J], N2Lcand[J], N2Hcand[J])로 분해된다. 다음에, 복호화 예측 잔차 벡터를 산출하는 공정에서, 인덱스 정보 N1cand_m[J]에 근거하여 1단째 코드 벡터 CN1cand_m[J]를 1단째 코드북(305)으로부터 판독하고, 다음에, 인덱스 정보 N2Lcand[J]에 근거하여 2단째 저차 코드 벡터 C2LN2Lcand[J]를 2단째 저차 코드북(309)으로부터 판독하며, 또, 인덱스 정보 N2Hcand[J]에 근거하여 2단째 고차 코드 벡터 C2HN2Hcand[J]를 2단째 고차 코드북(312)으로부터 판독하여, 그들 판독한 3개의 벡터에 대해 수학식 9에 기재된 가산 처리를 하면, LPC 부호에 대응하는 복호화 예측 잔차 벡터 CqJ[i](i=1, …, N)를 얻을 수 있다. 그리고, 복호화 LSF 벡터를 생성하는 공정에서, 인덱스 정보 N1cand_k[J]에 대응하는 MAN1cand_k[J][0][i]를 예측 계수 코드북(302)으로부터 판독하고, 상기 판독한 MAN1cand_k[J][0][i]와, 평균 LSF 저장부(323)로부터 판독한 평균 LSF 파라미터 AV[i](i=1, …, N)와, 예측 잔차 산출부(304)로부터 공급된 양자화 타겟 벡터의 N1cand_k[J]에 관한 XN1cand_k[J]와, 예측 잔차 복호화부(315)로부터 공급된 CqJ[i](i=1, …, N)를 이용한 수학식 10에 의해 최종적인 복호화 LSF 파라미터(이하, LSFqJ[i], i=1, …, N으로 함)를 얻을 수 있다. 또, 복호화한 LSF 파라미터를 또 복호화 LPC 계수로 변환하는 경우에는, 상기한 복호화 LSF 벡터를 생성하는 공정 후에, LSF·LPC 계수 변환부(317)와 동일한 기능을 갖는 공정을 더 구비하면 된다.
이상과 같이 상세히 설명한 3차 MA 예측을 이용한 2단 스플릿트 구조의 벡터 양자화 장치에 따르면, LSF 파라미터를 벡터 양자화할 때에, 가중치 부여 유클리드 거리를 척도로 하여 부호를 예비 선택하고, 예비 선택에 의해서 남겨진 후보에 대해서는 CD(Cepstral Distortion)를 기준 척도로 하여 최적의 부호를 선택할 수 있게 된다.
따라서, 상기 실시예에 따른 벡터 양자화 장치를 이용하면, LPC 부호 탐색에 소요되는 연산량을 대폭 증가시키는 일없이, 종래 기술의 과제(벡터 양자화 장치에서 선택되는 LPC 부호와, CD를 최소화하는 코드 벡터의 인덱스가 일치하지 않은 것이 많다고 하는 과제)를 완화시킬 수 있어, LPC 파라미터의 벡터 양자화 장치의 성능을 향상시킬 수 있게 된다.
또, 본 발명에 따른 벡터 양자화 장치에 따르면, 1단째 VQ 예비 선택부(307)에 의해 예비 선택하는 코드 벡터의 수를 제어함으로써, 실시예 1과 마찬가지로, LPC 부호 탐색에 소요되는 연산량의 증가분을 자유롭게 제어할 수 있다. 즉, 본 발명의 실시에 의해, LPC 부호 탐색에 소요되는 연산량의 증가분을 배려하면서 벡터 양자화기의 성능 향상을 도모하는 것이 가능해진다.
또한, 본 실시예에서는 1단째 VQ 예비 선택부(307)가 남기는 코드 벡터의 후보 수 N1이 미리 정해져 있는 경우(N1은 실험을 통해서 또는 경험적으로 8, 16, 32, 64라고 한 값으로 결정할 수 있는 경우가 많음)에 대하여 설명하고 있지만, 예컨대, 가중치 부여 유클리드 거리에 임계값을 설정해 두고, 설정한 임계값보다 가중치 부여 유클리드 거리가 작은 후보를 예비 선택 후의 후보로서 남기는 등, 다른 예비 선택 방법을 이용하는 것도 가능하며, 그 경우에도 마찬가지의 효과·작용을 얻는 것이 가능하다.
또한, 본 실시예에서는 1단째 VQ 예비 선택부(307)가 상기 수학식 2의 가중치 부여 유클리드 거리를 척도로 하여 코드 벡터의 예비 선택을 하는 경우에 대하여 설명하고 있지만, 예컨대, 상기 문헌 4 내의 수학식 8이나 수학식 10 등, 상기 수학식 2와는 수식적으로 다른 가중치 부여 유클리드 거리를 이용하는 경우에 대해서도 본 발명은 실시 가능하며, 그 경우에도 본 실시예와 마찬가지의 효과·작용을 얻을 수 있다.
또, 가중치 부여 유클리드 거리의 "가중치"에 대해서도, 지금까지 여러 산출 방법이 제안(예컨대, 문헌 5에 기재된 LSF 파라미터의 인접하는 요소 사이의 거리에 따라 가중치 부여를 하는 방법이나, 문헌 6에 기재된 양자화 타겟의 파워 스펙트럼에 따라 가중치 부여를 하는 방법 등)되어 있지만, 본 발명은 "가중치"의 산출 방법의 여하에 관계없이 적용 가능하고, 그 경우에도 마찬가지의 효과·작용을 얻을 수 있다.
또한, 본 실시예에서는 입력 벡터가 LSF 파라미터인 경우에 대하여 설명하고 있지만, LSP 파라미터, PARCOR 계수, LPC 계수 등, 음성 신호의 단시간적인 스펙트럼 포락 정보를 표현하는 다른 파라미터를 벡터 양자화하는 경우에도, 본 실시예는 적용 가능하고, 그 경우에도 마찬가지의 효과·작용을 얻을 수 있다.
또한, 본 실시예에서는 LPC 부호 최종 선택부(321)가 CD(Cepstrum Distortion)를 척도로 하여 최종적인 LPC 부호를 특정하는 경우에 대하여 설명하고 있지만, LPC 계수·LPC 켑스트럼 변환부(318, 320)를 LPC 계수로부터 FFT 파워 스펙트럼을 계산하는 기능을 갖는 LPC 계수·FFT 파워 스펙트럼 산출부로 치환하고, 또 LPC 부호 최종 선택부(321)가 실행하는 계산식을 상기 수학식 11로부터 상기 수학식 4의 평방근 내부의 계산식으로 치환함으로써 SD(Spectra1 Distortion)를 LPC 부호 선택부의 최종 척도로서 이용하는 것도 가능하며, 이 경우에도 마찬가지의 효과·작용을 얻을 수 있다.
또한, 본 실시예에서는, 설명을 간단히 하기 위해서, "3차 MA 예측을 이용한 2단 스플리트 구조"라는 특정한 구조의 벡터 양자화기를 예로 들어 설명하고 있지만, 본 실시예는 금회의 예 이외의 구조를 갖는 LPC 파라미터의 벡터 양자화 장치에 대해서도 적용 가능하며, 그 경우에도 마찬가지의 작용·효과를 얻을 수 있다.
이상 설명한 본 실시예에 따른 발명은, CELP 방식이나 Vocoder 방식 등의 음성 부호화·복호화 장치에서의 음성 신호의 단시간적인 스펙트럼 포락 정보를 부호화·복호화하는 개소에 적용하는 것이 바람직하다.
(실시예 3)
도 6은 실시예 3에 따른 벡터 양자화 장치의 구성을 나타내는 블럭도이다. 또, 도 6에 나타내는 벡터 양자화 장치에 있어서, 실시예 2에서 설명한 도 5와 공 통되는 부분에는 도 5와 동일한 부호를 부여하고 상세한 설명을 생략한다.
도 6에 나타내는 벡터 양자화 장치는 도 5의 벡터 양자화 장치에 저차 스케일링 계수 코드북(350) 및 고차 스케일링 계수 코드북(360)을 추가한 구성을 취한다. 또, 도 6에서는 도면을 보기 쉽게 하기 위해서, (301∼306) 및 (316∼323)의 각 구성 부분을 생략한다.
또, 실시예 2에서의 설명과 마찬가지로, 벡터 양자화 장치의 구성은 음성 부호화·복호화 장치 전체의 비트 레이트나, 그 중에서 LPC 파라미터의 벡터 양자화 장치에 배분되는 비트 수에 크게 의존한다. 여기서는, 설명을 간단화하기 위해서, 20㎳ 간격의 처리 프레임당 21 비트의 비트 정보가 할당된 것으로 한다.
또한, 본 실시예에서 설명하는 벡터 양자화 장치에 있어서도, 3차의 MA(Moving Average) 예측 기술을 이용하여, 처리 프레임당 4 세트(전환 정보로서 2 비트 필요)의 MA 예측 계수가 사용되는 것으로 한다. 또, 본 실시예에서 설명하는 벡터 양자화 장치는 2단 벡터 양자화 기술을 이용하는 것으로 한다. 또, 본 실시예에서 설명하는 벡터 양자화 장치에서는 2단 벡터 양자화 장치의 제 2 단째에 스플릿트 벡터 양자화 기술이 사용되고 있는 것으로 한다. 또, 1단째 벡터 양자화기, 2단째 저차 성분의 벡터 양자화기 및 2단째 고차 성분의 벡터 양자화기 각각에는 7 비트, 6 비트 및 6 비트가 각각 할당되어 있는 것으로 한다.
도 6의 벡터 양자화 장치에서는, 먼저 처음에 LSF 파라미터가 입력되고 나서 1단째 벡터 양자화기의 타겟 벡터가 얻어질 때까지의 처리(가중치 산출부(301), 예측 계수 코드북(302), MA 예측기(303), 예측 잔차 산출부(304)에 관한 처리)가 행 하여진다. 또, 당해 처리의 상세는 실시예 2에서의 해당 개소의 처리와 동일한 것으로 하고, 본 실시예에서는 설명을 생략한다.
도 6의 벡터 양자화 장치에서는, 다음에 2단 벡터 양자화기에서의 1단째 벡터 양자화기의 처리(1단째 코드북(305), 1단째 거리 계산부(306), 1단째 VQ 예비 선택부(307), 1단째 VQ 잔차 계산부(308)에 관한 처리)가 행하여진다.
이하, 본 실시예의 벡터 양자화 장치의 2단 벡터 양자화기에서의 상기한 1단째 벡터 양자화기의 처리를 상세히 설명한다.
1단째 코드북(305)은 128 종류의 예측 잔차 코드 벡터를 저장하고 있다. 또, 128 종류의 예측 잔차 코드 벡터는 양자화 타겟을 산출할 때까지의 상기 일련의 처리를 많은 처리 프레임 내의 음성 신호에 대하여 실행하여 많은 예측 잔차 벡터를 얻고, 얻어진 많은 예측 잔차 벡터에 대해 LBG 알고리즘을 적용하여 예측 잔차 벡터의 대표적인 샘플을 128 종류 추출하고, 추출된 128 종류의 대표적인 벡터에 대해 상기 문헌 8 등에 개시되어 있는 일반화 Lloyd 알고리즘을 또 적용하여 미리 획득된 것이다.
1단째 거리 계산부(306)는 예측 잔차 산출부(304)로부터 공급된 1단째 벡터 양자화기의 타겟 벡터(Xk[i], i=1, …, N)와, 1단째 코드북(305)으로부터 판독한 인덱스 m의 예측 잔차 코드 벡터(Cm[i], i=1, …, N)에 MA 예측 계수의 현 처리 프레임 성분(MAk[0][i], i=1, …, N)을 곱한 벡터(MAk[0][i]*Cm[i], i=1, …, N)와의 사이의 가중치 부여 유클리드 거리를 수학식 6에 의해 산출하고, 산출된 거리의 값을 1단째 VQ 예비 선택부(307)에 출력한다. 또, 1단째 거리 계산부(306)에서의 가중치 부여 유클리드 거리의 계산은 1단째 코드북(305)이 저장하고 있는 128 종류(m=1, …, 128)의 예측 잔차 코드 벡터(Cm[i], i=1, …, N)와, 예측 잔차 산출부(304)로부터 공급되는 타겟 벡터(Xk[i], i=1, …, N)를 생성할 때에 이용한 4 세트(k=1, …, 4)의 MA 예측 계수의 전체 조합(512 = 128 ×4)에 대하여 행하여지는 점도 실시예 2와 마찬가지이다. 따라서, 본 실시예에서도, 1단째 거리 계산부(306)로부터는 1단째 VQ 예비 선택부(307)로는 전부 512개의 거리 dk,m(k=1, …, 4, m=1, …, 128)이 출력되게 된다.
1단째 VQ 예비 선택부(307)는 1단째 거리 계산부(306)로부터 공급되는 상기 512개의 거리 dk,m(k=1, …, 4, m=1, …, 128)을 작은 순서대로 분류하여, 거리를 작게 하는 k(4 세트 있는 3차 MA 예측 계수 중 어떤 3차 예측 계수 세트를 사용했는지)와 m(128 종류 있는 1단째 코드북(305) 내의 코드 벡터 중 어떤 코드 벡터를 사용했는지)의 조합 정보를, 미리 설정된 N1번째까지 N1cand_k[j]와 N1cand_m[j](j=1, …, N1)에 각각 기록한다. 그리고, 1단째 VQ 예비 선택부(307)는 기록한 N1cand_k[j]와 N1cand_m[j](j=1, …, N1)를 1단째 VQ 잔차 계산부(308), 예측 잔차 복호화부(315) 및 복호화 LSF 생성부(316)로 출력한다. 또, 본 실시예에서는, 1단째 VQ 예비 선택부(307)는 N1cand_m[j](j=1, …, N1)을 저차 스케일링 계수 코드북(350)과 고차 스케일링 계수 코드북(360)으로도 출력한다.
1단째 VQ 잔차 산출부(308)는 1단째 VQ 예비 선택부(307)로부터 공급되는 N1 가지의 N1cand_k[j]와 N1cand_m[j](j=1, …, N1)의 조합 정보에 대응하는 3차 예측 계수 세트(예측 계수 코드북(302)으로부터 판독함)와 1단째 코드북 내의 코드 벡터(1단째 코드북(305)으로부터 판독함)를 사용하여 예비 선택 선택 처리를 한 후에 잔존하는 1단째 VQ 잔차 벡터 Xj (2)[i](i=1, …, N, j=1, …, N1)를 수학식 7에 의해 N1가지 산출하고, 산출한 N1가지의 벡터를 2단째 저차 거리 계산부(310) 및 2단째 고차 거리 계산부(311)로 출력한다.
또, 본 실시예에서도 실시예 2와 마찬가지로, 2단째 벡터 양자화기는 1단째 VQ 잔차 벡터를 저차 성분(i=1, …, NL)과 고차 성분(i=NL+1, …, N)으로 분해(스플릿트)하고, 분해에 의해서 얻어진 각각의 벡터를 개별적으로 벡터 양자화하는 분할 구성으로 되어 있는 것으로 한다.
따라서, 1단째 VQ 잔차 벡터 산출부(308)에 의해 산출된 Xj (2)[i](i=1, …, N, j=1, …, N1)는 2단째 벡터 양자화기의 구성에 맞춘 형태로 2단째 저차 거리 계산부(310) 및 2단째 고차 거리 계산부(311)에 출력되게 된다. 구체적으로는, Xj (2)[i](i=1, …, NL, j=1, …N1)가 2단째 저차 거리 계산부(310)에 출력되고, Xj (2)[i](i=NL+1, …, N, j=1, …, N1)가 2단째 고차 거리 계산부(311)에 출력된다.
이상이 2단 벡터 양자화기에서의 1단째 벡터 양자화기의 처리의 설명이다.
도 6의 벡터 양자화 장치에서는, 다음에 2단째 벡터 양자화기에서의 2단째 벡터 양자화기의 처리(2단째 저차 코드북(309), 저차 스케일링 계수 코드북(350), 2단째 저차 거리 계산부(310), 2단째 고차 거리 계산부(311), 고차 스케일링 계수 코드북(360), 2단째 고차 코드북(312), 2단째 저차 부호 탐색부(313), 2단째 고차 부호 탐색부(314)에 관한 처리)가 행하여진다. 따라서, 본 실시예에서도, 다음에 2단 벡터 양자화기에서의 상기한 2단째 벡터 양자화기의 처리를 상세히 설명한다.
또, 2단째 저차 코드북(309)은 64 종류의 2단째 저차 코드 벡터(C2Lm2L[i], i=1, …, NL, m2L=1, …, 64)를 저장하고, 2단째 고차 코드북(312)은 64 종류의 2단째 고차 코드 벡터(C2Hm2H[i], i=NL+1, …, N, m2H=1, …, 64)를 저장하고 있는 것으로 한다.
또한, 저차 스케일링 계수 코드북(350)은 1단째 코드북(305)이 저장하고 있는 예측 잔차 코드 벡터 수와 동수(同數)(본 실시예에서는 128 종류)의 저차 스케일링 계수(SF_low[j], j=1, 2, …, N1)를 저장하는 기능과, 1단째 VQ 예비 선택부(307)로부터 공급되는 N1cand_m[j]에 대응하는 저차 스케일링 계수(SF_low[N1cand_m[j]])를 2단째 저차 거리 계산부(310) 및 예측 잔차 복호화부(315)로 출력하는 기능을 구비하고 있다. 또한, 고차 스케일링 계수 코드북(360)은 1단째 코드북(305)이 저장하고 있는 예측 잔차 코드 벡터 수와 동수(본 실시예에서는 128 종류)의 저차 스케일링 계수(SF_high[j], j=1, 2, …, N1)를 저장하는 기능과, 1단째 VQ 예비 선택부(307)로부터 공급되는 N1cand_m[j]에 대응하는 저차 스케일링 계수(SF_high[N1cand_m[j]])를 2단째 고차 거리 계산부(311) 및 예측 잔차 복호화부(315)로 출력하는 기능을 구비하고 있다. 또, 저차 스케일링 계수(SF_low[j], j=l, 2, …, N1)와, 고차 스케일링 계수(SF_high[j], j=1, 2, …, N1)에는 LBG 알고리즘 및 일반화 Uoyd 알고리즘으로 이루어지는 학습 공정에 의해서 미리 획득된 0.5∼2.0의 범위 내의 값이 각각 저장되어 있는 것으로 한다.
2단째 저차 거리 계산부(310)는 1단째 VQ 잔차 계산부(308)로부터 공급된 1단째 VQ 잔차분 벡터의 저차 성분 Xj (2)[i](i=1, …, NL, j=1, …, N1)와, 2단째 저차 코드북(309)으로부터 판독한 인덱스 m2L의 2단째 저차 코드 벡터(C2Lm2L[i], i=1, …, NL)에 저차 스케일링 계수 코드북(350)으로부터 공급되는 SF_low[N1cand_m[j]]와 MA 예측 계수의 현 처리 프레임 성분(MAN1cand_k[j][0][i], i=1, …, NL)을 곱한 벡터(MAN1cand_k[j][0][i]*SF_low[N1cand_m[j]]*C2Lm2L[i], i=1, …, NL)과의 사이의 가중치 부여 유클리드 거리를 하기 수학식 12에 의해 산출하고, 산출된 거리의 값 d2Lj,m2L을 2단째 저차 부호 탐색부(313)에 출력한다.
Figure 112003019175763-pct00012
단, 수학식 12에서의 w[i]는 수학식 6과 동일한 "가중치"이다.
또, 2단째 저차 거리 계산부(310)에서는 1단째 VQ 예비 선택부(307)에 의해 특정된 N1개의 j 각각에 대해, 2단째 저차 코드북(309)이 저장하는 64 종류의 코드 벡터에 대하여 상기 수학식 12의 거리 계산이 행하여지고, 구해진 가중치 부여 유클리드 거리 d2Lj,m2L(j=1, …, N1, m2L=1, …, 64)은 모두 2단째 저차 부호 탐색부(313)에 출력되는 것으로 한다(전부 N1*64개의 d2Lj,m2L이 출력됨).
2단째 고차 거리 계산부(311)는 1단째 VQ 잔차 계산부(308)로부터 공급된 1단째 VQ 잔차분 벡터의 고차 성분 Xj (2)[i](i=NL+1, …, N, j=1, …, N1)와, 2단째 고차 코드북(312)으로부터 판독한 인덱스 m2H의 2단째 고차 코드 벡터(C2Hm2H[i], i=NL+1, …, N)에 고차 스케일링 계수 코드북(360)으로부터 공급되는 SF_high[N1cand_m[j]]와 MA 예측 계수의 현 처리 프레임 성분(MAN1cand_k[j][0][i], i=NL+1, …, N)을 곱한 벡터(MAN1cand_k[j][0][i]*SF_high[N1cand_m[j]]*C2Hm2H[i], i=NL+1, …, N)와의 사이의 가중치 부여 유클리드 거리를 하기 수학식 13에 의해 산출하고, 산출된 거리의 값 d2Hj,m2H를 2단째 고차 부호 탐색부(314)에 출력한다.
Figure 112003019175763-pct00013
단, 수학식 13에서의 w[i]는 수학식 6과 동일한 "가중치"이다.
또, 2단째 고차 거리 계산부(311)에서는, 1단째 VQ 예비 선택부(307)에 의해 특정된 N1개의 j 각각에 대하여, 2단째 고차 코드북(309)이 저장하는 64 종류의 코 드 벡터에 대해 상기 수학식 13의 거리 계산이 행하여져, 구해진 가중치 부여 유클리드 거리 d2Hj,m2H(j=1, …, N1, m2=1, …, 64)는 모두 2단째 고차 부호 탐색부(313)에 출력되는 것으로 한다(전부 N1*64개의 d2Hj,m2H가 출력됨).
2단째 저차 부호 탐색부(313)는 2단째 저차 거리 계산부(310)로부터 공급되는 가중치 부여 유클리드 거리 d2Lj,m2L(j=1, …, N1, m2L=1, …, 64)에 대하여, 거리를 최소화하는 인덱스 m2L을 각 j마다 하나 특정하고, 특정한 N1개(j=1, …, N1)의 인덱스를 각각 N2Lcand[j](j=1, …, N1)에 기록하며, 기록한 N1개의 N2Lcand[j](j=1, …, N1)를 예측 잔차 복호화부(315)로 출력한다.
2단째 고차 부호 탐색부(314)는 2단째 저차 거리 계산부(310)로부터 공급되는 가중치 부여 유클리드 거리 d2Hj,m2H(j=1, …, N1, m2H=1, …, 64)에 대하여, 거리를 최소화하는 인덱스 m2H를 각 j마다 하나 특정하고, 특정한 N1개(j=1, …, N1)의 인덱스를 N2Hcand[j](j=1, …, N1)에 기록하며, 기록한 N1개의 N2Hcand[j](j=1, …, N1)을 예측 잔차 복호화부(315)로 출력한다.
이상이, 2단째 벡터 양자화기에서의 2단째 벡터 양자화기의 처리의 설명이다. 또, 상기의 2단째 벡터 양자화기의 처리를 종료한 시점에서, 예측 잔차 복호화부(315)에는 이하의 4 정보의 조합 정보가 N1가지(j=1, …, N1) 공급되어 있는 것으로 된다.
(1) N1cand_k[j] : 4세트 있는 MA 예측 계수 중 어느 것이 예비 선택되었는지
(2) N1cand_m[j] : 128 종류의 1단째 코드 벡터 중 어느 것이 예비 선택되었는지
(3) N2Lcand[j] : 64 종류의 2단째 저차 코드 벡터 중 어느 것이 예비 선택되었는지
(4) N2Hcand[j] : 64 종류의 2단째 고차 코드 벡터 중 어느 것이 예비 선택되었는지
본 실시예에서의 이후의 설명에서는, 지금까지의 처리에 의해 예측 잔차 복호화부(315)에 공급되어 있는 N1가지의 조합 정보 중에서 CD를 최소화하는 조합 정보의 조합 번호를 특정하는 처리(예측 잔차 복호화부(315), 복호화 LSF 생성부(316), LSF·LPC 계수 변환부(317, 319), LPC 계수·LPC 켑스트럼 변환부(318, 320), LPC 부호 최종 선택부(321)에 관한 처리)에 대하여 상세히 설명한다.
예측 잔차 복호화부(315)는 공급된 인덱스 정보 N1cand_m[j]에 근거하여, 1단째 코드 벡터 CN1cand_m[j]와, 저차 스케일링 계수 SF_low[N1cand_m[j]]와, 고차 스케일링 계수 SF_high[N1cand_m[j]]를 각각 1단째 코드북(305), 저차 스케일링 계수 코드북(350), 고차 스케일링 계수 코드북(360)으로부터 판독하고, 또, 공급되는 인덱스 정보 N2Lcand[j]에 근거하여 2단째 저차 코드 벡터 C2LN2Lcand[j]를 2단째 저차 코드북(309)으로부터 판독하고, 또, 공급되는 인덱스 정보 N2Hcand[j]에 근거하여, 2단째 고차 코드 벡터 C2HN2Hcand[j]을 2단째 고차 코드북(312)으로부터 판독하여, 그 들을 이용한 및 하기 수학식 14에 의해 N1개(J=1, …, N1)의 복호화 예측 잔차 벡터 Cqj[i](i=1, …, N)를 산출하고, 산출한 복호화 예측 잔차 벡터를 기록 유지하고 또한 복호화 LSF 생성부(316)에 출력한다.
Figure 112003019175763-pct00014
단, 수학식 14에서, C2LN2Lcand[j][i]=0.0(i=NL+1, …, N), C2HN2Hcand[j][i]=0.0(i=1, …, N)이다.
또한, 예측 잔차 복호화부(315)는 N1cand_k[j](j=1=1, …, N1)를 복호화 LSF 생성부(316)에 출력한다.
복호화 LSF 생성부(316)는 예측 잔차 복호화부(315)로부터 공급된 N1cand_k[j](j=1, …, N1)에 대응하는 MAN1cand_k[j][0][i]를 예측 계수 코드북(302)으로부터 판독하고, 상기 판독한 MAN1cand_k[j][0][i]와, 평균 LSF 저장부(323)로부터 판독한 평균 LSF 파라미터 AV[i](i=1, …, N)와, 예측 잔차 산출부(304)로부터 공급된 양자화 타겟 벡터의 N1cand_k[j]에 관한 XN1cand_k[j][i]와, 예측 잔차 복호화부(315)로부터 공급된 Cqj[i](i=1, …, N)를 이용한 수학식 10에 의해 N1개(j=1, …, N1)의 복호화 LSF 파라미터(이하, LSFqj[i], j=1, …, N1, i=1, …, N으로 함)를 산출하고, 산출한 복호화 LSF 파라미터를 LSF·LPC 계수 변환부(317) 에 출력한다.
LSF·LPC 계수 변환부(317)는 복호화 LSF 생성부(316)로부터 공급된 N1개(j=1, …, N1)의 복호화 LSF 파라미터(LSFqj[i], j=1, …, N1, i=1, …, N)를 각각 복호화 LPC 계수(이하, LPCqj[i], j=1, …, N1, i=1, …, N으로 함)로 변환하여 LPC 계수·LPC 켑스트럼 변환부(318)에 출력한다.
LPC 계수·LPC 켑스트럼 변환부(318)는, 실시예 2와 마찬가지로, LSF·LPC 계수 변환부(317)로부터 공급된 N1개(j=1, …, N1)의 복호화 LPC 계수(LPCqj[i], i=1, …, N)를 각각 복호화 LPC 켑스트럼(이하, QCEPj[i], i=1, …, Nc, j=1, …, N1로 함)으로 변환하여 LPC 부호 최종 선택부(321)에 출력한다.
LSF·LPC 계수 변환부(319)는 LSF 파라미터를 LPC 계수로 변환하여 LPC 계수·LPC 켑스트럼 변환부(320)에 출력한다. LPC 계수·LPC 켑스트럼 변환부(320)는 LSF·LPC 계수 변환부(319)로부터 공급된 LPC 계수를 LPC 켑스트럼(이하, CEPt[i], i=1, …, Nc로 함)으로 변환하여 LPC 부호 최종 선택부(321)에 출력한다.
LPC 부호 최종 선택부(321)는, 먼저 LPC 계수·LPC 켑스트럼 변환부(320)로부터 공급되는 LPC 켑스트럼 계수(CEPt[i], i=1, …, Nc)와, LPC 계수·LPC 켑스트럼 변환부(318)로부터 공급되는 N1개(j=1, …, N1)의 복호화 LPC 켑스트럼(QCEPj[i], i=1, …, Nc, j=1, …, N1)과의 거리 DISj(j=1, …, N1)을 수학식 11에 의해 산출하고, 산출한 N1개의 DISj를 대소 비교하여, 그것을 최소화하는 번호 「J」를 하나 특정하고, 특정한 번호 「J」에 관한 이하의 4개의 정보, 즉
(1) N1cand_k[J] : 4세트 있는 MA 예측 계수 중 어느 것이 최적인지(2 비트 사용)
(2) N1cand_m[J] : 128 종류의 1단째 코드 벡터 중에서 어느 것이 최적인지(7 비트 사용)
(3) N2Lcand[J] : 64 종류의 2단째 저차 코드 벡터 중에서 어느 것이 최적인지(6 비트 사용)
(4) N2Hcand[J] : 64 종류의 2단째 고차 코드 벡터 중에서 어느 것이 최적인지(6 비트 사용)
을 통합한 21 비트의 정보를 당해 처리 프레임의 LPC 부호(처리 프레임 구간의 스펙트럼 포락 정보를 표현하기 위한 부호)로서 출력한다.
또한, LPC 부호 최종 선택부(321)는, 실시예 2와 마찬가지로, DISj를 최소화하는 번호 J를 예측 잔차 복호화부(315)로 공급한다.
그리고, 예측 잔차 복호화부(315)는 유지 저장하고 있는 N1개(j=1, …, N1)의 복호화 예측 잔차분 벡터 Cqj[i](i=1, …, N) 중에서 번호 J에 관한 벡터 CqJ[i](i=1, …, N)를 선택하여 복호화 예측 잔차 저장부(322)에 출력한다.
복호화 예측 잔차 저장부(322)는, 저장하고 있는 과거 복수 프레임 만큼의 복호화 예측 잔차 벡터 중(본 실시예에서는, 3차의 MA 예측을 하고 있기 때문에, 과거 3 프레임 만큼의 복호화 예측 잔차 벡터가 저장되어 있음) 가장 오래된 복호화 예측 잔차 벡터를 파기하고, 예측 잔차 복호화부(315)로부터 새롭게 공급되는 CqJ[i](i=1, …, N)를 다음 처리 프레임에서의 MA 예측용으로 새롭게 유지한다.
이상까지의 설명이, LSF 파라미터가 벡터 양자화 장치에 입력되고 나서 LPC 부호가 출력될 때까지의 일련의 처리 내용이다.
한편, 상기한 벡터 양자화 장치로부터 출력되는 LSF 파라미터의 복호화 장치(또 그것을 변환하여 얻어지는 LPC 계수의 복호화 장치)는, LPC 부호를 분해하여 얻어지는 4개의 인덱스 정보(N1cand_k[J], N1cand_m[J], N2Lcand[J], N2Hcand[J])로 분해하는 공정과, LPC 부호를 분해하는 공정에 의해서 얻어지는 각 인덱스 정보를 기초로 복호화 예측 잔차 벡터를 산출하는 공정과, 상기한 복호화 예측 잔차 벡터를 산출하는 공정에 의해서 얻어지는 복호화 예측 잔차 벡터를 기초로 복호화 LSF 벡터를 생성하는 공정에 의해서 구성하는 것이 가능하다. 구체적으로는, 먼저 LPC 부호를 분해하는 공정에 의해서, LPC 부호가 4개의 인덱스 정보(N1cand_k[J], N1cand_m[J], N2Lcand[J], N2Hcand[J])로 분해된다. 다음에, 복호화 예측 잔차 벡터를 산출하는 공정에서, 인덱스 정보 N1cand_m[J]에 근거하여, 1단째 코드 벡터 CN1cand_m[J]와, 저차 스케일링 계수 SF_low[N1cand_m[J]]와, 고차 스케일링 계수 SF_high[N1cand_m[J]]를 각각 1단째 코드북(305), 저차 스케일링 계수 코드북(350), 고차 스케일링 계수 코드북(360)으로부터 판독하고, 다음에, 인덱스 정보 N2Lcand[J]에 근거하여, 2단째 저차 코드 벡터 C2LN2Lcand[J]를 2단째 저차 코드북(309)으로부터 판독하고, 또한, 인덱스 정보 N2Hcand[J]에 근거하여, 2단째 고 차 코드 벡터 C2HN2Hcand[J]를 2단째 고차 코드북(312)으로부터 판독하여, 그들 판독한 3 종류의 벡터와 2 종류의 스케일링 계수를 이용하여 수학식 14에 기재된 곱/합 처리를 하면, LPC 부호에 대응하는 복호화 예측 잔차 벡터 CqJ[i](i=1,…, N)를 얻을 수 있다. 그리고, 복호화 LSF 벡터를 생성하는 공정에서, 인덱스 정보 N1cand_k[J]에 대응하는 MAN1cand_k[J][0][i]를 예측 계수 코드북(302)으로부터 판독하고, 상기 판독한 MAN1cand_k[J][0][i]와, 평균 LSF 저장부(323)로부터 판독한 평균 LSF 파라미터 AV[i](i=1, …, N)와, 예측 잔차 산출부(304)로부터 공급된 양자화 타겟 벡터의 N1cand_k[J]에 관한 XN1cand_k[J]와, 예측 잔차 복호화부(315)로부터 공급된 CqJ[i](i=1, …, N)를 이용한 수학식 10에 의해 최종적인 복호화 LSF 파라미터(이하, LSFqJ[i], i=1, …, N으로 함)를 얻을 수 있다. 또, 복호화한 LSF 파라미터를 또 복호화 LPC 계수로 변환하는 경우에는, 상기한 복호화 LSF 벡터를 생성하는 공정 후에, LSF·LPC 계수 변환부(317)와 동일한 기능을 갖는 공정을 더 구비하면 된다.
이상 상세히 설명한 저차 스케일링 계수 코드북(350)과, 고차 스케일링 계수 코드북(360)을 더 구비하는 3차 MA 예측을 이용한 2단 스플릿트 구조의 벡터 양자화 장치에 따르면, 2단째 코드 벡터의 복호 벡터 전체에 차지하는 기여분을 1단째의 벡터 양자화 처리에서 (예비) 선택된 코드 벡터 CN1cand_m[j](실제로는 코드 벡터 CN1cand_m[j]에 관한 인덱스 N1cand_m[j])에 적응시켜 제어하는 것이 가능하게 되어, 그것에 의해서 양자화 왜곡을 저감화할 수 있도록 되는 것이 가능하게 되고, 또한 가중치 부여 유클리드 거리를 척도로 하여 부호의 예비 선택을 하고, 예비 선택에 의해서 남은 후보에 대해서는 CD(Cepstrum Distortion)를 기준 척도로 하여 최적의 부호를 선택할 수 있게 되기 때문에, 종래의 벡터 양자화 장치에 비하여, 높은 정밀도로 LSF 파라미터를 벡터 양자화할 수 있다.
또, 본 실시예에 따른 벡터 양자화 장치에 의하면, 1단째 VQ 예비 선택부(307)에 의해 예비 선택하는 코드 벡터의 수를 제어함으로써, 실시예 2와 마찬가지로, LPC 부호 탐색에 소요되는 연산량의 증가분을 자유롭게 제어할 수 있다. 즉, 본 실시예에 의해, LPC 부호 탐색에 소요되는 연산량의 증가분을 배려하면서 벡터 양자화기의 성능 향상을 도모하는 것이 가능해진다.
또, 본 실시예에서는, 1단째 VQ 예비 선택부(307)가 남기는 코드 벡터의 후보 수 N1이 미리 정해져 있는 경우(N1은 실험을 통해서 또는 경험적으로 8, 16, 32, 64라고 한 값으로 결정할 수 있는 경우가 많음)에 대하여 설명하고 있지만, 예컨대, 가중치 부여 유클리드 거리에 임계값을 설정해 두고, 설정한 임계값보다 가중치 부여 유클리드 거리가 작은 후보를 예비 선택 후의 후보로서 남기는 등, 다른 예비 선택 방법을 이용하는 것도 가능하며, 그 경우에도 마찬가지의 효과·작용을 얻는 것이 가능하다.
또한, 본 실시예에서는 1단째 VQ 예비 선택부(307)가 상기 수학식 2의 가중치 부여 유클리드 거리를 척도로 하여 코드 벡터를 예비 선택하는 경우에 대하여 설명하고 있지만, 예컨대, 상기 문헌 4 내의 수학식 8이나 수학식 10 등, 상기 수학식 2와는 수식적으로 다른 가중치 부여 유클리드 거리를 이용하는 경우에 대해서도 본 발명은 실시 가능하며, 그 경우에도 본 실시예와 마찬가지의 효과·작용을 얻을 수 있다.
또, 가중치 부여 유클리드 거리의 "가중치"에 대해서도, 지금까지 여러 산출 방법이 제안(예컨대, 문헌 5에 기재된 LSF 파라미터의 인접하는 요소 사이의 거리에 따라 가중치 부여를 하는 방법이나, 문헌 6에 기재된 양자화 타겟의 파워 스펙트럼에 따라 가중치 부여를 하는 방법 등)되어 있지만, 본 발명은 "가중치"의 산출 방법의 여하에 관계없이 적용 가능하고, 그 경우에도 마찬가지의 효과·작용을 얻을 수 있다.
또한, 본 실시예에서는 입력 벡터가 LSF 파라미터인 경우에 대하여 설명하고 있지만, LSP 파라미터, PARCOR 계수, LPC 계수 등, 음성 신호의 단시간적인 스펙트럼 포락 정보를 표현하는 다른 파라미터를 벡터 양자화하는 경우에도 본 실시예는 적용 가능하며, 그 경우에도 마찬가지의 효과·작용을 얻을 수 있다.
또한, 본 실시예에서는 LPC 부호 최종 선택부(321)가 CD(Cepstral Distortion)을 척도로 하여 최종적인 LPC 부호를 특정하는 경우에 대해 설명하고 있지만, LPC 계수·LPC 켑스트럼 변환부(318, 320)를, LPC 계수로부터 FFT 파워 스펙트럼을 계산하는 기능을 갖는 LPC 계수·FFT 파워 스펙트럼 산출부로 치환하고, 또한 LPC 부호 최종 선택부(321)가 실행하는 계산식을 상기 수학식 11로부터 상기 수학식 4의 평방근 내부의 계산식으로 치환해 둠으로써, SD(Spectral Distorhon)을 LPC 부호 선택부의 최종 척도로서 이용하는 것도 가능하며, 이 경우에도 마찬가지의 효과·작용을 얻을 수 있다.
또한, 본 실시예에서는, 설명을 간단히 하기 위해서, "스케일링 계수를 따른 3차 MA 예측을 이용한 2단 스플릿트 구조"라는 특정한 구조의 벡터 양자화기를 예로 들어 설명하고 있지만, 본 실시예는 이번의 예 이외의 구조를 갖는 LPC 파라미터의 벡터 양자화 장치에 대해서도 적용 가능하며, 그 경우에도 마찬가지의 작용·효과를 얻을 수 있다.
이상 설명한 본 실시예에 따른 발명은, CELP 방식이나 Vocoder 방식 등의 음성 부호화·복호화 장치에서의 음성 신호의 단시간적인 스펙트럼 포락 정보를 부호화·복호화하는 개소에 적용하는 것이 바람직하다.
(실시예 4)
도 7은 본 발명의 실시예 4에 따른 음성 신호 송신 장치 및 수신 장치의 구성을 나타내는 블럭도이다. 도 7에 있어서, 음성 신호는 송신 장치의 입력 장치(401)에 의해서 전기적 신호로 변환되어 A/D 변환 장치(402)에 출력된다. A/D 변환 장치(402)는 입력 장치(401)로부터 출력된 (아날로그) 신호를 디지털 신호로 변환하여 음성 부호화 장치(403)에 출력한다.
음성 부호화 장치(403)는 A/D 변환 장치(402)로부터 출력된 디지털 음성 신호를 후술하는 음성 부호화 방법을 이용하여 부호화해서 부호화 정보를 RF 변조 장 치(404)에 출력한다. RF 변조 장치(404)는 음성 부호화 장치(403)로부터 출력된 음성 부호화 정보를 전파 등의 전파 매체에 실어 송출하기 위한 신호로 변환하여 송신 안테나(405)로 출력한다. 송신 안테나(405)는 RF 변조 장치(404)로부터 출력된 출력 신호를 전파(RF 신호)로서 송출한다.
송신 장치로부터 송신된 RF 신호는 수신 장치의 수신 안테나(406)에 의해서 수신되어 RF 복조 장치(407)에 출력된다. RF 복조 장치(407)는 수신 안테나(406)로부터 출력된 RF 신호로부터 음성 부호화 정보를 복조하여 음성 복호화 장치(408)에 출력한다.
음성 복호화 장치(408)는 RF 복조 장치(407)로부터 출력된 음성 부호화 정보를 이용하여, 후술하는 음성 복호화 방법에 의해 음성 신호를 복호해서 D/A 변환 장치(409)에 출력한다. D/A 변환 장치(409)는 음성 복호화 장치(408)로부터 출력된 디지털 음성 신호를 아날로그의 전기적 신호로 변환하여 출력 장치(410)에 출력한다. 출력 장치(410)는 전기적 신호를 공기의 진동으로 변환하여 음파로서 인간의 귀에 청취되도록 출력한다.
상기 구성을 갖는 음성 신호 송신 장치 및 수신 장치 중 적어도 한쪽을 구비하는 것에 의해, 이동 통신 시스템에서의 기지국 장치 및 통신 단말 장치를 구성할 수 있다.
상기 음성 신호 송신 장치는 음성 부호화 장치(403)에 그 특징을 갖는다. 도 8은 음성 부호화 장치(403)의 구성을 나타내는 블럭도이다. 도 8에 있어서, 입력 음성 신호는 도 7에서의 A/D 변환 장치(402)로부터 출력되는 신호이며, 전(前) 처리부(501)에 입력된다. 전 처리부(501)에서는 입력 음성 신호에 대하여 DC(직류) 성분을 제거하는 하이패스 필터 처리나 후속하는 부호화 처리의 성능 개선에 이어지는 파형 정형(整形) 처리나 프리엠파시스(pre-emphasis) 처리를 하고, 처리 후의 신호를 LPC 분석부(502), 가산기(505) 및 파라미터 결정부(513)에 출력한다(Xin).
LPC 분석부(502)는 Xin을 이용하여 선형 예측 분석을 하여, 그 분석 결과(선형 예측 계수)를 LPC 양자화부(503)에 출력한다. LPC 양자화부(503)는 LPC 분석부(502)로부터 출력된 LPC 계수를 LSF 파라미터로 변환하고, 변환에 의해서 얻어진 LSF 파라미터를 본 실시예 1, 2, 3에 나타낸 방법에 의해 벡터 양자화하여, 벡터 양자화에 의해서 얻어진 LPC 부호(L)를 다중화부(514)에 출력한다.
또, LPC 양자화부(503)는 본 실시예 1, 2, 3에 나타낸 LPC 파라미터 복호화 방법에 의해 LSF 영역의 복호화 LPC 파라미터를 얻고, 또한 얻어진 복호화 LPC 파라미터(LSF)를 복호화 LPC 계수로 변환하며, 또한 상기 변환에 의해서 얻어지는 복호화 LPC 계수를 합성 필터(504)에 출력한다.
합성 필터(504)는 상기 복호화 LPC 계수와 가산기(511)로부터 출력되는 구동 음원을 이용하여 필터 합성을 해서 합성 신호를 가산기(505)로 출력한다. 가산기(505)는 상기 Xin과 상기 합성 신호와의 오차 신호를 산출하여 청각 가중치 부여부(512)에 출력한다.
청각 가중치 부여부(512)는 가산기(505)로부터 출력된 오차 신호에 대해 청각적인 가중치 부여를 하여, 청각 가중치 부여 영역에서의 상기 Xin과 상기 합성 신호와의 왜곡을 산출해서 파라미터 결정부(513)에 출력한다. 파라미터 결정부(513)는 청각 가중치 부여부(512)로부터 출력된 상기 부호화 왜곡이 최소로 되도록, 적응 음원 부호 리스트(506)와 고정 음원 부호 리스트(508)와 양자화 이득 생성부(507)로부터 생성되어야 할 신호를 결정한다.
또, 청각 가중치 부여부(512)로부터 출력되는 부호화 왜곡의 최소화뿐만 아니라, 상기 Xin을 이용한 별도의 부호화 왜곡을 병용하여 상기 3개의 수단으로부터 생성되어야 되는 신호를 결정하는 것에 의해 더욱 부호화 성능을 개선할 수도 있다.
적응 음원 부호 리스트(506)는 과거에 가산기(511)에 의해서 출력된 음원 신호를 버퍼링하고 있어, 파라미터 결정부(513)로부터 출력된 신호(A)에 의해서 특정되는 위치로부터 적응 음원 벡터를 잘라내어 승산기(509)에 출력한다. 고정 음원 부호 리스트(508)는 파라미터 결정부(513)로부터 출력된 신호(F)에 의해서 특정되는 형상을 갖는 벡터를 승산기(510)에 출력한다.
양자화 이득 생성부(507)는 파라미터 결정부(513)로부터 출력된 신호(G)에 의해서 특정되는 적응 음원 이득과 고정 음원 이득을 각각 승산기(509, 510)에 출력한다.
승산기(509)는 양자화 이득 생성부(507)로부터 출력된 양자화 적응 음원 이득을 적응 음원 부호 리스트(506)로부터 출력된 적응 음원 벡터에 곱하여 가산기(511)에 출력한다. 승산기(510)는 양자화 이득 생성부(507)로부터 출력된 양자화 고정 음원 이득을 고정 음원 부호 리스트(508)로부터 출력된 고정 음원 벡 터에 곱하여 가산기(511)에 출력한다.
가산기(511)는 이득 승산 후의 적응 음원 벡터와 고정 음원 벡터를 각각 승산기(509, 510)로부터 입력하여, 벡터 가산을 하여 합성 필터(504) 및 적응 음원 부호 리스트(506)에 출력한다.
마지막으로, 다중화부(514)는 LPC 양자화부(503)로부터 양자화 LPC를 나타내는 부호 L을 입력하여, 파라미터 결정부(513)로부터 적응 음원 벡터를 나타내는 부호 A 및 고정 음원 벡터를 나타내는 부호 F 및 양자화 이득을 나타내는 부호 G를 입력하여, 이들 정보를 다중화해서 부호화 정보로서 전송로에 출력한다.
도 9는 도 7 중 음성 복호화 장치(408)의 구성을 나타내는 블럭도이다. 도 9에 있어서, RF 복조부(407)로부터 출력된 부호화 정보는 다중화 분리부(601)에 의해서 다중화되어 있는 부호화 정보를 개개의 부호 정보로 분리된다.
분리된 LPC 부호 L은 LPC 복호화부(602)에 출력되고, 분리된 적응 음원 벡터 부호 A는 적응 음원 부호 리스트(605)에 출력되고, 분리된 음원 이득 부호 G는 양자화 이득 생성부(606)에 출력되며, 분리된 고정 음원 벡터 부호 F는 고정 음원 부호 리스트(607)에 출력된다.
LPC 복호화부(602)는 다중화 분리부(601)로부터 출력된 부호 L(실시예 1, 2, 3에서의 LPC 부호의 것)로부터, 상기 실시예 1, 2, 3에 나타낸 복호화 LPC 파라미터의 생성 방법을 이용하여 복호화 LPC 파라미터를 획득하여, 획득한 복호화 LPC 파라미터를 복호화 LPC 계수로 변환하고, 변환에 의해서 얻어지는 복호화 LPC 계수를 합성 필터(603)에 출력한다.
적응 음원 부호 리스트(605)는 다중화 분리부(601)로부터 출력된 부호 A에서 지정되는 위치로부터 적응 음원 벡터를 출력하여 승산기(608)에 출력한다. 고정 음원 부호 리스트(607)는 다중화 분리부(601)로부터 출력된 부호 F에서 지정되는 고정 음원 벡터를 생성하여 승산기(609)에 출력한다.
양자화 이득 생성부(606)는 다중화 분리부(601)로부터 출력된 음원 이득 부호 G에서 지정되는 적응 음원 벡터 이득과 고정 음원 벡터 이득을 복호하여 승산기(608, 609)에 각각 출력한다. 승산기(608)는 상기 적응 부호 벡터에 상기 적응 부호 벡터 이득을 승산하여 가산기(610)에 출력한다. 승산기(609)는 상기 고정 부호 벡터에 상기 고정 부호 벡터 이득을 승산하여 가산기(610)에 출력한다.
가산기(610)는 승산기(608, 609)로부터 출력된 이득 승산 후의 적응 음원 벡터와 고정 음원 벡터를 가산하여 합성 필터(603)에 출력한다. 합성 필터(603)는 가산기(610)로부터 출력된 음원 벡터를 구동 신호로 하여, LPC 복호화부(602)로부터 공급된 복호화 LPC 계수를 필터 계수에 맞춘 합성 필터를 이용해서 필터 합성을 하고, 합성한 신호를 후(後) 처리부(604)에 출력한다.
후 처리부(604)는 포르만트(formant) 강조나 피치 강조 등과 같은 음성이 주관적인 품질을 개선하는 처리나, 정상 잡음의 주관적 품질을 개선하는 처리 등을 실시한 후에 최종적인 복호 음성 신호로서 출력한다.
이와 같이, 본 발명에 따른 LPC 파라미터의 벡터 양자화 장치를 음성 부호화·복호화 장치에 적응하는 것에 의해, 종래의 벡터 양자화 장치를 이용하고 있었던 음성 부호화·복호화 장치보다도 고품질의 합성 음성을 얻을 수 있게 된다.
또한, 상기 음성 부호화·복호화 장치는 디지털 무선 통신 시스템에서의 기지국 장치나 이동국과 같은 통신 단말 장치에 적용할 수 있다. 이것에 의해, 디지털 무선 통신 시스템에 있어서, 종래의 벡터 양자화 장치를 이용한 경우보다도 고품질의 합성 음성을 얻을 수 있게 된다.
본 발명은 상기 실시예 1∼3에 한정되지 않고, 다양하게 변경하여 실시하는 것이 가능하다. 예컨대, 상기 실시예 1, 2, 3에 따른 LPC 파라미터의 벡터 양자화/복호화는 벡터 양자화 장치나 음성 부호화 장치/음성 복호화 장치로서 설명하고 있지만, 이들 LPC 파라미터의 벡터 양자화/복호화를 소프트웨어로서 구성하더라도 무방하다. 예컨대, 상기 LPC 파라미터의 벡터 양자화/복호화의 프로그램을 ROM에 저장하고, 그 프로그램에 따라서 CPU의 지시에 의해 동작시키도록 구성하더라도 무방하다. 또한, LPC 파라미터의 벡터 양자화/복호화 프로그램을 컴퓨터에 판독 가능한 기억 매체에 저장하고, 이 기억 매체의 LPC 파라미터의 벡터 양자화/복호화 프로그램을 컴퓨터의 RAM에 기록하여, 벡터 양자화 프로그램에 따라서 동작시키도록 하더라도 무방하다. 이러한 경우에 있어서도, 상기 실시예 1, 2, 3과 마찬가지의 작용, 효과를 얻을 수 있다.
이상의 설명으로부터 분명한 바와 같이, 본 발명에 의하면, 음성 신호의 단시간적인 스펙트럼 포락 정보를 나타내는 LPC 파라미터를 벡터 양자화할 때에, (가중치 부여) 유클리드 거리를 척도로 하여 코트 벡터를 소수 개수로 예비 선택하고, 예비 선택에 의해 남겨진 소수개의 코드 벡터 후보에 대해서는 CD(Cepstrum Distortion)나 SD(Spectrum Distortion)라고 한 스펙트럼 공간의 왜곡량을 기준 척 도로 하여 부호 탐색(최종적인 LPC 부호의 특정)을 실행하는 것이 가능해져, 그 결과, (가중치 부여) 유클리드 거리만을 부호 탐색의 기준 척도로 하고 있었던 종래의 벡터 양자화 장치보다, 고성능의 (CD나 SD라고 한 스펙트럼 공간상의 왜곡이 종래보다 작게 됨) 벡터 양자화기를 제공할 수 있다.
또, 본 발명에 따른 LPC 파라미터의 벡터 양자화 장치를 음성 부호화·복호화 장치에 적응하는 것에 의해, 종래의 벡터 양자화 장치를 이용하고 있었던 음성 부호화·복호화 장치보다도 고품질의 합성 음성을 얻을 수 있게 된다.
본 명세서는 2000년 11월 30일 출원된 일본 특허 출원 번호 제 2000-366191 호에 근거한 것이다. 이 내용을 여기에 포함시켜 둔다.
본 발명은 인터넷 통신으로 대표되는 패킷 통신 시스템이나, 이동 통신 시스템 등의 분야에서, 음성 신호의 전송 효율을 높이기 위해서 이용되는 음성 부호화·복호화 장치에 적용하는 것에 바람직하다.

Claims (34)

  1. 삭제
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
  9. 삭제
  10. 삭제
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 다수의 LSF 코드 벡터를 저장한 LSF 코드북으로부터 순차적으로 판독한 코드 벡터와 양자화 타겟 사이의 유클리드 거리를 계산하는 거리 계산 수단과,
    상기 유클리드 거리를 작게 하는 코드 벡터의 인덱스를 예비 선택하고 또한 상기 예비 선택된 인덱스에 각각 대응하는 복호화 LSF 파라미터를 생성하는 LPC 부호 예비 선택 수단과,
    상기 복호화 LSF 파라미터 각각을 복호화 LPC 계수로 변환하는 LSF·LPC 계수 변환 수단과,
    상기 복호화 LPC 계수 각각으로부터 FFT 파워 스펙트럼을 산출하는 제 1 LPC 계수·FFT 파워 스펙트럼 산출 수단과,
    양자화 타겟인 LSF 파라미터를 LPC 계수로 변환하는 LSF·LPC 계수 변환 수단과,
    상기 양자화 타겟을 변환하여 얻어진 LPC 계수로부터 FFT 파워 스펙트럼을 산출하는 제 2 LPC 계수·FFT 파워 스펙트럼 산출 수단과,
    상기 제 1 및 제 2 LPC 계수·FFT 파워 스펙트럼 산출 수단으로부터 공급되는 양자화 타겟을 변환하여 얻어진 FFT 파워 스펙트럼과 복호화 LSF 파라미터를 변환하여 얻어진 FFT 파워 스펙트럼간의 스펙트럼 왜곡(SD)을 각각 계산하여, 상기 스펙트럼 왜곡을 최소화하는 FFT 파워 스펙트럼에 관한 LSF 코드 벡터의 인덱스를 LPC 부호로서 출력하는 LPC 부호 최종 선택 수단
    을 구비하는 LPC 파라미터의 벡터 양자화 장치.
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 입력 LSF 파라미터로부터 미리 저장된 평균 LSF 파라미터를 차분하는 것에 의해 차분 벡터를 산출하고, 상기 차분 벡터에 대한 예측 벡터를 산출하여, 상기 차분 벡터로부터 상기 예측 벡터를 더 차분하는 것에 의해 예측 잔차 벡터를 산출하고, 상기 예측 잔차 벡터를 벡터 양자화해서 LPC 부호를 출력하는 2단 스플릿트 구성의 벡터 양자화 장치로서,
    상기 예측 잔차 벡터를, 1단째 부호 리스트가 저장하고 있는 복수의 예측 잔차 벡터를 이용하여 가중치 부여 유클리드 거리를 왜곡 평가 척도로 하여 벡터 양자화하는 1단째 벡터 양자화 수단과,
    상기 1단째 벡터 양자화 수단에 의해서 발생하는 1단째 VQ 잔차 벡터를, 2단째 저차 코드북이 저장하고 있는 복수의 1단째 VQ 잔차 벡터의 저차 성분과, 2단째 고차 코드북이 저장하고 있는 1단째 VQ 잔차 벡터의 고차 성분을 이용하여, 켑스트럼 왜곡(CD)을 왜곡 평가 척도로 하여 벡터 양자화하는 2단째 벡터 양자화 수단
    을 구비하는 LSF 파라미터의 벡터 양자화 장치.
  23. 입력 LSF 파라미터로부터 미리 저장된 평균 LSF 파라미터를 차분하는 것에 의해 차분 벡터를 산출하고, 상기 차분 벡터에 대한 예측 벡터를 산출하여, 상기 차분 벡터로부터 상기 예측 벡터를 더 차분하는 것에 의해 예측 잔차 벡터를 산출하고, 상기 예측 잔차 벡터를 벡터 양자화하여 LPC 부호를 출력하는 2단 스플릿트 구성의 벡터 양자화 장치로서,
    상기 예측 잔차 벡터를, 1단째 부호 리스트가 저장하고 있는 복수의 예측 잔차 벡터를 이용하여, 가중치 부여 유클리드 거리를 왜곡 평가 척도로 하여 벡터 양자화하는 1단째 벡터 양자화 수단과,
    상기 1단째 벡터 양자화 수단에 의해서 발생하는 1단째 VQ 잔차 벡터를, 저차 스케일링 계수 코드북이 저장하고 있는 1단째 부호 리스트에 저장된 예측 잔차 벡터와 동수(同數) 종류의 저차 스케일링 계수와, 고차 스케일링 계수 코드북이 저장하고 있는 1단째 부호 리스트에 저장된 예측 잔차 벡터와 동수 종류의 고차 스케일링 계수와, 2단째 저차 코드북이 저장하고 있는 복수의 저차 코드 벡터와, 2단째 고차 코드북이 저장하고 있는 고차 코드 벡터를 이용하여, 켑스트럼 왜곡(CD)을 왜곡 평가 척도로 하여 벡터 양자화하는 2단째 벡터 양자화 수단
    을 구비하는 LSF 파라미터의 벡터 양자화 장치.
  24. 삭제
  25. 청구항 22에 기재된 벡터 양자화 장치가 출력한 LPC 부호를 인덱스 정보로 분해하고, 이 인덱스 정보를 기초로 복호화 예측 잔차 벡터를 산출하며, 이 복호화 예측 잔차 벡터를 기초로 복호화 LSF 파라미터를 생성하는 LSF 파라미터 복호화 장치로서,
    상기 인덱스 정보에 대응하는 1단째 코드 벡터와, 2단째 저차 코드 벡터와, 2단째 고차 코드 벡터를 각각의 코드북으로부터 각각 판독하여, 상기 판독한 3개의 코드 벡터를 가산함으로써 복호화 예측 잔차 벡터를 생성하는
    LSF 파라미터 복호화 장치.
  26. 청구항 23에 기재된 벡터 양자화 장치가 출력한 LPC 부호를 인덱스 정보로 분해하고, 이 인덱스 정보를 기초로 복호화 예측 잔차 벡터를 산출하여, 이 복호화 예측 잔차 벡터를 기초로 복호화 LSF 파라미터를 생성하는 LSF 파라미터 복호화 장치로서,
    상기 인덱스 정보와 대응하는 1단째 코드 벡터와, 2단째 저차 코드 벡터와, 2단째 고차 코드 벡터와, 저차 스케일링 계수와, 고차 스케일링 계수를 각각의 코드북으로부터 각각 판독하고, 상기 판독한 3개의 코드 벡터와 2개의 스케일링 계수를 승/가산함으로써 복호화 예측 잔차 벡터를 생성하는
    LSF 파라미터의 복호화 장치.
  27. 청구항 25에 기재된 LSF 파라미터 복호화 장치에 의해 생성된 복호화 LSF 파라미터를 복호화 LPC 계수로 변환하는 기능을 구비하는 LPC 계수의 복호화 장치.
  28. 청구항 26에 기재된 LSF 파라미터 복호화 장치에 의해 생성된 복호화 LSF 파라미터를 복호화 LPC 계수로 변환하는 LPC 계수의 복호화 장치.
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
  33. 삭제
  34. 삭제
KR1020037007206A 2000-11-30 2001-11-29 Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, lpc 계수의 복호화 장치, 기록 매체,음성 부호화 장치, 음성 복호화 장치, 음성 신호 송신장치, 및 음성 신호 수신 장치 KR100872538B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000366191 2000-11-30
JPJP-P-2000-00366191 2000-11-30
PCT/JP2001/010425 WO2002045077A1 (en) 2000-11-30 2001-11-29 Vector quantizing device for lpc parameters

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020087018896A Division KR100910282B1 (ko) 2000-11-30 2001-11-29 Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, 기록 매체, 음성 부호화 장치, 음성 복호화장치, 음성 신호 송신 장치, 및 음성 신호 수신 장치

Publications (2)

Publication Number Publication Date
KR20030062361A KR20030062361A (ko) 2003-07-23
KR100872538B1 true KR100872538B1 (ko) 2008-12-08

Family

ID=18836849

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020087018896A KR100910282B1 (ko) 2000-11-30 2001-11-29 Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, 기록 매체, 음성 부호화 장치, 음성 복호화장치, 음성 신호 송신 장치, 및 음성 신호 수신 장치
KR1020037007206A KR100872538B1 (ko) 2000-11-30 2001-11-29 Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, lpc 계수의 복호화 장치, 기록 매체,음성 부호화 장치, 음성 복호화 장치, 음성 신호 송신장치, 및 음성 신호 수신 장치

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020087018896A KR100910282B1 (ko) 2000-11-30 2001-11-29 Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, 기록 매체, 음성 부호화 장치, 음성 복호화장치, 음성 신호 송신 장치, 및 음성 신호 수신 장치

Country Status (9)

Country Link
US (1) US7392179B2 (ko)
EP (2) EP1339040B1 (ko)
KR (2) KR100910282B1 (ko)
CN (1) CN1200403C (ko)
AU (1) AU2002218501A1 (ko)
CA (2) CA2429832C (ko)
CZ (1) CZ304196B6 (ko)
DE (1) DE60137359D1 (ko)
WO (1) WO2002045077A1 (ko)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7453936B2 (en) * 2001-11-09 2008-11-18 Sony Corporation Transmitting apparatus and method, receiving apparatus and method, program and recording medium, and transmitting/receiving system
JP3887598B2 (ja) * 2002-11-14 2007-02-28 松下電器産業株式会社 確率的符号帳の音源の符号化方法及び復号化方法
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
KR20070009644A (ko) * 2004-04-27 2007-01-18 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 부호화 장치, 스케일러블 복호화 장치 및 그방법
KR100647290B1 (ko) 2004-09-22 2006-11-23 삼성전자주식회사 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법
KR100721537B1 (ko) * 2004-12-08 2007-05-23 한국전자통신연구원 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법
AU2006232364B2 (en) * 2005-04-01 2010-11-25 Qualcomm Incorporated Systems, methods, and apparatus for wideband speech coding
TWI317933B (en) * 2005-04-22 2009-12-01 Qualcomm Inc Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same
US7693921B2 (en) * 2005-08-18 2010-04-06 Texas Instruments Incorporated Reducing computational complexity in determining the distance from each of a set of input points to each of a set of fixed points
KR100735246B1 (ko) * 2005-09-12 2007-07-03 삼성전자주식회사 오디오 신호 전송 장치 및 방법
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
JPWO2008072732A1 (ja) * 2006-12-14 2010-04-02 パナソニック株式会社 音声符号化装置および音声符号化方法
WO2008103087A1 (en) * 2007-02-21 2008-08-28 Telefonaktiebolaget L M Ericsson (Publ) Double talk detector
JP5300733B2 (ja) * 2007-10-12 2013-09-25 パナソニック株式会社 ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
WO2009090876A1 (ja) * 2008-01-16 2009-07-23 Panasonic Corporation ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
CA2729752C (en) * 2008-07-10 2018-06-05 Voiceage Corporation Multi-reference lpc filter quantization and inverse quantization device and method
CN101630510B (zh) * 2008-07-18 2012-03-28 上海摩波彼克半导体有限公司 Amr语音编码中lsp系数量化的快速码本搜索的方法
CN101409075B (zh) * 2008-11-27 2011-05-11 杭州电子科技大学 一种g.729标准中线谱对系数转换及量化的改进方法
RU2519027C2 (ru) * 2009-02-13 2014-06-10 Панасоник Корпорэйшн Устройство векторного квантования, устройство векторного обратного квантования и способы для этого
US9153238B2 (en) 2010-04-08 2015-10-06 Lg Electronics Inc. Method and apparatus for processing an audio signal
US20110313756A1 (en) * 2010-06-21 2011-12-22 Connor Robert A Text sizer (TM)
US9135919B2 (en) 2010-09-17 2015-09-15 Panasonic Intellectual Property Corporation Of America Quantization device and quantization method
KR101747917B1 (ko) 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
EP2831757B1 (en) * 2012-03-29 2019-06-19 Telefonaktiebolaget LM Ericsson (publ) Vector quantizer
JP6096896B2 (ja) * 2012-07-12 2017-03-15 ノキア テクノロジーズ オーユー ベクトル量子化
US9640190B2 (en) * 2012-08-29 2017-05-02 Nippon Telegraph And Telephone Corporation Decoding method, decoding apparatus, program, and recording medium therefor
CA2928882C (en) * 2013-11-13 2018-08-14 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Encoder for encoding an audio signal, audio transmission system and method for determining correction values
EP4095854A1 (en) * 2014-01-15 2022-11-30 Samsung Electronics Co., Ltd. Weight function determination device and method for quantizing linear prediction coding coefficient
TR201900472T4 (tr) * 2014-04-24 2019-02-21 Nippon Telegraph & Telephone Frekans alanı parametre dizisi oluşturma metodu, kodlama metodu, kod çözme metodu, frekans alanı parametre dizisi oluşturma aparatı, kodlama aparatı, kod çözme aparatı, programı ve kayıt ortamı.
ES2840349T3 (es) * 2014-05-01 2021-07-06 Nippon Telegraph & Telephone Descodificación de una señal de sonido
KR102298767B1 (ko) * 2014-11-17 2021-09-06 삼성전자주식회사 음성 인식 시스템, 서버, 디스플레이 장치 및 그 제어 방법
JP6517924B2 (ja) * 2015-04-13 2019-05-22 日本電信電話株式会社 線形予測符号化装置、方法、プログラム及び記録媒体
US10991376B2 (en) * 2016-12-16 2021-04-27 Telefonaktiebolaget Lm Ericsson (Publ) Methods, encoder and decoder for handling line spectral frequency coefficients
CN112669857B (zh) * 2021-03-17 2021-05-18 腾讯科技(深圳)有限公司 一种语音处理的方法、装置及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61252600A (ja) 1985-05-02 1986-11-10 日本電気株式会社 Lsp型パタンマツチングボコ−ダ
JPH0197298A (ja) * 1987-10-07 1989-04-14 Sakata Corp プレス加工用被覆剤組成物
JPH01319799A (ja) * 1988-06-21 1989-12-26 Mitsubishi Electric Corp 最適音源ベクトル探索装置
JPH07191700A (ja) * 1993-12-27 1995-07-28 Nec Corp 音声符号化装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3296363B2 (ja) 1991-04-30 2002-06-24 日本電信電話株式会社 音声の線形予測パラメータ符号化方法
US5495555A (en) 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5734789A (en) 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
US5651026A (en) * 1992-06-01 1997-07-22 Hughes Electronics Robust vector quantization of line spectral frequencies
WO1994023426A1 (en) * 1993-03-26 1994-10-13 Motorola Inc. Vector quantizer method and apparatus
WO1995010760A2 (en) 1993-10-08 1995-04-20 Comsat Corporation Improved low bit rate vocoders and methods of operation therefor
JP3471889B2 (ja) 1994-04-01 2003-12-02 株式会社東芝 音声符号化方法及び装置
JP3224955B2 (ja) * 1994-05-27 2001-11-05 株式会社東芝 ベクトル量子化装置およびベクトル量子化方法
JP3179291B2 (ja) * 1994-08-11 2001-06-25 日本電気株式会社 音声符号化装置
JP3285072B2 (ja) 1994-12-28 2002-05-27 日本電信電話株式会社 重み付きベクトル量子化法
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
JP3238063B2 (ja) 1996-01-31 2001-12-10 株式会社東芝 ベクトル量子化方法および音声符号化方法
EP0788091A3 (en) 1996-01-31 1999-02-24 Kabushiki Kaisha Toshiba Speech encoding and decoding method and apparatus therefor
JPH09234797A (ja) 1996-03-01 1997-09-09 Muto Kasei Kogyosho:Kk 密閉容器の成形方法
JP3707153B2 (ja) 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
JPH1152994A (ja) 1997-08-05 1999-02-26 Kokusai Electric Co Ltd 音声符号化装置
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
AU1445100A (en) * 1998-10-13 2000-05-01 Hadasit Medical Research Services & Development Company Ltd Method and system for determining a vector index to represent a plurality of speech parameters in signal processing for identifying an utterance
DE60030069T2 (de) 1999-11-23 2007-02-22 Texas Instruments Inc., Dallas Verschleierungsverfahren bei Verlust von Sprachrahmen

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61252600A (ja) 1985-05-02 1986-11-10 日本電気株式会社 Lsp型パタンマツチングボコ−ダ
JPH0197298A (ja) * 1987-10-07 1989-04-14 Sakata Corp プレス加工用被覆剤組成物
JPH01319799A (ja) * 1988-06-21 1989-12-26 Mitsubishi Electric Corp 最適音源ベクトル探索装置
JPH07191700A (ja) * 1993-12-27 1995-07-28 Nec Corp 音声符号化装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Discrete-Time Processing of Speech Signals, Macmillan Publishing Co. (1993)

Also Published As

Publication number Publication date
CA2733453C (en) 2014-10-14
WO2002045077A1 (en) 2002-06-06
US20040015346A1 (en) 2004-01-22
EP1339040B1 (en) 2009-01-07
EP1860650A1 (en) 2007-11-28
KR20030062361A (ko) 2003-07-23
CN1488135A (zh) 2004-04-07
CZ20031500A3 (cs) 2003-10-15
CA2733453A1 (en) 2002-06-06
EP1339040A1 (en) 2003-08-27
US7392179B2 (en) 2008-06-24
KR20080074234A (ko) 2008-08-12
CA2429832C (en) 2011-05-17
CA2429832A1 (en) 2002-06-06
DE60137359D1 (de) 2009-02-26
AU2002218501A1 (en) 2002-06-11
CZ304196B6 (cs) 2013-12-27
CN1200403C (zh) 2005-05-04
EP1339040A4 (en) 2005-09-14
KR100910282B1 (ko) 2009-08-03

Similar Documents

Publication Publication Date Title
KR100872538B1 (ko) Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, lpc 계수의 복호화 장치, 기록 매체,음성 부호화 장치, 음성 복호화 장치, 음성 신호 송신장치, 및 음성 신호 수신 장치
JP3707154B2 (ja) 音声符号化方法及び装置
EP0905680B1 (en) Method for quantizing LPC parameters using switched-predictive quantization
EP0504627B1 (en) Speech parameter coding method and apparatus
KR100543982B1 (ko) 벡터양자화방법,음성부호화방법및장치
CA2202825C (en) Speech coder
JPH09127989A (ja) 音声符号化方法及び音声符号化装置
KR101390051B1 (ko) 벡터 양자화 장치, 벡터 역양자화 장치, 및 이러한 방법
US6889185B1 (en) Quantization of linear prediction coefficients using perceptual weighting
EP2398149B1 (en) Vector quantization device, vector inverse-quantization device, and associated methods
JPH08272395A (ja) 音声符号化装置
KR100508618B1 (ko) 피치 주기 탐색 범위 설정 장치, 피치 주기 탐색 장치,적응 음원 벡터의 생성 장치, 음성 부호화 장치, 음성복호화 장치, 음성 신호 송신 장치, 음성 신호 수신 장치,이동국 장치 및 기지국 장치
EP0899720B1 (en) Quantization of linear prediction coefficients
JP3793111B2 (ja) 分割型スケーリング因子を用いたスペクトル包絡パラメータのベクトル量子化器
EP0483882B1 (en) Speech parameter encoding method capable of transmitting a spectrum parameter with a reduced number of bits
EP0755047B1 (en) Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
EP0910064B1 (en) Speech parameter coding apparatus
JP3675054B2 (ja) ベクトル量子化方法、音声符号化方法及び装置、並びに音声復号化方法
JP2808841B2 (ja) 音声符号化方式
JP2002229597A (ja) Lpcパラメータのベクトル量子化装置
JP3230380B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
A107 Divisional application of patent
AMND Amendment
J201 Request for trial against refusal decision
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121121

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20131118

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20141120

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20151118

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee