KR20070009644A - 스케일러블 부호화 장치, 스케일러블 복호화 장치 및 그방법 - Google Patents

스케일러블 부호화 장치, 스케일러블 복호화 장치 및 그방법 Download PDF

Info

Publication number
KR20070009644A
KR20070009644A KR1020067022317A KR20067022317A KR20070009644A KR 20070009644 A KR20070009644 A KR 20070009644A KR 1020067022317 A KR1020067022317 A KR 1020067022317A KR 20067022317 A KR20067022317 A KR 20067022317A KR 20070009644 A KR20070009644 A KR 20070009644A
Authority
KR
South Korea
Prior art keywords
lsp
wideband
narrowband
quantized
lsp parameter
Prior art date
Application number
KR1020067022317A
Other languages
English (en)
Inventor
히로유키 에하라
고지 요시다
Original Assignee
마츠시타 덴끼 산교 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마츠시타 덴끼 산교 가부시키가이샤 filed Critical 마츠시타 덴끼 산교 가부시키가이샤
Publication of KR20070009644A publication Critical patent/KR20070009644A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/38Synchronous or start-stop systems, e.g. for Baudot code
    • H04L25/40Transmitting circuits; Receiving circuits
    • H04L25/49Transmitting circuits; Receiving circuits using code conversion at the transmitter; using predistortion; using insertion of idle bits for obtaining a desired frequency spectrum; using three or more amplitude levels ; Baseband coding techniques specific to data transmission systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/20Repeater circuits; Relay circuits

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Power Engineering (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

협대역 LSP로부터 광대역 LSP으로의 변환 성능(협대역 LSP로부터 광대역 LSP를 예측할 때의 예측 정밀도)을 높여, 고성능의 대역 스케일러블 LSP 부호화를 실현할 수 있는 스케일러블 부호화 장치를 개시한다.
이 장치에 있어서, 변환 계수 산출부(109)는 협대역 LSP 부호화부(103)로부터 과거로 출력된 협대역의 양자화 LSP와, 광대역 LSP 부호화부(107)로부터 과거로 출력된 광대역의 양자화 LSP를 이용하여 변환 계수를 구한다. 광대역 LSP 부호화부(107)는 협대역의 양자화 LSP에 변환 계수 산출부(109)로부터 입력되는 변환 계수를 곱해 광대역 LSP로 변환하고, 이 광대역 LSP에 보정 계수를 곱해 예측 광대역 LSP를 구한다. 그리고, 광대역 LSP 부호화부(107)는 구해진 예측 광대역 LSP와 광대역 LSP의 오차 신호를 부호화하여, 광대역의 양자화 LSP를 얻는다.

Description

스케일러블 부호화 장치, 스케일러블 복호화 장치 및 그 방법{SCALABLE ENCODING DEVICE, SCALABLE DECODING DEVICE, AND METHOD THEREOF}
본 발명은 이동 통신 시스템이나 인터넷 프로토콜을 이용한 패킷 통신 시스템 등에 있어서, 음성 통신을 행할 때에 이용되는 스케일러블 부호화 장치, 스케일러블 복호화 장치, 스케일러블 부호화 방법, 및 스케일러블 복호화 방법에 관한 것이다.
VoIP(Voice over IP) 등과 같이 패킷을 이용한 음성 통신에 있어서는 음성 데이터의 부호화에 프레임 소실내성(消失耐性)이 있는 부호화 방식이 요망되고 있다. 인터넷 통신으로 대표되는 패킷 통신에 있어서는 폭주 등에 의해 전송로상에서 패킷이 파기되는 일이 있기 때문이다.
프레임 소실내성을 높이는 방법의 하나로서, 전송 정보의 일부가 소실되더라도 다른 일부로부터 복호 처리를 행하도록 함으로써, 프레임 소실의 영향을 가능한한 줄이는 어프로치가 있다(예를 들면, 특허 문헌 1 참조). 특허 문헌 1에는 스케일러블 부호화를 이용해서 코어 레이어(Core Layer) 부호화 정보와 확장 레이어의 부호화 정보를 각각의 패킷에 넣어 전송하는 방법이 개시되어 있다. 또한, 패킷 통신의 애플리케이션으로서 굵은 회선(브로드밴드 회선)과 가는 회선(전송 레이트가 낮은 회선)이 혼재하는 네트워크를 이용한 멀티 캐스트 통신(일 대 복수의 통신)을 들 수 있다. 이러한 불균일한 네트워크 상에서 다지점간 통신을 행하는 경우에도, 각각의 네트워크에 대응하여 부호화 정보가 계층화되어 있으면, 네트워크마다 다른 부호화 정보를 보낼 필요가 없기 때문에, 스케일러블 부호화가 효과적이다.
예를 들면, 음성 신호의 고능률적인 부호화를 가능하게 하는 CELP 방식을 베이스로 하여, 신호 대역폭으로, 즉 주파수축 방향으로 스케일러빌리티(scalability)를 가지는 대역 스케일러블 부호화 기술로서 특허 문헌 2에 개시되어 있는 기술이 있다. 특허 문헌 2에서는 음성 신호의 스펙트럼 포락 정보를 LSP(선스펙트럼 쌍(line spectrum pair)) 파라미터로 표현하는 CELP 방식의 예가 표시되어 있다. 여기에서는 협대역 음성용 부호화부(코어 레이어)에서 얻어진 양자화 LSP 파라미터(협대역 부호화 LSP)를 이하의 (식 1)을 이용하여 광대역 음성 부호화용 LSP 파라미터로 변환하고, 변환한 LSP 파라미터를 광대역 음성용 부호화부(확장 레이어)에서 이용함으로써, 대역 스케일러블한 LSP 부호화 방법을 실현하고 있다.
fw(i)=0.5×fn(i) [단,i=0,…,Pn-1]
=0.0     [단,i=Pn,…,Pw-1] … (식 1)
또한, fw(i)는 광대역 신호에 있어서의 i차의 LSP 파라미터, fn(i)는 협대역 신호에 있어서의 i차의 LSP 파라미터, Pn은 협대역 신호의 LSP 분석 차수, Pw는 광대역 신호의 LSP 분석 차수를 각각 나타내고 있다.
그러나, 특허 문헌 2에 있어서는 협대역 신호로서 샘플링 주파수가 8 kHz, 광대역 신호로서 샘플링 주파수가 16 kHz, 광대역 LSP 분석 차수가 협대역 LSP 분석 차수의 2배인 경우를 예로 들어 설명하고 있기 때문에, 협대역 LSP로부터 광대역 LSP로의 변환이 (식 1)에서 표시되는 바와 같은 단순한 식으로 행해질 수 있다. 그런데, 광대역 LSP의 저차측(低次側)의 P차의 LSP 파라미터가 존재하는 위치는 고차측(高次側)의(Pw-Pn)차를 포함한 광대역 신호 전체에 대해서 결정되기 때문에, 반드시 협대역 LSP의 Pn차의 LSP 파라미터에 대응하는 것은 아니다. 이 때문에, (식 1)에서 표시되는 변환으로는 높은 변환 효율(협대역 LSP로부터 광대역 LSP를 예측한다고 본 경우, 예측 정밀도라고 말할 수도 있음)은 얻지 못하며, (식 1)에 기초하여 설계된 광대역 LSP 부호화기에는 부호화 성능을 개선할 여지가 남아 있다.
예를 들면, 비특허 문헌 1에는 (식 1)의 i차의 협대역 LSP 파라미터에 곱하는 변환 계수를 0.5로 하는 대신에, 이하의 (식 2)에 나타내는 바와 같이, 변환 계수의 최적화 알고리즘을 이용해서 차수마다 최적 변환 계수 β(i)를 구하는 방법이 개시되어 있다.
fw_n(i)=α(i)×L(i)+β(i)×fn_n(i) … (식 2)
다, fw_n(i)는 제 n 프레임에 있어서의 i차의 광대역 양자화 LSP 파라미터, α(i)×L(i)는 예측 오차 신호를 양자화한 벡터의 i차의 요소(α(i)는 i차의 보정 계수), L(i)는 LSP 예측 잔차 벡터, β(i)는 예측 광대역 LSP에 대한 보정 계수, fn_n(i)는 제 n 프레임에 있어서의 협대역 LSP 파라미터이다. 이러한 변환 계수의 최적화에 의해, 특허 문헌 2와 동일한 구성의 LSP 부호화기이면서, 보다 높은 부호화 성능을 실현하고 있다.
특허 문헌 1 : 특허 공개 2003-241799호 공보
특허 문헌 2 : 특허 공개 평성 11-30997호 공보
비특허 문헌 1 : K. Koishida et al, "Enhancing MPEG-4 CELP by jointly optimized inter/intra-frame LSP predictors," IEEE Speech Coding Workshop 2000, Proceeding, pp.90-92, 2000
그렇지만, 광대역 LSP의 저차측의 Pn차 LSP 파라미터의 위치는 광대역 신호 전체에 대해서 결정되기 때문에, 개개의 LSP 파라미터(분석 프레임마다 LSP 파라미터)에 대해서 착안하면, 시간 경과에 수반하여(프레임에 따라) 최적 변환 계수 β(i)의 값은 변화한다. 따라서, 특허 문헌 2에 개시된 기술에는 이하의 문제가 있다.
도 1은 광대역 신호에 대역 제한을 가한 신호, 즉 광대역 신호를 일단 다운 샘플한 뒤에 업 샘플하여 원래의 샘플링 주파수로 되돌린 것을, Pw=18로 LSP 분석하여 얻어지는 협대역의 LSP 파라미터의 예를 나타낸 도면이다.
또한, 도 2는 도 1에 나타낸 협대역 LSP 파라미터에 대응하는 광대역 신호를, Pw=18로 LSP 분석하여 얻어지는 광대역의 LSP 파라미터의 예를 나타낸 도면이다. 이들 도면에 있어서, 가로축은 시간(분석 프레임 번호)이며, 세로축은 정규화 주파수(1.0을 나이퀴스트(nyquist) 주파수로 하고, 도면의 예에서는 8 kHz) 이다.
이들 도면에 표시된 바와 같이, 신호의 주파수 대역이 다르다는 것 이외는 조건을 전부 동일하게 하여 얻어지는 LSP 파라미터, 즉 동일한 샘플링 주파수(16 kHz)에서 동일 분석 차수의 LSP 분석을 행하여 얻어지는 LSP 파라미터라 하더라도, 협대역으로 대역 제한된 신호로부터 얻어지는 저차측의 (Pw/2)차의 LSP 파라미터와, 광대역 신호로부터 얻어지는 저차측의 (Pw/2)차의 LSP 파라미터의 대응 관계가 시간적으로 변화하고 있음을 알 수 있다. 이 변화는 협대역 신호에는 포함되지 않고 광대역 신호에 포함되는 주파수 성분(주로 고역 성분)의 차이에 따라 발생하는 것이다.
도 3은 도 1 및 도 2에 나타낸 LSP 데이터를 이용하여, 차수별로 구한 협대역 LSP를 광대역 LSP로 변환하는 경우의 이상적인 변환 계수를 나타낸 도면이다. 여기서, 변환 계수는 광대역 LSP를 협대역 LSP로 나눈 값으로서, 가로축은 시간(분석 프레임 번호)으로, 차수가 0차, 4차, 8차인 경우를 예로 들어 나타내고 있다.
이 도면으로부터도 분명한 바와 같이, 이상적인 변환 계수의 값은 시간적으로 변동하고 있다. 즉, 협대역 LSP를 광대역 LSP로 변환할 때의 변환 계수, 다른 표현을 한다면, 협대역 LSP로부터 광대역 LSP를 예측할 때의 변환 계수의 이상값(理想値)은 시간적으로 변동하므로, 비특허 문헌 1에 개시된 설계 수법에 의해 얻어지는 변환 계수를 이용하더라도, 변환 계수가 고정값이면, 시간적으로 변동하는 이상적인 변환 계수를 정확하게 표시할 수는 없다.
또한, 여기서는 LSP 분석의 조건을 맞추기 위해서, 샘플링 주파수 및 분석 차수가 동일하고 신호의 대역만이 다른 경우를 예로 들어 나타냈지만, 다운 샘플한 신호를 이용하여 광대역 LSP보다도 낮은 차수로 LSP 분석을 행한 경우에도 동일하다고 할 수 있다. 이것은 이 분야의 기술자라면 용이하게 이해할 수 있는 것이다. 다만, LSP 분석의 조건이 달라지기 때문에, 협대역 LSP와 광대역 LSP의 대응 관계는 상기한 예보다 나빠진다.
따라서, 본 발명의 목적은 협대역 LSP로부터 광대역 LSP로의 변환 성능, 즉 협대역 LSP로부터 광대역 LSP를 예측할 때의 예측 정밀도를 높여, 고성능의 대역 스케일러블 LSP 부호화를 실현할 수 있는 스케일러블 부호화 장치, 스케일러블 복호화 장치, 스케일러블 부호화 방법, 및 스케일러블 복호화 방법을 제공하는 것이다.
본 발명의 스케일러블 부호화 장치는 입력 신호로부터, 주파수축 방향으로 스케일러빌리티를 가지는 협대역 및 광대역의 양자화 LSP 파라미터를 생성하는 스케일러블 부호화 장치로서, 협대역의 입력 신호의 LSP 파라미터를 부호화하여, 협대역의 제 1 의 양자화 LSP 파라미터를 생성하는 협대역 부호화 수단과, 상기 제 1 의 양자화 LSP 파라미터의 주파수 대역을 광대역으로 변환하는 변환 수단과, 광대역으로 변환한 후의 상기 제 1 의 양자화 LSP 파라미터를 이용해서 광대역의 입력 신호의 LSP 파라미터의 부호화를 행하고, 광대역의 제 2 의 양자화 LSP 파라미터를 생성하는 광대역 부호화 수단과, 과거에 생성된 상기 제 1 및 제 2 의 양자화 LSP 파라미터 간의 관계에 기초하여, 상기 변환 수단에서 사용되는 변환 계수를 산출하는 산출 수단을 구비하는 구성을 취한다.
발명의 효과
본 발명에 의하면, 협대역 LSP로부터 광대역 LSP로의 변환 성능을 높여, 고성능의 대역 스케일러블 LSP 부호화를 실현할 수 있다.
도 1은 협대역의 LSP 파라미터의 예를 나타낸 도면,
도 2는 광대역의 LSP 파라미터의 예를 나타낸 도면,
도 3은 이상적인 변환 계수를 나타낸 도면,
도 4는 실시예 1에 따른 스케일러블 부호화 장치의 주요한 구성을 나타내는 블록도,
도 5는 실시예 1에 따른 광대역 LSP 부호화부 내부의 주요한 구성을 나타내는 블록도,
도 6은 실시예 1에 따른 변환 계수 산출부 내부의 주요한 구성을 나타내는 블록도,
도 7은 실시예 1에 따른 스케일러블 복호화 장치의 주요한 구성을 나타내는 블록도,
도 8은 실시예 1에 따른 광대역 LSP 복호화부 내부의 주요한 구성을 나타내는 블록도,
도 9는 실시예 2에 따른 변환 계수 산출부 내부의 주요한 구성을 나타내는 블록도,
도 10은 실시예 2에 따른 광대역 LSP 부호화부 내부의 주요한 구성을 나타내는 블록도,
도 11은 실시예 2에 따른 광대역 LSP 복호화부 내부의 주요한 구성을 나타내는 블록도,
도 12는 실시예 3에 따른 스케일러블 부호화 장치의 주요한 구성을 나타내는 블록도,
도 13은 실시예 3에 따른 변환 계수 산출부 내부의 주요한 구성을 나타내는 블록도,
도 14는 실시예 3에 따른 스케일러블 복호화 장치의 주요한 구성을 나타내는 블록도,
도 15는 실시예 4에 따른 스케일러블 부호화 장치의 주요한 구성을 나타내는 블록도,
도 16은 실시예 4에 따른 스케일러블 복호화 장치의 주요한 구성을 나타내는 블록도,
도 17은 실시예 5에 따른 광대역 LSP 부호화부의 주요한 구성을 나타내는 블록도,
도 18은 실시예 5에 따른 변환 계수 산출부의 주요한 구성을 나타내는 블록도,
도 19는 실시예 5에 따른 스케일러블 부호화 장치의 주요한 구성을 나타내는 블록도,
도 20은 실시예 6에 따른 광대역 LSP 부호화부의 주요한 구성을 나타내는 블록도,
도 21은 실시예 6에 따른 변환 계수 산출부의 주요한 구성을 나타내는 블록도,
도 22는 실시예 7에 따른 광대역 LSP 부호화부의 주요한 구성을 나타내는 블록도.
이하, 본 발명의 실시예에 대해서, 첨부 도면을 참조해 상세하게 설명한다.
(실시예 1)
도 4는 본 발명의 실시예 1에 따른 스케일러블 부호화 장치의 주요한 구성을 나타내는 블록도이다.
본 실시예에 따른 스케일러블 부호화 장치는 다운 샘플부(101), LSP 분석부(협대역용)(102), 협대역 LSP 부호화부(103), 음원 부호화부(협대역용)(104), 위상 보정부(105), LSP 분석부(광대역용)(106), 광대역 LSP 부호화부(107), 음원 부호화부(광대역용)(108), 변환 계수 산출부(109), 업 샘플부(110), 가산기(111), 및 다중화부(112)를 구비한다.
본 실시예에 따른 스케일러블 부호화 장치의 각부는 이하의 동작을 행한다.
다운 샘플부(101)는 입력 음성 신호에 대해 다운 샘플링 처리를 행하여 협대역 신호를 LSP 분석부(협대역용)(102) 및 음원 부호화부(협대역용)(104)로 출력한다. 또한, 입력 음성 신호는 디지털화된 신호로서, 필요에 따라서 HPF나 배경 잡음 억압 처리 등의 전(前)처리가 실시되어 있다.
LSP 분석부(협대역용)(102)는 다운 샘플부(101)로부터 입력된 협대역 신호에 대해서 LSP(선 스펙트럼 쌍) 파라미터를 산출하여, 협대역 LSP 부호화부(103)로 출력한다.
협대역 LSP 부호화부(103)는 LSP 분석부(협대역용)(102)로부터 입력된 협대역 LSP 파라미터를 부호화하고, 양자화된 협대역 LSP 파라미터를 광대역 LSP 부호화부(107), 변환 계수 산출부(109), 및 음원 부호화부(협대역용)(104)로 출력한다. 또한, 협대역 LSP 부호화부(103)는 부호화 데이터를 다중화부(112)로 출력한다.
음원 부호화부(협대역용)(104)는 협대역 LSP 부호화부(103)로부터 입력된, 양자화된 협대역 LSP 파라미터를 선형 예측 계수로 변환하고, 얻어진 선형 예측 계 수를 이용해서 선형 예측 합성 필터를 구축한다. 음원 부호화부(104)는 이 선형 예측 합성 필터를 이용하여 합성되는 합성 신호와 별도의 다운 샘플부(101)로부터 입력된 협대역 입력 신호 사이의 청각적 보정 오차를 구하여, 이 청각적 보정 오차를 최소로 하는 음원 파라미터의 부호화를 행한다. 얻어진 부호화 정보는 다중화부(112)로 출력된다. 또한, 음원 부호화부(104)는 협대역 복호 음성 신호를 생성하여 업 샘플부(110)로 출력한다.
또한, 협대역 LSP 부호화부(103) 또는 음원 부호화부(협대역용)(104)에 대해서는 LSP 파라미터를 이용하는 CELP형 음성 부호화 장치에서 일반적으로 이용되고 있는 회로를 적용할 수 있으며, 예를 들면, 특허 문헌 2 또는 ITU-T 권고 G.729 등에 기재되어 있는 기술을 이용할 수 있다.
업 샘플부(110)는 음원 부호화부(104)에서 합성된 협대역 복호 음성 신호가 입력되면, 업 샘플 처리를 실시해서 가산기(111)로 출력한다.
가산기(111)는 위상 보정부(105)로부터 위상 보정 후의 입력 신호, 업 샘플부(110)로부터 업 샘플된 협대역 복호 음성 신호가 각각 입력되면, 양 신호의 차분 신호를 구해 음원 부호화부(광대역용)(108)로 출력한다.
위상 보정부(105)는 다운 샘플부(101) 및 업 샘플부(110)에서 발생하는 위상의 어긋남(지연)를 보정하기 위한 것으로서, 다운 샘플 처리 및 업 샘플 처리가 직선위상 저역통과 필터와 샘플 솎아내기(skim)/영점 삽입에 의해 행해질 경우는 직선위상 저역통과 필터에 의해 생기는 지연만큼 입력 신호를 지연시키는 처리를 행하여, LSP 분석부(광대역용)(106) 및 가산기(111)로 출력한다.
LSP 분석부(광대역용)(106)는 위상 보정부(105)로부터 출력되는 광대역 신호를 입력시켜 공지된 LSP 분석을 행하고, 얻어진 광대역 LSP 파라미터를 광대역 LSP 부호화부(107)로 출력한다.
변환 계수 산출부(109)는 협대역 LSP 부호화부(103)로부터 과거로 출력된 협대역의 양자화 LSP와, 광대역 LSP 부호화부(107)로부터 과거로 출력된 광대역의 양자화 LSP를 이용해서 변환 계수를 구해서 광대역 LSP 부호화부(107)로 출력한다.
광대역 LSP 부호화부(107)는 협대역 LSP 부호화부(103)로부터 입력되는 협대역의 양자화 LSP에 변환 계수 산출부(109)로부터 입력되는 변환 계수를 곱해서 광대역 LSP로 변환하고, 이 광대역 LSP에 보정 계수를 곱해 예측 광대역 LSP를 구한다. 그리고, LSP 분석부(광대역용)(106)로부터 입력된 광대역 LSP와 구해진 예측 광대역 LSP의 오차 신호를, 벡터 양자화 등의 수법을 이용해서 부호화하고, 얻어진 광대역의 양자화 LSP를 음원 부호화부(광대역용)(108)로 출력한다. 여기서, 양자화 LSP는 이하의 (식 3)과 같이 표시된다.
fw_n(i)=α(i)×L(i)+β(i)×{fw_n-1(i)/fn_n-1(i)}×fn_n(i) …(식 3)
단, fw_n(i)는 제 n 프레임에 있어서의 i차의 광대역 양자화 LSP 파라미터, α(i)×L(i)는 예측 오차 신호를 양자화한 벡터의 i차의 요소(α(i)는 i차 보정 계수), L(i)는 LSP 예측 잔차 벡터, β(i)는 예측 광대역 LSP에 대한 보정 계수, fw_n-1(i)는 제 (n-1) 프레임에 있어서의 광대역 양자화 LSP 파라미터, fn_n-1(i)는 제 (n-1) 프레임에 있어서의 협대역 양자화 LSP 파라미터, fn_n(i)는 제 n 프레임에 있어서의 협대역 LSP 파라미터이다.
한편, 광대역 LSP 부호화부(107)는 얻어진 부호 정보를 다중화부(112)로 출력한다. 또한, 상기의 LSP 예측 잔차 벡터에 곱하는 보정 계수 α(i)는 1.0의 고정값으로 해도 되고, 별도 학습에 의해 얻어진 정수여도 되며, 별도 학습에 의해 얻어진 복수의 계수를 코드북으로서 구비하여 그 중에서 하나를 선택하도록 해도 된다.
음원 부호화부(광대역용)(108)는 광대역 LSP 부호화부(107)로부터 입력된, 양자화된 광대역 LSP 파라미터를 선형 예측 계수로 변환하고, 얻어진 선형 예측 계수를 이용해서 선형 예측 합성 필터를 구축한다. 그리고, 이 선형 예측 합성 필터를 이용해서 합성되는 합성 신호와 위상 보정된 입력 신호 사이의 청각적 보정 오차를 구해, 이 청각적 보정 오차를 최소로 하는 음원 파라미터를 결정한다. 보다 상세하게는 음원 부호화부(108)에는 광대역 입력 신호와 업샘플 후의 협대역 복호 신호의 오차 신호가 별도의 가산기(111)로부터 입력되고, 이 오차 신호와 음원 부호화부(108)에서 생성되는 복호 신호 사이의 오차가 구해져서, 이 오차에 청각적 보정이 실시된 것이 최소가 되도록 음원 파라미터가 결정된다. 구해진 음원 파라미터의 부호 정보는 다중화부(112)로 출력된다. 이 음원 부호화에 대해서는 예를 들면, 「K. Koishida et al, "A16-kbit/s bandwidth scalable audio coder based on the G.729 standard," IEEE Proc. ICASSP 2000, pp.1149-1(152), 2000」에 개시되어 있다.
다중화부(112)에는 협대역 LSP 부호화부(103)로부터는 협대역 LSP의 부호화 정보가, 음원 부호화부(협대역용)(104)로부터는 협대역 신호의 음원 부호화 정보 가, 광대역 LSP 부호화부(107)로부터는 광대역 LSP의 부호화 정보가, 그리고, 음원 부호화부(광대역용)(108)로부터는 광대역 신호의 음원 부호화 정보가 입력된다. 다중화부(112)는 이러한 정보를 다중화해 비트 스트림(bit stream)으로서 전송로에 송출한다. 또한, 비트 스트림은 전송로의 사양에 따라, 전송 채널 프레임으로 프레임화되거나 패킷화된다. 또한, 전송로 오류에 대한 내성을 높이기 위해서, 오류 보호나 오류 검출 부호를 부가하거나 인터리브(interleave)처리 등을 적용한다.
도 5는 상기의 광대역 LSP 부호화부(107) 내부의 주요한 구성을 나타내는 블록도이다.
이 광대역 LSP 부호화부(107)는 오차 최소화부(121), LSP 코드북(122), 보정 계수 코드북(123), 증폭기(124~126) 및 가산기(127, 128)를 구비한다.
가산기(127)는 LSP 분석부(106)로부터 입력된, 양자화 타깃이 되는 LSP 파라미터와, 가산기(128)로부터 입력되는 양자화 LSP 파라미터 후보의 오차를 계산하고, 구해진 오차를 오차 최소화부(121)로 출력한다. 또한, 이 오차 계산은 입력된 LSP 벡터간의 제곱 오차여도 된다. 또한, 입력된 LSP 벡터의 특징에 따라 보정을 행하도록 하면, 한층 더 청감상의 품질을 좋게 할 수가 있다. 예를 들면, ITU-T권고 G.729에서는 3.2.4장(Quantization of the LSP coefficients)의 (21)식의 보정 제곱오차(보정 유클리드(Euclid) 거리)를 이용해서 오차 최소화를 행한다.
오차 최소화부(121)는 가산기(127)로부터 출력되는 오차를 최소로 하는 LSP 벡터 및 보정 계수 벡터를, LSP 코드북(122) 및 보정 계수 코드북(123) 각각 내에서 선택하고, 대응하는 인덱스를 부호화하여, 다중화부(112)로 출력한다(S11).
LSP 코드북(122)은 격납되어 있는 LSP 벡터를 증폭기(124)로 출력한다. 여기서, LSP 코드북(122)이 격납하고 있는 LSP 벡터는 증폭기(125)로부터 출력되는 협대역 양자화 LSP에 기초하여 예측된 광대역 LSP의(LSP 분석부(106)로부터 입력되는 광대역 LSP에 대한다) 예측 잔차 벡터이다.
보정 계수 코드북(123)은 격납하고 있는 보정 계수 세트 중에서 한 세트를 선택하고, 선택된 보정 계수 세트 중에서 증폭기(124)용 계수와 증폭기(125)용 계수를 증폭기(124) 및 (125)로 출력한다. 또한, 이 보정 계수 세트는 증폭기(124) 및 (125) 각각에 대해 LSP의 차수 별로 준비된 보정 계수로 이루어진다.
증폭기(124)는 LSP 코드북(122)으로부터 입력된 LSP 벡터에, 보정 계수 코드북(123)으로부터 출력된 증폭기(124)용 보정 계수를 곱하여 가산기(128)로 출력한다.
증폭기(125)는 증폭기(126)로부터 입력되는 광대역 LSP의 벡터 즉, 양자화 후의 협대역 LSP를 변환하여 얻어지는 광대역 LSP의 벡터에, 보정 계수 코드북(123)으로부터 출력되는 증폭기(125)용 보정 계수를 곱하여 가산기(128)로 출력한다.
가산기(128)는 증폭기(124)와 증폭기(125)로부터 출력된 LSP 벡터의 합을 계산하여 가산기(127)로 출력한다. 또한, 오차 최소화부(121)에서 오차가 최소가 된다고 판단된 LSP 벡터의 합이 광대역의 양자화 LSP 파라미터로서 음원 부호화부(108) 및 변환 계수 산출부(109)로 출력된다. 또한, 광대역의 양자화 LSP 파라미터로서 출력되는 LSP 파라미터가 안정조건(제 n 차 LSP는 제 0 차 ~ 제 (n-1) 차 중 어느 LSP보다 큰 경우 즉, LSP는 차수의 순서로 값이 커진다)을 만족시키고 있지 않은 경우에는 가산기(128)는 LSP의 안정조건을 만족시키도록 조작을 가한다. 또한, 인접하는 양자화 LSP의 간격이 소정의 간격보다 좁은 경우에도 소정의 간격 이상이 되도록 조작하는 것이 일반적이다.
증폭기(126)는 협대역 LSP 부호화부(103)로부터 입력된 LSP 파라미터에, 변환 계수 산출부(109)로부터 입력된 계수를 곱하여, 증폭기(125)로 출력한다. 또한, 협대역 LSP 부호화부(103)로부터 증폭기(126)에 입력되는 LSP 파라미터는 협대역 LSP 부호화부(103)의 양자화 결과 그대로도 좋지만, 업 샘플하여 광대역 신호의 샘플링 주파수에 맞춤과 동시에, 광대역 LSP의 차수에 맞추면 더욱 좋다. 이 업 샘플의 방법으로서는 협대역 LSP로부터 얻어지는 LPC 합성 필터의 임펄스(inpulse)응답을 업 샘플하고, 업 샘플한 임펄스 응답으로부터 자기 상관(自己相關)을 구하고(예를 들면, 특허 문헌 2 참조), 구해진 자기 상관계수를 주지된 방법에 따라 소망하는 차수의 LSP로 변환하는 방법 등을 들 수 있지만, 이에 한정되는 것은 아니다.
도 6은 도 4에 나타낸 변환 계수 산출부(109) 내부의 주요한 구성을 나타내는 블록도이다.
이 변환 계수 산출부(109)는 지연기(131, 132), 제산기(133), 리미터(134), 및 평활화부(135)를 구비한다.
지연기(131)는 협대역 LSP 부호화부(103)로부터 입력된 협대역 LSP 파라미터를 1 처리 단위 시간(LSP 파라미터의 갱신 주기)만큼 지연시켜, 제산기(133)로 출 력한다. 또한, 전술한 바와 같이, 협대역 LSP 부호화부(103)로부터 입력되는 협대역 LSP는 파라미터 협대역 LSP 그대로도 좋지만, 업 샘플하여 차수를 맞춰주면 더욱 좋다.
지연기(132)는 광대역 LSP 부호화부(107)로부터 입력된 광대역 LSP 파라미터를 1 처리 단위 시간(LSP 파라미터의 갱신 주기)만큼 지연시켜, 제산기(133)로 출력한다.
제산기(133)는 지연기(132)로부터 입력된 1 처리 단위 시간 전에 양자화된 광대역 LSP 파라미터를, 지연기(131)로부터 입력된 1 처리 단위 시간 전에 양자화된 협대역 LSP 파라미터로 나눗셈하여, 제산 결과를 리미터(134)로 출력한다. 지연기(131)로부터 출력되는 협대역 LSP 파라미터의 차수와 지연기(132)로부터 출력되는 광대역 LSP 파라미터의 차수가 다른 경우에는 적은 쪽의 차수(통상, 협대역 LSP 파라미터의 차수)만큼 나눗셈을 행하여 출력한다.
리미터(134)는 제산기(133)로부터 입력된 제산 결과를 미리 설정한 상한치와 하한치로 클리핑(상한치를 넘으면 이 상한치로 다시 설정하고, 하한치를 밑돌면 이 하한치로 다시 설정하는 처리)하여, 평활화부(135)로 출력한다. 또한, 상한치 및 하한치는 전(全)차수에서 동일한 것이어도 좋지만, 차수별로 최적의 값을 설정하면 더욱 좋다.
평활화부(135)는 리미터(134)로부터 입력된 클리핑 후의 나눗셈 결과를 시간적으로 평활화하고, 변환 계수로서 광대역 LSP 부호화부(107)로 출력한다. 이 평활화 처리는 예를 들면, 이하의 (식 4)를 이용함으로써 실현할 수 있다.
Xn(i) = K×Xn-1(i)+(1-K)×γ(i) … (식4)
여기서, Xn(i)는 제 n 번째의 처리 단위 시간에 있어서의 i차의 협대역 LSP 파라미터에 적용되는 변환 계수이며, K는 평활화 계수로 0≤K<1의 값을 취하고, γ(i)는 리미터(134)로부터 출력되는 i차의 LSP 파라미터에 대한 제산 결과이다.
이상, 본 실시예에 관계되는 스케일러블 부호화 장치에 대해 상세하게 설명했다.
도 7은 상기의 스케일러블 부호화 장치로 부호화된 부호화 정보를 복호화하는 스케일러블 복호화 장치의 주요한 구성을 나타내는 블록도이다.
이 스케일러블 복호화 장치는 다중 분리부(151), 음원 복호화부(협대역용)(152), 협대역 LSP 복호화부(153), 음원 복호화부(광대역용)(154), 변환 계수 산출부(155), 광대역 LSP 복호화부(156), 음성 합성부(협대역용)(157), 음성 합성부(광대역용)(158), 업 샘플부(159) 및 가산기(160)를 구비한다.
다중 분리부(151)는 상기의 스케일러블 부호화 장치에서 부호화된 부호화 정보를 받아, 각 파라미터의 부호화 정보로 분리하여, 협대역 음원 부호화 정보를 음원 복호화부(협대역용)(152)에, 협대역 LSP 부호화 정보를 협대역 LSP 복호화부(153)에, 광대역 음원 부호화 정보를 음원 복호화부(광대역용)(154)에, 광대역 LSP 부호화 정보를 광대역 LSP 복호화부(156)에, 각각 출력한다.
음원 복호화부(협대역용)(152)는 다중 분리부(151)로부터 입력된 협대역 음원 신호의 부호화 정보를, 상기의 스케일러블 부호화 장치의 음원 부호화부(협대역 용)(104)에서 행해진 처리와 반대되는 처리를 이용해서 복호하고, 양자화된 협대역 음원 신호를 음성 합성부(협대역용)(157)로 출력한다.
협대역 LSP 복호화부(153)는 다중 분리부(151)로부터 입력된 협대역 LSP의 부호화 정보를, 상기의 스케일러블 부호화 장치의 협대역 LSP 부호화부(103)에서 행해진 처리와 반대되는 처리로 복호하고, 얻어진 협대역의 양자화 LSP를 음성 합성부(협대역용)(157), 변환 계수 산출부(155), 및 광대역 LSP 복호화부(156)로 출력한다.
음성 합성부(협대역용)(157)는 협대역 LSP 복호화부(153)로부터 입력된, 양자화된 협대역 LSP 파라미터를 선형 예측 계수로 변환하고, 얻어진 선형 예측 계수를 이용해서 선형 예측 합성 필터를 구축한다. 음성 합성부(협대역용)(157)는 이 선형 예측 합성 필터를 음원 복호화부(협대역용)(152)로부터 입력되는 협대역의 양자화 음원 신호로 구동해 복호 음성 신호를 합성하여, 협대역 복호 음성 신호로서 출력한다. 이 협대역 복호 음성 신호는 광대역 복호 음성 신호를 얻기 위해서 업 샘플부(159)로 출력된다. 또한, 이 협대역 복호 음성 신호는 그대로 최종 출력으로서 이용되어도 된다. 협대역 복호 음성 신호를 그대로 최종 출력으로 할 경우에는 포스트필터(post filter)등 주관적인 품질을 개선하기 위한 후(後)처리를 행한 뒤 출력하는 것이 일반적이다.
업 샘플부(159)는 음성 합성부(협대역용)(157)로부터 입력된 협대역 음성 신호의 업 샘플 처리를 행하여 가산기(160)로 출력한다.
음원 복호화부(광대역용)(154)는 다중 분리부(151)로부터 입력된 광대역 음 원 신호의 부호화 정보를, 상기의 스케일러블 부호화 장치의 음원 부호화부(광대역용)(108)에서 행해진 처리와 반대되는 처리에 의해 복호하고, 얻어진 광대역 양자화 음원 신호를 음성 합성부(광대역용)(158)로 출력한다.
변환 계수 산출부(155)는 협대역 LSP 복호화부(153)로부터 과거에 입력된 협대역의 양자화 LSP와, 광대역 LSP 복호화부(156)로부터 과거에 입력된 광대역의 양자화 LSP를 이용해서 변환 계수를 구해 광대역 LSP 복호화부(156)로 출력한다.
광대역 LSP 복호화부(156)는 협대역 LSP 복호화부(153)로부터 입력되는 협대역의 양자화 LSP에, 변환 계수 산출부(155)로부터 입력되는 변환 계수를 곱해 광대역 LSP로 변환하고, 이 광대역 LSP에 보정 계수를 곱해 예측 광대역 LSP를 구한다. 또한, 이 보정 계수는 상기의 스케일러블 부호화 장치의 광대역 LSP 부호화부(107)에서 사용되는 보정 계수와 동일한 값을 이용한다. 또한, 광대역 LSP 복호화부(156)는 다중 분리부(151)로부터 입력된 광대역 LSP 부호화 정보로부터, 양자화된 광대역 LSP 예측 잔차(부호화측의 입력 광대역 LSP와 상기의 예측 광대역 LSP의 오차)를 복호한다. 그리고, 광대역 LSP 복호화부(156)는 이 양자화된 광대역 LSP 예측 잔차와 상기에서 이미 구해져 있는 예측 광대역 LSP를 가산하여, 광대역의 양자화 LSP를 복호한다. 얻어진 광대역의 양자화 LSP 파라미터는 음성 합성부(광대역용)(158) 및 변환 계수 산출부(155)로 출력된다.
음성 합성부(광대역용)(158)는 광대역 LSP 복호화부(156)로부터 입력된 양자화된 광대역 LSP 파라미터를 선형 예측 계수로 변환하고, 얻어진 선형 예측 계수를 이용해서 선형 예측 합성 필터를 구축한다. 음성 합성부(광대역용)(158)는 이 선 형 예측 합성 필터를 음원 복호화부(광대역용)(154)로부터 입력되는 광대역의 양자화 음원 신호로 구동해 광대역 복호 음성 신호(주로 고역 성분)를 합성하여, 가산기(160)로 출력한다.
가산기(160)는 업 샘플부(159)로부터 입력되는 업 샘플 후의 협대역 복호 음성 신호와, 음성 합성부(광대역용)(158)로부터 입력되는 광대역 복호 음성 신호(주로 고역 성분)를 가산하여, 최종적인 광대역 복호 음성 신호를 출력한다.
도 8은 상기의 광대역 LSP 복호화부(156) 내부의 주요한 구성을 나타내는 블록도이다.
이 광대역 LSP 복호화부(156)는 인덱스 복호부(161), LSP 코드북(162), 보정 계수 코드북(163), 증폭기(164~166), 및 가산기(167)를 구비한다.
인덱스 복호부(161)는 다중 분리부(151)로부터 광대역 LSP의 부호화 정보를 취득해서, LSP 코드북(162)용과 보정 계수 코드북(163)용 인덱스 정보를 복호하고, 각 인덱스 정보를 각각의 코드북로 출력한다.
LSP 코드북(162)는 인덱스 복호부(161)로부터 LSP 코드북 인덱스를 취득하고, 이 인덱스로 지정되는 LSP 벡터를 코드북에서 추출하여, 증폭기(164)로 출력한다. 또한, 코드북이 스플릿트형(Split)이나 타단(他段) 구성으로 되어 있는 경우에는 복수의 서브 코드북에서 지정된 벡터를 추출하여 LSP 벡터를 생성한다.
보정 계수 코드북(163)은 인덱스 복호부(161)로부터 보정 계수 코드북 인덱스를 취득하고, 이 인덱스로 지정되는 보정 계수 세트를 코드북으로부터 추출하며, 추출한 계수 세트로부터, 증폭기(164)용(LSP 코드북용)의 계수 서브세트(LSP 벡터 의 각 차수에 곱하는 계수로 됨)를 증폭기(164)에, 증폭기(165)용(협대역 LSP용) 계수 서브세트(예측 광대역 LSP 벡터의 각 차수에 곱하는 계수로 이루어짐)를 증폭기(165)에 각각 출력한다.
증폭기(164)는 LSP 코드북(162)으로부터 입력된 LSP 벡터에, 보정 계수 코드북(163)으로부터 입력된 증폭기(164)용 보정 계수를 곱해 가산기(167)로 출력한다.
증폭기(165)는 증폭기(166)로부터 입력되는 양자화된 협대역 LSP로부터 변환된 광대역 LSP의 벡터에, 보정 계수 코드북(163)으로부터 입력된 증폭기(165)용 보정 계수를 곱해 가산기(167)로 출력한다.
가산기(167)는 증폭기(164) 및 증폭기(165)로부터 입력된 LSP 벡터의 합을 계산하고, 양자화(복호) 광대역 LSP 파라미터로서 음성 합성부(광대역용)(158) 및 변환 계수 산출부(155)로 출력한다. 또한, 광대역의 양자화 LSP 파라미터로서 출력되는 LSP 파라미터가, 안정조건을 만족시키지 못할 경우, 즉, 제 n 차의 LSP가 제 0 차 ~ 제 (n-1) 차 전부의 LSP보다 작을 경우(LSP가 차수의 순서로 값이 크게 되어 있지 않은 경우)에는 LSP의 안정조건을 만족시키도록 조작을 가한다. 또한, 인접하는 양자화 LSP의 간격이 소정의 간격보다 좁은 경우도 소정의 간격 이상이 되도록 조작한다.
또한, 도 7에 나타낸 변환 계수 산출부(155)의 내부 구성은 도 6에 나타낸 변환 계수 산출부(109)와 기본적으로 동일하다. 따라서 상세한 설명은 생략하는데, 이 변환 계수 산출부(155)내의 지연기(131)로의 입력은 협대역 LSP 복호화부(153)로부터, 지연기(132)로의 입력은 광대역 LSP 복호화부(156)로부터, 평활화 부(135)의 출력은 광대역 LSP 복호화부(156)로 이루어지는 점은 도 6에 나타낸 변환 계수 산출부(109)와 다르다.
이상, 본 실시예에 관한 스케일러블 복호화 장치에 대해 상세하게 설명했다.
이와 같이, 본 실시예에 의하면, 변환 계수 산출부(109)는 과거의 프레임(예를 들면, 직전의 프레임 등)에 있어서 부호화된 협대역 및 광대역의 양자화 LSP 파라미터를 이용하여 과거의 프레임에 있어서의 이상적인 변환 계수의 근사치를 구하고 이 근사치에 기초하여 현프레임에 있어서의 협대역의 양자화 LSP로부터 광대역 LSP로의 변환 계수를 결정한다. 구체적으로는 이상적인 변환 계수의 근사치는 과거의 프레임의 광대역의 양자화 LSP를 동일한 프레임의 협대역의 양자화 LSP로 제산함으로써 구해진다. 바꾸어 말하면, 협대역 LSP 파라미터로부터 광대역 LSP 파라미터로 변환 계수 Xn(i)를 곱하여 추정할 때, 과거의 협대역 LSP 파라미터와 광대역 LSP 파라미터의 관계를 이용해서 적응적으로 프레임 별로 변환 계수를 결정한다. 따라서, 변환 계수는 시간 경과와 함께 변화한다. 이 구성을 취함으로써, 협대역 LSP로부터 광대역 LSP를 예측할 때의 예측 정밀도를 높일 수 있다.
또한, 이상의 구성에 있어서, 상기의 변환 계수는 과거 프레임에 있어서의 협대역 및 광대역의 양자화 LSP 파라미터로부터만 산출 가능하므로, 예를 들면, 복호화측에 있어서 부호화 측으로부터 정보를 별도로 취득할 필요가 없다. 즉, 통신의 전송 레이트를 증가시키는 일없이 광대역 LSP 파라미터의 부호화 성능을 개선할 수 있다.
또한, 이상의 구성에 있어서, 상기의 변환 계수는 과거의 프레임에 있어서의 협대역 및 광대역의 LSP 파라미터로부터 소정 연산에 의해 직접 구할 수 있으므로, 미리 복수의 변환 계수 세트를 데이터 테이블 등에 보관 유지해 둘 필요가 없다.
또한, 이상의 구성에 있어서, 변환 계수 산출부(109) 내의 리미터(134)는 산출된 변환 계수가 극단적인 값이 되지 않도록, 변환 계수에 예를 들면, 평균치의 상하 10% 정도 내로 드는 제한을 가한다. 예를 들면, 음성 모드가 유성 모드로부터 무성 모드로, 또는 무성 모드로부터 유성 모드로 바뀌는 등의 경우에는 LSP 파라미터가 크게 변동하기 때문에, 산출되는 변환 계수도 변동하여 타당한 값으로는 되지 않는 경우가 있다. 변환 계수가 단시간 내에 크게 변동할 때는 전(前) 프레임의 광대역/협대역의 LSP비를 이용한 예측이 효과가 없게 되어, 오히려 오차를 크게 하는 방향으로 움직인다. 그러면 LSP 코드북 쪽에서 이처럼 커진 오차를 수정하려고 하게 되는데, 이처럼 오차가 큰 벡터를 코드북에 마련하는 것은 예측 오차가 작은 경우의 오차를 증대시키게 된다. 즉, 변환 계수와 LSP 코드북 사이의 관계가 일종의 발진 상태에 빠지므로, 이렇게 되지 않도록 양자의 밸런스를 잘 취할 수 있는 등의 구성으로 할 필요가 있다.
그래서, 본 실시예에서는 우선, 모든 프레임에 대해 상기의 연산식에 따라 변환 계수를 구하지만, 변환 계수에는 상한 및 하한을 마련해 두고, 산출된 변환 계수가 이 범위내에 들어가 있지 않은 경우에는 변환 계수를 이 범위내로 넣는 수정을 행한다. 이로써, 변환에 실제로 사용되는 변환 계수를 일정 범위내의 값으로 할 수 있으므로, 변환 계수의 정상성(혹은 준정상성)이 보증되어, 발진 상태가 되 는 일이 없어진다. 이렇게 함으로써, 변환 계수에 의한 예측 능력이 제한되어 예측 오차가 커지는 일도 있지만, 변환 계수를 고정값으로 하는 경우의 「고정값」 근방으로 범위를 한정하면, 예측 오차가 변환 계수를 고정값으로 하는 경우를 크게 웃도는 등의 일은 없으며, 변환 계수를 고정값으로 하는 경우와 마찬가지로 LSP 코드북 측에서 대응하는 것이 가능하다. 변환 계수의 근사치는 직전 프레임의 광대역 양자화 LSP를 직전 프레임의 협대역의 양자화 LSP로 제산함으로써 구해지며, 현프레임에서 이용되는 변환 계수는 근사치를 평균적인 변환 계수의 근방(예를 들면 전후 10%정도의 범위 또는 변환 계수의 표준 편차 정도의 범위)으로 한정함으로써 얻어진다.
또한, 이상의 구성에 있어서, 상기 변환 계수는 시간적으로 완만하게 변동하도록 분석 프레임간에서(전후의 프레임간에서) 평활화 처리가 가해진다. 이 때문에, 변환 계수는 LSP 파라미터의 변동에 대해 완만하게 추이하여, 전송로 오류에 대해서 과잉으로 센시티브하게 되는 것을 방지할 수 있다. 또한, 변환 계수의 값이 안정되기 때문에, 대응하는 LSP 코드 벡터 코드북의 설계가 용이해진다. 양자화 LSP의 예측값은 변환 계수와 LSP 코드 벡터의 곱셈값으로 표시되고 있기 때문에, 한쪽의 파라미터가 폭주하면 다른쪽의 파라미터도 폭주하여, 서로의 관계가 발산 상태(전술한 발진 상태)에 빠져, 성능 좋은 코드북을 설계할 수 없어지기 때문이다. 상기의 구성으로 함으로써, 예를 들면 SD 성능을 0.05 dB개선할 수가 있다. 또한, 이 개선폭은 양자화 비트수나 프레임 길이에 의해 바뀌게 된다.
또한, 본 실시예에서는 MA 예측형 LSP 부호화기를 사용하지 않는 예를 나타 냈지만, MA 예측기를 이용한 경우에도 본 발명은 적용 가능하다. 이러한 경우, MA 예측 계수는 보정 계수 코드북(163)에 격납되고, 보정 계수 벡터의 차원수가 MA 예측 차수분만큼 증가하게 된다.
또한, 본 실시예에서는 변환 계수 산출부(109)가 리미터(134) 및 평활화부(135) 모두를 구비하는 경우를 예로 들어 설명했지만, 이들은 한쪽만을 구비하는 등의 구성이어도 된다.
(실시예 2)
실시예 1에서는 산출되는 변환 계수가 크게 변동할 경우에 변환 계수를 일정 범위내로 넣는 수정을 행함으로써, 협대역 LSP로부터 광대역 LSP를 예측할 때의 예측이 안정되게 행해지도록 했다. 본 실시예에서는 양자화 LSP 파라미터에 착안하여, 이 양자화 LSP 파라미터의 변화를 관측함으로써, LSP 파라미터가 변동하고 있는지 않는지를 판단하여, 변환에 사용하는 변환 계수를 바꾼다.
구체적으로는 부호화측의 협대역 LSP 부호화부 또는 복호화측의 협대역 LSP 복호화부에서 얻어지는 협대역의 양자화 LSP 파라미터에 착안하여, 이 협대역의 양자화 LSP 파라미터가 변동하고 있지 않을 때는 정상 모드로, 협대역의 양자화 LSP 파라미터가 변동하고 있을 때는 비정상 모드로 판정하여, 이 모드의 판정 결과에 따라, LSP 코드북과 보정 계수 코드북을 전환하여 사용한다. 즉, 정상 모드에서는 변환 계수를 프레임 별로 상기의 연산식 (식 2)에 따라 산출함으로써 적응적인 제어를 행하고 한편, 비정상 모드에서는 상기의 (식 3)을 이용해, 변환 계수를 고정 값 또는 준고정값으로 설정한다. 여기서 준고정값이란 미리 복수의 변환 계수를 설정해 두고, 음성 신호의 부호화 결과(음질)에 따라 변환 계수를 전환하는 것을 의미하고 있다. 즉, 고정값의 변환 계수 세트를 복수 종류 가지고 있어, 양자화시에 최적의 것을 1개 선택해서 사용한다.
이하, 본 실시예에 대해, 첨부 도면을 참조해서 구체적으로 설명한다.
본 발명의 실시예 2에 따른 스케일러블 부호화 장치의 기본적 구성은 실시예 1에 따른 스케일러블 부호화 장치와 동일하다. 따라서, 본 실시예에 따른 스케일러블 부호화 장치의 상세한 설명은 생략하고, 다른 구성인 변환 계수 산출부(109a) 및 광대역 LSP 부호화부(107a)에 대해 이하에서 상세하게 설명한다. 또한, 동일한 구성 요소에는 동일한 부호를 붙이며, 그 설명을 생략한다.
도 9는 변환 계수 산출부(109a) 내부의 주요한 구성을 나타내는 블록도이다.
이 변환 계수 산출부(109a)는 리미터(134) 대신에, 모드 판정부(201), 계수 테이블(202), 및 전환 스위치(203)를 구비한다. 변환 계수 산출부(109a)는 산출한 변환 계수와, 계수 테이블에 미리 보존되어 있는 변환 계수를, 모드 판정부(201)의 모드 판정 결과에 따라 전환하여 사용한다.
모드 판정부(201)는 협대역 LSP 부호화부(103)로부터 입력된 협대역의 양자화 LSP와, 지연기(131)의 출력인 1 처리 단위 시간만큼 전에 양자화된 협대역 LSP의 거리(변화량)를 계산하고, 계산한 거리에 기초하여, 정상 모드인지 비정상 모드인지를 판정한다. 예를 들면, 계산한 거리가 미리 설정한 임계값 이하인 경우는 정상 모드, 임계값을 초과한 경우는 비정상 모드라고 판정한다. 판정 결과는 광대 역 LSP 부호화부(107a) 및 전환 스위치(203)로 출력된다. 또한, 계산한 거리는 그대로 임계값 판정에 이용해도, 프레임간에서 평활화한 뒤 임계값 판정에 이용해도 된다.
전환 스위치(203)는 모드 판정부(201)의 판정 결과가 정상 모드였던 경우, 평활화부(135)로부터 출력되는 변환 계수를 광대역 LSP 부호화부(107a)로 출력하고 한편, 모드 판정부(201)의 판정 결과가 비정상 모드였던 경우, 계수 테이블에 격납되어 있는 변환 계수를 광대역 LSP 부호화부(107a)로 출력하도록 전환된다.
LSP 파라미터가 정상적인 값을 나타낼 경우는 현프레임의 광대역/ 협대역의 LSP 파라미터 비(比)와 전 프레임의 광대역/협대역의 양자화 LSP 파라미터의 비가 가까워지므로, (식 2)를 이용한 양자화를 적용함으로써, 협대역 LSP 파라미터로부터 광대역 LSP 파라미터를 예측할 때의 예측 정밀도를 향상시켜, 양자화 성능을 개선시킨다.
도 10은 상기의 광대역 LSP 부호화부(107a) 내부의 주요한 구성을 나타내는 블록도이다.
LSP 코드북과 보정 계수 코드북이 각각 모드수만큼(여기에서는 2개)의 서브 코드북으로 구성되어 있고(LSP 코드북 222-1, 222-2, 보정 계수 코드북 223-1, 223-2), 모드 판정부(201)로부터 입력되는 모드 정보에 기초하여, 전환 스위치(224, 225)가 각각 서브 코드북의 1개를 선택하는 구성으로 되어 있다.
본 발명의 실시예 2에 따른 스케일러블 복호화 장치의 기본적 구성도, 실시예 1에 따른 스케일러블 복호화 장치와 동일하다. 따라서, 상세한 설명은 생략하 고, 다른 구성인 변환 계수 산출부(155a) 및 광대역 LSP 복호화부(156a)에 대해 이하에서 설명한다. 또한, 동일한 구성 요소에는 동일한 부호를 붙이며 그 설명을 생략한다.
변환 계수 산출부(155a)의 내부 구성은 도 9에 나타낸 변환 계수 산출부(109a)와 기본적으로 동일하다. 따라서 상세한 설명은 생략하지만, 지연기(131)로의 입력은 협대역 LSP 복호화부(153)로, 지연기(132)로의 입력은 광대역 LSP 복호화부(156a)로, 평활화부(135)의 출력은 광대역 LSP 복호화부(156a)로 이루어지는 점은 도 9에 나타낸 변환 계수 산출부(109a)와 다르다. 또한, 모드 판정부의 번호는 부호화측의 모드 판정부(201)와 구별하기 위해 편의상 251로 한다.
도 11은 상기의 광대역 LSP 복호화부(156a)내부의 주요한 구성을 나타내는 블록도이다.
LSP 코드북과 보정 계수 코드북이 각각 모드 수만큼(여기에서는 2개)의 서브 코드북으로 구성되어 있고(LSP 코드북 262-1, 262-2, 보정 계수 코드북 263-1, 263-2), 모드 판정부(251)로부터 입력되는 모드 정보에 기초하여, 전환 스위치(264, 265)가 각각 서브 코드북의 1개를 선택하는 구성으로 되어 있다.
이와 같이, 본 실시예에 의하면, 입력된 미양자화의 광대역 LSP 또는 현프레임으로 양자화된 협대역 LSP의 정상성을 판정하고, 정상적이라(프레임간의 변동이 작음)고 판정된 경우만 선택적으로 상기 산출된 변환 계수를 이용하고, 비정상(프레임간의 변동이 큼)이라고 판정된 경우에는 별도 테이블에 격납된 변환 계수를 이용한다. 환언하면, 산출된 변환 계수와 미리 설계해서 테이블에 격납시켜 둔 변환 계수를 LSP 파라미터의 정상성에 기초하여 전환한다.
상기의 구성을 취함으로써, 협대역 LSP로부터 광대역 LSP를 예측할 때의 예측 정밀도를 향상시킬 수 있다. 또한, LSP 파라미터의 변동을 부호화 후의 양자화 LSP 파라미터를 이용하여 판단하므로, 복호측은 부호화측으로부터 모드 정보가 송신되지 않아도 LSP 파라미터의 변동을 판단할 수 있다. 부호화측으로부터 모드 정보를 송신할 필요도 없어지므로, 통신 시스템의 리소스를 소비하는 일도 없다.
(실시예 3)
실시예 2에서는 협대역의 양자화 LSP 파라미터의 변화를 관측하여, LSP 파라미터의 변동 유무를 판단(모드 판정)하고 있다. 그러나, 협대역의 양자화 LSP 파라미터가 변동 상태가 아닌 경우에도, 광대역의 양자화 LSP 파라미터 쪽은 변동해 있는 경우가 있다.
또한, 복호화측에서는 과거의 모드 판정 결과에 기초하여 현프레임의 복호화를 행하므로, 실시예 2의 방법에서는 과거의 모드 판정이 잘못되었으면, 그 오류가 나중의 처리로 전파된다.
그래서, 본 실시예에서는 부호화측은 광대역 LSP 파라미터를 이용하여 모드 판정을 행하는 모드 판정부를 새로이 설치하고, 얻어지는 모드 판정 결과를 복호화측에 송신한다. 복호화측은 이 모드 판정 결과를 복호화하는 모드 복호부를 새로이 설치한다.
이하, 본 실시예에 대해, 첨부 도면을 참조해서 구체적으로 설명한다.
도 12는 본 발명의 실시예 3에 따른 스케일러블 부호화 장치의 주요한 구성을 나타내는 블록도이다. 또한, 이 스케일러블 부호화 장치는 실시예 1에 나타낸 스케일러블 부호화 장치(도 4 참조)와 동일한 기본적 구성을 가지고 있고, 동일한 구성 요소에는 동일한 부호를 붙이며, 그 설명을 생략한다.
모드 판정부(301)는 기본적으로는 실시예 2에 나타낸 모드 판정부(201) (251)와 동일한 동작을 한다. 즉, 1 처리 단위 시간 지연된 LSP 파라미터와 현재의 LSP 파라미터의 거리를 계산하여, 이 거리가 미리 설정해 둔 임계값 이하일 경우는 정상 모드로, 임계값을 초과한 경우는 비정상 모드로 판정한다. 그러나, 입력 정보로서 이용하는 것은 LSP 분석부(광대역용)(106)로부터 출력되는 광대역 LSP 파라미터인 점이 실시예 2와 다르다. 모드 판정부(301)의 판정 결과는 변환 계수 산출부(109b)와 광대역 LSP 부호화부(107a)로 출력되고, 모드 정보의 부호화 정보는 다중화부(112)로 출력된다. 또한, 광대역 LSP 부호화부(107a)는 실시예 2에서 이미 설명한 것이다.
이와 같이, 모드 판정부(301)는 부호화 끝난 정보(양자화 LSP 파라미터)가 아니라, 광대역 LSP 파라미터를 이용해서 정상/비정상을 판정하므로, 광대역 신호의 고역부에만 변동이 큰 신호에도 대응이 가능하게 된다.
또한, 모드 판정부(301)는 얻어지는 모드 결과를 다른 부호화 파라미터와 함께 다중화해서 복호화측에 송신하고 있다. 이와 같이, 모드 정보를 복호화 측에 전송하므로, 복호화측에서 모드 정보의 판정을 한 번 잘못하더라도, 후속 프레임에서는 다음 모드 정보가 송신되어 오므로, 앞 프레임의 판정 오류의 영향이 전파되 지 않아서, 전송로 오류 내성이 개선된다.
도 13은 변환 계수 산출부(109b) 내부의 주요한 구성을 나타내는 블록도이다. 또한, 이 변환 계수 산출부(109b)는 실시예 2의 도 9에 나타낸 변환 계수 산출부(109a)와 동일한 기본적 구성을 가지고 있어서, 다른 점만을 아래에서 설명한다.
변환 계수 산출부(109b)는 모드 판정부를 내부에 구비하지 않고, 모드 판정 결과만을 외부로부터 입력한다. 그리고, 변환 계수 산출부(109b)는 입력되는 모드 판정 결과에 따라 전환 스위치를 전환한다. 구체적으로는 정상 모드일 때는 평활화부(135)로부터 출력되는 변환 계수가 광대역 LSP 부호화부(107a)로 출력되도록 전환 스위치(203)가 전환된다. 비정상 모드일 때는 미리 오프 라인 학습 등에 의해 설계된 변환 계수를 계수 테이블(202)로부터 광대역 LSP 부호화부(107a)로 출력되도록 전환 스위치(203)가 전환된다.
도 14는 본 발명의 실시예 3에 따른 스케일러블 복호화 장치의 주요한 구성을 나타내는 블록도이다.
이 스케일러블 복호화 장치도, 실시예 1에 나타낸 스케일러블 복호화 장치(도 7 참조)와 동일한 기본적 구성을 가지고 있고, 동일한 구성 요소에는 동일한 부호를 붙이며, 그 설명을 생략한다. 실시예 1에 나타낸 스케일러블 복호화 장치와 다른 점은 모드 복호부(351)를 새롭게 가지고, 본 실시예에 따른 스케일러블 부호화 장치의 모드 판정부(301)의 출력 정보를 복호하여, 복호 정보를 변환 계수 산출부(155b) 및 광대역 LSP 복호화부(156a)로 출력하는 점이다. 또한, 변환 계수 산출부(155b)도 부호화측의 변환 계수 산출부(109b)(도 13 참조)와 동일한 기본적 구성을 가지고 있다.
또한, 본 실시예에서는 LSP 파라미터의 시간적 변화에 기초하여 모드 판정을 행하는 경우를 설명했지만, 변환 계수의 변환 이득에 기초하여 모드 판정을 행해도 된다. 이 변환 계수의 변환 이득은 앞 프레임의「광대역 양자화 LSP/협대역 양자화 LSP」비(比)와 현 프레임의「입력 광대역 LSP/협대역 양자화 LSP」비가 얼마나 가까운가를 나타내고 있다.
(실시예 4)
본 실시예의 특징은 모드 정보를 부호화측이 복호화 측에 송신하지 않고, 모드 판정을 부호화측의 협대역 LSP 부호화부 또는 복호측의 협대역 LSP 부호화부의 내부에서 행하는 것이다.
도 15는 본 발명의 실시예 4에 따른 스케일러블 부호화 장치의 주요한 구성을 나타내는 블록도이다. 또한, 이 스케일러블 부호화 장치는 실시예 3에 나타낸 스케일러블 부호화 장치(도 12 참조)와 동일한 기본적 구성을 가지고 있고, 동일한 구성 요소에는 동일한 부호를 붙여서 그 설명을 생략한다.
본 실시예에 따른 스케일러블 부호화 장치는 협대역 LSP 부호화부(103c)가 멀티 모드 부호화를 행하고 있으며, 그 모드 정보(S41)를 이용하여 변환 계수 산출부(109b)의 모드 전환 및 광대역 LSP 부호화부(107a)의 모드 전환이 행해진다.
협대역 LSP 부호화 부가 LSP의 정상성으로 모드 전환을 행하는 기술로서는 예를 들면 T. Eriksson, J. Linden, and J. Skoglund, "Exploiting interframe correlation in spectral quantization A study of different memory VQ schemes, "Proc. IEEE ICASSP-96, pp.765-768, 1996 등에 기재가 있다. 이 문헌에서는 프레임간 상관이 강한(정상성이 높음) 프레임과 그렇지 않은 프레임 모두에 대응하기 위해서, 프레임간 예측을 이용하는 모드와 그렇지 않은 모드를 전환하는 「Safty-net VQ」라는 수법을 제안하고 있다. 이러한 양자화기를 협대역 LSP 부호화부에 이용하면, 그 모드 정보를 광대역 LSP 부호화부·변환 계수 산출부의 모드 변환 정보로서 이용하는 것이 가능하다.
도 16은 본 발명의 실시예 4에 따른 스케일러블 복호화 장치의 주요한 구성을 나타내는 블록도이다. 또한, 이 스케일러블 복호화 장치도, 실시예 3에 나타낸 스케일러블 복호화 장치(도 14 참조)와 동일한 기본적 구성을 가지고 있고, 동일한 구성 요소에는 동일한 부호를 붙이며, 그 설명을 생략한다.
본 실시예에 따른 스케일러블 복호화 장치에서는 협대역 LSP 복호화부(153c)에 모드정보 복호기능이 구비되어 있다. 즉, 협대역 LSP 복호화부(153c)가, 멀티 모드의 복호화를 행하고 있으며, 그 모드 정보(S42)를 변환 계수 산출부(155b) 및 광대역 LSP 복호화부(156a)로 출력한다. 변환 계수 산출부(155b) 및 광대역 LSP 복호화부(156a)에서는 협대역 LSP 복호화부(153c)로부터 입력된 모드 정보(S42)를 이용해서 모드 전환을 행한다.
이와 같이, 본 실시예에 의하면, 협대역 LSP 부호화 정보의 모드 정보를 이용해서 광대역 LSP 부호화의 모드를 전환하므로, 추가 비트없이, 광대역 LSP 부호 화부, 광대역 LSP 복호화부, 또는 변환 계수부의 모드 전환을 행할 수 있다. 또한, 모드 정보가 전송되기 때문에, 전송로 오류가 있었던 경우에도 오류의 영향이 후속 프레임으로 전파되는 일을 방지할 수 있다.
(실시예 5)
실시예 3에서는, 모드 판정은 LSP의 양자화에 앞서 행해져, 이 모드 판정 결과에 기초하여 탐색하는 코드북을 바꾸고 있다. 즉, 모드 판정은 양자화 전에 개방 루프(open loop)로 행해지기 때문에, 반드시 양자화 오차를 최소로 하는 모드가 선택된다고는 할 수 없다. 예를 들면, 실시예 3의 모드 판정은 양자화 전의 LSP 파라미터에 기초하여 행해지고 있지만, 양자화 전의 LSP 파라미터가 변동했다고 해서 반드시, 양자화 후의 LSP 파라미터도 변동한다고는 할 수 없고, 양자화 전의 LSP 파라미터가 정상적이라고 해서 반드시, 양자화 후의 LSP 파라미터가 정상적이라고도 할 수 없다. 또한, 일부 차수의 LSP 파라미터가 정상이라 하더라도, 나머지 차수의 LSP 파라미터가 비정상이면, 전(全)차수에서 변화를 본 경우에는 정상이라고 판정되는 일도 있다. 이와 같이, 개방 루프로 모드 판정을 행할 경우는 확실히 양자화 오차를 최소로 하는 모드를 선택하는 것이 어렵다.
그래서, 본 실시예에서는 개방 루프로 모드를 판정하는 것이 아니라, 폐루프(closed loop)로 모드 판정을 행한다. 즉, 정상 모드/비정상 모드에 대해, 2 이상의 모드가 있는 경우는 전부의 모드에 대해 코드북 탐색을 실제로 행해 보고, 이 결과에 기초하여 양자화 오차(양자화 왜곡)를 최소로 하는 모드를 선택한다. 더 바꾸어 말하면, 광대역 LSP 부호화부에 있어서, 변환 계수를 구하여 광대역 LSP를 양자화하는 모드와, 미리 정해 둔 고정 변환 계수를 이용해서 광대역 LSP를 양자화하는 모드 양쪽의 모드를 이용해서 양자화를 실제로 행하고, 양자화 오차가 작아지는 쪽 모드로 양자화한 결과를 최종적인 양자화 결과로서 선택한다.
이하, 본 실시예에 대해, 첨부 도면을 참조해 구체적으로 설명한다.
도 17은 본 발명의 실시예 5에 따른 광대역 LSP 부호화부(107d)의 주요한 구성을 나타내는 블록도이다. 또한, 이 광대역 LSP 부호화부(107d)는 실시예 2에 나타낸 광대역 LSP 부호화부(107a)(도 10 참조)와 동일한 기본적 구성을 가지고 있으며, 동일한 구성 요소에는 동일한 부호를 붙이며, 그 설명을 생략한다.
오차 최소화부(121d)는 모든 모드의 코드북 탐색을 행하고, 모든 모드의 코드북 중에서 양자화 오차를 최소로 하는 LSP 벡터 및 보정 계수 벡터를, LSP 코드북(222-1, 222-2), 보정 계수 코드북(223-1, 223-2) 각각 중에서 선택해서 대응하는 인덱스를 부호화하여 다중화부(112)로 출력한다(S11). 이 때, 선택된 LSP 벡터 및 보정 계수 벡터가 생성되는 모드 정보(어느 모드의 코드북으로부터 선택되었는지를 나타내는 정보) S51도 다중화부(112)로 출력된다.
도 18은 본 발명의 실시예 5에 따른 변환 계수 산출부(109d)의 주요한 구성을 나타내는 블록도이다. 또한, 이 변환 계수 산출부(109d)는 실시예 2에 나타낸 변환 계수 산출부(109a)(도 9 참조)와 동일한 기본적 구성을 가지고 있으며, 동일한 구성 요소에는 동일한 부호를 붙이며, 그 설명을 생략한다.
변환 계수 산출부(109d)는 광대역 LSP 부호화부(107d) 내의 오차 최소화 부(121d)로부터 출력되는 제어 신호 C51에 의해, 사용하는 예측 계수를 바꾼다. 즉, 변환 계수 산출부(109d)는 제어 신호 C51에 의해 양자화 LSP를 (식 2)로 나타낼 지 (식 3)으로 나타낼 지를 전환한다.
이와 같이, 변환 계수 산출부(109d)는 실제로 양자화를 행해 보고, 이 양자화 결과에 기초하여, (식 3)을 이용한 양자화를 행할지 말지를 결정한다. 따라서, (식 3)의 양자화에 의해 확실하게 성능이 좋아질 것으로 기대되는 프레임에 대해서만 (식 3)을 이용하는 모드가 선택되므로, 높은 예측 성능을 얻을 수 있다.
또한, 본 실시예에 의하면, 앞 프레임의 광대역/협대역의 양자화 LSP 파라미터 비(比)와 현프레임의 광대역/협대역의 LSP 파라미터 비가 가까운 프레임에 대해서만, (식 3)에 의한 양자화가 행해지게 된다. 즉, 광대역/협대역 LSP 파라미터가 정상이라고 판단되는 프레임에 대해서가 아니라, 광대역/협대역 LSP 파라미터 비가 정상이라고 판단되는 프레임에 대해서 (식 3)에 의한 양자화가 행해진다. 따라서, 오류 내성을 향상시킬 수가 있다. 왜냐하면, 본 실시예에 의하면, (식 3)에 의한 양자화 모드가 계속 선택되는 구간에 있어서는 광대역/협대역의 양자화 LSP 파라미터 비가 정상인 것이 거의 보장된다. 따라서, 예를 들면, 직전의 프레임이 잘못된 경우, 2 프레임 이전, 혹은 더욱 더 이전의 프레임의 광대역/협대역의 양자화 LSP 파라미터 비를 이용해서 근사를 행하는 것이 가능하기 때문이다. 한편, LSP 파라미터가 정상인지 아닌지에 따라 모드 판정을 행하는 경우, LSP 파라미터가 정상이더라도 반드시 광대역/협대역의 양자화 LSP 파라미터 비가 정상이라고는 할 수 없다. 따라서, 직전의 프레임이 잘못된 경우, 이 프레임 대신에, 정상이 아닐 가능 성이 있는 2 프레임 전의 광대역/협대역의 양자화 LSP 파라미터 비를 근사치로서 이용해 버릴 우려가 있다. 이 때, 오류가 없는 경우의 복호 결과와는 크게 다른 복호 결과를 얻게 되어 버리게 된다.
또한, 본 실시예에 의하면, 직전의 프레임이 잘못된 경우, (식 2)에 의한 모드가 선택되게 된다. 따라서, 이 단계에서 예측 부호화가 리셋(reset)되게 되므로, 오류가 후속 프레임으로 전파된는 것을 방지할 수 있어, 오류 내성이 보다 높아진다.
도 19는 상기의 광대역 LSP 부호화부(107d) 및 변환 계수 산출부(109d)를 구비한, 본 발명의 실시예 5에 따른 스케일러블 부호화 장치의 주요한 구성을 나타내는 블록도이다. 광대역 LSP 부호화부(107d)로부터 출력되는 신호(S11, S51)가 실시예 1~4에서 나타낸 스케일러블 부호화 장치와 다르다.
본 실시예에 따른 스케일러블 복호화 장치의 구성은 실시예 3에 나타낸 스케일러블 복호화 장치(도 14 참조)와 동일하므로, 설명을 생략한다.
이상에서, 본 실시예에 관한 스케일러블 부호화 장치 및 스케일러블 복호화 장치에 대해 설명했다.
(실시예 6)
실시예 1~5에 따른 발명은 앞 프레임의 양자화 결과를 적극적으로 이용해서 현 프레임의 예측을 행하기 때문에, 양자화 성능을 높일 수 있다. 따라서, 전송로 오류가 없는 또는 거의 없는 애플리케이션에 특히 효과적이다. 그러나, 실시예 1~5에서는 전송로 오류가 발생하면, 후속 프레임에 오류가 비교적 장시간 전파할 가능성이 있다. 구체적으로는 실시예 1~5에서는 과거의 협대역 양자화 LSP와 광대역 양자화 LSP의 관계를 이용해서 현재의 협대역 양자화 LSP로부터 광대역 양자화 LSP를 예측하기 때문에, 전송로 오류가 발생했을 경우, 부호화 장치와 복호화 장치에서 다른 양자화 결과가 생성될 가능성이 있다. 이러한 경우, 복호화 장치에서는 후속 프레임에 있어서의 예측이 정상적으로 행해지지 않게 되기 때문에, 후속 프레임에 오류가 전파한다. 다만, 실시예 2~5에 있어서 이러한 오류 전파가 생기는 것은 과거의 양자화 LSP를 이용한 예측을 이용하는 모드가 연속하고 또한, 이 연속하는 프레임에 있어서 전송로 오류가 발생했을 경우로 한정된다.
이러한 경우의 개선 수법으로서 과거의 양자화 결과에 의존하는 예측에 「망각 요소(忘却要素)」를 집어넣는 수법이 알려져 있다(예를 들면, Allen Gersho, Robert M. Gray저(著), 후루이, 타사키, 코데라, 와타나베 공역, 「벡터 양자화와 정보 압축」, 제 16장, 698페이지~, 소절 「이득 적응 VQ에 있어서의 전송 오류」, 코로나 사, 1998년 11월 10일 발행을 참조). 이 망각 요소를 집어넣는 수법에 의하면, 과거의 양자화 결과에 의존하는 예측(적응 예측 모드 성분)과 과거의 양자화 결과에 의존하지 않는 예측(고정 예측 모드 성분)과의 합을 이용해서 현재의 협대역 양자화 LSP로부터 현재의 광대역 양자화 LSP를 예측한다. 따라서, 적응 예측 모드 성분과 고정 예측 모드 성분의 비율을 최적화함으로써, 서로 트레이드 오프(Trade-off) 관계에 있는 적응 예측 모드 성분에 유래하는 양자화 성능 개선 효과와, 고정 예측 모드 성분에 유래하는 오류 내성 열화 억제 효과의 조화를 꾀할 수 있다.
본 발명의 실시예 6에서는 실시예 5에 있어서 상기 망각 요소를 집어넣는 수법을 적용함으로써, 전송로 오류가 발생한 경우에서도, 전송로 오류의 영향을 경감시킨다. 즉, 현프레임의 광대역 양자화 LSP의 산출에 있어서, 앞 프레임의 양자화 결과를 이용한 적응 예측 모드 성분과, 과거의 프레임의 양자화 결과를 이용하지 않는 고정 예측 모드 성분(고정값)을 조합하여 이용한다. 이에 의해, 적응 예측 모드의 프레임에서 전송로 오류가 발생한 경우에서도, 고정값 사용에 의해 적응 예측 성분을 시간의 경과와 함께 망각시켜, 부호화 장치와 복호화 장치의 내부 상태가 시간의 경과와 함께 가까워지도록 할 수가 있어, 전송로 오류의 영향이 경감시킨다. 또한, 본 실시예에서는 고정 예측만을 행하는 모드를 구비하므로, 고정 예측 모드로 전환된 프레임에 있어서 부호화 장치 및 복호화 장치의 내부 상태가 같이 리셋되어, 전송로 오류 영향의 후속 프레임에 대한 전파가 회피되어, 오류 내성이 개선된다.
도 20은 본 실시예에 따른 광대역 LSP 부호화부(107e)의 주요한 구성을 나타내는 블록도이다. 또한, 도 21은 본 실시예에 따른 변환 계수 산출부(109e)의 주요한 구성을 나타내는 블록도이다. 또한, 이 광대역 LSP 부호화부(107e) 및 변환 계수 산출부(109e)는 실시예 5에 있어서, 광대역 LSP 부호화부(107d)(도 17 참조) 및 변환 계수 산출부(109d)(도 18 참조) 대신에 사용되는 것이다. 따라서, 본 실시예에서는 스케일러블 부호화 장치 및 스케일러블 복호화 장치에 대해, 광대역 LSP 부호화부(107e)와 변환 계수 산출부(109e)에 한하여 설명한다. 또한, 본 실시 예에서는 광대역 LSP 부호화부(107e) 및 변환 계수 산출부(109e)의 구성 요소에 대해, 광대역 LSP 부호화부(107d) 및 변환 계수 산출부(109d)의 구성 요소와 동일한 기능을 발휘하는 구성 요소에는 동일한 부호를 붙이며, 그 설명을 생략한다.
광대역 LSP 부호화부(107e)에 있어서, 증폭기(126-1)는 협대역 LSP 부호화부(103)로부터 입력된 LSP 파라미터에, 변환 계수 산출부(109e)에 있어서의 계수 테이블(202-2)로부터 입력된 변환 계수를 곱하고, 그 곱셈 결과를 증폭기(125-1)로 출력한다. 한편, 증폭기(126-2)는 협대역 LSP 부호화부(103)로부터 입력된 LSP 파라미터에 대해서, 정상 모드(적응 예측 모드)의 경우에는 변환 계수 산출부(109e)에 있어서의 평활화부(135)로부터 출력되는 변환 계수를 곱하고, 또 비정상 모드(고정 예측 모드)의 경우에는 계수 테이블(202-1)에 격납되어 있는 변환 계수를 곱하여, 그 곱셈 결과를 증폭기(125-2)로 출력한다. 따라서, 증폭기(126-1, 126-2)가, 본 발명에 있어서의 곱셈 수단을 구성하게 된다.
또한, 광대역 LSP 부호화부(107e)에 있어서, 증폭기(125-1, 125-2)는 각각, 증폭기(126-1, 126-2)로부터 입력되어 오는 광대역 LSP의 벡터, 즉 협대역 양자화 LSP를 변환하여 얻어지는 광대역 LSP의 벡터에 대해서, 보정 계수 코드북(223-1, 223-2)으로부터 출력되는 기정(旣定)의 보정 계수를 곱하고, 그 곱셈 결과를 가산기(128)로 출력한다. 그리고, 가산기(128)는 증폭기(124)와, 증폭기(125-1, 125-2)로부터 출력된 LSP 벡터의 합을 계산하고, 그 가산 결과를 가산기(127)로 출력한다.
이와 같이, 본 실시예에서는 증폭기(126-1) 및 증폭기(125-1, 125-2)가 현프 레임의 협대역 양자화 LSP에 대해서 고정 변환 계수를 항상 곱하게 된다. 즉, 증폭기(126-1, 125-1)를 경유하여 가산기(128)에 입력되는 신호는 협대역 LSP 부호화부(103)로부터 입력되는 협대역 양자화 LSP가, 과거에 발생한 전송로 오류의 영향을 받지 않는 한, 과거에 발생한 전송로 오류의 영향을 받지 않는다. 또한, 고정 예측 모드에서의 예측에서는 증폭기(126-2)도 고정 변환 계수를 상기 협대역 양자화 LSP에 곱하므로, 전후 프레임과의 사이에서 정보의 교환이 행해지지 않아, 과거에 발생한 전송로 오류의 영향이 후속 프레임으로 전파되지 않는다. 그 결과, 본 실시예에 의하면, 전송로 오류가 발생한 경우에도 그 오류의 영향이 후속 프레임에 전파하는 것을 억제해서 오류 내성을 개선할 수 있다.
또한, 본 실시예에서는 변환 계수 산출부(109e)에 2개의 계수 테이블(202-1, 202-2)을 배치하고, 이것에 대응시켜 광대역 LSP 부호화부(107e)에 2개의 증폭기(126-1, 126-2)를 배치하는 경우에 대해 설명했지만, 본 발명은 이 경우로 한정되는 것은 아니며, 한층 더 많은 계수 테이블(202) 및 증폭기(126)를 배치하도록 해도 된다.
또한, 본 실시예에서는 변환 계수 산출부(109e)에 있어서의 계수 테이블(202-1, 202-2)이 각각 별개인 경우에 대해 설명했지만, 본 발명은 이 경우로 한정되는 것은 아니며, 예를 들면 변환 계수 산출부(109e)에 있어서 계수 테이블(202)이 1개 밖에 배치되지 않고, 이 계수 테이블(202)로부터 동일한 변환 계수가 광대역 LSP 부호화부(107e)에 있어서의 2개의 증폭기(126-1, 126-2)에 각각 입력되도록 해도 된다.
또한, 본 실시예에서는 변환 계수 산출부(109e)가 평활화부(135)를 필요로 하는 경우에 대해 설명했지만, 본 발명은 이 경우로 한정되는 것은 아니며, 예를 들면 평활화부(135)를 배치하지 않고, 제산기(133)의 출력을 그대로 전환 스위치(203)에 접속하는 구성으로 해도 된다. 이러한 구성으로 하면, 전환 스위치(203)가 일단 계수 테이블(202-1) 측으로 전환되면, 전송로 오류의 전파를 완전하게 리셋할 수가 있다.
또한, 변환 계수 산출부(109e)가 평활화부(135)를 구비하는 경우라 하더라도, 직전 프레임이 고정 예측 모드인(즉, 전환 스위치(203)가 계수 테이블(202-1) 측에 접속됨) 경우는 (식 4)에 있어서의 K를 0으로 하여, 바꾸어 말하면 Xn(i) = γ(i)로 해서, 현프레임의 협대역 양자화 LSP에 적용되는 변환 계수를 구하도록 하면, 동일하게 전송로 오류의 전파를 완전히 리셋할 수가 있다.
또한, 도 21에 표시한 변환 계수 산출부(109e)는 실시예 3에 나타낸 스케일러블 복호화 장치(도 14 참조)에 있어서의 변환 계수 산출부(155b) 대신에 사용할 수도 있다.
또한, 음성 신호의 주요 성분은 그 저역에 모이는 경향이 있기 때문에, 음성 신호의 저역 성분에 대해 광대역 양자화 LSP를 예측하는 경우는 적응 예측 모드 성분의 구성 비율이 낮아지도록(예를 들면 50%이하가 되도록) 보정 계수를 설계하고, 한편으로 음성 신호의 고역 성분에 대해 광대역 양자화 LSP를 예측하는 경우에는 적응 예측 모드 성분의 구성 비율이 높아지도록(예를 들면 50%이상이 되도록) 보정 계수를 설계하면, 주관적인 품질에 있어서의 오류 내성과 양자화 성능의 조화를 꾀할 수 있다.
(실시예 7)
본 발명의 실시예 7에서는 실시예 6에 있어서, 협대역 양자화 LSP의 오류 감도에 기초하여, 광대역 양자화 LSP의 예측에 있어서의 고정 예측 모드 성분과 적응 예측 모드 성분의 비율을 프레임 별로 적응적으로 결정한다. 즉, 실시예 6에서는 보정 계수 코드북(223-1, 223-2)으로부터 출력되는 보정 계수가 기정값이었지만, 본 실시예에서는 정상 모드인 경우에 선택되는 보정 계수 코드북(223-1)을 현프레임의 협대역 양자화 LSP로부터 산출되는 보정 계수로 차례로 갱신한다.
여기서, LSP의 양자화에 있어서는 스펙트럼의 최고점 부분에 있는 LSP와 최저점 부분에 있는 LSP에 있어서 주관적으로 허용되는 양자화 잡음의 레벨이 다른 점을 이용하기 위해서, 양자화 오차를 산출할 때에 「보정」을 곱한 보정 유클리드 거리로 양자화 오차를 평가하는 수법이 알려져 있다. 이「보정」을 오류 감도에 대응하는 척도로서 이용하면, 프레임 별로 협대역 양자화 LSP로부터 「보정」을 산출하고, 산출한「보정」에 따라 적응적으로 광대역 양자화 LSP의 예측에 있어서의 고정 예측 모드 성분과 적응 예측 모드 성분의 비율을 변화시킬 수가 있다. 그 결과, 트레이드 오프의 관계에 있는 오류 내성과 양자화 성능의 조절을 프레임 별로 꾀할 수 있게 된다.
도 22는 본 실시예에 관계되는 광대역 LSP 부호화부(107f)의 주요한 구성을 나타내는 블록도이다. 또한, 이 광대역 LSP 부호화부(107f)는 실시예 6에 있어서, 광대역 LSP 부호화부(107e:도 20 참조) 대신에 사용되는 것이다. 따라서, 본 실시예에서는 스케일러블 부호화 장치에 대해, 광대역 LSP 부호화부(107f)에 한해서 설명한다. 또한, 본 실시예에서는 광대역 LSP 부호화부(107f)의 구성 요소에 대해, 광대역 LSP 부호화부(107e)의 구성 요소와 같은 기능을 발휘하는 구성 요소에는 동일한 부호를 붙이며, 그 설명을 생략한다.
광대역 LSP 부호화부(107f)는 실시예 6에 나타낸 광대역 LSP 부호화부(107e)에 있어서, 보정 계수 산출기(2201)를 더 구비하는 것이다. 보정 계수 산출기(2201)는 「오류 감도에 따른 보정」을 프레임 별로 행하는 것으로서, 협대역 LSP 부호화부(103)로부터 입력된 협대역 양자화 LSP에 기초하여, 예를 들면 「R. Salami et al, "Design and Description of CS-ACELP: A Toll Quality 8 kb/s Speech Coder, "IEEE Trans. on Speech and Audio Process., vol. 6, no. 2, pp.1(161)30, March 1998.」의 (9) 식이나 「K. K. Paliwal and B. S. Atal, "Efficient Vector Quantization of LPC Parameters at 24 Bits/Frame, " IEEE Trans. on Speech and Audio Process., vol. 1, no. 1, pp.3-14, January 1993.」의 (9) 식에 기재된 보정을 산출하여, 산출한 보정을 이용해서 보정 계수 코드북(223-1)용 보정 계수를 산출한다. 그리고, 보정 계수 산출기(2201)는 프레임 별로 산출한 보정 계수로 보정 계수 코드북(223-1)의 보정 계수 코드북의 내용을 차례로 갱신한다. 또한, 본 실시예에서는 보정 계수 산출기(2201)는 산출한 보정이 큰 만큼(오류 감도가 큰 만큼), 광대역 양자화 LSP의 예측에 있어서의 고정 예측 모드 성분의 비율을 높게 설정하고 (예를 들면 고정 예측 모드 성분의 비율을 50%이상으로 설정하고), 한편으로 그 보정이 작을수록, 양자화 성능이 좋아지도록 학습을 행한다. 그리고, 이 학습에 의해 얻어지는 최적 구성비(일반적으로 적응 예측 모드 성분의 비율이 높아짐)에 가까워지도록, 보정 계수 산출기(2201)는 보정 계수 코드북(223-1)의 내용을 갱신한다.
이와 같이, 본 실시예에 의하면, 보정 계수 산출기(2201)가 현프레임의 협대역 양자화 LSP의 오류 감도에 기초하여 정상 모드에서 선택되는 보정 계수 코드북(223-1)의 내용을 차례로 갱신하기 때문에, 현프레임의 광대역 양자화 LSP의 예측에 있어서의 고정 예측 모드 성분과 적응 예측 모드 성분의 비율을 최적화함으로써, 오류 내성의 열화를 억제하면서 양자화 성능을 최대화할 수 있다. 예를 들면, 보정 계수 산출기(2201)가 광대역 양자화 LSP의 예측에 있어서 고정 예측 모드 성분의 비율을 100%로 한다면, 즉 협대역 양자화 LSP에 고정 변환 계수를 곱하는 증폭기(126-1)에 연결된 증폭기(125-1)의 보정 비율을 100%로 하고 또한, 증폭기(125-2)의 비율을 0%로 하면, 오류 내성을 개선할 수 있다. 한편, 보정 계수 산출기(2201)가 적응 예측 모드 성분의 비율을 100%로 하면, 오류 내성이 열화하는 대신에 양자화 성능을 개선할 수 있다. 또한, 보정 계수 산출기(2201)가, 고정 예측 모드 성분과 적응 예측 모드 성분의 비율을 예를 들면 50%, 50%로 하면, 적응 예측 모드 성분에 유래하는 양자화 성능 개선 효과가 생기며, 이 효과와 함께, 고정 예측 모드 성분에 의해 전송로 오류의 영향이 광대역 LSP 부호화부(107f)에 있어서의 계산 회수에 따라 희박화하기 때문에, 그 전송로 오류의 영향을 후속 프레 임에 전파하기 어렵게 할 수가 있다.
또한, 본 실시예에 의하면, 보정 계수 코드북(223-1)의 내용이 보정 계수 산출기(2201)에 의해 프레임 별로 차례로 갱신되기 때문에, 협대역 양자화 LSP의 오류 감도가 프레임마다 천이하는 경우에도, 서로 트레이드 오프 관계에 있는 적응 예측 모드 성분에 유래하는 양자화 성능 개선 효과와 고정 예측 모드 성분에 유래하는 오류 내성 열화 억제 효과의 조화를 적응적으로 꾀할 수 있다.
또한, 음성 신호의 경우에는 그 고역 성분에 대해 LSP 파라미터가 잘못되더라도 주관 품질에 대한 영향이 비교적 작다는 점에서, 보정 계수 산출기(2201)는 그 저역 성분에 대해 고정 예측 모드 성분의 비율이 높아지도록, 한편으로 그 고역 성분에 대해서 적응 예측 모드 성분의 비율이 높아지도록 보정 계수를 결정하는 것이 바람직하다.
또한, 본 실시예에서는 보정 계수 곱셈기(2201)가 협대역 양자화 LSP의 오류 감도에 기초하여 보정 계수 코드북(223-1)용 보정 계수를 산출하는 경우에 대해 설명했지만, 본 발명은 이 경우로 한정되는 것이 아니며, 예를 들면 보정 계수 곱셈기(2201)가 오프 라인에서의 학습 데이터로부터 보정 계수 코드북(223-1)용 보정 계수를 산출하도록 해도 된다.
이상에서 본 발명의 각 실시예에 대해서 설명했다.
본 발명에 관계되는 스케일러블 부호화 장치 및 스케일러블 복호화 장치는 상기 각 실시예로 한정되지 않으며, 여러 가지로 변경하여 실시할 수 있다. 예를 들면, 각 실시예는 적당하게 조합하여 실시할 수 있다.
본 발명에 관계되는 스케일러블 부호화 장치 및 스케일러블 복호화 장치는 이동 통신 시스템에 있어서의 통신 단말장치 및 기지국 장치에 탑재하는 것도 가능하며, 이에 의해 상기와 같은 작용 효과를 가지는 통신 단말장치 및 기지국 장치를 제공할 수 있다.
또한, 여기서는 LSP 파라미터를 부호화/복호화 하는 경우에 대해서 설명했지만, ISP(Immittance Spectrum Pairs) 파라미터에 대해서도 본 발명은 적용 가능하다.
또한, LSP의 코사인을 취한 것, 즉, LSP를 L(i)로 한 경우의 cos(L(i))를 특히 LSF(Line Spectral Frequency)라고 부르며, LSP와 구별하는 경우도 있지만, 본 명세서에서는 LSF는 LSP의 한 형태이며, LSP에 LSF가 포함되는 것으로서 LSP라는 용어를 사용하고 있다. 즉, LSP를 LSF라고 바꾸어 읽어도 된다.
또한, 여기에서는 1 프레임 이전의 광대역/협대역의 양자화 LSP 파라미터의 비(比)를 현프레임에 있어서의 협대역-광대역 변환 계수로 했지만, 더 과거의 프레임의 광대역/협대역의 양자화 LSP 파라미터의 비를 시계열적으로 이용하여, 현프레임의 광대역/협대역의 양자화 LSP 파라미터의 비를 예측 혹은 외부 삽입적으로 구하고, 구해진 값을 현프레임의 협대역-광대역 변환 계수로서 이용해도 된다.
또한, 여기에서는 모드가 정상 모드/비정상 모드의 2개의 모드로 이루어지는 경우를 예로 들어 설명했지만, 모드는 3개 이상이어도 된다.
또한, 여기에서는 대역 스케일러블 부호화의 레이어가 2개인 경우 즉, 협대역 및 광대역의 2개의 주파수 대역으로 이루어지는 대역 스케일러블 부호화 또는 대역 스케일러블 복호화를 예로 들어 설명했지만, 본 발명은 3개 이상의 주파수 대역(레이어)으로 이루어지는 대역 스케일러블 부호화 또는 대역 스케일러블 복호화에도 적용할 수 있다.
또한, 여기에서는 본 발명을 하드웨어로 구성하는 경우를 예로 들어 설명했지만, 본 발명은 소프트웨어로 실현되는 것도 가능하다. 예를 들면, 본 발명에 관계되는 스케일러블 부호화 방법 또는 스케일러블 복호화 방법의 알고리즘을 프로그램 언어를 이용하여 기술하고, 이 프로그램을 메모리에 기억해 두고 정보 처리 수단을 이용하여 실행시킴으로써, 본 발명의 스케일러블 부호화 장치 또는 스케일러블 복호화 장치와 동일한 기능을 실현할 수 있다.
또한, 상기 각 실시예의 설명에 이용한 각 기능 블록은 전형적으로는 집적회로인 LSI로서 실현된다. 이것들은 개별적으로 1 칩화되어도 되고, 일부 또는 모두를 포함하도록 1칩화되어도 된다.
또한, 여기에서는 LSI로 했지만, 집적도의 차이에 따라 IC, 시스템 LSI, 슈퍼 LSI, 울트라 LSI라고 호칭되는 일도 있다.
또한, 집적 회로화의 수법은 LSI에 한하는 것은 아니며, 전용 회로 또는 범용 프로세서로 실현되어도 된다. LSI 제조 후에, 프로그램하는 것이 가능한 FPGA(Field Programmable Gate Array)나, LSI 내부의 회로 셀의 접속 혹은 설정을 재구성 가능한 리컨피규러블 프로세서를 이용해도 된다.
또한, 반도체 기술의 진보 또는 파생하는 다른 기술에 의해, LSI에 대체되는 집적회로화의 기술이 등장하면, 당연히 그 기술을 이용해서 기능 블록의 집적화를 행해도 된다. 바이오 기술의 적응 등이 가능성으로서 있을 수 있다.
본 명세서는 2004년 4월 27일에 출원한 특허출원 2004-132113 및 2004년 9월 6일에 출원한 특허출원 2004-259036에 기초하고 있는 것이다. 이들의 내용은 모두 여기에 포함시켜 놓는다.
본 발명에 따른 스케일러블 부호화 장치, 스케일러블 복호화 장치, 스케일러블 부호화 방법 및 스케일러블 복호화 방법은 이동 통신 시스템이나 인터넷 프로토콜을 이용한 패킷 통신 시스템 등에 있어서의 통신 장치의 용도에 적용시킬 수 있다.

Claims (18)

  1. 입력 신호로부터, 주파수축 방향으로 스케일러빌리티를 가지는 협대역 및 광대역의 양자화 LSP 파라미터를 생성하는 스케일러블 부호화 장치로서,
    협대역의 입력 신호의 LSP 파라미터를 부호화하여 협대역의 제 1 의 양자화 LSP 파라미터를 생성하는 협대역 부호화 수단과,
    상기 제 1 의 양자화 LSP 파라미터의 주파수 대역을 광대역으로 변환하는 변환 수단과,
    광대역으로 변환한 후의 상기 제 1 의 양자화 LSP 파라미터를 이용해서 광대역의 입력 신호의 LSP 파라미터의 부호화를 행하여 광대역의 제 2 의 양자화 LSP 파라미터를 생성하는 광대역 부호화 수단과,
    과거에 생성된 상기 제 1 및 제 2 의 양자화 LSP 파라미터 사이의 관계에 기초하여 상기 변환 수단에서 사용되는 변환 계수를 산출하는 산출 수단
    을 구비하는 스케일러블 부호화 장치.
  2. 제 1 항에 있어서,
    변환 계수가 소정의 범위 내에 들도록 상기 산출 수단에 의해 산출된 변환 계수에 대해 수정을 행하는 리미터
    를 더 구비하는 스케일러블 부호화 장치.
  3. 제 1 항에 있어서,
    상기 산출 수단에 의해 산출된 변환 계수를 시간적으로 평활화하는 평활화 수단을 더 구비하는
    스케일러블 부호화 장치.
  4. 제 1 항에 있어서,
    상기 산출 수단은 미리 1개 또는 복수의 변환 계수가 보관 유지된 계수 테이블을 구비하고,
    과거에 생성된 상기 제 1 및 제 2 의 양자화 LSP 파라미터 사이의 관계에 기초하여 산출되는 변환 계수와 상기 계수 테이블에 보관 유지된 변환 계수를 상기 입력 신호의 음성 모드에 따라 전환하여 출력하는
    스케일러블 부호화 장치.
  5. 제 4 항에 있어서,
    상기 입력 신호의 음성 모드는
    협대역의 상기 제 1 의 양자화 LSP의 시간적 변화에 기초하여 결정되는
    스케일러블 부호화 장치.
  6. 제 4 항에 있어서,
    상기 입력 신호의 음성 모드는
    광대역의 상기 입력 신호의 LSP 파라미터의 시간적 변화에 기초하여 결정되는
    스케일러블 부호화 장치.
  7. 제 4 항에 있어서,
    상기 입력 신호의 음성 모드는
    상기 변환 계수의 변환 이득에 기초하여 결정되는
    스케일러블 부호화 장치.
  8. 제 4 항에 있어서,
    상기 입력 신호의 음성 모드는
    양자화 오차에 기초하여 폐 루프로 결정되는
    스케일러블 부호화 장치.
  9. 제 4 항에 있어서,
    상기 입력 신호의 음성 모드를 복호화 장치에 송신하는
    스케일러블 부호화 장치.
  10. 제 1 항에 있어서,
    상기 변환 수단으로 얻어지는 상기 제 1 의 양자화 LPS 파라미터를 가산하는 가산 수단을 더 구비하고,
    상기 산출 수단은
    미리 1개 이상의 변환 계수가 보관 유지된 계수 테이블을 구비하고, 과거에 생성된 상기 제 1 및 제 2 의 양자화 LSP 파라미터 사이의 관계에 기초하여 산출되는 변환 계수와 상기 계수 테이블에 보관 유지된 변환 계수를 함께 출력하고,
    상기 변환 수단은
    상기 제 1 의 양자화 LSP 파라미터에 대해서, 상기 산출 수단으로부터 출력되는 적어도 2개의 상기 변환 계수를 개별적으로 곱셈함으로써 상기 제 1 의 양자화 LSP 파라미터의 주파수 대역을 광대역으로 변환하여 광대역으로 변환한 후의 상기 제 1 의 양자화 LSP 파라미터를 적어도 2개 생성하며,
    상기 가산 수단은
    상기 변환 수단에 의해 광대역으로 변환된 적어도 2개의 상기 제 1 의 양자 화 LPS 파라미터를 가산하고,
    상기 광대역 부호화 수단은
    상기 가산 수단에 의한 가산 후의 상기 제 1 의 양자화 LSP 파라미터를 이용하여 광대역의 입력 신호의 LSP 파라미터의 부호화를 행하여, 광대역의 제 2 의 양자화 LSP 파라미터를 생성하는
    스케일러블 부호화 장치.
  11. 제 10 항에 있어서,
    상기 변환 수단에 의해 광대역으로 변환된 적어도 2개의 상기 제 1 의 양자화 LPS 파라미터 각각 대해 소정의 보정 계수를 개별적으로 곱셈하는 곱셈 수단과,
    상기 곱셈 수단에서 사용되는 상기 보정 계수를 산출하는 보정 계수 산출 수단을 더 구비하고,
    상기 가산 수단은
    상기 곱셈 수단에 의해 상기 보정 계수가 곱해진 적어도 2개의 상기 제 1 의 양자화 LSP 파라미터를 가산하고,
    상기 보정 계수 산출 수단은
    상기 제 1 의 양자화 LSP 파라미터의 오류 감도에 기초하여, 상기 곱셈 수단에서 사용되는 상기 보정 계수를 산출하는
    스케일러블 부호화 장치.
  12. 청구항 1에 기재된 스케일러블 부호화 장치를 구비하는 통신 단말장치.
  13. 청구항 1에 기재된 스케일러블 부호화 장치를 구비하는 기지국 장치.
  14. 주파수축 방향으로 스케일러빌리티(scalability)를 가지는 협대역 및 광대역의 양자화 LSP 파라미터를 복호화하는 스케일러블 복호화 장치로서,
    협대역의 양자화 LSP 파라미터를 복호화하여 협대역의 제 1 의 LSP 파라미터를 생성하는 협대역 복호화 수단과,
    상기 제 1 의 LSP 파라미터의 주파수 대역을 광대역으로 변환하는 변환 수단과,
    광대역으로 변환한 후의 상기 제 1 의 LSP 파라미터를 이용해서 광대역의 양자화 LSP 파라미터의 복호화를 행하여 광대역의 제 2 의 LSP 파라미터를 생성하는 광대역 복호화 수단과,
    과거에 생성된 상기 제 1 및 제 2 의 LSP 파라미터 사이의 관계에 기초하여, 상기 변환 수단에서 사용되는 변환 계수를 산출하는 산출 수단
    을 구비하는 스케일러블 복호화 장치.
  15. 청구항 14에 기재된 스케일러블 복호화 장치를 구비하는 통신 단말장치.
  16. 청구항 14에 기재된 스케일러블 복호화 장치를 구비하는 기지국 장치.
  17. 협대역의 입력 신호를 부호화하여 얻어지는 협대역 양자화 LSP 파라미터의 주파수 대역을 광대역으로 변환할 때에, 과거의 협대역 양자화 LSP 파라미터와 이에 대응하는 광대역 양자화 LSP 파라미터의 관계에 기초하여 각 프레임 별로 적응적으로 상기 변환을 행하는
    스케일러블 부호화 방법.
  18. 협대역 양자화 LSP 파라미터를 복호화하여 얻어지는 협대역 LSP 파라미터의 주파수 대역을 광대역으로 변환할 때에, 과거의 협대역 LSP 파라미터와 이에 대응하는 광대역 LSP 파라미터의 관계에 기초하여 각 프레임 별로 적응적으로 상기 변환을 행하는
    스케일러블 복호화 방법.
KR1020067022317A 2004-04-27 2005-04-19 스케일러블 부호화 장치, 스케일러블 복호화 장치 및 그방법 KR20070009644A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2004132113 2004-04-27
JPJP-P-2004-00132113 2004-04-27
JPJP-P-2004-00259036 2004-09-06
JP2004259036 2004-09-06

Publications (1)

Publication Number Publication Date
KR20070009644A true KR20070009644A (ko) 2007-01-18

Family

ID=35394383

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067022317A KR20070009644A (ko) 2004-04-27 2005-04-19 스케일러블 부호화 장치, 스케일러블 복호화 장치 및 그방법

Country Status (8)

Country Link
US (1) US8271272B2 (ko)
EP (1) EP1755109B1 (ko)
JP (1) JP4546464B2 (ko)
KR (1) KR20070009644A (ko)
CN (1) CN1947174B (ko)
BR (1) BRPI0510303A (ko)
RU (1) RU2006137841A (ko)
WO (1) WO2005112005A1 (ko)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8417515B2 (en) 2004-05-14 2013-04-09 Panasonic Corporation Encoding device, decoding device, and method thereof
CN101023472B (zh) * 2004-09-06 2010-06-23 松下电器产业株式会社 可扩展编码装置和可扩展编码方法
EP1949693B1 (en) * 2005-10-12 2012-04-18 Samsung Electronics Co., Ltd. Method and apparatus for processing/transmitting bit-stream, and method and apparatus for receiving/processing bit-stream
WO2008108701A1 (en) * 2007-03-02 2008-09-12 Telefonaktiebolaget Lm Ericsson (Publ) Postfilter for layered codecs
JP5377287B2 (ja) 2007-03-02 2013-12-25 パナソニック株式会社 ポストフィルタ、復号装置およびポストフィルタ処理方法
KR20100006492A (ko) 2008-07-09 2010-01-19 삼성전자주식회사 부호화 방식 결정 방법 및 장치
CA2729752C (en) * 2008-07-10 2018-06-05 Voiceage Corporation Multi-reference lpc filter quantization and inverse quantization device and method
JP4977157B2 (ja) * 2009-03-06 2012-07-18 株式会社エヌ・ティ・ティ・ドコモ 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
JP4977268B2 (ja) * 2011-12-06 2012-07-18 株式会社エヌ・ティ・ティ・ドコモ 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
JP5269195B2 (ja) * 2009-05-29 2013-08-21 日本電信電話株式会社 符号化装置、復号装置、符号化方法、復号方法及びそのプログラム
US8964966B2 (en) * 2010-09-15 2015-02-24 Avaya Inc. Multi-microphone system to support bandpass filtering for analog-to-digital conversions at different data rates
MX2013012301A (es) * 2011-04-21 2013-12-06 Samsung Electronics Co Ltd Aparato para cuantificar coeficientes de codificacion predictiva lineal, aparato de codificacion de sonido, aparato para decuantificar coeficientes de codificacion predictiva lineal, aparato de decodificacion de sonido y dispositivo electronico para los mismos.
TWI672691B (zh) * 2011-04-21 2019-09-21 南韓商三星電子股份有限公司 解碼方法
KR102060208B1 (ko) * 2011-07-29 2019-12-27 디티에스 엘엘씨 적응적 음성 명료도 처리기
EP3279895B1 (en) * 2011-11-02 2019-07-10 Telefonaktiebolaget LM Ericsson (publ) Audio encoding based on an efficient representation of auto-regressive coefficients
EP3611728A1 (en) * 2012-03-21 2020-02-19 Samsung Electronics Co., Ltd. Method and apparatus for high-frequency encoding/decoding for bandwidth extension
US20140307808A1 (en) * 2012-12-14 2014-10-16 Boris Kudryashov Protection against packet loss during transmitting video information
US9514761B2 (en) 2013-04-05 2016-12-06 Dolby International Ab Audio encoder and decoder for interleaved waveform coding
CN104143336B (zh) * 2013-05-29 2015-12-02 腾讯科技(深圳)有限公司 一种获取语音信号的平滑谱的方法和装置
CN105378836B (zh) * 2013-07-18 2019-03-29 日本电信电话株式会社 线性预测分析装置、方法、以及记录介质
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
TR201900472T4 (tr) * 2014-04-24 2019-02-21 Nippon Telegraph & Telephone Frekans alanı parametre dizisi oluşturma metodu, kodlama metodu, kod çözme metodu, frekans alanı parametre dizisi oluşturma aparatı, kodlama aparatı, kod çözme aparatı, programı ve kayıt ortamı.
PL3139382T3 (pl) * 2014-05-01 2019-11-29 Nippon Telegraph & Telephone Urządzenie kodujące sygnał dźwiękowy, sposób kodowania sygnału dźwiękowego, program i nośnik rejestrujący
ES2840349T3 (es) * 2014-05-01 2021-07-06 Nippon Telegraph & Telephone Descodificación de una señal de sonido
CN106486129B (zh) * 2014-06-27 2019-10-25 华为技术有限公司 一种音频编码方法和装置
US10824917B2 (en) 2018-12-03 2020-11-03 Bank Of America Corporation Transformation of electronic documents by low-resolution intelligent up-sampling

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3237089B2 (ja) * 1994-07-28 2001-12-10 株式会社日立製作所 音響信号符号化復号方法
JP2891193B2 (ja) * 1996-08-16 1999-05-17 日本電気株式会社 広帯域音声スペクトル係数量子化装置
TW326070B (en) * 1996-12-19 1998-02-01 Holtek Microelectronics Inc The estimation method of the impulse gain for coding vocoder
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3134817B2 (ja) 1997-07-11 2001-02-13 日本電気株式会社 音声符号化復号装置
KR100910282B1 (ko) * 2000-11-30 2009-08-03 파나소닉 주식회사 Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, 기록 매체, 음성 부호화 장치, 음성 복호화장치, 음성 신호 송신 장치, 및 음성 신호 수신 장치
JP2003241799A (ja) 2002-02-15 2003-08-29 Nippon Telegr & Teleph Corp <Ntt> 音響符号化方法、復号化方法、符号化装置、復号化装置及び符号化プログラム、復号化プログラム
KR100503415B1 (ko) * 2002-12-09 2005-07-22 한국전자통신연구원 대역폭 확장을 이용한 celp 방식 코덱간의 상호부호화 장치 및 그 방법

Also Published As

Publication number Publication date
CN1947174A (zh) 2007-04-11
US8271272B2 (en) 2012-09-18
EP1755109A4 (en) 2008-04-02
RU2006137841A (ru) 2008-05-10
JPWO2005112005A1 (ja) 2008-03-27
WO2005112005A1 (ja) 2005-11-24
EP1755109A1 (en) 2007-02-21
US20070223577A1 (en) 2007-09-27
JP4546464B2 (ja) 2010-09-15
BRPI0510303A (pt) 2007-10-02
EP1755109B1 (en) 2012-08-15
CN1947174B (zh) 2012-03-14

Similar Documents

Publication Publication Date Title
JP4546464B2 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
RU2418324C2 (ru) Поддиапазонный речевой кодекс с многокаскадными таблицами кодирования и избыточным кодированием
KR101344174B1 (ko) 오디오 신호 처리 방법 및 오디오 디코더 장치
EP1791116B1 (en) Scalable voice encoding apparatus, scalable voice decoding apparatus, scalable voice encoding method, scalable voice decoding method, communication terminal apparatus, and base station apparatus
JP7209032B2 (ja) 音声符号化装置および音声符号化方法
JP2006510947A (ja) 可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置
KR20090087920A (ko) 부호화 장치, 복호 장치 및 이들의 방법
JP3254687B2 (ja) 音声符号化方式
JPH10187197A (ja) 音声符号化方法及び該方法を実施する装置
KR101320963B1 (ko) 신호 잡음 제거 방법, 신호 잡음 제거 장치, 및 오디오 디코딩 시스템
US20130268268A1 (en) Encoding of an improvement stage in a hierarchical encoder
Bouzid et al. Switched split vector quantizer applied for encoding the LPC parameters of the 2.4 Kbits/s MELP speech coder
RU2574849C2 (ru) Устройство и способ для кодирования и декодирования аудиосигнала с использованием выровненной части опережающего просмотра
RU2464651C2 (ru) Способ и устройство многоуровневого масштабируемого устойчивого к информационным потерям кодирования речи для сетей с коммутацией пакетов

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid