KR100922702B1 - 음향 신호 부호화 방법 및 장치, 음향 신호 복호화 방법및 장치, 및 기록 매체 - Google Patents

음향 신호 부호화 방법 및 장치, 음향 신호 복호화 방법및 장치, 및 기록 매체 Download PDF

Info

Publication number
KR100922702B1
KR100922702B1 KR1020037002141A KR20037002141A KR100922702B1 KR 100922702 B1 KR100922702 B1 KR 100922702B1 KR 1020037002141 A KR1020037002141 A KR 1020037002141A KR 20037002141 A KR20037002141 A KR 20037002141A KR 100922702 B1 KR100922702 B1 KR 100922702B1
Authority
KR
South Korea
Prior art keywords
signal
time series
tone
residual
encoding
Prior art date
Application number
KR1020037002141A
Other languages
English (en)
Other versions
KR20030022894A (ko
Inventor
츠지미노루
스즈키시로
토요마케이스케
Original Assignee
소니 가부시끼 가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 가부시끼 가이샤 filed Critical 소니 가부시끼 가이샤
Publication of KR20030022894A publication Critical patent/KR20030022894A/ko
Application granted granted Critical
Publication of KR100922702B1 publication Critical patent/KR100922702B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/087Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

음향 신호 부호화 장치(1OO)에 있어서 톤·노이즈 판정부(110)에서는 입력된 음향 시계열 신호가 톤성인지 노이즈성인지의 여부가 판정된다. 톤성인 경우에는, 톤 성분 추출부(121)에서 톤 성분 신호가 추출되고, 그 톤 성분 파라미터가 정규화·양자화부(l22)로 정규화 및 양자화된다. 또한, 음향 시계열 신호로부터 톤 성분 신호를 추출한 잔차 시계열 신호는 스펙트럼 변환부(131)에서 스펙트럼 정보로 변환되고, 이 스펙트럼 정보가 정규화·양자화부(132)에서 정규화 및 양자화된다. 부호열 생성부(140)에서는 양자화된 톤 성분 파라미터와 양자화된 잔차 성분 스펙트럼 정보에 의해 부호열이 생성된다.
Figure R1020037002141
톤, 노이즈, 정규화, 양자화, 스펙트럼

Description

음향 신호 부호화 방법 및 장치, 음향 신호 복호화 방법 및 장치, 및 기록 매체 {Acoustic signal encoding method and apparatus, acoustic signal decoding method and apparatus, and recording medium}
본 발명은 음향 신호를 부호화하여 전송 또는 기록 매체에 기록하고, 복호화측에서 이것을 수신 또는 재생하여 복호화하는 음향 신호 부호화 방법 및 장치, 음향 신호 복호화 방법 및 장치, 및 음향 신호 부호화 프로그램, 음향 신호 복호화 프로그램, 또는 음향 신호 부호화 장치에서 부호화된 부호열이 기록된 기록 매체에 관한 것이다.
디지털 오디오 신호 혹은 음성 신호 등의 고능률 부호화의 수법에는 여러 가지가 있지만, 예를 들면, 시간축 상의 오디오 신호 등을 블록화하지 않고서, 복수의 주파수 대역으로 분할하여 부호화하는 비블록화 주파수 대역 분할 방식인 대역 분할 부호화(SubBand Coding: SBC)나, 시간축 상의 신호를 주파수축 상의 신호로 변환(스펙트럼 변환)하여 복수의 주파수 대역으로 분할하고, 각 대역마다 부호화하는 블록화 주파수 대역 분할 방식, 이른바 변환 부호화를 들 수 있다. 또한, 상술 한 대역 분할 부호화와 변환 부호화를 조합한 고능률 부호화의 수법도 생각되고, 이 경우에는 예를 들면, 상기 대역 분할 부호화로 대역 분할을 한 후, 해당 각 대역마다의 신호를 주파수축 상의 신호로 스펙트럼 변환하고, 이 스펙트럼 변환된 각 대역마다 부호화가 실시된다.
여기서, 상술한 스펙트럼 변환으로서는 예를 들면, 입력된 음향 시계열 신호를 소정 단위 시간의 프레임으로 블록화하고, 해당 블록마다 이산 푸리에 변환(Discrete Fourier Transformation: DFT), 이산 코사인 변환(Discrete Cosine Transformation: DCT), 변형 이산 코사인 변환(Modified Discrete Cosine Transformation: MDCT) 등을 함으로써 시간축을 주파수축으로 변환하는 것이 있다. MDCT에 대해서는 예를 들면 「"Subband/Transform Coding Using FilterBank Designs Based on Time Domain Aliasing Cancellation", J.P.Princen & A.B.Brandley, ICASSP 1987, Univ. of Surrey Royal Melbourne Inst. of Tech. 」등에 언급되어 있다.
이와 같이 필터나 스펙트럼 변환에 의해서 대역마다 분할된 신호를 양자화함으로써, 양자화 잡음이 발생하는 대역을 제어할 수 있고, 마스킹 효과 등의 성질을 이용하여 청각적으로 보다 고능률의 부호화를 행할 수 있다. 또한, 여기서 양자화를 하기 전에, 각 대역마다, 예를 들면 그 대역에서의 신호 성분의 절대치의 최대치로 정규화 하도록 하면, 더욱 고능률의 부호화를 할 수 있다.
주파수 대역 분할된 각 주파수 성분을 양자화하기 위한 주파수 분할폭으로서는 예를 들면 사람의 청각 특성을 고려한 대역 분할이 행해진다. 즉, 고역일수록 대역폭이 넓어지는 일반적으로 임계대역(크리티컬 밴드; critical band)라고 불리고 있는 대역폭으로, 오디오 신호를 예를 들면 32 밴드 처럼 복수의 대역으로 분할하는 것이다. 또한, 이 때의 각 대역마다의 데이터를 부호화할 때는 각 대역마다 소정의 비트 배분(혹은, 비트 얼로케이션, 비트 할당)이나 각 대역마다 적응적인 비트 배분에 의한 부호화가 행해진다. 예를 들면, 상기 MDCT 처리되어 얻어진 계수 데이터를 부호화할 때는 상기 각 블록마다의 MDCT 처리에 의해 얻어지는 각 대역마다, MDCT 계수 데이터에 대하여 적응적인 할당 비트수로 부호화가 행해지게 된다.
그런데, 음향 시계열 신호의 스펙트럼 변환 부호화 및 복호화에 있어서, 특정한 주파수에 스펙트럼이 집중되는 톤성의 음향 신호에 포함되는 잡음은 매우 귀에 들리기 쉽고, 청감 상 커다란 장해가 되는 것은 잘 알려져 있다. 이 때문에, 톤성 성분의 부호화를 위해서는 충분한 비트수로 양자화를 하지 않으면 안되지만, 상술한 바와 같이 소정의 대역마다 양자화 정밀도가 정해지는 경우, 톤성 성분을 포함하는 부호화 유닛 내의 모든 스펙트럼에 대하여 많은 비트 할당을 하게 되어, 부호화 효율이 나빠져 버린다.
그래서, 이 문제를 해결하기 위해서, 예를 들면 국제특허공개공보 WO94/28633이나 일본특허공개공보7-168593호 등에 있어서, 스펙트럼을 톤성 성분과 그 이외의 성분으로 분리하여, 톤성 성분에 대해서만 정밀도 좋게 양자화하는 수법이 제안되어 있다.
이 수법에 있어서는 도 1a에 도시하는 바와 같은 주파수축의 스펙트럼으로부 터, 국소적으로 에너지가 높은 스펙트럼, 즉 톤성 성분(T)을 분리한다. 톤성 성분을 제외한 노이즈성 성분은 도 1b와 같은 스펙트럼이 된다. 그리고, 톤성 성분과 노이즈성 성분의 각각에 대하여, 충분하고도 적절한 정밀도로 양자화가 이루어진다.
그러나, MDCT 등의 스펙트럼 변환의 수법에 있어서는 분석 구간 밖에서는 분석 구간 내의 파형이 주기적으로 반복되고 있다고 가정되어 있고, 그 영향에 의해, 실제로는 존재하지 않는 주파수 성분이 관측되어 버린다. 예를 들면, 어떤 주파수의 정현파가 입력된 경우, 이것을 MDCT 처리에 의해 스펙트럼 변환하였을 때, 스펙트럼은 도 1a 처럼, 원래의 주파수뿐만 아니라, 주위의 주파수로 넓어져 나타난다. 따라서, 이 정현파를 보다 정밀도 좋게 표현하기 위해서는 상기의 수법에 의해 톤성 성분에 대해서만 정밀도 좋게 양자화하려고 한 경우에도, 원래의 1개의 주파수뿐만 아니라, 도 1a에서 도시한 바와 같이, 주파수축 상에서 인접하는 복수의 주파수에 대한 스펙트럼 성분을 충분한 정밀도로 양자화하지 않으면 안 된다. 그 결과, 많은 비트가 필요해져, 부호화 효율은 나빠진다.
본 발명은 상술한 실정을 감안하여 제안되는 것으로, 국소적 주파수에 존재하는 톤 성분에 의해 부호화 효율이 나빠지는 것을 억제하는 음향 신호 부호화 방법 및 그 장치, 음향 신호 복호화 방법 및 그 장치, 및, 음향 신호 부호화 프로그램, 음향 신호 복호화 프로그램, 또는 음향 신호 부호화 장치에서 부호화된 부호열 이 기록된 기록 매체를 제공하는 것을 목적으로 하는 것이다.
본 발명에 따른 음향 신호 부호화 방법은 음향 시계열 신호를 부호화하는 음향 신호 부호화 방법에서, 상기 음향 시계열 신호로부터 톤 성분 신호를 추출하여 부호화하는 톤 성분 부호화 공정과, 상기 톤 성분 부호화 공정에서, 상기 음향 시계열 신호로부터 상기 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화하는 잔차 성분 부호화 공정을 갖는다.
이러한 음향 신호 부호화 방법에서는 음향 시계열 신호로부터 톤 성분 신호를 추출하고, 그 톤 성분 신호와 음향 시계열 신호로부터 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화한다.
또한, 본 발명에 따른 음향 신호 복호화 방법은 음향 시계열 신호로부터 톤 성분 신호를 추출하고, 해당 톤 성분 신호를 부호화하며, 또한, 상기 음향 시계열 신호로부터 상기 톤 성분 신호를 추출한 잔차 신호를 부호화하여 이루어지는 부호열을 입력하고, 해당 부호열을 복호화하는 음향 신호 복호화 방법으로서, 상기 부호열을 분해하는 부호열 분해 공정과, 상기 부호열 분해 공정에서 얻어진 톤 성분 정보에 따라서, 톤 성분 시계열 신호를 복호화하는 톤 성분 복호화 공정과, 상기 부호열 분해 공정에서 얻어진 잔차 성분 정보에 따라서, 잔차 성분 시계열 신호를 복호화하는 잔차 성분 복호화 공정과, 상기 톤 성분 복호화 공정에서 얻어진 톤 성분 시계열 신호와 잔차 성분 복호화 공정에서 얻어진 잔차 성분 시계열 신호를 가산하여 상기 음향 시계열 신호를 복원하는 가산 공정을 갖는다.
이러한 음향 신호 복호화 방법에서는 음향 시계열 신호로부터 톤 성분 신호 를 추출하고, 그 톤 성분 신호와 음향 시계열 신호로부터 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화하여 이루어지는 부호열을 복호화하고, 음향 시계열 신호를 복원한다.
또한, 본 발명에 따른 음향 신호 부호화 방법은 음향 시계열 신호를 부호화하는 음향 신호 부호화 방법에서, 상기 음향 시계열 신호를 복수의 주파수 대역으로 분할하는 주파수 대역 분할 공정과, 적어도 1개의 주파수 대역의 상기 음향 시계열 신호로부터 톤 성분 신호를 추출하여 부호화하는 톤 성분 부호화 공정과, 상기 톤 성분 부호화 공정에서, 적어도 1개의 주파수 대역의 상기 음향 시계열 신호로부터 상기 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화하는 잔차 성분 부호화 공정을 갖는다.
이러한 음향 신호 부호화 방법에서는 복수의 주파수 대역으로 분할된 음향 시계열 신호의 적어도 1개의 주파수 대역에 대하여, 음향 시계열 신호로부터 톤 성분 신호를 추출하고, 그 톤 성분 신호와 음향 시계열 신호로부터 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화한다.
또한, 본 발명에 따른 음향 신호 복호화 방법은 음향 시계열 신호가 복수의 주파수 대역으로 분할되고, 적어도 1개의 주파수 대역에서, 상기 음향 시계열 신호로부터 톤 성분 신호가 추출되어 부호화되고, 또한, 적어도 1개의 주파수 대역의 상기 음향 시계열 신호로부터 상기 톤 성분 신호가 추출된 잔차 시계열 신호가 부호화된 부호열을 입력하며, 해당 부호열을 복호화하는 음향 신호 복호화 방법으로서, 상기 부호열을 분해하는 부호열 분해 공정과, 상기 적어도 1개의 주파수 대역 에 대하여, 상기 부호열 분해 공정에서 얻어진 톤 성분 정보에 따라서 톤 성분 시계열 신호를 합성하는 톤 성분 복호화 공정과, 상기 적어도 1개의 주파수 대역에 대하여, 상기 부호열 분해 공정에서 얻어진 잔차 성분 정보에 따라서 잔차 성분 시계열 신호를 생성하는 잔차 성분 복호화 공정과, 상기 톤 성분 복호화 공정에서 얻어진 톤 성분 시계열 신호와 상기 잔차 성분 부호화 공정에서 얻어진 잔차 성분 시계열 신호를 가산 합성하여 복호화 신호를 얻는 가산 공정과, 각 대역에 대한 복호화 신호를 대역 합성하여 상기 음향 시계열 신호를 복원하는 대역 합성 공정을 갖는다.
이러한 음향 신호 복호화 방법에서는 복수의 주파수 대역으로 분할된 음향 시계열 신호의 적어도 1개의 주파수 대역에 대하여, 음향 시계열 신호로부터 톤 성분 신호를 추출하고, 그 톤 성분 신호와 음향 시계열 신호로부터 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화하여 이루어지는 부호열을 복호화하여, 음향 시계열 신호를 복원한다.
또한, 본 발명에 따른 음향 신호 부호화 방법은 음향 시계열 신호를 부호화하는 음향 신호 부호화 방법에서, 상기 음향 시계열 신호로부터 톤 성분 신호를 추출하고, 해당 톤 성분 신호를 부호화하는 톤 성분 부호화 공정과, 상기 톤 성분 부호화 공정에서 상기 음향 시계열 신호로부터 상기 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화하는 잔차 성분 부호화 공정과, 상기 톤 성분 부호화 공정에서 얻어진 정보와 상기 잔차 성분 부호화 공정에서 얻어진 정보로부터 부호열을 생성하는 부호열 생성 공정을 갖는 제 1 부호화 방법에 의해 상기 음향 시계열 신호를 부호화하는 제 1 음향 신호 부호화 공정과, 제 2 부호화 방법에 의해 상기 음향 시계열 신호를 부호화하는 제 2 음향 신호 부호화 공정과, 상기 제 1 음향 신호 부호화 공정의 부호화 효율과 상기 제 2 음향 신호 부호화 공정의 부호화 효율을 비교하여, 부호화 효율이 좋은 부호열을 선택하는 부호화 효율 판정 공정을 갖는다.
이러한 음향 신호 부호화 방법에서는 음향 시계열 신호로부터 톤 성분 신호를 추출하고, 그 톤 성분 신호와 음향 시계열 신호로부터 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화하여 부호열을 생성하는 제 1 부호화 방법에 의해 상기 음향 시계열 신호를 부호화하는 제 1 음향 신호 부호화 공정과, 제 2 부호화 방법에 의해 상기 음향 시계열 신호를 부호화하는 제 2 음향 신호 부호화 공정의 부호열 중, 부호화 효율이 좋은 부호열을 선택한다.
또한, 본 발명에 따른 음향 신호 복호화 방법은 음향 시계열 신호로부터 톤 성분 신호를 추출하고, 해당 톤 성분 신호를 부호화한 정보와, 상기 음향 시계열 신호로부터 상기 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화한 정보로부터 부호열을 생성하는 제 1 부호화 방법에 의해 상기 음향 시계열 신호를 부호화하는 제 1 음향 신호 부호화 공정과, 제 2 부호화 방법에 의해 상기 음향 시계열 신호를 부호화하는 제 2 음향 신호 부호화 공정 중, 부호화 효율이 좋은 부호열이 선택되어 입력되고, 해당 부호열을 복호화하는 음향 신호 복호화 방법으로서, 상기 제 1 음향 신호 부호화 공정에서 부호화된 부호열을 입력한 경우에는 상기 부호열을 톤 성분 정보와 잔차 성분 정보과 분해하는 부호열 분해 공정과, 상기 부호열 분해 공정에서 얻어진 상기 톤 성분 정보에 따라서, 톤 성분 시계열 신호를 생성하는 톤 성분 복호화 공정과, 상기 부호 분해 공정에서 얻어진 상기 잔차 성분 정보에 따라서, 잔차 성분 시계열 신호를 생성하는 잔차 성분 복호화 공정과, 상기 톤 성분 시계열 신호와 상기 잔차 성분 시계열 신호를 가산 합성하는 가산 공정을 갖는 제 1 음향 신호 복호화 공정에 의해, 상기 음향 시계열 신호를 복원하고, 상기 제 2 음향 신호 부호화 공정에서 부호화된 부호열을 입력한 경우에는 상기 제 2 음향 신호 부호화 공정에 대응하는 제 2 음향 신호 복호화 공정에 의해, 상기 음향 시계열 신호를 복원한다.
이러한 음향 신호 복호화 방법에서는 부호화측에서, 음향 시계열 신호로부터 톤 성분 신호를 추출하고, 그 톤 성분 신호와 음향 시계열 신호로부터 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화하여 부호열을 생성하는 제 1 부호화 방법에 의해 상기 음향 시계열 신호를 부호화하는 제 1 음향 신호 부호화 공정과, 제 2 부호화 방법에 의해 상기 음향 시계열 신호를 부호화하는 제 2 음향 신호 부호화 공정과의 부호열 중, 선택된 부호화 효율이 좋은 부호열을 입력하여, 부호화측에 대응하는 복호화를 실시한다.
또한, 본 발명에 따른 음향 신호 부호화 장치는 음향 시계열 신호를 부호화하는 음향 신호 부호화 장치에서, 상기 시계열 신호로부터 톤 성분 신호를 추출하여 부호화하는 톤 성분 부호화 수단과, 상기 톤 성분 부호화 수단에 의해서 상기 음향 시계열 신호로부터 상기 톤 성분 신호가 추출된 잔차 시계열 신호를 부호화하는 잔차 성분 부호화 수단을 구비하는 것을 특징으로 하고 있다.
이러한 음향 신호 부호화 장치는 음향 시계열 신호로부터 톤 성분 신호를 추 출하고, 그 톤 성분 신호와 음향 시계열 신호로부터 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화한다.
또한, 본 발명에 따른 음향 신호 복호화 장치는 음향 시계열 신호로부터 톤 성분 신호를 추출하고, 해당 톤 성분 신호를 부호화하며, 또한, 상기 음향 시계열 신호로부터 상기 톤 성분 신호를 추출한 잔차 신호를 부호화하여 이루어지는 부호열을 입력하고, 해당 부호열을 복호화하는 음향 신호 복호화 장치로서, 상기 부호열을 분해하는 부호열 분해 수단과, 상기 부호열 분해 수단에 의해서 얻어진 톤 성분 정보에 따라서, 톤 성분 시계열 신호를 복호화하는 톤 성분 복호화 수단과, 상기 부호열 분해 수단에 의해서 얻어진 잔차 성분 정보에 따라서, 잔차 성분 시계열 신호를 복호화하는 잔차 성분 복호화 수단과, 상기 톤 성분 복호화 수단에 의해서 얻어진 톤 성분 시계열 신호와 잔차 성분 복호화 수단에 의해서 얻어진 잔차 성분 시계열 신호를 가산하여 상기 음향 시계열 신호를 복원하는 가산 수단을 구비한다.
이러한 음향 신호 복호화 장치는 음향 시계열 신호로부터 톤 성분 신호를 추출하고, 그 톤 성분 신호와 음향 시계열 신호로부터 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화하여 이루어지는 부호열을 복호화하고, 음향 시계열 신호를 복원한다.
또한, 본 발명에 따른 기록 매체는 음향 시계열 신호를 부호화하는 음향 신호 부호화 프로그램이 기록된 컴퓨터 제어 가능한 기록 매체에 있어서, 상기 음향 신호 부호화 프로그램은 상기 음향 시계열 신호로부터 톤 성분 신호를 추출하여 부호화하는 톤 성분 부호화 공정과, 상기 톤 성분 부호화 공정에서, 상기 음향 시계 열 신호로부터 상기 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화하는 잔차 성분 부호화 공정을 갖는 것을 특징으로 하는 음향 신호 부호화 프로그램이 기록되어 있다.
이러한 기록 매체에는 음향 시계열 신호로부터 톤 성분 신호를 추출하고, 그 톤 성분 신호와 음향 시계열 신호로부터 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화하는 음향 신호 부호화 프로그램이 기록되어 있다.
또한, 본 발명에 따른 기록 매체는 음향 시계열 신호로부터 톤 성분 신호를 추출하고, 해당 톤 성분 신호를 부호화하며, 또한, 상기 음향 시계열 신호로부터 상기 톤 성분 신호를 추출한 잔차 시계열 신호를 복호화하는 음향 신호 복호화 프로그램이 기록된 컴퓨터 제어 가능한 기록 매체로서, 상기 음향 신호 복호화 프로그램은 상기 부호열을 분해하는 부호열 분해 공정과, 상기 부호열 분해 공정에서 얻어진 톤 성분 정보에 따라서, 톤 성분 시계열 신호를 복호하는 톤 성분 복호화 공정과, 상기 부호열 분해 공정에서 얻어진 잔차 성분 정보에 따라서, 잔차 성분 시계열 신호를 복호하는 잔차 성분 복호화 공정과, 상기 톤 성분 복호화 공정에서 얻어진 톤 성분 시계열 신호와 잔차 성분 복호화 공정에서 얻어진 잔차 성분 시계열 신호를 가산하여 상기 음향 시계열 신호를 복원하는 가산 공정을 갖는 것을 특징으로 하는 음향 신호 복호화 프로그램이 기록되어 있다.
이러한 기록 매체에는 음향 시계열 신호로부터 톤 성분 신호를 추출하고, 그 톤 성분 신호와 음향 시계열 신호로부터 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화하여 이루어지는 부호열을 복호화하고, 음향 시계열 신호를 복원하는 음 향 신호 복호화 프로그램이 기록되어 있다.
또한, 본 발명에 따른 기록 매체에는 음향 시계열 신호로부터 톤 성분 신호를 추출하고, 해당 톤 성분 신호를 부호화하며, 또한, 상기 음향 시계열 신호로부터 상기 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화하여 이루어지는 부호열이 기록되어 있다.
본 발명의 또 다른 목적, 본 발명에 의해서 얻어지는 구체적인 이점은 이하에 설명되는 실시예의 설명으로부터 한층 더 분명해질 것이다.
도 1a 및 도 1b는 종래의 톤성 성분의 추출 수법을 설명하는 도면으로, 도 1a는 톤성 성분을 제외하기 전의 스펙트럼을 도시하고, 도 1b는 톤성 성분을 제외한 후의 노이즈성 성분의 스펙트럼을 도시하는 도면.
도 2는 본 실시예에 있어서의 음향 신호 부호화 장치의 구성을 설명하는 도면.
도 3a 내지 도 3c는 추출 시계열 신호를 전후의 프레임과 매끄럽게 연결하는 방법을 설명하는 도면으로, 도 3a는 MDCT에 있어서의 프레임을 도시하고, 도 3b는 톤 성분을 추출하는 구간을 도시하고, 도 3c는 전후의 프레임과의 합성에 사용하는 창 함수를 도시하는 도면.
도 4는 상기 음향 신호 부호화 장치의 톤 성분 부호화부의 구성을 설명하는 도면.
도 5는 양자화 오차를 잔차 시계열 신호에 포함시키는 톤 성분 부호화부의 제 1 구성을 설명하는 도면.
도 6은 양자화 오차를 잔차 시계열 신호에 포함시키는 톤 성분 부호화부의 제 1 구성을 설명하는 도면.
도 7은 추출한 복수의 정현파의 최대 진폭치를 기준으로 정규화 계수를 정하는 예를 설명하는 도면.
도 8은 도 6의 톤 성분 부호화부를 갖는 음향 신호 부호화 장치의 일련의 동작을 도시하는 플로우 차트.
도 9a 및 도 9b는 순음 파형의 파라미터를 설명하는 도면으로, 도 9a는 주파수와 정현파 및 여현파의 진폭을 사용하는 예를 도시하며, 도 9b는 주파수, 진폭 및 위상을 사용하는 예를 도시하는 도면.
도 10은 도 5의 톤 성분 부호화부를 갖는 음향 신호부호화 장치의 일련의 동작을 도시하는 플로우 차트.
도 11은 본 실시예에 있어서의 음향 신호 복호화 장치의 구성을 설명하는 도면.
도 12는 상기 음향 신호 복호화 장치의 톤 성분 복호화부의 구성을 설명하는 도면.
도 13은 상기 음향 신호 복호화 장치의 일련의 동작을 설명하는 플로우 차트.
도 14는 상기 음향 신호 부호화 장치의 잔차 성분 부호화부의 다른 구성예를 설명하는 도면.
도 15는 도 14의 잔차 신호 부호화부에 대응하는 잔차 신호 복호화부의 구성예를 설명하는 도면.
도 16은 상기 음향 신호 부호화 장치 및 상기 음향 신호 복호화 장치의 제 2 구성예를 설명하는 도면.
도 17은 상기 음향 신호 부호화 장치 및 상기 음향 신호 복호화 장치의 제 3 구성예를 설명하는 도면.
이하, 본 발명을 적용한 구체적인 실시예에 관해서, 도면을 참조하면서 상세하게 설명한다.
우선, 본 실시예에 있어서의 음향 신호 부호화 장치의 구성의 일례를 도 2에 도시한다. 도 2에 도시하는 바와 같이, 이 음향 신호 부호화 장치(100)는 톤·노이즈 판정부(110)와, 톤 성분 부호화부(120)와, 잔차 성분 부호화부(130)와, 부호열 생성부(140)와, 시계열 보유부(150)를 구비한다.
톤·노이즈 판정부(110)는 입력한 음향 시계열 신호(S)가 톤성 신호인지 노이즈성 신호인지를 판정하고, 판정 결과에 따라서 톤·노이즈 판정부호(T/N)를 출력하여 후단의 처리를 바꾼다.
톤 성분 부호화부(120)는 톤 성분을 입력 신호로부터 추출하고, 그 톤 성분 신호를 부호화하는 것이며, 톤·노이즈 판정부(110)에 의해 톤성이라고 판단된 입 력 신호로부터 톤 성분 파라미터(N-TP)를 추출하는 톤 성분 추출부(121)와, 톤 성분 추출부(121)에서 얻어진 톤 성분 파라미터(N-TP)를 정규화 및 양자화하고, 양자화된 톤 성분 파라미터(N-QTP)를 출력하는 정규화·양자화부(122)를 갖는다.
잔차 성분 부호화부(130)는 톤·노이즈 판정부(110)에 의해 톤성이라고 판단된 입력 신호로부터 상기 톤 성분 추출부(121)에 있어서 톤 성분 신호를 추출된 잔차 시계열 신호(RS), 혹은 톤·노이즈 판정부(110)에 의해 노이즈성이라고 판단된 입력 신호를 부호화하는 것이며, 이들의 시계열 신호를 예를 들면 변형 이산 코사인 변환(Modified Discrete Cosine Transformation: MDCT) 등에 의해 스펙트럼 정보(NS)로 변환하는 스펙트럼 변환부(131)와, 스펙트럼 변환부(131)에서 얻어진 스펙트럼 정보(NS)를 정규화 및 양자화하여, 양자화된 스펙트럼 정보(QNS)를 출력하는 정규화·양자화부(132)를 갖는다.
부호열 생성부(140)는 톤 성분 부호화부(120) 및 잔차 성분 부호화부(13O)로부터의 정보에 기초하여 부호열(C)을 생성하여 출력한다.
시계열 보유부(150)는 잔차 성분 부호화부(130)로 입력되는 시계열 신호를 보유한다. 이 시계열 보유부(150)에 있어서의 처리에 대해서는 후술한다.
이와 같이, 본 실시예에 있어서의 음향 신호 부호화 장치(100)는 입력한 음향 시계열 신호가 톤성 신호인지 노이즈성 신호인지에 따라서, 프레임마다 후단의 부호화 처리의 수법을 바꾼다. 즉, 톤성 신호에 관해서는 후술하는 바와 같이 일반 조화 해석(Generalized Harmonic Analysis: GHA)의 수법을 사용하여 톤 성분 신호를 추출하여 그 파라미터를 부호화하고, 톤성 신호로부터 톤 성분 신호를 추출한 잔차 신호와 노이즈성 신호에 대해서는 예를 들면 MDCT에 의해 스펙트럼 변환한 후에 부호화한다.
그런데, 일반적으로 스펙트럼 변환에 사용하는 MDCT에서는 도 3a에 도시하는 바와 같이, 그 분석 프레임(부호화 단위)은 전후의 분석 프레임과 1/2 프레임의 오버랩을 요한다. 또한, 톤 성분 부호화 처리에 있어서의 일반 조화 해석의 분석 프레임도 전후의 분석 프레임과 1/2 프레임의 오버랩을 갖게 할 수 있고, 추출 시계열 신호를 전후의 프레임의 추출 시계열 신호와 매끄럽게 연결하는 것이 가능해진다.
그러나, 상술한 바와 같이 MDCT의 분석 프레임에는 1/2 프레임의 오버랩이 있기 때문에, 제 1 프레임의 분석 시에 있어서의 구간(A)의 시계열 신호와, 제 2 프레임 분석 시에 있어서의 구간(A)의 시계열 신호와 달라서는 안 된다. 이 때문에, 잔차 성분 부호화 처리에 있어서는 제 1 프레임을 스펙트럼 변환한 시점에서, 구간(A)에서의 톤 성분 추출을 완료하고 있을 필요가 있고, 이하와 같은 처리를 하는 것이 바람직하다.
우선, 톤 성분 부호화에 있어서, 도 3b에 도시하는 제 2 프레임의 구간에서 일반 조화 해석에 의해 순음 분석을 한다. 그 후, 얻어진 파라미터에 기초하여 파형 추출을 하지만, 그 추출 구간은 제 1 프레임과 겹친 구간으로 한다. 여기서, 제 1 프레임의 구간에서의 일반 조화 해석에 의한 순음 분석은 이미 종료하고 있고, 이 구간에서의 파형 추출은 이 제 1 프레임과 제 2 프레임의 각각에 얻어진 파라미터에 기초하여 행한다. 가령 제 1 프레임이 노이즈성 신호라고 판정되어 있는 경우에는 제 2 프레임에서 얻어진 파라미터만에 기초하여 파형 추출을 한다.
다음에, 각 프레임에 있어서 추출된 추출 시계열 신호를 이하와 같이 하여 합성한다. 즉, 도 3c에 도시하는 바와 같이, 각 프레임에서 분석된 파라미터에 의한 시계열 신호에, 예를 들면 식(1)에 나타내는 하닝(Hanning) 함수와 같은 더하여 1이 되는 창 함수를 곱하고, 제 1 프레임으로부터 제 2 프레임에 걸쳐서 매끄럽게 연결하는 시계열 신호를 합성한다. 또, 식(1)에 있어서, L은 프레임 길이, 즉 부호화 단위의 길이이다.
Figure 112003005091035-pct00001
...(1)
계속해서, 합성된 시계열 신호를 입력 신호로부터 추출한다. 이로써, 제 1 프레임과 제 2 프레임이 겹친 구간(오버랩 구간)에 있어서의 잔차 시계열 신호가 구해지고, 이 잔차 시계열 신호를 제 1 프레임의 후반 1/2 프레임의 잔차 시계열 신호로 한다. 제 1 프레임의 잔차 성분 부호화는 이 잔차 시계열 신호와 이미 보유되어 있는 제 l 프레임의 전반 1/2 프레임의 잔차 시계열 신호에 의해 제 1 프레임의 잔차 시계열 신호를 구성하고, 제 1 프레임에 있어서의 잔차 시계열 신호에 대하여 스펙트럼 변환을 실시하고, 얻어진 스펙트럼 정보를 정규화 및 양자화함으로써 행해진다. 여기서, 제 1 프레임의 톤 성분 정보와 제 1 프레임의 잔차 성분 정보에 의해 부호열을 생성함으로써, 복호 시에 톤 성분의 합성과 잔차 성분의 합성을 동일한 프레임에서 행하는 것이 가능해진다.
또, 제 1 프레임이 노이즈성 신호인 경우에는 제 1 프레임의 톤 성분 파라미 터가 존재하지 않기 때문에, 제 2 프레임에 있어서 추출된 추출 시계열 신호만에 대하여 상술한 창 함수를 곱한다. 얻어진 시계열 신호를 입력 신호로부터 추출하고, 그 잔차 시계열 신호가, 동일하게 제 1 프레임의 후반 1/2 프레임의 잔차 시계열 신호로 된다.
이상과 같이 하여, 불연속점을 가지지 않는 매끄러운 톤 성분 시계열 신호의 추출을 가능하게 하고, 또한, 잔차 성분 부호화에 있어서의 MDCT 스펙트럼 변환으로 프레임간의 부정합이 생기는 것을 방지할 수 있다.
본 실시예에 있어서의 음향 신호 부호화 장치(100)는 상술한 처리를 하기 위해서, 도 2에 도시하는 바와 같이, 잔차 성분 부호화부(130)의 앞에 시계열 보유부(150)를 갖는 구성으로 되어 있다. 이 시계열 보유부(150)는 1/2 프레임마다의 잔차 시계열 신호를 보유하고 있다. 또한, 톤 성분 부호화부(120)는 후술하는 바와 같이, 파라미터 보유부(2115, 2217, 2319)를 갖고, 전프레임에 있어서의 파형 파라미터 및 추출 파형 정보를 출력한다.
도 2에 도시한 톤 성분 부호화부(120)는 구체적으로는 도 4에 도시하는 바와 같은 구성인 것을 들 수 있다. 여기서, 톤 성분 추출에 있어서의 주파수 분석, 톤 성분 합성 및 추출에 있어서, Wiener가 제안한 일반 조화 해석을 응용한다. 이 수법은 분석 블록 내에서 잔차 에너지가 최소가 되는 정현파를 원래의 시계열 신호로부터 추출하고, 그 잔차 신호에 대하여 동일한 조작을 반복한다는 해석 수법이고, 분석창의 영향은 받지 않고, 주파수 성분을 1개씩 시간 영역에서 추출할 수 있다. 또한, 주파수 분해능을 자유롭게 설정할 수 있고, 고속 푸리에 변환(Fast Fourier Transformation: FFT)나 MDCT와 같은 수법과 비교하여, 보다 상세한 주파수 분석이 가능하다.
도 4에 도시하는 톤 성분 부호화부(2100)는 톤 성분 추출부(2110)와 정규화·양자화부(2120)를 갖는다. 이 톤 성분 추출부(2110) 및 정규화·양자화부(2120)는 도 2에 도시하는 톤 성분 추출부(121) 및 정규화·양자화부(122)와 동일한 것이다.
여기서, 톤 성분 부호화부(2100)에 있어서, 순음 분석부(2111)는 입력한 음향 시계열 신호(S)에서 잔차 신호의 에너지가 최소가 되는 순음 성분을 분석하여, 순음 파형 파라미터(TP)를 순음 합성부(2112) 및 파라미터 보유부(2115)에 공급한다.
순음 합성부(2112)는 순음 분석부(2111)에 의해 분석된 순음 성분의 순음 파형 시계열 신호(TS)를 합성하여, 감산기(2113)에 있어서 순음 합성부(2112)로 합성된 순음 파형 시계열 신호(TS)가 입력된 음향 시계열 신호(S)로부터 추출된다.
종료 조건 판정부(2114)는 감산기(2113)에 있어서의 순음 추출에 의해서 얻어진 잔차 신호가 톤 성분 추출의 종료 조건을 만족하는지의 여부의 판정을 하고, 종료 조건을 만족하게 될 때까지, 잔차 신호를 순음 분석부(2111)의 다음의 입력 신호로서 순음 추출을 반복하도록 전환한다. 이 종료 조건에 대해서는 후술한다.
파라미터 보유부(2115)는 현프레임에 있어서의 순음 파형 파라미터(TP)와 전프레임에 있어서의 순음 파형 파라미터(PrevTP)를 보유하고, 전프레임에 있어서의 순음 파형 파라미터(PrevTP)를 정규화·양자화부(2120)에 공급한다. 또한, 현프레 임에 있어서의 순음 파형 파라미터(TP)와 전프레임에 있어서의 순음 파형 파라미터(PrevTP)를 추출 파형 합성부(2116)에 공급한다.
추출 파형 합성부(2116)는 현프레임에 있어서의 순음 파형 파라미터(TP)에 의한 시계열 신호와 전프레임에 있어서의 순음 파형 파라미터(PrevTP)에 의한 시계열 신호를 예를 들면 상술한 하닝 함수를 사용하여 합성하고, 서로 겹친 구간(오버랩 구간)에 있어서의 톤 성분 시계열 신호(N-TS)를 생성한다. 감산기(2117)에서는 톤 성분 시계열 신호(N-TS)가 입력된 음향 시계열 신호(S)로부터 추출되고, 서로 겹치는 구간에서의 잔차 시계열 신호(RS)가 출력된다. 이 잔차 시계열 신호(RS)는 상술한 도 2에 있어서의 시계열 보유부(150)에 공급되어 보유된다.
정규화·양자화부(2120)는 파라미터 보유부(2115)로부터 공급된 전프레임에 있어서의 순음 파형 파라미터(PrevTP)를 정규화 및 양자화하고, 전프레임에 있어서의 양자화된 톤 성분 파라미터(PrevN-QTP)를 출력한다.
그런데, 상술한 도 4의 구성에서는 톤 성분 부호화에 있어서 양자화 오차가 발생한다. 그래서, 이하의 도 5, 도 6에 도시하는 바와 같이, 양자화 오차를 잔차 시계열 신호에 포함시키는 구성을 취하도록 하여도 상관없다.
양자화 오차를 잔차 시계열 신호에 포함시키는 제 1 구성으로서, 도 5에 도시하는 성분 부호화부(2200)는 톤 신호의 정보를 정규화 및 양자화하는 정규화·양자화부(2212)를 톤 성분 추출부(2210)의 속에 갖는다.
여기서, 톤 성분 부호화부(2200)에 있어서, 순음 분석부(2211)는 입력한 음향 시계열 신호(S)로부터 잔차 신호의 에너지가 최소가 되는 순음 성분을 분석하 여, 순음 파형 파라미터(TP)를 정규화·양자화부(2212)에 공급한다.
정규화·양자화부(2212)는 순음 분석부(2211)로부터 공급된 순음 파형 파라미터(TP)를 정규화 및 양자화하고, 양자화된 순음 파형 파라미터(QTP)를 역양자화·역정규화부(2213) 및 파라미터 보유부(2217)에 공급한다.
역양자화·역정규화부(2213)는 양자화된 순음 파형 파라미터(QTP)를 역양자화 및 역정규화하여, 역양자화된 순음 파형 파라미터(TP′)를 순음 합성부(2214) 및 파라미터 보유부(2217)에 공급한다.
순음 합성부(2214)는 역양자화된 순음 파형 파라미터(TP′)에 기초하여 순음성분의 순음 파형 시계열 신호(TS)를 합성하고, 감산기(2215)에 있어서 순음 합성부(2214)에서 합성된 순음 파형 시계열 신호(TS)가 입력된 음향 시계열 신호(S)로부터 추출된다.
종료 조건 판정부(2216)는 감산기(2215)에 있어서의 순음 추출에 의해서 얻어진 잔차 신호가 톤 성분 추출의 종료 조건을 만족하는지의 여부를 판정하고, 종료 조건을 만족하게 될 때까지, 잔차 신호를 순음 분석부(2211)의 다음의 입력 신호로서 순음 추출을 반복하도록 전환한다.
파라미터 보유부(2217)는 양자화된 순음 파형 파라미터(QTP)와 역양자화된 순음 파형 파라미터(TP′)를 보유하고, 전프레임에 있어서의 양자화된 톤 성분 파라미터(PrevN-QTP)를 출력한다. 또한, 역양자화된 현프레임에 있어서의 순음 파형 파라미터(TP′)와 역양자화된 전프레임에 있어서의 순음 파형 파라미터(PrevTP′)를 추출 파형 합성부(2218)에 공급한다.
추출 파형 합성부(2218)는 역양자화된 현프레임에 있어서의 순음 파형 파라미터(TP′)에 의한 시계열 신호와 역양자화된 전프레임에 있어서의 순음 파형 파라미터(PrevTP′)에 의한 시계열 신호를, 예를 들면 상술한 하닝 함수를 사용하여 합성하고, 서로 겹친 구간(오버랩 구간)에 있어서의 톤 성분 시계열 신호(N-TS)를 생성한다. 감산기(2219)에서는 톤 성분 시계열 신호(N-TS)가 입력된 음향 시계열 신호(S)로부터 추출되고, 서로 겹친 구간에서의 잔차 시계열 신호(RS)가 출력된다. 이 잔차 시계열 신호(RS)는 상술한 도 2에 있어서의 시계열 보유부(150)에 공급되어 보유된다.
또한, 양자화 오차를 잔차 시계열 신호에 포함시키는 제 2 구성으로서, 도 6에 도시하는 톤 성분 부호화부(2300)에 있어서도 동일하게, 톤 신호의 정보를 정규화 및 양자화하는 정규화·양자화부(2315)를, 톤 성분 추출부(2310) 중에 갖는다.
여기서, 톤 성분 부호화부(2300)에 있어서, 순음 분석부(2311)는 입력한 음향 시계열 신호(S)로부터 잔차 신호의 에너지가 최소가 되는 순음 성분을 분석하고, 순음 파형 파라미터(TP)를 순음 합성부(2312) 및 정규화·양자화부(2315)에 공급한다.
순음 합성부(2312)는 순음 분석부(2311)에 의해 분석된 순음 성분의 순음 파형 시계열 신호(TS)를 합성하고, 감산기(2313)에 있어서 순음 합성부(2312)에서 합성된 순음 파형 시계열 신호(TS)가 입력된 음향 시계열 신호(S)로부터 추출된다.
종료 조건 판정부(2314)는 감산기(2313)에 있어서의 순음 추출에 의해서 얻어진 잔차 신호가 톤 성분 추출의 종료 조건을 만족하였는지의 여부를 판정하고, 종료 조건을 만족하게 될 때까지, 잔차 신호를 순음 분석부(2311)의 다음의 입력 신호로서 순음 추출을 반복하도록 전환한다.
정규화·양자화부(2315)는 순음 분석부(2311)로부터 공급된 순음 파형 파라미터(TP)를 정규화 및 양자화하고, 양자화된 순음 파형 파라미터(N-QTP)를 역양자화·역정규화부(2316) 및 파라미터 보유부(2319)에 공급한다.
역양자화·역정규화부(2316)는 양자화된 순음 파형 파라미터(N-QTP)를 역양자화 및 역정규화하고, 역양자화된 순음 파형 파라미터(N-TP′)를 파라미터 보유부(2319)에 공급한다.
파라미터 보유부(2319)는 양자화된 순음 파형 파라미터(N-QTP)와 역양자화된 순음 파형 파라미터(N-TP′)를 보유하고, 전프레임에 있어서의 양자화된 톤 성분 파라미터(PrevN-QTP)를 출력한다. 또한, 역양자화된 현프레임에 있어서의 순음 파형 파라미터(N-TP′)와 역양자화된 전프레임에 있어서의 순음 파형 파라미터 (PrevN-TP′)를 추출 파형 합성부(2317)에 공급한다.
추출 파형 합성부(2317)는 역양자화된 현프레임에 있어서의 순음 파형 파라미터(N-TP′)에 의한 시계열 신호와 역양자화된 전프레임에 있어서의 순음 파형 파라미터(PrevN-TP′)에 의한 시계열 신호를, 예를 들면 상술한 하닝 함수를 사용하여 합성하고, 서로 겹친 구간에서의 톤 성분 시계열 신호(N-TS)를 생성한다. 감산기(2318)에서는 톤 성분 시계열 신호(N-TS)가 입력된 음향 시계열 신호(S)로부터 추출되고, 서로 겹친 구간에서의 잔차 시계열 신호(RS)가 출력된다. 이 잔차 시계열 신호(RS)는 상술한 도 2에 있어서의 시계열 보유부(150)에 공급되어 보유된다.
그런데, 도 5의 구성예의 경우, 진폭에 대한 정규화 계수는 취득하는 최대치 이상의 값으로 고정이 된다. 예를 들면, 음악용의 콤팩트 디스크(CD)에 기록되어 있는 음향 시계열 신호를 입력 신호로 하는 경우는 96dB를 정규화 계수로서 양자화를 하게 된다. 또한, 정규화 계수는 고정치이기 때문에, 부호열에 포함시킬 필요는 없다.
이것에 대하여, 도 4나 도 6의 구성예의 경우, 예를 들면 도 7에 도시하는 바와 같이, 추출한 복수의 정현파의 최대 진폭치를 기준으로 정규화 계수를 정하는 것이 가능하다. 즉, 미리 준비된 복수의 정규화 계수 중에서 최적의 정규화 계수를 선택하고, 모든 정현파의 진폭치를 이 정규화 계수에 의해 양자화한다. 이때, 양자화에 사용한 정규화 계수를 나타내는 정보를 부호열에 포함시킨다. 도 4나 도 6의 구성예의 경우에는 상술한 도 5의 구성예의 경우와 비교하여, 정규화 계수를 나타내는 정보분만 비트가 여분으로 필요하게 되지만, 보다 정밀도가 높은 양자화가 가능해진다.
다음에, 도 2의 톤 성분 부호화부(120)가 도 6에 도시하는 바와 같은 구성을 갖는 경우에 있어서의 음향 신호 부호화 장치(100)의 처리를, 도 8의 플로우 차트를 사용하여 상세하게 설명한다.
우선 스텝(S1)에 있어서, 어떤 일정한 분석 구간(샘플수)에서의 음향 시계열 신호를 입력한다.
다음에 스텝(S2)에 있어서, 상기 분석 구간에서, 이 입력 시계열 신호가 톤성인지의 여부를 판별한다. 판별수법으로서는 여러 가지 방법이 생각되지만, 예를 들면 입력 시계열 신호(x(t))를 FFT 등에 의해 스펙트럼 분석을 하여, 얻어진 스펙트럼(X(k))의 평균치(AVE(X(k)))와 최대치(Max(X(k)))와 이하의 식(2)을 만족할 때, 즉, 그 비가 미리 설정한 임계치(THtone)보다도 클 때는 톤성 신호라고 판정하는 등의 수법이 생각된다.
Figure 112003005091035-pct00002
...(2)
스텝(S2)에 있어서, 톤성이라고 판별된 경우는 스텝(S3)으로 진행하고, 노이즈성이라고 판별된 경우는 스텝(S10)으로 진행한다.
스텝(S3)에서는 입력된 시계열 신호로부터 잔차 에너지가 최소가 되는 주파수 성분을 구한다. 여기서, 입력된 시계열 신호(xo(t))로부터 주파수(f)의 순음 파형을 추출하였을 때의 잔차 성분은 이하의 식(3)에 나타내게 된다. 또, 식(3)에 있어서 L은 분석 구간의 길이(샘플수)이다.
또한, 식(3)에 있어서, Sf 및 Cf는 이하의 식(4), 식(5)과 같이 주어진다.
Figure 112003005091035-pct00003
...(3)
Figure 112003005091035-pct00004
...(4)
Figure 112003005091035-pct00005
...(5)
이 때, 이 잔차 에너지(Ef)는 이하의 식(6)과 같이 주어진다.
Figure 112003005091035-pct00006
...(6)
모든 주파수(f)에 대하여 상술한 분석을 하여, 잔차 에너지(Ef)가 최소가 되는 주파수(f1)를 구한다.
계속해서 스텝(S4)에 있어서, 스텝(S3)에서 얻어진 주파수(f1)의 순음 파형을 이하의 식(7)과 같이 입력 시계열 신호(x0(t))로부터 추출한다.
Figure 112003005091035-pct00007
...(7)
스텝(S5)에서는 추출 종료 조건을 만족하였는지의 여부가 판별된다. 추출 종료 조건이란, 예를 들면, 잔차 시계열 신호가 톤성의 신호가 아닌 것, 잔차 시계열 신호의 에너지가 입력 시계열 신호의 에너지보다도 소정의 값 이상 내려간 것, 혹은, 순음을 추출하는 것에 의한 잔차 시계열 신호의 감소량이 임계치 이하가 된 것 등을 들 수 있다.
스텝(S5)에 있어서, 추출 종료 조건을 만족하고 있지 않는 경우는 스텝(S3)으로 되돌아간다. 여기서, 식(7)에서 얻어진 잔차 시계열 신호가 다음의 입력 시계열 신호(x1(t))로 된다. 추출 종료 조건을 만족할 때까지, 스텝(S3)으로부터 스텝(S5)까지의 처리를 N회 반복한다. 스텝(S5)에 있어서, 추출 종료 조건을 만족하고 있는 경우는 스텝(S6)으로 진행한다.
스텝(S6)에서는 얻어진 N개의 순음 정보, 즉 톤 성분 정보(N-TP)의 정규화 및 양자화를 한다. 여기서 순음 정보란, 도 9a에 도시하는 바와 같은 추출한 순음 파형의 주파수(fn), 진폭(Sfn), 진폭(Cfn)이나, 도 9b에 도시하는 바와 같은 주파수(fn), 진폭(Afn), 위상(Pfn)이 생각된다. 여기서, 0≤n<N 이다. 또한, 주파수(fn), 진폭(Sfn), 진폭(Cfn), 진폭(Afn), 위상(Pfn)은 이하의 식(8) 내지 식(10)에 나타내는 관계를 갖는다.
Figure 112003005091035-pct00008
...(8)
Figure 112003005091035-pct00009
...(9)
Figure 112003005091035-pct00010
...(10)
다음에 스텝(S7)에 있어서, 양자화된 톤 성분 정보(N-QTP)를 역양자화 및 역정규화하고, 톤 성분 정보(N-TP′)를 얻는다. 이와 같이, 톤 성분 정보를 일단 정규화 및 양자화한 후에 역양자화 및 역정규화함으로써, 음향 시계열 신호의 복호 공정에서, 여기서 추출하는 톤 성분 시계열 신호와 전혀 상위없이 시계열 신호를 가산하는 것이 가능하게 된다.
계속해서 스텝(S8)에 있어서, 전프레임에 있어서의 톤 성분 정보(PrevN-TP′)와 현프레임에 있어서의 톤 성분 정보(N-TP′)와의 각각에 대하여, 이하의 식(11)과 같이, 톤 성분 시계열 신호(N-TS)를 생성한다.
Figure 112003005091035-pct00011
...(11)
이들의 톤 성분 시계열 신호(N-TS)가 상술한 바와 같이 서로 겹친 구간에서 합성되고, 서로 겹친 구간에서의 톤 성분 시계열 신호(N-TS)가 얻어진다.
스텝(S9)에서는 이하의 식(12)과 같이, 합성된 톤 성분 시계열 신호(N-TS)를 입력된 시계열 신호(S)로부터 빼고, 1/2 프레임분의 잔차 시계열 신호(RS)를 구한다.
Figure 112003005091035-pct00012
...(12)
다음에 스텝(S10)에서는 이 1/2 프레임분의 잔차 시계열 신호(RS), 혹은 스텝(S2)에서 노이즈성이라고 판별된 입력 신호 중의 1/2 프레임분과 이미 보유되어 있는 1/2 프레임분의 잔차 시계열 신호(RS), 혹은 1/2 프레임분의 입력 신호에 의해서 현재 부호화하고자 하는 1 프레임을 구성하고, 이 프레임을 사용하여 DFT나 MDCT에 의해 스펙트럼 변환한다. 계속되는 스텝(S11)에서는 얻어진 스펙트럼 정보의 정규화 및 양자화를 한다.
여기서, 순음 파형 파라미터의 정보량이나 그 양자화 정밀도 등에 따라서, 잔차 시계열 신호의 스펙트럼 정보의 정규화 및 양자화 정밀도를 적응적으로 바꾸는 것도 생각된다. 이 경우, 스텝(S12)에 있어서, 각각의 양자화 정밀도나 양자화 효율 등의 양자화 정보(QI)의 정합성이 잡혀 있는지의 여부를 판별한다. 순음 파형 파라미터의 양자화 정밀도가 지나치게 높고, 스펙트럼 정보에 충분한 양자화 정 밀도를 확보할 수 없는 등, 순음 파형 파라미터와 잔차 시계열 신호의 스펙트럼 정보와의 양자화 정밀도나 양자화 효율의 정합성이 잡혀 있지 않는 경우는 스텝(S13)에 있어서 순음 파형 파라미터의 양자화 정밀도를 변경하고, 스텝(S6)으로 되돌아간다. 스텝(S12)에 있어서, 각각의 양자화 정밀도나 양자화 효율의 정합성이 있는 경우는 스텝(S14)으로 진행한다.
스텝(S14)에서는 얻어진 순음 파형 파라미터 및 잔차 시계열 신호 혹은 노이즈성이라고 판별된 입력 신호의 스펙트럼 정보에 따라서 부호열을 생성하고, 스텝(S15)에 있어서, 그 부호열을 출력한다.
본 실시예에 있어서의 음향 신호 부호화 장치는 이상과 같은 처리를 함으로써, 음향 시계열 신호로부터, 톤 성분 신호를 미리 추출하고, 그 톤 성분과 잔차 성분에 대하여, 각각 효율적인 부호화를 실시하는 것이 가능해진다.
또, 도 8의 플로우 차트에서는 톤 성분 부호화부(120)가 도 6과 같은 구성을 갖는 경우의 음향 신호 부호화 장치(100)의 처리를 설명하였지만, 톤 성분 부호화부(120)가 도 5와 같은 구성을 갖는 경우의 음향 신호 부호화 장치(100)의 처리는 도 10의 플로우 차트에 도시하게 된다.
도 10에 있어서, 스텝(S21)에서는 어떤 일정한 분석 구간(샘플수)에서의 시계열 신호를 입력한다.
다음에 스텝(S22)에 있어서, 상기 분석 구간에 있어서, 이 입력 시계열 신호가 톤성인지의 여부를 판별한다. 이 판별 수법은 상술한 도 8에 있어서의 수법과 동일하다.
스텝(S23)에서는 입력된 시계열 신호로부터 잔차 에너지가 최소가 되는 주파수(f1)를 구한다.
계속해서 스텝(S24)에서는 순음 파형 파라미터(TP)의 정규화 및 양자화를 한다. 여기서 순음 파형 파라미터란 추출한 순음 파형의 주파수(f1), 진폭(Sf1), 진폭(Cf1)이나, 주파수(f1), 진폭(Af1), 위상(Pf1)이 생각된다.
다음에 스텝(S25)에 있어서, 양자화된 순음 파형 파라미터(QTP)를 역양자화 및 역정규화하여, 순음 파형 파라미터(TP′)를 얻는다.
계속해서 스텝(S26)에 있어서, 순음 파형 파라미터(TP′)에 따라서, 이하의 식(13)과 같이, 추출하는 순음 파형 시계열 신호(TS)를 생성한다.
Figure 112003005091035-pct00013
...(13)
스텝(S27)에서는 스텝(S23)에서 얻어진 주파수(f1)의 순음 파형을 이하의 식(14)과 같이 입력 시계열 신호(x0(t))로부터 추출한다.
Figure 112003005091035-pct00014
...(14)
계속되는 스텝(S28)에서는 추출 종료 조건을 만족하였는지의 여부가 판별된다. 스텝(S28)에 있어서, 추출 종료 조건을 만족하고 있지 않는 경우는 스텝(S23)으로 되돌아간다. 여기서, 식(10)에서 얻어진 잔차 시계열 신호가 다음의 입력 시계열 신호(x1(t))로 된다. 추출 종료 조건을 만족할 때까지, 스텝(S23)으로부터 스 텝(S28)까지의 처리를 N회 반복한다. 스텝(S28)에 있어서, 추출 종료 조건을 만족하고 있는 경우는 스텝(S29)으로 진행한다.
스텝(S29)에서는 전프레임에 있어서의 순음 파형 파라미터(PrevTP′)와 현프레임에 있어서의 순음 파형 파라미터(TP′)에 따라서, 추출하는 1/2 프레임분의 톤 성분 시계열 신호(N-TS)를 합성한다.
다음에 스텝(S30)에서는 합성된 톤 성분 시계열 신호(N-TS)를 입력된 시계열 신호(S)로부터 빼고, 1/2 프레임분의 잔차 시계열 신호(RS)를 구한다.
계속해서 스텝(S31)에서는 이 1/2 프레임분의 잔차 시계열 신호(RS), 혹은 스텝(S22)에서 노이즈성이라고 판별된 입력 신호 중의 1/2 프레임분과 이미 보유되어 있는 1/2 프레임분의 잔차 시계열 신호(RS), 혹은 1/2 프레임분의 입력 신호에 의해서 1 프레임을 구성하고, 이것을 DFT이나 MDCT에 의해 스펙트럼 변환한다. 계속되는 스텝(S32)에서는 얻어진 스펙트럼 정보의 정규화 및 양자화를 한다.
여기서, 순음 파형 파라미터의 정보량이나 그 양자화 정밀도 등에 따라서, 잔차 시계열 신호의 스펙트럼 정보의 정규화 및 양자화 정밀도를 적응적으로 바꾸는 것도 생각된다. 이 경우, 스텝(S33)에 있어서, 각각의 양자화 정밀도나 양자화 효율 등의 양자화 정보(QI)의 정합성이 잡혀 있는지의 여부를 판별한다. 순음 파형 파라미터의 양자화 정밀도가 지나치게 높고, 스펙트럼 정보에 충분한 양자화 정밀도가 확보할 수 없는 등, 순음 파형 파라미터와 잔차 시계열 신호의 스펙트럼 정보와의 양자화 정밀도나 양자화 효율의 정합성이 잡혀 있지 않는 경우는 스텝(S34)에 있어서 순음 파형 파라미터의 양자화 정밀도를 변경하고, 스텝(S23)으로 되돌아 간다. 스텝(S33)에 있어서, 각각의 양자화 정밀도나 양자화 효율의 정합성이 잡혀 있는 경우는 스텝(S35)으로 진행한다.
스텝(S35)에서는 얻어진 순음 파형 파라미터 및 잔차 시계열 신호 혹은 노이즈성이라고 판별된 입력 신호의 스펙트럼 정보에 따라서 부호열을 생성하고, 스텝(S36)에 있어서, 그 부호열을 출력한다.
다음에, 본 실시예에 있어서의 음향 신호 복호화 장치의 구성을 도 11에 도시한다. 도 11에 도시하는 바와 같이, 음향 신호 복호화 장치(400)는 부호열 분해부(410)와, 톤 성분 복호화부(420)와, 잔차 성분 복호화부(430)와, 가산기(440)를 구비한다.
부호열 분해부(410)는 입력한 부호열을 톤 성분 정보(N-QTP)와 잔차 성분 정보(QNS)로 분해한다.
톤 성분 복호화부(420)는 톤 성분 정보(N-QTP)에 따라서 톤 성분 시계열 신호(N-TS′)를 생성하는 것이고, 부호열 분해부(410)에서 얻어진 톤 성분 정보(N-QTP)를 역양자화 및 역정규화하는 역양자화·역정규화부(421)와, 역양자화·역정규화부(421)에서 얻어진 톤 성분 파라미터(N-TP′)에 따라서 톤 성분 시계열 신호(N-TS′)를 합성하여 출력하는 톤 성분 합성부(422)를 갖는다.
잔차 성분 복호화부(430)는 잔차 성분 정보(QNS)에 따라서 잔차 시계열 신호(RS′)를 생성하는 것이며, 부호열 분해부(410)로 얻어진 잔차 성분 정보(QNS)를 역양자화 및 역정규화하는 역양자화·역정규화부(431)와, 역양자화·역정규화부(431)에서 얻어진 스펙트럼 정보(NS′)를 역스펙트럼 변환하 여 잔차 시계열 신호(RS′)를 생성하는 역스펙트럼 변환부(432)를 갖는다.
가산기(440)는 톤 성분 복호화부(420)의 출력과 잔차 성분 복호화부(430)의 출력을 합성하여, 복원신호(S′)를 출력한다.
이와 같이, 본 실시예에 있어서의 음향 신호 복호화 장치(400)는 입력한 부호열을 톤 성분 정보와 잔차 성분 정보로 분해하고, 각각에 따른 복호화 처리를 한다.
톤 성분 복호화부(420)는 구체적으로는 도 12에 도시하는 바와 같은 구성인 것을 들 수 있다. 도 12에 도시하는 바와 같이, 톤 성분 복호화부(500)는 역양자화·역정규화부(510)와 톤 성분 합성부(520)를 갖는다. 이 역양자화·역정규화부(510) 및 톤 성분 합성부(520)는 도 11에 도시하는 역양자화·역정규화부(421) 및 톤 성분 합성부(422)와 동일한 것이다.
여기서, 톤 성분 복호화부(500)에 있어서, 역양자화·역정규화부(510)는 입력된 톤 성분 파라미터(N-QTP)를 역양자화 및 역정규화하고, 톤 성분 파라미터(N-TP′)의 각 순음 파형에 대응하는 순음 파형 파라미터(TP′O, TP′1,···, TP′N)를 각각 순음 합성부(5210, 5211,···, 521N)에 공급한다.
순음 합성부(5210, 5211,···, 521N)는 역양자화·역정규화부(510)로부터 공급된 순음 파형 파라미터(TP′0, TP′2,···, TP′N)에 기초하여, 각각 1개의 순음 파형(TS′0, TS′1,···, TS′N)을 합성하여 가산기(522)에 공급한다.
가산기(522)에서는 순음 합성부(5210, 5211, ···, 521N)로부터 공급된 순 음 파형(TS′O, TS′1,···, TS′N)을 합성하여, 톤 성분 시계열 신호(N-TS′)로서 출력한다.
다음에, 도 11의 톤 성분 복호화부(420)가 도 12에 도시하는 바와 같은 구성을 갖는 경우에 있어서의 음향 신호 복호화 장치(400)의 처리를, 도 13의 플로우 차트를 사용하여 상세하게 설명한다.
우선 스텝(S41)에 있어서, 상술한 음향 신호 부호화 장치(100)에 있어서 생성된 부호열을 입력하고, 다음에 스텝(S42)에 있어서, 이 부호화열을 톤 성분 정보와 잔차 신호 정보로 분해한다.
계속해서 스텝(S43)에서는 분해된 부호열에 톤 성분 파라미터가 존재하는지의 여부를 판별한다. 톤 성분 파라미터가 존재하는 경우는 스텝(S44)으로 진행하고, 톤 성분파라미터가 존재하지 않는 경우는 스텝(S46)으로 진행한다.
스텝(S44)에서는 톤 성분의 각 파라미터를 역양자화 및 역정규화하여, 톤 성분 신호의 각 파라미터를 얻는다.
계속되는 스텝(S45)에서는 스텝(S44)에서 얻어진 각 파라미터에 따라서, 톤 성분 파형을 합성하여, 톤 성분 시계열 신호를 생성한다.
다음에 스텝(S46)에서는 스텝(S42)에서 얻은 잔차 신호정보를 역양자화 및 역정규화하여, 잔차 시계열 신호의 스펙트럼을 얻는다.
계속되는 스텝(S47)에서는 스텝(S46)에서 얻어진 스펙트럼 정보를 역스펙트럼 변환하여, 잔차 성분 시계열 신호를 생성한다.
스텝(S48)에서는 스텝(S45)에서 생성된 톤 성분 시계열 신호와 스텝(S47)에 서 생성된 잔차 성분 시계열 신호를 시계열 상에서 가산하여 복원 시계열 신호를 생성하고, 스텝(S49)에 있어서, 그 복원 시계열 신호가 출력된다.
본 실시예에 있어서의 음향 신호 복호화 장치(400)는 이상과 같은 처리를 함으로써 입력된 음향 시계열 신호를 복원한다.
또한, 도 13에서는 스텝(S43)에 있어서, 분해된 부호열에 톤 성분 파라미터가 존재하는지의 여부를 판별하도록 하였지만, 판별하지 않고서, 직접 스텝(S44)으로 진행하도록 하여도 상관 없다. 이 경우, 톤 성분 파라미터가 존재하지 않으면, 스텝(S48)에 있어서, 톤 성분 시계열 신호로서 0이 합성된다.
여기서, 도 2에 도시한 잔차 성분 부호화부(130)는 도 14에 도시하는 바와 같은 구성의 것으로 바꾸는 것도 생각된다. 도 14에 도시하는 바와 같이, 잔차 성분 부호화부(7100)는 잔차 시계열 신호(RS)를 스펙트럼 정보(RSP)로 변환하는 스펙트럼 변환부(7101)와, 스펙트럼 변환부(7101)에서 얻은 스펙트럼 정보(RSP)를 정규화하고, 정규화 정보(N)를 출력하는 정규화부(7102)를 갖는다. 즉, 잔차 성분 부호화부(71OO)에서는 스펙트럼 정보의 정규화만을 하여 양자화를 행하지 않고, 정규화 정보(N)만을 복호화측에 출력한다.
이 때, 복호화측은 도 15에 도시하는 바와 같은 구성이 된다. 즉, 도 15에 도시하는 바와 같이, 잔차 성분 복호화부(7200)는 적당한 난수 분포의 난수에 의해서 의사 스펙트럼 정보(GSP)를 생성하는 난수 발생부(7201)와, 정규화 정보에 따라서 상기 난수 발생부(7201)에서 생성된 의사 스펙트럼 정보(GSP)를 역정규화하는 역정규화부(7202)와, 상기 역정규화부(7202)에서 역정규화된 의사 스펙트럼 정보(RSP′)를 의사적인 스펙트럼 정보라고 간주하고, 이것을 역스펙트럼 변환하여 의사적인 잔차 시계열 신호(RS′)를 생성하는 역스펙트럼 변환부(7203)를 갖는다.
여기서, 난수 발생부(7201)에 있어서는 난수를 발생할 때, 그 난수 분포를, 일반적인 음향신호나 노이즈성 신호를 스펙트럼 변환하여 정규화하였을 때의 정보의 분포에 가까운 것으로 하면 좋다. 또한, 더욱이, 복수의 난수 분포를 준비해두고, 부호화 시에 어느 분포가 최적인지를 분석하여 최적의 분포의 ID 정보를 부호열에 포함시켜 복호화 시에 참조된 ID 정보의 난수 분포를 사용하여 난수를 발생시킴으로써, 보다 근사적인 잔차 시계열 신호를 생성하는 것이 가능하다.
이상 설명한 바와 같이, 본 실시예에서는 음향 신호 부호화 장치에 있어서 톤 성분 신호를 미리 추출하고, 그 톤 성분과 잔차 성분에 대하여 각각 효율적인 부호화를 실시하는 것이 가능해지고, 음향 신호 복호화 장치에 있어서, 부호화된 부호화된 부호열은 부호화측에 대응하는 방법에 의해 복호할 수 있다.
또한, 본 발명은 상술한 실시예에만 한정되는 것이 아니라, 음향신호 부호화 장치 및 음향 신호 복호화 장치의 제 2 구성예로서 예를 들면 도 16에 도시하는 바와 같이 부호화 효율을 높이기 위해서 음향 시계열 신호(S)를 복수의 주파수 대역으로 분할하고, 각각의 대역에 대하여 각 처리를 행하여 부호화하고, 복호화한 후에 주파수 대역을 합성하도록 하는 구성도 생각된다. 이하, 간단하게 설명한다.
도 16에 있어서, 음향 신호 복호화 장치(810)는 입력한 음향 시계열 신호(S)를 복수의 주파수 대역으로 대역 분할하는 대역 분할 필터부(811)와, 복수의 주파수 대역으로 대역 분할된 입력 신호로부터 각각의 톤 성분 정보(N-QTP)와 잔차 성 분 정보(QNS)를 얻는 대역 신호 부호화부(812, 813, 814)와, 각 대역의 톤 성분 정보(N-QTP) 및/또는 잔차 성분 정보(QNS)로부터 부호열(C)을 생성하는 부호열 생성부(815)를 갖는다.
여기서, 대역신호 부호화부(812, 813, 814)는 상술한 톤·노이즈 판정부, 콘성분 부호화부, 및 잔차 성분 부호화부에서 구성되지만, 톤 성분이 그다지 존재하지 않는 것이 많은 고주파수 대역에서는 대역 신호 부호화부(814)에 나타내는 바와 같이 잔차 성분 부호화부만으로 구성하도록 하여도 좋다.
또한, 음향 신호 복호화 장치(820)는 상기 음향 신호 부호화 장치(810)에서 생성된 부호열(C)을 입력하고, 복수의 주파수 대역의 톤 성분 정보(N-QTP)와 잔차 성분 정보(QNS)에 분해하는 부호열 분해부(821)와, 대역마다 분해된 톤 성분 정보(N-QTP) 및 잔차 성분 정보(QNS)로부터, 각각의 대역에서의 시계열 신호를 생성하는 대역 신호 복호화부(822, 823, 824)와, 상기 대역 신호 복호화부(822, 823, 824)에서 생성된 각 대역의 복원 신호(S')를 대역 합성하는 대역 합성 필터부(825)를 갖는다.
여기서, 대역 신호 복호화부(822, 823, 824)는 상술한 톤 성분 복호화부, 잔차 성분 복호화부, 및 가산기로 구성되지만, 부호화측과 동일하게, 톤 성분이 그다지 존재하지 않는 것이 많은 고주파수 대역에서는 잔차 성분 복호화부만으로 구성하도록 하여도 좋다.
또한, 음향 신호 부호화 장치 및 음향 신호 복호화 장치의 제 3 구성예로서, 예를 들면 도 17에 도시하는 바와 같이, 복수의 부호화 방식에 의한 부호화 효율을 비교하여, 부호화 효율이 좋은 부호화 방식에 의한 부호열(C)을 선택하도록 하는 구성도 생각된다. 이하, 간단하게 설명한다.
도 17에 있어서, 음향 신호 부호화 장치(900)는 입력한 음향 시계열 신호(S)를 제 1 부호화 방식으로 부호화하는 제 1 부호화부(901)와, 입력한 음향 시계열 신호(S)를 제 2 부호화 방식으로 부호화하는 제 2 부호화부(905)와, 제 1 부호화 방식과 제 2 부호화 방식과의 부호화 효율을 판정하는 부호화 효율 판정부(909)를 구비한다.
여기서, 제 1 부호화부(901)는 음향 시계열 신호(S)의 톤 성분을 부호화하는 톤 성분 부호화부(902)와, 상기 톤 성분 부호화부(902)로부터 출력된 잔차 시계열 신호를 부호화하는 잔차 성분 부호화부(903)와, 상기 톤 성분 부호화부(902)와 잔차 성분 부호화부(903)에서 얻어진 톤 성분 정보(N-QTP) 및 잔차 성분 정보(QNS)에서 부호열(C)을 생성하는 부호열 생성부(904)를 갖는다.
또한, 제 2 부호화부(905)는 입력 시계열 신호를 스펙트럼 정보(SP)로 변환하는 스펙트럼 변환부(906)와, 상기 스펙트럼 변환부(906)에서 얻어진 스펙트럼 정보(SP)를 정규화 및 양자화하는 정규화·양자화부(907)와, 상기 정규화·양자화부(907)에서 얻어진 양자화된 스펙트럼 정보(QSP)로부터 부호열(C)을 생성하는 부호열 생성부(908)를 갖는다.
부호화 효율 판정부(909)는 부호열 생성부(904)와 부호열 생성부(908)에 있어서 생성된 부호열(C)의 부호화 정보(CI)를 입력한다. 이로써, 제 1 부호화부(901)의 부호화 효율과 제 2 부호화부(905)와의 부호화 효율을 비교하여 실제로 출력하는 부호열(C)을 선택하여, 전환기(910)를 제어한다. 전환기(910)는 부호화 효율 판정부(909)로부터 공급된 전환 부호(F)에 따라서 출력하는 부호열(C)을 바꾼다. 또한, 전환기(910)는 제 1 부호화부(901)의 부호열(C)을 선택한 경우에는 부호열이 후술하는 제 1 복호화부(921)에 공급되도록 바꾸고, 제 2 부호화부(905)의 부호열(C)을 선택한 경우에는 부호열(C)이 후술하는 제 2 복호화부(926)에 공급되도록 바꾼다.
한편, 음향 신호 복호화 장치(920)는 입력된 부호열(C)을 제 1 복호화 방식으로 복호화하는 제 1 복호화부(921)와, 입력된 부호열(C)을 제 2 복호화 방식으로 복호화하는 제 2 복호화부(926)를 구비한다.
여기서, 제 1 복호화부(921)는 입력된 부호열(C)을 톤 성분 정보 및 잔차 성분 정보에 분해하는 부호 분해부(922)와, 상기 부호 분해부(922)에서 얻어진 톤 성분 정보로부터 톤 성분 시계열 신호를 생성하는 톤 성분 복호화부(923)와, 상기 부호 분해부(922)에서 얻어진 잔차 성분 정보로부터 잔차 성분 시계열 신호를 생성하는 잔차 성분 복호화부(924)와, 상기 톤 성분 복호화부(923) 및 잔차 성분 복호화부(924)에서 생성된 톤 성분 시계열 신호 및 잔차 성분 시계열 신호를 합성하는 가산기(925)를 갖는다.
또한, 제 2 복호화부(926)는 입력된 부호열(C)로부터 양자화된 스펙트럼 정보를 얻는 부호 분해부(927)와, 상기 부호 분해부(927)에서 얻어진 양자화된 스펙트럼 정보를 역양자화 및 역정규화하는 역양자화·역정규화부(928)와, 상기 역양자화·역정규화부(928)에서 얻어진 스펙트럼 정보를 역스펙트럼 변환하여 시계열 신 호를 얻는 역스펙트럼 변환부(929)를 갖는다.
즉, 음향 신호 복호화 장치(920)에서는 음향 신호 부호화 장치(900)에서 선택된 부호화 방식에 대응하는 복호화 방식으로, 입력한 부호열(C)이 복호화된다.
이상, 제 2 구성예, 제 3 구성예로서 나타낸 이외에도, 본 발명의 요지를 일탈하지 않는 범위에 있어서 여러 가지 변경이 가능한 것은 물론이다.
예를 들면, 상술한 설명에서는 주로 MDCT를 사용하여 스펙트럼 변환을 하였지만, 이것에 한정되지 않으며, FFT, DFT, DCT 등이라도 상관없다. 또한, 프레임간의 오버랩도, 1/2 프레임에 한정되는 것이 아니다.
또한, 상술한 설명에서는 하드웨어로서 구성하였지만, 상술한 부호화 방법 및 복호화 방법에 따른 프로그램이 기록된 기록 매체를 제공하는 것도 가능하다. 게다가, 이로써 얻어지는 부호열이나, 부호열을 복호화한 신호가 기록된 기록 매체를 제공하는 것도 가능하다.
상술한 바와 같은 본 발명에 따르면, 음향 시계열 신호로부터 톤 성분 신호를 추출하고, 그 톤 성분 신호와 음향 시계열 신호로부터 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화함으로써, 국소적 주파수에 발생하고 있는 톤 성분에 의한 스펙트럼이 확산되어, 부호화 효율이 악화되는 것을 억제할 수 있다.

Claims (34)

  1. 음향 시계열 신호를 부호화하는 음향 신호 부호화 방법에 있어서,
    상기 음향 시계열 신호로부터 순음 파형인 톤 성분 신호를 추출하여 부호화하는 톤 성분 부호화 공정과,
    상기 톤 성분 부호화 공정에서, 상기 음향 시계열 신호로부터 상기 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화하는 잔차 성분 부호화 공정을 갖고,
    상기 톤 성분 부호화 공정은,
    상기 음향 시계열 신호로부터, 잔차 에너지가 최소가 되는 순음을 분석하는 순음 분석 공정과,
    상기 순음 분석 공정에서 얻어진 순음 파형의 파라미터를 사용하여 순음 파형을 합성하는 순음 합성 공정과,
    상기 음향 시계열 신호로부터 상기 순음 합성 공정에서 합성된 순음 파형을 순차 감산함으로써 잔차 신호를 얻는 감산 공정과,
    상기 감산 공정에서 얻어진 상기 잔차 신호를 분석하고, 소정의 조건에 기초하여 상기 순음 분석 공정의 종료 판정을 하는 종료 조건 판정 공정과,
    상기 순음 분석 공정에서 얻어진 순음 파형의 파라미터를 정규화 및 양자화하는 정규화·양자화 공정을 갖는 것을 특징으로 하는, 음향 신호 부호화 방법.
  2. 제 1 항에 있어서,
    상기 음향 시계열 신호가 톤성인지 노이즈성인지를 판정하는 톤·노이즈 판정 공정을 갖고,
    상기 톤·노이즈 판정 공정에서 노이즈성이라고 판정된 상기 음향 시계열 신호는 상기 잔차 성분 부호화 공정에서 부호화되는 것을 특징으로 하는, 음향 신호 부호화 방법.
  3. 제 1 항에 있어서,
    상기 음향 시계열 신호를 부호화할 때의 부호화 단위가 시간축 상에서 오버랩하는 경우에, 해당 오버랩 부분에서, 해당 오버랩 부분을 포함하는 시간적으로 앞의 부호화 단위로 얻어지는 상기 톤 성분 신호와 시간적으로 뒤의 부호화 단위로 얻어지는 상기 톤 성분 신호를 합성한 신호를 상기 음향 시계열 신호로부터 추출함으로써, 상기 잔차 시계열 신호를 얻는 것을 특징으로 하는, 음향 신호 부호화 방법.
  4. 제 2 항에 있어서,
    상기 잔차 성분 부호화 공정으로의 입력을 보유하기 위한 시계열 보유 공정을 갖는 것을 특징으로 하는, 음향 신호 부호화 방법.
  5. 삭제
  6. 제 1 항에 있어서,
    상기 음향 시계열 신호를 부호화할 때의 부호화 단위가 시간축 상에서 오버랩하는 경우에, 해당 오버랩 부분에서, 해당 오버랩 부분을 포함하는 시간적으로 앞의 부호화 단위로 얻어지는 상기 톤 성분 신호와 시간적으로 뒤의 부호화 단위로 얻어지는 상기 톤 성분 신호를 합성하여 합성 신호를 생성하는 추출 파형 합성 공정과,
    상기 합성 신호를 상기 음향 시계열 신호로부터 감산하여 상기 잔차 시계열 신호를 출력하는 감산 출력 공정을 갖는 것을 특징으로 하는, 음향 신호 부호화 방법.
  7. 음향 시계열 신호를 부호화하는 음향 신호 부호화 방법에 있어서,
    상기 음향 시계열 신호로부터 순음 파형인 톤 성분 신호를 추출하여 부호화하는 톤 성분 부호화 공정과,
    상기 톤 성분 부호화 공정에서, 상기 음향 시계열 신호로부터 상기 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화하는 잔차 성분 부호화 공정을 갖고,
    상기 톤 성분 부호화 공정은,
    상기 음향 시계열 신호로부터, 잔차 에너지가 최소가 되는 순음을 분석하는 순음 분석 공정과,
    상기 순음 분석 공정에서 얻어진 순음 파형의 파라미터를 정규화 및 양자화하는 정규화·양자화 공정과,
    상기 정규화·양자화 공정에서 얻어진 순음 파형의 파라미터를 역양자화 및 역정규화하는 역양자화·역정규화 공정과,
    상기 역양자화·역정규화 공정에서 얻어진 순음 파형의 파라미터에 사용하여 순음 파형을 합성하는 순음 파형 합성 공정과,
    상기 음향 시계열 신호로부터 상기 순음 합성 공정에서 합성된 순음 파형을 순차 감산함으로써 잔차 신호를 얻는 감산 공정과,
    상기 감산 공정에서 얻어진 상기 잔차 신호를 분석하여, 소정의 조건에 기초하여 상기 순음 분석 공정의 종료 판정을 행하는 종료 조건 판정 공정을 갖는 것을 특징으로 하는, 음향 신호 부호화 방법.
  8. 제 7 항에 있어서,
    상기 음향 시계열 신호를 부호화할 때의 부호화 단위가 시간축 상에서 오버랩하는 경우에, 해당 오버랩 부분에서, 해당 오버랩 부분을 포함하는 시간적으로 앞의 부호화 단위로 얻어지는 상기 톤 성분 신호와 시간적으로 뒤의 부호화 단위로 얻어지는 상기 톤 성분 신호를 합성하여 합성 신호를 생성하는 추출 파형 합성 공정과,
    상기 합성 신호를 상기 음향 시계열 신호로부터 감산하여 상기 잔차 시계열 신호를 출력하는 감산 출력 공정을 갖는 것을 특징으로 하는, 음향 신호 부호화 방법.
  9. 음향 시계열 신호를 부호화하는 음향 신호 부호화 방법에 있어서,
    상기 음향 시계열 신호로부터 순음 파형인 톤 성분 신호를 추출하여 부호화하는 톤 성분 부호화 공정과,
    상기 톤 성분 부호화 공정에서, 상기 음향 시계열 신호로부터 상기 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화하는 잔차 성분 부호화 공정을 갖고,
    상기 톤 성분 부호화 공정은,
    상기 음향 시계열 신호로부터, 잔차 에너지가 최소가 되는 순음을 분석하는 순음 분석 공정과,
    상기 순음 분석 공정에서 얻어진 순음 파형을 합성하는 순음 합성 공정과,
    상기 음향 시계열 신호로부터 상기 순음 합성 공정에서 합성된 순음 파형을 순차 감산함으로써 잔차 신호를 얻는 감산 공정과,
    상기 감산 공정에서 얻어진 상기 잔차 신호를 분석하고, 소정의 조건에 기초하여 상기 순음 분석 공정의 종료 판정을 행하는 종료 조건 판정 공정과,
    상기 순음 분석 공정에서 얻어진 순음 파형의 파라미터를 정규화 및 양자화하는 정규화·양자화 공정과,
    상기 정규화·양자화 공정에서 얻어진 순음 파형의 파라미터를 역양자화 및 역정규화하는 역양자화·역정규화 공정을 갖는 것을 특징으로 하는, 음향 신호 부호화 방법.
  10. 제 1 항에 있어서,
    상기 음향 시계열 신호를 부호화하는 부호화 단위가 시간축 상에서 오버랩하는 경우에, 해당 오버랩 부분에서, 해당 오버랩 부분을 포함하는 시간적으로 앞의 부호화 단위로 얻어지는 상기 톤 성분 신호와 시간적으로 뒤의 부호화 단위로 얻어지는 상기 톤 성분 신호를 합성하여 합성 신호를 생성하는 추출 파형 합성 공정과,
    상기 합성 신호를 상기 음향 시계열 신호로부터 감산하여 상기 잔차 시계열 신호를 출력하는 감산 출력 공정을 갖는 것을 특징으로 하는, 음향 신호 부호화 방법.
  11. 제 1 항에 있어서,
    상기 종료 조건 판정 공정에서의 종료 조건은 상기 잔차 신호가 노이즈성 신호라고 판정되는 것임을 특징으로 하는, 음향 신호 부호화 방법.
  12. 제 1 항에 있어서,
    상기 종료 조건 판정 공정에서의 종료 조건은 상기 잔차 신호의 에너지가 입력 신호의 에너지보다 소정치 이상 내려가는 것임을 특징으로 하는, 음향 신호 부호화 방법.
  13. 제 1 항에 있어서,
    상기 종료 조건 판정 공정에서의 종료 조건은 순음의 추출에 의한 상기 잔차 신호의 에너지의 감소량이 소정치 이하가 되는 것임을 특징으로 하는, 음향 신호 부호화 방법.
  14. 제 1 항에 있어서,
    상기 잔차 성분 부호화 공정은,
    시간적으로 앞의 부호화 단위의 일부분에서의 잔차 시계열 신호와 시간적으로 뒤의 부호화 단위의 일부분에서의 잔차 시계열 신호에 의해 1 부호화 단위의 잔차 시계열 신호를 생성하고, 해당 잔차 시계열 신호를 스펙트럼 변환하는 스펙트럼 변환 공정과,
    상기 스펙트럼 변환 공정에서 얻어진 스펙트럼 정보를 정규화 및 양자화하는 정규화·양자화 공정을 갖는 것을 특징으로 하는, 음향 신호 부호화 방법.
  15. 제 1 항에 있어서,
    상기 톤 성분 부호화 공정에서의 정규화·양자화 공정에서 얻어진 톤 성분 정보와 상기 잔차 성분 부호화 공정에서의 정규화·양자화 공정에서 얻어진 잔차 성분 정보를 비교하여, 정합이 잡혀 있지 않는 경우에, 톤 성분 정보의 양자화 정밀도를 변경하고, 다시 톤 성분 분석 및 추출을 하는 것을 특징으로 하는, 음향 신호 부호화 방법.
  16. 제 1 항에 있어서,
    상기 잔차 성분 부호화 공정은,
    시간적으로 앞의 부호화 단위의 일부분에서의 잔차 시계열 신호와 시간적으로 뒤의 부호화 단위의 일부분에서의 잔차 시계열 신호에 의해 한 부호화 단위의 잔차 신호를 생성하고, 해당 잔차 신호를 스펙트럼 변환하는 스펙트럼 변환 공정과,
    상기 스펙트럼 변환 공정에서 얻어진 스펙트럼 정보의 정규화를 행하는 정규화 공정을 갖는 것을 특징으로 하는, 음향 신호 부호화 방법.
  17. 음향 시계열 신호로부터 순음 파형인 톤 성분 신호를 추출하고, 해당 톤 성분 신호를 부호화하고, 또한, 상기 음향 시계열 신호로부터 상기 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화하여 이루어지는 부호열을 입력하고, 해당 부호열을 복호화하는 음향 신호 복호화 방법에 있어서,
    상기 부호열을 분해하는 부호열 분해 공정과,
    상기 부호열 분해 공정에서 얻어진 톤 성분 정보에 따라서, 톤 성분 시계열 신호를 복호화하는 톤 성분 복호화 공정과,
    상기 부호열 분해 공정에서 얻어진 잔차 성분 정보에 따라서, 잔차 성분 시계열 신호를 복호화하는 잔차 성분 복호화 공정과,
    상기 톤 성분 복호화 공정에서 얻어진 톤 성분 시계열 신호와 잔차 성분 복호화 공정에서 얻어진 잔차 성분 시계열 신호를 가산하여 상기 음향 시계열 신호를 복원하는 가산 공정을 갖고,
    상기 잔차 성분 정보는 시간적으로 앞의 부호화 단위의 일부분에서의 잔차 시계열 신호와 시간적으로 뒤의 부호화 단위의 일부분에서의 잔차 시계열 신호에 의해 1 부호화 단위의 잔차 시계열 신호가 생성되고, 해당 잔차 시계열 신호가 스펙트럼 변환되어, 얻어진 스펙트럼 정보의 정규화가 행해진 것이며,
    상기 잔차 성분 복호화 공정은,
    난수를 생성하는 난수 생성 공정과,
    부호화측에서의 상기 정규화로 얻어진 정규화 정보에 따라서, 상기 난수를 역정규화하여 의사 스펙트럼 정보를 생성하는 역정규화 공정과,
    상기 역정규화 공정에서 얻어진 상기 의사 스펙트럼 정보를 역스펙트럼 변환하여 의사 잔차 성분 시계열 신호를 생성하는 역스펙트럼 변환 공정을 갖는 것을 특징으로 하는, 음향 신호 복호화 방법.
  18. 제 17 항에 있어서,
    상기 톤 성분 복호화 공정은,
    상기 부호열 분해 공정에서 얻어진 톤 성분 정보를 역양자화 및 역정규화하는 역양자화·역정규화 공정과,
    상기 역양자화·역정규화 공정에서 얻어진 톤 성분 정보에 따라서 톤 성분 시계열 신호를 합성하는 톤 성분 합성 공정을 갖는 것을 특징으로 하는, 음향 신호 복호화 방법.
  19. 삭제
  20. 제 18 항에 있어서,
    상기 톤 성분 합성 공정은,
    상기 역양자화·역정규화 공정에서 얻어진 상기 톤 성분 정보에 따라서 순음 파형을 합성하는 순음 파형 합성 공정과,
    상기 순음 파형 합성 공정에서 얻어진 복수의 상기 순음 파형을 가산하여 상기 톤 성분 시계열 신호를 합성하는 가산 공정을 갖는 것을 특징으로 하는, 음향 신호 복호화 방법.
  21. 삭제
  22. 제 17 항에 있어서,
    상기 난수 생성 공정에서는 상기 난수로서, 그 분포가 일반적인 음향 시계열 신호 또는 노이즈성 신호를 스펙트럼 변환 및 정규화한 때의 분포에 가까운 분포를 갖는 난수를 생성하는 것을 특징으로 하는, 음향 신호 복호화 방법.
  23. 제 17 항에 있어서,
    미리 준비된 복수의 분포 중에서, 부호화측에서 상기 정규화된 스펙트럼 정보의 분포에 가까운 것으로서 선택된 분포를 나타내는 ID 정보가 부호열에 포함되어 있고,
    상기 난수 발생 공정에서는 상기 ID 정보에 기초를 둔 분포의 상기 난수가 발생되는 것을 특징으로 하는, 음향 신호 복호화 방법.
  24. 음향 시계열 신호를 부호화하는 음향 신호 부호화 방법에 있어서,
    상기 음향 시계열 신호를 복수의 주파수 대역으로 분할하는 주파수 대역 분할 공정과,
    적어도 1개의 주파수 대역의 상기 음향 시계열 신호로부터 순음 파형인 톤 성분 신호를 추출하여 부호화하는 톤 성분 부호화 공정과,
    상기 톤 성분 부호화 공정에서, 적어도 1개의 주파수 대역의 상기 음향 시계열 신호로부터 상기 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화하는 잔차 성분 부호화 공정을 갖고,
    상기 톤 성분 부호화 공정은,
    상기 음향 시계열 신호로부터, 잔차 에너지가 최소가 되는 순음을 분석하는 순음 분석 공정과,
    상기 순음 분석 공정에서 얻어진 순음 파형의 파라미터를 사용하여 순음 파형을 합성하는 순음 합성 공정과,
    상기 음향 시계열 신호로부터 상기 순음 합성 공정에서 합성된 순음 파형을 순차 감산함으로써 잔차 신호를 얻는 감산 공정과,
    상기 감산 공정에서 얻어진 상기 잔차 신호를 분석하고, 소정의 조건에 기초하여 상기 순음 분석 공정의 종료 판정을 하는 종료 조건 판정 공정과,
    상기 순음 분석 공정에서 얻어진 순음 파형의 파라미터를 정규화 및 양자화하는 정규화·양자화 공정을 갖는 것을 특징으로 하는, 음향 신호 부호화 방법.
  25. 음향 시계열 신호가 복수의 주파수 대역으로 분할되고, 적어도 1개의 주파수 대역에서, 상기 음향 시계열 신호로부터 순음 파형인 톤 성분 신호가 추출되어 부호화되며, 또한, 적어도 1개의 주파수 대역의 상기 음향 시계열 신호로부터 상기 톤 성분 신호가 추출된 잔차 시계열 신호가 부호화된 부호열을 입력하고, 해당 부호열을 복호화하는 음향 신호 복호화 방법에 있어서,
    상기 부호열을 분해하는 부호열 분해 공정과,
    상기 적어도 1개의 주파수 대역에 대하여, 상기 부호열 분해 공정에서 얻어진 톤 성분 정보에 따라서 톤 성분 시계열 신호를 합성하는 톤 성분 복호화 공정과,
    상기 적어도 1개의 주파수 대역에 대하여, 상기 부호열 분해 공정에서 얻어진 잔차 성분 정보에 따라서 잔차 성분 시계열 신호를 생성하는 잔차 성분 복호화 공정과,
    상기 톤 성분 복호화 공정에서 얻어진 톤 성분 시계열 신호와 상기 잔차 성분 부호화 공정에서 얻어진 잔차 성분 시계열 신호를 가산 합성하여 복호화 신호를 얻는 가산 공정과,
    각 대역에 대한 복호화 신호를 대역 합성하여 상기 음향 시계열 신호를 복원하는 대역 합성 공정을 갖고,
    상기 잔차 성분 정보는 시간적으로 앞의 부호화 단위의 일부분에서의 잔차 시계열 신호와 시간적으로 뒤의 부호화 단위의 일부분에서의 잔차 시계열 신호에 의해 1 부호화 단위의 잔차 시계열 신호가 생성되고, 해당 잔차 시계열 신호가 스펙트럼 변환되어, 얻어진 스펙트럼 정보의 정규화가 행해진 것이며,
    상기 잔차 성분 복호화 공정은,
    난수를 생성하는 난수 생성 공정과,
    부호화측에서의 상기 정규화로 얻어진 정규화 정보에 따라서, 상기 난수를 역정규화하여 의사 스펙트럼 정보를 생성하는 역정규화 공정과,
    상기 역정규화 공정에서 얻어진 상기 의사 스펙트럼 정보를 역스펙트럼 변환하여 의사 잔차 성분 시계열 신호를 생성하는 역스펙트럼 변환 공정을 갖는 것을 특징으로 하는, 음향 신호 복호화 방법.
  26. 음향 시계열 신호를 부호화하는 음향 신호 부호화 방법에 있어서,
    상기 음향 시계열 신호로부터 톤 성분 신호를 추출하여, 해당 톤 성분 신호를 부호화하는 톤 성분 부호화 공정과, 상기 톤 성분 부호화 공정에서 상기 음향 시계열 신호로부터 상기 톤 성분 신호를 추출한 잔차 신호를 부호화하는 잔차 성분 부호화 공정과, 상기 톤 성분 부호화 공정에서 얻어진 정보와 상기 잔차 성분 부호화 공정에서 얻어진 정보로부터 부호열을 생성하는 부호열 생성 공정을 갖는 제 1 부호화 방법에 의해 상기 음향 시계열 신호를 부호화하는 제 1 음향 신호 부호화 공정과,
    제 2 부호화 방법에 의해 상기 음향 시계열 신호를 부호화하는 제 2 음향 신호 부호화 공정과,
    상기 제 1 음향 신호 부호화 공정의 부호화 효율과 상기 제 2 음향 신호 부 호화 공정의 부호화 효율을 비교하여, 부호화 효율이 좋은 부호열을 선택하는 부호화 효율 판정 공정을 갖는 것을 특징으로 하는, 음향 신호 부호화 방법.
  27. 제 26 항에 있어서,
    상기 제 2 음향 신호 부호화 공정은,
    상기 음향 시계열 신호를 스펙트럼 변환하는 스펙트럼 변환 공정과,
    상기 스펙트럼 변환 공정에서 얻어진 스펙트럼 정보를 정규화 및 양자화하는 정규화·양자화 공정과,
    상기 정규화·양자화 공정에서 얻어진 정보로부터 부호열을 생성하는 부호열 생성 공정을 갖는 것을 특징으로 하는, 음향 신호 부호화 방법.
  28. 음향 시계열 신호로부터 톤 성분 신호를 추출하여, 해당 톤 성분 신호를 부호화한 정보와, 상기 음향 시계열 신호로부터 상기 톤 성분 신호를 추출한 잔차 신호를 부호화한 정보로부터 부호열을 생성하는 제 1 부호화 방법에 의해 상기 음향 시계열 신호를 부호화하는 제 1 음향 신호 부호화 공정과, 제 2 부호화 방법에 의해 상기 음향 시계열 신호를 부호화하는 제 2 음향 신호 부호화 공정 중, 부호화 효율이 좋은 부호열이 선택되어 입력되고, 해당 부호열을 복호화하는 음향 신호 복호화 방법에 있어서,
    상기 제 1 음향 신호 부호화 공정에서 부호화된 부호열을 입력한 경우에는 상기 부호열을 톤 성분 정보와 잔차 성분 정보로 분해하는 부호열 분해 공정과, 상기 부호열 분해 공정에서 얻어진 상기 톤 성분 정보에 따라서, 톤 성분 시계열 신호를 생성하는 톤 성분 복호화 공정과, 상기 부호열 분해 공정에서 얻어진 상기 잔차 성분 정보에 따라서, 잔차 성분 시계열 신호를 생성하는 잔차 성분 복호화 공정과, 상기 톤 성분 시계열 신호와 상기 잔차 성분 시계열 신호를 가산 합성하는 가산 공정을 갖는 제 1 음향 신호 복호화 공정에 의해, 상기 음향 시계열 신호를 복원하고,
    상기 제 2 음향 신호 부호화 공정에서 부호화된 부호열을 입력한 경우에는 상기 제 2 음향 신호 부호화 공정에 대응하는 제 2 음향 신호 복호화 공정에 의해, 상기 음향 시계열 신호를 복원하는 것을 특징으로 하는, 음향 신호 복호화 방법.
  29. 제 28 항에 있어서,
    상기 제 2 음향 신호 부호화 공정은, 상기 음향 시계열 신호를 스펙트럼 변환하여, 얻어진 스펙트럼 정보를 정규화 및 양자화한 정보로부터 부호열을 생성하는 것이며,
    상기 제 2 음향 신호 복호화 공정은,
    상기 부호열을 분해하여 양자화 스펙트럼 정보를 얻는 부호열 분해 공정과,
    상기 양자화 스펙트럼 정보를 역양자화 및 역정규화하는 역양자화·역정규화공정과,
    상기 역양자화·역정규화 공정에서 얻어진 스펙트럼 정보를 역스펙트럼 변환하는 역스펙트럼 변환 공정을 갖는 것을 특징으로 하는, 음향 신호 복호화 방법.
  30. 음향 시계열 신호를 부호화하는 음향 신호 부호화 장치에 있어서,
    상기 시계열 신호로부터 순음 파형인 톤 성분 신호를 추출하여 부호화하는 톤 성분 부호화 수단과,
    상기 톤 성분 부호화 수단에 의해서 상기 음향 시계열 신호로부터 상기 톤 성분 신호가 추출된 잔차 시계열 신호를 부호화하는 잔차 성분 부호화 수단을 구비하고,
    상기 톤 성분 부호화 수단은,
    상기 음향 시계열 신호로부터, 잔차 에너지가 최소가 되는 순음을 분석하는 순음 분석 수단과,
    상기 순음 분석 수단에서 얻어진 순음 파형의 파라미터를 사용하여 순음 파형을 합성하는 순음 합성 수단과,
    상기 음향 시계열 신호로부터 상기 순음 합성 수단에서 합성된 순음 파형을 순차 감산함으로써 잔차 신호를 얻는 감산 수단과,
    상기 감산 수단에서 얻어진 상기 잔차 신호를 분석하고, 소정의 조건에 기초하여 상기 순음 분석 수단의 종료 판정을 하는 종료 조건 판정 수단과,
    상기 순음 분석 수단에서 얻어진 순음 파형의 파라미터를 정규화 및 양자화하는 정규화·양자화 수단을 갖는 것을 특징으로 하는, 음향 신호 부호화 장치.
  31. 음향 시계열 신호로부터 순음 파형인 톤 성분 신호를 추출하여, 해당 톤 성분 신호를 부호화하고, 또한, 상기 음향 시계열 신호로부터 상기 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화하여 이루어지는 부호열을 입력하여, 해당 부호열을 복호화하는 음향 신호 복호화 장치에 있어서,
    상기 부호열을 분해하는 부호열 분해 수단과,
    상기 부호열 분해 수단에 의해서 얻어진 톤 성분 정보에 따라서, 톤 성분 시계열 신호를 복호화하는 톤 성분 복호화 수단과,
    상기 부호열 분해 수단에 의해서 얻어진 잔차 성분 정보에 따라서, 잔차 성분 시계열 신호를 복호화하는 잔차 성분 복호화 수단과,
    상기 톤 성분 복호화 수단에 의해서 얻어진 톤 성분 시계열 신호와 잔차 성분 복호화 수단에 의해서 얻어진 잔차 성분 시계열 신호를 가산하여 상기 음향 시계열 신호를 복원하는 가산 수단을 구비하고,
    상기 잔차 성분 정보는 시간적으로 앞의 부호화 단위의 일부분에서의 잔차 시계열 신호와 시간적으로 뒤의 부호화 단위의 일부분에서의 잔차 시계열 신호에 의해 1 부호화 단위의 잔차 시계열 신호가 생성되고, 해당 잔차 시계열 신호가 스펙트럼 변환되어, 얻어진 스펙트럼 정보의 정규화가 행해진 것이며,
    상기 잔차 성분 복호화 수단은,
    난수를 생성하는 난수 생성 수단과,
    부호화측에서의 상기 정규화로 얻어진 정규화 정보에 따라서, 상기 난수를 역정규화하여 의사 스펙트럼 정보를 생성하는 역정규화 수단과,
    상기 역정규화 수단에서 얻어진 상기 의사 스펙트럼 정보를 역스펙트럼 변환하여 의사 잔차 성분 시계열 신호를 생성하는 역스펙트럼 변환 수단을 갖는 것을 특징으로 하는, 음향 신호 복호화 장치.
  32. 음향 시계열 신호를 부호화하는 음향 신호 부호화 프로그램이 기록된 컴퓨터 제어 가능한 기록 매체에 있어서,
    상기 음향 신호 부호화 프로그램은,
    상기 음향 시계열 신호로부터 순음 파형인 톤 성분 신호를 추출하여 부호화하는 톤 성분 부호화 공정과,
    상기 톤 성분 부호화 공정에서, 상기 음향 시계열 신호로부터 상기 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화하는 잔차 성분 부호화 공정을 갖고,
    상기 톤 성분 부호화 공정은,
    상기 음향 시계열 신호로부터, 잔차 에너지가 최소가 되는 순음을 분석하는 순음 분석 공정과,
    상기 순음 분석 공정에서 얻어진 순음 파형의 파라미터를 사용하여 순음 파형을 합성하는 순음 합성 공정과,
    상기 음향 시계열 신호로부터 상기 순음 합성 공정에서 합성된 순음 파형을 순차 감산함으로써 잔차 신호를 얻는 감산 공정과,
    상기 감산 공정에서 얻어진 상기 잔차 신호를 분석하고, 소정의 조건에 기초하여 상기 순음 분석 공정의 종료 판정을 하는 종료 조건 판정 공정과,
    상기 순음 분석 공정에서 얻어진 순음 파형의 파라미터를 정규화 및 양자화하는 정규화·양자화 공정을 갖는 것을 특징으로 하는, 음향 신호 부호화 프로그램이 기록된 기록 매체.
  33. 음향 시계열 신호로부터 순음 파형인 톤 성분 신호를 추출하고, 해당 톤 성분 신호를 부호화하고, 또한, 상기 음향 시계열 신호로부터 상기 톤 성분 신호를 추출한 잔차 신호를 부호화하여 이루어지는 부호열을 복호화하는 음향 신호 복호화 프로그램이 기록된 컴퓨터 제어 가능한 기록 매체에 있어서,
    상기 음향 신호 복호화 프로그램은,
    상기 부호열을 분해하는 부호열 분해 공정과,
    상기 부호열 분해 공정에서 얻어진 톤 성분 정보에 따라서, 톤 성분 시계열 신호를 복호화하는 톤 성분 복호화 공정과,
    상기 부호열 분해 공정에서 얻어진 잔차 성분 정보에 따라서, 잔차 성분 시계열 신호를 복호화하는 잔차 성분 복호화 공정과,
    상기 톤 성분 복호화 공정에서 얻어진 톤 성분 시계열 신호와 잔차 성분 복호화 공정에서 얻어진 잔차 성분 시계열 신호를 가산하여 상기 음향 시계열 신호를 복원하는 가산 공정을 갖고,
    상기 잔차 성분 정보는 시간적으로 앞의 부호화 단위의 일부분에서의 잔차 시계열 신호와 시간적으로 뒤의 부호화 단위의 일부분에서의 잔차 시계열 신호에 의해 1 부호화 단위의 잔차 시계열 신호가 생성되고, 해당 잔차 시계열 신호가 스펙트럼 변환되어, 얻어진 스펙트럼 정보의 정규화가 행해진 것이며,
    상기 잔차 성분 복호화 공정은,
    난수를 생성하는 난수 생성 공정과,
    부호화측에서의 상기 정규화로 얻어진 정규화 정보에 따라서, 상기 난수를 역정규화하여 의사 스펙트럼 정보를 생성하는 역정규화 공정과,
    상기 역정규화 공정에서 얻어진 상기 의사 스펙트럼 정보를 역스펙트럼 변환하여 의사 잔차 성분 시계열 신호를 생성하는 역스펙트럼 변환 공정을 갖는 것을 특징으로 하는, 음향 신호 복호화 프로그램이 기록된 기록 매체.
  34. 음향 시계열 신호로부터 순음 파형인 톤 성분 신호를 추출하여, 해당 톤 성분 신호를 부호화하는 공정과, 또한, 상기 음향 시계열 신호로부터 상기 톤 성분 신호를 추출한 잔차 시계열 신호를 부호화하는 공정에 의해 이루어지는 부호열이 기록되어 이루어진 데이터를 컴퓨터 판독가능한 기록 매체로서,
    상기 톤 성분 신호를 부호화하는 공정은,
    상기 음향 시계열 신호로부터, 잔차 에너지가 최소가 되는 순음을 분석하는 순음 분석 공정과,
    상기 순음 분석 공정에서 얻어진 순음 파형의 파라미터를 사용하여 순음 파형을 합성하는 순음 합성 공정과,
    상기 음향 시계열 신호로부터 상기 순음 합성 공정에서 합성된 순음 파형을 순차 감산함으로써 잔차 신호를 얻는 감산 공정과,
    상기 감산 공정에서 얻어진 상기 잔차 신호를 분석하고, 소정의 조건에 기초하여 상기 순음 분석 공정의 종료 판정을 하는 종료 조건 판정 공정과,
    상기 순음 분석 공정에서 얻어진 순음 파형의 파라미터를 정규화 및 양자화하는 정규화·양자화 공정을 갖는, 컴퓨터 판독가능한 기록 매체.
KR1020037002141A 2001-06-15 2002-06-11 음향 신호 부호화 방법 및 장치, 음향 신호 복호화 방법및 장치, 및 기록 매체 KR100922702B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001182384A JP4622164B2 (ja) 2001-06-15 2001-06-15 音響信号符号化方法及び装置
JPJP-P-2001-00182384 2001-06-15
PCT/JP2002/005809 WO2002103682A1 (en) 2001-06-15 2002-06-11 Acoustic signal encoding method and apparatus, acoustic signal decoding method and apparatus, and recording medium

Publications (2)

Publication Number Publication Date
KR20030022894A KR20030022894A (ko) 2003-03-17
KR100922702B1 true KR100922702B1 (ko) 2009-10-22

Family

ID=19022496

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020037002141A KR100922702B1 (ko) 2001-06-15 2002-06-11 음향 신호 부호화 방법 및 장치, 음향 신호 복호화 방법및 장치, 및 기록 매체

Country Status (5)

Country Link
US (1) US7447640B2 (ko)
JP (1) JP4622164B2 (ko)
KR (1) KR100922702B1 (ko)
CN (1) CN1291375C (ko)
WO (1) WO2002103682A1 (ko)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004049311A1 (en) * 2002-11-27 2004-06-10 Koninklijke Philips Electronics N.V. Sinusoidal audio coding
WO2006051451A1 (en) * 2004-11-09 2006-05-18 Koninklijke Philips Electronics N.V. Audio coding and decoding
KR100707174B1 (ko) * 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
JP4635709B2 (ja) * 2005-05-10 2011-02-23 ソニー株式会社 音声符号化装置及び方法、並びに音声復号装置及び方法
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
JP4606264B2 (ja) * 2005-07-19 2011-01-05 三洋電機株式会社 ノイズキャンセラ
US20070033042A1 (en) * 2005-08-03 2007-02-08 International Business Machines Corporation Speech detection fusing multi-class acoustic-phonetic, and energy features
US7962340B2 (en) * 2005-08-22 2011-06-14 Nuance Communications, Inc. Methods and apparatus for buffering data for use in accordance with a speech recognition system
US8620644B2 (en) 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
RU2439721C2 (ru) 2007-06-11 2012-01-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Аудиокодер для кодирования аудиосигнала, имеющего импульсоподобную и стационарную составляющие, способы кодирования, декодер, способ декодирования и кодированный аудиосигнал
KR101411901B1 (ko) * 2007-06-12 2014-06-26 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
CN101488344B (zh) * 2008-01-16 2011-09-21 华为技术有限公司 一种量化噪声泄漏控制方法及装置
CN101521010B (zh) * 2008-02-29 2011-10-05 华为技术有限公司 一种音频信号的编解码方法和装置
CN101615395B (zh) 2008-12-31 2011-01-12 华为技术有限公司 信号编码、解码方法及装置、***
CN105374362B (zh) * 2010-01-08 2019-05-10 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置以及记录介质
US10312933B1 (en) 2014-01-15 2019-06-04 Sprint Spectrum L.P. Chord modulation communication system
JP6086999B2 (ja) * 2014-07-28 2017-03-01 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ハーモニクス低減を使用して第1符号化アルゴリズムと第2符号化アルゴリズムの一方を選択する装置及び方法
CN109817196B (zh) * 2019-01-11 2021-06-08 安克创新科技股份有限公司 一种噪音消除方法、装置、***、设备及存储介质
CN113724725B (zh) * 2021-11-04 2022-01-18 北京百瑞互联技术有限公司 一种蓝牙音频啸叫检测抑制方法、装置、介质及蓝牙设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995027335A1 (fr) * 1994-04-01 1995-10-12 Sony Corporation Methode et dispositif de codage et de decodage d'informations, methode de transmission d'informations et support d'enregistrement de l'information
KR960700570A (ko) * 1993-11-04 1996-01-20 오오가 노리오 신호 부호화 장치, 신호 복호화 장치, 기록 매체 및 신호 부호화 방법(Signal encoding apparatus, signal decoding apparatus, recording medium, and signal encoding method)
US5717821A (en) * 1993-05-31 1998-02-10 Sony Corporation Method, apparatus and recording medium for coding of separated tone and noise characteristic spectral components of an acoustic sibnal
KR19980071716A (ko) * 1997-02-26 1998-10-26 이데이 노부유키 정보 부호화 방법과 장치와 정보 복호화 방법과 장치 및 정보기록 매체

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3275249B2 (ja) * 1991-09-05 2002-04-15 日本電信電話株式会社 音声符号化・復号化方法
TW327223B (en) 1993-09-28 1998-02-21 Sony Co Ltd Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal
JP3685823B2 (ja) 1993-09-28 2005-08-24 ソニー株式会社 信号符号化方法及び装置、並びに信号復号化方法及び装置
JP3465341B2 (ja) 1994-04-28 2003-11-10 ソニー株式会社 オーディオ信号符号化方法
JP3277699B2 (ja) 1994-06-13 2002-04-22 ソニー株式会社 信号符号化方法及び装置並びに信号復号化方法及び装置
JP3250376B2 (ja) 1994-06-13 2002-01-28 ソニー株式会社 情報符号化方法及び装置並びに情報復号化方法及び装置
JPH07336231A (ja) 1994-06-13 1995-12-22 Sony Corp 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
TW295747B (ko) * 1994-06-13 1997-01-11 Sony Co Ltd
JPH0934493A (ja) 1995-07-20 1997-02-07 Graphics Commun Lab:Kk 音響信号符号化装置、音響信号復号装置および音響信号処理装置
JPH09101799A (ja) 1995-10-04 1997-04-15 Sony Corp 信号符号化方法及び装置
US5886276A (en) 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
US6064954A (en) * 1997-04-03 2000-05-16 International Business Machines Corp. Digital audio signal coding
US6078880A (en) * 1998-07-13 2000-06-20 Lockheed Martin Corporation Speech coding system and method including voicing cut off frequency analyzer
US6266644B1 (en) 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
JP2000122676A (ja) * 1998-10-15 2000-04-28 Takayoshi Hirata 音楽信号の波形符号化方式
JP2000267686A (ja) * 1999-03-19 2000-09-29 Victor Co Of Japan Ltd 信号伝送方式及び復号化装置
JP3434260B2 (ja) 1999-03-23 2003-08-04 日本電信電話株式会社 オーディオ信号符号化方法及び復号化方法、これらの装置及びプログラム記録媒体
JP2001007704A (ja) * 1999-06-24 2001-01-12 Matsushita Electric Ind Co Ltd トーン成分データの適応オーディオ符号化方法
ES2248112T3 (es) 1999-08-27 2006-03-16 Koninklijke Philips Electronics N.V. Codificacion de audio.

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5717821A (en) * 1993-05-31 1998-02-10 Sony Corporation Method, apparatus and recording medium for coding of separated tone and noise characteristic spectral components of an acoustic sibnal
KR960700570A (ko) * 1993-11-04 1996-01-20 오오가 노리오 신호 부호화 장치, 신호 복호화 장치, 기록 매체 및 신호 부호화 방법(Signal encoding apparatus, signal decoding apparatus, recording medium, and signal encoding method)
WO1995027335A1 (fr) * 1994-04-01 1995-10-12 Sony Corporation Methode et dispositif de codage et de decodage d'informations, methode de transmission d'informations et support d'enregistrement de l'information
KR19980071716A (ko) * 1997-02-26 1998-10-26 이데이 노부유키 정보 부호화 방법과 장치와 정보 복호화 방법과 장치 및 정보기록 매체

Also Published As

Publication number Publication date
US20040024593A1 (en) 2004-02-05
KR20030022894A (ko) 2003-03-17
JP2002372996A (ja) 2002-12-26
CN1465044A (zh) 2003-12-31
JP4622164B2 (ja) 2011-02-02
CN1291375C (zh) 2006-12-20
US7447640B2 (en) 2008-11-04
WO2002103682A1 (en) 2002-12-27

Similar Documents

Publication Publication Date Title
KR100922702B1 (ko) 음향 신호 부호화 방법 및 장치, 음향 신호 복호화 방법및 장치, 및 기록 매체
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
US6694292B2 (en) Apparatus for encoding and apparatus for decoding speech and musical signals
JP5343098B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
KR101373004B1 (ko) 고주파수 신호 부호화 및 복호화 장치 및 방법
JP4296752B2 (ja) 符号化方法及び装置、復号方法及び装置、並びにプログラム
KR101390188B1 (ko) 적응적 고주파수영역 부호화 및 복호화 방법 및 장치
JP2005528647A (ja) 合成発話の周波数選択的ピッチ強調方法およびデバイス
EP0966793A1 (en) Audio coding method and apparatus
JP2003337598A (ja) 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
KR100352351B1 (ko) 정보부호화방법및장치와정보복호화방법및장치
JP2002372996A5 (ko)
JP4603485B2 (ja) 音声・楽音符号化装置及び音声・楽音符号化方法
US7363216B2 (en) Method and system for parametric characterization of transient audio signals
KR100754033B1 (ko) 스펙트럼 향상을 구현하기 위한 방법 및 장치
KR100789368B1 (ko) 잔차 신호 부호화 및 복호화 장치와 그 방법
KR100952065B1 (ko) 부호화 방법 및 장치, 및 복호 방법 및 장치
Robinson Speech analysis
BR112019020491A2 (pt) aparelho e método para pós-processamento de um sinal de áudio usando formato com base em previsão
CA3118121C (en) Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction
JP3437421B2 (ja) 楽音符号化装置及び楽音符号化方法並びに楽音符号化プログラムを記録した記録媒体
KR100718487B1 (ko) 디지털 음성 코더들에서의 고조파 잡음 가중
JP4287840B2 (ja) 符号化装置
JP2900431B2 (ja) 音声信号符号化装置
KR100817424B1 (ko) 부호화 장치 및 복호 장치

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121008

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20131004

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20141006

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee