KR100941011B1 - 부호화 방법 및 장치, 및 복호 방법 및 장치 - Google Patents

부호화 방법 및 장치, 및 복호 방법 및 장치 Download PDF

Info

Publication number
KR100941011B1
KR100941011B1 KR1020047000175A KR20047000175A KR100941011B1 KR 100941011 B1 KR100941011 B1 KR 100941011B1 KR 1020047000175 A KR1020047000175 A KR 1020047000175A KR 20047000175 A KR20047000175 A KR 20047000175A KR 100941011 B1 KR100941011 B1 KR 100941011B1
Authority
KR
South Korea
Prior art keywords
spectrum
power
power adjustment
power correction
encoding
Prior art date
Application number
KR1020047000175A
Other languages
English (en)
Other versions
KR20040101180A (ko
Inventor
토우야마케이수케
스즈끼시로
쯔지미노루
Original Assignee
소니 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 주식회사 filed Critical 소니 주식회사
Publication of KR20040101180A publication Critical patent/KR20040101180A/ko
Application granted granted Critical
Publication of KR100941011B1 publication Critical patent/KR100941011B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 복호 장치(30)에 있어서, 파워 보정용 스펙트럼 생성 합성부(371 내지 374)는 양자화 정밀도 정보, 정규화 계수, 게인 제어 정보 및 파워 조정 정보에 기초하여 파워 보정용 스펙트럼(PCSP)의 파워 조정을 행한다. 그리고, 임계치 이하의 스펙트럼을 파워 조정 후의 파워 보정용 스펙트럼(PCSP)으로 바꿈으로써 또는 스펙트럼(SP)에 파워 조정 후의 파워 보정용 스펙트럼(PCSP)을 더하는 것으로 스펙트럼(SP)의 파워 보정을 행한다.
Figure R1020047000175
파워 보정용 스펙트럼, 정규화 계수, 게인 제어 정보, 파워 조정 정보치, 가우스 분포 수치열, 양자화 정밀도 정보, 스펙트럼 변환부, 대역 분할부

Description

부호화 방법 및 장치, 및 복호 방법 및 장치{Coding method, coding device, decoding method, and decoding device}
본 발명은 부호화 방법 및 장치, 복호 방법 및 장치, 및 프로그램 및 기록매체에 관한 것으로, 특히, 음향 신호나 음성 신호 등의 디지털 데이터를 고능률 부호화하여 전송하고, 또는 기록매체에 기록하는 부호화 방법 및 그 장치, 부호화 데이터를 수신하고, 또는 재생하여 복호하는 복호 방법 및 그 장치, 및 부호화 처리 또는 복호 처리를 컴퓨터에 실행시키는 프로그램 및 그와 같은 프로그램이 기록된 컴퓨터 판독 가능 기록매체에 관한 것이다.
본 출원은 일본에서 2002년 5월 7일에 출원된 일본 특허출원번호 2002-132188을 기초로 하여 우선권을 주장하는 것으로, 이 출원은 참조함으로써, 본 출원에 원용된다.
종래부터, 음성 등의 오디오 신호를 고능률 부호화하는 수법으로서는, 예를 들면 대역 분할 부호화(서브 밴드 코딩) 등으로 대표되는 비블록화 주파수 대역 분할방식이나 변환 부호화 등으로 대표되는 블록화 주파수 대역 분할방식 등이 알려 져 있다.
비블록화 주파수 대역 분할방식에서는 시간축상의 오디오 신호를 블록화하지 않고 복수의 주파수 대역으로 분할하여 부호화를 한다. 또한, 블록화 주파수 대역 분할방식에서는 시간축상의 신호를 주파수축상의 신호로 변환(스펙트럼 변환)하여 복수의 주파수 대역으로 분할하여, 즉, 스펙트럼 변환하여 얻어지는 계수를 소정의 주파수 대역마다 정리하여, 각 대역마다 부호화를 한다.
또한, 부호화 효율을 더욱 향상시키는 수법으로서, 상술한 비블록화 주파수 대역 분할방식과 블록화 주파수 대역 분할방식을 조합한 고능률 부호화의 수법도 제안되고 있다. 이 수법에 의하면, 예를 들면, 대역 분할 부호화로 대역 분할을 한 후, 각 대역마다의 신호를 주파수축상의 신호로 스펙트럼 변환하고, 이 스펙트럼 변환된 각 대역마다 부호화가 행하여진다.
여기서, 주파수 대역 분할을 할 때는 처리가 간단하고, 또한, 반환 왜곡이 소거되기 때문에, 예를 들면, QMF(Quadrature Mirror Filter)가 사용되는 경우가 많다. 또, QMF에 의한 주파수 대역 분할의 상세에 대해서는 「1976 R.E.Crochiere, Digital coding of speech in subbands, Bell Syst. Tech. J. Vol. 55, No. 8 1976」 등에 기재되어 있다.
또한, 대역 분할을 하는 수법으로서 이밖에, 예를 들면, 등밴드폭의 필터 분할 수법인 PQF(Polyphase Quadrature Filter) 등이 있다. 이 PQF의 상세에 대해서는, 「ICASSP 83 BOSTON, Polyphase Quadrature filters-A new subband coding technique, Joseph H. Rothweiler」 등에 기재되어 있다.
한편, 상술한 스펙트럼 변환으로서는 예를 들면, 입력 오디오 신호를 소정 단위시간의 프레임으로 블록화하여, 블록마다 이산 푸리에 변환(Discrete Fourier Transformation : DFT), 이산 코사인 변환(Discrete Cosine Transformation : DCT), 개량 DCT 변환(Modified Discrete Cosine Transformation : MDCT) 등을 행하는 것으로 시간축 신호를 주파수축 신호로 변환하는 것이다.
또, MDCT에 관해서는 「ICASSP 1987, Subband/Transform Coding Using Filter bank Designs Based on Time Domain Aliasing Cancellation, J. P. Princen, A.B. Bradley, Univ. of Surrey Royal Melbourne Inst. of Tech.」 등에, 그 상세가 기재되어 있다.
이와 같이 필터나 스펙트럼 변환에 의해서 얻어지는 대역마다의 신호를 양자화함으로써, 양자화 잡음이 발생하는 대역을 제어할 수 있고, 이것에 의해 마스킹효과 등의 성질을 이용하여 청각적으로 더욱 고능률의 부호화를 할 수 있다. 또한, 양자화를 하기 전에 각 대역마다의 신호 성분을, 예를 들면 그 대역에 있어서의 신호 성분의 절대값의 최대치로 정규화하도록 하면, 더욱 고능률의 부호화를 할 수 있다.
대역 분할을 할 때의 각 주파수 대역의 폭은 예를 들면, 인간의 청각 특성을 고려하여 결정된다. 즉 일반적으로는, 예를 들면, 임계 대역(critical band)이라고 불리고 있는, 고역일수록 폭이 넓어지는 대역폭으로, 오디오 신호를 복수(예를 들면 32밴드 등)의 대역으로 분할하는 것이 있다.
또한, 각 대역마다의 데이터를 부호화할 때는 각 대역마다 소정의 비트 배분, 또는 각 대역마다 적응적인 비트 할당(bit allocation)이 행하여진다. 즉, 예를 들면, MDCT 처리되어 얻어진 계수 데이터를 비트 할당에 의해서 부호화할 때는, 블록마다의 신호를 MDCT 처리하여 얻어지는 각 대역의 MDCT 계수 데이터에 대하여, 적응적으로 비트수가 할당되어 부호화가 행하여진다.
비트 할당수법으로서는 예를 들면, 각 대역마다의 신호의 크기에 기초하여 비트 할당을 하는 수법(이하, 적절하게 제 1 비트 할당수법이라고 함)이나, 청각 마스킹을 이용하는 것으로 각 대역마다 필요한 신호 대 잡음비를 얻어 고정적인 비트 할당을 하는 수법(이하, 적절하게 제 2 비트 할당수법이라고 함) 등이 알려져 있다.
또, 제 1 비트 할당수법에 관해서는, 예를 들면, 「Adaptive Transform Coding of Speech Signals, R. Zelinski and P. Noll, IEEE Transactions of Accoustics, Speech and Signal Processing, vol. ASSP-25, No.4, August 1977」 등에 그 상세가 기재되어 있다.
또한, 제 2 비트 할당수법에 관해서는, 예를 들면, 「ICASSP 1980, The critical band coder digital encoding of the perceptual requirements of the auditory system, M.A. Kransner MIT」 등에 그 상세가 기재되어 있다.
제 1 비트 할당수법에 의하면, 양자화 잡음 스펙트럼이 평탄해져, 잡음 에너지가 최소가 된다. 그렇지만, 청감각적으로는 마스킹 효과가 이용되지 않기 때문에, 실제의 청감상의 잡음감은 최적이 되지는 않는다. 또한, 제 2 비트 할당수법에서는, 어떤 주파수에 에너지가 집중하는 경우, 예를 들면, 사인파 등을 입력한 경우에도, 비트 할당이 고정적이기 때문에, 특성치가 그 만큼 좋은 값은 되지 않는다.
그래서, 비트 할당에 사용할 수 있는 전체 비트를, 각 소블록마다 미리 정해진 고정 비트 할당 패턴분과, 각 블록의 신호의 크기에 의존한 비트 배분을 하는 분으로 분할하여 사용하고, 그 분할비를 입력 신호에 관계하는 신호에 의존시키는, 즉, 예를 들면, 그 신호의 스펙트럼이 매끄러울수록 고정 비트 할당 패턴분에 대한 분할 비율을 크게 하는 고능률 부호화 장치가 제안되어 있다.
이 방법에 의하면, 사인파 입력과 같이 특정한 스펙트럼에 에너지가 집중하는 경우에는, 그 스펙트럼을 포함하는 블록에 대부분의 비트가 할당되고, 이것에 의해 전체의 신호 대 잡음 특성을 비약적으로 개선할 수 있다. 일반적으로, 급준한 스펙트럼 성분을 갖는 신호에 대하여 인간의 청각은 지극히 민감하기 때문에, 상술한 바와 같이 하여 신호 대 잡음 특성을 개선하는 것은, 단지 측정상의 수치를 향상시키는 것뿐만 아니라, 청감상의 음질을 개선하는 것에도 유효하다.
비트 할당 방법으로서는, 이밖에도 수많은 방법이 제안되고 있고, 또한 청각에 관한 모델이 정밀화되어, 부호화 장치의 능력이 향상되면, 청각적인 관점에서 더욱 고능률의 부호화가 가능해진다.
파형 신호를 스펙트럼으로 변환하는 방법으로서 DFT나 DCT를 사용한 경우에는, M개의 샘플로 이루어지는 시간 블록으로 변환을 하면, M개의 독립의 실수 데이터가 얻어진다. 하지만 통상은, 시간 블록(프레임)간의 접속 왜곡을 경감하기 위해서, 1개의 블록은 양 인접하는 블록과 각각 소정의 수 M1개의 샘플씩 오버랩시켜 구성되기 때문에, DFT나 DCT를 이용한 부호화 방법에서는, 평균하여 (M-M1)개의 샘플에 대하여 M개의 실수 데이터를 양자화하여 부호화하게 된다.
또한, 시간축상의 신호를 스펙트럼으로 변환하는 방법으로서 MDCT를 사용한 경우에는, 양 인접하는 블록과 M개씩 오버랩시킨 2M개의 샘플로부터, 독립의 M개의 실수 데이터가 얻어진다. 따라서 이 경우에는 평균하여 M개의 샘플에 대하여 M개의 실수 데이터를 양자화하여 부호화하게 된다. 이 경우, 복호 장치에 있어서는, 상술한 바와 같이 하여 MDCT를 사용하여 얻어지는 부호로부터, 각 블록에 있어서 역변환을 실시하여 얻어지는 파형 요소를 서로 간섭시키면서 합함으로써, 파형 신호가 재구성된다.
일반적으로, 변환을 위한 시간 블록(프레임)을 길게 함으로써, 스펙트럼의 주파수 분해 능력이 높아지고, 특정한 스펙트럼 성분에 에너지가 집중한다. 따라서, 양 인접하는 블록과 반씩 오버랩시켜 긴 블록 길이로 변환을 하고, 또한 얻어진 스펙트럼 신호의 개수가 원래의 시간 샘플의 개수에 대하여 증가하지 않는 MDCT를 사용하는 경우, DFT나 DCT를 사용한 경우보다도 효율이 좋은 부호화를 하는 것이 가능해진다. 또한, 인접하는 블록끼리에 충분히 긴 오버랩을 갖게 함에 따라, 파형 신호의 블록간 왜곡을 경감할 수도 있다.
실제의 부호열을 구성하는 것에 있어서는, 우선 정규화 및 양자화가 행하여지는 대역마다 양자화를 할 때의 양자화 스텝을 나타내는 정보인 양자화 정밀도 정보와 각 신호 성분을 정규화하는 데 사용한 계수를 나타내는 정보인 정규화 계수를 소정의 비트수로 부호화하고, 다음에 정규화 및 양자화된 스펙트럼 신호를 부호화 한다.
여기서, 예를 들면, 「IDO/IEC 11172-3 : 1993(E), 1993」에는, 대역에 의해서 양자화 정밀도 정보를 나타내는 비트수가 다르도록 설정된 고능률 부호화방식이 기술되어 있고, 이것에 의하면, 고역의 대역일수록 양자화 정밀도 정보를 나타내는 비트수가 작아지도록 규격화되어 있다.
도 1에, 예를 들면 오디도 신호를 주파수 대역 분할하여 부호화하는 종래의 부호화 장치(100)의 구성의 일례를 나타낸다. 대역 분할부(101)는, 부호화해야 할 오디오 신호를 입력하고, 상술한 QMF 또는 PQF 등의 필터를 사용하여, 이 오디오 신호를 예를 들면 4개의 주파수 대역의 신호로 대역 분할한다. 또, 대역 분할부(101)에서 오디오 신호를 대역 분할할 때의 각 대역(이하, 적절하게, 부호화 유닛이라고 함)의 폭은, 균일하여도, 또한 임계 대역폭에 맞도록 불균일하게 하여도 좋다. 또한, 오디오 신호는, 4개의 부호화 유닛으로 분할되도록 이루어져 있지만, 부호화 유닛의 수는, 이것에 한정되는 것은 아니다. 그리고, 대역 분할부(101)는, 4개의 부호화 유닛(이하, 적절하게, 4개의 부호화 유닛 각각을, 제 1 내지 제 4 부호화 유닛이라고 함)으로 분해된 신호를, 소정의 시간 블록(프레임)마다, 게인 제어부(1021 내지 1024)에 공급한다.
게인 제어부(1021 내지 1024)는 각 블록 내의 신호의 진폭에 따라서 게인 제어 정보를 생성하고, 이 게인 제어 정보에 기초하여 블록 내의 신호의 게인 제어를 한다. 그리고, 게인 제어부(1021 내지 1024)는, 게인 제어를 한 결과 얻어진 제 1 내지 제 4 부호화 유닛의 신호를 스펙트럼 변환부(1031 내지 1034)에 공급하는 동시에, 게인 제어 정보를 멀티플렉서(107)에 공급한다.
스펙트럼 변환부(1031 내지 1034)는 게인 제어된 각 부호화 유닛의 시간축상의 신호에 대하여 MDCT 등의 스펙트럼 변환을 하여 주파수 축상의 신호를 생성하고, 이 주파수 축상의 신호를 정규화부(1041 내지 1044) 및 양자화 정밀도 결정부(105)에 공급한다.
정규화부(1041 내지 1044)는 제 1 내지 제 4 부호화 유닛의 신호 각각을 구성하는 각 신호 성분으로부터 절대치가 최대인 것을 추출하고, 이 값에 대응하는 계수를 제 1 내지 제 4 부호화 유닛의 정규화 계수로 한다. 그리고, 정규화부(1041 내지 1044)는 제 1 내지 제 4 부호화 유닛의 신호를 구성하는 각 신호 성분을 제 1 내지 제 4 부호화 유닛의 정규화 계수에 대응하는 값으로 각각 정규화한다(제산한다). 따라서, 이 경우, 정규화에 의해 얻어지는 피정규화 데이터는 -1.0 내지 1.0의 범위의 값이 된다. 정규화부(1041 내지 1044)는 제 1 내지 제 4 부호화 유닛의 피정규화 데이터를 각각 양자화부(1061 내지 1064)에 공급하는 동시에, 제 1 내지 제 4 부호화 유닛의 정규화 계수를 멀티플렉서(107)에 공급한다.
양자화 정밀도 결정부(105)는 게인 제어부(1021 내지 1024)로부터 공급된 제 1 내지 제 4 부호화 유닛의 신호에 기초하여, 제 1 내지 제 4 부호화 유닛의 피정규화 데이터 각각을 양자화할 때의 양자화 스텝을 결정한다. 그리고 양자화 정밀도 결정부(105)는 그 양자화 스텝에 대응하는 제 1 내지 제 4 부호화 유닛의 양자화 정밀도 정보를, 양자화부(1061 내지 1064)에 각각 공급하는 동시에, 멀티플렉서(107)에도 공급한다.
양자화부(1061 내지 1064)는 제 1 내지 제 4 부호화 유닛의 피정규화 데이터를, 제 1 내지 제 4 부호화 유닛의 양자화 정밀도 정보에 대응하는 양자화 스텝에서 각각 양자화함으로써 부호화하여, 그 결과 얻어지는 제 1 내지 제 4 부호화 유닛의 양자화 계수를 멀티플렉서(107)에 공급한다.
멀티플렉서(107)는 제 1 내지 제 4 부호화 유닛의 양자화 계수, 양자화 정밀도 정보, 정규화 계수 및 게인 제어 정보를 필요에 따라서 부호화한 후, 다중화한다. 그리고, 멀티플렉서(107)는 다중화의 결과 얻어지는 부호화 데이터를 전송로를 통해서 전송하거나, 또는 도시하지 않은 기록매체에 기록한다.
또, 양지화 정밀도 결정부(105)는 대역 분할하여 얻어진 신호에 기초하여 양자화 스텝을 결정하는 것 외에, 예를 들면, 정규화 데이터에 기초하여 양자화 스텝을 결정하거나, 또한, 마스킹 효과 등의 청각 현상을 고려하여 양자화 스텝을 결정하거나 할 수 있다.
이상과 같은 구성을 구비하는 부호화 장치(100)로부터 출력되는 부호화 데이터를 복호하는 복호 장치의 구성의 일례를 도 2에 나타낸다. 도 2에 나타내는 복호 장치(120)에 있어서, 디멀티플렉서(121)는 입력한 부호화 데이터를 복호하여, 제 1 내지 제 4 부호화 유닛의 양자화 계수, 양자화 정밀도 정보, 정규화 계수 및 게인 제어 정보로 분리한다. 그리고 디멀티플렉서(121)는 제 1 내지 제 4 부호화 유닛의 양자화 계수, 양자화 정밀도 정보 및 정규화 계수를, 각각의 부호화 유닛에 대응하는 신호 성분 구성부(1221 내지 1224)에 공급하는 동시에, 제 1 내지 제 4 부호화 유닛의 게인 제어 정보를, 각각의 부호화 유닛에 대응하는 게인 제어부(1241 내지 1244)에 공급한다.
신호 성분 구성부(1221)는 제 1 부호화 유닛의 양자화 계수를 제 1 부호화 유닛의 양자화 정밀도 정보에 대응한 양자화 스텝으로 역양자화하여, 제 1 부호화 유닛의 피정규화 데이터를 생성한다. 또한, 신호 성분 구성부(1221)는 제 1 부호화 유닛의 피정규화 데이터에, 제 1 부호화 유닛의 정규화 계수에 대응하는 값을 승산하여 복호하여, 얻어진 제 1 부호화 유닛의 신호를 스펙트럼 역변환부(1231)에 공급한다.
신호 성분 구성부(1222 내지 1224)도 같은 처리를 하여 제 2 내지 제 4 부호화 유닛의 신호를 복호하고, 이들의 신호를 스펙트럼 역변환부(1232 내지 1234)에 공급한다.
스펙트럼 역변환부(1231 내지 1234)는 복호된 주파수축상의 신호에 대하여 IMDCT(Inverse MDCT) 등의 스펙트럼 역변환을 하여 시간축상의 신호를 생성하고, 이 시간축상의 신호를 게인 제어부(1241 내지 1244)에 공급한다.
게인 제어부(1241 내지 1244)는 디멀티플렉서(121)로부터 공급된 게인 제어 정보에 기초하여 게인 제어 보정 처리를 하고, 얻어진 제 1 내지 제 4 부호화 유닛의 신호를 대역 합성부(125)에 공급한다.
대역 합성부(125)는 게인 제어부(1241 내지 1244)로부터 공급된 제 1 내지 제 4 부호화 유닛의 신호를 대역 합성하고, 이것에 의해 원래의 오디오 신호를 복원한다.
그런데, 도 1의 부호화 장치(100)로부터 도 2의 복호 장치(120)에 공급(전송)되는 부호화 데이터에는, 양자화 정밀도 정보가 포함되어 있기 때문에, 복호 장치(120)에 있어서 사용되는 청각 모델은 임의로 설정할 수 있다. 즉, 부호화 장치(100)에 있어서 각 부호화 유닛에 대한 양자화 스텝을 자유롭게 설정할 수 있고, 부호화 장치(100)의 연산능력의 향상이나 청각 모델의 정밀화에 수반하여, 복호 장치(120)를 변경하지 않고 음질의 개선이나 압축율의 향상을 도모할 수 있다.
그렇지만 이 경우, 양자화 정밀도 정보 그 자체를 부호화하기 위한 비트수가 커져, 전체의 부호화 효율을 어떤 값 이상으로 향상시키는 것이 곤란하였다.
그래서, 양자화 정밀도 정보를 직접 부호화하는 대신에, 복호 장치에 있어서, 예를 들면 정규화 정보로부터 양자화 정밀도 정보를 결정하는 방법이 있지만, 이 방법으로는, 규격을 결정한 시점에서 정규화 계수와 양자화 정밀도 정보의 관계가 정해지기 때문에, 장래적으로 더욱 고도의 청각 모델에 기초한 양자화 정밀도의 제어를 도입하는 것이 곤란해진다는 문제가 있다. 또한, 실현하는 압축율에 폭이 있는 경우에는 압축율마다 정규화 계수와 양자화 정밀도 정보의 관계를 결정할 필요가 생긴다.
따라서, 압축율을 어떤 값으로부터 더욱 향상시키기 위해서는 직접 부호화 대상인 주정보, 예를 들면 도 1에 있어서의 오디오 신호의 부호화 효율을 높일 뿐만 아니라, 양자화 정밀도 정보나 정규화 계수 등의, 직접의 부호화 대상이 아닌 부정보의 부호화 효율을 높이는 것이 필요하게 된다.
그래서, 본건 발명자들은 먼저 출원한 일본특허출원 2000-390589 및 일본특허출원 2001-182383의 명세서 및 도면에 있어서, 이러한 부정보의 부호화 효율을 높이는 기술을 제안하고 있다. 또한, 본건 발명자 등은 일본특허출원 2001-182093의 명세서 및 도면에 있어서, 게인 제어를 하는 부호화 방식에 있어서의 게인 정보의 부호화 효율을 높이는 기술을 제안하고 있다. 이들 기술에 의하면, 예를 들면 각종 상관 등을 이용하여 가변 길이 부호화를 하는 등의 수법을 이용함으로써, 부정보의 부호화 효율을 높일 수 있다.
그렇지만, 대단히 높은 압축율이 요구되는 경우, 부호화 장치에 주어진 비트수로는 양자화 잡음을 지각(知覺)하기 어려운 정도의 양자화 정밀도를 유지할 수 없는 경우가 있다. 이러한 경우, 부호화 장치는 주정보로의 비트 배분을 줄이는 처치를 실시하는 경우가 많다. 구체적으로는, 주정보인 피정규화 데이터(스펙트럼)를 0 또는 작은 값으로 바꾸거나, 양자화를 하는 대역폭을 좁히거나 하는 처치를 실시한다.
이 결과, 복호된 처리음에는, 시간적으로 대역 변동이 일어나는 것에 의한 이음이나 노이즈, 또한, 스펙트럼을 0 또는 작은 값으로 바꿈으로써 파워감의 결여라는 문제가 발생한다. 특히 압축율을 대폭 높인 경우에는, 이들은 크게 지각되게 되고, 청감상의 큰 문제가 된다.
본 발명은 이러한 종래의 실정을 감안하여 제안된 것으로, 압축율을 높인 경우에 있어서의, 시간적인 대역 변동에 의한 이음이나 노이즈, 또는 파워감의 결여를 저감하는 부호화 방법 및 그 장치, 부호화 데이터를 수신하고, 또는 재생하여 복호하는 복호 방법 및 그 장치, 및 부호화 처리 또는 복호 처리를 컴퓨터에 실행시키는 프로그램 및 그와 같은 프로그램이 기록된 컴퓨터 판독 가능 기록매체를 제공하는 것을 목적으로 한다.
본 발명에 관계되는 부호화 방법은 상술한 목적을 달성하기 위해서, 입력 디지털 신호를 스펙트럼 변환한 스펙트럼을 부호화하는 부호화 방법에 있어서, 상기 스펙트럼과 복호측에서 합성되는 파워 보정용 스펙트럼의 파워를 조정하기 위한 파워 조정 정보를 생성하는 파워 조정 정보 생성 공정과, 상기 파워 조정 정보를 상기 스펙트럼과 함께 부호화하는 부호화 공정을 갖는다.
여기서, 상기 파워 조정 정보 생성 공정에서는, 상기 입력 디지털 신호의 토널리티(tonality)에 기초하여 상기 파워 조정 정보가 생성된다.
이러한 부호화 방법에서는, 복호측에서 스펙트럼과 합성되는 파워 보정용 스 펙트럼의 파워를 조정하기 위한 파워 조정 정보가 생성되고, 이것이 스펙트럼과 함께 부호화된다.
또한, 본 발명에 관계되는 부호화 장치는, 상술한 목적을 달성하기 위해서, 입력 디지털 신호를 스펙트럼 변환한 스펙트럼을 부호화하는 부호화 장치에 있어서, 상기 스펙트럼과 복호측에서 합성되는 파워 보정용 스펙트럼의 파워를 조정하기 위한 파워 조정 정보를 생성하는 파워 조정 정보 생성 수단과, 상기 파워 조정 정보를 상기 스펙트럼과 함께 부호화하는 부호화 수단을 구비한다.
여기서, 상기 파워 조정 정보 생성 수단은 상기 입력 디지털 신호의 토널리티에 기초하여 상기 파워 조정 정보를 생성한다.
이러한 부호화 장치는, 복호측에 있어서 스펙트럼과 합성되는 파워 보정용 스펙트럼의 파워를 조정하기 위한 파워 조정 정보를 생성하여, 이것을 스펙트럼과 함께 부호화한다.
또한, 본 발명에 관계되는 복호 방법은, 상술한 목적을 달성하기 위해서, 디지털 신호를 스펙트럼 변환하여 부호화된 스펙트럼을 복호하는 복호 방법에 있어서, 상기 스펙트럼을 복호하는 복호 공정과, 파워 보정용 스펙트럼을 생성하는 파워 보정용 스펙트럼 생성 공정과, 복호한 상기 스펙트럼과 상기 파워 보정용 스펙트럼을 합성하는 합성 공정을 갖는다.
여기서, 이 파워 보정용 스펙트럼 생성 공정에서는 소정의 스펙트럼 패턴으로 생성한 테이블의 값을 참조하여 파워 보정용 스펙트럼을 생성할 수 있다. 이 테이블을 참조할 때에는 가우스(gaussian) 분포 수치열 등의 랜덤한 수치열을 사용 하여도 좋고, 또한 부호화에 사용된 정규화 정보, 양자화 정밀도 정보 등을 사용하여도 좋다.
또한, 이 복호 방법은 파워 보정용 스펙트럼의 파워를 조정하는 파워 조정 공정을 갖고 있어도 좋다. 이 파워 조정 공정에서는, 스펙트럼의 복호에 사용한 정규화 계수 또는 양자화 정밀도 정보, 또는 상기 스펙트럼의 부호화시에 부호화된 파워 조정 정보에 기초하여 상기 파워 보정용 스펙트럼의 파워가 조정된다. 이 경우, 합성 공정에서는, 복호한 스펙트럼과 파워 조정 후의 파워 보정용 스펙트럼이 합성된다.
또한, 합성 공정에서는, 스펙트럼과 파워 보정용 스펙트럼이 가산되고, 또는 스펙트럼의 적어도 일부와 파워 보정용 스펙트럼이 바뀐다.
이러한 복호 방법에서는, 양자화 정밀도 정보, 정규화 계수 및 파워 조정 정보에 기초하여 파워 보정용 스펙트럼의 파워 조정이 행하여지고, 스펙트럼과 파워 보정용 스펙트럼을 가산하고, 또는 스펙트럼의 적어도 일부와 파워 보정 스펙트럼을 바꿈으로써, 파워 조정 후의 파워 보정용 스펙트럼이 스펙트럼과 합성된다.
또한, 본 발명에 관계되는 복호 장치는, 상술한 목적을 달성하기 위해서, 디지털 신호를 스펙트럼 변환하여 부호화된 스펙트럼을 복호하는 복호 장치에 있어서, 상기 스펙트럼을 복호하는 복호 수단과, 파워 보정용 스펙트럼을 생성하는 파워 보정용 스펙트럼 생성 수단과, 복호한 상기 스펙트럼과 상기 파워 보정용 스펙트럼을 합성하는 합성 수단을 구비한다.
여기서, 이 파워 보정용 스펙트럼 생성 수단은 소정의 스펙트럼 패턴으로부터 생성한 테이블의 값을 참조하여 파워 보정용 스펙트럼을 생성할 수 있다. 이 테이블을 참조할 때는 가우스 분포 수치열 등의 랜덤한 수치열을 사용하여도 좋고, 또한 부호화에 사용된 정규화 정보, 양자화 정밀도 정보 등을 사용하여도 좋다.
또한, 이 복호 장치는 파워 보정용 스펙트럼의 파워를 조정하는 파워 조정 수단을 구비하고 있어도 좋다. 이 파워 조정 수단은 스펙트럼의 복호에 사용한 정규화 계수 또는 양자화 정밀도 정보, 또는 스펙트럼의 부호화시에 부호화된 파워 조정 정보에 기초하여 파워 보정용 스펙트럼의 파워를 조정한다. 이 경우, 합성 수단은 복호한 스펙트럼과 파워 조정 후의 파워 보정용 스펙트럼을 합성한다.
또한, 합성 수단은 스펙트럼과 파워 보정용 스펙트럼을 가산하고, 또는 스펙트럼의 적어도 일부와 파워 보정용 스펙트럼을 바꾼다.
이러한 복호 장치는 양자화 정밀도 정보, 정규화 계수 및 파워 조정 정보에 기초하여 파워 보정용 스펙트럼의 파워를 조정하여, 스펙트럼과 파워 보정용 스펙트럼을 가산하고, 또는 스펙트럼의 적어도 일부와 파워 보정 스펙트럼을 바꿈으로써, 파워 조정 후의 파워 보정용 스펙트럼을 스펙트럼과 합성한다.
또한, 본 발명에 관계되는 프로그램은 상술한 부호화 처리 또는 복호 처리를 컴퓨터에 실행시키는 것으로, 본 발명에 관계되는 기록매체는, 그와 같은 프로그램이 기록된 컴퓨터 판독 가능한 것이다.
본 발명의 더욱 다른 목적, 본 발명에 의해서 얻어지는 구체적인 이점은, 이하에 설명되는 실시예의 설명으로부터 한층 더 분명해질 것이다.
도 1은 종래의 부호화 장치의 개략 구성을 설명하는 도면.
도 2는 종래의 복호 장치의 개략 구성을 설명하는 도면.
도 3은 본 실시예의 기본 개념을 설명하는 플로우 차트.
도 4는 본 실시예에 있어서의 부호화 장치의 개략 구성을 설명하는 도면.
도 5는 본 실시예에 있어서의 복호 장치의 개략 구성을 설명하는 도면.
도 6은 동 복호 장치에 있어서의 파워 보정용 스펙트럼(PCSP)의 생성 및 파워 조정 처리의 일례를 설명하는 플로우 차트.
도 7은 스펙트럼(SP)과 파워 보정용 스펙트럼(PCSP)의 합성 수법의 일례를 설명하는 플로우 차트.
도 8은 스펙트럼(SP)과 파워 보정용 스펙트럼(PCSP)의 합성 수법의 다른 예를 설명하는 플로우 차트.
도 9는 동 파워 보정용 스펙트럼(PCSP)의 생성 및 파워 조정 처리의 구체적인 예를 설명하는 도면.
도 10a 내지 도 10c는, 실제의 스펙트럼 예를 설명하는 도면으로, 도 10a는 원음의 스펙트럼을 나타내고, 도 10b는 종래 법의 부호화 처리를 실시한 후의 스펙트럼을 나타내고, 도 10c는, 본 실시예의 수법을 사용하여 파워 보정용 스펙트럼(PCSP)과 합성한 후의 스펙트럼을 나타내는 도면.
이하, 본 발명을 적용한 구체적 실시예에 관해서, 도면을 참조하면서 상세하게 설명한다. 이 실시예는, 본 발명을, 오디오 신호 등의 디지털 데이터를 고능률 부호화하여 전송하고, 또는 기록매체에 기록하는 부호화 방법 및 그 장치, 및 부호화 데이터를 수신하고, 또는 재생하여 복호하는 복호 방법 및 그 장치에 적용한 것이다.
본 실시예의 기본 개념을 도 3의 플로우 차트를 참조하여 설명한다. 우선 스텝 S1에 있어서, 스펙트럼 신호(SP)를 복호한다. 또, 이 스펙트럼 신호(SP)는, 압축율을 높인 경우에 스펙트럼 신호가 누락되는 것에 의한 시간적인 대역 변동이 원인이 되어 이음이나 노이즈가 생기고, 또는 파워감이 결여될 가능성이 있는 것으로 한다.
다음에 스텝 S2에 있어서, 파워 보정용 스펙트럼(PCSP)을 생성하고, 계속되는 스텝 S3에 있어서, 스펙트럼 신호(SP)와 파워 보정용 스펙트럼(PCSP)을 합성한 스펙트럼 신호를 생성한다.
즉, 본 실시예에 있어서의 부호화 장치 및 그 방법, 및 복호 장치 및 그 방법은, 파워 보정용 스펙트럼(PCSP)을 생성하여 스펙트럼 신호(SP)와 합성하는 것으로, 이것에 의해, 압축율을 높인 경우에 있어서의 시간적인 대역 변동에 의한 이음이나 노이즈, 또는 파워감의 결여를 저감할 수 있다.
이하에서는, 우선 도 4를 참조하여, 본 실시예에 있어서의 부호화 장치(10)의 개략 구성에 관해서 설명한다. 도 4에 있어서 대역 분할부(11)는, 부호화해야 할 오디오 신호를 입력하여, QMF(Quadrature Mirror Filter) 또는 PQF(Polyphase Quadrature Filter) 등의 필터를 사용하여, 이 오디오 신호를 예를 들면 4개의 주파수 대역의 신호로 대역 분할한다. 또, 대역 분할부(11)에서 오디오 신호를 대역 분할할 때의 각 대역(이하, 적절하게, 부호화 유닛이라고 함)의 폭은 균일하여도 좋고, 또한 임계 대역폭에 맞도록 불균일하게 하여도 좋다. 또한, 오디오 신호는 4개의 부호화 유닛으로 분할되도록 이루어져 있지만, 부호화 유닛의 수는, 이것에 한정되는 것은 아니다. 대역 분할부(11)는 4개의 부호화 유닛(이하, 적절하게, 4개의 부호화 유닛 각각을, 제 1 내지 제 4 부호화 유닛이라고 함)으로 분해된 신호를 소정의 시간 블록(프레임)마다 게인 제어부(121 내지 124)에 공급한다.
게인 제어부(121 내지 124)는 각 블록 내의 신호의 진폭에 따라서 게인 제어 정보를 생성하고, 이 게인 제어 정보에 기초하여 블록 내의 신호의 게인 제어를 한다. 그리고 게인 제어부(121 내지 124)는 게인 제어를 한 결과 얻어진 제 1 내지 제 4 부호화 유닛의 신호를 스펙트럼 변환부(141 내지 144)에 공급하는 동시에, 게인 제어 정보를 게인 제어 정보 부호화부(13)에 공급한다.
게인 제어 정보 부호화부(13)는 게인 제어부(121 내지 124)로부터 공급된 게인 제어 정보를 부호화하여 멀티플렉서(22)에 공급한다. 여기서, 게인 제어 정보를 부호화할 때는, 본건 발명자 등이 먼저 제안한 일본특허출원 2001-182093의 명세서 및 도면에 기재되어 있는 기술을 이용할 수 있다. 즉, 인접하는 부호화 유닛간 등에 있어서의 각종 상관을 이용하여 가변 길이 부호화를 하는 것으로, 게인 제어 정보의 부호화 효율을 높일 수 있다.
스펙트럼 변환부(141 내지 144)는 게인 제어부(121 내지 124)로부터 공급된 시간축상의 신호에 대하여 MDCT(Modified Discrete Cosine Transformation) 등의 스펙트럼 변환을 하여 주파수축상의 스펙트럼(SP)을 생성하고, 이 스펙트럼(SP)을 정규화부(151 내지 154) 및 양자화 정밀도 결정부(19)에 공급한다.
정규화부(151 내지 154)는 제 1 내지 제 4 부호화 유닛의 스펙트럼(SP) 각각을 구성하는 각 신호 성분으로부터 절대치가 최대인 것을 추출하고, 이 값에 대응하는 계수를 제 1 내지 제 4 부호화 유닛의 정규화 계수로 한다. 그리고, 정규화부(151 내지 154)는 제 1 내지 제 4 부호화 유닛의 스펙트럼(SP)을 구성하는 각 신호 성분을 제 1 내지 제 4 부호화 유닛의 정규화 계수에 대응하는 값으로 각각 정규화한다(제산한다). 따라서, 이 경우, 정규화에 의해 얻어지는 피정규화 데이터는, -1.0 내지 1.O의 범위의 값이 된다. 정규화부(151 내지 154)는 제 1 내지 제 4 부호화 유닛의 피정규화 데이터를 각각 파워 조정 정보 결정부(171 내지 174) 및 양자화부(201 내지 204)에 공급하는 동시에, 제 1 내지 제 4 부호화 유닛의 정규화 계수를 정규화 계수 부호화부(16)에 공급한다.
정규화 계수 부호화부(16)는 정규화부(151 내지 154)로부터 공급된 정규화 계수를 부호화하여 멀티플렉서(22)에 공급한다. 이 정규화 계수의 부호화 수법으로서는, 예를 들면 본건 발명자 등이 먼저 제안한 일본특허출원 2000-390589 및 일 본특허출원 2001-182093의 명세서 및 도면에 기재된 기술을 사용할 수 있다. 즉, 인접하는 부호화 유닛간, 인접하는 채널간, 인접하는 시각간에서의 각종 상관을 이용하여 가변 길이 부호화를 하거나, 개형(槪形) 정보를 양자화하여, 그 양자화 오차를 가변 길이 부호화하거나 함으로써, 정규화 계수의 부호화 효율을 높일 수 있다.
파워 조정 정보 결정부(171 내지 174)는 복호측에서 후술하는 파워 보정용 스펙트럼(PCSP)의 파워를 조정하기 위한 파워 조정 정보를 결정한다. 여기서, 원음의 상태로 스펙트럼이 빠져 있거나 값이 0이거나 하는 경우에는, 복호측에서 스펙트럼(SP)에 파워 보정용 스펙트럼(PCSP)을 합성하면, 본래 스펙트럼이 존재하지 않는 곳에 스펙트럼이 발생하여 버리기 때문에, 바람직하지 못하다. 특히 톤성의 신호의 경우에는, 파워 보정용 스펙트럼(PCSP)에 의한 보정량은 적은 것이 바람직하다.
그래서, 예를 들면 토널리티가 소정의 임계치보다도 높은 톤성 신호와 같이, 원음의 상태로 스펙트럼이 빠져 있거나 값이 0이거나 하는 경우에는, 파워 보정 스펙트럼(PCSP)을 작게 억제하거나 0으로 하여, 토널리티가 소정의 임계치보다도 낮은 노이즈성 신호와 같이, 원음의 스펙트럼이 노이즈성인 경우에는, 파워 보정용 스펙트럼(PCSP)을 큰 값으로 생성하도록 입력 신호의 토널리티에 기초하여 파워 조정 정보를 결정하고, 부호화측에서 파워 보정용 스펙트럼(PCSP)의 파워를 제어한다.
또, 파워 조정 정보에 의한 파워 보정용 스펙트럼(PCSP)의 제어 수법이나 제어 폭에는 여러가지가 있지만, 예를 들면 파워 조정 정보를 1 비트로 표현하는 경우에는, 톤성 신호에서는 파워 제어를 하지 않고, 노이즈성 신호에서는 파워 제어를 하는 제어가 가능하다. 또한, 예를 들면 파워 조정 정보를 4 비트로 표현하는 경우에는, 파워 조정 정보가 0에서는 파워 보정용 스펙트럼(PCSP)의 파워를 0으로 하고, 그 이외의 값에서는 그 값에 따라서 파워 보정 스펙트럼(PCSP)의 파워를, 예를 들면 1dB 스텝 간격으로 15dB 폭의 조정을 하는 것이 가능하다.
파워 조정 정보 부호화부(18)는 파워 조정 정보 결정부(171 내지 174)로부터 공급된 파워 조정 정보를 부호화하여 멀티플렉서(22)에 공급한다. 또, 파워 보정 스펙트럼의 생성 및 합성은 후술하는 바와 같이 부호화 유닛마다 행하여지기 때문에, 파워 조정 정보의 부호화에 대해서도 각 부호화 유닛마다 행하도록 하여도 좋지만, 부호화 유닛을 복수로 모은 그룹화한 대역마다 파워 조정 정보를 생성하도록 하여도 상관없다. 이것은, 일반적으로 신호의 토널리티는 미세한 대역마다는 그다지 변동하지 않고, 어느 정도 종합된 대역마다 토널리티의 값이 공통화할 수 있는 경우가 많기 때문이다.
여기서, 인간의 청각은 저역의 신호에 대하여 민감하기 때문에, 낮은 주파수 대역(예를 들면, 350Hz 이하)에서는 파워 보정용 스펙트럼(PCSP)에 의한 스펙트럼(SP)의 파워 보정량을 되도록이면 적게 하거나, 또는 완전히 행하지 않도록 하는 것이 바람직하다. 또한, 어떤 주파수보다 낮은 주파수 대역에서는 파워 보정 스펙트럼(PCSP)에 의한 스펙트럼(SP)의 파워를 보정하지 않는 경우에는, 그 대역에 대한 파워 조정 정보를 부호화할 필요는 없다.
양자화 정밀도 결정부(19)는 스펙트럼 변환부(141 내지 144)로부터 공급된 제 1 내지 제 4 부호화 유닛의 스펙트럼(SP)에 기초하여, 제 1 내지 제 4 부호화 유닛의 피정규화 데이터 각각을 양자화할 때의 양자화 스텝을 결정한다. 그리고 양자화 정밀도 결정부(19)는 그 양자화 스텝에 대응하는 제 1 내지 제 4 부호화 유닛의 양자화 정밀도 정보를 양자화부(201 내지 204)에 각각 공급하는 동시에, 양자화 정밀도 정보 부호화부(21)에도 공급한다.
양자화부(201 내지 204)는 제 1 내지 제 4 부호화 유닛의 피정규화 데이터를 제 1 내지 제 4 부호화 유닛의 양자화 정밀도 정보에 대응하는 양자화 스텝에서 각각 양자화함으로써 부호화하고, 그 결과 얻어지는 제 1 내지 제 4 부호화 유닛의 양자화 계수를 멀티플렉서(22)에 공급한다.
양자화 정밀도 정보 부호화부(21)는 양자화 정밀도 결정부(19)로부터 공급된 양자화 정밀도 정보를 부호화하여 멀티플렉서(22)에 공급한다. 또, 이 양자화 정밀도 정보의 부호화 수법으로서도, 상술한 일본특허출원 2000-390589 및 일본특허출원 2001-182093의 명세서 및 도면에 기재된 기술을 사용할 수 있다.
멀티플렉서(22)는 제 1 내지 제 4 부호화 유닛의 양자화 계수를 게인 제어 정보, 양자화 정밀도 정보, 정규화 정보 및 파워 조정 정보와 함께 다중화한다. 그리고 멀티플렉서(22)는 다중화의 결과 얻어지는 부호화 데이터를 전송로를 통해서 전송하거나, 또는 도시하지 않은 기록매체에 기록한다.
이상과 같이, 본 실시예에 있어서의 부호화 장치(10)는 복호측에서 스펙트럼(SP)과 합성되는 파워 보정용 스펙트럼(PCSP)의 파워를 조정하기 위한 파워 조정 정보를 생성하고, 이것을 스펙트럼과 함께 부호화하여 전송로를 통해서 전송하거나, 또는 도시하지 않은 기록매체에 기록한다.
계속해서 도 5를 참조하여, 부호화 장치(10)로부터 출력되는 부호화 데이터를 복호하는 복호 장치(30)의 개략 구성을 설명한다. 도 5에 있어서, 디멀티플렉서(31)는 입력한 부호화 데이터를 복호하여, 제 1 내지 제 4 부호화 유닛의 양자화 계수, 양자화 정밀도 정보 부호화 데이터, 정규화 정보 부호화 데이터, 게인 제어 정보 부호화 데이터 및 파워 조정 정보 부호화 데이터로 분리한다. 그리고 디멀티플렉서(31)는 제 1 내지 제 4 부호화 유닛의 양자화 계수를 각각의 부호화 유닛에 대응하는 신호 성분 구성부(341 내지 344)에 공급한다. 또한, 디멀티플렉서(31)는 제 1 내지 제 4 부호화 유닛의 양자화 정밀도 정보 부호화 데이터, 정규화 정보 부호화 데이터, 게인 제어 정보 부호화 데이터 및 파워 조정 정보 부호화 데이터를 각각 양자화 정밀도 정보 복호부(32), 정규화 정보 복호부(33), 게인 제어 정보 복호부(35) 및 파워 조정 정보 복호부(36)에 공급한다.
양자화 정밀도 정보 복호부(32)는 양자화 정밀도 정보 부호화 데이터를 복호하여, 복호한 양자화 정밀도 정보를 각각의 부호화 유닛에 대응하는 신호 성분 구성부(341 내지 344) 및 파워 보정용 스펙트럼 생성 합성부(371 내지 37 4)에 공급한 다.
정규화 정보 복호부(33)는 정규화 정보 부호화 데이터를 복호하여, 복호한 정규화 계수를 각각의 부호화 유닛에 대응하는 신호 성분 구성부(341 내지 344) 및 파워 보정용 스펙트럼 생성 합성부(371 내지 374)에 공급한다.
신호 성분 구성부(341)는 제 1 부호화 유닛의 양자화 계수를 제 1 부호화 유닛의 양자화 정밀도 정보에 대응한 양자화 스텝으로 역양자화하여, 제 1 부호화 유닛의 피정규화 데이터를 생성한다. 또한, 신호 성분 구성부(341)는 제 1 부호화 유닛의 피정규화 데이터에, 제 1 부호화 유닛의 정규화 정보에 대응하는 값을 승산하여 복호하여, 얻어진 제 1 부호화 유닛의 스펙트럼(SP)을 파워 보정용 스펙트럼 생성 합성부(371)에 공급한다.
신호 성분 구성부(342 내지 344)도 동일한 처리를 하여 제 2 내지 제 4 부호화 유닛의 스펙트럼(SP)에 복호하여, 이들의 스펙트럼(SP)을 파워 보정용 스펙트럼 생성 합성부(372 내지 374)에 공급한다.
게인 제어 정보 복호부(35)는 게인 제어 정보 부호화 데이터를 복호하여, 복호한 게인 제어 정보를 각각의 부호화 유닛에 대응하는 파워 보정용 스펙트럼 생성 합성부(371 내지 374) 및 게인 제어부(391 내지 394)에 공급한다.
파워 조정 정보 복호부(36)는 파워 조정 정보 부호화 데이터를 복호하여, 복호한 파워 조정 정보를 각각의 부호화 유닛에 대응하는 파워 보정용 스펙트럼 생성 합성부(371 내지 374)에 공급한다.
파워 보정용 스펙트럼 생성 합성부(371 내지 374)는 파워 보정용 스펙트럼(PCSP)을 생성하는 동시에, 양자화 정밀도 정보, 정규화 계수, 게인 제어 정보 및 파워 조정 정보에 기초하여 파워 보정용 스펙트럼(PCSP)의 파워를 조정한다. 그리고, 파워 조정 후의 파워 보정용 스펙트럼(PCSP)을 스펙트럼(SP)과 합성함으로써, 스펙트럼(SP)의 파워 보정을 한다. 또, 이 파워 보정용 스펙트럼(PCSP)의 생성 수법 및 스펙트럼(SP)의 합성 수법에 관한 상세는 후술한다.
스펙트럼 역변환부(381 내지 384)는 파워 보정용 스펙트럼 생성 합성부(371 내지 374)로부터 공급된, 보정된 스펙트럼에 대하여 IMDCT(Inverse MDCT) 등의 스펙트럼 역변환을 하여 시간축상의 신호를 생성하고, 이 시간축상의 신호를 게인 제어부(391 내지 394)에 공급한다.
게인 제어부(391 내지 394)는 게인 제어 정보 복호부(35)로부터 공급된 게인 제어 정보에 기초하여 제 1 내지 제 4 부호화 유닛의 신호에 대하여 게인 제어 보정 처리를 하여, 얻어진 제 1 내지 제 4 부호화 유닛의 신호를 대역 합성부(40)에 공급한다.
대역 합성부(40)는 게인 제어부(391 내지 394)로부터 공급된 제 1 내지 제 4 부호화 유닛의 신호를 대역 합성하고, 이것에 의해 원래의 오디오 신호를 복원한다.
이상과 같이, 본 실시예에 있어서의 복호 장치(30)는 부호화 데이터에 포함되는 양자화 정밀도 정보, 정규화 계수, 게인 제어 정보 및 파워 조정 정보에 기초하여 파워 보정용 스펙트럼(PCSP)의 파워를 조정하여, 파워 조정 후의 파워 보정용 스펙트럼(PCSP)을 스펙트럼(SP)과 합성한다. 이것에 의해, 압축율을 높인 경우에도, 시간적인 대역 변동에 의한 이음이나 노이즈, 또는 파워감의 결여를 저감할 수 있다.
그래서 이하에서는, 이 파워 보정용 스펙트럼(PCSP)의 생성 및 파워 조정 처리의 일례에 관해서 도 6의 플로차트를 참조하여 상세하게 설명한다. 우선 스텝 S10에 있어서, 파워 보정용 스펙트럼 테이블로부터 파워 보정용 스펙트럼(PCSP)을 생성한다.
여기서, 파워 보정용 스펙트럼 테이블로서는, 예를 들면, 가우시안 분포 수치열과 같은 랜덤의 것을 사용하여도 좋고, 또한, 실제의 여러가지 노이즈성 스텍트럼으로부터 미리 학습하여 작성한 것을 사용하여도 좋다. 또, 파워 조정용 스펙트럼은 1개에 한정되는 것이 아니라, 복수 준비하고 그 중으로부터 선택하여 사용하도록 하여도 상관없다.
파워 보정용 스펙트럼(PCSP)을 생성할 때는, 이 파워 보정용 스펙트럼 테이블로부터 부호화 유닛 내의 스펙트럼 개수분만큼 값을 참조한다. 이때, 시간적으로 연속하여 테이블의 같은 포인트를 참조하면 청감상 악영향을 미칠 우려가 있기 때문에, 시간적으로 랜덤하게 선택하도록 한다. 구체적으로는, 랜덤 생기 함수를 사용하여 랜덤하게 선택하여도 좋지만, 매회 동일한 파워 보정용 스펙트럼(PCSP)이 생성되는 것을 방지하기 위해서, 시간적으로 랜덤하게 되는 다른 파라미터, 예를 들면 정규화 계수나 양자화 정밀도 정보 등을 사용하여 랜덤하게 선택하는 것이 바람직하다. 이것에 의해, 복호기에 관계없이, 동일한 부호열로부터는 동일한 파워 보정용 스펙트럼(PCSP)을 얻을 수 있게 된다.
이하의 설명에서는, 이러한 파라미터의 일례로서, 정규화 계수의 인덱스 값을 모두 가산한 값을 사용한다. 단, 파워 보정용 스펙트럼 테이블의 사이즈를 예를 들면 1024로 하였을 때, 정규화 계수의 인덱스치의 가산치가 1024를 넘는 경우에는, 그 하위 10 비트의 값을 사용하는 것으로 한다.
또한, 각 부호화 유닛에서 같은 참조 포인트를 참조하는 것은 아니고, 어떤 부호화 유닛 중 스펙트럼 개수가 16개인 경우에는, 그 다음 부호화 유닛에서는 예를 들면 최초에 참조한 포인트로부터 16만큼 이동한 포인트를 참조하도록 하여, 같은 참조 포인트를 연속하여 참조하지 않도록 하면 좋다.
다음에 스텝 S11에 있어서, 정규화 계수에 기초하여 파워 보정용 스펙트럼(PCSP)의 파워를 조정한다. 구체적으로는, 예를 들면 파워 보정용 스펙트럼(PCSP)의 파워의 최대치가 정규화 계수의 값이 되도록 조정한다.
계속해서 스텝 S12에 있어서, 양자화 정밀도 정보의 값에 기초하여 파워 보정용 스펙트럼(PCSP)의 파워를 조정한다. 이 때, 양자화 정밀도가 높은 경우에는 파워 보정용 스펙트럼(PCSP)에 의한 보정이 되도록이면 행하여지지 않고, 양자화 정밀도가 낮은 경우에는 적극적으로 파워 보정용 스펙트럼(PCSP)에 의한 보정을 하도록, 파워 보정용 스펙트럼(PCSP)의 파워를 조정한다. 구체적으로는, 예를 들면 파워 보정용 스펙트럼(PCSP)을 양자화 정밀도 정보의 값으로 제산하도록 하여도 좋고, 또한, 파워 보정용 스펙트럼(PCSP)을 2(양자화 정밀도 값)승으로 제산하도록 하여도 좋다.
스텝 S13에서는, 파워 조정 정보의 값에 기초하여 파워 보정용 스펙트럼(PCSP)의 파워를 조정한다. 이것은, 예를 들면 원음의 상태로 스펙트럼이 빠져 있기 때문에 굳이 부호화하지 않았고, 또는 값을 0으로 하고 있는 경우에, 파워 보정용 스펙트럼(PCSP)을 합성함으로써, 본래 스펙트럼이 존재하지 않은 곳에 스펙트럼을 발생시켜 버리는 것을 방지하기 위해서이다.
다음에 스텝 S14에서는, 게인 제어 정보가 있는지의 여부가 판별된다. 스텝 S14에 있어서 게인 제어 정보가 있는 경우(Yes)에는 스텝 S15로 진행하고, 게인 제어 정보가 없는 경우(No)에는, 파워 보정용 스펙트럼(PCSP)의 생성 및 파워 조정 처리를 종료한다.
스텝 S15에서는 게인, 제어 정보의 값에 기초하여 파워 보정용 스펙트럼(PCSP)의 파워를 조정한다. 이것은, 게인 제어에 의해 스펙트럼의 게인이 올려지는 경우에 파워 보정용 스펙트럼(PCSP) 성분에 대해서도 동시에 게인이 올려짐으로써, 파워 보정용 스펙트럼(PCSP)에 의한 파워 보정량이 과도해지는 것을 방지하기 위해서이다. 구체적으로는, 예를 들면 파워 보정용 스펙트럼(PCSP)을 게인 제어 정보의 최대치로 제산한다.
이상과 같이 하여 파워 보정용 스펙트럼(PCSP)의 생성 및 파워 조정 처리가 행하여진다. 또, 상술한 정규화 계수, 양자화 정밀도 정보 및 게인 제어 정보는 스펙트럼(SP)을 위해 부호화된 값을 사용하는 것으로, 파워 보정용 스펙트럼(PCSP) 을 위해 특별히 다른 정규화 계수 등을 부호화할 필요는 없다.
이상과 같이 하여 파워 조정이 실시된 파워 보정용 스펙트럼(PCSP)이 스펙트럼(SP)과 합성된다. 이 스펙트럼(SP)과 파워 보정용 스펙트럼(PCSP)의 합성 수법의 일례에 관해서, 도 7의 플로우 차트를 참조하여 설명한다. 우선 스텝 S20에 있어서, 스펙트럼 개수의 카운터 i의 값을 0으로 리셋한다.
다음에 스텝 S21에 있어서, i번째의 스펙트럼(SP)[i]이 임계치(Th) 이하인 지의 여부가 판별된다. 스텝 S21에 있어서 스펙트럼(SP)[i]이 임계치(Th) 이하인 경우(Yes)에는 스텝 S22로 진행하고, 스펙트럼(SP)[i]이 임계치(Th)보다도 큰 경우(No)에는 스텝 S23으로 진행한다.
스텝 S22에서는 스펙트럼(SP)[i]을 i번째의 파워 보정용 스펙트럼 PCSP[i]로 바꾸어 스텝 S23으로 진행한다.
스텝 S23에서는 카운터 i의 값을 1개 인크리먼트하여 다음의 스펙트럼으로 진행한다.
스텝 S24에서는 카운터 i의 값이 부호화 유닛 내의 스펙트럼 개수에 도달하였는지의 여부가 판별된다. 스텝 S24에 있어서 카운터 i의 값이 부호화 유닛 내의 스펙트럼 개수에 도달한 경우(Yes)에는 합성 처리를 종료한다. 한편, 카운터 i의 값이 부호화 유닛 내의 스펙트럼 개수에 달하고 있지 않은 경우(No)에는 스텝 S21로 되돌아가, 처리를 계속한다.
이와 같이, 임계치(Th) 이하인 스펙트럼(SP)을 파워 보정용 스펙트럼(PCSP)과 바꿈으로써, 스펙트럼(SP)과 파워 보정용 스펙트럼(PCSP)을 합성한다.
또, 스펙트럼(SP)과 파워 보정용 스펙트럼(PCSP)의 합성 수법이 이 예에 한정되지 않는 것은 물론이고, 임계치(Th)를 0으로 하고, 스펙트럼(SP)이 0인 경우에만 파워 보정용 스펙트럼(PCSP)과 바꾸도록 하여도 상관없다.
또한, 임계치(Th)를 준비하지 않고, 모든 스펙트럼(SP)에 대하여 파워 보정용 스펙트럼(PCSP)을 더하도록 하여도 상관없다. 이 경우의 합성 처리에 관해서, 도 8의 플로우 차트를 참조하여 설명한다. 우선 스텝 S30에 있어서, 스펙트럼 개수의 카운터 i의 값을 0으로 리셋한다.
다음에 스텝 S31에 있어서, 스펙트럼(SP)[i]에 파워 보정용 스펙트럼(PCSP)[i]의 값을 더하고, 계속되는 스텝 S32에 있어서 카운터 i의 값을 1개 인크리먼트한다.
계속해서 스텝 S33에서는, 카운터 i의 값이 부호화 유닛 내의 스펙트럼 개수에 도달하였는지의 여부가 판별된다. 스텝 S33에 있어서 카운터 i의 값이 부호화 유닛 내의 스펙트럼 개수에 도달한 경우(Yes)에는 합성 처리를 종료한다. 한편, 카운터 i의 값이 부호화 유닛 내의 스펙트럼 개수에 도달하지 않은 경우(No)에는 스텝 S31로 되돌아가, 처리를 계속한다.
이하, 도 9를 참조하여, 파워 보정용 스펙트럼(PCSP)의 생성 및 파워 조정 처리와, 스펙트럼(SP)과 파워 보정용 스펙트럼(PCSP)의 합성 처리의 구체적인 예를 설명한다. 또, 이 구체적인 예에서는 파워 보정용 스펙트럼 테이블의 엔트리 수를 1024로 하여, 부호화 유닛 내의 스펙트럼 개수를 8로 한다. 또한, 도 8에 나타난 예와 같이, 모든 스펙트럼(SP)에 대하여 파워 보정용 스펙트럼(PCSP)을 더하는 것으로 하여 설명한다.
우선, 파워 보정용 스펙트럼 테이블을 참조하는 포인트를 정규화 계수 인덱스의 가산치로부터 구한다. 이 구체적인 예에서는, 정규화 계수 인덱스의 합이 1026으로 되어 있지만, 파워 보정용 스펙트럼의 엔트리 수가 1024이기 때문에, 하위 10비트의 값을 사용한다. 즉, 참조 포인트의 값은 2가 된다. 따라서, 파워 보정용 스펙트럼의 3번째로부터 10번째까지의 8개의 값이 선택되고, 이것에 의해 파워 보정용 스펙트럼(PCSP)의 값은 {-0.223, 0.647, 0.115, 0.925, -0.254, 0.247, -0.872, -0.242}가 된다.
다음에, 정규화 계수에 기초하여 파워 보정용 스펙트럼(PCSP)의 파워의 조정이 행하여진다. 구체적으로는, 파워 보정용 스펙트럼(PCSP)의 값에 정규화 계수를 승산함으로써 파워를 조정한다. 여기서 정규화 계수는 12000이기 때문에, 파워 보정용 스펙트럼의 값은 {-2676, 7764, 1380, 11100, -3048, 2964, -10464, -2904}가 된다.
계속해서, 양자화 정밀도 정보의 값에 기초하여 파워 보정용 스펙트럼(PCSP)의 파워의 조정이 행하여진다. 구체적으로는, 예를 들면 양자화 정밀도 정보의 값으로 제산함으로써 파워를 조정한다. 여기서, 양자화 정밀도 정보의 값은 6이기 때문에, 파워 보정용 스펙트럼의 값은 {-446, 1294, 230, 1850, -508, 494, -1744, -484}가 된다.
계속해서, 파워 조정 정보의 값에 기초하여 파워 보정용 스펙트럼(PCSP)의 파워의 조정이 행하여진다. 구체적으로는, 예를 들면 ((파워 조정 정보치-9)×2)dB 올리는 조작을 함으로써 파워를 조정한다. 또, 파워 조정 정보치가 O인 경우에는 - ∞dB로 한다. 여기서, 파워 조정 정보의 값은 3이기 때문에, -12dB의 조작이 행하여져, 파워 보정용 스펙트럼의 값은 {-112, 324, 58, 463, -127, 124, -436, -121}가 된다.
계속해서, 게인 제어 정보에 기초하여 파워 보정용 스펙트럼(PCSP)의 파워의 조정이 행하여진다. 구체적으로는, 예를 들면 2(게인 제어량 정보)승의 값으로 제산함으로써 파워를 조정한다. 여기서 게인, 제어 정보의 값은 1이기 때문에, 2로 제산하는 조작이 행하여져, 파워 보정용 스펙트럼의 값은 {-56, 162, 29, 232, -64, 62, -218, -61}가 된다.
이상과 같이 하여 생성된 파워 보정용 스펙트럼(PCSP)을 스펙트럼의 값과 가산 합성함으로써, 최종적인 합성 스펙트럼을 얻을 수 있다. 여기서, 스펙트럼(SP)의 값은 {12000, 0, -800, 0, 9600, 0, 0, -3200}이기 때문에, 생성한 파워 보정용 스펙트럼(PCSP)과 가산 합성함으로써, {11944, 162, -771, 232, 9536, 62, -218, -3261}이라는 합성 스펙트럼이 구해진다.
실제의 스펙트럼 예를 도 10a 내지 도 10c에 나타낸다. 여기서, 도 10a는 원음의 스펙트럼을 나타내고, 도 10b는 종래 법의 부호화 처리를 실시한 후의 스펙트럼을 나타낸다. 또한, 도 10c는 본 실시예의 수법을 사용하여 파워 보정용 스펙트럼(PCSP)과 합성한 후의 스펙트럼을 나타낸다. 이들의 도면으로부터 알 수 있는 바와 같이, 도 10b의 스펙트럼에서는 도면 중 화살 표시로 나타내는 부분 등의 스펙트럼이 빠져 있지만, 도 10c의 스펙트럼에서는 이들의 부분에 파워 보정용 스펙 트럼(PCSP)이 합성되는 것으로, 파워감의 결여가 억제되어 있다.
이상 설명한 바와 같이, 본 실시예에 있어서의 부호화 방법 및 장치, 및 복호 방법 및 장치에 의하면, 파워 보정용 스펙트럼(PCSP)을 스펙트럼(SP)과 합성함으로써, 압축율을 높인 경우에도, 시간적인 대역 변동에 의한 이음이나 노이즈, 또는 파워감의 결여를 저감할 수 있고, 결과적으로 청감상의 품질을 향상시킬 수 있다.
또, 본 발명은 상술한 실시예에만 한정되는 것이 아니라, 본 발명의 요지를 일탈하지 않는 범위에 있어서 여러가지의 변경이 가능한 것은 물론이다.
예를 들면, 상술한 실시예에서는, 하드웨어의 구성으로서 설명하였지만, 이것에 한정되는 것이 아니라, 임의의 처리를, CPU(Central Processing Unit)에 컴퓨터 프로그램을 실행시킴으로써 실현하는 것도 가능하다. 이 경우, 컴퓨터 프로그램은, 기록매체에 기록하여 제공하는 것도 가능하고, 또한, 인터넷 외의 전송매체를 통해서 전송함으로써 제공하는 것도 가능하다.
또, 본 발명은 도면을 참조하여 설명한 상술한 실시예에 한정되는 것이 아니라, 첨부한 청구의 범위 및 그 주지를 일탈하지 않고, 여러가지 변경, 치환 또는 그 동등한 것을 할 수 있는 것은 당업자에게 있어서 분명하다.
상술한 바와 본 발명을 이용하여, 부호화측에서는, 스펙트럼과 복호측에서 합성되는 파워 보정용 스펙트럼의 파워를 조정하기 위한 파워 조정 정보를 생성하여 이것을 스펙트럼과 함께 부호화하고, 복호측에서는, 이 파워 조정 정보를 이용하여 파워 보정용 스펙트럼의 파워를 조정하여, 파워 조정 후의 파워 보정용 스펙트럼을 스펙트럼과 합성함으로써, 압축율을 높인 경우에도, 시간적인 대역 변동에 의한 이음이나 노이즈, 또는 파워감의 결여를 저감할 수 있고, 결과적으로 청감상의 품질을 향상시킬 수 있다.

Claims (44)

  1. 입력 디지털 신호를 스펙트럼 변환한 스펙트럼을 부호화하는 부호화 방법에 있어서,
    상기 스펙트럼과 복호측에서 합성되는 파워 보정용 스펙트럼의 파워를 조정하기 위한 파워 조정 정보를 생성하는 파워 조정 정보 생성 공정, 및
    상기 파워 조정 정보를 상기 스펙트럼과 함께 부호화하는 부호화 공정을 갖는 것을 특징으로 하는, 부호화 방법.
  2. 제 1 항에 있어서,
    상기 파워 조정 정보 생성 공정에서는, 상기 입력 디지털 신호의 토널리티(tonality)에 기초하여 상기 파워 조정 정보가 생성되는 것을 특징으로 하는, 부호화 방법.
  3. 제 2 항에 있어서,
    상기 파워 조정 정보 생성 공정에서는, 상기 입력 디지털 신호의 토널리티가 소정의 임계치보다도 높은 경우, 상기 파워 보정용 스펙트럼에 의한 파워 조정량이 적어지도록 상기 파워 조정 정보가 생성되는 것을 특징으로 하는, 부호화 방법.
  4. 제 1 항에 있어서,
    상기 파워 조정 정보는 복호측에서의 상기 스펙트럼의 파워 제어량을 나타내 는 것을 특징으로 하는, 부호화 방법.
  5. 제 1 항에 있어서,
    상기 파워 조정 정보 생성 공정에서는, 상기 스펙트럼을 소정수마다 분할한 유닛마다 또는 상기 유닛을 복수로 모은 그룹마다 상기 파워 조정 정보가 생성되는 것을 특징으로 하는, 부호화 방법.
  6. 제 1 항에 있어서,
    상기 파워 조정 정보 생성 공정에서는, 소정의 대역보다 높은 대역의 스펙트럼에 대해서만 상기 파워 조정 정보가 생성되는 것을 특징으로 하는, 부호화 방법.
  7. 입력 디지털 신호를 스펙트럼 변환한 스펙트럼을 부호화하는 부호화 장치에 있어서,
    상기 스펙트럼과 복호측에서 합성되는 파워 보정용 스펙트럼의 파워를 조정하기 위한 파워 조정 정보를 생성하는 파워 조정 정보 생성 수단, 및
    상기 파워 조정 정보를 상기 스펙트럼과 함께 부호화하는 부호화 수단을 구비하는 것을 특징으로 하는, 부호화 장치.
  8. 제 7 항에 있어서,
    상기 파워 조정 정보 생성 수단은 상기 입력 디지털 신호의 토널리티에 기초하여 상기 파워 조정 정보를 생성하는 것을 특징으로 하는, 부호화 장치.
  9. 제 8 항에 있어서,
    상기 파워 조정 정보 생성 수단은, 상기 입력 디지털 신호의 토널리티가 소정의 임계치보다도 높은 경우, 상기 파워 보정용 스펙트럼에 의한 파워 보정량이 적어지도록 상기 파워 조정 정보를 생성하는 것을 특징으로 하는, 부호화 장치.
  10. 제 7 항에 있어서,
    상기 파워 조정 정보는 복호측에서의 상기 스펙트럼의 파워 제어량을 나타내는 것을 특징으로 하는, 부호화 장치.
  11. 제 7 항에 있어서,
    상기 파워 조정 정보 생성 수단은, 상기 스펙트럼을 소정수마다 분할한 유닛마다 또는 상기 유닛을 복수로 모은 그룹마다 상기 파워 조정 정보를 생성하는 것을 특징으로 하는, 부호화 장치.
  12. 제 7 항에 있어서,
    상기 파워 조정 정보 생성 수단은 소정의 대역보다 높은 대역의 스펙트럼에 대해서만 상기 파워 조정 정보를 생성하는 것을 특징으로 하는, 부호화 장치.
  13. 삭제
  14. 입력 디지털 신호를 스펙트럼 변환한 스펙트럼을 부호화하는 부호화 처리를 컴퓨터에 실행시키는 프로그램이 기록된 컴퓨터 판독 가능 기록매체에 있어서,
    상기 스펙트럼과 복호측에서 합성되는 파워 조정용 스펙트럼의 파워를 조정하기 위한 파워 조정 정보를 생성하는 파워 조정 정보 생성 공정, 및
    상기 파워 조정 정보를 상기 스펙트럼과 함께 부호화하는 부호화 공정을 갖는 것을 특징으로 하는, 컴퓨터 판독 가능 기록매체.
  15. 디지털 신호를 스펙트럼 변환하여 부호화된 스펙트럼을 복호하는 복호 방법에 있어서,
    상기 스펙트럼을 복호하는 복호 공정,
    파워 보정용 스펙트럼을 생성하는 파워 보정용 스펙트럼 생성 공정, 및
    상기 복호한 스펙트럼과 상기 파워 보정용 스펙트럼을 합성하는 합성 공정을 갖는 것을 특징으로 하는, 복호 방법.
  16. 제 15 항에 있어서,
    상기 파워 보정용 스펙트럼 생성 공정에서는, 소정의 스펙트럼 패턴으로부터 생성한 테이블의 값을 참조하여 파워 보정용 스펙트럼이 생성되는 것을 특징으로 하는, 복호 방법.
  17. 제 16 항에 있어서,
    상기 파워 보정용 스펙트럼 생성 공정에서는, 상기 테이블로부터 값을 참조하는 위치가 상기 스펙트럼의 부호화에 사용한 데이터에 기초하여 결정되는 것을 특징으로 하는, 복호 방법.
  18. 제 17 항에 있어서,
    상기 스펙트럼의 부호화에 사용한 데이터는 정규화 계수인 것을 특징으로 하는, 복호 방법.
  19. 제 17 항에 있어서,
    상기 스펙트럼의 부호화에 사용한 데이터는 양자화 정밀도 정보인 것을 특징으로 하는, 복호 방법.
  20. 제 15 항에 있어서,
    상기 파워 보정용 스펙트럼 생성 공정에서는, 랜덤한 수치열을 사용하여 상기 파워 보정용 스펙트럼이 생성되는 것을 특징으로 하는, 복호 방법.
  21. 제 20 항에 있어서,
    상기 랜덤한 수치열은 가우스 분포 수치열인 것을 특징으로 하는, 복호 방법.
  22. 제 15 항에 있어서,
    상기 파워 보정용 스펙트럼의 파워를 조정하는 파워 조정 공정을 갖고,
    상기 합성 공정에서는, 복호한 상기 스펙트럼과 파워 조정 후의 상기 파워 보정용 스펙트럼이 합성되는 것을 특징으로 하는, 복호 방법.
  23. 제 22 항에 있어서,
    상기 파워 조정 공정에서는, 상기 스펙트럼의 복호에 사용한 정규화 계수에 기초하여 상기 파워 보정용 스펙트럼의 파워가 조정되는 것을 특징으로 하는, 복호 방법.
  24. 제 22 항에 있어서,
    상기 파워 조정 공정에서는, 상기 스펙트럼의 복호에 사용한 양자화 정밀도 정보에 기초하여 상기 파워 보정용 스펙트럼의 파워가 조정되는 것을 특징으로 하는, 복호 방법.
  25. 제 22 항에 있어서,
    상기 파워 조정 공정에서는, 상기 스펙트럼의 부호화시에 부호화된 파워 조정 정보에 기초하여 상기 파워 보정용 스펙트럼의 파워가 조정되는 것을 특징으로 하는, 복호 방법.
  26. 제 15 항에 있어서,
    상기 합성 공정에서는, 상기 스펙트럼과 상기 파워 보정용 스펙트럼이 가산되는 것을 특징으로 하는, 복호 방법.
  27. 제 15 항에 있어서,
    상기 합성 공정에서는, 상기 스펙트럼의 적어도 일부와 상기 파워 보정 스펙트럼이 치환되는 것을 특징으로 하는, 복호 방법.
  28. 제 15 항에 있어서,
    상기 합성 공정에서는, 소정의 값 이하의 상기 스펙트럼과 상기 파워 보정용 스펙트럼이 합성되는 것을 특징으로 하는, 복호 방법.
  29. 디지털 신호를 스펙트럼 변환하여 부호화된 스펙트럼을 복호하는 복호 장치에 있어서,
    상기 스펙트럼을 복호하는 복호 수단,
    파워 조정용 스펙트럼을 생성하는 파워 보정용 스펙트럼 생성 수단, 및
    상기 복호한 스펙트럼과 상기 파워 보정용 스펙트럼을 합성하는 합성 수단을 구비하는 것을 특징으로 하는, 복호 장치.
  30. 제 29 항에 있어서,
    상기 파워 보정용 스펙트럼 생성 수단은 소정의 스펙트럼 패턴으로부터 생성한 테이블의 값을 참조하여 상기 파워 보정용 스펙트럼을 생성하는 것을 특징으로 하는, 복호 장치.
  31. 제 30 항에 있어서,
    상기 파워 보정용 스펙트럼 생성 수단은 상기 테이블로부터 값을 참조하는 위치를 상기 스펙트럼의 부호화에 사용한 데이터에 기초하여 결정하는 것을 특징으로 하는, 복호 장치.
  32. 제 31 항에 있어서,
    상기 스펙트럼의 부호화에 사용한 데이터는 정규화 계수인 것을 특징으로 하는, 복호 장치.
  33. 제 31 항에 있어서,
    상기 스펙트럼의 부호화에 사용한 데이터는 양자화 정밀도 정보인 것을 특징으로 하는, 복호 장치.
  34. 제 29 항에 있어서,
    상기 파워 보정용 스펙트럼 생성 수단은 랜덤한 수치열을 사용하여 상기 파워 보정용 스펙트럼을 생성하는 것을 특징으로 하는, 복호 장치.
  35. 제 34 항에 있어서,
    상기 랜덤한 수치열은 가우스 분포 수치열인 것을 특징으로 하는, 복호 장치.
  36. 제 29 항에 있어서,
    상기 파워 보정용 스펙트럼의 파워를 조정하는 파워 조정 수단을 구비하고,
    상기 합성 수단은 복호한 상기 스펙트럼과 파워 조정 후의 상기 파워 보정용 스펙트럼을 합성하는 것을 특징으로 하는, 복호 장치.
  37. 제 36 항에 있어서,
    상기 파워 조정 수단은 상기 스펙트럼의 복호에 사용한 정규화 계수에 기초하여 상기 파워 보정용 스펙트럼의 파워를 조정하는 것을 특징으로 하는, 복호 장치.
  38. 제 36 항에 있어서,
    상기 파워 조정 수단은 상기 스펙트럼의 복호에 사용한 양자화 정밀도 정보에 기초하여 상기 파워 보정용 스펙트럼의 파워를 조정하는 것을 특징으로 하는, 복호 장치.
  39. 제 36 항에 있어서,
    상기 파워 조정 수단은 상기 스펙트럼의 부호화시에 부호화된 파워 조정 정보에 기초하여 상기 파워 보정용 스펙트럼의 파워를 조정하는 것을 특징으로 하는, 복호 장치.
  40. 제 29 항에 있어서,
    상기 합성 수단은 상기 스펙트럼과 상기 파워 보정용 스펙트럼을 가산하는 것을 특징으로 하는, 복호 장치.
  41. 제 29 항에 있어서,
    상기 합성 수단은 상기 스펙트럼의 적어도 일부와 상기 파워 보정 스펙트럼을 치환하는 것을 특징으로 하는, 복호 장치.
  42. 제 29 항에 있어서,
    상기 합성 수단은 소정의 값 이하의 상기 스펙트럼과 상기 파워 보정용 스펙트럼을 합성하는 것을 특징으로 하는, 복호 장치.
  43. 삭제
  44. 디지털 신호를 스펙트럼 변환하여 부호화된 스펙트럼을 복호하는 복호 처리를 컴퓨터에 실행시키는 프로그램이 기록된 컴퓨터 판독 가능 기록매체에 있어서,
    상기 스펙트럼을 복호하는 복호 공정,
    파워 보정용 스펙트럼을 생성하는 파워 보정용 스펙트럼 생성 공정, 및
    상기 복호한 스펙트럼과 상기 파워 보정용 스펙트럼을 합성하는 합성 공정을 갖는 것을 특징으로 하는, 컴퓨터 판독 가능 기록매체.
KR1020047000175A 2002-05-07 2003-04-30 부호화 방법 및 장치, 및 복호 방법 및 장치 KR100941011B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2002132188A JP4296752B2 (ja) 2002-05-07 2002-05-07 符号化方法及び装置、復号方法及び装置、並びにプログラム
JPJP-P-2002-00132188 2002-05-07
PCT/JP2003/005545 WO2003096325A1 (en) 2002-05-07 2003-04-30 Coding method, coding device, decoding method, and decoding device

Publications (2)

Publication Number Publication Date
KR20040101180A KR20040101180A (ko) 2004-12-02
KR100941011B1 true KR100941011B1 (ko) 2010-02-05

Family

ID=29416630

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020047000175A KR100941011B1 (ko) 2002-05-07 2003-04-30 부호화 방법 및 장치, 및 복호 방법 및 장치

Country Status (7)

Country Link
US (1) US7428489B2 (ko)
EP (1) EP1503370B1 (ko)
JP (1) JP4296752B2 (ko)
KR (1) KR100941011B1 (ko)
CN (2) CN1302458C (ko)
DE (1) DE60331729D1 (ko)
WO (1) WO2003096325A1 (ko)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4734859B2 (ja) 2004-06-28 2011-07-27 ソニー株式会社 信号符号化装置及び方法、並びに信号復号装置及び方法
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
KR100857106B1 (ko) * 2005-09-14 2008-09-08 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
KR100785471B1 (ko) * 2006-01-06 2007-12-13 와이더댄 주식회사 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치
JP5147727B2 (ja) * 2006-01-19 2013-02-20 エルジー エレクトロニクス インコーポレイティド 信号デコーディング方法及び装置
TWI469133B (zh) * 2006-01-19 2015-01-11 Lg Electronics Inc 媒體訊號處理方法及裝置
KR20080110920A (ko) * 2006-02-07 2008-12-19 엘지전자 주식회사 부호화/복호화 장치 및 방법
US20090177479A1 (en) * 2006-02-09 2009-07-09 Lg Electronics Inc. Method for Encoding and Decoding Object-Based Audio Signal and Apparatus Thereof
TWI447707B (zh) * 2006-02-23 2014-08-01 Lg Electronics Inc 音頻訊號之處理方法及其裝置
EP1999745B1 (en) * 2006-03-30 2016-08-31 LG Electronics Inc. Apparatuses and methods for processing an audio signal
US7930173B2 (en) 2006-06-19 2011-04-19 Sharp Kabushiki Kaisha Signal processing method, signal processing apparatus and recording medium
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
JP4769673B2 (ja) * 2006-09-20 2011-09-07 富士通株式会社 オーディオ信号補間方法及びオーディオ信号補間装置
JP4993992B2 (ja) * 2006-10-04 2012-08-08 シャープ株式会社 信号処理方法、信号処理装置及びプログラム
JP5189760B2 (ja) * 2006-12-15 2013-04-24 シャープ株式会社 信号処理方法、信号処理装置及びプログラム
JP5098492B2 (ja) * 2007-07-30 2012-12-12 ソニー株式会社 信号処理装置及び信号処理方法、並びにプログラム
JP5045295B2 (ja) * 2007-07-30 2012-10-10 ソニー株式会社 信号処理装置及び方法、並びにプログラム
US8386266B2 (en) * 2010-07-01 2013-02-26 Polycom, Inc. Full-band scalable audio codec
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
US9208792B2 (en) * 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
JP2012103395A (ja) * 2010-11-09 2012-05-31 Sony Corp 符号化装置、符号化方法、およびプログラム
KR101468458B1 (ko) 2010-11-12 2014-12-03 폴리콤 인코포레이티드 멀티 포인트 환경에서의 스케일러블 오디오
CA2925037C (en) * 2013-12-02 2020-12-01 Huawei Technologies Co., Ltd. Encoding method and apparatus
EP3288031A1 (en) * 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using a compensation value

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR960032911A (ko) * 1995-02-27 1996-09-17 이데이 노부유키 오디오 신호 압축 방법
KR19990044450A (ko) * 1995-09-06 1999-06-25 워렌 로버트 엘 오디오신호에 보조데이터를 전송하기 위한 방법 및 장치
JP2000259190A (ja) 1999-03-09 2000-09-22 Matsushita Electric Ind Co Ltd オーディオ信号圧縮方法及びオーディオ信号復号方法とオーディオ信号圧縮装置

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5185800A (en) * 1989-10-13 1993-02-09 Centre National D'etudes Des Telecommunications Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion
JP2841797B2 (ja) * 1990-09-07 1998-12-24 三菱電機株式会社 音声分析・合成装置
JP3153933B2 (ja) * 1992-06-16 2001-04-09 ソニー株式会社 データ符号化装置及び方法並びにデータ復号化装置及び方法
JP3191457B2 (ja) * 1992-10-31 2001-07-23 ソニー株式会社 高能率符号化装置、ノイズスペクトル変更装置及び方法
JP3343962B2 (ja) * 1992-11-11 2002-11-11 ソニー株式会社 高能率符号化方法及び装置
JPH06202695A (ja) * 1993-01-07 1994-07-22 Sony Corp 音声信号処理装置
JP3341440B2 (ja) * 1994-02-04 2002-11-05 ソニー株式会社 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体
US5731767A (en) * 1994-02-04 1998-03-24 Sony Corporation Information encoding method and apparatus, information decoding method and apparatus, information recording medium, and information transmission method
US5684920A (en) * 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
PL311812A1 (en) * 1994-04-01 1996-03-18 Sony Corp Method of and apparatus for encoding information, method of and apparatus fro decoding information, method of transmitting information and information recording medium
US5651090A (en) * 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
JPH08223049A (ja) * 1995-02-14 1996-08-30 Sony Corp 信号符号化方法及び装置、信号復号化方法及び装置、情報記録媒体並びに情報伝送方法
JPH0946233A (ja) * 1995-07-31 1997-02-14 Kokusai Electric Co Ltd 音声符号化方法とその装置、音声復号方法とその装置
JP3519859B2 (ja) * 1996-03-26 2004-04-19 三菱電機株式会社 符号器及び復号器
US5848155A (en) * 1996-09-04 1998-12-08 Nec Research Institute, Inc. Spread spectrum watermark for embedded signalling
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DE19730129C2 (de) * 1997-07-14 2002-03-07 Fraunhofer Ges Forschung Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals
JPH1185195A (ja) * 1997-09-11 1999-03-30 Sharp Corp ディジタルデータの符号化方法
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
JP3404350B2 (ja) * 2000-03-06 2003-05-06 パナソニック モバイルコミュニケーションズ株式会社 音声符号化パラメータ取得方法、音声復号方法及び装置
WO2001097212A1 (fr) 2000-06-14 2001-12-20 Kabushiki Kaisha Kenwood Dispositif et procédé d'interpolation de fréquence
FR2815492B1 (fr) * 2000-10-13 2003-02-14 Thomson Csf Systeme et procede de radiodiffusion assurant une continuite de service
EP1199711A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Encoding of audio signal using bandwidth expansion
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
US7016502B2 (en) * 2000-12-22 2006-03-21 Sony Corporation Encoder and decoder
US6850179B2 (en) * 2001-06-15 2005-02-01 Sony Corporation Encoding apparatus and encoding method
JP4506039B2 (ja) * 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR960032911A (ko) * 1995-02-27 1996-09-17 이데이 노부유키 오디오 신호 압축 방법
KR19990044450A (ko) * 1995-09-06 1999-06-25 워렌 로버트 엘 오디오신호에 보조데이터를 전송하기 위한 방법 및 장치
JP2000259190A (ja) 1999-03-09 2000-09-22 Matsushita Electric Ind Co Ltd オーディオ信号圧縮方法及びオーディオ信号復号方法とオーディオ信号圧縮装置

Also Published As

Publication number Publication date
US7428489B2 (en) 2008-09-23
CN1524261A (zh) 2004-08-25
EP1503370A4 (en) 2007-08-22
CN1302458C (zh) 2007-02-28
CN1629936A (zh) 2005-06-22
WO2003096325A1 (en) 2003-11-20
CN1256715C (zh) 2006-05-17
JP4296752B2 (ja) 2009-07-15
EP1503370B1 (en) 2010-03-17
DE60331729D1 (de) 2010-04-29
KR20040101180A (ko) 2004-12-02
US20040196770A1 (en) 2004-10-07
JP2003323198A (ja) 2003-11-14
EP1503370A1 (en) 2005-02-02

Similar Documents

Publication Publication Date Title
KR100941011B1 (ko) 부호화 방법 및 장치, 및 복호 방법 및 장치
US10446162B2 (en) System, method, and non-transitory computer readable medium storing a program utilizing a postfilter for filtering a prefiltered audio signal in a decoder
RU2469422C2 (ru) Способ и устройство для формирования уровня улучшения в системе кодирования звука
JP4506039B2 (ja) 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
JP4168976B2 (ja) オーディオ信号符号化装置及び方法
KR100304055B1 (ko) 음성 신호 부호화동안 잡음 대체를 신호로 알리는 방법
US7983904B2 (en) Scalable decoding apparatus and scalable encoding apparatus
RU2381571C2 (ru) Синтезирование монофонического звукового сигнала на основе кодированного многоканального звукового сигнала
KR101144696B1 (ko) 음향 신호 부호화 방법 및 부호화 장치, 음향 신호 복호 방법 및 복호 장치, 및 기록 매체 화상 표시 장치
JP2012177939A (ja) 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形
JPH08278799A (ja) 雑音荷重フィルタリング方法
KR100968057B1 (ko) 부호화 방법 및 장치, 및 복호 방법 및 장치
KR100952065B1 (ko) 부호화 방법 및 장치, 및 복호 방법 및 장치
JP4297078B2 (ja) 復号方法及び装置
JP5098492B2 (ja) 信号処理装置及び信号処理方法、並びにプログラム
JPH09135173A (ja) 符号化装置および符号化方法、復号化装置および復号化方法、伝送装置および伝送方法、並びに記録媒体
JP2002304184A (ja) 電子透かし情報埋め込み装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130131

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20140124

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee