KR20130088756A - 복호 장치, 부호화 장치 및 이러한 방법 - Google Patents

복호 장치, 부호화 장치 및 이러한 방법 Download PDF

Info

Publication number
KR20130088756A
KR20130088756A KR1020127033257A KR20127033257A KR20130088756A KR 20130088756 A KR20130088756 A KR 20130088756A KR 1020127033257 A KR1020127033257 A KR 1020127033257A KR 20127033257 A KR20127033257 A KR 20127033257A KR 20130088756 A KR20130088756 A KR 20130088756A
Authority
KR
South Korea
Prior art keywords
encoding
decoding
signal
amplitude
spectrum
Prior art date
Application number
KR1020127033257A
Other languages
English (en)
Inventor
도모후미 야마나시
마사히로 오시키리
Original Assignee
파나소닉 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 파나소닉 주식회사 filed Critical 파나소닉 주식회사
Publication of KR20130088756A publication Critical patent/KR20130088756A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

광대역 신호의 고역부의 스펙트럼 데이터를 효율적으로 부호화/복호 할 수 있어, 처리 연산량의 대폭적인 삭감을 실현함과 동시에, 복호 신호의 품질도 개선할 수 있는 복호 장치. 이 장치에 있어서, 샘플군 추출부(372)는, 제2 복호 신호의 스펙트럼으로부터 산출되는 복수의 서브밴드의 각각의 스펙트럼에 가장 근사(近似)한 대역 및, 제2부호화 정보에 포함되는 제1 진폭 조정 파라미터에 의해 추정된 고역의 스펙트럼에 있어서, 진폭치가 최대인 스펙트럼 성분에 근접하는 스펙트럼 성분일수록 선택되기 쉬운 가중치에 의해, 스펙트럼 성분을 부분적으로 선택하고, 대수 게인 적용부(373)는, 부분적으로 선택된 스펙트럼 성분에 대해서 제2 진폭 조정 파라미터를 적용하고, 보간 처리부(374)는, 부분적으로 선택되지 않았던 스펙트럼 성분에 대해서 제2 진폭 조정 파라미터의 값에 따라 적응적으로 설정되는 제3 진폭 조정 파라미터를 적용한다.

Description

복호 장치, 부호화 장치 및 이러한 방법{DECODING DEVICE, ENCODING DEVICE, AND METHODS FOR SAME}
본 발명은, 신호를 부호화하여 전송하는 통신 시스템에 이용되는 복호 장치, 부호화 장치 및 이러한 방법에 관한 것이다.
인터넷 통신에 대표되는 패킷 통신 시스템, 또는, 이동 통신 시스템 등에서 음성·악음 신호를 전송하는 경우, 음성·악음 신호의 전송 효율을 높이기위해, 압축·부호화 기술이 자주 사용된다. 또, 최근에는, 단지 낮은 비트레이트(bit rate)로 음성·악음 신호를 부호화한다고 하는 한편으로, 보다 광대역의 음성·악음 신호를 부호화하는 기술에 대한 요구가 높아지고 있다.
이러한 요구에 대해서, 부호화 후의 정보량을 큰폭으로 증가시키는 일 없이 광대역의 음성·악음 신호를 부호화하는 각종 기술이 개발 되어오고 있다.예를 들면 특허 문헌 1에 개시되어 있는 기술에서는, 부호화 장치는, 일정시간 분의 입력 음향 신호를 변환하여 얻어지는 스펙트럼 데이터 중에서, 주파수의 고역부(高域部)의 스펙트럼을 생성하기 위한 파라미터를 산출하고, 이것을 저역부(低域部)의 부호화 정보와 합해서 출력하고 있다.구체적으로는, 부호화 장치는, 주파수의 고역부의 스펙트럼 데이터를 복수의 서브밴드로 분할하고, 각 서브밴드에 있어서, 해당 서브밴드의 스펙트럼과 가장 근사(近似)한 저역부의 스펙트럼을 특정하는 파라미터를 산출한다.그 다음에, 부호화 장치는, 가장 근사한 저역부의 스펙트럼에 대해서, 2종류의 스케일링 팩터를 이용하여, 생성하는 고역 스펙트럼중의 피크 진폭, 또는 서브밴드의 에너지(이하, 서브밴드 에너지라고 함) 및 형상이, 타깃(target)인 입력 신호의 고역부의 스펙트럼의 피크 진폭, 서브밴드 에너지, 형상에 가까워지도록 조정한다.
국제 공개 제 2007/052088호
그렇지만, 상기 특허 문헌 1에서는, 부호화 장치는, 고역 스펙트럼을 합성할 때에, 입력 신호의 스펙트럼 데이터 및 합성하고 있는 고역 스펙트럼 데이터의, 전부의 샘플(MDCT(Modified Discrete Cosine Transform) 계수)에 대해서 대수 변환을 행한다.그리고, 부호화 장치는, 각각의 서브밴드 에너지 및 형상이 타깃인 입력 신호의 고역부의 스펙트럼의 피크 진폭, 서브밴드 에너지, 형상에 가까워지는 파라미터를 산출하고 있다.이 때문에, 부호화 장치에 있어서의 연산량이 매우 크다고 하는 문제점이 있다.또, 복호 장치는, 산출한 파라미터를 서브밴드내의 전부의 샘플에 적용하고 있고, 개개의 샘플의 진폭의 크기는 고려하고 있지 않다. 이 때문에, 상기 산출한 파라미터를 이용해 고역 스펙트럼을 생성할 때의 복호 장치에 있어서의 연산량도 매우 커지고, 그리고 또, 생성되는 복호 음성의 품질이 불충분하고, 경우에 따라서는 이음(異音)이 발생할 가능성도 있다.
본 발명의 목적은, 광대역 신호의 저역부의 스펙트럼 데이터에 기초해서 고역부의 스펙트럼 데이터를 효율적으로 부호화하여, 복호 신호의 품질을 개선할 수 있는 복호 장치, 부호화 장치 및 이러한 방법을 제공하는 것이다.
본 발명의 제1의 형태에 따른 복호 장치는, 음성 신호 또는 음악 신호의 소정 주파수 이하의 저역 부분을 나타내는 제1부호화 정보와, 상기 음성 신호 또는 음악 신호의 상기 소정 주파수보다 높은 고역부분을 분할한 복수의 서브밴드에 있어서, 상기 음성 신호 또는 음악 신호의 고역부분의 스펙트럼을 추정하기 위한 대역 정보 및 각 서브밴드내의 일부 또는 전부의 스펙트럼 성분에 대한 진폭을 조정하는 제1 진폭 조정 파라미터를 포함한 제2부호화 정보를 수신하는 수신 수단과, 상기 제1부호화 정보를 복호하여 제1 복호 신호를 생성하는 제1 복호 수단과, 상기 제2부호화 정보를 이용해서, 상기 제1 복호 신호로부터 상기 음성 신호 또는 음악 신호의 고역부분을 추정하여, 스펙트럼 성분의 진폭을 조정함으로써 제2 복호 신호를 생성하는 제2 복호 수단을 구비하는 복호 장치이며, 상기 제2 복호 수단은, 추정한 상기 음성 신호 또는 음악 신호의 고역부분의 스펙트럼에 대해서, 스펙트럼 성분을 부분적으로 선택하는 스펙트럼 성분 선택 수단과, 상기 부분적으로 선택된 스펙트럼 성분에 대해서 제2 진폭 조정 파라미터를 적용하는 제1 진폭 조정 파라미터 적용 수단과, 상기 부분적으로 선택되지 않았던 스펙트럼 성분에 대해서 상기 제2 진폭 조정 파라미터의 값에 따라 적응적으로 설정되는 제3 진폭 조정 파라미터를 적용하는 제2 진폭 조정 파라미터 적용 수단을 구비하는 구성을 취한다.
본 발명의 제2의 형태에 따른 부호화 장치는, 입력 신호의 소정 주파수 이하의 저역 부분을 부호화해서 제1부호화 정보를 생성하는 제1부호화 수단과, 상기 제1부호화 정보를 복호해서 제1 복호 신호를 생성하는 복호 수단과, 상기 입력 신호의 상기 소정 주파수보다 높은 고역부분을 분할한 복수의 서브밴드에 있어서, 상기 입력 신호의 고역부분의 스펙트럼을 추정하기 위한 대역 정보 및, 각 서브밴드내의 일부 또는 전부의 스펙트럼 성분에 대한 진폭을 조정하는 제1 진폭 조정 파라미터를 포함한 제2부호화 정보를 생성하는 제2부호화 수단과, 상기 제2부호화 정보를 이용해서, 상기 제1 복호 신호로부터 상기 입력 신호의 고역부분을 추정하여, 스펙트럼 성분의 진폭을 조정함으로써 제2 복호 신호를 생성하는 제2 복호 수단과, 상기 제1 복호 신호 및 상기 제2 복호 신호와, 상기 입력 신호와의 차분 신호를 부호화하여, 제3부호화 정보를 생성하는 제3부호화 수단을 구비하는 부호화 장치이며, 상기 제2 복호 수단은, 추정한 상기 입력 신호의 고역부분의 스펙트럼에 대해서, 스펙트럼 성분을 부분적으로 선택하는 스펙트럼 성분 선택 수단과, 상기 부분적으로 선택된 스펙트럼 성분에 대해서 제2 진폭 조정 파라미터를 적용하는 제1 진폭 조정 파라미터 적용 수단과, 상기 부분적으로 선택되지 않았던 스펙트럼 성분에 대해서 상기 제2 진폭 조정 파라미터의 값에 따라 적응적으로 설정되는 제3 진폭 조정 파라미터를 적용하는 제2 진폭 조정 파라미터 적용 수단을 구비하는 구성을 취한다.
본 발명의 제3의 형태에 따른 복호 방법은, 음성 신호 또는 음악 신호의 소정 주파수 이하의 저역 부분을 나타내는 제1부호화 정보와, 상기 음성 신호 또는 음악 신호의 상기 소정 주파수보다 높은 고역부분을 분할한 복수의 서브밴드에 있어서, 상기 음성 신호 또는 음악 신호의 고역부분의 스펙트럼을 추정하기 위한 대역 정보 및 각 서브밴드내의 일부 또는 전부의 스펙트럼 성분에 대한 진폭을 조정하는 제1 진폭 조정 파라미터를 포함한 제2부호화 정보를 수신하는 수신 스텝과, 상기 제1부호화 정보를 복호하여 제1 복호 신호를 생성하는 제1 복호 스텝과, 상기 제2부호화 정보를 이용하여, 상기 제1 복호 신호로부터 상기 음성 신호 또는 음악 신호의 고역부분을 추정하여, 스펙트럼 성분의 진폭을 조정함으로써 제2 복호 신호를 생성하는 제2복스텝을 구비하는 복호 방법이며, 상기 제2 복호 스텝은, 추정한 상기 음성 신호 또는 음악 신호의 고역부분의 스펙트럼에 대해서, 스펙트럼 성분을 부분적으로 선택하는 스펙트럼 성분 선택 스텝과, 상기 부분적으로 선택된 스펙트럼 성분에 대해서 제2 진폭 조정 파라미터를 적용하는 제1 진폭 조정 파라미터 적용 스텝과, 상기 부분적으로 선택되지 않았던 스펙트럼 성분에 대해서 상기 제2 진폭 조정 파라미터의 값에 따라 적응적으로 설정되는 제3 진폭 조정 파라미터를 적용하는 제2 진폭 조정 파라미터 적용 스텝을 구비하는 구성을 취한다.
본 발명의 제4의 형태에 따른 부호화 방법은, 입력 신호의 소정 주파수 이하의 저역 부분을 부호화하여 제1부호화 정보를 생성하는 제1부호화 스텝과, 상기 제1부호화 정보를 복호하여 제1 복호 신호를 생성하는 복호 스텝과, 상기 입력 신호의 상기 소정 주파수보다 높은 고역부분을 분할한 복수의 서브밴드에 있어서, 상기 입력 신호의 고역부분의 스펙트럼을 추정하기 위한 대역 정보 및, 각 서브밴드내의 일부 또는 전부의 스펙트럼 성분에 대한 진폭을 조정하는 제1 진폭 조정 파라미터를 포함한 제2부호화 정보를 생성하는 제2부호화 스텝과, 상기 제2부호화 정보를 이용하여, 상기 제1 복호 신호로부터 상기 입력 신호의 고역부분을 추정하여, 스펙트럼 성분의 진폭을 조정함으로써 제2 복호 신호를 생성하는 제2 복호 스텝과, 상기 제1 복호 신호 및 상기 제2 복호 신호와, 상기 입력 신호와의 차분 신호를 부호화하여, 제3부호화 정보를 생성하는 제3부호화 스텝을 구비하는 부호화 방법이며, 상기 제2 복호 스텝은, 추정한 상기 입력 신호의 고역부분의 스펙트럼에 대해서, 스펙트럼 성분을 부분적으로 선택하는 스펙트럼 성분 선택 스텝과, 상기 부분적으로 선택된 스펙트럼 성분에 대해서 제2 진폭 조정 파라미터를 적용하는 제1진폭조정 파라미터 적용 스텝과, 상기 부분적으로 선택되지 않았던 스펙트럼 성분에 대해서 상기 제2 진폭 조정 파라미터의 값에 따라 적응적으로 설정되는 제3 진폭 조정 파라미터를 적용하는 제2 진폭 조정 파라미터 적용 스텝을 구비하는 구성을 취한다.
본 발명에 의하면, 광대역 신호의 고역부의 스펙트럼 데이터를 효율적으로 부호화/복호할 수 있어, 처리 연산량의 대폭적인 삭감을 실현함과 동시에, 복호 신호의 품질도 개선할 수 있다.
도 1은 본 발명의 실시형태 1에 따른 부호화 장치 및 복호 장치를 가지는 통신 시스템의 구성을 나타내는 블록도,
도 2는 본 발명의 실시형태 1에 따른 도 1에 나타낸 부호화 장치의 내부의 주요한 구성을 나타내는 블록도,
도 3은 본 발명의 실시형태 1에 따른 도 2에 나타낸 제2 레이어 부호화부의 내부의 주요한 구성을 나타내는 블록도,
도 4는 본 발명의 실시형태 1에 따른 도 3에 나타낸 게인 부호화부의 주요한 구성을 나타내는 블록도,
도 5는 본 발명의 실시형태 1에 따른 도 4에 나타낸 대수 게인 부호화부의 주요한 구성을 나타내는 블록도,
도 6은 본 발명의 실시형태 1에 따른 필터링부에 있어서의 필터링 처리의 상세한 것에 대하여 설명하기 위한 도면,
도 7은 본 발명의 실시형태 1에 따른 탐색부에 있어서 서브밴드 SBp에 대해서 최적 피치 계수 Tp'를 탐색하는 처리 순서를 나타내는 흐름도,
도 8은 본 발명의 실시형태 1에 따른 도 1에 나타낸 복호 장치의 내부의 주요한 구성을 나타내는 블록도,
도 9는 본 발명의 실시형태 1에 따른 도 8에 나타낸 제2 레이어 복호부의 내부의 주요한 구성을 나타내는 블록도,
도 10은 본 발명의 실시형태 1에 따른 도 9에 나타낸 스펙트럼 조정부의 내부의 주요한 구성을 나타내는 블록도,
도 11은 본 발명의 실시형태 1에 따른 도 10에 나타낸 대수 게인 복호부의 내부의 주요한 구성을 나타내는 블록도,
도 12는 본 발명의 실시형태 1에 따른 대수 게인 복호부에 있어서의 대수 게인 적용부 및 보간 처리부 각각의 적용 대상이 되는 샘플에 대해 설명하기 위한 도면,
도 13은 본 발명의 실시형태 1에 따른 기타 부호화 장치의 내부의 주요한 구성을 나타내는 블록도,
도 14는 본 발명의 실시형태 2에 따른 도 1에 나타낸 부호화 장치의 내부의 주요한 구성을 나타내는 블록도,
도 15는 본 발명의 실시형태 2에 따른 도 14에 나타낸 제2 레이어 부호화부의 내부의 주요한 구성을 나타내는 블록도,
도 16은 본 발명의 실시형태 2에 따른 도 15에 나타낸 제1부호화부의 주요한 구성을 나타내는 블록도,
도 17은 본 발명의 실시형태 2에 따른 도 1에 나타낸 복호 장치의 내부의 주요한 구성을 나타내는 블록도,
도 18은 본 발명의 실시형태 2에 따른 도 17에 나타낸 제2 레이어 복호부의 내부의 주요한 구성을 나타내는 블록도.
본 발명에 있어서는, 부호화 장치가, 부호화 대상이 되는 신호의 고역부의 스펙트럼 데이터를 저역부의 스펙트럼 데이터에 기초하여 생성할 때, 서브밴드 내에서 진폭이 최대인 샘플의 위치에 기초하여 추출된 샘플군에 대해서 서브밴드 에너지 및 형상의 조정 파라미터를 산출한다. 또, 복호 장치가, 상기 파라미터를, 서브밴드 내에서 진폭이 최대인 샘플의 위치에 기초하여 추출된 샘플군에 대해서 적용한다. 이것에 의해, 광대역 신호의 고역부의 스펙트럼 데이터를 효율적으로 부호화/복호할 수 있으며, 처리 연산량의 대폭적인 삭감을 실현함과 동시에, 복호 신호의 품질도 개선할 수 있는 것이다.
이하, 본 발명의 각 실시형태에 대해서, 도면을 참조하여 상세히 설명한다. 또한, 본 발명에 따른 부호화 장치 및 복호 장치는, 입력 신호/출력 신호로서, 음성 신호, 악음 신호 및 이들이 혼재한 신호의 어느것에 대해서도 대상으로 하는 것으로 한다. 본 발명의 각 실시형태에 있어서는, 음성 부호화 장치 및 음성 복호 장치를 예로 들어 설명한다.
(실시형태 1)
도 1은, 본 실시형태에 따른 부호화 장치 및 복호 장치를 가지는 통신 시스템의 구성을 나타내는 블록도이다. 도 1에 있어서, 통신 시스템은, 부호화 장치(101)와 복호 장치(103)를 구비하여, 각각 전송로(102)를 경유하여 통신 가능한 상태로 되어 있다. 또한, 부호화 장치(101) 및 복호 장치(103)는 어느것도, 통상, 기지국 장치 또는 통신 단말장치 등에 탑재되어 이용된다.
부호화 장치(101)는, 입력 신호를 N샘플씩 단락지어(N은 자연수), N샘플을 1 프레임으로 하여 프레임마다 부호화를 행한다. 여기서, 부호화의 대상이 되는 입력 신호를 xn(n=0,…, N-1)이라고 표시하는 것으로 한다. N은, N샘플씩 단락지어진 입력 신호 중, 신호 요소의 n+1번째를 나타낸다. 부호화 장치(101)는, 부호화한 입력 정보(부호화 정보)를, 전송로(102)를 경유하여 복호 장치(103)에 송신한다.
복호 장치(103)는, 전송로(102)를 경유하여 부호화 장치(101)로부터 송신된 부호화 정보를 수신하고, 이것을 복호해서 출력 신호를 얻는다.
도 2는, 도 1에 나타낸 부호화 장치(101)의 내부의 주요한 구성을 나타내는 블록도이다. 입력 신호의 샘플링 주파수를 SR1이라고 하면, 다운 샘플링 처리부(201)는, 입력 신호의 샘플링 주파수를 SR1로부터 SR2까지 다운 샘플링 하고(SR2<SR1), 다운 샘플링한 입력 신호를 다운 샘플링 후 입력 신호로서 제1 레이어 부호화부(202)에 출력한다. 또한, 이하에서는, 일례로서 SR2는 SR1의 1/2 샘플링 주파수인 경우에 대해서 설명한다.
제1 레이어 부호화부(202)는, 다운 샘플링 처리부(201)로부터 입력되는 다운 샘플링 후 입력 신호에 대해서, 예를 들면 CELP(Code Excited Linear Prediction) 방식의 음성 부호화 방법을 이용해서 부호화를 행하여 제1 레이어 부호화 정보를 생성한다. 구체적으로는, 제1 레이어 부호화부(202)는, 입력 신호의 소정 주파수 이하의 저역 부분을 부호화하여 제1 레이어 부호화 정보를 생성한다. 그리고, 제1 레이어 부호화부(202)는, 생성한 제1 레이어 부호화 정보를 제1 레이어 복호부(203) 및 부호화 정보 통합부(207)에 출력한다.
제1 레이어 복호부(203)는, 제1 레이어 부호화부(202)로부터 입력되는 제1 레이어 부호화 정보에 대해서, 예를 들면 CELP 방식의 음성 복호 방법을 이용해서 복호를 행하여 제1 레이어 복호 신호를 생성한다. 그리고, 제1 레이어 복호부(203)는, 생성한 제1 레이어 복호 신호를 업 샘플링 처리부(204)에 출력한다.
업 샘플링 처리부(204)는, 제1 레이어 복호부(203)로부터 입력되는 제1 레이어 복호 신호의 샘플링 주파수를 SR2로부터 SR1까지 업 샘플링 하고, 업 샘플링한 제1 레이어 복호 신호를 업 샘플링 후 제 1 레이어 복호 신호로서 직교 변환 처리부(205)에 출력한다.
직교 변환 처리부(205)는, 버퍼 buf1n 및 buf2n(n=0,…, N-1)을 내부에 가지고, 입력 신호 xn 및 업 샘플링 처리부(204)로부터 입력되는 업 샘플링 후 제 1 레이어 복호 신호 yn를 수정 이산 코사인 변환 (MDCT:Modified Discrete Cosine Transform)한다.
이하, 직교 변환 처리부(205)에 있어서의 직교 변환 처리에 대해서, 그 계산 순서와 내부 버퍼로의 데이터 출력에 관해서 설명한다.
우선, 직교 변환 처리부(205)는, 하기의 수학식(1) 및 수학식(2)에 의해 버퍼 buf1n 및 buf2n 각각을, 「0」을 초기값으로서 초기화한다.
Figure pct00001
Figure pct00002
그 다음에, 직교 변환 처리부(205)는, 입력 신호 xn 및 업 샘플링 후 제 1 레이어 복호 신호 yn에 대해서 하기의 수학식(3) 및 수학식(4)에 따라 MDCT 하여, 입력 신호의 MDCT 계수(이하, 입력 스펙트럼이라고 부른다) S2(k) 및 업 샘플링 후 제 1 레이어 복호 신호 yn의 MDCT 계수(이하, 제1 레이어 복호 스펙트럼이라고 부른다) S1(k)를 구한다.
Figure pct00003
Figure pct00004
여기서, k는 1 프레임에 있어서의 각 샘플의 인덱스를 나타낸다. 직교 변환 처리부(205)는, 입력 신호 xn과 버퍼 buf1n을 결합시킨 벡터인 xn'를 하기의 수학식(5)에 의해 구한다. 또, 직교 변환 처리부(205)는, 업 샘플링 후 제 1 레이어 복호 신호 yn과 버퍼 buf2n을 결합시킨 벡터인 yn'를 하기의 수학식(6)에 의해 구한다.
Figure pct00005
Figure pct00006
그 다음에, 직교 변환 처리부(205)는, 수학식(7) 및 수학식(8)에 의해 버퍼 buf1n 및 buf2n을 갱신한다.
Figure pct00007
Figure pct00008
그리고, 직교 변환 처리부(205)는, 입력 스펙트럼 S2(k) 및 제1 레이어 복호 스펙트럼 S1(k)를 제2 레이어 부호화부(206)에 출력한다.
이상, 직교 변환 처리부(205)에 있어서의 직교 변환 처리에 대해서 설명했다.
제2 레이어 부호화부(206)는, 직교 변환 처리부(205)로부터 입력되는 입력 스펙트럼 S2(k) 및 제1 레이어 복호 스펙트럼 S1(k)를 이용해서 제2 레이어 부호화 정보를 생성하고, 생성한 제2 레이어 부호화 정보를 부호화 정보 통합부(207)에 출력한다. 또한, 제2 레이어 부호화부(206)의 상세한 것에 대해서는 후술한다.
부호화 정보 통합부(207)는, 제1 레이어 부호화부(202)로부터 입력되는 제1 레이어 부호화 정보와, 제2 레이어 부호화부(206)로부터 입력되는 제2 레이어 부호화 정보를 통합하고, 통합된 정보원(情報源) 부호에 대해서, 필요하면 전송 오류 부호 등을 부가한 다음 이것을 부호화 정보로서 전송로(102)에 출력한다.
다음에, 도 2에 나타낸 제2 레이어 부호화부(206)의 내부의 주요한 구성에 대해서 도 3을 이용해서 설명한다.
제2 레이어 부호화부(206)는, 대역 분할부(260), 필터 상태 설정부(261), 필터링부(262), 탐색부(263), 피치 계수 설정부(264), 게인 부호화부(265) 및 다중화부(266)를 구비하고, 각 부는 이하의 동작을 행한다.
대역 분할부(260)는, 직교 변환 처리부(205)로부터 입력되는 입력 스펙트럼 S2(k)의 소정 주파수보다 높은 고역부(FL≤k<FH)를 P개(단, P는 1보다 큰 정수)의 서브밴드 SBp(p=0, 1,…, P-1)로 분할한다. 그리고, 대역 분할부(260)는, 분할한 각 서브밴드의 밴드폭 BWp(p=0, 1,…, P-1) 및 선두 인덱스(즉, 서브밴드의 개시 위치) BSp(p=0, 1,…, P-1)(FL≤BSp<FH)를 대역 분할 정보(입력 신호의 소정 주파수보다 높은 고역부분을 분할한 복수의 서브밴드에 있어서, 입력 신호의 고역부분의 스펙트럼을 추정하기 위한 정보)로서 필터링부(262), 탐색부(263) 및 다중화부(266)에 출력한다. 이하, 입력 스펙트럼 S2(k) 중, 서브밴드 SBp에 대응하는 부분을 서브밴드 스펙트럼 S2p(k) (BSp≤k<BSp+BWp)라고 적는다.
필터 상태 설정부(261)는, 직교 변환 처리부(205)로부터 입력되는 제1 레이어 복호 스펙트럼 S1(k)(0≤k<FL)을, 필터링부(262)에서 이용하는 필터 상태로서 설정한다. 즉, 필터링부(262)에 있어서의 전 주파수 대역 0≤k<FH의 스펙트럼 S(k)의 0≤k<FL의 대역에, 제1 레이어 복호 스펙트럼 S1(k)가 필터의 내부 상태(필터 상태)로서 저장된다.
필터링부(262)는, 멀티 탭 피치 필터를 구비하고, 필터 상태 설정부(261)에 의해 설정된 필터 상태와, 피치 계수 설정부(264)로부터 입력되는 피치 계수와, 대역 분할부(260)로부터 입력되는 대역 분할 정보에 기초하여, 제1 레이어 복호 스펙트럼을 필터링하고, 각 서브밴드 SBp(p=0, 1,…, P-1)의 추정치 S2p'(k)(BSp≤k<BSp+BWp)(p=0, 1,…, P-1)(이하, 「서브밴드 SBp의 추정 스펙트럼」이라고 부름)를 산출한다. 필터링부(262)는, 서브밴드 SBp의 추정 스펙트럼 S2p'(k)를 탐색부(263)에 출력한다. 또한, 필터링부(262)에 있어서의 필터링 처리의 상세한 것에 대해서는 후술한다. 또한, 멀티 탭의 탭 수는 1이상의 임의의 값(정수)을 취할 수 있는 것으로 한다.
탐색부(263)는, 대역 분할부(260)로부터 입력되는 대역 분할 정보에 기초하여, 필터링부(262)로부터 입력되는 서브밴드 SBp의 추정 스펙트럼 S2p'(k)와, 직교 변환 처리부(205)로부터 입력되는 입력 스펙트럼 S2(k)의 고역부(FL≤k<FH)에 있어서의 각 서브밴드 스펙트럼 S2p(k)와의 유사도(類似度)를 산출한다. 이 유사도 산출은, 예를 들면 상관 연산 등에 의해 행해진다. 또, 필터링부(262), 탐색부(263) 및 피치 계수 설정부(264)의 처리는, 서브밴드마다 폐루프(closed-loop)의 탐색 처리를 구성하여, 각 폐루프에 있어서, 탐색부(263)는, 피치 계수 설정부(264) 로부터 필터링부(262)에 입력되는 피치 계수 T를 여러 가지로 변화시킴으로써, 각 피치 계수에 대응하는 유사도를 산출한다. 탐색부(263)는, 서브밴드 마다의 폐루프에 있어서, 예를 들면, 서브밴드 SBp에 대응하는 폐루프에 있어서 유사도가 최대가 되는 최적 피치 계수 Tp'(단, Tmin~Tmax의 범위)를 구하고, P개의 최적 피치 계수를 다중화부(266)에 출력한다. 탐색부(263)에 있어서의 유사도의 산출 방법의 상세한 것에 대해서는 후술한다.
탐색부(263)는, 각 최적 피치 계수 Tp'를 이용하여, 각 서브밴드 SBp에 유사한, 제1 레이어 복호 스펙트럼의 일부 대역(즉, 각 서브밴드의 각각의 스펙트럼에 가장 근사(近似)한 대역)을 산출한다. 또, 탐색부(263)는, 각 최적 피치 계수 Tp'(p=0, 1,…, P-1)에 대응하는 추정 스펙트럼 S2p'(k) 및 수학식(9)에 따라 산출되는, 최적 피치 계수 Tp'(p=0, 1,…, P-1)를 산출했을 때의 진폭 조정 파라미터인 이상(理想) 게인α1p를, 게인 부호화부(265)에 출력한다. 또한, 식(9)에 있어서, M'는, 유사도 D를 산출할 때의 샘플수를 나타내며, 각 서브밴드의 밴드폭 이하의 임의의 값으로 좋다. 또한, 탐색부(263)에 있어서의 최적 피치 계수 Tp'(p=0, 1,…, P-1)의 탐색 처리의 상세한 것에 대해서는 후술한다.
Figure pct00009
피치 계수 설정부(264)는, 탐색부(263)의 제어하에, 필터링부(262) 및 탐색부(263)와 함께, 피치 계수 T를, 미리 정해진 탐색 범위 Tmin~Tmax 내에서 조금씩 변화시키면서, 필터링부(262)에 차례로 출력한다. 또한, 피치 계수 설정부(264)는, 예를 들면, 제1 서브밴드에 대응하는 폐루프의 탐색 처리를 행하는 경우에는, 피치 계수 T를, 미리 정해진 탐색 범위 Tmin~Tmax 안에서 조금씩 변화시키면서 설정하고, 제2 서브밴드 이후의 제m(m=2, 3,…, P) 서브밴드에 대응하는 폐루프의 탐색 처리를 행하는 경우에는, 제m-1 서브밴드에 대응하는 폐루프의 탐색 처리에 있어서 구해진 최적 피치 계수에 기초하여, 피치 계수 T를, 조금씩 변화시키면서 설정해도 좋다.
게인 부호화부(265)는, 입력 스펙트럼 S2(k) 및, 탐색부(263)로부터 입력되는 각 서브밴드의 추정 스펙트럼 S2p'(k)(p=0, 1,…, P-1), 이상 게인α1p에 기초하여, 비선형 영역에서의 에너지비(energy比) 조정을 행하는 파라미터인 대수(對數) 게인을, 각 서브밴드에 대해서 산출한다. 그 다음에, 게인 부호화부(265)는, 이상 게인 및 대수 게인을 양자화하고, 양자화한 이상 게인 및 대수 게인을 다중화부(266)에 출력한다.
도 4는, 게인 부호화부(265)의 내부 구성을 나타내는 도면이다. 게인 부호화부(265)는, 이상 게인 부호화부(271) 및 대수 게인 부호화부(272)로 주로 구성된다.
이상 게인 부호화부(271)는, 탐색부(263)로부터 입력되는 각 서브밴드의 추정 스펙트럼 S2p'(k)(p=0, 1,…, P-1)를 주파수 영역에서 연속시켜서 입력 스펙트럼의 고역부의 추정 스펙트럼 S2'(k)를 구성한다.그 다음에, 이상 게인 부호화부(271)는, 수학식(10)에 따라, 탐색부(263) 로부터 입력되는 각 서브밴드에 대한 이상 게인α1p를 추정 스펙트럼 S2'(k)에 곱하여, 추정 스펙트럼 S3'(k)를 산출한다. 또한, 식(10)에 있어서, BLp는 각 서브밴드의 선두(先頭) 인덱스를 나타내고, BHp는 각 서브밴드의 종단(終端) 인덱스를 나타낸다. 그리고, 이상 게인 부호화부(271)는, 산출한 추정 스펙트럼 S3'(k)를 대수 게인 부호화부(272)에 출력한다. 또, 이상 게인 부호화부(271)는, 이상 게인α1p를 양자화하고, 양자화한 이상 게인α1Qp를 이상 게인 부호화 정보로서 다중화부(266)에 출력한다.
Figure pct00010
대수 게인 부호화부(272)는, 직교 변환 처리부(205)로부터 입력되는 입력 스펙트럼 S2(k)의 고역부(FL≤k<FH)와, 이상 게인 부호화부(271) 로부터 입력되는 추정 스펙트럼 S3'(k)와의 서브밴드 마다의 비선형 영역에서의 에너지비 조정을 행하는 파라미터(즉, 진폭 조정 파라미터)인 대수 게인을 산출하고, 산출한 대수 게인을 대수 게인 부호화 정보로서 다중화부(266)에 출력한다.
도 5에, 대수 게인 부호화부(272)의 내부 구성을 나타낸다. 대수 게인 부호화부(272)는, 최대 진폭치 탐색부(281), 샘플군 추출부(282) 및 대수 게인 산출부(283)로 주로 구성된다.
최대 진폭치 탐색부(281)는, 수학식(11)과 같이 하여, 이상 게인 부호화부(271)로부터 입력되는 추정 스펙트럼 S3'(k)에 대해서, 대수 영역에서의 최대 진폭치 MaxValuep 및 진폭이 최대인 샘플(스펙트럼 성분)의 인덱스, 최대 진폭 인덱스 MaxIndexp를 서브밴드마다 탐색한다.
Figure pct00011
즉, 최대 진폭치 탐색부(281)는, 인덱스가 짝수인 샘플에 대해서만 대수 영역에서의 최대 진폭치의 탐색을 행한다. 이것에 의해, 최대 진폭치의 탐색에 대한 연산량을 효율적으로 삭감할 수 있다.
그리고, 최대 진폭치 탐색부(281)는, 추정 스펙트럼 S3'(k), 최대 진폭치MaxValuep 및 최대 진폭 인덱스MaxIndexp를 샘플군(群) 추출부(282)에 출력한다.
샘플군 추출부(282)는, 최대 진폭치 탐색부(281)로부터 입력되는 추정 스펙트럼 S3'(k)에 대해서, 이하의 수학식(12)에 따라, 각 샘플(스펙트럼 성분)에 대한 추출 플래그 SelectFlag(k)의 값을 결정한다.
Figure pct00012
즉, 샘플군 추출부(282)는, 식(12)에 나타내는 것처럼, 인덱스가 홀수인 샘플에 대해서는, 추출 플래그SelectFlag(k)의 값을 0으로 설정하고, 인덱스가 짝수인 샘플에 대해서는, 추출 플래그SelectFlag(k)의 값을 1로 설정한다. 즉, 샘플군 추출부(282)는, 추정 스펙트럼 S3'(k)에 대해서, 샘플(스펙트럼 성분)을 부분적으로(여기에서는, 짝수 인덱스의 샘플만) 선택한다. 그리고, 샘플군 추출부(282)는, 추출 플래그 SelectFlag(k), 추정 스펙트럼 S3'(k) 및 최대 진폭치 MaxValuep를 대수 게인 산출부(283)에 출력한다.
대수 게인 산출부(283)는, 샘플군 추출부(282)로부터 입력되는 추출 플래그 SelectFlag(k)의 값이 1인 샘플에 대해서, 수학식(13)에 따라, 추정 스펙트럼 S3'(k)과 입력 스펙트럼 S2(k)의 고역부(FL≤k<FH)의 대수 영역에서의 에너지비(대수 게인) α2p를 산출한다. 즉, 대수 게인 산출부(283)는, 샘플군 추출부(282)에서 부분적으로 선택된 샘플에 대해서만, 대수 게인α2p를 산출한다.
Figure pct00013
그리고, 대수 게인 산출부(283)는, 대수 게인α2p를 양자화하고, 양자화한 대수 게인α2Qp를 대수 게인 부호화 정보로서 다중화부(266)에 출력한다.
이상, 게인 부호화부(265)의 처리에 대해서 설명했다.
다중화부(266)는, 대역 분할부(260)로부터 입력되는 대역 분할 정보와, 탐색부(263)로부터 입력되는 각 서브밴드 SBp(p=0, 1,…, P-1)에 대한 최적 피치 계수 Tp'와, 게인 부호화부(265)로부터 입력되는 이상 게인α1Qp 및 대수 게인α2Qp에 각각 대응하는 인덱스(이상 게인 부호화 정보 및 대수 게인 부호화 정보. 즉, 각 서브밴드내의 일부 또는 전부의 스펙트럼 성분에 대한 진폭을 조정하는 파라미터)를, 제2 레이어 부호화 정보로서 다중화하여, 부호화 정보 통합부(207)에 출력한다.또한,Tp'와α1Qp 및α2Qp의 인덱스를 직접, 부호화 정보 통합부(207)에 입력하고, 부호화 정보 통합부(207)에서 제1 레이어 부호화 정보와 다중화해도 좋다.
그 다음에, 도 3에 나타낸 필터링부(262)에 있어서의 필터링 처리의 상세한 것에 대하여, 도 6을 이용해서 설명한다.
필터링부(262)는, 필터 상태 설정부(261)로부터 입력되는 필터 상태와, 피치 계수 설정부(264)로부터 입력되는 피치 계수 T와, 대역 분할부(260)로부터 입력되는 대역 분할 정보를 이용하여, 서브밴드 SBp(p=0, 1,…, P-1)에 대해서, 대역 BSp≤k<BSp+BWp(p=0, 1,…, P-1)에 있어서의 추정 스펙트럼을 생성한다. 필터링부(262)에 있어서 이용하는 필터의 전달 함수 F(z)는 하기의 수학식(14)으로 표시된다.
이하, 서브밴드 SBp를 예로 들어, 서브밴드 스펙트럼 S2p(k)의 추정 스펙트럼 S2p'(k)를 생성하는 처리를 설명한다.
Figure pct00014
식(14)에 있어서, T는 피치 계수 설정부(264)로부터 부여되는 피치 계수, βi는 미리 내부에 기억되어 있는 필터 계수를 나타내고 있다. 예를 들면, 탭 수가 3일 경우, 필터 계수의 후보는(β-10, β1)=(0.1, 0.8, 0.1)을 일례로서 들 수 있다. 그 밖에, 필터 계수의 후보로서, (β-10, β1)=(0.2, 0.6, 0.2), (0.3, 0.4, 0.3)등의 값도 적당하다. 또, 필터 계수의 후보로서, (β-10, β1)=(0.0, 1.0, 0.0)의 값도 좋고, 이 경우에는 대역 0≤k<FL의 제1 레이어 복호 스펙트럼의 일부 대역을 그 형상을 변화시키지 않고 그대로 BSp≤k<BSp+BWp의 대역에 복사하는 것을 의미한다. 이하의 설명에서는, (β-1, β0, β1)=(0.0, 1.0, 0.0)인 경우를 예로 들어 설명한다. 또, 식(14)에 있어서 M=1이라고 한다. M은 탭 수에 관한 지표이다.
필터링부(262)에 있어서의 전(全)주파수 대역의 스펙트럼 S(k)의 0≤k<FL의 대역에는, 제1 레이어 복호 스펙트럼 S1(k)가 필터의 내부 상태(필터 상태)로서 저장된다.
S(k)의 BSp≤k<BSp+BWp의 대역에는, 아래의 순서의 필터링 처리에 의해 서브밴드 SBp의 추정 스펙트럼 S2p'(k)가 저장된다. 즉, 도 6에 나타내는 것처럼, S2p'(k)에는, 기본적으로, 이 k보다 T만큼 낮은 주파수의 스펙트럼 S(k-T)가 대입된다. 단, 스펙트럼의 원활성을 높이기 위해, 실제로는, 스펙트럼 S(k-T)로부터 i만큼 떨어진 근방의 스펙트럼 S(k-T+i)에 소정의 필터 계수 βi를 곱한 스펙트럼 βi·S(k-T+i)를, 전부의 i에 대해서 가산한 스펙트럼을 S2p'(k)에 대입한다. 이 처리는 하기의 수학식(15)으로 표시된다.
Figure pct00015
상기 연산을, 주파수가 낮은 k=BSp부터 차례로, k를 BSp≤k<BSp+BWp의 범위에서 변화시켜서 행함으로써, BSp≤k<BSp+BWp에 있어서의 추정 스펙트럼 S2p'(k)를 산출한다.
이상의 필터링 처리는, 피치 계수 설정부(264)로부터 피치 계수 T가 부여될 때마다, BSp≤k<BSp+BWp의 범위에 있어서, 그때마다 S(k)를 제로 클리어(ZeroClear) 하여 행해진다. 즉, 피치 계수 T가 변화할 때마다 S(k)는 산출되고, 탐색부(263)에 출력된다.
도 7은, 도 3에 나타낸 탐색부(263)에 있어서 서브밴드 SBp에 대해서 최적 피치 계수 Tp'를 탐색하는 처리의 순서를 나타내는 흐름도이다. 또한, 탐색부(263)는, 도 7에 나타낸 순서를 반복함으로써, 각 서브밴드 SBp(p=0, 1,…, P-1)에 대응하는 최적 피치 계수 Tp'(p=0, 1,…, P-1)를 탐색한다.
우선, 탐색부(263)는, 유사도의 최소치를 보존하기 위한 변수인 최소 유사도 Dmin을 「+∞」로 초기화한다(ST2010). 그 다음에, 탐색부(263)는, 하기의 수학식(16)에 따라, 어느 피치 계수에 있어서의 입력 스펙트럼 S2(k)의 고역부(FL≤k<FH)와, 추정 스펙트럼 S2p'(k)와의 유사도 D를 산출한다(ST2020).
Figure pct00016
식(16)에 있어서, M'는, 유사도 D를 산출할 때의 샘플수를 나타내고, 각 서브밴드의 밴드폭 이하의 임의의 값으로 좋다. 또한, 식(16) 내에는 S2p'(k)가 존재하지 않지만, 이것은 BSp와 S2'(k)를 이용해 S2p'(k)를 나타내고 있기 때문이다.
그 다음에, 탐색부(263)는 산출한 유사도 D가 최소 유사도 Dmin보다 작은지 아닌지를 판정한다(ST2030). ST2020에 있어서 산출된 유사도가 최소 유사도 Dmin보다 작은 경우(ST2030:「YES」)에는, 탐색부(263)는, 유사도 D를 최소 유사도 Dmin에 대입한다(ST2040). 한편, ST2020에 있어서 산출된 유사도가 최소 유사도 Dmin 이상인 경우(ST2030:「NO」)에는, 탐색부(263)는, 탐색 범위에 걸친 처리가 종료했는지 아닌지를 판정한다. 즉, 탐색부(263)는, 탐색 범위내의 전부의 피치 계수 각각 대해서, ST2020에 있어서 상기의 식(16)에 따라 유사도를 산출했는지 아닌지를 판정한다(ST2050). 탐색 범위에 걸쳐서 처리가 종료하지 않았을 경우(ST2050:「NO」)에는, 탐색부(263)는 처리를 다시 ST2020으로 되돌린다. 그리고, 탐색부(263)는, 전회의 ST2020의 순서에 있어서 식(16)에 따라 유사도를 산출했을 경우와는 다른 피치 계수에 대해서, 식(16)에 따라 유사도를 산출한다. 한편, 탐색 범위에 걸친 처리가 종료한 경우(ST2050: 「YES」)에는, 탐색부(263)는, 최소 유사도 Dmin에 대응하는 피치 계수 T를 최적 피치 계수 Tp'로서 다중화부(266)에 출력한다(ST2060).
다음에, 도 1에 나타낸 복호 장치(103)에 대해서 설명한다.
도 8은, 복호 장치(103) 내부의 주요한 구성을 나타내는 블록도이다.
도 8에 있어서, 부호화 정보 분리부(131)는, 입력된 부호화 정보(즉, 부호화 장치(101)로부터 수신한 부호화 정보)중에서 제1 레이어 부호화 정보와 제2 레이어 부호화 정보를 분리하여, 제1 레이어 부호화 정보를 제1 레이어 복호부(132)에 출력하고, 제2 레이어 부호화 정보를 제2 레이어 복호부(135)에 출력한다.
제1 레이어 복호부(132)는, 부호화 정보 분리부(131)로부터 입력되는 제1 레이어 부호화 정보에 대해서 복호를 행하여, 생성된 제1 레이어 복호 신호를 업 샘플링 처리부(133)에 출력한다. 여기서, 제1 레이어 복호부(132)의 동작은, 도 2에 나타낸 제1 레이어 복호부(203)와 동일하기 때문에, 상세한 설명은 생략한다.
업 샘플링 처리부(133)는, 제1 레이어 복호부(132)로부터 입력되는 제1 레이어 복호 신호에 대해서 샘플링 주파수를 SR2로부터 SR1까지 업 샘플링 하는 처리를 행하고, 얻어지는 업 샘플링 후 제 1 레이어 복호 신호를 직교 변환 처리부(134)에 출력한다.
직교 변환 처리부(134)는, 업 샘플링 처리부(133)로부터 입력되는 업 샘플링 후 제 1 레이어 복호 신호에 대해서 직교 변환 처리(MDCT)를 실시하고, 얻어지는 업 샘플링 후 제 1 레이어 복호 신호의 MDCT 계수(이하, 제1 레이어 복호 스펙트럼이라고 부른다) S1(k)를 제2 레이어 복호부(135)에 출력한다. 여기서, 직교 변환 처리부(134)의 동작은, 도 2에 나타낸 직교 변환 처리부(205)의 업 샘플링 후 제 1 레이어 복호 신호에 대한 처리와 동일하기 때문에, 상세한 설명은 생략한다.
제2 레이어 복호부(135)는, 직교 변환 처리부(134)로부터 입력되는 제1 레이어 복호 스펙트럼 S1(k) 및 부호화 정보 분리부(131)로부터 입력되는 제2 레이어 부호화 정보를 이용해, 제1 레이어 복호 스펙트럼 S1(k)로부터, 음성 신호의 고역부분을 추정하여, 스펙트럼 성분의 진폭을 조정함으로써, 고역성분을 포함한 제2 레이어 복호 신호를 생성하여 출력 신호로서 출력한다.
도 9는, 도 8에 나타낸 제2 레이어 복호부(135)의 내부의 주요한 구성을 나타내는 블록도이다.
분리부(351)는, 부호화 정보 분리부(131)로부터 입력되는 제2 레이어 부호화 정보를, 각 서브밴드의 밴드폭 BWp(p=0, 1,…, P-1), 선두 인덱스 BSp(p=0, 1,…, P-1)(FL≤BSp<FH)를 포함한 대역 분할 정보와, 필터링에 관한 정보인 최적 피치 계수 Tp'(p=0, 1,…, P-1)와, 게인에 관한 정보인 이상 게인 부호화 정보(j=0, 1,…, J-1) 및 대수 게인 부호화 정보(j=0, 1,…, J-1)의 인덱스로 분리한다. 그리고, 분리부(351)는, 대역 분할 정보 및 최적 피치 계수 Tp'(p=0, 1,…, P-1)를 필터링부(353)에 출력하고, 이상 게인 부호화 정보 및 대수 게인 부호화 정보의 인덱스를 게인 복호부(354)에 출력한다. 또한, 부호화 정보 분리부(131)에 있어서, 대역 분할 정보와, 최적 피치 계수 Tp'(p=0, 1,…, P-1)와, 이상 게인 부호화 정보 및 대수 게인 부호화 정보의 인덱스를 분리한 경우는, 분리부(351)를 배치하지 않아도 좋다.
필터 상태 설정부(352)는, 직교 변환 처리부(134)로부터 입력되는 제1 레이어 복호 스펙트럼 S1(k)(0≤k<FL)을, 필터링부(353)에서 이용하는 필터 상태로서 설정한다. 여기서, 필터링부(353)에 있어서의 전(全)주파수 대역 0≤k<FH의 스펙트럼을 편의적으로 S(k)라고 부를 경우, S(k)의 0≤k<FL의 대역에, 제1 레이어 복호 스펙트럼 S1(k)가 필터의 내부 상태(필터 상태)로서 저장된다. 여기서, 필터 상태 설정부(352)의 구성 및 동작은, 도 3에 나타낸 필터 상태 설정부(261)와 동일하기 때문에, 상세한 설명은 생략한다.
필터링부(353)는, 멀티 탭(탭 수가 1보다 많음)의 피치 필터를 구비한다. 필터링부(353)는, 분리부(351)로부터 입력되는 대역 분할 정보와, 필터 상태 설정부(352)에 의해 설정된 필터 상태와, 분리부(351)로부터 입력되는 피치 계수 Tp'(p=0, 1,…, P-1)와, 미리 내부에 저장하고 있는 필터 계수에 기초하여, 제1 레이어 복호 스펙트럼 S1(k)를 필터링 하여, 상기의 식(15)에 나타내는, 각 서브밴드 SBp(p=0, 1,…, P-1)의 추정치 S2p'(k)(BSp≤k<BSp+BWp)(p=0, 1,…, P-1)를 산출한다. 필터링부(353)에서도, 상기의 식(14)에 나타낸 필터 함수가 이용된다. 단, 이 경우의 필터링 처리 및 필터 함수는, 식(14), 식(15)에 있어서의 T를 Tp'로 대체시킨 것으로 한다. 즉, 필터링부(353)는, 제1 레이어 복호 스펙트럼으로부터, 부호화 장치(101)에 있어서의 입력 스펙트럼의 고역부를 추정한다.
게인 복호부(354)는, 분리부(351)로부터 입력되는, 이상 게인 부호화 정보 및 대수 게인 부호화 정보의 인덱스를 복호하여, 이상 게인 α1p 및 대수 게인α2p의 양자화값인 양자화 이상 게인α1Qp 및 양자화 대수 게인 α2Qp를 구한다.
스펙트럼 조정부(355)는, 필터링부(353)로부터 입력되는 각 서브밴드 SBp(p=0, 1,…, P-1)의 추정치 S2p'(k)(BSp≤k<BSp+BWp)(p=0, 1,…, P-1), 및 게인 복호부(354)로부터 입력되는 서브밴드 마다의 이상 게인 α1Qp로부터 복호 스펙트럼을 산출하고, 산출한 복호 스펙트럼을 직교 변환 처리부(356)에 출력한다.
도 10은, 스펙트럼 조정부(355)의 내부 구성을 나타내는 도면이다. 스펙트럼 조정부(355)는, 이상 게인 복호부(361) 및 대수 게인 복호부(362)로 주로 구성된다.
이상 게인 복호부(361)는, 필터링부(353)로부터 입력되는 각 서브밴드의 추정치 S2p'(k)(BSp≤k<BSp+BWp)(p=0, 1,…, P-1)를 주파수 영역에서 연속시켜서, 입력 스펙트럼에 대한 추정 스펙트럼 S2'(k)를 구한다. 그 다음에, 이상 게인 복호부(361)는, 하기의 수학식(17)에 따라, 추정 스펙트럼 S2'(k)에 게인 복호부(354)로부터 입력되는 서브밴드 마다의 양자화 이상 게인α1Qp를 곱하여, 추정 스펙트럼 S3'(k)를 산출한다. 그리고, 이상 게인 복호부(361)는, 추정 스펙트럼 S3'(k)를 대수 게인 복호부(362)에 출력한다.
Figure pct00017
대수 게인 복호부(362)는, 이상 게인 복호부(361)로부터 입력되는 추정 스펙트럼 S3'(k)에 대해서, 게인 복호부(354)로부터 입력되는 서브밴드 마다의 양자화 대수 게인 α2Qp를 이용하여, 대수 영역에서의 에너지 조정을 행하고, 얻어지는 스펙트럼을 복호 스펙트럼으로서 직교 변환 처리부(356)에 출력한다.
도 11은, 대수 게인 복호부(362)의 내부 구성을 나타내는 도면이다. 대수 게인 복호부(362)는, 최대 진폭치 탐색부(371), 샘플군 추출부(372), 대수 게인 적용부(373) 및, 보간(補間) 처리부(374)로 주로 구성된다.
최대 진폭치 탐색부(371)는, 수학식(18)과 같이 하여, 이상 게인 복호부(361)로부터 입력되는 추정 스펙트럼 S3'(k)에 대해서, 대수 영역에서의 최대 진폭치 MaxValuep, 및 진폭이 최대인 샘플(스펙트럼 성분)의 인덱스, 최대 진폭 인덱스 MaxIndexp를 서브밴드마다 탐색한다. 그리고, 최대 진폭치 탐색부(371)는, 추정 스펙트럼 S3'(k), 대수 영역에서의 최대 진폭치 MaxValuep 및 최대 진폭 인덱스 MaxIndexp를 샘플군 추출부(372)에 출력한다.
Figure pct00018
샘플군 추출부(372)는, 수학식(19)에 나타내는 것처럼, 산출된 각 서브밴드에 대한 최대 진폭 인덱스 MaxIndexp에 따라, 각 샘플에 대한 추출 플래그 SelectFlag(k)를 결정한다. 즉, 샘플군 추출부(372)는, 각 서브밴드에 있어서의 최대 진폭치 MaxValuep를 가지는 샘플에 근접한 샘플(스펙트럼 성분)일수록 선택되기 쉬운 가중치(Weight)에 의해, 샘플을 부분적으로 선택한다. 그리고, 샘플군 추출부(372)는, 추정 스펙트럼 S3'(k), 서브밴드 마다의 최대 진폭치 MaxValuep 및 추출 플래그 SelectFlag(k)를 대수 게인 적용부(373)에 출력한다. 또, 샘플군 추출부(372)는, 추출 플래그 SelectFlag(k)를 보간 처리부(374)에 출력한다.
Figure pct00019
대수 게인 적용부(373)는, 샘플군 추출부(372)로부터 입력되는 추정 스펙트럼 S3'(k), 및, 추출 플래그 SelectFlag(k)로부터, 추출된 샘플군의 부호(+,-)를 나타내는 Signp(k)를, 수학식(20)과 같이 하여 산출한다. 즉, 식(20)에 나타내는 것처럼, 대수 게인 적용부(373)는, 추출된 샘플의 부호가 ‘+'일 경우(S3'(k)≥0의 경우), Signp(k)=1로 하고, 그 이외의 경우(추출된 샘플의 부호가 ‘-'일 경우), Signp(k)=-1로 한다.
Figure pct00020
대수 게인 적용부(373)는, 샘플군 추출부(372)로부터 입력되는 추정 스펙트럼 S3'(k), 최대 진폭치 MaxValuep 및 추출 플래그 SelectFlag(k)와, 게인 복호부(354)로부터 입력되는 양자화 대수 게인 α2Qp, 및 식(20)에 따라 산출한 부호 Signp(k) 에 기초하여, 추출 플래그 SelectFlag(k)의 값이 1인 샘플에 대해서, 수학식(21), 수학식(22)에 따라, 추정 스펙트럼 S5'(k)를 산출한다.
Figure pct00021
Figure pct00022
즉, 대수 게인 적용부(373)는, 샘플군 추출부(372)에서 부분적으로 선택된 샘플(추출 플래그 SelectFlag(k)=1의 샘플)에 대해서만, 대수 게인 α2p를 적용한다. 그리고, 대수 게인 적용부(373)는, 추정 스펙트럼 S5'(k)를 보간 처리부(374)에 출력한다.
보간 처리부(374)에는, 샘플군 추출부(372)로부터 추출 플래그 SelectFlag(k)가 입력된다. 또, 보간 처리부(374)에는, 대수 게인 적용부(373)로부터 추정 스펙트럼 S5'(k)가 입력된다. 또, 보간 처리부(374)에는, 게인 복호부(354)로부터, 대수 게인 α2p가 입력된다. 보간 처리부(374)는, 우선, 수학식(23)에 따라, 대수 게인 α2p에 따른, 선형 영역에서의 선형 보간 파라미터 α3p를 산출한다.
Figure pct00023
식(23)에 나타내는 것처럼, 선형 보간 파라미터 α3p는, 대수 게인 α2p의 값에 따라 미리 정해진 값(여기에서는, ALPHA3_LOW 및 ALPHA3_HIGH) 중에서 적응적으로 설정된다. 또한, 식(23)에 있어서, TH는 미리 정해진 임계값이다.
그 다음에, 보간 처리부(374)는, 수학식(24)에 따라, 추출 플래그 SelectFlag(k)의 값이 0인 샘플군에 대해서, 선형 영역에서의 선형 보간을 행하여, 복호 스펙트럼 S6'(k)를 산출한다. 즉, 보간 처리부(374)는, 샘플군 추출부(372)에서 부분적으로 선택되지 않았던 샘플(추출 플래그 SelectFlag(k)=0의 샘플(스펙트럼 성분))에 대해서, 대수 게인 α2p의 값에 따라 적응적으로 설정되는 선형 보간 파라미터 α3p를 적용한다.
Figure pct00024
여기서, 선형 보간 파라미터 α3p의 구체적 예로서는, 식(23)에 있어서, 예를 들면 TH=0.45, ALPHA3_LOW=0.75, ALPHA3_HIGH=0.95를 들 수 있다. 즉, 보간 처리부(374)는, 대수 게인 α2p의 값이 미리 설정된 임계값 TH보다 작은 경우에는, 선형 보간 파라미터 α3p를 작게 설정하고, 대수 게인 α2p의 값이 미리 설정된 임계값 TH이상일 경우에는, 선형 보간 파라미터 α3p를 크게 설정한다. 이 조건에 있어서 본 발명이 특히 효과적인 것을 실험에 의해 확인하고 있다.
또한, 식(24)에서는, 최대 진폭치 탐색부(371)에서 산출한 대수 영역에서의 최대 진폭치 MaxValuep를 이용한 선형 영역에서의 선형 보간 처리를 이용하지만, 대수 영역에서의 최대 진폭치 대신에, 선형 영역에서의 최대 진폭치를 이용하는 것도 가능하다. 이 경우, 최대 진폭치 탐색부(371)에서는, 식(18) 대신에, 수학식(25)에 나타내는 것처럼 하여 선형 영역에서의 최대 진폭치 MaxValuep를 산출한다. 또, 이 경우, 보간 처리부(374)는, 식(24) 대신에, 수학식(26)에 따라, 선형 영역에서의 선형 보간 처리를 행한다. 이 구성에 의해, 식(18) 및 식(24)에 나타내는 등의 대수 변환 처리 및 지수(指數) 변환 처리의 회수를 삭감할 수 있어, 더한층의 연산량 삭감을 실현할 수 있다.
Figure pct00025
Figure pct00026
그 다음에, 보간 처리부(374)는, 산출한 복호 스펙트럼 S6'(k)를 직교 변환 처리부(356)에 출력한다. 여기서, 복호 스펙트럼 S6'(k)의 저역부(0≤k<FL)는 제1 레이어 복호 스펙트럼 S1(k)으로 되어있다. 또, 복호 스펙트럼 S6'(k)의 고역부(FL≤k<FH)는 추정 스펙트럼 S3'(k)에 대해서 대수 영역에서의 에너지 조정(대수 게인 적용부(373)에 있어서의 처리) 및, 선형 영역에서의 에너지 조정(보간 처리부(374)에 있어서의 선형 보간 처리)을 행한 스펙트럼으로 되어있다.
여기서, 보간 처리부(374)에 있어서의 선형 영역에서의 선형 보간 처리(선형 영역에서의 진폭 조정 처리)의 효과에 대해서 설명한다.
특허 문헌 1에 개시되어 있는, 대수 영역에서의 에너지 조정 처리는, 인간의 청감 특성을 이용한 처리이며, 대단히 효과적인 수단이다.그러나, 특허 문헌 1에 개시되어 있는 대수 영역에서의 에너지 조정 처리는, 전(全)샘플(MDCT 계수)을 대상으로 하여 대수 변환을 행할 필요가 있어, 처리 연산량이 매우 커져 버리는 문제가 있다.이것에 비해서, 본 발명에서는, 대수 영역에서의 에너지 조정 처리를 실시하는 샘플을 샘플군 추출부(372)에서 선택된 샘플에만 한정하고, 선택되지 않았던 샘플에 대해서는, 선형 영역에서의 선형 보간 처리를 행하는 방식을 취했다. 이 때, 본 방식에서는, 식(23)에 나타낸 것처럼, 대수 영역에서의 에너지 조정 처리에 이용하는 대수 게인α2p의 값에 따라, 선형 보간 계수 α3p를 적응적으로 전환함으로써, 대수 영역에서의 대수 게인에 의한 에너지 조정 처리와 동일한 처리를, 선형 영역에서의 선형 보간 처리에 의해 근사적으로 실현하고 있다.이러한 본 방식에 의해, 인간의 청감 특성에 적합한 에너지 조정 처리를, 특허 문헌 1에 개시되어 있는 종래 기술과 비교하여 큰폭으로 낮은 처리 연산량으로 행할 수 있게 된다.
여기서, 대수 게인 복호부(362)에 있어서의 대수 게인의 적용 처리 및, 선형 영역에서의 선형 보간 처리의 대상이 되는 샘플군의 일례를 도 12에 나타낸다.
도 12에 있어서, 검은색으로 나타낸 블록은 각 서브밴드(도 12에서는 제p서브밴드)에 있어서의 최대 진폭치를 가지는 샘플을 나타내고, 사선으로 나타낸 블록은 샘플 인덱스가 짝수인 샘플을 나타내고, 세로선으로 나타낸 블록은 최대 진폭치를 가지는 샘플(검은색으로 나타낸 블록)의 주변에 존재하는 샘플을 나타내고, 흰색 블록은 상기의 3종류 이외의 샘플을 나타낸다.
도 12에 나타내는 일례에서는, 흰색 블록으로 나타낸 샘플 이외의 샘플군에 대해서는, 대수 게인 적용부(373)에 있어서 대수 게인이 적용되고, 흰색 블록으로 나타낸 샘플군에 대해서, 보간 처리부(374)에 있어서 선형 영역에서의 보간 처리부가 적용된다.또한, 도 12는 일례이며, 본 발명은, 예를 들면, 최대 진폭치를 나타내는 샘플의 주변에 존재하는 샘플수는 도면 내에 나타낸 수 이외의 구성에 대해서도 동일하게 적용할 수 있다.
직교 변환 처리부(356)는, 스펙트럼 조정부(355)로부터 입력되는 복호 스펙트럼 S6'(k)를 시간 영역의 신호로 직교 변환하고, 얻어지는 제2 레이어 복호 신호를 출력 신호로서 출력한다.여기에서는, 필요에 따라서 적절한 창 설치 및 중첩 가산 등의 처리를 행하여, 프레임 간에 발생하는 불연속을 회피한다.
이하, 직교 변환 처리부(356)에 있어서의 구체적인 처리에 대해서 설명한다.
직교 변환 처리부(356)는, 버퍼 buf'(k)를 내부에 가지고 있으며, 하기의 수학식(27)에 나타내는 것처럼 버퍼 buf'(k)를 초기화한다.
Figure pct00027
또, 직교 변환 처리부(356)는, 스펙트럼 조정부(355)로부터 입력되는 제2 레이어 복호 스펙트럼 S6'(k)를 이용하여 하기의 수학식(28)에 따라, 제2 레이어 복호 신호 yn”를 구한다.
Figure pct00028
식(28)에 있어서, Z4(k)는, 하기의 수학식(29)에 나타내는 것처럼, 복호 스펙트럼 S6'(k)와 버퍼 buf'(k)를 결합시킨 벡터이다.
Figure pct00029
그 다음에, 직교 변환 처리부(356)는, 하기의 수학식(30)에 따라 버퍼 buf'(k)를 갱신한다.
Figure pct00030
그리고, 직교 변환 처리부(356)는, 복호 신호 yn”를 출력 신호로서 출력한다.
이와 같이, 본 실시형태에 의하면, 부호화 장치는, 저역부의 스펙트럼을 이용해 대역 확장을 행하여 고역부의 스펙트럼을 추정하는 부호화/복호에 있어서, 복호한 저역 스펙트럼을 이용하여 고역부의 스펙트럼을 추정한 후, 추정 스펙트럼의 각 서브밴드에 대해서 샘플군의 선택(추출)을 행하고, 선택한 샘플에 대해서만 대수 영역에서의 게인 조정을 행하는 게인 조정 파라미터를 산출한다.또, 복호 장치(부호화 장치측의 로컬 디코드(local decoder)부를 포함)는, 추정 스펙트럼의 각 서브밴드에 있어서의 최대 진폭치의 샘플의 주변 샘플을 중시하여 선택된 샘플군에만 상기 게인 조정 파라미터를 적용하고, 그 외의 샘플군에 대해서는, 상기 게인 조정 파라미터에 따라 적응적으로 전환되는 선형 보간 계수를 이용하여, 선형 영역에서의 보간 처리를 행한다.이 구성에 의해, 부호화 장치에서는, 대수 영역에서의 게인 조정에 필요한 게인 조정 파라미터의 산출에 필요한 처리 연산량을 큰폭으로 삭감할 수 있다.또, 복호 장치에서는, 인간의 청각에 적합한 에너지 조정 처리에 필요한 처리 연산량을 큰폭으로 삭감할 수 있다.
또한, 본 실시형태에서는, 추출 플래그의 설정에 있어서, 서브밴드내의 최대 진폭값을 가지는 샘플을 탐색한 후, 그 샘플로부터의 거리에 따라 추출 플래그를 설정하는 구성을 예로 들어 설명했다.그러나, 본 발명은 이것에 한하지 않고, 복호 장치가, 예를 들면 최소 진폭치를 가지는 샘플을 탐색하고, 최소 진폭치를 가지는 샘플로부터의 거리에 따라 각 샘플의 추출 플래그를 설정하고, 추출된 샘플(추출 플래그의 값이 1로 설정된 샘플)에 대해서만 대수 게인 등의 진폭 조정 파라미터를 산출하여 적용하는 경우에도 동일하게 적용할 수 있다.이러한 구성은, 예를 들면, 진폭 조정 파라미터가, 추정한 고역스펙트럼을 감쇠시키는 효과를 가지는 경우에 유효하다고 말할 수 있다.진폭이 큰 샘플에 대해서 감쇠시킴으로써, 이음(異音)이 발생하는 경우도 생각되지만, 최소 진폭치를 가지는 샘플 주변에 대해서만 감쇠 처리를 적용함으로써 음질이 향상될 가능성이 있다.또, 상기 구성에 있어서는, 최소 진폭치를 탐색하는 것이 아니라, 최대 진폭치를 탐색하여, 최대 진폭치를 가지는 샘플로부터의 거리가 떨어진 샘플일수록 추출되기 쉽다고 하는 가중치(척도)로, 샘플을 추출하는 구성도 생각되며, 본 발명은 이러한 구성에 대해서도 동일하게 적용할 수 있다.
또, 본 실시형태에서는, 복호 장치내의 추출 플래그의 설정에 있어서, 서브밴드내의 최대 진폭치를 가지는 샘플을 탐색한 후, 그 샘플로부터의 거리에 따라 추출 플래그를 설정하는 구성을 예로 들어 설명했다.그러나, 본 발명은 이것에 한하지 않고, 부호화 장치는, 각 서브밴드에 대해서, 진폭이 큰 쪽으로부터 복수의 샘플을 선택하여, 각각의 샘플로부터의 거리에 따라 추출 플래그를 설정하는 구성에 대해서도 동일하게 적용할 수 있다.상기 구성으로 함으로써, 서브밴드내에 진폭의 크기의 가까운 복수의 샘플이 존재한 경우에, 효율적으로 샘플을 추출할 수 있다.
또, 본 실시형태에서는, 복호 장치에 있어서, 각 서브밴드내의 샘플이, 최대 진폭치를 가지는 샘플에 근접하는지 않는지를 임계값(식(19)에 나타내는 Nearp)에 기초하여 판단함으로써, 샘플을 부분적으로 선택하는 경우에 대해서 설명했다.본 발명에서는, 예를 들면, 복호 장치는, 고역의 서브밴드일수록, 보다 넓은 범위의 샘플을, 최대 진폭치를 가지는 샘플에 근접하는 샘플로서 선택해도 좋다.즉, 본 발명에서는, 복수의 서브밴드 중에서 고역의 서브밴드일수록, 식(19)에 나타내는 Nearp의 값을 보다 크게 해도 좋다.이것에 의해, 대역 분할시에, 예를 들면 바크 스케일(Bark scale)처럼 고역일수록 서브밴드폭이 커지도록 설정된 경우에 대해서도, 서브밴드 간에서 치우침없이 부분적으로 샘플을 선택할 수 있어, 복호 신호의 음질 열화를 막을 수 있다.또한, 식(19)에 나타내는 Nearp의 값으로서는, 예를 들면, 1 프레임의 샘플(MDCT 계수)의 수가 640 정도일 경우에는, 5~21 정도의 값(예를 들면 최저역(最低域) 서브밴드의 Nearp의 값을 5, 최고역(最高域) 서브밴드의 Nearp의 값을 21)으로 하면 좋은 결과가 얻어지는 것을 실험에 의해 확인했다.
또, 본 실시형태에 나타낸 것처럼, 부호화 장치가, 짝수 인덱스의 샘플로부터만 게인 조정 파라미터를 산출하고, 복호 장치가, 서브밴드내의 최대 진폭치를 가지는 샘플로부터의 거리를 고려하여, 추출한 샘플에 게인 조정 파라미터를 적용하는 경우에도, 음질 열화가 없는 것을 실험에 의해 확인했다.즉, 게인 조정 파라미터를 산출할 때의 대상이 되는 샘플 집합(샘플군)과, 게인 조정 파라미터를 적용할 때의 대상이 되는 샘플 집합(샘플군)이 반드시 일치하고 있지않아도 문제 없다고 말할 수 있다.이것은, 예를 들면, 본 실시형태에 나타낸 것처럼, 부호화 장치 및 복호 장치는, 서브밴드 전체에 걸쳐서 균등하게 샘플을 추출하면, 전부의 샘플을 추출하지 않아도, 효율좋게 게인 조정 파라미터를 산출할 수 있음을 나타내고 있다.단, 본 발명은 이것에 한하지 않고, 부호화 장치에 있어서도, 복호 장치와 마찬가지로, 각 서브밴드내의 최대 진폭치로부터의 거리에 따른 샘플군 추출 방법에 의해, 대수 게인을 산출하는 대상이 되는 샘플군을 선택하는 구성에 대해서도 동일하게 적용된다.
또, 본 실시형태에서는, 입력 신호의 저역 성분의 부호화/복호 처리와, 고역성분의 부호화/복호 처리를 각각 별도로 행하는 구성의 경우, 즉, 2단계의 계층 구조로 부호화/복호하는 경우에 대해서 설명했다. 그러나, 본 발명은 이것에 한하지 않고, 3단계 이상의 계층 구조로 부호화/복호하는 경우에 대해서도 동일하게 적용할 수 있다.또한,3단계 이상의 계층 부호화부를 고려했을 경우, 제2 레이어 부호화부의 로컬 디코드 신호를 생성하기 위한 제 2 레이어 복호부에 있어서, 게인 조정 파라미터(대수 게인)를 적용하는 샘플 집합(샘플군)은, 본 실시형태의 부호화 장치내에서 산출한 최대 진폭치를 가지는 샘플로부터의 거리를 고려하지 않는 샘플 집합이어도 좋고, 또 본 실시형태의 복호 장치내에서 산출한 최대 진폭치를 가지는 샘플로부터의 거리를 고려하는 샘플 집합이어도 좋다.
또, 본 실시형태에서는, 부호화 장치 및 복호 장치에서의 추출 플래그의 설정에 있어서, 샘플 인덱스가 짝수인 경우에는, 추출 플래그의 값을 강제적으로 1로 설정하고 있다.그러나, 본 발명은 이것에 한하지 않고, 예를 들면, 인덱스 3에 대한 잉여가 0일 경우에 추출 플래그의 값을 1로 설정하는 경우 등에 대해서도 동일하게 적용할 수 있다.즉, 본 실시형태에서는, 최대 진폭치를 가지는 샘플로부터의 거리에 따른 샘플 이외에서 추출되는 샘플에 대해서는, 특히 제약은 없고, 여러가지 선택 방법에 대해서도 동일하게 적용된다.
또, 본 실시형태에서는, 게인 부호화부(265)(도 3)에 있어서 입력 스펙트럼 S2(k)의 고역부를 분할해서 얻어지는 서브밴드의 수J가, 탐색부(263)에 있어서 입력 스펙트럼 S2(k)의 고역부를 분할해서 얻어지는 서브밴드의 수P와 다른 경우를 예로 들어 설명했다.그러나, 본 발명은 이것으로 한정되지 않고, 게인 부호화부(265)에 있어서 입력 스펙트럼 S2(k)의 고역부를 분할해서 얻어지는 서브밴드의 수를 P개로 해도 좋다.
또, 본 실시형태에서는, 제1 레이어 복호부로부터 얻어지는 제1 레이어 복호 스펙트럼의 저역 성분을 이용해서, 입력 스펙트럼의 고역부를 추정하는 구성에 대해서 설명했다.그러나, 본 발명은 이것에 한하지 않고, 제1 레이어 복호 스펙트럼 대신에 입력 스펙트럼의 저역 성분을 이용해서, 입력 스펙트럼의 고역부를 추정하는 구성에 대해서도 동일하게 적용할 수 있다.또한, 이 구성에 있어서는, 부호화 장치는 입력 스펙트럼의 저역 성분으로부터 입력 스펙트럼의 고역성분을 생성하기 위한 부호화 정보(제2 레이어 부호화 정보)를 산출하고, 복호 장치는 이 부호화 정보를 제1 레이어 복호 스펙트럼에 적용하여, 복호 스펙트럼의 고역성분을 생성한다.
또, 본 실시형태에서는, 특허 문헌 1에 있어서의 처리에 기초하여, 대수 영역에서의 에너지비를 조정하는 파라미터를 산출·적용하는 구성에 있어서 연산량의 삭감 및, 음질을 향상시키는 처리를 예로 들어 설명했다.
그러나, 본 발명은 이것에 한하지 않고, 대수 변환 이외의 비선형 변환 영역에서 에너지비 등을 조정하는 구성에 대해서도 동일하게 적용할 수 있다.또, 비선형 변환 영역 뿐만이 아니라, 선형 변환 영역에 대해서도 동일하게 적용할 수 있다.
또, 본 실시형태에서는, 특허 문헌 1에 있어서의 처리에 기초하여, 대역 확장 처리에 있어서, 대수 영역에서의 에너지비를 조정하는 파라미터를 산출·적용하는 구성에 있어서 연산량의 삭감, 및 음질을 향상시키는 처리를 예로 들어 설명했다.그러나, 본 발명은 이것에 한하지 않고, 대역 확장 처리 이외의 처리에 대해서도 동일하게 적용할 수 있다.
또, 본 실시형태에서는, 보간 처리부에 있어서, 입력 신호의 종류 (예를 들면 음성 신호 및 악음 신호 등), 스펙트럼 특성 등에 상관없이, 항상 동일한 방식으로 선형 보간 처리를 행하는 경우에 대해 설명했다.그러나, 본 발명은 이것에 한하지 않고, 입력 신호의 종류, 스펙트럼 특성에 따라, 보간 처리부에 있어서의 처리를 적응적으로 전환하는 경우에 대해서도 동일하게 적용할 수 있다.예를 들면, 입력 신호의 피크성이 강한 경우, 즉 입력 신호의 스펙트럼의 잡음성이 낮은 경우에는, 보간 처리부에 있어서의 선형 보간 파라미터를 고정시키고(예를 들면 0.95로 고정한다), 입력 신호의 피크성이 약한 경우, 즉 입력 신호의 스펙트럼의 잡음성이 높은 경우에는, 보간 처리부에 있어서의 선형 보간 파라미터를, 상기 실시형태에서 설명한 것처럼 2종류의 어느것인가로 전환해도 좋다.이러한 구성에 의해, 입력 신호의 피크성이 강한 경우에는, 보간 처리부에 있어서의 에너지 조정 처리의 효과를 약하게 할 (보간 처리를 하는 전후에서 샘플의 진폭이 크게 변하지 않게 함) 수 있기 때문에, 본 실시형태에서 설명한 방식에 비해서, 이음을 억제할 수 있을 가능성이 있다. 이것은, 급준한 스펙트럼에 대한 청각 마스킹(masking)값은 낮아진다, 라고 하는 청감 특성에 기초한 처리로서, 스펙트럼의 피크 부분에서는 선형 보간 처리의 대상이 되는 샘플의 진폭의 증폭을 억제하는 것을 의미하고 있다.단, 상기의 구성은, 본 실시형태에서 설명한 방식에 비해서, 입력 신호의 특성(예를 들면 피크성의 강약 등)을 판정하는 처리부를 새롭게 추가할 필요가 있기때문에, 처리 연산량은 증가하게 된다.또, 상기와 같은 전환 방법 외에, 본 실시형태에서 설명한 선형 보간 파라미터와 임계값의 조합(TH, ALPHA3_LOW, ALPHA3_HIGH)과, 상기 조합과는 다른 조합(예를 들면 TH2, ALPHA3_LOW2, ALPHA3_HIGH2)을, 입력 신호의 종류(예를 들면 음성 신호 및 악음 신호 등), 스펙트럼 특성에 따라 적응적으로 전환해도 좋다.
또, 본 실시형태에서는, 복호 장치에 있어서의 복호 처리 방법에 대해서 설명했다.그러나, 본 발명은, 복호 장치에 한정되지 않고, 상기 복호 처리 방법을 포함한 부호화 장치에도 동일하게 적용된다.예를 들면, 도 13에 나타내는 것처럼, 도 2에 나타내는 부호화 장치(101)의 구성에 더해, 제2부호화 정보를 이용해 제2 레이어 복호 스펙트럼을 생성하는 제2 레이어 복호부(401)를 더 구비하고, 제2 레이어 복호 스펙트럼과, 입력 신호의 스펙트럼(입력 스펙트럼)과의 잔차성분을 부호화하는 제3 레이어 부호화부(402)를 더 구비하는 부호화 장치(400)에 대해서도, 본 발명은 동일하게 적용할 수 있다.여기서, 제2 레이어 복호부(401)는, 도 9에 나타내는 제2 레이어 복호부(135)에 상당하는 복호 처리부이다.단, 제2 레이어 복호부(135)란, 내부에 직교 변환 처리부(356)를 구비하지않고, 시간 영역의 신호가 아니라, 주파수 영역의 신호(스펙트럼)를 출력하는 점이 다르다.또, 출력하는 성분의 명칭도 다르다.그 외의 점에 대해서는, 제2 레이어 복호부(135)와 동일한 처리를 한다. 또, 본 발명은 제3 레이어 부호화부(402)의 부호화 방법에는 한정되지 않으며, 제3 레이어 부호화부(402)에서는, 잔차성분을 벡터 양자화하는 것 외에, 여러가지 양자화 방법을 취할 수 있다.또한, 도 13에 나타내는 부호화 장치(400)에서는 부호화부의 수가 3개이지만, 부호화부의 수가 4개 이상인 경우에도, 본 발명은 동일하게 적용할 수 있다.
(실시형태 2)
실시형태 1에서는, 추가 파라미터(실시형태 1에서는 제2 레이어 부호화 정보)를 이용해서, 저역 스펙트럼으로부터 고역 스펙트럼을 생성하는 대역 확장 부호화 방식을 이용하는 부호화 장치 및 대응하는 복호 장치에 대해서 설명했다.
여기서, 동일한 「대역 확장 부호화 방식」을 채용하고 있는 방식으로서는, ITU-T에서 규격화되어 있는 G.722-SWB(G.722 Annex B)를 예로 들 수 있다.G.722-SWB에서는, 입력 신호의 특성(예를 들면 입력 스펙트럼)에 따라 4개 모드의 부호화/복호 방식에 의해 해당 입력 신호가 부호화된다.여기서 4개의 모드란, TRANSIENT, NORMAL, HARMONIC, 및 NOISE이며, 입력 스펙트럼으로부터 적절한 모드가 결정된다.
본 실시형태에서는, G.722-SWB와 같은, 입력 신호의 특성에 따라 부호화/복호 방식이 전환되는 멀티 모드 부호화/복호 방식에 있어서, 실시형태 1에서 설명한 대역 확장 부호화/복호 방식(실시형태 1에서는, 제2 레이어 부호화부/제2 레이어 복호부가 대응함)을 적용하는 구성에 대해서 설명한다.또, 본 실시형태에서는, 이러한 구성에 있어서, 부호화/복호 모드가 전환될 때에 발생할 수 있는 음질 열화(이음)를 억제하는 방법에 대해서 설명한다.
또한, G.722-SWB는 4개 모드의 부호화/복호 방식을 가지는 멀티 모드 부호화/복호 방식이지만, 이하에서는 설명의 간략화를 위해, 2개 모드의 부호화/복호 방식을 가지는 멀티 모드 부호화/복호 방식을 예로 들어 설명한다.
본 실시형태에 따른 부호화 장치 및 복호 장치를 가지는 통신 시스템의 구성은, 실시형태 1(도 1)에 있어서의 구성과 동일하다. 단, 부호화 장치 및 복호 장치의 내부 구성이 다르기때문에, 부호만 부호화 장치(111) 및 복호 장치(113)로 대체하는 것으로 한다. 부호화 장치(111) 및 복호 장치(113)의 처리는, 각각 부호화 장치(101) 및 복호 장치(103)와 동일하기 때문에, 여기에서는 설명을 생략한다.
도 14는, 부호화 장치(111)의 내부의 주요한 구성을 나타내는 블록도이다. 도 14에 나타내는 부호화 장치(111)에 있어서, 모드 판정부(501) 및 제2 레이어 부호화부(502)이외의 구성요소에 대해서는, 실시형태 1의 부호화 장치(101)(도 2) 내의 각 구성요소와 동일하기 때문에, 동일한 부호를 붙이고, 여기에서는 설명을 생략한다.
모드 판정부(501)에는, 직교 변환 처리부(205)로부터 입력 스펙트럼이 입력된다. 모드 판정부(501)는, 입력된 입력 스펙트럼의 스펙트럼 특성(즉 입력 신호의 특성)을 분석하고, 분석 결과에 기초하여, 모드 정보를 결정한다. 모드 판정부(501)는, 결정한 모드 정보를 제2 레이어 부호화부(502)에 출력한다. 여기서, 모드 정보는, 후술하는 2종류의 부호화 방식 중에서, 어느 부호화 방식을 이용해서 부호화를 행하는지를 나타내는 정보이다. 구체적으로는, 모드 판정부(501)는, 모드 정보로서 「모드 1」 또는 「모드 2」의 어느것인가를 결정한다. 예를 들면, 모드 판정부(501)는, 입력 스펙트럼이 TRANSIENT인지, NON-TRANSIENT인지를 분석하고, 분석 결과에 기초하여, 모드 정보를 판정한다고 하는 방법을 일례로서 들 수 있다. 모드 정보의 판정 방법의 상세한 것(예를 들면, G.722-SWB 규격서 참조)에 대해서는, 본 발명과는 직접 관계없기 때문에, 여기에서는 설명을 생략한다.
제2 레이어 부호화부(502)에는, 직교 변환 처리부(205)로부터 입력 스펙트럼 및 제1 레이어 복호 스펙트럼이 입력된다. 또, 제2 레이어 부호화부(502)에는, 모드 판정부(501)로부터 모드 정보가 입력된다. 제2 레이어 부호화부(502)는, 제1 레이어 복호 스펙트럼을 이용하여, 입력되는 모드 정보에 기초하여, 2 종류의 부호화 방식(모드 1 또는 모드 2)의 어느것인가에 의해 입력 스펙트럼의 부호화를 행하고, 제2 레이어 부호화 정보를 생성한다. 제2 레이어 부호화부(502)는, 생성한 제2 레이어 부호화 정보를, 부호화 정보 통합부(207)를 경유하여 전송로(102)(도 1)에 출력한다. 제2 레이어 부호화부(502)의 처리의 상세한 것에 대해서는 후술한다.
다음에, 도 14에 나타낸 제2 레이어 부호화부(502)의 내부의 주요한 구성에 대해서 도 15를 이용해서 설명한다.
제2 레이어 부호화부(502)는, 스위치(521), 스위치(522), 제1부호화부(523) 및 제2부호화부(524)를 구비한다.
스위치(521) 및 스위치(522)는, 모드 판정부(501)로부터 입력되는 모드 정보에 따라 제어되며, 입력 스펙트럼 및 제1 레이어 복호 스펙트럼을, 제1부호화부(523) 및 제2부호화부(524)의 어느것인가에 출력한다. 도 15에 있어서, 점선으로 표시되어 있는 화살표는, 데이터 흐름이 아니라, 제어한다는 의미이다. 예를 들면, 스위치(521) 및 스위치(522)는, 모드 정보가 「모드 1」인 경우에는 입력 스펙트럼 및 제1 레이어 복호 스펙트럼을 제1부호화부(523)에 출력하고, 모드 정보가 「모드 2」인 경우에는 입력 스펙트럼 및 제1 레이어 복호 스펙트럼을 제2부호화부(524)에 출력한다. 이와 같이, 스위치(521) 및 스위치(522)는, 부호화 방법의 모드에 따라, 입력 스펙트럼 및 제1 레이어 복호 스펙트럼의 출력처의 전환 제어를 행한다.
제1부호화부(523)는, 모드 정보가 「모드 1」인 경우, 입력되는, 모드 정보, 입력 스펙트럼 및 제1 레이어 복호 스펙트럼을 이용하여, 제2 레이어 부호화 정보를 생성한다. 제1부호화부(523)는, 생성한 제2 레이어 부호화 정보를 부호화 정보 통합부(207)에 출력한다. 본 실시형태에서는, 제1부호화부(523)는, 실시형태 1에서 설명한 제2 레이어 부호화부(206)와 동일한 처리를 행한다. 제1부호화부(523)의 처리의 상세한 것에 대해서는 후술한다.
제2부호화부(524)는, 모드 정보가 「모드 2」인 경우, 입력되는, 모드 정보, 입력 스펙트럼 및 제1 레이어 복호 스펙트럼을 이용해서, 제2 레이어 부호화 정보를 생성한다. 제2부호화부(524)는, 생성한 제2 레이어 부호화 정보를 부호화 정보 통합부(207)에 출력한다. 제2부호화부(524)는, 제1부호화부(523)에서의 부호화 방식과는 다른 부호화 방식에 의해 처리를 행한다. 본 실시형태에서는, 제2부호화부(524)에 있어서 이용하는 부호화 방식을 특히 한정할 필요는 없기 때문에, 설명을 생략하지만, 예를 들면 G.722-SWB에 있어서의 「TRANSIENT」모드의 부호화 방식을 취하는 구성을 일례로서 들 수 있다.
이와 같이, 제2 레이어 부호화부(502)는, 복수의 부호화 방법을 전환하는 복수의 부호화부(제1부호화부(523) 및 제2부호화부(524))를 가진다.
다음에, 도 15에 나타낸 제1부호화부(523)의 내부의 주요한 구성에 대해서 도 16을 이용해서 설명한다.
제1부호화부(523)는, 대역 분할부(260), 필터 상태 설정부(261), 필터링부(262), 탐색부(263), 피치 계수 설정부(264), 게인 부호화부(531) 및 다중화부(266)를 구비한다. 여기서, 게인 부호화부(531)이외의 각 구성요소는, 제2 레이어 부호화부(206)(도 3)내의 각 구성요소와 동일하기 때문에, 동일한 부호를 붙이고, 설명을 생략한다.
게인 부호화부(531)에는, 모드 판정부(501)로부터 모드 정보가 입력된다. 게인 부호화부(531)는, 입력 스펙트럼 S2(k) 및, 탐색부(263)로부터 입력되는 각 서브밴드의 추정 스펙트럼 S2p'(k)(p=0, 1,…, P-1), 이상 게인 α1p 에 기초하여, 비선형 영역에서의 에너지비 조정을 행하는 파라미터인 대수 게인을, 각 서브밴드에 대해서 산출한다.
그 다음에, 게인 부호화부(531)는, 모드 정보를 이용해서, 이상 게인 및 대수 게인을 양자화하고, 양자화한 이상 게인 및 대수 게인을 다중화부(266)에 출력한다. 구체적으로는, 게인 부호화부(531)는, 내부에 모드 정보를 기억할 수 있는 메모리를 보지(保持)한다. 게인 부호화부(531)의 내부 구성은, 상기 메모리를 보지하는 것 외에는, 게인 부호화부(265)(도 3)와 동일하다.
게인 부호화부(531)는, 메모리에 기억되어 있는 전(前)프레임 처리시의 모드 정보와 현프레임에 있어서 입력된 모드 정보가 달랐을 경우, 즉, 현프레임과 전프레임에서 부호화 방법이 전환되는 경우(여기에서는 전프레임에서는 제2부호화부(524)가 동작하고, 현프레임에서는 제1부호화부(523)가 동작하는 경우), 다음 수학식(31)에 따라, 양자화 대상인 이상 게인 α1p에 대해서 감쇠 처리를 실시한다. 여기서, γ는, 0<γ<1을 만족시키는 감쇠 계수이며, 미리 설정된 값을 가진다. 그 다음에, 게인 부호화부(531)는, γ가 곱해진 이상 게인 α1′p를 양자화한다.
Figure pct00031
한편, 게인 부호화부(531)는, 메모리에 기억하고 있는 전프레임 처리시의 모드 정보와 현프레임에 있어서 입력된 모드 정보가 동일할 경우, 즉, 현프레임과 전프레임에서 부호화 방법이 바뀌지않은 경우(여기에서는 전프레임 및 현프레임의 양쪽에서 제1부호화부(523)가 동작하는 경우), 양자화 대상인 이상 게인에 대해서 감쇠 처리를 실시하지 않고, 게인 부호화부(265)(도 3)와 동일한 처리를 행하여, 게인 정보를 양자화한다. 그 다음에, 게인 부호화부(531)는, 산출한 이상 게인 부호화 정보와 대수 게인 부호화 정보를 다중화부(266)에 출력한다.
이와 같이, 제1부호화부(523)는, 전프레임과 현프레임에서 부호화 방법이 전환되는 경우, 현프레임에서의 부호화 방법에서 이용하는 이상 게인을 조정한다. 구체적으로는, 제1부호화부(523)는, 전프레임과 현프레임에서 부호화 방법이 전환될 때, 현프레임에서 이용하는 이상 게인을 감쇠시킨다.
이상이, 제1부호화부(523)의 처리의 설명이다.
이상이, 본 실시형태에 따른 부호화 장치(111)의 처리의 설명이다.
다음에, 본 실시형태에 따른 복호 장치(113)의 처리에 대해서 설명한다.
도 17은, 복호 장치(113)의 내부의 주요한 구성을 나타내는 블록도이다.
도 17에 나타내는 복호 장치(113)에 있어서, 부호화 정보 분리부(601) 및 제2 레이어 복호부(602)이외의 구성요소에 대해서는, 실시형태 1에서 설명한 복호 장치(103)(도 8) 내의 구성요소와 동일하기 때문에, 동일한 부호를 붙이고, 설명을 생략한다.
부호화 정보 분리부(601)는, 입력된 부호화 정보(즉, 부호화 장치(111)(도 14)로부터 수신한 부호화 정보)중에서 제1 레이어 부호화 정보와, 제2 레이어 부호화 정보와, 모드 정보를 분리하고, 제1 레이어 부호화 정보를 제1 레이어 복호부(132)에 출력하고, 제2 레이어 부호화 정보 및 모드 정보를 제2 레이어 복호부(602)에 출력한다.
제2 레이어 복호부(602)는, 직교 변환 처리부(134)로부터 입력되는 제1 레이어 복호 스펙트럼 S1(k), 및, 부호화 정보 분리부(601)로부터 입력되는 제2 레이어 부호화 정보, 모드 정보를 이용하여, 제1 레이어 복호 스펙트럼 S1(k)로부터, 음성 신호의 고역부분을 추정하여, 스펙트럼 성분의 진폭을 조정함으로써, 고역성분을 포함한 제2 레이어 복호 신호를 생성해서 출력 신호로서 출력한다.
도 18은, 도 17에 나타낸 제2 레이어 복호부(602)의 내부의 주요한 구성을 나타내는 블록도이다.
제2 레이어 복호부(602)는, 스위치(621), 스위치(622), 제1 복호부(623) 및 제2 복호부(624)를 구비한다.
스위치(621) 및 스위치(622)는, 부호화 분리부(601)로부터 입력되는 모드 정보에 따라 제어되며, 제1 레이어 복호 스펙트럼 및 제2 레이어 부호화 정보를, 제1 복호부(623), 제2 복호부(624)의 어느것인가에 출력한다. 예를 들면, 스위치(621) 및 스위치(622)는, 모드 정보가 「모드 1」인 경우에는 제1 레이어 복호 스펙트럼 및 제2 레이어 부호화 정보를 제1 복호부(623)에 출력하고, 모드 정보가 「모드 2」인 경우에는 제1 레이어 복호 스펙트럼 및 제2 레이어 부호화 정보를 제2 복호부(624)에 출력한다. 이와 같이, 스위치(621) 및 스위치(622)는, 복호 방법의 모드에 따라, 제1 레이어 복호 스펙트럼 및 제2 레이어 부호화 정보의 출력처의 전환 제어를 행한다.
제1 복호부(623)는, 모드 정보가 「모드 1」인 경우, 입력되는, 모드 정보, 제1 레이어 복호 스펙트럼 및 제2 레이어 부호화 정보를 이용해, 출력 신호를 생성한다. 제1 복호부(623)는, 생성한 출력 신호를 출력한다. 본 실시형태에서는, 제1 복호부(623)는, 실시형태 1에서 설명한 제2 레이어 복호부(135)와 동일한 처리를 행하기때문에, 설명은 생략한다. 단, 제1 복호부(623)에 있어서, 복호하는 이상 게인 부호화 정보가, α1p가 아니라, α1′p인 점이 실시형태 1의 제2 레이어 복호부(135)와는 다른 것으로 한다.
제2 복호부(624)는, 모드 정보가 「모드 2」인 경우, 입력되는, 모드 정보, 제1 레이어 복호 스펙트럼 및 제2 레이어 부호화 정보를 이용해, 출력 신호를 생성한다. 제2 복호부(624)는, 생성한 출력 신호를 출력한다. 제2 복호부(624)는, 제1 복호부(623)에서의 복호 방식과는 다른 복호 방식(제2부호화부(524)에서의 부호화 방식에 대응하는 복호 방식)에 의해 처리를 행한다. 본 실시형태에서는, 제2 복호부(624)에 있어서 이용하는 복호 방식을 특히 한정할 필요는 없기 때문에, 설명을 생략하지만, 예를 들면 G.722-SWB에 있어서의 「TRANSIENT」모드의 복호 방식을 취하는 구성을 일례로서 들 수 있다.
이와 같이, 본 실시형태에 의하면, 부호화 장치는, 모드 정보를 보지하여, 전프레임의 모드 정보와 현프레임의 모드 정보가 다른 경우에는, 고역부의 스펙트럼을 추정하는 부호화부에 있어서, 양자화하는 게인을 감쇠시킨다. 이것에 의해, 부호화 방식(부호화 모드)이 전환되었을 때에, 이음의 원인이 될 수 있는 게인의 급격한 변화(특히, 청각적인 영향이 큰 게인의 급격한 증가)를 억제할 수 있기때문에, 상기 음질 열화의 억제 처리를 실현할 수 있다. 즉, 부호화 장치에서는, 저역부의 스펙트럼을 이용해 대역 확장을 행하여 고역부의 스펙트럼을 추정하는 부호화/복호 방식이 복수 종류 존재하는 경우, 즉 멀티 모드 부호화/복호 방식인 경우에서도, 모드가 전환되었을 때에 발생 할 수 있는 음질 열화(이음)를 억제함으로써, 처리량의 대폭적인 삭감을 실현하면서, 그리고 또 고품질의 복호 신호를 제공할 수 있다.
또한, 본 실시형태에서는, 부호화 장치의 게인 부호화부에 있어서, 각 프레임 처리시의 모드 정보를 보지하여, 모드 정보가 전환되었을 때에, 양자화하는 이상 게인을 감쇠시키는 처리를 예로 들어 설명했다. 그러나, 본 발명은 이것에 한하지 않고, 모드 정보 이외의 정보를 이용해 양자화하는 게인을 감쇠시키는 구성에 대해서도 본 실시형태를 동일하게 적용할 수 있다. 예를 들면, 부호화 장치가 각 프레임 처리시의 모드 정보에 더해, 각 프레임의 프레임 에너지를 기억하고, 이것들을 이용해서, 양자화하는 게인을 감쇠시키는 구성을 예로 들 수 있다. 이 구성에서는, 전프레임의 모드 정보와 현프레임의 모드 정보가 다른 경우, 즉 모드 정보가 전환되는 경우, 부호화 장치는, 우선, 전프레임의 프레임 에너지와 현프레임의 프레임 에너지의 평균치를 산출한다. 그 다음에, 부호화 장치는, 산출된 프레임 에너지의 평균치와 현프레임의 프레임 에너지와의 비(比)에 따라, 양자화하는 게인을 감쇠 또는 증폭시킨다. 예를 들면, 전프레임의 프레임 에너지가 10000이고, 현프레임의 프레임 에너지가 5000이었을 경우, 부호화 장치는, 프레임 에너지의 평균치 7500과 현프레임 에너지와의 비(比)인 1.5(=7500/5000)를 양자화하는 게인에 곱한다. 이 경우, 프레임 에너지비(1.5)는 1이상이기때문에, 감쇠 처리가 아니라 증폭 처리가 된다. 또한, 여기에서는, 식(31)에 있어서의 감쇠 계수 γ(0<γ<1)를, 1이상의 값도 허용하는 「감쇠·증폭 계수」로 대체함으로써, 전술과 동일한 처리에 의해, 증폭 처리도 가능하게 된다. 통상, 부호화 모드가 전환되었을 때에는, 청각적으로는 게인의 급격한 증가에 의한 이음의 영향이 크다. 이 때문에, 본 실시형태에서는, 게인의 급격한 증가에 대해서, 비교적 간단한 처리(저연산량의 처리)로 음질 열화를 억제하는 구성을 설명했다. 그러나, 상기의 프레임 에너지를 이용함으로써, 전술의 구성에 비해서, 처리 연산량은 증가하지만, 부호화 모드가 전환되었을 때에 프레임 에너지(또는 게인)가 급격하게 증가하는 경우뿐 만이 아니라, 급격하게 감소할 때에 대해서도, 프레임 에너지(혹은 게인)의 변화를 매끄럽게 할 수 있다. 이것에 의해, 음질 열화(이음)를 더욱 억제할 수 있다.
또, 본 실시형태에서는, 모드 정보가 전환되는 경우, 감쇠시키는 게인 정보로서 이상 게인을 대상으로 한 경우를 예로 들어 설명했다. 그러나, 본 발명은 이것에 한하지 않고, 이상 게인 이외의 다른 게인 정보를 감쇠(또는 증폭)하는 구성에 대해서도 본 실시형태를 동일하게 적용할 수 있다. 예를 들면, 본 실시형태에서 설명한 게인 부호화부가 대수 게인 정보에 대해서 감쇠 또는 증폭시키는 구성을 예로서 들고 있다. 또, 게인 부호화부는, 양자화 타깃이 되는 입력 스펙트럼 그 자체를 감쇠 또는 증폭시켜도 좋다. 또, 상술한 것과 같은 전프레임의 프레임 에너지와 현프레임의 프레임 에너지와의 비(比)(프레임 에너지비)를 이용하는 구성에 대해서도, 게인 부호화부는, 이상 게인, 대수 게인 또는 입력 스펙트럼 등의 어느것에 대해서 감쇠(또는 증폭) 처리를 적용해도 좋다.
또, 본 실시형태에서는, 모드 정보가 전환되는 경우, 부호화 장치내에서 게인 정보를 감쇠 또는 증폭시키는 구성을 예로 들어 설명했다. 그러나, 본 발명은 이것에 한하지 않고, 복호 장치내에서 게인 정보를 감쇠 또는 증폭시키는 구성에 대해서도 본 실시형태를 동일하게 적용할 수 있다. 즉, 복호 장치(예를 들면 제2 레이어 복호부)는, 모드 정보에 따라 복수의 복호 방법을 전환하는 복수의 복호부를 더 가지고, 전프레임과 현프레임에서 복호 방법이 전환되는 경우, 현프레임의 복호시에 이용하는 게인 정보를 조정해도 좋다. 예를 들면, 복호 장치는, 모드 정보의 전환을 검출했을 때, 복호한 게인 정보(이상 게인 또는 대수 게인)에 대해서 감쇠, 증폭 처리를 행해도 좋다. 또, 복호 장치는, 복호한 게인 정보(이상 게인 및 대수 게인)를 이용하여 생성한 복호 스펙트럼에 대해서, 감쇠, 증폭 처리를 행해도 좋다.
또, 본 실시형태에서는, 모드 정보가 전환되는 경우, 미리 정해진 감쇠 계수를 이용하여, 게인 정보가 감쇠되는 구성을 예로 들어 설명했다. 그러나, 본 발명은 이것에 한하지 않고, 프레임 처리마다 적응적으로 게인 정보를 감쇠시키는 감쇠 계수를 산출하는 구성에 대해서도 본 실시형태를 동일하게 적용할 수 있다. 예를 들면, 상술한 것처럼, 부호화 장치(또는 복호 장치)는, 전프레임의 프레임 에너지와 현프레임의 프레임 에너지와의 평균치를 산출하고, 현프레임의 프레임 에너지가 산출된 평균치에 가까워지는 계수를 이용해서 게인 정보 또는 스펙트럼을 감쇠, 증폭시켜도 좋다. 즉, 부호화 장치(또는 복호 장치)는, 전프레임의 프레임 에너지를 이용해서, 현프레임에서 이용하는 게인 정보 또는 스펙트럼을 감쇠, 증폭시켜도 좋다.
또는, 부호화 장치(또는 복호 장치)는, 모드 정보가 전환되는 경우, 즉, 전프레임과 현프레임에서 부호화 방법(복호 방법)이 전환되는 경우, 전프레임에서 이용하는 게인 정보를 이용해서, 현프레임에서 이용하는 게인 정보를 조정해도 좋다. 예를 들면, 부호화 장치(또는 복호 장치)는, 전프레임과 현프레임에서 부호화 방법(복호 방법)이 전환되는 경우, 현프레임에서 이용하는 게인 정보를 전프레임에서 이용하는 게인 정보에 가까워지도록, 현프레임에서 이용하는 게인 정보를 조정해도 좋다. 이러한 구성에 의해, 부호화 방법(복호 방법)이 전환되었을 때에도, 부호화 장치(복호 장치)는, 현프레임에 있어서, 전프레임을 고려한 게인 정보를 이용할 수 있어, 부호화 방법(복호 방법)이 전환될 때에 발생할 수 있는 음질 열화(이음)를 더욱 억제할 수 있다.
또, 본 실시형태에서는, 부호화 장치의 제2 레이어 부호화부 내에 2종류의 부호화 방식을 구비하는 구성을 예로 들어 설명했다. 그러나, 본 발명은 이것에 한하지 않고, 3종류 이상의 부호화 방식을 구비하는 구성, 즉 3종류 이상의 멀티 모드 부호화/복호 방식을 취하는 구성에 대해서도 본 실시형태를 동일하게 적용할 수 있다.
또, 본 실시형태에서는, 부호화 장치의 제2 레이어 부호화부 내의 제1부호화부에 있어서만, 게인 정보를 감쇠(또는 증폭)시키는 구성을 예로 들어 설명했다. 그러나, 본 발명은 이것에 한하지 않고, 제1부호화부 이외의 부호화부(예를 들면 제2부호화부)에 대해서도 동일하게 해서 감쇠(또는 증폭) 처리를 행하는 구성에 대해서도 본 실시형태를 동일하게 적용할 수 있다. 즉, 멀티 모드 부호화/복호 방식에 있어서, 본 실시형태와 동일한 처리를, 일부 모드의 부호화/복호 방식에 적용해도 좋고, 모든 모드의 부호화/복호 방식에 적용해도 좋다.
또, 상기 실시형태에 있어서의 복호 장치는, 상기 각 실시형태에 있어서의 부호화 장치로부터 전송된 부호화 정보를 이용해 처리를 행한다고 했지만, 본 발명은 이것으로 한정되지 않고, 필요한 파라미터 또는 데이터를 포함한 부호화 정보이면, 반드시 상기 각 실시형태에 있어서의 부호화 장치로부터의 부호화 정보가 아니라도 처리는 가능하다.
또, 신호 처리 프로그램을, 메모리, 디스크, 테이프, CD, DVD등의 기계 판독 가능한 기록 매체에 기록, 기입을 하여, 동작을 행하는 경우에 대해서도, 본 발명은 적용할 수 있고, 본 실시형태와 동일한 작용 및 효과를 얻을 수 있다.
또, 상기 각 실시형태에서는, 본 발명을 하드웨어로 구성하는 경우를 예로 들어 설명했지만, 본 발명은 하드웨어와의 제휴에 있어서 소프트웨어에서 실현하는 것도 가능하다.
또, 상기 각 실시형태의 설명에 이용한 각 기능 블록은, 전형적으로는 집적회로인 LSI로서 실현된다. 이것들은 개별적으로 1 칩화되어도 좋고, 일부 또는 모두를 포함하도록 1칩화되어도 좋다. 여기에서는, LSI라고 했지만, 집적도의 차이에 의해, IC, 시스템 LSI, 슈퍼 LSI, 울트라 LSI라고 호칭되는 일도 있다.
또, 집적회로화의 수법은 LSI에 한하는 것은 아니고, 전용 회로 또는 범용 프로세서로 실현되어도 좋다. LSI 제조 후에, 프로그램하는 것이 가능한 FPGA(Field Programmable Gate Array)나, LSI 내부의 회로 셀의 접속이나 설정을 재구성 가능한 리컨피규러블/프로세서를 이용해도 좋다.
또, 반도체 기술의 진보 또는 파생하는 별개의 기술에 의해 LSI에 대체되는 집적회로화의 기술이 등장하면, 당연히, 그 기술을 이용해서 기능 블록의 집적화를 행해도 좋다. 바이오 기술의 적용 등이 가능성으로서 있을 수 있다.
2010년 6월 21일에 출원한 특허출원 2010-141021 및 2011년 3월 4일에 출원한 특허출원 2011-047597의 일본 출원에 포함되는 명세서, 도면 및 요약서의 개시 내용은, 모두 본원에 원용된다.
[산업상의 이용 가능성]
본 발명에 따른 복호 장치, 부호화 장치 및 이러한 방법은, 저역부의 스펙트럼을 이용해 대역 확장을 행하여 고역부의 스펙트럼을 추정할 때에, 복호 신호의 품질을 향상할 수 있으며, 예를 들면, 패킷 통신 시스템, 이동 통신 시스템 등에 적용할 수 있다.
101, 111, 400 부호화 장치
102 전송로
103, 113 복호 장치
201 다운 샘플링 처리부
202 제1 레이어 부호화부
132, 203 제1 레이어 복호부
133, 204 업 샘플링 처리부
134, 205, 356 직교 변환 처리부
206, 226, 502 제2 레이어 부호화부
207 부호화 정보 통합부
260 대역 분할부
261, 352 필터 상태 설정부
262, 353 필터링부
263 탐색부
264 피치 계수 설정부
265, 531 게인 부호화부
266 다중화부
271 이상 게인 부호화부
272 대수 게인 부호화부
281, 371 최대 진폭치 탐색부
282, 372 샘플군 추출부
283 대수 게인 산출부
131, 601 부호화 정보 분리부
135, 401, 602 제2 레이어 복호부
351 분리부
354 게인 복호부
355 스펙트럼 조정부
361 이상 게인 복호부
362 대수 게인 복호부
373 대수 게인 적용부
374 보간 처리부
402 제 3 레이어 부호화부
501 모드 판정부
521, 522, 621, 622 스위치
523 제1부호화부
524 제2부호화부
623 제1 복호부
624 제2 복호부

Claims (23)

  1. 음성 신호 또는 음악 신호의 소정 주파수 이하의 저역(低域) 부분을 나타내는 제1부호화 정보와, 상기 음성 신호 또는 음악 신호의 상기 소정 주파수보다 높은 고역(高域) 부분을 분할한 복수의 서브밴드에 있어서, 상기 음성 신호 또는 음악 신호의 고역 부분의 스펙트럼을 추정하기 위한 대역 정보 및, 각 서브밴드내의 일부 또는 전부의 스펙트럼 성분에 대한 진폭을 조정하는 제1 진폭 조정 파라미터를 포함한 제2부호화 정보를 수신하는 수신 수단과,
    상기 제1부호화 정보를 복호하여 제1 복호 신호를 생성하는 제1 복호 수단과,
    상기 제2부호화 정보를 이용해, 상기 제1 복호 신호로부터 상기 음성 신호 또는 음악 신호의 고역 부분을 추정하여, 스펙트럼 성분의 진폭을 조정함으로써 제2 복호 신호를 생성하는 제2 복호 수단을 구비하는 복호 장치이며,
    상기 제2 복호 수단은,
    추정한 상기 음성 신호 또는 음악 신호의 고역 부분의 스펙트럼에 대해서, 스펙트럼 성분을 부분적으로 선택하는 스펙트럼 성분 선택 수단과,
    상기 부분적으로 선택된 스펙트럼 성분에 대해서 제2 진폭 조정 파라미터를 적용하는 제1 진폭 조정 파라미터 적용 수단과,
    상기 부분적으로 선택되지 않았던 스펙트럼 성분에 대해서 상기 제2 진폭 조정 파라미터의 값에 따라 적응적으로 설정되는 제3 진폭 조정 파라미터를 적용하는 제2 진폭 조정 파라미터 적용 수단을 구비하는,
    복호 장치.
  2. 청구항 1에 있어서,
    상기 제2 복호 수단은,
    추정한 상기 음성 신호 또는 음악 신호의 고역 부분의 스펙트럼에 대해서, 진폭치가 최대 또는 최소인 스펙트럼 성분을 상기 서브밴드마다 탐색하는 진폭치 탐색 수단을 더 구비하고,
    상기 스펙트럼 성분 선택 수단은, 상기 진폭치가 최대 또는 최소인 스펙트럼 성분에 근접하는 스펙트럼 성분일수록 선택되기 쉬운 가중값에 의해, 스펙트럼 성분을 부분적으로 선택하는,
    복호 장치.
  3. 청구항 1에 있어서,
    상기 제2 복호 수단은,
    상기 제1 복호 신호의 스펙트럼에 대해서, 상기 제2부호화 정보에 포함되는 상기 음성 신호 또는 음악 신호의 고역 부분의 스펙트럼의 각 서브밴드에 가장 근사(近似)한 상기 제1 복호 신호의 스펙트럼의 대역을 나타내는 상기 대역 정보를 이용해서, 상기 음성 신호 또는 음악 신호의 고역 부분의 스펙트럼을 추정하고, 상기 제2부호화 정보에 포함되는 상기 제1 진폭 조정 파라미터를 이용해서, 상기 추정한 음성 신호 또는 음악 신호의 고역 부분의 스펙트럼 성분의 진폭을 조정하는,
    복호 장치.
  4. 청구항 1에 있어서,
    상기 제1 진폭 조정 파라미터 적용 수단은, 대수 영역에서의 진폭 조정을 행하고,
    상기 제2 진폭 조정 파라미터 적용 수단은, 선형 영역에서의 진폭 조정을 행하는,
    복호 장치.
  5. 청구항 1에 있어서,
    상기 제2 진폭 조정 파라미터 적용 수단은, 상기 제2 진폭 조정 파라미터의 값이 미리 설정된 임계값보다 작은 경우에는, 상기 제3 진폭 조정 파라미터를 작게 설정하고, 상기 제2 진폭 조정 파라미터의 값이 상기 임계값 이상일 경우에는, 상기 제3 진폭 조정 파라미터를 크게 설정하는,
    복호 장치.
  6. 청구항 1에 있어서,
    상기 수신 수단은, 더욱, 상기 음성 신호 또는 음악 신호의 특성에 따른 복호 방법을 나타내는 모드 정보를 수신하고,
    상기 제2 복호 수단은, 상기 모드 정보에 따라 복수의 복호 방법을 전환하는 복수의 복호 수단을 더 구비하고,
    상기 복수의 복호 수단은, 전(前)프레임과 현프레임에서 복호 방법이 전환되는 경우, 현프레임의 복호시에 이용하는 제1 게인을 조정하고, 상기 제1 게인은 상기 제1 진폭 파라미터 또는 상기 제2 진폭 파라미터인,
    복호 장치.
  7. 청구항 6에 있어서,
    상기 복수의 복호 수단은, 전프레임과 현프레임에서 복호 방법이 전환되는 경우, 현프레임에서 이용하는 상기 제1 게인을 감쇠시키는,
    복호 장치.
  8. 청구항 6에 있어서,
    상기 복수의 복호 수단은, 전프레임과 현프레임에서 복호 방법이 전환되는 경우, 전프레임의 복호시에 이용하는 제2 게인을 이용하여, 현프레임에서 이용하는 상기 제1 게인을 조정하고, 상기 제2 게인은 상기 제1 진폭 파라미터 또는 상기 제2 진폭 파라미터인,
    복호 장치.
  9. 청구항 6에 있어서,
    상기 복수의 복호 수단은, 전프레임과 현프레임에서 복호 방법이 전환되는 경우, 현프레임에서 이용하는 상기 제1 게인을 전프레임의 복호시에 이용하는 제2 게인에 가까워지도록, 상기 제1 게인을 조정하고, 상기 제2 게인은 상기 제1 진폭 파라미터 또는 상기 제2 진폭 파라미터인,
    복호 장치.
  10. 청구항 1에 기재된 복호 장치를 구비하는 통신 단말장치.
  11. 청구항 1에 기재된 복호 장치를 구비하는 기지국 장치.
  12. 입력 신호의 소정 주파수 이하의 저역 부분을 부호화하여 제1부호화 정보를 생성하는 제1부호화 수단과,
    상기 제1부호화 정보를 복호하여 제1 복호 신호를 생성하는 복호 수단과,
    상기 입력 신호의 상기 소정 주파수보다 높은 고역 부분을 분할한 복수의 서브밴드에 있어서, 상기 입력 신호의 고역부분의 스펙트럼을 추정하기 위한 대역 정보 및, 각 서브밴드내의 일부 또는 전부의 스펙트럼 성분에 대한 진폭을 조정하는 제1 진폭 조정 파라미터를 포함하는 제2부호화 정보를 생성하는 제2부호화 수단과,
    상기 제2부호화 정보를 이용하여, 상기 제1 복호 신호로부터 상기 입력 신호의 고역부분을 추정하고, 스펙트럼 성분의 진폭을 조정함으로써 제2 복호 신호를 생성하는 제2 복호 수단과,
    상기 제1 복호 신호 및 상기 제2 복호 신호와, 상기 입력 신호와의 차분 신호를 부호화하여, 제3부호화 정보를 생성하는 제3부호화 수단을 구비하는 부호화 장치이며,
    상기 제2 복호 수단은,
    추정한 상기 입력 신호의 고역부분의 스펙트럼에 대해서, 스펙트럼 성분을 부분적으로 선택하는 스펙트럼 성분 선택 수단과,
    상기 부분적으로 선택된 스펙트럼 성분에 대해서 제2 진폭 조정 파라미터를 적용하는 제1 진폭 조정 파라미터 적용 수단과,
    상기 부분적으로 선택되지 않았던 스펙트럼 성분에 대해서 상기 제2 진폭 조정 파라미터의 값에 따라 적응적으로 설정되는 제3 진폭 조정 파라미터를 적용하는 제2 진폭 조정 파라미터 적용 수단을 구비하는,
    부호화 장치.
  13. 청구항 12에 있어서,
    상기 제2 복호 수단은,
    추정한 상기 입력 신호의 고역부분의 스펙트럼에 대해서, 진폭치가 최대 또는 최소인 스펙트럼 성분을 상기 서브밴드마다 탐색하는 진폭치 탐색 수단을 더 구비하고,
    상기 스펙트럼 성분 선택 수단은, 상기 진폭치가 최대 또는 최소인 스펙트럼 성분에 근접하는 스펙트럼 성분일수록 선택되기 쉬운 가중값에 의해, 스펙트럼 성분을 부분적으로 선택하는,
    부호화 장치.
  14. 청구항 12에 있어서,
    상기 제1 진폭 조정 파라미터 적용 수단은, 대수 영역에서의 진폭 조정을 행하고,
    상기 제2 진폭 조정 파라미터 적용 수단은, 선형 영역에서의 진폭 조정을 행하는,
    부호화 장치.
  15. 청구항 12에 있어서,
    상기 제2 진폭 조정 파라미터 적용 수단은, 상기 제2 진폭 조정 파라미터의 값이 미리 설정된 임계값보다 작은 경우에는, 상기 제3 진폭 조정 파라미터를 작게 설정하고, 상기 제2 진폭 조정 파라미터의 값이 상기 임계값 이상의 경우에는, 상기 제3 진폭 조정 파라미터를 크게 설정하는,
    부호화 장치.
  16. 청구항 12에 있어서,
    상기 제2부호화 수단은, 상기 입력 신호의 특성에 따라 복수의 부호화 방법을 전환하는 복수의 부호화 수단을 더 구비하고,
    상기 복수의 부호화 수단은, 전프레임과 현프레임에서 부호화 방법이 전환되는 경우, 현프레임의 부호화 때에 이용하는 제1 게인을 조정하고, 상기 제1 게인은 상기 제1 진폭 파라미터 또는 상기 제2 진폭 파라미터인,
    부호화 장치.
  17. 청구항 16에 있어서,
    상기 복수의 부호화 수단은, 전프레임과 현프레임에서 부호화 방법이 전환되는 경우, 현프레임에서 이용하는 상기 제1 게인을 감쇠시키는,
    부호화 장치.
  18. 청구항 16에 있어서,
    상기 복수의 부호화 수단은, 전프레임과 현프레임에서 부호화 방법이 전환되는 경우, 전프레임의 부호화 때에 이용하는 제2 게인을 이용해서, 현프레임에서 이용하는 상기 제1 게인을 조정하고, 상기 제2 게인은 상기 제1 진폭 파라미터 또는 상기 제2 진폭 파라미터인,
    부호화 장치.
  19. 청구항 16에 있어서,
    상기 복수의 부호화 수단은, 전프레임과 현프레임에서 부호화 방법이 전환되는 경우, 현프레임에서 이용하는 상기 제1 게인을 전프레임의 부호화 때에 이용하는 제2 게인에 가까워지도록, 상기 제1 게인을 조정하고, 상기 제2 게인은 상기 제1 진폭 파라미터 또는 상기 제2 진폭 파라미터인,
    부호화 장치.
  20. 청구항 12에 기재된 부호화 장치를 구비하는 통신 단말장치.
  21. 청구항 12에 기재된 부호화 장치를 구비하는 기지국 장치.
  22. 음성 신호 또는 음악 신호의 소정 주파수 이하의 저역 부분을 나타내는 제1부호화 정보와, 상기 음성 신호 또는 음악 신호의 상기 소정 주파수보다 높은 고역 부분을 분할한 복수의 서브밴드에 있어서, 상기 음성 신호 또는 음악 신호의 고역 부분의 스펙트럼을 추정하기 위한 대역 정보 및, 각 서브밴드내의 일부 또는 전부의 스펙트럼 성분에 대한 진폭을 조정하는 제1 진폭 조정 파라미터를 포함한 제2부호화 정보를 수신하는 수신 스텝과,
    상기 제1부호화 정보를 복호하여 제1 복호 신호를 생성하는 제1 복호 스텝과,
    상기 제2부호화 정보를 이용해서, 상기 제1 복호 신호로부터 상기 음성 신호 또는 음악 신호의 고역부분을 추정하고, 스펙트럼 성분의 진폭을 조정함으로써 제2 복호 신호를 생성하는 제2복호 스텝을 구비하는 복호 방법이며,
    상기 제2 복호 스텝은,
    추정한 상기 음성 신호 또는 음악 신호의 고역 부분의 스펙트럼에 대해서, 스펙트럼 성분을 부분적으로 선택하는 스펙트럼 성분 선택 스텝과,
    상기 부분적으로 선택된 스펙트럼 성분에 대해서 제2 진폭 조정 파라미터를 적용하는 제1 진폭 조정 파라미터 적용 스텝과,
    상기 부분적으로 선택되지 않았던 스펙트럼 성분에 대해서 상기 제2 진폭 조정 파라미터의 값에 따라 적응적으로 설정되는 제3 진폭 조정 파라미터를 적용하는 제2 진폭 조정 파라미터 적용 스텝을 구비하는,
    복호 방법.
  23. 입력 신호의 소정 주파수 이하의 저역 부분을 부호화하여 제1부호화 정보를 생성하는 제1부호화 스텝과,
    상기 제1부호화 정보를 복호하여 제1 복호 신호를 생성하는 복호 스텝과,
    상기 입력 신호의 상기 소정 주파수보다 높은 고역 부분을 분할한 복수의 서브밴드에 있어서, 상기 입력 신호의 고역부분의 스펙트럼을 추정하기 위한 대역 정보 및, 각 서브밴드내의 일부 또는 전부의 스펙트럼 성분에 대한 진폭을 조정하는 제1 진폭 조정 파라미터를 포함한 제2부호화 정보를 생성하는 제2부호화 스텝과,
    상기 제2부호화 정보를 이용하여, 상기 제1 복호 신호로부터 상기 입력 신호의 고역부분을 추정하여, 스펙트럼 성분의 진폭을 조정함으로써 제2 복호 신호를 생성하는 제2 복호 스텝과,
    상기 제1 복호 신호 및 상기 제2 복호 신호와, 상기 입력 신호와의 차분 신호를 부호화하여, 제3부호화 정보를 생성하는 제3부호화 스텝을 구비하는 부호화 방법이며,
    상기 제2 복호 스텝은,
    추정한 상기 입력 신호의 고역부분의 스펙트럼에 대해서, 스펙트럼 성분을 부분적으로 선택하는 스펙트럼 성분 선택 스텝과,
    상기 부분적으로 선택된 스펙트럼 성분에 대해서 제2 진폭 조정 파라미터를 적용하는 제1 진폭 조정 파라미터 적용 스텝과,
    상기 부분적으로 선택되지 않았던 스펙트럼 성분에 대해서 상기 제2 진폭 조정 파라미터의 값에 따라 적응적으로 설정되는 제3 진폭 조정 파라미터를 적용하는 제2 진폭 조정 파라미터 적용 스텝을 구비하는,
    부호화 방법.
KR1020127033257A 2010-06-21 2011-06-07 복호 장치, 부호화 장치 및 이러한 방법 KR20130088756A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JPJP-P-2010-141021 2010-06-21
JP2010141021 2010-06-21
JP2011047597 2011-03-04
JPJP-P-2011-047597 2011-03-04
PCT/JP2011/003196 WO2011161886A1 (ja) 2010-06-21 2011-06-07 復号装置、符号化装置およびこれらの方法

Publications (1)

Publication Number Publication Date
KR20130088756A true KR20130088756A (ko) 2013-08-08

Family

ID=45371093

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127033257A KR20130088756A (ko) 2010-06-21 2011-06-07 복호 장치, 부호화 장치 및 이러한 방법

Country Status (11)

Country Link
US (1) US9076434B2 (ko)
EP (1) EP2584561B1 (ko)
JP (1) JP5730303B2 (ko)
KR (1) KR20130088756A (ko)
CN (1) CN102947881A (ko)
BR (1) BR112012032746A2 (ko)
CA (1) CA2801362A1 (ko)
RU (1) RU2012155222A (ko)
TW (1) TW201212005A (ko)
WO (1) WO2011161886A1 (ko)
ZA (1) ZA201209578B (ko)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103119650B (zh) 2010-10-20 2014-11-12 松下电器(美国)知识产权公司 编码装置和编码方法
CA2861967A1 (en) * 2012-01-18 2013-07-25 Luca Rossato Distinct encoding and decoding of stable information and transient/stochastic information
EP3046104B1 (en) 2013-09-16 2019-11-20 Samsung Electronics Co., Ltd. Signal encoding method and signal decoding method
KR102315920B1 (ko) 2013-09-16 2021-10-21 삼성전자주식회사 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
CN104517610B (zh) * 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
JP5981408B2 (ja) * 2013-10-29 2016-08-31 株式会社Nttドコモ 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム
PL3163571T3 (pl) * 2014-07-28 2020-05-18 Nippon Telegraph And Telephone Corporation Kodowanie sygnału dźwiękowego
JP6622945B2 (ja) * 2017-03-30 2019-12-18 富士フイルム株式会社 画像処理装置、画像処理方法、およびプログラム
US11259040B1 (en) * 2019-04-25 2022-02-22 Amazon Technologies, Inc. Adaptive multi-pass risk-based video encoding
KR20220035096A (ko) * 2019-07-19 2022-03-21 소니그룹주식회사 신호 처리 장치 및 방법, 그리고 프로그램
CN115642971B (zh) * 2022-12-22 2023-05-09 成都华兴汇明科技有限公司 微波模块非线性参数的仿真文件生成方法及自动提取***

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003038812A1 (en) * 2001-11-02 2003-05-08 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device
WO2003085644A1 (en) * 2002-04-11 2003-10-16 Matsushita Electric Industrial Co., Ltd. Encoding device and decoding device
JP3881943B2 (ja) 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
CN101656075B (zh) * 2004-05-14 2012-08-29 松下电器产业株式会社 音频解码装置、音频解码方法以及通信终端和基站装置
US8417515B2 (en) 2004-05-14 2013-04-09 Panasonic Corporation Encoding device, decoding device, and method thereof
KR20070084002A (ko) * 2004-11-05 2007-08-24 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 복호화 장치 및 스케일러블 부호화 장치
JP4899359B2 (ja) 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
WO2007052088A1 (en) 2005-11-04 2007-05-10 Nokia Corporation Audio compression
JP4708446B2 (ja) * 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
EP2224432B1 (en) 2007-12-21 2017-03-15 Panasonic Intellectual Property Corporation of America Encoder, decoder, and encoding method
WO2009084221A1 (ja) 2007-12-27 2009-07-09 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
JP5448850B2 (ja) 2008-01-25 2014-03-19 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
US8452588B2 (en) 2008-03-14 2013-05-28 Panasonic Corporation Encoding device, decoding device, and method thereof
JP5511785B2 (ja) * 2009-02-26 2014-06-04 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
JP5565914B2 (ja) 2009-10-23 2014-08-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置およびこれらの方法
EP2500901B1 (en) 2009-11-12 2018-09-19 III Holdings 12, LLC Audio encoder apparatus and audio encoding method
EP2562750B1 (en) 2010-04-19 2020-06-10 Panasonic Intellectual Property Corporation of America Encoding device, decoding device, encoding method and decoding method

Also Published As

Publication number Publication date
US9076434B2 (en) 2015-07-07
EP2584561A1 (en) 2013-04-24
BR112012032746A2 (pt) 2016-11-08
JPWO2011161886A1 (ja) 2013-08-19
ZA201209578B (en) 2013-09-25
JP5730303B2 (ja) 2015-06-10
EP2584561B1 (en) 2018-01-10
US20130124201A1 (en) 2013-05-16
WO2011161886A1 (ja) 2011-12-29
TW201212005A (en) 2012-03-16
CA2801362A1 (en) 2011-12-29
RU2012155222A (ru) 2014-07-27
EP2584561A4 (en) 2013-11-20
CN102947881A (zh) 2013-02-27

Similar Documents

Publication Publication Date Title
KR20130088756A (ko) 복호 장치, 부호화 장치 및 이러한 방법
KR101661374B1 (ko) 부호화 장치, 복호 장치 및 이들 방법
KR101570550B1 (ko) 부호화 장치, 복호 장치 및 이러한 방법
US9779744B2 (en) Speech decoder with high-band generation and temporal envelope shaping
EP2239731B1 (en) Encoding device, decoding device, and method thereof
US8010348B2 (en) Adaptive encoding and decoding with forward linear prediction
KR101244310B1 (ko) 광대역 부호화 및 복호화 방법 및 장치
KR101576318B1 (ko) 스펙트럼 평활화 장치, 부호화 장치, 복호 장치, 통신 단말 장치, 기지국 장치 및 스펙트럼 평활화 방법
WO2009081568A1 (ja) 符号化装置、復号装置および符号化方法
WO2009084221A1 (ja) 符号化装置、復号装置およびこれらの方法
KR20080049085A (ko) 음성 부호화 장치 및 음성 부호화 방법
US8898057B2 (en) Encoding apparatus, decoding apparatus and methods thereof
US7974839B2 (en) Method, medium, and apparatus encoding scalable wideband audio signal
US20100283536A1 (en) System, apparatus, method and program for signal analysis control, signal analysis and signal control
JP5774490B2 (ja) 符号化装置、復号装置およびこれらの方法

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid