KR20140050050A - 부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램 - Google Patents

부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램 Download PDF

Info

Publication number
KR20140050050A
KR20140050050A KR1020147003607A KR20147003607A KR20140050050A KR 20140050050 A KR20140050050 A KR 20140050050A KR 1020147003607 A KR1020147003607 A KR 1020147003607A KR 20147003607 A KR20147003607 A KR 20147003607A KR 20140050050 A KR20140050050 A KR 20140050050A
Authority
KR
South Korea
Prior art keywords
signal
subband
section
low
continuous frame
Prior art date
Application number
KR1020147003607A
Other languages
English (en)
Inventor
유키 야마모토
도루 치넨
Original Assignee
소니 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 주식회사 filed Critical 소니 주식회사
Publication of KR20140050050A publication Critical patent/KR20140050050A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 기술은, 보다 적은 부호량으로 고음질의 음성을 얻을 수 있도록 하는 부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램에 관한 것이다. 구간수 결정 특징량 산출 회로는, 입력 신호를 구성하는 복수의 서브 밴드의 서브 밴드 신호에 기초하여, 처리 대상 구간을, 동일한 추정 계수가 선택되는 프레임을 포함하는 연속 프레임 구간으로 분할하는 분할 수를 정하기 위한 구간수 결정 특징량을 산출한다. 의사 고역 서브 밴드 파워 차분 산출 회로는, 구간수 결정 특징량에 기초하여 처리 대상 구간 내의 연속 프레임 구간수를 결정함과 함께, 각 연속 프레임 구간에 대해서, 입력 신호의 고역 성분을 추정에 의해 구하기 위한 추정 계수를 선택하고, 그것들의 추정 계수를 얻기 위한 계수 인덱스를 포함하는 데이터를 생성한다. 고역 부호화 회로는, 얻어진 데이터를 부호화하여, 고역 부호화 데이터를 생성한다. 본 기술은, 부호화 장치에 적용할 수 있다.

Description

부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램{ENCODING DEVICE AND METHOD, DECODING DEVICE AND METHOD, AND PROGRAM}
본 기술은 부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램에 관한 것으로, 특히, 보다 적은 부호량으로 음질이 좋은 음성을 얻을 수 있도록 한 부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램에 관한 것이다.
종래, 음성 신호의 부호화 방법으로서, HE-AAC(High Efficiency MPEG(Moving Picture Experts Group) 4 AAC(Advanced Audio Coding))(국제 표준 규격 ISO/IEC14496-3)나, AAC(MPEG2 AAC)(국제 표준 규격 ISO/IEC13818-7) 등이 알려져 있다.
예를 들어 음성 신호의 부호화 방법으로서, 저역 성분을 부호화하여 얻어진 저역 부호화 정보와, 저역 성분 및 고역 성분으로부터 생성된, 고역 성분의 추정값을 얻기 위한 고역 부호화 정보를 부호화로 얻어진 부호로서 출력하는 방법이 제안되어 있다(예를 들어, 특허문헌 1 참조). 이 방법에서는, 고역 부호화 정보에는, 고역의 주파수 성분을 얻기 위한 스케일 팩터, 진폭 조정 계수, 스펙트럼 잔차 등, 고역 성분의 추정값을 산출하기 위해 필요한 정보가 포함되어 있다.
또한, 복호 시에는 저역 부호화 정보를 복호하여 얻어지는 저역 성분과, 고역 부호화 정보를 복호하여 얻어지는 정보에 기초하여 고역 성분이 추정되고, 추정에 의해 얻어진 고역 성분과, 복호로 얻어진 저역 성분이 합성되어 복호로 얻어진 음성 신호가 된다.
이러한 부호화 방법에서는, 고역 성분의 추정값을 얻기 위한 정보만을 고역의 신호 성분에 관한 정보로서 부호화하므로, 음질의 열화를 억제하면서 부호화 효율을 향상시킬 수 있다.
국제 공개 제WO2006/049205호
그러나, 상술한 기술에서는 복호시에 고음질의 음성을 얻을 수는 있지만, 음성 신호의 처리 단위마다 고역 성분의 추정값을 산출하기 위한 정보를 생성해야만 하여, 고역 부호화 정보의 부호량이 충분히 적다고는 할 수 없었다.
본 기술은, 이러한 상황을 감안하여 이루어진 것으로, 보다 적은 부호량으로 고음질의 음성을 얻을 수 있도록 하는 것이다.
본 기술의 제1 측면의 부호화 장치는, 입력 신호의 저역측의 서브 밴드의 저역 서브 밴드 신호와, 상기 입력 신호의 고역측의 서브 밴드의 고역 서브 밴드 신호를 생성하는 서브 밴드 분할부와, 상기 저역 서브 밴드 신호와 소정의 추정 계수에 기초하여, 상기 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값인 의사 고역 서브 밴드 파워를 산출하는 의사 고역 서브 밴드 파워 산출부와, 상기 저역 서브 밴드 신호 또는 상기 고역 서브 밴드 신호 중 적어도 어느 하나에 기초하여, 구간수 결정 특징량을 산출하는 특징량 산출부와, 상기 구간수 결정 특징량에 기초하여, 상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에서의, 동일한 상기 추정 계수가 선택된 프레임을 포함하는 연속 프레임 구간의 수를 결정하는 결정부와, 결정된 상기 연속 프레임 구간의 수에 기초하여 상기 처리 대상 구간을 분할하여 얻어지는 각 상기 연속 프레임 구간에 대해서, 상기 의사 고역 서브 밴드 파워와 상기 고역 서브 밴드 파워에 기초하여, 복수의 상기 추정 계수 중에서 상기 연속 프레임 구간을 구성하는 프레임의 상기 추정 계수를 선택하는 선택부와, 상기 처리 대상 구간을 구성하는 각 상기 연속 프레임 구간의 프레임에서 선택된 상기 추정 계수를 얻기 위한 데이터를 생성하는 생성부와, 상기 입력 신호의 저역 신호를 부호화하여 저역 부호화 데이터를 생성하는 저역 부호화부와, 상기 데이터와 상기 저역 부호화 데이터를 다중화하여 출력 부호열을 생성하는 다중화부를 구비한다.
상기 구간수 결정 특징량을, 상기 고역 서브 밴드 파워의 합을 나타내는 특징량으로 할 수 있다.
상기 구간수 결정 특징량을, 상기 고역 서브 밴드 파워의 합의 시간 변동을 나타내는 특징량으로 할 수 있다.
상기 구간수 결정 특징량을, 상기 입력 신호의 주파수 형상을 나타내는 특징량으로 할 수 있다.
상기 구간수 결정 특징량을, 복수의 특징량의 선형 합 또는 비선형 합으로 할 수 있다.
부호화 장치에는, 상기 추정 계수마다 산출된, 상기 프레임에서의 상기 의사 고역 서브 밴드 파워와 상기 고역 서브 밴드 파워의 오차를 나타내는 평가값에 기초하여, 상기 추정 계수마다, 상기 연속 프레임 구간을 구성하는 각 프레임의 상기 평가값의 합을 산출하는 평가값 합 산출부를 더 설치하고, 상기 선택부에는, 상기 추정 계수마다 산출된 상기 평가값의 합에 기초하여, 상기 연속 프레임 구간의 프레임의 상기 추정 계수를 선택시킬 수 있다.
결정된 상기 연속 프레임 구간의 수로 상기 처리 대상 구간을 등분할하여 얻어진 각 구간을, 상기 연속 프레임 구간으로 할 수 있다.
상기 선택부에는, 결정된 상기 연속 프레임 구간의 수로 상기 처리 대상 구간을 분할할 때에 취할 수 있는 상기 처리 대상 구간의 분할의 조합마다, 상기 평가값의 합에 기초하여 상기 연속 프레임 구간의 프레임의 상기 추정 계수를 선택시킴과 함께, 각 상기 조합 중, 상기 처리 대상 구간을 구성하는 모든 상기 프레임의 선택된 상기 추정 계수의 상기 평가값의 합이 최소가 되는 상기 조합을 특정시키고, 특정된 상기 조합에 있어서, 각 프레임에서 선택된 상기 추정 계수를, 그것들의 프레임의 상기 추정 계수로 하게 할 수 있다.
부호화 장치에는, 상기 데이터를 부호화하여 고역 부호화 데이터를 생성하는 고역 부호화부를 더 설치하고, 상기 다중화부에는, 상기 고역 부호화 데이터와 상기 저역 부호화 데이터를 다중화하여 상기 출력 부호열을 생성시킬 수 있다.
상기 결정부에는, 결정된 상기 연속 프레임 구간의 수에 기초하여, 상기 처리 대상 구간의 상기 고역 부호화 데이터의 부호량을 더 산출시키고, 상기 저역 부호화부에는, 상기 처리 대상 구간에 대하여 미리 정해진 부호량과, 산출된 상기 고역 부호화 데이터의 부호량으로부터 정해지는 부호량으로 상기 저역 신호를 부호화시킬 수 있다.
본 기술의 제1 측면의 부호화 방법 또는 프로그램은, 입력 신호의 저역측의 서브 밴드의 저역 서브 밴드 신호와, 상기 입력 신호의 고역측의 서브 밴드의 고역 서브 밴드 신호를 생성하고, 상기 저역 서브 밴드 신호와 소정의 추정 계수에 기초하여, 상기 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값인 의사 고역 서브 밴드 파워를 산출하고, 상기 저역 서브 밴드 신호 또는 상기 고역 서브 밴드 신호 중 적어도 어느 하나에 기초하여, 구간수 결정 특징량을 산출하고, 상기 구간수 결정 특징량에 기초하여, 상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에서의, 동일한 상기 추정 계수가 선택된 프레임을 포함하는 연속 프레임 구간의 수를 결정하고, 결정된 상기 연속 프레임 구간의 수에 기초하여 상기 처리 대상 구간을 분할하여 얻어지는 각 상기 연속 프레임 구간에 대해서, 상기 의사 고역 서브 밴드 파워와 상기 고역 서브 밴드 파워에 기초하여, 복수의 상기 추정 계수 중에서 상기 연속 프레임 구간을 구성하는 프레임의 상기 추정 계수를 선택하고, 상기 처리 대상 구간을 구성하는 각 상기 연속 프레임 구간의 프레임에서 선택된 상기 추정 계수를 얻기 위한 데이터를 생성하고, 상기 입력 신호의 저역 신호를 부호화하여 저역 부호화 데이터를 생성하고, 상기 데이터와 상기 저역 부호화 데이터를 다중화하여 출력 부호열을 생성하는 스텝을 포함한다.
본 기술의 제1 측면에서는, 입력 신호의 저역측의 서브 밴드의 저역 서브 밴드 신호와, 상기 입력 신호의 고역측의 서브 밴드의 고역 서브 밴드 신호가 생성되고, 상기 저역 서브 밴드 신호와 소정의 추정 계수에 기초하여, 상기 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값인 의사 고역 서브 밴드 파워가 산출되고, 상기 저역 서브 밴드 신호 또는 상기 고역 서브 밴드 신호 중 적어도 어느 하나에 기초하여, 구간수 결정 특징량이 산출되고, 상기 구간수 결정 특징량에 기초하여, 상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에서의, 동일한 상기 추정 계수가 선택된 프레임을 포함하는 연속 프레임 구간의 수가 결정되고, 결정된 상기 연속 프레임 구간의 수에 기초하여 상기 처리 대상 구간을 분할하여 얻어지는 각 상기 연속 프레임 구간에 대해서, 상기 의사 고역 서브 밴드 파워와 상기 고역 서브 밴드 파워에 기초하여, 복수의 상기 추정 계수 중에서 상기 연속 프레임 구간을 구성하는 프레임의 상기 추정 계수가 선택되고, 상기 처리 대상 구간을 구성하는 각 상기 연속 프레임 구간의 프레임에서 선택된 상기 추정 계수를 얻기 위한 데이터가 생성되고, 상기 입력 신호의 저역 신호를 부호화하여 저역 부호화 데이터가 생성되고, 상기 데이터와 상기 저역 부호화 데이터가 다중화되어서 출력 부호열이 생성된다.
본 기술의 제2 측면의 복호 장치는, 입력 신호의 저역 서브 밴드 신호와 소정의 추정 계수에 기초하여, 상기 입력 신호의 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값이 산출되고, 상기 입력 신호로부터 추출된 구간수 결정 특징량에 기초하여, 상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에서의, 동일한 상기 추정 계수가 선택되는 프레임을 포함하는 연속 프레임 구간의 수가 결정되고, 결정된 상기 연속 프레임 구간의 수에 기초하여 상기 처리 대상 구간을 분할하여 얻어지는 각 상기 연속 프레임 구간에 대해서, 상기 추정값과 상기 고역 서브 밴드 파워에 기초하여, 복수의 상기 추정 계수 중에서 상기 연속 프레임 구간을 구성하는 프레임의 상기 추정 계수가 선택되고, 그 선택 결과에 기초하여 생성된, 상기 처리 대상 구간을 구성하는 각 상기 연속 프레임 구간의 프레임에서 선택된 상기 추정 계수를 얻기 위한 데이터와, 상기 입력 신호의 저역 신호를 부호화하여 얻어진 저역 부호화 데이터에, 입력 부호열을 비다중화하는 비다중화부와, 상기 저역 부호화 데이터를 복호하여 저역 신호를 생성하는 저역 복호부와, 상기 데이터로부터 얻어진 상기 추정 계수와, 상기 복호로 얻어진 저역 신호에 기초하여 고역 신호를 생성하는 고역 신호 생성부와, 상기 고역 신호와 상기 복호로 얻어진 저역 신호에 기초하여 출력 신호를 생성하는 합성부를 구비한다.
복호 장치에는, 상기 데이터를 복호하여 상기 추정 계수를 얻는 고역 복호부를 더 설치할 수 있다.
상기 추정 계수마다 산출된, 상기 프레임에서의 상기 추정값과 상기 고역 서브 밴드 파워의 오차를 나타내는 평가값에 기초하여, 상기 추정 계수마다, 상기 연속 프레임 구간을 구성하는 각 프레임의 상기 평가값의 합이 산출되고, 상기 추정 계수마다 산출된 상기 평가값의 합에 기초하여, 상기 연속 프레임 구간의 프레임의 상기 추정 계수가 선택되도록 할 수 있다.
결정된 상기 연속 프레임 구간의 수에 상기 처리 대상 구간을 등분할하여 얻어진 각 구간이, 상기 연속 프레임 구간이 되도록 할 수 있다.
결정된 상기 연속 프레임 구간의 수로 상기 처리 대상 구간을 분할할 때에 취할 수 있는 상기 처리 대상 구간의 분할의 조합마다, 상기 평가값의 합에 기초하여 상기 연속 프레임 구간의 프레임의 상기 추정 계수가 선택됨과 함께, 각 상기 조합 중, 상기 처리 대상 구간을 구성하는 모든 상기 프레임의 선택된 상기 추정 계수의 상기 평가값의 합이 최소가 되는 상기 조합이 특정되고, 특정된 상기 조합에 있어서, 각 프레임에서 선택된 상기 추정 계수가, 그것들의 프레임의 상기 추정 계수가 되도록 할 수 있다.
본 기술의 제2 측면의 복호 방법 또는 프로그램은, 입력 신호의 저역 서브 밴드 신호와 소정의 추정 계수에 기초하여, 상기 입력 신호의 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값이 산출되고, 상기 입력 신호로부터 추출된 구간수 결정 특징량에 기초하여, 상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에서의, 동일한 상기 추정 계수가 선택되는 프레임을 포함하는 연속 프레임 구간의 수가 결정되고, 결정된 상기 연속 프레임 구간의 수에 기초하여 상기 처리 대상 구간을 분할하여 얻어지는 각 상기 연속 프레임 구간에 대해서, 상기 추정값과 상기 고역 서브 밴드 파워에 기초하여, 복수의 상기 추정 계수 중에서 상기 연속 프레임 구간을 구성하는 프레임의 상기 추정 계수가 선택되고, 그 선택 결과에 기초하여 생성된, 상기 처리 대상 구간을 구성하는 각 상기 연속 프레임 구간의 프레임에서 선택된 상기 추정 계수를 얻기 위한 데이터와, 상기 입력 신호의 저역 신호를 부호화하여 얻어진 저역 부호화 데이터에, 입력 부호열을 비다중화하고, 상기 저역 부호화 데이터를 복호하여 저역 신호를 생성하고, 상기 데이터로부터 얻어진 상기 추정 계수와, 상기 복호로 얻어진 저역 신호에 기초하여 고역 신호를 생성하고, 상기 고역 신호와 상기 복호로 얻어진 저역 신호에 기초하여 출력 신호를 생성하는 스텝을 포함한다.
본 기술의 제2 측면에서는, 입력 신호의 저역 서브 밴드 신호와 소정의 추정 계수에 기초하여, 상기 입력 신호의 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값이 산출되고, 상기 입력 신호로부터 추출된 구간수 결정 특징량에 기초하여, 상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에서의, 동일한 상기 추정 계수가 선택되는 프레임을 포함하는 연속 프레임 구간의 수가 결정되고, 결정된 상기 연속 프레임 구간의 수에 기초하여 상기 처리 대상 구간을 분할하여 얻어지는 각 상기 연속 프레임 구간에 대해서, 상기 추정값과 상기 고역 서브 밴드 파워에 기초하여, 복수의 상기 추정 계수 중에서 상기 연속 프레임 구간을 구성하는 프레임의 상기 추정 계수가 선택되고, 그 선택 결과에 기초하여 생성된, 상기 처리 대상 구간을 구성하는 각 상기 연속 프레임 구간의 프레임에서 선택된 상기 추정 계수를 얻기 위한 데이터와, 상기 입력 신호의 저역 신호를 부호화하여 얻어진 저역 부호화 데이터에, 입력 부호열이 비다중화되고, 상기 저역 부호화 데이터가 복호되어서 저역 신호가 생성되고, 상기 데이터로부터 얻어진 상기 추정 계수와, 상기 복호로 얻어진 저역 신호에 기초하여 고역 신호가 생성되고, 상기 고역 신호와 상기 복호로 얻어진 저역 신호에 기초하여 출력 신호가 생성된다.
본 기술의 제1 측면 및 제2 측면에 의하면, 보다 적은 부호량으로 고음질의 음성을 얻을 수 있다.
도 1은 입력 신호의 서브 밴드에 대하여 설명하기 위한 도면이다.
도 2는 가변 길이 방식에 의한 고역 성분의 부호화에 대하여 설명하는 도면이다.
도 3은 고정 길이 방식에 의한 고역 성분의 부호화에 대하여 설명하는 도면이다.
도 4는 본 기술을 적용한 부호화 장치의 구성예를 도시하는 도면이다.
도 5는 부호화 처리에 대하여 설명하는 흐름도이다.
도 6은 복호 장치의 구성예를 도시하는 도면이다.
도 7은 부호화 처리에 대하여 설명하는 흐름도이다.
도 8은 부호화 처리에 대하여 설명하는 흐름도이다.
도 9는 부호화 처리에 대하여 설명하는 흐름도이다.
도 10은 부호화 처리에 대하여 설명하는 흐름도이다.
도 11은 부호화 처리에 대하여 설명하는 흐름도이다.
도 12는 부호화 장치의 다른 구성예를 도시하는 도면이다.
도 13은 부호화 처리에 대하여 설명하는 흐름도이다.
도 14는 컴퓨터의 구성예를 도시하는 도면이다.
이하, 도면을 참조하여, 본 기술을 적용한 실시 형태에 대하여 설명한다.
<본 기술의 개요>
[입력 신호의 부호화에 대해서]
본 기술은, 예를 들어 음악 신호 등의 음성 신호를 입력 신호로 해서, 입력 신호의 부호화를 행하는 것이다.
입력 신호의 부호화를 행하는 부호화 장치에서는, 부호화 시에 있어서 도 1에 도시한 바와 같이, 입력 신호는 소정의 대역 폭의 복수의 주파수 대역(이하, 서브 밴드라고 함)의 서브 밴드 신호로 분할된다. 또한, 도 1에서, 종축은 입력 신호의 각 주파수의 파워를 나타내고 있고, 횡축은 입력 신호의 각 주파수를 나타내고 있다. 또한, 곡선(C11)은 입력 신호의 각 주파수 성분의 파워를 나타내고 있고, 도면 중, 세로 방향의 점선은 각 서브 밴드의 경계 위치를 나타내고 있다.
입력 신호가 각 서브 밴드의 서브 밴드 신호로 분할되면, 입력 신호의 주파수 성분 중, 미리 정해진 주파수 이하의 저역측의 성분이, 소정의 부호화 방식에 의해 부호화되어, 저역 부호화 데이터가 생성된다.
도 1의 예에서는, 각 서브 밴드를 특정하는 인덱스가 sb인 서브 밴드 sb의 상한의 주파수 이하의 주파수의 서브 밴드가 입력 신호의 저역 성분으로 되어 있고, 서브 밴드 sb의 상한의 주파수보다 높은 주파수의 서브 밴드가 입력 신호의 고역 성분으로 되어 있다.
저역 부호화 데이터가 얻어지면, 다음으로 입력 신호의 저역 성분과 고역 성분에 기초하여, 고역 성분의 각 서브 밴드의 서브 밴드 신호를 재현하기 위한 정보가 생성되고, 그 정보가, 적절히, 소정의 부호화 방식에 의해 부호화되어서 고역 부호화 데이터가 생성된다.
구체적으로는, 주파수 방향으로 연속해서 배열하는 저역측의 가장 주파수가 높은 4개의 서브 밴드 sb-3 내지 서브 밴드 sb의 성분과, 고역측의 연속해서 배열하는 (eb-(sb+1)+1)개의 서브 밴드 sb+1 내지 서브 밴드 eb의 성분으로부터, 고역 부호화 데이터가 생성된다.
여기서, 서브 밴드 sb+1은 서브 밴드 sb에 인접하는, 가장 저역측에 위치하는 고역의 서브 밴드이며, 서브 밴드 eb는, 연속해서 배열하는 서브 밴드 sb+1 내지 서브 밴드 eb 중 가장 주파수가 높은 서브 밴드이다.
고역 성분의 부호화로 얻어지는 고역 부호화 데이터는, 고역측의 서브 밴드 ib(단, sb+1≤ib≤eb)의 서브 밴드 신호를 추정에 의해 생성하기 위한 정보이며, 고역 부호화 데이터에는, 각 서브 밴드 신호의 추정에 사용되는 추정 계수를 얻기 위한 계수 인덱스가 포함되어 있다.
즉, 서브 밴드 ib의 서브 밴드 신호의 추정에는, 저역측의 각 서브 밴드 kb(단, sb-3≤kb≤sb)의 서브 밴드 신호의 파워에 승산되는 계수 Aib(kb)와, 상수항인 계수 Bib를 포함하는 추정 계수가 사용된다. 고역 부호화 데이터에 포함되는 계수 인덱스는, 각 서브 밴드 ib의 계수 Aib(kb)와 계수 Bib를 포함하는 추정 계수의 세트를 얻기 위한 정보, 예를 들어 추정 계수의 세트를 특정하는 정보이다.
이상과 같이 하여 저역 부호화 데이터와 고역 부호화 데이터가 얻어지면, 그것들의 저역 부호화 데이터와 고역 부호화 데이터가 다중화되어서 출력 부호열로 되어 출력된다.
이렇게 고역 부호화 데이터에, 추정 계수를 얻기 위한 계수 인덱스를 포함시킴으로써, 프레임마다 고역 성분을 산출하기 위한 스케일 팩터나 진폭 조정 계수 등을 포함하는 경우에 비해, 고역 부호화 데이터의 부호량을 대폭 삭감할 수 있다.
또한, 출력 부호열의 공급을 받은 복호 장치는, 저역 부호화 데이터를 복호하여 저역측의 각 서브 밴드의 서브 밴드 신호를 포함하는 복호 저역 신호를 얻음과 함께, 복호 저역 신호와, 고역 부호화 데이터를 복호하여 얻어진 정보로부터 고역측의 각 서브 밴드의 서브 밴드 신호를 추정에 의해 생성한다. 그리고, 복호 장치는, 추정에 의해 얻어진 고역측의 각 서브 밴드의 서브 밴드 신호를 포함하는 복호 고역 신호와, 복호 저역 신호로부터 출력 신호를 생성한다. 이와 같이 하여 얻어진 출력 신호는, 부호화된 입력 신호를 복호함으로써 얻어진 신호이다.
[출력 부호열에 대해서]
그런데, 입력 신호의 부호화에서는 입력 신호의 소정의 시간 길이의 구간마다, 즉 프레임마다, 미리 준비된 복수의 추정 계수 중에서, 처리 대상으로 되어 있는 프레임에 대하여 적절한 추정 계수가 선택된다.
부호화 장치에서는, 각 프레임의 계수 인덱스를 그대로 고역 부호화 데이터에 포함하는 것이 아니라, 시간 방향에 있어서 계수 인덱스가 변화하는 시간의 정보와, 변화한 계수 인덱스의 값을 고역 부호화 데이터에 포함함으로써 더욱 부호량의 삭감이 도모되고 있다.
특히, 입력 신호가, 각 주파수 성분의 시간 방향으로의 변동이 적은 정상 신호일 경우에는, 선택된 추정 계수, 즉 계수 인덱스는 시간 방향으로 동일한 것이 연속해서 이어지는 경우가 많다. 따라서, 고역 부호화 데이터에 포함되는 계수 인덱스의 시간 방향의 정보량을 삭감하기 위해서, 적절히, 가변 길이 방식과 고정 길이 방식이 전환되면서, 입력 신호의 고역 성분의 부호화가 행하여진다.
[가변 길이 방식에 대해서]
이하, 가변 길이 방식과 고정 길이 방식에 의한 고역 성분의 부호화에 대하여 설명한다.
고역 성분의 부호화 시에는, 미리 정해진 소정의 프레임 길이의 구간마다, 가변 길이 방식과 고정 길이 방식의 전환이 행하여진다. 예를 들어, 이하에서는 16 프레임마다 가변 길이 방식과 고정 길이 방식의 전환이 행하여지는 것으로서 설명을 계속하기로 하고, 입력 신호의 16 프레임분의 구간을 처리 대상 구간이라고도 칭하기로 한다. 즉, 부호화 장치에서는, 처리 대상 구간인 16 프레임을 단위로 해서 출력 부호열이 출력된다.
우선, 가변 길이 방식에 대하여 설명한다. 가변 길이 방식에 의한 고역 성분의 부호화에서는, 방식 플래그, 계수 인덱스, 구간 정보 및 개수 정보를 포함하는 데이터가 부호화되어, 고역 부호화 데이터가 된다.
또한, 방식 플래그는, 고역 부호화 데이터를 생성하는 방식을 나타내는 정보, 즉 고역 성분의 부호화시에 가변 길이 방식과 고정 길이 방식 중 어느 방식이 선택되었는지를 나타내는 정보이다.
또한, 구간 정보란, 처리 대상 구간에 포함되는 연속하는 프레임을 포함하는 구간이며, 동일한 계수 인덱스가 선택된 프레임을 포함하는 구간(이하, 연속 프레임 구간이라고도 함)의 길이를 나타내는 정보이다. 또한, 개수 정보란, 처리 대상 구간에 포함되는 연속 프레임 구간의 개수를 나타내는 정보이다.
예를 들어, 가변 길이 방식에서는 도 2에 도시한 바와 같이 위치 FST1부터 위치 FSE1까지의 사이에 포함되는 16 프레임의 구간이 하나의 처리 대상 구간으로 된다. 또한, 도 2에서, 도면 중, 가로 방향은 시간을 나타내고 있고, 하나의 사각형은 하나의 프레임을 나타내고 있다. 또한, 프레임을 나타내는 사각형 내의 수치는, 그 프레임에 대하여 선택된 추정 계수를 특정하는 계수 인덱스의 값을 나타내고 있다.
가변 길이 방식에 의한 고역 성분의 부호화에서는, 우선, 처리 대상 구간이, 동일한 계수 인덱스가 선택되는, 연속하는 프레임을 포함하는 연속 프레임 구간으로 분할된다. 즉, 서로 다른 계수 인덱스가 선택되는, 서로 인접하는 프레임의 경계 위치가, 각 연속 프레임 구간의 경계 위치로 된다.
이 예에서는, 처리 대상 구간은, 위치 FST1부터 위치 FC1의 구간, 위치 FC1부터 위치 FC2의 구간 및 위치 FC2부터 위치 FSE1의 구간의 3개의 구간으로 분할된다. 예를 들어, 위치 FST1부터 위치 FC1까지의 연속 프레임 구간에서는, 각 프레임에 있어서, 동일한 계수 인덱스 「2」가 선택되어 있다.
이와 같이 하여 처리 대상 구간이 연속 프레임 구간으로 분할되면, 처리 대상 구간 내의 연속 프레임 구간수를 나타내는 개수 정보, 각 연속 프레임 구간에서 선택된 계수 인덱스, 각 연속 프레임 구간의 길이를 나타내는 구간 정보 및 방식 플래그를 포함하는 데이터가 생성된다.
여기에서는, 처리 대상 구간은 3개의 연속 프레임 구간으로 분할되어 있으므로, 연속 프레임 구간수 「3」을 나타내는 정보가 개수 정보가 된다. 도 2에서는 개수 정보가 「num_length=3」으로 표현되어 있다.
또한, 예를 들어 처리 대상 구간 내의 최초의 연속 프레임 구간의 구간 정보는, 그 연속 프레임 구간의 프레임을 단위로 하는 길이 「5」가 되고, 도 2에서는 「length0=5」로 표현되어 있다. 또한, 각 구간 정보는, 처리 대상 구간의 선두로부터 몇 번째에 있는 연속 프레임 구간의 구간 정보인지를 특정할 수 있도록 되어 있다. 바꾸어 말하면, 구간 정보에는, 처리 대상 구간 내에서의 연속 프레임 구간의 위치를 특정하기 위한 정보도 포함되어 있다.
이와 같이 하여, 처리 대상 구간에 대하여 개수 정보, 계수 인덱스, 구간 정보 및 방식 플래그를 포함하는 데이터가 생성되면, 이 데이터가 부호화되어서 고역 부호화 데이터가 된다. 이 경우, 복수 프레임에서 연속하여 동일한 계수 인덱스가 선택될 때에는, 프레임마다 계수 인덱스를 송신할 필요가 없어지므로, 전송하는 출력 부호열의 데이터량을 삭감하여, 보다 효율적으로 부호화, 복호를 행할 수 있다.
[고정 길이 방식에 대해서]
이어서, 고정 길이 방식에 의한 고역 성분의 부호화에 대하여 설명한다.
고정 길이 방식에서는 도 3에 도시한 바와 같이, 16 프레임을 포함하는 처리 대상 구간이, 소정의 프레임수를 포함하는 구간(이하, 고정 길이 구간이라고 함)으로 등분할된다. 또한, 도 3에서, 가로 방향은 시간을 나타내고 있고, 하나의 사각형은 하나의 프레임을 나타내고 있다. 또한, 프레임을 나타내는 사각형 내의 수치는, 그 프레임에 대하여 선택된 추정 계수를 특정하는 계수 인덱스의 값을 나타내고 있다. 또한, 도 3에서, 도 2에서의 경우와 대응하는 부분에는 동일한 부호를 부여하고 있으며, 그 설명은 적절히 생략한다.
고정 길이 방식에서는, 처리 대상 구간이 몇 개의 고정 길이 구간으로 분할된다. 이때, 고정 길이 구간의 길이는, 고정 길이 구간 내의 각 프레임에서 선택되어 있는 계수 인덱스가 동일하고, 또한 고정 길이 구간의 길이가 가장 길어지도록 정해진다.
도 3의 예에서는, 고정 길이 구간의 길이(이하, 간단히 고정 길이라고도 함)는, 4 프레임으로 되어 있고, 처리 대상 구간은 4개의 고정 길이 구간으로 등분되어 있다. 즉, 처리 대상 구간은, 위치 FST1부터 위치 FC21까지의 구간, 위치 FC21부터 위치 FC22까지의 구간, 위치 FC22부터 위치 FC23까지의 구간 및 위치 FC23부터 위치 FSE1까지의 구간으로 분할된다. 이들 고정 길이 구간에서의 계수 인덱스는, 처리 대상 구간의 선두의 고정 길이 구간부터 순서대로, 계수 인덱스 「1」, 「2」, 「2」, 「3」으로 되어 있다.
이와 같이 하여, 처리 대상 구간이 몇 개의 고정 길이 구간으로 분할되면, 처리 대상 구간 내의 고정 길이 구간의 고정 길이를 나타내는 고정 길이 인덱스, 계수 인덱스, 전환 플래그 및 방식 플래그를 포함하는 데이터가 생성된다.
여기서, 전환 플래그란, 고정 길이 구간의 경계 위치, 즉 소정의 고정 길이 구간의 마지막 프레임과, 그 고정 길이 구간의 다음의 고정 길이 구간의 선두의 프레임에서, 계수 인덱스가 변화했는지 여부를 나타내는 정보이다. 예를 들어, i번째(i=0, 1, 2, …)의 전환 플래그 gridflg_i는, 처리 대상 구간의 선두에서부터 (i+1)번째와 (i+2)번째의 고정 길이 구간의 경계 위치에 있어서, 계수 인덱스가 변화한 경우 「1」이 되고, 변화하지 않은 경우 「0」이 된다.
도 3의 예에서는, 처리 대상 구간의 1번째의 고정 길이 구간의 경계 위치(위치 FC21)의 전환 플래그 gridflg_0은, 1번째의 고정 길이 구간의 계수 인덱스 「1」과, 2번째의 고정 길이 구간의 계수 인덱스 「2」가 서로 다르기 때문에 「1」로 되어 있다. 또한, 위치 FC22의 전환 플래그 gridflg_1은, 2번째의 고정 길이 구간의 계수 인덱스 「2」와, 3번째의 고정 길이 구간의 계수 인덱스 「2」가 동일하기 때문에 「0」으로 되어 있다.
또한, 고정 길이 인덱스의 값은, 고정 길이로부터 구해지는 값 등으로 된다. 구체적으로는, 예를 들어 고정 길이 인덱스 length_id는, 고정 길이 fixed_length=16/2length_id를 만족하는 값이 된다. 도 3의 예에서는, 고정 길이 fixed_length=4이므로, 고정 길이 인덱스 length_id=2로 되어 있다.
처리 대상 구간이 고정 길이 구간으로 분할되고, 고정 길이 인덱스, 계수 인덱스, 전환 플래그 및 방식 플래그를 포함하는 데이터가 생성되면, 이 데이터가 부호화되어서 고역 부호화 데이터가 된다.
도 3의 예에서는, 위치 FC21 내지 위치 FC23에서의 전환 플래그 gridflg_0=1, gridflg_1=0 및 gridflg_2=1과, 고정 길이 인덱스 length_id=2, 각 고정 길이 구간의 계수 인덱스 「1」, 「2」, 「3」 및 고정 길이 방식인 취지의 방식 플래그를 포함하는 데이터가 부호화되어, 고역 부호화 데이터가 된다.
여기서, 각 고정 길이 구간의 경계 위치의 전환 플래그는, 처리 대상 구간의 선두에서부터 몇 번째에 있는 경계 위치의 전환 플래그인지를 특정할 수 있도록 되어 있다. 바꾸어 말하면, 전환 플래그에는, 처리 대상 구간 내에서의 고정 길이 구간의 경계 위치를 특정하기 위한 정보도 포함되어 있다.
또한, 고역 부호화 데이터에 포함되는 각 계수 인덱스는, 그것들의 계수 인덱스가 선택된 순서, 즉 고정 길이 구간이 배열되는 순서대로 배열되어 있다. 예를 들어, 도 3의 예에서는, 계수 인덱스 「1」, 「2」, 「3」의 순서대로 배열되고, 그것들의 계수 인덱스가 데이터에 포함된다.
또한, 도 3의 예에서는, 처리 대상 구간의 선두에서부터 2번째와 3번째의 고정 길이 구간의 계수 인덱스가 「2」인데, 고역 부호화 데이터에는, 계수 인덱스 「2」가 하나만 포함되게 된다. 연속하는 고정 길이 구간의 계수 인덱스가 동일한 경우, 즉 연속하는 고정 길이 구간의 경계 위치에서의 전환 플래그가 0인 경우에는, 그것들의 고정 길이 구간의 수만큼 동일한 계수 인덱스가 고역 부호화 데이터에 포함되는 것이 아니라, 1개의 계수 인덱스가 고역 부호화 데이터에 포함되게 된다.
이와 같이, 고정 길이 인덱스, 계수 인덱스, 전환 플래그 및 방식 플래그를 포함하는 데이터로부터 고역 부호화 데이터를 생성하면, 프레임마다 계수 인덱스를 송신할 필요가 없어지므로, 전송하는 출력 부호열의 데이터량을 삭감할 수 있다. 이에 의해, 보다 효율적으로 부호화, 복호를 행할 수 있다.
[연속 프레임 구간수에 대해서]
또한, 입력 신호의 부호화 시에 있어서는, 입력 신호의 각 서브 밴드의 서브 밴드 신호에 기초하여, 처리 대상 구간을 구성하는 연속 프레임 구간의 최적의 수가 정해지고, 정해진 연속 프레임 구간수에 기초하여 각 프레임의 계수 인덱스(추정 계수)가 선택된다. 예를 들어 처리 대상 구간을 구성하는 최적의 연속 프레임 구간수는, 고역측의 서브 밴드의 서브 밴드 파워로부터 정해지는 특징량(이하, 구간수 결정 특징량이라고도 함)에 기초하여 정해진다.
이와 같이, 처리 대상 구간을 구성하는 연속 프레임 구간의 수를, 고역의 특징을 나타내는 구간수 결정 특징량에 기초하여 정함으로써, 프레임마다 선택되는 계수 인덱스가, 시간 방향으로 필요 이상으로 변화하는 것을 방지할 수 있다.
이에 의해, 처리 대상 구간의 고역 부호화 데이터에 포함되는 계수 인덱스의 수 등을 필요 최소한으로 억제할 수 있어, 고역 부호화 데이터의 부호량을 보다 적게 할 수 있다.
또한, 추정 계수에 의해 고역 성분의 추정 오차 등의 특성이 상이하기 때문에, 계수 인덱스의 시간 방향의 변동이 필요 이상으로 많으면, 복호로 얻어지는 음성 신호에는, 복호 전의 입력 신호에는 없는 부자연스러운 주파수 포락의 시간 변동이 발생하여, 청감상, 음질이 열화되어버린다. 이러한 음질의 열화는, 고역 성분의 시간 변동이 적은 정상적인 음성 신호일수록 현저하다.
그러나, 처리 대상 구간을 구성하는 연속 프레임 구간수를 적절하게 정하고나서 각 프레임의 계수 인덱스를 선택하면, 계수 인덱스가 필요 이상으로 변동하는 것을 방지할 수 있다. 이에 의해, 복호로 얻어지는 음성의 고역 성분의 부자연스러운 시간 변동을 억제하여, 음질을 향상시킬 수 있다.
<제1 실시 형태>
[부호화 장치의 구성예]
이어서, 이상에서 설명한 입력 신호의 부호화 기술의 구체적인 실시 형태에 대하여 설명한다. 우선, 입력 신호의 부호화를 행하는 부호화 장치의 구성에 대하여 설명한다. 도 4는, 부호화 장치의 구성예를 도시하는 도면이다.
부호화 장치(11)는, 저역 통과 필터(31), 저역 부호화 회로(32), 서브 밴드 분할 회로(33), 특징량 산출 회로(34), 의사 고역 서브 밴드 파워 산출 회로(35), 구간수 결정 특징량 산출 회로(36), 의사 고역 서브 밴드 파워 차분 산출 회로(37), 고역 부호화 회로(38) 및 다중화 회로(39)로 구성된다. 부호화 장치(11)에서는, 부호화 대상의 입력 신호가 저역 통과 필터(31) 및 서브 밴드 분할 회로(33)에 공급된다.
저역 통과 필터(31)는, 공급된 입력 신호를 소정의 차단 주파수로 필터링하고, 그 결과 얻어진, 차단 주파수보다 저역의 신호(이하, 저역 신호라고 함)를 저역 부호화 회로(32) 및 서브 밴드 분할 회로(33)에 공급한다.
저역 부호화 회로(32)는, 저역 통과 필터(31)로부터의 저역 신호를 부호화하고, 그 결과 얻어진 저역 부호화 데이터를 다중화 회로(39)에 공급한다.
서브 밴드 분할 회로(33)는, 저역 통과 필터(31)로부터의 저역 신호를 복수의 서브 밴드의 서브 밴드 신호(이하, 저역 서브 밴드 신호라고도 함)로 등분할하고, 이에 의해 얻어진 저역 서브 밴드 신호를 특징량 산출 회로(34) 및 구간수 결정 특징량 산출 회로(36)에 공급한다. 저역 서브 밴드 신호는, 입력 신호의 저역측의 각 서브 밴드의 신호이다.
또한, 서브 밴드 분할 회로(33)는, 공급된 입력 신호를 복수의 서브 밴드의 서브 밴드 신호로 등분할하고, 이에 의해 얻어진 서브 밴드 신호 중, 고역측의 소정의 대역에 포함되는 각 서브 밴드의 서브 밴드 신호를, 구간수 결정 특징량 산출 회로(36) 및 의사 고역 서브 밴드 파워 차분 산출 회로(37)에 공급한다. 또한, 이하, 서브 밴드 분할 회로(33)로부터 구간수 결정 특징량 산출 회로(36) 및 의사 고역 서브 밴드 파워 차분 산출 회로(37)에 공급되는 각 서브 밴드의 서브 밴드 신호를, 고역 서브 밴드 신호라고도 한다.
특징량 산출 회로(34)는, 서브 밴드 분할 회로(33)로부터의 저역 서브 밴드 신호에 기초하여 특징량을 산출하고, 의사 고역 서브 밴드 파워 산출 회로(35)에 공급한다.
의사 고역 서브 밴드 파워 산출 회로(35)는, 특징량 산출 회로(34)로부터의 특징량에 기초하여, 고역 서브 밴드 신호의 파워의 추정값(이하, 의사 고역 서브 밴드 파워라고도 함)을 산출하고, 의사 고역 서브 밴드 파워 차분 산출 회로(37)에 공급한다. 또한, 의사 고역 서브 밴드 파워 산출 회로(35)에는, 통계 학습에 의해 얻어진 추정 계수의 세트가 복수 기록되어 있고, 의사 고역 서브 밴드 파워는, 추정 계수와 특징량에 기초하여 산출된다.
구간수 결정 특징량 산출 회로(36)는, 서브 밴드 분할 회로(33)로부터 공급된 저역 서브 밴드 신호 및 고역 서브 밴드 신호에 기초하여, 구간수 결정 특징량을 산출하고, 의사 고역 서브 밴드 파워 차분 산출 회로(37)에 공급한다.
의사 고역 서브 밴드 파워 차분 산출 회로(37)는, 각 프레임에 대해서, 그 프레임의 고역 성분을 추정하기에 적합한 추정 계수를 나타내는 계수 인덱스를 선택한다. 의사 고역 서브 밴드 파워 차분 산출 회로(37)는, 결정부(51), 평가값 합 산출부(52), 선택부(53) 및 생성부(54)를 구비하고 있다.
결정부(51)는, 구간수 결정 특징량 산출 회로(36)로부터 공급된 구간수 결정 특징량에 기초하여, 처리 대상 구간을 구성하는 연속 프레임 구간의 수를 결정한다.
의사 고역 서브 밴드 파워 차분 산출 회로(37)는, 서브 밴드 분할 회로(33)로부터의 고역 서브 밴드 신호의 파워(이하, 고역 서브 밴드 파워라고도 함)와, 의사 고역 서브 밴드 파워 산출 회로(35)로부터의 의사 고역 서브 밴드 파워에 기초하여, 각 프레임에 대해 추정 계수마다 평가값을 산출한다. 이 평가값은, 입력 신호의 실제의 고역 성분과, 추정 계수를 사용하여 추정된 고역 성분의 오차를 나타내는 값이다.
평가값 합 산출부(52)는, 결정부(51)에 의해 결정된 연속 프레임 구간수와, 각 프레임의 평가값에 기초하여, 연속하는 프레임의 평가값의 합을 산출한다. 선택부(53)는, 평가값 합 산출부(52)에 의해 산출된 평가값의 합에 기초하여 각 프레임의 계수 인덱스를 선택한다.
생성부(54)는, 입력 신호의 처리 대상 구간의 각 프레임에서의 계수 인덱스의 선택 결과에 기초하여, 가변 길이 방식 또는 고정 길이 방식의 전환을 행하고, 선택된 방식으로 고역 부호화 데이터를 얻기 위한 데이터를 생성하여, 고역 부호화 회로(38)에 공급한다.
고역 부호화 회로(38)는, 의사 고역 서브 밴드 파워 차분 산출 회로(37)로부터 공급된 데이터를 부호화하고, 그 결과 얻어지는 고역 부호화 데이터를 다중화 회로(39)에 공급한다. 다중화 회로(39)는, 저역 부호화 회로(32)로부터의 저역 부호화 데이터와, 고역 부호화 회로(38)로부터의 고역 부호화 데이터를 다중화하여, 출력 부호열로서 출력한다.
[부호화 처리의 설명]
도 4에 도시한 부호화 장치(11)는, 입력 신호가 공급되어, 입력 신호의 부호화가 지시되면 부호화 처리를 행하고, 복호 장치에 출력 부호열을 출력한다. 이하, 도 5의 흐름도를 참조하여, 부호화 장치(11)에 의한 부호화 처리에 대해 설명한다. 또한, 이 부호화 처리는, 미리 정해진 프레임수, 즉 처리 대상 구간마다 행하여진다.
스텝 S11에서, 저역 통과 필터(31)는, 공급된 처리 대상의 프레임의 입력 신호를 저역 통과 필터에 의해 소정의 차단 주파수로 필터링하고, 그 결과 얻어진 저역 신호를 저역 부호화 회로(32) 및 서브 밴드 분할 회로(33)에 공급한다.
스텝 S12에서, 저역 부호화 회로(32)는, 저역 통과 필터(31)로부터 공급된 저역 신호를 부호화하고, 그 결과 얻어진 저역 부호화 데이터를 다중화 회로(39)에 공급한다.
스텝 S13에서, 서브 밴드 분할 회로(33)는, 입력 신호 및 저역 신호를 소정의 대역 폭의 복수의 서브 밴드 신호로 등분할한다.
즉, 서브 밴드 분할 회로(33)는, 입력 신호를 각 서브 밴드의 서브 밴드 신호로 분할하고, 이에 의해 얻어진 고역측의 서브 밴드 sb+1 내지 서브 밴드 eb의 각 서브 밴드 신호를, 구간수 결정 특징량 산출 회로(36) 및 의사 고역 서브 밴드 파워 차분 산출 회로(37)에 공급한다.
또한, 서브 밴드 분할 회로(33)는, 저역 통과 필터(31)로부터의 저역 신호를 각 서브 밴드의 서브 밴드 신호로 분할하고, 이에 의해 얻어진 저역측의 서브 밴드 sb-3 내지 서브 밴드 sb의 각 서브 밴드 신호를, 특징량 산출 회로(34) 및 구간수 결정 특징량 산출 회로(36)에 공급한다.
스텝 S14에서, 구간수 결정 특징량 산출 회로(36)는, 서브 밴드 분할 회로(33)로부터 공급된 저역 서브 밴드 신호 및 고역 서브 밴드 신호 중 적어도 어느 하나에 기초하여 구간수 결정 특징량을 산출하고, 의사 고역 서브 밴드 파워 차분 산출 회로(37)에 공급한다.
예를 들어, 구간수 결정 특징량 산출 회로(36)는, 다음 식 (1)을 계산함으로써, 처리 대상의 프레임 J의 추정 대역, 즉 고역측의 각 서브 밴드의 서브 밴드 신호의 파워의 합인 서브 밴드 파워 합 powerhigh(J)를 산출한다.
Figure pct00001
또한, 식 (1)에서, powerlin(ib, J)는 프레임 J의 서브 밴드 ib(단, sb+1≤ib≤eb)의 서브 밴드 신호의 각 샘플의 샘플 값의 제곱 평균값을 나타내고 있다. 따라서, 서브 밴드 파워 합 powerhigh(J)는 고역측의 각 서브 밴드에 대하여 구한 제곱 평균값 powerlin(ib, J)의 합을 대수화함으로써 얻어진다.
이와 같이 하여 얻어지는 서브 밴드 파워 합 powerhigh(J)는, 입력 신호의 고역측의 각 서브 밴드의 고역 서브 밴드 파워의 합을 나타내고 있고, 각 서브 밴드의 파워의 합이 클수록 서브 밴드 파워 합 powerhigh(J)의 값도 커진다. 즉, 입력 신호의 고역 성분의 파워가 전체적으로 클수록, 서브 밴드 파워 합 powerhigh(J)도 커진다.
스텝 S15에서, 특징량 산출 회로(34)는, 서브 밴드 분할 회로(33)로부터 공급된 저역 서브 밴드 신호에 기초하여 특징량을 산출하고, 의사 고역 서브 밴드 파워 산출 회로(35)에 공급한다.
예를 들어, 특징량으로서 각 저역 서브 밴드 신호의 파워가 산출된다. 또한, 이하, 저역 서브 밴드 신호의 파워를 특히 저역 서브 밴드 파워라고도 하기로 한다. 또한, 저역 서브 밴드 신호나 고역 서브 밴드 신호 등, 각 서브 밴드 신호의 파워를, 적절히, 서브 밴드 파워라고도 칭하기로 한다.
구체적으로는, 특징량 산출 회로(34)는, 다음 식 (2)를 계산함으로써, 데시벨로 표현되는 처리 대상의 프레임 J의 서브 밴드 ib(단, sb-3≤ib≤sb)의 서브 밴드 파워 power(ib, J)를 산출한다.
Figure pct00002
또한, 식 (2)에서 x(ib, n)는 서브 밴드 ib의 서브 밴드 신호의 값(샘플의 샘플 값)을 나타내고 있고, x(ib, n)에서의 n은, 이산 시간의 인덱스를 나타내고 있다. 또한, 식 (2)에서의 FSIZE는, 1 프레임을 구성하는 서브 밴드 신호의 샘플수를 나타내고 있다.
따라서, 프레임 J의 저역 서브 밴드 파워 power(ib, J)는, 프레임 J를 구성하는 저역 서브 밴드 신호의 각 샘플의 샘플 값의 제곱 평균값을 대수화함으로써 산출된다. 또한, 이하에서는, 특징량 산출 회로(34)에 있어서, 특징량으로서 저역 서브 밴드 파워가 산출되는 것으로서 설명을 계속한다.
스텝 S16에서, 의사 고역 서브 밴드 파워 산출 회로(35)는, 미리 기록하고 있는 추정 계수마다, 특징량 산출 회로(34)로부터 공급된 특징량으로서의 저역 서브 밴드 파워와, 기록하고 있는 추정 계수에 기초하여 의사 고역 서브 밴드 파워를 산출한다.
예를 들어, 계수 인덱스가 1 내지 K(단, 2≤K)인 K개의 추정 계수의 세트가 미리 준비되어 있을 경우, K개의 추정 계수의 세트에 대해서, 각 서브 밴드의 의사 고역 서브 밴드 파워가 산출된다.
구체적으로는, 의사 고역 서브 밴드 파워 산출 회로(35)는, 다음 식 (3)을 계산하여, 처리 대상의 프레임 J의 고역측의 각 서브 밴드의 의사 고역 서브 밴드 파워 powerest(ib, J)(단, sb+1≤ib≤eb)를 산출한다.
Figure pct00003
또한, 식 (3)에서, 계수 Aib(kb) 및 계수 Bib는, 고역측의 서브 밴드 ib에 대하여 준비된 추정 계수의 세트를 나타내고 있다. 즉, 계수 Aib(kb)는 서브 밴드 kb(단, sb-3≤kb≤sb)의 저역 서브 밴드 파워 power(kb, J)에 승산되는 계수이며, 계수 Bib는, 저역 서브 밴드 파워를 선형 결합할 때에 사용되는 상수항이다.
따라서, 고역측의 서브 밴드 ib의 의사 고역 서브 밴드 파워 powerest(ib, J)는, 저역측의 각 서브 밴드의 저역 서브 밴드 파워에, 서브 밴드마다의 계수 Aib(kb)를 승산하고, 계수가 승산된 저역 서브 밴드 파워의 합에, 또한 계수 Bib를 가산함으로써 얻어진다.
의사 고역 서브 밴드 파워 산출 회로(35)는, 추정 계수의 세트마다 고역의 각 서브 밴드의 의사 고역 서브 밴드 파워를 산출하면, 산출한 의사 고역 서브 밴드 파워를 의사 고역 서브 밴드 파워 차분 산출 회로(37)에 공급한다.
스텝 S17에서, 의사 고역 서브 밴드 파워 차분 산출 회로(37)는, 계수 인덱스 id로 특정되는 추정 계수의 세트 모두에 대해서, 처리 대상의 프레임 J를 사용한 평가값 Res(id, J)를 산출한다.
구체적으로는, 의사 고역 서브 밴드 파워 차분 산출 회로(37)는, 서브 밴드 분할 회로(33)로부터 공급된 각 서브 밴드의 고역 서브 밴드 신호를 사용하여, 상술한 식 (2)와 마찬가지의 연산을 행하고, 프레임 J에서의 고역 서브 밴드 파워 power(ib, J)를 산출한다.
고역 서브 밴드 파워 power(ib, J)가 얻어지면, 의사 고역 서브 밴드 파워 차분 산출 회로(37)는, 다음 식 (4)를 계산하여, 잔차 제곱 평균값 Resstd(id, J)를 산출한다.
Figure pct00004
즉, 고역측의 각 서브 밴드 ib(단, sb+1≤ib≤eb)에 대해서, 프레임 J의 고역 서브 밴드 파워 power(ib, J)와 의사 고역 서브 밴드 파워 powerest(ib, id, J)의 차분이 구해지고, 그것들의 차분의 제곱 평균값이 잔차 제곱 평균값 Resstd(id, J)가 된다.
또한, 의사 고역 서브 밴드 파워 powerest(ib, id, J)는 프레임 J에 있어서, 계수 인덱스가 id인 추정 계수에 대하여 구해진, 서브 밴드 ib의 의사 고역 서브 밴드 파워를 나타내고 있다.
계속해서, 의사 고역 서브 밴드 파워 차분 산출 회로(37)는, 다음 식 (5)를 계산하여, 잔차 최대값 Resmax(id, J)를 산출한다.
Figure pct00005
또한, 식 (5)에서, maxib{|power(ib, J)-powerest(ib, id, J)|}는, 각 서브 밴드 ib의 고역 서브 밴드 파워 power(ib, J)와 의사 고역 서브 밴드 파워 powerest(ib, id, J)의 차분의 절댓값 중 최대인 것을 나타내고 있다. 따라서, 프레임 J에서의 고역 서브 밴드 파워 power(ib, J)와 의사 고역 서브 밴드 파워 powerest(ib, id, J)의 차분의 절댓값의 최대값이 잔차 최대값 Resmax(id, J)가 된다.
또한, 의사 고역 서브 밴드 파워 차분 산출 회로(37)는, 다음 식 (6)을 계산하여, 잔차 평균값 Resave(id, J)를 산출한다.
Figure pct00006
즉, 고역측의 각 서브 밴드 ib에 대해서, 프레임 J의 고역 서브 밴드 파워 power(ib, J)와 의사 고역 서브 밴드 파워 powerest(ib, id, J)의 차분이 구해지고, 그것들의 차분의 총합이 구해진다. 그리고, 얻어진 차분의 총합을 고역측의 서브 밴드수(eb-sb)로 제산하여 얻어지는 값의 절댓값이 잔차 평균값 Resave(id, J)가 된다. 이 잔차 평균값 Resave(id, J)는, 부호가 고려된 각 서브 밴드의 추정 오차의 평균값의 크기를 나타내고 있다.
또한, 잔차 제곱 평균값 Resstd(id, J), 잔차 최대값 Resmax(id, J) 및 잔차 평균값 Resave(id, J)가 얻어지면, 의사 고역 서브 밴드 파워 차분 산출 회로(37)는, 다음 식 (7)을 계산하여, 최종적인 평가값 Res(id, J)를 산출한다.
Figure pct00007
즉, 잔차 제곱 평균값 Resstd(id, J), 잔차 최대값 Resmax(id, J) 및 잔차 평균값 Resave(id, J)가 가중치 부여 가산되어서, 최종적인 평가값 Res(id, J)가 된다. 또한, 식 (7)에서, Wstd, Wmax 및 Wave는, 미리 정해진 가중치이며, 예를 들어 Wstd=1, Wmax=0.5, Wave=0.5 등으로 되어 있다.
의사 고역 서브 밴드 파워 차분 산출 회로(37)는, 이상의 처리를 행하여, K개의 추정 계수마다, 즉 K개의 계수 인덱스 id마다, 평가값 Res(id, J)를 산출한다.
이와 같이 하여 얻어진 평가값 Res(id, J)는, 실제의 입력 신호로부터 산출된 고역 서브 밴드 파워와, 계수 인덱스가 id인 추정 계수를 사용하여 산출된 의사 고역 서브 밴드 파워의 유사한 정도를 나타내고 있다. 즉, 고역 성분의 추정 오차의 크기를 나타내고 있다.
따라서, 평가값 Res(id, J)가 작을수록, 추정 계수를 사용한 연산에 의해, 실제의 입력 신호의 고역 성분에 보다 가까운 신호가 얻어지게 된다.
스텝 S18에서, 의사 고역 서브 밴드 파워 차분 산출 회로(37)는, 소정 프레임 길이만큼 처리를 행했는지의 여부를 판정한다. 즉, 처리 대상 구간을 구성하는 모든 프레임에 대해서, 구간수 결정 특징량과 평가값이 산출되었는지의 여부가 판정된다.
스텝 S18에서, 소정 프레임 길이만큼 처리를 행하지 않았다고 판정된 경우, 처리는 스텝 S11로 복귀되고, 상술한 처리가 반복된다. 즉, 처리 대상 구간의 아직 처리 대상으로 되어 있지 않은 프레임이, 다음 처리 대상의 프레임으로 되어, 그 프레임의 구간수 결정 특징량과 평가값이 산출된다.
이에 반해 스텝 S18에서, 소정 프레임 길이만큼 처리를 행했다고 판정된 경우, 처리는 스텝 S19로 진행한다.
스텝 S19에서, 결정부(51)는, 구간수 결정 특징량 산출 회로(36)로부터 공급된, 처리 대상 구간을 구성하는 각 프레임의 구간수 결정 특징량에 기초하여, 처리 대상 구간을 구성하는 연속 프레임 구간수를 결정한다.
구체적으로는 결정부(51)는, 처리 대상 구간을 구성하는 각 프레임의 구간수 결정 특징량으로부터, 그것들의 구간수 결정 특징량의 대표값을 구한다. 예를 들어, 각 프레임의 구간수 결정 특징량 중 최대값, 즉 가장 큰 구간수 결정 특징량이 대표값으로 된다.
이어서, 결정부(51)는, 구한 대표값과 미리 정한 임계값을 비교함으로써, 연속 프레임 구간수를 결정한다. 예를 들어 연속 프레임 구간수는, 대표값이 100 이상인 경우, 16이 되고, 대표값이 80 이상 100 미만인 경우, 8이 되고, 대표값이 60 이상 80 미만인 경우, 4가 된다. 또한, 대표값이 40 이상 60 미만인 경우, 연속 프레임 구간수는 2가 되고, 대표값이 40 미만인 경우, 연속 프레임 구간수는 1이 된다.
연속 프레임 구간수의 결정시에 임계값 처리되는 구간수 결정 특징량(대표값)은, 고역 서브 밴드 파워의 합을 나타내고 있다. 입력 신호 등의 음성 신호에 있어서, 고역측의 서브 밴드 파워의 합이 큰 구간은, 서브 밴드 파워가 작은 구간과 비교하여 청감상, 고역 성분이 보다 잘 들리므로(확실하게 들리므로), 복호 시에는, 보다 원신호에 가까운 신호가 추정에 의해 얻어지도록 할 필요가 있다.
따라서, 결정부(51)는, 구간수 결정 특징량의 대표값이 큰 경우에는, 연속 프레임 구간수를 많게 하여, 복호측에 있어서 보다 고정밀도로 각 프레임의 고역 성분을 추정할 수 있도록 한다. 이에 의해, 복호에 의해 얻어지는 음성 신호의 명료도를 높일 수 있어, 청감상의 음질을 향상시킬 수 있다.
이에 반해, 대표값이 작은 경우에는, 고역 성분의 파워는 작으므로, 추정 계수에 의한 고역 성분의 추정 정밀도가 어느 정도 낮아도, 복호로 얻어지는 음성의 음질의 청감상의 열화는 지각되기 어려워진다. 그로 인해, 결정부(51)는, 대표값이 작은 경우에는, 연속 프레임 구간수를 적게 하여, 음질을 열화시키지 않고 고역 부호화 데이터의 부호량을 삭감한다.
스텝 S20에서, 평가값 합 산출부(52)는, 각 프레임에 대하여 계수 인덱스(추정 계수의 세트)마다 산출한 평가값을 사용하여, 연속 프레임 구간을 구성하는 프레임의 평가값의 합을 계수 인덱스마다 산출한다.
예를 들어, 스텝 S19에서 결정된 연속 프레임 구간수가 ndiv이며, 처리 대상 구간이 16 프레임으로 구성되는 것으로 한다. 그러한 경우, 예를 들어 평가값 합 산출부(52)는, 처리 대상 구간을 ndiv개의 구간으로 등분하여, 얻어진 각 구간을 연속 프레임 구간으로 한다. 이 경우, 각 연속 프레임 구간은, 16/ndiv개의 연속하는 프레임으로 구성되게 된다.
또한, 평가값 합 산출부(52)는, 다음 식 (8)을 계산하여, 계수 인덱스마다 각 연속 프레임 구간을 구성하는 프레임의 평가값의 합인 평가값 합 Ressum(id, igp)을 산출한다.
Figure pct00008
또한, 식 (8)에서, igp는 처리 대상 구간 내의 연속 프레임 구간을 식별하는 인덱스이며, Res(id, ifr)는 계수 인덱스 id에 대하여 구해진, 연속 프레임 구간을 구성하는 프레임 ifr의 평가값 Res(id, ifr)를 나타내고 있다.
따라서, 연속 프레임 구간의 계수 인덱스 id에 관한 평가값 합 Ressum(id, igp)는, 그 연속 프레임 구간을 구성하는, 동일한 계수 인덱스 id의 각 프레임의 평가값의 합을 계산함으로써 산출된다.
스텝 S21에서, 선택부(53)는, 각 연속 프레임 구간에 대하여 계수 인덱스마다 구해진 평가값 합에 기초하여, 각 프레임의 계수 인덱스를 선택한다.
각 프레임의 평가값 Res(id, J)는, 그 값이 작을수록 추정 계수를 사용한 연산에 의해, 실제의 고역 성분에 보다 가까운 신호가 얻어지기 때문에, 평가값 합 Ressum(id, igp)이 작은 계수 인덱스일수록, 그 계수 인덱스가 연속 프레임 구간에 적합한 것이라고 할 수 있다.
따라서, 선택부(53)는, 복수의 계수 인덱스 중, 연속 프레임 구간에 대하여 구한 평가값 합 Ressum(id, igp)이 최소가 되는 계수 인덱스를, 그 연속 프레임 구간을 구성하는 각 프레임의 계수 인덱스로서 선택한다. 따라서, 연속 프레임 구간에서는, 각 프레임에서 동일한 계수 인덱스가 선택되게 된다.
이와 같이 하여 선택부(53)는, 처리 대상 구간을 구성하는 연속 프레임 구간마다, 그 연속 프레임 구간을 구성하는 프레임의 계수 인덱스를 선택한다.
또한, 연속 프레임 구간마다 평가값 합에 기초하여 계수 인덱스를 선택하면, 경우에 따라서는, 서로 인접하는 연속 프레임 구간에서 동일한 계수 인덱스가 선택되는 경우도 있다. 그러한 경우, 부호화 장치(11)는, 동일한 계수 인덱스가 선택된 그것들이 연속해서 배열하는 연속 프레임 구간을, 1개의 연속 프레임 구간으로서 취급한다.
스텝 S22에서, 생성부(54)는, 고역 부호화 데이터를 생성하는 방식을, 고정 길이 방식으로 할 지의 여부를 판정한다.
즉, 생성부(54)는, 처리 대상 구간에서의 각 프레임의 계수 인덱스의 선택 결과에 기초하여, 고정 길이 방식에 의해 생성했을 때의 고역 부호화 데이터와, 가변 길이 방식에 의해 생성했을 때의 고역 부호화 데이터의 부호량을 비교한다. 그리고, 생성부(54)는, 고정 길이 방식의 고역 부호화 데이터의 부호량이, 가변 길이 방식의 고역 부호화 데이터의 부호량보다 적은 경우, 고정 길이 방식으로 한다고 판정한다.
스텝 S22에서, 고정 길이 방식으로 한다고 판정된 경우, 처리는 스텝 S23으로 진행한다. 스텝 S23에서, 생성부(54)는, 고정 길이 방식이 선택된 취지의 방식 플래그, 고정 길이 인덱스, 계수 인덱스 및 전환 플래그를 포함하는 데이터를 생성하여, 고역 부호화 회로(38)에 공급한다.
예를 들어, 도 3의 예에서는, 생성부(54)는, 고정 길이를 4 프레임으로 하고, 위치 FST1부터 위치 FSE1까지의 처리 대상 구간을, 4개의 고정 길이 구간으로 분할한다. 그리고, 생성부(54)는, 고정 길이 인덱스 「2」, 계수 인덱스 「1」, 「2」, 「3」, 전환 플래그 「1」, 「0」, 「1」 및 방식 플래그를 포함하는 데이터를 생성한다.
또한, 도 3에서는, 처리 대상 구간의 선두에서부터 2번째와 3번째의 고정 길이 구간의 계수 인덱스는 모두 「2」이지만, 이것들의 고정 길이 구간은 연속하여 나열되어 있기 때문에, 생성부(54)로부터 출력되는 데이터에는, 계수 인덱스 「2」가 하나만 포함되게 된다.
스텝 S24에서, 고역 부호화 회로(38)는, 생성부(54)로부터 공급된, 방식 플래그, 고정 길이 인덱스, 계수 인덱스 및 전환 플래그를 포함하는 데이터를 부호화하여, 고역 부호화 데이터를 생성한다.
예를 들어, 필요에 따라, 방식 플래그, 고정 길이 인덱스, 계수 인덱스 및 전환 플래그 중 일부 또는 전부의 정보에 대하여 엔트로피 부호화 등이 행하여진다. 또한, 방식 플래그나 고정 길이 인덱스 등을 포함하는 데이터가, 그대로 고역 부호화 데이터로 되어도 된다.
고역 부호화 회로(38)는, 생성한 고역 부호화 데이터를 다중화 회로(39)에 공급하고, 그 후, 처리는 스텝 S27로 진행한다.
이에 반해, 스텝 S22에서, 고정 길이 방식으로 하지 않는다고 판정된 경우, 즉 가변 길이 방식으로 한다고 판정된 경우, 처리는 스텝 S25로 진행한다. 스텝 S25에서, 생성부(54)는, 가변 길이 방식이 선택된 취지의 방식 플래그, 계수 인덱스, 구간 정보 및 개수 정보를 포함하는 데이터를 생성하여, 고역 부호화 회로(38)에 공급한다.
예를 들어, 도 2의 예에서는, 위치 FST1부터 위치 FSE1까지의 처리 대상 구간이, 3개의 연속 프레임 구간으로 분할되어 있다. 생성부(54)는, 가변 길이 방식이 선택된 취지의 방식 플래그 및 연속 프레임 구간의 개수 「3」을 나타내는 개수 정보 「num_length=3」과, 각 연속 프레임 구간의 길이를 나타내는 구간 정보 「length0=5」 및 「length1=7」, 및 그것들의 연속 프레임 구간의 계수 인덱스 「2」, 「5」 및 「1」을 포함하는 데이터를 생성한다.
또한, 각 연속 프레임 구간의 계수 인덱스는, 구간 정보와 대응지어져서, 어느 연속 프레임 구간의 계수 인덱스인지를 특정할 수 있게 된다. 또한, 도 2의 예에서는, 처리 대상 구간의 선두와, 그 다음의 연속 프레임 구간의 구간 정보로부터, 처리 대상 구간의 마지막 연속 프레임 구간을 구성하는 프레임 수가 특정 가능하므로, 마지막 연속 프레임 구간에 대해서는 구간 정보가 생성되어 있지 않다.
스텝 S26에서, 고역 부호화 회로(38)는, 생성부(54)로부터 공급된, 방식 플래그, 계수 인덱스, 구간 정보 및 개수 정보를 포함하는 데이터를 부호화하여, 고역 부호화 데이터를 생성한다.
예를 들어, 스텝 S26에서는, 방식 플래그, 계수 인덱스, 구간 정보 및 개수 정보 중 일부 또는 전부의 정보에 대하여 엔트로피 부호화 등이 행하여진다. 또한, 고역 부호화 데이터는, 추정 계수가 얻어지는 정보이면, 어떤 정보이어도 되고, 예를 들어 방식 플래그, 계수 인덱스, 구간 정보 및 개수 정보를 포함하는 데이터가 그대로 고역 부호화 데이터로 되어도 된다.
고역 부호화 회로(38)는, 생성한 고역 부호화 데이터를 다중화 회로(39)에 공급하고, 그 후, 처리는 스텝 S27로 진행한다.
스텝 S24 또는 스텝 S26에서, 고역 부호화 데이터가 생성되면, 스텝 S27에서, 다중화 회로(39)는, 저역 부호화 회로(32)로부터 공급된 저역 부호화 데이터와, 고역 부호화 회로(38)로부터 공급된 고역 부호화 데이터를 다중화한다. 그리고, 다중화 회로(39)는, 다중화에 의해 얻어진 출력 부호열을 출력하고, 부호화 처리는 종료된다.
이상과 같이 하여 부호화 장치(11)는, 입력 신호로부터 얻어진 서브 밴드 신호에 기초하여 구간수 결정 특징량을 산출하고, 구간수 결정 특징량으로부터 연속 프레임 구간수를 정함과 함께, 연속 프레임 구간마다 평가값 합을 산출하여, 각 프레임의 계수 인덱스를 선택한다. 그리고, 부호화 장치(11)는, 선택한 계수 인덱스를 포함하는 데이터를 부호화하여, 고역 부호화 데이터로 한다.
이와 같이, 계수 인덱스를 포함하는 데이터를 부호화하여, 고역 부호화 데이터로 함으로써, 스케일 팩터 등의 고역의 추정 연산에 사용되는 데이터 그 자체를 부호화하는 경우에 비해, 고역 부호화 데이터의 부호량을 보다 적게 할 수 있다.
또한, 구간수 결정 특징량에 기초하여 연속 프레임 구간수를 정함으로써, 시간 방향에 대해 필요 이상으로 계수 인덱스가 변동하는 것을 억제하고, 복호로 얻어지는 음성의 청감상의 음질을 향상시킴과 함께, 출력 부호열의 부호량을 삭감할 수 있다. 이에 의해, 입력 신호의 부호화 효율을 향상시킬 수 있다.
또한, 연속 프레임 구간마다 평가값 합을 산출하여 계수 인덱스를 선택함으로써, 연속 프레임 구간마다 보다 적합한 추정 계수의 계수 인덱스를 얻을 수 있다. 특히, 처리 대상 구간을 구성하는 각 연속 프레임 구간의 길이를 동등하게 함으로써, 연산량을 삭감하고, 보다 신속하게 계수 인덱스를 선택할 수 있다.
[복호 장치의 구성]
다음으로 부호화 장치(11)로부터 출력된 출력 부호열의 공급을 받아, 출력 부호열의 복호를 행하는 복호 장치에 대하여 설명한다.
그러한 복호 장치는, 예를 들어 도 6에 도시한 바와 같이 구성된다.
복호 장치(81)는, 비다중화 회로(91), 저역 복호 회로(92), 서브 밴드 분할 회로(93), 특징량 산출 회로(94), 고역 복호 회로(95), 복호 고역 서브 밴드 파워 산출 회로(96), 복호 고역 신호 생성 회로(97) 및 합성 회로(98)로 구성된다.
비다중화 회로(91)는, 부호화 장치(11)로부터 수신한 출력 부호열을 입력 부호열로 해서, 입력 부호열을 고역 부호화 데이터와 저역 부호화 데이터로 비다중화한다. 또한, 비다중화 회로(91)는, 비다중화에 의해 얻어진 저역 부호화 데이터를 저역 복호 회로(92)에 공급하고, 비다중화에 의해 얻어진 고역 부호화 데이터를 고역 복호 회로(95)에 공급한다.
저역 복호 회로(92)는, 비다중화 회로(91)로부터의 저역 부호화 데이터를 복호하고, 그 결과 얻어진 입력 신호의 복호 저역 신호를, 서브 밴드 분할 회로(93) 및 합성 회로(98)에 공급한다.
서브 밴드 분할 회로(93)는, 저역 복호 회로(92)로부터의 복호 저역 신호를, 소정의 대역 폭을 갖는 복수의 저역 서브 밴드 신호로 등분할하고, 얻어진 저역 서브 밴드 신호를 특징량 산출 회로(94) 및 복호 고역 신호 생성 회로(97)에 공급한다.
특징량 산출 회로(94)는, 서브 밴드 분할 회로(93)로부터의 저역 서브 밴드 신호에 기초하여, 저역측의 각 서브 밴드의 저역 서브 밴드 파워를 특징량으로서 산출하고, 복호 고역 서브 밴드 파워 산출 회로(96)에 공급한다.
고역 복호 회로(95)는, 비다중화 회로(91)로부터의 고역 부호화 데이터를 복호하고, 그 결과 얻어진 데이터와, 그 데이터에 포함되는 계수 인덱스에 의해 특정되는 추정 계수를 복호 고역 서브 밴드 파워 산출 회로(96)에 공급한다. 즉, 고역 복호 회로(95)에는 미리 복수의 계수 인덱스와, 그 계수 인덱스에 의해 특정되는 추정 계수가 대응지어져서 기록되어 있고, 고역 복호 회로(95)는, 고역 부호화 데이터에 포함되는 계수 인덱스에 대응하는 추정 계수를 출력한다.
복호 고역 서브 밴드 파워 산출 회로(96)는, 고역 복호 회로(95)로부터의 데이터 및 추정 계수와, 특징량 산출 회로(94)로부터의 저역 서브 밴드 파워에 기초하여, 프레임마다 고역측의 각 서브 밴드의 서브 밴드 파워의 추정값인 복호 고역 서브 밴드 파워를 산출한다. 예를 들어, 상술한 식 (3)과 마찬가지의 연산이 행해져서, 복호 고역 서브 밴드 파워가 산출된다. 복호 고역 서브 밴드 파워 산출 회로(96)는, 산출한 각 서브 밴드의 복호 고역 서브 밴드 파워를 복호 고역 신호 생성 회로(97)에 공급한다.
복호 고역 신호 생성 회로(97)는, 서브 밴드 분할 회로(93)로부터의 저역 서브 밴드 신호와, 복호 고역 서브 밴드 파워 산출 회로(96)로부터의 복호 고역 서브 밴드 파워에 기초하여 복호 고역 신호를 생성하고, 합성 회로(98)에 공급한다.
구체적으로는, 복호 고역 신호 생성 회로(97)는, 저역 서브 밴드 신호의 저역 서브 밴드 파워를 산출하고, 복호 고역 서브 밴드 파워와 저역 서브 밴드 파워의 비에 따라서 저역 서브 밴드 신호를 진폭 변조한다. 또한, 복호 고역 신호 생성 회로(97)는, 진폭 변조된 저역 서브 밴드 신호를 주파수 변조함으로써, 고역측의 각 서브 밴드의 복호 고역 서브 밴드 신호를 생성한다. 이와 같이 하여 얻어진 복호 고역 서브 밴드 신호는, 입력 신호의 고역측의 각 서브 밴드의 고역 서브 밴드 신호의 추정값이다. 복호 고역 신호 생성 회로(97)는, 얻어진 각 서브 밴드의 복호 고역 서브 밴드 신호를 포함하는 복호 고역 신호를 합성 회로(98)에 공급한다.
합성 회로(98)는, 저역 복호 회로(92)로부터의 복호 저역 신호와, 복호 고역 신호 생성 회로(97)로부터의 복호 고역 신호를 합성하여, 출력 신호로서 출력한다. 이 출력 신호는, 부호화된 입력 신호를 복호하여 얻어지는 신호이며, 고역 성분과 저역 성분을 포함하는 신호이다.
<변형예 1>
[부호화 처리의 설명]
또한, 이상에서는, 구간수 결정 특징량으로서, 고역 서브 밴드 파워의 합을 구하는 경우에 대해 설명했지만, 고역 서브 밴드 파워의 합의 시간 변동을 나타내는 특징량이, 구간수 결정 특징량으로 되어도 된다.
고역 서브 밴드 파워의 합의 시간 변동을 나타내는 특징량으로서, 예를 들어 고역 서브 밴드 파워가 시간과 함께 어느 정도 커졌는지를 나타내는 특징량, 즉 어택성을 나타내는 특징량이 구간수 결정 특징량으로 되어도 된다.
그러한 경우, 부호화 장치(11)는, 예를 들어 도 7에 나타내는 부호화 처리를 행한다. 이하, 도 7의 흐름도를 참조하여, 부호화 장치(11)에 의한 부호화 처리에 대하여 설명한다.
또한, 스텝 S51 내지 스텝 S53의 처리는, 도 5의 스텝 S11 내지 스텝 S13의 처리와 마찬가지이므로, 그 설명은 생략한다.
스텝 S54에서, 구간수 결정 특징량 산출 회로(36)는, 서브 밴드 분할 회로(33)로부터 공급된 고역 서브 밴드 신호에 기초하여, 어택성을 나타내는 구간수 결정 특징량을 산출하고, 의사 고역 서브 밴드 파워 차분 산출 회로(37)에 공급한다.
예를 들어, 구간수 결정 특징량 산출 회로(36)는, 상술한 식 (1)을 계산함으로써, 처리 대상의 프레임 J의 고역 서브 밴드 신호의 서브 밴드 파워 합 powerhigh(J)를 산출한다.
또한, 구간수 결정 특징량 산출 회로(36)는, 처리 대상의 프레임 J를 포함하는 바로 옆 (L+1) 프레임분의 서브 밴드 파워 합에 기초하여, 다음 식 (9)를 계산하고, 어택성을 나타내는 구간수 결정 특징량으로서, 특징량 powerattack(J)를 산출한다. 이때, 예를 들어 L=16 등이 된다.
Figure pct00009
또한, 식 (9)에서, MIN{powerhigh(J), powerhigh(J-1), … powerhigh(J-L)}은, 서브 밴드 파워 합 powerhigh(J) 내지 서브 밴드 파워 합 powerhigh(J-L) 중의 최소값을 출력하는 함수를 나타내고 있다. 따라서, 특징량 powerattack(J)는, 처리 대상의 프레임 J의 서브 밴드 파워 합 powerhigh(J)와, 처리 대상의 프레임 J를 포함하는 바로 옆 (L+1) 프레임의 서브 밴드 파워의 최소값의 차분을 계산함으로써 구해진다.
이와 같이 하여 얻어진 특징량 powerattack(J)는, 서브 밴드 파워 합의 시간 방향으로의 상승의 속도, 즉 커지는 속도를 나타내고 있으므로, 특징량 powerattack(J)가 클수록, 고역 성분의 어택성이 강하다고 할 수 있다.
구간수 결정 특징량 산출 회로(36)가 산출한 특징량 powerattack(J)를 의사 고역 서브 밴드 파워 차분 산출 회로(37)에 공급하면, 그 후, 스텝 S55 내지 스텝 S67의 처리가 행해지고 부호화 처리는 종료된다.
또한, 이들 처리는 도 5의 스텝 S15 내지 스텝 S27의 처리와 마찬가지이므로, 그 설명은 생략한다. 단 스텝 S59에서는, 결정부(51)는 구간수 결정 특징량으로서 산출한, 어택성을 나타내는 특징량 powerattack(J)의 대표값와 임계값을 비교함으로써, 처리 대상 구간을 구성하는 연속 프레임 구간수를 결정한다.
구체적으로는, 예를 들어 처리 대상 구간 내의 각 프레임의 구간수 결정 특징량의 최대값이 대표값이 되고, 대표값이 40 이상인 경우, 연속 프레임 구간수는 16이 되고, 대표값이 30 이상 40 미만인 경우, 연속 프레임 구간수는 8이 된다. 또한, 대표값이 20 이상 30 미만인 경우, 연속 프레임 구간수는 4가 되고, 대표값이 10 이상 20 미만인 경우, 연속 프레임 구간수는 2가 되고, 대표값이 10 미만인 경우, 연속 프레임 구간수는 1이 된다.
예를 들어, 구간수 결정 특징량이 크고 어택성이 강한 구간은, 서브 밴드 파워 합의 시간 변동이 큰 구간이다. 즉, 최적의 추정 계수의 시간 방향의 변동이 큰 구간이다. 따라서, 결정부(51)는, 구간수 결정 특징량의 대표값이 큰 구간에서는 연속 프레임 구간수를 많게 함으로써, 복호측에 있어서, 보다 원신호에 가까운 고역 서브 밴드 신호를 추정에 의해 얻어지도록 한다. 이에 의해, 복호에 의해 얻어지는 음성 신호의 명료도를 높일 수 있어, 청감상의 음질을 향상시킬 수 있다.
이에 반해, 결정부(51)는, 대표값이 작은 구간에서는 연속 프레임 구간수를 적게 함으로써, 음질을 열화시키지 않고 고역 부호화 데이터의 부호량을 삭감한다.
이와 같이, 어택성을 나타내는 구간수 결정 특징량을 사용한 경우에도, 복호로 얻어지는 음성의 청감상의 음질을 향상시킴과 함께 출력 부호열의 부호량을 삭감하여, 입력 신호의 부호화 효율을 향상시킬 수 있다.
<변형예 2>
[부호화 처리의 설명]
또한, 고역 서브 밴드 파워의 합의 시간 변동을 나타내는 구간수 결정 특징량으로서, 디케이성을 나타내는 특징량이 사용되어도 된다.
그러한 경우, 부호화 장치(11)는, 예를 들어 도 8에 나타내는 부호화 처리를 행한다. 이하, 도 8의 흐름도를 참조하여, 부호화 장치(11)에 의한 부호화 처리에 대하여 설명한다. 또한, 스텝 S91 내지 스텝 S93의 처리는, 도 5의 스텝 S11 내지 스텝 S13의 처리와 마찬가지이므로, 그 설명은 생략한다.
스텝 S94에서, 구간수 결정 특징량 산출 회로(36)는, 서브 밴드 분할 회로(33)로부터 공급된 고역 서브 밴드 신호에 기초하여, 디케이성을 나타내는 구간수 결정 특징량을 산출하고, 의사 고역 서브 밴드 파워 차분 산출 회로(37)에 공급한다.
예를 들어, 구간수 결정 특징량 산출 회로(36)는, 상술한 식 (1)을 계산함으로써, 처리 대상의 프레임 J의 고역 서브 밴드 신호의 서브 밴드 파워 합 powerhigh(J)를 산출한다.
또한, 구간수 결정 특징량 산출 회로(36)는, 처리 대상의 프레임 J를 포함하는 바로 옆 (M+1) 프레임분의 서브 밴드 파워 합에 기초하여, 다음 식 (10)을 계산하여, 디케이성을 나타내는 구간수 결정 특징량으로서 특징량 powerdecay(J)를 산출한다. 이때, 예를 들어 M=16 등이 된다.
Figure pct00010
또한, 식 (10)에서, MAX{powerhigh(J), powerhigh(J-1), … powerhigh(J-M)}는, 서브 밴드 파워 합 powerhigh(J) 내지 서브 밴드 파워 합 powerhigh(J-M) 중의 최대값을 출력하는 함수를 나타내고 있다. 따라서, 특징량 powerdecay(J)는, 처리 대상의 프레임 J를 포함하는 바로 옆 (M+1) 프레임의 서브 밴드 파워의 최대값과, 처리 대상의 프레임 J의 서브 밴드 파워 합의 차분을 계산함으로써 구해진다.
이와 같이 하여 얻어진 특징량 powerdecay(J)는, 서브 밴드 파워 합의 시간 방향으로의 하강의 속도, 즉 작아지는 속도를 나타내고 있으므로, 특징량 powerdecay(J)가 클수록, 고역 성분의 디케이성이 강하다고 할 수 있다.
구간수 결정 특징량 산출 회로(36)가 산출한 특징량 powerdecay(J)를 의사 고역 서브 밴드 파워 차분 산출 회로(37)에 공급하면, 그 후, 스텝 S95 내지 스텝 S107의 처리가 행해져서 부호화 처리는 종료된다.
또한, 이들 처리는 도 5의 스텝 S15 내지 스텝 S27의 처리와 마찬가지므로, 그 설명은 생략한다. 단 스텝 S99에서는, 결정부(51)는, 디케이성을 나타내는 구간수 결정 특징량으로서 산출한 특징량 powerdecay(J)의 대표값과 임계값을 비교함으로써, 처리 대상 구간을 구성하는 연속 프레임 구간수를 결정한다.
구체적으로는, 예를 들어 처리 대상 구간 내의 각 프레임의 구간수 결정 특징량의 최대값이 대표값으로 되고, 대표값이 40 이상인 경우, 연속 프레임 구간수는 16이 되고, 대표값이 30 이상 40 미만인 경우, 연속 프레임 구간수는 8이 된다. 또한, 대표값이 20 이상 30 미만인 경우, 연속 프레임 구간수는 4가 되고, 대표값이 10 이상 20 미만인 경우, 연속 프레임 구간수는 2가 되고, 대표값이 10 미만인 경우, 연속 프레임 구간수는 1이 된다.
예를 들어, 구간수 결정 특징량이 크고 디케이성이 강한 구간은, 서브 밴드 파워 합의 시간 변동이 큰 구간이다. 따라서, 결정부(51)는, 어택성을 나타내는 구간수 결정 특징량의 경우와 마찬가지로, 구간수 결정 특징량의 대표값이 보다 큰 구간일수록, 연속 프레임 구간수를 보다 많게 한다. 이에 의해, 복호로 얻어지는 음성의 청감상의 음질을 향상시킴과 함께 출력 부호열의 부호량을 삭감하여, 입력 신호의 부호화 효율을 향상시킬 수 있다.
<변형예 3>
[부호화 처리의 설명]
또한, 구간수 결정 특징량으로서, 입력 신호의 주파수 형상을 나타내는 특징량이 사용되도록 해도 된다.
그러한 경우, 부호화 장치(11)는, 예를 들어 도 9에 나타내는 부호화 처리를 행한다. 이하, 도 9의 흐름도를 참조하여, 부호화 장치(11)에 의한 부호화 처리에 대하여 설명한다. 또한, 스텝 S131 내지 스텝 S133의 처리는, 도 5의 스텝 S11 내지 스텝 S13의 처리와 마찬가지므로, 그 설명은 생략한다.
스텝 S134에서, 구간수 결정 특징량 산출 회로(36)는, 서브 밴드 분할 회로(33)로부터 공급된 저역 서브 밴드 신호와 고역 서브 밴드 신호에 기초하여, 주파수 형상을 나타내는 구간수 결정 특징량을 산출하고, 의사 고역 서브 밴드 파워 차분 산출 회로(37)에 공급한다.
예를 들어, 구간수 결정 특징량 산출 회로(36)는, 상술한 식 (1)을 계산함으로써, 처리 대상의 프레임 J의 고역 서브 밴드 신호의 서브 밴드 파워 합 powerhigh(J)를 산출한다.
또한, 구간수 결정 특징량 산출 회로(36)는, 다음 식 (11)을 계산하여, 주파수 형상을 나타내는 구간수 결정 특징량으로서 특징량 powertilt(J)를 산출한다.
Figure pct00011
또한 식 (11)에서, Σpowerlin(ib, J)는 저역측의 서브 밴드 ib(단, 0≤ib≤sb)의 서브 밴드 신호의 각 샘플의 샘플 값의 제곱 평균값의 합을 나타내고 있다.
따라서, 특징량 powertilt(J)는 처리 대상의 프레임 J에 대해서, 저역측의 서브 밴드의 서브 밴드 신호의 샘플의 제곱 평균값의 합을 대수화하여 얻어진 값, 즉 저역의 서브 밴드 파워 합을, 고역의 서브 밴드 파워 합 powerhigh(J)로부터 감산함으로써 얻어진다. 즉, 특징량 powertilt(J)는 저역과 고역의 서브 밴드 파워 합의 차분을 구함으로써 산출된다.
이와 같이 하여 얻어진 특징량 powertilt(J)는, 처리 대상의 프레임 J에서의 저역의 서브 밴드 파워 합에 대한, 추정 대상이 되는 고역의 서브 밴드 파워 합의 비율을 나타내고 있다. 따라서, 특징량 powertilt(J)의 값이 클수록, 프레임 J에서는, 저역에 대한 고역이 상대적인 파워가 크게 된다.
구간수 결정 특징량 산출 회로(36)가 산출한 특징량 powertilt(J)를 의사 고역 서브 밴드 파워 차분 산출 회로(37)에 공급하면, 그 후, 스텝 S135 내지 스텝 S147의 처리가 행해지고 부호화 처리는 종료된다.
또한, 이들 처리는 도 5의 스텝 S15 내지 스텝 S27의 처리와 마찬가지므로, 그 설명은 생략한다. 단 스텝 S139에서는, 결정부(51)는, 주파수 형상을 나타내는 구간수 결정 특징량으로서 산출한 특징량 powertilt(J)의 대표값과 임계값을 비교함으로써, 처리 대상 구간을 구성하는 연속 프레임 구간수를 결정한다.
구체적으로는, 예를 들어 처리 대상 구간 내의 각 프레임의 구간수 결정 특징량의 최대값이 대표값으로 되고, 대표값이 40 이상인 경우, 연속 프레임 구간수는 16이 되고, 대표값이 30 이상 40 미만인 경우, 연속 프레임 구간수는 8이 된다. 또한, 대표값이 20 이상 30 미만인 경우, 연속 프레임 구간수는 4가 되고, 대표값이 10 이상 20 미만인 경우, 연속 프레임 구간수는 2가 되고, 대표값이 10 미만인 경우, 연속 프레임 구간수는 1이 된다.
예를 들어, 입력 신호의 처리 대상의 프레임이, 사람의 목소리의 자음부나 악기의 하이햇의 부분 등일 경우에는, 저역의 서브 밴드 파워 합보다 고역의 서브 밴드 파워 합이 커진다. 즉, 구간수 결정 특징량으로서의 특징량 powertilt(J)의 값이 커진다.
이러한 입력 신호의 프레임에서는, 비교적 고역의 부호화에 의한 음질 열화가 눈에 띄게 된다. 따라서, 결정부(51)는, 구간수 결정 특징량의 대표값이 큰 구간에서는 연속 프레임 구간수를 많게 함으로써, 복호측에 있어서, 보다 원신호에 가까운 고역 서브 밴드 신호를 추정에 의해 얻어지게 한다. 이에 의해, 복호에 의해 얻어지는 음성 신호의 명료도를 높일 수 있어, 청감상의 음질을 향상시킬 수 있다.
이에 반해, 결정부(51)는, 대표값이 작은 구간에서는 연속 프레임 구간수를 적게 함으로써, 음질을 열화시키지 않고 고역 부호화 데이터의 부호량을 삭감한다.
이와 같이, 주파수 형상을 나타내는 구간수 결정 특징량을 사용한 경우에도, 복호로 얻어지는 음성의 청감상의 음질을 향상시킴과 함께 출력 부호열의 부호량을 삭감하여, 입력 신호의 부호화 효율을 향상시킬 수 있다.
<변형예 4>
[부호화 처리의 설명]
또한, 상술한 서브 밴드 파워 합, 어택성이나 디케이성을 나타내는 특징량, 주파수 형상을 나타내는 특징량 등의 복수의 특징량 중 임의의 것의 선형 합을 구간수 결정 특징량으로 할 수도 있다.
그러한 경우, 부호화 장치(11)는, 예를 들어 도 10에 도시하는 부호화 처리를 행한다. 이하, 도 10의 흐름도를 참조하여, 부호화 장치(11)에 의한 부호화 처리에 대하여 설명한다. 또한, 스텝 S171 내지 스텝 S173의 처리는, 도 5의 스텝 S11 내지 스텝 S13의 처리와 마찬가지므로, 그 설명은 생략한다.
스텝 S174에서, 구간수 결정 특징량 산출 회로(36)는, 서브 밴드 분할 회로(33)로부터 공급된 저역 서브 밴드 신호와 고역 서브 밴드 신호에 기초하여 복수의 특징량을 산출하고, 그것들의 특징량의 선형 합을 구함으로써 구간수 결정 특징량을 산출한다.
예를 들어, 구간수 결정 특징량 산출 회로(36)는, 상술한 식 (1), 식 (9), 식 (10) 및 식 (11)을 계산함으로써, 서브 밴드 파워 합 powerhigh(J), 특징량 powerattack(J), 특징량 powerdecay(J) 및 특징량 powertilt(J)를 산출한다.
또한, 구간수 결정 특징량 산출 회로(36)는, 다음 식 (12)를 계산함으로써, 구한 서브 밴드 파워 합 powerhigh(J)나 특징량 powerattack(J) 등의 특징량의 선형 합을 구하여, 특징량 feature(J)를 산출한다.
Figure pct00012
또한 식 (12)에서, Whigh, Wattack, Wdecay 및 Wtilt는, 각각 서브 밴드 파워 합 powerhigh(J), 특징량 powerattack(J), 특징량 powerdecay(J) 및 특징량 powertilt(J)에 승산되는 가중치이며, 예를 들어 Whigh=1, Wattack=3, Wdecay=3, Wtilt=3 등이 된다.
이와 같이 하여 얻어진 특징량 feature(J)의 값은, 고역의 서브 밴드 파워 합이 크고, 그 서브 밴드 파워 합의 시간 변동이 클수록, 또한 저역에 대하여 고역의 서브 밴드 파워가 클수록 커진다. 또한, 복수의 특징량의 비선형 합을 구간수 결정 특징량으로서 산출해도 된다.
구간수 결정 특징량 산출 회로(36)가 구간수 결정 특징량으로서 산출한 특징량 feature(J)를 의사 고역 서브 밴드 파워 차분 산출 회로(37)에 공급하면, 그 후, 스텝 S175 내지 스텝 S187의 처리가 행해져서 부호화 처리는 종료된다.
또한, 이들 처리는 도 5의 스텝 S15 내지 스텝 S27의 처리와 마찬가지므로, 그 설명은 생략한다. 단 스텝 S179에서는, 결정부(51)는 특징량 feature(J)의 대표값과 임계값을 비교함으로써, 처리 대상 구간을 구성하는 연속 프레임 구간수를 결정한다.
구체적으로는, 예를 들어 처리 대상 구간 내의 각 프레임의 구간수 결정 특징량의 최대값이 대표값으로 되고, 대표값이 460 이상인 경우, 연속 프레임 구간수는 16이 되고, 대표값이 350 이상 460 미만인 경우, 연속 프레임 구간수는 8이 된다. 또한, 대표값이 240 이상 350 미만인 경우, 연속 프레임 구간수는 4가 되고, 대표값이 130 이상 240 미만인 경우, 연속 프레임 구간수는 2가 되고, 대표값이 130 미만인 경우, 연속 프레임 구간수는 1이 된다.
구간수 결정 특징량으로서 특징량 feature(J)를 사용하는 경우에도, 구간수 결정 특징량이 큰 구간일수록 연속 프레임 구간수를 많게 함으로써, 복호로 얻어지는 음성의 청감상의 음질을 향상시킴과 함께 출력 부호열의 부호량을 삭감할 수 있다. 이에 의해, 입력 신호의 부호화 효율을 향상시킬 수 있다.
<제2 실시 형태>
[부호화 처리의 설명]
또한, 이상에서는, 처리 대상 구간을 동등한 구간 길이의 몇 개의 연속 프레임 구간으로 분할한다고 설명했지만, 처리 대상 구간을 구성하는 각 연속 프레임 구간이, 서로 다른 길이가 되도록 해도 된다. 각 연속 프레임 구간을 필요에 따라서 서로 다른 길이로 하면, 보다 적절하게 각 프레임의 계수 인덱스를 선택할 수 있어, 복호로 얻어지는 음성의 음질을 더욱 향상시킬 수 있게 된다.
이와 같이, 각 연속 프레임 구간을 필요에 따라서 서로 다른 길이로 할 경우, 부호화 장치(11)는, 도 11에 도시하는 부호화 처리를 행한다. 이하, 도 11의 흐름도를 참조하여, 부호화 장치(11)에 의한 부호화 처리에 대하여 설명한다. 또한, 스텝 S211 내지 스텝 S219의 처리는, 도 5의 스텝 S11 내지 스텝 S19의 처리와 마찬가지므로, 그 설명은 생략한다.
스텝 S220에서, 평가값 합 산출부(52)는, 각 프레임에 대하여 계수 인덱스(추정 계수의 세트)마다 산출한 평가값을 사용하여, 연속 프레임 구간을 구성하는 프레임의 평가값의 합을 계수 인덱스마다 산출한다.
예를 들어, 스텝 S219에서 결정된 연속 프레임 구간수가 ndiv라고 하면, 평가값 합 산출부(52)는, 처리 대상 구간을 ndiv개의 임의의 길이의 연속 프레임 구간으로 분할한다. 이때, 각 연속 프레임 구간은, 동일한 길이이어도 되고, 서로 다른 길이이어도 된다.
구체적으로는, 연속 프레임 구간수 ndiv가 3일 경우, 예를 들어 도 2에 도시한 처리 대상 구간이, 위치 FST1부터 위치 FC1까지의 구간, 위치 FC1부터 위치 FC2까지의 구간 및 위치 FC2부터 위치 FSE1까지의 구간의 합계 3개의 구간으로 분할된다. 그리고, 이들 3개의 구간이 각각 연속 프레임 구간이 된다.
처리 대상 구간을 연속 프레임 구간으로 분할하면, 평가값 합 산출부(52)는, 상술한 식 (8)의 계산을 행하여, 계수 인덱스마다 연속 프레임 구간을 구성하는 프레임의 평가값 합 Ressum(id, igp)을 산출한다.
예를 들어, 도 2의 위치 FST1부터 위치 FC1까지의 구간에 대해서, 그 구간을 구성하는 프레임의 평가값의 합이 계수 인덱스마다 산출된다. 마찬가지로, 위치 FC1부터 위치 FC2까지의 구간 및 위치 FC2부터 위치 FSE1까지의 구간에 대해서도, 계수 인덱스마다 평가값의 합이 산출된다.
이에 의해, 처리 대상 구간을 구성하는 각 연속 프레임 구간에 대해서, 계수 인덱스마다 연속 프레임 구간의 평가값 합 Ressum(id, igp)이 얻어지게 된다.
평가값 합 산출부(52)는, 처리 대상 구간을 ndiv개의 연속 프레임 구간으로 분할할 경우에 취할 수 있는 모든 분할의 조합에 대해서, 계수 인덱스마다 처리 대상 구간의 각 연속 프레임 구간의 평가값 합을 산출한다. 예를 들어, 도 2에 도시한 예는, 처리 대상 구간이 3개의 연속 프레임 구간으로 분할되는 경우에 있어서의, 1개의 분할의 조합을 나타내고 있다.
스텝 S221에서, 선택부(53)는, 처리 대상 구간의 분할의 조합마다 구해진, 각 계수 인덱스의 연속 프레임 구간의 평가값 합에 기초하여, 각 프레임의 계수 인덱스를 선택한다.
구체적으로는, 선택부(53)는, 처리 대상 구간의 분할의 각 조합에 대해서, 그 조합의 연속 프레임 구간마다 계수 인덱스를 선택한다. 즉, 선택부(53)는, 복수의 계수 인덱스 중, 연속 프레임 구간에 대하여 구한 평가값 합이 최소가 되는 계수 인덱스를, 그 연속 프레임 구간의 계수 인덱스로서 선택한다.
또한, 선택부(53)는, 처리 대상으로 되어 있는 처리 대상 구간의 분할의 조합에 대해서, 각 연속 프레임 구간에서 선택된 계수 인덱스의 평가값 합의 합을 구한다.
예를 들어, 도 2에 도시하는 예에서, 위치 FST1부터 위치 FC1까지의 구간, 위치 FC1부터 위치 FC2까지의 구간 및 위치 FC2부터 위치 FSE1까지의 구간 각각에서, 계수 인덱스 「2」, 「5」 및 「1」이 선택된 것으로 한다.
이 경우, 위치 FST1부터 위치 FC1까지의 구간의 계수 인덱스 「2」의 평가값 합, 위치 FC1부터 위치 FC2까지의 구간의 계수 인덱스 「5」의 평가값 합 및 위치 FC2부터 위치 FSE1까지의 구간의 계수 인덱스 「1」의 평가값 합의 합이 구해진다.
이와 같이 하여 구해지는 평가값 합의 합은, 처리 대상 구간의 소정의 분할의 조합에 대하여 프레임마다 계수 인덱스를 선택한 경우에 있어서의, 각 프레임의 계수 인덱스의 평가값의 합이라고 할 수 있다. 따라서, 평가값 합의 합이 최소가 되는 분할의 조합이, 처리 대상 구간 전체로 보았을 경우에, 각 프레임에서 가장 적절한 계수 인덱스가 선택되는 조합이 된다.
선택부(53)는, 처리 대상 구간의 분할의 조합마다 평가값 합의 합을 구하면, 그것들의 평가값 합의 합이 최소가 되는 조합을 특정한다. 그리고, 선택부(53)는, 특정된 조합의 각 연속 프레임 구간을 최종적인 연속 프레임 구간으로 함과 함께, 그것들의 연속 프레임 구간에서 선택된 계수 인덱스를, 연속 프레임 구간을 구성하는 각 프레임의 최종적인 계수 인덱스로서 선택한다.
이와 같이 하여 연속 프레임 구간마다, 연속 프레임 구간을 구성하는 프레임의 계수 인덱스가 선택되면, 그 후, 스텝 S222 내지 스텝 S227의 처리가 행해지고 부호화 처리는 종료된다. 또한, 이들 처리는 도 5의 스텝 S22 내지 스텝 S27의 처리와 마찬가지이므로, 그 설명은 생략한다.
이상과 같이, 부호화 장치(11)는, 구간수 결정 특징량을 산출하고, 구간수 결정 특징량으로부터 연속 프레임 구간수를 정함과 함께, 연속 프레임 구간의 조합마다 연속 프레임 구간의 평가값 합의 합을 산출하여, 평가값 합의 합으로부터 각 프레임의 계수 인덱스를 선택한다.
이렇게 연속 프레임 구간의 조합마다 연속 프레임 구간의 평가값 합의 합을 산출하고, 최적의 연속 프레임 구간의 조합과, 각 연속 프레임 구간의 계수 인덱스를 정함으로써, 복호시에 보다 고정밀도로 고역 성분을 추정할 수 있게 된다. 이에 의해, 복호로 얻어지는 음성의 청감상의 음질을 향상시킴과 함께, 출력 부호열의 부호량을 삭감할 수 있어, 입력 신호의 부호화 효율을 향상시킬 수 있다.
또한, 도 11의 스텝 S214에서, 서브 밴드 파워 합 powerhigh(J)가 구간수 결정 특징량으로서 산출되는 경우에 대하여 설명했지만, 다른 특징량이 구간수 결정 특징량으로서 산출되도록 해도 된다. 예를 들어, 상술한 특징량 powerattack(J), 특징량 powerdecay(J), 특징량 powertilt(J), 특징량 feature(J) 등이 구간수 결정 특징량으로서 구해지도록 해도 된다.
<제3 실시 형태>
[부호화 장치의 구성예]
또한, 본 기술은, 입력 신호의 고역 부호화 데이터의 부호량을 고려하여 저역 성분을 부호화하는 경우에 적용하면, 보다 간단하고 신속하게 부호화를 행할 수 있다. 저역 성분의 부호화시에 고역 부호화 데이터의 부호량이 고려되는 경우, 부호화 장치는 예를 들어 도 12에 도시한 바와 같이 구성된다.
도 12의 부호화 장치(131)는, 음성 신호인 입력 신호를, 예를 들어(16) 프레임 등의 복수 프레임을 포함하는 처리 대상 구간을 단위로서 부호화하고, 그 결과 얻어진 출력 부호열을 출력하는 것이다. 또한, 이하에서는, 부호화 장치(131)가 가변 길이 방식으로 고역 부호화 데이터를 생성하는 경우를 예로서 설명한다. 단, 부호화 장치(131)에서는, 가변 길이 방식과 고정 길이 방식의 전환은 행하여지지 않으므로, 고역 부호화 데이터에는, 방식 플래그는 포함되지 않는 것으로 한다.
부호화 장치(131)는, 서브 밴드 분할 회로(141), 고역 부호량 산출 회로(142), 저역 통과 필터(143), 저역 부호화 회로(144), 저역 복호 회로(145), 서브 밴드 분할 회로(146), 지연 회로(147), 지연 회로(148), 지연 회로(149), 고역 부호화 회로(150), 부호량 조정 회로(151), 부호량 일시 축적 회로(152), 지연 회로(153) 및 다중화 회로(154)로 구성된다.
서브 밴드 분할 회로(141)는, 입력 신호를 복수의 서브 밴드 신호로 분할하고, 얻어진 저역 서브 밴드 신호를 고역 부호량 산출 회로(142)에 공급함과 함께, 고역 서브 밴드 신호를 고역 부호량 산출 회로(142) 및 지연 회로(149)에 공급한다.
고역 부호량 산출 회로(142)는, 서브 밴드 분할 회로(141)로부터 공급된 저역 서브 밴드 신호 및 고역 서브 밴드 신호에 기초하여, 입력 신호의 고역 성분을 부호화하여 얻어지는 고역 부호화 데이터의 부호량(이하, 고역 부호량이라고 함)을 산출한다.
고역 부호량 산출 회로(142)는, 특징량 산출부(161)를 구비하고 있고, 특징량 산출부(161)는, 저역 서브 밴드 신호 또는 고역 서브 밴드 신호 중 적어도 어느 하나에 기초하여, 구간수 결정 특징량을 산출한다. 또한, 고역 부호량 산출 회로(142)는, 구간수 결정 특징량에 기초하여 처리 대상 구간의 연속 프레임 구간수를 결정함과 함께, 연속 프레임 구간수로부터 고역 부호량을 산출한다.
고역 부호량 산출 회로(142)는, 연속 프레임 구간수를 지연 회로(148)에 공급함과 함께, 고역 부호량을 저역 부호화 회로(144) 및 지연 회로(148)에 공급한다.
저역 통과 필터(143)는, 공급된 입력 신호를 필터링하고, 그 결과 얻어진, 입력 신호의 저역 성분인 저역 신호를 저역 부호화 회로(144)에 공급한다.
저역 부호화 회로(144)는, 저역 신호를 부호화하여 얻어지는 저역 부호화 데이터의 부호량이, 입력 신호의 처리 대상 구간에서 사용 가능한 부호량으로부터, 고역 부호량 산출 회로(142)로부터 공급된 고역 부호량을 감산한 부호량 이하가 되도록, 저역 통과 필터(143)로부터의 저역 신호를 부호화한다. 저역 부호화 회로(144)는, 저역 신호의 부호화에 의해 얻어진 저역 부호화 데이터를 저역 복호 회로(145) 및 지연 회로(153)에 공급한다.
저역 복호 회로(145)는, 저역 부호화 회로(144)로부터 공급된 저역 부호화 데이터의 복호를 행하고, 그 결과 얻어진 복호 저역 신호를 서브 밴드 분할 회로(146)에 공급한다. 서브 밴드 분할 회로(146)는, 저역 복호 회로(145)로부터 공급된 복호 저역 신호를, 저역측의 복수의 서브 밴드의 서브 밴드 신호(이하, 복호 저역 서브 밴드 신호라고 함)로 분할하여, 지연 회로(147)에 공급한다. 여기서, 복호 저역 서브 밴드 신호의 서브 밴드 각각은, 저역 서브 밴드 신호의 서브 밴드의 각각과 동일한 주파수 대역이 된다.
지연 회로(147)는, 서브 밴드 분할 회로(146)로부터의 복호 저역 서브 밴드 신호를 지연시켜, 고역 부호화 회로(150)에 공급한다. 지연 회로(148)는, 고역 부호량 산출 회로(142)로부터의 고역 부호량 및 연속 프레임 구간수를 일정 기간만큼 지연시켜, 고역 부호화 회로(150)에 공급한다. 지연 회로(149)는, 서브 밴드 분할 회로(141)로부터의 고역 서브 밴드 신호를 지연시켜, 고역 부호화 회로(150)에 공급한다.
고역 부호화 회로(150)는, 지연 회로(147)로부터의 복호 저역 서브 밴드 신호로부터 얻어지는 특징량과, 지연 회로(148)로부터의 연속 프레임 구간수에 기초하여, 지연 회로(148)로부터의 고역 부호량 이하의 부호량이 되도록, 지연 회로(149)로부터의 고역 서브 밴드 신호의 파워를 추정에 의해 얻기 위한 정보를 부호화한다.
고역 부호화 회로(150)는, 산출부(162) 및 선택부(163)를 구비하고 있다. 산출부(162)는, 추정 계수를 나타내는 계수 인덱스마다 고역측의 각 서브 밴드의 평가값을 산출하고, 선택부(163)는, 산출부(162)에 의해 산출된 평가값에 기초하여, 각 프레임의 계수 인덱스를 선택한다.
또한, 고역 부호화 회로(150)는, 계수 인덱스를 포함하는 데이터를 부호화하여 얻어진 고역 부호화 데이터를 다중화 회로(154)에 공급함과 함께, 고역 부호화 데이터의 고역 부호량을, 부호량 조정 회로(151)에 공급한다.
부호량 조정 회로(151)는, 고역 부호화 회로(150)에서 얻어진 실제의 고역 부호량이, 지연 회로(148)를 통해 얻어지는 고역 부호량 산출 회로(142)의 고역 부호량 미만이었을 경우, 그 잉여 부호량을 부호량 일시 축적 회로(152)에 공급한다. 부호량 일시 축적 회로(152)는, 잉여 부호량의 축적을 행한다. 이 잉여 부호량은, 다음번 이후의 처리 대상 구간에서 적절히 사용된다.
지연 회로(153)는, 저역 부호화 회로(144)에서 얻어진 저역 부호화 데이터를 일정 기간만큼 지연시켜, 다중화 회로(154)에 공급한다. 다중화 회로(154)는, 지연 회로(153)로부터의 저역 부호화 데이터와, 고역 부호화 회로(150)로부터의 고역 부호화 데이터를 다중화하고, 그 결과 얻어진 출력 부호열을 출력한다.
[부호화 처리의 설명]
이어서, 부호화 장치(131)의 동작에 대하여 설명한다. 부호화 장치(131)에 입력 신호가 공급되어, 입력 신호의 부호화가 지시되면, 부호화 장치(131)는, 부호화 처리를 행하고, 입력 신호를 부호화한다.
이하, 도 13의 흐름도를 참조하여, 부호화 장치(131)에 의한 부호화 처리에 대하여 설명한다. 또한, 이 부호화 처리는, 입력 신호의 처리 대상 구간(예를 들어, 16 프레임)을 단위로서 행하여진다.
스텝 S251에서, 서브 밴드 분할 회로(141)는, 공급된 입력 신호를, 소정의 대역 폭을 갖는 복수의 서브 밴드 신호로 등분할한다. 여기에서 얻어진 서브 밴드 신호 중 저역측의 특정한 범위의 서브 밴드 신호가 저역 서브 밴드 신호가 되고, 고역측의 특정한 범위의 서브 밴드 신호가 고역 서브 밴드 신호가 된다.
서브 밴드 분할 회로(141)는, 서브 밴드 분할에 의해 얻어진 저역 서브 밴드 신호를 고역 부호량 산출 회로(142)에 공급하고, 고역 서브 밴드 신호를 고역 부호량 산출 회로(142) 및 지연 회로(149)에 공급한다.
예를 들어, 고역 서브 밴드 신호의 서브 밴드의 범위는, 입력 신호의 성질이나 비트 레이트 등에 따라 부호화 장치(131)측에서 설정된다. 또한, 저역 서브 밴드 신호의 서브 밴드 범위는, 고역 서브 밴드 신호의 서브 밴드의 최저역의 서브 밴드보다, 1개 저역측의 서브 밴드를 저역 서브 밴드 신호의 최고역의 서브 밴드로 한, 소정수의 서브 밴드를 포함하는 주파수 대역이 된다.
또한, 저역 서브 밴드 신호와 고역 서브 밴드 신호의 서브 밴드의 범위는, 부호화 장치(131)와 복호 장치측에서 동일한 범위가 된다.
스텝 S252에서, 고역 부호량 산출 회로(142)의 특징량 산출부(161)는, 서브 밴드 분할 회로(141)로부터 공급된 저역 서브 밴드 신호 또는 고역 서브 밴드 신호 중 적어도 어느 하나에 기초하여, 구간수 결정 특징량을 산출한다.
예를 들어, 특징량 산출부(161)는, 상술한 식 (9)의 연산을 행하여, 고역의 어택성을 나타내는 특징량 powerattack(J)를 구간수 결정 특징량으로서 산출한다. 구간수 결정 특징량은, 처리 대상 구간을 구성하는 프레임마다 산출된다.
또한, 구간수 결정 특징량으로서, 상술한 서브 밴드 파워 합 powerhigh(J), 특징량 powerdecay(J), 특징량 powertilt(J), 특징량 feature(J)나, 복수의 특징량의 비선형 합 등이 산출되도록 해도 된다.
스텝 S253에서, 고역 부호량 산출 회로(142)는, 처리 대상 구간의 각 프레임의 구간수 결정 특징량에 기초하여, 연속 프레임 구간수를 결정한다.
예를 들어, 고역 부호량 산출 회로(142)는, 처리 대상 구간의 각 프레임의 구간수 결정 특징량 중 최대값을, 구간수 결정 특징량의 대표값으로 하고, 대표값과 미리 정한 임계값을 비교함으로써, 연속 프레임 구간수를 결정한다.
구체적으로는, 예를 들어 대표값이 40 이상인 경우, 연속 프레임 구간수는 16이 되고, 대표값이 30 이상 40 미만인 경우, 연속 프레임 구간수는 8이 된다. 또한, 대표값이 20 이상 30 미만인 경우, 연속 프레임 구간수는 4가 되고, 대표값이 10 이상 20 미만인 경우, 연속 프레임 구간수는 2가 되고, 대표값이 10 미만인 경우, 연속 프레임 구간수는 1이 된다.
스텝 S254에서, 고역 부호량 산출 회로(142)는, 결정한 연속 프레임 구간수에 기초하여, 고역 부호화 데이터의 고역 부호량을 산출한다.
부호화 장치(131)에서는, 가변 길이 방식으로 고역 부호화 데이터가 생성되므로, 고역 부호화 데이터에는, 개수 정보, 구간 정보 및 계수 인덱스가 포함되게 된다.
현 시점에서, 처리 대상 구간을 구성하는 연속 프레임 구간수가 결정되어 있으므로, 연속 프레임 구간수가 nDiv라고 하면, 고역 부호화 데이터에는, 1개의 개수 정보, (nDiv-1)개의 구간 정보 및 nDiv개의 계수 인덱스가 포함되게 된다.
또한, 구간 정보가 (nDiv-1)개로 되는 것은, 처리 대상 구간의 길이는 미리 정해져 있어, (nDiv-1)개의 연속 프레임 구간의 길이를 알면, 나머지 1개의 연속 프레임 구간의 길이를 특정할 수 있기 때문이다.
이상으로부터 고역 부호화 데이터의 부호량은, (개수 정보의 기술에 필요한 비트수)+(nDiv-1)×(1개의 구간 정보의 기술에 필요한 비트수)+(nDiv)×(1개의 계수 인덱스의 기술에 필요한 비트수)에 의해 구할 수 있다.
이와 같이, 부호화 장치(131)에서는, 실제로 입력 신호의 고역 성분을 부호화하지 않아도, 적은 연산량으로 고역 부호화 데이터의 고역 부호량을 구할 수 있으므로, 보다 신속하게 저역 성분의 부호화를 개시할 수 있다.
즉, 종래의 처리에서는, 고역 부호화 데이터에 필요한 부호량을 결정할 때에, 입력 신호의 저역 서브 밴드 파워와 고역 서브 밴드 파워를 산출하여 프레임마다 계수 인덱스를 선택하지 않으면, 필요해지는 부호량을 구할 수 없었다. 이에 반해, 부호화 장치(131)에서는, 구간수 결정 특징량을 산출하기만 하면 되기 때문에, 보다 적은 연산으로 신속히 고역 부호량을 결정할 수 있다.
또한, 스텝 S254에서는, 가변 길이 방식에 의해 고역 부호화 데이터가 생성되는 경우를 예로서 설명했지만, 고역 부호화 데이터가 고정 길이 방식으로 생성되는 경우에도, 연속 프레임 구간수에 기초하여 고역 부호량을 산출할 수 있다.
고정 길이 방식으로 고역 부호화 데이터가 생성될 경우, 고역 부호화 데이터에는, 고정 길이 인덱스, 전환 플래그 및 계수 인덱스가 포함되게 된다.
이 경우, 도 3으로부터 알 수 있는 바와 같이 고역 부호화 데이터에는, 1개의 고정 길이 인덱스, (nDiv-1)개의 전환 플래그 및 nDiv개의 계수 인덱스가 포함되게 된다. 따라서, 고역 부호화 데이터의 부호량은, (고정 길이 인덱스의 기술에 필요한 비트수)+(nDiv-1)×(1개의 전환 플래그의 기술에 필요한 비트수)+(nDiv)×(1개의 계수 인덱스의 기술에 필요한 비트수)에 의해 구할 수 있다.
고역 부호량 산출 회로(142)는, 고역 부호량을 산출하면, 산출한 고역 부호량을 저역 부호화 회로(144) 및 지연 회로(148)에 공급함과 함께, 연속 프레임 구간수를 지연 회로(148)에 공급한다.
스텝 S255에서, 저역 통과 필터(143)는, 공급된 입력 신호를 저역 통과 필터로 필터링하고, 그 결과 얻어진 저역 신호를 저역 부호화 회로(144)에 공급한다. 이 필터 처리에 사용하는 저역 통과 필터의 차단 주파수로서는, 임의의 주파수를 설정하는 것이 가능한데, 본 실시 형태에서는, 상술한 저역 서브 밴드 신호의 상단부의 주파수에 대응하여 차단 주파수가 설정된다.
스텝 S256에서, 저역 부호화 회로(144)는, 저역 부호화 데이터의 부호량이 저역 부호량 이하의 부호량이 되도록, 저역 통과 필터(143)로부터의 저역 신호를 부호화하고, 그 결과 얻어진 저역 부호화 데이터를, 저역 복호 회로(145) 및 지연 회로(153)에 공급한다.
여기서, 저역 부호량이란, 저역 부호화 데이터의 목표로 하는 부호량이다. 저역 부호화 회로(144)는, 미리 정해진 처리 대상 구간 전체에서 사용 가능한 부호량으로부터, 고역 부호량 산출 회로(142)로부터 공급된 고역 부호량을 감산하고, 또한 부호량 일시 축적 회로(152)에 축적되어 있는 잉여 부호량을 가산함으로써 저역 부호량을 산출한다.
저역 부호화 회로(144)는, 실제로 저역 신호를 부호화하여 얻어진 저역 부호화 데이터의 부호량이, 저역 부호량 미만이었을 경우, 저역 부호화 데이터의 실제의 부호량과 저역 부호량을 부호량 조정 회로(151)에 공급한다.
그리고, 부호량 조정 회로(151)는, 저역 부호화 회로(144)로부터 공급된 저역 부호량으로부터, 저역 부호화 데이터의 실제의 부호량을 감산하여 얻어지는 부호량을 부호량 일시 축적 회로(152)에 공급하고, 잉여 부호량에 가산시킨다. 이에 의해, 부호량 일시 축적 회로(152)에 기록되어 있는 잉여 부호량이 갱신된다.
이에 반해, 저역 부호화 데이터의 실제의 부호량과 저역 부호량이 일치하는 경우, 부호량 조정 회로(151)는, 잉여 부호량의 증가분을 0으로 하여 부호량 일시 축적 회로(152)에 잉여 부호량의 갱신을 행하게 한다.
스텝 S257에서, 저역 복호 회로(145)는, 저역 부호화 회로(144)로부터 공급된 저역 부호화 데이터의 복호를 행하고, 이에 의해 얻어진 복호 저역 신호를 서브 밴드 분할 회로(146)에 공급한다. 또한, 부호화 장치(131)에서는, 저역 신호의 부호화 및 복호를 행하는 부호화 방식은 다양한 방식을 취할 수 있으며, 예를 들어 ACELP(Algebraic Code Excited Linear Prediction)나 AAC(Advanced Audio Coding) 등을 채용할 수 있다.
스텝 S258에서, 서브 밴드 분할 회로(146)는, 저역 복호 회로(145)로부터 공급된 복호 저역 신호를 복수의 서브 밴드의 복호 저역 서브 밴드 신호로 분할하여, 지연 회로(147)에 공급한다. 이 서브 밴드 분할에서의, 각 서브 밴드의 하단부 및 상단부의 주파수는, 스텝 S251에서 서브 밴드 분할 회로(141)가 행하는 서브 밴드 분할과 동일하게 된다. 즉, 복호 저역 서브 밴드 신호의 각 서브 밴드는, 저역 서브 밴드 신호의 각 서브 밴드와 동일한 주파수 대역이 된다.
스텝 S259에서, 지연 회로(147)는, 서브 밴드 분할 회로(146)로부터 공급된 복호 저역 서브 밴드 신호를 특정한 시간 샘플만큼 지연시켜, 고역 부호화 회로(150)에 공급한다. 또한, 지연 회로(148) 및 지연 회로(149)도, 연속 프레임 구간수와 고역 부호량 및 고역 서브 밴드 신호를 지연시켜, 고역 부호화 회로(150)에 공급한다.
지연 회로(147)나 지연 회로(148)에서의 지연량은, 고역 서브 밴드 신호, 고역 부호량 및 복호 저역 서브 밴드 신호의 동기를 취하기 위한 것이고, 저역, 고역 각각의 부호화 방식에 따라 적절한 값을 설정할 필요가 있다. 당연, 부호화 방식의 구성에 따라서는, 각 지연 회로의 지연량이 0인 경우도 있을 수 있다. 또한, 지연 회로(153)의 기능은, 지연 회로(147)가 완수하는 기능과 동등하므로, 여기에서는 그 설명을 생략한다.
스텝 S260에서, 고역 부호화 회로(150)는, 지연 회로(147)로부터의 복호 저역 서브 밴드 신호, 지연 회로(148)로부터의 연속 프레임 구간수 및 지연 회로(149)로부터의 고역 서브 밴드 신호에 기초하여, 지연 회로(148)로부터의 고역 부호량 이하의 부호량이 되도록, 입력 신호의 고역 성분을 부호화한다.
예를 들어, 산출부(162)는, 복호 저역 서브 밴드 신호에 기초하여 상술한 식 (2)와 마찬가지의 연산을 행하여, 저역의 각 서브 밴드의 저역 서브 밴드 파워 power(ib, J)를 산출함과 함께, 마찬가지의 연산을 행하여, 고역 서브 밴드 신호로부터 고역의 각 서브 밴드의 고역 서브 밴드 파워를 산출한다. 또한, 산출부(162)는, 저역 서브 밴드 파워와, 미리 기록하고 있는 추정 계수의 세트에 기초하여 식 (3)의 연산을 행하여, 고역의 각 서브 밴드의 의사 고역 서브 밴드 파워를 산출한다.
산출부(162)는, 고역 서브 밴드 파워와 의사 고역 서브 밴드 파워에 기초하여, 상술한 식 (4) 내지 식 (7)의 연산을 행하고, 각 프레임의 평가값 Res(id, J)을 산출한다. 또한, 평가값 Res(id, J)의 산출은, 저역 서브 밴드 파워의 계산에 사용되는 추정 계수의 세트를 나타내는 계수 인덱스마다 행하여진다.
또한, 산출부(162)는, 처리 대상 구간을 연속 프레임 구간수에 의해 나타나는 수의 구간으로 등분하여, 분할된 각 구간을 연속 프레임 구간으로 한다. 산출부(162)는, 각 프레임에 대하여 계수 인덱스마다 산출한 평가값을 사용하여 상술한 식 (8)을 계산하고, 계수 인덱스마다 평가값 합 Ressum(id, igp)을 산출한다.
또한, 선택부(163)는, 각 연속 프레임 구간에 대하여 계수 인덱스마다 구해진 평가값 합에 기초하여, 도 5의 스텝 S21과 마찬가지의 처리를 행하고, 각 프레임의 계수 인덱스를 선택한다. 즉, 연속 프레임 구간에 대하여 구한 평가값 합 Ressum(id, igp)이 최소가 되는 계수 인덱스가, 그 연속 프레임 구간을 구성하는 각 프레임의 계수 인덱스로서 선택된다.
또한, 서로 인접하는 연속 프레임 구간에서 동일한 계수 인덱스가 선택되는 경우가 있으므로, 그러한 경우에는, 동일한 계수 인덱스가 선택된 연속해서 배열하는 연속 프레임 구간이, 최종적인 하나의 연속 프레임 구간이 된다.
각 프레임의 계수 인덱스가 선택되면, 고역 부호화 회로(150)는, 도 5의 스텝 S25 및 스텝 S26과 마찬가지의 처리를 행하여, 구간 정보, 개수 정보 및 계수 인덱스를 포함하는 데이터를 생성하여 부호화하여, 고역 부호화 데이터를 생성한다.
이상과 같이 하여 얻어진 고역 부호화 데이터의 부호량은, 반드시 고역 부호량 이하가 된다. 예를 들어, 연속해서 배열하는 연속 프레임 구간에서 동일한 계수 인덱스가 선택된 경우, 최종적인 연속 프레임 구간의 수는, 고역 부호량 산출 회로(142)에서 얻어진 연속 프레임 구간수 미만이 된다. 이 경우, 고역 부호화 데이터에 포함되는 계수 인덱스의 수가, 고역 부호량 산출 회로(142)에서 얻어진 연속 프레임 구간수 미만이 될 뿐만 아니라, 구간 정보의 수도 적어진다.
따라서, 이러한 경우에는, 실제의 고역 부호화 데이터의 부호량은, 고역 부호량 산출 회로(142)에서 얻어진 고역 부호량 미만이 된다.
이에 반해, 연속해서 배열하는 연속 프레임 구간에서 동일한 계수 인덱스가 선택되지 않은 경우에는, 연속 프레임 구간의 수는, 고역 부호량 산출 회로(142)에서 얻어진 연속 프레임 구간수와 일치하므로, 실제의 고역 부호화 데이터의 부호량도 고역 부호량과 일치한다.
또한, 스텝 S260에서는, 처리 대상 구간이 등분할되어 연속 프레임 구간으로 되는 경우에 대하여 설명했지만, 처리 대상 구간이 임의의 길이의 연속 프레임 구간으로 분할되도록 해도 된다.
그러한 경우, 스텝 S260에서는, 각 프레임의 평가값 Res(id, J)가 산출된 후, 도 11의 스텝 S220 및 스텝 S221과 마찬가지의 처리가 행해져서, 각 프레임의 계수 인덱스가 선택된다. 그리고, 그 후, 선택된 계수 인덱스를, 고정 길이 인덱스 및 전환 플래그를 포함하는 데이터가 부호화되어 고역 부호화 데이터가 생성된다.
스텝 S261에서, 고역 부호화 회로(150)는, 부호화에 의해 얻어진 고역 부호화 데이터의 부호량이, 스텝 S254에서 산출된 고역 부호량 미만인지의 여부를 판정한다.
스텝 S261에서, 고역 부호량 미만이 아니라고 판정된 경우, 즉 고역 부호화 데이터의 부호량이 고역 부호량과 일치하는 경우, 부호의 잉여는 발생하지 않으므로, 처리는 스텝 S265로 진행한다. 이때, 고역 부호화 회로(150)는, 고역의 부호화에 의해 얻어진 고역 부호화 데이터를 다중화 회로(154)에 공급한다.
이에 반해, 스텝 S261에서, 고역 부호량 미만이라고 판정된 경우, 스텝 S262에서, 부호량 조정 회로(151)는, 고역 부호화 데이터의 부호량과, 고역 부호량과의 차분의 부호량 일시 축적 회로(152)에 대한 축적을 행한다. 즉, 고역 부호화 데이터의 부호량과 고역 부호량의 차분의 부호량이, 부호량 일시 축적 회로(152)에 축적되어 있는 잉여 부호량에 가산되어져 나가, 잉여 부호량이 갱신된다. 이러한 부호량 일시 축적 회로(152)는, AAC에서도 비트 리졸버라는 명칭으로 사용되고 있으며, 처리 프레임간에서의 부호량의 조정이 행하여진다.
스텝 S263에서, 부호량 조정 회로(151)는, 부호량 일시 축적 회로(152)에 축적하고 있는 잉여 부호량이 미리 정해진 상한에 도달했는지의 여부를 판정한다.
예를 들어, 부호량 일시 축적 회로(152)에서는, 잉여 부호량으로 하는 것이 가능한 부호량의 상한(이하, 상한 부호량이라고 함)이 미리 정해져 있다. 부호량 조정 회로(151)는, 스텝 S262에서 개시한, 고역 부호화 데이터의 부호량과 고역 부호량의 차분의 부호량 일시 축적 회로(152)에 대한 축적 시에, 잉여 부호량이 상한 부호량에 도달한 경우, 스텝 S263에서 잉여 부호량이 상한에 달했다고 판정한다.
스텝 S263에서, 잉여 부호량이 상한에 달하지 않았다고 판정된 경우, 고역 부호화 데이터의 부호량과, 고역 부호량의 차분이, 모두 잉여 부호량에 가산되어, 잉여 부호량이 갱신된다. 그리고, 그 후, 고역 부호화 회로(150)는, 고역의 부호화에 의해 얻어진 고역 부호화 데이터를 다중화 회로(154)에 공급하고, 처리는 스텝 S265로 진행한다.
한편, 스텝 S263에서, 잉여 부호량이 상한에 달했다고 판정된 경우, 스텝 S264에서, 고역 부호화 회로(150)는, 고역 부호화 데이터에 대한 제로 채우기를 행한다.
고역 부호화 데이터의 부호량과, 고역 부호량과의 차분을 잉여 부호량에 가산해 나갈 때에, 잉여 부호량이 상한 부호량에 도달한 경우, 고역 부호화 데이터의 부호량과, 고역 부호량과의 차분 중, 아직 잉여 부호량에 대한 가산이 행해지지 않은 미처리의 부호량이 남게 된다. 이 미처리의 부호량은, 잉여 부호량에 가산할 수는 없으므로, 고역 부호화 회로(150)는, 이 미처리의 부호량만큼, 고역 부호화 데이터의 최후미에 부호 「0」을 부가하여, 미처리의 부호량을 외관상, 고역 부호화 데이터의 생성에 사용한 것으로 한다. 또한, 복호 시에 있어서는, 고역 부호화 데이터의 최후미에 부가된 부호 「0」은, 입력 신호의 복호에는 사용되지 않는다.
고역 부호화 회로(150)는, 고역 부호화 데이터의 최후미에 부호 「0」을 부가하는 제로 채우기를 행하면, 제로 채우기 후의 고역 부호화 데이터를 다중화 회로(154)에 공급하고, 처리는 스텝 S265로 진행한다.
스텝 S261에서 고역 부호량 미만이 아니라고 판정되었거나, 스텝 S263에서 잉여 부호량이 상한에 달하지 않았다고 판단되었거나 또는 스텝 S264에서 제로 채우기가 행하여지면, 스텝 S265의 처리가 행해진다.
즉, 스텝 S265에서, 다중화 회로(154)는, 지연 회로(153)로부터의 저역 부호화 데이터와, 고역 부호화 회로(150)로부터의 고역 부호화 데이터를 다중화하여 출력 부호열을 생성하고, 출력 부호열을 출력한다. 이때, 다중화 회로(154)는, 저역 부호화 데이터나 고역 부호화 데이터와 함께, 입력 신호의 저역측의 상단부와 하단부의 서브 밴드를 나타내는 인덱스도 다중화한다. 이와 같이 하여 출력 부호열이 출력되면, 부호화 처리는 종료된다.
이상과 같이, 부호화 장치(131)는, 고역 및 저역의 서브 밴드 신호로부터 연속 프레임 구간수를 산출하여 고역 부호량을 산출하고, 이 고역 부호량으로부터 정해지는 부호량으로 저역 신호를 부호화함과 함께, 저역 부호화 데이터를 복호하여 얻어진 복호 저역 신호나 고역 부호량에 기초하여, 고역 성분의 부호화를 행한다.
이와 같이, 연속 프레임 구간수로부터 고역 부호량을 산출함으로써, 고역 성분의 부호화를 행하지 않고 고역의 부호화에 필요한 부호량을 산출할 수 있다. 따라서, 종래의 방법에 비해, 각 프레임의 계수 인덱스를 선택하기 위해 필요해지는 연산만큼, 고역 부호량의 산출시의 연산량을 삭감할 수 있다. 또한, 입력 신호의 특성을 고려하여, 종래보다 적절하게 고역 부호화 데이터의 비트 사용량(부호량)을 정할 수 있다.
또한, 이상에서 설명한 부호화 기술은, 예를 들어 음성 부호화 방식의 하나인 AC-3(ATSC A/52 "Digital Audio Compression Standard(AC-3)") 등에도 적용할 수 있다.
AC-3에서는, 음성 신호의 1 프레임이 복수의 블록으로 구성되어 있고, 각 블록에서 하나 앞의 블록에서의, 주파수 변환 후의 계수의 부동 소수 표현에 있어서의 지수부의 값을 그대로 사용할 것인지 여부의 정보가 비트 스트림에 포함된다.
여기서, 1 프레임 내에서 동일한 지수부의 값을 공유하는 연속하는 블록의 집합을, 연속 블록 구간이라 칭하기로 한다. 일반적인 AC-3 방식의 부호화 장치에서는, 프레임 내에서 부호화 대상이 되는 입력 신호가 정상적, 즉 시간 변동이 적은 경우에는, 1 프레임 내에서의 연속 블록 구간의 수는 많게 구성된다.
이러한 연속 블록 구간수를, 이상에서 설명한 본 기술을 적용하여 적절하게 결정함으로써, 필요 최소한의 연속 블록 구간, 즉 필요 최소한의 비트 사용량으로 효율적으로 부호화를 행할 수 있게 된다.
또한, 상술한 일련의 처리는, 하드웨어에 의해 실행할 수도 있고, 소프트웨어에 의해 실행할 수도 있다. 일련의 처리를 소프트웨어에 의해 실행하는 경우에는, 그 소프트웨어를 구성하는 프로그램이, 전용의 하드웨어에 내장되어 있는 컴퓨터, 또는, 각종 프로그램을 인스톨함으로써 각종 기능을 실행하는 것이 가능한, 예를 들어 범용의 퍼스널 컴퓨터 등에, 프로그램 기록 매체로부터 인스톨된다.
도 14는, 상술한 일련의 처리를 프로그램에 의해 실행하는 컴퓨터의 하드웨어의 구성예를 도시하는 블록도이다.
컴퓨터에 있어서, CPU(Central Processing Unit)(301), ROM(Read Only Memory)(302), RAM(Random Access Memory)(303)은, 버스(304)에 의해 서로 접속되어 있다.
버스(304)에는, 또한, 입출력 인터페이스(305)가 접속되어 있다. 입출력 인터페이스(305)에는, 키보드, 마우스, 마이크로폰 등을 포함하는 입력부(306), 디스플레이, 스피커 등을 포함하는 출력부(307), 하드 디스크나 불휘발성의 메모리 등을 포함하는 기록부(308), 네트워크 인터페이스 등을 포함하는 통신부(309), 자기 디스크, 광 디스크, 광자기 디스크, 또는 반도체 메모리 등의 리무버블 미디어(311)를 구동하는 드라이브(310)가 접속되어 있다.
이상과 같이 구성되는 컴퓨터에서는, CPU(301)가, 예를 들어 기록부(308)에 기록되어 있는 프로그램을, 입출력 인터페이스(305) 및 버스(304)를 통해, RAM(303)에 로드하여 실행함으로써, 상술한 일련의 처리가 행해진다.
컴퓨터(CPU(301))가 실행하는 프로그램은, 예를 들어 자기 디스크(플렉시블 디스크를 포함함), 광 디스크(CD-ROM(Compact Disc-Read Only Memory), DVD(Digital Versatile Disc) 등), 광자기 디스크, 또는 반도체 메모리 등을 포함하는 패키지 미디어인 리무버블 미디어(311)에 기록하고, 또는, 근거리 네트워크, 인터넷, 디지털 위성 방송과 같은, 유선 또는 무선의 전송 매체를 통해 제공된다.
그리고, 프로그램은, 리무버블 미디어(311)를 드라이브(310)에 장착함으로써, 입출력 인터페이스(305)를 통해 기록부(308)에 인스톨할 수 있다. 또한, 프로그램은, 유선 또는 무선의 전송 매체를 통해 통신부(309)에서 수신하고, 기록부(308)에 인스톨할 수 있다. 그 외, 프로그램은, ROM(302)이나 기록부(308)에 미리 인스톨해 둘 수 있다.
또한, 컴퓨터가 실행하는 프로그램은, 본 명세서에서 설명하는 순서를 따라서 시계열로 처리가 행해지는 프로그램이어도 되고, 병렬로, 또는 호출이 행해졌을 때 등의 필요한 타이밍에서 처리가 행해지는 프로그램이어도 된다.
또한, 본 기술의 실시 형태는, 상술한 실시 형태에 한정되는 것은 아니며, 본 기술의 요지를 일탈하지 않는 범위에서 다양한 변경이 가능하다.
또한, 본 기술은, 이하의 구성으로 하는 것도 가능하다.
[1] 입력 신호의 저역측의 서브 밴드의 저역 서브 밴드 신호와, 상기 입력 신호의 고역측의 서브 밴드의 고역 서브 밴드 신호를 생성하는 서브 밴드 분할부와,
상기 저역 서브 밴드 신호와 소정의 추정 계수에 기초하여, 상기 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값인 의사 고역 서브 밴드 파워를 산출하는 의사 고역 서브 밴드 파워 산출부와,
상기 저역 서브 밴드 신호 또는 상기 고역 서브 밴드 신호 중 적어도 어느 하나에 기초하여, 구간수 결정 특징량을 산출하는 특징량 산출부와,
상기 구간수 결정 특징량에 기초하여, 상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에서의, 동일한 상기 추정 계수가 선택된 프레임을 포함하는 연속 프레임 구간의 수를 결정하는 결정부와,
결정된 상기 연속 프레임 구간의 수에 기초하여 상기 처리 대상 구간을 분할하여 얻어지는 각 상기 연속 프레임 구간에 대해서, 상기 의사 고역 서브 밴드 파워와 상기 고역 서브 밴드 파워에 기초하여, 복수의 상기 추정 계수 중에서 상기 연속 프레임 구간을 구성하는 프레임의 상기 추정 계수를 선택하는 선택부와,
상기 처리 대상 구간을 구성하는 각 상기 연속 프레임 구간의 프레임에서 선택된 상기 추정 계수를 얻기 위한 데이터를 생성하는 생성부와,
상기 입력 신호의 저역 신호를 부호화하여 저역 부호화 데이터를 생성하는 저역 부호화부와,
상기 데이터와 상기 저역 부호화 데이터를 다중화하여 출력 부호열을 생성하는 다중화부
를 구비하는 부호화 장치.
[2] 상기 구간수 결정 특징량은, 상기 고역 서브 밴드 파워의 합을 나타내는 특징량인, [1]에 기재된 부호화 장치.
[3] 상기 구간수 결정 특징량은, 상기 고역 서브 밴드 파워의 합의 시간 변동을 나타내는 특징량인, [1]에 기재된 부호화 장치.
[4] 상기 구간수 결정 특징량은, 상기 입력 신호의 주파수 형상을 나타내는 특징량인, [1]에 기재된 부호화 장치.
[5] 상기 구간수 결정 특징량은, 복수의 특징량의 선형 합 또는 비선형 합인, [1]에 기재된 부호화 장치.
[6] 상기 추정 계수마다 산출된, 상기 프레임에서의 상기 의사 고역 서브 밴드 파워와 상기 고역 서브 밴드 파워의 오차를 나타내는 평가값에 기초하여, 상기 추정 계수마다, 상기 연속 프레임 구간을 구성하는 각 프레임의 상기 평가값의 합을 산출하는 평가값 합 산출부를 더 구비하고,
상기 선택부는, 상기 추정 계수마다 산출된 상기 평가값의 합에 기초하여, 상기 연속 프레임 구간의 프레임의 상기 추정 계수를 선택하는, [1] 내지 [5] 중 어느 하나에 기재된 부호화 장치.
[7] 결정된 상기 연속 프레임 구간의 수로 상기 처리 대상 구간을 등분할하여 얻어진 각 구간이, 상기 연속 프레임 구간이 되는, [6]에 기재된 부호화 장치.
[8] 상기 선택부는, 결정된 상기 연속 프레임 구간의 수로 상기 처리 대상 구간을 분할할 때에 취할 수 있는 상기 처리 대상 구간의 분할의 조합마다, 상기 평가값의 합에 기초하여 상기 연속 프레임 구간의 프레임의 상기 추정 계수를 선택함과 함께, 각 상기 조합 중, 상기 처리 대상 구간을 구성하는 모든 상기 프레임의 선택된 상기 추정 계수의 상기 평가값의 합이 최소가 되는 상기 조합을 특정하고, 특정된 상기 조합에 있어서, 각 프레임에서 선택된 상기 추정 계수를, 그것들의 프레임의 상기 추정 계수로 하는, [6]에 기재된 부호화 장치.
[9] 상기 데이터를 부호화하여 고역 부호화 데이터를 생성하는 고역 부호화부를 더 구비하고,
상기 다중화부는, 상기 고역 부호화 데이터와 상기 저역 부호화 데이터를 다중화하여 상기 출력 부호열을 생성하는, [1] 내지 [8] 중 어느 하나에 기재된 부호화 장치.
[10] 상기 결정부는, 결정된 상기 연속 프레임 구간의 수에 기초하여, 상기 처리 대상 구간의 상기 고역 부호화 데이터의 부호량을 더 산출하고,
상기 저역 부호화부는, 상기 처리 대상 구간에 대하여 미리 정해진 부호량과, 산출된 상기 고역 부호화 데이터의 부호량으로부터 정해지는 부호량으로 상기 저역 신호를 부호화하는, [9]에 기재된 부호화 장치.
[11] 입력 신호의 저역측의 서브 밴드의 저역 서브 밴드 신호와, 상기 입력 신호의 고역측의 서브 밴드의 고역 서브 밴드 신호를 생성하고,
상기 저역 서브 밴드 신호와 소정의 추정 계수에 기초하여, 상기 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값인 의사 고역 서브 밴드 파워를 산출하고,
상기 저역 서브 밴드 신호 또는 상기 고역 서브 밴드 신호 중 적어도 어느 하나에 기초하여 구간수 결정 특징량을 산출하고,
상기 구간수 결정 특징량에 기초하여, 상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에서의, 동일한 상기 추정 계수가 선택된 프레임을 포함하는 연속 프레임 구간의 수를 결정하고,
결정된 상기 연속 프레임 구간의 수에 기초하여 상기 처리 대상 구간을 분할하여 얻어지는 각 상기 연속 프레임 구간에 대해서, 상기 의사 고역 서브 밴드 파워와 상기 고역 서브 밴드 파워에 기초하여, 복수의 상기 추정 계수 중에서 상기 연속 프레임 구간을 구성하는 프레임의 상기 추정 계수를 선택하고,
상기 처리 대상 구간을 구성하는 각 상기 연속 프레임 구간의 프레임에서 선택된 상기 추정 계수를 얻기 위한 데이터를 생성하고,
상기 입력 신호의 저역 신호를 부호화하여 저역 부호화 데이터를 생성하고,
상기 데이터와 상기 저역 부호화 데이터를 다중화하여 출력 부호열을 생성하는 스텝을 포함하는 부호화 방법.
[12] 입력 신호의 저역측의 서브 밴드의 저역 서브 밴드 신호와, 상기 입력 신호의 고역측의 서브 밴드의 고역 서브 밴드 신호를 생성하고,
상기 저역 서브 밴드 신호와 소정의 추정 계수에 기초하여, 상기 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값인 의사 고역 서브 밴드 파워를 산출하고,
상기 저역 서브 밴드 신호 또는 상기 고역 서브 밴드 신호 중 적어도 어느 하나에 기초하여 구간수 결정 특징량을 산출하고,
상기 구간수 결정 특징량에 기초하여, 상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에서의, 동일한 상기 추정 계수가 선택된 프레임을 포함하는 연속 프레임 구간의 수를 결정하고,
결정된 상기 연속 프레임 구간의 수에 기초하여 상기 처리 대상 구간을 분할하여 얻어지는 각 상기 연속 프레임 구간에 대해서, 상기 의사 고역 서브 밴드 파워와 상기 고역 서브 밴드 파워에 기초하여, 복수의 상기 추정 계수 중에서 상기 연속 프레임 구간을 구성하는 프레임의 상기 추정 계수를 선택하고,
상기 처리 대상 구간을 구성하는 각 상기 연속 프레임 구간의 프레임에서 선택된 상기 추정 계수를 얻기 위한 데이터를 생성하고,
상기 입력 신호의 저역 신호를 부호화하여 저역 부호화 데이터를 생성하고,
상기 데이터와 상기 저역 부호화 데이터를 다중화하여 출력 부호열을 생성하는 스텝을 포함하는 처리를 컴퓨터에 실행시키는 프로그램.
[13] 입력 신호의 저역 서브 밴드 신호와 소정의 추정 계수에 기초하여, 상기 입력 신호의 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값이 산출되고, 상기 입력 신호로부터 추출된 구간수 결정 특징량에 기초하여, 상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에서의, 동일한 상기 추정 계수가 선택되는 프레임을 포함하는 연속 프레임 구간의 수가 결정되고, 결정된 상기 연속 프레임 구간의 수에 기초하여 상기 처리 대상 구간을 분할하여 얻어지는 각 상기 연속 프레임 구간에 대해서, 상기 추정값과 상기 고역 서브 밴드 파워에 기초하여, 복수의 상기 추정 계수 중에서 상기 연속 프레임 구간을 구성하는 프레임의 상기 추정 계수가 선택되고, 그 선택 결과에 기초하여 생성된, 상기 처리 대상 구간을 구성하는 각 상기 연속 프레임 구간의 프레임에서 선택된 상기 추정 계수를 얻기 위한 데이터와, 상기 입력 신호의 저역 신호를 부호화하여 얻어진 저역 부호화 데이터에, 입력 부호열을 비다중화하는 비다중화부와,
상기 저역 부호화 데이터를 복호하여 저역 신호를 생성하는 저역 복호부와,
상기 데이터로부터 얻어진 상기 추정 계수와, 상기 복호로 얻어진 저역 신호에 기초하여 고역 신호를 생성하는 고역 신호 생성부와,
상기 고역 신호와 상기 복호로 얻어진 저역 신호에 기초하여 출력 신호를 생성하는 합성부를 구비하는 복호 장치.
[14] 상기 데이터를 복호하여 상기 추정 계수를 얻는 고역 복호부를 더 구비하는, [13]에 기재된 복호 장치.
[15] 상기 추정 계수마다 산출된, 상기 프레임에서의 상기 추정값과 상기 고역 서브 밴드 파워의 오차를 나타내는 평가값에 기초하여, 상기 추정 계수마다, 상기 연속 프레임 구간을 구성하는 각 프레임의 상기 평가값의 합이 산출되고, 상기 추정 계수마다 산출된 상기 평가값의 합에 기초하여, 상기 연속 프레임 구간의 프레임의 상기 추정 계수가 선택되는, [13] 또는 [14]에 기재된 복호 장치.
[16] 결정된 상기 연속 프레임 구간의 수로 상기 처리 대상 구간을 등분할하여 얻어진 각 구간이, 상기 연속 프레임 구간이 되는, [15]에 기재된 복호 장치.
[17] 결정된 상기 연속 프레임 구간의 수에 상기 처리 대상 구간을 분할할 때에 취할 수 있는 상기 처리 대상 구간의 분할의 조합마다, 상기 평가값의 합에 기초하여 상기 연속 프레임 구간의 프레임의 상기 추정 계수가 선택됨과 함께, 각 상기 조합 중, 상기 처리 대상 구간을 구성하는 모든 상기 프레임의 선택된 상기 추정 계수의 상기 평가값의 합이 최소가 되는 상기 조합이 특정되고, 특정된 상기 조합에 있어서, 각 프레임에서 선택된 상기 추정 계수가, 그것들의 프레임의 상기 추정 계수가 되는, [15]에 기재된 복호 장치.
[18] 입력 신호의 저역 서브 밴드 신호와 소정의 추정 계수에 기초하여, 상기 입력 신호의 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값이 산출되고, 상기 입력 신호로부터 추출된 구간수 결정 특징량에 기초하여, 상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에서의, 동일한 상기 추정 계수가 선택되는 프레임을 포함하는 연속 프레임 구간의 수가 결정되고, 결정된 상기 연속 프레임 구간의 수에 기초하여 상기 처리 대상 구간을 분할하여 얻어지는 각 상기 연속 프레임 구간에 대해서, 상기 추정값과 상기 고역 서브 밴드 파워에 기초하여, 복수의 상기 추정 계수 중에서 상기 연속 프레임 구간을 구성하는 프레임의 상기 추정 계수가 선택되고, 그 선택 결과에 기초하여 생성된, 상기 처리 대상 구간을 구성하는 각 상기 연속 프레임 구간의 프레임에서 선택된 상기 추정 계수를 얻기 위한 데이터와, 상기 입력 신호의 저역 신호를 부호화하여 얻어진 저역 부호화 데이터에, 입력 부호열을 비다중화하고,
상기 저역 부호화 데이터를 복호하여 저역 신호를 생성하고,
상기 데이터로부터 얻어진 상기 추정 계수와, 상기 복호로 얻어진 저역 신호에 기초하여 고역 신호를 생성하고,
상기 고역 신호와 상기 복호로 얻어진 저역 신호에 기초하여 출력 신호를 생성하는 스텝을 포함하는 복호 방법.
[19] 입력 신호의 저역 서브 밴드 신호와 소정의 추정 계수에 기초하여, 상기 입력 신호의 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값이 산출되고, 상기 입력 신호로부터 추출된 구간수 결정 특징량에 기초하여, 상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에서의, 동일한 상기 추정 계수가 선택되는 프레임을 포함하는 연속 프레임 구간의 수가 결정되고, 결정된 상기 연속 프레임 구간의 수에 기초하여 상기 처리 대상 구간을 분할하여 얻어지는 각 상기 연속 프레임 구간에 대해서, 상기 추정값과 상기 고역 서브 밴드 파워에 기초하여, 복수의 상기 추정 계수 중에서 상기 연속 프레임 구간을 구성하는 프레임의 상기 추정 계수가 선택되고, 그 선택 결과에 기초하여 생성된, 상기 처리 대상 구간을 구성하는 각 상기 연속 프레임 구간의 프레임에서 선택된 상기 추정 계수를 얻기 위한 데이터와, 상기 입력 신호의 저역 신호를 부호화하여 얻어진 저역 부호화 데이터에, 입력 부호열을 비다중화하고,
상기 저역 부호화 데이터를 복호하여 저역 신호를 생성하고,
상기 데이터로부터 얻어진 상기 추정 계수와, 상기 복호로 얻어진 저역 신호에 기초하여 고역 신호를 생성하고,
상기 고역 신호와 상기 복호로 얻어진 저역 신호에 기초하여 출력 신호를 생성하는 스텝을 포함하는 처리를 컴퓨터에 실행시키는 프로그램.
11 : 부호화 장치 32 : 저역 부호화 회로
33 : 서브 밴드 분할 회로 34 : 특징량 산출 회로
35 : 의사 고역 서브 밴드 파워 산출 회로
36 : 구간수 결정 특징량 산출 회로
37 : 의사 고역 서브 밴드 파워 차분 산출 회로
38 : 고역 부호화 회로 39 : 다중화 회로
51 : 결정부 52 : 평가값 산출부
53 : 선택부 54 : 생성부

Claims (19)

  1. 입력 신호의 저역측의 서브 밴드의 저역 서브 밴드 신호와, 상기 입력 신호의 고역측의 서브 밴드의 고역 서브 밴드 신호를 생성하는 서브 밴드 분할부와,
    상기 저역 서브 밴드 신호와 소정의 추정 계수에 기초하여, 상기 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값인 의사 고역 서브 밴드 파워를 산출하는 의사 고역 서브 밴드 파워 산출부와,
    상기 저역 서브 밴드 신호 또는 상기 고역 서브 밴드 신호 중 적어도 어느 하나에 기초하여, 구간수 결정 특징량을 산출하는 특징량 산출부와,
    상기 구간수 결정 특징량에 기초하여, 상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에서의, 동일한 상기 추정 계수가 선택된 프레임을 포함하는 연속 프레임 구간의 수를 결정하는 결정부와,
    결정된 상기 연속 프레임 구간의 수에 기초하여 상기 처리 대상 구간을 분할하여 얻어지는 각 상기 연속 프레임 구간에 대해서, 상기 의사 고역 서브 밴드 파워와 상기 고역 서브 밴드 파워에 기초하여, 복수의 상기 추정 계수 중에서 상기 연속 프레임 구간을 구성하는 프레임의 상기 추정 계수를 선택하는 선택부와,
    상기 처리 대상 구간을 구성하는 각 상기 연속 프레임 구간의 프레임에서 선택된 상기 추정 계수를 얻기 위한 데이터를 생성하는 생성부와,
    상기 입력 신호의 저역 신호를 부호화하여 저역 부호화 데이터를 생성하는 저역 부호화부와,
    상기 데이터와 상기 저역 부호화 데이터를 다중화하여 출력 부호열을 생성하는 다중화부
    를 구비하는 부호화 장치.
  2. 제1항에 있어서,
    상기 구간수 결정 특징량은, 상기 고역 서브 밴드 파워의 합을 나타내는 특징량인, 부호화 장치.
  3. 제1항에 있어서,
    상기 구간수 결정 특징량은, 상기 고역 서브 밴드 파워의 합의 시간 변동을 나타내는 특징량인, 부호화 장치.
  4. 제1항에 있어서,
    상기 구간수 결정 특징량은, 상기 입력 신호의 주파수 형상을 나타내는 특징량인, 부호화 장치.
  5. 제1항에 있어서,
    상기 구간수 결정 특징량은, 복수의 특징량의 선형 합 또는 비선형 합인, 부호화 장치.
  6. 제1항에 있어서,
    상기 추정 계수마다 산출된, 상기 프레임에서의 상기 의사 고역 서브 밴드 파워와 상기 고역 서브 밴드 파워의 오차를 나타내는 평가값에 기초하여, 상기 추정 계수마다, 상기 연속 프레임 구간을 구성하는 각 프레임의 상기 평가값의 합을 산출하는 평가값 합 산출부를 더 구비하고,
    상기 선택부는, 상기 추정 계수마다 산출된 상기 평가값의 합에 기초하여, 상기 연속 프레임 구간의 프레임의 상기 추정 계수를 선택하는, 부호화 장치.
  7. 제6항에 있어서,
    결정된 상기 연속 프레임 구간의 수로 상기 처리 대상 구간을 등분할하여 얻어진 각 구간이, 상기 연속 프레임 구간이 되는, 부호화 장치.
  8. 제6항에 있어서,
    상기 선택부는, 결정된 상기 연속 프레임 구간의 수로 상기 처리 대상 구간을 분할할 때에 취할 수 있는 상기 처리 대상 구간의 분할의 조합마다, 상기 평가값의 합에 기초하여 상기 연속 프레임 구간의 프레임의 상기 추정 계수를 선택함과 함께, 각 상기 조합 중, 상기 처리 대상 구간을 구성하는 모든 상기 프레임의 선택된 상기 추정 계수의 상기 평가값의 합이 최소가 되는 상기 조합을 특정하고, 특정된 상기 조합에 있어서, 각 프레임에서 선택된 상기 추정 계수를, 그것들의 프레임의 상기 추정 계수로 하는, 부호화 장치.
  9. 제1항에 있어서,
    상기 데이터를 부호화하여 고역 부호화 데이터를 생성하는 고역 부호화부를 더 구비하고,
    상기 다중화부는, 상기 고역 부호화 데이터와 상기 저역 부호화 데이터를 다중화하여 상기 출력 부호열을 생성하는, 부호화 장치.
  10. 제9항에 있어서,
    상기 결정부는, 결정된 상기 연속 프레임 구간의 수에 기초하여, 상기 처리 대상 구간의 상기 고역 부호화 데이터의 부호량을 더 산출하고,
    상기 저역 부호화부는, 상기 처리 대상 구간에 대하여 미리 정해진 부호량과, 산출된 상기 고역 부호화 데이터의 부호량으로부터 정해지는 부호량으로 상기 저역 신호를 부호화하는, 부호화 장치.
  11. 입력 신호의 저역측의 서브 밴드의 저역 서브 밴드 신호와, 상기 입력 신호의 고역측의 서브 밴드의 고역 서브 밴드 신호를 생성하고,
    상기 저역 서브 밴드 신호와 소정의 추정 계수에 기초하여, 상기 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값인 의사 고역 서브 밴드 파워를 산출하고,
    상기 저역 서브 밴드 신호 또는 상기 고역 서브 밴드 신호 중 적어도 어느 하나에 기초하여, 구간수 결정 특징량을 산출하고,
    상기 구간수 결정 특징량에 기초하여, 상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에서의, 동일한 상기 추정 계수가 선택된 프레임을 포함하는 연속 프레임 구간의 수를 결정하고,
    결정된 상기 연속 프레임 구간의 수에 기초하여 상기 처리 대상 구간을 분할하여 얻어지는 각 상기 연속 프레임 구간에 대해서, 상기 의사 고역 서브 밴드 파워와 상기 고역 서브 밴드 파워에 기초하여, 복수의 상기 추정 계수 중에서 상기 연속 프레임 구간을 구성하는 프레임의 상기 추정 계수를 선택하고,
    상기 처리 대상 구간을 구성하는 각 상기 연속 프레임 구간의 프레임에서 선택된 상기 추정 계수를 얻기 위한 데이터를 생성하고,
    상기 입력 신호의 저역 신호를 부호화하여 저역 부호화 데이터를 생성하고,
    상기 데이터와 상기 저역 부호화 데이터를 다중화하여 출력 부호열을 생성하는
    스텝을 포함하는 부호화 방법.
  12. 입력 신호의 저역측의 서브 밴드의 저역 서브 밴드 신호와, 상기 입력 신호의 고역측의 서브 밴드의 고역 서브 밴드 신호를 생성하고,
    상기 저역 서브 밴드 신호와 소정의 추정 계수에 기초하여, 상기 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값인 의사 고역 서브 밴드 파워를 산출하고,
    상기 저역 서브 밴드 신호 또는 상기 고역 서브 밴드 신호 중 적어도 어느 하나에 기초하여, 구간수 결정 특징량을 산출하고,
    상기 구간수 결정 특징량에 기초하여, 상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에서의, 동일한 상기 추정 계수가 선택된 프레임을 포함하는 연속 프레임 구간의 수를 결정하고,
    결정된 상기 연속 프레임 구간의 수에 기초하여 상기 처리 대상 구간을 분할하여 얻어지는 각 상기 연속 프레임 구간에 대해서, 상기 의사 고역 서브 밴드 파워와 상기 고역 서브 밴드 파워에 기초하여, 복수의 상기 추정 계수 중에서 상기 연속 프레임 구간을 구성하는 프레임의 상기 추정 계수를 선택하고,
    상기 처리 대상 구간을 구성하는 각 상기 연속 프레임 구간의 프레임에서 선택된 상기 추정 계수를 얻기 위한 데이터를 생성하고,
    상기 입력 신호의 저역 신호를 부호화하여 저역 부호화 데이터를 생성하고,
    상기 데이터와 상기 저역 부호화 데이터를 다중화하여 출력 부호열을 생성하는
    스텝을 포함하는 처리를 컴퓨터에 실행시키는 프로그램.
  13. 입력 신호의 저역 서브 밴드 신호와 소정의 추정 계수에 기초하여, 상기 입력 신호의 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값이 산출되고, 상기 입력 신호로부터 추출된 구간수 결정 특징량에 기초하여, 상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에서의, 동일한 상기 추정 계수가 선택되는 프레임을 포함하는 연속 프레임 구간의 수가 결정되고, 결정된 상기 연속 프레임 구간의 수에 기초하여 상기 처리 대상 구간을 분할하여 얻어지는 각 상기 연속 프레임 구간에 대해서, 상기 추정값과 상기 고역 서브 밴드 파워에 기초하여, 복수의 상기 추정 계수 중에서 상기 연속 프레임 구간을 구성하는 프레임의 상기 추정 계수가 선택되고, 그 선택 결과에 기초하여 생성된, 상기 처리 대상 구간을 구성하는 각 상기 연속 프레임 구간의 프레임에서 선택된 상기 추정 계수를 얻기 위한 데이터와, 상기 입력 신호의 저역 신호를 부호화하여 얻어진 저역 부호화 데이터에, 입력 부호열을 비다중화하는 비다중화부와,
    상기 저역 부호화 데이터를 복호하여 저역 신호를 생성하는 저역 복호부와,
    상기 데이터로부터 얻어진 상기 추정 계수와, 상기 복호로 얻어진 저역 신호에 기초하여 고역 신호를 생성하는 고역 신호 생성부와,
    상기 고역 신호와 상기 복호로 얻어진 저역 신호에 기초하여 출력 신호를 생성하는 합성부
    를 구비하는 복호 장치.
  14. 제13항에 있어서,
    상기 데이터를 복호하여 상기 추정 계수를 얻는 고역 복호부를 더 구비하는, 복호 장치.
  15. 제14항에 있어서,
    상기 추정 계수마다 산출된, 상기 프레임에서의 상기 추정값과 상기 고역 서브 밴드 파워의 오차를 나타내는 평가값에 기초하여, 상기 추정 계수마다, 상기 연속 프레임 구간을 구성하는 각 프레임의 상기 평가값의 합이 산출되고, 상기 추정 계수마다 산출된 상기 평가값의 합에 기초하여, 상기 연속 프레임 구간의 프레임의 상기 추정 계수가 선택되는, 복호 장치.
  16. 제15항에 있어서,
    결정된 상기 연속 프레임 구간의 수로 상기 처리 대상 구간을 등분할하여 얻어진 각 구간이, 상기 연속 프레임 구간이 되는, 복호 장치.
  17. 제15항에 있어서,
    결정된 상기 연속 프레임 구간의 수로 상기 처리 대상 구간을 분할할 때에 취할 수 있는 상기 처리 대상 구간의 분할의 조합마다, 상기 평가값의 합에 기초하여 상기 연속 프레임 구간의 프레임의 상기 추정 계수가 선택됨과 함께, 각 상기 조합 중, 상기 처리 대상 구간을 구성하는 모든 상기 프레임의 선택된 상기 추정 계수의 상기 평가값의 합이 최소가 되는 상기 조합이 특정되고, 특정된 상기 조합에 있어서, 각 프레임에서 선택된 상기 추정 계수가, 그것들의 프레임의 상기 추정 계수가 되는, 복호 장치.
  18. 입력 신호의 저역 서브 밴드 신호와 소정의 추정 계수에 기초하여, 상기 입력 신호의 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값이 산출되고, 상기 입력 신호로부터 추출된 구간수 결정 특징량에 기초하여, 상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에서의, 동일한 상기 추정 계수가 선택되는 프레임을 포함하는 연속 프레임 구간의 수가 결정되고, 결정된 상기 연속 프레임 구간의 수에 기초하여 상기 처리 대상 구간을 분할하여 얻어지는 각 상기 연속 프레임 구간에 대해서, 상기 추정값과 상기 고역 서브 밴드 파워에 기초하여, 복수의 상기 추정 계수 중에서 상기 연속 프레임 구간을 구성하는 프레임의 상기 추정 계수가 선택되고, 그 선택 결과에 기초하여 생성된, 상기 처리 대상 구간을 구성하는 각 상기 연속 프레임 구간의 프레임에서 선택된 상기 추정 계수를 얻기 위한 데이터와, 상기 입력 신호의 저역 신호를 부호화하여 얻어진 저역 부호화 데이터에, 입력 부호열을 비다중화하고,
    상기 저역 부호화 데이터를 복호하여 저역 신호를 생성하고,
    상기 데이터로부터 얻어진 상기 추정 계수와, 상기 복호로 얻어진 저역 신호에 기초하여 고역 신호를 생성하고,
    상기 고역 신호와 상기 복호로 얻어진 저역 신호에 기초하여 출력 신호를 생성하는
    스텝을 포함하는 복호 방법.
  19. 입력 신호의 저역 서브 밴드 신호와 소정의 추정 계수에 기초하여, 상기 입력 신호의 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값이 산출되고, 상기 입력 신호로부터 추출된 구간수 결정 특징량에 기초하여, 상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에서의, 동일한 상기 추정 계수가 선택되는 프레임을 포함하는 연속 프레임 구간의 수가 결정되고, 결정된 상기 연속 프레임 구간의 수에 기초하여 상기 처리 대상 구간을 분할하여 얻어지는 각 상기 연속 프레임 구간에 대해서, 상기 추정값과 상기 고역 서브 밴드 파워에 기초하여, 복수의 상기 추정 계수 중에서 상기 연속 프레임 구간을 구성하는 프레임의 상기 추정 계수가 선택되고, 그 선택 결과에 기초하여 생성된, 상기 처리 대상 구간을 구성하는 각 상기 연속 프레임 구간의 프레임에서 선택된 상기 추정 계수를 얻기 위한 데이터와, 상기 입력 신호의 저역 신호를 부호화하여 얻어진 저역 부호화 데이터에, 입력 부호열을 비다중화하고,
    상기 저역 부호화 데이터를 복호하여 저역 신호를 생성하고,
    상기 데이터로부터 얻어진 상기 추정 계수와, 상기 복호로 얻어진 저역 신호에 기초하여 고역 신호를 생성하고,
    상기 고역 신호와 상기 복호로 얻어진 저역 신호에 기초하여 출력 신호를 생성하는
    스텝을 포함하는 처리를 컴퓨터에 실행시키는 프로그램.
KR1020147003607A 2011-08-24 2012-08-14 부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램 KR20140050050A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JPJP-P-2011-182449 2011-08-24
JP2011182449A JP6037156B2 (ja) 2011-08-24 2011-08-24 符号化装置および方法、並びにプログラム
PCT/JP2012/070683 WO2013027630A1 (ja) 2011-08-24 2012-08-14 符号化装置および方法、復号装置および方法、並びにプログラム

Publications (1)

Publication Number Publication Date
KR20140050050A true KR20140050050A (ko) 2014-04-28

Family

ID=47746377

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020147003607A KR20140050050A (ko) 2011-08-24 2012-08-14 부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램

Country Status (12)

Country Link
US (1) US9842603B2 (ko)
EP (1) EP2750131A4 (ko)
JP (1) JP6037156B2 (ko)
KR (1) KR20140050050A (ko)
CN (1) CN103765510B (ko)
AU (1) AU2012297804B2 (ko)
BR (1) BR112014003672A2 (ko)
CA (1) CA2840788A1 (ko)
MX (1) MX2014001871A (ko)
RU (1) RU2586011C2 (ko)
WO (1) WO2013027630A1 (ko)
ZA (1) ZA201401181B (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5704397B2 (ja) 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5975243B2 (ja) * 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
EP2631906A1 (en) * 2012-02-27 2013-08-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Phase coherence control for harmonic signals in perceptual audio codecs
US10083700B2 (en) 2012-07-02 2018-09-25 Sony Corporation Decoding device, decoding method, encoding device, encoding method, and program
WO2014168777A1 (en) * 2013-04-10 2014-10-16 Dolby Laboratories Licensing Corporation Speech dereverberation methods, devices and systems
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
KR102329309B1 (ko) * 2013-09-12 2021-11-19 돌비 인터네셔널 에이비 Qmf 기반 처리 데이터의 시간 정렬
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
CN109963338B (zh) * 2017-12-25 2023-07-21 成都鼎桥通信技术有限公司 一种特殊的lte-fdd小区中上行载波的调度方法和***
CN110989983B (zh) * 2019-11-28 2022-11-29 深圳航天智慧城市***技术研究院有限公司 一种零编码的应用软件快速构建***

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ZA9510509B (en) * 1994-12-23 1996-05-30 Qualcomm Inc Dual-mode digital FM communication system
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DE60133562T2 (de) * 2000-08-18 2009-05-28 Samsung Electronics Co., Ltd., Suwon Kanalcodierungs-decodierungsvorrichtung und -verfahren für ein cdma-mobilkommunikationssystem
US8417515B2 (en) 2004-05-14 2013-04-09 Panasonic Corporation Encoding device, decoding device, and method thereof
WO2006049205A1 (ja) 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル符号化装置
JP4899359B2 (ja) 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
KR100813259B1 (ko) 2005-07-13 2008-03-13 삼성전자주식회사 입력신호의 계층적 부호화/복호화 장치 및 방법
CN101120584B (zh) * 2005-11-18 2011-04-20 索尼株式会社 编码装置和方法、解码装置和方法、以及传输***
JP2007178529A (ja) * 2005-12-27 2007-07-12 Matsushita Electric Ind Co Ltd 符号化オーディオ信号再生装置及び符号化オーディオ信号再生方法
JP2007333785A (ja) * 2006-06-12 2007-12-27 Matsushita Electric Ind Co Ltd オーディオ信号符号化装置およびオーディオ信号符号化方法
JP5141180B2 (ja) * 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
KR101355376B1 (ko) 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
EP2294770B1 (en) 2008-06-20 2013-08-07 Rambus, Inc. Frequency responsive bus coding
JP5203077B2 (ja) * 2008-07-14 2013-06-05 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
JP2010079275A (ja) * 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
GB2466201B (en) 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
JP5106484B2 (ja) * 2009-06-15 2012-12-26 富士通テレコムネットワークス株式会社 可変電源装置とモータ駆動制御装置とそれらの保護回路動作方法
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5598536B2 (ja) 2010-03-31 2014-10-01 富士通株式会社 帯域拡張装置および帯域拡張方法
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US8560330B2 (en) 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
US9047875B2 (en) 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5704397B2 (ja) 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
BR112013026333B1 (pt) * 2011-04-28 2021-05-18 Telefonaktiebolaget L M Ericsson (Publ) método de classificação de sinal de áudio baseada em quadro, classificador de áudio, dispositivo de comunicação de áudio, e, disposição de codec de áudio
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5975243B2 (ja) 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5845760B2 (ja) 2011-09-15 2016-01-20 ソニー株式会社 音声処理装置および方法、並びにプログラム
WO2013154027A1 (ja) 2012-04-13 2013-10-17 ソニー株式会社 復号装置および方法、オーディオ信号処理装置および方法、並びにプログラム
JP5997592B2 (ja) 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
US10083700B2 (en) 2012-07-02 2018-09-25 Sony Corporation Decoding device, decoding method, encoding device, encoding method, and program
US9437198B2 (en) 2012-07-02 2016-09-06 Sony Corporation Decoding device, decoding method, encoding device, encoding method, and program
JP2014123011A (ja) 2012-12-21 2014-07-03 Sony Corp 雑音検出装置および方法、並びに、プログラム

Also Published As

Publication number Publication date
RU2586011C2 (ru) 2016-06-10
AU2012297804A1 (en) 2014-02-06
BR112014003672A2 (pt) 2017-03-01
US20140200899A1 (en) 2014-07-17
CA2840788A1 (en) 2013-02-24
CN103765510A (zh) 2014-04-30
JP6037156B2 (ja) 2016-11-30
US9842603B2 (en) 2017-12-12
RU2014105814A (ru) 2015-08-27
JP2013044922A (ja) 2013-03-04
EP2750131A1 (en) 2014-07-02
AU2012297804B2 (en) 2016-12-01
WO2013027630A1 (ja) 2013-02-28
EP2750131A4 (en) 2015-04-22
MX2014001871A (es) 2014-05-30
CN103765510B (zh) 2016-08-17
ZA201401181B (en) 2014-09-25

Similar Documents

Publication Publication Date Title
KR20140050050A (ko) 부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램
US10546594B2 (en) Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
JP5942358B2 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
KR102055022B1 (ko) 부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램
EP2693430B1 (en) Encoding apparatus and method, and program
KR102048672B1 (ko) 신호 처리 장치 및 방법, 및 컴퓨터 판독가능 기록 매체
KR101346462B1 (ko) 신호 부호화 장치 및 방법, 신호 복호 장치 및 방법, 및 기록 매체

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid