JP6457552B2 - 符号化装置、復号装置、これらの方法及びプログラム - Google Patents

符号化装置、復号装置、これらの方法及びプログラム Download PDF

Info

Publication number
JP6457552B2
JP6457552B2 JP2016561570A JP2016561570A JP6457552B2 JP 6457552 B2 JP6457552 B2 JP 6457552B2 JP 2016561570 A JP2016561570 A JP 2016561570A JP 2016561570 A JP2016561570 A JP 2016561570A JP 6457552 B2 JP6457552 B2 JP 6457552B2
Authority
JP
Japan
Prior art keywords
unit
sequence
coefficient
linear prediction
spectrum envelope
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016561570A
Other languages
English (en)
Other versions
JPWO2016084764A1 (ja
Inventor
守谷 健弘
健弘 守谷
優 鎌本
優 鎌本
登 原田
登 原田
弘和 亀岡
弘和 亀岡
亮介 杉浦
亮介 杉浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
University of Tokyo NUC
Original Assignee
Nippon Telegraph and Telephone Corp
University of Tokyo NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, University of Tokyo NUC filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2016084764A1 publication Critical patent/JPWO2016084764A1/ja
Application granted granted Critical
Publication of JP6457552B2 publication Critical patent/JP6457552B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/198Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including smoothing of a sequence of encoding parameters, e.g. by averaging, by choice of the maximum, minimum or median value
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

この発明は、音信号等の時系列信号を符号化又は復号する技術に関する。
低ビット(例えば10kbit/s〜20kbit/s程度)の音信号の符号化方法として、DFT(離散フーリエ変換)やMDCT(変形離散コサイン変換)などの周波数領域での直交変換係数に対する適応符号化が知られている。例えば標準規格技術であるMEPG USAC(Unified Speech and Audio Coding)は、TCX(transform coded excitation:変換符号化励振)符号化モードを持ち、この中ではMDCT係数をフレームごとに正規化して量子化後に可変長符号化している(例えば、非特許文献1参照)。
従来のTCXに基づく符号化装置の構成例を図1に示す。図1の符号化装置は、周波数領域変換部11と、線形予測分析部12と、振幅スペクトル包絡系列生成部13と、包絡正規部14と、符号化部15とを備えている。以下、図1の各部について説明する。
<周波数領域変換部11>
周波数領域変換部11には、時間領域の音信号が入力される。音信号は、例えば音声信号又は音響信号である。
周波数領域変換部11は、所定の時間長のフレーム単位で、入力された時間領域の音信号を周波数領域のN点のMDCT係数列X(0),X(1),…,X(N-1)に変換する。Nは正の整数である。
変換されたMDCT係数列X(0),X(1),…,X(N-1)は、包絡正規化部14に出力される。
<線形予測分析部12>
線形予測分析部12には、時間領域の音信号が入力される。
線形予測分析部12は、フレーム単位で入力された音信号に対する線形予測分析を行うことにより、線形予測係数α12,…,αpを生成する。また、線形予測分析部12は、生成された線形予測係数α12,…,αpを符号化して線形予測係数符号を生成する。線形予測係数符号の例は線形予測係数α12,…,αpに対応するLSP(Line Spectrum Pairs) パラメータ列の量子化値の列に対応する符号であるLSP符号である。pは2以上の整数である。
また、線形予測分析部12は、生成された線形予測係数符号に対応する線形予測係数である量子化線形予測係数^α1,^α2,…,^αpを生成する。
生成された量子化線形予測係数^α1,^α2,…,^αpは、振幅スペクトル包絡系列生成部13に出力される。また、生成された線形予測係数符号は、復号装置に出力される。
線形予測分析には、例えば、フレーム単位で入力された音信号に対する自己相関を求めて、求めた自己相関を利用してLevinson-Durbinアルゴリズムを行うことにより線形予測係数を得る方法が用いられる。または、線形予測分析部12に周波数領域変換部11が求めたMDCT係数列を入力し、MDCT係数列の各係数の自乗値の系列を逆フーリエ変換したものに対して、Levinson-Durbinアルゴリズムを行うことにより線形予測係数を得る方法を用いてもよい。
<振幅スペクトル包絡系列生成部13>
振幅スペクトル包絡系列生成部13には、線形予測分析部12が生成した量子化線形予測係数^α1,^α2,…,^αpが入力される。
振幅スペクトル包絡系列生成部13は、量子化線形予測係数^α1,^α2,…,^αpを用いて、以下の式(1)により定義される平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)を生成する。・を実数としてexp(・)はネイピア数を底とする指数関数、jは虚数単位である。γは、1以下の正の定数であり、以下の式(2)により定義される振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)の振幅の凹凸を鈍らせる係数、言い換えれば振幅スペクトル包絡系列を平滑化する係数である。
Figure 0006457552
生成された平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)は、包絡正規化部14に出力される。
<包絡正規化部14>
包絡正規化部14には、周波数領域変換部11が生成したMDCT係数列X(0),X(1),…,X(N-1)及び振幅スペクトル包絡系列生成部13が出力した平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)が入力される。
包絡正規化部14は、MDCT係数列の各係数X(k)を平滑化振幅スペクトル包絡系列の各値^Wγ(k)で正規化することにより、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)を生成する。つまり、XN(k)= X(k)/^Wγ(k) [k=0,1,…,N-1]である。
生成された正規化MDCT係数列XN(0),XN(1),…,XN(N-1)は、符号化部15に出力される。
ここでは、聴覚的に歪が小さくなるような量子化の実現のために、包絡正規化部14は、振幅スペクトル包絡を鈍らせた系列である平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)を用いて、フレーム単位でMDCT係数列X(0),X(1),…,X(N-1)を正規化している。
<符号化部15>
符号化部15には、包絡正規化部14が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)が入力される。
符号化部15は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)に対応する符号を生成する。
生成された正規化MDCT係数列XN(0),XN(1),…,XN(N-1)に対応する符号は、復号装置に出力される。
符号化部15は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数を利得(グローバルゲイン)gで割り算し、その結果を量子化した整数値による系列である量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を符号化して得られる符号を整数信号符号とする。非特許文献1の技術では、符号化部15は、この整数信号符号のビット数が、予め配分されたビット数である配分ビット数B以下、かつ、なるべく大きな値となるような利得gを決定する。そして、符号化部15は、この決定された利得gに対応する利得符号と、この決定された利得gに対応する整数信号符号とを生成する。
この生成された利得符号及び整数信号符号が、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)に対応する符号として復号装置に出力される。
[符号化部15が行う符号化処理の具体例]
符号化部15が行う符号化処理の具体例について説明する。
符号化部15の具体例の構成例を図2に示す。符号化部15は、図2に示すように、利得取得部151と、量子化部152と、Riceパラメータ決定部153と、Golomb-Rice符号化部154と、利得符号化部155と、判定部156と、利得更新部157とを備えている。以下、図2の各部について説明する。
<利得取得部151>
利得取得部151は、入力された正規化MDCT係数列XN(0),XN(1),…,XN(N-1)から、整数信号符号のビット数が、予め配分されたビット数である配分ビット数B以下、かつ、なるべく大きな値となるようなグローバルゲインgを決定して出力する。利得取得部151が得たグローバルゲインgは、量子化部152で用いられるグローバルゲインの初期値となる。
<量子化部152>
量子化部152は、入力された正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数を利得取得部151または利得更新部157が得たグローバルゲインgで割り算した結果の整数部分による系列である量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を得て出力する。
ここで、量子化部152が初回に実行される際に用いられるグローバルゲインgは、利得取得部151が得たグローバルゲインg、すなわちグローバルゲインの初期値である。また、量子化部152が2回目以降に実行される際に用いられるグローバルゲインgは、利得更新部157が得たグローバルゲインg、すなわちグローバルゲインの更新値である。
<Riceパラメータ決定部153>
Riceパラメータ決定部153は、量子化部152が得た量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)から、下記の式(3)によりRiceパラメータrを得て出力する。
Figure 0006457552
ただし、・を任意の数として、[・]は・に対する丸め操作であるものとする。
<Golomb-Rice符号化部154>
Golomb-Rice符号化部154は、Riceパラメータ決定部153が得たRiceパラメータrを用いて、量子化部152が得た量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)をGolomb-Rice符号化して整数信号符号を得て、整数信号符号と、整数信号符号のビット数である消費ビット数Cとを出力する。
<判定部156>
判定部156は、利得の更新回数が予め定めた回数の場合には、整数信号符号を出力するとともに、利得符号化部155に対し利得更新部157が得たグローバルゲインgを符号化する指示信号を出力し、利得の更新回数が予め定めた回数未満である場合には、利得更新部157に対し、Golomb-Rice符号化部154が計測した消費ビット数Cを出力する。
<利得更新部157>
利得更新部157は、Golomb-Rice符号化部154が計測した消費ビット数Cが配分ビット数Bより多い場合にはグローバルゲインgの値を大きな値に更新して出力し、消費ビット数Cが配分ビット数Bより少ない場合にはグローバルゲインgの値を小さな値に更新し、更新後のグローバルゲインgの値を出力する。
<利得符号化部155>
利得符号化部155は、判定部156が出力した指示信号に従って、利得更新部157が得たグローバルゲインgを符号化して利得符号を得て出力する。
判定部156が出力した整数信号符号と、利得符号化部155が出力した利得符号は、正規化MDCT係数列に対応する符号として、復号装置に出力される。
以上のように、従来のTCXに基づく符号化では、振幅スペクトル包絡を鈍らせた平滑化振幅スペクトル包絡系列を用いてMDCT係数列を正規化した後、正規化MDCT係数列を符号化している。この符号化方法は、上記のMPEG-4 USACなどで採用されている。
入力される係数列の包絡の凸凹はなるべく小さいほうが符号化部15の符号化効率は良い。しかし、従来の符号化装置では、聴覚的な歪を小さくするために、包絡正規化部14でMDCT系列X(0),X(1),…,X(N-1)を振幅スペクトル包絡系列ではなく平滑化振幅スペクトル包絡系列で正規化しているため、符号化部15に入力される正規化MDCT係数列XN(0),XN(1),…,XN(N-1)は、MDCT係数列X(0),X(1),…,X(N-1)ほどではないものの、包絡の凹凸を有する。すなわち、従来の符号化装置には、平滑化振幅スペクトル包絡系列の包絡の凸凹に起因して、符号化部15の符号化効率が悪くなっている。
本発明は、従来よりも効率の良い符号化又は復号を行うことができる符号化装置、復号装置、これらの方法及びプログラムを提供することを目的とする。
本発明の一態様による符号化装置によれば、時系列信号を周波数領域で符号化する符号化装置であって、ηを2以外の所定の正の数として、時系列信号に対応する周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做してスペクトル包絡の推定を行うスペクトル包絡推定部と、推定されたスペクトル包絡を基にビット割り当てを変える又は実質的にビット割り当てが変わる符号化を時系列信号に対応する周波数領域サンプル列の各係数に対して行う符号化部と、を備えている。
本発明の一態様による復号装置によれば、周波数領域での復号により時系列信号に対応する周波数領域サンプル列を得る復号装置であって、入力された線形予測係数符号を復号して線形予測係数に変換可能な係数を得る線形予測係数復号部と、ηを2以外の所定の正の数として、線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列を得る非平滑化スペクトル包絡系列生成部と、非平滑化スペクトル包絡系列に基づいて変わるビット割り当て又は実質的に変わるビット割り当てに従って、入力された整数信号符号の復号を行うことにより時系列信号に対応する周波数領域サンプル列を得る復号部と、を備えている。
従来よりも効率の良い符号化又は復号を行うことができる。
従来の符号化装置の例を説明するためのブロック図。 従来の符号化部の例を説明するためのブロック図。 技術的背景を説明するためのヒストグラム。 本発明の符号化装置の例を説明するためのブロック図。 本発明の符号化方法の例を説明するためのフローチャート。 本発明の符号化部の例を説明するためのブロック図。 本発明の符号化部の例を説明するためのブロック図。 本発明の符号化部の処理の例を説明するためのフローチャート。 本発明の復号装置の例を説明するためのブロック図。 本発明の復号方法の例を説明するためのフローチャート。 本発明の復号部の処理の例を説明するためのフローチャート。 本発明の技術的背景を説明するための図。 本発明の符号化方法の例を説明するためのフローチャート。 本発明の符号化部の例を説明するためのブロック図。 本発明の符号化部の例を説明するためのブロック図。 本発明の復号装置の例を説明するためのブロック図。 本発明の復号部の処理の例を説明するためのフローチャート。
[技術的背景]
平滑化振幅スペクトル包絡によるMDCT系列X(0),X(1),…,X(N-1)の正規化は、振幅スペクトル包絡系列による正規化よりもMDCT系列X(0),X(1),…,X(N-1)を白色化しない。具体的には、MDCT係数列X(0),X(1),…,X(N-1)を平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)で正規化して得られる正規化MDCT係数列XN(0)=X(0)/^Wγ(0),XN(1)=X(1)/^Wγ(1),…,XN(N-1)= X(N-1)/^Wγ(N-1)は、MDCT係数列X(0),X(1),…,X(N-1)を振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)で正規化して得られる正規化後の系列X(0)/^W(0),X(1)/^W(1),…,X(N-1)/^W(N-1)よりも、^W(0)/^Wγ(0),^W(1)/^Wγ(1),…,^W(N-1)/^Wγ(N-1)だけ凸凹が大きい。従って、MDCT係数列X(0),X(1),…,X(N-1)を振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)で正規化して得られる正規化後の系列X(0)/^W(0),X(1)/^W(1), …,X(N-1)/^W(N-1)が符号化部15における符号化に適する程度に包絡の凸凹が平坦にされたものとすると、符号化部15に入力される正規化MDCT係数列XN(0),XN(1),…,XN(N-1)には、^W(0)/^Wγ(0),^W(1)/^Wγ(1),…,^W(N-1)/^Wγ(N-1)の系列(以下、正規化振幅スペクトル包絡系列^WN(0),^WN(1),…,^WN(N-1))で表される包絡の凸凹が残されている。
図3に正規化MDCT系列の包絡の凹凸^W(0)/^Wγ(0),^W(1)/^Wγ(1),…,^W(N-1)/^Wγ(N-1)が各値をとる場合における、正規化MDCT係数列に含まれる各係数の値の出現頻度を示す。envelope:0.2-0.3の曲線は、正規化MDCT系列の包絡の凹凸^W(k)/^Wγ(k)が0.2以上0.3未満であるサンプルkに対応する正規化MDCT係数XN(k)の値の頻度を表す。envelope:0.3-0.4の曲線は、正規化MDCT系列の包絡の凹凸^W(k)/^Wγ(k)が0.3以上0.4未満であるサンプルkに対応する正規化MDCT係数XN(k)の値の頻度を表す。envelope:0.4-0.5の曲線は、正規化MDCT系列の包絡の凹凸^W(k)/^Wγ(k)が0.4以上0.5未満であるサンプルkに対応する正規化MDCT係数XN(k)の値の頻度を表す。
図3を見ると、正規化MDCT係数列に含まれる各係数の値は、平均はほぼ0であるが、分散は包絡の値と関連性をもつことがわかる。すなわち、正規化MDCT系列の包絡の凹凸が大きいほど、頻度を表す曲線の裾野が広がっているため、正規化MDCT系列の包絡の凹凸が大きいことは正規化MDCT係数の値の分散が大きいということと関連性があることがわかる。より効率的な圧縮を実現するため、この関連性を利用した符号化を行う。具体的には、符号化の対象となる周波数領域サンプル列の各係数に対して、スペクトル包絡を基にビット割り当てを変える又は実質的にビット割り当てが変わる符号化を行う。
そのために、例えば(i)量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)をGolomb-Rice符号化する場合には、スペクトル包絡に基づいて決定されたRiceパラメータを用いる。また、例えば(ii)量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を算術符号化する場合には、スペクトル包絡に基づいて決定された分散パラメータを用いる。
まず、(i)の場合の技術的背景について説明する。
従来の符号化装置では、Golomb-Rice符号化に用いるRiceパラメータを例えば量子化正規化済係数系列に含まれる係数の平均を含む以下の式(4)から求め、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)に含まれる全ての係数に対して式(4)から求めた同じRiceパラメータを用いてGolomb-Rice符号化していた。
Figure 0006457552
ただし、・を任意の数として、[・]は・に対する丸め操作であるものとする。
これに対し、本発明の第二実施形態では、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数に対するRiceパラメータを、それぞれの係数に対応する正規化振幅スペクトル包絡系列^WN(0),^WN(1),…,^WN(N-1) の各値とグローバルゲインgから以下の式(5)で算出する。
Figure 0006457552
ただし、σは予測残差のエネルギーσ2の平方根である。すなわち、σは正の数である。つまり、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数に対するRiceパラメータを、その各係数に対応する正規化振幅スペクトル包絡の値を所定の単調非減少関数に入力した場合の出力値とする。こうすることにより、各係数に対するRiceパラメータを表すために新たに情報を追加することなく各係数に適したRiceパラメータを得ることが可能となり、Golomb-Rice符号化の効率を上げることができる。
なお、従来とは異なる方法により求めたスペクトル包絡を利用してもよい。具体的には、本発明の第一実施形態では、Levinson-DurbinアルゴリズムをMDCT係数の絶対値の系列を逆フーリエ変換したものに対して行い、それにより得られる線形予測係数を量子化したものである^β1,^β2,…,^βpを量子化線形予測係数^α1,^α2,…,^αpの代わりに用い、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)をそれぞれ下記の式(6)と式(7)
Figure 0006457552
から求め、求めた非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)の各係数を対応する平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)の各係数で除算して正規化振幅スペクトル包絡系列^HN(0)=^H(0)/^Hγ(0),^HN(1)=^H(1)/^Hγ(1),…,^HN(N-1)=^H(N-1)/^Hγ(N-1)を得て、正規化振幅スペクトル包絡系列とグローバルゲインgとから下記の式(8)によりRiceパラメータを算出する。
Figure 0006457552
式(8)においても、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数に対するRiceパラメータを、その各係数に対応する正規化振幅スペクトル包絡の値を所定の単調非減少関数に入力した場合の出力値としている。
上記技術は、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)をGolomb-Rice符号化する際の符号長を規準とする最小化問題に基づくものである。以下に上記技術の導出を述べる。
量子化正規化済係数XQ(k)をそれぞれRiceパラメータr(k)によりGolomb-Rice符号化した際の符号長は丸め誤差の影響を無視すると、
Figure 0006457552
によってあらわされる。ただし、正負符号は別途符号化するものとする。この符号長を小さくするため、既に量子化及び符号化がなされている線形予測係数を基にRiceパラメータ系列r(0),r(1),…,r(N-1)を求めることを考える。上の式(9)は、式変形を行うことにより、
Figure 0006457552
と書き直すことができる。ただし、lnはネイピア数を底とする対数、CはRiceパラメータに対する定数、そして DIS(X|Y)はYからのXの板倉斎藤距離
Figure 0006457552
であるものとする。つまり、Riceパラメータ系列に対する符号長Lの最小化問題は(log2e)2r(k)とXQ(k)との板倉斎藤距離の総和の最小化問題に帰着される。ここで、Riceパラメータ系列r(0),r(1),…,r(N-1)と線形予測係数β12,…,βp、予測残差のエネルギーσ2との対応関係を一つ決めれば、符号長を最小化する線形予測係数を求める最適化問題を立てることができるが、従来の高速解法を用いるためにここでは次のように対応付ける。
Figure 0006457552
量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)は量子化の影響を無視すると、MDCT系列X(0),X(1),…,X(N-1)と平滑化振幅スペクトル包絡系列^Hγ(0), ^Hγ(1),…, ^Hγ(N-1)、グローバルゲインgを用いてそれぞれXQ(k)= X(k)/(g^Hγ(k))とあらわすことができることから、式(10)のRiceパラメータに依存する項は式(11)により、
Figure 0006457552
のように、MDCT係数系列の絶対値と全極型のスペクトル包絡との板倉斎藤距離としてあらわされる。従来の線形予測分析、つまりパワースペクトルを逆フーリエ変換したものに対してLevinson-Durbinアルゴリズムを適用するものは、パワースペクトルと全極型のスペクトル包絡との板倉斎藤距離を最小化する線形予測係数を求める操作であることが知られている。したがって、上記の符号長最小化問題は、振幅スペクトル、つまりMDCT係数系列の絶対値を逆フーリエ変換したものに対してLevinson-Durbinアルゴリズムを適用することにより従来法と同様に最適解を求めることができる。
つぎに、(ii)の場合の技術的背景について説明する。
符号化対象の属する確率分布には多様性があるところ、ある確率分布(例えば、ラプラス分布)に属する符号化対象を仮定した最適なビット割り当てを、その仮定から外れた確率分布に属する符号化対象に対して行うと、圧縮効率は低下する可能性がある。
そこで、符号化対象の属する確率分布として、様々な確率分布を表現することができる分布である、以下の式で表される一般化ガウス分布を使用する。
Figure 0006457552
一般化ガウス分布は形状パラメータη(>0)を変えることにより、図12のようにη=1の時はラプラス分布、η=2の時はガウス分布、といったように様々な分布を表現することができる。ηは、0より大きい所定の数である。ηは、0より大きい2以外の所定の数であってもよい。具体的には、ηは、2未満の所定の正の数であってよい。ηの値は、予め決めておくか、または所定の時間区間であるフレーム毎に選択又は可変にしてもよい。また、上式のφは分布の分散に対応している値であり、この値を分散パラメータとして、スペクトル包絡の凹凸の情報を組み込む。つまり、分散パラメータφ(0),φ(1),…,φ(N-1)をスペクトル包絡から生成し、各周波数kでの量子化正規化済係数XQ(k)に対して、fGG(X|φ(k),η)に従う場合に最適となるような算術符号を構成し、この構成に基づく算術符号により符号化を行う。
以下では、形状パラメータηは1つ決まっているものとする。
本発明の第三実施形態では、予測残差のエネルギーσ2及びグローバルゲインgの情報に加えて使用する分布の情報を更に取り入れ、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数に対する分散パラメータを例えば以下の式(A1)で算出する。
Figure 0006457552
ただし、σはσ2の平方根である。
具体的には、Levinson-DurbinアルゴリズムをMDCT係数の絶対値をη乗した値の系列を逆フーリエ変換したものに対して行い、それにより得られる線形予測係数を量子化したものであるβ1,^β2,…,^βpを量子化線形予測係数^α1,^α2,…,^αpの代わりに用い、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)をそれぞれ下記の式(A2)と式(A3)
Figure 0006457552
から求め、求めた非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)の各係数を対応する平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)の各係数で除算して正規化振幅スペクトル包絡系列^HN(0)=^H(0)/^Hγ(0),^HN(1)=^H(1)/^Hγ(1),…,^HN(N-1)=^H(N-1)/^Hγ(N-1)を得て、正規化振幅スペクトル包絡系列とグローバルゲインgとから上記の式(A1)により分散パラメータを算出する。
ここで、式(A1)のσ2/η/gは、エントロピーに密接に係わる値であり、ビットレートが固定ならフレーム毎の値の変動は小さい。このため、σ2/η/gとして予め定められた固定値を使用することもできる。このように固定値を使用する場合は、本発明の手法のため新たに情報を追加する必要はない。
上記技術は、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を算術符号化する際の符号長を規準とする最小化問題に基づくものである。以下に上記技術の導出を述べる。
量子化正規化済係数XQ(k)をそれぞれ分散パラメータφ(k)により、形状パラメータηの一般化ガウス分布を用いた算術符号で符号化した際の符号長は、量子化が十分細かく行われたとすると、
Figure 0006457552
に比例する。この符号長を小さくするため、既に量子化及び符号化がなされている線形予測係数を基に分散パラメータ系列φ(0),φ(1),…,φ(N-1)を求めることを考える。上の式(A4)は、式変形を行うことにより、
Figure 0006457552
と書き直すことができる。ただし、lnはネイピア数を底とする対数、Cは分散パラメータに対する定数、そして DIS(X|Y)はYからのXの板倉斎藤距離
Figure 0006457552
であるものとする。つまり、分散パラメータ系列に対する符号長Lの最小化問題はφη(k)/(ηBη(η))と|XQ(k)|ηとの板倉斎藤距離の総和の最小化問題に帰着される。ここで、分散パラメータ系列φ(0),φ(1),…,φ(N-1)と線形予測係数β12,…,βp、予測残差のエネルギーσ2との対応関係を一つ決めれば、符号長を最小化する線形予測係数を求める最適化問題を立てることができるが、従来の高速解法を用いるためにここでは次のように対応付ける。
Figure 0006457552
量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)は量子化の影響を無視すると、MDCT系列X(0),X(1),…,X(N-1)と平滑化振幅スペクトル包絡系列^Hγ(0), ^Hγ(1),…, ^Hγ(N-1)、グローバルゲインgを用いてそれぞれXQ(k)= X(k)/(g^Hγ(k))とあらわすことができることから、式(A5)の分散パラメータに依存する項は式(A6)により、
Figure 0006457552
のように、MDCT係数系列の絶対値と全極型のスペクトル包絡との板倉斎藤距離としてあらわされる。従来の線形予測分析、つまりパワースペクトルを逆フーリエ変換したものに対してLevinson-Durbinアルゴリズムを適用するものは、パワースペクトルと全極型のスペクトル包絡との板倉斎藤距離を最小化する線形予測係数を求める操作であることが知られている。したがって、上記の符号長最小化問題は、振幅スペクトルのη乗、つまりMDCT係数系列の絶対値のη乗を逆フーリエ変換したものに対してLevinson-Durbinアルゴリズムを適用することにより従来法と同様に最適解を求めることができる。
[第一実施形態]
(第一実施形態の符号化)
第一実施形態の符号化装置の構成例を図4に示す。第一実施形態の符号化装置は、図4に示すように、周波数領域変換部21と、線形予測分析部22と、非平滑化振幅スペクトル包絡系列生成部23と、平滑化振幅スペクトル包絡系列生成部24と、包絡正規化部25と、符号化部26とを例えば備えている。この符号化装置により実現される第一実施形態の符号化方法の各処理の例を図5に示す。
以下、図4の各部について説明する。
<周波数領域変換部21>
周波数領域変換部21には、時間領域の音信号が入力される。音信号の例は、音声ディジタル信号又は音響ディジタル信号である。
周波数領域変換部21は、所定の時間長のフレーム単位で、入力された時間領域の音信号を周波数領域のN点のMDCT係数列X(0),X(1),…,X(N-1)に変換する(ステップA1)。Nは正の整数である。
得られたMDCT係数列X(0),X(1),…,X(N-1)は、線形予測分析部22と包絡正規化部25に出力される。
特に断りがない限り、以降の処理はフレーム単位で行われるものとする。
このようにして、周波数領域変換部21は、音信号に対応する、例えばMDCT係数列である周波数領域サンプル列を求める。
<線形予測分析部22>
線形予測分析部22には、周波数領域変換部21が得たMDCT係数列X(0),X(1),…,X(N-1)が入力される。
線形予測分析部22は、MDCT係数列X(0),X(1),…,X(N-1)を用いて、以下の式(12)により定義される~X(0),~X(1),…,~X(N-1)を線形予測分析して線形予測係数β12,…,βpを生成し、生成された線形予測係数β12,…,βpを符号化して線形予測係数符号と線形予測係数符号に対応する量子化された線形予測係数である量子化線形予測係数^β1,^β2,…,^βpとを生成する(ステップA2)。
Figure 0006457552
生成された量子化線形予測係数^β1,^β2,…,^βpは、非平滑化スペクトル包絡系列生成部23と平滑化振幅スペクトル包絡系列生成部24に出力される。
また、生成された線形予測係数符号は、復号装置に送信される。
具体的には、線形予測分析部22は、まずMDCT係数列X(0),X(1),…,X(N-1)の絶対値をパワースペクトルと見做した逆フーリエ変換に相当する演算、すなわち式(12)の演算を行うことにより、MDCT係数列X(0),X(1),…,X(N-1)に対応する時間領域の信号列である擬似相関関数信号列~X(0),~X(1),…,~X(N-1)を求める。そして、線形予測分析部22は、求まった擬似相関関数信号列~X(0),~X(1),…,~X(N-1)を用いて線形予測分析を行って、線形予測係数β12,…,βpを生成する。そして、線形予測分析部22は、生成された線形予測係数β12,…,βpを符号化することにより、線形予測係数符号と、線形予測係数符号に対応する量子化線形予測係数^β1,^β2,…,^βpとを得る。
線形予測係数β12,…,βpは、MDCT係数列X(0),X(1),…,X(N-1)の絶対値をパワースペクトルと見做したときの時間領域の信号に対応する線形予測係数である。
線形予測分析部22による線形予測係数符号の生成は、例えば従来的な符号化技術によって行われる。従来的な符号化技術とは、例えば、線形予測係数そのものに対応する符号を線形予測係数符号とする符号化技術、線形予測係数をLSPパラメータに変換してLSPパラメータに対応する符号を線形予測係数符号とする符号化技術、線形予測係数をPARCOR係数に変換してPARCOR係数に対応する符号を線形予測係数符号とする符号化技術などである。例えば、線形予測係数そのものに対応する符号を線形予測係数符号とする符号化技術は、複数の量子化線形予測係数の候補が予め定められ、各候補が線形予測係数符号と予め対応付けられて記憶されており、候補の何れかが生成された線形予測係数に対する量子化線形予測係数として決定され、量子化線形予測係数と線形予測係数符号とが得られる技術である。
<非平滑化振幅スペクトル包絡系列生成部23>
非平滑化振幅スペクトル包絡系列生成部23には、線形予測分析部22が生成した量子化線形予測係数^β1,^β2,…,^βpが入力される。
非平滑化振幅スペクトル包絡系列生成部23は、量子化線形予測係数^β1,^β2,…,^βpに対応する振幅スペクトル包絡の系列である非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を生成する(ステップA3)。
生成された非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)は、符号化部26に出力される。
非平滑化振幅スペクトル包絡系列生成部23は、量子化線形予測係数^β1,^β2,…,^βpを用いて、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)として、以下の式(13)により定義される非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を生成する。
Figure 0006457552
このようにして、非平滑化振幅スペクトル包絡系列生成部23は、音信号に対応する振幅スペクトル包絡の系列である非平滑化振幅スペクトル包絡系列を得る。
<平滑化振幅スペクトル包絡系列生成部24>
平滑化振幅スペクトル包絡系列生成部24には、線形予測分析部22が生成した量子化線形予測係数^β1,^β2,…,^βpが入力される。
平滑化振幅スペクトル包絡系列生成部24は、量子化線形予測係数^β1,^β2,…,^βpに対応する振幅スペクトル包絡の系列の振幅の凸凹を鈍らせた系列である平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)を生成する(ステップA4)。
生成された平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)は、包絡正規化部25及び符号化部26に出力される。
平滑化振幅スペクトル包絡系列生成部24は、量子化線形予測係数^β1,^β2,…,^βpと補正係数γを用いて、平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)として、以下の式(14)により定義される平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)を生成する。
Figure 0006457552
ここで、補正係数γは予め定められた1未満の定数であり非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)の振幅の凹凸を鈍らせる係数、言い換えれば非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を平滑化する係数である。
このようにして、平滑化振幅スペクトル包絡系列生成部24は、非平滑化振幅スペクトル包絡系列の振幅の凸凹を平滑化した系列である平滑化振幅スペクトル包絡系列を得る。
<包絡正規化部25>
包絡正規化部25には、周波数領域変換部21が得たMDCT係数列X(0),X(1),…,X(N-1)及び平滑化振幅スペクトル包絡系列生成部24が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)が入力される。
包絡正規化部25は、MDCT係数列X(0),X(1),…,X(N-1)の各係数を、対応する平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)の各値で正規化することにより、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)を生成する(ステップA5)。
生成された正規化MDCT係数列は、符号化部26に出力される。
包絡正規化部25は、例えば、k=0,1,…,N-1として、MDCT係数列X(0),X(1),…,X(N-1)の各係数X(k)を平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)で除算することにより、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数XN(k)を生成する。すなわち、k=0,1,…,N-1として、XN(k)=X(k)/ ^Hγ(k)である。
このようにして、包絡正規化部25は、例えばMDCT係数列である周波数領域サンプル列の各サンプルを、平滑化振幅スペクトル包絡系列の対応するサンプルで正規化して、例えば正規化MDCT係数列である正規化周波数領域サンプル列を得る。
<符号化部26>
符号化部26には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)、非平滑化振幅スペクトル包絡系列生成部23が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)及び平滑化振幅スペクトル包絡系列生成部24が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)が入力される。
符号化部26は、図8に例示するステップA6−1からステップA6−5の処理を行うことにより符号化を行う(ステップA6)。すなわち、符号化部26は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)に対応するグローバルゲインgを求め(ステップA6−1)、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数をグローバルゲインgで割り算した結果を量子化した整数値による系列である量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を求め(ステップA6−2)、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数に対応するRiceパラメータr(0),r(1),…,r(N-1)をグローバルゲインgと非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)とから上記の式(8)により求め(ステップA6−3)、Riceパラメータr(0),r(1),…,r(N-1)を用いて量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)をGolomb-Rice符号化して整数信号符号を得(ステップA6−4)、グローバルゲインgに対応する利得符号を得る(ステップA6−5)。
ここで、上記の式(8)における正規化振幅スペクトル包絡系列^HN(0),^HN(1),…,^HN(N-1)は、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)の各値を、対応する平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)の各値で除算したもの、すなわち、以下の式(15)により求まるものである。
Figure 0006457552
生成された整数信号符号と利得符号は正規化MDCT係数列に対応する符号として、復号装置に出力される。
符号化部26は、上記のステップA6−1〜A6−5により、整数信号符号のビット数が、予め配分されたビット数である配分ビット数B以下、かつ、なるべく大きな値となるようなグローバルゲインgを決定し、決定されたグローバルゲインgに対応する利得符号と、この決定されたグローバルゲインgに対応する整数信号符号とを生成する機能を実現している。
符号化部26が行うステップA6−1からステップA6−5のうち、特徴的な処理が含まれるのはステップA6−3である。グローバルゲインgと量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)のそれぞれを符号化することにより正規化MDCT係数列に対応する符号を得る符号化処理自体には、非特許文献1に記載された技術を含む様々な公知技術が存在する。以下では符号化部26が行う符号化処理の具体例を2つ説明する。
[符号化部26が行う符号化処理の具体例1]
符号化部26が行う符号化処理の具体例1として、ループ処理を含まない例について説明する。
具体例1の符号化部26の構成例を図6に示す。具体例1の符号化部26は、図6に示すように、利得取得部261と、量子化部262と、Riceパラメータ決定部263と、Golomb-Rice符号化部264と、利得符号化部265とを例えば備えている。以下、図6の各部について説明する。
<利得取得部261>
利得取得部261は、入力された正規化MDCT係数列XN(0),XN(1),…,XN(N-1)から、整数信号符号のビット数が、予め配分されたビット数である配分ビット数B以下、かつ、なるべく大きな値となるようなグローバルゲインgを決定して出力する(ステップ261)。利得取得部261は、例えば、入力された正規化MDCT係数列XN(0),XN(1),…,XN(N-1)のエネルギーの合計の平方根と配分ビット数Bと負の相関のある定数との乗算値をグローバルゲインgとして得て出力する。または、利得取得部261は、入力された正規化MDCT係数列XN(0),XN(1),…,XN(N-1) のエネルギーの合計と、配分ビット数Bと、グローバルゲインgと、の関係を予めテーブル化しておき、そのテーブルを参照することによりグローバルゲインgを得て出力してもよい。
このようにして、利得取得部261は、例えば正規化MDCT係数列である正規化周波数領域サンプル列の全サンプルを除算するための利得を得る。
<量子化部262>
量子化部262は、入力された正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数を利得取得部261が得たグローバルゲインgで割り算した結果の整数部分による系列である量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を得て出力する(ステップ262)。
このようにして、量子化部262は、例えば正規化MDCT係数列である正規化周波数領域サンプル列の各サンプルを、利得で除算するとともに量子化して量子化正規化済係数系列を求める。
<Riceパラメータ決定部263>
Riceパラメータ決定部263は、利得取得部261が得たグローバルゲインgと、入力された非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と、入力された平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)とから、上記の式(8)によりRiceパラメータ系列r(0),r(1),…,r(N-1) の各Riceパラメータを得て出力する(ステップ263)。
このようにして、Riceパラメータ決定部263は、量子化正規化済係数系列をGolomb-Rice符号化するためのRiceパラメータを、平滑化振幅スペクトル包絡系列と非平滑化振幅スペクトル包絡系列と利得に基づいて、量子化正規化係数系列の各係数毎に求める。
符号化側のライスパラメータ決定装置は、Riceパラメータ決定部263を少なくとも備えた装置である。符号化側のライスパラメータ決定装置は、非平滑化振幅スペクトル包絡系列生成部23、平滑化振幅スペクトル包絡系列生成部24、包絡正規化部25、利得取得部261、量子化部262等の他の部を備えていてもよい。
<Golomb-Rice符号化部264>
Golomb-Rice符号化部264は、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数に対応するRiceパラメータとしてRiceパラメータ決定部263が得たRiceパラメータ系列r(0),r(1),…,r(N-1)の各Riceパラメータを用いて、量子化部262が得た量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)をGolomb-Rice符号化して整数信号符号を得て出力する(ステップ264)。
<利得符号化部265>
利得符号化部265は、利得取得部261が得たグローバルゲインgを符号化して利得符号を得て出力する(ステップ265)。
生成された整数信号符号と利得符号は正規化MDCT係数列に対応する符号として、復号装置に出力される。
すなわち、本具体例のステップ261から265がそれぞれ上記のステップA6−1〜A6−5に対応する。
[符号化部26が行う符号化処理の具体例2]
符号化部26が行う符号化処理の具体例2として、ループ処理を含む例について説明する。
具体例2の符号化部26の構成例を図7に示す。具体例2の符号化部26は、図7に示すように、利得取得部261と、量子化部262と、Riceパラメータ決定部263と、Golomb-Rice符号化部264と、利得符号化部265と、判定部266と、利得更新部267とを例えば備えている。以下、図7の各部について説明する。
<利得取得部261>
利得取得部261は、入力された正規化MDCT係数列XN(0),XN(1),…,XN(N-1)から、整数信号符号のビット数が、予め配分されたビット数である配分ビット数B以下、かつ、なるべく大きな値となるようなグローバルゲインgを決定して出力する(ステップ261)。利得取得部261は、例えば、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)のエネルギーの合計の平方根と配分ビット数Bと負の相関のある定数との乗算値をグローバルゲインgとして得て出力する。
利得取得部261が得たグローバルゲインgは、量子化部262及びRiceパラメータ決定部263で用いられるグローバルゲインの初期値となる。
このようにして、利得取得部261は、例えば正規化MDCT係数列である正規化周波数領域サンプル列の全サンプルを除算するための利得を得る。
<量子化部262>
量子化部262は、入力された正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数を利得取得部261または利得更新部267が得たグローバルゲインgで割り算した結果の整数部分による系列である量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を得て出力する(ステップ262)。
ここで、量子化部262の処理が初回に実行される際に用いられるグローバルゲインgは、利得取得部261が得たグローバルゲインg、すなわちグローバルゲインの初期値である。また、量子化部262の処理が2回目以降に実行される際に用いられるグローバルゲインgは、利得更新部267が得たグローバルゲインg、すなわちグローバルゲインの更新値である。
このようにして、量子化部262は、例えば正規化MDCT係数列である正規化周波数領域サンプル列の各サンプルを、利得で除算するとともに量子化して量子化正規化済係数系列を求める。
<Riceパラメータ決定部263>
Riceパラメータ決定部263は、利得取得部261または利得更新部267が得たが得たグローバルゲインgと、入力された非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と、入力された平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)とから、上記の式(8)によりRiceパラメータ系列r(0),r(1),…,r(N-1) の各Riceパラメータを得て出力する(ステップ263)。
ここで、Riceパラメータ決定部263の処理が初回に実行される際に用いられるグローバルゲインgは、利得取得部261が得たグローバルゲインg、すなわちグローバルゲインの初期値である。また、Riceパラメータ決定部263の処理が2回目以降に実行される際に用いられるグローバルゲインgは、利得更新部267が得たグローバルゲインg、すなわちグローバルゲインの更新値である。
このようにして、Riceパラメータ決定部263は、量子化正規化済係数系列をGolomb-Rice符号化するためのRiceパラメータを、平滑化振幅スペクトル包絡系列と非平滑化振幅スペクトル包絡系列と利得に基づいて、量子化正規化係数系列の各係数毎に求める。
符号化側のライスパラメータ決定装置は、Riceパラメータ決定部263を少なくとも備えた装置である。符号化側のライスパラメータ決定装置は、非平滑化振幅スペクトル包絡系列生成部23、平滑化振幅スペクトル包絡系列生成部24、包絡正規化部25、利得取得部261、量子化部262等の他の部を備えていてもよい。
<Golomb-Rice符号化部264>
Golomb-Rice符号化部264は、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数に対応するRiceパラメータとしてRiceパラメータ決定部263が得たRiceパラメータ系列r(0),r(1),…,r(N-1)の各Riceパラメータを用いて、量子化部262が得た量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)をGolomb-Rice符号化して整数信号符号を得て、整数信号符号と、整数信号符号のビット数である消費ビット数Cとを出力する(ステップ264)。
<判定部266>
判定部266は、利得の更新回数に基づく判定を行う。具体的には、判定部266は、利得の更新回数が予め定めた回数の場合には、整数信号符号を出力するとともに、利得符号化部265に対し利得更新部267が得たグローバルゲインgを符号化する指示信号を出力し、利得の更新回数が予め定めた回数未満である場合には、利得更新部267に対し、Golomb-Rice符号化部264が計測した消費ビット数Cを出力する(ステップS266)。
<利得更新部267>
利得更新部267は、Golomb-Rice符号化部264が計測した消費ビット数Cが配分ビット数Bより多い場合にはグローバルゲインgの値を大きな値に更新して出力し、消費ビット数Cが配分ビット数Bより少ない場合にはグローバルゲインgの値を小さな値に更新し、更新後のグローバルゲインgの値を出力する(ステップ267)。
<利得符号化部265>
利得符号化部265は、判定部266が出力した指示信号に従って、利得更新部267が得たグローバルゲインgを符号化して利得符号を得て出力する(ステップ265)。
判定部266が出力した整数信号符号と、利得符号化部265が出力した利得符号は、正規化MDCT係数列に対応する符号として、復号装置に出力される。
すなわち、本具体例においては、最後に行われたステップ267とステップ262とステップ263とステップ264がそれぞれ上記のステップA6−1〜A6−4に対応し、ステップ265が上記のステップA6−5に対応する。
なお、符号化部26が行う符号化処理の具体例2については、国際公開2014/054556などに更に詳細に説明されている。
(第一実施形態の復号)
第一実施形態の符号化装置に対応する復号装置の構成例を図9に示す。第一実施形態の復号装置は、図9に示すように、線形予測係数復号部31と、非平滑化振幅スペクトル包絡系列生成部32と、平滑化振幅スペクトル包絡系列生成部33と、復号部34と、包絡逆正規化部35と、時間領域変換部36とを例えば備えている。この復号装置により実現される第一実施形態の復号方法の各処理の例を図10に示す。
復号装置には、符号化装置が出力した、正規化MDCT係数列に対応する符号及び線形予測係数符号が少なくとも入力される。
以下、図9の各部について説明する。
<線形予測係数復号部31>
線形予測係数復号部31には、符号化装置が出力した線形予測係数符号が入力される。
線形予測係数復号部31は、フレームごとに、入力された線形予測係数符号を例えば従来的な復号技術によって復号して復号線形予測係数^β1,^β2,…, ^βpを得る(ステップB1)。
得られた復号線形予測係数^β1,^β2,…, ^βpは、非平滑化振幅スペクトル包絡系列生成部32及び平滑化振幅スペクトル包絡系列生成部33に出力される。
ここで、従来的な復号技術とは、例えば、線形予測係数符号が量子化された線形予測係数に対応する符号である場合に線形予測係数符号を復号して量子化された線形予測係数と同じ復号線形予測係数を得る技術、線形予測係数符号が量子化されたLSPパラメータに対応する符号である場合に線形予測係数符号を復号して量子化されたLSPパラメータと同じ復号LSPパラメータを得る技術などである。また、線形予測係数とLSPパラメータは互いに変換可能なものであり、入力された線形予測係数符号と後段での処理において必要な情報に応じて、復号線形予測係数と復号LSPパラメータの間での変換処理を行なえばよいのは周知である。以上から、上記の線形予測係数符号の復号処理と必要に応じて行なう上記の変換処理とを包含したものが「従来的な復号技術による復号」ということになる。
<非平滑化振幅スペクトル包絡系列生成部32>
非平滑化振幅スペクトル包絡系列生成部32には、線形予測係数復号部31が得た復号線形予測係数^β1,^β2,…,^βpが入力される。
非平滑化振幅スペクトル包絡系列生成部32は、復号線形予測係数^β1,^β2,…,^βpに対応する振幅スペクトル包絡の系列である非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を上記の式(13)により生成する(ステップB2)。
生成された非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)は、復号部34に出力される。
このようにして、非平滑化振幅スペクトル包絡系列生成部32は、入力された線形予測係数符号に対応する線形予測係数に対応する振幅スペクトル包絡の系列である非平滑化振幅スペクトル包絡系列を得る。
<平滑化振幅スペクトル包絡系列生成部33>
平滑化振幅スペクトル包絡系列生成部33には、線形予測係数復号部31が得た復号線形予測係数^β1,^β2,…,^βpが入力される。
平滑化振幅スペクトル包絡系列生成部33は、復号線形予測係数^β1,^β2,…,^βpに対応する振幅スペクトル包絡の系列の振幅の凸凹を鈍らせた系列である平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)を上記の式(14)により生成する(ステップB3)。
生成された平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)は、復号部34及び包絡逆正規化部35に出力される。
このようにして、平滑化振幅スペクトル包絡系列生成部33は、入力された線形予測係数符号に対応する線形予測係数に対応する振幅スペクトル包絡の系列の振幅の凸凹を平滑化した系列である平滑化振幅スペクトル包絡系列を得る。
<復号部34>
復号部34には、符号化装置が出力した正規化MDCT係数列に対応する符号、非平滑化振幅スペクトル包絡系列生成部32が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)及び平滑化振幅スペクトル包絡系列生成部33が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)が入力される。
復号部34は、Riceパラメータ決定部341を備えている。
復号部34は、図11に例示するステップB4−1からステップB4−4の処理を行うことにより復号を行う(ステップB4)。すなわち、復号部34は、フレームごとに、入力された正規化MDCT係数列に対応する符号に含まれる利得符号を復号してグローバルゲインgを得る(ステップB4−1)。復号部34のRiceパラメータ決定部341は、グローバルゲインgと非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)とから上記の式(8)によりRiceパラメータ系列r(0),r(1),…,r(N-1)の各Riceパラメータを求める(ステップB4−2)。復号部34は、正規化MDCT係数列に対応する符号に含まれる整数信号符号をRiceパラメータ系列r(0),r(1),…,r(N-1)の各Riceパラメータを用いてGolomb-Rice復号して復号正規化済係数系列^XQ(0),^XQ(1),…,^XQ(N-1)を得(ステップB4−3)、復号正規化済係数系列^XQ(0),^XQ(1),…,^XQ(N-1)の各係数にグローバルゲインgを乗算して復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)を生成する(ステップB4−4)。
生成された復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)は、包絡逆正規化部35に出力される。
このようにして、Riceパラメータ決定部341は、復号正規化済係数系列をGolomb-Rice復号によって得るためのRiceパラメータを、平滑化振幅スペクトル包絡系列と非平滑化振幅スペクトル包絡系列と利得に基づいて、上記復号量子化正規化済係数系列の各係数毎に求める。
また、復号部34は、入力された整数信号符号をGolomb-Rice復号して得られた復号正規化済係数系列の各係数に、入力された利得符号を復号して得られた利得を乗算して例えば復号正規化MDCT係数列である復号正規化周波数領域サンプル列を得る。
復号側のライスパラメータ決定装置は、Riceパラメータ決定部341を少なくとも備えた装置である。復号側のライスパラメータ決定装置は、非平滑化振幅スペクトル包絡系列生成部32等の他の部を備えていてもよい。
<包絡逆正規化部35>
包絡逆正規化部35には、平滑化振幅スペクトル包絡系列生成部33が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)及び復号部34が生成した復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)が入力される。
包絡逆正規化部35は、平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)を用いて、復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)を逆正規化することにより、復号MDCT係数列^X(0),^X(1),…,^X(N-1)を生成する(ステップB5)。
生成された復号MDCT係数列^X(0),^X(1),…,^X(N-1)は、時間領域変換部36に出力される。
例えば、包絡逆正規化部35は、k=0,1,…,N-1として、復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)の各係数^XN(k)に、平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)の各包絡値^Hγ(k)を乗じることにより復号MDCT係数列^X(0),^X(1),…,^X(N-1)を生成する。すなわち、k=0,1,…,N-1として、^X(k)=^XN(k)×^Hγ(k)である。
このようにして、包絡逆正規化部35は、例えば復号正規化MDCT係数列である正規化周波数領域サンプル列の各係数と、平滑化振幅スペクトル包絡系列の対応する係数とを乗算したものである復号周波数領域サンプル列を得る。
<時間領域変換部36>
時間領域変換部36には、包絡逆正規化部35が生成した復号MDCT係数列^X(0),^X(1),…,^X(N-1)が入力される。
時間領域変換部36は、フレームごとに、包絡逆正規化部35が得た復号MDCT係数列^X(0),^X(1),…,^X(N-1)を時間領域に変換してフレーム単位の音信号(復号音信号)を得る(ステップB6)。
このようにして、時間領域変換部36は、例えば復号MDCT係数列である復号周波数領域サンプル列に対応する復号音信号を得る。
[第二実施形態]
(第二実施形態の符号化)
第二実施形態の符号化装置の構成例を図4に示す。第二実施形態の符号化装置は、図4に示すように、周波数領域変換部21と、線形予測分析部22と、非平滑化振幅スペクトル包絡系列生成部23と、平滑化振幅スペクトル包絡系列生成部24と、包絡正規化部25と、符号化部26とを例えば備えている。この符号化装置により実現される第二実施形態の符号化方法の各処理の例を図5に示す。
以下、図4の各部について説明する。
<周波数領域変換部21>
周波数領域変換部21には、時間領域の音信号が入力される。音信号の例は、音声ディジタル信号又は音響ディジタル信号である。
周波数領域変換部21は、所定の時間長のフレーム単位で、入力された時間領域の音信号を周波数領域のN点のMDCT係数列X(0),X(1),…,X(N-1)に変換する(ステップA1)。Nは正の整数である。
得られたMDCT係数列X(0),X(1),…,X(N-1)は、線形予測分析部22と包絡正規化部25に出力される。
特に断りがない限り、以降の処理はフレーム単位で行われるものとする。
このようにして、周波数領域変換部21は、音信号に対応する、例えばMDCT係数列である周波数領域サンプル列を求める。
<線形予測分析部22>
線形予測分析部22には、周波数領域変換部21が得たMDCT係数列X(0),X(1),…,X(N-1)が入力される。
線形予測分析部22は、MDCT係数列X(0),X(1),…,X(N-1)を用いて、以下の式(16)により定義される~X(0),~X(1),…,~X(N-1)を線形予測分析して線形予測係数α1, α2,…, αpを生成し、生成された線形予測係数α1, α2,…, αpを符号化して線形予測係数符号と線形予測係数符号に対応する量子化された線形予測係数である量子化線形予測係数^α1, ^α2,…, ^αpとを生成する(ステップA2)。
Figure 0006457552
生成された量子化線形予測係数^α1, ^α2,…, ^αpは、非平滑化スペクトル包絡系列生成部23と平滑化振幅スペクトル包絡系列生成部24に出力される。
また、生成された線形予測係数符号は、復号装置に送信される。
具体的には、線形予測分析部22は、式(16)の演算を行うことにより、MDCT係数列X(0),X(1),…,X(N-1)に対応する時間領域の信号列である擬似相関関数信号列~X(0),~X(1),…,~X(N-1)を求める。そして、線形予測分析部22は、求まった擬似相関関数信号列~X(0),~X(1),…,~X(N-1)を用いて線形予測分析を行って、線形予測係数α1, α2,…, αpを生成する。そして、線形予測分析部22は、生成された線形予測係数α1, α2,…, αpを符号化することにより、線形予測係数符号と、線形予測係数符号に対応する量子化線形予測係数^α1, ^α2,…, ^αpとを得る。
線形予測分析部22による線形予測係数符号の生成は、例えば従来的な符号化技術によって行われる。従来的な符号化技術とは、例えば、線形予測係数そのものに対応する符号を線形予測係数符号とする符号化技術、線形予測係数をLSPパラメータに変換してLSPパラメータに対応する符号を線形予測係数符号とする符号化技術、線形予測係数をPARCOR係数に変換してPARCOR係数に対応する符号を線形予測係数符号とする符号化技術などである。例えば、線形予測係数そのものに対応する符号を線形予測係数符号とする符号化技術は、複数の量子化線形予測係数の候補が予め定められ、各候補が線形予測係数符号と予め対応付けられて記憶されており、候補の何れかが生成された線形予測係数に対する量子化線形予測係数として決定され、量子化線形予測係数と線形予測係数符号とが得られる技術である。
<非平滑化振幅スペクトル包絡系列生成部23>
非平滑化振幅スペクトル包絡系列生成部23には、線形予測分析部22が生成した量子化線形予測係数^α1, ^α2,…, ^αpが入力される。
非平滑化振幅スペクトル包絡系列生成部23は、量子化線形予測係数^α1, ^α2,…, ^αpに対応する振幅スペクトル包絡の系列である非平滑化振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)を生成する(ステップA3)。
生成された非平滑化振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)は、符号化部26に出力される。
非平滑化振幅スペクトル包絡系列生成部23は、量子化線形予測係数^α1, ^α2,…, ^αpを用いて、非平滑化振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)として、以下の式(17)により定義される非平滑化振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)を生成する。
Figure 0006457552
このようにして、非平滑化振幅スペクトル包絡系列生成部23は、音信号に対応する振幅スペクトル包絡の系列である非平滑化振幅スペクトル包絡系列を得る。
<平滑化振幅スペクトル包絡系列生成部24>
平滑化振幅スペクトル包絡系列生成部24には、線形予測分析部22が生成した量子化線形予測係数^α1, ^α2,…, ^αpが入力される。
平滑化振幅スペクトル包絡系列生成部24は、量子化線形予測係数^α1, ^α2,…, ^αpに対応する振幅スペクトル包絡の系列の振幅の凸凹を鈍らせた系列である平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)を生成する(ステップA4)。
生成された平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)は、包絡正規化部25及び符号化部26に出力される。
平滑化振幅スペクトル包絡系列生成部24は、量子化線形予測係数^α1, ^α2,…, ^αpと補正係数γを用いて、平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)として、以下の式(18)により定義される平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)を生成する。
Figure 0006457552
ここで、補正係数γは予め定められた1未満の定数であり非平滑化振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)の振幅の凹凸を鈍らせる係数、言い換えれば非平滑化振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)を平滑化する係数である。
このようにして、平滑化振幅スペクトル包絡系列生成部24は、非平滑化振幅スペクトル包絡系列の振幅の凸凹を平滑化した系列である平滑化振幅スペクトル包絡系列を得る。
<包絡正規化部25>
包絡正規化部25には、周波数領域変換部21が得たMDCT係数列X(0),X(1),…,X(N-1)及び平滑化振幅スペクトル包絡系列生成部24が生成した平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)が入力される。
包絡正規化部25は、MDCT係数列X(0),X(1),…,X(N-1)の各係数を、対応する平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)の各値で正規化することにより、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)を生成する(ステップA5)。
生成された正規化MDCT係数列は、符号化部26に出力される。
包絡正規化部25は、例えば、k=0,1,…,N-1として、MDCT係数列X(0),X(1),…,X(N-1)の各係数X(k)を平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)で除算することにより、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数XN(k)を生成する。すなわち、k=0,1,…,N-1として、XN(k)=X(k)/^ Wγ(k)である。
このようにして、包絡正規化部25は、例えばMDCT係数列である周波数領域サンプル列の各サンプルを、平滑化振幅スペクトル包絡系列の対応するサンプルで正規化して、例えば正規化MDCT係数列である正規化周波数領域サンプル列を得る。
<符号化部26>
符号化部26には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)、非平滑化振幅スペクトル包絡系列生成部23が生成した非平滑化振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)及び平滑化振幅スペクトル包絡系列生成部24が生成した平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)が入力される。
符号化部26は、図8に例示するステップA6−1からステップA6−5の処理を行うことにより符号化を行う(ステップA6)。すなわち、符号化部26は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)に対応するグローバルゲインgを求め(ステップA6−1)、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数をグローバルゲインgで割り算した結果を量子化した整数値による系列である量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を求め(ステップA6−2)、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数に対応するRiceパラメータr(0),r(1),…,r(N-1)をグローバルゲインgと非平滑化振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)と平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)とから上記の式(5)により求め(ステップA6−3)、Riceパラメータr(0),r(1),…,r(N-1)を用いて量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)をGolomb-Rice符号化して整数信号符号を得(ステップA6−4)、グローバルゲインgに対応する利得符号を得る(ステップA6−5)。ここで、上記の式(5)における正規化振幅スペクトル包絡系列^WN(0),^WN(1),…,^WNは、非平滑化振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)の各値を、対応する平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)の各値で除算したもの、すなわち、以下の式(19)により求まるものである。
Figure 0006457552
生成された整数信号符号と利得符号は正規化MDCT係数列に対応する符号として、復号装置に出力される。
符号化部26は、上記のステップA6−1〜A6−5により、整数信号符号のビット数が、予め配分されたビット数である配分ビット数B以下、かつ、なるべく大きな値となるようなグローバルゲインgを決定し、決定されたグローバルゲインgに対応する利得符号と、この決定されたグローバルゲインgに対応する整数信号符号とを生成する機能を実現している。
符号化部26が行うステップA6−1からステップA6−5のうち、特徴的な処理が含まれるのはステップA6−3である。グローバルゲインgと量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)のそれぞれを符号化することにより正規化MDCT係数列に対応する符号を得る符号化処理自体には、非特許文献1に記載された技術を含む様々な公知技術が存在する。
符号化部26が行う符号化処理の具体例は、第一実施形態の符号化部26の説明箇所で説明した通りである。
このようにして、Riceパラメータ決定部263は、量子化正規化済係数系列をGolomb-Rice符号化するためのRiceパラメータを、平滑化振幅スペクトル包絡系列と非平滑化振幅スペクトル包絡系列と利得に基づいて、量子化正規化係数系列の各係数毎に求める。
符号化側のライスパラメータ決定装置は、Riceパラメータ決定部263を少なくとも備えた装置である。符号化側のライスパラメータ決定装置は、非平滑化振幅スペクトル包絡系列生成部23、平滑化振幅スペクトル包絡系列生成部24、包絡正規化部25、利得取得部261、量子化部262等の他の部を備えていてもよい。
(第二実施形態の復号)
第二実施形態の符号化装置に対応する復号装置の構成例を図9に示す。第二実施形態の復号装置は、図9に示すように、線形予測係数復号部31と、非平滑化振幅スペクトル包絡系列生成部32と、平滑化振幅スペクトル包絡系列生成部33と、復号部34と、包絡逆正規化部35と、時間領域変換部36とを例えば備えている。この復号装置により実現される第二実施形態の復号方法の各処理の例を図10に示す。
復号装置には、符号化装置が出力した、正規化MDCT係数列に対応する符号及び線形予測係数符号が少なくとも入力される。
以下、図9の各部について説明する。
<線形予測係数復号部31>
線形予測係数復号部31には、符号化装置が出力した線形予測係数符号が入力される。
線形予測係数復号部31は、フレームごとに、入力された線形予測係数符号を例えば従来的な復号技術によって復号して復号線形予測係数^α1, ^α2,…, ^αpを得る(ステップB1)。
得られた復号線形予測係数^α1, ^α2,…, ^αpは、非平滑化振幅スペクトル包絡系列生成部32及び平滑化振幅スペクトル包絡系列生成部33に出力される。
ここで、従来的な復号技術とは、例えば、線形予測係数符号が量子化された線形予測係数に対応する符号である場合に線形予測係数符号を復号して量子化された線形予測係数と同じ復号線形予測係数を得る技術、線形予測係数符号が量子化されたLSPパラメータに対応する符号である場合に線形予測係数符号を復号して量子化されたLSPパラメータと同じ復号LSPパラメータを得る技術などである。また、線形予測係数とLSPパラメータは互いに変換可能なものであり、入力された線形予測係数符号と後段での処理において必要な情報に応じて、復号線形予測係数と復号LSPパラメータの間での変換処理を行なえばよいのは周知である。以上から、上記の線形予測係数符号の復号処理と必要に応じて行なう上記の変換処理とを包含したものが「従来的な復号技術による復号」ということになる。
<非平滑化振幅スペクトル包絡系列生成部32>
非平滑化振幅スペクトル包絡系列生成部32には、線形予測係数復号部31が得た復号線形予測係数^α1, ^α2,…, ^αpが入力される。
非平滑化振幅スペクトル包絡系列生成部32は、復号線形予測係数^α1, ^α2,…, ^αpに対応する振幅スペクトル包絡の系列である非平滑化振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)を上記の式(17)により生成する(ステップB2)。
生成された非平滑化振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)は、復号部34に出力される。
このようにして、非平滑化振幅スペクトル包絡系列生成部32は、入力された線形予測係数符号に対応する線形予測係数に対応する振幅スペクトル包絡の系列である非平滑化振幅スペクトル包絡系列を得る。
<平滑化振幅スペクトル包絡系列生成部33>
平滑化振幅スペクトル包絡系列生成部33には、線形予測係数復号部31が得た復号線形予測係数^α1, ^α2,…, ^αpが入力される。
平滑化振幅スペクトル包絡系列生成部33は、復号線形予測係数^α1, ^α2,…, ^αpに対応する振幅スペクトル包絡の系列の振幅の凸凹を鈍らせた系列である平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)を上記の式(18)により生成する(ステップB3)。
生成された平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)は、復号部34及び包絡逆正規化部35に出力される。
このようにして、平滑化振幅スペクトル包絡系列生成部33は、入力された線形予測係数符号に対応する線形予測係数に対応する振幅スペクトル包絡の系列の振幅の凸凹を平滑化した系列である平滑化振幅スペクトル包絡系列を得る。
<復号部34>
復号部34には、符号化装置が出力した正規化MDCT係数列に対応する符号、非平滑化振幅スペクトル包絡系列生成部32が生成した非平滑化振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)及び平滑化振幅スペクトル包絡系列生成部33が生成した平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)が入力される。
復号部34は、Riceパラメータ決定部341を備えている。
復号部34は、図11に例示するステップB4−1からステップB4−4の処理を行うことにより復号を行う(ステップB4)。すなわち、復号部34は、フレームごとに、入力された正規化MDCT係数列に対応する符号に含まれる利得符号を復号してグローバルゲインgを得る(ステップB4−1)。復号部34のRiceパラメータ決定部341は、グローバルゲインgと非平滑化振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)と平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)とから上記の式(5)によりRiceパラメータ系列r(0),r(1),…,r(N-1)の各Riceパラメータを求める(ステップB4−2)。復号部34は、正規化MDCT係数列に対応する符号に含まれる整数信号符号をRiceパラメータ系列r(0),r(1),…,r(N-1)の各Riceパラメータを用いてGolomb-Rice復号して復号正規化済係数系列^XQ(0),^XQ(1),…,^XQ(N-1)を得(ステップB4−3)、復号正規化済係数系列^XQ(0),^XQ(1),…,^XQ(N-1)の各係数にグローバルゲインgを乗算して復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)を生成する(ステップB4−4)。
生成された復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)は、包絡逆正規化部35に出力される。
このようにして、Riceパラメータ決定部341は、復号正規化済係数系列をGolomb-Rice復号によって得るためのRiceパラメータを、平滑化振幅スペクトル包絡系列と非平滑化振幅スペクトル包絡系列と利得に基づいて、上記復号量子化正規化済係数系列の各係数毎に求める。
また、復号部34は、入力された整数信号符号をGolomb-Rice復号して得られた復号正規化済係数系列の各係数に、入力された利得符号を復号して得られた利得を乗算して例えば復号正規化MDCT係数列である復号正規化周波数領域サンプル列を得る。
復号側のライスパラメータ決定装置は、Riceパラメータ決定部341を少なくとも備えた装置である。復号側のライスパラメータ決定装置は、非平滑化振幅スペクトル包絡系列生成部32等の他の部を備えていてもよい。
<包絡逆正規化部35>
包絡逆正規化部35には、平滑化振幅スペクトル包絡系列生成部33が生成した平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)及び復号部34が生成した復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)が入力される。
包絡逆正規化部35は、平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)を用いて、復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)を逆正規化することにより、復号MDCT係数列^X(0),^X(1),…,^X(N-1)を生成する(ステップB5)。
生成された復号MDCT係数列^X(0),^X(1),…,^X(N-1)は、時間領域変換部36に出力される。
例えば、包絡逆正規化部35は、k=0,1,…,N-1として、復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)の各係数^XN(k)に、平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)の各包絡値^Wγ(k)を乗じることにより復号MDCT係数列^X(0),^X(1),…,^X(N-1)を生成する。すなわち、k=0,1,…,N-1として、^X(k)=^XN(k)×^Wγ(k)である。
このようにして、包絡逆正規化部35は、例えば復号正規化MDCT係数列である正規化周波数領域サンプル列の各係数と、平滑化振幅スペクトル包絡系列の対応する係数とを乗算したものである復号周波数領域サンプル列を得る。
<時間領域変換部36>
時間領域変換部36には、包絡逆正規化部35が生成した復号MDCT係数列^X(0),^X(1),…,^X(N-1)が入力される。
時間領域変換部36は、フレームごとに、包絡逆正規化部35が得た復号MDCT係数列^X(0),^X(1),…,^X(N-1)を時間領域に変換してフレーム単位の音信号(復号音信号)を得る(ステップB6)。
このようにして、時間領域変換部36は、例えば復号MDCT係数列である復号周波数領域サンプル列に対応する復号音信号を得る。
[第三実施形態]
(第三実施形態の符号化)
第三実施形態の符号化装置の構成例を図4に示す。第三実施形態の符号化装置は、図4に示すように、周波数領域変換部21と、線形予測分析部22と、非平滑化振幅スペクトル包絡系列生成部23と、平滑化振幅スペクトル包絡系列生成部24と、包絡正規化部25と、符号化部26とを例えば備えている。この符号化装置により実現される第三実施形態の符号化方法の各処理の例を図5に示す。
以下、図4の各部について説明する。
<周波数領域変換部21>
周波数領域変換部21には、時間領域の時系列信号である音信号が入力される。音信号の例は、音声ディジタル信号又は音響ディジタル信号である。
周波数領域変換部21は、所定の時間長のフレーム単位で、入力された時間領域の音信号を周波数領域のN点のMDCT係数列X(0),X(1),…,X(N-1)に変換する(ステップA1)。Nは正の整数である。
得られたMDCT係数列X(0),X(1),…,X(N-1)は、線形予測分析部22と包絡正規化部25に出力される。
特に断りがない限り、以降の処理はフレーム単位で行われるものとする。
このようにして、周波数領域変換部21は、音信号に対応する、例えばMDCT係数列である周波数領域サンプル列を求める。
<線形予測分析部22>
線形予測分析部22には、周波数領域変換部21が得たMDCT係数列X(0),X(1),…,X(N-1)が入力される。
線形予測分析部22は、MDCT係数列X(0),X(1),…,X(N-1)を用いて、以下の式(A7)により定義される~R(0),~R(1),…,~R(N-1)を線形予測分析して線形予測係数β12,…,βpを生成し、生成された線形予測係数β12,…,βpを符号化して線形予測係数符号と線形予測係数符号に対応する量子化された線形予測係数である量子化線形予測係数^β1,^β2,…,^βpとを生成する(ステップA2)。
Figure 0006457552
ただし、ηは形状パラメータであり、予め決めておく。例えば、ηを2以外の所定の整数とする。
生成された量子化線形予測係数^β1,^β2,…,^βpは、非平滑化スペクトル包絡系列生成部23と平滑化振幅スペクトル包絡系列生成部24に出力される。なお、線形予測分析処理の過程で予測残差のエネルギーσ2が算出される。この場合、算出された予測残差のエネルギーσ2は、分散パラメータ決定部268に出力される。
また、生成された線形予測係数符号は、復号装置に送信される。
具体的には、線形予測分析部22は、まずMDCT係数列X(0),X(1),…,X(N-1)の絶対値のη乗をパワースペクトルと見做した逆フーリエ変換に相当する演算、すなわち式(A7)の演算を行うことにより、MDCT係数列X(0),X(1),…,X(N-1)の絶対値のη乗に対応する時間領域の信号列である擬似相関関数信号列~R(0),~R(1),…,~R(N-1)を求める。そして、線形予測分析部22は、求まった擬似相関関数信号列~R(0),~R(1),…,~R(N-1)を用いて線形予測分析を行って、線形予測係数β12,…,βpを生成する。そして、線形予測分析部22は、生成された線形予測係数β12,…,βpを符号化することにより、線形予測係数符号と、線形予測係数符号に対応する量子化線形予測係数^β1,^β2,…,^βpとを得る。
線形予測係数β12,…,βpは、MDCT係数列X(0),X(1),…,X(N-1)の絶対値のη乗をパワースペクトルと見做したときの時間領域の信号に対応する線形予測係数である。
線形予測分析部22による線形予測係数符号の生成は、例えば従来的な符号化技術によって行われる。従来的な符号化技術とは、例えば、線形予測係数そのものに対応する符号を線形予測係数符号とする符号化技術、線形予測係数をLSPパラメータに変換してLSPパラメータに対応する符号を線形予測係数符号とする符号化技術、線形予測係数をPARCOR係数に変換してPARCOR係数に対応する符号を線形予測係数符号とする符号化技術などである。例えば、線形予測係数そのものに対応する符号を線形予測係数符号とする符号化技術は、複数の量子化線形予測係数の候補が予め定められ、各候補が線形予測係数符号と予め対応付けられて記憶されており、候補の何れかが生成された線形予測係数に対する量子化線形予測係数として決定され、量子化線形予測係数と線形予測係数符号とが得られる技術である。
このようにして、線形予測分析部22は、例えばMDCT係数列である周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做した逆フーリエ変換を行うことにより得られる疑似相関関数信号列を用いて線形予測分析を行い線形予測係数に変換可能な係数を生成する。
<非平滑化振幅スペクトル包絡系列生成部23>
非平滑化振幅スペクトル包絡系列生成部23には、線形予測分析部22が生成した量子化線形予測係数^β1,^β2,…,^βpが入力される。
非平滑化振幅スペクトル包絡系列生成部23は、量子化線形予測係数^β1,^β2,…,^βpに対応する振幅スペクトル包絡の系列である非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を生成する(ステップA3)。
生成された非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)は、符号化部26に出力される。
非平滑化振幅スペクトル包絡系列生成部23は、量子化線形予測係数^β1,^β2,…,^βpを用いて、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)として、式(A2)により定義される非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を生成する。
Figure 0006457552
このようにして、非平滑化振幅スペクトル包絡系列生成部23は、線形予測分析部22により生成された線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列を得ることによりスペクトル包絡の推定を行う。ここで、cを任意の数として、複数の値から構成される系列をc乗した系列とは、複数の値のそれぞれをc乗した値から構成される系列のことである。例えば、振幅スペクトル包絡の系列を1/η乗した系列とは、振幅スペクトル包絡の各係数を1/η乗した値から構成される系列のことである。
非平滑化振幅スペクトル包絡系列生成部23による1/η乗の処理は、線形予測分析部22で行われた周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做した処理に起因するものである。すなわち、非平滑化振幅スペクトル包絡系列生成部23による1/η乗の処理は、線形予測分析部22で行われた周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做した処理によりη乗された値を元の値に戻すために行われる。
第一実施形態及び第二実施形態では式(13)により定義されるHγ(k) [k=0,1,…,N-1]が用いられるのに対して、第三実施形態では式(A2)により定義されるHγ(k) [k=0,1,…,N-1]が用いられる。
<平滑化振幅スペクトル包絡系列生成部24>
平滑化振幅スペクトル包絡系列生成部24には、線形予測分析部22が生成した量子化線形予測係数^β1,^β2,…,^βpが入力される。
平滑化振幅スペクトル包絡系列生成部24は、量子化線形予測係数^β1,^β2,…,^βpに対応する振幅スペクトル包絡の系列の振幅の凸凹を鈍らせた系列である平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)を生成する(ステップA4)。
生成された平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)は、包絡正規化部25及び符号化部26に出力される。
平滑化振幅スペクトル包絡系列生成部24は、量子化線形予測係数^β1,^β2,…,^βpと補正係数γを用いて、平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)として、式(A3)により定義される平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)を生成する。
Figure 0006457552
ここで、補正係数γは予め定められた1未満の定数であり非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)の振幅の凹凸を鈍らせる係数、言い換えれば非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を平滑化する係数である。
第一実施形態及び第二実施形態では式(14)により定義される^Hγ(k) [k=0,1,…,N-1]が用いられるのに対して、第三実施形態では式(A3)により定義される^Hγ(k) [k=0,1,…,N-1]が用いられる。
<包絡正規化部25>
包絡正規化部25には、周波数領域変換部21が得たMDCT係数列X(0),X(1),…,X(N-1)及び平滑化振幅スペクトル包絡系列生成部24が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)が入力される。
包絡正規化部25は、MDCT係数列X(0),X(1),…,X(N-1)の各係数を、対応する平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)の各値で正規化することにより、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)を生成する(ステップA5)。
生成された正規化MDCT係数列は、符号化部26に出力される。
包絡正規化部25は、例えば、k=0,1,…,N-1として、MDCT係数列X(0),X(1),…,X(N-1)の各係数X(k)を平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)で除算することにより、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数XN(k)を生成する。すなわち、k=0,1,…,N-1として、XN(k)=X(k)/^Hγ(k)である。
<符号化部26>
符号化部26には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)、非平滑化振幅スペクトル包絡系列生成部23が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)、平滑化振幅スペクトル包絡系列生成部24が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)及び線形予測分析部22が算出した平均残差のエネルギーσ2が入力される。
符号化部26は、図13に示すステップA61からステップA65の処理を例えば行うことにより符号化を行う(ステップA6)。
符号化部26は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)に対応するグローバルゲインgを求め(ステップA61)、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数をグローバルゲインgで割り算した結果を量子化した整数値による系列である量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を求め(ステップA62)、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数に対応する分散パラメータφ(0),φ(1),…,φ(N-1)をグローバルゲインgと非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)と平均残差のエネルギーσ2とから式(A1)により求め(ステップA63)、分散パラメータφ(0),φ(1),…,φ(N-1)を用いて量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を算術符号化して整数信号符号を得(ステップA64)、グローバルゲインgに対応する利得符号を得る(ステップA65)。
Figure 0006457552
ここで、上記の式(A1)における正規化振幅スペクトル包絡系列^HN(0),^HN(1),…,^HN (N-1)は、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)の各値を、対応する平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)の各値で除算したもの、すなわち、以下の式(A8)により求まるものである。
Figure 0006457552
生成された整数信号符号と利得符号は正規化MDCT係数列に対応する符号として、復号装置に出力される。
符号化部26は、ステップA61からステップA65により、整数信号符号のビット数が、予め配分されたビット数である配分ビット数B以下、かつ、なるべく大きな値となるようなグローバルゲインgを決定し、決定されたグローバルゲインgに対応する利得符号と、この決定されたグローバルゲインgに対応する整数信号符号とを生成する機能を実現している。
符号化部26が行うステップA61からステップA65のうち、の特徴的な処理が含まれるのはステップA63であり、グローバルゲインgと量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)のそれぞれを符号化することにより正規化MDCT係数列に対応する符号を得る符号化処理自体には、非特許文献1に記載された技術を含む様々な公知技術が存在する。以下では符号化部26が行う符号化処理の具体例を2つ説明する。
[符号化部26が行う符号化処理の具体例1]
符号化部26が行う符号化処理の具体例1として、ループ処理を含まない例について説明する。
具体例1の符号化部26の構成例を図14に示す。具体例1の符号化部26は、図14に示すように、利得取得部261と、量子化部262と、分散パラメータ決定部268と、算術符号化部269と、利得符号化部265とを例えば備えている。以下、図14の各部について説明する。
<利得取得部261>
利得取得部261には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)が入力される。
利得取得部261は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)から、整数信号符号のビット数が、予め配分されたビット数である配分ビット数B以下、かつ、なるべく大きな値となるようなグローバルゲインgを決定して出力する(ステップS261)。利得取得部261は、例えば、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)のエネルギーの合計の平方根と配分ビット数Bと負の相関のある定数との乗算値をグローバルゲインgとして得て出力する。または、利得取得部261は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)のエネルギーの合計と、配分ビット数Bと、グローバルゲインgと、の関係を予めテーブル化しておき、そのテーブルを参照することによりグローバルゲインgを得て出力してもよい。
このようにして、利得取得部261は、例えば正規化MDCT係数列である正規化周波数領域サンプル列の全サンプルを除算するための利得を得る。
得られたグローバルゲインgは、量子化部262及び分散パラメータ決定部268に出力される。
<量子化部262>
量子化部262には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)及び利得取得部261が得たグローバルゲインgが入力される。
量子化部262は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数をグローバルゲインgで割り算した結果の整数部分による系列である量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を得て出力する(ステップS262)。
このようにして、量子化部262は、例えば正規化MDCT係数列である正規化周波数領域サンプル列の各サンプルを、利得で除算するとともに量子化して量子化正規化済係数系列を求める。
得られた量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)は、算術符号化部269に出力される。
<分散パラメータ決定部268>
分散パラメータ決定部268には、利得取得部261が得たグローバルゲインg、非平滑化振幅スペクトル包絡系列生成部23が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)、平滑化振幅スペクトル包絡系列生成部24が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)及び線形予測分析部22が得た予測残差のエネルギーσ2が入力される。
分散パラメータ決定部268は、グローバルゲインgと、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と、平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)、予測残差のエネルギーσ2とから、上記の式(A1),式(A8)により分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを得て出力する(ステップS268)。
得られた分散パラメータ系列φ(0),φ(1),…,φ(N-1)は、算術符号化部269に出力される。
<算術符号化部269>
算術符号化部269には、量子化部262が得た量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)及び分散パラメータ決定部268が得た分散パラメータ系列φ(0),φ(1),…,φ(N-1)が入力される。
算術符号化部269は、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数に対応する分散パラメータとして分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを用いて、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を算術符号化して整数信号符号を得て出力する(ステップS269)。
算術符号化部269は、算術符号化の際に、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数が一般化ガウス分布fGG(X|φ(k),η)に従うときに最適になるような算術符号を構成し、この構成に基づく算術符号により符号化を行う。この結果、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数へのビット割り当ての期待値が分散パラメータ系列φ(0),φ(1),…,φ(N-1)で決定されることになる。
得られた整数信号符号は、復号装置に出力される。
量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の中の複数の係数に跨って算術符号化が行われてもよい。この場合、分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータは、式(A1),式(A8)からわかるように、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)に基づいているため、算術符号化部269は、推定されたスペクトル包絡(非平滑化振幅スペクトル包絡)を基に実質的にビット割り当てが変わる符号化を行っていると言える。
<利得符号化部265>
利得符号化部265には、利得取得部261が得たグローバルゲインgが入力される。
利得符号化部265は、グローバルゲインgを符号化して利得符号を得て出力する(ステップS265)。
生成された整数信号符号と利得符号は正規化MDCT係数列に対応する符号として、復号装置に出力される。
本具体例1のステップS261,S262,S268,S269,S265がそれぞれ上記のステップA61,A62,A63,A64,A65に対応する。
[符号化部26が行う符号化処理の具体例2]
符号化部26が行う符号化処理の具体例2として、ループ処理を含む例について説明する。
具体例2の符号化部26の構成例を図15に示す。具体例2の符号化部26は、図15に示すように、利得取得部261と、量子化部262と、分散パラメータ決定部268と、算術符号化部269と、利得符号化部265と、判定部266と、利得更新部267とを例えば備えている。以下、図15の各部について説明する。
<利得取得部261>
利得取得部261には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)が入力される。
利得取得部261は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)から、整数信号符号のビット数が、予め配分されたビット数である配分ビット数B以下、かつ、なるべく大きな値となるようなグローバルゲインgを決定して出力する(ステップS261)。利得取得部261は、例えば、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)のエネルギーの合計の平方根と配分ビット数Bと負の相関のある定数との乗算値をグローバルゲインgとして得て出力する。
得られたグローバルゲインgは、量子化部262及び分散パラメータ決定部268に出力される。
利得取得部261が得たグローバルゲインgは、量子化部262及び分散パラメータ決定部268で用いられるグローバルゲインの初期値となる。
<量子化部262>
量子化部262には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)及び利得取得部261又は利得更新部267が得たグローバルゲインgが入力される。
量子化部262は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数をグローバルゲインgで割り算した結果の整数部分による系列である量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を得て出力する(ステップS262)。
ここで、量子化部262が初回に実行される際に用いられるグローバルゲインgは、利得取得部261が得たグローバルゲインg、すなわちグローバルゲインの初期値である。また、量子化部262が2回目以降に実行される際に用いられるグローバルゲインgは、利得更新部267が得たグローバルゲインg、すなわちグローバルゲインの更新値である。
得られた量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)は、算術符号化部269に出力される。
<分散パラメータ決定部268>
分散パラメータ決定部268には、利得取得部261又は利得更新部267が得たグローバルゲインg、非平滑化振幅スペクトル包絡系列生成部23が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)、平滑化振幅スペクトル包絡系列生成部24が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)及び線形予測分析部22が得た予測残差のエネルギーσ2が入力される。
分散パラメータ決定部268は、グローバルゲインgと、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と、平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)と、予測残差のエネルギーσ2とから、上記の式(A1),式(A8)により分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを得て出力する(ステップS268)。
ここで、分散パラメータ決定部268が初回に実行される際に用いられるグローバルゲインgは、利得取得部261が得たグローバルゲインg、すなわちグローバルゲインの初期値である。また、分散パラメータ決定部268が2回目以降に実行される際に用いられるグローバルゲインgは、利得更新部267が得たグローバルゲインg、すなわちグローバルゲインの更新値である。
得られた分散パラメータ系列φ(0),φ(1),…,φ(N-1)は、算術符号化部269に出力される。
<算術符号化部269>
算術符号化部269には、量子化部262が得た量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)及び分散パラメータ決定部268が得た分散パラメータ系列φ(0),φ(1),…,φ(N-1)が入力される。
算術符号化部269は、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数に対応する分散パラメータとして分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを用いて、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を算術符号化して、整数信号符号と整数信号符号のビット数である消費ビット数Cとを得て出力する(ステップS269)。
算術符号化部269は、算術符号化の際に、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数が一般化ガウス分布fGG(X|φ(k),η)に従うときに最適になるようなビット割り当てを算術符号により行い、行われたビット割り当てに基づく算術符号により符号化を行う。
得られた整数信号符号及び消費ビット数Cは、判定部266に出力される。
量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の中の複数の係数に跨って算術符号化が行われてもよい。この場合、分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータは、式(A1),式(A8)からわかるように、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)に基づいているため、算術符号化部269は、推定されたスペクトル包絡(非平滑化振幅スペクトル包絡)を基に実質的にビット割り当てが変わる符号化を行っていると言える。
<判定部266>
判定部266には、算術符号化部269が得た整数信号符号が入力される。
判定部266は、利得の更新回数が予め定めた回数の場合には、整数信号符号を出力するとともに、利得符号化部265に対し利得更新部267が得たグローバルゲインgを符号化する指示信号を出力し、利得の更新回数が予め定めた回数未満である場合には、利得更新部267に対し、算術符号化部26が計測した消費ビット数Cを出力する(ステップS266)。
<利得更新部267>
利得更新部267には、算術符号化部26が計測した消費ビット数Cが入力される。
利得更新部267は、消費ビット数Cが配分ビット数Bより多い場合にはグローバルゲインgの値を大きな値に更新して出力し、消費ビット数Cが配分ビット数Bより少ない場合にはグローバルゲインgの値を小さな値に更新し、更新後のグローバルゲインgの値を出力する(ステップS267)。
利得更新部267が得た更新後のグローバルゲインgは、量子化部262及び利得符号化部265に出力される。
<利得符号化部265>
利得符号化部265には、判定部266からの出力指示及び利得更新部267が得たグローバルゲインgが入力される。
利得符号化部265は、指示信号に従って、グローバルゲインgを符号化して利得符号を得て出力する(ステップ265)。
判定部266が出力した整数信号符号と、利得符号化部265が出力した利得符号は、正規化MDCT係数列に対応する符号として、復号装置に出力される。
すなわち、本具体例2においては、最後に行われたステップS267が上記のステップA61に対応し、ステップS262,S263,S264,S265がそれぞれ上記のステップA62,A63,A64,A65に対応する。
なお、符号化部26が行う符号化処理の具体例2については、国際公開公報WO2014/054556などに更に詳細に説明されている。
[符号化部26の変形例]
符号化部26は、例えば以下の処理を行うことにより、推定されたスペクトル包絡(非平滑化振幅スペクトル包絡)を基にビット割り当てを変える符号化を行ってもよい。
符号化部26は、まず、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)に対応するグローバルゲインgを求め、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数をグローバルゲインgで割り算した結果を量子化した整数値による系列である量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を求める。
この量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数に対応する量子化ビットは、XQ(k)の分布がある範囲内で一様であると仮定して、その範囲を包絡の推定値から決めることができる。複数のサンプルごとの包絡の推定値を符号化することもできるが、符号化部26は、例えば以下の式(A9)のように線形予測に基づく正規化振幅スペクトル包絡系列の値^HN(k)を使用してXQ(k)の範囲を決めることができる。
Figure 0006457552
あるkにおけるXQ(k)を量子化するときに、XQ(k)の二乗誤差を最小とするために
Figure 0006457552
の制約のもとに、割り当てるビット数b(k)
Figure 0006457552
を設定することができる。Bは予め定められた正の整数である。この際にb(k)が整数となるように四捨五入するとか、0より小さくなる場合にはb(k)=0とするなどして、b(k)の再調整の処理を符号化部26は行ってもよい。
また、符号化部26は、サンプルごとの割り当てでなく、複数のサンプルをまとめて配分ビット数を決めて、量子化にもサンプルごとのスカラ量子化でなく、複数のサンプルをまとめたベクトルごとの量子化をすることも可能である。
サンプルkのXQ(k)の量子化ビット数b(k)が上記で与えられ、サンプルごとに符号化するとすると、XQ(k)は-2b(k)-1から2b(k)-1までの2b(k)種類の整数を取り得る。符号化部26は、b(k)ビットで各サンプルを符号化して整数信号符号を得る。
生成された整数信号符号は、復号装置に出力される。例えば、生成されたXQ(k)に対応するb(k)ビットの整数信号符号は、k=0から順次復号装置に出力される。
もし、XQ(k)が上記の-2b(k)-1から2b(k)-1までの範囲をこえる場合には最大値、または最小値に置き換える。
gが小さすぎるとこの置き換えで量子化歪が発生し、gが大きすぎると量子化誤差は大きくなり、XQ(k)のとりうる範囲がb(k)に比べて小さすぎて、情報の有効利用ができないことになる。このため、gの最適化を行ってもよい。
符号化部26は、グローバルゲインgを符号化して利得符号を得て出力する。
この符号化部26の変形例のように、符号化部26は算術符号化以外の符号化を行ってもよい。
(第三実施形態の復号)
第三実施形態の符号化装置に対応する復号装置の構成例を図16に示す。第三実施形態の復号装置は、図16に示すように、線形予測係数復号部31と、非平滑化振幅スペクトル包絡系列生成部32と、平滑化振幅スペクトル包絡系列生成部33と、復号部34と、包絡逆正規化部35と、時間領域変換部36とを例えば備えている。この復号装置により実現される第三実施形態の復号方法の各処理の例を図10に示す。
復号装置には、符号化装置が出力した、正規化MDCT係数列に対応する符号及び線形予測係数符号が少なくとも入力される。
以下、図16の各部について説明する。
<線形予測係数復号部31>
線形予測係数復号部31には、符号化装置が出力した線形予測係数符号が入力される。
線形予測係数復号部31は、フレームごとに、入力された線形予測係数符号を例えば従来的な復号技術によって復号して復号線形予測係数^β1,^β2,…, ^βpを得る(ステップB1)。
得られた復号線形予測係数^β1,^β2,…, ^βpは、非平滑化振幅スペクトル包絡系列生成部32及び平滑化振幅スペクトル包絡系列生成部33に出力される。
ここで、従来的な復号技術とは、例えば、線形予測係数符号が量子化された線形予測係数に対応する符号である場合に線形予測係数符号を復号して量子化された線形予測係数と同じ復号線形予測係数を得る技術、線形予測係数符号が量子化されたLSPパラメータに対応する符号である場合に線形予測係数符号を復号して量子化されたLSPパラメータと同じ復号LSPパラメータを得る技術などである。また、線形予測係数とLSPパラメータは互いに変換可能なものであり、入力された線形予測係数符号と後段での処理において必要な情報に応じて、復号線形予測係数と復号LSPパラメータの間での変換処理を行なえばよいのは周知である。以上から、上記の線形予測係数符号の復号処理と必要に応じて行なう上記の変換処理とを包含したものが「従来的な復号技術による復号」ということになる。
このようにして、線形予測係数復号部31は、入力された線形予測係数符号を復号することにより、時系列信号に対応する周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做した逆フーリエ変換を行うことにより得られる疑似相関関数信号列に対応する線形予測係数に変換可能な係数を生成する。
<非平滑化振幅スペクトル包絡系列生成部32>
非平滑化振幅スペクトル包絡系列生成部32には、線形予測係数復号部31が得た復号線形予測係数^β1,^β2,…,^βpが入力される。
非平滑化振幅スペクトル包絡系列生成部32は、復号線形予測係数^β1,^β2,…,^βpに対応する振幅スペクトル包絡の系列である非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を上記の式(A2)により生成する(ステップB2)。
生成された非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)は、復号部34に出力される。
このようにして、非平滑化振幅スペクトル包絡系列生成部32は、ηを2以外の所定の正の数として、線形予測係数復号部31により生成された線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列を得る。非平滑化振幅スペクトル包絡系列生成部32が用いるηは予め定められているものであり、対応する符号化装置において予め定められたηと同じものである。
<平滑化振幅スペクトル包絡系列生成部33>
平滑化振幅スペクトル包絡系列生成部33には、線形予測係数復号部31が得た復号線形予測係数^β1,^β2,…,^βpが入力される。
平滑化振幅スペクトル包絡系列生成部33は、復号線形予測係数^β1,^β2,…,^βpに対応する振幅スペクトル包絡の系列の振幅の凹凸を鈍らせた系列である平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)を上記の式A(3)により生成する(ステップB3)。
生成された平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)は、復号部34及び包絡逆正規化部35に出力される。
<復号部34>
復号部34には、符号化装置が出力した正規化MDCT係数列に対応する符号非平滑化振幅スペクトル包絡系列生成部32が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)及び平滑化振幅スペクトル包絡系列生成部33が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)が入力される。
復号部34は、分散パラメータ決定部342を備えている。
復号部34は、図17に示すステップB41からステップB44の処理を例えば行うことにより復号を行う(ステップB4)。すなわち、復号部34は、フレームごとに、入力された正規化MDCT係数列に対応する符号に含まれる利得符号を復号してグローバルゲインgを得る(ステップB41)。復号部34の分散パラメータ決定部342は、グローバルゲインgと非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)とから上記の式(A1)により分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを求める(ステップB42)。復号部34は、正規化MDCT係数列に対応する符号に含まれる整数信号符号を分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータに対応する算術復号の構成に従い、算術復号して復号正規化済係数系列^XQ(0),^XQ(1),…,^XQ(N-1)を得(ステップB43)、復号正規化済係数系列^XQ(0),^XQ(1),…,^XQ(N-1)の各係数にグローバルゲインgを乗算して復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)を生成する(ステップB44)。このように、復号部34は、非平滑化スペクトル包絡系列に基づいて実質的に変わるビット割り当てに従って、入力された整数信号符号の復号を行ってもよい。
なお、[符号化部26の変形例]に記載された処理により符号化が行われた場合には、復号部34は例えば以下の処理を行う。復号部34は、フレームごとに、入力された正規化MDCT係数列に対応する符号に含まれる利得符号を復号してグローバルゲインgを得る。復号部34の分散パラメータ決定部342は、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)とから上記の式(A9)により分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを求める。復号部34は、分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータφ(k)に基づいて式(A10)によりb(k)を求めることができ、XQ(k)の値をそのビット数b(k)で順次復号して、復号正規化済係数系列^XQ(0),^XQ(1),…,^XQ(N-1)を得て、復号正規化済係数系列^XQ(0),^XQ(1),…,^XQ(N-1)の各係数にグローバルゲインgを乗算して復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)を生成する。このように、復号部34は、非平滑化スペクトル包絡系列に基づいて変わるビット割り当てに従って、入力された整数信号符号の復号を行ってもよい。
生成された復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)は、包絡逆正規化部35に出力される。
<包絡逆正規化部35>
包絡逆正規化部35には、平滑化振幅スペクトル包絡系列生成部33が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)及び復号部34が生成した復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)が入力される。
包絡逆正規化部35は、平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)を用いて、復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)を逆正規化することにより、復号MDCT係数列^X(0),^X(1),…,^X(N-1)を生成する(ステップB5)。
生成された復号MDCT係数列^X(0),^X(1),…,^X(N-1)は、時間領域変換部36に出力される。
例えば、包絡逆正規化部35は、k=0,1,…,N-1として、復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)の各係数^XN(k)に、平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)の各包絡値^Hγ(k)を乗じることにより復号MDCT係数列^X(0),^X(1),…,^X(N-1)を生成する。すなわち、k=0,1,…,N-1として、^X(k)=^XN(k)×^Hγ(k)である。
<時間領域変換部36>
時間領域変換部36には、包絡逆正規化部35が生成した復号MDCT係数列^X(0),^X(1),…,^X(N-1)が入力される。
時間領域変換部36は、フレームごとに、包絡逆正規化部35が得た復号MDCT係数列^X(0),^X(1),…,^X(N-1)を時間領域に変換してフレーム単位の音信号(復号音信号)を得る(ステップB6)。
このようにして、復号装置は、周波数領域での復号により時系列信号を得る。
[変形例等]
線形予測分析部22及び非平滑化振幅スペクトル包絡系列生成部23を1つのスペクトル包絡推定部2Aとして捉えると、このスペクトル包絡推定部2Aは、ηを2以外の所定の正の数として、時系列信号に対応する例えばMDCT係数列である周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做したスペクトル包絡(非平滑化振幅スペクトル包絡系列)の推定を行っていると言える。例えば、第一実施形態ではηが1である場合の処理を行っていると言える。第二実施形態ではηが2である場合の処理を行っていると言える。また、第三実施形態ではηが2以外の所定の正の数である場合の処理を行っていると言える。ここで、「パワースペクトルと見做した」「パワースペクトルと見做して」とは、パワースペクトルを通常用いるところに、η乗のスペクトルを用いることを意味する。
この場合、ηを2以外の所定の整数として、スペクトル包絡推定部2Aの線形予測分析部22は、例えばMDCT係数列である周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做した逆フーリエ変換を行うことにより得られる疑似相関関数信号列を用いて線形予測分析を行い線形予測係数に変換可能な係数を得ていると言える。また、スペクトル包絡推定部2Aの非平滑化振幅スペクトル包絡系列生成部23は、ηを2以外の所定の整数として、線形予測分析部22により得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列を得ることによりスペクトル包絡の推定を行っていると言える。
また、平滑化振幅スペクトル包絡系列生成部24、包絡正規化部25及び符号化部26を1つの符号化部2Bとして捉えると、この符号化部2Bは、スペクトル包絡推定部2Aにより推定されたスペクトル包絡(非平滑化振幅スペクトル包絡系列)を基にビット割り当てを変える又は実質的にビット割り当てが変わる符号化を時系列信号に対応する例えばMDCT係数列である周波数領域サンプル列の各係数に対して行っていると言える。
第一実施形態から第三実施形態で説明した、スペクトル包絡推定部2Aの処理(すなわち、線形予測分析部22及び非平滑化振幅スペクトル包絡系列生成部23の処理)、及び、符号化部2Bの処理(すなわち、平滑化振幅スペクトル包絡系列生成部24、包絡正規化部25及び符号化部26の処理)は、一例に過ぎない。スペクトル包絡推定部2Aは、第一実施形態から第三実施形態で説明した処理以外の、時系列信号に対応する例えばMDCT係数列である周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做したスペクトル包絡(非平滑化振幅スペクトル包絡系列)の推定を行う処理を行ってもよい。また、符号化部2Bは、第一実施形態から第三実施形態で説明した処理以外の、スペクトル包絡推定部2Aにより推定されたスペクトル包絡(非平滑化振幅スペクトル包絡系列)を基にビット割り当てを変える又は実質的にビット割り当てが変わる符号化を時系列信号に対応する例えばMDCT係数列である周波数領域サンプル列の各係数に対して行う処理を行ってもよい。
例えば符号化部2Bに平滑化振幅スペクトル包絡系列生成部24が設けられていなくてもよい。この場合、包絡正規化部25によるMDCT係数列の正規化処理は行われず、符号化部26は正規化MDCT係数列に代えてMDCT係数列に対して上記と同様の符号化処理を行う。また、この場合、符号化部26の分散パラメータ決定部268は、式(A1)の代わりに下記の式(A11)に基づいて分散パラメータを決定する。
Figure 0006457552
また、この場合、復号装置に平滑化振幅スペクトル包絡系列生成部33が設けられていなくてもよい。この場合、包絡逆正規化部35による復号正規化MDCT係数列の逆正規化処理は行われず、復号部34の復号により復号MDCT係数列が得られる。また、この場合、復号部34の分散パラメータ決定部342は、式(A1)の代わりに上記の式(A11)に基づいて分散パラメータを決定する。さらに、この場合、時間領域変換部36は、復号正規化MDCT係数列に代えて復号MDCT係数列に対して上記と同様の時間領域変換を行う。
また、例えば符号化部2Bに包絡正規化部25が設けられていなくてもよい。この場合、符号化部26は正規化MDCT係数列に代えてMDCT係数列に対して上記と同様の符号化処理を行う。また、この場合、復号装置に包絡逆正規化部35が設けられていなくてもよい。この場合、復号部34の復号により復号MDCT係数列が得られ、時間領域変換部36は、復号正規化MDCT係数列に代えて復号MDCT係数列に対して上記と同様の時間領域変換を行う。
復号部34及び包絡逆正規化部35を1つの復号部3Aとして捉えると、この復号部3Aは、非平滑化スペクトル包絡系列に基づいて変わるビット割り当て又は実質的に変わるビット割り当てに従って、入力された整数信号符号の復号を行うことにより時系列信号に対応する周波数領域サンプル列を得ていると言える。
上記説明した処理は、記載の順にしたがって時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
また、各装置における各部の処理をコンピュータによって実現してもよい。その場合、各装置の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における各部の処理がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (8)

  1. 時系列信号を周波数領域で符号化する符号化装置であって、
    ηを2以外の所定の正の数として、上記時系列信号に対応する周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做してスペクトル包絡の推定を行うスペクトル包絡推定部と、
    上記推定されたスペクトル包絡を基にビット割り当てを変える又は実質的にビット割り当てが変わる符号化を上記時系列信号に対応する周波数領域サンプル列の各係数に対して行う符号化部と、
    を含む符号化装置。
  2. 請求項1の符号化装置において、
    上記スペクトル包絡推定部は、上記周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做した逆フーリエ変換を行うことにより得られる疑似相関関数信号列を用いて線形予測分析を行い線形予測係数に変換可能な係数を得る線形予測分析部と、上記線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列を得ることにより上記スペクトル包絡の推定を行う非平滑化スペクトル包絡系列生成部と、を含む、
    符号化装置。
  3. 周波数領域での復号により時系列信号に対応する周波数領域サンプル列を得る復号装置であって、
    入力された線形予測係数符号を復号して線形予測係数に変換可能な係数を得る線形予測係数復号部と、
    ηを2以外の所定の正の数として、上記線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列を得る非平滑化スペクトル包絡系列生成部と、
    上記非平滑化スペクトル包絡系列に基づいて変わるビット割り当て又は実質的に変わるビット割り当てに従って、入力された整数信号符号の復号を行うことにより上記時系列信号に対応する周波数領域サンプル列を得る復号部と、
    を含む復号装置。
  4. 時系列信号を周波数領域で符号化する符号化方法であって、
    ηを2以外の所定の正の数として、上記時系列信号に対応する周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做してスペクトル包絡の推定を行うスペクトル包絡推定ステップと、
    上記推定されたスペクトル包絡を基にビット割り当てを変える又は実質的にビット割り当てが変わる符号化を上記時系列信号に対応する周波数領域サンプル列の各係数に対して行う符号化ステップと、
    を含む符号化方法。
  5. 請求項4の符号化方法において、
    上記スペクトル包絡推定ステップは、上記周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做した逆フーリエ変換を行うことにより得られる疑似相関関数信号列を用いて線形予測分析を行い線形予測係数に変換可能な係数を得る線形予測分析ステップと、上記線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列を得ることにより上記スペクトル包絡の推定を行う非平滑化スペクトル包絡系列生成ステップと、を含む、
    符号化方法。
  6. 周波数領域での復号により時系列信号に対応する周波数領域サンプル列を得る復号方法であって、
    入力された線形予測係数符号を復号して線形予測係数に変換可能な係数を得る線形予測係数復号ステップと、
    ηを2以外の所定の正の数として、上記線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列を得る非平滑化スペクトル包絡系列生成ステップと、
    上記非平滑化スペクトル包絡系列に基づいて変わるビット割り当て又は実質的に変わるビット割り当てに従って、入力された整数信号符号の復号を行うことにより上記時系列信号に対応する周波数領域サンプル列を得る復号ステップと、
    を含む復号方法。
  7. 請求項1,2の何れかの符号化装置の各部としてコンピュータを機能させるためのプログラム。
  8. 求項3の復号装置の各部としてコンピュータを機能させるためのプログラム。
JP2016561570A 2014-11-27 2015-11-24 符号化装置、復号装置、これらの方法及びプログラム Active JP6457552B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2014239644 2014-11-27
JP2014239644 2014-11-27
JP2015017692 2015-01-30
JP2015017692 2015-01-30
PCT/JP2015/082839 WO2016084764A1 (ja) 2014-11-27 2015-11-24 符号化装置、復号装置、これらの方法及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2016084764A1 JPWO2016084764A1 (ja) 2017-10-05
JP6457552B2 true JP6457552B2 (ja) 2019-01-23

Family

ID=56074324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016561570A Active JP6457552B2 (ja) 2014-11-27 2015-11-24 符号化装置、復号装置、これらの方法及びプログラム

Country Status (5)

Country Link
US (1) US9838700B2 (ja)
EP (1) EP3226243B1 (ja)
JP (1) JP6457552B2 (ja)
CN (1) CN107004422B (ja)
WO (1) WO2016084764A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101996307B1 (ko) 2015-01-30 2019-07-04 니폰 덴신 덴와 가부시끼가이샤 부호화 장치, 복호 장치, 이들의 방법, 프로그램 및 기록 매체
JP6499206B2 (ja) * 2015-01-30 2019-04-10 日本電信電話株式会社 パラメータ決定装置、方法、プログラム及び記録媒体
US10325609B2 (en) 2015-04-13 2019-06-18 Nippon Telegraph And Telephone Corporation Coding and decoding a sound signal by adapting coefficients transformable to linear predictive coefficients and/or adapting a code book
JP6766264B2 (ja) * 2017-06-22 2020-10-07 日本電信電話株式会社 符号化装置、復号装置、符号化方法、復号方法、およびプログラム
WO2019167706A1 (ja) * 2018-03-02 2019-09-06 日本電信電話株式会社 符号化装置、符号化方法、プログラム、および記録媒体

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4649208B2 (ja) * 2002-07-16 2011-03-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオコーディング
KR100663379B1 (ko) * 2005-08-29 2007-01-02 주식회사 레인콤 멀티미디어용 휴대기기 오디오의 음질 향상 시스템 및 그향상 방법
KR20080049085A (ko) * 2005-09-30 2008-06-03 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치 및 음성 부호화 방법
FR2897742A1 (fr) * 2006-02-17 2007-08-24 France Telecom Codage/decodage perfectionnes de signaux numeriques, en particulier en quantification vectorielle avec codes a permutation
CN101140759B (zh) * 2006-09-08 2010-05-12 华为技术有限公司 语音或音频信号的带宽扩展方法及***
CN101320565B (zh) * 2007-06-08 2011-05-11 华为技术有限公司 感知加权滤波方法及感知加权滤波器
WO2009093714A1 (ja) * 2008-01-24 2009-07-30 Nippon Telegraph And Telephone Corporation 符号化方法、復号化方法、それらの装置、及びそれらのプログラムと記録媒体
CN101572092B (zh) * 2008-04-30 2012-11-21 华为技术有限公司 编解码端的固定码本激励的搜索方法及装置
CN101662288B (zh) * 2008-08-28 2012-07-04 华为技术有限公司 音频编码、解码方法及装置、***
JP5304504B2 (ja) * 2009-07-17 2013-10-02 ソニー株式会社 信号符号化装置、信号復号装置、信号処理システム、これらにおける処理方法およびプログラム
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
US9536534B2 (en) * 2011-04-20 2017-01-03 Panasonic Intellectual Property Corporation Of America Speech/audio encoding apparatus, speech/audio decoding apparatus, and methods thereof
CN102208188B (zh) * 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
WO2013142650A1 (en) * 2012-03-23 2013-09-26 Dolby International Ab Enabling sampling rate diversity in a voice communication system
EP3252762B1 (en) 2012-10-01 2019-01-30 Nippon Telegraph and Telephone Corporation Encoding method, encoder, program and recording medium

Also Published As

Publication number Publication date
US20170272766A1 (en) 2017-09-21
WO2016084764A1 (ja) 2016-06-02
JPWO2016084764A1 (ja) 2017-10-05
EP3226243A4 (en) 2018-04-11
EP3226243A1 (en) 2017-10-04
US9838700B2 (en) 2017-12-05
EP3226243B1 (en) 2022-01-05
CN107004422B (zh) 2020-08-25
CN107004422A (zh) 2017-08-01

Similar Documents

Publication Publication Date Title
JP6422813B2 (ja) 符号化装置、復号装置、これらの方法及びプログラム
JP6457552B2 (ja) 符号化装置、復号装置、これらの方法及びプログラム
WO2012137617A1 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
JP6633787B2 (ja) 線形予測復号装置、方法、プログラム及び記録媒体
JP6595687B2 (ja) 符号化方法、符号化装置、プログラム、および記録媒体
JP6744471B2 (ja) 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム、記録媒体
JP6387117B2 (ja) 符号化装置、復号装置、これらの方法、プログラム及び記録媒体
KR102070145B1 (ko) 파라미터 결정 장치, 방법, 프로그램 및 기록 매체
JP5663461B2 (ja) 符号化方法、符号化装置、プログラム、記録媒体
JPWO2015162979A1 (ja) 周波数領域パラメータ列生成方法、符号化方法、復号方法、周波数領域パラメータ列生成装置、符号化装置、復号装置、プログラム及び記録媒体
JP2011009860A (ja) 符号化方法、復号方法、符号化器、復号器、プログラム
JP5635213B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JPWO2013187498A1 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170525

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20170525

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180717

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180727

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181220

R150 Certificate of patent or registration of utility model

Ref document number: 6457552

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250