JP3344944B2 - オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 - Google Patents
オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法Info
- Publication number
- JP3344944B2 JP3344944B2 JP06241398A JP6241398A JP3344944B2 JP 3344944 B2 JP3344944 B2 JP 3344944B2 JP 06241398 A JP06241398 A JP 06241398A JP 6241398 A JP6241398 A JP 6241398A JP 3344944 B2 JP3344944 B2 JP 3344944B2
- Authority
- JP
- Japan
- Prior art keywords
- quantization
- band
- unit
- audio signal
- small
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005236 sound signal Effects 0.000 title claims description 136
- 238000000034 method Methods 0.000 title claims description 53
- 238000013139 quantization Methods 0.000 claims description 508
- 239000013598 vector Substances 0.000 claims description 76
- 238000012545 processing Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 description 142
- 238000010586 diagram Methods 0.000 description 27
- 108010076504 Protein Sorting Signals Proteins 0.000 description 16
- 238000004364 calculation method Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 11
- 230000000694 effects Effects 0.000 description 10
- 230000003044 adaptive effect Effects 0.000 description 7
- 230000006835 compression Effects 0.000 description 7
- 238000007906 compression Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 230000000873 masking effect Effects 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000005311 autocorrelation function Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3082—Vector coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
号などのオーディオ信号を符号化するオーディオ信号符
号化装置、特にオーディオ信号を直交変換等の手法を用
いて時間領域から周波数領域に変換し、その変換した信
号を、源オーディオ信号と比較してできるだけ少ない符
号列で表現することができるよう効率的に符号化する装
置,及び、符号化された信号である符号化列のすべて、
あるいはその一部のみを用いて、高い品質と広帯域なオ
ーディオ信号を復号可能な構成のオーディオ信号復号化
装置,さらにはその符号化,復号化を行うオーディオ信
号符号化方法,オーディオ信号復号化方法に関するもの
である。
び復号化する様々な手法が提案されている。音楽信号な
ど20kHz以上の周波数帯域を有するオーディオ信号
は、特に近年、MPEGオーディオ方式などがある。M
PEG方式に代表される符号化方式は、時間軸のディジ
タルオーディオ信号をコサイン変換などの直交変換を用
いて周波数軸上のデータに変換し、その周波数軸上の情
報を、人間の聴覚的な感度特性を利用して聴覚的に重要
な情報から符号化していく方式であり、聴覚的に重要で
ない情報や冗長な情報は符号化しない方式である。源デ
ィジタル信号の情報量に対して、かなり少ない情報量で
表現しようとする場合、ベクトル量子化の手法を用いた
TC−WVQなどの符号化方式がある。MPEGオーデ
ィオ、およびTC−WVQはそれぞれISO/IEC 標準IS-1
1172-3、およびT.Moriya, H.Suga:An 8 Kbits transfor
m coder for noisy channels, Proc.ICASSP 89,pp196-1
99などに述べられている。ここで図24を用いて従来の
オーディオ符号化装置の構成について説明する。
波数変換するFFT部、1602は周波数変換された入
力信号のうちの特定の帯域を符号化するよう最小可聴限
とマスキング特性算出による適応ビット割り当ての算出
を行う適応ビット割り当て算出部、1603は入力信号
を複数の帯域に分割するサブバンド帯域分割部、160
4は複数に分割された帯域の各成分をスケールファクタ
を用いて正規化するスケールファクタ正規化部、160
5はスケールファクタ正規化部1604の正規化出力
を、上記適応ビット割り当て算出部1602からのビッ
ト割り当てに応じてスカラー量子化するスカラー量子化
部である。
FFT部1601と、サブバンド帯域分割部1603に
入力される。FFT部1601では、入力信号を周波数
変換して、その出力を、適応ビット割り当て部1602
に入力する。適応ビット割り当て部1602では、人間
の聴覚特性に基づいて定義された最小可聴限と、マスキ
ング特性とをもとに、ある帯域成分に対してどれくらい
の情報量を与えるべきかを算出し、その帯域ごとの情報
量配分をインデックスに符号化する。
は、入力信号を、例えば、32の帯域に分割し出力す
る。そしてスケールファクタ正規化部1604では、前
記サブバンド帯域分割部1603で分割されたおのおの
の帯域成分に対して、ある代表値をもって正規化を行
う。該正規化の値はインデックスIND1 として量子化
される。スカラー量子化部1605では、前記適応ビッ
ト割り当て算出部1602で算出されたビット配分をも
とに、スケールファクタ正規化部1604の出力をスカ
ラー量子化し、その量子化値をインデックスIND2 と
して符号化する。
符号化装置は以上のように構成されており、MPEGオ
ーディオ方式は、1チャンネルあたり、64000ビッ
ト/秒以上の情報量で符号化されて使用される方法が一
般で、それ以下の情報量では、再生可能な周波数帯域幅
や復号されたオーディオ信号の主観的な品質が著しく劣
化する場合がある。これは、図22に示した例のよう
に、符号化された情報が、大別して、適応ビット割り当
て部1602によるビット配分,スケールファクタ正規
化部1604による帯域代表値,スカラー量子化部16
05による量子化値の3つからなり、高い圧縮率の場合
には、情報量が量子化値出力に十分に配分されないため
である。また、従来のオーディオ信号の符号化装置にお
いては、符号化する情報量と復号化する情報量とを同じ
にして、符号化装置,及び復号化装置を構成する方法が
一般的である。たとえば、1秒間に128000bit の
情報量に符号化する方法では、その復号化装置では12
8000bit の情報量を復号化するように構成されてい
る。
来のオーディオ信号符号化装置,及び復号化装置では、
良好な音質を得るためには固定された情報量で符号化,
及び復号化を行わなければならず、高い圧縮率にて高品
質な音質を得ることはできなかった。
ためになされたもので、少ない情報量で符号化,及び復
号化を行っても、高い品質と広い再生周波数帯域が得ら
れ、また符号化,及び復号化時の情報量を、固定の値で
はなくこれを可変とすることのできるオーディオ信号符
号化装置,及びおよび復号化装置,さらにはオーディオ
信号符号化・復号化方法を提供することを目的とする。
さらには、この発明は、量子化効率をさらに大きく向上
することのできるオーディオ信号符号化装置,及び復号
化装置,さらにはオーディオ信号符号化・復号化方法を
提供することを目的とする。
め、本発明の請求項1の発明は、複数の階層の小量子化
部を備え、時間−周波数変換されたオーディオ信号を入
力してインデックス情報を出力するオーディオ信号符号
化装置であって、少なくとも第i階層の小量子化部は、
分割された周波数帯域毎にベクトル量子化による符号化
を行う複数の帯域分割量子化器を備え、第i+1階層以
降の小量子化部は、前階層の一部の帯域分割量子化器の
量子化誤差にベクトル量子化による符号化を行い、イン
デックス情報は、各階層の小量子化部により符号化され
たベクトルを示す階層別インデックスを含み、階層別イ
ンデックスは、複数の帯域分割量子化器により周波数帯
域が分割された符号化が行われた階層においては、分割
された周波数帯域毎の帯域別インデックスを含むことを
特徴とするものである。
載のオーディオ信号符号化装置において、量子化帯域選
択部をさらに備え、量子化帯域選択部は、第i+1階層
以降の小量子化部が符号化を行う一部の帯域分割量子化
器を量子化誤差の大きさに基づいて選出することを特徴
とするものである。
小逆量子化部を備え、インデックス情報をオーディオ信
号に復号化するオーディオ信号復号化装置であって、少
なくとも第i階層の小逆量子化部は、分割された周波数
帯域毎にベクトル逆量子化による復号化を行う複数の帯
域分割逆量子化器を備え、第i+1階層以降の小逆量子
化部は、前階層の一部の帯域分割量子化器の量子化誤差
にベクトル逆量子化による復号化を行い、インデックス
情報は、階層毎のベクトルを示す階層別インデックスを
含み、階層別インデックスは、周波数帯域が分割された
符号化が行われた階層においては、分割された周波数帯
域毎の帯域別インデックスを含むことを特徴とするもの
である。
小量子化ステップを備え、時間−周波数変換されたオー
ディオ信号をインデックス情報に変換するオーディオ信
号符号化方法であって、少なくとも第i階層の小量子化
ステップは、分割された周波数帯域毎にベクトル量子化
による符号化を行う複数の帯域分割量子化ステップを備
え、第i+1階層以降の小量子化ステップは、前階層の
一部の帯域分割量子化ステップの量子化誤差にベクトル
量子化による符号化を行い、インデックス情報は、各階
層の小量子化ステップにより符号化されたベクトルを示
す階層別インデックスを含み、階層別インデックスは、
複数の帯域分割量子化ステップにより周波数帯域が分割
された符号化が行われた階層においては、分割された周
波数帯域毎の帯域別インデックスを含むことを特徴とす
るものである。
小逆量子化ステップを備え、インデックス情報をオーデ
ィオ信号に復号化するオーディオ信号復号化方法であっ
て、少なくとも第i階層の小逆量子化ステップは、分割
された周波数帯域毎にベクトル逆量子化による復号化を
行う複数の帯域分割逆量子化ステップを備え、第i+1
階層以降の小逆量子化ステップは、前階層の一部の帯域
分割量子化ステップの量子化誤差にベクトル逆量子化に
よる復号化を行い、インデックス情報は、各階層のベク
トルを示す階層別インデックスを含み、階層別インデッ
クスは、周波数帯域が分割された符号化が行われた階層
においては、分割された周波数帯域毎の帯域別インデッ
クスを含むことを特徴とするものである。
て、図面を用いて説明する。 実施の形態1. 図1は本発明の実施の形態1によるオーディオ信号符号
化装置,オーディオ信号復号化装置,オーディオ信号符
号化方法,及びオーディオ信号復号化方法の全体の構成
を示す図である。図1において、1は符号化装置であ
り、2は復号化装置である。符号化装置1において、1
01は入力信号を所定の値のフレーム数となるように分
割するフレーム分割部、102は時間軸上で、入力信号
と窓関数とを乗じる窓掛け部、103は変形離散コサイ
ン変換(Modified discrete cosinetransform)を行う
MDCT部、104はフレーム分割部101からの出力
である時間軸の信号と、MDCT部103からの出力で
あるMDCT係数との両者を入力としてそのMDCT係
数を正規化する正規化部、105は正規化されたMDC
T係数を入力として量子化を行う量子化部である。な
お、ここでは、時間周波数変換としてMDCTを用いた
場合について説明するが、これは離散フーリエ変換(D
FT:Discrete Fourier Transform)を用いてもよい。
置1から出力された信号(インデックスIND2 )を受
けてこれを逆量子化する逆量子化部、107は逆量子化
部106の出力を、符号化装置1の正規化部104から
のインデックスIND1 を用いて、逆正規化する逆正規
化部、108は逆正規化部107の出力を変形離散コサ
イン変換する逆MDCT部、109は逆MDCT部10
8の出力に対して窓掛けを行う窓掛け部、110は窓掛
け部109の出力に対し、フレーム重ね合わせを行うフ
レーム重ね合わせ部である。
号化装置,オーディオ信号復号化装置,オーディオ信号
符号化方法,及びオーディオ信号復号化方法の動作につ
いて述べる。符号化装置1に入力される信号は、時間的
に連続するディジタル信号系列であるとする。例えば、
音声信号を、サンプリング周波数48kHz で、16ビッ
トに量子化したディジタル信号であるとする。この入力
信号は、ある一定のサンプル数に達するまでフレーム分
割部101で蓄積され、蓄積されたサンプル数が規定の
フレーム長に達すると出力を行う。ここで、フレーム分
割部101のフレーム長は、例えば、128,256,
512,1024,2048,4096サンプルなどで
ある。フレーム分割部101では、入力信号の特徴に応
じてフレーム長を可変にして出力することも可能であ
る。また、フレーム分割部101は、あるシフト長ごと
に出力を行う構成のものであり、例えば、フレーム長を
4096サンプルとした場合において、フレーム長の半
分のシフト長を設定すれば、フレーム長が2048サン
プルに到達するに相当する時間ごとに最新の4096サ
ンプルを出力するなどの構成を持つ。当然ながらフレー
ム長やサンプリング周波数が変わっても、同様にシフト
長をフレーム長の半分に設定した構成を持つことは可能
である。
力は、後段の窓掛け部102と正規化部104へとそれ
ぞれ入力される。窓掛け部102では、前記フレーム分
割部101からの出力信号に対して、時間軸上で窓関数
を乗じて、窓掛け部102の出力とする。この様子は、
例えば、数1式で示される。
1からの出力で、hiは窓関数、hxi は窓掛け部102か
らの出力である。また、i は時間のサフィックスであ
る。なお、数1式で示した窓関数hiは一例であり、窓関
数は必ずしも数1式のものである必要はない。窓関数の
選択は、窓掛け部102に入力される信号の特徴と、フ
レーム分割部101のフレーム長と、時間的に前後に位
置するフレームにおける窓関数の形状に依存する。例え
ば、窓掛け部102に入力される信号の特徴として、フ
レーム分割部101のフレーム長をNとした場合、N/
4ごとに入力される信号の平均パワーを算出して、その
平均パワーが非常に大きく変動する場合は、フレーム長
をNよりも短くして数1式に示した演算を実行するなど
の選択を行う。また、前の時刻のフレームの窓関数の形
状と後ろのフレームの窓関数の形状に応じて、現在の時
刻のフレームの窓関数の形状に歪みがないように適宜選
択するのが望ましい。
CT部103に入力され、ここで変形離散コサイン変換
が施され、MDCT係数が出力される。変形離散コサイ
ン変換の一般式は数2式で表される。
MDCT係数は、数2式のykで表せるとすると、MDC
T部103の出力は周波数特性を示し、ykの変数k が0
に近いほど低い周波数成分に、0から増大してN/2-1 に
近くなるほど高い周波数成分に線形に対応する。正規化
部104では、フレーム分割部101からの出力である
時間軸の信号xiと、MDCT部103からの出力である
MDCT係数ykの両者を入力として、いくつかのパラメ
ータを用いて、MDCT係数を正規化する。ここでMD
CT係数の正規化とは、低域成分と高域成分とで非常に
大きさに違いのあるMDCT係数の大きさのばらつきを
抑圧することを意味し、例えば、低域成分が高域成分に
対して非常に大きい場合などは、低域成分では大きな
値、高域成分では小さな値となるようなパラメータを選
出し、これで上記MDCT係数を除算することによりM
DCT係数の大きさのばらつきを抑圧することをさす。
また正規化部104では、正規化に用いたパラメータを
表現するインデックスIND1 を符号化する。
規化されたMDCT係数を入力として、MDCT係数の
量子化を行う。この際、該量子化部105は、該量子化
した値と、コードブック中にある複数のコードインデッ
クスに対応する各量子化出力との間の差が,最も小さく
なるような,そのような該コードインデックスを出力す
る。この場合、上記量子化部105で量子化した値と、
該量子化部105から出力されるコードインデックスに
対応する値との差が、量子化誤差である。
正規化部104からのインデックスIND1 と、量子化
部105からのインデックスIND2 とを用いて復号を
行う。逆量子化部106では、量子化部105からのイ
ンデックスIND2 を用いて、上記符号化装置1におけ
る,正規化された時点でのMDCT係数の再生を行う。
逆量子化部106では、インデックスのすべてを用いて
もよいし、その一部分を用いてMDCT係数の再生を行
ってもよい。当然ながら、正規化部104からの出力
と、逆量子化部106の出力とは、量子化部105によ
る量子化時に量子化誤差を伴うために、量子化前の状態
と必ずしも一致しない。
規化部104からのインデックスIND1 から、符号化
装置1で正規化に用いたパラメータの復元を行い、逆量
子化部106の出力と該パラメータとを乗算し、MDC
T係数の復元を行う。逆MDCT部108では、逆正規
化部107からの出力であるMDCT係数から、逆MD
CTを行い、周波数領域の信号から時間領域の信号への
復元を行う。上記逆MDCT計算は、例えば、数3式で
示される。
れたMDCT係数で、xx(n) は逆MDCT係数であり、
これを逆MDCT部108の出力とする。窓掛け部10
9では、逆MDCT部108からの出力xx(n) を用いて
窓掛けを行う。窓掛けは、符号化装置1の窓掛け部10
2で用いた窓を用い、たとえば、数4式で示される処理
を行う。
ある。フレーム重ね合わせ部110では、窓掛け部10
9からの出力を用いて、オーディオ信号を再生する。窓
掛け部109からの出力は、時間的に重複した信号とな
っているので、フレーム重ね合わせ部110では、例え
ば、数5式を用いて復号化装置2の出力信号とする。
番目の窓掛け部109の出力信号z(i)であり、zm-1(i)
は第m-1 時刻フレームの第i番目の窓掛け部109の出
力信号であり、SHIFT は符号化装置のシフト長に相当す
るサンプル数であり、out(i)はフレーム重ね合わせ部1
10の第m 時刻フレームにおける復号化装置2の出力信
号とする。
詳細な一例を説明する。図2において、201はフレー
ム分割部101とMDCT部103の出力を受ける周波
数概形正規化部、202は周波数概形正規化部201の
出力を受け、帯域テーブル203を参照して正規化を行
う帯域振幅正規化部である。
規化部201では、フレーム分割部101からの時間軸
上のデータ出力を用いて、大まかな周波数の概形である
周波数概形を算出し、これでMDCT部103からの出
力であるMDCT係数を除算する。周波数概形を表現す
るのに用いたパラメータはインデックスIND1 として
符号化される。帯域振幅正規化部202では、周波数概
形正規化部201からの出力信号を入力として、帯域テ
ーブル203で示された帯域ごとに正規化を行う。例え
ば、周波数概形正規化部201の出力であるMDCT係
数が、dct(i)(i= 0〜2047) とし、帯域テーブル203
が、例えば、表1に示されるようなものであるとする
と、数6式などを用いて各帯域毎の振幅の平均値を算出
する。
3に示されたj 番目の帯域におけるdct(i)が属する最も
低域のインデックスi と、最も高域のインデックスi を
それぞれ示している。また、p は距離計算におけるノル
ムであり、2などが望ましい。avejは、各帯域番号j に
おける振幅の平均値である。帯域振幅正規化部202で
は、avejを量子化して、qavej を算出して、例えば、数
7式を用いて正規化する。
よいし、コードブックを用いてベクトル量子化を行って
もよい。帯域振幅正規化部202では、qavej を表現す
るのに用いたパラメータのインデックスIND1 を符号
化する。
4の構成は、図2の周波数概形正規化部201と帯域振
幅正規化部202の両者を用いた構成のものを示した
が、周波数概形正規化部201のみを用いた構成でもよ
く、帯域振幅正規化部202のみを用いた構成でもよ
い。さらに、MDCT部103から出力されるMDCT
係数の低域成分と高域成分とで大きなばらつきがない場
合は、両者を用いない構成で、MDCT部103の出力
信号をそのまま量子化部105に入力する構成としても
よい。
化部201の詳細について説明する。図3において、3
01はフレーム分割部101の出力を受ける線形予測分
析部、302は線形予測分析部301の出力を受ける概
形量子化部、303はMDCT部103の出力を受ける
包絡特性正規化部である。
について説明する。上記線形予測分析部301では、フ
レーム分割部101からの時間軸上のオーディオ信号を
入力として、線形予測分析(Linear Predictive Codin
g)を行う。線形予測分析の線形予測係数(LPC係
数)は、ハミング窓などの窓掛けされた信号の自己相関
関数を算出し、正規方程式などを解くことで一般に算出
可能である。算出された線形予測係数は、線スペクトル
対係数(LSP(Line Spectrum Pair) 係数)などに変
換され、概形量子化部302で量子化される。ここでの
量子化手法としてはベクトル量子化を用いてもよいし、
スカラー量子化を用いてもよい。そして概形量子化部3
02で量子化されたパラメータが表現する周波数伝達特
性を包絡特性正規化部303で算出し、MDCT部10
3からの出力であるMDCT係数をこれで除算すること
によって正規化する。具体的な算出例としては、概形量
子化部302で量子化されたパラメータと等価な線形予
測係数を、qlpc(i) とすれば、包絡特性正規化部303
で算出される上記周波数伝達特性は、例えば、数8式で
表すことができる。
い。fft( )は高速フーリエ変換を意味する。算出された
周波数伝達特性env(i)を用いて、包絡特性正規化部30
3では、例えば下記に示す数9式を用いて正規化を行
う。
の出力信号で、fdct(i) は正規化された包絡特性正規化
部303からの出力信号である。次に図4を用いて、符
号化装置1における量子化部105の詳細について説明
する。図4において、401は第1の小量子化部、40
2は第1の小量子化部401の出力を受ける第2の小量
子化部、403は第2の小量子化部402の出力を受け
る第3の小量子化部である。
明する。上記第1の小量子化部401に入力される信号
は符号化装置の正規化部104からの出力であり、正規
化されたMDCT係数である。ただし、正規化部104
を持たない構成では、MDCT部103の出力となる。
第1の小量子化部401では、入力されたMDCT係数
をスカラー量子化、またはベクトル量子化して、量子化
に用いたパラメータを表現するインデックスを符号化す
る。また、量子化による入力MDCT係数に対する量子
化誤差を算出し、それを第2の小量子化部402へ出力
する。ここで、第1の小量子化部401では、すべての
MDCT係数を量子化してもよいし、一部のみを量子化
するようにしてもよい。当然ながら、一部のみを量子化
した場合は、第1の小量子化部401で量子化されない
帯域の量子化誤差は、量子化されない帯域の入力MDC
T係数そのものとなる。
1の小量子化部401のMDCT係数の量子化誤差を入
力として、それをさらに量子化する。このときの量子化
も第1の小量子化部401と同様に、スカラー量子化を
用いてもよいし、ベクトル量子化を用いてもよい。そし
て、第2の小量子化部402では、量子化に用いたパラ
メータを表現するインデックスに符号化する。また、量
子化による量子化誤差を算出し、それを第3の小量子化
部403へと出力する。この第3の小量子化部403
は、上記第2の小量子化部と構成は同じである。ここ
で、上記第1の小量子化部401,第2の小量子化部4
02,第3の小量子化部403が量子化するMDCT係
数の個数、つまり、帯域幅は必ずしも均一である必要は
なく、また、量子化する帯域も同じである必要もない。
このとき、人間の聴覚特性を考慮し、第2の小量子化部
402,第3の小量子化部403は、ともに低域周波数
成分を示すMDCT係数の帯域を量子化するように設定
するのが望ましい。
オ信号符号化装置によれば、量子化を行う際に、量子化
部を階層的に設けて、即ち多段量子化手段を構成し、前
段と後段での量子化部が量子化する帯域幅を可変とした
ことにより、入力MDCT係数のうち、任意の帯域、例
えば、人間にとって聴覚的に重要な低域周波数成分に相
当する係数を重点的に量子化するようにしたから、低ビ
ットレート、すなわち高い圧縮率でオーディオ信号を符
号化した場合であっても、受信側において、高品位な音
声の再生を行うようにすることができる。
ィオ信号符号化装置について説明する。本実施の形態2
では、符号化装置1における量子化部105の構成のみ
が上記実施の形態1と異なるので、ここでは、量子化部
の構成についてのみ説明する。図5において、501は
第1の小量子化部、502は第2の小量子化部、503
は第3の小量子化部である。上記実施の形態1との構成
上の違いは、第1の量子化部501が、入力MDCT係
数を3つの帯域(高域、中域、低域)に分割して独立に
量子化を行う点であり、これら第1の小量子化部501
を構成する各帯域の量子化部が、いわゆる”分割化ベク
トル量子化器”に相当する。一般にベクトル量子化の手
法を用いて量子化を行う場合において、入力MDCT係
数からいくつかの要素を抽出して、ベクトルを構成し、
ベクトル量子化することができる。本実施の形態2の第
1の小量子化部501では、入力MDCT係数からいく
つかの要素を抽出してベクトルを構成する際に、低域の
量子化は低域のみの要素を用いて量子化し、中域の量子
化は中域のみの要素を用いて、高域の量子化は高域のみ
の要素を用いて、それぞれベクトル量子化する構成とな
っている。
に、低域,中域,高域の3つの帯域に分割する方法を一
例として説明したが、分割する帯域の数は3以外の数で
あってもよい。また、第2の小量子化部502,第3の
小量子化部503についても、第1の量子化部501と
同様に、帯域をいくつかに分割して量子化を行う構成と
してもよい。
量子化手段において、まず第1段では、入力MDCT係
数を3つの帯域に分割して独立的に量子化を行うように
したので、聴覚的に重要な帯域を優先的に量子化する等
の処理を、第1回目の量子化時に行うことができ、後段
の量子化部502,503において、さらに段階的に当
該聴覚的に重要な帯域のMDCT係数の量子化を行うよ
うにすることにより、量子化誤差をより低減することが
でき、受信側において、より高品位な音質の再現を可能
とすることができる。
の実施の形態3によるオーディオ信号符号化装置につい
て説明する。本実施の形態3では、符号化装置1におけ
る量子化部105の構成のみが上記実施の形態1と異な
るものであるために、ここでは、量子化部の構成につい
てのみ説明する。図6において、601は第1の小量子
化部、602は第1の量子化帯域選択部、603は第2
の小量子化部、604は第2の量子化帯域選択部、60
5は第3の小量子化部である。上記実施の形態2との構
成上の違いは、第1の量子化帯域選択部602と、第2
の量子化帯域選択部604が加わった点である。
子化帯域選択部602では、第1の小量子化部601の
量子化誤差である出力(fdcterr (i))を用いて、第2の
小量子化部602でどの帯域のMDCT係数を量子化す
べきかを算出する。例えば、数10式で与えるesum(j)
を最大とするj を算出し、j * OFFSETからj*OFFSET +BA
NDWIDTHの帯域を量子化すればよい。
2の小量子化部603が量子化する帯域幅に相当する総
サンプルである。第1の量子化帯域選択部602では、
例えば、数10式で、esum(j) の最大値を与えたj など
を、符号化してインデックスIND2 とする。第2の小
量子化部603では、これらのインデックスIND2 を
受けて、第1の量子化帯域選択部602で選択された帯
域を量子化する。第2の量子化帯域選択部604は、第
2の小量子化部603の量子化誤差である出力をその入
力とし、該第2の量子化帯域選択部604の選択した帯
域を、上記第3の小量子化部605に入力せしめること
を除いては、上記第1の量子化帯域選択部602と同じ
構成でこれを実現することが可能である。
よび第2の量子化帯域選択部604では、数10式を用
いて、次の量子化部が量子化すべき帯域を選択する構成
を説明したが、数11式の,正規化部104で正規化に
用いた値、および人間の周波数に対する相対的な聴覚感
度特性を考慮に入れた値,を乗算した値を用いて、量子
化すべき帯域を算出するようにしてもよい。
を正規化部104の出力で除算したものであり、zxc(i)
は人間の周波数に対する相対的な聴覚感度特性を考慮に
入れたテーブルであり、その一例を表2に示した。ま
た、数11式において、zxc(i)はすべて1として考慮に
入れない構成でもよい。
設けなくてもよく、第1の量子化帯域選択部602のみ
を用いた構成、あるいは第2の量子化帯域選択部604
のみを用いた構成としてもよい。
化手段により多段的に量子化を行う際に、前段の量子化
部と次段の量子化部との間に量子化帯域選択部を設け、
量子化する帯域を可変として適宜選択するようにするこ
とで、入力信号に応じて適宜、量子化する帯域を変化さ
せることが可能となり、量子化の自由度を向上すること
ができ、量子化の必要な部分を重点的に量子化して、量
子化効率を大きく向上することができる。
実施の形態1〜3の符号化装置1における量子化部10
6の量子化方法の詳細な動作について説明する。各小量
子化部に入力されるMDCT係数1401は、そのMD
CT係数1401から幾つかを抜き出して音源サブベク
トル1403を構成する。同様に、正規化部104にお
いて、正規化部104の入力であるMDCT係数を、正
規化部104の出力であるMDCT係数で割った係数列
を、正規化成分1402とした時、該正規化成分140
2についても、音源サブベクトル1403をMDCT係
数1401から抜き出したのと同じ規則で、該正規化成
分1402から抽出し、重みサブベクトル1404を構
成することができる。このように、音源サブベクトル1
403,および重みサブベクトル1404を、MDCT
係数1401,および正規化成分1402からそれぞれ
抽出する規則は、例えば、数14式で示す方法などがあ
る。
目の要素はsubvector i(j)であり、MDCT係数140
1はvector()であり、MDCT係数1401の総要素数
がTOTAL で、音源サブベクトル1403の要素数がC
R、VTOTALは、TOTAL と同じ値かより大きい値で,VTOT
AL/CR が整数値になるように設定する。例えば、TOTAL
が2048の時、CRが19で,VTOTALが2052、C
Rが23で,VTOTALが2070、CRが21で,VTOTAL
が2079などである。重みサブベクトル1404につ
いても、数14式の手順で抽出可能である。
ック1409中のコードベクトルの中から、音源サブベ
クトル1403との距離が、重みサブベクトル1404
で重みつけて最も小さくなるものを探し、その最小の距
離を与えたコードベクトルのインデックスIND2 と、
最小の距離を与えたコードベクトルと入力音源サブベク
トル1403との量子化誤差に相当する残差サブベクト
ル1410を出力する。実際の計算手順例としては、該
ベクトル量子化器1405は、距離計算手段1406,
コード決定手段1407,及び残差生成手段1408,
の3つの構成要素を有するものとして説明する。距離計
算手段1406では、例えば、数15式を用いて、i 番
目の音源サブベクトル1403と、コードブック140
9のk 番目のコードベクトルとの距離を算出する。
素、ck(j) はk 番目のコードベクトルのj 番目の要素、
R、Sは距離計算のノルムであり、R、Sの値としては
1, 1.5, 2 などが望ましい。なお、この距離計算のノル
ムRと、Sは同一の値である必要はない。dik はi 番目
の音源サブベクトルに対するk 番目のコードベクトルの
距離を意味する。コード決定手段1407では、数15
式などで算出された距離の中で最小となるコードベクト
ルを選出し、そのインデックスを符号化する(IN
D2 )。例えば、diu が最小値の場合、i 番目のサブベ
クトルに対する符号化されるインデックスはu となる。
残差生成手段1408では、コード決定手段1407で
選出したコードベクトルを用いて、数16式を用いて、
残差サブベクトル1410を生成する。
のj 番目の要素は、resi(j) であり、コード決定手段1
407で選出されたu 番目のコードベクトルのj 番目の
要素を、cu(j) とする。残差サブベクトル1410は、
数14式の逆過程などを行うことにより、それ以降の小
量子化部の量子化対象となるMDCT係数として保持さ
れる。ただし、ある帯域の量子化がそれ以降の小量子化
部に影響を与えない帯域の量子化を行っている場合、つ
まり以降の小量子化部が量子化をすることがない場合
は、残差生成手段1408,残差サブベクトル141
0,及びMDCT係数1411の生成は必要ない。なお
コードブック1409が持つコードベクトルの個数はい
くつでもよいが、メモリ容量、計算時間等を考慮する
と、64程度とすることが好ましい。
の実施の形態として、以下のような構成も可能である。
すなわち、距離計算手段1406では、数17式を用い
て距離を算出する。
ド検索に用いるコードベクトルの総数である。コード決
定手段1407では、数17式で算出された距離dik の
最小値を与えるk を選出し、そのインデックスを符号化
する(IND2 )。ただし、k は0から2K-1までの値と
なる。残差生成手段1408では、数18式を用いて残
差サブベクトル1410を生成する。
ルの個数はいくつでもよいが、メモリの容量、計算時間
等を考慮すると、64程度とすることが好ましい。ま
た、重みサブベクトル1404としては、これを正規化
成分1402のみから生成する構成について述べたが、
重みサブベクトル1404に、人間の聴覚特性を考慮し
た重みをさらに乗じて、重みサブベクトルを生成するこ
とも可能である。
1の小量子化部と第2の小量子化部との間に第1の量子
化帯域選択部を、第2の小量子化部と第3の小量子化部
との間に第2の量子化帯域選択部を、それぞれ設けて、
上記第2の小量子化部,第3の小量子化部で量子化する
帯域を可変として適宜選択するようにしたので、入力信
号に応じて適宜、量子化する帯域を変化させることが可
能となり、量子化の自由度を向上することができ、量子
化の必要な部分を重点的に量子化して、量子化効率を大
きく向上することができる効果が得られる。
オーディオ信号を周波数変換して得られた周波数特性信
号系列に対し、ベクトル量子化を行い、オーディオ信号
の符号化をするオーディオ信号符号化装置において、上
記周波数特性信号系列,またはその一部をベクトル量子
化する第1段目のベクトル量子化器と、上記第1段目の
ベクトル量子化器による量子化誤差成分をベクトル量子
化する第2段目のベクトル量子化器とを、少なくとも、
有する多段量子化手段を構成するようにするとともに、
該多段量子化手段の各段の量子化手段は、上記周波数特
性信号系列を,少なくとも2つ以上の,複数の段間で重
複する部分を有し得る周波数帯域に,各段毎の分割の仕
方により分割した,複数の周波数帯域のいずれかの帯域
の係数列をベクトル量子化する,少なくとも一つ以上の
分割化ベクトル量子化器を備えた構成とすることがで
き、このような構成により、入力MDCT係数のうち、
任意の帯域、例えば、人間にとって聴覚的に重要な低域
周波数成分に相当する係数を重点的に,所望の深さに量
子化するようにし、一方、復号化側では、複数段階の復
号化された符号を用いて復号を行うことも可能とし、ま
た、復号化の順は、帯域拡張に寄与するものと、品質向
上に寄与するものを交互に復号する構成を採ることも可
能にすることにより、低ビットレート、すなわち高い圧
縮率でオーディオ信号を符号化した場合であっても、ま
た、固定された情報量で符号化、及び復号化を行なわな
くとも、受信側において、高品位な音声の再生を行うよ
うにすることができる効果が得られる。
用いて、本発明の実施の形態4によるオーディオ信号復
号化装置について説明する。符号化装置1からの出力で
あるインデックスは、正規化部104の出力したインデ
ックスIND1 と、量子化部105の出力したインデッ
クスIND2 とに大きく分けられる。
ND1 は、逆正規化部107で復号し、量子化部105
の出力したインデックスIND2 は逆量子化部106で
復号する。ここで逆量子化部106では、量子化部10
5の出力したインデックスIND2 の一部分のみを用い
て復号することも可能である。
量子化部105の構成を図5に示す構成のものとした場
合に、復号化装置1において、図7の構成を有する逆量
子化部を用いて逆量子化を行う場合について説明する。
図7において、701は第1の低域成分の逆量子化部で
ある。この第1の低域成分の逆量子化部701では、第
1の小量子化部501の低域成分のインデックスIND
21のみを用いて復号化を行う。
第1の低域成分の逆量子化部701では、第1の小量子
化部501の低域成分のインデックスのみを用いて復号
化を行うようにすることで、符号化装置1から送信され
てくる情報量に関わらず、符号化されたオーディオ信号
の所望の情報量分を復号化することができる。即ち、受
信側で復号化する情報量が制限されている場合において
も、符号化する情報量と復号化する情報量とを異なる値
として、所望の情報量分のみを復号化するようにするこ
とができる。従って、受信者側での通信環境等に応じ
て、復号する情報量を変化させることができ、例えば、
通常の公衆電話網を利用しているような場合において
も、安定に高品位な音質を得ることができるようにな
る。
ィオ信号復号化装置の逆量子化部の構成を示す図であ
り、図8において、704は第2の逆量子化部である。
この第2の逆量子化部704では、第2の小量子化部5
02のインデックスIND3 を用いて復号化を行う。従
って、第1の低域成分の逆量子化部701からの出力I
ND21’と、第2の逆量子化部704からの出力IND
3 ’との加算値が、逆量子化部106の出力として出力
されることになる。ただし、ここでの加算は、量子化時
にそれぞれの小量子化部が量子化した帯域と同じ帯域に
加算していく。
インデックスIND21を第1の低域成分の逆量子化部7
01により復号化するとともに、第2の小量子化部のイ
ンデックスIND3 を逆量子化する際に、上記第1の低
域成分の逆量子化部701の出力IND21’をも該逆量
子化の対象に加算して逆量子化を行うようにすることに
より、逆量子化を2段階で行うことができ、多段階で量
子化されたオーディオ信号を正確に復号化することがで
き、より高品質な音質を得ることができるようになる。
に、対象となる帯域を拡大して行うようにしたオーディ
オ信号復号化装置の逆量子化部の構成を示す図であり、
図9において、702は第1の中域成分の逆量子化部で
ある。この第1の中域成分の逆量子化部702では、第
1の小量子化部501の中域成分のインデックスIND
22を用いて復号化を行う。従って、第1の低域成分の逆
量子化部701からの出力IND21’と、第2の逆量子
化部704からの出力IND3 ’と、第1の中域成分の
逆量子化部702からの出力IND22’との加算値が、
逆量子化部106の出力として出力されることになる。
ただし、ここでの加算は、量子化時にそれぞれの小量子
化部が量子化した帯域と同じ帯域に加算していく。この
ようにすることで、再生される音の帯域を拡大すること
ができ、より高品質なオーディオ信号の再生を行うこと
ができるようになる。
子化部において、逆量子化する段数を3段階で行う際の
オーディオ信号復号化装置の逆量子化部の構成を示す図
であり、図10において、705は第3の逆量子化部で
ある。第3の逆量子化部705では、第3の小量子化部
503のインデックスを用いて復号化を行う。従って、
第1の低域成分の逆量子化部701からの出力IN
D21’と、第2の逆量子化部704からの出力IN
D3 ’と、第1の中域成分の逆量子化部702からの出
力IND22’と、第3の逆量子化部705からの出力I
ND4 ’との加算値が、逆量子化部106の出力として
出力されることになる。ただし、ここでの加算は、量子
化時に、それぞれの小量子化部が量子化した帯域と同じ
帯域に加算していく。
逆量子化部において、逆量子化を3段階で行う際に、対
象となる帯域を拡大して行うようにしたオーディオ信号
復号化装置の逆量子化部の構成を示す図であり、図11
において、703は第1の高域成分の逆量子化部であ
る。第1の高域成分の逆量子化部703では、第1の小
量子化部501の高域成分のインデックスを用いて復号
化を行う。第1の低域成分の逆量子化部701からの出
力IND21’と、第2の逆量子化部704からの出力I
ND3 ’と、第1の中域成分の逆量子化部702からの
出力IND22’と、第3の逆量子化部705からの出力
IND4 ’と、第1の高域成分の逆量子化部703から
の出力IND23’との加算値が、逆量子化部106の出
力として出力されることとなる。ただし、ここでの加算
は、量子化時にそれぞれの小量子化部が量子化した帯域
と同じ帯域に加算していく。
6が、図5の構成を有する量子化部105によって量子
化された情報を、逆量子化する場合を例に挙げて説明し
たが、量子化部105の構成は、図4や図6に示した構
成でも同様に行うことができる。
るような構成の量子化部を用いて符号化を行い、その逆
量子化部として、図11に示すような構成を有する逆量
子化部を用いて復号化する場合には、図15に示すよう
に、第1の小量子化部の低域のインデックスを逆量子化
した後、次段の第2の小量子化部502のインデックス
を逆量子化し、再度第1の小量子化部の中域のインデッ
クスを逆量子化するというように、帯域を拡大するため
の逆量子化と、量子化誤差を低減するための逆量子化と
を交互に繰り返し行うが、図4に示したような構成の量
子化部によって符号化された信号を、図11に示すよう
な構成を有する逆量子化部を用いて復号化する場合に
は、図4の構成においては、分割された帯域がないの
で、順次、次段の逆量子化部にて量子化された係数を、
復号化する処理を行うことになる。
化装置2を構成する逆量子化部106の詳細な動作につ
いて説明する。逆量子化部106は、例えば、図7に示
した逆量子化部を有する場合は、第1の低域の逆量子化
部701から構成され、図8に示した逆量子化部を有す
る場合は、第1の低域の逆量子化部701と、第2の逆
量子化部704,の2つの逆量子化部,から構成され
る。
置1における,ベクトル量子化部105からのインデッ
クスIND2 を用いてMDCT係数の再生を行う。小量
子化部が図7に示した構成を有するものである場合の逆
量子化は、インデックスIND21からインデックス番号
を復号化して、その番号のコードベクトルを、コードブ
ック1502から選出する。コードブック1502は、
符号化装置1におけるコードブックと同様の内容のもの
とする。この選出されたコードベクトルから、再生サブ
ベクトル1503が得られ、これは、数14式の逆過程
で逆量子化されたMDCT係数(i,j )1504とな
る。
するものである場合の逆量子化は、インデックスIND
21、及びインデックスIND3 からインデックス番号k
を復号して、数19式で算出される番号u のコードベク
トルを、コードブック1502から選出する。
成する。
の要素はresi(j) とする。次に図1、及び図12を用い
て、オーディオ信号復号化装置2を構成する逆正規化部
107の詳細な構成について説明する。図12におい
て、1201は周波数概形逆正規化部、1202は帯域
振幅逆正規化部、1203は帯域テーブルである。周波
数概形逆正規化部1201は、周波数概形正規化部20
1からのインデックスIND11を入力として、周波数概
形を再生し、逆量子化部106からの出力に対して、前
記周波数概形を乗算して出力する。帯域振幅逆正規化部
1202では、帯域振幅正規化部202からのインデッ
クスIND12を入力として、帯域テーブル1203に示
された各帯域ごとの振幅値を、乗算により復元する。帯
域振幅正規化部202からのインデックスIND12を用
いて復元された各帯域ごとの値を、qavej とすると、帯
域振幅逆正規化部1202の演算は、数12式で与えら
れる。
出力を n_dct(i)、帯域振幅逆正規化部1202の出力
をdct(i)とした。また、帯域テーブル1203と図2の
帯域テーブル203は同様である。
数概形逆正規化部1201の詳細な構成について説明す
る。図16において、1301は概形逆量子化部、13
02は包絡特性逆正規化部である。概形逆量子化部13
01では、符号化装置1における概形量子化部301か
らのインデックスIND13を用いて、周波数概形を表す
パラメータ、例えば、線形予測係数等を復元する。復元
された係数が線形予測係数ならば、例えば、数8式と同
様に算出することにより、量子化された包絡特性E13を
復元する。復元された係数が線形予測係数でない場合、
例えば、LSP係数などの場合も、これを周波数特性に
変換して、包絡特性E13を復元する。包絡特性逆量子化
部1302では、数13式で示されるように、復元され
た包絡特性E13と、逆量子化部106からの出力IND
16とを乗算して出力とし、帯域振幅逆正規化部1201
へ入力する。
化手段で量子化する前に、正規化手段を設けて、入力オ
ーディオ信号の正規化を行った後に量子化を行うように
したので、正規化手段と量子化手段とがそれぞれの能力
をフルに発揮した符号化を行って,元オーディオ信号の
もつ情報量を損失することない、量子化誤差の少ない、
量子化効率の良い量子化を行うことができる。また、受
信側での情報量が限られているときには、帯域が狭くて
浅い領域でしか逆量子化を行うことができないが、この
逆量子化を順次、帯域を広くする方向と逆量子化の深さ
を深くする方向とに交互に拡張して、受信側での情報量
を増大していくことにより、符号化装置1から送信され
てくる情報量に関わらず、符号化されたオーディオ信号
の所望の情報量分を復号化することができる。従って、
受信者側での通信環境等に応じて復号する情報量を変化
させるようにすることにより、例えば、通常の公衆電話
網を利用しているような場合においても、安定に高品位
な音質を得ることができるようになる効果が得られる。
明の実施の形態5によるオーディオ信号符号化装置につ
いて説明する。本実施の形態5では、符号化装置1にお
ける量子化部105の構成のみが上記実施の形態と異な
るので、ここでは量子化部の構成についてのみ説明し、
他の構成については説明を割愛する。
部、1802は第1の小量子化部、1803は第1の量
子化帯域選択部、1804は第2の正規化部、1805
は第2の小量子化部、1806は第2の量子化帯域選択
部、1807は第3の正規化部、1808は第3の小量
子化部、1809は第3の量子化帯域選択部である。実
施の形態3との構成上の差異は、第2,及び第3の正規
化部1804,1807が付加された点である。
る。第1,第2,第3の正規化部1801,1804,
1807は、実施の形態1の正規化部104と同じ構成
にて実現できる。また、第1,第2,第3の小量子化部
1802,1805,1808は、実施の形態3の第1
の小量子化部601と同じ構成にて実現できる。また、
第1,第2,第3の量子化帯域選択部1803,180
6,1809は、実施の形態3の第1の量子化帯域選択
部602と同じ構成にて実現できる。本実施の形態5で
は、正規化部、小量子化部、量子化帯域選択部の3つか
ら成る組み合わせを3セット有する場合について説明す
るが、この組み合わせは3セットでなくてもよく、4セ
ット以上であっても、2セットであってもよい。また、
最終段のセットの量子化帯域選択部は、必ずしも必要が
ない場合もあり、省略することも可能である。
化装置の動作について説明する。図18において、本実
施の形態5に入力される入力オーディオ信号のMDCT
係数は、まず第1の正規化部1801で正規化処理を施
し、正規化されたMDCT係数を出力する。第1の小量
子化部1802では、第1の正規化部1801からの出
力信号である正規化されたMDCT係数を量子化する。
第1の小量子化部1802では、量子化に用いたパラメ
ータをインデックスとして、さらには、この際の量子化
において生じた量子化誤差を、次段の量子化帯域選択部
1803に出力する。第1の量子化帯域選択部1803
では、第1の小量子化部1802の出力を用いて、第2
の小量子化部1805においてどの帯域のMDCT係数
を量子化すべきかを算出する。
子化部1802の出力であるMDCT係数を、第1の量
子化帯域選択部1803が帯域選択した結果に基づい
て、その選択した帯域に関して正規化する。第2の小量
子化部1805では、第2の正規化部1804の出力を
量子化し、この際の量子化に用いたパラメータをインデ
ックスとして出力するとともに、この際の量子化におい
て生じた量子化誤差をも出力する。第2の量子化帯域選
択部1806では、第2の小量子化部1805の出力を
用いて、第3の小量子化部1808においてどの帯域の
MDCT係数を量子化すべきかを算出する。
子化部1805の出力であるMDCT係数を、第2の量
子化帯域選択部1806が帯域選択した結果に基づい
て、その選択した帯域に関して正規化する。第3の小量
子化部1808では、第3の正規化部1807の出力を
量子化し、この際の量子化に用いたパラメータをインデ
ックスとして出力するとともに、この際の量子化におい
て生じた量子化誤差をも出力する。
は、この後段にさらに第4の小量子化部(図示せず)が
存在する場合に要するものである。もし第4の小量子化
部が存在するならば、この第3の量子化帯域選択部18
09は、第3の小量子化部1808の出力を用いて、第
4の小量子化部においてどの帯域のMDCT係数を量子
化すべきかを算出する。なお、第1,第2,第3の正規
化部1801,1804,1807は、いずれも実施の
形態1の正規化部105と同様に、正規化に用いたパラ
メータをインデックスとして出力する。
作,作用の特徴について、上記実施の形態1〜3の符号
化装置と比較しながら説明する。上記実施の形態1〜3
によるオーディオ信号符号化装置における正規化手段を
有する構成においては、図19(a) に示すように、時間
軸上の音声信号波形を、MDCT,FFTにより周波数
軸上の波形に変換し、正規化手段によりその正規化A、
すなわち、概形抽出と、該抽出した概形の振幅値による
除算とを、図20(a) に示すように該周波数軸上波形の
全周波数範囲について行い、その後、その正規化出力に
対して、上記全周波数範囲を分割した,例えば3つの周
波数領域、即ち低域,中域,高域の各々につき、量子化
x,y,z を行うようにしたもので、これにより、量子化出
力=A(x+y+z)を得る。
(b) に示すように上記分割化した各量子化手段の前段
に、各々正規化手段α,β,γを備え、まず図19(d)
に示すように、周波数軸上の波形を複数の周波数帯域に
分割した後に、各分割した周波数帯域の各々毎に正規
化,及び量子化を行うようにしたもので、その結果、量
子化出力=αx+βy+γzを得るものである。その全
体の様子を、さらに図21に示している。
常にかたよりがある場合、例えば、音声情報のように低
域に集中しているような信号である場合は、これを全体
的におおざっぱに正規化してしまうと、上記低域の特徴
のあるところを重点的に正規化,量子化することができ
ない。すなわち、全体的なおおざっぱな正規化は、信号
変化の細かいところまで信号のエンベロープをとらない
こととなり、該信号変化の細かいところの情報を損失し
てしまうこととなる。従って、このような正規化を行っ
たのち、量子化を行い、ここで量子化器はその自己の能
力をフルに発揮したとしても、信号変化の細かいところ
の情報をひろっていない信号に対して量子化を行なって
いることとなり,あまり意味のない量子化を行ってい
る,いいかえると、正規化,量子化をあわせた効果がで
にくい量子化を行っていることとなる。即ち、正規化手
段を設けるのであれば、正規化手段,量子化手段の両方
が各々の能力をフルに発揮することができるのが望まし
い訳であるが、逆に非常におおざっぱな信号のときに
は、単に全体をおおざっぱに正規化しても、結果はそれ
ほど変わらないものである。
規化部104を有する,上記実施の形態1〜3のオーデ
ィオ信号符号化装置における,正規化手段と、各量子化
手段との関係を示すものであるが、この構成のように、
正規化手段Aが入力オーディオ信号の周波数特性信号系
列の全体を正規化する構成には、上述したように、入力
オーディオ信号が、例えば低域に集中しているような,
周波数的にかたよりのある信号,の場合には、正規化手
段,量子化手段の両方が各々の能力をフルに発揮するこ
とができる構成ではないと考えられる。
量子化手段x ,y ,z が、その前段に各々正規化手段
α,β,γを備えている,本実施の形態5による構成で
は、各量子化手段が量子化しようとするその対象の信号
毎に、正規化を行うようにしているので、各正規化手段
は、量子化を行おうとする各量子化手段の負荷を考慮し
た最適な正規化,即ち各量子化されるべき信号のレベル
を、各量子化手段がフルにその能力を発揮することので
きるレベルにもってくる正規化,を行うことができ、正
規化手段と量子化手段とを合わせた最大の効果を出すよ
うにすることができるものである。
おける正規化部,量子化部の構成は、図20(b) に示す
ように、入力オーディオ信号を周波数変換して得た周波
数特性信号系列、あるいは該周波数特性信号系列の周波
数帯域を分割したある周波数帯域Aの係数列に対して、
まず、第1段目の正規化手段α,量子化手段x により、
正規化,量子化を行い、かつ、2段目の正規化手段β,
量子化手段y により、上記1段目の周波数帯域Aの係数
列に対して隣接する周波数帯域Bの係数列に対して、正
規化,量子化を行い、さらに、第3段目の正規化手段
γ,量子化手段zにより、上記2段目の周波数帯域Bの
係数列に対して隣接する周波数帯域Cの係数列に対し
て、正規化,量子化を行う構成としたものである。
第2段目の正規化手段β,量子化手段yは、上記1段目
の周波数帯域Aに対して一部重なりをもって隣接する周
波数帯域Bにて、その重なり部分では1段目の出力であ
る量子化誤差に対して、その他の部分では上記周波数特
性信号系列の該周波数帯域Bの係数列に対して、正規
化,量子化を行う、第3段目の正規化手段γ,量子化手
段z により、上記2段目の周波数帯域Bの係数列に対し
て一部重なりをもって隣接する周波数帯域Cにて、その
重なり部分では2段目の出力である量子化誤差に対し
て、その他の部分では上記周波数特性信号系列の該周波
数帯域Cの係数列に対して、正規化,量子化を行う構成
としたものである。
各量子化手段による量子化毎に正規化を行うことによ
り、各正規化手段が、各量子化手段の負荷を考慮した正
規化を行って、各正規化手段,量子化手段がそれらの能
力をフルに発揮した量子化を行うことができ、量子化効
率を大きく向上することができる。なお、図20(b),
(c) における各段の正規化, 量子化手段の処理する周波
数帯域,及び量子化の深さは、これらの例のものに限ら
れるものではなく、さらに任意に調整することができ
る。
量子化手段による,正規化,量子化の手法の一例につい
て、図18,図22を用いて説明する。本実施の形態5
では、第1,第2,第3の各正規化部1801,180
4,1807として、上記実施の形態1の正規化部10
4と同様の構成でも実現可能であるが、正規化のパラメ
ータ算出手法としては、他の手法を用いて実現してもよ
く、例えば、各々の正規化部に入力されるMDCT係数
から直接、LPC係数やLSP係数などを算出し、これ
らを正規化のパラメータとして正規化部を構成すること
もできる。図22において、T1,T2,T3 は各段目の正
規化手段α, β,γがそれぞれ用いる正規化のためのテ
ーブルであり、これらは以下の方法で求める。
る可能性のある種々の音源信号のMDCT係数に対し
て、LPC(Linear Predictive C
oding) 分析を行い、LSP(Line Spectrum Pa
ir) 係数を求める。そして、この動作を音源毎に繰返
し、すべてのフレーム毎にLSP係数を求める処理を行
い、これらをすべて集めた上で、クラスタ分析をかけ
て、代表的な複数のエンベロープパターンを求め、これ
らを、第1段目の正規化手段αの正規化テーブルT1 と
する。
ーンを用いて、1段目の正規化,量子化の処理を行い、
その出力に対して上記と同じLPC分析からの処理を行
い、上記と同様にして、複数のエンベロープパターンを
求め、これらを、第2段目の正規化手段βの正規化テー
ブルT2 とする。
γの正規化テーブルT3 を求める。このようにして、第
1段目ないし第3段目の各量子化手段による量子化とし
て、各量子化手段の負荷を考慮して、正規化と量子化の
それぞれの能力をフルに発揮した最適の量子化を行うこ
とができるようにするための,正規化手段の正規化テー
ブルT1,T2,T3 を得ることができる。
置では、複数種類の種々の音源信号からなるものと考え
ることのできる入力オーディオ信号が、本装置に入力さ
れると、該入力オーディオ信号は、図19(a) から(b)
に示されるように、時間軸上のデータからMDCT F
FTにより周波数軸上のデータに変換される。そして、
該周波数軸上のデータに変換された信号は、図19(b)
から(c) に示されるように、その概形抽出が行われる。
このときの概形抽出は、第1段目の正規化手段αの正規
化テーブルT1 を用いて行い、結果得られる概形は、例
えば20個位のLSPの多項式でつくられるものであ
る。そして、得られた概形で上記該周波数軸上のデータ
に変換された信号を除算することにより、正規化αが行
われる。そして、該正規化が行われたのちは、これを量
子化手段x により量子化し、第1段の正規化,量子化が
完了する。これにより、上記複数種類の種々の音源信号
の特徴を考慮した効率のよい量子化を行うことができて
いる。
り、第1段目で正規化,量子化の対象とした,周波数特
性信号系列の分割したある周波数領域Aの係数列,と異
なる周波数領域Bの係数列に対して、あるいは上記第1
段目の正規化,量子化の結果である量子化誤差の出力に
対して、上記第2段目の正規化テーブルT2 を用いて、
第2段目の正規化,量子化を行う。これにより、やはり
上記複数種類の種々の音源信号の特徴を考慮した,所要
の周波数帯域に重点をおいた、あるいは所要の周波数帯
域部分の量子化の深さに重点をおいた、効率のよい量子
化を行うことができる。
より、第1段目,第2段目で正規化,量子化の対象とし
た,周波数特性信号系列の分割した各周波数領域の係数
列と異なる周波数領域の係数列に対して、あるいは上記
第2段目の正規化,量子化の結果である量子化誤差の出
力に対して、第3段目の正規化テーブルT3 を用いて、
第3段目の正規化,量子化を行う。これによっても、や
はり上記複数種類の種々の音源信号の特徴を考慮した,
所要の周波数帯域に重点をおいた、あるいは所要の周波
数帯域部分の量子化の深さに重点をおいた、効率のよい
量子化を行うことができる。
作成した,正規化テーブルT1,T2,T3 を用いて、各段
の正規化α,量子化x 、正規化β,量子化y 、正規化
γ,量子化z を行うことにより、量子化されるべき対象
である信号の性質等に応じて、量子化への過度の負担を
軽減するような正規化を行うことができ、量子化効率を
大きく改善することができ、再生側での品質を大きく向
上できるものである。
対する、復号化装置の構成は、図23(b),(c) に示すよ
うに、図20(b),(c) に示した符号化装置側の構成に対
応して、上記オーディオ信号符号化装置の量子化部の各
量子化器からの信号を受けて、上記周波数特性信号系列
の複数の周波数帯域に分割した各周波数帯域の係数列に
相当する信号を、再生する逆量子化部x ’,y ’,z ’
と、該複数の逆量子化部の各々毎に設けられ、その出力
である周波数特性信号系列の係数列と、上記オーディオ
信号符号化装置の出力である正規化に関する符号をもと
に再生した正規化成分とを乗算して、符号化前の周波数
特性信号系列の各係数列に相当する信号を出力する複数
の逆正規化部α’,β’,γ’と、該複数の各逆正規化
部の出力を受けて、元のオーディオ信号に相当する信号
に出力する逆周波数変換部(図示せず)とを備えたもの
となる。
量子化を、量子化の帯域が広くなる方向と、量子化の深
さが深くなる方向とを交互に行うようにすれば、上記実
施の形態4において説明したのと同様に、符号化装置か
ら送信されてくる情報量に関わらず、符号化されたオー
ディオ信号の所望の情報量分を復号化することができ
る。即ち、受信者側での通信環境等に応じて、復号する
情報量を変化させることができ、例えば、通常の公衆電
話網を利用しているような場合においても、安定に高品
位な音質を得ることができる効果が得られる。
第2,第3の量子化帯域選択部1803,1806,1
809の構成は、各々あらかじめ設定しておいた量子化
すべき周波数帯域を出力する構成としても実現可能であ
る。この場合は、第1,第2,第3の量子化帯域選択部
1803,1806,1809では、量子化すべき帯域
を算出する計算を行うことなく、各々あらかじめ設定し
ておいた量子化すべき周波数帯域を出力することとな
り、構成をより簡素化することができる。
第2,第3の量子化帯域選択部1803,1806,1
809の構成は、人間の聴覚特性に基づいて量子化すべ
き周波数帯域を出力として得るために、静寂時の最小可
聴特性と、ある入力周波数成分によってその近傍の周波
数成分の音が聞こえにくくなるマスキング特性との2つ
の特性を用いて、帯域の選択を行うように構成すること
も可能である。
号符号化装置によれば、多段量子化を行う量子化手段の
前段に各々正規化手段を設けて、分割した各周波数毎
に、かつ各段の量子化毎に正規化を行ったのち量子化を
行うようにしたので、周波数領域毎の正規化により各周
波数領域のオーディオ信号のもつ情報量に応じた適切な
符号化を行って、即ち、正規化手段と量子化手段とがそ
れぞれの能力をフルに発揮した符号化を行って,元オー
ディオ信号のもつ情報量を損失することのない、従って
量子化誤差が少なく、量子化効率の良い量子化を行うこ
とができ、安定に高品位な音質を得ることができる。
段量子化手段は、上記周波数特性信号系列,またはその
一部をベクトル量子化する第1段目のベクトル量子化器
と、上記第1段目のベクトル量子化器による量子化誤差
成分をベクトル量子化する第2段目のベクトル量子化器
とを、少なくとも、有するとともに、該多段量子化手段
の各段の量子化手段は、上記周波数特性信号系列を,少
なくとも2つ以上の,複数の段間で重複する部分を有し
得る周波数帯域に,各段毎の分割の仕方により分割し
た,複数の周波数帯域のいずれかの帯域の係数列をベク
トル量子化する,少なくとも一つ以上の分割化ベクトル
量子化器を備えたものとしたが、この多段量子化手段の
各段の量子化手段は、上記周波数特性信号系列,または
前段の量子化手段による量子化誤差成分をすべてベクト
ル量子化する全帯域ベクトル量子化器よりなるものであ
ってもよく、これにより、量子化を多段に行って、上記
と同様に、低ビットレート、すなわち高い圧縮率でオー
ディオ信号を符号化した場合であっても、また、固定さ
れた情報量で符号化、及び復号化を行なわなくとも、受
信側において、高品位な音声の再生を行うようにするこ
とができる効果が得られるものである。
信号符号化装置,オーディオ信号復号化装置,オーディ
オ信号符号化方法,及びオーディオ信号復号化方法によ
れば、量子化にはベクトル量子化の手法を用いるなどし
て高い情報圧縮率においても量子化可能な構成を有する
とともに、量子化時の情報量の配分を、再生帯域の拡張
に寄与する情報量と品質向上に寄与する情報量の両者を
交互に配分していくという構成を採用し、まず符号化装
置においては、第1段階として、入力のオーディオ信号
を周波数領域の信号に変換し、変換された周波数信号の
一部を符号化し、第2段階では、符号化されていない周
波数信号の一部と、第1段階の量子化誤差信号を符号化
して、第1段階の符号に付加し、第3段階では、さらに
符号化されていない周波数信号の一部と、第1段階およ
び第2段階の量子化誤差信号の符号化を行って、第1段
階、第2段階の符号に付加し、同様にさらに段階を重ね
て符号化を行い、一方、復号化装置では、第1段階の符
号化された符号のみを用いて復号を行うことも、第1段
階と第2段階の復号化された符号を用いて復号を行うこ
とも、第1段階から第3段階以上の段階の復号化された
符号を用いて復号を行うことも可能とし、復号化の順
は、帯域拡張に寄与するものと、品質向上に寄与するも
のを交互に復号する構成としたので、固定された情報量
で符号化、及び復号化を行なわなくとも、良好な音質を
得ることができ、また、高い圧縮率にて高品質な音を得
ることができるようになる効果が得られる。
装置,オーディオ信号復号化装置,オーディオ信号符号
化方法,及びオーディオ信号復号化方法によれば、量子
化手段で量子化する前に、正規化手段を設けて、入力オ
ーディオ信号の正規化を行った後に量子化を行うように
したので、正規化手段と量子化手段とがそれぞれの能力
をフルに発揮した符号化を行って,元オーディオ信号の
もつ情報量を損失することない、量子化誤差の少ない、
量子化効率の良い量子化を行うことができ、オーディオ
信号の種類によってはその効果をより大きく発揮するこ
とができるものである。また、上記で説明したように、
量子化時の情報量の配分を、再生帯域の拡張に寄与する
情報量と品質向上に寄与する情報量の両者を交互に配分
していくという構成を採用することにより、受信側での
情報量が限られているときには、帯域が狭くて浅い領域
でしか逆量子化を行うことができないが、この逆量子化
を順次、帯域を広くする方向と逆量子化の深さを深くす
る方向とに交互に拡張して、受信側での情報量を増大し
ていくことにより、符号化装置から送信されてくる情報
量に関わらず、符号化されたオーディオ信号の所望の情
報量分を復号化することができ、このように、受信者側
での通信環境等に応じて復号する情報量を変化させるよ
うにすることにより、例えば、通常の公衆電話網を利用
しているような場合においても、安定に高品位な音質を
得ることができるようになる効果が得られる。
装置,オーディオ信号復号化装置,オーディオ信号符号
化方法,及びオーディオ信号復号化方法によれば、多段
量子化を行う量子化手段の前段に各々正規化手段を設け
て、分割した各周波数毎に、かつ各段の量子化毎に正規
化を行ったのち量子化を行うようにしたので、周波数領
域毎の正規化により各周波数領域のオーディオ信号のも
つ情報量に応じた適切な符号化、即ち、正規化手段と量
子化手段とがそれぞれの能力をフルに発揮した符号化を
行って,元オーディオ信号のもつ情報量を損失すること
のない、従って量子化誤差が少なく、量子化効率の良い
量子化を行うことができ、オーディオ信号の種類によっ
てはその効果をより大きく発揮することができるもので
ある。また、復号化側の逆正規化,逆量子化を、量子化
の帯域が広くなる方向と、量子化の深さが深くなる方向
とを交互に行うようにすれば、上記と同様に、符号化装
置から送信されてくる情報量に関わらず、符号化された
オーディオ信号の所望の情報量分を復号化することがで
き、即ち、受信者側での通信環境等に応じて、復号する
情報量を変化させることができ、例えば、通常の公衆電
話網を利用しているような場合においても、安定に高品
位な音質を得ることができる効果が得られる。
ィオ信号復号化装置,オーディオ信号符号化方法,及び
オーディオ信号復号化方法の全体的な構成を示す図であ
る。
規化部の一例を示す構成図である。
波数概形正規化部の一例を示す構成図である。
子化部の実施の形態1における構成図である。
子化部の実施の形態2における構成図である。
子化部の実施の形態3における構成図である。
量子化部の実施の形態4における構成図である。
量子化部の実施の形態4における構成図である。
量子化部の実施の形態4における構成図である。
逆量子化部の実施の形態4における構成図である。
逆量子化部の実施の形態4における構成図である。
図である。
動作を説明するための図である。
な動作を説明するための図である。逆量子化の一実施形
態の構成図である。
量子化手順の動作を説明するための図である。
示す図である。
号符号化装置における量子化部の構成図である。
号符号化装置の動作の全体を説明するための波形図であ
る。
態5によるオーディオ信号符号化装置の動作の全体を説
明するための波形図である。
号符号化装置の動作の全体を説明するための波形図であ
る。
号符号化装置における第1段目ないし第3段目の正規
化,量子化手段による,正規化,量子化の手法の一例を
説明する図である。
号符号化装置に対する、オーディオ信号復号化装置の構
成を説明する図である。
示す図である。
Claims (5)
- 【請求項1】 複数の階層の小量子化部を備え、時間−
周波数変換されたオーディオ信号を入力してインデック
ス情報を出力するオーディオ信号符号化装置であって、少なくとも第i階層の小量子化部は、分割された周波数
帯域毎にベクトル量子化による符号化を行う複数の帯域
分割量子化器を備え、 第i+1階層以降の小量子化部は、前階層の一部の帯域
分割量子化器の量子化誤差にベクトル量子化による符号
化を行い、 インデックス情報は、各階層の小量子化部により符号化
されたベクトルを示す階層別インデックスを含み、 階層別インデックスは、複数の帯域分割量子化器により
周波数帯域が分割された符号化が行われた階層において
は、分割された周波数帯域毎の帯域別インデックスを含
む オーディオ信号符号化装置。 - 【請求項2】 量子化帯域選択部をさらに備え、 量子化帯域選択部は、第i+1階層以降の小量子化部が
符号化を行う一部の帯域分割量子化器を量子化誤差の大
きさに基づいて選出する 請求項1に記載の オーディオ信
号符号化装置。 - 【請求項3】 複数の階層の小逆量子化部を備え、イン
デックス情報をオーディオ信号に復号化するオーディオ
信号復号化装置であって、 少なくとも第i階層の小逆量子化部は、分割された周波
数帯域毎にベクトル逆量子化による復号化を行う複数の
帯域分割逆量子化器を備え、 第i+1階層以降の小逆量子化部は、前階層の一部の帯
域分割量子化器の量子化誤差にベクトル逆量子化による
復号化を行い、 インデックス情報は、階層毎のベクトルを示す階層別イ
ンデックスを含み、 階層別インデックスは、周波数帯域が分割された符号化
が行われた階層においては、分割された周波数帯域毎の
帯域別インデックスを含む オーディオ信号復号化装置。 - 【請求項4】 複数の階層の小量子化ステップを備え、
時間−周波数変換さ れたオーディオ信号をインデックス
情報に変換するオーディオ信号符号化方法であって、 少なくとも第i階層の小量子化ステップは、分割された
周波数帯域毎にベクトル量子化による符号化を行う複数
の帯域分割量子化ステップを備え、 第i+1階層以降の小量子化ステップは、前階層の一部
の帯域分割量子化ステップの量子化誤差にベクトル量子
化による符号化を行い、 インデックス情報は、各階層の小量子化ステップにより
符号化されたベクトルを示す階層別インデックスを含
み、 階層別インデックスは、複数の帯域分割量子化ステップ
により周波数帯域が分割された符号化が行われた階層に
おいては、分割された周波数帯域毎の帯域別インデック
スを含む オーディオ信号符号化方法。 - 【請求項5】 複数の階層の小逆量子化ステップを備
え、インデックス情報をオーディオ信号に復号化するオ
ーディオ信号復号化方法であって、 少なくとも第i階層の小逆量子化ステップは、分割され
た周波数帯域毎にベクトル逆量子化による復号化を行う
複数の帯域分割逆量子化ステップを備え、 第i+1階層以降の小逆量子化ステップは、前階層の一
部の帯域分割量子化ステップの量子化誤差にベクトル逆
量子化による復号化を行い、 インデックス情報は、各階層のベクトルを示す階層別イ
ンデックスを含み、 階層別インデックスは、周波数帯域が分割された符号化
が行われた階層においては、分割された周波数帯域毎の
帯域別インデックスを含む オーディオ信号復号化方法。
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP06241398A JP3344944B2 (ja) | 1997-05-15 | 1998-03-13 | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 |
CNB988005271A CN1144178C (zh) | 1997-05-15 | 1998-05-14 | 音频信号编码装置和译码装置以及音频信号编码和译码方法 |
EP98919600A EP0919989A4 (en) | 1997-05-15 | 1998-05-14 | AUDIO SIGNAL ENCODER, AUDIO SIGNAL DECODER, AND METHOD FOR ENCODING AND DECODING AUDIO SIGNALS |
PCT/JP1998/002135 WO1998052188A1 (fr) | 1997-05-15 | 1998-05-14 | Codeur de signaux audio, decodeur de signaux audio, et procede de codage et de decodage de signaux audio |
US09/227,189 US6904404B1 (en) | 1996-07-01 | 1999-01-08 | Multistage inverse quantization having the plurality of frequency bands |
KR1019997001099A KR100309727B1 (ko) | 1997-05-15 | 1999-01-15 | 오디오 신호 부호화 장치 및 복호화 장치와 오디오 신호 부호화 및 복호화 방법 |
US10/954,589 US7243061B2 (en) | 1996-07-01 | 2004-10-01 | Multistage inverse quantization having a plurality of frequency bands |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP12584497 | 1997-05-15 | ||
JP9-125844 | 1997-05-15 | ||
JP06241398A JP3344944B2 (ja) | 1997-05-15 | 1998-03-13 | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1130998A JPH1130998A (ja) | 1999-02-02 |
JP3344944B2 true JP3344944B2 (ja) | 2002-11-18 |
Family
ID=26403462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP06241398A Expired - Lifetime JP3344944B2 (ja) | 1996-07-01 | 1998-03-13 | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP0919989A4 (ja) |
JP (1) | JP3344944B2 (ja) |
KR (1) | KR100309727B1 (ja) |
CN (1) | CN1144178C (ja) |
WO (1) | WO1998052188A1 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6446037B1 (en) | 1999-08-09 | 2002-09-03 | Dolby Laboratories Licensing Corporation | Scalable coding method for high quality audio |
EP1345331B1 (en) | 2000-12-22 | 2008-08-20 | Sony Corporation | Encoder |
DE10102159C2 (de) * | 2001-01-18 | 2002-12-12 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erzeugen bzw. Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkasse, Codierer und skalierbarer Codierer |
DE60204039T2 (de) | 2001-11-02 | 2006-03-02 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur kodierung und dekodierung von audiosignalen |
WO2004042722A1 (en) * | 2002-11-07 | 2004-05-21 | Samsung Electronics Co., Ltd. | Mpeg audio encoding method and apparatus |
FR2852172A1 (fr) * | 2003-03-04 | 2004-09-10 | France Telecom | Procede et dispositif de reconstruction spectrale d'un signal audio |
EP1667109A4 (en) * | 2003-09-17 | 2007-10-03 | Beijing E World Technology Co | METHOD AND DEVICE FOR QUANTIFYING MULTI-RESOLUTION VECTOR FOR AUDIO CODING AND DECODING |
JP5224017B2 (ja) * | 2005-01-11 | 2013-07-03 | 日本電気株式会社 | オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム |
WO2007114290A1 (ja) * | 2006-03-31 | 2007-10-11 | Matsushita Electric Industrial Co., Ltd. | ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法 |
CN101325059B (zh) * | 2007-06-15 | 2011-12-21 | 华为技术有限公司 | 语音编解码收发方法及装置 |
CN101350197B (zh) * | 2007-07-16 | 2011-05-11 | 华为技术有限公司 | 立体声音频编/解码方法及编/解码器 |
WO2012026741A2 (ko) * | 2010-08-24 | 2012-03-01 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
SG10201808274UA (en) * | 2014-03-24 | 2018-10-30 | Samsung Electronics Co Ltd | High-band encoding method and device, and high-band decoding method and device |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03228433A (ja) * | 1990-02-02 | 1991-10-09 | Fujitsu Ltd | 多段ベクトル量子化方式 |
JP3114197B2 (ja) * | 1990-11-02 | 2000-12-04 | 日本電気株式会社 | 音声パラメータ符号化方法 |
JP3088163B2 (ja) * | 1991-12-18 | 2000-09-18 | 沖電気工業株式会社 | Lsp係数の量子化方法 |
JPH0677840A (ja) * | 1992-08-28 | 1994-03-18 | Fujitsu Ltd | ベクトル量子化装置 |
JP3239488B2 (ja) * | 1992-11-30 | 2001-12-17 | 三菱電機株式会社 | 画像帯域分割符号化装置および画像帯域分割符号化方法 |
JP3537008B2 (ja) * | 1995-07-17 | 2004-06-14 | 株式会社日立国際電気 | 音声符号化通信方式とその送受信装置 |
JPH09127987A (ja) * | 1995-10-26 | 1997-05-16 | Sony Corp | 信号符号化方法及び装置 |
JP3159012B2 (ja) * | 1995-10-26 | 2001-04-23 | 日本ビクター株式会社 | 音響信号の符号化装置及び復号化装置 |
JPH09281995A (ja) * | 1996-04-12 | 1997-10-31 | Nec Corp | 信号符号化装置及び方法 |
JP3246715B2 (ja) * | 1996-07-01 | 2002-01-15 | 松下電器産業株式会社 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
-
1998
- 1998-03-13 JP JP06241398A patent/JP3344944B2/ja not_active Expired - Lifetime
- 1998-05-14 WO PCT/JP1998/002135 patent/WO1998052188A1/ja not_active Application Discontinuation
- 1998-05-14 EP EP98919600A patent/EP0919989A4/en not_active Withdrawn
- 1998-05-14 CN CNB988005271A patent/CN1144178C/zh not_active Expired - Lifetime
-
1999
- 1999-01-15 KR KR1019997001099A patent/KR100309727B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
EP0919989A1 (en) | 1999-06-02 |
WO1998052188A1 (fr) | 1998-11-19 |
KR20000023852A (ko) | 2000-04-25 |
KR100309727B1 (ko) | 2001-09-29 |
JPH1130998A (ja) | 1999-02-02 |
CN1224523A (zh) | 1999-07-28 |
CN1144178C (zh) | 2004-03-31 |
EP0919989A4 (en) | 2003-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6826526B1 (en) | Audio signal coding method, decoding method, audio signal coding apparatus, and decoding apparatus where first vector quantization is performed on a signal and second vector quantization is performed on an error component resulting from the first vector quantization | |
US7243061B2 (en) | Multistage inverse quantization having a plurality of frequency bands | |
JP4506039B2 (ja) | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム | |
EP1914724B1 (en) | Dual-transform coding of audio signals | |
KR100304092B1 (ko) | 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치 | |
US7599833B2 (en) | Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same | |
EP1914725B1 (en) | Fast lattice vector quantization | |
JP4800645B2 (ja) | 音声符号化装置、及び音声符号化方法 | |
KR100904605B1 (ko) | 음성부호화장치, 음성복호장치, 음성부호화방법 및음성복호방법 | |
JP3344962B2 (ja) | オーディオ信号符号化装置、及びオーディオ信号復号化装置 | |
JPWO2005111568A1 (ja) | 符号化装置、復号化装置、およびこれらの方法 | |
JP4736812B2 (ja) | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 | |
JP3344944B2 (ja) | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 | |
JP3765171B2 (ja) | 音声符号化復号方式 | |
JP4603485B2 (ja) | 音声・楽音符号化装置及び音声・楽音符号化方法 | |
JP2002372996A (ja) | 音響信号符号化方法及び装置、音響信号復号化方法及び装置、並びに記録媒体 | |
JPH07261800A (ja) | 変換符号化方法、復号化方法 | |
US20090210219A1 (en) | Apparatus and method for coding and decoding residual signal | |
JP2009253706A (ja) | 符号化装置、復号装置、符号化方法、復号方法及びプログラム | |
JP4734859B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP2003110429A (ja) | 符号化方法及び装置、復号方法及び装置、伝送方法及び装置、並びに記録媒体 | |
US20120123788A1 (en) | Coding method, decoding method, and device and program using the methods | |
JP3191257B2 (ja) | 音響信号符号化方法、音響信号復号化方法、音響信号符号化装置、音響信号復号化装置 | |
JP4274614B2 (ja) | オーディオ信号復号方法 | |
JP2002091497A (ja) | オーディオ信号符号化方法、復号化方法及びそれらの方法を実行するプログラム記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070830 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080830 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080830 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090830 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090830 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100830 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110830 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110830 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120830 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130830 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term |