JP3344944B2

JP3344944B2 - オーディオ信号符号化装置，オーディオ信号復号化装置，オーディオ信号符号化方法，及びオーディオ信号復号化方法

Info

Publication number: JP3344944B2
Application number: JP06241398A
Authority: JP
Inventors: 峰生津島; 武志則松; 智一石川
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 1997-05-15
Filing date: 1998-03-13
Publication date: 2002-11-18
Anticipated expiration: 2018-03-13
Also published as: EP0919989A1; WO1998052188A1; KR20000023852A; KR100309727B1; JPH1130998A; CN1224523A; CN1144178C; EP0919989A4

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声信号や音楽信
号などのオーディオ信号を符号化するオーディオ信号符
号化装置、特にオーディオ信号を直交変換等の手法を用
いて時間領域から周波数領域に変換し、その変換した信
号を、源オーディオ信号と比較してできるだけ少ない符
号列で表現することができるよう効率的に符号化する装
置，及び、符号化された信号である符号化列のすべて、
あるいはその一部のみを用いて、高い品質と広帯域なオ
ーディオ信号を復号可能な構成のオーディオ信号復号化
装置，さらにはその符号化，復号化を行うオーディオ信
号符号化方法，オーディオ信号復号化方法に関するもの
である。

【０００２】

【従来の技術】オーディオ信号を効率的に符号化、およ
び復号化する様々な手法が提案されている。音楽信号な
ど２０ｋＨｚ以上の周波数帯域を有するオーディオ信号
は、特に近年、ＭＰＥＧオーディオ方式などがある。Ｍ
ＰＥＧ方式に代表される符号化方式は、時間軸のディジ
タルオーディオ信号をコサイン変換などの直交変換を用
いて周波数軸上のデータに変換し、その周波数軸上の情
報を、人間の聴覚的な感度特性を利用して聴覚的に重要
な情報から符号化していく方式であり、聴覚的に重要で
ない情報や冗長な情報は符号化しない方式である。源デ
ィジタル信号の情報量に対して、かなり少ない情報量で
表現しようとする場合、ベクトル量子化の手法を用いた
ＴＣ−ＷＶＱなどの符号化方式がある。ＭＰＥＧオーデ
ィオ、およびＴＣ−ＷＶＱはそれぞれISO/IEC 標準IS-1
1172-3、およびT.Moriya, H.Suga:An 8 Kbits transfor
m coder for noisy channels, Proc.ICASSP 89,pp196-1
99などに述べられている。ここで図２４を用いて従来の
オーディオ符号化装置の構成について説明する。

【０００３】図２４において、１６０１は入力信号を周
波数変換するＦＦＴ部、１６０２は周波数変換された入
力信号のうちの特定の帯域を符号化するよう最小可聴限
とマスキング特性算出による適応ビット割り当ての算出
を行う適応ビット割り当て算出部、１６０３は入力信号
を複数の帯域に分割するサブバンド帯域分割部、１６０
４は複数に分割された帯域の各成分をスケールファクタ
を用いて正規化するスケールファクタ正規化部、１６０
５はスケールファクタ正規化部１６０４の正規化出力
を、上記適応ビット割り当て算出部１６０２からのビッ
ト割り当てに応じてスカラー量子化するスカラー量子化
部である。

【０００４】次に動作について説明する。入力信号は、
ＦＦＴ部１６０１と、サブバンド帯域分割部１６０３に
入力される。ＦＦＴ部１６０１では、入力信号を周波数
変換して、その出力を、適応ビット割り当て部１６０２
に入力する。適応ビット割り当て部１６０２では、人間
の聴覚特性に基づいて定義された最小可聴限と、マスキ
ング特性とをもとに、ある帯域成分に対してどれくらい
の情報量を与えるべきかを算出し、その帯域ごとの情報
量配分をインデックスに符号化する。

【０００５】一方、サブバンド帯域分割部１６０３で
は、入力信号を、例えば、３２の帯域に分割し出力す
る。そしてスケールファクタ正規化部１６０４では、前
記サブバンド帯域分割部１６０３で分割されたおのおの
の帯域成分に対して、ある代表値をもって正規化を行
う。該正規化の値はインデックスＩＮＤ₁として量子化
される。スカラー量子化部１６０５では、前記適応ビッ
ト割り当て算出部１６０２で算出されたビット配分をも
とに、スケールファクタ正規化部１６０４の出力をスカ
ラー量子化し、その量子化値をインデックスＩＮＤ₂と
して符号化する。

【０００６】

【発明が解決しようとする課題】従来のオーディオ信号
符号化装置は以上のように構成されており、ＭＰＥＧオ
ーディオ方式は、１チャンネルあたり、６４０００ビッ
ト／秒以上の情報量で符号化されて使用される方法が一
般で、それ以下の情報量では、再生可能な周波数帯域幅
や復号されたオーディオ信号の主観的な品質が著しく劣
化する場合がある。これは、図２２に示した例のよう
に、符号化された情報が、大別して、適応ビット割り当
て部１６０２によるビット配分，スケールファクタ正規
化部１６０４による帯域代表値，スカラー量子化部１６
０５による量子化値の３つからなり、高い圧縮率の場合
には、情報量が量子化値出力に十分に配分されないため
である。また、従来のオーディオ信号の符号化装置にお
いては、符号化する情報量と復号化する情報量とを同じ
にして、符号化装置，及び復号化装置を構成する方法が
一般的である。たとえば、１秒間に１２８０００bit の
情報量に符号化する方法では、その復号化装置では１２
８０００bit の情報量を復号化するように構成されてい
る。

【０００７】しかしながら、以上のようなことから、従
来のオーディオ信号符号化装置，及び復号化装置では、
良好な音質を得るためには固定された情報量で符号化，
及び復号化を行わなければならず、高い圧縮率にて高品
質な音質を得ることはできなかった。

【０００８】この発明は以上のような問題点を解消する
ためになされたもので、少ない情報量で符号化，及び復
号化を行っても、高い品質と広い再生周波数帯域が得ら
れ、また符号化，及び復号化時の情報量を、固定の値で
はなくこれを可変とすることのできるオーディオ信号符
号化装置，及びおよび復号化装置，さらにはオーディオ
信号符号化・復号化方法を提供することを目的とする。
さらには、この発明は、量子化効率をさらに大きく向上
することのできるオーディオ信号符号化装置，及び復号
化装置，さらにはオーディオ信号符号化・復号化方法を
提供することを目的とする。

【０００９】

【課題を解決するための手段】上記の課題を解決するた
め、本発明の請求項１の発明は、複数の階層の小量子化
部を備え、時間−周波数変換されたオーディオ信号を入
力してインデックス情報を出力するオーディオ信号符号
化装置であって、少なくとも第ｉ階層の小量子化部は、
分割された周波数帯域毎にベクトル量子化による符号化
を行う複数の帯域分割量子化器を備え、第ｉ＋１階層以
降の小量子化部は、前階層の一部の帯域分割量子化器の
量子化誤差にベクトル量子化による符号化を行い、イン
デックス情報は、各階層の小量子化部により符号化され
たベクトルを示す階層別インデックスを含み、階層別イ
ンデックスは、複数の帯域分割量子化器により周波数帯
域が分割された符号化が行われた階層においては、分割
された周波数帯域毎の帯域別インデックスを含むことを
特徴とするものである。

【００１０】本発明の請求項２の発明は、請求項１に記
載のオーディオ信号符号化装置において、量子化帯域選
択部をさらに備え、量子化帯域選択部は、第ｉ＋１階層
以降の小量子化部が符号化を行う一部の帯域分割量子化
器を量子化誤差の大きさに基づいて選出することを特徴
とするものである。

【００１１】本発明の請求項３の発明は、複数の階層の
小逆量子化部を備え、インデックス情報をオーディオ信
号に復号化するオーディオ信号復号化装置であって、少
なくとも第ｉ階層の小逆量子化部は、分割された周波数
帯域毎にベクトル逆量子化による復号化を行う複数の帯
域分割逆量子化器を備え、第ｉ＋１階層以降の小逆量子
化部は、前階層の一部の帯域分割量子化器の量子化誤差
にベクトル逆量子化による復号化を行い、インデックス
情報は、階層毎のベクトルを示す階層別インデックスを
含み、階層別インデックスは、周波数帯域が分割された
符号化が行われた階層においては、分割された周波数帯
域毎の帯域別インデックスを含むことを特徴とするもの
である。

【００１２】本発明の請求項４の発明は、複数の階層の
小量子化ステップを備え、時間−周波数変換されたオー
ディオ信号をインデックス情報に変換するオーディオ信
号符号化方法であって、少なくとも第ｉ階層の小量子化
ステップは、分割された周波数帯域毎にベクトル量子化
による符号化を行う複数の帯域分割量子化ステップを備
え、第ｉ＋１階層以降の小量子化ステップは、前階層の
一部の帯域分割量子化ステップの量子化誤差にベクトル
量子化による符号化を行い、インデックス情報は、各階
層の小量子化ステップにより符号化されたベクトルを示
す階層別インデックスを含み、階層別インデックスは、
複数の帯域分割量子化ステップにより周波数帯域が分割
された符号化が行われた階層においては、分割された周
波数帯域毎の帯域別インデックスを含むことを特徴とす
るものである。

【００１３】本発明の請求項５の発明は、複数の階層の
小逆量子化ステップを備え、インデックス情報をオーデ
ィオ信号に復号化するオーディオ信号復号化方法であっ
て、少なくとも第ｉ階層の小逆量子化ステップは、分割
された周波数帯域毎にベクトル逆量子化による復号化を
行う複数の帯域分割逆量子化ステップを備え、第ｉ＋１
階層以降の小逆量子化ステップは、前階層の一部の帯域
分割量子化ステップの量子化誤差にベクトル逆量子化に
よる復号化を行い、インデックス情報は、各階層のベク
トルを示す階層別インデックスを含み、階層別インデッ
クスは、周波数帯域が分割された符号化が行われた階層
においては、分割された周波数帯域毎の帯域別インデッ
クスを含むことを特徴とするものである。

【００１４】

【００１５】

【００１６】

【００１７】

【００１８】

【００１９】

【００２０】

【００２１】

【００２２】

【００２３】

【００２４】

【００２５】

【００２６】

【００２７】

【００２８】

【００２９】

【００３０】

【００３１】

【００３２】

【００３３】

【００３４】

【００３５】

【００３６】

【００３７】

【００３８】

【００３９】

【００４０】

【００４１】

【００４２】

【００４３】

【００４４】

【００４５】

【００４６】

【００４７】

【発明の実施の形態】以下、本発明の実施の形態につい
て、図面を用いて説明する。実施の形態１．図１は本発明の実施の形態１によるオーディオ信号符号
化装置，オーディオ信号復号化装置，オーディオ信号符
号化方法，及びオーディオ信号復号化方法の全体の構成
を示す図である。図１において、１は符号化装置であ
り、２は復号化装置である。符号化装置１において、１
０１は入力信号を所定の値のフレーム数となるように分
割するフレーム分割部、１０２は時間軸上で、入力信号
と窓関数とを乗じる窓掛け部、１０３は変形離散コサイ
ン変換（Modified discrete cosinetransform）を行う
ＭＤＣＴ部、１０４はフレーム分割部１０１からの出力
である時間軸の信号と、ＭＤＣＴ部１０３からの出力で
あるＭＤＣＴ係数との両者を入力としてそのＭＤＣＴ係
数を正規化する正規化部、１０５は正規化されたＭＤＣ
Ｔ係数を入力として量子化を行う量子化部である。な
お、ここでは、時間周波数変換としてＭＤＣＴを用いた
場合について説明するが、これは離散フーリエ変換（Ｄ
ＦＴ：Discrete Fourier Transform）を用いてもよい。

【００４８】復号化装置２において、１０６は符号化装
置１から出力された信号（インデックスＩＮＤ₂）を受
けてこれを逆量子化する逆量子化部、１０７は逆量子化
部１０６の出力を、符号化装置１の正規化部１０４から
のインデックスＩＮＤ₁を用いて、逆正規化する逆正規
化部、１０８は逆正規化部１０７の出力を変形離散コサ
イン変換する逆ＭＤＣＴ部、１０９は逆ＭＤＣＴ部１０
８の出力に対して窓掛けを行う窓掛け部、１１０は窓掛
け部１０９の出力に対し、フレーム重ね合わせを行うフ
レーム重ね合わせ部である。

【００４９】以上のように構成されたオーディオ信号符
号化装置，オーディオ信号復号化装置，オーディオ信号
符号化方法，及びオーディオ信号復号化方法の動作につ
いて述べる。符号化装置１に入力される信号は、時間的
に連続するディジタル信号系列であるとする。例えば、
音声信号を、サンプリング周波数４８kHz で、１６ビッ
トに量子化したディジタル信号であるとする。この入力
信号は、ある一定のサンプル数に達するまでフレーム分
割部１０１で蓄積され、蓄積されたサンプル数が規定の
フレーム長に達すると出力を行う。ここで、フレーム分
割部１０１のフレーム長は、例えば、１２８，２５６，
５１２，１０２４，２０４８，４０９６サンプルなどで
ある。フレーム分割部１０１では、入力信号の特徴に応
じてフレーム長を可変にして出力することも可能であ
る。また、フレーム分割部１０１は、あるシフト長ごと
に出力を行う構成のものであり、例えば、フレーム長を
４０９６サンプルとした場合において、フレーム長の半
分のシフト長を設定すれば、フレーム長が２０４８サン
プルに到達するに相当する時間ごとに最新の４０９６サ
ンプルを出力するなどの構成を持つ。当然ながらフレー
ム長やサンプリング周波数が変わっても、同様にシフト
長をフレーム長の半分に設定した構成を持つことは可能
である。

【００５０】そしてこのフレーム分割部１０１からの出
力は、後段の窓掛け部１０２と正規化部１０４へとそれ
ぞれ入力される。窓掛け部１０２では、前記フレーム分
割部１０１からの出力信号に対して、時間軸上で窓関数
を乗じて、窓掛け部１０２の出力とする。この様子は、
例えば、数１式で示される。

【００５１】

【数１】

【００５２】ただし、ここで、xiはフレーム分割部１０
１からの出力で、hiは窓関数、hxi は窓掛け部１０２か
らの出力である。また、i は時間のサフィックスであ
る。なお、数１式で示した窓関数hiは一例であり、窓関
数は必ずしも数１式のものである必要はない。窓関数の
選択は、窓掛け部１０２に入力される信号の特徴と、フ
レーム分割部１０１のフレーム長と、時間的に前後に位
置するフレームにおける窓関数の形状に依存する。例え
ば、窓掛け部１０２に入力される信号の特徴として、フ
レーム分割部１０１のフレーム長をＮとした場合、Ｎ／
４ごとに入力される信号の平均パワーを算出して、その
平均パワーが非常に大きく変動する場合は、フレーム長
をＮよりも短くして数１式に示した演算を実行するなど
の選択を行う。また、前の時刻のフレームの窓関数の形
状と後ろのフレームの窓関数の形状に応じて、現在の時
刻のフレームの窓関数の形状に歪みがないように適宜選
択するのが望ましい。

【００５３】次いで窓掛け部１０２からの出力は、ＭＤ
ＣＴ部１０３に入力され、ここで変形離散コサイン変換
が施され、ＭＤＣＴ係数が出力される。変形離散コサイ
ン変換の一般式は数２式で表される。

【００５４】

【数２】

【００５５】このようにＭＤＣＴ部１０３の出力である
ＭＤＣＴ係数は、数２式のykで表せるとすると、ＭＤＣ
Ｔ部１０３の出力は周波数特性を示し、ykの変数k が０
に近いほど低い周波数成分に、０から増大してN/2-1 に
近くなるほど高い周波数成分に線形に対応する。正規化
部１０４では、フレーム分割部１０１からの出力である
時間軸の信号xiと、ＭＤＣＴ部１０３からの出力である
ＭＤＣＴ係数ykの両者を入力として、いくつかのパラメ
ータを用いて、ＭＤＣＴ係数を正規化する。ここでＭＤ
ＣＴ係数の正規化とは、低域成分と高域成分とで非常に
大きさに違いのあるＭＤＣＴ係数の大きさのばらつきを
抑圧することを意味し、例えば、低域成分が高域成分に
対して非常に大きい場合などは、低域成分では大きな
値、高域成分では小さな値となるようなパラメータを選
出し、これで上記ＭＤＣＴ係数を除算することによりＭ
ＤＣＴ係数の大きさのばらつきを抑圧することをさす。
また正規化部１０４では、正規化に用いたパラメータを
表現するインデックスＩＮＤ₁を符号化する。

【００５６】量子化部１０５では、正規化部１０４で正
規化されたＭＤＣＴ係数を入力として、ＭＤＣＴ係数の
量子化を行う。この際、該量子化部１０５は、該量子化
した値と、コードブック中にある複数のコードインデッ
クスに対応する各量子化出力との間の差が，最も小さく
なるような，そのような該コードインデックスを出力す
る。この場合、上記量子化部１０５で量子化した値と、
該量子化部１０５から出力されるコードインデックスに
対応する値との差が、量子化誤差である。

【００５７】一方、復号化装置２では、符号化装置１の
正規化部１０４からのインデックスＩＮＤ₁と、量子化
部１０５からのインデックスＩＮＤ₂とを用いて復号を
行う。逆量子化部１０６では、量子化部１０５からのイ
ンデックスＩＮＤ₂を用いて、上記符号化装置１におけ
る，正規化された時点でのＭＤＣＴ係数の再生を行う。
逆量子化部１０６では、インデックスのすべてを用いて
もよいし、その一部分を用いてＭＤＣＴ係数の再生を行
ってもよい。当然ながら、正規化部１０４からの出力
と、逆量子化部１０６の出力とは、量子化部１０５によ
る量子化時に量子化誤差を伴うために、量子化前の状態
と必ずしも一致しない。

【００５８】逆正規化部１０７では、符号化装置１の正
規化部１０４からのインデックスＩＮＤ₁から、符号化
装置１で正規化に用いたパラメータの復元を行い、逆量
子化部１０６の出力と該パラメータとを乗算し、ＭＤＣ
Ｔ係数の復元を行う。逆ＭＤＣＴ部１０８では、逆正規
化部１０７からの出力であるＭＤＣＴ係数から、逆ＭＤ
ＣＴを行い、周波数領域の信号から時間領域の信号への
復元を行う。上記逆ＭＤＣＴ計算は、例えば、数３式で
示される。

【００５９】

【数３】

【００６０】ここで、yyk は逆正規化部１０７で復元さ
れたＭＤＣＴ係数で、xx(n) は逆ＭＤＣＴ係数であり、
これを逆ＭＤＣＴ部１０８の出力とする。窓掛け部１０
９では、逆ＭＤＣＴ部１０８からの出力xx(n) を用いて
窓掛けを行う。窓掛けは、符号化装置１の窓掛け部１０
２で用いた窓を用い、たとえば、数４式で示される処理
を行う。

【００６１】

【数４】

【００６２】ここで、z(i)は、窓掛け部１０９の出力で
ある。フレーム重ね合わせ部１１０では、窓掛け部１０
９からの出力を用いて、オーディオ信号を再生する。窓
掛け部１０９からの出力は、時間的に重複した信号とな
っているので、フレーム重ね合わせ部１１０では、例え
ば、数５式を用いて復号化装置２の出力信号とする。

【００６３】

【数５】

【００６４】ここで、zm(i) は第m 時刻フレームの第ｉ
番目の窓掛け部１０９の出力信号z(i)であり、zm-1(i)
は第m-1 時刻フレームの第ｉ番目の窓掛け部１０９の出
力信号であり、SHIFT は符号化装置のシフト長に相当す
るサンプル数であり、out(i)はフレーム重ね合わせ部１
１０の第m 時刻フレームにおける復号化装置２の出力信
号とする。

【００６５】次に図２を用いて、上記正規化部１０４の
詳細な一例を説明する。図２において、２０１はフレー
ム分割部１０１とＭＤＣＴ部１０３の出力を受ける周波
数概形正規化部、２０２は周波数概形正規化部２０１の
出力を受け、帯域テーブル２０３を参照して正規化を行
う帯域振幅正規化部である。

【００６６】次に動作について説明する。周波数概形正
規化部２０１では、フレーム分割部１０１からの時間軸
上のデータ出力を用いて、大まかな周波数の概形である
周波数概形を算出し、これでＭＤＣＴ部１０３からの出
力であるＭＤＣＴ係数を除算する。周波数概形を表現す
るのに用いたパラメータはインデックスＩＮＤ₁として
符号化される。帯域振幅正規化部２０２では、周波数概
形正規化部２０１からの出力信号を入力として、帯域テ
ーブル２０３で示された帯域ごとに正規化を行う。例え
ば、周波数概形正規化部２０１の出力であるＭＤＣＴ係
数が、dct(i)(i= 0〜2047) とし、帯域テーブル２０３
が、例えば、表１に示されるようなものであるとする
と、数６式などを用いて各帯域毎の振幅の平均値を算出
する。

【００６７】

【表１】

【００６８】

【数６】

【００６９】ここで、bjlow,bjhighは帯域テーブル２０
３に示されたj 番目の帯域におけるdct(i)が属する最も
低域のインデックスi と、最も高域のインデックスi を
それぞれ示している。また、p は距離計算におけるノル
ムであり、２などが望ましい。avejは、各帯域番号j に
おける振幅の平均値である。帯域振幅正規化部２０２で
は、avejを量子化して、qavej を算出して、例えば、数
７式を用いて正規化する。

【００７０】

【数７】

【００７１】avejの量子化はスカラー量子化を用いても
よいし、コードブックを用いてベクトル量子化を行って
もよい。帯域振幅正規化部２０２では、qavej を表現す
るのに用いたパラメータのインデックスＩＮＤ₁を符号
化する。

【００７２】なお、符号化装置１における正規化部１０
４の構成は、図２の周波数概形正規化部２０１と帯域振
幅正規化部２０２の両者を用いた構成のものを示した
が、周波数概形正規化部２０１のみを用いた構成でもよ
く、帯域振幅正規化部２０２のみを用いた構成でもよ
い。さらに、ＭＤＣＴ部１０３から出力されるＭＤＣＴ
係数の低域成分と高域成分とで大きなばらつきがない場
合は、両者を用いない構成で、ＭＤＣＴ部１０３の出力
信号をそのまま量子化部１０５に入力する構成としても
よい。

【００７３】次に図３を用いて、図２の周波数概形正規
化部２０１の詳細について説明する。図３において、３
０１はフレーム分割部１０１の出力を受ける線形予測分
析部、３０２は線形予測分析部３０１の出力を受ける概
形量子化部、３０３はＭＤＣＴ部１０３の出力を受ける
包絡特性正規化部である。

【００７４】次に上記周波数概形正規化部２０１の動作
について説明する。上記線形予測分析部３０１では、フ
レーム分割部１０１からの時間軸上のオーディオ信号を
入力として、線形予測分析（Linear Predictive Codin
g）を行う。線形予測分析の線形予測係数（ＬＰＣ係
数）は、ハミング窓などの窓掛けされた信号の自己相関
関数を算出し、正規方程式などを解くことで一般に算出
可能である。算出された線形予測係数は、線スペクトル
対係数（ＬＳＰ（Line Spectrum Pair) 係数）などに変
換され、概形量子化部３０２で量子化される。ここでの
量子化手法としてはベクトル量子化を用いてもよいし、
スカラー量子化を用いてもよい。そして概形量子化部３
０２で量子化されたパラメータが表現する周波数伝達特
性を包絡特性正規化部３０３で算出し、ＭＤＣＴ部１０
３からの出力であるＭＤＣＴ係数をこれで除算すること
によって正規化する。具体的な算出例としては、概形量
子化部３０２で量子化されたパラメータと等価な線形予
測係数を、qlpc(i) とすれば、包絡特性正規化部３０３
で算出される上記周波数伝達特性は、例えば、数８式で
表すことができる。

【００７５】

【数８】

【００７６】ここでORDER は１０〜４０くらいが望まし
い。fft( )は高速フーリエ変換を意味する。算出された
周波数伝達特性env(i)を用いて、包絡特性正規化部３０
３では、例えば下記に示す数９式を用いて正規化を行
う。

【００７７】

【数９】

【００７８】ここで、mdct(i) はＭＤＣＴ部１０３から
の出力信号で、fdct(i) は正規化された包絡特性正規化
部３０３からの出力信号である。次に図４を用いて、符
号化装置１における量子化部１０５の詳細について説明
する。図４において、４０１は第１の小量子化部、４０
２は第１の小量子化部４０１の出力を受ける第２の小量
子化部、４０３は第２の小量子化部４０２の出力を受け
る第３の小量子化部である。

【００７９】次に上記量子化部１０５の動作について説
明する。上記第１の小量子化部４０１に入力される信号
は符号化装置の正規化部１０４からの出力であり、正規
化されたＭＤＣＴ係数である。ただし、正規化部１０４
を持たない構成では、ＭＤＣＴ部１０３の出力となる。
第１の小量子化部４０１では、入力されたＭＤＣＴ係数
をスカラー量子化、またはベクトル量子化して、量子化
に用いたパラメータを表現するインデックスを符号化す
る。また、量子化による入力ＭＤＣＴ係数に対する量子
化誤差を算出し、それを第２の小量子化部４０２へ出力
する。ここで、第１の小量子化部４０１では、すべての
ＭＤＣＴ係数を量子化してもよいし、一部のみを量子化
するようにしてもよい。当然ながら、一部のみを量子化
した場合は、第１の小量子化部４０１で量子化されない
帯域の量子化誤差は、量子化されない帯域の入力ＭＤＣ
Ｔ係数そのものとなる。

【００８０】次いで、第２の小量子化部４０２では、第
１の小量子化部４０１のＭＤＣＴ係数の量子化誤差を入
力として、それをさらに量子化する。このときの量子化
も第１の小量子化部４０１と同様に、スカラー量子化を
用いてもよいし、ベクトル量子化を用いてもよい。そし
て、第２の小量子化部４０２では、量子化に用いたパラ
メータを表現するインデックスに符号化する。また、量
子化による量子化誤差を算出し、それを第３の小量子化
部４０３へと出力する。この第３の小量子化部４０３
は、上記第２の小量子化部と構成は同じである。ここ
で、上記第１の小量子化部４０１，第２の小量子化部４
０２，第３の小量子化部４０３が量子化するＭＤＣＴ係
数の個数、つまり、帯域幅は必ずしも均一である必要は
なく、また、量子化する帯域も同じである必要もない。
このとき、人間の聴覚特性を考慮し、第２の小量子化部
４０２，第３の小量子化部４０３は、ともに低域周波数
成分を示すＭＤＣＴ係数の帯域を量子化するように設定
するのが望ましい。

【００８１】このように本実施の形態１によるオーディ
オ信号符号化装置によれば、量子化を行う際に、量子化
部を階層的に設けて、即ち多段量子化手段を構成し、前
段と後段での量子化部が量子化する帯域幅を可変とした
ことにより、入力ＭＤＣＴ係数のうち、任意の帯域、例
えば、人間にとって聴覚的に重要な低域周波数成分に相
当する係数を重点的に量子化するようにしたから、低ビ
ットレート、すなわち高い圧縮率でオーディオ信号を符
号化した場合であっても、受信側において、高品位な音
声の再生を行うようにすることができる。

【００８２】実施の形態２次に図５を用いて、本発明の実施の形態２によるオーデ
ィオ信号符号化装置について説明する。本実施の形態２
では、符号化装置１における量子化部１０５の構成のみ
が上記実施の形態１と異なるので、ここでは、量子化部
の構成についてのみ説明する。図５において、５０１は
第１の小量子化部、５０２は第２の小量子化部、５０３
は第３の小量子化部である。上記実施の形態１との構成
上の違いは、第１の量子化部５０１が、入力ＭＤＣＴ係
数を３つの帯域（高域、中域、低域）に分割して独立に
量子化を行う点であり、これら第１の小量子化部５０１
を構成する各帯域の量子化部が、いわゆる”分割化ベク
トル量子化器”に相当する。一般にベクトル量子化の手
法を用いて量子化を行う場合において、入力ＭＤＣＴ係
数からいくつかの要素を抽出して、ベクトルを構成し、
ベクトル量子化することができる。本実施の形態２の第
１の小量子化部５０１では、入力ＭＤＣＴ係数からいく
つかの要素を抽出してベクトルを構成する際に、低域の
量子化は低域のみの要素を用いて量子化し、中域の量子
化は中域のみの要素を用いて、高域の量子化は高域のみ
の要素を用いて、それぞれベクトル量子化する構成とな
っている。

【００８３】なお、本実施の形態２では、量子化の際
に、低域，中域，高域の３つの帯域に分割する方法を一
例として説明したが、分割する帯域の数は３以外の数で
あってもよい。また、第２の小量子化部５０２，第３の
小量子化部５０３についても、第１の量子化部５０１と
同様に、帯域をいくつかに分割して量子化を行う構成と
してもよい。

【００８４】このように本実施の形態２によれば、多段
量子化手段において、まず第１段では、入力ＭＤＣＴ係
数を３つの帯域に分割して独立的に量子化を行うように
したので、聴覚的に重要な帯域を優先的に量子化する等
の処理を、第１回目の量子化時に行うことができ、後段
の量子化部５０２，５０３において、さらに段階的に当
該聴覚的に重要な帯域のＭＤＣＴ係数の量子化を行うよ
うにすることにより、量子化誤差をより低減することが
でき、受信側において、より高品位な音質の再現を可能
とすることができる。

【００８５】実施の形態３．次に図６を用いて、本発明
の実施の形態３によるオーディオ信号符号化装置につい
て説明する。本実施の形態３では、符号化装置１におけ
る量子化部１０５の構成のみが上記実施の形態１と異な
るものであるために、ここでは、量子化部の構成につい
てのみ説明する。図６において、６０１は第１の小量子
化部、６０２は第１の量子化帯域選択部、６０３は第２
の小量子化部、６０４は第２の量子化帯域選択部、６０
５は第３の小量子化部である。上記実施の形態２との構
成上の違いは、第１の量子化帯域選択部６０２と、第２
の量子化帯域選択部６０４が加わった点である。

【００８６】以下動作について説明する。上記第１の量
子化帯域選択部６０２では、第１の小量子化部６０１の
量子化誤差である出力（fdct_err(i))を用いて、第２の
小量子化部６０２でどの帯域のＭＤＣＴ係数を量子化す
べきかを算出する。例えば、数１０式で与えるesum(j)
を最大とするj を算出し、j * OFFSETからj*OFFSET +BA
NDWIDTHの帯域を量子化すればよい。

【００８７】

【数１０】

【００８８】ここで、OFFSETは定数で、BANDWIDTH は第
２の小量子化部６０３が量子化する帯域幅に相当する総
サンプルである。第１の量子化帯域選択部６０２では、
例えば、数１０式で、esum(j) の最大値を与えたj など
を、符号化してインデックスＩＮＤ₂とする。第２の小
量子化部６０３では、これらのインデックスＩＮＤ₂を
受けて、第１の量子化帯域選択部６０２で選択された帯
域を量子化する。第２の量子化帯域選択部６０４は、第
２の小量子化部６０３の量子化誤差である出力をその入
力とし、該第２の量子化帯域選択部６０４の選択した帯
域を、上記第３の小量子化部６０５に入力せしめること
を除いては、上記第１の量子化帯域選択部６０２と同じ
構成でこれを実現することが可能である。

【００８９】なお、第１の量子化帯域選択部６０２，お
よび第２の量子化帯域選択部６０４では、数１０式を用
いて、次の量子化部が量子化すべき帯域を選択する構成
を説明したが、数１１式の，正規化部１０４で正規化に
用いた値、および人間の周波数に対する相対的な聴覚感
度特性を考慮に入れた値，を乗算した値を用いて、量子
化すべき帯域を算出するようにしてもよい。

【００９０】

【数１１】

【００９１】ここで、env(i)はＭＤＣＴ部１０３の出力
を正規化部１０４の出力で除算したものであり、zxc(i)
は人間の周波数に対する相対的な聴覚感度特性を考慮に
入れたテーブルであり、その一例を表２に示した。ま
た、数１１式において、zxc(i)はすべて１として考慮に
入れない構成でもよい。

【００９２】

【表２】

【００９３】さらに、量子化帯域選択部は必ずしも複数
設けなくてもよく、第１の量子化帯域選択部６０２のみ
を用いた構成、あるいは第２の量子化帯域選択部６０４
のみを用いた構成としてもよい。

【００９４】このように本実施の形態３では、多段量子
化手段により多段的に量子化を行う際に、前段の量子化
部と次段の量子化部との間に量子化帯域選択部を設け、
量子化する帯域を可変として適宜選択するようにするこ
とで、入力信号に応じて適宜、量子化する帯域を変化さ
せることが可能となり、量子化の自由度を向上すること
ができ、量子化の必要な部分を重点的に量子化して、量
子化効率を大きく向上することができる。

【００９５】以下に、図１および図１３を用いて、上記
実施の形態１〜３の符号化装置１における量子化部１０
６の量子化方法の詳細な動作について説明する。各小量
子化部に入力されるＭＤＣＴ係数１４０１は、そのＭＤ
ＣＴ係数１４０１から幾つかを抜き出して音源サブベク
トル１４０３を構成する。同様に、正規化部１０４にお
いて、正規化部１０４の入力であるＭＤＣＴ係数を、正
規化部１０４の出力であるＭＤＣＴ係数で割った係数列
を、正規化成分１４０２とした時、該正規化成分１４０
２についても、音源サブベクトル１４０３をＭＤＣＴ係
数１４０１から抜き出したのと同じ規則で、該正規化成
分１４０２から抽出し、重みサブベクトル１４０４を構
成することができる。このように、音源サブベクトル１
４０３，および重みサブベクトル１４０４を、ＭＤＣＴ
係数１４０１，および正規化成分１４０２からそれぞれ
抽出する規則は、例えば、数１４式で示す方法などがあ
る。

【００９６】

【数１４】

【００９７】ここで、i 番目の音源サブベクトルのj 番
目の要素はsubvector i(j)であり、ＭＤＣＴ係数１４０
１はvector()であり、ＭＤＣＴ係数１４０１の総要素数
がTOTAL で、音源サブベクトル１４０３の要素数がＣ
Ｒ、VTOTALは、TOTAL と同じ値かより大きい値で，VTOT
AL/CR が整数値になるように設定する。例えば、TOTAL
が２０４８の時、ＣＲが１９で，VTOTALが２０５２、Ｃ
Ｒが２３で，VTOTALが２０７０、ＣＲが２１で，VTOTAL
が２０７９などである。重みサブベクトル１４０４につ
いても、数１４式の手順で抽出可能である。

【００９８】ベクトル量子化器１４０５では、コードブ
ック１４０９中のコードベクトルの中から、音源サブベ
クトル１４０３との距離が、重みサブベクトル１４０４
で重みつけて最も小さくなるものを探し、その最小の距
離を与えたコードベクトルのインデックスＩＮＤ₂と、
最小の距離を与えたコードベクトルと入力音源サブベク
トル１４０３との量子化誤差に相当する残差サブベクト
ル１４１０を出力する。実際の計算手順例としては、該
ベクトル量子化器１４０５は、距離計算手段１４０６，
コード決定手段１４０７，及び残差生成手段１４０８，
の３つの構成要素を有するものとして説明する。距離計
算手段１４０６では、例えば、数１５式を用いて、i 番
目の音源サブベクトル１４０３と、コードブック１４０
９のk 番目のコードベクトルとの距離を算出する。

【００９９】

【数１５】

【０１００】ここでwjは重みサブベクトルのj 番目の要
素、ck(j) はk 番目のコードベクトルのj 番目の要素、
Ｒ、Ｓは距離計算のノルムであり、Ｒ、Ｓの値としては
1, 1.5, 2 などが望ましい。なお、この距離計算のノル
ムＲと、Ｓは同一の値である必要はない。dik はi 番目
の音源サブベクトルに対するk 番目のコードベクトルの
距離を意味する。コード決定手段１４０７では、数１５
式などで算出された距離の中で最小となるコードベクト
ルを選出し、そのインデックスを符号化する（ＩＮ
Ｄ₂）。例えば、diu が最小値の場合、i 番目のサブベ
クトルに対する符号化されるインデックスはu となる。
残差生成手段１４０８では、コード決定手段１４０７で
選出したコードベクトルを用いて、数１６式を用いて、
残差サブベクトル１４１０を生成する。

【０１０１】

【数１６】

【０１０２】ここでi 番目の残差サブベクトル１４１０
のj 番目の要素は、resi(j) であり、コード決定手段１
４０７で選出されたu 番目のコードベクトルのj 番目の
要素を、cu(j) とする。残差サブベクトル１４１０は、
数１４式の逆過程などを行うことにより、それ以降の小
量子化部の量子化対象となるＭＤＣＴ係数として保持さ
れる。ただし、ある帯域の量子化がそれ以降の小量子化
部に影響を与えない帯域の量子化を行っている場合、つ
まり以降の小量子化部が量子化をすることがない場合
は、残差生成手段１４０８，残差サブベクトル１４１
０，及びＭＤＣＴ係数１４１１の生成は必要ない。なお
コードブック１４０９が持つコードベクトルの個数はい
くつでもよいが、メモリ容量、計算時間等を考慮する
と、６４程度とすることが好ましい。

【０１０３】なお、上記ベクトル量子化器１４０５の他
の実施の形態として、以下のような構成も可能である。
すなわち、距離計算手段１４０６では、数１７式を用い
て距離を算出する。

【０１０４】

【数１７】

【０１０５】ただし、Ｋはコードブック１４０９のコー
ド検索に用いるコードベクトルの総数である。コード決
定手段１４０７では、数１７式で算出された距離dik の
最小値を与えるk を選出し、そのインデックスを符号化
する（ＩＮＤ₂）。ただし、k は０から2K-1までの値と
なる。残差生成手段１４０８では、数１８式を用いて残
差サブベクトル１４１０を生成する。

【０１０６】

【数１８】

【０１０７】コードブック１４０９が持つコードベクト
ルの個数はいくつでもよいが、メモリの容量、計算時間
等を考慮すると、６４程度とすることが好ましい。ま
た、重みサブベクトル１４０４としては、これを正規化
成分１４０２のみから生成する構成について述べたが、
重みサブベクトル１４０４に、人間の聴覚特性を考慮し
た重みをさらに乗じて、重みサブベクトルを生成するこ
とも可能である。

【０１０８】以上のような本実施の形態３によれば、第
１の小量子化部と第２の小量子化部との間に第１の量子
化帯域選択部を、第２の小量子化部と第３の小量子化部
との間に第２の量子化帯域選択部を、それぞれ設けて、
上記第２の小量子化部，第３の小量子化部で量子化する
帯域を可変として適宜選択するようにしたので、入力信
号に応じて適宜、量子化する帯域を変化させることが可
能となり、量子化の自由度を向上することができ、量子
化の必要な部分を重点的に量子化して、量子化効率を大
きく向上することができる効果が得られる。

【０１０９】さらに、上記実施の形態１〜３では、入力
オーディオ信号を周波数変換して得られた周波数特性信
号系列に対し、ベクトル量子化を行い、オーディオ信号
の符号化をするオーディオ信号符号化装置において、上
記周波数特性信号系列，またはその一部をベクトル量子
化する第１段目のベクトル量子化器と、上記第１段目の
ベクトル量子化器による量子化誤差成分をベクトル量子
化する第２段目のベクトル量子化器とを、少なくとも、
有する多段量子化手段を構成するようにするとともに、
該多段量子化手段の各段の量子化手段は、上記周波数特
性信号系列を，少なくとも２つ以上の，複数の段間で重
複する部分を有し得る周波数帯域に，各段毎の分割の仕
方により分割した，複数の周波数帯域のいずれかの帯域
の係数列をベクトル量子化する，少なくとも一つ以上の
分割化ベクトル量子化器を備えた構成とすることがで
き、このような構成により、入力ＭＤＣＴ係数のうち、
任意の帯域、例えば、人間にとって聴覚的に重要な低域
周波数成分に相当する係数を重点的に，所望の深さに量
子化するようにし、一方、復号化側では、複数段階の復
号化された符号を用いて復号を行うことも可能とし、ま
た、復号化の順は、帯域拡張に寄与するものと、品質向
上に寄与するものを交互に復号する構成を採ることも可
能にすることにより、低ビットレート、すなわち高い圧
縮率でオーディオ信号を符号化した場合であっても、ま
た、固定された情報量で符号化、及び復号化を行なわな
くとも、受信側において、高品位な音声の再生を行うよ
うにすることができる効果が得られる。

【０１１０】実施の形態４．次に図１、図７〜図１１を
用いて、本発明の実施の形態４によるオーディオ信号復
号化装置について説明する。符号化装置１からの出力で
あるインデックスは、正規化部１０４の出力したインデ
ックスＩＮＤ₁と、量子化部１０５の出力したインデッ
クスＩＮＤ₂とに大きく分けられる。

【０１１１】正規化部１０４の出力したインデックスＩ
ＮＤ₁は、逆正規化部１０７で復号し、量子化部１０５
の出力したインデックスＩＮＤ₂は逆量子化部１０６で
復号する。ここで逆量子化部１０６では、量子化部１０
５の出力したインデックスＩＮＤ₂の一部分のみを用い
て復号することも可能である。

【０１１２】すなわち、以下に、符号化装置１における
量子化部１０５の構成を図５に示す構成のものとした場
合に、復号化装置１において、図７の構成を有する逆量
子化部を用いて逆量子化を行う場合について説明する。
図７において、７０１は第１の低域成分の逆量子化部で
ある。この第１の低域成分の逆量子化部７０１では、第
１の小量子化部５０１の低域成分のインデックスＩＮＤ
₂₁のみを用いて復号化を行う。

【０１１３】このようにすることで、即ち上記のように
第１の低域成分の逆量子化部７０１では、第１の小量子
化部５０１の低域成分のインデックスのみを用いて復号
化を行うようにすることで、符号化装置１から送信され
てくる情報量に関わらず、符号化されたオーディオ信号
の所望の情報量分を復号化することができる。即ち、受
信側で復号化する情報量が制限されている場合において
も、符号化する情報量と復号化する情報量とを異なる値
として、所望の情報量分のみを復号化するようにするこ
とができる。従って、受信者側での通信環境等に応じ
て、復号する情報量を変化させることができ、例えば、
通常の公衆電話網を利用しているような場合において
も、安定に高品位な音質を得ることができるようにな
る。

【０１１４】図８は逆量子化を２段階で行う際のオーデ
ィオ信号復号化装置の逆量子化部の構成を示す図であ
り、図８において、７０４は第２の逆量子化部である。
この第２の逆量子化部７０４では、第２の小量子化部５
０２のインデックスＩＮＤ₃を用いて復号化を行う。従
って、第１の低域成分の逆量子化部７０１からの出力Ｉ
ＮＤ₂₁’と、第２の逆量子化部７０４からの出力ＩＮＤ
₃’との加算値が、逆量子化部１０６の出力として出力
されることになる。ただし、ここでの加算は、量子化時
にそれぞれの小量子化部が量子化した帯域と同じ帯域に
加算していく。

【０１１５】このように、第１の小量子化部（低域）の
インデックスＩＮＤ₂₁を第１の低域成分の逆量子化部７
０１により復号化するとともに、第２の小量子化部のイ
ンデックスＩＮＤ₃を逆量子化する際に、上記第１の低
域成分の逆量子化部７０１の出力ＩＮＤ₂₁’をも該逆量
子化の対象に加算して逆量子化を行うようにすることに
より、逆量子化を２段階で行うことができ、多段階で量
子化されたオーディオ信号を正確に復号化することがで
き、より高品質な音質を得ることができるようになる。

【０１１６】また、図９は逆量子化を２段階で行う際
に、対象となる帯域を拡大して行うようにしたオーディ
オ信号復号化装置の逆量子化部の構成を示す図であり、
図９において、７０２は第１の中域成分の逆量子化部で
ある。この第１の中域成分の逆量子化部７０２では、第
１の小量子化部５０１の中域成分のインデックスＩＮＤ
₂₂を用いて復号化を行う。従って、第１の低域成分の逆
量子化部７０１からの出力ＩＮＤ₂₁’と、第２の逆量子
化部７０４からの出力ＩＮＤ₃’と、第１の中域成分の
逆量子化部７０２からの出力ＩＮＤ₂₂’との加算値が、
逆量子化部１０６の出力として出力されることになる。
ただし、ここでの加算は、量子化時にそれぞれの小量子
化部が量子化した帯域と同じ帯域に加算していく。この
ようにすることで、再生される音の帯域を拡大すること
ができ、より高品質なオーディオ信号の再生を行うこと
ができるようになる。

【０１１７】また、図１０は、図９の構成を有する逆量
子化部において、逆量子化する段数を３段階で行う際の
オーディオ信号復号化装置の逆量子化部の構成を示す図
であり、図１０において、７０５は第３の逆量子化部で
ある。第３の逆量子化部７０５では、第３の小量子化部
５０３のインデックスを用いて復号化を行う。従って、
第１の低域成分の逆量子化部７０１からの出力ＩＮ
Ｄ₂₁’と、第２の逆量子化部７０４からの出力ＩＮ
Ｄ₃’と、第１の中域成分の逆量子化部７０２からの出
力ＩＮＤ₂₂’と、第３の逆量子化部７０５からの出力Ｉ
ＮＤ₄’との加算値が、逆量子化部１０６の出力として
出力されることになる。ただし、ここでの加算は、量子
化時に、それぞれの小量子化部が量子化した帯域と同じ
帯域に加算していく。

【０１１８】さらに、図１１は、図１０の構成を有する
逆量子化部において、逆量子化を３段階で行う際に、対
象となる帯域を拡大して行うようにしたオーディオ信号
復号化装置の逆量子化部の構成を示す図であり、図１１
において、７０３は第１の高域成分の逆量子化部であ
る。第１の高域成分の逆量子化部７０３では、第１の小
量子化部５０１の高域成分のインデックスを用いて復号
化を行う。第１の低域成分の逆量子化部７０１からの出
力ＩＮＤ₂₁’と、第２の逆量子化部７０４からの出力Ｉ
ＮＤ₃’と、第１の中域成分の逆量子化部７０２からの
出力ＩＮＤ₂₂’と、第３の逆量子化部７０５からの出力
ＩＮＤ₄’と、第１の高域成分の逆量子化部７０３から
の出力ＩＮＤ₂₃’との加算値が、逆量子化部１０６の出
力として出力されることとなる。ただし、ここでの加算
は、量子化時にそれぞれの小量子化部が量子化した帯域
と同じ帯域に加算していく。

【０１１９】なお、本実施の形態４では、復号化部１０
６が、図５の構成を有する量子化部１０５によって量子
化された情報を、逆量子化する場合を例に挙げて説明し
たが、量子化部１０５の構成は、図４や図６に示した構
成でも同様に行うことができる。

【０１２０】また、量子化部として、上記図５に示され
るような構成の量子化部を用いて符号化を行い、その逆
量子化部として、図１１に示すような構成を有する逆量
子化部を用いて復号化する場合には、図１５に示すよう
に、第１の小量子化部の低域のインデックスを逆量子化
した後、次段の第２の小量子化部５０２のインデックス
を逆量子化し、再度第１の小量子化部の中域のインデッ
クスを逆量子化するというように、帯域を拡大するため
の逆量子化と、量子化誤差を低減するための逆量子化と
を交互に繰り返し行うが、図４に示したような構成の量
子化部によって符号化された信号を、図１１に示すよう
な構成を有する逆量子化部を用いて復号化する場合に
は、図４の構成においては、分割された帯域がないの
で、順次、次段の逆量子化部にて量子化された係数を、
復号化する処理を行うことになる。

【０１２１】次に図１および図１４を用いて、上記復号
化装置２を構成する逆量子化部１０６の詳細な動作につ
いて説明する。逆量子化部１０６は、例えば、図７に示
した逆量子化部を有する場合は、第１の低域の逆量子化
部７０１から構成され、図８に示した逆量子化部を有す
る場合は、第１の低域の逆量子化部７０１と、第２の逆
量子化部７０４，の２つの逆量子化部，から構成され
る。

【０１２２】ベクトル逆量子化器１５０１は、符号化装
置１における，ベクトル量子化部１０５からのインデッ
クスＩＮＤ₂を用いてＭＤＣＴ係数の再生を行う。小量
子化部が図７に示した構成を有するものである場合の逆
量子化は、インデックスＩＮＤ₂₁からインデックス番号
を復号化して、その番号のコードベクトルを、コードブ
ック１５０２から選出する。コードブック１５０２は、
符号化装置１におけるコードブックと同様の内容のもの
とする。この選出されたコードベクトルから、再生サブ
ベクトル１５０３が得られ、これは、数１４式の逆過程
で逆量子化されたＭＤＣＴ係数（i,j ）１５０４とな
る。

【０１２３】また、小量子化部が図８に示した構成を有
するものである場合の逆量子化は、インデックスＩＮＤ
₂₁、及びインデックスＩＮＤ₃からインデックス番号k
を復号して、数１９式で算出される番号u のコードベク
トルを、コードブック１５０２から選出する。

【０１２４】

【数１９】

【０１２５】再生サブベクトルは、数２０式を用いて生
成する。

【０１２６】

【数２０】

【０１２７】ここでi 番目の再生サブベクトルのj 番目
の要素はresi(j) とする。次に図１、及び図１２を用い
て、オーディオ信号復号化装置２を構成する逆正規化部
１０７の詳細な構成について説明する。図１２におい
て、１２０１は周波数概形逆正規化部、１２０２は帯域
振幅逆正規化部、１２０３は帯域テーブルである。周波
数概形逆正規化部１２０１は、周波数概形正規化部２０
１からのインデックスＩＮＤ₁₁を入力として、周波数概
形を再生し、逆量子化部１０６からの出力に対して、前
記周波数概形を乗算して出力する。帯域振幅逆正規化部
１２０２では、帯域振幅正規化部２０２からのインデッ
クスＩＮＤ₁₂を入力として、帯域テーブル１２０３に示
された各帯域ごとの振幅値を、乗算により復元する。帯
域振幅正規化部２０２からのインデックスＩＮＤ₁₂を用
いて復元された各帯域ごとの値を、qavej とすると、帯
域振幅逆正規化部１２０２の演算は、数１２式で与えら
れる。

【０１２８】

【数１２】

【０１２９】ここで、周波数概形逆正規化部１２０１の
出力を n＿dct(i)、帯域振幅逆正規化部１２０２の出力
をdct(i)とした。また、帯域テーブル１２０３と図２の
帯域テーブル２０３は同様である。

【０１３０】次に図１６は復号化装置２を構成する周波
数概形逆正規化部１２０１の詳細な構成について説明す
る。図１６において、１３０１は概形逆量子化部、１３
０２は包絡特性逆正規化部である。概形逆量子化部１３
０１では、符号化装置１における概形量子化部３０１か
らのインデックスＩＮＤ₁₃を用いて、周波数概形を表す
パラメータ、例えば、線形予測係数等を復元する。復元
された係数が線形予測係数ならば、例えば、数８式と同
様に算出することにより、量子化された包絡特性Ｅ₁₃を
復元する。復元された係数が線形予測係数でない場合、
例えば、ＬＳＰ係数などの場合も、これを周波数特性に
変換して、包絡特性Ｅ₁₃を復元する。包絡特性逆量子化
部１３０２では、数１３式で示されるように、復元され
た包絡特性Ｅ₁₃と、逆量子化部１０６からの出力ＩＮＤ
₁₆とを乗算して出力とし、帯域振幅逆正規化部１２０１
へ入力する。

【０１３１】

【数１３】

【０１３２】このような本実施の形態４によれば、量子
化手段で量子化する前に、正規化手段を設けて、入力オ
ーディオ信号の正規化を行った後に量子化を行うように
したので、正規化手段と量子化手段とがそれぞれの能力
をフルに発揮した符号化を行って，元オーディオ信号の
もつ情報量を損失することない、量子化誤差の少ない、
量子化効率の良い量子化を行うことができる。また、受
信側での情報量が限られているときには、帯域が狭くて
浅い領域でしか逆量子化を行うことができないが、この
逆量子化を順次、帯域を広くする方向と逆量子化の深さ
を深くする方向とに交互に拡張して、受信側での情報量
を増大していくことにより、符号化装置１から送信され
てくる情報量に関わらず、符号化されたオーディオ信号
の所望の情報量分を復号化することができる。従って、
受信者側での通信環境等に応じて復号する情報量を変化
させるようにすることにより、例えば、通常の公衆電話
網を利用しているような場合においても、安定に高品位
な音質を得ることができるようになる効果が得られる。

【０１３３】実施の形態５．次に図１８を用いて、本発
明の実施の形態５によるオーディオ信号符号化装置につ
いて説明する。本実施の形態５では、符号化装置１にお
ける量子化部１０５の構成のみが上記実施の形態と異な
るので、ここでは量子化部の構成についてのみ説明し、
他の構成については説明を割愛する。

【０１３４】図１８において、１８０１は第１の正規化
部、１８０２は第１の小量子化部、１８０３は第１の量
子化帯域選択部、１８０４は第２の正規化部、１８０５
は第２の小量子化部、１８０６は第２の量子化帯域選択
部、１８０７は第３の正規化部、１８０８は第３の小量
子化部、１８０９は第３の量子化帯域選択部である。実
施の形態３との構成上の差異は、第２，及び第３の正規
化部１８０４，１８０７が付加された点である。

【０１３５】次に本実施の形態５の各構成要素を説明す
る。第１，第２，第３の正規化部１８０１，１８０４，
１８０７は、実施の形態１の正規化部１０４と同じ構成
にて実現できる。また、第１，第２，第３の小量子化部
１８０２，１８０５，１８０８は、実施の形態３の第１
の小量子化部６０１と同じ構成にて実現できる。また、
第１，第２，第３の量子化帯域選択部１８０３，１８０
６，１８０９は、実施の形態３の第１の量子化帯域選択
部６０２と同じ構成にて実現できる。本実施の形態５で
は、正規化部、小量子化部、量子化帯域選択部の３つか
ら成る組み合わせを３セット有する場合について説明す
るが、この組み合わせは３セットでなくてもよく、４セ
ット以上であっても、２セットであってもよい。また、
最終段のセットの量子化帯域選択部は、必ずしも必要が
ない場合もあり、省略することも可能である。

【０１３６】次に、図１８の本実施の形態５による符号
化装置の動作について説明する。図１８において、本実
施の形態５に入力される入力オーディオ信号のＭＤＣＴ
係数は、まず第１の正規化部１８０１で正規化処理を施
し、正規化されたＭＤＣＴ係数を出力する。第１の小量
子化部１８０２では、第１の正規化部１８０１からの出
力信号である正規化されたＭＤＣＴ係数を量子化する。
第１の小量子化部１８０２では、量子化に用いたパラメ
ータをインデックスとして、さらには、この際の量子化
において生じた量子化誤差を、次段の量子化帯域選択部
１８０３に出力する。第１の量子化帯域選択部１８０３
では、第１の小量子化部１８０２の出力を用いて、第２
の小量子化部１８０５においてどの帯域のＭＤＣＴ係数
を量子化すべきかを算出する。

【０１３７】第２の正規化部１８０４では、第１の小量
子化部１８０２の出力であるＭＤＣＴ係数を、第１の量
子化帯域選択部１８０３が帯域選択した結果に基づい
て、その選択した帯域に関して正規化する。第２の小量
子化部１８０５では、第２の正規化部１８０４の出力を
量子化し、この際の量子化に用いたパラメータをインデ
ックスとして出力するとともに、この際の量子化におい
て生じた量子化誤差をも出力する。第２の量子化帯域選
択部１８０６では、第２の小量子化部１８０５の出力を
用いて、第３の小量子化部１８０８においてどの帯域の
ＭＤＣＴ係数を量子化すべきかを算出する。

【０１３８】第３の正規化部１８０７では、第２の小量
子化部１８０５の出力であるＭＤＣＴ係数を、第２の量
子化帯域選択部１８０６が帯域選択した結果に基づい
て、その選択した帯域に関して正規化する。第３の小量
子化部１８０８では、第３の正規化部１８０７の出力を
量子化し、この際の量子化に用いたパラメータをインデ
ックスとして出力するとともに、この際の量子化におい
て生じた量子化誤差をも出力する。

【０１３９】図示する第３の量子化帯域選択部１８０９
は、この後段にさらに第４の小量子化部（図示せず）が
存在する場合に要するものである。もし第４の小量子化
部が存在するならば、この第３の量子化帯域選択部１８
０９は、第３の小量子化部１８０８の出力を用いて、第
４の小量子化部においてどの帯域のＭＤＣＴ係数を量子
化すべきかを算出する。なお、第１，第２，第３の正規
化部１８０１，１８０４，１８０７は、いずれも実施の
形態１の正規化部１０５と同様に、正規化に用いたパラ
メータをインデックスとして出力する。

【０１４０】以下、本実施の形態５の符号化装置の動
作，作用の特徴について、上記実施の形態１〜３の符号
化装置と比較しながら説明する。上記実施の形態１〜３
によるオーディオ信号符号化装置における正規化手段を
有する構成においては、図１９(a) に示すように、時間
軸上の音声信号波形を、ＭＤＣＴ，ＦＦＴにより周波数
軸上の波形に変換し、正規化手段によりその正規化Ａ、
すなわち、概形抽出と、該抽出した概形の振幅値による
除算とを、図２０(a) に示すように該周波数軸上波形の
全周波数範囲について行い、その後、その正規化出力に
対して、上記全周波数範囲を分割した，例えば３つの周
波数領域、即ち低域，中域，高域の各々につき、量子化
x,y,z を行うようにしたもので、これにより、量子化出
力＝Ａ（ｘ＋ｙ＋ｚ）を得る。

【０１４１】これに対し、本実施の形態５は、図２０
(b) に示すように上記分割化した各量子化手段の前段
に、各々正規化手段α，β，γを備え、まず図１９(d)
に示すように、周波数軸上の波形を複数の周波数帯域に
分割した後に、各分割した周波数帯域の各々毎に正規
化，及び量子化を行うようにしたもので、その結果、量
子化出力＝αｘ＋βｙ＋γｚを得るものである。その全
体の様子を、さらに図２１に示している。

【０１４２】一般に、オーディオ信号の周波数特性に非
常にかたよりがある場合、例えば、音声情報のように低
域に集中しているような信号である場合は、これを全体
的におおざっぱに正規化してしまうと、上記低域の特徴
のあるところを重点的に正規化，量子化することができ
ない。すなわち、全体的なおおざっぱな正規化は、信号
変化の細かいところまで信号のエンベロープをとらない
こととなり、該信号変化の細かいところの情報を損失し
てしまうこととなる。従って、このような正規化を行っ
たのち、量子化を行い、ここで量子化器はその自己の能
力をフルに発揮したとしても、信号変化の細かいところ
の情報をひろっていない信号に対して量子化を行なって
いることとなり，あまり意味のない量子化を行ってい
る，いいかえると、正規化，量子化をあわせた効果がで
にくい量子化を行っていることとなる。即ち、正規化手
段を設けるのであれば、正規化手段，量子化手段の両方
が各々の能力をフルに発揮することができるのが望まし
い訳であるが、逆に非常におおざっぱな信号のときに
は、単に全体をおおざっぱに正規化しても、結果はそれ
ほど変わらないものである。

【０１４３】ここで、図２０(a) は、図１に示される正
規化部１０４を有する，上記実施の形態１〜３のオーデ
ィオ信号符号化装置における，正規化手段と、各量子化
手段との関係を示すものであるが、この構成のように、
正規化手段Ａが入力オーディオ信号の周波数特性信号系
列の全体を正規化する構成には、上述したように、入力
オーディオ信号が、例えば低域に集中しているような，
周波数的にかたよりのある信号，の場合には、正規化手
段，量子化手段の両方が各々の能力をフルに発揮するこ
とができる構成ではないと考えられる。

【０１４４】これに対し、図２０(b) に示すように、各
量子化手段x ，y ，z が、その前段に各々正規化手段
α，β，γを備えている，本実施の形態５による構成で
は、各量子化手段が量子化しようとするその対象の信号
毎に、正規化を行うようにしているので、各正規化手段
は、量子化を行おうとする各量子化手段の負荷を考慮し
た最適な正規化，即ち各量子化されるべき信号のレベル
を、各量子化手段がフルにその能力を発揮することので
きるレベルにもってくる正規化，を行うことができ、正
規化手段と量子化手段とを合わせた最大の効果を出すよ
うにすることができるものである。

【０１４５】即ち、本実施の形態５による符号化装置に
おける正規化部，量子化部の構成は、図２０(b) に示す
ように、入力オーディオ信号を周波数変換して得た周波
数特性信号系列、あるいは該周波数特性信号系列の周波
数帯域を分割したある周波数帯域Ａの係数列に対して、
まず、第１段目の正規化手段α，量子化手段x により、
正規化，量子化を行い、かつ、２段目の正規化手段β，
量子化手段y により、上記１段目の周波数帯域Ａの係数
列に対して隣接する周波数帯域Ｂの係数列に対して、正
規化，量子化を行い、さらに、第３段目の正規化手段
γ，量子化手段ｚにより、上記２段目の周波数帯域Ｂの
係数列に対して隣接する周波数帯域Ｃの係数列に対し
て、正規化，量子化を行う構成としたものである。

【０１４６】あるいは、図２０（ｃ）に示すように、
第２段目の正規化手段β，量子化手段yは、上記１段目
の周波数帯域Ａに対して一部重なりをもって隣接する周
波数帯域Ｂにて、その重なり部分では１段目の出力であ
る量子化誤差に対して、その他の部分では上記周波数特
性信号系列の該周波数帯域Ｂの係数列に対して、正規
化，量子化を行う、第３段目の正規化手段γ，量子化手
段z により、上記２段目の周波数帯域Ｂの係数列に対し
て一部重なりをもって隣接する周波数帯域Ｃにて、その
重なり部分では２段目の出力である量子化誤差に対し
て、その他の部分では上記周波数特性信号系列の該周波
数帯域Ｃの係数列に対して、正規化，量子化を行う構成
としたものである。

【０１４７】以上の図２０(b),(c) に示した構成では、
各量子化手段による量子化毎に正規化を行うことによ
り、各正規化手段が、各量子化手段の負荷を考慮した正
規化を行って、各正規化手段，量子化手段がそれらの能
力をフルに発揮した量子化を行うことができ、量子化効
率を大きく向上することができる。なお、図２０(b),
(c) における各段の正規化, 量子化手段の処理する周波
数帯域，及び量子化の深さは、これらの例のものに限ら
れるものではなく、さらに任意に調整することができ
る。

【０１４８】次に、第１段目ないし第３段目の正規化，
量子化手段による，正規化，量子化の手法の一例につい
て、図１８，図２２を用いて説明する。本実施の形態５
では、第１，第２，第３の各正規化部１８０１，１８０
４，１８０７として、上記実施の形態１の正規化部１０
４と同様の構成でも実現可能であるが、正規化のパラメ
ータ算出手法としては、他の手法を用いて実現してもよ
く、例えば、各々の正規化部に入力されるＭＤＣＴ係数
から直接、ＬＰＣ係数やＬＳＰ係数などを算出し、これ
らを正規化のパラメータとして正規化部を構成すること
もできる。図２２において、Ｔ1,Ｔ2,Ｔ3 は各段目の正
規化手段α, β，γがそれぞれ用いる正規化のためのテ
ーブルであり、これらは以下の方法で求める。

【０１４９】即ち、入力オーディオ信号として入力され
る可能性のある種々の音源信号のＭＤＣＴ係数に対し
て、ＬＰＣ（ＬｉｎｅａｒＰｒｅｄｉｃｔｉｖｅＣ
ｏｄｉｎｇ）分析を行い、ＬＳＰ（Line Spectrum Pa
ir) 係数を求める。そして、この動作を音源毎に繰返
し、すべてのフレーム毎にＬＳＰ係数を求める処理を行
い、これらをすべて集めた上で、クラスタ分析をかけ
て、代表的な複数のエンベロープパターンを求め、これ
らを、第１段目の正規化手段αの正規化テーブルＴ1 と
する。

【０１５０】こうして得られた複数のエンベロープパタ
ーンを用いて、１段目の正規化，量子化の処理を行い、
その出力に対して上記と同じＬＰＣ分析からの処理を行
い、上記と同様にして、複数のエンベロープパターンを
求め、これらを、第２段目の正規化手段βの正規化テー
ブルＴ2 とする。

【０１５１】以下、同様にして、第３段目の正規化手段
γの正規化テーブルＴ3 を求める。このようにして、第
１段目ないし第３段目の各量子化手段による量子化とし
て、各量子化手段の負荷を考慮して、正規化と量子化の
それぞれの能力をフルに発揮した最適の量子化を行うこ
とができるようにするための，正規化手段の正規化テー
ブルＴ1,Ｔ2,Ｔ3 を得ることができる。

【０１５２】このような構成のオーディオ信号符号化装
置では、複数種類の種々の音源信号からなるものと考え
ることのできる入力オーディオ信号が、本装置に入力さ
れると、該入力オーディオ信号は、図１９(a) から(b)
に示されるように、時間軸上のデータからＭＤＣＴＦ
ＦＴにより周波数軸上のデータに変換される。そして、
該周波数軸上のデータに変換された信号は、図１９(b)
から(c) に示されるように、その概形抽出が行われる。
このときの概形抽出は、第１段目の正規化手段αの正規
化テーブルＴ1 を用いて行い、結果得られる概形は、例
えば２０個位のＬＳＰの多項式でつくられるものであ
る。そして、得られた概形で上記該周波数軸上のデータ
に変換された信号を除算することにより、正規化αが行
われる。そして、該正規化が行われたのちは、これを量
子化手段x により量子化し、第１段の正規化，量子化が
完了する。これにより、上記複数種類の種々の音源信号
の特徴を考慮した効率のよい量子化を行うことができて
いる。

【０１５３】次に、第２段目の正規化，量子化手段によ
り、第１段目で正規化，量子化の対象とした，周波数特
性信号系列の分割したある周波数領域Ａの係数列，と異
なる周波数領域Ｂの係数列に対して、あるいは上記第１
段目の正規化，量子化の結果である量子化誤差の出力に
対して、上記第２段目の正規化テーブルＴ2 を用いて、
第２段目の正規化，量子化を行う。これにより、やはり
上記複数種類の種々の音源信号の特徴を考慮した，所要
の周波数帯域に重点をおいた、あるいは所要の周波数帯
域部分の量子化の深さに重点をおいた、効率のよい量子
化を行うことができる。

【０１５４】さらに、第２段目の正規化，量子化手段に
より、第１段目，第２段目で正規化，量子化の対象とし
た，周波数特性信号系列の分割した各周波数領域の係数
列と異なる周波数領域の係数列に対して、あるいは上記
第２段目の正規化，量子化の結果である量子化誤差の出
力に対して、第３段目の正規化テーブルＴ3 を用いて、
第３段目の正規化，量子化を行う。これによっても、や
はり上記複数種類の種々の音源信号の特徴を考慮した，
所要の周波数帯域に重点をおいた、あるいは所要の周波
数帯域部分の量子化の深さに重点をおいた、効率のよい
量子化を行うことができる。

【０１５５】このように、上記で説明したような方法で
作成した，正規化テーブルＴ1,Ｔ2,Ｔ3 を用いて、各段
の正規化α，量子化x 、正規化β，量子化y 、正規化
γ，量子化z を行うことにより、量子化されるべき対象
である信号の性質等に応じて、量子化への過度の負担を
軽減するような正規化を行うことができ、量子化効率を
大きく改善することができ、再生側での品質を大きく向
上できるものである。

【０１５６】また、本実施の形態５による符号化装置に
対する、復号化装置の構成は、図２３(b),(c) に示すよ
うに、図２０(b),(c) に示した符号化装置側の構成に対
応して、上記オーディオ信号符号化装置の量子化部の各
量子化器からの信号を受けて、上記周波数特性信号系列
の複数の周波数帯域に分割した各周波数帯域の係数列に
相当する信号を、再生する逆量子化部x ’，y ’，z ’
と、該複数の逆量子化部の各々毎に設けられ、その出力
である周波数特性信号系列の係数列と、上記オーディオ
信号符号化装置の出力である正規化に関する符号をもと
に再生した正規化成分とを乗算して、符号化前の周波数
特性信号系列の各係数列に相当する信号を出力する複数
の逆正規化部α’，β’，γ’と、該複数の各逆正規化
部の出力を受けて、元のオーディオ信号に相当する信号
に出力する逆周波数変換部（図示せず）とを備えたもの
となる。

【０１５７】また、該復号化装置における逆正規化，逆
量子化を、量子化の帯域が広くなる方向と、量子化の深
さが深くなる方向とを交互に行うようにすれば、上記実
施の形態４において説明したのと同様に、符号化装置か
ら送信されてくる情報量に関わらず、符号化されたオー
ディオ信号の所望の情報量分を復号化することができ
る。即ち、受信者側での通信環境等に応じて、復号する
情報量を変化させることができ、例えば、通常の公衆電
話網を利用しているような場合においても、安定に高品
位な音質を得ることができる効果が得られる。

【０１５８】なお、上記実施の形態５において、第１，
第２，第３の量子化帯域選択部１８０３，１８０６，１
８０９の構成は、各々あらかじめ設定しておいた量子化
すべき周波数帯域を出力する構成としても実現可能であ
る。この場合は、第１，第２，第３の量子化帯域選択部
１８０３，１８０６，１８０９では、量子化すべき帯域
を算出する計算を行うことなく、各々あらかじめ設定し
ておいた量子化すべき周波数帯域を出力することとな
り、構成をより簡素化することができる。

【０１５９】また、上記実施の形態５における、第１，
第２，第３の量子化帯域選択部１８０３，１８０６，１
８０９の構成は、人間の聴覚特性に基づいて量子化すべ
き周波数帯域を出力として得るために、静寂時の最小可
聴特性と、ある入力周波数成分によってその近傍の周波
数成分の音が聞こえにくくなるマスキング特性との２つ
の特性を用いて、帯域の選択を行うように構成すること
も可能である。

【０１６０】このような本実施の形態５のオーディオ信
号符号化装置によれば、多段量子化を行う量子化手段の
前段に各々正規化手段を設けて、分割した各周波数毎
に、かつ各段の量子化毎に正規化を行ったのち量子化を
行うようにしたので、周波数領域毎の正規化により各周
波数領域のオーディオ信号のもつ情報量に応じた適切な
符号化を行って、即ち、正規化手段と量子化手段とがそ
れぞれの能力をフルに発揮した符号化を行って，元オー
ディオ信号のもつ情報量を損失することのない、従って
量子化誤差が少なく、量子化効率の良い量子化を行うこ
とができ、安定に高品位な音質を得ることができる。

【０１６１】なお、上記実施の形態１〜５では、上記多
段量子化手段は、上記周波数特性信号系列，またはその
一部をベクトル量子化する第１段目のベクトル量子化器
と、上記第１段目のベクトル量子化器による量子化誤差
成分をベクトル量子化する第２段目のベクトル量子化器
とを、少なくとも、有するとともに、該多段量子化手段
の各段の量子化手段は、上記周波数特性信号系列を，少
なくとも２つ以上の，複数の段間で重複する部分を有し
得る周波数帯域に，各段毎の分割の仕方により分割し
た，複数の周波数帯域のいずれかの帯域の係数列をベク
トル量子化する，少なくとも一つ以上の分割化ベクトル
量子化器を備えたものとしたが、この多段量子化手段の
各段の量子化手段は、上記周波数特性信号系列，または
前段の量子化手段による量子化誤差成分をすべてベクト
ル量子化する全帯域ベクトル量子化器よりなるものであ
ってもよく、これにより、量子化を多段に行って、上記
と同様に、低ビットレート、すなわち高い圧縮率でオー
ディオ信号を符号化した場合であっても、また、固定さ
れた情報量で符号化、及び復号化を行なわなくとも、受
信側において、高品位な音声の再生を行うようにするこ
とができる効果が得られるものである。

【０１６２】

【発明の効果】以上のように、本発明に係るオーディオ
信号符号化装置，オーディオ信号復号化装置，オーディ
オ信号符号化方法，及びオーディオ信号復号化方法によ
れば、量子化にはベクトル量子化の手法を用いるなどし
て高い情報圧縮率においても量子化可能な構成を有する
とともに、量子化時の情報量の配分を、再生帯域の拡張
に寄与する情報量と品質向上に寄与する情報量の両者を
交互に配分していくという構成を採用し、まず符号化装
置においては、第１段階として、入力のオーディオ信号
を周波数領域の信号に変換し、変換された周波数信号の
一部を符号化し、第２段階では、符号化されていない周
波数信号の一部と、第１段階の量子化誤差信号を符号化
して、第１段階の符号に付加し、第３段階では、さらに
符号化されていない周波数信号の一部と、第１段階およ
び第２段階の量子化誤差信号の符号化を行って、第１段
階、第２段階の符号に付加し、同様にさらに段階を重ね
て符号化を行い、一方、復号化装置では、第１段階の符
号化された符号のみを用いて復号を行うことも、第１段
階と第２段階の復号化された符号を用いて復号を行うこ
とも、第１段階から第３段階以上の段階の復号化された
符号を用いて復号を行うことも可能とし、復号化の順
は、帯域拡張に寄与するものと、品質向上に寄与するも
のを交互に復号する構成としたので、固定された情報量
で符号化、及び復号化を行なわなくとも、良好な音質を
得ることができ、また、高い圧縮率にて高品質な音を得
ることができるようになる効果が得られる。

【０１６３】また、本発明に係るオーディオ信号符号化
装置，オーディオ信号復号化装置，オーディオ信号符号
化方法，及びオーディオ信号復号化方法によれば、量子
化手段で量子化する前に、正規化手段を設けて、入力オ
ーディオ信号の正規化を行った後に量子化を行うように
したので、正規化手段と量子化手段とがそれぞれの能力
をフルに発揮した符号化を行って，元オーディオ信号の
もつ情報量を損失することない、量子化誤差の少ない、
量子化効率の良い量子化を行うことができ、オーディオ
信号の種類によってはその効果をより大きく発揮するこ
とができるものである。また、上記で説明したように、
量子化時の情報量の配分を、再生帯域の拡張に寄与する
情報量と品質向上に寄与する情報量の両者を交互に配分
していくという構成を採用することにより、受信側での
情報量が限られているときには、帯域が狭くて浅い領域
でしか逆量子化を行うことができないが、この逆量子化
を順次、帯域を広くする方向と逆量子化の深さを深くす
る方向とに交互に拡張して、受信側での情報量を増大し
ていくことにより、符号化装置から送信されてくる情報
量に関わらず、符号化されたオーディオ信号の所望の情
報量分を復号化することができ、このように、受信者側
での通信環境等に応じて復号する情報量を変化させるよ
うにすることにより、例えば、通常の公衆電話網を利用
しているような場合においても、安定に高品位な音質を
得ることができるようになる効果が得られる。

【０１６４】また、本発明に係るオーディオ信号符号化
装置，オーディオ信号復号化装置，オーディオ信号符号
化方法，及びオーディオ信号復号化方法によれば、多段
量子化を行う量子化手段の前段に各々正規化手段を設け
て、分割した各周波数毎に、かつ各段の量子化毎に正規
化を行ったのち量子化を行うようにしたので、周波数領
域毎の正規化により各周波数領域のオーディオ信号のも
つ情報量に応じた適切な符号化、即ち、正規化手段と量
子化手段とがそれぞれの能力をフルに発揮した符号化を
行って，元オーディオ信号のもつ情報量を損失すること
のない、従って量子化誤差が少なく、量子化効率の良い
量子化を行うことができ、オーディオ信号の種類によっ
てはその効果をより大きく発揮することができるもので
ある。また、復号化側の逆正規化，逆量子化を、量子化
の帯域が広くなる方向と、量子化の深さが深くなる方向
とを交互に行うようにすれば、上記と同様に、符号化装
置から送信されてくる情報量に関わらず、符号化された
オーディオ信号の所望の情報量分を復号化することがで
き、即ち、受信者側での通信環境等に応じて、復号する
情報量を変化させることができ、例えば、通常の公衆電
話網を利用しているような場合においても、安定に高品
位な音質を得ることができる効果が得られる。

【図面の簡単な説明】

【図１】本発明のオーディオ信号符号化装置，オーデ
ィオ信号復号化装置，オーディオ信号符号化方法，及び
オーディオ信号復号化方法の全体的な構成を示す図であ
る。

【図２】上記オーディオ信号符号化装置を構成する正
規化部の一例を示す構成図である。

【図３】上記オーディオ信号符号化装置を構成する周
波数概形正規化部の一例を示す構成図である。

【図４】上記オーディオ信号符号化装置を構成する量
子化部の実施の形態１における構成図である。

【図５】上記オーディオ信号符号化装置を構成する量
子化部の実施の形態２における構成図である。

【図６】上記オーディオ信号符号化装置を構成する量
子化部の実施の形態３における構成図である。

【図７】上記オーディオ信号復号化装置を構成する逆
量子化部の実施の形態４における構成図である。

【図８】上記オーディオ信号復号化装置を構成する逆
量子化部の実施の形態４における構成図である。

【図９】上記オーディオ信号復号化装置を構成する逆
量子化部の実施の形態４における構成図である。

【図１０】上記オーディオ信号復号化装置を構成する
逆量子化部の実施の形態４における構成図である。

【図１１】上記オーディオ信号復号化装置を構成する
逆量子化部の実施の形態４における構成図である。

【図１２】逆正規化部の一実施形態の構成図である。

【図１３】周波数概形逆正規化部の一実施形態の構成
図である。

【図１４】上記符号化装置における量子化部の詳細な
動作を説明するための図である。

【図１５】上記復号化装置における逆量子化部の詳細
な動作を説明するための図である。逆量子化の一実施形
態の構成図である。

【図１６】上記実施の形態４における逆量子化部の逆
量子化手順の動作を説明するための図である。

【図１７】従来のオーディオ信号符号化装置の構成を
示す図である。

【図１８】本発明の実施の形態５によるオーディオ信
号符号化装置における量子化部の構成図である。

【図１９】本発明の実施の形態５によるオーディオ信
号符号化装置の動作の全体を説明するための波形図であ
る。

【図２０】本発明の実施の形態１〜４，及び実施の形
態５によるオーディオ信号符号化装置の動作の全体を説
明するための波形図である。

【図２１】本発明の実施の形態５によるオーディオ信
号符号化装置の動作の全体を説明するための波形図であ
る。

【図２２】本発明の実施の形態５によるオーディオ信
号符号化装置における第１段目ないし第３段目の正規
化，量子化手段による，正規化，量子化の手法の一例を
説明する図である。

【図２３】本発明の実施の形態５によるオーディオ信
号符号化装置に対する、オーディオ信号復号化装置の構
成を説明する図である。

【図２４】従来のオーディオ信号符号化装置の構成を
示す図である。

【符号の説明】

１０１フレーム分割部１０２窓掛け部１０３ＭＤＣＴ部１０４正規化部１０５量子化部１０６逆量子化部１０７逆正規化部１０８逆ＭＤＣＴ部１０９窓掛け部１１０フレーム重ね合わせ部２０１周波数概形正規化部２０２帯域振幅正規化部２０３帯域テーブル３０１線形予測分析部３０２概形量子化部３０３包絡特性正規化部４０１第１の小量子化部４０２第２の小量子化部４０３第３の小量子化部５０１第１の小量子化部５０２第２の小量子化部５０３第３の小量子化部６０１第１の小量子化部６０２第１の量子化帯域選択部６０３第２の小量子化部６０４第２の量子化帯域選択部６０５第３の小量子化部７０１第１の低域成分の逆量子化部７０２第１の中域成分の逆量子化部７０３第１の高域成分の逆量子化部７０４第２の逆量子化部７０５第３の逆量子化部１２０１周波数概形逆正規化部１２０２帯域振幅逆正規化部１２０３帯域テーブル１３０１概形逆量子化部１３０２包絡特性逆量子化部１４０１ある量子化部の量子化する帯域のＭＤＣＴ１４０２量子化する帯域の正規化成分１４０３音源サブベクトル１４０４重みサブベクトル１４０５ベクトル量子化器１４０６距離計算手段１４０７コード決定手段１４０８残差生成手段１４０９コードブック１４１０残差サブベクトル１４１１ある量子化部の量子化する帯域のＭＤＣＴ１５０１ベクトル逆量子化器１５０２コードブック１５０３再生サブベクトル１５０４逆量子化されたＭＤＣＴ１６０１ＦＦＴ１６０２適応ビット割り当ての算出部１６０３サブバンド帯域分割部１６０４スケールファクタによる正規化１６０５スカラー量子化部１８０１第１の正規化部１８０２第１の小量子化部１８０３第１の量子化帯域選択部１８０４第２の正規化部１８０５第２の小量子化部１８０６第２の量子化帯域選択部１８０７第３の正規化部１８０８第３の小量子化部１８０９第３の量子化帯域選択部

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩＧ１０Ｌ 7/04 Ｆ (56)参考文献特開平６−77840（ＪＰ，Ａ) 特開平６−169449（ＪＰ，Ａ) 特開平９−34499（ＪＰ，Ａ) 特開平５−165499（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 19/00 G10L 19/02 H03M 7/30 H04B 14/04

Claims

(57)【特許請求の範囲】

【請求項１】複数の階層の小量子化部を備え、時間−
周波数変換されたオーディオ信号を入力してインデック
ス情報を出力するオーディオ信号符号化装置であって、少なくとも第ｉ階層の小量子化部は、分割された周波数
帯域毎にベクトル量子化による符号化を行う複数の帯域
分割量子化器を備え、第ｉ＋１階層以降の小量子化部は、前階層の一部の帯域
分割量子化器の量子化誤差にベクトル量子化による符号
化を行い、インデックス情報は、各階層の小量子化部により符号化
されたベクトルを示す階層別インデックスを含み、階層別インデックスは、複数の帯域分割量子化器により
周波数帯域が分割された符号化が行われた階層において
は、分割された周波数帯域毎の帯域別インデックスを含
むオーディオ信号符号化装置。
【請求項２】量子化帯域選択部をさらに備え、量子化帯域選択部は、第ｉ＋１階層以降の小量子化部が
符号化を行う一部の帯域分割量子化器を量子化誤差の大
きさに基づいて選出する請求項１に記載のオーディオ信
号符号化装置。
【請求項３】複数の階層の小逆量子化部を備え、イン
デックス情報をオーディオ信号に復号化するオーディオ
信号復号化装置であって、少なくとも第ｉ階層の小逆量子化部は、分割された周波
数帯域毎にベクトル逆量子化による復号化を行う複数の
帯域分割逆量子化器を備え、第ｉ＋１階層以降の小逆量子化部は、前階層の一部の帯
域分割量子化器の量子化誤差にベクトル逆量子化による
復号化を行い、インデックス情報は、階層毎のベクトルを示す階層別イ
ンデックスを含み、階層別インデックスは、周波数帯域が分割された符号化
が行われた階層においては、分割された周波数帯域毎の
帯域別インデックスを含むオーディオ信号復号化装置。
【請求項４】複数の階層の小量子化ステップを備え、
時間−周波数変換されたオーディオ信号をインデックス
情報に変換するオーディオ信号符号化方法であって、少なくとも第ｉ階層の小量子化ステップは、分割された
周波数帯域毎にベクトル量子化による符号化を行う複数
の帯域分割量子化ステップを備え、第ｉ＋１階層以降の小量子化ステップは、前階層の一部
の帯域分割量子化ステップの量子化誤差にベクトル量子
化による符号化を行い、インデックス情報は、各階層の小量子化ステップにより
符号化されたベクトルを示す階層別インデックスを含
み、階層別インデックスは、複数の帯域分割量子化ステップ
により周波数帯域が分割された符号化が行われた階層に
おいては、分割された周波数帯域毎の帯域別インデック
スを含むオーディオ信号符号化方法。
【請求項５】複数の階層の小逆量子化ステップを備
え、インデックス情報をオーディオ信号に復号化するオ
ーディオ信号復号化方法であって、少なくとも第ｉ階層の小逆量子化ステップは、分割され
た周波数帯域毎にベクトル逆量子化による復号化を行う
複数の帯域分割逆量子化ステップを備え、第ｉ＋１階層以降の小逆量子化ステップは、前階層の一
部の帯域分割量子化ステップの量子化誤差にベクトル逆
量子化による復号化を行い、インデックス情報は、各階層のベクトルを示す階層別イ
ンデックスを含み、階層別インデックスは、周波数帯域が分割された符号化
が行われた階層においては、分割された周波数帯域毎の
帯域別インデックスを含むオーディオ信号復号化方法。