JP2004029708A

JP2004029708A - 音声信号に対するベクトル量子化及びデコーディング装置とその方法

Info

Publication number: JP2004029708A
Application number: JP2002376122A
Authority: JP
Inventors: Buei Kin; 金　武　永; Willem Bastiaan Kleijn; ウィレム・バスチャン・クレイン
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2002-05-08
Filing date: 2002-12-26
Publication date: 2004-01-29
Also published as: EP1361567A3; US6631347B1; EP1361567B1; KR20030087373A; DE60232402D1; KR100446630B1; EP1361567A2

Abstract

【課題】音声信号に対するベクトル量子化及びデコーディング装置とその方法を提供する。
【解決手段】ベクトル量子化装置は、コードブック群、ＫＬＴ部、第１及び第２選択部、伝送部を含むベクトル量子化装置で構成される。コードブック群は、ＫＬＴにより得られた音声信号に対するコードベクトルを記憶した複数のコードブックで構成される。コードブックは、ＫＬＴドメイン統計値によって分類される。ＫＬＴ部は入力される音声信号をＫＬＴドメインに変換する。第１選択部は、ＫＬＴにより得られた入力音声信号の共分散マトリックスに対する固有値セットに基づいてコードブックから最適のコードブックを選択する。第２選択部は、選択されたコードブックに載せられている各コードベクトルと、ＫＬＴ部によりＫＬＴドメインに変換された音声信号との歪曲に基づいて最適のコードベクトルを選択する。
【選択図】　図２

Description

【０００１】
【発明の属する技術分野】
本発明は音声信号に対する符号化技術に係り、特に、音声信号に対する高い符号化効率を提供できるベクトル量子化及びデコーディング装置とその方法に関する。
【０００２】
【従来の技術】
音質の低下を抑制できる低ビット率の符号化結果を得るため、スカラ量子化よりも、メモリ、スペース充填及び形態上の利点を有するベクトル量子化が好まれている。
【０００３】
従来公知の音声信号に対するベクトル量子化技術には、音声信号の直接的なベクトル量子化（Ｄｉｒｅｃｔ　Ｖｅｃｔｏｒ　Ｑｕａｎｔｉｚａｔｉｏｎ、以下、ＤＶＱという）と、コード励起線形予測（Ｃｏｄｅ−Ｅｘｃｉｔｅｄ　Ｌｉｎｅａｒ　Ｐｒｅｄｉｃｔｉｏｎ、以下、ＣＥＬＰという）コーディング方式によるベクトル量子化とがある。
【０００４】
前記音声信号の統計値をとってみると、ＤＶＱは最も高いコーディング効率を示すことがわかる。しかし、音声信号の時変信号統計値は、多量のコードブックを要求するため、ＤＶＱの記憶要求管理が困難となる。
【０００５】
ＣＥＬＰは単一コードブックを使用する。したがって、ＣＥＬＰはＤＶＱのように大きい記憶容量が要求されない。ＣＥＬＰアルゴリズムは、入力される音声信号から線形予測（Ｌｉｎｅａｒ　Ｐｒｅｄｉｃｔｉｏｎ、以下、ＬＰという）係数を抽出するステップと、抽出されたＬＰ係数によりフィルタリング特性が決定される合成フィルタを利用して前記コードブックに記憶されているコードベクトルから試験音声信号を構成するステップと、入力される音声信号と最も近接な試験音声信号を有するコードベクトルを探すステップとから構成される。
【０００６】
このようなＣＥＬＰは、２次元である場合にコードブックに記憶されたコードベクトルのボロノイ領域（Ｖｏｒｏｎｏｉ−ｒｅｇｉｏｎ）形態が、図１（ａ）に示すように球形にほとんど近くなる一方、合成フィルタにより構成された試験音声信号は図１（ｂ）に示すように球形のボロノイ領域形態にはならない。したがって、ＣＥＬＰはベクトル量子化の利点であるスペース充填及び形態上の利点を十分に活用できない短所がある。
【０００７】
【発明が解決しようとする課題】
本発明は前述した問題を解決するためのものであって、音声信号を符号化する時、ベクトル量子化の利点を十分に生かすことができるベクトル量子化及びデコーディング装置とその方法を提供することをその目的とする。
【０００８】
本発明の他の目的は、ＫＬＴ（Ｋａｒｈｕｎｅｎ−Ｌｏｅｖｅ　Ｔｒａｎｓｆｏｒｍ）により得られたコードベクトルと固有ベクトルとを利用して音声信号をベクトル量子化することによって、適当な計算及び記憶要求で入力信号を量子化するベクトル量子化及びデコーディング装置とその方法を提供することである。
本発明のまた他の目的は、音声信号に対するボロノイ領域形態が球形にほとんど近い形態を維持するＫＬＴ基盤の分割ベクトル量子化及びデコーディング装置とその方法を提供することである。
【０００９】
【課題を解決するための手段】
前記目的を達成するために本発明は、コードブック群、ＫＬＴ部、第１及び第２選択部、伝送部を含むベクトル量子化装置を提供する。コードブック群にはＫＬＴにより得られた音声信号に対するコードベクトルを記憶したコードブックが複数備わる。前記コードブックはＫＬＴドメイン統計値によって分類される。ＫＬＴ部は入力される音声信号をＫＬＴドメインに変換する。第１選択部は、ＫＬＴにより得られた入力音声信号の共分散マトリックスに対する固有値セットに基づいてコードブックから最適のコードブックを選択する。第２選択部は、選択されたコードブックに載せられている各コードベクトルと、ＫＬＴ部によりＫＬＴドメインに変換された音声信号との歪曲に基づいて最適のコードベクトルを選択する。伝送部は、最適のコードベクトルが入力音声信号に対するベクトル量子化データとして使われるように最適のコードベクトルのインデックスを復号化側に伝送する。
【００１０】
前記コードブックは、音声信号の共分散マトリックスの固有値に基づいた信号クラスと関係があることを特徴とする。前記ＫＬＴ部は次のような動作を遂行する。まず、ＫＬＴ部は入力音声信号のＬＰ係数を計算し、線形予測係数を利用して共分散マトリックスを求め、共分散マトリックスに対する固有値セットを計算し、固有値に相応する固有ベクトルを計算する。その後、ＫＬＴ部は固有値セットに基づいて固有値マトリックスを求め、前記固有ベクトルに基づいて単位マトリックスを求める。その後、ＫＬＴ部は前記単位マトリックスを利用して入力音声信号に対するＫＬＴドメイン表現を得る。
【００１１】
前記第１選択部は、ＫＬＴ部により計算された固有値セットと近似した固有値セットを有するコードブックを選択することが望ましい。前記第２選択部は最小歪曲値を有するコードベクトルを選択し、使われたコードベクトルを最適のコードベクトルとすることを特徴とすることが望ましい。
【００１２】
前記目的を達成するために本発明はまた、音声信号に対するコードベクトルが記憶された複数のコードブックが備わったシステムで前記音声信号に対するベクトル量子化方法を提供する。この方法は、入力音声信号をＫＬＴドメインに変換する。入力音声信号に相当するコードブックは、入力音声信号のＫＬＴによって検出された入力音声信号の共分散マトリックスの固有値セットに基づいて複数のコードブックから選択される。最適のコードベクトルは選択されたコードブックに記憶されている各コードベクトルとＫＬ変換された音声信号との歪曲値に基づいて選択される。選択されたコードベクトルは入力音声信号のベクトル量子化値として使われるように伝送される。
【００１３】
入力音声信号のＫＬＴ基盤変換は次のような段階により遂行される。まず、入力音声信号の線形予測係数を推定する。その後、入力音声信号に対する共分散マトリックスを求め、共分散マトリックスに対する固有値と固有値に対する固有ベクトルを計算する。また、固有ベクトルを利用して音声信号対する単位マトリックスを求める。単位マトリックスを利用して入力音声信号をＫＬＴドメインに変換する。
【００１４】
前記選択されたコードブックは推定された固有値セットと類似した固有値セットに相当するコードブックであることが望ましい。前記最小歪曲を有するコードベクトルは最適のコードベクトルとして選択されることが望ましい。
【００１５】
【発明の実施の形態】
以下、添付した図面を参照して本発明の望ましい実施例について詳細に説明する。
【００１６】
図２は、本発明による音声信号に対するベクトル量子化装置のブロック図である。図２を参照すれば、本発明による音声信号に対するベクトル量子化装置は、コードブック群２００、ＫＬＴ部２１０、コードブッククラス選択部２２０、最適のコードベクトル選択部２３０、データ伝送部２４０で構成される。
【００１７】
コードブック群２００は、訓練段階でＫＬＴのエネルギー集中特性を利用して音声信号に対するＫＬＴドメイン統計値が狭いクラス別にコードブックが分割されるように設計される。
【００１８】
すなわち、音声信号をＫＬＴドメインに変換する場合に、図３（ｂ）に示すように、水平軸に沿ってエネルギーが集中したドメインを得る。図３（ａ）は、各相関係数α_１に対する２次元音声信号に対するコードベクトルの分布図である。図３（ｂ）は、図３（ａ）と同じ相関係数α_１で前記２次元音声信号に相当するＫＬ変換された信号に対するコードベクトルの分布図である。図３（ｂ）で異なる統計値を有する音声信号がＫＬＴドメイン上で同じ統計を有するということが分かる。ＫＬＴドメイン上で同じ統計を有するということは音声信号が同じ固有値セットに分類されうることを意味する。固有値はＫＬＴ領域に変換されたベクトルの成分分散に相応する。
【００１９】
コードブック群２００に備わる第１ないし第ｎコードブック２０１＿１〜２０１＿ｎに相当するｎクラスのうちの一つに音声信号を分割するために距離測定法を使用することができる。これは最も近似した統計値を有する固有値セットをさがせば終わる。
【００２０】
固有値セットは、数式１のような距離測定により分類することができる。
【００２１】
【数１】

【００２２】
すなわち、２次元信号に対するコードベクトルを考慮する場合、一つのコードブックは２つの固有値を有する。ｋ次元信号に対するコードベクトルが考慮される場合には、前記該当するコードブックはｋ個の固有値を有する。前記２つの固有値及びｋ個の固有値を該当する各コードブックの固有値セットという。前述したようにコードブックを固有値セットで分類する時、大きい固有値ほど重要な値となる。
【００２３】
第１ないし第ｎコードブック２０１＿１〜２０１＿ｎに含まれるコードベクトルはＫＬＴドメインに変換された量子化された音声信号である。コードブック分割のために音声信号のエネルギーに該当する固有値は数式２のように正規化される。
【００２４】
【数２】

【００２５】
このように正規化された固有値は、数式１にあてはめられる。
【００２６】
前述したクラス固有値セットは実際的な音声データのＰ次元ＬＰ係数から推定され、数式１のような距離測定機能を有するＬＢＧ（Ｌｉｎｄｅ−Ｂｕｚｏ−Ｇｒａｙ）アルゴリズムを利用して量子化される。前記Ｐは例えば１０になりうる。多くのクラスのコードブックがコードブック群２００に含まれれば、音声信号に対するベクトル量子化装置のＳＮＲ効率はさらに向上する。
【００２７】
ＫＬＴ部２１０は入力される音声信号をＫＬＴドメインに変換する。前記変換はフレーム単位でなされる。このために、ＫＬＴ部２１０はまず、入力される音声信号を分析してＬＰ係数を求める。求められたＬＰ係数はデータ伝送部２４０に伝送される。入力される音声信号のＬＰ係数を求める方式は既知の方式のうち一つを使用する。求められたＬＰ係数を利用して入力信号の共分散マトリックスＥ（ｘ）を求める。５次元である場合に、共分散マトリックスＥ（ｘ）は下記数式３のように定義される。
【００２８】
【数３】

【００２９】
したがってＬＰ係数を利用して共分散マトリックスＥ（ｘ）を求めることができる。
【００３０】
その後、ＫＬＴ部２１０は共分散マトリックスＥ（ｘ）に対する固有値λ_ｉは数式４を利用して求め、固有ベクトルＰ_ｉは数式５を利用して求める。
【００３１】
【数４】

【００３２】
【数５】

【００３３】
数式４でＩは識別子マトリックスである。このマトリックスは対角線行列値が全部１であり、残りは全部０であるマトリックスである。数式５を満たす固有ベクトルは正規化して求める。
【００３４】
共分散マトリックスＥ（ｘ）の順に並べた固有値を配列することによってマトリックスＤ（Ｄ＝［　λ_１，λ_２，．．．，λ_ｋ］　）を得る。マトリックスＤはコードブッククラス選択部２２０に出力される。
【００３５】
一方、ＫＬＴ部２１０は求めた固有ベクトルを利用して単位マトリックス（ｕｎｉｔａｒｙ　ｍａｔｒｉｘ）Ｕを数式６のように求める。
【００３６】
【数６】

【００３７】
数式６でＰ_１、Ｐ_２、Ｐ_ｋはｋ×１マトリックスである。
【００３８】
Ｕ^Ｔを入力される音声信号ｓ^ｋに乗算（Ｕ^Ｔｓ^ｋ）して入力された音声信号をＫＬＴドメインに変換する。ここでｓ^ｋはＬＰ合成フィルタのｋ次元ゼロ状態応答（ｋ−ｄｉｍｅｎｓｉｏｎａｌ　ｚｅｒｏ　ｓｔａｔｅ　ｒｅｓｐｏｎｓｅ，ＺＳＲ）であるか、あるいはｋ次原音である。ＫＬＴドメインに変換された音声信号は最適のコードベクトル選択部２３０に提供される。前記Ｕ^ＴでＴは転置である。ｓ^ｋは音声信号のｋ次元ベクトルである。
【００３９】
コードブッククラス選択部２２０は、ＫＬＴ部２１０から受信されたマトリックスＤに基づいて第１ないし第ｎコードブック２０１＿１〜２０１＿ｎのうち該当するコードブックを選択する。すなわち、数式１によってＫＬＴ部２１０から受信されたマトリックスＤと最も近似した固有値（または固有値セット）を有する一つのコードブックを選択する。選択されたコードブックが第１コードブック２０１＿１である場合に第１コードブック２０１＿１に存在するコードベクトルは順次に最適のコードベクトル選択部２３０に出力される。この時、コードブッククラス選択部２２０に、ＫＬＴ部２１０からマトリックスＤが伝送されるのではなく固有値が伝送されるように構成された場合、コードブッククラス選択部２２０は、数式１により最適のコードブックを選択することができる。
【００４０】
最適のコードベクトル選択部２３０は、数式７のようにＫＬＴ部２１０から受信されたＵ^Ｔｓ^ｋとコードブッククラス選択部２２０から受信された各コードベクトルとの歪曲を計算する。
【００４１】
【数７】

【００４２】
計算された歪曲値に基づいて、最適のコードベクトル選択部２３０は最小歪曲を有する最適のコードベクトルを抽出する。最適のコードベクトル選択部２３０は選択されたコードベクトルのインデックス情報をデータ伝送部２４０に伝送する。
【００４３】
データ伝送部２４０は、ＫＬＴ部２１０から伝送されるフレーム単位のＬＰ係数と選択されたコードベクトルのインデックス情報とを図４に示すデコーディング装置を含む復号化装置側に伝送する。
【００４４】
図４を参照すれば、図２に示すベクトル量子化装置に対応する復号化装置はデータ検出部４０１、コードブック群４１０、逆ＫＬＴ部４２０で構成される。
【００４５】
データ検出部４０１は、図２に示すようなベクトル量子化装置を具備した符号化装置から受信されるデータでコードベクトルのインデックス情報を検出し、数式３ないし数式６を利用して受信されたＬＰ係数からマトリックスＤと単位マトリックスＵとを得る。検出されたコードベクトルのインデックス情報とマトリックスＤはコードブック群４１０に伝送される。単位マトリックスＵは逆ＫＬＰ部４２０に伝送する。
【００４６】
コードブック群４１０は受信されたマトリックスＤにより該当するコードブッククラスを選択し、受信されたコードベクトルのインデックス情報により選択されたコードブッククラスで最適のコードベクトルを検出する。コードブック群４１０は図２のコードブック群２００と同じコードブックで構成され、マトリックスＤとコードベクトルのインデックス情報に該当する最適のコードベクトルを逆ＫＬＴ部４２０に伝送する。
【００４７】
逆ＫＬＴ部４２０は、データ検出部４０１から受信された単位マトリックスＵとコードブック群４１０から伝送されるコードベクトルとを利用して、ＫＬＴ部２１０での変換と逆方式にコードベクトルを変換して選択されたコードベクトルに対応する元の音声信号を復元する。すなわち、コードブックベクトルはＵと乗算されて元の音声信号を復元する。
【００４８】
前述したベクトル量子化装置とデコーディング装置は、符号化装置及び復号化装置が一つのシステムになっている環境では一つのシステム内に存在しうる。
図５は、本発明による音声信号に対するＫＬＴ基盤分割ベクトル量子化方法の動作フローチャートである。
【００４９】
図５を参照すれば、第５０１段階で、音声信号の入力が検知されると、第５０２段階で、入力された音声信号に対するＬＰ係数を推定する。ＬＰ係数はフレーム単位で推定される。次に、第５０３段階で、入力された音声信号の共分散行列Ｅ（ｘ）を数式３のように求める。さらに、第５０４段階で、求められた共分散行列Ｅ（ｘ）を利用して入力される音声信号に対する固有値を求め、求められた固有値で固有ベクトルを求める。
【００５０】
第５０５段階では、前記固有値を利用してマトリックスＤを求め、前記固有ベクトルを利用してマトリックスＵを求める。マトリックスＤとマトリックスＵとを求める方式は図２のＫＬＴ部２１０で説明した通りである。第５０６段階で前記マトリックスＵを利用して入力される音声信号をＫＬＴドメインに変換する。前述した第５０２段階ないし第５０６段階は、入力される音声信号をＫＬＴドメインに変換する段階と定義することができる。
【００５１】
第５０７段階では、固有値で構成されたマトリックスＤを利用して複数のコードブックで該当するコードブックを選択する。複数のコードブックは、図２のコードブック群２００で説明したようにＫＬＴドメインに変換された音声信号に基づいて分割されたものである。
【００５２】
第５０８段階では、選択されたコードブックに含まれているコードベクトルと、前述した第５０２段階ないし第５０６段階を通じてＫＬＴされた音声信号Ｕ^Ｔｓ^ｋとを数式７に代入して最適のコードベクトルを選択する。最適のコードベクトルは数式７による演算結果、最小値を有するコードベクトルとなる。
【００５３】
第５０９段階で、前記選択されたコードベクトルのインデックス情報と第５０２段階で推定されたＬＰ係数とを入力される音声信号に対するベクトル量子化結果値に伝送する。第５０１段階で入力信号がないと判断されれば、前述した過程は遂行されない。
【００５４】
復号化は、第５０９段階でデコーダに伝送されたコードベクトルのインデックス情報とＬＰ係数とを復号化し、復号化されたデータを逆ＫＬＴして音声信号を復元する。
【００５５】
前述した図５は、前述した図２のようにマトリックスＤを利用して最適のコードブッククラスを選択する例である。最適のコードブッククラスはマトリックスＤの固有値と数式１とを利用して選択される。
【００５６】
前述した実施例は音声信号に対するベクトル量子化された結果としてＬＰ係数とコードベクトルのインデックス情報とを共に伝送する場合である。しかし、ＬＰ係数を伝送せずにコードベクトルのインデックス情報だけ伝送されるように構成することもできる。ＩＴＵ−Ｔ標準コーデックであるＧ．７２８で使われた逆適応ＬＰ係数推定と類似した逆適応方法を適用する場合に、符号化及び復号化側で直前のフレームで量子化した音声信号でもって現在フレームのスペクトル特性を示すＬＰ係数を推定することによって、符号化側から復号化側にパラメータを伝送する必要がない。このようなＬＰ推定は音声スペクトル特性が徐々に変わるために可能である。
【００５７】
もし、符号化側から復号化側にＬＰ係数を伝送しない場合に、図４のデータ検出部４０１に印加されるＬＰ係数は符号化側から受信されたことではなく、復号化側で前述した逆適応方法に推定されたＬＰ係数となる。
【００５８】
【発明の効果】
本発明により提案されたＫＬＴに基づいて分類されたベクトル量子化（Ｃｌａｓｓｉｆｉｅｄ　Ｖｅｃｔｏｒ　Ｑｕａｎｔｉｚａｔｉｏｎ；ＣＶＱ）はボロノイ領域がＫＬＴにより影響されないためにスペース充填上の利点を提供できる。各コードブックがＫＬＴ領域統計値の狭いクラスに基づいて設計されたため、メモリ及び形態上の利点を提供できる。したがって、ＫＬＴ−ＣＶＱはＣＥＬＰ及びＤＶＱより高いＳＮＲを提供できる。
【００５９】
本発明はＫＬＴがボロノイ領域形態を変化させないために入力信号をＫＬＴドメインに変換して最適のコードベクトルを探す。この過程はコードブックサーチ期間中にコードベクトルの付加的なＬＰ合成フィルタリング計算が要らないために、ＫＬＴ−ＣＶＱはＤＶＱと計算上の複雑性が類似したコードブックサーチをするが、ＣＥＬＰよりは計算上の複雑性が低い。
【００６０】
本発明は、ＫＬＴが最も小さな固有値軸に対して相対的に低い分散を招くためにコードブックを記憶するために要求されるメモリを減らしうり、適切なコードベクトルを探すための検索の複雑性を低めうる。このような利点は高い固有値を有するサブセット次元だけを考慮することによって得られる。例えば、５次元ベクトルに対して４つの最も大きい固有値軸を使用することによって、あらゆる軸の使用と相応する性能を得られる。したがって、ＫＬＴのエネルギー集中特性を利用することによって、メモリ要求量及び検索複雑性を低減することができる。
【００６１】
本発明は前述した実施例に限定されず、本発明の思想内で当業者による変形が可能である。したがって、本発明で権利を請求する範囲は詳細な説明の範囲内で決められることではなく特許請求の範囲内で決められる。
【図面の簡単な説明】
【図１】（ａ）は、残留ドメインでＣＥＬＰコードブック例のボロノイ領域形態を示した図面であり、（ｂ）は、音声ドメインでＣＥＬＰコードブックに相当するボロノイ領域形態を示した図面である。
【図２】本発明によるベクトル量子化装置のブロック図である。
【図３】（ａ）及び（ｂ）は、ＫＬＴ特性を説明するためのボロノイ領域例である。
【図４】図２のベクトル量子化装置に対応するデコーディング装置のブロック図である。
【図５】本発明によるベクトル量子化方法の動作フローチャートである。
【符号の説明】
２００　　コードブック群
２１０　　ＫＬＴ部
２２０　　コードブッククラス選択部
２３０　　最適のコードベクトル選択部
２４０　　データ伝送部

Claims

音声信号に対するベクトル量子化装置において、
ＫＬＴにより得られた音声信号に対するコードベクトルを記憶したコードブックを前記音声信号のＫＬＴドメイン統計値によって複数に分割して具備するコードブック群と、
入力される音声信号をＫＬＴドメインに変換するＫＬＴ部と、
前記ＫＬＴ部でＫＬＴにより得られた前記入力される音声信号に対する固有値に基づいて前記コードブック群で最適のコードブックを選択する第１選択部と、
前記第１選択部で選択されたコードブックに載せられているコードベクトルと、前記ＫＬＴ部でＫＬＴドメインに変換された音声信号との間の歪曲に基づいて最適のコードベクトルを選択する第２選択部と、
前記最適のコードベクトルのインデックスを前記入力される音声信号に対するベクトル量子化情報として伝送する伝送部とを含むベクトル量子化装置。
前記各コードブックは、音声信号の共分散マトリックスの固有値の信号クラスと関係があることを特徴とする請求項１に記載のベクトル量子化装置。
前記ＫＬＴ部は、
前記入力される音声信号のＬＰ係数を求め、
前記線形予測係数に基づいて共分散マトリックスを求め、
前記共分散マトリックスの固有値を計算し、
前記固有値に相応する固有ベクトルセットを求め、
前記固有ベクトルセットに基づいて単位マトリックスを求め、
求められた単位マトリックスを利用して入力される音声信号に対応するＫＬＴドメイン表現を得るように構成されることを特徴とする請求項１に記載のベクトル量子化装置。
前記第１選択部は下記数式に基づいて前記最適のコードブックを選択することを特徴とする請求項１に記載のベクトル量子化装置。
前記第１選択部は、前記ＫＬＴ部により計算された固有値セットと近似した固有値セットが割当てられたコードブックを前記最適のコードブックに選択することを特徴とする請求項１に記載のベクトル量子化装置。
前記第２選択部は、最小歪曲値を有するコードベクトルが最適のコードベクトルになるように選択することを特徴とする請求項１に記載のベクトル量子化装置。
前記第２選択部は下記数式に基づいて前記歪曲を検出することを特徴とする、請求項１に記載のベクトル量子化装置。
前記伝送部は前記入力される音声信号に対するベクトル量子化情報としてＬＰ係数のインデックス及び選択されたコードベクトルのインデックスデータを伝送することを特徴とする請求項１に記載のベクトル量子化装置。
前記コードブックの次元はＫＬＴのエネルギー集中特性を使用してサブセット次元に減らしうる請求項１に記載のベクトル量子化装置。
前記ベクトル量子化装置が以前フレームで量子化した音声信号でもって現在フレームのスペクトル特性を示すＬＰ係数を推定するように構成された場合に、前記伝送部が音声信号に対するベクトル量子化情報としてＬＰ係数を伝送しないように構成されることを特徴とする請求項１に記載のベクトル量子化装置。
音声信号に対するコードベクトルが記憶された複数のコードブックが備わったシステムで前記音声信号に対するベクトル量子化方法において、
入力される音声信号をＫＬＴドメインに変換する段階と、
前記ＫＬＴドメインに変換するによって推定された、前記入力される音声信号に対する固有値セットに基づいて前記複数のコードブックで最適のコードブックを選択する段階と、
選択されたコードブックに記憶されているコードベクトルと、ＫＬＴドメインに変換された音声信号との歪曲値に基づいて最適のコードベクトルを選択する段階と、
選択されたコードベクトルのインデックスを前記入力される音声信号に対応するベクトル量子化値として伝送する段階とを含むベクトル量子化方法。
前記変換段階は、
前記入力される音声信号に対する線形予測係数を推定する段階と、
前記入力される音声信号に対する共分散マトリックスを求める段階と、
前記共分散マトリックスに対する固有値セットを求める段階と、
前記固有値セットに対する固有ベクトルセットを求める段階と、
前記固有ベクトルセットを利用して前記音声信号に対応する単位マトリックスを求める段階と、
前記単位マトリックスを利用して前記入力される音声信号をＫＬＴドメインに変換する段階とを含む請求項１１に記載のベクトル量子化方法。
前記コードブック選択段階は、前記固有値セットと近似した固有値セットと関係があるコードブックを最適のコードブックに選択する請求項１１に記載のベクトル量子化方法。
前記最適のコードベクトル選択段階は、前記歪曲が最小値であるコードベクトルを

を使用して前記最適のコードベクトルに選択する請求項１１に記載のベクトル量子化方法。
前記コードブックの次元はＫＬＴのエネルギー集中特性を使用してサブセットの次元に減らしうる請求項１１に記載のベクトル量子化方法。
前記線形予測係数推定段階が以前フレームで量子化した音声信号を利用して現在フレームのスペクトル特性を示す線形予測係数を推定する場合に、前記伝送段階で前記音声信号に対するベクトル量子化情報としてＬＰ係数を伝送しないことを特徴とする請求項１２に記載のベクトル量子化方法。
音声信号に対するデコーディング装置において、
ＫＬＴにより得られた音声信号に対するコードベクトルを記憶したコードブックを前記ＫＬＴドメイン統計値によって複数に分割して具備するコードブック群と、
受信されるデータを分析して前記コードベクトルのインデックスを検出し、現在フレームのスペクトル特性を示す線形予測係数に基づいて固有値セットと単位マトリックスＵを各々検出し、検出されたコードベクトルのインデックスと固有値セットは前記コードブック群に出力するデータ検出部と、
前記データ検出部から出力される単位マトリックスと前記コードベクトルのインデックスにより前記コードブック群から出力されるコードベクトルを利用した逆ＫＬＴで前記コードベクトルに対応する音声信号を復元する逆ＫＬＴ部とを含むデコーディング装置。
音声信号に対するデコーディング方法において、
ＫＬＴにより得られた音声信号に対するコードベクトルを記憶した複数のコードブックを有するコードブック群を形成し、前記コードブックは前記ＫＬＴドメイン通計値によって分類される段階と、
受信されるデータからコードベクトルインデックスを検出し、現在フレームのスペクトル特性を示す線形予測係数から固有値セットと単位マトリックスＵとを各々検出し、検出されたベクトルのインデックスと固有値セットは前記コードブック群に出力する段階と、
前記データ検出部から出力される単位マトリックスＵと前記コードブック群から受信された前記コードベクトルインデックスから検出されたコードベクトルを用いて逆ＫＬＴ動作を行って前記検出されたコードベクトルに対応する音声信号を復元する段階とを含むデコーディング方法。
前記伝送段階はＬＰ係数のインデックスと前記選択されたコードベクトルのインデックスデータを前記ベクトル量子化値として伝送する請求項１１に記載のベクトル量子化方法。