JP2014501395A

JP2014501395A - 階層型符号器における改良ステージの改良符号化

Info

Publication number: JP2014501395A
Application number: JP2013543859A
Authority: JP
Inventors: バラーツ・コヴシ; ステファン・ラゴ; アラン・ル・ギヤデール
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 2010-12-16
Filing date: 2011-12-13
Publication date: 2014-01-20
Anticipated expiration: 2031-12-13
Also published as: FR2969360A1; WO2012080649A1; US20130268268A1; CN103370740A; EP2652735A1; CN103370740B; JP5923517B2; KR20140005201A; EP2652735B1

Abstract

本発明は、“Ｂ”ビットを有するコア符号化ステージと、少なくとも１つの現在の改良符号化ステージｋを備える階層型符号器においてデジタル音声入力信号を符号化する方法であって、先行する埋め込み符号器のインデックスを形成するように連結された量子化インデックスを配信する方法に関係がある。その方法は、それが下記の、現在のステージｋのみの絶対再構成レベル及び先行する埋め込み符号器のインデックスに基づいて、現在の改良ステージｋに関する考えられる量子化値を獲得するステップと、考えられる量子化値のうちの１つに対応する、ステージｋに関する量子化インデックス、及び量子化信号を形成するように、考えられる量子化値に基づいて、知覚の重み付け処理を受けたまたは受けていない階層型符号器の入力信号またはを量子化するステップとを含むようなものである。本発明は、更に説明されたような符号化方法を実施する階層型符号器と関係がある。

Description

本発明は、デジタル信号の符号化の分野に関係する。

本発明に基づいた符号化は、特に音声周波数信号（発話、音楽等）のようなデジタル信号の伝送及び／または保存用に適合される。

本発明は、更に特に、ＰＣＭ（Pulse Code Modulation）符号化のような波形符号化、もしくは、ＡＤＰＣＭ（Adaptive Differential Pulse Code Modulation）符号化タイプの適応波形符号化に関係がある。本発明は、特にスケーラブルバイナリ列の量子化インデックスを配信することを可能にする埋め込みコード符号化（embedded-code coding）に関係がある。

ＩＴＵ−Ｔ勧告Ｇ．７２２またはＩＴＵ−Ｔ勧告Ｇ．７２７によって指定された埋め込みコードＡＤＰＣＭ符号化／復号化の一般原則は、例えば、図１及び図２を参照して説明されるようなものである。

図１は、従って、サンプルごとに“Ｂ”ビットと“Ｂ＋Ｋ”ビットとの間で動作するＡＤＰＣＭタイプ（例えば、Ｇ．７２２低帯域、Ｇ．７２７）の埋め込みコード符号器を表す。非スケーラブルＡＤＰＣＭ符号化（例えばＧ．７２６、Ｇ．７２２高帯域）の場合がＫ＝０に対応することに注意が必要である。ここで、“Ｂ”は、様々な考えられるビットレートの中から選択され得る一定値である。

それは、
−“ｖ（ｎ’）”が量子化倍率（quantization scale factor）である量子化された誤差信号の前のサンプル

、及び、“ｎ”が現在の時点である再構成された信号の前のサンプル

に基づいて、信号の予測値

を与えることを可能にする予測モジュール１１０と、
−“ｅ（ｎ）”と表示される予測誤差信号を獲得するために、入力信号“ｘ（ｎ）”からその予測値

を差し引く減算モジュール１２０と、
−“Ｂ＋Ｋ”ビットから成る量子化インデックス“Ｉ^Ｂ＋Ｋ（ｎ）”を与えるために誤差信号“ｅ（ｎ）”を入力として受け取る、誤差信号のための量子化モジュール１３０“Ｑ^Ｂ＋Ｋ”とを備える。量子化モジュール“Ｑ^Ｂ＋Ｋ”は、埋め込みコードタイプの量子化モジュールであり、すなわち、それは、“Ｂ”ビットを有する“コア”量子化器と、“コア”量子化器に埋め込まれた“Ｂ＋ｋ（ｋ＝１，．．．，Ｋ）”ビットを有する量子化器を含む。

ＩＴＵ−ＴＧ．７２２標準の低帯域の符号化の場合は、“Ｂ＝４”及び“Ｋ＝０、１、及び２”における量子化器“Ｑ^Ｂ”、“Ｑ^Ｂ＋１”、“Ｑ^Ｂ＋２”の判定レベル及び再構成レベル（reconstruction level：復元レベル）は、“X. Maitre”によるＧ．７２２標準を説明する概説の論文、すなわち「“7 kHz audio coding within 64 kbit/s”、“IEEE Journal on Selected Areas in Communication”、第６巻、第２号、１９８８年２月」のテーブルＩＶ及びテーブルＶＩによって定義される。

量子化モジュール“Ｑ^Ｂ＋Ｋ”の出力における“Ｂ＋Ｋ”ビットの量子化インデックス“Ｉ^Ｂ＋Ｋ（ｎ）”は、例えば図２を参照して説明されるように、データ伝送路１４０を介して復号器に送られる。

符号器は、更に、
−“Ｂ”ビットの低ビットレートインデックス“Ｉ^Ｂ（ｎ）”を与えるために、インデックス“Ｉ^Ｂ＋Ｋ（ｎ）”の“Ｋ”個の低位のビットを削除するためのモジュール１５０と、
−出力において、“Ｂ”ビットの量子化された誤差信号

を与えるための逆量子化モジュール１２１“（Ｑ^Ｂ）^−１”と、
−次の時点に対して倍率とも呼ばれるレベル制御パラメータ“ｖ（ｎ）”を与えるために、量子化器及び逆量子化器を適応させるためのモジュール１７０“Ｑ_{Ａｄａｐｔ}”と、
−低ビットレートの再構成された信号“ｒ^Ｂ（ｎ）”を与えるために、予測値

を量子化された誤差信号に加算するためのモジュール１８０と、
−“Ｂ”ビットの量子化された誤差信号

、及び“１＋Ｐ_ｚ（ｚ）”によってフィルタ処理された信号

に基づいて、予測モジュールを適応させるためのモジュール１９０“Ｐ_{Ａｄａｐｔ}”とを備える。

図１における、符号１５５で参照された破線部分が、低ビットレートのローカルな復号器を表すと共に、それは、予測器（predictor）１６５及び１７５、そして逆量子化器１２１を含むことが注目され得る。このローカルな復号器は、従って、低ビットレートインデックス“Ｉ^Ｂ（ｎ）”に基づいて符号１７０における逆量子化器を適応させることを可能にすると共に、再構成された低ビットレートデータに基づいて予測器（predictor）１６５及び１７５を適応させることを可能にする。

この部分は、例えば図２を参照して説明されたような埋め込みコードＡＤＰＣＭ復号器において全く同じに発見される。

図２の埋め込みコードＡＤＰＣＭ復号器は、入力として、バイナリエラーによって恐らくは妨害される“Ｉ^Ｂ＋Ｋ”のバージョンである、通信チャネル１４０に起因するインデックス“Ｉ^’Ｂ＋Ｋ”を受け取り、信号

を獲得するために、ビットレートがサンプル当たりＢビットである逆量子化モジュール２１０“（Ｑ^Ｂ）^−１”によって逆量子化を実行する。記号“ ’ ”は、受け取られたビットに基づいて復号化された値を示すと共に、それは、伝送エラーのために、符号器によって使用されたビットとは恐らくは異なる。

“Ｂ”ビットに対する出力信号“ｒ’^Ｂ（ｎ）”は、信号の予測値と“Ｂ”ビットを有する逆量子化器の出力の和に等しくなるであろう。復号器のこの部分（part：パート）２５５は、図１の低ビットレートローカル復号器１５５と同じである。

モードビットレートインジケータ及びセレクタ２２０を使用して、復号器は、復元された信号を向上させ得る。

実際には、もし“Ｂ＋１”ビットが受け取られたことをモードが示すならば、その場合に、出力は、信号の予測値

と“Ｂ＋１”ビットを有する逆量子化器２３０の出力

の和に等しくなるであろう。

もし“Ｂ＋２”ビットが受け取られたことをモードが示すならば、出力は、信号の予測値

と“Ｂ＋２”ビットを有する逆量子化器２４０の出力

の和に等しくなるであろう。

それは、ｚ変換表記法（z-transform notation）を使用することによって、ループ構造“Ｒ^Ｂ＋ｋ（ｚ）＝Ｘ（Ｚ）＋Ｑ^Ｂ＋ｋ（ｚ）”のように書くことができ、ここで、“Ｂ＋ｋ”ビットを有する量子化雑音“Ｑ^Ｂ＋ｋ（ｚ）”は、

によって定義される。

ＩＴＵ−Ｔ標準Ｇ．７２２（以下ではＧ．７２２と指定される）の埋め込みコードＡＤＰＣＭ符号化は、「５０〜７０００［Ｈｚ］」の最小帯域幅によって定義されると共に、１６［ｋＨｚ］でサンプリングされる広帯域において、信号の符号化を実行する。Ｇ．７２２符号化は、２つの信号サブ帯域「０〜４０００［Ｈｚ］」及び「４０００〜８０００［Ｈｚ］」の各々のＡＤＰＣＭ符号化であり、直交ミラーフィルタ（quadrature mirror filter）による信号分解によって獲得される。高域がサンプル当たり２ビットのＡＤＰＣＭ符号器によって符号化される一方、低域は、埋め込みコードＡＤＰＣＭ符号化によってサンプル当たり６、５、及び４ビットで符号化される。全体のビットレートは、低域の復号化のために使用されるビットの数に従って、６４、５６、または４８［ビット／ｓ］になるであろう。

この符号化は、最初にＩＳＤＮ（Integrated Services Digital Network）における使用のために開発された。それは、ＩＰネットワーク上の「ＨＤヴォイス（HD voice：高音質（ＨＤ）音声」と称される改良された品質の電話通信アプリケーションに最近展開された。

多数のレベルを有する量子化器に関して、量子化雑音のスペクトルは比較的平らであろう。しかしながら、信号が低いエネルギーを有する周波数ゾーンにおいて、雑音は、信号に匹敵するレベル、または実際には信号より大きいレベルを有し、従って、もはや必ずしもマスクされるとは限らない。その場合に、それは、これらの領域で聞こえる状態になるかもしれない。

符号化雑音の整形（shaping：成形）が、従って必要である。Ｇ．７２２のような符号器では、埋め込みコード符号化に適応した符号化雑音整形が更に望ましい。

一般的に、符号化雑音を整形することの目的は、スペクトル包絡線が短期間のマスキングしきい値に従う量子化雑音を獲得することであり、この原理は、多くの場合、雑音のスペクトルがおおよそ信号のスペクトルに追随すると共に、信号のエネルギーがより低いゾーンにおいてさえもその雑音が聞き取れないままであるようにより均一の信号対雑音比を保証するために、単純化される。

埋め込みコードＰＣＭ（パルス符号変調）タイプのための雑音整形技術は、ＩＴＵ−Ｔ勧告Ｇ．７１１．１“Wideband embedded extension for G.711 pulse code modulation”、または、“Y. Hiwasaki”、“S. Sasaki”、“H. Ohmuro”、“T. Mori”、“J. Seong”、“M. S. Lee”、“B. Kovesi”、“S. Ragot”、“J.-L. Garcia”、“C. Marro”、“L. Miao”、“J. Xu”、“V. Malenovsky”、“J. Lapierre”、“R. Lefebvre”、“G.711.1: A wideband extension to ITU-T G.711”、EUSIPCO、Lausanne、２００８年において説明されている。

この勧告は、従って、コアビットレート符号化のための符号化雑音の整形を伴う符号化を説明する。符号化雑音を整形するための知覚フィルタは、逆コア量子化器から生じる過去の復号化された信号に基づいて計算される。コアビットレートローカル復号器は、従って雑音整形フィルタを計算することを可能にする。このように、復号器で、コアビットレート復号化信号（core bitrate decoded signal）に基づいて、この雑音整形フィルタを計算することが可能である。

改良ビットを配信する量子化器が、符号器で使用される。

コアバイナリストリーム及び改良ビットを受け取る復号器は、コアビットレート復号化信号に基づいて、符号器における方法と同じ方法で、符号化雑音を整形するためのフィルタを計算すると共に、このフィルタを改良ビット逆量子化器の出力信号に適用し、フィルタ処理された信号を復号化されたコア信号に加えることによって、整形された高いビットレート信号が獲得される。

雑音の整形は、従って、コアビットレート信号の知覚の品質を改良する。それは、改良されたビットに関する品質において、限られた改良を提供する。実際には、符号化雑音の整形は、改良ビットの符号化に対しては実行されず、量子化器の入力は、改良された量子化に関しては、コア量子化のための入力と同じである。

改良ビットがコアビットに加えて復号化されるとき、復号器は、その場合に、適当なフィルタ処理によって、結果として生じる不要な成分を削除しなければならない。

復号器におけるフィルタの追加の計算は、復号器の複雑さを増大させる。

この技術は、Ｇ．７２２及びＧ．７２７復号器タイプの既に存在する標準のスケーラブルデコーダには使用されない。従って、現存する標準のスケーラブルデコーダと互換性がある状態を維持する一方、どのようなビットレートであっても信号の品質を改良する必要性が存在する。

復号器で補足的信号処理を行うことを必要としない解決法が、特許出願ＷＯ２０１０／０５８１１７号において説明される。この出願において、復号器で受け取られた信号は、コアビットレート信号及び埋め込みビットレート信号を、雑音または修正項（corrective term）を整形するためのあらゆる計算を必要とせずに、復号化することができる標準の復号器によって復号化され得る。

この文献は、階層型符号器改良ステージに関して、知覚的にフィルタ処理された領域（domain）における二次誤差基準（quadratic error criterion）を最小化することによって量子化が実行されることを説明する。

従って、符号化雑音整形フィルタが定義されて、少なくとも先行する符号化ステージの再構成された信号に基づいて判定された誤差信号に適用される。スキームは、更に、あとに続く符号化ステージの予測として、現在の改良ステージの再構成された信号の計算を必要とする。

更に、改良項が、現在の改良ステージに関して計算されて保存される。これは、従って、有意の複雑さと、改良項または以前のステージの再構成された信号サンプルの有意の記憶量を導入する。

この解決法は、従って、複雑さの見地から最適ではない。

従って、現存する階層型復号器と互換性がある状態を維持しながら、符号化と改良符号化の雑音の整形のために、従来技術スキームを改良する必要性が存在する。

本発明は、状況を改善するようになる。それは、この目的のために、“Ｂ”ビットを有するコア符号化ステージと、少なくとも１つの現在の改良符号化ステージｋを備える階層型符号器においてデジタル音声入力信号（ｘ（ｎ））を符号化する方法であって、前記現在のステージｋに先行する前記コア符号化ステージ及び前記改良符号化ステージが、先行する埋め込み符号器のインデックス（Ｉ^{Ｂ＋ｋ−１}）を形成するように連結された量子化インデックスを配信する方法を提案する。その方法は、それが下記の、−前記現在のステージｋのみの絶対再構成レベル及び前記先行する埋め込み符号器のインデックスに基づいて、前記現在の改良ステージｋに関する考えられる量子化値を獲得するステップと、−前記考えられる量子化値のうちの１つに対応する、前記ステージｋに関する量子化インデックス、及び量子化信号を形成するように、前記考えられる量子化値に基づいて、知覚の重み付け処理を受けたまたは受けていない前記階層型符号器の前記入力信号を量子化するステップとを含むようなものである。

従って、改良ステージの量子化は、以前のステージのインデックスと直接連結される量子化インデックスビットまたは複数の量子化インデックスビットを判定する。従来技術スキームとの対比において、改良信号及び改良項の計算は、存在しない。

更に、量子化の入力における信号は、直接的に階層型符号器の入力信号であるか、または、知覚の重み付け処理を直接的に受けたまさにこの入力信号である。従来技術と同様に、ここでは、これは、入力信号と先行する符号化ステージの再構成された信号との間の差異に関する差信号を包含しない。

計算負荷に関する複雑さは、それによって減少する。

更に、従来技術スキームとの対比において、保存された量子化値は、差分値（differential value）ではない。従って、改良ステージのための量子化辞書を構成するために、以前のステージにおける再構成の代わりになる量子化値を保存することは、有益ではない。

更に、従来技術スキームとの対比において、改良ステージが現存する階層型符号器及び階層型復号器によって保存される絶対レベル

を直接使用するので、差分辞書（differential dictionary）を構成して保存することは、必要ではない。従って、本発明は、符号器において差分辞書が使用され、復号器において絶対辞書（absolute dictionary）が使用される従来技術スキームにおいて直面し得る辞書の重複を回避する。

辞書の保存、そして符号器における量子化及び復号器における逆量子化の演算のために必要とされる記憶装置（memory：メモリ）は、従って減少する。

最後に、差を求めずに改良ステージの量子化値を直接獲得することは、例えば有限の精度で動作している場合に、符号器で獲得された値と復号器で獲得された値との間の追加の正確度を導入する。

下記で言及された様々な特別な実施例は、お互いに独立してまたは組み合わせて、上記で定義された方法のステップに加えられ得る。

特定の実施例において、前記量子化ステップの前に、前記入力信号は、修正された入力信号を与えるための所定の重み付けフィルタを使用して、知覚の重み付け処理を受けたと共に、前記方法は、前記現在の改良符号化ステージの前記量子化信号に基づいて前記重み付けフィルタのメモリを適応させるステップを更に含む。

入力信号と先行する符号化ステージの再構成された信号との間の差異に関する差信号に関してこの知覚の重み付け処理を行った従来技術に対して、ステージｋの改良符号化のために階層型符号器の入力信号に直接的に適用されたこの知覚の重み付け処理は、更に、計算の負荷に関する複雑さを減少させる。

従って、説明された符号化方法は、更に、現存する復号器が、効果的な符号化雑音の整形による信号の改良から利益を得る一方、実行されるべきあらゆる修正または想定されるべき追加の処理が存在しない状態で、信号を復号化することを可能にする。

特定の実施例において、改良ステージｋの前記考えられる量子化値は、更に、適応タイプ（adaptive type）のコア符号化から生じる倍率及び予測値を含む。

これは、コア符号化において定義された値に対して量子化値を適応させることを可能にする。

代替の実施例において、改良ステージｋにおいて量子化されるべき前記修正された入力信号は、適応タイプのコア符号化から生じる予測値が差し引かれる知覚的に重み付けされた入力信号である。

これは、更に、各量子化値に関してよりむしろ量子化器の入力においてこの適応を実行することによってではあるが、コア符号化において定義された値に対して量子化値を適応させることを可能にする。これは、その改良がいくらかのビットに関して行われる場合に有利である。

特定の方法において、前記知覚の重み付け処理は、ＡＲＭＡタイプのフィルタを形成する予測フィルタによって実行される。

改良符号化雑音の整形は、その場合に、良い品質を有する。

同じく本発明は、“Ｂ”ビットを有するコア符号化ステージと、少なくとも１つの現在の改良符号化ステージｋを備える、デジタル音声入力信号の階層型符号器であって、前記現在のステージｋに先行する前記コア符号化ステージ及び前記改良符号化ステージが、先行する埋め込み符号器のインデックスを形成するように連結された量子化インデックスを配信する階層型符号器と関係がある。前記符号器は、それが、−前記先行する埋め込み符号器のインデックスに基づいて前記現在のステージｋのみの絶対再構成レベルを判定することによって、前記現在の改良ステージｋに関する考えられる量子化値を獲得するためのモジュールと、−前記考えられる量子化値のうちの１つに対応する、前記ステージｋに関する量子化インデックス、及び量子化信号を形成するように、前記考えられる量子化値に基づいて、知覚の重み付け処理を受けたまたは受けていない前記階層型符号器の前記入力信号を量子化するためのモジュールとを備えるようなものである。

前記階層型符号器は、前記量子化モジュールの入力における、修正された入力信号を与えるための所定の重み付けフィルタを使用した知覚の重み付けのための前処理モジュールと、前記現在の改良符号化ステージの前記量子化信号に基づいて前記重み付けフィルタのメモリを適応させるためのモジュールとを更に備える。

階層型符号器は、それが実施する方法の利点と同じ利点を提供する。

本発明は、更に、プロセッサによって実行される場合に本発明による符号化方法のステップを実施するためのコード命令を含むコンピュータプログラムと関係がある。

本発明は、最終的に、上記で説明されたようなコンピュータプログラムを格納すると共に、プロセッサによって読み取り可能な記憶手段と関係がある。

本発明の他の特徴及び利点は、単に限定されない例のつもりで与えられた下記の説明を読むことに基づいて、そして添付図面を参照することによって、更に明らかに明白になるであろう。

最高水準の、そして上記で説明されたようなＡＤＰＣＭタイプの埋め込みコード符号器を例証する図である。最高水準の、そして上記で説明されたようなＡＤＰＣＭタイプの埋め込みコード復号器を例証する図である。本発明による符号化方法、及び本発明による符号器の一般的な実施例を例証する図である。本発明による符号化方法及び符号器の第１の特定の実施例を例証する図である。本発明による符号化方法及び符号器の第２の特定の実施例を例証する図である。本発明による符号化方法及び符号器の第３の特定の実施例を例証する図である。本発明による符号化方法及び符号器の一般的な代替実施例を例証する図である。本発明による符号化方法及び符号器の別の一般的な代替実施例を例証する図である。本発明による符号器のコア符号化の代表的な実施例を例証する図である。最高水準において使用される量子化の再構成レベルの例を例証する図である。本発明による符号器のハードウェアの実施例を例証する図である。

図３を参照すると、本発明の一実施例による符号化方法だけでなく符号器が説明されている。

ここで考察されているのは、Ｂビットを有するコア符号化及び少なくとも１つのランクｋの改良ステージが構想される埋め込みコード符号器または階層型符号器の場合であるということが思い出される。符号３０６で描写されたような改良の符号化ステージｋに先行するコア符号化ステージ及び改良ステージは、サンプル当たり“Ｂ＋ｋ−１”ビットのインデックス“Ｉ^{Ｂ＋ｋ−１}（ｎ）”に多重化されたスカラー量子化インデックスを配信する。

下記で説明された代表的な実施例では、説明を単純化するために、（ランクｋの）改良ステージは、サンプルごとに追加のビットを生成するとして提示される。この場合、各改良ステージにおける符号化は、２つの考えられる値のうちの１つを選択することを必要とする。続いて明白になるように、ランクｋの改良ステージが生成することができる全ての量子化値に対応する“絶対辞書”−絶対レベル（非差分という意味で）の観点において−は、サイズ“２^Ｂ＋ｋ”の辞書であるか、または、低域の６ビット量子化器における６４個の可能なレベルの代わりにわずか６０個の考えられるレベルを有する、例えばＧ．７２２の符号器における辞書のように、時にはサイズ“２^Ｂ＋ｋ”よりわずかに小さい辞書である。階層型符号化は、１つの改良ビットが以前のステージの“Ｂ＋ｋ−１”ビットを与えられて符号化を行うのに十分であることを説明する“絶対辞書”のバイナリーツリー構造（binary tree structure）を包含する。

図９は、前述の“Ｘ．Ｍａｉｔｒｅ”の論文の表ＶＩ（table VI）からの抽出であると共に、“Ｂ＋２”ビットの従来技術の改良量子化器の出力値だけでなく、“Ｂ”ビットを有するコア量子化器の“Ｂ＝４”ビットに対する最初の４つのレベル、そしてＧ．７２２符号器の低域の符号化の“Ｂ＋１”ビット及び“Ｂ＋２”ビットを有する量子化器のレベルを描写する。

この図において例証されたように、“Ｂ＋１＝５”ビットを有する埋め込み量子化器（embedded quantizer）は、“Ｂ＝４”ビットを有する量子化器のレベルを“分割する”ことによって獲得される。“Ｂ＋２＝６”ビットを有する埋め込み量子化器（embedded quantizer）は、“Ｂ＋１＝５”ビットを有する量子化器のレベルを“分割する”ことによって獲得される。実際には、再構成のレベルの分割は、Ｇ．７２２においてツリー構造化された（サンプル当たり４、５、または６ビットを有する）スカラー量子化辞書の形式で実施される低域に関する階層型符号化の制限の結果である。

従来技術において、改良ステージｋに関する量子化再構成レベルを示す値

は、“Ｂ＋ｋ”ビット（“Ｂ”はコア符号化のビット数を示す）を有する埋め込み量子化器の量子化の再構成レベルを示す値と、“Ｂ＋ｋ−１”ビットを有する埋め込み量子化器の量子化の再構成レベルを示す値との間の差異によって定義され、“Ｂ＋ｋ”ビットを有する埋め込み量子化器の量子化の再構成レベルは、“Ｂ＋ｋ−１”ビットを有する埋め込み量子化器の量子化の再構成レベルを分割することによって定義される。

本発明に関して、右側に記載されたと共に点線によって囲った差分の再構成レベル

は、計算されて保存される必要はない。本発明によれば、ステージｋの絶対的な再構成レベル

が、計算されて保存される。

標準の埋め込みコードＡＤＰＣＭ復号器を表す図２の説明を参照して既に提示されたように、これらのステージｋの絶対的な再構成レベル

は、再構成された信号が、倍率ｖ（ｎ）を乗算し、予測信号

を加えることによって、これらの絶対的な再構成レベル

に基づいて、ＡＤＰＣＭ符号化の一般的な場合に獲得され得るという意味において、復号器における方法と同じ方法で符号器において使用される。これらのレベルは復号器において既に定義されて保存されているので、従って、符号器は、符復号器（codec：コーデック）（符号器＋復号器）において、追加の量子化テーブルを全く加えない。

本発明による改良ステージの符号化は、改良ステージがサンプル当たりいくらかのビットを追加する場合に関して、非常に容易に一般化可能である。この場合に、これ以降定義されるように、改良ステージで使用された辞書“Ｄ_ｋ（ｎ）”のサイズは、単に２^Ｕであり、ここで、“Ｕ＞１”は、改良ステージのサンプル当たりのビット数である。

例えば図３において描写されるような符号器は、Ｂビットを有するコア符号化及び少なくとも１つのランクｋの改良ステージが構想される埋め込みコード符号器または階層型符号器を示す。符号３０６で描写されたような改良の符号化ステージｋに先行するコア符号化ステージ及び改良ステージは、先行する埋め込み符号器のインデックス“Ｉ^{Ｂ＋ｋ−１}（ｎ）”を形成するように連結されたスカラー量子化インデックスを配信する。

図３は、簡単な方法で、符号３０６における改良符号化に先行する埋め込み符号化を描写するＰＣＭ／ＡＤＰＣＭ符号化モジュール３０２を例証する。

先行する埋め込み符号化のコア符号化は、“コア”符号化雑音を整形するように、符号３０１において判定されたマスキングフィルタを使用して、任意に実行され得る。このタイプのコア符号化の例は、図８を参照して続いて説明される。

実際には図１を参照して説明された符号化と類似したＡＤＰＣＭ予測符号化に対処する場合に、このように、このモジュール３０２は、予測信号

及び倍率ｖ（ｎ）だけでなく、埋め込み符号器のインデックス“Ｉ^{Ｂ＋ｋ−１}（ｎ）”を配信する。

ＰＣＭ符号化の場合は、モジュール３０２は、単に、埋め込み量子化インデックスＩ^{Ｂ＋ｋ−１}（ｎ）”を配信する。更に、ＰＣＭ符号化が、

及び“ｖ（ｎ）＝１”とするＡＤＰＣＭ符号化の特別な場合であることに注意が必要である。

適切な場合、予測信号

及び倍率ｖ（ｎ）だけでなく、埋め込み量子化インデックス“Ｉ^{Ｂ＋ｋ−１}（ｎ）の知識及び絶対的な再構成レベル

の知識は、量子化値の辞書を構成するためのモジュール３０３において、現在の改良ステージｋに関する量子化値

を判定することを可能にする。この辞書“Ｄ_ｋ（ｎ）”は、ランクｋの改良ステージのための“改良量子化器”としてここで参照される量子化器によって使用される。

従って、好ましい実施例によれば、ＡＤＰＣＭ符号化の場合は、辞書の量子化値は、下記の方法で定義される。

ここで、“ｊ＝０”または“ｊ＝１”である場合に、

は、“Ｂ＋ｋ”ビットの埋め込み量子化器の２つの考えられる量子化値を表し、その値は、符号器において、そして復号器において事前に定義されて保存される。先行するステージ“ｋ−１”の辞書

の“分割（splitting）”から生じるものとして、値

を見ることができる。

辞書“Ｄ_ｋ（ｎ）”の２つの要素が“Ｉ^{Ｂ＋ｋ−１}”によって決まることに注意が必要である。実際、この辞書は、下記のように定義される“絶対辞書”のサブセットである。

“絶対辞書”は、ツリー構造化された（tree-structured）辞書である。インデックス“Ｉ^{Ｂ＋ｋ−１}”は、ステージｋの考えられる量子化値（Ｄ_ｋ（ｎ））を判定するためにツリーの様々なブランチが考慮されるように条件づける。

図１において例証されたように、倍率“ｖ（ｎ）”は、ＡＤＰＣＭ符号化のコアステージによって決定されると共に、従って、改良ステージは、量子化辞書の符号語（code word）を増減させるために、この同じ倍率を使用する。

本発明の一実施例では、図３の符号器は、モジュール３０１及び３１０を含まず、すなわち符号化雑音の整形処理への対策は全く講じられない。従って、量子化モジュール３０６によって量子化されるのは、入力信号“ｘ（ｎ）”そのものである。

特定の実施例において、符号器は、更に、マスキングフィルタを計算し、そして続いて説明される重み付けフィルタ“Ｗ（ｚ）”または予測のバージョン“Ｗ_ＰＲＥＤ（ｚ）”を判定するためのモジュール３０１を備える。マスキングフィルタまたは重み付けフィルタは、ここでは、入力信号“ｘ（ｎ）”に基づいて判定されるが、しかし、復号化された信号、例えば先行する埋め込み符号器の復号化された信号

に基づいて非常によく判定されるであろう。マスキングフィルタは、サンプル毎に、またはサンプルのブロック単位で、判定され得るか、もしくは適合され得る。

実際には、本発明による符号器は、フィルタ“Ｗ（ｚ）”によって重み付けされた領域（domain）における量子化を使用することによって、すなわち“Ｗ（ｚ）”によりフィルタ処理された量子化雑音のエネルギーを最小限にすることによって、改良ステージの符号化雑音の整形を行う。

この重み付けフィルタは、フィルタ処理モジュールによって、そしてより全体的には、入力信号“ｘ（ｎ）”の知覚の重み付け前処理のためのモジュール３１０によって、符号３１１において使用される。この前処理は、従来技術の場合にありえたように、誤差信号ではなく直接入力信号“ｘ（ｎ）”に適用される。

この前処理モジュール３１０は、改良量子化器３０７の入力に修正された信号“ｘ’（ｎ）”を配信する。

改良ステージｋの量子化モジュール３０７は、現在の埋め込み符号化のインデックス（Ｉ^Ｂ＋ｋ）を形成するように、ここで表されないモジュールによって先行する埋め込み符号化のインデックス（Ｉ^{Ｂ＋ｋ−１}）と連結されることになる量子化インデックス“Ｉ_ｅｎｈ ^Ｂ＋ｋ（ｎ）”を配信する。

改良ステージｋの量子化モジュール３０７は、適応辞書“Ｄ_ｋ（ｎ）”の２つの値

の中から選択をする。

それは、入力として信号“ｘ’（ｎ）”を受け取り、ローカル復号化モジュール３０８を通ることによって、出力として量子化された値

を、“ｘ’（ｎ）”と

との間の二次の誤差（quadratic error）を最小化することによって与える。（ここで、

は、

のいずれかに等しい。）従って、適応辞書“Ｄ_ｋ（ｎ）”は、ステージｋの量子化された出力値を直接含む。

モジュール３０８は、インデックス

の逆量子化によって、入力信号の量子化された値を与える。復号器において、同じ値が、単にステージｋの逆の量子化器及び連結されたインデックスを直接使用することによって、下記式のように獲得される。

この量子化信号は、入力

に対応するメモリを獲得するように、改良ステージの重み付けフィルタ“Ｗ（ｚ）”のメモリを更新するために使用される。一般的に、復号化された信号の現在の値

が、より最近のメモリ（または、ＡＲＭＡタイプのフィルタの場合における複数のメモリ）から差し引かれる。

従って、信号“ｘ（ｎ）”の量子化は、重み付けされた領域において行われ、それは、フィルタ“Ｗ（ｚ）”によってフィルタ処理した後で、“ｘ（ｎ）”と

との間の２次の誤差を最小化することを意味する。改良ステージの量子化雑音は、従って、フィルタ“１／Ｗ（ｚ）”によって、この雑音をあまり聞こえる状態にしないように、整形される。重み付けされた量子化雑音のエネルギーは、従って、最小限にされる。

図３において与えられるブロック３１０の一般的な実施例は、“Ｗ（ｚ）”が無限インパルス応答（ＩＩＲ）フィルタまたは有限インパルス応答（ＦＩＲ）フィルタである一般的な場合を示す。信号“ｘ’（ｎ）”は、“ｘ（ｎ）”を“Ｗ（ｚ）”によってフィルタ処理することによって獲得され、その場合に、量子化された値

が知られているとき、そのフィルタ処理が信号

に関して実行されたかのように、フィルタ“Ｗ（ｚ）”のメモリが更新される。

破線の矢印は、フィルタのメモリの更新を表す。

従って、図３において例証されたように、符号器に実装されるステップが更に表される。実際には、下記の、
−符号３０３において、先行する埋め込み符号器のインデックス（Ｉ^{Ｂ＋ｋ−１}）に基づいて現在のステージｋのみの絶対再構成レベルを判定することによって、現在の改良ステージｋに関する考えられる量子化値

を獲得するステップと、
−符号３０６において、考えられる量子化値のうちの１つに対応する、ステージｋに関する量子化インデックス（Ｉ_ｅｎｈ ^Ｂ＋ｋ（ｎ））、及び量子化信号

を形成するように、前記考えられる量子化値

に基づいて、知覚の重み付け処理を受けたまたは受けていない階層型符号器の入力信号（ｘ’（ｎ）またはｘ（ｎ））を量子化するステップが、その中で発見される。

図３に表されたケースにおいて、入力信号は、符号３０６における量子化ステップの前に、修正された入力信号“ｘ’（ｎ）”を与えるために、符号３０１においてあらかじめ定められた重み付けフィルタを使用して、符号３１０において知覚の重み付け処理を受けた。

図３は、更に、現在の改良符号化ステージの量子化信号

に基づいて重み付けフィルタのメモリを適応させるための、符号３１１における適応ステップを表す。

図４、５、及び６は、ここで、前処理ブロック３１０の特定の実施例を描写する。

ブロック３０１、３０２、３０３、３０６、３０７、及び３０８は、その場合に、図３を参照して説明されたそれらと同じままである。

図４は、有限インパルス応答（ＦＩＲ）を有するフィルタ“Ｗ（ｚ）＝Ａ’（ｚ）”を備えた前処理ブロック３１０の第１の実施例を表す。

この実施例において、フィルタのメモリは、信号

の過去の入力サンプルを単独で含み、“ｂ^Ｂ＋ｋ（ｎ’），ｎ’＝ｎ−１，．．．，ｎ−Ｎ_Ｄ”のように表される。Ｎ_Ｄは、知覚フィルタ“Ｗ（ｚ）”の次数である。

符号３０２において、入力信号“ｘ（ｎ）”は、埋め込み符号器“Ｂ＋ｋ−１”の符号化雑音の整形ありで、あるいは、埋め込み符号器“Ｂ＋ｋ−１”の符号化雑音の整形なしで、ＰＣＭ／ＡＤＰＣＭ符号化モジュール３０２によって符号化される。

符号３０３において、適応辞書“Ｄ_ｋ”は、図３を参照して説明されたように、ＡＤＰＣＭ適応タイプの符号化の場合は、そして符号化インデックス“Ｉ^{Ｂ＋ｋ−１}（ｎ）”の場合は、コアステージの倍率“ｖ（ｎ）”の予測値

の関数として構成される。適応辞書“Ｄ_ｋ”は、単一の改良ビットが改良ステージｋにおいて構想される特定の実施例において、下記の２つの項（term）を含む。

この実施例では、符号３０１においてマスキングフィルタを計算するステップ、そして重み付けフィルタ“Ｗ（ｚ）”及び予測に基づくその予測のバージョン“Ｗ_ＰＲＥＤ（ｚ）”を判定するステップ、すなわち単独で過去のサンプルを使用する計算を発見する。

予測フィルタの定義をここで思い起こす。

一例として、（同様に有限インパルス応答のためにＦＩＲと称される）零点のみ（all-zero）の伝達関数を有する次数４の非再帰型フィルタ“Ａ（ｚ）”

によって信号“ｘ（ｎ）”をフィルタ処理して、結果として信号“ｙ（ｎ）”を与える場合を考える。ｚ変換の領域において、方程式“Ｙ（ｚ）＝Ａ（ｚ）Ｘ（ｚ）”は、差分方程式“ｙ（ｎ）＝ａ_０ｘ（ｎ）＋ａ_１ｘ（ｎ−１）＋ａ_２ｘ（ｎ−２）＋ａ_３ｘ（ｎ−３）＋ａ_４ｘ（ｎ−４）”に対応する。

“ｙ（ｎ）”に関するこの表現法は、２つの部分に分割され得る。
−第１の部分“ａ_０ｘ（ｎ）”は、現在の入力“ｘ（ｎ）”のみによって変わる。本明細書において、通常は、そして我々にとって興味がある場合に、“ａ_０＝１”である。
−第２の部分“ａ_１ｘ（ｎ−１）＋ａ_２ｘ（ｎ−２）＋ａ_３ｘ（ｎ−３）＋ａ_４ｘ（ｎ−４）”は、過去の入力“ｘ（ｎ−ｉ），ｉ＞０”のみによって変わる。それは、従って、以前のサンプルに基づいて“ｘ（ｎ）”の予測を表す線形予測を有する類推による、フィルタ処理の予測部分（predictive part）であると考えられるであろう。

この第２の部分は、サンプリング時点“ｎ”における、実際には一般化された予測値である“ゼロ入力応答”（ＺＩＲ）、あるいは、“リンギング（ringing）”」に対応する。この成分のｚ変換は、下記のようになる。

同様に、

の場合に、信号“ｙ（ｎ）”をもたらす、極のみ（all-pole）の次数４の再帰型フィルタ

による信号“ｘ（ｎ）”のフィルタ処理に関して、伝達関数は、差分方程式が“ｙ（ｎ）＝ｘ（ｎ）−ｂ_１ｙ（ｎ−１）−ｂ_２ｙ（ｎ−２）−ｂ_３ｙ（ｎ−３）−ｂ_４ｙ（ｎ−４）”の場合に、

を与える。

ｚ変換が

の場合に、革新部分（innovation part）は“ｘ（ｎ）”であり、予測部分（predictive part）は“−ｂ_１ｙ（ｎ−１）−ｂ_２ｙ（ｎ−２）−ｂ_３ｙ（ｎ−３）−ｂ_４ｙ（ｎ−４）”である。

同じことが、差分方程式が

である場合に、全く同一の時刻に零と極を含むフィルタ（ＡＲＭＡ（自己回帰移動平均）フィルタ）

に関して適用できる。（この例では、“Ａ（ｚ）”及び“Ｂ（ｚ）”は次数４である。）

ｚ変換が

の場合に、革新部分（innovation part）は“ｘ（ｎ）”であり、予測部分（predictive part）は

である。

これ以降、“Ｈ_ＰＲＥＤ（ｚ）”は、一般的にその現在の入力“ｘ（ｎ）”に対する係数がゼロであるフィルタを表示する。

極のみの再帰型フィルタ

またはＡＲＭＡ再帰型フィルタ

は、いわゆるＩＩＲ（無限インパルス応答）フィルタである。

この場合は、図４において、革新部分（innovation part）と予測部分（predictive part）へのフィルタ処理の切り分けを使用することによって、エネルギーが最小限にされなければならない項は、

である。

ステージｋの改良量子化器によって量子化されるべき信号は、従って、

であり、ここで、

は、予測フィルタ“Ｗ_ＰＲＥＤ（ｚ）”によって

をフィルタ処理することによって獲得される。これらの２つのフィルタ処理は、（例えばフィルタのメモリを更新することによって）１つに結合され得ると共に、共通のフィルタ“Ｗ_ＰＲＥＤ（ｚ）”の入力は、その場合に、

になるであろう。その場合に、フィルタ処理の出力として、

が獲得される。

前処理モジュール３１０は、符号４０４において、“Ｗ_ＰＲＥＤ（ｚ）”によって、符号４０９において獲得された信号

の過去のサンプルをフィルタ処理することにより、予測値

を計算するステップを実施する。

この予測値

は、改良ステージｋの量子化器の修正された入力信号“ｘ’（ｎ）”を獲得するために、符号４０５において入力信号“ｘ（ｎ）”に加えられる。

“ｘ’（ｎ）”の量子化は、改良ステージｋの量子化インデックス

、及びステージｋの復号化された信号

を与えるために、符号３０６において、改良ステージｋの量子化モジュールによって実行される。モジュール３０７は、“ｘ’（ｎ）”と量子化値

との間の２次の誤差を最小化する、適応辞書“Ｄ_ｋ”の符号語（code word）のインデックス

（代表的実例では１ビット）を与える。このインデックスは、復号器においてステージｋの符号語のインデックス“Ｉ^Ｂ＋ｋ”を獲得するために、先行する埋め込み符号器のインデックス“Ｉ^{Ｂ＋ｋ−１}”と連結されなければならない。モジュール３０８は、インデックス

の逆量子化によって、入力信号の量子化された値

を与える。

復号器において、単に、ステージｋの逆量子化、及び、

を獲得するための連結されたインデックスを直接使用することによって、同じ値が獲得される。

符号４０９において、ステージｋを含む符号器の符号化雑音“ｂ^Ｂ＋ｋ（ｎ）”を計算するステップが、入力信号“ｘ（ｎ）”を、現在のサンプル（ｎ＝０）に関するステージｋの合成された信号

から差し引くことによって、実行される。

ブロック３１０の前処理の動作は、従って、入力信号“ｘ（ｎ）”の知覚の重み付けを実行することによって、ステージｋの改良符号化雑音を整形することを可能にする。知覚的に重み付けされているのは入力信号そのものであり、従来技術スキームにおける場合のような誤差信号ではない。

図５は、前処理モジュールの別の代表的な実施例を例証すると共に、この実施例では、伝達関数

を有するＡＲＭＡ（自己回帰移動平均）タイプのフィルタ処理を使用する。

図５に基づいた動作は、下記のとおりにつながれる。符号３０１において、マスキングフィルタを計算すると共に、重み付けフィルタ

を判定する。任意に、符号化雑音を整形するために符号３０１において判定されたマスキングフィルタを使用した符号化雑音の整形を伴って、符号３０２において、“Ｂ＋ｋ−１”ビットのＰＣＭ／ＡＤＰＣＭタイプの埋め込み符号器によって、入力信号“ｘ（ｎ）”を符号化する。符号３０３において、予測値

の関数として、及び（ＡＤＰＣＭ符号化の場合に）コアステージの倍率ｖ（ｎ）の関数として、及び量子化インデックス“Ｉ^{Ｂ＋ｋ−１}（ｎ）”の関数として、適応辞書“Ｄ_ｋ”を判定する。

これらのステップは、図３を参照して説明されるものに相当する。

前処理モジュール３１０は、フィルタ処理された再構成された雑音

に基づいて符号５１０において計算された予測値を加えることによって、そして、再構成された雑音

に基づいて符号５１１において計算された予測値を差し引くことによって、符号５１２において、フィルタ処理された量子化雑音

の予測信号

を計算するステップを含む。

符号５０５において、予測信号

を信号“ｘ（ｎ）”に加えるステップが、修正された信号“ｘ’（ｎ）”を与えるために実行される。

修正された信号“ｘ’（ｎ）”を量子化するステップが、図３及び図４を参照して説明された方法と同じ方法で、量子化モジュール３０６によって実行される。

従って、ブロック３０６の量子化は、出力として、インデックス

、及び、ステージｋにおける復号化された信号

を与える。

符号５０９において、信号“ｘ（ｎ）”から再構成された信号

を差し引くステップが、復号化された雑音“ｂ^Ｂ＋ｋ（ｎ）”を与えるために実行される。

符号５１３において、予測信号

を信号“ｂ^Ｂ＋ｋ（ｎ）”に加えるステップが、フィルタ処理された再構成された雑音

を与えるために実行される。

前処理ブロック３１０のモジュールによって、符号５０５、５０９、５１０、５１１、５１２、及び５１３において実行される全てのステップは、改良符号化ステージｋに関して、符号化雑音を整形することを可能にする。雑音のこの整形は、その場合に、従って雑音整形の更に良い正確度を提供するＡＲＭＡフィルタを構成する２つの予測フィルタによって実行される。

図６は、フィルタ処理された再構成された信号

が計算される方法に違いが存在する、前処理ブロック３１０の更にもう一つの実施例を例証する。フィルタ処理された再構成された雑音

は、符号６１４において、信号“ｘ’（ｎ）”から復号化されたシグナル

を差し引くことによって、ここでは獲得される。

上記で説明された図５及び図６では、過去のサンプルに関するフィルタ処理された再構成された雑音信号

に基づいて重み付けフィルタのメモリを更新することについて、更に説明することが可能である。

図７は、コア符号化に由来する予測された信号

を異なって処理することによって信号“ｘ’（ｎ）”を量子化するステップ３０６に関する代替実施例を例証する。この実施例は、図３において提示される代表的な前処理ブロック３１０によって表示されるが、しかし、明らかに図４、５、及び６で説明された前処理ブロックに統合され得る。図７に基づいた動作は、下記のとおりにつながれる。符号３０１において、マスキングフィルタを計算すると共に、重み付けフィルタ“Ｗ（ｚ）”またはその予測のバージョン“Ｗ_ＰＲＥＤ（ｚ）”を判定する。任意に、符号化雑音を整形するために符号３０１において判定されたマスキングフィルタを使用した符号化雑音の整形を伴って、符号３０２において、“Ｂ＋ｋ−１”ビットのＰＣＭ／ＡＤＰＣＭタイプの埋め込み符号器によって、入力信号“ｘ（ｎ）”を符号化する。符号７０１において、（ＡＤＰＣＭ符号化の場合に）コアステージの倍率ｖ（ｎ）の関数として、及び埋め込み符号化の先行するステージｋの量子化インデックス“Ｉ^{Ｂ＋ｋ−１}（ｎ）”の関数として、適応辞書“Ｄ_ｋ’”を判定する。

符号３１１において、フィルタ“Ｗ（ｚ）”のメモリとしての入力信号

に対応する値と共に、改良量子化器の修正された入力信号“ｘ’（ｎ）”を獲得するために、信号“ｘ（ｎ）”をフィルタ“Ｗ（ｚ）”によってフィルタ処理する。符号７０６において、インデックス

、及び、ステージｋにおける復号化された信号

を与えるために、入力信号“ｘ’（ｎ）”を量子化する。

この実施例において、コアステージの予測された信号

は、修正された信号

を獲得するために、信号“ｘ’（ｎ）”から差し引かれる（モジュール７０２）。

モジュール７０７は、“ｘ''（ｎ）”と符号語

との間の２次の誤差を最小化する、適応辞書“Ｄ_ｋ’”の符号語のインデックス

（代表的実例では１ビット）を与える。このインデックスは、復号器においてステージｋを含む現在の埋め込み符号化のインデックス“Ｉ^Ｂ＋ｋ”を獲得するために、先行する埋め込み符号化のインデックス“Ｉ^{Ｂ＋ｋ−１}”と連結されなければならない。

モジュール７０８は、インデックス

の逆量子化によって、信号“ｘ''（ｎ）”の量子化された値

を与える。モジュール７０３は、予測された信号と量子化器からの出力信号とを合計することによって、ステージｋの量子化信号

を計算する。

最終的に、入力

に対応するメモリを獲得するために、フィルタ“Ｗ（ｚ）”のメモリを更新するステップが符号３１１において実行される。一般的に、復号化された信号の現在の値

は、より最近のメモリ（または、ＡＲＭＡタイプのフィルタの場合におけるメモリ）から差し引かれる。

図７における解決法は、品質（quality）及び記憶装置（storage）の点から、図３の解決法と同等であるが、しかし、改良ステージが１ビット以上を使用する場合に、計算をほとんど必要としない。実際には、予測値

を全ての符号語（＞２）に加える代りに、量子化の前に単に１つの減算を行い、そして、量子化された値

を取り出すために単に１つの加算を行う。その複雑さは、従って減少する。

別の代替実施例が、図７ｂで例証される。ここで、適応辞書“Ｄ_ｋ'' ”は、修正された入力信号から、適切であるならばステージｋの倍率“ｖ（ｎ）”によって重み付けされた再構成レベルを差し引くことによって構成される。

この典型例において、それは、２次の誤差を最小化することによって量子化される予測信号

である。
次に、メモリを更新するための復号化された信号

は、下記の方法において獲得される。

図８は、コア符号化における雑音の整形の可能な実装を詳述する。モジュール８０１は、雑音整形フィルタの係数

を計算する。モジュール８０２は、前のサンプリング時点“ｎ−１，ｎ−２，．．．”の符号化の誤差

を計算する。この誤差は、予測信号“ｑ_{ｗ，ｐｒｅｄ}（ｎ）”を獲得するために予測フィルタ“Ｈ_ＰＲＥＤ（ｚ）”によってフィルタ処理される。“Ｈ_ＰＲＥＤ（ｚ）”に対応するフィルタ“Ｈ（ｚ）”は、例えば、

のいずれかに等しくなり得る。

時点“ｎ”において、この予測値は、符号化されるべき修正された信号“ｘ’（ｎ）＝ｘ（ｎ）−ｑ_{ｗ，ｐｒｅｄ}（ｎ）”を獲得するために、符号化されるべき信号から差し引かれることになる。

ＰＣＭ／ＡＤＰＣＭ符号器−ＰＣＭ／ＡＤＰＣＭ復号器チェーンの入力と出力との間の差異

は、これらの符号器が多数のレベルを有する量子化器を使用すると共に、入力信号が固定であると仮定する場合に、短期的には白色雑音であると考察され得る。

ここでは、例として、

であるとする。ＰＣＭ／ＡＤＰＣＭ標準符号化チェーンの入力信号は、寄与（contribution：貢献）

の減算によって修正される。これから、完全なチェーンの符号化雑音

がフィルタ

によって整形され、

ということになり、これは、方程式

の点から証明される。それ故に、

であり、従って、

である。

実際には、そのフィルタ“Ｈ_ＰＲＥＤ（ｚ）＝Ｈ（ｚ）−１”は、（時点“ｎ”において）“Ｚ^０”におけるゼロの係数を有しており、従って、予測器（predictor）は、復号化された値

が知られている場合に、その一部分に関してＰＣＭ／ＡＤＰＣＭ処理の終りにおいてのみ知られている

に基づいて、動作する。

図８の動作のシーケンスは、下記のとおりである。符号８０１において、マスキングフィルタを計算すると共に、フィルタ“Ｈ（ｚ）”を判定する。フィルタ“Ｈ（ｚ）”は、同様に、復号化された信号

に基づいて判定され得る点に注意が必要である。符号８０３において、前のサンプリング時点“ｎ−１，ｎ−２，．．．”の値

に基づいて、予測値“ｑ_{ｗ，ｐｒｅｄ}（ｎ）”を計算する（［Ｈ（ｚ）−１］Ｑ_ｗ（ｚ））。符号８０４において、修正された信号“ｘ’（ｎ）”を獲得するために、予測値“ｑ_{ｗ，ｐｒｅｄ}（ｎ）”を“ｘ（ｎ）”から差し引く。符号８０５−８０６において、標準のＰＣＭ／ＡＤＰＣＭ符号器／復号器によって、修正された信号“ｘ’（ｎ）”の符号化／復号化を行う。ローカル復号器は、標準Ｇ．７１１、Ｇ．７２１、Ｇ．７２６、Ｇ．７２２、或いはＧ．７２７のＰＣＭ／ＡＤＰＣＭタイプの標準のローカル復号器であり得る。符号８０２において、出力信号

から入力信号“ｘ（ｎ）”を差し引くことによって、フィルタ処理された符号化雑音“ｑ_ｗ（ｎ）”を計算する。

周囲を囲まれた部分８０７は、標準の符号器／復号器チェーンの入力を修正する雑音整形前処理として考えられると共に実施され得る。

本発明による符号器の代表的な実施例が、図１０を参照してここから説明される。

ハードウェアに関しては、上記で本発明の意図において様々な実施例に従って説明されたような符号器９００は、記憶装置及び／またはワークメモリを含むメモリブロック“ＢＭ”と協力するプロセッサ“μＰ”の他に、例えば図３、４、５、６、及び７を参照して説明されたような符号化方法の実施のために必要とされる量子化再構成レベルの辞書またはあらゆるその他のデータを保存するための手段としての前述のバッファメモリＭＥＭを備える。この符号器は、入力として、デジタル信号“ｘ（ｎ）”連続するフレームを受け取り、そして、連結された量子化インデックス“Ｉ^Ｂ＋Ｋ”を配信する。

メモリブロック“ＢＭ”は、コード命令が符号器のプロセッサ“μＰ”によって実行されたときに本発明による方法のステップ、特に、先行する埋め込み符号器のインデックスに基づいて現在のステージｋのみの絶対再構成レベルを判定することによって、現在の改良ステージｋに関する考えられる量子化値を獲得するステップと、前記考えられる量子化値のうちの１つに対応する、ステージｋに関する量子化インデックス、及び量子化信号を形成するように、前記考えられる量子化値に基づいて、知覚の重み付け処理を受けたまたは受けていない階層型符号器の入力信号（ｘ’（ｎ）またはｘ（ｎ））を量子化するステップとを実施するためのコード命令を有するコンピュータプログラムを含むことができる。

更に一般的な方法では、コンピュータまたは恐らくは符号器に統合されたプロセッサによって読み取り可能な記憶手段、任意に取り外し可能な記憶手段が、本発明による符号化方法を実施するコンピュータプログラムを記憶する。

図３〜図７は、例えばそのようなコンピュータプログラムのアルゴリズムを例証し得る。

１１０予測モジュール
１２０減算モジュール
１２１逆量子化モジュール
１３０量子化モジュール
１４０データ伝送路
１５０ “Ｋ”個の低位のビットを削除するためのモジュール
１６５、１７５予測器
１８０加算モジュール
２１０逆量子化モジュール
２２０モードビットレートインジケータ及びセレクタ
２３０、２４０逆量子化器
３０１マスキングフィルタ
３０２ＰＣＭ／ＡＤＰＣＭ符号化モジュール
３０３量子化値の辞書を構成するためのモジュール
３０６量子化モジュール
３０７改良量子化器
３０８ローカル復号化モジュール
３１０前処理モジュール
３１１重み付けフィルタ“Ｗ（ｚ）”
４０４予測フィルタ“Ｗ_ＰＲＥＤ（ｚ）”
９００符号器
ＢＭメモリブロック
μＰプロセッサ

Claims

“Ｂ”ビットを有するコア符号化ステージと、少なくとも１つの現在の改良符号化ステージｋを備える階層型符号器においてデジタル音声入力信号（ｘ（ｎ））を符号化する方法であって、
前記現在のステージｋに先行する前記コア符号化ステージ及び前記改良符号化ステージが、先行する埋め込み符号器のインデックス（Ｉ^{Ｂ＋ｋ−１}）を形成するように連結された量子化インデックスを配信し、
前記方法が、
−前記現在のステージｋのみの絶対再構成レベル

及び前記先行する埋め込み符号器のインデックス（Ｉ^{Ｂ＋ｋ−１}）に基づいて、前記現在の改良ステージｋに関する考えられる量子化値

を獲得するステップ（３０３）と、
−前記考えられる量子化値のうちの１つに対応する、前記ステージｋに関する量子化インデックス（Ｉ_ｅｎｈ ^Ｂ＋ｋ（ｎ））、及び量子化信号

を形成するように、前記考えられる量子化値

に基づいて、知覚の重み付け処理を受けたまたは受けていない前記階層型符号器の前記入力信号（ｘ’（ｎ）またはｘ（ｎ））を量子化するステップ（３０６）と
を含むことを特徴とする方法。
前記量子化ステップ（３０６）の前に、前記入力信号が、修正された入力信号（ｘ’（ｎ））を与えるための所定の重み付けフィルタを使用して、知覚の重み付け処理を受けたと共に、
前記方法が、前記現在の改良符号化ステージの前記量子化信号

に基づいて前記重み付けフィルタのメモリを適応させるステップ（３１１）を更に含む
ことを特徴とする請求項１に記載の方法。
改良ステージｋの前記考えられる量子化値が、更に、適応タイプのコア符号化から生じる倍率及び予測値を含む
ことを特徴とする請求項１に記載の方法。
改良ステージｋにおいて量子化されるべき前記修正された入力信号（ｘ''（ｎ））は、適応タイプのコア符号化から生じる予測値が差し引かれる知覚的に重み付けされた入力信号である
ことを特徴とする請求項２に記載の方法。
前記知覚の重み付け処理が、ＡＲＭＡタイプのフィルタを形成する予測フィルタによって実行される
ことを特徴とする請求項１から請求項４のいずれか一項に記載の方法。
“Ｂ”ビットを有するコア符号化ステージと、少なくとも１つの現在の改良符号化ステージｋを備える、デジタル音声入力信号（ｘ（ｎ））の階層型符号器であって、
前記現在のステージｋに先行する前記コア符号化ステージ及び前記改良符号化ステージが、先行する埋め込み符号器のインデックス（Ｉ^{Ｂ＋ｋ−１}）を形成するように連結された量子化インデックスを配信し、
前記符号器が、
−前記先行する埋め込み符号器のインデックス（Ｉ^{Ｂ＋ｋ−１}）に基づいて前記現在のステージｋのみの絶対再構成レベルを判定することによって、前記現在の改良ステージｋに関する考えられる量子化値

を獲得するためのモジュール（３０３）と、
−前記考えられる量子化値のうちの１つに対応する、前記ステージｋに関する量子化インデックス（Ｉ_ｅｎｈ ^Ｂ＋ｋ（ｎ））、及び量子化信号

を形成するように、前記考えられる量子化値

に基づいて、知覚の重み付け処理を受けたまたは受けていない前記階層型符号器の前記入力信号（ｘ’（ｎ）またはｘ（ｎ））を量子化するためのモジュール（３０６）と
備えることを特徴とする階層型符号器。
前記量子化モジュール（３０６）の入力における、修正された入力信号（ｘ’（ｎ））を与えるための所定の重み付けフィルタを使用した知覚の重み付けのための前処理モジュール（３１０）と、
前記現在の改良符号化ステージの前記量子化信号

に基づいて前記重み付けフィルタのメモリを適応させるためのモジュール（３１１）と
を更に備えることを特徴とする請求項６に記載の階層型符号器。
プロセッサによって実行される場合に請求項１から請求項５のいずれか一項に記載の符号化方法のステップを実施するためのコード命令を含むコンピュータプログラム。