JP2010520504A

JP2010520504A - レイヤード・コーデックのためのポストフィルタ

Info

Publication number: JP2010520504A
Application number: JP2009551966A
Authority: JP
Inventors: ステファンブルーン，
Original assignee: テレフオンアクチーボラゲットエルエムエリクソン（パブル）
Priority date: 2007-03-02
Filing date: 2007-12-14
Publication date: 2010-06-10
Anticipated expiration: 2027-12-14
Also published as: WO2008108701A1; EP2132732A1; EP2132732A4; ATE548727T1; CN101622667A; EP2132732B1; CN101622667B; US8571852B2; US20100063801A1; JP5255575B2

Abstract

オーディオを表す信号のためのスケーラブルデコーダ装置（５０）は、入力部（４０）に接続される１次デコーダ（２１）を含む。１次デコーダ（２１）は、受信したパラメータ（４）に基づいて１次復号化信号（２３）を出力する。１次ポストフィルタ（３１）は１次デコーダ（２３）に接続され、１次ポストフィルタ信号（３２）を出力する。２次エンハンスメントデコーダ（４５）は、入力部（４０）に接続され、２次復号化エンハンスメント信号（４４）を出力する。装置は、１次ポストフィルタ信号（３２）と２次復号化エンハンスメント信号（４４）に基づく信号（５３）とを合成して出力部（６）に出力される出力信号（６）を得る合成器（５５）を更に含む。その合成は、２つの信号からの寄与の間の適応可能な強度関係を用いて行われる。オーディオを表す符号化信号を復号化する方法は、スケーラブルデコーダ装置（５０）と同様に動作する。

Description

本発明は、オーディオコーデックに関し、特に、符号化中に音声に挿入される符号化ノイズを低減することに関する。

一般に、オーディオ符号化（audio coding）、特に音声符号化（speech coding）は、符号化領域においてアナログ入力オーディオ信号又は音声信号をデジタル表現にマッピングし、再びアナログ出力オーディオ信号又は音声信号に戻す。デジタル表現は、オーディオ又は音声を表す値又はパラメータの量子化又は離散化に必要である。量子化又は離散化は、符号化ノイズにより本来の値又はパラメータを乱すと考えられる。オーディオ符号化又は音声符号化の技術は、所与のビットレートの復号化音声における符号化ノイズの影響が可能な限り小さくなるように符号化を行う。しかし、音声が符号化される際に与えられるビットレートによって、符号化ノイズが最も低減される理論上の限度が規定される。符号化ノイズを少なくとも可能な限り除去することが目的となる。

スケーラブル符号化（scalable coding）又はエンベデッド符号化（embedded coding）は、符号化が階層的に行われる符号化パラダイムである。基本レイヤ又はコアレイヤが低ビットレートで信号を符号化する一方、各々が互いに重なり合う追加のレイヤは、コアから先の各レイヤまでの全てのレイヤにより達成される符号化に対して多少の改善を提供する。各レイヤは、多少の追加のビットレートを加える。生成されたビットストリームは埋め込まれる。これは、下位レイヤの符号化のビットストリームが上位レイヤのビットストリームに埋め込まれることを意味する。この特性により、送信機又は受信機の任意の場所で上位レイヤに属するビットをドロップできる。そのような取り除かれたビットストリームは、ビットが保持されるレイヤまで依然として復号化可能である。

符号化ノイズに対する適切な考えは、その符号化ノイズが付加的なホワイトノイズ又はカラーノイズであると仮定することである。デコーダでオーディオ信号又は音声信号の復号化した後に、符号化ノイズをより低減するように修正し、その結果、オーディオ信号又は音声の品質を向上させるある種のエンハンスメント方法が存在する。そのような技術は、一般に「ポストフィルタリング」と呼ばれる。これは、実際のデコーダの後の後処理において、改善されたオーディオ信号又は音声信号が得られることを意味する。ポストフィルタによる音質の改善に関する文献は多く存在する。最も基本的な文献の一部は非特許文献１乃至４である。

本発明の説明は、ピッチポストフィルタ又は微細構造ポストフィルタに関する。それらの基本的な動作原理は、発声された音声の高調波間のスペクトルの谷に入り込む（符号化）ノイズの少なくとも一部を除去することである。これは、一般に、復号化音声信号を、その復号化音声信号をタイムシフトした信号に重み付き重ね合わせすることにより達成される。ここで、タイムシフトは音声のピッチラグ又はピッチ周期に対応する。後続の音声信号サンプルにタイムシフトされた信号が更に含まれるのが好ましい。

P. Kroon、B. Atal, "Quantization procedures for 4.8 kbps CELP coders", in Proc IEEE ICASSP, pp. 1650-1654, 1987. V. Ramamoorthy, N.S. Jayant, "Enhancement of ADPCM speech by adaptive postfiltering", AT&T Bell Labs Tech. J., pp. 1465-1475, 1984. V. Ramamoorthy, N.S., Jayant, R. Cox, M. Sondhi, "Enhancement of ADPCM speech coding with backward-adaptive algorithms for postfiltering and noise feed-back", IEEE J. on Selected Areas in Communications, vol. SAC-6, pp. 364-382, 1988. J. H. Chen, A. Gersho, "Adaptive postfiltering for quality enhancements of coded speech", IEEE Trans. Speech Audio Process., vol. 3, no. 1, 1995

後続の音声信号を評価するピッチポストフィルタの１つの問題は、後続の１ピッチ周期の復号化オーディオ信号又は音声信号へのアクセスを必要とすることである。一般に、この後続の信号をポストフィルタにより利用可能にすることは、復号化オーディオ信号又は音声信号をバッファリングすることにより可能である。しかし、オーディオコーデック又は音声コーデックの従来の応用例において、これはコーデックのアルゴリズム的な遅延が増加するものであり、通信品質及び特に対話性に影響を与えるため、望ましくない。

本発明の目的は、スケーラブルなデコーダ装置によりオーディオ又は音声の品質を向上することである。本発明の更なる目的は、オーディオ信号又は音声信号の遅延増加の原因とならないスケーラブルなデコーダ装置用の効果的なポストフィルタの構成を提供することである。

上記目的は、添付の請求の範囲に係る装置及び方法により達成される。第１の側面によれば、オーディオ又は音声を表す信号のためのデコーダ装置、好ましくはスケーラブルデコーダ装置は、符号化信号のパラメータを入力する入力部と、入力部に接続される１次デコーダとを含む。１次デコーダは、パラメータに基づいて１次復号化信号を出力する。１次ポストフィルタは、１次デコーダの出力部に接続され、１次ポストフィルタ信号を出力する。２次デコーダは、入力部に接続され、パラメータに基づいて２次復号化信号を出力する。スケーラブル復号化装置は、１次ポストフィルタ信号と２次復号化信号に基づく信号とを合成して出力信号を得る合成器を更に含む。合成は、１次ポストフィルタ信号と２次復号化信号に基づく信号との重み付け合成である。スケーラブル復号化装置は、合成器に接続され、出力信号を出力する出力部を更に有する。

第２の側面によれば、オーディオ又は音声を表す符号化信号を復号化する方法は、符号化信号のパラメータを受信するステップと、パラメータを１次復号化して１次復号化信号を得るステップとを含む。１次復号化信号は１次ポストフィルタリングされて１次ポストフィルタ信号が得られる。また、パラメータは２次復号化されて２次復号化信号が得られる。方法は、１次ポストフィルタオーディオ信号と２次復号化信号に基づく信号とを合成して出力信号を得るステップを更に有する。出力信号は、１次ポストフィルタ信号と２次復号化信号に基づく信号との重み付け合成によって得られる。その後、出力信号が出力される。

本発明によれば、遅延を増加させることなく、スケーラブル音声及びオーディオコーデックの再構成信号の品質を向上させることができる。

ポストフィルタを有するオーディオコーデック又は音声コーデックの基本構造を示す図である。一般的なスケーラブルオーディオコーデック又は音声コーデックシステムを示すブロック図である。上位レイヤが非音声オーディオ信号の符号化をサポートする別のスケーラブルオーディオコーデックシステムを示すブロック図である。本発明に係る方法の一実施形態の手順を示すフローチャートである。本発明に係るデコーダ装置の一実施形態を示すブロック図である。本発明に係るスケーラブルデコーダ装置の一実施形態を示すブロック図である。本発明に係るスケーラブルデコーダ装置の別の実施形態を示すブロック図である。本発明に係る方法の別の実施形態の手順を示すフローチャートである。本発明に係るスケーラブルデコーダ装置の別の実施形態を示すブロック図である。図７に係る方法の特定の実施形態の部分的な手順を示すフローチャートである。本発明に係るスケーラブルデコーダ装置の別の実施形態を示すブロック図である。本発明に係るスケーラブルデコーダ装置の別の実施形態を示すブロック図である。本発明に係る方法の更に別の実施形態の手順を示すフローチャートである。本発明に係るスケーラブルデコーダ装置の別の実施形態を示すブロック図である。

本開示において、各図面及び実施形態における同等の又は直接対応する機能は同一の符号で示される。

詳細な説明の十分な理解を提供するため、いくつかの用語については混乱を避けるために、明示的に定義をしておく必要があろう。本開示において、用語「パラメータ」は一般名称として使用され、ビット又はビットストリームを含む任意の種類の信号の表現を表す。

２次デコーダに関係する種々の手段及び信号は以下のように規定される。「２次デコーダ（secondary decoder）」は、種々の２次復号化構成の一般的な表現である。これは、例えば２次エンハンスメントデコーダ又は２次再構成デコーダを含む。「２次エンハンスメントデコーダ（secondary enhancement decoder）」は、スケーラブル符号化に関係し、２次デコーダの部分集合である。そのような「２次エンハンスメントデコーダ」は、１次復号化信号等に加えられるある種の改善信号を提供する。「２次再構成デコーダ（secondary reconstruction decoder）」は、再構成信号空間の出力、すなわち再構成音声信号又はオーディオ信号を出力する２次デコーダを意味する。これは、２次デコーダがそのような出力を生成するか、あるいはスケーラブルコーデックの場合には出力が１次デコーダ出力及び２次エンハンスメントデコーダの出力に基づいて導出されることを意味してもよい。そのような２次デコーダから出力される信号は同様に示される。

本発明により達成される利点を理解するために、詳細な説明は、一般的なポストフィルタリングの簡単な説明から始める。図１は、ポストフィルタを含むオーディオ又は音声コーデックの基本構造を示す。送信機１は、入力オーディオ又は音声信号３をパラメータ４のストリームに符号化するエンコーダ１０を含む。一般に、パラメータ４は符号化され、受信機２に転送される。受信機２はデコーダ２０を含み、デコーダ２０は、元のオーディオ又は音声信号３を表すパラメータ４を受信し、それらのパラメータ４を復号化オーディオ又は音声信号５に復号化する。復号化オーディオ又は音声信号５は、可能な限り元のオーディオ又は音声信号３と類似することが意図される。しかし、復号化オーディオ又は音声信号５は多少の符号化ノイズを常に含む。受信機２はポストフィルタ３０を更に含み、ポストフィルタ３０は、復号化オーディオ又は音声信号５をデコーダ２０から受信し、ポストフィルタリング手順を実行し、そしてポストフィルタ復号化オーディオ又は音声信号６を出力する。

ポストフィルタの基本概念は、符号化ノイズがより低減されるように符号化ノイズのスペクトル形状を形成することであり、これは実質的に人間の聴知覚特性を活用する。一般にこれは、音声信号が相対的に高い電力（スペクトルピーク）を有する知覚感度の低い周波数領域にノイズが移動し、音声信号が低い電力（スペクトル谷）を有する領域からノイズが除去されるように行われる。２つの基本的なポストフィルタ手法として、フォルマントポストフィルタ、ピッチポストフィルタ、微細構造ポストフィルタとも呼ばれる短期ポストフィルタ及び長期ポストフィルタがある。適切な性能を得るために、適応ポストフィルタがよく使用される。

上述のように、ピッチポストフィルタ又は微細構造ポストフィルタは本発明で有用である。復号化音声信号のタイムシフトされた信号への復号化音声信号の重ね合わせの結果、特に音声高調波間において所望の音声信号に対して相関性のない符号化ノイズが減衰する。上述の効果は、非再帰型フィルタ構造及び再帰型フィルタ構造の双方により得られる。非特許文献４で説明される１つのそのような一般的な形式は以下の式で与えられる。

ただし、Tは音声のピッチ周期に対応する。

実際には、非再帰型フィルタ構造が好ましい。最近の１つの非再帰型ピッチポストフィルタ方法は、米国特許出願公開第２００５／０１６５６０３号において説明される。これは、３ＧＰＰ（第３世代パートナーシッププロジェクト）のAMR-WB+（拡張適応マルチレート広帯域コーデック）［3GPP TS 26.290］及び、３ＧＰＰ２のVMR-WB（可変レートマルチモード広帯域（VMR-WB）コーデック)［3GPP2 C.S0052-A: "Source-Controlled Variable-Rate Multimode Wideband Speech Codec (VMR-WB), Service Options 62 and 63 for Spread Spectrum Systems"］オーディオ及び音声符号化規格において適用される。ここで、基本概念は、第１に以下の関係により符号化ノイズ推定値r(n)を計算することである。

r(n) = y(n) - y_p(n)
ただし、y(n)は復号化オーディオ又は音声信号、y_pは以下のように計算される予測信号である。
y_p = 0.5・(y(n-T)) + y(n+T))

第２に、ノイズ推定値をローパス（又はバンドパス）フィルタリングし、係数αで重み付けした値を音声信号から減算し、その結果、エンハンスメントオーディオ又は音声信号を得る。
y_enh(n) = y(n) - α・LP{r(n)}

符号が反転した場合のローパスフィルタリングされたノイズ信号の適切な解釈は、その信号を符号化ノイズの低周波数部分を補償するエンハンスメント信号として見ることである。係数αは、予測信号及び復号化音声信号の相関性、予測信号のエネルギ、並びに音声信号及び予測信号の差のエネルギのある時間平均に応じて適応化される。

上述のように、上記定義式 y_p = 0.5・(y(n-T)) + y(n+T)) を評価する従来技術のピッチポストフィルタの１つの問題は、それらのポストフィルタが後続の１ピッチ周期の復号化音声信号y(n+T)が必要となり、その結果、アルゴリズム的な遅延が増加することである。AMR-WB+及びVMR-WBでは、利用可能な復号化オーディオ又は音声信号に基づいて、復号化オーディオ又は音声信号を後方に延ばすことにより、また、そのオーディオ又は音声信号はピッチ周期Tで周期的に延びていくと仮定することにより、その問題を解決している。復号化オーディオ又は音声信号が時間インデックスn⁺までのみ利用可能であるという仮定の下、後続のピッチ周期は以下の式に従って計算される。

この拡張は、単なる近似であるため、本来の後続の復号化音声信号を使用した場合に得られる品質と比較すると、品質に関しては妥協したものとなる。

本発明は、スケーラブル・オーディオ又は音声コーデック装置を考慮し、本発明の基本概念と共に使用できるいくつかのシステムを以下に簡単に説明する。図２は、一般的なスケーラブル・オーディオ又は音声コーデックシステムを示すブロック図である。ここでは、送信機１は、入力オーディオ又は音声信号３をパラメータ４のストリームに符号化するエンコーダ１０を含む。符号化全体は、２つのレイヤ、送信機における１次エンコーダ１１を含む下位レイヤ７及び送信機における２次エンコーダ１５を含む少なくとも１つの上位レイヤ８において行われる。スケーラブルコーデック装置は追加のレイヤを有してもよいが、ここでは２レイヤのデコーダシステムがモデルシステムとして使用される。しかし、本発明の原理は、３つ以上のレイヤを含むスケーラブルコーデックにも適用可能である。

１次エンコーダ１１は、入力オーディオ又は音声信号３を受信し、それを１次パラメータ１２のストリームに符号化する。更に１次エンコーダは、１次パラメータ１２を推定１次信号１３に復号化する。推定１次信号１３は、デコーダ側で１次パラメータ１２から取得される信号に対応するのが理想的である。推定１次信号１３は、比較器１４、この場合は減算器、において、元の入力オーディオ又は音声信号３と比較される。従って、差信号が、１次エンコーダ１１の１次符号化ノイズ信号１６である。１次符号化ノイズ信号１６は２次エンコーダに供給され、２次エンコーダはその信号を２次パラメータ１７のストリームに符号化する。それらの２次パラメータ１７は、１次パラメータ１２から復号化可能な信号の好適なエンハンスメントパラメータとして考えられる。それと共に、１次パラメータ１２及び２次パラメータ１７は、入力オーディオ又は音声信号３のパラメータ４の一般的なストリームを形成する。

一般に、パラメータ４は符号化されて受信機２に転送される。受信機２はデコーダ２０を含み、デコーダ２０は、元のオーディオ又は音声信号３を表すパラメータ４を受信し、それらのパラメータ４を復号化オーディオ又は音声信号５に復号化する。復号化全体は、２つのレイヤ、すなわち下位レイヤ７及び上位レイヤ８において行われる。受信機において、下位レイヤ７は１次デコーダ２１を含む。同様に、上位レイヤ８は受信機において２次デコーダ２５を含む。１次デコーダ２１は、パラメータ４のストリームの入力１次パラメータ２２を受信する。それらのパラメータはエンコーダ１０において作成されるパラメータと同一であるのが理想的であるが、送信ノイズはパラメータを歪ませている場合がある。１次デコーダ２１は、入力１次パラメータ２２を復号化１次オーディオ又は音声信号２３に復号化する。２次デコーダ２５は、同様に、パラメータ４のストリームの入力２次パラメータ２７を受信する。それらのパラメータはエンコーダ１０において作成されるパラメータと同一であるのが理想的であるが、この場合も送信ノイズによってパラメータが歪んでいる場合がある。２次デコーダ２１は、入力２次パラメータ２２を復号化エンハンスメントオーディオ又は音声信号２６に復号化する。この復号化エンハンスメントオーディオ又は音声信号２６は、可能な限り正確に１次エンコーダ１１の符号化ノイズに対応し、それにより１次デコーダ２１から得られる符号化ノイズと類似することが意図される。復号化１次オーディオ又は音声信号２３及び復号化エンハンスメントオーディオ又は音声信号２６は、加算器２４で加算され、最終的な出力信号５が出力される。

１次パラメータ２２のみが受信機２で受信される場合、受信機２が１次復号化のみをサポートする場合、あるいは、何らかの理由により２次復号化を実行しないと決定した場合は、得られる復号化エンハンスメントオーディオ又は音声信号２６はゼロとなり、出力信号５は復号化１次オーディオ又は音声信号２３と同一になる。これが、スケーラブルコーデックシステムの概念のフレキシビリティである。従来技術によれば、一般に、ポストフィルタリングは出力信号５に対して実行される。

今日、最も使用されるスケーラブル音声圧縮アルゴリズムは、１９９８年１１月のＩＴＵ−Ｔ勧告Ｇ．７１１「音声周波数のパルス符号変調（ＰＣＭ）（Pulse code modulation (PCM) of voice frequencies）」による６４ｋｂｐｓのA/U-law対数ＰＣＭコーデックである。８ｋＨｚサンプリングのＧ．７１１コーデックは、１２ビット又は１３ビットリニアＰＣＭ（パルス符号変調）サンプルを８ビット対数サンプルに変換する。対数サンプルのビット表現は、Ｇ．７１１ビットストリームの最下位ビット（ＬＳＢ）スチールを可能にし、Ｇ．７１１コーデックは実際には４８、５６及び６４ｋｂｐｓの間でＳＮＲ（信号対雑音比）スケーラブルとなる。このＧ．７１１コーデックのスケーラビリティは、帯域内制御信号の目的で回線交換通信網において使用される。このＧ．７１１のスケーラビリティの使用の最近の例は、従来の６４ｋｂｐｓのＰＣＭリンクを介する広帯域音声の設定及び転送を可能にする３ＧＰＰ−ＴＦＯプロトコル（３ＧＰＰのTS28.062によると、ＴＦＯ＝Tandem Free Operation）である。元の６４ｋｂｐｓのＧ．７１１ストリームのうちの８ｋｂｐｓは、狭帯域サービス品質にそれ程影響を及ぼさずに広帯域音声サービスの呼設定を可能にするためにまず使用される。呼設定の後、広帯域音声は、６４ｋｂｐｓのＧ．７１１ストリームのうち１６ｋｂｐｓを使用する。オープンループ・スケーラビリティをサポートする他の従来の音声符号化規格としては、１９９０年１２月のＩＴＵ−Ｔ勧告Ｇ．７２７「5-, 4-, 3-, and 2-bit/sample embedded adaptive differential pulse code modulation (ADPCM)」や、Ｇ．７２２（サブバンドＡＤＰＣＭ）がある。

スケーラブル音声符号化技術における更に最近の進歩は、ＭＰＥＧ−４（ＭＰＥＧ＝Moving Picture Experts Group)ＣＥＬＰにスケーラビリティを提供するＭＰＥＧ−４規格（ＩＳＯ／ＩＥＣ−１４４９６）である。ＭＰＥ基本レイヤは、追加のフィルタパラメータ情報又は追加の新しいパラメータ情報の送信により拡張されうる。国際電気通信連合の標準化部門であるＩＴＵ−Ｔは、近年、Ｇ．７２９．ＥＶと呼ばれるＩＴＵ−Ｔ勧告Ｇ．７２９．１「G.729 based Embedded Variable bit-rate coder: An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729」（２００６年５月）に係る新たなスケーラブルコーデックの標準化を終了した。このスケーラブル音声コーデックのビットレートの範囲は、８ｋｂｐｓ〜３２ｋｂｐｓである。このコーデックの主な使用例は、いくつかのＶｏＩＰ（Voice over IP（インターネットプロトコル））呼び出しの間の共有ｘＤＳＬ６４／１２８ｋｂｐｓ（ＤＳＬ＝デジタル加入者回線、ｘＤＳＬ＝種々の特定のＤＳＬ方法の一般的名称）アップリンク等のホーム又はオフィスゲートウェイにおける制限のある帯域幅リソースの効率的な共有を可能にすることである。

スケーラブル音声符号化の最近の１つの傾向は、音楽等の非音声オーディオ信号の符号化のサポートを上位レイヤで提供することである。１つのそのような方法を図３に示す。そのようなコーデックにおいて、下位レイヤ７は、例えばＣＥＬＰ（符号励振線形予測）が周知の例である合成による分析（ＡｂＳ）パラダイムによる従来の音声符号化を採用する。本実施形態において、１次エンコーダ１１はＣＥＬＰエンコーダ１８であり、１次デコーダ２１はＣＥＬＰデコーダ２８である。そのような符号化は音声にのみよく適しており、音楽等の非音声オーディオ信号にはあまり適さないため、上位レイヤ８はオーディオコーデックにおいて使用される符号化パラダイムに従って動作する。従って、本実施形態において、２次エンコーダはオーディオエンコーダ１９であり、２次デコーダはオーディオデコーダ２９である。本実施形態において、一般に上位レイヤ８の符号化は下位レイヤの符号化の符号化誤差に対して動作する。

次に、本発明の中心部分を説明する。本発明は、上述のスケーラブル音声又はオーディオコーデックに対する構造的な類似点を有するコーデックに関する。１次復号化及び２次復号化が利用され、結果として得られる信号が合成される。現在、一般的な実現例はスケーラブル音声又はオーディオコーデックであると考えられており、この実現例において、コーデックは１次下位レイヤ符号化を実行し、２次上位レイヤコーデックが使用される。この概念は、一般に１次コーデックが２次コーデックよりアルゴリズム的に短い遅延を有するということを更に使用する。一般にこれは、例えば１次コーデックが時間領域音声コーデックであり、２次コーデックが例えば周波数領域オーディオコーデックである場合である。２つの符号化原理は互いに異なり、従って異なる種類の符号化ノイズを発生する。ポストフィルタリングが復号化１次オーディオ又は音声信号から構成される場合、信号を強調するために２つの異なる信号が利用可能である。概念は、２つの成分強調信号の合成として、１次符号化ノイズを補償する最終的なエンハンスメント信号を構成する。第１の成分は、下位レイヤ１次復号化信号から得られ、ポストフィルタリングにより強調され、第２の成分は、上位レイヤ２次復号化信号から得られる。特定の一実施形態において、ポストフィルタリングはピッチポストフィルタに関係する。

図４は、本発明に係る方法の一実施形態の手順を示すフローチャートである。オーディオを表す符号化信号を復号化する方法はステップ２００で開始する。ステップ２１０において、符号化信号のパラメータが受信される。１次復号化信号へのパラメータの１次復号化は、ステップ２２０において実行される。ステップ２２２において、１次復号化信号は１次ポストフィルタリングされて１次ポストフィルタ信号が出力される。同時に、符号化信号のパラメータは、ステップ２３０において２次復号化されて２次復号化信号が出力される。本実施形態において、ステップ２３０は２つのサブステップを含む。ステップ２３１において、符号化信号のパラメータは、２次復号化エンハンスメント信号に復号化された２次エンハンスメントである。ステップ２３２において、２次復号化再構成信号は、２次復号化エンハンスメント信号及び１次復号化信号に基づいて出力される。一般にこれは、必要に応じて２次復号化エンハンスメント信号を得るためのアルゴリズム的な遅延に等しい量だけ遅延される１次復号化信号に２次復号化エンハンスメント信号を加算することにより行われる。なお、一般に２次エンハンスメント信号は重み付き音声領域において符号化され、符号化の知覚特性を向上させる。実質的に、重み付き領域における符号化により、符号化ノイズのスペクトルは、そのような重み付けを行わない場合と比較して低減されるように形成される。従って、好ましくは、１次信号は２次復号化エンハンスメント信号の加算前に重み演算子Wを使用して重み付き音声領域に変換される必要がある。加算後、和信号は演算子W^-1を使用して逆重み付けされ、重み付けされていない２次復号化再構成信号を生成する。１次ポストフィルタリングのステップは、２次復号化及び１次復号化による遅延差を利用するのが好ましい。ステップ２４０において、１次ポストフィルタ信号及び２次復号化信号に基づく信号が出力信号に合成される。本実施形態において、２次復号化信号に基づく信号は、２次復号化信号をフィルタリングした信号である。合成は、１次ポストフィルタ信号及び２次復号化エンハンスメント信号に基づく信号からの寄与が重み付けられるように実行される。重み付けは適応可能であることが好ましい。合成ステップは、信号特性を検出し、それにより信号重みが検出された特性に応じて適応されることを含むとよい。そのような信号特性の例については以下で説明する。ステップ２４８で、出力信号が出力される。ステップ２４９において、処理は終了する。

一般に、１次復号化信号が２次復号化信号より少ない遅延を有するため、下位レイヤ及び上位レイヤの双方に対するデコーダは、デコーダの加算ポイントにおいて双方の信号を適切に合成するために遅延差を補償する必要がある。これは、単純にその遅延差を使用して１次復号化信号を遅延させるか又はバッファリングすることにより行われる。本発明によると、高品質ポストフィルタリングに対してその利用可能な余分な遅延を利用することは有用である。そのような利用により、追加の情報がポストフィルタリングにおいて利用されることを可能にする。レイヤ遅延補償バッファにおいて、更なる将来の１次復号化信号はより大きな時間インデックスn⁺まで利用可能である。ここでは１次復号化信号の対応する追加の時間延長が回避されるため、その信号に対するポストフィルタは符号化ノイズを除去する際に明らかにより適切なジョブを行える。

本発明の別の側面は、２次コーデックが１次コーデックの実際の符号化誤差に対して動作することである。従って、２次コーデックは、そのビットレート及び性能に依存して、１次コーデックによって生じる符号化ノイズを少なくともある程度補償する。換言すると、１次復号化オーディオ信号を向上することを目的とする利用可能なエンハンスメント信号は２つ存在する。種々の状況において、エンハンスメント信号の一方又は他方がより適切である。本発明は、それを利用し、種々のエンハンスメント信号及び１次復号化オーディオ信号を最終的な出力信号に合成する。使用される種々のエンハンスメント信号の相対的な量を実際に受信された信号の特性に依存させることにより、適切な混合が提供される。ある状況においては、２次デコーダエンハンスメントのみが使用され、他の状況においては、ポストフィルタ１次復号化信号のみが使用され、更に他の状況においては、それらの間の混合が存在する。

図５は、本発明に係るデコーダ装置５０の一実施形態を示すブロック図である。オーディオ又は音声を表す信号に対するデコーダ装置５０は、符号化信号のパラメータ４の入力部４０を含む。１次デコーダ２１は、入力部４０に接続される。１次デコーダ２１は、パラメータ４に基づいて１次復号化信号２３を提供するように構成される。１次ポストフィルタ３１は、１次デコーダ２１の出力に接続され、１次復号化信号２３を受信する。１次ポストフィルタ３１は、本実施形態においては高遅延ポストフィルタ３３であり、２次デコーダ２５及び１次デコーダ２１による遅延差を利用し、ポストフィルタリングの目的で「将来」の情報を利用することを可能にする。これにより、１次ポストフィルタ３１は１次ポストフィルタ信号３２を出力する。

上述のように、デコーダ装置５０は、入力部４０に接続される２次デコーダ２５を含む。２次デコーダ２５は、パラメータ４に基づいて２次復号化信号４４を出力するように構成される。本実施形態において、２次復号化信号は２次復号化再構成信号でもある。

デコーダ装置５０は、１次ポストフィルタ信号３２と２次復号化信号４４に基づく信号５３とを合成し、出力部６０を介して出力される出力信号６を得る合成器５５を更に含む。本実施形態において、２次復号化信号４４に基づく信号５３は、２次復号化信号４４自体である。合成器５５は、１次ポストフィルタ信号３２及び２次復号化信号４４からの寄与のために重みβ及び(1-β)をそれぞれ有する１次ポストフィルタ信号３２及び２次復号化信号４４を加算する適応加算器５６を含む。

本実施形態は、単一の係数βを使用してその合成を行い、β×１次ポストフィルタ信号＋(1-β)×２次復号化信号、として合計デコーダ出力を構成する単純な方法を示す。このように、合計再構成信号の電力が重み付け係数の影響を受けないことが保証される。本実施形態において、重み付けは、係数βの大きさを制御する適応制御５１により制御される。係数βは、適応制御５１により制御され、βの値は０≦β≦１であると仮定する。合成器５５は、信号特性を検出する手段５４を含む。本実施形態において、信号特性は、パラメータ４を含むビットストリームの特性である。適応制御５１は、検出された信号特性に応じて係数βの値を選択する。それにより、適応加算器５６は、検出された特性に基づいて重み、すなわち係数βを適応化し、２つのエンハンスメント信号間の適切な混合を提供できる。そのような信号特性は、例えば受信したビットストリームのビットレート及び損失／破損したビット又はフレームの指示であってもよい。特に、受信したビットストリームが２次エンコーダビットを少しでも含むかに依存して適応化が行われる。

更に、符号化信号の特性又は信号を適切に符号化するコーデックの能力に応じた適応化が考えられる。

図６は、本発明に係るデコーダ装置５０の別の実施形態を示すブロック図である。本実施形態は、オーディオ又は音声を表す信号のためのスケーラブルデコーダ装置である。ここでは、１次デコーダ２１は、パラメータ４に基づいて及び特に下位レイヤパラメータ２２に基づいて１次復号化信号２３を提供するように構成される。本実施形態において、これはコアデコーダ４１により実行される。特定の実施形態において、コアデコーダ４１は、実際にはスケーラブルであり２つのレイヤを有する。第１のレイヤは８ｋｂｐｓのレートで動作し、第２のレイヤまでの符号化は１２ｋｂｐｓのレートを提供する。

２次デコーダ２５は、パラメータ４又は特にその上位レイヤパラメータ２７に基づいて２次復号化信号４４を提供するように構成される。本実施形態において、２次デコーダ２５は、２次再構成デコーダ１２５である。２次再構成デコーダ１２５は２次エンハンスメントデコーダ４５を含み、２次エンハンスメントデコーダ４５は上位レイヤパラメータに基づいて２次復号化エンハンスメント信号５２を提供するように構成される。本実施形態において、２次エンハンスメントデコーダ４５はレイヤード２次デコーダ４７を含む。レイヤード２次デコーダは、１６ｋｂｐｓの合計レートを与える１つのレイヤ、２４ｋｂｐｓを与える別のレイヤ及び３２ｋｂｐｓを与える更に別のレイヤを有する。この特定の実施形態における２次エンハンスメントデコーダ４５は、ＩＭＤＣＴ４６（逆修正離散コサイン変換）を更に含む。本実施形態において、２次デコーダ２５は、１次デコーダ２１の出力に更に接続され、１次復号化信号２３にアクセスできる。１次復号化信号２３は、２次エンハンスメント信号が加算される重み付き音声領域に変換されるために、重み付きフィルタ４２を通過するのが好ましい。上述のように、本実施形態の２次エンハンスメントデコーダ４５は、１フレームの余分な遅延を有する２次エンハンスメント信号を復号化する。この余分な遅延は、実際の２次デコーダ合成により発生する可能性がある。しかし、余分な遅延は、復号化中ではなく符号化中のより大きな遅延によっても発生する可能性がある。従って、１次復号化信号２３はバッファ４３において１フレーム分遅延する。２次復号化エンハンスメント信号５２及び遅延する１次復号化信号は加算器４８で合計される。この合計された信号は逆フィルタ４９を通過し、２次復号化再構成信号１４４の形式で２次復号化信号を提供する。換言すると、本実施形態において、２次デコーダ２５はパラメータ４及び１次復号化信号２３に基づいて２次復号化信号を提供するように構成される。

なお、２次エンハンスメントデコーダ４５が復号化エンハンスメント信号を提供できない場合、２次復号化再構成信号１４４は遅延する１次復号化信号と同一になる。別の実施形態において、２次復号化再構成信号１４４はヌル信号に設定され、合成器により抑制される。

スケーラブルデコーダ装置５０は、図５と類似する合成器５５を更に含む。ここでも、合成器５５は信号特性を検出する手段５４を含む。上述のように、本実施形態においては、受信したビットストリームが、１次復号化信号とは異なる２次復号化信号を再生する２次エンコーダビットを少しでも含むかどうかに依存して、適応化が行われる。これによって、合成は、着目する低周波帯域における１次復号化信号と前記２次復号化信号との間の類似性に基づいて行われる。

一般に、２次デコーダはある程度の符号化ノイズを残す。図７は、その事実に対処するスケーラブルデコーダ装置５０の一実施形態を示すブロック図である。２次符号化ノイズは２次ポストフィルタ３４により低減されるが、２次ポストフィルタ３４は完全なコーデックの符号化遅延を増加しないように復号化信号の時間延長を適用する必要がある。２次ポストフィルタ３４は、２次再構成デコーダ２５の出力に接続され、２次復号化信号４４、本実施形態においては２次復号化再構成信号１４４を受信する。上述のように、本実施形態において、２次ポストフィルタ３４は低遅延ポストフィルタ３６である。それにより、２次ポストフィルタ３４は２次ポストフィルタ信号３５を提供する。この２次ポストフィルタ信号３５は、合成器５５において２次復号化信号４４に基づく信号５３として利用される。

図８は、同様のデコーダ構成により使用される方法の一実施形態を示すフローチャートである。図４において提供されるステップに加え、追加のステップ２３４が追加される。ステップ２３４において、２次復号化信号は２次ポストフィルタ信号に２次ポストフィルタリングされる。それにより、２次ポストフィルタ信号は２次復号化エンハンスメント信号に基づく信号として使用される。

ここで、１次復号化信号に提供される高遅延高品質ポストフィルタは、符号化ノイズを補償するための適切な能力を有することが当業者には理解されよう。同時に、好ましくは低遅延ポストフィルタと組み合わされる２次コーデックもまた、基本的に１次エンコーダの符号化ノイズを補償する。従って、双方の要素の符号化ノイズ補償能力は競合し、高品質ポストフィルタを有する１次デコーダの出力又は低遅延ポストフィルタを有する２次デコーダの出力のうちのどちらがより適切な合計デコーダ出力信号を提供するかは明らかではない。

２次エンコーダの性能が低い場合、一般に、高品質ポストフィルタによる１次復号化信号の出力が好ましい。これは、例えばビットレートが低いか又は２次復号化信号が全く入手可能でない場合である。２次コーデックがほぼ全ての符号化ノイズを補償できる場合、低遅延ポストフィルタによる２次復号化信号の出力が好ましい。これは、一般に２次コーデックの性能及びビットレートが高い場合である。概念は、双方の信号の線形結合としてデコーダの合計出力を構成し、この線形結合における重み付け係数を適応化させることである。

本発明の１つの更なる側面は、特に、使用されるピッチポストフィルタ及びスケーリング係数αに関する。スケーリング係数αは、復号化音声信号から減算される前に符号化ノイズ推定値をスケーリングする。高品質１次ポストフィルタがより正確に符号化ノイズを推定するため、より正確でない符号化ノイズ推定を実行する２次ポストフィルタより強いスケーリング係数αを使用するのが適切である。

本発明に係るスケーラブルデコーダ装置５０の別の実施形態を図９に示す。ここで、合計デコーダ出力信号に対する合成エンハンスメント信号６５は、１次ポストフィルタエンハンスメント信号６４及び本実施形態においては２次ポストフィルタエンハンスメント信号６３である２次エンハンスメント信号６９に基づくエンハンスメント信号に基づいて計算される。合成器５５は、１次ポストフィルタエンハンスメント信号６４を抽出する手段を有する。その目的のために、１次復号化信号２３は、１次ポストフィルタ３１のアルゴリズム的な遅延に対応する時間だけバッファ５７において遅延される。１次ポストフィルタエンハンスメント信号６４は、減算器５８において遅延した１次復号化信号を高品質１次ポストフィルタ信号３２から減算することにより取得される。

同様に、２次ポストフィルタエンハンスメント信号６３が取得される。すなわち、合成器５５は２次ポストフィルタエンハンスメント信号６３を抽出する手段を更に含む。これは、２次復号化信号４４を低遅延２次ポストフィルタ信号３５から減算することにより減算器５９において実行される。上記実施形態のように、これらの２つのポストフィルタエンハンスメント信号６３、６４は、好ましくは単一の制御係数βを使用して線形結合される。結果として得られる合計合成エンハンスメント信号６５が作成される。

合成エンハンスメント信号６５は、フィルタ６１においてローパス（又はバンドパス）フィルタリングされてローパスフィルタ合成エンハンスメント信号６６とされるのが好ましい。合成エンハンスメント信号６５又はローパスフィルタ合成エンハンスメント信号６６等の合成エンハンスメント信号６５に基づく任意の信号は、加算器６２において１次復号化信号に基づく信号に加算され、出力信号６を提供する。本実施形態において、１次復号化信号に基づく信号は２次復号化再構成信号１４４である。その結果、最終的には、エンハンスメント合計デコーダ出力信号６が得られる。先の実施形態と比較して本実施形態の利点は、２つのポストフィルタにおける可能なローパス（又はバンドパス）フィルタリングが回避されることであり、それにより数値的な複雑さ及び数値的な精度が低減される。

本実施形態において、１次ポストフィルタ信号及び２次ポストフィルタ信号の線形結合係数βは、考慮されるポストフィルタの関連する低周波数帯域における１次復号化信号及び２次復号化信号の類似性に基づいて適応される。本実施形態において、受信信号の特性を検出する手段５４は、遅延する１次復号化信号６８及び２次復号化信号４４の特性を検出するように構成される。これらの信号が非常に類似する場合、係数βは大きな値（１に近い値）をとり、１次高品質ポストフィルタエンハンスメント信号の出力が好ましいことを意味する。考慮されるローバンドの１次復号化信号及び２次復号化信号の類似性が、そのバンドにおける２次コーデックの効果は小さく、高品質ポストフィルタの符号化ノイズ除去効果が好ましいことを意味するため、これは適切な適応である。

図１０は、本発明に係る方法の一実施形態の対応する合成ステップの部分的なステップを示すフローチャートである。この合成ステップ２４０は、第２の復号化信号及びその信号のポストフィルタリングが使用可能である場合に使用されることを意図する。合成ステップ２４０は、ステップ２４１において１次ポストフィルタエンハンスメント信号を抽出することを含む。ステップ２４２において、本実施形態においては２次ポストフィルタエンハンスメント信号である２次復号化信号に基づくエンハンスメント信号が抽出される。ステップ２４３において、１次ポストフィルタエンハンスメント信号及び２次復号化信号に基づくエンハンスメント信号は合成エンハンスメント信号に合成される。上記実施形態と同様に、合成は寄与する信号の重み付けにより行われる。ステップ２４４において、合成エンハンスメント信号は合成エンハンスメント信号に基づく信号にローパスフィルタリングされる。あるいは、合成エンハンスメント信号は帯域フィルタリングされるか又はステップが省略される。最後にステップ２４５において、前記合成エンハンスメント信号に基づく信号、すなわち本実施形態においてはローパスフィルタ合成エンハンスメント信号は、１次復号化信号に基づく信号に加算され、出力信号を提供する。本実施形態において、１次復号化信号に基づく信号は２次復号化信号である。

本発明に係るスケーラブルデコーダ装置５０の別の実施形態を図１１に示す。これは、図９の実施形態にある程度類似しており、ここでは相違点のみを説明する。本実施形態において、前記２次復号化エンハンスメント信号６９に基づく信号、すなわち合計２次エンハンスメント信号６７は、２次ポストフィルタ信号と１次復号化信号を遅延した信号６８との差として抽出される。この合計２次エンハンスメント信号６７は、２次ポストフィルタ及び２次デコーダからの合成エンハンスメントを表す。本実施形態において、合成エンハンスメント信号６５は、信号６６にローパスフィルタリングされた後に１次復号化信号２３を遅延した信号６８に加算される。１次復号化信号の遅延は、その信号が１次ポストフィルタエンハンスメント信号６４及び２次ポストフィルタエンハンスメント信号６７の抽出に関わるため既に利用可能である。

これまでの種々の実施形態において、完全に復号化された２次信号は手順のあるステップにおいて提供される。しかし、直接組み合わせて２次復号化エンハンスメント信号５２を使用することも可能である。本発明に係るスケーラブルデコーダ装置５０のそのような一実施形態を図１２に示す。ここでは、２次復号化エンハンスメント信号６９に基づくエンハンスメント信号は２次復号化エンハンスメント信号５２自体である。完全な２次復号化再構成信号が利用可能でないため、本実施形態において、１次復号化信号に基づく信号は前記１次復号化信号２３を遅延した信号６８である。

図１３は、対応するフローチャートを示す。先のフローチャートと比較すると、複数のステップが省略される。２次再構成復号化は実行されず、２次ポストフィルタリングも実行されない。２次復号化エンハンスメント信号のみが利用可能であるため、適切な２次ポストフィルタエンハンスメント信号を抽出するステップも省略される。

図１２に対する別の実施形態を図１４に示す。ここでは、２次ポストフィルタ３４は、２次エンハンスメントデコーダ４５の出力に直接接続される。それにより、２次復号化エンハンスメント信号６９に基づくエンハンスメント信号は２次ポストフィルタ３４からの出力信号である。対応する方法は、２次ポストフィルタリングステップが追加された状態の図１３に従う。

上述の実施形態は、本発明のいくつかの例として理解されよう。本発明の範囲から逸脱することなく、実施形態に対する種々の変形、組み合わせ、変更が行われうることは、当業者には理解されるだろう。特に、技術的に可能であれば、種々の実施形態における種々の部分的な解決策は他の構成と組み合わせ可能である。本発明の範囲は添付の特許請求の範囲によって定義される。

Claims

オーディオ又は音声を表す信号のためのデコーダ装置（５０）であって、
符号化信号のパラメータ（４）を入力する入力部（４０）と、
前記入力部（４０）に接続され、前記パラメータ（４）に基づいて１次復号化信号（２３）を出力する１次デコーダ（２１）と、
前記１次デコーダ（２１）の出力部に接続され、１次ポストフィルタ信号（３２）を出力する１次ポストフィルタ（３１）と、
前記入力部（４０）に接続され、前記パラメータ（４）に基づいて２次復号化信号（４４）を出力する２次デコーダ（２５）と、
前記１次ポストフィルタ信号（３２）と前記２次復号化信号に基づく信号（５３）とを重み付け合成して出力信号（６）を得る合成器（５５）と、
前記合成器（５５）に接続され、前記出力信号（６）を出力する出力部（６０）と、
を有することを特徴とするデコーダ装置。
前記合成器（５５）は、前記重み付け合成を適応化することを特徴とする請求項１に記載のデコーダ装置。
前記合成器（５５）は、信号特性を検出する手段（５４）を含み、前記適応化は、前記信号特性に応じて実行されることを特徴とする請求項２に記載のデコーダ装置。
前記信号特性を検出する手段（５４）は、着目する低周波帯域における前記１次復号化信号（２３）と前記２次復号化信号（４４）との間の類似性を検出することを特徴とする請求項３に記載のデコーダ装置。
前記信号特性を検出する手段（５４）は、受信したビットストリームの、前記１次復号化信号（２３）とは異なる前記２次復号化信号（４４）を再生する部分を検出することを特徴とする請求項３に記載のデコーダ装置。
前記１次ポストフィルタ（３１）は、前記１次復号化信号（２３）と前記２次復号化信号（４４）との遅延差を利用する高遅延ポストフィルタ（３３）であることを特徴とする請求項１乃至４のいずれか１項に記載のデコーダ装置。
前記２次デコーダ（２５）は、２次エンハンスメントデコーダ（４５）を有する２次再構成デコーダ（１２５）であり、更に、前記１次デコーダ（２１）の出力と接続され、
前記２次エンハンスメントデコーダ（４５）は、前記パラメータ（４）に基づいて２次復号化エンハンスメント信号（５２）を出力し、
前記２次再構成デコーダ（１２５）は、前記２次復号化エンハンスメント信号（５２）と前記１次復号化信号（２３）とに基づいて２次復号化再構成信号（１４４）を出力する
ことを特徴とする請求項１乃至６のいずれか１項に記載のデコーダ装置。
前記２次復号化信号に基づく前記信号（５３）は、前記２次復号化再構成信号（１４４）であることを特徴とする請求項７に記載のデコーダ装置。
前記２次デコーダ（２５）の出力と接続され、２次ポストフィルタ信号（３５）を出力する２次ポストフィルタ（３４）を更に有し、
前記２次復号化信号に基づく信号（５３）は、前記２次ポストフィルタ信号（３５）である
ことを特徴とする請求項７に記載のデコーダ装置。
前記合成器（５５）は、１次ポストフィルタエンハンスメント信号（６４）を抽出する手段を更に含み、
前記合成器（５５）は、前記１次ポストフィルタエンハンスメント信号（６４）と前記２次復号化信号（４４）に基づくエンハンスメント信号（６９）とを重み付け合成して合成エンハンスメント信号（６５）を得るように構成され、
前記合成器（５５）は、前記合成エンハンスメント信号（６５）に基づく信号と前記１次復号化信号（２３）に基づく信号とを加算して前記出力信号（６）を出力する手段（６２）を更に含む
ことを特徴とする請求項１乃至６のいずれか１項に記載のデコーダ装置。
前記合成器（５５）は、前記合成エンハンスメント信号（６５）をフィルタリングして、前記合成エンハンスメント信号（６５）に基づく前記信号として使用されるフィルタ信号（６６）を得るローパスフィルタ（６１）及びバンドパスフィルタのうちのいずれか一方を更に含むことを特徴とする請求項１０に記載のデコーダ装置。
前記２次デコーダ（２５）は、２次エンハンスメントデコーダ（４５）であり、
前記２次エンハンスメントデコーダ（４５）は、前記パラメータ（４）に基づいて２次復号化エンハンスメント信号（５２）を出力する
ことを特徴とする請求項１０又は１１記載のデコーダ装置。
前記２次復号化信号に基づく前記エンハンスメント信号（６９）は、前記２次復号化エンハンスメント信号（５２）であり、
前記１次復号化信号（２３）に基づく前記信号は、前記１次復号化信号を遅延した信号（６８）である
ことを特徴とする請求項１２に記載のデコーダ装置。
前記２次エンハンスメントデコーダ（４５）の出力に接続される２次ポストフィルタ（３４）を更に有し、
前記２次復号化信号に基づく前記エンハンスメント信号（６９）は、前記２次ポストフィルタからの出力信号（３５）であり、
前記１次復号化信号（２３）に基づく前記信号は、前記１次復号化信号を遅延させた信号（６８）である
ことを特徴とする請求項１２に記載のデコーダ装置。
前記２次デコーダ（２５）は、２次エンハンスメントデコーダ（４５）を有する２次再構成デコーダ（１２５）であり、更に、前記１次デコーダ（２１）の出力と接続され、
前記２次エンハンスメントデコーダ（４５）は、前記パラメータ（４）に基づいて２次復号化エンハンスメント信号（５２）を出力し、
前記２次再構成デコーダ（１２５）は、前記２次復号化エンハンスメント信号（５２）と前記１次復号化信号（２３）とに基づいて２次復号化再構成信号（１４４）を出力し、
前記２次デコーダ（２５）の出力と接続され、２次ポストフィルタ信号（３５）を出力する２次ポストフィルタ（３４）を更に有する
ことを特徴とする請求項１０又は１１に記載のデコーダ装置。
前記合成器（５５）は、前記２次復号化信号（４４）に基づく前記エンハンスメント信号（６９）として使用される２次ポストフィルタエンハンスメント信号（６７）を抽出する手段を更に含み、
前記１次復号化信号に基づく前記信号は、前記２次復号化再構成信号（１４４）である
ことを特徴とする請求項１５に記載のデコーダ装置。
前記合成器（５５）は、前記２次ポストフィルタ信号（３５）と前記１次復号化信号を遅延させた信号（６８）との差として前記２次復号化信号に基づく前記エンハンスメント信号（６９）を抽出する手段を更に含み、
前記１次復号化信号（２３）に基づく前記信号は、前記１次復号化信号を遅延させた信号（６８）である
ことを特徴とする請求項１５に記載のデコーダ装置。
前記デコーダ装置（５０）はスケーラブルデコーダ装置であることを特徴とする請求項１乃至１７のいずれか１項に記載のデコーダ装置。
オーディオ又は音声を表す符号化信号を復号化する方法であって、
符号化信号のパラメータ（４）を受信する受信ステップ（２１０）と、
前記パラメータ（４）を１次復号化して１次復号化信号（２３）を得るステップ（２２０）と、
前記１次復号化信号（２３）を１次ポストフィルタリングして１次ポストフィルタ信号（３２）を得る１次ポストフィルタリングステップ（２２２）と、
前記パラメータを２次復号化して２次復号化信号（４４）を得る２次復号化ステップ（２３０）と、
前記１次ポストフィルタ信号（３２）と前記２次復号化信号（４４）に基づく信号（５３）とを重み付け合成して出力信号（６）を得る合成ステップ（２４０）と、
前記出力信号（６）を出力する出力ステップ（２４８）と、
を有することを特徴とする方法。
前記合成ステップ（２４０）は、前記重み付け合成を適応化するステップを含むことを特徴とする請求項１９に記載の方法。
前記合成ステップ（２４０）は、信号特性を検出する検出ステップを含み、前記適応化は、前記検出された信号特性に応じて実行されることを特徴とする請求項２０に記載の方法。
前記検出ステップは、着目する低周波帯域における前記１次復号化信号（２３）と前記２次復号化信号（４４）との間の類似性を検出するステップを含むことを特徴とする請求項２１に記載の方法。
前記検出ステップは、受信ビットストリームの、前記１次復号化信号（２３）とは異なる前記２次復号化信号（４４）を再生する部分を検出するステップを含むことを特徴とする請求項２１に記載の方法。
前記１次ポストフィルタリングステップは、前記１次復号化信号（２３）と前記２次復号化信号（４４）との遅延差を利用することを特徴とする請求項１９乃至２３のいずれか１項に記載の方法。
前記２次復号化ステップ（２３０）は、
前記パラメータ（４）を２次エンハンスメント復号化して２次復号化エンハンスメント信号（５２）を得るステップ（２３１）と、
前記２次復号化エンハンスメント信号（５２）と前記１次復号化信号（２３）とに基づいて、前記２次復号化信号（４４）として使用される２次復号化再構成信号（１４４）を再構成するステップ（２３２）と、
を含むことを特徴とする請求項１９乃至２４のいずれか１項に記載の方法。
前記２次復号化信号（４４）に基づく前記信号（５３）は、前記２次復号化再構成信号（１４４）であることを特徴とする請求項２５に記載の方法。
前記２次復号化再構成信号（１４４）を２次ポストフィルタリングして２次ポストフィルタ信号（３５）を得るステップ（２３４）を更に有し、
前記２次ポストフィルタ信号（３５）は、前記２次復号化信号（４４）に基づく前記信号（５３）として使用される
ことを特徴とする請求項２５に記載の方法。
前記合成ステップは、
１次ポストフィルタエンハンスメント信号（６４）を抽出するステップ（２４１）と、
前記１次ポストフィルタエンハンスメント信号（６４）と前記２次復号化信号（４４）に基づくエンハンスメント信号（６９）とを重み付け合成して合成エンハンスメント信号（６５）を得るステップ（２４３）と、
前記合成エンハンスメント信号（６５）に基づく信号と前記１次復号化信号（２３）に基づく信号とを加算して前記出力信号（６）を出力するステップ（２４５）と、
を含むことを特徴とする請求項１９乃至２４のいずれか１項に記載の方法。
前記合成ステップ（２４０）は、前記合成エンハンスメント信号（５６）に対してローパスフィルタリング（２４４）及びバンドパスフィルタリングのうちの少なくとも一方を行い、前記合成エンハンスメント信号に基づく前記信号として使用されるフィルタ信号（６６）を得るフィルタリングステップを更に含むことを特徴とする請求項２８に記載の方法。
前記２次復号化ステップ（２３０）は、前記パラメータ（４）を２次エンハンスメント復号化して前記２次復号化信号（４４）として使用される２次復号化エンハンスメント信号（５２）を得るステップ（２３１）を含むことを特徴とする請求項２８又は２９に記載の方法。
前記１次復号化信号（２３）を遅延させるステップを更に有し、
前記２次復号化エンハンスメント信号（５２）は、前記２次復号化信号（４４）に基づく前記エンハンスメント信号（６９）として使用され、
前記１次復号化信号（２３）を遅延させた前記信号（６８）は、前記１次復号化信号（２３）に基づく前記信号として使用される
ことを特徴とする請求項３０に記載の方法。
前記１次復号化信号を遅延させるステップと、
前記２次復号化エンハンスメント信号（５２）を２次ポストフィルタリングして２次ポストフィルタエンハンスメント信号を得るステップと、
を更に有し、
前記２次ポストフィルタエンハンスメント信号は、前記２次復号化エンハンスメント信号に基づく前記エンハンスメント信号（６９）として使用され、
前記１次復号化信号（２３）を遅延させた前記信号（６８）は、前記１次復号化信号（２３）に基づく前記信号として使用される
ことを特徴とする請求項３０に記載の方法。
前記２次復号化ステップ（２３０）は、
前記パラメータ（４）を２次エンハンスメント復号化して２次復号化エンハンスメント信号（５２）を得るステップ（２３１）と、
前記２次復号化エンハンスメント信号（５２）と前記１次復号化信号（２３）とに基づいて前記２次復号化信号（４４）として使用される２次復号化再構成信号（１４４）を再構成するステップ（２３２）と、
を含み、
前記方法は、前記２次復号化信号（４４）を２次ポストフィルタリングして２次ポストフィルタ信号（３５）を得るステップ（２３４）を更に有する
ことを特徴とする請求項２８又は２９に記載の方法。
前記合成ステップ（２４０）は、前記２次復号化信号（４４）に基づく前記エンハンスメント信号（６９）として使用される２次ポストフィルタエンハンスメント信号を抽出するステップ（２４２）を含み、
前記２次復号化再構成信号（１４４）は、前記１次復号化信号（２３）に基づく前記信号として使用される
ことを特徴とする請求項３３に記載の方法。
前記１次復号化信号（２３）を遅延させるステップを更に有し、
前記合成ステップ（２４０）は、前記２次ポストフィルタ信号と前記１次復号化信号（２３）を遅延させた前記信号（６８）との差として前記２次復号化信号に基づく前記エンハンスメント信号（６９）を抽出するステップ（２４２）を含み、
前記１次復号化信号（２３）を遅延させた前記信号（６８）は、前記１次復号化信号に基づく前記信号として使用される
ことを特徴とする請求項３３に記載の方法。
前記パラメータ（４）は、スケーラブルエンコーダパラメータであることを特徴とする請求項１９乃至３５のいずれか１項に記載の方法。