JP4963955B2

JP4963955B2 - 信号処理方法、信号処理装置及びプログラム

Info

Publication number: JP4963955B2
Application number: JP2006356215A
Authority: JP
Inventors: 修藤井
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2006-12-28
Filing date: 2006-12-28
Publication date: 2012-06-27
Anticipated expiration: 2026-12-28
Also published as: JP2008165051A

Description

本発明は、符号化音響信号を逆量子化した音響信号を処理する信号処理方法、信号処理装置、該信号処理装置をコンピュータとして機能させるためのプログラムに関する。

音響信号を符号化する技術としてＭＰ３（MPEG 1 Audio Layer 3）、ＡＡＣ（Advanced Audio Coding）、ＡＴＲＡＣ（Adaptive TRansform Acoustic Coding）、ＷＭＡ（Windows（登録商標） Media Audio）またはＡＣ−３（Audio Code Number 3）等が知られている。例えばＭＰ３方式においては、高能率で圧縮するために、音響信号は複数の周波数帯域に分割され、可変長の時間単位でブロック化される。そして、ブロック化されたデジタルデータは、ＭＤＣＴ（Modified Discrete Cosine Transform）処理によってスペクトル信号に変換され、さらに聴覚心理特性を利用して割り当てられたビット数で各スペクトル信号がそれぞれ符号化される（例えば、特許文献１乃至３参照）。

このようにして符号化された音響信号は、復号装置にて復号される。図１８は従来の復号装置のハードウェア構成を示すブロック図である。図において１００は従来の復号装置であり、アンパッキング部１０１、逆量子化部１０２、周波数時間変換部１０３、周波数帯域合成部１０４及び音響信号出力部１０５を含んで構成される。符号化音響信号は、アンパッキング部１０１へ入力され、音響信号のフレーム情報から量子化係数、スケールファクタ、スケールファクタマルチプレクサ、グローバルゲイン、サブブロックゲインがそれぞれアンパッキングされる。そして、逆量子化部１０２において、この量子化係数、スケールファクタ、スケールファクタマルチプレクサ、グローバルゲイン、サブブロックゲインを用いてＩＭＤＣＴ係数に逆量子化される。

逆量子化部１０２で逆量子化されたＩＭＤＣＴ係数（Inverse Modified Discrete Cosine Transform ）は、周波数帯域毎に周波数時間変換部１０３でＩＭＤＣＴ処理が施され、時間軸のデータに変換される。更に、逆変換された周波数帯域は、周波数帯域合成部１０４において、帯域合成フィルタであるＩＰＦＢ（Inverse Polyphase Filter Bank）によって帯域合成された後、音響信号出力部１０５へ出力される（例えば、特許文献３参照）。

また、圧縮に伴うパワー感の欠如を補うために、復号時におけるスペクトルにパワー調整用スペクトルを補う技術が開示されている（例えば、特許文献４参照）。特許文献４に記載された技術では、符号化時に入力オーディオ信号の特性に基づき、補うべきパワー調整情報を、符号化装置内のパワー調整情報決定部において生成する。次に、このパワー調整情報を符号化したオーディオ信号と共に符号化する。そして、復号装置におけるパワー調整情報復号部において符号化されたパワー調整情報を復号し、さらにパワー補正用スペクトル生成合成部においてパワー調整情報を生成して復号されたオーディオ信号に補う。

ＭＰ３方式においては、ＭＤＣＴにより得られたデータはバタフライ回路により周波数帯域でＰＦＢ（Polyphase Filter Bank ）に起因して発生した折り返し歪み成分の除去が行われる。すなわち隣接したＰＦＢの３２帯域相互に対して、帯域境界に近いサンプルから８サンプルを入力として折り返し歪み（折り返しノイズ）成分を打ち消すバタフライ演算が行われる（例えば非特許文献１乃至３参照）。一方、ＡＴＲＡＣ方式においては、ＭＤＣＴ等の周波数変換前にＱＭＦ（Quadrature Mirror Filter）による周波数帯域分割が行われ、またＩＭＤＣＴ等の時間変換後にＩＱＭＦ（Inverse Quadrature Mirror Filter）による周波数帯域合成が行われ、ＱＭＦで発生した折り返しノイズをＩＱＭＦでほぼキャンセル（除去）することができるようにフィルタが構成されている。
特開２００２−３５１５００号公報特開２００５−１９５９８３号公報特開２００５−２６９４０号公報特開２００３−３２３１９８号公報藤原洋、安田浩監修、マルチメディア通信研究会編集、「ポイント図解式標準ブロードバンド＋モバイルＭＰＥＧ教科書」、ＡＳＣＩＩ、２００３年２月、初版、ｐ２６５ジェイ.プリンセンアンドエー．ブランドレー，アイトリプルイートランザクションズオンアコースティックス，スピーチ，アンドシグナルプロセッシング，ボリュウム，エーエスエスピー−３２，ナンバー２４月１９８４年ページ３５３−３６１「クワッドラチュアーミラーフィルターバンクデザインベイスドオンタイムドメイン」(Ｊ．ＰｒｉｎｃｅｎａｎｄＡ．Ｂｒａｎｄｌｅｙ,ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＡｃｏｕｓｔｉｃｓ，ｓｐｅｅｃｈ，ａｎｄｓｉｇｎａｌｐｒｏｃｅｓｓｉｎｇ，ｖｏｌ．ＡＳＳＰ−３２，Ｎｏ．２Ａｐｒｉｌ．１９８４ｐｐ．３５３−３６１「ＱｕａｄｒａｔｕｅｒＭｉｒｒｏｒＦｉｌｔｅｒＢａｎｋＤｅｓｉｇｎＢａｓｅｄｏｎＴｉｍｅＤｏｍａｉｎ」) 尾知博「シミュレーションで学ぶディジタル信号処理Ｖｏｌ.９」、２００１年７月ＣＱ出版、ｐ１５２−ｐ１５４

しかしながら、非特許文献２及び３に記載の如く、これらの帯域分割及び帯域合成フィルタは、帯域分割された帯域の信号に何らかの処理をしないことを前提にして設計されており、何らかの処理を行った場合は完全再構成（式（２）参照）の条件を満たさず、折り返し歪みは０にならない。例えばＱＭＦの場合、帯域分割及び帯域合成の入力信号をｘ(ｎ)、出力信号をｘ’(ｎ)とし、ｘ’(ｎ)の伝達関数Ｘ’(ｚ)は式（１）によって表される。

ここで、Ｈ₀ は、低域通過特性をもつ分割フィルタ、Ｈ₁ は、高域通過特性をもつ分割フィルタ、Ｆ₀ は、低域通過特性をもつ合成フィルタ、Ｆ₁は、高域通過特性をもつ合成フィルタである。上記式（１）が完全再構成、すなわちＸ’(ｚ)をＸ(ｚ)に戻す（完全再構成される）条件は、式（２）、式（３）となる。

ここで、ｚ^-1はｌサンプルの遅延を表し、式（２）を満たせば周波数振幅特性及び周波数位相特性で歪みがなくなり、また折り返し成分であるＸ（−ｚ）の項が０となる、すなわち式（３）を満たせば折り返し成分が出力ｘ’（ｚ）に含まれない。ＡＴＲＡＣのＱＭＦ、ＩＱＭＦのフィルタ係数は、式（４）のように設計されており、式（５）を満たす。

ここでｈ₀ （ｎ）はＨ₀ のインパルス応答、ｈ₁ （ｎ）はＨ₁ のインパルス応答、ｆ₀（ｎ）はＦ₀ のインパルス応答、ｆ₁ （ｎ）はＦ₁ のインパルス応答を表す。

これを式（１）に代入すると、式（６）のようになり、帯域分割及び帯域合成のフィルタだけの特性ではＸ（−ｚ）の項が０となり、折り返しの成分はキャンセルされていることになる。

折り返し歪みが０にならない要因として、ＡＴＲＡＣ方式の場合、帯域分割フィルタ後に、折り返し歪み成分が付加されるが、非可逆の符号化処理によって、量子化ノイズが発生し、特に量子化ビット数が零の係数には本来帯域合成フィルタにてキャンセルされるはずの成分も完全に除去されるため、復号時に折り返し歪みが発生する問題があった。

一方、ＭＰ３方式の場合、周波数領域において、折り返し歪み削減バタフライ回路により周波数帯域の係数中の折り返し歪み成分は除去されている。従って、量子化ビット数が零の場合、量子化により原音の周波数成分は除去されるものの、キャンセルされるはずの折り返し歪み成分は既に除去されるためＡＴＲＡＣ方式のような問題は生じない。しかしながら、ＭＰ３方式においても、量子化ビット数が零の場合、折り返し歪み削減バタフライ回路において、当該量子化ビット数が零の対称帯域に、キャンセル用の折り返し成分が発生しないという問題があった。なお特許文献１乃至４並びに非特許文献１乃至３には係る問題を解決するための手段は記載されていない。

本発明は斯かる事情に鑑みてなされたものであり、その目的は、ＡＴＲＡＣ等の如く、符号化方式、すなわち、帯域分割及び帯域合成のフィルタが帯域分割された帯域の信号に何らかの処理をしないことを前提にして設計された方式において、量子化ビット数を検出し、検出した係数の量子化ビット数が零の場合、演算部により前記係数について周波数帯域での折り返し成分を生成することにより、ビット配分が零であることに起因する折り返し歪みの発生を低減させることが可能な信号処理方法、信号処理装置、該信号処理装置をコンピュータとして機能させるためのプログラムを提供することにある。

本発明の他の目的は、符号化方式がＭＰ３方式等の如く、周波数領域において、折り返し歪み削減バタフライ回路により、周波数帯域の係数中の折り返し歪み成分が除去される方式において、（以降、ＭＰ３方式と称する。）逆量子化した音響信号の周波数帯域の係数の中から複数の係数を選択し、選択した複数の係数を用いた補間法により、選択されない係数であって量子化ビット数が零の係数に対する補間係数を算出することにより、折り返し歪み削減バタフライ演算に用いる対象周波数成分をより高い精度で発生させることが可能な信号処理方法、信号処理装置、該信号処理装置をコンピュータとして機能させるためのプログラムを提供することにある。

本発明に係る信号処理方法は、帯域分割された符号化音響信号を逆量子化した音響信号を処理する信号処理方法において、逆量子化した音響信号の周波数帯域の係数の量子化時における量子化ビット数を検出する検出ステップと、該検出ステップにより検出した一の周波数帯域内の係数の量子化ビット数が零であり、かつ、前記検出ステップにより検出した前記一の周波数帯域に隣接する他の周波数帯域内の折り返し位置にある係数の量子化ビット数が非零の場合、前記一の周波数帯域の係数および前記他の周波数帯域の係数についてバタフライ演算を行う演算ステップとを備えることを特徴とする。

本発明に係る信号処理装置は、帯域分割された符号化音響信号を逆量子化した音響信号を処理する信号処理装置において、逆量子化した音響信号の周波数帯域の係数の量子化時における量子化ビット数を検出する検出部と、該検出部により検出した一の周波数帯域内の係数の量子化ビット数が零であり、かつ、前記検出部により検出した前記一の周波数帯域に隣接する他の周波数帯域内の折り返し位置にある係数の量子化ビット数が非零の場合、前記一の周波数帯域の係数および前記他の周波数帯域の係数についてバタフライ演算を行う演算部とを備えることを特徴とする。

本発明に係る信号処理装置は、前記検出部は、逆量子化した音響信号の周波数帯域の係数の内、前記帯域分割の境界から所定周波数内に存在する係数の量子化時における量子化ビット数を検出するよう構成してあることを特徴とする。

本発明に係る信号処理装置は、前記所定周波数は、前記帯域分割の境界の周波数と、帯域分割を行う帯域分割フィルタの周波数応答に基づく所定強度以上の周波数との間の周波数であることを特徴とする。

本発明に係るプログラムは、帯域分割された符号化音響信号を逆量子化した音響信号をコンピュータにより処理するプログラムにおいて、コンピュータに、逆量子化した音響信号の周波数帯域の係数の量子化時における量子化ビット数を検出する検出ステップと、該検出ステップにより検出した一の周波数帯域内の係数の量子化ビット数が零であり、かつ、前記検出ステップにより検出した前記一の周波数帯域に隣接する他の周波数帯域内の折り返し位置にある係数の量子化ビット数が非零の場合、前記一の周波数帯域の係数および前記他の周波数帯域の係数についてバタフライ演算を行う演算ステップとを実行させることを特徴とする。

本発明に係る信号処理方法は、帯域分割された符号化音響信号を逆量子化した音響信号を処理する信号処理方法において、逆量子化した音響信号の周波数帯域の係数の中から複数の係数を選択する選択ステップと、逆量子化した音響信号の周波数帯域の係数の量子化時における量子化ビット数を検出する検出ステップと、前記選択ステップにより選択した複数の係数を用いた補間法により、前記選択ステップにより選択されない係数であって前記検出ステップにて検出した量子化ビット数が零の係数に対する補間係数を算出する算出ステップとを備えることを特徴とする。

本発明に係る信号処理装置は、帯域分割された符号化音響信号を逆量子化した音響信号を処理する信号処理装置において、逆量子化した音響信号の周波数帯域の係数の中から複数の係数を選択する選択部と、逆量子化した音響信号の周波数帯域の係数の量子化時における量子化ビット数を検出する検出部と、前記選択部により選択した複数の係数を用いた補間法により、前記選択部により選択されない係数であって前記検出部にて検出した量子化ビット数が零の係数に対する補間係数を算出する算出部とを備えることを特徴とする。

本発明に係るプログラムは、帯域分割された符号化音響信号を逆量子化した音響信号をコンピュータにより処理するプログラムにおいて、コンピュータに、逆量子化した音響信号の周波数帯域の係数の中から複数の係数を選択する選択ステップと、逆量子化した音響信号の周波数帯域の係数の量子化時における量子化ビット数を検出する検出ステップと、前記選択ステップにより選択した複数の係数を用いた補間法により、前記選択ステップにより選択されない係数であって前記検出ステップにて検出した量子化ビット数が零の係数に対する補間係数を算出する算出ステップとを実行させることを特徴とする。

本発明に係る信号処理方法は、帯域分割された符号化音響信号を逆量子化した音響信号を処理する信号処理方法において、符号化音響信号の符号化方式がバタフライ演算を行う方式であるか否かを判断する方式判断ステップと、逆量子化した音響信号の周波数帯域の係数の量子化時における量子化ビット数を検出する検出ステップと、前記方式判断ステップにて符号化方式がバタフライ演算を行う方式でないと判断し、また、前記検出ステップにより検出した一の周波数帯域内の係数の量子化ビット数が零であり、かつ、前記検出ステップにより検出した前記一の周波数帯域に隣接する他の周波数帯域内の折り返し位置にある係数の量子化ビット数が非零の場合、前記一の周波数帯域の係数および前記他の周波数帯域の係数についてバタフライ演算を行う演算ステップとを備えることを特徴とする。

本発明に係る信号処理装置は、帯域分割された符号化音響信号を逆量子化した音響信号を処理する信号処理装置において、符号化音響信号の符号化方式がバタフライ演算を行う方式であるか否かを判断する方式判断部と、逆量子化した音響信号の周波数帯域の係数の量子化時における量子化ビット数を検出する検出部と、前記方式判断部にて符号化方式がバタフライ演算を行う方式でないと判断し、また、前記検出部により検出した一の周波数帯域内の係数の量子化ビット数が零であり、かつ、前記検出部により検出した前記一の周波数帯域に隣接する他の周波数帯域内の折り返し位置にある係数の量子化ビット数が非零の場合、前記一の周波数帯域の係数および前記他の周波数帯域の係数についてバタフライ演算を行う演算部とを備えることを特徴とする。

本発明に係る信号処理装置は、逆量子化した音響信号の周波数帯域の係数の中から複数の係数を選択する選択部と、前記方式判断部において符号化方式がバタフライ演算を行う方式と判断した場合に、前記選択部により選択した複数の係数を用いた補間法により、前記選択部により選択されない係数であって前記検出部にて検出した量子化ビット数が零の係数に対する補間係数を算出する算出部とをさらに備えることを特徴とする。

本発明に係るプログラムは、帯域分割された符号化音響信号を逆量子化した音響信号をコンピュータにより処理するプログラムにおいて、コンピュータに、符号化音響信号の符号化方式がバタフライ演算を行う方式であるか否かを判断する方式判断ステップと、逆量子化した音響信号の周波数帯域の係数の量子化時における量子化ビット数を検出する検出ステップと、前記方式判断ステップにて符号化方式がバタフライ演算を行う方式でないと判断し、また、前記検出ステップにより検出した一の周波数帯域内の係数の量子化ビット数が零であり、かつ、前記検出ステップにより検出した前記一の周波数帯域に隣接する他の周波数帯域内の折り返し位置にある係数の量子化ビット数が非零の場合、前記一の周波数帯域の係数および前記他の周波数帯域の係数についてバタフライ演算を行う演算ステップとを実行させることを特徴とする。

本発明にあっては、逆量子化した音響信号の周波数帯域の係数の量子化時における量子化ビット数を検出部により検出する。そして、検出部により検出した係数の量子化ビット数が零の場合、前記係数について折り返し歪みを削減する演算部によりバタフライ演算を行うので、ビット配分が零に起因して発生する帯域分割フィルタの折り返し歪みを低減することが可能となる。

本発明にあっては、検出部は、逆量子化した音響信号の周波数帯域の係数の内、帯域分割の境界から所定周波数内に存在する係数に着目し、これらの係数の量子化時における量子化ビット数を検出する。この所定周波数としては、例えば、帯域分割の境界の周波数と、帯域分割を行う帯域分割フィルタの周波数応答に基づく所定強度以上の周波数との間の周波数とする。このように、バタフライ演算を行う係数を所定周波数内の係数に限って行うこととしたので消費電力を低減することが可能となる。

本発明にあっては、演算部は、検出部により検出した係数の量子化ビット数が零であり、前記係数が属する一の周波数帯域に隣接する他の周波数帯域内の折り返し位置にある係数の量子化ビット数が検出部により非零と検出された場合に、検出した係数及び折り返し位置にある係数を用いてバタフライ演算を行う。反対に、係数の量子化ビット数が零であり、また帯域分割の境界から対称帯域にある係数の量子化ビット数も零の場合、折り返し歪みが発生しないことから演算部による演算が実行されない。

本発明にあっては、選択部は逆量子化した音響信号の周波数帯域の係数の中から複数の係数を選択する。また検出部は逆量子化した音響信号の周波数帯域の係数の量子化時における量子化ビット数を検出する。そして、選択部により選択した複数の係数を用いた補間法により、選択されない係数であって、また検出部にて検出した量子化ビット数が零の係数に対する補間係数を算出部により算出するので、キャンセル用の折り返し歪み成分を最適な量で生成することが可能となる。また、補間処理により量子化の際に失われたエネルギが補間され、量子化誤差に伴うエネルギの物足りなさを補うことが可能となる。

本発明にあっては、方式判断部は符号化音響信号の符号化方式が例えばＭＰ３方式、即ち、周波数領域において、折り返し歪み削減バタフライ回路により、周波数帯域の係数中の折り返し歪み成分が除去される方式であるか否かを判断する。そして、符号化方式がバタフライ演算を行う方式でないと判断し、また、検出部により検出した係数の量子化ビット数が零の場合、係数についてバタフライ演算により、折り返し歪みをキャンセルする帯域合成に用いる対象周波数成分を生成するので、ビット配分が零に起因して発生する帯域分割フィルタの折り返し歪みを低減することが可能となる。

本発明にあっては、方式判断部において符号化方式がバタフライ演算を行う方式であると判断した場合に、選択部により選択した複数の係数を用いた補間法により、選択されない係数であって検出部にて検出した量子化ビット数が零の係数に対する補間係数を算出するので、キャンセル用の折り返し歪み成分を最適な量で生成することが可能となる。

本発明にあっては、逆量子化した音響信号の周波数帯域の係数の量子化時における量子化ビット数を検出部により検出する。そして検出した係数の量子化ビット数が零の場合、前記係数について演算部によりバタフライ演算を行うので、ビット配分が零に起因して発生する帯域分割フィルタの折り返し歪みを低減することが可能となる。

本発明にあっては、検出部は、逆量子化した音響信号の周波数帯域の係数の内、帯域分割の境界から所定周波数内に存在する係数に着目し、これらの係数の量子化時における量子化ビット数を検出する。このように、バタフライ演算を行う係数を所定周波数内の係数に限って行うこととしたので、歪み成分が大きい帯域について効果的に歪み削減を行うことができ、また消費電力を低減することが可能となる。

本発明にあっては、係数の量子化ビット数が零であり、また対称帯域にある係数の量子化ビット数も零の場合、折り返し歪みが発生しないことから演算部による演算が実行されない。これにより、無用の折り返し歪み削減バタフライ演算に用いる対象周波数成分の生成が回避され演算速度の向上を図ることが可能となる。

本発明にあっては、選択部は逆量子化した音響信号の周波数帯域の係数の中から複数の係数を選択する。また検出部は逆量子化した音響信号の周波数帯域の係数の量子化時における量子化ビット数を検出する。そして、選択部により選択した複数の係数を用いた補間法により、選択されない係数であって、また検出部にて検出した量子化ビット数が零の係数に対する補間係数を算出部により算出するので、キャンセル用の折り返し歪み削減バタフライ演算に用いる対象周波数成分を最適な量で生成することが可能となる。また、補間処理により量子化の際に失われたエネルギが補間され、量子化誤差に伴うエネルギの物足りなさを補うことが可能となる。

本発明にあっては、方式判断部は符号化音響信号の符号化方式がバタフライ演算を行う方式であるか否かを判断する。そして、符号化方式がバタフライ演算を行う方式でないと判断し、また、検出部により検出した係数の量子化ビット数が零の場合、係数についてバタフライ演算を行うので、ビット配分が零に起因して発生する帯域分割フィルタの折り返し歪みを低減することが可能となる。また符号化方式を事前に判断し、また逆量子化した周波数帯域の係数を用いるので、復号側において独立してエネルギを補間でき、多様な規格に対してエネルギを適切に補間することが可能となる。

本発明にあっては、方式判断部において符号化方式がバタフライ演算を行う方式であると判断した場合に、選択部により選択した複数の係数を用いた補間法により、選択されない係数であって検出部にて検出した量子化ビット数が零の係数に対する補間係数を算出するので、キャンセル用の折り返し歪み削減バタフライ演算に用いる対象周波数成分を最適な量で生成することが可能となる。また、事前に符号化方式を判断すると共に、逆量子化した周波数帯域の係数を用いるので、復号側において独立してエネルギを補間でき、多様な規格に対してエネルギを適切に補間することが可能となる等、本発明は優れた効果を奏する。

実施の形態１
以下本発明の実施の形態を、図面を参照して説明する。図１は信号処理装置たる復号装置のハードウェア構成を示すブロック図である。図において２０は、符号化された音響信号を復号する復号装置であり、音響信号入力部２１、アンパッキング部２２、逆量子化部２３、補間処理部１、バタフライ演算部２４０、周波数時間変換部２４、周波数帯域合成部２５及び音響信号出力部２６を含んで構成される。本実施の形態においては圧縮符号化方式としてＭＰ３を適用した例についてまず説明する。なお、周波数帯域合成部２５は、ＩＰＦＢである。

記録媒体から読み出された符号化音響信号またはデジタルチューナにより受信した符号化音響信号等は、音響信号入力部２１へ入力され、入力された符号化音響信号はアンパッキング部（デマルチプレクサ）２２へ出力される。アンパッキング部２２は、音響信号のフレーム情報から量子化係数、量子化ビット数、スケールファクタ、スケールファクタマルチプレクサ、グローバルゲイン、及びサブブロックゲインをそれぞれアンパッキングする。アンパッキングされた量子化係数、量子化ビット数、スケールファクタ、スケールファクタマルチプレクサ、グローバルゲイン、及びサブブロックゲインを用いて逆量子化部２３においてＩＭＤＣＴ係数に逆量子化される。逆量子化部２３からはブロック長（ロングブロックまたはショートブロック）に応じて次の式（７）で示されるＩＭＤＣＴ係数が周波数帯域毎に出力される。

式（７）中の変数ｍはＩＭＤＣＴ係数のインデックス、ＭＫ（ｍ）は量子化係数(ハフマン復号化値)、sgn(ＭＫ（ｍ）)は量子化係数の符号、scalefac_multiplierは１または0.5、grはグラニュールのインデックス、wndはウィンドウの形状のインデックス、sfbはスケールファクタバンドのインデックス、preflag[gr]はプリエンファシスの有無フラグで０または１、pretab[sfb] は所定のプリエンファシステーブルによって得られる値を表している。なお、ＡＴＲＡＣにおけるスケールファクタ（例えば各６ビットで表され、約２ｄＢ単位で指定することができる）は、ＭＰ３におけるスケールファクタに関する値と同様であり、ＭＰ３におけるスケールファクタに関する値は、式（７）で示す如く、スケールファクタ、スケールファクタマルチプレクサ、グローバルゲイン及びサブブロックゲイン（式（７）の２の乗数以降の箇所）、プリエンファシスの有無フラグ、プリエンファシステーブルによって得られる値を用いて算出される。以下ではＡＴＲＡＣにおけるスケールファクタ及びＭＰ３におけるスケールファクタに関する値をまとめてスケールファクタとして説明する。ここで、スケールファクタとは、所定の分割された各周波数帯域のスペクトルを表現するために、仮数部と指数部で表した指数部分をいう。例えば、ＭＰ３においては、所定の分割された各周波数帯域のスペクトルを最大値が１．０となるように正規化され、その指数部分をスケールファクタとグローバルゲイン、及びサブブロックゲインとして符号化されている。上記スケールファクタとグローバルゲイン、及びサブブロックゲインの指数部を総称してスケールファクタに関する値と呼ぶ。

本実施の形態においては図に示すように３２の周波数帯域毎ｂｌｏｃｋ（０）〜ｂｌｏｃｋ（３１）にＩＭＤＣＴ係数Ｉ（０）、Ｉ（１）、…、Ｉ（ｍ）、…、Ｉ（５７５）が出力される。サンプリング周波数が４４．１ｋＨｚの場合、ｂｌｏｃｋ（０）の周波数は０Ｈｚ〜６８９．０６２５Ｈｚ、ｂｌｏｃｋ（１）は６８９．０６２５Ｈｚ〜１３７８．１２５Ｈｚ、またｂｌｏｃｋ（３１）は２１３６０．９３７５Ｈｚ〜２２０５０Ｈｚである。なお、以下では任意の周波数帯域のブロックをｂｌｏｃｋ（ｋ）とする。ここでｋは整数であり、０≦ｋ≦３１を満たすものとする。各周波数帯域のＩＭＤＣＴ係数Ｉ（０）〜Ｉ（５７５）は補間処理部１へ入力される。

各周波数帯域のＩＭＤＣＴ係数はブロック長に応じて複数の係数（スペクトル）から構成される。ロングブロックでは１８の係数からなり、ショートブロックでは６の係数からなる。なお、本実施の形態においては、ブロック長はロングブロックであるものとして説明する。

図２は周波数に対するＩＭＤＣＴ係数の変化を示すグラフである。横軸は周波数であり、縦軸は係数を示す。ＩＭＤＣＴ係数（以下、係数Ｉ（ｍ）で代表する）はロングブロックの場合、一周波数帯域内に１８の係数Ｉ（１８×ｋ）乃至Ｉ（１８×ｋ＋１７）を有する。図２のグラフにおいては周波数１８×ｋ、１８×ｋ＋１、…１８×ｋ＋１７に対応させて、係数Ｉ（１８×ｋ）、Ｉ（１８×ｋ＋１）、…、Ｉ（１８×ｋ＋１７）の変化が示されている。この係数は正、負または零の値を取る。

図１において係数Ｉ（ｍ）は補間処理部１へ入力され、補間処理後の係数Ｉ’（ｍ）が補間処理部１から出力される。バタフライ演算部２４０は、後述する式（３３）のバタフライ演算式を用いて、帯域分割の境界から８サンプルの係数Ｉ’（ｍ）に対して夫々の帯域でバタフライ演算が施される。ここで、式（３３）に入力されるｃ_ｉは、ｉ＝０の場合、-0.6、ｉ＝１の場合、-0.535、ｉ＝２の場合、-0.33、ｉ＝３の場合、-0.185、ｉ＝４の場合、-0.095、ｉ＝５の場合、-0.041、ｉ＝６の場合、-0.0142、ｉ＝７の場合、-0.0037である。なお、ｉは、入力Ｉｎ１または入力Ｉｎ２と分割境界との間隔であり、これらの係数及び数式はバタフライ演算部２４０内の図示しないメモリに記憶されている。周波数時間変換部２４には一部の係数についてバタフライ演算が施された補間処理後の係数Ｉ’（ｍ）が入力される。周波数時間変換部２４では係数Ｉ’（ｍ）についてＩＭＤＣＴ処理が施され、時間軸の音響信号に変換される。更に、逆変換された音響信号は周波数帯域合成部２５において、帯域合成フィルタであるＩＰＦＢによって帯域合成された後、音響信号出力部２６へ出力される。

図３は補間処理部１のハードウェア構成を示すブロック図である。補間処理部１は量子化ビット数検出部１１、補間判定部１２、選択部１３及び算出部１４を含んで構成される。量子化ビット数検出部１１は周波数帯域の係数の量子化時における量子化ビット数を、入力されるフレームサイド情報に基づき検出する。具体的には、係数Ｉ（ｍ）の量子化ビット数はアンパッキング部２２にてアンパックされたビットストリーム中のフレームサイド情報のtable＿select[ch][gr][region]を参照することにより検出することができる。
このtable＿select[ch][gr][region]は、ハフマン符号化されたハフマンテーブルを指し示すセレクト信号であり、指し示されたハフマンテーブルを復号化する事により、ハフマン復号化値、即ち係数Ｉ（ｍ）を得る。上記regionにおける一の領域のハフマン復号化値の最大の数字を取得することにより、量子化ビット数を検出することもできるが、table＿select[ch][gr][region]が指し示すハフマンテーブルに存在する最大の数字は予め決まっているので、その語長を量子化ビット数とすることで検出する。

量子化ビット数検出部１１は検出した量子化ビット数を補間判定部１２及び算出部１４へ出力する。補間判定部１２は、周波数帯域内の係数Ｉ（ｍ）の量子化ビット数に所定ビット数以下の係数Ｉ（ｍ）が存在するか否かを判断する。例えば、補間判定部１２は周波数帯域内の係数Ｉ（ｍ）の量子化ビット数が、４以下の係数Ｉ（ｍ）が存在するか否かを判断すればよい。そして、補間判定部１２は、入力された周波数帯域内の係数Ｉ（ｍ）に所定量子化ビット数以下の係数Ｉ（ｍ）が存在すると判断した場合、当該周波数帯域の係数Ｉ（ｍ）を補間処理すべく選択部１３へ出力する。一方、補間判定部１２は、入力された周波数帯域内の係数Ｉ（ｍ）に所定量子化ビット数以下の係数Ｉ（ｍ）が存在しないと判断した場合、当該周波数帯域の係数Ｉ（ｍ）を補間処理することなく、補正後の係数Ｉ’（ｍ）を、バタフライ演算部２４０を経ることなく周波数時間変換部２４へ出力する。

選択部１３は周波数帯域内の係数の中から複数の係数を選択する。これは、例えば、周波数帯域内の係数の両端の係数、すなわち最も低域にあたる係数及び最も高域にあたる係数を少なくとも選択する。図２の例においては、Ｉ（１８×ｋ）及びＩ（１８×ｋ＋１７）が選択される。さらに選択部１３はこれらに加え、周波数帯域内の係数の中からスペクトルが最大及び最小の係数を選択するようにしても良い。図２の例においては、最小スペクトルであるＩ（１８×ｋ＋３）、及び、最大スペクトルであり、また、最も高域にある係数Ｉ（１８×ｋ＋１７）が選択される。選択部１３は入力された係数Ｉ（ｍ）及び選択した複数の係数に係る情報を算出部１４へ出力する。

算出部１４は選択部１３において選択した係数を用い、選択されなかった係数の補間係数を、補間法を用いて算出する。この場合、算出部１４は、量子化ビット数検出部１１から出力される係数の量子化ビット数に基づき、量子化ビット数が零の係数について補間係数を算出する。この補間法は例えばラグランジュ補間法またはスプライン補間法が用いられる。以下では、スプライン補間法を用いた例について説明する。

Ｎ＋１個の点（ｘ₀ ，ｙ₀ ），（ｘ₁ ，ｙ₁ ），・・・，（ｘ_N，ｙ_N ）が与えられている。ただし、ｘ₀ ＜ｘ₁ ＜・・ｘ_N とする。これらの点を滑らかに接続するスプライン補間について述べる。３次スプライン補間で求まる曲線をｙ＝Ｓ（ｘ）とする。Ｓ（ｘ）は各区間[ｘ_j ，ｙ_j]で区分的に定義されているとする。各区間ｘ_j ≦ｘ≦ｘ_j+1 の区間でＳ（ｘ）＝Ｓ_j （ｘ）とする。さらに、Ｓ_j （ｘ）は式（８）で示す３次多項式で与えられる。

係数ａ_j ，ｂ_j ，ｃ_j ，ｄ_j は以下に述べる条件から決まる。すなわち、曲線ｙ＝Ｓ（ｘ）は連続であり、点（ｘ_j，ｙ_j ）（ｊ＝０，１，・・・，Ｎ）の全てをとおる（条件１）。また区間の境目ｘ＝ｘ_j（ｊ＝１，２，・・・，N-1 ）で、ｙ＝Ｓ（ｘ）の１階微分係数および２階微分係数が連続である（条件２）。条件１から、式（９）が導出される。

また条件２から式（１０）が導出される。

これら式（９）及び式（１０）を用いることにより係数ａ_j ，ｂ_j ，ｃ_j ，ｄ_jが決定される。まず、ｘ＝ｘ_j （ｊ＝１，２，・・・，N-1 ）でのＳ（ｘ）の２階微分係数を式（１１）のようにおく。

３次スプラインの定義は式（８）であるから、その２階微分係数は式（１２）で表される。

これによりｂ_j＝ｕ_j／２となる。さらに、２階微分係数は式（１３）で表すことができる。

式（１３）から、式（１４）が導出される。

また以上の式から式（１５）の条件を自動的に満たす。

またｄ_j＝ｙ_jも明らかであることから、条件１を用いて式（１６）が導出される。

さらに式（１６）から最終的に式（１７）が得られる。

ここで、式（１８）で示す最後の条件を用いる。

式（１８）は３次多項式から式（１９）の如く表現できる。

式（１９）にａ_j，ｂ_j，ｃ_jを代入することにより式（２０）が導出される。

これを順に並べた場合、式（２１）で示す連立方程式をなす。

ただし、ｈ_j，ｖ_jは以下の式（２２）で示す条件を満たすものとする。なお、ｈ_j，ｖ_jは最初に与えられているｘ_j，ｙ_jだけから計算できるので既知の定数である。

未知変数ｕ_jは、全部で N+1個あるが、上で述べた連立１次方程式の数は N-1個である。したがって、この連立１次方程式からｕ_jを一意に決定できない。そこで、曲線の両端の点（ｘ₀，ｙ₀），（ｘ_N，ｙ_N）で、それぞれ境界条件を１つずつ付け加える。この境界条件にはいくつか考えられるが、ここでは曲線の傾きの変化率が両端で０であるという条件を採用する。２階微分が０であることから式（２３）が導出される。

式（２３）から式（２４）が導かれる。

またｕ₀＝ｕ_N＝０であることから、式（２５）で示すｕ₁ 〜ｕ_N-1に関する連立１次方程式が求まる。

次に、スプライン補間のアルゴリズムを説明する。まず、 N+1個の点（ｘ_j，ｙ_j）（ｊ＝０，１，・・・，Ｎ）を与え、３次スプラインは区分的に式（２６）及び式（２７）を満たすとする。

曲線の両端での境界条件を式（２８）とした場合、ｕ₀＝ｕ_N＝０となる。

ｈ_j（ｊ＝０，１，・・・，Ｎ）及びｕ_j（ｊ＝０，１，・・・，Ｎ）を計算し、連立一次方程式を解くことにより、ｕ₁〜ｕ_N-1が求まる。最後に係数ａ_j，ｂ_j，ｃ_j，ｄ_jを求め、曲線Ｓ（ｘ）が決定される。算出部１４は選択部１３で選択された係数に基づき、曲線Ｓ_j （ｘ）の係数ａ_j，ｂ_j，ｃ_j，ｄ_jを求める。そして、選択されていない係数であって、量子化ビット数が所定値以下の係数について、補間係数Ｓ_j（ｘ）を算出し、補間後の補間係数Ｓ_j（ｘ）及び補間されていない係数を係数Ｉ’（ｍ）として、周波数時間変換部２４へ出力する。

図４は補間処理の手順を示すフローチャートである。なお、以下では説明を容易にするために周波数帯域内の係数のブロック長をロングブロックであるとして説明する。まず量子化ビット数検出部１１は量子化ビット数を検出する（ステップＳ４１）。この検出した量子化ビット数は補間判定部１２及び算出部１４へそれぞれ出力される。補間判定部１２は、周波数帯域内の係数の中に量子化ビット数が所定値以下のものが存在するか否かを判断する（ステップＳ４２）。補間判定部１２は係数の量子化ビット数に所定値以下のものが存在しないと判断した場合（ステップＳ４２でＮＯ）、一連の処理を終了する。この場合、補間判定部１２は当該周波数帯域の係数を、バタフライ演算部２４０を経ることなく周波数時間変換部２４へ出力する。

一方、補間判定部１２は係数の量子化ビット数が所定値以下のものが存在すると判断した場合（ステップＳ４２でＹＥＳ）、補間判定部１２は、当該周波数帯域内の係数を選択部１３へ出力する。選択部１３は、周波数帯域内の両端の係数、すなわち低域側の係数及び高域側の係数を、スプライン補間の節点とすべく選択する（ステップＳ４３）。さらに、選択部１３は周波数帯域内の係数の最大スペクトルの係数及び最小スペクトルの係数をスプライン補間の節点とすべく、選択する（ステップＳ４４）。なお、最大スペクトルの係数及び最小スペクトルの係数はそれぞれ、周波数帯域内の両端の係数となることもあることから、節点数は２〜４となる。

算出部１４は、式（８）で示すステップＳ４３及びＳ４４で選択した係数に基づき、３次スプライン関数の係数ａ_j，ｂ_j，ｃ_j，ｄ_jを算出する（ステップＳ４５）。算出部１４はステップＳ４３及びＳ４４において選択されない係数の量子化ビット数が所定値（０）以下であるか否かを判断する（ステップＳ４６）。算出部１４は選択されない係数の量子化ビット数が所定値（０）以下であると判断した場合（ステップＳ４６でＹＥＳ）、求めた係数ａ_j，ｂ_j，ｃ_j，ｄ_j及び式（８）から補間係数を算出する（ステップＳ４７）。一方、選択されない係数の量子化ビット数が所定値（０）以下でないと判断した場合（ステップＳ４６でＮＯ）、補間処理を行わず、ステップＳ４７の処理をスキップする。

算出部１４は全てのステップＳ４３及びＳ４４において選択されない係数に対するステップＳ４６の処理が終了したか否かを判断する（ステップＳ４８）。算出部１４は、処理が終了していないと判断した場合（ステップＳ４８でＮＯ）、他の選択されていない係数の補関係数を求めるべく、ステップＳ４６へ移行する。一方、全ての選択されない係数に対する処理を終了したと算出部１４が判断した場合（ステップＳ４８でＹＥＳ）、一連の処理を終了する。以上の処理を全ての周波数帯域に対して実行し、量子化ビット数が０の係数に対するスプライン補間により、最適なスペクトルが補間係数として得られる結果、
量子化された係数の分解能を高めることができ、物足りなさや違和感を受けることなく再生が可能となる。なお、以上述べた節点となる係数の選択方法及び量子化ビット数の値はあくまで一例でありこれに限るものでない。

実施の形態２
実施の形態２は補間係数を補正する形態に関する。図５は実施の形態２に係る補間処理部１のハードウェア構成を示すブロック図である。実施の形態１の構成に加え、有効範囲決定部１５及び補正部１６が追加されている。逆量子化部２３から出力されるビットストリームのフレームサイド情報から各周波数帯域のスケールファクタが抽出され、抽出されたスケールファクタは、有効範囲決定部１５へ入力される。量子化ビット数検出部１１により検出される係数の量子化ビット数及び算出部１４にて算出された補間係数は有効範囲決定部１５へ入力される。さらに、補間判定部１２から出力された補間処理を行わない係数も有効範囲決定部１５へ入力される。

図６は有効範囲を説明するためのグラフである。図６のグラフにおいて横軸は周波数を、縦軸はスペクトルの大きさを示す。丸印はスプライン補間による補間がなされていない係数Ｉ（ｍ）を示す。ここで例示のため係数の数は１≦ｍ≦４としてあり、スケールファクタはＳＦ、量子化ビット数は２としている。また×印は原音のＭＤＣＴ係数（Ｍ（ｍ））である。原音のＭ（ｍ）は２ビットの量子化により矢印方向へ丸印まで量子化される。例えば、Ｍ（１）については、約０．３ＳＦに位置するところ、０．５ＳＦ以下であることから、Ｉ（１）＝０ＳＦへ量子化される。またＭ（２）については０．５ＳＦより大きいのでＩ（２）＝ＳＦへ量子化される。

ここで、図に示すようにＩ（１）＝０の場合、原音Ｍ（１）は量子化ビット数が２であることから、−０．５ＳＦから＋０．５ＳＦに理論上存在する。またＩ（２）＝ＳＦの場合、原音Ｍ（２）は上限ＳＦ、下限０．５ＳＦの範囲内に理論上存在する。係数Ｉ（ｍ）に対してスケールファクタ及び量子化ビット数により決定される原音の存在する理論上の範囲を有効範囲とする。ここで係数Ｉ（ｍ）の有効範囲をＰ（ｍ）、量子化ビット数をＷ、スケールファクタをＳＦとした場合、有効範囲Ｐ（ｍ）は例えば下記式（２９）により定義される。

ただし、Ｉ（ｍ）＝ＳＦの場合、有効範囲Ｐ（ｍ）は式（３０）で定義される。

さらに、Ｉ（ｍ）＝−ＳＦの場合、有効範囲Ｐ（ｍ）は式（３１）で定義される。

これら有効範囲の定義はあくまで一例であり、係数Ｉ（ｍ）の絶対値を用いて有効範囲Ｐ（ｍ）を定義する等、係数に対するスケールファクタ及び量子化ビット数に基づき決定されるものであればこれに限るものではない。

図６において、三角印は図５における算出部１４にて算出された補間係数Ｓ（ｍ）を示している。Ｓ（１）、Ｓ（３）及びＳ（４）に着目すると、より原音に近い補間係数が算出され、またその補間係数は矢印で示す有効範囲内に存在していることが理解できる。しかし補間係数Ｓ（２）については、不適切な節点の係数を選択したことで、補間法のルンゲの現象等に起因する誤差が発生しており、理論上取り得る有効範囲から逸脱していることが理解できる。図５における補正部１６は有効範囲決定部１５から出力される有効範囲Ｐ（ｍ）及び補間係数Ｓ（ｍ）に基づき、この誤差を補正する。

補正部１６は補間係数が有効範囲内に存在していると判断した場合は、補正することなく補間係数を、バタフライ演算部２４０を経ることなく周波数時間変換部２４へ出力する。一方、補正部１６は補間係数が有効範囲内に存在しないと判断した場合は、補間係数を有効範囲内に属するよう補正する。この補正処理は例えば以下のように行う。例えば補間係数が式（２９）乃至式（３１）で定義される有効範囲の上限値を超える場合、上限値が補間係数となるよう補正する。また、補間係数が式（２９）乃至式（３１）で定義される下限値を下回る場合、下限値が補間係数となるよう補正する。

またこの他、所定のゲインｇを補間係数に乗ずるようにしても良い。このゲインｇは有効範囲Ｐ（ｍ）の上限（または下限）と補間係数Ｓ（ｍ）との比である。そしてこのゲインｇを他の補間係数（例えば、隣接するＳ（ｍ−２）、Ｓ（ｍ−１）、Ｓ（ｍ＋１）、Ｓ（ｍ＋２））に乗じ、他の補間係数がそれぞれの有効範囲（Ｐ（ｍ−２）、Ｐ（ｍ−１）、Ｐ（ｍ＋１）、Ｐ（ｍ＋２））に属するか否かを判断する。そして補正部１６は属すると判断した場合は、当該ゲインｇを補間係数Ｓ（ｍ）に乗じ、この値を、バタフライ演算部２４０を経ることなく周波数時間変換部２４へ出力する。

一方、補正部１６は、他の補間係数がそれぞれの有効範囲に属しないと判断した場合は、ゲインｇの値を所定値変更（例えば１．５ｇ、１．４ｇ、１．３ｇ・・・０．５ｇ）し、他の補間係数がそれぞれの有効範囲に属するまでこれを繰り返し行う。以上の処理を行った場合にでも、他の補間係数がそれぞれの有効範囲に属しない場合は、上述したように当該補間係数Ｓ（ｍ）についてのみ、上限値（または下限値）が補間係数となるよう補正する。これにより、何らかの原因により、補間誤差が生じた場合でも、原音が取り得る量子化の理論範囲内に補間係数を補正でき復号時の信号処理の安定化を図ることが可能となる。なお、上述した補正処理は、あくまで一例であり、補間係数が有効範囲内に存在するよう補正するのであれば、他の形態であっても良い。

図７は補正処理の手順を示すフローチャートである。有効範囲決定部１５にはスケールファクタ、量子化ビット数、補間係数及び係数が入力される（ステップＳ８１）。有効範囲決定部１５は係数に対する有効範囲を入力されたスケールファクタ及び量子化ビット数並びに式（２９）乃至式（３１）に基づき決定する（ステップＳ８２）。有効範囲決定部１５は決定した係数に対する有効範囲及び補間係数を補正部１６へ出力する（ステップＳ８３）。

補正部１６は補間係数と有効範囲とを比較し、補間係数が有効範囲内に存在するか否かを判断する（ステップＳ８４）。補正部１６は、補間係数が有効範囲内に存在すると判断した場合は（ステップＳ８４でＹＥＳ）、当該補間係数を補正することなく周波数時間変換部２４へ出力する（ステップＳ８７）。一方、補間係数が有効範囲内に存在しないと判断した場合（ステップＳ８４でＮＯ）、補正部１６は補間係数が有効範囲内に属するよう補正する（ステップＳ８５）。補正部１６は補間係数が式（２９）乃至式（３１）で定義される有効範囲の上限値を超える場合、上限値が補間係数となるよう補正する。また、補間係数が式（２９）乃至式（３１）で定義される下限値を下回る場合、下限値が補間係数となるよう補正する。そして、補正部１６は補正後の補間係数を周波数時間変換部２４へ出力する（ステップＳ８６）。

図８はゲインｇの算出処理の手順を示すフローチャートである。ステップＳ８５における処理は上述したようにゲインｇを算出し、このゲインｇを補間係数に乗じて補正するようにしても良い。補正部１６は有効範囲決定部１５から出力された有効範囲の上限（または下限）と補間係数との比（ｇ）を算出し（ステップＳ９１）、これをゲインｇとする。なお、補正部１６はゲインの初期値ｇ’にこの算出したｇを代入をしておく。補正部１６はゲインｇ’を他の補間係数に乗ずる（ステップＳ９２）。これは、例えば対象となる補間係数Ｓ（ｍ）と量子化ビット数を同じくする周波数帯域内の補間係数について行えばよい。

補正部１６はゲインｇ’を乗じた他の補間係数が、当該他の補間係数に係る有効範囲内に存在するか否かを判断する（ステップＳ９３）。補正部１６は、ゲインｇ’を乗じた他の補間係数の全てが各補間係数に係る有効範囲内に存在すると判断した場合（ステップＳ９３でＹＥＳ）、当該ゲインｇ’を補間係数Ｓ（ｍ）に乗じ（ステップＳ９４）、処理を終了する。一方、補正部１６は、ゲインｇ’を乗じた他の補間係数の少なくとも一つが当該他の補間係数に係る有効範囲内に存在しないと判断した場合（ステップＳ９３でＮＯ）、ゲインｇ’を段階的に変更すべく以下の処理を行う。

補正部１６は変数ｎにｎ＋１を代入する（ステップＳ９５）。なお、ｎの初期値は０である。補正部１６はゲインｇ（初期値のゲインｇ’）の１．５倍から（ｎ／１０）ｇを減算し、新たなゲインｇ’を算出する（ステップＳ９６）。すなわちゲインｇから±５０％の範囲で１０％段階的に変化させる処理を行う。また量子化ビット数が２、３と大きくなるに従って、ゲインｇの１．５倍から（ｎ／１０）ｇを減算する、１．２５倍から（ｎ／１０）ｇを減算するといったように、範囲を狭くして段階の分解能を上げてもよい。補正部１６は変数ｎが１０であるか否かを判断する（ステップＳ９７）。補正部１６は変数ｎが１０でないと判断した場合（ステップＳ９７でＮＯ）、ステップＳ９２へ移行し、新たなゲインｇ’を他の補間係数に乗ずる。このように変数ｎをインクリメントさせてゲインｇを段階的に変更させる処理を繰り返し行う。

補正部１６はｎが１０であると判断した場合（ステップＳ９７でＹＥＳ）、すなわちゲインｇが１．５ｇ以上、０．５ｇ以下となる場合、ゲインｇによる補正は困難であるとして、補間係数を有効範囲の上限（または下限）に補正する（ステップＳ９８）。なお、本実施の形態においては、ステップＳ９６において、ｇに１．５を乗ずる処理を行ったが、あくまで一例であり、適宜の値を乗ずるようにすればよい。

本実施の形態２は以上の如き構成としてあり、その他の構成及び作用は実施の形態１と同様であるので、対応する部分には同一の参照番号を付してその詳細な説明を省略する。

実施の形態３
図９は実施の形態３に係る信号処理装置２０の構成を示すブロック図である。実施の形態３に係る信号処理装置２０の各処理はパーソナルコンピュータで実行されるソフトウェアにより実現しても良い。以下では信号処理装置２０をパーソナルコンピュータ２０であるものとして説明する。パーソナルコンピュータ２０は公知のものであり、ＣＰＵ（Central Processing Unit）６１にバス６７を介してＲＡＭ（Random Access Memory）６２、ハードディスク等の記憶部６５、入力部６３、スピーカ等の出力部６４、インターネット等の通信網に接続可能な通信部６６を備える。

パーソナルコンピュータ２０を動作させるためのコンピュータプログラムは、本実施の形態３のように、ＣＤ−ＲＯＭ、ＭＯ、またはＤＶＤ−ＲＯＭ等の可搬型記録媒体１Ａで提供することも可能である。さらに、コンピュータプログラムを、通信部６６を介して図示しないサーバコンピュータからダウンロードすることも可能である。以下に、その内容を説明する。

図９に示すパーソナルコンピュータ２０の図示しないリーダ／ライタに、係数を選択させ、補間係数を算出させるコンピュータプログラムが記録された可搬型記録媒体１Ａ（ＣＤ−ＲＯＭ、ＭＯ又はＤＶＤ−ＲＯＭ等）を、挿入して記憶部６５の制御プログラム内にこのプログラムをインストールする。または、かかるプログラムを、通信部６６を介して外部の図示しないサーバコンピュータからダウンロードし、記憶部６５にインストールするようにしても良い。かかるプログラムはＲＡＭ６２にロードして実行される。これにより、上述のような本発明の信号処理装置２０として機能する。

本実施の形態３は以上の如き構成としてあり、その他の構成及び作用は実施の形態１及び２と同様であるので、対応する部分には同一の参照番号を付してその詳細な説明を省略する。

実施の形態４
図１０は実施の形態４に係る復号装置のハードウェア構成を示すブロック図である。図において２０Ａは、符号化された音響信号を復号する復号装置であり、ＭＰ３方式以外の、ＡＡＣまたはＡＴＲＡＣ方式に適用される。以下では復号装置２０ＡをＡＴＲＡＣ方式に適用した例について説明する。復号装置２０Ａは、音響信号入力部２１、アンパッキング部２２、逆量子化部２３、量子化ビット数検出部１１、演算部であるバタフライ演算部３１、周波数時間変換部２４、周波数帯域合成部２５及び音響信号出力部２６を含んで構成される。なお、周波数帯域合成部２５は、ＩＱＭＦである。

記録媒体から読み出された符号化音響信号またはデジタルチューナにより受信した符号化音響信号等は、音響信号入力部２１へ入力され、入力された符号化音響信号はアンパッキング部（デマルチプレクサ）２２へ出力される。アンパッキング部２２は、音響信号のフレーム情報から量子化係数、量子化ビット数、スケールファクタをそれぞれアンパッキングする。アンパッキングされた量子化係数、量子化ビット数、及びスケールファクタは逆量子化部２３において逆量子化される。逆量子化部２３からは式（３２）で示すＩＭＤＣＴ係数が周波数帯域毎に量子化ビット数検出部１１へ出力される。

ここで、式３２中の変数ｍはＩＭＤＣＴ係数のインデックス、ｉは逆量子化周波数帯域のインデックス、ＭＫ（ｍ）は量子化係数、ＷＬ（ｉ）は量子化ビット数、ＳＦ（ｉ）はスケールファクタを表している。

図１１は対称帯域にある係数を説明するためのグラフである。図１１のグラフは横軸を周波数、縦軸をスペクトルとし、帯域分割フィルタであるＱＭＦにより５１２サンプルのＰＣＭが２分割された低域側の周波数帯域ｂｌｏｃｋ（Ｌ）と高域側の周波数帯域ｂｌｏｃｋ（Ｈ）内のＩＭＤＣＴ係数を表示している。また、図１２はＱＭＦの周波数応答を示すグラフである。横軸は各周波数を示し、サンプリング周波数が４４．１ｋＨｚの場合、π/２が２２．０５Ｈｚである。縦軸は強度を示し単位はデシベルである。図１２のように、周波数の中央（帯域の分割境界）から低域側（Ｈ０（ｚ））の応答と高域側（Ｈ１（z））の応答は対称な特性になるように設計されており、Ｈ０（ｚ）とＨ１（z）との阻止域減衰が約−７０ｄＢの周波数を低域境界、及び高域境界と呼ぶことにする。ｂｌｏｃｋ（Ｌ）とｂｌｏｃｋ（Ｈ）との分割境界はＩ（２５５）とＩ（２５６）との間である。また低域境界はＩ（１９１）とＩ（１９２）との間、高域境界はＩ（３１９）とＩ（３２０）との間として説明する。量子化ビット数検出部１１は、入力された一の周波数帯域の係数が一の周波数帯域の分割境界と低域境界との間に存在するか否かを判断し、さらに量子化ビット数が０であるか否かを判断する。そして、係数が一の周波数帯域の分割境界と低域境界の間に含まれない場合は、折り返し歪みは非常に小さいので、バタフライ演算部３１を経ることなく当該係数を周波数時間変換部２４へ出力する。量子化ビット数検出部１１は、係数の量子化ビット数が０であると判断した場合、帯域分割境界を中心に折り返した高域側の係数の量子化ビット数を判断する。すなわち、量子化ビット数検出部１１は帯域内の全ての係数について検出するのではなく、所定周波数内の係数のみを検出してバタフライ演算部３１による演算を行う。この所定周波数は、例えば、上述したように、帯域の分割境界（Ｉ（２５５）とＩ（２５６）との間）と、図１２の周波数応答に基づく所定強度（−７０ｄＢ）以上の周波数（Ｉ（１９１）とＩ（１９２）との間）との間に存在する周波数とすればよい。量子化ビット数検出部１１が検出する係数の範囲は、帯域分割フィルタの特性、音質及び消費電力等によって適宜設定すれば良く、検出する係数の範囲を予め量子化ビット数検出部１１の図示しないメモリに記憶しておけばよい。また本実施の形態においては、周波数応答に基づく強度が−７０ｄＢ以上の周波数としたが、これに限るものではなく、例えば高域側の周波数応答においては帯域の分割境界から周波数が小さくなるにつれて強度が減少するが、最初に極値をとる強度（図１２では−７４ｄＢ）以上の周波数としても良い。この場合、量子化ビット数検出部１１が検出する係数は、帯域の分割境界に対応する周波数と、高域側の周波数応答において分割境界を経て最初に極値をとる強度に対応する周波数との間に属する係数となる。

量子化ビット数検出部１１は、帯域分割境界を中心に折り返した高域側の係数の量子化ビット数が０と判断した場合、折り返し成分も０であり、折り返し歪みは発生しないので、量子化ビット数検出部１１は一の周波数帯域の係数を、バタフライ演算部３１を経ることなく周波数時間変換部２４へ出力する。

当該係数または帯域分割境界を中心に折り返した高域側の係数の量子化ビット数のどちらか一方が０でない場合、当該係数と帯域分割境界を中心に折り返した高域側の係数をバタフライ演算部３１へ出力する。

バタフライ演算部３１は、当該係数と帯域分割境界を中心に折り返した高域側の係数及びバタフライ係数を用いてバタフライ演算を行い、バタフライ演算後の係数を周波数時間変換部２４へ出力する。なお、バタフライ演算は帯域分割された境界帯域の折り返し歪みを削減するために行われる。またバタフライ係数については後述する。周波数時間変換部２４ではＩＭＤＣＴ処理が施され、時間軸の音響信号に変換される。更に、逆変換された音響信号は周波数帯域合成部２５において、帯域合成フィルタであるＩＱＭＦによって帯域合成された後、音響信号出力部２６へ出力される。

図１１に示すＩ（２５５）とＩ（２５６）とを中心として、図１２に示すＱＭＦの周波数応答の約−７０dＢまでの低域側６４個のＩＭＤＣＴ係数と高域側の６４個のＩＭＤＣＴ係数に対し、すなわち、低域境界までのＩ（１９２）〜Ｉ（２５５）と、高域境界までのＩ（２５６）〜Ｉ（３１９）に対して折り返し歪み成分を打ち消すバタフライ演算が行われる。ここで一の周波数帯域ｂｌｏｃｋ（Ｌ）の係数Ｉ（１９３）及びＩ（３１７）に着目する。なお、Ｉ（１９３）及びＩ（３１７）の量子化ビット数は０であるものとする。

Ｉ（１９３）については、分割境界の対称位置にあるＩ（３１８）との比較が行われる。量子化ビット数検出部１１は係数Ｉ（３１８）の量子化ビット数を検出し、０であるか否かを判断する。ここで、係数Ｉ（３１８）の量子化ビット数は０でないので、Ｉ（１９３）及びＩ（３１８）を用いたバタフライ演算が行われる。

図１３はバタフライ演算の手順を示す説明図である。バタフライ演算部３１は入力Ｉｎ１及びＩｎ２を、式（３３）へ代入することにより出力Ｏｕｔ１及びＯｕｔ２を得る。上述の例では、係数Ｉ（１９３）及びＩ（３１８）がそれぞれ入力され、係数Ｉ’（１９３）及びＩ’（３１８）がバタフライ演算部３１から周波数時間変換部２４へ出力される。

ここで、バタフライ演算における係数ｃ_ｉは、入力Ｉｎ１または入力Ｉｎ２と分割境界との間隔に応じて定まる係数であり、図１２のＱＭＦの周波数応答特性から求められる。図１４はバタフライ演算係数記憶部３１０のレコードレイアウトを示す説明図である。バタフライ演算係数記憶部３１０（図示せず）はバタフライ演算部３１内部に記憶されており、入力Ｉｎ１または入力Ｉｎ２と分割境界との間隔ｉに対応付けて係数ｃ_ｉが記憶されている。係数Ｉ（１９３）及びＩ（３１８）の場合、分割領域との間隔ｉ＝６２となり、ｃ_ｉ＝-0.00054932が選択される。この係数ｃ_ｉから式（３３）によって係数ｃｓ_ｉ及びｃａ_ｉが算出される。なお、計算後のｃｓ_ｉ及びｃａ_ｉも予めバタフライ演算部３１内部に記憶しておいても良い。一方、係数Ｉ（１９４）の場合、分割境界の対称位置にあるＩ（３１７）との比較が行われる。ここでＩ（３１７）の量子化ビット数が０であるとすると、量子化ビット数検出部１１はバタフライ演算部３１を経ることなく、係数Ｉ（１９４）及び、Ｉ（３１７）をそのまま周波数時間変換部２４へ出力する。

図１５はバタフライ演算処理の手順を示すフローチャートである。まず、量子化ビット数検出部１１は係数の初期選択を行う（ステップＳ１６１）。量子化ビット数検出部１１は選択された係数が一の周波数帯域の分割境界と低域境界との間に存在するか否かを判断する（ステップＳ１６２）。

量子化ビット数検出部１１は選択された係数が一の周波数帯域の分割境界と低域境界との間に存在すると判断した場合（ステップＳ１６２でＹＥＳ）、選択された係数の量子化ビット数が０であるか否かを判断する（ステップＳ１６３）。量子化ビット数検出部１１は選択された係数の量子化ビット数が０と判断した場合（ステップＳ１６３でＹＥＳ）、分割境界を中心として折り返した高域側の周波数帯域の係数の量子化ビット数が０であるか否かを判断する（ステップＳ１６４）。量子化ビット数検出部１１は、分割境界を中心として折り返した高域側の周波数帯域の係数の量子化ビット数が０でないと判断した場合（ステップＳ１６４でＮＯ）、選択された係数及び高域側の周波数帯域の係数をバタフライ演算部３１へ出力する。バタフライ演算部３１は一の周波数帯域の係数及び高域側の周波数帯域の係数を用いてバタフライ演算を行う（ステップＳ１６６）。具体的にはバタフライ演算部３１は式３３を読み出し、またバタフライ演算係数記憶部３１０から読み出した係数Ｃ_ｉ並びに一の周波数帯域の係数及び高域側の周波数帯域の係数を、読み出した式に代入し演算後の係数及び高域側の係数を求める。バタフライ演算後の一の周波数帯域の係数及び高域側の周波数帯域の係数は周波数時間変換部２４へ出力される。

量子化ビット数検出部１１は、選択された係数の量子化ビット数が０でないと判断した場合（ステップＳ１６３でＮＯ）、分割境界を中心として折り返した高域側の周波数帯域の係数の量子化ビット数が０であるか否かを判断する（ステップＳ１６５）。量子化ビット数検出部１１は、分割境界を中心として折り返した高域側の周波数帯域の係数の量子化ビット数が０と判断した場合（ステップＳ１６５でＹＥＳ）、選択された係数及び高域側の周波数帯域の係数がバタフライ演算部３１へ出力され、ステップＳ１６６で述べた処理が行われる。

ステップＳ１６２においてＮＯの場合、ステップＳ１６４においてＹＥＳの場合、及びステップＳ１６５においてＮＯの場合は、ステップＳ１６６の処理、すなわちバタフライ演算処理がスキップされ、この場合選択された係数はバタフライ演算部３１を経ることなく周波数時間変換部２４へ出力される。その後、バタフライ演算部３１はｂｌｏｃｋ（Ｌ）の全係数に対して処理を終了したか否かを判断する（ステップＳ１６７）。バタフライ演算部３１は全ての係数について処理を終えていないと判断した場合（ステップＳ１６７でＮＯ）、ステップＳ１６２乃至ステップＳ１６６の処理を未だ終えていない係数へ変更し、ステップＳ１６２以降の処理を繰り返す。一方、バタフライ演算部３１は全ての係数について処理を終えたと判断した場合（ステップＳ１６７でＹＥＳ）、一連の処理を終了する。

本実施の形態４は以上の如き構成としてあり、その他の構成及び作用は実施の形態１乃至３と同様であるので、対応する部分には同一の参照番号を付してその詳細な説明を省略する。

実施の形態５
図１６は実施の形態５に係る信号処理装置たる復号装置２０及び復号装置２０Ａのハードウェア構成を示すブロック図である。図１６は実施の形態１の復号装置２０及び実施の形態４の復号装置２０Ａをそれぞれ組み合わせたものであり、これらに方式判断部３２を加えたものである。方式判断部３２は入力される音響信号の符号化方式を判断し、符号化方式に応じて入力される音響信号を復号装置２０または復号装置２０Ａのいずれかへ出力する。方式判断部３２は、入力された符号化方式が、折り返し歪みを削減するバタフライ演算を行う方式であると判断した場合、補間処理部１を備える復号装置２０へ音響信号を出力する。一方、入力された符号化方式が、折り返し歪みを削減するバタフライ演算を行う方式でないと判断した場合、バタフライ演算部３１を備える復号装置２０Ａへ音響信号を出力する。例えば方式判断部３２は、入力音響信号中のヘッダ等を参照することにより、符号化方式がＭＰ３方式であると判断した場合、入力音響信号を復号装置２０へ出力する。その後、入力音響信号は実施の形態１で述べた補間処理が行われる。一方、方式判断部３２は、入力音響信号の符号化方式がＡＡＣ方式、または、ＡＴＲＡＣ方式であると判断した場合、入力音響信号を復号装置２０Ａへ出力する。その後、入力音響信号は実施の形態４で述べたバタフライ演算処理が行われる。

本実施の形態５は以上の如き構成としてあり、その他の構成及び作用は実施の形態１乃至４と同様であるので、対応する部分には同一の参照番号を付してその詳細な説明を省略する。

実施の形態６
実施の形態５に係る処理を図９で示したパーソナルコンピュータを用いてソフトウェア処理として実現するようにしても良い。図１７は実施の形態６に係る信号処理装置２０の構成を示すブロック図である。信号処理装置たるパーソナルコンピュータ２０を動作させるためのコンピュータプログラムは、本実施の形態６のように、ＣＤ−ＲＯＭ、ＭＯ、またはＤＶＤ−ＲＯＭ等の可搬型記録媒体１Ａで提供することも可能である。さらに、コンピュータプログラムを、通信部６６を介して図示しないサーバコンピュータからダウンロードすることも可能である。以下に、その内容を説明する。

図１７に示すパーソナルコンピュータ２０の図示しないリーダ／ライタに、方式を判断させ、量子化ビット数を検出させ、バタフライ演算をさせるコンピュータプログラムが記録された可搬型記録媒体１Ａ（ＣＤ−ＲＯＭ、ＭＯ又はＤＶＤ−ＲＯＭ等）を、挿入して記憶部６５の制御プログラム内にこのプログラムをインストールする。または、かかるプログラムを、通信部６６を介して外部の図示しないサーバコンピュータからダウンロードし、記憶部６５にインストールするようにしても良い。かかるプログラムはＲＡＭ６２にロードして実行される。これにより、上述のような本発明の信号処理装置２０として機能する。

本実施の形態６は以上の如き構成としてあり、その他の構成及び作用は実施の形態１乃至５と同様であるので、対応する部分には同一の参照番号を付してその詳細な説明を省略する。

信号処理装置たる復号装置のハードウェア構成を示すブロック図である。周波数に対するＩＭＤＣＴ係数の変化を示すグラフである。補間処理部のハードウェア構成を示すブロック図である。補間処理の手順を示すフローチャートである。実施の形態２に係る補間処理部のハードウェア構成を示すブロック図である。有効範囲を説明するためのグラフである。補正処理の手順を示すフローチャートである。ゲインの算出処理の手順を示すフローチャートである。実施の形態３に係る信号処理装置の構成を示すブロック図である。実施の形態４に係る復号装置のハードウェア構成を示すブロック図である。対称帯域にある係数を説明するためのグラフである。ＱＭＦの周波数応答を示すグラフである。バタフライ演算の手順を示す説明図である。バタフライ演算係数記憶部のレコードレイアウトを示す説明図である。バタフライ演算処理の手順を示すフローチャートである。実施の形態５に係る信号処理装置たる復号装置及び復号装置のハードウェア構成を示すブロック図である。実施の形態６に係る信号処理装置の構成を示すブロック図である。従来の復号装置のハードウェア構成を示すブロック図である。

符号の説明

１補間処理部
１１量子化ビット数検出部
１２補間判定部
１３選択部
１４算出部
１５有効範囲決定部
１６補正部
２０、２０Ａ復号装置（信号処理装置）
２１音響信号入力部
２２アンパッキング部
２３逆量子化部
２４周波数時間変換部
２５周波数帯域合成部
２６音響信号出力部
３１バタフライ演算部
３２方式判断部
１Ａ可搬型記録媒体

Claims

帯域分割された符号化音響信号を逆量子化した音響信号を処理する信号処理方法において、
逆量子化した音響信号の周波数帯域の係数の量子化時における量子化ビット数を検出する検出ステップと、
該検出ステップにより検出した一の周波数帯域内の係数の量子化ビット数が零であり、かつ、前記検出ステップにより検出した前記一の周波数帯域に隣接する他の周波数帯域内の折り返し位置にある係数の量子化ビット数が非零の場合、前記一の周波数帯域の係数および前記他の周波数帯域の係数についてバタフライ演算を行う演算ステップと
を備えることを特徴とする信号処理方法。
帯域分割された符号化音響信号を逆量子化した音響信号を処理する信号処理装置において、
逆量子化した音響信号の周波数帯域の係数の量子化時における量子化ビット数を検出する検出部と、
該検出部により検出した一の周波数帯域内の係数の量子化ビット数が零であり、かつ、前記検出部により検出した前記一の周波数帯域に隣接する他の周波数帯域内の折り返し位置にある係数の量子化ビット数が非零の場合、前記一の周波数帯域の係数および前記他の周波数帯域の係数についてバタフライ演算を行う演算部と
を備えることを特徴とする信号処理装置。
前記検出部は、
逆量子化した音響信号の周波数帯域の係数の内、前記帯域分割の境界から所定周波数内に存在する係数の量子化時における量子化ビット数を検出するよう構成してある
ことを特徴とする請求項２に記載の信号処理装置。
前記所定周波数は、
前記帯域分割の境界の周波数と、帯域分割を行う帯域分割フィルタの周波数応答に基づく所定強度以上の周波数との間の周波数である
ことを特徴とする請求項３に記載の信号処理装置。
帯域分割された符号化音響信号を逆量子化した音響信号をコンピュータにより処理するプログラムにおいて、
コンピュータに、
逆量子化した音響信号の周波数帯域の係数の量子化時における量子化ビット数を検出する検出ステップと、
該検出ステップにより検出した一の周波数帯域内の係数の量子化ビット数が零であり、かつ、前記検出ステップにより検出した前記一の周波数帯域に隣接する他の周波数帯域内の折り返し位置にある係数の量子化ビット数が非零の場合、前記一の周波数帯域の係数および前記他の周波数帯域の係数についてバタフライ演算を行う演算ステップと
を実行させるためのプログラム。
帯域分割された符号化音響信号を逆量子化した音響信号を処理する信号処理方法において、
符号化音響信号の符号化方式がバタフライ演算を行う方式であるか否かを判断する方式判断ステップと、
逆量子化した音響信号の周波数帯域の係数の量子化時における量子化ビット数を検出する検出ステップと、
前記方式判断ステップにて符号化方式がバタフライ演算を行う方式でないと判断し、また、前記検出ステップにより検出した一の周波数帯域内の係数の量子化ビット数が零であり、かつ、前記検出ステップにより検出した前記一の周波数帯域に隣接する他の周波数帯域内の折り返し位置にある係数の量子化ビット数が非零の場合、前記一の周波数帯域の係数および前記他の周波数帯域の係数についてバタフライ演算を行う演算ステップとを備えることを特徴とする信号処理方法。
帯域分割された符号化音響信号を逆量子化した音響信号を処理する信号処理装置において、
符号化音響信号の符号化方式がバタフライ演算を行う方式であるか否かを判断する方式判断部と、
逆量子化した音響信号の周波数帯域の係数の量子化時における量子化ビット数を検出する検出部と、
前記方式判断部にて符号化方式がバタフライ演算を行う方式でないと判断し、また、前記検出部により検出した一の周波数帯域内の係数の量子化ビット数が零であり、かつ、前記検出部により検出した前記一の周波数帯域に隣接する他の周波数帯域内の折り返し位置にある係数の量子化ビット数が非零の場合、前記一の周波数帯域の係数および前記他の周波数帯域の係数についてバタフライ演算を行う演算部と
を備えることを特徴とする信号処理装置。
逆量子化した音響信号の周波数帯域の係数の中から複数の係数を選択する選択部と、
前記方式判断部において符号化方式がバタフライ演算を行う方式と判断した場合に、前記選択部により選択した複数の係数を用いた補間法により、前記選択部により選択されない係数であって前記検出部にて検出した量子化ビット数が零の係数に対する補間係数を算出する算出部と
をさらに備えることを特徴とする請求項７に記載の信号処理装置。
帯域分割された符号化音響信号を逆量子化した音響信号をコンピュータにより処理するプログラムにおいて、
コンピュータに、
符号化音響信号の符号化方式がバタフライ演算を行う方式であるか否かを判断する方式判断ステップと、
逆量子化した音響信号の周波数帯域の係数の量子化時における量子化ビット数を検出する検出ステップと、
前記方式判断ステップにて符号化方式がバタフライ演算を行う方式でないと判断し、また、前記検出ステップにより検出した一の周波数帯域内の係数の量子化ビット数が零であり、かつ、前記検出ステップにより検出した前記一の周波数帯域に隣接する他の周波数帯域内の折り返し位置にある係数の量子化ビット数が非零の場合、前記一の周波数帯域の係数および前記他の周波数帯域の係数についてバタフライ演算を行う演算ステップと
を実行させるためのプログラム。