JP3639216B2

JP3639216B2 - 音響信号符号化装置

Info

Publication number: JP3639216B2
Application number: JP2001052113A
Authority: JP
Inventors: 厚堀田
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2001-02-27
Filing date: 2001-02-27
Publication date: 2005-04-20
Anticipated expiration: 2021-02-27
Also published as: JP2002261622A; US20020120442A1; US6577252B2

Description

【０００１】
【発明の属する技術分野】
本発明は、広帯域の音響信号を符号化し、符号化処理によって生成された符号化ビット列を伝送路へ多重伝送する音響信号符号化装置、特に処理の対象とする信号の成分が正弦波等の周波数成分の存在帯域が狭い場合のＳ／Ｎ比等の客観特性の劣化を防ぐことに関する。
【０００２】
【従来の技術】
従来の音響信号符号化装置の例として、ＩＳＯ／ＩＥＣ１３８１８−７規格(以下、ＭＰＥＧ−２ＡＡＣ方式と記す)で示されている音響信号符号化装置について説明する(なお、ＭＰＥＧ−２ＡＡＣ方式については前記規格に詳しく規定されている)。
【０００３】
図１５は従来の音響信号符号化装置として、ＭＰＥＧ−２ＡＡＣ方式のブロック図を示したものである。図において１は心理音響モデル部、１１はＦＦＴ(Fast Fourier Transform：高速フーリエ変換)演算部、１２はブロックタイプ判別部、１３はＳＭＲ(Signal Mask Ratio：信号対マスク比)演算部、２はＭＤＣＴ(Modified Discrete Cosine Transform：変形離散コサイン変換)処理部、３は反復ループ処理部、３１は許容誤差量計算部、３２はビット量／誤差量制御部、３３は正規化処理部、３４は量子化部、３５はハフマン符号化部、４は多重化部である。次にその動作を説明する。
【０００４】
心理音響モデル部１に入力された入力信号は、ＦＦＴ演算部１１においてＦＦＴ計算処理が行われ、ＦＦＴ周波数スペクトルが生成される。
【０００５】
ブロックタイプ判別部１２の説明の前に、処理ブロックタイプの説明を行う。時間軸上の信号を周波数軸上の信号に変換する際には、分析対象とする信号を時間的に長くして周波数分解能を向上させるロングタイプと、分析対象とする信号を時間的に短くして時間分解能を向上させるショートタイプの２種類の処理ブロックタイプが存在する。前者は定常的な信号のみが存在する場合、一方、後者は急な信号変化のある場合に用いられるものである。ＭＰＥＧ−２ＡＡＣ方式ではこれらの２種類の処理ブロックタイプを信号の特性に応じて使い分けることにより、時間分解能の不足に起因して発生するプリエコーと呼ばれる不快な雑音の発生を防いでいる。
【０００６】
ブロックタイプ判別部１２ではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルからマスキングしきい値を算出し、これを基にブロックタイプの判別を行い、その結果を処理ブロックタイプとしてＭＤＣＴ処理部２と多重化部４に渡す。
【０００７】
次に、ＳＭＲ演算部１３ではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルと、ブロックタイプ判別部１２におけるマスキングしきい値を基にＳＭＲを算出し、その結果として生成されるＳＭＲを反復ループ処理部３内の許容誤差計算部３１に渡す。
【０００８】
ＭＤＣＴ処理部２ではブロックタイプ判別部１２から受け取った処理ブロックタイプを基に、時間軸から周波数軸へ変換処理、即ち、周波数直交変換処理を行い、その結果として生成されるＭＤＣＴ周波数スペクトルを反復ループ処理部３内の許容誤差計算部３１と正規化処理部３３に渡す。
【０００９】
反復ループ処理部３内の許容誤差計算部３１では、ＭＤＣＴ周波数スペクトルとＳＭＲの逆数(１／ＳＭＲ)の乗算を行い、許容できる誤差量の計算を行う。ここで言う誤差量とは、ＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルと量子化／逆量子化を経て生成された逆量子化値の差分、即ち量子化誤差のことを指し、この値が許容範囲内に収まっていれば、人間の耳にノイズが知覚されずに済む。
【００１０】
許容誤差量計算部３１において算出された誤差量は、ビット量／誤差量制御部３２に渡され、量子化／逆量子化を経て生成されたＭＤＣＴ周波数スペクトルが許容誤差量を満足しているかの判定の指標として用いられる。
【００１１】
正規化処理部３３ではビット量／誤差量制御部３２において選択されたスケールファクタを用いて、ＭＤＣＴ処理部２から渡されたＭＤＣＴ周波数スペクトルの正規化が行われる。
【００１２】
量子化部３４では正規化処理部３３において正規化されたＭＤＣＴ周波数スペクトルの量子化を行い、その結果をハフマン符号化部３５に渡す。また、誤差量を算出するために、逆量子化を行いその値をビット量／誤差量制御部３２に渡す。
【００１３】
量子化されたＭＤＣＴ周波数スペクトルは、ハフマン符号化部３５においてハフマン符号化を施され、実際に必要となったビット量をビット量／誤差量制御部３２に、ハフマン符号帳番号とハフマン符号を多重化部４に渡す。
【００１４】
ビット量／誤差量制御部３２ではＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルと量子化部３４から得た逆量子化されたＭＤＣＴ周波数スペクトルの差分、即ち、量子化による誤差量を計算し、許容誤差量計算部３１において算出された誤差量との比較を行う。その結果、量子化による誤差量の方が大きいと判定された場合はスケールファクタの値を小さくし、その値を正規化処理部３３に渡す。
【００１５】
一方、量子化による誤差量の方が小さいと判定された場合は、ハフマン符号化部３５から得た使用ビット量と、符号化の際に指定されるビットレートから算出された許容ビット量との比較を行う。その結果、使用ビット量の方が大きいと判定された場合はスケールファクタの値を大きくし、その値を正規化処理部３３に渡す。一方、使用ビット量の方が小さいと判定された場合は反復ループ処理部３内の処理を終了し、多重化処理に移行する。
【００１６】
以上説明したように、許容誤差計算部３１、ビット量／誤差量制御部３２、正規化処理部３３、量子化処理部３４、ハフマン符号化部３５で構成される反復ループ処理部３の処理は、実際に量子化されたＭＤＣＴ周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【００１７】
次に、量子化されハフマン符号化されたＭＤＣＴ周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部１２において決定された処理ブロックタイプと、ビット量／誤差量制御部３２において選択されたスケールファクタと、ハフマン符号化部３５において選択されたハフマン符号帳番号と共に多重化部４において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【００１８】
【発明が解決しようとする課題】
一般的に、心理音響モデルを利用した符号化方式の特徴としては、音声／音楽信号の聴感品質は良いが、Ｓ／Ｎ比(Signal／Noise：信号対雑音比)等に代表される客観特性は、逆に悪くなる傾向がある。上述の従来の音響信号符号化装置等では、符号化処理の対象とする信号が、正弦波のような周波数成分の存在する帯域が狭い場合においても、心理音響モデルにおいて算出された人間の聴覚特性を考慮したパラメータを用いて符号化処理が行われていたため、客観特性が劣化することが問題となっていた。
【００１９】
本発明は、かかる問題を解決するためになされたものであり、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを用いない、或いは当該信号に効果的に量子化がなされるものに置き換えることによって、客観特性の劣化を防ぐことを可能にした音響信号符号化装置を提供することを目的とする。
【００２０】
【課題を解決するための手段】
前記の目的に鑑み、この発明は、入力信号のＦＦＴ計算処理を行うＦＦＴ演算部と、このＦＦＴ演算部の演算結果であるＦＦＴ周波数スペクトルを利用してＭＤＣＴ処理部の処理ブロックタイプを判別するブロックタイプ判別部と、前記ＦＦＴ演算部の演算結果であるＦＦＴ周波数スペクトルを利用して前記入力信号の信号成分が正弦波か否かの判定を行う正弦波判定部と、前記ＦＦＴ演算部の演算結果であるＦＦＴ周波数スペクトルを利用してＳＭＲの演算を行うＳＭＲ演算部と、前記正弦波判定部での正弦波の判定結果に基づいて前記ＳＭＲ演算部からの出力値を利用するか否か切り換える手段と、前記ブロックタイプ判別部から受け取った処理ブロックタイプを基に入力信号の周波数直交変換処理を行いＭＤＣＴ周波数スペクトルを求めるＭＤＣＴ処理部と、前記ＳＭＲ及びＭＤＣＴ周波数スペクトルを用いて許容誤差量の計算を行う許容誤差量計算部と、この許容誤差量計算部からの誤差量及び量子化部からの逆量子化値及びハフマン符号化部からの使用ビット量を基にビット量／誤差量の制御を行いスケールファクタを決定するビット量／誤差量制御部と、このビット量／誤差量制御部からのスケールファクタを基に前記ＭＤＣＴ処理部からのＭＤＣＴ周波数スペクトルの正規化を行う正規化処理部と、この正規化されたＭＤＣＴ周波数スペクトルの量子化及び逆量子化を行う前記量子化部と、この量子化されたＭＤＣＴ周波数スペクトルのハフマン符号化を行いハフマン符号帳番号とハフマン符号を出力するとともに使用ビット量の計算を行う前記ハフマン符号化部と、前記ブロックタイプ判別部からの処理ブロックタイプ、前記ビット量／誤差量制御部からのスケールファクタおよび前記ハフマン符号化部からのハフマン符号帳番号とハフマン符号の多重化を行う多重化部と、を備え、前記正弦波判定部において、前記ＦＦＴ演算部において計算されたＦＦＴ周波数スペクトルから、振幅スペクトル、パワースペクトル、ＦＦＴ周波数スペクトルの実数成分の絶対値、虚数成分の絶対値のいずれか１つを計算し、これの低域側で周波数範囲が狭く、高域側で周波数範囲が広くなるように規定したバンド毎の和をとり、全てのバンドの中で最大値をとるバンドと、最大値をとるバンドの前後２つのバンドを除いた残りのバンドから２番目に大きい値をとるバンドを探索し、最大値をとるバンドと２番目に大きい値をとるバンドの相対比を正弦波の判定の指標とすることを特徴とする音響信号符号化装置にある。
【００２１】
また、前記正弦波判定部での正弦波の判定結果に基づいて前記ＳＭＲ演算部の演算処理の実行、停止を切り換える手段をさらに備えたことを特徴とする。
【００２２】
また、前記正弦波判定部での正弦波の判定結果に基づいてＳＭＲ演算部からの出力値を利用するか否か切り換える手段において、前記ＳＭＲ演算部からの出力値を利用しない場合には予め定めておいたＳＭＲの値を使用することを特徴とする。
【００２３】
また、入力信号のＦＦＴ計算処理を行うＦＦＴ演算部と、このＦＦＴ演算部の演算結果であるＦＦＴ周波数スペクトルを利用してＭＤＣＴ処理部の処理ブロックタイプを判別するブロックタイプ判別部と、前記ＦＦＴ演算部の演算結果であるＦＦＴ周波数スペクトルを利用して前記入力信号の信号成分が正弦波か否かの判定を行う正弦波判定部と、前記ＦＦＴ演算部の演算結果であるＦＦＴ周波数スペクトルを利用してＳＭＲの演算を行うＳＭＲ演算部と、ブロックタイプ判別部から受け取った処理ブロックタイプを基に入力信号の周波数直交変換処理を行いＭＤＣＴ周波数スペクトルを求めるＭＤＣＴ処理部と、前記ＳＭＲ及びＭＤＣＴ周波数スペクトルを用いて許容誤差量の計算を行う許容誤差量計算部と、前記正弦波判定部での正弦波の判定結果に基づいて前記許容誤差量計算部からの出力値を利用するか否か切り換える手段と、前記許容誤差量計算部からの誤差量及び量子化部からの逆量子化値及びハフマン符号化部からの使用ビット量を基にビット量／誤差量の制御を行いスケールファクタを決定するビット量／誤差量制御部と、このビット量／誤差量制御部からのスケールファクタを基に前記ＭＤＣＴ処理部からのＭＤＣＴ周波数スペクトルの正規化を行う正規化処理部と、この正規化されたＭＤＣＴ周波数スペクトルの量子化及び逆量子化を行う前記量子化部と、この量子化されたＭＤＣＴ周波数スペクトルのハフマン符号化を行いハフマン符号帳番号とハフマン符号を出力するとともに使用ビット量の計算を行う前記ハフマン符号化部と、前記ブロックタイプ判別部からの処理ブロックタイプ、前記ビット量／誤差量制御部からのスケールファクタおよび前記ハフマン符号化部からのハフマン符号帳番号とハフマン符号の多重化を行う多重化部と、を備え、前記正弦波判定部において、前記ＦＦＴ演算部において計算されたＦＦＴ周波数スペクトルから、振幅スペクトル、パワースペクトル、ＦＦＴ周波数スペクトルの実数成分の絶対値、虚数成分の絶対値のいずれか１つを計算し、これの低域側で周波数範囲が狭く、高域側で周波数範囲が広くなるように規定したバンド毎の和をとり、全てのバンドの中で最大値をとるバンドと、最大値をとるバンドの前後２つのバンドを除いた残りのバンドから２番目に大きい値をとるバンドを探索し、最大値をとるバンドと２番目に大きい値をとるバンドの相対比を正弦波の判定の指標とすることを特徴とする音響信号符号化装置にある。
【００２４】
また、前記正弦波判定部での正弦波の判定結果に基づいて前記ＳＭＲ演算部の演算処理の実行、停止を切り換える手段と、前記正弦波判定部での正弦波の判定結果に基づいて前記許容誤差量計算部の演算処理の実行、停止を切り換える手段と、をさらに備えたことを特徴とする。
【００２５】
また、前記正弦波判定部での正弦波の判定結果に基づいて前記許容誤差量計算部からの出力値を利用するか否か切り換える手段において、許容誤差計算部からの出力値を利用しない場合には、予め定めておいた許容誤差量の値を使用することを特徴とする。
【００２６】
また、入力信号のＦＦＴ計算処理を行うＦＦＴ演算部と、このＦＦＴ演算部の演算結果であるＦＦＴ周波数スペクトルを利用してＭＤＣＴ処理部の処理ブロックタイプを判別するブロックタイプ判別部と、このブロックタイプ判別部から受け取った処理ブロックタイプを基に入力信号の周波数直交変換処理を行いＭＤＣＴ周波数スペクトルを求めるＭＤＣＴ処理部と、このＭＤＣＴ処理部の演算結果であるＭＤＣＴ周波数スペクトルを利用して前記入力信号の信号成分が正弦波か否かの判定を行う正弦波判定部と、前記ＦＦＴ演算部の演算結果であるＦＦＴ周波数スペクトルを利用してＳＭＲの演算を行うＳＭＲ演算部と、前記正弦波判定部での正弦波の判定結果に基づいて前記ＳＭＲ演算部からの出力値を利用するか否か切り換える手段と、前記ＳＭＲ及びＭＤＣＴ周波数スペクトルを用いて許容誤差量の計算を行う許容誤差量計算部と、この許容誤差量計算部からの誤差量及び量子化部からの逆量子化値及びハフマン符号化部からの使用ビット量を基にビット量／誤差量の制御を行いスケールファクタを決定するビット量／誤差量制御部と、このビット量／誤差量制御部からのスケールファクタを基に前記ＭＤＣＴ処理部からのＭＤＣＴ周波数スペクトルの正規化を行う正規化処理部と、この正規化されたＭＤＣＴ周波数スペクトルの量子化及び逆量子化を行う前記量子化部と、この量子化されたＭＤＣＴ周波数スペクトルのハフマン符号化を行いハフマン符号帳番号とハフマン符号を出力するとともに使用ビット量の計算を行う前記ハフマン符号化部と、前記ブロックタイプ判別部からの処理ブロックタイプ、前記ビット量／誤差量制御部からのスケールファクタおよび前記ハフマン符号化部からのハフマン符号帳番号とハフマン符号の多重化を行う多重化部と、を備え、前記正弦波判定部において、前記ＭＤＣＴ処理部において計算されたＭＤＣＴ周波数スペクトルからパワースペクトルを計算し、これの低域側で周波数範囲が狭く、高域側で周波数範囲が広くなるように規定したバンド毎の和をとり、全てのバンドの中で最大値をとるバンドと、最大値をとるバンドの前後２つのバンドを除いた残りのバンドから２番目に大きい値をとるバンドを探索し、最大値をとるバンドと２番目に大きい値をとるバンドの相対比を正弦波の判定の指標とすることを特徴とする音響信号符号化装置にある。
【００２７】
また、前記正弦波判定部での正弦波の判定結果に基づいて前記ＳＭＲ演算部の演算処理の実行、停止を切り換える手段をさらに備えたことを特徴とする。
【００２８】
また、前記正弦波判定部での正弦波の判定結果に基づいてＳＭＲ演算部からの出力値を利用するか否か切り換える手段において、前記ＳＭＲ演算部からの出力値を利用しない場合には予め定めておいたＳＭＲの値を使用することを特徴とする。
【００２９】
また、入力信号のＦＦＴ計算処理を行うＦＦＴ演算部と、このＦＦＴ演算部の演算結果であるＦＦＴ周波数スペクトルを利用してＭＤＣＴ処理部の処理ブロックタイプを判別するブロックタイプ判別部と、このブロックタイプ判別部から受け取った処理ブロックタイプを基に入力信号の周波数直交変換処理を行いＭＤＣＴ周波数スペクトルを求めるＭＤＣＴ処理部と、このＭＤＣＴ処理部の演算結果であるＭＤＣＴ周波数スペクトルを利用して前記入力信号の信号成分が正弦波か否かの判定を行う正弦波判定部と、前記ＦＦＴ演算部の演算結果であるＦＦＴ周波数スペクトルを利用してＳＭＲの演算を行うＳＭＲ演算部と、前記ＳＭＲ及びＭＤＣＴ周波数スペクトルを用いて許容誤差量の計算を行う許容誤差量計算部と、前記正弦波判定部での正弦波の判定結果に基づいて前記許容誤差量計算部からの出力値を利用するか否か切り換える手段と、前記許容誤差量計算部からの誤差量及び量子化部からの逆量子化値及びハフマン符号化部からの使用ビット量を基にビット量／誤差量の制御を行いスケールファクタを決定するビット量／誤差量制御部と、このビット量／誤差量制御部からのスケールファクタを基に前記ＭＤＣＴ処理部からのＭＤＣＴ周波数スペクトルの正規化を行う正規化処理部と、この正規化されたＭＤＣＴ周波数スペクトルの量子化及び逆量子化を行う前記量子化部と、この量子化されたＭＤＣＴ周波数スペクトルのハフマン符号化を行いハフマン符号帳番号とハフマン符号を出力するとともに使用ビット量の計算を行う前記ハフマン符号化部と、前記ブロックタイプ判別部からの処理ブロックタイプ、前記ビット量／誤差量制御部からのスケールファクタおよび前記ハフマン符号化部からのハフマン符号帳番号とハフマン符号の多重化を行う多重化部と、を備え、前記正弦波判定部において、前記ＭＤＣＴ処理部において計算されたＭＤＣＴ周波数スペクトルからパワースペクトルを計算し、これの低域側で周波数範囲が狭く、高域側で周波数範囲が広くなるように規定したバンド毎の和をとり、全てのバンドの中で最大値をとるバンドと、最大値をとるバンドの前後２つのバンドを除いた残りのバンドから２番目に大きい値をとるバンドを探索し、最大値をとるバンドと２番目に大きい値をとるバンドの相対比を正弦波の判定の指標とすることを特徴とする音響信号符号化装置にある。
【００３０】
また、前記正弦波判定部での正弦波の判定結果に基づいて前記ＳＭＲ演算部の演算処理の実行、停止を切り換える手段をさらに備えたことを特徴とする。
【００３１】
また、前記正弦波判定部での正弦波の判定結果に基づいて前記許容誤差量計算部からの出力値を利用するか否か切り換える手段において、前記許容誤差計算部からの出力値を利用しない場合には予め定めておいた許容誤差量の値を使用することを特徴とする。
【００４３】
【発明の実施の形態】
実施の形態１．
図１は本発明の実施の形態１による音響信号符号化装置のブロック図を示すものである。上述の従来のものと同一もしくは相当部分は同一符号で示す。図において１４ａは正弦波判定部Ａ、１５は固定テーブル、１６はスイッチである。次にその動作を説明する。
【００４４】
心理音響モデル部１に入力された入力信号は、ＦＦＴ演算部１１においてＦＦＴ計算処理が行われ、ＦＦＴ周波数スペクトルが生成される。
【００４５】
ブロックタイプ判別部１２ではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルからマスキングしきい値を算出し、これを基にブロックタイプの判別を行い、その結果を処理ブロックタイプとしてＭＤＣＴ処理部２と多重化部４に渡す。
【００４６】
次に、ＳＭＲ演算部１３ではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルと、ブロックタイプ判別部１２におけるマスキングしきい値を基にＳＭＲを算出し、その結果として生成されるＳＭＲをスイッチ１６に渡す
【００４７】
正弦波判定部Ａ１４ａではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルを用いて、入力信号の信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ１６を予め定めておいた固定値であるＳＭＲが格納された固定テーブル１５側に接続する。一方、正弦波ではないと判定された場合は、スイッチ１６をＳＭＲ演算部１３側に接続する。正弦波の判定方法の一例を図２〜３に続くフローチャートを用いて説明する。
【００４８】
まず、ＦＦＴ演算部１１において算出されるＦＦＴ周波数スペクトルから、実数成分と虚数成分の自乗和の平方根、即ち、振幅スペクトルを計算し、これを用いて各バンド毎の振幅スペクトル(ＦＦＴｌｅｖｅｌ(ｉ)に相当)の計算を行う(ステップＳ８０)。ここで言うバンドとは、予め設定した周波数帯域の間に存在する周波数スペクトルを束ねてグループ化したもので、人間の聴覚の特性に合わせて低域側では狭く、高域側では広くなるように設定されている。
【００４９】
次に、全バンド中の最大振幅スペクトル値を格納するｍａｘ１と、そのインデックス値ｍａｘ１ｉの初期設定として、バンド０の値を、ｍａｘ１←ＦＦＴｌｅｖｅｌ(０)、ｍａｘ１ｉ←０に設定する(ステップＳ８１)。また、カウンタｉの値を１に設定する(ステップＳ８２)。
【００５０】
ステップＳ８３ではＦＦＴｌｅｖｅｌ(ｉ)とｍａｘ１の比較を行い、ＦＦＴｌｅｖｅｌ(ｉ)がｍａｘ１よりも大きい場合は、ｍａｘ１の値とｍａｘ１ｉの値を更新する。
【００５１】
ｉの値に１を加算(ステップＳ８４)後、ｉが総バンド数よりも大きいかの判定を行い(ステップＳ８５)、条件を満たさない場合はステップＳ８３に戻り、ステップＳ８３〜ステップＳ８５の処理を繰り返す。
【００５２】
次に、全バンドからｍａｘ１ｉの前後２バンドを除いた残りのバンドの中から１番大きい振幅スペクトル値を格納するｍａｘ２と、そのインデックス値ｍａｘ２ｉの初期設定を行う(ステップＳ８６)。ここでｍａｘ１ｉの前後２バンドを除く理由に関して詳しく説明する。
【００５３】
今回の例として挙げている正弦波の判定方法は、全バンドの中から最大振幅スペクトルを取るバンドと、２番目に大きい振幅スペクトルを取るバンドの振幅値の相対比を判断の指標としている。ここで問題となるのは、ｍａｘ１ｉが最大振幅スペクトルを取る場合、その近傍周波数のスペクトルも大きい値になる傾向があり、この周波数成分を全バンドの中から２番目に大きい振幅スペクトルと判断されてしまうことである。今回の例ではこれを防ぐために、最大振幅値を取るバンドの前後２バンドを２番目に大きい振幅スペクトルの判定から外している。
【００５４】
ステップＳ８７はｉの値が、ｍａｘ１ｉ−２より小さい又はｍａｘ１ｉ＋２より大きいかという条件を満たす場合とそうでない場合で処理が異なる。条件を満たす場合は、ステップＳ８３と同様に、ＦＦＴｌｅｖｅｌ(ｉ)とｍａｘ２の比較を行い、ＦＦＴｌｅｖｅｌ(ｉ)がｍａｘ２よりも大きい場合は、ｍａｘ２の値とｍａｘ２ｉの値を更新し、ステップ８８に進む。一方、条件を満たさない場合は処理を行わずにステップ８８に進む。
【００５５】
ｉの値に１を加算(ステップＳ８８)後、ｉが総バンド数よりも大きいかの判定を行い(ステップＳ８９)、条件を満たさない場合はステップＳ８７に戻り、ステップＳ８７〜ステップＳ８９の処理を繰り返す。
【００５６】
次に、ｍａｘ１とｍａｘ２の除算を行い、ｍａｘ１とｍａｘ２の相対比を示すｘに格納する(ステップＳ９０)。
【００５７】
ステップ９１ではｘと予め定めたしきい値(図３の例では１０００．０)との比較を行い、条件を満たした場合は正弦波と判定(ステップＳ９２)、条件を満たさなかった場合は正弦波でないと判定(ステップＳ９３)する。
【００５８】
以上が、正弦波の判定方法の一例である。
【００５９】
図１に戻り、以下の動作は基本的に従来のものと同じであるが、ＭＤＣＴ処理部２では、ブロックタイプ判別部１２から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるＭＤＣＴ周波数スペクトルを反復ループ処理部３内の許容誤差計算部３１と正規化処理部３３に渡す。
【００６０】
反復ループ処理部３内の許容誤差計算部３１では、ＭＤＣＴ周波数スペクトルとＳＭＲの逆数(１／ＳＭＲ)の乗算を行い、許容できる誤差量の計算を行う。ここで言う誤差量とは、ＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルと量子化／逆量子化を経て生成された逆量子化値の差分、即ち量子化誤差のことを指し、この値が許容範囲内に収まっていれば、人間の耳にノイズが知覚されずに済む。
【００６１】
許容誤差量計算部３１において算出された誤差量は、ビット量／誤差量制御部３２に渡され、量子化／逆量子化を経て生成されたＭＤＣＴ周波数スペクトルが許容誤差量を満足しているかの判定の指標として用いられる。
【００６２】
正規化処理部３３ではビット量／誤差量制御部３２において選択されたスケールファクタを用いて、ＭＤＣＴ処理部２から渡されたＭＤＣＴ周波数スペクトルの正規化が行われる。
【００６３】
量子化部３４では正規化処理部３３において正規化されたＭＤＣＴ周波数スペクトルの量子化を行い、その結果をハフマン符号化部３５に渡す。また、誤差量を算出するために、逆量子化を行いその値をビット量／誤差量制御部３２に渡す。
【００６４】
量子化されたＭＤＣＴ周波数スペクトルは、ハフマン符号化部３５においてハフマン符号化を施され、実際に必要となったビット量をビット量／誤差量制御部３２に、ハフマン符号帳番号とハフマン符号を多重化部４に渡す。
【００６５】
ビット量／誤差量制御部３２ではＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルと量子化部３４から得た逆量子化されたＭＤＣＴ周波数スペクトルの差分、即ち、量子化による誤差量を計算し、許容誤差量計算部３１において算出された誤差量との比較を行う。その結果、量子化による誤差量の方が大きいと判定された場合はスケールファクタの値を小さくし、その値を正規化処理部３３に渡す。
【００６６】
一方、量子化による誤差量の方が小さいと判定された場合は、ハフマン符号化部３５から得た使用ビット量と、符号化の際に指定されるビットレートから算出された許容ビット量との比較を行う。その結果、使用ビット量の方が大きいと判定された場合はスケールファクタの値を大きくし、その値を正規化処理部３３に渡す。一方、使用ビット量の方が小さいと判定された場合は反復ループ処理部３内の処理を終了し、多重化処理に移行する。
【００６７】
以上説明したように、許容誤差計算部３１、ビット量／誤差量制御部３２、正規化処理部３３、量子化処理部３４、ハフマン符号化部３５で構成される反復ループ処理部３の処理は、実際に量子化されたＭＤＣＴ周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【００６８】
次に、量子化されハフマン符号化されたＭＤＣＴ周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部１２において決定された処理ブロックタイプと、ビット量／誤差量制御部３２において選択されたスケールファクタと、ハフマン符号化部３５において選択されたハフマン符号帳番号と共に多重化部４において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【００６９】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。
【００７０】
また、前記説明の中では正弦波の判定基準として、ＦＦＴ演算において算出されるＦＦＴ周波数スペクトルの実数成分と虚数成分の自乗和の平方根の振幅スペクトルを利用することを前提としているが、これを実数成分と虚数成分の自乗和、即ちパワースペクトルを利用して処理を行っても、同様の効果が得られる。
【００７１】
また、前記説明の中では正弦波の判定基準として、ＦＦＴ演算において算出されるＦＦＴ周波数スペクトルの実数成分と虚数成分の自乗和の平方根の振幅スペクトルを利用することを前提としているが、自乗和計算を省略し、これを実数成分又は虚数成分を利用して、例えば実数成分又は虚数成分の絶対値を用いて処理を行っても、より少ない計算量で同様の効果が得られる。
【００７２】
実施の形態２．
図４は本発明の実施の形態２による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において１４ｂは正弦波判定部Ｂ、１５は固定テーブル、１６及び１７はスイッチである。次にその動作を説明する。
【００７３】
心理音響モデル部１に入力された入力信号は、ＦＦＴ演算部１１においてＦＦＴ計算処理が行われ、ＦＦＴ周波数スペクトルが生成される。
【００７４】
ブロックタイプ判別部１２ではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルからマスキングしきい値を算出し、これを基にブロックタイプの判別を行い、その結果を処理ブロックタイプとしてＭＤＣＴ処理部２と多重化部４に渡す。
【００７５】
ＳＭＲ演算部１３ではスイッチ１７がブロックタイプ判別部１２に接続された場合のみ、ＦＦＴ演算部１１からのＦＦＴ周波数スペクトルと、ブロックタイプ判別部１２におけるマスキングしきい値を基にＳＭＲを算出し、その結果として生成されるＳＭＲをスイッチ１６に渡す。
【００７６】
正弦波判定部Ｂ１４ｂではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルを用いて、入力信号の信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ１７を何も接続されていない側に接続、即ち、ＳＭＲ演算部１３の処理を停止させる。また、スイッチ１６を予め定めておいた固定値であるＳＭＲが格納された固定テーブル１５側に接続する。
【００７７】
一方、正弦波ではないと判定された場合はスイッチ１７をブロックタイプ判別部１２に接続し、また、スイッチ１６をＳＭＲ演算部１３側に接続する。正弦波の判定方法については、前記実施の形態１で詳しく説明を行ったので省略する。
【００７８】
ＭＤＣＴ処理部２では、ブロックタイプ判別部１２から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるＭＤＣＴ周波数スペクトルを反復ループ処理部３内の許容誤差計算部３１と正規化処理部３３に渡す。
【００７９】
反復ループ処理部３内の動作は前記実施の形態と基本的に同じであり、許容誤差計算部３１、ビット量／誤差量制御部３２、正規化処理部３３、量子化処理部３４、ハフマン符号化部３５で構成される反復ループ処理部３の処理は、実際に量子化されたＭＤＣＴ周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【００８０】
そして量子化されハフマン符号化されたＭＤＣＴ周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部１２において決定された処理ブロックタイプと、ビット量／誤差量制御部３２において選択されたスケールファクタと、ハフマン符号化部３５において選択されたハフマン符号帳番号と共に多重化部４において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【００８１】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。また、ＳＭＲの演算処理を省略することが可能となるため、処理量削減の効果もある。
【００８２】
また、前記説明の中では正弦波の判定基準として、ＦＦＴ演算において算出されるＦＦＴ周波数スペクトルの実数成分と虚数成分の自乗和の平方根の振幅スペクトルを利用することを前提としているが、これを実数成分と虚数成分の自乗和、即ちパワースペクトルを利用して処理を行っても、同様の効果が得られる。
【００８３】
また、前記説明の中では正弦波の判定基準として、ＦＦＴ演算において算出されるＦＦＴ周波数スペクトルの実数成分と虚数成分の自乗和の平方根の振幅スペクトルを利用することを前提としているが、自乗和計算を省略し、これを実数成分又は虚数成分を利用して、例えば実数成分又は虚数成分の絶対値を用いて処理を行っても、より少ない計算量で同様の効果が得られる。
【００８４】
実施の形態３．
図５は本発明の実施の形態３による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において、心理音響モデル部１内の１４ｃは正弦波判定部Ｃ、反復ループ処理部３内の３７はスイッチである。次にその動作を説明する。
【００８５】
心理音響モデル部１のＦＦＴ演算部１１、ブロックタイプ判別部１２およびＳＭＲ演算部１３の動作は前記実施の形態のものと同じである。
【００８６】
正弦波判定部Ｃ１４ｃではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルを用いて、入力信号の信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ３７を予め定めておいた固定値である許容誤差量が格納された固定テーブル３６側に接続する。
【００８７】
一方、正弦波ではないと判定された場合はスイッチ３７を許容誤差量計算部３１に接続する。正弦波の判定方法については、発明の実施の形態１で詳しく説明を行ったので省略する。
【００８８】
ＭＤＣＴ処理部２では、ブロックタイプ判別部１２から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるＭＤＣＴ周波数スペクトルを反復ループ処理部３内の許容誤差計算部３１と正規化処理部３３に渡す。
【００８９】
反復ループ処理部３内の許容誤差計算部３１では、ＭＤＣＴ周波数スペクトルとＳＭＲの逆数(１／ＳＭＲ)の乗算を行い、許容できる誤差量の計算を行う。ここで言う誤差量とは、ＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルと量子化／逆量子化を経て生成された逆量子化値の差分、即ち量子化誤差のことを指し、この値が許容範囲内に収まっていれば、人間の耳にノイズが知覚されずに済む。
【００９０】
正弦波判定部Ｃ１４ｃの制御を経て、スイッチ３７より得られた誤差量は、ビット量／誤差量制御部３２に渡され、量子化／逆量子化を経て生成されたＭＤＣＴ周波数スペクトルが許容誤差量を満足しているかの判定の指標として用いられる。
【００９１】
正規化処理部３３ではビット量／誤差量制御部３２において選択されたスケールファクタを用いて、ＭＤＣＴ処理部２から渡されたＭＤＣＴ周波数スペクトルの正規化が行われる。
【００９２】
量子化部３４では正規化処理部３３において正規化されたＭＤＣＴ周波数スペクトルの量子化を行い、その結果をハフマン符号化部３５に渡す。また、誤差量を算出するために、逆量子化を行いその値をビット量／誤差量制御部３２に渡す。
【００９３】
量子化されたＭＤＣＴ周波数スペクトルは、ハフマン符号化部３５においてハフマン符号化を施され、実際に必要となったビット量をビット量／誤差量制御部３２に、ハフマン符号帳番号とハフマン符号を多重化部４に渡す。
【００９４】
ビット量／誤差量制御部３２ではＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルと量子化部３４から得た逆量子化されたＭＤＣＴ周波数スペクトルの差分、即ち、量子化による誤差量を計算し、許容誤差量計算部３１において算出された誤差量との比較を行う。その結果、量子化による誤差量の方が大きいと判定された場合はスケールファクタの値を小さくし、その値を正規化処理部３３に渡す。
【００９５】
一方、量子化による誤差量の方が小さいと判定された場合は、ハフマン符号化部３５から得た使用ビット量と、符号化の際に指定されるビットレートから算出された許容ビット量との比較を行う。その結果、使用ビット量の方が大きいと判定された場合はスケールファクタの値を大きくし、その値を正規化処理部３３に渡す。一方、使用ビット量の方が小さいと判定された場合は反復ループ処理部３内の処理を終了し、多重化処理に移行する。
【００９６】
以上説明したように、許容誤差計算部３１、ビット量／誤差量制御部３２、正規化処理部３３、量子化処理部３４、ハフマン符号化部３５で構成される反復ループ処理部３の処理は、実際に量子化されたＭＤＣＴ周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【００９７】
次に、量子化されハフマン符号化されたＭＤＣＴ周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部１２において決定された処理ブロックタイプと、ビット量／誤差量制御部３２において選択されたスケールファクタと、ハフマン符号化部３５において選択されたハフマン符号帳番号と共に多重化部４において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【００９８】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。
【００９９】
また、前記説明の中では正弦波の判定基準として、ＦＦＴ演算において算出されるＦＦＴ周波数スペクトルの実数成分と虚数成分の自乗和の平方根の振幅スペクトルを利用することを前提としているが、これを実数成分と虚数成分の自乗和、即ちパワースペクトルを利用して処理を行っても、同様の効果が得られる。
【０１００】
また、前記説明の中では正弦波の判定基準として、ＦＦＴ演算において算出されるＦＦＴ周波数スペクトルの実数成分と虚数成分の自乗和の平方根の振幅スペクトルを利用することを前提としているが、自乗和計算を省略し、これを実数成分又は虚数成分を利用して、例えば実数成分又は虚数成分の絶対値を用いて処理を行っても、より少ない計算量で同様の効果が得られる。
【０１０１】
実施の形態４．
図６は本発明の実施の形態４による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において１４ｄは正弦波判定部Ｄ、３６は固定テーブル、１７と３７と３８と３９はスイッチ、４は多重化部である。次にその動作を説明する。
【０１０２】
心理音響モデル部１に入力された入力信号は、ＦＦＴ演算部１１においてＦＦＴ計算処理が行われ、ＦＦＴ周波数スペクトルが生成される。
【０１０３】
ブロックタイプ判別部１２ではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルからマスキングしきい値を算出し、これを基にブロックタイプの判別を行い、その結果を処理ブロックタイプとしてＭＤＣＴ処理部２と多重化部４に渡す。
【０１０４】
ＳＭＲ演算部１３ではスイッチ１７がブロックタイプ判別部１２に接続された場合のみ、ＦＦＴ演算部１１からのＦＦＴ周波数スペクトルと、ブロックタイプ判別部１２におけるマスキングしきい値を基にＳＭＲを算出し、その結果として生成されるＳＭＲをスイッチ３８に渡す。
【０１０５】
正弦波判定部Ｄ１４ｄではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルを用いて、入力信号の信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ１７を何も接続されていない側に接続、即ち、ＳＭＲ演算部１３の処理を停止させ、スイッチ３８及びスイッチ３９を何も接続されていない側に接続、即ち、許容誤差量計算部３１の処理を停止させる。また、スイッチ３７を予め定めておいた固定値である許容誤差量が格納された固定テーブル３６側に接続する。
【０１０６】
一方、正弦波ではないと判定された場合はスイッチ１７をブロックタイプ判別部１２に接続し、スイッチ３８をＳＭＲ演算部１３に接続し、スイッチ３９をＭＤＣＴ処理部２に接続し、スイッチ３７を許容誤差量計算部３１に接続する。正弦波の判定方法については、発明の実施の形態１で詳しく説明を行ったので省略する。
【０１０７】
ＭＤＣＴ処理部２では、ブロックタイプ判別部１２から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるＭＤＣＴ周波数スペクトルをスイッチ３９と正規化処理部３３に渡す。
【０１０８】
反復ループ処理部３内の許容誤差計算部３１では、正弦波判定部Ｄ１４ｄの制御を経て、スイッチ３８より得られたＳＭＲと、スイッチ３９より得られたＭＤＣＴ周波数スペクトルを用いて、ＭＤＣＴ周波数スペクトルとＳＭＲの逆数(１／ＳＭＲ)の乗算を行い、許容できる誤差量の計算を行う。ここで言う誤差量とは、ＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルと量子化／逆量子化を経て生成された逆量子化値の差分、即ち量子化誤差のことを指し、この値が許容範囲内に収まっていれば、人間の耳にノイズが知覚されずに済む。
【０１０９】
正弦波判定部Ｄ１４ｄの制御を経て、スイッチ３７より得られた誤差量は、ビット量／誤差量制御部３２に渡され、量子化／逆量子化を経て生成されたＭＤＣＴ周波数スペクトルが許容誤差量を満足しているかの判定の指標として用いられる。
【０１１０】
正規化処理部３３ではビット量／誤差量制御部３２において選択されたスケールファクタを用いて、ＭＤＣＴ処理部２から渡されたＭＤＣＴ周波数スペクトルの正規化が行われる。
【０１１１】
量子化部３４では正規化処理部３３において正規化されたＭＤＣＴ周波数スペクトルの量子化を行い、その結果をハフマン符号化部３５に渡す。また、誤差量を算出するために、逆量子化を行いその値をビット量／誤差量制御部３２に渡す。
【０１１２】
量子化されたＭＤＣＴ周波数スペクトルは、ハフマン符号化部３５においてハフマン符号化を施され、実際に必要となったビット量をビット量／誤差量制御部３２に、ハフマン符号帳番号とハフマン符号を多重化部４に渡す。
【０１１３】
ビット量／誤差量制御部３２ではＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルと量子化部３４から得た逆量子化されたＭＤＣＴ周波数スペクトルの差分、即ち、量子化による誤差量を計算し、許容誤差量計算部３１において算出された誤差量との比較を行う。その結果、量子化による誤差量の方が大きいと判定された場合はスケールファクタの値を小さくし、その値を正規化処理部３３に渡す。
【０１１４】
一方、量子化による誤差量の方が小さいと判定された場合は、ハフマン符号化部３５から得た使用ビット量と、符号化の際に指定されるビットレートから算出された許容ビット量との比較を行う。その結果、使用ビット量の方が大きいと判定された場合はスケールファクタの値を大きくし、その値を正規化処理部３３に渡す。一方、使用ビット量の方が小さいと判定された場合は反復ループ処理部３内の処理を終了し、多重化処理に移行する。
【０１１５】
以上説明したように、許容誤差計算部３１、ビット量／誤差量制御部３２、正規化処理部３３、量子化処理部３４、ハフマン符号化部３５で構成される反復ループ処理部３の処理は、実際に量子化されたＭＤＣＴ周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【０１１６】
次に、量子化されハフマン符号化されたＭＤＣＴ周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部１２において決定された処理ブロックタイプと、ビット量／誤差量制御部３２において選択されたスケールファクタと、ハフマン符号化部３５において選択されたハフマン符号帳番号と共に多重化部４において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【０１１７】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。また、ＳＭＲの演算処理及び許容誤差量の計算処理を省略することが可能となるため、処理量削減の効果もある。
【０１１８】
また、前記説明の中では正弦波の判定基準として、ＦＦＴ演算において算出されるＦＦＴ周波数スペクトルの実数成分と虚数成分の自乗和の平方根の振幅スペクトルを利用することを前提としているが、これを実数成分と虚数成分の自乗和、即ちパワースペクトルを利用して処理を行っても、同様の効果が得られる。
【０１１９】
また、前記説明の中では正弦波の判定基準として、ＦＦＴ演算において算出されるＦＦＴ周波数スペクトルの実数成分と虚数成分の自乗和の平方根の振幅スペクトルを利用することを前提としているが、自乗和計算を省略し、これを実数成分又は虚数成分を利用して、例えば実数成分又は虚数成分の絶対値を用いて処理を行っても、より少ない計算量で同様の効果が得られる。
【０１２０】
実施の形態５．
図７は本発明の実施の形態５による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において５ａは正弦波判定部Ｅ、１５は固定テーブル、１６はスイッチである。
【０１２１】
実施の形態１〜４ではＦＦＴ演算部１１の演算結果であるＦＦＴ周波数スペクトルを利用して正弦波の判定を行っているが、実施の形態５〜８ではＭＤＣＴ処理部２の演算結果であるＭＤＣＴ周波数スペクトルを利用して正弦波の判定を行う。次にその動作を説明する。
【０１２２】
心理音響モデル部１に入力された入力信号は、ＦＦＴ演算部１１においてＦＦＴ計算処理が行われ、ＦＦＴ周波数スペクトルが生成される。
【０１２３】
ブロックタイプ判別部１２ではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルからマスキングしきい値を算出し、これを基にブロックタイプの判別を行い、その結果を処理ブロックタイプとしてＭＤＣＴ処理部２と多重化部４に渡す。
【０１２４】
ＳＭＲ演算部１３ではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルと、ブロックタイプ判別部１２におけるマスキングしきい値を基にＳＭＲを算出し、その結果として生成されるＳＭＲをスイッチ１６に渡す。
【０１２５】
次に、ＭＤＣＴ処理部２では、ブロックタイプ判別部１２から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるＭＤＣＴ周波数スペクトルを反復ループ処理部３内の許容誤差計算部３１と正規化処理部３３と正弦波判定部Ｅ５ａに渡す。
【０１２６】
正弦波判定部Ｅ５ａではＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルを用いて、入力信号の信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ１６を予め定めておいた固定値であるＳＭＲが格納された固定テーブル１５側に接続する。
【０１２７】
一方、正弦波ではないと判定された場合は、スイッチ１６をＳＭＲ演算部１３側に接続する。正弦波の判定方法は、発明の実施の形態１で詳しく説明した判定方法に用いたＦＦＴの振幅スペクトルを、ＭＤＣＴのパワースペクトルに置き換えることにより容易に実現できる。よって、詳細な説明は省略する。
【０１２８】
反復ループ処理部３内の許容誤差計算部３１では、ＭＤＣＴ周波数スペクトルとＳＭＲの逆数(１／ＳＭＲ)の乗算を行い、許容できる誤差量の計算を行う。ここで言う誤差量とは、ＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルと量子化／逆量子化を経て生成された逆量子化値の差分、即ち量子化誤差のことを指し、この値が許容範囲内に収まっていれば、人間の耳にノイズが知覚されずに済む。
【０１２９】
許容誤差量計算部３１において算出された誤差量は、ビット量／誤差量制御部３２に渡され、量子化／逆量子化を経て生成されたＭＤＣＴ周波数スペクトルが許容誤差量を満足しているかの判定の指標として用いられる。
【０１３０】
正規化処理部３３ではビット量／誤差量制御部３２において選択されたスケールファクタを用いて、ＭＤＣＴ処理部２から渡されたＭＤＣＴ周波数スペクトルの正規化が行われる。
【０１３１】
量子化部３４では正規化処理部３３において正規化されたＭＤＣＴ周波数スペクトルの量子化を行い、その結果をハフマン符号化部３５に渡す。また、誤差量を算出するために、逆量子化を行いその値をビット量／誤差量制御部３２に渡す。
【０１３２】
量子化されたＭＤＣＴ周波数スペクトルは、ハフマン符号化部３５においてハフマン符号化を施され、実際に必要となったビット量をビット量／誤差量制御部３２に、ハフマン符号帳番号とハフマン符号を多重化部４に渡す。
【０１３３】
ビット量／誤差量制御部３２ではＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルと量子化部３４から得た逆量子化されたＭＤＣＴ周波数スペクトルの差分、即ち、量子化による誤差量を計算し、許容誤差量計算部３１において算出された誤差量との比較を行う。その結果、量子化による誤差量の方が大きいと判定された場合はスケールファクタの値を小さくし、その値を正規化処理部３３に渡す。
【０１３４】
一方、量子化による誤差量の方が小さいと判定された場合は、ハフマン符号化部３５から得た使用ビット量と、符号化の際に指定されるビットレートから算出された許容ビット量との比較を行う。その結果、使用ビット量の方が大きいと判定された場合はスケールファクタの値を大きくし、その値を正規化処理部３３に渡す。一方、使用ビット量の方が小さいと判定された場合は反復ループ処理部３内の処理を終了し、多重化処理に移行する。
【０１３５】
以上説明したように、許容誤差計算部３１、ビット量／誤差量制御部３２、正規化処理部３３、量子化処理部３４、ハフマン符号化部３５で構成される反復ループ処理部３の処理は、実際に量子化されたＭＤＣＴ周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【０１３６】
次に、量子化されハフマン符号化されたＭＤＣＴ周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部１２において決定された処理ブロックタイプと、ビット量／誤差量制御部３２において選択されたスケールファクタと、ハフマン符号化部３５において選択されたハフマン符号帳番号と共に多重化部４において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【０１３７】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。
【０１３８】
実施の形態６．
図８は本発明の実施の形態６による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において５ｂは正弦波判定部Ｆ、１５は固定テーブル、１６と１７はスイッチである。次にその動作を説明する。
【０１３９】
心理音響モデル部１に入力された入力信号は、ＦＦＴ演算部１１においてＦＦＴ計算処理が行われ、ＦＦＴ周波数スペクトルが生成される。
【０１４０】
ブロックタイプ判別部１２ではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルからマスキングしきい値を算出し、これを基にブロックタイプの判別を行い、その結果を処理ブロックタイプとしてＭＤＣＴ処理部２と多重化部４に渡す。
【０１４１】
次に、ＭＤＣＴ処理部２では、ブロックタイプ判別部１２から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるＭＤＣＴ周波数スペクトルを反復ループ処理部３内の許容誤差計算部３１と正規化処理部３３と正弦波判定部Ｆ５ｂに渡す。
【０１４２】
正弦波判定部Ｆ５ｂではＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルを用いて、入力信号の信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ１７を何も接続されていない側に接続、即ち、ＳＭＲ演算部１３の処理を停止させ、スイッチ１６を予め定めておいた固定値であるＳＭＲが格納された固定テーブル１５側に接続する。
【０１４３】
一方、正弦波ではないと判定された場合は、スイッチ１７をブロックタイプ判別部１２側に接続し、スイッチ１６をＳＭＲ演算部１３側に接続する。正弦波の判定方法については、発明の実施の形態５で詳しく説明を行ったので省略する。
【０１４４】
ＳＭＲ演算部１３ではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルと、ブロックタイプ判別部１２におけるマスキングしきい値を基にＳＭＲを算出し、その結果として生成されるＳＭＲをスイッチ１６に渡す。
【０１４５】
反復ループ処理部３内の動作は基本的に上記実施の形態と同じであり、許容誤差計算部３１、ビット量／誤差量制御部３２、正規化処理部３３、量子化処理部３４、ハフマン符号化部３５で構成される反復ループ処理部３の処理は、実際に量子化されたＭＤＣＴ周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【０１４６】
次に、量子化されハフマン符号化されたＭＤＣＴ周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部１２において決定された処理ブロックタイプと、ビット量／誤差量制御部３２において選択されたスケールファクタと、ハフマン符号化部３５において選択されたハフマン符号帳番号と共に多重化部４において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【０１４７】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。また、ＳＭＲの演算処理を省略することが可能となるため、処理量削減の効果もある。
【０１４８】
実施の形態７．
図９は本発明の実施の形態７による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において５ｃは正弦波判定部Ｇ、３６は固定テーブル、３７はスイッチである。次にその動作を説明する。
【０１４９】
心理音響モデル部１のＦＦＴ演算部１１、ブロックタイプ判別部１２およびＳＭＲ演算部１３動作は上記実施の形態のものと同じである。
【０１５０】
次に、ＭＤＣＴ処理部２では、ブロックタイプ判別部１２から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるＭＤＣＴ周波数スペクトルを反復ループ処理部３内の許容誤差計算部３１と正規化処理部３３と正弦波判定部Ｇ５ｃに渡す。
【０１５１】
正弦波判定部Ｇ５ｃではＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルを用いて、入力信号の信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ３７を予め定めておいた固定値である許容誤差量が格納された固定テーブル３６側に接続する。
【０１５２】
一方、正弦波ではないと判定された場合は、スイッチ３７を許容誤差量計算部３１側に接続する。正弦波の判定方法については、発明の実施の形態５で詳しく説明を行ったので省略する。
【０１５３】
反復ループ処理部３内の許容誤差計算部３１では、ＭＤＣＴ周波数スペクトルとＳＭＲの逆数(１／ＳＭＲ)の乗算を行い、許容できる誤差量の計算を行う。ここで言う誤差量とは、ＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルと量子化／逆量子化を経て生成された逆量子化値の差分、即ち量子化誤差のことを指し、この値が許容範囲内に収まっていれば、人間の耳にノイズが知覚されずに済む。
【０１５４】
許容誤差量計算部３１において算出された誤差量は、ビット量／誤差量制御部３２に渡され、量子化／逆量子化を経て生成されたＭＤＣＴ周波数スペクトルが許容誤差量を満足しているかの判定の指標として用いられる。
【０１５５】
正規化処理部３３ではビット量／誤差量制御部３２において選択されたスケールファクタを用いて、ＭＤＣＴ処理部２から渡されたＭＤＣＴ周波数スペクトルの正規化が行われる。
【０１５６】
量子化部３４では正規化処理部３３において正規化されたＭＤＣＴ周波数スペクトルの量子化を行い、その結果をハフマン符号化部３５に渡す。また、誤差量を算出するために、逆量子化を行いその値をビット量／誤差量制御部３２に渡す。
【０１５７】
量子化されたＭＤＣＴ周波数スペクトルは、ハフマン符号化部３５においてハフマン符号化を施され、実際に必要となったビット量をビット量／誤差量制御部３２に、ハフマン符号帳番号とハフマン符号を多重化部４に渡す。
【０１５８】
ビット量／誤差量制御部３２ではＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルと量子化部３４から得た逆量子化されたＭＤＣＴ周波数スペクトルの差分、即ち、量子化による誤差量を計算し、許容誤差量計算部３１において算出された誤差量との比較を行う。その結果、量子化による誤差量の方が大きいと判定された場合はスケールファクタの値を小さくし、その値を正規化処理部３３に渡す。
【０１５９】
一方、量子化による誤差量の方が小さいと判定された場合は、ハフマン符号化部３５から得た使用ビット量と、符号化の際に指定されるビットレートから算出された許容ビット量との比較を行う。その結果、使用ビット量の方が大きいと判定された場合はスケールファクタの値を大きくし、その値を正規化処理部３３に渡す。一方、使用ビット量の方が小さいと判定された場合は反復ループ処理部３内の処理を終了し、多重化処理に移行する。
【０１６０】
以上説明したように、許容誤差計算部３１、ビット量／誤差量制御部３２、正規化処理部３３、量子化処理部３４、ハフマン符号化部３５で構成される反復ループ処理部３の処理は、実際に量子化されたＭＤＣＴ周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【０１６１】
次に、量子化されハフマン符号化されたＭＤＣＴ周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部１２において決定された処理ブロックタイプと、ビット量／誤差量制御部３２において選択されたスケールファクタと、ハフマン符号化部３５において選択されたハフマン符号帳番号と共に多重化部４において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【０１６２】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。
【０１６３】
実施の形態８．
図１０は本発明の実施の形態８による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において５ｄは正弦波判定部Ｈ、１７と３７はスイッチ、３６は固定テーブルである。次にその動作を説明する。
【０１６４】
心理音響モデル部１に入力された入力信号は、ＦＦＴ演算部１１においてＦＦＴ計算処理が行われ、ＦＦＴ周波数スペクトルが生成される。
【０１６５】
ブロックタイプ判別部１２ではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルからマスキングしきい値を算出し、これを基にブロックタイプの判別を行い、その結果を処理ブロックタイプとしてＭＤＣＴ処理部２と多重化部４に渡す。
【０１６６】
次に、ＭＤＣＴ処理部２では、ブロックタイプ判別部１２から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるＭＤＣＴ周波数スペクトルを反復ループ処理部３内の許容誤差計算部３１と正規化処理部３３と正弦波判定部Ｈ５ｄに渡す。
【０１６７】
正弦波判定部Ｈ５ｄではＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルを用いて、入力信号の信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ１７を何も接続されていない側に接続、即ち、ＳＭＲ演算部１３の処理を停止させ、スイッチ３７を予め定めておいた固定値である許容誤差量が格納された固定テーブル３６側に接続する。
【０１６８】
一方、正弦波ではないと判定された場合は、スイッチ１７をブロックタイプ判別部１２側に接続し、スイッチ３７を許容誤差量計算部３１側に接続する。正弦波の判定方法については、発明の実施の形態５で詳しく説明を行ったので省略する。
【０１６９】
ＳＭＲ演算部１３ではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルと、ブロックタイプ判別部１２におけるマスキングしきい値を基にＳＭＲを算出し、その結果として生成されるＳＭＲを許容誤差量計算部３１に渡す。
【０１７０】
反復ループ処理部３内の許容誤差計算部３１では、ＭＤＣＴ周波数スペクトルとＳＭＲの逆数(１／ＳＭＲ)の乗算を行い、許容できる誤差量の計算を行う。ここで言う誤差量とは、ＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルと量子化／逆量子化を経て生成された逆量子化値の差分、即ち量子化誤差のことを指し、この値が許容範囲内に収まっていれば、人間の耳にノイズが知覚されずに済む。
【０１７１】
許容誤差量計算部３１において算出された誤差量は、ビット量／誤差量制御部３２に渡され、量子化／逆量子化を経て生成されたＭＤＣＴ周波数スペクトルが許容誤差量を満足しているかの判定の指標として用いられる。
【０１７２】
正規化処理部３３ではビット量／誤差量制御部３２において選択されたスケールファクタを用いて、ＭＤＣＴ処理部２から渡されたＭＤＣＴ周波数スペクトルの正規化が行われる。
【０１７３】
量子化部３４では正規化処理部３３において正規化されたＭＤＣＴ周波数スペクトルの量子化を行い、その結果をハフマン符号化部３５に渡す。また、誤差量を算出するために、逆量子化を行いその値をビット量／誤差量制御部３２に渡す。
【０１７４】
量子化されたＭＤＣＴ周波数スペクトルは、ハフマン符号化部３５においてハフマン符号化を施され、実際に必要となったビット量をビット量／誤差量制御部３２に、ハフマン符号帳番号とハフマン符号を多重化部４に渡す。
【０１７５】
ビット量／誤差量制御部３２ではＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルと量子化部３４から得た逆量子化されたＭＤＣＴ周波数スペクトルの差分、即ち、量子化による誤差量を計算し、許容誤差量計算部３１において算出された誤差量との比較を行う。その結果、量子化による誤差量の方が大きいと判定された場合はスケールファクタの値を小さくし、その値を正規化処理部３３に渡す。
【０１７６】
一方、量子化による誤差量の方が小さいと判定された場合は、ハフマン符号化部３５から得た使用ビット量と、符号化の際に指定されるビットレートから算出された許容ビット量との比較を行う。その結果、使用ビット量の方が大きいと判定された場合はスケールファクタの値を大きくし、その値を正規化処理部３３に渡す。一方、使用ビット量の方が小さいと判定された場合は反復ループ処理部３内の処理を終了し、多重化処理に移行する。
【０１７７】
以上説明したように、許容誤差計算部３１、ビット量／誤差量制御部３２、正規化処理部３３、量子化処理部３４、ハフマン符号化部３５で構成される反復ループ処理部３の処理は、実際に量子化されたＭＤＣＴ周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【０１７８】
次に、量子化されハフマン符号化されたＭＤＣＴ周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部１２において決定された処理ブロックタイプと、ビット量／誤差量制御部３２において選択されたスケールファクタと、ハフマン符号化部３５において選択されたハフマン符号帳番号と共に多重化部４において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【０１７９】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。また、ＳＭＲの演算処理と許容誤差量の演算処理を省略することが可能となるため、処理量削減の効果もある。
【０１８０】
実施の形態９．
図１１は本発明の実施の形態９による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において６ａは正弦波検出部Ａ、１５は固定テーブル、１６はスイッチである。次にその動作を説明する。
【０１８１】
実施の形態１〜４ではＦＦＴ演算部１１の演算結果であるＦＦＴ周波数スペクトル、実施の形態５〜８ではＭＤＣＴ処理部２の演算結果であるＭＤＣＴ周波数スペクトルを利用してそれぞれ正弦波の判定を行っているが、実施の形態９〜１２では音響信号符号化装置への入力信号を利用して正弦波の判定を行う。
【０１８２】
心理音響モデル部１に入力された入力信号は、ＦＦＴ演算部１１においてＦＦＴ計算処理が行われ、ＦＦＴ周波数スペクトルが生成される。
【０１８３】
ブロックタイプ判別部１２ではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルからマスキングしきい値を算出し、これを基にブロックタイプの判別を行い、その結果を処理ブロックタイプとしてＭＤＣＴ処理部２と多重化部４に渡す。
【０１８４】
ＳＭＲ演算部１３ではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルと、ブロックタイプ判別部１２におけるマスキングしきい値を基にＳＭＲを算出し、その結果として生成されるＳＭＲをスイッチ１６に渡す。
【０１８５】
次に、ＭＤＣＴ処理部２では、ブロックタイプ判別部１２から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるＭＤＣＴ周波数スペクトルを反復ループ処理部３内の許容誤差計算部３１と正規化処理部３３に渡す。
【０１８６】
正弦波検出部Ａ６ａでは入力信号を用いて信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ１６を予め定めておいた固定値であるＳＭＲが格納された固定テーブル１５側に接続する。
【０１８７】
一方、正弦波ではないと判定された場合は、スイッチ１６をＳＭＲ演算部１３側に接続する。
【０１８８】
反復ループ処理部３内の許容誤差計算部３１では、ＭＤＣＴ周波数スペクトルとＳＭＲの逆数(１／ＳＭＲ)の乗算を行い、許容できる誤差量の計算を行う。ここで言う誤差量とは、ＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルと量子化／逆量子化を経て生成された逆量子化値の差分、即ち量子化誤差のことを指し、この値が許容範囲内に収まっていれば、人間の耳にノイズが知覚されずに済む。
【０１８９】
許容誤差量計算部３１において算出された誤差量は、ビット量／誤差量制御部３２に渡され、量子化／逆量子化を経て生成されたＭＤＣＴ周波数スペクトルが許容誤差量を満足しているかの判定の指標として用いられる。
【０１９０】
正規化処理部３３ではビット量／誤差量制御部３２において選択されたスケールファクタを用いて、ＭＤＣＴ処理部２から渡されたＭＤＣＴ周波数スペクトルの正規化が行われる。
【０１９１】
量子化部３４では正規化処理部３３において正規化されたＭＤＣＴ周波数スペクトルの量子化を行い、その結果をハフマン符号化部３５に渡す。また、誤差量を算出するために、逆量子化を行いその値をビット量／誤差量制御部３２に渡す。
【０１９２】
量子化されたＭＤＣＴ周波数スペクトルは、ハフマン符号化部３５においてハフマン符号化を施され、実際に必要となったビット量をビット量／誤差量制御部３２に、ハフマン符号帳番号とハフマン符号を多重化部４に渡す。
【０１９３】
ビット量／誤差量制御部３２ではＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルと量子化部３４から得た逆量子化されたＭＤＣＴ周波数スペクトルの差分、即ち、量子化による誤差量を計算し、許容誤差量計算部３１において算出された誤差量との比較を行う。その結果、量子化による誤差量の方が大きいと判定された場合はスケールファクタの値を小さくし、その値を正規化処理部３３に渡す。
【０１９４】
一方、量子化による誤差量の方が小さいと判定された場合は、ハフマン符号化部３５から得た使用ビット量と、符号化の際に指定されるビットレートから算出された許容ビット量との比較を行う。その結果、使用ビット量の方が大きいと判定された場合はスケールファクタの値を大きくし、その値を正規化処理部３３に渡す。一方、使用ビット量の方が小さいと判定された場合は反復ループ処理部３内の処理を終了し、多重化処理に移行する。
【０１９５】
以上説明したように、許容誤差計算部３１、ビット量／誤差量制御部３２、正規化処理部３３、量子化処理部３４、ハフマン符号化部３５で構成される反復ループ処理部３の処理は、実際に量子化されたＭＤＣＴ周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【０１９６】
次に、量子化されハフマン符号化されたＭＤＣＴ周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部１２において決定された処理ブロックタイプと、ビット量／誤差量制御部３２において選択されたスケールファクタと、ハフマン符号化部３５において選択されたハフマン符号帳番号と共に多重化部４において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【０１９７】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。
【０１９８】
実施の形態１０．
図１２は本発明の実施の形態１０による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において６ｂは正弦波検出部Ｂ、１５は固定テーブル、１６と１７はスイッチである。次にその動作を説明する。
【０１９９】
心理音響モデル部１に入力された入力信号は、ＦＦＴ演算部１１においてＦＦＴ計算処理が行われ、ＦＦＴ周波数スペクトルが生成される。
【０２００】
ブロックタイプ判別部１２ではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルからマスキングしきい値を算出し、これを基にブロックタイプの判別を行い、その結果を処理ブロックタイプとしてＭＤＣＴ処理部２と多重化部４に渡す。
【０２０１】
次に、ＭＤＣＴ処理部２では、ブロックタイプ判別部１２から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるＭＤＣＴ周波数スペクトルを反復ループ処理部３内の許容誤差計算部３１と正規化処理部３３に渡す。
【０２０２】
正弦波検出部Ｂ６ｂでは入力信号を用いて信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ１７を何も接続されていない側に接続、即ち、ＳＭＲ演算部１３の処理を停止させ、スイッチ１６を予め定めておいた固定値であるＳＭＲが格納された固定テーブル１５側に接続する。
【０２０３】
一方、正弦波ではないと判定された場合は、スイッチ１７をブロックタイプ判別部１２側に接続し、スイッチ１６をＳＭＲ演算部１３側に接続する。
【０２０４】
ＳＭＲ演算部１３ではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルと、ブロックタイプ判別部１２におけるマスキングしきい値を基にＳＭＲを算出し、その結果として生成されるＳＭＲをスイッチ１６に渡す。
【０２０５】
反復ループ処理部３内の動作は基本的に上記実施の形態と同じであり、許容誤差計算部３１、ビット量／誤差量制御部３２、正規化処理部３３、量子化処理部３４、ハフマン符号化部３５で構成される反復ループ処理部３の処理は、実際に量子化されたＭＤＣＴ周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【０２０６】
次に、量子化されハフマン符号化されたＭＤＣＴ周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部１２において決定された処理ブロックタイプと、ビット量／誤差量制御部３２において選択されたスケールファクタと、ハフマン符号化部３５において選択されたハフマン符号帳番号と共に多重化部４において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【０２０７】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。また、ＳＭＲの演算処理を省略することが可能となるため、処理量削減の効果もある。
【０２０８】
実施の形態１１．
図１３は本発明の実施の形態１１による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において６ｃは正弦波検出部Ｃ、３６は固定テーブル、３７はスイッチである。次にその動作を説明する。
【０２０９】
心理音響モデル部１のＦＦＴ演算部１１、ブロックタイプ判別部１２およびＳＭＲ演算部１３の動作は上記実施の形態と同じである。
【０２１０】
次に、ＭＤＣＴ処理部２では、ブロックタイプ判別部１２から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるＭＤＣＴ周波数スペクトルを反復ループ処理部３内の許容誤差計算部３１と正規化処理部３３に渡す。
【０２１１】
正弦波検出部Ｃ６ｃでは入力信号を用いて信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ３７を予め定めておいた固定値である許容誤差量が格納された固定テーブル３６側に接続する。
【０２１２】
一方、正弦波ではないと判定された場合は、スイッチ３７を許容誤差量計算部３１側に接続する。
【０２１３】
反復ループ処理部３内の許容誤差計算部３１では、ＭＤＣＴ周波数スペクトルとＳＭＲの逆数(１／ＳＭＲ)の乗算を行い、許容できる誤差量の計算を行う。ここで言う誤差量とは、ＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルと量子化／逆量子化を経て生成された逆量子化値の差分、即ち量子化誤差のことを指し、この値が許容範囲内に収まっていれば、人間の耳にノイズが知覚されずに済む。
【０２１４】
許容誤差量計算部３１において算出された誤差量は、ビット量／誤差量制御部３２に渡され、量子化／逆量子化を経て生成されたＭＤＣＴ周波数スペクトルが許容誤差量を満足しているかの判定の指標として用いられる。
【０２１５】
正規化処理部３３ではビット量／誤差量制御部３２において選択されたスケールファクタを用いて、ＭＤＣＴ処理部２から渡されたＭＤＣＴ周波数スペクトルの正規化が行われる。
【０２１６】
量子化部３４では正規化処理部３３において正規化されたＭＤＣＴ周波数スペクトルの量子化を行い、その結果をハフマン符号化部３５に渡す。また、誤差量を算出するために、逆量子化を行いその値をビット量／誤差量制御部３２に渡す。
【０２１７】
量子化されたＭＤＣＴ周波数スペクトルは、ハフマン符号化部３５においてハフマン符号化を施され、実際に必要となったビット量をビット量／誤差量制御部３２に、ハフマン符号帳番号とハフマン符号を多重化部４に渡す。
【０２１８】
ビット量／誤差量制御部３２ではＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルと量子化部３４から得た逆量子化されたＭＤＣＴ周波数スペクトルの差分、即ち、量子化による誤差量を計算し、許容誤差量計算部３１において算出された誤差量との比較を行う。その結果、量子化による誤差量の方が大きいと判定された場合はスケールファクタの値を小さくし、その値を正規化処理部３３に渡す。
【０２１９】
一方、量子化による誤差量の方が小さいと判定された場合は、ハフマン符号化部３５から得た使用ビット量と、符号化の際に指定されるビットレートから算出された許容ビット量との比較を行う。その結果、使用ビット量の方が大きいと判定された場合はスケールファクタの値を大きくし、その値を正規化処理部３３に渡す。一方、使用ビット量の方が小さいと判定された場合は反復ループ処理部３内の処理を終了し、多重化処理に移行する。
【０２２０】
以上説明したように、許容誤差計算部３１、ビット量／誤差量制御部３２、正規化処理部３３、量子化処理部３４、ハフマン符号化部３５で構成される反復ループ処理部３の処理は、実際に量子化されたＭＤＣＴ周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【０２２１】
次に、量子化されハフマン符号化されたＭＤＣＴ周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部１２において決定された処理ブロックタイプと、ビット量／誤差量制御部３２において選択されたスケールファクタと、ハフマン符号化部３５において選択されたハフマン符号帳番号と共に多重化部４において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【０２２２】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。
【０２２３】
実施の形態１２．
図１４は本発明の実施の形態１２による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において６ｄは正弦波検出部Ｄ、１は心理音響モデル部、１１はＦＦＴ演算部、１２はブロックタイプ判別部、１３はＳＭＲ演算部、１７はスイッチ、２はＭＤＣＴ処理部、３は反復ループ処理部、３１は許容誤差量計算部、３２はビット量／誤差量計算部、３３は正規化処理部、３４は量子化部、３５はハフマン符号化部、３６は固定テーブル、３７はスイッチ、４は多重化部、６ｄは正弦波検出部Ｄである。次にその動作を説明する。
【０２２４】
心理音響モデル部１に入力された入力信号は、ＦＦＴ演算部１１においてＦＦＴ計算処理が行われ、ＦＦＴ周波数スペクトルが生成される。
【０２２５】
ブロックタイプ判別部１２ではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルからマスキングしきい値を算出し、これを基にブロックタイプの判別を行い、その結果を処理ブロックタイプとしてＭＤＣＴ処理部２と多重化部４に渡す。
【０２２６】
次に、ＭＤＣＴ処理部２では、ブロックタイプ判別部１２から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるＭＤＣＴ周波数スペクトルを反復ループ処理部３内の許容誤差計算部３１と正規化処理部３３に渡す。
【０２２７】
正弦波検出部Ｄ６ｄでは入力信号を用いて信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ１７を何も接続されていない側に接続、即ち、ＳＭＲ演算部１３の処理を停止させ、スイッチ３７を予め定めておいた固定値である許容誤差量が格納された固定テーブル３６側に接続する。
【０２２８】
一方、正弦波ではないと判定された場合は、スイッチ１７をブロックタイプ判別部１２側に接続し、スイッチ３７を許容誤差量計算部３１側に接続する。
【０２２９】
ＳＭＲ演算部１３ではＦＦＴ演算部１１からのＦＦＴ周波数スペクトルと、ブロックタイプ判別部１２におけるマスキングしきい値を基にＳＭＲを算出し、その結果として生成されるＳＭＲを許容誤差量計算部３１に渡す。
【０２３０】
反復ループ処理部３内の許容誤差計算部３１では、ＭＤＣＴ周波数スペクトルとＳＭＲの逆数(１／ＳＭＲ)の乗算を行い、許容できる誤差量の計算を行う。ここで言う誤差量とは、ＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルと量子化／逆量子化を経て生成された逆量子化値の差分、即ち量子化誤差のことを指し、この値が許容範囲内に収まっていれば、人間の耳にノイズが知覚されずに済む。
【０２３１】
許容誤差量計算部３１において算出された誤差量は、ビット量／誤差量制御部３２に渡され、量子化／逆量子化を経て生成されたＭＤＣＴ周波数スペクトルが許容誤差量を満足しているかの判定の指標として用いられる。
【０２３２】
正規化処理部３３ではビット量／誤差量制御部３２において選択されたスケールファクタを用いて、ＭＤＣＴ処理部２から渡されたＭＤＣＴ周波数スペクトルの正規化が行われる。
【０２３３】
量子化部３４では正規化処理部３３において正規化されたＭＤＣＴ周波数スペクトルの量子化を行い、その結果をハフマン符号化部３５に渡す。また、誤差量を算出するために、逆量子化を行いその値をビット量／誤差量制御部３２に渡す。
【０２３４】
量子化されたＭＤＣＴ周波数スペクトルは、ハフマン符号化部３５においてハフマン符号化を施され、実際に必要となったビット量をビット量／誤差量制御部３２に、ハフマン符号帳番号とハフマン符号を多重化部４に渡す。
【０２３５】
ビット量／誤差量制御部３２ではＭＤＣＴ処理部２からのＭＤＣＴ周波数スペクトルと量子化部３４から得た逆量子化されたＭＤＣＴ周波数スペクトルの差分、即ち、量子化による誤差量を計算し、許容誤差量計算部３１において算出された誤差量との比較を行う。その結果、量子化による誤差量の方が大きいと判定された場合はスケールファクタの値を小さくし、その値を正規化処理部３３に渡す。
【０２３６】
一方、量子化による誤差量の方が小さいと判定された場合は、ハフマン符号化部３５から得た使用ビット量と、符号化の際に指定されるビットレートから算出された許容ビット量との比較を行う。その結果、使用ビット量の方が大きいと判定された場合はスケールファクタの値を大きくし、その値を正規化処理部３３に渡す。一方、使用ビット量の方が小さいと判定された場合は反復ループ処理部３内の処理を終了し、多重化処理に移行する。
【０２３７】
以上説明したように、許容誤差計算部３１、ビット量／誤差量制御部３２、正規化処理部３３、量子化処理部３４、ハフマン符号化部３５で構成される反復ループ処理部の処理３は、実際に量子化されたＭＤＣＴ周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【０２３８】
次に、量子化されハフマン符号化されたＭＤＣＴ周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部１２において決定された処理ブロックタイプと、ビット量／誤差量制御部３２において選択されたスケールファクタと、ハフマン符号化部３５において選択されたハフマン符号帳番号と共に多重化部４において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【０２３９】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。また、ＳＭＲの演算処理と許容誤差量の演算処理を省略することが可能となるため、処理量削減の効果もある。
【０２４０】
【発明の効果】
以上のようにこの発明においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えるよう変更するようにしたので、客観特性の劣化を防ぐ効果がある。
【０２４１】
また、ＳＭＲの演算処理又は許容誤差量の演算処理あるいはこれらの両方の演算処理を省略するようにしたので、処理量削減の効果がある。
【０２４２】
また、ＳＭＲの演算処理又は許容誤差量の演算処理あるいはこれらの両方の演算処理の出力値を利用しない場合あるいは演算処理を行わない場合に、予め定めておいたＳＭＲの値、許容誤差量の値を使用するようにしたので、ＳＭＲ演算部、許容誤差量計算部からの出力値を利用しない場合あるいは演算処理を行わない場合に所望の値を設定できる。
【０２４３】
また、前記ＦＦＴ周波数スペクトルを振幅スペクトルとして上記発明が実施可能である。
【０２４４】
また、前記ＦＦＴ周波数スペクトルをパワースペクトルとして上記発明が実施可能である。
【０２４５】
また、前記ＦＦＴ周波数スペクトルをＦＦＴ演算結果の実数成分又は虚数成分として上記発明が実施可能である。
【０２４６】
また、正弦波判定部での正弦波の判定に利用するＭＤＣＴ周波数スペクトルをパワースペクトルとして上記発明が実施可能である。
【図面の簡単な説明】
【図１】本発明の実施の形態１の音響信号符号化装置を示すブロック図である。
【図２】本発明における正弦波判定部の処理フローチャートである。
【図３】図２の本発明における正弦波判定部の処理フローチャートの続きの処理フローチャートである。
【図４】本発明の実施の形態２の音響信号符号化装置を示すブロック図である。
【図５】本発明の実施の形態３の音響信号符号化装置を示すブロック図である。
【図６】本発明の実施の形態４の音響信号符号化装置を示すブロック図である。
【図７】本発明の実施の形態５の音響信号符号化装置を示すブロック図である。
【図８】本発明の実施の形態６の音響信号符号化装置を示すブロック図である。
【図９】本発明の実施の形態７の音響信号符号化装置を示すブロック図である。
【図１０】本発明の実施の形態８の音響信号符号化装置を示すブロック図である。
【図１１】本発明の実施の形態９の音響信号符号化装置を示すブロック図である。
【図１２】本発明の実施の形態１０の音響信号符号化装置を示すブロック図である。
【図１３】本発明の実施の形態１１の音響信号符号化装置を示すブロック図である。
【図１４】本発明の実施の形態１２の音響信号符号化装置を示すブロック図である。
【図１５】従来の音響信号符号化装置を示すブロック図である。
【符号の説明】
１心理音響モデル部、２ＭＤＣＴ処理部、３反復ループ処理部、４多重化部、５ａ正弦波判定部Ｅ、５ｂ正弦波判定部Ｆ、５ｃ正弦波判定部Ｇ、５ｄ正弦波判定部Ｈ、６ａ正弦波検出部Ａ、６ｂ正弦波検出部Ｂ、６ｃ正弦波検出部Ｃ、６ｄ正弦波検出部Ｄ、１１ＦＦＴ演算部、１２ブロックタイプ判別部、１３ＳＭＲ演算部、１４ａ正弦波判定部Ａ、１４ｂ正弦波判定部Ｂ、１４ｃ正弦波判定部Ｃ、１４ｄ正弦波判定部Ｄ、１５固定テーブル、１６スイッチ、１７スイッチ、３１許容誤差量計算部、３２ビット量／誤差量制御部、３３正規化処理部、３４量子化部、３５ハフマン符号化部、３６固定テーブル、３７スイッチ、３８スイッチ、３９スイッチ。

Claims

入力信号のＦＦＴ計算処理を行うＦＦＴ演算部と、
このＦＦＴ演算部の演算結果であるＦＦＴ周波数スペクトルを利用してＭＤＣＴ処理部の処理ブロックタイプを判別するブロックタイプ判別部と、
前記ＦＦＴ演算部の演算結果であるＦＦＴ周波数スペクトルを利用して前記入力信号の信号成分が正弦波か否かの判定を行う正弦波判定部と、
前記ＦＦＴ演算部の演算結果であるＦＦＴ周波数スペクトルを利用してＳＭＲの演算を行うＳＭＲ演算部と、
前記正弦波判定部での正弦波の判定結果に基づいて前記ＳＭＲ演算部からの出力値を利用するか否か切り換える手段と、
前記ブロックタイプ判別部から受け取った処理ブロックタイプを基に入力信号の周波数直交変換処理を行いＭＤＣＴ周波数スペクトルを求めるＭＤＣＴ処理部と、
前記ＳＭＲ及びＭＤＣＴ周波数スペクトルを用いて許容誤差量の計算を行う許容誤差量計算部と、
この許容誤差量計算部からの誤差量及び量子化部からの逆量子化値及びハフマン符号化部からの使用ビット量を基にビット量／誤差量の制御を行いスケールファクタを決定するビット量／誤差量制御部と、
このビット量／誤差量制御部からのスケールファクタを基に前記ＭＤＣＴ処理部からのＭＤＣＴ周波数スペクトルの正規化を行う正規化処理部と、
この正規化されたＭＤＣＴ周波数スペクトルの量子化及び逆量子化を行う前記量子化部と、
この量子化されたＭＤＣＴ周波数スペクトルのハフマン符号化を行いハフマン符号帳番号とハフマン符号を出力するとともに使用ビット量の計算を行う前記ハフマン符号化部と、
前記ブロックタイプ判別部からの処理ブロックタイプ、前記ビット量／誤差量制御部からのスケールファクタおよび前記ハフマン符号化部からのハフマン符号帳番号とハフマン符号の多重化を行う多重化部と、
を備え、
前記正弦波判定部において、前記ＦＦＴ演算部において計算されたＦＦＴ周波数スペクトルから、振幅スペクトル、パワースペクトル、ＦＦＴ周波数スペクトルの実数成分の絶対値、虚数成分の絶対値のいずれか１つを計算し、これの低域側で周波数範囲が狭く、高域側で周波数範囲が広くなるように規定したバンド毎の和をとり、全てのバンドの中で最大値をとるバンドと、最大値をとるバンドの前後２つのバンドを除いた残りのバンドから２番目に大きい値をとるバンドを探索し、最大値をとるバンドと２番目に大きい値をとるバンドの相対比を正弦波の判定の指標とすることを特徴とする音響信号符号化装置。
前記正弦波判定部での正弦波の判定結果に基づいて前記ＳＭＲ演算部の演算処理の実行、停止を切り換える手段をさらに備えたことを特徴とする請求項１に記載の音響信号符号化装置。
前記正弦波判定部での正弦波の判定結果に基づいてＳＭＲ演算部からの出力値を利用するか否か切り換える手段において、前記ＳＭＲ演算部からの出力値を利用しない場合には予め定めておいたＳＭＲの値を使用することを特徴とする請求項１または２に記載の音響信号符号化装置。
入力信号のＦＦＴ計算処理を行うＦＦＴ演算部と、
このＦＦＴ演算部の演算結果であるＦＦＴ周波数スペクトルを利用してＭＤＣＴ処理部の処理ブロックタイプを判別するブロックタイプ判別部と、
前記ＦＦＴ演算部の演算結果であるＦＦＴ周波数スペクトルを利用して前記入力信号の信号成分が正弦波か否かの判定を行う正弦波判定部と、
前記ＦＦＴ演算部の演算結果であるＦＦＴ周波数スペクトルを利用してＳＭＲの演算を行うＳＭＲ演算部と、
ブロックタイプ判別部から受け取った処理ブロックタイプを基に入力信号の周波数直交変換処理を行いＭＤＣＴ周波数スペクトルを求めるＭＤＣＴ処理部と、
前記ＳＭＲ及びＭＤＣＴ周波数スペクトルを用いて許容誤差量の計算を行う許容誤差量計算部と、
前記正弦波判定部での正弦波の判定結果に基づいて前記許容誤差量計算部からの出力値を利用するか否か切り換える手段と、
前記許容誤差量計算部からの誤差量及び量子化部からの逆量子化値及びハフマン符号化部からの使用ビット量を基にビット量／誤差量の制御を行いスケールファクタを決定するビット量／誤差量制御部と、
このビット量／誤差量制御部からのスケールファクタを基に前記ＭＤＣＴ処理部からのＭＤＣＴ周波数スペクトルの正規化を行う正規化処理部と、
この正規化されたＭＤＣＴ周波数スペクトルの量子化及び逆量子化を行う前記量子化部と、
この量子化されたＭＤＣＴ周波数スペクトルのハフマン符号化を行いハフマン符号帳番号とハフマン符号を出力するとともに使用ビット量の計算を行う前記ハフマン符号化部と、
前記ブロックタイプ判別部からの処理ブロックタイプ、前記ビット量／誤差量制御部からのスケールファクタおよび前記ハフマン符号化部からのハフマン符号帳番号とハフマン符号の多重化を行う多重化部と、
を備え、
前記正弦波判定部において、前記ＦＦＴ演算部において計算されたＦＦＴ周波数スペクトルから、振幅スペクトル、パワースペクトル、ＦＦＴ周波数スペクトルの実数成分の絶対値、虚数成分の絶対値のいずれか１つを計算し、これの低域側で周波数範囲が狭く、高域側で周波数範囲が広くなるように規定したバンド毎の和をとり、全てのバンドの中で最大値をとるバンドと、最大値をとるバンドの前後２つのバンドを除いた残りのバンドから２番目に大きい値をとるバンドを探索し、最大値をとるバンドと２番目に大きい値をとるバンドの相対比を正弦波の判定の指標とすることを特徴とする音響信号符号化装置。
前記正弦波判定部での正弦波の判定結果に基づいて前記ＳＭＲ演算部の演算処理の実行、停止を切り換える手段と、
前記正弦波判定部での正弦波の判定結果に基づいて前記許容誤差量計算部の演算処理の実行、停止を切り換える手段と、
をさらに備えたことを特徴とする請求項４に記載の音響信号符号化装置。
前記正弦波判定部での正弦波の判定結果に基づいて前記許容誤差量計算部からの出力値を利用するか否か切り換える手段において、許容誤差計算部からの出力値を利用しない場合には、予め定めておいた許容誤差量の値を使用することを特徴とする請求項４または５に記載の音響信号符号化装置。
入力信号のＦＦＴ計算処理を行うＦＦＴ演算部と、
このＦＦＴ演算部の演算結果であるＦＦＴ周波数スペクトルを利用してＭＤＣＴ処理部の処理ブロックタイプを判別するブロックタイプ判別部と、
このブロックタイプ判別部から受け取った処理ブロックタイプを基に入力信号の周波数直交変換処理を行いＭＤＣＴ周波数スペクトルを求めるＭＤＣＴ処理部と、
このＭＤＣＴ処理部の演算結果であるＭＤＣＴ周波数スペクトルを利用して前記入力信号の信号成分が正弦波か否かの判定を行う正弦波判定部と、
前記ＦＦＴ演算部の演算結果であるＦＦＴ周波数スペクトルを利用してＳＭＲの演算を行うＳＭＲ演算部と、
前記正弦波判定部での正弦波の判定結果に基づいて前記ＳＭＲ演算部からの出力値を利用するか否か切り換える手段と、
前記ＳＭＲ及びＭＤＣＴ周波数スペクトルを用いて許容誤差量の計算を行う許容誤差量計算部と、
この許容誤差量計算部からの誤差量及び量子化部からの逆量子化値及びハフマン符号化部からの使用ビット量を基にビット量／誤差量の制御を行いスケールファクタを決定するビット量／誤差量制御部と、
このビット量／誤差量制御部からのスケールファクタを基に前記ＭＤＣＴ処理部からのＭＤＣＴ周波数スペクトルの正規化を行う正規化処理部と、
この正規化されたＭＤＣＴ周波数スペクトルの量子化及び逆量子化を行う前記量子化部と、
この量子化されたＭＤＣＴ周波数スペクトルのハフマン符号化を行いハフマン符号帳番号とハフマン符号を出力するとともに使用ビット量の計算を行う前記ハフマン符号化部と、
前記ブロックタイプ判別部からの処理ブロックタイプ、前記ビット量／誤差量制御部からのスケールファクタおよび前記ハフマン符号化部からのハフマン符号帳番号とハフマン符号の多重化を行う多重化部と、
を備え、
前記正弦波判定部において、前記ＭＤＣＴ処理部において計算されたＭＤＣＴ周波数スペクトルからパワースペクトルを計算し、これの低域側で周波数範囲が狭く、高域側で周波数範囲が広くなるように規定したバンド毎の和をとり、全てのバンドの中で最大値をとるバンドと、最大値をとるバンドの前後２つのバンドを除いた残りのバンドから２番目に大きい値をとるバンドを探索し、最大値をとるバンドと２番目に大きい値をとるバンドの相対比を正弦波の判定の指標とすることを特徴とする音響信号符号化装置。
前記正弦波判定部での正弦波の判定結果に基づいて前記ＳＭＲ演算部の演算処理の実行、停止を切り換える手段をさらに備えたことを特徴とする請求項７に記載の音響信号符号化装置。
前記正弦波判定部での正弦波の判定結果に基づいてＳＭＲ演算部からの出力値を利用するか否か切り換える手段において、前記ＳＭＲ演算部からの出力値を利用しない場合には予め定めておいたＳＭＲの値を使用することを特徴とする請求項７または８に記載の音響信号符号化装置。
入力信号のＦＦＴ計算処理を行うＦＦＴ演算部と、
このＦＦＴ演算部の演算結果であるＦＦＴ周波数スペクトルを利用してＭＤＣＴ処理部の処理ブロックタイプを判別するブロックタイプ判別部と、
このブロックタイプ判別部から受け取った処理ブロックタイプを基に入力信号の周波数直交変換処理を行いＭＤＣＴ周波数スペクトルを求めるＭＤＣＴ処理部と、
このＭＤＣＴ処理部の演算結果であるＭＤＣＴ周波数スペクトルを利用して前記入力信号の信号成分が正弦波か否かの判定を行う正弦波判定部と、
前記ＦＦＴ演算部の演算結果であるＦＦＴ周波数スペクトルを利用してＳＭＲの演算を行うＳＭＲ演算部と、
前記ＳＭＲ及びＭＤＣＴ周波数スペクトルを用いて許容誤差量の計算を行う許容誤差量計算部と、
前記正弦波判定部での正弦波の判定結果に基づいて前記許容誤差量計算部からの出力値を利用するか否か切り換える手段と、
前記許容誤差量計算部からの誤差量及び量子化部からの逆量子化値及びハフマン符号化部からの使用ビット量を基にビット量／誤差量の制御を行いスケールファクタを決定するビット量／誤差量制御部と、
このビット量／誤差量制御部からのスケールファクタを基に前記ＭＤＣＴ処理部からのＭＤＣＴ周波数スペクトルの正規化を行う正規化処理部と、
この正規化されたＭＤＣＴ周波数スペクトルの量子化及び逆量子化を行う前記量子化部と、
この量子化されたＭＤＣＴ周波数スペクトルのハフマン符号化を行いハフマン符号帳番号とハフマン符号を出力するとともに使用ビット量の計算を行う前記ハフマン符号化部と、
前記ブロックタイプ判別部からの処理ブロックタイプ、前記ビット量／誤差量制御部からのスケールファクタおよび前記ハフマン符号化部からのハフマン符号帳番号とハフマン符号の多重化を行う多重化部と、
を備え、
前記正弦波判定部において、前記ＭＤＣＴ処理部において計算されたＭＤＣＴ周波数スペクトルからパワースペクトルを計算し、これの低域側で周波数範囲が狭く、高域側で周波数範囲が広くなるように規定したバンド毎の和をとり、全てのバンドの中で最大値をとるバンドと、最大値をとるバンドの前後２つのバンドを除いた残りのバンドから２番目に大きい値をとるバンドを探索し、最大値をとるバンドと２番目に大きい値をとるバンドの相対比を正弦波の判定の指標とすることを特徴とする音響信号符号化装置。
前記正弦波判定部での正弦波の判定結果に基づいて前記ＳＭＲ演算部の演算処理の実行、停止を切り換える手段をさらに備えたことを特徴とする請求項１０に記載の音響信号符号化装置。
前記正弦波判定部での正弦波の判定結果に基づいて前記許容誤差量計算部からの出力値を利用するか否か切り換える手段において、前記許容誤差計算部からの出力値を利用しない場合には予め定めておいた許容誤差量の値を使用することを特徴とする請求項１０または１１に記載の音響信号符号化装置。