JP3639216B2 - 音響信号符号化装置 - Google Patents
音響信号符号化装置 Download PDFInfo
- Publication number
- JP3639216B2 JP3639216B2 JP2001052113A JP2001052113A JP3639216B2 JP 3639216 B2 JP3639216 B2 JP 3639216B2 JP 2001052113 A JP2001052113 A JP 2001052113A JP 2001052113 A JP2001052113 A JP 2001052113A JP 3639216 B2 JP3639216 B2 JP 3639216B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- sine wave
- mdct
- frequency spectrum
- error amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000001228 spectrum Methods 0.000 claims abstract description 291
- 238000004364 calculation method Methods 0.000 claims abstract description 246
- 238000013139 quantization Methods 0.000 claims abstract description 187
- 238000010606 normalization Methods 0.000 claims abstract description 77
- 230000006866 deterioration Effects 0.000 abstract description 15
- 230000005236 sound signal Effects 0.000 abstract description 5
- 238000000034 method Methods 0.000 description 74
- 238000010586 diagram Methods 0.000 description 26
- 230000000694 effects Effects 0.000 description 26
- 230000000873 masking effect Effects 0.000 description 20
- 230000005540 biological transmission Effects 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 11
- 238000001514 detection method Methods 0.000 description 10
- 101100083446 Danio rerio plekhh1 gene Proteins 0.000 description 7
- 101100129500 Caenorhabditis elegans max-2 gene Proteins 0.000 description 6
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
本発明は、広帯域の音響信号を符号化し、符号化処理によって生成された符号化ビット列を伝送路へ多重伝送する音響信号符号化装置、特に処理の対象とする信号の成分が正弦波等の周波数成分の存在帯域が狭い場合のS/N比等の客観特性の劣化を防ぐことに関する。
【0002】
【従来の技術】
従来の音響信号符号化装置の例として、ISO/IEC 13818−7規格(以下、MPEG−2 AAC方式と記す)で示されている音響信号符号化装置について説明する(なお、MPEG−2 AAC方式については前記規格に詳しく規定されている)。
【0003】
図15は従来の音響信号符号化装置として、MPEG−2 AAC方式のブロック図を示したものである。図において1は心理音響モデル部、11はFFT(Fast Fourier Transform:高速フーリエ変換)演算部、12はブロックタイプ判別部、13はSMR(Signal Mask Ratio:信号対マスク比)演算部、2はMDCT(Modified Discrete Cosine Transform:変形離散コサイン変換)処理部、3は反復ループ処理部、31は許容誤差量計算部、32はビット量/誤差量制御部、33は正規化処理部、34は量子化部、35はハフマン符号化部、4は多重化部である。次にその動作を説明する。
【0004】
心理音響モデル部1に入力された入力信号は、FFT演算部11においてFFT計算処理が行われ、FFT周波数スペクトルが生成される。
【0005】
ブロックタイプ判別部12の説明の前に、処理ブロックタイプの説明を行う。時間軸上の信号を周波数軸上の信号に変換する際には、分析対象とする信号を時間的に長くして周波数分解能を向上させるロングタイプと、分析対象とする信号を時間的に短くして時間分解能を向上させるショートタイプの2種類の処理ブロックタイプが存在する。前者は定常的な信号のみが存在する場合、一方、後者は急な信号変化のある場合に用いられるものである。MPEG−2 AAC方式ではこれらの2種類の処理ブロックタイプを信号の特性に応じて使い分けることにより、時間分解能の不足に起因して発生するプリエコーと呼ばれる不快な雑音の発生を防いでいる。
【0006】
ブロックタイプ判別部12ではFFT演算部11からのFFT周波数スペクトルからマスキングしきい値を算出し、これを基にブロックタイプの判別を行い、その結果を処理ブロックタイプとしてMDCT処理部2と多重化部4に渡す。
【0007】
次に、SMR演算部13ではFFT演算部11からのFFT周波数スペクトルと、ブロックタイプ判別部12におけるマスキングしきい値を基にSMRを算出し、その結果として生成されるSMRを反復ループ処理部3内の許容誤差計算部31に渡す。
【0008】
MDCT処理部2ではブロックタイプ判別部12から受け取った処理ブロックタイプを基に、時間軸から周波数軸へ変換処理、即ち、周波数直交変換処理を行い、その結果として生成されるMDCT周波数スペクトルを反復ループ処理部3内の許容誤差計算部31と正規化処理部33に渡す。
【0009】
反復ループ処理部3内の許容誤差計算部31では、MDCT周波数スペクトルとSMRの逆数(1/SMR)の乗算を行い、許容できる誤差量の計算を行う。ここで言う誤差量とは、MDCT処理部2からのMDCT周波数スペクトルと量子化/逆量子化を経て生成された逆量子化値の差分、即ち量子化誤差のことを指し、この値が許容範囲内に収まっていれば、人間の耳にノイズが知覚されずに済む。
【0010】
許容誤差量計算部31において算出された誤差量は、ビット量/誤差量制御部32に渡され、量子化/逆量子化を経て生成されたMDCT周波数スペクトルが許容誤差量を満足しているかの判定の指標として用いられる。
【0011】
正規化処理部33ではビット量/誤差量制御部32において選択されたスケールファクタを用いて、MDCT処理部2から渡されたMDCT周波数スペクトルの正規化が行われる。
【0012】
量子化部34では正規化処理部33において正規化されたMDCT周波数スペクトルの量子化を行い、その結果をハフマン符号化部35に渡す。また、誤差量を算出するために、逆量子化を行いその値をビット量/誤差量制御部32に渡す。
【0013】
量子化されたMDCT周波数スペクトルは、ハフマン符号化部35においてハフマン符号化を施され、実際に必要となったビット量をビット量/誤差量制御部32に、ハフマン符号帳番号とハフマン符号を多重化部4に渡す。
【0014】
ビット量/誤差量制御部32ではMDCT処理部2からのMDCT周波数スペクトルと量子化部34から得た逆量子化されたMDCT周波数スペクトルの差分、即ち、量子化による誤差量を計算し、許容誤差量計算部31において算出された誤差量との比較を行う。その結果、量子化による誤差量の方が大きいと判定された場合はスケールファクタの値を小さくし、その値を正規化処理部33に渡す。
【0015】
一方、量子化による誤差量の方が小さいと判定された場合は、ハフマン符号化部35から得た使用ビット量と、符号化の際に指定されるビットレートから算出された許容ビット量との比較を行う。その結果、使用ビット量の方が大きいと判定された場合はスケールファクタの値を大きくし、その値を正規化処理部33に渡す。一方、使用ビット量の方が小さいと判定された場合は反復ループ処理部3内の処理を終了し、多重化処理に移行する。
【0016】
以上説明したように、許容誤差計算部31、ビット量/誤差量制御部32、正規化処理部33、量子化処理部34、ハフマン符号化部35で構成される反復ループ処理部3の処理は、実際に量子化されたMDCT周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【0017】
次に、量子化されハフマン符号化されたMDCT周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部12において決定された処理ブロックタイプと、ビット量/誤差量制御部32において選択されたスケールファクタと、ハフマン符号化部35において選択されたハフマン符号帳番号と共に多重化部4において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【0018】
【発明が解決しようとする課題】
一般的に、心理音響モデルを利用した符号化方式の特徴としては、音声/音楽信号の聴感品質は良いが、S/N比(Signal/Noise:信号対雑音比)等に代表される客観特性は、逆に悪くなる傾向がある。上述の従来の音響信号符号化装置等では、符号化処理の対象とする信号が、正弦波のような周波数成分の存在する帯域が狭い場合においても、心理音響モデルにおいて算出された人間の聴覚特性を考慮したパラメータを用いて符号化処理が行われていたため、客観特性が劣化することが問題となっていた。
【0019】
本発明は、かかる問題を解決するためになされたものであり、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを用いない、或いは当該信号に効果的に量子化がなされるものに置き換えることによって、客観特性の劣化を防ぐことを可能にした音響信号符号化装置を提供することを目的とする。
【0020】
【課題を解決するための手段】
前記の目的に鑑み、この発明は、入力信号のFFT計算処理を行うFFT演算部と、このFFT演算部の演算結果であるFFT周波数スペクトルを利用してMDCT処理部の処理ブロックタイプを判別するブロックタイプ判別部と、前記FFT演算部の演算結果であるFFT周波数スペクトルを利用して前記入力信号の信号成分が正弦波か否かの判定を行う正弦波判定部と、前記FFT演算部の演算結果であるFFT周波数スペクトルを利用してSMRの演算を行うSMR演算部と、前記正弦波判定部での正弦波の判定結果に基づいて前記SMR演算部からの出力値を利用するか否か切り換える手段と、前記ブロックタイプ判別部から受け取った処理ブロックタイプを基に入力信号の周波数直交変換処理を行いMDCT周波数スペクトルを求めるMDCT処理部と、前記SMR及びMDCT周波数スペクトルを用いて許容誤差量の計算を行う許容誤差量計算部と、この許容誤差量計算部からの誤差量及び量子化部からの逆量子化値及びハフマン符号化部からの使用ビット量を基にビット量/誤差量の制御を行いスケールファクタを決定するビット量/誤差量制御部と、このビット量/誤差量制御部からのスケールファクタを基に前記MDCT処理部からのMDCT周波数スペクトルの正規化を行う正規化処理部と、この正規化されたMDCT周波数スペクトルの量子化及び逆量子化を行う前記量子化部と、この量子化されたMDCT周波数スペクトルのハフマン符号化を行いハフマン符号帳番号とハフマン符号を出力するとともに使用ビット量の計算を行う前記ハフマン符号化部と、前記ブロックタイプ判別部からの処理ブロックタイプ、前記ビット量/誤差量制御部からのスケールファクタおよび前記ハフマン符号化部からのハフマン符号帳番号とハフマン符号の多重化を行う多重化部と、を備え、前記正弦波判定部において、前記FFT演算部において計算されたFFT周波数スペクトルから、振幅スペクトル、パワースペクトル、FFT周波数スペクトルの実数成分の絶対値、虚数成分の絶対値のいずれか1つを計算し、これの低域側で周波数範囲が狭く、高域側で周波数範囲が広くなるように規定したバンド毎の和をとり、全てのバンドの中で最大値をとるバンドと、最大値をとるバンドの前後2つのバンドを除いた残りのバンドから2番目に大きい値をとるバンドを探索し、最大値をとるバンドと2番目に大きい値をとるバンドの相対比を正弦波の判定の指標とすることを特徴とする音響信号符号化装置にある。
【0021】
また、前記正弦波判定部での正弦波の判定結果に基づいて前記SMR演算部の演算処理の実行、停止を切り換える手段をさらに備えたことを特徴とする。
【0022】
また、前記正弦波判定部での正弦波の判定結果に基づいてSMR演算部からの出力値を利用するか否か切り換える手段において、前記SMR演算部からの出力値を利用しない場合には予め定めておいたSMRの値を使用することを特徴とする。
【0023】
また、入力信号のFFT計算処理を行うFFT演算部と、このFFT演算部の演算結果であるFFT周波数スペクトルを利用してMDCT処理部の処理ブロックタイプを判別するブロックタイプ判別部と、前記FFT演算部の演算結果であるFFT周波数スペクトルを利用して前記入力信号の信号成分が正弦波か否かの判定を行う正弦波判定部と、前記FFT演算部の演算結果であるFFT周波数スペクトルを利用してSMRの演算を行うSMR演算部と、ブロックタイプ判別部から受け取った処理ブロックタイプを基に入力信号の周波数直交変換処理を行いMDCT周波数スペクトルを求めるMDCT処理部と、前記SMR及びMDCT周波数スペクトルを用いて許容誤差量の計算を行う許容誤差量計算部と、前記正弦波判定部での正弦波の判定結果に基づいて前記許容誤差量計算部からの出力値を利用するか否か切り換える手段と、前記許容誤差量計算部からの誤差量及び量子化部からの逆量子化値及びハフマン符号化部からの使用ビット量を基にビット量/誤差量の制御を行いスケールファクタを決定するビット量/誤差量制御部と、このビット量/誤差量制御部からのスケールファクタを基に前記MDCT処理部からのMDCT周波数スペクトルの正規化を行う正規化処理部と、この正規化されたMDCT周波数スペクトルの量子化及び逆量子化を行う前記量子化部と、この量子化されたMDCT周波数スペクトルのハフマン符号化を行いハフマン符号帳番号とハフマン符号を出力するとともに使用ビット量の計算を行う前記ハフマン符号化部と、前記ブロックタイプ判別部からの処理ブロックタイプ、前記ビット量/誤差量制御部からのスケールファクタおよび前記ハフマン符号化部からのハフマン符号帳番号とハフマン符号の多重化を行う多重化部と、を備え、前記正弦波判定部において、前記FFT演算部において計算されたFFT周波数スペクトルから、振幅スペクトル、パワースペクトル、FFT周波数スペクトルの実数成分の絶対値、虚数成分の絶対値のいずれか1つを計算し、これの低域側で周波数範囲が狭く、高域側で周波数範囲が広くなるように規定したバンド毎の和をとり、全てのバンドの中で最大値をとるバンドと、最大値をとるバンドの前後2つのバンドを除いた残りのバンドから2番目に大きい値をとるバンドを探索し、最大値をとるバンドと2番目に大きい値をとるバンドの相対比を正弦波の判定の指標とすることを特徴とする音響信号符号化装置にある。
【0024】
また、前記正弦波判定部での正弦波の判定結果に基づいて前記SMR演算部の演算処理の実行、停止を切り換える手段と、前記正弦波判定部での正弦波の判定結果に基づいて前記許容誤差量計算部の演算処理の実行、停止を切り換える手段と、をさらに備えたことを特徴とする。
【0025】
また、前記正弦波判定部での正弦波の判定結果に基づいて前記許容誤差量計算部からの出力値を利用するか否か切り換える手段において、許容誤差計算部からの出力値を利用しない場合には、予め定めておいた許容誤差量の値を使用することを特徴とする。
【0026】
また、入力信号のFFT計算処理を行うFFT演算部と、このFFT演算部の演算結果であるFFT周波数スペクトルを利用してMDCT処理部の処理ブロックタイプを判別するブロックタイプ判別部と、このブロックタイプ判別部から受け取った処理ブロックタイプを基に入力信号の周波数直交変換処理を行いMDCT周波数スペクトルを求めるMDCT処理部と、このMDCT処理部の演算結果であるMDCT周波数スペクトルを利用して前記入力信号の信号成分が正弦波か否かの判定を行う正弦波判定部と、前記FFT演算部の演算結果であるFFT周波数スペクトルを利用してSMRの演算を行うSMR演算部と、前記正弦波判定部での正弦波の判定結果に基づいて前記SMR演算部からの出力値を利用するか否か切り換える手段と、前記SMR及びMDCT周波数スペクトルを用いて許容誤差量の計算を行う許容誤差量計算部と、この許容誤差量計算部からの誤差量及び量子化部からの逆量子化値及びハフマン符号化部からの使用ビット量を基にビット量/誤差量の制御を行いスケールファクタを決定するビット量/誤差量制御部と、このビット量/誤差量制御部からのスケールファクタを基に前記MDCT処理部からのMDCT周波数スペクトルの正規化を行う正規化処理部と、この正規化されたMDCT周波数スペクトルの量子化及び逆量子化を行う前記量子化部と、この量子化されたMDCT周波数スペクトルのハフマン符号化を行いハフマン符号帳番号とハフマン符号を出力するとともに使用ビット量の計算を行う前記ハフマン符号化部と、前記ブロックタイプ判別部からの処理ブロックタイプ、前記ビット量/誤差量制御部からのスケールファクタおよび前記ハフマン符号化部からのハフマン符号帳番号とハフマン符号の多重化を行う多重化部と、を備え、前記正弦波判定部において、前記MDCT処理部において計算されたMDCT周波数スペクトルからパワースペクトルを計算し、これの低域側で周波数範囲が狭く、高域側で周波数範囲が広くなるように規定したバンド毎の和をとり、全てのバンドの中で最大値をとるバンドと、最大値をとるバンドの前後2つのバンドを除いた残りのバンドから2番目に大きい値をとるバンドを探索し、最大値をとるバンドと2番目に大きい値をとるバンドの相対比を正弦波の判定の指標とすることを特徴とする音響信号符号化装置にある。
【0027】
また、前記正弦波判定部での正弦波の判定結果に基づいて前記SMR演算部の演算処理の実行、停止を切り換える手段をさらに備えたことを特徴とする。
【0028】
また、前記正弦波判定部での正弦波の判定結果に基づいてSMR演算部からの出力値を利用するか否か切り換える手段において、前記SMR演算部からの出力値を利用しない場合には予め定めておいたSMRの値を使用することを特徴とする。
【0029】
また、入力信号のFFT計算処理を行うFFT演算部と、このFFT演算部の演算結果であるFFT周波数スペクトルを利用してMDCT処理部の処理ブロックタイプを判別するブロックタイプ判別部と、このブロックタイプ判別部から受け取った処理ブロックタイプを基に入力信号の周波数直交変換処理を行いMDCT周波数スペクトルを求めるMDCT処理部と、このMDCT処理部の演算結果であるMDCT周波数スペクトルを利用して前記入力信号の信号成分が正弦波か否かの判定を行う正弦波判定部と、前記FFT演算部の演算結果であるFFT周波数スペクトルを利用してSMRの演算を行うSMR演算部と、前記SMR及びMDCT周波数スペクトルを用いて許容誤差量の計算を行う許容誤差量計算部と、前記正弦波判定部での正弦波の判定結果に基づいて前記許容誤差量計算部からの出力値を利用するか否か切り換える手段と、前記許容誤差量計算部からの誤差量及び量子化部からの逆量子化値及びハフマン符号化部からの使用ビット量を基にビット量/誤差量の制御を行いスケールファクタを決定するビット量/誤差量制御部と、このビット量/誤差量制御部からのスケールファクタを基に前記MDCT処理部からのMDCT周波数スペクトルの正規化を行う正規化処理部と、この正規化されたMDCT周波数スペクトルの量子化及び逆量子化を行う前記量子化部と、この量子化されたMDCT周波数スペクトルのハフマン符号化を行いハフマン符号帳番号とハフマン符号を出力するとともに使用ビット量の計算を行う前記ハフマン符号化部と、前記ブロックタイプ判別部からの処理ブロックタイプ、前記ビット量/誤差量制御部からのスケールファクタおよび前記ハフマン符号化部からのハフマン符号帳番号とハフマン符号の多重化を行う多重化部と、を備え、前記正弦波判定部において、前記MDCT処理部において計算されたMDCT周波数スペクトルからパワースペクトルを計算し、これの低域側で周波数範囲が狭く、高域側で周波数範囲が広くなるように規定したバンド毎の和をとり、全てのバンドの中で最大値をとるバンドと、最大値をとるバンドの前後2つのバンドを除いた残りのバンドから2番目に大きい値をとるバンドを探索し、最大値をとるバンドと2番目に大きい値をとるバンドの相対比を正弦波の判定の指標とすることを特徴とする音響信号符号化装置にある。
【0030】
また、前記正弦波判定部での正弦波の判定結果に基づいて前記SMR演算部の演算処理の実行、停止を切り換える手段をさらに備えたことを特徴とする。
【0031】
また、前記正弦波判定部での正弦波の判定結果に基づいて前記許容誤差量計算部からの出力値を利用するか否か切り換える手段において、前記許容誤差計算部からの出力値を利用しない場合には予め定めておいた許容誤差量の値を使用することを特徴とする。
【0043】
【発明の実施の形態】
実施の形態1.
図1は本発明の実施の形態1による音響信号符号化装置のブロック図を示すものである。上述の従来のものと同一もしくは相当部分は同一符号で示す。図において14aは正弦波判定部A、15は固定テーブル、16はスイッチである。次にその動作を説明する。
【0044】
心理音響モデル部1に入力された入力信号は、FFT演算部11においてFFT計算処理が行われ、FFT周波数スペクトルが生成される。
【0045】
ブロックタイプ判別部12ではFFT演算部11からのFFT周波数スペクトルからマスキングしきい値を算出し、これを基にブロックタイプの判別を行い、その結果を処理ブロックタイプとしてMDCT処理部2と多重化部4に渡す。
【0046】
次に、SMR演算部13ではFFT演算部11からのFFT周波数スペクトルと、ブロックタイプ判別部12におけるマスキングしきい値を基にSMRを算出し、その結果として生成されるSMRをスイッチ16に渡す
【0047】
正弦波判定部A14aではFFT演算部11からのFFT周波数スペクトルを用いて、入力信号の信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ16を予め定めておいた固定値であるSMRが格納された固定テーブル15側に接続する。一方、正弦波ではないと判定された場合は、スイッチ16をSMR演算部13側に接続する。正弦波の判定方法の一例を図2〜3に続くフローチャートを用いて説明する。
【0048】
まず、FFT演算部11において算出されるFFT周波数スペクトルから、実数成分と虚数成分の自乗和の平方根、即ち、振幅スペクトルを計算し、これを用いて各バンド毎の振幅スペクトル(FFTlevel(i)に相当)の計算を行う(ステップS80)。ここで言うバンドとは、予め設定した周波数帯域の間に存在する周波数スペクトルを束ねてグループ化したもので、人間の聴覚の特性に合わせて低域側では狭く、高域側では広くなるように設定されている。
【0049】
次に、全バンド中の最大振幅スペクトル値を格納するmax1と、そのインデックス値max1iの初期設定として、バンド0の値を、max1←FFTlevel(0)、max1i←0に設定する(ステップS81)。また、カウンタiの値を1に設定する(ステップS82)。
【0050】
ステップS83ではFFTlevel(i)とmax1の比較を行い、FFTlevel(i)がmax1よりも大きい場合は、max1の値とmax1iの値を更新する。
【0051】
iの値に1を加算(ステップS84)後、iが総バンド数よりも大きいかの判定を行い(ステップS85)、条件を満たさない場合はステップS83に戻り、ステップS83〜ステップS85の処理を繰り返す。
【0052】
次に、全バンドからmax1iの前後2バンドを除いた残りのバンドの中から1番大きい振幅スペクトル値を格納するmax2と、そのインデックス値max2iの初期設定を行う(ステップS86)。ここでmax1iの前後2バンドを除く理由に関して詳しく説明する。
【0053】
今回の例として挙げている正弦波の判定方法は、全バンドの中から最大振幅スペクトルを取るバンドと、2番目に大きい振幅スペクトルを取るバンドの振幅値の相対比を判断の指標としている。ここで問題となるのは、max1iが最大振幅スペクトルを取る場合、その近傍周波数のスペクトルも大きい値になる傾向があり、この周波数成分を全バンドの中から2番目に大きい振幅スペクトルと判断されてしまうことである。今回の例ではこれを防ぐために、最大振幅値を取るバンドの前後2バンドを2番目に大きい振幅スペクトルの判定から外している。
【0054】
ステップS87はiの値が、max1i−2より小さい又はmax1i+2より大きいかという条件を満たす場合とそうでない場合で処理が異なる。条件を満たす場合は、ステップS83と同様に、FFTlevel(i)とmax2の比較を行い、FFTlevel(i)がmax2よりも大きい場合は、max2の値とmax2iの値を更新し、ステップ88に進む。一方、条件を満たさない場合は処理を行わずにステップ88に進む。
【0055】
iの値に1を加算(ステップS88)後、iが総バンド数よりも大きいかの判定を行い(ステップS89)、条件を満たさない場合はステップS87に戻り、ステップS87〜ステップS89の処理を繰り返す。
【0056】
次に、max1とmax2の除算を行い、max1とmax2の相対比を示すxに格納する(ステップS90)。
【0057】
ステップ91ではxと予め定めたしきい値(図3の例では1000.0)との比較を行い、条件を満たした場合は正弦波と判定(ステップS92)、条件を満たさなかった場合は正弦波でないと判定(ステップS93)する。
【0058】
以上が、正弦波の判定方法の一例である。
【0059】
図1に戻り、以下の動作は基本的に従来のものと同じであるが、MDCT処理部2では、ブロックタイプ判別部12から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるMDCT周波数スペクトルを反復ループ処理部3内の許容誤差計算部31と正規化処理部33に渡す。
【0060】
反復ループ処理部3内の許容誤差計算部31では、MDCT周波数スペクトルとSMRの逆数(1/SMR)の乗算を行い、許容できる誤差量の計算を行う。ここで言う誤差量とは、MDCT処理部2からのMDCT周波数スペクトルと量子化/逆量子化を経て生成された逆量子化値の差分、即ち量子化誤差のことを指し、この値が許容範囲内に収まっていれば、人間の耳にノイズが知覚されずに済む。
【0061】
許容誤差量計算部31において算出された誤差量は、ビット量/誤差量制御部32に渡され、量子化/逆量子化を経て生成されたMDCT周波数スペクトルが許容誤差量を満足しているかの判定の指標として用いられる。
【0062】
正規化処理部33ではビット量/誤差量制御部32において選択されたスケールファクタを用いて、MDCT処理部2から渡されたMDCT周波数スペクトルの正規化が行われる。
【0063】
量子化部34では正規化処理部33において正規化されたMDCT周波数スペクトルの量子化を行い、その結果をハフマン符号化部35に渡す。また、誤差量を算出するために、逆量子化を行いその値をビット量/誤差量制御部32に渡す。
【0064】
量子化されたMDCT周波数スペクトルは、ハフマン符号化部35においてハフマン符号化を施され、実際に必要となったビット量をビット量/誤差量制御部32に、ハフマン符号帳番号とハフマン符号を多重化部4に渡す。
【0065】
ビット量/誤差量制御部32ではMDCT処理部2からのMDCT周波数スペクトルと量子化部34から得た逆量子化されたMDCT周波数スペクトルの差分、即ち、量子化による誤差量を計算し、許容誤差量計算部31において算出された誤差量との比較を行う。その結果、量子化による誤差量の方が大きいと判定された場合はスケールファクタの値を小さくし、その値を正規化処理部33に渡す。
【0066】
一方、量子化による誤差量の方が小さいと判定された場合は、ハフマン符号化部35から得た使用ビット量と、符号化の際に指定されるビットレートから算出された許容ビット量との比較を行う。その結果、使用ビット量の方が大きいと判定された場合はスケールファクタの値を大きくし、その値を正規化処理部33に渡す。一方、使用ビット量の方が小さいと判定された場合は反復ループ処理部3内の処理を終了し、多重化処理に移行する。
【0067】
以上説明したように、許容誤差計算部31、ビット量/誤差量制御部32、正規化処理部33、量子化処理部34、ハフマン符号化部35で構成される反復ループ処理部3の処理は、実際に量子化されたMDCT周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【0068】
次に、量子化されハフマン符号化されたMDCT周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部12において決定された処理ブロックタイプと、ビット量/誤差量制御部32において選択されたスケールファクタと、ハフマン符号化部35において選択されたハフマン符号帳番号と共に多重化部4において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【0069】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。
【0070】
また、前記説明の中では正弦波の判定基準として、FFT演算において算出されるFFT周波数スペクトルの実数成分と虚数成分の自乗和の平方根の振幅スペクトルを利用することを前提としているが、これを実数成分と虚数成分の自乗和、即ちパワースペクトルを利用して処理を行っても、同様の効果が得られる。
【0071】
また、前記説明の中では正弦波の判定基準として、FFT演算において算出されるFFT周波数スペクトルの実数成分と虚数成分の自乗和の平方根の振幅スペクトルを利用することを前提としているが、自乗和計算を省略し、これを実数成分又は虚数成分を利用して、例えば実数成分又は虚数成分の絶対値を用いて処理を行っても、より少ない計算量で同様の効果が得られる。
【0072】
実施の形態2.
図4は本発明の実施の形態2による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において14bは正弦波判定部B、15は固定テーブル、16及び17はスイッチである。次にその動作を説明する。
【0073】
心理音響モデル部1に入力された入力信号は、FFT演算部11においてFFT計算処理が行われ、FFT周波数スペクトルが生成される。
【0074】
ブロックタイプ判別部12ではFFT演算部11からのFFT周波数スペクトルからマスキングしきい値を算出し、これを基にブロックタイプの判別を行い、その結果を処理ブロックタイプとしてMDCT処理部2と多重化部4に渡す。
【0075】
SMR演算部13ではスイッチ17がブロックタイプ判別部12に接続された場合のみ、FFT演算部11からのFFT周波数スペクトルと、ブロックタイプ判別部12におけるマスキングしきい値を基にSMRを算出し、その結果として生成されるSMRをスイッチ16に渡す。
【0076】
正弦波判定部B14bではFFT演算部11からのFFT周波数スペクトルを用いて、入力信号の信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ17を何も接続されていない側に接続、即ち、SMR演算部13の処理を停止させる。また、スイッチ16を予め定めておいた固定値であるSMRが格納された固定テーブル15側に接続する。
【0077】
一方、正弦波ではないと判定された場合はスイッチ17をブロックタイプ判別部12に接続し、また、スイッチ16をSMR演算部13側に接続する。正弦波の判定方法については、前記実施の形態1で詳しく説明を行ったので省略する。
【0078】
MDCT処理部2では、ブロックタイプ判別部12から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるMDCT周波数スペクトルを反復ループ処理部3内の許容誤差計算部31と正規化処理部33に渡す。
【0079】
反復ループ処理部3内の動作は前記実施の形態と基本的に同じであり、許容誤差計算部31、ビット量/誤差量制御部32、正規化処理部33、量子化処理部34、ハフマン符号化部35で構成される反復ループ処理部3の処理は、実際に量子化されたMDCT周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【0080】
そして量子化されハフマン符号化されたMDCT周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部12において決定された処理ブロックタイプと、ビット量/誤差量制御部32において選択されたスケールファクタと、ハフマン符号化部35において選択されたハフマン符号帳番号と共に多重化部4において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【0081】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。また、SMRの演算処理を省略することが可能となるため、処理量削減の効果もある。
【0082】
また、前記説明の中では正弦波の判定基準として、FFT演算において算出されるFFT周波数スペクトルの実数成分と虚数成分の自乗和の平方根の振幅スペクトルを利用することを前提としているが、これを実数成分と虚数成分の自乗和、即ちパワースペクトルを利用して処理を行っても、同様の効果が得られる。
【0083】
また、前記説明の中では正弦波の判定基準として、FFT演算において算出されるFFT周波数スペクトルの実数成分と虚数成分の自乗和の平方根の振幅スペクトルを利用することを前提としているが、自乗和計算を省略し、これを実数成分又は虚数成分を利用して、例えば実数成分又は虚数成分の絶対値を用いて処理を行っても、より少ない計算量で同様の効果が得られる。
【0084】
実施の形態3.
図5は本発明の実施の形態3による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において、心理音響モデル部1内の14cは正弦波判定部C、反復ループ処理部3内の37はスイッチである。次にその動作を説明する。
【0085】
心理音響モデル部1のFFT演算部11、ブロックタイプ判別部12およびSMR演算部13の動作は前記実施の形態のものと同じである。
【0086】
正弦波判定部C14cではFFT演算部11からのFFT周波数スペクトルを用いて、入力信号の信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ37を予め定めておいた固定値である許容誤差量が格納された固定テーブル36側に接続する。
【0087】
一方、正弦波ではないと判定された場合はスイッチ37を許容誤差量計算部31に接続する。正弦波の判定方法については、発明の実施の形態1で詳しく説明を行ったので省略する。
【0088】
MDCT処理部2では、ブロックタイプ判別部12から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるMDCT周波数スペクトルを反復ループ処理部3内の許容誤差計算部31と正規化処理部33に渡す。
【0089】
反復ループ処理部3内の許容誤差計算部31では、MDCT周波数スペクトルとSMRの逆数(1/SMR)の乗算を行い、許容できる誤差量の計算を行う。ここで言う誤差量とは、MDCT処理部2からのMDCT周波数スペクトルと量子化/逆量子化を経て生成された逆量子化値の差分、即ち量子化誤差のことを指し、この値が許容範囲内に収まっていれば、人間の耳にノイズが知覚されずに済む。
【0090】
正弦波判定部C14cの制御を経て、スイッチ37より得られた誤差量は、ビット量/誤差量制御部32に渡され、量子化/逆量子化を経て生成されたMDCT周波数スペクトルが許容誤差量を満足しているかの判定の指標として用いられる。
【0091】
正規化処理部33ではビット量/誤差量制御部32において選択されたスケールファクタを用いて、MDCT処理部2から渡されたMDCT周波数スペクトルの正規化が行われる。
【0092】
量子化部34では正規化処理部33において正規化されたMDCT周波数スペクトルの量子化を行い、その結果をハフマン符号化部35に渡す。また、誤差量を算出するために、逆量子化を行いその値をビット量/誤差量制御部32に渡す。
【0093】
量子化されたMDCT周波数スペクトルは、ハフマン符号化部35においてハフマン符号化を施され、実際に必要となったビット量をビット量/誤差量制御部32に、ハフマン符号帳番号とハフマン符号を多重化部4に渡す。
【0094】
ビット量/誤差量制御部32ではMDCT処理部2からのMDCT周波数スペクトルと量子化部34から得た逆量子化されたMDCT周波数スペクトルの差分、即ち、量子化による誤差量を計算し、許容誤差量計算部31において算出された誤差量との比較を行う。その結果、量子化による誤差量の方が大きいと判定された場合はスケールファクタの値を小さくし、その値を正規化処理部33に渡す。
【0095】
一方、量子化による誤差量の方が小さいと判定された場合は、ハフマン符号化部35から得た使用ビット量と、符号化の際に指定されるビットレートから算出された許容ビット量との比較を行う。その結果、使用ビット量の方が大きいと判定された場合はスケールファクタの値を大きくし、その値を正規化処理部33に渡す。一方、使用ビット量の方が小さいと判定された場合は反復ループ処理部3内の処理を終了し、多重化処理に移行する。
【0096】
以上説明したように、許容誤差計算部31、ビット量/誤差量制御部32、正規化処理部33、量子化処理部34、ハフマン符号化部35で構成される反復ループ処理部3の処理は、実際に量子化されたMDCT周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【0097】
次に、量子化されハフマン符号化されたMDCT周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部12において決定された処理ブロックタイプと、ビット量/誤差量制御部32において選択されたスケールファクタと、ハフマン符号化部35において選択されたハフマン符号帳番号と共に多重化部4において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【0098】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。
【0099】
また、前記説明の中では正弦波の判定基準として、FFT演算において算出されるFFT周波数スペクトルの実数成分と虚数成分の自乗和の平方根の振幅スペクトルを利用することを前提としているが、これを実数成分と虚数成分の自乗和、即ちパワースペクトルを利用して処理を行っても、同様の効果が得られる。
【0100】
また、前記説明の中では正弦波の判定基準として、FFT演算において算出されるFFT周波数スペクトルの実数成分と虚数成分の自乗和の平方根の振幅スペクトルを利用することを前提としているが、自乗和計算を省略し、これを実数成分又は虚数成分を利用して、例えば実数成分又は虚数成分の絶対値を用いて処理を行っても、より少ない計算量で同様の効果が得られる。
【0101】
実施の形態4.
図6は本発明の実施の形態4による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において14dは正弦波判定部D、36は固定テーブル、17と37と38と39はスイッチ、4は多重化部である。次にその動作を説明する。
【0102】
心理音響モデル部1に入力された入力信号は、FFT演算部11においてFFT計算処理が行われ、FFT周波数スペクトルが生成される。
【0103】
ブロックタイプ判別部12ではFFT演算部11からのFFT周波数スペクトルからマスキングしきい値を算出し、これを基にブロックタイプの判別を行い、その結果を処理ブロックタイプとしてMDCT処理部2と多重化部4に渡す。
【0104】
SMR演算部13ではスイッチ17がブロックタイプ判別部12に接続された場合のみ、FFT演算部11からのFFT周波数スペクトルと、ブロックタイプ判別部12におけるマスキングしきい値を基にSMRを算出し、その結果として生成されるSMRをスイッチ38に渡す。
【0105】
正弦波判定部D14dではFFT演算部11からのFFT周波数スペクトルを用いて、入力信号の信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ17を何も接続されていない側に接続、即ち、SMR演算部13の処理を停止させ、スイッチ38及びスイッチ39を何も接続されていない側に接続、即ち、許容誤差量計算部31の処理を停止させる。また、スイッチ37を予め定めておいた固定値である許容誤差量が格納された固定テーブル36側に接続する。
【0106】
一方、正弦波ではないと判定された場合はスイッチ17をブロックタイプ判別部12に接続し、スイッチ38をSMR演算部13に接続し、スイッチ39をMDCT処理部2に接続し、スイッチ37を許容誤差量計算部31に接続する。正弦波の判定方法については、発明の実施の形態1で詳しく説明を行ったので省略する。
【0107】
MDCT処理部2では、ブロックタイプ判別部12から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるMDCT周波数スペクトルをスイッチ39と正規化処理部33に渡す。
【0108】
反復ループ処理部3内の許容誤差計算部31では、正弦波判定部D14dの制御を経て、スイッチ38より得られたSMRと、スイッチ39より得られたMDCT周波数スペクトルを用いて、MDCT周波数スペクトルとSMRの逆数(1/SMR)の乗算を行い、許容できる誤差量の計算を行う。ここで言う誤差量とは、MDCT処理部2からのMDCT周波数スペクトルと量子化/逆量子化を経て生成された逆量子化値の差分、即ち量子化誤差のことを指し、この値が許容範囲内に収まっていれば、人間の耳にノイズが知覚されずに済む。
【0109】
正弦波判定部D14dの制御を経て、スイッチ37より得られた誤差量は、ビット量/誤差量制御部32に渡され、量子化/逆量子化を経て生成されたMDCT周波数スペクトルが許容誤差量を満足しているかの判定の指標として用いられる。
【0110】
正規化処理部33ではビット量/誤差量制御部32において選択されたスケールファクタを用いて、MDCT処理部2から渡されたMDCT周波数スペクトルの正規化が行われる。
【0111】
量子化部34では正規化処理部33において正規化されたMDCT周波数スペクトルの量子化を行い、その結果をハフマン符号化部35に渡す。また、誤差量を算出するために、逆量子化を行いその値をビット量/誤差量制御部32に渡す。
【0112】
量子化されたMDCT周波数スペクトルは、ハフマン符号化部35においてハフマン符号化を施され、実際に必要となったビット量をビット量/誤差量制御部32に、ハフマン符号帳番号とハフマン符号を多重化部4に渡す。
【0113】
ビット量/誤差量制御部32ではMDCT処理部2からのMDCT周波数スペクトルと量子化部34から得た逆量子化されたMDCT周波数スペクトルの差分、即ち、量子化による誤差量を計算し、許容誤差量計算部31において算出された誤差量との比較を行う。その結果、量子化による誤差量の方が大きいと判定された場合はスケールファクタの値を小さくし、その値を正規化処理部33に渡す。
【0114】
一方、量子化による誤差量の方が小さいと判定された場合は、ハフマン符号化部35から得た使用ビット量と、符号化の際に指定されるビットレートから算出された許容ビット量との比較を行う。その結果、使用ビット量の方が大きいと判定された場合はスケールファクタの値を大きくし、その値を正規化処理部33に渡す。一方、使用ビット量の方が小さいと判定された場合は反復ループ処理部3内の処理を終了し、多重化処理に移行する。
【0115】
以上説明したように、許容誤差計算部31、ビット量/誤差量制御部32、正規化処理部33、量子化処理部34、ハフマン符号化部35で構成される反復ループ処理部3の処理は、実際に量子化されたMDCT周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【0116】
次に、量子化されハフマン符号化されたMDCT周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部12において決定された処理ブロックタイプと、ビット量/誤差量制御部32において選択されたスケールファクタと、ハフマン符号化部35において選択されたハフマン符号帳番号と共に多重化部4において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【0117】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。また、SMRの演算処理及び許容誤差量の計算処理を省略することが可能となるため、処理量削減の効果もある。
【0118】
また、前記説明の中では正弦波の判定基準として、FFT演算において算出されるFFT周波数スペクトルの実数成分と虚数成分の自乗和の平方根の振幅スペクトルを利用することを前提としているが、これを実数成分と虚数成分の自乗和、即ちパワースペクトルを利用して処理を行っても、同様の効果が得られる。
【0119】
また、前記説明の中では正弦波の判定基準として、FFT演算において算出されるFFT周波数スペクトルの実数成分と虚数成分の自乗和の平方根の振幅スペクトルを利用することを前提としているが、自乗和計算を省略し、これを実数成分又は虚数成分を利用して、例えば実数成分又は虚数成分の絶対値を用いて処理を行っても、より少ない計算量で同様の効果が得られる。
【0120】
実施の形態5.
図7は本発明の実施の形態5による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において5aは正弦波判定部E、15は固定テーブル、16はスイッチである。
【0121】
実施の形態1〜4ではFFT演算部11の演算結果であるFFT周波数スペクトルを利用して正弦波の判定を行っているが、実施の形態5〜8ではMDCT処理部2の演算結果であるMDCT周波数スペクトルを利用して正弦波の判定を行う。次にその動作を説明する。
【0122】
心理音響モデル部1に入力された入力信号は、FFT演算部11においてFFT計算処理が行われ、FFT周波数スペクトルが生成される。
【0123】
ブロックタイプ判別部12ではFFT演算部11からのFFT周波数スペクトルからマスキングしきい値を算出し、これを基にブロックタイプの判別を行い、その結果を処理ブロックタイプとしてMDCT処理部2と多重化部4に渡す。
【0124】
SMR演算部13ではFFT演算部11からのFFT周波数スペクトルと、ブロックタイプ判別部12におけるマスキングしきい値を基にSMRを算出し、その結果として生成されるSMRをスイッチ16に渡す。
【0125】
次に、MDCT処理部2では、ブロックタイプ判別部12から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるMDCT周波数スペクトルを反復ループ処理部3内の許容誤差計算部31と正規化処理部33と正弦波判定部E5aに渡す。
【0126】
正弦波判定部E5aではMDCT処理部2からのMDCT周波数スペクトルを用いて、入力信号の信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ16を予め定めておいた固定値であるSMRが格納された固定テーブル15側に接続する。
【0127】
一方、正弦波ではないと判定された場合は、スイッチ16をSMR演算部13側に接続する。正弦波の判定方法は、発明の実施の形態1で詳しく説明した判定方法に用いたFFTの振幅スペクトルを、MDCTのパワースペクトルに置き換えることにより容易に実現できる。よって、詳細な説明は省略する。
【0128】
反復ループ処理部3内の許容誤差計算部31では、MDCT周波数スペクトルとSMRの逆数(1/SMR)の乗算を行い、許容できる誤差量の計算を行う。ここで言う誤差量とは、MDCT処理部2からのMDCT周波数スペクトルと量子化/逆量子化を経て生成された逆量子化値の差分、即ち量子化誤差のことを指し、この値が許容範囲内に収まっていれば、人間の耳にノイズが知覚されずに済む。
【0129】
許容誤差量計算部31において算出された誤差量は、ビット量/誤差量制御部32に渡され、量子化/逆量子化を経て生成されたMDCT周波数スペクトルが許容誤差量を満足しているかの判定の指標として用いられる。
【0130】
正規化処理部33ではビット量/誤差量制御部32において選択されたスケールファクタを用いて、MDCT処理部2から渡されたMDCT周波数スペクトルの正規化が行われる。
【0131】
量子化部34では正規化処理部33において正規化されたMDCT周波数スペクトルの量子化を行い、その結果をハフマン符号化部35に渡す。また、誤差量を算出するために、逆量子化を行いその値をビット量/誤差量制御部32に渡す。
【0132】
量子化されたMDCT周波数スペクトルは、ハフマン符号化部35においてハフマン符号化を施され、実際に必要となったビット量をビット量/誤差量制御部32に、ハフマン符号帳番号とハフマン符号を多重化部4に渡す。
【0133】
ビット量/誤差量制御部32ではMDCT処理部2からのMDCT周波数スペクトルと量子化部34から得た逆量子化されたMDCT周波数スペクトルの差分、即ち、量子化による誤差量を計算し、許容誤差量計算部31において算出された誤差量との比較を行う。その結果、量子化による誤差量の方が大きいと判定された場合はスケールファクタの値を小さくし、その値を正規化処理部33に渡す。
【0134】
一方、量子化による誤差量の方が小さいと判定された場合は、ハフマン符号化部35から得た使用ビット量と、符号化の際に指定されるビットレートから算出された許容ビット量との比較を行う。その結果、使用ビット量の方が大きいと判定された場合はスケールファクタの値を大きくし、その値を正規化処理部33に渡す。一方、使用ビット量の方が小さいと判定された場合は反復ループ処理部3内の処理を終了し、多重化処理に移行する。
【0135】
以上説明したように、許容誤差計算部31、ビット量/誤差量制御部32、正規化処理部33、量子化処理部34、ハフマン符号化部35で構成される反復ループ処理部3の処理は、実際に量子化されたMDCT周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【0136】
次に、量子化されハフマン符号化されたMDCT周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部12において決定された処理ブロックタイプと、ビット量/誤差量制御部32において選択されたスケールファクタと、ハフマン符号化部35において選択されたハフマン符号帳番号と共に多重化部4において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【0137】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。
【0138】
実施の形態6.
図8は本発明の実施の形態6による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において5bは正弦波判定部F、15は固定テーブル、16と17はスイッチである。次にその動作を説明する。
【0139】
心理音響モデル部1に入力された入力信号は、FFT演算部11においてFFT計算処理が行われ、FFT周波数スペクトルが生成される。
【0140】
ブロックタイプ判別部12ではFFT演算部11からのFFT周波数スペクトルからマスキングしきい値を算出し、これを基にブロックタイプの判別を行い、その結果を処理ブロックタイプとしてMDCT処理部2と多重化部4に渡す。
【0141】
次に、MDCT処理部2では、ブロックタイプ判別部12から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるMDCT周波数スペクトルを反復ループ処理部3内の許容誤差計算部31と正規化処理部33と正弦波判定部F5bに渡す。
【0142】
正弦波判定部F5bではMDCT処理部2からのMDCT周波数スペクトルを用いて、入力信号の信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ17を何も接続されていない側に接続、即ち、SMR演算部13の処理を停止させ、スイッチ16を予め定めておいた固定値であるSMRが格納された固定テーブル15側に接続する。
【0143】
一方、正弦波ではないと判定された場合は、スイッチ17をブロックタイプ判別部12側に接続し、スイッチ16をSMR演算部13側に接続する。正弦波の判定方法については、発明の実施の形態5で詳しく説明を行ったので省略する。
【0144】
SMR演算部13ではFFT演算部11からのFFT周波数スペクトルと、ブロックタイプ判別部12におけるマスキングしきい値を基にSMRを算出し、その結果として生成されるSMRをスイッチ16に渡す。
【0145】
反復ループ処理部3内の動作は基本的に上記実施の形態と同じであり、許容誤差計算部31、ビット量/誤差量制御部32、正規化処理部33、量子化処理部34、ハフマン符号化部35で構成される反復ループ処理部3の処理は、実際に量子化されたMDCT周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【0146】
次に、量子化されハフマン符号化されたMDCT周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部12において決定された処理ブロックタイプと、ビット量/誤差量制御部32において選択されたスケールファクタと、ハフマン符号化部35において選択されたハフマン符号帳番号と共に多重化部4において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【0147】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。また、SMRの演算処理を省略することが可能となるため、処理量削減の効果もある。
【0148】
実施の形態7.
図9は本発明の実施の形態7による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において5cは正弦波判定部G、36は固定テーブル、37はスイッチである。次にその動作を説明する。
【0149】
心理音響モデル部1のFFT演算部11、ブロックタイプ判別部12およびSMR演算部13動作は上記実施の形態のものと同じである。
【0150】
次に、MDCT処理部2では、ブロックタイプ判別部12から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるMDCT周波数スペクトルを反復ループ処理部3内の許容誤差計算部31と正規化処理部33と正弦波判定部G5cに渡す。
【0151】
正弦波判定部G5cではMDCT処理部2からのMDCT周波数スペクトルを用いて、入力信号の信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ37を予め定めておいた固定値である許容誤差量が格納された固定テーブル36側に接続する。
【0152】
一方、正弦波ではないと判定された場合は、スイッチ37を許容誤差量計算部31側に接続する。正弦波の判定方法については、発明の実施の形態5で詳しく説明を行ったので省略する。
【0153】
反復ループ処理部3内の許容誤差計算部31では、MDCT周波数スペクトルとSMRの逆数(1/SMR)の乗算を行い、許容できる誤差量の計算を行う。ここで言う誤差量とは、MDCT処理部2からのMDCT周波数スペクトルと量子化/逆量子化を経て生成された逆量子化値の差分、即ち量子化誤差のことを指し、この値が許容範囲内に収まっていれば、人間の耳にノイズが知覚されずに済む。
【0154】
許容誤差量計算部31において算出された誤差量は、ビット量/誤差量制御部32に渡され、量子化/逆量子化を経て生成されたMDCT周波数スペクトルが許容誤差量を満足しているかの判定の指標として用いられる。
【0155】
正規化処理部33ではビット量/誤差量制御部32において選択されたスケールファクタを用いて、MDCT処理部2から渡されたMDCT周波数スペクトルの正規化が行われる。
【0156】
量子化部34では正規化処理部33において正規化されたMDCT周波数スペクトルの量子化を行い、その結果をハフマン符号化部35に渡す。また、誤差量を算出するために、逆量子化を行いその値をビット量/誤差量制御部32に渡す。
【0157】
量子化されたMDCT周波数スペクトルは、ハフマン符号化部35においてハフマン符号化を施され、実際に必要となったビット量をビット量/誤差量制御部32に、ハフマン符号帳番号とハフマン符号を多重化部4に渡す。
【0158】
ビット量/誤差量制御部32ではMDCT処理部2からのMDCT周波数スペクトルと量子化部34から得た逆量子化されたMDCT周波数スペクトルの差分、即ち、量子化による誤差量を計算し、許容誤差量計算部31において算出された誤差量との比較を行う。その結果、量子化による誤差量の方が大きいと判定された場合はスケールファクタの値を小さくし、その値を正規化処理部33に渡す。
【0159】
一方、量子化による誤差量の方が小さいと判定された場合は、ハフマン符号化部35から得た使用ビット量と、符号化の際に指定されるビットレートから算出された許容ビット量との比較を行う。その結果、使用ビット量の方が大きいと判定された場合はスケールファクタの値を大きくし、その値を正規化処理部33に渡す。一方、使用ビット量の方が小さいと判定された場合は反復ループ処理部3内の処理を終了し、多重化処理に移行する。
【0160】
以上説明したように、許容誤差計算部31、ビット量/誤差量制御部32、正規化処理部33、量子化処理部34、ハフマン符号化部35で構成される反復ループ処理部3の処理は、実際に量子化されたMDCT周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【0161】
次に、量子化されハフマン符号化されたMDCT周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部12において決定された処理ブロックタイプと、ビット量/誤差量制御部32において選択されたスケールファクタと、ハフマン符号化部35において選択されたハフマン符号帳番号と共に多重化部4において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【0162】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。
【0163】
実施の形態8.
図10は本発明の実施の形態8による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において5dは正弦波判定部H、17と37はスイッチ、36は固定テーブルである。次にその動作を説明する。
【0164】
心理音響モデル部1に入力された入力信号は、FFT演算部11においてFFT計算処理が行われ、FFT周波数スペクトルが生成される。
【0165】
ブロックタイプ判別部12ではFFT演算部11からのFFT周波数スペクトルからマスキングしきい値を算出し、これを基にブロックタイプの判別を行い、その結果を処理ブロックタイプとしてMDCT処理部2と多重化部4に渡す。
【0166】
次に、MDCT処理部2では、ブロックタイプ判別部12から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるMDCT周波数スペクトルを反復ループ処理部3内の許容誤差計算部31と正規化処理部33と正弦波判定部H5dに渡す。
【0167】
正弦波判定部H5dではMDCT処理部2からのMDCT周波数スペクトルを用いて、入力信号の信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ17を何も接続されていない側に接続、即ち、SMR演算部13の処理を停止させ、スイッチ37を予め定めておいた固定値である許容誤差量が格納された固定テーブル36側に接続する。
【0168】
一方、正弦波ではないと判定された場合は、スイッチ17をブロックタイプ判別部12側に接続し、スイッチ37を許容誤差量計算部31側に接続する。正弦波の判定方法については、発明の実施の形態5で詳しく説明を行ったので省略する。
【0169】
SMR演算部13ではFFT演算部11からのFFT周波数スペクトルと、ブロックタイプ判別部12におけるマスキングしきい値を基にSMRを算出し、その結果として生成されるSMRを許容誤差量計算部31に渡す。
【0170】
反復ループ処理部3内の許容誤差計算部31では、MDCT周波数スペクトルとSMRの逆数(1/SMR)の乗算を行い、許容できる誤差量の計算を行う。ここで言う誤差量とは、MDCT処理部2からのMDCT周波数スペクトルと量子化/逆量子化を経て生成された逆量子化値の差分、即ち量子化誤差のことを指し、この値が許容範囲内に収まっていれば、人間の耳にノイズが知覚されずに済む。
【0171】
許容誤差量計算部31において算出された誤差量は、ビット量/誤差量制御部32に渡され、量子化/逆量子化を経て生成されたMDCT周波数スペクトルが許容誤差量を満足しているかの判定の指標として用いられる。
【0172】
正規化処理部33ではビット量/誤差量制御部32において選択されたスケールファクタを用いて、MDCT処理部2から渡されたMDCT周波数スペクトルの正規化が行われる。
【0173】
量子化部34では正規化処理部33において正規化されたMDCT周波数スペクトルの量子化を行い、その結果をハフマン符号化部35に渡す。また、誤差量を算出するために、逆量子化を行いその値をビット量/誤差量制御部32に渡す。
【0174】
量子化されたMDCT周波数スペクトルは、ハフマン符号化部35においてハフマン符号化を施され、実際に必要となったビット量をビット量/誤差量制御部32に、ハフマン符号帳番号とハフマン符号を多重化部4に渡す。
【0175】
ビット量/誤差量制御部32ではMDCT処理部2からのMDCT周波数スペクトルと量子化部34から得た逆量子化されたMDCT周波数スペクトルの差分、即ち、量子化による誤差量を計算し、許容誤差量計算部31において算出された誤差量との比較を行う。その結果、量子化による誤差量の方が大きいと判定された場合はスケールファクタの値を小さくし、その値を正規化処理部33に渡す。
【0176】
一方、量子化による誤差量の方が小さいと判定された場合は、ハフマン符号化部35から得た使用ビット量と、符号化の際に指定されるビットレートから算出された許容ビット量との比較を行う。その結果、使用ビット量の方が大きいと判定された場合はスケールファクタの値を大きくし、その値を正規化処理部33に渡す。一方、使用ビット量の方が小さいと判定された場合は反復ループ処理部3内の処理を終了し、多重化処理に移行する。
【0177】
以上説明したように、許容誤差計算部31、ビット量/誤差量制御部32、正規化処理部33、量子化処理部34、ハフマン符号化部35で構成される反復ループ処理部3の処理は、実際に量子化されたMDCT周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【0178】
次に、量子化されハフマン符号化されたMDCT周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部12において決定された処理ブロックタイプと、ビット量/誤差量制御部32において選択されたスケールファクタと、ハフマン符号化部35において選択されたハフマン符号帳番号と共に多重化部4において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【0179】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。また、SMRの演算処理と許容誤差量の演算処理を省略することが可能となるため、処理量削減の効果もある。
【0180】
実施の形態9.
図11は本発明の実施の形態9による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において6aは正弦波検出部A、15は固定テーブル、16はスイッチである。次にその動作を説明する。
【0181】
実施の形態1〜4ではFFT演算部11の演算結果であるFFT周波数スペクトル、実施の形態5〜8ではMDCT処理部2の演算結果であるMDCT周波数スペクトルを利用してそれぞれ正弦波の判定を行っているが、実施の形態9〜12では音響信号符号化装置への入力信号を利用して正弦波の判定を行う。
【0182】
心理音響モデル部1に入力された入力信号は、FFT演算部11においてFFT計算処理が行われ、FFT周波数スペクトルが生成される。
【0183】
ブロックタイプ判別部12ではFFT演算部11からのFFT周波数スペクトルからマスキングしきい値を算出し、これを基にブロックタイプの判別を行い、その結果を処理ブロックタイプとしてMDCT処理部2と多重化部4に渡す。
【0184】
SMR演算部13ではFFT演算部11からのFFT周波数スペクトルと、ブロックタイプ判別部12におけるマスキングしきい値を基にSMRを算出し、その結果として生成されるSMRをスイッチ16に渡す。
【0185】
次に、MDCT処理部2では、ブロックタイプ判別部12から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるMDCT周波数スペクトルを反復ループ処理部3内の許容誤差計算部31と正規化処理部33に渡す。
【0186】
正弦波検出部A6aでは入力信号を用いて信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ16を予め定めておいた固定値であるSMRが格納された固定テーブル15側に接続する。
【0187】
一方、正弦波ではないと判定された場合は、スイッチ16をSMR演算部13側に接続する。
【0188】
反復ループ処理部3内の許容誤差計算部31では、MDCT周波数スペクトルとSMRの逆数(1/SMR)の乗算を行い、許容できる誤差量の計算を行う。ここで言う誤差量とは、MDCT処理部2からのMDCT周波数スペクトルと量子化/逆量子化を経て生成された逆量子化値の差分、即ち量子化誤差のことを指し、この値が許容範囲内に収まっていれば、人間の耳にノイズが知覚されずに済む。
【0189】
許容誤差量計算部31において算出された誤差量は、ビット量/誤差量制御部32に渡され、量子化/逆量子化を経て生成されたMDCT周波数スペクトルが許容誤差量を満足しているかの判定の指標として用いられる。
【0190】
正規化処理部33ではビット量/誤差量制御部32において選択されたスケールファクタを用いて、MDCT処理部2から渡されたMDCT周波数スペクトルの正規化が行われる。
【0191】
量子化部34では正規化処理部33において正規化されたMDCT周波数スペクトルの量子化を行い、その結果をハフマン符号化部35に渡す。また、誤差量を算出するために、逆量子化を行いその値をビット量/誤差量制御部32に渡す。
【0192】
量子化されたMDCT周波数スペクトルは、ハフマン符号化部35においてハフマン符号化を施され、実際に必要となったビット量をビット量/誤差量制御部32に、ハフマン符号帳番号とハフマン符号を多重化部4に渡す。
【0193】
ビット量/誤差量制御部32ではMDCT処理部2からのMDCT周波数スペクトルと量子化部34から得た逆量子化されたMDCT周波数スペクトルの差分、即ち、量子化による誤差量を計算し、許容誤差量計算部31において算出された誤差量との比較を行う。その結果、量子化による誤差量の方が大きいと判定された場合はスケールファクタの値を小さくし、その値を正規化処理部33に渡す。
【0194】
一方、量子化による誤差量の方が小さいと判定された場合は、ハフマン符号化部35から得た使用ビット量と、符号化の際に指定されるビットレートから算出された許容ビット量との比較を行う。その結果、使用ビット量の方が大きいと判定された場合はスケールファクタの値を大きくし、その値を正規化処理部33に渡す。一方、使用ビット量の方が小さいと判定された場合は反復ループ処理部3内の処理を終了し、多重化処理に移行する。
【0195】
以上説明したように、許容誤差計算部31、ビット量/誤差量制御部32、正規化処理部33、量子化処理部34、ハフマン符号化部35で構成される反復ループ処理部3の処理は、実際に量子化されたMDCT周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【0196】
次に、量子化されハフマン符号化されたMDCT周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部12において決定された処理ブロックタイプと、ビット量/誤差量制御部32において選択されたスケールファクタと、ハフマン符号化部35において選択されたハフマン符号帳番号と共に多重化部4において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【0197】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。
【0198】
実施の形態10.
図12は本発明の実施の形態10による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において6bは正弦波検出部B、15は固定テーブル、16と17はスイッチである。次にその動作を説明する。
【0199】
心理音響モデル部1に入力された入力信号は、FFT演算部11においてFFT計算処理が行われ、FFT周波数スペクトルが生成される。
【0200】
ブロックタイプ判別部12ではFFT演算部11からのFFT周波数スペクトルからマスキングしきい値を算出し、これを基にブロックタイプの判別を行い、その結果を処理ブロックタイプとしてMDCT処理部2と多重化部4に渡す。
【0201】
次に、MDCT処理部2では、ブロックタイプ判別部12から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるMDCT周波数スペクトルを反復ループ処理部3内の許容誤差計算部31と正規化処理部33に渡す。
【0202】
正弦波検出部B6bでは入力信号を用いて信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ17を何も接続されていない側に接続、即ち、SMR演算部13の処理を停止させ、スイッチ16を予め定めておいた固定値であるSMRが格納された固定テーブル15側に接続する。
【0203】
一方、正弦波ではないと判定された場合は、スイッチ17をブロックタイプ判別部12側に接続し、スイッチ16をSMR演算部13側に接続する。
【0204】
SMR演算部13ではFFT演算部11からのFFT周波数スペクトルと、ブロックタイプ判別部12におけるマスキングしきい値を基にSMRを算出し、その結果として生成されるSMRをスイッチ16に渡す。
【0205】
反復ループ処理部3内の動作は基本的に上記実施の形態と同じであり、許容誤差計算部31、ビット量/誤差量制御部32、正規化処理部33、量子化処理部34、ハフマン符号化部35で構成される反復ループ処理部3の処理は、実際に量子化されたMDCT周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【0206】
次に、量子化されハフマン符号化されたMDCT周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部12において決定された処理ブロックタイプと、ビット量/誤差量制御部32において選択されたスケールファクタと、ハフマン符号化部35において選択されたハフマン符号帳番号と共に多重化部4において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【0207】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。また、SMRの演算処理を省略することが可能となるため、処理量削減の効果もある。
【0208】
実施の形態11.
図13は本発明の実施の形態11による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において6cは正弦波検出部C、36は固定テーブル、37はスイッチである。次にその動作を説明する。
【0209】
心理音響モデル部1のFFT演算部11、ブロックタイプ判別部12およびSMR演算部13の動作は上記実施の形態と同じである。
【0210】
次に、MDCT処理部2では、ブロックタイプ判別部12から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるMDCT周波数スペクトルを反復ループ処理部3内の許容誤差計算部31と正規化処理部33に渡す。
【0211】
正弦波検出部C6cでは入力信号を用いて信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ37を予め定めておいた固定値である許容誤差量が格納された固定テーブル36側に接続する。
【0212】
一方、正弦波ではないと判定された場合は、スイッチ37を許容誤差量計算部31側に接続する。
【0213】
反復ループ処理部3内の許容誤差計算部31では、MDCT周波数スペクトルとSMRの逆数(1/SMR)の乗算を行い、許容できる誤差量の計算を行う。ここで言う誤差量とは、MDCT処理部2からのMDCT周波数スペクトルと量子化/逆量子化を経て生成された逆量子化値の差分、即ち量子化誤差のことを指し、この値が許容範囲内に収まっていれば、人間の耳にノイズが知覚されずに済む。
【0214】
許容誤差量計算部31において算出された誤差量は、ビット量/誤差量制御部32に渡され、量子化/逆量子化を経て生成されたMDCT周波数スペクトルが許容誤差量を満足しているかの判定の指標として用いられる。
【0215】
正規化処理部33ではビット量/誤差量制御部32において選択されたスケールファクタを用いて、MDCT処理部2から渡されたMDCT周波数スペクトルの正規化が行われる。
【0216】
量子化部34では正規化処理部33において正規化されたMDCT周波数スペクトルの量子化を行い、その結果をハフマン符号化部35に渡す。また、誤差量を算出するために、逆量子化を行いその値をビット量/誤差量制御部32に渡す。
【0217】
量子化されたMDCT周波数スペクトルは、ハフマン符号化部35においてハフマン符号化を施され、実際に必要となったビット量をビット量/誤差量制御部32に、ハフマン符号帳番号とハフマン符号を多重化部4に渡す。
【0218】
ビット量/誤差量制御部32ではMDCT処理部2からのMDCT周波数スペクトルと量子化部34から得た逆量子化されたMDCT周波数スペクトルの差分、即ち、量子化による誤差量を計算し、許容誤差量計算部31において算出された誤差量との比較を行う。その結果、量子化による誤差量の方が大きいと判定された場合はスケールファクタの値を小さくし、その値を正規化処理部33に渡す。
【0219】
一方、量子化による誤差量の方が小さいと判定された場合は、ハフマン符号化部35から得た使用ビット量と、符号化の際に指定されるビットレートから算出された許容ビット量との比較を行う。その結果、使用ビット量の方が大きいと判定された場合はスケールファクタの値を大きくし、その値を正規化処理部33に渡す。一方、使用ビット量の方が小さいと判定された場合は反復ループ処理部3内の処理を終了し、多重化処理に移行する。
【0220】
以上説明したように、許容誤差計算部31、ビット量/誤差量制御部32、正規化処理部33、量子化処理部34、ハフマン符号化部35で構成される反復ループ処理部3の処理は、実際に量子化されたMDCT周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【0221】
次に、量子化されハフマン符号化されたMDCT周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部12において決定された処理ブロックタイプと、ビット量/誤差量制御部32において選択されたスケールファクタと、ハフマン符号化部35において選択されたハフマン符号帳番号と共に多重化部4において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【0222】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。
【0223】
実施の形態12.
図14は本発明の実施の形態12による音響信号符号化装置のブロック図を示すものである。上述の実施の形態のものと同一もしくは相当部分は同一符号で示す。図において6dは正弦波検出部D、1は心理音響モデル部、11はFFT演算部、12はブロックタイプ判別部、13はSMR演算部、17はスイッチ、2はMDCT処理部、3は反復ループ処理部、31は許容誤差量計算部、32はビット量/誤差量計算部、33は正規化処理部、34は量子化部、35はハフマン符号化部、36は固定テーブル、37はスイッチ、4は多重化部、6dは正弦波検出部Dである。次にその動作を説明する。
【0224】
心理音響モデル部1に入力された入力信号は、FFT演算部11においてFFT計算処理が行われ、FFT周波数スペクトルが生成される。
【0225】
ブロックタイプ判別部12ではFFT演算部11からのFFT周波数スペクトルからマスキングしきい値を算出し、これを基にブロックタイプの判別を行い、その結果を処理ブロックタイプとしてMDCT処理部2と多重化部4に渡す。
【0226】
次に、MDCT処理部2では、ブロックタイプ判別部12から受け取った処理ブロックタイプを基に、周波数直交変換処理を行い、その結果として生成されるMDCT周波数スペクトルを反復ループ処理部3内の許容誤差計算部31と正規化処理部33に渡す。
【0227】
正弦波検出部D6dでは入力信号を用いて信号成分が正弦波であるか、そうでないかの判定を行い、正弦波であると判定された場合は、スイッチ17を何も接続されていない側に接続、即ち、SMR演算部13の処理を停止させ、スイッチ37を予め定めておいた固定値である許容誤差量が格納された固定テーブル36側に接続する。
【0228】
一方、正弦波ではないと判定された場合は、スイッチ17をブロックタイプ判別部12側に接続し、スイッチ37を許容誤差量計算部31側に接続する。
【0229】
SMR演算部13ではFFT演算部11からのFFT周波数スペクトルと、ブロックタイプ判別部12におけるマスキングしきい値を基にSMRを算出し、その結果として生成されるSMRを許容誤差量計算部31に渡す。
【0230】
反復ループ処理部3内の許容誤差計算部31では、MDCT周波数スペクトルとSMRの逆数(1/SMR)の乗算を行い、許容できる誤差量の計算を行う。ここで言う誤差量とは、MDCT処理部2からのMDCT周波数スペクトルと量子化/逆量子化を経て生成された逆量子化値の差分、即ち量子化誤差のことを指し、この値が許容範囲内に収まっていれば、人間の耳にノイズが知覚されずに済む。
【0231】
許容誤差量計算部31において算出された誤差量は、ビット量/誤差量制御部32に渡され、量子化/逆量子化を経て生成されたMDCT周波数スペクトルが許容誤差量を満足しているかの判定の指標として用いられる。
【0232】
正規化処理部33ではビット量/誤差量制御部32において選択されたスケールファクタを用いて、MDCT処理部2から渡されたMDCT周波数スペクトルの正規化が行われる。
【0233】
量子化部34では正規化処理部33において正規化されたMDCT周波数スペクトルの量子化を行い、その結果をハフマン符号化部35に渡す。また、誤差量を算出するために、逆量子化を行いその値をビット量/誤差量制御部32に渡す。
【0234】
量子化されたMDCT周波数スペクトルは、ハフマン符号化部35においてハフマン符号化を施され、実際に必要となったビット量をビット量/誤差量制御部32に、ハフマン符号帳番号とハフマン符号を多重化部4に渡す。
【0235】
ビット量/誤差量制御部32ではMDCT処理部2からのMDCT周波数スペクトルと量子化部34から得た逆量子化されたMDCT周波数スペクトルの差分、即ち、量子化による誤差量を計算し、許容誤差量計算部31において算出された誤差量との比較を行う。その結果、量子化による誤差量の方が大きいと判定された場合はスケールファクタの値を小さくし、その値を正規化処理部33に渡す。
【0236】
一方、量子化による誤差量の方が小さいと判定された場合は、ハフマン符号化部35から得た使用ビット量と、符号化の際に指定されるビットレートから算出された許容ビット量との比較を行う。その結果、使用ビット量の方が大きいと判定された場合はスケールファクタの値を大きくし、その値を正規化処理部33に渡す。一方、使用ビット量の方が小さいと判定された場合は反復ループ処理部3内の処理を終了し、多重化処理に移行する。
【0237】
以上説明したように、許容誤差計算部31、ビット量/誤差量制御部32、正規化処理部33、量子化処理部34、ハフマン符号化部35で構成される反復ループ処理部の処理3は、実際に量子化されたMDCT周波数スペクトルが許容誤差量を下回り、かつ量子化に必要となるビット量が許容ビット量を下回るまで反復して繰返される。
【0238】
次に、量子化されハフマン符号化されたMDCT周波数スペクトルは、ヘッダ等の補助情報と、ブロックタイプ判別部12において決定された処理ブロックタイプと、ビット量/誤差量制御部32において選択されたスケールファクタと、ハフマン符号化部35において選択されたハフマン符号帳番号と共に多重化部4において多重化処理され、符号化ストリームに変換された後、伝送路に送出される。
【0239】
以上、符号化処理部の処理の詳細について説明した。前記手法を用いれば、処理の対象とする信号の成分が正弦波のような周波数成分の存在する帯域が狭い場合においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えることが可能となるため、客観特性の劣化を防ぐ効果がある。また、SMRの演算処理と許容誤差量の演算処理を省略することが可能となるため、処理量削減の効果もある。
【0240】
【発明の効果】
以上のようにこの発明においては、人間の聴覚特性に基づいて生成される心理音響モデルからのパラメータを、効果的に量子化がなされるものに置き換えるよう変更するようにしたので、客観特性の劣化を防ぐ効果がある。
【0241】
また、SMRの演算処理又は許容誤差量の演算処理あるいはこれらの両方の演算処理を省略するようにしたので、処理量削減の効果がある。
【0242】
また、SMRの演算処理又は許容誤差量の演算処理あるいはこれらの両方の演算処理の出力値を利用しない場合あるいは演算処理を行わない場合に、予め定めておいたSMRの値、許容誤差量の値を使用するようにしたので、SMR演算部、許容誤差量計算部からの出力値を利用しない場合あるいは演算処理を行わない場合に所望の値を設定できる。
【0243】
また、前記FFT周波数スペクトルを振幅スペクトルとして上記発明が実施可能である。
【0244】
また、前記FFT周波数スペクトルをパワースペクトルとして上記発明が実施可能である。
【0245】
また、前記FFT周波数スペクトルをFFT演算結果の実数成分又は虚数成分として上記発明が実施可能である。
【0246】
また、正弦波判定部での正弦波の判定に利用するMDCT周波数スペクトルをパワースペクトルとして上記発明が実施可能である。
【図面の簡単な説明】
【図1】 本発明の実施の形態1の音響信号符号化装置を示すブロック図である。
【図2】 本発明における正弦波判定部の処理フローチャートである。
【図3】 図2の本発明における正弦波判定部の処理フローチャートの続きの処理フローチャートである。
【図4】 本発明の実施の形態2の音響信号符号化装置を示すブロック図である。
【図5】 本発明の実施の形態3の音響信号符号化装置を示すブロック図である。
【図6】 本発明の実施の形態4の音響信号符号化装置を示すブロック図である。
【図7】 本発明の実施の形態5の音響信号符号化装置を示すブロック図である。
【図8】 本発明の実施の形態6の音響信号符号化装置を示すブロック図である。
【図9】 本発明の実施の形態7の音響信号符号化装置を示すブロック図である。
【図10】 本発明の実施の形態8の音響信号符号化装置を示すブロック図である。
【図11】 本発明の実施の形態9の音響信号符号化装置を示すブロック図である。
【図12】 本発明の実施の形態10の音響信号符号化装置を示すブロック図である。
【図13】 本発明の実施の形態11の音響信号符号化装置を示すブロック図である。
【図14】 本発明の実施の形態12の音響信号符号化装置を示すブロック図である。
【図15】 従来の音響信号符号化装置を示すブロック図である。
【符号の説明】
1 心理音響モデル部、2 MDCT処理部、3 反復ループ処理部、4 多重化部、5a 正弦波判定部E、5b 正弦波判定部F、5c 正弦波判定部G、5d 正弦波判定部H、6a 正弦波検出部A、6b 正弦波検出部B、6c正弦波検出部C、6d 正弦波検出部D、11 FFT演算部、12 ブロックタイプ判別部、13 SMR演算部、14a 正弦波判定部A、14b 正弦波判定部B、14c 正弦波判定部C、14d 正弦波判定部D、15 固定テーブル、16 スイッチ、17 スイッチ、31 許容誤差量計算部、32 ビット量/誤差量制御部、33 正規化処理部、34 量子化部、35 ハフマン符号化部、36 固定テーブル、37 スイッチ、38 スイッチ、39 スイッチ。
Claims (12)
- 入力信号のFFT計算処理を行うFFT演算部と、
このFFT演算部の演算結果であるFFT周波数スペクトルを利用してMDCT処理部の処理ブロックタイプを判別するブロックタイプ判別部と、
前記FFT演算部の演算結果であるFFT周波数スペクトルを利用して前記入力信号の信号成分が正弦波か否かの判定を行う正弦波判定部と、
前記FFT演算部の演算結果であるFFT周波数スペクトルを利用してSMRの演算を行うSMR演算部と、
前記正弦波判定部での正弦波の判定結果に基づいて前記SMR演算部からの出力値を利用するか否か切り換える手段と、
前記ブロックタイプ判別部から受け取った処理ブロックタイプを基に入力信号の周波数直交変換処理を行いMDCT周波数スペクトルを求めるMDCT処理部と、
前記SMR及びMDCT周波数スペクトルを用いて許容誤差量の計算を行う許容誤差量計算部と、
この許容誤差量計算部からの誤差量及び量子化部からの逆量子化値及びハフマン符号化部からの使用ビット量を基にビット量/誤差量の制御を行いスケールファクタを決定するビット量/誤差量制御部と、
このビット量/誤差量制御部からのスケールファクタを基に前記MDCT処理部からのMDCT周波数スペクトルの正規化を行う正規化処理部と、
この正規化されたMDCT周波数スペクトルの量子化及び逆量子化を行う前記量子化部と、
この量子化されたMDCT周波数スペクトルのハフマン符号化を行いハフマン符号帳番号とハフマン符号を出力するとともに使用ビット量の計算を行う前記ハフマン符号化部と、
前記ブロックタイプ判別部からの処理ブロックタイプ、前記ビット量/誤差量制御部からのスケールファクタおよび前記ハフマン符号化部からのハフマン符号帳番号とハフマン符号の多重化を行う多重化部と、
を備え、
前記正弦波判定部において、前記FFT演算部において計算されたFFT周波数スペクトルから、振幅スペクトル、パワースペクトル、FFT周波数スペクトルの実数成分の絶対値、虚数成分の絶対値のいずれか1つを計算し、これの低域側で周波数範囲が狭く、高域側で周波数範囲が広くなるように規定したバンド毎の和をとり、全てのバンドの中で最大値をとるバンドと、最大値をとるバンドの前後2つのバンドを除いた残りのバンドから2番目に大きい値をとるバンドを探索し、最大値をとるバンドと2番目に大きい値をとるバンドの相対比を正弦波の判定の指標とすることを特徴とする音響信号符号化装置。 - 前記正弦波判定部での正弦波の判定結果に基づいて前記SMR演算部の演算処理の実行、停止を切り換える手段をさらに備えたことを特徴とする請求項1に記載の音響信号符号化装置。
- 前記正弦波判定部での正弦波の判定結果に基づいてSMR演算部からの出力値を利用するか否か切り換える手段において、前記SMR演算部からの出力値を利用しない場合には予め定めておいたSMRの値を使用することを特徴とする請求項1または2に記載の音響信号符号化装置。
- 入力信号のFFT計算処理を行うFFT演算部と、
このFFT演算部の演算結果であるFFT周波数スペクトルを利用してMDCT処理部の処理ブロックタイプを判別するブロックタイプ判別部と、
前記FFT演算部の演算結果であるFFT周波数スペクトルを利用して前記入力信号の信号成分が正弦波か否かの判定を行う正弦波判定部と、
前記FFT演算部の演算結果であるFFT周波数スペクトルを利用してSMRの演算を行うSMR演算部と、
ブロックタイプ判別部から受け取った処理ブロックタイプを基に入力信号の周波数直交変換処理を行いMDCT周波数スペクトルを求めるMDCT処理部と、
前記SMR及びMDCT周波数スペクトルを用いて許容誤差量の計算を行う許容誤差量計算部と、
前記正弦波判定部での正弦波の判定結果に基づいて前記許容誤差量計算部からの出力値を利用するか否か切り換える手段と、
前記許容誤差量計算部からの誤差量及び量子化部からの逆量子化値及びハフマン符号化部からの使用ビット量を基にビット量/誤差量の制御を行いスケールファクタを決定するビット量/誤差量制御部と、
このビット量/誤差量制御部からのスケールファクタを基に前記MDCT処理部からのMDCT周波数スペクトルの正規化を行う正規化処理部と、
この正規化されたMDCT周波数スペクトルの量子化及び逆量子化を行う前記量子化部と、
この量子化されたMDCT周波数スペクトルのハフマン符号化を行いハフマン符号帳番号とハフマン符号を出力するとともに使用ビット量の計算を行う前記ハフマン符号化部と、
前記ブロックタイプ判別部からの処理ブロックタイプ、前記ビット量/誤差量制御部からのスケールファクタおよび前記ハフマン符号化部からのハフマン符号帳番号とハフマン符号の多重化を行う多重化部と、
を備え、
前記正弦波判定部において、前記FFT演算部において計算されたFFT周波数スペクトルから、振幅スペクトル、パワースペクトル、FFT周波数スペクトルの実数成分の絶対値、虚数成分の絶対値のいずれか1つを計算し、これの低域側で周波数範囲が狭く、高域側で周波数範囲が広くなるように規定したバンド毎の和をとり、全てのバンドの中で最大値をとるバンドと、最大値をとるバンドの前後2つのバンドを除いた残りのバンドから2番目に大きい値をとるバンドを探索し、最大値をとるバンドと2番目に大きい値をとるバンドの相対比を正弦波の判定の指標とすることを特徴とする音響信号符号化装置。 - 前記正弦波判定部での正弦波の判定結果に基づいて前記SMR演算部の演算処理の実行、停止を切り換える手段と、
前記正弦波判定部での正弦波の判定結果に基づいて前記許容誤差量計算部の演算処理の実行、停止を切り換える手段と、
をさらに備えたことを特徴とする請求項4に記載の音響信号符号化装置。 - 前記正弦波判定部での正弦波の判定結果に基づいて前記許容誤差量計算部からの出力値を利用するか否か切り換える手段において、許容誤差計算部からの出力値を利用しない場合には、予め定めておいた許容誤差量の値を使用することを特徴とする請求項4または5に記載の音響信号符号化装置。
- 入力信号のFFT計算処理を行うFFT演算部と、
このFFT演算部の演算結果であるFFT周波数スペクトルを利用してMDCT処理部の処理ブロックタイプを判別するブロックタイプ判別部と、
このブロックタイプ判別部から受け取った処理ブロックタイプを基に入力信号の周波数直交変換処理を行いMDCT周波数スペクトルを求めるMDCT処理部と、
このMDCT処理部の演算結果であるMDCT周波数スペクトルを利用して前記入力信号の信号成分が正弦波か否かの判定を行う正弦波判定部と、
前記FFT演算部の演算結果であるFFT周波数スペクトルを利用してSMRの演算を行うSMR演算部と、
前記正弦波判定部での正弦波の判定結果に基づいて前記SMR演算部からの出力値を利用するか否か切り換える手段と、
前記SMR及びMDCT周波数スペクトルを用いて許容誤差量の計算を行う許容誤差量計算部と、
この許容誤差量計算部からの誤差量及び量子化部からの逆量子化値及びハフマン符号化部からの使用ビット量を基にビット量/誤差量の制御を行いスケールファクタを決定するビット量/誤差量制御部と、
このビット量/誤差量制御部からのスケールファクタを基に前記MDCT処理部からのMDCT周波数スペクトルの正規化を行う正規化処理部と、
この正規化されたMDCT周波数スペクトルの量子化及び逆量子化を行う前記量子化部と、
この量子化されたMDCT周波数スペクトルのハフマン符号化を行いハフマン符号帳番号とハフマン符号を出力するとともに使用ビット量の計算を行う前記ハフマン符号化部と、
前記ブロックタイプ判別部からの処理ブロックタイプ、前記ビット量/誤差量制御部からのスケールファクタおよび前記ハフマン符号化部からのハフマン符号帳番号とハフマン符号の多重化を行う多重化部と、
を備え、
前記正弦波判定部において、前記MDCT処理部において計算されたMDCT周波数スペクトルからパワースペクトルを計算し、これの低域側で周波数範囲が狭く、高域側で周波数範囲が広くなるように規定したバンド毎の和をとり、全てのバンドの中で最大値をとるバンドと、最大値をとるバンドの前後2つのバンドを除いた残りのバンドから2番目に大きい値をとるバンドを探索し、最大値をとるバンドと2番目に大きい値をとるバンドの相対比を正弦波の判定の指標とすることを特徴とする音響信号符号化装置。 - 前記正弦波判定部での正弦波の判定結果に基づいて前記SMR演算部の演算処理の実行、停止を切り換える手段をさらに備えたことを特徴とする請求項7に記載の音響信号符号化装置。
- 前記正弦波判定部での正弦波の判定結果に基づいてSMR演算部からの出力値を利用するか否か切り換える手段において、前記SMR演算部からの出力値を利用しない場合には予め定めておいたSMRの値を使用することを特徴とする請求項7または8に記載の音響信号符号化装置。
- 入力信号のFFT計算処理を行うFFT演算部と、
このFFT演算部の演算結果であるFFT周波数スペクトルを利用してMDCT処理部の処理ブロックタイプを判別するブロックタイプ判別部と、
このブロックタイプ判別部から受け取った処理ブロックタイプを基に入力信号の周波数直交変換処理を行いMDCT周波数スペクトルを求めるMDCT処理部と、
このMDCT処理部の演算結果であるMDCT周波数スペクトルを利用して前記入力信号の信号成分が正弦波か否かの判定を行う正弦波判定部と、
前記FFT演算部の演算結果であるFFT周波数スペクトルを利用してSMRの演算を行うSMR演算部と、
前記SMR及びMDCT周波数スペクトルを用いて許容誤差量の計算を行う許容誤差量計算部と、
前記正弦波判定部での正弦波の判定結果に基づいて前記許容誤差量計算部からの出力値を利用するか否か切り換える手段と、
前記許容誤差量計算部からの誤差量及び量子化部からの逆量子化値及びハフマン符号化部からの使用ビット量を基にビット量/誤差量の制御を行いスケールファクタを決定するビット量/誤差量制御部と、
このビット量/誤差量制御部からのスケールファクタを基に前記MDCT処理部からのMDCT周波数スペクトルの正規化を行う正規化処理部と、
この正規化されたMDCT周波数スペクトルの量子化及び逆量子化を行う前記量子化部と、
この量子化されたMDCT周波数スペクトルのハフマン符号化を行いハフマン符号帳番号とハフマン符号を出力するとともに使用ビット量の計算を行う前記ハフマン符号化部と、
前記ブロックタイプ判別部からの処理ブロックタイプ、前記ビット量/誤差量制御部からのスケールファクタおよび前記ハフマン符号化部からのハフマン符号帳番号とハフマン符号の多重化を行う多重化部と、
を備え、
前記正弦波判定部において、前記MDCT処理部において計算されたMDCT周波数スペクトルからパワースペクトルを計算し、これの低域側で周波数範囲が狭く、高域側で周波数範囲が広くなるように規定したバンド毎の和をとり、全てのバンドの中で最大値をとるバンドと、最大値をとるバンドの前後2つのバンドを除いた残りのバンドから2番目に大きい値をとるバンドを探索し、最大値をとるバンドと2番目に大きい値をとるバンドの相対比を正弦波の判定の指標とすることを特徴とする音響信号符号化装置。 - 前記正弦波判定部での正弦波の判定結果に基づいて前記SMR演算部の演算処理の実行、停止を切り換える手段をさらに備えたことを特徴とする請求項10に記載の音響信号符号化装置。
- 前記正弦波判定部での正弦波の判定結果に基づいて前記許容誤差量計算部からの出力値を利用するか否か切り換える手段において、前記許容誤差計算部からの出力値を利用しない場合には予め定めておいた許容誤差量の値を使用することを特徴とする請求項10または11に記載の音響信号符号化装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001052113A JP3639216B2 (ja) | 2001-02-27 | 2001-02-27 | 音響信号符号化装置 |
US10/040,635 US6577252B2 (en) | 2001-02-27 | 2002-01-09 | Audio signal encoding apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001052113A JP3639216B2 (ja) | 2001-02-27 | 2001-02-27 | 音響信号符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002261622A JP2002261622A (ja) | 2002-09-13 |
JP3639216B2 true JP3639216B2 (ja) | 2005-04-20 |
Family
ID=18912792
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001052113A Expired - Lifetime JP3639216B2 (ja) | 2001-02-27 | 2001-02-27 | 音響信号符号化装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6577252B2 (ja) |
JP (1) | JP3639216B2 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002196792A (ja) * | 2000-12-25 | 2002-07-12 | Matsushita Electric Ind Co Ltd | 音声符号化方式、音声符号化方法およびそれを用いる音声符号化装置、記録媒体、ならびに音楽配信システム |
KR100547113B1 (ko) * | 2003-02-15 | 2006-01-26 | 삼성전자주식회사 | 오디오 데이터 인코딩 장치 및 방법 |
JP2004309921A (ja) * | 2003-04-09 | 2004-11-04 | Sony Corp | 符号化装置、符号化方法及びプログラム |
CN100493199C (zh) * | 2003-06-16 | 2009-05-27 | 松下电器产业株式会社 | 编码装置、编码方法和码本 |
KR101017770B1 (ko) * | 2003-06-26 | 2011-02-28 | 톰슨 라이센싱 | 슬라이딩 윈도 채널 제약에 부합하는 멀티패스 비디오레이트 제어 |
US7325023B2 (en) * | 2003-09-29 | 2008-01-29 | Sony Corporation | Method of making a window type decision based on MDCT data in audio encoding |
US7426462B2 (en) * | 2003-09-29 | 2008-09-16 | Sony Corporation | Fast codebook selection method in audio encoding |
US7283968B2 (en) | 2003-09-29 | 2007-10-16 | Sony Corporation | Method for grouping short windows in audio encoding |
US7349842B2 (en) * | 2003-09-29 | 2008-03-25 | Sony Corporation | Rate-distortion control scheme in audio encoding |
US7676360B2 (en) * | 2005-12-01 | 2010-03-09 | Sasken Communication Technologies Ltd. | Method for scale-factor estimation in an audio encoder |
KR100788706B1 (ko) | 2006-11-28 | 2007-12-26 | 삼성전자주식회사 | 광대역 음성 신호의 부호화/복호화 방법 |
JP5262171B2 (ja) * | 2008-02-19 | 2013-08-14 | 富士通株式会社 | 符号化装置、符号化方法および符号化プログラム |
CN113541624B (zh) * | 2021-07-02 | 2023-09-26 | 北京航空航天大学 | 一种用于功率放大器控制的小信号处理方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07264144A (ja) * | 1994-03-16 | 1995-10-13 | Toshiba Corp | 信号圧縮符号化装置および圧縮信号復号装置 |
US6266644B1 (en) * | 1998-09-26 | 2001-07-24 | Liquid Audio, Inc. | Audio encoding apparatus and methods |
-
2001
- 2001-02-27 JP JP2001052113A patent/JP3639216B2/ja not_active Expired - Lifetime
-
2002
- 2002-01-09 US US10/040,635 patent/US6577252B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2002261622A (ja) | 2002-09-13 |
US20020120442A1 (en) | 2002-08-29 |
US6577252B2 (en) | 2003-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100913987B1 (ko) | 다중-채널 출력 신호를 발생시키기 위한 다중-채널합성장치 및 방법 | |
US7143030B2 (en) | Parametric compression/decompression modes for quantization matrices for digital audio | |
US9443525B2 (en) | Quality improvement techniques in an audio encoder | |
CA2651745C (en) | Information signal encoding | |
EP2250641B1 (en) | Apparatus for mixing a plurality of input data streams | |
US7146313B2 (en) | Techniques for measurement of perceptual audio quality | |
JP4212591B2 (ja) | オーディオ符号化装置 | |
JP4673882B2 (ja) | 推定値を決定するための方法および装置 | |
JP3639216B2 (ja) | 音響信号符号化装置 | |
EP3826011A1 (en) | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals | |
JP4625709B2 (ja) | ステレオオーディオ信号符号化装置 | |
JPH0918348A (ja) | 音響信号符号化装置及び音響信号復号装置 | |
AU2012202581B2 (en) | Mixing of input data streams and generation of an output data stream therefrom |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20041007 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041012 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050111 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050113 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3639216 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080121 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090121 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100121 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100121 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110121 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120121 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130121 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130121 Year of fee payment: 8 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |