JP3190204B2 - Mpeg規格の音声信号デコーダ - Google Patents
Mpeg規格の音声信号デコーダInfo
- Publication number
- JP3190204B2 JP3190204B2 JP9815694A JP9815694A JP3190204B2 JP 3190204 B2 JP3190204 B2 JP 3190204B2 JP 9815694 A JP9815694 A JP 9815694A JP 9815694 A JP9815694 A JP 9815694A JP 3190204 B2 JP3190204 B2 JP 3190204B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- audio signal
- data
- processing
- inverse quantization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005236 sound signal Effects 0.000 title claims description 50
- 238000013139 quantization Methods 0.000 claims description 79
- 230000015654 memory Effects 0.000 claims description 45
- 230000015572 biosynthetic process Effects 0.000 claims description 23
- 238000003786 synthesis reaction Methods 0.000 claims description 23
- 238000000034 method Methods 0.000 claims description 21
- 230000002194 synthesizing effect Effects 0.000 claims description 21
- 230000014509 gene expression Effects 0.000 claims description 19
- 238000000926 separation method Methods 0.000 claims description 12
- 230000001131 transforming effect Effects 0.000 claims description 2
- 239000000523 sample Substances 0.000 description 25
- 238000004364 calculation method Methods 0.000 description 7
- 238000005070 sampling Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 238000000354 decomposition reaction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- BBRBUTFBTUFFBU-LHACABTQSA-N Ornoprostil Chemical compound CCCC[C@H](C)C[C@H](O)\C=C\[C@H]1[C@H](O)CC(=O)[C@@H]1CC(=O)CCCCC(=O)OC BBRBUTFBTUFFBU-LHACABTQSA-N 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 description 1
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 description 1
- 101100524644 Toxoplasma gondii ROM4 gene Proteins 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Television Receiver Circuits (AREA)
- Television Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
ディジタル音声信号を復号するための音声信号デコーダ
に関し、特に、MPEG規格の音声信号を復号するのに
用いて好適なものである。
1つとして、MPEGと称される技術が開発されてきて
いる。このMPEGによる音声信号の圧縮技術は、IS
O/IEC(国際標準化機構/国際電気標準会議)によ
って規格化されたものであり、MPEG1とMPEG2
との両方を含む。以下、これらを合わせてMPEG規格
という。
回路規模によってレイヤ1,レイヤ2,レイヤ3の3つ
の方式が用意されている。レイヤ1とレイヤ2との主な
違いは、ディジタル化された情報についてコード化およ
びサンプリングが施されたデータを幾つごとにまとめる
かというパケットサイズの差にある。また、レイヤ3に
ついては、上記パケットサイズの他に符号化の方式も異
なっている。
のチャンネルモードとして、シングルチャンネル、デュ
アルチャンネル、ステレオ、ジョイントステレオなどの
各モードが規定されている。これらの各モードの違い
は、音源が1つ、2つまたはステレオの何れであるかと
いうことと、高音域におけるステレオ音声の符号化の仕
方との差異によるものである。
チャンネルモードごとに使用可能な伝送レートが規定さ
れている。例えば、レイヤ1のシングルチャンネルにお
いては、32K, 64K, 96K, 128K, 160Kbit/secなどの値が
定義されている。この伝送レートの違いは、圧縮後のデ
ータ量に影響を及ぼす。また、再生後の音声信号の出力
レート(サンプリングレート)として、32K, 44.1K, 48
KHz の3種類のレートが規定されている。
声信号の圧縮および復号の原理を、レイヤ1,シングル
チャンネル,伝送レート128Kbit/sec ,サンプリングレ
ート48KHz の下で1フレームの音声信号を圧縮および復
号する場合を例にとって説明する。
ム分のディジタル音声信号は、サブバンドフィルタによ
り32のサブバンドに分割され、各サブバンド毎に12
サンプルの値を得る。そして、この各サブバンドの最大
振幅からスケールファクタ(SF)が求められ、各データ
はそのサブバンドのスケールファクタ(SF)により正規
化される。また、伝送レート、サンプリングレートから
上記1フレーム当りのビット量が計算される。
限聴特性やマスキング特性(前者は人の聴覚が低周波や
高周波の領域ではあまり敏感でないという特性、後者は
ある周波数スペクトルのピーク近傍の周波数では聴感度
が低下するという特性)に基づいて、上記1フレームの
ビット量と合致するよう量子化レベル(Allocation)が
各サブバンドごとに設定される。
(Allocation)に従って、上記正規化された各サブバン
ド毎のサンプルが量子化および符号化され、量子化デー
タ(Sample)が求められる。そして、この量子化データ
(Sample)は、上述のスケールファクタ(SF)および量
子化レベル(Allocation)とともに1つのデータストリ
ームにされて、圧縮音声信号が生成される。
n)は、復号時において逆量子化演算を行うときに用い
られるデータであり、1つのサブバンド中に含まれる各
サンプルに何ビットが割り当てられているかを表すもの
である。なお、この量子化レベル(Allocation)は、レ
イヤ1においては、1フレーム中の1サブバンド単位に
4ビットが与えられている。したがって、1フレーム当
りでは128ビット(=32サブバンド×4ビット)と
なる。
において逆スケーリング演算を行うときに用いられるデ
ータであり、おおよその出力レベルを与えるものであ
る。例えば、電子計算機で使用する浮動小数点数の指数
部に相当する。なお、このスケールファクタ(SF)は、
レイヤ1においては、量子化データ(Sample)の値が0
の場合は省略されるが、省略されない場合は1フレーム
中の1サブバンド単位に6ビットが与えられている。し
たがって、1フレーム当りでは192ビット程度(=3
2サブバンド×6ビット)となる。
時における逆量子化演算に用いられるデータであり、出
力データの細かい値を与えるものである。例えば、電子
計算機で使用する浮動小数点数の仮数部に相当する。な
お、この量子化データ(Sample)は、1フレームごとに
上記量子化レベル(Allocation)で指定したビット数の
データが与えられており、レイヤ1においては1Kビッ
ト程度である。
の復号は、この圧縮とは逆の操作によって行われる。す
なわち、まず、対象となる圧縮音声信号のデータストリ
ームが分解されて、そこから量子化レベル(Allocatio
n)、スケールファクタ(SF)および量子化データ(Sam
ple)が抽出される。そして、抽出された量子化データ
(Sample)が量子化レベル(Allocation)によって逆量
子化されるとともに、スケールファクタ(SF)によって
逆スケーリング処理が施されて、サブバンド情報が求め
られる。
サブバンド情報に対して、シンセサイザ合成の処理が施
される。その後、ポリフェーズフィルタにより所定の処
理が施された後、前後16の波形が合成されて復号音声
信号として出力される。
復号を行うための従来の音声信号デコーダの一部を示す
概略的な構成図である。また、図4は、この音声信号デ
コーダの動作を示すフローチャートである。
1は入力ユニットであり、その内部に設けられている分
解抽出回路31aによって、入力される圧縮音声信号の
データストリームDS から量子化レベル(Allocatio
n)、スケールファクタ(SF)および量子化データ(Sam
ple)を分解して抽出する。なお、このような処理は、
入力コントローラ32の制御に従って行われる。
逆量子化コントローラ37の制御に従って、以下のよう
な処理を行うものである。すなわち、逆量子化ユニット
33は、その内部に設けられている逆量子化処理ユニッ
ト34および第1の乗算器35により、逆量子化および
逆スケーリングの各処理を行う。
は、上記抽出した量子化レベル(Allocation)を用い
て、量子化データ(Sample)に対して(式1)に示すよ
うな逆量子化演算を施すことにより、演算値Sample-Val
ueを求める。
ルファクタ(SF)を用いて、逆量子化処理ユニット34
により求められた演算値Sample-Valueに21-SF/3の値を
乗ずることにより、サブバンド情報Sj (jは0〜31
の値で、32個のサブバンド番号を示す)を求める。
1のテーブルROM36にテーブル情報として予め記憶
されている値SF-TBL(Scale-Factor)が用いられる。な
お、このテーブル情報SF-TBL(Scale-Factor)は、与えら
れるスケールファクタ(SF)に基づいて21-SF/3を実際
に計算した値と比較して丸め誤差の範囲でしか異ならな
い。したがって、MPEG−Audio規格では、数値
テーブルで値が与えられている。
(SF)は6ビットで構成されているので、その値には0
〜63(ただし、有効な値は0〜62であり、63はエ
ラーとなる)の整数が用いられる。このため、上記第1
のテーブルROM36には、少なくとも63ワード分の
記憶容量が必要となる。
あり、その内部にある第1のバッファメモリ(RAM)
39に、上記逆量子化ユニット33で求められたサブバ
ンド情報Sj が格納される。そして、この第1のバッフ
ァメモリ39に格納されたサブバンド情報Sj は、次段
においてシンセサイザ合成を行う際に使用される。
以上に保つためには、演算によって得られるサブバンド
情報Sj には16ビット程度のビット数が必要である。
したがって、上記第1のバッファメモリ39には、少な
くとも6144ビット(=32サブバンド×12サンプ
ル×16ビット)の記憶容量が必要となる。
たサブバンド情報Sj は、バッファメモリコントローラ
40の制御に従って、次段のシンセサイザ合成ユニット
41に供給される。このシンセサイザ合成ユニット41
には、第2の乗算器42と累積加算器43と第2のテー
ブルROM44とが備えられており、これらによって各
サブバンドの周波数と、対象となる時刻の位相とから波
形情報Vi が求められるようになされている。
り、上記第1のバッファメモリ39から供給されるサブ
バンド情報Sj に、cos((16+i)×(2j+1)π/64)の値が乗
ぜられる。このようなcos((16+i)×(2j+1)π/64)の値
は、上記第2のテーブルROM44にテーブル情報とし
て予め記憶されているものが用いられる。なお、上記式
中のi は時間軸方向のパラメータ(サンプル番号)であ
り、0〜63の値をとる。また、j は周波数軸方向のパ
ラメータ(サブバンド番号)であり、0〜31の値をと
る。
乗算器42で求められた各サブバンド毎の乗算値が全て
加算されて波形情報Vi が求められる。なお、このよう
なシンセサイザ合成ユニット41での一連の演算処理
は、シンセサイザ合成コントローラ45による制御に従
って行われる。
いる第2のテーブルROM44の記憶容量について考え
る。コサイン関数は、(式2)に示すような周期性をそ
の特徴の1つとして持っているため、上記コサイン関数
値を表す式中の(16+i)×(2j+1)の値は、0〜127の1
28個を用意すればよい。 cos(x)=cos(2πn+x) :nは整数 …(式2)
(式4)に示すような対称性をもその特徴の1つとして
持っているため、上記(16+i)×(2j+1)の値は、0〜12
7の範囲の1/4倍、すなわち0〜31の32個を用意
すればよいことになる。 cos(x)=cos(2π−x) :x=π〜 2π …(式3) cos(x)= −cos(π−x) :x=π/2〜π …(式4)
式に対して、(16+i)×(2j+1)の値を0〜31の32個用
意することが必要であるので、第2のテーブルROM4
4としては、少なくとも32ワード分の記憶容量が必要
となる。
内部にある第2のバッファメモリ47に、上記シンセサ
イザ合成ユニット41にて求められた波形情報Vi が格
納される。なお、この第2のバッファメモリ47の記憶
容量は、1サンプル当りで1024ビット(=64×1
6ビット)である。
ーダの動作を、図3の構成図および図4のフローチャー
トとともに説明する。図4において、まずステップP1
で、分解抽出回路31aによって、圧縮音声信号のデー
タストリームDs から量子化レベル(Allocation)、ス
ケールファクタ(SF)および量子化データ(Sample)が
各々抽出される。
tion)および量子化データ(Sample)は、逆量子化処理
ユニット34に供給される。また、スケールファクタ
(SF)は、第1のテーブルROM36に供給される。
ット34により上記量子化レベル(Allocation)に従っ
て量子化データ(Sample)が逆量子化され、演算値Samp
le-Valueが求められる。こうして求められた演算値Samp
le-Valueは、第1の乗算器35に与えられる。そして、
この演算値Sample-Valueに対して、スケールファクタ
(SF)の値に応じて第1のテーブルROM36から読み
出されるSF-TBL(Scale-Factor)の値が乗ぜられることに
より、サブバンド情報Sj が求められる。
j は、ステップP3で第1のバッファメモリ39に一時
格納される。次のステップP4では、第2の乗算器42
により、上記第1のバッファメモリ39から供給される
サブバンド情報Sj にcos((16+i)×(2j+1)π/64)の値が
乗ぜられる。また、これによって得られるサブバンド毎
の乗算値が累積加算器43で全て加算されて、波形情報
Vi が求められる。
て求められた波形情報Vi が第2のバッファメモリ47
に格納される。この第2のバッファメモリ47に格納さ
れた波形情報Vi は、その後、図示しないサブバンドフ
ィルタにおけるアップ・サンプリング処理で用いるため
に、出力コントローラ48の制御に従って上記サブバン
ドフィルタに出力される。
におけるMPEG規格の音声信号デコーダでは、圧縮音
声信号のデータストリームからシンセサイザ合成情報を
得るまでの処理過程において、大容量のメモリを必要と
していた。
コーダは、逆量子化ユニット33とシンセサイザ合成ユ
ニット41とを別個に持っていたため、逆量子化ユニッ
ト33で求めたサブバンド情報Sj をシンセサイザ合成
ユニット41で使用するために、両者の間に第1のバッ
ファメモリ39を設けることが必要であった。
ザ合成ユニット41との両方の中にそれぞれの乗算処理
に必要な乗数を予め記憶しておくためのテーブルROM
を設けることが必要であった。このため、メモリの使用
数および容量がともに多くなってしまい、装置のハード
構成が複雑になってしまうという問題があった。
に、逆量子化ユニット33とシンセサイザ合成ユニット
41とのそれぞれにおいて、演算負荷が大きい乗算処理
を2回にわたって行わなくてはならいため、全体として
の演算負荷が非常に大きくなり、処理時間が長くなると
いう問題もあった。
に成されたものであり、メモリの使用数および容量を少
なくすることができるようにするとともに、演算負荷を
小さくすることができるようにすることを目的としてい
る。
音声信号デコーダは、MPEG規格の圧縮音声信号を逆
量子化処理およびシンセサイザ合成処理を行って復号す
るようにした音声信号デコーダにおいて、上記圧縮音声
信号のデータストリームから量子化レベルデータ、スケ
ールファクタデータおよび量子化データの各データを抽
出するデータ抽出手段と、上記データ抽出手段により抽
出された各データを、上記逆量子化処理およびシンセサ
イザ合成処理を行うための各演算式をまとめて変形した
統一演算式を用いて処理する逆量子化・シンセサイザ合
成手段とを設け、上記逆量子化処理とシンセサイザ合成
処理とを統合して行うようにしたものである。
上記スケールファクタの値によって特定される演算値の
指数を整数部と分数部とに分ける整数・分数分離処理手
段と、上記整数・分数分離処理手段により分離された分
数部の値に応じてメモリ手段から読み出されるテーブル
情報を用いて、上記量子化レベルおよび量子化データに
対して乗算に基づく演算処理を施す第1の演算処理手段
と、上記整数・分数分離処理手段により分離された整数
部の値を用いて、上記第1の演算処理手段により求めら
れた演算値に対してシフト演算に基づく演算処理を施す
第2の演算処理手段とにより上記逆量子化・シンセサイ
ザ合成手段を構成し、上記第1の演算処理手段と第2の
演算処理手段とにより、上記統一演算式に基づく演算処
理を行うようにしたものである。
々に行われていた逆量子化処理とシンセサイザ合成処理
とが1つの演算処理回路群内で行われるようになり、従
来のように、逆量子化処理を行う回路とシンセサイザ合
成処理を行う回路との間に、逆量子化処理により得られ
るデータを格納するためのバッファメモリを設けなくて
も済む。
算式に基づく演算処理が、整数部に関する演算処理と分
数部に関する演算処理とに分けられて行われるようにな
り、整数部に関する演算処理については、与えられる情
報を乗算ではなくシフト演算によって処理することがで
きるようになるので、シンセサイザ合成情報を得るまで
に演算負荷が大きい乗算を行う回数を従来よりも少なく
することが可能となるとともに、乗算に利用される複雑
な乗数をテーブル情報として予め記憶しておくためのメ
モリ手段の使用数を少なくすることが可能となる。
明する。図1は、本実施例の音声信号デコーダの一部を
示す概略的な構成図である。また、図2は、この音声信
号デコーダの動作を示すフローチャートである。
であり、分解抽出回路1aと入力バッファメモリ2とを
備えている。分解抽出回路1aは、入力される圧縮音声
信号のデータストリームDs から量子化レベル(Alloca
tion)、スケールファクタ(SF)および量子化データ
(Sample)を分解して抽出する。
データは、入力バッファメモリ2の所定領域、すなわ
ち、Allocationの記憶領域2a、Scale Factorの記憶領
域2b、Sampleの記憶領域2cにそれぞれ格納される。
なお、以上のような入力バッファユニット1における処
理は、入力バッファコントローラ3の制御に従って行わ
れる。
レイヤ1,シングルチャンネル,伝送レート128Kbit/se
c ,サンプリングレート48KHz の下では、量子化レベル
(Allocation)は1フレーム当りで128ビット、スケ
ールファクタ(SF)は192ビット、量子化データ(Sa
mple)は約1Kビット程度のデータ量を持っている。し
たがって、これらの各データが格納される入力バッファ
メモリ2には、合計で約1300ビットの記憶容量が必
要である。
ユニットであり、その内部にある各回路で逆量子化およ
びシンセサイザ合成の各処理を行って、波形情報Vi を
求める。すなわち、本実施例では、この逆量子化・シン
セサイザ合成ユニット4を用いて、従来は別々に行われ
ていた逆量子化処理とシンセサイザ合成処理とを統合し
て行うことにより、バッファメモリの容量の低減、演算
負荷の低減、テーブルROMの使用数の低減を図ってい
る。
成演算とを統合する原理について述べる。従来は、まず
(式5)に示すような逆量子化演算を行うことによって
サブバンド情報Sj を求め、更にこのサブバンド情報S
j を用いて(式6)に示すようなシンセサイザ合成演算
を行うことによって波形情報Vi を求めていた。
めて1つの式にすると、(式7)のようになる。ただ
し、簡略化のため、k=(16+i)×(2j+1)π/64 としてい
る。
「1-SF/3」の値を整数部Nと分数部nとに分離すると、 N+n=1-SF/3 …(式8) が成り立つ。なお、上述したように、スケールファクタ
(SF)がとり得る値は0〜63であるから、N,nがと
り得る値の範囲は、それぞれN=−20〜1、n=0,
1/3,2/3となる。さらに、(式8)を(式7)に
代入して変形すると(式9)が得られる。
ザ合成ユニット4では、この(式9)で示される演算
を、(式10)のように分数部nに関する演算と整数部
Nに関する演算との2つに分けて処理するようにしてい
る。すなわち、本実施例では、整数・分数分離処理部5
によって上記「1-SF/3」の値を整数部Nと分数部nとに
分け、分数部nの値に応じて第1の演算処理手段11に
よってまず中間演算値Wj を求める。さらに、この中間
演算値Wj を用いて、整数部Nの値に応じて第2の演算
処理手段12によって波形情報Vi を求めるようにして
いる。
ち、逆量子化処理ユニット6は、入力バッファメモリ2
から供給される量子化レベル(Allocation)を用いて、
量子化データ(Sample)に対して(式1)に示したよう
な逆量子化演算を施すことにより、演算値Sample-Value
を求めるためのものである。
6により求められた演算値Sample-Valueに対して2n co
s(k)(ただし、k=(16+i)×(2j+1)π/64 :i= 0〜63, j=
0〜31)の値を乗じて中間演算値Wj を求めるためのも
のである。さらに、テーブルROM8は、i,j,nの値に
応じて予め計算した2n cos(k)の値をテーブル情報とし
て記憶しておくためのものである。このテーブルROM
8に整数・分数分離処理部5から分数部nの値が与えら
れると、その値に対応する2n cos(k)の値が各サブバン
ド毎に出力されて乗算器7に供給されるようになされて
いる。
いるテーブルROM8の記憶容量について考える。ま
ず、cos(k)の係数であるk=(16+i)×(2j+1)π/64 に関し
ては、従来例のところで述べたように、0〜31の32
個の値を用意すればよい。一方、2n の指数に関して
は、n=0,1/3,2/3の3つの値が必要である。
したがって、2n cos(k)の全体としては、96(=32
×3)個の値が必要であり、テーブルROM8として
は、96ワード分の記憶容量が必要となる。
は、第1のテーブルROM36の記憶容量は63ワード
であり、第2のテーブルROM44の記憶容量は32ワ
ードである。したがって、全体としての記憶容量は95
(=63+32)ワードであり、本実施例の場合よりわ
ずかに少ない。しかし、本実施例では、ROMの使用数
が1個でよいので、装置のハード構成を簡単にすること
ができるという利点がある。
成のうち、シフタ9は、上記整数・分数分離処理部5か
ら出力される整数部Nの値を受け取って、第1の演算処
理手段11により求められた中間演算値Wj に対して2
N のシフト演算を行うためのものである。また、累積加
算器10は、上記シフタ9で求められた各サブバンド毎
のシフト演算値を全て加算して波形情報Vi を求めるた
めのものである。
トローラ13は、以上のような逆量子化・シンセサイザ
合成ユニット4での一連の演算処理を制御するためのも
のである。また、出力ユニット14は、従来の出力ユニ
ット46と同様のものであり、その内部にある出力バッ
ファメモリ15に、上記逆量子化・シンセサイザ合成ユ
ニット4における各回路によって求められた波形情報V
i が格納される。そして、この出力バッファメモリ15
に格納された波形情報Vi は、出力コントローラ16の
制御に従って、図示しないポリフェーズフィルタに供給
される。
る音声信号デコーダの動作を、図1の構成図および図2
のフローチャートを参照しながら説明する。図2におい
て、まずステップP1で、分解抽出回路1aにより、圧
縮音声信号のデータストリームDs から量子化レベル
(Allocation)、スケールファクタ(SF)および量子化
データ(Sample)が抽出され、それぞれ入力バッファメ
モリ2の所定領域2a,2b,2cに格納される。
された量子化レベル(Allocation)および量子化データ
(Sample)の各データは、逆量子化処理ユニット6に供
給され、スケールファクタ(SF)は、整数・分数分離処
理部5に供給される。
ット6により、上記量子化データ(Sample)が量子化レ
ベル(Allocation)によって逆量子化され、演算値Samp
le-Valueが求められる。そして、こうして求められた演
算値Sample-Valueは、乗算器7に与えられる。
ールファクタ(SF)の値によって特定される21-SF/3の
指数が整数部Nと分数部nとに分けられる。そして、分
数部nの値はテーブルROM8に与えられ、その値に応
じてテーブルROM8から対応する2n cos(k)の値が読
み出されて乗算器7に供給される。これにより、乗算器
7では、上記逆量子化処理ユニット6から与えられる演
算値Sample-Valueと、テーブルROM8から与えられる
2n cos(k)の値とが乗ぜられ、中間演算値Wjが求めら
れる。
より、上記逆量子化処理ユニット6および乗算器7によ
って求められた中間演算値Wj が、整数・分数分離処理
部5から与えられる整数部Nの値に基づいて2N 分だけ
シフトされる。次に、これによって得られるサブバンド
毎のシフト演算値が累積加算器10で全て加算されて、
波形情報Vi が求められる。
て求められた波形情報Vi が、図示しないサブバンドフ
ィルタにおけるアップ・サンプリング処理に用いるため
に、出力バッファメモリ15に格納される。
音声信号デコーダでは、従来は別々に行われていた逆量
子化演算とシンセサイザ合成演算とを、一定の規定に従
って統合して行うようにしたので、従来のように、シン
セサイザ合成を行う回路の前段に、図3の構成図に示し
たような第1のバッファメモリ39を設ける必要がな
い。
デコーダでは、6144ビットの記憶容量を持つ第1の
バッファメモリ39が必要であったのに対し、本実施例
のMPEG規格の音声信号デコーダでは、このような記
憶容量を持つバッファメモリを設ける必要がない。
デコーダでは、逆量子化・シンセサイザ合成ユニット4
の前段に、量子化レベル(Allocation)、スケールファ
クタ(SF)および量子化データ(Sample)の各データを
格納するための入力バッファメモリ2を設けることが必
要となるが、その記憶容量は約1300ビット程度で足
りる。したがって、本実施例においては、バッファメモ
リの記憶容量を従来の約20%にまで少なくすることが
できる。
される統一演算式に基づく演算処理を(式10)のよう
に整数部Nに関する演算処理と分数部nに関する演算処
理とに分けて行うようにしている。したがって、分数部
nに関しては乗算に基づく演算を行い、整数部Nに関し
てはシフト演算を行うだけで波形情報Vi を求めること
ができる。
も演算負荷が小さいので、本実施例によれば、演算負荷
が大きい乗算を2回にわたって行わなければならなかっ
た従来技術に比べて、復号に際しての演算負荷を著しく
小さくすることができる。
の場合のように、予め計算しておいた複雑な乗数をテー
ブル情報として用意しておく必要がないので、シフト演
算用のテーブルROMを別個に設けなくても済む。した
がって、上述したように、ROMの使用数を従来の2個
から1個に減らすことができ、ハード構成を簡単にする
ことができる。
1に基づくものであるが、本発明はレイヤ2やレイヤ3
にも適用できることは言うまでもない。例えば、レイヤ
2,チャンネル数2(デュアルチャンネルまたはステレ
オ),伝送レート384Kbit/sec ,サンプリングレート48
KHz の場合を考える。
あるが、処理単位である1フレーム当りの音声サンプル
数を多くして圧縮効率を向上させたとことに違いがあ
る。すなわち、レイヤ2のサンプル数はレイヤ1の3倍
であり、1152サンプルである。したがって、従来の
MPEG規格の音声信号デコーダでは、図3中の第1の
バッファメモリ39には、36864ビット(=115
2サンプル×2チャンネル×16ビット)の記憶容量が
必要となる。
(Allocation)は1フレーム当りで384ビット(=3
×32サブバンド×4ビット)、スケールファクタ(S
F)は576ビット(=3×32サブバンド×6ビッ
ト)、量子化データ(Sample)は9216ビット(=
(384K/48K)×1152)である。
声信号デコーダにおいては、上述の各データが格納され
る入力バッファメモリ2としては、合計で10176ビ
ットの記憶容量を用意するだけでよい。このため、本実
施例によれば、バッファメモリの記憶容量を従来の約2
7.6%にまで少なくすることができる。
のデータストリームからシンセサイザ合成情報を得るに
至るまでの各演算式を1つの式に統合して変形し、この
統一演算式に基づいて、逆量子化処理とシンセサイザ合
成処理とを統一的に行うようにしたので、上記逆量子化
処理とシンセサイザ合成処理とを1つの演算処理回路群
内で行うことができるようになり、従来は逆量子化処理
を行う回路とシンセサイザ合成処理を行う回路との間に
設けることが必要であったバッファメモリをなくすこと
ができ、復号を行うために必要なメモリ容量を大幅に少
なくすることができる。
算式に基づく演算処理を、整数部に関する演算処理と分
数部に関する演算処理とに分けて行うようにしたので、
1回の乗算と1回のシフト演算とによってシンセサイザ
合成情報を求めることができるようになり、従来は2回
にわたって行っていた乗算の一方をシフト演算に置き換
えることで復号を行う際の演算負荷を著しく小さくする
ことができ、復号のための処理時間を短くすることがで
きる。さらに、上述のように、乗算を行う回数を少なく
することができるので、乗算に利用される複雑な乗数を
テーブル情報として予め記憶しておくためのメモリ手段
の個数を少なくすることができ、装置の構成を大幅に簡
略化することができる。
部を示す概略構成図である。
ーチャートである。
図である。
ャートである。
Claims (2)
- 【請求項1】 MPEG規格の圧縮音声信号を逆量子化
処理およびシンセサイザ合成処理を行って復号するよう
にした音声信号デコーダにおいて、 上記圧縮音声信号のデータストリームから量子化レベル
データ、スケールファクタデータおよび量子化データの
各データを抽出するデータ抽出手段と、 上記データ抽出手段により抽出された各データを、上記
逆量子化処理およびシンセサイザ合成処理を行うための
各演算式をまとめて変形した統一演算式を用いて処理す
る逆量子化・シンセサイザ合成手段とを設け、 上記逆量子化処理とシンセサイザ合成処理とを統合して
行うようにしたことを特徴とするMPEG規格の音声信
号デコーダ。 - 【請求項2】 上記逆量子化・シンセサイザ合成手段
は、上記スケールファクタの値によって特定される演算
値の指数を整数部と分数部とに分ける整数・分数分離処
理手段と、 上記整数・分数分離処理手段により分離された分数部の
値に応じてメモリ手段から読み出されるテーブル情報を
用いて、上記量子化レベルおよび量子化データに対して
乗算に基づく演算処理を施す第1の演算処理手段と、 上記整数・分数分離処理手段により分離された整数部の
値を用いて、上記第1の演算処理手段により求められた
演算値に対してシフト演算に基づく演算処理を施す第2
の演算処理手段とにより構成され、 上記第1の演算処理手段と第2の演算処理手段とによ
り、上記統一演算式に基づく演算処理が行われるように
なされていることを特徴とする請求項1記載のMPEG
規格の音声信号デコーダ。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9815694A JP3190204B2 (ja) | 1994-04-12 | 1994-04-12 | Mpeg規格の音声信号デコーダ |
US08/420,156 US5675703A (en) | 1994-04-12 | 1995-04-11 | Apparatus for decoding compressed and coded sound signal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9815694A JP3190204B2 (ja) | 1994-04-12 | 1994-04-12 | Mpeg規格の音声信号デコーダ |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07281697A JPH07281697A (ja) | 1995-10-27 |
JP3190204B2 true JP3190204B2 (ja) | 2001-07-23 |
Family
ID=14212285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9815694A Expired - Lifetime JP3190204B2 (ja) | 1994-04-12 | 1994-04-12 | Mpeg規格の音声信号デコーダ |
Country Status (2)
Country | Link |
---|---|
US (1) | US5675703A (ja) |
JP (1) | JP3190204B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3501246B2 (ja) | 1995-04-21 | 2004-03-02 | ユナイテッド・モジュール・コーポレーション | Mpegオーディオデコーダ |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9606680D0 (en) * | 1996-03-29 | 1996-06-05 | Philips Electronics Nv | Compressed audio signal processing |
US5893066A (en) * | 1996-10-15 | 1999-04-06 | Samsung Electronics Co. Ltd. | Fast requantization apparatus and method for MPEG audio decoding |
KR100300887B1 (ko) * | 1999-02-24 | 2001-09-26 | 유수근 | 디지털 오디오 데이터의 역방향 디코딩 방법 |
US6981060B2 (en) * | 2000-12-14 | 2005-12-27 | Telefonaktiebolaget L M Ericsson (Publ) | Compression based on channel characteristics |
US7302628B2 (en) | 2000-12-14 | 2007-11-27 | Telefonaktiebolaget L M Ericsson (Publ) | Data compression with incremental redundancy |
US6917913B2 (en) * | 2001-03-12 | 2005-07-12 | Motorola, Inc. | Digital filter for sub-band synthesis |
KR100571824B1 (ko) * | 2003-11-26 | 2006-04-17 | 삼성전자주식회사 | 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치 |
KR100668299B1 (ko) | 2004-05-12 | 2007-01-12 | 삼성전자주식회사 | 구간별 선형양자화를 이용한 디지털 신호 부호화/복호화방법 및 장치 |
WO2013042884A1 (ko) * | 2011-09-19 | 2013-03-28 | 엘지전자 주식회사 | 영상 부호화/복호화 방법 및 그 장치 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05218771A (ja) * | 1992-02-07 | 1993-08-27 | Matsushita Electric Ind Co Ltd | サブバンド符号化信号再生装置 |
JP3127600B2 (ja) * | 1992-09-11 | 2001-01-29 | ソニー株式会社 | ディジタル信号復号化装置及び方法 |
KR950008637B1 (ko) * | 1993-04-08 | 1995-08-03 | 삼성전자주식회사 | 부밴드 코딩시스템의 신호처리장치 |
US5508949A (en) * | 1993-12-29 | 1996-04-16 | Hewlett-Packard Company | Fast subband filtering in digital signal coding |
-
1994
- 1994-04-12 JP JP9815694A patent/JP3190204B2/ja not_active Expired - Lifetime
-
1995
- 1995-04-11 US US08/420,156 patent/US5675703A/en not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3501246B2 (ja) | 1995-04-21 | 2004-03-02 | ユナイテッド・モジュール・コーポレーション | Mpegオーディオデコーダ |
Also Published As
Publication number | Publication date |
---|---|
JPH07281697A (ja) | 1995-10-27 |
US5675703A (en) | 1997-10-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2308045B1 (en) | Compression of audio scale-factors by two-dimensional transformation | |
JP3321971B2 (ja) | 音声信号処理方法 | |
US20050171785A1 (en) | Audio decoding device, decoding method, and program | |
JPH07210196A (ja) | ディジタル信号符号化/復号化装置及び方法 | |
JP2001521648A (ja) | スペクトル帯域複製を用いた原始コーディングの強化 | |
JP3190204B2 (ja) | Mpeg規格の音声信号デコーダ | |
US20030004713A1 (en) | Signal processing apparatus and method, signal coding apparatus and method , and signal decoding apparatus and method | |
WO2006051446A2 (en) | Method of signal encoding | |
EP0693829A1 (en) | Method and device for encoding information and method and device for decoding information | |
US7096240B1 (en) | Channel coupling for an AC-3 encoder | |
EP1259956A1 (en) | Method of and apparatus for converting an audio signal between data compression formats | |
JP3254953B2 (ja) | 音声高能率符号化装置 | |
JP2891193B2 (ja) | 広帯域音声スペクトル係数量子化装置 | |
JPH07168593A (ja) | 信号符号化方法及び装置、信号復号化方法及び装置、並びに信号記録媒体 | |
KR100712409B1 (ko) | 벡터의 차원변환 방법 | |
JP3593201B2 (ja) | オーディオ復号装置 | |
KR100287861B1 (ko) | 디지탈 오디오 스테레오 모드에서의 각 채널 비균등 비트할당 장치 및 방법 | |
JP4618823B2 (ja) | 信号符号化装置及び方法 | |
JPH08102677A (ja) | Mpeg規格の音声信号デコーダ | |
JP3501246B2 (ja) | Mpegオーディオデコーダ | |
JPH07273656A (ja) | 信号処理方法及び装置 | |
JP3417437B2 (ja) | Mpegオーディオデコーダ | |
JP4081994B2 (ja) | ディジタルオーディオデコーダ | |
JPH11195995A (ja) | 画像音声圧縮伸長装置 | |
JPH08237209A (ja) | ディジタルオーディオ信号処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090518 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100518 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110518 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120518 Year of fee payment: 11 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120518 Year of fee payment: 11 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130518 Year of fee payment: 12 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |