JP3190204B2 - Mpeg規格の音声信号デコーダ - Google Patents

Mpeg規格の音声信号デコーダ

Info

Publication number
JP3190204B2
JP3190204B2 JP9815694A JP9815694A JP3190204B2 JP 3190204 B2 JP3190204 B2 JP 3190204B2 JP 9815694 A JP9815694 A JP 9815694A JP 9815694 A JP9815694 A JP 9815694A JP 3190204 B2 JP3190204 B2 JP 3190204B2
Authority
JP
Japan
Prior art keywords
value
audio signal
data
processing
inverse quantization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP9815694A
Other languages
English (en)
Other versions
JPH07281697A (ja
Inventor
弥章 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
United Module Corp
Original Assignee
United Module Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by United Module Corp filed Critical United Module Corp
Priority to JP9815694A priority Critical patent/JP3190204B2/ja
Priority to US08/420,156 priority patent/US5675703A/en
Publication of JPH07281697A publication Critical patent/JPH07281697A/ja
Application granted granted Critical
Publication of JP3190204B2 publication Critical patent/JP3190204B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Television Receiver Circuits (AREA)
  • Television Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、圧縮され符号化された
ディジタル音声信号を復号するための音声信号デコーダ
に関し、特に、MPEG規格の音声信号を復号するのに
用いて好適なものである。
【0002】
【従来の技術】近年、ディジタル音声信号の圧縮技術の
1つとして、MPEGと称される技術が開発されてきて
いる。このMPEGによる音声信号の圧縮技術は、IS
O/IEC(国際標準化機構/国際電気標準会議)によ
って規格化されたものであり、MPEG1とMPEG2
との両方を含む。以下、これらを合わせてMPEG規格
という。
【0003】このMPEG規格には、要求される音質や
回路規模によってレイヤ1,レイヤ2,レイヤ3の3つ
の方式が用意されている。レイヤ1とレイヤ2との主な
違いは、ディジタル化された情報についてコード化およ
びサンプリングが施されたデータを幾つごとにまとめる
かというパケットサイズの差にある。また、レイヤ3に
ついては、上記パケットサイズの他に符号化の方式も異
なっている。
【0004】また、MPEG規格においては、音声信号
のチャンネルモードとして、シングルチャンネル、デュ
アルチャンネル、ステレオ、ジョイントステレオなどの
各モードが規定されている。これらの各モードの違い
は、音源が1つ、2つまたはステレオの何れであるかと
いうことと、高音域におけるステレオ音声の符号化の仕
方との差異によるものである。
【0005】さらに、MPEG規格では、各レイヤの各
チャンネルモードごとに使用可能な伝送レートが規定さ
れている。例えば、レイヤ1のシングルチャンネルにお
いては、32K, 64K, 96K, 128K, 160Kbit/secなどの値が
定義されている。この伝送レートの違いは、圧縮後のデ
ータ量に影響を及ぼす。また、再生後の音声信号の出力
レート(サンプリングレート)として、32K, 44.1K, 48
KHz の3種類のレートが規定されている。
【0006】以下に、MPEG規格で採用されている音
声信号の圧縮および復号の原理を、レイヤ1,シングル
チャンネル,伝送レート128Kbit/sec ,サンプリングレ
ート48KHz の下で1フレームの音声信号を圧縮および復
号する場合を例にとって説明する。
【0007】まず、384サンプル単位でなる1フレー
ム分のディジタル音声信号は、サブバンドフィルタによ
り32のサブバンドに分割され、各サブバンド毎に12
サンプルの値を得る。そして、この各サブバンドの最大
振幅からスケールファクタ(SF)が求められ、各データ
はそのサブバンドのスケールファクタ(SF)により正規
化される。また、伝送レート、サンプリングレートから
上記1フレーム当りのビット量が計算される。
【0008】また、人の聴覚心理学モデルによる最小下
限聴特性やマスキング特性(前者は人の聴覚が低周波や
高周波の領域ではあまり敏感でないという特性、後者は
ある周波数スペクトルのピーク近傍の周波数では聴感度
が低下するという特性)に基づいて、上記1フレームの
ビット量と合致するよう量子化レベル(Allocation)が
各サブバンドごとに設定される。
【0009】次に、こうして設定された量子化レベル
(Allocation)に従って、上記正規化された各サブバン
ド毎のサンプルが量子化および符号化され、量子化デー
タ(Sample)が求められる。そして、この量子化データ
(Sample)は、上述のスケールファクタ(SF)および量
子化レベル(Allocation)とともに1つのデータストリ
ームにされて、圧縮音声信号が生成される。
【0010】ここで、上述の量子化レベル(Allocatio
n)は、復号時において逆量子化演算を行うときに用い
られるデータであり、1つのサブバンド中に含まれる各
サンプルに何ビットが割り当てられているかを表すもの
である。なお、この量子化レベル(Allocation)は、レ
イヤ1においては、1フレーム中の1サブバンド単位に
4ビットが与えられている。したがって、1フレーム当
りでは128ビット(=32サブバンド×4ビット)と
なる。
【0011】また、スケールファクタ(SF)は、復号時
において逆スケーリング演算を行うときに用いられるデ
ータであり、おおよその出力レベルを与えるものであ
る。例えば、電子計算機で使用する浮動小数点数の指数
部に相当する。なお、このスケールファクタ(SF)は、
レイヤ1においては、量子化データ(Sample)の値が0
の場合は省略されるが、省略されない場合は1フレーム
中の1サブバンド単位に6ビットが与えられている。し
たがって、1フレーム当りでは192ビット程度(=3
2サブバンド×6ビット)となる。
【0012】さらに、量子化データ(Sample)は、復号
時における逆量子化演算に用いられるデータであり、出
力データの細かい値を与えるものである。例えば、電子
計算機で使用する浮動小数点数の仮数部に相当する。な
お、この量子化データ(Sample)は、1フレームごとに
上記量子化レベル(Allocation)で指定したビット数の
データが与えられており、レイヤ1においては1Kビッ
ト程度である。
【0013】一方、以上のようにして圧縮されたデータ
の復号は、この圧縮とは逆の操作によって行われる。す
なわち、まず、対象となる圧縮音声信号のデータストリ
ームが分解されて、そこから量子化レベル(Allocatio
n)、スケールファクタ(SF)および量子化データ(Sam
ple)が抽出される。そして、抽出された量子化データ
(Sample)が量子化レベル(Allocation)によって逆量
子化されるとともに、スケールファクタ(SF)によって
逆スケーリング処理が施されて、サブバンド情報が求め
られる。
【0014】次に、この逆量子化演算等により得られた
サブバンド情報に対して、シンセサイザ合成の処理が施
される。その後、ポリフェーズフィルタにより所定の処
理が施された後、前後16の波形が合成されて復号音声
信号として出力される。
【0015】図3は、上述のようにして圧縮音声信号の
復号を行うための従来の音声信号デコーダの一部を示す
概略的な構成図である。また、図4は、この音声信号デ
コーダの動作を示すフローチャートである。
【0016】図3に示す音声信号デコーダにおいて、3
1は入力ユニットであり、その内部に設けられている分
解抽出回路31aによって、入力される圧縮音声信号の
データストリームDS から量子化レベル(Allocatio
n)、スケールファクタ(SF)および量子化データ(Sam
ple)を分解して抽出する。なお、このような処理は、
入力コントローラ32の制御に従って行われる。
【0017】次いで、33は逆量子化ユニットであり、
逆量子化コントローラ37の制御に従って、以下のよう
な処理を行うものである。すなわち、逆量子化ユニット
33は、その内部に設けられている逆量子化処理ユニッ
ト34および第1の乗算器35により、逆量子化および
逆スケーリングの各処理を行う。
【0018】ここで、上記逆量子化処理ユニット34
は、上記抽出した量子化レベル(Allocation)を用い
て、量子化データ(Sample)に対して(式1)に示すよ
うな逆量子化演算を施すことにより、演算値Sample-Val
ueを求める。
【0019】
【数1】
【0020】また、第1の乗算器35は、上述のスケー
ルファクタ(SF)を用いて、逆量子化処理ユニット34
により求められた演算値Sample-Valueに21-SF/3の値を
乗ずることにより、サブバンド情報Sj (jは0〜31
の値で、32個のサブバンド番号を示す)を求める。
【0021】このとき、上記21-SF/3の値としては、第
1のテーブルROM36にテーブル情報として予め記憶
されている値SF-TBL(Scale-Factor)が用いられる。な
お、このテーブル情報SF-TBL(Scale-Factor)は、与えら
れるスケールファクタ(SF)に基づいて21-SF/3を実際
に計算した値と比較して丸め誤差の範囲でしか異ならな
い。したがって、MPEG−Audio規格では、数値
テーブルで値が与えられている。
【0022】なお、上述したように、スケールファクタ
(SF)は6ビットで構成されているので、その値には0
〜63(ただし、有効な値は0〜62であり、63はエ
ラーとなる)の整数が用いられる。このため、上記第1
のテーブルROM36には、少なくとも63ワード分の
記憶容量が必要となる。
【0023】次いで、38はバッファメモリユニットで
あり、その内部にある第1のバッファメモリ(RAM)
39に、上記逆量子化ユニット33で求められたサブバ
ンド情報Sj が格納される。そして、この第1のバッフ
ァメモリ39に格納されたサブバンド情報Sj は、次段
においてシンセサイザ合成を行う際に使用される。
【0024】ところで、逆量子化演算の演算精度を一定
以上に保つためには、演算によって得られるサブバンド
情報Sj には16ビット程度のビット数が必要である。
したがって、上記第1のバッファメモリ39には、少な
くとも6144ビット(=32サブバンド×12サンプ
ル×16ビット)の記憶容量が必要となる。
【0025】上記第1のバッファメモリ39に格納され
たサブバンド情報Sj は、バッファメモリコントローラ
40の制御に従って、次段のシンセサイザ合成ユニット
41に供給される。このシンセサイザ合成ユニット41
には、第2の乗算器42と累積加算器43と第2のテー
ブルROM44とが備えられており、これらによって各
サブバンドの周波数と、対象となる時刻の位相とから波
形情報Vi が求められるようになされている。
【0026】具体的には、まず、第2の乗算器42によ
り、上記第1のバッファメモリ39から供給されるサブ
バンド情報Sj に、cos((16+i)×(2j+1)π/64)の値が乗
ぜられる。このようなcos((16+i)×(2j+1)π/64)の値
は、上記第2のテーブルROM44にテーブル情報とし
て予め記憶されているものが用いられる。なお、上記式
中のi は時間軸方向のパラメータ(サンプル番号)であ
り、0〜63の値をとる。また、j は周波数軸方向のパ
ラメータ(サブバンド番号)であり、0〜31の値をと
る。
【0027】次に、累積加算器43により、上記第2の
乗算器42で求められた各サブバンド毎の乗算値が全て
加算されて波形情報Vi が求められる。なお、このよう
なシンセサイザ合成ユニット41での一連の演算処理
は、シンセサイザ合成コントローラ45による制御に従
って行われる。
【0028】ここで、上記コサイン関数値が記憶されて
いる第2のテーブルROM44の記憶容量について考え
る。コサイン関数は、(式2)に示すような周期性をそ
の特徴の1つとして持っているため、上記コサイン関数
値を表す式中の(16+i)×(2j+1)の値は、0〜127の1
28個を用意すればよい。 cos(x)=cos(2πn+x) :nは整数 …(式2)
【0029】また、コサイン関数は、(式3)および
(式4)に示すような対称性をもその特徴の1つとして
持っているため、上記(16+i)×(2j+1)の値は、0〜12
7の範囲の1/4倍、すなわち0〜31の32個を用意
すればよいことになる。 cos(x)=cos(2π−x) :x=π〜 2π …(式3) cos(x)= −cos(π−x) :x=π/2〜π …(式4)
【0030】このため、cos((16+i)×(2j+1)π/64)なる
式に対して、(16+i)×(2j+1)の値を0〜31の32個用
意することが必要であるので、第2のテーブルROM4
4としては、少なくとも32ワード分の記憶容量が必要
となる。
【0031】次いで、46は出力ユニットであり、その
内部にある第2のバッファメモリ47に、上記シンセサ
イザ合成ユニット41にて求められた波形情報Vi が格
納される。なお、この第2のバッファメモリ47の記憶
容量は、1サンプル当りで1024ビット(=64×1
6ビット)である。
【0032】次に、以上のように構成した音声信号デコ
ーダの動作を、図3の構成図および図4のフローチャー
トとともに説明する。図4において、まずステップP1
で、分解抽出回路31aによって、圧縮音声信号のデー
タストリームDs から量子化レベル(Allocation)、ス
ケールファクタ(SF)および量子化データ(Sample)が
各々抽出される。
【0033】こうして抽出された量子化レベル(Alloca
tion)および量子化データ(Sample)は、逆量子化処理
ユニット34に供給される。また、スケールファクタ
(SF)は、第1のテーブルROM36に供給される。
【0034】次に、ステップP2で、逆量子化処理ユニ
ット34により上記量子化レベル(Allocation)に従っ
て量子化データ(Sample)が逆量子化され、演算値Samp
le-Valueが求められる。こうして求められた演算値Samp
le-Valueは、第1の乗算器35に与えられる。そして、
この演算値Sample-Valueに対して、スケールファクタ
(SF)の値に応じて第1のテーブルROM36から読み
出されるSF-TBL(Scale-Factor)の値が乗ぜられることに
より、サブバンド情報Sj が求められる。
【0035】こうして求められたサブバンド情報S
j は、ステップP3で第1のバッファメモリ39に一時
格納される。次のステップP4では、第2の乗算器42
により、上記第1のバッファメモリ39から供給される
サブバンド情報Sj にcos((16+i)×(2j+1)π/64)の値が
乗ぜられる。また、これによって得られるサブバンド毎
の乗算値が累積加算器43で全て加算されて、波形情報
i が求められる。
【0036】そして、ステップP5で、以上のようにし
て求められた波形情報Vi が第2のバッファメモリ47
に格納される。この第2のバッファメモリ47に格納さ
れた波形情報Vi は、その後、図示しないサブバンドフ
ィルタにおけるアップ・サンプリング処理で用いるため
に、出力コントローラ48の制御に従って上記サブバン
ドフィルタに出力される。
【0037】
【発明が解決しようとする課題】上述したように、従来
におけるMPEG規格の音声信号デコーダでは、圧縮音
声信号のデータストリームからシンセサイザ合成情報を
得るまでの処理過程において、大容量のメモリを必要と
していた。
【0038】つまり、従来のMPEG規格の音声信号デ
コーダは、逆量子化ユニット33とシンセサイザ合成ユ
ニット41とを別個に持っていたため、逆量子化ユニッ
ト33で求めたサブバンド情報Sj をシンセサイザ合成
ユニット41で使用するために、両者の間に第1のバッ
ファメモリ39を設けることが必要であった。
【0039】また、逆量子化ユニット33とシンセサイ
ザ合成ユニット41との両方の中にそれぞれの乗算処理
に必要な乗数を予め記憶しておくためのテーブルROM
を設けることが必要であった。このため、メモリの使用
数および容量がともに多くなってしまい、装置のハード
構成が複雑になってしまうという問題があった。
【0040】さらに、シンセサイザ合成情報を得るまで
に、逆量子化ユニット33とシンセサイザ合成ユニット
41とのそれぞれにおいて、演算負荷が大きい乗算処理
を2回にわたって行わなくてはならいため、全体として
の演算負荷が非常に大きくなり、処理時間が長くなると
いう問題もあった。
【0041】本発明は、このような問題を解決するため
に成されたものであり、メモリの使用数および容量を少
なくすることができるようにするとともに、演算負荷を
小さくすることができるようにすることを目的としてい
る。
【0042】
【課題を解決するための手段】本発明のMPEG規格の
音声信号デコーダは、MPEG規格の圧縮音声信号を逆
量子化処理およびシンセサイザ合成処理を行って復号す
るようにした音声信号デコーダにおいて、上記圧縮音声
信号のデータストリームから量子化レベルデータ、スケ
ールファクタデータおよび量子化データの各データを抽
出するデータ抽出手段と、上記データ抽出手段により抽
出された各データを、上記逆量子化処理およびシンセサ
イザ合成処理を行うための各演算式をまとめて変形した
統一演算式を用いて処理する逆量子化・シンセサイザ合
成手段とを設け、上記逆量子化処理とシンセサイザ合成
処理とを統合して行うようにしたものである。
【0043】また、本発明の他の特徴とするところは、
上記スケールファクタの値によって特定される演算値の
指数を整数部と分数部とに分ける整数・分数分離処理手
段と、上記整数・分数分離処理手段により分離された分
数部の値に応じてメモリ手段から読み出されるテーブル
情報を用いて、上記量子化レベルおよび量子化データに
対して乗算に基づく演算処理を施す第1の演算処理手段
と、上記整数・分数分離処理手段により分離された整数
部の値を用いて、上記第1の演算処理手段により求めら
れた演算値に対してシフト演算に基づく演算処理を施す
第2の演算処理手段とにより上記逆量子化・シンセサイ
ザ合成手段を構成し、上記第1の演算処理手段と第2の
演算処理手段とにより、上記統一演算式に基づく演算処
理を行うようにしたものである。
【0044】
【作用】本発明は上記技術手段より成るので、従来は別
々に行われていた逆量子化処理とシンセサイザ合成処理
とが1つの演算処理回路群内で行われるようになり、従
来のように、逆量子化処理を行う回路とシンセサイザ合
成処理を行う回路との間に、逆量子化処理により得られ
るデータを格納するためのバッファメモリを設けなくて
も済む。
【0045】また、本発明の他の特徴によれば、統一演
算式に基づく演算処理が、整数部に関する演算処理と分
数部に関する演算処理とに分けられて行われるようにな
り、整数部に関する演算処理については、与えられる情
報を乗算ではなくシフト演算によって処理することがで
きるようになるので、シンセサイザ合成情報を得るまで
に演算負荷が大きい乗算を行う回数を従来よりも少なく
することが可能となるとともに、乗算に利用される複雑
な乗数をテーブル情報として予め記憶しておくためのメ
モリ手段の使用数を少なくすることが可能となる。
【0046】
【実施例】以下、本発明の一実施例を図面に基づいて説
明する。図1は、本実施例の音声信号デコーダの一部を
示す概略的な構成図である。また、図2は、この音声信
号デコーダの動作を示すフローチャートである。
【0047】図1において、1は入力バッファユニット
であり、分解抽出回路1aと入力バッファメモリ2とを
備えている。分解抽出回路1aは、入力される圧縮音声
信号のデータストリームDs から量子化レベル(Alloca
tion)、スケールファクタ(SF)および量子化データ
(Sample)を分解して抽出する。
【0048】上記分解抽出回路1aにより抽出された各
データは、入力バッファメモリ2の所定領域、すなわ
ち、Allocationの記憶領域2a、Scale Factorの記憶領
域2b、Sampleの記憶領域2cにそれぞれ格納される。
なお、以上のような入力バッファユニット1における処
理は、入力バッファコントローラ3の制御に従って行わ
れる。
【0049】なお、従来技術のところで述べたように、
レイヤ1,シングルチャンネル,伝送レート128Kbit/se
c ,サンプリングレート48KHz の下では、量子化レベル
(Allocation)は1フレーム当りで128ビット、スケ
ールファクタ(SF)は192ビット、量子化データ(Sa
mple)は約1Kビット程度のデータ量を持っている。し
たがって、これらの各データが格納される入力バッファ
メモリ2には、合計で約1300ビットの記憶容量が必
要である。
【0050】次いで、4は逆量子化・シンセサイザ合成
ユニットであり、その内部にある各回路で逆量子化およ
びシンセサイザ合成の各処理を行って、波形情報Vi
求める。すなわち、本実施例では、この逆量子化・シン
セサイザ合成ユニット4を用いて、従来は別々に行われ
ていた逆量子化処理とシンセサイザ合成処理とを統合し
て行うことにより、バッファメモリの容量の低減、演算
負荷の低減、テーブルROMの使用数の低減を図ってい
る。
【0051】以下、この逆量子化演算とシンセサイザ合
成演算とを統合する原理について述べる。従来は、まず
(式5)に示すような逆量子化演算を行うことによって
サブバンド情報Sj を求め、更にこのサブバンド情報S
j を用いて(式6)に示すようなシンセサイザ合成演算
を行うことによって波形情報Vi を求めていた。
【0052】
【数2】
【0053】これに対して、(式5)と(式6)をまと
めて1つの式にすると、(式7)のようになる。ただ
し、簡略化のため、k=(16+i)×(2j+1)π/64 としてい
る。
【0054】
【数3】
【0055】ここで、(式7)中において指数を表す
「1-SF/3」の値を整数部Nと分数部nとに分離すると、 N+n=1-SF/3 …(式8) が成り立つ。なお、上述したように、スケールファクタ
(SF)がとり得る値は0〜63であるから、N,nがと
り得る値の範囲は、それぞれN=−20〜1、n=0,
1/3,2/3となる。さらに、(式8)を(式7)に
代入して変形すると(式9)が得られる。
【0056】
【数4】
【0057】そして、本実施例の逆量子化・シンセサイ
ザ合成ユニット4では、この(式9)で示される演算
を、(式10)のように分数部nに関する演算と整数部
Nに関する演算との2つに分けて処理するようにしてい
る。すなわち、本実施例では、整数・分数分離処理部5
によって上記「1-SF/3」の値を整数部Nと分数部nとに
分け、分数部nの値に応じて第1の演算処理手段11に
よってまず中間演算値Wj を求める。さらに、この中間
演算値Wj を用いて、整数部Nの値に応じて第2の演算
処理手段12によって波形情報Vi を求めるようにして
いる。
【0058】
【数5】
【0059】上記第1の演算処理手段11の構成のう
ち、逆量子化処理ユニット6は、入力バッファメモリ2
から供給される量子化レベル(Allocation)を用いて、
量子化データ(Sample)に対して(式1)に示したよう
な逆量子化演算を施すことにより、演算値Sample-Value
を求めるためのものである。
【0060】また、乗算器7は、逆量子化処理ユニット
6により求められた演算値Sample-Valueに対して2n co
s(k)(ただし、k=(16+i)×(2j+1)π/64 :i= 0〜63, j=
0〜31)の値を乗じて中間演算値Wj を求めるためのも
のである。さらに、テーブルROM8は、i,j,nの値に
応じて予め計算した2n cos(k)の値をテーブル情報とし
て記憶しておくためのものである。このテーブルROM
8に整数・分数分離処理部5から分数部nの値が与えら
れると、その値に対応する2n cos(k)の値が各サブバン
ド毎に出力されて乗算器7に供給されるようになされて
いる。
【0061】ここで、この2n cos(k)の値が記憶されて
いるテーブルROM8の記憶容量について考える。ま
ず、cos(k)の係数であるk=(16+i)×(2j+1)π/64 に関し
ては、従来例のところで述べたように、0〜31の32
個の値を用意すればよい。一方、2n の指数に関して
は、n=0,1/3,2/3の3つの値が必要である。
したがって、2n cos(k)の全体としては、96(=32
×3)個の値が必要であり、テーブルROM8として
は、96ワード分の記憶容量が必要となる。
【0062】これに対し、従来の音声信号デコーダで
は、第1のテーブルROM36の記憶容量は63ワード
であり、第2のテーブルROM44の記憶容量は32ワ
ードである。したがって、全体としての記憶容量は95
(=63+32)ワードであり、本実施例の場合よりわ
ずかに少ない。しかし、本実施例では、ROMの使用数
が1個でよいので、装置のハード構成を簡単にすること
ができるという利点がある。
【0063】次いで、上記第2の演算処理手段12の構
成のうち、シフタ9は、上記整数・分数分離処理部5か
ら出力される整数部Nの値を受け取って、第1の演算処
理手段11により求められた中間演算値Wj に対して2
N のシフト演算を行うためのものである。また、累積加
算器10は、上記シフタ9で求められた各サブバンド毎
のシフト演算値を全て加算して波形情報Vi を求めるた
めのものである。
【0064】次いで、逆量子化・シンセサイザ合成コン
トローラ13は、以上のような逆量子化・シンセサイザ
合成ユニット4での一連の演算処理を制御するためのも
のである。また、出力ユニット14は、従来の出力ユニ
ット46と同様のものであり、その内部にある出力バッ
ファメモリ15に、上記逆量子化・シンセサイザ合成ユ
ニット4における各回路によって求められた波形情報V
i が格納される。そして、この出力バッファメモリ15
に格納された波形情報Vi は、出力コントローラ16の
制御に従って、図示しないポリフェーズフィルタに供給
される。
【0065】次に、以上のように構成した本実施例によ
る音声信号デコーダの動作を、図1の構成図および図2
のフローチャートを参照しながら説明する。図2におい
て、まずステップP1で、分解抽出回路1aにより、圧
縮音声信号のデータストリームDs から量子化レベル
(Allocation)、スケールファクタ(SF)および量子化
データ(Sample)が抽出され、それぞれ入力バッファメ
モリ2の所定領域2a,2b,2cに格納される。
【0066】そして、この入力バッファメモリ2に格納
された量子化レベル(Allocation)および量子化データ
(Sample)の各データは、逆量子化処理ユニット6に供
給され、スケールファクタ(SF)は、整数・分数分離処
理部5に供給される。
【0067】次に、ステップP2で、逆量子化処理ユニ
ット6により、上記量子化データ(Sample)が量子化レ
ベル(Allocation)によって逆量子化され、演算値Samp
le-Valueが求められる。そして、こうして求められた演
算値Sample-Valueは、乗算器7に与えられる。
【0068】一方、整数・分数分離処理部5では、スケ
ールファクタ(SF)の値によって特定される21-SF/3
指数が整数部Nと分数部nとに分けられる。そして、分
数部nの値はテーブルROM8に与えられ、その値に応
じてテーブルROM8から対応する2n cos(k)の値が読
み出されて乗算器7に供給される。これにより、乗算器
7では、上記逆量子化処理ユニット6から与えられる演
算値Sample-Valueと、テーブルROM8から与えられる
n cos(k)の値とが乗ぜられ、中間演算値Wjが求めら
れる。
【0069】次のステップP3では、まず、シフタ9に
より、上記逆量子化処理ユニット6および乗算器7によ
って求められた中間演算値Wj が、整数・分数分離処理
部5から与えられる整数部Nの値に基づいて2N 分だけ
シフトされる。次に、これによって得られるサブバンド
毎のシフト演算値が累積加算器10で全て加算されて、
波形情報Vi が求められる。
【0070】そして、ステップP4で、以上のようにし
て求められた波形情報Vi が、図示しないサブバンドフ
ィルタにおけるアップ・サンプリング処理に用いるため
に、出力バッファメモリ15に格納される。
【0071】以上のように、本実施例のMPEG規格の
音声信号デコーダでは、従来は別々に行われていた逆量
子化演算とシンセサイザ合成演算とを、一定の規定に従
って統合して行うようにしたので、従来のように、シン
セサイザ合成を行う回路の前段に、図3の構成図に示し
たような第1のバッファメモリ39を設ける必要がな
い。
【0072】すなわち、従来のMPEG規格の音声信号
デコーダでは、6144ビットの記憶容量を持つ第1の
バッファメモリ39が必要であったのに対し、本実施例
のMPEG規格の音声信号デコーダでは、このような記
憶容量を持つバッファメモリを設ける必要がない。
【0073】なお、本実施例のMPEG規格の音声信号
デコーダでは、逆量子化・シンセサイザ合成ユニット4
の前段に、量子化レベル(Allocation)、スケールファ
クタ(SF)および量子化データ(Sample)の各データを
格納するための入力バッファメモリ2を設けることが必
要となるが、その記憶容量は約1300ビット程度で足
りる。したがって、本実施例においては、バッファメモ
リの記憶容量を従来の約20%にまで少なくすることが
できる。
【0074】また、本実施例においては、(式9)で示
される統一演算式に基づく演算処理を(式10)のよう
に整数部Nに関する演算処理と分数部nに関する演算処
理とに分けて行うようにしている。したがって、分数部
nに関しては乗算に基づく演算を行い、整数部Nに関し
てはシフト演算を行うだけで波形情報Vi を求めること
ができる。
【0075】周知のように、シフト演算の方が乗算より
も演算負荷が小さいので、本実施例によれば、演算負荷
が大きい乗算を2回にわたって行わなければならなかっ
た従来技術に比べて、復号に際しての演算負荷を著しく
小さくすることができる。
【0076】しかも、シフト演算を行うためには、乗算
の場合のように、予め計算しておいた複雑な乗数をテー
ブル情報として用意しておく必要がないので、シフト演
算用のテーブルROMを別個に設けなくても済む。した
がって、上述したように、ROMの使用数を従来の2個
から1個に減らすことができ、ハード構成を簡単にする
ことができる。
【0077】以上の説明は、全てMPEG規格のレイヤ
1に基づくものであるが、本発明はレイヤ2やレイヤ3
にも適用できることは言うまでもない。例えば、レイヤ
2,チャンネル数2(デュアルチャンネルまたはステレ
オ),伝送レート384Kbit/sec ,サンプリングレート48
KHz の場合を考える。
【0078】レイヤ2は、基本原理はレイヤ1と同じで
あるが、処理単位である1フレーム当りの音声サンプル
数を多くして圧縮効率を向上させたとことに違いがあ
る。すなわち、レイヤ2のサンプル数はレイヤ1の3倍
であり、1152サンプルである。したがって、従来の
MPEG規格の音声信号デコーダでは、図3中の第1の
バッファメモリ39には、36864ビット(=115
2サンプル×2チャンネル×16ビット)の記憶容量が
必要となる。
【0079】一方、レイヤ2の下では、量子化レベル
(Allocation)は1フレーム当りで384ビット(=3
×32サブバンド×4ビット)、スケールファクタ(S
F)は576ビット(=3×32サブバンド×6ビッ
ト)、量子化データ(Sample)は9216ビット(=
(384K/48K)×1152)である。
【0080】したがって、本実施例のMPEG規格の音
声信号デコーダにおいては、上述の各データが格納され
る入力バッファメモリ2としては、合計で10176ビ
ットの記憶容量を用意するだけでよい。このため、本実
施例によれば、バッファメモリの記憶容量を従来の約2
7.6%にまで少なくすることができる。
【0081】
【発明の効果】本発明は上述したように、圧縮音声信号
のデータストリームからシンセサイザ合成情報を得るに
至るまでの各演算式を1つの式に統合して変形し、この
統一演算式に基づいて、逆量子化処理とシンセサイザ合
成処理とを統一的に行うようにしたので、上記逆量子化
処理とシンセサイザ合成処理とを1つの演算処理回路群
内で行うことができるようになり、従来は逆量子化処理
を行う回路とシンセサイザ合成処理を行う回路との間に
設けることが必要であったバッファメモリをなくすこと
ができ、復号を行うために必要なメモリ容量を大幅に少
なくすることができる。
【0082】また、本発明の他の特徴によれば、統一演
算式に基づく演算処理を、整数部に関する演算処理と分
数部に関する演算処理とに分けて行うようにしたので、
1回の乗算と1回のシフト演算とによってシンセサイザ
合成情報を求めることができるようになり、従来は2回
にわたって行っていた乗算の一方をシフト演算に置き換
えることで復号を行う際の演算負荷を著しく小さくする
ことができ、復号のための処理時間を短くすることがで
きる。さらに、上述のように、乗算を行う回数を少なく
することができるので、乗算に利用される複雑な乗数を
テーブル情報として予め記憶しておくためのメモリ手段
の個数を少なくすることができ、装置の構成を大幅に簡
略化することができる。
【図面の簡単な説明】
【図1】本発明の一実施例である音声信号デコーダの一
部を示す概略構成図である。
【図2】本実施例の音声信号デコーダの動作を示すフロ
ーチャートである。
【図3】従来の音声信号デコーダの一部を示す概略構成
図である。
【図4】従来の音声信号デコーダの動作を示すフローチ
ャートである。
【符号の説明】
2 入力バッファメモリ 4 逆量子化・シンセサイザ合成ユニット 5 整数・分数分離処理部 6 逆量子化処理ユニット 7 乗算器 8 テーブルROM 9 シフタ 10 累積加算器 15 出力バッファメモリ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI H04N 7/24 H04N 7/13 Z (73)特許権者 500117842 993 Highland Circle, Los Altos,CA 94024,U. S.A. (56)参考文献 特開 平5−218771(JP,A) 特開 平1−80640(JP,A) 特開 昭63−271572(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/02

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 MPEG規格の圧縮音声信号を逆量子化
    処理およびシンセサイザ合成処理を行って復号するよう
    にした音声信号デコーダにおいて、 上記圧縮音声信号のデータストリームから量子化レベル
    データ、スケールファクタデータおよび量子化データの
    各データを抽出するデータ抽出手段と、 上記データ抽出手段により抽出された各データを、上記
    逆量子化処理およびシンセサイザ合成処理を行うための
    各演算式をまとめて変形した統一演算式を用いて処理す
    る逆量子化・シンセサイザ合成手段とを設け、 上記逆量子化処理とシンセサイザ合成処理とを統合して
    行うようにしたことを特徴とするMPEG規格の音声信
    号デコーダ。
  2. 【請求項2】 上記逆量子化・シンセサイザ合成手段
    は、上記スケールファクタの値によって特定される演算
    値の指数を整数部と分数部とに分ける整数・分数分離処
    理手段と、 上記整数・分数分離処理手段により分離された分数部の
    値に応じてメモリ手段から読み出されるテーブル情報を
    用いて、上記量子化レベルおよび量子化データに対して
    乗算に基づく演算処理を施す第1の演算処理手段と、 上記整数・分数分離処理手段により分離された整数部の
    値を用いて、上記第1の演算処理手段により求められた
    演算値に対してシフト演算に基づく演算処理を施す第2
    の演算処理手段とにより構成され、 上記第1の演算処理手段と第2の演算処理手段とによ
    り、上記統一演算式に基づく演算処理が行われるように
    なされていることを特徴とする請求項1記載のMPEG
    規格の音声信号デコーダ。
JP9815694A 1994-04-12 1994-04-12 Mpeg規格の音声信号デコーダ Expired - Lifetime JP3190204B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP9815694A JP3190204B2 (ja) 1994-04-12 1994-04-12 Mpeg規格の音声信号デコーダ
US08/420,156 US5675703A (en) 1994-04-12 1995-04-11 Apparatus for decoding compressed and coded sound signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9815694A JP3190204B2 (ja) 1994-04-12 1994-04-12 Mpeg規格の音声信号デコーダ

Publications (2)

Publication Number Publication Date
JPH07281697A JPH07281697A (ja) 1995-10-27
JP3190204B2 true JP3190204B2 (ja) 2001-07-23

Family

ID=14212285

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9815694A Expired - Lifetime JP3190204B2 (ja) 1994-04-12 1994-04-12 Mpeg規格の音声信号デコーダ

Country Status (2)

Country Link
US (1) US5675703A (ja)
JP (1) JP3190204B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3501246B2 (ja) 1995-04-21 2004-03-02 ユナイテッド・モジュール・コーポレーション Mpegオーディオデコーダ

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9606680D0 (en) * 1996-03-29 1996-06-05 Philips Electronics Nv Compressed audio signal processing
US5893066A (en) * 1996-10-15 1999-04-06 Samsung Electronics Co. Ltd. Fast requantization apparatus and method for MPEG audio decoding
KR100300887B1 (ko) * 1999-02-24 2001-09-26 유수근 디지털 오디오 데이터의 역방향 디코딩 방법
US6981060B2 (en) * 2000-12-14 2005-12-27 Telefonaktiebolaget L M Ericsson (Publ) Compression based on channel characteristics
US7302628B2 (en) 2000-12-14 2007-11-27 Telefonaktiebolaget L M Ericsson (Publ) Data compression with incremental redundancy
US6917913B2 (en) * 2001-03-12 2005-07-12 Motorola, Inc. Digital filter for sub-band synthesis
KR100571824B1 (ko) * 2003-11-26 2006-04-17 삼성전자주식회사 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치
KR100668299B1 (ko) 2004-05-12 2007-01-12 삼성전자주식회사 구간별 선형양자화를 이용한 디지털 신호 부호화/복호화방법 및 장치
WO2013042884A1 (ko) * 2011-09-19 2013-03-28 엘지전자 주식회사 영상 부호화/복호화 방법 및 그 장치

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05218771A (ja) * 1992-02-07 1993-08-27 Matsushita Electric Ind Co Ltd サブバンド符号化信号再生装置
JP3127600B2 (ja) * 1992-09-11 2001-01-29 ソニー株式会社 ディジタル信号復号化装置及び方法
KR950008637B1 (ko) * 1993-04-08 1995-08-03 삼성전자주식회사 부밴드 코딩시스템의 신호처리장치
US5508949A (en) * 1993-12-29 1996-04-16 Hewlett-Packard Company Fast subband filtering in digital signal coding

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3501246B2 (ja) 1995-04-21 2004-03-02 ユナイテッド・モジュール・コーポレーション Mpegオーディオデコーダ

Also Published As

Publication number Publication date
JPH07281697A (ja) 1995-10-27
US5675703A (en) 1997-10-07

Similar Documents

Publication Publication Date Title
EP2308045B1 (en) Compression of audio scale-factors by two-dimensional transformation
JP3321971B2 (ja) 音声信号処理方法
US20050171785A1 (en) Audio decoding device, decoding method, and program
JPH07210196A (ja) ディジタル信号符号化/復号化装置及び方法
JP2001521648A (ja) スペクトル帯域複製を用いた原始コーディングの強化
JP3190204B2 (ja) Mpeg規格の音声信号デコーダ
US20030004713A1 (en) Signal processing apparatus and method, signal coding apparatus and method , and signal decoding apparatus and method
WO2006051446A2 (en) Method of signal encoding
EP0693829A1 (en) Method and device for encoding information and method and device for decoding information
US7096240B1 (en) Channel coupling for an AC-3 encoder
EP1259956A1 (en) Method of and apparatus for converting an audio signal between data compression formats
JP3254953B2 (ja) 音声高能率符号化装置
JP2891193B2 (ja) 広帯域音声スペクトル係数量子化装置
JPH07168593A (ja) 信号符号化方法及び装置、信号復号化方法及び装置、並びに信号記録媒体
KR100712409B1 (ko) 벡터의 차원변환 방법
JP3593201B2 (ja) オーディオ復号装置
KR100287861B1 (ko) 디지탈 오디오 스테레오 모드에서의 각 채널 비균등 비트할당 장치 및 방법
JP4618823B2 (ja) 信号符号化装置及び方法
JPH08102677A (ja) Mpeg規格の音声信号デコーダ
JP3501246B2 (ja) Mpegオーディオデコーダ
JPH07273656A (ja) 信号処理方法及び装置
JP3417437B2 (ja) Mpegオーディオデコーダ
JP4081994B2 (ja) ディジタルオーディオデコーダ
JPH11195995A (ja) 画像音声圧縮伸長装置
JPH08237209A (ja) ディジタルオーディオ信号処理装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090518

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100518

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110518

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120518

Year of fee payment: 11

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120518

Year of fee payment: 11

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130518

Year of fee payment: 12

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term