JP2821713B2 - 高品質オーディオ用低ビット伝送速度変換コーダ、デコーダ、及びエンコーダ・デコーダ - Google Patents

高品質オーディオ用低ビット伝送速度変換コーダ、デコーダ、及びエンコーダ・デコーダ

Info

Publication number
JP2821713B2
JP2821713B2 JP2503825A JP50382590A JP2821713B2 JP 2821713 B2 JP2821713 B2 JP 2821713B2 JP 2503825 A JP2503825 A JP 2503825A JP 50382590 A JP50382590 A JP 50382590A JP 2821713 B2 JP2821713 B2 JP 2821713B2
Authority
JP
Japan
Prior art keywords
transform
exponent
block
signal
blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2503825A
Other languages
English (en)
Other versions
JPH04504192A (ja
Inventor
フィルダー、ルイス・ダン
デビッドソン、グラント・アレン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=26973611&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2821713(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of JPH04504192A publication Critical patent/JPH04504192A/ja
Application granted granted Critical
Publication of JP2821713B2 publication Critical patent/JP2821713B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/005Statistical coding, e.g. Huffman, run length coding
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • G11B20/1806Pulse code modulation systems for audio signals
    • G11B20/1809Pulse code modulation systems for audio signals by interleaving
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M5/00Conversion of the form of the representation of individual digits
    • H03M5/02Conversion to or from representation by pulses
    • H03M5/04Conversion to or from representation by pulses the pulses having two levels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Stereophonic System (AREA)

Description

【発明の詳細な説明】 技術分野 本発明は、概して、音楽のようなオーディオ信号の低
いビット伝送速度での高品質ディジタル信号処理に関す
る。
背景技術 信号処理の分野では、所与の信号を十分に表現するの
に必要な情報の量を最小化する方法を発見するために大
きな関心が払われている。必要な情報を低減させること
によって、信号をより狭い帯域で伝送したり、より少な
い空間内に記憶することができる。ディジタル技法に関
して、より少ない情報の要件とは、必要な2値ビットが
より少ないことと同義である。
ビットの削減要件は、2つの因子によって制限され
る。すなわち、 (1)帯域幅Wの信号は、2×Wより低くない周波数で
標本化された一連のサンプルによって、正確に表現され
る。これが、いわゆるナイキストのサンプリング・レー
トである。したがって、帯域幅Wを有する、T秒間の長
さの信号を正確に表現するためには、少なくとも2×W
×Tの数のサンプルが必要であり、 (2)信号サンプルの量子化には連続する範囲のどのよ
うな数値をも取り得るが、この数値によっては、量子化
段の規模又は分解能力に比例する、不正確な信号の表現
を生じる。この不正確さは量子化誤りと呼ばれる。この
誤りは、信号サンプル量子化の表現に利用できるビット
の数に反比例する ことである。
もし全帯域幅に対して符号化技法が適用されると、総
ての量子化誤りは、雑音として顕われるが、帯域幅全体
にわたって均等に拡散する。スペクトルの選択された部
分に適用できる技法によって、量子化雑音のスペクトル
の拡散を制限することができる。このような技法として
は、サブバンド符号化、及び変換符号化の2種がある。
これらの技法を用いることによって、量子化雑音が特に
耳障りな特定の周波数帯において当該周波数帯を少ない
段数で量子化することにより、量子化誤りを低減させる
ことができる。
サブバンド符号化は、一連のディジタル帯域フィルタ
のバンク(列)によって実現することができる。変換符
号化は、ディジタル帯域フィルタバンクをシミュレート
する幾つかの時間領域対周波数領域変換を任意に行うこ
とによって実現することができる。変換は、ディジタル
・フィルタよりも実現が容易であり、計算処理及びハー
ドウエアも少なくて済むが、変換係数で表わされる帯域
フィルタの「周波数ピン」の各々が均一な帯域幅を有す
る点で設計上の柔軟性に欠ける。これと対照的に、ディ
ジタル帯域フィルタバンクは、種々のサブバンド帯域幅
を持つように設計することができる。しかし、変換係数
は、単一の変換係数帯域幅の乗数である帯域幅を有する
「サブバンド」を決定すべく、共にグループ化すること
ができる。以下、当明細書では、「サブバンド」という
用語は、サブバンド・コーダ、又は変換コーダの何れで
実現されるにせよ、全信号帯域幅の選択された部分を指
すものとして用いる。変換コーダで実現されるサブバン
ドは、1つ又は2つ以上の隣接する変換係数又は周波数
ビンの1組によって決定される。変換コーダの周波数ビ
ンの帯域幅は、変換コーダのサンプリング・レートと、
各信号サンプル・ブロック(変換長)中のサンプル数と
に依存する。
音楽用信号用の高品質処理系の性能に対しては、サブ
バンド帯域フィルタの2つの特性は特に重大である。そ
の第1は、フィルタの通過帯域と阻止帯域との間の領域
の帯域幅(僊移帯域)である。第2は、阻止帯域での減
衰レベルである。本明細書中で用いているように、フィ
ルタの「選択度」の尺度は、僊移帯域内のフィルタ応答
特性曲線の鋭さ(僊移帯域ロールオフの鋭さ)と、阻止
帯域での減衰レベル(阻止帯域の深さ)とである。
耳には、可変中心周波数を持つ、極度に非対象に同調
されたフィルタの特性と類似の周波数分析特性があるの
で、これらの2つのフィルタ特性は重大である。耳の同
調フィルタの周波数分解能力は、オーディオ・スペクト
ル全体にわたって周波数につれて変わる。約500Hz以下
の周波数においては、共に接近して存在する複数の信号
を耳に識別することができるが、可聴限界へと周波数が
上昇するにつれて、識別可能な信号間の周波数の幅は拡
がる。このような聴覚上のフィルタの有効帯域幅は、臨
界帯域と呼ばれる。この臨界帯域の重要な特質は、音響
心理学的マスキング効果が臨界帯域内で最も強く顕れる
こと、すなわち、臨界帯域内の何処でも他のあらゆる周
波数の信号に対する聴取力が、臨界帯域内の支配的な信
号によって抑制されることである。臨界帯域の外側にあ
る信号はそれ程強くは掩蔽されない。この概要について
は、サン・フランシスコのマッグロウヒル社1988年出版
の、K.ブレア・ベンソン編、「オーディオ・エンジニア
リング・ハンドブック」の1.40ページから1.42ページま
でと、4.8ページから4.10ページまでと(Audio Enginee
ring Handbook,K.Balir Benson ed.,McGraw−Hill,San
Fransisco,1988)を参照のこと。
音響心理学的マスキングは、もし可聴スペクトル全体
を通してサブバンド帯域幅がこのスペクトルの同一部分
における耳の臨界帯域幅の約半分であるならば、サブバ
ンド及び変換コーダによって更に容易に達成される。何
故ならば、耳の臨界帯域には聴覚上の刺激に順応する可
変の中心周波数があるのに対して、サブバンド及び変換
コーダは典型的に固定の中心周波数を具えているからで
ある。音響心理学的マスキング効果を利用する機会を最
適化するために、支配的信号の存在によって生じる総て
の人工的ひずみは、支配的信号を含むサブバンドに制限
されなければならない。もしサブバンド帯域が臨界帯域
の約半分又はそれより小さければ(また、もし、僊移帯
域ロールオフが十分に鋭く、阻止帯域排除が十分に深け
れば)、サブバンド通過帯域の帯域幅の縁の近くに周波
数がある信号に対してさえも、望ましくないひずみに対
する最も効果的なマスキング効果が生じる可能性があ
る。もしサブバンド帯域幅が臨界帯域の半分より大きけ
れば、支配的信号によって耳の臨界帯域がコーダのサブ
バンドから偏位させられて、耳の臨界帯域の外側にある
望ましくないひずみの幾分かが掩蔽されない可能性があ
る。これらの結果は、耳の臨界帯域が狭くなる低い周波
数においては、最も耳障りである。
文書、WO 88/01811では、音響信号、とりわけ音楽信
号の伝送、記憶のためのディジタル符号化が開示されて
いる。この中で、音響信号のNピックアップ値のブロッ
クは、離散正弦変換、TDAC変換、又は高速フーリエ変換
を用いて、Mのスペクトル係数のブロックに変形され
る。この過程では、量子化装置の初期段の規模が選ば
れ、エントロピー符号化が適用され、Mスペクトル係数
が所定数のビットで符号化されるまで、異なる段の規模
で符号化が反復される。未使用のビットは、後続のブロ
ック中への割当てのために使用可能である。音響心理学
的マスキング効果を利用するために、各ブロックのスペ
クトル係数は、周波数グループに分割され、これらの周
波数グループは、個別の各々の周波数グループ内の信号
のエネルギーが同グループ内の雑音のエネルギーよりも
実質的に高ければ、雑音が感受されないように、音響心
理学的マスキングに従って、選択される。符号化の後
に、係数は再構築され、再構築された値の周波数グルー
プ内の信号エネルギーは、それぞれの最小基準値と比較
される。もし1又は2個以上の周波数グループ内の信号
エネルギーがそれぞれの最小基準値よりも低ければ、ス
ペクトル係数は、所与の因数で乗じられ、反復する形で
量子化および符号化が行われる。内側及び外側の反復ル
ープは、副次情報として伝送されなければならない。
変換符号化の性能は、信号サンプル・ブロック長と、
変換符号誤りと、エイリアシング相殺とを含む、幾つか
の要因に依存する。
ブロック長 ブロック長が短くなるにつれて、変換エンコーダ及び
デコーダの性能は、結果的に周波数ビンが拡がることに
よるばかりではなく、帯域フィルタの周波数ビンの応答
特性の劣化、すなわち、(1)僊移帯域ロールオフ率の
減少と、(2)阻止帯域排除の水準の減少とによって
も、不利な影響を受ける。帯域フィルタのこの特性劣化
によって、隣接する周波数ビンにおいて望ましい信号に
応答して生じる望ましくない変換係数の生成、若しく
は、変換係数に対する望ましくない寄与に帰着する。こ
れらの望ましくない寄与は、サイドロープ漏洩と呼ばれ
る。
かくして、サンプリング・レートによっては、ブロッ
ク長を短くすることにより、或る周波数又は全周波数、
特に低い周波数において、名目上のフィルタ帯域幅が耳
の臨界帯域幅を超えることになる。たとえばこの名目上
のサブバンド帯域幅が耳の臨界帯域幅よりも狭くとも、
広がった僊移帯域、貧弱な阻止帯域排除の形で顕れる劣
化したフィルタ特性によって、耳の臨界帯域幅の外側に
顕著な信号成分が現れる。このような場合には、この系
の他の側面、特に量子化精度面で、通常、より大幅な制
約を受ける。
短いブロック長によって生じるもう1つの不利益は、
次の節に述べる変換符号化誤りの悪化である。
変換符号化誤り 離散変換は信号の有限のセグメントにしか作用しない
ので、離散変換では完全に正確な1組の周波数係数は生
み出されない。厳密に言うと、離散変換では、入力時間
領域信号の表現について、無限の変換長が必要になる真
正の周波数領域表現ではなく、時間・周波数表現が作り
出される。しかしながら、ここでの議論の便宜上、離散
変換の出力を周波数領域表現と呼ぶこととしよう。実際
には、離散変換では、標本化信号は周期が有限のサンプ
ル期間の約数である周波数成分を持つのみであると仮定
している。これは、有限長の信号が周期性のものである
と仮定することに等しい。この仮定は一般的に正しくな
い。この仮定された周期性によって、有限時間期間の縁
において不連続性が生じ、これにより変換において擬似
の高い周波数が生じる。
この効果を最小化する1つの技法は、期間の縁の近く
のサンプルが0に近くなるように信号サンプルを重み付
けることによって、変換を行う前に非連続性を低減する
ことである。期間の中心にあるサンプルは一般的に変更
せずに、すなわち、係数1で重み付けて通過させる。こ
の重み付け関数は、「分析ウインドウ」と呼ばれ、どの
ような形状でも良いが、幾つかのウインドウはサブバン
ドのフィルタ性能に一層有利に寄与する。
本明細書で用いているように、「分析ウインドウ」と
いう用語は、前向き変換を適用する前に行われるウイン
ドウ処理関数を指しているに過ぎない。下で論考するよ
うに、本発明中で用いる分析ウインドウの設計は、合成
ウインドウ設計要件によって制約される。したがって、
広く同じ用語が用いられている当分野の「分析ウインド
ウ」の設計及び性能特性は、本発明で実施されている分
析ウインドウとは異なる。
ウインドウの質を評価するのに用いることができる単
一の条件はないが、他方、一般的な条件には、僊移帯域
ロールオフの鋭さと阻止帯域の深さとが含まれる。或る
種の用途においては、鋭いロールオフと深い阻止レベル
とを交換する能力が有益な特質となる。
分析ウインドウは時間領域関数である。もし他の補償
が行われなければ、復元若しくは「合成」される信号
は、分析ウインドウの形状に従ってのひずみを受ける。
補償方法には幾つかあるが、例えば、以下のとおりであ
る。
(a)復元された信号期間又はブロックを、逆ウインド
ウ、すなわち、その重み付け係数が分析ウインドウの重
み付け係数の逆数であるウインドウで、乗じる。この技
法の短所は、分析ウインドウがその縁で0にならないこ
とを明確に必要とすることである。
(b)連続的な入力信号ブロックを重複させる。2つの
隣接するウインドウが重複部分を横切って一体的に合算
されるように分析ウインドウを注意深く設計することに
よって、このウインドウの効果は正確に補償される。
(しかし、次の節を参照のこと)。離散フーリエ変換
(DFT:Discrete Fourier Transform)のような或る形式
の変換と共に用いる時には、この技法では、重複期間中
の信号の一部を変換し、かつ2度伝送しなければならな
いので、当該信号を表わすのに必要なビット数が増加す
る。これらの形式の変換に対しては、可能な限り小さい
重複期間を有するウインドウを設計することが望まし
い。
(c)逆変換からの合成出力にもウインドウ処理を行う
必要がある。本発明で用いている変換を含む、幾つかの
変換では、このウインドウ処理を要する。更に、量子化
誤りによって、有限時間期間の縁において0とならない
時間領域信号が逆変換に生じる。これをそのままにして
置くと、この誤りによって、復元される時間領域信号は
ウインドウ重複期間内で最も強く歪まされる。縁で各合
成信号ブロックを整形するために、合成ウインドウを用
いることもできる。この場合、当該信号は分析及び合成
ウインドウで処理される。すなわち、当該信号はこれら
2つのウインドウの積によって重み付けられる。したが
って、この2つのウインドウの積が重複部分を横切って
一体的に合算されるように、両方のウインドウが設計さ
れなければならない。これについては、前節における論
考を参照のこと。
短い変換サンプル・ブロックでは、上記の分析及び合
成ウインドウに対してより大きな補償要件が課される。
変換サンプル・ブロックが短くなるにつれて、フィルタ
の僊移帯域及び阻止帯域を通してのサイドロープ漏洩が
一層多くなる。良く整形された分析ウインドウではこの
漏洩が低減される。
サイドロープ漏洩は望ましくない。何故ならば、サイ
ドロープ漏洩によって、変換においてフィルタの通過帯
域の外側の信号成分の周波数を誤って表現するスペクト
ル係数が生じるからである。この表現誤りがエイリアシ
ングと呼ばれるひずみである。
エイリアシング相殺 ナイキストの理論では、サンプル間の期間が信号の最
高周波数成分の期間の半分より短ければ、離散サンプル
から信号を正確に復元できると考える。サンプリング・
レートがこのナイキスト・レートよりも小さければ、高
い周波数成分は低い周波数成分として誤って表わされ
る。この低い周波数成分が真正成分に対する「別名(エ
イリアス)」である。
サブバンド・フィルタ及び有限ディジタル変換は、完
全な通過帯域フィルタではない。通過帯域と阻止帯域と
の間の僊移は無限に鋭いものではなく、阻止帯域中にお
ける信号減衰は無限に大きくはない。その結果、通過帯
域で濾波された入力信号が通過帯域遮断周波数によって
示されるナイキスト・レートで標本化されるとしても、
この遮断周波数よりも高い僊移帯域中の周波数は忠実に
は表現されない。
エイリアシングひずみが逆変換によって自動的に相殺
されるように分析及び合成フィルタを設計することは可
能である。時間領域内の直角位相ミラー・フィルタには
この特性がある。本発明で用いている変換コーダ技法を
含めて、或る種の変換コーダ技法でも、エイリアシング
ひずみを相殺する。
サンプル・ブロック長を短くすればする程、その結果
として発生する聴取可能な変換コーダ中のエイリアシン
クひずみを抑制するのが一層困難になる。上で説明した
ように、短いサンプル・ブロック長によってフィルタ特
性が劣化する。すなわち、通過帯域幅が広がり、通過帯
域対阻止帯域の僊移がより鋭さを失い、阻止帯域排除特
性が劣化する。その結果、エイリアシングがより一層目
立つようになる。もしエイリス成分が不十分な正確さで
符号化され復号されると、これらの符号化誤りによっ
て、エイリアシングひずみを逆変換で完全に相殺するこ
とが妨げられる。残留エイリアシングひずみは、音響心
理学的に掩蔽されない限り聴取可能なものとなろう。し
かし、サンプル・ブロックを短くすることによって、変
換周波数ビンの幾つかは、特に聴覚上の臨界帯域が最大
の分解能力を有する低い周波数において、聴覚上の臨界
帯域よりも広い通過帯域を具えることになる。この結果
として、エイリアシングひずみを掩蔽することができな
い。このひずみを極少化する1つの方法は、問題のサブ
バンド中での量子化精度を向上させることであるが、そ
れによって必要なビット伝送速度は増加する。
ビット伝送速度低減技法 上で挙げた2つの要因(ナイキスト・サンプル・レー
ト及び量子化誤り)によって、特定品質の信号伝送又は
記憶に対するビット伝送速度要件を決定すべきである。
しかし、各種技法を利用して、所与の信号品質に必要な
ビット伝送速度を低減することができる。これらの技法
では、信号の冗長性と無関係上を利用する。信号が予見
できるものであるか、若しくは他の方法で受信機から得
られるものであるならば、その信号成分には冗長性があ
る。もし或る信号成分が特定品質の表現を達成するため
に不要ならば、その信号成分は無関係である。当技術で
用いられる幾つかの技法には、以下の事柄が含まれる。
(1)予知 信号の周期的乃至は予知可能な特性によって、現在の
信号又は先行する信号の特性に基づいて、幾つかの成分
を受信機に予期させることができる。
(2)エントロピー符号化 省略符号によって、高い発生確率の成分を表現するこ
とができる。この場合、送信機及び受信機の両方とも、
同一のコード・ブックを備えていなければならない。エ
ントロピー符号化及び予知には、計算の複雑さと処理に
よる遅延とが増大する短所がある。また、エントロピー
符号化及び予知では、本来、可変伝送速度の出力が与え
られるので、もし一定ビット伝送速度系で用いるのであ
れば緩衝する必要がある。
(3)不均一符号化 対数又は不均一量子化段による表現によって、量子化
誤りが大きくなるという犠牲の下で、より少ないビット
で大信号値の符号化を行うことが可能になる。
(4)浮動小数点 浮動小数点表現によって、精度が下がるという犠牲の
下で、ビット要件を低減することができる。ブロック浮
動小数点表現では、1ブロックの浮動小数点仮数に対し
て1つの位取り因子又は指数を用いる。また、ブロック
浮動小数点表現は、時間領域信号を符号化する際に広く
用いられる。浮動小数点は、不均一符号化の特異例であ
る。
(5)ビット割当て 正確さに対する受信機への要求は、時間、信号内容、
強さ、又は周波数に伴って変化する。例えば、話し声の
より低い周波数成分は、通常、話し言葉を理解し話者を
認識する上で一層重要であるので、より高い周波数成分
よりも一層高い精度で伝送されなければならない。音楽
信号に関しては、別の基準が適用する。ビット割当てに
ついての幾つかの一般基準は、以下のとおりである。
(a)成分変動 最大レベルの交流電力を持つ変換係数に対しては、よ
り多くのビットを割り当てる。
(b)成分値 最大振幅又はエネルギーを持つ周波数帯を表現する変
換係数に対しては、より多くのビットを割り当てる。
(c)音響心理学的マスキング 他の信号成分によって量子化誤りが掩蔽される(***
聴感)信号成分に対しては、より少ないビットを割り当
てる。この技法は、可聴信号が人が聴取することを目的
として企図されている用途で、その特質を発揮する。マ
スキングは、音楽信号のような多重音信号及び複号波形
よりも、単音信号に関して最も良く認識される。
音響心理学的マスキングに関連する適応ビット割当て
を用いる変換に基づくエンコーダ及びデコーダの例は、
ノース・ホランドのエルセフィア科学出版社の話声通
信、1897年第6巻の299ページから308ページの、ジョン
ソンとブラッドレイによる論文、「時間領域エイリアシ
ング相殺に関する適応変換符号化」(Johnson,Bradley,
“Adaptive Transform Coding Incorporating Time Dom
ain Aliasing Cancellation",Speech Communications,V
ol.6,North−Holland,Elsevier Science Publishers,19
87,00.299−308)中に叙述されている。
発明の開示 本発明の目的は、主観的な高音質を毎秒128kビット
(kbs)程度の低いビット伝送速度で提供する、符号化
及び複号化の装置と方法とを用いて、広帯域のオーディ
オ情報、とりわけ、音楽のディジタル処理を行うことで
ある。
本発明の更なる目的は、再生の品質が高品質の伝送又
は記憶及び再生に適する。例えば放送用オーディオ網の
ような高品質の再生に適する符号化及び復号化の装置と
方法を提供することである。
本発明の更なる目的は、コンパクト・ディスクで得ら
れる品質程度に主観的に良好な、再生の品質を提供する
ことである。
本発明の更なる目的は、ディジタル処理系中で実現さ
れる、伝送通路による信号の悪化に対して高度の耐性を
有する符号化及び復号化の装置と方法を提供することで
ある。
本発明の更なる目的は、符号化された信号を記憶する
のに少量の空間しか必要としない、ディジタル処理系中
で実現される符号化及び復号化の装置と方法を提供する
ことである。
本発明のもう1つの目的は、音楽信号を処理する変換
コーダ中に、改良された音響心理学的マスキング技法を
提供することである。
加えて、本発明のもう1つの目的は、変換コーダ中の
聴取可能なひずみ人工物に関して音響心理学的に補償す
る技法を提供することである。
上記の本発明の目的の詳細については、当明細書の全
体を通して説明するが、以下の「発明を実施するための
望ましい形態」を叙述する節で特に詳しく説明する。
本発明の教示に従って、エンコーダによって広帯域オ
ーディオ情報のディジタル符号化が行われる。この広帯
域オーディオ信号は、標本化され、時間領域サンプル・
ブロックに量子化される。その後、各サンプル・ブロッ
クは分析ウインドウによって変調される。その後、周波
数領域のスペクトル成分が、分析ウインドウによって重
み付けられた時間領域サンプル・ブロックに応答して発
生される。適応ビットの割当てを行う変換コーダによっ
て、各変換係数が、不均一に量子化され、これらの係数
の記憶又は伝送に適するフォーマットを有するディジタ
ル出力に組み立て、すなわち、アセンブルされる。伝送
信号が通信線路の雑音又はその他の悪化の影響を受ける
用途においては、誤り訂正符号を用いても良い。
更に本発明の教示に従って、本発明のエンコーダによ
って符号化されたディジタル符号化広帯域オーディオ信
号の高品質の再生が、本発明のデコーダによって行われ
る。エンコーダのディジタル出力が、記憶装置又は伝送
線路を経由してデコーダに受け取られる。デコーダによ
って、不均一に符号化されたスペクトル成分がフォーマ
ット化されたディジタル信号から誘導され、この成分か
ら周波数領域スペクトル成分が再構築される。この時間
領域のスペクトル成分を発生したエンコーダ中の装置に
対して逆の特性を具える装置によって、周波数領域のス
ペクトル成分に応答して時間領域信号サンプル・ブロッ
クが発生される。これらのサンプル・ブロックは合成ウ
インドウによって変調される。この合成ウインドウは、
この合成ウインドウの応答特性とエンコーダ中の分析ウ
インドウの応答特性との積によって、隣接する2つの重
複サンプル・ブロックに関して一体的に合算するような
複合応答特性を作り出す特性を具えている。隣接するサ
ンプル・ブロックは、重複、加算されて、分析及び合成
ウインドウの重み付け効果が相殺され、その後、高品質
のアナログ出力に変換される時間領域信号のディジタル
化された表現が復元される。
更に本発明の教示に従って、エンコーダ・デコーダ系
によって、広帯域オーディオ情報のディジタル符号化と
高品質の再生とが行われる。この系のエンコーダ部分に
おいては、アナログ広帯域オーディオ信号が時間領域サ
ンプル・ブロックに標本化され、量子化される。その
後、各サンプル・ブロックは、分析ウインドウによって
変調される。その後、周波数領域のスペクトル成分が、
分析ウインドウによって重み付けられた時間領域サンプ
ル・ブロックに応答して、発生される。適応ビット割当
てを含む不均一スペクトル符号化によって各スペクトル
成分が量子化され、これらの成分は、信号の悪化を受け
易い記憶、又は通信通路を通しての伝送に適するディジ
タル・フォーマットを有する、ディジタル出力に組み立
てられる。この系のデコーダ部分によって、エンコーダ
部分のディジタル出力が、記憶装置又は伝送線路を経由
して受け取られる。このデコーダ部分によって、フォー
マット化ディジタル信号から不均一に符号化されたスペ
クトル成分が誘導され、この成分から周波数領域のスペ
クトル成分が再構築される。時間領域サンプル・ブロッ
クが、周波数領域変換係数に応答して、周波数領域変換
係数を発生したエンコーダ部分中の装置に対して逆の特
性を具える装置によって、発生される。このサンプル・
ブロックは、合成ウインドウによって変調される。この
合成ウインドウは、この合成ウインドウの応答特性とエ
ンコーダ部中の分析ウインドウの応答特性との積によっ
て隣接する2つの重複サンプル・ブロックに関して一体
的に合算する複合応答特性を作り出すような特性を具え
ている。隣接するサンプル・ブロックは、重複され、加
算されて分析及び合成ウインドウの重み付け効果を相殺
し、その後高品質のアナログ出力に変換される時間領域
信号のディジタル化された表現が復元される。
本発明のエンコーダの実施例においては、離散変換に
よって、周波数領域スペクトル成分が、分析ウインドウ
で重み付けられた時間領域サンプル・ブロックに応答し
て発生される。この離散変換には、改良型の離散余弦変
換(DCT:Discrete Cosine Transform)と、改良型の離
散正弦変換(DST:Discrete Sine Transform)と等価の
関数を具えていることが好ましい。代替的な実施例にお
いては、この離散変換は、単一の改良型の離散余弦変換
(DCT)によって実施されるが、実質的に総ての時間領
域対周波数領域変換を用いることができる。
エンコーダに関する本発明の好ましい実施例において
は、単一のFFTを利用して、単一チャネル系では隣接す
る2つの信号サンプル・ブロックに関して、若しくは、
2チャネル系では各チャネルの1つの信号サンプル・ブ
ロックに関して、前向き変換を同時に計算する。デコー
ダに関する本発明の好ましい実施例においては、単一の
FFTを利用して、2つの変換ブロックに関して逆変換を
同時に計算する。
エンコーダ及びデコーダのこれらの好ましい実施例に
おいては、サンプリング・レートは44.1kHzである。こ
のサンプリング・レートは、決定的なものではないが、
この44.1kHzは、適切なサンプリング・レートであり、
また、コンパクト・ディスクに用いられているサンプリ
ング・レートでもあるので、便利である。この44.1kHz
のサンプリング・レートを用いている好ましい実施例に
おいては、名目周波数応答特性は15kHzまで延びてお
り、時間領域サンプル・ブロックは512サンプルの長さ
を具えている。本発明の好ましい実施例においては、職
業用放送局用途に適する主観的な品質水準での音楽の符
号化は、毎秒128kビット(誤り訂正符号のような余分な
情報を含めて)程度の低いビット伝送速度で達成され
る。本発明の基本的な神髄から逸脱せずに、信号品質の
異なる水準をもたらす、これ以外のビット伝送速度を用
いることもできる。
このエンコーダの好ましい実施例においては、不均一
変換コーダによって、可変長のコード・ワードが各変換
係数について計算される。各変換係数のコード・ワード
のビット長は、固定ビット数と、現状の信号内容のため
にサブバンド中の雑音が他のサブバンド中の雑音よりも
音響心理学的にマスクされ易いかどうかに基づく適応ビ
ット割当てによって決定される可変ビット数との合計で
ある。この固定ビット数は、対象のサブバンド中での単
音についての音響心理学的マスキング効果に関する経験
的観察に基づいて、各サブバンドに対して割り当てられ
る。この固定ビット割当てでは、低い周波数における耳
の選択度がより大きいことによって、低い周波数におい
ては系の性能が主観的に低下することについて考慮を払
っている。複合信号が存在する際のマスキング性能は、
通常、単音信号が存在する際のマスキング性能よりも良
好であるが、複合信号が存在する際のマスキング効果
は、良く理解されておらず、また予測できるものでもな
い。この系では、ビットの多くが固定ビットであり、比
較的僅かのビットしか適応的に割り当てないという点
で、積極的なものとは言えない。この方法には、幾つか
の長所がある。その第1は、必要な固定ビットの割当て
を行った経験的手続には逆変換過程を含んでいたので、
この固定ビット割当てでは逆変換によって作り出される
望ましくないひずみを本来的に補償することである。第
2に、適応ビット割当てのアルゴリズムを比較的単純に
維持することができることである。これに加えて、エン
コーダとデコーダとの間で生じる信号伝送誤りは、デコ
ーダ中のビットに対する値となると同時に不正確な割当
てともなるので、適応的に割り当てられたビットはこの
ような誤りに対して一層敏感であることである。
本発明によるビット割当てに関する経験的技法につい
ては、第13図を参照することによって、より良く理解で
きるであろう。第13図では、500Hzの信号音(正弦波)
から生じる、出力雑音及びひずみの重要な臨界帯域スペ
クトル(すなわち、ここに示してある雑音及びひずみ
は、聴覚上の臨界帯域に関するものである)を、3つの
異なるビット割当てに関して、聴覚上のマスキングと比
較して示している。この図では、特定のデータを示すこ
とよりむしろ、経験的な方法を示すことを企図してい
る。
割当てA(実線)は基準であり、任意の数のビットを
各変換係数に対して割り当てた時の、500Hzの正弦波に
よって作り出される雑音及びひずみの積を示している。
割当てB(短い線の点線)は、割当てAと同じ相対的割
当てであるが、変換係数当たり2つ少ないビットを有す
る雑音及びひずみの積を示している。割当てC(鎖線)
は、オーディオ帯域の1500Hzまでの低い周波数部分に対
して、割当てAと同じ割当てを与えた場合を示してい
る。割当てCは、約1500Hzから上の高い周波数部分に対
しては、割当てBと同じである。点線は、500Hzについ
ての聴覚上のマスキングを示している。
以上の3つのビット割当て事例の総てについて、マス
キング曲線の急激な低下による聴取可能な雑音が500Hz
の信号音以下の周波数において存在すること、すなわ
ち、約100Hzから300乃至400Hzにかけて、雑音及びひず
みの積がマスキングしきい値より上にあることが観察さ
れるであろう。ビットを2つ少なくしたこと(割当てA
に対する割当てB)によって、聴取可能な雑音及びひず
みが悪化するが、割当てCに示すように、500Hzの信号
音以下の領域を含むスペクトルにこの2ビットを加え戻
すことによって、元の聴取可能な雑音及びひずみの水準
を回復する。聴取可能な雑音は、高い周波数においても
存在するが、オーディオ・スペクトルの極めて高い部分
において500Hzの信号音によって作り出される雑音及び
ひずみの積は比較的低いことから、ビットを減らしたり
追加した際にも、実質的に変化しない。
種々の周波数の信号音に応答して作り出される雑音及
びひずみ、種々のビット割当てについて観察することに
よって、オーディオ・スペクトル全体にわたって聴取可
能なマスキングに関して受容できる雑音及びひずみの水
準となる。種々の変換係数に対するビット長を割り当て
ることができる。第13図の例に関しては、約100Hzから3
00乃至400Hzまでの領域中のマスキングしきい値以下の
雑音及びひずみの積の水準を低減するために、雑音及び
ひずみがマスキングしきい値より低くなるまで、500Hz
の信号音を含む変換係数及びそれと至近の変換係数に関
する基準割当てに対して追加ビットを加えても良い。他
の信号音に対しても、オーディオ・スペクトル全体にわ
たって、信号音が存在する際に総合的変換係数ビット長
割当てが受容できる雑音となるまで、同様な段階を一度
に1つずつ踏むことができよう。これは、コンピュータ
・シミュレーションによって、最も容易に行われる。ス
ペクトル全体を通して各変換係数から1つ又は2つ以上
のビットを取り除くことによって、固定ビット割当て
(割当てBのように)が行われる。必要に応じて、適応
割当てビットが加えられて(割当てCのように)、問題
の領域において聴取可能な雑音が受容できる水準まで低
減される。かくして、第13図に示す例のようなビットの
割当てに対する聴取可能な雑音の増減に関する経験的観
察によって、本発明の固定及び適応ビット割当て構想の
基盤が形成される。
このエンコーダの好ましい実施例においては、不均一
量子化変換係数は、ブロック指数と可変長コード・ワー
ドとから成る、ブロック浮動小数点表現によって表され
る。上で述べたように、この可変長コード・ワードは、
更に、適応割当てビットの固定ビット長部分と可変長部
分とから成る。1組の変換ブロックに対する符号化信号
は、指数と、総ての適応割当てビットの1群が続くコー
ド・ワードの固定長部分とによって構成されるフレーム
に組み立てられる。コード・ワードの指数及び可変長部
分は、適応割当てビットから別個に組み立てられて、突
発雑音誤りに対する脆弱性が低減される。
先行技術でのエンコーダとは異なり、本発明によるエ
ンコーダでは、各フレーム中の適応割当てビットの割当
てに関する副次的な情報を伝送する必要がない。本発明
のデコーダでは、エンコーダで用いられた割当てアルゴ
リズムと同一の割当てアルゴリズムを用いることによっ
て、正しい割当てを誘導することができる。
フレーム同期を必要とする用途においては、本発明の
エンコーダ部分によって、フォーマット化されたデータ
が同期ビットに対して補足される。このフォーマット化
データ・ビットは、最初に無作為化され、それにより1
又は0のビットの長い列が生じる確率が低減される。こ
れは、特定の長さを超える長い連続を許容しない、T−
1搬送のような多くの環境において必要なことである。
非同期の用途では、無作為化によって、フレーム内の有
効データがブロック同期列と誤認される確率もまた低減
される。本発明によるデコーダ部分では、フレーム同期
データ・ビットを取り除き、逆無作為化を適用すること
によって、フォーマット化データが復元される。
符号化信号が悪化する可能性のある用途においては、
誤り訂正符号を用いて、最重要情報、すなわち、指数、
及び有り得る低い周波数の係数コード・ワードの部分が
保護される。フォーマット化されたフレーム全体に誤り
符号、及び上記の保護されたデータが分散されて、突発
雑音に対する感度が低減され、必要とされる突発雑音の
長さが重要データの訂正ができるまで増加される。
本発明の種々の特長及び本発明の実施例については、
「発明を実施するための望ましい形態」を述べる以下の
節、及び添付図面中で、より詳細に説明する。
図面の簡単な説明 第1a図及び第1b図は、本発明の基本的な構造を示す機
能概念図である。
第2a図から第2e図までは、本発明の1実施例のハード
ウエア構成を示す概念図である。
第3a図及び第3b図は、本発明の2チャネルの実施例に
関する演算装置のシリアル通信インターフェイスをより
詳細に示す概念図である。
第4図は、時間領域信号サンプル・ブロックを示す仮
想表現図である。
第5図は、信号が時間領域信号サンプル・ブロック内
で周期性を有すると仮定しての、離散変換によって生じ
る時間領域信号サンプル・ブロックの縁の不連続性を示
す、時間領域信号サンプル・ブロッの更なる仮想表現図
である。
第6a図は、結果としての関数Y(t)を得るための、
関数X(t)の関数W(t)による変調を示す機能概念
図である。
第6b図から第6d図までは、時間領域信号サンプル・ブ
ロックの、分析ウインドウによる変調を示す仮想表現図
である。
第7図は、本発明中で利用される不均一量子化装置に
関する高級論理を示す流れ図である。
第8図は、本発明中で利用される適応ビット割当て過
程に関する一層詳細な論理を示す流れ図である。
第9図は、代表的なフィルタ応答特性及び2つの代表
的な音響心理学的マスキング曲線を示す表現図である。
第10図は、4kHzの音響心理学的マスキング曲線に関す
るフィルタ応答特性を示す表現図である。
第11図は、1kHzの音響心理学的マスキング曲線に関す
るフィルタ応答特性を示す表現図である。
第12図は、幾つかの信号音の音響心理学的マスキング
曲線から誘導される複合マスキング曲線を説明する表現
図である。
第13図は、500Hzの音に対する音響心理学的マスキン
グ曲線に関して、3つの異なるビット割当てに対して符
号化された500Hzの音の符号化雑音及びひずみの、スペ
クトル・レベルを示す表現図である。
第14a図から第14e図までは、重複され、ウインドウで
処理された一連の時間領域信号サンプル・ブロックにグ
ループ化される時間領域信号を説明する、仮想表現図で
ある。
第15a図から第15d図までは、E−TDAC変換によって作
り出される時間領域エイリアシングひずみを説明する、
仮想表現図である。
第16a図から第16g図までは、E−TDAC変換信号合成の
間の、時間領域エイリアシングの重複・加算による相殺
を説明する仮想表現図である。
第17a図及び第17b図は、分析専用ウインドウを用いる
フィルタバンクのフィルタ僊移帯域ロールオフ及び阻止
帯域排除を、本発明のために設計された分析・合成ウイ
ンドウ・ペアを用いるフィルタバンクのフィルタ僊移帯
域ロールオフ及び阻止帯域排除と比較する表現図であ
る。
第18図は、ウインドウで処理された隣接ブロックの重
複・加算特性を示す仮想表現図である。
第19図は、4から7までのアルファ値に対する幾つか
のたたみ込みカイザー・ベッセル(Kaiser−Bessel)分
析ウインドウの形状を正弦波傾斜ウインドウと比較する
仮想表現図である。
第20図は、誤り訂正を有しない、符号化された2つの
変換ブロックのフレームのフォーマットを説明する概要
図である。
第21図は、誤り訂正符号を有する、符号化された2つ
の変換ブロックのフレームのフォーマットを説明する概
要図である。
第22a図から第22e図までは、特に本発明のO−TDAC変
換のために実現される、重複されてウインドウで処理さ
れた一連の時間領域信号サンプル・ブロックにグループ
化される時間領域信号を説明する、仮想表現図である。
第23a図から第23d図までは、O−TDAC変換によって作
り出される時間領域エイリアシングを説明する、仮想表
現図である。
第24a図から第24g図までは、O−TDAC信号合成の間
の、時間領域エイリアシングの重複・加算による相殺を
説明する仮想表現図である。
第24図は、誤り訂正を有しない、本発明のO−TDAC変
換の実施例のための、符号化された2つの変換ブロック
のフレームのフォーマットを説明する概要図である。
表Iは、本発明の15kHzのE−TDAC変換の実施例のた
めの、主指数、サブバンドのグループ化、及び係数ビッ
ト長を示す。
表IIは、本発明の20kHzのE−TDAC変換の実施例にお
いて必要な、サブバンドのグループ化、及び追加変換係
数のための係数ビット長を示す。
表IIIは、本発明のO−TDAC変換実施例において必要
な、サブバンド0中の差異を示す。
発明を実施するための望ましい形態 第1a図及び第1b図には、本発明の基本的な構造が示さ
れている。第1a図に示す本発明のコーダ部分は、以下の
部分から成る。すなわちこれらは、時間領域信号入力10
0、信号標本化及び量子化装置101、信号サンプル・バッ
ファ102、各ディジタル化時間領域信号ブロックを変調
する分析ウインドウ逓倍装置103、量子化信号を周波数
係数に変換するディジタル・フィルタバンク104、整数
値の変換係数の各々を浮動小数点表現に転換するブロッ
ク浮動小数点エンコーダ105、総合的信号のスペクトル
構成に従って各変換係数の表現に対してビットを割り当
てる適応ビット割当て装置106、割り当てられたビット
長に各変換係数を丸める均一量子化装置107、符号化さ
れた周波数係数を伝送又は記憶のためにビット・ストリ
ームに組み立てるフォーマット化装置、すなわち、フォ
ーマット装置109である。第1a図によって伝送通路110が
示されているが、符号化信号を、後で使用するために、
直ちに記憶することもできることを理解して置くべきで
あろう。
第1b図に示す本発明のデコーダ部分は、以下の部分か
ら成る。すなわち、符号化されたビット・ストリーム信
号入力111、符号化された周波数係数の各々を組み立て
られたビット・ストリームから抽出するフォーマット解
除装置、すなわち、デフォーマット装置112、各変換係
数を整数値の変換係数に転換する線形化装置113、変換
係数を時間領域信号ブロックに転換する逆ディジタル・
フィルタバンク114、時間領域信号ブロックを変調する
合成ウインドウ逓倍装置115、時間領域信号のディジタ
ル表現を復元する信号ブロック重複・加算装置116、ア
ナログ信号発生器117、及びアナログ信号出力118であ
る。
A.演算ハードウエア 本発明の基本的なハードウエアの構成は、第2a図から
第2e図までと、第3a図から第3b図までとに示されてい
る。所与の性能目標を達成するためには、経験的研究か
ら、在来の整数変換計算は少なくとも20有意ビットの精
度で行われなければならないことが分かっている。
44.1kHz又は48kHzの何れかのサンプル・レートを用い
る、本発明の単一チャネル版の好ましい実施例の実現に
おいては、時間領域入力信号を20μs以下の周期時間で
量子化する、16ビットのアナログ対ディジタル・コンバ
ータ(ADC)を利用している。16ビットのディジタル化
されたサンプルの各々を用いて、後続の計算で用いられ
る24ビットのワードの有意16ビットが形成される。待ち
時間なしの、20.5MHzで動作するモトローラ(Motorol
a)社製DSP56001型ディジタル信号プロセッサ(DSP)を
用いて、必要な計算が行われ、符号化・複号化過程が制
御される。スタティック等速呼出記憶装置(RAM)によ
って、DSPに対するプログラム化とデータ記憶とが行わ
れる。周期時間20μs以下の16ビットのディジタル対ア
ナログ・コンバータ(DAC)を用いて、複合されたディ
ジタル信号からアナログ信号が発生される。
第2a図に示すエンコーダのハードウエアの構成は、以
下のものから成る。すなわち、アナログ信号入力200、
低域フィルタ(LPF)200A、ADC 201、DSP 202、スタ
ティックRAM 203、消去可能固定記憶装置(EPROM)20
4、及び符号化されたシリアル信号出力206である。LPF
200A(第1a図に示されていない低域フィルタ)によっ
て、入力信号が帯域幅制限されることが保証される。AD
C 201によって、入力信号がシリアルの16ビットのワー
ドにディジタル化(標本化及び量子化)される。DSP 2
02によって、ディジタル化されたサンプルのシリアル・
ストリームが受け取られ、緩衝され、サンプルがブロッ
クにグループ化され、ブロックを周波数領域に変換する
ために必要な計算が行われ、変換係数が符号化され、コ
ード・ワードがデータ・ストリームにフォーマット化さ
れ、符号化信号がシリアル・データ通路206を通して伝
送される。このDSPのためのプログラミング及びデータ
作業領域は、2組の8,192個の24ビット・ワードに秩序
立てられているスタティックRAM 203の2つの24kBバン
ク中に記憶される。このDSPには、RAM中ではプログラマ
ブルROM中で実現されるよりも一層安価に実現される、
短呼出時間プログラム記憶装置が必要である。その結
果、EPROM 204では、エンコーダが最初に起動される時
にDSPによってRAM 203で使用できる形式で中身が取り
出される圧縮フォーマット中に、プログラミング及びス
タティック・データが記憶される。
第2b図及び第2c図では、2つのDSPインターフェイス
について更に詳細に示されている。第2b図には、DSP 2
02及びADC 201のためのシリアル通信インターフェイス
と、ADC 201と、シリアル・データ通路206とが示され
ている。タイミング発生装置202Aによって、エンコーダ
のための、受取りクロック、フレーム同期クロック、及
び伝送クロック信号が発生される。線路SC0によって、A
DC201からDSP 202へと、線路SRDに沿ってディジタル化
入力信号サンプルのシリアル・ビット・ストリームにク
ロック同期が掛けられる。線路SC1によって、各16ビッ
ト・ワードの始まりを標識するフレーム同期信号が、AD
C及びDSPに対して与えられる。線路SCKによって、DSPか
らシリアル・データ線路206へと、線路STDに沿って符号
化信号のシリアル・ビット・ストリームにクロック同期
が掛けられる。
第2c図には、メモリをアドレスするインターフェイス
が示されている。前記のモトローラ社のDSP56001のため
のメモリは、プログラム、Xデータ、及びYデータの3
つのセグメントに分割されている。RAMのバンクの1つ
にはプログラム・メモリが含まれているが、DSPによっ
て線路PSが低電位にされると何時でもこれが選択され
る。第2のバンクにはデータ・メモリが含まれている
が、線路DSが低電位にされると何時でもこれが選択され
る。線路XYを高電位にしたり、低電位にしたりすること
により、それぞれXデータ・メモリとYデータ・メモリ
とがDSPによって選択される。線路XYをアドレス線路A12
に取り付けることによって、Xデータ・メモリとYデー
タ・メモリとは別のアドレス空間に位置付けされる。し
たがって、Yデータ・メモリの4kワード(4096又は24ビ
ット・ワードの100016)がワード・アドレス0000から0F
FF16に位置付けされ、Xデータ・メモリの4kワードがワ
ード・アドレス100016から1FFF16に位置付けされ、プロ
グラム・メモリは8kワードの自身の空間中にあり、ワー
ド・アドレス0000から0FFF16から成る。
プログラム・データRAM 203及びEPROM 204は、別の
アドレス空間に位置付けされる。インバータ205Cによっ
て、DSP 202が、アドレス線路A15の状態に従ってRAM又
はEPROMの何れかを選ぶことが可能になる。DSP 202に
よってA15が高電位に設定されると、インバータ205Cに
よってRAM 203及びEPROM 204のチップ選択(CS)線路
は低電位に設定される。DSP 202によってA15が低電位
に設定されると、インバータ205CによってRAM 203及び
EPROM 204のCS線路は高電位に設定される。CS線路が高
電位に設定されると、スタティックRAMのみが選択され
る。
第2d図に示されるデコーダのハードウエアの構成は、
符号化シリアル信号入力通路207、DSP 208、スタティ
ックRAM 209、EPROM 210、DAC 212、LPF 213A、及
びアナログ信号入力213から成る。DSP 208によって、
符号化信号が受け取られ、緩衝され、この信号のフォー
マットが符号化変換係数に分解され、この係数を時間領
域に変換するのに必要な計算が行われ、この係数が時間
領域ブロックにグループ化され、このブロックが重複・
加算されてディジタル・サンプルの時間領域列にされ、
このディジタル・サンプルがシリアル・ビット・ストリ
ームの形でDAC 212に伝送される。DSPに関するプログ
ラミング及びデータ作業領域は、2つの8,192個の24ビ
ット・ワードに順序立てられているスタティックRAM 2
09の2つの24kBバンクに記憶される。EPROM 210によっ
て、エンコーダが最初に起動する時にRAM 209に対して
使用できる形式でDSPによって中身が取り出される圧縮
フォーマットで、プログラミング及びスタティック・デ
ータが記憶される。DAC 212によって、DSPから受け取
られるシリアル・データ・ストリームに対応するアナロ
グ信号が発生される。LPF 213A(第1b図には示されて
いない低域フィルタ)によって、出力信号213がこの符
号化・複合化過程で作り出されるあらゆる高域擬似信号
から免れることが保証される。
第2e図には、DSP 208のためのシリアル通信インター
フェイスと、シリアル信号入力通路207と、DAC 212と
が示されている。フェーズ・ロック・ループを用いて符
号化シリアル・ビット入力信号からタイミング基準を抽
出するタイミング発生器208Aによって、このデコーダの
ための、受取りクロック、フレーム同期クロック、及び
伝送信号が発生される。線路SC0によって、DSP 208
へ、線路SRDに沿って符号化シリアル・ビット信号のク
ロック同期が掛けられる。線路SCKによって、DSP 208
からDAC 212へと、線路STDに沿って複号ディジタル化
信号のシリアル・ビット・ストリームのクロック同期が
掛けられる。線路SC2によって、DACと、DSPとに対して
フレーム同期信号が与えられ、これによって、各16ビッ
ト・ワードの始まりが標識される。DSP 208とメモリ・
アドレス・バスとの間のインターフェイスは、エンコー
ダについて上に述べたのと同様な方法で実現される。第
2c図を参照して欲しい。
2チャネルのエンコーダでは、第3a図に示すように結
合された、LPF 200A及び200Bと、ADC 201A及び201Bと
が必要である。DSP及びADCの構成要素間のインターフェ
イスは、1チャネルのエンコーダについて上に述べたの
と類似の方法で動作する。タイミング発生器202Aによっ
て、フレーム同期信号の半分の伝送速度でDSPの線路SC2
に対して付加的な信号が与えられて、マルチプレクサ20
2Bが制御され、2つのADCの何れがディジタル化データ
を現在送っているかがDSPに対して指示される。
2チャネルのデコーダでは、第3b図に示すように結合
されたDAC 212A及び212Bと、LPF 213A及び213Bとが必
要である。DSP及びDACの構成要素間のインターフェイス
は、1チャネルのデコーダについて上に述べたのと類似
の方法で動作する。タイミング発生器208Aによって、フ
レーム同期信号の半分の伝送速度でDSPの線路SC1に対し
て付加的な信号が与えられて、逓減装置208Bが制御さ
れ、2つのDACの何れがディジタル化データを現在受け
取っているかがDSPに対して指示される。
この基本的なハードウエア構成を改変することができ
る。例えば、待ち時間なしの、27MHzで動作するモトロ
ーラ社のDSP65001 1個によって、2チャネルのエンコ
ーダ又はデコーダを実現できる。この場合、追加のRAM
が必要となるかもしれない。
特別のハードウエアを用いて、ウインドウ変調又は高
速フーリエ変換(FFT:Fast Fourier Transform)のよう
な幾つかの機能を行うこともできる。この総合的なエン
コーダ・デコーダを特別仕立ての集積回路中で実現する
こともできる。これ以外にも数多くの実施方法があるこ
とは、当業者にとっては明白であろう。
B.入力信号の標本化とウインドウ処理 本発明の現在の実施例において、信号標本化及び量子
化装置101は、引き続いて右側に8個の0ビットが引き
当てられて24ビットの整数表現を形成する16ビットに入
力信号を量子化する、アナログ対ディジタル・コンバー
タである。後続の変換計算は総て、24ビットの整数計算
で行われる。アナログ入力信号は、最高でも15kHz(20k
Hz帯域幅コーダに関しては、20kHz)に帯域幅を制限し
なければならない。これは、第1a図には示されていない
低域フィルタによって達成される。
他の品質に加えて、少なくともコンパクト・ディスク
(CD)が具える品質の音楽信号は、15kHzを超える帯域
幅を有する。ナイキストの理論から、15kHzの帯域の信
号は30kHz以上で標本化されなければならないことは周
知のことである。44.1kHzのサンプル・レートがCD用途
に用いられており、このサンプル・レートを選択するこ
とによって本発明をこのような用途に用いる装置が単純
化されるので、現在の実施例に対しては44.1kHzのサン
プル・レートが選ばれている。(このサンプル・レート
によって、本発明の20kHz帯域幅の代替的実施例をも実
施できる)。
別のサンプル・レート、つまり、多くの職業用オーデ
ィオ用途に一般的となっている48kHzのようなサンプル
・レートを用いることもできる。もし異なるサンプル・
レートが選ばれると、隣接する変換係数間の周波数分離
が変化し、望ましい信号帯域幅を表現するために必要な
係数の数が変化する。サンプル・レートを変えた際に本
発明の実施例が受ける総ての影響については、当業者に
とっては明白であろう。
入力信号が複素数でない、すなわち、虚数成分の総て
が0であると仮定すると、512サンプル・ブロックの周
波数領域変換によって、最大256の非0の特異変換係数
が作り出される。したがって、第1a図及び第1b図に示す
本発明は、256の周波数ビンから成る。この実施例にお
いて、各ビンの帯域幅は86.1Hz(又は44.1kHz/512)に
等しい。(幾つかの離散変換に関しては、ビン0、すな
わち直流又は0周波数は、この量の半分に等しい帯域幅
を有する)。15.6kHzの信号を通過させるために、0か
ら182までの係数のみが用いられる。(20kHzの信号を通
過させるためには、0から233までの係数が用いられ
る)。入力信号の帯域幅を超える追加の高い周波数係数
は、エイリアシング消去を行った際の設計帯域幅内での
量子化誤りの悪効果を最小化するために用いられる。入
力信号が15kHz(又は20kHz)に帯域幅制限され、最終的
出力信号もまた帯域幅制限されて、最高係数中を通過す
るあらゆるエイリアシングが相殺されていることに注意
して欲しい。
変換では、サンプル・ブロック中の信号は周期性のも
のであると仮定しているので、サンプル・ブロックが改
変、すなわち、修正されない限り、存在しないスペクト
ル成分を誤って作り出す。第4図を参照のこと。この変
換誤りは、第5図に示すようにブロックの縁の不連続性
に起因している。これらの不連続性を緩和して、この効
果を最小化することもできる。ブロックの縁の近くにあ
るサンプルを0に近付けるように、ブロックをどのよう
にして改変又は重み付けするかについて第6a図から第6d
図までに示してある。第6a図に示す逓倍装置の回路によ
って、第6b図に示す標本化入力信号x(t)が第6c図に
示す重み付け機能により変調される。この結果生じる信
号を第6d図に示す。この過程は第1a図の箱103で表され
る。分析ウインドウと呼ばれるこの重み付け関数は、信
号サンプル・ブロックをサンプルごとに逓倍することで
あるが、この形状によってディジタル・フィルタの性能
に強い影響を与えるので、数多くの研究の主題となって
きた。その例として、ハリスによるIEEE学会誌1978年66
巻51ページから83ページまでの論文、「離散フーリエ変
換を用いた高調波分析のためのウインドウの使用につい
て」(Harris,“On the Use of Windows for Harmonic
Analysis with the Discrete Fourier Transform",Pro
c.IEEE,vol.66,1978,pp.51−83)を参照のこと。要約す
ると、良好なウインドウによって、阻止帯域幅の深さの
所与の水準に対する僊移帯域ロールオフの鋭さが増大さ
れ、隣接するブロックを重複・加算することによりウイ
ンドウの変調効果を修正することが可能になるというこ
とである。ウインドウの設計については、以下で更に詳
しく論考する。
C.分析フィルタバンク、前向き変換 離散変換によって、第1a図に示すディジタル・フィル
タバンク104が実現される。フィルタ作用は、時間領域
信号サンプル・ブロックを時間変化スペクトル係数に転
換することによって行われる。本発明の1つの実施例で
用いられているこの変換技法は、IEEEの音響、音声、信
号処理に関する学会誌1986年ASSP−34巻1153ページから
1161ページまでの、プリンセンとブラッドリーによる論
文、「時間領域エイリアシング相殺に基づく分析・合成
フィルタバンクの設計」(Princen and Bradley,“Anal
ysis/Synthesis Filter Bank Design Based on Time Do
main Aliasing Cancellation",IEEE Trans.on Acoust.,
Speech,Signal Proc.,vol.ASSP−34,1986,pp.1153−116
1)中で初めて叙述された。この技法は、偶数に重ねら
れ、厳密に標本化された単側波帯分析・合成系の時間領
域等価である。本出願では、この変換を、偶数に重ねら
れた時間領域エイリアシング相殺(Evenly−Stacked Ti
me−Do−main Aliasing Cancellation:E−DTAC)と呼
ぶ。この技法は、1987年ICASSP会議報告、1987年5月号
の2161ページから2164ページまでのプリンセン、ジョン
ソン、とブラッドリーによる論文、「時間領域エイリア
シング相殺に基づく分析・合成フィルタ・バンクの設計
を用いてのサブバンド・変換符号化」(Princen,Johnso
n,and Bradley,“Subband/Trans−form Coding Using A
nalysis/Synthesis Filter Bank Design Based on Time
Domain Aliasing Cancellation",ICASSP 1987 Conf.Pr
oc.,May 1987,pp.2161−64)中に叙述されている。この
代替的変換は、奇数に重ねられ、厳密に標本化された単
側波帯分析・合成系の時間領域等価である。本出願で
は、この変換を、奇数に重ねられた時間領域エイリアシ
ング相殺(Oddly−Stacked Time−Domain Aliasing Can
cellation:O−TDAC)と呼ぶ。O−TDAC変換を用いる本
発明の実施例については、E−TDACの実施例について十
分叙述した後に論考する。
E−TDACでは、改変された離散正弦変換(Discrete S
ine Transform:DST)を伴う改変された離散余弦変換(D
iscrete Cosine Transform:DCT)の代替的応用に等価の
変換関数を利用する。DCTは以下の式1、DSTは以下の式
2に示される。
すなわち、 ここで、 k=周波数係数番号 n=入力信号サンプル番号 N=サンプル・ブロック長 m=E−TDACに関する位相項 x(n)=サンプルnにおける入力信号x(t)の量子
化数 C(k)=DCT係数k S(k)=DST係数k である。
E−TDAC変換では、2組のスペクトル係数又は変換ブ
ロックの1つが各信号サンプル・ブロックに対して交互
に作り出される。これらの変換ブロックは、次式の形を
取る。
すなわち、 ここで、 i=信号サンプル・ブロック番号 C(k)=DCT係数(式1を参照のこと) S(k)=DST係数(式2を参照のこと) である。
ここで用いられる計算アルゴリズムは、高速フーリエ
変換(FFT)である。クーリーとテューキーによる数学
計算誌1965年19巻、297ページから301ページまでの論
文、「複体フーリエ・シリーズの機械計算のためのアル
ゴリズム」(Cooley and Tukey,“An Algorithm for th
e Machine Calculation of Complex Fourier Series",M
ath.Comp.,vol.19,1965,pp.297−301)を参照のこと。
単一のFFTを用いて単一複体変換の実数及び虚数成分と
してDCT及びDSTをそれぞれ決定することによって、DCT
及びDSTを同時に行うことができる。この技法では、FFT
は複素変換であるが、両方の入力信号サンプル・ブロッ
クは実数値のサンプルのみから成るという事実を利用し
ている。これらの変換を1つのFFTと複素定数のアレイ
との積に因数分解することによって、DCT係数が1組の
実数値として変換から出現し、DST係数が1組の虚数と
して表される。したがって、1つの信号サンプル・ブロ
ックのDCTを、もう1つの信号サンプル・ブロックのDST
と共に、複素アレイの乗算及び加算が後に続くただ1つ
のFFTによって、同時発生的に計算することができる。
1つのFFTを用いて2つの変換を同時発生的に計算す
るこの基本的な技法は、当分野では周知のものであり、
ニュー・ジャージイ州イングルウッド・クリフズのプレ
ンティス・ホール社1974年出版の、プリガムによる「高
速フーリエ変換」(Brigham,The Fast Fourier Transfo
rm,Englewood Cliffs,NJ:Prentice−Hall,Inc.,1974)
に叙述されている。E−TDACに対する改変DCT及びDSTの
同時発生的な計算に関する追加的な情報は、カリフォル
ニア州スタンフォードのスタンフォード大学の、ルッカ
ボウによる1988年6月の博士学位論文、「音声の可変レ
ート及び適応周波数領域ベクトル量子化」(Lookabaug
h,“Variable Rate and Adaptive Frequency Domain Ve
ctor Quantization of Speech",Stanford,CA:Stanford
University,PhD Thesis,June,1988)中に見ることがで
きる。
本発明の1チャネル版の好ましい実施例では、2つの
隣接する信号サンプル・ブロックは、バッファに記憶さ
れ、共にDCT・DSTペアに変換される。このブロック・ペ
アは、続いて伝送と記憶のために量子化され、フォーマ
ット化される。
2チャネル系では、2チャネルの各々からの信号サン
プル・ブロックを処理すること、すなわち、DSTブロッ
クを1つのチャネルに対して発生し、DCTブロックを第
2のチャネルに対して発生することによって、同時発生
的な処理が達成される。所定のチャネルに対する符号化
ブロックは、DCTとDSTとの間を交互し(式5及び29を参
照のこと)、それぞれのチャネルの形式とは常に逆の形
式になる。
プリンセンは、適正な位相成分m、及び注意深く設計
された1組の分析・合成ウインドウを用いることによっ
て、E−TDAC技法では以下の形式の余弦及び正弦変換の
交互する列から正確に入力信号を復元できることを示し
ている。
すなわち、 {C(k)}0,{S(k)}1,{C(k)}2,{S
(k)}3, …(5) である。ここで、各変換ブロックは、1つの時間領域信
号サンプル・ブロックを表す。この過程は、第14a図か
ら第14e図までと、第15a図から第15d図までと、第16a図
から第16g図までに示されている。
第14a図を参照すると、1組の量子化された入力信号
x(t)がブロックにグループ化されていることが分か
る。第14b図に示すウインドウ関数Wcで変調された1組
のブロックによって、第14d図に示す信号xc(t)が作
り出される。信号xc(t)はDCTに対する入力である。
標本化された入力信号x(t)のブロックの別の1組
は、第1の組とブロック長の半分だけ重複されるが、第
14c図に示すウインドウ関数Ws(これのウインドウ関数
はWcと同等であるが、時間的にブロック長の半分だけず
れている)によってウインドウ処理されて第14e図に示
す信号xs(t)を作り出し、次にDSTに受け渡される。
DCT及びDSTの交互の変換ブロックのみを用いることに
よって、これらの変換ブロックの廃棄された半分に含ま
れる情報が失われることになる。この損失によって時間
領域エイリアシング成分が作り出されるが、式1及び式
2について適切な位相項mを選び、重複された時間領域
信号サンプル・ブロックに対して前向き変換を適用し、
逆変換で復元される隣接する時間領域信号サンプル・ブ
ロックを重複・加算することによって、このひずみを相
殺することができる。
式1及び式2における位相項mによって、この時間領
域エイリアシングひずみの位相転移が制御される。第15
a図から第15d図までと、第16a図から第16g図までに、こ
のひずみが説明されている。逆DCTから復元される信号
x′(t)が、第15a図に示されている。第15b図で
は、この復元信号が2つの成分、すなわち、元のウイン
ドウ処理された信号(実線)と、時間領域エイリアシン
グひずみ(点線)とから成ることが示されている。第15
c図及び第15d図には、逆DSTから復元される信号x′
(t)についての類似の情報が示されている。このエイ
リアシングひずみを相殺し、元の時間領域信号を正確に
復元するために、E−TDACではこのエイリアシングが次
のようであることが必要である。すなわち、DCTについ
ては、時間領域エイリアス成分は、サンプル・ブロック
の約1/4の点の時間以内で反転される標本化信号の第1
半部と、サンプル・ブロックの約3/4の点の時間以内で
反転される標本化信号の第2半部とから成ることであ
る。DSTについては、このエイリアス成分は振幅の記号
が逆になっていること以外は、DCTについての場合と類
似であることである。第15b図及び第15d図を参照のこ
と。エイリアス相殺に必要な位相項は、次式のとおりで
ある。
すなわち、 ここで、 N=サンプル・ブロック長 である。
E−TDACにもまた、重複された信号サンプル・ブロッ
クに対して、注意深く設計された1組の分析・合成ウイ
ンドウを適用することが必要である。この信号サンプル
・ブロックは100%の重複、すなわち、所与のブロック
の50%が前のブロックによって重複され、同ブロックの
残りの50%が後のブロックによって重複されている形
で、重複されていなければならない。第16a図から第16g
図まで、信号サンプル・ブロックの重複と、その結果の
エイリアス消去とについて示してある。第16a図及び第1
6d図に示す、逆DCT及び逆DSTから復元される信号y
c(t)及びys(t)は、それぞれウインドウ関数W
c(t)及びWs(t)によって変調されて、これにより
第16c図及び第16f図に示す信号y′(t)及びy′
(t)が作り出される。これらのウインドウ処理された
信号の重複されたブロックが加算されると、エイリアス
成分は消去され、第16g図に示すその結果の信号y
(t)は元の入力x信号(t)を正確に再構成したもの
となる。
この分析・合成過程中に用いられるウインドウの設計
と重複・加算については、以下で更に詳しく論考する。
この時点では、変換ブロックの半分を省略することによ
って必要なビットレートは半減されるが、信号合成中に
E−TDACに必要な100%重複を行うことによりビットレ
ートが倍加されることを注意して置くことで十分であ
る。その結果、E−TDACは必要なビットレートに対して
は中立的な効果を持つ。
D.不均一量子化 フィルタ・バンク104から誘導される各変換係数は、
不均一量子化装置108によって、符号化され、サブバン
ドにグループ化される(表I及びIIにサブバンドに対す
る変換係数の割当てを示す)。この不均一量子化装置
は、第1a図に示す、ブロック浮動小数点エンコーダ105
と、適応ビット割当て装置106と、均一量子化装置107と
によって構成されている。量子化は、変換ブロック・ペ
ア、すなわち、1チャネル系における2つの隣接するブ
ロックの何れか、若しくは、2チャネルの各チャネルか
らの1つのブロックに対して行われる。第7図に示すよ
うに、不均一量子化は、5つの主要な部分から成る。す
なわち、(1)サブバンド指数を計算し、(2)主指数
を決定し、(3)係数の周波数の関数としての各係数コ
ード・ワードのビット長を初期設定し、(4)特定のコ
ード・ワードに対して追加ビットを適応的に割り当て、
及び(5)適応ビット割当てと、係数の周波数に基づく
最小ビット長との合計から計算されるビット長に従って
コード・ワードの丸めと打切りを行うことである。
数値量の浮動小数点表現は、ディジタル・データ表現
の分野では周知であり、整数表現で可能な範囲より一層
広い範囲の値を表現するために用いられる。浮動小数点
数は、仮数及び指数で構成される。本発明の実施例にお
いて、仮数は、2の補数形式で表現される記号化された
整数値表現である。
この対応する指数は、表現されている数の量の真値に
この仮数を転換(正規化又は非正規化の何れかに)する
のに必要な、2のべきの乗数に等しい非記号化値であ
る。この表現は、以下のように表現できる。
すなわち、 F=M・2-E (7) ここで、 F=浮動小数点の値 M=記号化整数値仮数 E=非記号化整数値指数 である。
例えば、指数3では、この浮動小数点の値が、この整
数値仮数に2-3を乗じることにより得られることを指示
する。これは、仮数の二進表現を右へ3桁移動すること
と等価である。
正の非0仮数は、最も有意のビットが非0である時、
正規化されていると言われる。負の値を持つ仮数は、最
も有意のビットが0である時、正規化される。正規化さ
れた仮数によって、数の量に対する有意のビットの最大
値が仮数の制限ビット長内に含まれることが保証され
る。
ブロック浮動小数点表現もまた、当分野では周知であ
り、従来の浮動小数点表現で可能なビット数より少ない
ビットで1組の浮動小数点数を表現するために用いられ
る。この技法では、仮数の群に対して1つの指数を用い
る。この群中の幾つかの仮数は、正規化することができ
ない。この群中で最も大きい量に対する仮数は、その量
が小さ過ぎる、すなわち、正規化するのに必要な倍数を
指数が表現することが不可能ということがないという条
件下で、正規化される。しかし、仮数が正規化されるか
されないかに拘らず、指数は、浮動少数点量の真値を得
るためにこの群中の各整数値仮数を右に転移しなければ
ならない桁数を常に表現する。
1.サブバンド指数 ブロック浮動小数点エンコーダは、部分1及び2の不
均一量子化装置から成る。第1部分によって演じられる
機能を、第7図の箱701に示す。この部分によって、幾
つかのサブバンド周波数係数の各々に対するサブバンド
指数が計算される。これらのサブバンドは表Iに示され
ている。この過程は、3つの段階から成る。第1段階で
は、1つの変換ブロック内で各サブバンド中の最大の変
換係数を見付け、これらの24ビットの係数を正規化する
ために必要な左への転移の桁数を決定する。第2段階で
は、第2の変換ブロックに関して対応する転移値を決定
する。第3段階では、第1の変換ブロック中の各サブバ
ンドの転移値とこれに対応する第2の変換ブロックの転
移値とを比較し、この2つの中の小さい方の値を選び、
この値を量ブロック中の適切なサブバンドに対する指数
として保存する。
2.主指数 不均一量子化装置部分の第2部分によって、2つのサ
ブバンド群の各々に対する1ビットの主指数の値が決定
される。この主指数は、コーダのダイナミック・レンジ
を広げるために用いられる。表Iを参照すると、主指数
MEXP0によって、低いサブバンド周波数0から18までが
表現されていることが分かる。主指数MEXP1によって、1
9から36までの高いサブバンド周波数が表現される。(2
0kHzコーダに関しては、表IIに示されているように、3
つの追加的サブバンドが必要である)。もし群の中の総
てのサブバンド指数が3であるか若しくはそれ以上であ
れば、この群に対する主指数は1に設定され、群中の総
てのサブバンド指数は3まで減らされる。主指数が1に
設定されると、群中の総てのサブバンド内の総ての符号
化された主指数が、サブバンド指数値によって指示され
る桁よりも3桁左に転移されることが指示される。主指
数が0である時には、群中の各サブバンド指数によっ
て、このサブバンド中での各変換係数に関する左への転
移の合計桁数が正確に表現される。これらの主指数によ
って、十分なダイナミック・レンジを持たせながら、よ
り短いサブバンド指数を用いることが可能になる。過程
中のこの段階は、第7図の箱702a及び702bに示されてい
る。
符号化信号を表現するのに必要な総合的なビットを減
少させる、追加的な段階を取ることもできる。1つの指
数によって単一の係数が表現されている総てのサブバン
ドにおいて、正規化された仮数の記号ビットは過分なも
のである。上で論考したように、正規化された仮数中で
は、記号ビットと最も有意なデータ・ビットとは、常に
逆の値である。したがって、記号ビットをエンコーダに
よって脱落させることができ、デコーダによって復活さ
せることができる。この脱落されたビットを当出願では
「隠れビット」と呼ぶ。
仮数が正規化されているかどうかを、指数を調べるこ
とによって判断できる。もし指数が最大値(本発明の好
ましい実施例で用いている浮動小数点系中では主指数を
調整した後に15になる)よりも小さければ、この仮数は
正規化されている。もし指数が最大値に等しければ、結
論を引き出すことができないので、仮数は正規化されて
おらず、隠れビットはないものと仮定される。
この技法は、仮数が自身の独特の指数を1つしか含ん
でいない仮数に関してのみ用いることができる。本発明
の好ましい実施例においては、DCTサブバンド0のみが
この要件に合致する。すなわち、DCTサブバンド0は、
ただ1つの係数から成り、組み合わせのDSTブロック中
のサブバンドとは指数を分けあっていない。変換ブロッ
クのペアの間で指数を分けあっていないコーダにおいて
は、1つの係数のみを含むサブバンドの総てに対して隠
れビット技法を用いることができる。
ビット要件の低減は、DCT係数0に対する固定ビット
長に反映される。表Iに示すように、係数C(0)に対
する「最小」ビット長は8ビットである。隠れビット技
法を用いなかったとすれば、C(0)に対する固定ビッ
ト長は、係数S(0)に対するビット長と等価、若しく
は9ビットとなったであろう。係数C(0)が正規化さ
れていない状況下では、周波数成分の大きさが非常に低
いので、ビット長が低減されることによって聴取可能な
量子化雑音が生成される可能性はない。
3.固定ビット長 不均一量子化装置の第3成分によって、左に転移され
た変換係数の各々に対する初期最小ビット長が設定され
る。このビット長は、係数の周波数に従って設定され
る。第7図の箱703にはこの過程のこの部分が表され、
表Iには各係数のコード・ワードに対して固定されるビ
ットの最小数が示されている。この最小ビット長は、代
表的なフィルタバンクの応答特性曲線を音響心理学的マ
スキングしきい値曲線と比較することによって誘導され
たものである。フィルタの性能は信号及び係数の周波数
の間の周波数差のみの関数であるので、このフィルタバ
ンクの応答特性を表すのにどのような周波数係数を用い
ても良い。第9図に示す応答特性曲線は、フィルタの通
過帯域内の周波数の範囲に対するフィルタの応答特性の
実効値から得られる。上で論じたように、フィルタの選
択度は、分析ウインドウの形状と、各時間領域信号ブロ
ック中のサンプルの数とによって影響される。信号合成
過程中に付加的な選択度の損失が生じるので、総合的コ
ーダの応答特性は第9図に示す程には良好ではないこと
に注意して置きたい。この効果については以下で論考す
るが、第17a図及び第17b図にもまた示されている。
2つの音響心理学的マスキング曲線が第9図に示され
ている。これらの曲線は、オーディオ技術協会誌1988年
第35巻の517ページから534ページまでのフィールダーに
よる論文、「ディジタル・オーディオ・コンバータによ
って作り出される聴取可能なひずみと雑音の評価」(Fi
elder,“Evaluation of the Audible Distortion and N
oise Produced by Digital Audio Converters",J.Aud−
io Eng.Soc.,vol.35,1988,pp.517−534)から誘導され
たものである。耳の聴覚上の選択度は周波数と共に大き
く変化するが、500Hzから2kHzの間の周波数に対しては1
kHzの曲線が耳の特性を代表し、より高い周波数に対し
ては4kHzの曲線が耳の特性を代表する。低いビット・レ
ートを達成するためには、変換コーダに関しての僊移帯
域ロールオフと阻止帯域排除の割合は、音響心理学的マ
スキング曲線の割合と同じ程度に大きくなければならな
い。とりわけ、1kHz以下のマスキング信号音に対する耳
の聴覚上の選択度は極めて高いことに注意して欲しい。
フィルタ選択度の不十分さは、低い周波数の係数に対
して追加ビットを確保することによって部分的に補償さ
れる。第10図では、フィルタの応答特性を4kHzの音響心
理学的マスキング曲線に対して比較している。周波数が
上がるにつれてコーダの帯域幅と選択度が音響心理学的
マスキング曲線に対して向上するので、高い周波数の係
数を表すために必要なビット数は少なくなる。この関係
は、表Iに示す最小ビット長の値に反映されている。
第11図では、1kHzのマスキング曲線は、この音響心理
学的マスキング曲線が常に上になるように偏らせてある
フィルタ応答特性に対して比較している。このフィルタ
応答特性に関する偏りは、低い周波数の係数に対して確
保してある追加ビットによって得られる、精度の増加に
負うものである。各追加ビットによって、信号対雑音比
が約6dB向上する。第11図では、もしマスキングに寄与
する別の信号音が存在しなければ、低い周波数の変換係
数を符号化するために8dBの偏り(又は約1.3の追加ビッ
トの精度)を必要とすることが示されている。
しかし、第9図、第10図、及び第11図に示されている
曲線は、単音又は非常に狭い帯域の雑音によって作り出
される音響心理学的マスキング効果を表しているので、
これらの図によって示唆されている最小ビット長は控え
目なものである。第12図には、3つの音の個々のマスキ
ング曲線を単純に重ね合わせることによって誘導された
複合マスキング曲線が示されている。経験的な証拠によ
って、重合音の実際のマスキング効果を理解すると、こ
の複合マスキング曲線さえもまた、非常に控え目なもの
であることが示されている。更に、一般的に音楽な幾つ
かの個別の周波数よりも数等複雑な信号であり、その結
果、マスキングの水準が増大することによって、変換係
数コード・ワードに必要な精度を下げることが可能にな
る。結果として、表Iに示される、DCT係数C(0)及
びDST係数S(1)以外の総てに関する最小ビット長
は、第10図、及び第11図のマスキング曲線によって示唆
される各係数コード・ワードのビット長から3ビットを
控除することで得られる。上記の2つの低い周波数の係
数以外は、特定の係数の精度を増加するために必要なと
ころでは、適応ビット割当てによって追加ビットが供給
される。
もし係数0及び1を適応ビット割当て過程に含めると
したら、入力信号チャネルにサンプル・ブロック長と比
較して周期の長い低い周波数スペクトル成分が含まれる
時には何時でも、サンプル・ブロック・レートに等しい
周波数において量子化雑音がE−TDACコーダによって発
生されるであろう。この雑音は、低い周波数成分を含む
チャネル内で、2つの機構の相互作用によって生成され
る。第1に、E−TDAC変換によって低い周波数成分が係
数0[DCT C(0)及びDST S(0)]に関する非0
及び0の値の交互の繋がりに転換される。係数C(0)
はDCT変換ブロック中では非0であるが、係数S(0)
はDST変換ブロック中では常に0である。係数1[DCT
C(1)及びDST S(1)]は、フィルタバンクのサ
イドロープ効果のためにより少ない影響しか受けない。
第2に、これら2つの低い周波数の係数を適応ビット割
当て過程に含めることによって、チャネルに対する割当
てアルゴリズムは2つのビット割当てパターン、すなわ
ち、1つがDCTブロック用、もう1つがDSTブロック用の
ビット割当てパターンの間を行き来する。適応的に割り
当てられるビットの数は固定されているので、DCTブロ
ック中で係数C(0)に割り当てられるビットはDSTブ
ロック中のような他の変換係数に割り当てられる余裕は
ない。[係数S(0)の値は常に0であるので、どのよ
うな適応割当てビットを割り当てられることもない]。
この交互のパターン割当ては、86.1Hz(又は44.1kHz/51
2)のサンプル・ブロック・レートに等しい周波数の聴
取可能な量子化雑音となって顕れる。
本発明の現在の実施例では、DCT係数C(0)に対し
て8ビットの固定ビット長、DST係数S(1)に対して
9ビットを割り当て(表Iを参照)、これらを適応ビッ
ト割当てから除外する。この除外によって、前文節で述
べた、この適応ビット割当て構想での量子化雑音の発生
が避けられる。
4.適応ビット割当て a.大要 不均一量子化装置の第4部分によって、適応ビット割
当てが行われる。第7図の箱704には、この割当て過程
の大要が提示されている。大かまに言って、各変換ブロ
ックについて、ビット割当てによって、固定の数の追加
ビットが特定の係数に対して4つの相で割り当てられ
る。このビットの数は、信号符号化品質とビット伝送速
度との平衡に取るべく選ぶことができる。本発明の好ま
しい実施例では、毎秒128kビットの総合的ビット伝送速
度を達成するために、この割当ての制限値を変換ブロッ
ク当たり133ビットに設定している。誤り訂正符号(下
で論考する)を用いる用途では、同じ総合ビット伝送速
度を維持するために、この制限値をブロック当たり124
ビットに低減しなければならない。当出願では、この制
限を割当て最大値又は割当て可能数と呼ぶ。
現状の実施例では、係数当たり4ビットの最大値を割
り当てている。この最大値は、符号化精度と総合的ビッ
ト伝送速度との間の設計上の妥協を表している。当業者
には、本発明の概念又は基本的目的を変更せずに、この
適応的に割当て可能なビットの最大値と数を変えること
ができることが分かるであろう。
相0は、残りの相に対する初期化の過程である。相1
では、係数当たり4ビットの最大値までが、最大のスペ
クトル・エネルギーを有する周波数成分の同一の臨界周
波数帯域内にある係数に対して、割り当てられる。もし
割当て可能なビットの総てが相1の期間中に割り当てら
れたならば、この割当て過程は停止される。もしそうで
なければ、相2によって、総合的な適応割当ビットが各
係数に対して4ビットになるように、相1の期間中に割
り当てられた変換係数に対して、追加ビットが割り当て
られる。もし割当て可能なビットの総てが相2の期間中
に割り当てられるならば、この割当て過程は停止され
る。もしビットが幾らかでも残っているならば、相3に
よって、相1及び相2の期間中に割り当てられた係数に
隣接する係数に対して、ビットが割り当てられる。この
手順の更に詳細な概念については、以下の文節で叙述す
る。この手順の論理の実施については、その後で論考す
る。
第8図は、特定の変換係数に対してビットを割り当て
る概念上の過程の図である。相0の初期化段階が箱800
中に示されている。第1段階では、アレイA()の要素
が0に設定される。次の段階では、最大のスペクトル成
分を有するサブバンドに対する指数である、最小のサブ
バンド指数が識別され、この値がXMINとして保存され
る。総てのサブバンド指数がXMINから控除され、差がア
レイM()中に記憶される。有り得る最小のサブバンド
指数は0であり、有り得る最大のサブバンドの指数は4
ビットの高い周波数サブバンド指数に対する最大値15に
主指数MEXP1に対する値3を加えた、18であることに注
意して欲しい。これについては、表Iを参照して欲し
い。したがって、アレイM()中の有り得る値の範囲
は、負の18から0までである。次のステップで、アレイ
M()の各要素に4が加えられ、0以下の総ての要素は
0に設定される。相0の最後において、アレイM()
は、各サブバンドについて1つの、値が0から4までの
範囲の要素の組から成る。4の値を有する要素は、サブ
バンド中の少なくとも1つの係数が全信号中で最大のス
ペクトル係数を有するサブバンドを表す。
相1では、第8図の箱801に示す過程を用いて、各サ
ブバンド中の係数に対して割り当てられるべきビットを
表す、もう1つのアレイA()が構築される。このアレ
イA()中の各要素は、1つのサブバンドに対応する。
表Iから、最高のサブバンド指数は重合する変換係数を
表すので、A()の各要素は対応するサブバンド中で総
ての変換係数に割り当てられるビット数を表すことを思
い出して欲しい。例えば、表Iを参照すると、サブバン
ド13は、係数13から14を表す。もし要素A(13)が値1
を有するならば、変換係数13及び14に対して1ビットず
つの、2ビットが割り当てられることを示している。こ
の例について続けると、もし要素A(36)が値2を有す
るならば、係数168から182までに対して2ビットずつ
の、30ビットが割り当てられる。この割当て過程の間
中、A()の各要素が増分されるにつれて、割当てのた
めに残されているビットの数から割り当てられたビット
の数が控除される。
この相又は後続の何れかの相の間中に割当て可能なビ
ットの総てが割り当てられると、この相は直ちに終結
し、後続の相は省かれる。割当て限界に達する最終段階
中に、この段階中にサブバンドに割り当てられるビット
の数は、割当てのために残されているビットの数を超え
ない。2つ以上の係数を有するサブバンドの処理が行わ
れている間に、割当て可能なビットの最後のものが割り
当てられると、このサブバンド中の係数の総てに同じ数
のビットが割り当てられないこともあり得る。
最も低い周波数係数を表すM()アレイ要素[DCTブ
ロックに関してはM(1)、DSTブロックに関してはM
(2)]から始めて、M()の各要素が次々に検査され
る。M()アレイ全体を通して、若しくは割当て可能な
ビット総てが割り当てられるまで、4回もの検査が行わ
れる。第1回の検査で、アレイA()中の各要素は、も
しアレイM()中の対応する要素が4に等しい値であれ
ば、1だけ増分される。第2回の検査によって、3又は
4の値を有するM()中の各要素に対応するアレイ
A()中の各要素が、1だけ増分される。第3回の検査
で、アレイA()要素は、対応するM()要素が2から
4までの範囲内の値を有するならば、増分される。最後
の検査によって、1から4までの範囲内の値を有するM
()要素に対応するアレイA()中の要素が増分され
る。アレイM()中の要素の合計が割当て制限値に達す
るか、若しくはそれよりも少なければ、この時点でのア
レイM()及びA()の内容は等価であることに注意し
たい。もし割り当てられたビットの数が割当て限界に達
したならば、このビット割当て過程は相1の最後で完結
する。
もし割当て可能なビットが幾つかでも残っているなら
ば、第8図の箱802に示す相2の割当てが続行される。
この相では、A()アレイ全体にわたって3回もの検査
が行われ、もし、最大数の割当て可能なビットが割り当
てられると、早々に停止される。各検査は、最も低い周
波数要素[DCTブロックに関してはA(1)、DSTブロッ
クに関してはA(2)]で開始され、周波数を上げなが
ら進められる。アレイA()全体にわたる第1回の検査
で、1と3との間の値を有する各要素が1だけ増分され
る。第2階の検査で、2又は3の値を有する要素が増分
される。第3回の検査で、3に等しい要素が増分され
る。割当て制限値を超えることなくこの相が完結するな
らば、A()アレイ中の各要素の値は、4または0の何
れかである。
もし割当て可能なビットが残っているならば、第8図
の箱803に示す相3の割当てが続行される。前の相と同
じように、割当て制限値に達すると直ちに相3の割当て
は終了する。この最後の相によって、高いエネルギーを
持つ係数のサブバンドに隣接する、低いスペクトル・エ
ネルギーを持つ変換係数に対して、追加ビットが割り当
てられる。この割当ては、3段階で達成される。第1段
階によって、値{0,4}を持つ2つの隣接要素の群を探
索するための、最も高い周波数要素A(36)[20kHz帯
域幅コーダでは要素A(39)が開始要素]から始まる、
アレイA()の走査が行われる。もしこれが見付かれ
ば、この群の値が{1,4}になるように、値が0である
要素が1に設定される。
もし割当て限界に達していなければ、値{4,0}を持
つ2つの隣接要素の組を探索するために、最も高い周波
数サブバンドから始め、低い周波数に向けてアレイ
A()を走査することで、相3の段階2が開始される。
もしこれが見付かれば、0の値を有する要素が1に設定
されて{4,1}の値が作り出される。
相3の第3及び最終段階によって、この相の段階1及
び段階2の中でビットを割り当てられたサブバンドの中
の係数に対して、追加ビットが割り当てられる。アレイ
A()の最も高い周波数要素で始めて、段階1中で改変
された各要素が増分される。最後に、段階2中で改変さ
れた要素が、最も高い周波数サブバンドから始め、増分
される。この第3の段階によって、上で論じたのと同じ
順序で、割当て可能なビットが総て割り当てられるま
で、若しくは段階1及び段階2の中で改変された要素の
総てに合計4ビットずつが割り当てられるまで、アレイ
要素が反復的に増分される。もし後者の条件に一致し、
割当て可能なビットが幾つかでも残っているならば、相
3が、段階1から始まり、繰り返される。
b.適応ビット割当て論理 適応ビット割当ての概念については、第8図に表現
し、上で述べた。このアルゴリズムの概念を理解するこ
とは、適応ビット割当てルーチンの実際の論理を理解す
るのに役立つ。
相0は、0に等しいアレイA()の総ての要素を初期
化し、T1からT4までの4つの表を構築することから始ま
る。これらの表の構築は、以下の段階を通して達成され
る。すなわち、(1)最小のサブバンド指数を識別し、
この値をXMINとして保存し、(2)最も低い周波数サブ
バンド(DCTブロックについてはサブバンド1、又は、D
STブロックについてはサブバンド2)から始めて、サブ
バンド指数(表I参照)をXMINから控除し、(3)もし
この差が0であれば、このサブバンド数を表T1、T2
T3、及びT4に挿入し、(4)もしこの差が負の1であれ
ば、このサブバンド数を表T1、T2、及びT3に挿入し、
(5)もしこの差が負の2であれば、このサブバンド数
を表T1、及びT2に挿入し、(6)もしこの差が負の3で
あれば、このサブバンド数を表T1に挿入し、(7)総て
のサブバンドが処理されるまで、各サブバンドに対して
段階3から段階6までを続行する、段階である。この段
階の最後において、表T1にはXMIN−3からXMINまでの範
囲の指数を有する総てのサブバンドの数、表T2にはXMIN
−2からXMINまでの指数を有するサブバンド、表T3には
XMIN−1からXMINまでの指数を有するサブバンド、表T4
にはXMINに等しい指数を有するサブバンドが含まれる。
ここで重要なことは、各表へのサブバンド書込みが周波
数の上がる順序で行われることである。
相1によって、最大のサブバンド指数を有するサブバ
ンド中の変換係数に対して、ビットが割り当てられる。
最初の表T4への書込み(最も低い周波数)から始めて、
この表で表される各サブバンド内の各変換係数に対して
1ビットが割り当てられる。割当ては、表T3、T2、最後
にT1へと、次々に反復される。この過程は、割当て可能
なビットが総て割り当てられるまで、若しくはT4からT1
までの表への総ての書込みが処理され終わるまで、続行
される。サブバンド中の総ての係数に対してビットが割
り当てられると、A()中の要素が各サブバンド中の各
変換係数に対して割り当てられる全ビットを反映するよ
うに、アレイA()のサブバンドに対応してアレイ
A()中での書込みが1だけ増分される。
前に注意したように、割当て可能なビットが総て割り
当てられると割当ては直ちに終結する。各表への書込み
によって、一般的に重合変換係数を含むサブバンドが表
される。したがって、もし割当て可能ビットの最後のも
のが2つ以上の係数を持つサブバンドを表す表書込みに
割り当てられるならば、そのサブバンド中の係数の総て
には同じ数のビットが割り当てられないことが起こり得
る。そのような状況下では、この割当て過程によって、
継続してアレイA()中に記憶されるサブバンド割当て
の合計から、サブバンド中のどの係数が控除しなければ
ならないビットを持っているのかが表示される。
相2によって、表T1からT4までの4つの新しい表が、
相0で用いられたのと類似の手順を用いて構築される。
すなわち、この手順は、(1)XMINによって最小のサブ
バンド指数が依然保持され、(2)最も低い周波数サブ
バンド(DCTブロックについてはサブバンド1、又は、D
STブロックについてはサブバンド2)に関して、サブバ
ンド指数をXMINから控除し、(3)もしこの差が0であ
れば、このサブバンド数を表T4に挿入し、(4)もしこ
の差が負の1であれば、このサブバンド数を表T3に挿入
し、(5)もしこの差が負の2であれば、このサブバン
ド数を表T2に挿入し、(6)もしこの差が負の3であれ
ば、このサブバンド数を表T1に挿入し、(7)総てのサ
ブバンドが処理されるまで、各サブバンドに対して段階
3から段階6までを続行することである。この段階の最
後において、表T1にはXMIN−3に等しい指数を有する総
てのサブバンドの数、表T2にはXMIN−2に等しい指数を
有するサブバンド、表T3にはXMIN−1に等しい指数を有
するサブバンド、表T4にはXMINに等しい指数を有するサ
ブバンドが含まれる。総ての表へのサブバンド書込み
は、変換係数の周波数の上がる順序で行われる。
相2によって、表T3からT1までの中のサブバンドで表
される総ての係数に対して、各係数が合計4つの追加ビ
ットを受け取るまで、若しくは割当て限界に達するま
で、ビットが割り当てられる。表T3中の最初の書込み
(最も低い周波数)から始めて、この表中に表される各
サブバンド内に含まれる各係数に対して、1ビットが割
り当てられる。各サブバンドが処理されるにつれて、書
込みは、表T3から取り除かれて、表T4に挿入される。次
に、追加ビットが割り当てられるにつれて、各書込みを
表T2から表T3に移動させながら、表T2中の書込みに関連
する係数に対して、追加ビットが割り当てられる。その
後、書込みを表T1から表T2に移動させながら、表T1中の
書込みが処理される。もし割当て可能なビットが幾らか
でも残っているならば、表T3に対する処理、その後、表
T2に対する処理を反復しながら、割当てが続行される。
もし割り当てられるべきビットが残っているならば、表
T3中の書込みを通して最後の処理が行われる。もし相2
によって割当て可能なビットの総てが割り当てられなけ
れば、表T4には各々が受け取った4ビットを持つ総ての
係数を含み、表T3から表T1までは空である。もし割当て
可能なビットの総てが割り当てられたならば、各変換係
数に割り当てられた全ビットを反映すべく、表T1から表
T4までに含まれる情報からアレイA()が再構築され
る。表T4中の書込みに対応するアレイA()中の各要素
には値4が割り当てられる。表T3中の書込みに対応する
各A()要素には値3が割り当てられ、表T2については
値2、表T1については値1が割り当てられる。A()の
他の総ての要素、すなわち表T1から表T4までの書込みで
表されないサブバンドは0である。
もし割当て可能なビットが幾つかでも残っているなら
ば、相3での割当てが続行される。サブバンドの数を周
波数の下がる向きに順序付けることによって、表T4が並
び替えられる。第1段階によって、表T4にはない、低い
周波数で、表T4中にあるサブバンドに隣接するサブバン
ドが表T1に対して追加される。表T4中の最初の書込み
(最も高い周波数)から始めて、表T4中での隣接書込み
が1つであるのか、若しくは2つ以上のサブバンドに分
離されていないかについて検査される。もし分離されて
いるならば、高い周波数の直ぐ下にあるサブバンドの数
が表T1に挿入される。例えば、表T4中の2つの隣接する
書込みによってサブバンド16及び12が表されるとしよ
う。これらのサブバンドは3つのサブバンドに分離され
ている。したがって、サブバンド16の下のサブバンドを
表す数15が表T1に挿入されることになろう。
第2段階によって、表T4にはない、高い周波数で、表
T4中にあるサブバンドに隣接するサブバンドが表T1に対
して追加される。表T4中の最初の書込み(最も高い周波
数)から始めて、表T4中での隣接書込みが1つであるの
か、若しくは2つ以上のサブバンドに分離されていない
かについて判定すべく検査される。もし分離されている
ならば、低い周波数の直ぐ上にあるサブバンドの数が表
T1に挿入される。例えば、表T4中の2つの隣接する書込
みによってサブバンド16及び12が表されるとしよう。上
で論じたように、これらのサブバンドは3つのサブバン
ドに分離されている。したがって、サブバンド12の上の
サブバンドを表す数13が表T1に挿入されることになろ
う。
表T1中の最初の書込みから始めて、表T1中の書込みに
よって表される各サブバンドに関連する各変換係数に対
して追加ビットが割り当てられる。各サブバンドの書込
みは、処理されるにつれて、表T1から表T2へと移され
る。表T1の処理の最後で割当て可能なビットが幾つかで
も残っているならば、各書込みを表T2から表T3へと移し
ながら、表T2の書込みに関して類似の過程が反復され
る。もし割り当てられるべきビットが幾つかでも残って
いるならば、表T3の書込みを表T3から表T4へと移しなが
ら、表T3の過程が続行される。もしこの過程の後にビッ
トが幾つかでも残っているならば、最初に表T4の書込み
が未だ並び替えられた状態にあるかどうかを判定し、も
しそうでなければ、表T4の書込みを周波数の下がる向き
の順序に並び替える、始めの段階から相3が繰り返され
る。割当て可能なビットの総てが割り当てられると、上
で相2に関して述べたように、4つの表からアレイ
A()が構築される。
ビットの総てが割り当てられた後、各変換係数コード
・ワードは、この係数がグループ化されるサブバンドを
その中で表すアレイA()の要素の値に等しい。ビット
長に丸められる。しかし、1つのサブバンド中の幾つか
の係数では、割当てビットの合計数を割当て最大数に等
しく保つために必要なビット長から1つ控除した、ビッ
ト長を具えることもある。
5.コード・ワード省略 第7図の箱705に示す不均一量子化装置の第5部分
は、適応ビット割当てルーチンに従う。前節で決定され
たサブバンド及び主指数を用いて、変換ブロック中の各
変換係数は、もしその関連する主指数が0に設定されて
いるならば、変換係数が中でグループ化されるサブバン
ドに対する指数の値に等しい桁数に更に3桁加えた桁数
だけ、左に移動される。その後、アレイA()中で見出
だされる各サブバンドに対して割り当てられる適応割当
てビットの数に最小ビット数(表Iを参照)を加えるこ
とによって、各係数の合計ビット長が計算される。各変
換係数のコード・ワードは、このビット長に丸められ
る。
上で述べたように、アレイA()の各要素によって、
サブバンド内の総ての係数に割り当てられるビットの数
が表される。1つのサブバンド中の幾つかの係数では、
割当てビットの合計数を割当て最大数に等しく保つため
に必要なビット長から1つ控除したビット長を具えるこ
ともある。
E.フォーマット化 フォーマット化過程によって、伝送又は記憶のための
符号化された1組の変換ブロックが用意される。この過
程は、第1a図の箱109に示されている。以下の叙述で
は、1チャネル系中の2つの隣接する変換ブロックのフ
ォーマット化について論考する。同じ技法を用い、ステ
レオ音響の用途に用いられる技法のように信号を処理し
て、2チャネル系の各チャネルから1つの変換ブロック
がフォーマット化される。
各変換係数のコード・ワードの固定長表現は、丸めら
れたコード・ワードを、表Iに示す最小ビット長に等し
い長さにまで省略することによって形成される。このコ
ード・ワードに対して割り当てられるあらゆる追加ビッ
トは、適応ビット・ブロック中で個別にフォーマット化
される。その後、主指数と、サブバンド指数と、省略さ
れたコード・ワードと、適応ビット・ブロックとが第20
図に示すグループ化によって組み立てられる。1組の主
及びサブバンド指数は、ブロック・ペア中の両方の変換
ブロックに適用されることに注意して欲しい。(不均一
量子化装置についての上述の論考を参照のこと)。ブロ
ックの各ペアの間で指数を分け合うことによって、両変
換ブロックの指数を表現するために必要なビットの数は
50%まで低減される。
第20図の変換ブロックのフォーマット化されたフレー
ムでは、変換ブロックAがDCTブロック、変換ブロック
BがDSTブロックの形での、構造が説明されている。こ
のフレームが、伝送中の雑音によって生じるようなビッ
ト誤りを受けるのであれば、第21図に示すようにデータ
に誤り訂正符号が混交される。もしこのディジタル信号
が放送用に企図されたものならば、フレーム同期ビット
のような、また、もしこのフレームが記憶用に企図され
たものならば、データベース・ポインタ又はレコードキ
ーのような、追加の付帯的なビットが必要になることも
ある。フレーム同期ビットが必要であれば、フォーマッ
ト化されたフレームは、ニュー・ヨーク州ニュー・ヨー
クのヴァン・ノストランド・ラインホールド社1985年出
版の、スミスによる「ディジタル伝送系」の228ページ
から236ページまで(Smith,Digital Transmission Syst
em,New York,NY:Van Nostrand Reinhold Co.,1985,pp.2
28−236)に叙述されている技法を用いて、無作為化さ
れる。無作為化は、フレーム内の有効データが同期パタ
ーンと誤認される確率を下げるために行われる。その
後、この無作為化されたフレームは、フレーム同期ビッ
トに対して付加される。
各変換係数を2つの別個の部分又はセグメントで表現
することができることに注意して欲しい。第の部分によ
って係数の最小の長さが表現されるが、この部分は固定
の数のバスで構成される。表Iを参照のこと。この表現
の第2部分は、もしそれがあるとすれれば、長さが変わ
り、適応的に割当てられるビットで構成される。可変長
のワードとして各係数を表す表現構想では雑音による悪
化があるのに対して、この2部分構成による表現構想は
より優れた免疫性があるので、これが選ばれる。好まし
い実施例の構成を用いるフレーム中でもし突発雑音が発
生すると、この雑音の影響は、指数の値、コード・ワー
ド、又はこの雑音によって直接影響を受ける割当てビッ
トに限られる。もし可変長コード・ワードを利用するフ
レーム中で突発雑音が発生すると、この雑音の影響は、
残りのフレーム全体に伝ぱんすることが有り得る。突発
雑音によって、この雑音で直接的に打撃を受ける指数の
値及びコード・ワードのみならず、各可変長のコード・
ワードの長さを決定するのに必要な情報も変わってしま
うので、この伝ぱんが生じる。もし1つのコード・ワー
ドの長さに誤りを生じると、フレームの残りの部分も誤
って解釈される。
DCT変換ブロックには、537ビットから成る183の係数
仮数(表Iを参照)と133の適応割当ビットとの合計、6
70ビットが含まれる。DST係数S(0)は常に0である
ので(表I及び表現4を参照のこと)、これを伝送する
必要はない。2つの主指数ビット及び148ビットの37サ
ブバンド指数によって、DCT・DSTブロック・ペアの長さ
は1486ビットになる。(本発明の20kHz版では、全ブロ
ック・ペアの長さは1702ビットになる)。
追加ビットが割り当てられている係数を指示するの
に、付帯的情報は必要ではない。フォーマットを解除す
る過程では、符号化過程で用いられるのと同一の割当て
アルゴリズムを実行することによって、伝送されたサブ
バンド指数から適正な割当てを決定することが可能であ
る。
データの悪化が問題ではない時には、変換ブロックの
フレームをフォーマット化するための好ましい構造は、
指数を最初に、係数コード・ワードを2番目に、適応割
当てビットを最後に配置する構造である。この構造で
は、総てのサブバンド指数が受け取られた後に、適応ビ
ット・ブロックが受け取られる間に、フォーマットを解
除する過程によって各変換係数に対するビット割当てを
決定することが可能であるので、処理による遅延が低減
される。本発明の好ましい実施例において用いられるフ
ォーマット化構造は、第20図に示されている。ビット・
ストリームは、主及びサブバンド指数と共に、周波数の
上向きの順序にフォーマット化される。その後、変換ブ
ロックAに関する係数コード・ワードの固定長部分が周
波数の上昇する順序で組み立てられ、ブロックBに関す
る係数コード・ワードがそれに続く。最後に、ブロック
Aに関する適応ビット・ブロックがビット・ストリーム
に付加され、ブロックBに関する適応ビット・ブロック
がそれに続く。
データ悪化の可能性が心配な用途においては、誤り訂
正構想が必要である。サブバンド指数中の誤りと、それ
よりも程度は低いが、低い周波数係数コード・ワード中
の誤りとによって、聴感上の最大の歪みが生じる。この
情報は、保護すべく最重要のデータである。好ましい構
成では、これらの値を誤り検出及び訂正符号を用いて保
護するが、突発雑音誤差に対する免疫性を向上させるた
めに、これらの値をできるだけ隔置する。第21図にこの
ような構想が示されている。
当業者にとって、本基本発明から逸脱せずに、別のフ
レーム・フォーマット及び訂正符号を利用できることは
明白であろう。
誤り訂正符号を用いる際には、全ビットレートを同一
に維持するために、適応割当てビットを少なくする。DC
T・DSTブロック・ペアの1フレームに関する指数及び仮
数ビットの合計数は、1220ビットである。この長さにつ
いて、150ビットはサブバンド指数及び主指数である。
このビット・ストリームに1(21,19)リード・ソロモ
ン(Reed−Solomon)誤り訂正符号が付加される。この
符号は長さ16ビットであるが、これによって、19個の8
ビット記号(バイト:bytes)又は152ビット期間にわた
って、単一記号誤り検出・訂正が行われる。この例とし
て、マサチューセッツ州ケンブリッジのM.I.T.プレス社
1986年出版の、ピーターソンとウエルドンによる、「誤
り訂正符号」の269ページから309ページまでと、361ペ
ージから362ページまで(Peterson and Weldon,Error−
Correcting Codes,Cambridge,Mass:The M.I.T.Press,19
86,pp.269−309,361−362)を参照のこと。
符号によって保護されるこれらの152ビットについ
て、150は主指数及びサブバンド指数から成る(15kHz
版)。残りの誤り訂正能力は、2つの主指数に対して冗
長保護を与えることに利用される。16ビットの誤り符号
及び冗長指数を表現するには、全部で18ビットが必要で
ある。これらのビットは、適応ビット割当てに割当て可
能なビットを減らすことによって、総合的データ伝送速
度を増加させずに、フォーマット化されたデータ・スト
リームに付加される。その結果、変換ブロック・ペア中
で各ブロックに対する総合的に割当て可能なビットは13
3から124に減る。
リード・ソロモン・コードによってバイトの中のデー
タが処理されるので、処理を容易にするために、誤り符
号と、保護されたデータと、保護されていないデータと
は、8ビットのバイトにグループ化される。各ブロック
・ペア・フレーム中での保護されたデータに対する保護
されていないデータの比率は、約9対1である。これに
よって、フォーマット化されたフレーム全体にわたっ
て、保護されたデータを、保護されたデータの8ビット
のバイトの各々を保護されていないデータの8バイトに
分離する形で、分散することが可能になる。これについ
ては第21図を参照のこと。この技法を用いると、65ビッ
トにも及ぶ単一の突発雑音誤りがフレーム中のどの位置
に生じても、保護データの2バイト以上が悪化させられ
ることはない。したがって、65ビット以上に及ばない、
あらゆる単一の突発雑音に対しては、保護されたデータ
を復元することができる。
上で論じた制約の下で、指数及び変換係数コード・ワ
ードは周波数の上昇する順序に組み立てられ、その後に
適応的ビット・ブロックが続く。
F.伝送又は記憶 今や、フォーマット化されたフレームの伝送又は記憶
のための準備が整えられた。第1a図には、伝送装置110
が示されている。伝送媒体としては、放送のような公共
頒布系、スタジオでのモニタや信号ミキシングのような
内部用途と、内部施設又は地上系や衛星系電波を経由す
る電話用途とが含まれる。記憶媒体には、磁気テープ
と、磁気又は光ディスクとが含まれる。
G.フォーマット解除 伝送信号の受信か、もしくは記憶からの取り出しの何
れかによって、ディジタル化され符号化された信号が伝
送装置111から受け取られると、フォーマット解除過程
が始まる。この過程は、第1b図の箱112に表現されてい
る。もしコード・ワードのフォーマット化されたフレー
ムが、伝送の前に無作為化されていたものであれば、逆
無作為化過程によって復元される。その後、このフレー
ムは、各変換ブロックの成分、すなわち、主指数と、サ
ブバンドに指数と、変換指数コード・ワードと、適応的
割当てビットとに分割される。誤り訂正符号がもしあれ
ば、これを用いて、伝送又は記憶の間に引き起こされた
誤りが取り除かれる。
各主指数ビットは、その対応する冗長ビットを用いて
点検され、精度が確認される。もしこの点検で落第なら
ば、つまり、主指数とその相手の冗長とが等しくなけれ
ば、この主指数は1であると仮定される。もしこの主指
数の正しい値が実際には0であるならば、この仮定によ
って、この間違った主指数の下でグループ化されるサブ
バンド内の、総ての変換係数の振幅は低減される。主指
数を0(1であるべきところで)に誤って設定すると、
影響を受ける係数の総ての振幅が増加するので、この仮
定を用いる方が、不都合なひずみの発生をより少なくで
きる。
DCT係数C(0)に対する指数も点検され、隠れビッ
トに対する調整が必要かどうかが判定される。
上で述べた適応ビット割当てルーチンを用いて、受信
信号から抽出される指数が処理され、この処理結果を用
いて、変換係数に対する適応ビット・ブロックの適正な
割当てが決定される。最大ビット長とあらゆる適応割当
てビットとを加えたビット長にその長さが等しい、各変
換係数の部分は、24ビット・ワードに負荷され、その
後、もし関連する主指数が1に限定されているならば、
適切なサブバンド指数の値と3桁の追加移動桁とを加え
た数に等しい度数だけ右に移行される。この過程は、第
1b図の箱113に表現されている。
H.合成フィルタバンク、逆変換 第1b図の箱114には、フォーマット解除及び直線化手
順から復元された周波数領域係数の各組を時間領域信号
サンプルのブロックに変換する、合成フィルタのバンク
が表現されている。第1a図の分析フィルタバンクで用い
られる変換とは逆の変換によって、合成フィルタバンク
114が実現される。本発明の実施例で用いられるE−TDA
C技法のための逆変換は、改変された逆DCT及び逆DSTの
交互的な適用である。変換ブロックの半分が伝送又は記
憶から除去されているので(表現5及び29を参照のこ
と)、逆変換のためにこれらのブロックを再生しなけれ
ばならない。式8に示されるように、失われたDCTブロ
ックを入手可能なDCTブロックから再生することができ
る。この逆DCTブロックは式10で表現されており、逆DST
ブロックは式11で表現されている。
すなわち、 (k)=−(N−k) N/2≦k<Nに関して(8) (k)=(N−k) N/2≦k<Nに関して(9) ここで、 k=変換係数 n=信号サンプル数 K=変換係数の数 N=サンプル・ブロック長 m=E−TDACに関する相期間 (k)=量子化されたDCT係数k (k)=量子化されたDST係数k (n)=復元された量子化信号x(n) である。
計算は、FFTアルゴリズムを用いて行われる。逆変換
において、前向き変換で用いられた技法と同じ技法を用
いて、FFTを用いてのDCT及びDSTの両方の同時発生的計
算が可能になる。
第14a図から第14e図までと、第16a図から第16g図まで
に、分析・合成フィルタバンクの変換過程が示されてい
る。分析フィルタバンクによって、時間領域信号が、DC
T及びDSTブロックの交互列に変換される。逆変換によっ
て、逆DCTが別のブロックの各々に適用され、逆DSTがブ
ロックの別の半分に適用される。第15a図から第15d図ま
でに示すように、復元信号には、エイリアシングひずみ
が含まれている。このひずみは、第1b図の箱116に表さ
れている後続の時間領域ブロック重複・加算過程の間
に、相殺される。この重複・加算過程については、以下
に述べる。
I.合成ウインドウ 第16a図から第16g図までには、隣接する時間領域信号
サンプル・ブロックの重複・加算による時間領域エイリ
アシングの相殺が示されている。プリンセンによって誘
導されているように、時間領域エイリアシングひずみを
相殺するには、E−TDAC変換で分析ウインドウと同等の
合成ウインドウを適用し、隣接するブロックを重複・加
算することが必要である。各ブロックは、100%、すな
わち、先行ブロックによって50%、後続ブロックによっ
て50%が重複される。合成ウインドウ変調は、第1b図の
箱115によって表現されている。
合成・分析ウインドウの設計では、フィルタバンクの
性能について考慮しなければならない。両方のウインド
ウとも時間領域信号を変調すべく用いられるので、フィ
ルタ性能に係る総合的効果は、これら2つのウインドウ
の積から形成される単一のウインドウによって生じる効
果と類似している。したがって、合成・分析ウインドウ
・ペアの設計は、合成、及び分析ウインドウの点ごとの
乗算を表す適切な積ウインドウを設計することにより達
成される。この設計は非常に制約されていて、僊移帯域
ロールオフの鋭さと阻止帯域排除の深さとを交換する融
通性を低下させる。その結果、フィルタ性能は、この制
約のない分析専用ウインドウにおけるよりも大幅に劣化
する。この例については、第17a図及び第17b図を参照の
こと。
先行技術では、分析ウインドウに関して多大な注意が
払われているが、合成ウインドウについては教示すると
ころが少ない。以下に叙述する技法では、周知の良好な
分析ウインドウの設計から良好な合成・分析ウインドウ
・ペアを誘導している。どのような分析ウインドウをも
出発点として用いることができる。幾つかのウインドウ
では良好な選択度を有するフィルタバンクの設計が可能
となり、僊移帯域ロールオフの鋭さを阻止帯域排除の深
さと交換する手段が提供される。3つの例として、カイ
ザー・ベッセル・ウインドウ(Kaiser−Bessel windo
w)と、ドルフ・チェピシェフ・ウインドウ(Dolph−Ch
ebychev window)と、パークス・マックレラン法(Park
s−McClellan method)を用いて有限インパルス・フィ
ルタ係数から誘導されるウインドウとが挙げられる。19
72年3月のIEEE学会誌、回路理論、CT−19巻の189ペー
ジから194ページまでの、パークスとマックレランによ
る論文、「リニア相を有する非回帰型ディジタル・フィ
ルタのチェビシェフ近似法」(Parks and McClellan,
“Chebychev Approximation for Nonrecursive Digital
Filters with Linear Phase",IEEE Trans.Circuit The
ory,vol.CT−19,March 1972,pp.189−94)を参照のこ
と。ここでは、カイザー・ベッセル・ウインドウのみに
ついて論考している。このウインドウによって、単一の
パラメータ・アルファ値の選択を通して、上述の交換が
可能になる。一般的法則として、低いアルファ値によっ
て僊移帯域ロールオフが改善され、高いアルファ値によ
って阻止帯域排除の深さが増加させられる。上で引用し
たハリスの論文を参照のこと。
本発明の好ましい実施例では、4から7までの範囲の
アルファ値が使用できる。この範囲では、中間周波数領
域(1kHzから2kHz)での僊移帯域ロールオフの鋭さと、
低い周波数領域(500Hz以下)及び高い周波数領域(7kH
z以上)での阻止帯域排除の深さとの間の良好な妥協が
得られる。この受容できるアルファ値の範囲は、量子化
雑音を音響心理学的マスキングしきい値以下に維持する
ために十分な阻止帯域排除を具える最低のアルファ値
を、コンピュータ・シミュレーションで識別することに
よって決定された。
カイザー・ベッセル・ウインドウ関数は以下の通りで
ある。
すなわち、 ここで、 α=カイザー・ベッセル・アルファ因数 n=ウインドウのサンプル数 N=ウインドウのサンプル数中のウインドウ長 である。
この重複・加算条件を満足させるために、長さv+1
のウインドウW(n)を長さN−vの長方形ウインドウ
でたたみ込むことによって、長さNの分析・合成積ウイ
ンドウWP(n)が誘導される。値vは、ウインドウ重複
・加算期間である。この重複・加算過程によって、エイ
リアスひずみと分析・合成ウインドウの変調効果とが消
去される。積ウインドウを誘導するたたみ込みは、式13
に示される。ここでは、表現の分母によって、最大値が
単位1に近付くが1を超えないようにウインドウが測定
される。この表現を式14に示されるように単純化するこ
ともできる。
すなわち、 ここで、 n=積ウインドウのサンプル数 v=ウインドウ重複期間内のサンプル数 N=積ウインドウの望ましい長さ W(n)=長さv+1のウインドウ関数の開始 WP(n)=長さNの誘導された積ウインドウ である。
式(15)及び式(16)に示される分析及び合成ウイン
ドウは、誘導された積ウインドウWP(n)をそれぞれS
及びAで累乗することによって得られる。
すなわち、 WA(n)=WP(n) 0≦n<Nに対して(15) WS(n)=WP(n) 0≦n<Nに対して(16) ここで、 WP(n)=誘導された積ウインドウ (式14及び式14を参照) WA(n)=分析ウインドウ WS(n)=合成ウインドウ N=積ウインドウの長さ A+S=1 である。
本発明の現在の実施例では、分析及び合成ウインドウ
は、100%のウインドウ重複、又は256サンプルの重複期
間を有する。512サンプルの長さである。S及びAの値
は各々、E−TDAC変換に必要な1組の同等な分析合成ウ
インドウ及び合成ウインドウを作り出す真半分に設定さ
れる。これらの値を式14に代入することによって、結果
としての分析ウインドウは以下のようになる。
すなわち、 ここで、W(n)=長さ257のカイザー・ベッセル関
数で、アルファ因数は4から7までの範囲である。
J.重複・加算 ウインドウの設計には、更に追加の要件が課される。
すなわち、分析及び合成ウインドウは、隣接する2つの
分析及び合成ウインドウが重複された時に、分析・合成
積ウインドウが一体的に合算されるように設計されなけ
ればならない。重複・加算過程は、分析ウインドウ及び
合成ウインドウの時間領域効果を相殺すべく用いられる
ので、この要件が課される。この過程は、第1b図の箱11
6によって表現され、第16a図から第16g図までによって
説明されている。逆DCT及びDSTからそれぞれ復元される
信号yc(t)及びys(t)は、第16a図及び第16d図に示
されている。各信号ブロックは、1連のブロックにグル
ープ化される。各信号ブロックは、第16b図及び第16e図
に示される分析・合成ウインドウ関数によって変調され
る。結果として得られる信号y′(t)及びy′
(t)のブロックが、第16c図及び第16f図に示されて
いる。ブロック長の半分ずつが重複されている2つの信
号は加算されて第16g図に示される信号y(t)が作り
出される。信号y(t)は、元の入力信号を正確に再構
築したものである。
第18図に示されるように、ブロックkとブロックk+
1との間の重複期間内に或る時刻n0tにある信号サンプ
ルは、2つのブロックの各々の中のサンプルによって表
現される。ウインドウ処理された2つのブロックの重複
・加算に続いて、時刻n0tにある復元された信号サンプ
ルは、ウインドウ処理されたブロックk及びk+1から
のサンプルの合計であることが分かる。これは、以下の
式で表現することができる。
すなわち、 x(n0t)=WPk(n0t)・x(n0t) +WPk+1(n0t)・x(n0t) (18) =[WAk(n0t)+WAk+1(n0t)]x(n0t) ここで、 WPk(n0t)=WAk(n0t)・WSk(n0t)= {WAk(n0t)} WAk(n0t)=時刻n0tにおけるブロックk中の分析ウイ
ンドウ WSk(n0t)=時刻n0tにおけるブロックk中の合成ウイ
ンドウ WAk(n0t)=E−TDAC変換に必要なWSk(n0t) である。
もしウインドウの重複期間を横切る2つの積ウインド
ウの合計が単位1に等しければ、積ウインドウの変調効
果は相殺される。したがって、信号x(nt)は、ブロッ
クk及びブロックk+1の間の重複期間内の時間サンプ
ルの総てについて以下のようであれば、正確に復元され
る。
すなわち、 WPk(nt)+WPk+1(nt)=10≦n<Nに関して(19) である。
時間の関数として積ウインドウで作業するのは困難で
あるので、式19に示されている要求をウインドウのサン
プル数の関数に翻訳することが望ましい。式20から式23
まででは、100%重複している512サンプルの分析及び合
成ウインドウのペアの積から作り出される積ウインドウ
についてのこの要件を表現している。式20では、ウイン
ドウWPkの前半部とウインドウWPk-1の後半部との重複が
表されている。式21では、ウインドウWPkの後半部とウ
インドウWPk+1の前半部との重複が表されている。式22
及び式23では、分析ウインドウに関して等価の表現が示
されている。
すなわち WPk+1(n+256)+WPk(n)=10≦n<256に関して
(20) WPk(n)+WPk+1(n−256)=1 256≦n<512に関し
て(21) {WAk-1(n+256)}+{WAk(n)}=1 0≦n
<256に関して(22) {WAk(n)}+{WAk+1(n−256)}=1256≦n
<512に関して(23) ここで、 WPk(n)=WAk(n)・WSk(n}={WAk(n)} WAk(n)=ブロックk中のサンプルnに対する分析ウ
インドウの値 WSk(n)=ブロックk中のサンプルnに対する合成ウ
インドウの値 WAk(n)=E−TDAC変換に必要なWSk(n) である。
K.信号出力 第1b図の箱117には、ディジタル入力に応答して電圧
が変化するアナログ信号を発生する、ディジタル対応ア
ナログ・コンバータが示されている。このディジタル入
力は、重複・加算過程によって作り出される、24整数ワ
ードの16最上位ビットから得られる。このアナログ出力
は、擬似の高周波成分を取り除くために、15kHz(20kHz
版については20kHz)の通過帯域を持つ低域フィルタで
濾波されなければならない。第1b図では、このフィルタ
は示されていない。
I.本発明の代替的O−TDAC実施例 本発明のもう1つの実施例では、本出願で奇数積み重
ね時間領域エイリアシング相殺(O−TDAC)と呼ぶ、交
互的な変換を利用している。以下の叙述では、本発明で
のE−TDAC方式とO−TDAC方式の間の実施上の差につい
て論考する。
A.前向き変換 O−TDACでは、以下の式24に示す改変された離散余弦
変換(DCT)を用いる。
すなわち、 ここで、 k=周波数係数 n=入力信号サンプル数 N=サンプル・ブロック長 m=O−TDACに対する位相項(式6を参照) x(n)=サンプルnにおける入力信号x(t)の量子
化値 C(k)=DCT係数k である。
O−TDAC変換によって、以下の式の1組のスペクトル
係数又は変換ブロックが作り出される。
すなわち、 ここで、 i=信号サンプル・ブロック数 C(k)=DCT係数k(式24を参照) である。
ここで用いる計算アルゴリズムは、高速フーリエ変換
(FFT)である。E−TDAC方式とは異なり、O−TDACの
実施例では、単一のFFTも用いないで、2つの信号サン
プル・ブロックを同時発生的に変換する。しかし、E−
TDAC方式で用いられる前逓倍・変換・後逓倍に類似の技
法を用いることにより、変換の計算上の複雑さは低減さ
れる。前逓倍段階では、信号サンプルx(n)を以下の
複素数関数で変調して、信号サンプルの実数値列を複素
数列に転換する。
すなわち、 FFTで実行される離散フーリエ変換によって、改変さ
れた信号サンプルは1組の変換係数に変換される。FFT
は複素数変換であるので、1組の改変された信号サンプ
ルの実数部及び虚数部を同時発生的に変換することがで
きる。最後に、後逓倍ステップによって真のDCT係数が
得られる。この過程は、以下の式27及び28に表現され
る。
すなわち、 本発明の1チャネル版のための好ましい実施例におい
て、2つの連続する重複信号サンプル・ブロックはバッ
ファ中に記憶され、2つのFFT過程を用いて共にDCT1・D
CT2ブロック・ペアに変換される。2チャネル系におい
ては、2チャネルの各々からの信号サンプル・ブロック
は2つのFFT過程を用いてDCT1・DST2ブロック・ぺアに
変換される。
プリンセンは、適正な位相成分m(式6を参照)と、
注意深く設計された分析・合成ウインドウとを用いて、
O−TDAC技法によって以下の形式の余弦変換ブロックの
交互列から入力信号を正確に復元できることを示してい
る。
すなわち、 {C1(k)}0,{C2(k)}1,{C1(k)}2,{C2
(k)} …(29) ここで、 C1(k)=信号サンプル・ブロックのDCT1係数 C2(k)=信号サンプル・ブロックのDCT2係数 である。変換ブロックの列は、実際には、2チャネル系
における各チャネルから相手の変換ブロックの各々を、
又は1チャネル系において用いられる両方のDCTの各々
から相手の変換ブロックの各々を廃棄することによって
形成されることに注意して欲しい。
O−TDAC変換及びエイリアシング消去過程は、E−TD
ACの過程と非常に類似しているが、第22a図から第22e図
までと、第23a図から第23d図までと、第24a図から第24g
図までとに示されている。主要な差異はエイリアシング
成分の形式にある。標本化された信号ブロックの前半部
に関して、エイリアシング成分はサンプル・ブロックの
約1/4の点で入力信号の時間的に逆転したイメージであ
るが、その振幅の記号は入力信号の記号と逆転してい
る。標本化された信号ブロックの後半部に関しては、エ
イリアシングはサンプル・ブロックの約3/4の点で入力
信号の時間的に逆転しているが、記号は変化していな
い。これについては、第23b図及び第23d図を参照のこ
と。
分析及び合成ウインドウの設計法及び使用法はE−TD
ACのそれと同等である。これについては、第24a図から
第24g図までを参照のこと。
B.不均一量子化装置 本発明のE−TDAC方式のための不均一量子化装置は、
DCTブロックが存在することにのみ起因する、ごく僅か
の差異がある点以外は、E−TDAC変換方式で用いられる
不均一量子化装置と同等である。各ブロック・ペア中に
は、両変換ブロックには係数C(0)が含まれているの
で、総てのサブバンド指数は2つのブロックによって共
有される。その結果、隠れビットはそこにはなく、係数
C(0)に関する「最小」ビット長は9ビットに固定さ
れる(E−TDACでは8ビット)。表IIIを参照のこと。
動的ビット割当ては実質的にE−TDACに対するそれと
同じである。係数C(0)は各ペア中の両ブロックに対
する割当てから除外され、各変換ブロック・ペアの長さ
が増加していることから、以下に論じるように割当て限
界は130ビットしかない。
C.フォーマット化とフォーマット解除 各符号化DCTブロックには、538ビット(表I及び表II
Iを参照のこと)と適応的に割り当てられた130ビットの
合計668ビットから成る183の係数仮数が含まれる。DCT
ブロックによって共有される2つの主指数及び37のサブ
バンド指数によって、E−TDACの実施例のDCT1・DCT2ブ
ロック・ペアの長さと同じく、その長さが1486ビットに
される。
誤り訂正符号を有しないフォーマット化されたフレー
ムの構造は、本発明のE−TDAC中で用いられるそれと非
常に類似しているが、これは第25図に示されている。誤
り訂正符号を有するフレームの構造はE−TDACのそれと
同一であるが、これは第21図に示されている。
フォーマット解除過程は、隠れビット対して点検が為
されない点以外は上述の過程と同じである。
D.逆変換 DCTブロックの半分は、伝送又は記憶から除去されて
いるが、入手可能なDCTブロックから式30に示す関係を
用いて再生される。逆DCTは式31に示されている。
すなわち、 (k)=−(N−k) N/2≦k<Nに関して(30) ここで、 k=変換係数 n=信号サンプル数 K=変換係数の番号 N=サンプル・ブロック長 m=E−TDACに対する位相項(式6を参照) (k)=量子化DCT係数k (n)=復元量子化信号x(n) である。
逆変換のO−TDAC実行では、前方変換で用いられる前
逓倍・変換・後逓倍過程のような過程によって計算上の
複雑さが低減される。この過程によって、単一の逆FFT
(IFFT)を用いて実数のDCT係数が1組の改変された複
素数の係数に転換され、以下の式に示すように、後逓倍
から時間領域信号が得られる。
すなわち、 ここで、 m=A−TDACに対する位相項(式6を参照) N=サンプル・ブロック長 k=周波数係数信号 n=入力信号サンプル数 r(n)=サンプルx(n)の実数部 q(n)=サンプルx(n)の虚数部 (n)=復元量子化信号x(n) である。
後続の、ウインドウ処理、重複・加算、及び信号出力
処理は、本発明のE−TDACの実施に関して上で述べた処
理と同一である。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI H04B 14/04 H04B 14/04 Z (72)発明者 デビッドソン、グラント・アレン アメリカ合衆国、94618 カリフォルニ ア州オークランド、カルデコット・レー ン 182、アパートメント 222 (56)参考文献 特表 平2−501507(JP,A) IEEE Transaction on Acoustics,Speec h and Signal Proce ssing,Vol.34,No.5, 1986,J.P.Princen,A. B.Bradley 「Analysi s/Synthesis Filter Bank Design Based on Time Domain Al iasing Cancellatio n」p.1153〜1161

Claims (16)

    (57)【特許請求の範囲】
  1. 【請求項1】オーディオ情報を高品質でデジタル符号化
    するエンコーダであって、 オーディオ情報を表す信号サンプルブロックを形成する
    要素と、 各信号サンプルブロックを分析ウインドウで重み付けす
    る要素と、 分析ウインドウで加重された信号サンプルブロックに離
    散変換関数を適用することによって変換係数を含む変換
    ブロックを発生させる要素と、 それぞれの変換ブロック内の変換係数をグループ化しす
    ると共にビットを仮数及び指数に割当てることによって
    1指数と関連する1以上の仮数から成るブロック浮動小
    数点の形で変換係数のそれぞれのサブバンドを表すコー
    ドワードのグループを発生させる要素であって、1指数
    が、信号サンプルブロックの対に応答して発生される変
    換ブロック対をなすサブバンドのための2グループのコ
    ードワードによって共有される、前記指数が変換ブロッ
    ク対によって共有されるので指数を表すためにより少な
    いビットが割当てられるグループ要素と、 前記コードワードを含むデジタル情報を伝送又は記憶に
    適したフォーマットを有する出力にアセンブルする要素
    とから成るエンコーダ。
  2. 【請求項2】前記指数が、隣接信号サンプルブロックの
    対に応答して発生される変換ブロック対をなすサブバン
    ドのための2グループのコードワードによって共有され
    る、請求項1のエンコーダ。
  3. 【請求項3】前記指数が、2チャンネルのオーディオ情
    報の各々を表す信号サンプルブロックの対に応答して発
    生される変換ブロック対をなすサブバンドのための2グ
    ループのコードワードによって共有される、2チャンネ
    ルのオーディオ情報を符号化する請求項1のエンコー
    ダ。
  4. 【請求項4】コードワードを含む符号化された信号から
    オーディオ情報を高品質で再生するデコーダであって、 ビットを仮数及び指数に割当てることによって1指数と
    関連する1以上の仮数から成るブロック浮動小数点の形
    で表される前記コードワードのグループから変換係数の
    サブバンドを含む変換ブロックの対を得るために前記コ
    ード化された信号をデフォーマットする要素であって、
    1指数が、変換ブロックのそれぞれの対のための2グル
    ープのコードワードによって共有される、前記指数が変
    換ブロック対によって共有されるので指数で表すために
    より少ないビットが割当てられるデフォーマット要素
    と、 前記変換ブロック対内の再構成された変換係数に逆離散
    変換関数を適用することによって信号サンプルブロック
    の対を発生させる要素と、 合成ウインドウによって該信号サンプルブロックを重み
    付けする要素と、 該オーディオ情報を再生するために該加重された信号サ
    ンプルブロックを重複かつ加算する要素とから成るデコ
    ーダ。
  5. 【請求項5】指数を共有する前記変換ブロック対に応答
    して隣接信号サンプルブロックが発生される、請求項4
    のデコーダ。
  6. 【請求項6】2チャンネルオーディオ情報の各々を表す
    信号サンプルブロック対が、指数を共有する前記変換ブ
    ロック対に応答して発生される、2チャンネルのオーデ
    ィオ情報を高品質で再生する請求項4のデコーダ。
  7. 【請求項7】オーディオ情報を高品質でデジタル符号化
    するエンコーダであって、 前記オーディオ情報にフィルターバンクを適用すること
    によって該オーディオ情報の周波数サブバンドを表すサ
    ブバンド情報を発生させる要素と、 前記サブバンド情報をブロックにグループ化しすると共
    にビットを仮数及び指数に割当てることによって1指数
    と関連する1以上の仮数から成るブロック浮動小数点の
    形で変換係数のそれぞれのサブバンドを表すコードワー
    ドのグループを発生させる要素であって、1指数が、信
    号サンプルブロックの対に応答して発生される変換ブロ
    ック対をなすサブバンドのための2グループのコードワ
    ードによって共有される、前記指数が変換ブロック対に
    よって共有されるので指数を表すためにより少ないビッ
    トが割当てられるグループ要素と、 前記コードワードを含むデジタル情報を伝送又は記憶に
    適したフォーマットを有する出力にアセンブルする要素
    とから成るエンコーダ。
  8. 【請求項8】前記指数が、前記オーディオ情報の隣接間
    隔の対を表すブロックの対をなすサブバンド情報のため
    の2グループのコードワードによって共有される、請求
    項7のエンコーダ。
  9. 【請求項9】前記指数が、2チャンネルのオーディオ情
    報の各々を表す信号サンプルブロックの対をなすサブバ
    ンドのための2グループのコードワードによって共有さ
    れる、2チャンネルのオーディオ情報を符号化する請求
    項7のエンコーダ。
  10. 【請求項10】コードワードを含む符号化された信号か
    らオーディオ情報を高品質で再生するデコーダであっ
    て、 ビットを仮数及び指数に割当てることによって1指数と
    関連する1以上の仮数から成るブロック浮動小数点の形
    で表される前記コードワードのグループからサブバンド
    情報を含むブロックの対を得るために前記コード化され
    た信号をデフォーマットする要素であって、1指数が、
    ブロックのそれぞれの対のための2グループのコードワ
    ードによって共有される、前記指数がブロック対によっ
    て共有されるので指数を表すためにより少ないビットが
    割当てられるデフォーマット要素と、 前記サブバンド情報に逆フィルターバンクを適用するこ
    とによって前記オーディオ情報を再生する要素とから成
    るデコーダ。
  11. 【請求項11】指数を共有する前記変換ブロック対に応
    答して前記再生の隣接間隔の対が発生される、請求項10
    のデコーダ。
  12. 【請求項12】2チャンネルオーディオ情報の各々を表
    す前記再生の間隔の対が、指数を共有する前記ブロック
    対に応答して発生される、2チャンネルのオーディオ情
    報を高品質で再生する請求項10のデコーダ。
  13. 【請求項13】オーディオ情報を高品質でデジタル符号
    化する方法であって、 オーディオ情報を表す信号サンプルブロックを形成し、 各信号サンプルブロックを分析ウインドウで重み付け
    し、 分析ウインドウで加重された信号サンプルブロックに離
    散変換関数を適用することによって変換係数を含む変換
    ブロックを発生させ、 それぞれの変換ブロック内の変換係数をグループ化しす
    ると共にビットを仮数及び指数に割当てることによって
    1指数と関連する1以上の仮数から成るブロック浮動小
    数点の形で変換係数のそれぞれのサブバンドを表すコー
    ドワードのグループを発生させ、1指数が、信号サンプ
    ルブロックの対に応答して発生される変換ブロック対を
    なすサブバンドのための2グループのコードワードによ
    って共有される、前記指数が変換ブロック対によって共
    有されるので指数を表すためにより少ないビットが割当
    てられるようにし、 前記コードワードを含むデジタル情報を伝送又は記憶に
    適したフォーマットを有する出力にアセンブルすること
    から成る符号化方法。
  14. 【請求項14】コードワードを含む符号化された信号か
    らオーディオ情報を高品質で再生する復号方法であっ
    て、 ビットを仮数及び指数に割当てることによって1指数と
    関連する1以上の仮数から成るブロック浮動小数点の形
    で表される前記コードワードのグループから変換係数の
    サブバンドを含む変換ブロックの対を得るために前記コ
    ードワード化された信号をデフォーマットし、1指数
    が、変換ブロックのそれぞれの対のための2グループの
    コードワードによって共有される、前記指数が変換ブロ
    ック対によって共有されるので指数を表すためにより少
    ないビットが割当てられるようにし、 前記変換ブロック対内の再構成された変換係数に逆離散
    変換関数を適用することによって信号サンプルブロック
    の対を発生させ、 合成ウインドウによって該信号サンプルブロックを重み
    付けし、 該オーディオ情報を再生するために該加重された信号サ
    ンプルブロックを重複かつ加算することから成る復号方
    法。
  15. 【請求項15】オーディオ信号を高品質でデジタル符号
    化する方法であって、 前記オーディオ情報にフィルターバンクを適用すること
    によって該オーディオ情報の周波数サブバンドを表すサ
    ブバンド情報を発生させ、 前記サブバンド情報をブロックにグループ化しすると共
    にビットを仮数及び指数に割当てることによって1指数
    と関連する1以上の仮数から成るブロック浮動小数点の
    形で変換係数のそれぞれのサブバンドを表すコードワー
    ドのグループを発生させ、1指数が、信号サンプルブロ
    ックの対に応答して発生される変換ブロック対をなすサ
    ブバンドのための2グループのコードワードによって共
    有される、前記指数が変換ブロック対によって共有され
    るので指数を表すためにより少ないビットが割当てられ
    るようにし、 前記コードワードを含むデジタル情報を伝送又は記憶に
    適したフォーマットを有する出力にアセンブルすること
    から成る符号化方法。
  16. 【請求項16】コードワードを含む符号化された信号か
    らオーディオ情報を高品質で再生する復号方法であっ
    て、 ビットを仮数及び指数に割当てることによって1指数と
    関連する1以上の仮数から成るブロック浮動小数点の形
    で表される前記コードワードのグループからサブバンド
    情報を含むブロックの対を得るために前記コード化され
    た信号をデフォーマットし、1指数が、ブロックのそれ
    ぞれの対のための2グループのコードワードによって共
    有される、前記指数がブロック対によって共有されるの
    で指数を表すためにより少ないビットが割当てられるよ
    うにし、 前記サブバンド情報に逆フィルターバンクを適用するこ
    とによって前記オーディオ情報を再生することから成る
    復号方法。
JP2503825A 1989-01-27 1990-01-29 高品質オーディオ用低ビット伝送速度変換コーダ、デコーダ、及びエンコーダ・デコーダ Expired - Lifetime JP2821713B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US30371489A 1989-01-27 1989-01-27
US303,714 1989-01-27
US43986889A 1989-11-20 1989-11-20
US439,868 1989-11-20

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP10158415A Division JP3093178B2 (ja) 1989-01-27 1998-05-21 高品質オーディオ用低ビットレート変換エンコーダ及びデコーダ

Publications (2)

Publication Number Publication Date
JPH04504192A JPH04504192A (ja) 1992-07-23
JP2821713B2 true JP2821713B2 (ja) 1998-11-05

Family

ID=26973611

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2503825A Expired - Lifetime JP2821713B2 (ja) 1989-01-27 1990-01-29 高品質オーディオ用低ビット伝送速度変換コーダ、デコーダ、及びエンコーダ・デコーダ

Country Status (10)

Country Link
EP (5) EP0455738B2 (ja)
JP (1) JP2821713B2 (ja)
AT (4) ATE136147T1 (ja)
AU (2) AU631404B2 (ja)
BR (1) BR9007063A (ja)
DE (4) DE69026278T3 (ja)
DK (3) DK0560413T4 (ja)
ES (3) ES2099185T3 (ja)
SG (3) SG49891A1 (ja)
WO (1) WO1990009022A1 (ja)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU653582B2 (en) * 1991-01-08 1994-10-06 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
JP3123290B2 (ja) * 1993-03-09 2001-01-09 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体
US5463424A (en) * 1993-08-03 1995-10-31 Dolby Laboratories Licensing Corporation Multi-channel transmitter/receiver system providing matrix-decoding compatible signals
JP3131542B2 (ja) * 1993-11-25 2001-02-05 シャープ株式会社 符号化復号化装置
JP3186413B2 (ja) * 1994-04-01 2001-07-11 ソニー株式会社 データ圧縮符号化方法、データ圧縮符号化装置及びデータ記録媒体
US6167093A (en) * 1994-08-16 2000-12-26 Sony Corporation Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission
JPH08190764A (ja) * 1995-01-05 1996-07-23 Sony Corp ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
JP3521596B2 (ja) * 1996-01-30 2004-04-19 ソニー株式会社 信号符号化方法
EP0827647B1 (en) * 1996-03-19 2002-07-17 Dolby Laboratories Licensing Corporation Analysis/synthesis filtering system with efficient oddly-stacked single-sideband filter bank using time-domain aliasing cancellation
US5890106A (en) * 1996-03-19 1999-03-30 Dolby Laboratories Licensing Corporation Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation
KR100378790B1 (ko) * 1996-04-23 2003-05-01 엘지전자 주식회사 서브밴드양자화레벨디코딩장치
KR100223169B1 (ko) * 1996-06-14 1999-10-15 윤종용 펄스부호변조된 디지털 오디오신호의 기록 및 재생을 위한 시스템
US5892746A (en) * 1996-06-15 1999-04-06 Samsung Electronics Co., Ltd. System for recording and/or reproducing a pulse code modulation digital audio signal
JP3092653B2 (ja) * 1996-06-21 2000-09-25 日本電気株式会社 広帯域音声符号化装置及び音声復号装置並びに音声符号化復号装置
TW301103B (en) * 1996-09-07 1997-03-21 Nat Science Council The time domain alias cancellation device and its signal processing method
JPH1083623A (ja) * 1996-09-10 1998-03-31 Sony Corp 信号記録方法、信号記録装置、記録媒体および信号処理方法
GB2326572A (en) * 1997-06-19 1998-12-23 Softsound Limited Low bit rate audio coder and decoder
US6081783A (en) * 1997-11-14 2000-06-27 Cirrus Logic, Inc. Dual processor digital audio decoder with shared memory data transfer and task partitioning for decompressing compressed audio data, and systems and methods using the same
US6016473A (en) * 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
US6665409B1 (en) 1999-04-12 2003-12-16 Cirrus Logic, Inc. Methods for surround sound simulation and circuits and systems using the same
US6356871B1 (en) 1999-06-14 2002-03-12 Cirrus Logic, Inc. Methods and circuits for synchronizing streaming data and systems using the same
US6349285B1 (en) 1999-06-28 2002-02-19 Cirrus Logic, Inc. Audio bass management methods and circuits and systems using the same
JP2002135122A (ja) * 2000-10-19 2002-05-10 Nec Corp オーディオ信号符号化装置
EP1345331B1 (en) * 2000-12-22 2008-08-20 Sony Corporation Encoder
US7123655B2 (en) 2001-08-09 2006-10-17 Sharp Laboratories Of America, Inc. Method for reduced bit-depth quantization
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
KR101016224B1 (ko) 2006-12-12 2011-02-25 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 인코더, 디코더 및 시간 영역 데이터 스트림을 나타내는 데이터 세그먼트를 인코딩하고 디코딩하는 방법
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
JP5302980B2 (ja) * 2008-03-04 2013-10-02 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 複数の入力データストリームのミキシングのための装置
KR100940532B1 (ko) * 2009-09-28 2010-02-10 삼성전자주식회사 저비트율 복호화방법 및 장치
EP2849180B1 (en) * 2012-05-11 2020-01-01 Panasonic Corporation Hybrid audio signal encoder, hybrid audio signal decoder, method for encoding audio signal, and method for decoding audio signal
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
US9401152B2 (en) 2012-05-18 2016-07-26 Dolby Laboratories Licensing Corporation System for maintaining reversible dynamic range control information associated with parametric audio coders
US10438597B2 (en) 2017-08-31 2019-10-08 Dolby International Ab Decoder-provided time domain aliasing cancellation during lossy/lossless transitions

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3171990D1 (en) * 1981-04-30 1985-10-03 Ibm Speech coding methods and apparatus for carrying out the method
US4455649A (en) * 1982-01-15 1984-06-19 International Business Machines Corporation Method and apparatus for efficient statistical multiplexing of voice and data signals
GB8330885D0 (en) * 1983-11-18 1983-12-29 British Telecomm Data transmission
GB8421498D0 (en) * 1984-08-24 1984-09-26 British Telecomm Frequency domain speech coding
DE3506912A1 (de) 1985-02-27 1986-08-28 Telefunken Fernseh Und Rundfunk Gmbh, 3000 Hannover Verfahren zur uebertragung eines audiosignals
IL76283A0 (en) * 1985-09-03 1986-01-31 Ibm Process and system for coding signals
DE3629434C2 (de) * 1986-08-29 1994-07-28 Karlheinz Dipl Ing Brandenburg Digitales Codierverfahren
DE3639753A1 (de) 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
NL8901032A (nl) * 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
IEEE Transaction on Acoustics,Speech and Signal Processing,Vol.34,No.5,1986,J.P.Princen,A.B.Bradley 「Analysis/Synthesis Filter Bank Design Based on Time Domain Aliasing Cancellation」p.1153〜1161

Also Published As

Publication number Publication date
AU3373693A (en) 1993-04-22
SG47111A1 (en) 1998-03-20
EP0514949A2 (en) 1992-11-25
AU655535B2 (en) 1994-12-22
DK0513860T3 (da) 1997-08-18
DE69026278D1 (de) 1996-05-02
DE69026278T3 (de) 2002-08-08
DE69006011D1 (de) 1994-02-24
EP0514949A3 (en) 1993-02-03
EP0513860B1 (en) 1997-03-19
DK0560413T3 (da) 1996-04-22
ATE136147T1 (de) 1996-04-15
ATE160464T1 (de) 1997-12-15
BR9007063A (pt) 1991-10-08
WO1990009022A1 (en) 1990-08-09
DE69031737D1 (de) 1998-01-02
EP0511692A2 (en) 1992-11-04
ATE150571T1 (de) 1997-04-15
ES2109296T3 (es) 1998-01-16
EP0513860A2 (en) 1992-11-19
DE69006011T3 (de) 2007-08-23
DE69030266T2 (de) 1997-08-14
EP0514949B1 (en) 1997-11-19
EP0511692A3 (en) 1993-01-27
EP0560413A2 (en) 1993-09-15
DE69031737T2 (de) 1998-04-09
EP0455738B2 (en) 2007-04-04
DK0514949T3 (da) 1998-07-27
AU5159690A (en) 1990-08-24
SG49891A1 (en) 1998-06-15
SG48247A1 (en) 1998-04-17
ES2085680T3 (es) 1996-06-01
ES2085680T5 (es) 2002-10-16
ATE100235T1 (de) 1994-01-15
EP0513860A3 (en) 1993-01-27
EP0455738A1 (en) 1991-11-13
DE69026278T2 (de) 1996-11-14
JPH04504192A (ja) 1992-07-23
DK0560413T4 (da) 2002-06-17
ES2099185T3 (es) 1997-05-16
EP0560413B2 (en) 2002-05-15
EP0560413A3 (ja) 1994-05-04
DE69030266D1 (de) 1997-04-24
EP0560413B1 (en) 1996-03-27
AU631404B2 (en) 1992-11-26
DE69006011T2 (de) 1994-08-18
EP0455738B1 (en) 1994-01-12

Similar Documents

Publication Publication Date Title
JP2821713B2 (ja) 高品質オーディオ用低ビット伝送速度変換コーダ、デコーダ、及びエンコーダ・デコーダ
EP0610975B1 (en) Coded signal formatting for encoder and decoder of high-quality audio
US5142656A (en) Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5230038A (en) Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5109417A (en) Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5222189A (en) Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5479562A (en) Method and apparatus for encoding and decoding audio information
US5357594A (en) Encoding and decoding using specially designed pairs of analysis and synthesis windows
US5752225A (en) Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands
KR100193353B1 (ko) 적응블록길이, 적응변환, 적응윈도우 변환코더, 디코더 및 고품질 오디오용 인코더/디코더
JP3093178B2 (ja) 高品質オーディオ用低ビットレート変換エンコーダ及びデコーダ

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080904

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090904

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100904

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100904

Year of fee payment: 12