JP2007504503A - 低ビットレートオーディオ符号化 - Google Patents

低ビットレートオーディオ符号化 Download PDF

Info

Publication number
JP2007504503A
JP2007504503A JP2006525245A JP2006525245A JP2007504503A JP 2007504503 A JP2007504503 A JP 2007504503A JP 2006525245 A JP2006525245 A JP 2006525245A JP 2006525245 A JP2006525245 A JP 2006525245A JP 2007504503 A JP2007504503 A JP 2007504503A
Authority
JP
Japan
Prior art keywords
frequency
phase
track
sine wave
sinusoidal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006525245A
Other languages
English (en)
Inventor
ハー ホトー,ヘラルド
イェー ヘリットス,アンドレアス
Original Assignee
コニンクリユケ フィリップス エレクトロニクス エヌ.ブイ.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コニンクリユケ フィリップス エレクトロニクス エヌ.ブイ. filed Critical コニンクリユケ フィリップス エレクトロニクス エヌ.ブイ.
Publication of JP2007504503A publication Critical patent/JP2007504503A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

正弦波オーディオエンコーダの場合、オーディオセグメントごとに複数の複数の正弦波を推定する。正弦波は周波数、振幅、及び位相により表される。本発明はトラックに依存した位相量子化を使用する。細かいものから粗いものまである可能な初期(例えば、周波数に依存する)グリッドの組のうち、選択された好適な初期量子化グリッドでトラックを符号化する。一連の時間セグメントにおいて、1つのトラックの周波数変化が所定値よりも小さい場合、そのトラックはより細かい量子化グリッドを用いて量子化される。本発明は、複合信号、特に低ビットレート量子化器の複合信号の品質を大幅に改善する。

Description

発明の詳細な説明
本発明は、ブロードバンド信号、特にオーディオ信号の符号化と復号に関する。本発明は、エンコーダとデコーダの両方に関し、また、本発明により符号化されたオーディオストリームに関し、また、オーディオストリームが格納されているデータ記憶媒体に関する。
ブロードバンド信号、例えばセリフ等のオーディオ信号を伝送するとき、圧縮または符号化方法を用いて信号の帯域幅またはビットレートを低下させる。
図1は、本発明で使用する、国際出願第WO01/69593号に記載された既知のパラメータ符号化装置、特に正弦波エンコーダを示している。このエンコーダでは、入力オーディオ信号x(t)は、(重なり合っていてもよい)複数の時間セグメントまたはフレーム(一般的には各20msの長さ)に分割される。各セグメントは、過渡成分、正弦波成分、及びノイズ成分に分解される。本発明の目的には関係ないが、入力オーディオ信号の他の成分、例えば高調波成分を求めることも可能である。
図1の正弦波分析器130において、各セグメントの信号x2は、振幅パラメータ、周波数パラメータ、及び位相パラメータにより表された複数の正弦波を用いてモデル化される。この情報は、通常、フーリエ変換(FT)を実行することにより、1つの分析期間について取り出される。フーリエ変換により、周波数、各周波数の振幅、各周波数の位相を含む、その期間のスペクトル表示が得られる。ここで、各位相は「ラップ」されている、すなわち、{−π,π}の範囲にある。セグメントの正弦波情報が一旦推定されると、トラッキングアルゴリズムが開始される。このアルゴリズムは、コスト関数を用いて異なるセグメントの正弦波を互いにセグメント毎にリンクさせ、いわゆるトラックを求める。このように、トラッキングアルゴリズムにより正弦波コードCが得られる。正弦波コードCは、ある時刻から始まり、複数の時間セグメントにわたる期間の間に時間発展し、その後停止する正弦波トラックを有する。
上記の正弦波符号化において、通常、エンコーダで形成されたトラックの周波数情報を伝送する。この伝送は、簡単なやり方で比較的低コストで実行することができるが、その理由は、トラックの周波数変化はゆっくりしているからである。それゆえ、周波数情報は時間差分符号化により効率的に伝送することができる。一般的に、振幅も時間差分符号化することができる。
周波数とは対照的に、位相は時間的により急激に変化する。周波数が一定の場合、位相は時間的に線形に変化し、周波数変化により位相が線形の変化からずれる。トラックセグメントインデックスの関数として、位相はほぼ線形に振る舞う。それゆえ、符号化された位相の伝送はより複雑である。しかし、伝送時、フーリエ変換から分かるように、位相は{−π,π}の範囲に限定されている、すなわち、位相は「ラップ」されている。位相のこのモジュロ2πの表現により、位相の構造的フレーム間関係は失われ、初めて見るとランダム変数であるように見える。
しかし、位相は、周波数の積分であるから、冗長であり、原理的には伝送する必要はない。このことは、位相連続(phase continuation)と呼ばれ、ビットレートを大幅に減らす。
位相連続の場合、各トラックの最初の正弦波は、ビットレートを節約するために伝送される。後続の各位相は最初の位相とトラックの周波数とから計算する。周波数は量子化され、必ずしも非常に正確に推定される訳ではないので、連続位相は測定された位相とはずれてしまう。実験によると、位相連続によりオーディオ信号の品質は低下する。
すべての正弦波の位相を伝送すると、レシーバ側での復号信号の品質は高くなるが、ビットレート/帯域幅も大幅に大きくなってしまう。それゆえ、ジョイント周波数/位相量子化器では、−πからπの値を有する正弦波トラックの測定位相が測定周波数とリンキング情報を用いて接続され、トラックの接続された位相が単調に増大することとなる。そのエンコーダでは、接続された位相は、アダプティブ差分パルスコード変調(ADPCM)量子化器を用いて量子化され、デコーダに伝送される。デコーダは接続された位相トラジェクトリから正弦波トラックの周波数と位相とを求める。
位相連続においては、符号化された周波数のみが伝送され、デコーダは、位相と周波数間の積分関係を利用して位相を再生する。しかし、位相連続を使用する場合、位相は完全には再生できない。周波数の測定誤差や量子化ノイズにより周波数誤差が生じた場合、位相は、積分関係を用いて再構成され、一般的にはドリフト特性を有する誤差を示す。その理由は、周波数誤差はほぼランダムな特性を有するからである。低周波数誤差は積分により増幅され、その結果、再生された位相は実測された位相からドリフトしていってしまう傾向がある。これによるアーティファクトは聞き取ることができる。
上記を図2aに示した。ここで、Ωとψは、それぞれトラックの実周波数と実位相である。エンコーダとデコーダの両方で、文字「I」で表したように、周波数と位相は積分関係を有する。エンコーダにおける量子化プロセスはノイズnを付け加えることでモデル化した。デコーダでは、このように再生された位相
(外1)
Figure 2007504503
は、実位相ψとノイズ成分εの2つの成分を有する。再生された位相のスペクトルとノイズεのパワースペクトル密度関数は両方とも顕著な低周波数特性を有する。
このように、位相連続においては、再生された位相は低周波数信号の積分であるため、再生された位相自体も低周波数信号であることが分かる。しかし、再構成プロセスで入るノイズもこの低周波数範囲では優勢である。それゆえ、符号化の際に入ったノイズnをフィルタリングする目的でこれらの信号源を分離することは困難である。
従来の量子化方法では、周波数と位相は互いに別々に量子化される。一般的に、一様スカラー量子化器を位相パラメータに適用する。知覚的な理由から、低周波は高周波よりも正確に量子化すべきである。それゆえ、周波数は、ERBまたはBark関数を用いて、不均一表示に変換され、均一に量子化され、結果として不均一な量子化器である。また、物理的理由もある。調波複合音では、高い調和振動数ほど低い振動数よりも周波数変化が大きくなる傾向がある。
周波数と位相が共に量子化される場合、周波数依存の量子化の正確性は簡単ではない。一様量子化アプローチを使用すると、音声再構成の品質が低くなってしまう。
初期量子化精度の選択、すなわち量子化精度は、量子化グリッドとも呼ばれ、位相ADPCM量子化器で使用される、トラックの最初のエレメントの量子化に使用されるが、以下の2つの場合のバランスである。
−予測することが困難な接続された位相を求められるスピード。
この例には、周波数が急速に変化しているトラックがある。
−予測することが容易な接続された位相を求められる精度。この例には、周波数がほぼ一定であるトラックがある。
初期量子化グリッドが細かすぎる場合、位相ADPCM量子化器は、接続位相を予測することが困難なとき、それに追随することができない。この場合、トラックに大きな量子化誤差が生じ、聴取可能な歪みが入ってしまう。これによりビットレートが上昇する。一方、初期量子化グリッドが粗すぎる場合、図7に示したように、スイッチングオン振動が容易に予測可能なトラックで発生し、元のトラックの周波数がステップ状に変化する。この図において、元の周波数は約1.9Hzの精度で推定されている。推定周波数の振動は聞き取ることができ、望ましくない。
本発明は、ブロードバンド信号、特にセリフ信号等のオーディオ信号を低ビットレートを用いて符号化する方法を提供する。正弦波エンコーダの場合、オーディオセグメントごとに複数の複数の正弦波を推定する。正弦波は周波数、振幅、及び位相により表される。従来、位相は周波数とは独立に量子化されていた。本発明は、複合信号、特に低ビットレート量子化器の複合信号の品質を大幅に改善する。
本発明によると、トラックは、複数の可能な初期グリッドの組のうちから選択された好適な初期量子化グリッドを用いて符号化される。この初期グリッドは、細かいものから粗い物まである。2つの可能な初期グリッドを用いてよい結果を得ることができるが、複数のグリッドを用いることもできる。一連の時間セグメントにおいて、1つのトラックの周波数変化が所定値よりも小さい場合、そのトラックはより細かい量子化グリッドを用いて量子化される。この方法により、図7の振動問題を避けることができる。初期グリッドの選択に関する情報がデコーダに送信される必要がある。
これにより、全ての周波数においてよい位相精度と信号品質を維持したまま、低ビットレートで位相情報を送信できるという利点が得られる。この方法の利点は、特に、位相と周波数の量子化に小数のビットのみを使用した場合の、位相精度の改善と、それによる音声品質の改善である。一方、必要な音声品質はより少ないビットを用いて得ることができる。
本発明の好ましい実施形態を添付した図面を参照して説明する。図面においては、同じ構成要素には同じ参照数字を付し、これらは特に言及しない限り同じ機能を果たす。本発明の好ましい実施形態において、エンコーダ1は、WO01/69593の図1に示されたタイプの正弦波エンコーダである。この従来技術に属するエンコーダとそれに対応するデコーダについては上記文献に十分説明されているので、ここでは本発明に関係するところだけを説明する。
従来技術と本発明の好ましい実施形態との両方において、オーディオエンコーダ1は、1つのサンプリング周波数で入力オーディオ信号をサンプルし、オーディオ信号のデジタル表示x(t)を求める。エンコーダ1は、サンプリングされた入力信号を3つの成分、すなわち過渡信号成分、持続的決定論的成分、及び持続的確率論的成分に分ける。オーディオエンコーダ1は、過渡エンコーダ11、正弦波エンコーダ13、及びノイズエンコーダ14を有する。
過渡エンコーダ11は、過渡ディテクタ(検出器)(TD)110、過渡アナライザ(分析器)(TA)111、及び過渡シンセサイザ(合成器)(TS)112を有する。最初に、信号x(t)は過渡ディテクタ110に入力される。このディテクタ110は、過渡信号成分があるかどうかとその位置とを調べる。この情報は過渡アナライザ111に入力される。過渡信号成分の位置が決定された場合、過渡アナライザ111がその過渡信号成分(の主要部分)を取り出すように試みる。過渡アナライザ111は、好ましくは推定された開始位置で始まる信号セグメントに形状関数をマッチさせて、例えば複数(少数)の正弦波成分を利用して、その形状関数の下にあるコンテントを決定する。この情報は過渡コードCに含まれる。過渡コードCの生成に関するより詳細な情報はWO01/69593に記載されている。
過渡コードCは過渡シンセサイザ112に入力される。合成された過渡信号成分は、減算器16において入力信号x(t)から減算され、信号x1となる。ゲイン制御メカニズムGC(12)を用いて信号xから信号xを作る。
信号x2は、正弦波エンコーダ13に入力され、正弦波アナライザ(分析器)(SA)130で分析される。正弦波アナライザ130は(決定論的)正弦波成分を決定する。それゆえ、分かることは、過渡アナライザがあることが望ましいが、必ずしも必要ではなく、本発明はそのようなアナライザが無くても実施することができる。あるいは、上述のように、本発明は、例えば調和複合音アナライザを用いて実施することもできる。要するに、正弦波エンコーダは、正弦波成分のトラックが1つのフレームセグメントから次のフレームセグメントにリンクされる際、入力信号xを符号化する。
ここで図3aを参照する。従来技術と同様に、好ましい実施形態において、入力信号x2の各セグメントがフーリエ変換(FT)部40において周波数領域に変換される。各セグメントについて、フーリエ変換部は測定された振幅A、位相φ、周波数ωを出力する。前に述べたように、フーリエ変換により与えられる位相の範囲は−π≦φ<πに制限されている。トラッキングアルゴリズム(TA)部42は、各セグメントの情報を取り、好適なコスト関数を利用することにより、1つのセグメントから次のセグメントに正弦波をリンクする。これにより、各トラックについて測定された位相φ(k)と周波数ω(k)のシーケンスを作る。
従来技術と対照的に、アナライザ130により最終的に得られる正弦波コードCは、位相情報を含み、周波数はデコーダにおいてこの情報から再構成される。
しかし、上述のように、測定された位相はラップされている、すなわち、モジュロ2πに制限されている。それゆえ、好ましい実施形態においては、アナライザは位相接続器(PU)44を有し、モジュロ2πの位相表現を接続して、トラックの構造的なフレーム間の位相の振る舞いψを明らかにする。正弦波トラックの周波数はほぼ一定であるから、接続された位相ψは一般的にはほぼ線形に増加(または減少)する関数であり、位相を安価に(すなわち低いビットレートで)伝送することを可能にすることが分かる。接続された位相ψは位相エンコーダ(PE)46に入力される。その位相エンコーダ46は伝送に好適な量子化された表示レベルrを出力する。
ここで、位相接続器44の動作について述べる。上述のように、トラックの瞬間的位相ψと瞬間的周波数Ωは、次の式(1)の関係を有する。
Figure 2007504503
ここで、Tは基準時刻である。
フレームk=K,K+1...K+L−1の正弦波トラックは、測定された(ラジアン毎秒で表現される)周波数ω(k)と測定された(ラジアンで表現される)位相φ(k)を有する。フレームの中央間の距離はU(秒で表現される更新レート)で与えられる。測定された周波数は、ω(k)=Ω(kU)として、仮定された基礎をなす連続時間周波数トラックΩのサンプルであると考えられ、同様に、測定された位相は、φ(k)=ψ(kU)mod(2π)として、関連づけられた連続時間位相トラックψのサンプルである。正弦波符号化の場合、Ωはほぼ一定の関数であると仮定する。
セグメント内では周波数はほぼ一定であると仮定すると、式1は次の式(2)ように近似できる。
Figure 2007504503
1つのセグメントの位相と周波数及び次のセグメントの周波数が分かると、次のセグメントの接続された位相の値を推定することが可能であり、トラックの各セグメントについても同様である。
好ましい実施形態において、位相接続器は、次の式(3)により時刻kにおける接続係数を決定する。
Figure 2007504503
接続係数m(k)により、位相接続器44は、接続された位相を求めるために加えなければならないサイクル数が分かる。
式(2)と(3)を組み合わせて、位相接続器は、次式のように増加接続係数e(k)を決定する。
Figure 2007504503
ここでeは整数である。しかし、測定及びモデル化による誤差のため、増加接続係数は正確には整数にならない。そこで、
Figure 2007504503
とする。モデル化及び測定による誤差は小さいと仮定した。
増加接続係数eが分かると、式(3)のm(k)を総和として計算できる。ここで、一般性を失わずに、位相接続器はm(K)=0である最初のフレームKから始まり、m(k)とφ(k)から(接続された)位相ψ(kU)が決定される。
実際には、サンプルされたデータψ(kU)とΩ(kU)は、測定誤差により歪められる。
Figure 2007504503
ここで、εとεは、それぞれ位相誤差及び周波数誤差である。接続係数の決定がいい加減にならないように、データは十分な精度で測定する必要がある。このように、好ましい実施形態においては、トラッキングは次の制限を満たす:
Figure 2007504503
ここで、δは丸め誤差である。誤差δは、主に、Uとの乗算によるωの誤差により決定される。ωはサンプリング周波数Fでサンプルされた入力信号からのフーリエ変換の絶対値の最大値から決定され、フーリエ変換の分解能は2π/L(Lは分析サイズ)であると仮定する。考慮された限度内にあるためには、
Figure 2007504503
すなわち、接続を正確にするためには、分析サイズは更新サイズより少し大きくなくてはならず、例えば、δ=1/4とすると、分析サイズは更新サイズの4倍でなければならない(位相測定の誤差εは無視した)。
丸め操作において決定誤差を避けるために取ることができる2つめの注意は、トラックを適当に決めることである。トラッキング部42において、正弦波トラックは、一般的に、振幅及び周波数の違いを考慮して決められる。また、リンクの基準で位相情報を説明することも可能である。
例えば、位相推定誤差εを測定値と推定値
(外2)
Figure 2007504503
との差として次式で定義することも可能である。
Figure 2007504503
ここで、推定値は次式による。
Figure 2007504503
このように、好ましくは、トラッキング部42は、εが一定値より大きい(例えば、ε>π/2)であるトラックを禁止して、e(k)の定義をはっきりさせる。
また、エンコーダは、デコーダで利用できるような位相と周波数を計算する。デコーダで利用可能になる位相または周波数がエンコーダにある位相及び/または周波数と大きく違いすぎる場合、トラックを中断するものと決めてもよい。すなわち、トラックの終了信号を出し、現在の周波数、位相、及びリンクされた正弦波のデータを用いて新しいトラックを開始してもよい。
位相接続器(PU)44により作られたサンプルされ接続された位相ψ(kU)は、位相エンコーダ(PE)46に入力され、表示レベルrの組を作る。接続された位相のように、一般的に単調に変化する特性を効率的に伝送する方法が知られている。図3bの好ましい実施形態において、アダプティブ差分パルス符号変調(APCM)が利用される。ここで、推定器(PF)48を使用して、次のトラックセグメントの位相を推定し、量子化器(Q)50において差のみを符号化する。ψはほぼ線形な関数であると期待され、簡単化するため、推定器48は次の形の2次フィルタとする:
Figure 2007504503
ここで、xは入力であり、yは出力である。しかし、(高次の関係を含む)他の機能的関係を取ることも可能であり、フィルター係数のアダプティブな(バックワードまたはフォワード)当てはめを含むこともできる。好ましい実施形態においては、簡単のため、バックワードアダプティブ制御メカニズム(QC)52を使用して、量子化器50を制御する。フォワードアダプティブ制御も可能であるが、余分なビットレートがオーバーヘッドとして必要となる。
1つのトラックに対して、エンコーダ(及びデコーダ)は、開始位相φ(0)と開始周波数ω(0)が分かってから初期化される。これらは別のメカニズムにより量子化及び伝送される。また、図5bに示した、エンコーダの量子化コントローラ52とデコーダの対応するコントローラ62で使用される初期量子化ステップは、エンコーダ及びデコーダの両方で、伝送されるか一定の値に設定される。最後に、トラックの終わりは、別のサイドストリームで、または位相のビットストリームで一意的なシンボルとして、信号を送ることもできる。
接続された位相の開始周波数は、エンコーダとデコーダの両方で既知である。この周波数に基づき、量子化精度を選択する。低い振動数で始まる接続された位相トラジェクトリの場合、より高い周波数で始まる接続された位相トラジェクトリの場合よりも、より正確な量子化グリッド、すなわち、より高い分解能を選択する。
ADPCM量子化器においては、接続された位相ψ(k)(kはトラック中の番号を表す)トラック中の先行する位相から予測/推定される。
予測された位相
(外3)
Figure 2007504503
と接続された位相ψ(k)の間の差が量子化され、伝送される。
量子化器は、トラック中の全ての接続された位相に適合する。予測誤差が小さいとき、量子化器は可能な値の範囲を限定し、量子化がより正確になる。一方、予測誤差が大きいとき、量子化器はより粗い量子化をする。
図3bの量子化器Qは、次式で計算される予測誤差Δを量子化する:
Figure 2007504503
予測誤差Δは、ルックアップテーブルを用いて量子化できる。この目的のため、テーブルQを保持している。例えば、2ビットのADPCM量子化器の場合、テーブルQは最初は表1に示すテーブルのようなものである。
Figure 2007504503
表1:最初に使用する量子化テーブルQ
量子化は以下のように行われる。次式が満たされるかどうか予測誤差Δを境界bと比較する。
Figure 2007504503
上の関係を満たすiの値から表示レベルrをr=iにより計算する。
関連づけられた表示レベルは表示テーブルRに格納される。表示テーブルRは表2に示されている。
Figure 2007504503
表2:最初に使用する表示テーブルR
テーブルQとRに係数cをかけて、トラックの次の正弦波成分を量子化する。
Figure 2007504503
トラックの復号の際、両方のテーブルは生成された表示レベルrによりスケールされる。現在のサブフレームについてrが1または2(内部レベル)のいずれかである場合、量子化テーブルのスケールファクタcは、次式のように設定される:
Figure 2007504503
c<1であるから、トラックの次の正弦波の周波数と位相は、より正確になる。rが0または3(外部レベル)、スケールファクタ次式により設定される:
Figure 2007504503
c>1であるから、トラックの次の正弦波の量子化精度は低下する。これらのファクタを用いて、1つのアップスケーリングを2つのダウンスケーリングで取り消すことができる。アップスケーリングファクタとダウンスケーリングファクタの違いにより、アップスケーリングを速くなるが、対応するダウンスケーリングには2つのステップが必要となる。
量子化テーブルのエントリーが多すぎたり少なすぎたりしないように、内側レベルの絶対値がπ/64と3π/4の間である場合にだけ、適応を行う。その場合、cは1に設定される。
デコーダでは、受信した表示レベルrを量子化された予測誤差に変換するためにテーブルRだけを保持していればよい。この逆量子化操作は図5bのブロックDQにより実行される。
上記の設定を用いて、再構成された音声の品質を改善する必要がある。本発明により、開始周波数に応じて、接続された位相トラックに対して異なる初期テーブルを使用する。これによりよい音声品質を得ることができる。これは以下のように行われる。初期テーブルQとRがトラックの最初の周波数に基づきスケールされる。テーブル3において、スケールファクタが周波数範囲とともに与えられる。トラックの最初の周波数が一定の周波数範囲に入っている場合、適当なスケールファクタを選択し、テーブルRとQがそのスケールファクタにより分割される。終点もトラックの最初の周波数によって決まりうる。デコーダにおいて、正しい初期テーブルRを作るために対応する手順が実行される。
Figure 2007504503
テーブル3:周波数に依存するスケールファクタ及び初期テーブル
テーブル3は、2ビットADPCM量子化器の場合に、周波数に依存するスケールファクタの例と対応する初期テーブルQとRを示す。0−22050Hzのオーディオ周波数範囲が4つの副周波数範囲に分割されている。高い周波数範囲と比較して低い周波数範囲において位相精度がよくなっていることが分かる。
副周波数範囲の数と周波数依存スケールファクタは可変であり、個別の目的と必要性に合うように選択できる。上述のように、テーブル3の周波数依存初期テーブルQとRは、1つの時間セグメントから次の時間セグメントに位相が発展するのに合わせて動的にアップスケール及びダウンスケールしてもよい。
例えば、3ビットADPCM量子化器において、3ビットで決まる8つの量子化区間の初期の境界は次のように決めることができる:
Q={−∞,−1.41,−0.707,−0.35,0,0.35,0.707,1.41,∞}。
そして、最小グリッドサイズはπ/64であり、最大グリッドサイズはπ/2である。表示テーブルRは次のようになる:
R={−2.117,−1.0585,−0.5285,−0.1750,0.1750,0.5285,1.0585,2.117}
テーブル3に示したように、テーブルQとRの同様の周波数依存初期化をこの場合には使用することができる。
デコーダの正弦波シンセサイザ(SS)32について説明するのと同様に、正弦波エンコーダで生成された正弦波コードCから正弦波信号成分を正弦波シンセサイザ(SS)131により再構成する。この信号は、正弦波エンコーダ13への入力xから減算器17において減算され、残余信号xになる。正弦波エンコーダ13により作られた残余信号xは好ましい実施形態のノイズアナライザ14に送られる。そのノイズアナライザ14は、例えば、国際特許出願第PCT/EP00/04599号に記載したように、このノイズを表すノイズコードCを作る。
最後に、マルチプレクサ15において、コードC、C及びCを含むオーディオストリームASが構成される。オーディオストリームASは、例えば、データバス、アンテナシステム、記憶媒体等に送られる。
図4は、データバス、アンテナシステム、記憶媒体等から得られた、例えば、図1のエンコーダ1により生成された、オーディオストリームAS′を復号するのに好適なオーディオプレーヤ3を示している。コードC、C、Cを求めるため、オーディオストリームAS′はデマルチプレクサ30で逆多重される。これらのコードは、それぞれ過渡シンセサイザ31、正弦波シンセサイザ32、及びノイズシンセサイザ33に入力される。過渡コードCから、過渡信号成分が過渡シンセサイザ31で計算される。過渡コードが形状関数を示す場合、受信したパラメータに基づいて形状が計算される。さらに、形状コンテントが正弦波成分の周波数と振幅に基づき計算される。過渡コードCがステップを示している場合、過渡計算は行われない。トータルの過渡信号yTは全ての過渡計算を合計したものである。
アナライザ130により符号化された情報を含む正弦波コードCは、信号yを生成するために正弦波シンセサイザ32により使用される。ここで、図5aと5bを参照して、正弦波シンセサイザ32は、位相エンコーダ46と互換性のある位相デコーダ(PD)56を有する。ここで、逆量子化器(DQ)60は、2次予測フィルタ(PF)64とともに、表示レベルr、予測フィルタ(PF)64に提供された初期情報
(外4)
Figure 2007504503
及び量子化コントローラ(QC)62の初期量子化ステップから、接続された位相
(外5)
Figure 2007504503
(の予測値)を作る。
図2bに示したように、周波数は、接続された位相
(外6)
Figure 2007504503
から差分により再生することができる。デコーダにおける位相誤差がほぼ白色であると仮定すると、差分により高い周波数が増幅されるから、差分をローパスフィルタと組み合わせてノイズを低減し、そうすることにより、デコーダにおいて周波数を正確に推定することができる。
好ましい実施形態において、フィルタ部(FR)58は差分を近似する。これは、前方差分、後方差分、または中央差分の方法により接続された位相から周波数
(外7)
Figure 2007504503
を求めるのに必要である。これにより、デコーダは、符号化信号の正弦波成分を合成するために従来の方法で使用することができる位相
(外8)
Figure 2007504503
と周波数
(外9)
Figure 2007504503
を出力することができる。
同時に、信号の正弦波成分が合成される際、ノイズコードCがノイズシンセサイザNS33に入力される。このノイズシンセサイザNS33は、主に、ノイズのスペクトルを近似する周波数応答を有するフィルタである。NS33は、ノイズコードCで白色ノイズ信号をフィルタすることにより、再構成ノイズyを生成する。トータル信号y(t)は、過渡信号yと、振幅解凍(g)と正弦波信号yの和の積と、ノイズ信号yとを有する。オーディオプレーヤは、信号をそれぞれ合計する2つの加算器36と37を有する。トータル信号は、例えばスピーカである出力部35に送られる。
図6は、本発明によるオーディオシステムを示しており、図1に示したオーディオエンコーダ1と、図4に示したオーディオプレーヤ3とを有する。このようなシステムは再生機能と記録機能とを有する。オーディオストリームASは、オーディオエンコーダからオーディオプレーヤに通信チャネル2を解して送られる。通信チャネル2は、例えば、ワイヤレス接続、データバス20、または記憶媒体である。通信チャネル2が記憶媒体である場合、その記憶媒体はシステムに固定されていてもよいし、リムーバブルのディスク、メモリカード、メモリチップ、その他の固体メモリであってもよい。通信チャネル2はオーディオシステムの一部であってもよいが、その外部にあってもよい。
複数の連続セグメントからの符号化データがリンクされる。これは以下のように行われる。複数の正弦波が(例えばFFTを用いて)決定される。正弦波は周波数、振幅、及び位相により構成されている。1セグメント当たりの正弦波の数は可変である。一旦セグメントに対して正弦波が決定されると、前のセグメントの正弦波と接続するための分析が実行される。これは、「リンキング」または「トラッキング」と呼ばれている。その分析は、現在のセグメントの正弦波と、前のセグメントからの全ての正弦波の間の差に基づく。前のセグメントの差が最も小さい正弦波とリンク/トラックする。差が最も小さくても所定の閾値より大きい場合、前のセグメントの正弦波との接続はしない。このように、新しい正弦波が生成される、すなわち「生まれる」。
正弦波間の差は、コスト関数を用いて決定される。このコスト関数は、正弦波の周波数、振幅、及び位相を使用する。この分析は各セグメントに対して実行される。結果として、オーディオ信号に対して多数のトラックが得られる。トラックは、前のセグメントからの正弦波と接続していない正弦波である起源を有する。起源正弦波は差分せずに符号化される。前のセグメントからの正弦波と接続された正弦波は連続と呼ばれ、前のセグメントからの正弦波に対する差が符号化される。これにより多くのビットが節約できる。その理由は、絶対値でなく差だけが符号化されるからである。
本発明によると、例えば、各トラックに対して2つの可能な初期グリッドの組が使用された場合、2つの初期グリッドのどちらが実際に使用されたかを示す1ビットをデコーダに伝送しなければならない。エンコーダにおいて、1つのトラックに沿った周波数を調べて、周波数差を決定し、その差を所定の閾値と比較する。その差が閾値より大きい場合、粗いグリッドを選択するが、そうでない場合、細かいグリッドを選択する。周波数差は、周波数間の数値的差または差以外の統計的量(例えば、標準偏差)である。
これによりオーディオ品質がよくなる。同様に、各トラックに対して4つの可能な初期グリッドの組が使用される場合、4つの初期グリッドのどれが使用されたかを示す2ビットをデコーダに伝送しなければならない。一般的に、12500ビット/秒のビットレートで動作する、参考文献[1]に記載したエンコーダの場合、300ビット/秒のビットレートがこの方法に割り当てられる。しかし、本発明の以下の方法により、オーディオ品質を維持したまま、ビットレートを低くすることができる。
エンコーダにおいて、以下の条件
a)少なくとも所定数のフレーム長(例えば、5フレーム)であり、
b)第2フレームから第5フレームまでの最高周波数と最低周波数の間の差が所定値よりも小さい、
を満たすトラックは、上記の2条件a)、b)を満たさない残りのトラックに対して使用される初期量子化グリッドよりも細かい(例えば、2倍細かい)初期量子化グリッドで符号化される。
好ましくは、少なくとも所定数のフレーム長(例えば、5フレーム)であるトラックの少なくとも1つの初期化を有するフレームにおいて、以下の条件の1つがあてはまる:
− フレーム中のどのトラックも細かい量子化グリッドを用いて符号化されていない。この場合、「0」がデコーダに送信され、その他の情報はデコーダに送信される必要はない。
− 細かい量子化グリッドを用いて少なくとも1つのトラックが符号化された。この場合、「1」がデコーダに送信され、所定数のフレーム長(例えば、5フレーム)のトラック全てに対して、細かい初期量子化グリッドで符号化されたか、粗い初期量子化グリッドで符号化されたかを示す。デコーダはトラッキング情報を用いて、どのトラックが少なくとも所定数フレーム長を有するか判断する。
エンコーダで適用されて、上記の符号化方法により、デコーダは、トラックが細かい初期量子化グリッドと粗い初期量子化グリッドのどちらで符号化されたか決定することができる。
本発明の方法を参考文献[1]に記載したエンコーダに適用する場合、全ビットレート12500ビット/秒のうち、約100ビット/秒が必要である。本発明の方法において、ビットレートを低減した場合(100ビット/秒)と通常の場合(300ビット/秒)の間のビットレートのゲインは、2つより多い初期グリッドを使用した場合、大幅に大きくなる。
参考文献:[1]Gerard HothoとRobSluijter「A low bit rate audio and speech sinusoidal coder fornarrowband signals」In Proc. 1st IEEE Benelux workshop on MPCA-2002, pages 1-4, Leuven, Belgium, November 15, 2002。
本発明の一実施形態を実施する従来技術に属するオーディオエンコーダを示す図である。 従来のシステムにおける位相と周波数との関係を示す図である。 本発明によるオーディオシステムにおける位相と周波数との関係を示す図である。 図3aと図3bは、図1のオーディオエンコーダの正弦波エンコーダ構成要素の好ましい実施形態を示す図である。 本発明の一実施形態を実施するオーディオプレーヤを示す図である。 図5aと図5bは、図4のオーディオプレーヤの正弦波シンセサイザ構成要素の好ましい実施形態を示す図である。 本発明によるオーディオエンコーダとオーディオプレーヤを有するシステムを示す図である。 元の周波数トラックの例と、異なる量子化グリッドを用いた位相ADPCM量子化器による2通りの推定を示す図である。

Claims (23)

  1. 信号の符号化方法であって、
    複数の順次時間セグメントのそれぞれについてサンプルされた信号値の組を与えるステップと、
    前記複数の順次セグメントのそれぞれについて1つ以上の正弦波成分であって、それぞれが周波数値と位相値を含む正弦波成分を決定するため、前記サンプルされた信号値を分析するステップと、
    正弦波トラックを求めるため複数の順次セグメントにわたる正弦波成分をリンクするステップと、
    前記複数の順次セグメントのそれぞれの各正弦波トラックに、少なくとも前のセグメントの位相値の関数として推定された位相値を決定するステップと、
    各正弦波トラックについて、一般的に単調に変化する値を有する測定された位相値を決定するステップと、
    各トラックについて、前記トラック中の複数の正弦波を選択するステップと、
    各トラックについて、前記セグメントの推定された位相値と測定された位相値の関数として正弦波コードを、前記選択された正弦波の周波数に応じて量子化するステップと、
    前記周波数及び前記位相及びリンク情報を表す正弦波コードを含む符号化信号を生成するステップと、を有することを特徴とする方法。
  2. 請求項1に記載の方法であって、
    所定の時間セグメントにある2つの正弦波を選択し、
    前記正弦波コードが前記2つの正弦波の周波数間の違いに応じて量子化されることを特徴とする方法。
  3. 請求項1に記載の方法であって、
    前記正弦波コードが前記選択された2つの正弦波の周波数の標準偏差に応じて量子化されることを特徴とする方法。
  4. 請求項2に記載の方法であって、
    前記第1と第2の周波数値が第1の差を有する第1の正弦波トラックにおいて、前記正弦波コードは第1の量子化グリッドを用いて量子化され、
    前記第1と第2の周波数値が前記第1の差より小さい第2の差を有する第2の正弦波トラックにおいて、前記正弦波コードは前記第1の量子化グリッドと同じかまたはより細かい第2の量子化グリッドを用いて量子化されることを特徴とする方法。
  5. 請求項4に記載の方法であって、
    時間セグメントにおいて、1つ以上の正弦波コードが前記第2の量子化グリッドを用いて量子化されたかどうかを示すコードを生成するステップをさらに有することを特徴とする方法。
  6. 請求項4に記載の方法であって、
    前記符号化信号は、前記第1と第2の量子化精度が等しいか否かに応じたコードを含むことを特徴とする方法。
  7. 請求項1に記載の方法であって、
    1つのトラックの正弦波コードは、初期位相値と初期周波数値を含み、前記推定するステップは最初の推定をするために前記初期周波数値と前記初期位相値を使用することを特徴とする方法。
  8. 請求項1に記載の方法であって、
    各リンクされたセグメントの位相値は、前のセグメントの周波数と前記リンクされたセグメントの周波数の積分と、及び前のセグメントの位相との関数として決定され、前記正弦波成分は範囲{−π,π}に位相値を含むことを特徴とする方法。
  9. 請求項1に記載の方法であって、
    前記正弦波コードの量子化は、
    各推定された位相値間の位相差の決定と、
    対応する観測された位相値と、を含むことを特徴とする方法。
  10. 請求項6に記載の方法であって、
    前記生成するステップは、前記量子化された正弦波コードの関数として前記量子化するステップを制御するステップを有することを特徴とする方法。
  11. 請求項8に記載の方法であって、
    前記正弦波コードは、トラックの終わりのインジケータを含むことを特徴とする方法。
  12. 請求項1に記載の方法であって、
    前記正弦波コードを用いて前記正弦波成分を合成するステップと、
    オーディオ信号の残余成分を表す一組の値を与えるため、前記サンプルされた信号値から前記合成された信号値を減算するステップと、
    パラメータを決定し、前記残余成分を近似することにより前記オーディオ信号の残余成分をモデル化するステップと、
    オーディオストリームに前記パラメータを含めるステップと、をさらに有することを特徴とする方法。
  13. 請求項1に記載の方法であって、
    前記サンプルされた信号値は過渡成分が取り除かれたオーディオ信号を表すことを特徴とする方法。
  14. オーディオストリームの復号方法であって、
    前記オーディオストリームは、周波数、位相、リンク情報、及び量子化グリッド情報を表す正弦波コードのトラックを含み、
    前記方法は、
    前記オーディオストリームを含む信号を受信するステップと、
    量子化グリッドの情報に応じて前記正弦波コードを逆量子化して接続された逆量子化位相値を求めるステップと、
    前記逆量子化された接続された位相値から周波数値を計算するステップと、
    前記オーディオ信号の前記正弦波成分を合成するため、前記逆量子化された周波数値と位相値とを使用するステップと、を有することを特徴とする方法。
  15. 請求項14に記載の方法であって、
    前記量子化グリッドの情報は、所定数の一連の時間セグメントにおいて、1つ以上の正弦波コードのトラックがデフォルト量子化グリッド以外の量子化グリッドを用いて量子化されたかどうかを示すコードを含み、
    前記方法は、どのトラックを前記デフォルト量子化グリッド以外の量子化グリッドを用いて量子化するか決定するために前記リンク情報を用いるステップをさらに有することを特徴とする方法。
  16. 請求項14に記載の方法であって、
    リンクされた各正弦波成分の位相値は、前のセグメントの周波数と前記リンクされたセグメントの周波数と、前のセグメントの位相の関数として決定され、
    前記正弦波成分は{−π,π}の範囲の位相値を含むことを特徴とする方法。
  17. 請求項14に記載の方法であって、
    前記量子化グリッドは、前記量子化された正弦波コードの関数として制御されることを特徴とする方法。
  18. 複数の順次時間セグメントのそれぞれについて、サンプルされた信号値の組を処理するように構成されたオーディオエンコーダであって、
    前記複数の順次セグメントのそれぞれについて1つ以上の正弦波成分であって、それぞれが周波数値と位相値を含む正弦波成分を決定するため、前記サンプルされた信号値を分析するアナライザと、
    正弦波トラックを求めるため複数の順次セグメントにわたる正弦波成分をリンクするリンカと、
    前記複数の順次セグメントのそれぞれの各正弦波トラックに、少なくとも前のセグメントの位相値の関数として推定された位相値を決定し、
    各正弦波トラックについて、一般的に単調に変化する値を有する測定された位相値を決定する位相接続器と、
    前記セグメントの推定された位相値と測定された位相値の関数として正弦波コードを、第1の時間セグメントの第1の周波数値と第2の時間セグメントの第2の周波数値に応じて量子化する、前記第1と第2の時間セグメントは一連の所定数の時間セグメントから選択される量子化器と、
    前記周波数及び前記位相を表す正弦波コードを含む符号化信号を与える手段と、を有することを特徴とするオーディオエンコーダ。
  19. 請求項16に記載のオーディオエンコーダであって、
    前記量子化器は、
    前記第1と第2の周波数値が第1の差を有する第1の正弦波トラックにおいて、前記正弦波コードを第1の量子化グリッドを用いて量子化し、
    前記第1と第2の周波数値が前記第1の差より小さい第2の差を有する第2の正弦波トラックにおいて、前記正弦波コードを前記第1の量子化グリッドと同じかまたはより細かい第2の量子化グリッドを用いて量子化することを特徴とするオーディオエンコーダ。
  20. オーディオプレーヤであって、
    リンクされた正弦波成分の各トラックの周波数と位相、及び位相とリンク情報と量子化グリッド情報を表す正弦波コードのトラックを含む符号化オーディオ信号を読み出す手段と、
    量子化グリッド情報に応じて前記正弦波コードを逆量子化して接続された逆量子化位相値を求め、前記逆量子化した接続された位相値から周波数値を計算する逆量子化器と、
    前記オーディオ信号の前記正弦波成分を合成するため、前記生成された位相値と周波数値とを使用するシンセサイザと、を有することを特徴とするオーディオプレーヤ。
  21. オーディオシステムであって、請求項16に記載のオーディオエンコーダと、請求項20に記載のオーディオプレーヤとを有することを特徴とするオーディオシステム。
  22. オーディオ信号の複数の順次時間セグメントにわたってリンクした正弦波成分のトラックを表す正弦波コードを有するオーディオストリームであって、
    前記コードが少なくとも前のセグメントの位相値の関数としての推定された位相値と、一般的に単調に変化する値を有する測定された位相値とを表し、
    前記正弦波コードがそのセグメントの推定された位相値と測定された位相値の関数として量子化され、
    前記正弦波コードがそのセグメントの予測された位相値と測定された位相値に応じて量子化され、
    前記正弦波コードが第1の時間セグメントの第1の周波数値と第2の時間セグメントの第2の周波数値に応じて量子化され、
    前記第1と第2の時間セグメントが一連の所定数の時間セグメントから選択されることを特徴とするオーディオストリーム。
  23. 記憶媒体であって、請求項20に記載のオーディオストリームが格納されたことを特徴とする記憶媒体。
JP2006525245A 2003-09-05 2004-08-25 低ビットレートオーディオ符号化 Pending JP2007504503A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03103308 2003-09-05
PCT/IB2004/051564 WO2005024783A1 (en) 2003-09-05 2004-08-25 Low bit-rate audio encoding

Publications (1)

Publication Number Publication Date
JP2007504503A true JP2007504503A (ja) 2007-03-01

Family

ID=34259257

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006525245A Pending JP2007504503A (ja) 2003-09-05 2004-08-25 低ビットレートオーディオ符号化

Country Status (6)

Country Link
US (1) US7596490B2 (ja)
EP (1) EP1665232A1 (ja)
JP (1) JP2007504503A (ja)
KR (1) KR20060083202A (ja)
CN (1) CN1846253B (ja)
WO (1) WO2005024783A1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL376861A1 (pl) * 2002-11-29 2006-01-09 Koninklijke Philips Electronics N.V. Kodowanie sygnału audio
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
DE102006049154B4 (de) * 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
KR20080073925A (ko) * 2007-02-07 2008-08-12 삼성전자주식회사 파라메트릭 부호화된 오디오 신호를 복호화하는 방법 및장치
KR101080421B1 (ko) * 2007-03-16 2011-11-04 삼성전자주식회사 정현파 오디오 코딩 방법 및 장치
KR101418248B1 (ko) * 2007-04-12 2014-07-24 삼성전자주식회사 정현파 성분의 진폭 코딩 및 디코딩 방법과 그 장치
KR101317269B1 (ko) 2007-06-07 2013-10-14 삼성전자주식회사 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치
KR20090008611A (ko) * 2007-07-18 2009-01-22 삼성전자주식회사 오디오 신호의 인코딩 방법 및 장치
KR101410229B1 (ko) * 2007-08-20 2014-06-23 삼성전자주식회사 오디오 신호의 연속 정현파 신호 정보를 인코딩하는 방법및 장치와 디코딩 방법 및 장치
KR101380170B1 (ko) * 2007-08-31 2014-04-02 삼성전자주식회사 미디어 신호 인코딩/디코딩 방법 및 장치
KR101425355B1 (ko) * 2007-09-05 2014-08-06 삼성전자주식회사 파라메트릭 오디오 부호화 및 복호화 장치와 그 방법
CN102460574A (zh) * 2009-05-19 2012-05-16 韩国电子通信研究院 用于使用层级正弦脉冲编码对音频信号进行编码和解码的方法和设备
US20110153337A1 (en) * 2009-12-17 2011-06-23 Electronics And Telecommunications Research Institute Encoding apparatus and method and decoding apparatus and method of audio/voice signal processing apparatus
WO2011080185A1 (en) 2009-12-28 2011-07-07 Gambro Lundia Ab Apparatus and method for prediction of rapid symptomatic blood pressure decrease
US8620660B2 (en) * 2010-10-29 2013-12-31 The United States Of America, As Represented By The Secretary Of The Navy Very low bit rate signal coder and decoder
US9087260B1 (en) * 2012-01-03 2015-07-21 Google Inc. Hierarchical randomized quantization of multi-dimensional features
KR20140072995A (ko) * 2012-12-05 2014-06-16 한국전자통신연구원 Ofdm 신호의 송수신 장치 및 방법
EP2963648A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using vertical phase correction
US10249319B1 (en) 2017-10-26 2019-04-02 The Nielsen Company (Us), Llc Methods and apparatus to reduce noise from harmonic noise sources

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001228898A (ja) * 1987-04-02 2001-08-24 Massachusetts Inst Of Technol <Mit> 音響波形のコード化方式

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US5680336A (en) * 1994-04-19 1997-10-21 Northrop Grumman Corporation Continuous wave synthesis from a finite periodic waveform
WO1999010719A1 (en) * 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
JP2003502703A (ja) * 1999-06-18 2003-01-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 改善された符号器を有するオーディオ伝送システム
CN1154975C (zh) 2000-03-15 2004-06-23 皇家菲利浦电子有限公司 用于声频编码的拉盖尔函数
CN1193347C (zh) * 2000-06-20 2005-03-16 皇家菲利浦电子有限公司 正弦编码
CN1307612C (zh) * 2002-04-22 2007-03-28 皇家飞利浦电子股份有限公司 声频信号的编码解码方法、编码器、解码器及相关设备
EP1554716A1 (en) * 2002-10-14 2005-07-20 Koninklijke Philips Electronics N.V. Signal filtering
PL376861A1 (pl) * 2002-11-29 2006-01-09 Koninklijke Philips Electronics N.V. Kodowanie sygnału audio

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001228898A (ja) * 1987-04-02 2001-08-24 Massachusetts Inst Of Technol <Mit> 音響波形のコード化方式

Also Published As

Publication number Publication date
CN1846253B (zh) 2010-06-16
CN1846253A (zh) 2006-10-11
EP1665232A1 (en) 2006-06-07
US20070027678A1 (en) 2007-02-01
WO2005024783A8 (en) 2005-05-26
KR20060083202A (ko) 2006-07-20
US7596490B2 (en) 2009-09-29
WO2005024783A1 (en) 2005-03-17

Similar Documents

Publication Publication Date Title
US10096323B2 (en) Frame error concealment method and apparatus and decoding method and apparatus using the same
US6263312B1 (en) Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
JP5343098B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
JP4426483B2 (ja) オーディオ信号の符号化効率を向上させる方法
KR101278805B1 (ko) 엔트로피 코딩 방법 및 엔트로피 디코딩 방법
KR100986153B1 (ko) 합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템
JP2007504503A (ja) 低ビットレートオーディオ符号化
US20070078646A1 (en) Method and apparatus to encode/decode audio signal
JP2003529787A (ja) 可変時間/周波数分解能および時間/周波数切り替えを使用する効率的なスペクトルエンベロープ符号化
JPH09204197A (ja) 周波数領域内のlpc予測による時間領域内での知覚ノイズ整形
KR101058064B1 (ko) 저비트율 오디오 인코딩
KR20060135699A (ko) 신호 복호화 장치 및 신호 복호화 방법
JPH0844392A (ja) 音響信号符号化復号方法
US7363216B2 (en) Method and system for parametric characterization of transient audio signals
JP3472279B2 (ja) 音声符号化パラメータ符号化方法及び装置
JP3437421B2 (ja) 楽音符号化装置及び楽音符号化方法並びに楽音符号化プログラムを記録した記録媒体
JP3453116B2 (ja) 音声符号化方法及び装置
JP3827720B2 (ja) 差分コーディング原理を用いる送信システム
WO1998035447A2 (en) Audio coding method and apparatus
JPH11194799A (ja) 楽音符号化装置および楽音復号化装置および楽音符号化復号化装置およびプログラム記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101102

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110405

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110623

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111005

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111213