JP2004518164A - オーディオ信号又はスピーチ信号を符号化するパラメトリック・エンコーダ及び方法 - Google Patents
オーディオ信号又はスピーチ信号を符号化するパラメトリック・エンコーダ及び方法 Download PDFInfo
- Publication number
- JP2004518164A JP2004518164A JP2002556881A JP2002556881A JP2004518164A JP 2004518164 A JP2004518164 A JP 2004518164A JP 2002556881 A JP2002556881 A JP 2002556881A JP 2002556881 A JP2002556881 A JP 2002556881A JP 2004518164 A JP2004518164 A JP 2004518164A
- Authority
- JP
- Japan
- Prior art keywords
- filters
- frequency
- sine wave
- parametric encoder
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 13
- 230000011218 segmentation Effects 0.000 claims abstract description 14
- 238000012805 post-processing Methods 0.000 claims abstract description 8
- 238000005070 sampling Methods 0.000 claims description 19
- 238000012546 transfer Methods 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 4
- 238000005192 partition Methods 0.000 abstract description 2
- 239000011159 matrix material Substances 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本発明は、オーディオ又はスピーチ信号sを正弦波符号データに符号化するパラメトリック・エンコーダに関する。このようなパラメトリック・エンコーダは、mが1からMまでの整数を表すとき、典型的に、信号sを少なくとも一つの単一スケールセグメントxm(n)に区分し、上記セグメントxm(n)のサンプルxm(0),...,xm(L−1)を出力するセグメンテーション・ユニット120と、上記サンプルから上記セグメントxm(n)を表現する正弦波符号データを推定する正弦波推定ユニット140と、を含む。本発明の目的は、要求された時間・周波数分解能の兼ね合いの実現を容易にするパラメトリック・エンコーダ及び方法を改良することである。この目的は、出力されたサンプルxm(0),...,xm(L−1)を周波数ラップドメインに変換するため、周波数ラッピング演算を実行するようにセグメンテーション・ユニット120を具現化し、正弦波推定ユニット140によって出力された正弦波符号データを元の信号sの周波数ドメインへ再マッピングする後処理フィルタ160を設けることにより達成される。
Description
【0001】
本発明は、オーディオ又はスピーチ信号(音声信号)を正弦波符号データに符号化するパラメトリック・エンコーダ及び方法に関する。
【0002】
このようなエンコーダ及び方法は、一般的に、技術的に公知であり、例えば、文献:B. Elder, H. Purnhagen, and C. Ferekidis, ”ASAC − Analysis/synthesis codec for very low bit rates”, Preprint 4179(F−6) 100th AES Convention, Copenhagen, 11−14 May, 1996に記載されている。このような公知のパラメトリック・エンコーダは、図4及び5に示されている。
【0003】
図5に示されたエンコーダは、受信オーディオ又はスピーチ信号を、サンプルxm(0),...,xm(L−1)を有する少なくとも一つの単一スケールセグメントxm(l)に区分するセグメンテーション・ユニット120’を含む。これらのサンプルは、上記セグメントxm(n)を表現する正弦波符号データを推定する正弦波推定ユニット140’によって受信される。これらの正弦波符号データは、典型的に、チャネルを介して伝送されるか、若しくは、記録媒体に記憶される前に、データストリームに組み込まれる。
【0004】
図4は、公知のセグメンテーション・ユニット120’のより詳細な構成図である。同図から分かるように、オーディオ又はスピーチ信号s(n)は、連続したフィルタ122_1’、122_2’、...,122_L−1’を含むタップ付き遅延線へ入力される。元のオーディオ又はスピーチ信号s(n)=y0(nD)、並びに、上記のL−1個のフィルタ122_1’、122_2’、...,122_L−1’の出力信号y1(nD),...,yL−1(nD)は、セグメントxm(l)のL個のサンプルxm(0)、...,xm(L−1)を生成するため、好ましくは、ダウンサンプリング・ユニットとして具現化されたサンプリング・ユニット124’へ入力される。
【0005】
図4及び5による従来のパラメトリック・エンコーダによって生成される単一スケールセグメントは、そのセグメント長、及び、それ故に周波数分解能が、区分されたオーディオ又はスピーチ信号の実際の周波数レンジとは無関係に一定であることを特徴とする。換言すると、一般的なエンコーダに設けられているような単一スケール正弦波推定機構は、要求された時間・周波数分解能の兼ね合いに関して問題がある。特に、高品質オーディオ符号化用の信号sの低周波数レンジに対して高い周波数分解能が要求され、他方、それ以外の周波数レンジでは、より低い周波数分解能が要求され、より短いセグメント長Lでも足りるであろう。
【0006】
これらの問題を解決するため、例えば、文献:T. S. Verma, S. N. Levine and J. O. Smith III, ”Multiresolution sinusoidal modeling for wideband audio with modifications”, Proc. ICASSP−98, Seattle, 1998に記載されているように、多重スケールモデルが提案されている。多重スケールモデルは、信号sの異なる周波数レンジに対し種々のセグメント長Lを設定する。しかし、これらの多重スケールモジュールは、成分をスケール全域に分散させるという問題、及び/又は、異なるスケールで取り出されたデータを併合するという問題を生じる。より詳細には、この分散の問題は、生成されたセグメントが通常は重なり合い、したがって、セグメントのサンプルは2回処理されるかもしれない、という問題を扱うことである。なぜならば、格別の努力を注がない限り、生成された2個のセグメントを明確に分離することは可能ではないからである。
【0007】
従来技術に鑑みるに、本発明の目的は、上記の多重スケールモデルの問題
即ち、成分をスケール全域に分散させる問題、及び/又は、異なるスケールで獲得されたデータを併合する問題を伴うことなく、要求された時間・周波数分解能の兼ね合いが確立されるように、オーディオ又はスピーチ信号を符号化する従来のパラメトリック・エンコーダ及び方法を改良することである。
【0008】
この目的は、請求項1に記載された内容によって解決される。より詳細には、従来のパラメトリック・エンコーダに対して、請求項1に係る発明によれば、セグメンテーション・ユニットは、出力サンプルを周波数ラップドメインへ変換するため周波数ラッピング演算を実行し、正弦波推定ユニットから出力された上記正弦波符号データを信号sの元の周波数ドメインへ再マッピングする後処理フィルタが設けられる。
【0009】
請求項に記載されたパラメトリック・エンコーダのセグメンテーション・ユニットは、信号sを少なくとも一つの単一スケールセグメントxm(l)に区分する。このセグメンテーション・ユニットは、単一スケールセグメントだけを生成するので、技術的に知られている多重スケールモデルの問題は生じない。その代わり、周波数ラッピング演算を適用することによって、即ち、信号sの異なる周波数レンジに対し様々の周波数分解能を与えることによって、要求された時間・周波数分解能の兼ね合いは、全く問題を生じることなく、単一スケールセグメントに関して有利に確立される。
【0010】
尚、片側周波数ラッピングは、例えば、オーディオの線形予測符号化、オーディオイコライザ、及び、ノーマルフィルタ設計に関して、従来技術において広く知られているが、本願において提案されているような正弦波符号化に関しては知られていない。両側周波数ラッピングは、オーディオ処理には未だ適用されていない。
【0011】
パラメトリック・エンコーダの有利な実施例は従属請求項に記載されている。
【0012】
本発明の目的は、請求項9に記載されたオーディオ又はスピーチ信号を符号化する方法によっても解決される。この方法の利点は上記のパラメトリック・エンコーダの利点と一致する。
【0013】
次に、図1乃至3を参照して、本発明によるパラメトリック・エンコーダの好ましい実施例を説明する。
【0014】
図1には、オーディオ又はスピーチ(音声)信号s(n)を正弦波符号データscdへ符号化する本発明によるパラメトリック・エンコーダの好ましい第1の実施例が示されている。パラメトリック・エンコーダは、現在のダウンサンプリング・ステップを表すmが1からMまでの整数(m=1...M)であるとき、信号sを少なくとも一つの単一スケールセグメントxm(n)に区分するセグメンテーション・ユニット120を含む。より詳細には、セグメンテーション・ユニット120は、直列に接続された複数のL−1個のフィルタ122_1、...,122_L−1を含み、これらのフィルタの中の最初のフィルタの入力で信号s(n)を受信する。このセグメンテーション・ユニット120は、lが1からL−1までの整数(l=0...(L−1))を表すとき、単一スケールセグメントxm(l)のL個のサンプルxm(0)、...、xm(L−1)を生成するため、信号s(n)=y0(n)と、上記L−1個のフィルタ122_1、...、122_L−1の出力信号y1(n)...yL−1(n)とを受信し、好ましくは、ダウンサンプリングするサンプリング・ユニット124を更に含む。この好ましい第1の実施例において、L−1個のフィルタ122_1、...、122_L−1のすべては、伝達関数A(z)、即ち、
【0015】
【数6】
を有する全域通過フィルタとして具現化される。式中、*は、複素共役を表し、λは|λ|<1である。典型的に、λは実数値であり、かつ、λ≠0である。
【0016】
第1の実施例では、次のように処理が行われる。オーディオ信号sは、出力yl(n)(n=0,1,...,L−1)を有するタップ付きの全域通過ラインへ入力される。ここで、
y0(n)=s(n) (2)
かつ、
l=1,2,...,L−1に対して、yl=yl−1*α (3)
であり、*はコンボリューション演算を表し、αは伝達関数A(z)と関連したインパルス応答である。出力ylはダウンサンプリングされ(D回の時点毎に1回ずつ読み出され)、セグメントxmとして、
xm(l)=yl(mD) (4)
のように定義される。式中、Dは、サンプリング・ユニット140のダウンサンプリング倍率である。サンプリング・ユニット124によって出力された信号は、lが1からL−1までの整数(l=0,1,...,L−1)である場合に、セグメントxmのサンプルxm(l)を表現していると考えられる。
【0017】
フィルタ122_1、...、122_L−1は、第1の実施例によれば、全域通過フィルタとして具現化されるので、サンプリング・ユニット124によって出力されたサンプルは、周波数ラップドメインに存在することに注意する必要がある。
【0018】
l=0,...,L−1としたときのサンプルxm(l)は、セグメントxmを表現する正弦波符号データを推定する正弦波推定ユニット140へ入力される。この推定は、周波数ラップされたサンプルにフーリエ変換を実施し、次に、例えば、ピーク・ピッキングを実施することによって行われる。
【0019】
更に、正弦波推定ユニット140によって出力されるような正弦波符号データは周波数ラップドメインに存在することに注意する必要がある。したがって、正弦波符号データは、元のオーディオ又はスピーチ信号sの周波数ドメインへ再マッピング(再割当)、即ち、逆ラッピングしなければならない。これは、正弦波推定ユニット140の後に続く後処理フィルタ160によって実行される。後処理フィルタ160の出力は、元の信号セグメントxmと関連した再マッピングされた正弦波符号データに対応する。
【0020】
後処理フィルタ160によって完了されるように、正弦波を抽出した後、後の処理ステップは、残りのモデリングである。残りのモデリングを最も経済的に行うため、パワー・スペクトル密度関数のパラメトリック・モデルを使用する。このようなアプローチにより、正弦波推定及び雑音推定を統合することが可能になる。なぜならば、雑音モデリングに対し周波数ラッピングを使用できるからである。
【0021】
第1の実施例では、サンプリング・ユニット120によってラップされた周波数ラップ化サンプルは、単一スケールセグメントxmに属するので、このような状況では、技術的に知られた多重スケールモデルの問題は生じない。フィルタを全域通過フィルタとして具現化することにより、周波数ラッピング演算が実行されると、サンプリング・ユニット124の出力で周波数ラップ化サンプルが得られる。周波数ラッピング演算によって、要求された時間・周波数分解能の兼ね合いが信号sに対して達成される。しかし、元のオーディオ又はスピーチ信号のパワー・スペクトル密度関数が僅かに修正されている点で不利である。
【0022】
図2は、実質的に第1の実施例に対応しているパラメトリック・エンコーダの第2の実施例の構成図である。特に、第2の実施例におけるサンプリング・ユニット124、正弦波推定ユニット140及び後処理フィルタ160は、第1の実施例における対応したユニットと同じである。更に、フィルタ122_3、...、122_L−1は、第1の実施例における対応したフィルタと同じである。なぜならば、これらのフィルタも、式(1)で表された伝達関数A(z)を有する1次の全域通過フィルタとして具現化されるからである。
【0023】
しかし、第2の実施例は、セグメンテーション・ユニット120内の直列接続されたフィルタのうちの1番目のフィルタ122_1が、
【0024】
【数7】
で表される伝達関数A0(z)を有する点で第1の実施例と相違する。
【0025】
また、2番目のフィルタ122_2は、全域通過フィルタとして具現化されるのではなく、
【0026】
【数8】
で表される伝達関数A1(z)を有する。尚、式(5)及び(6)において、λは、典型的に実数値である。
【0027】
λ>0の場合に、伝達関数A0(z)及びA1(z)は、共に、低域通過フィルタを表現し、λ<0の場合には、両方の伝達関数は高域通過フィルタを表現する。
【0028】
第2の実施例の利点は第1の実施例の利点に対応する。更に、元のオーディオ又はスピーチ信号sのパワー・スペクトル密度関数は、より良好に維持される。
【0029】
第1の実施例及び第2の実施例の問題は、導入された周波数ラッピング演算が片側デバイスとして機能することである。過去はラップされ(包み隠され)、各周波数の時間スケールが有効に相違する結果として、推定された周波数は、nサンプル前の瞬時周波数に対する優れた推定結果である。ここで、瞬時周波数の遅延を表現するnは、瞬時周波数自体に依存する。換言すると、このような遅延の存在は許容されるが、遅延がその周波数に依存することは回避されるべきである。なぜならば、この周波数依存性は符号化の目的には不利になるからである。符号化の目的としては、時間的に明確な時点での瞬時周波数が望ましい。
【0030】
そのため、周波数ラッピング処理を、過去と未来の両方をラッピングする両側演算に拡張することが提案される。未来のラッピングは、第1の実施例及び第2の実施例が考慮した機構を用いても実施できない。なぜならば、第1の実施例及び第2の実施例は、無限インパルス応答IIRフィルタに基づいているからである。
【0031】
しかし、有限セグメントの周波数ラッピングを考慮し、理想的な無限長のラップされた信号の有限部分を観察することによって、IIRフィルタを使用する処理は、マトリックス・ベクトル乗算に簡単化される。この場合、パラメトリック・エンコーダは、図3に示されるように具現化される。第3の実施例によれば、受信したオーディオ又はスピーチ信号は、タップ付き遅延ラインに入力され、次に、このオーディオ又はスピーチ信号sと、タップ付き遅延ラインのL−1個のフィルタ122_1、...、122_L−1の出力信号y1(n)、...、yL−1(n)は、サンプリング・ユニット124へ入力される。サンプリング・ユニット124は、N1>0かつN2>0であるとき、−N1、−N1+1、...、0、...、N2−1、N2のようにインデックスを付けられたN1+1+N2個のサンプルを有するセグメントxmを生成する。第3の実施例においてここまでに実行されたサンプリング演算は、図4に関して説明したような従来技術において公知のサンプリング演算であり、サンプリング・ユニットの出力x0 m(−N1)、...、x0 m(0)、...、x0 m(N2)における共通のサンプリング演算から得られるサンプルは、未だ周波数ラップドメインに存在しないことに注意することが重要である。
【0032】
サンプルを周波数ラップドメインへ変換するため、付加的に設けられた、好ましくは、サンプリング・ユニット120内に設けられた両側ラッピング・ユニット126を用いて両側ラッピング演算が実行される。両側ラッピング・ユニットは、前の段落で説明したマトリックス・ベクトル乗算を実行する。この乗算は、マトリックス記法で、
xm=Bx0 m (7)
のように記述される。
【0033】
変換マトリックスBは、異なる周波数ラッピング演算に対して計算され、特に、変換マトリックスBは、本発明の第1の実施例又は第2の実施例による周波数ラッピング演算が第3の実施例によってシミュレートされるか、若しくは、実現されるように計算することが可能である。両側ラッピング・ユニット126によって出力されたサンプルは、入力サンプルとは違って、第1の実施例又は第2の実施例にしたがってサンプリング・ユニット120によって出力されたサンプルと同じように、望ましい周波数ラップドメイン上に存在する。図3から分かるように、変換されたサンプルは正弦波推定ユニット140へ出力され、正弦波推定ユニット140において、望ましい正弦波符号データが推定され、最終的に周波数ラップドメイン上の正弦波符号データは、正弦波推定ユニット140によって出力され、後処理フィルタ160へ入力され、元の信号sの周波数ドメインへ再マッピングされる。次に、変換マトリックスBの計算の一例が与えられ、第2の実施例が第3の実施例によってシミュレーションされる。
【0034】
このシミュレーションを実現するため、有限サポートをもつセグメントx0(n)の周波数ラッピングを考える。より詳細には、このセグメントのサンプルは、N1>0かつN2>0の場合に、−N1、−N1+1、...、0、...、N2でインデックス付けされる。関連したラップ(された)信号は、
【0035】
【外1】
によって表され、原理的に、無限サポートをもつ。
【0036】
サンプルx(n)と関連したラップ信号のフーリエ変換は、
【0037】
【数9】
によって与えられる。但し、
【0038】
【数10】
である。
【0039】
全域通過セクションの位相特性に従う周波数ラッピングの場合、これらの周波数変数の間には、
【0040】
【数11】
又は、
【0041】
【数12】
のような関係が与えられる。ここから、
【0042】
【数13】
が得られる。但し、補間関数qの定義は、
【0043】
【数14】
であり、Fn −1は、n−ドメインへのフーリエ逆変換を表す。より詳細には、
q(λ;n,0)=δ(n);
q(λ;−,k)=k次全域通過のインパルス応答、但し、k>0
q(λ;n,k)=q(λ;−n,−k)
q(λ;n,k)=0、n・k<0又は(k=0かつn≠0)の場合
である。
【0044】
マトリックス記法(この特殊なケースの表記からλを除去する)では、式(7)は、
【0045】
【数15】
のように表される。即ち、カスケードされた全域通過フィルタは列方向に現れる。実際上、切り捨てられた(ウィンドウ化された)ラップ信号
【0046】
【外2】
は、更なる処理のため使用される。
【0047】
【外3】
の一部は、−M1からM2まで変化し、
【0048】
【数16】
かつ、
【0049】
【数17】
であると仮定する。これにより、マトリックスの略半分は、零と一致する。正のλに対して、切り捨てられた
【0050】
【外4】
のサポートは、xのサポートよりも実質的に短い。
【0051】
マトリックスの行は、第2の実施例で説明したフィルタの(切り捨てられた)インパルス応答に対応する。
【0052】
上記の実施例は、本発明を限定するのではなく、本発明を例示するものであり、当業者は、請求項に係る発明の範囲を逸脱することなく、代替的な実施例を設計することが可能であろう。請求項の記載中、括弧付きの参照符号は、請求項に係る発明を限定するものとして解釈されるべきではない。「含む」、「有する」のような語は、請求項に列挙されていない他の要素或いは手順を除外するものではない。本発明は、幾つかの別々の要素を含むハードウェア、並びに、適切にプログラミングされたコンピュータを用いて実施することが可能である。幾つかの手段を列挙する装置クレームにおいて、それらの手段のうちの幾つかは全く同一のハードウェアによって具現化し得る。ある種の手段が相互に異なる従属請求項に記載されているという単なる事実は、これらの手段を組み合わせて使用しても有利ではない、ということを示すものではない。
【図面の簡単な説明】
【図1】
本発明によるパラメトリック・エンコーダの好ましい第1の実施例の構成図である。
【図2】
本発明によるパラメトリック・エンコーダの好ましい第2の実施例の構成図である。
【図3】
本発明によるパラメトリック・エンコーダの好ましい第3の実施例の構成図である。
【図4】
従来技術によるパラメトリック・エンコーダの詳細な構成図である。
【図5】
従来技術によるパラメトリック・エンコーダの略構成図である。
本発明は、オーディオ又はスピーチ信号(音声信号)を正弦波符号データに符号化するパラメトリック・エンコーダ及び方法に関する。
【0002】
このようなエンコーダ及び方法は、一般的に、技術的に公知であり、例えば、文献:B. Elder, H. Purnhagen, and C. Ferekidis, ”ASAC − Analysis/synthesis codec for very low bit rates”, Preprint 4179(F−6) 100th AES Convention, Copenhagen, 11−14 May, 1996に記載されている。このような公知のパラメトリック・エンコーダは、図4及び5に示されている。
【0003】
図5に示されたエンコーダは、受信オーディオ又はスピーチ信号を、サンプルxm(0),...,xm(L−1)を有する少なくとも一つの単一スケールセグメントxm(l)に区分するセグメンテーション・ユニット120’を含む。これらのサンプルは、上記セグメントxm(n)を表現する正弦波符号データを推定する正弦波推定ユニット140’によって受信される。これらの正弦波符号データは、典型的に、チャネルを介して伝送されるか、若しくは、記録媒体に記憶される前に、データストリームに組み込まれる。
【0004】
図4は、公知のセグメンテーション・ユニット120’のより詳細な構成図である。同図から分かるように、オーディオ又はスピーチ信号s(n)は、連続したフィルタ122_1’、122_2’、...,122_L−1’を含むタップ付き遅延線へ入力される。元のオーディオ又はスピーチ信号s(n)=y0(nD)、並びに、上記のL−1個のフィルタ122_1’、122_2’、...,122_L−1’の出力信号y1(nD),...,yL−1(nD)は、セグメントxm(l)のL個のサンプルxm(0)、...,xm(L−1)を生成するため、好ましくは、ダウンサンプリング・ユニットとして具現化されたサンプリング・ユニット124’へ入力される。
【0005】
図4及び5による従来のパラメトリック・エンコーダによって生成される単一スケールセグメントは、そのセグメント長、及び、それ故に周波数分解能が、区分されたオーディオ又はスピーチ信号の実際の周波数レンジとは無関係に一定であることを特徴とする。換言すると、一般的なエンコーダに設けられているような単一スケール正弦波推定機構は、要求された時間・周波数分解能の兼ね合いに関して問題がある。特に、高品質オーディオ符号化用の信号sの低周波数レンジに対して高い周波数分解能が要求され、他方、それ以外の周波数レンジでは、より低い周波数分解能が要求され、より短いセグメント長Lでも足りるであろう。
【0006】
これらの問題を解決するため、例えば、文献:T. S. Verma, S. N. Levine and J. O. Smith III, ”Multiresolution sinusoidal modeling for wideband audio with modifications”, Proc. ICASSP−98, Seattle, 1998に記載されているように、多重スケールモデルが提案されている。多重スケールモデルは、信号sの異なる周波数レンジに対し種々のセグメント長Lを設定する。しかし、これらの多重スケールモジュールは、成分をスケール全域に分散させるという問題、及び/又は、異なるスケールで取り出されたデータを併合するという問題を生じる。より詳細には、この分散の問題は、生成されたセグメントが通常は重なり合い、したがって、セグメントのサンプルは2回処理されるかもしれない、という問題を扱うことである。なぜならば、格別の努力を注がない限り、生成された2個のセグメントを明確に分離することは可能ではないからである。
【0007】
従来技術に鑑みるに、本発明の目的は、上記の多重スケールモデルの問題
即ち、成分をスケール全域に分散させる問題、及び/又は、異なるスケールで獲得されたデータを併合する問題を伴うことなく、要求された時間・周波数分解能の兼ね合いが確立されるように、オーディオ又はスピーチ信号を符号化する従来のパラメトリック・エンコーダ及び方法を改良することである。
【0008】
この目的は、請求項1に記載された内容によって解決される。より詳細には、従来のパラメトリック・エンコーダに対して、請求項1に係る発明によれば、セグメンテーション・ユニットは、出力サンプルを周波数ラップドメインへ変換するため周波数ラッピング演算を実行し、正弦波推定ユニットから出力された上記正弦波符号データを信号sの元の周波数ドメインへ再マッピングする後処理フィルタが設けられる。
【0009】
請求項に記載されたパラメトリック・エンコーダのセグメンテーション・ユニットは、信号sを少なくとも一つの単一スケールセグメントxm(l)に区分する。このセグメンテーション・ユニットは、単一スケールセグメントだけを生成するので、技術的に知られている多重スケールモデルの問題は生じない。その代わり、周波数ラッピング演算を適用することによって、即ち、信号sの異なる周波数レンジに対し様々の周波数分解能を与えることによって、要求された時間・周波数分解能の兼ね合いは、全く問題を生じることなく、単一スケールセグメントに関して有利に確立される。
【0010】
尚、片側周波数ラッピングは、例えば、オーディオの線形予測符号化、オーディオイコライザ、及び、ノーマルフィルタ設計に関して、従来技術において広く知られているが、本願において提案されているような正弦波符号化に関しては知られていない。両側周波数ラッピングは、オーディオ処理には未だ適用されていない。
【0011】
パラメトリック・エンコーダの有利な実施例は従属請求項に記載されている。
【0012】
本発明の目的は、請求項9に記載されたオーディオ又はスピーチ信号を符号化する方法によっても解決される。この方法の利点は上記のパラメトリック・エンコーダの利点と一致する。
【0013】
次に、図1乃至3を参照して、本発明によるパラメトリック・エンコーダの好ましい実施例を説明する。
【0014】
図1には、オーディオ又はスピーチ(音声)信号s(n)を正弦波符号データscdへ符号化する本発明によるパラメトリック・エンコーダの好ましい第1の実施例が示されている。パラメトリック・エンコーダは、現在のダウンサンプリング・ステップを表すmが1からMまでの整数(m=1...M)であるとき、信号sを少なくとも一つの単一スケールセグメントxm(n)に区分するセグメンテーション・ユニット120を含む。より詳細には、セグメンテーション・ユニット120は、直列に接続された複数のL−1個のフィルタ122_1、...,122_L−1を含み、これらのフィルタの中の最初のフィルタの入力で信号s(n)を受信する。このセグメンテーション・ユニット120は、lが1からL−1までの整数(l=0...(L−1))を表すとき、単一スケールセグメントxm(l)のL個のサンプルxm(0)、...、xm(L−1)を生成するため、信号s(n)=y0(n)と、上記L−1個のフィルタ122_1、...、122_L−1の出力信号y1(n)...yL−1(n)とを受信し、好ましくは、ダウンサンプリングするサンプリング・ユニット124を更に含む。この好ましい第1の実施例において、L−1個のフィルタ122_1、...、122_L−1のすべては、伝達関数A(z)、即ち、
【0015】
【数6】
を有する全域通過フィルタとして具現化される。式中、*は、複素共役を表し、λは|λ|<1である。典型的に、λは実数値であり、かつ、λ≠0である。
【0016】
第1の実施例では、次のように処理が行われる。オーディオ信号sは、出力yl(n)(n=0,1,...,L−1)を有するタップ付きの全域通過ラインへ入力される。ここで、
y0(n)=s(n) (2)
かつ、
l=1,2,...,L−1に対して、yl=yl−1*α (3)
であり、*はコンボリューション演算を表し、αは伝達関数A(z)と関連したインパルス応答である。出力ylはダウンサンプリングされ(D回の時点毎に1回ずつ読み出され)、セグメントxmとして、
xm(l)=yl(mD) (4)
のように定義される。式中、Dは、サンプリング・ユニット140のダウンサンプリング倍率である。サンプリング・ユニット124によって出力された信号は、lが1からL−1までの整数(l=0,1,...,L−1)である場合に、セグメントxmのサンプルxm(l)を表現していると考えられる。
【0017】
フィルタ122_1、...、122_L−1は、第1の実施例によれば、全域通過フィルタとして具現化されるので、サンプリング・ユニット124によって出力されたサンプルは、周波数ラップドメインに存在することに注意する必要がある。
【0018】
l=0,...,L−1としたときのサンプルxm(l)は、セグメントxmを表現する正弦波符号データを推定する正弦波推定ユニット140へ入力される。この推定は、周波数ラップされたサンプルにフーリエ変換を実施し、次に、例えば、ピーク・ピッキングを実施することによって行われる。
【0019】
更に、正弦波推定ユニット140によって出力されるような正弦波符号データは周波数ラップドメインに存在することに注意する必要がある。したがって、正弦波符号データは、元のオーディオ又はスピーチ信号sの周波数ドメインへ再マッピング(再割当)、即ち、逆ラッピングしなければならない。これは、正弦波推定ユニット140の後に続く後処理フィルタ160によって実行される。後処理フィルタ160の出力は、元の信号セグメントxmと関連した再マッピングされた正弦波符号データに対応する。
【0020】
後処理フィルタ160によって完了されるように、正弦波を抽出した後、後の処理ステップは、残りのモデリングである。残りのモデリングを最も経済的に行うため、パワー・スペクトル密度関数のパラメトリック・モデルを使用する。このようなアプローチにより、正弦波推定及び雑音推定を統合することが可能になる。なぜならば、雑音モデリングに対し周波数ラッピングを使用できるからである。
【0021】
第1の実施例では、サンプリング・ユニット120によってラップされた周波数ラップ化サンプルは、単一スケールセグメントxmに属するので、このような状況では、技術的に知られた多重スケールモデルの問題は生じない。フィルタを全域通過フィルタとして具現化することにより、周波数ラッピング演算が実行されると、サンプリング・ユニット124の出力で周波数ラップ化サンプルが得られる。周波数ラッピング演算によって、要求された時間・周波数分解能の兼ね合いが信号sに対して達成される。しかし、元のオーディオ又はスピーチ信号のパワー・スペクトル密度関数が僅かに修正されている点で不利である。
【0022】
図2は、実質的に第1の実施例に対応しているパラメトリック・エンコーダの第2の実施例の構成図である。特に、第2の実施例におけるサンプリング・ユニット124、正弦波推定ユニット140及び後処理フィルタ160は、第1の実施例における対応したユニットと同じである。更に、フィルタ122_3、...、122_L−1は、第1の実施例における対応したフィルタと同じである。なぜならば、これらのフィルタも、式(1)で表された伝達関数A(z)を有する1次の全域通過フィルタとして具現化されるからである。
【0023】
しかし、第2の実施例は、セグメンテーション・ユニット120内の直列接続されたフィルタのうちの1番目のフィルタ122_1が、
【0024】
【数7】
で表される伝達関数A0(z)を有する点で第1の実施例と相違する。
【0025】
また、2番目のフィルタ122_2は、全域通過フィルタとして具現化されるのではなく、
【0026】
【数8】
で表される伝達関数A1(z)を有する。尚、式(5)及び(6)において、λは、典型的に実数値である。
【0027】
λ>0の場合に、伝達関数A0(z)及びA1(z)は、共に、低域通過フィルタを表現し、λ<0の場合には、両方の伝達関数は高域通過フィルタを表現する。
【0028】
第2の実施例の利点は第1の実施例の利点に対応する。更に、元のオーディオ又はスピーチ信号sのパワー・スペクトル密度関数は、より良好に維持される。
【0029】
第1の実施例及び第2の実施例の問題は、導入された周波数ラッピング演算が片側デバイスとして機能することである。過去はラップされ(包み隠され)、各周波数の時間スケールが有効に相違する結果として、推定された周波数は、nサンプル前の瞬時周波数に対する優れた推定結果である。ここで、瞬時周波数の遅延を表現するnは、瞬時周波数自体に依存する。換言すると、このような遅延の存在は許容されるが、遅延がその周波数に依存することは回避されるべきである。なぜならば、この周波数依存性は符号化の目的には不利になるからである。符号化の目的としては、時間的に明確な時点での瞬時周波数が望ましい。
【0030】
そのため、周波数ラッピング処理を、過去と未来の両方をラッピングする両側演算に拡張することが提案される。未来のラッピングは、第1の実施例及び第2の実施例が考慮した機構を用いても実施できない。なぜならば、第1の実施例及び第2の実施例は、無限インパルス応答IIRフィルタに基づいているからである。
【0031】
しかし、有限セグメントの周波数ラッピングを考慮し、理想的な無限長のラップされた信号の有限部分を観察することによって、IIRフィルタを使用する処理は、マトリックス・ベクトル乗算に簡単化される。この場合、パラメトリック・エンコーダは、図3に示されるように具現化される。第3の実施例によれば、受信したオーディオ又はスピーチ信号は、タップ付き遅延ラインに入力され、次に、このオーディオ又はスピーチ信号sと、タップ付き遅延ラインのL−1個のフィルタ122_1、...、122_L−1の出力信号y1(n)、...、yL−1(n)は、サンプリング・ユニット124へ入力される。サンプリング・ユニット124は、N1>0かつN2>0であるとき、−N1、−N1+1、...、0、...、N2−1、N2のようにインデックスを付けられたN1+1+N2個のサンプルを有するセグメントxmを生成する。第3の実施例においてここまでに実行されたサンプリング演算は、図4に関して説明したような従来技術において公知のサンプリング演算であり、サンプリング・ユニットの出力x0 m(−N1)、...、x0 m(0)、...、x0 m(N2)における共通のサンプリング演算から得られるサンプルは、未だ周波数ラップドメインに存在しないことに注意することが重要である。
【0032】
サンプルを周波数ラップドメインへ変換するため、付加的に設けられた、好ましくは、サンプリング・ユニット120内に設けられた両側ラッピング・ユニット126を用いて両側ラッピング演算が実行される。両側ラッピング・ユニットは、前の段落で説明したマトリックス・ベクトル乗算を実行する。この乗算は、マトリックス記法で、
xm=Bx0 m (7)
のように記述される。
【0033】
変換マトリックスBは、異なる周波数ラッピング演算に対して計算され、特に、変換マトリックスBは、本発明の第1の実施例又は第2の実施例による周波数ラッピング演算が第3の実施例によってシミュレートされるか、若しくは、実現されるように計算することが可能である。両側ラッピング・ユニット126によって出力されたサンプルは、入力サンプルとは違って、第1の実施例又は第2の実施例にしたがってサンプリング・ユニット120によって出力されたサンプルと同じように、望ましい周波数ラップドメイン上に存在する。図3から分かるように、変換されたサンプルは正弦波推定ユニット140へ出力され、正弦波推定ユニット140において、望ましい正弦波符号データが推定され、最終的に周波数ラップドメイン上の正弦波符号データは、正弦波推定ユニット140によって出力され、後処理フィルタ160へ入力され、元の信号sの周波数ドメインへ再マッピングされる。次に、変換マトリックスBの計算の一例が与えられ、第2の実施例が第3の実施例によってシミュレーションされる。
【0034】
このシミュレーションを実現するため、有限サポートをもつセグメントx0(n)の周波数ラッピングを考える。より詳細には、このセグメントのサンプルは、N1>0かつN2>0の場合に、−N1、−N1+1、...、0、...、N2でインデックス付けされる。関連したラップ(された)信号は、
【0035】
【外1】
によって表され、原理的に、無限サポートをもつ。
【0036】
サンプルx(n)と関連したラップ信号のフーリエ変換は、
【0037】
【数9】
によって与えられる。但し、
【0038】
【数10】
である。
【0039】
全域通過セクションの位相特性に従う周波数ラッピングの場合、これらの周波数変数の間には、
【0040】
【数11】
又は、
【0041】
【数12】
のような関係が与えられる。ここから、
【0042】
【数13】
が得られる。但し、補間関数qの定義は、
【0043】
【数14】
であり、Fn −1は、n−ドメインへのフーリエ逆変換を表す。より詳細には、
q(λ;n,0)=δ(n);
q(λ;−,k)=k次全域通過のインパルス応答、但し、k>0
q(λ;n,k)=q(λ;−n,−k)
q(λ;n,k)=0、n・k<0又は(k=0かつn≠0)の場合
である。
【0044】
マトリックス記法(この特殊なケースの表記からλを除去する)では、式(7)は、
【0045】
【数15】
のように表される。即ち、カスケードされた全域通過フィルタは列方向に現れる。実際上、切り捨てられた(ウィンドウ化された)ラップ信号
【0046】
【外2】
は、更なる処理のため使用される。
【0047】
【外3】
の一部は、−M1からM2まで変化し、
【0048】
【数16】
かつ、
【0049】
【数17】
であると仮定する。これにより、マトリックスの略半分は、零と一致する。正のλに対して、切り捨てられた
【0050】
【外4】
のサポートは、xのサポートよりも実質的に短い。
【0051】
マトリックスの行は、第2の実施例で説明したフィルタの(切り捨てられた)インパルス応答に対応する。
【0052】
上記の実施例は、本発明を限定するのではなく、本発明を例示するものであり、当業者は、請求項に係る発明の範囲を逸脱することなく、代替的な実施例を設計することが可能であろう。請求項の記載中、括弧付きの参照符号は、請求項に係る発明を限定するものとして解釈されるべきではない。「含む」、「有する」のような語は、請求項に列挙されていない他の要素或いは手順を除外するものではない。本発明は、幾つかの別々の要素を含むハードウェア、並びに、適切にプログラミングされたコンピュータを用いて実施することが可能である。幾つかの手段を列挙する装置クレームにおいて、それらの手段のうちの幾つかは全く同一のハードウェアによって具現化し得る。ある種の手段が相互に異なる従属請求項に記載されているという単なる事実は、これらの手段を組み合わせて使用しても有利ではない、ということを示すものではない。
【図面の簡単な説明】
【図1】
本発明によるパラメトリック・エンコーダの好ましい第1の実施例の構成図である。
【図2】
本発明によるパラメトリック・エンコーダの好ましい第2の実施例の構成図である。
【図3】
本発明によるパラメトリック・エンコーダの好ましい第3の実施例の構成図である。
【図4】
従来技術によるパラメトリック・エンコーダの詳細な構成図である。
【図5】
従来技術によるパラメトリック・エンコーダの略構成図である。
Claims (9)
- mが1からMまでの整数を表すとき、オーディオ又はスピーチ信号sを少なくとも一つの単一スケールセグメントxm(n)に区分し、該セグメントxm(n)のサンプルxm(0),...,xm(L−1)を出力するセグメンテーション・ユニットと、
受信したサンプルxm(0),...,xm(L−1)から該セグメントxm(n)を表現する正弦波符号データを推定する正弦波推定ユニットと、
を有し、
オーディオ又はスピーチ信号sを正弦波符号データへ符号化するパラメトリック・エンコーダであって、
セグメンテーション・ユニットは、更に周波数ラッピング演算を実行するように具現化され、
正弦波推定ユニットから出力された該正弦波符号データを再マッピングする後処理フィルタが設けられている、
ことを特徴とするパラメトリック・エンコーダ。 - セグメンテーション・ユニットは、直列に接続された複数のL−1個のフィルタを含み、該フィルタの中の最初のフィルタの入力で信号s(n)を受信し、
セグメンテーション・ユニットは、セグメントxmのL個のサンプルxm(0),...,xm(L−1)又はx0 m(0),...,x0 m(L−1)を生成するため、該信号s(n)=y0(n)並びに該L−1個のフィルタの出力信号y1(n),...,yL−1(n)を受信し、サンプリングするサンプリング・ユニットを更に含む、
ことを特徴とする請求項1記載のパラメトリック・エンコーダ。 - L個のフィルタのうちの少なくとも一部は、全域通過フィルタとして具現化されていることを特徴とする請求項2記載のパラメトリック・エンコーダ。
- セグメンテーション・ユニット内では、直列に接続されている複数のL−1個のフィルタはタップ付きの遅延ラインによって具現化され、
各フィルタは、
A(z)=z−1
で表される伝達関数を有し、
両側周波数ラッピング演算をサンプリング・ユニットによって出力された元の信号sの周波数ドメイン上のサンプルx0 m(−N1),...,x0 m(N2)に適用することにより、サンプルx0 m(−N1),...,x0 m(N2)を周波数ラップドメイン上のサンプルxm(−M1),...,xm(M2)へ変換し、変換されたサンプルxm(−M1),...,xm(M2)を該正弦波推定ユニットへ出力する両側ラッピング・ユニットが更に設けられている、
ことを特徴とする請求項2記載のパラメトリック・エンコーダ。 - mが1からMまでの整数を表すとき、オーディオ又はスピーチ信号sを、サンプルxm(0),...,xm(L−1)を有する少なくとも一つの単一スケールセグメントxm(n)に区分する手順と、
受信したサンプル(0),...,xm(L−1)から該セグメントxm(n)を表現する正弦波符号データを推定する手順と、
を有し、
オーディオ又はスピーチ信号sを正弦波符号データへ符号化する方法であって、
サンプルxm(0),...,xm(L−1)が周波数ラップドメインに設けられるように周波数ラッピング演算が実行され、
周波数ラップドメイン上で推定された該正弦波符号データは、元の信号sの周波数ドメインへ再マッピングされる、
ことを特徴とする方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP01200143 | 2001-01-16 | ||
EP01202718 | 2001-07-17 | ||
PCT/IB2001/002682 WO2002056300A1 (en) | 2001-01-16 | 2001-12-19 | Parametric encoder and method for encoding an audio or speech signal |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004518164A true JP2004518164A (ja) | 2004-06-17 |
Family
ID=26076811
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002556881A Withdrawn JP2004518164A (ja) | 2001-01-16 | 2001-12-19 | オーディオ信号又はスピーチ信号を符号化するパラメトリック・エンコーダ及び方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20020152072A1 (ja) |
JP (1) | JP2004518164A (ja) |
KR (1) | KR20020084201A (ja) |
CN (1) | CN1235191C (ja) |
WO (1) | WO2002056300A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080094710A (ko) * | 2005-10-26 | 2008-10-23 | 엘지전자 주식회사 | 멀티채널 오디오 신호의 부호화 및 복호화 방법과 그 장치 |
CN104778948B (zh) * | 2015-04-29 | 2018-05-01 | 太原理工大学 | 一种基于弯折倒谱特征的抗噪语音识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU9404098A (en) * | 1997-09-23 | 1999-04-12 | Voxware, Inc. | Scalable and embedded codec for speech and audio signals |
-
2001
- 2001-12-19 KR KR1020027012154A patent/KR20020084201A/ko active IP Right Grant
- 2001-12-19 WO PCT/IB2001/002682 patent/WO2002056300A1/en not_active Application Discontinuation
- 2001-12-19 CN CNB018095321A patent/CN1235191C/zh not_active Expired - Fee Related
- 2001-12-19 JP JP2002556881A patent/JP2004518164A/ja not_active Withdrawn
-
2002
- 2002-01-14 US US10/046,632 patent/US20020152072A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20020152072A1 (en) | 2002-10-17 |
CN1235191C (zh) | 2006-01-04 |
WO2002056300A1 (en) | 2002-07-18 |
KR20020084201A (ko) | 2002-11-04 |
CN1429385A (zh) | 2003-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7475410B2 (ja) | サブバンドブロックに基づく高調波移調の改善 | |
JP4396233B2 (ja) | 複素指数変調フィルタバンクの信号分析方法、信号合成方法、そのプログラム及びその記録媒体 | |
DK2337224T3 (en) | Filter unit and method for generating subband filter pulse response | |
KR101341115B1 (ko) | 적응식 오버샘플링을 사용하는 고주파수 오디오 신호를 발생시키기 위한 장치 및 방법 | |
JP2007520748A (ja) | 複素値データを用いたオーディオ信号の復号 | |
JP2007526691A (ja) | 信号解析及び合成のための適応型混合変換 | |
TWI575514B (zh) | 資訊編碼器、其操作方法及相關電腦可讀媒體 | |
JP2004531151A (ja) | 時間離散オーディオサンプル値を処理する方法と装置 | |
BR112014020594B1 (pt) | Sistema e método de processamento de áudio para prover uma representação parcialmente complexa do domínio de frequência de um sinal, e portadora de dados | |
Zhang et al. | Efficient design of orthonormal wavelet bases for signal representation | |
Nakamura et al. | Time-domain audio source separation with neural networks based on multiresolution analysis | |
JP2004518164A (ja) | オーディオ信号又はスピーチ信号を符号化するパラメトリック・エンコーダ及び方法 | |
JPH0573093A (ja) | 信号特徴点の抽出方法 | |
Kim | Lossless wideband audio compression: Prediction and transform | |
JP2007228349A (ja) | サンプリング周波数変換方法、そのプログラム及びその記録媒体 | |
KR101820028B1 (ko) | 오버랩 범위 내의 결합을 사용하여 오디오 신호를 처리하기 위한 장치 및 방법 | |
Gillan et al. | Harmonic-band Complex Wavelet Transform Audio Analysis and Synthesis | |
EP1356458A1 (en) | Parametric encoder and method for encoding an audio or speech signal | |
TW202334938A (zh) | 正交鏡像濾波器域中之沉浸式音訊及視訊服務空間重建濾波器庫 | |
Comer | A wavelet-based technique for reducing noise in audio signals | |
Kim | Lossless Wideband Audio Compression | |
JPH0219477B2 (ja) | ||
JPH0580795A (ja) | 信号処理方法 | |
JPH1039900A (ja) | 音響信号の周波数領域変換係数の包絡推定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041216 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20070507 |