JP2004518164A - オーディオ信号又はスピーチ信号を符号化するパラメトリック・エンコーダ及び方法 - Google Patents

オーディオ信号又はスピーチ信号を符号化するパラメトリック・エンコーダ及び方法 Download PDF

Info

Publication number
JP2004518164A
JP2004518164A JP2002556881A JP2002556881A JP2004518164A JP 2004518164 A JP2004518164 A JP 2004518164A JP 2002556881 A JP2002556881 A JP 2002556881A JP 2002556881 A JP2002556881 A JP 2002556881A JP 2004518164 A JP2004518164 A JP 2004518164A
Authority
JP
Japan
Prior art keywords
filters
frequency
sine wave
parametric encoder
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002556881A
Other languages
English (en)
Inventor
ブリンケル,アルベルテュス セー デン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2004518164A publication Critical patent/JP2004518164A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本発明は、オーディオ又はスピーチ信号sを正弦波符号データに符号化するパラメトリック・エンコーダに関する。このようなパラメトリック・エンコーダは、mが1からMまでの整数を表すとき、典型的に、信号sを少なくとも一つの単一スケールセグメントx(n)に区分し、上記セグメントx(n)のサンプルx(0),...,x(L−1)を出力するセグメンテーション・ユニット120と、上記サンプルから上記セグメントx(n)を表現する正弦波符号データを推定する正弦波推定ユニット140と、を含む。本発明の目的は、要求された時間・周波数分解能の兼ね合いの実現を容易にするパラメトリック・エンコーダ及び方法を改良することである。この目的は、出力されたサンプルx(0),...,x(L−1)を周波数ラップドメインに変換するため、周波数ラッピング演算を実行するようにセグメンテーション・ユニット120を具現化し、正弦波推定ユニット140によって出力された正弦波符号データを元の信号sの周波数ドメインへ再マッピングする後処理フィルタ160を設けることにより達成される。

Description

【0001】
本発明は、オーディオ又はスピーチ信号(音声信号)を正弦波符号データに符号化するパラメトリック・エンコーダ及び方法に関する。
【0002】
このようなエンコーダ及び方法は、一般的に、技術的に公知であり、例えば、文献:B. Elder, H. Purnhagen, and C. Ferekidis, ”ASAC − Analysis/synthesis codec for very low bit rates”, Preprint 4179(F−6) 100th AES Convention, Copenhagen, 11−14 May, 1996に記載されている。このような公知のパラメトリック・エンコーダは、図4及び5に示されている。
【0003】
図5に示されたエンコーダは、受信オーディオ又はスピーチ信号を、サンプルx(0),...,x(L−1)を有する少なくとも一つの単一スケールセグメントx(l)に区分するセグメンテーション・ユニット120’を含む。これらのサンプルは、上記セグメントx(n)を表現する正弦波符号データを推定する正弦波推定ユニット140’によって受信される。これらの正弦波符号データは、典型的に、チャネルを介して伝送されるか、若しくは、記録媒体に記憶される前に、データストリームに組み込まれる。
【0004】
図4は、公知のセグメンテーション・ユニット120’のより詳細な構成図である。同図から分かるように、オーディオ又はスピーチ信号s(n)は、連続したフィルタ122_1’、122_2’、...,122_L−1’を含むタップ付き遅延線へ入力される。元のオーディオ又はスピーチ信号s(n)=y(nD)、並びに、上記のL−1個のフィルタ122_1’、122_2’、...,122_L−1’の出力信号y(nD),...,yL−1(nD)は、セグメントx(l)のL個のサンプルx(0)、...,x(L−1)を生成するため、好ましくは、ダウンサンプリング・ユニットとして具現化されたサンプリング・ユニット124’へ入力される。
【0005】
図4及び5による従来のパラメトリック・エンコーダによって生成される単一スケールセグメントは、そのセグメント長、及び、それ故に周波数分解能が、区分されたオーディオ又はスピーチ信号の実際の周波数レンジとは無関係に一定であることを特徴とする。換言すると、一般的なエンコーダに設けられているような単一スケール正弦波推定機構は、要求された時間・周波数分解能の兼ね合いに関して問題がある。特に、高品質オーディオ符号化用の信号sの低周波数レンジに対して高い周波数分解能が要求され、他方、それ以外の周波数レンジでは、より低い周波数分解能が要求され、より短いセグメント長Lでも足りるであろう。
【0006】
これらの問題を解決するため、例えば、文献:T. S. Verma, S. N. Levine and J. O. Smith III, ”Multiresolution sinusoidal modeling for wideband audio with modifications”, Proc. ICASSP−98, Seattle, 1998に記載されているように、多重スケールモデルが提案されている。多重スケールモデルは、信号sの異なる周波数レンジに対し種々のセグメント長Lを設定する。しかし、これらの多重スケールモジュールは、成分をスケール全域に分散させるという問題、及び/又は、異なるスケールで取り出されたデータを併合するという問題を生じる。より詳細には、この分散の問題は、生成されたセグメントが通常は重なり合い、したがって、セグメントのサンプルは2回処理されるかもしれない、という問題を扱うことである。なぜならば、格別の努力を注がない限り、生成された2個のセグメントを明確に分離することは可能ではないからである。
【0007】
従来技術に鑑みるに、本発明の目的は、上記の多重スケールモデルの問題
即ち、成分をスケール全域に分散させる問題、及び/又は、異なるスケールで獲得されたデータを併合する問題を伴うことなく、要求された時間・周波数分解能の兼ね合いが確立されるように、オーディオ又はスピーチ信号を符号化する従来のパラメトリック・エンコーダ及び方法を改良することである。
【0008】
この目的は、請求項1に記載された内容によって解決される。より詳細には、従来のパラメトリック・エンコーダに対して、請求項1に係る発明によれば、セグメンテーション・ユニットは、出力サンプルを周波数ラップドメインへ変換するため周波数ラッピング演算を実行し、正弦波推定ユニットから出力された上記正弦波符号データを信号sの元の周波数ドメインへ再マッピングする後処理フィルタが設けられる。
【0009】
請求項に記載されたパラメトリック・エンコーダのセグメンテーション・ユニットは、信号sを少なくとも一つの単一スケールセグメントx(l)に区分する。このセグメンテーション・ユニットは、単一スケールセグメントだけを生成するので、技術的に知られている多重スケールモデルの問題は生じない。その代わり、周波数ラッピング演算を適用することによって、即ち、信号sの異なる周波数レンジに対し様々の周波数分解能を与えることによって、要求された時間・周波数分解能の兼ね合いは、全く問題を生じることなく、単一スケールセグメントに関して有利に確立される。
【0010】
尚、片側周波数ラッピングは、例えば、オーディオの線形予測符号化、オーディオイコライザ、及び、ノーマルフィルタ設計に関して、従来技術において広く知られているが、本願において提案されているような正弦波符号化に関しては知られていない。両側周波数ラッピングは、オーディオ処理には未だ適用されていない。
【0011】
パラメトリック・エンコーダの有利な実施例は従属請求項に記載されている。
【0012】
本発明の目的は、請求項9に記載されたオーディオ又はスピーチ信号を符号化する方法によっても解決される。この方法の利点は上記のパラメトリック・エンコーダの利点と一致する。
【0013】
次に、図1乃至3を参照して、本発明によるパラメトリック・エンコーダの好ましい実施例を説明する。
【0014】
図1には、オーディオ又はスピーチ(音声)信号s(n)を正弦波符号データscdへ符号化する本発明によるパラメトリック・エンコーダの好ましい第1の実施例が示されている。パラメトリック・エンコーダは、現在のダウンサンプリング・ステップを表すmが1からMまでの整数(m=1...M)であるとき、信号sを少なくとも一つの単一スケールセグメントx(n)に区分するセグメンテーション・ユニット120を含む。より詳細には、セグメンテーション・ユニット120は、直列に接続された複数のL−1個のフィルタ122_1、...,122_L−1を含み、これらのフィルタの中の最初のフィルタの入力で信号s(n)を受信する。このセグメンテーション・ユニット120は、lが1からL−1までの整数(l=0...(L−1))を表すとき、単一スケールセグメントx(l)のL個のサンプルx(0)、...、x(L−1)を生成するため、信号s(n)=y(n)と、上記L−1個のフィルタ122_1、...、122_L−1の出力信号y(n)...yL−1(n)とを受信し、好ましくは、ダウンサンプリングするサンプリング・ユニット124を更に含む。この好ましい第1の実施例において、L−1個のフィルタ122_1、...、122_L−1のすべては、伝達関数A(z)、即ち、
【0015】
【数6】
Figure 2004518164
を有する全域通過フィルタとして具現化される。式中、は、複素共役を表し、λは|λ|<1である。典型的に、λは実数値であり、かつ、λ≠0である。
【0016】
第1の実施例では、次のように処理が行われる。オーディオ信号sは、出力y(n)(n=0,1,...,L−1)を有するタップ付きの全域通過ラインへ入力される。ここで、
(n)=s(n) (2)
かつ、
l=1,2,...,L−1に対して、y=yl−1*α (3)
であり、*はコンボリューション演算を表し、αは伝達関数A(z)と関連したインパルス応答である。出力yはダウンサンプリングされ(D回の時点毎に1回ずつ読み出され)、セグメントxとして、
(l)=y(mD) (4)
のように定義される。式中、Dは、サンプリング・ユニット140のダウンサンプリング倍率である。サンプリング・ユニット124によって出力された信号は、lが1からL−1までの整数(l=0,1,...,L−1)である場合に、セグメントxのサンプルx(l)を表現していると考えられる。
【0017】
フィルタ122_1、...、122_L−1は、第1の実施例によれば、全域通過フィルタとして具現化されるので、サンプリング・ユニット124によって出力されたサンプルは、周波数ラップドメインに存在することに注意する必要がある。
【0018】
l=0,...,L−1としたときのサンプルx(l)は、セグメントxを表現する正弦波符号データを推定する正弦波推定ユニット140へ入力される。この推定は、周波数ラップされたサンプルにフーリエ変換を実施し、次に、例えば、ピーク・ピッキングを実施することによって行われる。
【0019】
更に、正弦波推定ユニット140によって出力されるような正弦波符号データは周波数ラップドメインに存在することに注意する必要がある。したがって、正弦波符号データは、元のオーディオ又はスピーチ信号sの周波数ドメインへ再マッピング(再割当)、即ち、逆ラッピングしなければならない。これは、正弦波推定ユニット140の後に続く後処理フィルタ160によって実行される。後処理フィルタ160の出力は、元の信号セグメントxと関連した再マッピングされた正弦波符号データに対応する。
【0020】
後処理フィルタ160によって完了されるように、正弦波を抽出した後、後の処理ステップは、残りのモデリングである。残りのモデリングを最も経済的に行うため、パワー・スペクトル密度関数のパラメトリック・モデルを使用する。このようなアプローチにより、正弦波推定及び雑音推定を統合することが可能になる。なぜならば、雑音モデリングに対し周波数ラッピングを使用できるからである。
【0021】
第1の実施例では、サンプリング・ユニット120によってラップされた周波数ラップ化サンプルは、単一スケールセグメントxに属するので、このような状況では、技術的に知られた多重スケールモデルの問題は生じない。フィルタを全域通過フィルタとして具現化することにより、周波数ラッピング演算が実行されると、サンプリング・ユニット124の出力で周波数ラップ化サンプルが得られる。周波数ラッピング演算によって、要求された時間・周波数分解能の兼ね合いが信号sに対して達成される。しかし、元のオーディオ又はスピーチ信号のパワー・スペクトル密度関数が僅かに修正されている点で不利である。
【0022】
図2は、実質的に第1の実施例に対応しているパラメトリック・エンコーダの第2の実施例の構成図である。特に、第2の実施例におけるサンプリング・ユニット124、正弦波推定ユニット140及び後処理フィルタ160は、第1の実施例における対応したユニットと同じである。更に、フィルタ122_3、...、122_L−1は、第1の実施例における対応したフィルタと同じである。なぜならば、これらのフィルタも、式(1)で表された伝達関数A(z)を有する1次の全域通過フィルタとして具現化されるからである。
【0023】
しかし、第2の実施例は、セグメンテーション・ユニット120内の直列接続されたフィルタのうちの1番目のフィルタ122_1が、
【0024】
【数7】
Figure 2004518164
で表される伝達関数A(z)を有する点で第1の実施例と相違する。
【0025】
また、2番目のフィルタ122_2は、全域通過フィルタとして具現化されるのではなく、
【0026】
【数8】
Figure 2004518164
で表される伝達関数A(z)を有する。尚、式(5)及び(6)において、λは、典型的に実数値である。
【0027】
λ>0の場合に、伝達関数A(z)及びA(z)は、共に、低域通過フィルタを表現し、λ<0の場合には、両方の伝達関数は高域通過フィルタを表現する。
【0028】
第2の実施例の利点は第1の実施例の利点に対応する。更に、元のオーディオ又はスピーチ信号sのパワー・スペクトル密度関数は、より良好に維持される。
【0029】
第1の実施例及び第2の実施例の問題は、導入された周波数ラッピング演算が片側デバイスとして機能することである。過去はラップされ(包み隠され)、各周波数の時間スケールが有効に相違する結果として、推定された周波数は、nサンプル前の瞬時周波数に対する優れた推定結果である。ここで、瞬時周波数の遅延を表現するnは、瞬時周波数自体に依存する。換言すると、このような遅延の存在は許容されるが、遅延がその周波数に依存することは回避されるべきである。なぜならば、この周波数依存性は符号化の目的には不利になるからである。符号化の目的としては、時間的に明確な時点での瞬時周波数が望ましい。
【0030】
そのため、周波数ラッピング処理を、過去と未来の両方をラッピングする両側演算に拡張することが提案される。未来のラッピングは、第1の実施例及び第2の実施例が考慮した機構を用いても実施できない。なぜならば、第1の実施例及び第2の実施例は、無限インパルス応答IIRフィルタに基づいているからである。
【0031】
しかし、有限セグメントの周波数ラッピングを考慮し、理想的な無限長のラップされた信号の有限部分を観察することによって、IIRフィルタを使用する処理は、マトリックス・ベクトル乗算に簡単化される。この場合、パラメトリック・エンコーダは、図3に示されるように具現化される。第3の実施例によれば、受信したオーディオ又はスピーチ信号は、タップ付き遅延ラインに入力され、次に、このオーディオ又はスピーチ信号sと、タップ付き遅延ラインのL−1個のフィルタ122_1、...、122_L−1の出力信号y(n)、...、yL−1(n)は、サンプリング・ユニット124へ入力される。サンプリング・ユニット124は、N>0かつN>0であるとき、−N、−N+1、...、0、...、N−1、Nのようにインデックスを付けられたN+1+N個のサンプルを有するセグメントxを生成する。第3の実施例においてここまでに実行されたサンプリング演算は、図4に関して説明したような従来技術において公知のサンプリング演算であり、サンプリング・ユニットの出力x (−N)、...、x (0)、...、x (N)における共通のサンプリング演算から得られるサンプルは、未だ周波数ラップドメインに存在しないことに注意することが重要である。
【0032】
サンプルを周波数ラップドメインへ変換するため、付加的に設けられた、好ましくは、サンプリング・ユニット120内に設けられた両側ラッピング・ユニット126を用いて両側ラッピング演算が実行される。両側ラッピング・ユニットは、前の段落で説明したマトリックス・ベクトル乗算を実行する。この乗算は、マトリックス記法で、
=Bx (7)
のように記述される。
【0033】
変換マトリックスBは、異なる周波数ラッピング演算に対して計算され、特に、変換マトリックスBは、本発明の第1の実施例又は第2の実施例による周波数ラッピング演算が第3の実施例によってシミュレートされるか、若しくは、実現されるように計算することが可能である。両側ラッピング・ユニット126によって出力されたサンプルは、入力サンプルとは違って、第1の実施例又は第2の実施例にしたがってサンプリング・ユニット120によって出力されたサンプルと同じように、望ましい周波数ラップドメイン上に存在する。図3から分かるように、変換されたサンプルは正弦波推定ユニット140へ出力され、正弦波推定ユニット140において、望ましい正弦波符号データが推定され、最終的に周波数ラップドメイン上の正弦波符号データは、正弦波推定ユニット140によって出力され、後処理フィルタ160へ入力され、元の信号sの周波数ドメインへ再マッピングされる。次に、変換マトリックスBの計算の一例が与えられ、第2の実施例が第3の実施例によってシミュレーションされる。
【0034】
このシミュレーションを実現するため、有限サポートをもつセグメントx(n)の周波数ラッピングを考える。より詳細には、このセグメントのサンプルは、N>0かつN>0の場合に、−N、−N+1、...、0、...、Nでインデックス付けされる。関連したラップ(された)信号は、
【0035】
【外1】
Figure 2004518164
によって表され、原理的に、無限サポートをもつ。
【0036】
サンプルx(n)と関連したラップ信号のフーリエ変換は、
【0037】
【数9】
Figure 2004518164
によって与えられる。但し、
【0038】
【数10】
Figure 2004518164
である。
【0039】
全域通過セクションの位相特性に従う周波数ラッピングの場合、これらの周波数変数の間には、
【0040】
【数11】
Figure 2004518164
又は、
【0041】
【数12】
Figure 2004518164
のような関係が与えられる。ここから、
【0042】
【数13】
Figure 2004518164
が得られる。但し、補間関数qの定義は、
【0043】
【数14】
Figure 2004518164
であり、F −1は、n−ドメインへのフーリエ逆変換を表す。より詳細には、
q(λ;n,0)=δ(n);
q(λ;−,k)=k次全域通過のインパルス応答、但し、k>0
q(λ;n,k)=q(λ;−n,−k)
q(λ;n,k)=0、n・k<0又は(k=0かつn≠0)の場合
である。
【0044】
マトリックス記法(この特殊なケースの表記からλを除去する)では、式(7)は、
【0045】
【数15】
Figure 2004518164
のように表される。即ち、カスケードされた全域通過フィルタは列方向に現れる。実際上、切り捨てられた(ウィンドウ化された)ラップ信号
【0046】
【外2】
Figure 2004518164
は、更なる処理のため使用される。
【0047】
【外3】
Figure 2004518164
の一部は、−MからMまで変化し、
【0048】
【数16】
Figure 2004518164
かつ、
【0049】
【数17】
Figure 2004518164
であると仮定する。これにより、マトリックスの略半分は、零と一致する。正のλに対して、切り捨てられた
【0050】
【外4】
Figure 2004518164
のサポートは、xのサポートよりも実質的に短い。
【0051】
マトリックスの行は、第2の実施例で説明したフィルタの(切り捨てられた)インパルス応答に対応する。
【0052】
上記の実施例は、本発明を限定するのではなく、本発明を例示するものであり、当業者は、請求項に係る発明の範囲を逸脱することなく、代替的な実施例を設計することが可能であろう。請求項の記載中、括弧付きの参照符号は、請求項に係る発明を限定するものとして解釈されるべきではない。「含む」、「有する」のような語は、請求項に列挙されていない他の要素或いは手順を除外するものではない。本発明は、幾つかの別々の要素を含むハードウェア、並びに、適切にプログラミングされたコンピュータを用いて実施することが可能である。幾つかの手段を列挙する装置クレームにおいて、それらの手段のうちの幾つかは全く同一のハードウェアによって具現化し得る。ある種の手段が相互に異なる従属請求項に記載されているという単なる事実は、これらの手段を組み合わせて使用しても有利ではない、ということを示すものではない。
【図面の簡単な説明】
【図1】
本発明によるパラメトリック・エンコーダの好ましい第1の実施例の構成図である。
【図2】
本発明によるパラメトリック・エンコーダの好ましい第2の実施例の構成図である。
【図3】
本発明によるパラメトリック・エンコーダの好ましい第3の実施例の構成図である。
【図4】
従来技術によるパラメトリック・エンコーダの詳細な構成図である。
【図5】
従来技術によるパラメトリック・エンコーダの略構成図である。

Claims (9)

  1. mが1からMまでの整数を表すとき、オーディオ又はスピーチ信号sを少なくとも一つの単一スケールセグメントx(n)に区分し、該セグメントx(n)のサンプルx(0),...,x(L−1)を出力するセグメンテーション・ユニットと、
    受信したサンプルx(0),...,x(L−1)から該セグメントx(n)を表現する正弦波符号データを推定する正弦波推定ユニットと、
    を有し、
    オーディオ又はスピーチ信号sを正弦波符号データへ符号化するパラメトリック・エンコーダであって、
    セグメンテーション・ユニットは、更に周波数ラッピング演算を実行するように具現化され、
    正弦波推定ユニットから出力された該正弦波符号データを再マッピングする後処理フィルタが設けられている、
    ことを特徴とするパラメトリック・エンコーダ。
  2. セグメンテーション・ユニットは、直列に接続された複数のL−1個のフィルタを含み、該フィルタの中の最初のフィルタの入力で信号s(n)を受信し、
    セグメンテーション・ユニットは、セグメントxのL個のサンプルx(0),...,x(L−1)又はx (0),...,x (L−1)を生成するため、該信号s(n)=y(n)並びに該L−1個のフィルタの出力信号y(n),...,yL−1(n)を受信し、サンプリングするサンプリング・ユニットを更に含む、
    ことを特徴とする請求項1記載のパラメトリック・エンコーダ。
  3. L個のフィルタのうちの少なくとも一部は、全域通過フィルタとして具現化されていることを特徴とする請求項2記載のパラメトリック・エンコーダ。
  4. L個のフィルタのうちの一部のフィルタは、1次の全域通過フィルタとして具現化され、
    各フィルタは、λが複素共役を表し、λが好ましくは実数値である場合に、
    Figure 2004518164
    に従う伝達関数A(z)を有することを特徴とする請求項3記載のパラメトリック・エンコーダ。
  5. 複数のフィルタのうちのすべてのフィルタは、1次の全域通過フィルタとして具現化され、
    各フィルタは、λが複素共役を表し、λが好ましくは実数値である場合に、
    Figure 2004518164
    に従う伝達関数A(z)を有することを特徴とする請求項4記載のパラメトリック・エンコーダ。
  6. 該直列に接続されたフィルタの中で信号s(n)を受信する1番目のフィルタは、
    Figure 2004518164
    に従う伝達関数A(z)を有し、
    該直列に接続されたフィルタの中で該1番目のフィルタの後に続く2番目のフィルタは、
    Figure 2004518164
    に従う伝達関数A(z)を有し、
    1次の全域通過フィルタである残りの各フィルタは、請求項4に記載された伝達関数A(z)を有する、
    ことを特徴とする請求項4記載のパラメトリック・エンコーダ。
  7. セグメンテーション・ユニット内では、直列に接続されている複数のL−1個のフィルタはタップ付きの遅延ラインによって具現化され、
    各フィルタは、
    A(z)=z−1
    で表される伝達関数を有し、
    両側周波数ラッピング演算をサンプリング・ユニットによって出力された元の信号sの周波数ドメイン上のサンプルx (−N),...,x (N)に適用することにより、サンプルx (−N),...,x (N)を周波数ラップドメイン上のサンプルx(−M),...,x(M)へ変換し、変換されたサンプルx(−M),...,x(M)を該正弦波推定ユニットへ出力する両側ラッピング・ユニットが更に設けられている、
    ことを特徴とする請求項2記載のパラメトリック・エンコーダ。
  8. 両側ラッピング・ユニットは、
    Figure 2004518164
    に従ってサンプルx のサンプルxへの変換を実行し、
    列方向のqは全域通過フィルタのタップ付きのラインのインパルス応答を表現する、
    ことを特徴とする請求項7記載のパラメトリック・エンコーダ。
  9. mが1からMまでの整数を表すとき、オーディオ又はスピーチ信号sを、サンプルx(0),...,x(L−1)を有する少なくとも一つの単一スケールセグメントx(n)に区分する手順と、
    受信したサンプル(0),...,x(L−1)から該セグメントx(n)を表現する正弦波符号データを推定する手順と、
    を有し、
    オーディオ又はスピーチ信号sを正弦波符号データへ符号化する方法であって、
    サンプルx(0),...,x(L−1)が周波数ラップドメインに設けられるように周波数ラッピング演算が実行され、
    周波数ラップドメイン上で推定された該正弦波符号データは、元の信号sの周波数ドメインへ再マッピングされる、
    ことを特徴とする方法。
JP2002556881A 2001-01-16 2001-12-19 オーディオ信号又はスピーチ信号を符号化するパラメトリック・エンコーダ及び方法 Withdrawn JP2004518164A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP01200143 2001-01-16
EP01202718 2001-07-17
PCT/IB2001/002682 WO2002056300A1 (en) 2001-01-16 2001-12-19 Parametric encoder and method for encoding an audio or speech signal

Publications (1)

Publication Number Publication Date
JP2004518164A true JP2004518164A (ja) 2004-06-17

Family

ID=26076811

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002556881A Withdrawn JP2004518164A (ja) 2001-01-16 2001-12-19 オーディオ信号又はスピーチ信号を符号化するパラメトリック・エンコーダ及び方法

Country Status (5)

Country Link
US (1) US20020152072A1 (ja)
JP (1) JP2004518164A (ja)
KR (1) KR20020084201A (ja)
CN (1) CN1235191C (ja)
WO (1) WO2002056300A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080094710A (ko) * 2005-10-26 2008-10-23 엘지전자 주식회사 멀티채널 오디오 신호의 부호화 및 복호화 방법과 그 장치
CN104778948B (zh) * 2015-04-29 2018-05-01 太原理工大学 一种基于弯折倒谱特征的抗噪语音识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU9404098A (en) * 1997-09-23 1999-04-12 Voxware, Inc. Scalable and embedded codec for speech and audio signals

Also Published As

Publication number Publication date
US20020152072A1 (en) 2002-10-17
CN1235191C (zh) 2006-01-04
WO2002056300A1 (en) 2002-07-18
KR20020084201A (ko) 2002-11-04
CN1429385A (zh) 2003-07-09

Similar Documents

Publication Publication Date Title
JP7475410B2 (ja) サブバンドブロックに基づく高調波移調の改善
JP4396233B2 (ja) 複素指数変調フィルタバンクの信号分析方法、信号合成方法、そのプログラム及びその記録媒体
DK2337224T3 (en) Filter unit and method for generating subband filter pulse response
KR101341115B1 (ko) 적응식 오버샘플링을 사용하는 고주파수 오디오 신호를 발생시키기 위한 장치 및 방법
JP2007520748A (ja) 複素値データを用いたオーディオ信号の復号
JP2007526691A (ja) 信号解析及び合成のための適応型混合変換
TWI575514B (zh) 資訊編碼器、其操作方法及相關電腦可讀媒體
JP2004531151A (ja) 時間離散オーディオサンプル値を処理する方法と装置
BR112014020594B1 (pt) Sistema e método de processamento de áudio para prover uma representação parcialmente complexa do domínio de frequência de um sinal, e portadora de dados
Zhang et al. Efficient design of orthonormal wavelet bases for signal representation
Nakamura et al. Time-domain audio source separation with neural networks based on multiresolution analysis
JP2004518164A (ja) オーディオ信号又はスピーチ信号を符号化するパラメトリック・エンコーダ及び方法
JPH0573093A (ja) 信号特徴点の抽出方法
Kim Lossless wideband audio compression: Prediction and transform
JP2007228349A (ja) サンプリング周波数変換方法、そのプログラム及びその記録媒体
KR101820028B1 (ko) 오버랩 범위 내의 결합을 사용하여 오디오 신호를 처리하기 위한 장치 및 방법
Gillan et al. Harmonic-band Complex Wavelet Transform Audio Analysis and Synthesis
EP1356458A1 (en) Parametric encoder and method for encoding an audio or speech signal
TW202334938A (zh) 正交鏡像濾波器域中之沉浸式音訊及視訊服務空間重建濾波器庫
Comer A wavelet-based technique for reducing noise in audio signals
Kim Lossless Wideband Audio Compression
JPH0219477B2 (ja)
JPH0580795A (ja) 信号処理方法
JPH1039900A (ja) 音響信号の周波数領域変換係数の包絡推定方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041216

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20070507