JP2007519967A - 信号を時間スケーリングする方法及び装置 - Google Patents

信号を時間スケーリングする方法及び装置 Download PDF

Info

Publication number
JP2007519967A
JP2007519967A JP2006550386A JP2006550386A JP2007519967A JP 2007519967 A JP2007519967 A JP 2007519967A JP 2006550386 A JP2006550386 A JP 2006550386A JP 2006550386 A JP2006550386 A JP 2006550386A JP 2007519967 A JP2007519967 A JP 2007519967A
Authority
JP
Japan
Prior art keywords
time
parameter value
signal
sample block
frequency sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006550386A
Other languages
English (en)
Inventor
エリク ジー ピー スヒャイゥエルス
アンドレアス ジェイ ヒェリット
アルノルドゥス ダブリュ ジェイ オーメン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2007519967A publication Critical patent/JP2007519967A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Television Systems (AREA)
  • Synchronisation In Digital Transmission Systems (AREA)
  • Communication Control (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

デコーダは、符号化モノ信号とステレオデータとを有するビットストリームを入力する(501)。時間スケールプロセッサ(503)は、時間スケーリングされたモノ信号を発生する。時間/周波数プロセッサは、上記時間スケーリングされた信号の周波数サンプルブロックを発生し、該ブロックの長さは固定であって、時間スケーリングとは独立している。パラメータ式ステレオデコーダ(509)は上記周波数サンプルブロックに対してステレオ信号を発生し、これらは周波数/時間プロセッサ(511)により時間ドメインに変換される。同期化プロセッサ(515)は、パラメータ値と周波数サンプルブロックとの間の時間関連付けを決定することによりステレオデータを上記時間スケーリングされた信号に同期させる。上記パラメータ値及び時間関連付けは、当該及び他の周波数サンプルブロックに関して同期されたステレオパラメータ値を決定するために使用される。本発明は、MPEG4符号化信号から時間スケーリングされたステレオ信号を少ない複雑さで発生するのに特に適している。

Description

本発明は、信号を時間スケーリングする方法及び装置に係り、特にはオーディオ信号を時間スケーリングする方法及び装置に関する。
近年、デジタル形態のA/Vコンテンツの分配及び記憶が大幅に増加している。従って、多数の符号化規格及びプロトコルが開発された。
オーディオ符号化及び圧縮技術は、相対的に小さなデータサイズ及び高品質のオーディオファイルが例えばインターネットを含むデータネットワークを介して都合良く配信されるのを可能にするような非常に効率的なオーディオ符号化を提供する。
符号化規格の一例は動画専門家グループ4(MPEG4)符号化規格であり、該規格はビデオ及びオーディオ符号化の両方に対してデコーダ規格を規定している。MPEG4符号化規格の更なる詳細は、“オーディオ/ビジュアル・オブジェクトの符号化”MPEG4:ISO/IEC14496で見付けることができる。
オーディオ信号に、知覚される音高(ピッチ)を変えることなくオーディオ信号の再生速度及び期間を変更するために適用することが可能な技術は、時間スケーリング又はテンポスケーリングとして知られている。例えばオーディオ/ビデオ同期化、言語学習、難聴の人のためのツール、回答マシン、発話書籍等を含む、時間スケーリングにとって多数の興味ある用途が存在する。
一般的に、時間スケーリングは後処理技術として適用される。従って、通常の波形符号化題材に対しては、通常の復号処理及び複雑な時間スケーリング処理の両方が実行されねばならないので、更なる量の複雑さを招来する。更に、時間スケーリング処理は典型的には復号された信号にアーチファクトを生じるので、時間スケーリングされた信号の品質を劣化させる。許容可能な品質を達成するためには、計算的要件の増加につながるような非常に複雑な時間スケーリングアルゴリズムを使用する必要がある。
波形符号化と比較したパラメータ式オーディオ符号化の利点は、オーディオ信号のパラメータ表現が、例えば時間及び/又はピッチスケーリング処理等の効果処理を相対的に低い複雑さで容易化させる点にある。パラメータ式オーディオ符号化の一例は、Erik Schuijers、Werner Oomen、Bert den Brinker及びJeroen Breebaartによる “高品質オーディオ用のパラメータ式符号化における進歩”Preprint 5852, 114th AES Convention, Amsterdam, The Netherlands, 22-25 March 2003で見付けることができる。
このパラメータ式符号化方法は、目下、規格化中であって、現在のところMPEG4拡張2, Coding of Moving Pictures and Audio, Parametric coding for High Quality Audio”, ISO/IEC 14496-3:2001/FPDAM2, JTC1/SC29/WG11に記載されており、ISO/IEC 14496-3:2001/AMD2で正式に規格化されるべきものである。便宜上、この明細書ではMPEG4拡張2なる用語が使用される。MPEG4拡張2によれば、ステレオオーディオ信号は、下記のパラメータデータにより表現することができる:
当該オーディオ信号の非静止部を表す過渡パラメータデータ;
当該オーディオ信号の音調(tonal)部分を表す正弦(sinusoid)パラメータデータ;
オーディオ信号の非音調(又は確率的)部分を表すノイズパラメータデータ;
ステレオイメージングデータ。
MPEG4拡張2は、ステレオ信号がパラメータ式ステレオ(PS)アルゴリズムにより符号化されるようにする。PSにおいては、ステレオオーディオ符号化は、ステレオオーディオ信号をモノ信号及び少量のステレオイメージングパラメータとして符号化することにより達成される。この場合、結果としてのモノ信号は(パラメータ式)モノエンコーダにより符号化することができる。デコーダにおいては、モノ符号化されたチャンネルは、復号されたモノ信号に上記ステレオイメージングパラメータを適用することによりステレオチャンネルに拡張される。斯かるステレオパラメータは、チャンネル間強度差(IID)、チャンネル間時間又は位相差(ITD又はIPD)及びチャンネル間コヒーレンス(ICC)(若しくはチャンネル間相互相関)からなる。
図1は、従来技術によるMPEG4拡張2のパラメータ式ステレオデコーダの一例を図示している。
デコーダ100は、到来するMPEG4拡張2のビットストリームを入力すると共に該ビットストリームをデマルチプレクスするレシーバ101を有している。レシーバ101は復号ユニット103に結合され、該復号ユニットには過渡、正弦及びノイズパラメータデータが供給される。これに応答して、復号ユニット103はモノ信号を発生する。
復号ユニット103はステレオプロセッサ105に結合され、該ステレオプロセッサは更にレシーバ101にも結合されている。ステレオプロセッサ105は、復号ユニット103から上記モノ信号を入力すると共にレシーバ101から前記ステレオイメージングデータを入力し、これらに応答して、MPEG4拡張2のパラメータ式ステレオ復号アルゴリズムに基づきステレオ信号を発生する。
パラメータ式オーディオ符号化は、相対的に低い複雑さの時間スケーリングがデコーダで実行されるのを可能にする。図2は、従来技術によるMPEG4拡張2の時間及び/又はピッチスケーリングパラメータ式ステレオデコーダ200の一例を図示している。デコーダ200は図1のデコーダ100と、該デコーダ200が時間/ピッチスケールユニット201を更に有している点を除き同一である。デコーダ200とデコーダ100との対応するブロックは、図1及び図2において同一の符号を有している。
時間/ピッチスケールユニット201は、レシーバ101と復号ユニット103との間に結合されている。時間/ピッチスケールユニット201は、パラメータデータを、これらが復号信号を発生するために使用される前に変更するように動作する。このように、斯かるパラメータは所望のテンポ及びピッチを達成すべく変更することができる。
図3は、従来技術によるパラメータ式ステレオデコーダ300を図示している。パラメータ式ステレオデコーダ300は、復号ユニット103から時間ドメインのモノ信号を入力し、これに応答して、相関解除器(decorrelator)301において相関解除された信号を発生する。上記モノ信号は更に第1ドメイン変換プロセッサ303にも供給され、該ドメイン変換プロセッサは当該モノ信号の周波数ドメイン表現を発生する。同様に、前記相関解除された信号は第2ドメイン変換プロセッサ305に供給され、該第2ドメイン変換プロセッサは該相関解除された信号の周波数ドメイン表現を発生する。
第1及び第2ドメイン変換プロセッサ303、305はパラメータ式ステレオデコーダユニット307に結合され、該ユニットにおいては上記信号が、左及び右の周波数ドメインチャンネルを発生すべく処理される。詳細には、MPEG4拡張2のステレオイメージングパラメータは時間的に変化する周波数依存性パラメータである。従って、上記周波数ドメインのサンプルは:
− スケーリング(チャンネル間強度差パラメータを表す);
− 回転(チャンネル間位相差パラメータを表す);及び
− 混合(チャンネル間コヒーレンスパラメータを表す);
により変更される。
結果として、左及び右信号に対する周波数ドメイン表現が発生される。
パラメータ式ステレオデコーダユニット307は、第1逆変換プロセッサ309及び第2逆変換プロセッサ311に結合され、これらプロセッサは、周波数ドメインの左及び右チャンネルの供給を各々受け、これらに応答して時間ドメインの左及び右チャンネルを発生する。
従来、時間ドメインから周波数ドメインへの変換は高速フーリエ変換(FFT)が後続する(解析)ウィンドウ処理により実行され、周波数ドメインから時間ドメインへの変換は、逆高速フーリエ変換(iFFT)、これに後続する(合成)ウィンドウ処理及び連続するブロックからのデータを結合する重ね合わせ及び加算により実行される。
時間スケーリングを適用する場合、時間スケーリングされたモノ信号(及び相関解除された信号)とステレオイメージパラメータとの間に適切な同期が維持されて、パラメータ式ステレオデータユニット307において適切なステレオイメージパラメータが正しいサンプルに適用されるのを保証することが不可欠であることが理解されるであろう。
従来、斯かる同期は、時間から周波数への変換及び周波数から時間への変換の両方において適用されるウィンドウのサイズを調整することにより達成される。例えば、当該モノ信号の時間スケーリングが、テンポが増加されるようなものである場合、連続するステレオパラメータ値の間において、より少ない時間ドメインサンプルが発生される必要がある。結果として、(逆)ドメイン変換プロセッサ303、305、309及び311において、より短い解析及び合成ウィンドウが適用される。しかしながら、計算的複雑さに鑑みて、(逆)変換長は一定に維持されるのが好ましい。従って、所定の変換長までの解析及び合成ウィンドウの零詰め込みが適用される。
従来の方法においては、ステレオパラメータは前記ビットストリームから直接取られ、パラメータ式ステレオデコーダユニット307による処理のために使用される。従って、パラメータ式ステレオデコーダユニット307のステレオパラメータ及びブロック処理は、オリジナルの時間スケーリングされていない信号に同期されていると考えることができる。これを補償するために、FFT及びiFFTのブロック時間は、ウィンドウ処理技術の使用により、それに応じて変更される。この方法は、高い粒度(granularity)での非常に柔軟性のある正確な時間スケーリングを可能にする。
ウィンドウ処理及びFFTに関連する複雑さは、特にメモリ要件に関して、非常に高い。パラメータ式ステレオ復号ツールの複雑さを低減するためには、パラメータ式ステレオデコーダにおける時間から周波数への及び周波数から時間への変換を、ダウンサンプリングされた複素指数変調されたフィルタバンクにより置換するのが望ましい。複素値サブバンドドメインサンプルは、入力信号の複素指数変調された試作型フィルタによる畳み込み(フィルタ処理)により発生される。分解技術の適用により、このフィルタ処理を実行するのに必要とされる乗算及び加算の数は最小化される。ダウンサンプリングされた複素指数変調されたフィルタバンクの更なる説明は、P. Ekstrandによる"スペクトルバンド複製によるオーディオ信号の帯域幅拡張" Proc. 1st IEEE Benelux Workshop on Model Base Processing and Coding of Audio (MPCA-2002), Leuven, Belgium, 2002年11月15日で見付けることができる。
FFT型方法における解析/合成ウィンドウ処理の柔軟性とは対称的に、複素変調されたフィルタバンクの使用は、固定ブロック型の変換及び処理となる。典型的な64バンドの複素変調されたフィルタバンクの場合、実効的に各64入力サンプルブロックに対して、図4に示されるように64の複素値サブバンドドメインサンプルが発生される。(下側の3つのバンドは、ステレオ再生に要する周波数分解能の増加のために周波数的に更に分割されることに注意されたい。)これらブロックの各々に関連する時間間隔は固定である。しかしながら、時間スケーリングされた信号に対する時間間隔は一定であるから、時間スケーリングされていない信号の対応する時間間隔の長さは、適用される時間スケーリングに依存して変化する。例えば、増加されたテンポに関しては、時間スケーリングされたモノ信号の64サンプルは、元々符号化されていた時間スケーリングされていない時間信号の64より多いサンプルに対応するであろう。ビットストリームのステレオイメージングパラメータ値は、元々符号化された時間スケーリングされていない時間信号と本来的に同期しており、時間から周波数へのドメイン変換は斯かる時間スケーリングを補償することはできないので、ステレオイメージングパラメータは、通常は、ステレオ復号ユニットにおける周波数ドメインサンプルとは同期しないであろう。
かくして、時間スケーリングのための改善されたシステムが有利であり、特に、増加された柔軟性、より低い複雑さ、増加された性能及び/又は信号品質を可能にするシステムが有利である。特に、低減された複雑さ及び/又は改善された同期を有するMPEG4ステレオ信号を時間スケーリングする改善されたシステムが有利であろう。
従って、本発明は好ましくは、上述した欠点の1以上を単独で又は何らかの組み合わせで低減、軽減又は除去するのを目指すものである。
本発明の第1のフィーチャによれば、信号を時間スケーリングする装置であって、第1信号と拡張データとを有する入力信号を入力する手段と、前記第1信号の時間スケーリングされた信号を発生する手段と、前記時間スケーリングされた信号に対して複数の周波数サンプルブロックを発生する手段であって、各周波数サンプルブロックが前記時間スケーリングされた信号の固定の時間間隔に対応し、該固定の時間間隔が時間スケール係数とは独立しているような手段と、前記拡張データの第1パラメータ値と前記時間スケーリングされた信号の関連する第1時間間隔を有する第1周波数サンプルブロックとの間の第1の時間関連付けを決定する手段と、前記第1の時間関連付け及び前記第1パラメータ値に応答して、第2周波数サンプルブロックに関連する第2パラメータ値を決定する手段と、前記第2パラメータ値に応答して、前記第2周波数サンプルブロックのデータを変更する手段と、前記周波数サンプルブロックから時間ドメインの出力サンプルブロックを発生する手段とを有するような装置が提供される。
本発明は信号の効率的な時間スケーリングを提供する。上記第1信号は、特には、符号化された信号であり得る。特に、本発明は、時間スケーリングされた信号の固定長のドメイントランスファブロックの使用を可能にする。このように、(周波数)ドメイントランスファブロックの長さは時間スケール係数とは独立となる。即ち、本発明は、時間スケーリングされた信号が可変長(時間スケーリング値の関数として)のブロック変換により補償されることを要さずに、信号の時間スケーリングを可能にすることができる。従って、時間スケーリングされた信号の可変ウィンドウ処理の要件が、軽減され得るか又は不要とされ得る。代わりに、前記周波数サンプルブロックを発生する手段、前記データを変更する手段及び前記時間ドメインの出力サンプルブロックを発生する手段は、データを、上記時間スケーリングされた信号の固定数のサンプルに対応する固定サイズのブロックステップで全て処理することができる。該固定数は時間スケーリングとは独立である。即ち、時間スケーリングされた信号の周波数サンプルの数と時間サンプルの数との間には好ましくは固定の比が存在し、好ましくは、各時間サンプルに対して1つの周波数サンプルが発生される。このように、例えば64サンプルのブロックステップサイズに対して、前記複数の周波数サンプルブロックを発生する手段は、好ましくは、64の周波数サンプルを発生する。実際のブロック処理は、他のブロックからのデータを含み得る。例えば、上記複数の周波数サンプルブロックを発生する手段は、当該変換を、ブロックサイズを超えるような複数のサンプルに基づくものとすることができる。
これは、特に少ない複雑さの処理を可能にすると共に、特に簡素化されたドメイントランスファ機能の使用を可能にする。特に、本発明は、ダウンサンプリングされた複素指数変調フィルタバンクを使用した時間スケーリングを可能にすることができる。
本発明は、拡張データのパラメータ値を時間スケーリングされた信号に同期させる、少ない複雑さ及び高い性能の手段を提供する。即ち、本発明は、時間スケーリングされた信号に適用された時間スケーリングに対応するようにパラメータ値を時間スケーリングする簡単な処理を可能にする。
本発明の一つのフィーチャによれば、前記第1の時間関連付けを決定する手段が、前記第1周波数サンプルブロックを、前記第1パラメータ値に関連する時点に対応する関連する時間間隔を持つものとして決定する。
これは、前記パラメータ値と前記時間スケーリングされた信号との間を同期させるために使用することが可能な時間関連付けを決定する簡単な構成及び可能な方法を可能にする。即ち、所与のパラメータ値に関する時間関連付けは、どの周波数サンプルブロックが、入力されたビットストリームにおけるパラメータ値の時間スケーリングされていない時点に対応するかを簡単に示すことができる。
本発明の別のフィーチャによれば、前記第1の時間関連付けが、前記第1時間間隔内のパラメータ値の時間位置の指示を有する。
上記時間関連付けは、パラメータ値の部分的な時間の指示を有することができる。即ち、該指示は、当該パラメータ値が第1時間間隔のどの相対的部分に当てはまるかを示すような相対的時間指示であり得る。これは、拡張データのパラメータ値と時間スケーリングされた信号との間の大幅に改善され且つ一層接近した同期化を可能にすることができる。特に、これは、計算される第2パラメータ値の精度を大幅に改善することができると共に、パラメータ値の大幅に高い時間分解能のスケーリングを可能にすることができ、これにより、一層細かな時間スケーリング分解能を提供する。
本発明の別のフィーチャによれば、当該装置は、前記拡張データの第3パラメータ値と第3周波数サンプルブロックとの間の第2の時間関連付けを決定する手段を更に有し、前記第2パラメータ値を決定する手段は、前記第1パラメータ値、前記第1の時間関連付け、前記第3パラメータ値及び前記第2の時間関連付けに応答して補間を実行するように動作する。好ましくは、上記補間は線形補間とする。
これは、少ない複雑さでありながら、高い性能の構成を提供する。詳細には、これは第2パラメータ値を高い時間分解能で決定する効率的手段を可能にする。即ち、これは第2パラメータ値が所望の時点に対して正確に決定されるのを可能にする。
本発明の別のフィーチャによれば、前記第1の時間関連付けを決定する手段は、前記第1の時間関連付けを前の時間関連付けに応答して決定するように動作する。
また、本発明の別のフィーチャによれば、当該装置は、前記拡張データの連続するパラメータ値の間のスケーリングされた時間オフセットを決定する手段を更に有し、前記第1の時間関連付けを決定する手段は、前のパラメータ値と前記スケーリングされた時間オフセットとに応答して前記第1パラメータ値の時点を決定すると共に、該時点に応答して前記時間関連付けを発生する。
典型的には、前記拡張データのパラメータ値は、規則的な間隔で(例えば前記符号化された時間スケーリングされていない信号の1024サンプル毎に)発生し得る。このように、スケーリングされていない時間ドメインにおいては、連続するパラメータ値の間の時間オフセットは1024サンプルである。時間スケーリングされた信号に関しては、対応するスケーリングされた時間オフセットは異なるであろう。例えば、再生レートが10%増加された場合、上記1024サンプルは、時間スケーリングされた信号の922サンプルに対応するであろう。このように、時間スケーリングされた信号に対する第1パラメータ値の時点は、前のパラメータ値の時間スケーリングされたサンプルに922サンプルを加えたものとして決定することができる。これは、時間スケーリングされた信号とパラメータ値とを同期する簡単な手段を提供する。
好ましくは、前記時間関連付けは時間サンプルブロックに対して決定される。例えば、時間サンプルブロックが時間スケーリングされた信号の64サンプルを有する場合、2.75なる時間指示は第3ブロックの48番目のサンプルに対応する。スケーリングされた時間オフセットも、好ましくは、時間サンプルブロックに対して決定される。このように、922なるスケーリングされた時間オフセットは、14.41時間サンプルブロックのスケーリングされた時間オフセットと等価であり得る。前のパラメータ値が2.75なるスケーリングされた時間ドメインで発生した場合、後のパラメータ値は、2.75+14.41=17.16なる時間スケーリングされたドメインの時間に、即ち時間サンプルブロック17のスケーリングされた時間サンプル10に対応すると決定することができる。
本発明の別のフィーチャによれば、前記第2パラメータ値を決定する手段は、前記時間関連付けに応答して前記第1パラメータ値を前記第1時間間隔内の公称時点に関連付けると共に、前記第1パラメータ値及び前記公称時点に応答して前記第2パラメータ値を決定するように動作する。好ましくは、前記第2パラメータ値を決定する手段は、前記第2パラメータ値を、前記第1パラメータ値及び前記公称時点に応答する補間に応答して決定する。
即ち、上記公称時点は時間サンプルブロックの中間時点とすることができる。例えば、17.16なる第1パラメータ値の時点を計算した場合、17.5なる位置であると仮定する第1パラメータ値と、2.5なる位置であると仮定する前のパラメータ値との間の補間を実行することができる。好ましくは、後のパラメータの時点を決定するために正確な時点関連付けが使用される。このように、好ましくは、続くパラメータ値は17.16+14.41=31.57で発生すると決定することができる。
上記公称位置は、例えば第1時間間隔に関する中間点、終点、量子化された又は整数の時間値とすることができる。このフィーチャは、第2パラメータ値の決定を単純化する一方、前記時間関連付けの時間指示の高いスケーリングされた時間ドメイン精度を保証することができる。
好ましくは、前記入力信号はパラメータ符号化オーディオ信号であり、特に該入力信号はMPEG4符号化オーディオ信号(MPEG4拡張2符号化オーディオ信号等の)とすることができる。
本発明の別のフィーチャによれば、記周波数サンプルブロックを発生する手段は、例えばQMF型フィルタバンク等の複素指数変調フィルタバンク(complex-exponential modulated filter banks)を有する。同様に、前記時間ドメイン出力サンプルブロックを発生する手段は、好ましくは、複素指数変調フィルタバンクを有する。このように、本発明は複雑さが低減された時間スケールデコーダを容易化又は可能にすることができ、特に、ドメイン変換に関連する解析ウィンドウ処理の要件を好ましくは不要にすることができる。
本発明の別のフィーチャによれば、前記拡張データがパラメータ型ステレオデータを有し、前記第1パラメータ値は、好ましくは、チャンネル間強度差パラメータ、チャンネル間時間又は位相差パラメータ、及びチャンネル間コヒーレンスパラメータからなる群から選択されたステレオイメージパラメータのパラメータ値であるとする。好ましくは、前記第2パラメータ値を決定する手段は、前記周波数サンプルブロックを、パラメータ式ステレオプロトコルに基づいて、特にはMPEG4拡張2に記載されたパラメータ式ステレオプロトコルに基づいて処理するように動作する。好ましくは、前記変更する手段は、前記第2周波数サンプルブロックのデータを変更して少なくとも第1ステレオチャンネルの周波数サンプルブロックを発生するように動作する。従って、本発明は、MPEG4パラメータステレオビットストリームからのステレオ信号の効率的な少ない複雑さでの発生を可能にすることができる。
代替的に又は付加的に、前記拡張データは空間的オーディオデータを有することができる。例えば、該拡張データは、例えばセンタ及びリアチャンネル等の更なる空間的チャンネルの発生を可能にするようなデータを有することができる。
本発明の別の態様によれば、信号を時間スケーリングする方法であって、該方法が、第1信号と拡張データとを有する入力信号を入力するステップと、前記第1信号の時間スケーリングされた信号を発生するステップと、前記時間スケーリングされた信号に対して周波数サンプルブロックを発生するステップであって、各周波数サンプルブロックが前記時間スケーリングされた信号の固定の時間間隔に対応し、該固定の時間間隔が時間スケール係数とは独立しているようなステップと、前記拡張データの第1パラメータ値と前記時間スケーリングされた信号の関連する第1時間間隔を有する第1周波数サンプルブロックとの間の第1の時間関連付けを決定するステップと、前記第1の時間関連付け及び前記第1パラメータ値に応答して、第2周波数サンプルブロックに関連する第2パラメータ値を決定するステップと、前記第2パラメータ値に応答して、前記第2周波数サンプルブロックのデータを変更するステップと、前記周波数サンプルブロックから時間ドメインの出力サンプルブロックを発生するステップとを有するような方法が提供される。
本発明の、これら及び他の態様、フィーチャ並びに利点は、以下に説明する実施例から明らかとなり、斯かる実施例を参照して解説されるであろう。
以下、本発明の一実施例を、添付図面を参照して例示のみとして説明する。
以下の説明は、オーディオ時間スケーリングデコーダに、特には時間スケーリング機能を有するMPEG4拡張2ステレオデコーダに適用可能な本発明の一実施例に焦点を合わせる。しかしながら、本発明は斯かる用途に限定されるものではなく、多くの他の信号及び用途に適用することができることが分かるであろう。
また、特定の説明は、この実施例に焦点を合わせるが、ここに述べる原理、代替例及びフィーチャは必ずしも該特定の実施例に限定されるものではなく、他の適切な実施例にも任意選択的に適用することができることが分かるであろう。
図5は、本発明の一実施例による時間スケーリングデコーダ500を図示している。
時間スケーリングデコーダ500は、外部又は内部の情報源(図示略)からのMPEG4拡張2で符号化されたステレオ信号を入力するレシーバ501を有している。レシーバ501は、例えば、ネットワーク接続からMPEG4拡張2のビットストリームを入力することができるか、又は内部メモリ若しくはプロセッサから該信号を入力することができる。
上記MPEG4拡張2ビットストリームは、過渡、正弦及びノイズパラメータデータの形態のパラメータ的に符号化されたモノ信号を有している。更に、該MPEG4拡張2ビットストリームは、パラメータ的に符号化されたステレオイメージパラメータの形態の拡張データを有している。詳細には、MPEG4拡張2ビットストリームは、チャンネル間強度差(IID)パラメータ、チャンネル間時間又は位相差(ITD)パラメータ及びチャンネル間コヒーレンス(ICC)パラメータの形態のステレオ拡張データを有している。
レシーバ501は時間スケールプロセッサ503に結合され、該時間スケールプロセッサには上記過渡、正弦及びノイズパラメータを含む符号化された信号データが供給される。時間スケールプロセッサ503は、テンポ及びピッチ要件に応じて、斯かる過渡、正弦及びノイズパラメータを処理する。このように、時間スケールプロセッサ503は、所望のピッチ及び再生レートを持つような時間スケーリングされた過渡、正弦及びノイズパラメータを発生する。斯かるパラメータの如何なる好適な時間スケール処理も、本発明を逸脱することなしに適用することができることが分かるであろう。例えば、正弦合成ウィンドウの長さ及びノイズ包絡線を時間スケーリングすることができる。
時間スケールプロセッサ503はモノ信号デコーダ505に結合され、該モノ信号デコーダは時間スケールプロセッサ503から時間スケーリングされた過渡、正弦及びノイズパラメータを入力する。これらに応答して、モノ信号デコーダ505は時間スケーリングされたモノ信号を発生する。上記時間スケーリングされた過渡、正弦及びノイズパラメータは、好ましくは、MPEG4拡張2と互換性のあるパラメータとし、モノ信号デコーダ505は、当業者にとり良く知られた従来のMPEG4拡張2のパラメータ式復号アルゴリズムを特に採用することができる。
即ち、モノ信号デコーダ505は、復号された時間スケーリングされたパルスコード変調(PCM)信号を発生することができる。該時間スケーリングされた信号は、オリジナルに符号化された信号のリアルタイム整列とは異なるリアルタイム整列を有する。例えば、テンポが10%だけ増加されることに対応する時間スケーリングが適用された場合、オリジナルの符号化信号に対して1秒に対応する時間間隔は、時間スケーリングされた信号の0.9秒の時間スケーリングされた時間間隔に対応するであろう。48kHzなる同一のサンプルレートを仮定すると、オリジナルのモノ符号化信号が48000サンプルを有するのに対し、時間スケーリングされた信号は0.9・48000=43200サンプルしか有さないであろう。所与の時間スケーリングされていない時間間隔に対応する時間スケーリングされた時間間隔及びサンプルの数が、適応された時間スケーリングの程度に依存することは明であろう。
上記モノ信号デコーダ505は時間/周波数プロセッサ507に結合され、該時間/周波数プロセッサは時間スケーリングされた信号を入力する。時間/周波数プロセッサ507は、上記時間スケーリングされた信号を、実効的に等数の時間ドメインサンプルに対応する連続した周波数サンプルブロックに変換する。特定の実施例においては、該時間/周波数プロセッサ507は、実効的に、64の時間スケーリングされた信号サンプルの各ブロックを64のサブバンドドメインサンプルのブロックに変換し、これらサブドメインサンプルは次いでブロック毎に処理される。
固定サイズのブロックへのサンプルの該分割は、時間スケールプロセッサ503により適用される時間スケール係数とは独立である。このように、各ブロックは時間スケーリングされた信号の固定の時間間隔に対応する。例えば、48kHzなるサンプルレートの場合、各ブロックは、時間スケーリングの大きさとは無関係に、64/48000Hz=1.33msecの間隔に対応する。しかしながら、関連する時間スケール間隔は時間スケーリングされた信号に対して固定されているので、オリジナルに符号化された信号の対応する時間間隔は、適用される時間スケール係数に依存して変化するであろう。
時間/周波数プロセッサ507は、上記時間スケーリングされた信号の各ブロックに対して周波数サンプルブロックを発生するように動作する。このように、各ブロック処理ステップにおいて、時間/周波数プロセッサ507は、上記時間スケーリングされた信号の64の時間サンプルに対応するような64の周波数サンプルを発生する。しかしながら、時間/周波数プロセッサ507は、周波数サンプルブロックを発生する場合に、これら64の時間サンプル以外のサンプルを含めることができる。
即ち、時間/周波数プロセッサ507は、周波数サンプルブロックを発生するダウンサンプリングされた複素指数変調されたフィルタバンクを有する。
FFT処理と同様に、上記複素指数変調されたフィルタバンクは複素変調された変換を利用する。記載される実施例の複素指数変調されたフィルタバンク(例えば、QMF型フィルタバンク)は、640の入力サンプルを変換に使用して64の出力サンプルを発生する。しかしながら、ブロックステップ(又はホップサイズ)は64サンプルのみである。このように、最初の640の入力サンプルは第1群の64のフィルタされた係数を与え、次いで最後の640−64=576に64の新たな入力サンプルを加えたものが、第2の群の64のフィルタされた係数を発生するために使用され、等々となる。このように、変換自体は現ブロックよりも多くにわたって延びるが、時間スケーリングされた信号の64サンプルの入力ブロックが、結果として64の周波数ドメインサンプルを有する周波数サンプルブロックとなるであろう。
このように、時間スケーリングされた信号の64サンプルの各時間サンプルブロックに対して、時間/周波数プロセッサ507は、図4に示されるように、64の周波数サンプルの周波数サンプルブロックを実効的に発生する。
上記時間/周波数プロセッサ507はパラメータ式ステレオデコーダ509に結合され、該ステレオデコーダは上記周波数サンプルブロック及びパラメータ的ステレオパラメータを入力する。該パラメータ式ステレオデコーダ509は、上記パラメータ的ステレオパラメータに応答して各周波数サンプルブロックを処理し、左及び右チャンネルの周波数ドメイン信号を発生する。
即ち、パラメータ式ステレオデコーダ509は、適切なサブバンドIIDパラメータに応答して個々の周波数サンプルをスケーリングし、ITDパラメータに応答してパラメータを回転する。
上記説明は、簡略化及び明瞭化のために、相関解除された信号の発生無しでのステレオ信号の発生に対して焦点を当てていることが分かるであろう。しかしながら、実際的な適用例においては、当業者により理解されるであろう様に、相関解除された信号の発生及び処理により、改善された品質を達成することができる。即ち、前記モノ信号及び相関解除された信号をICCパラメータに応答して混合することができる。
このように、パラメータ式ステレオデコーダ509は、周波数サンプルステレオブロック発生することができる(又は、等価的に、左及び右チャンネルに対応する2つの周波数ドメインサンプルブロックを発生することができる)。パラメータ式ステレオデコーダ509は、上記周波数サンプルブロックを、適切なMPEG4拡張2と互換性のあるパラメータ式ステレオ復号アルゴリズムに従って処理することができることが分かるであろう。このように、パラメータ式ステレオデコーダ509は、少なくとも第1ステレオチャンネルの周波数サンプルブロックを発生するために、上記周波数サンプルブロックのデータを変更するように動作する。
パラメータ式ステレオデコーダ509は、第1及び第2の周波数/時間プロセッサ511,513に結合されている。第1周波数/時間プロセッサ511は上記の変更された周波数サンプルブロックを入力する。詳細には、第1周波数/時間プロセッサ511は、上記変更された周波数サンプルブロックのうちの左チャンネルに対応するサンプルを入力し、第2周波数/時間プロセッサ513は上記変更された周波数サンプルブロックのうちの右チャンネルに対応するサンプルを入力する。
第1及び第2周波数/時間プロセッサ511、513は、周波数から時間へのドメイン変換を実行し、かくして、左及び右ステレオチャンネルのための時間ドメインサンプルブロックを各々発生する。このようにして、時間スケーリングされたステレオ信号が形成される。
上記パラメータ式ステレオデコーダ509の処理は周波数ドメインのブロック型処理でることが理解されるであろう。64の周波数サブバンドサンプルの各周波数サンプルブロックは、実効的に、前記時間スケーリングされた信号の64の時間サンプルの時間サンプルブロックに対応し、かくして、斯かる周波数サンプルブロックの各々は、上記時間スケーリングされた信号の時間スケール係数とは無関係な時間間隔に関連される。結果として、各周波数サンプルブロックは、オリジナルに符号化された時間スケーリングされていない信号の可変時間間隔に対応する。該スケーリングされていない時間間隔の長さは、時間スケール係数に依存する。
しかしながら、上記パラメータ式ステレオデコーダ509により使用されるステレオイメージパラメータはMPEG4拡張2のビットストリームにおいて受信され、オリジナルの時間スケーリングされていない信号の時間配列に同期されている。このように、パラメータ式ステレオデコーダ509により処理を実行する場合には、パラメータ値及び時間スケーリングされた信号を同期させる必要がある。
一つのオプションは、上記時間スケールに応答してサンプルブロックのサイズを変化させか、又は時間スケール係数に応答して各ブロックに関連する時間スケーリングされた時間間隔を等価的に変化させることにより可変サイズブサンプルロックを使用することである。しかしながら、前述したように、これは複雑な演算を必要とすると共に、特に交互のウィンドウ処理を必要とし、これにより結果として計算的負荷が高くなる。
現実施例においては、時間スケーリングされた信号の固定時間間隔ブロック処理が維持され、代わりに、該固定時間間隔ブロック処理と互換性のあるようなステレオイメージパラメータ値が発生される。このように、時間スケーリングされた信号とブロック型処理との間の時間関係を変更することにより同期させるというよりは、上記固定時間ブロック処理にステレオパラメータを同期させることにより同期化が達成される。
従って、時間スケーリングデコーダ500は、レシーバ501及びパラメータ式ステレオデコーダ509に結合された同期化プロセッサ515を有する。該同期化プロセッサは、レシーバ501から時間スケーリングされていないステレオパラメータを入力するとともに、時間スケーリングされたモノ信号に、従って上記固定サイズブロック処理に同期されたステレオパラメータを発生する。
即ち、同期化プロセッサ515はステレオパラメータ値と周波数サンプルブロックとの間の時間の関連付けを決定するように動作する。簡単な実施例では、上記時間関連づけ処理は、どのサンプル周波数ブロックに当該ステレオパラメータ値が対応するかの指示子を有する。例えば、ステレオパラメータが時間スケーリングされていない信号において64サンプルの16ブロック毎に更新され、時間スケール係数が、64サンプルの上記16個の時間スケーリングされていないブロックが時間スケーリングされた信号の15個のブロックのみに対応するようなものである場合、同期化プロセッサ515は、ステレオパラメータに関連付けられた周波数サンプルブロックを15ブロック毎として単に決定することができる。
本例では、ステレオパラメータ値は15周波数サンプルブロック毎に入力される。他の周波数ブロックのステレオパラメータ値は、入力されたステレオパラメータ値の間を補間することにより計算することができる。このように、どの周波数サンプルブロックに当該ステレオパラメータ値が当てはまるかを決定した後、他の周波数サンプルブロックのパラメータ値は、これらのパラメータ値及び斯かるパラメータ値が属する周波数サンプルブロックのタイミングに応答して決定することができる。
これは、ブロック処理(即ち、スケーリングされていない時間のドメインにおける64サンプルのステップでの)の固定時間間隔に対応する時間スケール係数に特に適した簡単な構成を可能にし得る。しかしながら、典型的には、パラメータ値が属すると考えられる周波数サンプルブロックの時間間隔内での当該ステレオパラメータ値の時間位置を更に示すための時間関連付けを決定することが好ましい。
以下において、この方法を、時間スケーリングされていない信号の16ブロックが14.5ブロックに時間スケーリングされるような時間スケーリングが実行される例により説明する。このように、同一のサンプリング周波数を仮定すると、時間スケールプロセッサ503は符号化されたパラメータを、オリジナルの信号の16・64サンプル=1024サンプルが時間スケーリングされた信号の14.5・64サンプル=934サンプルとなるように修正するように動作する。該例においては、ステレオパラメータの新たな値は、オリジナルの時間スケーリングされていない信号の16ブロック毎、即ち1024サンプル毎に入力される。
図6は、この例に従って時間スケーリングされたパラメータ値を決定する方法をグラフ的に示している。以下においては、ステレオパラメータのための時間指示は、関連する周波数サンプルブロックの時間間隔に関して与えられる。このように、図6の例では、最初の周波数サンプルブロックは0から1への時間指示に対応し、2番目の周波数サンプルブロックは1から2への時間間隔に対応し、等々となる。初期パラメータ値は時点1.5において入力される。スケーリングされた時間ドメインにおけるパラメータ間のスケーリングされた時間オフセットは14.5ブロックであり、次のパラメータ値の対応する時点は、図6に示されるように、1.5+14.5=16と計算することができる。このように、ステレオパラメータ値は時点1.5及び時点16において分かり、従って、間に入る周波数サンプルブロックに適した適切なステレオパラメータ値は簡単な補間により決定することができる。例えば、時点1.5におけるパラメータ値がxであり、時点16におけるパラメータ値がxであるなら、3番目の周波数ブロック(時点2.5に対応する)に対する適切なパラメータ値は、
Figure 2007519967
から計算することができる。
より一般的には、複素指数変調フィルタバンクに基づくパラメータ式ステレオデコーダにおいては、ステレオサブバンド信号は典型的には、
Figure 2007519967
なる式により構成され、ここで、信号mk(n)及びdk(n)はサブバンドインデックスkに対する複素値サブバンドドメインモノ及び相関解除された信号を表し、nはサブバンドサブバンドインデックスを表し、マトリクスH11(k,n), H12(k,n), H21(k,n)及びH22(k,n)はパラメータ操作マトリクスを表す。
前の及び現在の(必ずしも整数ではない)スケーリングされたパラメータ位置は、各々、n^prev及びn^currにより示される。入力されたステレオパラメータに基づいて、ベクトルH11(k,n^curr), H12(k,n^curr), H21(k,n^curr)及びH22(k,n^curr)を計算することができる。
前のステップにおいてH11(k,n^prev), H12(k,n^prev), H21(k,n^prev)及びH22(k,n^prev)が計算されていたら、上記操作マトリクスは、
Figure 2007519967
に対して、
Figure 2007519967
から計算することができる。
従って、該実施例は、時間スケーリングされたモノ信号、従ってパラメータ式ステレオデコーダ509の固定のスケーリングされた時間ドメイン間隔ブロック処理に時間的に整列されたステレオパラメータ値を発生する複雑さの少ない方法を提供することができる。これは、更に、より簡単なドメイン変換関数を使用することができるので、大幅に低減された複雑さも可能にする。
該例において、前述した補間は、入力されたパラメータ値に対して決定された実際の部分的時点を用いて実行された。しかしながら、幾つかの実施例においては、斯かる補間を公称の時点に基づいて実行することが望ましいかも知れない。即ち、これは、当該処理の複雑さの低減を可能にすると共に、特に、複雑で資源を要する乗算又は除算の必要性を低減又は除去することができる。
従って、所与のパラメータ値に対する部分的時点を決定した後、これを、更なる処理のために当該時間間隔内の公称時間位置に関連付けることができる。このように、決定された時間位置は、補間の目的のために、例えば対応する周波数サンプルブロック時間間隔の中間点へのように、最寄りの公称値へシフトすることができる。しかしながら、好ましくは、時点の決定された部分的値が、次のパラメータ値の時点の計算のために使用されるようにする。
特定の例として、時点16.0で発生する図6のパラメータ値を、補間の目的で時点16.5(又は15.5)に移動することができる。このようにして、3番目の周波数サンプルブロック(時点2.5に対応する)に対するパラメータ値の補間は、
Figure 2007519967
から計算することができる。
しかしながら、後続のパラメータ値に対する次の時点の計算は、依然として、正確な値に基づくものであろう。即ち、後続のパラメータは時点16.0+14.5=30.5にあると見なされるであろう。このようにして、正しい平均パラメータ周波数の更新が維持されるであろう。
補間の目的のためのパラメータ値の時間シフトは、異なるサンプル値がパラメータ値に対応する結果となるであろう。しかしながら、上記シフトは典型的には64サンプル未満であるので、斯かるシフトにより可聴アーチファクトが生じることはない。
一般的に、時間スケーリングされたパラメータ値の更新レートが、時間スケーリングされたモノ信号に同期され、これらの間で同期が維持されるのを保証することが重要であることが分かるであろう。しかしながら、僅かな絶対時間オフセット(例えば64サンプル未満の)は、知覚品質に対して無視可能な影響しか有さない。
前の及び現在の(必ずしも整数ではない)パラメータ値の時点をn^prev及びn^currにより各々示すと、非整数パラメータ位置n^prev及びn^currを整数位置nprev及びncurrにマッピングする他の方法は、下記の反復(recursion)により与えられる。Nはブロック内のサンプル数(例えば、64)と仮定する。下記の値が決定される。
Figure 2007519967
ここで、nprevは前の整数位置である。
この場合、現在の整数パラメータ位置は、
Figure 2007519967
のように計算することができる。
上記反復を開始するために、nprev=0とする。
本発明は、ハードウェア、ソフトウェア、ファームウエア又はこれらの如何なる組み合わせをも含む如何なる好適な形態においても実施化することができる。しかしながら、好ましくは、本発明は1以上のデータプロセッサ及び/又はデジタル信号プロセッサ上で動作するコンピュータソフトウェアとして実施化される。本発明の一実施例の構成要素及び成分は、如何なる好適な方法でも物理的に、機能的に及び論理的に構成することができる。確かに、機能は単一のユニットにおいて、複数のユニットにおいて、又は他の機能ユニットの一部として実施化することができる。そのようであるので、本発明は単一のユニット内で実施化することができるか、又は異なるユニット及びプロセッサの間で物理的及び機能的に分散させることができる。
本発明は、好ましい実施例に関連して説明されたが、ここで述べた特定の形態に限定されることを意図するものではない。むしろ、本発明の範囲は添付請求項によってのみ限定されるものである。請求項において、“有する”なる用語は他の要素又はステップの存在を排除するものではない。更に、個々に掲載されているが、複数の手段、要素又は方法のステップは、例えば単一のユニット又はプロセッサにより実施化することができる。加えて、個々のフィーチャは別個の請求項に含まれ得るが、これらは有利に組み合わせることもでき、異なる請求項に含まれることは、フィーチャの組み合わせが可能及び/又は有利ではないということを意味するものではない。更に、単一的参照は複数を排除するものではない。このように、単数表現は複数を排除するものではない。
図1は、従来技術によるMPEG4拡張2のパラメータ式ステレオデコーダの一例を示す。 図2は、従来技術によるMPEG4拡張2の時間スケーリングパラメータ式ステレオデコーダの一例を示す。 図3は、従来技術によるパラメータ式ステレオデコーダを示す。 図4は、周波数サンプルブロックを有する時間/周波数図を示す。 図5は、本発明の一実施例による時間スケーリングデコーダを示す。 図6は、本発明の一実施例による時間スケーリングされたパラメータ値を決定する方法をグラフ的に示す。

Claims (17)

  1. 信号を時間スケーリングする装置において、
    第1信号と拡張データとを有する入力信号を入力する手段と、
    前記第1信号の時間スケーリングされた信号を発生する手段と、
    前記時間スケーリングされた信号に対して複数の周波数サンプルブロックを発生する手段であって、各周波数サンプルブロックが前記時間スケーリングされた信号の固定の時間間隔に対応し、該固定の時間間隔が時間スケール係数とは独立しているような手段と、
    前記拡張データの第1パラメータ値と前記時間スケーリングされた信号の関連する第1時間間隔を有する第1周波数サンプルブロックとの間の第1の時間関連付けを決定する手段と、
    前記第1の時間関連付け及び前記第1パラメータ値に応答して、第2周波数サンプルブロックに関連する第2パラメータ値を決定する手段と、
    前記第2パラメータ値に応答して、前記第2周波数サンプルブロックのデータを変更する手段と、
    前記周波数サンプルブロックから時間ドメインの出力サンプルブロックを発生する手段と、
    を有する装置。
  2. 請求項1に記載の装置において、前記第1の時間関連付けを決定する手段が、前記第1周波数サンプルブロックを、前記第1パラメータ値に関連する時点に対応する関連する時間間隔を持つものとして決定するように動作することを特徴とする装置。
  3. 請求項1に記載の装置において、前記第1の時間関連付けは前記第1時間間隔内のパラメータ値の時点の指示を有することを特徴とする装置。
  4. 請求項1に記載の装置において、前記拡張データの第3パラメータ値と第3周波数サンプルブロックとの間の第2の時間関連付けを決定する手段を更に有し、前記第2パラメータ値を決定する手段が、前記第1パラメータ値、前記第1の時間関連付け、前記第3パラメータ値及び前記第2の時間関連付けに応答して補間を実行することを特徴とする装置。
  5. 請求項4に記載の装置において、前記補間が線形補間であることを特徴とする装置。
  6. 請求項1に記載の装置において、前記第1の時間関連付けを決定する手段が、前記第1の時間関連付けを前の時間関連付けに応答して決定するように動作することを特徴とする装置。
  7. 請求項1に記載の装置において、前記拡張データの連続するパラメータ値の間のスケーリングされた時間オフセットを決定する手段を更に有し、前記第1の時間関連付けを決定する手段が、前のパラメータ値と前記スケーリングされた時間オフセットとに応答して前記第1パラメータ値の時点を決定すると共に、該時点に応答して前記時間関連付けを発生することを特徴とする装置。
  8. 請求項7に記載の装置において、前記第2パラメータ値を決定する手段は、前記時間関連付けに応答して前記第1パラメータ値を前記第1時間間隔内の公称時点に関連付けると共に、前記第1パラメータ値及び前記公称時点に応答して前記第2パラメータ値を決定するように動作することを特徴とする装置。
  9. 請求項8に記載の装置において、前記第2パラメータ値を決定する手段は、前記第2パラメータ値を、前記第1パラメータ値及び前記公称時点に応答する補間に応答して決定することを特徴とする装置。
  10. 請求項1に記載の装置において、前記入力信号がパラメータ符号化オーディオ信号であることを特徴とする装置。
  11. 請求項1に記載の装置において、前記周波数サンプルブロックを発生する手段が、複素指数変調フィルタバンクを有することを特徴とする装置。
  12. 請求項1に記載の装置において、前記拡張データがパラメータ型ステレオデータを有することを特徴とする装置。
  13. 請求項1に記載の装置において、前記第1パラメータ値が、
    a.チャンネル間強度差パラメータ、
    b.チャンネル間時間又は位相差パラメータ、及び
    c.チャンネル間コヒーレンスパラメータ、
    からなる群から選択されたステレオイメージパラメータのパラメータ値であることを特徴とする装置。
  14. 請求項1に記載の装置において、前記変更する手段が、前記第2周波数サンプルブロックのデータを変更して少なくとも第1ステレオチャンネル周波数サンプルブロックを発生するように動作することを特徴とする装置。
  15. 信号を時間スケーリングする方法において、
    第1信号と拡張データとを有する入力信号を入力するステップと、
    前記第1信号の時間スケーリングされた信号を発生するステップと、
    前記時間スケーリングされた信号に対して周波数サンプルブロックを発生するステップであって、各周波数サンプルブロックが前記時間スケーリングされた信号の固定の時間間隔に対応し、該固定の時間間隔が時間スケール係数とは独立しているようなステップと、
    前記拡張データの第1パラメータ値と前記時間スケーリングされた信号の関連する第1時間間隔を有する第1周波数サンプルブロックとの間の第1の時間関連付けを決定するステップと、
    前記第1の時間関連付け及び前記第1パラメータ値に応答して、第2周波数サンプルブロックに関連する第2パラメータ値を決定するステップと、
    前記第2パラメータ値に応答して、前記第2周波数サンプルブロックのデータを変更するステップと、
    前記周波数サンプルブロックから時間ドメインの出力サンプルブロックを発生するステップと、
    を有する方法。
  16. 請求項15に記載の方法の実施を可能にするコンピュータプログラム。
  17. 請求項16に記載のコンピュータプログラムを有する記録担体。
JP2006550386A 2004-01-28 2005-01-14 信号を時間スケーリングする方法及び装置 Pending JP2007519967A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP04100306 2004-01-28
PCT/IB2005/050159 WO2005073958A1 (en) 2004-01-28 2005-01-14 Method and apparatus for time scaling of a signal

Publications (1)

Publication Number Publication Date
JP2007519967A true JP2007519967A (ja) 2007-07-19

Family

ID=34814365

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006550386A Pending JP2007519967A (ja) 2004-01-28 2005-01-14 信号を時間スケーリングする方法及び装置

Country Status (11)

Country Link
US (1) US7734473B2 (ja)
EP (1) EP1711937B1 (ja)
JP (1) JP2007519967A (ja)
KR (1) KR20070001111A (ja)
CN (1) CN1914668B (ja)
AT (1) ATE447226T1 (ja)
BR (1) BRPI0507124A (ja)
DE (1) DE602005017358D1 (ja)
ES (1) ES2335221T3 (ja)
RU (1) RU2381569C2 (ja)
WO (1) WO2005073958A1 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE602005005186T2 (de) * 2004-04-16 2009-03-19 Dublin Institute Of Technology Verfahren und system zur schallquellen-trennung
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US9159333B2 (en) * 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
CN101479788B (zh) * 2006-06-29 2012-01-11 Nxp股份有限公司 声音帧长度适配
US8571875B2 (en) 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
EP2118887A1 (en) * 2007-02-06 2009-11-18 Koninklijke Philips Electronics N.V. Low complexity parametric stereo decoder
KR20080073925A (ko) * 2007-02-07 2008-08-12 삼성전자주식회사 파라메트릭 부호화된 오디오 신호를 복호화하는 방법 및장치
US8401865B2 (en) 2007-07-18 2013-03-19 Nokia Corporation Flexible parameter update in audio/speech coded signals
CN103474076B (zh) * 2008-10-06 2017-04-12 爱立信电话股份有限公司 用于输送对齐的多通道音频的方法和设备
EP2650877B1 (en) * 2008-10-06 2016-04-06 Telefonaktiebolaget LM Ericsson (publ) Method and apparatus for delivery of aligned multi-channel audio
EP2214161A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal
TWI559679B (zh) * 2009-02-18 2016-11-21 杜比國際公司 低延遲調變濾波器組及用以設計該低延遲調變濾波器組之方法
TWI516138B (zh) * 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
CN103098131B (zh) * 2010-08-24 2015-03-11 杜比国际公司 调频立体声无线电接收器的间歇单声道接收的隐藏
CN103155030B (zh) * 2011-07-15 2015-07-08 华为技术有限公司 用于处理多声道音频信号的方法及设备
JP6113294B2 (ja) * 2012-11-07 2017-04-12 ドルビー・インターナショナル・アーベー 軽減された計算量の変換器snr計算
WO2014170530A1 (en) * 2013-04-15 2014-10-23 Nokia Corporation Multiple channel audio signal encoder mode determiner
US9686609B1 (en) * 2013-06-28 2017-06-20 Avnera Corporation Low power synchronous data interface
CN104347077B (zh) * 2014-10-23 2018-01-16 清华大学 一种立体声编解码方法
JP6763194B2 (ja) * 2016-05-10 2020-09-30 株式会社Jvcケンウッド 符号化装置、復号装置、通信システム
US10210874B2 (en) * 2017-02-03 2019-02-19 Qualcomm Incorporated Multi channel coding

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001255894A (ja) * 2000-03-13 2001-09-21 Sony Corp 再生速度変換装置及び方法
JP2002268700A (ja) * 2001-03-09 2002-09-20 Canon Inc 音響情報符号化装置及び復号装置及び方法及びコンピュータプログラム及び記憶媒体

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5175769A (en) * 1991-07-23 1992-12-29 Rolm Systems Method for time-scale modification of signals
US5828994A (en) * 1996-06-05 1998-10-27 Interval Research Corporation Non-uniform time scale modification of recorded audio
JP3465628B2 (ja) * 1999-05-06 2003-11-10 ヤマハ株式会社 オーディオ信号の時間軸圧伸方法及び装置
JP3430968B2 (ja) * 1999-05-06 2003-07-28 ヤマハ株式会社 ディジタル信号の時間軸圧伸方法及び装置
US6278387B1 (en) * 1999-09-28 2001-08-21 Conexant Systems, Inc. Audio encoder and decoder utilizing time scaling for variable playback
US6842735B1 (en) * 1999-12-17 2005-01-11 Interval Research Corporation Time-scale modification of data-compressed audio information
US7610205B2 (en) * 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7079905B2 (en) * 2001-12-05 2006-07-18 Ssi Corporation Time scaling of stereo audio
US7239999B2 (en) * 2002-07-23 2007-07-03 Intel Corporation Speed control playback of parametric speech encoded digital audio
US6982377B2 (en) * 2003-12-18 2006-01-03 Texas Instruments Incorporated Time-scale modification of music signals based on polyphase filterbanks and constrained time-domain processing

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001255894A (ja) * 2000-03-13 2001-09-21 Sony Corp 再生速度変換装置及び方法
JP2002268700A (ja) * 2001-03-09 2002-09-20 Canon Inc 音響情報符号化装置及び復号装置及び方法及びコンピュータプログラム及び記憶媒体

Also Published As

Publication number Publication date
RU2381569C2 (ru) 2010-02-10
EP1711937B1 (en) 2009-10-28
BRPI0507124A (pt) 2007-06-19
RU2006127273A (ru) 2008-02-10
ATE447226T1 (de) 2009-11-15
EP1711937A1 (en) 2006-10-18
WO2005073958A1 (en) 2005-08-11
US7734473B2 (en) 2010-06-08
US20090192804A1 (en) 2009-07-30
ES2335221T3 (es) 2010-03-23
KR20070001111A (ko) 2007-01-03
DE602005017358D1 (de) 2009-12-10
CN1914668A (zh) 2007-02-14
CN1914668B (zh) 2010-06-16

Similar Documents

Publication Publication Date Title
JP2007519967A (ja) 信号を時間スケーリングする方法及び装置
CN108885879B (zh) 使用帧控制同步来编码或解码多声道音频信号的装置和方法
JP6185592B2 (ja) 空間オーディオオブジェクト符号化における信号依存ズーム変換のためのエンコーダ、デコーダおよび方法
JP4834539B2 (ja) オーディオ信号合成
RU2550525C2 (ru) Аппаратный блок, способ и компьютерная программа для преобразования расширения сжатого аудио сигнала с помощью сглаженного значения фазы
JP6285939B2 (ja) 後方互換性のある多重分解能空間オーディオオブジェクト符号化のためのエンコーダ、デコーダおよび方法
JP2018182757A (ja) オーディオ信号を処理するための方法、信号処理ユニット、バイノーラルレンダラ、オーディオエンコーダおよびオーディオデコーダ
CN105378832B (zh) 解码器、编码器、解码方法、编码方法和存储介质
JP2014038347A (ja) 通信システムにおける隠蔽フレームの生成方法
MXPA06008450A (en) Savoury food composition comprising low-trans triglyceride fat composition

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110405

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110705

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110712

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120508