JP4950040B2 - マルチチャンネルオーディオ信号を符号化及び復号する方法及び装置 - Google Patents

マルチチャンネルオーディオ信号を符号化及び復号する方法及び装置 Download PDF

Info

Publication number
JP4950040B2
JP4950040B2 JP2007516134A JP2007516134A JP4950040B2 JP 4950040 B2 JP4950040 B2 JP 4950040B2 JP 2007516134 A JP2007516134 A JP 2007516134A JP 2007516134 A JP2007516134 A JP 2007516134A JP 4950040 B2 JP4950040 B2 JP 4950040B2
Authority
JP
Japan
Prior art keywords
signal
component
prediction
generating
residual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007516134A
Other languages
English (en)
Other versions
JP2008503767A (ja
Inventor
ブリンケル アルベルトゥス シー デン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2008503767A publication Critical patent/JP2008503767A/ja
Application granted granted Critical
Publication of JP4950040B2 publication Critical patent/JP4950040B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

本発明は、マルチ信号エンコーダ、マルチ信号デコーダ及びそのための方法に関し、専らではないが特にはステレオオーディオ信号の符号化に関する。
近年、デジタル形態のコンテンツ信号の分配及び記憶が大幅に増加している。従って、多数の符号化規格及びプロトコルが開発された。
オーディオ信号のデジタルオーディオ符号化用の最も普及した符号化規格の1つは、一般的にMP3と呼ばれる動画専門家グルーブレベル3である。一例として、MP3は歌の30又は40メガバイトのデジタルPCM(パルス符号変調)オーディオ記録が、3又は4メガバイトのMP3ファイルに圧縮されるのを可能にする。正確な圧縮率は、MP3符号化オーディオの所望の品質に依存する。
MP3のようなオーディオ符号化及び圧縮技術は、相対的に小さなデータサイズで高品質なオーディオファイルがインターネット等のデータネットワークを介して便利に配信されるのを可能にするような非常に効率的なオーディオ符号化を提供する。
多くの符号化プロトコルが、ステレオチャンネルの効率的な符号化を提供する。ステレオ符号化は、冗長性及び無関連性をステレオ信号から除去して、所与の品質レベルに対して別個のチャンネルのビットレートの和よりも低いビットレートを得ることを狙いとする。
多数の異なるステレオ符号化アルゴリズム及び技術が知られている。一つ技術は、強度ステレオ符号化(Intensity stereo coding)として知られている。強度ステレオ符号化は、オーディオチャンネルの独立的符号化と比較して、ビットレートの大幅な低減を可能にする。強度ステレオにおいては、当該信号の一層高い周波数範囲に対してモノオーディオ信号が発生される。更に、異なるチャンネルに対して別個の強度パラメータが発生される。典型的には、斯かる強度パラメータは、デコーダにおいてモノオーディオ信号から左及び右の出力信号を発生するために使用される左及び右のスケール係数の形態である。変形例は、単一のスケール係数及び指向性(directional)パラメータの使用である。
しかしながら、強度ステレオ符号化技術は幾つかの不利な点を有している。先ず、エンコーダは、より高い周波数に対して時間及び位相情報を破棄してしまう。従って、デコーダは元のオーディオ題材に存在する時間又は位相のチャンネル差を再生することができない。更に、通常、符号化はオーディオチャンネル間の相関を保存することができない。従って、エンコーダにより発生されるステレオ信号の品質劣化を避けることができない。
他の技術はMid/Side(MS)符号化として知られており、該符号化においては、Mid信号成分は左及び右のチャンネル信号を加算することにより発生することができ、Side信号は左及び右のチャンネル信号を減算することにより発生することができる。左及び右信号の間の相関は典型的には高いので、この結果、Mid信号成分の信号エネルギが高くなり、Side信号の信号エネルギは低くなる。次いで、Mid及びSide信号は異なる符号化パラメータを使用して符号化され、この場合においてSide信号の符号化は典型的には該符号化がSide信号のデータレートを減少させるようなものである。
MS符号化の不利な点は、MS符号化のビットレート効率が一般的に例えば強度ステレオ符号化よりも著しく低く、これによりデータレートが増加する結果となる点である。最悪の場合の状況では、MS符号化は、左及び右チャンネルの独立符号化と比較して、如何なるビットレートの利得も提供しない。
他のステレオ符号化技術は、線形予測技術として知られており、該技術においては左及び右のチャンネルが複素信号に線形に合成される。この場合、複素信号を予測するために複素線形予測フィルタが使用され、結果としての残存信号が符号化される。このようなエンコーダの一例は、1997年4月ドイツ国、ミュンヘン、Proceedings of ICASSP-97の第323-326のHarma、Laine及びKarjalainenによる"An experimental audio codec based on warped linear prediction of complex valued signals"なる文献に示されている。
現在の線形予測の提案に関連する問題は、左及び右チャンネルの複素信号への合成が左及び右チャンネルの時間的関連付けを課し、これが結果として予測に対する利用可能な自由度の限界となる点にある。従って、予測は、冗長情報の最大限の除去を達成することはできない。更に、斯かる技術は、符号化を個々に最適化することが可能なメイン及びサイド信号を識別し又は構築することはない。更に、使用される予測評価値は簡単な予測フィルタ処理に基づくものであり、これは最適な予測とはならない。従って、所与の信号品質に対して達成可能なデータレートは最適ではない。
別の符号化技術は、周波数帯域又は副帯域(サブバンド)の回転を利用する。このような技術においては、左及び右チャンネルのための複数のサブバンド信号を発生するために帯域フィルタを使用することができる。一方のチャンネルの各副帯域は他方のチャンネルの副帯域と対にされ、主成分分析が実行される。エンコーダにおいては、回転により副帯域毎のメイン及びサイド信号を発生するために、副帯域毎のパラメータが適用される。斯かるパラメータは、デコーダが逆処理を適用することができるように、データストリームにも記憶される。
このようなローテータ(rotator)技術の問題点は、左及び右信号の間の可能性のある時間差を考慮に入れず、従って最適な性能を達成しない点にある。第2に、オーバーラップ加算の分析及び合成により、信号量子化がない場合でさえ、サブバンド信号の完全な再生は可能ではない。
現在のところ、低データレートのステレオ符号化にとり最も有望な技術は、符号化データレートを低減するために知覚的モデル及び情報が使用されるような知覚的ステレオ符号化であると思われる。このように、元のステレオ信号の波形に可能な限り近いものを表すように試みるというより、知覚的ステレオ符号化は、デコーダがユーザにとり結果的に同一のオーディオ知覚となるような出力信号を発生するために使用することができるような信号を発生することを狙いとする。
この方法に固有の問題点は、信号量子化がなくても元の信号を完全に再生することができない点にある。これは、特に、分析及び合成系において使用されるオーバーラップ加算手順によるものであり得る。従って、高データレート用途の場合、知覚的ステレオ符号化の性能は、低品質の再生信号を形成する傾向がある。
従って、マルチチャンネル符号化及び/又は復号のための改善されたシステムが有益であり、特に、増加された柔軟性、低減されたデータレート、増加された品質及び/又は低減された複雑さを可能にするようなシステムが有益であろう。即ち、高データレートにおける高信号品質及び低データレートにおける効率的符号化を可能にする様なシステムが有益であろう。
従って、本発明は好ましくは前述した不利な点の1以上を単独で又は組み合わせで緩和、軽減又は除去することを目指すものである。
本発明の第1の態様によれば、少なくとも第1信号成分及び第2信号成分を有するマルチチャンネル信号を符号化する信号エンコーダであって、該信号エンコーダが、前記第1信号成分及び第2信号成分の音響心理学特性に関連する線形予測により前記第1信号成分の第1残存信号及び前記第2信号成分の第2残存信号を発生する予測手段と、前記第1残存信号及び第2残存信号を有する合成信号の回転によりメイン信号及びサイド信号を発生する回転手段であって、前記メイン信号が前記サイド信号より高い信号エネルギを有するような回転手段と、前記メイン信号を符号化して符号化メインデータを発生する第1符号化手段と、前記符号化メインデータを有する出力信号を発生する出力手段とを有するような信号エンコーダが提供される。
本発明は、所与のデータレートにおいて改善された品質を、及び/又は所与の品質レベルに対して低減されたデータレートを提供することができる。代替的に又は付加的に、本発明は、一連のデータレートにわたって改善された柔軟性及び/又は改善された性能を有するような信号エンコーダを提供することができる。特に、本発明は、低データレートでの効率的符号化に適したメイン及びサイド信号を発生することができる一方、高データレートにおいては元の信号の波形の正確な表現を可能にするような符号化方法を提供することができる。
本発明は、個々の符号化方法に関連する欠点を克服するために異なる符号化方法の利点が組み合わされるのを可能にすることができる。特に、本発明は、予測に対する自由度の数を増加させ、これにより残存信号の大きさを低減させることができる。更に、オーディオ信号に対する改善された予測を、音響心理学的特性に基づく予測を用いることにより達成することができる。斯かる音響心理学的特性は、ユーザによるオーディオ信号の知覚を示す。改善された予測及び回転の組み合わせは、所与の品質レベルに対してデータレートを減少させることができ、特に、個々の信号の特性に固有に適したアルゴリズムにより個々に符号化することができるようなメイン信号及びサイド信号を発生することができる。
特に、本発明の一実施例は、信号量子化がない場合に実質的に完全な信号の再生を、従って高データレートに対して完全に近い信号再生を可能にするような信号エンコーダを提供する。同一の信号エンコーダが、低データレート符号化に対して有利であり得るパラメータ的知覚ステレオ符号化により提供されるものと同様のメイン及びサイド信号を構築することもできる。
上記メイン信号の符号化は、例えば、該メイン信号の符号化を含み得る。前記出力手段は、好ましくは、出力信号に線形予測の回転パラメータ及び/又は予測パラメータを更に含むように動作可能とする。
本発明の好ましいフィーチャによれば、当該信号エンコーダは、前記サイド信号を符号化して符号化サイドデータを発生する第2符号化手段を更に有し、前記出力手段は前記出力信号に該符号化サイドデータを含めるように更に動作可能である。
これは、低データレートを維持しながら、デコーダが高品質を有する信号を再生するのを可能にし得る。
前記符号化メインデータ信号のデータレートは、好ましくは、符号化サイドデータのデータレートよりも高い。好ましくは、符号化メインデータのサンプルレートが符号化サイド信号のサンプルレートよりも高い、及び/又は符号化メインデータの量子化が符号化サイド信号に対するより細かいようにする。
本発明の好ましいフィーチャによれば、前記第2符号化手段はサイド信号をパラメータ的に符号化するよう動作する。これは効率的符号化を提供することができ、結果として所与の品質レベルに対して出力信号のデータレートが低くなる。
本発明の好ましいフィーチャによれば、前記予測手段は少なくとも1つの音響心理学型フィルタシステムを有する。
これは、効率的予測性能を提供し、及び/又は実施化を容易化し得る。上記音響心理学型フィルタシステムは、例えばカウツフィルタバンク(Kautz filter bank)、ラゲールフィルタバンク(Lagguerre filter bank)、タップ型オールパスライン(tapped allpass line)又はガンマトーンフィルタバンク(Gamma-tone filter bank)とすることができる。
本発明の好ましいフィーチャによれば、前記回転手段は前記合成信号を前記メイン信号の信号エネルギを実質的に最大化するように回転するよう動作する。これは、マルチチャンネル信号の効率的符号化を提供し得る。特に、これはメイン信号における情報を増加させ、これにより該メイン信号の正確な符号化を可能にして高度の情報を維持することができる。
本発明の好ましいフィーチャによれば、前記回転手段は前記合成信号を前記サイド信号の信号エネルギを実質的に最小化するように回転するよう動作する。これは、マルチチャンネル信号の効率的符号化を提供し得る。特に、これは上記サイド信号の相対的情報含有量を減少させ、これにより、該サイド信号の損失性符号化の結果としての出力信号に対する劣化が減少されるのを可能にすることができる。特に、サイド信号が破棄されるような実施例では、これに関連する品質劣化を減少させることができる。
本発明の好ましいフィーチャによれば、前記予測手段は、第1信号成分に対する第1推定信号を第1信号成分に応答して発生する第1予測器と、第1信号成分に対する第2推定信号を第2信号成分に応答して発生する第2予測器と、第1残存信号を第1推定信号及び第2推定信号により減算された第1信号成分として発生する手段とを有する。
これは、適切な実施化を提供することができ、及び/又は結果的に正確な予測に、従って出力信号の品質レベルとデータレートとの間の改善された比になり得る。特に、該フィーチャは、第1信号成分に及び第2信号成分に基づいた第1信号成分の独立した予測を可能にし得る。第1及び第2予測器は、特に、結果的に異なる時間的予測を生じ得る。第1推定信号と第2推定信号との間の時間的独立性は、予測に対する自由度を増加させ、結果として性能が改善される。
第1及び/又は第2予測器の各々は、有限インパルス応答(FIR)又は無限インパルス応答(IIR)フィルタを有することができ、特に音響心理学型フィルタバンクを有することができる。
本発明の好ましいフィーチャによれば、前記予測手段は、第2信号成分に対する第3推定値を第1信号成分に応答して発生する第3予測器と、第2信号成分に対する第4推定信号を第2信号成分に応答して発生する第4予測器と、第2残存信号を第3推定信号及び第4推定信号により減算された第2信号成分として発生する手段とを有する。
これは、適切な構成を提供することができ、及び/又は結果的に正確な予測に、従って出力信号の品質レベルとデータレートとの間の改善された比になり得る。
第3及び/又は第4予測器の各々は、有限インパルス応答(FIR)又は無限インパルス応答(IIR)フィルタを有することができ、特に音響心理学型フィルタバンクを有することができる。
本発明の好ましいフィーチャによれば、前記ローテータは前記合成信号に対してマトリクス乗算を実行するよう動作する。これは、適切な構成を提供することができる。
本発明の好ましいフィーチャによれば、当該信号エンコーダは、第1信号成分及び第2信号成分のスペクトル特性に応答して、前記メイン信号をスペクトル的に整形する手段を更に有する。好ましくは、前記第1符号化手段は、音響心理学型モノエンコーダを有する。この結果として、出力信号の品質レベルとデータレートとの間の比が改善され得る。
前記マルチチャンネル信号は、如何なる複数の信号成分も有することができるが、好ましくは、該マルチチャンネル信号はステレオオーディオ信号とする。
本発明の第2の態様によれば、マルチチャンネル信号を復号する信号デコーダであって、該信号デコーダが、
マルチチャンネル信号を入力する入力手段と、
該マルチチャンネル信号の回転により第1残存信号及び第2残存信号を発生する回転手段と、
出力マルチチャンネル信号を、第1残存信号及び第2残存信号に応答して音響心理学的特性に関連する線形予測により発生する合成手段と、
を有するような信号デコーダが提供される。
本発明の第3の態様によれば、少なくとも第1信号成分と第2信号成分とを有するマルチチャンネル信号を符号化する方法であって、該方法が、前記第1信号成分及び第2信号成分の音響心理学特性に関連する線形予測により前記第1信号成分の第1残存信号及び前記第2信号成分の第2残存信号を発生するステップと、前記第1残存信号及び第2残存信号を有する合成信号の回転によりメイン信号及びサイド信号を発生するステップであって、前記メイン信号が前記サイド信号より高い信号エネルギを有するようなステップと、前記メイン信号を符号化して符号化メインデータを発生するステップと、前記符号化メインデータを有する出力信号を発生するステップとを有するような方法が提供される。
本発明の第4の態様によれば、マルチチャンネル信号を復号する方法であって、該方法が、マルチチャンネル信号を入力するステップと、該マルチチャンネル信号の回転により第1残存信号及び第2残存信号を発生するステップと、出力マルチチャンネル信号を、第1残存信号及び第2残存信号に応答して音響心理学的特性に関連する線形予測により発生するステップとを有するような方法が提供される。
本発明の第5の態様によれば、マルチチャンネル信号のための符号化データを有するデータストリームであって、該データストリームが、前記マルチチャンネル信号の第1信号成分及び第2信号成分の線形予測を示す線形予測パラメータと、メイン信号と前記第1信号成分の線形予測に関連する第1残存信号及び第2信号成分の線形予測に関連する第2残存信号を有する合成信号との間の回転値を示す回転パラメータと、前記メイン信号の符号化メインデータとを有するようなデータストリームが提供される。
本発明の、これら並びに他の態様、フィーチャ及び利点は、以下に説明する実施例から明らかとなり、斯かる実施例を参照して解説されるであろう。
以下、本発明の実施例を、図面を参照して例示のみとして説明する。
以下の説明は、ステレオオーディオ信号用のエンコーダ及びデコーダに適用可能な、本発明の一実施例に焦点を絞る。しかしながら、本発明は斯かる適用例に限定されるものではなく、多くの他のマルチチャンネル信号に適用することができると理解されるであろう。
図1は、本発明の一実施例によるエンコーダ100に関するブロック図の一例を示す。
エンコーダ100は、第1信号成分x(記載される該実施例では左チャンネル信号である)及び第2信号成分x(記載される該実施例では右チャンネル信号である)を有するステレオ信号を入力する。第1及び第2信号成分x,xは予測プロセッサ101に供給され、該予測プロセッサは斯かる第1及び第2信号成分x,xの線形予測により上記第1信号成分の第1残存信号e及び上記第2信号成分の第2残存信号eを発生する。
第1及び第2信号成分x,xは更に予測パラメータプロセッサ103にも供給され、該予測パラメータプロセッサは予測プロセッサ101により実行される線形予測のための最適な予測係数を決定する。従って、該予測パラメータプロセッサ103は、予測プロセッサ101に結合されると共に、決定された予測パラメータを該予測プロセッサに供給する。予測パラメータプロセッサ103は、当業者によりよく知られている線形回帰(linear regression)等の既知の最適化アルゴリズムを用いて上記予測パラメータを決定することができる。
予測パラメータプロセッサ103は、更に、スペクトル平滑化(ピーク拡幅としても知られている)及び予測パラメータの補間等の他の標準的線形予測演算も実行することができる。典型的には、予測パラメータプロセッサ103はパラメータの量子化も含むであろう。
予測パラメータプロセッサ103から入力された予測パラメータに基づいて、予測プロセッサ101は現在の左及び右チャンネルサンプルの期待値を発生すると共に、これを第1及び第2信号成分x,xの実際の値から減算する。従って、予測プロセッサ101は、第1及び第2信号成分x,xの予測値と実際の値との間の差に対応するような第1及び第2残存信号e,eを発生する。残存信号e,eの値は、典型的には、前記第1及び第2信号成分の値より大幅に小さい値である。
予測プロセッサ101は、人によるオーディオの知覚を考慮に入れた線形予測を実行するように動作する。かくして、該線形予測は音響心理学的特性に関連づけられる。例えば、該線形予測は、異なる周波数範囲における人の耳の感度、音量レベルに対するインパルス性能及び感度等を考慮に入れることができる。該線形予測が音響心理学的特性に依存してパラメータを修正若しくは変更することができるか、又は音響心理学的特性を例えば予測プロセッサ101の設計及び実施化の固有の一部とすることもできる。例えば、使用されるアルゴリズムは、人の聴覚の音響心理学的モデルを反映するように選択することができる。特に、予測プロセッサ101は、カウツフィルタバンク(Kautz filter bank)、ラゲールフィルタバンク(Laguerre filter bank)又はガンマトーンフィルタバンク(Gamma-tone filter bank)等の1以上の音響心理学型予測システムを使用することができる。
予測プロセッサ101は回転プロセッサ105に結合され、該回転プロセッサは第1残存信号e及び第2残存信号eを有する合成信号の回転によりメイン信号及びサイド信号を発生する。予測プロセッサ101は更に回転係数プロセッサ107にも結合され、該回転係数プロセッサは回転プロセッサ105により使用される回転係数を決定する。特定の実施例では、上記合成信号はe+j・eに対応する複素信号とみなすことができ、該複素信号は複素回転値a+j・bにより乗算され、かくして、
Figure 0004950040
により与えられるメイン及びサイド信号が得られる。
等価的に、回転係数プロセッサ107は角度値αを発生することができ、該角度値は回転プロセッサ105により実行される下記のマトリクス計算に使用することができる。
Figure 0004950040
当該実施例では、回転係数プロセッサ107は回転パラメータをメイン信号がサイド信号より高い信号エネルギを有するように決定する。これは、一般的に、メイン信号の信号値がサイド信号の信号値より大きくなり、これにより、メイン信号への情報の集中を行うのを可能にする。これは、より効率的な符号化を可能にする。即ち、サイド信号の量子化及び/又はサンプルレートを大幅に低減することができる。幾つかの実施例では、サイド信号を完全に破棄することさえもできる。
記載された実施例では、回転係数プロセッサ107は回転パラメータを、上記信号エネルギがメイン信号に対して最大化される及び/又はサイド信号に対して最小化されるように決定する。例えば、角度値αは、メイン信号が最大化され、サイド信号が最小化されるように決定される。
回転プロセッサ105は符号化プロセッサ109に結合され、該符号化プロセッサは上記メイン及びサイド信号を符号化して符号化メインデータ及び好ましくは符号化サイドデータを発生する。上記メイン及びサイド信号を符号化する如何なる好適な手段も使用することができることが理解されるであろう。簡単な実施例においては、符号化プロセッサ109は、単に、メイン及びサイド信号の個々の量子化によりメイン及びサイド信号に関する量子化データ(b,b)を発生するような量子化器を有する。
幾つかの実施例では、上記サイド信号はパラメータ的に符号化され、これにより、当該サイド信号の波形を記述する信号データ値を含めるというよりは、当該サイド信号の1以上の特性を記述する1以上のパラメータが含められる。これは、サイド信号の非常に効率的且つ低データレートの符号化を可能にする。
符号化プロセッサ109は出力プロセッサ111に結合され、該出力プロセッサは上記の符号化メインデータ及び好ましくは上記符号化サイドデータを有する出力信号を発生する。加えて、記載された実施例の出力プロセッサ111は、前記線形予測に使用された予測パラメータ及び回転パラメータも含む。従って、前記ステレオ信号を表す単一のビットストリームが発生される。
音響心理学的パラメータに基づく線形予測と結果的残存信号の回転との組み合わせは、大きな柔軟性を持つ高度に効率的な符号化を提供する。特に、メイン及びサイド信号の発生は、より低データレートでの高度に効率的な符号化を提供し得る。更に、高いデータレートでは、当該エンコーダは、元の信号を非常に正確に再生することができるようなビットストリームを発生する。
図2は、本発明の一実施例によるデコーダ200のブロック図の一例を示す。該デコーダは、図1のエンコーダからのビットストリームを復号することができ、これを参照して説明する。
デコーダ200は受信器201を有し、該受信器はエンコーダ100からマルチチャンネル信号を、該エンコーダ100により発生されたビットストリームの形態で入力する。受信器201はデマルチプレクサを有し、該デマルチプレクサは上記ビットストリームのデータを分離し、これらを当該デコーダ200の適切な機能ブロックに供給するよう動作する。
デコーダ200はデコーダプロセッサ203を有し、該デコーダプロセッサは上記ビットストリームから前記メイン及びサイド信号を発生する。特に、受信器201は符号化メイン及びサイドデータb,bをデコーダプロセッサ203に供給し、該デコーダプロセッサは図1のエンコーダ100における符号化プロセッサ109の相補的動作を実行する。符号化プロセッサ109が回転プロセッサ105からのデータ値を単に量子化するような簡単な実施例では、デコーダプロセッサ203は符号化メイン及びサイドデータで入力された量子化値を単に送出する。
デコーダ200は更に復号回転プロセッサ205を有し、該復号回転プロセッサはデコーダプロセッサ203に結合されている。デコーダプロセッサ203は入力されたメイン及びサイド信号を復号回転プロセッサ205に供給し、該復号回転プロセッサは上記メイン及びサイド信号の回転により第1残存信号e及び第2残存信号eを再生する。特に、復号回転プロセッサ205は下記のマトリクス演算を実行することができる。
Figure 0004950040
従って、復号回転プロセッサ205には受信器201から値αが供給される。
復号回転プロセッサ205は予測デコーダ207に結合されている。該予測デコーダ207は、線形予測フィルタ処理により、当該マルチチャンネル信号の第1信号成分に対する第1予測信号及び該マルチチャンネル信号の第2信号成分に対する第2予測信号を発生する。第1及び第2予測信号は、前記残存信号を発生するために予測プロセッサ101により使用された予測信号に対応するように発生される。特に、復号される信号に基づいて同一の予測アルゴリズムを使用することができる。従って、予測デコーダ207は受信器201から予測パラメータαを入力する。
前記エンコーダと同様に、当該線形予測フィルタ処理は、聴取者の音響心理学的知覚の特性を表す予測フィルタのように、適切な音響心理学的特性に基づくものである。
第1予測信号及び第1残存信号eに基づき、予測デコーダ207により第1信号成分xが再生される。同様に、第2信号成分xが第2予測信号及び第2残存信号に基づいて発生される。
上記説明は入力されるデータストリームに予測パラメータ及び回転パラメータが含まれるような構成に焦点を絞っているが、これは本発明の必須のフィーチャではないことが理解されるであろう。
例えば、幾つかの実施例では、これらの値は逆方向適応型アルゴリズムを用いて構築することができる。
以下においては、図1のエンコーダ100の態様を更に詳細に説明する。
図3は、本発明の一実施例による線形予測及び回転手段の構成を示している。即ち、該図は図1の予測プロセッサ101及び回転プロセッサ105の実施例を示している。
第1及び第2信号成分x,xは予測プロセッサ101に入力され、該予測プロセッサは出力信号e,eを発生する2チャンネル予測器である。
該実施例において、予測プロセッサ101は4つの予測器301,303,305,307を有し、各予測器は第1及び第2信号成分x,x並びに第1及び第2予測信号の4つの可能性のある組み合わせのうちの1つに対応する。
従って該実施例では、予測プロセッサ101は、第1信号成分に応答して該第1信号成分に対する第1推定信号を発生する第1予測器301と、第2信号成分に応答して第1信号成分に対する第2推定信号を発生する第2予測器303と、第1信号成分に応答して第2信号成分に対する第3推定信号を発生する第3予測器305と、第2信号成分に応答して該第2信号成分に対する第4推定信号を発生する第4予測器307とを有する。
該実施例において、上記予測器の各々は、カウツフィルタバンク、ラゲールフィルタバンク、タップ型オールパスライン又はガンマトーンフィルタ等の音響心理学型予測システムである。ラゲールフィルタバンク又はタップ型オールパスラインにおけるオールパスフィルタは、Smith and Abel "Bark and ERB bilinear transform" IEEE Trans. Speech and Audio Processing, Vol. 7, pp.697-708, 1999に開示されているように、バークスケール(Barkscale)又はERBスケール等の音響心理学的関連周波数スケールに類似したワープ周波数スケール(warped frequency scale)に従ってとることができる。カウツ又はガンマトーン・フィルタバンクにおいては、フィルタ伝達は、中心周波数及び帯域幅が音響心理学的実験において見いだされるものと定性的に類似するように選択することができる。
オーディオ及び音声符号化目的の場合、音響心理学的特性に関連する予測フィルタの使用は、タップ型遅延線フィルタ処理に基づく従来の予測アルゴリズムと比較して、改善された品質を提供する。
予測プロセッサ101は、更に、第1残存信号eを第1推定信号及び第2推定信号により減算された第1信号成分xとして発生する第1加算器(減算器)309と、第2残存信号eを第3推定信号及び第4推定信号により減算された第2信号成分xとして発生する第2加算器311とを有している。従って、残存信号e,eは前記元の信号成分と前記合成信号との間の差に対応する。
予測プロセッサ101の2チャンネル系の伝達は、定常状態では、
Figure 0004950040
により記述することができ、ここで、Pn,m(z)は個々の予測フィルタの伝達関数である。
上記予測フィルタ用の予測パラメータは個々に決定することができるので、当該予測に対する多数の自由度が得られる。特に、第1及び第2信号成分x,xの間の時間的な仮定又は関連付けは課されない又は仮定されず、これは、複素予測フィルタが複素信号x+j・xに対して使用される場合と対照的である。
予測フィルタに対する特定のフィルタ構成が図4に示されている。一実施例の予測フィルタの伝達関数は、
Figure 0004950040
として、即ち係数αm (k,l)により加重され、総和器で加算された複数のフィルタHm (k,l)が後続するような前置フィルタHとして書くことができる。
対称的な考えに鑑みて、H0 (k,l)=H0 (l,k)及びHm (k,l)=Hm (l,k)とするのが有利である。複雑さを低減するために、H0 (k,l)=H0 (k,k)=H及びHm (k,l)=Hm (k,k)=Hと設定し、
Figure 0004950040
なる伝達関数となる。
上記フィルタH〜Hは、Hにより示され、1つの入力とM個の出力とを有するフィルタバンクを形成する。
このように、本例では、第1及び第2信号成分x,xは伝達関数Hの因果的安定フィルタ(causal stable filter)に各々供給され、これは、特に、純粋な線形予測系となるような単一の遅延H0(z)=z-1とすることができる。
次いで、フィルタ401の出力は、因果的安定線形フィルタ403からなる単一入力複数出力(SIMO)系(図4では、明瞭化のために2つの出力を持つフィルタ403として図示されている)に供給される。典型的には、出力の数は実用的実施例においては、適切な音響心理学的周波数スケールによる関連する自由度(帯域)の数を反映して、20ないし50程度であろう。
フィルタバンク403における出力の各々は、乗算器405において係数αm (l,k)により乗算される。結果は総和器407において加算され、第1及び第2信号成分x,xの(部分的)予測を発生する。特には、第1推定信号が第1信号成分xに基づいて該第1信号成分xのために発生され、第2推定信号が第2信号成分xに基づいて該第1信号成分xのために発生される。これらの推定信号は第1信号成分xから減算され、第1残存信号eを発生する。第2残存信号eを発生するために、対称的な処理が適用される。
予測係数αm (l,k)は、標準の線形回帰法により、即ち第1及び第2残存信号e,eの(加重)自乗和を最小化することにより決定することができる。第1及び第2信号成分x,xは、ステレオ信号からの処理されていない左及び右信号とすることができるが、左及び右チャンネルの帯域制限されたバージョンのような前置処理された信号を構成することもできる。
2チャンネル分析系は、第1及び第2残存信号e,eのスペクトルが平坦化される(従って、形状が等しい)こと、及び第1及び第2残存信号e,eに関連する相互相関関数が零遅れを除き最小化されることを保証することができる。これは、回転に適した状況であり、従って回転プロセッサ105をメイン及びサイド信号を構築するために使用することができる。
αの最適値は、典型的には、メイン信号の(加重)自乗和の最大値を、従ってサイド信号の(加重)自乗和の最小値を生成するものとして定義される。
デコーダ200は上記エンコーダのものと逆の演算を実行する。特には、図5に示すように、デコーダ200の予測デコーダ207は上記エンコーダで使用されたものと同一の予測器301,303,305,307を使用することができる。しかしながら、フィードフォワード構造を使用するエンコーダとは対照的に、該デコーダはフィードバック構造を使用し、これにより、現信号サンプルを予測するために前に復号された信号サンプルを使用する。
更に詳細には、図6に示すように、デコーダ200の予測デコーダ207は、前記エンコーダと同様であるが、結果としての(部分的)信号推定値を第1及び第2残存信号e,eに結合及び加算するフィードバックに結合された予測フィルタ構造を使用することができる。
この様にして発生された第1及び第2残存信号e,eは、典型的には、ガウス分布及び平らな、即ちホワイト周波数のスペクトルを有するであろう。従って、メイン及びサイド信号も平らな周波数スペクトルを持つガウス信号である。しかしながら、幾つかの実施例においては、当該装置は、第1信号成分及び第2信号成分のスペクトル特性に応答してメイン信号及び好ましくはサイド信号をスペクトル的に整形する手段を更に有することができる。
例えば、或る実施例は、符号化プロセッサ109においてメイン信号を符号化するためのモノコーダを使用することができる。音響心理学的モデルを利用した通常のモノコーダを使用するためには、第1及び第2信号成分x,xの平均スペクトル形状と同様のスペクトル形状を持つ信号を有することが好ましい。
これは、メイン信号を直接符号化する代わりに、下記のz表現を持つ信号mを使用することにより達成することができ、
Figure 0004950040
ここで、M(z)はメイン信号のz表現である。同じフィルタ処理は、サイド信号にも適用することができる。1/H(z)に対する適切な選択により、第1及び第2信号成分x,xの平均スペクトル包絡線がエンコーダにおいて回復される。このフィルタ処理は前記ローテータの前又は後で適用することができる。明らかに、デコーダは、H(z)による乗算を導入することにより、それに応じて適応化することができる。
好ましくは、H(z)は下記の2つの条件を満足するものとする。
・|H(z)|が、第1及び第2信号成分x,xの平均スペクトル包絡線を表す。
・H(z)は前記予測係数から直接導出することができ、余分なデータを送信する必要がないことを意味する。
理論的な可能性は、
Figure 0004950040
により与えられるフィルタ処理を使用することであり、ここで、Fk,l(z)は、
Figure 0004950040
なるフィルタのz表現を示す。
このオプションは、フィルタH(z)が有限次のものでありそうにないという意味で理論的なものである。近似を使用して、実現可能なフィルタが可能であり、その場合に依然として予測係数のみに基づいて規定されるであろう。
余分なフィルタH(z)を使用する場合、当該デコーダの適応化はすなおなものとなる。元々、当該デコーダは、
Figure 0004950040
なる伝達関数マトリクスを持つ2チャンネル系を構成するので、該デコーダは、それに応じて、対応する合成系、
Figure 0004950040
を提供するように変更される。
上記記載は、明瞭化のために、本発明の実施例を記憶装置の異なる機能ユニットに関して説明したことが分かるであろう。しかしながら、異なる機能ユニット間の機能の如何なる好適な分散も本発明から逸脱することなしに使用することができることは明であろう。従って、特定の機能ユニットに対する参照は、厳密な論理的又は物理的構造、編成又は分離を示すというよりも、記載された機能を提供するための好適な手段の参照としてのみ見られるべきである。例えば、アプリケーションデータ発生器は、抽出プロセッサと統合又は結合することができるか、又はこれの一部とすることができる。
本発明は、ハードウェア、ソフトウェア、ファームウエア又はこれらの如何なる組み合わせをも含む如何なる好適な形態で実施化することもできる。しかしながら、好ましくは、本発明は1以上のデータプロセッサ及び/又はデジタル信号プロセッサ上で動作するコンピュータソフトウェアとして実施化される。本発明の実施例のエレメント及び構成要素は、物理的、機能的及び論理的に如何なる好適な方法でも実施化することができる。確かに、上記機能は単一のユニットにおいて、複数のユニットにおいて又は他の機能ユニットの一部として実施化することができる。そのようであるので、本発明は、単一のユニットで実施化することができるか、又は異なるユニット及びプロセッサの間で物理的及び機能的に分散させることもできる。
以上、本発明を好ましい実施例に関連して説明したが、ここで述べた特定の形態に限定されることを意図するものではない。むしろ、本発明の範囲は添付請求項のみにより限定されるものである。請求項において、"有する"なる用語は他の構成要素又はステップの存在を排除するものではない。更に、個別に掲載されていても、複数の手段、エレメント又は方法ステップは、例えば単一のユニット又はプロセッサにより実施化することができる。更に、個々のフィーチャが異なる請求項に含まれているかもしれないが、これらは可能性として有利に組み合わせることができ、異なる請求項に含めることは、フィーチャの組み合わせが可能ではない及び/又は有利ではないということを意味するものでもない。更に、単一形の参照は、複数を排除するものではない。かくして、単数表現、"第1の"、"第2の"等は複数を排除するものではない。また、請求項における符号は例の明瞭化としてのみ設けたもので、如何なる形でも請求項の範囲を限定するものと見なしてはならない。
図1は、本発明の一実施例によるエンコーダのブロック図の一例を示す。 図2は、本発明の一実施例によるデコーダのブロック図の一例を示す。 図3は、本発明の一実施例によるエンコーダ用の線形予測及び回転手段の構成を示す。 図4は、本発明の一実施例によるエンコーダにおける線形予測の実施化を示す。 図5は、本発明の一実施例によるデコーダ用の線形予測及び回転手段の構成を示す。 図6は、本発明の一実施例によるデコーダにおける線形予測の実施化を示す。

Claims (16)

  1. 少なくとも第1信号成分と第2信号成分とを有するマルチチャンネル信号を符号化する信号エンコーダにおいて、該信号エンコーダが、前記第1信号成分からの線形予測と前記第2信号成分からの線形予測と前記第1信号成分とから前記第1信号成分の第1残存信号を発生し、前記第1信号成分からの線形予測と前記第2信号成分からの線形予測と前記第2信号成分とから前記第2信号成分の第2残存信号を発生する予測手段であって、前記線形予測が音響心理学的特性に基づいている予測手段と、
    前記第1残存信号及び前記第2残存信号を有する合成信号の回転によりメイン信号及びサイド信号を発生する回転手段であって、前記メイン信号が前記サイド信号より高い信号エネルギを有するような回転手段と、
    前記メイン信号を符号化して符号化メインデータを発生する第1符号化手段と、
    前記符号化メインデータを有する出力信号を発生する出力手段と、
    を有する信号エンコーダ。
  2. 請求項1に記載の信号エンコーダにおいて、前記サイド信号を符号化して符号化サイドデータを発生する第2符号化手段を更に有し、前記出力手段が更に前記符号化サイドデータを前記出力信号に含めるように動作するような信号エンコーダ。
  3. 請求項2に記載の信号エンコーダにおいて、前記第2符号化手段が前記サイド信号をパラメータ的に符号化するように動作する信号エンコーダ。
  4. 請求項1に記載の信号エンコーダにおいて、前記予測手段が少なくとも1つの音響心理学型フィルタバンクを有する信号エンコーダ。
  5. 請求項1に記載の信号エンコーダにおいて、前記回転手段が、前記メイン信号の信号エネルギを実質的に最大化するように前記合成信号を回転させるように動作する信号エンコーダ。
  6. 請求項1に記載の信号エンコーダにおいて、前記回転手段が、前記サイド信号の信号エネルギを実質的に最小化するように前記合成信号を回転させるように動作する信号エンコーダ。
  7. 請求項1に記載の信号エンコーダにおいて、前記予測手段が、
    前記第1信号成分に応答して該第1信号成分に対する第1推定信号を発生する第1予測器と、
    前記第2信号成分に応答して前記第1信号成分に対する第2推定信号を発生する第2予測器と、
    前記第1残存信号を、前記第1推定信号及び前記第2推定信号により減算された前記第1信号成分として発生する手段と、
    を有する信号エンコーダ。
  8. 請求項7に記載の信号エンコーダにおいて、前記予測手段が、
    前記第1信号成分に応答して該第2信号成分に対する第3推定信号を発生する第3予測器と、
    前記第2信号成分に応答して該第2信号成分に対する第4推定信号を発生する第4予測器と、
    前記第2残存信号を、前記第3推定信号及び前記第4推定信号により減算された前記第2信号成分として発生する手段と、
    を有する信号エンコーダ。
  9. 請求項1に記載の信号エンコーダにおいて、前記回転手段が前記合成信号に対してマトリクス乗算を実行するように動作する信号エンコーダ。
  10. 請求項に記載の信号エンコーダにおいて、前記第1符号化手段が音響心理学的モノエンコーダを有する信号エンコーダ。
  11. 請求項1に記載の信号エンコーダにおいて、前記マルチチャンネル信号がステレオオーディオ信号である信号エンコーダ。
  12. マルチチャンネル信号を復号する信号デコーダにおいて、該信号デコーダが、
    マルチチャンネル信号を入力する入力手段と、
    前記マルチチャンネル信号の回転により第1残存信号及び第2残存信号を発生する回転手段と、前記第1残存信号及び前記第2残存信号に応答して線形予測により出力マルチチャンネル信号を発生する合成手段であって、前記線形予測が音響心理学的特性に基づいている合成手段と、
    を有する信号デコーダ。
  13. 少なくとも第1信号成分と第2信号成分とを有するマルチチャンネル信号を符号化する方法において、該方法が、
    前記第1信号成分からの線形予測と前記第2信号成分からの線形予測と前記第1信号成分とから前記第1信号成分の第1残存信号を発生し、前記第1信号成分からの線形予測と前記第2信号成分からの線形予測と前記第2信号成分とから前記第2信号成分の第2残存信号を発生するステップであって、前記線形予測が音響心理学的特性に基づいているステップと、
    前記第1残存信号及び前記第2残存信号を有する合成信号の回転によりメイン信号及びサイド信号を発生するステップであって、前記メイン信号が前記サイド信号より高い信号エネルギを有するようなステップと、
    前記メイン信号を符号化して符号化メインデータを発生するステップと、
    前記符号化メインデータを有する出力信号を発生するステップと、
    を有する方法。
  14. マルチチャンネル信号を復号する方法において、該方法が、
    マルチチャンネル信号を入力するステップと、
    前記マルチチャンネル信号の回転により第1残存信号及び第2残存信号を発生するステップと、
    前記第1残存信号及び前記第2残存信号に応答して線形予測により出力マルチチャンネル信号を発生するステップであって、前記線形予測が音響心理学的特性に基づいているステップと、
    を有する方法。
  15. 請求項13又は請求項14に記載の方法の実施を可能にするコンピュータプログラム。
  16. 請求項15に記載のコンピュータプログラムを有する記録担体。
JP2007516134A 2004-06-21 2005-06-14 マルチチャンネルオーディオ信号を符号化及び復号する方法及び装置 Expired - Fee Related JP4950040B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP04102827.5 2004-06-21
EP04102827 2004-06-21
PCT/IB2005/051964 WO2006000952A1 (en) 2004-06-21 2005-06-14 Method and apparatus to encode and decode multi-channel audio signals

Publications (2)

Publication Number Publication Date
JP2008503767A JP2008503767A (ja) 2008-02-07
JP4950040B2 true JP4950040B2 (ja) 2012-06-13

Family

ID=34970343

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007516134A Expired - Fee Related JP4950040B2 (ja) 2004-06-21 2005-06-14 マルチチャンネルオーディオ信号を符号化及び復号する方法及び装置

Country Status (8)

Country Link
US (1) US7742912B2 (ja)
EP (1) EP1761915B1 (ja)
JP (1) JP4950040B2 (ja)
KR (1) KR101183857B1 (ja)
CN (1) CN1973319B (ja)
AT (1) ATE416455T1 (ja)
DE (1) DE602005011439D1 (ja)
WO (1) WO2006000952A1 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US8433581B2 (en) * 2005-04-28 2013-04-30 Panasonic Corporation Audio encoding device and audio encoding method
EP1876586B1 (en) * 2005-04-28 2010-01-06 Panasonic Corporation Audio encoding device and audio encoding method
JP5025485B2 (ja) * 2005-10-31 2012-09-12 パナソニック株式会社 ステレオ符号化装置およびステレオ信号予測方法
EP2005420B1 (fr) * 2006-03-15 2011-10-26 France Telecom Dispositif et procede de codage par analyse en composante principale d'un signal audio multi-canal
KR101149448B1 (ko) 2007-02-12 2012-05-25 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법
WO2009057329A1 (ja) * 2007-11-01 2009-05-07 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
WO2009068087A1 (en) * 2007-11-27 2009-06-04 Nokia Corporation Multichannel audio coding
KR101441897B1 (ko) * 2008-01-31 2014-09-23 삼성전자주식회사 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치
KR20090131230A (ko) 2008-06-17 2009-12-28 삼성전자주식회사 적어도 두 개의 주파수 대역들을 이용하는 저 밀도 패리티코드 인코딩 장치 및 디코딩 장치
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
EP2313886B1 (en) 2008-08-11 2019-02-27 Nokia Technologies Oy Multichannel audio coder and decoder
US20100104015A1 (en) * 2008-10-24 2010-04-29 Chanchal Chatterjee Method and apparatus for transrating compressed digital video
EP2439736A1 (en) * 2009-06-02 2012-04-11 Panasonic Corporation Down-mixing device, encoder, and method therefor
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
WO2011072729A1 (en) * 2009-12-16 2011-06-23 Nokia Corporation Multi-channel audio processing
US8463414B2 (en) 2010-08-09 2013-06-11 Motorola Mobility Llc Method and apparatus for estimating a parameter for low bit rate stereo transmission
RU2562771C2 (ru) 2011-02-16 2015-09-10 Долби Лабораторис Лайсэнзин Корпорейшн Способы и системы генерирования коэффициентов фильтра и конфигурирования фильтров
EP2702776B1 (en) 2012-02-17 2015-09-23 Huawei Technologies Co., Ltd. Parametric encoder for encoding a multi-channel audio signal
ES2555579T3 (es) 2012-04-05 2016-01-05 Huawei Technologies Co., Ltd Codificador de audio multicanal y método para codificar una señal de audio multicanal
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
KR101453733B1 (ko) 2014-04-07 2014-10-22 삼성전자주식회사 오디오 신호 처리장치
TR201900472T4 (tr) * 2014-04-24 2019-02-21 Nippon Telegraph & Telephone Frekans alanı parametre dizisi oluşturma metodu, kodlama metodu, kod çözme metodu, frekans alanı parametre dizisi oluşturma aparatı, kodlama aparatı, kod çözme aparatı, programı ve kayıt ortamı.
EP3067886A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
CN106373578B (zh) * 2016-08-29 2019-10-11 福建联迪商用设备有限公司 一种音频通信解码方法
WO2018189414A1 (en) * 2017-04-10 2018-10-18 Nokia Technologies Oy Audio coding
JP7407110B2 (ja) * 2018-07-03 2023-12-28 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置及び符号化方法
KR20220066749A (ko) 2020-11-16 2022-05-24 한국전자통신연구원 잔차 신호의 생성 방법과 그 방법을 수행하는 부호화기 및 복호화기

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0761043B2 (ja) * 1986-04-10 1995-06-28 株式会社東芝 ステレオ音声伝送蓄積方式
AU5663296A (en) * 1995-04-10 1996-10-30 Corporate Computer Systems, Inc. System for compression and decompression of audio signals fo r digital transmission
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
JP3945827B2 (ja) * 1997-01-16 2007-07-18 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 複数のディジタル情報信号に関するデータの圧縮/伸長
US6121904A (en) * 1998-03-12 2000-09-19 Liquid Audio, Inc. Lossless data compression with low complexity
JP2000066700A (ja) 1998-08-17 2000-03-03 Oki Electric Ind Co Ltd 音声信号符号器、音声信号復号器
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
JP4240683B2 (ja) * 1999-09-29 2009-03-18 ソニー株式会社 オーディオ処理装置
SE519985C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
JP3387088B2 (ja) * 2000-10-20 2003-03-17 日本ビクター株式会社 光記録媒体、音声信号伝送方法及び音声復号方法
BRPI0308691A2 (pt) 2002-04-10 2016-11-16 Koninkl Philips Electronics Nv métodos para codificar um sinal de canal múltiplo e para decodificar informação de sinal de canal múltiplo, arranjos para codificar e decodificar um sinal de canal múltiplo, sinal de dados, meio legível por computador, e, dispositivo para comunicar um sinal de canal múltiplo.

Also Published As

Publication number Publication date
US20070248157A1 (en) 2007-10-25
CN1973319A (zh) 2007-05-30
JP2008503767A (ja) 2008-02-07
CN1973319B (zh) 2010-12-01
US7742912B2 (en) 2010-06-22
WO2006000952A1 (en) 2006-01-05
EP1761915B1 (en) 2008-12-03
ATE416455T1 (de) 2008-12-15
KR20070030841A (ko) 2007-03-16
EP1761915A1 (en) 2007-03-14
DE602005011439D1 (de) 2009-01-15
KR101183857B1 (ko) 2012-09-19

Similar Documents

Publication Publication Date Title
JP4950040B2 (ja) マルチチャンネルオーディオ信号を符号化及び復号する方法及び装置
RU2555221C2 (ru) Канальное кодирование на основе комплексного преобразования с частотным кодированием с расширенной полосой
RU2381571C2 (ru) Синтезирование монофонического звукового сигнала на основе кодированного многоканального звукового сигнала
KR101178114B1 (ko) 복수의 입력 데이터 스트림을 믹싱하기 위한 장치
US7573912B2 (en) Near-transparent or transparent multi-channel encoder/decoder scheme
JP3391686B2 (ja) 符号化されたオーディオ信号を復号する方法及び装置
RU2425340C2 (ru) Оптимизированное по точности кодирование с подавлением упреждающего эхо
JP5215994B2 (ja) 損失エンコ−ドされたデータ列および無損失拡張データ列を用いた、原信号の無損失エンコードのための方法および装置
US20090204397A1 (en) Linear predictive coding of an audio signal
WO2005083679A1 (en) An audio distribution system, an audio encoder, an audio decoder and methods of operation therefore
WO2006059567A1 (ja) ステレオ符号化装置、ステレオ復号装置、およびこれらの方法
JP4927264B2 (ja) オーディオ信号を符号化する方法
US7725324B2 (en) Constrained filter encoding of polyphonic signals
JP4323520B2 (ja) ポリフォニック信号の制約付きフィルタ符号化
JP3099876B2 (ja) 多チャネル音声信号符号化方法及びその復号方法及びそれを使った符号化装置及び復号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080613

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110531

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110831

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111129

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20111129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120209

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120308

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees