JP4794448B2 - オーディオエンコーダ - Google Patents

オーディオエンコーダ Download PDF

Info

Publication number
JP4794448B2
JP4794448B2 JP2006531857A JP2006531857A JP4794448B2 JP 4794448 B2 JP4794448 B2 JP 4794448B2 JP 2006531857 A JP2006531857 A JP 2006531857A JP 2006531857 A JP2006531857 A JP 2006531857A JP 4794448 B2 JP4794448 B2 JP 4794448B2
Authority
JP
Japan
Prior art keywords
frequency band
signal
quantization
audio
phase difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006531857A
Other languages
English (en)
Other versions
JPWO2006022190A1 (ja
Inventor
修二 宮阪
良明 高木
直也 田中
峰生 津島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2006531857A priority Critical patent/JP4794448B2/ja
Publication of JPWO2006022190A1 publication Critical patent/JPWO2006022190A1/ja
Application granted granted Critical
Publication of JP4794448B2 publication Critical patent/JP4794448B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/022Electronic editing of analogue information signals, e.g. audio or video signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、少なくとも2チャンネル以上のマルチチャンネル信号を符号化するオーディオエンコーダに関する。特に、マルチチャンネル信号をダウンミックスした混合信号(ダウンミックス信号)を元のマルチチャンネルの信号に分離するのに必要な補助情報を具体的に作成する技術に関する。
近年、Spatial Codec(空間的符号化)といわれる技術の開発が行われている。これは、非常に少ない情報量でマルチチャンネルの臨場感を圧縮・符号化することを目的としている。
例えば、既にデジタルテレビの音声方式として広く用いられているマルチチャンネルコーデックであるAAC方式が、5.1ch当り512kbpsや、384kbpsというビットレートを要する。これに対し、Spatial Codecでは、128kbpsや、64kbps、さらに48kbpsといった非常に少ないビットレートでマルチチャンネル信号を圧縮・符号化することを目指している。そのための技術として、例えば、特許文献1がある。
それによると、チャンネル間のレベル比(以下「レベル差」、「ゲイン比」とも記す。)等を符号化することによって、少ない情報量で臨場感を圧縮符号化することが述べられている。
より具体的には、聴覚空間(BCC)符号化において、入力信号のスペクトル成分がダウン混合され、BCCパラメータ(例えば、チャンネル間レベルおよび/或いは時間差)が生成され、ステレオ実現においては、左右のチャンネルを周波数領域に変換した後に、対の左右のチャンネルのスペクトル成分がモノ成分にダウン混合される。その後、これらモノ成分と、ダウン混合されなかった左右のチャンネルのスペクトル成分とを時間領域に逆変換することでハイブリッドステレオ信号が生成され、次にこれらハイブリッドステレオ信号を従来の符号化技術を用いて符号化される。再生のためには、符号化されたビット流が従来の復号技術を用いて復号される。次に、BCC合成技術を用いてBCCパラメータを適用することで、これらモノ成分とダウン混合されなかったステレオ成分に基づいて聴覚シーンが合成される。
このため、家庭などのAV機器で本格的に視聴するような場合には、符号化された混合信号を補助情報を用いて分離することで、聴感上、違和感がない程度に信号の分離を達成することが可能となる。しかも、携帯電話機などで、ヘッドフォンなどを用いて気軽に視聴するような場合には、BCCパラメータを用いずに、ダウンミクス信号だけを復号化すればよく、従来の圧縮方式では実現できない、簡単且つ低演算量での高音質な再生が可能となる。
US2003/0236583A1号公報 (対応日本国出願、特開2004−78183号公報)
しかしながら、特許文献1では、該一つ或いは複数のダウン混合されたスペクトル成分に対して一つ或いは複数の聴覚空間パラメータを生成するといった記載や、該一つ或いは複数の聴覚空間パラメータが一つ或いは複数のチャンネル間レベル差とチャンネル間時間差を含むといった記載があるだけで、そのような情報(補助情報)を具体的にどのように量子化し、圧縮するかということは開示されていない。
従って、補助情報の具体的な作成技術の開発が要望されている。
本発明は、このような従来の問題点に鑑みてなされたものであって、混合信号だけを復号化することができ、しかも混合信号を分離するのに必要な補助情報を具体的に作成することができるオーディオエンコーダを提供することを目的とする。
上記目的を達成するために、本発明に係るオーディオエンコーダにおいては、Nチャンネル(N>1)のオーディオ信号を圧縮符号化するオーディオエンコーダであって、前記オーディオ信号を混合することにより得られた混合信号を、符号化する混合信号符号化手段と、前記混合信号符号化手段により符号化された混合信号から前記Nチャンネルのオーディオ信号に復号化するために必要な補助情報を生成する補助情報生成手段とを含み、前記補助情報生成手段は、前記オーディオ信号を周波数領域の信号にそれぞれ変換する変換手段と、前記周波数領域の信号の周波数帯域を複数に分割する分割手段と、前記周波数領域の信号間の相違の度合いを表す位相差情報とゲイン比情報とを検出する検出手段と、前記検出手段により検出された位相差情報とゲイン比情報とを、対応する周波数帯域毎に量子化する量子化手段とを備えることを特徴とする。
なお、本発明は、このようなオーディオエンコーダとして実現することができるだけでなく、このようなオーディオエンコーダが備える特徴的な手段をステップとする符号化方法として実現したり、それらのステップをコンピュータに実行させるプログラムとして実現したりすることもできる。また、このようなオーディオエンコーダが備える特徴的な手段を一体化したLSIとして構成することもできる。そして、そのようなプログラムは、CD−ROM等の記録媒体やインターネット等の伝送媒体を介して配信することができるのはいうまでもない。
以上の説明から明らかなように、本発明に係るオーディオエンコーダによれば、混合信号だけを復号化することができ、しかも混合信号を分離するのに必要な補助情報を具体的に作成することができるという効果が奏される。
よって、本発明により、簡易且つ高品位の再生が可能となり、携帯電話機等のモバイル機器での簡易な音楽再生や、AV機器での本格的な音楽再生が普及してきた今日における本願発明の実用的価値は極めて高い。
以下、本発明に係るオーディオエンコーダが適用される、オーディオ信号エンコード・デコードシステムについて説明する。
(実施の形態1)
図1は、本発明に係るオーディオエンコーダを用いて構成される、オーディオ信号エンコード・デコードシステムの全体構成を示すブロック図である。
図1に示されるように、オーディオ信号エンコード・デコードシステム1は、Nチャンネル(N>1)のオーディオ信号を圧縮符号化するオーディオエンコーダ10と、オーディオエンコーダ10によって圧縮符号化されたオーディオ信号を復号化するオーディオデコーダ20とから構成される。なお、ここでは、説明の便宜のため、2チャンネルのオーディオ信号をエンコードする場合が図示されている。
オーディオエンコーダ10は、2チャンネルの入力オーディオ信号を混合することにより得られた混合信号を、符号化する混合信号符号化部11と、混合信号符号化部11により符号化された混合信号からNチャンネルのオーディオ信号に復号化するために必要な補助情報(レベル比、位相差)を生成する補助情報生成部12と、混合信号符号化部11により符号化された混合信号と、補助情報生成部12により生成された補助情報とを所定のフレーム毎に連結し、ビットストリームを生成し、生成したビットストリームをオーディオデコーダ20に出力するフォーマッタ13とを備える。
例えば、2チャンネルの入力オーディオ信号が図2に示される2つのベクトルである場合、混合信号符号化部11は、混合信号として符号Xで示されるベクトルに合成する。なお、図2において、入力オーディオ信号の一方は、その絶対値が1に正規化されており、他方はレベル比Dに正規化されている。補助情報生成部12は、2チャンネルの入力オーディオ信号のレベル比Dと、位相差θとを検出し、これを対応する帯域毎に量子化する。なお、補助情報生成部12の構成の詳細については、後述する。フォーマッタ13は、混合信号と、補助情報とを所定のフレーム毎に連結し、ビットストリームを生成する。
図3は、上記ビットストリームのフォーマット構成を示す図である。なお、図3では、1フレーム分のみ例示されている。
本ビットストリームには、所定の時間間隔で設けられるフレーム毎に、前述した符号化された混合信号を格納する領域αと、補助情報を格納する領域βとが、この順序で、設けられている。
図3において、領域α,βにそれぞれ第1フレームに関する対応データが格納され、第2フレームについても同様の構成が繰り返される。
領域αには、例えば2チャンネルの信号をダウンミックスした混合信号をMPEG規格AAC方式で圧縮符号化し、符号化された混合信号が格納されているものとする。ここでは、信号をベクトル合成する処理をダウンミックスという。
領域βには、2チャンネルのオーディオ信号間のゲイン比Dを表す値と、2チャンネルのオーディオ信号間の位相差θを表す値を含む補助情報が格納されている。ここで注意するべきことは、前記位相差θを表す値は、必ずしも位相差θを直接的に符号化したものである必要はなく、例えば、cosθのような値を符号化したデータでもよい。その場合、cosθの値によって前記位相差θを0゜から180゜の範囲で表すことができる。
図1に戻り、オーディオデコーダ20は、オーディオエンコーダ10から受信したビットストリームから、符号化された混合信号と補助情報とを、フレーム毎に分離するデフォーマッタ21と、デフォーマッタ21により分離された符号化された混合信号を復号化する混合信号復号化部22と、混合されたオーディオ信号と、Nチャンネルのオーディオ信号との何れかを選択的に出力する出力選択部23とを備える。出力選択部23は、出力先選択スイッチ231と、チャンネル拡張復号化部232とを備える。
オーディオデコーダ20が携帯電話機のようなモバイル機器であり、ヘッドフォンで手軽に再生するような場合には、出力先選択スイッチ231により、混合信号復号化部22によって復号化された混合信号がそのまま出力される。
これに対して、AV機器などにより本格的に再生するような場合には、出力先選択スイッチ231により、混合信号復号化部22によって復号化された混合信号がチャンネル拡張復号化部232に出力される。チャンネル拡張復号化部232は、補助情報生成部12と逆の処理、つまり、逆量子化を行い、レベル比および位相差を復号化した後、周波数軸上において、出力先選択スイッチ231から入力の対して、図2と逆の処理、つまり対角線が混合信号に対応し、頂角が位相差θとなる菱形を求めることにより、2つのチャンネルのオーディオ信号に分離し、分離されたオーディオ信号を周波数軸から時間軸に変換することにより、臨場感の増した音楽を高品質で再生する。
以下本発明の実施の形態1における補助情報生成部について図面を参照しながら説明する。
図4は、図1に示される補助情報生成部の詳細な構成例を示すブロック図である。
図4に示されるように、補助情報生成部12aは、第1の変換部121と、第2の変換部122と、検出部123と、量子化部125と、量子化精度設定テーブル124とを備える。
第1の変換部121は、第1の入力オーディオ信号を周波数帯域信号に変換する。
第2の変換部122は、第2の入力オーディオ信号を周波数帯域信号に変換する。
検出部123は、第1の入力オーディオ信号と第2の入力オーディオ信号との対応する周波数帯域信号間の相違の度合いを検出する。
量子化精度設定テーブル124は、量子化部125での量子化の精度を、各周波数帯域毎に設定している。
量子化部125は、検出された周波数帯域毎の相違の度合いを量子化する。
以上のように構成された補助情報生成部12aの動作について以下説明する。
まず、第1の変換部121は、第1の入力オーディオ信号を複数の周波数帯域信号に変換する。これは、例えば、フーリエ変換やコサイン変換などを用いて、入力のオーディオ信号を周波数スペクトル信号に変換し、何本かのスペクトル信号をまとめて所定の周波数帯域信号を構成するような方法でよい。例えば、入力のオーディオ信号を1024本の周波数スペクトル信号に変換し、最も低い周波数から4本の周波数スペクトル信号をまとめて第1の周波数帯域信号とし、その次の4本の周波数スペクトル信号をまとめて第2の周波数帯域信号とするなどという方法でよい。ここで周波数が高域に行けば行くほど、多くの本数の周波数スペクトル信号をまとめて周波数帯域信号にするようにしてもよい。或いは、QMFフィルタバンクなどを用いて周波数帯域信号を求めてもよい。
次に、第2の変換部122は、第2の入力オーディオ信号を複数の周波数帯域信号に変換する。この方法は、上記第1の変換部121における方法と同じ方法である。
次に、検出部123は、第1の入力オーディオ信号と第2の入力オーディオ信号との対応する周波数帯域信号間の相違の度合いを検出する。例えば、対応する周波数帯域信号間のレベル差や、位相差を検出する。
レベル差を検出する方法は、対応する帯域毎の振幅の最大値どうしを比較する方法や、エネルギーレベルを比較する方法などがある。
位相差を検出する方法は、フーリエ級数の実数値と虚数値とから位相角と求める方法や、対応する帯域信号の相関値から求める方法がある。すなわち相関値をC(Cは±1.0の範囲内)としたとき、位相角はπ*(1−C)/2として求めることができる。
最後に、量子化部125で、検出された周波数帯域毎の相違の度合いを量子化する。ここで、各帯域毎にどれくらいの精度で量子化するかは、予め、量子化精度設定テーブル124によって設定されている。
図5は、量子化精度設定テーブル124の一例を示す図である。
図5においては、一番低い帯域に対しては6ビットの量子化ビット数が与えられていることが示されている。次の帯域に対しては5ビット、その次の帯域に対しては4ビット、というように帯域毎に量子化の精度が与えられており、量子化を行う最も高い周波数帯域に対しては1ビットというように、低い帯域ほど、高精度な量子化を行うように設定されている。ここでは、勿論値は一例に過ぎず、他の値であってもよいことはいうまでもない。また、周波数帯域の順に量子化の精度を変えるのではなく、聴覚の感度特性に応じて量子化の精度を変えるようにしてもよいことはいうまでもない。このように量子化部125では、量子化精度設定テーブル124で設定された量子化精度で各周波数帯域毎の信号を量子化する。
上記においては、説明の簡単化のために、周波数帯域毎の量子化の精度はテーブルによって予め設定されるとしたが、必ずしもその必要がないことはいうまでもない。つまり、入力信号に応じて、当該周波数帯域の量子化の粗さ(Coarse)を適宜設定し、当該量子化の粗さを示す情報も符号化するという方法でもよい。その場合、粗さを示す情報の符号化信号のサイズを小さくするために、量子化の粗さは、2段階で表すことが適切である。
以上のように本実施の形態1によれば、補助情報生成部12aは、Nチャンネル(N>1)のオーディオ信号をそれぞれ複数の周波数帯域信号に変換する第1の変換部121、第2の変換部122、Nチャンネルのオーディオ信号間の、対応する周波数帯域信号の相違の度合いを検出する検出部123と、検出された周波数帯域毎の相違の度合いを量子化する量子化部125とを備え、量子化部125での量子化の精度を、各周波数帯域毎に設定することによって、低いビットレートでしかも高音質にオーディオ信号を符号化できることとなる。
ところで、既に広く用いられている圧縮方式においても、チャンネル間の位相差や、レベル差を符号化する技術を部分的に取り入れているものもある。例えば前述のAAC方式(ISO/IEC13818−7)では、Intensity Stereoといわれる技術が搭載されている。このためこの技術を用いることも考えられる。
このMPEG方式AAC規格(ISO/IEC13818−7)における、Intensity Stereoでは、チャンネル間のレベル差が、複数の周波数帯域毎に、256値の量子化精度で量子化され、さらに、隣接する周波数帯域間の差分値をハフマン符号化することで圧縮されることが開示されている。
しかしながら、上記のような方法では、全ての周波数帯域毎に256値という高精度な量子化を行っているので、無駄な情報量が費やされている。なぜならば、人間の聴覚特性は、周波数帯域毎に感度が異なっているので、そのことを考慮に入れれば、精密な量子化精度で量子化を行うべき帯域と大雑把な精度で量子化を行っても影響の無い帯域を個々に制御するべきであるのに、一律に256値という高精度な量子化を行うことは無駄な情報量を費やすことになる。
また、MPEG方式AAC規格(ISO/IEC13818−7)における、Intensity Stereoでは、チャンネル間の位相差が、複数の周波数帯域毎に、2値の量子化精度での量子化であり、結果として、位相差が無いか、位相差が180度か、のどちらかしか表現できず、これも、聴覚の感度に応じた制御ができないことになる。
すなわち、従来技術においては、図6(a)に示されるように、全周波数バンドに対し、同じ量子化精度(例えば位相角の量子化に例えば32値)で量子化している。
これに対して、本発明では、図6(b)に示されるように、例えば、低域では32値、その上の帯域では16値、さらにその上の帯域では13値、高域では11値といったように、帯域に応じて、レベル比および位相差の量子化精度を変更できるようにしている。
従って、チャンネル間位相差情報やレベル差情報を、周波数帯域毎に異なる精度で量子化することで、高音質でしかもビットレートを低くしつつ、オーディオ信号を符号化できることとなる。
なお、高域などにおいて、隣接帯域を1まとめにして(グルーピング)符号化、例えば11値×11値の120値を7ビットのストライドで符号化、つまり1帯域当り3.5ビットで量子化してもよい。これによっても低ビット化を図ることができる。
(実施の形態2)
以下本発明の実施の形態2における補助情報生成部について図面を参照しながら説明する。
図7は、本実施の形態2における補助情報生成部の他の詳細な構成例を示すブロック図である。なお、図4に示される補助情報生成部12aの構成部分と対応する部分に同じ番号を付し、その説明を省略する。
図7に示されるように、補助情報生成部12bは、補助情報生成部12の構成要素、すなわち第1の変換部121、第2の変換部122、検出部123、量子化精度設定テーブル124および量子化部125に加えて、さらに圧縮部126を備えて構成される。
つまり、実施の形態1と異なるのは、量子化部125で量子化された周波数帯域毎の相違の度合いを量子化した量子化値を受けて、当該複数の量子化値をさらに可逆圧縮する圧縮部126を備えていることである。ここで、圧縮部126による可逆圧縮とは、圧縮による劣化なく完全に元に復号されるロスレス圧縮方法である。
この可逆圧縮として、例えば、各量子化値をハフマン符号によって圧縮する方法などがある。
或いは、差分符号の方法をとってもよい。すなわち、最も低い周波数帯域に対応する量子化値はそのままにし、以降隣接する周波数帯域に対応する量子化値は差分信号を計算しそれを圧縮信号として用いるようにする。これは、隣接する周波数帯域間では、量子化値に大きな差が無いという性質を利用した可逆圧縮である。さらに、その差分信号をハフマン符号によってさらに圧縮してもよい。
或いは、隣接する周波数帯域間で量子化値が等しい場合は、連続して何回等しいかを表すランレングス符号化することによってビット数を削減してもよい。さらに、そのランレングス符号をハフマン符号によってさらに圧縮してもよい。
或いは、A値で量子化された隣接するB個の量子化値をB桁のA進数で表現した値を符号化することによって、ビット数をさらに削減するようにしてもよい。
例えば、5値で量子化された隣接する3個の量子化値を3桁の5進数で表現した場合、取りうる値の最大値は124となる。これは、3個の量子化値が全て最大値の4であった場合4*25+4*5+4=124であるからである。一方、124は、7桁の2進数で表現できるので、5値で量子化された隣接する3個の量子化値は、7ビットで圧縮できることになる。そもそも5値を表現するためには3ビットの情報量が必要なので、3つで9ビット必要となる。つまりこの場合、3つで2ビット情報が削減できることになる。
具体的には、検出部123は、入力のオーディオ信号間の、対応する周波数信号の位相差を検出し、量子化部125は、検出された位相差を5値で量子化し、圧縮部126は、そのようにして量子化された少なくとも2個の量子化値をまとめて圧縮するようにするなどすれば情報量が圧縮できる。ここで、量子化部125は、必ずしも位相差を等間隔で5等分した量子化レベルで量子化する必要はない。聴覚の特性に応じて、位相差90°近傍は粗く、0°近傍は細かく量子化する方がよい。
同様に、検出部123は、入力のオーディオ信号間の、対応する周波数信号の位相差を検出し、量子化部125は、検出された位相差を3値で量子化し、圧縮部126は、そのようにして量子化された少なくとも3個の量子化値をまとめて圧縮するようにするなどすれば情報量が圧縮できる。ここで、量子化部125は、必ずしも位相差を等間隔で3等分する必要はなく、聴覚の特性に応じて、位相差90°近傍は粗く、0°近傍は細かく量子化する方がよい。
また同様に、検出部123は、入力のオーディオ信号間の、対応する周波数信号の位相差を検出し、量子化部125は、検出された位相差を11値で量子化し、圧縮部126は、そのようにして量子化された少なくとも2個の量子化値をまとめて圧縮するようにするなどすれば情報量が圧縮できる。ここで、量子化部125は、必ずしも位相差を等間隔で11等分する必要はなく、聴覚の特性に応じて、位相差90°近傍は粗く、0°近傍は細かく量子化する方がよい。
以上のように本実施の形態2によれば、圧縮部126により、量子化された複数の量子化値を可逆圧縮することによって、より低いビットレートでしかも高音質にオーディオ信号を符号化できることとなる。
(実施の形態3)
以下本発明の実施の形態3における補助情報生成部について図面を参照しながら説明する。
図8は、本実施の形態3における補助情報生成部のさらに他の詳細な構成例を示すブロック図である。なお、図4に示される補助情報生成部12aの構成部分と対応する部分に同じ番号を付し、その説明を省略する。
図8に示されるように、補助情報生成部12cは、第1の変換部121と、第2の変換部122と、第1の分割部127aと、第2の分割部127bと、第3の分割部127cと、第4の分割部127dと、第1の量子化部128aと、第2の量子化部128bとを備える。
第1の変換部121は、第1の入力オーディオ信号を周波数領域の信号に変換する。
第2の変換部122は、第2の入力オーディオ信号を周波数領域の信号に変換する。
第1の分割部127aは、ゲイン比情報に関する周波数分割テーブル1271を有し、第1の変換部121で生成された周波数領域の信号を複数の周波数帯域毎に分割する。
第2の分割部127bは、位相差情報に関する周波数分割テーブル1272を有し、第1の変換部121で生成された周波数領域の信号を第1の分割部127aとは異なる分割の仕方で分割する。
第3の分割部127cは、ゲイン比情報に関する周波数分割テーブル1271を有し、第2の変換部122で生成された周波数領域の信号を第1の分割部127aと同じ分割の仕方で分割する。
第4の分割部127dは、位相差情報に関する周波数分割テーブル1272を有し、第2の変換部122で生成された周波数領域の信号を第2の分割部127bと同じ分割の仕方で分割する。
第1の量子化部128aは、ゲイン比情報の量子化精度と、位相差情報の量子化精度とを別々に設定した量子化精度テーブル1281を有し、第1の分割部127aで分割された周波数帯域信号と、第3の分割部127cで分割された周波数帯域信号との、それぞれ対応する周波数帯域毎のゲイン比を検出し、量子化する。
第2の量子化部128bは、量子化精度テーブル1281を有し、第2の分割部127bで分割された周波数帯域信号と第4の分割部127dで分割された周波数帯域信号との、それぞれ対応する周波数帯域毎の位相差を検出し、量子化する。
以上のように構成された補助情報生成部12cの動作について以下説明する。
まず、第1の変換部121で第1の入力オーディオ信号を周波数領域の信号に変換する。これは、例えば、フーリエ変換などを用いて、入力のオーディオ信号を周波数スペクトル信号に変換する。本実施の形態3では1024本の複素フーリエ級数に変換するものとする。
一方、第2の変換部122では第2の入力オーディオ信号を周波数領域の信号に変換する。この方法は、第1の変換部121における方法と同じ方法である。
次に、第1の分割部127aで、第1の変換部121で生成された周波数領域の信号を複数の周波数帯域毎に分割する。この時、分割の仕方は、図9のテーブルに従う。
図9は、周波数分割テーブル1271の詳細構成を示す図である。
図9において、左の列は帯域の番号を示しており、中央の列は当該帯域番号の周波数帯域の開始周波数を示しており、右の列は当該帯域番号の周波数帯域の終端周波数を示している。すなわち、第1の分割部127aでは、第1の変換部121で生成された周波数領域の信号(1024本の複素フーリエ級数)を図9のテーブルに従って、それぞれ示されている周波数帯域毎に分割する。
同様に、第2の分割部127bで、第1の変換部121で生成された周波数領域の信号を複数の周波数帯域毎に分割する。この時、分割の仕方は、図10のテーブルに従う。
図10は、周波数分割テーブル1272の詳細構成を示す図である。
図10の意味するところは図9と同様であるが、具体的な帯域の割り当て方が異なっている。本実施の形態3では、一例として、高域側の帯域の分割の幅を、図9に示したものより粗くしている。このような図10に示されたテーブルに従って、第2の分割部127bでは、第1の変換部121で生成された周波数領域の信号(1024本の複素フーリエ級数)をそれぞれ示されている周波数帯域毎に分割する。本実施の形態3では、一例として、高域側の帯域の分割の幅を、図9に示したものより粗くしているが、必ずしもそうでなくてもよく、聴覚の感度の低い帯域幅を選択的に粗くしてもよい。
第3の分割部127cは、第2の変換部122で生成された周波数領域の信号を複数の周波数帯域毎に分割するが、その動作は、第1の分割部127aと同様である。
第4の分割部127dは、第2の変換部122で生成された周波数領域の信号を複数の周波数帯域毎に分割するが、その動作は、第2の分割部127bと同様である。
次に、第1の量子化部128aでは、第1の分割部127aで分割された周波数帯域信号と第3の分割部127cで分割された周波数帯域信号との、それぞれ対応する周波数帯域毎のゲイン比を検出し、量子化する。
ここでゲイン比を検出する方法は、対応する帯域毎の振幅の最大値どうしを比較する方法や、エネルギーレベルを比較する方法など、どのような方法でもよく、そのようにして検出されたゲイン比を第1の量子化部128aで量子化する。
次に、第2の量子化部128bでは、第2の分割部127bで分割された周波数帯域信号と第4の分割部127dで分割された周波数帯域信号との、それぞれ対応する周波数帯域毎の位相差を検出し、量子化する。
ここで、位相差を検出する方法は、当該周波数帯域内の、フーリエ級数の、実数値と虚数値の代表値から位相角と求める方法など、どのような方法でもよく、そのようにして検出された位相差を第2の量子化部128bで量子化する。
ここで注意すべきことは、第1の分割部127aと、第3の分割部127cとは、共に図9のテーブルに示された分割の仕方で、それぞれ、第1の入力オーディオ信号の周波数信号と第2の入力オーディオ信号の周波数信号とを分割しているので、比較的高域まで細かい周波数毎の分割が行われている。
これに対して、第2の分割部127bと第4の分割部127dとは、共に図10のテーブルに示された分割の仕方で、それぞれ、第1の入力オーディオ信号の周波数信号と第2の入力オーディオ信号の周波数信号とを分割しているので、高域では粗く周波数の分割が行われていることである。
この結果として、ゲイン比情報は、比較的高域まで細かい周波数毎検出され量子化されるが、位相差情報については、高域側では粗く検出され量子化されることになる。これは、高域信号については、位相情報を正確に検知できないという聴覚の特性を考慮したものであり、これによって、聴覚的な音質劣化を少なく留めながら、情報量の削減を行うことができることになる。
上記においては、説明の簡単化のために、周波数信号の分割の仕方はテーブルによって予め設定されるとしたが、必ずしもその必要がないことはいうまでもない。つまり、入力信号に応じて、周波数信号の分割の仕方を適宜設定し、当該分割の仕方を示す情報も符号化するという方法でもよい。
その場合、上記分割の仕方は、以下のように行ってもよい。すなわち、分割されることによって得られるそれぞれのグループ(Group)が有する帯域信号の数を低域の周波数帯域から順次所望の幅(Stride)毎にまとめることによって行う、という方法である。
最後に、このようにして量子化されたゲイン比情報と位相差情報とは、所定のルールでフォーマットされビットストリームが形成されるが、それはどのような方法であってもよい。
以上のように本実施の形態3によれば、位相差情報をゲイン比情報より粗い周波数分割で量子化することで、聴覚的な音質劣化を少なくしながら、情報量の削減を行うことができることになる。
なお、本実施の形態3では、周波数分割を粗くすることによって、位相差情報の情報量を削減したが、位相差情報の情報量を削減する方法としては、他にも例えば、個々の周波数帯域毎の位相差情報の量子化精度をゲイン比情報の量子化精度よりも粗くするなどの方法もある。
例えば、図11に示すように、位相差情報の量子化精度をゲイン比情報の量子化精度より粗く設定するのである。これも位相差情報の聴覚上の知覚感度が、ゲイン比情報の聴覚上の知覚感度より鈍いという特性に基づいている。図11においても、値は勿論一例に過ぎず、サンプリング周波数やビットレートに応じて適切に設定すればよいが、量子化に際しては、位相差情報に用いるビット数をゲイン比情報に用いるビット数より少なくすることによって、聴感上の音質劣化をできるだけ少なく留めながら高圧縮を実現できる。
また、本実施の形態3では、ゲイン比情報に関する周波数の分割を図9に基づいて行い、位相差情報に関する周波数の分割を図10に基づいて行ったが、例えば、ゲイン比情報に関する周波数の分割を図12に基づいて行い、位相差情報に関する周波数の分割を図13に基づいて行ってもよい。
図9と図12とを比較すれば、図12の方が図9より周波数の分割が粗くなっており、図10と図13とを比較すれば、図13の方が図10より周波数の分割が粗くなっている。従って、分割の仕方を決めるテーブルとして、図12、図13に示したものを選択すると、量子化した際の情報量の削減が可能となる。従って、複数のビットレートの動作モードを備えるエンコーダの場合、低いビットレートでの動作時は、周波数の分割の仕方を変えるようにすればよいこととなる。この場合には、帯域番号を合わせて量子化精度テーブル1281を用いてもよく、この量子化精度テーブル1281よりも低ビットレート用の量子化精度テーブルを用意して用いてもよい。
ここで、本発明の本願発明の特徴を説明する。
図14(a).図14(b)に示されるように、ビットレートビットレートに応じて、帯域の分け方を変更するようにしている。これにより、音質劣化を少なくしつつ、低ビットレート化を図ることができる。
また、図14(c).図14(d)に示されるように、位相差情報は、ゲイン差情報より粗いバンドの切り方で符号化するようにしている。また、位相差情報は、ゲイン差情報より粗い量子化精度で量子化するようにしている。
従って、これにより、音質劣化を少なくしつつ、低ビットレート化を図ることができる。
勿論ここでも説明の簡単化のために、周波数信号の分割の仕方が疎なものと密なものとが存在する例として、テーブルによって予め分割の仕方が設定されるとしたが、必ずしもその必要がないことはいうまでもない。例えば、分割されることによって得られるそれぞれのグループ(Group)が有する帯域信号の数を低域の周波数帯域から順次所望の幅(Stride)毎にまとめるという方法において、上記Strideの値を大とすることによって、分割の仕方が疎となるように設定し、上記Strideの値を小とすることによって、分割の仕方が密となるように設定してもよい。
また、上記実施の形態では2チャンネルの入力オーディオ信号について説明したが、それ以上の多チャンネルの入力オーディオ信号について適用してもよい。
例えば、5.1チャンネルのマルチチャンネル信号は、聴視者の前方正面Center、前方右FR、前方左FL、後方右BR、及び後方左BLに配置される音源からの5チャンネルのオーディオ信号と、オーディオ信号の超低域を表す0.1チャンネルの信号LFEとから構成される。この場合、混合信号符号化部11は、前方左FLと、後方左BLと、前方正面Centerと、LFEとのオーディオ信号を2つずつ混合していくことによりダウンミクス信号DLを生成し、前方右FRと、後方右BRと、前方正面Centerと、LFEとのオーディオ信号を2つずつ混合していくことによりダウンミクス信号DRを生成すればよい。また、補助情報生成部12は、ダウンミクス信号DLについて、前方左FLと、後方左BLと、前方正面Centerと、LFEとのオーディオ信号を2つずつ、レベル比および位相差を検出し、ダウンミクス信号DRについて、前方右FRと、後方右BRと、前方正面Centerと、LFEとのオーディオ信号を2つずつレベル比および位相差を検出すればよい。
本発明に係るオーディオエンコーダは、マルチチャンネル信号を符号化するオーディオエンコーダであるが、特にマルチマルチチャンネル間の位相差やレベル差を非常に少ないビット数で表現できるので、低ビットレートでの音楽放送サービスや、音楽配信サービスに用いられる機器および携帯電話機などのモバイル機器や、AV機器など、その受信機器に適用するのに適している。
図1は、本発明に係るオーディオエンコーダが適用される、オーディオ信号符号化・復号化システムの全体構成を示すブロック図である。 図2は、2チャンネルのオーディオ信号と、混合信号と、ゲイン比と、位相差との周波数軸上における関係を示す図である。 図3は、オーディオエンコーダ10から出力されるビットストリームのフォーマット構成を示す図である。 図4は、図1に示される補助情報生成部の詳細な構成例を示すブロック図である。 図5は、量子化精度設定テーブル124の一例を示す図である。 図6は、従来技術と本願発明とを対比して説明するための図である。特に図6(a)は、従来技術における量子化精度を示す図であり、図6(b)は、本願発明における量子化精度を示す図である。 図7は、本実施の形態2における補助情報生成部の他の詳細な構成例を示すブロック図である。 図8は、本実施の形態3における補助情報生成部のさらに他の詳細な構成例を示すブロック図である。 図9は、ゲイン比情報に関する周波数分割テーブル1271の一例を示す図である。 図10は、位相差情報に関する周波数分割テーブル1272の一例を示す図である。 図11は、ゲイン比情報の量子化精度と、位相差情報の量子化精度とを別々に設定した量子化精度テーブル1281の一例を示す図である。 図12は、低ビットレートモードでの動作時のゲイン比情報に関する周波数分割テーブルの一例を示す図である。 図13は、低ビットレートモードでの動作時の位相差情報に関する周波数分割テーブルの一例を示す図である。 図14は、本願発明の特徴を説明するための図である。特に図14(a),図14(b)は、高ビットレート時および低ビットレート時における量子化精度を比較して示す図であり、図14(c),図14(d)は、位相差情報およびゲイン比情報における量子化精度を比較して示す図である。
符号の説明
10 オーディオエンコーダ
11 混合信号符号化部
12 補助情報生成部
13 フォーマッタ
121 第1の変換部
122 第2の変換部
123 検出部
124 量子化精度設定テーブル
125 量子化部
126 圧縮部
127a 第1の分割部
127b 第2の分割部
127c 第3の分割部
127d 第4の分割部
128a 第1の量子化部
128b 第2の量子化部
1271 周波数分割テーブル
1272 周波数分割テーブル
1281 量子化精度テーブル

Claims (20)

  1. Nチャンネル(N>1)のオーディオ信号を圧縮符号化するオーディオエンコーダであって、
    前記オーディオ信号を混合することにより得られた混合信号を、符号化する混合信号符号化手段と、
    前記混合信号符号化手段により符号化された混合信号から前記Nチャンネルのオーディオ信号に復号化するために必要な補助情報を生成する補助情報生成手段とを含み、
    前記補助情報生成手段は、
    前記オーディオ信号を周波数領域の信号にそれぞれ変換する変換手段と、
    前記周波数領域の信号の周波数帯域を複数に分割する分割手段と、
    前記周波数領域の信号間の相違の度合いを表す位相差情報とゲイン比情報とを検出する検出手段と、
    前記検出手段により検出された位相差情報とゲイン比情報とを、対応する周波数帯域毎に量子化する量子化手段とを備え
    前記分割手段は、前記位相差情報を量子化するための周波数帯域と、前記ゲイン比情報を量子化するための周波数帯域とを、異なる仕方で分割する
    ことを特徴とするオーディオエンコーダ。
  2. 前記分割の仕方は、分割されることによって得られるそれぞれのグループ(Group)が有する帯域信号の数を、低域の周波数帯域から順次所望の幅(Stride)毎にまとめることによって行う
    ことを特徴とする請求項記載のオーディオエンコーダ
  3. 前記位相差情報を量子化するための周波数帯域を分割する仕方は、前記ゲイン比情報を量子化するための周波数帯域の分割の仕方よりも粗く分割する
    ことを特徴とする請求項記載のオーディオエンコーダ。
  4. 前記補助情報生成手段は、さらに
    周波数帯域の分割の仕方を規定する第1のテーブルと、
    前記第1のテーブルよりも粗い周波数帯域の分割の仕方を規定する第2のテーブルとを備え、
    前記分割手段は、前記第1および第2のテーブルを切り換えることで、周波数帯域の分割の仕方を適宜変更する
    ことを特徴とする請求項1記載のオーディオエンコーダ。
  5. 前記補助情報生成手段は、さらにビットレートを指定するビットレート指定手段を備え、
    前記分割手段は、前記ビットレート指定手段で指定されたビットレートに応じて、周波数帯域の分割の仕方を変更する
    ことを特徴とする請求項記載オーディオエンコーダ。
  6. 前記分割手段は、ビットレートが高い場合は、前記第1のテーブルの規定に従って周波数帯域を分割し、ビットレートが低い場合は、前記第2のテーブルの規定に従って周波数帯域を分割する
    ことを特徴とする請求項記載のオーディオエンコーダ。
  7. 前記量子化手段での量子化の精度は、各周波数帯域毎に設定される
    ことを特徴とする請求項1記載のオーディオエンコーダ。
  8. 前記量子化手段での量子化の精度は、低い周波数帯域に対する精度ほど細かく設定される
    ことを特徴とする請求項記載のオーディオエンコーダ。
  9. 前記量子化手段での量子化の精度は、聴覚の感度特性応じて設定される
    ことを特徴とする請求項記載のオーディオエンコーダ。
  10. 前記補助情報生成手段は、さらに前記量子化手段で量子化された複数の量子化値を可逆圧縮する圧縮手段を備える
    ことを特徴とする請求項記載のオーディオエンコーダ。
  11. 前記圧縮手段は、隣接する周波数帯域の量子化値の差分を求めることでビット数を削減する
    ことを特徴とする請求項1記載のオーディオエンコーダ。
  12. 前記圧縮手段は、周波数帯域間の量子化値が等しい場合は、連続して何回等しいかを表すランレングス符号化することによってビット数を削減する
    ことを特徴とする請求項1記載のオーディオエンコーダ。
  13. 前記圧縮手段は、可変長符号化処理を用いてビット数を削減する
    ことを特徴とする請求項1記載のオーディオエンコーダ。
  14. 前記量子化手段は、前記検出手段により検出された相違の度合いをA個のレベルを有する量子化値で量子化し、
    前記圧縮手段は、前記量子化されたB個の量子化値をまとめて圧縮する
    ことを特徴とする請求項1記載のオーディオエンコーダ。
  15. 前記Bの値は、前記Aの値に応じて予め設定される
    ことを特徴とする請求項1記載のオーディオエンコーダ。
  16. 前記Bの値は、Aを2進数で表現した時の桁数をPとし、
    B桁のA進数を2進数で表現した時の桁数をQとした時、QがP*Bより小さな値となるような値である
    ことを特徴とする請求項1記載のオーディオエンコーダ。
  17. 前記量子化手段は、前記位相差情報を前記ゲイン比情報より少ないビット数で量子化する
    ことを特徴とする請求項1記載のオーディオエンコーダ。
  18. Nチャンネル(N>1)のオーディオ信号を圧縮符号化する符号化方法であって、
    前記オーディオ信号を混合することにより得られた混合信号を、符号化する混合信号符号化ステップと、
    前記混合信号符号化ステップにより符号化された混合信号から前記Nチャンネルのオーディオ信号に復号化するために必要な補助情報を生成する補助情報生成ステップとを含み、
    前記補助情報生成ステップは、
    前記オーディオ信号を周波数領域の信号にそれぞれ変換する変換ステップと、
    前記周波数領域の信号の周波数帯域を複数に分割する分割ステップと、
    前記周波数領域の信号間の相違の度合いを表す位相差情報とゲイン比情報とを検出する検出ステップと、
    前記検出ステップにより検出された位相差情報とゲイン比情報とを、対応する周波数帯域毎に量子化する量子化ステップとを含み、
    前記分割ステップでは、前記位相差情報を量子化するための周波数帯域と、前記ゲイン比情報を量子化するための周波数帯域とを、異なる仕方で分割する
    ことを特徴とする符号化方法。
  19. 請求項1に記載の符号化方法に含まれるステップをコンピュータに実行させるためのプログラム。
  20. Nチャンネル(N>1)のオーディオ信号を圧縮符号化するLSIであって、
    前記オーディオ信号を混合することにより得られた混合信号を、符号化する混合信号符号化手段と、
    前記混合信号符号化手段により符号化された混合信号から前記Nチャンネルのオーディオ信号に復号化するために必要な補助情報を生成する補助情報生成手段とを一体的に含み、
    前記補助情報生成手段は、
    前記オーディオ信号を周波数領域の信号にそれぞれ変換する変換手段と、
    前記周波数領域の信号の周波数帯域を複数に分割する分割手段と、
    前記周波数領域の信号間の相違の度合いを表す位相差情報とゲイン比情報とを検出する検出手段と、
    前記検出手段により検出された位相差情報とゲイン比情報とを、対応する周波数帯域毎に量子化する量子化手段とを備え
    前記分割手段は、前記位相差情報を量子化するための周波数帯域と、前記ゲイン比情報を量子化するための周波数帯域とを、異なる仕方で分割する
    ことを特徴とするLSI。
JP2006531857A 2004-08-27 2005-08-18 オーディオエンコーダ Active JP4794448B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006531857A JP4794448B2 (ja) 2004-08-27 2005-08-18 オーディオエンコーダ

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2004248990 2004-08-27
JP2004248990 2004-08-27
JP2006531857A JP4794448B2 (ja) 2004-08-27 2005-08-18 オーディオエンコーダ
PCT/JP2005/015083 WO2006022190A1 (ja) 2004-08-27 2005-08-18 オーディオエンコーダ

Publications (2)

Publication Number Publication Date
JPWO2006022190A1 JPWO2006022190A1 (ja) 2008-05-08
JP4794448B2 true JP4794448B2 (ja) 2011-10-19

Family

ID=35967403

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006531857A Active JP4794448B2 (ja) 2004-08-27 2005-08-18 オーディオエンコーダ

Country Status (4)

Country Link
US (1) US7848931B2 (ja)
JP (1) JP4794448B2 (ja)
CN (1) CN101010724B (ja)
WO (1) WO2006022190A1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8385556B1 (en) * 2007-08-17 2013-02-26 Dts, Inc. Parametric stereo conversion system and method
CN101809653A (zh) * 2007-12-06 2010-08-18 Lg电子株式会社 用于处理音频信号的方法和装置
KR20100086000A (ko) * 2007-12-18 2010-07-29 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US8060042B2 (en) * 2008-05-23 2011-11-15 Lg Electronics Inc. Method and an apparatus for processing an audio signal
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
KR20110022252A (ko) * 2009-08-27 2011-03-07 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
WO2012093290A1 (en) * 2011-01-05 2012-07-12 Nokia Corporation Multi-channel encoding and/or decoding
JP5929301B2 (ja) * 2012-02-23 2016-06-01 オンキヨー株式会社 時間差補正方法、音声信号処理装置、再生装置およびプログラム
US10300281B2 (en) 2012-03-09 2019-05-28 Mayo Foundation For Medical Education And Research Modulating afferent signals to treat medical conditions
CN103812824A (zh) * 2012-11-07 2014-05-21 中兴通讯股份有限公司 音频多编码传输方法及相应装置
WO2014174344A1 (en) * 2013-04-26 2014-10-30 Nokia Corporation Audio signal encoder
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
WO2015104447A1 (en) 2014-01-13 2015-07-16 Nokia Technologies Oy Multi-channel audio signal classifier
JP6567691B2 (ja) * 2015-05-20 2019-08-28 テレフオンアクチーボラゲット エルエム エリクソン(パブル) マルチチャネルオーディオ信号のコード化
CN108694955B (zh) 2017-04-12 2020-11-17 华为技术有限公司 多声道信号的编解码方法和编解码器
IL307898A (en) 2018-07-02 2023-12-01 Dolby Laboratories Licensing Corp Methods and devices for encoding and/or decoding embedded audio signals
JP7092047B2 (ja) * 2019-01-17 2022-06-28 日本電信電話株式会社 符号化復号方法、復号方法、これらの装置及びプログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07336232A (ja) * 1994-06-13 1995-12-22 Sony Corp 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体
JPH0846518A (ja) * 1994-07-28 1996-02-16 Sony Corp 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
JPH08166799A (ja) * 1994-12-15 1996-06-25 Sony Corp 高能率符号化方法及び装置
JP2001306097A (ja) * 2000-04-26 2001-11-02 Matsushita Electric Ind Co Ltd 音声符号化方式及び装置、音声復号化方式及び装置、並びに記録媒体
WO2003090206A1 (en) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. Signal synthesizing
WO2003090208A1 (en) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. pARAMETRIC REPRESENTATION OF SPATIAL AUDIO
WO2003090207A1 (en) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
DE19721487A1 (de) * 1997-05-23 1998-11-26 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Fehlerverschleierung bei Mehrkanaltonsignalen
JP3352406B2 (ja) * 1998-09-17 2002-12-03 松下電器産業株式会社 オーディオ信号の符号化及び復号方法及び装置
JP2000260855A (ja) * 1999-03-10 2000-09-22 Mitsubishi Electric Corp ウェハ処理装置
NL1013938C2 (nl) * 1999-12-23 2001-06-26 Asm Int Inrichting voor het behandelen van een wafer.
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
WO2004098105A1 (en) * 2003-04-30 2004-11-11 Nokia Corporation Support of a multichannel audio extension

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07336232A (ja) * 1994-06-13 1995-12-22 Sony Corp 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体
JPH0846518A (ja) * 1994-07-28 1996-02-16 Sony Corp 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
JPH08166799A (ja) * 1994-12-15 1996-06-25 Sony Corp 高能率符号化方法及び装置
JP2001306097A (ja) * 2000-04-26 2001-11-02 Matsushita Electric Ind Co Ltd 音声符号化方式及び装置、音声復号化方式及び装置、並びに記録媒体
WO2003090206A1 (en) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. Signal synthesizing
WO2003090208A1 (en) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. pARAMETRIC REPRESENTATION OF SPATIAL AUDIO
WO2003090207A1 (en) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation
JP2005523480A (ja) * 2002-04-22 2005-08-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間的オーディオのパラメータ表示
JP2005523624A (ja) * 2002-04-22 2005-08-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 信号合成方法
JP2005523479A (ja) * 2002-04-22 2005-08-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ パラメータによるマルチチャンネルオーディオ表示

Also Published As

Publication number Publication date
CN101010724A (zh) 2007-08-01
CN101010724B (zh) 2011-05-25
WO2006022190A1 (ja) 2006-03-02
WO2006022190A9 (ja) 2006-05-11
JPWO2006022190A1 (ja) 2008-05-08
US7848931B2 (en) 2010-12-07
US20070271095A1 (en) 2007-11-22

Similar Documents

Publication Publication Date Title
JP4794448B2 (ja) オーディオエンコーダ
TWI759240B (zh) 用以使用量化及熵寫碼來編碼或解碼方向性音訊寫碼參數之設備及方法
JP4934427B2 (ja) 音声信号復号化装置及び音声信号符号化装置
CN1758337B (zh) 用于低比特率音频编码应用的高效可标度参数立体声编码
RU2388068C2 (ru) Временное и пространственное генерирование многоканальных аудиосигналов
JP5934922B2 (ja) 復号装置
KR101102401B1 (ko) 오브젝트 기반 오디오 신호의 부호화 및 복호화 방법과 그 장치
RU2367033C2 (ru) Многоканальное иерархическое аудиокодирование с компактной дополнительной информацией
KR100955361B1 (ko) 적응 잔류 오디오 코딩
TWI396187B (zh) 用於將以物件為主之音訊信號編碼與解碼之方法與裝置
US8817992B2 (en) Multichannel audio coder and decoder
US20090234657A1 (en) Energy shaping apparatus and energy shaping method
JP2008530616A (ja) ニアトランスペアレントまたはトランスペアレントなマルチチャネルエンコーダ/デコーダ構成
KR20070001139A (ko) 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들
KR20220062599A (ko) 공간적 오디오 파라미터 인코딩 및 연관된 디코딩의 결정
WO2019105575A1 (en) Determination of spatial audio parameter encoding and associated decoding
CA3212985A1 (en) Combining spatial audio streams
WO2022223133A1 (en) Spatial audio parameter encoding and associated decoding
WO2017148526A1 (en) Audio signal encoder, audio signal decoder, method for encoding and method for decoding
EP4162487A1 (en) Spatial audio parameter encoding and associated decoding

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080801

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110609

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110705

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110726

R150 Certificate of patent or registration of utility model

Ref document number: 4794448

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140805

Year of fee payment: 3