JP2012527021A - 効率的なダウンミキシングを使ったオーディオ・デコーダおよびデコード方法 - Google Patents
効率的なダウンミキシングを使ったオーディオ・デコーダおよびデコード方法 Download PDFInfo
- Publication number
- JP2012527021A JP2012527021A JP2012512088A JP2012512088A JP2012527021A JP 2012527021 A JP2012527021 A JP 2012527021A JP 2012512088 A JP2012512088 A JP 2012512088A JP 2012512088 A JP2012512088 A JP 2012512088A JP 2012527021 A JP2012527021 A JP 2012527021A
- Authority
- JP
- Japan
- Prior art keywords
- downmixing
- data
- channels
- channel
- audio data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 189
- 238000012545 processing Methods 0.000 claims description 236
- 230000001052 transient effect Effects 0.000 claims description 76
- 230000008569 process Effects 0.000 claims description 52
- 230000009466 transformation Effects 0.000 claims description 35
- 230000000694 effects Effects 0.000 claims description 28
- 230000001131 transforming effect Effects 0.000 claims description 20
- 238000012856 packing Methods 0.000 claims description 18
- 238000012360 testing method Methods 0.000 claims description 16
- 230000001419 dependent effect Effects 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 10
- 238000005562 fading Methods 0.000 claims description 3
- 239000000872 buffer Substances 0.000 description 44
- 230000007704 transition Effects 0.000 description 39
- 230000006870 function Effects 0.000 description 28
- 238000010586 diagram Methods 0.000 description 23
- 230000008859 change Effects 0.000 description 15
- 230000008878 coupling Effects 0.000 description 14
- 238000010168 coupling process Methods 0.000 description 14
- 238000005859 coupling reaction Methods 0.000 description 14
- 230000003595 spectral effect Effects 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 13
- 239000011159 matrix material Substances 0.000 description 9
- 239000000203 mixture Substances 0.000 description 8
- 238000013139 quantization Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 241000610375 Sparisoma viride Species 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 230000009977 dual effect Effects 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 229920005994 diacetyl cellulose Polymers 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 238000011010 flushing procedure Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/02—Spatial or constructional arrangements of loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
Description
本願は、2010年2月5日に出願された米国仮特許出願第61/305,871号および2010年6月29日に出願された米国仮特許出願第61/359,763号の優先権を主張するものである。両文献はここに参照によってその全体において組み込まれる。
本開示は概括的にはオーディオ信号処理に関する。
本発明の実施形態は、方法、装置および一つまたは複数のコンピュータ可読の有形の媒体にエンコードされた諸工程を実行するための論理を含む。
拡張AC-3(E-AC-3: Extended AC-3)規格に従って符号化ビットストリームに符号化されたオーディオを復号するための本発明の諸実施形態について述べる。E-AC-3およびそれ以前のAC-3規格は非特許文献1において詳細に記載されている。しかしながら、本発明はE-AC-3でエンコードされたビットストリームの復号に限定されるものではなく、別の符号化方法に従ってエンコードされたビットストリームのデコーダおよび復号や、そのような復号方法、符号装置、そのような復号を実行するシステム、実行されたときに一つまたは複数のプロセッサにそのような復号を実行させるソフトウェアおよび/またはそのようなソフトウェアが記憶されている有形の記憶媒体にも適用されうる。たとえば、本発明の諸実施形態は、MPEG-2 AAC(ISO/IEC 13818-7)およびMPEG-4オーディオ(ISO/IEC 14496-3)規格に従って符号化されたオーディオの復号にも適用可能である。MPEG-4オーディオ規格は、高効率AACバージョン1(HE-AAC v1: High Efficiency AAC version 1)および高効率AACバージョン2(HE-AAC v2)符号化の両方を含む。これらは本稿ではまとめてHE-AACと称される。
x86という用語は、インテル8086プロセッサに起源をもつプロセッサ命令セット・アーキテクチャーのファミリーを指すことが当業者によって一般に理解される。このアーキテクチャーは、インテル、サイリックス、AMD、VIAおよび他の多くの会社からのプロセッサにおいて実装されてきた。一般に、この用語は、インテル80386プロセッサの32ビット命令セットとのバイナリー互換性を含意するものと理解される。今日(2010年初頭)、x86アーキテクチャーはデスクトップおよびノートブック・コンピュータの間ではあまねく広まっており、またサーバーおよびワークステーションの間でも多数派として増えつつある。MS-DOS、ウィンドウズ、リナックス、BSD、ソラリスおよびMac OS Xといった多くのソフトウェアがこのプラットフォームをサポートしている。
複数チャンネル・オーディオ信号のAC-3ビットストリームはフレームから構成される。フレームは、すべての符号化されたチャンネルにわたるオーディオ信号の1536個のパルス符号変調(PCM)されたサンプルの一定の時間期間を表す。五つまでのメイン・チャンネルおよび任意的に、「.1」と表される低周波数効果(LFE: low frequency effects)チャンネルが提供される。すなわち、5.1チャンネルまでのオーディオが提供される。各フレームは固定サイズをもち、そのサイズはサンプル・レートおよび符号化されるデータ・レートのみに依存する。
典型的なAC-3デコーダ実装では、メモリおよびデコーダ・レイテンシ要求をできるだけ小さくしておくため、各AC-3フレームは一連のネストされたループにおいて復号される。
本発明の個別的な実施形態は、M.mチャンネルの復号されたオーディオを含む復号オーディオ・データを形成するよう、エンコードされたオーディオ・データのN.nで表されるある数のチャンネルを含むオーディオ・データを復号するオーディオ・デコーダ、たとえばE-AC-3エンコードされたオーディオ・データを復号するE-AC-3オーディオ・デコーダを動作させる方法を含む。ここで、n=0または1であり、m=0または1であり、M≧1である。n=1は一つの入力LFEチャンネルを示し、m=1は一つの出力LFEチャンネルを示す。M<Nであることはダウンミキシングを示し、M>Nであることはアップミキシングを示す。
本発明のある実施形態は、それぞれ高々5.1チャンネルをもつ「メイン」および「付随」と表される二つのAC-3/E-AC-3入力ビットストリームを復号してPCMオーディオにし、変換の場合、メイン・オーディオ・ビットストリームをE-AC-3からAC-3に変換し、復号の場合、メイン・ビットストリームおよびもし存在すれば付随ビットストリームを復号する、デュアル・デコーダ変換器(DDC: dual decoder converter)の形である。デュアル・デコーダ変換器は、任意的に、付随オーディオ・ビットストリームから抽出された混合メタデータを使って、二つのPCM出力を混合する。
フロントエンド復号モジュールは、AC-3の方法に従って、かつ定常信号用のAHTデータの復号、E-AC-3の向上したチャンネル結合およびスペクトル拡張を含むE-AC-3の追加的な復号側面に従って、データを復号する。
バックエンド復号(BED)モジュールは、周波数領域の指数および仮数データを受けて、それをPCMオーディオ・データに復号するよう動作する。PCMオーディオ・データは、ユーザー選択されたモード、ダイナミックレンジ圧縮およびダウンミックスに基づいてレンダリングされる。
E-AC-3エンコードおよびデコードは、AC-3よりも低いデータ・レートで動作し、よりよいオーディオ品質を与えるよう設計されたものである。より低いデータ・レートでは、符号化されたオーディオのオーディオ品質は、特に比較的符号化困難な過渡的な素材について、負の影響を受けることがある。オーディオ品質に対するこの影響は、主として、こうした型の信号を正確に符号化するために利用可能なデータ・ビットの数が限られていることによる。過渡信号の符号化アーチファクトは、当該過渡信号の精細度(definition)の低下ならびに「過渡プレノイズ」アーチファクトとして示される。「過渡プレノイズ(transient pre-noise)」アーチファクトは、符号化量子化誤差のため、エンコード窓全体にわたって可聴ノイズを広げる(smear)。
N.nがE-AC-3ビットストリームにおいてエンコードされるチャンネルの数を表すことにする。Nはメイン・チャンネルの数、n=0または1はLFEチャンネルの数である。しばしば、N個のメイン・チャンネルを、Mと表されるより少数の出力メイン・チャンネルにダウンミックスすることが所望される。M<NとしてNチャンネルからMチャンネルへのダウンミックスは、本発明の諸実施形態によってサポートされる。アップミックスも可能であり、その場合、M>Nである。
ダウンミキシングは完全に周波数領域で、逆変換の前に行うこともできるし、逆変換後、ただし重複加算ブロック処理の場合には窓処理および重複加算演算の前に時間領域で行うこともできるし、あるいは窓処理および重複加算演算後に時間領域で行うこともできる。
エンコードされるべきオーディオ内容に依存して、E-AC-3エンコーダは、オーディオ・データをセグメント分割するのに、短いブロックおよび長いブロックという二つの異なるブロック型の間で選択をすることができる。倍音的(harmonic)でゆるやかに変化するオーディオ・データは典型的には長いブロックを使ってセグメント分割およびエンコードされ、一方、過渡信号は短いブロックを使ってセグメント分割およびエンコードされる。結果として、短いブロックおよび長いブロックの周波数領域表現は本来的に異なっており、周波数領域のダウンミキシング動作では組み合わせられない。
出力メイン・チャンネルの数が入力メイン・チャンネルの数より多い、M>Nの場合、時間領域混合のアプローチは有益である。これはアップミキシング段階を処理の終わりのほうに繰り下げ、処理におけるチャンネル数を減らすからである。
過渡プレノイズ処理(TPNP)にかけらるブロックは、TPNPが時間領域で動作するため、周波数領域ではダウンミックされえないことがありうる。TPNPは、4つまでのブロックのPCMデータ(1024個のサンプル)の履歴を必要とし、それがTPNPが適用されるチャンネルについて存在していなければならない。よって、PCMデータ履歴を埋め、プレノイズ置換を実行するために時間領域ダウンミックスへの切り換えが必要となる。
本発明者らは、大半の符号化されたオーディオ信号におけるチャンネルは、90%より多くの時間にわたって同じブロック型を使うことを認識している。これは、TPNPがないとして、典型的な符号化オーディオ中のデータの90%より多くについて、より効率がよい周波数領域ダウンミキシングが機能するということを意味している。残りの10%以下が、典型的な従来技術のE-AC-3デコーダにおいて行われるような時間領域ダウンミキシングを必要とすることになる。
復号において、オーディオ・ブロック間のなめらかな遷移をもつことが必要である。E-AC-3および他の多くのエンコード方法は、ラップ変換(lapped transform)、たとえば50%重複(overlapping)MDCTを使う。よって、現在ブロックを処理するとき、直前のブロックとの50%の重なりがあり、さらに、時間領域で次のブロックとの間に50%の重なりがある。本発明のいくつかの実施形態は、重複加算バッファを含む重複加算論理を使う。現在ブロックを処理するとき、重複加算バッファは直前のオーディオ・ブロックからのデータを含む。オーディオ・ブロック間でなめらかな遷移をもつことが必要なので、TDダウンミキシングからFDダウンミキシングへ、および、FDダウンミキシングからTDダウンミキシングへの遷移を異なる仕方で扱う論理が含められる。
R'で表される右出力=aC+bR+cRS。
TDダウンミキシング・ブロックの直後のFDダウンミキシング・ブロックであるブロックk+1を考えよう。TDダウンミキシング後、重複加算バッファは直前ブロックからのL、C、R、LSおよびRSデータを含み、これが現在ブロックのために含められる必要がある。また、すでにFDダウンミックスされている現在ブロックk+1の寄与も含められる。出力のためのダウンミックスされたPCMデータを適正に決定するために、現在ブロックおよび直前ブロックのデータが含められる必要がある。このために、直前ブロックのデータは、フラッシュ・アウトされ、まだダウンミキシングされていないので時間領域でダウンミキシングされる必要がある。出力のためのダウンミックスされたPCMデータを決定するために、これら二つの寄与が加算されなければならない。この処理は、図7および図8のTDダウンミックス遷移論理715に、および図5Bに示されるFDダウンミックス・モジュールに含まれるTDダウンミックス遷移論理中のコードによって、含められる。そこで実行される処理は、図8のTDダウンミックス遷移論理セクション715においてまとめられている。より詳細には、TDダウンミックスからFDダウンミックスへの遷移のための遷移処理は、下記を含む。
FDダウンミキシング・ブロックk+2の直後のTDダウンミキシング・ブロックであるブロックk+3を考えよう。直前ブロックがFDダウンミキシング・ブロックだったので、より早い段階、たとえばTDダウンミキシング前の重複加算バッファは、左および右のチャンネルにはダウンミックスされたデータを含み、他のチャンネルにはデータを含まない。現在ブロックの寄与がダウンミックスされるのは、TDダウンミキシング後のことである。出力のためのダウンミックスされたPCMデータを適正に決定するために、現在ブロックおよび直前ブロックのデータが含められる必要がある。このために、直前ブロックのデータは、フラッシュ・アウトされる必要がある。出力のためのダウンミックスされたPCMデータを決定するためには、現在ブロックのデータは、時間領域でダウンミキシングされ、フラッシュ・アウトされた逆変換されたデータに加えられる必要がある。この処理は、図7および図8のFDダウンミックス遷移論理723に、および図5Bに示されるFDダウンミックス遷移論理モジュールに含まれるコードによって、含められる。そこで実行される処理は、図8のFDダウンミックス遷移論理セクション723においてまとめられている。より詳細には、各出力チャンネルについて出力PCMバッファがあるとして、FDダウンミックスからTDダウンミックスへの遷移のための遷移処理は、下記を含む。
ダウンミキシングはいくつかの問題を生じうる。異なるダウンミックスの式が異なる状況において求められる。よって、ダウンミックス係数は、信号条件に基づいて動的に変化する必要があることがある。最適な結果を求めてダウンミックス係数を調整することを許容するメタデータ・パラメータが利用可能である。
c[i]=w2[i]・cnew+w2[255−i]・cold i=0,…255
となる。
c[i]=w2[i]・cnew+w2[255−i]・cnew=cnew
となる。
本発明者は、多くのオーディオ・ストリームおよびダウンミキシング状況において、ミキシング係数はしばしば変化しないことを観察した。時間領域ダウンミキシング・プロセスのパフォーマンスを改善するため、時間領域ダウンミキシング・モジュールの諸実施形態は、ダウンミキシング係数がその前の値から変化しているかどうかを見きわめるべく試験し、変化していなければダウンミキシングを実行し、変化していれば、事前選択された正の窓関数に従ってダウンミキシング係数のクロスフェードを実行することを含む。ある実施形態では、窓関数は、窓処理および重複加算演算において使用されるのと同じ窓関数である。別の実施形態では、異なる窓関数が使用される。
いくつかのダウンミキシング状況では、ダウンミックスされる出力に寄与しない少なくとも一つのチャンネルがある。たとえば、5.1オーディオからステレオへのダウンミックスの多くの場合、LFEチャンネルは含められない。よって、ダウンミックスは5.1から2.0である。LFEチャンネルをダウンミックスから除外することは、AC-3の場合のように、符号化フォーマットにとって本来的であってもよいし、E-AC-3の場合のように、メタデータによって制御されてもよい。E-AC-3では、lfemixlevcodeパラメータが、LFEチャンネルがダウンミックスに含められるかどうかを決定する。lfemixlevcodeパラメータが0のとき、LFEチャンネルはダウンミックスに含められない。
Claims (78)
- N.nチャンネルのオーディオ・データのエンコードされたブロックを含むオーディオ・データを復号してM.mチャンネルの復号されたオーディオを含む復号オーディオ・データを形成するオーディオ・デコーダを動作させる方法であって、M≧1であり、nはエンコードされたオーディオ・データにおける低周波数効果チャンネルの数であり、mは復号オーディオ・データにおける低周波数効果チャンネルの数であり、当該方法は:
N.nチャンネルのデジタル・オーディオ・データを変換して周波数領域の指数および仮数データを形成し、パッキングすることを含むエンコード方法によってエンコードされた、N.nチャンネルのエンコード・オーディオ・データのブロックを含むオーディオ・データを受け入れる段階と;
受け入れたオーディオ・データを復号する段階とを含み、前記復号する段階は:
前記周波数領域の指数および仮数データをアンパックおよび復号する段階と;
アンパックされ復号された周波数領域の指数および仮数データから変換係数を決定する段階と;
前記周波数領域データを逆変換し、さらなる処理を適用してサンプリングされたオーディオ・データを決定する段階と;
M<Nの場合についてダウンミキシング・データに従って、決定されたサンプリングされたオーディオ・データの少なくともいくつかのブロックを時間領域ダウンミキシングする段階とを含み、次のA、BおよびCのうちの少なくとも一つは真であり、
Aは、前記復号する段階が、ブロックごとに、周波数領域ダウンミキシングを適用するか時間領域ダウンミキシングを適用するかを決定し、特定のブロックについて周波数領域ダウンミキシングを適用することが決定される場合、その特定のブロックについて周波数領域ダウンミキシングを適用することを含むことであり、
Bは、前記時間領域ダウンミキシングが、前記ダウンミキシング・データが前に使われたダウンミキシング・データから変わっているかどうかを試験し、もし変わっていれば、クロスフェーディングを適用してクロスフェードしたダウンミキシング・データを決定し、該クロスフェードしたダウンミキシング・データに従って時間領域ダウンミキシングし、もし変わっていなければ、前記ダウンミキシング・データに従って直接、時間領域ダウンミキシングすることを含む、ことであり、
Cは、当該方法が、前記N.n個の入力チャンネルのうちの一つまたは複数の非寄与チャンネルを同定することを含み、非寄与チャンネルとは、前記M.m個のチャンネルに寄与しないチャンネルであり、当該方法が、同定された一つまたは複数の非寄与チャンネルに対しては、前記周波数領域データの逆変換および前記さらなる処理の適用を実行しない、ことである、
方法。 - 請求項1記載の方法であって、前記エンコード方法における変換が重複変換を使用し、前記さらなる処理が、窓処理および重複加算演算を適用してサンプリングされたオーディオ・データを決定することを含む、方法。
- 請求項1または2記載の方法であって、前記エンコード方法が、前記周波数領域の指数および仮数データに関係するメタデータを形成およびパッキングすることを含み、前記メタデータは任意的に、過渡プレノイズ処理およびダウンミキシングに関係したメタデータを含む、方法。
- 請求項1ないし3のうちいずれか一項記載の方法であって、Aが真である方法。
- 請求項4記載の方法であって、周波数領域ダウンミキシングを適用するか時間領域ダウンミキシングを適用するかの決定は、過渡プレノイズ処理があるかどうかを判定し、前記N個のチャンネルのうちのいずれかが異なるブロック型を有しているかどうかを判定し、前記N個のチャンネルにおいて同じブロック型をもち、過渡プレノイズ処理をもたず、M<Nであるブロックについてのみ周波数領域ダウンミキシングが適用される、方法。
- 請求項4または5記載の方法であって、
前記エンコード方法における変換が重複変換を使用し、前記さらなる処理が、窓処理および重複加算演算を適用してサンプリングされたオーディオ・データを決定することを含み、
前記特定のブロックについて周波数領域ダウンミキシングを適用することは、直前のブロックについてのダウンミキシングが時間領域ダウンミキシングであったかどうかを判定し、直前のブロックについてのダウンミキシングが時間領域ダウンミキシングであった場合、前記特定のブロックの復号データと重ねられるべき直前のブロックのデータに対して時間領域ダウンミキシングまたは擬似時間領域におけるダウンミキシングを適用することを含み、
特定のブロックについて時間領域ダウンミキシングを適用することは、直前のブロックについてのダウンミキシングが周波数領域ダウンミキシングであったかどうかを判定し、直前のブロックについてのダウンミキシングが周波数領域ダウンミキシングであった場合、前記特定のブロックを、直前のブロックについてのダウンミキシングが周波数領域ダウンミキシングでなかった場合とは異なる仕方で処理することを含む、
方法。 - 請求項1ないし6のうちいずれか一項記載の方法であって、Bが真である、方法。
- 請求項7記載の方法であって、前記デコーダはベクトル命令を含むストリーミング単一命令複数データ拡張(SSE)を含む命令セットを有する少なくとも一つのx86プロセッサを使用し、時間領域ダウンミキシングは前記一つまたは複数のx86プロセッサの少なくとも一つの上でベクトル命令を実行することを含む、方法。
- 請求項1ないし8のうちいずれか一項記載の方法であって、Cが真である、方法。
- 請求項9記載の方法であって、n=1かつm=0であり、逆変換およびさらなる処理の適用は低周波数効果チャンネル上では実行されない、方法。
- 請求項9または10記載の方法であって、エンコードされたブロックを含むオーディオ・データは、ダウンミキシングを定義する情報を含み、一つまたは複数の非寄与チャンネルを同定することは、ダウンミキシングを定義する前記情報を使う、方法。
- 請求項11記載の方法であって、ダウンミキシングを定義する前記情報は、一つまたは複数のチャンネルが非寄与チャンネルであることを示すあらかじめ定義された値をもつミックス・レベル・パラメータを含む、方法。
- 請求項9または10記載の方法であって、一つまたは複数の非寄与チャンネルを同定することは、さらに、一つまたは複数のチャンネルが一つまたは複数の他のチャンネルに対して取るに足りない量の内容をもつかどうかを識別することを含み、チャンネルが別のチャンネルに対して取るに足りない量の内容をもつのは、そのエネルギーまたは絶対レベルが、前記別のチャンネルより少なくとも15dB低い場合である、方法。
- 請求項13記載の方法であって、チャンネルが別のチャンネルに対して取るに足りない量の内容をもつのは、そのエネルギーまたは絶対レベルが、前記別のチャンネルより少なくとも18dB低い場合である、方法。
- 請求項13記載の方法であって、チャンネルが別のチャンネルに対して取るに足りない量の内容をもつのは、そのエネルギーまたは絶対レベルが、前記別のチャンネルより少なくとも25dB低い場合である、方法。
- 請求項13記載の方法であって、一つまたは複数のチャンネルが一つまたは複数の他のチャンネルに対して取るに足りない量の内容をもつかどうかを識別することは、チャンネルの対の間の内容量の指標の差を設定可能な閾値と比較することを含む、方法。
- 請求項16記載の方法であって、前記設定可能な閾値は、複数のあらかじめ定義された値のうちの一つに設定される、方法。
- 請求項1ないし17のうちいずれか一項記載の方法であって、前記受け入れられるオーディオ・データが符号化されたデータのフレームのビットストリームの形であり、前記復号する段階は、一組のフロントエンド復号処理および一組のバックエンド復号処理に分割され、前記フロントエンド復号処理は、前記ビットストリームのフレームの前記周波数領域の指数および仮数データをアンパックおよび復号して、そのフレームについてのアンパックおよび復号された周波数領域の指数および仮数データおよびそのフレームの付随メタデータにすることを含み、前記バックエンド復号処理は、前記変換係数を決定する段階と、前記逆変換し、さらなる処理を適用する段階と、要求される過渡プレノイズ処理復号があればそれを適用する段階と、M<Nの場合にはダウンミキシングする段階とを含む、方法。
- 請求項18記載の方法であって、前記フロントエンド復号処理は、第一のパスおよびそれに続く第二のパスにおいて実行され、前記第一のパスは、ブロックごとにメタデータをアンパックし、パックされた指数および仮数のデータが記憶されている場所へのポインタを保存することを含み、前記第二のパスは、パックされた指数および仮数への保存されたポインタを使って、チャンネルごとに指数および仮数のデータをアンパックおよび復号することを含む、方法。
- 請求項1ないし19のうちいずれか一項記載の方法であって、前記エンコードされたオーディオ・データは、AC-3規格、E-AC-3規格、E-AC-3規格に対して上位互換である規格、HE-AAC規格およびHE-AAC規格に対して上位互換である規格からなる規格の集合のうちの一つに従ってエンコードされている、方法。
- 処理システムの一つまたは複数のプロセッサによって実行されたときに前記処理システムに、N.nチャンネルのオーディオ・データのエンコードされたブロックを含むオーディオ・データを復号してM.mチャンネルの復号されたオーディオを含む復号オーディオ・データを形成することを実行させる復号命令を記憶しているコンピュータ可読記憶媒体であって、M≧1であり、nはエンコードされたオーディオ・データにおける低周波数効果チャンネルの数であり、mは復号オーディオ・データにおける低周波数効果チャンネルの数であり、前記復号命令は:
実行されたときに、N.nチャンネルのデジタル・オーディオ・データを変換して周波数領域の指数および仮数データを形成し、パッキングすることを含むエンコード方法によってエンコードされた、N.nチャンネルのエンコード・オーディオ・データのブロックを含むオーディオ・データを受け入れさせる命令と;
実行されたときに、受け入れたオーディオ・データを復号させる命令とを含み、実行されたときに復号させる前記命令は:
実行されたときに、前記周波数領域の指数および仮数データをアンパックおよび復号させる命令と;
実行されたときに、アンパックされ復号された周波数領域の指数および仮数データから変換係数を決定させる命令と;
実行されたときに前記周波数領域データを逆変換し、さらなる処理を適用してサンプリングされたオーディオ・データを決定させる命令と;
実行されたときに、M<Nであるかどうかを見きわめさせる命令と;M<Nであれば、
実行されたときにダウンミキシング・データに従って、決定されたサンプリングされたオーディオ・データの少なくともいくつかのブロックを時間領域ダウンミキシングさせる命令とを含み、次のA、BおよびCのうちの少なくとも一つは真であり、
Aは、実行されたときに復号させる前記命令が、実行されたときに、ブロックごとに、周波数領域ダウンミキシングを適用するか時間領域ダウンミキシングを適用するかを決定させる命令と、実行されたときに、特定のブロックについて周波数領域ダウンミキシングを適用することが決定される場合、周波数領域ダウンミキシングを適用させる命令とを含むことであり、
Bは、前記時間領域ダウンミキシングが、前記ダウンミキシング・データが前に使われたダウンミキシング・データから変わっているかどうかを試験し、もし変わっていれば、クロスフェーディングを適用してクロスフェードしたダウンミキシング・データを決定し、該クロスフェードしたダウンミキシング・データに従って時間領域ダウンミキシングし、もし変わっていなければ、前記ダウンミキシング・データに従って直接、時間領域ダウンミキシングすることを含む、ことであり、
Cは、実行されたときに復号させる前記命令が、前記N.n個の入力チャンネルのうちの一つまたは複数の非寄与チャンネルを同定することを含み、非寄与チャンネルとは、前記M.m個のチャンネルに寄与しないチャンネルであり、前記方法が、同定された一つまたは複数の非寄与チャンネルに対しては、前記周波数領域データの逆変換およびさらなる処理の適用を実行しない、ことである、
コンピュータ可読記憶媒体。 - 請求項21記載のコンピュータ可読記憶媒体であって、前記エンコード方法における変換が重複変換を使用し、前記さらなる処理が、窓処理および重複加算演算を適用してサンプリングされたオーディオ・データを決定することを含む、コンピュータ可読記憶媒体。
- 請求項21または22記載のコンピュータ可読記憶媒体であって、前記エンコード方法が、前記周波数領域の指数および仮数データに関係するメタデータを形成およびパッキングすることを含み、前記メタデータは任意的に、過渡プレノイズ処理およびダウンミキシングに関係したメタデータを含む、コンピュータ可読記憶媒体。
- 請求項21ないし23のうちいずれか一項記載のコンピュータ可読記憶媒体であって、Aが真である、コンピュータ可読記憶媒体。
- 請求項24記載のコンピュータ可読記憶媒体であって、周波数領域ダウンミキシングを適用するか時間領域ダウンミキシングを適用するかの決定は、過渡プレノイズ処理があるかどうかを判定し、前記N個のチャンネルのうちのいずれかが異なるブロック型を有しているかどうかを判定し、周波数領域ダウンミキシングが実行されるのは、実行されたときに、前記N個のチャンネルにおいて同じブロック型をもち、過渡プレノイズ処理をもたず、M<Nであるブロックについてのみ復号させる命令によってである、コンピュータ可読記憶媒体。
- 請求項24または25記載のコンピュータ可読記憶媒体であって、
前記エンコード方法における変換が重複変換を使用し、前記さらなる処理が、窓処理および重複加算演算を適用してサンプリングされたオーディオ・データを決定することを含み、
前記特定のブロックについて周波数領域ダウンミキシングを適用することは、直前のブロックについてのダウンミキシングが時間領域ダウンミキシングであったかどうかを判定し、直前のブロックについてのダウンミキシングが時間領域ダウンミキシングであった場合、前記特定のブロックの復号データと重ねられるべき直前のブロックのデータに対して時間領域ダウンミキシングまたは擬似時間領域におけるダウンミキシングを適用することを含み、
特定のブロックについて時間領域ダウンミキシングを適用することは、直前のブロックについてのダウンミキシングが周波数領域ダウンミキシングであったかどうかを判定し、直前のブロックについてのダウンミキシングが周波数領域ダウンミキシングであった場合、前記特定のブロックを、直前のブロックについてのダウンミキシングが周波数領域ダウンミキシングでなかった場合とは異なる仕方で処理することを含む、
コンピュータ可読記憶媒体。 - 請求項21ないし26のうちいずれか一項記載のコンピュータ可読記憶媒体であって、Bが真である、コンピュータ可読記憶媒体。
- 請求項27記載のコンピュータ可読記憶媒体であって、前記処理システムはベクトル命令を含むストリーミング単一命令複数データ拡張(SSE)を含む命令セットを有する少なくとも一つのx86プロセッサを使用し、実行されたときに受け入れたオーディオ・データを復号させる前記命令は前記一つまたは複数のx86プロセッサの少なくとも一つの上での実行のための命令を含み、実行されたときに時間領域ダウンミキシングをさせる前記命令は、前記一つまたは複数のx86プロセッサの少なくとも一つのためのベクトル命令を含む、コンピュータ可読記憶媒体。
- 請求項21ないし28のうちいずれか一項記載のコンピュータ可読記憶媒体であって、Cが真である、コンピュータ可読記憶媒体。
- 請求項29記載のコンピュータ可読記憶媒体であって、n=1かつm=0であり、逆変換およびさらなる処理の適用は低周波数効果チャンネル上では実行されない、コンピュータ可読記憶媒体。
- 請求項29または30記載のコンピュータ可読記憶媒体であって、エンコードされたブロックを含むオーディオ・データは、ダウンミキシングを定義する情報を含み、一つまたは複数の非寄与チャンネルを同定することは、ダウンミキシングを定義する前記情報を使う、コンピュータ可読記憶媒体。
- 請求項31記載のコンピュータ可読記憶媒体であって、ダウンミキシングを定義する前記情報は、一つまたは複数のチャンネルが非寄与チャンネルであることを示すあらかじめ定義された値をもつミックス・レベル・パラメータを含む、コンピュータ可読記憶媒体。
- 請求項29または30記載のコンピュータ可読記憶媒体であって、一つまたは複数の非寄与チャンネルを同定することは、さらに、一つまたは複数のチャンネルが一つまたは複数の他のチャンネルに対して取るに足りない量の内容をもつかどうかを識別することを含み、チャンネルが別のチャンネルに対して取るに足りない量の内容をもつのは、そのエネルギーまたは絶対レベルが、前記別のチャンネルより少なくとも15dB低い場合である、コンピュータ可読記憶媒体。
- 請求項33記載のコンピュータ可読記憶媒体であって、チャンネルが別のチャンネルに対して取るに足りない量の内容をもつのは、そのエネルギーまたは絶対レベルが、前記別のチャンネルより少なくとも18dB低い場合である、コンピュータ可読記憶媒体。
- 請求項33記載のコンピュータ可読記憶媒体であって、チャンネルが別のチャンネルに対して取るに足りない量の内容をもつのは、そのエネルギーまたは絶対レベルが、前記別のチャンネルより少なくとも25dB低い場合である、コンピュータ可読記憶媒体。
- 請求項33記載のコンピュータ可読記憶媒体であって、一つまたは複数のチャンネルが一つまたは複数の他のチャンネルに対して取るに足りない量の内容をもつかどうかを識別することは、チャンネルの対の間の内容量の指標の差を設定可能な閾値と比較することを含む、コンピュータ可読記憶媒体。
- 請求項36記載のコンピュータ可読記憶媒体であって、前記設定可能な閾値は、複数のあらかじめ定義された値のうちの一つに設定される、コンピュータ可読記憶媒体。
- 請求項21ないし37のうちいずれか一項記載のコンピュータ可読記憶媒体であって、前記受け入れられるオーディオ・データが符号化されたデータのフレームのビットストリームの形であり、実行されたときに受け入れたデータを復号させる前記命令は、フロントエンド復号モジュールおよびバックエンド復号モジュールを含む一組の再利用可能なモジュールに分割され、前記フロントエンド復号モジュールは、実行されたときに前記ビットストリームのフレームの前記周波数領域の指数および仮数データをアンパックおよび復号して、そのフレームについてのアンパックおよび復号された周波数領域の指数および仮数データおよびそのフレームの付随メタデータにすることを行わせる命令を含み、前記バックエンド復号モジュールは、実行されたときに、前記変換係数を決定し、前記逆変換し、さらなる処理を適用し、要求される過渡プレノイズ処理復号があればそれを適用し、M<Nの場合にはダウンミキシングすることを行わせる命令を含む、コンピュータ可読記憶媒体。
- 請求項21ないし38のうちいずれか一項記載のコンピュータ可読記憶媒体であって、前記エンコードされたオーディオ・データは、AC-3規格、E-AC-3規格、E-AC-3規格に対して上位互換である規格、HE-AAC規格およびHE-AAC規格に対して上位互換である規格からなる規格の集合のうちの一つに従ってエンコードされている、コンピュータ可読記憶媒体。
- 請求項38記載のコンピュータ可読記憶媒体であって、
前記エンコードされたオーディオ・データは、E-AC-3規格に従ってまたはE-AC-3規格に対して上位互換である規格に従ってエンコードされており、5つより多くの符号化されたチャンネルを含むことができ、
前記さらなる処理は、窓処理および重複加算演算を適用してサンプリングされたオーディオ・データを決定することを含み、
N>5の場合、前記符号化されたビットストリームは、5.1個までの符号化されたチャンネルの独立フレームおよび符号化されたデータの少なくとも一つの従属フレームを含み、
前記復号命令は、複数の5.1チャンネル復号モジュールとして構成され、各5.1チャンネル復号モジュールは、フロントエンド復号モジュールのそれぞれのインスタンスおよびバックエンド復号モジュールのそれぞれのインスタンスを含み、前記複数の5.1チャンネル復号モジュールは、実行されたときに前記独立フレームの復号をさせる第一の5.1チャンネル復号モジュールと、各従属フレームについての一つまたは複数の他のチャンネル復号モジュールとを含み、前記復号命令は、さらに:
実行されたときに、ビットストリーム情報フィールド・データをアンパックしてフレームおよびフレーム種別を識別させ、識別されたフレームを適切なフロントエンド復号モジュールのインスタンスに与えさせる命令のフレーム情報解析モジュールと、
実行されたときに、N>5の場合、それぞれのバックエンド復号モジュールからの復号されたデータを組み合わせて前記N個のチャンネルの復号データを形成させる命令のチャンネル・マッピング器モジュールとを含む、
コンピュータ可読記憶媒体。 - N.nチャンネルのオーディオ・データのエンコードされたブロックを含むオーディオ・データを復号してM.mチャンネルの復号されたオーディオを含む復号オーディオ・データを形成するオーディオ・データ処理装置であって、M≧1であり、nはエンコードされたオーディオ・データにおける低周波数効果チャンネルの数であり、mは復号オーディオ・データにおける低周波数効果チャンネルの数であり、当該装置は:
N.nチャンネルのデジタル・オーディオ・データを変換して周波数領域の指数および仮数データを形成し、パッキングすることを含むエンコード方法によってエンコードされた、N.nチャンネルのエンコード・オーディオ・データのブロックを含むオーディオ・データを受け入れる手段と;
受け入れたオーディオ・データを復号する手段とを有しており、前記復号する手段は:
前記周波数領域の指数および仮数データをアンパックおよび復号する手段と;
アンパックされ復号された周波数領域の指数および仮数データから変換係数を決定する手段と;
前記周波数領域データを逆変換し、さらなる処理を適用してサンプリングされたオーディオ・データを決定する手段と;
M<Nの場合についてダウンミキシング・データに従って、決定されたサンプリングされたオーディオ・データの少なくともいくつかのブロックを時間領域ダウンミキシングする手段とを含み、
次のA、BおよびCのうちの少なくとも一つは真であり、
Aは、前記復号する手段が、ブロックごとに、周波数領域ダウンミキシングを適用するか時間領域ダウンミキシングを適用するかを決定する手段と、特定のブロックについて周波数領域ダウンミキシングを適用することが決定される場合、その特定のブロックについて周波数領域ダウンミキシングを適用する周波数領域ダウンミキシング適用手段とを含むことであり、
Bは、前記時間領域ダウンミキシングする手段が、前記ダウンミキシング・データが前に使われたダウンミキシング・データから変わっているかどうかの試験を実行し、もし変わっていれば、クロスフェーディングを適用してクロスフェードしたダウンミキシング・データを決定し、クロスフェードしたダウンミキシング・データに従って時間領域ダウンミキシングし、もし変わっていなければ、ダウンミキシング・データに従って直接、時間領域ダウンミキシングを適用する、ことであり、
Cは、当該装置が、前記N.n個の入力チャンネルのうちの一つまたは複数の非寄与チャンネルを同定する手段を含み、非寄与チャンネルとは、前記M.m個のチャンネルに寄与しないチャンネルであり、当該装置が、同定された一つまたは複数の非寄与チャンネルに対しては、前記周波数領域データの逆変換およびさらなる処理の適用を実行しない、ことである、
装置。 - 請求項41記載の装置であって、前記エンコード方法における変換が重複変換を使用し、前記さらなる処理が、窓処理および重複加算演算を適用してサンプリングされたオーディオ・データを決定することを含む、装置。
- 請求項41または42記載の装置であって、前記エンコード方法が、前記周波数領域の指数および仮数データに関係するメタデータを形成およびパッキングすることを含み、前記メタデータは任意的に、過渡プレノイズ処理およびダウンミキシングに関係したメタデータを含む、装置。
- 請求項41ないし43のうちいずれか一項記載の装置であって、Aが真である装置。
- 請求項44記載の装置であって、周波数領域ダウンミキシングを適用するか時間領域ダウンミキシングを適用するかを決定する手段は、過渡プレノイズ処理があるかどうかを判定し、前記N個のチャンネルのうちのいずれかが異なるブロック型を有しているかどうかを判定し、前記N個のチャンネルにおいて同じブロック型をもち、過渡プレノイズ処理をもたず、M<Nであるブロックについてのみ周波数領域ダウンミキシングが適用される、装置。
- 請求項44または45記載の装置であって、
前記エンコード方法における変換が重複変換を使用し、前記さらなる処理が、窓処理および重複加算演算を適用してサンプリングされたオーディオ・データを決定することを含み、
前記特定のブロックについて周波数領域ダウンミキシングを適用することは、直前のブロックについてのダウンミキシングが時間領域ダウンミキシングであったかどうかを判定し、直前のブロックについてのダウンミキシングが時間領域ダウンミキシングであった場合、前記特定のブロックの復号データと重ねられるべき直前のブロックのデータに対して時間領域ダウンミキシングまたは擬似時間領域におけるダウンミキシングを適用することを含み、
特定のブロックについて時間領域ダウンミキシングを適用することは、直前のブロックについてのダウンミキシングが周波数領域ダウンミキシングであったかどうかを判定し、直前のブロックについてのダウンミキシングが周波数領域ダウンミキシングであった場合、前記特定のブロックを、直前のブロックについてのダウンミキシングが周波数領域ダウンミキシングでなかった場合とは異なる仕方で処理することを含む、
装置。 - 請求項41ないし46のうちいずれか一項記載の装置であって、Bが真である、装置。
- 請求項47記載の装置であって、当該装置はベクトル命令を含むストリーミング単一命令複数データ拡張(SSE)を含む命令セットを有する少なくとも一つのx86プロセッサを含み、時間領域ダウンミキシングする手段は前記一つまたは複数のx86プロセッサの少なくとも一つの上でベクトル命令を実行する、装置。
- 請求項41ないし48のうちいずれか一項記載の装置であって、Cが真である、装置。
- 請求項49記載の装置であって、n=1かつm=0であり、逆変換およびさらなる処理の適用は低周波数効果チャンネル上では実行されない、装置。
- 請求項49または50記載の装置であって、エンコードされたブロックを含むオーディオ・データは、ダウンミキシングを定義する情報を含み、一つまたは複数の非寄与チャンネルを同定することは、ダウンミキシングを定義する前記情報を使う、装置。
- 請求項49または50記載の装置であって、一つまたは複数の非寄与チャンネルを同定することは、さらに、一つまたは複数のチャンネルが一つまたは複数の他のチャンネルに対して取るに足りない量の内容をもつかどうかを識別することを含み、チャンネルが別のチャンネルに対して取るに足りない量の内容をもつのは、そのエネルギーまたは絶対レベルが、前記別のチャンネルより少なくとも15dB低い場合である、装置。
- 請求項41ないし52のうちいずれか一項記載の装置であって、前記エンコードされたオーディオ・データは、AC-3規格、E-AC-3規格、E-AC-3規格に対して上位互換である規格、HE-AAC規格およびHE-AAC規格に対して上位互換である規格からなる規格の集合のうちの一つに従ってエンコードされている、装置。
- N.nチャンネルのエンコードされたオーディオ・データを含むオーディオ・データを処理してM.mチャンネルの復号されたオーディオを含む復号オーディオ・データを形成する装置であって、M≧1であり、n=0または1はエンコードされたオーディオ・データにおける低周波数効果チャンネルの数であり、m=0または1は復号オーディオ・データにおける低周波数効果チャンネルの数であり、当該装置は、
エンコード方法によってエンコードされた、N.nチャンネルのエンコード・オーディオ・データを含むオーディオ・データを受け入れる手段であって、前記エンコード方法は、N.nチャンネルのデジタル・オーディオ・データを、逆変換およびさらなる処理によってエイリアシング・エラーなしで時間領域サンプルを復元できるよう変換し、周波数領域の指数および仮数データを形成およびパッキングし、該周波数領域の指数および仮数データに関係するメタデータを形成およびパッキングすることを含み、前記メタデータは任意的に、過渡プレノイズ処理に関係したメタデータを含む、手段と;
受け入れたオーディオ・データを復号する手段とを有しており、
前記復号する手段は:
フロントエンド復号のための一つまたは複数の手段とバックエンド復号のための一つまたは複数の手段とを有しており、
前記フロントエンド復号のための手段は、前記メタデータのアンパックのためであり、前記周波数領域の指数および仮数データのアンパックおよび復号のためである手段を含み、
前記バックエンド復号のための手段は、アンパックされて復号された周波数領域の指数および仮数データから変換係数を決定するため;前記周波数領域データを逆変換するため;窓処理および重複加算演算を適用してサンプリングされたオーディオ・データを決定するため;過渡プレノイズ処理に関係した前記メタデータに従って、必要とされる過渡プレノイズ処理復号があればそれを適用するため;およびダウンミキシング・データに従って時間領域ダウンミキシングするための手段を含み、前記時間領域ダウンミキシングは、M<Nの場合にダウンミキシング・データに従ってデータの少なくともいくつかのブロックを時間領域ダウンミキシングし、
次のA、BおよびCのうちの少なくとも一つは真であり、
Aは、前記バックエンド復号のための手段が、ブロックごとに、周波数領域ダウンミキシングを適用するか時間領域ダウンミキシングを適用するかを決定する手段と、特定のブロックについて周波数領域ダウンミキシングを適用することが決定される場合、その特定のブロックについて周波数領域ダウンミキシングを適用する周波数領域ダウンミキシング適用手段とを含むことであり、
Bは、前記時間領域ダウンミキシングする手段が、前記ダウンミキシング・データが前に使われたダウンミキシング・データから変わっているかどうかの試験を実行し、もし変わっていれば、クロスフェーディングを適用してクロスフェードしたダウンミキシング・データを決定し、該クロスフェードしたダウンミキシング・データに従って時間領域ダウンミキシングし、もし変わっていなければ、前記ダウンミキシング・データに従って直接、時間領域ダウンミキシングを適用する、ことであり、
Cは、当該装置が、前記N.n個の入力チャンネルのうちの一つまたは複数の非寄与チャンネルを同定する手段を含み、非寄与チャンネルとは、前記M.m個のチャンネルに寄与しないチャンネルであり、前記バックエンド復号のための手段が、同定された一つまたは複数の非寄与チャンネルに対しては、前記周波数領域データの逆変換およびさらなる処理の適用を実行しない、ことである、
装置。 - 請求項54記載の装置であって、前記エンコード方法における変換が重複変換を使用し、前記さらなる処理が、窓処理および重複加算演算を適用してサンプリングされたオーディオ・データを決定することを含む、装置。
- 請求項54または55記載の装置であって、
前記エンコードされたオーディオ・データは、E-AC-3規格に従ってまたはE-AC-3規格に対して上位互換である規格に従ってエンコードされており、5つより多くの符号化されたチャンネルを含むことができ、
N>5の場合、前記オーディオ・データは5.1個までの符号化されたチャンネルの独立フレームおよび符号化されたデータの少なくとも一つの従属フレームを含み、
前記復号する手段は:
5.1チャンネルまでの前記独立フレームを復号するための第一のフロントエンド復号手段および第一のバックエンド復号手段と、一つまたは複数の従属フレームのデータを復号するための第二のフロントエンド復号手段および第二のバックエンド復号手段とを含む、前記フロントエンド復号のための手段および前記バックエンド復号のための手段の複数のインスタンスと;
ビットストリーム情報フィールド・データをアンパックしてフレームおよびフレーム種別を識別し、識別されたフレームを適切なフロントエンド復号手段に与える手段と;
それぞれのバックエンド復号手段からの復号データを組み合わせて前記Nチャンネルの復号データを形成する手段とを有する、
装置。 - 請求項54ないし56のうちいずれか一項記載の装置であって、Aが真である、装置。
- 請求項57記載の装置であって、周波数領域ダウンミキシングを適用するか時間領域ダウンミキシングを適用するかを決定する手段は、過渡プレノイズ処理があるかどうかを判定し、前記N個のチャンネルのうちのいずれかが異なるブロック型を有しているかどうかを判定することを実行し、前記N個のチャンネルにおいて同じブロック型をもち、過渡プレノイズ処理をもたず、M<Nであるブロックについてのみ周波数領域ダウンミキシングが適用される、装置。
- 請求項54ないし58のうちいずれか一項記載の装置であって、Bが真である、装置。
- 請求項59記載の装置であって、当該装置はベクトル命令を含むストリーミング単一命令複数データ拡張(SSE)を含む命令セットを有する少なくとも一つのx86プロセッサを含み、時間領域ダウンミキシングする手段は前記一つまたは複数のx86プロセッサの少なくとも一つの上でベクトル命令を実行する、装置。
- 請求項54ないし60のうちいずれか一項記載の装置であって、Cが真である、装置。
- 請求項61記載の装置であって、n=1かつm=0であり、逆変換およびさらなる処理の適用は低周波数効果チャンネル上では実行されない、装置。
- 請求項61または62記載の装置であって、エンコードされたブロックを含むオーディオ・データは、ダウンミキシングを定義する情報を含み、一つまたは複数の非寄与チャンネルを同定することは、ダウンミキシングを定義する前記情報を使う、装置。
- 請求項61または62記載の装置であって、一つまたは複数の非寄与チャンネルを同定することは、さらに、一つまたは複数のチャンネルが一つまたは複数の他のチャンネルに対して取るに足りない量の内容をもつかどうかを識別することを含み、チャンネルが別のチャンネルに対して取るに足りない量の内容をもつのは、そのエネルギーまたは絶対レベルが、前記別のチャンネルより少なくとも15dB低い場合である、装置。
- 請求項54ないし64のうちいずれか一項記載の装置であって、前記エンコードされたオーディオ・データは、AC-3規格、E-AC-3規格、E-AC-3規格に対して上位互換である規格、HE-AAC規格およびHE-AAC規格に対して上位互換である規格からなる規格の集合のうちの一つに従ってエンコードされている、装置。
- N.nチャンネルのオーディオ・データのエンコードされたオーディオ・データを含むオーディオ・データを復号してM.mチャンネルの復号されたオーディオを含む復号オーディオ・データを形成するよう構成されたシステムであって、M≧1であり、nはエンコードされたオーディオ・データにおける低周波数効果チャンネルの数であり、mは復号オーディオ・データにおける低周波数効果チャンネルの数であり、当該システムは:
一つまたは複数のプロセッサと;
前記一つまたは複数のプロセッサに結合された記憶サブシステムとを有しており、
当該システムは、N.nチャンネルのデジタル・オーディオ・データを変換して周波数領域の指数および仮数データを形成し、パッキングすることを含むエンコード方法によってエンコードされた、N.nチャンネルのエンコード・オーディオ・データのブロックを含むオーディオ・データを受け入れ;さらに、受け入れたオーディオ・データを復号するよう構成されており、前記は:
前記周波数領域の指数および仮数データをアンパックおよび復号し;
アンパックされ復号された周波数領域の指数および仮数データから変換係数を決定し;
前記周波数領域データを逆変換し、さらなる処理を適用してサンプリングされたオーディオ・データを決定し;
M<Nの場合についてはダウンミキシング・データに従って、決定されたサンプリングされたオーディオ・データの少なくともいくつかのブロックを時間領域ダウンミキシングすることを含み、
次のA、BおよびCのうちの少なくとも一つは真であり、
Aは、前記復号が、ブロックごとに、周波数領域ダウンミキシングを適用するか時間領域ダウンミキシングを適用するかを決定し、特定のブロックについて周波数領域ダウンミキシングを適用することが決定される場合、その特定のブロックについて周波数領域ダウンミキシングを適用することを含むことであり、
Bは、前記時間領域ダウンミキシングが、前記ダウンミキシング・データが前に使われたダウンミキシング・データから変わっているかどうかを試験し、もし変わっていれば、クロスフェーディングを適用してクロスフェードしたダウンミキシング・データを決定し、該クロスフェードしたダウンミキシング・データに従って時間領域ダウンミキシングし、もし変わっていなければ、前記ダウンミキシング・データに従って直接、時間領域ダウンミキシングすることを含む、ことであり、
Cは、前記方法が、前記N.n個の入力チャンネルのうちの一つまたは複数の非寄与チャンネルを同定することを含み、非寄与チャンネルとは、前記M.m個のチャンネルに寄与しないチャンネルであり、前記方法が、同定された一つまたは複数の非寄与チャンネルに対しては、前記周波数領域データの逆変換およびさらなる処理の適用を実行しない、ことである、
システム。 - 請求項66記載のシステムであって、前記エンコード方法における変換が重複変換を使用し、前記さらなる処理が、窓処理および重複加算演算を適用してサンプリングされたオーディオ・データを決定することを含む、システム。
- 請求項66または67記載のシステムであって、Aが真である、システム。
- 請求項68記載のシステムであって、周波数領域ダウンミキシングを適用するか時間領域ダウンミキシングを適用するかを決定することは、過渡プレノイズ処理があるかどうかを判定し、前記N個のチャンネルのうちのいずれかが異なるブロック型を有しているかどうかを判定し、前記N個のチャンネルにおいて同じブロック型をもち、過渡プレノイズ処理をもたず、M<Nであるブロックについてのみ周波数領域ダウンミキシングが適用される、システム。
- 請求項66ないし69のうちいずれか一項記載のシステムであって、Bが真である、システム。
- 請求項70記載のシステムであって、当該システムはベクトル命令を含むストリーミング単一命令複数データ拡張(SSE)を含む命令セットを有する少なくとも一つのx86プロセッサを含み、時間領域ダウンミキシングは前記一つまたは複数のx86プロセッサの少なくとも一つの上でベクトル命令を実行することを含む、システム。
- 請求項66ないし71のうちいずれか一項記載のシステムであって、Cが真である、システム。
- 請求項72記載のシステムであって、n=1かつm=0であり、逆変換およびさらなる処理の適用は低周波数効果チャンネル上では実行されない、システム。
- 請求項72または73記載のシステムであって、エンコードされたブロックを含むオーディオ・データは、ダウンミキシングを定義する情報を含み、一つまたは複数の非寄与チャンネルを同定することは、ダウンミキシングを定義する前記情報を使う、システム。
- 請求項72または73記載のシステムであって、一つまたは複数の非寄与チャンネルを同定することは、さらに、一つまたは複数のチャンネルが一つまたは複数の他のチャンネルに対して取るに足りない量の内容をもつかどうかを識別することを含み、チャンネルが別のチャンネルに対して取るに足りない量の内容をもつのは、そのエネルギーまたは絶対レベルが、前記別のチャンネルより少なくとも15dB低い場合である、システム。
- 請求項66ないし75のうちいずれか一項記載のシステムであって、前記エンコードされたオーディオ・データは、AC-3規格、E-AC-3規格、E-AC-3規格に対して上位互換である規格、HE-AAC規格およびHE-AAC規格に対して上位互換である規格からなる規格の集合のうちの一つに従ってエンコードされている、システム。
- 請求項66ないし76のうちいずれか一項記載のシステムであって、
受け入れたオーディオ・データは、符号化されたデータのフレームからなるビットストリームの形であり、
前記記憶サブシステムは、前記処理システムの前記プロセッサの一つまたは複数によって実行されたとき、受け入れたオーディオ・データの復号をさせる命令を与えられて構成されている、
システム。 - 請求項66ないし77のうちいずれか一項記載のシステムであって、ネットワーク・リンクを介してネットワーク接続される一つまたは複数のサブシステムを含み、各サブシステムは少なくとも一つのプロセッサを含む、システム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US30587110P | 2010-02-18 | 2010-02-18 | |
US61/305,871 | 2010-02-18 | ||
US35976310P | 2010-06-29 | 2010-06-29 | |
US61/359,763 | 2010-06-29 | ||
PCT/US2011/023533 WO2011102967A1 (en) | 2010-02-18 | 2011-02-03 | Audio decoder and decoding method using efficient downmixing |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014047759A Division JP5863858B2 (ja) | 2010-02-18 | 2014-03-11 | 効率的なダウンミキシングを使ったオーディオ・デコーダおよびデコード方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012527021A true JP2012527021A (ja) | 2012-11-01 |
JP5501449B2 JP5501449B2 (ja) | 2014-05-21 |
Family
ID=43877072
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012512088A Active JP5501449B2 (ja) | 2010-02-18 | 2011-02-03 | 効率的なダウンミキシングを使ったオーディオ・デコーダおよびデコード方法 |
JP2014047759A Active JP5863858B2 (ja) | 2010-02-18 | 2014-03-11 | 効率的なダウンミキシングを使ったオーディオ・デコーダおよびデコード方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014047759A Active JP5863858B2 (ja) | 2010-02-18 | 2014-03-11 | 効率的なダウンミキシングを使ったオーディオ・デコーダおよびデコード方法 |
Country Status (36)
Country | Link |
---|---|
US (3) | US8214223B2 (ja) |
EP (2) | EP2360683B1 (ja) |
JP (2) | JP5501449B2 (ja) |
KR (2) | KR101327194B1 (ja) |
CN (2) | CN102428514B (ja) |
AP (1) | AP3147A (ja) |
AR (2) | AR080183A1 (ja) |
AU (1) | AU2011218351B2 (ja) |
BR (1) | BRPI1105248B1 (ja) |
CA (3) | CA2757643C (ja) |
CO (1) | CO6501169A2 (ja) |
DK (1) | DK2360683T3 (ja) |
EA (1) | EA025020B1 (ja) |
EC (1) | ECSP11011358A (ja) |
ES (1) | ES2467290T3 (ja) |
GE (1) | GEP20146086B (ja) |
GT (1) | GT201100246A (ja) |
HK (2) | HK1160282A1 (ja) |
HN (1) | HN2011002584A (ja) |
HR (1) | HRP20140506T1 (ja) |
IL (3) | IL215254A (ja) |
MA (1) | MA33270B1 (ja) |
ME (1) | ME01880B (ja) |
MX (1) | MX2011010285A (ja) |
MY (1) | MY157229A (ja) |
NI (1) | NI201100175A (ja) |
NZ (1) | NZ595739A (ja) |
PE (1) | PE20121261A1 (ja) |
PL (1) | PL2360683T3 (ja) |
PT (1) | PT2360683E (ja) |
RS (1) | RS53336B (ja) |
SG (1) | SG174552A1 (ja) |
SI (1) | SI2360683T1 (ja) |
TW (2) | TWI557723B (ja) |
WO (1) | WO2011102967A1 (ja) |
ZA (1) | ZA201106950B (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016038876A1 (ja) * | 2014-09-08 | 2016-03-17 | 日本放送協会 | 符号化装置、復号化装置及び音声信号処理装置 |
JP2016146642A (ja) * | 2013-03-28 | 2016-08-12 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 見かけのサイズをもつオーディオ・オブジェクトの任意のラウドスピーカー・レイアウトへのレンダリング |
JP2017017749A (ja) * | 2013-04-05 | 2017-01-19 | ドルビー・インターナショナル・アーベー | オーディオ処理システム |
JP2017201413A (ja) * | 2014-01-30 | 2017-11-09 | クゥアルコム・インコーポレイテッドQualcomm I | フレームパラメータ再使用可能性を示すこと |
JP2017229087A (ja) * | 2013-01-21 | 2017-12-28 | ドルビー ラボラトリーズ ライセンシング コーポレイション | メタデータのトランスコード |
US10499176B2 (en) | 2013-05-29 | 2019-12-03 | Qualcomm Incorporated | Identifying codebooks to use when coding spatial components of a sound field |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
Families Citing this family (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8948406B2 (en) * | 2010-08-06 | 2015-02-03 | Samsung Electronics Co., Ltd. | Signal processing method, encoding apparatus using the signal processing method, decoding apparatus using the signal processing method, and information storage medium |
US20120033819A1 (en) * | 2010-08-06 | 2012-02-09 | Samsung Electronics Co., Ltd. | Signal processing method, encoding apparatus therefor, decoding apparatus therefor, and information storage medium |
TWI759223B (zh) | 2010-12-03 | 2022-03-21 | 美商杜比實驗室特許公司 | 音頻解碼裝置、音頻解碼方法及音頻編碼方法 |
KR101809272B1 (ko) * | 2011-08-03 | 2017-12-14 | 삼성전자주식회사 | 다 채널 오디오 신호의 다운 믹스 방법 및 장치 |
CN104011655B (zh) * | 2011-12-30 | 2017-12-12 | 英特尔公司 | 管芯上/管芯外存储器管理 |
KR101915258B1 (ko) * | 2012-04-13 | 2018-11-05 | 한국전자통신연구원 | 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법 |
CA2843226A1 (en) * | 2012-07-02 | 2014-01-09 | Sony Corporation | Decoding device, decoding method, encoding device, encoding method, and program |
WO2014007095A1 (ja) | 2012-07-02 | 2014-01-09 | ソニー株式会社 | 復号装置および方法、符号化装置および方法、並びにプログラム |
US10083699B2 (en) * | 2012-07-24 | 2018-09-25 | Samsung Electronics Co., Ltd. | Method and apparatus for processing audio data |
CA2880028C (en) * | 2012-08-03 | 2019-04-30 | Thorsten Kastner | Decoder and method for a generalized spatial-audio-object-coding parametric concept for multichannel downmix/upmix cases |
KR102331129B1 (ko) * | 2013-01-21 | 2021-12-01 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화 |
KR20140117931A (ko) | 2013-03-27 | 2014-10-08 | 삼성전자주식회사 | 오디오 디코딩 장치 및 방법 |
TWI530941B (zh) | 2013-04-03 | 2016-04-21 | 杜比實驗室特許公司 | 用於基於物件音頻之互動成像的方法與系統 |
TWI557727B (zh) * | 2013-04-05 | 2016-11-11 | 杜比國際公司 | 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品 |
CN108806704B (zh) * | 2013-04-19 | 2023-06-06 | 韩国电子通信研究院 | 多信道音频信号处理装置及方法 |
US8804971B1 (en) * | 2013-04-30 | 2014-08-12 | Dolby International Ab | Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio |
CN104143334B (zh) * | 2013-05-10 | 2017-06-16 | 中国电信股份有限公司 | 可编程图形处理器及其对多路音频进行混音的方法 |
EP2804176A1 (en) | 2013-05-13 | 2014-11-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio object separation from mixture signal using object-specific time/frequency resolutions |
CA3211308A1 (en) | 2013-05-24 | 2014-11-27 | Dolby International Ab | Coding of audio scenes |
US9666198B2 (en) | 2013-05-24 | 2017-05-30 | Dolby International Ab | Reconstruction of audio scenes from a downmix |
TWM487509U (zh) * | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
EP2830045A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
EP2830043A3 (en) * | 2013-07-22 | 2015-02-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for Processing an Audio Signal in accordance with a Room Impulse Response, Signal Processing Unit, Audio Encoder, Audio Decoder, and Binaural Renderer |
EP2830049A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient object metadata coding |
JP6476192B2 (ja) | 2013-09-12 | 2019-02-27 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 多様な再生環境のためのダイナミックレンジ制御 |
WO2015038522A1 (en) * | 2013-09-12 | 2015-03-19 | Dolby Laboratories Licensing Corporation | Loudness adjustment for downmixed audio content |
CN117037811A (zh) | 2013-09-12 | 2023-11-10 | 杜比国际公司 | 多声道音频内容的编码 |
EP2866227A1 (en) | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
EP3108474A1 (en) * | 2014-02-18 | 2016-12-28 | Dolby International AB | Estimating a tempo metric from an audio bit-stream |
CN106664500B (zh) * | 2014-04-11 | 2019-11-01 | 三星电子株式会社 | 用于渲染声音信号的方法和设备以及计算机可读记录介质 |
US9886962B2 (en) * | 2015-03-02 | 2018-02-06 | Google Llc | Extracting audio fingerprints in the compressed domain |
US9837086B2 (en) * | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
JP6797187B2 (ja) * | 2015-08-25 | 2020-12-09 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ・デコーダおよびデコード方法 |
US10015612B2 (en) | 2016-05-25 | 2018-07-03 | Dolby Laboratories Licensing Corporation | Measurement, verification and correction of time alignment of multiple audio channels and associated metadata |
PL3568853T3 (pl) | 2017-01-10 | 2021-06-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder audio, enkoder audio, sposób dostarczania dekodowanego sygnału audio, sposób dostarczania enkodowanego sygnału audio, strumień audio, moduł dostarczania strumienia audio i program komputerowy używający identyfikator strumienia |
US10210874B2 (en) * | 2017-02-03 | 2019-02-19 | Qualcomm Incorporated | Multi channel coding |
WO2019092161A1 (en) | 2017-11-10 | 2019-05-16 | Koninklijke Kpn N.V. | Obtaining image data of an object in a scene |
TWI681384B (zh) * | 2018-08-01 | 2020-01-01 | 瑞昱半導體股份有限公司 | 音訊處理方法與音訊等化器 |
BR112020018466A2 (pt) | 2018-11-13 | 2021-05-18 | Dolby Laboratories Licensing Corporation | representando áudio espacial por meio de um sinal de áudio e de metadados associados |
CN110035299B (zh) * | 2019-04-18 | 2021-02-05 | 雷欧尼斯(北京)信息技术有限公司 | 沉浸式对象音频的压缩传输方法与*** |
CN110417978B (zh) * | 2019-07-24 | 2021-04-09 | 广东商路信息科技有限公司 | 菜单配置方法、装置、设备及存储介质 |
EP4014506B1 (en) * | 2019-08-15 | 2023-01-11 | Dolby International AB | Methods and devices for generation and processing of modified audio bitstreams |
CN113035210A (zh) * | 2021-03-01 | 2021-06-25 | 北京百瑞互联技术有限公司 | 一种lc3音频混合方法、装置及存储介质 |
WO2024073401A2 (en) * | 2022-09-30 | 2024-04-04 | Sonos, Inc. | Home theatre audio playback with multichannel satellite playback devices |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001518267A (ja) * | 1997-03-21 | 2001-10-09 | ソニー エレクトロニクス インク | オーディオチャンネルミキシング |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5274740A (en) | 1991-01-08 | 1993-12-28 | Dolby Laboratories Licensing Corporation | Decoder for variable number of channel presentation of multidimensional sound fields |
JP4213708B2 (ja) * | 1995-09-29 | 2009-01-21 | ユナイテッド・モジュール・コーポレーション | オーディオ復号装置 |
US5867819A (en) | 1995-09-29 | 1999-02-02 | Nippon Steel Corporation | Audio decoder |
US6128597A (en) * | 1996-05-03 | 2000-10-03 | Lsi Logic Corporation | Audio decoder with a reconfigurable downmixing/windowing pipeline and method therefor |
SG54379A1 (en) | 1996-10-24 | 1998-11-16 | Sgs Thomson Microelectronics A | Audio decoder with an adaptive frequency domain downmixer |
SG54383A1 (en) * | 1996-10-31 | 1998-11-16 | Sgs Thomson Microelectronics A | Method and apparatus for decoding multi-channel audio data |
US5986709A (en) | 1996-11-18 | 1999-11-16 | Samsung Electronics Co., Ltd. | Adaptive lossy IDCT for multitasking environment |
US6356639B1 (en) * | 1997-04-11 | 2002-03-12 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment |
US5946352A (en) | 1997-05-02 | 1999-08-31 | Texas Instruments Incorporated | Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain |
DE69712230T2 (de) | 1997-05-08 | 2002-10-31 | St Microelectronics Asia | Verfahren und gerät zur frequenzdomäneabwärtsumsetzung mit zwangblockschaltung für audiodekoderfunktionen |
US6141645A (en) | 1998-05-29 | 2000-10-31 | Acer Laboratories Inc. | Method and device for down mixing compressed audio bit stream having multiple audio channels |
US6246345B1 (en) | 1999-04-16 | 2001-06-12 | Dolby Laboratories Licensing Corporation | Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding |
JP2002182693A (ja) | 2000-12-13 | 2002-06-26 | Nec Corp | オーディオ符号化、復号装置及びその方法並びにその制御プログラム記録媒体 |
US7610205B2 (en) | 2002-02-12 | 2009-10-27 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
US7313519B2 (en) | 2001-05-10 | 2007-12-25 | Dolby Laboratories Licensing Corporation | Transient performance of low bit rate audio coding systems by reducing pre-noise |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
WO2003094369A2 (en) * | 2002-05-03 | 2003-11-13 | Harman International Industries, Incorporated | Multi-channel downmixing device |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
JP2004194100A (ja) * | 2002-12-12 | 2004-07-08 | Renesas Technology Corp | オーディオ復号再生装置 |
AU2003285787A1 (en) * | 2002-12-28 | 2004-07-22 | Samsung Electronics Co., Ltd. | Method and apparatus for mixing audio stream and information storage medium |
KR20040060718A (ko) * | 2002-12-28 | 2004-07-06 | 삼성전자주식회사 | 오디오 스트림 믹싱 방법, 그 장치 및 그 정보저장매체 |
US7318027B2 (en) | 2003-02-06 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Conversion of synthesized spectral components for encoding and low-complexity transcoding |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
US7516064B2 (en) | 2004-02-19 | 2009-04-07 | Dolby Laboratories Licensing Corporation | Adaptive hybrid transform for signal analysis and synthesis |
EP1719118A1 (en) * | 2004-02-19 | 2006-11-08 | Koninklijke Philips Electronics N.V. | Decoding scheme for variable block length signals |
KR101079066B1 (ko) * | 2004-03-01 | 2011-11-02 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 멀티채널 오디오 코딩 |
US7983922B2 (en) * | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
WO2006126843A2 (en) * | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding audio signal |
US8494667B2 (en) * | 2005-06-30 | 2013-07-23 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
KR20070003594A (ko) * | 2005-06-30 | 2007-01-05 | 엘지전자 주식회사 | 멀티채널 오디오 신호에서 클리핑된 신호의 복원방법 |
KR100760976B1 (ko) | 2005-08-01 | 2007-09-21 | (주)펄서스 테크놀러지 | 프로그래머블 프로세서에서 mpeg-2 또는 mpeg-4aac 오디오 복호 알고리즘을 처리하기 위한 연산 회로및 연산 방법 |
KR100771401B1 (ko) | 2005-08-01 | 2007-10-30 | (주)펄서스 테크놀러지 | 프로그래머블 프로세서에서 mpeg-2 또는 mpeg-4aac 오디오 복호 알고리즘을 처리하기 위한 연산 회로및 연산 방법 |
KR100803212B1 (ko) * | 2006-01-11 | 2008-02-14 | 삼성전자주식회사 | 스케일러블 채널 복호화 방법 및 장치 |
CN101371298A (zh) * | 2006-01-19 | 2009-02-18 | Lg电子株式会社 | 用于解码信号的方法和装置 |
TWI469133B (zh) * | 2006-01-19 | 2015-01-11 | Lg Electronics Inc | 媒體訊號處理方法及裝置 |
ES2376889T3 (es) * | 2006-03-24 | 2012-03-20 | Dolby International Ab | Generación de mezclas descendentes espaciales a partir de representaciones paramétricas de señales multicanal |
PL2038878T3 (pl) * | 2006-07-07 | 2012-06-29 | Fraunhofer Ges Forschung | Urządzenie i sposób do łączenia wielu zakodowanych parametrycznie źródeł audio |
JP2008236384A (ja) * | 2007-03-20 | 2008-10-02 | Matsushita Electric Ind Co Ltd | 音声ミキシング装置 |
JP4743228B2 (ja) * | 2008-05-22 | 2011-08-10 | 三菱電機株式会社 | デジタル音声信号解析方法、その装置、及び映像音声記録装置 |
EP2306452B1 (en) * | 2008-07-29 | 2017-08-30 | Panasonic Intellectual Property Management Co., Ltd. | Sound coding / decoding apparatus, method and program |
-
2011
- 2011-01-24 TW TW103112991A patent/TWI557723B/zh active
- 2011-01-24 TW TW100102481A patent/TWI443646B/zh active
- 2011-02-03 CN CN2011800021214A patent/CN102428514B/zh active Active
- 2011-02-03 GE GEAP201112462A patent/GEP20146086B/en unknown
- 2011-02-03 EA EA201171268A patent/EA025020B1/ru not_active IP Right Cessation
- 2011-02-03 MA MA34347A patent/MA33270B1/fr unknown
- 2011-02-03 CN CN201310311362.8A patent/CN103400581B/zh active Active
- 2011-02-03 KR KR1020117027457A patent/KR101327194B1/ko active IP Right Grant
- 2011-02-03 MY MYPI2011004688A patent/MY157229A/en unknown
- 2011-02-03 MX MX2011010285A patent/MX2011010285A/es active IP Right Grant
- 2011-02-03 BR BRPI1105248-1A patent/BRPI1105248B1/pt active IP Right Grant
- 2011-02-03 SG SG2011069242A patent/SG174552A1/en unknown
- 2011-02-03 AP AP2011005900A patent/AP3147A/xx active
- 2011-02-03 NZ NZ595739A patent/NZ595739A/en unknown
- 2011-02-03 WO PCT/US2011/023533 patent/WO2011102967A1/en active Application Filing
- 2011-02-03 PE PE2011001738A patent/PE20121261A1/es active IP Right Grant
- 2011-02-03 JP JP2012512088A patent/JP5501449B2/ja active Active
- 2011-02-03 AU AU2011218351A patent/AU2011218351B2/en active Active
- 2011-02-03 CA CA2757643A patent/CA2757643C/en active Active
- 2011-02-03 CA CA2794029A patent/CA2794029C/en active Active
- 2011-02-03 CA CA2794047A patent/CA2794047A1/en active Pending
- 2011-02-03 KR KR1020137012147A patent/KR101707125B1/ko active IP Right Grant
- 2011-02-15 AR ARP110100457A patent/AR080183A1/es active IP Right Grant
- 2011-02-17 RS RS20140286A patent/RS53336B/en unknown
- 2011-02-17 ME MEP-2014-57A patent/ME01880B/me unknown
- 2011-02-17 PL PL11154910T patent/PL2360683T3/pl unknown
- 2011-02-17 ES ES11154910.1T patent/ES2467290T3/es active Active
- 2011-02-17 DK DK11154910.1T patent/DK2360683T3/da active
- 2011-02-17 PT PT111549101T patent/PT2360683E/pt unknown
- 2011-02-17 EP EP11154910.1A patent/EP2360683B1/en active Active
- 2011-02-17 SI SI201130184T patent/SI2360683T1/sl unknown
- 2011-02-17 EP EP13189503.9A patent/EP2698789B1/en active Active
- 2011-09-20 IL IL215254A patent/IL215254A/en active IP Right Grant
- 2011-09-22 ZA ZA2011/06950A patent/ZA201106950B/en unknown
- 2011-09-27 US US13/246,572 patent/US8214223B2/en active Active
- 2011-09-28 GT GT201100246A patent/GT201100246A/es unknown
- 2011-09-29 EC EC2011011358A patent/ECSP11011358A/es unknown
- 2011-09-30 CO CO11129235A patent/CO6501169A2/es active IP Right Grant
- 2011-09-30 HN HN2011002584A patent/HN2011002584A/es unknown
- 2011-09-30 NI NI201100175A patent/NI201100175A/es unknown
-
2012
- 2012-01-13 HK HK12100408.2A patent/HK1160282A1/xx unknown
- 2012-05-29 US US13/482,878 patent/US8868433B2/en active Active
- 2012-10-25 HK HK12110666.8A patent/HK1170059A1/xx unknown
-
2013
- 2013-02-06 AR ARP130100367A patent/AR089918A2/es active IP Right Grant
- 2013-07-29 IL IL227701A patent/IL227701A/en active IP Right Grant
- 2013-07-29 IL IL227702A patent/IL227702A/en active IP Right Grant
-
2014
- 2014-03-11 JP JP2014047759A patent/JP5863858B2/ja active Active
- 2014-06-02 HR HRP20140506AT patent/HRP20140506T1/hr unknown
- 2014-10-18 US US14/517,800 patent/US9311921B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001518267A (ja) * | 1997-03-21 | 2001-10-09 | ソニー エレクトロニクス インク | オーディオチャンネルミキシング |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11075762B2 (en) | 2013-01-21 | 2021-07-27 | Dolby Laboratories Licensing Corporation | Metadata transcoding |
US10554415B2 (en) | 2013-01-21 | 2020-02-04 | Dolby Laboratories Licensing Corporation | Metadata transcoding |
JP2017229087A (ja) * | 2013-01-21 | 2017-12-28 | ドルビー ラボラトリーズ ライセンシング コーポレイション | メタデータのトランスコード |
US11019447B2 (en) | 2013-03-28 | 2021-05-25 | Dolby Laboratories Licensing Corporation | Rendering of audio objects with apparent size to arbitrary loudspeaker layouts |
US11979733B2 (en) | 2013-03-28 | 2024-05-07 | Dolby Laboratories Licensing Corporation | Methods and apparatus for rendering audio objects |
US10652684B2 (en) | 2013-03-28 | 2020-05-12 | Dolby Laboratories Licensing Corporation | Rendering of audio objects with apparent size to arbitrary loudspeaker layouts |
US9992600B2 (en) | 2013-03-28 | 2018-06-05 | Dolby Laboratories Licensing Corporation | Rendering of audio objects with apparent size to arbitrary loudspeaker layouts |
US11564051B2 (en) | 2013-03-28 | 2023-01-24 | Dolby Laboratories Licensing Corporation | Methods and apparatus for rendering audio objects |
JP2016146642A (ja) * | 2013-03-28 | 2016-08-12 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 見かけのサイズをもつオーディオ・オブジェクトの任意のラウドスピーカー・レイアウトへのレンダリング |
JP2017017749A (ja) * | 2013-04-05 | 2017-01-19 | ドルビー・インターナショナル・アーベー | オーディオ処理システム |
US11146903B2 (en) | 2013-05-29 | 2021-10-12 | Qualcomm Incorporated | Compression of decomposed representations of a sound field |
US10499176B2 (en) | 2013-05-29 | 2019-12-03 | Qualcomm Incorporated | Identifying codebooks to use when coding spatial components of a sound field |
US11962990B2 (en) | 2013-05-29 | 2024-04-16 | Qualcomm Incorporated | Reordering of foreground audio objects in the ambisonics domain |
JP2017201413A (ja) * | 2014-01-30 | 2017-11-09 | クゥアルコム・インコーポレイテッドQualcomm I | フレームパラメータ再使用可能性を示すこと |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
WO2016038876A1 (ja) * | 2014-09-08 | 2016-03-17 | 日本放送協会 | 符号化装置、復号化装置及び音声信号処理装置 |
JPWO2016038876A1 (ja) * | 2014-09-08 | 2017-06-15 | 日本放送協会 | 符号化装置、復号化装置及び音声信号処理装置 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5863858B2 (ja) | 効率的なダウンミキシングを使ったオーディオ・デコーダおよびデコード方法 | |
RU2406166C2 (ru) | Способы и устройства кодирования и декодирования основывающихся на объектах ориентированных аудиосигналов | |
JP5426680B2 (ja) | 信号処理方法及び装置 | |
US20090240505A1 (en) | Audio decoding | |
TWI521502B (zh) | 多聲道音訊的較高頻率和降混低頻率內容的混合編碼 | |
KR20100095586A (ko) | 신호 처리 방법 및 장치 | |
RU2696952C2 (ru) | Аудиокодировщик и декодер | |
AU2013201583B2 (en) | Audio decoder and decoding method using efficient downmixing | |
JP2022529731A (ja) | 出力ダウンミックス表現を生成するための装置及びコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130411 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131015 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131206 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140311 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5501449 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |