JP5917777B2 - 3dオーディオのための強化されガイドされるダウンミクス能力を提供するための装置および方法 - Google Patents
3dオーディオのための強化されガイドされるダウンミクス能力を提供するための装置および方法 Download PDFInfo
- Publication number
- JP5917777B2 JP5917777B2 JP2015531556A JP2015531556A JP5917777B2 JP 5917777 B2 JP5917777 B2 JP 5917777B2 JP 2015531556 A JP2015531556 A JP 2015531556A JP 2015531556 A JP2015531556 A JP 2015531556A JP 5917777 B2 JP5917777 B2 JP 5917777B2
- Authority
- JP
- Japan
- Prior art keywords
- audio
- channels
- audio input
- channel
- audio output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 47
- 238000004590 computer program Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 7
- 238000012986 modification Methods 0.000 claims description 3
- 230000004048 modification Effects 0.000 claims description 3
- 238000009792 diffusion process Methods 0.000 claims 1
- 230000005236 sound signal Effects 0.000 description 23
- 238000010586 diagram Methods 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 6
- 238000013507 mapping Methods 0.000 description 5
- 238000009877 rendering Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 102100039160 Amiloride-sensitive amine oxidase [copper-containing] Human genes 0.000 description 1
- 241000167854 Bourreria succulenta Species 0.000 description 1
- 101000889548 Homo sapiens Amiloride-sensitive amine oxidase [copper-containing] Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 235000019693 cherries Nutrition 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000001337 psychedelic effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
- H04S5/005—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation of the pseudo five- or more-channel type, e.g. virtual surround
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Algebra (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Stereophonic System (AREA)
Description
ここで、y(t)はダウンミクスの出力信号であり、x(t)は入力信号であり、nは入力オーディオチャネルの指数であり、mは出力チャネルの指数である。n番目の出力チャネルに対するm番目の入力チャネルのダウンミクス係数が、cnmに相当する。以下の式による5チャネル信号および2チャネルステレオ信号のダウンミクスの例が知られている。
R’(t)=R(t)+cC・C(t)+cR・RS(t)
ダウンミクス係数は静的でありかつオーディオ信号の各サンプルに適用される。これらは、オーディオビットストリームにメタデータとして加えられ得る。「周波数選択的ダウンミクス係数」という用語は、特定の周波数帯に別のダウンミクス係数を使用する可能性に関して使用される。時間可変係数と組み合わせて、デコーダ側ダウンミクスを、エンコーダから制御してもよい。その場合、オーディオフレームのためのダウンミクスの仕様は以下のとおりになる。
ここで、kは、周波数帯(ハイブリッドQMF帯等)であり、sはハイブリッドQMF帯のサブサンプルである。
アンビエンスの量
拡散性
指向性
音源幅
音源距離
到来方向
こられのパラメータの定義は当業者には周知である。これらのパラメータの定義については、添付の文献を参照(特許文献1から4、非特許文献1から20を参照)。たとえば、アンビエンスの量についての定義は、非特許文献15、特許文献1、2、3および4ならびに非特許文献14に示される。ドライ/ウエット比の定義については、直接/アンビエンスの定義から直接的に導き出すことができ、当業者には周知である。指向性および拡散性と言う用語については、非特許文献17に説明され、これも当業者には周知である。
ここでc∈{1,2,3}、i∈{1,2,3,4}、0≦ai≦1
この実施例では、3以上のオーディオ出力チャネルの各々について、すべての重みが等しく決定される。
g2,i=(1−ai)/4、ここでi∈{1,2,3,4}、0≦ai≦1、
g3,i=(1−(ai/2))/4、ここで、i∈{1,2,3,4}、0≦ai≦1
この実施例では、3以上のオーディオ出力チャネルのうちの1つの重みを、同3以上のオーディオ出力チャネルの他の1つの重みとは異なるように決定する。
図3および図4の重みgc,iも、何らかの他の適当な方法で決定してもよい。
または、たとえば
g1,i=(1−(di/2))/4、ここでi∈{1,2,3,4}、0≦di≦1
g2,i=(1−di)/4、ここでi∈{1,2,3,4}、0≦di≦1、
g3,i=(1−(di/2))/4、ここでi∈{1,2,3,4}、0≦di≦1
または、他の何らかの適切な方法で決定され得る。
または、たとえば
g1,i=0.125+diri/8、ここでi∈{1,2,3,4}、0≦diri≦1
g2,i=diri/4、ここでi∈{1,2,3,4}、0≦diri≦1
g3,i=0.125+diri/8、ここでi∈{1,2,3,4}、0≦diri≦1
または、他の何らかの適切な方法で決定され得る。
ここでc∈{1,2,3}、i∈{1,2,3,4}、0°≦ji<360°
270°の到来方向が、オーディオ出力チャネルAOC2の場合よりも、オーディオ出力チャネルAOC1およびAOC3にとってより許容可能な場合、重みgc,iはたとえば以下のように決定され得る。
ここで、i∈{1,2,3,4}、0°≦ji<360°
g2,i=(1+sinji)/8
ここで、i∈{1,2,3,4}、0°≦ji<360°
g3,i=(1.5+(sinji)/2)/8、ここで、i∈{1,2,3,4}、0°≦ji<360°
または、他の何らかの適切な方法で決定され得る。
視聴者との差
音の幅(「拡散性」)
オブジェクト優先の3Dオーディオでは特に、目標のフォーマットのラウドスピーカに対するオブジェクトのマッピングを制御するためにこれらのパラメータを採用し得る。
Claims (10)
- 3以上のオーディオ入力チャネルから2以上のオーディオ出力チャネルを生成するための装置(100)であって、装置(100)が、
3以上のオーディオ入力チャネルを受信しかつサイド情報を受信するための受信インターフェース(110)と、
各オーディオ入力チャネルのための重みを使用してサイド情報に基づいて3以上のオーディオ入力チャネルをダウンミクスして、2以上のオーディオ出力チャネルを取得するためのダウンミキサ(120)とを含み、
オーディオ出力チャネルの数がオーディオ入力チャネルの数より少なく、
サイド情報が、3以上のオーディオ入力チャネルの少なくとも1つの特徴、1以上のオーディオ入力チャネル内に記録される1以上の音波の特徴または1以上のオーディオ入力チャネル内に記録される1以上の音波を発した1以上の音源の特徴を示し、
ダウンミキサが、サイド情報に基づいて各オーディオ入力チャネルのための重みを決定するように構成され、
装置(100)が、2以上のラウドスピーカのグループのうちの1ラウドスピーカに2以上のオーディオ出力チャネルの各々をフィードするように構成され、
ダウンミキサ(120)が、3以上の仮定のラウドスピーカ位置の第1のグループの各仮定のラウドスピーカ位置と2以上の実際のラウドスピーカ位置の第2のグループの各実際のラウドスピーカ位置とに基づいて、3以上のオーディオ入力チャネルをダウンミクスして、2以上のオーディオ出力チャネルを取得するよう構成され、
2以上の実際のラウドスピーカ位置の第2のグループの各実際のラウドスピーカ位置が、2以上のラウドスピーカのグループのうちの1ラウドスピーカの位置を示し、
3以上のオーディオ入力チャネルの各オーディオ入力チャネルが、3以上の仮定のラウドスピーカ位置の第1のグループの1つの仮定のラウドスピーカ位置に割り当てられ、
2以上のオーディオ出力チャネルの各オーディオ出力チャネルが、2以上の実際のラウドスピーカ位置の第2のグループの1つの実際のラウドスピーカ位置に割り当てられ、
ダウンミキサ(120)が、3以上のオーディオ入力チャネルのうち少なくとも2つと、3以上のオーディオ入力チャネルのうち前記少なくとも2つの各々の仮定のラウドスピーカ位置と、前記オーディオ出力チャネルの実際のラウドスピーカ位置とに基づいて、2以上のオーディオ出力チャネルの各オーディオ出力チャネルを生成するよう構成され、
サイド情報が3以上のオーディオ入力チャネルの各々のアンビエンス量を含み、
ダウンミキサ(120)が、3以上のオーディオ入力チャネルの各々のアンビエンス量に基づいて3以上のオーディオ入力チャネルをダウンミクスして、2以上のオーディオ出力チャネルを取得するよう構成される、装置。 - ダウンミキサ(120)が、サイド情報に基づいて3以上のオーディオ入力チャネルのうち少なくとも2つのオーディオ入力チャネルを修正して修正されたオーディオチャネルのグループを取得し、かつ修正されたオーディオチャネルの前記グループの各修正されたオーディオチャネルを組み合わせて前記オーディオ出力チャネルを取得することにより、2以上のオーディオ出力チャネルの各オーディオ出力チャネルを生成するよう構成される、請求項1に記載の装置(100)。
- ダウンミキサ(120)が、サイド情報に基づいて3以上のオーディオ入力チャネルの各オーディオ入力チャネルを修正して修正されたオーディオチャネルのグループを取得し、かつ修正されたオーディオチャネルの前記グループの各修正されたオーディオチャネルを組み合わせて前記オーディオ出力チャネルを取得することにより、2以上のオーディオ出力チャネルの各オーディオ出力チャネルを生成するよう構成される、請求項2に記載の装置(100)。
- ダウンミキサ(120)が、1以上のオーディオ入力チャネルの1オーディオ入力チャネルおよびサイド情報に基づき重みを決定しかつ前記オーディオ入力チャネルに前記重みを適用して、修正されたオーディオチャネルのグループの各修正されたオーディオチャネルを生成することにより、2以上のオーディオ出力チャネルの各オーディオ出力チャネルを生成するよう構成される、請求項2または3に記載の装置(100)。
- サイド情報が3以上のオーディオ入力チャネルの各々の拡散性または3以上のオーディオ入力チャネルの各々の指向性を示し、かつ
ダウンミキサ(120)が、3以上のオーディオ入力チャネルの各々の拡散性または3以上のオーディオ入力チャネルの各々の指向性に基づいて3以上のオーディオ入力チャネルをダウンミクスして、2以上のオーディオ出力チャネルを取得するよう構成される、請求項1から請求項4のいずれかに記載の装置(100)。 - サイド情報が、音声の到来方向を示し、かつ
ダウンミキサ(120)が、音声の到来方向に基づいて3以上のオーディオ入力チャネルをダウンミクスして2以上のオーディオ出力チャネルを取得するよう構成される、請求項1から請求項5のいずれかに記載の装置(100)。 - ダウンミキサ(120)が、サイド情報に基づいて4以上のオーディオ入力チャネルをダウンミクスして3以上のオーディオ出力チャネルを取得するよう構成される、請求項1から請求項6のいずれかに記載の装置(100)。
- 3以上の未処理のオーディオチャネルを符号化して3以上の符号化されたオーディオチャネルを取得し、かつ3以上の未処理のオーディオチャネルに関する追加の情報を符号化してサイド情報を取得するためのエンコーダ(810)と、
3以上のオーディオ入力チャネルとして3以上の符号化されたオーディオチャネルを受信し、サイド情報を受信しかつサイド情報に基づき、3以上のオーディオ入力チャネルから2以上のオーディオ出力チャネルを生成するための、請求項1から請求項7のいずれかに記載の装置(100)とを含む、システム。 - 3以上のオーディオ入力チャネルから2以上のオーディオ出力チャネルを生成するための方法であって、
3以上のオーディオ入力チャネルおよびサイド情報を受信するステップと、
各オーディオ入力チャネルのための重みを使用してサイド情報に基づいて3以上のオーディオ入力チャネルをダウンミクスして2以上のオーディオ出力チャネルを取得するステップとを含み、
オーディオ出力チャネルの数が、オーディオ入力チャネルの数より少なく、かつ
サイド情報が3以上のオーディオ入力チャネルのうちの少なくとも1つの特徴、1以上のオーディオ入力チャネル内に記録される1以上の音波の特徴または1以上のオーディオ入力チャネル内に記録される1以上の音波を発した1以上の音源の特徴を示し、
重みがサイド情報に基づいて各オーディオ入力チャネルのために決定され、
2以上のオーディオ出力チャネルの各々が2以上のラウドスピーカのグループのうちの1ラウドスピーカにフィードされ、
3以上のオーディオ入力チャネルが、3以上の仮定のラウドスピーカ位置の第1のグループの各仮定のラウドスピーカ位置と2以上の実際のラウドスピーカ位置の第2のグループの各実際のラウドスピーカ位置とに基づいて、ダウンミクスされて、2以上のオーディオ出力チャネルが取得され、
2以上の実際のラウドスピーカ位置の第2のグループの各実際のラウドスピーカ位置が、2以上のラウドスピーカのグループのうちの1ラウドスピーカの位置を示し、
3以上のオーディオ入力チャネルの各オーディオ入力チャネルが、3以上の仮定のラウドスピーカ位置の第1のグループの1つの仮定のラウドスピーカ位置に割り当てられ、
2以上のオーディオ出力チャネルの各オーディオ出力チャネルが、2以上の実際のラウドスピーカ位置の第2のグループの1つの実際のラウドスピーカ位置に割り当てられ、
2以上のオーディオ出力チャネルの各オーディオ出力チャネルが、3以上のオーディオ入力チャネルのうち少なくとも2つと、3以上のオーディオ入力チャネルのうち前記少なくとも2つの各々の仮定のラウドスピーカ位置と、前記オーディオ出力チャネルの実際のラウドスピーカ位置とに基づいて、生成され、
サイド情報が3以上のオーディオ入力チャネルの各々のアンビエンス量を含み、
3以上のオーディオ入力チャネルの各々のアンビエンス量に基づいて3以上のオーディオ入力チャネルがダウンミクスされて、2以上のオーディオ出力チャネルが取得される、方法。 - コンピュータまたは信号処理装置で実行された際に、請求項9に記載の方法を実現するためのコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261699990P | 2012-09-12 | 2012-09-12 | |
US61/699,990 | 2012-09-12 | ||
PCT/EP2013/068903 WO2014041067A1 (en) | 2012-09-12 | 2013-09-12 | Apparatus and method for providing enhanced guided downmix capabilities for 3d audio |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015532062A JP2015532062A (ja) | 2015-11-05 |
JP5917777B2 true JP5917777B2 (ja) | 2016-05-18 |
Family
ID=49226131
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015531556A Active JP5917777B2 (ja) | 2012-09-12 | 2013-09-12 | 3dオーディオのための強化されガイドされるダウンミクス能力を提供するための装置および方法 |
Country Status (20)
Country | Link |
---|---|
US (4) | US9653084B2 (ja) |
EP (1) | EP2896221B1 (ja) |
JP (1) | JP5917777B2 (ja) |
KR (1) | KR101685408B1 (ja) |
CN (1) | CN104782145B (ja) |
AR (1) | AR092540A1 (ja) |
AU (1) | AU2013314299B2 (ja) |
BR (6) | BR112015005456B1 (ja) |
CA (1) | CA2884525C (ja) |
ES (1) | ES2610223T3 (ja) |
HK (1) | HK1212537A1 (ja) |
MX (1) | MX343564B (ja) |
MY (1) | MY181365A (ja) |
PL (1) | PL2896221T3 (ja) |
PT (1) | PT2896221T (ja) |
RU (1) | RU2635884C2 (ja) |
SG (1) | SG11201501876VA (ja) |
TW (1) | TWI545562B (ja) |
WO (1) | WO2014041067A1 (ja) |
ZA (1) | ZA201502353B (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112015005456B1 (pt) * | 2012-09-12 | 2022-03-29 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. | Aparelho e método para fornecer capacidades melhoradas de downmix guiado para áudio 3d |
CN108806704B (zh) | 2013-04-19 | 2023-06-06 | 韩国电子通信研究院 | 多信道音频信号处理装置及方法 |
US10075795B2 (en) * | 2013-04-19 | 2018-09-11 | Electronics And Telecommunications Research Institute | Apparatus and method for processing multi-channel audio signal |
EP2830332A3 (en) * | 2013-07-22 | 2015-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration |
US9319819B2 (en) | 2013-07-25 | 2016-04-19 | Etri | Binaural rendering method and apparatus for decoding multi channel audio |
KR102160254B1 (ko) | 2014-01-10 | 2020-09-25 | 삼성전자주식회사 | 액티브다운 믹스 방식을 이용한 입체 음향 재생 방법 및 장치 |
RU2646337C1 (ru) * | 2014-03-28 | 2018-03-02 | Самсунг Электроникс Ко., Лтд. | Способ и устройство для рендеринга акустического сигнала и машиночитаемый носитель записи |
CN110213709B (zh) * | 2014-06-26 | 2021-06-15 | 三星电子株式会社 | 用于渲染声学信号的方法和设备及计算机可读记录介质 |
EP3213323B1 (en) | 2014-10-31 | 2018-12-12 | Dolby International AB | Parametric encoding and decoding of multichannel audio signals |
US10475463B2 (en) * | 2015-02-10 | 2019-11-12 | Sony Corporation | Transmission device, transmission method, reception device, and reception method for audio streams |
GB2540175A (en) * | 2015-07-08 | 2017-01-11 | Nokia Technologies Oy | Spatial audio processing apparatus |
US10659904B2 (en) | 2016-09-23 | 2020-05-19 | Gaudio Lab, Inc. | Method and device for processing binaural audio signal |
US10356545B2 (en) * | 2016-09-23 | 2019-07-16 | Gaudio Lab, Inc. | Method and device for processing audio signal by using metadata |
GB2572419A (en) * | 2018-03-29 | 2019-10-02 | Nokia Technologies Oy | Spatial sound rendering |
US11356791B2 (en) | 2018-12-27 | 2022-06-07 | Gilberto Torres Ayala | Vector audio panning and playback system |
EP3925236B1 (en) | 2019-02-13 | 2024-07-17 | Dolby Laboratories Licensing Corporation | Adaptive loudness normalization for audio object clustering |
WO2020249480A1 (en) * | 2019-06-12 | 2020-12-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Packet loss concealment for dirac based spatial audio coding |
WO2022258876A1 (en) * | 2021-06-10 | 2022-12-15 | Nokia Technologies Oy | Parametric spatial audio rendering |
DE102021122597A1 (de) | 2021-09-01 | 2023-03-02 | Synotec Psychoinformatik Gmbh | Mobiler, immersiver 3D-Audioraum |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0795698A (ja) | 1993-09-21 | 1995-04-07 | Sony Corp | オーディオ再生装置 |
US7567845B1 (en) * | 2002-06-04 | 2009-07-28 | Creative Technology Ltd | Ambience generation for stereo signals |
JP3519724B2 (ja) * | 2002-10-25 | 2004-04-19 | パイオニア株式会社 | 情報記録媒体、情報記録装置及び情報記録方法並びに情報再生装置及び情報再生方法 |
US7412380B1 (en) | 2003-12-17 | 2008-08-12 | Creative Technology Ltd. | Ambience extraction and modification for enhancement and upmix of audio signals |
SE0400997D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Efficient coding of multi-channel audio |
US7490044B2 (en) * | 2004-06-08 | 2009-02-10 | Bose Corporation | Audio signal processing |
US7853022B2 (en) | 2004-10-28 | 2010-12-14 | Thompson Jeffrey K | Audio spatial environment engine |
JP2006197391A (ja) | 2005-01-14 | 2006-07-27 | Toshiba Corp | 音声ミクシング処理装置及び音声ミクシング処理方法 |
EP1691348A1 (en) | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
US20060262936A1 (en) * | 2005-05-13 | 2006-11-23 | Pioneer Corporation | Virtual surround decoder apparatus |
DE602006016017D1 (de) | 2006-01-09 | 2010-09-16 | Nokia Corp | Steuerung der dekodierung binauraler audiosignale |
EP1989920B1 (en) | 2006-02-21 | 2010-01-20 | Koninklijke Philips Electronics N.V. | Audio encoding and decoding |
US8379868B2 (en) * | 2006-05-17 | 2013-02-19 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
US9014377B2 (en) | 2006-05-17 | 2015-04-21 | Creative Technology Ltd | Multichannel surround format conversion and generalized upmix |
RU2431940C2 (ru) * | 2006-10-16 | 2011-10-20 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Аппаратура и метод многоканального параметрического преобразования |
DE102006050068B4 (de) | 2006-10-24 | 2010-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm |
JP5450085B2 (ja) * | 2006-12-07 | 2014-03-26 | エルジー エレクトロニクス インコーポレイティド | オーディオ処理方法及び装置 |
RU2417549C2 (ru) * | 2006-12-07 | 2011-04-27 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для обработки аудиосигнала |
US8296158B2 (en) * | 2007-02-14 | 2012-10-23 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
US20080232601A1 (en) * | 2007-03-21 | 2008-09-25 | Ville Pulkki | Method and apparatus for enhancement of audio reconstruction |
US9015051B2 (en) * | 2007-03-21 | 2015-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Reconstruction of audio channels with direction parameters indicating direction of origin |
US8908873B2 (en) * | 2007-03-21 | 2014-12-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US8107631B2 (en) | 2007-10-04 | 2012-01-31 | Creative Technology Ltd | Correlation-based method for ambience extraction from two-channel audio signals |
MX2010003807A (es) | 2007-10-09 | 2010-07-28 | Koninkl Philips Electronics Nv | Metodo y aparato para generar una señal de audio binaural. |
DE102007048973B4 (de) * | 2007-10-12 | 2010-11-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung |
US8315396B2 (en) * | 2008-07-17 | 2012-11-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio output signals using object based metadata |
EP2154910A1 (en) * | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for merging spatial audio streams |
EP2396637A1 (en) * | 2009-02-13 | 2011-12-21 | Nokia Corp. | Ambience coding and decoding for audio applications |
JP2012525051A (ja) * | 2009-04-21 | 2012-10-18 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号の合成 |
EP2249334A1 (en) * | 2009-05-08 | 2010-11-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
US8976972B2 (en) * | 2009-10-12 | 2015-03-10 | Orange | Processing of sound data encoded in a sub-band domain |
EP2464146A1 (en) * | 2010-12-10 | 2012-06-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decomposing an input signal using a pre-calculated reference curve |
US9026450B2 (en) * | 2011-03-09 | 2015-05-05 | Dts Llc | System for dynamically creating and rendering audio objects |
AU2012279357B2 (en) * | 2011-07-01 | 2016-01-14 | Dolby Laboratories Licensing Corporation | System and method for adaptive audio signal generation, coding and rendering |
US9473870B2 (en) * | 2012-07-16 | 2016-10-18 | Qualcomm Incorporated | Loudspeaker position compensation with 3D-audio hierarchical coding |
BR112015005456B1 (pt) * | 2012-09-12 | 2022-03-29 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. | Aparelho e método para fornecer capacidades melhoradas de downmix guiado para áudio 3d |
KR102226420B1 (ko) * | 2013-10-24 | 2021-03-11 | 삼성전자주식회사 | 다채널 오디오 신호 생성 방법 및 이를 수행하기 위한 장치 |
-
2013
- 2013-09-12 BR BR112015005456-0A patent/BR112015005456B1/pt active IP Right Grant
- 2013-09-12 WO PCT/EP2013/068903 patent/WO2014041067A1/en active Search and Examination
- 2013-09-12 BR BR122021021503-0A patent/BR122021021503B1/pt active IP Right Grant
- 2013-09-12 TW TW102133018A patent/TWI545562B/zh active
- 2013-09-12 PT PT137656708T patent/PT2896221T/pt unknown
- 2013-09-12 ES ES13765670.8T patent/ES2610223T3/es active Active
- 2013-09-12 JP JP2015531556A patent/JP5917777B2/ja active Active
- 2013-09-12 AU AU2013314299A patent/AU2013314299B2/en active Active
- 2013-09-12 MY MYPI2015000600A patent/MY181365A/en unknown
- 2013-09-12 KR KR1020157009303A patent/KR101685408B1/ko active IP Right Grant
- 2013-09-12 BR BR122021021487-5A patent/BR122021021487B1/pt active IP Right Grant
- 2013-09-12 BR BR122021021494-8A patent/BR122021021494B1/pt active IP Right Grant
- 2013-09-12 CN CN201380058866.1A patent/CN104782145B/zh active Active
- 2013-09-12 PL PL13765670T patent/PL2896221T3/pl unknown
- 2013-09-12 RU RU2015113161A patent/RU2635884C2/ru active
- 2013-09-12 SG SG11201501876VA patent/SG11201501876VA/en unknown
- 2013-09-12 AR ARP130103261A patent/AR092540A1/es active IP Right Grant
- 2013-09-12 CA CA2884525A patent/CA2884525C/en active Active
- 2013-09-12 BR BR122021021506-5A patent/BR122021021506B1/pt active IP Right Grant
- 2013-09-12 MX MX2015003195A patent/MX343564B/es active IP Right Grant
- 2013-09-12 BR BR122021021500-6A patent/BR122021021500B1/pt active IP Right Grant
- 2013-09-12 EP EP13765670.8A patent/EP2896221B1/en active Active
-
2015
- 2015-03-10 US US14/643,007 patent/US9653084B2/en active Active
- 2015-04-09 ZA ZA2015/02353A patent/ZA201502353B/en unknown
-
2016
- 2016-01-08 HK HK16100174.0A patent/HK1212537A1/xx unknown
-
2017
- 2017-05-15 US US15/595,065 patent/US10347259B2/en active Active
-
2019
- 2019-06-03 US US16/429,280 patent/US10950246B2/en active Active
-
2021
- 2021-01-14 US US17/148,638 patent/US20210134304A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10950246B2 (en) | Apparatus and method for providing enhanced guided downmix capabilities for 3D audio | |
RU2635903C2 (ru) | Способ и процессор сигналов для преобразования множества входных каналов из конфигурации входных каналов в выходные каналы из конфигурации выходных каналов | |
US9478225B2 (en) | Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients | |
JP5437638B2 (ja) | マルチチャンネル復号化方法 | |
JP5081838B2 (ja) | オーディオ符号化及び復号 | |
US9761229B2 (en) | Systems, methods, apparatus, and computer-readable media for audio object clustering | |
US20090164221A1 (en) | Methods and apparatuses for encoding and decoding object-based audio signals | |
JP2012198556A (ja) | オブジェクトベースオーディオ信号の符号化及び復号化方法並びにその装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160304 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160315 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160406 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5917777 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |