JP2014501945A - 幾何ベースの空間オーディオ符号化のための装置および方法 - Google Patents
幾何ベースの空間オーディオ符号化のための装置および方法 Download PDFInfo
- Publication number
- JP2014501945A JP2014501945A JP2013541377A JP2013541377A JP2014501945A JP 2014501945 A JP2014501945 A JP 2014501945A JP 2013541377 A JP2013541377 A JP 2013541377A JP 2013541377 A JP2013541377 A JP 2013541377A JP 2014501945 A JP2014501945 A JP 2014501945A
- Authority
- JP
- Japan
- Prior art keywords
- audio data
- data stream
- audio
- values
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 64
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 50
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 50
- 238000004364 calculation method Methods 0.000 claims description 48
- 238000009792 diffusion process Methods 0.000 claims description 40
- 238000012986 modification Methods 0.000 claims description 31
- 230000004048 modification Effects 0.000 claims description 31
- 238000012545 processing Methods 0.000 claims description 23
- 238000012937 correction Methods 0.000 claims description 19
- 230000007480 spreading Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 10
- 230000005236 sound signal Effects 0.000 description 44
- 239000013598 vector Substances 0.000 description 20
- 238000003491 array Methods 0.000 description 18
- 238000001914 filtration Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 13
- 239000010410 layer Substances 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 12
- 238000001228 spectrum Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 6
- 239000002131 composite material Substances 0.000 description 5
- 230000001629 suppression Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000013213 extrapolation Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000001093 holography Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000004091 panning Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 239000002356 single layer Substances 0.000 description 2
- 241001061225 Arcos Species 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/326—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
- H04R2430/21—Direction finding using differential microphone array [DMA]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Otolaryngology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
【選択図】図1
Description
[1]マイケル A.ガーゾン.オーディオ多重放送およびビデオのアンビソニックス.J.Audio.Eng.Soc,33(11):859−871,1985.
[21]J.ヘーレ、K.クジュルリング、J.ブリーバールト、C.ファーラー、S.ディッシュ、H.パルンハーゲン、J.コッペンス、J.ヒルペルト、J.レーデン、W.オーメン、K.リンツマイヤー、K.S.チョン、「MPEGサラウンド ―効率的かつ互換性を持つマルチチャンネルオーディオ符号化のためのISO/MPEG基準」、第122回AESコンベンション、ウィーン、オーストリア、2007年、プレプリント7048
[25]イェルーン・ブリーバールト、ジョナス・エングデガルト、コーネリア・ファルヒ、オリバー・ヘルムート、ヨハネス・ヒルペルト、アンドレアス・ホエルツァー、イェルーン・コッペンス、ワーナー・オーメン、バーバラ・レッシュ、エリク・シュイヤース、レオニード・テレンティーブ、空間オーディオオブジェクト符号化(saoc)−パラメトリック・オブジェクトベースのオーディオ符号化に関する最新のMPEG標準、AESコンベンション124回、2008年5月
[22]ビーレ・プルッキ、方向オーディオ符号化を用いた空間再生、J.Audio Eng.Soc、55(6):503―516、2007年6月
で述べられているように、方向オーディオ符号化(Directional Audio Coding(DirAC))がある。
[23]C.ファーラー、空間オーディオコーダのためのマイクロホン・フロントエンド、第125回AES国際コンベンションのプロシーディング、サンフランシスコ、2008年10月
で提示される。
[20]ジョヴァンニ・デルガルト、オリバー・ティーレガルト、トビアス・ウェラーおよびE.A.P.ハベッツ、分散型配置によって集められた幾何的情報を使用した仮想マイクロホン信号の生成、ハンズフリー・スピーチ・コミュニケーションとマイクロホン配置(HSCMA’11)の第3回ジョイントワークショップ、エジンバラ、英国、2011年5月
で提供される。それは、その環境において任意で仮想的に位置づけられた任意の空間マイクロホンの出力信号(すなわち任意の位置および方向)を算出することを可能にする。仮想マイクロホン(virtual microphone)(VM)アプローチを特徴づけている柔軟性によって、音響シーンが後処理ステップで任意で仮想的に捕捉されることを可能にするが、音響シーンを効率的に、送信する、および/または、格納する、および/または、修正するために、使用されることができる音場表現は、利用可能ではない。さらに、時間―周波数ビンごとに1つのソースだけがアクティブであると仮定され、したがって、2つ以上のソースが、同じ時間―周波数ビンにおいてアクティブである場合、それは音響シーンを正しく示すことができない。さらに、仮想マイクロホン(VM)が受信機側で適用される場合、すべてのマイクロホン信号は、そのチャネルを通じて送られる必要があり、それは、その表現を非効率にするが、一方、VMが送信器側で適用される場合、音響シーンを、更に操作することができず、そのモデルは、柔軟性を失って、特定のスピーカセットアップに制限されることになる。さらに、パラメトリック情報に基づく音響シーンの操作を考慮しない。
では、音源位置推定は、分散マイクロホンによって測定された到来の2つ1組になって起こる時間差に基づく。さらにまた、受信機は、その録音に依存し、合成(例えばスピーカ信号の生成)のためのすべてのマイクロホン信号を必要とする。
の中で提示された方法は、DirACと同様に、パラメータとしての到来方向を使用し、したがって、その表現を音響シーンの特定の視点に制限する。さらに、それは音響シーン表現を送信する/格納するための可能性を提案しない。というのも、分析および合成は、両方とも通信システムの同じ側で適用されることを必要とするからである。
[13]R.ロイ、A.ポールラージおよびT.カイラス、「サブスペース回転による到来方向推定 ― ESPRIT」、Acoustics, Speech and Signal Processing(ICASSP)、IEEE国際コンフェレンス、スタンフォード、CA、USA、1986年4月
または、(ルート)MUSIC、参照
[14]R.シュミット、「複数のエミッタ位置および信号パラメータ推定」、IEEE Transactions on Antennas and Propagation、34巻、no.3、ページ276〜280、1986年
などの、適切な到来方向(DOA)推定器を使用することによって達成される。
[15]J.マイケル・スティール、「平面のランダムサンプルの最適三角測量」、確率の紀要、10巻、No.3(1982年8月)、ページ548〜553
に説明されるように、適用されうる。
[12]S.リカードおよびZ.ユルマズ、「音声の近似W−ディスジョイント直交性について」、Acoustics, Speech and Signal Processing、2002.ICASSP 2002年IEEE国際コンフェレンス、2002年4月、1巻
を参照されたい。
− 例えばSNR、または仮想マイクロホンまでの距離、または実在の空間マイクロホンによって推定された拡散を考慮する、加重平均。従来の解決法、例えば、最大比合成(Maximum Ratio Combining)(MRC)または等利得合成(Equal Gain Combining)(EQC)のために使用されることができる。または、
− 合成信号を得るための一部または全部の修正されたオーディオ信号の1次結合。修正されたオーディオ信号は、合成信号を得るために、1次結合において重み付けされうる。または、
− 例えば、一つの信号だけが、例えば、SNRまたは距離または拡散に依存して、使用される、選択。
g(θ)=0.5+0.5cos(θ)
によって定められたピックアップパターンを有することができる。ここで、θは、仮想空間マイクロホンの視方向(look direction)と仮想マイクロホンの視点からの音響の到来方向(DOA)との間の角度である。
h(k,n)=s(k,n)−r(k,n)
を使用することによって、算出されることができる。
a(k,n)=arcos(h(k,n)・v(k,n)/(||h(k,n)||||v(k,n)||)
により、(k,n)ごとに算出される。
Ia(k,n)=−(1/2ρ)|Pv(k,n)|2*[cos(k,n),sin(k,n)]T
に従って、Ia(k,n)を算出することができる。ここで、[]Tは、転置ベクトルを示し、ρは、空気密度であり、そして、Pv(k,n)は、仮想空間マイクロホン、例えば図19のブロック506の出力105により測定された音圧である。
Ia(k,n)=(1/2ρ)|Pv(k,n)|2h(k,n)/||h(k,n)||。
●P(k,n):音源の、例えばIPLSの合成圧力。この信号は、おそらく直接音(IPLS自体から生じている音)と拡散音とを含む。
●Q(k,n):音源、例えばIPLSの位置(例えば3Dの直角座標):
その位置は、例えば、直角座標X(k,n)、Y(k,n)、Z(k,n)を含むことができる。
●IPLSでの拡散:ψ(k,n)。このパラメータは、P(k,n)において含まれる拡散音に対する直接音の出力比に関連する。P(k,n)=Pdir(k,n)+Pdiff(k,n)である場合、拡散を表す1つの可能性は、ψ(k,n)=|Pdiff(k,n)|2/|P(k,n)|2である。|P(k,n)|2が知られている場合、他の相当する表現、例えば、直接音対拡散音比(Direct to Diffuse Ratio)(DDR)Γ=|Pdir(k,n)|2/|Pdiff(k,n)|2が考えられる。
[26]R.ロイおよびT.カイラス、ESPRIT −回転不変技術による信号パラメータの推定、音響、音声および信号処理、IEEE論文集、37(7):984―995、1989年7月
Ei,j=|Pi,1−Pi,2|+|Pj,1−Pj,2|、 (1)
ここで、(i,j)∈{(1,2),(1’,2’)}(図5を参照)およびPi,lが音源iのアレイrによって参照された補償された信号電力を表す。エラーは、実音源の一対について最小である。一旦、ペアリング問題が解決されて、正しい到来方向(DOA)推定値が計算されると、これらは、GACストリームに、対応する圧力信号および拡散評価と共に、一まとめにされる。圧力信号および拡散評価は、1つの音源のためのパラメータ推定のためにすでに説明された同じ方法を使用して得られることができる。
1.音響シーンにおいて空間/ボリュームの任意のセクションを拡大すること(例えばそれを聴取者にとって広く見えるように点音源を拡張すること);
2.音響シーンにおいて空間/ボリュームの選択されたセクションを空間/ボリュームの他の任意のセクションに変換すること(変換された空間/ボリュームは、例えば、新たな位置に移動することを必要とするソースを含むことができる);
3.位置ベースのフィルタリング(音響シーンの選択された領域が強化されるかまたは部分的に/完全に抑制される)
[20]ジョヴァンニ・デルガルト、オリバー・ティーレガルト、トビアス・ウェラーおよびE.A.P.ハベッツ、分散型配置によって集められた幾何的情報を使用した仮想マイクロホン信号の生成、ハンズフリー・スピーチ・コミュニケーションとマイクロホン配置(HSCMA’11)の第3回ジョイントワークショップ、エジンバラ、英国、2011年5月
における提案と同様に、そして、構成可能な仮想位置で仮想マイクロホンのオーディオ出力信号を生成するための装置について説明されたように、複雑な音響シーンは、時間―周波数表現、例えば短時間フーリエ変換(STFT)によって供給されるもの特定のスロットでアクティブである、音源、例えば、等方的点音源(IPLS)によってモデル化される。
そのシーンの特定のエネルギーが、ボリュームVの範囲内に位置すると仮定する。ボリュームVは、環境の所定の領域を示しうる。Θは、対応する音源、例えばIPLSがボリュームVの範囲内に配置される時間―周波数ビン(k,n)のセットを意味する。
Q(k,n)=[X(k,n)+Φx(k,n);Y(k,n)+Φy(k,n)Z(k,n)+Φz(k,n)]T (2)
となる。ここで、Φx、ΦyおよびΦzが元のボリュームに関して新たなボリュームV’の幾何にその範囲が依存するランダム変数である。この構想は、例えば、音源を広く知覚させるために使用されることができる。この例において、元のボリュームVは、無限小に小さい、すなわち、音源、例えばIPLSは、同じ点Q(k,n)=[X(k,n),Y(k,n),Z(k,n)]T for all(k,n)∈Θに定位される。この機構は、位置パラメータQ(k,n)のディザリングの形としてみなされる。
ボリューム拡張に加えて、GACストリームの位置データは、音場の中で空間/ボリュームのセクションを再配置するために修正されることができる。この場合も、操作されるデータは、定位されたエネルギーの空間座標を含む。
幾何ベースのフィルタリング(または位置ベースのフィルタリング)の考えは、音響シーンから空間/ボリュームのセクションを増す又は完全に/部分的に取り除くための方法を提供する。しかし、ボリューム拡張および変換技術と比較すると、この場合、GACストリームからの圧力データだけが、適当なスカラー重みを適用することによって修正される。
●非残響。部屋のジオメトリーを知っていることによって、空間周波数フィルタは、多重伝搬によって生じることがありえる部屋の境界の外側で定位されるエネルギーを抑制するために使用されることができる。例えば会議室および車でのハンズフリーコミュニケーションに関して、このアプリケーションが関心がある。遅い残響を抑制するために、高い拡散の場合にはフィルタを閉じるのに十分であり、一方、初期の反射を抑制するために、位置に依存するフィルタがより効果的であることに留意されたい。この場合、すでに述べたように、部屋のジオメトリーは、事前に知られていることを必要とする。
●バックグラウンドノイズ抑制。同様の構想は、同様にバックグラウンドノイズを抑制するために使用されることができる。ソースが位置付けされうる潜在的領域(例えば会議室の参加者の椅子または車の座席)が知られている場合、これらの領域の外に位置付けされるエネルギーは、バックグラウンドノイズに関連しており、従って、空間周波数フィルタによって抑制される。このアプリケーションは、ソースの近似の位置の、GACストリームの利用できるデータに基づいて、事前情報または推定値を必要とする。
●点状の干渉物の抑制。干渉物が空間において明らかに定位される場合、拡散であるよりはむしろ、位置ベースのフィルタリングは干渉物の位置で定位されるエネルギーを減らすために適用されることができる。それは、事前情報または干渉物の位置の推定値を必要とする。
●エコー制御。この場合、抑制される干渉物は、スピーカ信号である。この目的のために、点状の干渉物の場合と同様に、ちょうどスピーカ位置またはその近傍に定位されたエネルギーは、抑制される。それは、事前情報またはスピーカ位置の推定値を必要とする。 ●拡張された音声検出。幾何ベースのフィルタリング発明と関連した信号拡張技術は、従来のオーディオ活動検知システムにおいて、例えば車において、前処理ステップとして実行されることができる。非残響、またはノイズ抑制は、システム性能を改善するアドオンとして使用されることができる。
●監視。エネルギーだけを特定の領域から保存して、残りを抑制することは、監視アプリケーションの一般的に用いられる技術である。それは、幾何に関する事前情報および関心がある領域の位置を必要とする。
●ソース分離。複数の同時にアクティブであるソースを有する環境において、幾何ベースの空間フィルタリングは、ソース分離のために適用されることができる。ソースの位置に中央に置かれた適切に設計された空間周波数フィルタを位置付けることは、結果として他の同時にアクティブなソースの抑制/減弱になる。このイノベーションは、例えばSAOCのフロントエンドとして、使用されることができる。事前情報またはソース位置の推定値が必要である。
●位置に依存する自動利得調整(AGC)。位置に依存する重みは、例えば遠隔会議アプリケーションの異なるトーカーのラウドネスを等しくするために、使用されることができる。
[27]国際公開WO2004/077884号公報:タピオ・ロッキ、ユハ・メリマー、ビーレ・プルッキ、マルチチャンネルリスニングにおける自然のまたは修正された空間印象を再生するための方法、2006年
で与えられる空間音響の知覚に関する仮定により動機を与えられる。
[1]マイケル A.ガーゾン.オーディオ多重放送およびビデオのアンビソニックス.J.Audio.Eng.Soc,33(11):859−871,1985.
[2]V.プルッキ、「空間再生およびステレオアップミキシングにおける方向オーディオ符号化」、第28回AES国際コンフェレンスの予稿集、pp.251―258、Pitea、スウェーデン、2006年6月30日〜7月2日
[3]V.プルッキ、「方向オーディオ符号化を用いた空間再生」、J.Audio.Eng.Soc、vol55、no.6、pp.503―516、2007年6月
[4]C.ファーラー、「空間オーディオ符号器に関するマイクロホンフロントエンド」、第125回AES国際コンベンションの予稿集、サンフランシスコ、2008年10月
[5]M.カリンガー、H.オクセンフェルト、G.デルガルド、F.キュッヒ、D.マーネ、R.シュルツ―アムリング、およびO.ティエルガルト、「方向オーディオ符号化のための空間フィルタリング手法」、Audio Engineering Society Convention 126、ミュンヘン、ドイツ、2009年5月
[6]R.シュルツ―アムリング、F.キュッヒ、O.ティエルガルト、およびM.カリンガー、「パラメトリック音場表現に基づく音響ズーミング」、Audio Engineering Society Convention 128、ロンドン、英国、2010年5月
[7]J.ヘーレ、C.ファルヒ、D.マーネ、G.デルガルト、M.カリンガー、およびO.ティエルガルト、「空間オーディオオブジェクト符号化および方向オーディオ符号化技術を組み合わせたインタラクティブ遠隔会議」、Audio Engineering Society Convention 128、ロンドン英国、2010年5月
[8]E.G.ウィリアムス、フーリエ音響学:音響放射および近場音響ホログラフィー、アカデミック・プレス、1999年
[9]A.クンツおよびR.ラベンシュタイン、「全周性測定からの波動場の外挿の限界」、15th European Signal Processing Conference(EUSIPCO 2007)、2007
[10]A・ワルターおよびC.フォーラ、「b―フォーマット記録を使用した間隔をおいたマイクロホンアレイの線形シミュレーション」、Audio Engineering Society Convention 128、ロンドン英国、2010年5月
[11]米国61/287,596公報:第2のパラメトリック空間オーディオ信号に第1のパラメトリック空間オーディオ信号を変換するための装置及び方法
[12]S.リカードおよびZ.ユルマズ、「音声の近似W−ディスジョイント直交性について」、Acoustics, Speech and Signal Processing、2002.ICASSP 2002年IEEE国際コンフェレンス、2002年4月、1巻
[13]R.ロイ、A.ポールラージおよびT.カイラス、「サブスペース回転による到来方向推定 ― ESPRIT」、Acoustics, Speech and Signal Processing(ICASSP)、IEEE国際コンフェレンス、スタンフォード、CA、USA、1986年4月
[14]R.シュミット、「複数のエミッタ位置および信号パラメータ推定」、IEEE Transactions on Antennas and Propagation、34巻、no.3、ページ276〜280、1986年
[15]J.マイケル・スティール、「平面のランダムサンプルの最適三角測量」、確率の紀要、10巻、No.3(1982年8月)、ページ548〜553
[16]F.J.ファヒー、音の強さ、エセックス:エルゼビア・サイエンス・パブリッシャーズ社、1989年
[17]R.シュルツ―アムリング、F.キュッヒ、M.カリンガー、G.デルガルト、T.アホネンおよびV.プルッキ、「分析のための平面マイクロホン・アレイ処理および方向オーディオ符号化を使用した空間オーディオの再生」、オーディオ技術学会規則124、アムステルダム、オランダ、2008年5月
[18]M.カリンガー、F.キュッヒ、R.シュルツ―アムリング、G.デルガルト、T.アホネンおよびV.プルッキ、「方向オーディオ符号化のためのマイクロホンアレイを用いた拡張された方向推定」、ハンズフリーオーディオ通信およびマイクロホンアレイ、2008.HSCMA 2008、2008年5月、ページ45〜48
[19]R.K.ファーネス、「アンビソニック ― 概要 ― 」、AES第8回国際コンフェレンス、1990年4月、ページ181〜189
[20]ジョヴァンニ・デルガルト、オリバー・ティーレガルト、トビアス・ウェラーおよびE.A.P.ハベッツ、分散型配置によって集められた幾何的情報を使用した仮想マイクロホン信号の生成、ハンズフリー・スピーチ・コミュニケーションとマイクロホン配置(HSCMA’11)の第3回ジョイントワークショップ、エジンバラ、英国、2011年5月
[21]J.ヘーレ、K.クジュルリング、J.ブリーバールト、C.ファーラー、S.ディッシュ、H.パルンハーゲン、J.コッペンス、J.ヒルペルト、J.レーデン、W.オーメン、K.リンツマイヤー、K.S.チョン、「MPEGサラウンド ―効率的かつ互換性を持つマルチチャンネルオーディオ符号化のためのISO/MPEG基準」、第122回AESコンベンション、ウィーン、オーストリア、2007年、プレプリント7048
[22]ビーレ・プルッキ、方向オーディオ符号化を用いた空間再生、J.Audio Eng.Soc、55(6):503―516、2007年6月
[23]C.ファーラー、空間オーディオコーダのためのマイクロホン・フロントエンド、第125回AES国際コンベンションのプロシーディング、サンフランシスコ、2008年10月
[24]エマニュエル・ガロおよびニコラス・ツィンゴス、フィールドレコーディングからの構造聴覚シーンの抽出とリレンダリング、AES第30回国際コンフェレンス、2007
[25]イェルーン・ブリーバールト、ジョナス・エングデガルト、コーネリア・ファルヒ、オリバー・ヘルムート、ヨハネス・ヒルペルト、アンドレアス・ホエルツァー、イェルーン・コッペンス、ワーナー・オーメン、バーバラ・レッシュ、エリク・シュイヤース、レオニード・テレンティーブ、空間オーディオオブジェクト符号化(saoc)−パラメトリック・オブジェクトベースのオーディオ符号化に関する最新のMPEG標準、AESコンベンション124回、2008年5月
[26]R.ロイおよびT.カイラス、ESPRIT −回転不変技術による信号パラメータの推定、音響、音声および信号処理、IEEE論文集、37(7):984―995、1989年7月
[27]国際公開WO2004/077884号公報:タピオ・ロッキ、ユハ・メリマー、ビーレ・プルッキ、マルチチャンネルリスニングにおける自然のまたは修正された空間印象を再生するための方法、2006年
[28]スヴェイン・ベルグ、空間オーディオ信号を変換するための装置および方法、米特許出願、出願番号10/547,151
Claims (25)
- 1つ又は複数の音源に関連したオーディオデータを含むオーディオデータストリームに基づいて、少なくとも1つのオーディオ出力信号を生成するための装置(150)であって、前記装置(150)は、
前記オーディオデータを含む前記オーディオデータストリームを受信するための受信機(160)であって、前記オーディオデータは、前記1つ又は複数の音源のそれぞれについて、1つ又は複数の圧力値を含み、前記オーディオデータは、更に、前記1つ又は複数の音源のそれぞれについて、前記音源のうちの1つの位置を示している1つ又は複数の位置値を含み、前記1つ又は複数の位置値のそれぞれは、少なくとも2つの座標値を含む、前記受信機と、
前記オーディオデータストリームの前記オーディオデータの前記1つ又は複数の圧力値のうちの少なくとも1つに基づき、かつ、前記オーディオデータストリームの前記オーディオデータの前記1つ又は複数の位置値のうちの少なくとも1つに基づいて、前記少なくとも1つのオーディオ出力信号を生成するための合成モジュール(170)とを含むことを特徴とする、前記装置(150)。 - 前記オーディオデータは、複数の時間―周波数ビンのうちの1つの時間―周波数ビンについて定められることを特徴とする、請求項1に記載の装置(150)。
- 前記受信機(160;610)は、前記オーディオデータを含む前記オーディオデータストリームを受信するように構成され、前記オーディオデータは、前記音源のそれぞれについて1つ又は複数の拡散値を更に含み、
前記合成モジュール(170;620)は、前記オーディオデータストリームの前記オーディオデータの前記1つ又は複数の拡散値のうちの少なくとも1つに基づいて、前記少なくとも1つのオーディオ出力信号を生成するように構成されることを特徴とする、請求項1又は請求項2に記載の装置(150)。 - 前記受信機(160;610)は、前記オーディオデータの前記1つ又は複数の圧力値のうちの少なくとも1つを修正することによって、前記オーディオデータの前記1つ又は複数の位置値のうちの少なくとも1つを修正することによって、または、前記オーディオデータの前記1つ又は複数の拡散値のうちの少なくとも1つを修正することによって、前記受信されたオーディオデータストリームの前記オーディオデータを修正するための修正モジュール(630)を更に含み、
前記合成モジュール(170;620)は、修正された前記少なくとも1つの圧力値に基づいて、修正された前記少なくとも1つの位置値に基づいて、または、修正された前記少なくとも1つの拡散値に基づいて、前記少なくとも1つのオーディオ出力信号を生成するように構成されることを特徴とする、請求項3に記載の装置(150)。 - 前記音源のそれぞれの前記位置値のそれぞれは、少なくとも2つの座標値を含み、前記修正モジュール(630)は、前記座標値が、音源が環境の予め定められた領域の範囲内の位置にあることを示すとき、前記座標値に少なくとも1つの乱数を加えることによって前記座標値を修正するように構成されることを特徴とする、請求項4に記載の装置(150)。
- 前記音源のそれぞれの前記位置値のそれぞれは、少なくとも2つの座標値を含み、前記修正モジュール(630)は、前記座標値が、音源が環境の予め定められた領域の範囲内の位置にあることを示すとき、前記座標値に確定関数を適用することによって前記座標値を修正するように構成されることを特徴とする、請求項4に記載の装置(150)。
- 前記音源のそれぞれの前記位置値のそれぞれは、少なくとも2つの座標値を含み、前記修正モジュール(630)は、前記座標値が、音源が環境の予め定められた領域の範囲内の位置にあることを示すとき、前記座標値と同じ音源に関連して、前記オーディオデータの前記1つ又は複数の圧力値のうちの選択された圧力値を修正するように構成されることを特徴とする、請求項4に記載の装置(150)。
- 前記修正モジュール(630)は、前記座標値が、前記音源が環境の予め定められた領域の範囲内の位置にあることを示すとき、前記1つ又は複数の拡散値のうちの1つに基づいて、前記オーディオデータの前記1つ又は複数の圧力値のうちの前記選択された圧力値を修正するように構成されることを特徴とする、請求項7に記載の装置(150)。
- 前記合成モジュールは、
前記オーディオデータストリームの前記オーディオデータの前記1つ又は複数の圧力値のうちの少なくとも1つに基づいて、前記オーディオデータストリームの前記オーディオデータの前記1つ又は複数の位置値のうちの少なくとも1つに基づいて、および、前記オーディオデータストリームの前記オーディオデータの前記1つ又は複数の拡散値のうちの少なくとも1つに基づいて、直接音を含む直接圧力信号、拡散音を含む拡散圧力信号および到来方向情報を生成するための第1のステージ合成ユニット(501)と、
前記直接圧力信号、前記拡散圧力信号および前記到来方向情報に基づいて、前記少なくとも1つのオーディオ出力信号を生成するための第2のステージ合成ユニット(502)とを含むことを特徴とする、請求項2〜請求項8のいずれかに記載の装置(150)。 - 1つ又は複数の音源に関連した音源データを含むオーディオデータストリームを生成するための装置(200)であって、オーディオデータストリームを生成するための前記装置は、
少なくとも1つのマイクロホンによって記録された少なくとも1つのオーディオ入力信号に基づき、かつ、少なくとも2つの空間マイクロホンによって供給されたオーディオ補助情報に基づいて、前記音源データを決定するための決定器(210;670)と、
前記オーディオデータストリームが前記音源データを含むように、前記オーディオデータストリームを生成するためのデータストリーム生成器(220;680)とを含み、
前記音源データは、前記音源のそれぞれについて1つ又は複数の圧力値を含み、前記音源データは、前記音源のそれぞれについて音源位置を示している1つ又は複数の位置値を更に含むことを特徴とする、前記装置。 - 前記音源データは、複数の時間―周波数ビンのうちの1つの時間―周波数ビンについて定められることを特徴とする、請求項10に記載の装置(200)。
- 前記決定器(210;670)は、少なくとも1つの空間マイクロホンによって拡散情報に基づいて前記音源データを決定するように構成され、
前記データストリーム生成器(220;680)は、前記オーディオデータストリームが前記音源データを含むように、前記オーディオデータストリームを生成するように構成され、
前記音源データは、前記音源のそれぞれについて1つ又は複数の拡散値を更に含むことを特徴とする、請求項10又は請求項11に記載の装置(200)。 - 前記装置(200)は、前記音源のうちの少なくとも1つに関する前記オーディオデータの前記圧力値のうちの少なくとも1つ、前記オーディオデータの前記位置値のうちの少なくとも1つ、または、前記オーディオデータの前記拡散値のうちの少なくとも1つを修正することによって、前記データストリーム生成器によって生成された前記オーディオデータストリームを修正するための修正モジュール(690)を含むことを特徴とする、請求項12に記載の装置(200)。
- 前記音源のそれぞれの前記位置値のそれぞれは、少なくとも2つの座標値を含み、前記修正モジュール(690)は、前記座標値が、音源が環境の予め定められた領域の範囲内の位置にあることを示すとき、前記座標値に少なくとも1つの乱数を加えることによって、または、前記座標値に確定関数を適用することによって、前記座標値を修正するように構成されることを特徴とする、請求項13に記載の装置(200)。
- 前記音源のそれぞれの前記位置値のそれぞれは、少なくとも2つの座標値を含み、前記修正モジュール(690)は、前記座標値が、音源が環境の予め定められた領域の範囲内の位置にあることを示すとき、前記座標値と同じ音源に関連して、前記オーディオデータの前記1つ又は複数の圧力値のうちの選択された圧力値を修正するように構成されることを特徴とする、請求項13に記載の装置(200)。
- 前記修正モジュール(690)は、前記少なくとも1つのオーディオ入力信号のうちの少なくとも1つに基づいて、前記1つ又は複数の圧力値のうちの前記選択された圧力値を修正するように構成されることを特徴とする、請求項15に記載の装置(200)。
- 仮想マイクロホンデータストリームを生成するための装置(950)であって、
仮想マイクロホンのオーディオ出力信号を生成するための装置(960)と、
前記仮想マイクロホンデータストリームとして、オーディオデータストリームを生成するための請求項10〜請求項13のいずれかに記載の装置(970)とを含み、
仮想マイクロホンのオーディオ出力信号を生成するための装置(960)は、
前記環境の音源の位置を示している音源位置を推定するための音事象位置推定器(110)であって、前記音事象位置推定器(110)は、前記環境の第1の実在のマイクロホン位置にある第1の実在の空間マイクロホンによって供給された第1の方向情報に基づき、かつ、前記環境の第2の実在のマイクロホン位置にある第2の実在の空間マイクロホンによって供給された第2の方向情報に基づいて、前記音源位置を推定するように構成される、前記音事象位置推定器(110)と、
記録されたオーディオ入力信号に基づいて、前記第1の実在のマイクロホン位置に基づいて、および、前記計算されたマイクロホン位置に基づいて、前記オーディオ出力信号を生成するための情報計算モジュール(120)とを含み、
仮想マイクロホンのオーディオ出力信号を生成するための装置(960)は、オーディオデータストリームを生成するための前記装置(970)に前記オーディオ出力信号を供給するように配置されること、および、
オーディオデータストリームを生成するための前記装置(970)の前記決定器は、仮想マイクロホンのオーディオ出力信号を生成するための前記装置(960)によって供給された前記オーディオ出力信号に基づいて、前記音源データを決定することを特徴とする、前記装置(950)。 - 請求項17に記載の仮想マイクロホンデータストリームを生成するための装置(950)によって供給された前記オーディオデータストリームとして、仮想マイクロホンデータストリームに基づいて、前記オーディオ出力信号を生成するように構成される、請求項1〜請求項9のいずれかに記載の装置(980)。
- 請求項1〜請求項9のいずれか又は請求項18に記載の装置と、
請求項10〜請求項16のいずれかに記載の装置とを含む、システム。 - 1つ又は複数の音源に関連したオーディオデータを含むオーディオデータストリームであって、前記オーディオデータは、前記1つ又は複数の音源のそれぞれについて、1つ又は複数の圧力値を含むこと、および、
前記オーディオデータは、前記1つ又は複数の音源のそれぞれについて、音源位置を示している1つ又は複数の位置値を含み、前記1つ又は複数の位置値のそれぞれは、少なくとも2つの座標値を含むことを特徴とする、オーディオデータストリーム。 - 前記オーディオデータは、複数の時間―周波数ビンのうちの1つの時間―周波数ビンについて定められることを特徴とする、請求項20に記載のオーディオデータストリーム。
- 前記オーディオデータは、前記1つ又は複数の音源のそれぞれについて1つ又は複数の拡散値を含むことを特徴とする、請求項20又は請求項21に記載のオーディオデータストリーム。
- 1つ又は複数の音源に関連したオーディオデータを含むオーディオデータストリームに基づいて、少なくとも1つのオーディオ出力信号を生成するための方法であって、
前記オーディオデータストリームを受信するステップであって、前記オーディオデータストリームは、前記音源のそれぞれについて、1つ又は複数の圧力値を含み、前記オーディオデータストリームは、前記音源のそれぞれについて音源位置を示している1つ又は複数の位置値を含む、前記ステップと、
前記オーディオストリームから、得られる圧力値を得るために前記圧力値の少なくともいくつか、および、得られる位置値を得るために前記位置の少なくともいくつかを決定するステップと、
前記得られる圧力値の少なくともいくつかに基づき、かつ、前記得られた位置値の少なくともいくつかに基づいて、前記少なくとも1つのオーディオ出力信号を決定するステップとを含む、方法。 - 1つ又は複数の音源に関連したオーディオデータを含むオーディオデータストリームを生成するための方法であって、
前記音源のそれぞれについて、少なくとも1つの圧力値を含むオーディオデータを受信するステップであって、前記オーディオデータは、前記音源のそれぞれについて、音源位置を示している1つ又は複数の位置値を更に含む、前記ステップと、
前記オーディオデータストリームが、前記音源のそれぞれについて、1つ又は複数の圧力値を含み、かつ、前記オーディオデータストリームが、前記音源のそれぞれについて、音源位置を示している1つ又は複数の位置値を更に含むように、前記オーディオデータストリームを生成するステップとを含む、前記方法。 - コンピュータまたは処理装置で実行されるときに、請求項23又は請求項24の方法を実行するためのコンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US41962310P | 2010-12-03 | 2010-12-03 | |
US61/419,623 | 2010-12-03 | ||
US42009910P | 2010-12-06 | 2010-12-06 | |
US61/420,099 | 2010-12-06 | ||
PCT/EP2011/071644 WO2012072804A1 (en) | 2010-12-03 | 2011-12-02 | Apparatus and method for geometry-based spatial audio coding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014501945A true JP2014501945A (ja) | 2014-01-23 |
JP5878549B2 JP5878549B2 (ja) | 2016-03-08 |
Family
ID=45406686
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013541374A Active JP5728094B2 (ja) | 2010-12-03 | 2011-12-02 | 到来方向推定から幾何学的な情報の抽出による音取得 |
JP2013541377A Active JP5878549B2 (ja) | 2010-12-03 | 2011-12-02 | 幾何ベースの空間オーディオ符号化のための装置および方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013541374A Active JP5728094B2 (ja) | 2010-12-03 | 2011-12-02 | 到来方向推定から幾何学的な情報の抽出による音取得 |
Country Status (16)
Country | Link |
---|---|
US (2) | US9396731B2 (ja) |
EP (2) | EP2647222B1 (ja) |
JP (2) | JP5728094B2 (ja) |
KR (2) | KR101442446B1 (ja) |
CN (2) | CN103460285B (ja) |
AR (2) | AR084091A1 (ja) |
AU (2) | AU2011334851B2 (ja) |
BR (1) | BR112013013681B1 (ja) |
CA (2) | CA2819502C (ja) |
ES (2) | ES2525839T3 (ja) |
HK (1) | HK1190490A1 (ja) |
MX (2) | MX338525B (ja) |
PL (1) | PL2647222T3 (ja) |
RU (2) | RU2556390C2 (ja) |
TW (2) | TWI489450B (ja) |
WO (2) | WO2012072804A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016056410A1 (ja) * | 2014-10-10 | 2016-04-14 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
JP2020501428A (ja) * | 2016-12-05 | 2020-01-16 | マジック リープ, インコーポレイテッドMagic Leap,Inc. | 仮想現実(vr)、拡張現実(ar)、および複合現実(mr)システムのための分散型オーディオ捕捉技法 |
JP2020098365A (ja) * | 2016-03-15 | 2020-06-25 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 音場記述を生成する装置、方法、及びコンピュータプログラム |
Families Citing this family (103)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
EP2600637A1 (en) * | 2011-12-02 | 2013-06-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for microphone positioning based on a spatial power density |
US10154361B2 (en) | 2011-12-22 | 2018-12-11 | Nokia Technologies Oy | Spatial audio processing apparatus |
CN104054126B (zh) * | 2012-01-19 | 2017-03-29 | 皇家飞利浦有限公司 | 空间音频渲染和编码 |
BR112015004625B1 (pt) | 2012-09-03 | 2021-12-07 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Aparelho e método para fornecer uma estimativa de probabilidade de presença de voz multicanal informada. |
WO2014046916A1 (en) * | 2012-09-21 | 2014-03-27 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
US10136239B1 (en) | 2012-09-26 | 2018-11-20 | Foundation For Research And Technology—Hellas (F.O.R.T.H.) | Capturing and reproducing spatial sound apparatuses, methods, and systems |
US10175335B1 (en) | 2012-09-26 | 2019-01-08 | Foundation For Research And Technology-Hellas (Forth) | Direction of arrival (DOA) estimation apparatuses, methods, and systems |
US9554203B1 (en) | 2012-09-26 | 2017-01-24 | Foundation for Research and Technolgy—Hellas (FORTH) Institute of Computer Science (ICS) | Sound source characterization apparatuses, methods and systems |
US9955277B1 (en) | 2012-09-26 | 2018-04-24 | Foundation For Research And Technology-Hellas (F.O.R.T.H.) Institute Of Computer Science (I.C.S.) | Spatial sound characterization apparatuses, methods and systems |
US9549253B2 (en) * | 2012-09-26 | 2017-01-17 | Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) | Sound source localization and isolation apparatuses, methods and systems |
US20160210957A1 (en) * | 2015-01-16 | 2016-07-21 | Foundation For Research And Technology - Hellas (Forth) | Foreground Signal Suppression Apparatuses, Methods, and Systems |
US10149048B1 (en) | 2012-09-26 | 2018-12-04 | Foundation for Research and Technology—Hellas (F.O.R.T.H.) Institute of Computer Science (I.C.S.) | Direction of arrival estimation and sound source enhancement in the presence of a reflective surface apparatuses, methods, and systems |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
FR2998438A1 (fr) * | 2012-11-16 | 2014-05-23 | France Telecom | Acquisition de donnees sonores spatialisees |
EP2747451A1 (en) | 2012-12-21 | 2014-06-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Filter and method for informed spatial filtering using multiple instantaneous direction-of-arrivial estimates |
CN104010265A (zh) | 2013-02-22 | 2014-08-27 | 杜比实验室特许公司 | 音频空间渲染设备及方法 |
CN104019885A (zh) * | 2013-02-28 | 2014-09-03 | 杜比实验室特许公司 | 声场分析*** |
US9979829B2 (en) | 2013-03-15 | 2018-05-22 | Dolby Laboratories Licensing Corporation | Normalization of soundfield orientations based on auditory scene analysis |
WO2014171791A1 (ko) | 2013-04-19 | 2014-10-23 | 한국전자통신연구원 | 다채널 오디오 신호 처리 장치 및 방법 |
CN108810793B (zh) | 2013-04-19 | 2020-12-15 | 韩国电子通信研究院 | 多信道音频信号处理装置及方法 |
US9769586B2 (en) | 2013-05-29 | 2017-09-19 | Qualcomm Incorporated | Performing order reduction with respect to higher order ambisonic coefficients |
CN104244164A (zh) | 2013-06-18 | 2014-12-24 | 杜比实验室特许公司 | 生成环绕立体声声场 |
CN104240711B (zh) * | 2013-06-18 | 2019-10-11 | 杜比实验室特许公司 | 用于生成自适应音频内容的方法、***和装置 |
EP2830047A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for low delay object metadata coding |
EP2830045A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
EP2830052A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension |
EP2830050A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for enhanced spatial audio object coding |
US9319819B2 (en) * | 2013-07-25 | 2016-04-19 | Etri | Binaural rendering method and apparatus for decoding multi channel audio |
EP3028476B1 (en) | 2013-07-30 | 2019-03-13 | Dolby International AB | Panning of audio objects to arbitrary speaker layouts |
CN104637495B (zh) * | 2013-11-08 | 2019-03-26 | 宏达国际电子股份有限公司 | 电子装置以及音频信号处理方法 |
CN103618986B (zh) * | 2013-11-19 | 2015-09-30 | 深圳市新一代信息技术研究院有限公司 | 一种3d空间中音源声像体的提取方法及装置 |
CN112351367B (zh) | 2013-11-22 | 2022-11-29 | 苹果公司 | 用于调节由扬声器阵列发出的声音的方法、***和设备 |
ES2833424T3 (es) | 2014-05-13 | 2021-06-15 | Fraunhofer Ges Forschung | Aparato y método para panoramización de amplitud de atenuación de bordes |
US9620137B2 (en) * | 2014-05-16 | 2017-04-11 | Qualcomm Incorporated | Determining between scalar and vector quantization in higher order ambisonic coefficients |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
DE112015003945T5 (de) * | 2014-08-28 | 2017-05-11 | Knowles Electronics, Llc | Mehrquellen-Rauschunterdrückung |
CN110636415B (zh) | 2014-08-29 | 2021-07-23 | 杜比实验室特许公司 | 用于处理音频的方法、***和存储介质 |
CN104168534A (zh) * | 2014-09-01 | 2014-11-26 | 北京塞宾科技有限公司 | 一种全息音频装置及控制方法 |
US9774974B2 (en) * | 2014-09-24 | 2017-09-26 | Electronics And Telecommunications Research Institute | Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion |
CN104378570A (zh) * | 2014-09-28 | 2015-02-25 | 小米科技有限责任公司 | 录音方法及装置 |
US9794721B2 (en) | 2015-01-30 | 2017-10-17 | Dts, Inc. | System and method for capturing, encoding, distributing, and decoding immersive audio |
TWI579835B (zh) * | 2015-03-19 | 2017-04-21 | 絡達科技股份有限公司 | 音效增益方法 |
EP3079074A1 (fr) * | 2015-04-10 | 2016-10-12 | B<>Com | Procédé de traitement de données pour l'estimation de paramètres de mixage de signaux audio, procédé de mixage, dispositifs, et programmes d'ordinateurs associés |
US9609436B2 (en) | 2015-05-22 | 2017-03-28 | Microsoft Technology Licensing, Llc | Systems and methods for audio creation and delivery |
US9530426B1 (en) | 2015-06-24 | 2016-12-27 | Microsoft Technology Licensing, Llc | Filtering sounds for conferencing applications |
US9601131B2 (en) * | 2015-06-25 | 2017-03-21 | Htc Corporation | Sound processing device and method |
WO2017004584A1 (en) | 2015-07-02 | 2017-01-05 | Dolby Laboratories Licensing Corporation | Determining azimuth and elevation angles from stereo recordings |
HK1255002A1 (zh) | 2015-07-02 | 2019-08-02 | 杜比實驗室特許公司 | 根據立體聲記錄確定方位角和俯仰角 |
GB2543275A (en) * | 2015-10-12 | 2017-04-19 | Nokia Technologies Oy | Distributed audio capture and mixing |
TWI577194B (zh) * | 2015-10-22 | 2017-04-01 | 山衛科技股份有限公司 | 環境音源辨識系統及其環境音源辨識之方法 |
US10425726B2 (en) * | 2015-10-26 | 2019-09-24 | Sony Corporation | Signal processing device, signal processing method, and program |
US10206040B2 (en) * | 2015-10-30 | 2019-02-12 | Essential Products, Inc. | Microphone array for generating virtual sound field |
EP3174316B1 (en) * | 2015-11-27 | 2020-02-26 | Nokia Technologies Oy | Intelligent audio rendering |
US9894434B2 (en) * | 2015-12-04 | 2018-02-13 | Sennheiser Electronic Gmbh & Co. Kg | Conference system with a microphone array system and a method of speech acquisition in a conference system |
US11064291B2 (en) | 2015-12-04 | 2021-07-13 | Sennheiser Electronic Gmbh & Co. Kg | Microphone array system |
US9956910B2 (en) * | 2016-07-18 | 2018-05-01 | Toyota Motor Engineering & Manufacturing North America, Inc. | Audible notification systems and methods for autonomous vehicles |
GB2554446A (en) * | 2016-09-28 | 2018-04-04 | Nokia Technologies Oy | Spatial audio signal format generation from a microphone array using adaptive capture |
US9986357B2 (en) | 2016-09-28 | 2018-05-29 | Nokia Technologies Oy | Fitting background ambiance to sound objects |
US10820097B2 (en) | 2016-09-29 | 2020-10-27 | Dolby Laboratories Licensing Corporation | Method, systems and apparatus for determining audio representation(s) of one or more audio sources |
US9980078B2 (en) | 2016-10-14 | 2018-05-22 | Nokia Technologies Oy | Audio object modification in free-viewpoint rendering |
CN106708041B (zh) * | 2016-12-12 | 2020-12-29 | 西安Tcl软件开发有限公司 | 智能音箱、智能音箱定向移动方法及装置 |
US11096004B2 (en) | 2017-01-23 | 2021-08-17 | Nokia Technologies Oy | Spatial audio rendering point extension |
US10366700B2 (en) | 2017-02-08 | 2019-07-30 | Logitech Europe, S.A. | Device for acquiring and processing audible input |
US10229667B2 (en) | 2017-02-08 | 2019-03-12 | Logitech Europe S.A. | Multi-directional beamforming device for acquiring and processing audible input |
US10366702B2 (en) | 2017-02-08 | 2019-07-30 | Logitech Europe, S.A. | Direction detection device for acquiring and processing audible input |
US10362393B2 (en) | 2017-02-08 | 2019-07-23 | Logitech Europe, S.A. | Direction detection device for acquiring and processing audible input |
US10531219B2 (en) | 2017-03-20 | 2020-01-07 | Nokia Technologies Oy | Smooth rendering of overlapping audio-object interactions |
US10397724B2 (en) | 2017-03-27 | 2019-08-27 | Samsung Electronics Co., Ltd. | Modifying an apparent elevation of a sound source utilizing second-order filter sections |
US11074036B2 (en) | 2017-05-05 | 2021-07-27 | Nokia Technologies Oy | Metadata-free audio-object interactions |
US10165386B2 (en) * | 2017-05-16 | 2018-12-25 | Nokia Technologies Oy | VR audio superzoom |
IT201700055080A1 (it) * | 2017-05-22 | 2018-11-22 | Teko Telecom S R L | Sistema di comunicazione wireless e relativo metodo per il trattamento di dati fronthaul di uplink |
US10602296B2 (en) | 2017-06-09 | 2020-03-24 | Nokia Technologies Oy | Audio object adjustment for phase compensation in 6 degrees of freedom audio |
US10334360B2 (en) * | 2017-06-12 | 2019-06-25 | Revolabs, Inc | Method for accurately calculating the direction of arrival of sound at a microphone array |
GB2563606A (en) | 2017-06-20 | 2018-12-26 | Nokia Technologies Oy | Spatial audio processing |
GB201710085D0 (en) | 2017-06-23 | 2017-08-09 | Nokia Technologies Oy | Determination of targeted spatial audio parameters and associated spatial audio playback |
GB201710093D0 (en) * | 2017-06-23 | 2017-08-09 | Nokia Technologies Oy | Audio distance estimation for spatial audio processing |
KR102654507B1 (ko) | 2017-07-14 | 2024-04-05 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 다중-지점 음장 묘사를 이용하여 증강된 음장 묘사 또는 수정된 음장 묘사를 생성하기 위한 개념 |
KR102652670B1 (ko) | 2017-07-14 | 2024-04-01 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 다중-층 묘사를 이용하여 증강된 음장 묘사 또는 수정된 음장 묘사를 생성하기 위한 개념 |
CN111108555B (zh) | 2017-07-14 | 2023-12-15 | 弗劳恩霍夫应用研究促进协会 | 使用深度扩展DirAC技术或其他技术生成经增强的声场描述或经修改的声场描述的装置和方法 |
US10264354B1 (en) * | 2017-09-25 | 2019-04-16 | Cirrus Logic, Inc. | Spatial cues from broadside detection |
US11395087B2 (en) | 2017-09-29 | 2022-07-19 | Nokia Technologies Oy | Level-based audio-object interactions |
CN111201784B (zh) | 2017-10-17 | 2021-09-07 | 惠普发展公司,有限责任合伙企业 | 通信***、用于通信的方法和视频会议*** |
US10542368B2 (en) | 2018-03-27 | 2020-01-21 | Nokia Technologies Oy | Audio content modification for playback audio |
TWI690921B (zh) * | 2018-08-24 | 2020-04-11 | 緯創資通股份有限公司 | 收音處理裝置及其收音處理方法 |
US11017790B2 (en) * | 2018-11-30 | 2021-05-25 | International Business Machines Corporation | Avoiding speech collisions among participants during teleconferences |
TWI751457B (zh) | 2018-12-07 | 2022-01-01 | 弗勞恩霍夫爾協會 | 使用直流分量補償用於編碼、解碼、場景處理及基於空間音訊編碼與DirAC有關的其他程序的裝置、方法及電腦程式 |
CN113841197B (zh) * | 2019-03-14 | 2022-12-27 | 博姆云360公司 | 具有优先级的空间感知多频带压缩*** |
EP4005233A1 (en) | 2019-07-30 | 2022-06-01 | Dolby Laboratories Licensing Corporation | Adaptable spatial audio playback |
US11968268B2 (en) | 2019-07-30 | 2024-04-23 | Dolby Laboratories Licensing Corporation | Coordination of audio devices |
KR102154553B1 (ko) * | 2019-09-18 | 2020-09-10 | 한국표준과학연구원 | 지향성이 향상된 마이크로폰 어레이 및 이를 이용한 음장 취득 방법 |
EP3963902A4 (en) | 2019-09-24 | 2022-07-13 | Samsung Electronics Co., Ltd. | METHODS AND SYSTEMS FOR MIXED AUDIO SIGNAL RECORDING AND DIRECTIONAL AUDIO CONTENT REPRODUCTION |
TW202123220A (zh) | 2019-10-30 | 2021-06-16 | 美商杜拜研究特許公司 | 使用方向性元資料之多通道音頻編碼及解碼 |
GB2590504A (en) * | 2019-12-20 | 2021-06-30 | Nokia Technologies Oy | Rotating camera and microphone configurations |
CN113284504A (zh) * | 2020-02-20 | 2021-08-20 | 北京三星通信技术研究有限公司 | 姿态检测方法、装置、电子设备及计算机可读存储介质 |
US11277689B2 (en) | 2020-02-24 | 2022-03-15 | Logitech Europe S.A. | Apparatus and method for optimizing sound quality of a generated audible signal |
US11425523B2 (en) * | 2020-04-10 | 2022-08-23 | Facebook Technologies, Llc | Systems and methods for audio adjustment |
CN111951833A (zh) * | 2020-08-04 | 2020-11-17 | 科大讯飞股份有限公司 | 语音测试方法、装置、电子设备和存储介质 |
CN112083379B (zh) * | 2020-09-09 | 2023-10-20 | 极米科技股份有限公司 | 基于声源定位的音频播放方法、装置、投影设备及介质 |
JPWO2022162878A1 (ja) * | 2021-01-29 | 2022-08-04 | ||
CN116918350A (zh) * | 2021-04-25 | 2023-10-20 | 深圳市韶音科技有限公司 | 声学装置 |
US20230036986A1 (en) * | 2021-07-27 | 2023-02-02 | Qualcomm Incorporated | Processing of audio signals from multiple microphones |
DE202022105574U1 (de) | 2022-10-01 | 2022-10-20 | Veerendra Dakulagi | Ein System zur Klassifizierung mehrerer Signale für die Schätzung der Ankunftsrichtung |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01109996A (ja) * | 1987-10-23 | 1989-04-26 | Sony Corp | マイクロホン装置 |
JP2002051399A (ja) * | 2000-08-03 | 2002-02-15 | Sony Corp | 音声信号処理方法及び音声信号処理装置 |
JP2004193877A (ja) * | 2002-12-10 | 2004-07-08 | Sony Corp | 音像定位信号処理装置および音像定位信号処理方法 |
JP2006503491A (ja) * | 2002-10-15 | 2006-01-26 | 韓國電子通信研究院 | 空間性が拡張された音源を有する3次元音響シーンの生成及び消費方法 |
JP2008028700A (ja) * | 2006-07-21 | 2008-02-07 | Sony Corp | 音声信号処理装置、音声信号処理方法および音声信号処理プログラム |
JP2008245984A (ja) * | 2007-03-30 | 2008-10-16 | Konami Digital Entertainment:Kk | ゲーム音出力装置、音像定位制御方法、および、プログラム |
JP2009216473A (ja) * | 2008-03-07 | 2009-09-24 | Univ Nihon | 音源距離計測装置及びそれを用いた音響情報分離装置 |
JP2009537876A (ja) * | 2006-05-19 | 2009-10-29 | 韓國電子通信研究院 | プリセットオーディオシーンを用いたオブジェクトベースの3次元オーディオサービスシステム及びその方法 |
WO2010128136A1 (en) * | 2009-05-08 | 2010-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
Family Cites Families (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04181898A (ja) * | 1990-11-15 | 1992-06-29 | Ricoh Co Ltd | マイクロホン |
JPH1063470A (ja) * | 1996-06-12 | 1998-03-06 | Nintendo Co Ltd | 画像表示に連動する音響発生装置 |
US6577738B2 (en) * | 1996-07-17 | 2003-06-10 | American Technology Corporation | Parametric virtual speaker and surround-sound system |
US6072878A (en) | 1997-09-24 | 2000-06-06 | Sonic Solutions | Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics |
JP3344647B2 (ja) * | 1998-02-18 | 2002-11-11 | 富士通株式会社 | マイクロホンアレイ装置 |
JP3863323B2 (ja) | 1999-08-03 | 2006-12-27 | 富士通株式会社 | マイクロホンアレイ装置 |
EP1275272B1 (en) * | 2000-04-19 | 2012-11-21 | SNK Tech Investment L.L.C. | Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics in three dimensions |
KR100387238B1 (ko) * | 2000-04-21 | 2003-06-12 | 삼성전자주식회사 | 오디오 변조 기능을 갖는 오디오 재생 장치 및 방법, 그장치를 적용한 리믹싱 장치 및 방법 |
GB2364121B (en) | 2000-06-30 | 2004-11-24 | Mitel Corp | Method and apparatus for locating a talker |
KR100626661B1 (ko) * | 2002-10-15 | 2006-09-22 | 한국전자통신연구원 | 공간성이 확장된 음원을 갖는 3차원 음향 장면 처리 방법 |
KR101014404B1 (ko) * | 2002-11-15 | 2011-02-15 | 소니 주식회사 | 오디오신호의 처리방법 및 처리장치 |
KR20040060718A (ko) | 2002-12-28 | 2004-07-06 | 삼성전자주식회사 | 오디오 스트림 믹싱 방법, 그 장치 및 그 정보저장매체 |
EP1576602A4 (en) | 2002-12-28 | 2008-05-28 | Samsung Electronics Co Ltd | METHOD AND DEVICE FOR MIXING AUDIO SEQUENCE AND INFORMATION RECORDING MEDIUM |
JP3639280B2 (ja) * | 2003-02-12 | 2005-04-20 | 任天堂株式会社 | ゲームメッセージ表示方法およびゲームプログラム |
FI118247B (fi) | 2003-02-26 | 2007-08-31 | Fraunhofer Ges Forschung | Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa |
JP4133559B2 (ja) | 2003-05-02 | 2008-08-13 | 株式会社コナミデジタルエンタテインメント | 音声再生プログラム、音声再生方法及び音声再生装置 |
US20060104451A1 (en) * | 2003-08-07 | 2006-05-18 | Tymphany Corporation | Audio reproduction system |
RU2396608C2 (ru) * | 2004-04-05 | 2010-08-10 | Конинклейке Филипс Электроникс Н.В. | Способ, устройство, кодирующее устройство, декодирующее устройство и аудиосистема |
GB2414369B (en) * | 2004-05-21 | 2007-08-01 | Hewlett Packard Development Co | Processing audio data |
KR100586893B1 (ko) | 2004-06-28 | 2006-06-08 | 삼성전자주식회사 | 시변 잡음 환경에서의 화자 위치 추정 시스템 및 방법 |
WO2006006935A1 (en) | 2004-07-08 | 2006-01-19 | Agency For Science, Technology And Research | Capturing sound from a target region |
US7617501B2 (en) | 2004-07-09 | 2009-11-10 | Quest Software, Inc. | Apparatus, system, and method for managing policies on a computer having a foreign operating system |
US7903824B2 (en) * | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
DE102005010057A1 (de) | 2005-03-04 | 2006-09-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms |
WO2006105105A2 (en) | 2005-03-28 | 2006-10-05 | Sound Id | Personal sound system |
JP4273343B2 (ja) * | 2005-04-18 | 2009-06-03 | ソニー株式会社 | 再生装置および再生方法 |
US20070047742A1 (en) | 2005-08-26 | 2007-03-01 | Step Communications Corporation, A Nevada Corporation | Method and system for enhancing regional sensitivity noise discrimination |
JP5038145B2 (ja) * | 2005-10-18 | 2012-10-03 | パイオニア株式会社 | 定位制御装置、定位制御方法、定位制御プログラムおよびコンピュータに読み取り可能な記録媒体 |
CN101473645B (zh) * | 2005-12-08 | 2011-09-21 | 韩国电子通信研究院 | 使用预设音频场景的基于对象的三维音频服务*** |
DE602007004451D1 (de) | 2006-02-21 | 2010-03-11 | Koninkl Philips Electronics Nv | Audiokodierung und audiodekodierung |
GB0604076D0 (en) * | 2006-03-01 | 2006-04-12 | Univ Lancaster | Method and apparatus for signal presentation |
EP1989926B1 (en) | 2006-03-01 | 2020-07-08 | Lancaster University Business Enterprises Limited | Method and apparatus for signal presentation |
US8374365B2 (en) * | 2006-05-17 | 2013-02-12 | Creative Technology Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
US20080004729A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Direct encoding into a directional audio coding format |
US8229754B1 (en) * | 2006-10-23 | 2012-07-24 | Adobe Systems Incorporated | Selecting features of displayed audio data across time |
EP2595148A3 (en) * | 2006-12-27 | 2013-11-13 | Electronics and Telecommunications Research Institute | Apparatus for coding multi-object audio signals |
JP4449987B2 (ja) * | 2007-02-15 | 2010-04-14 | ソニー株式会社 | 音声処理装置、音声処理方法およびプログラム |
US9015051B2 (en) * | 2007-03-21 | 2015-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Reconstruction of audio channels with direction parameters indicating direction of origin |
EP2147567B1 (en) | 2007-04-19 | 2013-04-10 | Epos Development Ltd. | Voice and position localization |
FR2916078A1 (fr) * | 2007-05-10 | 2008-11-14 | France Telecom | Procede de codage et decodage audio, codeur audio, decodeur audio et programmes d'ordinateur associes |
US8180062B2 (en) * | 2007-05-30 | 2012-05-15 | Nokia Corporation | Spatial sound zooming |
US20080298610A1 (en) | 2007-05-30 | 2008-12-04 | Nokia Corporation | Parameter Space Re-Panning for Spatial Audio |
JP5294603B2 (ja) * | 2007-10-03 | 2013-09-18 | 日本電信電話株式会社 | 音響信号推定装置、音響信号合成装置、音響信号推定合成装置、音響信号推定方法、音響信号合成方法、音響信号推定合成方法、これらの方法を用いたプログラム、及び記録媒体 |
GB2467668B (en) * | 2007-10-03 | 2011-12-07 | Creative Tech Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
KR101415026B1 (ko) | 2007-11-19 | 2014-07-04 | 삼성전자주식회사 | 마이크로폰 어레이를 이용한 다채널 사운드 획득 방법 및장치 |
DE212009000019U1 (de) | 2008-01-10 | 2010-09-02 | Sound Id, Mountain View | Persönliches Schallsystem für die Anzeige eines Schalldruckpegels oder einer anderen Umgebungsbedingung |
JP2009246827A (ja) * | 2008-03-31 | 2009-10-22 | Nippon Hoso Kyokai <Nhk> | 音源及び仮想音源の位置特定装置、方法及びプログラム |
KR101461685B1 (ko) * | 2008-03-31 | 2014-11-19 | 한국전자통신연구원 | 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치 |
US8457328B2 (en) * | 2008-04-22 | 2013-06-04 | Nokia Corporation | Method, apparatus and computer program product for utilizing spatial information for audio signal enhancement in a distributed network environment |
EP2154677B1 (en) | 2008-08-13 | 2013-07-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus for determining a converted spatial audio signal |
EP2154910A1 (en) * | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for merging spatial audio streams |
US8023660B2 (en) * | 2008-09-11 | 2011-09-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues |
KR101392546B1 (ko) * | 2008-09-11 | 2014-05-08 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 마이크로폰 신호를 기반으로 공간 큐의 세트를 제공하는 장치, 방법 및 컴퓨터 프로그램과, 2채널 오디오 신호 및 공간 큐의 세트를 제공하는 장치 |
ES2733878T3 (es) * | 2008-12-15 | 2019-12-03 | Orange | Codificación mejorada de señales de audio digitales multicanales |
JP5309953B2 (ja) | 2008-12-17 | 2013-10-09 | ヤマハ株式会社 | 収音装置 |
EP2205007B1 (en) * | 2008-12-30 | 2019-01-09 | Dolby International AB | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction |
US8867754B2 (en) | 2009-02-13 | 2014-10-21 | Honda Motor Co., Ltd. | Dereverberation apparatus and dereverberation method |
JP5197458B2 (ja) * | 2009-03-25 | 2013-05-15 | 株式会社東芝 | 受音信号処理装置、方法およびプログラム |
JP5314129B2 (ja) * | 2009-03-31 | 2013-10-16 | パナソニック株式会社 | 音響再生装置及び音響再生方法 |
CN102414743A (zh) * | 2009-04-21 | 2012-04-11 | 皇家飞利浦电子股份有限公司 | 音频信号合成 |
EP2346028A1 (en) | 2009-12-17 | 2011-07-20 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal |
KR20120059827A (ko) * | 2010-12-01 | 2012-06-11 | 삼성전자주식회사 | 다중 음원 위치추적장치 및 그 위치추적방법 |
-
2011
- 2011-12-02 TW TW100144577A patent/TWI489450B/zh active
- 2011-12-02 CA CA2819502A patent/CA2819502C/en active Active
- 2011-12-02 ES ES11801647.6T patent/ES2525839T3/es active Active
- 2011-12-02 BR BR112013013681-2A patent/BR112013013681B1/pt active IP Right Grant
- 2011-12-02 ES ES11801648.4T patent/ES2643163T3/es active Active
- 2011-12-02 KR KR1020137017057A patent/KR101442446B1/ko active IP Right Grant
- 2011-12-02 AR ARP110104509A patent/AR084091A1/es active IP Right Grant
- 2011-12-02 PL PL11801647T patent/PL2647222T3/pl unknown
- 2011-12-02 WO PCT/EP2011/071644 patent/WO2012072804A1/en active Application Filing
- 2011-12-02 AU AU2011334851A patent/AU2011334851B2/en active Active
- 2011-12-02 MX MX2013006150A patent/MX338525B/es active IP Right Grant
- 2011-12-02 TW TW100144576A patent/TWI530201B/zh active
- 2011-12-02 RU RU2013130226/08A patent/RU2556390C2/ru active
- 2011-12-02 CN CN201180066795.0A patent/CN103460285B/zh active Active
- 2011-12-02 EP EP11801647.6A patent/EP2647222B1/en active Active
- 2011-12-02 JP JP2013541374A patent/JP5728094B2/ja active Active
- 2011-12-02 KR KR1020137017441A patent/KR101619578B1/ko active IP Right Grant
- 2011-12-02 MX MX2013006068A patent/MX2013006068A/es active IP Right Grant
- 2011-12-02 RU RU2013130233/28A patent/RU2570359C2/ru active
- 2011-12-02 WO PCT/EP2011/071629 patent/WO2012072798A1/en active Application Filing
- 2011-12-02 AU AU2011334857A patent/AU2011334857B2/en active Active
- 2011-12-02 CN CN201180066792.7A patent/CN103583054B/zh active Active
- 2011-12-02 JP JP2013541377A patent/JP5878549B2/ja active Active
- 2011-12-02 EP EP11801648.4A patent/EP2647005B1/en active Active
- 2011-12-02 CA CA2819394A patent/CA2819394C/en active Active
- 2011-12-05 AR ARP110104544A patent/AR084160A1/es active IP Right Grant
-
2013
- 2013-05-29 US US13/904,870 patent/US9396731B2/en active Active
- 2013-05-31 US US13/907,510 patent/US10109282B2/en active Active
-
2014
- 2014-04-09 HK HK14103418.2A patent/HK1190490A1/xx unknown
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01109996A (ja) * | 1987-10-23 | 1989-04-26 | Sony Corp | マイクロホン装置 |
JP2002051399A (ja) * | 2000-08-03 | 2002-02-15 | Sony Corp | 音声信号処理方法及び音声信号処理装置 |
JP2006503491A (ja) * | 2002-10-15 | 2006-01-26 | 韓國電子通信研究院 | 空間性が拡張された音源を有する3次元音響シーンの生成及び消費方法 |
JP2004193877A (ja) * | 2002-12-10 | 2004-07-08 | Sony Corp | 音像定位信号処理装置および音像定位信号処理方法 |
JP2009537876A (ja) * | 2006-05-19 | 2009-10-29 | 韓國電子通信研究院 | プリセットオーディオシーンを用いたオブジェクトベースの3次元オーディオサービスシステム及びその方法 |
JP2008028700A (ja) * | 2006-07-21 | 2008-02-07 | Sony Corp | 音声信号処理装置、音声信号処理方法および音声信号処理プログラム |
JP2008245984A (ja) * | 2007-03-30 | 2008-10-16 | Konami Digital Entertainment:Kk | ゲーム音出力装置、音像定位制御方法、および、プログラム |
JP2009216473A (ja) * | 2008-03-07 | 2009-09-24 | Univ Nihon | 音源距離計測装置及びそれを用いた音響情報分離装置 |
WO2010128136A1 (en) * | 2009-05-08 | 2010-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016056410A1 (ja) * | 2014-10-10 | 2016-04-14 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
JPWO2016056410A1 (ja) * | 2014-10-10 | 2017-07-20 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
US10602266B2 (en) | 2014-10-10 | 2020-03-24 | Sony Corporation | Audio processing apparatus and method, and program |
JP2020098365A (ja) * | 2016-03-15 | 2020-06-25 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 音場記述を生成する装置、方法、及びコンピュータプログラム |
US11272305B2 (en) | 2016-03-15 | 2022-03-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Apparatus, method or computer program for generating a sound field description |
JP7043533B2 (ja) | 2016-03-15 | 2022-03-29 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 音場記述を生成する装置、方法、及びコンピュータプログラム |
JP2020501428A (ja) * | 2016-12-05 | 2020-01-16 | マジック リープ, インコーポレイテッドMagic Leap,Inc. | 仮想現実(vr)、拡張現実(ar)、および複合現実(mr)システムのための分散型オーディオ捕捉技法 |
JP7125397B2 (ja) | 2016-12-05 | 2022-08-24 | マジック リープ, インコーポレイテッド | 仮想現実(vr)、拡張現実(ar)、および複合現実(mr)システムのための分散型オーディオ捕捉技法 |
US11528576B2 (en) | 2016-12-05 | 2022-12-13 | Magic Leap, Inc. | Distributed audio capturing techniques for virtual reality (VR), augmented reality (AR), and mixed reality (MR) systems |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5878549B2 (ja) | 幾何ベースの空間オーディオ符号化のための装置および方法 | |
JP6086923B2 (ja) | 幾何学配置に基づく空間オーディオ符号化ストリームを統合する装置および方法 | |
JP2015502716A (ja) | 空間パワー密度に基づくマイクロフォン位置決め装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140425 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140527 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20140528 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20140528 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20140821 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20140828 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141127 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150414 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150813 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20150813 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20150907 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151020 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160128 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5878549 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |