JP5728094B2 - 到来方向推定から幾何学的な情報の抽出による音取得 - Google Patents
到来方向推定から幾何学的な情報の抽出による音取得 Download PDFInfo
- Publication number
- JP5728094B2 JP5728094B2 JP2013541374A JP2013541374A JP5728094B2 JP 5728094 B2 JP5728094 B2 JP 5728094B2 JP 2013541374 A JP2013541374 A JP 2013541374A JP 2013541374 A JP2013541374 A JP 2013541374A JP 5728094 B2 JP5728094 B2 JP 5728094B2
- Authority
- JP
- Japan
- Prior art keywords
- microphone
- sound
- true
- signal
- spatial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 claims description 70
- 238000004364 calculation method Methods 0.000 claims description 64
- 238000000034 method Methods 0.000 claims description 49
- 239000013598 vector Substances 0.000 claims description 13
- 238000009792 diffusion process Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 230000003595 spectral effect Effects 0.000 claims description 4
- 238000003491 array Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 14
- 238000001228 spectrum Methods 0.000 description 10
- 238000013459 approach Methods 0.000 description 9
- 208000001992 Autosomal Dominant Optic Atrophy Diseases 0.000 description 8
- 206010011906 Death Diseases 0.000 description 8
- 238000013213 extrapolation Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 238000001093 holography Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000004807 localization Effects 0.000 description 3
- 230000007480 spreading Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/326—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
- H04R2430/21—Direction finding using differential microphone array [DMA]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Otolaryngology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Description
[1] R. K. Furness, "Ambisonics - An overview," in AES 8th International Conference, April 1990, pp. 181-189
を参照し、例えばアンビソニック(Ambisonics)において、例えばB−フォーマットマイクロホンなどのより高性能のマイクロホンを、間隔をおいて用いる。
[2] Pulkki, V., "Directional audio coding in spatial sound reproduction and stereo upmixing," in Proceedings of the AES 28th International Conference, pp. 251-258, Piteaa, Sweden, June 30 - July 2, 2006,
[3] V. Pulkki, "Spatial sound reproduction with directional audio coding," J. Audio Eng. Soc., vol. 55, no. 6, pp. 503-516, June 2007
に見られる。
[4] C. Faller: "Microphone Front-Ends for Spatial Audio Coders", in Proceedings of the AES 125th International Convention, San Francisco, Oct. 2008
を参照する。
[5] M. Kallinger, H. Ochsenfeld, G. Del Galdo, F. Kuech, D. Mahne, R. Schultz-Amling. and O. Thiergart, "A spatial filtering approach for directional audio coding," in Audio Engineering Society Convention 126, Munich, Germany, May 2009
に記載されるように、任意のピックアップパターンを有する空間フィルタを実現することが可能である方向オーディオ符号化(DirAC)([2]、[3]を参照)などの上述の方法、および、例えば、
[6] R. Schultz-Amling, F. Kuech, O. Thiergart, and M. Kallinger, "Acoustical zooming based on a parametric sound field representation," in Audio Engineering Society Convention 128, London UK, May 2010,
[7] J. Herre, C. Falch, D. Mahne, G. Del Galdo, M. Kallinger, and O. Thiergart, "Interactive teleconferencing combining spatial audio object coding and DirAC technology," in Audio Engineering Society Convention 128, London UK, May 2010
を参照する、音シーンの他の信号処理操作によって提供される。
[8] E. G. Williams, Fourier Acoustics: Sound Radiation and Nearfield Acoustical Holography, Academic Press, 1999
に記載されるように、音響ホログラフィである。
[9] A. Kuntz and R. Rabenstein, "Limitations in the extrapolation of wave fields from circular measurements," in 15th European Signal Processing Conference (EUSIPCO 2007), 2007
を参照し、より大きい外挿距離のためにおよび音の伝搬方向に対して直角の方向に向かって外挿のために、急速に低下する。
は、平面波モデルを記載し、音場外挿は、実際の音源から離れた位置に、例えば測定位置の近くにだけ可能である。
は、ラウドスピーカまたはヘッドホンを通して再生されるときに、真の記録位置を他の位置に仮想的に動かすための方法を提案する。しかしながら、この方法は、すべての音オブジェクトが、記録のために用いられる真の空間マイクロホンまでの等しい距離を有すると考えられる単純な音シーンに制限される。さらに、その方法は、1つの空間マイクロホンの利点をとることができるだけである。
[13] R. Roy, A. Paulraj, and T. Kailath, "Direction-of-arrival estimation by subspace rotation methods - ESPRIT," in IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), Stanford, CA, USA, April 1986
、または、
[14] R. Schmidt, "Multiple emitter location and signal parameter estimation," IEEE Transactions on Antennas and Propagation, vol. 34, no. 3, pp. 276-280, 1986
を参照する、(ルート)MUSICなどの適切なDOA推定器を、時間周波数領域に変換される音圧信号に用いることによって達成される。
[15] J. Michael Steele, "Optimal Triangulation of Random Samples in the Plane", The Annals of Probability, Vol. 10, No.3 (Aug., 1982), pp. 548-553
に記載されているように適用されてもよい。
[12] S. Rickard and Z. Yilmaz, "On the approximate W-disjoint orthogonality of speech," in Acoustics, Speech and Signal Processing, 2002. ICASSP 2002. IEEE International Conference on, April 2002, vol. 1
を参照する、スピーチ信号のために通常、真実である。
−重み付けられた平均、例えば、SNRまたは仮想マイクロホンまでの距離または真の空間マイクロホンによって推定された拡散を考慮すること。従来の解決策、例えば、Maximum Ratio Combining(MRC)またはEqual Gain Combining(EQC)が用いられてもよく、または、
−結合信号を得るために修正されたオーディオ信号のいくらかまたはすべての1次結合。修正されたオーディオ信号は、結合信号を得るために、1次結合において重み付けられてもよく、または、
−選択、例えば、唯一の信号だけが、SNRまたは距離または拡散に依存して用いられる。
を含む。
Claims (18)
- 環境において設定可能な仮想位置で仮想マイクロホンによってオーディオ出力信号の記録をシミュレートするためにオーディオ出力信号を生成するための装置であって、
前記環境において音事象の位置を示す音事象位置を推定するための音事象位置推定器(110)であって、前記音事象は、特定の時間瞬間でまたは特定の時間周波数ビンにおいてアクティブであり、前記音事象は、真の音源または鏡像源であり、前記音事象位置推定器(110)は、前記音事象が鏡像源であるときに前記環境において鏡像源の位置を示す前記音事象位置を推定するように構成され、さらに、前記音事象位置推定器(110)は、前記環境において第1の真のマイクロホン位置に設置される第1の真の空間マイクロホンによって提供される第1の方向情報に基づいて、さらに、前記環境において第2の真のマイクロホン位置に設置される第2の真の空間マイクロホンによって提供される第2の方向情報に基づいて、前記音事象位置を推定するように構成され、前記第1の真の空間マイクロホンおよび前記第2の真の空間マイクロホンは、物理的に存在する空間マイクロホンであり、さらに、前記第1の真の空間マイクロホンおよび前記第2の真の空間マイクロホンは、音の到来方向を検索することができる空間音の取得のための装置である、音事象位置推定器、および
第1の記録されたオーディオ入力信号に基づいて、前記第1の真のマイクロホン位置に基づいて、前記仮想マイクロホンの前記仮想位置に基づいて、さらに、前記音事象位置に基づいて、前記オーディオ出力信号を生成するための情報計算モジュール(120)を含み、
前記第1の真の空間マイクロホンは、前記第1の記録されたオーディオ入力信号を記録するように構成され、または、第3のマイクロホンが、前記第1の記録されたオーディオ入力信号を記録するように構成され、
前記音事象位置推定器(110)は、前記第1の方向情報として前記第1の真のマイクロホン位置での前記音事象から放出される前記音波の第1の到来方向に基づいてさらに前記第2の方向情報として前記第2の真のマイクロホン位置での前記音波の第2の到来方向に基づいて前記音事象位置を推定するように構成され、さらに
前記情報計算モジュール(120)は、伝搬補償器(500)を含み、
前記伝搬補償器(500)は、前記オーディオ出力信号を得るために、前記第1の記録されたオーディオ入力信号の振幅値、強度値または位相値を調整することによって、前記音事象および前記第1の真の空間マイクロホン間の第1の振幅減衰に基づいてさらに前記音事象および前記仮想マイクロホン間の第2の振幅減衰に基づいて、前記第1の記録されたオーディオ入力信号を修正することによって第1の修正されたオーディオ信号を生成するように構成され、または、前記伝搬補償器(500)は、前記オーディオ出力信号を得るために、前記第1の記録されたオーディオ入力信号の振幅値、強度値または位相値を調整することによって、前記第1の真の空間マイクロホンでの前記音事象から放出される音波の到来および前記仮想マイクロホンでの前記音波の到来間の第1の時間遅延を補償することによって第1の修正されたオーディオ信号を生成するように構成される、装置。 - 前記情報計算モジュール(120)は、空間サイド情報を計算するための空間サイド情報計算モジュール(507)を含み、
前記情報計算モジュール(120)は、前記仮想マイクロホンの位置ベクトルに基づいてさらに前記音事象の位置ベクトルに基づいて、空間サイド情報として前記仮想マイクロホンでの前記到来方向またはアクティブな音のインテンシティを推定するように構成される、
請求項1に記載の装置。 - 前記伝搬補償器(500)は、前記オーディオ出力信号を得るために、前記第1の記録されたオーディオ入力信号の前記振幅値、前記強度値または前記位相値を調整することによって、前記音事象および前記第1の真の空間マイクロホン間の前記第1の振幅減衰に基づいてさらに前記音事象および前記仮想マイクロホン間の前記第2の振幅減衰に基づいて、前記第1の記録されたオーディオ入力信号を修正することによって前記第1の修正されたオーディオ信号を生成するように構成され、
前記伝搬補償器(500)は、時間周波数領域において表される前記第1の記録されたオーディオ入力信号の前記強度値を調整することによって、前記音事象および前記第1の真の空間マイクロホン間の前記第1の振幅減衰に基づいてさらに前記音事象および前記仮想マイクロホン間の前記第2の振幅減衰に基づいて、時間周波数領域において前記第1の修正されたオーディオ信号を生成するように構成される、
請求項1に記載の装置。 - 前記伝搬補償器(500)は、前記オーディオ出力信号を得るために、前記第1の記録されたオーディオ入力信号の前記振幅値、前記強度値または前記位相値を調整することによって、前記第1の真の空間マイクロホンでの前記音事象から放出される音波の前記到来および前記仮想マイクロホンでの前記音波の前記到来間の前記第1の時間遅延を補償することによって前記第1の修正されたオーディオ信号を生成するように構成され、
前記伝搬補償器(500)は、時間周波数領域において表される前記第1の記録されたオーディオ入力信号の前記強度値を調整することによって、前記第1の真の空間マイクロホンでの前記音事象から放出される前記音波の前記到来および前記仮想マイクロホンでの前記音波の前記到来間の前記第1の時間遅延を補償することによって、前記時間周波数領域において前記第1の修正されたオーディオ信号を生成するように構成される、
請求項1に記載の装置。 -
- 前記情報計算モジュール(120)は、結合器(510)をさらに含み、
前記伝搬補償器(500)は、第2の修正されたオーディオ信号を得るために前記第2の記録されたオーディオ入力信号の振幅値、強度値または位相値を調整することによって、前記第2の真の空間マイクロホンでの前記音事象から放出される前記音波の到来および前記仮想マイクロホンでの前記音波の到来間の第2の時間遅延または第2の振幅減衰を補償することによって、前記第2の真の空間マイクロホンによって記録される、第2の記録されたオーディオ入力信号を修正するようにさらに構成され、さらに
前記結合器(510)は、前記オーディオ出力信号を得るために、前記第1の修正されたオーディオ信号および前記第2の修正されたオーディオ信号を結合することによって結合信号を生成するように構成される、
請求項1ないし請求項5のうちの1つに記載の装置。 - 前記伝搬補償器(500)は、前記仮想マイクロホンでの前記音波の到来およびさらなる真の空間マイクロホンのそれぞれでの前記音事象から放出される前記音波の到来間の時間遅延または振幅減衰を補償することによって、1つ以上のさらなる真の空間マイクロホンによって記録される、1つ以上のさらなる記録されたオーディオ入力信号を修正するようにさらに構成され、前記伝搬補償器(500)は、複数の第3の修正されたオーディオ信号を得るために、前記さらなる記録されたオーディオ入力信号のそれぞれの振幅値、強度値または位相値を調整することによって、前記時間遅延または振幅減衰のそれぞれを補償するように構成され、さらに
前記結合器(510)は、前記オーディオ出力信号を得るために、前記第1の修正されたオーディオ信号および前記第2の修正されたオーディオ信号および前記複数の第3の修正されたオーディオ信号を結合することによって結合信号を生成するように構成される、
請求項6に記載の装置。 - 前記情報計算モジュール(120)は、前記オーディオ出力信号を得るために、前記仮想マイクロホンの前記仮想位置での前記音波の到来方向に応じてさらに前記仮想マイクロホンの前記方向を記載する単位ベクトルに応じて、前記第1の修正されたオーディオ信号を修正することによって重み付けられたオーディオ信号を生成するためのスペクトル重み付けユニット(520)を含み、前記第1の修正されたオーディオ信号は、時間周波数領域において修正される、請求項1ないし請求項5のうちの1つに記載の装置。
- 前記情報計算モジュール(120)は、前記オーディオ出力信号を得るために、前記仮想マイクロホンの前記仮想位置での到来方向または前記音波に応じてさらに前記仮想マイクロホンの前記方向を記載する単位ベクトルに応じて前記結合信号を修正することによって重み付けられたオーディオ信号を生成するためのスペクトル重み付けユニット(520)を含み、前記結合信号は、時間周波数領域において修正される、請求項6または請求項7に記載の装置。
-
- 前記伝搬補償器(500)は、前記オーディオ出力信号を得るために、前記第3の記録されたオーディオ入力信号の振幅値、強度値または位相値を調整することによって、第4のマイクロホンでの前記音事象から放出される前記音波の到来および前記仮想マイクロホンでの前記音波の到来間の第3の時間遅延または第3の振幅減衰を補償することによって第4のマイクロホンによって記録される第3の記録されたオーディオ入力信号を修正することによって第3の修正されたオーディオ信号を生成するようにさらに構成される、請求項1ないし請求項6のうちの1つに記載の装置。
- 前記音事象位置推定器(110)は、3次元環境において音事象位置を推定するように構成される、請求項1ないし請求項11のうちの1つに記載の装置。
- 前記情報計算モジュール(120)は、前記仮想マイクロホンでの拡散音エネルギーまたは前記仮想マイクロホンでの直接音エネルギーを推定するように構成される拡散計算ユニット(801)をさらに含み、前記拡散計算ユニット(801)は、前記第1および前記第2の真の空間マイクロホンでの拡散音エネルギーに基づいて前記仮想マイクロホンでの前記拡散音エネルギーを推定するように構成される、請求項1ないし請求項12のうちの1つに記載の装置。
-
-
-
- 環境において設定可能な仮想位置で仮想マイクロホンによってオーディオ出力信号の記録をシミュレートするためにオーディオ出力信号を生成するための方法であって、
前記環境において音事象の位置を示す音事象位置を推定するステップであって、前記音事象は、特定の時間瞬間でまたは特定の時間周波数ビンにおいてアクティブであり、前記音事象は、真の音源または鏡像源であり、前記音事象位置を推定する前記ステップは、前記音事象が鏡像源であるときに前記環境において鏡像源の位置を示す前記音事象位置を推定するステップを含み、さらに、前記音事象位置を推定する前記ステップは、前記環境において第1の真のマイクロホン位置に設置される第1の真の空間マイクロホンによって提供される第1の方向情報に基づき、さらに、前記環境において第2の真のマイクロホン位置に設置される第2の真の空間マイクロホンによって提供される第2の方向情報に基づき、前記第1の真の空間マイクロホンおよび前記第2の真の空間マイクロホンは、物理的に存在する空間マイクロホンであり、さらに、前記第1の真の空間マイクロホンおよび前記第2の真の空間マイクロホンは、音の到来方向を検索することができる空間音の取得のための装置である、前記環境において音事象の位置を示す音事象位置を推定するステップ、および
第1の記録されたオーディオ入力信号に基づいて、前記第1の真のマイクロホン位置に基づいて、前記仮想マイクロホンの前記仮想位置に基づいて、さらに、前記音事象位置に基づいて、前記オーディオ出力信号を生成するステップを含み、
前記第1の真の空間マイクロホンは、第1の記録されたオーディオ入力信号を記録するように構成され、または、第3のマイクロホンが、前記第1の記録されたオーディオ入力信号を記録するように構成され、
前記音事象位置を推定するステップは、前記第1の方向情報として前記第1の真のマイクロホン位置での前記音事象から放出される前記音波の第1の到来方向に基づいてさらに前記第2の方向情報として前記第2の真のマイクロホン位置での前記音波の第2の到来方向に基づいて行われ、
前記オーディオ出力信号を生成する前記ステップは、前記オーディオ出力信号を得るために、前記第1の記録されたオーディオ入力信号の振幅値、強度値または位相値を調整することによって、前記音事象および前記第1の真の空間マイクロホン間の第1の振幅減衰に基づいてさらに前記音事象および前記仮想マイクロホン間の第2の振幅減衰に基づいて、前記第1の記録されたオーディオ入力信号を修正することによって第1の修正されたオーディオ信号を生成するステップを含み、または、前記オーディオ出力信号を生成する前記ステップは、前記オーディオ出力信号を得るために、前記第1の記録されたオーディオ入力信号の振幅値、強度値または位相値を調整することによって、前記第1の真の空間マイクロホンでの前記音事象から放出される音波の到来および前記仮想マイクロホンでの前記音波の到来間の第1の時間遅延を補償することによって第1の修正されたオーディオ信号を生成するステップを含む、方法。 - コンピュータまたは信号プロセッサ上で実行されるときに、請求項17の方法を実施するためのコンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US41962310P | 2010-12-03 | 2010-12-03 | |
US61/419,623 | 2010-12-03 | ||
US42009910P | 2010-12-06 | 2010-12-06 | |
US61/420,099 | 2010-12-06 | ||
PCT/EP2011/071629 WO2012072798A1 (en) | 2010-12-03 | 2011-12-02 | Sound acquisition via the extraction of geometrical information from direction of arrival estimates |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014502109A JP2014502109A (ja) | 2014-01-23 |
JP5728094B2 true JP5728094B2 (ja) | 2015-06-03 |
Family
ID=45406686
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013541374A Active JP5728094B2 (ja) | 2010-12-03 | 2011-12-02 | 到来方向推定から幾何学的な情報の抽出による音取得 |
JP2013541377A Active JP5878549B2 (ja) | 2010-12-03 | 2011-12-02 | 幾何ベースの空間オーディオ符号化のための装置および方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013541377A Active JP5878549B2 (ja) | 2010-12-03 | 2011-12-02 | 幾何ベースの空間オーディオ符号化のための装置および方法 |
Country Status (16)
Country | Link |
---|---|
US (2) | US9396731B2 (ja) |
EP (2) | EP2647222B1 (ja) |
JP (2) | JP5728094B2 (ja) |
KR (2) | KR101442446B1 (ja) |
CN (2) | CN103460285B (ja) |
AR (2) | AR084091A1 (ja) |
AU (2) | AU2011334851B2 (ja) |
BR (1) | BR112013013681B1 (ja) |
CA (2) | CA2819502C (ja) |
ES (2) | ES2525839T3 (ja) |
HK (1) | HK1190490A1 (ja) |
MX (2) | MX338525B (ja) |
PL (1) | PL2647222T3 (ja) |
RU (2) | RU2556390C2 (ja) |
TW (2) | TWI489450B (ja) |
WO (2) | WO2012072804A1 (ja) |
Families Citing this family (106)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
EP2600637A1 (en) * | 2011-12-02 | 2013-06-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for microphone positioning based on a spatial power density |
US10154361B2 (en) | 2011-12-22 | 2018-12-11 | Nokia Technologies Oy | Spatial audio processing apparatus |
CN104054126B (zh) * | 2012-01-19 | 2017-03-29 | 皇家飞利浦有限公司 | 空间音频渲染和编码 |
BR112015004625B1 (pt) | 2012-09-03 | 2021-12-07 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Aparelho e método para fornecer uma estimativa de probabilidade de presença de voz multicanal informada. |
WO2014046916A1 (en) * | 2012-09-21 | 2014-03-27 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
US10136239B1 (en) | 2012-09-26 | 2018-11-20 | Foundation For Research And Technology—Hellas (F.O.R.T.H.) | Capturing and reproducing spatial sound apparatuses, methods, and systems |
US10175335B1 (en) | 2012-09-26 | 2019-01-08 | Foundation For Research And Technology-Hellas (Forth) | Direction of arrival (DOA) estimation apparatuses, methods, and systems |
US9554203B1 (en) | 2012-09-26 | 2017-01-24 | Foundation for Research and Technolgy—Hellas (FORTH) Institute of Computer Science (ICS) | Sound source characterization apparatuses, methods and systems |
US9955277B1 (en) | 2012-09-26 | 2018-04-24 | Foundation For Research And Technology-Hellas (F.O.R.T.H.) Institute Of Computer Science (I.C.S.) | Spatial sound characterization apparatuses, methods and systems |
US9549253B2 (en) * | 2012-09-26 | 2017-01-17 | Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) | Sound source localization and isolation apparatuses, methods and systems |
US20160210957A1 (en) * | 2015-01-16 | 2016-07-21 | Foundation For Research And Technology - Hellas (Forth) | Foreground Signal Suppression Apparatuses, Methods, and Systems |
US10149048B1 (en) | 2012-09-26 | 2018-12-04 | Foundation for Research and Technology—Hellas (F.O.R.T.H.) Institute of Computer Science (I.C.S.) | Direction of arrival estimation and sound source enhancement in the presence of a reflective surface apparatuses, methods, and systems |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
FR2998438A1 (fr) * | 2012-11-16 | 2014-05-23 | France Telecom | Acquisition de donnees sonores spatialisees |
EP2747451A1 (en) | 2012-12-21 | 2014-06-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Filter and method for informed spatial filtering using multiple instantaneous direction-of-arrivial estimates |
CN104010265A (zh) | 2013-02-22 | 2014-08-27 | 杜比实验室特许公司 | 音频空间渲染设备及方法 |
CN104019885A (zh) * | 2013-02-28 | 2014-09-03 | 杜比实验室特许公司 | 声场分析*** |
US9979829B2 (en) | 2013-03-15 | 2018-05-22 | Dolby Laboratories Licensing Corporation | Normalization of soundfield orientations based on auditory scene analysis |
WO2014171791A1 (ko) | 2013-04-19 | 2014-10-23 | 한국전자통신연구원 | 다채널 오디오 신호 처리 장치 및 방법 |
CN108810793B (zh) | 2013-04-19 | 2020-12-15 | 韩国电子通信研究院 | 多信道音频信号处理装置及方法 |
US9769586B2 (en) | 2013-05-29 | 2017-09-19 | Qualcomm Incorporated | Performing order reduction with respect to higher order ambisonic coefficients |
CN104244164A (zh) | 2013-06-18 | 2014-12-24 | 杜比实验室特许公司 | 生成环绕立体声声场 |
CN104240711B (zh) * | 2013-06-18 | 2019-10-11 | 杜比实验室特许公司 | 用于生成自适应音频内容的方法、***和装置 |
EP2830047A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for low delay object metadata coding |
EP2830045A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
EP2830052A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension |
EP2830050A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for enhanced spatial audio object coding |
US9319819B2 (en) * | 2013-07-25 | 2016-04-19 | Etri | Binaural rendering method and apparatus for decoding multi channel audio |
EP3028476B1 (en) | 2013-07-30 | 2019-03-13 | Dolby International AB | Panning of audio objects to arbitrary speaker layouts |
CN104637495B (zh) * | 2013-11-08 | 2019-03-26 | 宏达国际电子股份有限公司 | 电子装置以及音频信号处理方法 |
CN103618986B (zh) * | 2013-11-19 | 2015-09-30 | 深圳市新一代信息技术研究院有限公司 | 一种3d空间中音源声像体的提取方法及装置 |
CN112351367B (zh) | 2013-11-22 | 2022-11-29 | 苹果公司 | 用于调节由扬声器阵列发出的声音的方法、***和设备 |
ES2833424T3 (es) | 2014-05-13 | 2021-06-15 | Fraunhofer Ges Forschung | Aparato y método para panoramización de amplitud de atenuación de bordes |
US9620137B2 (en) * | 2014-05-16 | 2017-04-11 | Qualcomm Incorporated | Determining between scalar and vector quantization in higher order ambisonic coefficients |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
DE112015003945T5 (de) * | 2014-08-28 | 2017-05-11 | Knowles Electronics, Llc | Mehrquellen-Rauschunterdrückung |
CN110636415B (zh) | 2014-08-29 | 2021-07-23 | 杜比实验室特许公司 | 用于处理音频的方法、***和存储介质 |
CN104168534A (zh) * | 2014-09-01 | 2014-11-26 | 北京塞宾科技有限公司 | 一种全息音频装置及控制方法 |
US9774974B2 (en) * | 2014-09-24 | 2017-09-26 | Electronics And Telecommunications Research Institute | Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion |
CN104378570A (zh) * | 2014-09-28 | 2015-02-25 | 小米科技有限责任公司 | 录音方法及装置 |
EP3206415B1 (en) * | 2014-10-10 | 2019-09-04 | Sony Corporation | Sound processing device, method, and program |
US9794721B2 (en) | 2015-01-30 | 2017-10-17 | Dts, Inc. | System and method for capturing, encoding, distributing, and decoding immersive audio |
TWI579835B (zh) * | 2015-03-19 | 2017-04-21 | 絡達科技股份有限公司 | 音效增益方法 |
EP3079074A1 (fr) * | 2015-04-10 | 2016-10-12 | B<>Com | Procédé de traitement de données pour l'estimation de paramètres de mixage de signaux audio, procédé de mixage, dispositifs, et programmes d'ordinateurs associés |
US9609436B2 (en) | 2015-05-22 | 2017-03-28 | Microsoft Technology Licensing, Llc | Systems and methods for audio creation and delivery |
US9530426B1 (en) | 2015-06-24 | 2016-12-27 | Microsoft Technology Licensing, Llc | Filtering sounds for conferencing applications |
US9601131B2 (en) * | 2015-06-25 | 2017-03-21 | Htc Corporation | Sound processing device and method |
WO2017004584A1 (en) | 2015-07-02 | 2017-01-05 | Dolby Laboratories Licensing Corporation | Determining azimuth and elevation angles from stereo recordings |
HK1255002A1 (zh) | 2015-07-02 | 2019-08-02 | 杜比實驗室特許公司 | 根據立體聲記錄確定方位角和俯仰角 |
GB2543275A (en) * | 2015-10-12 | 2017-04-19 | Nokia Technologies Oy | Distributed audio capture and mixing |
TWI577194B (zh) * | 2015-10-22 | 2017-04-01 | 山衛科技股份有限公司 | 環境音源辨識系統及其環境音源辨識之方法 |
US10425726B2 (en) * | 2015-10-26 | 2019-09-24 | Sony Corporation | Signal processing device, signal processing method, and program |
US10206040B2 (en) * | 2015-10-30 | 2019-02-12 | Essential Products, Inc. | Microphone array for generating virtual sound field |
EP3174316B1 (en) * | 2015-11-27 | 2020-02-26 | Nokia Technologies Oy | Intelligent audio rendering |
US9894434B2 (en) * | 2015-12-04 | 2018-02-13 | Sennheiser Electronic Gmbh & Co. Kg | Conference system with a microphone array system and a method of speech acquisition in a conference system |
US11064291B2 (en) | 2015-12-04 | 2021-07-13 | Sennheiser Electronic Gmbh & Co. Kg | Microphone array system |
EP3338462B1 (en) | 2016-03-15 | 2019-08-28 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus, method or computer program for generating a sound field description |
US9956910B2 (en) * | 2016-07-18 | 2018-05-01 | Toyota Motor Engineering & Manufacturing North America, Inc. | Audible notification systems and methods for autonomous vehicles |
GB2554446A (en) * | 2016-09-28 | 2018-04-04 | Nokia Technologies Oy | Spatial audio signal format generation from a microphone array using adaptive capture |
US9986357B2 (en) | 2016-09-28 | 2018-05-29 | Nokia Technologies Oy | Fitting background ambiance to sound objects |
US10820097B2 (en) | 2016-09-29 | 2020-10-27 | Dolby Laboratories Licensing Corporation | Method, systems and apparatus for determining audio representation(s) of one or more audio sources |
US9980078B2 (en) | 2016-10-14 | 2018-05-22 | Nokia Technologies Oy | Audio object modification in free-viewpoint rendering |
US10531220B2 (en) | 2016-12-05 | 2020-01-07 | Magic Leap, Inc. | Distributed audio capturing techniques for virtual reality (VR), augmented reality (AR), and mixed reality (MR) systems |
CN106708041B (zh) * | 2016-12-12 | 2020-12-29 | 西安Tcl软件开发有限公司 | 智能音箱、智能音箱定向移动方法及装置 |
US11096004B2 (en) | 2017-01-23 | 2021-08-17 | Nokia Technologies Oy | Spatial audio rendering point extension |
US10366700B2 (en) | 2017-02-08 | 2019-07-30 | Logitech Europe, S.A. | Device for acquiring and processing audible input |
US10229667B2 (en) | 2017-02-08 | 2019-03-12 | Logitech Europe S.A. | Multi-directional beamforming device for acquiring and processing audible input |
US10366702B2 (en) | 2017-02-08 | 2019-07-30 | Logitech Europe, S.A. | Direction detection device for acquiring and processing audible input |
US10362393B2 (en) | 2017-02-08 | 2019-07-23 | Logitech Europe, S.A. | Direction detection device for acquiring and processing audible input |
US10531219B2 (en) | 2017-03-20 | 2020-01-07 | Nokia Technologies Oy | Smooth rendering of overlapping audio-object interactions |
US10397724B2 (en) | 2017-03-27 | 2019-08-27 | Samsung Electronics Co., Ltd. | Modifying an apparent elevation of a sound source utilizing second-order filter sections |
US11074036B2 (en) | 2017-05-05 | 2021-07-27 | Nokia Technologies Oy | Metadata-free audio-object interactions |
US10165386B2 (en) * | 2017-05-16 | 2018-12-25 | Nokia Technologies Oy | VR audio superzoom |
IT201700055080A1 (it) * | 2017-05-22 | 2018-11-22 | Teko Telecom S R L | Sistema di comunicazione wireless e relativo metodo per il trattamento di dati fronthaul di uplink |
US10602296B2 (en) | 2017-06-09 | 2020-03-24 | Nokia Technologies Oy | Audio object adjustment for phase compensation in 6 degrees of freedom audio |
US10334360B2 (en) * | 2017-06-12 | 2019-06-25 | Revolabs, Inc | Method for accurately calculating the direction of arrival of sound at a microphone array |
GB2563606A (en) | 2017-06-20 | 2018-12-26 | Nokia Technologies Oy | Spatial audio processing |
GB201710085D0 (en) | 2017-06-23 | 2017-08-09 | Nokia Technologies Oy | Determination of targeted spatial audio parameters and associated spatial audio playback |
GB201710093D0 (en) * | 2017-06-23 | 2017-08-09 | Nokia Technologies Oy | Audio distance estimation for spatial audio processing |
KR102654507B1 (ko) | 2017-07-14 | 2024-04-05 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 다중-지점 음장 묘사를 이용하여 증강된 음장 묘사 또는 수정된 음장 묘사를 생성하기 위한 개념 |
KR102652670B1 (ko) | 2017-07-14 | 2024-04-01 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 다중-층 묘사를 이용하여 증강된 음장 묘사 또는 수정된 음장 묘사를 생성하기 위한 개념 |
CN111108555B (zh) | 2017-07-14 | 2023-12-15 | 弗劳恩霍夫应用研究促进协会 | 使用深度扩展DirAC技术或其他技术生成经增强的声场描述或经修改的声场描述的装置和方法 |
US10264354B1 (en) * | 2017-09-25 | 2019-04-16 | Cirrus Logic, Inc. | Spatial cues from broadside detection |
US11395087B2 (en) | 2017-09-29 | 2022-07-19 | Nokia Technologies Oy | Level-based audio-object interactions |
CN111201784B (zh) | 2017-10-17 | 2021-09-07 | 惠普发展公司,有限责任合伙企业 | 通信***、用于通信的方法和视频会议*** |
US10542368B2 (en) | 2018-03-27 | 2020-01-21 | Nokia Technologies Oy | Audio content modification for playback audio |
TWI690921B (zh) * | 2018-08-24 | 2020-04-11 | 緯創資通股份有限公司 | 收音處理裝置及其收音處理方法 |
US11017790B2 (en) * | 2018-11-30 | 2021-05-25 | International Business Machines Corporation | Avoiding speech collisions among participants during teleconferences |
TWI751457B (zh) | 2018-12-07 | 2022-01-01 | 弗勞恩霍夫爾協會 | 使用直流分量補償用於編碼、解碼、場景處理及基於空間音訊編碼與DirAC有關的其他程序的裝置、方法及電腦程式 |
CN113841197B (zh) * | 2019-03-14 | 2022-12-27 | 博姆云360公司 | 具有优先级的空间感知多频带压缩*** |
EP4005233A1 (en) | 2019-07-30 | 2022-06-01 | Dolby Laboratories Licensing Corporation | Adaptable spatial audio playback |
US11968268B2 (en) | 2019-07-30 | 2024-04-23 | Dolby Laboratories Licensing Corporation | Coordination of audio devices |
KR102154553B1 (ko) * | 2019-09-18 | 2020-09-10 | 한국표준과학연구원 | 지향성이 향상된 마이크로폰 어레이 및 이를 이용한 음장 취득 방법 |
EP3963902A4 (en) | 2019-09-24 | 2022-07-13 | Samsung Electronics Co., Ltd. | METHODS AND SYSTEMS FOR MIXED AUDIO SIGNAL RECORDING AND DIRECTIONAL AUDIO CONTENT REPRODUCTION |
TW202123220A (zh) | 2019-10-30 | 2021-06-16 | 美商杜拜研究特許公司 | 使用方向性元資料之多通道音頻編碼及解碼 |
GB2590504A (en) * | 2019-12-20 | 2021-06-30 | Nokia Technologies Oy | Rotating camera and microphone configurations |
CN113284504A (zh) * | 2020-02-20 | 2021-08-20 | 北京三星通信技术研究有限公司 | 姿态检测方法、装置、电子设备及计算机可读存储介质 |
US11277689B2 (en) | 2020-02-24 | 2022-03-15 | Logitech Europe S.A. | Apparatus and method for optimizing sound quality of a generated audible signal |
US11425523B2 (en) * | 2020-04-10 | 2022-08-23 | Facebook Technologies, Llc | Systems and methods for audio adjustment |
CN111951833A (zh) * | 2020-08-04 | 2020-11-17 | 科大讯飞股份有限公司 | 语音测试方法、装置、电子设备和存储介质 |
CN112083379B (zh) * | 2020-09-09 | 2023-10-20 | 极米科技股份有限公司 | 基于声源定位的音频播放方法、装置、投影设备及介质 |
JPWO2022162878A1 (ja) * | 2021-01-29 | 2022-08-04 | ||
CN116918350A (zh) * | 2021-04-25 | 2023-10-20 | 深圳市韶音科技有限公司 | 声学装置 |
US20230036986A1 (en) * | 2021-07-27 | 2023-02-02 | Qualcomm Incorporated | Processing of audio signals from multiple microphones |
DE202022105574U1 (de) | 2022-10-01 | 2022-10-20 | Veerendra Dakulagi | Ein System zur Klassifizierung mehrerer Signale für die Schätzung der Ankunftsrichtung |
Family Cites Families (71)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01109996A (ja) * | 1987-10-23 | 1989-04-26 | Sony Corp | マイクロホン装置 |
JPH04181898A (ja) * | 1990-11-15 | 1992-06-29 | Ricoh Co Ltd | マイクロホン |
JPH1063470A (ja) * | 1996-06-12 | 1998-03-06 | Nintendo Co Ltd | 画像表示に連動する音響発生装置 |
US6577738B2 (en) * | 1996-07-17 | 2003-06-10 | American Technology Corporation | Parametric virtual speaker and surround-sound system |
US6072878A (en) | 1997-09-24 | 2000-06-06 | Sonic Solutions | Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics |
JP3344647B2 (ja) * | 1998-02-18 | 2002-11-11 | 富士通株式会社 | マイクロホンアレイ装置 |
JP3863323B2 (ja) | 1999-08-03 | 2006-12-27 | 富士通株式会社 | マイクロホンアレイ装置 |
EP1275272B1 (en) * | 2000-04-19 | 2012-11-21 | SNK Tech Investment L.L.C. | Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics in three dimensions |
KR100387238B1 (ko) * | 2000-04-21 | 2003-06-12 | 삼성전자주식회사 | 오디오 변조 기능을 갖는 오디오 재생 장치 및 방법, 그장치를 적용한 리믹싱 장치 및 방법 |
GB2364121B (en) | 2000-06-30 | 2004-11-24 | Mitel Corp | Method and apparatus for locating a talker |
JP4304845B2 (ja) * | 2000-08-03 | 2009-07-29 | ソニー株式会社 | 音声信号処理方法及び音声信号処理装置 |
KR100626661B1 (ko) * | 2002-10-15 | 2006-09-22 | 한국전자통신연구원 | 공간성이 확장된 음원을 갖는 3차원 음향 장면 처리 방법 |
AU2003269551A1 (en) * | 2002-10-15 | 2004-05-04 | Electronics And Telecommunications Research Institute | Method for generating and consuming 3d audio scene with extended spatiality of sound source |
KR101014404B1 (ko) * | 2002-11-15 | 2011-02-15 | 소니 주식회사 | 오디오신호의 처리방법 및 처리장치 |
JP2004193877A (ja) * | 2002-12-10 | 2004-07-08 | Sony Corp | 音像定位信号処理装置および音像定位信号処理方法 |
KR20040060718A (ko) | 2002-12-28 | 2004-07-06 | 삼성전자주식회사 | 오디오 스트림 믹싱 방법, 그 장치 및 그 정보저장매체 |
EP1576602A4 (en) | 2002-12-28 | 2008-05-28 | Samsung Electronics Co Ltd | METHOD AND DEVICE FOR MIXING AUDIO SEQUENCE AND INFORMATION RECORDING MEDIUM |
JP3639280B2 (ja) * | 2003-02-12 | 2005-04-20 | 任天堂株式会社 | ゲームメッセージ表示方法およびゲームプログラム |
FI118247B (fi) | 2003-02-26 | 2007-08-31 | Fraunhofer Ges Forschung | Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa |
JP4133559B2 (ja) | 2003-05-02 | 2008-08-13 | 株式会社コナミデジタルエンタテインメント | 音声再生プログラム、音声再生方法及び音声再生装置 |
US20060104451A1 (en) * | 2003-08-07 | 2006-05-18 | Tymphany Corporation | Audio reproduction system |
RU2396608C2 (ru) * | 2004-04-05 | 2010-08-10 | Конинклейке Филипс Электроникс Н.В. | Способ, устройство, кодирующее устройство, декодирующее устройство и аудиосистема |
GB2414369B (en) * | 2004-05-21 | 2007-08-01 | Hewlett Packard Development Co | Processing audio data |
KR100586893B1 (ko) | 2004-06-28 | 2006-06-08 | 삼성전자주식회사 | 시변 잡음 환경에서의 화자 위치 추정 시스템 및 방법 |
WO2006006935A1 (en) | 2004-07-08 | 2006-01-19 | Agency For Science, Technology And Research | Capturing sound from a target region |
US7617501B2 (en) | 2004-07-09 | 2009-11-10 | Quest Software, Inc. | Apparatus, system, and method for managing policies on a computer having a foreign operating system |
US7903824B2 (en) * | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
DE102005010057A1 (de) | 2005-03-04 | 2006-09-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms |
WO2006105105A2 (en) | 2005-03-28 | 2006-10-05 | Sound Id | Personal sound system |
JP4273343B2 (ja) * | 2005-04-18 | 2009-06-03 | ソニー株式会社 | 再生装置および再生方法 |
US20070047742A1 (en) | 2005-08-26 | 2007-03-01 | Step Communications Corporation, A Nevada Corporation | Method and system for enhancing regional sensitivity noise discrimination |
JP5038145B2 (ja) * | 2005-10-18 | 2012-10-03 | パイオニア株式会社 | 定位制御装置、定位制御方法、定位制御プログラムおよびコンピュータに読み取り可能な記録媒体 |
WO2007136187A1 (en) * | 2006-05-19 | 2007-11-29 | Electronics And Telecommunications Research Institute | Object-based 3-dimensional audio service system using preset audio scenes |
CN101473645B (zh) * | 2005-12-08 | 2011-09-21 | 韩国电子通信研究院 | 使用预设音频场景的基于对象的三维音频服务*** |
DE602007004451D1 (de) | 2006-02-21 | 2010-03-11 | Koninkl Philips Electronics Nv | Audiokodierung und audiodekodierung |
GB0604076D0 (en) * | 2006-03-01 | 2006-04-12 | Univ Lancaster | Method and apparatus for signal presentation |
EP1989926B1 (en) | 2006-03-01 | 2020-07-08 | Lancaster University Business Enterprises Limited | Method and apparatus for signal presentation |
US8374365B2 (en) * | 2006-05-17 | 2013-02-12 | Creative Technology Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
US20080004729A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Direct encoding into a directional audio coding format |
JP4894386B2 (ja) * | 2006-07-21 | 2012-03-14 | ソニー株式会社 | 音声信号処理装置、音声信号処理方法および音声信号処理プログラム |
US8229754B1 (en) * | 2006-10-23 | 2012-07-24 | Adobe Systems Incorporated | Selecting features of displayed audio data across time |
EP2595148A3 (en) * | 2006-12-27 | 2013-11-13 | Electronics and Telecommunications Research Institute | Apparatus for coding multi-object audio signals |
JP4449987B2 (ja) * | 2007-02-15 | 2010-04-14 | ソニー株式会社 | 音声処理装置、音声処理方法およびプログラム |
US9015051B2 (en) * | 2007-03-21 | 2015-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Reconstruction of audio channels with direction parameters indicating direction of origin |
JP4221035B2 (ja) * | 2007-03-30 | 2009-02-12 | 株式会社コナミデジタルエンタテインメント | ゲーム音出力装置、音像定位制御方法、および、プログラム |
EP2147567B1 (en) | 2007-04-19 | 2013-04-10 | Epos Development Ltd. | Voice and position localization |
FR2916078A1 (fr) * | 2007-05-10 | 2008-11-14 | France Telecom | Procede de codage et decodage audio, codeur audio, decodeur audio et programmes d'ordinateur associes |
US8180062B2 (en) * | 2007-05-30 | 2012-05-15 | Nokia Corporation | Spatial sound zooming |
US20080298610A1 (en) | 2007-05-30 | 2008-12-04 | Nokia Corporation | Parameter Space Re-Panning for Spatial Audio |
JP5294603B2 (ja) * | 2007-10-03 | 2013-09-18 | 日本電信電話株式会社 | 音響信号推定装置、音響信号合成装置、音響信号推定合成装置、音響信号推定方法、音響信号合成方法、音響信号推定合成方法、これらの方法を用いたプログラム、及び記録媒体 |
GB2467668B (en) * | 2007-10-03 | 2011-12-07 | Creative Tech Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
KR101415026B1 (ko) | 2007-11-19 | 2014-07-04 | 삼성전자주식회사 | 마이크로폰 어레이를 이용한 다채널 사운드 획득 방법 및장치 |
DE212009000019U1 (de) | 2008-01-10 | 2010-09-02 | Sound Id, Mountain View | Persönliches Schallsystem für die Anzeige eines Schalldruckpegels oder einer anderen Umgebungsbedingung |
JP5686358B2 (ja) * | 2008-03-07 | 2015-03-18 | 学校法人日本大学 | 音源距離計測装置及びそれを用いた音響情報分離装置 |
JP2009246827A (ja) * | 2008-03-31 | 2009-10-22 | Nippon Hoso Kyokai <Nhk> | 音源及び仮想音源の位置特定装置、方法及びプログラム |
KR101461685B1 (ko) * | 2008-03-31 | 2014-11-19 | 한국전자통신연구원 | 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치 |
US8457328B2 (en) * | 2008-04-22 | 2013-06-04 | Nokia Corporation | Method, apparatus and computer program product for utilizing spatial information for audio signal enhancement in a distributed network environment |
EP2154677B1 (en) | 2008-08-13 | 2013-07-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus for determining a converted spatial audio signal |
EP2154910A1 (en) * | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for merging spatial audio streams |
US8023660B2 (en) * | 2008-09-11 | 2011-09-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues |
KR101392546B1 (ko) * | 2008-09-11 | 2014-05-08 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 마이크로폰 신호를 기반으로 공간 큐의 세트를 제공하는 장치, 방법 및 컴퓨터 프로그램과, 2채널 오디오 신호 및 공간 큐의 세트를 제공하는 장치 |
ES2733878T3 (es) * | 2008-12-15 | 2019-12-03 | Orange | Codificación mejorada de señales de audio digitales multicanales |
JP5309953B2 (ja) | 2008-12-17 | 2013-10-09 | ヤマハ株式会社 | 収音装置 |
EP2205007B1 (en) * | 2008-12-30 | 2019-01-09 | Dolby International AB | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction |
US8867754B2 (en) | 2009-02-13 | 2014-10-21 | Honda Motor Co., Ltd. | Dereverberation apparatus and dereverberation method |
JP5197458B2 (ja) * | 2009-03-25 | 2013-05-15 | 株式会社東芝 | 受音信号処理装置、方法およびプログラム |
JP5314129B2 (ja) * | 2009-03-31 | 2013-10-16 | パナソニック株式会社 | 音響再生装置及び音響再生方法 |
CN102414743A (zh) * | 2009-04-21 | 2012-04-11 | 皇家飞利浦电子股份有限公司 | 音频信号合成 |
EP2249334A1 (en) * | 2009-05-08 | 2010-11-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
EP2346028A1 (en) | 2009-12-17 | 2011-07-20 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal |
KR20120059827A (ko) * | 2010-12-01 | 2012-06-11 | 삼성전자주식회사 | 다중 음원 위치추적장치 및 그 위치추적방법 |
-
2011
- 2011-12-02 TW TW100144577A patent/TWI489450B/zh active
- 2011-12-02 CA CA2819502A patent/CA2819502C/en active Active
- 2011-12-02 ES ES11801647.6T patent/ES2525839T3/es active Active
- 2011-12-02 BR BR112013013681-2A patent/BR112013013681B1/pt active IP Right Grant
- 2011-12-02 ES ES11801648.4T patent/ES2643163T3/es active Active
- 2011-12-02 KR KR1020137017057A patent/KR101442446B1/ko active IP Right Grant
- 2011-12-02 AR ARP110104509A patent/AR084091A1/es active IP Right Grant
- 2011-12-02 PL PL11801647T patent/PL2647222T3/pl unknown
- 2011-12-02 WO PCT/EP2011/071644 patent/WO2012072804A1/en active Application Filing
- 2011-12-02 AU AU2011334851A patent/AU2011334851B2/en active Active
- 2011-12-02 MX MX2013006150A patent/MX338525B/es active IP Right Grant
- 2011-12-02 TW TW100144576A patent/TWI530201B/zh active
- 2011-12-02 RU RU2013130226/08A patent/RU2556390C2/ru active
- 2011-12-02 CN CN201180066795.0A patent/CN103460285B/zh active Active
- 2011-12-02 EP EP11801647.6A patent/EP2647222B1/en active Active
- 2011-12-02 JP JP2013541374A patent/JP5728094B2/ja active Active
- 2011-12-02 KR KR1020137017441A patent/KR101619578B1/ko active IP Right Grant
- 2011-12-02 MX MX2013006068A patent/MX2013006068A/es active IP Right Grant
- 2011-12-02 RU RU2013130233/28A patent/RU2570359C2/ru active
- 2011-12-02 WO PCT/EP2011/071629 patent/WO2012072798A1/en active Application Filing
- 2011-12-02 AU AU2011334857A patent/AU2011334857B2/en active Active
- 2011-12-02 CN CN201180066792.7A patent/CN103583054B/zh active Active
- 2011-12-02 JP JP2013541377A patent/JP5878549B2/ja active Active
- 2011-12-02 EP EP11801648.4A patent/EP2647005B1/en active Active
- 2011-12-02 CA CA2819394A patent/CA2819394C/en active Active
- 2011-12-05 AR ARP110104544A patent/AR084160A1/es active IP Right Grant
-
2013
- 2013-05-29 US US13/904,870 patent/US9396731B2/en active Active
- 2013-05-31 US US13/907,510 patent/US10109282B2/en active Active
-
2014
- 2014-04-09 HK HK14103418.2A patent/HK1190490A1/xx unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5728094B2 (ja) | 到来方向推定から幾何学的な情報の抽出による音取得 | |
JP5814476B2 (ja) | 空間パワー密度に基づくマイクロフォン位置決め装置および方法 | |
JP6086923B2 (ja) | 幾何学配置に基づく空間オーディオ符号化ストリームを統合する装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20140528 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140609 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20140528 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140625 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140805 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141024 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150310 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150403 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5728094 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |