JP2012514358A5 - - Google Patents

Download PDF

Info

Publication number
JP2012514358A5
JP2012514358A5 JP2011542729A JP2011542729A JP2012514358A5 JP 2012514358 A5 JP2012514358 A5 JP 2012514358A5 JP 2011542729 A JP2011542729 A JP 2011542729A JP 2011542729 A JP2011542729 A JP 2011542729A JP 2012514358 A5 JP2012514358 A5 JP 2012514358A5
Authority
JP
Japan
Prior art keywords
audio
track
encoding
order
tracks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011542729A
Other languages
English (en)
Other versions
JP2012514358A (ja
JP5688030B2 (ja
Filing date
Publication date
Priority claimed from EP08382091.0A external-priority patent/EP2205007B1/en
Application filed filed Critical
Publication of JP2012514358A publication Critical patent/JP2012514358A/ja
Publication of JP2012514358A5 publication Critical patent/JP2012514358A5/ja
Application granted granted Critical
Publication of JP5688030B2 publication Critical patent/JP5688030B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (17)

  1. オーディオ信号および関連する空間情報を再生配置に依存しないフォーマットに符号化する方法であって、
    ーディオ信号の第1セットを第1グループに割り当て、第1グループを、録音位置に対する各トラックの信号の起点方向およびその初期再生時間を示す関連のメタデータを有するモノラルオーディオトラックのセットとして符号化すること、および
    ーディオ信号の第2セットを第2グループに割り当て、第2グループを、所与の次数および混合次数のアンビソニックストラックの少なくとも1セットとして符号化すること
    含む、
    2つのグループのトラックを生成すること、を備える前記方法。
  2. モノラルオーディオトラックのセットにおけるトラックと関連付けられた広がりパラメータを符号化することをさらに含む、請求項1に記載の方法。
  3. 第1セットにおける各トラックの指向性パラメータを、固定された特定の値または時変値として符号化すること、または、
    モノラルオーディオトラックのセットにおけるトラックと関連付けられた指向性パラメータを符号化すること、または、
    第1セットにおけるトラックの信号の起点方向を、所定のルールに従って割り当てること
    をさらに含む、請求項に記載の方法。
  4. トラックに関連付けられた音源を含むシーンの任意の三次元表現および録音場所から、第1セットにおけるトラックの信号の起点方向を導出することをさらに含む、請求項に記載の方法。
  5. アンビソニックスの次数、混合次数の種類、トラック関連ゲイン、トラック順序付けという、使用されるアンビソニックスフォーマットの仕様を示すメタデータを符号化すること、または、
    アンビソニックストラックに関連した初期再生時間を符号化すること
    をさらに含む、請求項に記載の方法。
  6. 関連の指向性データを有する入力されたモノラル信号を、所与の次数および混合次数のアンビソニックストラックに符号化すること、または、
    任意の入力されたマルチチャンネル信号を、所与の次数および混合次数のアンビソニックストラックに符号化すること、または、
    任意の次数および混合次数の任意の入力されたアンビソニックス信号を、異なり得る所与の次数および混合次数のアンビソニックストラックに符号化すること
    をさらに含む、請求項に記載の方法。
  7. モノラルトラックのセットに関連した、広がりパラメータおよび場合によっては他の空間メタデータを、特定された広がりに適した復号化アルゴリズムを使用するために使用することをさらに含む、請求項に記載の方法。
  8. 再生配置に依存しないフォーマットを所与のマルチスピーカー配置に復号化することをさらに含み、
    前記復号化が
    域音源を再生するのに適したアルゴリズムを使用して、モノラルトラックのセットを復号化するため、および
    ラックの次数、混合次数および特定された配置に適合されたアルゴリズムによりアンビソニックストラックのセットを復号化するために、
    マルチスピーカー位置の仕様を使用する、請求項に記載の方法。
  9. サウンドスケープ全体の回転を行うために回転制御パラメータを使用することをさらに含み、回転制御パラメータは頭部追跡装置から生成される、請求項に記載の方法。
  10. スピーカーの位置を自動的に導出して復号器により使用される配置の仕様を定義するための技術を使用することをさらに含む、請求項に記載の方法。
  11. ステレオおよびサラウンド5.1、ITU−R775−1という標準的な再生配置プリセットを使用すること、または、
    頭部伝達関数データベースを使用して、標準的なバイノーラル技術により、ヘッドフォンに復号化すること
    をさらに含む、請求項に記載の方法。
  12. 復号化の出力は、直接再生されず、オーディオトラックのセットとして記憶される、請求項または11に記載の方法。
  13. オーディオ信号の全てまたは一部が圧縮されたオーディオフォーマットに符号化される、請求項1、、または11に記載の方法。
  14. オーディオ信号および関連の空間情報を再生配置に依存しないフォーマットに符号化するためのオーディオ符号化器であって、
    ーディオ信号の第1セットを第1グループに割り当て、および、第1グループを、指向性情報および初期再生時間情報を有するモノラルトラックのセットに符号化するための符号化器、
    ーディオ信号の第2セットを第2グループに割り当て、および、第2グループを、任意の次数および混合次数のアンビソニックストラックスのセットに符号化するための符号化器、および
    1および第2セットのオーディオ信号を含む2つのグループのトラックを生成するための符号化器、
    を含む前記オーディオ符号化器。
  15. 再生配置に依存しないフォーマットをN個のチャンネルを有する所与の再生システムに復号するためのオーディオ復号器であって、
    前記再生配置に依存しないフォーマットが請求項1に記載された方法に従って、及び/又は請求項14に記載されたオーディオ符号化器によって生成され、
    前記オーディオ復号器が、
    生配置の仕様に基づき、指向性情報および初期再生時間情報を有するモノラルトラックのセットをN個のオーディオチャンネルに復号化するための復号器、
    生配置の仕様に基づき、アンビソニックストラックのセットをN個のオーディオチャンネルに復号化するための復号器、および
    個の出力オーディオチャンネルを生成するために、2つの上記復号器の出力をミキシングして、再生および記憶に供するミキサー、
    を含む、オーディオ復号器。
  16. 空間オーディオを再生配置に依存しないフォーマットに符号化および再符号化し、任意のマルチスピーカー配置またはヘッドフォンに復号化および再生するシステムであって、
    ーディオ信号のセットおよび関連の空間情報を再生配置に依存しないフォーマットに符号化する、請求項14に記載のオーディオ符号化器、および
    生配置に依存しないフォーマットを、マルチスピーカー配置またはヘッドフォンである所与の再生システムに復号化する、請求項15に記載のオーディオ復号器
    を含む、前記システム。
  17. 請求項1から13のいずれかに記載の方法をコンピュータ上で実行するためのコンピュータプログラム。
JP2011542729A 2008-12-30 2009-12-29 三次元音場の符号化および最適な再現の方法および装置 Active JP5688030B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP08382091.0A EP2205007B1 (en) 2008-12-30 2008-12-30 Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction
EP08382091.0 2008-12-30
PCT/EP2009/009356 WO2010076040A1 (en) 2008-12-30 2009-12-29 Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction

Publications (3)

Publication Number Publication Date
JP2012514358A JP2012514358A (ja) 2012-06-21
JP2012514358A5 true JP2012514358A5 (ja) 2013-02-21
JP5688030B2 JP5688030B2 (ja) 2015-03-25

Family

ID=40606571

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011542729A Active JP5688030B2 (ja) 2008-12-30 2009-12-29 三次元音場の符号化および最適な再現の方法および装置

Country Status (8)

Country Link
US (1) US9299353B2 (ja)
EP (2) EP2205007B1 (ja)
JP (1) JP5688030B2 (ja)
CN (1) CN102326417B (ja)
MX (1) MX2011007035A (ja)
RU (1) RU2533437C2 (ja)
UA (1) UA106598C2 (ja)
WO (1) WO2010076040A1 (ja)

Families Citing this family (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9591374B2 (en) 2010-06-30 2017-03-07 Warner Bros. Entertainment Inc. Method and apparatus for generating encoded content using dynamically optimized conversion for 3D movies
US10326978B2 (en) 2010-06-30 2019-06-18 Warner Bros. Entertainment Inc. Method and apparatus for generating virtual or augmented reality presentations with 3D audio positioning
US9552840B2 (en) * 2010-10-25 2017-01-24 Qualcomm Incorporated Three-dimensional sound capturing and reproducing with multi-microphones
EP2450880A1 (en) * 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
CN103460285B (zh) * 2010-12-03 2018-01-12 弗劳恩霍夫应用研究促进协会 用于以几何为基础的空间音频编码的装置及方法
EP2469741A1 (en) * 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field
FR2970574B1 (fr) * 2011-01-19 2013-10-04 Devialet Dispositif de traitement audio
EP2637427A1 (en) * 2012-03-06 2013-09-11 Thomson Licensing Method and apparatus for playback of a higher-order ambisonics audio signal
EP2665208A1 (en) * 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
US9622014B2 (en) 2012-06-19 2017-04-11 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems
EP2688066A1 (en) 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
KR20230137492A (ko) 2012-07-19 2023-10-04 돌비 인터네셔널 에이비 다채널 오디오 신호들의 렌더링을 향상시키기 위한 방법 및 디바이스
EP2733963A1 (en) * 2012-11-14 2014-05-21 Thomson Licensing Method and apparatus for facilitating listening to a sound signal for matrixed sound signals
KR102028122B1 (ko) * 2012-12-05 2019-11-14 삼성전자주식회사 오디오 장치 및 그의 신호 처리 방법 그리고 그 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능 매체
EP2743922A1 (en) * 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
KR102031826B1 (ko) * 2013-01-16 2019-10-15 돌비 인터네셔널 에이비 Hoa 라우드니스 레벨을 측정하기 위한 방법 및 hoa 라우드니스 레벨을 측정하기 위한 장치
US9736609B2 (en) * 2013-02-07 2017-08-15 Qualcomm Incorporated Determining renderers for spherical harmonic coefficients
EP2782094A1 (en) * 2013-03-22 2014-09-24 Thomson Licensing Method and apparatus for enhancing directivity of a 1st order Ambisonics signal
US9756444B2 (en) 2013-03-28 2017-09-05 Dolby Laboratories Licensing Corporation Rendering audio using speakers organized as a mesh of arbitrary N-gons
US9667959B2 (en) 2013-03-29 2017-05-30 Qualcomm Incorporated RTP payload format designs
TWI530941B (zh) 2013-04-03 2016-04-21 杜比實驗室特許公司 用於基於物件音頻之互動成像的方法與系統
JP6204684B2 (ja) * 2013-04-05 2017-09-27 日本放送協会 音響信号再生装置
EP2800401A1 (en) 2013-04-29 2014-11-05 Thomson Licensing Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation
JP6228389B2 (ja) * 2013-05-14 2017-11-08 日本放送協会 音響信号再生装置
JP6228387B2 (ja) * 2013-05-14 2017-11-08 日本放送協会 音響信号再生装置
US9466305B2 (en) * 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US9495968B2 (en) 2013-05-29 2016-11-15 Qualcomm Incorporated Identifying sources from which higher order ambisonic audio data is generated
TWM487509U (zh) * 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
EP2824661A1 (en) 2013-07-11 2015-01-14 Thomson Licensing Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals
EP2830048A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for realizing a SAOC downmix of 3D audio content
EP2830047A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
WO2015038475A1 (en) 2013-09-12 2015-03-19 Dolby Laboratories Licensing Corporation Dynamic range control for a wide variety of playback environments
US9807538B2 (en) 2013-10-07 2017-10-31 Dolby Laboratories Licensing Corporation Spatial audio processing system and method
DE102013223201B3 (de) * 2013-11-14 2015-05-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes
US9489955B2 (en) 2014-01-30 2016-11-08 Qualcomm Incorporated Indicating frame parameter reusability for coding vectors
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
JP6374980B2 (ja) * 2014-03-26 2018-08-15 パナソニック株式会社 サラウンドオーディオ信号処理のための装置及び方法
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
EP4216212A1 (en) 2015-10-08 2023-07-26 Dolby International AB Layered coding for compressed sound or sound field represententations
US10070094B2 (en) * 2015-10-14 2018-09-04 Qualcomm Incorporated Screen related adaptation of higher order ambisonic (HOA) content
EP3188504B1 (en) 2016-01-04 2020-07-29 Harman Becker Automotive Systems GmbH Multi-media reproduction for a multiplicity of recipients
FR3046489B1 (fr) 2016-01-05 2018-01-12 Mimi Hearing Technologies GmbH Encodeur ambisonique ameliore d'une source sonore a pluralite de reflexions
EP3465679A4 (en) * 2016-05-25 2020-01-15 Warner Bros. Entertainment Inc. METHOD AND DEVICE FOR GENERATING PRESENTATIONS OF THE VIRTUAL OR EXTENDED REALITY WITH 3D AUDIO POSITIONING
US10158963B2 (en) * 2017-01-30 2018-12-18 Google Llc Ambisonic audio with non-head tracked stereo based on head position and time
US10390166B2 (en) 2017-05-31 2019-08-20 Qualcomm Incorporated System and method for mixing and adjusting multi-input ambisonics
GB2563635A (en) 2017-06-21 2018-12-26 Nokia Technologies Oy Recording and rendering audio signals
CN117319917A (zh) 2017-07-14 2023-12-29 弗劳恩霍夫应用研究促进协会 使用多点声场描述生成经修改的声场描述的装置及方法
RU2740703C1 (ru) 2017-07-14 2021-01-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Принцип формирования улучшенного описания звукового поля или модифицированного описания звукового поля с использованием многослойного описания
US10257633B1 (en) * 2017-09-15 2019-04-09 Htc Corporation Sound-reproducing method and sound-reproducing apparatus
CN109756683B (zh) * 2017-11-02 2024-06-04 深圳市裂石影音科技有限公司 全景音视频录制方法、装置、存储介质和计算机设备
US10714098B2 (en) 2017-12-21 2020-07-14 Dolby Laboratories Licensing Corporation Selective forward error correction for spatial audio codecs
US10595146B2 (en) 2017-12-21 2020-03-17 Verizon Patent And Licensing Inc. Methods and systems for extracting location-diffused ambient sound from a real-world scene
EP3503102A1 (en) 2017-12-22 2019-06-26 Nokia Technologies Oy An apparatus and associated methods for presentation of captured spatial audio content
GB2572420A (en) * 2018-03-29 2019-10-02 Nokia Technologies Oy Spatial sound rendering
CN109462811B (zh) * 2018-11-23 2020-11-17 武汉轻工大学 基于非中心点的声场重建方法、设备、存储介质及装置
CN218198109U (zh) * 2019-10-23 2023-01-03 索尼公司 移动装置
TW202123220A (zh) 2019-10-30 2021-06-16 美商杜拜研究特許公司 使用方向性元資料之多通道音頻編碼及解碼
CN111263291B (zh) * 2020-01-19 2021-06-11 西北工业大学太仓长三角研究院 一种基于高阶麦克风阵列的声场重构方法
JP2021131433A (ja) * 2020-02-19 2021-09-09 ヤマハ株式会社 音信号処理方法および音信号処理装置

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9204485D0 (en) * 1992-03-02 1992-04-15 Trifield Productions Ltd Surround sound apparatus
AUPO316296A0 (en) * 1996-10-23 1996-11-14 Lake Dsp Pty Limited Dithered binaural system
AUPP272598A0 (en) * 1998-03-31 1998-04-23 Lake Dsp Pty Limited Wavelet conversion of 3-d audio signals
JP3863306B2 (ja) * 1998-10-28 2006-12-27 富士通株式会社 マイクロホンアレイ装置
KR100542129B1 (ko) * 2002-10-28 2006-01-11 한국전자통신연구원 객체기반 3차원 오디오 시스템 및 그 제어 방법
FR2847376B1 (fr) * 2002-11-19 2005-02-04 France Telecom Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede
US8027482B2 (en) * 2003-02-13 2011-09-27 Hollinbeck Mgmt. Gmbh, Llc DVD audio encoding using environmental audio tracks
DE10344638A1 (de) * 2003-08-04 2005-03-10 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Erzeugen, Speichern oder Bearbeiten einer Audiodarstellung einer Audioszene
US7672196B1 (en) * 2004-11-16 2010-03-02 Nihon University Sound source localizing apparatus and method
DE102005008366A1 (de) 2005-02-23 2006-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ansteuern einer Wellenfeldsynthese-Renderer-Einrichtung mit Audioobjekten
FI20055260A0 (fi) * 2005-05-27 2005-05-27 Midas Studios Avoin Yhtioe Laite, järjestelmä ja menetelmä akustisten signaalien vastaanottamista tai toistamista varten
EP1989854B1 (fr) * 2005-12-27 2015-07-22 Orange Procede de determination d'un mode d'encodage spatial de donnees audio
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
JP2009540650A (ja) * 2006-06-09 2009-11-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 複数の音声再生ユニットへの送信のための音声データを生成する装置及び方法
US20080004729A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Direct encoding into a directional audio coding format
JP2008061186A (ja) * 2006-09-04 2008-03-13 Yamaha Corp 指向特性制御装置、収音装置および収音システム
JP4949477B2 (ja) * 2006-09-25 2012-06-06 ドルビー ラボラトリーズ ライセンシング コーポレイション 高次角度項による信号を抽出することでマルチチャンネルオーディオ再生システムの空間分解能を改善したサウンドフィールド
US8290167B2 (en) * 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
RS1332U (en) 2013-04-24 2013-08-30 Tomislav Stanojević FULL SOUND ENVIRONMENT SYSTEM WITH FLOOR SPEAKERS

Similar Documents

Publication Publication Date Title
JP2012514358A5 (ja)
JP6838093B2 (ja) オーディオ符号化システムにおけるユーザー対話のためのラウドネス制御
EP2382803B1 (en) Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction
TWI744341B (zh) 使用近場/遠場渲染之距離聲相偏移
CN107533843A (zh) 用于捕获、编码、分布和解码沉浸式音频的***和方法
JP6612753B2 (ja) 高チャンネル数マルチチャンネルオーディオのためのマルチプレットベースのマトリックスミキシング
US9119011B2 (en) Upmixing object based audio
US9190065B2 (en) Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
TWI543642B (zh) 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
US9761229B2 (en) Systems, methods, apparatus, and computer-readable media for audio object clustering
EP3123747B1 (en) Apparatus and method for audio rendering employing a geometric distance definition
CN101695151B (zh) 多声道音频信号变换为双声道音频信号的方法和设备
US20090110204A1 (en) Distributed Spatial Audio Decoder
GB2549532A (en) Merging audio signals with spatial metadata
KR20190115124A (ko) 비트스트림에서 오디오 렌더링 정보의 시그널링
US11924627B2 (en) Ambience audio representation and associated rendering
CN110191745B (zh) 利用空间音频的游戏流式传输
KR20010009258A (ko) 가상 멀티 채널 레코딩 시스템
Ludé Your Host
KR20130030044A (ko) 음향 데이터 처리방법 및 음향 데이터 처리장치