JP4751722B2 - オーディオシーンにおける音源のワイドネスを符号化および復号化する方法 - Google Patents

オーディオシーンにおける音源のワイドネスを符号化および復号化する方法 Download PDF

Info

Publication number
JP4751722B2
JP4751722B2 JP2005501282A JP2005501282A JP4751722B2 JP 4751722 B2 JP4751722 B2 JP 4751722B2 JP 2005501282 A JP2005501282 A JP 2005501282A JP 2005501282 A JP2005501282 A JP 2005501282A JP 4751722 B2 JP4751722 B2 JP 4751722B2
Authority
JP
Japan
Prior art keywords
sound source
sound
point
shape
sources
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005501282A
Other languages
English (en)
Other versions
JP2006516164A (ja
Inventor
シュピレ イェンス
シュミット ユルゲン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP20020022866 external-priority patent/EP1411498A1/en
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2006516164A publication Critical patent/JP2006516164A/ja
Application granted granted Critical
Publication of JP4751722B2 publication Critical patent/JP4751722B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

本発明は、殊にMPEG−4オーディオ標準によるオーディオオブジェクトとして符号化された音源のプレゼンテーションを記述するために、オーディオ信号のプレゼンテーション記述を符号化および復号化する方法および装置に関する。
背景技術
MPEG−4オーディオ標準ISO/IEC 14496−3:2001およびMPEG−4システム標準14496−1:2001に規定されているMPEG−4はオーディオオブジェクトの表現を支援することによって多種多様な用途を容易にする。オーディオオブジェクトに付加的な情報、いわゆるシーン記述を組み合わせるために、空間的および時間的な位置が求められ、符号化されたオーディオオブジェクトと共に伝送される。
再生に関しては単一のサウンドトラックを供給するために、オーディオオブジェクトがシーン記述を使用して別個に復号化され、合成されて、聴取者に再生される。
効率に関しては、MPEG−4システム標準ISO/IEC 14496−1:2001がバイナリ表現されたシーン記述、いわゆるBIFS(Binary Format for Scene)記述を符号化するやり方を規定している。したがってオーディオシーンはいわゆるオーディオBIFSを使用して記述される。
シーン記述は階層的に構造化されており、またグラフとして表現することができる。ここでグラフの葉ノードは別個のオブジェクトを形成し、また他のノードは例えば位置決め、スケーリング、効果などの処理を記述する。別個のオブジェクトの外観および挙動をシーン記述ノード内のパラメータを使用して制御することができる。
本発明
本発明は以下の事実の認識に基づくものである。上述したMPEG−4オーディオ標準のバージョンは例えば飛んでいる昆虫のような点源もしくは単一の楽器しか記述できず、聖歌隊、オーケストラ、海または雨などのような特定の次元を有する音源は記述することができない。しかしながら聴音テストによれば音源のワイドネス(wideness)は明確に可聴できる。
したがって本発明により解決されるべき課題は上述の問題を解決することである。この課題は請求項1に記載されている符号化方法および請求項8に記載されている相応の復号化方法によって解決される。
基本的に本発明による符号化方法は、音源のオーディオ信号とリンクされている、音源のパラメータ的な記述の生成を包含し、非点音源のワイドネスの記述はパラメータ的な記述を用いて記述されており、また非点音源のプレゼンテーションは非相関化された複数の点音源によって規定される。
基本的に本発明による復号化方法は、音源のパラメータ的な記述とリンクされている音源に対応するオーディオ信号の受信を包含する。音源のパラメータ的な記述は非点音源のワイドネスを求めるために評価され、また非相関化された複数の点音源は異なる位置において、非点音源に割り当てられる。
これによって、単純かつ逆方向の互換性もあるやり方で特定の次元を有する音源のワイドネスを記述することができる。殊に、広範な音が知覚される音源の再生をモノラル信号でもって実現でき、したがって結果として伝送されるべきオーディオ信号のビットレートは低くなる。1つの用途は例えばオーケストラのモノラル伝送であり、これは固定のスピーカレイアウトには結びつかず、所望の位置に配置することができる。
本発明の有利で付加的な実施形態は各従属請求項に記載されている。
図面
本発明の実施例を添付の図面を参照して説明する。ここで、
図1は音源のワイドネスを記述するためのノードの一般的な機能を示し、
図2は線音源に関するオーディオシーンであり、
図3は聴取者に対して相対的な開放角(opening-angle)を有する音源の幅を制御するための例であり、
図4はより複雑なオーディオ源を表現するための形状の組合せを有する例示的なシーンである。
実施例
図1は音源のワイドネスを記述するためのノードNDの一般的な機能性能を示したものである。このノードを以下ではAudioSpatialDiffusenessノードまたはAudioDiffusenessノードとも称する。
このAudioSpatialDiffusenessノードNDは1つまたは複数のチャネルからなるオーディオ信号AIを受信し、非相関化DECの後に同じ数のチャネルを有するオーディオ信号AOを出力として生成する。MPEG−4の術語においてはこのオーディオ入力はいわゆる子(child)に相応し、これは上位レベルの分岐に接続されており、他のあらゆるノードを変更することなくオーディオ分木の各分岐に挿入することができる分岐として規定されている。
diffuseSelectionフィールドDISによって拡散アルゴリズムの選択を制御することができる。したがってAudioSpatialDiffusenessノードが複数ある場合には、各ノードに異なる拡散アルゴリズムを適用することができ、したがって異なる出力が形成され、またそれぞれの出力の非相関化が保証される。拡散ノードは実質的にN個の異なる信号を生成することができるが、diffuseSelectフィールドによって選択された1つの実際の信号のみをノードの出力に通過させる。しかしながら、複数の実際の信号を1つの信号拡散ノードによって形成し、ノードの出力に供給することも可能である。必要であれば、非相関化強度を表すフィールドのような別のフィールドDESをノードに付加することができる。この非相関化強度は例えば相互相関関数を用いて求めることができる。
表1は提案されるAudioSpatialDiffusenessノードの考えられるセマンティクスを示す。子はそれぞれaddChildrenフィールドを用いて追加することができるか、removeChildrenフィールドを用いてノードから削除することができる。childrenフィールドは接続されている子のID、すなわち参照を包含する。diffuseSelectフィールドおよびdecorreStrentgthフィールドはスカラー32ビット整数値として規定されている。numChanフィールドはノードの出力におけるチャネル数を記述する。phaseGroupフィールドはノードの出力信号が関連するフェーズとして一緒にグループ化されるか否かを記述する。
Figure 0004751722
しかしながらこれは提案されるノードの1つの実施形態に過ぎず、異なるフィールドおよび/または付加的なフィールドが考えられる。
numChanが1より大きい場合、すなわちマルチチャネルのオーディオ信号である場合には、各チャネルは別個に拡散されるべきである。
非相関化された複数の点音源による非点音源のプレゼンテーションに関しては、非相関化された複数の点音源の数および位置を規定する必要がある。これを自動的もしくは手動で行うことができ、また点音源の正確な数に関する明示的な位置パラメータか、所定の形状内の点音源の密度のような相対的なパラメータを用いて行うことができる。さらにはプレゼンテーションを各点音源の強度および方向を使用して、またISO/IEC 14496−1に規定されているAudioDelayノードおよびAudioEffectsノードを使用して操作することができる。
図2は線音源LSSに関するオーディオシーンの一例を示す。3つの点音源S1,S2およびS3は線音源LSSを表現するために規定されており、それぞれの位置はデカルト座標で表されている。音源S1は−3,0,0に位置しており、音源S2は0,0,0に位置しており、音源S3は3,0,0に位置している。音源の非相関化のために異なる拡散アルゴリズムがそれぞれのAudioSpatialDiffusenessノードND1,ND2またはND3において選択されており、DS=1,2または3によって表されている。
表2はこの例に関する考えられるセマンティクスを示す。3つの音オブジェクトPOS1,POS2およびPOS3を有するグループが規定されている。正規化された強度はPOS1に対しては0.9、POS2およびPOS3に対しては0.8である。これらの音オブジェクトの位置は‘location’フィールドを使用することによりアドレッシングされ、このlocationフィールドはここでは3Dベクトルである。POS1は原点0,0,0に位置しており、POS2およびPOS3はそれぞれ原点に相対的にx方向に−3および3単位の所に位置している。ノードの‘spatialize’フィールドは‘true’にセットされており、これは音を‘'location’フィールドにおけるパラメータに依存して空間的に位置決めできることを表している。numChan1によって表されている場合には1チャネルのオーディオ信号が使用され、また異なる拡散アルゴリズムはdiffuseSelect1,2または3によって表されているようにそれぞれのAudioSpatialDiffusenessノードにおいて選択される。第1のAudioSpatialDiffusenessノードにおいては1チャネルの信号であるAudioSource BEACHが規定されており、url100において発見することができる。第2および第3のAudioSpatialDiffusenessノードは同一のAudioSource BEACHを使用する。これによってMPEG−4プレイヤにおける計算に必要とされる能力を低減させることができる。何故ならば、符号化されたオーディオデータをPCM出力信号に変換するオーディオデコーダは符号化を一度だけ行えば良いからである。このためにMPEG−4プレイヤのレンダは同一のAudioSourceを識別するためにシーン木を通過する。
Figure 0004751722
別の実施形態によれば、基本形状がAudioSpatialDiffusenessノードにおいて規定される。有利な選択形状は例えば箱形、球体および円柱を包含する。これら全てのノードは表3に示されているように、location、size、rotationフィールドを有する。
Figure 0004751722
sizeフィールドの1つのベクトル成分が0にセットされる場合には音量は平坦になり、その結果壁または円板が生じる。2つのベクトル成分が0である場合には線が生じる。
3D座標系で形状のサイズを記述するための別のアプローチは、聴取者に相対的な開放角を有する音のワイドネスを制御することである。開放角は中心としてのロケーションを有する0...2πの範囲にある垂直成分および水平成分、すなわち‘widthHorizontal’および‘widthVertical’を有する。witdhHorizontal成分φの定義は一般的に図3に示されている。音源は場所Lに位置している。良好な効果を達成するために、ロケーションは少なくとも2つのスピーカL1,L2によって挟まれるべきである。座標系および聴取者ロケーションはステレオまたは5.1再生システムのために使用される典型的な配置構成が想定され、ここで聴取者の位置はスピーカ装置によってもたらされるいわゆるスイートスポット内にあるべきである。widthVerticalはwithHorizontalがx−y方向に90°回転された関係に類似する。
さらには上述の基本形状をより複雑な形状と組み合わせることができる。図4は2つのオーディオ源、すなわち聴取者Lの前方に位置している聖歌隊と、聴取者の左方、右方および後方において拍手喝采する観衆を有するシーンを示す。聖歌隊は1つのSoundSphere Cからなり、観衆は3つのSoundBox A1,A2およびA3からなり、AudioDiffusenessノードでもって接続されている。
図4のシーンに関するBIFSの例が表4に示されている。聖歌隊を表すSoundSphereに関するオーディオ源はlocationフィールド内に規定されているように位置決めされており、またそれぞれのフィールドにおいて与えられているサイズおよび強度を有する。childrenフィールドAPPLAUSEは第1のSoundBoxに関するオーディオ源として規定されており、また第2および第3の音響ボックスに関するオーディオ源として再度使用される。さらにはこの場合、diffuseSelectフィールドはそれぞれのSoundBoxに対してどの信号が出力に通過されるべきかを表す。
Figure 0004751722
2Dシーンの場合には音響が3Dであることが依然として想定される。したがって、SoundVolumeノードの第2のセットを使用することが提案され、ここではz軸が表5に示されているように‘depth’と表されている単精度浮動小数点フィールドに置換されている。
Figure 0004751722
音源のワイドネスを記述するためのノードの一般的な機能。 線音源に関するオーディオシーン。 聴取者に対して相対的な開放角を有する音源の幅を制御するための例。 より複雑なオーディオ源を表現するための形状の組合せを有する例示的なシーン。

Claims (14)

  1. パラメータ的な記述によってオーディオ信号のシーン記述を符号化する方法であって、
    音源のパラメータ的な記述を生成することであって、前記パラメータ的な記述は、複数の点音源による前記音源に近似する形状の規定と、規定された前記形状内の前記複数の点音源の密度の規定と、各点音源に対して非相関化のために選択されるべき拡散アルゴリズムの規定とを含む、生成することと、
    前記音源の前記パラメータ的な記述を前記音源のオーディオ信号とリンクさせること
    有する前記方法。
  2. 別個の音源を別個のオーディオオブジェクトとして符号化し、音響シーンにおける前記音源の配置構成を、前記別個のオーディオオブジェクトに対応する第1のノードと前記オーディオオブジェクトのプレゼンテーションを記述する第2のノードとを有するシーン記述によって記述し、第2のノードが非点音源のプレゼンテーションを記述する、請求項1記載の方法。
  3. 前記非相関化された複数の点音源の非相関化の強度を前記非点音源に割り当てる、請求項1または2記載の方法。
  4. 規定された前記形状のサイズを3D座標系におけるパラメータによって表す、請求項1から3までのいずれか1項記載の方法。
  5. 規定された前記形状のサイズを垂直成分および水平成分を有する開放角によって表す、請求項4記載の方法。
  6. 複雑な形状の非点音源を、それぞれが該複雑な形状の非点音源の一部に近似する形状を有する種々の非点音源に分割し、同一のオーディオ信号を前記種々の非点音源のそれぞれに対して使用する、請求項1から5までのいずれか1項記載の方法。
  7. パラメータ的な記述によってオーディオ信号のシーン記述を復号化す方法であって、
    音源のパラメータ的な記述にリンクされている音源のオーディオ信号を受信することと、
    受信したパラメータ的な記述を評価することであって、前記パラメータ的な記述は、複数の点音源による前記音源に近似する形状の規定、規定された前記形状内の前記複数の点音源の密度の規定と、各点音源に対して非相関化のために選択されるべき拡散アルゴリズムの規定を含む、評価することと、
    複数の異なる拡散アルゴリズムから、前記各点音源に対する非相関化のための拡散アルゴリズムを選択することと、
    を有する前記方法。
  8. 別個の音源を表現するオーディオオブジェクトを別個に復号化し、別個のオーディオオブジェクトに対応する第1のノードとオーディオオブジェクトの処理を記述する第2のオブジェクトとを有するシーン記述を使用して、復号化されたオーディオオブジェクトから単一のサウンドトラックを構成し、第2のノードは非点音源のプレゼンテーションを記述する、請求項7記載の方法。
  9. 前記非相関化された複数の点音源の非相関化の強度を前記非点音源に割り当てられている対応する指示に依存して選択する、請求項7また8記載の方法。
  10. 規定された前記形状のサイズを3D座標系におけるパラメータを使用して求める、請求項7から9までのいずれか1項記載の方法。
  11. 規定された前記形状のサイズを垂直成分および水平成分を有する開放角を使用して求める、請求項10記載の方法。
  12. 複雑な形状の非点音源の一部に近似する形状をそれぞれ有している種々の非点音源の形状を組み合わせて前記複雑な形状の非点音源近似を生成し、同一のオーディオ信号を前記種々の非点音源それぞれに対して使用する、請求項7から11までのいずれか1項記載の方法。
  13. オーディオ信号のシーン記述を符号化する装置において、
    音源のパラメータ的な記述を生成する手段であって、前記パラメータ的な記述は、複数の点音源による前記音源に近似する形状の規定と、規定された前記形状内の前記複数の点音源の密度の規定と、各点音源に対して非相関化のために選択されるべき拡散アルゴリズムの規定とを含む、生成する手段と、
    前記音源のパラメータ的な記述を前記音源のオーディオ信号とリンクさせる手段
    有する前記装置。
  14. オーディオ信号のシーン記述を復号化する装置において、
    音源のパラメータ的な記述にリンクされている音源のオーディオ信号を受信する手段と、
    前記受信したパラメータ的な記述を評価する手段であって、前記パラメータ的な記述は、複数の点音源による前記音源に近似する形状の規定、規定された前記形状内の前記複数の点音源の密度の規定と、各点音源に対して非相関化のために選択されるべき拡散アルゴリズムの規定を含む、評価する手段と、
    複数の異なる拡散アルゴリズムから、前記各点音源に対する非相関化のための拡散アルゴリズムを選択する手段と、
    を有する前記装置。
JP2005501282A 2002-10-14 2003-10-10 オーディオシーンにおける音源のワイドネスを符号化および復号化する方法 Expired - Fee Related JP4751722B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
EP02022866.4 2002-10-14
EP20020022866 EP1411498A1 (en) 2002-10-14 2002-10-14 Method and apparatus for describing sound sources
EP02026770.4 2002-12-02
EP02026770 2002-12-02
EP03004732.8 2003-03-04
EP03004732 2003-03-04
PCT/EP2003/011242 WO2004036548A1 (en) 2002-10-14 2003-10-10 Method for coding and decoding the wideness of a sound source in an audio scene

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2010095347A Division JP2010198033A (ja) 2002-10-14 2010-04-16 オーディオシーンにおける音源のワイドネスを符号化および復号化する方法

Publications (2)

Publication Number Publication Date
JP2006516164A JP2006516164A (ja) 2006-06-22
JP4751722B2 true JP4751722B2 (ja) 2011-08-17

Family

ID=32110517

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2005501282A Expired - Fee Related JP4751722B2 (ja) 2002-10-14 2003-10-10 オーディオシーンにおける音源のワイドネスを符号化および復号化する方法
JP2010095347A Pending JP2010198033A (ja) 2002-10-14 2010-04-16 オーディオシーンにおける音源のワイドネスを符号化および復号化する方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2010095347A Pending JP2010198033A (ja) 2002-10-14 2010-04-16 オーディオシーンにおける音源のワイドネスを符号化および復号化する方法

Country Status (11)

Country Link
US (1) US8437868B2 (ja)
EP (1) EP1570462B1 (ja)
JP (2) JP4751722B2 (ja)
KR (1) KR101004836B1 (ja)
CN (1) CN1973318B (ja)
AT (1) ATE357043T1 (ja)
AU (1) AU2003273981A1 (ja)
BR (1) BRPI0315326B1 (ja)
DE (1) DE60312553T2 (ja)
ES (1) ES2283815T3 (ja)
WO (1) WO2004036548A1 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1717955B (zh) * 2002-12-02 2013-10-23 汤姆森许可贸易公司 用于描述音频信号的合成的方法
US8204261B2 (en) 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
EP1817767B1 (en) * 2004-11-30 2015-11-11 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
DE102005008366A1 (de) * 2005-02-23 2006-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ansteuern einer Wellenfeldsynthese-Renderer-Einrichtung mit Audioobjekten
DE102005008343A1 (de) * 2005-02-23 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Liefern von Daten in einem Multi-Renderer-System
EP1905002B1 (en) 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2007032648A1 (en) 2005-09-14 2007-03-22 Lg Electronics Inc. Method and apparatus for decoding an audio signal
WO2007136187A1 (en) * 2006-05-19 2007-11-29 Electronics And Telecommunications Research Institute Object-based 3-dimensional audio service system using preset audio scenes
EP1974348B1 (en) 2006-01-19 2013-07-24 LG Electronics, Inc. Method and apparatus for processing a media signal
KR101366291B1 (ko) 2006-01-19 2014-02-21 엘지전자 주식회사 신호 디코딩 방법 및 장치
KR20080093024A (ko) 2006-02-07 2008-10-17 엘지전자 주식회사 부호화/복호화 장치 및 방법
BRPI0708047A2 (pt) * 2006-02-09 2011-05-17 Lg Eletronics Inc método para codificar e decodificar sinal de áudio com base em objeto e equipamento para o mesmo
ES2407820T3 (es) 2006-02-23 2013-06-14 Lg Electronics Inc. Método y aparato para procesar una señal de audio
JP2009532712A (ja) 2006-03-30 2009-09-10 エルジー エレクトロニクス インコーポレイティド メディア信号処理方法及び装置
US20080235006A1 (en) 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
KR100868475B1 (ko) 2007-02-16 2008-11-12 한국전자통신연구원 객체기반 오디오 서비스를 위한 다중객체 오디오 콘텐츠파일의 생성, 편집 및 재생 방법과, 오디오 프리셋 생성방법
JPWO2010005050A1 (ja) * 2008-07-11 2012-01-05 日本電気株式会社 信号分析装置、信号制御装置及びその方法と、プログラム
CN101819774B (zh) * 2009-02-27 2012-08-01 北京中星微电子有限公司 声源定向信息的编解码方法和***
CN101819775B (zh) * 2009-02-27 2012-08-01 北京中星微电子有限公司 声源定向信息的编解码方法和***
CN101819776B (zh) * 2009-02-27 2012-04-18 北京中星微电子有限公司 嵌入和获取声源定向信息的方法及音频编解码方法和***
CN104054126B (zh) * 2012-01-19 2017-03-29 皇家飞利浦有限公司 空间音频渲染和编码
MX361115B (es) * 2013-07-22 2018-11-28 Fraunhofer Ges Forschung Descodificador de audio multicanal, codificador de audio multicanal, métodos, programa de computadora y representación de audio codificada usando una decorrelación de señales de audio renderizadas.
RU2716037C2 (ru) * 2013-07-31 2020-03-05 Долби Лэборетериз Лайсенсинг Корпорейшн Обработка пространственно-диффузных или больших звуковых объектов
EP3900401A1 (en) 2018-12-19 2021-10-27 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Apparatus and method for reproducing a spatially extended sound source or apparatus and method for generating a bitstream from a spatially extended sound source
US11270712B2 (en) 2019-08-28 2022-03-08 Insoundz Ltd. System and method for separation of audio sources that interfere with each other using a microphone array
CA3164476A1 (en) * 2019-12-12 2021-06-17 Liquid Oxigen (Lox) B.V. Generating an audio signal associated with a virtual sound source
EP3879856A1 (en) * 2020-03-13 2021-09-15 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Apparatus and method for synthesizing a spatially extended sound source using cue information items
EP4210352A1 (en) * 2022-01-11 2023-07-12 Koninklijke Philips N.V. Audio apparatus and method of operation therefor

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05505298A (ja) * 1991-01-08 1993-08-05 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 多次元音場のための符号器・復号器
JP2004535145A (ja) * 2001-07-10 2004-11-18 コーディング テクノロジーズ アクチボラゲット 低ビットレートオーディオ符号化用の効率的かつスケーラブルなパラメトリックステレオ符号化

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05505298A (ja) * 1991-01-08 1993-08-05 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 多次元音場のための符号器・復号器
JP2004535145A (ja) * 2001-07-10 2004-11-18 コーディング テクノロジーズ アクチボラゲット 低ビットレートオーディオ符号化用の効率的かつスケーラブルなパラメトリックステレオ符号化

Also Published As

Publication number Publication date
BRPI0315326B1 (pt) 2017-02-14
US8437868B2 (en) 2013-05-07
ES2283815T3 (es) 2007-11-01
ATE357043T1 (de) 2007-04-15
EP1570462A1 (en) 2005-09-07
CN1973318A (zh) 2007-05-30
WO2004036548A1 (en) 2004-04-29
KR20050055012A (ko) 2005-06-10
CN1973318B (zh) 2012-01-25
JP2010198033A (ja) 2010-09-09
EP1570462B1 (en) 2007-03-14
DE60312553T2 (de) 2007-11-29
US20060165238A1 (en) 2006-07-27
DE60312553D1 (de) 2007-04-26
JP2006516164A (ja) 2006-06-22
AU2003273981A1 (en) 2004-05-04
BR0315326A (pt) 2005-08-16
KR101004836B1 (ko) 2010-12-28

Similar Documents

Publication Publication Date Title
JP4751722B2 (ja) オーディオシーンにおける音源のワイドネスを符号化および復号化する方法
JP5425907B2 (ja) 空間出力マルチチャネルオーディオ信号を決定する装置
JP5688030B2 (ja) 三次元音場の符号化および最適な再現の方法および装置
CN113316943B (zh) 再现空间扩展声源的设备与方法、或从空间扩展声源生成比特流的设备与方法
TWI797417B (zh) 用於將保真立體音響格式聲訊訊號描繪至二維度(2d)揚聲器設置之方法和裝置以及電腦可讀式儲存媒體
KR102652670B1 (ko) 다중-층 묘사를 이용하여 증강된 음장 묘사 또는 수정된 음장 묘사를 생성하기 위한 개념
KR20220044393A (ko) 깊이-확장형 DirAC 기술 또는 기타 기술을 이용하여 증강된 음장 묘사 또는 수정된 음장 묘사를 생성하기 위한 개념
TW201442522A (zh) 屬於第1階保真立體音響訊號且具有第0階和第1階係數的輸入訊號指向性之增進方法及裝置
US20240119949A1 (en) Encoding/decoding apparatus for processing channel signal and method therefor
KR20220156809A (ko) 앵커링 정보를 이용하여 공간적으로 확장된 음원을 재생하는 장치 및 방법 또는 공간적으로 확장된 음원에 대한 디스크립션을 생성하기 위한 장치 및 방법
WO2023083876A2 (en) Renderers, decoders, encoders, methods and bitstreams using spatially extended sound sources
Barrett Spatial music composition
Jot et al. Perceptually Motivated Spatial Audio Scene Description and Rendering for 6-DoF Immersive Music Experiences
KR20190060464A (ko) 오디오 신호 처리 방법 및 장치
Devonport et al. Full Reviewed Paper at ICSA 2019
KR20240091274A (ko) 기본 공간 섹터를 사용하여 공간 확장형 음원을 합성하는 장치, 방법 및 컴퓨터 프로그램
KR20240096683A (ko) 잠재적 수정 객체에 대한 수정 데이터를 사용하여 공간 확장형 음원을 합성하는 장치, 방법 또는 컴퓨터 프로그램
KR20240096705A (ko) 분산 또는 공분산 데이터를 사용하여 공간 확장형 음원을 합성하는 장치, 방법 또는 컴퓨터 프로그램
Stevenson Spatialisation, Method and Madness Learning from Commercial Systems

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061002

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091016

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100113

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100114

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100120

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100416

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100716

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20100716

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101001

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101227

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110107

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20110307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110328

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110513

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110523

R150 Certificate of patent or registration of utility model

Ref document number: 4751722

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140527

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees