JP4993227B2 - 多チャンネル音声フォーマット間の変換のための方法および装置 - Google Patents
多チャンネル音声フォーマット間の変換のための方法および装置 Download PDFInfo
- Publication number
- JP4993227B2 JP4993227B2 JP2009553931A JP2009553931A JP4993227B2 JP 4993227 B2 JP4993227 B2 JP 4993227B2 JP 2009553931 A JP2009553931 A JP 2009553931A JP 2009553931 A JP2009553931 A JP 2009553931A JP 4993227 B2 JP4993227 B2 JP 4993227B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- representation
- signal
- audio signal
- spatial audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 34
- 238000006243 chemical reaction Methods 0.000 title description 24
- 230000005236 sound signal Effects 0.000 claims description 67
- 239000013598 vector Substances 0.000 claims description 32
- 238000004590 computer program Methods 0.000 claims description 6
- 238000009795 derivation Methods 0.000 claims description 5
- 108091006146 Channels Proteins 0.000 description 80
- 238000004458 analytical method Methods 0.000 description 13
- 238000009792 diffusion process Methods 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000004091 panning Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000003892 spreading Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- ZYXYTGQFPZEUFX-UHFFFAOYSA-N benzpyrimoxan Chemical compound O1C(OCCC1)C=1C(=NC=NC=1)OCC1=CC=C(C=C1)C(F)(F)F ZYXYTGQFPZEUFX-UHFFFAOYSA-N 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/86—Arrangements characterised by the broadcast information itself
- H04H20/88—Stereophonic broadcast systems
- H04H20/89—Stereophonic broadcast systems using three or more audio channels, e.g. triphonic or quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- General Physics & Mathematics (AREA)
- Algebra (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Stereophonic System (AREA)
Description
この発明は、異なる多チャンネル音声フォーマット間で、特定の多チャンネル表現に限定されることなく、可能な最高の品質でどのように変換するかについての技術に関する。つまり、この発明は、任意の多チャンネルフォーマット間の変換を可能にする技術に関する。
一般に、多チャンネル再生および聴取では、聴取者は多数のラウドスピーカによって包囲される。特定の設定用に音声信号を取り込むために、さまざまな方法が存在する。再生における1つの一般的な目標は、もともと録音された音響事象、すなわちオーケストラの中でのトランペットの位置といった音声源の起源の空間的構成を再現することである。いくつかのラウドスピーカ設定はかなり一般的であり、異なる空間的印象を作り出すことができる。特殊な生成後技術(post-production techniques)を用いなければ、一般に知られた2チャンネルステレオ設定は、2つのラウドスピーカ間の配線上に聴覚事象を再度作り出すことしかできない。これは主として、1つの音声源に関連した信号の振幅が2つのラウドスピーカ間で、ラウドスピーカに対する音声源の位置に依存して分配される、いわゆる「振幅パンニング」によって達成される。これは通常、録音中またはその後のミキシング中に行なわれる。つまり、聴取位置に対して左端から到来する音声源は主として左のラウドスピーカによって再生され、一方、聴取位置の前にある音声源は両方のラウドスピーカによって同じ振幅(レベル)で再生されることになる。しかしながら、他の方向から生じる音は再生できない。
のみから生じる音を表わす。音の到来方向を測定する一般に知られた一方法は、デカルト座標軸と整列された3つの8の字マイク(XYZ)を適用することである。特殊なマイク、いわゆる「音場マイク」がこれまで設計されており、それはあらゆる所望の応答を直接生み出す。しかしながら、上述のように、W、X、YおよびZ信号はまた、1組の別々の全指向性マイクから計算されてもよい。
の問題は、5チャンネルのサラウンド・ラウドスピーカ・システムでの再生のために、2チャンネルステレオ音声をどのように変換するか、ということである。そのような2対5のアップミックスに対する1つのアプローチまたは実現化例は、いわゆる「行列」復号器を用いることである。そのような復号器は、特に映画およびホームシアター用の初期のサラウンドサウンドにおいて、ステレオ伝送インフラストラクチャ全体に5.1多チャンネルサウンドを提供するかまたはアップミックスすることが、一般的になっている。基本的な考え方は、音像の前にあるステレオ信号において同相である音成分を再生すること、および位相成分を後方ラウドスピーカに導入することである。代替的な2対5のアップミックス方法は、ステレオ信号の周囲成分を抽出すること、およびそれらの成分を5.1設定の後方ラウドスピーカを介して再生することを提案している。知覚的により理に適った根拠に基づいて同じ基本的考え方に従い、かつ数学的により洗練された実現化例を用いる一アプローチが最近、C・フォーラー(Faller)により、「パラメトリック多チャンネル音声符号化:コヒーレンスキューの合成」(Parametric Multi-channel Audio Coding: Synthesis of Coherence Cues)、音声処理に関するIEEE会報(IEEE Trans. On Speech and Audio Proc.)、第14巻、第1号、2006年1月、において提案されている。
国際特許出願2004/077884は、DirAC符号化を利用して、聴取環境内の音声信号のインパルス応答を録音することを提案している。そのような録音されたインパルス応答を用いて、音声信号は聴取環境の空間的印象とともに再生されてもよい。
AES会議論文6658はDirAC音声符号化に向けられており、bフォーマットマイクによって録音された信号の効率的な符号化表現をどのように作成するかという方法を提案している。
国際特許出願01/82651は、多チャンネルサラウンドマスタリングおよび再生技術に関する。伝送されるべきコンパクトな符号化表現を提供するために、ある特定の空間符号化技術が提案されている。符号化表現は次に受信側で、特別に設計された復号器によって復号されてもよい。
この発明の一実施例によれば、空間音声信号の入力多チャンネル表現を異なる出力多チャンネル表現に変換するための装置は、空間音声信号の中間表現を導き出すための分析器を含み、中間表現は、空間音声信号の一部分の起源の方向を示す方向パラメータを有し、前記装置はさらに、空間音声信号の中間表現を用いて、空間音声信号の出力多チャンネル表現を生成するための信号構成器を含む。
つまり、(正および負の振幅が起こり得るため)2つの信号間の起こり得る干渉を可能にする強度量が導き出される。加えて、エネルギ量が導き出されるが、それは当然、2つの信号間の干渉を可能にはしない。なぜなら、エネルギ量は、信号の打ち消しを可能とする負の値を含んでいないためである。
つまり、オプションで、空間音声信号の起源の方向を示すパラメータを有する短時間平均された方向ベクトルが導き出されてもよい。
図2は、ITU−775−1に従った5チャンネルを有する入力多チャンネル表現からの方向パラメータを導出についての一例を示す。多チャンネル入力音声信号、すなわち入力多チャンネル表現はまず、対応する多チャンネル音声設定の無響録音をシミュレートすることにより、Bフォーマットに変換される。軸x22およびy24を有するデカルト座標系の中心20に対し、後方右側のラウドスピーカ26は110°の角度に位置している。右側前方のラウドスピーカ28は+30°に、中央のラウドスピーカは0°に、左側前方のラウドスピーカ32は−31°に、そして左側後方のラウドスピーカ34は−110°に位置している。実際には、無響録音は、単純な行列化演算を適用することによりシミュレート可能であり、入力多チャンネル表現の幾何学的設定は公知である。
に適合される出力多チャンネル表現は、再生されるべき空間音声信号の部分を音声源44の方向に近いラウドスピーカに再分配することにより、すなわち、方向パラメータによって示された方向に近いラウドスピーカにより、容易に導き出すことができる。つまり、方向パラメータによって示された方向のラウドスピーカに対応する音声チャンネルは、この方向から遠く離れたラウドスピーカに対応する音声チャンネルに対して強調される。つまり、ラウドスピーカ50aおよび50bはその信号部分を再生するよう(たとえば振幅パンニングを用いて)操作可能であるが、一方、ラウドスピーカ50c〜50fはその特定の信号成分を再生せず、それらは異なる音、または異なる周波数帯域の他の信号部分の再生用に使用されてもよい。
装置100は、空間音声信号の中間表現106を導き出すための分析器104を含み、中間表現106は、空間音声信号の一部分の起源の方向を示す方向パラメータを有する。
得ることが理解されるべきである。
Claims (22)
- 空間音声信号の入力多チャンネル表現を異なる出力多チャンネル表現に変換するための装置であって、
シミュレートされたマイク信号を得るために、入力多チャンネル表現に関連したラウドスピーカに対応する数の音声チャンネルの録音をシミュレートするための手段と、
シミュレートされたマイク信号から空間音声信号の中間表現を導き出すための分析器とを含み、中間表現は、空間音声信号の一部分の起源の方向を示す方向パラメータを有し、前記装置はさらに、
空間音声信号の中間表現を用いて、空間音声信号の出力多チャンネル表現を生成するための信号構成器を含む、装置。 - 分析器は、入力多チャンネル表現に関連した音声チャンネルの相互関係に依存する方向パラメータを導き出すよう動作する、請求項1に記載の装置。
- 分析器は、入力多チャンネル表現に関連した音声チャンネルの相対位相情報を保存する方向パラメータを導き出すよう動作する、請求項1に記載の装置。
- 分析器は、空間音声信号の有限幅の周波数部分のために異なる方向パラメータを導き出すよう動作する、請求項1に記載の装置。
- 分析器は、空間音声信号の有限長の時間部分のために異なる方向パラメータを導き出すよう動作する、請求項1に記載の装置。
- 分析器は、空間音声信号の一部分の起源の方向を指すベクトルを表わす方向パラメータを導き出すよう動作する、請求項1に記載の装置。
- 分析器は加えて、中間表現に関連した1つ以上の音声チャンネルを導き出すよう動作する、請求項1に記載の装置。
- 分析器は、入力多チャンネル表現に関連したラウドスピーカに対応する音声チャンネルを導き出すよう動作する、請求項7に記載の装置。
- 分析器は、入力多チャンネル表現に関連したラウドスピーカに対応する音声チャンネルの和として1つのダウンミックスチャンネルを導き出すよう動作する、請求項7に記載の装置。
- 分析器は、デカルト座標系の軸の方向に関連した少なくとも1つの音声チャンネルを導き出すよう動作する、請求項7に記載の装置。
- 分析器は、入力多チャンネル表現に関連したラウドスピーカに対応する音声チャンネルの加重和を構築する少なくとも1つの音声チャンネルを導き出すよう動作する、請求項10に記載の装置。
- 分析器はさらに、空間音声信号の一部分の起源の方向の拡散性を示す拡散性パラメータを導き出すよう動作する、請求項1に記載の装置。
- 信号構成器は、空間音声信号の一部分を、出力多チャンネル表現に関連したラウドスピーカの数に対応する数のチャンネルに分配するよう動作する、請求項1に記載の装置。
- 信号構成器は、空間音声信号の一部分が、方向パラメータによって示された方向からより遠く離れたラウドスピーカに対応するチャンネルよりも、その方向により近いラウドスピーカに対応するチャンネルに、より大きい強度で分配されるよう動作する、請求項14に記載の装置。
- 信号構成器は、拡散性パラメータがより低い拡散性を示す場合よりも、拡散性パラメータがより高い拡散性を示す場合に、空間音声信号の一部分が、出力多チャンネル表現に関連したラウドスピーカに対応するチャンネルにより均一な強度で分配されるよう動作する、請求項13に記載の装置。
- 入力多チャンネル表現を受取るための入力インターフェイスをさらに含む、請求項1に記載の装置。
- 入力多チャンネル表現に関連したすべてのラウドスピーカに対応する数の音声チャンネルを導き出すための入力表現復号器をさらに含む、請求項1に記載の装置。
- 信号構成器は、出力チャンネル表現に関連したラウドスピーカに対応する音声チャンネルに基づいて出力多チャンネル表現を導き出すための出力チャンネル符号器をさらに含む、請求項14に記載の装置。
- 出力多チャンネル表現を提供するための出力インターフェイスをさらに含む、請求項1に記載の装置。
- 空間音声信号の入力多チャンネル表現を異なる出力多チャンネル表現に変換するための方法であって、
シミュレートされたマイク信号を得るために、入力多チャンネル表現に関連したラウドスピーカに対応する数の音声チャンネルの録音をシミュレートするステップと、
シミュレートされたマイク信号から空間音声信号の中間表現を導き出すステップとを含み、中間表現は、空間音声信号の一部分の起源の方向を示す方向パラメータを有し、前記方法はさらに、
空間音声信号の中間表現を用いて、空間音声信号の出力多チャンネル表現を生成するステップを含む、方法。 - コンピュータ上で起動される際に、空間音声信号の多チャンネル表現を異なる出力多チャンネル表現に変換するための方法を実施するためのコンピュータプログラムであって、前記方法は、
シミュレートされたマイク信号を得るために、入力多チャンネル表現に関連したラウドスピーカに対応する数の音声チャンネルの録音をシミュレートするステップと、
シミュレートされたマイク信号から空間音声信号の中間表現を導き出すステップとを含み、中間表現は、空間音声信号の一部分の起源の方向を示す方向パラメータを有し、前記方法はさらに、
空間音声信号の中間表現を用いて、空間音声信号の出力多チャンネル表現を生成するステップを含む、コンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US89618407P | 2007-03-21 | 2007-03-21 | |
US60/896,184 | 2007-03-21 | ||
US11/742,502 US8290167B2 (en) | 2007-03-21 | 2007-04-30 | Method and apparatus for conversion between multi-channel audio formats |
US11/742,502 | 2007-04-30 | ||
PCT/EP2008/000830 WO2008113428A1 (en) | 2007-03-21 | 2008-02-01 | Method and apparatus for conversion between multi-channel audio formats |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010521910A JP2010521910A (ja) | 2010-06-24 |
JP4993227B2 true JP4993227B2 (ja) | 2012-08-08 |
Family
ID=39313182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009553931A Active JP4993227B2 (ja) | 2007-03-21 | 2008-02-01 | 多チャンネル音声フォーマット間の変換のための方法および装置 |
Country Status (9)
Country | Link |
---|---|
US (1) | US8290167B2 (ja) |
EP (1) | EP2130204A1 (ja) |
JP (1) | JP4993227B2 (ja) |
KR (1) | KR101195980B1 (ja) |
CN (1) | CN101669167A (ja) |
BR (1) | BRPI0808217B1 (ja) |
RU (1) | RU2449385C2 (ja) |
TW (1) | TWI369909B (ja) |
WO (1) | WO2008113428A1 (ja) |
Families Citing this family (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007083739A1 (ja) * | 2006-01-19 | 2007-07-26 | Nippon Hoso Kyokai | 3次元音響パンニング装置 |
US9014377B2 (en) * | 2006-05-17 | 2015-04-21 | Creative Technology Ltd | Multichannel surround format conversion and generalized upmix |
US9015051B2 (en) * | 2007-03-21 | 2015-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Reconstruction of audio channels with direction parameters indicating direction of origin |
US8908873B2 (en) * | 2007-03-21 | 2014-12-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US8180062B2 (en) * | 2007-05-30 | 2012-05-15 | Nokia Corporation | Spatial sound zooming |
JP2011519528A (ja) * | 2008-04-21 | 2011-07-07 | スナップ ネットワークス インコーポレーテッド | スピーカー用電気システムとその制御装置 |
CN102084418B (zh) * | 2008-07-01 | 2013-03-06 | 诺基亚公司 | 用于调整多通道音频信号的空间线索信息的设备和方法 |
EP2205007B1 (en) * | 2008-12-30 | 2019-01-09 | Dolby International AB | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction |
KR101387195B1 (ko) * | 2009-10-05 | 2014-04-21 | 하만인터내셔날인더스트리스인코포레이티드 | 오디오 신호의 공간 추출 시스템 |
EP2346028A1 (en) | 2009-12-17 | 2011-07-20 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal |
JP5508550B2 (ja) * | 2010-02-24 | 2014-06-04 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 拡張ダウンミックス信号を発生するための装置、拡張ダウンミックス信号を発生するための方法及びコンピュータプログラム |
US9100768B2 (en) | 2010-03-26 | 2015-08-04 | Thomson Licensing | Method and device for decoding an audio soundfield representation for audio playback |
EP2375779A3 (en) * | 2010-03-31 | 2012-01-18 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for measuring a plurality of loudspeakers and microphone array |
KR20120004909A (ko) * | 2010-07-07 | 2012-01-13 | 삼성전자주식회사 | 입체 음향 재생 방법 및 장치 |
US9271081B2 (en) * | 2010-08-27 | 2016-02-23 | Sonicemotion Ag | Method and device for enhanced sound field reproduction of spatially encoded audio input signals |
JP5567997B2 (ja) * | 2010-12-07 | 2014-08-06 | 日本放送協会 | 音響信号比較装置およびそのプログラム |
KR101871234B1 (ko) | 2012-01-02 | 2018-08-02 | 삼성전자주식회사 | 사운드 파노라마 생성 장치 및 방법 |
JP2015509212A (ja) * | 2012-01-19 | 2015-03-26 | コーニンクレッカ フィリップス エヌ ヴェ | 空間オーディオ・レンダリング及び符号化 |
CN103379424B (zh) * | 2012-04-24 | 2016-08-10 | 华为技术有限公司 | 一种混音方法及多点控制服务器 |
EP2733964A1 (en) * | 2012-11-15 | 2014-05-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Segment-wise adjustment of spatial audio signal to different playback loudspeaker setup |
MX347100B (es) * | 2012-12-04 | 2017-04-12 | Samsung Electronics Co Ltd | Aparato de suministro de audio y método de suministro de audio. |
WO2014161996A2 (en) | 2013-04-05 | 2014-10-09 | Dolby International Ab | Audio processing system |
BR122021009022B1 (pt) | 2013-04-05 | 2022-08-16 | Dolby International Ab | Método de decodificação para decodificar dois sinais de áudio, mídia legível por computador, e decodificador para decodificar dois sinais de áudio |
ES2643789T3 (es) | 2013-05-24 | 2017-11-24 | Dolby International Ab | Codificación eficiente de escenas de audio que comprenden objetos de audio |
JP6190947B2 (ja) * | 2013-05-24 | 2017-08-30 | ドルビー・インターナショナル・アーベー | オーディオ・オブジェクトを含むオーディオ・シーンの効率的な符号化 |
US9495968B2 (en) | 2013-05-29 | 2016-11-15 | Qualcomm Incorporated | Identifying sources from which higher order ambisonic audio data is generated |
EP2814027B1 (en) * | 2013-06-11 | 2016-08-10 | Harman Becker Automotive Systems GmbH | Directional audio coding conversion |
EP2830332A3 (en) | 2013-07-22 | 2015-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration |
JP6392353B2 (ja) | 2013-09-12 | 2018-09-19 | ドルビー・インターナショナル・アーベー | マルチチャネル・オーディオ・コンテンツの符号化 |
CN105637901B (zh) * | 2013-10-07 | 2018-01-23 | 杜比实验室特许公司 | 空间音频处理***和方法 |
EP3127109B1 (en) | 2014-04-01 | 2018-03-14 | Dolby International AB | Efficient coding of audio scenes comprising audio objects |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
US9852737B2 (en) * | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
CN105657633A (zh) | 2014-09-04 | 2016-06-08 | 杜比实验室特许公司 | 生成针对音频对象的元数据 |
US9774974B2 (en) | 2014-09-24 | 2017-09-26 | Electronics And Telecommunications Research Institute | Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion |
US9913061B1 (en) | 2016-08-29 | 2018-03-06 | The Directv Group, Inc. | Methods and systems for rendering binaural audio content |
EP3297298B1 (en) * | 2016-09-19 | 2020-05-06 | A-Volute | Method for reproducing spatially distributed sounds |
US9820073B1 (en) | 2017-05-10 | 2017-11-14 | Tls Corp. | Extracting a common signal from multiple audio signals |
AU2018344830B2 (en) | 2017-10-04 | 2021-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to DirAC based spatial audio coding |
PL3711047T3 (pl) * | 2017-11-17 | 2023-01-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Urządzenie i sposób do kodowania lub dekodowania parametrów kierunkowego kodowania audio przy wykorzystaniu różnych rozdzielczości czasowych/częstotliwościowych |
WO2020016685A1 (en) * | 2018-07-18 | 2020-01-23 | Sphereo Sound Ltd. | Detection of audio panning and synthesis of 3d audio from limited-channel surround sound |
WO2022164229A1 (ko) * | 2021-01-27 | 2022-08-04 | 삼성전자 주식회사 | 오디오 처리 장치 및 방법 |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BG60225B2 (en) | 1988-09-02 | 1993-12-30 | Q Sound Ltd | Method and device for sound image formation |
US5208860A (en) | 1988-09-02 | 1993-05-04 | Qsound Ltd. | Sound imaging method and apparatus |
DE69210689T2 (de) | 1991-01-08 | 1996-11-21 | Dolby Lab Licensing Corp | Kodierer/dekodierer für mehrdimensionale schallfelder |
GB9103207D0 (en) | 1991-02-15 | 1991-04-03 | Gerzon Michael A | Stereophonic sound reproduction system |
DE4236989C2 (de) | 1992-11-02 | 1994-11-17 | Fraunhofer Ges Forschung | Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle |
JPH07222299A (ja) | 1994-01-31 | 1995-08-18 | Matsushita Electric Ind Co Ltd | 音像移動処理編集装置 |
US5850453A (en) | 1995-07-28 | 1998-12-15 | Srs Labs, Inc. | Acoustic correction apparatus |
FR2738099B1 (fr) | 1995-08-25 | 1997-10-24 | France Telecom | Procede de simulation de la qualite acoustique d'une salle et processeur audio-numerique associe |
US5870484A (en) | 1995-09-05 | 1999-02-09 | Greenberger; Hal | Loudspeaker array with signal dependent radiation pattern |
JP4132109B2 (ja) | 1995-10-26 | 2008-08-13 | ソニー株式会社 | 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置 |
US6697491B1 (en) | 1996-07-19 | 2004-02-24 | Harman International Industries, Incorporated | 5-2-5 matrix encoder and decoder system |
JP3594281B2 (ja) | 1997-04-30 | 2004-11-24 | 株式会社河合楽器製作所 | ステレオ拡大装置及び音場拡大装置 |
JP4347422B2 (ja) | 1997-06-17 | 2009-10-21 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | 空間形成されたオーディオの再生 |
US5890125A (en) | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
FI116990B (fi) | 1997-10-20 | 2006-04-28 | Nokia Oyj | Menetelmä ja järjestelmä akustisen virtuaaliympäristön käsittelemiseksi |
AUPP272598A0 (en) | 1998-03-31 | 1998-04-23 | Lake Dsp Pty Limited | Wavelet conversion of 3-d audio signals |
EP1275272B1 (en) | 2000-04-19 | 2012-11-21 | SNK Tech Investment L.L.C. | Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics in three dimensions |
US7110953B1 (en) | 2000-06-02 | 2006-09-19 | Agere Systems Inc. | Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction |
CN100429960C (zh) | 2000-07-19 | 2008-10-29 | 皇家菲利浦电子有限公司 | 用于获得立体声环绕和/或音频中心信号的多声道立体声转换器 |
EP1184676B1 (en) | 2000-09-02 | 2004-05-06 | Nokia Corporation | System and method for processing a signal being emitted from a target signal source into a noisy environment |
KR100922910B1 (ko) | 2001-03-27 | 2009-10-22 | 캠브리지 메카트로닉스 리미티드 | 사운드 필드를 생성하는 방법 및 장치 |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
JP3810004B2 (ja) | 2002-03-15 | 2006-08-16 | 日本電信電話株式会社 | ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム |
TWI236307B (en) | 2002-08-23 | 2005-07-11 | Via Tech Inc | Method for realizing virtual multi-channel output by spectrum analysis |
FI118247B (fi) | 2003-02-26 | 2007-08-31 | Fraunhofer Ges Forschung | Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa |
SE0400997D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Efficient coding of multi-channel audio |
US7818077B2 (en) | 2004-05-06 | 2010-10-19 | Valve Corporation | Encoding spatial data in a multi-channel sound file for an object in a virtual environment |
US20080144864A1 (en) | 2004-05-25 | 2008-06-19 | Huonlabs Pty Ltd | Audio Apparatus And Method |
US8843378B2 (en) | 2004-06-30 | 2014-09-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel synthesizer and method for generating a multi-channel output signal |
WO2006003813A1 (ja) | 2004-07-02 | 2006-01-12 | Matsushita Electric Industrial Co., Ltd. | オーディオ符号化及び復号化装置 |
KR101283525B1 (ko) | 2004-07-14 | 2013-07-15 | 돌비 인터네셔널 에이비 | 오디오 채널 변환 |
US7720232B2 (en) | 2004-10-15 | 2010-05-18 | Lifesize Communications, Inc. | Speakerphone |
US7853022B2 (en) | 2004-10-28 | 2010-12-14 | Thompson Jeffrey K | Audio spatial environment engine |
SE0402652D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
US8873768B2 (en) | 2004-12-23 | 2014-10-28 | Motorola Mobility Llc | Method and apparatus for audio signal enhancement |
JP4804014B2 (ja) | 2005-02-23 | 2011-10-26 | 沖電気工業株式会社 | 音声会議装置 |
US8023659B2 (en) * | 2005-06-21 | 2011-09-20 | Japan Science And Technology Agency | Mixing system, method and program |
EP1761110A1 (en) | 2005-09-02 | 2007-03-07 | Ecole Polytechnique Fédérale de Lausanne | Method to generate multi-channel audio signals from stereo signals |
US8379868B2 (en) * | 2006-05-17 | 2013-02-19 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
-
2007
- 2007-04-30 US US11/742,502 patent/US8290167B2/en active Active
-
2008
- 2008-02-01 CN CN200880009025A patent/CN101669167A/zh active Pending
- 2008-02-01 WO PCT/EP2008/000830 patent/WO2008113428A1/en active Application Filing
- 2008-02-01 KR KR1020097019537A patent/KR101195980B1/ko active IP Right Grant
- 2008-02-01 EP EP08707513A patent/EP2130204A1/en not_active Withdrawn
- 2008-02-01 RU RU2009134474/08A patent/RU2449385C2/ru active
- 2008-02-01 BR BRPI0808217-0A patent/BRPI0808217B1/pt active IP Right Grant
- 2008-02-01 JP JP2009553931A patent/JP4993227B2/ja active Active
- 2008-03-19 TW TW097109731A patent/TWI369909B/zh active
Also Published As
Publication number | Publication date |
---|---|
KR101195980B1 (ko) | 2012-10-30 |
US8290167B2 (en) | 2012-10-16 |
CN101669167A (zh) | 2010-03-10 |
KR20090117897A (ko) | 2009-11-13 |
BRPI0808217B1 (pt) | 2021-04-06 |
RU2449385C2 (ru) | 2012-04-27 |
TW200845801A (en) | 2008-11-16 |
RU2009134474A (ru) | 2011-04-27 |
TWI369909B (en) | 2012-08-01 |
WO2008113428A1 (en) | 2008-09-25 |
US20080232616A1 (en) | 2008-09-25 |
JP2010521910A (ja) | 2010-06-24 |
BRPI0808217A2 (pt) | 2014-07-01 |
EP2130204A1 (en) | 2009-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4993227B2 (ja) | 多チャンネル音声フォーマット間の変換のための方法および装置 | |
US10820134B2 (en) | Near-field binaural rendering | |
US8908873B2 (en) | Method and apparatus for conversion between multi-channel audio formats | |
US10609503B2 (en) | Ambisonic depth extraction | |
CN111316354B (zh) | 目标空间音频参数和相关联的空间音频播放的确定 | |
RU2533437C2 (ru) | Способ и устройство для кодирования и оптимальной реконструкции трехмерного акустического поля | |
JP5081838B2 (ja) | オーディオ符号化及び復号 | |
KR101341523B1 (ko) | 스테레오 신호들로부터 멀티 채널 오디오 신호들을생성하는 방법 | |
EP2805326B1 (en) | Spatial audio rendering and encoding | |
US8180062B2 (en) | Spatial sound zooming | |
TW201820898A (zh) | 用以再生空間分散聲音之方法 | |
GB2549532A (en) | Merging audio signals with spatial metadata | |
Kan et al. | Psychoacoustic evaluation of different methods for creating individualized, headphone-presented virtual auditory space from B-format room impulse responses | |
Epain et al. | D3. 3: Object-based capture |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110804 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110823 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111121 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120410 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120425 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150518 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4993227 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |