TW200845801A - Method and apparatus for conversion between multi-channel audio formats - Google Patents

Method and apparatus for conversion between multi-channel audio formats Download PDF

Info

Publication number
TW200845801A
TW200845801A TW097109731A TW97109731A TW200845801A TW 200845801 A TW200845801 A TW 200845801A TW 097109731 A TW097109731 A TW 097109731A TW 97109731 A TW97109731 A TW 97109731A TW 200845801 A TW200845801 A TW 200845801A
Authority
TW
Taiwan
Prior art keywords
channel
representation
audio signal
spatial audio
signal
Prior art date
Application number
TW097109731A
Other languages
English (en)
Other versions
TWI369909B (en
Inventor
Ville Pulkki
Juergen Herre
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW200845801A publication Critical patent/TW200845801A/zh
Application granted granted Critical
Publication of TWI369909B publication Critical patent/TWI369909B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems
    • H04H20/89Stereophonic broadcast systems using three or more audio channels, e.g. triphonic or quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)

Description

200845801 九、發明說明: 【發明所屬之技術領域】 本發明涉及-種關於如何以最高可能品質在不同的多 聲道音頻格式之間進行轉換的技術,而不限於特定的多聲 迢表不。即’本發明涉及一種允許在任意多聲道格式之間 5 進行轉換的技術。 【先前技術】 通常,在多琴道再現和收聽中,收聽者被多個揚聲器 壞繞。存在捕獲針對特定設置(set.up)的音·號的各種 10方法。再現中的一個通常目標是再現原始記錄的聲音事件 的空間合成,即,各個音頻源的源點(〇rigin),如管弦樂 隊内喇叭的位置。多個揚聲器設置是相當常見的,並且可 以產生不同的空間感。不使用特殊的後生產技術,通常已 知的兩聲道身歷聲設置可以僅在兩個揚聲器之間的線上重 I5建聽覺事件。這主要通過所謂的“振幅-移動(P麵ing),,來 實現,其中取決於音頻源相對於揚聲器的位置,與—個音 頻源相關的信號的振幅分佈在兩個揚聲器之間。這通常在 §己錄或後繽的混音期間進行。即,來自相對於收聽值置較 遠左侧的音頻源將主要通過左揚聲器再現,而在收聽位置 2〇前面的音頻源將通過這兩個揚聲器以相同的振幅(電平) 再現。然而,不能再現從其他方向發出的聲音。 因此,通過使用分佈在收聽者周圍的更多揚聲器,可 以覆蓋更多方向,並且可以產生更加自然的空間感。可处 J月b 最公知的多聲道揚聲器佈局是5·1標準(ITU-R775-1),其 5 200845801 包括5個揚聲器,將這些揚聲 預先確定為0。、±30。和±11〇。。這表_十,於收聽位置的方位角 將信號為狀縣魏置妓音期間’ 置的偏差將導致再現品質降低。▲‘準的再現設
ίο 15
也提出了具有彳嫌不同方向上 多個其他系統。專業和專用系統(t j數目的杨荦益的 中)也包括不同高度的揚聲器。-影院和聲音裝置 能约=來ί出了被稱為DirAc的通用音頻再現系統,其 錄鱗現針對任意揚鞋設置的聲音。的目 姓疋使用具有任意幾何設置的多聲道揚聲器系統,盡可能 月確地再現現有聲學環境的空間感。在記錄環境中,以全 向麥克風(w)和允許㈣聲音到達方向以及聲音擴散的 麥克風組來測量環境的回應(可以是連續記錄的聲音或脈 衝回應)。在以下段落中以及在本申請中,術語“擴散,,應 被理解為針對聲音的非方向性測量。即,以相等的強度從 所有方向到達收聽或記錄位置的聲音是最大擴散的。量化 擴散的通常方式是使用來自區間[0,···,1]的擴散值,其中, 值1描述了最大擴散聲音,而值0描述了理想定向聲音, 即僅從一個可清晰辨識的方向發出的聲音。一個通常已知 20的測量聲音到達的方向的方法是應用與笛卡爾坐標軸對齊 的3個八字(figure-of-eight)麥克風(ΧΥΖ)。已設計出被 稱作“聲場麥克風”的專用麥克風,該麥克風直接產生所 有期望的響應。然而,如以上所提及的’ W、X、Y和Z信 號也可以根據離散全向麥克風組進行計算。 6 200845801 任 近來,Goodwin和J〇t提 意多個聲道的音頻格式存儲至立H迎的方向賢料,將 聲道的方法。祕式可⑽—域兩個下混音 “一量(包括速度向應 向量是錄敎置指向Γ聲训㈣)。速度 權重是揚聲器的較時“的加/和’其中每個 能量向量是類似的加權:量 =')權處= ίο 15 20 的短時能量料,即如述了鑛平滑的 2度時間間_的信號中的信號能量的積 =的:這些向量共有的缺點是與實際的或感:的量; Γ:如:;支有,考慮揚聲器相對於彼此的相對相 將寬頻信號饋人相反相位的” 的身歷聲設置的揚聲器,則收聽者將感知到來^ 聲音,收聽位置中的聲場將具有從—側到另一 ]如,從左侧到右侧)的聲音能量振盪。在這種場景 I知向量將會指向前方’顯然這並不表示實際的ί ^自然地,市場上存在多個多聲道格式或表示,存在能 ί在=同表示之間轉換的需求,從而可以利用最初針對= 選的多聲道表示而開發的設置來再現各個表示。即例如, 可能需要5.1聲道與7·〗或7·2聲道之間的轉換,以使用現 有的7·1或7·2聲道重播設置來重播通常在DVD上使用的 5·1夕聲道表示。多種音頻格式使音頻内容生產變得困難, 7 200845801 因為所有格式需要特定的混頻 於不同再;η ⑽/傳輸格式。因此,用 需的。m的重播的不同記錄格式之間的轉換是必 頻袼種頻格式的音頻轉換為另-音 ;π’這些僅可應用於從-個特定的預ΐ=ΐ 至另—特定的多聲道表示的轉換。 夕聲運表不 通常’再現聲道數署的 ίο 15 (downmix ) » w, ^ f的減少(所謂“下混音 "wnmix ))比再現聲道數吾沾|、;丄,, (upmix),,)更易實現。钟科 、θ σ ( 上混音 例如m;糾卜些標準的揚聲器再現設置, 至再現二可使用較少個數的再現聲道下混音 主冉現叹置的推薦。在這些所謂的“lTir ::出出為輸入信號的簡單靜態線性:二:常: ^耳運數1的減少導致所感知的空間圖像的惡化,即空 間音頻信號的再現品質發生惡化。 為了從大量再現聲道或再現揚聲器中可能的獲益,開 發出用於型轉換的U音技術。通常研究的問題是 如=轉換2料綠聲音頻以使用$聲道環繞揚聲器系統 ^再現° ^種2 i 5上混音的—種方式S實現是使用所 明的矩陣解碼器。這種解碼器普遍用於通過身歷聲傳 輸結構(特別是早期的用於電影和家庭影院的環繞聲音) 來提供或上混音5.1多聲道聲音。基本思想是再現聲音圖像 前的身歷聲信號中同相的聲音分量,並將異相分量置入後 揚聲器。可選的2至5上混音方法提出提取身歷聲信號的 8 20 200845801 環境分量並經由5.1設置的後揚聲器再現這些分量。近來, C· Faller 在 “parametric Multi_channel Audio Coding : Synthesis of Coherence Cues,,,IEEE Trans· On Speech and
Audio Proc.v〇U4, ηο·ι,2〇〇6年i月中提出了遵循在更加合 理的基礎上使用數學上更好的實現的相同基本思想的方 式。
近來公開的標準mpeg環繞執行從一個或兩個下混音 和傳輸的聲道至用於再現或重播的最終聲道(通常是51) 的上混音。這通過使用空間邊資訊(side infbrmation)(與 10 BCC技術類似的邊資訊)或沒有邊資訊,或通過使用身歷 耸下混音的兩個聲道之間的相位關係(“非引導模式,,戈 “增強矩陣模式”)來實現。 、一 在前面的段落中描述的用於格式轉換的所有方法特別 15 應用於源和目的地音頻再現格式的特定配置,因而並不通 =即,不能執行任意的輸入多聲道表示至任意的輸出^ 聲道表示的轉換。即,現有的轉換技術專門針對輸入多^ 道音頻表示和輸出多聲道表示而關於揚聲器數量及 位置做出調整。 ’、月嘴 一自然地,期望有一種針對可應用於輸入和輪出多聲道 20表示的任意組合的多聲道轉換的概念。 墁 【發明内容】 根據本發明的一個實施例,一種用於將空間音頻信 的輸入多聲道表示轉換為不同的輸出多聲道表示的設傷2 9 200845801 括:分析器,用於導出空間音頻信號的中間表示,所述中 間表示具有指示㈣音頻信制科的源點方向的方向參 數;以及信號編排器(composer),用於使用空間音頻信號 的中間表示來產生空間音頻信號的輸出多聲道表示/ ° ;u 5 其中使用中間表示,該中間表示具有指示空間音頻信 號的部分的源點方向的方向參數,只要已知輪 '爾聲器配置,便可以實現任意的多聲道== 藝 換。重要的疋’注意不必提前(即在轉換設傷的設計期間) 知道輸出多聲道表示的揚聲器配置。由於轉換設備和方法 ίο是通用的,所以可以在接收侧改變提供作為輸入多聲道表 示並針對特定揚聲器設置而設計的多聲道表示,以適合可 用的再現设置’從而增強空間音頻信號再現的再現品質。 根據本發明的另一實施例,在不同頻帶内分析空間音 頻信號的部分的源點方向。這樣,針對空間音頻信號的有 15限寬度頻率部分,導出不同的方向參數。例如,為了導出 • 有限寬度頻率部分,可以使用濾波器組或傅立葉變換。根 據另一實施例,選擇針對其分別執行分析的頻率部分或頻 帶,以匹配人類聽覺處理的頻率解析度。這些實施例可以 具有以下優點:與人類聽覺系統本身可以確定音頻信號的 2〇源點方向一樣好地執行空間音頻信號的部分的源點方向。 因此’當重構這種被分析的號教經由任意揚聲器設置重 播時’所執行的分析在確定音頻物件或信號部分5源點的 過程中不存在潛在的精度損失。 根據本發明的另一實施例,另外導出屬於中間表示的 200845801 -個或更多個下混音聲道。,從與和輪人多聲道表 關聯的揚聲n相對應的音解道巾導出下混音聲道H 將該二混聲道餘產生_乡聲道麵或料產生與=輸 出多聲道表示相關聯的揚聲器相對應的音頻聲道。 別 5
10
时例如,可以從普通5.1聲道音頻信號的51輸入聲道中 生單聲道下混音聲道。例如,這可以通過計算所有單獨音 頻聲道之和來執行。基於這個導出的單聲道下混音聲道: 仏號編排器可以將與所分析的輸入多聲道表示的部分相對 應的單聲道下混音聲道的該部分分發給由方向參數指亍的 輸出多聲道表示的聲道。即,將所分析的來自空間音頻信 號較遠左侧的頻率/時間或信號部分重新分發給輸出多聲^ 表示的揚聲器,該揚聲器位於相對於收聽位置的左側。耳k通常,本發明的一些實施例允許以如下方式來分發空 間音頻信號的部分:針對與更靠近所述方向參數所指 方向的揚聲器相對應的聲道,以及更遠離該方向的^道,、 月者的信號分發強度大於後者的信號分發強度。即,無論 在輸出多聲道表示中如何定義用於再現的揚聲器的位置, 也會盡可能好地實現適合可用的再現設置的空間重新分 發0 根據本發明的一些實施例,可以利用其確定空間音頻 信號的部分的源點方向的空間解析度比與輸入多聲道表示 的單個揚聲器相關聯的三維空間角大得多。即,可以利用 比通過將音頻聲道簡單地從一個獨特的設置重新分發至另 一特定設置(如通過將5.1設置的聲道重新分發給71或72 200845801 置)而實現的空間解析度更高的精度來導出空間音頻 的部分的源點方向。 Λ σ
士/L 叹 號 總之,本發明的一些實施例允許用於格式轉換的增強 方法的應用,該方法是通用的,並且不依賴於特定的期望 5目裇揚擎器佈局/配置。一些實施例通過提取方向參數(與 DirAC類似),然後將該參數用於合成具有N2個聲道的輪出 k唬,而把具有N1個聲道的輸入多聲道音頻格式(表示) 轉換為具有N2個聲道的輸出多聲道格式(表示此外,根 據一些實施例,根據N1個輸入信號(與根據輸入多聲道^ 10示的揚聲器相對應的音頻聲道)計算N0個下混音聲道,然 後將該N0個下混音聲道用作使用所提取的方向參數進行解 碼處理的基礎。 【實施方式】 15 以下將參照附圖對本發明的多個實施例進行描述。 本發明的一些實施例導出了空間音頻信號的中間表 示’所述空間音頻信號具有指示空間音頻信號的部分的源 點方向的方向參數。一種可能是導出指示空間音頻信號的 部分的源點方向的速度向量。將參照第一圖,在以下段落 20 中描述這樣做的一個示例。 在細述概念之前,應注意’可以將以下分析同時應用 於下層(underlying)空間音頻信號的多個單獨的頻率或時 間部分。然而為了簡單起見,將僅針對一個特定頻率或時 間或時間/頻率部分來描述該分析。該分析基於在位於坐標 12 200845801 系中心的記錄位置2處記錄的聲場的能量分析,如第一圖所 示0 該坐標系是笛卡爾坐標系,具有彼此垂直的乂軸4和7軸 6。使用右手系,第一圖中未示出的z軸指向從綠圖平面伸 5 出的方向。 針對方向分析,假設記錄了 4個信號(被稱為6格式信 號)。記錄一個全向信號w,即以(理想上)相等的靈敏度 接收來自所有方向的信號的信號。此外,記錄三個^向信 號X、Y和Z,它們具有沿笛卡爾坐標系的軸向指示的靈敏 1〇度分佈。第一圖中給出了所使用的麥克風的可能的靈敏度 圖案的示例,示出了兩個八字”圖案8a和8b,指向軸向。 另外在第一圖所示坐標系的二維投影中示出了兩個可能的 音頻源10和12。 對於方向分析,通過(1)式,針對不同頻率部分(由 15索引i來描述)編排瞬時速度向量(在時間索引!!處)。 v(n,i)=X(n,i) ex +Y(n,i) ey +Z(n,i) ez ⑴ 即,所產生的向量具有與坐標系軸相關聯的麥克風的 單獨記錄的麥克風信號作為分量。在上文和下文的等'、 中,通過兩個索引(n,i)以時間(n)和頻率(i)對量^ 2〇行索引化。即, '進 ex,ey和62表示笛卡爾單位向量。 使用同時記錄的全向信號w,將暫態強度I計算為 I(n,i) =w(n,i)v(n,i) ⑵ 根據以下公式導出暫態能量: 200845801 E(n,i)=w2(n,i)+||Y||2(nji) (3) 其中III丨表示向量範數。 处即,導出允許兩個信號間的可能干擾的強度量(由於 可此出現正和負的振幅)。另外,導出能量,該能量自鈇不 允許兩個信號間的干擾,因為能量不包含允許信號抵消的 負值。 有利地’可以使用強度和能量信號的這些特性來導出 具有冋精度的信號部分的源點方向,如以下將要解釋的, 保邊曰頻聲道的虛擬(virtual)相關(聲道間的相對相位)。 一方面’可以將暫態強度向量用作指示空間音頻信號 的。卩刀的源點方向的向量。然而,該向量可能經受快速改 麦,因而在信號再現中產生偽信號(artifact)。因此可選地, 可以根據以下公式,使用利用漢寧窗(Hanning window) W2的短時平均來計算暫態方向: = ~ J/(n.埘萬㈣, f 2 ( 4 ) 其中,W2是用於短時平均D的漢寧窗。 即可選地,可以導出具有指示空間音頻信號的源點方 向的參數的短時平均方向向量。 可選地,可以如下計算擴散測量值 —Λ一 ⑽ ' (5) 其中,WKm)是在-Μ/2與Μ/2之間定義的用於短時平均 的窗函數。 200845801 應再次注意,如此執行導出,從而保留音頻聲道的虛 擬相關。即,適當每慮相位資訊,這並不是針對僅基於能 量估計的方向估計的情況(例如Gerzon向量)。
10
20 以下簡單示例將用於對此進行更加詳細的解釋。考慮 通過身歷聲系統的兩個揚聲器重播的理想擴散信號。因為 "ί吕號是擴散的(源自所有方向),所以通過兩個揚聲器以相 等的強度進行重播。然而,因為感知應是擴散的,所以需 要180度的相移。在這種場景下,單純基於能量的方向估= 將產生恰好指向兩個揚聲器之間的中點位置的方向向量°, 這必定是未反映現實的不期望的結果。 根據上述本發明的概念,保留音頻聲道的虛 ,,方向參數(方向向量)。在該特定示例中,^向 =將,疋零’指不聲音並不源自—個獨特的方向 廷不是現實中的情況。相應地 ;疋 理想地匹配了真實情況。核⑸的擴办數是卜 長度此外’以上#式中的漢寧窗可針料_帶具有不同 出指===部:==:個_ ’導 可以導出―空間音頻/數執行分析。可選地, 數。如上所述,根據ϋ的^分的方向擴散的擴散參 散信號,即《相梅源自财值描述了最大擴 相反,小擴散值屬於主要源自一個=的信號部分。 200845801 5 10 15 第一圖示出了根據ITU-775-1,從具有五個聲道的輸入 多?還表不巾導出方向參數的糊。首先,通過仿真相應 多聲道音頻設置的無回聲記錄,將多聲道輸人音頻信號 (即輸入夕聲道表示)變換為B格式。相對於具有\軸22 和y軸24的笛卡爾坐標系的中心2〇,右後侧的揚聲器%位於 11〇j角處。右前側揚聲器28位於+30。,中心揚聲器位於〇。, ^側揚聲器32位於_31。,而左後側揚聲器34位於_11〇。。 κ 乂中可以通過應用簡單的矩陣化操作來仿真無回聲記 錄,,入多聲道表示的幾何設置是已知的。 一可以通過採用對所有揚聲器信號(即同與輸入多聲道 聯的揚聲器相對應的所有音頻聲道)的直接求和 負二二全向信號…。通過把由揚聲器和相應笛卡爾軸之間夾 口矛、,而加權的揚聲器信號相加,即要仿真的偶極子麥 X Υ的表大重敏度方向,可以形成偶極子或“八字,,信號 以是指向第η揚聲器的2維或3維笛卡爾向量, 向量。^指向與偶極子麥克風相對應的笛卡爾軸向的單位 八焉作 ^%C^cos(angle(Ln,V)), 夾角示第n聲道的揚聲器信號’岐聲道數。術語 角。即二為操作符’計算兩個給定向量之間的空間夾 揚藏笑^1如在第二圖所示的二維情況下的¥軸24和左前侧 杨聲砂之_夾㈣⑼。 ⑴側 例 ,可以如第一圖所示並如相應描述來執行方向來 20 200845801 數的其他導出,即,音頻信號X、Y和Z可以根據人類聽覺 系統的頻率解析度來分為多個頻帶。依據每個頻率聲道中 的時間,對聲音的方向(即空間音頻信號的部分的源點方 向)以及(可選的)擴散進行分析。可選地,也可以使用 5不同於擴散的信號相異性的另一測量來替換聲音擴散,例 如與空間音頻信號相關聯的(身歷聲)聲道之間的相干性。 作為簡化示例,如果如第二圖所指示存在一個音頻源 44 ’其中該源僅對特定頻帶内的信號有貢獻,則將導出指 向該音頻源44的方向向量46。通過指示源自音頻源44的空 10間音頻信號的部分的方向的方向參數(向量分量)來表示 方向向量。在第二圖的再現設置中,該信號將主要通過如 由14該%聲器相關聯的符號波形所示的左前側的揚聲哭η 來再現。然而,也將從左後側揚聲器32對較小信號部分進 行f播。因此,與X座標22相關聯的麥克風的方向信號將從 15左丽側聲道32 (與左前侧揚聲器32相關聯的音 左後侧聲道34接收信號分量。 根據上述實施方式’與3^軸相關聯的方向信號γ也將接 收由左前侧揚聲器32所重播的信號部分,基於方向信號χ 和γ的方向分析將能夠以高精度重構來自方向向量46的“聲 20音。 為了最終轉換油望❹聲道表示(多聲道格式),使 用指不音頻信號的部分的源點方向的方向參數。可選地, 可以使用-個或更多個⑽)附加音頻下混音聲道。例如, 該下混音聲道可以是全向聲㈣或任何其他單聲道。然 17 200845801
ίο 而針對工間分佈,僅使用與中間表示相關聯的單個聲道 具有小的負面影響。即,只要導出方向參數或方向資料, 並且可以將’用於重構或產生輸出多聲道表示,便可以 使用諸如S歷聲現頻之類的若干個下混音聲道 、聲道w、x # 丫或,式的所有聲道。可選地,也可以直接使用第二圖 :的5们:道或與輸入多聲道表示相關聯的聲道的任意組 口作為可能的下混音聲道的替換。當僅存儲一個聲道時, 可犯,擴散耸音的再現中出現品質惡化。 f一圖不出了使用明顯不同於第二圖的揚聲器設置來 ^現曰頻源44的信號的示例,第二圖的揚聲ϋ設置是從中 導=參數的輪人多聲道表示。作為示例,第三圖示出了沿 收&位置60兩的直線同等分佈的六個揚聲器5Oa至5 Of,如第 15
20 所介紹的,該收聽位置60定義了具有X軸22和y軸24的 坐^系的中心。由於前面的分析提供了描述指向音頻信號 |原44的方向向量46的方向的方向參數,所以可以容易地通 過把要再現的空間音頻信號的部分重新分發到靠近音頻源 4=^向的揚聲器,即通過靠近那些由方向參數所指方向的 ^聲斋’來導出適於第三圖的揚聲器設置的輸出多聲道表 不。即’相對於與遠離方向參數所指示的方向的揚聲器相 董子應的音頻聲道,強化與該方向的揚聲器相對應的音頻聲 逼。即’可以操作揚聲器50&和501)(例如使用振幅移動) =再現信號部分,揚聲器50c至50f不會再現該特定信號部 刀’而是可以將它們用於再現擴散聲音或具有不同頻帶的 其他信號部分。 18 200845801 5
10 15 表示的信產生5間音頻信號的輸出多聲道 有N2個輸^聲道望^將中間信號解碼為具 分析所吝斗w 逼輸出格式。典型地,在盥 刀析所產生的音頻下混音聲道 牡,、 該音頻下料聲私錄進行中對 的方式執行解碼。在可㈣^#Dll:AC類似 m於本了廷的擴散奪音的再現中,典型地, 用=非擴散流的音頻是可選咖個 一或其線性組合。 耳^口现I 選㈣散流創建,存在若干個綜合選項,以根 琴這表示來創建與揚聲器相對應的輸出信號或輸 耳^、擴散部分。如果僅存在—個下混音聲道的傳輸, 使^該晕2^來為每個揚聲器創建非擴散信號。如果 子 夕耸道的傳輸,則存在如何創建擴散聲音的更多選 項、。例如,如果在轉換過程中使用身歷聲下混音,則明顯 合適的方法是將左下混音聲道應用至左侧的揚聲器,並將
^下此曰聲道應用至右侧的揚聲器。如果使用若干下混音 聲,進行轉換(即,N〇>1),則可以將每個揚聲器的擴散流 計异為這些下混音聲道的不同加權的和。例如,一種可能 可以疋傳輸B格式信號(如先前所描述的聲道X、γ、Z和W) 2〇並计异每個揚聲器的虛擬心形麥克風信號的信號。 下文以列表描述了將輸入多聲道表示轉換為輸出多聲 道表示的可能過程。在本示例中,以仿真的B格式麥克風來 記錄聲音,然後由信號編排器進行進一步處理,以便以多 耸道或單聲道揚聲器設置進行收聽或重播。參照示出5·1聲 19 200845801 道輸入多聲道表示至8聲道輸出多聲道表示的轉換的第四 圖來解釋單個步驟。基礎是N1聲道音頻格式(Nl在特定示 例中是5)。為了將輸入多聲道表示轉換為不同的輸出多聲 道表示,可執行以下步驟。 5 丨.如在記錄部分70中所示出的,仿真具有N1個音頻聲 這(5個聲道)的任意多聲道音頻表示的無回聲記錄(使用 佈局中心72處的仿真的B格式麥克風)。 2.在分析步驟7钟,仿真的麥克聰餘分至頻帶, 並在方向分析步驟%中,導出仿真的麥克風信號的部分的 10源點方向。糾可祕,可財織終止步驟财 散(或相干性)。 κ 如先前所提及的,可以不使用式中間步驟來執行方 向分析。通常必須基於輸人多聲道表示來導出 15
頻信號的"麵’其巾,财間表轉有指衫間音二 仏號的部分的源點方向的方向參數。 、 3.在下混音步獅中,導_個下混音音頻信號,用 作輸出多聲運表示的轉換/創建的基礎。在合成步驟82中, 對Ν0個下衫音頻錢騎解科㈣適合的綜合方法 (例如’使用振幅移動或㈣的適合技術)上混音 N2個音頻聲道的任意揚聲器設置。 可以通過夕聲這揚聲器系統(例如,具有在第四 重播場景财指示的_揚鞋)再職絲。然而,由於 概念的通用性’也可以針對單聲道揚聲器設置執行轉換,、 提供了仿偶—個單方向麥克風記錄空間音頻信號的效 20 20 200845801 果0 第五圖示出了用於在多聲道音頻格式之間轉換的設備 100的示例的原理草圖。 設備100用於接收輸入多聲道表示102。 5 設備1⑻包括用於導出空間音頻信號的中間表示106的 分析器104,中間表示1〇6具有指示空間音頻信號的部分的 源點方向的方向參數。 此外,設備100包括信號編排器108,用於使用空間音 頻信號的中間表示(106)產生空間音頻信號的輸出多聲道 10 表示110。 總之 •趣優 15 无丽描述的轉換設備和轉換方法的實施例提供 了一些優點。首先,實際上可以以這種方式對任何輸入音 ,格式進行處理。此外,職過料以產生針對任何揚聲 為佈局(包括非標準揚聲器佈局遞置)的輸出,而不需 =對輸入揚聲器佈局/配置和輸出揚聲器佈局/配置 二特別,整新的_。此外,音頻再現的空間解析度在揚 弇為數1增加時增加,這與現有實現相反。 依據本發明方法的特定實 來實現本發_枝。可以使用 3公硬體或軟體 而執行本發明方法的數位存儲介質3=協作從 可讀控制錢的盤、dvd%d)um疋其上存儲有電 執行本發明的方法 ,具有存儲在機器可讀載體上通常 產品:式碼操作 程式產二: 換…因而本發明的方法是具有程 20 200845801 式碼的電腦程式,用於當電腦程式在電腦上運行時執行本 發明方法中的至少一種。 儘管已經參照特定實施例特別示出並描述了以上内 容,但是本領域技術人員將會理解,可以在不偏離本發明 5 的精神和範圍的情況下做出形式和細節上的各種其他改 變。應理解,可以在適合於不同實施例的過程中做出各種 改變,而不會偏離這裏所公開的、並由所附申請專利範圍 所限定的更寬的概念。
22 200845801 【圖式簡單說明】 第一圖示出了導出指示了音頻信號的部分的源點方向 的方向參數的圖示; 第二圖示出了基於5.1聲道表示而導出方向參數的另 5 一實施例; 第三圖示出了產生輸出多聲道表示的示例; 第四圖示出了從5.1聲道設置到8·1聲道設置的音頻轉 換的示例;以及 第五圖示出了用於多聲道音頻格式之間的轉換的本發 10 明的設備示例。
23 200845801 【主要元件符號說明】 記錄位置2 X軸4 y軸6 八字圖案8a、8b 音頻源10、12 中心20 X軸22 y軸24 5 右後侧揚聲器26 右前侧揚聲器28 左前側揚聲器32 左後侧揚聲器34 爽角40 音頻源44 方向向量46 揚聲器50a-50f 收聽位置60 10 記錄部分70 佈局中心72 分析步驟74 方向分析步驟76 擴散終止步驟78 下混音步驟80 合成步驟82 重播場景84 設備100 輸入多聲道表示102 分析器104 中間表示106 信號編排器108 15 輸出多聲道表示110
24

Claims (1)

  1. 200845801 、申請專利範圍: ^ . 户声之,蓄表系轉換為 1、 一種用於將空間音頻信號的輸入夕耳l 不同的輸出多聲道表示的設備,包括: ',所述中 分析器,用於導出空間音頻信號的中間表:的方甸參 間表示具有指示空間音頻信號的部分的源點方向 數,以及 ,以中間表示 信號編排器,用於使用空間音頻信號的戶i 來產生空間音頻信號的輸出多聲道表系。 矣中戶斤述分 2、 依據申請專利範圍第1項所述的設備,二的音頻聲 析為操作用於依據與所述輸入多聲道表示相關, ίο 15 道的虛擬相關來導出方向參數。 中所述分 3、 依據申請專利範圍第1項所述的汉備1、相關聯的 析器操作用於導出保留了與所述輸入多聲道表济 音頻聲道的相對相位資訊的方向參數。 |中所述分 4、 依據申請專利範圍第1項所述的設備’其率部分 析器操作用於導出針對空間音頻信號的有限1度雜^ 的不同的方向參數。 斤述分 5、 依據申請專利範圍第1項所述的設備,其二分 析器操作用於導出針對空間音頻信號的有限長度時~ 的不同的方向參數。 述分 6、 依據申請專利範圍第4項所述的設備,其中f俨號 析器操作用於導出針對與頻率部分相關聯的空間音頻音頻 的有限長度時間部分的不同的方向參數,其中與突間同於 信號的第一頻率部分相關聯的第一時間部分的長度^問部 與空間音娜號的第二不同頻率部分相關聯的第二^ 25 20 200845801 分的長度。 7、依據申請專利範圍第1項所述的設備,其中所述分 析器操作用於導出方向參數,所述方向參數描述指向空間 音頻"^號的部分的源點方向的向量。 5 8、依據申請專利範圍第1項所述的設備,其中所述分 析器還操作用於導出與中間表示相關聯的一個或更多個音 頻聲道。 9、 依據申請專利範圍第8項所述的設備’其中所述分 析裔操作用於導出與和輸入多聲道表示相關聯的揚聲器相 10 對應的音頻聲道。 10、 依據申請專利範圍第8項所述的設備,其中所述 分析為操作用於導出一個下混音聲道,作為與和輸入多聲 道表示相關聯的揚聲器相對應的音頻聲道之和。 11、 依據申請專利範圍第8項所述的設備’其中所述 15 分析器操作用於導出與笛卡爾坐標系的軸向相關聯的至少 個音頻聋'道。 12、 依據申請專利範圍第n項所述的設備,其中所述 分析器操作用於導出至少一個音頻聲道,所述至少一個音 頻聲道構建了與和輸入多聲道表示相關聯的揚聲器相對應 20的音頻聲道的加權和。 13、 依據申請專利範圍第U頊所述的設備,其中操作 所述分析器,使得能夠根據以下公式,通過與和輸入多聲 遒表示相關聯、並指向方向Cn的所有η個揚聲器相對應的 II個音頻聲道Cn的組合,來導出與笛卡爾坐標系的軸向V 26 200845801 相關聯的至少一個音頻聲道X · X=tCn,C〇S(,le(Ln,V))。 14、 依據申請專利範圍第丨項所述的設備,其中所述 分析器還操作用於導出擴散參數,所述擴散參數指示空間 5音頻信號的部分的源點方向的擴散。 15、 依據申請專利範圍第丨項所述的設備,其中所述 信號編排器操作用於將空間音頻信號的部分分發到與和輸 出多聲道表示相關聯的多個揚聲器相對應的多個聲道。 16、 依據申請專利範圍第15項所述的設備,其中操作 10所述信號編排器,使得以如下方式來分發空間音頻信號的 部分·針對與更靠近所述方向參數所指示的方向的揚聲器 相對應的聲道,其信號分發強度大於與和更遠離該方向的 揚聲器相對應的聲道的信號分發強度。 17、 依據申請專利範圍第14項所述的設備,其中操作 15所述信號編排器、,使得在所述擴散參數指示較高擴散時, 與所述擴散參數指示較低擴散時相比較,以更加均勻的強 度向與和所述輸出多聲道表示相關聯的揚聲器相對應的聲 道分發空間音頻信號的部分。 18、 依據申請專利範圍第1項所述的設備,還包括: 20 輪入介面,用於接收輸入多聲道表示。 19、 依據申請專利範圍第1項所述的設備,還包括·· 輪入表示解碼器,用於導出與和輸入多聲道表示相關 聯的所有揚聲器相對應的多個音頻聲道。 20、依據申請專利範圍第15項所述的設備,其中所述 27 200845801 信號編排器還包括輸出聲道編碼器,所述輸出聲道編碼器 用於基於與和輸出聲道表示相關聯的揚聲器相對應的音頻 聲道,導出輸出多聲道表示。 21、 依據申請專利範圍第1項所述的設備,還包括用 5 於提供輸出多聲道表示的輸出介面。 22、 一種用於將空間音頻信號的輸入多聲道表示轉換 為不同的輸出多聲道表示的方法,所述方法包括: 導出空間音頻信號的中間表示,所述中間表示具有指 示空間音頻信號的部分的源點方向的方向參數;以及 10 使用空間音頻信號的中間表示來產生空間音頻信號的 輸出多聲道表示。 .23、一種電腦程式,用於在電腦上運行時,實現用於 將空間音頻信號的輸入多聲道表示轉換為不同的輸出多聲 道表示的方法,所述方法包括: 15 導出空間音頻信號的中間表示,所述中間表示具有指 示空間音頻信號的部分的源點方向的方向參數;以及 使用空間音頻信號的中間表示來產生空間音頻信號的 輸出多聲道表示。 28
TW097109731A 2007-03-21 2008-03-19 Method and apparatus for conversion between multi-channel audio formats TWI369909B (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US89618407P 2007-03-21 2007-03-21
US11/742,502 US8290167B2 (en) 2007-03-21 2007-04-30 Method and apparatus for conversion between multi-channel audio formats

Publications (2)

Publication Number Publication Date
TW200845801A true TW200845801A (en) 2008-11-16
TWI369909B TWI369909B (en) 2012-08-01

Family

ID=39313182

Family Applications (1)

Application Number Title Priority Date Filing Date
TW097109731A TWI369909B (en) 2007-03-21 2008-03-19 Method and apparatus for conversion between multi-channel audio formats

Country Status (9)

Country Link
US (1) US8290167B2 (zh)
EP (1) EP2130204A1 (zh)
JP (1) JP4993227B2 (zh)
KR (1) KR101195980B1 (zh)
CN (1) CN101669167A (zh)
BR (1) BRPI0808217B1 (zh)
RU (1) RU2449385C2 (zh)
TW (1) TWI369909B (zh)
WO (1) WO2008113428A1 (zh)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007083739A1 (ja) * 2006-01-19 2007-07-26 Nippon Hoso Kyokai 3次元音響パンニング装置
US9014377B2 (en) * 2006-05-17 2015-04-21 Creative Technology Ltd Multichannel surround format conversion and generalized upmix
US9015051B2 (en) * 2007-03-21 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reconstruction of audio channels with direction parameters indicating direction of origin
US8908873B2 (en) * 2007-03-21 2014-12-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US8180062B2 (en) * 2007-05-30 2012-05-15 Nokia Corporation Spatial sound zooming
JP2011519528A (ja) * 2008-04-21 2011-07-07 スナップ ネットワークス インコーポレーテッド スピーカー用電気システムとその制御装置
CN102084418B (zh) * 2008-07-01 2013-03-06 诺基亚公司 用于调整多通道音频信号的空间线索信息的设备和方法
EP2205007B1 (en) * 2008-12-30 2019-01-09 Dolby International AB Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction
JP5400225B2 (ja) * 2009-10-05 2014-01-29 ハーマン インターナショナル インダストリーズ インコーポレイテッド オーディオ信号の空間的抽出のためのシステム
EP2346028A1 (en) * 2009-12-17 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal
CA2790956C (en) * 2010-02-24 2017-01-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for generating an enhanced downmix signal, method for generating an enhanced downmix signal and computer program
CN102823277B (zh) 2010-03-26 2015-07-15 汤姆森特许公司 解码用于音频回放的音频声场表示的方法和装置
EP2375779A3 (en) 2010-03-31 2012-01-18 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for measuring a plurality of loudspeakers and microphone array
KR20120004909A (ko) 2010-07-07 2012-01-13 삼성전자주식회사 입체 음향 재생 방법 및 장치
WO2012025580A1 (en) 2010-08-27 2012-03-01 Sonicemotion Ag Method and device for enhanced sound field reproduction of spatially encoded audio input signals
JP5567997B2 (ja) * 2010-12-07 2014-08-06 日本放送協会 音響信号比較装置およびそのプログラム
KR101871234B1 (ko) 2012-01-02 2018-08-02 삼성전자주식회사 사운드 파노라마 생성 장치 및 방법
CN104054126B (zh) * 2012-01-19 2017-03-29 皇家飞利浦有限公司 空间音频渲染和编码
CN103379424B (zh) * 2012-04-24 2016-08-10 华为技术有限公司 一种混音方法及多点控制服务器
EP2733964A1 (en) * 2012-11-15 2014-05-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Segment-wise adjustment of spatial audio signal to different playback loudspeaker setup
SG11201504368VA (en) 2012-12-04 2015-07-30 Samsung Electronics Co Ltd Audio providing apparatus and audio providing method
BR112015025092B1 (pt) * 2013-04-05 2022-01-11 Dolby International Ab Sistema de processamento de áudio e método para processar um fluxo de bits de áudio
BR122021009022B1 (pt) 2013-04-05 2022-08-16 Dolby International Ab Método de decodificação para decodificar dois sinais de áudio, mídia legível por computador, e decodificador para decodificar dois sinais de áudio
US9892737B2 (en) 2013-05-24 2018-02-13 Dolby International Ab Efficient coding of audio scenes comprising audio objects
CN110085240B (zh) 2013-05-24 2023-05-23 杜比国际公司 包括音频对象的音频场景的高效编码
US9769586B2 (en) 2013-05-29 2017-09-19 Qualcomm Incorporated Performing order reduction with respect to higher order ambisonic coefficients
EP2814027B1 (en) 2013-06-11 2016-08-10 Harman Becker Automotive Systems GmbH Directional audio coding conversion
EP2830335A3 (en) * 2013-07-22 2015-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method, and computer program for mapping first and second input channels to at least one output channel
EP3293734B1 (en) * 2013-09-12 2019-05-15 Dolby International AB Decoding of multichannel audio content
EP3056025B1 (en) * 2013-10-07 2018-04-25 Dolby Laboratories Licensing Corporation Spatial audio processing system and method
WO2015150384A1 (en) 2014-04-01 2015-10-08 Dolby International Ab Efficient coding of audio scenes comprising audio objects
US9852737B2 (en) * 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
CN105657633A (zh) 2014-09-04 2016-06-08 杜比实验室特许公司 生成针对音频对象的元数据
US9774974B2 (en) * 2014-09-24 2017-09-26 Electronics And Telecommunications Research Institute Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion
US9913061B1 (en) 2016-08-29 2018-03-06 The Directv Group, Inc. Methods and systems for rendering binaural audio content
EP3297298B1 (en) * 2016-09-19 2020-05-06 A-Volute Method for reproducing spatially distributed sounds
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
CA3219540A1 (en) * 2017-10-04 2019-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to dirac based spatial audio coding
SG11202004430YA (en) * 2017-11-17 2020-06-29 Fraunhofer Ges Forschung Apparatus and method for encoding or decoding directional audio coding parameters using different time/frequency resolutions
WO2020016685A1 (en) * 2018-07-18 2020-01-23 Sphereo Sound Ltd. Detection of audio panning and synthesis of 3d audio from limited-channel surround sound
WO2022164229A1 (ko) * 2021-01-27 2022-08-04 삼성전자 주식회사 오디오 처리 장치 및 방법

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5208860A (en) * 1988-09-02 1993-05-04 Qsound Ltd. Sound imaging method and apparatus
BG60225B2 (en) 1988-09-02 1993-12-30 Q Sound Ltd Method and device for sound image formation
WO1992012607A1 (en) * 1991-01-08 1992-07-23 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
GB9103207D0 (en) 1991-02-15 1991-04-03 Gerzon Michael A Stereophonic sound reproduction system
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
JPH07222299A (ja) 1994-01-31 1995-08-18 Matsushita Electric Ind Co Ltd 音像移動処理編集装置
US5850453A (en) * 1995-07-28 1998-12-15 Srs Labs, Inc. Acoustic correction apparatus
FR2738099B1 (fr) * 1995-08-25 1997-10-24 France Telecom Procede de simulation de la qualite acoustique d'une salle et processeur audio-numerique associe
US5870484A (en) * 1995-09-05 1999-02-09 Greenberger; Hal Loudspeaker array with signal dependent radiation pattern
JP4132109B2 (ja) 1995-10-26 2008-08-13 ソニー株式会社 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置
US6697491B1 (en) * 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
JP3594281B2 (ja) 1997-04-30 2004-11-24 株式会社河合楽器製作所 ステレオ拡大装置及び音場拡大装置
AU735333B2 (en) * 1997-06-17 2001-07-05 British Telecommunications Public Limited Company Reproduction of spatialised audio
US5890125A (en) 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
FI116990B (fi) 1997-10-20 2006-04-28 Nokia Oyj Menetelmä ja järjestelmä akustisen virtuaaliympäristön käsittelemiseksi
AUPP272598A0 (en) * 1998-03-31 1998-04-23 Lake Dsp Pty Limited Wavelet conversion of 3-d audio signals
EP1275272B1 (en) 2000-04-19 2012-11-21 SNK Tech Investment L.L.C. Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics in three dimensions
US7110953B1 (en) 2000-06-02 2006-09-19 Agere Systems Inc. Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction
EP2299735B1 (en) 2000-07-19 2014-04-23 Koninklijke Philips N.V. Multi-channel stereo-converter for deriving a stereo surround and/or audio center signal
EP1184676B1 (en) * 2000-09-02 2004-05-06 Nokia Corporation System and method for processing a signal being emitted from a target signal source into a noisy environment
WO2002078388A2 (en) * 2001-03-27 2002-10-03 1... Limited Method and apparatus to create a sound field
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP3810004B2 (ja) 2002-03-15 2006-08-16 日本電信電話株式会社 ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム
TWI236307B (en) 2002-08-23 2005-07-11 Via Tech Inc Method for realizing virtual multi-channel output by spectrum analysis
FI118247B (fi) 2003-02-26 2007-08-31 Fraunhofer Ges Forschung Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa
SE0400997D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
US7818077B2 (en) 2004-05-06 2010-10-19 Valve Corporation Encoding spatial data in a multi-channel sound file for an object in a virtual environment
AU2004320207A1 (en) 2004-05-25 2005-12-08 Huonlabs Pty Ltd Audio apparatus and method
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
WO2006003813A1 (ja) 2004-07-02 2006-01-12 Matsushita Electric Industrial Co., Ltd. オーディオ符号化及び復号化装置
ES2333137T3 (es) 2004-07-14 2010-02-17 Koninklijke Philips Electronics N.V. Conversion de canal de audio.
US7720232B2 (en) * 2004-10-15 2010-05-18 Lifesize Communications, Inc. Speakerphone
US7853022B2 (en) * 2004-10-28 2010-12-14 Thompson Jeffrey K Audio spatial environment engine
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
US8873768B2 (en) 2004-12-23 2014-10-28 Motorola Mobility Llc Method and apparatus for audio signal enhancement
JP4804014B2 (ja) 2005-02-23 2011-10-26 沖電気工業株式会社 音声会議装置
JP4295798B2 (ja) * 2005-06-21 2009-07-15 独立行政法人科学技術振興機構 ミキシング装置及び方法並びにプログラム
EP1761110A1 (en) 2005-09-02 2007-03-07 Ecole Polytechnique Fédérale de Lausanne Method to generate multi-channel audio signals from stereo signals
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues

Also Published As

Publication number Publication date
US20080232616A1 (en) 2008-09-25
EP2130204A1 (en) 2009-12-09
BRPI0808217A2 (pt) 2014-07-01
RU2009134474A (ru) 2011-04-27
TWI369909B (en) 2012-08-01
RU2449385C2 (ru) 2012-04-27
CN101669167A (zh) 2010-03-10
JP4993227B2 (ja) 2012-08-08
US8290167B2 (en) 2012-10-16
KR20090117897A (ko) 2009-11-13
JP2010521910A (ja) 2010-06-24
KR101195980B1 (ko) 2012-10-30
WO2008113428A1 (en) 2008-09-25
BRPI0808217B1 (pt) 2021-04-06

Similar Documents

Publication Publication Date Title
TW200845801A (en) Method and apparatus for conversion between multi-channel audio formats
US10820134B2 (en) Near-field binaural rendering
US10609503B2 (en) Ambisonic depth extraction
US10536793B2 (en) Method for reproducing spatially distributed sounds
US8908873B2 (en) Method and apparatus for conversion between multi-channel audio formats
US9552819B2 (en) Multiplet-based matrix mixing for high-channel count multichannel audio
RU2533437C2 (ru) Способ и устройство для кодирования и оптимальной реконструкции трехмерного акустического поля
JP5081838B2 (ja) オーディオ符号化及び復号
CN101263741B (zh) 产生和处理表示hrtf的参数的方法和设备
GB2549532A (en) Merging audio signals with spatial metadata
KR100763919B1 (ko) 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2 채널의 바이노럴 신호로 복호화하는 방법 및 장치
TW201325268A (zh) 虛擬實境音源定位裝置
Tomasetti et al. Latency of spatial audio plugins: a comparative study
Keyes The Dynamic Redistribution of Spectral Energies for Upmixing and Re-Animation of Recorded Audio
Kan et al. Psychoacoustic evaluation of different methods for creating individualized, headphone-presented virtual auditory space from B-format room impulse responses