TWI673707B - 將以L<sub>1</sub>個頻道為基礎之輸入聲音訊號產生至L<sub>2</sub>個揚聲器頻道之方法及裝置,以及得到一能量保留混音矩陣之方法及裝置,用以將以輸入頻道為基礎之聲音訊號混音以用於L<sub>1</sub>個聲音頻道至L<sub>2</sub>個揚聲器頻道 - Google Patents

將以L<sub>1</sub>個頻道為基礎之輸入聲音訊號產生至L<sub>2</sub>個揚聲器頻道之方法及裝置,以及得到一能量保留混音矩陣之方法及裝置,用以將以輸入頻道為基礎之聲音訊號混音以用於L<sub>1</sub>個聲音頻道至L<sub>2</sub>個揚聲器頻道 Download PDF

Info

Publication number
TWI673707B
TWI673707B TW107116311A TW107116311A TWI673707B TW I673707 B TWI673707 B TW I673707B TW 107116311 A TW107116311 A TW 107116311A TW 107116311 A TW107116311 A TW 107116311A TW I673707 B TWI673707 B TW I673707B
Authority
TW
Taiwan
Prior art keywords
matrix
mixing
channels
speaker
sound
Prior art date
Application number
TW107116311A
Other languages
English (en)
Other versions
TW201832224A (zh
Inventor
約哈拿斯 波漢
Original Assignee
瑞典商杜比國際公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 瑞典商杜比國際公司 filed Critical 瑞典商杜比國際公司
Publication of TW201832224A publication Critical patent/TW201832224A/zh
Application granted granted Critical
Publication of TWI673707B publication Critical patent/TWI673707B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/301Automatic calibration of stereophonic sound system, e.g. with test microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/308Electronic adaptation dependent on speaker or headphone connection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)

Abstract

本發明係為一種產生多重頻道聲音之方法,將多頻道聲音內容混音係用於一特殊揚聲器安裝設定,然而,一客戶之聲音安裝設定極可能使用一不同揚聲器配置,本方法確保該訊號之空間訊號分量以相等響度播放。本發明揭示一種得到一能量保留混音矩陣( G )之方法,用以將L 1個輸入聲音頻道混音至L 2個輸出頻道,該方法包括以下步驟:得到(s711)一第一混音矩陣,在該第一混音矩陣上執行(s712)一奇異值分解以得到一奇異性矩陣 S ,處理(s713)該奇異性矩陣 S 以得到一處理過之奇異性矩陣,判定(s715)一縮放因子a,及根據以求出(s716)一改良式混音矩陣 G 。聽到任一揚聲器安裝設定上所播放之多頻道聲音之聲音、響度、音質及空間效果實際上與原揚聲器安裝設定者相等。

Description

將以 L 1 個頻道為基礎之輸入聲音訊號產生至 L 2 個揚聲器頻道之方法及裝置,以及得到一能量保留混音矩陣之方法及裝置,用以將以輸入頻道為基礎之聲音訊號混音以用於 L 1 個聲音頻道至 L 2 個揚聲器頻道
本發明相關產生多重頻道聲音訊號的方法,及產生多重頻道聲音訊號的裝置,本發明特別相關產生多重頻道聲音訊號的方法及裝置,該訊號用於揚聲器頻道的L 1個頻道到不同的L 2個頻道。
以新立體(3D)頻道為基礎的聲音格式提供聲音混音以用於揚聲器頻道,其不僅環繞聆聽位置,亦包括定位在聆聽位置(甜蜜點)上方(高度)及下方的頻道,該混音適合這種揚聲器特殊定位,通用格式係22.2(即22頻道)或11.1(即11頻道)。
圖1顯示不同揚聲器安裝設定中理想揚聲器位置的二範例:一22頻道揚聲器安裝設定(左)及一12頻道揚聲器安裝設定(右),每一節點顯示一揚聲器的虛擬位置,與甜蜜點有不同距離的真實揚聲器位置係藉由增益及延遲補償映射到虛擬位置。用於以頻道為基礎的聲音的一產生器接收L 1 個數位聲音訊號W 1 ,並將輸出處理到L 2 個輸出訊號W 2 。圖2顯示一產生器整合成再製鏈。
該產生器使用輸入揚聲器安裝設定的位置資訊及輸出揚聲器安裝設定的位置資訊作為輸入將處理鏈初始化,這顯示在圖3中,顯示二主要處理區塊:一混音與濾波區塊31及一延遲與增益補償區塊32。
揚聲器位置資訊可在笛卡兒(Cartesian)或球面座標中,可手動輸入用於輸出配置的位置R 2 ,或透過以特殊測試訊號的麥克風量測或藉由其他任何方法得出。可藉由表格登錄像用於5頻道環繞音響的一指示器,使輸入配置的位置R 1 隨內容產生。假定數個理想標準化揚聲器位置[9],該等位置亦可使用數個球面角位置以訊號顯示,假定一不變半徑用於輸入配置。
具有 係球面座標中輸出配置的位置,該座標系的原點係該甜蜜點(即聆聽位置)。r2 l 係該聆聽位置與一揚聲器l之間的距離,及θ l ,係相關球面角,其指明一揚聲器l相關該聆聽位置的空間方向。
延遲及增益補償
該等距離係用以得出數個延遲及增益g l ,其藉由放大或衰減元素應用到揚聲器饋入,及一延遲線具有d l 單元樣本延遲步驟。首先,判定一揚聲器與該甜蜜點之間的最大距離:
用於各揚聲器,藉由:
求出該延遲,f s 係取樣率,c係聲音速度(在攝氏溫度20度(公尺/秒)),及指明捨入下一整數。
藉由
判定揚聲器增益g l ,延遲及增益補償建造區塊的任務係為衰減及延遲比其他揚聲器更靠近聆聽者的揚聲器,使此等較靠近的揚聲器不主導聽到的聲音方向,因此該等揚聲器係設置在如圖1所示的虛擬球面上,混音及濾波區塊31茲可使用數個虛擬揚聲器位置搭配具有一不變的揚聲器距離。
混音及濾波
在一初始化相位中,使用輸入及理想化輸出配置R 1 ,的揚聲器位置以得出一L 2 ×L 1 混音矩陣 G ,在產生過程期間,此混音矩陣應用到輸入訊號以得出揚聲器輸出訊號。如圖4所示,存在二通用措施,在圖4(a)所示的第一措施中,混音矩陣係依存於聲音頻率,及藉由: W 2= GW 1, (3)得出輸出,其中 W 1 W 2 在矩陣表示法中表示L 1 ,L 2 個聲音頻道的輸入及輸出訊號及τ時間樣本, 最優的方法係向量基振幅平移(VBAP)[1]。在其他措施中,如圖4b)所示,混音矩陣成為頻率依存的( G (f))。接著,需要足夠解析度的一濾波器堆積,及根據公式(3)將一混音矩陣應用到每一頻帶樣本。
用於後者措施的數個範例係[2]、[3]及[4],為得出該混音矩陣,使用以下措施:如圖5所示,一虛擬麥克風陣列放置在該甜蜜點四周,將接收輸入配置(原方向,左手側)來的聲音的麥克風訊號M 1 ,與接收所想揚聲器配置(右手側)來的聲音的麥克風訊號M 2 作比較。令 M 1 R M×τ表示M個麥克風訊號接收該輸入配置發射出的聲音,及 M 2 R M×τ係來自輸出配置的聲音的M個麥克風訊號,可由以下公式得出
具有係自由場中理想聲音發射的複轉移函數,假定球面波或平面波發射,該等轉移函數係頻率依存的,選取相關一濾波器堆積的一中頻f m ,可使用公式(3)使公式(4)與公式(5)成為等式,用於每一f m ,需要解出以下公式以得到 G (f m ):
可得出依存於輸入訊號及使用的偽逆矩陣的一解為:
通常這措施所產生結果並不令人滿意,[2]及[5]並提 出更複雜途徑以解出公式(6)以用於 G
此外,有一完全不同的訊號適應產生方式,其中將進來聲音內容的方向訊號像聲音物件般加以萃取及產生,將剩餘訊號平移及解關連到輸出揚聲器。按計算複雜度而言,這類聲音產生昂貴許多,且常無法避免人工產物,在此並不使用訊號適應產生,提及只為要完整說明。
有一問題在於用戶在家的安裝設定,極可能因客廳的實地限制而使用不同的揚聲器放置,揚聲器數亦會不同。因此產生器的任務為使以頻道為基礎的聲音訊號調適到新安裝設定,以便聽到的聲音、響度、音質及空間效果盡可能接近在其原揚聲器安裝設定像混音室中播放時以原頻道為基礎的聲音。
本發明涉及一種產生聲音訊號的方法,其確保空間訊號分量的播放(即再製)具有該訊號的相等響度(如在原安裝設定中),後者意指從原混音中的一方向聽到的一方向訊號在產生到新揚聲器安裝設定時亦以相等響度聽到。此外,提供數個濾波器,其將該等輸人訊號等化用以再製一音質盡可能接近在聆聽原安裝設定時所聽到的。
在一方面,本發明相關一種將以L 1個頻道為基礎的輸入聲音訊號產生到L 2個揚聲器頻道的方法,其中L 1不同於L 2,如申請專利範圍第1項所揭示。根據本發明的一對應裝置揭示在申請專利範圍第8項中。
在一方面,本發明相關一種得到一能量保留混音矩陣G的方法,用以將以輸入頻道為基礎的聲音訊號混音以用於L 1個聲音頻道到L 2個揚聲器頻道,如申請專利範圍第7項所揭示。根據本發明的一對應裝置揭示在申請專利範圍第14項中。
在一方面,本發明相關一種電腦可讀媒體,具有數個可執行指令,用以令一電腦執行如申請專利範圍第1項所述的方法,或如申請專利範圍第7項所述的方法。
一種得到一能量保留混音矩陣G的方法,用以將以輸入頻道為基礎聲音訊號混音以用於L 1個聲音頻道到L 2個揚聲器頻道,該方法包括以下步驟:得到一第一混音矩陣,在該第一混音矩陣上執行一奇異值分解以得到一奇異性矩陣 S ,處理該奇異性矩陣 S 以得到一 處理過的奇異性矩陣具有& m 非零對角元素,根據 (用於L 2 L 1)或(用於L 2>L 1)判定一縮放因子a,及根據求出一混音矩陣 G 。結果,聽到在任一揚聲器安裝設定上播放的多重頻道聲音的聲音、響度、音質及空間效果盡可能接近以頻道為基礎的聲音,仿如以頻道為基礎的原本聲音在其原本揚聲器安裝設定上播放般。
以下參考附圖及後附申請專利範圍的說明,將更了解本發明進一步的目的、特徵及有利點。
31、72‧‧‧混音及濾波區塊(單元)
32、71、74‧‧‧延遲及增益補償區塊
73‧‧‧削峰防止區塊(單元)
722‧‧‧等化濾波器
724‧‧‧能量保留混音矩陣
EF1,...,EFL1‧‧‧濾波器
G ‧‧‧能量保留混音矩陣
G (f)‧‧‧頻率依存混音矩陣
G l ‧‧‧揚聲器放大率
q71‧‧‧延遲及增益補償之輸入聲音訊號
q72‧‧‧再混音聲音訊號
q73‧‧‧削峰之再混音聲音訊號
q722‧‧‧濾波之延遲及增益補償輸入聲音訊號
R1、R2‧‧‧揚聲器位置
S‧‧‧奇異矩陣
s60、s61、s622、s624、s63、s64、s711、s712、s713、s714、s715、s716‧‧‧步驟
s710‧‧‧方法
U、V‧‧‧矩陣
W1‧‧‧L 1個數位聲音訊號
W2‧‧‧L 2個輸出訊號
w11‧‧‧以L 1個頻道為基礎的輸入聲音訊號
w22‧‧‧L 2個揚聲器頻道
以下將參考附圖說明本發明的數個示範實施例,圖中:圖1係二揚聲器安裝設定的範例;圖2係一已知普遍結構,用以產生內容以用於一新揚聲器安裝設定;圖3係一般習知結構用於以頻道為基礎的聲音產生;圖4係將L 1個頻道混音到L 2個輸出頻道的二途徑:a.)一頻率獨立混音矩陣 G ,及b.)一頻率依存混音矩陣 G (f);圖5係一虛擬麥克風陣列,用以將原安裝設定發射出的聲音(輸入配置)和所要的輸出配置作出較;圖6a)係以流程圖根據本發明繪示將以L 1個頻道為基礎的輸入聲音訊號產生到L 2個揚聲器頻道的方法;圖6b)係以流程圖根據本發明繪示得到一能量保留混音矩陣 G 的方法;圖7係根據本發明一實施例的產生架構;圖8係混音及濾波區塊中一濾波器實施例的結構;圖9係用於5頻道再混音的示範頻率響應;圖10A及10B係用於22頻道再混音的示範頻率響應;圖11以圖繪示調整各揚聲器的聲壓位階;及圖12係如在EBU R128及ATSC A/85中使用的ITU-R BS.1770響度量測。
圖6a)根據本發明的一實施例以流程圖顯示將以L 1個頻道為基礎的輸入聲音訊號產生到L 2個揚聲器頻道的方法,將以L 1個頻道為基礎的輸入聲音訊號w11產生到L 2個揚聲器頻道的方法,其中L 1個與L 2個不同,包括以下步驟:判定s60 L 1個輸入聲音訊號的一混音類型,根據判定的混音類型在L 1個輸入聲音訊號上執行一第一延遲及增益補償s61,其中得到一延遲及增益補償的輸入聲音訊號,具有L 1個頻道及具有一限定混音類型,將該延遲及增益補償的輸入聲音訊號混音s624以用於L 2個聲音頻道,其中得到一再混音聲音訊號以用L 2個聲音頻道,將該再混音聲音訊號削峰s63,其中得到一削峰的再混音聲音訊號以用於L 2個聲音頻道,及在該再混音聲音訊號上執行一第二延遲及增益補償s64以用於L 2個聲音頻道,其中得到至L 2個揚聲器頻道w22。可能的混音類型包含球面、柱面及直角(或更普遍係立體)中的至少一者,在一實施例中,該方法包括又一濾波步驟,在一等化濾波器中將具有L 1個頻道的延遲及增益補償輸入聲音訊號q71濾波,其中得到一濾波過的延遲及增益補償輸入聲音訊號。雖然該等化濾波原則上獨立於一能量保留混音矩陣的使用,及可不用該等能量保留混音矩陣,但兩者結合使用特別有利。
圖6b)根據本發明的一實施例以流程圖顯示得到一能量保留混音矩陣 G 的方法,方法s710用以得到一能量保留混音矩陣 G 將以輸入頻道為基礎的聲音訊號混音以用於L 1個聲音頻道到L 2個揚聲器頻道,該方法包括以下步驟:從虛擬來源位置或方向及目標揚聲器位置或方向得到s711一第一混音矩陣,其中使用一平移方法,根據在第一混音矩陣上執行s712一奇異值分解,其中 U V 係正交矩陣,及 S 係一奇異性矩陣且具有s個第一對角元素係 G 的奇異值以遞減順序,及 S 的其他所有元素皆為零,處理s713奇異性矩陣 S ,其中得到一量化奇異性矩陣具有數個對角元素高於一臨界值設成一,及數個對角元素低於一臨界值設成零,判定s714一對角元素數目& m , 其在量化奇異性矩陣中設成一,根據用 於(L 2 L 1)或
用於(L 2>L 1)判定s715一縮放因子a,及根據求出s716一混音矩陣 G 。該等步驟係執行在一或多個處理元件如數個微處理器、一GPU(圖形處理單元)的脈絡等中。
圖7根據本發明的一實施例顯示一產生架構,在根據本發明的產生器過程或產生架構中,使用一外加"增益及延遲補償"區塊71用以預先處理不同的輸入安裝設定如球面、柱面或直角輸入安裝設定。此外,使用一修改版“混音及濾波”區塊72,其能保留原響度。在一實施例中,“混音及濾波”區塊72包括一等化濾波器722。以下相關圖7b)及圖8詳細說明”混音及濾波”區塊72,一削峰 防止區塊73防止由於修正的混音矩陣會發生的訊號溢流。圖8顯示該混音及濾波區塊中一等化濾波器722的結構,該等化濾波器原則上係一濾波堆積,具有L 1個濾波器EF1,...,EFL1,各輸入頻道有一個。以下將說明該等濾波器的設計及特徵。
新產生器解決以下至少一問題:
首先,可將以新立體聲音頻道為基礎的內容混音以用於一球面、直角或柱面的揚聲器安裝設定,此資訊需要隨同表格登錄的一指數傳送,以訊號顯示該輸入配置(其假定一不變的揚聲器半徑)能用以算出真實輸入揚聲器位置。或者,完整輸入揚聲器位置座標可隨同作為媒介資料的內容傳送,為使用獨立於該混音類型的數個混音矩陣,提供一增益及延遲補償用於該輸入配置。
第二,提供一能量保留混音矩陣G,傳統上,混音矩陣並非能量保留的,相較於使用一播放系統的相同校正時在混音室中的內容響度,能量保留確保該內容在產生後具有相同響度(參閱附錄及[6]、[7]、[8])。這亦確保如22頻道輸入或10頻道輸入具有相等‘響度,K-加權、相對全刻度”(LKFS)內容響度在產生後似乎同樣大聲。本發明的一有利點在於允許產生能量(及響度)保留、頻率獨立的混音矩陣。請注意,相同原則亦可用於頻率依存混音矩陣,但其並非是想要的。一頻率獨立混音矩陣按計算複雜度而言是有利的,但可能常有再混音後音質會改變的缺點,為避開這種混音後音質不匹配的情形,在一實 施例中,在混音前將在各輸入揚聲器頻道應用數個簡單濾波器,這就是等化濾波器722,以下將提出一種設計這類濾波器的方法。
能量保留產生法具有一缺點,即峰值聲音訊號分量可能會訊號超載,一外加削峰防止區塊73防止超載,這可簡單理解為一飽和,較複雜地說,此區塊係用於峰值聲音的一動態處理器,此建構區塊包含在本發明的一實施例中。
以下相關輸入增益及延遲補償71。
若輸入配置係藉由一表格登錄加上混音室資訊以訊號表示,像直角、柱面或球面配置,則配置座標係自特別預備的表格(如RAM(隨機存取記憶體))讀取為球面座標,若該等座標係直接傳送則轉換到球面座標。令 R 1=[r1 1 , 具有係此輸入配置的位置。在一第一步驟中,偵測到最大半徑:r1max=,因用於此建構區塊只對相對差異感興趣,因此該等半徑係藉由r2 max 縮放的r11,其可得自該輸出配置的增益及延遲補償初始化:
求出每一揚聲器的延遲定位點數及增益值如下: f s 係取樣頻率、c係聲音速度(在攝氏20度溫度(公尺/秒)),及指明捨入下個整數。
藉由
判定揚聲器增益,該混音及濾波區塊茲可使用數個虛擬揚聲器位置搭配具有一不變的揚聲器距離。
以下將說明混音矩陣設計。
首先,討論揚聲器訊號的能量及聽到的響度。圖7a以方塊圖顯示定義該等描述變數,必須將L 1 個揚聲器訊號處理到L 2 個訊號(通常L 2 L 1 ),揚聲器饋入訊號W 2 的播放理想上聽到的響度應與聆聽混音室中以最適揚聲器安裝設定播放的響度相等。令W 1 L 1個揚聲器頻道(列)及τ樣本(行)的一矩陣。
τ時間樣本區塊的訊號W 1 的能量定義如下:
在此W l,i W 1 的矩陣元素,l表示揚聲器指數,i表示樣本指數,表示Frobenius(弗羅貝尼烏斯)矩陣範數,W 1 的第t行向量,及[ ]T表示向量或矩陣轉置。
此能量E w 提供以頻道為基礎的聲音的一最佳聲音量測估算,如[6]、[7]、[8]中所定義,其中K-濾波器抑制頻率低於200Hz(赫)。W 1 的混音提供數個訊號W 2 ,該訊號能量在混音後成為:
其中L 2 係新的揚聲器數目,具有L 2 L 1
假定由一混音矩陣 G 執行該產生過程,從W 1 得出數 個訊號W 2 如下: W 2 = GW 1 (13)
評估及使用的行向量分解搭配以,接著得到
在一實施例中,接著得到響度保留如下。
若:E 1 =E 2 (15)
則原訊號混音的響度保留在新產生的訊號中。
由公式(14)明顯看出混音矩陣 M 需是正交的及 G T G = I (16)
其中 I L 1 ×L 1 單元矩陣。
根據本發明的一實施例,可得到一最適產生矩陣(亦稱為混音矩陣或解碼矩陣)如下。
步驟1:藉由使用平移方向得出一傳統混音矩陣,將來自原揚聲器組的一單個揚聲器l 1 看做是一音源,將由新揚聲器安裝設定的L 2 個揚聲器再製。較佳的平移方法係VBAP(向量基振幅平移)[1]或用於定頻的穩健平移[2](即用於此步驟可使用一已知技術)。為判定混音矩陣,使用修正的揚聲器位置,,用於輸出配置及用於虛擬來源方向。
步驟2:使用緊奇異值分解,該混音矩陣表示為三個矩陣的乘積:
U V 係正交矩陣,及 S 具有s個第一對角元素(該等奇異值在遞減順序中),具有s L 2 。其他矩陣元素係零。請注意,用於L 2 L 1 的情形保持如此,(再混音L 2 =L 1 ,向下混音L 2 <L 1 ),用於向上混音的情形(L 2 >L 1 ),L 2 在此區段需由L 1 取代。
步驟3:由S形成一新矩陣,其中該等對角元素由一值一取代,但極低值的奇異值s & <<s max 則由零取代。通常在-10dB(分貝)...-30dB或更小的範圍中選取一臨界值(如-20dB係一典型值),由於將發生二群組對角元素:具較大值元素及具相當較小值元素,因此由實際範例中的實際數據明顯看出該臨界值。該臨界值係在此二群組之中用以區別。
用於大部分的揚聲器設定,非零對角元素數& m & m =L 2 ,但用於一些設定變成較低且& m <L 2 ,其意指L 2 -& m 個揚聲器將不用以播放內容;只因該等揚聲器未有任何聲音資訊,因此仍無聲。
& m 表示將由一取代的最終奇異值,接著藉由:
判定混音矩陣G具有該縮放因子
或,分別地
該縮放因子係得自:,其中VV T 具有& m 本徵值等於一,其意指。因此,將L 1 個訊號簡單向下混音到& m 訊號將減少能量,除非& m =L 1 (換言之:當輸出揚聲器數匹配輸入揚聲器數)。利用,一縮放因子補償向下混音期間的能量損失。
作為一範例,以下說明一奇異性矩陣的處理,例如,根據公式(17):,使用緊奇異值分解將一初始(傳統)混音矩陣分解,奇異性矩陣 S 係在該形式的對角矩陣 有s1 s2 ...sL(即s1=smax)。
接著藉由將該等係數s1 s2 ...sL設成1或0以處理該奇異矩陣,依各係數是否高於一臨界值如0.06*smax而定,此類似於該等係數的一相對量化,該等臨界值示範為0.06,但亦可(當以分貝表示時)在-10dB或更低的範圍中。
用於一情形,具有如L=5及如只有s1及s2係高於臨界值,及s3,s4及s5係低於臨界值,作為結果的處理過(或”量化”)的奇異性矩陣,因此其非零對角係數的數目& m 係二。
以下將說明等化濾波器722。
當在不同3D(立體)安裝設定之間混音時,特別當從立 體安裝設定混音到2D(平面)安裝設定時,音質會改變,例如用於3D到2D,原來自上方的一聲音今只使用平面上的數個揚聲器再製,等化濾波器的工作係將此音質不匹配減到最小及將能量保留最大化。如圖7b所示,個別的濾波器F l 在應用該混音矩陣前應用到輸入配置的L 1 個頻道的各頻道,以下將顯示理論上的推演,及說明得出該等濾波器的頻率響應。
使用根據圖7的一模型及公式(4)及(5),為求方便,在此皆再列出二公式:
利用係假定球面波或平面波輻射的自由場中理想聲音輻射的複變換函數。此等矩陣係頻率函數,並可使用位置資訊,求出。定義,其中係一頻率函數。不用公式(4)及(5),如在先前技術段落提及,茲將等化該等能量。並因想要等化以用於輸入配置中揚聲器方向的聲音,因此可解決在一時間(在L 1 個上的迴路)為各輸入揚聲器的考量。
在該等虛擬麥克風測量以用於輸入安裝設定的能量,若只有一揚聲器l有作用,則係由
提供,有h M,l 代表的第l行,及w 1l 代表W 1 的一列,即揚聲器l的時間訊號具有τ個樣本。將Frobenius (弗羅貝尼烏斯)範數模擬重寫到公式(11),可進一步將公式(22)求值到:
其中( ) H 係共軛複轉置(Hermitian transposed(埃爾米特轉置)),及E wl 係揚聲器訊號l的能量,向量h M,l 係由數個複指數所複合(參閱公式(31)、(32)),及一元素與其共軛複形相乘等於一,因此
混音後在虛擬麥克風的量測係由提供。若只有一揚聲器有作用,則可重寫成:
的第l行。將定義成可分解成相關揚聲器l的一頻率依存部分,及由公式(24)得出混音矩陣 G
b 作為L 1 複元素的一頻率依存向量,及(f)表示頻率依存性,其在以下已略過以求簡化。利用此方式,公式(25)變成:
其中g G 的第l行,及b l b 的第l個元素。使用以上Frobenius範數的相同考量,在該等虛擬麥克風的能量成為:
其可求值到:
茲可分別根據公式(24)及公式(29)將該等能量建立方程,及解出b l 以用於各頻率f
公式(30)的b l 係頻率依存增益因子或縮放因子,及由於b l 係頻率依存的,因此可作為等化濾波器722的係數使用以用於各頻帶。
以下說明用於等化濾波器722的實用濾波器設計。以下將虛擬麥克風陣列半徑及轉移函數列入考量。為匹配人類最佳感知音質效果,選取0.09公尺的一麥克風半徑r M (人腦的平均直徑係大約0.18公尺),在環繞原點(甜蜜點,聆聽位置)在一球面或半徑r M 上放置M>>L1個虛擬麥克風,在[11]可找出合適的位置,在(該座標系統的)原點加入一額外虛擬麥克風。
使用一平面波或球面波模型設計轉移矩陣,為稍後由於該等增益及延遲補償階段,可忽略該等振幅衰減效應。令h m,l 係該轉移矩陣H M,L 的一抽象矩陣元素,以用於從揚聲器l到麥克風m的自由場轉移函數(其亦指明該等矩陣的行及列指數)。藉由
提供該平面波轉移函數,i係想像單元,r m 係麥克風位置的半徑(r M 或零以用於原位置),及係揚聲器l與麥 克風m位置球面角的餘弦,藉由提供頻率依存性,f係頻率及c係聲音速度,藉由
提供該球面波轉移函數,以r l,m 為揚聲器l到麥克風m的距離。
使用在F N 離散頻率上的一迴路及在所有輸入配置揚聲器L 1 個上的一迴路,求出該濾波器的頻率響應B resp :根據以上在5.2“最適產生矩陣的設計”中的說明求出G:用於(f=0;f=f+f個步驟;f<F N f個步驟)/*在頻率上的迴路*/
k=2*π*f/342;根據公式(31)或公式(32)求出
用於(1=1;1++;1<=L 1 )/*在輸入頻道上的迴路*/
g= G (:,1)
可使用一標準技術從頻率響應 B resp (1,f)得出該等濾波響應。通常,可能得出位階等於或小於64的一FIR(有限脈衝響應)濾波器設計,或使用串聯雙四角形區域的IIR(無限脈衝響應)濾波器設計,計算複雜性甚至更小。圖 9、10A及10B顯示數個設計範例。
在圖9中,顯示濾波器的頻率響應範例以用於五頻道ITU安裝設定[9](L,R,C,Ls,Rs)到+/-30度2頻道立體音響的再混音,及作為示範結果的2×5混音矩陣 G 。使用[2]根據段落5.2得出混音矩陣以用於500Hz(赫),使用一平面波模型用於該轉移函數。如所示,該等濾波器中的二者(上列,用於該等頻道中的二者)原則上具有低通(LP)特性,及該等濾波器中的三者(下列,用於其餘三頻道)原則上具有高通(HP)特性,因該等濾波器一起形成一等化濾波器(或等化濾波堆積),因此希望該等濾波器不具有理想的HP或LP特性。通常,並非全部濾波器具有大致相同特性,以便利用至少一LP或至少一HP濾波器以用於不同頻道。
在圖10A及10B中,顯示數個濾波器的示範響應,以用於22.2 NHK(日本放送協會)安裝設定的22頻道[10]到ITU 5頻道環繞立響[9]的再混音,及作為結果的一5×22混音矩陣。
本發明可用以利用任意定義的L 1 個揚聲器位置以調整以聲音頻道為基礎的內容,使能播放到L 2 個真實的揚聲器位置。
在一方面,本發明相關一種產生L1個頻道到L2個頻道以頻道為基礎的聲音的方法,其中使用一響度及能量保留混音矩陣,如以上在”最適產生矩陣的設計”段落中所述,該矩陣係由奇異值分解以得出,在一實施例中,將該奇異值分解應用到以傳統方式得出的一混音矩陣。
在一實施例中,根據公式(19)或公式(19’),藉由 (用於L 1 L 2 )的一因子,或藉由(用於L 1 <L 2 )的一因子,將該矩陣縮放。
可藉由使用各種不同平移方法如VBAP(向量基振幅平移)或穩健平移得出傳統矩陣,此外,傳統矩陣亦使用理想化的輸入及輸出揚聲器位置(球面投射,參閱上述說明)。因此,在一方面,本發明相關一種濾波方法,在應用該混音矩陣前將該L 1 個輸入頻道濾波,在一實施例中,在一延遲及增益補償區塊71中,將使用不同揚聲器位置的數個輸入訊號映射到一球面投射。
在一實施例中,從藉由上述方法求出的頻率響應得出數個等化濾波。
在一實施例中,由以下數個建構及處理區塊組裝成一元件,用以將L 1 個頻道以頻道為基礎的聲音內容,產生到L 2 個頻道以頻道為基礎的聲音內容:- 數個輸入(及輸出)增益及延遲補償區塊71,74,目的為將該等輸入及輸出揚聲器位置映射到一虛擬球面,上述混音矩陣可應用需要此類球面結構;- 數個等化濾波器722,係由上述方法得出,在輸入增益及延遲補償後用以將L 1 個頻道濾波;- 一混音單元72,用以藉由應用上述方法得出的能量保留混音矩陣724將L 1 個輸入頻道混音到L 2 個輸出頻 道,等化濾波器722可為混音單元72的一部分,或可為一分開模組;- 一訊號溢流偵測及削峰防止區塊73,用以防止訊號超載到L 2 個頻道的訊號;及- 一輸出增益及延遲校正區塊。
在一實施例中,一種得到一能量保留混音矩陣 G 用以將L 1 個輸入聲音頻道混音到L 2 個輸出頻道的方法,包括以下步驟:得到s711一第一混音矩陣,在第一混音矩陣上執行s712一奇異值分解以得到一奇異性矩陣 S ,處理s713奇異性矩陣 S 以得到一處理過的奇異性矩陣,判定s715一縮放因子a,及根據求出s716一改良式混音矩陣 G 。一有利點在於在任一揚聲器安裝設定上播放的多重頻道聲音,實際上與原揚聲器安裝設定所聽到的聲音、響度、音質及空間效果相等。
最後,參考圖11說明一示範過程用以設定一播放位階,一粉紅雜訊測試用以藉由調整揚聲器放大率G l 以位階調整各揚聲器的聲壓位階。在混音及呈現地點中的聲壓位階(SPL)調整及在混音室中的內容響度位階調整,能在節目或項目之間切換時令聽到的響度保持不變。如在[8]中所述,設定各揚聲器饋入的放大器增益G l ,以便具有-18dBFSrms(全刻度分貝均方根)的一數位全頻粉紅雜訊輸入造成78 +/- 5dBA(A加權分貝)的一聲壓位階。
關於內容響度位階校正,若依此方式設定混音設備及呈現地點的播放位階,則項目或節目之間的切換 可能不用進一步的位階調整。用於以頻道為基礎的內容,若在混音地點將內容調到令人愉悅的一響度位階,就可簡單達到此目的。用於此令人愉悅的聆聽位階的參考可以是整個項目本身或一錨訊號的響度。
若係整個項目本身,則若內容係儲存為一檔案,則這情形對於”短形式內容”係有用的。除了藉由聆聽來調整以外,根據EBU R128建議,響度單元全刻度(LUFS)中的一響度量測[6]亦可用以響度調整該內容。LUFS的另一名稱係源自ITU-R BS.1770建議的‘響度,K-加權,相對全刻度’[7](1LUFS=1LKFS),不幸的是,[6]支援用於安裝設定的內容只達到5頻道環繞音響,而22頻道檔案的響度量測,其中全部22頻道皆由一的相等頻道有效值進行因數分解,可與聽到的響度相關連,但尚未藉由全面清單測試得到證據或證明。
若此訊號係一錨訊號如對話,則相關該訊號選取位階,這對於“長形式內容”的影片聲音、現場錄音及廣播等有用。茲延伸該愉悅聆聽位階的一額外要求係口說文字的可理解性,同樣在藉由聆聽的調整之外,亦可相關一響度量測將該內容正規化,如在ATSC A/85[8]中所界定,將該內容的第一部分識別為錨部分,接著求出如[7]中定義的一量測,或判定此等訊號及一增益因子以達到目標響度,使用該增益因子來將整個項目加以縮放。不幸的是,支援的最大頻道數同樣限制到5個。
圖12顯示如在EBU R128[2]及ATSC A/85 [4]中使用的ITU-R BS.1770[3]響度量測。[2]提議將全內容項目測得的響度以增益調整到-23dBLKFS,在[4]中只測量錨訊號響度並以增益調整該內容,使該等錨部分達到-24dBLKFS的目標響度。
出於藝術考量,內容必須藉由在混音工作室聆聽加以調整,可使用響度量測作為一支援及用以顯示並未超過一明確界定的響度。
根據公式(11)的能量E w 提供聽到的如一錨訊號響度的一公平估算以用於超過200Hz(赫)的頻率。因K-濾波器抑制頻率低於200Hz[5],因此E w 與該響度量測大致成正比。
雖然本發明的基本新穎特徵如應用到其數個較佳實施例所顯示、說明及指出者,但應瞭解,不背離本發明的精神,熟諳此藝者在所述裝置及方法中,在揭示構件的形式及細節中,及在其操作中,可作出不同的省略、添加和變動。明白地希望為達成相同結果,在實質相同方式中執行實質相同功能的該等元件的所有組合皆涵蓋在本發明的範圍內。亦完全希望及考慮到從一說明實施例到另一說明實施例的元件替換,應瞭解本發明單純藉由範例加以說明,不背離本發明的範圍即可作出細節修改。
在本說明書及(在適當處)後附申請專利範圍及附圖中揭示的各特徵可獨立地提供或在任何適當組合中提供,數個特徵在適當處可實施在硬體、軟體或兩者的組合中,數個連接方式在可應用處可實施作為無線連接或有線 連接,不必是直接或專用的連接。
後附申請專利範圍中出現的參考數字符號係只在繪示方式,不應在後附申請專利範圍的範疇中具有任何限制效果。
參考文獻
[1] Pulkki, V., “使用向量基振幅平移的虛擬音源定位(Virtual Sound Source Positioning Using Vector Base Amplitude Panning)”,聲音工程協會期刊,第45期,456-466頁(1997年6月)。
[2] Poletti, M., “用於非統一揚聲器布局的穩健2D環繞音響再製(Robust two-dimensional surround sound reproduction for non-uniform loudspeaker layouts)”,聲音工程協會期刊,第55(7/8)期;598-610頁,2007年7/8月。
[3] O. Kirkeby及P. A. Nelson,"平面波音場的再製(Reproduction of plane wave sound fields)”,音響學協會期刊,第94(5)期,2992-3000頁(1993年)。
[4] Fazi, F.; Yamada, T; Kamdar, S.; Nelson P.A.; Otto, P., “基於虛擬麥克風陣列的環繞音響平移技術(Surround Sound Panning Technique Based on a Virtual Microphone Array)”,AES(進階加密標準)協定:128(2010年5月)文件編號:8119。
[5] Shin, M.; Fazi, F.; Seo, J.; Nelson, P.A., “有效率立體(3D)音場再製(Efficient 3-D Sound Field Reproduction)”,AES協定:130(2011年5月)文件編號:8404。
[6] EBU(歐洲廣播聯盟電子工程師學會)技術建議書R128,”聲音訊號的響度正規化及允許最大位準 (Loudness Normalization and Permitted Maximum Level of Audio Signals)”,日內瓦,2010。[http://tech.ebu.ch/docs/r/r128.pdf]
[7] ITU-R(國際通信聯盟無線通信部門)建議書BS.1770-2,"測量聲音程式設計響度及真正峰值聲音位階的演算法(Algorithms to measure audio programme loudness and true-peak audio level)”,日內瓦,2011年。[http://tech.ebu.ch/docs/r/r128.pdf]
[8] ATSC(美國廣播電視標準)A/85,"建立及維護數位電視聲音響度的技術(Techniques for Establishing and Maintaining Audio Loudness for Digital Television)”,進階電視系統委員會,華盛頓,2011年7月25日。
[9] ITU-R BS 775-1建議書(1994年)。
[10] Hamasaki, K.; Nishiguchi T.; Okumura, R.; Nakayama, Y.; Ando, A., “超高畫質電視(UHDTV)的22.2多重頻道聲音系統(A 22.2 multichannel sound system for ultrahigh-definition TV (UHDTV)”,SMPTE(電影及電視協會)動態影像期刊,44-49頁,2008年4月。
[11] Jorg Fliege及Ulrike Maier,計算球面的求體積公式的二階段方法(A two-stage approach for computing cubature formulae for the sphere),Fachereich Mathematil, Universitat Dortmund,技術論文,1999年,可於網址http://www.personal.soton.ac.uk/jflw07/nodes/nodes.html找到節點數及論文。

Claims (13)

  1. 一種將以 L 1個頻道為基礎之輸入聲音訊號產生至 L 2個揚聲器頻道之方法,其中 L 1不同於 L 2,該方法包括以下步驟:- 判定該等 L 1個輸入聲音訊號之一混音類型,其中該混音類型明確界定被用於定義揚聲器位置的一座標系並且其中可能之混音類型包含球面、柱面及直角中之至少一者;- 根據該判定之混音類型在該等 L 1個輸入聲音訊號上執行一第一延遲及增益補償,其中得到一延遲及增益補償之輸入聲音訊號,具有 L 1個頻道及具有一界定混音類型;- 將該延遲及增益補償之輸入聲音訊號混音以用於 L 2個聲音頻道,其中得到一再混音之聲音訊號以用於 L 2個聲音頻道;- 將該再混音之聲音訊號削峰,其中得到一削峰之再混音聲音訊號以用於 L 2個聲音頻道;以及- 在該削峰之再混音聲音訊號上執行一第二延遲及增益補償以用於 L 2個聲音頻道,其中得到 L 2個揚聲器頻道;其中,該混音使用藉由以下步驟所得到的一能量保留混音矩陣 G:- 使用一平移方法,從數個虛擬來源方向 及數個目標揚聲器方向 得到一第一混音矩陣 ;- 根據 在該第一混音矩陣 上執行一奇異值分解,其中 U V 係正交矩陣,及 S 係一奇異性矩陣及具有 s個第一對角元素,係 G在遞減順序中之奇異值,及 S 之所有其他元素係零;- 處理該奇異性矩陣 S ,其中利用高於一臨界值之數個對角元素設成一,及低於一臨界值之數個對角元素設成零,得到一量化奇異性矩陣 ;- 判定該量化奇異性矩陣 中設成一之對角元素之數目 & m ; - 根據 用於( L 2 L 1)或 用於( L 2> L 1)判定一縮放因子 a;以及- 根據 計算出該能量保留混音矩陣 G
  2. 根據申請專利範圍第1項所述之方法,更包括一濾波步驟,將具有 L 1個頻道之延遲及增益補償之輸入聲音訊號濾波,其中,得到一濾波之延遲及增益補償輸入聲音訊號,並且其中,該混音使用該濾波之延遲及增益補償輸入聲音訊號。
  3. 根據申請專利範圍第2項所述之方法,其中具有 L 1個頻道之延遲及增益補償輸入聲音訊號之濾波使用一等化濾波器,具有不同類型濾波器以用於該等頻道,其中至少一頻道使用一高通濾波器,及至少一頻道使用一低通濾波器。
  4. 根據申請專利範圍第1項所述之方法,其中該界定之混音類型係球面。
  5. 根據申請專利範圍第1項所述之方法,其中將該輸入訊號最適化以用於 L 1個正規揚聲器位置,及將該產生最適化以用於 L 2個任意揚聲器位置,其中該等任意揚聲器位置中之至少一者不同於該等正規揚聲器位置。
  6. 一種用於產生一能量保留混音矩陣 G 之電腦所實施的方法,該能量保留混音矩陣 G 用以將以輸入頻道為基礎之聲音訊號混音以用於 L 1個聲音頻道至 L 2個揚聲器頻道,該方法包括以下由該電腦所執行的步驟:- 從數個虛擬來源方向 及數個目標揚聲器方向 得到一第一混音矩陣 ,其中使用一平移方法;- 根據 在該第一混音矩陣 上執行一奇異值分解,其中 U V 係正交矩陣,及 S 係一奇異性矩陣及具有 s個第一對角元素,係 G在遞減順序中之奇異值,及 S 之所有其他元素係零;- 處理奇異性矩陣 S ,其中利用高於一臨界值之數個對角元素設成一,及低於一臨界值之數個對角元素設成零,得到一量化奇異性矩陣 ;- 判定該量化奇異性矩陣 中設成一之對角元素之數目 & m ; - 根據 用於( L 2 L 1)或 用於( L 2> L 1),判定一縮放因子 a;以及- 根據 計算出該能量保留混音矩陣 G
  7. 一種將以 L 1個頻道為基礎之輸入聲音訊號產生至 L 2個揚聲器頻道之裝置,其中 L 1不同於 L 2,該裝置包括至 少一個包括至少各個以下單元中之一者的處理器:- 判定單元,用以判定 L 1個輸入聲音訊號之一混音類型,其中該混音類型明確界定被用於定義揚聲器位置的一座標系並且其中可能之混音類型包含球面、柱面及直角中之至少一者;- 第一延遲及增益補償單元,用以根據該判定之混音類型在 L 1個輸入聲音訊號上執行一第一延遲及增益補償,其中得到一延遲及增益補償之輸入聲音訊號,具有 L 1個頻道及具有一界定之混音類型;- 混音單元,用以將該延遲及增益補償之輸入聲音訊號混音以用於 L 2個聲音頻道,其中得到一再混音之聲音訊號以用於 L 2個聲音頻道;- 削峰單元,用以將該再混音之聲音訊號削峰,其中得到一削峰之再混音聲音訊號以用於 L 2個聲音頻道;以及- 第二延遲及增益補償單元,用以在該削峰之再混音聲音訊號上執行一第二延遲及增益補償以用於 L 2個聲音頻道,其中得到 L 2個揚聲器頻道;其中,將該延遲及增益補償之輸入聲音訊號混音以用於 L 2個聲音頻道的該混音單元係使用藉由一混音矩陣產生單元所得到的一能量保留混音矩陣 G,其中該混音矩陣產生單元包括一或更多個處理器用以實施以下模組:- 第一計算模組,用於使用一平移方法,從數個虛擬來源方向 及數個目標揚聲器方向 得到一第一混音矩陣 ; - 奇異值分解模組,用於根據 在該第一混音矩陣 上執行一奇異值分解,其中 U V 係正交矩陣,及 S 係一奇異性矩陣及具有 s個第一對角元素,係 G在遞減順序中之奇異值,及 S 之所有其他元素係零;- 處理模組,用於處理該奇異性矩陣 S ,其中利用高於一臨界值之數個對角元素設成一,及低於一臨界值之數個對角元素設成零,得到一量化奇異性矩陣 ;- 計數模組,用於判定該量化奇異性矩陣 中設成一之對角元素之數目 & m ; - 第二計算模組,用於根據 用於( L 2 L 1)或 用於( L 2> L 1)判定一縮放因子 a;以及- 第三計算模組,用於根據 計算出一混音矩陣 G
  8. 根據申請專利範圍第7項所述之裝置,更包括一等化濾波器,用以將具有 L 1個頻道之延遲及增益補償之輸入聲音訊號濾波,其中得到一濾波之延遲及增益補償輸入聲音訊號。
  9. 根據申請專利範圍第8項所述之裝置,其中該等化濾波器包括不同類型濾波器,其係用於該等頻道,其中至少一頻道使用一高通濾波器,及至少一頻道使用一低通濾波器。
  10. 根據申請專利範圍第7項所述之裝置,其中該界定之混音類型係球面。
  11. 根據申請專利範圍第7項所述之裝置,其中將該等輸入訊號最適化以用於 L 1個正規揚聲器位置,及將該產生最適化以用於 L 2個任意揚聲器位置,其中該等任意揚聲器位置中之至少一者係不同於該等正規揚聲器位置。
  12. 一種得到一能量保留混音矩陣 G 之裝置,用以將以輸入頻道為基礎之聲音訊號混音以用於 L 1個聲音頻道至 L 2個揚聲器頻道,該裝置包括至少一個處理器,該處理器包括至少一個處理元件用以實施模組:- 第一計算模組,用於從數個虛擬來源方向 及數個目標揚聲器方向 得到一第一混音矩陣 ,其中一平移方法被使用;- 奇異值分解模組,用於根據 在該第一混音矩陣 上執行一奇異值分解,其中 U V 係正交矩陣,及 S 係一奇異性矩陣及具有 s個第一對角元素,係 G在遞減順序中之奇異值,及 S 之所有其他元素係零;- 處理模組,其處理該奇異性矩陣 S ,其中利用高於一臨界值之數個對角元素設成一,及低於一臨界值之數個對角元素設成零,得到一量化奇異性矩陣 ;- 計數模組,用於判定該量化奇異性矩陣 中設成一之對角元素之數目 & m ; - 第二計算模組,用於根據 用於( L 2 L 1)或 用於( L 2> L 1)判定一縮放因子 a;以及- 第三計算模組,用於根據 計算出該能量 保留混音矩陣 G
  13. 一種非暫態的電腦可讀取儲存媒體,其具有儲存於其上之指令,當該指令在一電腦上被執行時,導致該電腦實行根據申請專利範圍第1項之方法。
TW107116311A 2013-07-19 2014-07-16 將以L<sub>1</sub>個頻道為基礎之輸入聲音訊號產生至L<sub>2</sub>個揚聲器頻道之方法及裝置,以及得到一能量保留混音矩陣之方法及裝置,用以將以輸入頻道為基礎之聲音訊號混音以用於L<sub>1</sub>個聲音頻道至L<sub>2</sub>個揚聲器頻道 TWI673707B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
??13306042.6 2013-07-19
EP13306042 2013-07-19

Publications (2)

Publication Number Publication Date
TW201832224A TW201832224A (zh) 2018-09-01
TWI673707B true TWI673707B (zh) 2019-10-01

Family

ID=48949099

Family Applications (2)

Application Number Title Priority Date Filing Date
TW107116311A TWI673707B (zh) 2013-07-19 2014-07-16 將以L<sub>1</sub>個頻道為基礎之輸入聲音訊號產生至L<sub>2</sub>個揚聲器頻道之方法及裝置,以及得到一能量保留混音矩陣之方法及裝置,用以將以輸入頻道為基礎之聲音訊號混音以用於L<sub>1</sub>個聲音頻道至L<sub>2</sub>個揚聲器頻道
TW103124331A TWI631553B (zh) 2013-07-19 2014-07-16 將以<i>L</i><sub>1</sub>個頻道為基礎之輸入聲音訊號產生至<i>L</i><sub>2</sub>個揚聲器頻道之方法及裝置,以及得到一能量保留混音矩陣之方法及裝置,用以將以輸入頻道為基礎之聲音訊號混音以用於<i>L</i><sub>1</sub>個聲音頻道至<i>L</i><sub>2</sub>個揚聲器頻道

Family Applications After (1)

Application Number Title Priority Date Filing Date
TW103124331A TWI631553B (zh) 2013-07-19 2014-07-16 將以<i>L</i><sub>1</sub>個頻道為基礎之輸入聲音訊號產生至<i>L</i><sub>2</sub>個揚聲器頻道之方法及裝置,以及得到一能量保留混音矩陣之方法及裝置,用以將以輸入頻道為基礎之聲音訊號混音以用於<i>L</i><sub>1</sub>個聲音頻道至<i>L</i><sub>2</sub>個揚聲器頻道

Country Status (4)

Country Link
US (3) US9628933B2 (zh)
EP (2) EP3022950B1 (zh)
TW (2) TWI673707B (zh)
WO (1) WO2015007889A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI791175B (zh) * 2019-11-20 2023-02-01 弗勞恩霍夫爾協會 音訊物件呈現器、用以決定揚聲器增益之方法、及使用平移物件揚聲器增益及擴展物件揚聲器增益之電腦程式

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US9883312B2 (en) 2013-05-29 2018-01-30 Qualcomm Incorporated Transformed higher order ambisonics audio data
US9502045B2 (en) 2014-01-30 2016-11-22 Qualcomm Incorporated Coding independent frames of ambient higher-order ambisonic coefficients
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
CA3155815A1 (en) 2014-03-24 2015-10-01 Dolby International Ab METHOD AND DEVICE FOR APPLYING DYNAMIC RANGE COMPRESSION TO A HIGHER ORDER SURROUND SIGNAL
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
WO2016210174A1 (en) 2015-06-25 2016-12-29 Dolby Laboratories Licensing Corporation Audio panning transformation system and method
US10070094B2 (en) * 2015-10-14 2018-09-04 Qualcomm Incorporated Screen related adaptation of higher order ambisonic (HOA) content
EP4254403A3 (en) * 2016-09-14 2023-11-01 Magic Leap, Inc. Virtual reality, augmented reality, and mixed reality systems with spatialized audio
US10499153B1 (en) 2017-11-29 2019-12-03 Boomcloud 360, Inc. Enhanced virtual stereo reproduction for unmatched transaural loudspeaker systems
US10524078B2 (en) * 2017-11-29 2019-12-31 Boomcloud 360, Inc. Crosstalk cancellation b-chain
US11743670B2 (en) 2020-12-18 2023-08-29 Qualcomm Incorporated Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications
CN117651238B (zh) * 2024-01-30 2024-05-31 科大讯飞(苏州)科技有限公司 音频播放方法、音频补偿系数的确定方法和汽车

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120082319A1 (en) * 2010-09-08 2012-04-05 Jean-Marc Jot Spatial audio encoding and reproduction of diffuse sound

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5594800A (en) * 1991-02-15 1997-01-14 Trifield Productions Limited Sound reproduction system having a matrix converter
WO2003104924A2 (en) * 2002-06-05 2003-12-18 Sonic Focus, Inc. Acoustical virtual reality engine and advanced techniques for enhancing delivered sound
EP1915818A1 (en) * 2005-07-29 2008-04-30 Harman International Industries, Incorporated Audio tuning system
JP2012022731A (ja) * 2010-07-12 2012-02-02 Hitachi Ltd 磁気ヘッドスライダ及びそれを用いた磁気ディスク装置
US10674299B2 (en) * 2014-04-11 2020-06-02 Samsung Electronics Co., Ltd. Method and apparatus for rendering sound signal, and computer-readable recording medium

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120082319A1 (en) * 2010-09-08 2012-04-05 Jean-Marc Jot Spatial audio encoding and reproduction of diffuse sound

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
F. Zotter, et al., "Energy-Preserving Ambisonic Decoding", ACTA Acustica United with Acustica, Vol. 98, No. 1, January 2012, http://docserver.ingentaconnect.com/deliver/connect/dav/16101928/v98n1/s4.pdf?expires=1544790899&id=0000&titleid=75000347&checksum=69FA17E *
F. Zotter, et al., "Energy-Preserving Ambisonic Decoding", ACTA Acustica United with Acustica, Vol. 98, No. 1, January 2012, http://docserver.ingentaconnect.com/deliver/connect/dav/16101928/v98n1/s4.pdf?expires=1544790899&id=0000&titleid=75000347&checksum=BC764255A84A828F769FA17ECAE541B7

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI791175B (zh) * 2019-11-20 2023-02-01 弗勞恩霍夫爾協會 音訊物件呈現器、用以決定揚聲器增益之方法、及使用平移物件揚聲器增益及擴展物件揚聲器增益之電腦程式

Also Published As

Publication number Publication date
WO2015007889A2 (en) 2015-01-22
US20160174008A1 (en) 2016-06-16
TW201514455A (zh) 2015-04-16
EP3022950B1 (en) 2018-11-21
EP3022950A2 (en) 2016-05-25
US20170251322A1 (en) 2017-08-31
US10091601B2 (en) 2018-10-02
TW201832224A (zh) 2018-09-01
WO2015007889A3 (en) 2015-07-16
EP3531721B1 (en) 2020-10-21
TWI631553B (zh) 2018-08-01
US9628933B2 (en) 2017-04-18
EP3531721A1 (en) 2019-08-28
US20190007779A1 (en) 2019-01-03

Similar Documents

Publication Publication Date Title
TWI673707B (zh) 將以L&lt;sub&gt;1&lt;/sub&gt;個頻道為基礎之輸入聲音訊號產生至L&lt;sub&gt;2&lt;/sub&gt;個揚聲器頻道之方法及裝置,以及得到一能量保留混音矩陣之方法及裝置,用以將以輸入頻道為基礎之聲音訊號混音以用於L&lt;sub&gt;1&lt;/sub&gt;個聲音頻道至L&lt;sub&gt;2&lt;/sub&gt;個揚聲器頻道
US11178503B2 (en) System for rendering and playback of object based audio in various listening environments
RU2640647C2 (ru) Устройство и способ преобразования первого и второго входных каналов, по меньшей мере, в один выходной канал
EP2891335B1 (en) Reflected and direct rendering of upmixed content to individually addressable drivers
US8180062B2 (en) Spatial sound zooming
CN108174341B (zh) 测量高阶高保真度立体声响复制响度级的方法及设备
US20180115850A1 (en) Processing audio data to compensate for partial hearing loss or an adverse hearing environment
CN105874820A8 (zh) 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
US20210250717A1 (en) Spatial audio Capture, Transmission and Reproduction
JP2024028527A (ja) 音場関連レンダリング
JP2024502732A (ja) バイノーラル信号の後処理
JP6285790B2 (ja) チャンネル数変換装置