TW201843675A - 降混多聲道音頻信號的裝置和方法 - Google Patents
降混多聲道音頻信號的裝置和方法 Download PDFInfo
- Publication number
- TW201843675A TW201843675A TW107105810A TW107105810A TW201843675A TW 201843675 A TW201843675 A TW 201843675A TW 107105810 A TW107105810 A TW 107105810A TW 107105810 A TW107105810 A TW 107105810A TW 201843675 A TW201843675 A TW 201843675A
- Authority
- TW
- Taiwan
- Prior art keywords
- channel
- component
- input
- input channel
- item
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 230000005236 sound signal Effects 0.000 title claims abstract description 38
- 238000012545 processing Methods 0.000 claims abstract description 101
- 230000000694 effects Effects 0.000 claims description 22
- 230000006835 compression Effects 0.000 claims description 21
- 238000007906 compression Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 18
- 238000010586 diagram Methods 0.000 description 44
- 238000004891 communication Methods 0.000 description 19
- 230000002085 persistent effect Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 238000012546 transfer Methods 0.000 description 7
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 241000610375 Sparisoma viride Species 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000005316 response function Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003370 grooming effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/07—Generation or adaptation of the Low Frequency Effect [LFE] channel, e.g. distribution or signal processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Stereophonic System (AREA)
Abstract
一種用於處理多聲道輸入音頻信號之方法,其係在一運算裝置上執行。該方法包括下列步驟:從該多聲道輸入音頻信號選取一左輸入聲道及一右輸入聲道,其中該左輸入聲道及該右輸入聲道對應於一對空間上對稱之信號源;從該左輸入聲道及該右輸入聲道產生一或多個跨聲道特徵;根據該等跨聲道特徵處理該左輸入聲道及該右輸入聲道,以產生一左中間聲道及一右中間聲道;以及將該左中間聲道及該右中間聲道各自與該多聲道輸入音頻信號的一第三輸入聲道結合,以形成一雙聲道輸出音頻信號。
Description
本發明係關於一種音頻信號處理方法,特別是一種用於降混多聲道音頻信號的電腦實施方法、裝置以及電腦可用程式碼。
環繞音效是使用環繞聆聽者的多聲道,以產生、傳送及播放音頻的技術,通常使用多個分立聲道達成。多聲道或環繞音效兩種最普遍的配置方式為5.1環繞音效及7.1環繞音效。一套5.1環繞音效的配置由一對前置揚聲器(L及R)、一個中央前置聲道(C)、一對側置揚聲器(Ls及Rs)和一個低頻效果聲道(LFE)組成,傳統的配置順序為L,C,R,Ls,Rs,LFE。一套7.1環繞音效的配置由一對前置揚聲器(L及R)、一個中央前置聲道(C)、一對側置環繞揚聲器(Lss及Rss)、一對後置環繞揚聲器(Lrs及Rrs)和一個低頻效果聲道(LFE)組成,傳統的配置順序為L,C,R,Lss,Rss,Lrs,Rrs,LFE。
降混是一種將具有多聲道配置的音頻內容(例如一多聲道音頻檔),轉換為較少聲道音頻內容的方法。舉例來說,一個5.1環繞音效檔或7.1環繞音效檔經由降混處理,可進而使用一雙聲道的立體聲播放系統播放,而藉由雙聲道立體聲播放系統仍可為聽眾提供優質的聆聽體驗。
傳統的降混方法中,各個多聲道音頻輸入經由個別處理器獨 立且分開處理,以產生一或兩個聲道輸出。各聲道上的處理程序並未恰當考量到兩個成對揚聲器之間有意義的資訊。因此,使用這類傳統降混方法得到的音頻輸出較為失真,且可能使身歷其境的聆聽體驗受到減損。
本發明的目的是發展一種成對處理輸入聲道的音頻降混處理管線,能夠使降混後所生成的輸出具有更高準確度,同時保留原本多聲道音頻流的空間資訊。聲道輸入及輸出的數量雖可以是定義範圍內任何有效數字,以下敘述採用5.1聲道降混為立體聲及7.1聲道降混為立體聲作為示例。
本發明一方面提出一種於運算裝置上執行的多聲道輸入音頻信號處理方法,該運算裝置具有一或多個處理器、記憶體,及儲存於該記憶體且由該一或多個處理器執行的複數個程式模組。該方法包括下列步驟:從該多聲道輸入音頻信號中選取一左輸入聲道及一右輸入聲道,其中該左輸入聲道及該右輸入聲道對應於一對空間上對稱之信號源;從該左輸入聲道及該右輸入聲道產生一或多個跨聲道特徵;根據該等跨聲道特徵處理該左輸入聲道及該右輸入聲道,以產生一左中間聲道及一右中間聲道;以及將該左中間聲道及該右中間聲道,分別與該多聲道輸入音頻信號的一第三輸入聲道結合,以形成一雙聲道輸出音頻信號。
本發明另一方面提出一種運算裝置,其包括:一或多個處理器;記憶體;及儲存於該記憶體中且由該一或多個處理器執行的複數個程式模組。當該複數個程式模組由一或多個處理器執行時,能使該運算裝置執行上述處理多聲道輸入音頻信號之方法。本發明又一方面提出一種電腦 程式產品,其儲存於一非暫態電腦可讀取儲存媒體,該儲存媒體與一運算裝置連結,且該運算裝置具有一或多個處理器,該電腦程式產品包括複數個程式模組,當該等程式模組由一或多個處理器執行時,會使該運算裝置執行上述處理多聲道音頻信號之方法。
100‧‧‧數據處理系統
102‧‧‧通訊架構
104‧‧‧處理器單元
106‧‧‧記憶體
108‧‧‧持久性儲存器
110‧‧‧通訊單元
112‧‧‧輸入/輸出單元
114‧‧‧顯示器
116‧‧‧揚聲器
118‧‧‧電腦可讀取儲存器媒體
120‧‧‧程式碼/模組
122‧‧‧電腦程式產品
222、224‧‧‧信號對
232、234‧‧‧PROC
240‧‧‧7.1環繞音效檔
242、244、246‧‧‧信號對
252、254、254、256‧‧‧PROC
410‧‧‧輸入信號對
420‧‧‧PROC/信號對處理器
422‧‧‧M/S混音器
424‧‧‧側邊信號
426‧‧‧中央分量(M)
428‧‧‧等化器(EQ)
430‧‧‧動態範圍壓縮器(DRC)
432‧‧‧串音消除模組(XTC)
434‧‧‧寬度控制器(WC)
436‧‧‧動態範圍壓縮器(DRC)
440‧‧‧輸出信號對
450‧‧‧帶通濾波信號
452‧‧‧殘餘信號
462、464、466‧‧‧放大器
472、474‧‧‧輸出信號對
476‧‧‧輸出信號
482、484、486‧‧‧寬度控制器(WC)
488‧‧‧立體聲輸出信號
500‧‧‧使用者介面(UI)
510‧‧‧左側面板
520、530、540‧‧‧控制區
602至630‧‧‧步驟
本說明書隨附圖式提供對本發明具體實施例更進一步的理解,並構成說明書之一部分,其繪示所述具體實施例且連同說明書詳細解釋本發明的工作原理。相似的元件編號用以表示類似的對應構件。
第一A圖係根據部分具體實施例,例示對一5.1聲道輸入信號實施傳統降混方法之方塊圖。
第一B圖係根據部分具體實施例,例示對一5.1聲道輸入信號實施傳統LoRo降混方法之方塊圖。
第一C圖係根據部分具體實施例,例示對一7.1聲道輸入信號執行環繞音效虛擬化或空間化的傳統降混方法之方塊圖。
第二圖係根據本發明之一例示性具體實施例,例示一經配置執行音頻降混的數據處理系統之方塊圖。
第三A圖至第三B圖係根據部分具體實施例,例示處理多聲道輸入信號之音頻降混管線方塊圖。
第四A圖係根據部分具體實施例的信號處理流程方塊圖,該信號處理流程包含一PROC,應用在一輸入信號對上。
第四B圖係根據部分具體實施例,例示應用在一7.1環繞音效檔之信號處理流程方塊圖。
第五圖係根據部分具體實施例,例示一軟體應用程式或其外掛程式元件之使用者介面,其係用於管理第四B圖所示之7.1環繞音效檔信號處理管線之執行。
第六A圖至第六C圖係根據部分具體實施例,例示一多聲道音頻信號降混方法之流程圖。
以下將進行本發明具體實施例之詳細說明,其示例描繪於隨附圖式中。下列敘述將詳細揭示數個非限制性的特定特徵,以協助了解本發明之標的。所屬技術領域中具通常知識者可明顯確知,在不脫離本發明申請專利範圍的情況下,本發明可以各種替代方式加以實施,且無需此處詳述之特定細節亦可實施本發明標的。舉例而言,所屬技術領域中具通常知識者將可明顯確知,本發明揭示之標的可實施於多種無線電通訊系統,例如智慧型手機與平板電腦。
請參閱圖式理解以下說明,圖式中方塊圖所例示之數據處理環境僅說明例示性實施例可據以實施之環境。應瞭解的是,所參照圖式僅為示例性質,並非意欲主張或暗示對於不同實施例可施作環境的限制,所描述之環境仍允許諸多修改。
請參閱第一A圖,該圖例示對一5.1輸入信號實施傳統降混方法之方塊圖。如第一A圖所示,各輸入聲道(即:L、C、R、Ls、Rs、LFE)不論與其他聲道的關係為何,均經過分別處理且傳送至各自的處理器模組(PROC)。處理器可包括一或多個子模組(圖中未顯示),例如增益、時間延遲、低通濾波器及/或其他音頻處理模組。每一處理模組對各別聲道進行 處理後的輸出可包括一或多個聲道,端視在處理模組中執行的程序類型而定。最後,在此例中,這些輸出加總(即:Σ)為一雙聲道音頻(即:L和R輸出聲道)。
請參閱第一B圖,該圖例示對一5.1輸入信號實施傳統單左聲道/單右聲道(LoRo)降混方法之方塊圖。各輸入聲道(即L、C、R、Ls、Rs、LFE)將分別通過一增益模組。增益的調整依照如同由環繞音效系統再現的實際位置而定。雖然環繞聲道可能比左/右聲道被減弱更多,但左側和右側聲道之間的關係是被忽略的。左聲道輸出是藉由將左側所有聲道相加,再加上減弱的C及LFE信號而產生。中央聲道被分為兩聲道,因為在立體聲重現的環境裡,中線上並無實體揚聲器。LFE也被分為兩聲道。右聲道輸出是藉由將右側所有聲道相加,再加上減弱的C及LFE信號而產生。在此例中,每一輸入聲道都由一單獨的處理器分別處理,其包括一簡易增益模組,處理器接收一單聲道輸入並產生一單或雙聲道輸出。最後,所有PROC輸出會依據該輸入所預定的再現位置被加總。
參閱第一C圖,該方塊圖例示對一7.1輸入信號進行環繞音效虛擬化或空間化之傳統降混方法。在此例中,對於輸入的多聲道音頻之各聲道(即:L、C、R、Lss、Rss、Lrs、Rrs、LFE),除了各別增益處理之外,還會由代表各實體揚聲器預定位置的頭部相關轉移函數(head-related transfer function,HRTF)各別處理,以產生一雙聲道輸出。舉例而言,左聲道輸入將由代表環繞音效系統中揚聲器左聲道的HRTF加以處理。類似處理程序亦應用於其他所有輸入聲道。所有依據各別輸入聲道產生的雙聲道輸出組將會被加總,分別形成左聲道輸出及右聲道輸出。在此例中,每個 輸入聲道亦由一單獨的處理器(例如包括一增益模組及一HRTF濾波器)分別進行處理。處理器會接收一單聲道輸入並產生一雙聲道輸出。所有雙聲道輸出將會被加總,形成最後的雙聲道輸出。
第二圖係根據本發明一例示性具體實施例,例示經配置以執行音頻降混處理的一數據處理系統100之方塊圖。在此示例中,數據處理系統100包括一通訊架構102,其提供一處理器單元104、一記憶體106、一持久性儲存器108、一通訊單元110、一輸入/輸出(I/O)單元112、一顯示器114,及一或多個揚聲器116之間的通訊。須注意的是,揚聲器116可內建於數據處理系統100之中,或外接於數據處理系統100。在部分實施例中,數據處理系統100的形式可為筆記型電腦、桌上型電腦、平板電腦、行動電話(例如:智慧型手機)、多媒體播放裝置、導航裝置、教育性裝置(例如:兒童學習玩具)、遊戲機系統、影音(AV)接收器,或控制裝置(例如:家用或工業用控制器)。
處理器單元104的功能是執行可裝載至記憶體106之軟體程式指令。處理器單元104可為包含一或多個處理器的一個套組,或可為一多核心處理器,依所需執行的特定工作而定。再者,處理器單元104可使用一或多個異質處理器系統實施,其中一主要處理器與次要處理器共同位於單一晶片上。另一示例中,處理器單元104可為對稱的多處理器系統,包含同樣類型的多個處理器。
在這些示例中,記憶體106可為隨機存取記憶體或任何其他合適的揮發性或非揮發性儲存裝置。持久性儲存器108可依特定的工作執行而採用不同的形態。舉例而言,持久性儲存器108可包含一或多個構件或裝 置,例如:硬碟、快閃記憶體、可複寫式光碟、可複寫式磁帶,或以上構件或裝置之組合。持久性儲存器108所使用的媒體亦可為可移除式。舉例而言,持久性儲存器108可使用可移除硬碟。
在這些示例中,通訊單元110提供與其他數據處理系統或裝置之通訊。在這些示例中,通訊單元110為一網路介面卡。通訊單元110可透過使用實體和無線通訊連結之其一或兩者,提供通訊功能。
輸入/輸出單元112提供與其他可連結於數據處理系統100的裝置間之數據輸入或輸出。舉例而言,輸入/輸出單元112可透過鍵盤和滑鼠,提供使用者一輸入連結設備。甚者,輸入/輸出單元112可傳送輸出至一印表機。顯示器114提供一資訊顯示機制予使用者。揚聲器116則向使用者播放音效。
作業系統指令及應用程式或程式位於持久性儲存器108上。這些指令可以被加載至記憶體106,供處理器單元104執行。以下各實施例中所述處理程序,可由處理器單元104使用位於記憶體(例如:記憶體106)上的電腦實施指令加以執行。這些指令稱為程式碼(或模組),電腦可用程式碼(或模組),或電腦可讀取程式碼(或模組),其可被處理器單元104中的一個處理器讀取並執行。這些不同實施例中的程式碼(或模組)可在各類實體的或有形的電腦可讀取媒體上具體化,例如記憶體106或持久性儲存器108。
程式碼/模組120位於一電腦可讀取儲存媒體118的一功能性形態上,該電腦可讀取儲存媒體118為可選擇為移動式的,程式碼/模組120亦可加載或傳輸至數據處理系統100,由處理器單元104加以執行。在這些 示例中,程式碼/模組120及電腦可讀取儲存媒體118構成一電腦程式產品122。在一示例中,電腦可讀取儲存媒體118可為有形形態,舉例而言,如***或置入持久性儲存器108一部分之硬碟機或其他裝置中之光碟或磁碟,以傳送資料至一儲存裝置,例如為持久性儲存器108一部分之硬碟機。如為有形形態,電腦可讀取儲存媒體118也可以為連結至數據處理系統100之持久性儲存器形式,例如:硬碟、隨身碟或快閃記憶體等。電腦可讀取儲存媒體118的有形形態亦可稱為電腦可記錄儲存媒體。在部分示例中,電腦可讀取儲存媒體118可能無法從數據處理系統100上移除。
或者,程式碼/模組120可透過與通訊單元110連結之一通訊連結方式和/或藉由與輸入/輸出單元112連接之構件,從電腦可讀取儲存媒體118傳輸至數據處理系統100。在示例中,此通訊連結方式和/或連接構件可為實體或無線。此電腦可讀取媒體亦可為非有形媒體形態,例如:包含程式碼/模組之通訊連結方式或無線傳輸方式。
繪示於數據處理系統100之不同構件並非為了對不同實施例之可能實施形態提供架構上的限制。這些不同的例示性實施例可於一數據處理系統上實施,該數據處理系統可包括所繪示的數據處理系統100構件以外的構件,或包括其他可替代之構件。其他於第一圖顯示之構件,可與示例所顯示之構件不同。
在一示例中,數據處理系統100之一儲存裝置為任何可儲存數據之硬體設備。記憶體106、持久性儲存器108及電腦可讀取儲存媒體118皆為有形儲存裝置之例。
在另一示例中,一匯流排系統可用來實施通訊架構102,且 由一或多個匯流排組成,例如一系統匯流排或輸入/輸出匯流排。匯流排系統的實施可使用任何合適的架構類型,提供與匯流排系統連結之不同構件或裝置間之資料傳輸。此外,通訊單元可包括用於傳送及接收數據之一或多個裝置,例如:數據機或網路配接器。再者,此處之記憶體舉例而言可為記憶體106或快取記憶體,其可能存在於通訊架構102之中的介面與記憶體控制器中樞。
為解決本發明背景中所述之傳統方法的問題,以下敘述本發明之不同具體實施例,其與成對降混輸入聲道之系統與方法相關,以提供更佳的音頻資訊準確度,並保留原多聲道音頻流的空間資訊。與傳統方式不同的是,輸入聲道間的關係是成對考量的,每一信號對會被各別傳送至一處理器。單一信號對所包含的信號資訊會被相互比較與分析,以創造更堅實的音像與更佳的空間效果。為使信號對具有意義,處理程序中至少一模組需就一信號對本身包含的信號資訊進行交互參照。各信號對之雙聲道輸出將與單聲道加總,以產生一左聲道輸出及一右聲道輸出。
第三A圖至第三B圖係根據本發明之部分實施例,例示處理多聲道輸入信號的音頻降混管線方塊圖。第三A圖中的多聲道輸入信號為一5.1環繞音效檔210,其包括一左前置聲道(L)、一中央前置聲道(C)、一右前置聲道(R)、一左側置聲道(Ls)、一右側置聲道(Rs)與一低頻效果聲道(LFE)。第三B圖中的多聲道輸入信號為一7.1環繞音效檔240,其包括一左前置聲道(L)、一中央前置聲道(C)、一右前置聲道(R)、一左側置環繞聲道(Lss)、一右側置環繞聲道(Rss)、一左後置環繞聲道(Lrs)、一右後置環繞聲道(Rrs)與一低頻效果聲道(LFE)。
在部分實施例中,本系統從多聲道輸入信號中挑選一或多個輸入信號對。在部分實施例中,一輸入信號對與欲在對稱兩側揚聲器上重現的兩組音頻流相對應。因此,此輸入信號對包括一對空間上對稱之信號源。在部分實施例中,一輸入信號對包括兩個聲道,其位於兩側(即:左側及右側)且與中線保持相同角度。舉例而言,前端對包括左前置(L)聲道及右前置(R)聲道,左側與右側各自與中線保持30°角。在另一例中為杜比7.1環繞音效設置,後端對包括左後置環繞(Lrs)聲道及右後置環繞(Rrs)聲道,左右各自與中線保持135°角。選出的每個輸入信號對接著被發送至各別的處理器(PROC),以產生一輸出音頻信號對。
在本發明部分實施例中,如第三A圖所示者,系統從5.1環繞音效檔之多輸入聲道中選取左前置聲道(L)及右前置聲道(R)成為一信號對222,並選取左側置聲道(Ls)及右側置聲道(Rs)成為一信號對224。在部分實施例中,如第三B圖所示者,系統從7.1環繞音效檔之多輸入聲道中選取左前置聲道(L)及右前置聲道(R)成為一信號對242,選取左側置環繞聲道(Lss)及右側置環繞聲道(Rss)成為一信號對244,以及選取左後置環繞聲道(Lrs)及右後置環繞聲道(Rrs)成為一信號對246。位於中線上的聲道(例如:中央前置聲道C)及全向式聲道(例如:LFE)各為單一聲道,而不會與其他任何聲道配對。
在部分實施例中,各信號對將分別被傳送進入一處理器。舉例而言,在第三A圖中,信號對222及224分別被傳送至PROC 232及234;在第三B圖中,信號對242、244、246分別被傳送至PROC 252、254、256。在此程序中,單一信號對所包含的信號資訊會被相互比較與分析,以創造更 堅實的音像與更佳的空間效果。為使信號對具有意義,在各個處理器PROC所包含的一或多個模組中,至少一個模組需交互參照一信號對內兩個聲道間的資訊。每一處理器PROC之輸出信號包括雙聲道,且各信號對之雙聲道輸出將與其他單一聲道之輸出進行加總(Σ),以產生包括一左聲道輸出(L’)及一右聲道輸出(R’)的輸出信號(如第三A圖和第三B圖分別所示)。
在部分實施例中,信號對處理器(PROC)可為任何可能的「二進二出」音頻信號處理器。如上所述,此處理器包括至少一個從一輸入信號對之中將跨聲道特徵合併的模組。在部分實施例中,一信號對處理器(PROC)包括一或多個從一輸入信號對讀取信號資訊的模組。基於此輸入信號對的信號資訊,信號對處理器(PROC)接著在成對的基礎上改變輸出流。
在部分實施例中,一信號對處理器(PROC)由複數個不同構件(或模組)組成,包括聲道非獨立處理構件及/或聲道獨立處理構件。在部分實施例中,聲道非獨立處理構件執行一「多聲道進、多聲道出」的處理程序,例如:一信號對處理器中的二進二出程序。在部分實施例中,聲道非獨立處理構件產生多個輸出聲道,其中每一輸出聲道係基於一個以上的輸入聲道產生。在部分實施例中,聲道非獨立處理構件利用輸入信號的資訊,並基於所提取的跨聲道特徵調整處理程序。在部分實施例中,跨聲道特徵包括各輸入聲道音量的比較、左右輸入聲道頻譜特性(例如:強度及/或相位)之間的關係,及/或左右輸入聲道信號開始之時間差和振幅差。在部分實施例中,信號對處理器(PROC)包括一或多個聲道非獨立處理構件,例如:M/S混音器(mid/side mixer,中央/兩側混音器)及/或寬度 控制器(WC)。舉例而言,M/S混音器可使用左右輸入信號的總和及差,產生中央及兩側信號。在另一例中,藉由比較輸入信號頻譜的重疊區域,M/S混音器可產生中央及兩側信號。
在部分實施例中,聲道獨立處理構件執行一「多聲道進、多聲道出」的程序(包括二進二出),分開處理多聲道輸入檔的每一個別聲道。在部分實施例中,聲道獨立處理構件處理多聲道輸入檔時,是把多個聲道當成被切分為同數量的單聲道信號進行處理,各個單聲道信號皆被獨立處理,再將多個聲道各別處理過後的單聲道信號全部加總。在部分實施例中,信號對處理器(PROC)包括一或多個聲道獨立處理構件,例如等化器(EQ)及/或動態範圍壓縮器(DRC)。舉例而言,一等化器(EQ)模組分別接收單一聲道,並產生相應的聲道,而不需使用其他聲道的任何資訊。等化器(EQ)的產出結果,即如同各聲道均使用相同的輸入參數分別進行等化處理。
第四A圖係根據本發明之部分實施例,例示將一PROC 420應用於一輸入信號對410之信號流程方塊圖。在部分實施例中,PROC 420包括複數個模組(亦稱為構件),該等模組經配置以處理輸入信號對410。在部分實施例中,PROC 420可為任何信號對處理器,例如第三A圖至第三B圖所示的PROC 232、PROC 234、PROC 252、PROC 254或PROC 256。因此,信號對處理器420可應用於任何輸入信號對,例如第三A圖至第三B圖所示的信號對222、信號對224、信號對242、信號對244或信號對246。在部分實施例中,信號對處理器420包括一M/S混音器422、一等化器(EQ)428、一動態範圍壓縮器(DRC)430及一串音消除(XTC)模組432,信號對處理器 420的上述構件相互耦接,如第四A圖所示。PROC 420之輸出信號會進一步由一寬度控制器(WC)434及另一動態範圍壓縮器(DRC)436處理,以獲得輸出信號對440,如第四A圖所示。
在部分實施例中,數據處理系統100首先傳送左、右輸入信號410進入M/S混音器422。在部分實施例中,M/S混音器422為一混音工具,經配置以從輸入信號對410中產生三個信號分量(signal components)(包括兩個側邊分量(S)424,即左側及右側,以及一中央分量(M)426)。左側分量代表只出現在左聲道的音源,而右側分量對應於只出現在右聲道的音源。中央分量為只出現在音場的幻象中央聲道(phantom center)之音源,例如:主要音樂元素及對白。
如此一來,M/S混音器422可分離出有助於各種後續音場增強處理的資訊,並將音質上不必要的失真(例如:音染)減至最低。再者,此一步驟也有助於降低左右分量的關聯性。在部分實施例中,M/S混音器422分析音象並對中央及左、右聲道而來的音效進行估測,之後M/S混音器422將兩個輸入聲道(即左側與右側信號410)分成單聲道的中央信號426及兩聲道的側邊信號424。有關M/S混音器422更詳細的說明,可見2015年10月27日提出申請,名稱為APPARATUS AND METHOD FOR SOUND STAGE ENHANCEMENT之PCT申請案(案號PCT/US2015/057616),其全文以併入參照方式納入本案。
接下來,系統發送側邊信號424至等化器(EQ)428以調整側邊信號424之頻率分量。在部分實施例中,兩個側邊信號424進入之等化器428包括一或多個多頻帶等化器,用以對兩個側邊信號執行帶通濾波功 能。在部分實施例中,應用於各個側邊信號之多頻帶等化器均相同。在部分其他實施例中,應用於一側邊信號之多頻帶等化器不同於應用在另一側邊信號之等化器。然而,其功能同樣是保持音頻信號原本的音色,且避免此兩信號出現模糊的空間線索。在部分實施例中,等化器428亦可用來基於兩側邊信號分量的頻譜分析,選取目標音源。在部分實施例中,如第四A圖所示者,等化器428產生兩個輸出信號450及452。在部分實施例中,輸出信號450及452各自為兩聲道的音頻信號。在部分實施例中,等化器428對每個兩聲道的側邊信號424分別使用帶通濾波器,以獲得帶通濾波信號450。
在部分實施例中,等化器428亦基於其輸入信號(即兩聲道的側邊信號424)及輸出信號(即兩聲道的帶通濾波信號450)之頻帶差,產生殘餘信號452。在部分實施例中,數據處理系統100藉由從帶通濾波處理後之左側分量及帶通濾波處理後之右側分量,分別減去左側分量及右側分量,而產生一左側殘餘分量及一右側殘餘分量。在部分實施例中,分別對殘餘信號及串音消除處理產生之生成信號應用了各別的放大器,以在兩信號結合前調整其增益。有關等化器428更詳細的說明,可見2015年10月27日提出申請,名稱為APPARATUS AND METHOD FOR SOUND STAGE ENHANCEMENT之PCT申請案(案號PCT/US2015/057616),其全文以併入參照方式納入本案。
在部分實施例中,帶通濾波信號450會被傳送至動態範圍壓縮器(DRC)430。在部分實施例中,動態範圍壓縮器430包括一帶通濾波器(與等化器428之帶通濾波器不同),用於在一預定頻率範圍內放大此兩個聲音信號(亦即:兩聲道的帶通濾波信號450),以將串音消除模塊(XTC) 432所達成之音場增強效果最大化。在部分實施例中,使用者(例如:音頻工程師)可調整動態範圍壓縮器430之帶通濾波器,以使一特定頻帶突出。如此一來,使用者可突顯其所選擇的某些特定聲音事件。舉例而言,數據處理系統100使用等化器428的第一帶通濾波器,對左側分量及右側分量執行等化處理後,接著使用動態範圍壓縮器430的第二帶通濾波器,針對左側分量及右側分量移除一預定頻帶。等化器模塊428及動態範圍壓縮器模塊430可使用之代表性帶通濾波器,包括雙二階濾波器或Butterworth濾波器。在部分實施例中,數據處理系統100使用等化器428之第一帶通濾波器對左側分量及右側分量執行等化處理後,接著使用動態範圍壓縮器430對左右側分量執行第一動態範圍壓縮,以突顯其他頻率的預定頻帶。有關動態範圍壓縮器430更詳細的說明,可見2015年10月27日提出申請,名稱為APPARATUS AND METHOD FOR SOUND STAGE ENHANCEMENT之PCT申請案(案號PCT/US2015/057616),其全文以併入參照方式納入本案。
在部分實施例中,信號從動態範圍壓縮器430輸出之後傳送至串音消除(XTC)模組432,以執行串音消除程序。串音是立體聲(即:雙聲道)音響揚聲器播放時既有的問題,會在聲音從各揚聲器到達相對側的耳中時發生,且會為原信號帶來不必要的頻譜音染。此問題的解決方法是串音消除(XTC)運算。其中一種XTC運算是使用廣義的方向性雙耳轉移函數,例如頭部相關轉移函數(HRTFs)及/或空間雙耳脈衝響應函數(BRIR),來表示相對於聽者位置的兩個實體揚聲器的角度。另一種XTC運算系統為遞迴式串音消除方法,該方法不需計算頭部轉移函數(HRTF)、空間雙耳脈衝響應函數(BRIR)或其他雙耳轉移函數。基本的運算方法可 以下列公式表示之:left[n]=left[n]-A L *right[n-d L ] right[n]=right[n]-A R *left[n-d R ]其中,A L 及A R 為信號之衰減係數,d L 及d R 為從個別揚聲器到相對側耳中發生延遲的數據樣本數。在部分實施例中,第四A圖所示之串音消除模組432使用遞迴式串音消除方法或廣義的方向性雙耳轉移函數。有關串音消除模組432更詳細的說明,可見2014年12月12日提出申請,名稱為APPARATUS AND METHOD FOR SOUND STAGE ENHANCEMENT之美國專利14/569,490號申請案(於2016年12月27日獲准,核准專利號9,532,156),以及2016年11月11日提出申請,名稱為APPARATUS AND METHOD FOR SOUND STAGE ENHANCEMENT之美國專利15/349,822號申請案,上述案件之全文以併入參照方式納入本案。
在如第四A圖所示之部分實施例中,串音消除模組432之輸出信號會被傳送至放大器462,殘餘信號對452被傳送至放大器464,中央分量(M)426亦被傳送至放大器466,接著上述三種信號再被傳送至寬度控制器(WC)434進行處理與結合。
在部分實施例中,放大器462、464、466之輸出信號被傳送至寬度控制器434以調整音場寬度。在部分實施例中,寬度控制器434使用經過分析的輸入信號對資訊來控制輸出音頻信號之音場寬度。音場寬度範圍可以從最窄為0°,到完全沉浸式音效的360°寬。在部分實施例中,會針對一信號對(例如:輸出信號對472或474)的跨聲道資訊進行分析及調整。在部分實施例中,使用者可以在寬度控制器上指定想要的音場寬度,如以 下第五圖所例示。指定的音場寬度可能基於先前分析之資訊,影響寬度控制器434之信號對求和矩陣。在部分實施例中,音場寬度可以下列等式進行調整:
在部分實施例中,寬度控制器434之輸出信號476會被傳送至第二動態範圍壓縮器(DRC)436,以放大音頻在母帶後期製作程序中聲音信號之整體輸出等級。在部分實施例中,數據處理系統100藉由動態範圍壓縮器436對左側分量及右側分量執行第二動態範圍壓縮,以保存數位音頻輸出信號之定位線索。
如第四A圖所示,此流程管線之輸出為一立體聲音頻信號440,其包括一左聲道(L’)及一右聲道(R’)。在部分實施例中,此一包括PROC 420的信號處理流程,可應用於如第三A圖所示的5.1環繞音效檔。舉例而言,第三A圖的PROC 232及/或PROC 234,可能近似於第四A圖所例示之PROC 420。
第四B圖之方塊圖為根據本發明部分具體實施例,例示應用於一7.1環繞音效檔之信號處理流程。同時參考第三B圖,在部分實施例中,7.1環繞音效檔的輸入信號被分類成不同的信號對,亦即L/R信號對242、Lss/Rss信號對244,以及Lrs/Rrs信號對246。接下來,L/R信號對242、Lss/Rss信號對244及Lrs/Rrs信號對246分別被傳送至PROC 252、PROC 254及PROC 256。在部分實施例中,每一各別的PROC 252、PROC 254及PROC 256均與第四A圖中所討論的PROC 420相似。在其他實施例中,PROC 252、PROC 254或PROC 256在不同配置下,可能包括一或多個其他模組(或構件)。PROC 252、PROC 254及PROC 256各自所輸出的信號,會被分別傳送至各自的寬度控制器,例如寬度控制器482、寬度控制器484以及寬度控制器486。寬度控制器482、寬度控制器484或寬度控制器486可與第四A圖中所討論的寬度控制器434相似。寬度控制器482、寬度控制器484以及寬度控制器486之輸出信號,會與中央信號C及低頻效果聲道信號LFE結合,產生立體聲音頻輸出信號488。
第五圖例示根據本發明部分實施例,一軟體應用程式或其外掛程式元件之使用者介面(UI)500,其係用以管理前述第四B圖所示7.1環繞音效檔信號處理管線之執行。該信號處理管線可包括複數個信號對處理器,例如第四A圖所例示之PROC 420。在此示例中共有三組信號對:前置信號對(L及R)、側置信號對(Lss及Rss)及後置信號對(Lrs及Rrs)。使用者介面500之左側面板510控制各別輸入聲道之增益。控制區520控制等化器(EQ)之頻率分量。控制區530控制寬度控制器之寬度。如參考第四B圖時所述,每一信號對會通過不同的信號對處理器PROC,而每一PROC使用不同的參數,因此控制區540可用來選擇欲處理的一信號對(例如:前置信號對、側置信號對或後置信號對),以輸入執行PROC處理程序時的參數。
如上所述,聲音在媒體及娛樂上扮演重要的角色,對觀眾產生情緒作用並使他們與故事連結。為使聽者擁有更身歷其境的聆聽體驗,於是發展出了多聲道環繞音效。多聲道音頻格式使用多個音軌,以在 一個對應的多聲道聲音重現系統上重建音效。降混可以在音頻的生成端以及重現端進行。在生成端,混音器通常從最多的聲道數開始混音,再降混至較少的聲道數。在重現端,一多聲道音軌可以被降混至較少的聲道數,以符合重現系統的聲道數。在兩種情況中,目標都是保持與原始創意構想相符的音效使用與配置。
傳統的降混方法如第一A圖至第一C圖所示,係對個別音軌各自應用一處理流程。音軌之間的關係並未列入考量。本文提出的方法和系統在成對的基礎上考量音頻輸入。首先將多聲道音軌依據重現系統的物理位置關係分類成對。其次,分析一信號對之中兩聲道間的關係。最後,基於分析結果,處理該信號對輸入。藉由納入各信號對之間的關係,原多聲道音頻輸入的空間資訊可被保存得更完善。因此,以相同的音頻輸入來說,使用本文介紹之系統及方法降混處理產生的多聲道音頻輸出,將會比用傳統方法降混更接近原本的多聲道音頻輸入,並創造出更準確的音效場域。
第六A圖至第六C圖係根據本發明之部分實施例,例示使用如第2圖之數據處理系統100進行多聲道音頻信號降混之流程圖。數據處理系統100從多聲道音頻輸入信號中選擇(步驟602)一左輸入聲道及一右輸入聲道。在部分實施例中,左輸入聲道及右輸入聲道對應一對在空間上對稱之信號源。在部分實施例中,多聲道音頻輸入信號例如為第三A圖中的5.1環繞音效檔210,或第三B圖中的7.1環繞音效檔240。在部分實施例中,5.1環繞音效輸入信號210包括一左前置聲道L及一右前置聲道R,其形成信號對222,以及一左側置聲道Ls及一右側置聲道Rs,其形成信號對224。在部分 實施例中,7.1環繞音效輸入信號240包括一左前置聲道L及一右前置聲道R,其形成信號對242;一左側置環繞聲道Lss及一右側置環繞聲道Rss,其形成信號對244;以及一左後置環繞聲道Lrs及一右後置環繞聲道Rrs,其形成信號對246。
數據處理系統100隨後從一選取信號對的左輸入聲道及右輸入聲道,產生(步驟604)一或多個跨聲道特徵。在部分實施例中,該一或多個跨聲道特徵包括比較一信號對左右輸入聲道的音量,左右輸入聲道頻譜特性(例如:強度和/或相位)之間的關係,及/或左右輸入聲道信號起始之時間差和振幅差。
數據處理系統100隨後依據跨聲道特徵,處理(步驟606)所選取信號對之左輸入聲道及右輸入聲道,以產生一左中間聲道及一右中間聲道。在部分實施例中,係使用如第三A圖至第三B圖、及第四A圖至第四B圖例示之處理器(PROC),處理一信號對之左輸入聲道及右輸入聲道。在部分實施例中,PROC如第四A圖所示,包括一或多個模組。
接著,數據處理系統100將每一左中間聲道及右中間聲道,與多聲道音頻輸入信號的一第三輸入聲道結合(步驟608),以形成一雙聲道音頻輸出信號。舉例而言,如第三A圖所示,由各別PROC處理的左中間聲道及右中間聲道(例如:L/R信號對或Ls/Rs信號對),係與中央聲道C和/或低頻效果聲道(LFE)結合,而產生雙聲道音頻輸出信號L’/R’。類似地,如第三B圖所示,由各別PROC處理的左中間聲道及右中間聲道(例如:L/R信號對、Lss/Rss信號對或Lrs/Rrs信號對),係與中央聲道C和/或低頻效果聲道(LFE)結合,而產生雙聲道音頻輸出信號L’/R’。
在聲學工程中,音場通常定義為音頻重現之最左側可感知位置到最右側可感知位置之間的區域。換句話說,音場為一聲音物件可被感知的最遠範圍。因此,音場寬度的定義為左右邊界之間的距離。在一般情況下,立體聲重現的音場寬度是兩個揚聲器間的距離。在本案中,則採用音場的概念分別應用在每一組對稱的聲道。舉例而言,在部分實施例中,數據處理系統100使用一寬度控制器(例如:寬度控制器434),進一步調整(步驟610)與左中間聲道及右中間聲道關聯的一音場寬度,再將左中間聲道、右中間聲道與第三輸入聲道結合。在部分實施例中,數據處理系統100接收(步驟612)一使用者輸入,其明確定出雙聲道音頻輸出信號之音場寬度。使用者輸入可在如第五圖所示的使用者介面500上接收。
在部分實施例中,處理左輸入聲道及右輸入聲道的步驟606,進一步包括從左輸入聲道及右輸入聲道提取(步驟614)一中央信號分量、一左側信號分量,及一右側信號分量。舉例而言,如第四A圖所例示,輸入信號對410由M/S混音器422處理,以產生一中央分量426以及一左側分量與右側分量S 424。在部分實施例中,數據處理系統100處理(步驟616)左側分量及右側分量,再將兩者與中央分量結合,以產生左中間聲道及右中間聲道。
在部分實施例中,處理左輸入聲道及右輸入聲道的步驟606,進一步包括使用一帶通濾波器對左側分量及右側分量執行(步驟618)等化處理(例如由第四A圖之等化器模塊428執行),以獲得一左帶通濾波分量及一右帶通濾波分量(例如等化器之輸出信號450)。在部分實施例中,等化處理步驟進一步基於左側分量與左帶通濾波分量之差,產生(步驟620) 一左側殘餘分量,以及基於右側分量與右帶通濾波分量之差,產生一右側殘餘分量,例如第四A圖所例示之左側殘餘分量及右側殘餘分量452。
在部分實施例中,對左側分量及右側分量執行等化處理後,數據處理系統100即對左帶通濾波分量及右帶通濾波分量(例如由第四A圖之等化器428所產生)分別執行(步驟622)一第一動態範圍壓縮(例如由第四A圖之動態範圍壓縮器430執行),以獲得相應的一左壓縮分量及一右壓縮分量。
在部分實施例中,數據處理系統100於執行完第一動態範圍壓縮後,分別對左壓縮分量及右壓縮分量(例如由第四A圖之動態範圍壓縮器430所產生)執行(步驟624)串音消除(例如由第四A圖之串音消除模組432執行),以獲得一串音消除左側分量及一串音消除右側分量。
在部分實施例中,數據處理系統100結合(步驟626)串音消除左側分量及串音消除右側分量、左側殘餘分量及右側殘餘分量、中央分量,以產生左中間聲道及右中間聲道。在部分實施例中,該結合步驟更進一步包括:調整(步驟628)與左中間聲道及右中間聲道關聯的一音場寬度(例如由第四A圖之寬度控制器434調整)後,再將兩者與第三輸入聲道結合。舉例而言,如第四B圖所示,由各別PROC產生的左、右中間聲道被傳送到各別之寬度控制器,以調整音場寬度。調整後的信號即與一第三輸入聲道(例如:C或LFE聲道)結合,產生立體聲輸出信號488。
在部分實施例中,在調整完音場寬度後,數據處理系統100執行(步驟630)一第二動態範圍壓縮(例如由第四A圖之動態範圍壓縮器436),以產生左中間聲道及右中間聲道。
最後,須注意的是,本發明可實施為完全硬體形態、完全軟體形態,或包括軟硬體元件之形態。在一較佳實施例中,本發明於軟體上實施,其包括但不限於韌體、常駐軟體、微程式碼等等。
此外,本發明可為一電腦程式產品,其係透過電腦可用或電腦可讀取媒體存取,提供可供電腦或任何指令執行系統使用或與之相關的程式碼。就本案說明書之目的而言,一電腦可用或電腦可讀取媒體可為任何有形裝置,該有形裝置可包含、儲存、通訊、傳播或傳送可供指令執行系統、裝置、元件使用或與其相關的程式。
此媒體可為一電子、磁性、光學、電磁、紅外線或半導體系統(或裝置或元件)或傳播媒體。電腦可讀取媒體的示例包括半導體或固態記憶體、磁帶、可移除式電腦硬碟、隨機存取記憶體(RAM)、唯讀式記憶體(ROM)、硬式磁碟機及光碟機。目前光碟的示例包括唯讀式的CD-ROM、可讀寫式的CD-R/W及DVD。
適合儲存及/或執行程式碼之數據處理系統包括至少一個處理器,其透過一系統匯流排直接或間接耦接至記憶體元件。該記憶體元件可包括實際執行程式碼期間所使用的本機記憶體、大容量儲存器以及快取記憶體,快取記憶體可提供至少部分程式碼之暫時儲存,以減少執行期間必須從大容量儲存器讀取程式碼的次數。在部分實施例中,數據處理系統以半導體晶片(例如:系統單晶片)的形態實施,其將一電腦的所有元件或其他電子系統整合為一單晶片基板。
輸入/輸出(I/O)裝置(包括但不限於鍵盤、顯示器、指向裝置等)可直接或透過中介I/O控制器耦接至系統。
網路配接器也可連接至系統,以使數據處理系統可透過中介之私人或公共網路與其他數據處理系統、遠端印表機或儲存裝置連接。數據機、纜線數據機及乙太網路卡是目前通用的一些網路配接器類型。
本發明說明書係作為例示和說明目的提出,但不為窮盡或限制所揭露之本發明形式。許多修飾和變更對所屬技術領域中具通常知識者為顯而易見。實施例的選擇及描述,目的在妥善解釋發明原理及實際應用,且使其他所屬技術領域中具有通常知識者透過諸多實施例理解本發明,並理解本發明可依據所想要的特定用途進行諸多修飾。
本文實施例說明之用語僅為敘述特定實施例使用,而非用以限制申請專利範圍。在實施例說明及所附申請專利範圍中使用之單數形字詞「一」、「一個」、「該」亦涵蓋複數形,除非上下文清楚指明其他意涵。本文之用語「及/或」,係指並包括一或多個所列項目相關之所有可能組合。並應進一步理解,本說明書中之用語「包含」及/或「包括」,係指存在所述之特徵、整體、步驟、操作、元件及/或構件,但不排除存在或增加一或多個其他特徵、整體、步驟、操作、元件、構件及/或組件。
亦須了解的是,雖然第一、第二等詞語可能在本文中用來描述不同元件,這些元件不應受該等詞語所限制。這些詞語旨在區隔某一元件與其他元件。舉例而言,一第一埠可能稱為第二埠,相同的,一第二埠可能稱為第一埠,而未偏離實施例之範圍。第一埠及第二埠均為埠,但非指同一個埠。
在閱讀上述詳細說明及相關圖式中所呈現的教示後,熟習該技術者將得以思及諸多對本文所揭露實施例之修飾及替代實施方式。因 此,須理解本案申請專利範圍並不限於所揭露之特定實施例,諸多修飾與其他實施方式亦應包括在所附申請專利範圍內。雖然本文使用某些特定詞語,但其僅屬概括與敘述性質,並非為限制之目的。
實施例的選擇及描述,目的在妥善解釋發明原理及其實際應用,以使其他熟習該技術者能夠妥善運用本發明原理及諸多實施方式,並依據所想要的特定用途進行諸多修飾。
Claims (42)
- 一種用於處理一多聲道輸入音頻信號之電腦實施方法,包含:在一運算裝置上執行,該運算裝置具有一或多個處理器、記憶體,以及儲存於該記憶體並由該一或多個處理器執行的複數個程式模組:從該多聲道輸入音頻信號選取一左輸入聲道及一右輸入聲道,其中該左輸入聲道及該右輸入聲道對應於一對空間上對稱之信號源;從該左輸入聲道及該右輸入聲道產生一或多個跨聲道特徵;根據該等跨聲道特徵處理該左輸入聲道及該右輸入聲道,以產生一左中間聲道及一右中間聲道;以及將該左中間聲道及該右中間聲道各自與該多聲道輸入音頻信號的一第三輸入聲道結合,以形成一雙聲道輸出音頻信號。
- 如申請專利範圍第1項所述之電腦實施方法,進一步包括:在與該第三輸入聲道結合前,先調整與該左中間聲道及該右中間聲道關聯的一音場寬度。
- 如申請專利範圍第2項所述之電腦實施方法,進一步包括:接收一使用者輸入,該使用者輸入指明該雙聲道輸出音頻信號之音場寬度。
- 如申請專利範圍第1項所述之電腦實施方法,其中處理該左輸入聲道及該右輸入聲道的步驟進一步包括:從該左輸入聲道及該右輸入聲道提取一中央分量、一左側分量及一右側分量;以及處理該左側分量及該右側分量,再將兩者與該中央分量結合以產生 該左中間聲道及該右中間聲道。
- 如申請專利範圍第4項所述之電腦實施方法,其中處理該左側分量及該右側分量的步驟進一步包括:使用一帶通濾波器對該左側分量及該右側分量執行等化處理,以獲得一左帶通濾波分量及一右帶通濾波分量;以及基於該左側分量與該左帶通濾波之差,產生一左側殘餘分量,以及基於該右側分量與該右帶通濾波分量之差,產生一右側殘餘分量。
- 如申請專利範圍第5項所述之電腦實施方法,進一步包括:對該左側分量及該右側分量執行完等化處理之後,對該左帶通濾波分量及該右帶通濾波分量分別執行一第一動態範圍壓縮,以獲得對應的一左壓縮分量及一右壓縮分量。
- 如申請專利範圍第6項所述之電腦實施方法,進一步包括:執行完該第一動態範圍壓縮後,分別對該左壓縮分量及該右壓縮分量執行串音消除,以獲得一串音消除左側分量及一串音消除右側分量。
- 如申請專利範圍第7項所述之電腦實施方法,進一步包括:結合該串音消除左側分量與該串音消除右側分量、該左側殘餘分量與該右側殘餘分量、該中央分量,以產生該左中間聲道及該右中間聲道,其中該結合步驟進一步包括:在與該第三輸入聲道結合前,先調整與該左中間聲道及該右中間聲道關聯的一音場寬度。
- 如申請專利範圍第8項所述之電腦實施方法,進一步包括:調整完該音場寬度後,執行一第二動態範圍壓縮,以產生該左中間 聲道及該右中間聲道。
- 如申請專利範圍第1項所述之電腦實施方法,其中該左輸入聲道為一左前置聲道,該右輸入聲道為一右前置聲道。
- 如申請專利範圍第1項所述之電腦實施方法,其中該左輸入聲道為一左環繞聲道,該右輸入聲道為一右環繞聲道。
- 如申請專利範圍第1項所述之電腦實施方法,其中該左輸入聲道為一左後置環繞聲道,該右輸入聲道為一右後置環繞聲道。
- 如申請專利範圍第1項所述之電腦實施方法,其中該第三輸入聲道為一中央聲道。
- 如申請專利範圍第1項所述之電腦實施方法,其中該第三輸入聲道為一低頻效果聲道。
- 一種用於處理一多聲道輸入音頻信號的運算裝置,該運算裝置包括:一或多個處理器;記憶體;及複數個程式模組,其儲存於該記憶體內並由該一或多個處理器執行,其中當該複數個程式模組由該一或多個處理器執行時,會使該運算裝置執行複數個步驟,包括:從該多聲道輸入音頻信號選取一左輸入聲道及一右輸入聲道,其中該左輸入聲道及該右輸入聲道對應於一對空間上對稱之信號源;從該左輸入聲道及該右輸入聲道產生一或多個跨聲道特徵;根據該等跨聲道特徵處理該左輸入聲道及該右輸入聲道,以產生一左中間聲道及一右中間聲道;以及 將該左中間聲道及該右中間聲道各自與該多聲道輸入音頻信號的一第三輸入聲道結合,以形成一雙聲道輸出音頻信號。
- 如申請專利範圍第15項所述之運算裝置,其中該運算裝置進一步執行:在與該第三輸入聲道結合前,先調整與該左中間聲道及該右中間聲道關聯的一音場寬度。
- 如申請專利範圍第16項所述之運算裝置,其中運算裝置進一步執行:接收一使用者輸入,該使用者輸入指明該雙聲道輸出音頻信號之音場寬度。
- 如申請專利範圍第15項所述之運算裝置,其中處理該左輸入聲道及該右輸入聲道的步驟進一步包括:從該左輸入聲道及該右輸入聲道提取一中央分量、一左側分量及一右側分量;以及處理該左側分量及該右側分量,再將兩者與該中央分量結合以產生該左中間聲道及該右中間聲道。
- 如申請專利範圍第18項所述之運算裝置,其中處理該左側分量及該右側分量的步驟進一步包括:使用一帶通濾波器對該左側分量及該右側分量執行等化處理,以獲得一左帶通濾波分量及一右帶通濾波分量;以及基於該左側分量與該左帶通濾波分量之差,產生一左側殘餘分量,以及基於該右側分量及該右帶通濾波分量之差,產生一右側殘餘分量。
- 如申請專利範圍第19項所述之運算裝置,其中該運算裝置進一步執行:對該左側分量及該右側分量執行完等化處理後,對該左帶通濾波分 量及該右帶通濾波分量分別執行一第一動態範圍壓縮,以獲得對應的一左壓縮分量及一右壓縮分量。
- 如申請專利範圍第20項所述之運算裝置,其中該運算裝置進一步執行:執行完該第一動態範圍壓縮後,分別對該左壓縮分量及該右壓縮分量執行串音消除,以獲得一串音消除左側分量及一串音消除右側分量。
- 如申請專利範圍第21項所述之運算裝置,其中該運算裝置進一步執行:結合該串音消除左側分量與該串音消除右側分量、該左側殘餘分量與該右側殘餘分量、該中央分量,以產生該左中間聲道及該右中間聲道,其中該結合步驟進一步包括:在與第三輸入聲道結合前,先調整與該左中間聲道及該右中間聲道關聯的一音場寬度。
- 如申請專利範圍第22項所述之運算裝置,其中該運算裝置進一步執行:調整完該音場寬度後,執行一第二動態範圍壓縮,以產生該左中間聲道及該右中間聲道。
- 如申請專利範圍第15項所述之運算裝置,其中該左輸入聲道為一左前置聲道,該右輸入聲道為一右前置聲道。
- 如申請專利範圍第15項所述之運算裝置,其中該左輸入聲道為一左環繞聲道,該右輸入聲道為一右環繞聲道。
- 如申請專利範圍第15項所述之運算裝置,其中該左輸入聲道為一左後置環繞聲道,右輸入聲道為一右後置環繞聲道。
- 如申請專利範圍第15項所述之運算裝置,其中該第三輸入聲道為一中央聲道。
- 如申請專利範圍第15項所述之運算裝置,其中該第三輸入聲道為一低頻效果聲道。
- 一電腦程式產品,其儲存於一非暫態電腦可讀取儲存媒體,該非暫態電腦可讀取儲存媒體與一運算裝置連結,該運算裝置具有一或多個處理器以處理一音頻信號,該電腦程式產品包括複數個程式模組,當該複數個程式模組由該一或多個處理器執行時,會使該運算裝置執行複數個步驟,包括:從多聲道輸入音頻信號選取一左輸入聲道及一右輸入聲道,其中該左輸入聲道及該右輸入聲道對應於一對空間上對稱之信號源;從該左輸入聲道及該右輸入聲道產生一或多個跨聲道特徵;根據該等跨聲道特徵處理該左輸入聲道及該右輸入聲道,以產生一左中間聲道及一右中間聲道;以及將該左中間聲道及該右中間聲道與該多聲道輸入音頻信號的一第三輸入聲道結合,以形成一雙聲道輸出音頻信號。
- 如申請專利範圍第29項所述之電腦程式產品,其中該運算裝置進一步執行:在與該第三輸入聲道結合前,先調整與該左中間聲道及右中間聲道關聯的一音場寬度。
- 如申請專利範圍第30項所述之電腦程式產品,其中該運算裝置進一步執行:接收一使用者輸入,該使用者輸入指明該雙聲道輸出音頻信號之音場寬度。
- 如申請專利範圍第29項所述之電腦程式產品,其中處理該左輸入聲道及該右輸入聲道的步驟進一步包括:從該左輸入聲道及該右輸入聲道提取一中央分量、一左側分量及一右側分量;以及處理該左側分量及該右側分量,再將兩者與該中央分量結合以產生該左中間聲道及該右中間聲道。
- 如申請專利範圍第32項所述之電腦程式產品,其中處理該左側分量及該右側分量的步驟進一步包括:使用一帶通濾波器對該左側分量及該右側分量執行等化處理,以獲得一左帶通濾波分量及一右帶通濾波分量;以及基於該左側分量與該左帶通濾波分量之差,產生一左側殘餘分量,以及基於該右側分量與該右帶通濾波分量之差,產生一右側殘餘分量。
- 如申請專利範圍第33項所述之電腦程式產品,其中該運算裝置進一步執行:對該左側分量及該右側分量執行完等化處理後,對該左帶通濾波分量及該右帶通濾波分量分別執行一第一動態範圍壓縮,以獲得對應的一左壓縮分量及一右壓縮分量。
- 如申請專利範圍第34項所述之電腦程式產品,其中該運算裝置進一步執行:執行完該第一動態範圍壓縮後,分別對該左壓縮分量及該右壓縮分量執行串音消除,以獲得一串音消除左側分量及一串音消除右側分量。
- 如申請專利範圍第35項所述之電腦程式產品,其中該運算裝置進一步執 行:結合該串音消除左側分量與該串音消除右側分量、該左側殘餘分量與右側殘餘分量、該中央分量,以產生該左中間聲道及該右中間聲道,其中該結合步驟進一步包括:在與該第三輸入聲道結合前,先調整與該左中間聲道及該右中間聲道關聯的一音場寬度。
- 如申請專利範圍第36項所述之電腦程式產品,其中該運算裝置進一步執行:調整完該音場寬度後,執行一第二動態範圍壓縮,以產生該左中間聲道及該右中間聲道。
- 如申請專利範圍第29項所述之電腦程式產品,其中該左輸入聲道為一左前置聲道,該右輸入聲道為一右前置聲道。
- 如申請專利範圍第29項所述之電腦程式產品,其中該左輸入聲道為一左環繞聲道,該右輸入聲道為一右環繞聲道。
- 如申請專利範圍第29項所述之電腦程式產品,其中該左輸入聲道為一左後置環繞聲道,該右輸入聲道為一右後置環繞聲道。
- 如申請專利範圍第29項所述之電腦程式產品,其中該第三輸入聲道為一中央聲道。
- 如申請專利範圍第29項所述之電腦程式產品,其中該第三輸入聲道為一低頻效果聲道。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762460584P | 2017-02-17 | 2017-02-17 | |
US62/460,584 | 2017-02-17 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW201843675A true TW201843675A (zh) | 2018-12-16 |
Family
ID=63169877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107105810A TW201843675A (zh) | 2017-02-17 | 2018-02-21 | 降混多聲道音頻信號的裝置和方法 |
Country Status (6)
Country | Link |
---|---|
EP (1) | EP3583786A4 (zh) |
JP (1) | JP2020508590A (zh) |
KR (1) | KR20190109726A (zh) |
CN (1) | CN109644315A (zh) |
TW (1) | TW201843675A (zh) |
WO (1) | WO2018151858A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI732684B (zh) * | 2019-10-10 | 2021-07-01 | 美商博姆雲360公司 | 用於處理一多通道輸入音訊信號之系統、方法及非暫時性電腦可讀媒體 |
TWI765325B (zh) * | 2019-10-10 | 2022-05-21 | 美商博姆雲360公司 | 使用頻譜正交音訊分量之副頻帶空間及串擾處理 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR3091636B1 (fr) * | 2019-01-04 | 2020-12-11 | Parrot Faurecia Automotive Sas | Procédé de traitement d’un signal audio multicanal |
CN110853658B (zh) * | 2019-11-26 | 2021-12-07 | 中国电影科学技术研究所 | 音频信号的下混方法、装置、计算机设备及可读存储介质 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2000242253A1 (en) * | 2000-04-10 | 2001-10-23 | Harman International Industries Incorporated | Creating virtual surround using dipole and monopole pressure fields |
CN1233200C (zh) * | 2003-03-04 | 2005-12-21 | Tcl王牌电子(深圳)有限公司 | 一种基于fpga的5.1声道虚拟声重放方法以及装置 |
KR100644617B1 (ko) * | 2004-06-16 | 2006-11-10 | 삼성전자주식회사 | 7.1 채널 오디오 재생 방법 및 장치 |
US7853022B2 (en) * | 2004-10-28 | 2010-12-14 | Thompson Jeffrey K | Audio spatial environment engine |
US7751572B2 (en) * | 2005-04-15 | 2010-07-06 | Dolby International Ab | Adaptive residual audio coding |
KR101277041B1 (ko) * | 2005-09-01 | 2013-06-24 | 파나소닉 주식회사 | 멀티 채널 음향 신호 처리 장치 및 방법 |
US8050434B1 (en) * | 2006-12-21 | 2011-11-01 | Srs Labs, Inc. | Multi-channel audio enhancement system |
US8346380B2 (en) * | 2008-09-25 | 2013-01-01 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
UA101542C2 (ru) * | 2008-12-15 | 2013-04-10 | Долби Лабораторис Лайсензин Корпорейшн | Виртуализатор окружающего звука с динамическим сжатием диапазона и способ |
CN102687536B (zh) * | 2009-10-05 | 2017-03-08 | 哈曼国际工业有限公司 | 用于音频信号的空间提取的*** |
WO2012094335A1 (en) * | 2011-01-04 | 2012-07-12 | Srs Labs, Inc. | Immersive audio rendering system |
TWI479905B (zh) * | 2012-01-12 | 2015-04-01 | Univ Nat Central | Multi-channel down mixing device |
JP6251809B2 (ja) * | 2013-12-13 | 2017-12-20 | アンビディオ,インコーポレイテッド | サウンドステージ拡張用の装置及び方法 |
KR20180075610A (ko) * | 2015-10-27 | 2018-07-04 | 앰비디오 인코포레이티드 | 사운드 스테이지 향상을 위한 장치 및 방법 |
-
2018
- 2018-02-16 KR KR1020197007657A patent/KR20190109726A/ko unknown
- 2018-02-16 WO PCT/US2018/000075 patent/WO2018151858A1/en unknown
- 2018-02-16 EP EP18754857.3A patent/EP3583786A4/en not_active Withdrawn
- 2018-02-16 CN CN201880003285.0A patent/CN109644315A/zh active Pending
- 2018-02-16 JP JP2019503460A patent/JP2020508590A/ja active Pending
- 2018-02-21 TW TW107105810A patent/TW201843675A/zh unknown
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI732684B (zh) * | 2019-10-10 | 2021-07-01 | 美商博姆雲360公司 | 用於處理一多通道輸入音訊信號之系統、方法及非暫時性電腦可讀媒體 |
US11284213B2 (en) | 2019-10-10 | 2022-03-22 | Boomcloud 360 Inc. | Multi-channel crosstalk processing |
TWI765325B (zh) * | 2019-10-10 | 2022-05-21 | 美商博姆雲360公司 | 使用頻譜正交音訊分量之副頻帶空間及串擾處理 |
US11432069B2 (en) | 2019-10-10 | 2022-08-30 | Boomcloud 360, Inc. | Spectrally orthogonal audio component processing |
Also Published As
Publication number | Publication date |
---|---|
CN109644315A (zh) | 2019-04-16 |
KR20190109726A (ko) | 2019-09-26 |
JP2020508590A (ja) | 2020-03-19 |
WO2018151858A1 (en) | 2018-08-23 |
EP3583786A1 (en) | 2019-12-25 |
EP3583786A4 (en) | 2020-12-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10299057B2 (en) | Apparatus and method for sound stage enhancement | |
US9552840B2 (en) | Three-dimensional sound capturing and reproducing with multi-microphones | |
RU2564050C2 (ru) | Способ и устройство для воспроизведения трехмерного звука | |
US9794715B2 (en) | System and methods for processing stereo audio content | |
US20050053249A1 (en) | Apparatus and method for rendering audio information to virtualize speakers in an audio system | |
TW201843675A (zh) | 降混多聲道音頻信號的裝置和方法 | |
EP2870782B1 (en) | Audio precompensation controller design with pairwise loudspeaker symmetry | |
JP2008516539A5 (zh) | ||
JP2008522483A (ja) | 多重チャンネルオーディオ入力信号を2チャンネル出力で再生するための装置及び方法と、これを行うためのプログラムが記録された記録媒体 | |
JP2021505064A (ja) | クロストークプロセッシングb−チェーン | |
CN101902679A (zh) | 立体声音频信号模拟5.1声道音频信号的处理方法 | |
KR101871234B1 (ko) | 사운드 파노라마 생성 장치 및 방법 | |
EP2484127B1 (en) | Method, computer program and apparatus for processing audio signals | |
EP3225039B1 (en) | System and method for producing head-externalized 3d audio through headphones | |
JP7370415B2 (ja) | 空間オーディオ信号のクロストーク処理のためのスペクトル欠陥補償 | |
US8116469B2 (en) | Headphone surround using artificial reverberation | |
US11924628B1 (en) | Virtual surround sound process for loudspeaker systems | |
JP2020039168A (ja) | サウンドステージ拡張のための機器及び方法 |