TWI424754B - 利用側邊資訊之聲道重新組配技術 - Google Patents

利用側邊資訊之聲道重新組配技術 Download PDF

Info

Publication number
TWI424754B
TWI424754B TW095119160A TW95119160A TWI424754B TW I424754 B TWI424754 B TW I424754B TW 095119160 A TW095119160 A TW 095119160A TW 95119160 A TW95119160 A TW 95119160A TW I424754 B TWI424754 B TW I424754B
Authority
TW
Taiwan
Prior art keywords
audio
channel
audio signals
instructions
signals
Prior art date
Application number
TW095119160A
Other languages
English (en)
Other versions
TW200715901A (en
Inventor
Alan Jeffrey Seefeldt
Mark Stuart Vinton
Charles Quito Robinson
Original Assignee
Dolby Lab Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Lab Licensing Corp filed Critical Dolby Lab Licensing Corp
Publication of TW200715901A publication Critical patent/TW200715901A/zh
Application granted granted Critical
Publication of TWI424754B publication Critical patent/TWI424754B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)

Description

利用側邊資訊之聲道重新組配技術 發明領域
本發明係有關於利用側邊資訊之聲道重新組配技術。
發明背景
在廣泛採用DVD播放器下,多聲道(多於二聲道)音頻播放系統在家用中已變成普遍的。此外,多聲道音頻系統在汽車中正變得更普遍的。且下一代之衛星與地面數位無線電系統渴望要傳遞多聲道內容至成長數目之多聲道播放環境。然而在很多情形中,多聲道內容之佯裝的提供者會面對此材料之缺乏。例如,大多數之流行音樂仍只存在為二聲道之立體聲(「立體聲」)軌。如此,其對將以單音(「單聲道」)或立體聲格式存在之此種「舊有」內容「向上混頻」成為多資訊格式。
習知技藝之解決方案存在用於達成此變換。例如,Dolby Pro Logic II可採用原始立體聲記錄且根據由立體聲記錄本身被導出之操縱資訊產生多聲道向上混頻。”Dolby”,”Pro Logic”與”Pro Logic II”為Dolby Laboratories Licensing Corporation之註冊商標。為了傳遞此向上混頻至消費者,一內容提供者可在生產之際對該舊有內容施用一向上混頻解決方案,及然後透過如Dolby Digital之一些適合的多聲道傳遞格式傳輸該結果所得之多聲道信號至一消費者。”Dolby Digital”為Dolby Laboratories Licensing Corporation之註冊商標。替選的是,未變更之舊有內容可被傳遞給消費者,其然後可在播放之際施用向上混頻處理。在前者之情形中,內容提供者對向上混頻被創立之方式有完整之控制,其由內容提供者之觀點為所欲的。此外,在生產側之處理限制一般為比播放側少很多,所以使用更複雜之向上混頻技術的可能性存在。然而在生產側之向上混頻具有一些缺點。首先,多聲道信號之傳輸比舊有信號因音頻聲道之數目增加而為更昂貴的。同時,若消費者沒有多聲道播放系統,被傳輸之多聲道信號典型上在被播放前須被向下混頻。此被向下混頻之信號一般與原始舊有內容不相同且在很多情形之音響劣於原始者。
第1圖與第2圖分別顯示剛所描述之在生產與消費端被施用之習知技藝的向上混頻技術例子。這些例子假設原始信號包含M=2聲道及被向上混頻之信號包含N=6聲道。在第1圖之例子,向上混頻在生產端被執行,而在第2圖中向上混頻在消費端被執行。在第2圖中之向上混頻器只接收其對之將執行向上混頻的音頻信號,此有時被稱為「盲目」向上混頻。
參照第1圖,在一音頻系統之生產部分2中,構成M聲道原始信號之一個或多個音頻信號(在此處知此圖與其他圖中,每一音頻信號可代表一聲道,如左聲道、右聲道等)被施用至一向上混頻裝置或向上混頻功能(「向上混頻」)4,其產生構成N聲道向上混頻信號之增加數目的音頻信號。該等向上混頻信號被施用至一格式化裝置或格式化功能(「格式化」)6,其將N聲道向上混頻信號格式化成為適於傳輸或儲存之形式。該格式化可包括資料壓縮編碼。被格式化知信號被音頻系統之消費部分8接收,其中一解除格式化功能或解除格式化器裝置(「解除格式化」)10恢復被格式化之信號為N聲道向上混頻信號(或其近似者)。如上面被討論者,在一些情形中一解除格式化器裝置或解除格式化功能(「解除格式化」)12亦將N聲道向上混頻信號向下混頻成為M聲道向下混頻信號(或其近似者),此處M<N。
參照第2圖,在一音頻系統之生產部分14中,構成M聲道原始信號之一個或多個音頻信號被施用至一格式化器裝置或格式化功能(「格式化」)6,此將其格式化成為適於傳輸或儲存之形式(在此與其他圖中,相同之元件編號就在不同圖中基本上相同的裝置與功能被使用)。該格式化可包括資料壓縮編碼。被格式化之信號被音頻系統之消費部分16接收,其中一解除格式化功能或解除格式化器裝置(「解除格式化」)10恢復被格式化之信號為M聲道原始信號(或其近似者)。M聲道原始信號可被提供作為一輸出,且其亦被施用至一向上混頻功能或向上混頻裝置(「向上混頻」)18,其將M聲道原始信號向上混頻以產生N聲道向上混頻信號。
發明概要
本發明之層面提供對第1與2圖之配置的替選方式。例如依據本發明之某些層面,非在生產或消費端將舊有內容向上混頻地,例如在一編碼器用一處理分析舊有內容可產生輔助之「側邊」或「側鏈」資訊,其以某些方式與舊有內容音頻資訊一起被傳送至例如為解碼器之進一步處理。其中側邊資訊被傳送至方式對本發明並非關鍵的,很多側邊資訊之傳送方法為習知的,例如包括在音頻資訊中埋入側邊資訊(如將之隱藏)或利用分離地傳送側邊資訊(如在其本身之位元串流或與音頻資訊被多工)。「編碼器」與「解碼器」在此文意中分別指與生產相關之裝置或處理與消費相關之裝置或處理-此類裝置與處理可或不包括資料「編碼」與「解碼」。編碼器所產生之側邊資訊可指示解碼器如何將舊有內容向上混頻。因而,解碼器以側邊資訊之助提供向上混頻。雖然向上混頻技術之控制可能位於生產端,消費者仍可接收未被變更之舊有內容,其在多聲道播放系統若不為可得可用的時可未被變更地被播放。此外,顯著的處理功率可在一編碼器被運用以分析舊有內容並為高品質向上混頻產生側邊資訊而因解碼器只施用側邊資訊而非將之傳遞而允許解碼器運用顯著地較少的處理資源。最終,此向上混頻側邊資訊之傳輸成本典型上非常地低。
雖然本發明與其各種層面可涉及類比或數位信號,在實務應用中大多數或所有處理功能可對在數位信號串流之數位域中被執行,其中音頻信號以樣本被呈現。依據本發明之信號處理可對多頻帶處理器之每一頻帶或對寬帶信號被施用,且依施作而定地可對每一樣本被執行一次或在數位音頻被分為區塊時對每組樣本(如一區塊之樣本)被執行一次。多頻帶實施例可運用濾波器排組或一變換組配。因而,在配合第3、4A-4C、5A-5C與6圖被顯示及被描述的本發明之實施例可接收時域中的數位信號(如PCM信號)並將之施用至適合的時間對頻率變換器或變換功能用於在多頻帶中處理,此些頻帶可能與人耳之關鍵頻帶有關。在處理後該等信號可被變換回到時域。在原理上,濾波器排組或變換可被運用以達成時間對頻率變換與其逆處理。本發明之層面的一些實施例之細節在此處被描述為運用時間對頻率變換即為短時間離散傅立葉變換(STDFT)。然而其將被了解本發明在其各層面中不受限於使用任何特定時間對頻率變換器或變換處理。
依照本發明之一層面,一種用於處理至少一音頻信號或具有之聲道與該至少一音頻信號相同的該至少一音頻信號之一修改的方法,每一音頻信號代表一音頻聲道,該方法包含:導出指令用於將該至少一音頻信號或其修改重新組配,其中該導出所只接收的音頻資訊為該至少一向上混頻或其修改;以及提供一輸出,其包括:(1)該至少一音頻信號或其修改,及(2)用於重新組配之指令,但在此聲道重新組配係由用於聲道重新組配的指令之結果時,不包括該至少一音頻信號或其修改的任何聲道重新組配。該等至少一音頻信號與其修改之每一個可為二個或更多音頻信號,在此情形中,該等被修改之二個或多個信號可為一矩陣編碼修改且在如用矩陣解碼器或有作用之矩陣解碼器被解碼時,該等被修改之二個或多個信號可為一矩陣編碼修改且在如用矩陣解碼器或有作用之矩陣解碼器被解碼時,該等被修改之二個或多個音頻信號可針對未被修改之二個或多個音頻信號的解碼提供改良式的多聲道解碼。該解碼「被改良」之意義為如矩陣解碼器的解碼器之任何相當習知的效能特徵,例如包括聲道隔離、空間成像與影像穩定性等。
不論該等至少一音頻信號與其修改是否為二個或多個音頻信號,其就聲道重新組配指令有數種替代方案。依據一替代方案,該等指令為用於將該等至少一音頻信號或其修改向上混頻,使得在依照用於向上混頻之指令被向上混頻時,結果所得之音頻信號數目大於包含該等至少一音頻信號或其修改之音頻信號數目。依據用於聲道重新組配指令之另一替代方案,該等至少一音頻信號與其修改為二個或多個音頻信號。在此其他替代方案之第一個中,該等指令為用於將該等至少一音頻信號或其修改向下混頻,使得在依照用於向下混頻之指令被向下混頻時,結果所得之音頻信號數目小於包含該等至少一音頻信號或其修改之音頻信號數目。在此其他替代方案之第二個中,該等指令為用於重新組配,音頻信號之數目維持相同,但此類音頻信號被欲再生之一個或多個空間位置被改變。在輸出中之該等至少一音頻信號與其修改可分別為該等至少一音頻信號與其修改的資料壓縮後的版本。
在任一替代方案中及不論資料壓縮是否被運用,指令可不須參照由用於聲道重新組配結果所得之任何聲道重新組配地被導出。該至少一音頻信號可被分割為頻帶,及用於聲道重新組配之指令可為針對這類頻帶的個別者。本發明之其他層面包括實作此類方法的音頻編碼器。
依據本發明之另一層面,一種用於處理至少一音頻信號或具有之聲道與該至少一音頻信號相同的該至少一音頻信號之一修改的方法,每一音頻信號代表一音頻聲道,該方法包含:導出指令用於將該至少一音頻信號或其修改重新組配,其中該導出所只接收的音頻資訊為該至少一向上混頻或其修改;以及提供一輸出,其包括:(1)該至少一音頻信號或其修改,及(2)用於重新組配之指令,但在此聲道重新組配係由用於聲道重新組配的指令之結果時,不包括該至少一音頻信號或其修改的任何聲道重新組配;以及接收該輸出。
該方法可進一步包含使用為聲道重新組配所接收之指令來將被接收的該等至少一音頻信號與其修改聲道重新組配。該等至少一音頻信號與其修改之每一個可為二個或更多音頻信號,在此情形中,該等被修改之二個或多個信號可為一矩陣編碼修改且在如用矩陣解碼器或有作用之矩陣解碼器被解碼時,該等被修改之二個或多個信號可為一矩陣編碼修改且在如用矩陣解碼器或有作用之矩陣解碼器被解碼時,該等被修改之二個或多個音頻信號可針對未被修改之二個或多個音頻信號的解碼提供改良式的多聲道解碼。「被改良」以與上述本發明之第一層面相同的意義被使用。
如本發明之第一層面者,其就聲道重新組配指令有替代方案-例如為向上混頻、向下混頻與重新組配,使得音頻信號之數目維持相同,但此類音頻信號被欲再生之一個或多個空間位置被改變。如本發明之第一層面者,在輸出中之該等至少一音頻信號與其修改可分別為該等至少一音頻信號與其修改的資料壓縮後的版本。在此情形中該接收可包括將該等至少一音頻信號或其修改解壓縮。在任一替代方案中及不論資料壓縮與解壓縮是否被運用,指令可不須參照由用於聲道重新組配結果所得之任何聲道重新組配地被導出。
如本發明之第一層面者,該至少一音頻信號可被分割為頻帶,及用於聲道重新組配之指令可為針對這類頻帶的個別者。當本方法進一步包含使用為聲道重新組配所接收之聲道重新組配來將被接收的該等至少一音頻信號與其修改聲道重新組配時,該方法可還進一步包含提供一音頻輸出;以及選擇:(1)該等至少一音頻信號或其修改或(2)被聲道重新組配之至少一向上混頻的其中之一作為音頻輸出。
不論本方法是否進一步包含使用為聲道重新組配所接收之聲道重新組配來將被接收的該等至少一音頻信號與其修改聲道重新組配,本方法可進一步包含在響應被接收之該等至少一音頻信號或其修改下提供一音頻輸出,在此情形中,當音頻輸出中之該等至少一音頻信號與其修改為二個或多個音頻信號時,該方法可進一步包含將該等二個或多個音頻信號解碼。
當本方法進一步包含使用為聲道重新組配所接收之指令來將被接收的至少一音頻信號或其修改加以重新組配時,該方法還可進一步包含提供一音頻輸出。
一種用於處理至少一音頻信號或具有之聲道與該至少一音頻信號相同的該至少一音頻信號之一修改的方法,每一音頻信號代表一音頻聲道,該方法包含:接收該等至少一音頻信號或其修改與用於將該等至少一音頻信號或其修改聲道重新組配之指令,但不包括對由用於聲道重新組配之指令結果所得的該等至少一音頻信號或其修改之聲道重新組配,該等指令已用一指令導出被導出,其中唯一被接收之音頻資訊為該等至少一音頻信號或其修改;以及使用該等指令將該等至少一音頻信號或其修改聲道重新組配。該方法可進一步包含使用為聲道重新組配所接收之聲道重新組配來將被接收的該等至少一音頻信號與其修改聲道重新組配。該等至少一音頻信號與其修改之每一個可為二個或更多音頻信號,在此情形中,該等被修改之二個或多個信號可為一矩陣編碼修改且在如用矩陣解碼器或有作用之矩陣解碼器被解碼時,該等被修改之二個或多個信號可為一矩陣編碼修改且在如用矩陣解碼器或有作用之矩陣解碼器被解碼時,該等被修改之二個或多個音頻信號可針對未被修改之二個或多個音頻信號的解碼提供改良式的多聲道解碼。「被改良」以與上述本發明之其他層面相同的意義被使用。
如本發明之其他層面者,其就聲道重新組配指令有替代方案-例如為向上混頻、向下混頻與重新組配,使得音頻信號之數目維持相同,但此類音頻信號被欲再生之一個或多個空間位置被改變。
如本發明之其他層面者,在輸出中之該等至少一音頻信號與其修改可分別為該等至少一音頻信號與其修改的資料壓縮後的版本。在此情形中該接收可包括將該等至少一音頻信號或其修改解壓縮。在任一替代方案中及不論資料壓縮與解壓縮是否被運用,指令可不須參照由用於聲道重新組配結果所得之任何聲道重新組配地被導出。
如本發明之其他層面者,該至少一音頻信號可被分割為頻帶,及用於聲道重新組配之指令可為針對這類頻帶的個別者。當本方法進一步包含使用為聲道重新組配所接收之聲道重新組配來將被接收的該等至少一音頻信號與其修改聲道重新組配時,該方法可還進一步包含提供一音頻信號;以及選擇:(1)該等至少一音頻信號或其修改或(2)被聲道重新組配之至少一向上混頻的其中之一作音頻輸出。且該等二個或多個音頻信號被矩陣解碼。依據還另一替選方案,本發明之此層面可進一步包含在響應該等被聲道重新組配之至少一音頻信號下提供一音頻輸出。本發明之其他層面包括實作任一此類方法的一音頻解碼器。
依照本發明另一層面,一種用於處理至少一音頻信號或具有之聲道與該至少一音頻信號相同的該至少一音頻信號之一修改的方法,每一音頻信號代表一音頻聲道,該方法包含:接收該等至少二音頻信號與用於重新組配該等至少二音頻信號之指令,但不包括對由用於聲道重新組配的該等指令結果所得之該等至少二音頻信號的聲道重新組配,該等指令已用一指令導出被導出,其中唯一被接收之音頻資訊為該等至少二音頻信號;以及將該等二個或多個音頻信號矩陣解碼。該矩陣解碼有無參照該等被接收之指令均可。在被解碼時,該等被修改之二個或多個音頻信號可針對未被修改之二個或多個音頻信號的解碼提供改良式之多聲道解碼。該等被修改之二個或多個音頻信號可為矩陣編碼修改,且在用如矩陣解碼器或有作用的矩陣解碼器被解碼時,該等被修改之二個或多個音頻信號可針對未被修改之二個或多個音頻信號的解碼提供改良式之多聲道解碼。「被改良」以與上述本發明之其他層面相同的意義被使用。本發明之其他層面包括實作任一此類方法的一音頻解碼器。
在本發明還進一步之層面中,二個或多個音頻信號之每一個音頻信號代表一音頻聲道,其被修改使該等修改後之信號在同一矩陣解碼器被解碼後針對未被修改之信號的解碼提供改良式之多聲道解碼。此可藉由修改該等音頻信號間之本質信號特徵的一個或多個差異而被完成。此類本質信號特徵可包括振幅與相位二者或其中之一。修改該等音頻信號間之本質信號特徵的一個或多個差異可包括將該等被修改之信號向上混頻為較大數目的信號,及使用一矩陣解碼器將已向上混頻後之信號向下混頻。替選的是,修改該等音頻信號間之本質信號特徵的一個或多個差異亦可包括提高或降低該等音頻信號間之交叉相關。該等音頻信號間之交叉相關可在一個或多個頻帶中各式各樣地被提高及/或降低。
本發明之其他層面包括:(1)被適應於執行此處所描述之方法的任一方法之裝置;(2)用於致使電腦執行此處所描述之方法的任一方法之被儲存於電腦可讀取的媒體上之電腦程式;(3)用此處所描述的方法之一被產生的位元串流;以及用被適應於執行此處所描述的方法之裝置被產生的位元串流。
圖式簡單說明
第1圖為用於將具有一生產部分與一消費部分向上混頻,其中向上混頻為在該生產部分被執行之習知技藝配置的功能示意方塊圖;第2圖為用於將具有一生產部分與一消費部分向上混頻,其中向上混頻為在該消費部分被執行之習知技藝配置的功能示意方塊圖;第3圖為本發明之層面的一向上混頻實施例之功能示意方塊圖,其中用於向上混頻的指令係在一生產部分中被導出及該等指令係在一消費部分中被施用。
第4A圖為本發明之層面的一般化聲道重新組配實施例,其中用於聲道重新組配之指令係在一生產部分中被導出及該等指令係在一消費部分中被施用。
第4B圖為本發明之層面的一般化聲道重新組配實施例,其中用於聲道重新組配之指令係在一生產部分中被導出及該等指令係在一消費部分中被施用。被施用至該生產部分的信號在此重新組配於該消費部分中以不須參照用於聲道重新組配之指令地被執行時可被修改以改良其聲道重新組配。
第4C圖為本發明之層面的一般化聲道重新組配另一實施例。被施用至該生產部分的信號在此重新組配於該消費部分中以不須參照用於聲道重新組配之指令地被執行時可被修改以改良其聲道重新組配。該重新組配資訊未由該生產部分被傳送至該消費部分。
第5A圖為一配置之功能示意方塊圖,其中該生產部分藉由運用一向上混頻器或向上混頻功能與一矩陣編碼器或矩陣編碼功能來修改被施用之信號。
第5B圖為一配置之功能示意方塊圖,其中該生產部分藉由降低其交叉相關來修改被施用之信號。。
第5C圖為一配置之功能示意方塊圖,其中該生產部分藉由以子帶為基準來修改被施用之信號。
第6A圖為一功能示意方塊圖顯示在空間編碼系統中之習知技藝編碼器的例子,其中該編碼器接收N聲道信號,其被欲於用空間編碼系統解碼器被再生。
第6B圖為一功能示意方塊圖顯示在空間編碼系統中之習知技藝編碼器的例子,其中該編碼器接收N聲道信號,其被欲於用空間編碼系統解碼器被再生,且亦接收M聲道合成信號,其由該編碼器被傳送至該解碼器。
第6C圖為一功能示意方塊圖,顯示在空間編碼系統中之習知技藝編碼器的例子,其為與第6A圖之編碼器或第6B圖之編碼器可使用的。
第7圖為在空間編碼系統中可使用之本發明的層面之本發明的層面之一編碼器實施例的功能示意方塊圖。
第8圖為適合與一個2:5有作用之矩陣解碼器使用的理想化之習知技藝的5:2矩陣編碼器之功能示意方塊圖。
較佳實施例之詳細說明
第3圖顯示在向上混頻配置中本發明知層面例子。在該配置之生產部分20中,M聲道原始信號(如舊有音頻信號)被施用至導出一組或多組向上混頻側邊資訊(「導出向上混頻資訊」)21之一裝置或功能及至一格式化裝置或格式化功能(「格式化」)22。替選的是,第3圖之M聲道原始信號可如下面被描述地為舊有音頻信號的修改版本。格式化22例如可包括一多工器或多工功能,其將M聲道原始信號、向上混頻側邊資訊與其他資料格式化或配置成為例如一串列位元流或並列位元流。生產部份20之輸出位元流為串列位元流或並列位元流對本發明不為關鍵的。格式化亦可包括如漏失、無漏失或漏失與無漏失向上混頻或編碼功能之適合的資料壓縮編碼器或編碼功能。輸出位元流是否被編碼對本發明不為關鍵的。其輸出位元流以任何適合之方式被傳輸及儲存。
在第3圖之配置例的消費部分24中,輸出位元流被接收及一解除格式化或解除格式化功能(「解除格式化」)26使格式化22之動作不作用以提供M聲道原始信號(或其近似)與向上混頻資訊。解除格式化如必要地可包括一適合之資料壓縮解碼器或解碼功能。向上混頻資訊與M聲道原始信號(或其近似)被施用一向上混頻裝置或向上混頻功能(「向上混頻」)28,其依照向上混頻指令將M聲道原始信號(或其近似)以提供N聲道向上混頻信號。其可能有多組向上混頻指令,其每一個例如對不同之聲道數提供向上混頻。若有多組向上混頻指令,一組或多組被選擇(此選擇可在配置之消費部分中被固定或以一些方式為可選擇的)。該等M聲道原始信號與N聲道向上混頻信號為該配置之消費部分24的潛在輸出。其中之一或全部二者可被提供作為輸出(如所顯示者),一個或另一個可被選擇,該選擇係例如被使用者或消費者以自動控制或人工控制用一選擇器或選擇功能(未畫出)被施作。雖然第3圖以符號顯示M=2與N=6,其將被了解M與N不被限於此。
在本發明之層面的一實務應用例中,代表各立體聲道之二音頻信號被一裝置或處理接收,且其欲導出適用於將該等二音頻信號向上混頻成為典型上被稱為「5.1聲道」(實際上為六聲道,其中一聲道為需要非常少資料之一低頻效應聲道)的指令。然後該等二原始音頻信號以及向上混頻指令可被傳送至一向上混頻器或向上混頻處理,其對該等二音頻信號施用向上混頻指令以提供所欲之5.1聲道(一向上混頻運用側邊資訊)。然而,在一些情形中,該等二原始音頻信號與相關之向上混頻指令可被一裝置或處理接收,其可能無法使用向上混頻指令,不過其可被修改以執行該等被接收之二音頻信號的向上混頻,此向上混頻如上述地經常被稱為「盲目」向上混頻。此類盲目向上混頻例如可用如Pro Logic,Pro Logic II或Pro Logic IIx解碼器(Pro Logic,Pro Logic II與Pro Logic IIx為Dolby Laboratories Licensing Corporation之註冊商標)的主動矩陣被該等至少一音頻信號與其修改。其他主動矩陣解碼器可被運用。此類主動矩陣盲目向上混頻器在響應本質之信號特徵(如被施用於此之信號間的振幅及/或相拉關係)下依賴及操作以執行向上混頻。盲目向上混頻形成或不形成如用被修改以使用向上混頻指令之裝置或功能所提供的相同數目之聲道均可(在此例中,盲目向上混頻可能不會形成5.1聲道之結果)。
用主動矩陣解碼密被執行之「盲目」向上混頻在其輸入被與該主動矩陣解碼器相容的裝置或功能預先編碼時為最佳的(如用一矩陣編碼器,特別是與該解碼器互補之矩陣編碼器)。在此情形中,其輸入信號具有主動矩陣解碼器使用的本質之振幅與相位關係。未被相容之裝置預先編碼的信號(此種信號不具有如振幅或相位關係之有用的本質之信號特徵或只具有最少之有用的本質之信號特徵)係用可被稱為”artistic”向上混頻器(典型上為一計算上複雜之向上混頻器)如下面進一步被討論地加以最佳地執行。
雖然本發明之層面可有利地就向上混頻被使用,其在其中為特定「聲道組配」被設計之至少一音頻信號被變更用於在一個或多個交替聲道組配上上播放的更一般情形也成立。例如,一編碼器產生側邊資訊例如指示一解碼器在所欲時如何為一個或多個交替聲道組配變更原始信號。「聲道組配」在此文意中例如不僅包括相對於原始音頻信號之多個播放音頻信號,亦包括播放音頻信號被欲於針對原始音頻信號的空間位置被再生之空間位置。因而,聲道「重新組配」例如可包括其中一個或多個聲道以某種方式被映射至較多數目之聲道的向上混頻、二個或多個聲道以某種方式被映射至較少數目之聲道的向下混頻、其中聲道被欲於再生之位置或有關聯之聲道以某種方式被改變或重新映射的方向之空間位置重新組配、及由二聲道至擴音器格式(利用串音消除或具有串音消除器之處理)或由擴音器格式至二聲道(利用擴音器格式對二聲道變換器(即「二聲道器」)之「二聲道化」或處理)的變換。因而在依據本發明之層面的聲道重新組配文意中,原始音頻信號中之聲道數可能為小於、大於或等於任一交替聲道組配結果之聲道數。
空間位置組配之例子為由正交聲音組配(具有左前、右前、左後與右後之「正方形」佈置)至慣常之動畫組配(具有左前、中前、右前與環繞之「菱形」配置)的變換。
本發明之層面的非向上混頻「重新組配」應用例在Michael John Smithers於2004年8月3日申請之美國專利申請案第S.N.10/911,404號的”Method for Combining Audio Signals Using Auditory Scene Analysis”中被描述。Smithers描述用於動態地向下混頻之技術,其方法為避免與靜態向下混頻有關聯之共同梳濾波與相位消除效應。例如,一原始信號可由左、中與右聲道組成,但在很多播放環境中,中央聲道不為可得可用的。在此情形中,中央聲道信號須被混頻成為左與右用於以立體聲播放。Smithers所揭示之方法動態地在播放之際測量在中央聲道與左及右聲道間的平均整體延遲。然後對應之補償延遲在其與左與右聲道被混頻前被施用至中央聲道以避免梳濾波。此外,功率補償就每一向下混頻聲道之每一關鍵頻帶被計算且被施用至此。本發明並非在播放之際計算此等延遲與功率補償值,而是允許其產生作為在編碼器的側邊資訊,然後若在慣常之立體聲組配上的播放為需要的,該等值可選擇性地在解碼器被施用。
第4A圖顯示本發明之層面在一般化的聲道重新組配配置例。在該配置之生產部分30中,M聲道原始信號(如舊有音頻信號)被施用至導出一組或多組向上混頻側邊資訊(「聲道重新組配資訊」)32之一裝置或功能及至一格式化裝置或格式化功能(「格式化」)22(配合第3圖之例子被描述)。第4A圖之M聲道原始信號可如下面被描述地為舊有音頻信號的修改版本。其輸出位元流以任何適合之方式被傳輸及儲存。
在消費部分34中,輸出位元流被接收及一解除格式化或解除格式化功能(「解除格式化」)26(配合第3圖之例子被描述)使格式化22之動作不作用以提供M聲道原始信號(或其近似)與聲道重新組配資訊。聲道重新組配資訊與M聲道原始信號(或其近似)被施用一裝置或功能(「重新組配聲道」)36,其依照指令將M聲道原始信號(或其近似)作聲道重新組配以提供N聲道重新組配信號。如第3圖之例子者,若有多組指令,一組或多組被選擇(「選擇聲道重新組配」)(此選擇可在配置之消費部分中被固定或以一些方式為可選擇的)。如第3圖之例子者,該等M聲道原始信號與N聲道重新組配信號為該配置之消費部分34的潛在輸出。其中之一或全部二者可被提供作為輸出(如所顯示者),一個或另一個可被選擇,該選擇係例如被使用者或消費者以自動控制或人工控制用一選擇器或選擇功能(未畫出)被施作。雖然第4A圖以符號顯示M=3與N=2,其將被了解M與N不被限於此。如上面指出者,「聲道重新組配」例如可包括其中一個或多個聲道以某種方式被映射至較多數目之聲道的向上混頻、二個或多個聲道以某種方式被映射至較少數目之聲道的向下混頻、其中聲道被欲於再生之位置或有關聯之聲道以某種方式被改變或重新映射的方向之空間位置重新組配、及由二聲道至擴音器格式(利用串音消除或具有串音消除器之處理)或由擴音器格式至二聲道(利用擴音器格式對二聲道變換器(即「二聲道器」)之「二聲道化」或處理)的變換。在二聲道化之情形中,聲道重新組配可包括(1)向上混頻為多重虛擬聲道,及/或(2)被提供作為二聲道立體聲二聲道二聲道信號之虛擬空間位置重新組配。虛擬向上混頻與虛擬擴音器定位為至少早至1960年代之技藝中為相當習知的(如見1966年2月26日之美國專利第3,236,949號的Atal等人之”Apparent Sound Source Translator,”與1963年5月7日之美國專利第3,088,997號的Bauer之”Stereophonic to Binaural Conversion Apparatus”)。
如在上面第3圖與第4A圖之相關例子中被提及者,M聲道原始信號之修改版本可被運用作為輸入。該等信號被修改以用如普遍上可得可用之如主動矩陣解碼器的消費者裝置來促進盲目重新組配。替選的是,當未修改之信號為二聲道立體聲信號時,被修改之信號可為未修改信號之二聲道化後的二聲道信號。修改後之M聲道原始信號可具有與未修改之信號相同的聲道數,雖然此對本發明之此層面不為關鍵的。參照第4B圖之例子,在該配置之生產部分38中,M聲道原始信號(舊有音頻信號)被施用至一裝置或功能,其產生一交替或修改集合之音頻信號(「產生交替信號」)40,這些交替或修改信號被施用至一裝置或功能,其導出一個或多個集合之聲道重新組配側邊資訊(「導出聲道重新組配資訊」)32,及被施用至一格式化裝置或格式化功能(「格式化」)22(32與22二者均在上面被描述)。導出聲道重新組配資訊亦可由產生交替信號40接收非音頻資訊以協助其導出該重新組配資訊。輸出位元流以任何適合之方式被傳輸或被儲存。
在該配置之消費部分42中,輸出位元流被接收及一解除格式化或解除格式化功能(「解除格式化」)26(如上述)使格式化22之動作不作用以提供M聲道交替信號(或其近似)與聲道重新組配資訊。聲道重新組配資訊與M聲道交替信號(或其近似)被施用一裝置或功能(「重新組配聲道」)44,其依照指令將M聲道原始信號(或其近似)作聲道重新組配以提供N聲道重新組配信號。如第3與4A圖之例子者,若有多組指令,一組或多組被選擇(「選擇聲道重新組配」)(此選擇可在配置之消費部分中被固定或以一些方式為可選擇的)。如在上面第4A圖例子之描述被注意到者,「聲道重新組配」例如可包括「向上混頻」(包括其中二聲道信號被該等至少一音頻信號與其修改而具有被向上混頻之虛擬聲道的虛擬向上混頻)、「向下混頻」、空間位置重新組配、以及由二聲道至擴音器格式或由擴音器格式至二聲道之變換。M聲道交替信號(或其近似)亦可被施用至一裝置或功能,其以不須參照重新組配資訊地重新組配M聲道交替信號(「無重新組配資訊之聲道重新組配」)46以提供P聲道重新組配信號。如上面被討論者,在重新組配為向上混頻之情形中,此裝置或功能46例如可為如主動矩陣解碼器之盲目向上混頻器(其例子在上面被設立)。裝置或功能46亦可提供由二聲道至擴音器格式或由擴音器格式至二聲道之變換。如利用第4A圖例子之裝置或功能36般地,裝置或功能可提供虛擬向上混頻及/或虛擬擴音器重新定位,其中二聲道信號被提供而具有被向上混頻及/或重新定位之虛擬聲道。M聲道交替信號、N聲道重新組配信號及P聲道重新組配信號為該配置之消費部分42的潛在輸出。其任何組合可被提供作為輸出(該圖顯示全部三個),或其組合或其中一個可被選擇,該選擇係例如被使用者或消費者以自動控制或人工控制用一選擇器或選擇功能(未畫出)被施作。
進一步之一替選做法在第4C圖之例中被顯示。在此例中,M聲道原始信號被修改,但導出聲道重新組配資訊未被傳輸或被記錄。因而,導出聲道重新組配資訊32可在該配置之生產部分38中被略去,使得只有M聲道交替信號被施用至格式化22。因而,可能無法承載音頻資訊外加重新組配資訊之一舊有傳輸或記錄裝置被要求只承載舊有型式之信號,如二聲道立體聲信號,其在此情形中於被施用至如主動矩陣解碼器之低複雜度的消費者型式之向上混頻器時已被修改以提供較佳的結果。在該消費部分42中,重新組配聲道44可被略去,以提供M聲道交替信號及P聲道重新組配信號給二個潛在輸出的二者或其中之一。
如上面所指出者,其可能欲修改被施用至一音頻系統之一組M聲道原始信號,使得M聲道原始信號(或其近似)更適合用如主動矩陣解碼器的消費者型式之向上混頻器用於該系統的消費部分之盲目向上混頻。
修改此組非最適音頻信號之一方法為(1)使用比適應性矩陣解碼器較不依賴本質之信號特徵(如被施用於此之信號間的振幅及/或相位關係)地操作的裝置或功能將該組信號向上混頻,及(2)使用能與預期之適應性矩陣解碼器相容的矩陣編碼器將被向上混頻之該組信號編碼。此做法在下面相關之第5A圖的例子被描述。
修改此組信號之另一方法為施用一個或多個習知之「空間化」及/或合成技術。此種技術之一有時以「虛擬立體聲」或「虛擬線組」為特徵。例如,吾人可添加解除相關及/或相位外之內容至一個或多個聲道。此處理以消失之中央影像穩定度為代價提供明顯之聲音影像寬度或聲音封包。此在相關之第5B圖的例子被描述。為協助到達這些信號特點(寬度/封包相對於影像穩定度)間之平衡,吾人可能採取影像穩定度主要係用低至中頻率被決定,而影像寬度與封包主要係用較高頻率被決定的現象之好處。藉由將該信號分割為二個或多個頻帶,吾人可獨立地處理音頻子帶而在低與中間頻率藉由施用最少之解除相關來維持影像穩定度,及在較高頻率藉由施用較多之解除相關來提供封包之感覺。此在第5C圖之例中被描述。
參照第5A圖之例,在該配置之生產部分48中,M聲道信號被向上混頻為P聲道信號,而一「artistic」向上混頻裝置或「artistic」向上混頻信號功能(「artistic」向上混頻)50係以此為特徵。「artistic」向上混頻器典型上但未必要地為計算上複雜之向上混頻器,而較少或不依賴本質之信號特徵(如被施用於此之信號間的振幅及/或相位關係)主動矩陣解碼器則係依賴此來執行向上混頻。代之的是,「artistic」係依照向上混頻器之設計者視為適於產生特定結果之一個或多個處理而操作。此種「artistic」向上混頻器可採取很多形式。此處被提供之例子係與第7圖有關,其標題為「被施用至空間編碼器之本發明」。依據第7圖之例子,其結果例如為具有較佳左/右隔離以使「中央堆疊」最小化或更多前/後隔離以改善「封包」之被向上混頻的信號。用於執行「artistic」向上混頻之特定技術的選擇非對本發明之此層面為關鍵的。
仍參照第5A圖,向上混頻後之P聲道信號被施用至一矩陣編碼器或矩陣編碼功能(「矩陣編碼」)52,其提供較少之聲道數與M聲道交替信號,其聲道以適於用矩陣編碼器解碼之如振幅與相位線索的本質之信號特徵被編碼。適合之矩陣編碼器為在下面配合第8圖被描述的5:2矩陣編碼器。其他之矩陣解碼器亦為適合的。矩陣編碼輸出被施用至格式化22,其例如上面描述般地產生串列或並列位元流。理想上,「artistic」向上混頻50與矩陣編碼52之組合形成信號的產生之結果,其在被慣常的消費者主動矩陣解碼器解碼時比起被施用至「artistic」向上混頻50之原始信號的解碼提供改善之聆聽經驗。
在該第5A圖配置之消費部分54中,輸出位元流被接收及一解除格式化或解除格式化功能(「解除格式化」)26(如上述)使格式化22之動作不作用以提供M聲道交替信號(或其近似)。M聲道交替信號(或其近似)亦可被施用至一裝置或功能,其以不須參照重新組配資訊地重新組配M聲道交替信號(「無重新組配資訊之聲道重新組配」)56以提供P聲道重新組配信號。如上面被討論者,在重新組配為向上混頻之情形中,此裝置或功能56例如可為如主動矩陣解碼器之盲目向上混頻器(如上面被討論者)。M聲道交替信號與P聲道重新組配信號為該配置之消費部分54的潛在輸出。其之一或二者可被選擇,該選擇係例如被使用者或消費者以自動控制或人工控制用一選擇器或選擇功能(未畫出)被施作。
在第5B圖之例中,修改非最適組之輸入信號的另一方法被顯示,即其中聲道間之相關的「空間化」型式被修改。在該配置之生產部分58中,M聲道信號被施用至一組解除相關裝置或解除相關功能(「解除相關器」)60。信號聲道間之交叉相關的降低可用任何相當習知之解除相關技術與處理各別聲道獨立無關地被達成。替選的是,解除相關可藉由在聲道間獨立無關地處理而被達成。例如,聲道間之相位外內容(即負相關)可藉由將來自一聲道之信號縮放及逆轉並混頻為另一個而被達成。在此二情形中,該處理可藉由調整在每一聲道中被處理與未被處理之信號的相對位準而被控制。如上面被提及者,其在明顯之聲音影像寬度或聲音封包及消失的中央影像穩定度間要有所取捨。藉由獨立地處理各別聲道之解除相關的例子在Seefeldt等人之審理中的美國專利申請案第S.N.60/604,725號(2004年8月25日申請)、第S.N.60/700,137號(2005年7月18日申請)與第S.N.60/705,784號(2005年8月5日申請,律師案號DOL14901),每一個均以”Multichannel Decorrelation in Spatial Audio Coding”為標題之案中被設立。藉由獨立地處理各別聲道之解除相關的另一例子在下面被引述之Breebaart等人的AES協會論文6072號與WO 03/090206號國際申請案中被設立。具有降低之相關性的M聲道信號如上述地被施用至格式化22,其提供如一個或多個位元流之適合的輸出用於應用至適合之傳輸或記錄。第5B圖配置之消費部分54可與第5A圖配置之消費部分相同。
如上述者,添加解除相關及/或相位外之內容至一個或多個聲道。此處理以消失之中央影像穩定度為代價提供明顯之聲音影像寬度或聲音封包。在第5C圖中,為協助到達寬度/封包相對於影像穩定度間之平衡,信號分割為二個或多個頻帶,且音頻子帶獨立地被處理而在低與中間頻率藉由施用最少之解除相關來維持影像穩定度,及在較高頻率藉由施用較多之解除相關來提供封包之感覺。
參照第5C圖,在生產部分58’中,M聲道信號被施用至子帶濾波功能(「子帶濾波器」)62。雖然第5C圖明顯地畫出此一子帶濾波器62,其應被了解此一濾波器或濾波功能可如上面被提及地在其他例子中被運用。雖然子帶濾波器可採取各種形式且濾波器或濾波功能(如濾波器排組或變化)對本發明不為關鍵的。子帶濾波器62將M聲道信號之頻譜分為R個頻帶,其每一個可被施用至各別的解除相關器。該圖示意地顯示解除相關器64用於頻帶1、解除相關器64用於頻帶2、及解除相關器68用於頻帶R,其被了解每一頻帶可具有其本身之解除相關器。一些頻帶可不被施用至解除相關器。該等解除相關器除了在比M聲道信號之全頻譜較少地操作外基本上與第5B圖之解除相關器60相同。為呈現簡單起見,第5C圖就單一信號顯示一子帶濾波器與相關之解除相關器,其被了解每一信號被分割為子帶,且每一子帶可被解除相關。在解除相關後,每一信號之子帶(若有的話)可用加總器或加總功能(「加總」)70被加總在一起。加總70輸出被施用至格式化22,其如上述地例如產生一串列或並列位元流。第5C圖配置之消費部分54可與第5A及5B圖配置之消費部分相同。
與空間編碼整合
某些最近被引進之有限的位元率編碼技術(見下面有關空間編碼之專利、專利申請案與公告的釋例性清單)分析N聲道輸入信號以及M聲道合成信號(N>M)以產生包含N聲道輸入信號之音場針對M聲道合成者的參數性模型之側邊資訊。典型上,該合成信號係由與原始N聲道信號相同之主要材料被導出。側邊資訊與合成信號被傳輸至一解碼器,其施用該參數性模型至合成信號以重新創造該原始N聲道信號之音場的近似物。此「空間編碼」系統之主要目標為以非常有限數量的資料來重新創造原始音場;因而此迫使對被用以模擬原始音場之參數性模型的限制。此類空間編碼系統典型地運用如聲道間位準差(ILD)、聲道間時間或相位差(ITD或IPD)、與聲道間一致性(ICC)之參數將原始N聲道信號之音場模型化。典型上此類參數就跨過被編碼之施入信號的全部N聲道之多重頻帶被估計且在時間上動態地被估計。
習知技藝之空間編碼的一些例子在第6A-6B圖(編碼器)與第6C圖(解碼器)中被顯示。N聲道原始信號可運用如習知之短時間離散傅立葉變換(STDFT)的適當之時間對頻率變換用一裝置或功能(「時間對頻率」)被變換至頻域。典型上,變換***縱使得其頻帶近似於人耳之關鍵頻帶。每一頻帶之聲道間振幅差、聲道間時間或相位差、與聲道間相關的估計值被計算(「產生空間側邊資訊」)。若對應於N聲道原始信號之M聲道合成信號尚未存在,這些估計值可被運用將N聲道原始信號向下混頻(「向下混頻」)成為M聲道合成信號(如在第6A圖中之例子)。替選地,現存之M聲道合成可用相同的時間對頻率變換(為清楚呈現而分離地被顯示),且N聲道原始信號之空間參數可針對M聲道合成信號者被計算(如第6B圖之例子)。類似地,若N聲道原始信號不為可得可用的,一組可得可用之M聲道合成信號可在時域中被向上混頻以產生「N聲道原始信號」-在第6B圖之例中每一組信號提供一組輸入至各時間對頻率裝置或功能。然後合成信號與被估計之空間參數被編碼(「格式化」)成為單一位元流。在解碼器(第6C圖),此位元流被解碼(「解除格式化」)以產生M聲道合成信號以及空間側邊資訊。該等合成信號被變換至頻域(「時間對頻率」),此處被解碼之空間參數被施用至其對應的頻帶(「施用空間側邊資訊」)以產生頻域中之N聲道原始信號。最後,一頻率對時間變換(「頻率對時間」)被施用以產生N聲道原始信號或其近似。替選地,空間側邊資訊可被忽略且M聲道合成信號被選擇用於播放。
雖然習知技藝之空間編碼系統假設N聲道信號的存在,其音場之低資料率參數性呈現由此被估計,此系統可被變更以所揭示之本發明而工作。非為來自N聲道原始信號之估計空間參數地,此類空間參數代之地可直接由舊有M聲道信號之分析被產生,此處M<N。該等參數被產生,使得舊有M聲道信號之所欲的N聲道向上混頻在此類參數於此被施用時在解碼器被產生。此可不須保證在編碼器產生實際N聲道向上混頻信號地被達成,而是直接由M聲道舊有信號產生所欲之向上混頻信號音場的參數性呈現。第7圖顯示此一向上混頻編碼器,其與第6C圖之空間解碼器相容。產生此參數性呈現之進一步細節在下面以「本發明被施用至空間編碼器」為標題的段落被提供。
參照第7圖之細節,在時域中之M聲道原始信號運用適合的時間對頻率變換(「時間對頻率」)72被變換為頻域。一裝置或功能74(「導出向上混頻資訊作為側邊資訊」)以與空間側邊資訊在空間編碼系統被產生相同之方式導出向上混頻指令。在空間編碼系統中產生空間側邊資訊之細節在此處被引述的一個或多個參考文獻中被設立。構成向上混頻指令之空間編碼參數以及M聲道原始信號被施用至一裝置或功能(「格式化」)76,其將M聲道原始信號與空間編碼參數格式化成為適於傳輸或儲存之形式。該格式化可包括資料壓縮編碼。
運用恰如在以用於施用參數至將在例如第6C圖之解碼器中被向上混頻的信號之裝置或功能的組合所描述之參數產生的一向上混頻器適於作為計算上複雜之向上混頻器用於如第4B、4C、5A與5B圖之例子般地產生交替信號。
雖然以不須在編碼器產生所欲之N聲道向上混頻信號地直接由M聲道舊有信號產生參數性的呈現為有利的,其對本發明不為關鍵的。替選地,空間參數可藉由在編碼器產生所欲之N聲道向上混頻信號而被導出。功能上而言,此類信號會在第7圖之方塊74中被產生。因而,就算在此替選做法中,指令導出接收之唯一音頻資訊為M聲道舊有信號。
第8圖為與Pro Logic II主動矩陣解碼器相容之慣常的習知技藝之5:2矩陣被動(線性時間無異的)編碼器之理想化功能示意方塊圖。此一編碼器適於上述第5A圖之例子中使用。該編碼器接收五個分離之輸入信號:左、中央、右、左環繞與右環繞(L、C、R、LS、RS),並創造二個最後輸出:左總與右總(Lt與Rt)。C輸入用L與R輸入(分別在組合器80與82中)以3dB位準(振幅)衰減(被衰減器84提供)相等地被分割及加總以維持固定之聲音功率。每一個以位準降低之C輸入被加總的L與R輸入具有LS與RS輸入以其相減及相加地被組合的相位與位準平移之版本。左環繞(LS)輸入在方塊86中被顯示地理想上以90度被相位平移,然後在衰減器88中以1.2dB降低位準用於在組合器90中與被加總之L與位準降低之C相減式的組合。然後其在衰減器92中進一步以5dB降低位準用於在組合器90中與被加總之L與位準降低之C及被相位平移之位準降低的RS版本如下一個被描述地相加式之組合以提供Rt輸出。右環繞(RS)輸入在方塊96中被顯示地理想上以90度被相位平移,然後在衰減器98中以1.2dB降低位準用於在組合器100中與被加總之R與位準降低之C。然後其進一步在衰減器102以5dB降低位準用於在組合器104中用於與被加總之L與位準降低之C相減式的組合,及位準降低之相位平移後的LS提供Lt輸出。
原則上如圖中顯示者,在每一環境輸入路徑中只需一個90度相位平移方塊。在實務上,90度相位平移為不可實現的,所以四個全通網路可能以適當之相位平移被使用而實現所欲的90度相位平移。全通網路具有不影響被處理之音頻信號的音色(頻譜)之好處。
左總(Lt)與右總(Rt)編碼信號可被表達為:Lt=L+m(-3)dB*C-j*[m(-1.2)dB*Ls+m(-6.2)dB*Rs],及Rt=R+m(-3)dB*C+j*[(m(-1.2)dB*Rs+m(-6.2)dB*Ls)
此處L為左輸入信號、R為右輸入信號、C為中央輸入信號、Ls為左環繞輸入信號、Rs為右環繞輸入信號、j為負1(-1)之平方根(90度相位平移)、及m表示乘以用分貝表示之衰減(所以,m(-3)dB=衰減3dB)。
替選的是,該等公式可被表達為如下:Lt=L+(0.707)*C-j*(0.87*Ls+0.56*Rs)及Rt=R+(0.707)*C+j*(0.87*Rs+0.56*Ls)
此處0.707為3dB衰減之近似值、0.87為1.2dB衰減之近似值及0.56為6.2dB衰減之近似值。(0.707,0.87與0.56)之值不為關鍵的。其他之值可用可接受的結果被運用、其他之值可被運用的程度依系統設計者視該等可聽到的結果之可接受的程度而定。
本發明之一實施例的細節 空間編碼背景
考慮一空間編碼系統,其運用N個聲道信號之聲道間為準差(ILD)與聲道間一致性(ICC)的估計值作為其每一個關鍵頻帶之側邊資訊。吾人假設在合成信號中之聲道數為M=2,及原始信號中之聲道數為N=5。定義下列之記號:X j [b ,t ]:合成信號x在頻帶b與時間區塊之聲道j的頻域呈現。此值係藉由對被傳送至解碼器之合成信號施用時間對頻率變換而被導出。
Z i [b ,t ]:原始信號z在頻帶b與時間區塊之聲道j的頻域呈現。此值係藉由對X j [b ,t ]施用側邊資訊而被計算。
ILD ij [b ,t ]:原始信號之聲道i針對合成信號之聲道j在頻帶b與時間區塊t的聲道間位準差。此值被傳送作為側邊資訊。
ICC i [b ,t ]:原始信號之聲道i在頻帶b與時間區塊t的聲道間一致性。此值被傳送作為側邊資訊。
作為解碼之第一步驟下,N聲道信號的一中間頻域呈現透過如下列般地對合成信號施用聲道間位準差而被產生:
接著Yi 之解除相關的版本透過對每一聲道i施用一獨特之解除相關濾波器Hi 而被產生,此處該濾波器之施用可透過頻域中之乘法被達成:
最後原始信號z之頻域估計值被計算作為Yi的線性組合,此處該聲道間一致性控制此組合之比例:
然後最終之信號z藉由對Z i [b ,t ]施用頻率對時間變換而被產生。
本發明被施用至空間編碼器
現在吾人描述所揭示之本發明的一實施例,其運用上述之空間解碼器以將一M=2的聲道信號向上混頻成為N=6之聲道信號。該編碼需要獨自地合成來自X j [b ,t ]之ILD ij [b ,t ]與ICC i [b ,t ]使得所欲向上混頻在ILD ij [b ,t ]與ICC i [b ,t ]如上述地被施用至X j [b ,t ]。如上面指出者,此做法在然後被施用至一矩陣編碼器時亦提供計算上複雜之向上混頻適用於產生適於用如相費者型式的主動矩陣解碼器之低複雜度的向上混頻器來向上混頻之交替信號。
該較佳之盲目向上混頻系統的第一步驟為將該二聲道輸入變換為頻域。該變換為頻域可使用75%重疊之DFT而以50%之區塊用填襯來防止被解除相關濾波器所致的循環迴旋效果而被完成。此DFT做法符合在該空間編碼系統之較佳實施例所使用的時間-頻率變換。然後該信號之頻譜呈現被分離成為近似於等值的長方形頻帶(ERB)尺度之多重頻帶,再此地說,此頻帶結構與空間編碼系統所用者相同,使得側邊資訊可被使用以在解碼器執行盲目向上混頻。在每一頻道b,一共變異數矩陣如下列公式般地被顯示:
此處X 1 [k ,t ]為在櫃k與區塊t之第一聲道的DFT、X 2 [k ,t ]為在櫃k與區塊t之第二聲道的DFT、W為頻帶b在櫃中被計算之帶寬、及為就該等二輸入聲道在頻帶b之區塊t的共變異數矩陣之聯立估計值。進一步而言,在上面公式中之” ”運算元代表DFT值之共軛。
然後該共變異數矩陣之聯立估計值使用被施用至每一頻帶中的共變異數矩陣之一簡單的一階IIR濾波器如下列公式顯示地在每一區塊上被平滑:
此處為該共變異數矩陣之平滑後的估計值,及λ 為平滑係數,其可為與信號及頻帶相依的。
就簡單之2至6盲目向上混頻系統而言,吾人定義聲道排序如下:
使用上面之聲道映射,無人為每一聲道針對平滑後之共變異數矩陣發展下列的每一頻帶ILD與ICC:定義:α b , t =|[1,2]|
則就聲道1(左)而言: ILD 1 , 2 [b ,t ]=0ICC 1 [b ,t ]=1
則就聲道2(中央)而言:ILD 2 , 1 [b ,t ]=0ILD 2 , 2 [b ,t ]=0ICC 2 [b ,t ]=1
則就聲道3(右)而言:ILD 3 , 1 [b ,t ]=0 ICC 3 [b ,t ]=1
則就聲道4(左環繞)而言:ILD 4 , 1 [b ,t ]=α b , t ILD 4 , 2 [b ,t ]=0ICC 4 [b ,t ]=0
則就聲道5(右環繞)而言:ILD 5 , 1 [b ,t ]=0ILD 5 , 2 [b ,t ]=α b , t ICC 5 [b ,t ]=0
則就聲道6(LFE)而言:ILD 6 , 1 [b ,t ]=0ILD 6 , 2 [b ,t ]=0ICC 6 [b ,t ]=1
在實務上,依據剛所描述之例子的配置曾被發現執行良好-其分離來自周圍聲音之直接聲音、將直接聲音置於左與右聲道、及將周圍聲音移至後聲道。更複雜之配置亦可使用空間編碼系統內傳輸的側邊資訊被創立。
參考文獻
下列之專利、專利申請案與公報的每一個整體在此被納入作為參考。
虛擬聲音處理
1966年2月26日Atal等人申請之美國專利第3,236,949號的”“Apparent Sound Source Translator”1963年5月7日Bauer申請之美國專利第3,088,997號的”Stereophonic to Binaural Conversion Apparatus”。
AC-3(Dolby Digital)
2001年8月20日之先進電視系統委員會的ATSC標準A52/A:Digital Audio Compression Standard(AC-3),修正版A。該A52/A文件可在全球資訊網之http://www.atsc.org/standards.html 取得。
1995年8月IEEE Trans Consumer Electronics第41卷第3期,Steve Vernon之”Design and Implementation of AC-3 Coders”。
1993年10月第95屆AES年會之Audio Engineering Society再版3774,Mark Davis的”The AC-3 Multichannel Coder”。
1992年10月第93屆AES年會Audio Engineering Society再版3365,Bosi等人的”High Quality Low-Rate Audio Transform Coding for Transmission and Multimedia Applications”。
美國專利第5,583,962;5,632,005;5,633,981;5,727,119與6,021,386號。
空間編碼
2003年2月6日出版之美國專利申請案公報US 2003/0026441號。
2003年2月20日出版之美國專利申請案公報US 2003/0035553號。
2003年11月27日出版之美國專利申請案公報US 2003/0219130號。(Baumgarte與Faller)。
2003年3月音訊工程協會論文第5852號。
2003年10月30日出版之國際專利申請案WO 03/090206號。
2003年10月30日出版之國際專利申請案WO 03/090207號。
2003年10月30日出版之國際專利申請案WO 03/090208號。
2003年1月22日出版之國際專利申請案WO 03/007656號。
2003年12月25日出版之Baumgarte等人的美國專利申請案公報US 2003/0236583 A1號之”Hybrid Multi-Channel/Cue Coding/Decoding of Audio Signals”(申請案第S.N.10/246,570號)。
2002年5月慕尼黑第112屆音訊工程協會年會論文第5574號之Faller等人的”Binaural Cue Coding Applied to Stereo and Multi-Channel Audio Compression”。
2002年5月慕尼黑第112屆音訊工程協會年會論文第5575號之Baumgarte等人的”Why Binaural Cue Coding is Better than Intensity Stereo Coding”。
2002年5月洛杉磯第113屆音訊工程協會年會論文第5706號之Baumgarte等人的”Design and Evaluation of Binaural Cue Coding Schemes”。
2001年10月紐約New Paltz,IEEE Workshop on Applications of Processing to Audio and Acoustics之Faller等人的”Efficient Representation of Spatial Audio Using Perceptual Parameterization”,pp.199-202。
2002年5月佛羅里達之奧侖多ICASSP 2002第II-1801-II-1804頁之Baumgarte等人的”Estimation of Auditory Spatial Cues for Binaural Cue Coding”。
2002年5月佛羅里達之奧侖多ICASSP 2002第II-1841-II-1844頁之Faller等人的”Binaural Cue Coding:A Navel and Efficient Representation of Spatial Audio”。
2004年5月柏林第116屆音訊工程協會年會論文第6072號之Breebaart等人的”High-quality parametric spatial audio coding at low bitrates”。
2004年5月柏林第116屆音訊工程協會年會論文第6060號之Baumgarte等人的”Audio Coder Enhancement using Scalable Binaural Cue Coding with Equalized Mixed”。
2004年5月柏林第116屆音訊工程協會年會論文第6073號之Schuijers等人的”Low Complexity Parametric Stereo Coding”。
2004年5月柏林第116屆音訊工程協會年會論文第6074號之Engdegard等人的”Synthetic Ambience in Parametric Stereo Coding”。
其他
2004年8月3日Michael John Smithers之美國專利申請案第S.N.10/911,404號的”Method for Combining Audio Signals Using Auditory Scene Analysis”。
Seefeldt等人的美國專利申請案第S.N.60/604,725號(2004年8月25日申請)、第S.N.60/700,137號(2005年7月18日申請)與第S.N.60/705,784號(2005年8月5日申請,律師案號DOL14901),每一個均以”Multichannel Decorrelation in Spatial Audio Coding”為標題。
2003年10月30日出版之國際專利申請案WO 03/090206號。
2004年5月柏林第116屆音訊工程協會年會論文第6072號之Breebaart等人的”High-quality parametric spatial audio coding at low bitrates”。
2...生產部分
4...向上混頻
6...格式化
8...消費部分
10...解除格式化
12...向下混頻
14...生產部分
16...消費部分
18...向上混頻
20...生產部分
21...導出向上混頻資訊
22...格式化
24...消費部分
26...解除格式化
28...向上混頻
30...生產部分
32...聲道重新組配資訊
34...消費部分
36...資訊
38...生產部分
40...聲道向下混頻信號
42...重新組配聲道
44...重新組配聲道
46...無重新組配資訊之聲道重新組配
48...生產部分
50...Artistsc向上混頻
52...矩陣編碼
54...消費部分
56...無重新組配資訊之聲道重新組配
58...生產部分
58’...生產部分
60、64、66、68...解除相關器
62...子帶濾波器
72...時間對頻率
74...導出向上混頻
76...格式化
80、82、94、100...組合器
84、88、92、98、102...衰減器
86、96...方塊
90、104...組合器
第1圖為用於將具有一生產部分與一消費部分向上混頻,其中向上混頻為在該生產部分被執行之習知技藝配置的功能示意方塊圖;第2圖為用於將具有一生產部分與一消費部分向上混頻,其中向上混頻為在該消費部分被執行之習知技藝配置的功能示意方塊圖;第3圖為本發明之層面的一向上混頻實施例之功能示意方塊圖,其中用於向上混頻的指令係在一生產部分中被導出及該等指令係在一消費部分中被施用。
第4A圖為本發明之層面的一般化聲道重新組配實施例,其中用於聲道重新組配之指令係在一生產部分中被導出及該等指令係在一消費部分中被施用。
第4B圖為本發明之層面的一般化聲道重新組配實施例,其中用於聲道重新組配之指令係在一生產部分中被導出及該等指令係在一消費部分中被施用。被施用至該生產部分的信號在此重新組配於該消費部分中以不須參照用於聲道重新組配之指令地被執行時可被修改以改良其聲道重新組配。
第4C圖為本發明之層面的一般化聲道重新組配另一實施例。被施用至該生產部分的信號在此重新組配於該消費部分中以不須參照用於聲道重新組配之指令地被執行時可被修改以改良其聲道重新組配。該重新組配資訊未由該生產部分被傳送至該消費部分。
第5A圖為一配置之功能示意方塊圖,其中該生產部分藉由運用一向上混頻器或向上混頻功能與一矩陣編碼器或矩陣編碼功能來修改被施用之信號。
第5B圖為一配置之功能示意方塊圖,其中該生產部分藉由降低其交叉相關來修改被施用之信號。。
第5C圖為一配置之功能示意方塊圖,其中該生產部分藉由以子帶為基準來修改被施用之信號。
第6A圖為一功能示意方塊圖顯示在空間編碼系統中之習知技藝編碼器的例子,其中該編碼器接收N聲道信號,其被欲於用空間編碼系統解碼器被再生。
第6B圖為一功能示意方塊圖顯示在空間編碼系統中之習知技藝編碼器的例子,其中該編碼器接收N聲道信號,其被欲於用空間編碼系統解碼器被再生,且亦接收M聲道合成信號,其由該編碼器被傳送至該解碼器。
第6C圖為一功能示意方塊圖,顯示在空間編碼系統中之習知技藝編碼器的例子,其為與第6A圖之編碼器或第6B圖之編碼器可使用的。
第7圖為在空間編碼系統中可使用之本發明的層面之本發明的層面之一編碼器實施例的功能示意方塊圖。
第8圖為適合與一個2:5有作用之矩陣解碼器使用的理想化之習知技藝的5:2矩陣編碼器之功能示意方塊圖。
30...生產部分
32...聲道重新組配資訊
34...消費部分
36...資訊

Claims (27)

  1. 一種用於處理兩個或更多個音頻信號的方法,每一音頻信號代表一音頻聲道,該方法包含下列步驟:導出指令,其用於將該等兩個或更多個音頻信號進行聲道重新組配而未改變該等兩個或更多個音頻信號之組態,其中該導出步驟中所接收的唯一音頻資訊為該等兩個或更多個音頻信號;以及產生一格式化輸出,其包括未經改變之聲道組配之該等兩個或更多個音頻信號,使得具有未經改變之聲道組配之該等兩個或更多個音頻信號相對於該等音頻聲道之數目、該等音頻聲道之所欲空間位置、及該等音頻聲道之格式而未被改變,及該經格式化輸出包括用於聲道重新組配之該等指令。
  2. 如申請專利範圍第1項所述之方法,其中該等音頻信號係一對立體聲音頻信號。
  3. 如申請專利範圍第1項所述之方法,其中用於聲道重新組配之該等導出指令導出用於將該等兩個或更多個音頻信號向上混頻之指令,使得在依照用於向上混頻之該等指令來向上混頻時,結果所得之音頻信號數目大於包含該等兩個或更多個音頻信號之音頻信號之數目。
  4. 如申請專利範圍第1項所述之方法,其中用於聲道重新組配的該等導出指令導出用來將該等二個或更多個音頻信號向下混頻之指令,使得在依照用於向下混頻之該等指令來向下混頻時,結果所得之音頻信號數目小於包 含該等二個或更多個音頻信號之數目。
  5. 如申請專利範圍第1項所述之方法,其中用於聲道重新組配之該等導出指令導出用於將該等二個或更多個音頻信號重新組配之指令,使得在依據用於重新組配之指令而重新組配時音頻信號之數目維持相同,但欲再被產生之此類音頻信號之一個或多個空間位置被改變。
  6. 如申請專利範圍第1項所述之方法,其中在輸出之該等兩個或更多個音頻信號係分別為該等兩個或更多個音頻信號的資料壓縮後的版本。
  7. 如申請專利範圍第1項所述之方法,其中該等兩個或更多個音頻信號被分成數個頻帶,及用於聲道重新組配之該等指令係有關於該等頻帶中之多個頻帶。
  8. 如申請專利範圍第1項所述之方法,其中該音頻信號係一對立體聲音頻信號之一二聲道化版本。
  9. 一種用於處理兩個或多個音頻信號的方法,每一音頻信號代表一音頻聲道,該方法包含:在來自一音頻處理器之一格式化輸出中接收該等兩個或多個音頻信號與用於將該等兩個或多個音頻信號聲道重新組配之指令,該等指令已藉一指令推導而被導出,其中被接收之唯一音頻資訊為該等兩個或多個音頻信號,且該指令導出並未改變該等兩個或多個音頻信號之組態,該等兩個或多個音頻信號具有相對於由該指令推導所接收之兩個或多個音頻信號之該聲道組配之一未經改變之聲道組配,使得具有未經改變之聲道組配 之該等兩個或多個音頻信號相對於音頻聲道之數目、該等音頻聲道之所欲空間位置、及該等音頻聲道之格式而未被改變;以及使用該等指令將該等兩個或多個音頻信號進行聲道重新組配。
  10. 如申請專利範圍第9項所述之方法,其中用於聲道重新組配之該等指令為用於將該等兩個或多個音頻信號向上混頻之指令,並且該聲道重新組配將該等兩個或多個音頻信號向上混頻以致使結果所得之音頻信號數目大於包含該等兩個或多個音頻信號之音頻信號數目。
  11. 如申請專利範圍第9項所述之方法,其中用於聲道重新組配之該等指令為用於將該等二個或多個音頻信號向下混頻之指令,並且該聲道重新組配將該等二個或多個音頻信號向下混頻,以致使結果所得之音頻信號數目小於包含該等二個或多個音頻信號之音頻信號數目。
  12. 如申請專利範圍第9項所述之方法,其中用於聲道重新組配之該等指令係用於將該等二個或多個音頻信號重新組配之指令,以致使音頻信號之數目維持相同,但欲被再次產生之此類音頻信號之各個空間位置被改變。
  13. 如申請專利範圍第9項所述之方法,其中用於聲道重新組配的該等指令為用於提供具有向上混頻為該等兩個或多個音頻信號之多重虛擬聲道的二聲道立體聲信號之指令。
  14. 如申請專利範圍第9項所述之方法,其中用於聲道重新 組配的該等指令為用於提供具有一虛擬空間位置重新組配之二聲道立體聲信號的指令。
  15. 如申請專利範圍第9項所述之方法,其中該等兩個或多個音頻信號被資料壓縮,該方法更包含將該等兩個或多個音頻信號進行資料解壓縮。
  16. 如申請專利範圍第9項所述之方法,其中該等兩個或多個音頻信號被分割為頻帶,及用於聲道重新組配之該等指令為相關於這類頻帶的個別者。
  17. 如申請專利範圍第9項所述之方法,進一步包含提供一音頻輸出;以及選擇下列的其中之一作為音頻輸出:(1)該等至少兩個或多個音頻信號,或(2)被聲道重新組配之兩個或多個音頻信號。
  18. 如申請專利範圍第9項所述之方法,進一步包含在響應被接收之該等兩個或多個音頻信號下提供一音頻輸出。
  19. 如申請專利範圍第18項所述之方法,其中該方法進一步包含將該等二個或多個音頻信號矩陣解碼。
  20. 如申請專利範圍第9項所述之方法,進一步包含響應於在該兩個或多個音頻信號所接收之聲道重新組配提供一音頻輸出。
  21. 一種用於處理至少兩個音頻信號的方法,每一音頻信號代表一音頻聲道,該方法包含下列步驟:在來自一音訊處理器之一格式化輸出中接收兩個或多個音頻信號與用於將該等兩個或多個音頻信號進 行聲道重新組配之指令,該等指令已用一指令推導而被導出,其中被接收之唯一音頻資訊為該等兩個或多個音頻信號,且該指令導出並未改變該等兩個或多個音頻信號之組態,該等兩個或多個音頻信號具有相對於由該指令推導所接收之兩個或多個音頻信號之該聲道組配之一未經改變聲道組配,使得具有未經改變之聲道組配之該等兩個或多個音頻信號相對於音頻聲道之數目、該等音頻聲道之所欲空間位置、及該等音頻聲道之格式而未被改變;以及將該等二個或多個音頻信號矩陣解碼。
  22. 如申請專利範圍第21項所述之方法,其中該矩陣解碼無參照該等被接收之指令。
  23. 如申請專利範圍第21項所述之方法,其中該矩陣解碼有參照該等被接收之指令。
  24. 一種用於處理兩個或多個音頻信號的裝置,每一音頻信號代表一音頻聲道,該裝置包含:用於導出指令之裝置,其用於將該等兩個或多個音頻信號進行聲道重新組配而未改變該等兩個或多個音頻信號之組態,其中該用於導出指令之裝置所接收的唯一音頻資訊為該等兩個或多個音頻信號;以及用於產生一格式化輸出之裝置,其包括具有未經改變之聲道組配的該等兩個或多個音頻信號,使得具有未經改變之聲道組配之該等兩個或多個音頻信號相對於該等音頻聲道之數目、該等音頻聲道之所欲空間位置、 及該等音頻聲道之格式而未被改變,及該經格式化輸出包括用於聲道重新組配之指令。
  25. 一種用於處理兩個或更多個音頻信號的裝置,每一音頻信號代表一音頻聲道,該裝置包含:用於導出指令之裝置,其用以將該等兩個或更多個音頻信號進行聲道重新組配而未改變該等兩個或更多個音頻信號之組態,其中該用於導出指令之裝置所接收的唯一音頻資訊為該等兩個或更多個音頻信號;以及用於產生一格式化輸出之裝置,其包括具有未經改變之聲道組配的該等兩個或更多個音頻信號,使得具有未經改變之聲道組配之該等兩個或更多個音頻信號相對於該等音頻聲道之數目、該等音頻聲道之所欲空間位置、及該等音頻聲道之格式而未被改變,及該經格式化輸出包括用於聲道重新組配之指令;以及用於接收該輸出之裝置。
  26. 一種用於處理兩個或更多個音頻信號的裝置,每一音頻信號代表一音頻聲道,該裝置包含:接收裝置,其在來自一音訊處理器之一格式化輸出中接收該等兩個或更多個音頻信號與用於將該等兩個或更多個音頻信號進行聲道重新組配之指令,該等指令已用一指令推導而被導出,其中被接收之唯一音頻資訊為該等兩個或更多個音頻信號,且該指令導出並未改變該等兩個或更多個音頻信號之組態,該等兩個或更多個音頻信號具有相對於由該指令推導所接收之兩個或多 個音頻信號之該聲道組配之一未經改變聲道組配,使得具有未經改變之聲道組配之該等兩個或更多個音頻信號相對於音頻聲道之數目、該等音頻聲道之所欲空間位置、及該等音頻聲道之格式而未被改變;以及用以使用該等指令對該等兩個或更多個音頻信號進行聲道重新組配之裝置。
  27. 一種用於處理至少兩個音頻信號的裝置,每一音頻信號代表一音頻聲道,該裝置包含:接收裝置,其用於在來自一音頻處理器之一格式化輸出中接收兩個或多個音頻信號與用於將該等兩個或多個音頻信號進行聲道重新組配之指令,該等指令已用一指令推導而被導出,其中被接收之唯一音頻資訊為該等兩個或多個音頻信號,且該指令導出並未改變該等兩個或多個音頻信號之組態,該等兩個或更多個音頻信號具有相對於由該指令推導所接收之兩個或多個音頻信號之該聲道組配之一未經改變聲道組配,使得具有未經改變之聲道組配之該等兩個或多個音頻信號相對於音頻聲道之數目、該等音頻聲道之所欲空間位置、及該等音頻聲道之格式而未被改變;以及矩陣解碼裝置,其用於將該等二個或多個音頻信號矩陣解碼。
TW095119160A 2005-06-03 2006-05-30 利用側邊資訊之聲道重新組配技術 TWI424754B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US68710805P 2005-06-03 2005-06-03
US71183105P 2005-08-26 2005-08-26

Publications (2)

Publication Number Publication Date
TW200715901A TW200715901A (en) 2007-04-16
TWI424754B true TWI424754B (zh) 2014-01-21

Family

ID=37498915

Family Applications (1)

Application Number Title Priority Date Filing Date
TW095119160A TWI424754B (zh) 2005-06-03 2006-05-30 利用側邊資訊之聲道重新組配技術

Country Status (13)

Country Link
US (2) US20080033732A1 (zh)
EP (1) EP1927102A2 (zh)
JP (1) JP5191886B2 (zh)
KR (1) KR101251426B1 (zh)
CN (1) CN101228575B (zh)
AU (1) AU2006255662B2 (zh)
BR (1) BRPI0611505A2 (zh)
CA (1) CA2610430C (zh)
IL (1) IL187724A (zh)
MX (1) MX2007015118A (zh)
MY (1) MY149255A (zh)
TW (1) TWI424754B (zh)
WO (1) WO2006132857A2 (zh)

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7610205B2 (en) 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
EP1914722B1 (en) 2004-03-01 2009-04-29 Dolby Laboratories Licensing Corporation Multichannel audio decoding
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
MX2007015118A (es) * 2005-06-03 2008-02-14 Dolby Lab Licensing Corp Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion.
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
EP1946297B1 (en) * 2005-09-14 2017-03-08 LG Electronics Inc. Method and apparatus for decoding an audio signal
WO2007083952A1 (en) * 2006-01-19 2007-07-26 Lg Electronics Inc. Method and apparatus for processing a media signal
CN102693727B (zh) * 2006-02-03 2015-06-10 韩国电子通信研究院 用于控制音频信号的渲染的方法
EP1984913A4 (en) 2006-02-07 2011-01-12 Lg Electronics Inc DEVICE AND METHOD FOR CODING / DECODING A SIGNAL
ATE538604T1 (de) * 2006-03-28 2012-01-15 Ericsson Telefon Ab L M Verfahren und anordnung für einen decoder für mehrkanal-surroundton
EP1853092B1 (en) * 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
US8374365B2 (en) * 2006-05-17 2013-02-12 Creative Technology Ltd Spatial audio analysis and synthesis for binaural reproduction and format conversion
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
US9697844B2 (en) * 2006-05-17 2017-07-04 Creative Technology Ltd Distributed spatial audio decoder
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
US9418667B2 (en) 2006-10-12 2016-08-16 Lg Electronics Inc. Apparatus for processing a mix signal and method thereof
DE102006050068B4 (de) * 2006-10-24 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
US9009032B2 (en) * 2006-11-09 2015-04-14 Broadcom Corporation Method and system for performing sample rate conversion
JP4838361B2 (ja) 2006-11-15 2011-12-14 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及びその装置
WO2008069584A2 (en) 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
KR101111520B1 (ko) 2006-12-07 2012-05-24 엘지전자 주식회사 오디오 처리 방법 및 장치
JP2010516077A (ja) 2007-01-05 2010-05-13 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
ES2358786T3 (es) 2007-06-08 2011-05-13 Dolby Laboratories Licensing Corporation Derivación híbrida de canales de audio de sonido envolvente combinando de manera controlable componentes de señal de sonido ambiente y con decodificación matricial.
WO2009093867A2 (en) 2008-01-23 2009-07-30 Lg Electronics Inc. A method and an apparatus for processing audio signal
KR101024924B1 (ko) * 2008-01-23 2011-03-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
US8615088B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal using preset matrix for controlling gain or panning
MX2010009932A (es) 2008-03-10 2010-11-30 Fraunhofer Ges Forschung Metodo y dispositivo para manipular una señal de audio que tiene un evento transitorio.
CN101960514A (zh) * 2008-03-14 2011-01-26 日本电气株式会社 信号分析控制***及其方法、信号控制装置及其方法和程序
WO2009131066A1 (ja) * 2008-04-21 2009-10-29 日本電気株式会社 信号分析制御及び信号制御のシステム、装置、方法及びプログラム
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
EP2146522A1 (en) 2008-07-17 2010-01-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio output signals using object based metadata
US8023660B2 (en) 2008-09-11 2011-09-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
MX2011002626A (es) * 2008-09-11 2011-04-07 Fraunhofer Ges Forschung Aparato, metodo y programa de computadora para proveer un conjunto de pistas espaciales en base a una señal de microfono y aparato para proveer una señal de audio de dos canales y un conjunto de pistas especiales.
WO2010033384A1 (en) 2008-09-19 2010-03-25 Dolby Laboratories Licensing Corporation Upstream quality enhancement signal processing for resource constrained client devices
EP2347556B1 (en) * 2008-09-19 2012-04-04 Dolby Laboratories Licensing Corporation Upstream signal processing for client devices in a small-cell wireless network
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
CN102273233B (zh) * 2008-12-18 2015-04-15 杜比实验室特许公司 音频通道空间转换
TWI449442B (zh) 2009-01-14 2014-08-11 Dolby Lab Licensing Corp 用於無回授之頻域主動矩陣解碼的方法與系統
EP2214162A1 (en) 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Upmixer, method and computer program for upmixing a downmix audio signal
JP5564803B2 (ja) * 2009-03-06 2014-08-06 ソニー株式会社 音響機器及び音響処理方法
WO2010126709A1 (en) 2009-04-30 2010-11-04 Dolby Laboratories Licensing Corporation Low complexity auditory event boundary detection
FR2954570B1 (fr) 2009-12-23 2012-06-08 Arkamys Procede de codage/decodage d'un flux numerique stereo ameliore et dispositif de codage/decodage associe
KR101405976B1 (ko) * 2010-01-06 2014-06-12 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
EP2609591B1 (en) 2010-08-25 2016-06-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for generating a decorrelated signal using transmitted phase information
KR101697550B1 (ko) * 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
EP2523472A1 (en) * 2011-05-13 2012-11-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method and computer program for generating a stereo output signal for providing additional output channels
JP6384329B2 (ja) * 2012-12-28 2018-09-05 株式会社ニコン データ処理装置、およびデータ処理プログラム
KR101729930B1 (ko) 2013-02-14 2017-04-25 돌비 레버러토리즈 라이쎈싱 코오포레이션 업믹스된 오디오 신호들의 채널간 코히어런스를 제어하기 위한 방법
TWI618051B (zh) * 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
KR20140117931A (ko) 2013-03-27 2014-10-08 삼성전자주식회사 오디오 디코딩 장치 및 방법
US9607624B2 (en) * 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
CN108806704B (zh) 2013-04-19 2023-06-06 韩国电子通信研究院 多信道音频信号处理装置及方法
CN108810793B (zh) * 2013-04-19 2020-12-15 韩国电子通信研究院 多信道音频信号处理装置及方法
CN105612766B (zh) 2013-07-22 2018-07-27 弗劳恩霍夫应用研究促进协会 使用渲染音频信号的解相关的多声道音频解码器、多声道音频编码器、方法、以及计算机可读介质
EP2830334A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
US9319819B2 (en) 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
JP6235725B2 (ja) * 2014-01-13 2017-11-22 ノキア テクノロジーズ オサケユイチア マルチ・チャンネル・オーディオ信号分類器
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
US11528574B2 (en) 2019-08-30 2022-12-13 Sonos, Inc. Sum-difference arrays for audio playback devices
US11373662B2 (en) * 2020-11-03 2022-06-28 Bose Corporation Audio system height channel up-mixing
US20220391899A1 (en) * 2021-06-04 2022-12-08 Philip Scott Lyren Providing Digital Media with Spatial Audio to the Blockchain

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6021386A (en) * 1991-01-08 2000-02-01 Dolby Laboratories Licensing Corporation Coding method and apparatus for multiple channels of audio information representing three-dimensional sound fields
CN1278996A (zh) * 1997-09-05 2001-01-03 雷克西康公司 5-2-5矩阵编码器和解码器***
TW444511B (en) * 1998-04-14 2001-07-01 Inst Information Industry Multi-channel sound effect simulation equipment and method
JP2002514827A (ja) * 1998-05-05 2002-05-21 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 別個のデジタルサウンドフォーマットでマトリックス符号化された環境音チャンネル
US6430533B1 (en) * 1996-05-03 2002-08-06 Lsi Logic Corporation Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation
CN1391782A (zh) * 1999-12-03 2003-01-15 多尔拜实验特许公司 从两路输入音频信号中导出至少三路音频信号的方法
US20030125933A1 (en) * 2000-03-02 2003-07-03 Saunders William R. Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
WO2003090208A1 (en) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. pARAMETRIC REPRESENTATION OF SPATIAL AUDIO
TW569551B (en) * 2001-09-25 2004-01-01 Roger Wallace Dressler Method and apparatus for multichannel logic matrix decoding
JP2004078183A (ja) * 2002-06-24 2004-03-11 Agere Systems Inc オーディオ信号のマルチチャネル/キュー符号化/復号化
CN1494356A (zh) * 1996-07-19 2004-05-05 具有最大横向分离度的多声道主动型矩阵音响重放
US20040184537A1 (en) * 2002-08-09 2004-09-23 Ralf Geiger Method and apparatus for scalable encoding and method and apparatus for scalable decoding
TW200507680A (en) * 2003-05-20 2005-02-16 Sonic Focus Inc Acoustical virtual reality engine
US20050078840A1 (en) * 2003-08-25 2005-04-14 Riedl Steven E. Methods and systems for determining audio loudness levels in programming
WO2005036925A2 (en) * 2003-10-02 2005-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Compatible multi-channel coding/decoding

Family Cites Families (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4624009A (en) * 1980-05-02 1986-11-18 Figgie International, Inc. Signal pattern encoder and classifier
US4464784A (en) * 1981-04-30 1984-08-07 Eventide Clockworks, Inc. Pitch changer with glitch minimizer
US5040081A (en) * 1986-09-23 1991-08-13 Mccutchen David Audiovisual synchronization signal generator using audio signature comparison
US5055939A (en) 1987-12-15 1991-10-08 Karamon John J Method system & apparatus for synchronizing an auxiliary sound source containing multiple language channels with motion picture film video tape or other picture source containing a sound track
FR2641917B1 (fr) * 1988-12-28 1994-07-22 Alcatel Transmission Dispositif de diagnostic du canal de transmission pour modem numerique
AU8053691A (en) 1990-06-15 1992-01-07 Auris Corp. Method for eliminating the precedence effect in stereophonic sound systems and recording made with said method
US5235646A (en) * 1990-06-15 1993-08-10 Wilde Martin D Method and apparatus for creating de-correlated audio output signals and audio recordings made thereby
GB2262992B (en) 1990-06-21 1995-07-05 Reynolds Software Inc Method and apparatus for wave analysis and event recognition
US5175769A (en) 1991-07-23 1992-12-29 Rolm Systems Method for time-scale modification of signals
US5291557A (en) * 1992-10-13 1994-03-01 Dolby Laboratories Licensing Corporation Adaptive rematrixing of matrixed audio signals
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
JPH1074097A (ja) 1996-07-26 1998-03-17 Ind Technol Res Inst オーディオ信号のパラメータを変更する方法及び装置
US6049766A (en) 1996-11-07 2000-04-11 Creative Technology Ltd. Time-domain time/pitch scaling of speech or audio signals with transient handling
US5862228A (en) * 1997-02-21 1999-01-19 Dolby Laboratories Licensing Corporation Audio matrix encoding
US6211919B1 (en) * 1997-03-28 2001-04-03 Tektronix, Inc. Transparent embedment of data in a video signal
US6330672B1 (en) 1997-12-03 2001-12-11 At&T Corp. Method and apparatus for watermarking digital bitstreams
GB2340351B (en) * 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
US6266644B1 (en) 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
SE9903552D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Efficient spectral envelope coding using dynamic scalefactor grouping and time/frequency switching
FR2802329B1 (fr) * 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
WO2002015587A2 (en) 2000-08-16 2002-02-21 Dolby Laboratories Licensing Corporation Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
MXPA03009357A (es) 2001-04-13 2004-02-18 Dolby Lab Licensing Corp Escalamiento en el tiempo y escalamiento en el tono de alta calidad de senales de audio.
US7283954B2 (en) * 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7461002B2 (en) * 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US7610205B2 (en) * 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
EP1386312B1 (en) * 2001-05-10 2008-02-20 Dolby Laboratories Licensing Corporation Improving transient performance of low bit rate audio coding systems by reducing pre-noise
MXPA03010751A (es) 2001-05-25 2005-03-07 Dolby Lab Licensing Corp Segmentacion de senales de audio en eventos auditivos.
CA2447911C (en) 2001-05-25 2011-07-05 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US20040037421A1 (en) * 2001-12-17 2004-02-26 Truman Michael Mead Parital encryption of assembled bitstreams
ATE315823T1 (de) 2002-02-18 2006-02-15 Koninkl Philips Electronics Nv Parametrische audiocodierung
CN100481722C (zh) * 2002-06-05 2009-04-22 索尼克焦点公司 声虚拟现实引擎中增强传送音的***和方法
US7072726B2 (en) * 2002-06-19 2006-07-04 Microsoft Corporation Converting M channels of digital audio data into N channels of digital audio data
JP2005533271A (ja) * 2002-07-16 2005-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化
US7454331B2 (en) * 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
CN1739141A (zh) 2003-02-06 2006-02-22 杜比实验室特许公司 连续的备份音频
AU2004248544B2 (en) 2003-05-28 2010-02-18 Dolby Laboratories Licensing Corporation Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
US20050058307A1 (en) * 2003-07-12 2005-03-17 Samsung Electronics Co., Ltd. Method and apparatus for constructing audio stream for mixing, and information storage medium
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
EP1914722B1 (en) 2004-03-01 2009-04-29 Dolby Laboratories Licensing Corporation Multichannel audio decoding
US7617109B2 (en) * 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
TWI397903B (zh) 2005-04-13 2013-06-01 Dolby Lab Licensing Corp 編碼音訊之節約音量測量技術
TW200638335A (en) 2005-04-13 2006-11-01 Dolby Lab Licensing Corp Audio metadata verification
MX2007015118A (es) 2005-06-03 2008-02-14 Dolby Lab Licensing Corp Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion.
TWI396188B (zh) 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
ES2359799T3 (es) 2006-04-27 2011-05-27 Dolby Laboratories Licensing Corporation Control de ganancia de audio usando detección de eventos auditivos basada en la sonoridad específica.
CA2874451C (en) * 2006-10-16 2016-09-06 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
WO2010087631A2 (en) * 2009-01-28 2010-08-05 Lg Electronics Inc. A method and an apparatus for decoding an audio signal

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6021386A (en) * 1991-01-08 2000-02-01 Dolby Laboratories Licensing Corporation Coding method and apparatus for multiple channels of audio information representing three-dimensional sound fields
US6430533B1 (en) * 1996-05-03 2002-08-06 Lsi Logic Corporation Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation
CN1571583A (zh) * 1996-07-19 2005-01-26 莱克西康公司 具有最大横向分离度的多声道主动型矩阵音响重放
CN1494356A (zh) * 1996-07-19 2004-05-05 具有最大横向分离度的多声道主动型矩阵音响重放
CN1278996A (zh) * 1997-09-05 2001-01-03 雷克西康公司 5-2-5矩阵编码器和解码器***
TW444511B (en) * 1998-04-14 2001-07-01 Inst Information Industry Multi-channel sound effect simulation equipment and method
JP2002514827A (ja) * 1998-05-05 2002-05-21 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 別個のデジタルサウンドフォーマットでマトリックス符号化された環境音チャンネル
CN1391782A (zh) * 1999-12-03 2003-01-15 多尔拜实验特许公司 从两路输入音频信号中导出至少三路音频信号的方法
US20030125933A1 (en) * 2000-03-02 2003-07-03 Saunders William R. Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
TW569551B (en) * 2001-09-25 2004-01-01 Roger Wallace Dressler Method and apparatus for multichannel logic matrix decoding
WO2003090208A1 (en) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. pARAMETRIC REPRESENTATION OF SPATIAL AUDIO
JP2004078183A (ja) * 2002-06-24 2004-03-11 Agere Systems Inc オーディオ信号のマルチチャネル/キュー符号化/復号化
US20040184537A1 (en) * 2002-08-09 2004-09-23 Ralf Geiger Method and apparatus for scalable encoding and method and apparatus for scalable decoding
TW200507680A (en) * 2003-05-20 2005-02-16 Sonic Focus Inc Acoustical virtual reality engine
US20050078840A1 (en) * 2003-08-25 2005-04-14 Riedl Steven E. Methods and systems for determining audio loudness levels in programming
WO2005036925A2 (en) * 2003-10-02 2005-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Compatible multi-channel coding/decoding

Also Published As

Publication number Publication date
TW200715901A (en) 2007-04-16
US20080033732A1 (en) 2008-02-07
JP5191886B2 (ja) 2013-05-08
WO2006132857A3 (en) 2007-05-24
US20080097750A1 (en) 2008-04-24
CN101228575B (zh) 2012-09-26
AU2006255662A1 (en) 2006-12-14
US8280743B2 (en) 2012-10-02
WO2006132857A2 (en) 2006-12-14
CN101228575A (zh) 2008-07-23
MY149255A (en) 2013-07-31
EP1927102A2 (en) 2008-06-04
JP2008543227A (ja) 2008-11-27
IL187724A (en) 2015-03-31
CA2610430A1 (en) 2006-12-14
BRPI0611505A2 (pt) 2010-09-08
KR20080015886A (ko) 2008-02-20
AU2006255662B2 (en) 2012-08-23
KR101251426B1 (ko) 2013-04-05
MX2007015118A (es) 2008-02-14
CA2610430C (en) 2016-02-23
IL187724A0 (en) 2008-08-07

Similar Documents

Publication Publication Date Title
TWI424754B (zh) 利用側邊資訊之聲道重新組配技術
RU2407226C2 (ru) Генерация пространственных сигналов понижающего микширования из параметрических представлений мультиканальных сигналов
AU2005324210C1 (en) Compact side information for parametric coding of spatial audio
Faller Coding of spatial audio compatible with different playback formats
JP4856653B2 (ja) 被送出チャネルに基づくキューを用いる空間オーディオのパラメトリック・コーディング
JP5455647B2 (ja) オーディオデコーダ
JP4589962B2 (ja) レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
JP5017121B2 (ja) 外部的に供給されるダウンミックスとの空間オーディオのパラメトリック・コーディングの同期化
RU2618383C2 (ru) Кодирование и декодирование аудиообъектов
JP4987736B2 (ja) オーディオ断片またはオーディオデータストリームの符号化ステレオ信号を生成するための装置および方法
JP5645951B2 (ja) ダウンミックス信号表現に基づくアップミックス信号を提供する装置、マルチチャネルオーディオ信号を表しているビットストリームを提供する装置、方法、コンピュータプログラム、および線形結合パラメータを使用してマルチチャネルオーディオ信号を表しているビットストリーム
JP5134623B2 (ja) 複数のパラメータ的に符号化された音源を合成するための概念
JP5209637B2 (ja) オーディオ処理方法及び装置
US8880413B2 (en) Binaural spatialization of compression-encoded sound data utilizing phase shift and delay applied to each subband
KR20080051042A (ko) 상호상관을 이용한 다채널 오디오 신호 복호화 장치 및 그방법
JP2009151183A (ja) マルチチャネル音声音響信号符号化装置および方法、並びにマルチチャネル音声音響信号復号装置および方法
MX2008011994A (es) Generacion de mezclas descendentes espaciales a partir de representaciones parametricas de señales de multicanal.

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees