TWI459380B - 用以解碼信號之裝置及方法、和電腦可讀媒體 - Google Patents

用以解碼信號之裝置及方法、和電腦可讀媒體 Download PDF

Info

Publication number
TWI459380B
TWI459380B TW100129375A TW100129375A TWI459380B TW I459380 B TWI459380 B TW I459380B TW 100129375 A TW100129375 A TW 100129375A TW 100129375 A TW100129375 A TW 100129375A TW I459380 B TWI459380 B TW I459380B
Authority
TW
Taiwan
Prior art keywords
signal
transient
decorrelator
mixer
decorrelated
Prior art date
Application number
TW100129375A
Other languages
English (en)
Other versions
TW201214417A (en
Inventor
Achim Kuntz
Sascha Disch
Juergen Herre
Fabian Kuech
Johannes Hilpert
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=44509236&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=TWI459380(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW201214417A publication Critical patent/TW201214417A/zh
Application granted granted Critical
Publication of TWI459380B publication Critical patent/TWI459380B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
  • Synchronisation In Digital Transmission Systems (AREA)
  • Error Detection And Correction (AREA)
  • Optical Communication System (AREA)

Description

用以解碼信號之裝置及方法、和電腦可讀媒體
本發明係關於音訊處理以及音訊解碼之領域,尤其是關於解碼包含暫態之一信號。
音訊處理及/或解碼以許多方式被提昇。尤其是,空間音訊應用已成為越來越重要。音訊信號處理時常被使用以去相關或表達信號。此外,信號之去相關以及表達被採用在單聲道至立體聲上混、單聲道/立體聲至多頻道上混、人工式回響、立體聲加寬或使用者互動混合/表達之處理程序中。
許多音訊信號處理系統採用去相關器。一重要範例是應用去相關系統在參數空間音訊解碼器中以恢復在自一個或多個下混合信號被重建的二個或更多個信號之間的特定去相關性質。去相關器之應用主要地改進輸出信號的感知品質,例如,當比較至強度立體聲時。明確地說,去相關器之利用使得空間聲音能夠與寬的聲音影像、許多同時發生的聲音物體及/或周遭環境而適當地合成。但是,去相關器也是習知地引介在時間信號結構、音質等等中之類似人為效應的改變。
音訊處理中之去相關器的其他應用範例是,例如,人工式回響之產生以改變空間效果或在多頻道音響回音取消系統中利用去相關器以改進收斂行為。
在單聲道至立體聲上混合器中之去相關器之一般最近應用,例如,應用在參數立體聲(PS)中,被展示在第1圖,其中一單聲道輸入信號M(一“乾(dry)”信號)被提供至一去相關器110。去相關器110依據一去相關方法而將單聲道輸入信號M去相關以在其之輸出提供一去相關信號D(一“濕(wet)”信號)。該去相關信號D作為一第一混合器輸入信號與乾單聲道信號M作為一第二混合器輸入信號一起被饋送進入混合器120中。更進一步地,一上混控制單元130饋送上混控制參數進入混合器120中。混合器120接著依據一混合矩陣H而產生二個輸出頻道L以及R(L=左方立體聲輸出頻道;R=右方立體聲輸出頻道)。混合矩陣之係數可被固定、信號相依或利用使用者來控制。
另外地,混合矩陣藉由側資訊被控制,該側資訊與含有如何上混該下混合之信號以形成所需的多頻道輸出上之一參數說明的下混合一起被發送。這空間側資訊通常在單聲道下混合處理程序期間於一調諧的信號編碼器中被產生。
這原理廣泛地被應用在空間音訊編碼中,例如,參數立體聲,參看,例如,於2004年5月在德國Preprint 6072,柏林舉行之AES第116屆會議的論文集中,J. Breebaart、S. vandePar、A. Kohlrausch、E. Schuijers等人發表之“低位元率之高品質參數空間音訊編碼”文件。
參數立體聲解碼器之進一步的一般最近技術結構被展示在第2圖中,其中一去相關處理在一轉換域中被進行。一分析濾波器組210將一單聲道輸入信號轉換成為一轉換域,例如,成為一頻域。被轉換的單聲道輸入信號M之去相關接著利用產生去相關信號D之去相關器220被進行。被轉換的單聲道輸入信號M以及去相關信號D皆被饋送進入一混合矩陣230中。混合矩陣230接著考慮利用參數修改單元240所提供之上混合參數而產生二個輸出信號L以及R,其中該參數修改單元240被提供空間參數並且被耦合至參數控制單元250。於第2圖中,空間參數可藉由使用者或另外的工具所修改,例如,用於立體音響表達/呈現之後處理。於這範例中,上混合參數與來自立體音響濾波器之參數組合以形成供用於上混合矩陣之輸入參數。最後,利用混合矩陣230產生之輸出信號被饋送進入決定立體聲輸出信號的合成濾波器組260。
混合矩陣230的輸出L/R依據一混合規則自單聲道輸入信號M以及去相關信號D被計算出,例如,藉由應用下面的公式:
於該混合矩陣中,被饋送至輸出之去相關聲音總量基於發送參數而被控制,例如,頻道間相關/同調性(ICC)及/或固定的或使用者定義的設置。
在概念上,去相關器輸出D之輸出信號取代一餘留信號,其將理想上允許原始L/R信號之完全地解碼。在上混合器中利用去相關器輸出D取代餘留信號將導致節省在其他方面發送餘留信號所需的位元率。去相關器之目的因此是自單聲道信號M產生信號D,其展示如同以D取代的餘留信號之相似性質。
對應地,在編碼器側上,二種型式之空間參數被抽取:一第一族群參數,其包含代表在二個將被編碼的輸入頻道之間的同調性或交相關之相關/同調性參數(例如,ICC=頻道間相關/同調性參數)。一第二族群參數,其包含代表在二個輸入頻道之間的位準差異之位準差異參數(例如,ILD=頻道間位準差異參數)。
更進一步地,一下混合信號藉由將二個輸入頻道加以向下混合而被產生。此外一餘留信號被產生。餘留信號是可被使用以藉由另外地採用該下混合信號以及一上混矩陣而再產生原始信號之信號。例如,當N個信號被下混合至1個信號時,該下混合一般是N個成分之1,其產生自N個輸入信號之映製。自映製(例如,N-1個成分)產生的其餘成分是餘留信號並且允許藉由一逆映製而重建原始的N個信號。該映製,例如,可以是一轉動操作。該映製將被進行,以至於下混合信號被最大化並且餘留信號被最小化,例如,相似於一主軸轉換。例如,下混合信號之能量將被最大化並且餘留信號之能量將被最小化。當將2個信號下混合至1個信號時,下混合通常是自2個輸入信號之映製產生的二個成分之一。自映製產生的其餘成分是餘留信號並且允許藉由一逆映製而重建原始的2個信號。
於一些情況中,餘留信號可利用它們的下混合以及去相關的參數而表示關聯於所代表的二個信號之一誤差。例如,餘留信號可能是一誤差信號,其代表在原始頻道L、R以及頻道L’、R’之間的誤差,而該等頻道L’、R’是由於將依據原始頻道L以及R所產生的下混合信號加以上混合所產生的。
換言之,餘留信號可被考慮作為時域或一頻域或一次頻域中之信號,其僅與下混合信號或與下混合信號以及參數資訊一起允許一原始頻道之正確的或近乎正確的重建。必須了解所謂近乎正確係指,比較至利用下混合而不需餘留信號或利用下混合以及參數資訊而不需餘留信號之重建,與具有較大於零的能量之餘留信號之重建是較接近於原始頻道。
考慮到MPEG環場(MPS),相似於PS而被稱為一對二匣(OTT匣)之結構,被採用於空間音訊解碼樹中。這可被看為是單聲道-對-立體聲上混至多頻道空間音訊編碼/解碼機構之概念的一般化。於MPS中,取決於TTT操作模式,可施加去相關器之二-對-三上混合系統(TTT匣)也是存在的。其細節於2007年5月在奧地利,維也納舉行之第122屆AES會議的論文集中,J. Herre、K. Kjrling、J. Breebaart等人之“MPEG環場-用於有效以及可相容之多頻道音訊編碼的ISO/MPEG標準”一文中被說明。
關於方向性音訊編碼(DirAC),DirAC係關於一參數音域編碼機構,其不限於具有固定擴音機位置之一固定數目音訊輸出頻道。DirAC在DirAC形成器中施加去相關器,亦即,在空間音訊解碼器中施加去相關器以合成音域之非同調性成分。關於方向性音訊編碼之更多資訊可被發現於J. Audio Eng. Soc.之2007年第6號,第55卷中之Pulkki,Ville之“具方向性音訊編碼之空間聲音重現”一文中。
關於空間音訊解碼器中之去相關器之最近技術,可參考至:2007年,ISO/IEC23003-1,ISO/IEC國際標準,“資訊技術-MPEG音訊技術-第一部分:MPEG環場”、以及參考至2004年5月,柏林,Preprint,AES第116屆會議的論文集中之J. Engdegard、H. Purnhagen、J. Rden、L. Liljeryd,“參數立體聲編碼中之合成環境”。IIR格子式全通結構被使用作為在相同於MPS之空間音訊解碼器中的去相關器,如同在2007年5月於奧地利,維也納舉行之第122屆AES會議的論文集中,J.Herre、Kjrling、J. Breebaart等人所說明之“MPEG環場-用於有效以及可相容之多頻道音訊編碼的ISO/MPEG標準”一文,並且如同在2007年ISO/IEC23003-1,ISO/IEC國際標準中所說明的“資訊技術-MPEG音訊技術-第一部分:MPEG環場”。其他最近技術去相關器應用(可能頻率相依)延遲至去相關信號或旋積輸入信號,例如,以指數方式衰減雜訊叢爆。對於空間音訊上混合系統之最近技術去相關器的敘述,參看2004年5月於柏林,Preprint舉行之AES第116屆會議的論文集中之“參數立體聲編碼中之合成周圍環境”。
處理信號之另一技術是“語義上混合處理”。語義上混合處理是將信號分解成為具有不同語義性質(亦即,信號等級)之成分的技術且施加不同的上混合策略至不同的信號成分上。不同的上混合演算法可依據不同的語義性質被最佳化,以便改進全面之信號處理機構。這概念於2009年8月11日之國際專利申請案號,PCT/EP2009/005828,11.6.2010(FH090802PCT),專利WO/2010/017967案“用以決定一空間輸出多頻道-頻道音訊信號之裝置”中被說明。
進一步的一空間音訊編碼機構是“時間排列方法”,如Hotho,G.,vandePar,S.,及Breebaart,J.之下列文件中的說明:信號處理之進展期刊EURASIP,標題是“喝采信號之多頻道編碼”,2008年1月,art.10. DOI=http://dx.doi.org/10.1155/2008/。於這文件中,適用於類似喝采信號之編碼/解碼的空間音訊編碼機構被提出。這方案是依賴單聲道音訊信號,一空間音訊編碼器之一下混合信號,之片段之感知相似性。該單聲道音訊信號被分割成為重疊的時間片段。這些片段時間上在一“超級”區塊之內假性隨機地(對於n個輸出頻道相互獨立地)被排列以形成去相關輸出頻道。
進一步的一空間音訊編碼技術是“時間延遲以及交換方法”。於2007年4月17日之DE102007018032A案:20070417,Erzeugung dekorrelierter Signale,23.10.2008(FH070414PDE),同時也是適合於形成立體音響演出之類似喝采信號的編碼/解碼之一方案被提出。這方案也是依賴單聲道音訊信號片段之感知相似性並且彼此延遲於輸出頻道。為了避免向領先頻道之局域偏化,領先以及延後頻道週期性地被交換。
一般,在參數空間音訊編碼器中被編碼/被解碼之立體聲或多頻道的類似喝采信號是習知地導致降低信號品質(參看,例如,Hotho,G.,vandePar,S.,及Breebaart,J.:“喝采信號之多頻道編碼”,信號處理之進展期刊EURASIP,2008年1月,art.10. DOI=http://dx.doi.org/10.1155/2008/531693,同時參看DE102007018032A案)。類似喝采信號是具特徵地含有來自不同方向之時間密集的暫態混合。對於此些信號的範例如喝采、下雨聲、馬之奔馳聲等等。類似喝采信號時常也含有來自遠方之聲音來源的聲音成分,其感知地被融合進入一類似雜訊、平順的背景音域中。
在類似MPEG環場之空間音訊解碼器中被採用的最近去相關技術含有格子式全通結構。這些作用如同人工式回響產生器並且因此是很好地適用於產生同質、平順、類似雜訊,低沉之聲音(類似於室內回響尾聲)。但是,仍然有使收聽者覺得聲音低沉之具有非同質空間時間結構的音域範例:一重要範例是,不僅僅是利用同質類似雜訊音域,但有些也利用來自不同方向之單一拍擊聲的密集序列,而產生環繞收聽者之類似喝采的音域。因此,喝采音域之非同質成分可具特徵於一空間分佈之暫態混合。顯然地,這些不同的拍擊聲根本上是不同質、平順、並且類似雜訊的。
由於它們類似回響的性能,格子式全通去相關器不能產生具有,例如,喝采特性之低沉音域。然而,當應用至類似喝采信號時,它們有助於時間上抹除信號中之暫態。非所需的結果是類似雜訊之低沉音域,而不具有類似喝采音域之特殊空間-時間結構。進一步地,類似於單一手拍擊聲之暫態事件可能引起去相關器濾波器之回響式人工音效。
依據Hotho,G.,vandePar,S.,以及Breebaart,J.“喝采信號之多頻道編碼”之一系統,信號處理之進展期刊EURASIP,2008年1月,art.10. DOI=http://dx.doi.org/10.1155/2008/531693,其展示由於輸出音訊信號中之某一反覆品質之可感知輸出聲音的降低。這是因為事實上一個輸入信號以及其之片段不變的出現在每個輸出頻道中(雖然在一不同的時間點)。更進一步地,為避免增加喝采密度,一些原始頻道必須在上混合中被捨棄並且因此一些重要聽覺事件可能在產生的上混合中被失去。該方法僅是可應用於假設其是可能找出共用相同感知性質之信號片段,亦即:聲音相似之信號片段。該方法一般嚴重地改變信號的時間結構,其可能僅對於非常少的信號是可接受的。於施加該機構至類似非喝采信號之情況中(例如,由於信號之錯分類),時間的排列將更時常導致不可接受之結果。時間的排列進一步限定適用性於其中許多信號片段可一起被混合,而無類似人工式之回聲或梳理過濾之情況中。相似之缺點出現於DE102007018032A中所說明之方法。
WO/2010/017967案中所說明之語義上混合處理在去相關器應用之前分離信號暫態成分。其餘(無暫態)的信號被饋送至習見去相關器以及上混處理器,因而暫態信號不同地被處理:後者(例如,隨機地)藉由應用振幅掃視技術而被分佈至立體聲或多頻道輸出信號的不同頻道上。振幅掃視展示許多缺點:
振幅掃視不必定得產生接近於原始的輸出信號。如果原始信號中之暫態分配可利用振幅掃視法規被說明,則該輸出信號可以是僅接近於該原始信號。亦即:該振幅掃視可僅正確地完全複製振幅掃視事件,但是在不同輸出頻道中的暫態成分之間無相位或時間差異。
此外,於MPS中之振幅掃視方法的應用將不僅僅是需要旁通去相關器,同時也需要旁通上混合矩陣。因為上混合矩陣反映合成展示正確空間性質之一上混合輸出所必須的空間參數(頻道間相關性:ICC、頻道間位準差異:ILD),掃視系統它本身必須應用一些規則以合成具有正確空間性質之輸出信號。用於如此處理的一般法則不是習知的。進一步的,這結構增加複雜性,因為空間參數必須被注意二次:一次是對於信號之非暫態部份,以及第二次是對於信號之振幅掃視暫態部份。
因此本發明之一目的是提供用以產生供解碼一信號之去相關信號的改進概念。本發明之目的藉由依據申請專利範圍第1項之用以產生供解碼一信號之裝置、依據申請專利範圍第13項之供解碼一信號的方法、以及依據申請專利範圍第14項之電腦程式而被解決。
依據一實施例之一裝置包含暫態分離器,該暫態分離器用以將輸入信號分離成為第一信號成分以及成為第二信號成分,以至於該第一信號成分包含該輸入信號之暫態信號部份,並且以至於該第二信號成分包含該輸入信號之非暫態信號部份。該暫態分離器可將不同的信號成分相互分離,以允許除了不包含暫態的信號成分之外,包含暫態的信號成分也可不同地被處理。
該裝置更進一步地包含一暫態去相關器,其用以依據一去相關方法而將包含暫態之信號成分去相關,其尤其是適用於將包含暫態之信號成分去相關。此外,該裝置包含用以將不包含暫態之信號成分去相關的一第二去相關器。
因此,該裝置能夠利用標準去相關器處理信號成分或利用尤其是適用於處理暫態信號成分之暫態去相關器而不同地處理信號成分。於一實施例中,暫態分離器決定一信號成分是否被饋送進入標準去相關器或進入暫態去相關器之任一者中。
更進一步地,該裝置可被調適以分離一信號成分,以至於該信號成分部份地被饋送進入暫態去相關器中,並且部份地被饋送進入第二去相關器中。
此外,該裝置包含一組合單元,其用以組合利用標準去相關器以及暫態去相關器所輸出之信號成分以產生一去相關組合信號。
於一實施例中,該裝置包含一混合器,其被調適以接收輸入信號且更依據該輸入信號以及依據一混合規則被調適以產生輸出信號。一裝置輸入信號被饋送進入一暫態分離器並且隨後利用一暫態分離器及/或一第二去相關器如上所述地被去相關。組合單元以及混合器可被配置因而該去相關組合信號被饋送進入混合器作為一第一混合器輸入信號。一第二混合器輸入信號可以是裝置輸入信號或是自該裝置輸入信號導出的一信號。由於當去相關組合信號被饋送進入混合器時去相關處理程序已被完成,故混合器不需要考慮暫態去相關性。因此,一習見混合器可被採用。
於進一步的一實施例中,混合器被調適以接收指示在二個信號之間的相關性或同調性之相關性/同調性參數資料,且被調適以依據該相關性/同調性參數資料而產生輸出信號。於另一實施例中,混合器被調適以接收指示在二個信號之間的能量差異之位準差異參數資料,且被調適以依據位準差異參數資料而產生輸出信號。於此一實施例中,由於混合器將負責處理對應的資料,因此暫態去相關器、第二去相關器、以及組合單元不需要被調適以處理此些參數資料。另一方面,具有習見相關性/同調性以及位準差異參數處理的一習見混合器可被採用於此一實施例中。
於一實施例中,暫態分離器被調適,以依據指示包含一暫態之所考慮信號部份或其指示不包含一暫態之所考慮信號部份之任一者的暫態分離資訊,而饋送一裝置輸入信號之所考慮信號部份進入暫態去相關器或饋送所考慮信號部份進入第二去相關器。此一實施例允許暫態分離資訊之容易處理。
於另一實施例中,暫態分離器被調適以部份地饋送一裝置輸入信號之一所考慮信號部份進入暫態去相關器並且部份地饋送該所考慮信號部份進入第二去相關器。被饋送進入暫態分離器之所考慮信號部份總量以及被饋送進入第二去相關器之所考慮信號部份總量是取決於暫態分離資訊。藉此,暫態強度可被考慮。
於進一步的一實施例中,暫態分離器被調適以分離在一頻率領域中被表示的一裝置輸入信號。這允許頻率相依暫態處理(分離以及去相關)。因此,第一頻帶之特定信號成分可依據一暫態去相關方法被處理,而另一頻帶之信號成分可依據另一方法,例如,習見去相關方法被處理。因此,於一實施例中,暫態分離器被調適以依據頻率相依暫態分離資訊而分離一裝置輸入信號。但是,於另一實施例中,暫態分離器被調適以依據頻率相依分離資訊而分離一裝置輸入信號。這允許更有效的暫態信號處理。
於另一實施例中,暫態分離器可被調適以分離在一頻率領域中被表示之一裝置輸入信號,以至於在一第一頻率範圍之內的裝置輸入信號之所有信號部份被饋送進入第二去相關器。一對應的裝置因此被調適以限定暫態信號處理於具有在一第二頻率範圍中之信號頻率的信號成分,而同時沒有在第一頻率範圍中之信號頻率的信號成分被饋送進入暫態去相關器(但卻是進入第二去相關器)。
於進一步的一實施例中,暫態去相關器可被調適以藉由施加代表在一餘留信號以及一下混合信號之間的一相位差異之相位資訊而將該第一信號成分去相關。在編碼器側上,一“反向”混合矩陣可被採用以產生下混合信號以及餘留信號,例如,自一立體聲信號之二個頻道,如已在上面之說明。雖下混合信號可被發送至解碼器,餘留信號可被摒棄。依據一實施例,被暫態去相關器所採用的相位差異可以是在餘留信號以及下混合信號之間的相位差異。因此其可藉由在下混合之上施加餘留的原始相位,而重建“人工式”餘留信號。於一實施例中,相位差異可關係於某一頻帶,亦即,可能是頻率相依的。另外地,一相位差異可能不關係於某些頻帶,但是可被施加作為一頻率無關多頻帶參數。
於一實施例中,該裝置包含用以接收相位資訊的一接收單元,其中該暫態去相關器被調適以施加相位資訊至第一信號成分。相位資訊可利用一適當的編碼器被產生。
於進一步的一實施例中,一相位項可藉由將相位項與第一信號成分相乘而被施加至第一信號成分上。
於進一步的一實施例中,第二去相關器可以是習見去相關器,例如,格子式IIR去相關器。
圖式簡單說明
接著將參考圖形更詳細地說明各實施例,其中:第1圖說明在一單聲道至立體聲上混合器中之去相關器之最近技術應用;第2圖說明在單聲道至立體聲上混合器中之去相關器之進一步最近技術應用;第3圖說明依據一實施例之用以產生去相關信號的裝置;第4圖說明依據一實施例用以解碼信號之裝置;第5圖是依據一實施例之一對二(OTT)系統之概觀圖;第6圖說明依據進一步的一實施例用以產生包含接收單元之去相關信號的裝置;第7圖是依據進一步的另一實施例之一對二系統概觀圖;第8圖是說明自相位一致性量測映射至暫態分離強度的範例;第9圖是依據進一步的另一實施例之一對二系統概觀圖;第10圖是說明依據一實施例用以編碼具有多數個頻道之音訊信號的裝置。
詳細說明
第3圖說明依據一實施例用以產生一去相關信號之裝置。該裝置包含一暫態分離器310、一暫態去相關器320、一習見去相關器330以及一組合單元340。這實施例之暫態處理方法是用以自類似喝采音訊信號產生去相關信號,例如,對於空間音訊解碼器之上混合處理中的應用。
於第3圖中,一輸入信號被饋送進入一暫態分離器310。該輸入信號可能,例如,藉由施加一混合QMF濾波器排組而被轉換至一頻率領域。暫態分離器310可決定對於輸入信號之各考慮信號成分是否包含一暫態。更進一步地,該暫態分離器310可被配置,如果所考慮信號部份包含一暫態(信號成分s1),則饋送任一考慮信號部份進入暫態去相關器320,或如果考慮信號部份不包含一暫態(傳信號成分s2),則其可饋送考慮信號部份進入習見去相關器330。暫態分離器310也可被配置以依據考慮信號部份中之一暫態的存在而分切考慮信號部份且部份地提供它們至暫態去相關器320並且部份至習見去相關器330。
於一實施例中,暫態去相關器320依據一暫態去相關方法以將信號成分s1去相關,該去相關方法尤其是適用於將暫態信號成分去相關。例如,暫態信號成分之去相關可藉由施加相位資訊,例如,藉由施加相位項而被實施。其中相位項被施加在暫態信號成分上之一去相關方法將參看第5圖實施例在下面被說明。此一去相關方法也可被採用作為第3圖實施例之暫態去相關器320的暫態去相關方法。
信號成分s2,其包含非暫態信號部份,被饋送進入習見去相關器330。該習見去相關器330接著可依據一習見去相關方法以將信號成分s2去相關,例如,藉由施加格子式全通結構,例如,一格子式IIR(無限脈衝響應)濾波器。
在利用習見去相關器330被去相關之後,去相關信號成分自習見去相關器330被饋送進入組合單元340。去相關暫態信號成分也自暫態去相關器320被饋送進入組合單元340。組合單元340接著組合兩個去相關信號成分,例如,藉由相加兩個信號成分,以得到一去相關組合信號。
一般,依據一實施例以將包含暫態信號去相關之方法可如下面所述地被進行:
於一分離步驟中,輸入信號被分離成為二個成分:一個成分s1包含輸入信號之暫態,另一成分s2包含輸入信號之其餘(非暫態)部份。信號之非暫態成分s2可在系統中相同地被處理而不必施加這實施例之暫態去相關器的去相關方法。亦即:無暫態信號s2可被饋送至相同於格子式IIR全通機構的一個或多個習見去相關信號處理機構。
此外,包含暫態之信號成分(暫態流s1)被饋送至一“暫態去相關器”機構,其將暫態流去相關而保持較佳於習見去相關機構之特殊信號性質。暫態流之去相關藉由施加一高時間解析之相位資訊而被實施。最好是,相位資訊包含相位項。更進一步地,較佳的是,相位資訊可利用編碼器被提供。
進一步地,習見去相關器以及暫態去相關器兩者之輸出信號被組合以形成去相關信號,其可被採用於空間音訊編碼器之上混合處理中。空間音訊解碼器之混合-矩陣(Mmix )的元素(h11 、h12 、h21 、h22 )可保持不變。
第4圖展示依據一實施例用以解碼一裝置輸入信號之裝置,其中該裝置輸入信號被饋送進入暫態分離器410。裝置包含暫態分離器410、一暫態去相關器420、一習見去相關器430、組合單元440、以及混合器450。這實施例之暫態分離器410、暫態去相關器420、習見去相關器430、以及組合單元440可分別地相似於第3圖實施例之暫態分離器310、暫態去相關器320、習見去相關器330以及組合單元340。利用組合單元440產生之去相關組合信號被饋送進入混合器450作為一第一混合器輸入信號。更進一步地,已被饋送進入暫態分離器410之裝置輸入信號也被饋送進入混合器450作為一第二混合器輸入信號。另外地,裝置輸入信號不直接地被饋送進入混合器450,但是自裝置輸入信號導出的一信號被饋送進入混合器450。一信號可自裝置輸入信號被導出,例如,藉由施加一習見信號處理方法至裝置輸入信號,例如,施加一濾波器。第4圖實施例之混合器450依據輸入信號以及一混合法則被調適以產生輸出信號。此一混合法則可以是,例如,相乘輸入信號以及一混合矩陣,例如,藉由應用下列公式:
混合器450可基於相關/同調性參數資料,例如,頻道間相關/同調性(ICC),及/或位準差異參數資料,例如,頻道間位準差異(ILD),而產生輸出頻道L、R。例如,一混合矩陣之係數可取決於相關/同調性參數資料及/或位準差異參數資料。於第4圖之實施例中,混合器450產生二個輸出頻道L以及R。但是,於另外的實施例中,混合器可產生多數個輸出信號,例如,3個、4個、5個、或9個輸出信號,其可以是環場聲音信號。
第5圖展示一實施例之1-對-2(OTT)上混合系統中的暫態處理方法之系統概觀圖,例如,MPS(MPEG環場)空間音訊解碼器之1-對-2匣。依據一實施例供用於分別的暫態之平行信號路線被包含在U-形暫態處理匣中。一裝置輸入信號DMX被饋送進入暫態分離器510。裝置輸入信號可在一頻域中被表示。例如,一時域輸入信號可能已藉由如在MPEG環場中被使用地施加一QMF濾波器排組而被轉換成為一頻域信號。暫態分離器510接著可饋送裝置輸入信號DMX之成分進入暫態去相關器520及/或進入格子式IIR去相關器530。裝置輸入信號成分接著利用暫態去相關器520及/或格子式IIR去相關器530被去相關。隨後,去相關信號成分D1以及D2利用組合單元540被組合,例如,藉由相加兩個信號成分,以得到去相關組合信號D。去相關組合信號被饋送進入混合器552作為第一混合器輸入信號D。更進一步地,裝置輸入信號DMX(或另外地:自裝置輸入信號DMX導出之信號)也被饋送進入混合器552作為第二混合器輸入信號。混合器552接著依據裝置輸入信號DMX,而產生第一以及第二“乾(dry)”信號。混合器552也依據去相關組合信號D而產生第一以及第二“濕(wet)”信號。利用混合器552產生的信號,也可依據發送的參數,例如,相關/同調性參數資料、例如,頻道間相關/同調性(ICC)、及/或位準差異參數資料,例如,頻道間位準差異(ILD)而被產生。於一實施例中,利用混合器552所產生的信號可被提供至成形單元554,其依據被提供的時間成形資料而形成所提供的信號。於其他實施例中,沒有信號成形發生。產生的信號接著被提供至第一556或第二558加法單元,其組合被提供的信號以分別地產生第一輸出信號L以及第二輸出信號R。
第5圖展示之處理原理可被應用於單聲道-至-立體聲上混合系統(例如,立體聲音訊編碼器)中以及於多頻道結構(例如,MPEG環場)中。於實施例中,所提議之暫態處理機構可作為一升級被施加至現存的上混合系統中,而不必上混合系統之大的概念之改變,因為僅一平行的去相關器信號路線被引介,而不必改變上混合處理程序本身。
信號分離成為暫態以及非暫態成分利用可在編碼器及/或空間音訊解碼器中被產生的參數被控制。暫態去相關器520採用相位資訊,例如,可在編碼器中或空間音訊解碼器中被得到的相位項。用以得到暫態處理參數(亦即:諸如暫態位置或分離強度之暫態分離參數以及諸如相位資訊之暫態去相關參數)的可能變化將在下面被說明。
輸入信號可在一頻域中被表示。例如,一信號可藉由採用一分析濾波器排組而被轉換至一頻域信號。一QMF濾波器排組可被施加以自時域信號得到多數個次頻帶信號。
對於最佳之感知品質,暫態信號處理最好是可將信號頻率限制在一限定的頻率範圍中。一範例是將處理範圍限定在混合QMF濾波器排組的頻帶指數k≧8,如在MPS中之使用,相似於MPS中之引導封裝成形(GES)的頻帶限定。
於下面,暫態分離器520實施例將更詳細地被說明。暫態分離器510分切輸入信號DMX分別地成為暫態以及非暫態成分s1、s2。暫態分離器510可採用暫態分離資訊以供切割輸入信號DMX,例如,暫態分離參數β[n]。輸入信號DMX之分切可以一方式被完成,以至於成分總和,s1+s2,等於輸入信號DMX:
s 1[n ]=DMX [n ]‧β [n ]
s 2[n ]=DMX [n ]‧(1-β [n ])
其中n是向下取樣次頻帶信號之時間指數及對於時間變化暫態分離參數β[n]之有效數值是在範圍[0,1]中。β[n]可以是頻率無關參數。依據頻率無關分離參數被調適以分離一裝置輸入信號之暫態分離器510,可依據β[n]數值而饋送所有具有時間指數n的次頻帶信號部份至暫態去相關器520或進入第二去相關器。
另外地,β[n]可以是頻率相依參數。依據一頻率相依暫態分離資訊被調適以分離一裝置輸入信號之暫態分離器510,如果它們對應的暫態分離資訊不同,則可不同地處理具有相同時間指數之次頻帶信號部份。
更進一步地,頻率相依可以,例如,被使用以限定暫態處理之頻率範圍,如上面部份之說明。
於一實施例中,暫態分離資訊可以是一參數,其指示輸入信號DMX之考慮信號部份包含一暫態或其指示考慮信號部份不包含一暫態。如果暫態分離資訊指示考慮信號部份包含一暫態,則暫態分離器510饋送考慮信號部份進入暫態去相關器520。另外地,如果暫態分離資訊指示考慮信號部份包含一暫態,則暫態分離器510饋送考慮信號部份進入第二去相關器,例如,格子式IIR去相關器530。
例如,一暫態分離參數β[n]可被採用作為暫態分離資訊,其可以是一個二元參數。N是輸入信號DMX之考慮信號部份的時間指數。β[n]可以是1(指示考慮信號部份將被饋送進入暫態去相關器)或0(指示考慮信號部份將被饋送進入第二去相關器)。限定β[n]至β{0,1}導致硬性之暫態/非暫態決定,亦即:被處理如暫態之成分是完全地自輸入(β=1)被分離。
於另一實施例中,暫態分離器510被調適以部份地饋送裝置輸入信號之考慮信號部份進入暫態去相關器520並且部份地饋送考慮信號部份進入第二去相關器530。被饋送進入暫態分離器520之考慮信號部份總數以及被饋送進入第二去相關器530之考慮信號部份總數取決於暫態分離資訊。於一實施例中,β[n]必須是在範圍[0,1]中。於進一步的實施例中,β[n]可被限定至β[n][0,βmax ],其中βmax <1,形成暫態的部份分離,導致暫態處理機構較小明顯的影響。因此,改變βmax 將允許在習見無暫態處理之上混合處理輸出及包括暫態處理之上混合處理之間的衰褪。
接著,將依據一實施例更詳細地說明一暫態去相關器520。
依據一實施例,暫態去相關器520產生與輸入充分地去相關的一輸出信號。其不改變單一拍擊聲/暫態的時間結構(無時間抹除、無延遲)。然而,其導致暫態信號成分之空間分配(在上混處理程序之後),其是相似於原始(無編碼)信號中之空間分配。暫態去相關器520可允許位元率相對品質之折衷(例如,在低位元率之完全地隨機空間暫態分配在高位元率之接近至原始(近乎明晰))。更進一步地,這利用低的計算複雜性被達成。
如已在上面之說明,在編碼器側上,一“反向”混合矩陣可被採用以產生一下混合信號以及一餘留信號,例如,自一立體聲信號之二個頻道。雖下混合信號可被發送至解碼器時,餘留信號可被摒棄。依據一實施例,在餘留信號以及下混合信號之間的相位差異可被決定,例如,藉由一編碼器,並且當將一信號去相關時,可被一解碼器所採用。利用這點,接著藉由將餘留原始相位應用在下混合上,可重建一“人工式”餘留信號。
依據一實施例之暫態去相關器520的一對應去相關方法,接著將在下面被說明:
依據一暫態去相關方法,一相位項可被採用。去相關藉由簡單地相乘暫態流與高時間解析(例如,在相同於MPS之轉換領域系統中的次頻帶信號時間解析)之相位項而被達成:
D 1[n ]=s 1[n ]‧e j Δ φ [ n ]
於這方程式中,n是下取樣次頻帶信號之時間指數。Δφ理想上反映在下混合以及餘留者之間的相位差異。因此,暫態餘留被來自下混合之暫態複製所取代、被修改,以至於它們具有原始相位。
應用相位資訊將在上混處理程序中固有地導致至原始位置的一暫態掃視。展示的範例考慮到ICC=0,ILD=0之情況:輸出信號之暫態部份接著為:
L [n ]=c ‧(s [n ]+D 1[n ])=cs [n ]‧(1+e j ‧Δ φ [ n ] )
R [n ]=c ‧(s [n ]-D 1[n ])=cs [n ]‧(1-e j ‧Δ φ [ n ] )
對於Δφ=0,這導致L=2c*s,R=0,而Δφ=π導致L=0,R=2c*s。其他的Δφ、ICC、以及ILD數值將導致在產生的暫態之間的不同位準以及相位關係。
Δφ[n]數值可被施加作為頻率無關多頻帶參數或作為頻率相依參數。於類似喝采信號而無音調成分之情況中,由於較低資料率要求以及多頻帶暫態的一致處理(在頻率上之一致性),多頻帶Δφ[n]數值可以是有利的。
第5圖之暫態處理結構被配置,以至於僅習見去相關器530關於暫態信號成分被旁通,而混合矩陣則保持不變。因此,對於暫態信號,空間參數(ICC,ILD)也固有地被考慮,例如:ICC自動地控制產生的暫態分配之寬度。
考慮到如何得到相位資訊方面,於一實施例中,相位資訊可自一編碼器被接收。
第6圖展示用以產生一去相關信號之裝置實施例。該裝置包含暫態分離器610、暫態去相關器620、習見去相關器630、組合單元640以及接收單元650。暫態分離器610、習見去相關器630以及組合單元640是相似於第3圖展示之實施例的暫態分離器310、習見去相關器330以及組合單元340。但是,第6圖更進一步地展示接收單元650,其被調適以接收相位資訊。該相位資訊可利用編碼器(未被展示)被發送。例如,編碼器可計算在餘留的以及下混合信號之間的相位差異(有關一下混合之餘留信號的相對相位)。對於某些頻帶或多頻帶(例如,在時間領域中),相位差異可被計算。編碼器可適當地藉由均勻或非均勻量化而編碼相位數值且可能無損編碼。隨後,編碼器可發送該編碼相位數值至空間音訊解碼系統。自編碼器得到相位資訊是有利的,因原始的相位資訊是接著可供利用於解碼器中(除了對於量化誤差之外)。
接收單元650饋送相位資訊進入暫態去相關器620中,其當將一信號成分去相關時將使用該相位資訊。例如,相位資訊可以是一相位項並且暫態去相關器620可將一接收的暫態信號成分與該相位項相乘。
於自編碼器發送相位資訊Δφ[n]至解碼器之情況中,所需的資料率可如下面所述被降低:
相位資訊Δφ[n]可僅被施加至解碼器中之暫態信號成分上。因此,相位資訊僅需只要在信號中有暫態成分將被去相關可供用於解碼器中即可。相位資訊之發送因此可能受編碼器之限定,以至於僅必須的資訊被發送至解碼器。這可藉由在編碼器中施加一暫態檢測而被完成,如在下面之說明。相位資訊Δφ[n]僅被發送於已在編碼器中檢測暫態之時間n中的時間點。
考慮到暫態分離方面,於一實施例中,暫態分離可以是編碼器驅動方式。
依據一實施例,暫態分離資訊(也被稱為“暫態資訊”)可自編碼器被得到。如於2007年5月於奧地利維也納舉行之第122屆AES會議之論文集中,Andreas Walther、Christian Uhle、Sascha Disch之“利用暫態抑制於隱藏式多頻道上混合演算法”一文中的說明,編碼器可施加暫態檢測方法至編碼器輸入信號或至下混合信號。暫態資訊接著被發送至解碼器並且最好是,例如,以向下取樣次頻帶信號之時間解析被得到。
暫態資訊最好是可包含供用於時間中的各個信號取樣之一簡單二元(暫態/非暫態)決定。這資訊最好是也可利用時間中之暫態位置以及暫態持續被表示。
暫態資訊可無損地被編碼(例如,行程長度編碼、熵編碼)以降低自編碼器將暫態資訊發送至解碼器所必須的資料率。
暫態資訊可依某一頻率解析被發送作為多頻帶資訊或作為頻率相依資訊。發送該暫態資訊作為多頻帶參數,將由於多頻帶暫態的一致性之處理而降低暫態資訊資料率並且可能改進音訊品質。
取代二元(暫態/非暫態)決定,暫態強度也可被發送,例如,以二個或四個級距被量化。暫態強度接著可控制在空間音訊解碼器中之暫態分離,如下面所述:強的暫態自IIR格子式去相關器輸入完全地被分離,而較弱之暫態僅部份地被分離。
暫態資訊可僅被發送,如果編碼器檢測到類似喝采信號,例如,利用喝采檢測系統,如於2009年紐約舉行之音訊工程師協會第127屆會議中,Christian Uhle之“具有低潛伏期之喝采聲音的檢測”一文的說明。
對於輸入信號對類似喝采信號之相似性的檢測結果也可以較低的時間解析(例如,在MPS中之空間參數更新率)被發送至解碼器以控制暫態分離強度。該喝采檢測結果可被發送作為二元參數(亦即,作為硬性決定)或作為非二元參數(亦即,作為軟性決定)。這參數控制空間音訊解碼器中之分離強度。因此,允許(幾乎不或逐漸地)導通/切斷解碼器中之暫態處理。這允許,例如,當應用一多頻帶暫態處理機構至含有音調成分的信號時,將避免可能發生的人工產物。
第7圖展示依據一實施例之用以解碼一信號的裝置。該裝置包含暫態分離器710、暫態去相關器720、格子式IIR去相關器730、組合單元740、混合器752、選用成形單元754、第一加法單元756以及第二加法單元758,其分別地對應至第5圖實施例之暫態分離器510、暫態去相關器520、格子式IIR去相關器530、組合單元540、混合器552、選用成形單元554、第一加法單元556以及第二加法單元558。於第7圖實施例中,一編碼器得到相位資訊以及暫態位置資訊並且發送該資訊至用以解碼的裝置。沒有餘留信號被發送。第7圖展示相同於MPS中之OTT匣的1-對-2之上混合組態。其可依據一實施例被應用在供用於自單聲道下混合至立體聲輸出的上混合之立體聲編解碼中。於第7圖實施例中,三個暫態處理參數作為頻率無關參數而自編碼器被發送至解碼器,如可自第7圖中所見:
將被發送的一第一暫態處理參數是在編碼器中執行之一暫態檢測器的二元暫態/非暫態決定。其被使用以控制解碼器中之暫態分離。於一簡單機構中,二元暫態/非暫態決定可被發送作為每個次頻帶時間取樣之二元旗標,而不必進一步的編碼。
將被發送之進一步的一暫態處理參數是暫態去相關器所需要的相位數值(或多個相位數值)Δφ[n]。Δφ僅對於其暫態已於編碼器中被檢測之時間n而發送。Δφ數值被發送作為具有,例如,每個取樣3位元之解析度的量化器指數。
將被發送之另一暫態處理參數是分離強度(亦即,暫態處理機構之效應強度)。這資訊以如空間參數ILD、ICC相同的時間解析度被發送。
用以自編碼器將暫態分離決定以及多頻帶相位資訊發送至解碼器之必須的位元率BR可對於類似MPS系統被估計,如下所述:
其中σ是暫態密度(被標記為暫態之時槽片段(=次頻帶時間取樣)),Q是每個發送相位數值之位元數,且fs 是取樣率。應注意到,(fs /64)是下取樣次頻帶信號之取樣率。
E{σ}<0.25對於一組許多表示喝采項目被量測,其中E{.}指示在項目持續上之平均值。在相位數值精確度以及參數位元率之間的合理折衷是Q=3。為降低參數資料率,ICC以及ILD可被發送作為多頻帶提示。作為多頻帶提示的ICC以及ILD之發送是格外地可適用於諸如喝采之非音調信號。
另外地,用以傳信分離強度之參數以ICC/ILD之更新率被發送。對於MPS中之長空間訊框(32乘64取樣)以及4-級距量化分離強度,這導致BR transientseparationstrength =(f s /(64‧32))‧2之另外位元率。
分離強度參數可在編碼器中自信號分析演算法結果被導出,該信號分析演算法結果評估對於類似喝采信號、聲調或指示當施加實施例之暫態去相關時可能的優勢或問題之其他信號特性的相似性。
被發送以供暫態處理的參數可接受無損編碼以降低冗餘量,而導致較低的參數位元率(例如,暫態分離資訊之行程長度編碼,熵編碼)。
返回至得到相位資訊之論點,於一實施例中,相位資訊可在解碼器中被得到。
於此一實施例中,用以解碼之裝置不自編碼器得到相位資訊,但是可決定相位資訊本身。因此,不須發送相位資訊而導致降低全面之傳輸率。
於一實施例中,相位資訊在MPS為基礎之解碼器中自“引導封裝成形(GES)”資料被得到。這僅是適用於假設GES資料被發送,亦即,如果GES特點在編碼器中被致動的話。GES特點是可用的,例如,於MPS系統中。在輸出頻道之間的GES封裝數值比率反映在高時間解析度之暫態的掃視位置。GES封裝數值比率(GESR)可被映製至暫態處理所需要的相位資訊上。於GES中,映製可依據一映製法則被進行,該映製法則是憑經驗地自對於一組適當測試信號表示的相位-相對-至-GESR-分配之建構統計被得到。決定映製法則是用以設計暫態處理系統之步驟,而不是當應用暫態處理系統時之一進行時間處理程序。因此,無論如何,如果GES資料是GES特點應用所需的,則其是有利地不需要花費另外的發送相位資料之成本。位元流回溯相容性藉由MPS位元流/解碼器被達成。但是,自GES資料抽取之相位資訊不是如可在編碼器中被得到的相位資訊一般地精確(例如:估計相位之符號是未知的)。
於進一步的一實施例中,相位資訊也可在解碼器中被得到,但是自發送的非滿頻帶餘留者。這是適用於,例如,如果頻帶受限餘留信號在MPS編碼機構中被發送(一般涵蓋高至某一轉變頻率之頻率範圍)。於此一實施例中,在下混合以及餘留頻帶中被發送的餘留信號之間的相位關係被計算,亦即,對於餘留信號被發送的頻率。更進一步地,自餘留頻帶至非餘留頻帶的相位資訊被外插(及/或可能被內插)。一個可能性是將於餘留頻帶中所得到的相位關係映製至一廣域頻率無關相位關係數值,其接著被使用於暫態去相關器中。總之如果無滿頻帶餘留被發送的話,這將導致沒有另外的發送相位資料之成本的優勢。但是,必須考慮到,相位估計正確性是取決於其中餘留信號被發送之頻帶寬度。該相位估計之正確性也取決於在沿著頻率軸的下混合以及餘留信號之間的相位關係之一致性。對於明確暫態信號,通常遭遇高的一致性。
於進一步的一實施例中,相位資訊採用自編碼器被發送之另外的更正資訊在解碼器中被得到。此一實施例是相似於先前的二個實施例(來自GES之相位、來自餘留的相位),但是另外地,其必須在編碼器中產生被發送至解碼器之更正資料。更正資料允許降低可能發生在先前說明之不同的二者(來自GES之相位、來自餘留的相位)中之相位估計誤差。更進一步地,更正資料可在編碼器中自估計的解碼器側之相位估計誤差被導出。更正資料可以是這(可能被編碼)估計的估計誤差。更進一步地,有關相位-估計-自-GES-資料方法,更正資料可簡單地是編碼器-產生相位數值之正確符號。這允許在解碼器中產生具有正確符號之相位項。此一方法之優勢是由於有更正資料,在解碼器中之相位資訊可恢復的精確性是更接近於編碼器產生的相位資訊。但是,更正資訊之熵是較低於正確相位資訊本身之熵。因此,當比較至直接地發送在編碼器中所得到的相位資訊時,參數位元率被降低。
於另一實施例中,相位資訊/項目在解碼器中自一(假性-)隨機處理程序被得到。此一方法之優勢是不需要發送任何具有高時間解析度之相位資訊。這導致資料率被降低。於一實施例中,一簡單方法是在[-180°,180°]範圍中產生具有均勻隨機分配之相位數值。
於進一步的一實施例中,編碼器中之相位分配的統計性質被量測。這些性質被編碼並且接著被發送(低時間解析度)至解碼器。受支於發送統計性質之隨機相位數值在解碼器中被產生。這些性質可以是統計相位分佈之平均值、變量、或其他的統計量測。
當多於一個去相關器實例平行地被進行時(例如,對於一多頻道上混合),必須要小心以確保相互地去相關的去相關器輸出。於一實施例中,其中(假性-)隨機相位數值之多數個向量(非一單一向量)對於第一去相關器實例之外的所有者被產生,一組向量被選擇而導致在所有去相關器實例相位數值之最少的相關性。
於自編碼器發送相位更正資訊至解碼器之情況中,所需的資料率可如下所述地被降低:
相位更正資訊僅在將被去相關之信號中有暫態成分,則需要可在解碼器中供其所用。相位更正資訊之發送可因此受限於編碼器,以至於僅必須的資訊被發送至解碼器。這可如上所述地,藉由在編碼器中施加一暫態檢測而被完成。相位更正資訊僅對於其中暫態在編碼器中被檢測之時間n中的點被發送。
返回至暫態分離方面,於一實施例中,暫態分離可以是解碼器驅動式。
於此一實施例中,暫態分離資訊也可在解碼器中被得到,例如,藉由在上混合至一立體聲或多頻道輸出信號之前將一暫態檢測方法施加至可供用於空間音訊解碼器中之下混合信號,該暫態檢測方法如在2007年5月於奧地利維也納舉行之第122屆AES會議之論文集中,Andreas Walther、Christian Uhle、Sascha Disch之“利用暫態抑制於隱藏式多頻道上混合演算法中”中之說明。於這情況中,沒有暫態資訊必須被發送,其節省發送資料率。
但是,進行解碼中之暫態檢測可能導致爭議,例如,當標準化暫態處理機構時:例如,可能是難以找到一暫態檢測演算法,當於涉及不同的數值精確性、捨入機構等等之不同的結構/平臺上被實作時,其將確切地導致相同暫態檢測結果。此一可預料的解碼器性能通常對標準化是強制性。更進一步地,標準化之暫態檢測演算法可能對於一些輸入信號造成失敗,而在輸出信號中導致不能忍受的失真。其接著可能是不易於在標準化之後不用建構不符合標準的解碼器而更正失敗的演算法。如果控制暫態分離強度的至少一參數以低時間解析度(例如,在MPS之空間參數更新率)自編碼器被發送至解碼器的話,則這議題將可能是較不嚴重。
於進一步的一實施例中,暫態分離也是解碼器驅動式並且非滿頻帶餘留者被發送。於這實施例中,解碼器驅動暫態分離可藉由採用自被發送之非滿頻帶餘留者所得到的相位估計而被精緻化(如上所述)。注意到,這精緻化可被應用在解碼器中,而不必自編碼器發送另外的資料至解碼器。
於這實施例中,被施加在暫態去相關器中之相位項藉由外插自餘留頻帶至沒有可供用之餘留的頻率之正確相位數值而被得到。一個方法是,自可被計算對於餘留信號是可供使用的那些頻率之相位數值而計算(可能是,例如,信號功率加權)一平均相位數值。平均相位數值接著可被應用作為在暫態去相關器中之一頻率無關參數。
只要在下混合以及餘留之間的正確相位關係是頻率無關的,則平均相位數值代表正確相位數值之一良好的估計。但是,於沿著頻率軸之一相位關係不是一致的情況中,平均相位數值可能是較不正確之估計,而可能導致不正確之相位數值以及聽得到之人工產物式聲音。
沿著頻率軸在下混合以及發送的餘留之間的相位關係之一致性可因此被使用作為被施加在暫態去相關器中之外插相位估計的可靠度量測。為了降低聽得到之人工式聲音風險,在解碼器中所得到的一致性量測可被使用以控制解碼器中之暫態分離強度,例如,如下面所述:
其對應的相位資訊(亦即,對於相同時間指數n之相位資訊)是與頻率一致的暫態,是完全地與習見去相關器輸入分離且是完全地被饋送進入暫態去相關器中。因為大的相位估計誤差是不太能,暫態處理之完全可能性被使用。
其對應的相位資訊是與頻率較不一致的暫態,僅是部份地分離,而導致暫態處理機構較不顯著的效應。
其對應的相位資訊是與頻率非常一致的暫態,不被分離,而導致習見無所建議的暫態處理上混合系統之標準行為。因此,沒有由於大的相位估計誤差之人工式產物可能發生。
對於相位資訊之一致性量測可被減除,例如,自(可能地信號功率加權)沿著頻率之相位資訊標準偏差的變異量。
因為僅少數頻率是可供用於餘留信號之發送,一致性量測可能必須僅自沿著頻率之少數取樣被估計,導致僅很少的達到極端數值(“完全地一致”或“完全地不一致”)之一致性量測。因此,一致性量測在被使用以控制暫態分離強度之前可能是線性地或非線性地變形。於一實施例中,一臨界特性被實作,如第8圖右方範例之展示。
第8圖展示自相位一致性量測映製至暫態分離強度的不同範例,其展示用以在暫態錯誤分類之強健度上得到暫態處理參數之變化衝擊。用以得到上面列出之暫態分離資訊以及相位資訊的變化是不同於參數資料率,並且以實作所提議的暫態處理技術的一編解碼器之所有位元率角度而言,其因此代表不同的操作點。此外,用以得到相位資訊之來源的選擇也影響諸如對於錯誤暫態分類之強健度:如果正確相位資訊被施加在暫態處理中,處理一非暫態信號作為一暫態將引起更少之聽得見的失真。因此,當比較至解碼器中之隨機相位產生情節時,在發送相位數值情節中,信號分類錯誤引起較不嚴重的人工式產物。
第9圖是依據進一步的實施例而具有暫態處理之一對二系統概觀圖,其中窄頻帶餘留信號被發送。相位資料Δφ自餘留信號頻帶中在下混合(DMX)以及餘留信號之間的相位關係而被估計。可選擇地,相位更正資料被發送以降低相位估計誤差。
第9圖展示暫態分離器910、暫態去相關器920、格子式IIR去相關器930、組合單元940、混合器952、選用成形單元954、第一加法單元956以及第二加法單元958,其是分別地對應至第5圖實施例之暫態分離器510、暫態去相關器520、格子式IIR去相關器530、組合單元540、混合器552、選用成形單元554、、第一加法單元556以及第二加法單元558。第8圖實施例更進一步地包含相位估計單元960。相位估計單元960接收輸入信號DMX、餘留信號“餘留”以及可選擇地,相位更正資料。依據接收的資訊,相位資訊單元計算相位資料Δφ。可選擇地,相位估計單元也決定相位一致性資訊並且傳送該相位一致性資訊至暫態分離器910。例如,相位一致性資訊可被暫態分離器所使用以控制暫態分離強度。
第9圖實施例應用一些發現,如果餘留者是在一非滿頻帶形式的編碼機構之內被發送,則在餘留的以及下混合(Δφ餘留_頻帶 )之間的信號功率加權平均相位差可作為多頻帶相位資訊被施加至分別的暫態(Δφ=Δφ低餘留_頻帶 )。於這情況中,沒有另外的相位資訊必須被發送,而降低對於暫態處理之位元率要求。於第9圖實施例中,自餘留頻帶之相位估計可能自可供用於編碼器中之更精確的多頻帶相位估計大量偏離。一選擇是因此發送相位更正資料(例如,Δφ更正 ,Δφ-Δφ餘留_頻帶 ),因而正確的Δφ是可於解碼器中得到。但是,因為Δφ更正 可展示較低於Δφ的熵,所須的參數資料率可以是較低於用以發送Δφ所需要的資料率。(這概念是相似於編碼中預測的一般使用:取代直接地編碼資料,具有較低熵的預測誤差被編碼。第9圖實施例中,預測步驟是自餘留頻帶至非餘留頻帶之相位外插)。在沿著頻率軸之餘留頻帶(Δφ餘留_頻帶 )中的相位差異一致性可被使用以控制暫態分離強度。
於實施例中,解碼器可自編碼器接收相位資訊,或解碼器它本身可決定相位資訊。更進一步地,解碼器可自編碼器接收暫態分離資訊,或解碼器它本身可決定暫態分離資訊。
於實施例中,暫態處理之一論點是,於與“暫態去相關器”一起之WO/2010/017967案中所說明之“語義去相關”概念的應用,其是依據將輸入與相位項相乘。產生的類似喝采信號之感知品質被改進,因兩個處理步驟避免改變暫態信號的時間結構。更進一步地,暫態之空間分配以及在該等暫態之間的相位關係在輸出頻道中被重建。更進一步地,實施例也是有計算效益的並且可容易地被整合於PS-或MPS-類似上混合系統。於實施例中,暫態處理不影響混合矩陣處理程序,因而藉由混合矩陣被定義之所有空間產生的性質也被施加至暫態信號上。
於實施例中,一新穎之去相關機構被應用,其尤其是適用於上混合系統中之應用,其尤其是適用於類似於PS或MPS的空間音訊編碼機構之應用並且其改進類似喝采信號情況之輸出信號感知品質,亦即,於含有空間分佈暫態之密集混合的信號及/或可被視為特別地提昇之一般“語義去相關”架構的實作例之情況。更進一步地,於實施例中,一新穎之去相關機構被組合,其重建相似於原始信號中之分配的暫態空間/時間分配,保存暫態信號的時間結構,允許變化位元率對品質之折衷及/或理想地適用於與類似於非滿頻帶餘留或GES之MPS特點的組合。該等組合是互補的,亦即:標準MPS特點之資訊供重複使用於暫態處理。
第10圖展示用以編碼具有多數個頻道之音訊信號的裝置。二個輸入頻道L、R被饋送進入一下混合器1010並且進入一餘留信號計算器1020。於其他實施例中,多數個頻道被饋送進入下混合器1010以及餘留信號計算器1020,例如,3個、5個或9個環場頻道。下混合器1010接著向下混合二個頻道L、R,以得到一下混合信號。例如,下混合器1010可採用一混合矩陣並且進行該混合矩陣與二個輸入頻道L、R的一矩陣乘法運算,以得到下混合信號。下混合信號可被發送至解碼器。
更進一步地,餘留信號產生器1020被調適以計算進一步的信號,其被稱為餘留信號。餘留信號是可被使用以藉由另外地採用下混合信號以及一上混合矩陣而重新產生原始信號之信號。例如,當N個信號被下混合至1個信號時,該下混合一般是自N個輸入信號之映製產生的N個成分之1。自映製產生的其餘成分(例如,N-1個成分)是餘留信號並且允許藉由一反向映製而重建原始N個信號。映製可能,例如,是一轉動操作。映製將被進行,以至於下混合信號被最大化並且使餘留信號最小化,例如,相似於一主軸轉換。例如,下混合信號之能量將被最大化並且將使餘留信號之能量最小化。當將2個信號下混合至1個信號時,下混合通常是自2個輸入信號之映製所產生的二個成分之一者。自映製產生的其餘成分是餘留信號,並且允許藉由一反向映製而重建原始2個信號。
於一些情況中,餘留信號可代表關聯於藉由它們的下混合以及關聯參數而代表二個信號的一誤差。例如,餘留信號可以是一誤差信號,其代表在原始頻道L、R以及自依據原始頻道L以及R所產生的下混合信號加以上混合所產生的頻道L’、R’之間的誤差。
換言之,餘留信號可被考慮作為時域或頻域或次頻域中之信號,其與下混合信號或與下混合信號以及參數資訊一起而允許正確或近乎正確之原始頻道的重建。必須了解,比較至利用下混合而不必餘留信號或利用下混合以及參數資訊而不必餘留信號之重建,利用餘留信號之近乎正確的重建,具有接近於原始頻道之較大於零的能量。
更進一步地,編碼器包含一相位資訊計算器1030。下混合信號以及餘留信號被饋送進入相位資訊計算器1030。相位資訊計算器接著計算在下混合以及餘留信號之間的相位差異上之資訊以得到相位資訊。例如,相位資訊計算器可應用計算下混合以及餘留信號之交相關的功能。
此外,編碼器包含輸出產生器1040。利用相位資訊計算器1030產生的相位資訊被饋送進入輸出產生器1040。輸出產生器1040接著輸出該相位資訊。
於一實施例中,該裝置進一步包含用以量化相位資訊之相位資訊量化器。利用相位資訊計算器產生的相位資訊可被饋送進入相位資訊量化器。相位資訊量化器接著量化該相位資訊。例如,該相位資訊可被映製至8個不同的數值,例如,映製至數值0、1、2、3、4、5、6、或7之一者。該等數值可分別地代表相位差異0、π/4、π/2、3π/4、π、5π/4、3π/2以及7π/4。被量化的相位資訊接著可被饋送進入輸出產生器1040。
於進一步的一實施例中,該裝置更包含一無損編碼器。來自相位資訊計算器1040之相位資訊或來自相位資訊量化器之量化相位資訊可被饋送進入該無損編碼器。該無損編碼器被調適以藉由應用無損編碼而編碼相位資訊。任何類型之無損編碼機構均可被採用。例如,編碼器可採用算術編碼。該無損編碼器接著饋送無損地被編碼之相位資訊進入輸出產生器1040。
下面將提到所說明的實施例之有關的解碼器、編碼器以及方法:
雖然一些論點已於裝置說明文中被說明,應清楚的是,這些論點也代表對應的方法之說明,其中一區塊或設備對應至一方法步驟或一方法步驟之特點。類似地,於方法步驟本文中所說明之論點也代表對應的裝置所對應之區塊或項目或特點的說明。
取決於某些實作需要,本發明實施例可以硬體或軟體被實作。該實作可利用具有電子式可讀取控制信號儲存在其上之數位儲存媒體而被進行,例如,軟磁碟、DVD、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體,其與可程規電腦系統配合(或能夠配合),以至於分別的方法被進行。
依據本發明之一些實施例包含具有電子式可讀取控制信號之資料攜載器,其可與可程規電腦系統配合,以至於此處說明的方法之一者被進行。
通常,本發明之實施例可被實作如具有程式碼之電腦程式產品,當在電腦上執行該電腦程式產品時,該程式碼是可供用於進行該等方法之一者的操作。該程式碼,例如,可被儲存在一機器可讀取攜載器上。
其他實施例包含用以進行此處說明的方法之一者的電腦程式,其被儲存在機器可讀取攜載器或非暫態儲存媒體上。
換言之,本發明方法之一實施例,因此,是當在一電腦上執行一電腦程式時,該電腦程式是用以進行此處說明的方法之一者的程式碼之電腦程式。
本發明方法之一進一步的實施例,因此,是一資料攜載器(或數位儲存媒體,或電腦可讀取媒體),其包含被記錄其之上而用以進行此處說明的方法之一者的電腦程式。
本發明方法之一進一步的實施例,因此是一資料流或一信號序列,其代表用以進行此處說明的方法之一者的電腦程式。該資料流或信號序列,例如,可被組態以經由資料通訊連接(例如,經由網際網路)而被傳輸。
一進一步的實施例包含一處理構件,例如,電腦、或可程規邏輯裝置,其被組態或被調適以進行此處說明的方法之一者。
一進一步的實施例包含一電腦,其具有被安裝在其上之用以進行此處說明的方法之一者的電腦程式。
於一些實施例中,一可程規邏輯設備(例如,場式可程規閘陣列)可被使用以進行此處說明的方法之一些或所有的功能。於一些實施例中,一場式可程規閘陣列可與微處理器共同操作以便進行此處說明的方法之一者。通常,該等方法最好是利用任何之硬體裝置被進行。
上面說明之實施例僅是供展示本發明原理。熟習本技術者應了解,本發明之配置以及此處說明之細節可有各種的修改與變化。因此其欲僅受限定於本發明待決之申請專利範圍的範疇並且不受限定於經由此處本發明實施例之說明以及敘述的特定細節。
110...去相關器
120...混合器
130...上混控制單元
210...分析濾波器組
220...去相關器
230...混合矩陣
240...參數修改單元
250...參數控制單元
260...合成濾波器組
310...暫態分離器
320...暫態去相關器
330...習見去相關器
340...組合單元
410...暫態分離器
420...暫態去相關器
430...習見去相關器
440...組合單元
450...混合器
510...暫態分離器
520...暫態去相關器
530...格子式IIR去相關器
540...組合單元
552...混合器
554...成形單元
556、558...加法單元
610...暫態分離器
620...暫態去相關器
630...習見去相關器
640...組合單元
650...接收單元
710...暫態分離器
720...暫態去相關器
730...格子式IIR去相關器
740...組合單元
752...混合器
754...選用成形單元
756、758...加法單元
910...暫態分離器
920...暫態去相關器
930...格子式IIR去相關器
940...組合單元
952...混合器
954...成形單元
956、958...加法單元
960...相位估計單元
1010...下混合器
1020...餘留信號計算器
1030...相位資訊計算器
1040...輸出產生器
ICC...頻道間相關/同調性
ILD...頻道間位準差異
L...左方立體聲輸出頻道
R...右方立體聲輸出頻道
s1...暫態成分
s2...非暫態成分
第1圖說明在一單聲道至立體聲上混合器中之去相關器之最近技術應用;
第2圖說明在單聲道至立體聲上混合器中之去相關器之進一步最近技術應用;
第3圖說明依據一實施例之用以產生去相關信號的裝置;
第4圖說明依據一實施例用以解碼信號之裝置;
第5圖是依據一實施例之一對二(OTT)系統之概觀圖;
第6圖說明依據進一步的一實施例用以產生包含接收單元之去相關信號的裝置;
第7圖是依據進一步的另一實施例之一對二系統概觀圖;
第8圖是說明自相位一致性量測映射至暫態分離強度的範例;
第9圖是依據進一步的另一實施例之一對二系統概觀圖;
第10圖是說明依據一實施例用以編碼具有多數個頻道之音訊信號的裝置。
410‧‧‧暫態分離器
420‧‧‧暫態去相關器
430‧‧‧習見去相關器
440‧‧‧組合單元
450‧‧‧混合器
ICC‧‧‧頻道間相關/同調性
ILD‧‧‧頻道間位準差異
L‧‧‧左方立體聲輸出頻道
R‧‧‧右方立體聲輸出頻道
s1‧‧‧暫態成分
s2‧‧‧非暫態成分

Claims (14)

  1. 一種用以解碼一信號之裝置,該裝置包含:一暫態分離器,其用以將一裝置輸入信號分離成為一第一信號成分以及成為一第二信號成分,以使得該第一信號成分包含該輸入信號之暫態信號部份並且使得該第二信號成分包含該輸入信號之非暫態信號部份;一暫態去相關器,其用以依據一第一去相關方法而將該第一信號成分去相關以得到一第一去相關信號成分;一第二去相關器,其用以依據一第二去相關方法而將該第二信號成分去相關以得到一第二去相關信號成分,其中該第二去相關方法是不同於該第一去相關方法;一組合單元,其用以組合該第一去相關信號成分以及該第二去相關信號成分以得到一去相關組合信號;以及一混合器,其被調適以接收混合器輸入信號並且被調適以依據該等混合器輸入信號以及一混合規則而產生輸出信號;其中該組合單元以及該混合器被配置,以至於該去相關信號被饋送進入該混合器作為一第一混合器輸入信號並且該裝置輸入信號或自該裝置輸入信號導出之一信號被饋送進入該混合器作為一第二混合器輸入信號。
  2. 依據申請專利範圍第1項之裝置, 其中該混合器進一步地被調適以接收指示在二個信號之間的相關性或同調性之相關性/同調性參數資料,並且其中該混合器進一步地被調適以依據該相關性同調性參數資料而產生輸出信號。
  3. 依據申請專利範圍第1項之裝置,其中該混合器進一步地被調適以接收指示在二個信號之間的一能量差異之位準差異參數資料,並且其中該混合器進一步地被調適以依據該位準差異參數資料以產生輸出信號。
  4. 依據申請專利範圍第1項之裝置,其中該混合器被調適以採用一混合法則,該混合法則包含將該第一以及第二混合器輸入信號與一混合矩陣相乘之規則。
  5. 依據申請專利範圍第1項之裝置,其中該組合單元被調適以藉由相加該第一去相關信號成分以及該第二去相關信號成分而組合該第一去相關信號成分以及該第二去相關信號成分。
  6. 依據申請專利範圍第1項之裝置,其中該暫態分離器被調適以依據暫態分離資訊而饋送該裝置輸入信號之一考慮信號部份進入該暫態去相關器或饋送該考慮信號部份進入該第二去相關器,其中該暫態分離資訊指示該考慮信號部份包含一暫態或其指示該考慮信號部份不包含一暫態。
  7. 依據申請專利範圍第1項之裝置, 其中該暫態分離器被調適以部份地饋送該裝置輸入信號之一考慮信號部份進入該暫態去相關器並且部份地饋送該考慮信號部份進入該第二去相關器,並且其中被饋送進入該暫態分離器之該考慮信號部份之數量以及被饋送進入該第二去相關器之該考慮信號部份之數量是取決於暫態分離資訊。
  8. 依據申請專利範圍第1項之裝置,其中該暫態分離器被調適以分離在頻域中被表示之一裝置輸入信號。
  9. 依據申請專利範圍第1項之裝置,其中該暫態分離器被調適以依據一頻率無關暫態分離資訊而使該裝置輸入信號分離成為一第一信號成分以及成為一第二信號成分。
  10. 依據申請專利範圍第1項之裝置,其中該暫態分離器被調適以依據一頻率依賴暫態分離資訊而將該裝置輸入信號分離成為一第一信號成分以及成為一第二信號成分。
  11. 依據申請專利範圍第1項之裝置,其中該裝置更進一步地包含一接收單元,該接收單元被調適以自一編碼器接收相位資訊;並且其中該暫態去相關器被調適以將來自該編碼器之該相位資訊施加至該第一信號成分上。
  12. 依據申請專利範圍第1項之裝置,其中該第二去相關器是一格子式IIR去相關器。
  13. 一種用以解碼一信號之方法,該方法包含下列步驟:將一裝置輸入信號分離成為一第一信號成分以及成為一第二信號成分,以至於該第一信號成分包含該裝置輸入信號之暫態信號部份並且該第二信號成分包含該裝置輸入信號之非暫態信號部份;依據一第一去相關方法將該第一信號成分去相關以得到一第一去相關信號成分;依據一第二去相關方法將該第二信號成分去相關以得到一第二去相關信號成分,其中該第二去相關方法是不同於該第一去相關方法;組合該第一去相關信號成分以及該第二去相關信號成分以得到一去相關組合信號;並且依據一混合規則、該去相關信號以及該裝置輸入信號而產生輸出信號。
  14. 一種電腦可讀媒體,其已儲存電腦程式,當該電腦程式於一電腦上執行時用以實行依據申請專利範圍第13項之方法。
TW100129375A 2010-08-25 2011-08-17 用以解碼信號之裝置及方法、和電腦可讀媒體 TWI459380B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US37698010P 2010-08-25 2010-08-25
PCT/EP2011/061360 WO2012025282A1 (en) 2010-08-25 2011-07-06 Apparatus for decoding a signal comprising transients using a combining unit and a mixer

Publications (2)

Publication Number Publication Date
TW201214417A TW201214417A (en) 2012-04-01
TWI459380B true TWI459380B (zh) 2014-11-01

Family

ID=44509236

Family Applications (2)

Application Number Title Priority Date Filing Date
TW100129372A TWI457912B (zh) 2010-08-25 2011-08-17 用以產生去相關信號之裝置及方法、用以編碼音訊信號之裝置、及電腦程式
TW100129375A TWI459380B (zh) 2010-08-25 2011-08-17 用以解碼信號之裝置及方法、和電腦可讀媒體

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW100129372A TWI457912B (zh) 2010-08-25 2011-08-17 用以產生去相關信號之裝置及方法、用以編碼音訊信號之裝置、及電腦程式

Country Status (21)

Country Link
US (3) US8831931B2 (zh)
EP (5) EP3471091A1 (zh)
JP (3) JP5775583B2 (zh)
KR (2) KR101445293B1 (zh)
CN (2) CN103180898B (zh)
AR (3) AR082543A1 (zh)
AU (2) AU2011295367B2 (zh)
BR (2) BR112013004365B1 (zh)
CA (3) CA2809437C (zh)
ES (3) ES2585402T3 (zh)
HK (2) HK1186833A1 (zh)
MX (2) MX2013002188A (zh)
MY (3) MY156770A (zh)
PL (3) PL3144932T3 (zh)
PT (2) PT3144932T (zh)
RU (3) RU2640650C2 (zh)
SG (3) SG188254A1 (zh)
TR (1) TR201900417T4 (zh)
TW (2) TWI457912B (zh)
WO (2) WO2012025282A1 (zh)
ZA (1) ZA201302050B (zh)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG188254A1 (en) 2010-08-25 2013-04-30 Fraunhofer Ges Forschung Apparatus for decoding a signal comprising transients using a combining unit and a mixer
CN103262158B (zh) * 2010-09-28 2015-07-29 华为技术有限公司 对解码的多声道音频信号或立体声信号进行后处理的装置和方法
US9064318B2 (en) 2012-10-25 2015-06-23 Adobe Systems Incorporated Image matting and alpha value techniques
US9355649B2 (en) * 2012-11-13 2016-05-31 Adobe Systems Incorporated Sound alignment using timing information
US10638221B2 (en) 2012-11-13 2020-04-28 Adobe Inc. Time interval sound alignment
US9201580B2 (en) 2012-11-13 2015-12-01 Adobe Systems Incorporated Sound alignment user interface
US9076205B2 (en) 2012-11-19 2015-07-07 Adobe Systems Incorporated Edge direction and curve based image de-blurring
US10249321B2 (en) 2012-11-20 2019-04-02 Adobe Inc. Sound rate modification
US9451304B2 (en) 2012-11-29 2016-09-20 Adobe Systems Incorporated Sound feature priority alignment
US10455219B2 (en) 2012-11-30 2019-10-22 Adobe Inc. Stereo correspondence and depth sensors
US9135710B2 (en) 2012-11-30 2015-09-15 Adobe Systems Incorporated Depth map stereo correspondence techniques
US10249052B2 (en) 2012-12-19 2019-04-02 Adobe Systems Incorporated Stereo correspondence model fitting
US9208547B2 (en) 2012-12-19 2015-12-08 Adobe Systems Incorporated Stereo correspondence smoothness tool
US9214026B2 (en) 2012-12-20 2015-12-15 Adobe Systems Incorporated Belief propagation and affinity measures
RU2630370C9 (ru) * 2013-02-14 2017-09-26 Долби Лабораторис Лайсэнзин Корпорейшн Способы управления межканальной когерентностью звуковых сигналов, подвергнутых повышающему микшированию
US9830917B2 (en) 2013-02-14 2017-11-28 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP2989631A4 (en) 2013-04-26 2016-12-21 Nokia Technologies Oy AUDIO SIGNAL ENCODER
CA2919080C (en) 2013-07-22 2018-06-05 Sascha Disch Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2838086A1 (en) * 2013-07-22 2015-02-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
EP2830333A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
JP6242489B2 (ja) * 2013-07-29 2017-12-06 ドルビー ラボラトリーズ ライセンシング コーポレイション 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法
CN105531761B (zh) * 2013-09-12 2019-04-30 杜比国际公司 音频解码***和音频编码***
RU2641463C2 (ru) * 2013-10-21 2018-01-17 Долби Интернэшнл Аб Структура декоррелятора для параметрического восстановления звуковых сигналов
KR102231755B1 (ko) 2013-10-25 2021-03-24 삼성전자주식회사 입체 음향 재생 방법 및 장치
KR101841380B1 (ko) 2014-01-13 2018-03-22 노키아 테크놀로지스 오와이 다중-채널 오디오 신호 분류기
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
EP2963648A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using vertical phase correction
EP2980789A1 (en) * 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhancing an audio signal, sound enhancing system
US10225675B2 (en) 2015-02-17 2019-03-05 Electronics And Telecommunications Research Institute Multichannel signal processing method, and multichannel signal processing apparatus for performing the method
US11234072B2 (en) 2016-02-18 2022-01-25 Dolby Laboratories Licensing Corporation Processing of microphone signals for spatial playback
TWI616095B (zh) * 2016-08-26 2018-02-21 配信裝置、配信系統、配信方法、電子機器、播放裝置及接收程式
MY196198A (en) 2016-11-08 2023-03-22 Fraunhofer Ges Forschung Apparatus and Method for Downmixing or Upmixing a Multichannel Signal Using Phase Compensation
CA3045847C (en) * 2016-11-08 2021-06-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Downmixer and method for downmixing at least two channels and multichannel encoder and multichannel decoder
EP3382704A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
US11232804B2 (en) 2017-07-03 2022-01-25 Dolby International Ab Low complexity dense transient events detection and coding
SG11202000510VA (en) 2017-07-28 2020-02-27 Fraunhofer Ges Forschung Apparatus for encoding or decoding an encoded multichannel signal using a filling signal generated by a broad band filter
US10306391B1 (en) 2017-12-18 2019-05-28 Apple Inc. Stereophonic to monophonic down-mixing
EP3550561A1 (en) 2018-04-06 2019-10-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value
US11990141B2 (en) * 2018-12-20 2024-05-21 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for controlling multichannel audio frame loss concealment
FR3136099A1 (fr) * 2022-05-30 2023-12-01 Orange Codage audio spatialisé avec adaptation d’un traitement de décorrélation

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070140499A1 (en) * 2004-03-01 2007-06-21 Dolby Laboratories Licensing Corporation Multichannel audio coding
WO2007081166A1 (en) * 2006-01-11 2007-07-19 Samsung Electronics Co., Ltd. Method, medium, and system decoding and encoding a multi-channel signal

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010006291A (ko) * 1998-02-13 2001-01-26 요트.게.아. 롤페즈 서라운드 음향 재생 시스템, 음향/시각 재생 시스템, 서라운드 신호 처리 유닛 및 입력 서라운드 신호 처리 방법
EP1500085B1 (en) 2002-04-10 2013-02-20 Koninklijke Philips Electronics N.V. Coding of stereo signals
CN1307612C (zh) * 2002-04-22 2007-03-28 皇家飞利浦电子股份有限公司 声频信号的编码解码方法、编码器、解码器及相关设备
ATE339759T1 (de) * 2003-02-11 2006-10-15 Koninkl Philips Electronics Nv Audiocodierung
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
WO2007109338A1 (en) * 2006-03-21 2007-09-27 Dolby Laboratories Licensing Corporation Low bit rate audio encoding and decoding
JP4521633B2 (ja) 2004-03-12 2010-08-11 直樹 末広 符号分割多重信号の相関分離識別方式
PL1735774T3 (pl) 2004-04-05 2008-11-28 Koninl Philips Electronics Nv Koder wielokanałowy
EP3573055B1 (en) * 2004-04-05 2022-03-23 Koninklijke Philips N.V. Multi-channel decoder
CA2572805C (en) * 2004-07-02 2013-08-13 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
US7283634B2 (en) * 2004-08-31 2007-10-16 Dts, Inc. Method of mixing audio channels using correlated outputs
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
JP5191886B2 (ja) 2005-06-03 2013-05-08 ドルビー ラボラトリーズ ライセンシング コーポレイション サイド情報を有するチャンネルの再構成
RU2393550C2 (ru) * 2005-06-30 2010-06-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Устройство и способ кодирования и декодирования звукового сигнала
JP5053849B2 (ja) 2005-09-01 2012-10-24 パナソニック株式会社 マルチチャンネル音響信号処理装置およびマルチチャンネル音響信号処理方法
RU2393646C1 (ru) * 2006-03-28 2010-06-27 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Усовершенствованный способ для формирования сигнала при восстановлении многоканального аудио
KR20080052813A (ko) * 2006-12-08 2008-06-12 한국전자통신연구원 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법
DE102007018032B4 (de) * 2007-04-17 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung dekorrelierter Signale
US8064624B2 (en) * 2007-07-19 2011-11-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for generating a stereo signal with enhanced perceptual quality
GB2467668B (en) * 2007-10-03 2011-12-07 Creative Tech Ltd Spatial audio analysis and synthesis for binaural reproduction and format conversion
KR20100095586A (ko) 2008-01-01 2010-08-31 엘지전자 주식회사 신호 처리 방법 및 장치
ES2404563T3 (es) * 2008-02-14 2013-05-28 Dolby Laboratories Licensing Corporation Ampliación estereofónica
EP2254110B1 (en) 2008-03-19 2014-04-30 Panasonic Corporation Stereo signal encoding device, stereo signal decoding device and methods for them
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
EP2154911A1 (en) 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
SG188254A1 (en) * 2010-08-25 2013-04-30 Fraunhofer Ges Forschung Apparatus for decoding a signal comprising transients using a combining unit and a mixer

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070140499A1 (en) * 2004-03-01 2007-06-21 Dolby Laboratories Licensing Corporation Multichannel audio coding
WO2007081166A1 (en) * 2006-01-11 2007-07-19 Samsung Electronics Co., Ltd. Method, medium, and system decoding and encoding a multi-channel signal

Also Published As

Publication number Publication date
HK1186833A1 (zh) 2014-03-21
US9368122B2 (en) 2016-06-14
BR112013004365A2 (pt) 2020-06-02
PL2609591T3 (pl) 2016-11-30
CA2809437A1 (en) 2012-03-01
BR112013004362A2 (pt) 2017-09-19
HK1187144A1 (zh) 2014-03-28
AR082542A1 (es) 2012-12-12
MX2013002188A (es) 2013-03-18
AU2011295367B2 (en) 2014-07-31
CN103180898A (zh) 2013-06-26
EP2609590A1 (en) 2013-07-03
US20130173274A1 (en) 2013-07-04
JP5775583B2 (ja) 2015-09-09
CN103180898B (zh) 2015-04-08
PT3144932T (pt) 2019-02-04
AU2011295368A1 (en) 2013-03-28
EP3144932A1 (en) 2017-03-22
KR101445291B1 (ko) 2014-09-29
MY180970A (en) 2020-12-14
CA2809404A1 (en) 2012-03-01
SG187950A1 (en) 2013-03-28
AU2011295368B2 (en) 2015-05-07
SG188254A1 (en) 2013-04-30
AR098078A2 (es) 2016-04-27
EP2924687B1 (en) 2016-11-02
JP2013539554A (ja) 2013-10-24
AR082543A1 (es) 2012-12-12
SG2014006738A (en) 2014-03-28
EP3144932B1 (en) 2018-11-07
US20130173273A1 (en) 2013-07-04
ZA201302050B (en) 2013-12-23
PT2609591T (pt) 2016-07-12
CA2887939A1 (en) 2012-03-01
TW201214414A (en) 2012-04-01
RU2573774C2 (ru) 2016-01-27
CN103460282B (zh) 2015-08-19
US8831931B2 (en) 2014-09-09
EP2609590B1 (en) 2015-05-20
TR201900417T4 (tr) 2019-02-21
ES2706490T3 (es) 2019-03-29
RU2015102326A (ru) 2015-06-10
EP2609591B1 (en) 2016-06-01
KR101445293B1 (ko) 2014-09-29
JP2013539553A (ja) 2013-10-24
ES2544077T3 (es) 2015-08-27
BR112013004362B1 (pt) 2020-12-01
RU2013112853A (ru) 2014-09-27
EP3471091A1 (en) 2019-04-17
AU2011295367A1 (en) 2013-04-11
MY178197A (en) 2020-10-06
PL2609590T3 (pl) 2015-10-30
TW201214417A (en) 2012-04-01
CN103460282A (zh) 2013-12-18
ES2585402T3 (es) 2016-10-05
PL3144932T3 (pl) 2019-04-30
US20140222441A1 (en) 2014-08-07
MX2013002187A (es) 2013-03-18
CA2887939C (en) 2017-11-07
JP5775582B2 (ja) 2015-09-09
KR20130079507A (ko) 2013-07-10
WO2012025282A1 (en) 2012-03-01
TWI457912B (zh) 2014-10-21
WO2012025283A1 (en) 2012-03-01
RU2640650C2 (ru) 2018-01-10
MY156770A (en) 2016-03-31
EP2924687A1 (en) 2015-09-30
JP6196249B2 (ja) 2017-09-13
CA2809437C (en) 2016-06-21
RU2580084C2 (ru) 2016-04-10
CA2809404C (en) 2016-06-21
EP2609591A1 (en) 2013-07-03
JP2015129953A (ja) 2015-07-16
US9431019B2 (en) 2016-08-30
BR112013004365B1 (pt) 2021-01-12
KR20130069770A (ko) 2013-06-26
RU2013112903A (ru) 2014-09-27

Similar Documents

Publication Publication Date Title
TWI459380B (zh) 用以解碼信號之裝置及方法、和電腦可讀媒體
AU2015201672B2 (en) Apparatus for generating a decorrelated signal using transmitted phase information