TWI519178B - 用以利用預先計算參考曲線來分解輸入信號之裝置和方法 - Google Patents

用以利用預先計算參考曲線來分解輸入信號之裝置和方法 Download PDF

Info

Publication number
TWI519178B
TWI519178B TW100143542A TW100143542A TWI519178B TW I519178 B TWI519178 B TW I519178B TW 100143542 A TW100143542 A TW 100143542A TW 100143542 A TW100143542 A TW 100143542A TW I519178 B TWI519178 B TW I519178B
Authority
TW
Taiwan
Prior art keywords
signal
analysis
similarity
channels
frequency
Prior art date
Application number
TW100143542A
Other languages
English (en)
Other versions
TW201238367A (en
Inventor
安卓斯 渥勒爾
Original Assignee
弗勞恩霍夫爾協會
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 弗勞恩霍夫爾協會 filed Critical 弗勞恩霍夫爾協會
Publication of TW201238367A publication Critical patent/TW201238367A/zh
Application granted granted Critical
Publication of TWI519178B publication Critical patent/TWI519178B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Amplifiers (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Time-Division Multiplex Systems (AREA)

Description

用以利用預先計算參考曲線來分解輸入信號之裝置和方法 發明領域
本發明有關於音訊處理,且特別是有關於音訊信號分解成不同分量,諸如感知不同的分量。
人類聽覺系統感覺來自各個方向的聲音。感知聽覺(形容詞「聽覺」表示所感知者,而「聲音」一詞將用以描述物理現象)環境產生周圍空間及發生的聲音事件之聲學性質的一印象。在一特定聲場中感知到的聽覺印象可(至少部分地)考量在車輛入口的三種不同類型的信號:直達聲早期反射,及擴散反射而被模型化。這些信號促成一感知聽覺空間聲像的形成。
直達聲表示在無干擾下自一聲源最先直接到達聽者的每一聲音事件的波。其為聲源的特徵且提供關於聲音事件之入射方向的最少損失資訊。用以估計一聲源在水平面上的方向的主要座標是左耳輸入信號與右耳輸入信號之間的差,即雙耳時間差(ITD)及雙耳音強差(ILD)。隨後,直達聲的大量反射從不同的方向且以不同的相對時間延遲及音強到達雙耳。反射的密度隨著相對直達聲的時間延遲增加而增加直到它們構成一雜波統計為止。
反射聲音促成距離感知,且促成聽覺空間印象,其由至少二分量組成:主觀聲源寬度(ASW)(ASW的另一常用用語是聽覺空間感(auditory spaciousness))及聽者包圍感(LEV)。ASW被定義為一聲源之主觀寬度之增寬且主要由早期橫向反射來決定。LEV指聽者被聲音包圍的感覺且主要由晚到反射來決定。電聲立體聲再現的目標是引起對一令人愉悅的聽覺空間聲像的感知。這可能有一自然或建築參考(例如,一大廳中之音樂會的錄音),或其可以是實際上並不存在的一聲場(例如,電聲音樂)。
從音樂廳聲學的範疇來看,眾所周知的是-獲得一主觀上令人愉悅的聲場-一聽覺空間印象的強烈感覺是重要的,其中LEV是一不可或缺的部分。揚聲器設置藉由再現一擴散聲場來再現一包圍聲場的能力受到關注。在一合成聲場中,不可能使用專用轉換器再現所有自然發生的反射。對於擴散較晚反射此尤其為真。漫反射之時間及音強性質可藉由使用「迴響」信號作為揚聲器饋送來模擬。若這些充分地無關,則用於播放的揚聲器的數目及位置決定聲場是否被感知為擴散的。目標是僅使用離散數目的轉換器引起一連續、擴散聲場的感知。也就是說,產生無聲音到達方向可被評估,且特別是無單一轉換器可被定位的聲場。合成聲場之主觀擴散可在主觀測試中予以評估。
立體聲再現旨在僅使用離散數目的轉換器引起對一連續聲場之感知。最想得到的特徵是局部化聲源的方向穩定性及周圍聽覺環境之真實感渲染。現今用以儲存或傳送立體聲記錄的大多數格式是以通道為基礎。每一通道傳播一信號,該信號欲透過處於特定位置的一相關揚聲器而被播放。一特定的聽覺聲像在記錄或混合程序期間被設計。若用於再現的揚聲器設置類似於記錄所針對設計的目標設置,則此聲像被準確地再生。
合宜的傳輸及播放通道的數目不斷地增大,且每一新出現的音訊再現格式產生欲使舊有格式內容在現行的播放系統上呈現的需求。上混演算法是對於此一需求的一解決方案,由一舊有信號計算具有較多通道的一信號。一些立體聲上混演算法已在文獻中提出,例如Carlos Avendano及Jean-Marc Jot於2004年發表在“Journal of the Audio Engineering Society”第52卷,第7/8期第740-749頁中的“A frequency-domain approach to multichannel upmix”;Christof Faller於2006年11月在“Journal of the Audio Engineering Society”第54卷第11期第1051-1064頁中的“Multiple-loudspeaker playback of stereo signals”;John Usherand Jacob Benesty於2007年9月在“IEEE Transactions on Audio,Speech,and Language Processing”第15卷第7期第2141-2150頁中的“Enhancement of spatial sound quality: A new reverberation-extraction audio upmixer”。這些演算法中大多數是以後隨以適於目標揚聲器設置之渲染的直達/環境聲信號分解為基礎。
所述之直達/環境聲信號分解不能立即適用於多聲道環繞信號。不易用公式表示一信號模型及由N個音訊通道濾波得到對應的N個直達聲及N個環境聲通道。在立體聲音箱中所使用的簡單信號模型,參見,例如Christof Faller於2006年11月發表在“Journal of the Audio Engineering Society”第54卷第11期第1051-1064頁中的“Multiple-loudspeaker playback of stereo signals”,假定在所有通道中互相關聯的直達聲並未占有環繞信號通道之間可能存在的多種通道關係。
立體聲再現的總體目標是僅使用有限數目的傳輸通道及轉換器引起對一連續聲場的感知。對於空間聲音再現,兩個揚聲器是最低要求。現代的消費者系統常常提供大量的再現通道。基本上,立體聲信號(與通道數目無關)被記錄或混合成使得對於每一聲源,直達聲相干地(= 非獨立的 )進入具有特定方向座標的一些通道,且反射的 獨立 聲音進入決定主觀聲源寬度聽者包圍感之座標的一些通道。預期的聽覺聲像之正確感知通常僅在記錄所適用之播放設置中的理想觀察點中方屬可能。加入更多的揚聲器到一特定的揚聲器設置中通常實現一自然聲場的一更加真實的重建/模擬。若輸入信號以另一格式提供,為了完全利用一擴增的揚聲器設置、或為了處理輸入信號之感知不同部分,那些信號必須被單獨擷取。在下文中,此說明書描述一種分離包含任意數目之輸入通道的立體聲記錄之非獨立及獨立分量的方法。
音訊信號分解成感知不同的分量對高品質信號修改、增強、適配播放,及感知編碼是必要的。近來,允許處理及/或擷取雙通道輸入信號之感知不同信號分量的一些方法已被提出。由於具有二個以上通道的輸入信號變得越來越常見,所述處理也是多通道輸入信號所需要的。然而,相對於雙通道輸入所描述的大多數構想無法容易地延伸作用於具有任意數目之通道的輸入信號。
若要對例如具有一左通道、一中間通道、一右通道、一左環繞通道、一右環繞通道及一低頻增強(重低音)的一5.1通道環繞信號的直達及環境聲部分執行一信號分析,應該如何應用一直達/環境聲信號分析並不是直接簡明的。可能考慮到比較每一對六個通道導致一階層處理,其最終有多達15個不同的比較操作。接著,當所有這些15個比較操作完成時,每一通道已與所有其他通道比較後,將必須決定應該如何評估15個結果。這是耗費時間的,結果難以解讀,且由於有相當大量的處理資源,不能用於例如直達/環境聲分離,或一般而言,例如可以在上混或任何其他音訊處理操作中使用之信號分解的即時應用上。
在M. M. Goodwin及J. M. Jot於2001年發表在“Proc. Of ICASSP 2007”中之“Primary-ambient signal decomposition and vector-based localization for spatial audio coding and enhancement”中,一主成分分析被應用於輸入通道信號,以執行主要(=直達)及環境聲信號分解。
Christof Faller於2006年11月發表在“Journal of the Audio Engineering Society”第54卷第11期第1051-1064頁中之“Multiple-loudspeaker playback of stereo signals”,及C. Faller於2007年10月發表在“Preprint 123 rd Conv. Aud. Eng. Soc.”中之“A highly directive 2-capsule based microphone system”中所使用的模型分別在立體聲及麥克風信號中採用去相關或部分相關漫射聲。它們考慮此一假定下推導出用以擷取漫射聲/環境聲信號的濾波器。這些方法被局限於單一及雙通道音訊信號。
另一參考文獻是C. Avendano及J.-M. Jot於2004年發表在“Journal of the Audio Engineering Society”第52卷第7/8期第740-749頁之“A frequency-domain approach to multichannel upmix”。參考文獻-M. M. Goodwin及J. M. Jot 於2007年發表在“Proc. Of ICASSP 2007”中之“Primary-ambient signal decomposition and vector-based localization for spatial audio coding and enhancement”對Avendano,Jot參考評論如下。該參考文獻提供一種方法,該方法包括產生一時頻遮罩以自一立體聲輸入信號擷取環境聲。然而,該遮罩是以左右通道信號之間之交叉相關為基礎,故此方法並不直接適用於自一任意的多通道輸入擷取環境聲的問題。在此一較高階情況下使用任一此種以相關為基礎的方法,將要求一需要大量計算成本的階層式成對相關分析,或某種多通道相關的替代方法。
空間脈衝響應渲染(SIRR)(Juha Merimaa及Ville Pulkki 於2004年發表在“Proc. of the 7 th Int. Conf. on Digital Audio Effects”(DAFx’04)中之“Spatial impulse response rendering”)以方向估計直達聲且以B格式脈衝響應估計漫射聲。與SIRR非常類似,定向音訊編碼(DirAC)(Ville Pulkki於2007年6月發表在“Journal of the Audio Engineering Society”第55卷第6期第503-516頁上之“Spatial sound reproduction with directional audio coding”)對B格式連續音訊信號實施類似的直達及漫射聲分析。
赫爾辛基理工大學的Julia Jakka於2005年發表的博士論文,碩士論文“Binaural to Multichannel Audio Upmix”中所提出的方法描述使用雙耳信號作為輸入的一上混。
參考文獻-Boaz Rafaely於2001年10月21日至24日在紐約州新帕爾茲“IEEE Workshop on Applications of Signal Processing to Audio and Acoustics 2001中發表的Spatially Optimal Wiener Filtering in a Reverberant Sound Field”描述維納濾波器之推導,維納濾波器對迴響聲場在空間上是最佳的。在迴響室中應用雙麥克風雜訊消除被提出。由擴散聲場之空間相關所推導出的最佳濾波器擷取聲場之局部特性,且因此具有較低階數且可能在迴響室中比習知的適配雜訊消除濾波器空間上更堅固。無約束及因果約束之最佳濾波器的公式被提出且對一雙麥克風語音增強的一示範應用使用一電腦模擬來證明。
雖然維納濾波方法可提供迴響室中雜訊消除的有用結果,但是其可能計算效率低,且在某些情況下,對信號分解不是那麼有用。
本發明之目的在於提供用以分解一輸入信號的一改良構想。
此目的藉由如申請專利範圍第1項所述,用以分解一輸入信號的一裝置、一種如申請專利範圍第14項所述,分解一輸入信號的方法或如申請專利範圍第15項所述的一電腦程式來實現。
本發明所根據的研究成果是當信號分析基於預先計算頻率依賴相似度曲線作為一參考曲線被執行時獲得信號分解的上一特定效率。「相似度」一詞包括相關及相干,其中-從嚴格的數學意義上來說,相關是在無額外時間偏移的二信號之間被計算,且相干是藉由偏移二信號的時間/相位使得該等信號具有一最大相關來計算,且實際頻率相關是以所應用的時間/相位偏移來計算。對於本文,相似度、相關及相干被視為意義相同,即二信號之間的相似度的一數量等級,例如,一較高絕對值的相似度意指二信號較為相似且一較低絕對值的相似度意指二信號較不相似。
已經證明,使用此相似度曲線作為一參考曲線允許一非常有效率的可實施分析,這是因為該曲線可用於直接比較操作及/或加權因數計算。使用一預先計算頻率依賴相似度曲線允許僅執行簡單的計算而非較複雜的維納濾波操作。此外,鑒於問題並未從一統計的觀點處理而是以一更為分析性的方式來處理,由於從當前設置引入盡可能多的資訊以獲得問題的解決方案,頻率依賴相似度曲線的應用特別有用。此外,此程序的變通性非常高,這是因為參考曲線可藉由許多不同的方式來獲得。一種方式是,在某一設置中實際量測二或多個信號且接著由量測信號計算頻率相似度曲線。因此,可發送不同揚聲器的獨立信號或具有預先知道的某種依賴性程度的信號。
另一較佳的替代方案是在獨立信號的假設之下僅計算相似度曲線。在此情況下,實際上任何信號都不是必需的,這是因為結果是信號無關的。
使用一信號分析之參考曲線的信號分解可被應用於立體聲處理,即應用於分解一立體聲信號。可選擇地,此程序亦可與用以分解多通道信號的一下混器一起被實施。可選擇地,當一階層方式的信號成對評估被設想時,此程序亦可在不使用一下混器下被實施於多通道信號。
在另一實施例中,不直接對輸入信號,即具有至少三輸入通道的一信號的不同信號分量執行分析是一有利方法。代之者,具有至少三輸入通道的多通道輸入信號藉由用一下混器來處理以分解輸入信號獲得一下混信號。下混信號所具有之下混通道的數目小於輸入通道的數目,且較佳地是兩個。接著,輸入信號的分析對下混信號而非直接對輸入信號執行,且該分析產生一分析結果。然而,此分析結果並不應用於下混信號,而是應用於輸入信號,或可選擇地,應用於由輸入信號導出的一信號,其中由輸入信號導出的此信號可以是一上混信號,或依輸入信號之通道的數目而定,也可以是一下混信號,但是由輸入信號導出的此信號將不同於已執行分析的下混信號。例如,當所考量之情況是,輸入信號是一5.1通道信號時,則已執行分析的下混信號可能是具有二通道的一立體聲下混。分析結果接著被直接應用於5.1輸入信號,應用於一較高的上混,諸如7.1輸出信號或應用於輸入信號之一多通道下混,該輸入信號例如當僅一三通道音訊渲染裝置在手邊時僅具有三個通道,即左通道、中間通道及右通道。然而,在任何情況下,由信號處理器應用分析結果的信號都不同於已執行分析的下混信號,且典型地比相對於信號分量執行分析的下混信號具有更多通道。
鑒於可假定個別輸入通道中的任何信號分量也出現在下混通道中,所謂的「間接」分析/處理是可能的,這是因為一下混典型地由輸入通道之不同方式的一加成組成。一直接下混為,例如,個別輸入通道按一下混規則或一下混矩陣的需要來加權且接著在加權之後加在一起。一替代下混由利用某些濾波器,諸如HRTF濾波器來過濾輸入通道組成,且該下混藉由使用濾波信號,即由業內已知的HRTF濾波器所濾波之信號來執行。對於一五通道輸入信號,需要10個HRTF濾波器,且HRTF濾波器的左部分/左耳的輸出被加在一起,及右通道濾波器的HRTF濾波器的右耳輸出被加在一起。替代下混可被應用,以減少必須在信號分析器中加以處理的通道數目。
因此,本發明之實施例描述用以藉由考量一分析信號,自任意輸入信號擷取感知不同分量,同時分析結果被應用於輸入信號的一新構想。此分析信號可,例如藉由考量通道或揚聲器信號對耳朵的一傳播模型來獲得。這在某種程度上因人類聽覺系統也僅使用二感測器(左右耳)來評估聲場而引起動機。因此,感知不同分量之擷取基本上成為考量將在下文中被表示為下混的一分析信號。在本文中,「下混」一詞使用於產生一分析信號的任一多通道信號之預處理(這可包括,例如傳播模型、HRTF、BRIR、簡單的交叉因數下混)。
知道特定輸入的格式及將被擷取之信號的期望特性,理想的通道間關係可相對下混格式被定義,且此一分析信號之此分析足以產生一加權遮罩(或多個加權遮罩)用以分解多通道信號。
在一實施例中,多通道問題藉由使用一環繞信號之一立體聲下混且對該下混應用一直達/環境聲分析而被簡化。根據結果,即直達及環境聲之短時功率譜估計,濾波器被導出用以將一N通道信號分解成N個直達聲及N個環境聲通道。
本發明是有利的,這是因為信號分析是在較少數目的通道上實施,顯著地減少所需的處理時間,使得發明構想甚至可即時應用中實施以供用於上混或下混、或其他需要不同分量,諸如一信號之感知不同分量的任何其他信號處理操作。
本發明之另一優勢在於,雖然一下混被執行,但是已發現,這並未使輸入信號中的感知不同分量的可檢測性降低。換句話說,即使當輸入通道被下混時,個別信號分量也仍可被分離到一大程度。此外,下混以一種將所有輸入通道之所有信號分量「收集」到雙通道中的方式運作,且實施於這些「收集」下混信號的單一分析提供一不需要被解讀且可直接用於信號處理的唯一結果。
圖式簡單說明
本發明之較佳實施例隨後相關於附圖來討論,其中:第1圖是繪示用以使用一下混器來分解一輸入信號的一裝置的一方塊圖;第2圖是繪示依據本發明之另一層面,用以使用具有一預先計算頻率依賴相關曲線的一分析器來分解具有至少三個輸入通道的一信號的一裝置的一實施態樣的一方塊圖;第3圖繪示本發明之另一較佳實施態樣,包括對下混的一頻域處理、分析及信號處理;第4圖繪示一示範性預先計算頻率依賴相關曲線作為第1圖或第2圖中所表示之分析的一參考曲線;第5圖繪示說明用以擷取獨立分量之另一處理的一方塊圖;第6圖繪示在獨立擴散、獨立直達及直達分量被擷取情況下的進一步處理的一方塊圖的另一實施態樣;第7圖繪示實施下混器作為一分析信號產生器的一方塊圖;第8圖繪示表示第1圖或第2圖之信號分析器中的一較佳處理方式的一流程圖;第9a-9e圖繪示不同的預先計算頻率依賴相關曲線,該等曲線可用作具有不同數目與位置之聲源(諸如揚聲器)的數個不同設置的參考曲線;第10圖繪示用以說明一擴散估計的另一實施例的一方塊圖,其中擴散分量是被分解的分量;及第11A及11B圖繪示在無頻率依賴相關曲線但依賴於維納濾波方法下實施一信號分析的示範方程式。
較佳實施例之詳細說明
第1圖繪示一種用以分解具有為數至少三個輸入通道,或一般而言,N個輸入通道的一輸入信號10的裝置。這些輸入通道被輸入到用以下混輸入信號的一下混器12中以獲得一下混信號14,其中下混器12被配置成用以下混,使得由「m」表示的下混信號14之下混通道數目至少為2、且小於輸入信號10之輸入通道的數目。m個下混通道被輸入到用以分析下混信號的一分析器16中以導出一分析結果18。分析結果18被輸入到一信號處理器20中,其中該信號處理器被配置成使用該分析結果,藉由一信號導出器22處理輸入信號10或由該輸入信號導出的一信號,其中信號處理器20被配置成對輸入通道或對由輸入信號導出的信號24之通道應用分析結果以獲得一分解信號26。
在第1圖中所示之實施例中,輸入通道的數目為n,下混通道的數目為m,導出通道的數目為l,且輸出通道的數目等於l,當該導出信號而非輸入信號由信號處理器處理時。可選擇地,當信號導出器22並不存在時,輸入信號直接由信號處理器來處理,且在第1圖中由「l」表示的分解信號26之通道的數目將等於n。因此,第1圖繪示兩個不同的範例。一個範例沒有信號導出器22且輸入信號直接應用於信號處理器20。另一範例為信號導出器22被實施,且接著,導出信號24而非輸入信號10由信號處理器20處理。該信號導出器可以是,例如,一音訊通道混合器,諸如用以產生較多輸出通道的一上混器。在此情況下,l將大於n。在另一實施例中,該信號導出器可以是對輸入通道執行加權、延遲或任何其他操作的另一音訊處理器,且在此情況下,信號導出器22之輸出通道的數目l將等於輸入通道的數目n。在另一實施態樣中,該信號導出器可以是一下混器,其將輸入信號的通道數目減少到導出信號的通道數目。在此實施態樣中,較佳的是,數目l仍大於下混通道的數目m,以擁有本發明的優勢之一,即信號分析被應用於較少數目的通道信號。
該分析器操作以分析關於感知不同分量的下混信號。一方面,這些感知不同分量可以是個別通道中的獨立分量,且另一方面,可以是非獨立分量。本發明所分析的替代信號分量一方面是直達分量且另一方面是環境聲分量。有許多其他分量可由本發明分離,諸如來自音樂分量的語音分量,來自語音分量的雜訊分量,來自音樂分量的雜訊分量,相對於低頻雜訊分量的高頻雜訊分量,多音高信號中由不同樂器提供的分量等。這是因為有強大的分析工具,諸如第11A、11B圖中所討論的維納濾波或其他分析程序,諸如使用,例如,依據本發明在第8圖中所討論的一頻率依賴相關曲線。
第2圖繪示另一層面,其中分析器被實施用以使用一預先計算頻率依賴相關曲線16。因此,用以分解具有多個通道的一信號28之裝置包含分析器16,分析器16用以分析與輸入信號完全相同或與輸入信號相關的一分析信號之二通道之間的一相關,例如,藉由第1圖中所示的一下混操作。分析器16所分析之分析信號具有至少兩個分析通道,且分析器16被配置成使用一預先計算頻率依賴相關曲線作為一參考曲線以決定分析結果18。信號處理器20可以與第1圖中所討論者以相同的方式運作且被配置成藉由一信號導出器22來處理分析信號或由該分析信號導出的一信號,其中信號導出器22可實施成類似於在第1圖之信號導出器22中所討論者。可選擇地,該信號處理器可處理導出該分析信號的一信號,且信號處理使用分析結果來獲得一分解信號。因此,在第2圖之實施例中,輸入信號可與分析信號完全相同,且在此情況下,分析信號也可以是僅具有第2圖中所示之二通道的一立體聲信號。可選擇地,分析信號可藉由任一種處理,諸如第1圖中所述之下混,或藉由任何其他處理,諸如上混等由一輸入信號被導出。此外,信號處理器20在對已輸入到分析器中者相同的信號應用信號處理上是有用的,或該信號處理器可對諸如第1圖中所示,導出分析信號的一信號應用一信號處理,或該信號處理器可對諸如藉由上混等由分析信號導出的一信號應用一信號處理。
因此,信號處理器存在不同的可能性且鑒於使用一預先計算頻率依賴相關曲線作為一參考曲線來決定分析結果的分析器獨特操作,所有這些可能性都是有利的。
隨後,其他實施例被討論。應指出的是,如第2圖中所討論者,甚至使用一雙通道分析信號(無下混)被考量。因此,在第1圖及第2圖中就不同層面所討論的本發明可一起使用或以單獨的層面使用,下混可由分析器來處理,或一可能尚未由一下混產生的雙通道信號可由使用預先計算參考曲線的信號分析器來處理。就此一情況而論,應指出的是,實施層面之後續說明可應用於第1圖及第2圖中示意性繪示之兩個層面,即便是當某些特徵僅對於一層面而非二層面而被描述時。例如,若第3圖被考量,則清楚的是,第3圖之頻域特徵就第1圖中所示之層面而被描述,但是應清楚的是,隨後相關於第3圖而描述的一時間/頻率轉換及反轉換也可應用於第2圖中之實施態樣,其中沒有下混器,但是有使用一預先計算頻率依賴相關曲線的一特定分析器。
特別是,時間/頻率轉換器將被安置以在分析信號被輸入到分析器之前轉換該分析信號,且頻率/時間轉換器將被安置在信號處理器之輸出以將處理信號轉換回時域。當一信號導出器存在時,時間/頻率轉換器可能被安置在信號導出器的一輸入,使得該信號導出器、該分析器,及該信號處理器均在頻域/子頻域中運作。就此一情況而論,頻率及子頻帶基本上意味著一頻率表示之頻率的一部分。
此外,應清楚地是,第1圖中的分析器可以許多不同方式來實施,但是在一實施例中,此分析器也被實施為第2圖中所討論之分析器,即,使用一預先計算頻率依賴相關曲線作為維納濾波或任何其他分析方法的一替代物的一分析器。
第3圖之實施例對一任意輸入信號應用一下混程序以獲得一雙通道表示。一時頻域中之分析被執行且加權遮罩被計算而乘以輸入信號之時間頻率表示,如第3圖中所示者。
在圖像中,T/F表示一時間頻率轉換;通常稱為一短時傅立葉變換(STFT)。iT/F表示各自的反轉換。[x 1(n),…,x N (n)]是時域輸入信號,其中n是時間索引。[X 1(m,i),…,X N (m,i)]表示頻率分解之係數,其中m是分解時間索引,且i是分解頻率索引。[D 1(m,i),D 2(m,i)]是下混信號之二通道。
W(m,i)是計算之加權。[Y 1(m,i),...,Y N (m,i)]是每一通道之加權頻率分解。H ij (i)是下混係數,其可以是實值或複值的且該等係數可能是不隨時間變化的或隨時間變化的。因此,下混係數可能僅是常數或濾波器,諸如HRTF濾波器、迴響濾波器或類似的濾波器。
Y j (m,i)=W j (m,i)‧X j (m,i),其中j=(1,2,...,N) (2)
在第3圖中,對所有通道應用相同加權的情況被描述。
Y j (m,i)=W(m,i)‧X j (m,i) (3)
[y 1(n),...,y N (n)]是包含擷取信號分量的時域輸出信號。(輸入信號可能具有任意數目的通道(N),對一任意目標播放揚聲器設置而產生。下混可包括獲得耳輸入信號的HRTF,聽覺濾波器之模擬等。下混也可在時域中實施。)。
在一實施例中,一參考相關之間的差(在本文中,「相關」一詞被使用為通道間相似度的同義字且因此還可包括時間偏移之評估,通常使用「相干」一詞)。即使時間偏移被評估,所產生的值可能具有一符號。(通常地,相干被定義為僅具有正值)作為一頻率函數(c ref (ω)),且下混輸入信號(c sig (ω))的實際相關被計算。依實際曲線與參考曲線的偏差而定,每一時頻網格的一加權因數被計算,指出其是否包含非獨立或獨立分量。所獲得的時頻加權指示獨立分量且可能已經被應用於輸入信號之每一通道以產生一包括可被感知為各別或擴散之獨立部分的多通道信號(通道之數目等於輸入通道之數目)。
參考曲線可以以不同方式來定義。範例為:
‧ 由獨立分量組成的一理想化二或三維擴散聲場之理想理論參考曲線。
‧ 參考目標揚聲器設置對特定輸入信號(例如,具有方位角(±30°)的標準立體聲設置,或依據ITU-R BS.775、具有方位角(0°,±30°,±110°)的標準五通道設置))可達成的理想曲線。
‧ 實際存在之揚聲器設置的理想曲線(實際位置可被量測或透過使用者輸入而獲知。參考曲線可採獨立信號透過特定揚聲器播放而計算)。
‧ 每一輸入通道之實際的頻率依賴短時功率可併入參考之計算。
考慮一頻率依賴參考曲線(c ref (ω)),一上臨界值(c hi (ω))及下臨界值(c lo (ω))可被界定(參見第4圖)。臨界值曲線可能與參考曲線重合(c ref (ω)=c hi (ω)=c lo (ω)),或假定可檢測性臨界值被定義,或它們可被試探導出。
若實際曲線與參考曲線的偏差在臨界值所賦予的邊界內,則實際頻率點得到表示獨立分量的一加權。高於上臨界值或低於下臨界值,該頻率點被表示為非獨立的。此一表示可以是二進制的,或漸進地(即遵循一軟決策函數)。特別是,若上下臨界值與參考曲線重合,則所應用的加權直接相關於參考曲線的偏差。
參照第3圖,參考數字32說明一時間/頻率轉換器,其可被實施為一短時傅立葉變換或產生子頻帶信號的任一種濾波器組,諸如QMF濾波器組。與時間/頻率轉換器32之詳細實施無關,對於每一輸入通道xi,該時間/頻率轉換器之輸出是輸入信號之每一時段的一頻譜。因此,時間/頻率處理器32可被實施成總是獲得一個別通道信號之一輸入樣本區塊並計算頻率表示,諸如具有自一較低頻率延伸至一較高頻率之頻譜線的FFT頻譜。接著,對於下一時間區塊,相同的程序被執行,使得最後,一序列短時頻譜對於每一輸入通道信號被計算。與一輸入通道之某一輸入樣本區塊有關的某一頻譜之某一頻率範圍被視為「時間/頻率網格」且,較佳地是,分析器16中的分析是根據這些時間/頻率網格被執行。因此,該分析器對第一下混通道D1之某一輸入樣本區塊接收一第一頻率的頻譜值作為一時間/頻率網格的一輸入,且接收第二下混通道D2之同一頻率及同一區塊(時間)的值。
接著,例如在第8圖中所示者,分析器16被配置成決定(80)每一子頻帶之二輸入通道之間的一相關值及時間區塊,即一時間/頻率網格的一相關值。接著,在相關於第2圖或第4圖所示之實施例中,分析器16自參考相關曲線擷取對應子頻帶的一相關值(82)。當例如該子頻帶是第4圖中之40所指示的子頻帶時,步驟82產生表示-1與+1之間之一相關的值41,且值41則為擷取相關值。接著,在步驟83中,使用來自步驟80的決定相關值及步驟82中所獲得之擷取相關值41的子頻帶之結果藉由執行一比較而被執行,且後續決策或藉由計算一實際差而被完成。如之前所討論者,結果可能是一二進制結果,也就是說在下混/分析信號中所考量的實際時間/頻率網格具有獨立分量。當實際決定的相關值(在步驟80中)等於參考相關值或非常接近參考相關值時將作成此決策。
然而,當確定了決定之相關值表示一較參考相關值為高的絕對相關時,則確定考量中的時間/頻率網格包含非獨立分量。因此,當下混或分析信號之一時間/頻率網格之相關表示一較參考曲線為高的絕對相關值時,則可以說,此時間/頻率網格中的分量是彼此依賴的。然而,當相關被表示為非常接近參考曲線時,則可以說,該等分量是獨立的。非獨立分量可接收一第一加權值,諸如1,且獨立分量可接收一第二加權值,諸如0。較佳地是,如第4圖中所示者,與參考線相間隔的高及低臨界值被使用,以提供比單獨使用參考曲線更適合的一較佳結果。
此外,相關於第4圖,應指出的是,相關可在-1與+1之間變化。具有一負號的一相關附加表示信號間的一180°相移。因此,僅在0與1之間延伸的其他相關也可被應用,其中使該相關之負值部分變成正值。在此程序中,出於相關決定的目的,將會忽視一時間偏移或相位偏移。
計算結果的替代方式是實際計算方塊80中所決定之相關值與方塊82中所獲得之擷取相關值之間的距離且接著基於該距離,決定0與1之間的一度量作為一加權因數。雖然第8圖中之第一替代方式(1)僅產生值0或1,但是可能性(2)產生0與1之間的值,且在某些實施態樣中是較佳的。
第3圖中之信號處理器20被繪示為乘法器且分析結果只是一決定的加權因數,該加權因數由分析器被轉發至信號處理器,如第8圖中之84中所示者,且接著被應用於輸入信號10之對應的時間/頻率網格。當例如實際考量之頻譜是頻譜序列中第20個頻譜時,且當實際考量之頻率點是此第20個頻譜之第5個頻率點時,則時間/頻率網格可被表示為(20,5),其中第一個數字表示時間區塊的數目,且第二個數字指示此頻譜中的頻率點。接著,時間/頻率網格(20,5)的分析結果被應用於第3圖中之輸入信號之每一通道之對應的時間/頻率網格(20,5),或當第1圖中所示之一信號導出器被實施時,被應用於導出信號之每一通道之對應的時間/頻率網格。
隨後,一參考曲線的計算更加詳細地被討論。然而,對於本發明,基本上參考曲線如何被導出並不重要。其可以是一任意曲線,或,例如,一查找表中表示下混信號D中或,及第2圖中在分析信號中的輸入信號xj的一理想或期望關係的值。下述的導出是示範性的。
一聲場之物理擴散可藉由Cook等人(Richard K. Cook,R. V. Waterhouse,R. D. Berendt,Seymour Edelman,及Jr. M.C. Thompson發表於1955年11月的“Journal Of The Acoustical Society Of America”第27卷第6期第1072-1077頁之“Measurement of correlation coefficients in reverberant sound fields”)所提出的一種利用二空間分離點處之平面波之穩態聲壓之相關係數(r)的一種方法來評估,如下式(4)中所示:
其中p 1(n)與p 2(n)是兩點處的聲壓量測,n是時間索引,且<‧>表示時間平均。在一穩態聲場中,以下關係可被導出:
r(k,d)=J 0(kd)(對於二維聲場)(6),
其中d是二量測點之間的距離,且k=是波數,其中λ為波長。(實際參考曲線r(k,d)可能已被使用作c ref 以作進一步的處理。)
對一聲場之感知擴散的一量測是在一聲場中所量測的雙耳交叉相關係數(ρ)。量測ρ意指壓力感測器(各自的雙耳)之間的半徑是固定的。納入此限制,r變成一頻率函數,角頻率ω=kc,其中c是聲音在空氣中的速度。此外,由於聽者之外耳殼、頭部,及軀幹所引起的反射、繞射,及彎曲效應,壓力信號不同於先前所考量的自由場信號。這些對空間聽力巨大的效應由頭部相關傳輸函數(HRTF)來描述。考量這些影響,耳朵入口處所產生的壓力信號為p L (n,ω)及p R (n,ω)。對於該計算,量測之HRTF資料可被使用或近似值可藉由使用一分析模型(例如,Richard O. Duda及William L. Martens發表於1998年11月的“Journal Of The Acoustical Society Of America”第104卷第5期第3048-3058頁之“Range dependence of the response of a spherical head model”)而被獲得。
由於人類聽覺系統作用為具有有限頻率選擇性的一頻率分析器,此外,此頻率選擇性可被納入。聽覺濾波器被假定表現如同重疊帶通濾波器。在以下示範說明中,一臨界頻帶方法用以藉由矩形濾波器來逼近這些重疊帶通。等效的矩形頻寬(ERB)可按一中心頻率函數計算(Brian R. Glasberg及Brian C. J. Moore於1990年發表在“Hearing Research”第47卷第103-138頁之“Derivation of auditory filter shapes from notched-noise data”)。考量雙耳處理採用聽覺濾波,ρ必須對個別頻率通道來計算,產生以下頻率依賴壓力信號
其中積分極限由依據實際中心頻率ω的臨界頻帶之邊界給定。因數1/b(w)可以或可以不用在方程式(7)及(8)中。
若聲壓量測之一提前或延遲了一頻率無關時間差,則信號之相干可被估計。人類聽覺系統能夠利用此時間對準性質。通常,雙耳相干在±1ms內計算。依可用的處理功率而定,計算可僅使用零滯後值(對於低複雜性而言)或一時間提前及延遲下的相干(若高複雜性是可能的)而被實施。在下文中,這兩種情況無差別。
理想表現在就一理想擴散聲場而論下被達成,該理想聲場可被理想化為由在所有方向上傳播的勻強非相關平面波組成(即具有隨機相位關係及均勻分佈之傳播方向的無限個傳播平面波的疊加)的一波場。對於位置距離足夠遠的一聽者而言,一揚聲器所發射的一信號可被視為一平面波。此平面波假定在透過揚聲器播放之立體聲中是常見的。因此,由揚聲器所再現的一合成聲場由來自有限方向的貢獻平面波組成。
考慮到具有N個通道的一輸入信號,該信號產生用以透過揚聲器位置為[l 1,l 2,l 3,...,l N ]的一設置來播放。(就一僅水平播放設置而言,l i 表示方位角。在一般情況下,l i =(方位角,仰角)表示揚聲器相對於聽者頭部的位置。若聆聽室中存在的設置與參考設置不同,l i 可選擇性地表示實際播放設置之揚聲器位置)。利用此資訊,在獨立信號被饋送至每一揚聲器的假定下,用於一擴散場模擬的一雙耳相干參考曲線ρ ref 可對於此一設置被計算。每一時頻網格中的每一輸入通道所貢獻之信號功率可納入參考曲線之計算中。在示範實施態樣中,ρ ref 被用作c ref
作為頻率依賴參考曲線或相關曲線之範例的不同參考曲線在第9a至9e圖中相對在不同聲源位置上之不同數目聲源繪示,且在諸圖式中指出不同的頭部方位。
隨後,在第8圖中基於參考曲線所討論之分析結果的計算將更加詳細地被討論。
若在獨立信號由所有揚聲器播放的假定下,下混通道之相關等於計算參考相關,則目標是導出等於1的一加權。若下混之相關等於+1或-1,則導出之加權應該為0,表示不存在獨立分量。在這些極端情況中間,加權應代表獨立(W=1)或完全不獨立(W=0)之表示間的一適當轉變。
鑑於參考相關曲線c ref (ω)及透過實際再現設置(c sig (ω))播放之實際輸入信號之相關/相干的估計(c sig 為下混之各別相干的相關),c ref (ω)與c sig (ω)的偏差可被計算。此偏差(可能包括一上及下臨界值)被映射至範圍[0;1]以獲得一加權(W(m,i)),該加權被應用於所有輸入通道以分離獨立分量。
以下範例繪示當臨界值與參考曲線相對應時的一可能映射:
實際曲線C sig 偏離參考c ref 之大小(用Δ表示)由下式提供:
Δ(ω)=|c sig (ω)-c ref (ω)| (9)
若相關/相干被限制在[-1;+1]之間,對於每一頻率,與+1或-1的最大可能偏差由下式提供:
對於每一頻率的加權因而由下式獲得:
考量頻率分解之時間依賴性及有限頻率分辨,加權值被導出如下(此處,可隨著時間變化的一參考曲線之一般情況被提供。一時間無關參考曲線(即c ref (i))也是可能的):
此處理可在一頻率分解中實施,其中頻率係數因計算複雜性被分組成感知激勵子頻帶,及獲得具有較短脈衝響應的濾波器。此外,平滑濾波器可被應用且壓縮函數(即以一期望方式來扭曲加權,另外引入最小及/或最大加權值)可被應用。
第5圖繪示本發明之另一實施態樣,其中下混器使用所示之HRTF及聽覺濾波器而被實施。此外,第5圖附加說明分析器16所輸出的分析結果是對於每一時間/頻率點的加權因數,且信號處理器20被繪示為用以擷取獨立分量的一擷取器。接著,處理器20之輸出再次為N個通道,但是每一通道現在僅包括獨立分量且不再包括非獨立分量。在此實施態樣中,分析器將計算加權,使得,在第8圖之第一實施態樣中,一獨立分量將接收一加權值1且一非獨立分量將接收一加權值0。接著,由處理器20所處理的具有非獨立分量的原始N個通道中的時間/頻率網格將被設定為0。
在另一替代方式中,在第8圖中有加權值在0與1之間,分析器將會計算加權,使得與參考曲線距離較小的一時間/頻率網格將會接收一高值(更加接近於1),且與參考曲線距離較大的一時間/頻率網格將會接收一小加權因數(較接近於0)。在所示之後續加權中,例如,在第3圖之20中,獨立分量將會被放大,而非獨立分量將會變小。
然而,當信號處理器20將被實施成不擷取獨立分量但擷取非獨立分量時,將指定相反的加權,使得當加權在第3圖中所示之乘法器20中被執行時,獨立分量變小且非獨立分量被放大。因此,每一信號處理器可被應用以擷取信號分量,這是因為實際擷取之信號分量之決定由實際指定的加權值來決定。
第6圖繪示發明構想之另一實施態樣,但是現在包括一不同實施態樣之處理器20。在第6圖之實施例中,處理器20被實施以擷取獨立擴散部分、獨立直達部分及直達部分/分量本身。
為了由分離的獨立分量(Y 1,…,Y N )獲得有助於感知一包圍/環境聲場的部分,更進一步的限制條件必須被考量。一個這樣的限制條件可以是,包圍環境聲在每個方向上強度相等的假定。因此,例如,獨立聲音信號之每一通道中的每一時頻網格之最小能量可被擷取以獲得一包圍環境聲信號(可被進一步處理以獲得較多的環境聲通道)。範例為:
其中P表示一短時功率估計。(此範例顯示最簡單的情況。一個不適用的明顯例外情況是通道之一包括信號暫停時,此時此通道中的功率將會非常低或為零。)
在有些情況下,擷取所有輸入通道之相等的能量部分及僅使用此擷取頻譜來計算加權是有利的。
擷取之非獨立(這些可例如被推導為Ydependent=Yj(m,i)-Xj(m,i)部分)可用以檢測通道依賴性及估計輸入信號中所固有的方向座標,允許進一步被處理,例如,再平移。
第7圖描繪一般構想的一變化型式。N通道輸入信號被饋送至一分析信號產生器(ASG)。M通道分析信號的產生例如可包括從通道/揚聲器到耳朵的一傳播模型或在此文件中被表示為下混的其他方法。不同分量之指示是基於分析信號。指示不同分量的遮罩被應用於輸入信號(A擷取/D擷取(20a,20b))。加權輸入信號可被進一步處理(A後處理/D後處理(70a,70b)以產生具有特定性質的輸出信號,其中在此範例中,指示符「A」及「D」已被選擇成表示,擷取之分量可以是「環境聲」及「直達聲」。
隨後,第10圖被描述。若聲音能量之方向分佈並不依方向而定,則一穩態聲場被稱作擴散。該方向能量分佈可藉由使用一高方向性麥克風來量測所有方向來評估。在室內聲學中,一封閉體中的迴響聲場常常被模型化為一擴散場。一擴散聲場可被理想化為由在所有方向上傳播的勻強非相關平面波組成的一波場。這樣的一聲場是等向的且均勻的。
若能量分佈的均勻性特別受關注,則二空間分離點處的穩態聲壓p 1 (t)p 2 (t)之點對點相關係數r=可用以評估一聲場之物理擴散。對由一正弦波源所引起之假定理想三維及二維穩態擴散聲場,以下關係可被導出:
r 2 D =J 0(kd),
其中k=(λ=波長)是波數,且d是量測點之間的距離。在這些關係之下,一聲場之擴散可藉由比較量測資料與參考曲線來評估。由於理想關係僅是必要條件,而不是充分條件,一些對於連接麥克風之軸的不同方位的量測可被考量。
考量一聽者在一聲場中,聲壓量測由耳朵輸入信號p l (t)p r (t)提供。因此,量測點之間的假定距離d是固定的且r變成一唯一頻率函數,f=,其中c是聲音在空氣中的速度。由於聽者之外耳殼、頭部及軀幹所引起之效應的影響,耳朵輸入信號不同於先前所考量之自由場信號。這些對於空間聽力重要的效應由頭部相關傳輸函數(HRTF)來描述。量測之HRTF資料可用以體現這些效應。我們使用一分析模型來模擬HRTF的一近似值。頭部被模型化為一半徑為8.75cm且耳朵位置在方位角±100°且仰角為0°的剛性球體。已知一理想擴散聲場中r之理論行為及HRTF之影響,可以決定擴散聲場的一頻率依賴雙耳交叉相關參考曲線。
擴散估計是基於模擬座標與假定擴散場參考座標之比較。此比較受限於人類聽覺。在聽覺系統中,雙耳處理根據由外耳、中耳及內耳組成的聽覺外周。並不接近於球形模型(例如,外耳殼形、耳道)的外耳之作用及中耳之作用未被考量。內耳之頻譜選擇性被模型化為一重疊帶通濾波器組(在第10圖中表示為聽覺濾波器)。一臨界頻帶方法用以藉由矩形濾波器來逼近這些重疊帶通。等效的矩形頻寬(ERB)按遵照b(f c )=24.7‧(0.00437‧f c +1)的一中心頻率函數來計算。
假定人類聽覺系統能夠執行一時間對準以檢測相干的信號分量且假定交叉相關分析用以估計存在複雜聲音下的對準時間τ(對應於ITD)。載波信號最高達約1-1.5kHz之時間偏移使用波形交叉相關來評估,而在較高頻率,包圍交叉相關變成相關座標。在下文中,我們並不作此一區分。雙耳相干(IC)估計被模型化為正規化雙耳交叉相關函數之最大絕對值
有些雙耳感知模型考量一運行雙耳交叉相關分析。由於我們考量穩態信號,我們並未將時間依賴性納入考量。為了模型化臨界頻帶處理的影響,我們按下式計算頻率依賴正規化交叉相關函數:
其中A是每一臨界頻帶的交叉相關函數,且B與C是每一臨界頻帶的自相關函數。它們依帶通交叉頻譜及帶通自相關頻譜與頻域的關聯可被公式化如下:
其中L(f)及R(f)是耳輸入信號之傅立葉變換,f ±=f c ±是依據實際中心頻率的臨界頻帶之上下積分限度,且*表示複共軛。
若來自不同角度的二或多個源的信號被疊加,則引出波動ILD及ITD座標。為一時間及/或頻率函數的此類ILD及ITD變化可產生空間感。然而,在長時平均值中,一擴散聲場中不能有ILD及ITD。零之一平均ITD意指信號之間的相關不能藉由時間對準來增加。在原則上,ILD可在完整的可聽頻率範圍上評估。因為頭部在低頻下不會構成障礙,所以ILD在中高頻下效率最高。
隨後,第11A及11B圖被討論以說明毋需使用在第10圖或第4圖中所討論的一參考曲線的分析器之一替代實施態樣。
一短時傅立葉變換(STFT)被分別應用於輸入環繞音訊通道x 1(n)至x N (n),產生短時頻譜X 1(m,i)至X N (m,i),其中m是頻譜(時間)索引且i是頻率索引。以(m,i)與(m,i)表示的環繞輸入信號之一立體聲下混之頻譜被計算。對5.1環繞而言,一ITU下混適合作為方程式(1)。X 1(m,i)至X 5(m,i)以此一順序對應於左(L)、右(R)、中心(C)、左環繞(LS),及右環繞(RS)通道。在下文中,為了標記的簡潔,時間及頻率索引大多數被省略。
基於下混立體聲信號,濾波器W D W A 被計算用以獲得方程式(2)及(3)中的直達聲及環境聲環繞信號估計。
假設環境聲信號在所有輸入通道之間不相關,我們選擇下混係數以使得此一假定也適用於下混通道。因此,我們可用公式表示方程式4中的下混信號模型。
D 1 D 2 代表相關的直達聲STFT頻譜,且A 1 A 2 代表不相關的環境聲。進一步假定每一通道中的直達聲及環境聲互不相關。
從一最小均方意義上來說,估計直達聲藉由對原始環繞信號應用一維納濾波以抑制環境聲來實現。為了導出可應用於所有輸入通道的一單一濾波器,方程式(5)中我們對左右通道使用同一濾波器來估計下混中的直達分量。
用於此估計之聯合均方誤差函數由方程式(6)提供。
E{‧}是期望運算符且P D 及及P A 是直達及環境聲分量之短期功率估計的總和(方程式7)。
誤差函數(6)藉由將其導數設定成零而被最小化。所產生之用於估計直達聲的濾波器在方程式8中。
同樣地,用於環境聲的估計濾波器可在方程式9中被導出。
在下文中,對P D P A 的估計被導出,它們是計算W D W A 所需的。下混之交叉相關由方程式10提供。
其中,考慮下混信號模型(4),參照(11)。
進一步假定,下混中的環境聲分量之左右下混通道具有相同的功率,可寫出方程式12。
將方程式12代入方程式10的最後一行且考量方程式13,得到方程式(14)及(15)。
如第4圖中所討論者,產生一最小相關的參考曲線可設想為將二或多個不同聲源置於一重播設置中、且使一聽者頭部位於此重播設置中的某一位置。於是,完全獨立的信號由不同的揚聲器發送。對一雙揚聲器設置而言,如果不會有任何交叉混合產物,雙通道將必須與等於0的一相關完全不相關。然而,這些交叉混合產物因一人類聽力系統之左側到右側的交叉耦合而發生,且其他交叉耦合也會因室內迴響等而發生。因此,第4圖中或第9a至9d圖中所示之所產生的參考曲線並不總是0值,而是具有特別是不同於0的值,儘管在此情境下設想的參考信號是完全獨立的。然而,重要的是理解實際上並不需要這些信號。當計算參考曲線時假定二或多個信號之間的一完全獨立也已足夠。然而,在此情況下,應指出的是其他參考曲線可對其他情境來計算,例如,使用或假定彼此間並不完全獨立但具有某一預先知道的依賴性或依賴性程度的信號。當此不同的參考曲線被計算時,在假定為完全獨立信號的情況下,加權因數之解讀或提供相對一參考曲線將會是不同的。
雖然有些層面已就一裝置而被描述,但是應清楚的是,這些層面還代表對應方法的一說明,其中一方塊或裝置對應於一方法步驟或一方法步驟的一特徵。類似地,就一方法步驟而被描述的層面也代表一對應方塊或項目或一對應裝置之特徵的一說明。
發明的分解信號可被儲存在一數位儲存媒體上或可在一傳輸介質,諸如無線傳輸介質或有線傳輸介質,諸如網際網路上傳送。
依某些實施要求而定,本發明之實施例可以硬體或以軟體來實施。實施態樣可使用一數位儲存媒體來執行,例如軟碟、DVD、CD、ROM、PROM、EPROM、EEPROM或FLASH記憶體,數位儲存媒體上儲存有電子可讀控制信號,與(或能夠與)一可程式電腦系統協作,使得各個方法被執行。
依據本發明的一些實施例包含具有電子可讀控制信號的一非暫態資料載體,它們能夠與一可程式電腦系統協作,使得本文所述方法之一被執行。
一般說來,本發明之實施例可實施為具有一程式碼的一電腦程式產品,當該電腦程式產品在一電腦上運行時,該程式碼可操作地執行該等方法之一。該程式碼可例如被儲存在一機器可讀載體上。
其他實施例包含用以執行本文所述方法之一、儲存在一機器可讀載體上的電腦程式。
換言之,發明方法的一實施例因而是具有一程式碼的一電腦程式,當該電腦程式在一電腦上運行時,該程式碼用以執行本文所述方法之一。
因而,發明方法的另一實施例是一資料載體(或一數位儲存媒體,或一電腦可讀媒體),包含記錄於其上用以執行本文所述方法之一的電腦程式。
因而,發明方法的另一實施例是表示用以執行本文所述方法之一的電腦程式的一資料串流或一序列信號。該資料串流或序列信號例如可被配置成經由一資料通訊連接,例如經由網際網路來傳送。
另一實施例包含一處理裝置,例如,被配置成或適配於執行本文所述方法之一的一電腦或一可程式邏輯裝置。
另一實施例包含一電腦,其上安裝有用以執行本文所述方法之一的電腦程式。
在一些實施例中,一可程式邏輯裝置(例如,一現場可程式閘陣列)可用以執行本文所述方法的某些功能或所有功能。在一些實施例中,一現場可程式閘陣列可與一微處理器協作以執行本文所述方法之一。一般說來,該等方法較佳地藉由任何硬體裝置來執行。
上述實施例僅說明本發明的原理。應理解的是,本文所述配置及細節的修改及變化對熟於此技者將是顯而易見的。因此,意圖僅受後附專利申請範圍之範圍的限制而不受本文中詳細說明及實施例說明所提出的特定細節的限制。
10...輸入信號
12...下混器
14...下混信號
16...分析器/預先計算頻率依賴相關曲線
18...分析結果
20...信號處理器/處理器/乘法器
20a...A擷取
20b...D擷取
22...信號導出器
24...信號/導出信號
26...分解信號
28...信號
32...時間/頻率轉換器/時間/頻率處理器
40...參考數字
41...值
70a...A後處理
70b...D後處理
80、82、83、84...步驟
80、82...步驟/方塊
第1圖是繪示用以使用一下混器來分解一輸入信號的一裝置的一方塊圖;
第2圖是繪示依據本發明之另一層面,用以使用具有一預先計算頻率依賴相關曲線的一分析器來分解具有至少三個輸入通道的一信號的一裝置的一實施態樣的一方塊圖;
第3圖繪示本發明之另一較佳實施態樣,包括對下混的一頻域處理、分析及信號處理;
第4圖繪示一示範性預先計算頻率依賴相關曲線作為第1圖或第2圖中所表示之分析的一參考曲線;
第5圖繪示說明用以擷取獨立分量之另一處理的一方塊圖;
第6圖繪示在獨立擴散、獨立直達及直達分量被擷取情況下的進一步處理的一方塊圖的另一實施態樣;
第7圖繪示實施下混器作為一分析信號產生器的一方塊圖;
第8圖繪示表示第1圖或第2圖之信號分析器中的一較佳處理方式的一流程圖;
第9a-9e圖繪示不同的預先計算頻率依賴相關曲線,該等曲線可用作具有不同數目與位置之聲源(諸如揚聲器)的數個不同設置的參考曲線;
第10圖繪示用以說明一擴散估計的另一實施例的一方塊圖,其中擴散分量是被分解的分量;及
第11A及11B圖繪示在無頻率依賴相關曲線但依賴於維納濾波方法下實施一信號分析的示範方程式。
16...分析器
18...分析結果
20...信號處理器/處理器
22...信號導出器
28...信號

Claims (15)

  1. 一種用以分解具有多個通道的一信號的裝置,其包含:一分析器,用以分析與具有該等多個通道之該信號有關的一分析信號之二通道之間的一相似度,其中該分析器被配置成用以使用一預先計算頻率依賴相似度曲線作為一參考曲線來決定分析結果,其中,該預先計算頻率依賴相似度曲線係已經基於兩個信號而被計算,以獲得該等兩個信號間於一個頻率範圍內之一相似度之數量等級;及一信號處理器,用以使用該分析結果來處理該分析信號或由該分析信號導出的一信號或導出該分析信號的一信號以獲得一分解信號。
  2. 如申請專利範圍第1項所述之裝置,其進一步包含預先儲存該參考曲線的一查找表。
  3. 如申請專利範圍第1項所述之裝置,其進一步包含一時頻轉換器,用以將該信號或該分析信號或導出該分析信號的信號轉換成一時間序列的頻率表示,每一頻率表示具有多個子頻帶,其中該分析器被配置成由該頻率依賴相似度曲線來針對每一子頻帶決定一參考相似度值,且使用子頻帶之二通道之間的一相似度及該參考相似度值來決定該子頻帶的分析結果。
  4. 如申請專利範圍第1項所述之裝置,其中該分析器被配置成藉由比較由該分析信號之該等二通道導出的一相 似度值與由該參考曲線所決定之對應相似度值來計算分析結果,且依據該比較之結果來指定一加權值或計算由該分析信號之該等二通道導出的該相似度值與由該參考曲線所決定的一對應相似度值之間的差。
  5. 如申請專利範圍第1項所述之裝置,其中該分析器被配置成產生加權因數(W(m,i))作為分析結果,且其中該信號處理器被配置成用以藉由以該加權因數來加權而將該加權因數施加至輸入信號或由該輸入信號所導出之信號。
  6. 如申請專利範圍第1項所述之裝置,其進一步包含用以下混一輸入信號至該分析信號的一下混器,該輸入信號比該分析信號具有更多的通道,且其中該處理器被配置成處理該輸入信號或由該輸入信號導出、不同於該分析信號的一信號。
  7. 如申請專利範圍第1項所述之裝置,其中該分析器被配置成使用指示由具有一先前已知依賴性程度之信號所產生之二信號之間的一頻率依賴相似度的預先計算參考曲線。
  8. 如申請專利範圍第1項所述之裝置,其中該分析器被配置成,在假設該等二個信號具有一已知的相似度特性且該等二個信號係可由位於已知揚聲器位置的揚聲器發送的之下,使用指示在一聽者位置的該等二個信號之間的一頻率依賴相似度的一預先儲存頻率依賴相似度曲線。
  9. 如申請專利範圍第7項所述之裝置,其中一參考信號的一相似度特性是已知的。
  10. 如申請專利範圍第7項所述之裝置,其中參考信號是完全去相關的。
  11. 如申請專利範圍第1項所述之裝置,其中該分析器被配置成分析由人耳之一頻率分辨所決定之子頻帶中的下混通道。
  12. 如申請專利範圍第1項所述之裝置,其中該分析器被配置成分析一下混信號以產生允許一直達環境聲分解的一分析結果,且其中該信號處理器被配置成使用該分析結果來擷取該直達部分或該環境聲部分。
  13. 如申請專利範圍第1項所述之裝置,其中該分析器被配置成使用不同於該參考曲線的一較低或較高的邊界,且其中該分析器被配置成比較分析通道之一頻率依賴相似度結果與該較低或較高邊界以決定分析結果。
  14. 一種分解一具有多個通道的信號的方法,其包含以下步驟:使用一預先計算頻率依賴相似度曲線作為一參考曲線來分析與具有該等多個通道之該信號有關的一分析信號之二通道之間的一相似度以決定分析結果,其中,該預先計算頻率依賴相似度曲線係已經基於兩個信號而被計算,以獲得該等兩個信號間於一個頻率範圍內之一相似度之數量等級;及使用該分析結果來處理該分析信號或由該分析信 號導出的一信號或導出該分析信號的一信號以獲得一分解信號。
  15. 一種電腦程式,當該電腦程式由一電腦或處理器執行時,用以執行申請專利範圍第14項之方法。
TW100143542A 2010-12-10 2011-11-28 用以利用預先計算參考曲線來分解輸入信號之裝置和方法 TWI519178B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US42192710P 2010-12-10 2010-12-10
EP11165746A EP2464146A1 (en) 2010-12-10 2011-05-11 Apparatus and method for decomposing an input signal using a pre-calculated reference curve

Publications (2)

Publication Number Publication Date
TW201238367A TW201238367A (en) 2012-09-16
TWI519178B true TWI519178B (zh) 2016-01-21

Family

ID=44582056

Family Applications (2)

Application Number Title Priority Date Filing Date
TW100143542A TWI519178B (zh) 2010-12-10 2011-11-28 用以利用預先計算參考曲線來分解輸入信號之裝置和方法
TW100143541A TWI524786B (zh) 2010-12-10 2011-11-28 用以利用向下混合器來分解輸入信號之裝置和方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
TW100143541A TWI524786B (zh) 2010-12-10 2011-11-28 用以利用向下混合器來分解輸入信號之裝置和方法

Country Status (16)

Country Link
US (3) US10187725B2 (zh)
EP (4) EP2464146A1 (zh)
JP (2) JP5654692B2 (zh)
KR (2) KR101471798B1 (zh)
CN (2) CN103355001B (zh)
AR (2) AR084176A1 (zh)
AU (2) AU2011340891B2 (zh)
BR (2) BR112013014173B1 (zh)
CA (2) CA2820351C (zh)
ES (2) ES2534180T3 (zh)
HK (2) HK1190552A1 (zh)
MX (2) MX2013006358A (zh)
PL (2) PL2649815T3 (zh)
RU (2) RU2554552C2 (zh)
TW (2) TWI519178B (zh)
WO (2) WO2012076332A1 (zh)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI429165B (zh) 2011-02-01 2014-03-01 Fu Da Tong Technology Co Ltd Method of data transmission in high power induction power supply
US10056944B2 (en) 2011-02-01 2018-08-21 Fu Da Tong Technology Co., Ltd. Data determination method for supplying-end module of induction type power supply system and related supplying-end module
US9075587B2 (en) 2012-07-03 2015-07-07 Fu Da Tong Technology Co., Ltd. Induction type power supply system with synchronous rectification control for data transmission
TWI472897B (zh) * 2013-05-03 2015-02-11 Fu Da Tong Technology Co Ltd 自動調節電壓準位之方法、裝置及其感應式電源供應器
US9831687B2 (en) 2011-02-01 2017-11-28 Fu Da Tong Technology Co., Ltd. Supplying-end module for induction-type power supply system and signal analysis circuit therein
US9048881B2 (en) 2011-06-07 2015-06-02 Fu Da Tong Technology Co., Ltd. Method of time-synchronized data transmission in induction type power supply system
US8941267B2 (en) 2011-06-07 2015-01-27 Fu Da Tong Technology Co., Ltd. High-power induction-type power supply system and its bi-phase decoding method
US9628147B2 (en) 2011-02-01 2017-04-18 Fu Da Tong Technology Co., Ltd. Method of automatically adjusting determination voltage and voltage adjusting device thereof
US10038338B2 (en) 2011-02-01 2018-07-31 Fu Da Tong Technology Co., Ltd. Signal modulation method and signal rectification and modulation device
US9600021B2 (en) 2011-02-01 2017-03-21 Fu Da Tong Technology Co., Ltd. Operating clock synchronization adjusting method for induction type power supply system
US9671444B2 (en) 2011-02-01 2017-06-06 Fu Da Tong Technology Co., Ltd. Current signal sensing method for supplying-end module of induction type power supply system
KR20120132342A (ko) * 2011-05-25 2012-12-05 삼성전자주식회사 보컬 신호 제거 장치 및 방법
US9253574B2 (en) * 2011-09-13 2016-02-02 Dts, Inc. Direct-diffuse decomposition
MY181365A (en) * 2012-09-12 2020-12-21 Fraunhofer Ges Forschung Apparatus and method for providing enhanced guided downmix capabilities for 3d audio
EP2976898B1 (en) 2013-03-19 2017-03-08 Koninklijke Philips N.V. Method and apparatus for determining a position of a microphone
EP2790419A1 (en) * 2013-04-12 2014-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio
WO2014171791A1 (ko) 2013-04-19 2014-10-23 한국전자통신연구원 다채널 오디오 신호 처리 장치 및 방법
CN108810793B (zh) 2013-04-19 2020-12-15 韩国电子通信研究院 多信道音频信号处理装置及方法
US9769586B2 (en) * 2013-05-29 2017-09-19 Qualcomm Incorporated Performing order reduction with respect to higher order ambisonic coefficients
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
CN105706468B (zh) 2013-09-17 2017-08-11 韦勒斯标准与技术协会公司 用于音频信号处理的方法和设备
US10580417B2 (en) 2013-10-22 2020-03-03 Industry-Academic Cooperation Foundation, Yonsei University Method and apparatus for binaural rendering audio signal using variable order filtering in frequency domain
EP4246513A3 (en) 2013-12-23 2023-12-13 Wilus Institute of Standards and Technology Inc. Audio signal processing method and parameterization device for same
CN104768121A (zh) 2014-01-03 2015-07-08 杜比实验室特许公司 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
ES2709248T3 (es) 2014-01-03 2019-04-15 Dolby Laboratories Licensing Corp Generación de audio binaural en respuesta a un audio multicanal que usa al menos una red de retardo de retroalimentación
WO2015142073A1 (ko) 2014-03-19 2015-09-24 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
US9860668B2 (en) 2014-04-02 2018-01-02 Wilus Institute Of Standards And Technology Inc. Audio signal processing method and device
EP2942982A1 (en) * 2014-05-05 2015-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. System, apparatus and method for consistent acoustic scene reproduction based on informed spatial filtering
EP3165007B1 (en) 2014-07-03 2018-04-25 Dolby Laboratories Licensing Corporation Auxiliary augmentation of soundfields
CN105336332A (zh) * 2014-07-17 2016-02-17 杜比实验室特许公司 分解音频信号
CN106797525B (zh) 2014-08-13 2019-05-28 三星电子株式会社 用于生成和回放音频信号的方法和设备
US9666192B2 (en) 2015-05-26 2017-05-30 Nuance Communications, Inc. Methods and apparatus for reducing latency in speech recognition applications
US10559303B2 (en) * 2015-05-26 2020-02-11 Nuance Communications, Inc. Methods and apparatus for reducing latency in speech recognition applications
TWI596953B (zh) * 2016-02-02 2017-08-21 美律實業股份有限公司 錄音模組
EP3335218B1 (en) * 2016-03-16 2019-06-05 Huawei Technologies Co., Ltd. An audio signal processing apparatus and method for processing an input audio signal
EP3232688A1 (en) * 2016-04-12 2017-10-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for providing individual sound zones
US10659904B2 (en) * 2016-09-23 2020-05-19 Gaudio Lab, Inc. Method and device for processing binaural audio signal
US10187740B2 (en) * 2016-09-23 2019-01-22 Apple Inc. Producing headphone driver signals in a digital audio signal processing binaural rendering environment
JP6788272B2 (ja) * 2017-02-21 2020-11-25 オンフューチャー株式会社 音源の検出方法及びその検出装置
CN110383700A (zh) * 2017-03-10 2019-10-25 英特尔Ip公司 杂散降低电路和装置、无线电收发器、移动终端、用于杂散降低的方法和计算机程序
IT201700040732A1 (it) * 2017-04-12 2018-10-12 Inst Rundfunktechnik Gmbh Verfahren und vorrichtung zum mischen von n informationssignalen
CA3219540A1 (en) * 2017-10-04 2019-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to dirac based spatial audio coding
CN111107481B (zh) * 2018-10-26 2021-06-22 华为技术有限公司 一种音频渲染方法及装置

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7026A (en) * 1850-01-15 Door-lock
US9025A (en) * 1852-06-15 And chas
US5065759A (en) * 1990-08-30 1991-11-19 Vitatron Medical B.V. Pacemaker with optimized rate responsiveness and method of rate control
US5912976A (en) 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
TW358925B (en) * 1997-12-31 1999-05-21 Ind Tech Res Inst Improvement of oscillation encoding of a low bit rate sine conversion language encoder
SE514862C2 (sv) 1999-02-24 2001-05-07 Akzo Nobel Nv Användning av en kvartär ammoniumglykosidtensid som en effektförhöjande hjälpkemikalie för gödningsmedel eller pesticider samt kompositioner innehållande pesticider eller gödningsmedel
US6694027B1 (en) * 1999-03-09 2004-02-17 Smart Devices, Inc. Discrete multi-channel/5-2-5 matrix system
JP4322207B2 (ja) * 2002-07-12 2009-08-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化方法
EP1576602A4 (en) * 2002-12-28 2008-05-28 Samsung Electronics Co Ltd METHOD AND DEVICE FOR MIXING AUDIO SEQUENCE AND INFORMATION RECORDING MEDIUM
US7254500B2 (en) * 2003-03-31 2007-08-07 The Salk Institute For Biological Studies Monitoring and representing complex signals
JP2004354589A (ja) * 2003-05-28 2004-12-16 Nippon Telegr & Teleph Corp <Ntt> 音響信号判別方法、音響信号判別装置、音響信号判別プログラム
DE602005005640T2 (de) 2004-03-01 2009-05-14 Dolby Laboratories Licensing Corp., San Francisco Mehrkanalige audiocodierung
EP1722359B1 (en) * 2004-03-05 2011-09-07 Panasonic Corporation Error conceal device and error conceal method
US7392195B2 (en) 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
US8843378B2 (en) 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
KR101283741B1 (ko) * 2004-10-28 2013-07-08 디티에스 워싱턴, 엘엘씨 N채널 오디오 시스템으로부터 m채널 오디오 시스템으로 변환하는 오디오 공간 환경 엔진 및 그 방법
US7961890B2 (en) 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
US7468763B2 (en) * 2005-08-09 2008-12-23 Texas Instruments Incorporated Method and apparatus for digital MTS receiver
US7563975B2 (en) * 2005-09-14 2009-07-21 Mattel, Inc. Music production system
KR100739798B1 (ko) 2005-12-22 2007-07-13 삼성전자주식회사 청취 위치를 고려한 2채널 입체음향 재생 방법 및 장치
SG136836A1 (en) * 2006-04-28 2007-11-29 St Microelectronics Asia Adaptive rate control algorithm for low complexity aac encoding
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
US7877317B2 (en) * 2006-11-21 2011-01-25 Yahoo! Inc. Method and system for finding similar charts for financial analysis
US8023707B2 (en) * 2007-03-26 2011-09-20 Siemens Aktiengesellschaft Evaluation method for mapping the myocardium of a patient
DE102008009024A1 (de) 2008-02-14 2009-08-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum synchronisieren von Mehrkanalerweiterungsdaten mit einem Audiosignal und zum Verarbeiten des Audiosignals
EP2272169B1 (en) * 2008-03-31 2017-09-06 Creative Technology Ltd. Adaptive primary-ambient decomposition of audio signals
US8023660B2 (en) 2008-09-11 2011-09-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
WO2010092568A1 (en) * 2009-02-09 2010-08-19 Waves Audio Ltd. Multiple microphone based directional sound filter
WO2010125228A1 (en) * 2009-04-30 2010-11-04 Nokia Corporation Encoding of multiview audio signals
KR101566967B1 (ko) * 2009-09-10 2015-11-06 삼성전자주식회사 디지털 방송 시스템에서 패킷 디코딩 방법 및 장치
EP2323130A1 (en) 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
EP2578000A1 (en) * 2010-06-02 2013-04-10 Koninklijke Philips Electronics N.V. System and method for sound processing
US9183849B2 (en) 2012-12-21 2015-11-10 The Nielsen Company (Us), Llc Audio matching with semantic audio recognition and report generation

Also Published As

Publication number Publication date
EP2464145A1 (en) 2012-06-13
US10187725B2 (en) 2019-01-22
TW201238367A (en) 2012-09-16
CA2820351A1 (en) 2012-06-14
EP2649815B1 (en) 2015-01-21
AR084175A1 (es) 2013-04-24
CA2820376A1 (en) 2012-06-14
RU2555237C2 (ru) 2015-07-10
JP2014502479A (ja) 2014-01-30
KR101480258B1 (ko) 2015-01-09
RU2013131775A (ru) 2015-01-20
BR112013014172A2 (pt) 2016-09-27
TWI524786B (zh) 2016-03-01
ES2530960T3 (es) 2015-03-09
US20130268281A1 (en) 2013-10-10
AR084176A1 (es) 2013-04-24
JP2014502478A (ja) 2014-01-30
CA2820376C (en) 2015-09-29
ES2534180T3 (es) 2015-04-20
WO2012076331A1 (en) 2012-06-14
AU2011340891B2 (en) 2015-08-20
JP5595602B2 (ja) 2014-09-24
EP2649815A1 (en) 2013-10-16
US20190110129A1 (en) 2019-04-11
HK1190552A1 (zh) 2014-07-04
AU2011340890A1 (en) 2013-07-04
TW201234871A (en) 2012-08-16
CN103355001B (zh) 2016-06-29
KR20130105881A (ko) 2013-09-26
BR112013014172B1 (pt) 2021-03-09
US20130272526A1 (en) 2013-10-17
HK1190553A1 (zh) 2014-07-04
US9241218B2 (en) 2016-01-19
CA2820351C (en) 2015-08-04
MX2013006358A (es) 2013-08-08
RU2554552C2 (ru) 2015-06-27
RU2013131774A (ru) 2015-01-20
EP2464146A1 (en) 2012-06-13
CN103348703A (zh) 2013-10-09
KR101471798B1 (ko) 2014-12-10
CN103355001A (zh) 2013-10-16
JP5654692B2 (ja) 2015-01-14
EP2649814B1 (en) 2015-01-14
PL2649814T3 (pl) 2015-08-31
BR112013014173B1 (pt) 2021-07-20
MX2013006364A (es) 2013-08-08
EP2649814A1 (en) 2013-10-16
WO2012076332A1 (en) 2012-06-14
US10531198B2 (en) 2020-01-07
BR112013014173A2 (pt) 2018-09-18
CN103348703B (zh) 2016-08-10
AU2011340891A1 (en) 2013-06-27
PL2649815T3 (pl) 2015-06-30
AU2011340890B2 (en) 2015-07-16
KR20130133242A (ko) 2013-12-06

Similar Documents

Publication Publication Date Title
TWI519178B (zh) 用以利用預先計算參考曲線來分解輸入信號之裝置和方法
TWI540913B (zh) 運用分解器產生輸出信號之裝置和方法
AU2015255287B2 (en) Apparatus and method for generating an output signal employing a decomposer