TWI458331B - 用於計算回聲抑制濾波器的控制資訊的裝置和方法,以及用於計算延遲值的裝置和方法 - Google Patents

用於計算回聲抑制濾波器的控制資訊的裝置和方法,以及用於計算延遲值的裝置和方法 Download PDF

Info

Publication number
TWI458331B
TWI458331B TW098101960A TW98101960A TWI458331B TW I458331 B TWI458331 B TW I458331B TW 098101960 A TW098101960 A TW 098101960A TW 98101960 A TW98101960 A TW 98101960A TW I458331 B TWI458331 B TW I458331B
Authority
TW
Taiwan
Prior art keywords
signal
value
energy
signals
delay
Prior art date
Application number
TW098101960A
Other languages
English (en)
Other versions
TW200942016A (en
Inventor
Fabian Kuech
Markus Kallinger
Christof Faller
Alexis Favrot
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW200942016A publication Critical patent/TW200942016A/zh
Application granted granted Critical
Publication of TWI458331B publication Critical patent/TWI458331B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Description

用於計算回聲抑制濾波器的控制資訊的裝置和方法,以及用於計算延遲值的裝置和方法
本發明的實施例涉及用於計算抑制濾波器的控制資訊的裝置和方法、用於抑制濾波的裝置和方法以及用於計算延遲值的裝置和方法,例如可以用於會議系統、通信系統和可能出現聲學回聲的其他系統。
例如,當來自揚聲器的音調、聲音和雜訊被相同房間內或相同聲學環境內的麥克風拾取時,將出現聲學回聲。在電信系統中,回聲被作為聲學回饋信號發送回位於遠端或另一端的用戶,該用戶注意到這是其自己的話音的延遲版本。這裏,回聲信號表現為一種擾亂的干擾,甚至可能損害互動式的雙向全雙工通信。此外,聲學回聲也可以導致嘯聲效應(howling effects)和聲學回饋環路的其他不穩定性。
這裏,與提供給對應揚聲器的揚聲器信號相比,麥克風拾取的麥克風信號有所不同,這種不同一方面是由其中佈置有麥克風和揚聲器的聲學環境導致的,另一方面是由源自最多樣的物理源的噪音源導致的。除了聲學環境的噪音源之外,揚聲器本身、相關電路、麥克風和與其相關的其他電路(僅作為潛在源中的一些而提出)可能將雜訊耦合入麥克風信號。
這裏,靜態或准靜態雜訊在麥克風信號中的出現可能顯著影響系統可實現的音頻品質。
WO 2006/111370 A1涉及一種用於去除多聲道音頻信號中的回聲的方法和裝置。對於每個免提電信系統,如電話、音頻或視頻會議系統,聲學回聲控制和雜訊抑制是其重要部分。這裏也要考慮帶寬限制和關於計算複雜度的限制。這裏,在該文獻中描述的用於處理多聲道音頻揚聲器信號和至少一個麥克風信號的方法包括以下步驟:將輸入麥克風信號變換為輸入麥克風短時頻譜;根據揚聲器信號來計算組合揚聲器信號的短時頻譜;根據輸入麥克風信號來計算組合麥克風信號的短時頻譜;估計組合麥克風信號的短時頻譜中回聲的幅度譜或功率譜;計算用於對輸入麥克風短時頻譜進行幅度修正的增益濾波器;將該增益濾波器應用至至少一個輸入麥克風頻譜;以及將濾波後的輸入麥克風頻譜轉換至時域。
基於該現有技術,本發明的目的是在與雜訊部分相關的回聲抑制的範圍內提高聲學系統的音頻品質。
這個目的是通過依據申請專利範圍第1項所述的裝置、依據申請專利範圍第20項所述的抑制濾波器、依據申請專利範圍第21或22項其中之一所述的方法或依據申請專利範圍第32項所述的程式來實現的。
在其他信號處理電路中,雜訊對使用信號處理電路來處理的相應分量的性能也有負面影響,不論該分量是類比的還是數位的,是電信號還是光信號。具體地,這裏一方面考慮從所關心的信號獲取資訊的信號處理電路,另一方面考慮基於所獲取的資訊來影響原始信號的信號處理電路。
例如,這樣的信號處理電路的示例是延遲電路,其中從兩個信號的對應比較來導出延遲值。這裏,在一個或更多所關心的信號中存在雜訊部分將使所關心的信號處理電路的性能顯著下降。因此,例如在延遲電路的範圍內,延遲值對另一信號波形的對應適配可能在其品質以及其適配速度方面受到雜訊的負面影響。
這裏,基於該現有技術,本發明的另一目的是提供延遲裝置的延遲值計算方面的改進,允許改進的延遲值計算。
這個目的是通過依據申請專利範圍第23項的用於計算延遲值的裝置、依據申請專利範圍第31項的用於計算延遲值的方法或依據申請專利範圍第32項的程式來實現的。
這裏,用於計算抑制濾波器的控制資訊的裝置的實施例包括計算裝置,所述抑制濾波器用於對第二音頻信號進行濾波,以抑制基於第一音頻信號的回聲。所述計算裝置本身包括值確定裝置,用於為信號組中的至少一個信號的至少兩個在時間上連續的資料塊的帶通信號確定至少一個與能量相關的值。這裏,所述信號組包括第一音頻信號、第二音頻信號和從第一或第二音頻信號導出的信號。所述計算裝置還包括均值確定裝置,用於確定所述帶通信號的至少一個確定的與能量相關的值的至少一個均值。所述計算裝置還包括修正裝置,基於所述帶通信號的確定的均值來對所述帶通信號的至少一個與能量相關的值進行修正。所述計算裝置還包括控制資訊計算裝置,基於所述帶通信號的至少一個修正後的與能量相關的值來計算抑制濾波器的控制資訊。
採取抑制濾波器形式的本發明的實施例包括計算裝置,所述抑制濾波器用於對第二音頻信號進行濾波,以抑制基於第一音頻信號的回聲,所述計算裝置本身包括值確定裝置,用於為信號組中的至少一個信號的至少兩個在時間上連續的資料塊的帶通信號確定至少一個與能量相關的值。所述信號組包括第一音頻信號、第二音頻信號和從第一或第二音頻信號導出的信號。所述計算裝置還包括均值確定裝置,用於確定所述帶通信號的至少一個確定的與能量相關的值的至少一個均值。所述計算裝置還包括修正裝置,基於所述帶通信號的確定的均值來對所述帶通信號的至少一個與能量相關的值進行修正。此外,所述計算裝置還包括聲學抑制濾波器裝置,基於控制資訊來對麥克風信號進行濾波,所述控制資訊至少基於所述帶通信號的至少一個修正後的與能量相關的值。
採取用於計算延遲裝置的延遲值的裝置的形式的本發明的實施例包括計算裝置,所述延遲裝置用於相對於第二信號來延遲第一信號,所述計算裝置本身包括值確定裝置,用於為第一和第二信號的至少兩個在時間上連續的資料塊的第一信號和第二信號的帶通信號確定至少一個與能量相關的值。所述計算裝置還包括均值確定裝置,用於確定所述第一信號和第二信號的帶通信號的至少一個確定的與能量相關的值的至少一個均值。所述計算裝置還包括修正裝置,基於所述第一信號和第二信號的帶通信號的確定的均值來對所述第一信號的帶通信號和所述第二信號的帶通信號的至少一個與能量相關的值進行修正。此外,所述計算裝置還包括延遲值計算裝置,被形成為基於第一和第二信號的修正後的與能量相關的值來計算延遲值。
本發明的實施例基於以下發現:通過對帶通信號的至少一個與能量相關的值的均值進行修正,之後再基於至少一個修正後的與能量相關的值來確定抑制濾波器和/或抑制濾波的控制資訊,可以實現針對噪音源來提高用於回聲抑制的系統中的音頻品質。尤其由於對帶通信號的與能量相關的值的平均和修正是這樣一種可能的對雜訊分量的考慮(在相應的瞬時值(延伸值)方面,雜訊分量包括在時域中為零的統計均值),而且由於帶通信號的與能量相關的值具有不同於零的均值也是對雜訊分量的考慮。
通過基於伴隨的均值來對與能量相關的值進行平均和修正,可以在計算抑制濾波器的控制資訊之前和/或在實際進行抑制濾波之前,從實際有用的信號中分離靜態虛假信號。因此,尤其在本發明的一些實施例中,與現有的雜訊分量相比,可以將抑制濾波器和/或伴隨的控制資訊集中在實際有用的信號上。
這裏,在本發明的實施例中,與能量相關的值可以與實數值的正整數指數次冪成比例。類似地,與能量相關的值可以與幅度(絕對值)的正實數指數次冪成比例。因此,在本發明的實施例中,與能量相關的值可以是能量值(幅度的平方),或與能量值成比例的值。這裏,第一音頻信號可以是揚聲器信號,第二音頻信號可以是麥克風信號。
在本發明的實施例中,因此,值計算裝置也可以被形成為:針對相同資料塊、但具有不同特徵頻率的不同帶通信號,確定多個與能量相關的值。這裏,一般而言,帶通信號是頻譜、與頻率相近或與頻率相關的信號,至少一個特徵頻率與其相關聯。例如,這些特徵頻率可以是中心頻率、起始頻率、終止頻率或其他典型頻率。因此,帶通信號的示例表示傅立葉解析濾波器組的頻譜資訊、子帶或部分頻帶信號、有限頻率範圍內的信號或也可以是QMF(正交鏡像濾波器)信號。
在本發明的實施例中,不僅對單獨的帶通信號,而且對多個對應的帶通信號,或也可以對所有帶通信號來計算以下每一個:相關帶通信號的對應的與能量相關的值、相關的時間平均的均值和考慮相應均值的對應數目的修正後的與能量相關的值;在計算聲學抑制濾波器的控制資訊或直接進行聲學抑制濾波時可以使用這些值。
在本發明的實施例中,可以基於滑動平均來執行均值計算。這裏,根據實施例的具體實現,除了當前資料塊以外,滑動平均或平均還可以僅基於在時間上位於當前資料塊之前的資料塊。因此,例如,可以實現即時平均。
在本發明的另外實施例中,基於從相關的與能量相關的值中減去均值來執行修正。本發明的實施例也包括另外的濾波器單元或延遲裝置,其中,延遲裝置被形成為利用延遲值對信號、波形或值的時間序列(如與能量相關的值的時間序列)進行延遲。這裏,基於修正後的與能量相關的值、未修正的與能量相關的值或其他值來確定所述延遲值。
這裏,本發明的實施例也基於以下發現:通過確定第一信號和第二信號的至少一個帶通信號的與能量相關的值,對其求平均,並基於所確定的均值來相應地對其進行修正,可以實現對延遲裝置的延遲值的計算的改進。這裏,在所關心的帶通信號下的頻率範圍中,或在該帶通信號下的特徵頻率中,可以消除與能量相關的值中表現為零點偏移影響的雜訊部分或靜態信號部分。由於基於與能量相關的值並針對帶通信號來執行相應修正,可以消除以與對應頻率相關的雜訊信號的形式出現的干擾,該干擾在時間平均中基本消失。
對於延遲值的計算,其可以確定延遲值,在該延遲值的幫助下,通過實現本發明的實施例,可以可以更快、更可靠、或更快而且更可靠地實現例如第一和第二信號的波形的適配。
參照附圖,以下將更詳細地解釋本發明的實施例。
在結合第二圖至第十四圖來詳細解釋本發明的各種實施例之前,首先結合第一圖來更詳細的解釋回聲去除中的基本問題。
例如,任何時候當來自揚聲器的音調、聲音或雜訊被相同房間內或相同聲學環境內的麥克風拾取時,將出現聲學回聲。在電信系統中,回聲被作為聲學回饋信號發送回遠端用戶,該用戶注意到這是其自己的話音的延遲版本。在這樣的環境下,回聲信號表現為一種非常擾亂的干擾,甚至可能導致互動式的雙向全雙工通信被阻斷。此外,聲學回聲可以導致嘯聲效應和聲學回饋環路的其他不穩定性。
因此,在全雙工免提電信系統中,回聲控制通常是可取的,以抑制、衰減或去除揚聲器與麥克風之間的耦合。第一圖示出了這種聲學回聲問題。
第一圖示出了在聲學環境120(例如可以是房間)中揚聲器100和麥克風110的佈置。這裏,向揚聲器100提供揚聲器信號130(在第一圖中也稱為x[n]),揚聲器100將其轉換為聲學聲波。這裏,索引n是指揚聲器信號x[n]的離散過程的時間索引。這裏,索引n是整數。
麥克風110拾取入射到其上的聲波,並將其轉換為麥克風信號140(在第一圖中也稱為y[n])。這裏,特別地,麥克風110也拾取源自揚聲器100、從揚聲器100經由不同路徑到達麥克風110的揚聲器信號x[n]的聲學波。除了直接傳輸路徑150之外,在第一圖中還示意性且示例性地繪出了兩個間接傳輸路徑160-1和160-2,在這兩個間接傳輸路徑中,揚聲器100的聲波在聲學環境120處被反射,因此只能間接地到達麥克風110。因此,傳輸路徑160也被稱為間接路徑。
因此,如果在揚聲器100處可用的揚聲器信號x[n]是遠端電信系統用戶的話音信號(所謂的遠端信號),則麥克風110也拾取該遠端信號。換言之,基於揚聲器100的發射,該遠端信號經由直接和間接或反射路徑或傳輸路徑150、160到達麥克風110。因此,麥克風110不僅拾取電信系統的近端的本地話音,也拾取回音,然後將回音回饋給遠端用戶。
為了控制這一問題,電信系統通常包括回聲抵消處理電路或回聲抑制處理電路,以下也總稱為回聲去除處理電路或回聲去除處理單元170,如同樣在第一圖中示出的,向回聲去除處理單元170提供了麥克風信號y[n]和揚聲器信號x[n]。然後,回聲去除處理單元170輸出回聲去除的或回聲部分去除的或回聲部分抵消的信號e[n]。
第一圖示出了該聲學回聲去除問題的基本構成。將揚聲器信號x回饋入麥克風信號y。回聲去除過程去除該回聲,同時理想地允許在通信系統的本端產生的本地話音通過。
處理這些回聲的一種傳統方法是將聲學回聲抵消器(AEC)與回聲信號的傳播路徑150、160並行放置,參考文獻[1]中也描述了該方法。在聲學回聲去除器中,對回聲信號的數位副本進行估計,然後從測量的麥克風信號中減去該副本。用於聲學回聲抵消的標準方法依賴於以下假設:可以使用線性FIR(有限沖激回應)濾波器來對回聲路徑(傳輸路徑150、160的整體系統)進行建模,以便相應地實現聲學回聲抵消,這也在[1]中進行了描述。FIR濾波器也被稱為具有有限長度的沖激回應的濾波器。
這裏,由多個參數給出回聲路徑,包括揚聲器100的特性、麥克風110的特性和聲學環境120的特性,以及其他物件的屬性和特徵。例如,特別考慮由日照或其他熱源(僅列出一些可能的偏差源)導致的空氣的溫度變化和溫度梯度。
由於回聲路徑是未知的,而且在操作期間可變,因此,自適應地實現聲學回聲抵消的線性濾波器是可取的。因此,為了對典型回聲路徑進行建模,通常實現(而且也部分需要)長度高達數百毫秒的FIR濾波器,這意味著較高的計算複雜度。這裏,在濾波器中實現的濾波器係數的數目被稱為FIR濾波器(即具有有限沖激回應的濾波器)的長度。這裏,以及在其他相應參數中,如果以秒、毫秒或其他時間單位來表示實際上表示無量綱數量的相應數或相應值,則其涉及數位信號處理或相應地使用的類比/數位轉換器和數位/類比轉換器中所利用的採樣率(採樣頻率)。
然而,實際上,這些傳統方法可實現的回聲衰減不夠高,這是由於回聲的長迴響時間(回聲拖尾效應)、非線性回聲分量和收斂問題。上述回聲拖尾效應通常由回聲路徑的建模不足(undermodeling)而導致,而非線性回聲分量是由振動效應或低成本或廉價的音頻硬體元件的非線性性態而導致。例如,上述收斂問題出現在高度時變回聲路徑的情況下。在參考文獻[2]中闡述了該情況的細節。
出於這種原因,可能必須將聲學回聲抵消器與非線性後處理器組合,以去除回聲抵消器無法消除的殘留回聲。在參考文獻[3]中可以找到關於這方面的詳細描述。通常,如在參考文獻[4]中所述,以頻率選擇性的方式來執行殘留回聲的抑制。確實,幾乎所有的聲學回聲抵消器使用這樣的後處理器,這是由於它們通過不能充分減少回聲以使其變為不可聽見。
近來,提出了多種在子帶範圍中操作的聲學回聲抑制器,如參考文獻[5]和[6]所述,這些抑制器與上述非線性後處理器類似,但不需要聲學回聲抵消器,且不需要估計回聲路徑的沖激回應。據稱,這些系統具有低計算複雜度並且是魯棒的,同時能夠實現高度的雙工性。
參考文獻[6]中提出的回聲抑制方案應用短時傅立葉變換(STFT)來計算揚聲器和麥克風信號的頻譜。選擇通過STFT來變換的揚聲器信號的結果之間的延遲或延遲值d,以便考慮大多數回聲沖激回應。然後,對用於模仿回聲路徑的部分的效應的實數值回聲估計濾波器進行估計。為了獲得回聲幅度譜的估計,對揚聲器信號頻譜應用估計的延遲值和回聲估計濾波器。使用回聲幅度譜的估計,計算實數值回聲抑制濾波器,並將其應用至麥克風信號頻譜以抑制回聲。
然而,上述聲學回聲抑制(AES)系統的缺點在於,其不能以令人滿意的方式來處理麥克風信號中的靜態雜訊。如隨後的解釋將要示出的,靜態雜訊產生回聲估計中的成分(偏置),如果所關心的信號的信噪比不是非常高,則該成分(偏置)將使這種系統的性能退化。根據該實現方式或模型,該成分也被稱為對期望估計的偏差、零點偏移或系統性估計偏差。
第二圖示出了用於計算聲學抑制濾波器210的控制資訊的裝置200的電路框圖,在第二圖中以虛線將濾波器210表示為可選組件。這裏,裝置200包括計算裝置220,計算裝置220繼而包括值確定裝置230,其輸入耦合至裝置200的輸入240。均值確定裝置250一方面耦合至值確定裝置230的輸出,值確定裝置230的輸出以與該耦合並行的方式耦合至修正裝置260的第一輸入。均值確定裝置250的輸出耦合至修正裝置260的第二輸入。修正裝置260經由其輸出耦合至控制資訊計算裝置270的輸入,控制資訊計算裝置270在其輸出處輸出並提供聲學抑制濾波器210的控制資訊,其輸出同時也是裝置200的輸出。
至此,聲學抑制濾波器210包括用於控制資訊的輸入。根據其中實現裝置200和聲學抑制濾波器210的系統的具體實現方式,在輸入240處提供的信號也可以在輸入側被提供給抑制濾波器210。然而,此外,附加地或備選地,也可以在可選輸入280處向其提供另外的信號。對按照這種方式提供給聲學抑制濾波器210的一個或兩個信號(考慮提供給抑制濾波器210的控制資訊)進行濾波,並在輸出290將其輸出。
關於用於計算聲學抑制濾波器210的控制資訊的裝置200的功能,在輸入240向其提供至少一個信號,該信號可以是上述揚聲器信號、上述麥克風信號或從其一或兩者導出的信號。如以下仍要更詳細解釋的,當然也可以向裝置200提供多於一個的信號。
這裏,提供給裝置200的信號包括在時間上連續的資料塊(也被稱為幀)。在本發明的實施例中,下游裝置和單元每個對一個或更多資料塊進行操作,其中,在對若干資料塊進行操作的情況下,對於資料塊的時間序列而言,附加地考慮過去的資料塊。這反映了根據本發明的實施例的裝置200的一種典型應用場景,裝置200通常用於允許或實現即時的相應的回聲抑制。
如果在輸入240處向裝置200提供相應信號,則至少一個相應資料塊到達值確定裝置230,值確定裝置230繼而計算至少一個帶通信號的與能量相關的值。這裏,帶通信號是與頻率相關的信號,例如由解析傅立葉濾波器組、子帶解析濾波器組或也可以由QMF解析濾波器組來提供。
這裏,特徵頻率與每個帶通信號相關聯,該特徵頻率表示較低的起始頻率、較高的終止頻率、中心頻率或其他典型頻率。例如,如果帶通信號是傅立葉解析濾波器組的頻譜值,則所關心的頻譜值下的頻率可以被認為是特徵頻率。在包括更大頻率範圍的頻率部分的子帶或QMF信號的情況下,特徵頻率可以是上述典型頻率之一。
根據本發明的實施例的裝置200的具體實現方式,值確定裝置230也可以基於由時間索引唯一可標識的相同資料塊,輸出多於一個帶通信號的多於一個的與能量相關的值。因此,例如,可以為多個或所有子帶信號確定對應的與能量相關的值。
例如,與能量相關的值可以是所關心的帶通信號的能量值或與其成比例的值。類似地,如果作為底的值是實數值,則與能量相關的值可以是與所關心的帶通信號的值的正整數指數次冪成比例的值。可選地或附加地,與能量相關的值可以與所關心的帶通信號的幅度(絕對值)的正實數指數次冪成比例。例如,這樣也允許使用複數值作為底。
現在,將針對至少一個帶通信號所確定的與能量相關的值提供給均值確定裝置250,均值確定裝置250被形成為確定至少一個相應均值。在向均值確定裝置250提供每資料塊多於一個與能量相關的值的本發明的實施例中,可以僅對多個所關心的值確定這樣的均值,或對每個所關心的值確定這樣的均值。
如在其他過程中將要解釋的,這裏,可以基於滑動平均來執行均值確定,例如,除當前資料塊之外,所述滑動平均還基於時間上在前的資料塊或多個資料塊。例如,這可以通過分別考慮不同資料塊的各自的值來執行,或以遞迴計算的形式來執行。在其他過程中仍將解釋具體實現。
現在,將值確定裝置230的至少一個與能量相關的值和均值確定裝置250的至少一個均值提供給修正裝置260,修正裝置260基於為所關心的帶通信號確定的均值來修正與能量相關的值。在本發明的不同實施例中,例如,可以通過簡單的減法、通過簡單的除法或基於減法或除法的更複雜的數學運算來進行該修正。
因此,修正裝置260產生一個或更多修正後的與能量相關的值,基於此,下游的控制資訊計算裝置270現在計算聲學抑制濾波器210的控制資訊。
根據在裝置200的輸入240處所提供的信號,經由可選的另外的輸入280向聲學抑制濾波器210提供相同的信號或提供其他信號是可取的。例如,如果在輸入240處提供的信號是麥克風信號,則可以省略聲學抑制濾波器210的另外的輸入280的實現。然而,如果在輸入240處提供的信號是揚聲器信號,則實現另外的輸入280並向其提供麥克風信號確實是可取的。
上述進一步描述的傳統聲學回聲抑制系統的缺點在於,它們不能很好地處理麥克風信號中的靜態雜訊。通過實現本發明的實施例,可以至少部分地、也可能完全改進與上述缺點相關的音頻品質方面的缺點。如在其他過程中還要示出的,靜態或准靜態雜訊導致關於回聲估計的系統性估計偏差,在信噪比(SNR)不是非常高的場景中,這將使這些系統的性能惡化。
本發明的實施例確實開創了一種新技術,以解決並至少部分消除相應的聲學回聲抑制系統的上述缺點。第二圖所示的本發明的實施例尤其允許基本實現用於估計回聲估計濾波器的技術,其中減輕了由於雜訊的存在而導致的系統性估計偏差的問題。
因此,本發明的實施例涉及回聲估計濾波器的計算。這是基於從揚聲器頻譜的時間波動開始對麥克風頻譜的時間波動的估計。因此,本發明的實施例允許對回聲估計濾波器的更正確的估計,而不會由麥克風聲道中可能的加性雜訊引入系統性估計偏差。因此,本發明的實施例允許基於頻譜成分的波動來實現回聲估計濾波器。
在本說明書的其他過程中對本發明的另外的實施例進行更詳細的解釋並更詳細地討論其功能之前,要指出的是,假定互相耦合的兩個元件是指直接連接或經由相應的連接裝置、信號路徑或其他通信方法來間接連接的元件。因此,上述裝置230、250、260和270都被實現在計算裝置220的框架內。
這裏,單獨的裝置不必須由分離的電路模組來實現。因此,確實可能出現以下情況:計算裝置220中屬於多於一個的上述裝置的電路元件部分或完全重疊。例如,如果計算裝置220是處理器,則在不同裝置中可以至少部分地使用相同的電路。因此,例如,值確定裝置230以及修正裝置260中可以採用ALU(算術邏輯單元)的相同部分。在這種情況下,例如,可以經由記憶體中的儲存位置來實現相應裝置230、260的耦合。
此處也要指出,以下使用相似或相同的參考標號來表示功能相同或功能相似的裝置、單元和物件。相同、相似、功能相同或功能相似的裝置、物件和單元也使用相同或相似的參考標號。出於這種原因,說明書中涉及使用相同或相似參考標號來表示物件、裝置和單元的段落可以在本發明的各個實施例之間轉移,這允許在不使用不必要的重複的情況下,能夠更準確清楚地示意各種實施例。
在本說明書的其他過程中使用的概括性的參考標號也算作類似的參考標號。如果裝置、物件和元件在一幅圖中出現多次,或在本發明的一個實施例中出現多次,或在其他環境下出現多次,則將使用單獨的參考標號來表示單獨的物件、裝置和元件,而在對所有相應裝置、物件和單元的總體特徵和屬性進行描述、陳述或討論時,將使用伴隨的概括性參考標號。因此,例如,概括性參考標號160用於兩個間接交疊路徑160-1和160-2。在許多其他情況下,除非從相應裝置、物件和元件的描述中能夠得到任何相反的內容,否則概括性參考標號的使用指示了所表示的相應裝置、元件和單元包括相同或相似的功能或結構特徵的事實。
回聲抑制系統的關鍵部分是回聲信號的幅度或功率譜的正確估計,以使得可以計算有效的回聲抑制濾波器。在參考文獻[6]中,在回聲估計濾波器的幫助下,通過對正確延遲後的揚聲器幅度譜進行濾波來估計回聲幅度譜。
然而,首先說明,只要麥克風信號中存在雜訊,參考文獻[6]中的回聲估計濾波器的計算將導致系統性估計偏差。然後,提出了一種方法來計算回聲估計濾波器,即使在信號中存在雜訊的情況下,該方法也(幾乎)總是不產生系統性估計偏差。如第三圖所示,通過基於信號頻譜的波動來估計回聲估計濾波器,能夠解決系統性估計偏差的問題。
第三圖示出了裝置200的簡化電路框圖,裝置200用於計算聲學抑制濾波器以及未直接在第三圖中實現而作為更大電路的一部分的相應聲學抑制濾波器的控制資訊。第三圖所示的電路框圖是其中未示出所有元件的簡化圖。基於第三圖,僅解釋根據本發明實施例的裝置和/或根據本發明實施例的相應聲學抑制濾波器的基本功能。
因此,第三圖再次示出了重現揚聲器信號x[n]的揚聲器100。將該揚聲器信號提供給單元300。此外,第三圖也示出了向單元300提供麥克風信號y[n]的麥克風110。
相對於第二圖所示的實施例中包括值確定裝置230和均值確定裝置250,第三圖所示的單元300略有不同。因此,第三圖中的單元300包括針對時間波動的兩個估計裝置310-1和310-2,在第三圖中也表示為ETF(時間波動的估計)。這裏,估計裝置310-1的輸入側耦合到揚聲器100,而估計裝置310-2的輸入側耦合到麥克風110。
這裏,兩個估計裝置310至少對揚聲器信號和麥克風信號中包括的帶通信號執行如結合第二圖所描述的值確定裝置230和均值確定裝置250的功能特徵和屬性。因此,第三圖所示的裝置200的實施例表示的實施例中,不僅處理信號組中的單個信號,而且至少處理兩個信號,即揚聲器信號和麥克風信號。因此,在第三圖所示的實施例中,兩個估計裝置310確定相應帶通信號的兩個信號的與能量相關的值以及伴隨的均值。
兩個估計裝置310中每一個的輸出耦合至回聲估計濾波器320的相應輸入,回聲估計濾波器320包括與第二圖所示的實施例的描述相關的修正裝置260和控制資訊計算裝置270。相應地,回聲估計濾波器320基於兩個信號x[n]、y[n]的與能量相關的值以及伴隨的均值來執行結合第二圖所描述的兩個裝置260和270的功能。
第三圖中的裝置200還包括回聲抑制處理單元或回聲抑制處理電路325(ERP=回聲去除處理),在第三圖中也將其稱為回聲抑制,其包括第二圖中的聲學抑制濾波器210的功能。因此,回聲估計濾波器320也包括相應的控制資訊輸入,向該輸入提供由回聲估計濾波器320提供的控制資訊。
如同聲學抑制濾波器一樣,回聲抑制處理單元325也接著基於向其提供的信號來產生聲學信號e[n],該聲學信號e[n]基於麥克風信號y[n]並關於揚聲器100產生的回聲進行了至少部分校正。這一步驟通常也被稱為頻譜修正,這是聲學抑制濾波器210(第三圖中未示出)和回聲抑制處理單元325兩者被稱為頻譜修正的原因,因為其至少在本發明的一些實施例中在基於頻率的域中操作。具體地,關於回聲抑制處理單元325,額外參考對第七圖的描述。
因此,第三圖示出了回聲估計濾波器的所提出的估計的電路框圖,其中第三圖中所使用的縮寫ETF和EEF分別代表時間波動的估計和回聲估計濾波器。
為了更好地理解本發明的實施例的功能,現在參照附圖,基於信號模型來對其他功能進行更詳細的描述。以下,這裏假定可以將第一圖中的聲學環境中的聲學回聲路徑cn- 表示為直接傳輸路徑或直接傳播路徑與線性濾波器gn 的影響的組合。這裏,直接傳播路徑與揚聲器信號和麥克風信號的v個樣本延遲值的延遲相對應。這裏,線性濾波器gn 對環境的聲學屬性進行建模。因此,獲得了:
cn =gn *δ[n-v], (1)
其中δ[n]表示單位沖激,*表示(數學)迴旋。假定只有遠端說話者是活動的,麥克風信號y[n]的時域模型由以下給出:
y[n]=gn *x[n-v]+w[n], (2)
其中n還是表示與離散時間過程的採樣值相關的時間索引的整數。因此,等式(1)和(2)中出現的變數n是時域中的索引。
在等式(2)中,這裏,運算式gn *x[n-v]表示由麥克風拾取的經過延遲和濾波後的揚聲器信號。這裏,成分W[n]表示記錄區中存在的靜態背景雜訊。通過對等式(2)的兩端進行相應的時頻變換,即例如短時傅立葉變換(STFT),獲得了:
Y[k,m]=G[k,m]Xd [k,m]+W[k,m], (3)
其中k是整數並以資料塊編號(幀編號)的形式來表示資料塊,其中,m是頻率索引,即也是整數。這裏,根據
Xd [k,m]:=X[k-d,m], (4)
頻域或STFT域中相應延遲的揚聲器信號為x[n-v],其中這裏假定在當前情況下v是資料塊偏移(幀偏移或樣本提前值)K的整數倍。換言之,這裏假定適用以下等式:
v=dK (5)
其中v、d和K是對應的整數。這裏,等式(5)僅表示一種允許在標記上略微簡化的假定,而並不表示後續等式或其技術實現的有效性的嚴格先決條件。在本說明書的其他過程中,如果提及信號的延遲或數值的頻率,無需嚴格考慮等式(5)。
再換言之,在本發明的一些實施例中,將連續的、採樣的聲學資料流程劃分為時域中長度為K的資料塊。當然,在其他實施例中,資料塊也可以包括比所關心的資料流程被偏移的值更多數目的值。例如,這可以通過交疊來實現。
此外,使用等式(3)中的表示G[k,m]作為濾波器gn 和/或其沖激回應的伴隨表示。相應地,W[k,m]表示靜態背景雜訊w[n]在頻域中的表示。實際上,可以合理假定x[n]與w[n]不相關,使得根據等式(3),有:
其中E{}表示數學期望值或均值(例如算術均值)。作為等式(6)的一種暫態近似,可以以功率譜|Y[k,m]|2 的形式將其寫為:
基於這種信號建模,結合第四圖和第五圖,以用於計算聲學抑制濾波器210的控制資訊的裝置200的形式來描述本發明的其他實施例。這裏,第四圖和第五圖示出了電路框圖,其中第五圖示出了可以在第四圖所示的實施例中使用的延遲計算裝置的電路框圖。
第四圖示出了用於計算聲學抑制濾波器210的控制資訊的裝置200的電路框圖。這裏,將裝置200和聲學抑制濾波器210均實現為計算裝置220的一部分,計算裝置220可以是處理器或CPU(中央處理單元)。
這裏,裝置200包括第一輸入240-1和第二輸入240-2,其中提供第一輸入240-1和第二輸入240-2分別用於時域中的揚聲器信號和時域中的麥克風信號。時間/頻率變換裝置330-1耦合至第一輸入240-1,時間/頻率變換裝置330-1可以是例如:短時傅立葉解析濾波器組、傅立葉解析濾波器組、子帶解析濾波器組或也可以是QMF解析濾波器組。延遲裝置340耦合在時間/頻率變換裝置330-1的輸出處,延遲裝置340被形成用於以延遲的方式來轉發從時間/頻率變換裝置330-1提供的信號。
在第四圖所示的實施例中,延遲裝置340的輸出側耦合至值確定裝置230,值確定裝置230包括用於揚聲器信號的第一值確定子裝置230a。然後,值確定裝置230耦合至均值確定裝置250,均值確定裝置250繼而包括均值確定子裝置250a,均值確定子裝置250a耦合至延遲裝置240的輸出和值確定子裝置230a的輸出。均值確定裝置250以及均值確定子裝置250a在其輸出耦合至修正裝置260的修正子裝置260a的輸入。這裏,修正子裝置260a經由另外的輸入耦合至值確定子裝置230a的輸出,使得除了確定的均值之外,原始值也對修正子裝置260a可用。
除了該用於揚聲器信號的第一路徑之外,裝置200還包括第二路徑,該第二路徑耦合至用於麥克風信號的第二輸入240-2。更具體地,這裏,第二時間/頻率變換裝置330-2的輸入側耦合至第二輸入240-2。然後,其輸出側耦合至第二值確定子裝置230b,第二值確定子裝置230b也被實現為值確定裝置230的一部分。均值確定裝置250還包括用於麥克風信號的均值確定子裝置250b,均值確定子裝置250b的輸入側耦合至時間/頻率變換裝置330-2的輸出和第二值確定子裝置230b的輸出。如同均值確定子裝置250a一樣,均值確定子裝置250b耦合至修正裝置260的輸入。這裏,均值確定子裝置250b耦合至第二修正子裝置260b,第二修正子裝置260b也是修正裝置260的一部分。這裏,修正子裝置260b經由另外的輸入耦合至值確定子裝置230b的輸出,使得除了確定的均值之外,原始值也對修正子裝置260b可用。
在第四圖所示的實施例中,通過其兩個修正子裝置260a、260b,修正裝置260本身耦合至控制資訊計算裝置270的輸入,控制資訊計算裝置270包括串聯連接的用於實際控制資訊的估計裝置350和計算裝置360。在第四圖所示的裝置200的實施例中,計算裝置360還耦合至值確定子裝置230b和延遲裝置340的輸出。
向聲學抑制濾波器210提供從計算裝置360提供的控制信號以及在第二時間/頻率變換裝置330-2中被變換至頻域或與頻率相近的域的麥克風信號,該控制信號包括控制資訊,基於這些信號,聲學抑制濾波器210產生頻域或與頻率相近的域中的回聲抑制後的信號,並對該信號執行頻譜修正。然後,將頻域或與頻率相近的域中的修正的信號發送至頻率/時間變換裝置370,頻率/時間變換裝置370執行向時域的反變換。頻率/時間變換裝置370的輸出側耦合至裝置200的輸出290,在輸出290處,在時域中提供回聲抑制或回聲減小後的麥克風信號--與第二圖所示的實施例不同。
此外,第四圖所示的裝置200的實施例還包括延遲值計算裝置380,其輸出耦合至延遲裝置340的輸入(控制輸入),延遲值計算裝置380經由該輸出將當前延遲值或延遲值的當前校正值發送至延遲裝置340。這裏,延遲值計算裝置380耦合至用於揚聲器信號和麥克風信號的路徑中的每個路徑。
根據具體實現方式,可以在不同位置執行這種與兩個路徑的耦合,這兩個路徑僅在修正裝置260之後會合。因此,例如,延遲值計算裝置380可以耦合至第一時間/頻率變換裝置330-1的輸出、延遲裝置340的輸出或修正裝置260中的第一修正子裝置260a的輸出。此外,對於麥克風信號路徑,延遲值計算裝置380可以耦合至第二時間/頻率變換裝置330-2的輸出或修正裝置260中的第二修正子裝置260b的輸出。
第五圖示出了例如可以在第四圖中採用的延遲值計算裝置380的電路框圖。這裏,延遲值計算裝置380包括第一輸入390-1和第二輸入390-2,其中之一耦合至第四圖所示的實施例中的揚聲器信號路徑,而其中另一個耦合至麥克風信號路徑。因此,例如,對於揚聲器信號路徑,第一輸入390-1可以耦合至延遲裝置340的輸出,而第二輸入390-2耦合至第二時間/頻率變換裝置330-2的輸出。
延遲值計算裝置380包括耦合至兩個輸入390的相干函數計算裝置400。相干函數計算裝置400被形成為基於在兩個輸入390處輸入的信號來計算相應的相干函數。相干函數計算裝置400的輸出側耦合至下游的回聲預測增益計算裝置410,回聲預測增益計算裝置410被形成為計算相應的回聲預測增益並將其輸出至優化裝置420。然後,該優化裝置420耦合至延遲值計算裝置380的輸出430,該輸出430本身耦合至第一圖中的延遲裝置340的輸入,用於相應的延遲值。
因此,在第四圖和第五圖中所示的裝置的幫助下,可以根據以下等式,針對揚聲器和麥克風功率譜,使用相干函數(例如平方相干函數)來計算或確定延遲值d:
其中,等式(8)中出現的期望值E{}也可以被實現為均值。在第四圖和第五圖所示的實施例中,使用延遲值計算裝置380的相干函數計算裝置400來執行該計算。
基本地,可以針對每個頻帶和/或每個帶通信號來計算延遲值d,其中帶通信號是由整數索引m來確定的。然而,在第四圖和第五圖所描述的實施例中,僅考慮使用單個延遲值用於所有頻率和/或所有帶通信號。出於這種原因,在回聲預測增益計算裝置410中,根據以下等式來計算所謂的回聲預測增益ω[k]作為相干函數Γd [k,m]在各頻率上的均值:
其中M是指示頻帶和/或帶通信號的數目的整數。這裏,各頻帶的索引m的範圍從0至M-1。然後,通過優化裝置420來選擇實際延遲值d,使回聲預測增益最大化。換言之,裝置420根據以下等式來確定延遲值d:
d=argmaxdd [k]}, (10)
其中函數argmaxd {}表示關於參數d來確定精確的最大值。
這裏,如第四圖所示,經由延遲值計算裝置380,將作為當前波形的函數的當前延遲值d發送給延遲裝置340。更具體地,這裏描述的延遲值計算裝置380的連接是一種回饋電路,其中由於在相干函數的計算中已經考慮了延遲的信號,因此對延遲裝置340可用的信號傾向於表示對延遲值d的校正信號。基本地,因此也可以使用Δd來表示根據等式(10)來計算的延遲值,Δd表示與先前計算的延遲值的偏差。可以通過延遲裝置340來考慮Δd,以獲得絕對延遲值d。然而,在基於非延遲的信號來進行計算的情況下,可以直接通過等式(10)來確定相應的延遲值。
關於回聲估計濾波器,以下將示出參考文獻[6]中使用的估計導致被系統性估計偏差所偏移後的估計。在參考文獻[6]中,基於功率譜|Y[k,m]2 和|Xd [k,m]2 ,即基於直接測量和檢測的麥克風和揚聲器的頻譜,直接執行回聲估計濾波器的估計。在能量域中,針對回聲估計濾波器 biased [k,m]獲得了以下等式:
如附錄A所示,由於靜態雜訊W[k,m]的加性部分,等式(11)的使用導致了回聲估計濾波器的被系統性估計偏差所偏移的估計。因此,基於等式(11),在能量域中的回聲估計濾波器產生為:
其中是在具有索引為m的頻帶和資料塊索引或時間索引k中的靜態雜訊w[n]的方差。這裏,從(12)立即得出:在有雜訊的環境中,被系統性估計偏差所偏移的回聲估計濾波器潛在地導致對回聲信號的不可接受的高估計。由於回聲信號的過高估計典型地導致過度強烈的回聲抑制,因此在同時的雙向通信(雙重談話情形)期間,近端話音信號中的干擾將高得不可接受。
在使用本發明的實施例時,如第四圖和第五圖所示,例如,關於揚聲器和麥克風功率譜的時間波動來估計回聲估計濾波器G[k,m]。這裏將功率譜的時間波動確定為“集中的”或平均的版本,即減小--更一般地--考慮相應均值。因此,在修正裝置260中,第二修正裝置260b根據以下等式來計算修正的功率譜作為麥克風信號的修正的與能量相關的值:
相應地,修正裝置260也以第一修正子裝置260a的形式,根據以下等式來計算揚聲器信號的修正的功率譜:
這裏,由均值確定裝置250來形成等式(13)和(14)中的數學期望值E{}。這裏,兩個均值確定子裝置250a和250b可以方便地基於相應的與功率相關的值來使用短時均值替代上述等式中所使用的數學期望值E{}。從以下示例開始:
ΦAB [k,m]=E{A[k,m]‧B[k,m]}, (15)
其中值A[k,m]和B[k,m]可以表示任意值,甚至是相等的值,例如,根據以下等式來執行遞迴平滑,以獲得關於值ΦAB [k,m]的短時均值 AB [k,m]:
這裏,因數αavg 確定了時間上的平滑程度,並可以適於任何給定的要求。
換言之,可以根據以下等式來對任意量A[k,m]來計算時間均值,其中k是時間索引:
E (A [k,m ])=(1-α avg )E (A [k -1,m ])+α avg A [k,m ], (17)
其中,基於當前值A[k,m]和先前計算的均值E(A[k-1,m])來遞迴地計算量E(A[k,m])。這裏,因數αavg 對新值A[k,m]相對於先前計算的均值的附加貢獻進行加權,使用因數(1-αavg )來對先前計算的均值進行加權。
因此,在等式(15)至(17)給出的計算規則的幫助下,可以在均值確定裝置250及其兩個均值確定子裝置250a和250b中,根據對這些裝置可用的相應資料來確定相應的均值。這裏,根據等式(15)至(17)的計算規則的實現方式表示了一種可以即時執行的遞迴的滑動平均。具體地,這裏不用等待“未來”的資料塊。
現在,具有估計裝置350的控制資訊計算裝置270能夠基於從修正裝置260提供的修正的與能量相關的值來計算聲學抑制濾波器210的控制資訊。為此,估計裝置350考慮功率譜的時間波動,首先根據以下等式來計算回聲估計濾波器
更具體地,根據等式(18)來計算相應回聲估計濾波器的幅度頻率過程,其中,也可以通過各種方法來添加和/或估計相關聯的相位資訊。只要有必要,例如可以對所有頻帶、頻率範圍或帶通信號使用恆定相位作為相位資訊,該恆定相位根據相應頻帶的延遲值d來確定,或是根據相應幅度的時間過程或頻譜過程來確定。
通過如等式(18)中所執行的估計,僅使用揚聲器信號和麥克風信號的頻譜動態來估計回聲估計濾波器。如也在附錄B中示意的,根據等式(18)的估計抵消了加性靜態雜訊信號w[n]。如在附錄B中的偏差中所示,使用等式(18)帶來了回聲功率傳遞函數的無偏移估計。更具體地,有:
此外,這裏要指出,作為使用等式(8)的一種替代選擇,也可以基於波動的頻譜,使用根據以下等式的相干函數來執行對延遲值d的估計:
其中以與等式(14)類似的方式定義。然後,基於回聲預測增益
來選擇實際延遲值,使得回聲預測增益最大化。
換言之,延遲值計算裝置380也可以使用除了結合等式(8)和(9)所表示的量之外的量來執行延遲值計算。對於第四圖,這意味著經由可選地繪出的路徑將其他值提供給延遲值計算裝置380,使得這些值在輸入390處可用。控制資訊計算裝置270以基於設計參數β、γ和LH 的濾波器係數H[k,m]的形式(以下將更詳細介紹),使控制資訊對聲學抑制濾波器210可用。
在本發明的實施例中,可以在不同程度上對屬於不同特徵頻率的揚聲器信號的帶通信號或由其導出的信號進行延遲。例如,當不同的傳播路徑具有頻率選擇性衰減時,這種延遲是可取的,使得直接傳播路徑不再提供特定頻率範圍中的最強信號成分。在這種情況下,可以基於相干函數和/或基於通過有限頻帶來進行的對回聲預測增益的計算,直接執行延遲值的確定。
聲學抑制濾波器210根據以下等式,通過使用合適的回聲抑制濾波器來對麥克風信號進行加權,以執行聲學回聲抑制:
E[k,m]=H[k,m]‧Y[k,m]. (22)
這裏,從第二時間/頻率變換裝置330-2的輸出直接向聲學抑制濾波器210提供麥克風頻譜Y[k,m]。這裏,加權因數和/或濾波器因數H[k,m]表示聲學抑制濾波器210從用於控制資訊的計算裝置360獲得的、和/或從控制資訊計算裝置270獲得的控制資訊。
這裏,如參考文獻[7]中所描述的,可以根據頻譜減法方法來計算回聲估計濾波器H[k,m]和/或控制資訊。在這種情況下,控制資訊由以下等式給出:
設計參數β、γ和LH 用於控制回聲抑制濾波器的期望性能。這裏,典型值是β=2,γ=2和LH =-60(與-60dB的最大衰減相對應)。這裏,根據以下等式,使用回聲估計濾波器來獲得回聲的功率譜的估計:
用於控制資訊的計算裝置360也可以執行根據等式(24)的計算。優選地,關於揚聲器信號和麥克風信號的原始頻譜來執行回聲估計和回聲抑制。
第六圖示出了基於本發明的實施例針對1000Hz頻率的數位結果。使用被1/F雜訊(粉紅雜訊)破壞的、信噪比(SNR)為6dB的話音信號來產生仿真。這裏,仿真的第一半專門與活動的遠端說話者所導致的回聲相對應,而仿真的第二半與雙向談話的情形(雙重談話情形)相對應。
第六圖的部分(a)以黑線示出了其上疊加1000Hz頻率的揚聲器信號的短時功率譜430和短時平均頻譜。換言之,第六圖(a)示出了揚聲器信號的短時功率譜430和相應的短時平均頻譜440。
這裏,部分圖示第六圖(b)以虛線示出了真實的回聲估計濾波器,以點線的方式示出了具有系統性估計偏差的估計,並以實線繪出了沒有系統性估計偏差的估計。換言之,第六圖(b)中的部分圖示以虛線示出了真實的回聲估計濾波器G[k,m],以點線示出了根據等式(11)計算的具有系統性估計偏差的估計 biased [k,m],並以實線示出了如在本發明的實施例中和說明書中提出並描述的那樣計算的沒有系統性估計偏差的估計[k ,m ]。
部分圖示第六圖(c)示出了回聲預測增益的時間過程,其中所有的三個部分圖示中的每一個都是基於0秒(0s)至15秒(15s)的時間範圍。如之前所解釋的,僅在從0s至約7.5s的時間範圍中包括來自揚聲器的話音,該話音經由回聲和麥克風被再次拾取,而在第二半,即約7.5s和15s之間的時間區間中,話音被附加地耦合入麥克風。
因此,部分圖示第六圖(c)與回聲預測增益相對應,回聲預測增益將回聲估計濾波器的可靠性度量表示為時間的函數。這些圖示出了在不考慮集中的統計特性的情況下計算的回聲估計濾波器的系統性估計偏差,而當回聲預測增益足夠大時,基於時間波動的回聲估計濾波器與真實的回聲估計濾波器G[k,m]相對應。具體地,這示意出,在考慮均值去除的情況下,與不考慮均值去除的情況相比,回聲估計濾波器與期望的過程具有明顯更好的匹配。具體地,在部分圖示第六圖(b)中的10至15s之間的時間範圍中,在相應的回聲估計濾波器過程方面存在顯著的可識別的差異。
第七圖示出了具有聲學抑制濾波器210的裝置200的另一實施例的簡化電路框圖。第七圖所選擇的圖示附加地示出了基於時間索引n的麥克風信號y[n]和揚聲器信號x[n]的兩個時間過程。與第三圖所示的實施例相比,第七圖示出了根據本發明實施例的聲學回聲抑制演算法的更完整的電路框圖。由於與第三圖所示的實施例的相似性,在此使本實施例描述更加簡短,關於其他細節,參考對第三圖的陳述。
將揚聲器信號x[n]提供給採取短時傅立葉變換(STFT)形式的第一時間/頻率變換裝置330-1。類似地,將麥克風信號y[n]提供給第二時間/頻率變換裝置330-2,裝置330-2也是相應的STFT單元。如這兩個波形的時間波形x[n]和y[n]的比較所示,由於揚聲器信號以時間間隔d領先麥克風信號,因此,第一時間/頻率變換裝置330-1產生揚聲器信號的相應時間延遲的頻譜X[k-d,m]。
也使用兩個大括弧450-1和450-2以及指示時間間隔d的箭頭460來表示第七圖上部中的兩個時間過程。然而,第二時間/頻率變換裝置330-2以未經過時間延遲的形式來提供相應的麥克風信號的頻譜Y[k,m]。相對於第四圖而言,在第七圖所示的實施例中,這意味著延遲裝置340也被集成到第一時間/頻率變換裝置330-1中。
兩個時間/頻率變換裝置330-1繼而耦合至單元300,如在第三圖所示的實施例中已經示出的,單元300包括兩個估計裝置310-1和310-2,在第七圖中,將這兩個估計裝置稱為ETF。這裏,縮寫ETF代表時間波動的估計。因此,估計裝置310包括第四圖中的值確定裝置230和均值確定裝置250的功能。
單元300的輸出側繼而耦合至回聲估計濾波器320,在第七圖中再次將其標記為EEF(回聲估計濾波器)。這裏,回聲估計濾波器320包括修正裝置260的功能和控制資訊計算裝置270中的估計裝置350的功能。回聲估計濾波器320將相應的估計[k,m]移交給回聲抑制處理單元325(ERP=回聲去除處理),回聲抑制處理單元325基於兩個頻譜X[k-d,m]和Y[k,m]以及估計的濾波器[k,m]來執行實際的回聲去除。因此,在其功能方面,回聲抑制處理單元325與用於控制資訊的計算裝置360和實際的聲學抑制濾波器210相對應。
回聲抑制處理單元325的輸出提供了位於頻域中的回聲抑制後的信號,然後由頻率/時間變換單元370(在本情況下是逆短時傅立葉變換(ISTFT))對該信號進行處理,使得在其輸出處輸出回聲減小後的相應時間信號e[n]。
第三圖和第七圖所示的實施例與第四圖和第五圖所示的實施例的比較清楚地示出,在其功能方面,確實可以以不同的方式來實現各個裝置和模組。因此,可以使用相應的數學轉換將各個步驟重新組合。因此,例如,可以以與上述在回聲抑制處理單元325中所描述的不同的方式來概括等式(22)至(24)的實現。因此,例如,可以在一個計算過程中,或者也可以在若干以不同方式進行子劃分的計算中,執行相應計算。
第八圖示出了根據本發明的另一實施例,該實施例採取用於計算聲學抑制濾波器210的控制資訊的裝置200的形式,其中裝置200中也包括聲學抑制濾波器210。這裏,第八圖所示的實施例強調:也可以以其他聲學回聲抑制方法來實現和實施本發明的實施例。在第九圖中描述了另一實施例,該實施例示出了關於聲學回聲抑制方法的嵌入的第二種不同方法。
這裏,第八圖示出了根據本發明實施例的聲學回聲抑制方法的框圖,其中,對輸入信號頻譜X[k,m]應用回聲估計濾波器[k,m]。
裝置200包括揚聲器100和麥克風110。將揚聲器信號x[n]提供給採取離散傅立葉變換解析濾波器組(DFT=離散傅立葉變換)形式的時間/頻率變換裝置330-1,時間/頻率變換裝置330-1將該信號變換至頻域。時間/頻率變換裝置330-1在其輸出處輸出頻譜X[k,m],該頻譜一方面被提供給延遲裝置340,另一方面被提供給值確定裝置230的第一值確定子裝置230a。這裏,頻譜X[k,m]可以是實數值的,或者也可以是複數值的。
相應地,將麥克風110的麥克風信號y[n]提供給第二時間/頻率變換裝置330-2,第二時間/頻率變換裝置330-2在其輸出處輸出相應的實數值或複數值頻譜Y[k,m]。該頻譜一方面被提供給值確定裝置230的第二值確定子裝置230b,另一方面被直接提供給聲學抑制濾波器210作為輸入信號。
這裏,根據本發明的實施例,兩個值確定子裝置230a、230b被形成為產生相應頻譜的幅度平方,並將其提供給執行濾波器的估計和延遲值的估計d(k,m)的單元470。因此,單元470部分承擔了均值確定裝置250、修正裝置260和延遲值計算裝置380的功能。因此,單元470的相應電路和元件中至少部分包括這些裝置。出於這種原因,單元470耦合至延遲裝置340的輸入,以向延遲裝置340提供當前延遲值d(k,m)(=d)。例如,可以根據等式(18)來實現濾波器的確定。
延遲裝置340根據向其提供的頻譜X[k,m]來產生延遲版本X[k-d(k,m)m]。然後,使該延遲的揚聲器頻譜對於耦合至延遲裝置340的回聲估計濾波器480可用。
此外,回聲估計濾波器480也耦合至單元470,經由該單元來以相關聯的濾波器係數的形式獲得實際的回聲估計濾波器。因此,回聲估計濾波器480執行第八圖所示的實施例中的等式(24)的功能,並因此被認為是控制資訊計算裝置270的一部分。
可以根據頻譜、時間或其組合來估計回聲估計濾波器的相位位置。此外,當然,也存在以其他方式來確定相位位置的可能性,例如通過將固定相位位置與每個係數相關聯。例如,0°的相位可以與係數中的每個單個係數相關聯。
回聲估計濾波器480對輸入信號進行濾波,以便在其輸出提供信號,該信號經由另一值確定裝置230’的另一值確定子裝置230c對用於控制資訊的計算裝置360可用。類似地,第二時間/頻率變換裝置330-2輸出的麥克風頻譜Y[k,m]也被提供給值確定裝置230’的第四值確定子裝置230d,第四值確定子裝置230d的輸出繼而也耦合至用於控制資訊的計算裝置360。繼而,兩個值確定子裝置230c和230d被形成為計算其可用的頻譜的幅度平方。這裏,在功能上,可以認為該另一值確定裝置230’是第八圖中未示出的控制資訊計算裝置270的一部分。
這裏,用於控制資訊的計算裝置360再次被形成為計算回聲抑制係數H[k,m],並使其經由相應的控制輸入對聲學抑制濾波器210可用。
如之前已經解釋的,由於第二時間/頻率變換裝置330-2的輸出也耦合至聲學抑制濾波器210的輸入,因此,它能夠計算回聲抑制後的頻譜E[k,m],並使其對採取逆離散傅立葉變換濾波器組形式的下游頻率/時間變換裝置370可用。該頻率/時間變換裝置(也被稱為合成濾波器組)在其輸出處提供回聲抑制後的時間信號e[n]。
因此,第八圖中所示的實施例允許基於揚聲器頻譜的回聲估計。如第八圖所示,對揚聲器頻譜X[k,m]應用延遲和/或延遲值d[k,m]以及回聲估計濾波器,以獲得回聲頻譜的估計。然後,基於所估計的頻譜的頻譜功率或幅度和麥克風信號的功率譜或幅度譜Y[k,m]來計算回聲抑制濾波器H[k,m]。
這裏要指出,在關於關鍵頻帶來確定回聲估計濾波器的情況下,如將在其他過程中進行解釋的,可以執行相應的插值,以獲得位於STFT域中的回聲估計濾波器的版本。
第九圖示出了採取聲學抑制濾波器210與裝置200在一起的形式的本發明的另一實施例,聲學抑制濾波器210也在裝置200中實現。與第八圖所示的實施例相反,第九圖所示的實施例是基於聲學回聲抑制的方法,其中,對輸入信號的功率譜|X[k,m]|2 應用回聲估計濾波器
此外,第九圖和第八圖所示的實施例在其結構特徵方面有所不同,但僅在非常小的程度上不同。更具體地,它們在值確定子裝置230a和230c的佈置方面有很大不同。為了簡化說明,在第九圖中未示出值確定裝置230、230’。
更具體地,現在,值確定子裝置230a直接連接在第一時間/頻率變換裝置330-1的下游,使得不僅將揚聲器信號的功率譜X[k,m]已經提供給單元470,而且還將其提供給延遲裝置340。相應地,延遲裝置340也產生該功率譜的延遲形式,回聲估計濾波器480根據等式(24)產生相應的幅度頻率過程,然後將其直接提供給用於控制資訊的計算裝置360而無需額外的值確定子裝置230c。換言之,通過將值確定子裝置230a移動至延遲裝置340的上游,可以省略第三值確定子裝置230c的實現。類似地,這裏可以省去回聲估計濾波器的相位或相位位置的目標定義或確定。
然而,此外,第八圖和第九圖所示的本發明的兩個實施例彼此沒有明顯區別。僅在一些功能特徵和一些計算規則上可能存在由於各個裝置的其他提供的信號和資訊而導致的偏差。
因此,第九圖示出了基於揚聲器功率譜或揚聲器幅度譜的回聲估計。這表示了一種可選方法,其中對揚聲器信號的功率譜或幅度譜|X[k,m]|2 應用延遲值d(k,m)和回聲估計濾波器,以獲得回聲信號的功率譜或幅度譜的估計
與結合第八圖所討論的方法相比,回聲抑制濾波器H[k,m]還是基於所估計的回聲幅度的功率譜或幅度譜和麥克風信號的功率譜或幅度譜|Y[k,m]|2 來計算的。
在第八圖和第九圖所示的實施例中,在時間以及當前頻率方面,延遲值d(k,m)可以變化。當然,可以將延遲裝置340中使用的延遲值選擇為針對各個帶通信號和/或頻率範圍是相同的。
第十圖示出了本發明的另一實施例,該實施例在其結構方面與第二圖所示的實施例類似。然而,第十圖和第二圖中所示的實施例的區別在於,第十圖中所示的實施例是用於多聲道變型的裝置200。從結構上說,第二圖和第十圖所示的實施例僅有略微差別,這是再次參考第二圖的描述的原因。
然而,與第二圖所示的裝置200的實施例相反,第十圖所示的實施例200包括多個輸入240-1、240-2……,如先前定義的,該多個輸入允許向裝置200提供信號組中的多個相應輸入信號。因此,多個輸入中的輸入240-1、240-2……耦合至組合裝置490,組合裝置490根據在輸入240處輸入的信號來產生單個組合信號,然後使該單個組合信號對裝置200的其他元件可用。更具體地,再次使組合裝置490的該組合信號對值確定裝置230、均值確定裝置250、修正裝置260和控制資訊計算裝置270可用,如上所述,控制資訊計算裝置270繼而提供相應的控制資訊。
第十圖所示的實施例與第二圖所示實施例的另外的區別還在於,聲學抑制濾波器210現在包括子濾波器210-1、210-2……,根據相應實施例的具體實現方式,也可以向這些子濾波器提供在裝置200的輸入240處提供的輸入信號,或也可以向這些子濾波器提供經由可選的附加輸入280-1、280-2……提供給裝置200的其他信號。換言之,根據具體實現方式,可以向聲學抑制濾波器210中的每個單個子濾波器210-1、210-2提供在輸入240-1、240-2……處可用的信號或可選的其他信號。這樣的信號可以經由相應的可選輸入280-1、280-2……提供給濾波器210-1、210-2。
然而,並行地使控制資訊計算裝置270的控制資訊對聲學抑制濾波器210中的所有子濾波器210-1、210-2……可用。因此,所有子濾波器210都相應地耦合至控制資訊計算裝置270的輸出。各個子濾波器210-1、210-2……在相應輸出290-1、290-2……處提供回聲減小後的輸出信號,該信號耦合至所述相應輸出。
儘管之前僅針對單聲道的情況討論了本發明的實施例,在單聲道情況下,僅有一個揚聲器信號和一個麥克風信號可用,但是現在考慮多聲道的情況。如在以下仍要描述的,本發明的實施例不侷限於單聲道情況,而是也可以類似地適用於聲學多聲道回聲抑制系統。
令X1 [k,m]表示第1個揚聲器信號的STFT域表示,首先,由組合裝置490根據以下等式來對各個揚聲器信號的頻譜進行組合,從而計算所有揚聲器聲道的聯合功率譜:
這裏,L表示揚聲器聲道的數目,1是聲道索引,其範圍從0至L-1。然而,這是一個非負整數。
類似地,根據以下等式來計算麥克風聲道的聯合功率譜:
其中Yp [k,m]表示第p個麥克風的信號,P是自然數,表示麥克風的數目。索引p表示各個麥克風信號,其範圍從0至P-1。因此,與先前描述的索引m類似,索引1和p中的每一個分別在0至L-1、P-1和M-1的值範圍內。
例如,可以通過相應的組合裝置,也可以使用其他計算或確定規則來實現等式(25)和(26)中包含的組合。例如,如果在等式(25)和(26)中分別存在除以參數L和P的除法,則這是算術平均。出於這種原因,在部分情況下,組合裝置也可以被稱為平均裝置。
與等式(7)類似,針對回聲的功率譜的期望模型由以下給出:
其中,在多聲道情況下,功率譜|X[k,m]|2 和|Y[k,m]|2 由等式(25)和(26)給出。當然,如上所述,這裏也產生在時間上相應延遲的信號。
如上所述,為了確定回聲估計濾波器|G[k,m]|2 ,使用相應方法,然而,在該相應的方法中,如以上所定義的來使用聯合的揚聲器功率譜和聯合的麥克風功率譜。這對於延遲值d的估計也一樣,針對每個揚聲器聲道的聯合功率譜來計算延遲值d的估計。
然後,對每個麥克風信號,獨立地執行實際的回聲抑制,但是對每個麥克風聲道使用相同的回聲抑制濾波器。因此,適用:
E p [k ,m ]=H [k ,m ]‧Y p [k ,m ] (28)
其中p=0,1,...,P-1。相應地,如結合第十圖所描述的,首先針對每個麥克風信號,在頻域中確定相應的回聲減小後的信號Ep [k,m],然後將該信號變換至時域。
當然,在第十圖所示的實施例中,可以使用在輸入240處提供的和在輸入280處提供的不同數目的信號。除非期望進行聲道的平行計算和其他處理,其意義僅在於為要處理的每個信號實現相應的獨立的聲學抑制子濾波器210。
當然,也可以對本發明的實施例進行組合,使得僅將一個麥克風信號與多個揚聲器信號組合,因此,僅對揚聲器信號來實現附加元件。類似地,也可以利用一個揚聲器信號對多個麥克風信號的實現方式。例如在車輛免提電話系統中可能遇到第一種情形,在該情形中經由車輛的HiFi系統輸出另一端的話音,而在具有單個中心揚聲器和每方一個麥克風的會議系統的情況下可能出現第二種場景。當然,這裏,揚聲器信號和麥克風信號的數目可以彼此相同或不同。
在結合第十二圖和第十三圖來解釋本發明的各個實施例的頻率解析度並討論替代選擇之前,首先結合第十一圖來描述濾波器500的實施例,第十一圖也示出了各個裝置也能夠在其電路和處理實現方面進行靈活適配。
這裏,如第十一圖所示,聲學抑制濾波器500在很大程度上與第二圖所示的裝置200中的聲學抑制濾波器210相對應。因此,第十一圖中的聲學抑制濾波器500也包括輸入240,與計算裝置220非常類似的計算裝置510具有輸入240。經由輸入240,向值確定裝置230提供之前描述的信號組中的信號,值確定裝置230是計算裝置510的一部分。值確定裝置230的輸出一方面耦合至均值確定裝置250,另一方面耦合至修正裝置260。均值確定裝置250的輸出也耦合至修正裝置260。在這方面,到目前為止,聲學抑制濾波器500的結構描述和功能連接與裝置200中的沒有區別。
然而,現在將修正裝置260的輸出耦合至聲學抑制濾波器裝置520的輸入,聲學抑制濾波器裝置520在其功能上與聲學抑制濾波器210相對應。然而,與第二圖中的聲學抑制濾波器210不同,聲學抑制濾波器單元520也直接耦合至輸入240或可選的其他輸入280,以基於從修正裝置260接收的修正後的與能量相關的值來對相應信號之一進行濾波。相應地,聲學抑制濾波器裝置520耦合至輸出290,在輸出290處可以輸出回聲減小的信號。
因此,第十一圖所示的聲學抑制濾波器500的實施例與第二圖所示的裝置200的實施例的區別例如在於,在實際的聲學抑制濾波器和/或聲學抑制濾波器裝置520中包括了裝置200的部分功能。換言之,這意味著聲學抑制濾波器裝置520包括第二圖所示的控制資訊計算裝置270的功能。如之前已經解釋的,相對於先前描述的模組,這裏可能出現功能和/或結構的軟化(softening)。
在頻率解析度方面,與頻譜解析度偏離一個STFT單位也是可取的。STFT的均勻頻譜解析度通常不能很好地適應於人類感知。因此,如在參考文獻[8]中所述,將均勻間隔的頻譜系數|X[k,m]|2 和|Y[k,m]|2 分組為多個非交疊的分區或組是有利的,其中,帶寬模仿了人類聽覺系統的頻率解析度。就此而言,也引用參考文獻[9]。
如參考文獻[9]中所述,對於16kHz的採樣率,長度為512的DFT濾波器組的使用和15個分區的使用可以表示一種合適的選擇,其中每個分區具有約兩倍於等效矩形帶寬(ERB)的帶寬。如第十二圖中所示,頻帶與分區相對應。
因此,第十二圖示出了如何將均勻STFT頻譜的頻譜系數分組為模仿人類聽覺系統的非均勻頻率解析度的分區。因此,第十二圖示出通過操作於16kHz的採樣裝置可取得的總計15至16個頻帶的佈置,作為0Hz至8000Hz之間的頻率的函數。第十二圖清楚地示出了相應的頻率分區隨著頻率的增大如何變得更寬。
僅對每個分區的中心頻率來計算不同的增益濾波器。與均勻STFT頻譜的全頻譜解析度的情況相比,這還帶來了較低的計算複雜度。在對STFT頻譜的均勻信號應用最後的分區增益濾波器之前,使用Hann插值濾波器對相應頻譜進行插值。
因此,第十三圖(a)示出了可以用於對增益濾波器進行平滑的潛在的Hann插值濾波器,作為頻率的函數。第十三圖(b)以實線600的形式示出了相應的增益濾波器係數,可以通過在分區中對第十三圖(b)中黑點所表示的增益濾波器的值進行插值來獲取這些係數。這裏,在第十三圖(b)的橫坐標上所示的頻率軸也與第十三圖(a)中所示的圖示相關。
換言之,部分圖示第十三圖(a)示出了Hann濾波器,部分圖示第十三圖(b)示出了在應用相應的插值之前和之後增益濾波器值的示例。這裏,使用點來表示之前的值,使用線600來表示插值。增益濾波器的頻率平均導致所產生的頻譜的變化的平均作為頻率的函數,從而減小了音調、音樂雜訊和其他偽像。
根據具體實現方式,這裏,本發明的實施例可以包括:接收至少一個揚聲器信號;接收至少一個麥克風信號;將揚聲器和麥克風信號轉換為短時頻譜;計算相應的揚聲器和麥克風信號的功率譜;對揚聲器和麥克風功率譜進行濾波以獲得相應的時間波動頻譜;根據揚聲器時間波動頻譜來計算用於估計麥克風時間波動頻譜的回聲估計濾波器;使用回聲抑制濾波器來去除麥克風信號頻譜中的回聲;以及將具有抑制後的回聲的麥克風信號頻譜轉換回時域以獲得回聲去除後的輸出信號。
至此,指出以下內容仍然是有意義的:可以通過相應的解析濾波器組,利用傅立葉變換、向子帶域的變換或向QMF域的變換,來處理本發明實施例中的帶通信號。可以通過相應的合成濾波器組來完成相應的反變換。
類似地,指出以下內容是有意義的:可以使用完全或部分相同的線路、電路和物件來形成不同的裝置。類似地,指出以下內容是有意義的:麥克風信號和揚聲器信號一般是不同的信號。至此,要再次指出的是,在上述實施例中獲得的中間結果不必以上述方式來產生。更合理地,也可以使用數學轉換來實現本發明的實施例,在所述數學轉換中,能夠直接取得其他中間結果或不取得任何中間結果。類似地,在多聲道實現的情況下,可以基於導出的信號來計算與能量相關的值,但是進一步的計算基於各個信號來進行。
也要指出,上述採用裝置和系統形式的結構實施例也可以被理解為表示各個計算步驟、方法步驟和其他步驟的流程圖。在這方面,在此無需分別描述方法和裝置。
在本說明書中,實質上,先前已經考慮了以電數位元方式編碼的音頻信號,其中,在回聲抵消系統中計算延遲值,並將其應用到揚聲器信號和/或由其導出的信號。然而,如在開始處所解釋的,在其他信號處理電路中確實也需要針對其他信號來確定相應的延遲值,並可能將信號延遲該延遲值。
這裏,作為可能的應用領域,要提到補償電路和補償裝置,其中要將不同的信號關於其運行時間、相位位置或其他參數互相適配。除了上述電數位編碼的音頻信號之外,其他電數位編碼的信號也可能需要相應延遲。對類比電信號、光學類比信號和光數位編碼的信號也是如此。根據具體實現方式,這裏可以將相應資訊編碼在電壓值、電流值、頻率值、相位值、強度值或其他電或光信號的量中。除了上述音頻信號之外,例如視頻信號、一般資料信號,還有同步信號和其他信號也可能需要相應延遲。
不論各種實現方式的多樣性,在其他過程中將描述的本發明的實施例採取用於主要基於數位編碼的電信號來確定延遲值的裝置形式,其中,隨後將對用於上述應用領域的實施例的相應變化進行解釋和描述。
第十四圖示出了用於計算延遲裝置710的延遲值d的裝置700。這裏,延遲裝置710本身是裝置700的可選元件,因此在第十四圖中以虛線繪出。
這裏,裝置700包括針對第一和第二信號的第一輸入720-1和第二輸入720-2。如之前所解釋的,這些信號可以是電數位編碼的音頻信號,也可以是相應的其他信號。這裏,延遲裝置710的輸入側耦合至針對第一信號的第一輸入720-1。延遲裝置710的輸出側耦合到裝置700的輸出730,在輸出730上以延遲形式輸出第一信號。此外,延遲裝置710包括輸入710a,在輸入710a上提供的信號包括與第一信號在輸入720-1與輸出730要延遲的延遲值相關的資訊。相應地,延遲裝置710被形成為將輸入的第一信號相應地延遲該延遲值。
裝置700還包括耦合至兩個輸入720的可選的時間/頻率變換裝置740。時間/頻率變換裝置740的第一和第二輸出耦合至值確定裝置750,值確定裝置750繼而經由針對基於第一信號的信號輸出和針對基於第二信號的信號輸出耦合至均值確定裝置760和修正裝置770中的每一個。修正裝置770還包括兩個另外的輸入,使用這兩個另外的輸入,修正裝置770耦合至均值確定裝置760和均值確定裝置760的兩個輸出,這兩個輸出用於與第一信號和第二信號相關的信號。
在第十四圖所示的裝置700的實施例中,修正裝置770也包括耦合至延遲值計算裝置780的兩個相應的輸出。延遲值計算裝置780繼而包括耦合至延遲裝置710的控制輸入710a的輸出。
如結合上述用於計算控制資訊的裝置200和聲學抑制濾波器500的實施例所描述的,所述裝置可以是計算裝置790的一部分,例如,可以採用處理器的形式來實現計算裝置790。可選地,各個元件(例如延遲裝置710)也可以不是該計算裝置790的一部分。
在其功能上,各個裝置與之前描述的裝置相對應。因此,例如,時間/頻率變換裝置740被形成為將第一和第二信號中的每個信號的一個資料塊轉換為相應的頻譜表示,然後在其他裝置中對其進行其他處理。更具體地,這裏,時間/頻率變換裝置740針對兩個信號中的每個信號輸出一個或更多帶通信號,每個帶通信號具有相關聯的一個或更多特徵頻率。這裏,帶通信號與和頻率相關的域相關聯,與頻率相關的域還可以是(僅列出三個示例):實際的頻域、子帶域或QMF域。
在其功能上,值確定裝置750與值確定裝置230相對應,因此這裏在這方面可以參考先前的實施例。然而,與採取其最一般且簡單的形式的值確定裝置230不同,第十四圖中所示的實施例的裝置700的值確定裝置750被形成為對兩個信號計算與帶通信號相關聯的至少一個與能量相關的值。在本發明的其他實施例中,它還被形成為對所有帶通信號計算多個或相應的與能量相關的值,即例如相應帶通信號的能量值或幅度值。這裏,各種帶通信號繼而與不同的特徵頻率相關聯,其中典型地,針對這種情況下的兩個信號,考慮與相同特徵頻率相對應的帶通信號。
在其功能上,均值確定裝置760與先前描述的實施例中的均值確定裝置250相對應,其中,均值確定裝置760仍對兩個信號確定相應的均值。出於這種原因,此處可以再次參考關於均值確定裝置250的描述。
對於修正裝置770,也適用同樣的原理,其與先前的實施例中的修正裝置260相對應,其中,它也對兩個信號執行相應的修正。
最終,在延遲值的計算值d[k,m]方面,延遲值計算裝置780與延遲值計算裝置380和單元470相對應。出於這種原因,在描述中也參考與這些裝置和單元相關的對應的說明書段落。
換言之,在本發明的實施例中,例如,延遲值計算裝置780可以被形成為執行等式(8)至(10)中描述的功能。相應地,在本發明的實施例中,修正裝置770可以相應地被形成為實現等式(13)和(14)中描述的功能。因此,均值確定裝置760也可以基本上被理解為實現等式(15)至(17)所限定的功能。最後,值確定裝置750可以被理解為用於對相應信號的輸入值計算結合第二圖已經針對其進行過解釋的與能量相關的值的裝置。
在其功能上,延遲裝置710不僅與延遲裝置340相對應,也與同樣實現相應功能的其他組件相對應,如第七圖中的時間/頻率變換單元330-1。類似地,計算裝置790和 220可以互相對應。相對於上述輸入240、280和輸出290,輸入720和輸出730也互相對應。
如這裏的討論所示,第一圖至第十三圖中所示的許多裝置和聲學抑制濾波器也是採取裝置700形式的本發明的實施例,即使其中為了簡單的原因而未對其進行如此表示。
如上所述,例如,第十四圖中所示的採取裝置700形式的本發明的實施例可以帶來更快也可能是改進的第一信號相對於第二信號的延遲值的適配。例如,在運行時間補償問題中這是非常有利的,在該問題中,相應的差別在時間上不是恆定的。這尤其是通過以下方式來實現的:可以通過相應平均來確定與頻率相關的域中的雜訊部分和其他靜態雜訊成分,所述雜訊部分和其他靜態雜訊成分是在與能量相關的值方面以系統性估計偏差形式的恆定值出現的。然後,在修正裝置770中還可以考慮這些值。
如也在第十四圖中所示,例如,所確定的延遲值可以用於延遲相應的信號。除了多次提及的運行時間補償之外,也可以在回聲去除系統和其他同步電路中採用相應的延遲電路。
此外,在本發明的實施例中,也可以將裝置700實現為一種多聲道變型。在這種情況下,裝置700的這種多聲道變型包括針對第一信號的多個輸入720-1、針對第二信號的多個輸入720-2,或兩者都包括,其中,在後一種情況下,針對第一和第二信號的輸入的數目可以彼此相同或也可以彼此獨立。
在這樣的裝置700中,根據相應的第一和第二信號的類型,可以在時間/頻率變換裝置740中針對每一個信號來實現可選的時間/頻率變換子裝置,以執行向頻域的變換。如結合之前的組合裝置490已經描述過的,可以將用於組合輸入的第一信號和輸入的第二信號的組合裝置連接在時間/頻率變換裝置740與值確定裝置750和/或伴隨的輸入720與值確定裝置750之間。然後,可以如上所述地進行其他的信號處理。
裝置700的這種多聲道變型還包括多個延遲裝置710,其數目典型地與針對第一信號的輸入720-1的數目相對應。所述多個延遲裝置710的控制輸入(經由控制輸入來獲得延遲值)並行地耦合至延遲值計算裝置780,使得這些延遲裝置中的每一個獲得相同的延遲值。
當然,如上所述,針對多個帶通信號或對所有帶通信號,這裏也可以單獨地對具有其特徵頻率的每個帶通信號進行延遲值的計算。當然,如第十四圖所示,在裝置700的情況下,即在不具有多聲道能力的實現方式中,也可以實現這一點。
根據條件,可以以硬體或軟體形式來實現本發明的實施例。實現方式可以是在數位元儲存介質上,例如軟碟、CD、DVD或其他具有電可讀的控制信號的電腦可讀儲存介質,該數位儲存介質可以與可編程電腦系統協作來執行本發明的方法。一般地,因此,本發明的實施例也在於具有程式碼的軟體程式產品和/或電腦程式產品和/或程式產品,所述程式碼儲存在機器可讀載體上,當軟體程式產品在電腦或處理器上執行時,所述程式碼執行方法實施例。換言之,因此,本發明的實施例可以被實現為具有程式碼的電腦程式和/或軟體程式和/或程式,當程式在處理器上執行時,所述程式碼執行方法實施例。這裏,處理器可以由電腦、晶片卡(智慧卡)、專用積體電路(ASIC)、片上系統(SOC)或其他積體電路(IC)形成。
參考文獻
[1] C. Breining,P. Dreiseitel,E. Hnsler,A. Mader,B. Nitsch,H. Puder,T. Schertler,G. Schmidt,and J. Tilp. Acoustic echo control. IEEE Signal Processing Magazine,16(4):42-69,July 1999.
[2] A. N. Birkett and R. A. Goubran. Limitations of handsfree acoustic echo cancelers due to nonlinear loudspeaker distortion and enclosure vibration effects. In Proc. IEEE Workshop on Applications of Signal Processing to Audio and Acoustics,pages 13-16,New Paltz,Oct. 1995.
[3] G. Schmidt and E. Hnsler. Acoustic echo and noise control:a practical approach. Hoboken:Wiley,2004.
[4] W. L. B. Jeannes,P. Scalart,G. Faucon,and C. Beaugeant. Combined noise and echo reduction in hands-free systems:a survey. IEEE Transactions on Speech and Audio Processing,9(8):808-820,Nov. 2001.
[5] C. Faller and J. Chen. Suppressing acoustic echo in a sampled auditory envelope space. IEEE Trans. on Speech and Audio Proc.,13(5):1048-1062,Sept. 2005.
[6] C. Faller and C. Tournery. Estimating the delay and coloration effect of the acoustic echo path for low complexity echo suppression. In Proc. Intl. Works. on Acoust. Echo and Noise Control(IWAENC),Sept. 2005.
[7] W. Etter and G. S. Moschytz. Noise reduction by noise-adaptive spectral magnitude expansion. J. Audio Eng. Soc.,42:341-349,May 1994.
[8] C. Faller and F. Baumgarte. Binaural Cue Coding -Part II:Schemes and applications. IEEE Trans. on Speech and Audio Proc.,11(6):520-531,Nov. 2003.
[9] B. R. Glasberg and B. C. J. Moore. Derivation of auditory filter shapes from notched-noise data. Hear. Res.,47:103-138,1990.
附錄A
具有系統性估計偏差的回聲估計濾波器
以下將示出,參考文獻[6]中提出的等式(11)對回聲估計濾波器|G[k,m]|2 的零點偏移估計。將要示出,該零點偏移是由於麥克風信號中的靜態雜訊w[n]的效應而導致的。
首先,
其中是具有索引m的頻帶內的靜態雜訊w[n]的方差。此外,
因此,根據等式(11)的回聲估計濾波器產生:
可以看到,靜態雜訊信號w[n]將零點項引入回聲估計濾波器的估計中。此外,等式(29)暗示,回聲估計濾波器中的零點偏移將隨著雜訊方差的增大而變得更大。
附錄B
沒有系統性估計偏差的回聲估計濾波器
在本說明書提出的方法中,為了去除被引入回聲估計濾波器的估計的零點偏移,在集中的中心統計特性|Y[k,m]2 和|Xd [k,m ]2 的幫助下來計算該估計。與附錄A中的過程類似,這裏提出的方法產生了以下運算式:
此外,
因此,根據等式(18)的回聲估計濾波器產生:
因此,可以看到,在麥克風信號中包含近端的靜態背景雜訊的情況下,等式(18)帶來了回聲功率傳遞函數的正確估計。
100...揚聲器
110...麥克風
120...聲學環境
130...揚聲器信號
140...麥克風信號
150...直接傳輸路徑
160...間接傳輸路徑
170...回聲去除處理單元
200...裝置
210...聲學抑制濾波器
220...計算裝置
230...值確定裝置
240...輸入
250...均值確定裝置
260...修正裝置
270...控制資訊計算裝置
280...另外的輸入
290...輸出
300...單元
310...估計裝置
320...回聲估計濾波器
325...回聲抑制處理電路
330...時間/頻率變換裝置
340...延遲裝置
350...估計裝置
360...用於控制資訊的計算裝置
370...頻率/時間變換裝置
380...延遲值計算裝置
390...輸入
400...相干函數計算裝置
410...回聲預測增益計算裝置
420...優化裝置
430...短時功率譜
440...平均的短時功率譜
450...大括弧
460...箭頭
470...單元
480...回聲估計濾波器
490...組合裝置
500...聲學抑制濾波器
510...計算裝置
520...聲學抑制濾波器
600...線
700...裝置
710...延遲裝置
720...輸入
730...輸出
740...時間/頻率變換裝置
750...值確定裝置
760...均值確定裝置
770...修正裝置
780...延遲值計算裝置
790...計算裝置
第一圖示出了用於示意回聲去除中的基本問題的示意圖;
第二圖示出了根據本發明實施例的用於計算聲學抑制濾波器的控制資訊的裝置的電路框圖;
第三圖示出了用於更詳細描述本發明的實施例的功能的簡化框圖;
第四圖示出了根據本發明的另一實施例的電路框圖;
第五圖示出了第四圖所示的本發明實施例的延遲值計算裝置的電路框圖;
第六圖(a)示出了1000Hz處的揚聲器信號的短時頻譜的時間過程及其時間平均值;
第六圖(b)示出了各種回聲估計濾波器的比較;
第六圖(c)示出了回聲可預測性增益因數的時間過程;
第七圖示出了根據本發明的另一實施例的框圖;
第八圖示出了根據本發明的實施例的框圖;
第九圖示出了根據本發明的實施例的用於計算聲學抑制濾波器的控制資訊的裝置的框圖;
第十圖示出了根據本發明的實施例的用於針對若干聲道來計算聲學抑制濾波器的控制資訊的裝置的框圖;
第十一圖示出了根據本發明的實施例的另一聲學抑制濾波器的框圖;
第十二圖示出了對頻率組中的勻短時傅立葉變換濾波器組進行分組;
第十三圖(a)示出了Hann插值濾波器的過程;
第十三圖(b)示出了作為頻率的函數對增益濾波器組係數的比較;以及
第十四圖示出了用於計算延遲值的裝置的實施例的電路框圖。
200...裝置
210...聲學抑制濾波器
220...計算裝置
230...值確定裝置
240...輸入
250...均值確定裝置
260...修正裝置
270...控制資訊計算裝置
280...另外的輸入
290...輸出

Claims (31)

  1. 一種用於計算抑制濾波器(210)的濾波器係數的裝置(200),所述抑制濾波器(210)用於對第二音頻信號進行濾波,以抑制基於第一音頻信號的回聲,所述裝置(200)包括:計算裝置(220),包括值確定裝置(230),所述值確定裝置(230)用於為信號組中的至少一個信號的至少兩個在時間上連續的資料塊的帶通信號,確定至少一個與能量相關的值,所述信號組包括第一音頻信號、第二音頻信號和從第一音頻信號或第二音頻信號導出的信號;其中,所述計算裝置(220)還包括均值確定裝置(250),所述均值確定裝置(250)用於確定為所述帶通信號而確定的至少一個與能量相關的值的至少一個均值;其中,所述計算裝置(220)還包括修正裝置(260),所述修正裝置(260)基於為所述帶通信號而確定的均值來對所述帶通信號的至少一個與能量相關的值進行修正;以及其中,所述計算裝置(220)還包括濾波器係數計算裝置(270),所述濾波器係數計算裝置(270)基於所述帶通信號的修正後的至少一個與能量相關的值來計算所述抑制濾波器(210)的濾波器係數。
  2. 依據申請專利範圍第1項所述的裝置(200),其中,所述值確定裝置(230)被形成為:所述與能量相關的值與所述帶通信號的值的正整數指數次冪成比例,或 者,所述值確定裝置(230)被形成為:所述與能量相關的值與所述帶通信號的值的幅度的正實數指數次冪成比例。
  3. 依據申請專利範圍第1項所述的裝置(200),其中,所述值確定裝置(230)被形成為:使用能量值或與能量值成比例的值作為與能量相關的值。
  4. 依據申請專利範圍第1項所述的裝置(200),其中,所述值確定裝置(230)被形成為:針對相同資料塊但具有不同特徵頻率的不同帶通信號來確定多個與能量相關的值。
  5. 依據申請專利範圍第1項所述的裝置(200),其中,所述值確定裝置(230)被形成為:針對相同資料塊但具有不同特徵頻率的所有帶通信號來確定與能量相關的值。
  6. 依據申請專利範圍第4項所述的裝置(200),其中,所述均值確定裝置(250)被形成為:針對為帶通信號而確定的每一個與能量相關的值,確定均值,所述修正裝置(260)被形成為:基於相關聯的所確定的均值來對所確定的每一個與能量相關的值進行修正,以及,所述濾波器係數計算裝置(270)被形成為:基於所有修正後的與能量相關的值來計算濾波器係數。
  7. 依據申請專利範圍第1項所述的裝置(200),其中,所述均值確定裝置(250)被形成為:基於滑動平均來確定所述至少一個均值。
  8. 依據申請專利範圍第7項所述的裝置(200),其中,所述均值確定裝置(250)被形成為:僅基於信號組中的信號的當前資料塊和在時間上位於當前資料塊之前的資料塊,來計算滑動平均。
  9. 依據申請專利範圍第1項所述的裝置(200),其中,所述修正裝置(260)被形成為:基於與針對相應帶通信號而確定的均值作減法,對至少一個與能量相關的值進行修正。
  10. 依據申請專利範圍第1項所述的裝置(200),其中,所述計算裝置(220)還包括:時間/頻率變換裝置(330),被形成為:至少一個信號屬於基於頻率的域,以作為子帶信號,所述基於頻率的域基於信號的資料塊。
  11. 依據申請專利範圍第1項所述的裝置(200),其中,所述計算裝置(220)被形成為:針對第一音頻信號或基於第一音頻信號的信號以及第二音頻信號或基於第二音頻信號的信號中的每一個,確定至少一個與能量相關的值,確定至少一個均值,基於相應均值來修正所述至少一個與能量相關的值,以及基於相應的修正後的與能量相關的值來計算所述濾波器係數。
  12. 依據申請專利範圍第1項所述的裝置(200),其中,所述計算裝置(220)被形成為:基於多個第一音頻信號、多個第二音頻信號或從第一音頻信號或第二音頻信號導出的多個信號,通過組合,形成所述信號組中的所述至少一個信號。
  13. 依據申請專利範圍第12項所述的裝置(200),其中,所述計算裝置(220)被形成為:針對多個第一音頻信號、多個第二音頻信號或從所述第一音頻信號或所述第二音頻信號導出的多個信號中的每個信號,計算用於所述抑制濾波器(210)的相同的濾波器係數。
  14. 依據申請專利範圍第1項所述的裝置(200),其中,所述計算裝置(220)還包括延遲裝置(340),所述延遲裝置(340)用於信號組中的至少一個信號或用於信號組中的信號的帶通信號的至少一個與能量相關的值,所述延遲裝置(340)被形成為:以延遲值對相應的信號或相應的與能量相關的值進行延遲。
  15. 依據申請專利範圍第14項所述的裝置(200),其中,所述延遲裝置(340)被形成為:所述延遲值基於修正後的至少一個與能量相關的值。
  16. 依據申請專利範圍第14項所述的裝置(200),其中,所述延遲裝置(340)被形成為:所述延遲值基於相干函數的最大值,所述相干函數基於修正後的至少一個與能量相關的值。
  17. 依據申請專利範圍第14項所述的裝置(200),其中,所述延遲裝置(340)被形成為:針對不同特徵頻率的不同帶通信號的延遲值互相獨立。
  18. 依據申請專利範圍第1項所述的裝置(200),其中,所述裝置(200)或所述計算裝置(200)還包括抑制濾波器(210),所述抑制濾波器(210)用於基於所計算 的濾波器係數來對第二音頻信號進行濾波。
  19. 依據申請專利範圍第1項所述的裝置(200),其中,所述裝置(200)被形成為:所述第一音頻信號是揚聲器信號,且所述第二音頻信號是麥克風信號。
  20. 一種抑制濾波器(500),用於對第二音頻信號進行濾波,以抑制基於第一音頻信號的回聲,所述抑制濾波器(500)包括:計算裝置(220),包括值確定裝置(230),所述值確定裝置(230)用於為信號組中至少一個信號的至少兩個在時間上連續的資料塊的帶通信號,確定至少一個與能量相關的值,所述信號組包括第一音頻信號、第二音頻信號和從第一音頻信號或第二音頻信號導出的信號;其中,所述計算裝置(220)還包括均值確定裝置(250),所述均值確定裝置(250)用於確定為所述帶通信號而確定的至少一個與能量相關的值的至少一個均值;其中,所述計算裝置(220)還包括修正裝置(260),所述修正裝置(260)基於為所述帶通信號而確定的均值來對所述帶通信號的至少一個與能量相關的值進行修正;以及其中,所述計算裝置(220)還包括聲學抑制濾波器裝置(520),所述聲學抑制濾波器裝置(520)基於濾波器係數來對第二音頻信號進行濾波,所述濾波器係數基於所述帶通信號的修正後的至少一個與能量相關的值。
  21. 一種用於計算抑制濾波器(210)的濾波器係數的 方法,所述抑制濾波器用於對第二音頻信號進行濾波,以抑制基於第一音頻信號的回聲,所述方法包括:為信號組中的至少一個信號的至少兩個在時間上連續的資料塊的帶通信號,確定至少一個與能量相關的值,所述信號組包括第一音頻信號、第二音頻信號和從第一音頻信號或第二音頻信號導出的信號;確定為所述帶通信號而確定的至少一個與能量相關的值的至少一個均值;基於為所述帶通信號而確定的均值來對所述帶通信號的至少一個與能量相關的值進行修正;以及基於所述帶通信號的修正後的至少一個與能量相關的值來計算抑制濾波器的濾波器係數。
  22. 一種對第二音頻信號進行抑制濾波、以抑制基於第一音頻信號的回聲的方法,所述方法包括:為信號組中的至少一個信號的至少兩個在時間上連續的資料塊的帶通信號,確定至少一個與能量相關的值,所述信號組包括第一音頻信號、第二音頻信號和從第一音頻信號或第二音頻信號導出的信號;確定為所述帶通信號而確定的至少一個與能量相關的值的至少一個均值;基於為所述帶通信號而確定的均值來對所述帶通信號的至少一個與能量相關的值進行修正;以及基於濾波器係數來對第二音頻信號進行濾波,其中,所述濾波器係數基於所述帶通信號的修正後的至少一個 與能量相關的值。
  23. 一種用於計算延遲裝置(710)的延遲值的裝置(700),所述延遲裝置用於相對於第二信號來延遲第一信號,所述裝置(700)包括:計算裝置(790),包括值確定裝置(750),所述值確定裝置(750)用於為第一和第二信號的至少兩個在時間上連續的資料塊的第一信號和第二信號的帶通信號,確定至少一個與能量相關的值;其中,所述計算裝置(790)還包括均值確定裝置(760),所述均值確定裝置(760)用於確定為所述第一信號和第二信號的帶通信號而確定的至少一個與能量相關的值的至少一個均值;其中,所述計算裝置(790)還包括修正裝置(770),所述修正裝置(770)基於為所述第一信號和第二信號的帶通信號而確定的均值,對所述第一信號的帶通信號和所述第二信號的帶通信號的至少一個與能量相關的值進行修正;以及其中,所述計算裝置(790)還包括延遲值計算裝置(780),所述延遲值計算裝置(780)被形成為:基於第一和第二信號的修正後的與能量相關的值來計算延遲值;所述延遲值基於相干函數的最大值,所述相干函數基於第一和第二信號的修正後的與能量相關的值。
  24. 依據申請專利範圍第23項所述的裝置(700),其 中,所述裝置(700)或所述計算裝置(790)還包括用於第一信號的延遲裝置(710),所述延遲裝置(710)被形成為:以所述延遲值對第一信號進行延遲。
  25. 依據申請專利範圍第23項所述的裝置(700),其中,所述裝置(700)被形成為:第一信號和第二信號中的每一個是下述信號類型組中的信號,所述信號類型組包括:類比電信號、類比光信號、數位電信號和數位光信號。
  26. 依據申請專利範圍第23項所述的裝置(700),其中,所述計算裝置(790)還包括時間/頻率變換裝置(740),所述時間/頻率變換裝置(740)被形成為:第一和第二信號屬於基於頻率的域,以作為子帶信號,所述基於頻率的域基於資料塊。
  27. 依據申請專利範圍第23項所述的裝置(700),其中,所述值計算裝置(750)被形成為:針對第一和第二信號的相同資料塊但具有不同特徵頻率的不同帶通信號來確定多個與能量相關的值;所述均值確定裝置(760)被形成為:針對為所述帶通信號而確定的每一個與能量相關的值,確定均值;所述修正裝置(770)被形成為:基於相關聯的所確定的均值來對所確定的每一個與能量相關的值進行修正;以及,所述延遲值計算裝置(780)被形成為:基於第一和第二信號的所有修正後的與能量相關的值來計算所述延遲值。
  28. 依據申請專利範圍第23項所述的裝置(700),其中,所述計算裝置(790)被形成為:通過基於多個第一 信號或從第一信號導出的多個信號的組合來形成第一信號,或者,所述計算裝置(790)被形成為:通過基於多個第二信號或從第二信號導出的多個信號的組合來形成第二信號。
  29. 依據申請專利範圍第28項所述的裝置(700),其中,所述計算裝置(790)被形成為:針對多個第一信號或從第一信號導出的多個信號中的每一個信號,計算延遲裝置(710)的相同的延遲值。
  30. 一種用於計算延遲裝置(710)的延遲值的方法,所述延遲裝置用於相對於第二信號來延遲第一信號,所述方法包括:為至少兩個在時間上連續的資料塊的第一信號和第二信號的帶通信號,確定至少一個與能量相關的值;確定為所述第一信號和第二信號的帶通信號而確定的至少一個與能量相關的值的至少一個均值;基於為所述第一信號和第二信號的帶通信號而確定的均值,對所述第一信號和所述第二信號的帶通信號的至少一個與能量相關的值進行修正;以及基於第一和第二信號的修正後的與能量相關的值來計算所述延遲值。
  31. 一種具有程式碼的程式,當在處理器上執行所述程式時,用於執行依據申請專利範圍第21、22或30項所述的方法。
TW098101960A 2008-01-25 2009-01-19 用於計算回聲抑制濾波器的控制資訊的裝置和方法,以及用於計算延遲值的裝置和方法 TWI458331B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US2347208P 2008-01-25 2008-01-25
DE102008039329A DE102008039329A1 (de) 2008-01-25 2008-08-22 Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts

Publications (2)

Publication Number Publication Date
TW200942016A TW200942016A (en) 2009-10-01
TWI458331B true TWI458331B (zh) 2014-10-21

Family

ID=40794586

Family Applications (1)

Application Number Title Priority Date Filing Date
TW098101960A TWI458331B (zh) 2008-01-25 2009-01-19 用於計算回聲抑制濾波器的控制資訊的裝置和方法,以及用於計算延遲值的裝置和方法

Country Status (14)

Country Link
US (1) US8731207B2 (zh)
EP (1) EP2235927B1 (zh)
JP (1) JP5102371B2 (zh)
KR (1) KR101250124B1 (zh)
CN (1) CN101953145B (zh)
AU (1) AU2009207881B2 (zh)
BR (1) BRPI0905760B1 (zh)
CA (1) CA2713127C (zh)
DE (1) DE102008039329A1 (zh)
ES (1) ES2641770T3 (zh)
MX (1) MX2010008034A (zh)
RU (1) RU2495506C2 (zh)
TW (1) TWI458331B (zh)
WO (1) WO2009092522A1 (zh)

Families Citing this family (90)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8831936B2 (en) 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
US8538749B2 (en) 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
WO2010118763A1 (en) 2009-04-15 2010-10-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multichannel echo canceller
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
NO332437B1 (no) * 2010-01-18 2012-09-17 Cisco Systems Int Sarl Apparat og fremgangsmate for a supprimere et akustisk ekko
DE102010029030A1 (de) * 2010-05-17 2012-03-01 Bayerische Motoren Werke Aktiengesellschaft Verfahren und Vorrichtung zur Verarbeitung von Daten in einem Fahrzeug
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
US20120263317A1 (en) * 2011-04-13 2012-10-18 Qualcomm Incorporated Systems, methods, apparatus, and computer readable media for equalization
EP2562751B1 (en) * 2011-08-22 2014-06-11 Svox AG Temporal interpolation of adjacent spectra
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
CN103325379A (zh) 2012-03-23 2013-09-25 杜比实验室特许公司 用于声学回声控制的方法与装置
CN103325380B (zh) 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
CN103730125B (zh) * 2012-10-12 2016-12-21 华为技术有限公司 一种回声抵消方法和设备
CN102982801B (zh) * 2012-11-12 2014-12-10 中国科学院自动化研究所 一种用于鲁棒语音识别的语音特征提取方法
TWI469650B (zh) * 2012-11-29 2015-01-11 Quanta Comp Inc 回音消除系統
US9495951B2 (en) 2013-01-17 2016-11-15 Nvidia Corporation Real time audio echo and background noise reduction for a mobile device
EP2976897B8 (en) * 2013-03-21 2020-07-01 Cerence Operating Company System and method for identifying suboptimal microphone performance
CN106470284B (zh) * 2015-08-20 2020-02-11 钉钉控股(开曼)有限公司 消除声学回声的方法、装置、***、服务器及通话装置
US10397190B2 (en) * 2016-02-05 2019-08-27 Huawei Technologies Co., Ltd. System and method for generating an obfuscated optical signal
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US9811314B2 (en) 2016-02-22 2017-11-07 Sonos, Inc. Metadata exchange involving a networked playback system and a networked microphone system
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US9772817B2 (en) 2016-02-22 2017-09-26 Sonos, Inc. Room-corrected voice detection
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
EP3312838A1 (en) 2016-10-18 2018-04-25 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for processing an audio signal
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
CN106791244B (zh) * 2016-12-13 2020-03-27 青岛微众在线网络科技有限公司 回声消除方法、装置以及通话设备
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
DE102017212980B4 (de) 2017-07-27 2023-01-19 Volkswagen Aktiengesellschaft Verfahren zur Kompensation von Störgeräuschen bei einer Freisprecheinrichtung in einem Kraftfahrzeug und Freisprecheinrichtung
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10446165B2 (en) * 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US10482868B2 (en) * 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
CN109658946A (zh) * 2017-10-12 2019-04-19 深圳前海黑鲸科技有限公司 一种回声处理方法、装置、存储介质及终端设备
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US10818290B2 (en) 2017-12-11 2020-10-27 Sonos, Inc. Home graph
WO2019152722A1 (en) 2018-01-31 2019-08-08 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10847178B2 (en) 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
EP3654249A1 (en) 2018-11-15 2020-05-20 Snips Dilated convolutions and gating for efficient keyword spotting
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
CN111698022B (zh) * 2019-01-03 2022-02-08 长沙天仪空间科技研究院有限公司 一种基于抑制窄带多通道通信干扰的卫星通信***
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US10839821B1 (en) * 2019-07-23 2020-11-17 Bose Corporation Systems and methods for estimating noise
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11437054B2 (en) 2019-09-17 2022-09-06 Dolby Laboratories Licensing Corporation Sample-accurate delay identification in a frequency domain
CN110648679B (zh) * 2019-09-25 2023-07-14 腾讯科技(深圳)有限公司 回声抑制参数的确定方法和装置、存储介质及电子装置
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
CN112803959B (zh) * 2019-11-13 2022-05-10 瑞昱半导体股份有限公司 收发电路与应用于收发电路的信号处理方法
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
EP4199368A4 (en) * 2020-08-12 2024-01-03 Auzdsp Co., Ltd. ADAPTIVE DELAY DIVERSITY FILTER, ECHO COMPENSATION DEVICE AND METHOD USING THE SAME
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range
US11551700B2 (en) 2021-01-25 2023-01-10 Sonos, Inc. Systems and methods for power-efficient keyword detection

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020054685A1 (en) * 2000-11-09 2002-05-09 Carlos Avendano System for suppressing acoustic echoes and interferences in multi-channel audio systems
US6622030B1 (en) * 2000-06-29 2003-09-16 Ericsson Inc. Echo suppression using adaptive gain based on residual echo energy
US20050108004A1 (en) * 2003-03-11 2005-05-19 Takeshi Otani Voice activity detector based on spectral flatness of input signal
US6961422B2 (en) * 2001-12-28 2005-11-01 Avaya Technology Corp. Gain control method for acoustic echo cancellation and suppression
US20060165019A1 (en) * 2002-10-22 2006-07-27 Siemens Aktiengesellschaft Echo-suppression with short delay
US20060222172A1 (en) * 2005-03-31 2006-10-05 Microsoft Corporation System and process for regression-based residual acoustic echo suppression
WO2006111369A1 (en) * 2005-04-19 2006-10-26 Epfl (Ecole Polytechnique Federale De Lausanne) A method and device for removing echo in an audio signal
WO2006111370A1 (en) * 2005-04-19 2006-10-26 Epfl (Ecole Polytechnique Federale De Lausanne) A method and device for removing echo in a multi-channel audio signal
US20070263850A1 (en) * 2006-04-28 2007-11-15 Microsoft Corporation Integration of a microphone array with acoustic echo cancellation and residual echo suppression

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02291712A (ja) 1989-05-02 1990-12-03 Nec Corp ノイズ除去方法及び装置
JP2842026B2 (ja) 1991-02-20 1998-12-24 日本電気株式会社 適応フィルタの係数制御方法及び装置
JP3277398B2 (ja) * 1992-04-15 2002-04-22 ソニー株式会社 有声音判別方法
DE69421911T2 (de) * 1993-03-25 2000-07-20 British Telecomm Spracherkennung mit pausedetektion
US6760451B1 (en) 1993-08-03 2004-07-06 Peter Graham Craven Compensating filters
US5844994A (en) * 1995-08-28 1998-12-01 Intel Corporation Automatic microphone calibration for video teleconferencing
SG71035A1 (en) 1997-08-01 2000-03-21 Bitwave Pte Ltd Acoustic echo canceller
US5930366A (en) 1997-08-29 1999-07-27 Telefonaktiebolaget L M Ericsson Synchronization to a base station and code acquisition within a spread spectrum communication system
JP3403655B2 (ja) 1998-11-27 2003-05-06 松下電器産業株式会社 サブバンド適応フィルタを用いた未知システムの同定方法および装置
US6590881B1 (en) 1998-12-04 2003-07-08 Qualcomm, Incorporated Method and apparatus for providing wireless communication system synchronization
US6556967B1 (en) * 1999-03-12 2003-04-29 The United States Of America As Represented By The National Security Agency Voice activity detector
JP3507020B2 (ja) * 2000-09-08 2004-03-15 日本電信電話株式会社 反響抑圧方法、反響抑圧装置及び反響抑圧プログラム記憶媒体
CN100477705C (zh) 2002-07-01 2009-04-08 皇家飞利浦电子股份有限公司 音频增强***、配有该***的***、失真信号增强方法
US7889804B2 (en) 2003-05-30 2011-02-15 Mohammad Jaber Borran Partially coherent constellations for multiple-antenna systems
JP4395105B2 (ja) 2005-06-13 2010-01-06 日本電信電話株式会社 音響結合量推定方法、音響結合量推定装置、プログラム、記録媒体

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6622030B1 (en) * 2000-06-29 2003-09-16 Ericsson Inc. Echo suppression using adaptive gain based on residual echo energy
US20020054685A1 (en) * 2000-11-09 2002-05-09 Carlos Avendano System for suppressing acoustic echoes and interferences in multi-channel audio systems
US6961422B2 (en) * 2001-12-28 2005-11-01 Avaya Technology Corp. Gain control method for acoustic echo cancellation and suppression
US20060165019A1 (en) * 2002-10-22 2006-07-27 Siemens Aktiengesellschaft Echo-suppression with short delay
US20050108004A1 (en) * 2003-03-11 2005-05-19 Takeshi Otani Voice activity detector based on spectral flatness of input signal
US20060222172A1 (en) * 2005-03-31 2006-10-05 Microsoft Corporation System and process for regression-based residual acoustic echo suppression
WO2006111369A1 (en) * 2005-04-19 2006-10-26 Epfl (Ecole Polytechnique Federale De Lausanne) A method and device for removing echo in an audio signal
WO2006111370A1 (en) * 2005-04-19 2006-10-26 Epfl (Ecole Polytechnique Federale De Lausanne) A method and device for removing echo in a multi-channel audio signal
US20070263850A1 (en) * 2006-04-28 2007-11-15 Microsoft Corporation Integration of a microphone array with acoustic echo cancellation and residual echo suppression

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Faller, C. et al., "Suppressing Acoustic Echo in a Spectral Envelope Space", IEEE Trans. on Speech and Audio Proc., Sep. 2005 *

Also Published As

Publication number Publication date
US8731207B2 (en) 2014-05-20
JP5102371B2 (ja) 2012-12-19
BRPI0905760B1 (pt) 2020-09-24
RU2010131421A (ru) 2012-02-10
CN101953145B (zh) 2013-03-27
AU2009207881B2 (en) 2012-07-12
TW200942016A (en) 2009-10-01
CA2713127A1 (en) 2009-07-30
US20110044461A1 (en) 2011-02-24
MX2010008034A (es) 2010-09-22
ES2641770T3 (es) 2017-11-13
AU2009207881A1 (en) 2009-07-30
CA2713127C (en) 2015-03-24
EP2235927A1 (en) 2010-10-06
KR20100133365A (ko) 2010-12-21
KR101250124B1 (ko) 2013-04-09
EP2235927B1 (en) 2017-07-12
CN101953145A (zh) 2011-01-19
WO2009092522A1 (en) 2009-07-30
RU2495506C2 (ru) 2013-10-10
DE102008039329A1 (de) 2009-07-30
BRPI0905760A8 (pt) 2017-11-28
JP2011511522A (ja) 2011-04-07

Similar Documents

Publication Publication Date Title
TWI458331B (zh) 用於計算回聲抑制濾波器的控制資訊的裝置和方法,以及用於計算延遲值的裝置和方法
JP4161628B2 (ja) エコー抑圧方法及び装置
TWI388190B (zh) 用於回聲抑制的濾波器係數的計算設備和方法
JP5671147B2 (ja) 後期残響成分のモデリングを含むエコー抑制
EP3080975B1 (en) Echo cancellation
Faller et al. Suppressing acoustic echo in a spectral envelope space
US20130301840A1 (en) Methods for processing audio signals and circuit arrangements therefor
Burton et al. A generalized proportionate subband adaptive second-order Volterra filter for acoustic echo cancellation in changing environments
JP2004349806A (ja) 多チャネル音響エコー消去方法、その装置、そのプログラム及びその記録媒体
Wada et al. Multi-channel acoustic echo cancellation based on residual echo enhancement with effective channel decorrelation via resampling
Fukui et al. Double-talk robust acoustic echo cancellation for CD-quality hands-free videoconferencing system
JP2002223182A (ja) 反響消去方法、その装置、そのプログラム及びその記録媒体
Eneroth Stereophonic acoustic echo cancellation: Theory and implementation
Emura et al. A method of coherence-based step-size control for robust stereo echo cancellation
JP4631933B2 (ja) エコー抑圧方法
Nathan et al. Acoustic Echo Cancellation Technique for VoIP
Chowdary Acoustic Echo cancellation inside a Conference Room using Adaptive Algorithms
Benesty et al. Some Practical Aspects of Stereo Teleconferencing System Implementation
Kim et al. Stereophonic Acoustic Echo Canceller using single adaptive filter per channel
Gopalaiah Design & Development of a Partitioned Block Frequency Domain Based Adaptive Filtering Concept for Noise Cancellation Techniques

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent