TW201032220A - Systems, methods, apparatus, and computer-readable media for coherence detection - Google Patents

Systems, methods, apparatus, and computer-readable media for coherence detection Download PDF

Info

Publication number
TW201032220A
TW201032220A TW098136230A TW98136230A TW201032220A TW 201032220 A TW201032220 A TW 201032220A TW 098136230 A TW098136230 A TW 098136230A TW 98136230 A TW98136230 A TW 98136230A TW 201032220 A TW201032220 A TW 201032220A
Authority
TW
Taiwan
Prior art keywords
channel
signal
value
frequency
task
Prior art date
Application number
TW098136230A
Other languages
English (en)
Inventor
Erik Visser
Ian Ernan Liu
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW201032220A publication Critical patent/TW201032220A/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/8006Multi-channel systems specially adapted for direction-finding, i.e. having a single aerial system capable of giving simultaneous indications of the directions of different signals
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/86Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves with means for eliminating undesired waves, e.g. disturbing noises
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Description

201032220 六、發明說明: 【發明所屬之技術領域】 本發明係關於信號處理。 本專利申請案主張2008年10月24日申請且已讓與給其受 > 讓人之題為「Motivation for multi mic phase correlation based 、 masking scheme」之美國臨時專利申請案第61/108,447號的 優先權。本專利申請案亦主張2009年6月9曰申請且已讓與 給其受讓人之題為「Systems, methods,apparatus, and ❿ computer-readable media for coherence detection」之美國 臨時專利申請案第61/1 85,51 8號的優先權。本專利申請案 亦主張2009年9月8日申請且已讓與給其受讓人之題為 「Systems, methods, apparatus, and computer-readable media for coherence detection」之美國臨時專利申請案第 61/240,318號的優先權。 【先前技術】 先前執行於安靜之辦公室或家庭環境中的許多活動如今 魯 正執行於聲學上可變之情形(如,汽車、街道或咖啡館) 中。舉例而言,一人可能期望使用語音通信頻道與另一人 * 進行通信。舉例而言,該頻道可由行動無線手機或耳機、 , 步講機、雙向無線電設備、車載裝置或另一通信器件提 供。因此,大量語音通信係使用行動器件(例如,智慧電 話、手機及/或耳機)而發生於使用者由其他人包圍、具有 通常在人們傾向於聚集之情形中遭遇之類型的雜訊内容之 環境中。此雜訊傾向於使電話通話之遠端處的使用者分心 144218.doc 201032220 ,煩權。此外,許多標準自動商業異動(例如,帳戶社餘 或股票報價查核)使用基於語音辨識之資料查詢且此。等 系統之正確性可顯著地被干擾雜訊阻礙。 ^通信發生於嘈雜環境中之應用而言,可能需要將所 要話曰信號與背景雜訊分離。可將雜訊定義為干擾所要作 號或以其他方錢所要㈣祕之所有信號的組合。背^ 雜訊可包括產生於聲學環境(諸如,其他人之背景通話)内 之許多雜訊信號以及自所要信號及/或其他信號中之任一 者產生的反射及回響。若所要話音信號未與背景雜訊分 離,則可能難以可靠且有效地利用該所要話音信號。在一 個特疋實例中’話音信號產生於增雜環境中,且使用話音 處理方法將話音信號與環境雜訊分離。 曰 行動環境中遭遇之雜訊可包括各種不同分量,諸如,競 爭性之談話者、音樂、串音、街道雜訊及/或機場雜訊。 因為此雜訊之特性通常不穩定且接近於使用者自身之頻率 特性,所以該雜訊可能難以使用傳統單一麥克風或固定波 束成形型方法來模型化。單一麥克風雜訊減少技術通常需 要顯著之參數調諧以達成最佳效能。舉例而言,在此等 形中可能不可直接獲得一適當雜訊參考值’且可能必需^ 接地導出雜訊參考值。因此,可能需要基於多個麥克風i 高級信號處理以支援使用行動器件用於嘈雜環境中之詳土 通信。 9 【發明内容】 針 種根據—般組態處理一多頻道信號之方法包括: 144218.doc 201032220 對該多頻道㈣之複數财同頻率分量巾的每—者計算該 多頻道信號之-第—頻道中之該頻率分量的一相位與該多 頻道信號之-第二頻道中之該頻率分量的一相位之間的 差。此方法亦包括基於來自該複數個所計算出之相位差之 資訊計算—致性量狀—值,該值指示至少該複數個不 同頻率分量之到達方向之間的_致性之—程度。在本文中 亦揭示儲存用於執行此方法之機器可讀取指令的電腦可讀 參
取媒體、經組態以執行此方法之裝置及含有此裝置之系 統。 種用於根般組態處理一多頻道信號之裝置包 括:用於針對該多頻道信號之複數個不同頻率分量中的每 一者計算該多頻道信號之—第—頻道中之該頻率分量的一 相位與該多頻道信號之-第二頻道中之該頻率分量的一相 位之間的差之構件。此裝置亦包括心基於來自該複數個 所計算出之相位差之資訊計算__致性量測之—值的構 件,該值指示至少該複數個不同頻率分量之到達方向之間 的一致性之一程度。 τ種用於根據另一一般組態處理一多頻道信號之裝置包 括.相位差計算器’其經組態以針對該多頻道信號之複 數個不同頻率分量中的每-者計算該多頻道信號之-第-頻道中之該頻率分量的—相位與該多頻道信號之一第二頻 道中,該頻率分量的-相位之間的差。此裝置亦包括一一 致性量測計算n,其㈣態以基於來自該複數個所計算出 之相位差之資訊計算致性量測之—值,該值指示至少 144218.doc 201032220 該複數個不同頻率分量之到達方向之間的一致性之一程 度。 【實施方式】 真實世界充滿多個雜訊源,包括單點雜訊源,該等雜訊 源經常侵入(transgress)至多個聲音中,從而導致回響。背 景聲學雜訊可包括由一般環境產生之許多雜訊信號及由其 他人之背景通話產生之干擾信號以及自所要聲音信號及/ 或其他信號中之任一者產生的反射及回響。 環境雜訊可影響所感應音訊信號(諸如,近端話音信號) 之可懂度。可能需要使用信號處理來區分所要音訊信號與 背景雜訊。舉例而言,對於通信可能發生於嘈雜環境中之 應用而言,可能需要使用話音處理方法來區分話音信號與 背景雜訊並增強其可懂度。此處理在日常通信之許多領域 中可為重要的,因為雜訊幾乎始終存在於真實世界狀況 中。 ' 關於手機及耳機之多麥克風雜訊減少方案包括波束成 途徑(例如’廣義旁瓣對消(GSC)、最小變異數無失真回 (MVDR)及/或線性限制性最小變異數(LCMV)波束成形著 及盲源分離(BSS)途徑。此等途徑通常^能夠抑制自盘 要聲音(例如’近場講話者之語音)相同之方向到達^ 訊°尤其在耳機及中場或遠場手機應用(例如 ==話模式)中’由麥克風陣列記錄的多頻道信 顯著擾雜訊源及/或所要近場談話者之話音 ,者口響的聲音。尤其對於耳機而言,與使用者之口部 144218.doc 201032220 大距離可允許麥克風陣列拾取來自 ro . Ij方之大量雜訊,僅使 用方向資訊可能難以顯著抑制該等雜訊。 災 可將近場定義為距聲音接收器(例如,麥克風陣列)小於 一個波^之空間區域。根據此定義,與該區域之邊界的距 離與頻率相反地變化。舉例而言, 在2〇〇、700及2〇〇〇赫茲 之頻率下,與-波長之邊界的距離分別為約17。、49及17
公分。替代地將近場/遠場邊界考慮成處於距麥克風陣列 之特定距離(例如,距陣列之麥克風或距陣列之形心 (centroid^公分’或距陣列之麥克風或距陣列之形心】$ 公尺)處可為有用的。 可能需要實施-種辨別來自近場源之聲音與來自遠場源 聲曰的L號處理方案(例如,以達成較佳雜訊減少)。舉 例而吕’可能需|區分來自所要近場談話者之聲音與來自 遠昜源之自相同方向到達的聲音。此方案之—個基於振幅 ^增益的實例在兩個麥克風之間使用—壓力梯度場以判定 源係近場還是遠場。雖然此技術可用於在近場靜寂期間 降低來自遠%源之雜訊’然而’當兩源皆活動時其可能 不支援近场^號與遠場信號之間的辨別。此技術通常亦高 度取決於麥克風相對於彼此之正確增益校準達成此可為 困難及/或不切實際的(例如,昂貴及/或耗時)。可能需要 $極或不取決於麥克風增益校準之情形中減少在近場源 靜叔及近%源活動兩者期間的遠場信號及/或辨別來自近 場源之信號與來自遠場源之信號。 本發明包括對經組態以判定多頻道信號(例如,由麥克 144218.doc 201032220 風陣列產生)之各種頻 手刀量之間的方向一致性之系統、 二 置的描述。可能需要基於在複數個不同頻率中之 二::信號之頻道的估計相位之間的差而組態此系統、 :、置Μ判定方向—致性。在本文中亦將此等組態稱 :二:相位」。基於相位之組態可使用(例如)根據複數個 :同頻率之間的相關性(例如,線性關係之強度)及在該複 固不同頻率中之每—者下的估計相位差而判定方向一致 性的方案。在本文中亦將此等方案稱為「基於相位相關 性j。 一麥克風陣列產生—多頻道信號,在該多頻道信號中, 每-頻道係基於麥克財之—對應者對聲學環境之回應。 當該陣列接收來源於遠場源之聲音時,所得多頻道信號通 常將不如來源於近場源之所接收聲音之所得多頻道信號方 向一致。舉例而言,在複數個不同頻率分量中之每一者下 麥克風頻道之間的相位差與來源於遠場源之所接收聲音之 頻率的相關性通常將小於與來源於近場源之所接收聲音之 頻率的相關性。當陣列在一方向上接收來自所要近場源之 聲音且在不同方向上接收來自干擾近場源之聲音時,該陣 列回應於每一聲音而產生之信號通常將在對應方向上一 致。 可能需要使用基於相位或基於相位相關性之方案來識別 展現非所要之相位差特性(例如,與頻率不相關及/或與頻 率相關但指示非所要的方向上之一致性的相位差)之時間_ 頻率點。此識別可包括對所記錄之多頻道信號執行方向遮 144218.doc ' 8 - 201032220 蔽操作。方向遮蔽掉作可白& 「 敝栎作了包括(例如)將方向遮蔽函數(或 遮罩」)應用於多頻道作號夕& ,㈤u號之相位分析的結I以便廢棄 號之大量時間·頻率點。與所記錄信號相比之經遮蔽 號之力率的大量減小可用於指示在彼特定時間間隔中存 2遠場源及/或干擾近場源’且可能需要在彼間隔中使記 ::、▲《夕個頻道衰減。此方法可經組態以(例如)使多頻 道信號之主要頻道(亦即’基於由主要麥克風(諸如,經定
=最直接地接收使用者之語音的麥克風)產生之信號的 頻^)中之非所要的時間頻率點衰減。 、基於相位或基於相位相關性之方向一致性方案(例如, 遽蔽方案)的應用範圍包括:減少不穩定擴散及/或方向雜 訊;消除由近場所要講話者產生之聲音的回響;移除在麥 克風頻道之間不相關之雜訊(例如,風及/或感應器雜訊)丨 抑制來自非所要方向之聲音;抑制來自任何方向之遠場信 號,估計直接路徑與回響(direct path_t〇似咖rati〇n)信 '又(例如以達成來自遠場源之干擾的顯著減少);經 由辨別近場源與遠場源而減少轉定雜訊;及減小在近場 所要源活動期間以及暫停期間來自前方干擾者的聲音,此 通常不可藉由基於增益之途徑達成。 在具有二麥克風陣列之通信耳機中,可使用基於相位之 遮蔽方案來辨別近場談話者與遠場談話者並藉此減少遠場 干擾而不管其到達方向。來自近場源之聲音與來自遠場源 之聲音之間的此辨別通常不可自當前雜訊減少方案獲得且 可預期向耳機效能添加顯著益處。在具有四麥克風陣列之 144218.doc 201032220 通L手機中,可使用基於相位的遮蔽途徑來獲得對來自近 場談話者之聲音之回響的顯著消除及/或對於瀏覽談話模 式(亦即’-器件使用模式’其中使用者在檢視器件之顯 示螢幕的同時致力於諸如電話呼叫之語音通信會話)之不 穩定雜訊的減少。 可能需要對一或多個其他處理操作上游之所記錄多頻道 輸入執行基於相位之方案。舉例而言,來自基於相位或基 於相位相關性之操作的結果可用於支援各種其他應用,諸 如,對所記錄輸入之增益校準操作、空間選擇性處理操作 及/或雜訊減少操作。 除非明確由其上下文限制,否則術語「信號」在本文中 用來指不其普通意義中之任一者,包括如導線、匯流排或 其他傳輸媒體上表達之記憶體位置(或記憶體位置之集合) 的狀態。除非明確由其上下文限制,丨則術語「產生」在 本文用來指示其普通意義中之任—者,諸如計算或以其他 方式產生。除非明確由其上下文限制,否則術語「計算」 在本文用來指示其普通意義中之任一者,諸如計算、評 估、估計及/或自複數個值選擇。除非明續由其上下文限 制’否則術語「獲得」肖來指示其普通意義中之任一者, 諸如計算、導出、接收(例如,自一外部器件)及,或擁取 (例如,自儲存元件陣列)。除非明確由其上下文限制,否 則術語「選擇」用來指示其普通意義中之任—者,諸如識 別、指示、應用及/或使用具有兩個或兩個以上者之集合 中的至少-者(且少於全部)。當術語「包含」使用於本發 144218.doc • 10· 201032220 明之描述及申請專利範圍中時, 作。#「其π w 其並不排除其他元件或操 音薦土 A係基於B」巾)用來指示其普通 : 者,包括以下情形:⑴「自…導出」(例 . 甘人 (11>至少基於」(例如,「A至少 ‘=」);及㈣「等同於」(例如,「A等同於B」)(若在 7疋上下文中為適當的)。類似地,術語「回應於」用來 指不其普通意義中之任—者, 、 巴栝至少回應於」。 •麥::上…外指示,否則對多麥克風音訊感應器件之 麥克風之「位置,的摇月# .,A里 各不該麥克風之聲學上敏感之面 的中心位置。根據特定上下文,術語「頻道」有時 2一信號路徑且在其他時候用於指示—由此路徑載運之信 號。除非另外指示,否則術語「 .^ ^ 糸歹】J用於札示具有兩個 ^兩個以上項之序列。術語「對數」用於㈣底為此 頻=作向其他底之擴展處於本發明之範嘴内。術語 頻率刀量」用於指示信號之頻率或頻帶之集合中的一 •二=該信號之頻域表示之樣本(例如,由快速傅立 產生)或該信號之子頻帶(例如,㈣尺度或_尺度 于頻帶)。 ·=:外指示’否則具有特定特徵之裝置的操作之任何 . :合亦明確地意欲揭示具有類似特徵之方法(且反之 亦=),且根據特定組態之裝置的操作之任何揭示内容亦 日二:意欲揭示根據類似組態之方法(且反之 ::Γ考由其特定上下文所指示之方法、裝置及/ 或“而使用。除非特定上下文另外指示,否則術語「方 144218.doc •11 - 201032220 法」、「過程」、「程序」及「技術」一般性地且可交換地使 用。除非特定上下文另外指示,否則術語「裝置」及「器 件」亦一般性地且可交換地使用。術語「元件」及「模 組」通常用於指示較大組態之一部分。除非明確由其上下 文限制’否則術語「系統」在本文中用來指示其普通意義 中之任一者’包括「互動以達成共同目的之一組元件」。 亦應將文獻之部分以引用方式之任何併入理解為併入該部 分内所引用之術語或變數的定義(其中此等定義出現於該 文獻之其他位置)及所併入部分中所引用的任何圖。 此描述包括應用關於麥克風間距離及頻率與麥克風間相 位差之間的相關性之資訊來判定所感應多頻道信號之特定 頻率分量係來源於可允許麥克風間角的範圍之内還是來源 於此範圍之外的系統、方法及裝置之揭示内容。此判定可 =辨別自不同方向到達之信號(例如,以使得來源於彼 圍之内的聲音得以保留且來源於彼範 抑制)及/或用於辨別近場信號與遠場信號。 =典型應用中,此系統、方法或裝置料針對多頻道 仏琥之母一時間_頻率點 向。可將方…“ τ异相對於麥克風對之到達方 了將方向遮蔽函數應用於此等 範圍内之到達方向的點與具有其他 “有在所要 蔽操作之姓婁亦田 達方向之點。來自遮 方向的時間.頻率點而移除來自、有在«外之到達 而言,可能需要計算在所有時間_頻率::之信號。舉例 直方圖(例如,藉由計算映射至每頻=上之到達方向的 母—到打向之所量測時 1442l8.doc φ Θ -12· 201032220 間-頻率點的數目)並自該直方圖選擇—所要方向。 圖1A展示根據一般組態的處理多頻道信號之方法 之流程圖。方法M100包括針對多頻道信號之複數個不同 • 頻率分量中的每一者計算該信號之頻道(例如,麥克風頻 、 道)之間的相位差之任務T100及基於所計算出之相位差計 算一致性量測之任務Τ200。 方法Μ100可經組態以將該多頻道信號處理為一系列片 籲 段。典型片段長度之範圍處於約5或1〇毫秒至約4〇或5〇毫 秒之間,且該等片段可重疊(例如,相鄰片段重疊25%或 50%)或不重疊。在一個特定實例中,多頻道信號經劃分成 一系列不重疊片段或「訊框」’該等片段或「訊框」各自 具有1 〇毫秒之長度。任務Τ100可經組態以計算相位差之一 集合(例如’向量),且任務Τ200可經組態以針對片段中之 每一者計算一致性量測。由方法Μ100處理之片段亦可為 由不同操作處理之較大片段的一片段(亦即,一「子訊 φ 框」)’或反之亦然。 圖1Β展示任務Τ100之實施例Τ102的流程圖。對於每一 麥克風頻道’任務Τ102包括針對不同頻率分量中之每—者 估計頻道之相位的子任務Τ110之各別例項。圖1 c展示任務 • ΤΙ 1 0之實施例Τ112(包括子任務Τ1121及Τ1122)的流程圖。 任務Τ1121計算頻道之頻率變換,諸如快速傅立葉變換 (FFT)或離散餘弦變換(DCT)。任務Τ1121通常經組態以針 對每一片段計算頻道之頻率變換。舉例而言,可能需要將 任務Τ1121組態成執行每一片段之128點或256點FFT。任務 144218.doc -13· 201032220 ΤΙ 121之替代實施例經組態以使用一組子頻帶濾波器分離 頻道之各種頻率分量。 任務Τ1122針對不同頻率分量(亦稱為「頻率組」)中之 每一者計算(例如,估計)麥克風頻道之相位。舉例而言, 針對待檢驗之每一頻率分量,任務T1122可經組態以將相 位估計為對應FFT係數之虛數項與FFT係數之實數項的比 之反正切(亦被稱作反正切(arctangent))。 任務T102亦包括基於每一頻道之所估計相位而針對不同 頻率刀量中之每一者計算相位差△供的子任務T12〇。任務⑩ Τ120可經組態以藉由自關於一頻道中之彼頻率分量的所估 计相位減去關於另一頻道中之彼頻率分量的所估計相位來 計算相位差。舉例而言,任務T12〇可經組態以藉由自關於 另一(例如,次要)頻道中之彼頻率分量的所估計相位減去 關於主要頻道中之彼頻率分量的所估計相位來計算相位 差。在此情形中,主要頻道可為預期具有最高信雜比之頻 道,諸如,對應於預期在器件之典型使用期間最直接地接 收使用者之語音的麥克風之頻道。 ⑬ 可能需要組態方法Μ100(或經組態以執行此方法之系統 或裝置)以判定在頻率之寬頻範圍中的多頻道信號之頻道 之間的方向—致性。此寬頻範圍可(例如)自0、50、1〇〇或 2〇〇 Ηζ之低頻率界限擴展至3、3.5或4 kHz(或甚至更高,. 諸如巧達7或8 kHz或更大)之高頻率界限。然而,任務 T100可能不必計算跨越信號之整個頻寬的相位差。舉例而 吕’對於此寬頻範圍中之許多頻帶,相位估計可為不切實 144218.doc •14- 201032220
際或不必要的。在極低頻率下之所接收波形之相位關係的 實際評價通常需要轉換器之間的相應的大間距。因此,麥 克風之間的最大可用間距可建立一低頻率界限。另一方 面’麥克風之間的距離不應超過最小波長之一半以便避免 空間映頻混擾(spatial aliasing)。舉例而言,8千赫兹之取 樣率給出0至4千赫茲之頻寬。4 kHz信號之波長為約8.5公 分,因此在此情形中,相鄰麥克風之間的間距不應超過約 4公分。麥克風頻道可經低通濾波’以便移除可能引起空 間映頻混擾之頻率。 可能需要將可預期話音信號(或另一所要信號)跨越其而 方向一致之特定頻率分量或特定頻率範圍作為目標。可預 期,諸如方向雜訊(例如,來自諸如汽車之源)及/或擴散雜 訊之背景雜訊在相同範圍中將不為方向一致的。話音在4 至8千赫茲之範圍中傾向於具有低功率,因此可能需要先 期進行(forego)在至少此範圍中之相位估計。舉例而言, 可能需要在約700赫茲至約2千赫茲之範圍中執行相位估計 並判定方向一致性。 因此,可能需要組態任務T1122以針對少於由任務Tu2i 產生之頻率分量中之全部的頻率分量(例如,針對少於由 任務Τ1121執行之FFT的頻率樣本巾之全部的頻率樣本)計 异相位估計。在一個實例中,任務T1122針對70〇沿至 2〇〇0 Hz之頻率範圍計算相位估計。對於4千赫兹頻寬之信 號之128點FFT’ 700 Hz至2000 Hz之範圍粗略對庫於自第 10個樣本至弟32個樣本的23個頻率樣本。 144218.doc -15- 201032220 基於來自由任務τι00計算出之相位差的資訊任務 計算關於多頻道信號之一致性量測。圖2Α展示任務Τ200 之實施例Τ202(包括子任務Τ21〇)的流程圖。針對自任務 Τ100計算出之複數個相位差中之每一者,任務Τ2ι〇計算對 應方向指示符。 任務Τ210可經組態以將方向指示符中之每一者計算為多 頻道信號之對應頻率分量fi的到達方向Θ"舉例而言,^ 務Τ21〇可經組態以將到達方向⑸古計為量^之反純(亦 稱為反餘弦(arccosine)),其中c表示聲音之速度(約“Ο m/sec),d表示麥克風之間的距離,△外表示兩個麥克風之 對應相位估計之間的弧度差,且^為該等相位估計與之對 應之頻率分量(例如,對應FFT樣本之頻率或㈣子頻帶之 中或邊緣頻率)。或者,任務121〇可經組態以將到達方 向θ,估。十為量之反餘弦’其中义,表示頻率分量fi之波 長。 ' 圖3A展示幾何近似法之實例該實例說明用於估計相對 於-麥克風陣列MC1()、MC2Q之麥克風之到達方向^ 的此途技。在此實例中,h之值=()指示自參考端射方向(亦 P麥克風MC10之方向)到達麥克風MC20之信號,θ·之 值-指示自另-端射方向到達之信號,且之值=π/2指示 + 向到達之信號。在另一實例中,任務Τ2 10可經組 〜 相對於不同參考位置(例如,麥克風MC10或諸如 在^等麥克風之間的中途之點的某-其他點)及/或不同參 144218.doc •16· 201032220 ° (例如,另-端射方向、垂射方向等)之θ;。 :八中所說明之方案可用於咩之正值(例如 兀/2)。圖4展示針對知之負 目至 (例如,自0至-π/2)使用相同 近似法之實例。在此情形巾,可如上文所描述而計 弦以評估角ζ,接著“弧度減去;以得到到達方㈣。對於 僅關注△外之正值(例如,前方端射瓣(f〇r贈d㈣如 lobe))之情形’當△仍為負時可不必計算到達方向^。舉 例而言,可能需要拒斥卸為負之任何分量或以其他方式 將此分量分類為雜訊。執業工程師亦將理解,可替代弧度 而用度或適於特定應用之任何其他單位來表達到達方= θί 0 如上文所提及,可根據如圖3Α及圖4中說明之幾何近似 法來執行對到達方向θί之計算。此近似法假定距離s等於距 離L,其中s為麥克風MC20之位置與麥克風河(:1〇之位置至 聲源與麥克風MC20之間的線上之正交投影之間的距離, φ 且L為每一麥克風與聲源之距離之間的實際差。當相對於 麥克風MC20之到達方向Θ接近於〇時,誤差(S_L)變得較 小。當聲源與麥克風陣列之間的相對距離增加時,此誤差 亦變得較小。 ‘在替代實施例中,任務T210經組態以將方向指示符中之 每一者計算為多頻道信號之對應頻率分量fi的到達時間延 遲1(例如’以秒為單位)。任務T210可經組態以使用諸如 L 或=¾之表達式來估計麥克風MC20處之相對於 麥克風MC10之到達時間延遲〜。在此等實例中,Ti之值=〇 144218.doc -17- 201032220 指示自垂射方向到達之信號’ Ti之大的正值指示自參考端 射方向到達之信號,且Ti之大的負值指示自另—端射方向 到達之信號。對於僅關注△外之正值(例如,前方端射瓣)之 情形’當Μ為負時,可不必計算到達時間延遲V在計算 值1中,可能需要使用被認為適於特定應用之時間單位, 諸如,取樣週期(例如,對於8 kHZ之取樣率的125毫秒之 :位)或秒分率(例*,1〇-3、1〇-4、1〇-5或1〇.6秒)。應注 意’任務T210亦可經組態以藉由使時域中之每—頻道之頻 率分量fi交又相關而計算到達時間延遲h。 對於方向上理想地-致之信號,学之值對於所有頻率而 言等於怪值k’其中k之值與到達方向^及到達時間延遲確 關。在另-替代實施例中,任務T21〇經組態以將方向指示 符中之每一者計算為所估計相位差△外與頻率&之間的曰比〜 (例如…,。對於僅關注·之正值(例如,前方端射瓣Γ; 二‘It 形 % '马員時,可不必計算 , ,. —-J 3應注意,雖然表達式―-feh省根㈣ 場模型(亦即,採用平面波前之模型)計算方向指示符… 但表達式r 、Γ, “ ' ✓>0 >rr 2πί, 及根據近場模 (亦即,採用球面波前之模型)計算方向指示 丨雖然 土於近場模型之方向指示符可提供較正確及/或較易於叶 算之結果,但如上文所述之方向指示符1提供可適用於諸如 振幅控制(例如,增益控制)之應用的相位差之非線性映射 144218.doc •18- 201032220 任務T202亦包括評定由任務T21〇產生之方向指示符之子 任務Τ220。任務Τ220可經組態以藉由針對待檢驗之每一頻 率分量將方向指示符之值轉換或映射至關於振幅、量值或 成功/失敗尺度的對應值而評定方向指示符。舉例而言, #務了220可經組態以使用方向遮蔽函數將每—方向指示符 之值映射至指示所指示方向是否落入遮蔽函數之通帶内 (及/或落入遮蔽函數之通帶内的程度)的遮罩分數。(在此 參’清形中’術語「通帶」指遮蔽函數所通過之到達方向之範 圍。)關於各種頻率分量之遮罩分數集合可視為_向量。 遮蔽函數之通帶可經選擇以包括所要信號方向。遮蔽函 ;之罐擇性可藉由變化通帶之寬度而控制,此可根據 導納範圍(亦即,函數通過之到達方向或時間延遲之範圍) 與雜訊拒斥之間的所要取捨而選擇。雖然寬通帶可允許較 t的使用者行動性及使用靈活性,但亦將_其允許多頻 道信號中之環境雜訊中之較多者傳遞通過至輸出。 • 音訊錢ϋ件通常目持於相對於㈣者之 何形狀(亦即’標準定向中)中。在正常使用期間= =感Μ件可能在相對於所要聲源之4範圍的標準定 佩戴=持二:作。舉例而言,不同使用者可能不同地 佩戴i固括 同一使用者可能在不同時間不同地 佩戴或固持-器件,即使在相同使用週期内(例如,在單 =話呼叫期間)。圖5展示以相對於使用者口部的, 向安裝於使用者之耳部上之耳機的俯視圖二: 耳機之相對於使用者之口部的標準定向範圍中之圖展不在 J靶固中之兩個實例 144218.doc 201032220 之側視圖。可能需要根據標準定向之所要可允許範圍而選 擇遮蔽函數之通帶。舉例而言,在〇度指示陣列最直接指 向使用者之口部的標準定向之情況下,可能需要在耳機應 用中提供正45至負45度之通帶(在正45至負45度之到達方 向之範圍中)。 魯 對於手機而言,可能需要允許比耳機大之標準定向範 圍。舉例而言,在〇度指示陣列最直接指向使用者之口部 的標準定向之情形中’可能需要將用於手機應用之遮蔽函 數組態成具有正90至負90度之通帶。圖7展示手機相對於 使用者口部的標準定向範圍之兩個實例。 方向遮蔽函數可經實施以使得阻帶(st〇pband)與通帶之 間的轉變之位置及/或銳度在操作期間可根據一或多個因 數(諸如,信雜比(SNR)、雜訊底限等)之值而選擇及/或變 化。舉例而言,當SNR低時,可能需要使用較窄之通帶。 ❹ 可能需要根據所要應用來選擇方向遮蔽函數之轉移函 數。為了獲得二元值輸出(例如,針對語音活動偵測應 用),可能需要組態任務T220以使用在通帶與阻帶之間具 有相對突然轉變之遮蔽函數(例如,如圖3Β中所展示的用 於-具有中心在θ=π/4之到達方向處之通帶的遮蔽函數之 碑牆式輪廓)u此種情形中,任務t22g經組態以在 D才曰示符才曰#函數之通帶内之方向時傳回一具有第一值 (例如,1)的料分數,且在方向指示符指示函數之通帶外 之方向時傳回一具有第二值(例如,0)的遮罩分數。 另一方面,為了獲得多值輸出(例如,針對増益控制或 144218.doc •20· 201032220 另振幅控制應用),可能需要組態任務T22〇以使用在通 帶與阻帶之間具有較不突然之轉變(例如,較緩和之滾落) 的迗蔽函數。圖3C展示具有線性滾落及中心在θ=π/4之到 達方向處之通帶的遮蔽函數之實例,且圖3D展示具有非線 性滚落及中心在θ=π/4之到達方向處之通帶的遮蔽函數之 實例。 非線性方向遮蔽函數之一實例可表達為:
1 ®xp y θγ j — 其:θ,表不目標到達方向,你表示遮罩之所要寬度(以弧度 為單位),且γ表不銳度參數。圖8A至圖8d展示對於卜,冰為) 分別等於(8 土 五、、π π、 π π π 、,2,2) (2〇ϋ)、(3〇5,〇)及(50,^)之此函 Δ 〇 2 數的實例。亦可替代方向θ而根據時間延遲τ或比[來表達 此函數。 應注意,對於小的麥克風間距離(例如,1〇cm或更小)及 低頻率(例如,小於丨kHz),卸之可觀測值可受限制。舉 例而5 ,對於200 Hz之頻率分量,對應波長為約17〇 cm。 對於此分I,具有丨公分之麥克風間距離的陣列可觀測僅 約2度之最大相位差(例如,在端射處)。在此情形中,大於 2度之所觀測相位差指示來自一個以上源之信號(例如,一 信號及其回響)。因此,可能需要組態方法M100以偵測所 報告之相位差何時超過最大值(例如,在給定特定麥克風 間距離及頻率之情況下的最大可觀測相位差)。可將此條 144218.doc -21 - 201032220 個此種實例中,當偵測到 之遮罩分數設定為最低遮 件解釋為與單一源不協調。在一 此條件時,將對於對應頻率分量 罩分數(例如,〇)。 對於需要偵測來自特定類型之源的方向上一致之信號之 存在的應用,可能需要根據關於目標信號之其他特性的資 訊來修改方法MHM)。此修改之潛在優勢包括減小搜尋空 間及排除有雜訊資料。舉例而言 用’可能需要根據關於話音信號之 組態方法Ml00。 1對於語音活動偵測應 一或多個特性的資訊而
有聲話音(例如’母音聲(VQWel _nd))之能譜傾向於在 音調頻率之諧波下具有局部峰值。圖9展示此信號之B點 FF 丁的前128個頻率組的振幅,其中用星號指示峰值。另一 方面’背景雜訊之能譜傾向於相對非結構化。因此,可預 期輸入頻道中之在音調頻率之諸波下的分量具有比其他分 量高的信雜比(驗)。料方法M⑽之話音處理應用(例 如,浯音活動偵測應用),可能需要組態任務丁1〇韻如,
組心任務ΤΙ I22)以僅考慮對應於所估計音調頻率之倍數的 相位差。 典型音調頻率處於約70至100 Hz(對於男性講話者)至約 150至200 Hz(對於女性講話者)之範圍中。可藉由將音調週 期計算為相鄰音調峰值之間的距離(例如,在主要麥克風 頻道中)而估計當前音調頻率。彳基於輸人頻道之樣本之 月b量的量測(例如,基於樣本能量與訊框平均能量之間的 比)及/或该樣本之鄰近者與已知音調冑值之類似鄰近者相 144218.doc -22- 201032220 關的程度之量測而將該樣本識別為音調峰值。舉例而言, 在EVRC(增強型可變速率編解碼器)文獻c s〇〇i4c之章節 4.6.3(第4-44頁至第4_49頁)中描述一音調估計程序該2 獻可於線上獲得於www.3gpp_org處。音調頻率之當前估計 (例如,以音調週期或「音調滯後」之估計的形式)通常將 已自包括話音編碼及/或解碼之應用(例如,使用包括音調 估計(諸如,碼激勵線性預測(CELp)及原型波形内插 (PWI))之編解碼器的語音通信)中獲得。 圖10展示將任務T100之(例如,T1122之)此種實施例應 用於頻譜展示於圖9中之信號的實例。虛線指示待考慮之 頻率範圍。在此實例中,該範圍自第1〇頻率組擴展至第% 頻率組(約300至2500 Hz)。藉由僅考慮對應於音調頻率(在 此實例中約190 Hz)之倍數的彼等相位差,待考慮之相位 差的數目自67減少至僅11。此外,可預期,用以計算出此 11個相位差之頻率係數相對於在正考慮之頻率範圍内的其 φ 他頻率係數具有高SNR。在更一般之情形中,亦可考慮其 他信號特性。舉例而言,可能需要組態任務T1122以使得 所計算相位差之至少25%、50%或75%對應於所估計音調 頻率之倍數。相同原理亦可適用於其他所要諧波信號。在 方法Ml 〇〇之相關實施例中,任務T1〇〇經組態以針對多頻 道#號之至少一子頻帶之頻率分量中的每一者計算相位 差,且任務Τ200經組態以僅基於對應於所估計音調頻率之 倍數的彼等相位差而計算一致性量測之值β 共振峰追蹤為可包括於方法Ml 00之實施例中以用於話 144218.doc -23- 201032220 音處理應用(例如,語音活動偵測應用)的另一話音特性相 關程序。共振峰追蹤可使用線性預測性編碼、隱馬爾可夫 模型(HMM)、卡爾曼濾波器(Kalman filter)及/或梅爾倒頻 譜係數(MFCC)而執行。共振峰資訊通常已可自包括話音 編碼及/或解碼(例如,使用線性預測性編碼之語音通信、 使用MFCC及/或之話音辨識應用)之應用中獲得。 任務T202亦包括一基於評定結果計算對於信號之一致性 篁測的子任務T230。舉例而言,任務T23〇可經組態以組合 對應於所關注頻率(例如,在7〇〇至2〇〇〇 Ηζ之範圍中的分 量及/或在音調頻率之倍數下的分量)之各種遮罩分數以獲 得-致性量測。舉例而言,任務T23Q可經組態以藉由對遮 罩分數求平均(例如’ #由對該等遮罩分數求和或藉由使 總和正規化以獲得遮罩分數之平均值)而計算—致性量 測。在此情形中,任務T23〇可經組態以對遮罩分數中之每 -者同等地加權(例如,對每—遮罩分數以i加權)或對一或 多個遮罩分數彼此不同地加權(例如,對於對應於低頻率 或高頻率分量之遮罩分數不如對應於中間範圍頻率分量之 遮罩分數更重地加權)。或者,任務T23Q可馳態以藉由 計,所關注頻率分量(例如,在鳩至繼沿之範圍㈣ 分量及/或在音調頻率之倍數下的分量)之加權值(例如,量 值)的總和而計算一致性量測’纟中每一值係藉由對應遮 罩分數而加權。在此情形中,每一頻率分量之值可自多頻 道"ί§號之'^個頻道(例如,t \ /. 主要頻道)或自兩個頻道獲取(例 如,作為來自每一頻道之對應值的均值)。 144218.doc •24- 201032220 圖2B展不任務丁2〇〇之替代實施例τ2〇4的流程圖。替代 吞平定複數個方向指*符中之每一者,任務Τ2〇4包括一使用 對應方向遮蔽函數%評定每—相位差Δ仍的子任務丁24〇。 舉例而^,對於需要選擇自心至ΘΗ之範圍中之方向到達的 • 一致信號之情形,每一遮蔽函數m〗可經組態以具有在 至I,範圍中的通帶,其中M,=亨峡(相等地, △〜=fC〇吨)且△外,=亨一“相等地,△〜=宁co,。對 參 於需要選擇自對應於乜至τΗ之到達時間延遲之範圍的方向 到達之一致k號的情形,每一遮蔽函數叫可經組態以具有 在卸之範圍中的通帶,其中、=2咖(相等地, 且=2办"(相等地,。對於需要選 擇自對應於1至1^之相位差與頻率比之範圍的方向到達之 致仏號之情形,母一遮蔽函數mi可經組態以具有在 至之範圍中的通帶,其中Δ% =仇且=仇。如上文參 考任務Τ220所論述,可根據所要應用(例如,語音活動偵 ® 測、增益控制等)而選擇每一遮蔽函數之輪廓。 在一些情形中,可能需要在不參考預定到達方向或到達 時間延遲之情況下計算一致性量測。圖2(:展示任務Τ2〇〇之 替代實施例Τ206(包括子任務Τ250)的流程圖。基於由任務 Τ210計异出之方向指示符’任務Τ250計算對於多頻道信號 之一致性量測。任務Τ250可經組態以基於針對各種頻率分 量的方向指示符之當前值之分布而計算一致性量測。在一 個特定實例中,任務Τ250經組態以基於方向指示符之—變 144218.doc -25· 201032220 異數而计算一致性量測。舉例而言,任務Τ2 5 0之此種實施 例可經組態以基於每一方向指示符之平方差的總和與該等 方向指不符之平均值而計算一致性量測。在計算此分布 時’可能需要對一或多個方向指示符彼此不同地加權。舉 例而S ’可能需要對於對應於低頻帶或高頻帶之方向指示 符不如對應於中間範圍頻帶之方向指示符更重地加權。 可月b需要組態任務T23 0或任務T250以將一致性量測產生 為時間上平滑化之值。舉例而言,此任務可經組態以使用 時間平滑化函數(諸如,有限或無限脈衝回應濾波器)而計參 算致性量測。在一個此種實例中,該任務經組態以將一 致性量測產生為最近之m個訊框上之平均值其中瓜之可 成值包括4、5、8、1G、16及2G。在另-此種實例中,該 任務差組態以根據諸如2(”)=〇z卜丨)#_斗(”)(亦稱為一階nR 或遞回濾波器)之表達式而計算對於訊框n之經平滑化之一 則生量測Ζ(η)’其中咖])表示對於前—訊框之經平滑化之 致性量測,c⑻表示一致性量測之當前未平滑化值且^ 為值可係選自〇(無平滑化(無更新)之範圍的平滑化因© 數。平滑化因數α之典型值包括〇」、〇2、〇25、〇3、〇4 及0.5。在初純斂週期„(例如,緊接著音訊錢電路 ,通電或另-啟動),該任務可能需要比在後續穩定狀態 操作期間在更短間隔中或使用更小的平滑化因數α之值來 平滑化一致性量測。 除評估-致性量測之外’可能需要基於來自所計算出之 相位差之資訊而控制多頻道信號之一或多個頻道的一或多 144218.doc -26 · 201032220 個頻率分量之增益(或以其他方式變化多頻道信號之一或 多個頻道的一或多個頻率分量之振幅)。舉例而言,在一 致性量測之值高時可能需要比在一致性量測之值低時向至 少一頻道應用更高的增益。圖11A展示方法Ml 00之實施例 M200(包括任務T200之實施例T300)之流程圖。除如上文所 描述而計算一致性量測之值之外,任務T3〇〇產生一基於所 計算出之相位差及多頻道信號之至少一頻道的經遮蔽信 號。任務Τ300可經組態以根據對應評定結果之值而基於加 權或閘控至少一頻道之頻率分量的結果來產生經遮蔽信 號。舉例而言,任務Τ300可經組態以藉由基於對於所計算 出之相位差的評定結果(例如,遮罩分數)而變化多頻道信 號之一或多個頻道之一或多個頻率分量的振幅來產生經遮 蔽信號。 經遮蔽信號可為單頻道信號或可具有一個以上頻道。對 於複雜值頻率分量而言,變化該分量之振幅可藉由以相同 φ 因數變化該分量之實數值及虛數值或藉由變化該分量之量 值或藉由向該分量應用一增益因數而執行。變化信號之至 ^頻率刀量之振幅亦可藉由在時域_向該信號應用一增 益因數而執行。可線性地或對數地(例如,藉由應用一具 有以刀貝為單位之值的增益因數)執行此等振幅變化操 作。 = 11B展示任扣⑽之實施例T3G2的流程圖1為上文 所娜述之任務T2〇2之實施例的任務丁3〇2包括評定任務 T220之第二例項了麗。可根據本文中所描述之實施例中 144218.doc -27- 201032220 之任者而組態的任務T220b可經組態以使用一與任務 T220之另一例項不同的方向遮蔽函數。任務τ3〇2亦包括任 務Τ310,該任務Τ31〇經組態以藉由基於來自由任務T22〇b 產生之評定結果的資訊來變化多頻道信號之至少一頻道 (例如,主要頻道)之至少一頻率分量的振幅而產生經遮蔽 信號。圖12A展示任務T302之實施例丁3〇21的流程圖,其 中任務T220及T220b係使用任務T220之單一例項而實施。 單一遮蔽任務T 3 10可經組態以將評定結果施加至至少一 頻道之對應頻率分量、至少一頻道之子頻帶或整個頻道。 圖11C展示信號遮蔽任務T310之實施例T312的流程圖,該 實施例Τ3 12藉由對頻率分量之至少一者中之每一者根據對 應於彼頻率刀篁之s平定結果進行加權而向至少一頻道應用 5平定結果。舉例而言,任務T312可經組態以藉由根據諸如 之表達式將遮罩分數作為加權因數施加至多頻道信 號之一頻道之頻率分量中的一些或全部而產生一經遮蔽信 號,其中fi表示第i個頻率分量,Ci表示對應遮罩分數,且 smi表示經遮蔽信號之對應頻率分量。可能需要組態任務 T310以對經遮蔽頻率分量之遮罩分數及/或量值的值外加 較低限制(例如,以避免非活動訊框之過度衰減)。 另外或其他,任務T312可經組態以藉由閘控多頻道信號 之一頻道之頻率分量中的一些或全部而產生經遮蔽信號。
舉例而言,任務T312可經組態以根據諸如〜=|/;,c, >7^0 、[fi,c. >7;] . U,否則 J 或〜,否則f (lb)之表達式產生經遮蔽信號。在此等實例 144218.doc •28· 201032220 中,几表示可針對所 ..^ 頊羊刀量&具有相同值之臨限值。 或者’臨限值Ti可針對頻率 能全部中的每一者而且* 中之兩者或兩者以上及可 ^ 、有—不同值(例如,根據指定頻譜 鄭’堵如’所彳士 唬之預期頻譜輪廓)。量值心之最小振 中田可針對所有頻率分晉 量w、有相同值(例如,〇或某一小的 正值)’或替代地’可針對 紂對頻率分量中之兩者或兩者以上 (可犯全部)中的每一者具有一不同值。
對於少於頻率分量中之全部的頻率分量(例如,僅音調 頻率之倍數)具有對應遮罩分數之情形,任務Τ312可經組 態以藉由複製或内插(例如,線性地内插)而自鄰近分量之 遮罩分數針對其他頻率分量fi計算Ci之值。 可能需要組態任務T310以執行子頻帶遮蔽。舉例而言, 此途裎可幫助消除信號與雜訊之相關性及/或減少雜訊調 變。圖11D展示任務T310之實施例门14的流程圖,該實施 例Τ 3 14將評定結果施加至至少一頻道之一或多個子頻帶以 產生經遮蔽信號。任務Τ314包括任務Τ3142,任務τ3ΐ42 基於來自對應評定結果之資訊而針對一或多個子頻帶中之 每一者(例如,Bark尺度或mel尺度子頻帶之集合中之一或 多者中的每一者)計算子頻帶評定結果。可能需要組態評 定任務T220之對應例項以針對子頻帶中之兩者或兩者以上 (可能全部)中的每一者使用一具有不同通帶寬度及/或滾落 輪廓的方向遮蔽函數《舉例而言,針對低頻率子頻帶可能 需要比針對高頻率子頻帶使用更窄的通帶。 任務T3142可經組態以藉由組合關於子頻帶j之頻率分量 144218.doc -29- 201032220 果而針對該子頻帶計算子頻帶評定結果。舉例而 。’任務T3U2可經組態以藉由對對應於_子頻 分量的所計算出之相位差的評定結果求平均(例如 對該等遮罩分數求和或藉由使總和正規化以獲得遮罩㈣ 2千均值)而計算該子頻帶之子頻帶評定結果。在此情形 中,任務T3U2可經組態以對評定結果中之每一者同等地 加權(例如’對每_遮罩分數以i加權)或使子 結果中的一叆客去^丨l 1〜 &多者(例如,兩者、三者或可能全部)彼此不 參 同地加權。由任務丁助計算之子頻帶評定結果亦可 係對於對應子頻帶之一致性量測。 ❿ 任務τ314亦包括任務T3144,任務τΜ44藉由基於任務 Τ3 142中所計算出之子頻帶評定結果來變化至少一頻道之 至夕頻率分量的振幅而產生一經遮蔽信號。舉例而古, 對於至少-頻道之子頻帶中之一或多者(例如,兩者:三 者或可能全部)中的每_者’任務則4可經組態以根據對 應子頻帶評定結果對子頻帶之頻率分量中之至少一者(可 能全部)中的每一者加權及/或根據對應子頻帶評定結果與 臨限值之間的關係之狀態(例如,根據類似於上文表達式 ⑽或(lb)的表達式)而閘控子頻帶之頻率分量中的至少一 者(可能全部)中之每一者。 其他或另外,任務T3144可經組態以根據由任務丁3]42在 -子頻帶中計算之子頻帶評定結果而對一不同子頻帶之頻 率/刀量中的至少一者中之每一者加權及/或根據臨限值與 由任務Τ3142在一子頻帶上計算出之子頻帶評定結果之間 J442J8.doc -30- 201032220 的關係之狀態(例如,桐媸艇, …、… 於上文表達式⑽或(lb)的 表達式)而閘控一不同子頻帶 ▼I頭率分置中的至少一者中 之每一者。舉例而言,杯欲 務T3 144可經組態以根據由任務 ❹ T3 142在+ i括低頻率分量之子頻帶(例如,中間頻率子 頻帶、高頻率子頻帶或僅包括中間頻率及高頻率分量之子 頻帶)上計算_子頻帶評定結果而對至少—頻道頻率分 量(包括低頻率子頻帶之分量)加權。因為關於所感應多頻 道信號之低頻率分量的相位資訊可因雜訊而發生轨誤,所 以此途徑可幫助消除雜訊與近場所要話音之間的相關性。 任務Τ3144可經组態以藉由基於時域中之子頻㈣定結果 應用增益因數(例如,施加至經配置以變化子頻帶之振幅 之放大器的增益控制輸入)而變化子頻帶之振幅。 圖11Ε展不任務Τ3 10之實施例Τ3丨6的流程圖,該實施例 Τ 3 16藉由基於一致性量測變化至少一頻率分量之振幅而將 評定結果施加至至少一頻道❶任務Τ3丨6包括一致性量測計 算任務T230之例項(例如,根據本文中所描述之實施例中 之任一者)。任務T316亦包括任務T3162,任務T3162藉由 基於一致性量測變化至少一頻道之至少一頻率分量的振幅 而產生一經遮蔽信號。舉例而言,任務T3 162可經組態以 藉由根據一致性量測對至少一頻道之頻率分量中的一或多 者(可能全部)加權及/或藉由根據一致性量測與臨限值之間 的關係之狀態(例如,根據類似於上文表達式(la)或(lb)的 表達式)閘控至少一頻道之頻率分量中的一或多者(可能全 部)而產生經遮蔽信號。任務T3 162可經組態以藉由基於時 144218.doc 31 201032220 域中之一致性量測應用增益因數(例如,施加至經配置以 變化至少一頻道之振幅之放大器的增益控制輸入)而變化 該至少一頻道之振幅。圖12B展示任務T3021之實施例 T3022的流程圖,其中任務T230及T310係藉由任務T316之 一例項而實施。 圖13A展示任務T300之另一實施例T304的流程圖。亦為 上文所論述之任務T204之實施例的任務T304包括評定任務 T240之第二例項。可根據本文中所描述之實施例中之任一 者而組態的任務T240b可經組態以使用一與任務T240之另 一例項不同的方向遮蔽函數。任務T304亦包括信號遮蔽任 務T3 10之一例項,任務T3 10經組態以藉由基於來自由任務 T240b產生之評定結果的資訊來變化多頻道信號之至少一 頻道(例如,主要頻道)之至少一頻率分量的振幅而產生經 遮蔽信號。圖13B展示任務T304之實施例T3041的流程 圖,其中任務T240及T240b係使用任務T240之單一例項而 實施,且圖13C展示任務T3041之實施例T3042的流程圖, 其中任務T23 0及T310係藉由任務T316之一例項而實施。 圖14A展示任務T300之實施例T306的流程圖。亦為任務 T206之實施例的任務T306包括一經組態以基於由任務 T210產生之方向指示符而選擇方向遮蔽函數之任務T260。 任務T260可經組態以基於方向指示符之均值及/或分布而 選擇方向遮蔽函數。舉例而言,任務T260可經組態以將方 向遮蔽函數之一通帶方向選擇為方向指示符中之兩者或兩 者以上(可能全部)的均值及/或根據方向指示符之變異數而 144218.doc -32· 201032220 選擇方向遮蔽函數之通頻寬度及/或輪廓β 任務Τ306亦包括評定任務Τ220之一例項,任務Τ22〇可 根據本文中所描述之實施例中之任一者而組態,經配置以 使用所選擇遮蔽函數來評定方向指示符。任務Τ3〇6亦包括 單一遮蔽任務Τ310之一例項,任務Τ310可根據本文中所描 述之實施例中之任一者而組態,經配置以基於來自由任務 Τ220產生之評定結果的資訊而產生經遮蔽信號。 圖14Β展示任務Τ3 021之相關實施例Τ3〇8(包括任務Τ26〇) 的流程圖,且圖14C展示任務Τ3022之相關實施例丁3〇82的 流程圖。在此等情形中,任務Τ26〇經配置以基於由任務 Τ210產生之方向指示符選擇方向遮蔽函數,且任務T22〇經 配置以使用由任務Τ260選擇之方向遮蔽函數來評定方向指 示符。 了食b耑要組態方法M200以對由任務Τ3 〇〇產生之經遮蔽 信號執行一或多個額外操作。舉例而言,當遮蔽前的信號 粵’位準與遮蔽後的彳舌號位準之間存在大的差時,可能需要衰 減經遮蔽k號’因為此差可指示未經遮蔽之信號之能量中 的多數係歸因於回響及/或干擾。圖15A展示方法厘200之 實施例M210的流程圖。方法M210包括任務T3 50,任務 T3 5 0經組態以在遮蔽後之信號位準與遮蔽前之信號位準之 比值小時衰減經遮蔽信號。 任務T3 50可經組態以根據諸如㈨之表達式而計算 經遮蔽位準與未遮蔽位準之比R(亦即,任務Τ3〇〇產生之經 遮蔽信號之頻率分量的量值之總和與任務Τ3〇〇對其操作之 144218.doc •33· 201032220 未經遮蔽信號之頻率分量的量值之總和之比)。或者,任 務T 3 5 0可經組態以根據諸如Σ, 讨之表達式而計算 R(亦即,兩個信號之頻率分量之能量的總和之間的比)。 任務T350可經組態以在比R小於(或者,不大於)最小比 臨限值η時衰減經遮蔽信號且在不另外進行進一步衰滅的 情況下傳遞經遮蔽信號。此關係可等效地表達為κ<η、 1/Κ>1/η、Μ<η*1^υ>Μ/η(或者,、1/Ry/T1、Μ«υ 或U^M/η),其中U及M分別表示未經遮蔽之位準及經遮蔽 位準,且任務Τ350可經實施以根據任何一或多個此等表達 式來評估該關係。臨限值η之值的實例包括〇 2、〇 25、 0.3 、 0.4 、 0.5 、 0.6及 0.7 。 任務Τ350可經組態以藉由對經遮蔽信號以衰減因數 ε(η)(其中ε(η)具有〇與1之間的值(例如,〇·25、〇 3、〇 4、 0.5、0.6或0.7))加權或藉由自信號減去以分貝為單位之對 應值而衰減經遮蔽信號。舉例而言,任務Τ3 50可經組態以 藉由對經遮蔽信號之每一頻率分量Smi以ε(η)加權、藉由對 時域中之經遮蔽信號以ε(η)加權或藉由將以分貝為單位的 對應增益因數施加至時域或頻域中之信號而衰減經遮蔽信 號。 可能需要組態任務Τ3 50以使用用於最小比臨限值η之一 個以上值與用於衰減因數ε(η)之對應值。舉例而言,任務 Τ350之此種實施例可經組態以連續地使用用於最小比臨限 值η之較大值直至η之當前值大於(或者,不小於)比R為 144218.doc -34· 201032220 止,並使用衰減因數ε(η)之對應值衰減經遮蔽信號,或在 比R不小於(或者’大於)η之值中之最大者的情況下不進行 進一步哀減即傳遞經遮蔽信號。在此情形中可能需要組雜 任務Τ350以在時間上自一個片段至另一片段地平滑化衰減 因數ε(η)之值(例如,以避免經遮蔽信號之位準上的突然且 可能知覺上突兀之改變)》任務Τ350可經組態以藉由延遲 衰減因數ε(η)之值的改變直至已針對指定數目之連續訊框 (例如,2 ' 3、4、5或10個訊框)指示新值為止來執行此平 滑化。此途徑可幫助避免衰減因數ε(η)之值的暫態。或 者,任務Τ350可經組態以根據時間平滑化演算法(例如, FIR或IIR濾波器,諸如,一階nR濾波器)執行此平滑化, 如本文中之相關上下文中所描述。 可能需要基於一致性量測之值修改多頻道信號之至少一 頻道的殘餘背景雜訊頻譜。圖158展示方法M1〇〇之實施例 M120(包括任務T400)的流程圖。任務T4〇〇經組態以基於一 φ 致性量測之值而修改多頻道信號之一或多個頻道的一雜訊 分量之頻譜。在此情形中,術語「雜訊分量」指示並非為 所要資訊信號之多頻道信號的内容。雜訊分量可包括所要 •資訊信號之回響。 任務Τ400可經組態以在一致性量測之值小於(或者,不 大於)指定臨限值的間隔期間修改多頻道信號之一或多個 頻C(諸如主要頻道)的頻譜。此頻譜修改可包括衰減一 或多個頻譜峰值中之每—者處的一或多個頻率分量及/或 提高或多個頻譜谷值中之每一者處的一或多個頻率分 144218.doc •35- 201032220 量。舉例而言,任務T400可經組態以根據所要雜訊頻譜輪 廓(例如,准白色或粉紅色頻譜輪廓)而在此等間隔期間壓 縮或減少信號頻譜。 此雜訊白化可建立殘餘穩定雜訊底限之感覺及/或可導 致雜訊進入至或後退至背景中之知覺。任務丁4〇〇可能需要 包括一平滑化方案(諸如,上文中所描述之時間平滑化方 案)以在不對信號執行此修改之間隔(例如,話音間隔)與執 行頻譜修改之間隔(例如,雜訊間隔)之間平滑化相關頻率 分量之振幅的轉變。可包括使用如上文中所描述之fir或 _ IIR濾波器的此平滑化可幫助支援話音間隔與雜訊間隔之 間的知覺上平滑之轉變。 可能需要計算多頻道信號之雜訊分量之估計(亦稱為 「雜訊參考值」或「雜訊功率參考值」)。舉例而言,雜 訊功率參考信冑可計算為由語音活動制(VAD)操作分類 為非活動之輸入頻道之訊框在時間上之均值。典型環境中 =聲學雜訊可包括混串音雜訊、機場雜訊、街道雜訊、競 爭炎話者的δ吾音及/或來自干擾源(例如,電視機或無線❹ 電)之聲音。此雜訊通常不穩定且可能具有接近於使用者 =之語音之頻譜的平均頻譜。然而’當vad操作僅基於 二頻道時’所得雜訊參考值通常僅為穩定雜訊之近似估 。十二此外’此參考值之計算通常需要雜訊功率估計延遲, 1 = #訊刀4之㈣特性之改變的回應僅可在顯著延遲 由任務T2〇〇產 生之一致性量測可用於支援雜訊參考值之 144218.doc -36 - 201032220 計算,該計算比基於單一頻道VAD信號之雜訊估計更可靠 且同時。圖15C展示方法崖100之實施例馗13〇(包括任務 T500)的流程圖。基於一致性量測之值,任務τ5〇〇計算雜 訊參考值(例如,主要頻道之雜訊分量的估計)。舉例而 言,任務Τ500可經組態以藉由在一致性量測之值小於(或 者’不大於)指定臨限值時基於來自主要頻道之訊框的資 afl更新雜訊估計而計算雜訊估計。
任務T500可經組態以使用時間平滑化函數(諸如,有限 或無限脈衝回應滤波器)而計算雜訊參考值。在一個此種 實例中:任務T5_組態以計算雜訊參考值,使得雜訊參 考值之每涉頁_分量為主要頻道在最近m個非活動訊框上 之對應頻率分量的平均值,其中m之可能值包括2、3、4、 5、8、1〇及16。在另一此種實例中,任務τ遍經組態以根 據諸如之表達式更新雜訊參考值r之每一頻率 刀量h其中^表不^之前—值,qi表示當前非活動訊框之 對應頻率分量,且β急彳古 ρ為值可選自〇(無平滑化)至ι(無更新)之 範圍的平滑化因數。孚、、典 十α化因數β之典型值包括〇1、02、 0.25、0.3、〇.4及 〇 $。户.,, 在初始收斂週期期間(例如,緊接著 曰:感應電路之通電或另一啟動),任務τ则可能需要比 在後續穩疋狀$操作期間以更短間隔或使用更小平滑化因 數β之值來計算雜訊參考值。 應’主意’雜訊參考值中 ^ 可值Τ之頻率分量的數目可不同於多頻 道號中之頻率分量的赵B m ®的數目。舉例而言,任務T500可經實 施以基於子頻帶計算 τ异雜訊參考值。任務T500之此種實施例 144218.doc -37- 201032220 可經組態以針對雜訊訊框之一組子頻帶(例如,h汰尺产 或mel尺度子頻帶)中之每一者計算頻率分量之均值且使用 該均值來更新雜訊參考值之對應子頻帶。 方法M13〇可經實施以使用由任務丁5〇〇產生之雜訊參考 值來對多頻道信號中之-或多個頻道執行頻率相依性振幅 控制操作。方法M130之此種實施例可經組態以藉由(例如) 衰減對應於雜訊參考值中之峰值的分量或子頻帶而修改至 少一頻道之頻譜。圖15D展示方法M13〇之實施例购〇(包 括任務T550)的流程圖。任務乃5〇經組態以使用雜訊參考❹ 值來對多頻道信號中之至少一頻道執行雜訊減少操作。此 雜訊減少操作之-個實例使用雜訊參考值對主要頻道執行 文納(Wiener)濾波操作。此雜.訊減少操作之另一實例使用 雜訊參考值來對主要頻道執行頻譜減法運算(例如,藉由 自主要頻道減去雜訊頻譜)。此雜訊減少操作之另一 ^例 基於雜訊參考值之對應頻率分量的能量而衰減主要頻道之 一或多個頻率分量的增益(例如,藉由將一隨雜訊參考值 之對應頻率分量之能量而增加的增益衰減施加至每一頻率© 分量)。 任務T550可經組態以基於子頻帶執行雜訊減少操作(例 如’頻譜減法或增益衰減操作)。舉例而S,任務T550之 此種實施例可經組態以將-組子頻帶增益衰減施加至主要· 頻道之對應子頻帶應用’該等衰減中之每一者係基於雜訊 參考值之對應子頻帶的能量。當任和5〇對多頻道信號之 僅一個頻道(例如,主要頻道)執行雜訊減少操作時,所得 144218.doc •38- 201032220 操作可認為係利用雙頻道VAD操作之准單頻道雜訊減少演 算法。或者,任務T550可經組態以對多頻道信號執行此雜 訊減少操作(使用單頻道或多頻道雜訊參考值)以產生多頻 道輸出。
方法M100可經實施以基於一致性量測之值而產生一致 性指示,該一致性指示在輸入頻道在方向上一致時具有第 一狀態(例如,高或「丨」)且在輸入頻道在方向上不一致時 具有第二狀態(例如,低或「0」)。此一致性指示可用作語 Θ活動偵測(VAD)信號或旗標,以使得在一致性指示之對 應狀態為第一狀態的情況下將訊框分類為活動(亦即,語 在致险^曰示之對應狀態不為第一狀態的情況下分 ’、為非活動(亦即,雜訊)。舉例而言,如上文中所論述(例 如參考任務T316、T400及T500),可能需要組態方法 M100以根據-致性量測之值與臨限值之間的關係之狀態 而執仃或多個任務。在此情形中’可能需要組態方法 Μ100以產味„杜一 . α 知不—致性量測與臨限值之間的此關係之 狀態的一致性指示。 子於致f生里測之較高值指示較高方向一致性程度的 用,一致性指示可經組態以在-致性量測大於(或者, 小於)臨限值時指示信號—致性。對於_致性量測之較 值指示較高方向—致性程度的應用,一致性指示可經組 、在致!·生量測小於(或者,不大於)臨限值時指示信號 w可^隨時間推移而為固定或可變之臨限值可根據 如i蔽函數之通帶的寬度及方向以及偵測操作之所要敏 144218.doc -39- 201032220 度之因素而選擇。 圖16A展示任務T3 16之實施例T3 164(包括任務T3 166)的 流程圖。任務T3 166包括一基於一致性量測產生一致性指 示之子任務T3168。舉例而言,任務T3168可經組態以使得 一致性指示在一致性量測大於(或者,不小於)臨限值時具 有第一狀態且在一致性量測不大於臨限值時具有第二狀 態。任務T3 166亦包括一基於一致性指示之狀態而變化多 頻道信號之至少一頻道的至少一頻率分量之振幅的子任務 T3169。 舉例而言,方法M100之實施例(包括任務T3164)可經組 態以將一致性指示用作閘控信號,以使得經閘控之信號 (例如,多頻道信號或經遮蔽信號之一或多個頻道)在輸入 頻道在方向上一致時經傳遞且在輸入頻道在方向上不一致 時被阻擋。任務T3 164之此種實施例可經組態以在—致性 指示具有第一狀態時傳遞經閘控之信號的所有子頻帶(曳 者,信號的在選定頻率範圍中之所有子頻帶)。舉例而 言,任務T3 164可經組態以在活動訊框期間傳遞主要頻道 之所有子頻帶(例如,藉由計算一致性指示之邏輯ΑΝ〇及 經閘控信號中之每一位元)。或者,可能需要組態任務 T3164以僅在亦滿足一或多個額外約束之情況下傳遞經閘 控信號之子頻帶。 舉例而言,任務T3 164可經組態以在一致性指示具有第 一狀態時僅傳遞具有足夠高遮罩分數的彼等子頻帶。其他 或另外,任務T3 1 64可經組態以在一致性指示具有第—狀 1442J8.doc • 40- 201032220 態時僅傳遞具有至少等於(或者,不小於)最小能量臨限值 之能量的彼等子頻帶。此臨限值對於每一子頻帶可為相同 的,或對於子頻帶中之兩者或兩者以上(可能全部)中的每 一者可為不同的。此頻帶相依性約束可幫助減小失真。 圖16B展示任務Τ4〇〇之相關實施例T4〇2(包括任務 及子任務Τ404之例項)的流程圖。任務Τ4〇4經組態以基於 一致性指示之狀態而修改多頻道信號之一或多個頻道的一 ❹雜訊分量之頻譜。圖16C展示任務Τ5〇〇之相關實施例 Τ502(包括任務Τ3ΐ68及子任務Τ5〇4之例項)的流程圖。任 務Τ504經組態以基於一致性指示之狀態而計算多頻道信號 之一或多個頻道的一雜訊分量之估計。 時間相依性增盈控制(例如’本文中參考任務Τ3〇〇所描 述之信號遮蔽)可使輸出中之雜訊分量的量值隨時間推移 而變化。舉例而言,時間相依性增益控制可導致在所要講 話者活動之間隔期間比在所要講話者非活動之間隔期間不 φ 成比例地更高量之雜訊的通過。此效應稱為「雜訊閘 控」、「雜訊搭載(ride-in)」或「雜訊調變」。 可能需要組態信號遮蔽任務T3 16以在一致性量測之值指 •示缺乏方向一致性的多頻道信號間隔期間不成比例地衰減 - 一或多個頻道。類似地,可能需要組態信號遮蔽任務T314 以在對應評定結果之值指示缺乏方向一致性的多頻道信號 間隔期間不成比例地衣減一或多個頻率分量及/或子頻 帶。類似地’可能需要組態信號遮蔽任務Τ3丨2以在此等間 隔期間不成比例地哀減一或多個頻率分量。此等途徑可藉 144218.doc -41 - 201032220 由(例如)消除雜訊與近場所要話音之相關性而減少雜訊閘 控。 雜訊搭載在基於雜訊參考值之雜訊減少操作(例如,文 納濾波、頻譜減法或參考(例如)上文之任務T330而描述的 另一頻率相依性增益控制操作)的情況下通常不會觀測 到。因此,可能需要組合(例如,混合)由任務T300產生的 經遮蔽信號與藉由對多頻道信號之至少一頻道執行任務 T400或T5 50之例項而產生的在頻譜上經修改之信號。舉例 而言,可能需要實施方法M200以包括任務T400或T500及 T550的此例項,且產生一為由任務T300產生之經遮蔽信號 與任務T400或T550之輸出信號的均值之輸出信號。方法 M200之此種實施例可經組態以對主要頻道執行任務T300 及T400(或T500及T550)中之每一者並混合該等結果。對於 任務Τ3 00及Τ400或Τ5 50中之每一者產生多頻道輸出(例 如,以用於立體傳輸)之應用,可能需要混合此等輸出以 使得結果之每一頻道為經遮蔽信號的對應頻道與任務Τ400 或Τ55 0之輸出信號之對應頻道的均值。 作為混合任務Τ400或Τ550之輸出與由任務Τ300產生之 經遮蔽信號的替代,可能需要將任務Τ400或Τ550施加至經 遮蔽信號之一或多個頻道。圖17Α展示方法Μ200之此種實 施例Μ220(包括任務Τ400之實施例Τ410)的流程圖,實施例 Τ410經組態以基於一致性量測之值而修改經遮蔽信號之一 或多個頻道的雜訊分量之頻譜。圖17Β展示方法Μ200之相 關實施例Μ230(包括任務Τ500之實施例Τ510)的流程圖,實 144218.doc •42- 201032220 施例T510經組態以基於一致性量測之值而計算經遮蔽信號 之雜訊分量的估計。圖17C展示方法M23〇之相關實施例 M240(包括任務T550之實施例T56〇)的流程圖,實施例 Τ560經組態以基於由任務Τ51〇產生之雜訊估計而對經遮蔽 信號之一或多個頻道執行雜訊減少操作。 些多頻道號處理操作使用來自多頻道信號 调Μ
上頻道的資訊來產生多頻道輸出之每一頻道。此等操作之 實例可包括波束成形及盲源分離(BSS)操作。可能難以整 〇回曰消除與此技術’因為該操作傾向於改變每一輸出頻 道中之殘餘回音。如本文中所描述,方法M100可經實施 以使用來自所計算出之相位差之資訊對多頻道信號之一或 多個頻道⑽如’主要頻道)中的每—者執行單頻道時間相 依性及/或頻率相依性振幅控制(例如,雜訊減少操作卜此 單頻道操作可經實施以使得殘餘㈣料大體上不改變。 因此’回音消除操作與方法編〇之實施例(包括此雜訊減 少刼作)的整合可比回音消除操作與對兩個或兩個以上麥 克風頻道操作之雜訊減少操作的整合更容易。 田聲=與麥克風對之間的相對距離增加時,可預期不同 頻率分量之到達方而夕 運方内之間的一致性降低,
響之增加)。因此,任務Τ2ηΛΛ U ^ 任務T200中所計算出之一致性量測在 ^程度上亦可用作接近量測。舉例而言,不同於僅基於 到:方向之處理操作’如本文中所描述的基於一致性量測 之值的時間相依性及/或頻 於區分使用者或另一所要近:振幅控制可有效地用 有飞另~要近場源之話音與干擾(諸如,在 144218.doc •43· 201032220 相同方向上來自遠場源之競爭性講話者的話音)。方向— 致性隨距離而變小之读i;万向 變J之逮率可視環境而變化。舉例而言 車之内部通常極有回響,以使得 一致性可在距源僅約50 a ”的方向 可靠轉;m准 A刀之範圍内隨時間推移而維持於 :靠:疋之位準下。在此情形中,來自後座乘客之聲音可 致,即使彼講話者定位於方㈣蔽函數之通 t亦此。在此等情況下,對於高的講話者而言,可 1致性之範圍亦可能減小(例如,歸因於來自鄰近頂 板之反射)。 π <視 變化可發生於陣列R⑽之麥克風的製造期間,以使得即 使在批大s生產且表觀上相同之麥克風中,敏感度亦可 ^見麥克風而顯著變化。舉例而言,用於攜帶型暢銷器件 中之麥克風可以敏感度容限加減3分貝而製造以使得器 件之麥克風陣列中之兩個此等麥克風的增益回應可能相差 6分貝之多。 許多多麥克風空間處理操作本質上取決於麥克風頻道之 相對增益回應。在製造期間對麥克風增益回應之校準(其 可能必需啟用此等空間處理操作)通常為耗時及蠘以其他 方式而為昂貴的。’然而’應注意,方法贈0可經實施而 不受輸人頻道之增益之間的不同之影響,使得對應麥克風 之增益回應彼此經校準的程度不為對空間處理方法之效能 (例如,所計算出之相位差之正確性及基於其之後續操作) 的限制因素。 方法M100之實施例亦可經組態以支援各種其他操作, 144218.doc -44 - 201032220 諸如’增益校準操作或空間選擇性處理操作。舉例而言, 可能需要實施方法M100以包括自動增益匹配(AGM)操作。 可假定,若麥克風頻道經適當校準,則其對遠場雜訊之回 應之位準將相等。AGM操作回應於頻道對遠場雜訊之回應 之間的偏差而調整至少一頻道之增益回應。 為了區分遠場間隔與近場間隔(此可能不適於增益匹 配),當前AGM技術通常依賴於頻道之相對位準之比較。 瘳 基於相位之VAD操作(例如,經組態以產生一致性指示的 方法M100之實施例,如本文中所描述)可用於(通常)比當 前技術更快速且更可靠地識別遠場雜訊間隔。遠場雜訊間 隔之正確偵測允許AGM操作更正確地匹配麥克風頻道之增 益。此改良之增益匹配亦可用於較激進地調協基於接近效 應之衰減方案。此等操作之實例之描述揭示於美國臨時專 利申請案第61/24〇,32〇號(代理人案號第〇91561p2號,申請 於2009年9月8日)中。 φ 圖18A展示根據一般組態之裝置A10的方塊圖。裝置A1〇 包括用於針對多頻道信號之複數個不同頻率分量中的每一 者計算該信號之頻道之間的相位差(例如,如本文中參考 任務T100所描述)之構件F1〇〇。裝置A1〇亦包括用於基於來 斤十算出之相位差之資訊計算一致性量測之值(例如, 如本文中參考任務T200所描述)的構件F200,該值指示至 少該複數個不同頻率分量之到達方向之間的一致性程度。 圖1犯展不裝置Α10之實施例Α100的方塊圖。裝置Al00 I括相位差計算器100,該相位差計算器1〇〇經組態以針 144218.doc •45- 201032220 對多頻道信號之複數個不同頻率分量中的每一者計算該信 號之頻道之間的相位差(例如,如本文中參考任務T100所 描述)且為構件F100之實施。裝置A1 〇〇亦包括--致性量 測計算器200,該一致性量測計算器2〇〇經組態以基於來自 所計算出之相位差之資訊計算一致性量測之值(例如,如 本文中參考任務T200所描述)且為構件F2〇〇之實施。 圖18C展示裝置A10之實施例A2〇的方塊圖。裝置A20包 括用於計算一致性量測之值並產生經遮蔽信號(例如,如 本文中參考任務T300所描述)之構件F3〇〇。圖18D展示裝置 A20及A100之實施例A200的方塊圖。裝置A2〇〇包括一經遮 蔽信號產生器300,經遮蔽信號產生器3〇〇經組態以根據來 自一致性量測計算器200之資訊(例如,方向指示符,評定 結果或一致性量測’如本文參考任務T3〇〇所描述)而基於 多頻道信號之至少一頻道產生經遮蔽信號。 圖18Ε展示裝置Α10之實施例Α12的方塊圖。裝置Α12包 括用於修改多頻道信號之至少一頻道之雜訊分量的頻譜 (例如,如本文參考任務Τ400所描述)之構件F4〇〇。圖18F 展示裝置Α12及Α100之實施例Α120的方塊圖。裝置Α120包 括一頻譜修改器400,該頻譜修改器4〇〇經組態以根據指定 雜訊頻譜輪廓而變化多頻道信號之至少一頻道之至少一頻 率分量的振幅(例如,如本文參考任務Τ400所描述)。 圖19Α展示裝置Α100之實施例Α1002的方塊圖。裝置 Α1002包括分別接收多頻道信號之頻道si〇_i及S10-2並執 行FFT操作以將對應頻率分量輸出至相位差計算器1 〇〇的 144218.doc -46- 201032220 FFT模組FFT1及FFT2。圖19B展示裝置A1002及A200之實 施例A2002的方塊圖。裝置A2002亦包括經配置以基於多 頻道信號之主要頻道S10-1產生經遮蔽信號的經遮蔽信號 產生器300。裝置A2002亦包括經組態以執行反向FFT操作 以轉換來自頻域之經遮蔽信號以產生時域信號S20的反向 FFT 模組 IFFT1。 圖20A展示裝置A10之實施例A13的方塊圖。裝置A13包 括用於估計多頻道信號之至少一頻道之雜訊分量(例如, 如本文參考任務Τ500所描述)的構件F500。圖20Β展示裝置 Α13及Α100之實施例Α130的方塊圖。裝置Α130包括經組態 以估計多頻道信號之至少一頻道之雜訊分量(例如,如本 文參考任務Τ500所描述)的雜訊估計器5〇〇。 圖20C展示裝置Α10之實施例Α14的方塊圖。裝置Α14包 括用於基於由構件F500產生之雜訊估計而修改多頻道信號 之至少一頻道之頻譜(例如’如本文參考任務Τ55〇所描述) φ 的構件F550。圊20D展示裝置Α14及Α130之實施例Α140的 方塊圖。裝置A140包括經組態以修改多頻道信號之至少一 頻道之頻譜(例如,如本文參考任務T55〇所描述)的頻譜估 ' 計器550。 ' 圖2犯展示裝置Α14及裝置Α20之實施例Α24的方塊圖。 裝置Α24包括構件F500之用於估計由構件F3〇〇產生之經遮 蔽信號之至少一頻道的雜訊分量(例如,如本文參考任務 T510所描述)的實施例F51〇。裝置A24亦包括構件F55〇之用 於基於由構件F 5 1 〇產生之雜訊估計而修改經遮蔽信號之至 144218.doc -47- 201032220 少一頻道的頻譜(例如,如本文參考任務T56〇所描述)的實 施例F 5 6 0 ° 圖20F展示裝置Al4〇及裝置A2〇〇之實施例A24〇的方塊 圖。裝置A240包括雜訊估計器之實施例51〇,該實施例 5 10經配置以估計由經遮蔽信號產生器3〇〇產生之經遮蔽信 號之至少一頻道的雜訊分量(例如,如本文參考任務τ5ΐ〇 所描述)。裝置Α240包括頻譜估計器55〇之實施例56〇,該 實施例560經組態以基於由雜訊估計器51〇產生之雜訊估計 而修改經遮蔽信號之至少一頻道之頻譜(例如,如本文參 考任務Τ56〇所描述)。 圖21展不裝置Α240之實施例Α2402的方塊圖。裝置 Α2402包括經組態以對多頻道信號之各別頻道si〇1iSl〇_ 4執行FFT操作的四個fFT模組FFT^FFT4。裝置人24〇2亦 包括經遮蔽信號產生器3〇〇之實施例316,該實施例316經 組態以基於主要頻道810_1及由一致性量測計算器2〇〇產生 之致丨生量測而產生經遮蔽信號。舉例而言,經遮蔽信號 產生器3 1 6可實施為經組態以加權或閘控主要頻道s丨〇_工之 至少一頻率分量或子頻帶的增益控制元件(例如,乘法器 或放大器)。可能需要組態經遮蔽信號產生器316以變化主 要頻道S1 0-1之頻率範圍之僅一部分(例如,僅一低頻率子 頻帶’諸如,0至4kHz之頻帶)的振幅。 裝置A2402亦包括經配置以計算頻道S10-1之一雜訊分量 之估計的雜訊估計器500之例項及經配置以基於該雜訊估 計修改經遮蔽信號之頻譜的頻譜修改器56〇之例項。可能 144218.doc -48- 201032220 需要組態頻譜修改器560以在主要頻道之寬於由經遮 蔽信號產生器3 16操作之範圍的頻率範圍中(例如,在整個 頻帶(諸如,〇至8 kHz之頻帶)中)執行雜訊減少操作。裝置 _ A2402亦包括經組態以執行反向FFT操作以轉換來自頻域 之在頻譜上經修改之經遮蔽信號以產生時域信號S2〇的反 向FFT模組IFFT1。 可能需要產生一具有經組態以接收聲學信號的兩個或兩 參 個以上麥克風之陣列R1〇〇的攜帶型音訊感應器件。可經實 施以包括此陣列且可用於音訊記錄及/或語音通信應用之 攜V型音sfl感應器件的實例包括:電話手機(例如,蜂巢 式電話手機);有線或無線耳機(例如,藍芽耳機”掌上型 音訊及/或視訊記錄器;個人媒體播放器,其經組態以記 錄音訊及/或視訊内容;個人數位助理(PDA)或其他掌上型 計算器件;及筆記型電腦、膝上型電腦、筆記本電腦 (netbook computer)或其他攜帶型計算器件。 • 陣列R100之每一麥克風可具有為全向、雙向或單向(例 如,心形曲線)之回應。可用於陣列R1〇〇中之各種類型之 麥克風包括(但不限於)壓電麥克風、動態麥克風及駐極體 麥克風。在用於攜帶型語音通信之器件(諸如,手機或耳 機)中,睁列R剛之相鄰麥克風之間的中心間距通常處於 約以Cm至約4.5⑽的範圍中,但較大間距(例如,高達ι〇 或15在諸如手機之器件中亦係可能的。在助聽器中, 陣歹⑽之相鄰麥克風之間的中心間距可小至約“5 mm P車列R10G之麥克風可沿_條直線配置,或經替代地 144218.doc -49- 201032220 配置以使得其中心位於二維(例如,三角形)或三維形狀之 頂點處。 在夕麥克風音訊感應器件(例如,如本文中所描述之器 件 Dl〇〇、D200、D300、D400、D500、D600、D700 或 D800)之操作期間,陣列R1〇〇產生一多頻道信號,在該多 頻道化號中,母一頻道係基於麥克風中之一對應者對聲學 環衩的回應。一個麥克風可比另__麥克風更直接地接收特 疋聲θ使知對應頻道彼此不同以共同提供比可使用單一 麥克風所擷取者更完整的聲學環境表示。 陣列R100可能需要對由麥克風產生之信號執行一或多個 處理操作以產生多頻道信號S10。圖22A展示陣列R100之 包括經組態以執行一或多個此等操作之音訊預處理級Αρι〇 的實施例R200之方塊圖,該等操作可包括(但不限於)阻抗 匹配、類比至數位轉換、增益控制及/或類比及/或數位域 中之濾波。 圖22B展示陣列R200之實施例R21〇的方塊圖。陣列R2i〇 包括音訊預處理級AP10之實施例AP20,該實施例aP2〇包 括類比預處理級PlOa及Pl〇b。在一個實例中,級pi〇a及
Pl〇b各自經組態以對對應麥克風信號執行高通濾波操作 (例如’以50、100或200 Hz之截止頻率 陣列R100可能需要產生多頻道信號作為數位信號,亦 即,作為樣本序列。舉例而言,陣列R21 〇包括各自經配置 以對對應類比頻道進行取樣之類比至數位轉換器 (ADC)ClOa及ClOb。聲學應用之典型取樣率包括8 kHz、 1442l8.doc -50· 201032220 12 kHz、16 kHz及在約8至約16 kH2^範圍中的其他 率,但亦可使用高達約44 kHz之取樣 , ,, 你此符疋實例 中,陣歹mi〇亦包括各自經組態以對對應經數位化之頻道 執行一或多個預處理操作(例如,回音消除、雜訊減少2 或頻譜整形)的數位預處理級P2〇a&p2〇b。 應明確注意,陣列R100之麥克風可更通常地實施為除對 聲音敏感之外亦對輻射或發射敏感的轉換器。在一個此實 ❿例中,陣列謂〇之麥克風實施為超音波轉換器(例如,對 大於15、20、25、30、40或5〇千赫兹或更大之聲學頻率敏 感的轉換器)。 圖23A展示根據一般組態之器件⑽的方塊圖。器件⑽ 包括本文所揭示之麥克風陣列尺1〇〇之實施例中之任—者的 例項,且本文所揭示之音訊感應器件中的任一者可實施為 器件⑽之例項。器件D10亦包括經組態以處理由陣列 R1 〇〇產生之多頻道信號以計算一致性量測之值的裝置Μ〇 ❿之實施例之例項。舉例而言,裝置Α1〇可經組態以根據本 文所揭示之方法Μ100之實施例中的任一者之例項而處理 多頻道音訊信號。裝置Α10可以硬體及/或以軟體(例如, 動體)實施。舉例而言’裝置Α10可實施於器件D10之處理 器上,該處理器亦經組態以對經處理之多頻道信號執行如 上文所描述之空間處理操作(例如,判定音訊感應器件與 特定聲源之間的距離、減少雜訊、增強自特定方向到達之 信號分量及/或分離一或多個聲音分量與其他環境聲音的 一或多個操作)。 144218.doc 51 201032220 圖23B展不為器件Dl〇之實施例之通信器件D2〇的方塊 圖。器件D20包括-包括裝置A1〇之晶片或晶片組csi〇(例 如,行動台數據機(MSM)晶片組)。晶片/晶片組csl〇可包 括可經組態以執行裝置A1〇之全部或部分(例如,作為指 令)的一或多個處理器。晶片/晶片組csl〇亦可包括陣列 R100之處理元件(例如,音訊預處理級Αρι〇之元件卜晶片/ 晶片組CS1〇包括:一接收器,其經組態以接收射頻(RF)通 信信號且解碼並再現該尺1?信號内所編碼之音訊信號;及一 傳輸器,其經組態以編碼一基於由裝置A1〇產生之經處理 之信號的音訊信號且傳輸一描述該經編碼之音訊信號的rf 通信信號。舉例而言,晶片/晶片組CS10中之一或多個處 理器可經組態以對多頻道信號之一或多個頻道執行如上文 所描述之雜訊減少操作,以使得該經編碼之音訊信號係基 於雜訊經減少之信號。 器件D20經組態以經由天線C3〇接收並傳輸rf通信信 號。器件D20亦可在至天線C3〇之路徑中包括一雙訊器及 一或多個功率放大器。晶片/晶片組csl〇亦經組態以經由 小鍵盤C 1 0接收使用者輸入並經由顯示器顯示資訊。 在此實例中,器件D20亦包括一或多個天線C4〇以支援全 球定位系統(GPS)定位服務及/或與諸如無線(例如,
BlUet〇〇thTM)耳機之外部器件的短程通信。在另一實例 中,此通信器件自身為藍芽耳機且不具有小鍵盤c1〇、顯 示器C20及天線C30。 如本文所描述之裝置A1〇之實施例可實施於包括耳機及 144218.doc •52· 201032220 手機的各種音訊感應器件中。手機實施例之一個實例包括 陣列R100之前面(front-facing)雙麥克風實施例,該陣列 R1 00在麥克風之間具有6.5公分之間距。雙麥克風遮蔽途 徑之實施例可包括以光譜圖直接分析麥克風對之相位關係 及遮蔽來自非所要方向之時間-頻率點。 圖24A至圖24D展示器件D10之多麥克風攜帶型音訊感應 實施例D100的各種視圖。器件D100為一包括承載陣列 R100之二麥克風實施例的外殼Z10及自該外殼延伸之收聽 器Z20的無線耳機。此器件可經組態以經由與諸如蜂巢式 電話手機之電話器件的通信(例如,使用由Bluetooth Special Interest Group, Inc·, Bellevue,WA 發布之 BluetoothTM協定之一版本)而支援半雙工或全雙工電話。 通常,耳機之外殼可為長方形或以其他方式狹長的(如圖 24A、圖24B及圖24D中所展示(例如,如微型支架之形狀)) 或可為較圓或甚至為圓形的。該外殼亦可封閉一電池及一 處理器及/或另一處理電路(例如,印刷電路板及安裝於其 上之組件)且可包括一電埠(例如,一微型通用串列匯流排 (USB)或用於電池充電之另一埠)及諸如一或多個按鈕開關 及/或LED之使用者介面特徵。通常,外殼之沿其主軸線之 長度在1至3英吋的範圍中。 通常,陣列R100之每一麥克風安裝於器件内於外殼中之 充當聲埠的一或多個小孔後面。圖24B至圖24D展示用於 器件D100之陣列之主要麥克風的‘埠Z40及用於器件D100 之陣列之次要麥克風的聲埠Z50之位置。 144218.doc -53· 201032220 耳機亦可包括一通常可自該耳機拆卸的緊固器件,諸 如,耳鉤Z30。舉例而言,外部耳鉤可為可逆的,以允許 使用者組態耳機以使用於任一耳上。或者,耳機之收聽器 可設計為可包括一可移除聽筒以允許不同使用者使用不同 大小(例如,直徑)的聽筒以更佳地適於特定使用者之耳道 之外部部分的内部緊固器件(例如,耳塞)。 圖25 A至圖25D展示器件D10之多麥克風攜帶型音訊感應 實施例D200的各種視圖,該實施例D200為無線耳機之另 一實例。器件D200包括一經整圓之橢圓形外殼Z12及一可 組態為耳塞之收聽器Z22。圖25A至圖25D亦展示用於器件 D200之陣列之主要麥克風的聲埠Z42及用於其次要麥克風 之聲埠Z52的位置。次要麥克風埠Z52可至少部分地閉塞 (例如,藉由使用者介面按紐)係可能的。 圖26A展示器件D10之多麥克風攜帶型音訊感應實施例 D300之橫截面圖(沿一中心軸線),該實施例D300為通信手 機。器件D300包括具有主要麥克風MC 10及次要麥克風 MC20的陣歹iJRIOO之實施例。在此實例中,器件D300亦包 括主要擴音器SP10及次要擴音器SP20。此器件可經組態以 經由一或多個編碼及解碼方案(亦被稱為「編解碼器」)而 無線地傳輸並接收語音通信資料。此等編解碼器之實例包 括:增強型可變速率編解碼器,如題為「Enhanced Variable Rate Codec, Speech Service Options 3, 68, and 70 for Wideband Spread Spectrum Digital Systems」(2007年 2 月)之第三代合作夥伴計劃2(3GPP2)文獻C.S0014-C, 144218.doc -54- 201032220 vl.0(可在線獲得於www.3gpp.org處)中所描述;可選模式 聲碼器話音編解碼器,如題為「Selectable Mode Vocoder (SMV) Service Option for Wideband Spread Spectrum Communication Systems」(2004 年 1 月)之 3GPP2 文獻 C.S0030-0,ν3·0(可在線獲得於www.3gpp.org處).中所描 述;適應性多速率(AMR)話音編解碼器,如文獻ETSI TS 126 092 V6.0.0(歐洲電信標準協會(ETSI),Sophia Antipolis Cedex,FR ’ 2004 年 12月)中所描述;及 AMR 寬頻 話音編解碼器’如文獻ETSI TS 126 192 V6.0.0(ETSI, 2004年12月)中所描述。在圖26A之實例中,手機D300為蛤 殼型蜂巢式電話手機(亦稱為「翻蓋」手機此多麥克風 通信手機之其他組態包括直板型及滑蓋型電話手機。圖 26B展示器件D300之實施例D3 1 0之橫截面圖,該實施例 D310包括包括第三麥克風MC30的陣列R100之三麥克風實 施例。 圖2 7A展示器件D10之多麥克風撲帶型音訊感應實施例 D400的圖’該實施例D400為一媒體播放器。此器件可經 組態以播放經壓縮之音訊或視聽資訊,諸如,根據標準壓 縮格式編碼之檔案或流(例如,動畫專家組(MPEG)-1音訊 層3(MP3)、MPEG-4第14部分(MP4)、視窗媒體音訊/視訊 版本(WMA/WMV)(Microsoft Corp” Redmond, WA)、高級 音訊編碼(AAC)、國際電信聯盟(ιτυ)-Τ H.264或其類似 者)。器件D400包括安置於器件之前面的顯示螢幕SC10及 擴音器SP10,及安置於器件之相同面處的陣列ri 〇〇之麥克 144218.doc -55- 201032220 風MC10及MC20(例如,安置於頂面之相對側上(如在此實 例中)或安置於前面之相對側上)。圖27B展示器件D400之 另一實施例D410 ’其中麥克風MC10及MC20安置於器件之 相對面上;且圖27C展示器件D400之另一實施例D420,其 中麥克風MC10及MC20安置於器件之相鄰面上。媒體播放 器亦可經設計以使得較長軸線在所欲使用期間為水平的。 圖28A展示器件D10之多麥克風攜帶型音訊感應實施例 D500的圖,該實施例D5〇〇為一免持車載裝置。此器件可 經組態以安裝於車輛之儀錶板、風檔、後視鏡、遮光板或 另一内部表面中或上或可移除地固定至車輛之儀錶板、風 擋、後視鏡、遮光板或另一内部表面。器件D5〇〇包括一擴 音器85及陣列R1 〇〇之實施例。在此特定實例中,器件 D500將陣列R100之實施例R1〇2包括為以線性陣列配置之 四個麥克風 此器件可經組態以經由一或多個編解碼器 (諸如上文列舉之實例)而無線地傳輸並接收語音通信資 料。其他或另外,此器件可經組態以經由與諸如蜂巢式電 話手機之電話器件的通信(例如,使用如上文所描述之 Bluetooth™協定之一版本)而支援半雙工或全雙工電話。 訊感應實施例 圖28B展示器件D10之多麥克風攜帶型音 D_的圖,該實施例D600為一撰寫器件(例如,鋼筆(㈣ 或鉛筆(pencii))。器件D600包括陣列尺1〇〇之實施例。此器 件可經組態以經由一或多個編解碼器(諸如上文列舉之實 例)而無線地傳輸並接收語音通信資料。其他或另外,此 器件可經組態讀由與諸如蜂以電話手似/或無線耳 144218.doc -56- 201032220 機之器件的通信(例如,使用如上文所描述之Bluetooth™ 協定之一版本)而支援半雙工或全雙工電話。器件D600可 包括經組態以執行空間選擇性處理操作以降低由陣列R100 產生之信號中的刮擦雜訊82之位準,刮擦雜訊82可由於器 件D600之尖端跨越繪製表面81(例如,一張紙)之移動而產 生。 攜帶型計算器件之種類當前包括具有諸如以下各者之名 稱的器件:膝上型電腦、筆記型電腦、筆記本電腦、超攜 帶型電腦、平板型電腦、行動網際網路器件、智慧筆電 (smartbook)或智慧電話。此等器件通常具有一包括一顯示 螢幕之頂板及一可包括一鍵盤之底板,其中該兩個板可以 蛤殼或另一鉸接關係連接。 圖29A展示器件D10之此種實施例D700之實例的前視 圖,該實施例D700包括以線性陣列配置於顯示螢幕SC 1 0 上之頂板PL10上的四個麥克風MC10、MC20、MC30、 MC40。圖29B展示頂板PL10之俯視圖,該圖以另一維度展 示該四個麥克風之位置。圖29C展示此攜帶型計算器件 D710之另一實例的前視圖,該實例包括以非線性陣列配置 於顯示螢幕SC10上之頂板PL12上的四個麥克風MC 10、 MC20、MC3 0、MC40。圖29D展示頂板PL12之俯視圖,該 圖以另一維度展示該四個麥克風之位置,其中麥克風 MC10、MC20及MC30安置於該板之前面且麥克風MC40安 置於該板之背面。 圖30展示用於掌上型應用之器件D10之多麥克風攜帶型 144218.doc -57- 201032220 音訊感應實施例D800的圓。器件D800包括一觸控螢幕顯 示器TS10 '三個前部麥克風MC10至MC30、一背部麥克風 MC40、兩個擴音器SP10ASP20、一左側使用者介面控制 器(例如,用於選擇)UI10及一右側使用者介面控制器(例 匆,用於導覽)UI20。該等使用者介面控制器中之每一者 可使用以下各者中之一或多者來實施:按鈕、軌跡球、點 按式選盤、觸控板、操縱桿及/或其他指標器件等。可在 瀏覽-談話模式或玩遊戲模式下使用之器件D8〇〇之典型大 小為約15公分乘20公分。明確揭示,本文中所揭示之系參 統、方法及裝置之可應用性並不限於圖24A至圖3〇中所展 示之特定實例。此等系統、方法及裝置可應用於之攜帶型 音訊感應器件之其他實例包括助聽器。 可能需要將方法M100擴展至處理一個以上多頻道信 號。舉例而言,如下文參考該等實例所論述,方法mi〇〇 的經擴展之實施例M300可用於支援僅使用一個麥克風對 可能不可獲得之操作。 圖31A展示方&M300之流程圖,該方法M3〇〇包括任務 _ T100之基於第一多頻道信號計算第一複數個相位差的第— 例項Tl〇〇a及任務T100之基於第二多頻道信號計算第二複 數個相位差的第二例項丁1〇〇b。方法Μ3〇〇亦可經實施以包 括任務Τ100之經組態以基於各別額外多頻道信號計算額外 - 複數個相位差的額外例項。方法Μ300亦包括基於來自第 一及第二(且可能其他)複數個相位差的資訊計算一致性量 測之值的任務Τ280。 144218.doc -58- 201032220 圖31B展示任務T280之實施例T288的流程圖。任務T288 包括任務T200之基於來自第一複數個相位差的資訊計算第 --致性量測之值的第一例項T200a。任務T288亦包括任 務T200之基於來自第二複數個相位差的資訊計算第二一致 性量測之值的第二例項T200b。任務T288亦可經實施以包 括任務T200之經組態以基於自各別額外多頻道信號所計算 之相位差計算額外一致性量測之值的額外例項。 任務T288亦包括一組合分量一致性量測(在此實例中為 ® 第一及第二一致性量測)之值以獲得複合一致性量測之值 的任務T6 1 0。舉例而言,任務T6 1 0可經組態以基於分量一 致性量測之結果(product)計算複合一致性量測。對於分量 一致性量測之值為二元(例如,如上文所描述之一致性指 示)的情形,此結果可使用邏輯AND操作來計算。 圖31(:展示任務丁280及任務丁202之實施例丁282的流程 圖。任務T282包括任務T210之經配置以針對由任務TIOOa _ 計算出之第一複數個相位差中的每一者計算對應方向指示 符的第一例項T2 10a及任務T220之經配置以評定方向指示 符以產生第一評定結果集合(例如,遮罩分數之第一向量) • 的第一例項T220a。任務T282亦包括任務T2 10之經配置以 針對由任務TIOOb計算出之第二複數個相位差中的每一者 計算對應方向指示符的至少一第二例項T210b及任務T220 之經配置以評定方向指示符以產生第二評定結果集合(例 如,遮罩分數之第二向量)的對應第二例項T220b。 任務T282亦包括經組態以合併第一及第二(且可能額外) 144218.doc -59- 201032220 評定結果集合以產生經合併之評定結果集合的任務T620及 經配置以基於經合併之評定結果集合計算一致性量測之值 (例如,作為如由經合併之評定結果集合加權之所關注頻 率分量的值之總和)的任務T230之例項。任務T620可經組 態以藉由將經合併之集合的每一評定結果計算為來自任務 T220之各種例項之對應評定結果的均值(例如,平均值)而 合併該等評定結果集合。或者,任務T620可經組態以藉由 將經合併之集合的每一評定結果計算為來自任務T220之各 種例項之對應評定結果中的最小值而合併該等評定結果集 合。對於二元值評定結果,任務T620可經組態以藉由將經 合併之集合的每一評定結果計算為來自任務T220之各種例 項之對應評定結果的邏輯AND而合併該等評定結果集合。 在一個此種實例中,任務T220a產生一對應於在200至 1000赫茲之範圍中之頻率分量的評定結果集合,且任務 T220b產生一對應於在500至2000赫茲之範圍中之頻率分量 的評定結果集合。在此實例中,任務T620可經組態以產生 一對應於在200至2000赫茲之範圍中之頻率分量的經合併 評定結果集合,使得對於200至500赫茲之範圍的每一經合 併之評定結果為由任務T220a產生之對應評定結果(亦即, 其自身之均值),對於1000至2000赫茲之範圍的每一經合 併之評定結果為由任務T220b產生之對應評定結果,且對 於500至1000赫茲之範圍的每一經合併之評定結果為由任 務T220a及T220b產生之對應評定結果的平均值。 圖32A展示任務T280及任務T204之實施例T284的流程 144218.doc •60· 201032220 圖。任務T284包括:任務T240之第一例項T240a,其經配 置以使用對應遮蔽函數評定由任務T10〇a計算出之第一複 數個相位差中的每一者;任務T240之第二例項T240b,其 經配置以使用對應遮蔽函數評定由任務T1 〇〇b計算出之第 一複數個相位差中的每一者;及任務T240之可能額外例 項,其經配置以評定由任務T100之各別額外例項計算出之 複數個相位差。任務T284亦包括經配置以合併第一及第二 ❷ (及可此額外)評定結果集合以產生經合併乏評定結果集合 的任務T 6 2 0之例項及經配置以基於經合併之評定結果計算 一致性量測之值的任務T23〇之例項。 圖32B展示任務T280及任務T206之實施例T286的流程 圖。任務T286包括任務T210之經配置以針對由任務丁1〇〇 之每一例項計算出的複數個相位差計算對應複數個方向指 示付之至少第一例項Τ2 10a及第二例項Τ21 Ob。任務Τ286亦 包括:任務T250之至少第一例項丁25〇&及第二例項T25〇b, # 其經配置以針對該複數個方向指示符中之每一者計算對應 一致性量測;任務T610之例項,其經配置以組合分量一致 性量測之值以獲得複合一致性量測之值。 方法M300之應用的一個實例為計算一基於在比使用單 一麥克風對可觀測之頻率範圍寬的頻率範圍上之相位差的 致性量測。如上文中提及,可在其中可靠計算出相位差 之頻率範圍自上可受空間映頻混擾限制,且自下可受最大 可觀測相位差限制。因此,可能需要應用方法M3〇〇以基 於根據自-個以上麥克風對記錄之信號所計算出的相位差 144218.doc 201032220 而計算一致性量測。任務T200之各別例項可經組態以使用 相同方向遮蔽函數,或各別遮蔽函數之通帶及/或輪廓可 根據正被每一例項作為目標之頻率範圍而不同。舉例而 言’可能需要針對任務Τ200之對應於較低頻率範圍的例項 而使用較窄之通帶。 圖3 2C展示包括三個麥克風MC10 ❹ R100之多對實施例的一個實例。在此實例中,第一多頻道 信號係基於由麥克風MC10及MC20記錄之信號,且第二多 頻道信號係基於由麥克風Mcl〇&MC3〇記錄之信號。因為 麥克風MC10與MC2〇之間的距離小於麥克風河匸1〇與 之間的距離,所以第一多頻道信號可用於計算比第二多頻 道信號高的頻率下之相位差,且第二多頻道信號可用於計 算比第一多頻道信號低的頻率下之相位差。方法Μ则之 實施例可用於處理兩個多頻道信號以獲得_指示在比可單 獨由任-麥克風對可靠支援之頻率範圍大的頻率範圍中之 方向一致性之程度的複合—致性量測。 參 圖32C展示線性麥克風陣 只要考慮到麥克風對 使用非線性配置, 為圖以之陣財之兩對所=向即可°衫麥克風卿 麥克風之對獲得第一及坌_ 自不具有共有 及第二多頻道信號。 到達陣列之兩個麥 地對應於相對於該陣 刀置疋間的相位差理想 彼轴線之某-參考點處:^線的特定角(該角之頂點在沿 心或該等麥克風之間的等麥克風中之-者的中 中點)。因此,自相對於陣列在空 144218.doc -62- 201032220 處於不同位置處但滿足相對於車 的诉d 千幻釉線之相同角關係 :原(例如,圖33A中之源⑴)所接收之相等頻率之分量 將理想地具有相同相位差。 方向遮蔽函數通常定義於包括麥克風陣列之轴線的半平 刚度之空間範圍上^以使得該函數之回應在 4列軸線周圍的空間中粗略地對K在實際意義上, ^對稱之程度可受諸如以下各者之因素限制:麥克風之回 應中之方向性、來自器件之一或多個表面之反射、麥克風 :對於特定源方向之閉塞,#。)當預期來自所要源之聲 音自端射方向到達(如在圖3犯之實例中)時,遮蔽函數之 此對稱可為可接受的或甚至為需要的。然@,當遮蔽函數 之通帶經組態以看起來處於垂射方向甲(如在圖33c之實例 中)時,可能需要區分自軸線之一側(例如,器件之前側)到 達的聲音與自轴線之另一側(例如’器件之背側)到達的聲 音0 ❹ 方法M300之應用的另一實例為以一個以上維度及/或在 器件之一個以上面上提供方向選擇性。圖33D展示兩個麥 克風MC30及MC40已添加至圖33C之陣列的此種實例。在 此情形中,方法M300經組態以將如圖33C中所展示之垂射 方向之遮蔽函數施加至基於來自麥克風^1€1〇及河(:2〇之信 號的第一多頻道信號、將如圖3 3D中所展示之端射方向之 遮蔽函數施加至基於來自麥克風]^(:3〇及]^〇:4〇之信號的第 一多頻道信號且產生一指示在兩個遮蔽函數之通帶的空間 中之相交部分上的一致性之程度的一致性量測。在此配置 144218.doc •63- 201032220 之典型使用中,麥克風MC10、MC20及MC30定位於器件 之前面(亦即,面向使用者)’麥克風MC40定位於器件之背 面’且方法M300操作以指示相對於器件前部處之所要覆 蓋區域(例如,接近錐形)的一致性。 圖34A展示可用於攜帶型音訊感應器件中之三麥克風陣 列之一般實例。在此情形中,方法M300可經組態以將第 一遮蔽函數施加至來自麥克風MCI 0及MC20之頻道以辨別 左右方向中(亦即,xy平面中)之角,且將第二遮蔽函數施 加至麥克風MC10及MC30之頻道以辨別上下方向中(亦 即,yz平面中)之角。方法M300之此種實施例可經組態以 組合來自此兩個複合遮蔽函數之結果,以指示相對於三維 體積中之選定方向範圍(其可認為係錐形覆蓋)的一致性。 在此應用之另一實例中,將複合遮蔽函數中之每一者施加 至具有四個或四個以上麥克風之陣列中之不同麥克風對的 頻道。 圖34B展不可用於攜帶型音訊感應器件中之三麥克風陣 列之應用的另一實例。在此情形中,方法厘3〇〇可經組態 以將第一遮蔽函數施加至麥克風河(:1〇及厘(::2〇之頻道以辨 別左右方向中之备,日胲埜-i .
複合遮蔽函數中之每一 P〜Λ® /73 <力一 I例宁,將 者施加至具有四個或四個以上麥克 144218.doc -64 - 201032220 風之陣列中之不同麥克風對的頻道。用於此應用之四麥克 風。來自前向麥克風中之麥克風集合及一背向麥克 位晋銘圖…號可用於覆蓋-使用者 且來自另-前向麥克風及該背向麥克風的 ^於辨別自前方到達之信號與自後方到達之信號。舉例 而S ’在圖34C中,麥克風MC20及MC40之頻道可用於 右辨別。 '
在四麥克風㈣之另_#财,麥克風粗略地以四面體 之組態配置,使得—個麥克風定位於頂點由間隔開約3公 分之其他三個麥克風之位置界定的三角形後面(例如,約 在後面1公分)。此陣列之潛在應用包括在揚聲器電話模式 下操作之手機’對此而t,講話者之口部與陣列之間的預 期距離為約20至30公分。圖35A展示手機〇3〇〇之實施例 D320的前視圖,其包括粗略地以四面體之組態配置之四個 麥克風MC10、MC2〇、MCSO、MCM0。圖LB展示手機 D320之側視圖’其展示麥克風Mcl〇、mC2〇、MC3(^ MC40在手機内之位置。 用於手機應用之四麥克風陣列的另一實例包括在手機前 面(例如,靠近小鍵盤之1、7及9位置)之三個麥克風及在背 面(例如’在小鍵盤之7或9位置後面)之一個麥克風。圖 35C展示手機D300之實施例D330的前視圖,其包括以「星 形」組態配置之四個麥克風MC10、MC20、MC30、 MC40。圖35D展示手機D330之側視圖,其展示麥克風 MC10、MC20、MC30及MC40在手機内之位置。 144218.doc •65· 201032220 :於-些應用’所要聲音(例如,使用者之 ^向的預期範圍通常限㈣相對窄之範圍。在此達 =寻足 =耳機或手機應用)中,單-方向遮蔽函數 圍^包括對應維度㈣所要聲音之預_達方向範 = = : =足夠高之信雜~寬2 双往h號之可靠偵測(例如,蕤 的雜訊源產生之頻率分量)。3斥由可允許範圍之外 範:二對:其他應用’具有寬得足以包括所要到達方向 心圍料-遮蔽函數可能導㈣多雜訊以致不 I可靠地區分寬頻—致性信號與干擾。舉例而言,諸如膝 =電腦、智慧電話及新興器件(諸如動(行動網際網路 之許多消費型器件支援一定範圍之不同使用者介面 W且在給定情況下可能沒必要清楚使用者正自哪一方 向4活。此等器件通常具有較大顯示榮幕且可允許廣泛範 圍之可能麥克風置放及同時麥克風信號擷取。舉例而言, 劉覽"炎s舌」模式下’使用者可注視顯示螢幕,同時經 由:見訊鏈路聊天或進行通話。因為在此模式期間使用者之 邛通常疋位於距麥克風較遠’所以維持愉快的通信經歷 可涉及實質話音增強處理。 對於典型膝上型電腦《筆記本電腦或免持車載裝置應 用’可能需要允許廣泛範圍之可能講話者位置,諸如,達 度之可允許到達方向範圍。舉例而言,可預期,使用 者可能在使用期間在攜帶型計算器件D7〇〇或d7丨〇之前部 自側移動至另一側、朝向器件及遠離該器件移動,及/ 144218.doc -66 - 201032220 或甚至在該器件周圍(例如,自該器件之前部至背部)移 動。對於其他應用(例如,會議),可能需要允許甚至更大 範圍之可能講話者位置。 . 遺$地’具有廣泛導納範圍之遮蔽函it亦可能自雜訊源 冑遞聲音。雖然放寬遮蔽函數之導㈣可允許較大範圍之 、方向但此放寬亦可降低該方法區分在所要頻率範圍 中方向-致之信號與背景雜訊的能力。對於使用兩個或兩 ❹㈣以上麥克風提供寬導納角之應用(例如,車載裝置或膝 上型電腦或筆記本電腦應用),可能需要使用多個方向遮 蔽函數將所要導納角劃分成對應扇區,其中每一扇區經定 義為對應遮蔽函數之通帶。 為了達成此所要講話者定位及/或聲音之空間辨別,可 能需要在麥克風陣列周圍之不同方向令產生窄的空間扇區 以便正確地判定聲源(例如,使用者)之位置。在具有兩個 麥克風之情況下,相對窄之扇區通常僅可產生於端射方向 Φ 巾,而垂射扇區通常寬得多。然而,在具有三個、四個或 更多麥克風之情況下,較窄扇區通常在所有方向中係可能 可能需要設計相鄰扇區之間的重疊(例如,以確保所要 講話者移動之連續性、支援較平滑之轉變及/或降低抖 動)。圖36A展示寬導納角(跨越麥克風⑽。處之相對於麥 克風MCl〇的所要到達方向範圍)經劃分成三個重疊扇區之 ,用的-個實例。在另—料實例中,⑽度之導納角經 劃分成九個重疊扇區(例如,對於筆記本電腦或膝上型電 144218.doc •67- 201032220 腦應用)。 在一般情形中,包·你道& Λ ... 7導納角可經劃分成扇區,且可使用 任意二目之㈣如,取決於(―方面)每一扇區之寬度與 面)可用#算#源之間的所要取捨)。該等扇區可具 有彼此相同之角寬声“ # , a(幻如,以度或弧度為單位),或該等 扇區中之兩者或兩去 存 (可施全部)可具有彼此不同的寬 :例而5 ’可能需要實施每-遮罩以在中心(亦即, 更具有約20度之頻寬且在最大可允許距離處具有 參 = 式下操作的―個實例使用三個遮蔽 函數’每一遮蔽函數嘗 寬、力90度,其中一個遮罩對準使用 個對準使用者之左邊45度且另一者對準使用者之右 在另-實例中,車載裝置應用經實施以包括一經 向司機頭部之扇區、一定向於司機頭部與中間之間 ^ 、、工疋向朝向中間之扇區及一經定向朝向前座乘 〇 扇區。在另-實例中,車載裝置應用經實2 機之…疋向朝向司機之門或窗之扇區、一經定向朝向司 司機與ί或頭部之扇區,及一經定向朝向中間(亦即,在 朝向藥Γ座乘客之間)之扇區。此應用亦可包括一經定向 η客之碩部之扇區。車載裝置應用可包括手動地 機或乘客選擇(例如,經由一 要講話者的能力。 使用者介面)為所 Μ需要組態多扇區應用以使得可在複合導 何位置處偵測寬頻一致性信號,只要該信號在該等扇= 144218.doc •68- 201032220 之一者内為寬頻一致的即可。圖36B展示方法M100之實施 例M400之流程圖,該實施例M400包括任務T1 00及任務 T700之至少一例項。基於由任務T100計算出之相位差,任 務T700判定對應多頻道信號在複數個扇區中之任一者中是 否一致。以此方式的一致性信號之偵測可用於支援語音活 動债測及/或雜訊減少操作(例如,如上文中較詳細描述)。 可能需要組態任務T700以對於每一分量遮蔽函數包括一 致性量測評估任務T230之一例項。圖37展示關於η扇區應 用之任務Τ700及Τ202之此種實施例Τ702的流程圖,其中η 為大於1之整數。任務Τ702包括子任務Τ220之η個例項 T220a ' T220b.....T220n,其中每一例項j經組態以使用 η個方向遮蔽函數中之一各別者(亦即,對應於第j扇區之函 數)來評定由任務T210產生之方向指示符。可能需要使用 分頻帶結構(split-band structure)及/或重疊儲存架構來實施 各種方向遮蔽函數。 任務T702亦包括子任務T230之η個例項T230a、 T230b.....T230n。任務T230之每一例項經組態以基於 由任務Τ220之對應例項產生的評定結果而相對於對應扇區 計算信號之一致性量測。可能需要組態任務Τ230之各種例 項中的每一者以將對應一致性量測產生為時間上平滑之 值。在一個此種實例中,任務Τ230之每一例項經組態以根 據諸如ζ(«) = Α(η-1)+(1-户>(«)之表達式而計算訊框η之經平滑化 一致性量測ζ(η),其中ζ(η-1)表示前一訊框之經平滑化一致 性量測,c(n)表示一致性量測之當前值,且β為值可選自0 144218.doc -69- 201032220 (無平滑化)至1(無更新)之範圍的平滑化因數。平滑化因數 β之典型值包括〇」、0 2、〇 25、〇 3、〇 4及〇 5。此任務可 月b在不同時間(例如,在音訊感應電路之啟動期間與在穩 疋狀L期間)使用不同的平滑化因數p之值。此任務Η〕〇之 對應於不同扇區的例項通常(但不必需)使用相同ρ值。 任務Τ702亦包括經組態以基於對應一致性量測判定多頻 ▼仏號在η扇區中之任一者中是否一致的子任務丁71〇。舉 例而s,任務Τ71 〇可經組態以指示一致性量測中之任一者 是否超過(或者,至少等於)對應臨限值。可能需要組態任 務Τ710以對於一個扇區使用比另一扇區大的臨限值。空間 上分散之雜訊傾向於隨時間推移而具有垂直於麥克風對之 軸線的平均到達方向,使得垂射扇區(包括垂直於麥克風 對之軸線之方向的扇區)可能比端射扇區(包括麥克風對之 軸線的扇區)遭遇到此雜訊中之更多者。因此,對於垂射 扇區(例如,〇.4、〇 5、〇 6或〇 7)可能需要比對於端射扇區 (例如,0.2、〇.3、〇.4或0 5)使用更大的臨限值。類似地, 垂射扇區可能需要對準稍微偏離轴線之方向(例如,以減 小經導納之分散雜訊之量)。 圖38Α展示用於η扇區應用之任務丁7〇〇及丁2〇4之實施例 Τ7〇4的流程圖。任務Τ7〇4包括子任務Τ24〇之實施例 Τ245 ’該實施例Τ245使用多扇區遮蔽函數評定相位差中之 每一者。舉例而言’任務Τ245可經組態以針對每一扇區指 示每相位差是否落入於關於彼扇區處之彼頻率分量的可 允許相位差範圍内(及/或每一相位差落入於關於彼扇區處 144218.doc 201032220 之彼頻率分量的可允許相位差範圍内之程度)。 可成需要組態任務T710以指示在其内债測到一致性作_號 之扇區。舉例而言’任務T71 0之此種實施例T7丨2可經組熊 以指示一致性量測最大之扇區或一致性量測具有最大對比 度之扇區。在此情形中,可將一致性量測之對比度表達為 一致性量測之當前值與一致性量測隨時間推移(例如,在 最近10、20、50或100個訊框中)的平均值之間的關係(例 如,差或比)之值。 可預期,任務T712隨時間推移將指示不同扇區(例如, 如所要聲源之相對位置自一扇區移動至另一扇區)^可能 需要抑制任務T712切換扇區(亦即,指示一不同於當前扇 區之扇區),除非對於目標扇區之一致性量測超過(或者, 不小於)彼扇區之臨限值。舉例而言,可能需要組態任務 T712之此種實施例以在不滿足此條件時繼續指示當前扇 區,即使對於目標扇區之一致性量測當前具有最大值或最 籲 大對比度亦如此。如上文所提及,對於垂射部分(例如, 0.4、0.5、0.6或0.7)可能需要比對於端射部分(例如,〇2、 0.3、0.4或0.5)使用更大的臨限值。 可能需要基於多頻道信號之至少一頻道產生經遮蔽信號 (例如,如上文參考任務T31〇所描述),其中每一訊框係使 用對應於由任務Τ712針對彼訊框所識別之扇區的遮蔽函數 而獲付。此操作可包括(例如)基於對應遮蔽函數之遮罩分 數而衰減主要頻道之頻率分量及/或子頻帶,及/或傳遞少 於主要頻k之所有子頻帶的子頻帶。方法Μ彻之其他實 144218.doc •71- 201032220 施例可經組態以包括經組態以根據由任務T712指示之扇區 選擇而基於多頻道信號之一或多個頻道產生音訊信號(例 如,將與特定選定扇區相關聯之波束或另一濾波器施加至 多頻道信號之至少一頻道)的類似任務。 可能需要實施任務Τ712以包括用以支援自一個扇區至另 一扇區之平滑轉變的邏輯。舉例而言,可能需要組態任務 Τ712以包括一可幫助降低抖動之慣性機構(諸如,滯留邏 輯)。此滯留邏輯可經組態以抑制任務Τ7丨2切換至目標扇 區,除非指示切換至彼扇區之條件(例如,如上文所描述)_ 在若干連續訊框(例如,2、3、4、5、10或20個訊框)之週 期中繼續存在。 任務T710可經實施以一次指示一個以上一致性扇區。舉 例而S,任務T71 0之此種實施例可經組態以指示哪些扇區 具有向於(或者,不小於)對應臨限值之一致性量測。包括 此任務的方法M400之實施例可經組態以根據來自一個以 上所指示扇區之評定結果及/或一致性量測而產生經遮蔽 k號。多個扇區指示可用於追蹤一個以上所要源(例如,◎ 在會議應用中)。然而,追蹤多個源亦可能將更多雜訊導 納至輸出中。其他或另外,任務T710可經組態以包括用以 指示在長時間(例如,〇25、〇 5、1或2秒)中未偵測到一致 · 性扇區(在此情形中,可能需要應用更多雜訊減少)的邏 輯。 可能需要組態任務T710以產生一基於扇區特定—致性量 測之一致性量測。任務T710之一個此種實例針對多頻道信 1442I8.doc •72- 201032220 號之母一訊框產生一基於(例如,等於)對於彼訊框之各種 扇區之一致性量測中的最大者之複合一致性量測。任務 T710之另一此種實例針對每一訊框產生一基於(例如,等 於)當前具有最大對比度之扇區特定一致性量測的複合一 致性量測。任務T710之實施例可經組態以將複合一致性量 測產生為時間上平滑之值(例如,根據本文中所描述之時 間平滑化技術中之任一者)。 方法M400之實施例可經組態以使用由任務T71〇產生之 一致性量測以用於VAD指示及/或用於雜訊減少(例如,用 於上文參考任務丁4〇〇所描述之雜訊修改及/或用於上文參 考任務Τ500及Τ550所描述之雜訊估計)。其他或另外,方 法Μ400之實施例可經組態以基於由任務Τ710產生之一致 性量測的值而向多頻道信號之至少一個頻道(諸如,主要 頻道)應用增益因數。方法Μ400之此種實施例可經組態以 隨時間推移而平滑化此增益因數之值(例如,根據本文所 描述之時間平滑化技術中之任一者)。 可能需要組態任務Τ710以在時間上平滑化跨越扇區切換 操作之值及/或結構。舉例而言,任務Τ71〇可經組態以平 滑化自與一個扇區相關聯之波束至與另一扇區相關聯之波 束的轉變’及/或平滑化自一個扇區之一或多個值(例如, 遮罩分數及/或一致性量測)至另一扇區之對應值的轉變。 此平滑化可根據諸如r =州+ (1-;^之表達式而執行,其中 表示與當前扇區相關聯之值或結構,q表示與目標扇區相 關聯之對應值或結構,r表示混合之值或結構,且μ表厂
La. 144218.doc -73· 201032220 在若干訊框(例如,2、3、4、5或1 0個訊框)之週期中在〇至 1之範圍中増加的平滑化因數。 方法Μ4〇〇亦可經組態以接收各自來自不同麥克風對之 兩個或兩個以上多頻道信號,並指示在該等多頻道信號中 之任一者之任何扇區中是否偵測到一致性。舉例而言,方 法Μ400之此種實施例可經組態以處理來自線性陣列之不 同麥克風對的多頻道信號。 圖38Β展示方法Μ400之此種實施例Μ410的流程圖,該 實施例Μ410包括任務Τ100之多個例項,每一例項經组態 以自對應多頻道信號計算複數個相位差。方法Μ41〇亦包 括任務Τ700之實施例Τ720,該實施例Τ720基於來自複數 個所計算出之相位差之資訊而判定多頻道信號中之任一者 在任何扇區中是否一致。圖39展示任務Τ720及Τ702之實施 例Τ722的流程圖。任務Τ720亦可以類似方式實施為任務 Τ704之擴展實施例。 在方法Μ410之應用之一個實例中,任務Τ2l〇a自圖34C 中所展示之陣列的麥克風MC40及MC20接收第一多頻道信 號,且任務T2 10b自該陣列之麥克風MC20及MCI0接收第 二多頻道信號。在此特定實例中,任務T722將覆蓋自麥克 風MC40之端射方向至垂射方向(亦即,垂直於陣列轴線之 方向)之約90度範圍的遮蔽函數施加至第一多頻道信號, 且任務T722將覆蓋自麥克風MCI 0之端射方向至垂射方向 之約90度範圍的遮蔽函數施加至第二多頻道信號。 其他或另外’方法Ml 00可組態為方向選擇方法M300及 144218.doc •74- 201032220 扇區選擇方法M4(H)兩者的實施例,使得方法M彻之扇區 選擇係對由方法M300處理之多頻道信號令的至少一者而 執行舉例* 5,方法M400之此種實施例可經組態以處 理來自非線性陣列之不同麥克風對的多頻道信號。 圖40展示方法M300及M4〇〇之此種實施例M35〇的流程 圖,該實施例M350包括任務丁100之多個例項,每一例項 經組態以自對應多頻道信號計算複數個相位差。方法 癱 M35〇亦包括經組態以針對多頻道信號中之一者計算一致 性量測之值的任務丁200之例項,及經組態以判定該等多頻 道L號中之另一者在任何扇區中是否一致的任務T7〇〇之例 項。方法M350亦包括經組態以組合來自任務T2〇〇之一致 性量測與由任務T700產生之一致性指示以產生複合一致性 量測的任務Τ6 10之例項。在方法Μ350之應用之一個實例 中’任務Τ200之遮蔽函數的通帶覆蓋器件之前面,且任務 Τ700將該器件之該面劃分成扇區。 φ 方法Μ100之實施例可經組態以包括可根據任務Τ712之 扇區選擇而在方向上組態(例如’可操縱)的空間選擇處理 操作。舉例而言,方法Μ100之此種實施例可經組態以對 麥克風頻道執行波束成形操作以使得波束根據扇區選擇而 可選擇地引導(例如’操縱)^波束成形器可經組態以藉由 在複數個固定波束成形器中進行選擇或藉由改變適應性波 束成形器之波束方向而執行此可選擇方向。 圖41展示裝置Α100之實施例Α400的方塊圖。裝置Α400 包括一致性量測計算器200之實施例712,該實施例712經 144218.doc • 75· 201032220 組態以指示複數個扇區中之一一致者(例如,根據包括如 本文中所描述之任務丨〇之實施例^ 2的任務之實 施例)。裝置A400亦包括一可選擇的波束成形器8〇〇,其經 組態以根據由一致性量測計算器712指示之扇區而選擇複 數個波束中之一者,並將選定波束施加至頻道sl〇i至 S10-4中之兩者、三者、四者或更多者以產生一包括所要 聲音及可能的雜訊之第一頻道及一為雜訊參考值之第二頻 道。裝置A400亦包括一經組態以對波束成形器8〇〇之多頻 道輸出執行雜訊減少操作以產生雜訊經減小之信號的雜訊 減少模組600。模組6〇〇可經實施以包括經配置以估計波束 成形器800之信號加雜訊輸出之雜訊分量的雜訊估計器5〇〇 之例項及經配置以將雜訊估計施加至波束成形器輸出的頻 譜修改器5 6 0之例項。 波束成形器800可經組態以儲存及/或計算複數個波束, 該等波束可根據包括(但不限於)本文中所提及之實例(例 如,MVDR、受限BSS等)的任何波束成形方法而計算。可 能需要組態波束成形器800以僅在頻道之頻率範圍之一部 分上(例如’在諸如0至4 kHz之頻帶的低頻率頻帶中)施加 選定波束。圖42展示裝置A4〇0及A24〇2之實施例A420的方 塊圖。裝置A420包括經遮蔽信號產生器300之實施例302, 該實施例302經組態以根據由一致性量測計算器712產生之 評定結果及/或一致性量測而基於波束成形器輸出產生經 遮蔽信號。裝置A420亦包括經配置以估計經遮蔽信號之雜 訊分量的雜訊估計器500之例項及經配置以將雜訊估計施 144218.doc -76- 201032220 加至經遮蔽信號的頻譜修改器5 60之例項。
在不穩定雜訊環境中,雙麥克風系統之效能可能被較不 可靠、單頻道VAD操作妨礙。此外,雙麥克風陣列可能能 夠提供僅關於前後組態之不穩定雜訊參考值。圖43展示麥 克風MC20及MC40之對用於自指向陣列之背部的遮罩(如 由虛線半圓表示)產生不穩定雜訊參考值的此種實例。此 遮罩可包括(例如)對準陣列之前部的零點波束(null beam),且雜訊參考值可用於支援如本文中所描述(例如, 參考任務T5 00及T55 0)之對多頻道信號之至少一頻道的後 處理雜訊減少操作。如圖43中所展示,此雜訊參考值可能 未能包括來自在陣列前部之源(如由擴音器表示)的干擾。 具有更夕麥克風(例如,四個麥克風)之陣列可用於支援 在手機與所要講話者之間的更寬之相對空間組態範圍中的 不穩定雜訊參考值之估計。圖44展示組合一指向所要講話 者之第一遮罩與一與該第一遮罩互補(且由虛線區域指示) 之第二遮罩的實例。第一遮罩用於基於多頻道信號之至少 一頻道產生經遮蔽信號(例如,如上文參考任務所描 述),且互補遮罩用於產生可用於支援如本文所描述(例 如,參考任務T500及T550)的對經遮蔽信號之至少一頻道 之後處理雜訊減少操作的不穩定雜訊參考值。 訊減少方案整體上比二麥克風方案更協調地執彳^。 雜 圖45展示指向所要源之方向遮蔽函數(如由自⑽至約 90度之通帶所指示)及背離所要源之互補遮罩(如由小於約 20度之通帶及大於約100度之通帶所指 頁例。如此圖 1442l8.doc •77- 201032220 中所展示,可能需要將信號之通帶與互補遮罩實施成具有 極少重疊至無重疊。 圖46展示方法M100之實施例M500的流程圖,該實施例 M500使用互補遮蔽函數來產生不穩定雜訊估計。方法 M500包括相位差計算任務τ 1 〇〇之至少一個例項及包括扇 區選擇任務T712的任務T700之實施例。方法M500亦包括 遮蔽任務T3 10之實施例T740。任務T740根據來自對應於 由任務T712選擇之扇區之方向遮蔽函數的評定結果(例 如’遮罩分數)而基於多頻道信號之至少一頻道產生經遮 φ 蔽信號。 方法M500亦包括遮蔽任務T3 1〇之實施例T750。任務 T750使用與選定扇區互補之方向遮蔽函數來產生基於多頻 道信號之至少一頻道的經遮蔽雜訊信號。方法M5〇〇亦包 括雜訊估計任務T500之實施例T520,該實施例Τ52〇計算 多頻道信號之至少一頻道之不穩定雜訊分量的估計。舉例 而吕,任務T520可經組態以藉由執行時間平滑化操作(例 如,使用如本文中所描述之FIR或IIR濾波器)而計算不穩⑩ 定雜訊估計。在此情形中,更新該雜訊估計可能需要比通 常更新穩定雜訊估計更快速。舉例而言,可能需要在短時 間間隔(例如’ 2、3、5或10個訊框)中及/或藉由執行比平 滑化多的更新(例如’使用(M、〇.2或〇 3之平滑化因數)而· 平滑化經遮蔽雜訊信號。方法M5〇〇亦包括經配置以基於 由任務T5 20產生之不穩疋雜訊估計而修改經遮蔽信號的至 少一頻道之頻譜的頻譜修改任務T56〇之例項。 144218.doc -78. 201032220 方法M500之替代實施例可經組態以使用對應於選定扇 區之波束而非方向遮蔽函數來產生經遮蔽信號及/或使用 指向選定扇區之零點波束而非互補方向遮蔽函數來產生經 遮蔽雜訊信號。 可能需要組態裝置A100之實施例以計算不穩定雜訊參考 值。舉例而t,在裝置A420之實施財,可能需要組態雜 訊=考值計算器5〇〇絲於較遮罩之補體(c〇mpie_tW ❹ 計算雜訊參考值(例如,由一致性量測計算器712所指示)。 在一個實例中,此雜訊參考值係藉由在由一致性量測計算 器712產生之一致性量測高時將一低增益施加至頻道s ^ 而计,且反之亦然。在另一實例中,此雜訊參考值係藉 由將可選擇之零點波束成形器(類似於波束成形器咖)施加 至頻道SHM至S1G•钟之兩者或兩者以上以使得選定零點 波束處於所要講話者之方向中(例如,處於選定扇區之方 向中)而產生。以此方式,選定遮罩之補體可藉由注視所 參 I講話者缺席之區域而獲得。有可能❹使絲自多頻道 信號之訊框的資訊而更新的此不穩定雜訊參考值來對該信 號之相同訊框之至少-頻道執行雜訊減少操作。 替代基於來自非活動間隔之資訊而更新雜訊估計的雜訊 估.十器500之實施例或除基於來自非活動間隔之資訊而更 新雜婦計的雜訊估計器5〇〇之實施例之外’可使用雜訊 估相500之此種實施例。舉例而言,頻譜修改器州可經 組態以將兩個雜訊參考值之組合(例如’均值)施加至主要 頻道SUM(或者,施加至由波束成形器剛產生之信號加 144218.doc •79- 201032220 雜訊頻道)。 在一個實例中,使用四個麥岁 命兄風之遮蔽途徑經實施以在 所要區域中具有單位增益且 社谈Q域之外具有強衰減(例 如,大於40分貝)。對於具有強 胥強正面方向雜訊之情況,當 所要講話者正自前部談話時, 百可旎僅可達成約10或12分 貝之雜訊減少(即使當使用窄 题卓時)。然而’當所要講話 者正自左侧或右側談話時,有 ’ j此達成大於20 dB之雜訊 減少。 鲁 在具有兩個麥克風之情況下,相對窄之波束通常僅可產 生於端射方向巾,而垂射波束通常寬得多。然而,在且有 三個、四個或更多麥克風之情況下,較窄波束通常在;有 方向中係可能的。 可能需要實施方法Μ_以藉由首先使用來自兩個麥克 風之寬扇區且接著使用來自四個麥克風之較窄扇區而移至 特定空間源中。此方案可用於獲得頻寬之適應性調整而不 會^因於所要講話者方向之估計的初始不確定性而損失所 要語音振幅。自兩個麥克風進行至三個及四個麥克風之方_ 案亦可經實施以用於較緩和之轉變。若一個麥克風發生故 障則由四個麥克風達成之最窄空間解析度可能受損’但 通常可藉由三個麥克風之組合來達成足狗窄之垂射扇區及/ 或波束。 使用扇區(例如,方法刚〇〇)之操作的追蹤精確度通常取 決於該等扇區之寬度,該等扇區之寬度可設定追縱操作之 空間解析度的最小界限。舉例而t,在當前經指示為接收 144218.doc 201032220 到一致性信號之扇區内的源可定位於該扇區之甲心或該肩 區之邊緣中的一者處或彼扇區内之任何其他位置處。雖然 追縱精確度可藉由窄化扇區之寬度而增加,但此途徑亦可 減小導納角(除非使用更多扇區),此繼而可增加操作之計 算複雜度。 可能需要使用方向指示符之分布而非先驗扇區集合來定 位及/或追縱一致性信號之源。圖47A展示方法Ml 00之實 施例M600的流程圖,該實施例M6〇〇包括相位差計算任務 T100之例項、方向指示符計算任務T210之例項及一致性量 測評估任務Τ250之實施例Τ252。任務Τ252經組態以基於 一到達方向範圍中之方向指示符的分布而計算一致性量測 之值。如上文所論述,方向指示符可計算為(例如)到達方 向之值、到達時間延遲或相位差與頻率之比。 任務Τ252經組態以針對複數個方向中之每一者判定方向 指示符中之多少者對應於彼方向。舉例而言,可將方向範 圍劃分成複數個頻率組’且任務Τ2 5 2可經組態以對值落入 於每一頻率組内之方向指示符之數目進行計數。在此情形 中,一致性量測之值係基於最滿頻率組中之方向指示符的 數目。 可能需要組態任務Τ252以僅考慮對應於所關注頻率(例 如,在700至2000 Hz之範圍中的分量及/或在音調頻率之 倍數下的分量)之方向指示符。任務T252亦可經組態以根 據其對應頻率對方向指示符中之一或多者加權。舉例而 言,任務T252之φ種實施例可經組態以或較重或較輕地對 144218.doc 201032220 對應於特疋子頻帶之方向指示符加權及/或較重地對對應 於所估計音調頻率之倍數的方向指示符加權。 可能需要針對方向指示符之每一可能值具有一頻率組。 在此情形中,任務T252經組態以藉由對具有相同值之方向 指示符的數目進行計數而計算—致性量測之值。舉例而 言,任務T252可經組態以將_致性量測之值計算為方向指 示符之-模式。或者,可能需要將方向指示符中之兩個或 兩個以上(例如,五個)可能值組合成單一頻率組。舉例而 言,頻率組劃分可經組態以使得每一頻率組覆蓋方向指示 符之可能值中的兩者或兩者以上。可能需要組態頻率組劃 分以支援不同方向中之不同追蹤解析度。 任務T252可藉由繪製如圖48中所展示之直方圖而實施。 在此情形中,一致性量測之值可係基於如由該直方圖所指 示之分布的峰值或重心。對於直方圖不關於峰值對稱之例 項,任務T252可能需要基於所加權之最大值(例如,重心) 而計算一致性量測之值。 任務T252可經組態以對一個訊框中或多個訊框(例如, 5、10、20或50個訊框)中之方向指示符進行計數。任務 T252亦可經組態以隨時間推移而平滑化一致性量測之值 (例如,使用如本文所描述之時間平滑化操作,諸如,fir 或HR濾波器)。 任務T252可經組態以在一致性量測小於(或者,不大於) 臨限值時指示缺乏一致性。在此情形中,可能需要針對複 數個方向中之兩者或兩者以上(可能全部)使用不同臨限 144218.doc -82- 201032220 值舉例而°,針對朝向垂射方向之方向(亦即,相對於 麥克風陣列之轴線)可能需要比針對朝向端射方向向 使用更高的臨限值。另外或其他,任務T252可經組態以在 —致性經指示而用於不同方向之情況下計算 性量測中之每一者的值。 圖47B展示方法撾6〇〇之實施例M61〇(包括任務丁91〇的流 矛圖任務T910經組態以基於方向指示符之分布而選擇遮 ❹蔽方向。舉例而言’任務T91G可經組態以選擇對應於如由 直方圖所指示之分布之峰值或重心的方向。對於直方圖不 關於峰值對稱之例項,任務丁91〇可能需要選擇對應於所加 權最大值之方向。對於任務Τ252經組態以計算一個以上一 致性量測中之每一者之值的情形,任務Τ91〇亦可經組態以 選擇一個以上對應遮蔽方向。 任務T91 〇可經組態以自固定方向遮蔽函數(具有(例如)丄〇 度之寬度)之集合中選擇。或者,任務T91〇可經組態以使 φ 用來自該分布之資訊來組態可操縱方向遮蔽函數。此函數 之一個實例為如上文參考圖8Α至圖8D所描述之非線性遮 蔽函數。在此情形中,任務T910可經組態以選擇通帶之中 心頻率(例如,自直方圖之峰值或重心)並使用固定通帶寬 度(例如’ 1 〇度)及/或輪廓或基於該分布之特性(例如,峰 度(peakiness))而選擇寬度及/或輪廓。圖49展示其中遮蔽 函數之通帶係基於直方圖而選擇的實例。根據方法M6〇〇 之定位途徑的一個潛在優勢為避免同時針對一組扇區中之 每一者執行一致性量測評估之例項。 144218.doc -S3- 201032220 關於上文所描述之波束成形器及波束成形操作,可能需 要使用一或多個資料相依性或資料獨立性設計技術 (MVDR、獨立向量分析(IVA)等)而針對由如本文中所描述 之方法M4〇0之實施例追蹤的空間扇區產生固定波束。舉 例而言,可能需要將離線計算之波束儲存於查找表中。一 個此種實例針對每一濾波器(三個濾波器)包括65個複合係 數以針對每一空間扇區(且總共9個空間扇區)產生波束。圖 5 0及圖5 1展示此所什异波束之一實例之曲線的兩個視圖。 如MVDR、延遲及求和波束成形器之傳統途徑可用於基 _ 於自由場模型設計波束型樣,其令波束成形器輸出能量藉 由等於1之受限注視方向能量而最小化。舉例而言,閉合 形式MVDR技術可用於基於給定注視方向、麥克風間距離 及雜訊交叉相關矩陣而設計波束型樣。通常,所得設計包 含非所要旁瓣,可藉由雜訊交叉相關矩陣之頻率相依性對 角負載而取捨該等旁瓣與主要波束。 可能需要使用由線性程式化技術解決之特殊受限mvdr 成本函數,其可提供對主要波束寬度與旁瓣量值之間的取© 捨之較佳控制。圖52至圖54展示對於分別具有注視方向 π/2、5π/8及3π/8之線性等距四麥克風陣列所獲得之波束型 樣的一組實例。可觀測至’卜在主要注視方向關存在大量 旁瓣且波束在低頻率子頻帶中為薄的’此可導致對風雜訊 放大之高易感性。 可能需要對於具有兩個以上麥克風之應用實施迭代程序 〜十波束型樣。替代最小化所設計波束成形器之輸出能 144218.doc • 84 · 201032220 量’此程序可使用一藉由建立至干擾源之零點波束而設法 使源彼此分離的受限盲源分離(BSS)學習規則。替代射出 波束至所要源中(如在傳統波束成形技術中),此程序可經 設計以藉由消除其他競爭方向之波束而產生朝向所要源之 波束。可能需要組態該程序以使用受限BSS途徑在每一個 別頻率組中迭代地對波束型樣整形且藉此取捨相關雜訊與 非相關雜訊以及旁瓣與主要波束。為了達成此結果,可能 φ 需要在所有注視角中使用正規化程序而在所要注視方向中 將收敛波束調整至單位增益。亦可能需要使用調協矩陣以 在每一零點波束方向中在每一頻率組之迭代過程期間直接 控制所實施零點波束之深度及波束寬度。 為了建立適當零點波束,可使用如圖55中所展示之擴音 器-麥克風設置來擷取資料。若需要產生朝向特定注視方 向之波束,則擴音器可置放於相對於陣列之彼等角處。所 得波束之波束寬度可由干擾擴音器之接近度判定,因為受 _ 限BSS規則可設法排除競爭源且因此可導致由干擾擴音器 之相對角距離判定之較窄或較寬的殘餘波束。 可藉由使用具有不同表面及曲率之根據其幾何形狀在空 間中散播聲音的擴音器來影響波束寬度。可使用小於或等 於麥克風之數目的許多源信號對此等回應整形。由該等擴 音器播放之不同聲音檔案可用於產生不同頻率内容。若擴 音器含有不同頻率内容,則所再現信號可在再現之前經等 化以補償特定頻帶中之頻率損失。 BSS演算法可設法自然地消除干擾源之波束,僅留下所 144218.doc •85· 201032220 要主視方向中之能量。在於所有頻率組上正規化之後,此 操作可在所要源方向中導致單位增益。BSS演算法可能不 特定方向t產生完全對準之波束。若需要產生具有特 定二間拾波型樣之波束成形器,則可最小化旁瓣且可藉由 在特定注視方向中實施零點波束來對波束寬度進行整形, 可針對每一頻率組並針對每一零點波束方向而藉由特定調 協因數實施該等零點波束之深度及寬度。 可能需要藉由選擇性地實施旁瓣最小化及/或調整特定 /主視方向中之波束型樣而微調由Bss演算法提供之原始波 束型樣。β要注I方向可(例如)藉由計算陣列注視方向中 之濾波器空間回應的最大值且接著在&最大注視方向周圍 實施限制而獲得。 此合成波束成形器之每一輸出頻道】的波束型樣可根據 頻域轉移函數Wjm(i*a>)(其中瓜表示輸入頻道, 藉由§十算該表達式之量值曲線而獲得。 % X 〜(ί· X,⑻〇 + …+ Ό·。 在此表達式中,D(co)指示頻率份之方向性矩陣,使得: (5) = exp(-/xc〇s(^)xpos{i)X(〇Ic) ^ 其中pos⑴表*具有M個麥克風之陣列中之心個麥克風的 空間座標,c為聲音在媒體中之傳播速度(例如,空氣中
340 m/s),且0』·表示第j個源相對於麥克風陣列之軸至, 達入射角。 、-、至J 盲源分離(BSS)演算法之範圍包括稱為頻域似或複合 1442I8.doc -86 - 201032220 ICA之途徑,其中濾波器係數值係直接計算於頻域中。可 使用前饋濾波器結構實施之此途徑可包括對輸入頻道執行 FFT或另一變換。此ICA技術經設計以針對每—頻率組①計 算Μ X Μ不混合矩陣w(co),使得解混合之輸出向量 ^,/)=灰(岣1(叭/)相互獨立。不混合矩陣胃(〇)根據可如下表 達之規則而更新: WUr (ω) = W, (ω) + μ[ΐ _ (φ{Υ{ω, 1))Υ(ω> 1)Η (ω) ^ ❹ ❹ 其中Κω)表示關於頻率組ω及窗口 /之不混合矩陣,γ(仍,ζ) 表示關於頻率組ω及窗口 /之濾波器輸出,W/+r((〇)表示關於 頻率組ω及窗口(/+r)之不混合矩陣,r為具有不小於〗之整 數值的更新速率參數,μ為學習速率參數,〗為識別碼矩 陣’ Φ表不啟動函數,上標Η表示共輛倒置操作且括號◊ 表示時間卜1、…、L中之平均操作。在-個實例中,啟動 函數φ(〇,/))等於丨。 複合1CA解決方㈣常遭受縮放不定性,此可在注視方 向改變時導致波束型樣增益及/或回應風格(π—⑶㈣ 上之變化。若源為穩定的且源之變異數在所有頻率組中已 知,則該縮放問題可藉由將該等變異數調整至已知值而解 决。然而’自然信號源為動態的、通常不穩定的且具 知變異數。 戈調1源變異數,縮放問題可藉由調整所習得之分離 解^藉由最小失真原理獲得之—個熟知解決 ”諸如以下之表達式而縮放所習得之*混合矩陣。 J44218.doc -87- 201032220 可能需要藉由在所要注視方向中建立單朽供、 千1立增益而解決縮 放問題,此可幫助降低或避免所要講話者之注立 曰的頻率半 色(frequency coloration)。一個此途徑藉由 ’、 精田所有角中之濾 波器回應量值的最大值而使矩陣W之每一列j正規化.〜 max^=[-,,,]|^,{ixω)^{ω)Χ] + WJ2(ixω)ϋ(ω)^ +--- + WjM(ixω)ϋ{ω)Μ | 〇 一些複合ICA實施例之另一問題為與相同源有關的頻率 組之間的一致性之損失。此損失可導致頻率排列問題其 中主要含有來自資訊源之能量的頻率組錯誤指派至干擾輸 出頻道,及/或反之亦然。可使用對此問題之若干解決方 案。 可使用之對排列問題之一個回應為獨立向量分析 (IVA) ’其為使用一源(在此之前模型化頻率組之間的預期 相依性)的複合ICA之變型。在此方法中,啟動函數φ為諸 如以下之多變數啟動函數: Φ(ΥΜΙ)) = ~-Υ^1) Σ\γ;Μ\ρ \ ώ> ) 其中P具有大於或等於1(例如,1、2或3)之整數值。在此函 數中,分母上之項係關於所有頻率組中之分離的源頻譜。 可能需要藉由基於方向性矩陣D(co)(如上文中之表達式 (5)中)添加調整項J(c〇)而實施波束及/或零點波束。 J ⑻=ΜύΟΐίΓ ⑻ £>(«) _ (:(的|丨2 (7) 1442l8.doc •88· 201032220 其中s⑻為頻率①及每一零點波束方向之調協矩陣且 C(Q>)為等於diag(W(o)*D(〇)))之MxM對角矩陣,該_ 定所要波束型樣之選擇且針對每一輸出頻道』將==^ = , 於干擾方向處。此調整可幫助控制旁瓣。舉例而言,矩陣 8(ω)可用於藉由在每一頻率組下在每—零點方向中控制實 施之量而對特定方向h中之每一零點波束的深度進行效 形。此控制對於取捨旁瓣與窄或寬之零點波束之產生可$ 重要的。 Φ 可藉由諸如以下之表達式而將調整項(7)表達為不混合 矩陣更新方程式之約束: (:〇η’Η_\ν)(ω)=μ * S⑻ * 2 * ( W(co) * D(co)-C(co) ) D⑻η。⑻ 此約束可藉由將此項添加至濾波器學習規則(例如,表 達式(6))而實施,如在以下表達式中: ^constrJ+p(^)= 〈靖明r㈣,办)+ 2如刺⑻_一_)、广。⑼ ❿ 源到達方向(罐)值θ】可基於收斂BSS波束型樣而判定以 消除旁瓣。舉例而言,圖56及圖57展示已在約^孤度之 寬區域令收斂之一個BSS解決方案的實例。為了減少在此 情形中之旁瓣(其對於所要應用而言可能過大),可能需要 在(例如馮1/4及θ』=3π/4處實施選擇性零點波束。圖兄及 圖59展示所得較窄波束。圖6〇展示藉由在^65π/8處施加 額外零點波束(該零點波束經由特定矩陣8(ω)實施於每一 頻率組中)而自圖58令之波束獲得之另一窄化波束。可觀 144218.doc -89 - 201032220 測到’旁瓣在中間頻率帶至高頻率帶中已顯著減少。在此 實例中,低頻率帶特意含有寬波束,此可幫助最小化非相 關雜訊放大。閉合形式MVDR設計通常不能夠直接處置此 等問題。 文限388途徑可用於在每一個別頻率組中迭代地對波束 型樣進打整形且藉此對相關雜訊與非相關雜訊以及旁瓣與 主要波束進行取捨。然而,如使用MVDR設計之情況,受 限BSS設計單獨可提供麥克風p車列之前部與背部之間的不 足夠的辨別。 可能需要實施如本文中所描述之相關聯處理系統,以提 供近場話音之保留與遠場干擾之衰減之間的適當取捨及/ 或提供非所要方向上之非線性信號衰減。對於處理來自兩 個以上麥克風之信號的方法河1〇〇之實施例之應用,可能 需要選擇線性麥克風組態以獲得最小語音失真或選擇非線 性麥克風組態以獲得更佳雜訊減少。 1月「要同時或成對地使用三個、四㈤或更多麥克風以 在最小化所要語音失真之同時達成此增強。類似於可展開 使用之鍵盤,器件⑽之實施例可配備有可以此方式部署 之非線性麥克風陣列。 非線性四麥克風陣狀—個實例包括:成—條直線之三 個麥克風’在中心麥克風與外部麥克風中之每—者之間具 有二分的間距’·及另一麥克風,其定位於該直線上方四 :二與中心麥克風之距離比與任一外部麥克風的距離 陣列之應用包括可安裝於前座佔據者的前部以及司 144218.doc 201032220 機之遮光板與乘客之遮光板之間(例如,在後視鏡中或上) 的免持車載裝置。 對於在手機模式下使用之通信器件,雙麥克風陣列通常 係足夠的’因為手機與所要講話者之空間組態的可變性通 常係有限的,使得其可能足以處理僅有限範圍之空間組 態。特定麥克風組態可藉由手機模式之最佳配置來指示。 所記錄信雜比通常為高的’使得可應用激進的後處理技術 Φ (例如,如參考任務T55〇所描述之雜訊減少操作)。然而, 二麥克風陣列可支援僅有限之使用者追蹤能力,使得講話 者之語音可超過特定範圍而衰減。 可能需要使用具有兩個以上麥克風之陣列以在時間及空 間上支援對使用者之追蹤及/或辨別近場與遠場區域。在 使用者-手機組態之適當追蹤之情況下,此陣列可用於經 由空間辨別處理來支援顯著之雜訊減少。此陣列可適用於 遠場互動模式,諸如,智慧電話或具有此等模式之另一器 • 件的免持及/或瀏覽-談話模式。對於此模式的在陣列與使 用者之口部之間的一典型距離為50公分。此陣列可適用於 僅可容許具有極低語音失真之雜訊移除的自動話音辨識 (ASR)應用(例如,語音搜尋)。可能需要使用此陣列來追 蹤講話者移動並相應地對處理進行調適。然而,自動回音 消除之問題可能比在手機模式下更困難,且可能需要使: 整合式回音消除雜訊抑制(ECNS)解決方案以用於與來自三 個或二個以上麥克風頻道之雜訊減少相互作用。 使用具有兩個以上麥克風之陣列可有益於高語音品質及/ 144218.doc 91- 201032220 或良好的ASR效能。舉例而言,此陣列之使用可在廣泛範 圍的空間組態中對於給定位準之雜訊減少提供較小語音失 真。可能需要使用此陣列來支援增強型語音追蹤能力,使 得在所要講話者之移動期間經歷較少的語音衰減或壓抑。 本文中所揭示之方法及裝置通常可應用於任何收發及/ 或音訊感應應用中,尤其係此等應用之行動或以其他方式 之攜▼型例項。舉例而t,本文中所揭示之組態的範圍包 括駐留於經組態以使用分碼多重存取(CDMA)空中介面的 無線電話通信系統中的通信器件。然而,^習此項技術者 將理解,具有本文中所描述之特徵的方法及裝置可駐留於 使用熟習此項技術者所已知之廣泛範圍之技術的各種通信 系統中之任一者中,諸如經由有線及/或無線(例如, CDMA、TDMA、FDMA及/或TD_SCDMA)傳輸頻道使用網 路電話(VoIP)之系統。 明確地預期且特此揭示’本文揭示之通信器件可經調適 以用於為封包交換式(例如,根據諸如v〇Ip之協定配置以 載運音訊傳輸之有線及/或無線網路)及/或電路交換式之網 路中。亦明確地預期且特此揭示,本文揭示之通信器件可 經調適以用於窄頻編碼系統(例如,編碼約四千赫茲或五 千赫茲之音訊頻率範圍之系統)中及用於寬頻編碼系統(例 如,編碼大於五千赫茲之音訊頻率之系統)中,包括全頻 帶寬頻編碼系統及分頻帶寬頻編碼系統。 提供所描述組態之前文呈現以使得任何熟習此項技術者 能夠製造或使用本文揭示之方法及其他結構。本文展示且 144218.doc -92- 201032220 描述之流程圖、方塊圖及其他結構僅為實例,且此等結構 之其他變型亦在本發明之範疇内。對此等組態之各種修改 係可能的’且亦可將本文呈現之一般原理應用至其他組 態。因此,本發明不意欲限於上文展示之組態,而應符合 與本文中以任何方式揭示之原理及新穎特徵(包括於形成 原始揭示案之一部分的所申請之附加申請專利範圍中)一 致的最廣泛範疇。 參 熟習此項技術者應理解,可使用各種不同技術及技藝中 之任一者來表示資訊及信號。舉例而言,可藉由電壓、電 流、電磁波、磁場或磁粒子、光場或光粒子,或其任何組 合來表示可遍及上文之描述所引用之資料、指令、命令、 資訊、信號、位元及符號。 關於如本文所揭示之組態之實施例的重要設計要求可包 括(尤其)針對計算密集型應用(諸如,以大於8千赫茲(例 如12、16或44 kHz)之取樣率進行語音通信的應用)最小 ❹ 化處理延遲及/或計算複雜度(通常以百萬指令/秒或MIPS 量測)。 夕麥克風處理系統之目標可包括達成1〇至12 dB之整體 雜訊減少、在所要講話者之移動期間保留語音位準及風 格、獲得雜訊已移動至背景中而非激進的雜訊移除之知 覺、消除話音之回響及/或啟用後處理之選項(例如,基於 雜訊估計之頻譜修改操作,諸如,任務T55〇)以獲得較激 進的雜訊減少。 本文所揭示之裝置(例如’裝置Α10、α12、Α13、Α14、 144218.doc -93 · 201032220 A20、A24、A100、A120、A130、A140、A200、A240、 A400、A420、A1002、A2002及A2402)之實施例的各種元
件可實施於被認為適用於所欲應用之硬體、軟體及/或勒 體之任何組合中。舉例而言,可將此等元件製造為駐留於 (例如)同一晶片或晶片組中之兩個或兩個以上晶片上的電 子及/或光學器件。此器件之一實例為固定或可程式化邏 輯元件(諸如,電晶體或邏輯閘)之陣列,且此等元件中之 任一者可實施為一或多個此等陣列。此等元件中之任兩者 或兩者以上乃至全部可實施於同一陣列或若干相同陣列 内。此或此等陣列可實施於一或多個晶片内(例如,包括 兩個或兩個以上晶片之晶片組内)。 本文中所揭示之裝置(例如,裝置A1〇、A12、八13、 AU、A20、A24、A1〇〇、A12〇、Ai3〇、Ai4〇、繼、 A240、A400、A420、Al〇〇2、A2〇〇ua24〇2)之各種實施 例的-或多個元件亦可全部或部分地實施為經配置以在一 或多個固定或可程式化邏輯元件陣列(諸如,微處理器、
嵌入式處理@ ' IP核心、數位信號處理器、(場可程 式化閘陣列)、ASSP(特殊庳用庐淮A 〇、 沐應用軚準產品)及ASIC(特殊應用 積體電路))上執行之一或多個指 丨U?s 7集合。本文中所揭示之 裝置之一實施例之各種元件中 y 的任—者亦可實施為一或多 個電腦(例如,包括經程式 ^ „ 式化以執行一或多個指令集合或 才日7序列之一或多個陣列 曰…〇 亦稱為「處理器」), ^ ^ 有4兩者以上乃至全部可實施於相 同的此或此等電腦内。 、 144218.doc -94. 201032220 用於如本文所揭不地處理之虚搜吳斗、 慝理器或其他構件可製造為
駐留於(例如)同-晶月或晶片組中之兩個或兩個以上晶片 之間的一或多個電子及/或光學器件。此器件之-實例為 固定或可程式化邏輯元件(諸如,電晶體或邏輯閉)之陣 列’且此等元件之任一者可實施為一或多個此等陣列。此 或此等陣列可實施於-或多個晶片内(例如,包括兩個或 兩個以上晶片之晶片組内)。此等陣列之實例包括固定或 可程式化邏輯元件陣列,諸如’微處理器、嵌入式處理 器、π>核心、DSP、FPGA、ASSI^ASIC。用於如本文所 揭示地處理之處理器或其他構件可實施為一或多個電腦 (例如,包括、經程式化以執行一或多個指令集合或指令序 列之一或多個陣列的機器)或其他處理器。有可能如本文 所描述之處㈣詩執行並非與—致性偵測程序直接相關 之任務或執行並非與一致性偵測程序直接相關之其他指令 集合’諸如,肖其中嵌人有處理器之器件或系統(例如, 音訊感應器件)之另一操作相關的任務。亦有可能如本文 所揭示之方法的部分藉由音訊感應器件之處理器來執行 (例如,相位差汁异任務Τ1 〇〇及/或一致性量測計算任務 丁200)且s亥方法之另一部分在一或多個其他處理器之控制 下執行(例如,經組態以將一致性量測施加至信號之—或 多個頻道之任務,諸如,雜訊減少任務)。 熟習此項技術者將瞭解,可將結合本文中所揭示之組態 所描述的各種說明性模組、邏輯區塊、電路,及測試及其 他操作實施為電子硬體、電腦軟體或兩者之組合。可以通 144218.doc -95- 201032220 用處理器、數位信號處理器(DSP)、ASIC或ASSP、FPGA 或經設計以產生本文中所揭示之組態的其他可程式化邏輯 器件、離散閘或電晶體邏輯、離散硬體組件,或其任何組 合來實施或執行此等模組、邏輯區塊、電路及操作。舉例 而言,此組態可至少部分地實施為一硬連線電路、製造為 特殊應用積體電路之電路組態,或載入至非揮發性儲存器 中之韌體程式或作為機器可讀取程式碼自一資料儲存媒體 載入或載入至一資料儲存媒體中之軟體程式,此程式碼為 可由邏輯元件之陣列(諸如一通用處理器或另一數位信號 處理單元)執行之指令。通用處理器可為微處理器,但在 替代例中,處理器可為任何習知處理器、控制器、微控制 器或狀態機。亦可將處理器實施為計算器件之組合,例 如,DSP與微處理器之組合、複數個微處理器、一或多個 微處理器連同一 DSP核心,或任何其他此組態。一軟體模 組可駐留於RAM(隨機存取記憶體)、ROM(唯讀記憶體)、 非揮發性RAM(NVRAM)(諸如,快閃RAM)、可抹除可程式 化ROM(EPROM)、電可抹除可程式化ROM(EEPROM)、暫 存器、硬碟、可移除式碟片、CD-ROM或此項技術中已知 之任何其他形式的儲存媒體中。將一例示性儲存媒體耦接 至該處理器,使得該處理器可自該儲存媒體讀取資訊及將 資訊寫入至該儲存媒體。在替代例中,儲存媒體可整合至 處理器。處理器及儲存媒體可駐留於ASIC中。ASIC可駐 留於使用者終端機中。在替代例中,處理器及儲存媒體可 作為離散組件而駐留於使用者終端機中。 144218.doc -96- 201032220 應注意,本文中所揭示之錢方法可藉由諸如處理器之 =輯70件陣列而執行’且如本文_所描述之裝置的各種元 件可實施為經設計以在此陣列上執行之模組。如本文中所 .使用’術語「模組」或「子模組」可指包括呈軟體、硬體 絲體形式之電腦指令(例如,邏輯表達式)的任何方法、 裝置、器件、單元或電腦可讀取資料儲存媒體。應理解, 可將夕個模組或系統組合成一個模組或系統,且可將一個 ❿模組或系統分成多個模組或系統以執行相同功能。處理程 序之兀件在實施於軟體或其他電腦可執行指令中時實質上 為用以(諸如)藉由常式、程式、物件、組件資料結構及 其類似者而執行相關任務的程式碼片段。術語「軟體」應 理解為包括原始碼、組合語言碼、機器碼、二進位碼、韌 體、巨碼(macrocode)、微碼、可由邏輯元件津列執行之任 何一或多個指令集合或指令序列,及此等實例之任何组 〇程式或程式碼片段可儲存於處理器可讀取媒體中或可 籲經由傳輸媒體或通信鍵路藉由實施於載波中之電腦資料信 號來傳輸。 本文中所揭示之方法、方案及技術的實施例亦可有形地 • f施(例如’在如上文所列出之—或多個電腦可讀取媒體 .中)為可由-包括邏輯元件陣列(例如,_處理器、微處理 器、微控制器或其他有限狀態機)的機器讀取及/或執行之 -或多個指令集合。術語「電腦可讀取媒體」可包括可錯 存或轉移資訊之任何媒體’包括揮發性、非揮發性、可移 除或不可移除媒體。電腦可讀取媒體之實例包括電子電 144218.doc -97- 201032220 路、半導體記憶體器件、R0M、快閃記憶體、可抹除 ROM(EROM)、軟碟或其他磁性儲存器、CDR〇M/DVD或 其他光學儲存器、硬碟、光纖媒體、射頻(RF)鏈路或可用 於儲存所要資訊且可被存取之任何其他媒體。電腦資料信 號可包括可經由傳輸媒體(諸如,電子網路頻道、光纖、 二氣電磁、RF鏈路等)傳播之任何信號。程式碼片段可 絰由諸如網際網路或内部網路之電腦網路而下載。在任何 情形中’本發明之範嘴不應解釋為受此等實施例限制。
,▲切Τ Μ布一苍1且接貫施於
體、可由處理器執行之軟體模组或該兩者之組合中。在 本文所揭不之方法之實施例的典型應用中,邏輯元件( 如邏輯閘)之陣列經組態以執行該方法之各種任務中 者、-者以上乃至全部。亦可將任務中之一或多者( 能全部)實施為實施於電腦程式產品(例如,-或多個資 儲存媒體,諸如碟片、快閃記憶體或其他非揮發性記 卡、半導體記億體晶片等)中之程式碼(例如,一或多個 :集:),該電腦程式產品可由包括邏輯元件陣列(例如 (I!如裔雷微處理器、微控制器或其他有限狀態機)的機 (例如’電腦)讀取及/或執行。如本文所揭示之方法之 施例的任務亦可藉由—個以上此陣列或機 :. 或其他實施财,該等任務可執行於心無線通^ = 内’諸如,蜂巢式電話或具有此通信能 ::心 器件可經域以(例如,使㈣如卿之 ;^件1 電路交換式及/或封包交換 ’多個協定)多 匕叉換式網路通。舉例而言,此署 144218.doc •98- 201032220 件可包括經組態以接收及/或傳輸經編碼之訊框的汉 路。 电 明確地揭示,本文所揭示之各種方法可藉由諸如手機、 耳機或攜帶型數位助理(PDA)之攜帶型通信器件執行,且 本文所描述之各種裝置可包括於此器件内。典型即時(例 如’線上)應用為使用此行動器件進行之電話通話。 在一或多個例示性實施例中,可以硬體、軟體、勤體或 眷 其任何組合來實施本文所描述之操作。若以軟體實施,則 此等操作可作為一或多個指令或程式碼在一電腦可讀取媒 體上儲存或經由電腦可讀取媒體傳輸。術語「電腦可讀取 媒體」包括電腦儲存媒體及通信媒體兩者,通信媒體包括 促進將電腦程式自一處轉移至另一處之任何媒體。儲存媒 體可為可由電腦存取之任何可用媒體。作為實例而非限 制’此電腦可讀取媒體可包含諸如以下各者之儲存元件陣 列:半導體記憶體(其可包括(但不限於)動態或靜態尺八河、 ❹ ROM、EEPROM及/或快閃RAM)或鐵電、磁電阻、雙向、 聚合或相變記憶體;CD-ROM或其他光碟儲存器、磁碟儲 存器或其他磁性儲存器件,或可用於以指令或資料結構之 • 形式載運或儲存所要程式碼且可由電腦存取的任何其他媒 • 體。又,可適當地將任何連接稱為電腦可讀取媒體。舉例 而言,若使用同轴電纜、光纖電纜、雙絞線、數位用戶線 (DSL)或諸如紅外線、無線電及/或微波之無線技術自網 站、伺服器或另一遠端源傳輸軟體,則該同軸電規、光纖 電纜、雙絞線、DSL,或諸如紅外線、無線電及/或微波之 144218.doc •99· 201032220 無線技術包括於媒體之定義中。如本文中所使用,磁碟及 光碟包括緊密光碟(CD)、雷射光碟、光學光碟數位多功 能光碟(DVD)、軟性磁碟及Blu_ray DiscTM (BiuRay以“
Association,Universal City,CA),其中磁碟通常以磁性方 式再現資料,而光碟藉由雷射以光學方式再現資料。以上 各者之組合亦應包括於電腦可讀取媒體之範疇内。 如本文中所描述之聲學信號處理裝置可併入至接受話音 輸入以便控制特定操作或可以其他方式獲益於所要雜訊與 背景雜訊的分離之電子器件(諸如,通信器件)中。許多應❿ 用可獲益於增強或分離清楚的所要聲音與來源於多個方向 之背景聲音。此等應用可在併有諸如語音辨識及该測、話 音:強及分離、語音啟動控制及其類似者之能力的電子或 什算器件中包括人機介面。可能需要將此聲學信號處理裝 置實施成適用於僅提供有限處理能力之器件中。 如本文所描述之模組、元件及器件之各種實施例的元件 可製造為駐留於(例如)同—晶片上或晶片組之兩個或兩個 以上晶片之間的電子及/或光學器件。此器件之一實例為❹ 固疋或可程式化邏輯元件(諸如,電晶體或閘)之陣列。本 文中所私述之裝置之各種實施例的一或多個元件亦可整體 或部分地實施為經配置以執行於一或多個固定或可程式化 邏輯疋件陣列(諸如,微處理器、嵌人式處理器、㈣ 心、數位信號處理器、FPGA、Assp&ASIc)上的一或多 個指令集合。 有可能如本文中所描述之裝置之實施例的一或多個元件 144218.doc -100- 201032220
用於執行並非與該裝置之操作直接相關的任務或執行並非 與該裝置之操作直接相關的其他指令集合,諸如,與其中 嵌入有該裝置之器件或系統之另一操作相關的任務。亦有 可能此裝置之實施例的一或多個元件具有共同結構(例 如,用以執行在不同時間對應於不同元件之程式碼部分的 處理器,經執行以執行在不同時間對應於不同元件之任務 的指令集合,或在不同時間執行不同元件之操作的電子及/ 或光學器件之配置)。舉例而言,FFT模組FFT1至中 之一或多者(可能全部)可經實施以在不同時間使用相同結 構(例如,界定FFT操作之相同指令集合)。 【圖式簡單說明】 圖1 A展不根據一般組態之方法M100之流程圖 圖1B展示任務T100之實施例丁102的流程圖; 圖1C展示任務T110之實施例丁112的流程圖; 圖2Α展示任務Τ200之實施例丁2〇2的流程圖;
圖2Β展示任務丁2〇〇之替代實施例Τ2〇4的流程圖; 圖2C展示任務丁200之替代實施例丁2〇6的流程圖; 圖3Α展示說明用以估計到達方向θ之途徑 之實例; 的幾何近似法 圖3Β至圖3D展示遮蔽函數之三個不同輪廓之實例; 圖4展示圖3Α中所說明之幾何近似法之另—實例.’ 圖5展示以相對於使用者之口部的標準定向安1於使用 者之耳部處的耳機D100之圖; 圖6展示耳機0100之相對於使用者之口部的標準定向之 144218.doc -101- 201032220 兩個實例; 圖7展示手機D300之相對於使用者之口部的標準定向之 兩個實例; 圖8A至圖8D展示非線性遮蔽函數之四個不同輪廓之實 例; 圖9展示有聲話音信號之256點FFT的前128個頻率組的振 幅之實例; 圖10展示將任務T100之(例如,任務T1122之)實施例應 用於頻譜展示於圖9中之信號的實例; 圖11A展示方法M100之實施例M200的流程圖; 圖11B展示任務T300之實施例T302的流程圖; 圖11C、圖11D及圖11E分別展示任務T310之實施例 丁312、丁314及丁316的流程圖; 圖12A及圖12B分別展示任務T302之實施例T3021及 T3 022的流程圖; 圖13 A展示任務T300之實施例T3 04的流程圖; 圖13B及圖13C分別展示任務T304之實施例T3041及 T3 042的流程圖; 圖14A展示任務T300之實施例T306的流程圖; 圖14B展示任務T300之實施例T308的流程圖; 圖14C展示任務T308之實施例T3082的流程圖; 圖15A展示方法M200之實施例M210的流程圖; 圖15B展示方法Ml00之此種實施例Ml20的流程圖; 圖15C展示方法M100之此種實施例M130的流程圖; 144218.doc -102- 201032220 圖15D展示方法M130之實施例M140的流程圖; 圖16A展示任務T316之實施例T3164的流程圖; 圖16B展示任務T400之實施例T402的流程圖; 圖16C展示任務T500之實施例T502的流程圖; 圖17A展示方法M200之實施例M220的流程圖; 圖17B展示方法M200之實施例M230的流程圖; 圖17C展示方法M230之實施例M240的流程圖; 圖18A展示根據一般組態之裝置A10的方塊圖; 圖18B展示裝置A10之實施例A100的方塊圖; 圖18C展示裝置A10之實施例A20的方塊圖; 圖18D展示裝置A20之實施例A200的方塊圖; 圖18E展示裝置A10之實施例A12的方塊圖; 圖18F展示裝置A12之實施例A120的方塊圖; 圖19A展示裝置A100之實施例A1002的方塊圖; 圖19B展示裝置A1002之實施例A2002的方塊圖; 圖20A展示裝置A10之實施例A13的方塊圖; 圖20B展示裝置A13之實施例A130的方塊圖; 圖20C展示裝置A10之實施例A14的方塊圖; 圖20D展示裝置A14之實施例A140的方塊圖; 圖20E展示裝置A14及裝置A20之實施例A24的方塊圖; 圖20F展示裝置A140及裝置A200之實施例A240的方塊 圖, 圖21展示裝置A240之實施例A2402的方塊圖; 圖22A展示陣列R100之實施例R200的方塊圖; 144218.doc -103- 201032220 圖22B展示陣列R200之實施例R210的方塊圖; 圖23A展示根據一般組態之器件D10的方塊圖; 圖23B展示器件D10之實施例D20的方塊圖; 圖24A至圖24D展示多麥克風無線耳機D100之各種視 圖, 圖25A至圖25D展示多麥克風無線耳機D200之各種視 圖; 圖26A展示多麥克風通信手機D300之橫截面圖(沿一中 心軸線); 圖26B展示器件D300之實施例D310之橫截面圖; 圖27A展示多麥克風媒體播放器D400之圖; 圖27B及圖27C分別展示器件D400之實施例D410及D420 的圖, 圖28A展示多麥克風免持車載裝置D500之圖; 圖28B展示多麥克風撰寫器件D600之圖; 圖29A及圖29B分別展示器件D700之前視圖及俯視圖; 圖29C及圖29D分別展示器件D710之前視圖及俯視圖; 圖30展示器件D10之多麥克風攜帶型音訊感應實施例 D 8 0 0的圖, 圖31A展示方法M300之流程圖; 圖31B展示任務T280之實施例T288的流程圖; 圖31C展示任務T280之實施例T282的流程圖; 圖32A展示任務T280之實施例T284的流程圖; 圖32B展示任務T280之實施例T286的流程圖; 144218.doc -104- 201032220 圖32C展示陣列R100之多對實施例之一個實例; 圖33A展示一個二麥克風陣列及兩個源; 圖33B展示一個二麥克風陣列及一端射導向遮蔽函數; 圖33C展示一個二麥克風陣列及一垂射導向遮蔽函數; 圖33D展示一個四麥克風陣列及一端射導向遮蔽函數; ' 圖34A展示三麥克風陣列之一般實例; 圖34B展示三麥克風陣列之應用之另一實例; 圖34C展示四麥克風陣列之應用之一實例; ❹ 圖35A展示手機D300之實施例D320之前視圖; 圖35B展示手機D320之側視圖; 圖35C展示手機D300之實施例D330之前視圖; 圖35D展示手機D330之側視圖; 圖36A展示寬導納角經劃分成三個重疊扇區之應用的實 例; 圖36B展示方法M100之實施例M400的流程圖; _ 圖37展示任務T700之此種實施例T702的流程圖; 圖38A展示任務T700之實施例T704的流程圖; 圖38B展示方法M400之實施例M410的流程圖; • 圖39展示任務T720之實施例T722的流程圖; . 圖40展示方法M300之實施例M350的流程圖; 圖41展示裝置A100之實施例A400之應用; 圖42展示裝置A400之實施例A420之應用; 圖43展示一對麥克風用於產生不穩定雜訊參考值之實 例; 144218.doc -105- 201032220 圖44展示兩個以上麥克風用於產生不穩定雜訊參考值之 實例; 圖45展示方向遮蔽函數及互補遮罩之實例; 圖46展示方法M100之實施例M500的流程圖; 圖47A展示方法M100之實施例M600的流程圖; 圖47B展示方法M600(包括任務T910)之實施例M610的流 程圖; 圖48展示一直方圖; 圖49展示遮蔽函數之通帶係基於直方圖而選擇的實例; 圖50及圖5 1展示所計算波束之一實例之曲線的兩個視 圖; 圖52至圖54展示針對線性等距四麥克風陣列而獲得之波 束型樣的實例集合; 圖55展示一擴音器-麥克風設置; 圖56及圖57展示已收斂之一個BSS解決方案之實例; 圖58及圖59展示較窄之波束;及 圖60展示自圖58中之波束獲得之另一窄化波束。 【主要元件符號說明】 81 繪製表面 82 刮擦雜訊 85 擴音器 100 相位差計算器 200 一致性量測計算器 300 經遮蔽信號產生器 144218.doc -106- 201032220
302 經遮蔽信號產生器 316 經遮蔽信號產生器 400 頻譜修改器 500 雜訊估計器 510 雜訊估計器 550 頻譜估計器 560 頻譜修改器 600 雜訊減少模組 712 一致性量測計算器 800 波束成形器 A10 裝置 A12 裝置 A13 裝置 A14 裝置 A24 裝置 A20 裝置 A100 裝置 A120 裝置 A200 裝置 A400 裝置 A420 裝置 A1002 裝置 A2002 裝置 A2402 裝置 144218.doc •107- 201032220 AP10 音訊預處理級 AP20 音訊預處理級 ClOa 類比至數位轉換器 ClOb 類比至數位轉換器 CIO 小鍵盤 C20 顯示器 C30 天線 C40 天線 CS10 晶片/晶片組 DIO 器件 D20 器件 D100 多麥克風無線耳機 D200 多麥克風無線耳機 D300 手機 D310 手機 D320 手機 D330 手機 D400 器件 D410 器件 D420 器件 D500 車載裝置 D600 多麥克風撰寫器件 D700 器件 D710 器件 144218.doc -108- 201032220 D800 多麥克風攜帶型音訊感應實施例 F100 用於針對多頻道信號之複數個不同頻率分量中 的每一者計算該信號之頻道之間的相位差之構 件 F200 用於基於來自所計算出之相位差之資訊計算一 致性量測之值的構件 F300 用於計算一致性量測之值並產生經遮蔽信號之 構件 ® F400 用於修改多頻道信號之至少一頻道之雜訊分量 的頻譜之構件 F500 用於估計多頻道信號之至少一頻道之雜訊分量 的構件 F510 構件F500之用於估計由構件F300產生之經遮蔽 信號之至少一頻道的雜訊分量的實施例 F550 用於基於由構件F500產生之雜訊估計而修改多 «頻道信號之至少一頻道之頻譜的構件 F560 構件F550之用於基於由構件F5 10產生之雜訊估 計而修改經遮蔽信號之至少一頻道的頻譜的實 • 施例 FFT1 FFT 模組 FFT2 FFT 模組 FFT3 FFT 模組 FFT4 FFT 模組 IFFT1 反向FFT模組 144218.doc -109- 201032220 M100 方法 M120 方法 M130 方法 M140 方法 M200 方法 M210 方法 M220 方法 M230 M240 方法 方法 ❹ M300 方法 M350 方法 M400 方法 M410 方法 M500 方法 M600 方法 M610 MC10 方法 麥克風 MC20 麥克風 MC30 麥克風 MC40 麥克風 PlOa 類比預處理級 PlOb 類比預處理級 P20a 數位預處理級 P20b 數位預處理級 144218.doc -110- 201032220 PL10 頂板 PL 12 頂板 R100 陣列 R102 陣列R100之實施例 R200 陣列 R210 陣列R200之實施例 S10 多頻道信號 S10-1 主要頻道 W S10-2 頻道 S10-3 頻道 S10-4 頻道 S20 時域信號 SC10 顯示螢幕 SP10 擴音器 SP20 擴音器 赢 TS10 觸控螢幕顯示器 UI10 左側使用者介面控制器 UI20 右侧使用者介面控制器 • Z10 外殼 Z12 橢圓形外殼 Z20 收聽器 Z22 收聽器 Z30 耳鉤 Z40 聲埠 144218.doc -Ill - 201032220 Z42 聲埠 Z50 聲埠 Z52 次要麥克風之聲埠 144218.doc •112·

Claims (1)

  1. 201032220 七、申請專利範圍: 1 · 一種處理一多頻道信號之方法,該方法包含: 針對該多頻道信號之複數個不同頻率分量中的每 者,計算該多頻道信號之一第一頻道中之該頻率分量的 一相位與該多頻道信號之一第二頻道中之該頻率分量的 一相位之間的一差;及 、 基於來自該複數個所計算出之相位差之資訊叶算一
    一致性量測之一值,該值指示至少該複數個不同頻率分 量之到達方向之間的一致性之—程度。 刀 2·如請求項1之方法,其中該複數個頻率分量包括具有— 不大於1千赫茲之頻率的至少一頻率分量及具有二不小 於1500赫茲之頻率的至少一頻率分量。 3·如請求項1之方法,其中該複數個頻率分量包括具有一 不大於800赫茲之頻率的至少一頻率分量及具有一不小 於18〇〇赫茲之頻率的至少一頻率分量。 4.如4求項1之方法,丨中該方法包括基於該多頻道信號 之所估汁音調頻率而選擇該複數個不同頻率分量。 5·如二求項1之方法,其中該方法包括基於該-致性量測 之该值,根據一指定雜訊頻譜輪廓而變化該多頻道信號 之至少一頻道之至少一頻率分量的振幅。 6·如請求項1 > 士、、上 飞11万去’其中該方法包括基於該一致性量測 之該值’更新該多頻道信號之至少-頻道之-雜訊分量 的一估計。 如請求項丨之方法 其中該方法包含: 144218.doc 201032220 針對第一多頻道信號之複數個不同頻率分量中的每 十算第—多頻道信號之一第一頻道中之該頻率分 量的4目位與該第二多頻道信號之—第二頻道中之該頻 率m相位之間的—差’以獲得—第二複數個所計 算相位差,且 八中該汁算一一致性量測之—值係基於來自該第二巷 數個所計算出之相位差的資訊’且 其中該-致性量測之該值指示該多頻道信號之至少錢
    不同頻率分量及該第二多頻道信號之該複數個不 同頻率分量的該等到達方向之間的—致性之—程度。 8. 如請求们之方法,其中該計算一 一致性量測之一值台 含針對該複數個所計算出之相位差中的每-者計算-到 應方向指示符,且
    其中該複數個方向指示符中之每一者指示以下各者中 之至少—者:(A)該對應頻率分量之一到達方向;(b)^ 對應頻率分量之—到達時間延遲;及⑹該所計算出之相 位差與該對應頻率分量之該頻率之間的一比。 9. 求項8之方法,其中該計算――致性量測之一值自 2根據-方向遮蔽函數而針對該複數個方向指示符中之 每一者評定該方向指示符以獲得一對應遮罩分數,且 其中該-致性量測之該值係基於該複數個遮罩分數。 M m::之二法,其中該方法包括基於該對應遮罩分 '夕頻、號之至少-頻道之該複數個頻率分量 中的至少一·*· +分· A- ® 者之該振幅以產生一經遮蔽信號。 144218.doc -2 - 201032220 11. 如請求項9之方法,其中該方涂包括 基於對應於該多頻道信號之一指定子頻帶中之頻率分 量的該複數個方向指示符中之至少一些之該等遮罩分 數,計算一子頻帶遮罩分數;及 基於忒子頻帶遮罩分數而變化該多頻道信號之至少〆 頻道之至少該指定子頻帶的該等頻率分量之該振幅,以 產生一經遮蔽信號。 12. 如請求項1()之方法,其中該方法包括在該經遮蔽信號之 -位準與該至少一頻道之一位準的一比值小時衰減該經 遮蔽信號。 13. 如請求項9之方法,其中該方法包含: 針對”亥複數個方向指示符中之每一者,根據一第二方 向遮蔽函數評定該方向指示符以獲得一第二對應遮罩分 數,及
    基於該第二複數個遮罩分數,計算一第二一致性量測 之一值。 14_如請求項13之方法’其中該方法包含 基於該一致性量測之該值及該第二一致性量測之該 值,根據以下各者中之一者組態—空間選擇性處理操 作··(A)—對應於該方向遮蔽函數之第一方向;及⑺)一 對應於該第二方向遮蔽函數之第二方向,及 。將該經組狀空間選擇性處理操作施加至f亥多頻道信 號之至少兩個頻道,以獲得一經處理之信號。 15.如請求項13之方法,其中該方法包含: 14421&doc 201032220 比較(A)該一致性量測之該值與該一致性量測之先前 值的一均值之間的一關係之狀態與(B)該第二一致性量測 之該值與該第二一致性量測之先前值的一均值之間的一 關係之狀態。 16. 17. 如請求項1之方法’其中該方法包含: 針對一第二多頻道信號之複數個不同頻率分量中的每 一者計算該第二多頻道信號之—第—頻道中之該頻率分 量的:相位與該第二多頻道信號之一第二頻道中之該頻 率分量的-相位之間的-差’以獲得—第:複數個所計❹ 算相位差; 基於來自該第二複數個所計算出之相位 算一第二-致性量測之-值,該值指示該第二^道;; 號之至少該複數個不同頻率分量的該等到達方向之間的 一致性之一程度; 比較該一致性量測之該值與一第一臨限值;及 比較該第二-致性量測之該值與一不同於該第一臨限 值之第二臨限值。 ⑩ 一種用於處理一多頻道信號之裝置,該裝置包含: 用於針對該多頻道信號之複數個不同頻率分量中的每 一者計算該多頻道信號之一第一頻道中之該頻率分量的 -相位與該多頻道信號之一第二頻道中之該頻率分量的· 一相位之間的一差之構件;及 用於基於來自該複數個所計算出之相位差之資訊計算 一一致性量測之一值的構件,該值指示至少該複數個不 144218.doc -4. 201032220 18. 19. 20. ❹ 21. 22.
    23. 同頻率刀量之到達方向之間的—致性之—程度。 月求項17之裝置’其中該複數個頻率分量包括具有— 不大於1千赫茲之頻率的至少一頻率分量及具有一不小 於1500赫茲之頻率的至少一頻率分量。 β求項17之裝置,其中該複數個頻率分量包括具有— 不大於8GG赫兹之頻率的至少—頻率分量及具有一不小 於1800赫茲之頻率的至少一頻率分量。 ^請求項Π之裝置’其中該裝置包括用於基於該多頻道 L號之所估計音調頻率而選擇該複數個不同頻率分量 的構件。 :請求項!7之裝置,其中該裝置包括用於基於該一致性 量測之該值而根據—指定雜訊頻譜輪廓來變化該多頻道 信號之至少-頻道之至少—頻率分量的振幅之構件。 如請求項17之裝置,其中該裝置包括用於基於該一致性 量測之該值而更新該多頻道信號之至少一頻道之一雜訊 分量的一估計之構件。 如請求項17之裝置,其中該裝置包含用於針對一第二多 頻道信號之複數個不同頻率分量中的每一者計算該第二 多頻道信號之一第一頻道中之該頻率分量的—相位與該 第二多頻道信號之一第二頻道中之該頻率分量的一相位之 間的一差以獲得一第二複數個所計算相位差之構件,且 其中用於計算·--致性量測之一值的兮操ΑΙ· / 恨的5亥構件經組態以 基於來自該第二複數個所計算出之相位差的資訊而計算 該一致性量測之該值,且 144218.doc 201032220 24. 其中該-致性量測之該值指示該多頻道信號之至少該 複數個不同頻率分量及該第二多頻道信號之該複數個不 同頻率分量的該等到達方向之間的—致性之—程度。 如請求項17之裝置,其中用於計算—雜量測之一值 的該構件馳態以針對該複數個所計算出之相位差中的 每一者計算一對應方向指示符,且 其中該複數個方向指示符中之每一者指示以下各者中
    之至v者·(A)該對應頻率分量之一到達方向;(B)該 對應頻率分量之-到達時間延遲;及⑹該所計算出之相
    25. 26. 27. 如請求項24之裝置,其中用於計算一一致性量測之一值 的該構件包含用於針對該複數個方向指示符中之每一者 根據一方向遮蔽函數評定該方向指示符以獲得一對應遮 罩分數的構件,且 其中該一致性量測之該值係基於該複數個遮罩分數。 如請求項25之裝置,其中該裝置包括用於基於該對應遮 罩分數變化該多頻道信號之至少—頻道之該複數個頻率Θ 分量中的至少一者之該振幅以產生一經遮蔽信號之構 件。 如請求項25之裝置,其中該裝置包括: 用於基於對應於該多頻道信號之一指定子頻帶中之頻 率分量的該複數個方向指示符中之至少一些之該等遮罩 分數而計算一子頻帶遮罩分數的構件;及 用於基於該子頻帶遮罩分數而變化該多頻道信號之至 144218.doc 201032220 ^頻道之至少該指定子頻帶的該等頻率分量之該振幅 以產生一經遮蔽信號的構件。 28_如請求項26之裝置,其中該裝置包括用於在該經遮蔽信 號之-位準與該至少—頻道之—位準的—比值小時衰減 該經遮蔽信號的構件。 29.如請求項25之裝置,其中該裝置包含: 用於針對該複數個方向指示符中之每—者根據一第
    方向遮蔽函數評定該方向指示符續得—第二對應遮 分數的構件,及 用於基於該第二複數個遮罩分數計算一第二一致性量 測之一值的構件。 30.如請求項29之裝置,其中該裝置包含: 用於基於該-致性量測之該值及該第二一致性量測之 該值而根據以下各者中之―者組態―空間選擇性處理操 作的構件:(A)-對應於該方向遮蔽函數之第 W-對應於該第二方向遮蔽函數之第二方向;及, 用於將該經組態之空間選擇性處理操作施加至該多頻 道信號之至少兩個頻道以獲得—經處理之信號的構件。 .如請求項29之裝置,其中該裝置包含: 用於比較⑷該—致性量敎録與該—致性量測之 先前值的-均值之間的一關係之狀態與(b)該第二 量測之該值與該第二-致性量測之先前值的-均值之間 的一關係之狀態的構件β θ 32.如請求項17之裝置,其中該裝置包含: 144218.doc 201032220 用於針對一第二多頻道信號之複數個不同頻率分量中 的每-者計算該第二多頻道信號之—第—頻道中之該頻 率分量的一相位與該第二多頻道信號之— 該頻率分量的一相位之間的一差以獲得一第 计算相位差之構件; 用於基於來自該第二複數個所計算出之相位差之資訊 計算-第二一致性量測之一值的構件,該值指示該第二 多頻道信號之至少該複數個不同頻率分量的該等到達方 向之間的一致性之一程度; 用於比較該-致性量測之該值與—第—臨限值 件;及 用於比較該第二-致性量測之該值與一不同於該第— 臨限值之第二臨限值的構件β 33. 34. 一種用於處理一多頻道信號之裝置,該裝置包含: -相位差計算器,其經組態以針對該多頻道信號之複 數個不同頻率分量中的每-者計算該多頻道信號之-第 -頻道中之該頻率分量的一相位與該多頻道信號之一第 二頻道中之該頻率分量的-相位之間的差;及 --致性篁測計算器’其經組態以基於來自該複數個 所計算出之相位差之資訊計算致性量測之—值,該 值指示至少該複數個不同頻率分量之到達方向之間的_ 致性之一程度。 如-月求項33之裝置’其中該複數個頻率分量包括具有— 不大於1千赫茲之頻率的至少一頻率分量及具有一不小 144218.doc 201032220 35. 36. 37. 38. 39. 於1500赫茲之頻率的至少一頻率分量。 如請求項33之裝置,其中該複數個頻率分量包括具有— 不大於800赫茲之頻率的至少一頻率分量及具有一不小 於1800赫茲之頻率的至少一頻率分量。 如睛求項33之裝置’其中該相位差計算器及該一致性量 測計算器中之至少一者經組態以基於該多頻道信號之一 所估計音調頻率而選擇該複數個不同頻率分量。 如請求項33之裝置,其中該裝置包括一頻譜修改器,該 頻譜修改器經組態以基於該一致性量測之該值而根據一 指定雜訊頻譜輪廓來變化該多頻道信號之至少一頻道之 至少一頻率分量的振幅。 如請求項33之裝置,其中該裝置包括一雜訊估計器,該 雜Λ估计器經組態以基於該一致性量測之該值而更新該 多頻道信號之至少一頻道的一雜訊分量之一估計。 如請求項33之裝置,其中該裝置包含一第二相位差計算 器,該第二相位差計算器經組態以針對一第二多頻道信 號之複數個不同頻率分量中的每一者計算該第二多頻道 信號之一第一頻道中之該頻率分量的一相位與該第二多 頻道彳s號之一第二頻道中之該頻率分量的一相位之間的 一差以獲得一第二複數個所計算相位差,且 其中該一致性量測計算器經組態以基於來自該第二複 數個所計算出之相位差的資訊而計算該一致性量測之該 值,且 其中該一致性量測之該值指示該多頻道信號之至少該 144218.doc -9- 201032220 複數個不同頻率分量及該第二多頻道信號之該複數個不 同頻率分量的該等到達方向之間的一致性之一程度。 40.如請求項33之裝置, 針對該複數個所計算 方向指示符,且 其中該一致性量測計算器經組態以 出之相位差中的每一者計算一對應 ,、中該複數個方向指示符中之每—者指示以下各者中 之至v者.(A)該對應頻率分量之一到達方向;該 對應頻率分量之—到達時間延遲:及⑹該所計算出之相 位差與該對應頻率分量之該頻率之間的一比。 41. 如4求項40之裝置,其中該一致性量測計算器經組態以 針對該複數個方向指示符中之每—者根據—方向遮蔽函 數評定該方向指示符以獲得一對應遮罩分數,且 其中該一致性量測之該值係基於該複數個遮罩分數。 42. 如請求項41之裝置,其中該裝置包括一經遮蔽信號產生 器,該經遮蔽信號產生器經組態以基於該對應遮罩分數 變化該多頻道信號之至少一頻道之該複數個頻率分量中 的至少一者之振幅以產生一經遮蔽信號。 43. 如請求項41之裝置,其中該裝置包括一經遮蔽信號產生 器,該經遮蔽信號產生器經組態以基於對應於該多頻道 仏號之一指定子頻帶中之頻率分量的該複數個方向指示 符中之至少一些之s亥等遮罩分數而計算一子頻帶遮罩分 數,且基於a亥子頻帶遮罩分數而變化該多頻道信號之至 少一頻道之至少該指定子頻帶的該等頻率分量之該振幅 以產生一經遮蔽信號。 I442I8.doc •10- 201032220 44.如請求項42之裝置,其中該經遮蔽信號產生器經組態以 在該經遮蔽信號之一位準與該至少一頻道之一位準的— 比值小時衰減該經遮蔽信號。 45_如請求項41之裝置,其中該一致性量測計算器經組態以 針對該複數個方向指示符中之每一者根據一第二方向遮 蔽函數評定該方向指示符以獲得—第二對應遮罩分數且 基於該第二複數個遮罩分數計算一第二一致性量測之— 值。 ❿ 46. 如吻求項45之裝置’其中該裝置包含—空間選擇性處理 器,該空間選擇性處理器經組態以將—㈣選擇性處理 操作施加至該多頻道信號之至少兩個頻道以獲得 理之信號,且 其中該空間選擇性處理操作係基於該一致性 值及該第二—致性量測之該值而根據以下各者中之一; 來組態」(A卜對應於該方向遮蔽函數之卜方向;及 (B)-對應於該第二方向遮蔽函數之第二方向。 47. =求項45之裝置,其中該—致性量測計算器經組態以 比較(A)該一致性量測之該信|兮 該值與該—致性量測之先前值的 -均值之間的―關叙狀態與(B)該第:性 值與該第二一致性蚤制々止_ 置叫之这 之狀態。 '先則值的一均值之間的一關係 48. 如請求項33之裝 以: 其中该一致性量測計算器經組態 針對—第二多頻道信號之複數個不同頻率分量中的每 144218.doc -II- 201032220 者°十算該第二多頻道信號之一第一頻道中之該頻率分 ^ 相位與該第二多頻道信號之一第二頻道中之該頻 率分量的-相位之間的ϋ獲得—第二複數個所計 算相位差; 基於來自該第二複數個所計算出之相位差之資訊計算 第一致性量測之一值,該值指*該第二多頻道信號 之至少該冑數個+同頻率分量㈣等到彡方向之間的一 致性之一程度; 比較該一致性量測之該值與一第一臨限值;及 比較該第1一致性量冑之該值與_不同於該第—臨限 值之第二臨限值。 49. 一種電腦可讀取媒體,其包含在由至少—處理器執行時 使忒至 > 一處理器執行如請求項1之方法的指令。
    144218.doc 12·
TW098136230A 2008-10-24 2009-10-26 Systems, methods, apparatus, and computer-readable media for coherence detection TW201032220A (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US10844708P 2008-10-24 2008-10-24
US18551809P 2009-06-09 2009-06-09
US24031809P 2009-09-08 2009-09-08
US12/605,158 US8724829B2 (en) 2008-10-24 2009-10-23 Systems, methods, apparatus, and computer-readable media for coherence detection

Publications (1)

Publication Number Publication Date
TW201032220A true TW201032220A (en) 2010-09-01

Family

ID=41651609

Family Applications (1)

Application Number Title Priority Date Filing Date
TW098136230A TW201032220A (en) 2008-10-24 2009-10-26 Systems, methods, apparatus, and computer-readable media for coherence detection

Country Status (6)

Country Link
US (1) US8724829B2 (zh)
EP (1) EP2345031B1 (zh)
JP (2) JP5307248B2 (zh)
CN (2) CN103295579B (zh)
TW (1) TW201032220A (zh)
WO (1) WO2010048620A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103380456A (zh) * 2010-12-29 2013-10-30 瑞典爱立信有限公司 噪声抑制方法和应用噪声抑制方法的噪声抑制器
US9934787B2 (en) 2013-01-29 2018-04-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for coding mode switching compensation
TWI710779B (zh) * 2017-02-13 2020-11-21 美商高通公司 用於安全關鍵汽車使用例的現場自測試控制器、方法、和電腦可讀取媒體
TWI749437B (zh) * 2013-03-21 2021-12-11 美商唯亞威方案公司 用於識別一海產樣本之方法及裝置與用於判定一海產樣本之鮮度之方法

Families Citing this family (319)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
JP2008092269A (ja) * 2006-10-02 2008-04-17 Matsushita Electric Ind Co Ltd ハンズフリー通話装置
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
CN103137139B (zh) * 2008-06-30 2014-12-10 杜比实验室特许公司 多麦克风语音活动检测器
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
EP2350926A2 (en) * 2008-11-24 2011-08-03 Institut Ruder Boskovic Method of and system for blind extraction of more than two pure components out of spectroscopic or spectrometric measurements of only two mixtures by means of sparse component analysis
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US8620672B2 (en) * 2009-06-09 2013-12-31 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
JP5326051B2 (ja) * 2009-10-15 2013-10-30 ヴェーデクス・アクティーセルスカプ 音声コーデックを備えた補聴器および方法
US20110096937A1 (en) * 2009-10-28 2011-04-28 Fortemedia, Inc. Microphone apparatus and sound processing method
US9838784B2 (en) * 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US8560309B2 (en) * 2009-12-29 2013-10-15 Apple Inc. Remote conferencing center
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8897455B2 (en) 2010-02-18 2014-11-25 Qualcomm Incorporated Microphone array subset selection for robust noise reduction
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8958572B1 (en) * 2010-04-19 2015-02-17 Audience, Inc. Adaptive noise cancellation for multi-microphone systems
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
EP2561508A1 (en) 2010-04-22 2013-02-27 Qualcomm Incorporated Voice activity detection
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US20110288860A1 (en) 2010-05-20 2011-11-24 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for processing of speech signals using head-mounted microphone pair
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
US9025782B2 (en) * 2010-07-26 2015-05-05 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for multi-microphone location-selective processing
US9100734B2 (en) 2010-10-22 2015-08-04 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for far-field multi-source tracking and separation
US8898058B2 (en) 2010-10-25 2014-11-25 Qualcomm Incorporated Systems, methods, and apparatus for voice activity detection
US9031256B2 (en) 2010-10-25 2015-05-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for orientation-sensitive recording control
US8855341B2 (en) 2010-10-25 2014-10-07 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for head tracking based on recorded sound signals
US9111526B2 (en) 2010-10-25 2015-08-18 Qualcomm Incorporated Systems, method, apparatus, and computer-readable media for decomposition of a multichannel music signal
US9552840B2 (en) 2010-10-25 2017-01-24 Qualcomm Incorporated Three-dimensional sound capturing and reproducing with multi-microphones
US9330675B2 (en) 2010-11-12 2016-05-03 Broadcom Corporation Method and apparatus for wind noise detection and suppression using multiple microphones
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US8525868B2 (en) 2011-01-13 2013-09-03 Qualcomm Incorporated Variable beamforming with a mobile platform
JP2012150237A (ja) * 2011-01-18 2012-08-09 Sony Corp 音信号処理装置、および音信号処理方法、並びにプログラム
WO2012107561A1 (en) * 2011-02-10 2012-08-16 Dolby International Ab Spatial adaptation in multi-microphone sound capture
US9354310B2 (en) * 2011-03-03 2016-05-31 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for source localization using audible sound and ultrasound
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US8942382B2 (en) * 2011-03-22 2015-01-27 Mh Acoustics Llc Dynamic beamformer processing for acoustic echo cancellation in systems with high acoustic coupling
WO2012159217A1 (en) * 2011-05-23 2012-11-29 Phonak Ag A method of processing a signal in a hearing instrument, and hearing instrument
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8817917B2 (en) * 2011-06-21 2014-08-26 Ibiquity Digital Corporation Method and apparatus for implementing signal quality metrics and antenna diversity switching control
GB2493327B (en) 2011-07-05 2018-06-06 Skype Processing audio signals
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US10015589B1 (en) * 2011-09-02 2018-07-03 Cirrus Logic, Inc. Controlling speech enhancement algorithms using near-field spatial statistics
GB2495131A (en) 2011-09-30 2013-04-03 Skype A mobile device includes a received-signal beamformer that adapts to motion of the mobile device
GB2495129B (en) 2011-09-30 2017-07-19 Skype Processing signals
GB2495472B (en) 2011-09-30 2019-07-03 Skype Processing audio signals
GB2495278A (en) 2011-09-30 2013-04-10 Skype Processing received signals from a range of receiving angles to reduce interference
GB2495128B (en) 2011-09-30 2018-04-04 Skype Processing signals
GB2495130B (en) 2011-09-30 2018-10-24 Skype Processing audio signals
WO2013063345A1 (en) * 2011-10-27 2013-05-02 Med-El Elektromedizinische Geraete Gmbh Optimized energy and data transfer in hearing implant systems
KR20130048075A (ko) * 2011-11-01 2013-05-09 삼성전자주식회사 다중 음원 위치추적장치 및 그 위치추적방법
GB2496660B (en) 2011-11-18 2014-06-04 Skype Processing audio signals
US8879761B2 (en) 2011-11-22 2014-11-04 Apple Inc. Orientation-based audio
GB201120392D0 (en) 2011-11-25 2012-01-11 Skype Ltd Processing signals
GB2497343B (en) 2011-12-08 2014-11-26 Skype Processing audio signals
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US10448161B2 (en) 2012-04-02 2019-10-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for gestural manipulation of a sound field
US9857451B2 (en) 2012-04-13 2018-01-02 Qualcomm Incorporated Systems and methods for mapping a source location
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US20140006017A1 (en) * 2012-06-29 2014-01-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for generating obfuscated speech signal
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US10075801B2 (en) * 2012-07-13 2018-09-11 Sony Corporation Information processing system and storage medium
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
JP6028502B2 (ja) * 2012-10-03 2016-11-16 沖電気工業株式会社 音声信号処理装置、方法及びプログラム
US9210499B2 (en) * 2012-12-13 2015-12-08 Cisco Technology, Inc. Spatial interference suppression using dual-microphone arrays
EP2747451A1 (en) * 2012-12-21 2014-06-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Filter and method for informed spatial filtering using multiple instantaneous direction-of-arrivial estimates
WO2014104815A1 (ko) * 2012-12-28 2014-07-03 한국과학기술연구원 바람 소음 제거를 통한 음원 위치 추적 장치 및 그 방법
US9516418B2 (en) 2013-01-29 2016-12-06 2236008 Ontario Inc. Sound field spatial stabilizer
DE112014000709B4 (de) 2013-02-07 2021-12-30 Apple Inc. Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten
US9312826B2 (en) 2013-03-13 2016-04-12 Kopin Corporation Apparatuses and methods for acoustic channel auto-balancing during multi-channel signal extraction
US10306389B2 (en) 2013-03-13 2019-05-28 Kopin Corporation Head wearable acoustic system with noise canceling microphone geometry apparatuses and methods
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US20140278380A1 (en) * 2013-03-14 2014-09-18 Dolby Laboratories Licensing Corporation Spectral and Spatial Modification of Noise Captured During Teleconferencing
WO2014144949A2 (en) 2013-03-15 2014-09-18 Apple Inc. Training an at least partial voice command system
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
CN105122359B (zh) 2013-04-10 2019-04-23 杜比实验室特许公司 语音去混响的方法、设备和***
US20180317019A1 (en) 2013-05-23 2018-11-01 Knowles Electronics, Llc Acoustic activity detecting microphone
US9269350B2 (en) 2013-05-24 2016-02-23 Google Technology Holdings LLC Voice controlled audio recording or transmission apparatus with keyword filtering
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101922663B1 (ko) 2013-06-09 2018-11-28 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
KR101809808B1 (ko) 2013-06-13 2017-12-15 애플 인크. 음성 명령에 의해 개시되는 긴급 전화를 걸기 위한 시스템 및 방법
US9099973B2 (en) 2013-06-20 2015-08-04 2236008 Ontario Inc. Sound field spatial stabilizer with structured noise compensation
US9271100B2 (en) * 2013-06-20 2016-02-23 2236008 Ontario Inc. Sound field spatial stabilizer with spectral coherence compensation
CN105409241B (zh) * 2013-07-26 2019-08-20 美国亚德诺半导体公司 麦克风校准
US10791216B2 (en) 2013-08-06 2020-09-29 Apple Inc. Auto-activating smart responses based on activities from remote devices
KR102089638B1 (ko) 2013-08-26 2020-03-16 삼성전자주식회사 전자장치의 음성 녹음 방법 및 장치
US9449594B2 (en) 2013-09-17 2016-09-20 Intel Corporation Adaptive phase difference based noise reduction for automatic speech recognition (ASR)
KR20150050693A (ko) * 2013-10-30 2015-05-11 삼성전자주식회사 컨텐츠 재생 방법 및 그 방법을 처리하는 전자 장치
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
JP6295650B2 (ja) * 2013-12-25 2018-03-20 沖電気工業株式会社 音声信号処理装置及びプログラム
CA2947324C (en) * 2014-04-30 2019-09-17 Motorola Solutions, Inc. Method and apparatus for discriminating between voice signals
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US20150348530A1 (en) * 2014-06-02 2015-12-03 Plantronics, Inc. Noise Masking in Headsets
US9946331B2 (en) 2014-06-27 2018-04-17 Samsung Electronics Co., Ltd. System and method to process signals having a common component
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9606986B2 (en) 2014-09-29 2017-03-28 Apple Inc. Integrated word N-gram and class M-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
WO2016076123A1 (ja) * 2014-11-11 2016-05-19 ソニー株式会社 音声処理装置、音声処理方法、並びにプログラム
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
WO2016093854A1 (en) 2014-12-12 2016-06-16 Nuance Communications, Inc. System and method for speech enhancement using a coherent to diffuse sound ratio
CN105791961B (zh) * 2014-12-23 2018-12-07 深圳Tcl数字技术有限公司 终端与环绕音响之间音频数据的无线传输方法及***
JP6829693B2 (ja) * 2014-12-23 2021-02-10 ティモシー デグレイ オーディオ共有のための方法及びシステム
JP2016127300A (ja) * 2014-12-26 2016-07-11 アイシン精機株式会社 音声処理装置
US9800964B2 (en) 2014-12-29 2017-10-24 Sound Devices, LLC Motion detection for microphone gating
US10045140B2 (en) 2015-01-07 2018-08-07 Knowles Electronics, Llc Utilizing digital microphones for low power keyword detection and noise suppression
CN105989851B (zh) 2015-02-15 2021-05-07 杜比实验室特许公司 音频源分离
EP3259927A1 (en) * 2015-02-19 2017-12-27 Dolby Laboratories Licensing Corporation Loudspeaker-room equalization with perceptual correction of spectral dips
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9489963B2 (en) * 2015-03-16 2016-11-08 Qualcomm Technologies International, Ltd. Correlation-based two microphone algorithm for noise reduction in reverberation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
TWI579835B (zh) * 2015-03-19 2017-04-21 絡達科技股份有限公司 音效增益方法
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US9565493B2 (en) 2015-04-30 2017-02-07 Shure Acquisition Holdings, Inc. Array microphone system and method of assembling the same
US9554207B2 (en) 2015-04-30 2017-01-24 Shure Acquisition Holdings, Inc. Offset cartridge microphones
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US9672841B2 (en) * 2015-06-30 2017-06-06 Zte Corporation Voice activity detection method and method used for voice activity detection and apparatus thereof
EP3329692B1 (en) * 2015-07-27 2021-06-30 Sonova AG Clip-on microphone assembly
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10242689B2 (en) * 2015-09-17 2019-03-26 Intel IP Corporation Position-robust multiple microphone noise estimation techniques
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
DK3157268T3 (da) * 2015-10-12 2021-08-16 Oticon As Høreanordning og høresystem, der er konfigureret til at lokalisere en lydkilde
US11631421B2 (en) * 2015-10-18 2023-04-18 Solos Technology Limited Apparatuses and methods for enhanced speech recognition in variable environments
US9804599B2 (en) 2015-11-04 2017-10-31 Zoox, Inc. Active lighting control for communicating a state of an autonomous vehicle to entities in a surrounding environment
US9494940B1 (en) 2015-11-04 2016-11-15 Zoox, Inc. Quadrant configuration of robotic vehicles
US9878664B2 (en) * 2015-11-04 2018-01-30 Zoox, Inc. Method for robotic vehicle communication with an external environment via acoustic beam forming
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
WO2017143105A1 (en) 2016-02-19 2017-08-24 Dolby Laboratories Licensing Corporation Multi-microphone signal enhancement
US11120814B2 (en) 2016-02-19 2021-09-14 Dolby Laboratories Licensing Corporation Multi-microphone signal enhancement
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
JP6645322B2 (ja) * 2016-03-31 2020-02-14 富士通株式会社 雑音抑圧装置、音声認識装置、雑音抑圧方法、及び雑音抑圧プログラム
US10735870B2 (en) 2016-04-07 2020-08-04 Sonova Ag Hearing assistance system
BR112017021239B1 (pt) * 2016-04-29 2023-10-03 Honor Device Co., Ltd Método, aparelho, e meio legível por computador de determinação de exceção de entrada de voz
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US20180160226A1 (en) * 2016-12-05 2018-06-07 Semiconductor Components Industries, Llc Reducing or eliminating transducer reverberation
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
EP3346725B1 (en) 2017-01-05 2019-09-25 Harman Becker Automotive Systems GmbH Active noise reduction earphones
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US10367948B2 (en) 2017-01-13 2019-07-30 Shure Acquisition Holdings, Inc. Post-mixing acoustic echo cancellation systems and methods
CN110226101B (zh) * 2017-04-25 2021-09-14 华为技术有限公司 用于估计到达方向的设备和方法
JP2018191145A (ja) * 2017-05-08 2018-11-29 オリンパス株式会社 収音装置、収音方法、収音プログラム及びディクテーション方法
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770428A1 (en) 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
CN109686378B (zh) * 2017-10-13 2021-06-08 华为技术有限公司 语音处理方法和终端
US10665234B2 (en) * 2017-10-18 2020-05-26 Motorola Mobility Llc Detecting audio trigger phrases for a voice recognition session
CN107948900A (zh) * 2017-10-26 2018-04-20 青岛亿联客信息技术有限公司 一种电子设备麦克风阵列一致性检测方法及其装置
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10339949B1 (en) 2017-12-19 2019-07-02 Apple Inc. Multi-channel speech enhancement
CN108303463A (zh) * 2017-12-22 2018-07-20 江苏大学 一种用于禽蛋裂纹识别的音频传感器的检测装置及方法
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
KR102088222B1 (ko) * 2018-01-25 2020-03-16 서강대학교 산학협력단 분산도 마스크를 이용한 음원 국지화 방법 및 음원 국지화 장치
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US11523212B2 (en) 2018-06-01 2022-12-06 Shure Acquisition Holdings, Inc. Pattern-forming microphone array
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US11297423B2 (en) 2018-06-15 2022-04-05 Shure Acquisition Holdings, Inc. Endfire linear array microphone
CN109104683B (zh) * 2018-07-13 2021-02-02 深圳市小瑞科技股份有限公司 一种双麦克风相位测量校正的方法及校正***
CN112889296A (zh) 2018-09-20 2021-06-01 舒尔获得控股公司 用于阵列麦克风的可调整的波瓣形状
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
CN109743653B (zh) * 2019-01-21 2020-11-10 闻泰通讯股份有限公司 耳机电路结构及通讯设备
US10665220B1 (en) * 2019-03-05 2020-05-26 Bose Corporation Active noise reduction (ANR) system with multiple feedforward microphones and multiple controllers
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11558693B2 (en) 2019-03-21 2023-01-17 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality
EP3942842A1 (en) 2019-03-21 2022-01-26 Shure Acquisition Holdings, Inc. Housings and associated design features for ceiling array microphones
JP2022526761A (ja) 2019-03-21 2022-05-26 シュアー アクイジッション ホールディングス インコーポレイテッド 阻止機能を伴うビーム形成マイクロフォンローブの自動集束、領域内自動集束、および自動配置
CN110012331B (zh) * 2019-04-11 2021-05-25 杭州微纳科技股份有限公司 一种红外触发的远场双麦远场语音识别方法
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
CN114051738A (zh) 2019-05-23 2022-02-15 舒尔获得控股公司 可操纵扬声器阵列、***及其方法
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
DK201970511A1 (en) 2019-05-31 2021-02-15 Apple Inc Voice identification in digital assistant systems
CN114051637A (zh) 2019-05-31 2022-02-15 舒尔获得控股公司 集成语音及噪声活动检测的低延时自动混波器
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
EP3783609A4 (en) * 2019-06-14 2021-09-15 Shenzhen Goodix Technology Co., Ltd. DIFFERENTIAL BEAM FORMATION METHOD AND MODULE, SIGNAL PROCESSING METHOD AND APPARATUS, AND CHIP
EP3764359B1 (en) 2019-07-10 2024-08-28 Analog Devices International Unlimited Company Signal processing methods and systems for multi-focus beam-forming
EP3764358B1 (en) 2019-07-10 2024-05-22 Analog Devices International Unlimited Company Signal processing methods and systems for beam forming with wind buffeting protection
EP3764360B1 (en) * 2019-07-10 2024-05-01 Analog Devices International Unlimited Company Signal processing methods and systems for beam forming with improved signal to noise ratio
US11297426B2 (en) 2019-08-23 2022-04-05 Shure Acquisition Holdings, Inc. One-dimensional array microphone with improved directivity
JP7199322B2 (ja) * 2019-08-26 2023-01-05 株式会社東芝 測距装置及び測距方法
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
EP3805777A1 (de) * 2019-10-10 2021-04-14 Toposens GmbH Vorrichtungen und verfahren zur 3d-positionsbestimmung
US12028678B2 (en) 2019-11-01 2024-07-02 Shure Acquisition Holdings, Inc. Proximity microphone
CN110996244B (zh) * 2019-12-23 2021-08-03 四川虹美智能科技有限公司 麦克风阵列性能测试方法、装置及***
US11508348B2 (en) * 2020-02-05 2022-11-22 Motorola Mobility Llc Directional noise suppression
US11552611B2 (en) 2020-02-07 2023-01-10 Shure Acquisition Holdings, Inc. System and method for automatic adjustment of reference gain
CN113466840B (zh) * 2020-03-30 2022-09-20 阿里巴巴集团控股有限公司 测距方法、定位方法、装置、设备及***
US11183193B1 (en) 2020-05-11 2021-11-23 Apple Inc. Digital assistant hardware abstraction
US11706562B2 (en) 2020-05-29 2023-07-18 Shure Acquisition Holdings, Inc. Transducer steering and configuration systems and methods using a local positioning system
CN112365900B (zh) * 2020-10-30 2021-12-24 北京声智科技有限公司 一种语音信号增强方法、装置、介质和设备
WO2022150950A1 (zh) * 2021-01-12 2022-07-21 华为技术有限公司 评估传声器阵列一致性的方法和装置
CN116918351A (zh) 2021-01-28 2023-10-20 舒尔获得控股公司 混合音频波束成形***
CN113889137B (zh) * 2021-12-06 2022-04-01 中国科学院自动化研究所 麦克风阵列语音增强的方法、装置、电子设备及存储介质
CN117935837B (zh) * 2024-03-25 2024-05-24 中国空气动力研究与发展中心计算空气动力研究所 一种时域多声源定位及噪声处理方法

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100230231B1 (ko) 1994-05-31 1999-11-15 윤종용 다채널 오디오 마스킹처리장치
JP3797751B2 (ja) * 1996-11-27 2006-07-19 富士通株式会社 マイクロホンシステム
US6654468B1 (en) * 1998-08-25 2003-11-25 Knowles Electronics, Llc Apparatus and method for matching the response of microphones in magnitude and phase
JP2002540696A (ja) 1999-03-19 2002-11-26 シーメンス アクチエンゲゼルシヤフト ノイズ音響に満ちた環境でのオーディオ信号の受信と処理のための方法
EP1198974B1 (en) * 1999-08-03 2003-06-04 Widex A/S Hearing aid with adaptive matching of microphones
JP3599653B2 (ja) 2000-09-06 2004-12-08 日本電信電話株式会社 収音装置、収音・音源分離装置及び収音方法、収音・音源分離方法並びに収音プログラム、収音・音源分離プログラムを記録した記録媒体
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US20030112896A1 (en) 2001-07-11 2003-06-19 Raghavan Sreen A. Multi-channel communications transceiver
JP3716918B2 (ja) 2001-09-06 2005-11-16 日本電信電話株式会社 収音装置、方法及びプログラム、記録媒体
US7171008B2 (en) * 2002-02-05 2007-01-30 Mh Acoustics, Llc Reducing noise in audio systems
JP2004128707A (ja) * 2002-08-02 2004-04-22 Sony Corp 指向性を備えた音声受信装置およびその方法
DE602004022175D1 (de) 2003-09-02 2009-09-03 Nippon Telegraph & Telephone Signaltrennverfahren, signaltrenneinrichtung,signaltrennprogramm und aufzeichnungsmedium
JP2006100869A (ja) * 2004-09-28 2006-04-13 Sony Corp 音声信号処理装置および音声信号処理方法
KR100657912B1 (ko) * 2004-11-18 2006-12-14 삼성전자주식회사 잡음 제거 방법 및 장치
JP4247195B2 (ja) * 2005-03-23 2009-04-02 株式会社東芝 音響信号処理装置、音響信号処理方法、音響信号処理プログラム、及び音響信号処理プログラムを記録した記録媒体
JP4896449B2 (ja) 2005-06-29 2012-03-14 株式会社東芝 音響信号処理方法、装置及びプログラム
JP2007027939A (ja) * 2005-07-13 2007-02-01 Advanced Telecommunication Research Institute International 音響信号処理装置
JP4701931B2 (ja) 2005-09-02 2011-06-15 日本電気株式会社 信号処理の方法及び装置並びにコンピュータプログラム
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
JP5098176B2 (ja) 2006-01-10 2012-12-12 カシオ計算機株式会社 音源方向判定方法及び装置
JP4912036B2 (ja) * 2006-05-26 2012-04-04 富士通株式会社 指向性集音装置、指向性集音方法、及びコンピュータプログラム
JP4660740B2 (ja) * 2006-09-13 2011-03-30 独立行政法人産業技術総合研究所 電動車椅子搭載用音声入力装置
JP2008079256A (ja) 2006-09-25 2008-04-03 Toshiba Corp 音響信号処理装置、音響信号処理方法及びプログラム
WO2008062848A1 (fr) * 2006-11-22 2008-05-29 Funai Electric Advanced Applied Technology Research Institute Inc. Dispositif d'entrée vocale, procédé de production de ce dernier et système de traitement d'informations
US8041043B2 (en) * 2007-01-12 2011-10-18 Fraunhofer-Gessellschaft Zur Foerderung Angewandten Forschung E.V. Processing microphone generated signals to generate surround sound
US8005238B2 (en) * 2007-03-22 2011-08-23 Microsoft Corporation Robust adaptive beamforming with enhanced noise suppression
GB2453118B (en) 2007-09-25 2011-09-21 Motorola Inc Method and apparatus for generating and audio signal from multiple microphones
US8954324B2 (en) * 2007-09-28 2015-02-10 Qualcomm Incorporated Multiple microphone voice activity detector
US8620672B2 (en) * 2009-06-09 2013-12-31 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103380456A (zh) * 2010-12-29 2013-10-30 瑞典爱立信有限公司 噪声抑制方法和应用噪声抑制方法的噪声抑制器
CN103380456B (zh) * 2010-12-29 2015-11-25 瑞典爱立信有限公司 噪声抑制方法和应用噪声抑制方法的噪声抑制器
US9934787B2 (en) 2013-01-29 2018-04-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for coding mode switching compensation
US10734007B2 (en) 2013-01-29 2020-08-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for coding mode switching compensation
US11600283B2 (en) 2013-01-29 2023-03-07 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for coding mode switching compensation
US12067996B2 (en) 2013-01-29 2024-08-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for coding mode switching compensation
TWI749437B (zh) * 2013-03-21 2021-12-11 美商唯亞威方案公司 用於識別一海產樣本之方法及裝置與用於判定一海產樣本之鮮度之方法
TWI710779B (zh) * 2017-02-13 2020-11-21 美商高通公司 用於安全關鍵汽車使用例的現場自測試控制器、方法、和電腦可讀取媒體

Also Published As

Publication number Publication date
US20110038489A1 (en) 2011-02-17
CN102197424B (zh) 2013-07-17
EP2345031A1 (en) 2011-07-20
CN103295579B (zh) 2015-10-21
CN102197424A (zh) 2011-09-21
US8724829B2 (en) 2014-05-13
WO2010048620A1 (en) 2010-04-29
EP2345031B1 (en) 2015-07-29
JP2013240082A (ja) 2013-11-28
CN103295579A (zh) 2013-09-11
JP5307248B2 (ja) 2013-10-02
JP2012507049A (ja) 2012-03-22

Similar Documents

Publication Publication Date Title
TW201032220A (en) Systems, methods, apparatus, and computer-readable media for coherence detection
US8897455B2 (en) Microphone array subset selection for robust noise reduction
US9025782B2 (en) Systems, methods, apparatus, and computer-readable media for multi-microphone location-selective processing
JP5323995B2 (ja) マルチチャネル信号の残響除去のためのシステム、方法、装置、およびコンピュータ可読媒体
US8620672B2 (en) Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal
JP5575977B2 (ja) ボイスアクティビティ検出
US20110288860A1 (en) Systems, methods, apparatus, and computer-readable media for processing of speech signals using head-mounted microphone pair