TWI731391B - 麥克風裝置、電子裝置及其音訊信號處理方法 - Google Patents

麥克風裝置、電子裝置及其音訊信號處理方法 Download PDF

Info

Publication number
TWI731391B
TWI731391B TW108129047A TW108129047A TWI731391B TW I731391 B TWI731391 B TW I731391B TW 108129047 A TW108129047 A TW 108129047A TW 108129047 A TW108129047 A TW 108129047A TW I731391 B TWI731391 B TW I731391B
Authority
TW
Taiwan
Prior art keywords
microphone
sound signal
time
microphones
domain
Prior art date
Application number
TW108129047A
Other languages
English (en)
Other versions
TW202110205A (zh
Inventor
劉涵一
Original Assignee
緯創資通股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 緯創資通股份有限公司 filed Critical 緯創資通股份有限公司
Priority to TW108129047A priority Critical patent/TWI731391B/zh
Priority to CN201910826070.5A priority patent/CN112399304B/zh
Priority to US16/689,720 priority patent/US11109153B2/en
Publication of TW202110205A publication Critical patent/TW202110205A/zh
Application granted granted Critical
Publication of TWI731391B publication Critical patent/TWI731391B/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/403Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers loud-speakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/4012D or 3D arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/403Linear arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • H04R2430/21Direction finding using differential microphone array [DMA]

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Otolaryngology (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

一種麥克風裝置,包括:一麥克風陣列及一積體電路。麥克風陣列包括以非等間隔呈一直線設置的至少三個麥克風。積體電路係電性連接至該麥克風陣列。積體電路係用以分別將該等麥克風之不同組合混合相加的聲音信號經由一時域濾波器處理以產生一輸出聲音信號,其中輸出聲音信號在各個頻率的各個收音角度之聲音增益為實質地均衡。

Description

麥克風裝置、電子裝置及其音訊信號處理方法
本發明之實施例係有關於音訊裝置,特別是有關於一種具有線性麥克風陣列之麥克風裝置、電子裝置及其音訊信號處理方法。
隨著科技進步,可攜式電子裝置、個人電腦、筆記型電腦已被廣泛使用,且對使用麥克風陣列的產品之需求也隨之增加。舉例來說,麥克風陣列可包括複數個麥克風,且會被以一預定方式進行排列設置藉以擷取聲音信號。傳統的麥克風陣列例如為線性麥克風陣列,且線性麥克風陣列中的各個麥克風係以等間隔而一直線排列。
第5A圖為等間隔排列的線性麥克風陣列之示意圖。麥克風陣列500例如包括N個麥克風以相同間隔(例如為麥克風距離l)呈一直線排列。為了便於說明,在第5A圖中係繪示3個麥克風5011~5013。聲音信號之波前(wavefront)520與麥克風5011~5013之中心軸的對準方向522之間具有一收音角度θ。若聲 速為c且聲音信號之頻率為f,則聲音信號波長λ=c/f。其中,麥克風距離l、訊號接收角度及聲音信號波長λ均會影響麥克風陣列500所接收之聲音信號的強度。當麥克風陣列500使用N顆麥克風時,則麥克風陣列500之輸出聲音信號Aout可用式(1)表示:
Figure 108129047-A0305-02-0004-1
當使用等間隔排列的麥克風陣列500時,若聲音信號的頻率越低,則相應的收音場形的變化較為平緩且收音範圍越寬,故容易收到過多環境聲音(雜訊)。若聲音信號的頻率越高,則相應的收音場形的變化越劇烈且收音範圍變窄。當使用者稍微移動位置,收音的品質就變差(音量變小),且不同頻段收音的品質不一致。
第5B及5C圖為等間隔的線性麥克風陣列在不同頻率之極性圖。在第5B及5C圖中,外圈的數字為收音角度,其中0度為使用者位置或麥克風所對準的方向,且不同的同心圓例如代表不同的增益值(單位以dB表示)。舉例來說,給定麥克風距離l為20公分,當聲音信號在800Hz之頻率時,麥克風陣列500之收音場形如第5B圖之曲線501所示,其中在靠近0度角(即聲源方向)及180度角附近之角度範圍具有較良好的增益,且在90度及-90度角的增益較差,約衰減18dB。類似地,當聲音信號在4000Hz之頻率時,麥克風陣列500之收音場形如第5C圖之曲線502所示,其中在靠近0度角(使用者位置)、正負30度角、正負60度角、正負120度角、正負150度角、180度角才會有較良好的增益,且在多個特定收音角度的增益明顯較差。因此,在聲音頻率為4000Hz時,麥克風陣列500接收 使用者語音的範圍很小,且收到環境雜訊的比例較高。
詳細而言,使用等間隔的麥克風陣列500並無法在不同頻率之各個收音角度得到均衡一致的收音效果,故會降低使用者體驗。
有鑑於此,本發明之實施例係提供一種具有線性麥克風陣列之麥克風裝置、電子裝置及音訊信號處理方法以解決上述問題。
本發明之實施例係提供一種麥克風裝置,包括:一麥克風陣列及一積體電路。麥克風陣列包括以非等間隔呈一直線設置的至少三個麥克風。積體電路係電性連接至該麥克風陣列。積體電路係用以分別將該等麥克風之不同組合混合相加的聲音信號經由一時域濾波器處理以產生一輸出聲音信號。
本發明之實施例更提供一種音訊信號處理方法,包括下列步驟:提供一麥克風陣列,其中麥克風陣列包括以非等間隔呈一直線設置的至少三個麥克風;分別將該等麥克風之不同組合混合相加的聲音信號經由一時域濾波器處理以產生一輸出聲音信號,其中該輸出聲音信號為一時域聲音信號,且該輸出聲音信號在各個頻率的各個收音角度之聲音增益為實質地均衡。
本發明之實施例更提供一種電子裝置,包括:一麥克風裝置及一處理器。麥克風裝置包括一麥克風陣列及一積體電路。麥克風陣列包括以非等間隔呈一直線設置的至少三個麥克風。積體電路係電性連接至該麥克風陣列。積體電路係用以分別將該等 麥克風之不同組合混合相加的聲音信號經由一時域濾波器處理以產生一輸出聲音信號。處理器係電性連接至該麥克風裝置,並用以將該輸出聲音信號進行快速傅立葉轉換以得到一頻域聲音信號以進行語音辨識。
100:麥克風裝置
102、200、300:使用者
103:人聲信號
110:積體電路
120:麥克風陣列
121-12N:麥克風
202-206、231-236、302-308:聲音信號
331-338、371-380:聲音信號
240、340、382:輸出聲音信號
211-213、311-314、361-365:濾波器
210、310、360:音訊處理階段
261-261、501-502、3001-3005:曲線
500:麥克風陣列
520:波前
522:對準方向
5011-5013:麥克風
θ:收音角度
D1-D4:麥克風距離
S410、S420-S426:步驟
第1圖為依據本發明一實施例中之麥克風裝置的方塊圖。
第2A圖為依據本發明一實施例中之麥克風陣列進行音訊處理之流程的示意圖。
第2B及2C圖為依據本發明第2A圖之實施例中在不同頻率的極性圖。
第3A圖為依據本發明另一實施例中之麥克風陣列進行音訊處理之流程的示意圖。
第3B圖為依據本發明第3A圖實施例中之不同麥克風陣列之頻率響應的示意圖。
第3C圖為依據本發明又一實施例中之麥克風裝置進行音訊處理之流程的示意圖。
第4A圖為依據本發明一實施例中之音訊信號處理方法的流程圖。
第4B圖為依據本發明第4A圖之實施例中步驟S420的流程圖。
第5A圖為等間隔排列的線性麥克風陣列之示意圖。
第5B及5C圖為等間隔的線性麥克風陣列在不同頻率之極性圖。
以下說明係為完成發明的較佳實現方式,其目的在於描述本發明的基本精神,但並不用以限定本發明。實際的發明內容必須參考之後的申請專利範圍。
於申請專利範圍中使用如"第一"、"第二"、"第三"等詞係用來修飾權利要求中的元件,並非用來表示之間具有優先權順序,先行關係,或者是一個元件先於另一個元件,或者是執行方法步驟時的時間先後順序,僅用來區別具有相同名字的元件。
第1圖係顯示依據本發明一實施例中之麥克風裝置的方塊圖。麥克風裝置100可設置於一電子裝置中,例如個人電腦、筆記型電腦、顯示器、伺服器、可攜式電子裝置、機上盒等等,用以接收使用者所發出之人聲信號。麥克風裝置100並對所接收的人聲信號進行時域濾波處理以產生輸出聲音信號,使得輸出聲音信號可以在不同頻率的各個收音角度具有較一致的聲音增益(gain)。
如第1圖所示,麥克風裝置100包括一積體電路110及一麥克風陣列120。積體電路110及麥克風陣列120例如可設置於一電路板130上。麥克風陣列120包括至少三個麥克風,例如麥克風121~12N,其中N為大於或等於3的整數。麥克風121~12N係以非等間隔(non-uniform configuration)進行一直線排列,並用以接收使用者102所發出的人聲信號103。每個麥克風121~12N例如為全指向性(omnidirectional)麥克風且具有相同的感度。此外,每個麥克風121~12N可包括用於放大聲音信號的聲音放大器以及將所接收的聲音信號轉換為電性信號的類比至數位轉換器(analog-to-digital converter,ADC)。
在一些實施例中,積體電路110可直接連接並控制麥克風121~12N。在一些實施例中,積體電路110可透過導體(或導線)連接至電路板130,再透過其他導體耦接至麥克風121~12N,藉此提供電壓至麥克風121~12N並且接收及處理麥克風121~12N所產生的電性訊號。
在一些實施例中,積體電路110例如可為一應用導向積體電路,其包括數位電路(例如可執行數位訊號處理的電路)、類比電路(例如運算放大器)與類比/數位轉換電路。在另一些實施例中,積體電路110可為一數位信號處理器(digital signal processor)、一微控制器(micro control unit,MCU)、或一微處理器(microprocessor unit,MPU),但本發明之實施例並不限於此。
第2A圖為依據本發明一實施例中之麥克風陣列進行音訊處理之流程的示意圖。請同時參考第1圖及第2A圖。
為了便於說明,在第2A圖之實施例中,麥克風陣列120係以3個麥克風121~123所實現,且麥克風121~123係可設置於麥克風裝置100的相同平面上,例如正面平面或是側面平面上。此外,麥克風121~123係以非等間隔進行直線排列。舉例來說,麥克風121及122之間的麥克風距離例如為D1,麥克風122及123之間的麥克風距離例如為D2,且麥克風距離D1不等於麥克風距離D2,如第2A圖所示。此外,麥克風121及123之間的麥克風距離例如為D3,且麥克風距離D1~D3的關係為:D3 > D2 > D1。在一些實施例中,麥克風距離D1、D2及D3例如分別為3公分、4.5公分、及7.5公分,但本發明之實施例並不限於此。需注意的是,麥克風距離D1~D3可視麥克風裝置100之使用需求而特別設計,但相鄰的兩個麥克風之間的最小距離D需要不會產生空間頻疊(spatial aliasing)為準,例如可用式(2)表示:
Figure 02_image003
其中聲音信號的波長最小值λmin 例如會發生在收音角度θ 為90度時,且波長最小值λmin 係對應於聲音信號的頻率最大值fmax ,例如為8000Hz~15000Hz,且波長最小值λmin 與頻率最大值fmax 之關係式可用式(3)表示:
Figure 02_image005
收音角度θ 係表示聲音信號之波前(意即聲音來源方向)與麥克風121、122、123之中心軸的對準方向之間的夾角。在此實施例中,麥克風陣列120中的任兩個麥克風均可構成一麥克風陣列或麥克風對(microphone pair)。因為在麥克風陣列120中的各個麥克風對的兩個麥克風之間的麥克風距離均不同(例如為D1、D2、D3),故任兩個麥克風所構成的麥克風對所對應的聲音信號之頻率也不同。
舉例來說,依據尼奎斯特定理(Nyquist Theorem),取樣頻率至少需為各麥克風對所擷取的聲音信號頻率的兩倍才不會造成空間頻疊。舉例來說,若麥克風對的距離為d且音速為c(例如340公尺/秒),則該麥克風對所對應不失真的最大頻率f0 可用式(4)表示:
Figure 02_image007
若麥克風對的距離為d=5公分且音速c為340公尺/秒,則此麥克風對所擷取之聲音信號在頻率3400Hz時不會產生空間頻疊。
當使用者200發出人聲信號201時,麥克風121~123會接收到人聲信號並分別產生聲音信號202、204及206,其中聲音信號202及204會混合相加(merge)以得到聲音信號231,聲音信號202及206會混合相加以得到聲音信號232,且聲音信號204及206會混合相加以得到聲音信號233。聲音信號231、232及233係分別傳送至濾波器211、212及213,其中濾波器211、212及213分別為時域(time domain)的高通濾波器、低通濾波器及帶通濾波器。其中,時域的高通濾波器、低通濾波器及帶通濾波器可用本發明領域中習知的各式濾波器或是經過適當設計濾波器參數的數位濾波器所實現。在一些實施例中,低通濾波器例如可使用時域的sinc濾波器、單位盒子濾波器(unit box filter)、單位高斯濾波器(unit Gaussian filter)所實現,但本發明之實施例並不限於此。
聲音信號231、232及233分別經過濾波器211、212及213處理後會得到過濾後的聲音信號234、235及236,且聲音信號234、235及236會再混合相加以得到輸出聲音信號240。需注意的是,在麥克風裝置100中之音訊處理階段210均是使用時域的聲音信號,且濾波器211、212及213所產生過濾的聲音信號234、235及236、以及傳送至後端處理的輸出聲音信號240均為時域的聲音信號。舉例來說,麥克風裝置100中之各個濾波器的輸入聲音信號例如可表示為s(t),且濾波器在時域的轉換函數可表示為h(t)。因此,各個濾波器可將輸入聲音信號s(t)及轉換函數h(t)進行時域的摺積(convolution)運算,且濾波器所產生的聲音信號同樣為時域的聲音信號。
需注意的是,因為麥克風裝置100為音訊處理之前端裝置,故不需具備強大的運算能力。因此,麥克風裝置100之濾波器可進行時域的摺積運算,且不會消耗過多系統資源及功耗。麥克風裝置100的輸出聲音信號240係傳送至後端處理250(例如為電子裝置中之後端處理部件)以進行後續的音訊處理,且後端處理250係配備運算能力較強的處理器可將時域的輸出聲音信號240進行快速傅立葉轉換(Fast Fourier Transform,FFT)轉換至頻域的聲音信號,並接著分析頻域的聲音信號進行相應的音訊處理,例如可辨識音源方向、過濾雜訊、波束成形(beamforming)、語音辨識等等,但本發明之實施例並不限於此。一般而言,頻率範圍在300~4000Hz的聲音信號以足夠讓後端處理250辨別特定人的語音及內容。
本發明領域中具有通常知識者當可了解快速傅立葉轉換需要對輸入信號的實部(real part)及虛部(imaginary part)進行乘法運算及積分運算才能得到頻域聲音信號S(f) ,如式(5)所示:
Figure 02_image009
若每個濾波器均用頻域濾波器實現,則麥克風裝置需要對輸入聲音信號先進行快速傅立葉轉換後,再進行摺積運算。因為任意兩個麥克風即可構成一麥克風陣列,若使用頻域的濾波器則需要進行個別的快速傅立葉轉換運算。因此,若使用頻域的濾波器,其總運算量相當龐大且大量耗費系統資源,並不適用於設置於音訊處理流程之前端的麥克風裝置。
本發明實施例的麥克風裝置100中的各個麥克風接收人聲信號後所產生的聲音信號的相關運算在時域即可完成,且麥克風裝置100之運算並不需要使用到快速傅立葉轉換,故可大幅降低運算量。此外,因為麥克風裝置100是使用時域的濾波器,且麥克風裝置100最後輸出的聲音信號240亦是時域的聲音信號。因此,無論麥克風陣列120使用多少個麥克風,後端處理250可對麥克風裝置100輸出的聲音信號240進行一次快速傅立葉轉換就能得到頻域聲音信號以進行後續的分析及音訊處理,故可大幅減少運算量。
在第2A圖之實施例中,若對麥克風裝置100之輸出聲音信號240進行分析,則可得到如第2B及2C圖所示的極性圖,其中,第2B圖之曲線261係對應於800Hz頻率之聲音信號,第2C圖之曲線262係對應於4000Hz頻率之聲音信號。
如第2B圖所示,聲音信號之頻率在800Hz時,在0度及180度角的收音角度之聲音增益略大於0dB,且正負90度角的收音角度之聲音增益約可提升至-5dB左右。請再參考第5B圖,利用等間隔的傳統線性麥克風所產生的聲音信號在正負90度角的聲音增益會有嚴重的衰減,例如可達-20dB。詳細而言,如第2B圖之曲線261所示,當聲音信號之頻率為800Hz時,麥克風裝置100處理後所產生的聲音信號在不同的收音角度之聲音增益的上限及下限的差距係小於一預定值(例如約為6dB),故可視為人聲信號經過麥克風裝置100處理後所產生的聲音信號在各個收音角度的聲音增益為實質地均衡。
如第2C圖所示,聲音信號之頻率在4000Hz時,在0度及180度角的收音角度之聲音增益略大於0dB,且正負90度角的收音角度之聲音增益約可提升至-5dB。請再參考第5C圖,利用等間隔的線性麥克風所產生的聲音信號在許多特定收音角度的聲音增益會有嚴重的衰減,例如可達-50dB。詳細而言,如第2C圖之曲線262所示,當聲音信號之頻率為4000Hz時,麥克風裝置100處理後所產生的聲音信號在不同的收音角度之聲音增益的上限及下限的差距係小於一預定值(例如約為6dB),故可視為人聲信號經過麥克風裝置100處理後所產生的聲音信號在各個收音角度的聲音增益實質地均衡。
此外,上述實施例係使用800Hz及4000Hz的聲音信號為例,除了第2B圖及第2C圖之極性圖的曲線亦相當類似,在其他頻率的聲音信號亦有類似於第2B~2C圖中所示的極性圖之曲線,意即透過麥克風裝置100之處理後所產生的聲音信號可在各個頻率(包括高頻及低頻)的各個收音角度的聲音增益為實質地均衡。因此,當使用者之位置移動時(即收音角度改變時),麥克風裝置100仍然可提供良好的收音品質。
第3A圖為依據本發明另一實施例中之麥克風陣列進行音訊處理之流程的示意圖。請同時參考第1圖及第3A圖。
在另一實施例中,麥克風陣列120包括四個麥克風,例如麥克風121~124。麥克風121~124之設置方式係類似於第2A圖之實施例,且麥克風121~123係以非等間隔進行直線排列。舉例來說,麥克風121及122之間的麥克風距離例如為D1,麥克風122及123之間的麥克風距離例如為D2,麥克風123及124之間的麥克風距離例如為D3,麥克風121及124之間的麥克風距離例如為D4。其中,麥克風距離D1不等於麥克風距離D2,且麥克風距離D2不等於麥克風距離D3,如第3A圖所示。
在一些實施例中,麥克風距離D1~D4的關係為:D4>D2>D3>D1。在另一些實施例中,麥克風距離D1~D4的關係例如為D4>D2>D3=D1,其中麥克風距離D1~D4例如分別為3公分、4.5公分、3公分及10.5公分,但本發明之實施例並不限於此。需注意的是,麥克風距離D1~D4可視麥克風裝置100或音訊處理的使用需求而特別設計。
第3B圖為依據本發明第3A圖實施例中之不同麥克風陣列之頻率響應的示意圖。
麥克風121~124之任兩者同樣可構成一麥克風陣列。第3A圖之音訊處理階段310使用了4個不同組合的麥克風對,例如分別為麥克風121及122、麥克風121及124、麥克風122及123、麥克風123及124。因為麥克風121及124之間的麥克風距離D4最長,故麥克風121所產生的聲音信號302及麥克風124所產生的聲音信號308相加得到的聲音信號332會被傳送至濾波器312,例如為一低通濾波器。因為麥克風121及122之間的麥克風距離D1最短,故麥克風121所產生的聲音信號302及麥克風122所產生的聲音信號304相加得到的聲音信號331會被傳送至濾波器311,例如為一高通濾波器。此外,其餘麥克風對,例如麥克風121及123以及麥克風123及124之組合,所得到的聲音信號333及334會被分別傳送至濾波器313及314,例如均為帶通濾波器。
經過適當設計,濾波器311~314之頻率響應的範圍例如可分別對應至互不重疊的不同頻段。舉例來說,濾波器312為低通濾波器,其頻率響應如曲線3001所示,截止頻率約為1200Hz;濾波器313為帶通濾波器,其頻率響應如曲線3002所示,高截止頻率及低截止頻率例如分別為2500Hz及1200Hz;濾波器314為帶通濾波器,其頻率響應如曲線3003所示,高截止頻率及低截止頻率例如分別為4000Hz及2900Hz;濾波器315為高通濾波器,其頻率響應如曲線3004所示,截止頻率約為4500Hz。因此,濾波器311~314之整體的頻率響應可用曲線3005表示,如第3B圖所示。如第3B圖中的曲線3005所示,麥克風裝置100輸出的聲音信號340在0~6000Hz的頻率範圍內的不同頻率下之振幅的增益約介於-2dB~-5dB之間,意即麥克風裝置100輸出的聲音信號340在不同頻率下之聲音增益上限及下限的差距係小於一預定值(例如約為6dB)。本發明之實施例並不限於上述組態的濾波器設計,本發明領域中具有通常知識者可針對實際情況而調整各個濾波器之截止頻率。
在第3A圖之實施例中,若對麥克風裝置100輸出的聲音信號340進行分析,則可得到類似於第2B及2C圖所示的極性圖,意即透過麥克風裝置100之處理後所產生的聲音信號可在高頻及低頻的各個收音角度的聲音增益為實質地均衡(substantially uniform)。因此,若使用者之位置移動時(即收音角度改變時),麥克風裝置100仍然可提供良好的收音品質。
第3C圖為依據本發明又一實施例中之麥克風裝置進行音訊處理之流程的示意圖。第3C圖之實施例中之麥克風121~ 124的設置方式係類似於第3A圖,其差別在於第3C圖之音訊處理階段360使用了5個不同組合的麥克風對。舉例來說,在第3C圖之實施例中,麥克風121及122、麥克風122及123、及麥克風121及124之組合相加而得的聲音信號371、373及375係與第3A圖中之聲音信號331、333及332類似,且濾波器361、363、365係分別與第3A圖中之濾波器311、313及314類似。
此外,因為麥克風122及124、以及麥克風121及123之間的距離均為3+4.5=7.5公分,故由麥克風121及123以及麥克風122及124之組合所得到的聲音信號335及336會被會分別傳至濾波器362及364,且濾波器362及364例如均為帶通濾波器,且濾波器362及364對應的頻帶重疊。濾波器362及364所產生的聲音信號377及379會各自除以具有重疊麥克風距離之麥克風對的數量(例如為預定數量)後再與其他濾波器361、363及365所產生的聲音信號376、378及380相加而得到聲音信號382,且聲音信號382可同樣傳送至後端處理350。
在此實施例中,因為麥克風123及124之間的距離最短,故其相應的濾波器361可用一帶通濾波器或一高通濾波器(例如截止頻率為4500Hz)實現。若濾波器361使用帶通濾波器實現,則其低截止頻率/高截止頻率例如可分別為4500及8000Hz,其中高截止頻率可對應至人耳所能感知的聲音頻率上限,但本發明之實施例並不限於此。若濾波器361使用高通濾波器實現,則其設計係類似於第3A圖中之濾波器311,例如具有截止頻率為4500Hz。需注意的是,在第3C圖中之濾波器361~365同樣為時域的濾波器,故可大幅降低運算量。
第4A圖為依據本發明一實施例中之音訊信號處理方法的流程圖。請同時參考第1圖及第4A圖。
在步驟S410,提供一麥克風陣列,其中該麥克風陣列包括以非等間隔呈一直線設置的至少三個麥克風,且該至少三個麥克風包括複數個麥克風對。在一些實施例中,各麥克風對所相應的麥克風距離均不重複,如第2A圖之實施例。在另一些實施例中,各麥克風對所相應的麥克風距離有部分重複,如第3A及3C圖之實施例。
在步驟S420,分別將該等麥克風之不同組合混合相加的聲音信號經由一時域濾波器處理以產生一輸出聲音信號。其中,步驟S420之詳細流程包括步驟S422~S426,請參考第4B圖。
第4B圖為依據本發明第4A圖之實施例中步驟S420的流程圖。請同時參考第1圖及第4A~4B圖。在第4A圖中之步驟S420例如可包括第4B圖中之步驟S422、S424及S426。
在步驟S422,依據該至少三個麥克風中之各麥克風對的間隔以將各麥克風對所接收的第一聲音信號混合相加以產生相應的一第二聲音信號。舉例來說,各麥克風對包括兩個麥克風,且此兩個麥克風所擷取的第一聲音信號會被相加混合以產生第二聲音信號。
在步驟S424,將各麥克風對相應的第二聲音信號套用一時域濾波器以產生一第三聲音信號。其中,各麥克風對相應的該第三聲音信號係分別對應至一頻段(frequency band)。在一些實施例中,若各麥克風對所相應的麥克風距離均不重複,則各時域濾波器所對應的頻帶亦互不重疊。在另一些實施例中,在該等麥克風對之其餘的麥克風對中有一預定數量的複數個第三麥克風對之麥克風距離相同,如第3C圖之實施例所述,則各第三麥克風對相應的該時域濾波器所對應的頻帶重疊,故在混合相加以產生輸出聲音信號時,積體電路110會先將各第三麥克風對所相應的該時域濾波器所 產生的該第二聲音信號除以該預定數量,如第3C圖所示。
在步驟S426,將各時域濾波器所產生的第三聲音信號相加混合以產生輸出聲音信號。其中,輸出聲音信號為一時域聲音信號,且輸出聲音信號在各個頻率的各個收音角度之聲音增益為實質地均衡,如第3B及3C圖所示。
綜上所述,本發明之實施例係提供一種麥克風裝置及其音訊信號處理方法,其中麥克風裝置包括以非等間隔呈一直線設置的至少三個麥克風,且麥克風裝置係使用時域的濾波器以對上述至少三個麥克風中之各個麥克風對所擷取混合相加的聲音信號進行濾波處理,使得麥克風裝置之輸出聲音信號在各個頻率的各個收音角度之聲音增益為實質地均衡。當使用者之位置移動時(即收音角度改變時),麥克風裝置仍然可提供良好的收音品質,進而增加使用者體驗。
本發明之實施例揭露如上,然其並非用以限定本發明的範圍,任何所屬技術領域中具有通常知識者,在不脫離本發明之精神和範圍內,當可做些許的更動與潤飾,因此本發明之保護範圍當視後附之申請專利範圍所界定者為準。
100:麥克風裝置
102:使用者
103:人聲信號
110:積體電路
120:麥克風陣列
121-12N:麥克風
130:電路板

Claims (9)

  1. 一種麥克風裝置,包括:一麥克風陣列,包括以非等間隔呈一直線設置的至少三個麥克風;以及一積體電路,電性連接至該麥克風陣列,該積體電路係用以分別將該等麥克風之不同組合混合相加的聲音信號經由一時域濾波器處理以產生一輸出聲音信號;其中在該等麥克風之不同組合中有一預定數量的第一組合的麥克風距離相同;其中各第一組合相應的該時域濾波器所對應的頻帶重疊,且該積體電路係將各第一組合所相應的該時域濾波器所產生的聲音信號除以該預定數量再與其他各時域濾波器所產生的聲音信號混合相加以產生該輸出聲音信號。
  2. 如申請專利範圍第1項所述之麥克風裝置,其中該輸出聲音信號為一時域聲音信號,且該輸出聲音信號在各個頻率的各個收音角度之聲音增益為實質地均衡。
  3. 如申請專利範圍第1項所述之麥克風裝置,其中該等麥克風依序包括一第一麥克風、一第二麥克風、及一第三麥克風,且具有最短麥克風距離的該第一麥克風及該第二麥克風所相應的該時域濾波器為一高通濾波器,且具有最長麥克風距離的該第一麥克風及該第三麥克風所相應的該時域濾波器為一低通濾波器;其中該第二麥克風及該第三麥克風之組合所相應的該時域濾波器為一帶通濾波器。
  4. 如申請專利範圍第3項所述之麥克風裝置,其中該等麥克風之不同組合相應的各時域濾波器所對應的頻帶互不重疊。
  5. 如申請專利範圍第1項所述之麥克風裝置,其中該積體電路係將該輸出聲音信號傳送至一後端處理裝置,且該後端處理裝置係將該輸出聲音信號進行快速傅立葉轉換以得到一頻域聲音信號以進行語音辨識。
  6. 一種音訊信號處理方法,該方法包括:提供一麥克風陣列,其中該麥克風陣列包括以非等間隔呈一直線設置的至少三個麥克風;以及分別將該等麥克風之不同組合混合相加的聲音信號經由一時域濾波器處理以產生一輸出聲音信號,其中該輸出聲音信號為一時域聲音信號,且該輸出聲音信號在各個頻率的各個收音角度之聲音增益為實質地均衡;其中在該等麥克風之不同組合中有一預定數量的第一組合的麥克風距離相同,且各第一組合相應的該時域濾波器所對應的頻帶重疊,且該方法更包括:將各第一組合所相應的該時域濾波器所產生的聲音信號除以該預定數量再與其他各時域濾波器所產生的聲音信號混合相加以產生該輸出聲音信號。
  7. 如申請專利範圍第6項所述之音訊信號處理方法,其中該等麥克風依序包括一第一麥克風、一第二麥克風、及一第三麥克風,且具有最短麥克風距離的該第一麥克風及該第二麥克風所相應的該時域濾波器為一高通濾波器,且具有最長麥克風距離的該第一麥克風及該第三麥克風所相應的該時域濾波器為一低通濾波器;其中該第二麥克風及該第三麥克風之組合所相應的該時域濾波 器為一帶通濾波器;其中該等麥克風之不同組合相應的各時域濾波器所對應的頻帶互不重疊。
  8. 如申請專利範圍第6項所述之音訊信號處理方法,更包括:將該輸出聲音信號傳送至一後端處理裝置;以及利用該後端處理裝置將該輸出聲音信號進行快速傅立葉轉換以得到一頻域聲音信號以進行語音辨識。
  9. 一種電子裝置,包括:一麥克風裝置,包括:一麥克風陣列,包括以非等間隔呈一直線設置的至少三個麥克風;以及一積體電路,電性連接至該麥克風陣列,該積體電路係用以分別將該等麥克風之不同組合混合相加的聲音信號經由一時域濾波器處理以產生一輸出聲音信號,其中該輸出聲音信號為一時域聲音信號,且該輸出聲音信號在各個頻率的各個收音角度之聲音增益為實質地均衡;以及一處理器,電性連接至該麥克風裝置,用以將該輸出聲音信號進行快速傅立葉轉換以得到一頻域聲音信號以進行語音辨識;其中在該等麥克風之不同組合中有一預定數量的第一組合的麥克風距離相同;其中各第一組合相應的該時域濾波器所對應的頻帶重疊,且該積體電路係將各第一組合所相應的該時域濾波器所產生的聲音信號除以該預定數量再與其他各時域濾波器所產生的聲音信號 混合相加以產生該輸出聲音信號。
TW108129047A 2019-08-15 2019-08-15 麥克風裝置、電子裝置及其音訊信號處理方法 TWI731391B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW108129047A TWI731391B (zh) 2019-08-15 2019-08-15 麥克風裝置、電子裝置及其音訊信號處理方法
CN201910826070.5A CN112399304B (zh) 2019-08-15 2019-09-03 麦克风装置、电子装置及其音频信号处理方法
US16/689,720 US11109153B2 (en) 2019-08-15 2019-11-20 Microphone apparatus and electronic device having linear microphone array with non-uniform configuration and method of processing sound signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW108129047A TWI731391B (zh) 2019-08-15 2019-08-15 麥克風裝置、電子裝置及其音訊信號處理方法

Publications (2)

Publication Number Publication Date
TW202110205A TW202110205A (zh) 2021-03-01
TWI731391B true TWI731391B (zh) 2021-06-21

Family

ID=74566768

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108129047A TWI731391B (zh) 2019-08-15 2019-08-15 麥克風裝置、電子裝置及其音訊信號處理方法

Country Status (3)

Country Link
US (1) US11109153B2 (zh)
CN (1) CN112399304B (zh)
TW (1) TWI731391B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020241050A1 (ja) * 2019-05-28 2020-12-03 ソニー株式会社 音声処理装置、音声処理方法およびプログラム
US11630999B2 (en) * 2019-12-19 2023-04-18 Dish Network Technologies India Private Limited Method and system for analyzing customer calls by implementing a machine learning model to identify emotions

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4751738A (en) * 1984-11-29 1988-06-14 The Board Of Trustees Of The Leland Stanford Junior University Directional hearing aid
US20040175006A1 (en) * 2003-03-06 2004-09-09 Samsung Electronics Co., Ltd. Microphone array, method and apparatus for forming constant directivity beams using the same, and method and apparatus for estimating acoustic source direction using the same

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4311874A (en) * 1979-12-17 1982-01-19 Bell Telephone Laboratories, Incorporated Teleconference microphone arrays
JPH0728470B2 (ja) * 1989-02-03 1995-03-29 松下電器産業株式会社 アレイマイクロホン
JP3216704B2 (ja) * 1997-08-01 2001-10-09 日本電気株式会社 適応アレイ装置
NZ502603A (en) * 2000-02-02 2002-09-27 Ind Res Ltd Multitransducer microphone arrays with signal processing for high resolution sound field recording
CA2354858A1 (en) * 2001-08-08 2003-02-08 Dspfactory Ltd. Subband directional audio signal processing using an oversampled filterbank
JP4671303B2 (ja) * 2005-09-02 2011-04-13 国立大学法人北陸先端科学技術大学院大学 マイクロホンアレイ用ポストフィルタ
US8189806B2 (en) * 2005-11-01 2012-05-29 Panasonic Corporation Sound collection apparatus
TWM330707U (en) 2007-11-08 2008-04-11 Univ Southern Taiwan Audio extractor using rectangle microphone array
US20110288860A1 (en) * 2010-05-20 2011-11-24 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for processing of speech signals using head-mounted microphone pair
KR101782050B1 (ko) * 2010-09-17 2017-09-28 삼성전자주식회사 비등간격으로 배치된 마이크로폰을 이용한 음질 향상 장치 및 방법
CN102447993A (zh) * 2010-09-30 2012-05-09 Nxp股份有限公司 声音场景操纵
TWI406266B (zh) * 2011-06-03 2013-08-21 Univ Nat Chiao Tung 語音辨識裝置及其辨識方法
CN102306496B (zh) * 2011-09-05 2014-07-09 歌尔声学股份有限公司 一种多麦克风阵列噪声消除方法、装置及***
JP6763721B2 (ja) * 2016-08-05 2020-09-30 大学共同利用機関法人情報・システム研究機構 音源分離装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4751738A (en) * 1984-11-29 1988-06-14 The Board Of Trustees Of The Leland Stanford Junior University Directional hearing aid
US20040175006A1 (en) * 2003-03-06 2004-09-09 Samsung Electronics Co., Ltd. Microphone array, method and apparatus for forming constant directivity beams using the same, and method and apparatus for estimating acoustic source direction using the same

Also Published As

Publication number Publication date
US11109153B2 (en) 2021-08-31
US20210051401A1 (en) 2021-02-18
CN112399304B (zh) 2022-09-20
TW202110205A (zh) 2021-03-01
CN112399304A (zh) 2021-02-23

Similar Documents

Publication Publication Date Title
Huang et al. Insights into frequency-invariant beamforming with concentric circular microphone arrays
US9094496B2 (en) System and method for stereophonic acoustic echo cancellation
US8903108B2 (en) Near-field null and beamforming
Teutsch et al. First-and second-order adaptive differential microphone arrays
JP5123843B2 (ja) マイクロフォンアレイおよびデジタル信号処理システム
CN103856866B (zh) 低噪微分麦克风阵列
JP4066197B2 (ja) マイクロフォン装置
Torres et al. Robust acoustic source localization based on modal beamforming and time–frequency processing using circular microphone arrays
US9020163B2 (en) Near-field null and beamforming
TWI731391B (zh) 麥克風裝置、電子裝置及其音訊信號處理方法
EP2360940A1 (en) Steerable microphone array system with a first order directional pattern
KR102191736B1 (ko) 인공신경망을 이용한 음성향상방법 및 장치
US20150063591A1 (en) Sound receiving system
US11330368B2 (en) Portable microphone array apparatus and system and processing method
WO2023108864A1 (zh) 小型麦克风阵列设备的区域拾音方法及***
US6718041B2 (en) Echo attenuating method and device
WO2022142833A1 (zh) 信号处理方法、设备及装置
Todorović et al. Implementation and application of FPGA platform with digital MEMS microphone array
US20140269198A1 (en) Beamforming Sensor Nodes And Associated Systems
Geng et al. A speech enhancement method based on the combination of microphone array and parabolic reflector
Lin et al. Development of novel hearing aids by using image recognition technology
US11284187B1 (en) Small-array MEMS microphone apparatus and noise suppression method thereof
EP2757811A1 (en) Modal beamforming
Pinardi et al. Full-Digital Microphone Meta-Arrays for Consumer Electronics
CN113645542B (zh) 语音信号处理方法和***及音视频通信设备