TWI590239B - 語音信號處理裝置及語音信號處理方法 - Google Patents
語音信號處理裝置及語音信號處理方法 Download PDFInfo
- Publication number
- TWI590239B TWI590239B TW105140854A TW105140854A TWI590239B TW I590239 B TWI590239 B TW I590239B TW 105140854 A TW105140854 A TW 105140854A TW 105140854 A TW105140854 A TW 105140854A TW I590239 B TWI590239 B TW I590239B
- Authority
- TW
- Taiwan
- Prior art keywords
- loudness
- gain
- filtered
- frequency band
- dynamic range
- Prior art date
Links
- 238000003672 processing method Methods 0.000 title claims description 20
- 238000007906 compression Methods 0.000 claims description 81
- 230000006835 compression Effects 0.000 claims description 75
- 238000001914 filtration Methods 0.000 claims description 22
- 238000000034 method Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 208000032041 Hearing impaired Diseases 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
- H03G9/025—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/35—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using translation techniques
- H04R25/356—Amplitude, e.g. amplitude shift or compression
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Description
本發明是有關於一種信號處理裝置,且特別是有關於一種語音信號處理裝置及語音信號處理方法。
多頻帶的寬動態範圍壓縮(Wide Dynamic Range Compression, WDRC)技術廣泛在助聽器的範圍被使用,寬動態範圍壓縮的主要功能是提高響度小的語音信號的響度增益,以利辨識,並降低響度大的語音信號的響度增益,以避免聲音太大造成不舒服。一般來說,多頻帶的寬動態範圍壓縮是每一個頻帶各自獨立進行語音信號的處理,各個頻帶的寬動態範圍壓縮曲線為依據個人需求進行聽力檢測所決定。在對輸入語音信號進行寬動態範圍壓縮處理時,為分別以各個頻帶的輸入語音信號的響度檢測結果為基準配合對應的寬動態範圍壓縮曲線來決定各頻帶的輸出語音信號的響度。此處理方式雖可提高輸出語音信號的響度,然當雜訊信號的響度所對應的響度增益較大時,將可能造成訊雜比下降,而使得輸出語音信號的辨識度下降。
本發明提供一種語音信號處理裝置及語音信號處理方法,可有效地避免多頻帶的寬動態範圍壓縮處理造成輸出語音信號的訊雜比下降,大幅地提高輸出語音信號的辨識度。
本發明的語音信號處理裝置包括濾波單元以及處理單元。濾波單元接收輸入語音信號,對輸入語音信號進行濾波,以產生不同頻帶的多個濾波信號。處理單元檢測輸入語音信號的響度,以獲得基準響度,依據基準響度與各頻帶對應的寬動態範圍壓縮曲線計算對應各頻帶的基準響度增益,將濾波信號與濾波信號對應的基準響度增益進行乘法運算,以得到對應不同頻帶的多個響度調整濾波信號,將響度調整濾波信號進行加法運算,以產生輸出語音信號。
在本發明的一實施例中,上述各寬動態範圍壓縮曲線為單位增益曲線分別進行各頻帶對應的寬動態範圍壓縮處理後所得到的曲線,處理單元更依據各頻帶對應的寬動態範圍壓縮曲線上對應基準響度的第一輸出響度以及單位增益曲線上對應基準響度的第二輸出響度計算基準響度增益。
在本發明的一實施例中,上述的處理單元更檢測上述多個濾波信號的響度,以獲得多個濾波響度,依據各濾波響度與各頻帶對應的寬動態範圍壓縮曲線分別計算各頻帶的濾波響度增益,將各頻帶的基準響度增益與濾波響度增益進行比較,以分別選擇出具有較小增益值的響度增益,將選擇出的具有較小增益值的響度增益分別與對應的各該頻帶的濾波信號進行乘法運算,以得到上述多個響度調整濾波信號。
在本發明的一實施例中,上述各寬動態範圍壓縮曲線為單位增益曲線分別進行各頻帶對應的寬動態範圍壓縮處理後所得到的曲線,處理單元更依據各頻帶的寬動態範圍壓縮曲線上與各頻帶的濾波響度對應的第一輸出響度以及單位增益曲線上與各頻帶的濾波響度對應的第二輸出響度計算各頻帶對應的濾波響度增益。
在本發明的一實施例中,上述的濾波單元對輸入語音信號進行帶通濾波。
本發明的語音信號處理方法,包括下列步驟。接收輸入語音信號。對輸入語音信號進行濾波,以產生不同頻帶的多個濾波信號。檢測輸入語音信號的響度,以獲得基準響度。依據基準響度與各頻帶對應的寬動態範圍壓縮曲線計算對應各頻帶的基準響度增益。將濾波信號與濾波信號對應的基準響度增益進行乘法運算,以得到對應不同頻帶的多個響度調整濾波信號。將響度調整濾波信號進行加法運算,以產生輸出語音信號。
在本發明的一實施例中,上述各寬動態範圍壓縮曲線為單位增益曲線分別進行各頻帶對應的寬動態範圍壓縮處理後所得到的曲線,基準響度增益為依據各頻帶對應的寬動態範圍壓縮曲線上對應基準響度的第一輸出響度以及單位增益曲線上對應該基準響度的第二輸出響度計算得到。
在本發明的一實施例中,上述的語音信號處理方法,更包括下列步驟。檢測濾波信號的響度,以獲得多個濾波響度。依據各濾波響度與各頻帶對應的寬動態範圍壓縮曲線分別計算各頻帶的濾波響度增益。將各頻帶的基準響度增益與濾波響度增益進行比較,以分別選擇出具有較小增益值的響度增益。將選擇出的具有較小增益值的響度增益分別與對應的各頻帶的濾波信號進行乘法運算,以得到上述多個響度調整濾波信號。
在本發明的一實施例中,上述各該寬動態範圍壓縮曲線為單位增益曲線分別進行各頻帶對應的寬動態範圍壓縮處理後所得到的曲線,各頻帶對應的濾波響度增益為依據各頻帶的寬動態範圍壓縮曲線上與各頻帶的濾波響度對應的第一輸出響度以及單位增益曲線上與各頻帶的濾波響度對應的第二輸出響度計算得到。
在本發明的一實施例中,上述的語音信號處理方法包括,對輸入語音信號進行帶通濾波。
基於上述,本發明的實施例檢測輸入語音信號的響度以獲得基準響度,依據基準響度與各頻帶對應的寬動態範圍壓縮曲線計算對應各頻帶的基準響度增益,並依據各頻帶的基準響度增益調整各頻帶的濾波信號的響度,以避免輸出語音信號出現訊雜比下降的情形,而可大幅地提高輸出語音信號的辨識度。
為讓本發明的上述特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式作詳細說明如下。
圖1是依照本發明一實施例之語音信號處理裝置的示意圖,請參照圖1。語音信號處理裝置包括濾波單元102以及處理單元104,濾波單元102耦接處理單元104,其中濾波單元102可例如以帶通濾波器來實施,而處理單元104則可例如以中央處理單元來實施,然不以此為限。
濾波單元102用以對輸入語音信號SI1進行濾波,以產生多個不同頻帶的濾波信號SF1~SFN給處理單元104,其中N為大於1的正整數。處理單元104可檢測輸入語音信號SI1的響度,並以輸入語音信號SI1的響度做為基準響度。處理單元104可依據基準響度與各個頻帶對應的寬動態範圍壓縮曲線計算對應各個頻帶的基準響度增益,其中各個頻帶對應的寬動態範圍壓縮曲線為單位增益曲線分別進行各個頻帶對應的寬動態範圍壓縮處理後所得到的曲線,各個頻帶的寬動態範圍壓縮曲線為依據個人需求進行聽力檢測所決定,不同頻帶所對應的寬動態範圍壓縮曲線可能不同。進一步來說,處理單元104可依據各個頻帶對應的寬動態範圍壓縮曲線上對應基準響度的輸出響度以及單位增益曲線上對應基準響度的輸出響度來計算響度增益。處理單元104可將各個頻帶的濾波信號與各個頻帶的濾波信號對應的基準響度增益進行乘法運算,以得到對應不同頻帶的多個響度調整濾波信號,將此些響度調整濾波信號進行加法運算,以產生輸出語音信號SO1。如此依據基準響度來計算各個頻帶的基準響度增益,可避免雜訊信號所對應的響度增益過大,而降低輸出語音信號SO1的訊雜比。
舉例來說,圖2是依照本發明一實施例之語音信號處理方法的流程示意圖,請參照圖2。本實施例的語音信號處理方法可包括下列步驟。首先,接收輸入語音信號(步驟S202),濾波單元102對輸入語音信號SI1進行濾波,以產生第一頻帶的濾波信號Xa(步驟S204A)以及第二頻帶的濾波信號Xb(步驟S204B),而處理單元104可檢測輸入語音信號SI1的響度,以獲得基準響度(步驟S206)。值得注意的是,在本實施例中,為以產生2個不同頻帶的濾波信號為例進行說明,然並不以此為限,在其它實施例中,濾波單元102可產生更多不同頻帶的濾波信號。在步驟S208A中,處理單元104可依據基準響度與第一頻帶對應的寬動態範圍壓縮曲線計算對應第一頻帶的基準響度增益。而在在步驟S208B中,處理單元104可依據基準響度與第二頻帶對應的寬動態範圍壓縮曲線計算對應第二頻帶的基準響度增益。
例如,圖3是依照本發明一實施例之寬動態範圍壓縮曲線的示意圖,假設第一頻帶與第二頻帶所對應的寬動態範圍壓縮曲線皆如圖3所示,然不以此為限,在其它實施例中,第一頻帶與第二頻帶所對應的寬動態範圍壓縮曲線可不同於圖3的寬動態範圍壓縮曲線,且第一頻帶與第二頻帶亦可對應不同的寬動態範圍壓縮曲線。圖3實施例的寬動態範圍壓縮曲線可區分為多個區間S1~S4,其中區間S1為線性區、區間S2為壓縮區、區間S3為線性區而區間S4為限制區,此外,虛線為單位增益曲線,亦即信號的輸入響度等於輸出響度。其中區間S1可用以幫助聽障人士將微小的語音聲音放大,區間S2可用以調節使用者聽域的動態範圍。區間S3寬動態範圍壓縮曲線與單位增益曲線重疊,因聽障人士的飽和聲壓與正常人一樣不須放大。區間S4用以限制輸出語音信號SO1的響度,以避免聽力損壞。
假設輸入語音信號SI1的輸入響度為68dB,輸入語音信號SI1中語音信號主要為分佈在第一頻帶,且其輸入響度為66dB(亦即濾波信號Xa的響度為66dB),輸入語音信號SI1中雜訊信號主要分佈在第二頻帶,且其輸入響度為60dB(亦即濾波信號Xb的響度為60dB)。處理單元104可依據各個頻帶對應的寬動態範圍壓縮曲線上對應基準響度的輸出響度以及單位增益曲線上對應基準響度的輸出響度來計算響度增益Gp,例如在本實施例中,輸入語音信號SI1的輸入響度為做為基準響度(68dB),基準響度在寬動態範圍壓縮曲線上對應的輸出響度為77dB,而在單位增益曲線上對應的輸出響度為68,因此可計算出基準響度增益Gxa、Gxb為77-68=9dB。
在計算出第一頻帶與第二頻帶的基準響度增益Gxa、Gxb後,處理單元104可將第一頻帶的濾波信號Xa與第一頻帶的濾波信號Xb對應的基準響度增益進行乘法運算,以得到對應第一頻帶的響度調整濾波信號Ya(步驟S210A),響度調整濾波信號Ya的響度等於66+9=75dB。依此類推,在步驟S210B可計算出響度調整濾波信號Yb的響度等於60+9=69dB。之後,處理單元104可將響度調整濾波信號Ya與Yb進行加法運算(步驟S212),以產生輸出語音信號SO1 (步驟S214),藉由本實施例的語音信號處理方法,輸出語音信號SO1的訊雜比為75-69=6dB。而若採用習知的寬動態範圍壓縮處理方式,亦即處理單元104分別依據各頻帶的寬動態範圍壓縮曲線以及濾波信號的輸入響度計算各頻帶的濾波信號的輸出響度,再將進行寬動態範圍壓縮處理後的各頻帶的濾波信號相加以獲得輸出語音信號,如此獲得的輸出語音信號相較於本實施例的輸出語音信號SO1將具有較小的訊雜比。例如若依據圖3的寬動態範圍壓縮曲線來進行習知的寬動態範圍壓縮處理,第一頻帶的濾波信號Xa的輸入響度(60dB)所對應的輸出響度(亦即響度調整濾波信號Ya的響度)等於72dB,第二頻帶的濾波信號Xb的輸入響度(66dB)所對應的輸出響度(亦即響度調整濾波信號Yb的響度)等於76dB,輸出語音信號的訊雜比將為76-72=4dB,顯然採用本實施例的寬動態範圍壓縮處理方式可具有較高的訊雜比。
圖4是依照本發明另一實施例之語音信號處理方法的流程示意圖,請參照圖4。假設在本實施例中,第一頻帶與第二頻帶所對應的寬動態範圍壓縮曲線皆如圖5所示,然不以此為限,在其它實施例中,第一頻帶與第二頻帶所對應的寬動態範圍壓縮曲線可不同於圖5的寬動態範圍壓縮曲線,且第一頻帶與第二頻帶亦可對應不同的寬動態範圍壓縮曲線。圖5實施例的寬動態範圍壓縮曲線可區分為多個區間S0~S4,其中區間S0為擴張區、區間S1為線性區、區間S2為壓縮區、區間S3為線性區而區間S4為限制區,此外,虛線為單位增益曲線,亦即信號的輸入響度等於輸出響度,當雜訊信號遠小於語音信號而落於區間S0時,區間S0可用以提高訊雜比。值得注意的是,在圖4實施例中,為以產生2個不同頻帶的濾波信號為例進行說明,然並不以此為限,在其它實施例中,濾波單元102可產生更多不同頻帶的濾波信號。
相較於圖2實施例,在本實施例的處理單元104更檢測濾波信號Xa與Xb的響度,以獲得第一濾波響度與第二濾波響度(步驟S402A、S402B),並依據第一濾波響度與第一頻帶對應的寬動態範圍壓縮曲線計算第一頻帶的濾波響度增益Gpa(步驟S404A),以及依據第二濾波響度與第二頻帶對應的寬動態範圍壓縮曲線計算第二頻帶的濾波響度增益Gpb(步驟S404B),然後再比較第一頻帶的濾波響度增益Gpa與第一頻帶的基準響度增益Gxa的大小,以及比較第二頻帶的濾波響度增益Gpb與第二頻帶的基準響度增益Gxb,以分別選擇出具有較小增益值的響度增益(步驟S406A、S406B)。接著處理單元104再將選擇出的具有較小增益值的響度增益分別與對應頻帶的濾波信號進行乘法運算,以分別得到第一頻帶的響度調整濾波信號Ya與第二頻帶的響度調整濾波信號Yb。然後處理單元104將響度調整濾波信號Ya與響度調整濾波信號Yb進行加法運算(步驟S410),以產生輸出語音信號SO1(步驟S412)。如此藉由將各頻帶的基準響度增益與濾波響度增益進行比較,以分別選擇出具有較小增益值的響度增益進行濾波信號的響度增益運算,可避免在使用圖5的寬動態範圍壓縮曲線時,皆以各頻帶的基準響度增益進行濾波信號的響度增益運算,而使得輸出語音信號SO1的訊雜比下降。
舉例來說,假設本案的輸入語音信號SI1的輸入響度為67dB,輸入語音信號SI1中語音信號主要為分佈在第一頻帶,且其輸入響度為66dB(亦即濾波信號Xa的響度為66dB),輸入語音信號SI1中雜訊信號主要分佈在第二頻帶,且其輸入響度為20dB(亦即濾波信號Xb的響度為20dB)。類似上述實施例,處理單元104可依據各個頻帶對應的寬動態範圍壓縮曲線上對應基準響度的輸出響度以及單位增益曲線上對應基準響度的輸出響度來計算響度增益,例如在本實施例中,輸入語音信號SI1的輸入響度為做為基準響度(67dB),基準響度在寬動態範圍壓縮曲線上對應的輸出響度為78.5,而在單位增益曲線上對應的輸出響度為67,因此可計算出基準響度增益Gxa、Gxb為78.5-67=11.5dB。此外,在本實施中處理單元104更依據各頻帶的寬動態範圍壓縮曲線上與各頻帶的濾波響度對應的第一輸出響度以及單位增益曲線上與各頻帶的濾波響度對應的第二輸出響度計算各頻帶對應的濾波響度增益。例如在本實施例中,第一頻帶的濾波信號Xa的響度為66dB,其在寬動態範圍壓縮曲線上對應的輸出響度為78dB,也就是說第一頻帶的濾波信號Xa的濾波響度增益為78-66=12dB。此外,本實施例的第二頻帶的濾波信號Xa的響度為20dB,其在寬動態範圍壓縮曲線上對應的輸出響度為12dB,也就是說第一頻帶的濾波信號Xa的濾波響度增益為12-20=-8dB。
處理單元104可將第一頻帶的濾波響度增益(12dB)與基準響度增益(11.5dB)比較,並選擇出具有較小的響度增益值的基準響度增益(11.5dB)與第一頻帶的濾波信號Xa進行乘法運算,而使第一頻帶的響度調整濾波信號Ya的響度等於66+11.5=77.5dB。類似地,處理單元104可將第二頻帶的濾波響度增益(-8dB)與基準響度增益(11.5dB)比較,並選擇出具有較小的響度增益值的第二頻帶的濾波信號Xb的濾波響度增益(-8dB)與第二頻帶的濾波信號Xb進行乘法運算,而使第二頻帶的響度調整濾波信號Yb的響度等於20-8=12dB。如此一來,輸出語音信號SO1的訊雜比將為77.5-12=65.5dB,而可保持相當不錯的訊雜比。而若如圖2實施例的方式,直接以第二頻帶的基準響度增益Gxb(11.5dB)與第二頻帶的濾波信號Xb進行乘法運算,可得到第二頻帶的響度調整濾波信號Yb的響度等於20+11.5=31.5dB,如此將使得輸出語音信號SO1的訊雜比將為77.5-31.5=36dB,顯然在使用圖5的寬動態範圍壓縮曲線時,採用本實施例的寬動態範圍壓縮處理方式可具有較高的訊雜比。
此外,若本實施例的第二頻帶的濾波信號Xb為落於區間S2,亦即雜訊信號落於區間S2時,由於第一頻帶的濾波信號Xa與第二頻帶的濾波信號Xb的濾波響度必然小於輸入語音信號SI1的響度,因此第一頻帶的濾波信號Xa與第二頻帶的濾波信號Xb的濾波響度增益將分別大於第一頻帶與第二頻帶的基準響度增益Gxa與Gxb。也就是說,在步驟S406A與步驟S406B中,將分別選擇基準響度增益Gxa與Gxb來分別與濾波信號Xa與濾波信號Xb進行乘法運算,而可達到類似圖2實施例的效果,使輸出語音信號SO1具有較高的訊雜比。由於圖2實施例已舉例說明以基準響度增益進行濾波信號的響度調整,因此在此不再贅述。由此可知,本實施例的語音信號處理方法不論雜訊信號的響度大或小,皆可使輸出語音信號具有高訊雜比。
值得注意的是,在圖4實施例中,為以產生2個不同頻帶的濾波信號為例進行說明,然並不以此為限,在其它實施例中,濾波單元102可產生更多不同頻帶的濾波信號。此外,上述實施例雖以dB值來表示響度大小,然實際應用上處理單元104並不限定必須使用dB值來進行運算,處理單元104可直接依據對應響度的電壓值來進行計算,以節省運算資源。
綜上所述,本發明的實施例藉由檢測輸入語音信號的響度以獲得基準響度,依據基準響度與各頻帶對應的寬動態範圍壓縮曲線計算對應各頻帶的基準響度增益,並依據各頻帶的基準響度增益調整各頻帶的濾波信號的響度,以避免輸出語音信號出現訊雜比下降的情形,而可大幅地提高輸出語音信號的辨識度。在部份實施例中,亦可將各頻帶的基準響度增益與濾波響度增益進行比較,並分別選擇出具有較小增益值的響度增益進行濾波信號的響度增益運算,以進一步避免輸出語音信號的訊雜比下降。
雖然本發明已以實施例揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本發明的精神和範圍內,當可作些許的更動與潤飾,故本發明的保護範圍當視後附的申請專利範圍所界定者為準。
102‧‧‧濾波單元
104‧‧‧處理單元
SF1~SFN‧‧‧濾波信號
SI1‧‧‧輸入語音信號
SO1‧‧‧輸出語音信號
S202~S214、S402~S412‧‧‧語音信號處理方法步驟
S0~S4‧‧‧區間
Gp‧‧‧響度增益
Gpa、Gpb‧‧‧濾波響度增益
Gxa、Gxb‧‧‧基準響度增益
Xa、Xb‧‧‧濾波信號
Ya、Yb‧‧‧響度調整濾波信號
圖1是依照本發明一實施例之語音信號處理裝置的示意圖。 圖2是依照發明一實施例之語音信號處理方法的流程示意圖。 圖3是依照本發明一實施例之寬動態範圍壓縮曲線的示意圖。 圖4是依照本發明另一實施例之語音信號處理方法的流程示意圖。 圖5是依照本發明另一實施例之寬動態範圍壓縮曲線的示意圖。
S202~S214‧‧‧語音信號處理方法的流程步驟
Gxa、Gxb‧‧‧基準響度增益
Xa、Xb‧‧‧濾波信號
Ya、Yb‧‧‧響度調整濾波信號
Claims (10)
- 一種語音信號處理裝置,包括:一濾波單元,接收一輸入語音信號,對該輸入語音信號進行濾波,以產生不同頻帶的多個濾波信號;以及一處理單元,檢測該輸入語音信號的響度,以獲得一基準響度,依據該基準響度與各該頻帶對應的寬動態範圍壓縮曲線計算對應各該頻帶的基準響度增益,將該些濾波信號與該些濾波信號對應的基準響度增益進行乘法運算,以得到對應該些頻帶的多個響度調整濾波信號,將該些響度調整濾波信號進行加法運算,以產生一輸出語音信號;其中各該寬動態範圍壓縮曲線為一單位增益曲線分別進行各該頻帶對應的寬動態範圍壓縮處理後所得到的曲線。
- 如申請專利範圍第1項所述的語音信號處理裝置,該處理單元更依據各該頻帶對應的寬動態範圍壓縮曲線上對應該基準響度的一第一輸出響度以及該單位增益曲線上對應該基準響度的一第二輸出響度計算該基準響度增益。
- 如申請專利範圍第1項所述的語音信號處理裝置,其中該處理單元更檢測該些濾波信號的響度,以獲得多個濾波響度,依據各該濾波響度與各該頻帶對應的寬動態範圍壓縮曲線分別計算各該頻帶的濾波響度增益,將各該頻帶的基準響度增益與濾波響度增益進行比較,以分別選擇出具有較小增益值的響度增益, 將選擇出的具有較小增益值的響度增益分別與對應的各該頻帶的濾波信號進行該乘法運算,以得到該些響度調整濾波信號。
- 如申請專利範圍第3項所述的語音信號處理裝置,其中各該寬動態範圍壓縮曲線為一單位增益曲線分別進行各該頻帶對應的寬動態範圍壓縮處理後所得到的曲線,處理單元更依據各該頻帶的寬動態範圍壓縮曲線上與各該頻帶的濾波響度對應的第一輸出響度以及該單位增益曲線上與各該頻帶的濾波響度對應的第二輸出響度計算各該頻帶對應的濾波響度增益。
- 如申請專利範圍第1項所述的語音信號處理裝置,其中該濾波單元對該輸入語音信號進行帶通濾波。
- 一種語音信號處理方法,包括:接收一輸入語音信號;對該輸入語音信號進行濾波,以產生不同頻帶的多個濾波信號;檢測該輸入語音信號的響度,以獲得一基準響度;依據該基準響度與各該頻帶對應的寬動態範圍壓縮曲線計算對應各該頻帶的基準響度增益,其中各該寬動態範圍壓縮曲線為一單位增益曲線分別進行各該頻帶對應的寬動態範圍壓縮處理後所得到的曲線;將該些濾波信號與該些濾波信號對應的基準響度增益進行乘法運算,以得到對應該些頻帶的多個響度調整濾波信號;以及 將該些響度調整濾波信號進行加法運算,以產生一輸出語音信號。
- 如申請專利範圍第6項所述的語音信號處理方法,該基準響度增益為依據各該頻帶對應的寬動態範圍壓縮曲線上對應該基準響度的一第一輸出響度以及該單位增益曲線上對應該基準響度的一第二輸出響度計算得到。
- 如申請專利範圍第6項所述的語音信號處理方法,更包括:檢測該些濾波信號的響度,以獲得多個濾波響度;依據各該濾波響度與各該頻帶對應的寬動態範圍壓縮曲線分別計算各該頻帶的濾波響度增益;將各該頻帶的基準響度增益與濾波響度增益進行比較,以分別選擇出具有較小增益值的響度增益;以及將選擇出的具有較小增益值的響度增益分別與對應的各該頻帶的濾波信號進行該乘法運算,以得到該些響度調整濾波信號。
- 如申請專利範圍第8項所述的語音信號處理方法,其中各該寬動態範圍壓縮曲線為一單位增益曲線分別進行各該頻帶對應的寬動態範圍壓縮處理後所得到的曲線,各該頻帶對應的濾波響度增益為依據各該頻帶的寬動態範圍壓縮曲線上與各該頻帶的濾波響度對應的第一輸出響度以及該單位增益曲線上與各該頻帶的濾波響度對應的第二輸出響度計算得到。
- 如申請專利範圍第6項所述的語音信號處理方法,包 括:對該輸入語音信號進行帶通濾波。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW105140854A TWI590239B (zh) | 2016-12-09 | 2016-12-09 | 語音信號處理裝置及語音信號處理方法 |
US15/457,104 US10020003B2 (en) | 2016-12-09 | 2017-03-13 | Voice signal processing apparatus and voice signal processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW105140854A TWI590239B (zh) | 2016-12-09 | 2016-12-09 | 語音信號處理裝置及語音信號處理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI590239B true TWI590239B (zh) | 2017-07-01 |
TW201822192A TW201822192A (zh) | 2018-06-16 |
Family
ID=60048558
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW105140854A TWI590239B (zh) | 2016-12-09 | 2016-12-09 | 語音信號處理裝置及語音信號處理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10020003B2 (zh) |
TW (1) | TWI590239B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3389183A1 (en) * | 2017-04-13 | 2018-10-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for processing an input audio signal and corresponding method |
CN109686378B (zh) * | 2017-10-13 | 2021-06-08 | 华为技术有限公司 | 语音处理方法和终端 |
US11032642B1 (en) * | 2020-03-10 | 2021-06-08 | Nuvoton Technology Corporation | Combined frequency response and dynamic range correction for loudspeakers |
US11317203B2 (en) | 2020-08-04 | 2022-04-26 | Nuvoton Technology Corporation | System for preventing distortion of original input signal |
US11961529B2 (en) * | 2021-05-17 | 2024-04-16 | Purdue Research Foundation | Hybrid expansive frequency compression for enhancing speech perception for individuals with high-frequency hearing loss |
CN113473287A (zh) * | 2021-06-23 | 2021-10-01 | 天津大学 | 一种新型蓝牙耳机输出声压级控制方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101421781A (zh) | 2006-04-04 | 2009-04-29 | 杜比实验室特许公司 | 音频信号的感知响度和/或感知频谱平衡的计算和调整 |
ES2359799T3 (es) * | 2006-04-27 | 2011-05-27 | Dolby Laboratories Licensing Corporation | Control de ganancia de audio usando detección de eventos auditivos basada en la sonoridad específica. |
US9521501B2 (en) * | 2013-09-12 | 2016-12-13 | Dolby Laboratories Licensing Corporation | Loudness adjustment for downmixed audio content |
WO2015038475A1 (en) * | 2013-09-12 | 2015-03-19 | Dolby Laboratories Licensing Corporation | Dynamic range control for a wide variety of playback environments |
US10111014B2 (en) * | 2015-08-10 | 2018-10-23 | Team Ip Holdings, Llc | Multi-source audio amplification and ear protection devices |
-
2016
- 2016-12-09 TW TW105140854A patent/TWI590239B/zh active
-
2017
- 2017-03-13 US US15/457,104 patent/US10020003B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20180166090A1 (en) | 2018-06-14 |
US10020003B2 (en) | 2018-07-10 |
TW201822192A (zh) | 2018-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI590239B (zh) | 語音信號處理裝置及語音信號處理方法 | |
EP1542359A1 (en) | Signal compression/expansion device and mobile communication terminal | |
US10511905B2 (en) | Method and system for dynamically enhancing low frequency based on equal-loudness contour | |
KR20070050930A (ko) | 고 잡음 환경에서의 음향 표현을 위한 오디오 신호 처리시스템 및 방법 | |
US9640168B2 (en) | Noise cancellation with dynamic range compression | |
US9473102B2 (en) | Level adjusting circuit, digital sound processor, audio AMP integrated circuit, electronic apparatus and method of automatically adjusting level of audio signal | |
US20160381468A1 (en) | Method for compressing the dynamics in an audio signal | |
TWI590236B (zh) | 語音信號處理裝置及語音信號處理方法 | |
US20120014539A1 (en) | Signal processing apparatus, semiconductor chip, signal processing system, and method of processing signal | |
CN105872884A (zh) | 耳机、耳机的下行降噪电路及方法 | |
TWI451405B (zh) | 增進語音即時輸出之方法及助聽器 | |
US20080192966A1 (en) | Method for generating acoustic signals of a hearing aid | |
TWI543634B (zh) | 處理聲音段之方法及其電腦程式產品及助聽器 | |
US10264366B2 (en) | Hearing aid and method for dynamically adjusting recovery time in wide dynamic range compression | |
TWI623234B (zh) | 助聽器及其自動分頻濾波增益控制方法 | |
JP2008148179A (ja) | 音声信号処理装置および自動利得制御装置における雑音抑圧処理方法 | |
CN108806710B (zh) | 一种语音增强增益调整方法、***及耳机 | |
CN108257612B (zh) | 语音信号处理装置及语音信号处理方法 | |
US20120016505A1 (en) | Electronic audio device | |
US20180041836A1 (en) | Signal processing device, signal processing method, and speaker device | |
US20220141583A1 (en) | Hearing assisting device and method for adjusting output sound thereof | |
CN111815877B (zh) | 一种白噪声警示方法及装置 | |
US9514765B2 (en) | Method for reducing noise and computer program thereof and electronic device | |
CN108281148B (zh) | 语音信号处理装置及语音信号处理方法 | |
JP5531988B2 (ja) | 音量制御装置、音量制御方法、および音量制御プログラム |