TW416044B - Adaptive filter and filtering method for low bit rate coding - Google Patents
Adaptive filter and filtering method for low bit rate coding Download PDFInfo
- Publication number
- TW416044B TW416044B TW086107998A TW86107998A TW416044B TW 416044 B TW416044 B TW 416044B TW 086107998 A TW086107998 A TW 086107998A TW 86107998 A TW86107998 A TW 86107998A TW 416044 B TW416044 B TW 416044B
- Authority
- TW
- Taiwan
- Prior art keywords
- signal
- patent application
- filter
- noise
- gain
- Prior art date
Links
- 238000001914 filtration Methods 0.000 title claims abstract description 39
- 238000000034 method Methods 0.000 title claims abstract description 30
- 230000003044 adaptive effect Effects 0.000 title description 5
- 238000012546 transfer Methods 0.000 claims abstract description 22
- 230000007774 longterm Effects 0.000 claims abstract description 8
- 230000002079 cooperative effect Effects 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 5
- 230000005236 sound signal Effects 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 3
- 230000002708 enhancing effect Effects 0.000 claims 3
- 230000003139 buffering effect Effects 0.000 claims 2
- 230000003111 delayed effect Effects 0.000 claims 2
- 238000012797 qualification Methods 0.000 claims 2
- 238000005728 strengthening Methods 0.000 claims 2
- 230000005284 excitation Effects 0.000 abstract description 16
- 230000006870 function Effects 0.000 abstract description 9
- 238000001228 spectrum Methods 0.000 description 17
- 239000011295 pitch Substances 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 239000003638 chemical reducing agent Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000008054 signal transmission Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000010977 jade Substances 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03L—AUTOMATIC CONTROL, STARTING, SYNCHRONISATION OR STABILISATION OF GENERATORS OF ELECTRONIC OSCILLATIONS OR PULSES
- H03L7/00—Automatic control of frequency or phase; Synchronisation
- H03L7/06—Automatic control of frequency or phase; Synchronisation using a reference signal applied to a frequency- or phase-locked loop
- H03L7/08—Details of the phase-locked loop
- H03L7/085—Details of the phase-locked loop concerning mainly the frequency- or phase-detection arrangement including the filtering or amplification of its output signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Filters That Use Time-Delay Elements (AREA)
Description
416044 A7 ________B7 五、發明説明(,) 本發明是在國防部授與的合約下,得到政府支持而完 成,政府對本發明擁有一定的權利。 癸明的技術領域 本發明是關於語音的編碼,特别是關於低位元率語音 編碼的自請調渡波(adaptive filtering)。
相Μ的申請IT A-McCree的名稱為"分數音高之混合激發線性預測,,之 於1994年3月3日提申之申請案序號〇8/218 〇〇3以及名 稱為分數音南之混合激發線性預測”之於1994年11月9 曰提申之申請案序號08/336,593係與本申請案相關,並且 於此援引為參考。 發明的背景 經濟部智慈財產局8工消費合作杜印製 I I - It t -- 1 - In I I ' 一aj (請先閲讀背面之注意事項再填寫本頁〕 人類的聲音是由頻率範圍大約到兩萬赫茲的聲訊流所 組成。然而,大約在100赫茲到5000赫茲間的波段包含 了巨量的聲能。人類語音的電話傳輸原本包含了類比的聲 訊流到類比的電訊流的轉換(例如使用麥克風),類比的電 訊流的傳輸,以及類比的電訊流回到聲訊流的轉換(例如 使用揚聲器)。電訊將被帶通濾波以保持僅僅300赫茲到 4000赫茲的頻率波段,用以限制頻寬並避免低頻問題。然 而,在1960年代初期,數位訊號傳輸的優點啟發了數位 電話傳輸的變遷。數位電話訊號一般是以8000赫茲將類 ______ -3-_ 度 用中國 率(CNS > Λ4 規格(210X297 公楚1 86220A(9TI) ~ 經濟部智慧財產局員工消費合作社印製 416044 A7 ____B7__ 五、發明説明(2 ) 比訊號取樣並且以8位元碼根據"-law(脈碼調變-PCM)非 線性地將取樣量化而取得。配合時脈之數位-類比轉換器 和縮張(companding)放大器由八位元的取樣流重建類比電 訊流"這樣的訊號要求64Kbps(每秒千位元)的傳輸率,超 過了以前的類比訊號傳輸頻寬。 以類比的方式儲存語音資訊(例如存放在電話答錄機 内的磁帶)同樣地可以用數位儲存來取代。然而,記憶體 的需求會變得難以克服:1〇分鐘8位元在8000赫茲下的 PCM取樣需要5MB(百萬位元組)來儲存。 較低的傳輸率以及儲存要求導致語音訊號壓縮的發 展。一種語音的壓縮方式是仿效生理學上語音而產生,並 且因此減低了需要被傳輸或儲存的必要資訊,特別是,線 性語音產生模型假設一可變濾波器(粗略的說,此濾波器 扮演聲道(vocal tract)的角色)被一連串音高週期為p的脈 衝(有聲)或者白雜訊(無聲)激發,並且緊接著被放大以調 整響度。1/A(z)傳統上表示濾波器的轉換函數中的z轉 換。此模型簡單地藉由週期地決定有聲/無聲加上調整濾 波係數和增益而產生聲音流。請參看Markd和Gray的"語 音之線性預測"(Springer-Verlag 1976)。 為了減低位元率,可以内插方式產生連續音框之係 數°然而,為了改善聲音品質,可從語音裡取出更多的資 訊壓縮並傳送或者儲存。例如,密碼本激發線性預測 (fELP)方法先分析語音音框以找丨A(z)並將語音渡波,接 著決疋曰问週期,並以梳形(c〇mb)濾波器移除此週期性以 本紙張尺度適—---
In ι^ϋ . 1 1^1 (請先閲讀背面之注意事項再填寫本頁) 41^044 經濟部智慧財產局員工消費合作社印製 A7 B7 五、發明説明(3 ) 產生看起來像雜訊的激發訊號,然後用密碼本編碼激發訊 號《因此’ CELP傳送LPC濾波係數、音高和激發的密碼 本索引。 另一種方式是混合有聲和無聲的激發,用於LPC濾 波器。例如,1992年八月McCree在喬治亞理工學院的博 士論文"低位元率語音編碼的新LPC音碼器(Vocoder)模型” 把激發頻率分成頻帶,在各頻帶中個別地決定有聲/無聲 之混合,並亙把結果結合起來成為整個激發。A. McCree 的文章”低位元率語音編碼之混合激發LPC Vocoder模型 "(IEEE Trans. On Speech and Audio Proc., Vol.3, No.4, July 1995)有描述混合激發線性預測(MELP)係數vocoder。之前 援引的申請案序號08/218,003和08/336,593有描述混合激 發線性預測語音編碼器。這些資料於此援引為參考資料。 大部分的低位元率語音編碼器利用一些自諧調頻譜加 強?慮政器或後;慮波器(adaptive spectral enhancement filter or postfilter)的形式改善處理過的語音訊號品質。例如在 McCree等人的混合激發線性預測(MELP)語音編碼器裡使 用了以LPC頻譜(spectrum)為基礎的自諧調極/零加強濾波 器(adaptive pole/zero enhancement fi丨ter)。自諸調頻譜加強 濾波器有助於帶通濾波之語音在共振峯區域内符合自然語 音波形。上述的自諧調濾波器只能在輸入訊號無雜訊的情 形下改善語音品質,而在有雜訊存在的情形下,這種濾波 器實際上會降低其性能。這種加強濾波器易於增加聲音的 背景雜sil之功率頻譜(p〇wer Spectrum)的變動(fiuctuati〇n), _ -5- 本紙張纽it财CNS ) 44規格(2丨0X297公釐) 一
n ϋϋ ^1.1 n 1 ... ^^1 - s- ^^1 ^^1 U3--β (請先閲讀背面之注意事項再填寫本頁J 經濟部智慧財產局員工消費合作社印製 416044 A7 B7 _ 五、發明説明(4 ) 造成一種對聽者來說非常煩擾的渦漩(Swirling)效應。在 CELP語音編碼器的後濾波器(postfiIter)也有類似的效應出 現。 依據本發明其中一項目的,對於這種CELP的自諧調 頻譜加強濾波器或者後濾波器提供了改良’導致在雜訊存 在的情形下有更好的效能’而對無雜訊的語音訊號則維持 現有方法所擁有的品質改善。 發明概要 根據本發明其中一項實例’本發明提供一種濾波方 法,用於改善在低位元率的語音或音頻訊號(audio signal) 之數位處理語音,其中,濾波是由線性預測係數參數 (linear predictive coefficient parameters)以及估計輸入音框 是語音而非背景雜訊的機率所控制。在此方式下’對於無 雜訊的語音訊號,實踐了濾波的優點,而沒有引入額外雜 訊至已處理之背景雜訊。 熟悉此技術人士自以下配合所附圖式之本發明詳細說 明,即能瞭解本發明的此等以及其他特色。 圈式說明 圖1係一般語音通訊系統之方塊圖。 圖2係圖I之語音分析器的方塊圖。 圖3係合成器之方塊圖。 圖4a-d為自然語音與衰退波形之比較,其中4a為自 -6- 本紙張尺度適用中國國家橾準(CNS ) A4規格(2丨〇X'297公t ) ^ TJ <^^ 、-0 (請先閲讀背面之注意事項再填寫本頁} 416044 經濟部智慧財產局8工消費合作杜印製 A7 B7 五、發明説明(5 ) 然語音母音之第一共振峯,4b為合成的指數衰退共振,4c 為此共振之極/零加強濾波脈衝響應,4d為加強衰退共 振。 圏5係根據本發明一項實例之自諧調頻譜加強的方塊 圖。 圖6係訊號機率估算器之流程圖。 較佳實施例洋細說明 圖1圖示了整個低位元率語音通訊系統,輸入語音在 此是由類比-數位轉換器所取樣,把參數編碼並傳送到分 析器600,再藉由儲存及傳輸通道傳送到合成器5〇〇<>從 合成器500出來之解瑪訊號接著由數位_類比轉換器(dAc) 轉換成為送給揚聲器之訊號。圖2所示為分析器之略圖。 轉換器620把類比輸入語音轉換成數位語音,並將之應用 於語音分析器,此語音分析器包含了一個LPC操取器 (extractor)602、一個音高週期擷取器604、一個顫動(jitter) 擷取器606,一個有聲/無聲混合控制擷取器608,一個增 益擷取器610,以及一個編碼器612,此編碼器係用於聚 集從602到610的五個輸入以及輸出,並配合時脈將編碼 之語音送出至傳輸通道。合成器500有一個解碼器536, 將來自編碼器612的編碼語音進行解碼,以提供LPC參 數 '音尚週期、混音(mix),jitter旗標以及增益。 圖3為根據本發明之一項實例且描述於1994年3月 25日提申之美國專利申請序號08/218,003,以及類似前述 本紙張尺度適用中國國家樣率(CNS ) A4規格(2丨0X 297公釐) — •n n I n - n n n> n HI ntn T --3 (讀先閱讀背面之注意事項再填寫本頁) 416044 A7 _________B7 五、發明説明(6 ) 所援引McCree等人之論文之MELP vocoder。合成器500 包含一個由解碼器536出來之音高週期輸入所控制的週期 脈衝串產生器502、一個由解碼器536出來之增益輸入所 控制的脈衝串放大器504、一個由解喝器536的顏動輸出 之旗標輸入所控制的脈衝顫動產生器506、一個由解碼器 536出來的五頻道有聲/無聲混音輸入所控制的脈衝濾波器 508。合成器500更進一步包含一個白雜訊(whhe noise)產 生器512、一個受到同樣增益輸入所控制的增益放大器、 一個也受到相同的五頻道有聲/無聲混音輸入所控制的雜 訊濾波器(noise filter)518、以及一個用於結合濾波後的脈 衝和雜訊的加法器520。加法器輸出混合的激發訊號 e(n) ’此激發訊號輸出到自諧調頻譜加強濾波器(adaptive spectral enhancement filter)530, 530 會在共振峯(formant) 經濟部智慧財產局員工消費合作社印製 ^1 I 1^1 II - - -II 1· ioi. —i - - -i n I 、τ (請先閱讀背面之注意事項再填寫本頁) 内加入強調(emphasis)以產生e’(n)。此輸出被應用到由1〇 個LPC係數控制的LPC合成濾波器532。532的輸出由放 大器533用解碼器536出來的增益加以放大,然後再傳送 到脈衝分散濾波器(pulse dispersion filter)534以得到數位 合成語音。此數位化的語音繼而利用數位-類比轉換器540 轉換成類比語音以提供給揚聲器·^根據本發明之另一個實 例,加法器的輸出e(n)是被用在由1〇個LPC係數控制的 合成濾波器532, LPC濾波器的輸出再被用在自諧調加強 濾波器530,在共振峯内加入強調以產生e,(n) 〇 根據本發明的一項實例,本發明改善自諧調頻譜加強 濾波器530。在MELP編碼器裡的自諧調頻譜加強濾波器 本纸張尺度適用中國國家標準(CNS ) A4規格(2丨0 X 297公楚) 41&044 A7 ___B7 五、發明説明(7 ) 530是一個以LPC濾波器係數為基礎的極/零濾波器。此 自諧調濾波器有助於帶通濾波的合成語音在共振峯區域内 符合自然語音波形。不是在自然語音裡就是在合成語音 裡’典型的共振峯共振通常不會在音高脈衝間的時間内完 全地衰退’然而合成語音波形在波峰間達到比較低的波 谷’而不像自然語音波形那樣9這可能是由於LPC合成 濾波器的極點無法重製人類語音裡共振峯共振的特色所造 成。對這個問a題有兩個可能的理由,一個理由可能是LPC 極點頻寬不合適;因為LPC極點共振比真正的共振峯 弱’故合成的時間訊號可能衰退太快。另一個可能的解釋 是真正的共振峯頻寬可能在音高週期内稍微改變,而合成 6吾音無法模仿這種作用。 經濟部智"財產局員工消費合作社印製 --------r 裝------訂 (請先閱讀背面之注意事項再填寫本頁) 之前所援引McCree在1995年的文章裡的自諧調頻譜 加強濾波器對於匹配共振峯波形的問題提供了—個簡單的 解決之道》自諧調極/零濾波器被廣泛的使用在CELP編碼 器’意囷在於減低共振峯頻率間的量化雜訊(qUantizati〇n noise) »請參看陳等人之文章"具自諧調後濾波在480ObpS 下的即時向量APC語音編碼"(在proc. IEEE Int. Conf.. Accost, Speech Signal Processing, Dallas 1987, 2185-2188 頁)’以及 Compbell 等人的"The DOD 4.8kps Standard(Prop〇sed Federal Standard 1016)"(in Advances in
Speech Coding,Nowell, MA: Kluwer,1991,第 121 至 133 頁)。這些參考資料在此被援引為參考。極是由LPC合成 ;慮波器的一個頻寬擴充版用α等於3產生。根據McCree 本紙張尺度_適用中國國家標準(CNS)Λ4規格(2丨0X297公釐) 經濟部智慧財產局員工消費合作社印製 416044 A7 __B7______ 五、發明説明(8 ) 的文章,此全極濾波器因為增加頻譜傾斜而引入擾動的低 通濾波效應,因此用一個以α等於0.5計算出的較弱之全 零濾波器,以降低整體濾波器的傾斜而沒有減低共振峯的 加強。除此而外,一個簡單的一階FIR濾波器更進一步的 被用於減低低通覆蓋效應(low pass muffling effect)。在混 合激發LPC vocoder裡,減少量化雜訊並不被重視,然而 此濾波器在時間方面的性質產生了一個類似於音高同步極 頻寬調變(pitch-synchronous pole bandwidth modu丨ation)之 效應》如圖4所示,當使用此加強濾波器時,衰退的共振 在時間方面比較不會有陡峭的衝擊。圖4描繪自然語音與 衰退共振波形之比較,其中X轴係時間,而Y軸係振 幅。圖4a描繪自然語音母音之第一共振峯β圖4b描繪合 成的指數衰退共振。圖4c描繪此共振之極/零加強濾波 器脈衝響應。圖4d描繪加強之衰退共振。此特性容許 LPC vocoder語音輸出較匹配在共振峯内自然語音的帶通 波形特性’並且增加了合成語音的品質。 就如之前所討論的,加強濾波器的極就是LPC濾波 器的極往z平面上的單位圓偏移0.8的因子。 根據本發明,由於全極據波器本身會在處理過的語音 訊號裡引入覆蓋(muffled)的特色,因此串接一個較弱的全 零濾波器以補償由極所引入的頻譜傾斜。此外,濾波器内 還包含另外一個零以更進一步的削減頻譜傾斜。陳等人在 美國專利號碼第4,969,192號,題目為"語音及音響之向量 自諧調預測編碼"裡,在CELP語音編碼器的一個後濾波 _______-10· 玉紙張尺度適用中國國家標準_( CNS > A4規格( 270^97公釐) ---- 1 ^^^^1 % n^i (1 t J (請先閱讀背面之注意事項再填寫本頁〕 41β〇44 Α7 五 經濟部智慧財產局員工消費合作社印製 Β7 、發明說明() 9 器内使用了第二個濾波器。 此現存方法的問題是會增加已存在的背景雜訊之波 % °我們在此所提的新方法根據估算現在的輸入訊號是語 5而不是背景雜訊的機率來加以改變頻譜加強濾波器的強 度。機率的估算是藉由比較現在的語音音框之功率和雜訊 率的長期估算。為避免開關加強渡波器所造成的不連 續减波器的強度在訊號機率的範圍内緩慢的由完全沒有 滅攻到全頻加強。 11 62,此濾波器的轉移函數是 ---------—装------訂 (請先閱讀背面之注項再填寫本頁) 圖5所示為根據本發明所作出改良後的加強濾波器之 方塊圖。混合激發訊號e(n)輸入由u>c係數p控制的濾波 ΙΗζ) = Τ^Γ^)0<β<α<λ ,處的ζ是單位延遲運算元Ζ·1的倒數,^及沒是經驗所 件的係數,在頻譜峰造成吱喳聲及未達到頻譜加強間做取 捨預測濾波係數丨-ρ(ζ)等於分析濾波係數α(ζ)。以赫茲 為單位的頻率響應等於兩個全極濾波器之頻率響應的差值 2〇l〇g|//(e7,")|= 20 log- —20t〇g- …-— 丨1-尸(叫| |1-Ρ(^)| 在先前McCree的文章裡,加強遽波器裡第一個滤波 器的值是0=〇.5’ 的轉移函數是 。根據本發明的第—個濾波器,從訊號機率估算器 63得到的訊號機率值(sig.pr〇b)會被乘進㈣〇5裡以及: 的〇』裡’換言之,在遽波器62裡,㈣5*sig_pr〇b(訊 本紙張尺度適用中國國家榡準(CNS ) A4規格{ 210x297-^^ ) f 416044 A7 B7 五、發明説明(10 ) 號機率是在估算器得到)以及a =0.8*sig-prob。渡波器62 的輸出被耦合到第二個濾波器仍,此第二個濾波器的轉移 函數是1-# z-1乘上sig-prob ’其值通常是0.5乘上1ς(1), k(l)項是第一個反射係數(first reflection coefficient)。訊號 機率估算器63對分析器出來的增益(圖2的610,由圏3 的536所解碼)反應,以比較現在音框的功率和長期佑算 的雜訊功率。圖6所示為估算器的流程圖。估算器63先 設定時間常數和刻度大小,然後比較增益的對數值和雜訊 增益加30dB的大小。如果增益水平大於雜訊增益加 30dB ’便將sig-prob設定為1 ;如果小於雜訊增益加 UdB,便將sig-prob設定為零以取消濾波。在此方式下, 如果是訊號’濾波器便作用;如果是雜訊,濾波器便不作 用。如果增益是在這兩者之間,則sig_prob的值等於(對數 增益-12dB-雜訊增益)/18。此值在12dB到30dB之間從0 到1線性變化。sig-pr〇b變成是α,沒和v的乘數 (multipli♦時間常數是被選擇用於平均聲訊並逼近雜訊 底值(floor) 〇 在TMS320C31的數位訊號處理器(Dsp)晶片上施用的 即I2.4kb/S之MELP編碼器上,對於有雜訊輸入的語 音,此改良後的自譜調頻譜加強方法導致語音品質明顯的 改善,對於無雜訊的輸入訊號則維持原方法所擁有的相同 品質。 估算器63也可以是執行以下虛擬碼的處理器晶片之 ______ -12- 本紙展尺度適财關家標準(CNS ) A4规格(2似297公釐1 ~~~ ______ (諳先閱讀背面之注意事項再填寫本頁} 裝. 今 經濟部智慧財產局員工消費合作社印製 416044 經濟部智慧財產局員工消費合作社印製 A7 _______B7_ 五、發明説明(η ) 一部分: *從現在音框的時間常數/尺度大小之對數增益估算平均雜 訊增益 up = 0.0675; down = -0.27; min = 10; max= 80; if(l〇g—gain^oise—gain+up) noise—gain = noise—gain+up; else if(log—gain<noise—gain+down) noise_gain; noise—gain+down; else noise_gain=log_gain; /*限制noise_gain的全部範圍*/ if(noise_gain<min) noise_gain=min; if(noise_gain>max) noise_gain=max; *藉由比較雜訊功率來估算現在音框的訊號機率 if(log—gain>noise—gain+30dB) sig_prob=1.0; else if (log_gain<noise_gain+12dB) sig_prob=0.0; else -13- ^^1· In 1^1 1^1 . ^^1 In «n ^^1 (讀先閲讀背面之注項再填寫本頁) 本紙張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) 416044 A7 B7 經濟部智慧財產局員工消費合作社印製 五、發明説明(12 ) sig_prob=(I og_gain-12 -noisegain)/18; *計算後濾波器係數 pf_num=bw_expand (lpc_coeff, sig_prob*0.5); pf_den=bw_expand (lpc coeff, sig_prob*0.8); tilt_cof= [1,-sig—prob*k [1 first reflection coefficient]] *應用自諧調頻譜加強濾波器到激發訊號上 filter (excitation, pf num, pf_den); filter (excitation, tilt cof); 我們注意到本方法可以輕易的應用到其他需要頻譜加 強或後濾波的語音編碼應用上。 陳等人在之前援引的美國專利號碼4 969 192裡,描 述了第一個濾波器為/9 =0.5和α =0.8以及第二濾波器轉移 函數為Ι-yz·1的後遽波器。為了估算訊號是語音而不是背 景雜訊的機率,根據本發明,短暫延遲後濾波器(sh〇rt delay post filter)32a如以上所討論地修改成石=〇 5*sig pr〇b 及α 0.8 sig-prob。第二;慮波器的轉移函數為# 2-1*化_ prob,此處的#為〇.5*k(i),而k〇)則為第一反射係數。 其他的實施例 雖…:本發明以及其優點已有詳細的描述,然而必須了解, 在不偏離彳脑巾請專__㈣的本發賴神纽範圍下, 可為各種改變、取代以及變更。 木纸張又度顏中_家梯準(CNS ) ---------裝------訂 (請先閱讀背面之注意事項再填寫本頁)
Claims (1)
- .S, ^; -'^資質内容 經濟部智慧財產局員工消費合作社印製專利申請案第86107998號 ROC Patent Appln. No.86107998 中文申諳專利範圍修正本-附件三 Amended Claims in Chinese - Encl.IIT (氏國88年11月30曰送幻〜 (Submitted on November 30, 1999) 1 . 一種用於改善數位化處理之語音訊號的據波方 含: 比較現在音框之上述訊號的訊號功率和長期估算的雜訊 功率並以此為基礎產生訊號機率估算值; 第一濾波,-將上述訊號濾波,其中濾波係由線性預測係 數及上述訊號機率值所控制; 第二濾波’利用形式為1-/ZZ-1*訊號機率值的轉移函 數’此處的Θ是比例調整因子,z·1是單位延遲運算 元。 2. 如申請專利範圍第1項的濾波方法,其中若訊號之訊號 功率的對數增益大於雜訊功率加30dB,則訊號機率值是 1 ° 3. 如申請專利範圍第2項的遽波方法,其中若訊號功率小 於雜訊功率加12dB,則訊號機率值是〇。 4. 如申請專利範圍第3項的濾波方法,其中若訊號功率大 於雜訊增益加12dB並且小於雜訊增益加30dB,則訊號 機率值等於(對數增益-12-雜訊增益)/18。 5. 如申請專利範圍第4項的濾波方法,其中第一濾波步驟 1-P(———-) 的轉移函數是——,此處的p是預測係數, 1 —尸(-?-) a * sig - prob α與Θ是比例調整因子,且Z是單位延遲Z·1的倒數 -15 - 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 86220b(9Tl) c靖先閲婧背面之注意事項再填寫本頁) .S, ^; -'^資質内容 經濟部智慧財產局員工消費合作社印製專利申請案第86107998號 ROC Patent Appln. No.86107998 中文申諳專利範圍修正本-附件三 Amended Claims in Chinese - Encl.IIT (氏國88年11月30曰送幻〜 (Submitted on November 30, 1999) 1 . 一種用於改善數位化處理之語音訊號的據波方 含: 比較現在音框之上述訊號的訊號功率和長期估算的雜訊 功率並以此為基礎產生訊號機率估算值; 第一濾波,-將上述訊號濾波,其中濾波係由線性預測係 數及上述訊號機率值所控制; 第二濾波’利用形式為1-/ZZ-1*訊號機率值的轉移函 數’此處的Θ是比例調整因子,z·1是單位延遲運算 元。 2. 如申請專利範圍第1項的濾波方法,其中若訊號之訊號 功率的對數增益大於雜訊功率加30dB,則訊號機率值是 1 ° 3. 如申請專利範圍第2項的遽波方法,其中若訊號功率小 於雜訊功率加12dB,則訊號機率值是〇。 4. 如申請專利範圍第3項的濾波方法,其中若訊號功率大 於雜訊增益加12dB並且小於雜訊增益加30dB,則訊號 機率值等於(對數增益-12-雜訊增益)/18。 5. 如申請專利範圍第4項的濾波方法,其中第一濾波步驟 1-P(———-) 的轉移函數是——,此處的p是預測係數, 1 —尸(-?-) a * sig - prob α與Θ是比例調整因子,且Z是單位延遲Z·1的倒數 -15 - 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 86220b(9Tl) c靖先閲婧背面之注意事項再填寫本頁) A8B8C8D8 416044 六、申請專利範圍 6. 如申請專利範圍第5項的濾波方法’其中α =〇_8 ’召 =0.5 〇 7. 如申請專利範圍第6項的濾波方法,其中β^0·5*1^1) ’ 此處的k(l)是第一反射係數。 8. 如申請專利範圍第1項的濾波方法,其中第一濾波步称 1_ 尸(·---) 的轉移函數是一ilsiS-Prot,此處的P是預測係數’ ——Γ> a* sig-prob α與0是比例調整因子,且z是單位延遲z·1的倒數。 9. 如申請專利範圍第8項的濾波方法’其中α =0.8,召 =0.5,仁=〇.5*k(l),此處的k(l)是第一反射係數。 1〇_ —種用於加強數位處理語音或音頻訊號濾波的方法,包 含: 將上述語音或音頻訊號緩衝形成向量音框,各向量有K 個連續取樣; 對預定區塊内被緩衝之語音或音頻訊號的音框進行分 析,以計算現在音框的線性預測係數及訊號功率; 基於現在音框的訊號功率與長期估算的雜訊功率之比 較,產生訊號機率估算值sig-prob ; 利用由前述線性預測係數及訊號機率估算值控制的延遲 對每個向量進行第一次濾波,此處的濾波是由轉移函數 1_ 尸—~) -〈泠<α <1所達成,此處的1-Ρ是LPC 1-P(-?_) ^ a* sig-prob -16 - 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公笼) — — — — — — 111 — !. I i 1---I ^--11 —--線 (請先閲讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 留308 416044 六、申請專利範圍 係數’ Z是用於轉移函數的轉換表示之單位延遲運算元 的倒數,α與泠是比例調整因子;以及 藉由轉移函數l-jczz-^sig-prob做第二次濾波,此處的以 是比例調整因子》 11·如申請專利範圍第1〇項的濾波方法,其中若訊號功率 大於雜訊增益加30dB,則前述之訊號機率值為t。 12. 如申請專利範圍第I】項的濾波方法’其中若訊號功率 小於雜訊增1 益加12dB ’則前述之訊號機率值為〇。 13. 如申請專利範圍第12項的濾波方法,其中若訊號功率 大於雜訊增益加12dB並且小於雜訊增益加3〇dB,則訊 號機率值設定為(對數增益-12-雜訊增益)/18。 14. 如申請專利範圍第10項的濾波方法,其中召=〇5,^ =0.8 ’ #=〇.5k(l) ’此處的k(l)是第一反射係數。 15. 如申請專利範圍第14項的濾波方法,其中若對數增益 大於雜訊增益加3〇dB,則前述之sig-prob等於1。 16. 如申請專利範圍第15項的濾波方法,其中若對數增益 小於雜sfl增盈加12<JB,則前述之sig-prob等於〇。 Π.如申請專利範圍第16項的濾波方法,其中若訊號功率 大於雜訊增益加12dB並且小於雜訊增益加3〇dB,則 sig-prob設定為(對數增益―〗2·雜訊增益)/18。 18.—種用於傳送語音訊號之低位元率語音通訊系統,包 括: 用於將前述之語音訊號緩衝形成向量音框的裝置,各向 量有連續之取樣; 本紙浪尺度適用中關家標準<CNS)A4規格(21G X 297公爱) II I---In - I - . · I I--I I I I illllll — (請先閱讀背面之注意i項再填寫本頁> 經濟部智慧財產局員工消費合作社印製 416044 A8SC8D8 六、申請專利範圍 對預定區塊内被緩衝的語音或音頻訊號的音框進行分析 以計算包含現在音框的線性預測係數及功率之編碼語音 的裝置; 在傳輸通道上傳送前述編碼語音的裝置; —個柄合到前述傳送裝置並將前述編碼語音解碼成數位 訊號之合成器; 一個數位-類比轉換器裝置,轉換來自前述合成器之數 位訊號’谈提供語音訊號, 前述之合成器包含加強數位處理語音的裝置,此加強數 位處理S吾音的裝置包含: 以現在音框的訊號功率與長期雜訊功率的估算之比較為 基礎’產生出訊號機率估算值sig_prob的裝置; 利用由前述線性預測係數及訊號機率估算值控制的延遲 對每個向量進行第一次濾波的裝置,此處的濾波是由轉 l-P( ~ 移函數所達成,此處的 a^sig -prol) — — — ml — — — !. — — — — — — ^ . I---I *--•錄 (請先閲讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 是LPC係數’ z是用於轉移函數的轉換表示之單位延遲 運算元的倒數’ α與万是比例調整因子;以及 藉由轉移函數l,VZ-i*sig_prob來作第二次濾波的裝 置’此處的私是比例調整因子。 19·如申請專利範圍第18項的系統,其中若訊號功率大於 雜訊增益加30dB,則前述之訊號機率值sig_pr〇b為j。 20.如申請專利範圍第19項的系統,其中若訊號功率小於 • 18 - Μ氏張尺度適用中國国家標準(CNS〉A4規格(210 X 297^F A8B8C8D8 416044 六、申請專利範圍 雜訊增益加12dB,則前述之訊號機率值sig-prob為〇。 21. 如申請專利範圍第20項的系統,其中若訊號功率大於 雜訊增益加12dB並且小於雜訊增益加30dB,則訊號機 率值sig-prob設定為(對數增益-12-雜訊增益)/18。 22. 如申請專利範圍第18項的系統,其中冷=〇.5,〇; =0.8,//=0.5k(l),此處的k(l)是第一反射係數。 23. 如申請專利範圍第18項的系統,其中合成器包含一個 由LPC係數控制的LPC濾波器。 24. 如申請專利範圍第23項的系統,其中用於加強之前述 裝置是在前述的LPC濾波器之前。 25‘如申請專利範圍第23項的系統,其中用於加強之前述 裝置是在前述的LPC濾波器之後 26. 如申請專利範圍第π項的系統,其中前述系統是 MELP編碼器。 27. —種用於改良數位化處理的語音訊號之濾波器,包含: 以現在音框内前述訊號的訊號功率與長期估算的雜訊功 率之比較為基礎,產生訊號機率估算值的裝置; 利用由線性預測係數及前述訊號機率值之控制,對前述 訊號濾波的第一濾波器; 轉移函數為1-/ZZ·1乘上訊號機率值的第二濾波器,此 處的#是比例調整因子,ζ·ι是單位延遲運算元。 28. 如申請專利範圍第27項的濾波器,其中若前述訊號的 訊號功率之對數增益大於雜訊功率加3〇dB,則前述之 訊號機率值為1。 19 - .紙張尺度適用中國國家森準(CNS)A4規格(2】〇χ297公釐 I 丨. ! I 丨! 訂·1!_ 緩 {請先《讀背面之注項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 A8B8C8D8 416044 六、申請專利範圍 29. 如申請專利範圍第28項的濾波器’其中若前述訊號功 率小於雜訊功率加12dB ’則前述之訊號機率值為〇。 30. 如申請專利範圍第29項的濾波器,其中若前述訊號功 率大於雜訊增益加12dB並且小於雜訊增益加30dB,則 訊號機率值等於(對數增益-12-雜訊增益V18。 31. 如申請專利範圍第30項的濾波器,其中前述之第一濾 ~r) 波器的轉移^函數為一β slg_pro -,此處的P是預測係 a* sig- prob 數,α與/?是比例調整因子,z是單位延遲β的倒數。 32. 如申請專利範圍第31項的濾波器,其中α=0.8 ’沒 =0.5。 33. 如申請專利範圍第32項的濾波器,其中以二0·5*1^1) ’此處 的k(l)是第一反射係數。 (請先閱讀背面之注意事項再填寫本頁) 裝 ----訂---------線 經濟部智慧財產局員工消費合作社印製 本紙張尺度適用中國國家標準(CNS)A4規格(210x297公釐)
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US2033796P | 1996-06-19 | 1996-06-19 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW416044B true TW416044B (en) | 2000-12-21 |
Family
ID=21798075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW086107998A TW416044B (en) | 1996-06-19 | 1997-06-11 | Adaptive filter and filtering method for low bit rate coding |
Country Status (6)
Country | Link |
---|---|
US (1) | US5966689A (zh) |
EP (1) | EP0814458B1 (zh) |
JP (1) | JPH1145100A (zh) |
KR (1) | KR100421160B1 (zh) |
DE (1) | DE69730779T2 (zh) |
TW (1) | TW416044B (zh) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW376611B (en) * | 1998-05-26 | 1999-12-11 | Koninkl Philips Electronics Nv | Transmission system with improved speech encoder |
EP0998166A1 (fr) * | 1998-10-30 | 2000-05-03 | Koninklijke Philips Electronics N.V. | Dispositif de traitement audio récepteur et procédé pour filtrer un signal utile et le restituer en présence de bruit ambiant |
US7295974B1 (en) * | 1999-03-12 | 2007-11-13 | Texas Instruments Incorporated | Encoding in speech compression |
JP2001175298A (ja) * | 1999-12-13 | 2001-06-29 | Fujitsu Ltd | 騒音抑圧装置 |
US7133823B2 (en) * | 2000-09-15 | 2006-11-07 | Mindspeed Technologies, Inc. | System for an adaptive excitation pattern for speech coding |
US6529867B2 (en) * | 2000-09-15 | 2003-03-04 | Conexant Systems, Inc. | Injecting high frequency noise into pulse excitation for low bit rate CELP |
EP1199812A1 (en) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Perceptually improved encoding of acoustic signals |
WO2002056303A2 (en) * | 2000-11-22 | 2002-07-18 | Defense Group Inc. | Noise filtering utilizing non-gaussian signal statistics |
US20020128839A1 (en) * | 2001-01-12 | 2002-09-12 | Ulf Lindgren | Speech bandwidth extension |
SE521693C3 (sv) * | 2001-03-30 | 2004-02-04 | Ericsson Telefon Ab L M | En metod och anordning för brusundertryckning |
US20030028386A1 (en) * | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
US7272555B2 (en) * | 2001-09-13 | 2007-09-18 | Industrial Technology Research Institute | Fine granularity scalability speech coding for multi-pulses CELP-based algorithm |
US7103541B2 (en) * | 2002-06-27 | 2006-09-05 | Microsoft Corporation | Microphone array signal enhancement using mixture models |
KR100630112B1 (ko) * | 2002-07-09 | 2006-09-27 | 삼성전자주식회사 | 이동통신시스템의 적응형 채널 추정장치 및 방법 |
US20050071154A1 (en) * | 2003-09-30 | 2005-03-31 | Walter Etter | Method and apparatus for estimating noise in speech signals |
CA2603246C (en) * | 2005-04-01 | 2012-07-17 | Qualcomm Incorporated | Systems, methods, and apparatus for anti-sparseness filtering |
SI1875463T1 (sl) * | 2005-04-22 | 2019-02-28 | Qualcomm Incorporated | Sistemi, postopki in naprava za glajenje faktorja ojačenja |
KR101565919B1 (ko) | 2006-11-17 | 2015-11-05 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 방법 및 장치 |
US20080120098A1 (en) * | 2006-11-21 | 2008-05-22 | Nokia Corporation | Complexity Adjustment for a Signal Encoder |
US20080249767A1 (en) * | 2007-04-05 | 2008-10-09 | Ali Erdem Ertan | Method and system for reducing frame erasure related error propagation in predictive speech parameter coding |
EP2232700B1 (en) | 2007-12-21 | 2014-08-13 | Dts Llc | System for adjusting perceived loudness of audio signals |
US8842846B2 (en) * | 2009-03-18 | 2014-09-23 | Texas Instruments Incorporated | Method and apparatus for polarity detection of loudspeaker |
EP2246845A1 (en) * | 2009-04-21 | 2010-11-03 | Siemens Medical Instruments Pte. Ltd. | Method and acoustic signal processing device for estimating linear predictive coding coefficients |
US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
WO2011026247A1 (en) * | 2009-09-04 | 2011-03-10 | Svox Ag | Speech enhancement techniques on the power spectrum |
US8204742B2 (en) * | 2009-09-14 | 2012-06-19 | Srs Labs, Inc. | System for processing an audio signal to enhance speech intelligibility |
CA3160488C (en) * | 2010-07-02 | 2023-09-05 | Dolby International Ab | Audio decoding with selective post filtering |
US20120143604A1 (en) * | 2010-12-07 | 2012-06-07 | Rita Singh | Method for Restoring Spectral Components in Denoised Speech Signals |
WO2013019562A2 (en) | 2011-07-29 | 2013-02-07 | Dts Llc. | Adaptive voice intelligibility processor |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3702215A1 (de) * | 1987-01-26 | 1988-08-04 | Ant Nachrichtentech | Uebertragungsanordnung fuer digitale signale |
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
US5408529A (en) * | 1993-06-02 | 1995-04-18 | Motorola, Inc. | Dual tone detector operable in the presence of speech or background noise and method therefor |
-
1997
- 1997-06-11 DE DE69730779T patent/DE69730779T2/de not_active Expired - Lifetime
- 1997-06-11 TW TW086107998A patent/TW416044B/zh not_active IP Right Cessation
- 1997-06-11 EP EP97109600A patent/EP0814458B1/en not_active Expired - Lifetime
- 1997-06-18 US US08/877,833 patent/US5966689A/en not_active Expired - Lifetime
- 1997-06-18 KR KR1019970025556A patent/KR100421160B1/ko not_active IP Right Cessation
- 1997-06-19 JP JP9162949A patent/JPH1145100A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
KR100421160B1 (ko) | 2004-05-24 |
DE69730779T2 (de) | 2005-02-10 |
JPH1145100A (ja) | 1999-02-16 |
EP0814458A3 (en) | 1998-09-23 |
KR980006936A (ko) | 1998-03-30 |
EP0814458B1 (en) | 2004-09-22 |
EP0814458A2 (en) | 1997-12-29 |
US5966689A (en) | 1999-10-12 |
DE69730779D1 (de) | 2004-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW416044B (en) | Adaptive filter and filtering method for low bit rate coding | |
RU2325707C2 (ru) | Способ и устройство для эффективного маскирования стертых кадров в речевых кодеках на основе линейного предсказания | |
EP0673013B1 (en) | Signal encoding and decoding system | |
RU2257556C2 (ru) | Квантование коэффициентов усиления для речевого кодера линейного прогнозирования с кодовым возбуждением | |
RU2485606C2 (ru) | Схема кодирования/декодирования аудио сигналов с низким битрейтом с применением каскадных переключений | |
JP3566652B2 (ja) | 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法 | |
US5699477A (en) | Mixed excitation linear prediction with fractional pitch | |
JP4662673B2 (ja) | 広帯域音声及びオーディオ信号復号器における利得平滑化 | |
JP4005359B2 (ja) | 音声符号化及び音声復号化装置 | |
JP3234609B2 (ja) | 32Kb/sワイドバンド音声の低遅延コード励起線型予測符号化 | |
KR20010102004A (ko) | Celp 트랜스코딩 | |
JPH10187197A (ja) | 音声符号化方法及び該方法を実施する装置 | |
JP3446764B2 (ja) | 音声合成システム及び音声合成サーバ | |
JP2002533963A (ja) | 符号化通信信号の性能改良のための符号化された改良特性 | |
JPH09127996A (ja) | 音声復号化方法及び装置 | |
JPH02155313A (ja) | 符号化方法 | |
EP0865029B1 (en) | Efficient decomposition in noise and periodic signal waveforms in waveform interpolation | |
Kroon et al. | Predictive coding of speech using analysis-by-synthesis techniques | |
EP0779732A2 (en) | Multi-point voice conferencing system over a wide area network | |
US20030065507A1 (en) | Network unit and a method for modifying a digital signal in the coded domain | |
EP1208413A2 (en) | Coded domain noise control | |
JPH056197A (ja) | 音声合成装置用ポストフイルタ | |
JPH1083199A (ja) | 量子化装置及び方法 | |
JP4295372B2 (ja) | 音声符号化装置 | |
JPH0736484A (ja) | 音響信号符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent | ||
MM4A | Annulment or lapse of patent due to non-payment of fees |