TWI430264B - 交叉乘積加強之諧波移調 - Google Patents

交叉乘積加強之諧波移調 Download PDF

Info

Publication number
TWI430264B
TWI430264B TW099101097A TW99101097A TWI430264B TW I430264 B TWI430264 B TW I430264B TW 099101097 A TW099101097 A TW 099101097A TW 99101097 A TW99101097 A TW 99101097A TW I430264 B TWI430264 B TW I430264B
Authority
TW
Taiwan
Prior art keywords
sub
band
signal
frequency
analysis
Prior art date
Application number
TW099101097A
Other languages
English (en)
Other versions
TW201128634A (en
Inventor
Lars Villemoes
Per Hedelin
Original Assignee
Dolby Int Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Int Ab filed Critical Dolby Int Ab
Publication of TW201128634A publication Critical patent/TW201128634A/zh
Application granted granted Critical
Publication of TWI430264B publication Critical patent/TWI430264B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Auxiliary Devices For Music (AREA)
  • Carbon And Carbon Compounds (AREA)
  • Fats And Perfumes (AREA)
  • Superconductors And Manufacturing Methods Therefor (AREA)

Description

交叉乘積加強之諧波移調
本發明相關於使用用於高頻重構(HFR)之諧波移調法的音訊編碼系統。
HFR技術,諸如頻譜帶複製(SBR)技術,容許顯著地改善習知知覺音訊編碼解碼器的編碼效率。在與MPEG-4先進音訊編碼(AAC)組合後,其形成非常有效率的音訊編碼解碼器,其已使用在XM無線電系統及數位無線電調幅聯盟內。AAC及SBR的組合稱為aacPlus。其係指稱為高效率AAC規格之MPEG-4標準的一部分。通常,HFR技術可用逆向及順向相容的方法與任何知覺音訊編碼解碼器組合,因此提供將已建立廣播系統昇級的可能性,例如,使用在Eureka DAB系統中的MPEG第2層級。HFR移調法也可與語音編碼解碼器組合,以容許極低位元率的寬頻語音。
HFR背後的基本概念係在訊號之高頻範圍的特徵及該相同訊號之低頻範圍的特徵之間的強關聯通常係存在的之觀察。因此,代表訊號之原始輸入高頻範圍的良好近似可藉由從低頻範圍至高頻範圍之訊號移調而達成。
此移調觀念係建立於WO 98/57436中,作為從音訊訊號之低頻率帶重建高頻率帶的方法。儲存在位元率中的實質可藉由將此觀念使用在音訊編碼及/或語音編碼中而得到。在下文中,將參考至音訊編碼,但應注意所描述之方式及系統可相等地應用至語音編碼及在統一語音及音訊編碼(USAC)中。
在HFR為基之音訊編碼系統中,將低頻寬訊號呈現至核心波形編碼器,並使用低頻寬訊號的移調及額外的側資訊,其典型地以非常低位元率編碼且其描述該目標頻譜形狀,在該解碼器側重生該等較高頻。針對低位元率,其中該核心編碼訊號之頻寬狹窄,重建在知覺上具有愉悅特徵之高頻帶,亦即,該音訊訊號的高頻範圍,變得逐漸重要。在下文中提及諧波頻率重構法的二種變化,將一種指稱為諧波移調並將另一種指稱為單側頻帶調變。
界定在WO 98/57436中的諧波移調的原理係將具有頻率ω的正弦曲線映射至具有頻率Tω的正弦曲線,其中T>1係界定該移調級的整數。該諧波移調的誘人特性係其藉由等於該移調級的因數將來源頻率範圍伸展為目標頻率範圍,亦即,藉由等於T的因數。該諧波移調良好地對複雜的音樂素材實施。此外,諧波移調呈現低交越頻率,亦即,在該交越頻率上方的大高頻範圍可從該交越頻率下方之相對小的低頻範圍產生。
相對於諧波移調,單側頻帶調變(SSB)為基之HFR將具有頻率ω的正弦曲線映射至具有頻率ω+Δω的正弦曲線,其中Δω係固定頻率移位。已參察到給定具有低頻寬的核心訊號,刺耳的振鈴人造音可能從該SSB移調產生。也應注意針對低交越頻率,亦即,小來源頻率範圍,諧波移調將比SSB為基的移調需要較少數量的音調以填充期望目標頻率範圍。藉由例示方式,若應填充(ω,4ω)的高頻範圍,則使用移調級T=4,諧波移調可從(ω,ω)之低頻範圍填充此頻率範圍。另一方面,使用相同低頻範圍之以SSB為基的移調必須使用Δω=ω的頻率移位,且必須重複此程序四次以填充該高頻範圍(ω,4ω)。
另一方面,如已於WO 02/052545 A1中所指出的,諧波移調對具有顯著週期結構的訊號具有缺點。此種訊號係具有頻率Ω、2Ω、3Ω、…之在諧波上相關的正弦曲線之重疊,其中Ω係基本頻率。在T諧波移調級上,該等輸出正弦曲線具有頻率TΩ、2TΩ、3TΩ、…,在T>1的情形中,其僅係所期望之全諧波序列的精確子集。從產生音訊品質的觀點,與該移調基本頻率TΩ對應之「鬼影」音調典型地將會被察覺。該諧波移調通常導致該編碼及解碼音訊訊號的「金屬」音特性。可能藉由加入T=2、3、…、Tmax 之數個移調級至該HFR而將該情況減輕至特定程度,但若待避免多數的頻譜間隙,此方法在計算上係複雜的。
當使用諧波移調時,避免「鬼影」音調出現的另一方案已於WO 02/052545 A1中提出。該方案由二種移調的使用組成,亦即,典型的諧波移調及特殊的「脈衝移調」。所描述的方法教導針對偵測為具有脈衝串類特性之週期的該音訊訊號之部分切換至專屬的「脈衝移調」。使用此方法的問題係相較於基於高解析濾波器庫的諧波移調,「脈衝移調」在複雜音樂素材上的應用通常使品質降級。因此,該偵測機構必須相當保守地調整,使得該脈衝移調不用於複雜素材。不可避免地,單音調樂器及聲音有時會被分類為複雜訊號,特此引起諧波移調且因此失去諧波。此外,若切換發生在單音調訊號的中央,或在較弱的複雜背景中具有主要音調之訊號中時,在具有非常不同之頻譜填充性質的二移調方法之間的該切換自身將產生可聽見的人造音。
本發明提供方法及系統以完成自週期訊號之諧波移調產生該諧波序列。頻域移調包含將非線性修改次頻帶訊號從分析濾波器庫映射至合成濾波器庫之選擇次頻帶的步驟。該非線性修改包含相位修改或相位旋轉,彼等係在可藉由冪次律及之後的振幅調整而得到之複濾波器庫中。然而,先前技術的移調每次分別修改一分析次頻帶,本發明教導針對各合成次頻帶加入至少二不同分析次頻帶的非線性組合。該等待組合分析次頻帶之間的間距可能與待移調訊號之主要成份的基本頻率相關。
在最常見形式中,本發明的數學描述係將頻率成份ω1 、ω2 、…、ωK 之群組用於產生新頻率成份
ω=T1 ω1 +T2 ω2 +…+TK ωK
其中該等係數T1 、T2 、…、TK 係整數移調級,彼等之和為總移調級T=T1 +T2 +…+TK 。此效果係藉由以該等因數T1 、T2 、…、TK 修改適當地選擇之次頻帶訊號K的相位,並將該結果重組為具有與該等已修改相位的和相同之相位的訊號而得到。重要的係須注意所有此等相位操作係良好界定且不模糊的,因為該等個別移調級係整數,且只要總移調級滿足T1,此等整數的一部分甚至可係負的。
先前技術方法對應於K=1之情形,且本發明教導使用K2。該描述文字主要處理K=2之情形,T2足以解決現有之最具體問題。但應注意將K>2之情形視為由本說明書所等同地揭示及涵蓋。
本發明使用來自較高數量之低頻帶分析頻道的資訊,亦即,較高數量之分析次頻帶訊號,以將非線性修改次頻帶訊號從分析濾波器庫映射至合成濾波器庫之選擇次頻帶。該移調不僅每次分別地修改一次頻帶,也針對各合成次頻帶加入至少二不同分析次頻帶的非線性組合。如已提及的,以T>1將T級諧波移調設計成將頻率ω的正弦曲線映射至具有頻率Tω的正弦曲線。根據本發明,將具有音調參數Ω及索引0<r<T之所謂的交叉乘積加強設計成將具有頻率(ω,ω+Ω)之正弦曲線對映射至具有頻率(T-r)ω+r(ω+Ω)=Tω+rΩ的正弦曲線。應理解針對此種交叉乘積移調,具有週期Ω之週期訊號的所有部分頻率將藉由將具有範圍從1至T-1之索引r的音調參數Ω之所有交叉乘積加至T級諧波移調而產生。
根據本發明之實施樣態,描述用於從訊號的低頻成份產生該訊號之高頻成份的系統及方法。應注意在下文之系統背景中描述的該等特性可相等地應用至本發明方法。該訊號可能係,例如音訊及/或語音訊號。該系統及方法可能用於統一語音及音訊編碼。該訊號包含低頻成份及高頻成份,其中該低頻成份包含低於特定交越頻率之頻率且該高頻成份包含高於該交越頻率的頻率。在特定環境中,可能需要從訊號之低頻成份估算其高頻成份。藉由例示方式,特定音訊編碼方案僅編碼音訊訊號的低頻成份且目的在於單獨地從該已解碼低頻成份重構該訊號的高頻成份,可能藉由使用在該原始高頻成份之波封上的特定資訊。本文描述之系統及方法可能在此種編碼及解碼系統的背景中使用。
用於產生高頻成份的該系統包含分析濾波器庫,其提供該訊號之低頻成份的複數個次頻帶訊號。此種分析濾波器庫可能包含具有固定頻寬的帶通濾波器群組。顯然地在語音訊號的背景中,使用具有對數頻寬分佈之帶通濾波器群組也可能係有利的。該分析濾波器庫的目的係將該訊號的低頻成份分解入其頻率組成中。此等頻率組成將反映入由該分析濾波器庫所產生的複數個分析次頻帶訊號中。藉由例示方式,包含由樂器演奏之音符的訊號將針對與該演奏音符之諧波頻率對應的次頻帶而分解入具有顯著振幅的分析次頻帶訊號中,然而其他次頻帶將顯示具有低振幅的分析次頻帶訊號。
該系統另外包含非線性處理單元,藉由修改或旋轉該等複數個分析次頻帶訊號之第一及第二分析次頻帶訊號的相位並藉由組合該等相位已修改分析次頻帶訊號,以產生具有特殊合成頻率之合成次頻帶訊號。該第一及第二分析次頻帶訊號通常係不同的。換言之,彼等對應於不同次頻帶。該非線性處理單元可能包含所謂的交叉項處理單元,該合成次頻帶訊號係產生於其中。該合成次頻帶訊號包含該合成頻率。通常,該合成次頻帶訊號包含來自特定合成頻率範圍的頻率。該合成頻率係在此頻率範圍內的頻率,例如,該頻率範圍的中央頻率。該合成頻率以及該合成頻率範圍典型地高於該交越頻率。該分析次頻帶訊號以類比方式包含來自特定分析頻率範圍的頻率。此等分析頻率範圍典型地低於該交越頻率。
相位修改操作可能由移調該等分析次頻帶訊號之頻率所組成。典型地,該分析濾波器庫產生可能表示為包含振幅及相位之複指數的複分析次頻帶訊號。該複次頻帶訊號的相位對應於該次頻帶訊號的頻率。此種次頻帶訊號藉由特定移調級T'的移調可能藉由將該次頻帶訊號採用為該移調級T'的冪次而實施。此導致該複次頻帶訊號的相位待被乘以該移調級T'。結果,該移調分析次頻帶訊號呈現係原始相位或頻率T'倍大的相位或頻率。此種相位修改操作也可能指稱為相位旋轉或相位乘積。
此外,該系統包含合成濾波器庫,用於從該合成次頻帶訊號產生該訊號的高頻成份。換言之,該合成濾波器庫的目的係可能從複數個合成頻率範圍可能合併複數個合成次頻帶訊號,並在時域中產生該訊號的高頻成份。應注意針對包含基本頻率的訊號,例如基本頻率Ω,該合成濾波器庫及/或該分析濾波器庫呈現與該訊號之基本頻率相關聯之頻率間距可能係有利的。明確地說,選擇具有足夠低頻間距或足夠高頻間距的濾波器庫以決定該基本頻率Ω可能係有利的。
根據本發明之另一實施樣態,該非線性處理單元或該非線性處理單元內的交叉項處理單元包含第一及第二移調級的多輸入單輸出單元,分別從呈現第一及第二分析頻率的該第一及第二分析次頻帶訊號產生該合成次頻帶訊號。換言之,該多輸入單輸出單元實施該第一及第二分析次頻帶訊號的移調並將該二移調分析次頻帶訊號合併入合成次頻帶訊號。該第一分析次頻帶訊號係已相位修改的,或其相位已乘以該第一移調級,且該第二分析次頻帶訊號係已相位修改的,或其相位已乘以該第二移調級。在複分析次頻帶訊號的情形中,此種相位修改操作係由將個別分析次頻帶訊號的相位乘以個別移調級所組成。組合此二移調分析次頻帶訊號以產生具有合成頻率之組合合成次頻帶訊號,該合成頻率對應於被乘以該第一移調級之該第一分析頻率加上被乘以該第二移調級的該第二分析頻率。該組合步驟可能由該二已移調複分析次頻帶訊號的乘積所組成。二訊號之間的此種乘積可能由彼等樣本之乘積所組成。
上述特性也可能以方程式表示。令第一分析頻率為ω且第二分析頻率為(ω+Ω)。應注意此等變數也可能代表該二分析次頻帶訊號的個別分析頻率範圍。換言之,應將頻率理解為代表包含在特定頻率範圍或頻率次頻帶內的所有頻率,亦即,也應將該第一及第二分析頻率理解為第一及第二分析頻率範圍或第一及第二分析次頻帶。此外,該第一移調級可能係(T-r)且該第二移調級可能係r。將該等移調級限制成使得T>1且1r<T可能係有利的。針對此種情形,該多輸入單輸出單元可能產生具有(T-r)‧ω+r‧(ω+Ω)之合成頻率的合成次頻帶訊號。
根據本發明之其他實施樣態,該系統包含產生具有該合成頻率之複數個部分合成次頻帶訊號的複數個多輸入單輸出單元及/或複數個非線性處理單元。換言之,可能產生覆蓋相同合成頻率範圍的複數個部分合成次頻帶訊號。在此種情形中,設置用於組合該等複數個合成次頻帶訊號的次頻帶加總單元。然後該等組合部分合成次頻帶訊號代表該合成次頻帶訊號。該組合操作可能包含該等複數個部分合成次頻帶訊號的相加。也可能包含從該等複數個部分合成次頻帶訊號確定平均合成次頻帶訊號,其中該等合成次頻帶訊號可能係根據彼等與該合成次頻帶訊號的關聯性而加權。該組合操作也可能包含從具有,例如超過預界定臨界值之振幅的複數個次頻帶訊號選擇一或數個。應注意該合成次頻帶訊號乘以增益參數可能係有利的。顯然地在具有複數個部分合成次頻帶訊號的情形中,此種增益參數可能有助於該等合成次頻帶訊號的正規化。
根據本發明之其他實施樣態,該非線性處理單元另外包含用於從該等複數個分析次頻帶訊號之第三分析次頻帶訊號產生另一合成次頻帶訊號的直接處理單元。此種直接處理單元可能執行描述在,例如WO 98/57436中的直接移調法。若該系統包含額外的直接處理單元,則其可能必須設置用於組合對應合成次頻帶訊號的次頻帶加總單元。此種對應合成次頻帶訊號典型地係覆蓋相同合成頻率範圍及/或呈現相同合成頻率的次頻帶訊號。該次頻帶加總單元可能實施根據上文略述之該等實施樣態的該組合。若,例如,來自作用於該合成次頻帶訊號的該等交叉項之一或多個分析次頻帶訊號的最小振幅小於該訊號之振幅的預界定分數時,顯然地也可能在一旦於該多輸入單輸出單元中產生特定合成次頻帶訊號時將其忽略。該訊號可能係該訊號的低頻成份或特定的分析次頻帶訊號。此訊號也可能係特定的合成次頻帶訊號。換言之,若用於產生該合成次頻帶訊號之該等分析次頻帶訊號的能量或振幅太小時,則可能不將此合成次頻帶訊號用於產生該訊號的高頻成份。該能量或振幅可能針對各樣本測定,或其可能針對樣本群組測定,例如,藉由確定該等分析次頻帶訊號之跨越複數個相鄰樣本的時間平均或滑動窗平均。
該直接處理單元可能包含第三移調級T'的單輸入單輸出單元,從呈現第三分析頻率的第三分析次頻帶訊號產生該合成次頻帶訊號,其中該第三分析次頻帶訊號已相位修改,或其相位已乘以該第三移調級T',且其中T'大於一。然後該合成頻率對應於被乘以該第三移調級的該第三分析頻率。應注意此第三移調級T'等於下文引入之該系統移調級T為佳。
根據本發明之另一實施樣態,該分析濾波器庫具有基本上固定次頻帶間距Δω的N個分析次頻帶。如上文所提及,此次頻帶間距Δω可能與該訊號之基本頻率相關。分析次頻帶與分析次頻帶索引n相關聯,其中n{1,…,N}。換言之,該分析濾波器庫的分析次頻帶可能藉由次頻帶索引n識別。以相似的方式,包含來自該對應分析次頻帶的頻率範圍之頻率的該等分析次頻帶訊號可能以次頻帶索引n識別。
在該合成側,該合成濾波器庫具有也與合成次頻帶索引n相關聯的合成次頻帶。此合成次頻帶索引n也識別該合成次頻帶訊號,其包含來自具有次頻帶索引n之該合成次頻帶的合成頻率範圍之頻率。若該系統具有系統移調級,也指稱為總移調級T,則該合成次頻帶典型地具有基本上固定次頻帶間距Δω‧T,亦即,該等合成次頻帶的次頻帶間距比該等分析次頻帶之次頻帶間距大T倍。在此種情形中,具有索引n之該合成次頻帶及該分析次頻帶各者包含經由該因數或該系統移調級T而彼此相關的頻率範圍。藉由例示方式,若具有索引n之分析次頻帶的頻率範圍係[(n-1)‧ω,n‧ω],則具有索引n之合成次頻帶的頻率範圍係[T‧(n-1)‧ω,T‧n‧ω]。
鑑於該合成次頻帶訊號與具有索引n之合成次頻帶相關聯,本發明之另一實施樣態為具有索引n之此合成次頻帶訊號係在多輸入單輸出單元中從第一及第二分析次頻帶訊號產生。該第一分析次頻帶訊號與具有索引n-p1 之分析次頻帶相關聯且該第二分析次頻帶訊號與具有索引n+p2 之分析次頻帶相關聯。
在下文中,略述用於選擇索引移位(p1 ,p2 )對的數個方法。此可能藉由所謂的索引選擇單元實施。典型地,選擇最佳索引移位對以產生具有預界定合成頻率的合成次頻帶訊號。在第一方法中,該等索引移位p1 及p2 係選自儲存在索引儲存單元中之有限的(p1 ,p2 )對列。可從此有限的索引移位對列選擇(p1 ,p2 )對,使得將包含該第一分析次頻帶訊號的振幅及該第二分析次頻帶訊號之振幅的該群組之最小值最大化。換言之,該對應分析次頻帶訊號的振幅可針對索引移位p1 及p2 的各可能對確定。在複分析次頻帶訊號的情形中,該振幅對應於絕對值。該振幅可能針對各樣本確定,或其可能針對樣本群組確定,例如,藉由確定該分析次頻帶訊號之跨越複數個相鄰樣本的時間平均或滑動窗平均。此分別產生第一及第二分析次頻帶訊號的第一及第二振幅。考慮該第一及第二振幅的最小者且該索引移位(p1 ,p2 )係針對此最小振幅值係最高者選擇。
在另一方法中,該等索引移位p1 及p2 係選自有限的(p1 ,p2 )對列,其中該有限列係藉由該方程式p1 =r‧1及p2 =(T-r)‧1確定。在此等方程式中,1係正整數,取自,例如,1至10之值。此方法在用於移調該第一分析次頻帶(n-p1 )之該第一移調級係(T-r)且用於移調該第二分析次頻帶(n+p2 )的該第二移調級係r之情形中特別有用。假設該系統移調級T係固定的,可能將參數l及r選擇成使得包含該第一分析次頻帶訊號之振幅及該第二分析次頻帶訊號的振幅之群組的最小值最大化。換言之,參數l及r可能藉由如上文所略述之最大-最小最佳方案而選擇。
在其他方法中,該第一及第二分析次頻帶訊號的選擇可能基於該潛在訊號的特徵。顯然地,若該訊號包含基本頻率Ω,亦即,若該訊號具有類脈衝串特性之週期,選擇索引移位p1 及p2 時考慮到此種特徵可能係有利的。該基本頻率Ω可能從該訊號的低頻成份確定或其可能從包含該低及高頻成份二者的該原始訊號確定。在該第一情形中,基本頻率Ω可在使用高頻重構的訊號解碼器確定,而在第二情形中,基本頻率Ω典型地會在訊號編碼器確定且之後發訊至對應的訊號解碼器。若使用具有次頻帶間距Δω的分析濾波器庫且若用於移調該第一分析次頻帶(n-p1 )的第一移調級係(T-r)且若用於移調該第二分析次頻帶(n+p2 )的第二移調級係r,則可能將p1 及p2 選擇成使得彼等之和p1 +p2 近似於分數Ω/Δω且彼等之分數p1 /p2 近似於r/(T-r)。在特定情形中,將p1 及p2 選擇成使得該分數p1 /p2 等於r/(T-r)。
根據本發明之另一實施樣態,用於產生訊號之高頻成份的該系統也包含將預界定時間實例k周圍之低頻成份的預界定時間間隔隔離之分析窗。該系統也可能包含將預界定時間實例k周圍之該高頻成份的預界定時間間隔隔離之合成窗。此等窗對具有隨時間改變之頻率組成的訊號特別有用。彼等容許分析訊號的瞬間頻率成份。在與該等濾波器庫組合後,此種時間相關頻率分析的典型範例係短時間傅立葉轉換(STFT)。應注意通常該分析窗係該合成窗的時間散佈版本。針對具有系統移調級T的系統,時域中的分析窗可能係具有散佈因數T之在時域中的合成窗的時間散佈版本。
根據本發明之其他實施樣態,描述用於解碼訊號的系統。該系統採用訊號之低頻成份的編碼版本並包含移調單元,根據上文描述之該系統,用於從該訊號的低頻成份產生該訊號的高頻成份。此種解碼系統典型地另外包含用於解碼該訊號之低頻成份的核心解碼器。該解碼系統可能另外包含用於實施該低頻成份的升取樣,以產生升取樣低頻成份的升取樣器。若該訊號的低頻成份已在編碼器降低取樣時,利用該低頻成份相較於該原始訊號僅覆蓋已縮減頻率範圍的事實,此可能係必要的。此外,該解碼系統可能包含用於接收該已編碼訊號的輸入單元,包含該低頻成份,及用於提供該已解碼訊號的輸出單元,包含該低頻成份及所產生之高頻成份。
該解碼系統可能另外包含波封調整器以定形該高頻成份。當訊號之高頻可能使用描述在本說明書中的高頻重構系統及方法自訊號之低頻範圍重生時,從該原始訊號擷取與其高頻成份之頻譜波封相關的資訊可能係有利的。然後可能將此波封資訊提供給該解碼器,以產生良好近似於該原始訊號的高頻成份之頻譜波封的高頻成份。此操作典型地在解碼系統之波封調整器中實施。該解碼系統可能包含波封資料接收單元,用於接收與該訊號之高頻成份的波封相關之資訊。然後該重生高頻成份及該已解碼並可能昇取樣之低頻成份可能在成份加總單元中加總以確定該解碼訊號。
如上文所略述的,用於產生該高頻成份的系統可能使用與待移調及組合之分析次頻帶訊號相關的資訊,以產生特定合成次頻帶訊號。為此,該解碼系統可能另外包含用於接收容許第一及第二分析次頻帶訊號之選擇的資訊之次頻帶選擇資料接收單元,該合成次頻帶訊號待從該第一及該第二分析次頻帶訊號產生。此資訊可能相關於該編碼訊號的特定特徵,例如,該資訊可能與該訊號的基本頻率Ω相關聯。該資訊也可能直接相關於待被選擇的分析次頻帶。藉由例示方式,該資訊可能包含第一及第二分析次頻帶訊號之可能對列或可能的索引移位(p1 ,p2 )對列。
根據本發明之另一實施樣態,描述已編碼訊號。此已解碼訊號包含與該已解碼訊號的低頻成份相關之資訊,其中該低頻成份包含複數個分析次頻帶訊號。此外,該已編碼訊號包含與該等複數個分析次頻帶訊號中予以被選擇以產生該已解碼訊號的高頻成份之兩分析次頻帶訊號相關的資訊,該等高頻成份係藉由移調該已選擇之兩分析次頻帶訊號產生。換言之,該已編碼訊號包含訊號之低頻成份的可能已編碼版本。此外,其提供資訊,諸如該訊號的基本頻率Ω或可能的索引移位(p1 ,p2 )對列,其將容許解碼器基於本說明書所略述之該交叉乘積加強諧波移調法而重生該訊號的高頻成份。
根據本發明之其他實施樣態,描述用於編碼訊號的系統。此編碼系統包含用於將該訊號***為低頻成份及高頻成份的***單元及用於編碼該低頻成份的核心編碼器。其也包含用於確定該訊號之基本頻率Ω的頻率確定單元及用於編碼該基本頻率Ω的參數編碼器,其中該基本頻率Ω係使用在解碼器中以重生該訊號的該高頻成份。該系統也可能包含用於確定該高頻成份之頻譜波封的波封確定單元以及用於編碼該頻譜波封的波封編碼器。換言之,該編碼系統移除該原始訊號的高頻成份並藉由核心編碼器編碼該低頻成份,例如,AAC或杜比D編碼器。此外,該編碼系統分析該原始訊號的高頻成份,並確定在該解碼器使用的資訊群組以重生該已解碼訊號的高頻成份。該資訊群組可能包含該訊號的基本頻率Ω及/或該高頻成份的頻譜波封。
該編碼系統也可能包含提供該訊號的低頻成份之複數個分析次頻帶訊號的分析濾波器庫。此外,其可能包含用於確定用於產生該訊號之高頻成份的第一及第二次頻帶訊號之次頻帶對確定單元,以及用於編碼代表該等已確定之第一及該第二次頻帶訊號的索引號碼之索引編碼器。換言之,該編碼系統可能使用描述於本說明書中的該高頻重構法及/或系統,以確定該訊號之高頻成份及極高頻成份可能自其產生的該等分析次頻帶。然後在此等次頻帶上的該資訊,例如,有限的索引移位(p1 ,p2 )對列,可能被編碼並提供至該解碼器。
如上文所強調的,本發明也包括用於產生訊號之高頻成份的方法,以及用於解碼及編碼訊號的方法。於上文之系統背景中略述的該等特性將等同地應用至對應方法。在下文中略述根據本發明之該等方法的選擇實施樣態。此等實施樣態也以相似的方式應用至本說明書略述的該系統。
根據本發明之另一實施樣態,描述用於從訊號的低頻成份實施高頻成份之高頻重構的方法。此方法包含從第一頻率帶提供該低頻成份的第一次次頻帶訊號並從第二頻率帶提供該低頻成份的第二次頻帶訊號之步驟。換言之,將二次頻帶訊號與該訊號之低頻成份隔離,該第一次頻帶訊號包括第一頻率帶且該第二次頻帶訊號包括第二頻率帶。該二頻率次頻帶係不同的為佳。在另一步驟中,該第一及該第二次頻帶訊號分別藉由第一及第二移調因數移調。各次頻帶訊號的移調可能根據用於移調訊號之已知方法實施。在複次頻帶訊號的情形中,該移調可能藉由修改該相位,或藉由以個別移調因數或移調級乘以該相位而實施。在另一步驟中,組合該已移調第一及第二次頻帶訊號,以產生包含來自高頻率帶之頻率的高頻成份。
可能實施該移調使得該高頻率帶對應於被乘以該第一移調因數的該第一頻率帶及被乘以該第二移調因數之該第二頻率帶的和。此外,該移調步驟可能包含將該第一次頻帶訊號的該第一頻率帶乘以該第一移調因數以及將該第二次頻帶訊號的該第二頻率帶乘以該第二移調因數的該等步驟。為簡化該解釋而無須限制其範圍,本發明係針對個別頻率之移調說明。然而,應注意該移調不僅針對個別頻率實施,也對整體頻率帶實施,亦即,針對包含在頻率帶內的複數個頻率。實際上,頻率的移調及頻率帶之移調在本說明書中應理解為係可互換的。然而,必須注意的一點係該等分析及合成濾波器庫的不同頻率解析度。
在上述方法中,該提供步驟可能包含藉由分析濾波器庫濾波該低頻成份,以產生第一及第二次頻帶訊號。另一方面,該組合步驟可能包含將該第一移調次頻帶訊號乘以該第二移調次頻帶訊號以產生高次頻帶訊號,以及將該高次頻帶訊號輸入至合成濾波器庫以產生該高頻成份。也可能將其他訊號轉換成頻率表示並自其轉換出,且在本發明之範圍內。此種訊號轉換包含傅立葉轉換(FFT、DCT)、小波轉換、正交鏡相濾波器(QMF)等。此外,此等轉換也包含用於隔離「待轉換」訊號之縮減時間間隔的目的之窗函數。可能的窗函數包含高斯窗、餘弦窗、漢明窗(Hamming windows)、韓恩窗(Hann windows)、矩形窗、巴列特窗(Barlett windows)、布雷克曼窗(Blackman windows)、及其他窗。在本說明書中,術語「濾波器庫」可能包含可能與任何此種窗函數組合的任何此種轉換。
根據本發明之另一實施樣態,描述用於解碼已編碼訊號的方法。該已編碼訊號係自原始訊號導出並僅代表該原始訊號中低於交越頻率之頻率次頻帶的一部分。該方法包含提供該已編碼訊號之第一及第二頻率次頻帶的步驟。此可能藉由使用分析濾波器庫而完成。然後該等頻率次頻帶分別藉由第一移調因數及第二移調因數而移調。此可能藉由實施該第一頻率次頻帶中之該訊號的相位修改或與第一移調因數的相位乘積並藉由實施該第二頻率次頻帶中之該訊號的相位修改或與第二移調因數的相位乘積而完成。最後,高頻次頻帶係從該第一及第二已移調頻率次頻帶產生,其中該高頻次頻帶高於該交越頻帶。此高頻次頻帶可能對應於被乘以該第一移調因數的該第一頻率次頻帶及被乘以該第二移調因數之該第二頻率次頻帶的和。
根據本發明之另一實施樣態,描述用於編碼訊號的方法。此方法包含濾波該訊號以隔離該訊號的低頻及編碼該訊號之該低頻成份的步驟。此外,提供該訊號之該低頻成份的複數個分析次頻帶訊號。此可能使用如本說明書中所描述的分析濾波器庫而完成。然後確定用於產生該訊號之高頻成份的第一及第二次頻帶訊號。此可能使用在本說明書中略述之該等高頻重構法及系統而完成。最後,將代表該已確定第一及第二次頻帶訊號的資訊編碼。此種資訊可能係該原始訊號的特徵,例如,該訊號的基本頻率Ω,或與該等已選擇分析次頻帶相關的資訊,例如,該索引移位對(p1 ,p2 )。
應注意可能任意地組合上述之本發明的該等實施例及實施樣態。明確地說,應注意針對系統略述之該等實施樣態也可應用至由本發明所包含的該對應方法。此外,應注意本發明的揭示也涵蓋藉由反向參考相關申請專利範圍而明顯給定之申請專利範圍組合之外的其他申請專利範圍組合,亦即,申請專利範圍及彼等之技術特性可以任何順序及任何形式組合。
下文描述之該等實施例僅用於說明所謂的交叉乘積加強之諧波移調的本發明原理。已理解此處所描述之配置及細節的修改及變化對熟悉本發明之人士將係明顯的。因此,其意圖係僅由待審專利之申請專利範圍的範圍所限制且不受以本文實施例之描述及解釋的方式所呈現的特定細節所限制。
圖1描繪HFR加強音訊解碼器的操作。核心音訊解碼器101輸出提供至可能係必要之昇取樣器104的低頻寬音訊訊號,以產生期望全取樣率之最終音訊輸出作用。此種昇取樣對雙率系統係必要的,其中該頻帶受限之核心音訊編碼解碼器係以一半的外部音訊取樣率操作,而該HFR部分係以全取樣頻率處理。所以,對於單率系統,省略此昇取樣器104。核心音訊解碼器101的低頻寬輸出也輸送至輸出已移調訊號的該移調器或移調單元102,該移調訊號包含期望高頻範圍的訊號。此已移調訊號可能藉由波封調整器103在時間及頻率中定形。該最終音訊輸出係低頻寬核心訊號及該波封調整移調訊號的和。
圖2描繪諧波移調器201的操作,其對應於圖1之移調器102,包含數個移調級T不同的移調器。將待移調訊號遞送至分別具有移調級T=2、3、…、Tmax 的個別移調器201-2、201-3、…、201-Tmax 庫。典型地,移調級Tmax =3滿足多數的音訊編碼應用。在加總單元202中將不同移調器201-2、201-3、…201-Tmax 的作用加總,以產生該組合移調器輸出。在第一實施例中,該加總操作可能包含個別作用的相加。在另一實施例中,該等作用以不同權重加權,使得將多個作用加至特定頻率的影響減緩。例如,該第三級作用可能被加入以比第二級更低的增益。最後,加總單元202可能依據該輸出頻率選擇性地加入該等作用。例如,該第二級移調可能用於第一低目標頻率範圍,且該第三級移調可能用於第二高目標頻率範圍。
圖3描繪頻域(FD)諧波移調器的操作,諸如諧波移調器201之該等個別區塊之一,亦即,移調級T的移調器201-T之一的操作。分析濾波器庫301輸出提送至非線性處理單元302的複次頻帶,該非線性處理單元302根據所選擇的移調級T修改該次頻帶訊號的相位及/或振幅。將已修改次頻帶提供至輸出該已移調時域訊號的合成濾波器庫303。在諸如圖2所示的移調級不同之多重平行移調器的情形中,部分的濾波器庫操作可能在不同移調器201-2、201-3、…、201-Tmax 之間共享。濾波器庫操作的共享可能針對分析或合成而完成。在共享合成濾波器庫303的情形中,加總單元202可在次頻帶域中執行,亦即,在合成濾波器庫303之前執行。
圖4除了直接處理單元401以外,還描繪交叉項處理402的操作。交叉項處理402及直接處理單元401係在圖3之頻域諧波移調器的非線性處理區塊302內並聯地執行。將已移調輸出訊號組合,例如,相加,以提供結合的已移調訊號。已移調輸出訊號的此組合可能由該等已移調輸出訊號的疊加所組成。選擇性地,交叉項的選擇性相加可能在增益計算中執行。
圖5更詳細地描繪在圖3之頻域諧波移調器內,圖4的直接處理區塊401的操作。單輸入單輸出(SISO)單元401-1、…、401-n、…、401-N將由來源範圍之各個分析次頻帶映射至目標範圍中的一合成次頻帶。根據圖5,索引n之分析次頻帶係藉由SISO單元401-n映射至相同索引n的合成次頻帶。應注意在該合成濾波器庫中具有索引n之次頻帶的頻率範圍可能依據諧波移調之確切版本或種類而改變。在圖5描繪之該版本或種類中,分析庫301的頻率間距係小於合成庫303之因數的因數T。因此,在合成庫303中之索引n對應於在分析庫301中具有相同索引n的次頻帶頻率之T倍高的頻率。藉由例示方式,將分析次頻帶[(n-1)ω,nω]移調至合成次頻帶[(n-1)Tω,nTω]。
圖6描繪含括在SISO單元401-n各者中之單次頻帶的直接非線性處理。區塊601的非線性實施複次頻帶訊號之相位與等於該移調級T的因數的乘積。選擇增益單元602修改該相位修改次頻帶訊號的振幅。從數學角度,可將該SISO單元401-n的輸出y寫為如下之至該SISO系統401-n之輸入x及增益參數g的函數:
y =gv T ,其中v =x /|x |1-1/ T  (1)
此也可能寫成:
以文字表達,複次頻帶訊號x的相位被乘以移調級T且複次頻帶訊號x之振幅被乘以增益參數g。
圖7描繪用於諧波移調級T之交叉項處理402的元件。具有T-1個並聯之交叉項處理區塊,701-1、…701-r、…、701-(T-1),其輸出在加總單元702中加總以產生組合輸出。如已在介紹段所指出的,目標係將具有頻率(ω,ω+Ω)之正弦曲線對映射至具有頻率(T-r)ω+r(ω+Ω)=Tω+rΩ的正弦曲線,其中該變數r從1改變至T-1。換言之,來自分析濾波器庫301的兩個次頻帶予以映射至該高頻範圍的一次頻帶。針對r之特定值及給定之移調級T,此映射步驟係在交叉項處理區塊701-r中實施。
圖8描繪交叉項處理區塊701-r針對固定值r=1、2、…、T-1的操作。各輸出次頻帶803係在多輸入單輸出(MISO)單元800-n中從兩輸入次頻帶801及802得到。針對索引n之輸出次頻帶803,MISO單元800-n的二輸入係次頻帶n-p1 ,801,及n+p2 ,802,其中p1 及p2 係正整數索引移位,這些係取決於移調級T、變數r、以及交叉乘積加強音調參數Ω。該分析及合成次頻帶編號轉換係與圖5中的編號轉換保持一致,亦即,分析庫301之頻率中的間距係比合成庫303中之因數更小的因數T,且因此上述就因數T之變化的解釋仍維持相關。
關於交叉項處理的使用,應考慮下列評述。音調參數Ω不必以高精確度知道,且肯定不具有比藉由分析濾波器庫301得到之頻率解析度更好的頻率解析度。事實上,在本發明之部分實施例中,其中之交叉乘積加強音調參數Ω完全未進入該解碼器中。替代地,所選擇之整數索引移位(p1 ,p2 )對係藉由遵守最佳標準而選自可能之候選列,諸如交叉乘積輸出振幅的最大化,亦即,該交叉乘積輸出之能量的最大化。藉由例示方式,對於T及r之給定值,可使用藉由方程式(p1 ,p2 )=(rl ,(T-r)l ),l L所給定的候選列,其中L係正整數列。此在以下之方程式(11)的上下文中更詳細地顯示。所有正整數原則上均可以作為候選者。在部分情形中,音調資訊可能有助於指明選擇哪一l 作為適當的索引移位。
此外,雖然描繪於圖8中的該範例交叉項處理建議所施用的索引移位(p1 ,p2 )係與用於特定範圍之例如,合成次頻帶(n-1)的輸出次頻帶的索引移位相同,但不必然n及(n+1)係自具有固定距離p1 +p2 之分析次頻帶構成。事實上,索引移位(p1 ,p2 )可能針對各個及每個輸出次頻帶而有所不同。此意謂著針對各次頻帶n,可選擇該交叉乘積加強音調參數的不同值Ω。
圖9描繪含括在各個MISO單元800-n中的該非線性處理。乘積操作901產生具有與該二複輸入次頻帶訊號之相位的加權和相等之相位及與該二輸入次頻帶樣本之振幅的一般化均值相等之振幅的次頻帶訊號。選擇增益單元902修改該等相位修改次頻帶樣本的振幅。從數學角度,可將該輸出y寫為如下之至MISO單元800-n之輸入u1 801及u2 802及該增益參數g的函數,
此也可能寫成:
其中μ(|u1 |,|u2 |)係振幅產生函數。以文字表達,複次頻帶訊號u1 的相位被乘以移調級T-r且複次頻帶訊號u2 之相位被乘以移調級r。將此等二相位之和使用為其振幅係藉由該振幅產生函數而得到的輸出y之相位。相較於方程式(2),將該振幅產生函數表示為藉由該增益參數g修改之振幅的幾何平均,亦即,μ(|u 1 |,|u 2 |)=g ‧|u 1 |1- r / T |u 2 | r / T 。藉由容許該增益參數相依於該等輸入,此當然涵蓋所有可能性。
應注意方程式(2)係從其中目標造成,其中具有頻率(ω,ω+Ω)的正弦曲線對予以被映射至具有頻率Tω+rΩ之正弦曲線,其也可寫為(T-r)ω+r(ω+Ω)。
在下文中,將略述本發明之數學描述。為了簡化,考慮時間連續的訊號。假設合成濾波器庫303從具有實數值對稱窗函數之對應複調變分析濾波器庫301或原型濾波器w(t)達成完美的重構。該合成濾波器庫通常會但不總是在該合成程序中使用相同之窗。假設該調變係偶數堆疊型,將該步幅正規化為一並將該等合成次頻帶的角頻率間距正規化為π。因此,若至該合成濾波器庫的該等輸入次頻帶訊號係由合成次頻帶訊號yn (k)所給定,
目標訊號s(t)將在該合成濾波器庫的輸出實現。
須注意方程式(3)係複調變次頻帶分析濾波器庫中的平常運算之正規化連續時間數學模式,諸如,窗化離散傅立葉轉換(DFT),也表示為短時間傅立葉轉換(STFT)。稍微修改方程式(3)之複指數的引數,得到用於複調變(虛擬)正交鏡相濾波器(QMF)及複雜修改離散餘弦轉換(CMDCT)的連續時間模型,也表示為窗化奇數堆疊窗化DFT。該次頻帶索引n對該連線時間情形耗盡所有非負整數。針對該離散時間體,該時間變數t係在1/N步驟取樣,且該次頻帶索引n係由N所限制,其中N係該濾波器庫中的次頻帶數字,其等於該濾波器庫的離散時間步幅。在該離散時間情形中,若與N相關之正規化因數未合併入該窗的縮放中,其在該轉換操作中也係必要的。
對於實數值訊號,有與用於該選擇濾波器庫模型中之實數值取樣輸入一樣多之複次頻帶取樣輸出。因此,具有因數為二之總過取樣(或冗餘)。也可使用具有較高過取樣的濾波器庫,但為了說明之明晰性,本實施例的描述維持小的過取樣。
在對應於方程式(3)之該調變濾波器庫分析中涉及的主要步驟係將該訊號乘以中心在時間t=k周圍之窗,且所產生的窗化訊號與各個該等複正弦曲線exp[-inπ(t-k)]相關。在離散時間實作中,此相關係經由快速傅立葉轉換而有效率地實作。用於該合成濾波器庫的對應演算步驟為熟悉本發明之人士所熟知,並由合成調變、合成窗化、及重疊相加操作所組成。
圖19描繪與次頻帶樣本yn (k)所運載的資訊對應之在時間及頻率中的該位置,該資訊係用於時間索引k及次頻帶索引n之值的選擇。作為範例之次頻帶樣本y5 (4)係由暗色矩形1901所表示。
對於正弦曲線,s(t)=Acos(ωt+θ)=Re{Cexp(iωt)},方程式(3)的次頻帶訊號係以良好近似而具有足夠大的n,該良好近似係由以下方程式所給定
其中該上標表示傅立葉轉換,亦即,係窗函數w的傅立葉轉換。嚴格地說,方程式(4)僅在加上以-ω取代ω之項時方為真。基於該窗的頻率響應夠快地衰減以及ω及n之和不接近零之假設,該項被受忽視。
圖20描畫窗w,2001及其傅立葉轉換,2002之典型外觀。
圖21描繪對應於方程式(4)之單正弦曲線的分析。主要受頻率為ω之正弦曲線影響的該等次頻帶係具有使得nπ-ω甚小之索引n的次頻帶。針對圖21之範例,該頻率係如該水平虛線2101所標示之ω=6.25π。在該情形中,由參考符號2102、2103、2104代表的n=5、6、7之三個次頻帶分別包含重要的非零次頻帶訊號。此等三個次頻帶的陰影濃淡反映在從方程式(4)得到的各次頻帶內側之該複正弦曲線的相對振幅。越暗的濃淡意謂越高的振幅。在具體範例中,此意謂著次頻帶5,亦即,2102之振幅,較次頻帶7,亦即,2104之振幅低,次頻帶7之振幅再低於次頻帶6,亦即,2103的振幅。重要的係須注意數個非零次頻帶可能通常需要能在該合成濾波器庫的輸出合成在頻率中具有相對短時間週期及顯著側葉之高品質正弦曲線,特別係在該窗具有圖20之窗2001之外觀的情形中。
也可將合成次頻帶訊號yn (k)確定為分析濾波器庫301及該非線性處理的結果,亦即,描繪於圖3的諧波移調器302。在該分析濾波器庫側,可能將該分析次頻帶訊號xn (k)表示為來源訊號z(t)的函數。針對移調級T,將具有窗wT (t)=w(t/T)/T、步幅一、以及調變步驟步進之複調變分析濾波器庫施用至來源訊號z(t),該調變步驟步進比該合成庫之頻率步進更精細T倍。圖22描繪縮放窗wT 2201及其傅立葉轉換2202的外觀。相較於圖20,將時間窗2201伸長而將頻率窗2202壓縮。
藉由該修改濾波器庫的分析使分析次頻帶訊號xn (k)昇高:
針對正弦曲線,z (t )=B cos(ξt +φ)=Re{D exp(i ξt )},發現方程式(5)的次頻帶訊號針對足夠大的n具有由以下方程式所給定的良好近似
因此,將此等次頻帶訊號提送至諧波移調器302並將直接移調規則(1)施用至(6)產生
由方程式(4)給定之合成次頻帶訊號yn (k)理想上應與經由方程式(7)給定之諧波移調(k)所得到的非線性次頻帶訊號匹配。
針對奇數移調級T,包含方程式(7)之該窗的影響之因數等於一,因為該窗的傅立葉轉換假設為實數值的,且T-1係偶數。因此,當ω=Tξ時,方程式(7)可針對所有次頻帶與方程式(4)確切地匹配,使得具有根據方程式(7)之輸入次頻帶訊號的該合成濾波器庫之輸出係具有頻率ω=Tξ、振幅A=gB、以及相位θ=Tφ的正弦曲線,其中B及φ係確定自方程式:D=Bexp(iφ),其在***後產生。因此,得到該正弦曲線來源訊號z(t)的T級諧波移調。
針對偶數之T,此匹配更近似,但仍保持在該窗頻率響應的正值部,其對於對稱實數值窗包括該最重要主葉。此意謂著也對於偶數值T,得到該正弦曲線來源訊號z(t)的諧波移調。在高斯窗的特定情形中,始終為正且因此,在移調之偶數及奇數級的效能中沒有不同。
相似於方程式(6),具有頻率ξ+Ω之正弦曲線,亦即,該正弦曲線來源訊號z (t )=B' cos((ζ+Ω)t' )=Re{E exp(i (ζ+Ω)t )},的分析係
因此,傳送對應於圖8中的訊號801之該二次頻帶訊號u1 =(k )及對應於圖8中的訊號802之u2 =(k )之至描繪於圖8中的交叉乘積處理800-n並用該交叉乘積方程式(2)產生該輸出次頻帶訊號803
其中
從方程式(9),可看出MISO系統800-n之輸出次頻帶訊號803的相位演變跟隨頻率Tξ+rΩ的正弦曲線之分析的相位演變。此保持與索引移位p1 及p2 的選擇無關。實際上,若將次頻帶訊號(9)提供至對應於頻率Tξ+rΩ的次頻帶頻道n,亦即,若nπTξ+rΩ,則該輸出將係對頻率為Tξ+rΩ之正弦曲線產生作出貢獻。然而,較佳確保各個貢獻顯著且該等貢獻以有利地方式加總。此等實施樣態將於下文討論。
給定一交叉乘積加強音調參數Ω,可導出索引移位p1 及p2 的合適選擇,可使方程式(10)之複振幅M(n,ξ)針對次頻帶n之範圍近似(nπ-(Tξ+rΩ)),其中該最終輸出將近似頻率Tξ+rΩ的正弦曲線。主葉上的首要考量使所有三個值(n-p1 )π-Tξ、(n+p2 )π-T(ξ+Ω)、nπ-(Tξ+rΩ)同時變小,其該近似等式
此意謂著當已知該交叉乘積加強音調參數Ω時,該索引移位可能藉由方程式(11)加以近似,因此容許該等分析次頻帶之簡單選擇。針對窗函數w(t)之重要特殊情形,諸如高斯窗及正弦窗,可實施根據方程式(11)之索引移位p1 及p2 的選擇對根據方程式(10)之參數M(n,ζ)的振幅之影響的更深入分析。可發現對(nπ-(Tξ+rΩ))的期望近似對於具有nπTξ+rΩ之數個次頻帶係非常好的。
應注意將關係式(11)校正成分析濾波器庫301具有π/T之角頻率次頻帶間距的例示狀況。在該常見情形中,關係式(11)所產生的解釋係該交叉項來源跨距p1 +p2 係以該分析濾波器庫次頻帶間距為單位量測之近似內藏基本頻率Ω的整數,以及將該對(p1 ,p2 )選擇為(r,T-r)的倍數。
對於在解碼器中之索引移位對(p1 ,p2 )的決定,可以使用以下模式:
1.Ω的值可能在該編碼程序中導出並以足夠地精確度明確地轉移至該解碼器,以藉由合適的捨入程序導出p1 及p2 的整數值,其可能遵守下列原則
o p1 +p2 近似於Ω/Δω,其中Δω係該分析濾波器庫的角頻率間距;且
o 將p1 /p2 選擇成近似r/(T-r)。
2.針對各目標次頻帶樣本,索引移位對(p1 ,p2 )可能在該解碼器中從預定候選值列,諸如(p1 ,p2 )=(rl ,(T-r)l ),l L,r{1,2,…,T-1}中導出,其中L係正整數列。該選擇可能基於交叉項輸出振幅的最佳化,亦即,該交叉項輸出能量的最大化。
3.針對各目標次頻帶取樣,該索引移位對(p1 ,p2 )可藉由交叉項輸出振幅的最佳化從已縮減之候選值列中導出,其中該已縮減之候選值列係在該編碼程序中導出並傳送至該解碼器。
應注意次頻帶訊號u1 及u2 的相位修改分別以加權(T-r)及r實施,但該次頻帶索引距離p1 及p2 係分別與r及(T-r)成比例地選擇。因此,與合成次頻帶n最接近的次頻帶接收最強的相位修改。
用於上文略述之模式2及3的最佳化程序之有利方法可考慮該最大-最小最佳化:
且使用獲勝對以及其對應值r以對給定之目標次頻帶索引n建構交叉乘積貢獻。在該解碼器搜尋導向模式2及部分地模式3中,不同值r之交叉項的加入係獨立地完成為佳,因為可能有將內容加至相同次頻帶數次的風險。另一方面,若將基本頻率Ω如在模式1中係用於選擇該等次頻帶,或者,若可能如同在模式2中的該情形僅容許窄範圍之次頻帶索引距離,則將內容加至相同次頻帶數次的特定問題可以加以避免。
此外,也應注意針對上文略述之交叉項處理方案的該等實施例,該交叉乘積增益g的額外解碼器修改可能係有利的。例如,參考輸入至由方程式(2)給定之該交叉乘積MISO單元的輸入次頻帶訊號u1 、u2 以及輸入至由方程式(1)給定之該移調SISO單元的該輸入次頻帶訊號x。若所有三個訊號被提供至如圖4所示之相同的輸出合成次頻帶,其中該直接處理單元401及交叉項處理402提供用於該相同輸出合成次頻帶的元件,若針對預界定臨界q>1,
min(|u 1 |,|u 2 |)<q |x |, (13)
可能期望將該交叉乘積增益g,亦即,圖9之增益單元902設定為零。換言之,該交叉乘積相加僅在該直接項輸入次頻帶振幅|x|比該等交叉乘積輸入項二者小時實施。在此本文中,x係用於該直接項處理之分析次頻帶樣本,該直接項處理導致在相同合成次頻帶之輸出如同在硏究中的該交叉乘積。此可能係預防措施以不更行加強已由該直接移調所裝飾的諧波成份。
在下文中,本說明書中略述之該諧波移調法將針對列示範頻譜組態描述,以說明優於先前技術的加強。圖10描繪直接諧波移調級T=2的效果。上方圖1001藉由定位在基本頻率Ω之倍數的垂直箭號描畫原始訊號的部分頻率成份。其描繪,例如,在編碼器側的該原始訊號。將圖1001分段為具有部分頻率Ω、2Ω、3Ω、4Ω、5Ω之左側來源頻率範圍以及具有部分頻率6Ω、7Ω、8Ω的右側目標頻率範圍。該來源頻率範圍典型地將被編碼並傳輸至該解碼器。另一方面,該右側目標頻率範圍典型地將不傳輸至該解碼器,該右側目標頻率範圍包含在該HFR法之交越頻率1005之上的部分頻率6Ω、7Ω、8Ω。該諧波移調法的目標係從該來源頻率範圍重構高於該來源訊號之交越頻率1005的目標頻率範圍。所以,該目標頻率範圍及圖1001中之該等部分頻率6Ω、7Ω、8Ω顯然地不可使用為至該移調器的輸入。
如上文所略述的,該諧波移調法的目的係從該來源頻率範圍中之可用頻率成份重生該來源訊號的訊號成份6Ω、7Ω、8Ω。下方圖1002顯示該移調器在右側目標頻率範圍中的輸出。此種移調器可能,例如,置於該解碼器側。在頻率6Ω及8Ω的該部分頻率係藉由使用移調級T=2之諧波移調從在頻率3Ω及4Ω的該等部分頻率重生。由點虛線箭號1003及1004於此處描畫作為該諧波移調之頻譜伸展效果的結果,在7Ω的該目標部分頻率遺失。在7Ω的此目標部分頻率不能使用以下的先前諧波移調法產生。
圖11描繪用於週期訊號之諧波移調的本發明在第二級諧波移調器係藉由單交叉項而加強之情形中(亦即,T=2且r=1)的效果。如圖10之上下文所略述的,將移調器用於從低於圖1101之交越頻率1105的來源頻率範圍中之該等部分頻率Ω、2Ω、3Ω、4Ω、5Ω產生高於下方圖1102之交越頻率1105的目標頻率範圍中之部分頻率6Ω、7Ω、8Ω。除了圖10之先前技術移調器的輸出外,在7Ω的該部分頻率成份係從在3Ω及4Ω之來源部分頻率的組合重生。該交叉乘積相加的效果係由虛線箭號1103及1104所描畫。從方程式的角度,具有ω=3Ω且因此(T-r)ω+r(ω+Ω)=Tω+rΩ=6Ω+Ω=7Ω。如從此範例所看到的,所有該等目標部分頻率可能使用在本說明書所略述之本發明的HFR法重生。
圖12描繪先前技術之第二級諧波移調器在用於圖10的頻譜組態之調變濾波器庫中的可能實作。該分析濾波器庫次頻帶的風格化頻率響應係由點線所顯示,例如,在上圖1201中的參考符號1206。該等次頻帶係以次頻帶索引列舉,其中,該等索引5、10、及15係由圖12所示。針對該給定範例,基本頻率Ω等於該分析次頻帶頻率間距的3.5倍。此係由圖1201中之該部分頻率Ω係位於具有次頻帶索引3及4的該二次頻帶之間的事實所說明。部分頻率2Ω係定位在具有次頻帶索引7之該次頻帶的中央並依此類推。
下圖1202顯示被重疊有所選擇合成濾波器庫次頻帶的風格化頻率響應(例如,參考符號1207)之重生部分頻率6Ω及8Ω。如先前所描述的,此等次頻帶具有T=2倍之較粗的頻率間距。因此,該等頻率響應也為該因數T=2所縮放。如上文所略述的,先前技術的直接項處理法以因數T=2修改各分析次頻帶的相位,亦即,低於圖1201的交越頻率1205之各次頻帶的相位,並將該結果映射入具有相同索引的該合成次頻帶,亦即,高於圖1202之交越頻率1205的次頻帶。此在圖12係藉由對角點虛線箭號象徵,例如,用於分析次頻帶1206及合成次頻帶1207的箭號1208。針對來自分析次頻帶1201之具有次頻帶索引9至16的次頻帶之此直接項處理的結果係在合成次頻帶1202中在頻率6Ω及8Ω之該二目標部分頻率從在頻率3Ω及4Ω之來源部分頻率的重生。如可從圖12看出,目標部分頻率6Ω的主要作用係來自具有次頻帶索引10及11的該等次頻帶,亦即,參考符號1209及1210,且目標部分頻率8Ω的主要作用係來自具有次頻帶索引14的該次頻帶,亦即,參考符號1211。
圖13描繪額外交叉項處理步驟在圖12之調變濾波器庫中的可能實作。該交叉項處理步驟對應於與圖11相關之針對具有基本頻率Ω的週期訊號所描述之步驟。上圖1301描繪該等分析次頻帶,其來源頻率範圍待移調至下圖1302之合成次頻帶的目標頻率範圍中。考慮圍繞部分頻率7Ω之合成次頻帶1315及1316係從該等分析次頻帶產生之特殊情形。針對移調級T=2,可能選擇可能值r=1。將候選值(p1 ,p2 )列選擇為(r,T-r)=(1,1)的倍數,使得p1 +p2 近似,亦即,以該合成次頻帶頻率間距為單位之基本頻率Ω,導致該選擇p1 =p2 =2。如圖8之上下文所略述的,具有次頻帶索引n之合成次頻帶可從具有該次頻帶索引(n-p1 )及(n+p2 )之該等分析次頻帶的交叉項乘積產生。因此,針對具有次頻帶索引12的該合成次頻帶,亦即,參考符號1315,交叉乘積係從具有次頻帶索引(n-p1 )=12-2=10,亦即,參考符號1311,以及(n+p2 )=12+2=14,亦即,參考符號1313的該等分析次頻帶形成。針對具有次頻帶索引13的該合成次頻帶,交叉乘積係從具有索引(n-p1 )=13-2=11,亦即,參考符號1312,及(n+p2 )=13+2=15,亦即,參考符號1314之合成次頻帶形成。交叉項乘積產生的此程序係以該對角虛/點虛線箭號對象徵,亦即,分別藉由參考符號對1308、1309、及1306、1307。
如可從圖13看出,該部分頻率7Ω主要地置於具有索引12的次頻帶1315內並僅次要地在具有索引13的次頻帶1316內。所以,針對更現實之濾波器響應,比具有索引13之合成次頻帶1316周圍的項,其有利地加入高品質正弦曲線在頻率(T-r)ω+r(ω+Ω)=Tω+rΩ=6Ω+Ω=7Ω的合成之具有索引12的合成次頻帶1315之周圍將具有更多直接及/或交叉項。此外,如方程式(13)之上下文所強調的,具有p1 =p2 =2之所有交叉項的盲目加總可導致較不週期之非期望訊號成份及理論輸入訊號。所以,非期望訊號成份的此現象可能需要合適的交叉乘積取消規則,諸如,由方程式(13)所給定的該規則。
圖14描繪先前技術之諧波移調級T=3的效果。上方圖1401藉由定位在基本頻率Ω之倍數的垂直箭號描畫原始訊號的部分頻率成份。該等部分頻率6Ω、7Ω、8Ω、9Ω係在高於該HFR法之交越頻率1405的目標頻率中,且因此不能使用為該移調器的輸入。該諧波移調器的目的係從該來源範圍中的該訊號重生此等訊號成份。下方圖1402顯示該移調器在目標頻率範圍中的輸出。在頻率6Ω及9Ω的該等部分頻率,亦即,參考符號1407及參考符號1410,已從在頻率2Ω及3Ω的該等部分頻率產生,亦即,參考符號1406及參考符號1409。分別由點虛線箭號1408及1411於此處描畫作為該諧波移調之頻譜伸展效果的結果,在7Ω及8Ω的該目標部分頻率遺失。
圖15描繪用於週期訊號之諧波移調的本發明在第三級諧波移調器係藉由加入二不同交叉項而加強之情形中(亦即,T=3且r=1,2)的效果。除了圖14之先前技術移調器的輸出外,在7Ω的該部分頻率成份1508係藉由r=1之交叉項從在2Ω及3Ω之來源部分頻率1506及1507的組合重生。該交叉乘積相加的效果係由虛線箭號1510及1511所描畫。從方程式的角度,具有ω=2Ω,(T-r)ω+r(ω+Ω)=Tω+rΩ=6Ω+Ω=7Ω。相似地,在8Ω之該部分頻率成份1509係藉由r=2之交叉項重生。下方圖1502之目標範圍中的此部分頻率成份1509係從在上方圖1501之來源頻率範圍中之在2Ω及在3Ω的部分頻率成份1506及1507產生。該交叉乘積相加的產生係由箭號1512及1513所描畫。從方程式的角度,具有(T-r)ω+r(ω+Ω)=Tω+rΩ=6Ω+2Ω=8Ω。如所看到的,所有該等目標部分頻率可能使用本說明書描述之本發明的HFR法重生。
圖16描繪先前技術之第三級諧波移調器在用於圖14的頻譜情況之調變濾波器庫中的可能實作。該合成濾波器庫次頻帶的風格化頻率響應係藉由上方圖1601的點虛線所顯示。該等次頻帶係藉由1至17之該等次頻帶索引所列舉,具有索引7之次頻帶1606、具有索引10的次頻帶1607、以及具有索引11的次頻帶1608係以模範方式參考。針對該給定範例,基本頻率Ω等於該分析次頻帶頻率間距Δω的3.5倍。下方圖1602顯示與所選擇之合成濾波器庫次頻帶的風格化頻率響應重疊之重生部分頻率。藉由例示方式,參考具有次頻帶索引7的次頻帶1609、具有次頻帶索引10的次頻帶1610、具有次頻帶索引11的次頻帶1611。如上文所描述的,此等次頻帶具有T=3倍之較粗略的頻率間距Δω。所以,該等頻率響應也因此縮放。
先前技術的直接項處理針對各分析次頻帶以因數T=3修改該等次頻帶訊號的相位,並將該結果映射至具有相同索引的該合成次頻帶中,如該對角點虛線箭號所象徵的。用於分析次頻帶6至11之此直接項處理的結果係該二目標部分頻率6Ω及9Ω從在頻率2Ω及3Ω之來源部分頻率重生。如可從圖16看出的,目標部分頻率6Ω的主要作用係來自具有索引7的次頻帶,亦即,參考符號1606,且目標部分頻率9Ω的主要作用係分別來自具有索引10及11的次頻帶,亦即,參考符號1607及1608。
圖17描繪額外交叉項處理步驟在圖16之調變濾波器庫中針對r=1的可能實作,其導致在7Ω之部分頻率的重生。如圖8之上下文所略述的,可能將該索引移位(p1 ,p2 )選擇為(r,T-r)=(1,2)的倍數,使得p1 +p2 近似3.5,亦即,以該合成次頻帶頻率間距Δω為單位的基本頻率Ω。換言之,作用至待產生之該合成次頻帶之該二分析次頻帶之間的該相對距離,亦即,在由該分析次頻帶頻率間距Δω所分割之在該頻率軸上的距離,應最佳近似於該相對基本頻率,亦即,由分析次頻帶頻率間距Δω所分割之基本頻率Ω。此也由方程式(11)所表示並導致該選擇p1 =1,p2 =2。
如圖17所示,具有索引8的該合成次頻帶,亦即,參考符號1710,係得自從具有索引(n-p1 )=8-1=7,亦即,參考符號1706,以及(n+p2 )=8+2=10,亦即,參考符號1708的該等分析次頻帶所形成的該交叉乘積。針對具有索引9的該合成次頻帶,交叉乘積係從具有索引(n-p1 )=9-1=8,亦即,參考符號1707,及(n+p2 )=9+2=11,亦即,參考符號1709之合成次頻帶形成。形成交叉項的此程序係由該對角虛/點虛線箭號對所象徵,亦即,分別藉由箭號對1712、1713、及1714、1715。可從圖17看出,該部分頻率7Ω比在次頻帶1711中更顯著地定位在次頻帶1710中。所以,預期針對現實之濾波器響應,其有利地加入高品質正弦曲線在頻率(T-r)ω+r(ω+Ω)=Tω+rΩ=6Ω+Ω=7Ω的合成之具有索引8的合成次頻帶,亦即,次頻帶1710,之周圍將具有更多交叉項乘積。
圖18描繪額外交叉項處理步驟在圖16之調變濾波器庫中針對r=2的可能實作,其導致在8Ω之部分頻率的重生。可能將該索引移位(p1 ,p2 )選擇為(r,T-r)=(1,2)的倍數,使得p1 +p2 近似3.5,亦即,以該合成次頻帶頻率間距Δω為單位之基本頻率Ω。此導致該選擇p1 =2,p2 =1。如圖18所示,具有索引9的該合成次頻帶,亦即,參考符號1810,係得自從具有索引(n-p1 )=9-2=7,亦即,參考符號1806,以及(n+p2 )=9+1=10,亦即,參考符號1808的該等分析次頻帶所形成的該交叉乘積。針對具有索引10的該合成次頻帶,交叉乘積係從具有索引(n-p1 )=10-2=8,亦即,參考符號1807,及(n+p2 )=10+1=11,亦即,參考符號1809之合成次頻帶形成。形成交叉項的此程序係由該對角虛/點虛線箭號對所象徵,亦即,分別藉由箭號對1812、1813、及1814、1815。可從圖18看出該部分頻率8Ω比在次頻帶1811中更稍微顯著地定位在次頻帶1810中。所以,預期針對現實之濾波器響應,其有利地加入高品質正弦曲線在頻率(T-r)ω+r(ω+Ω)=Tω+rΩ=2Ω+6Ω=8Ω的合成之具有索引9的合成次頻帶,亦即,次頻帶1810,的周圍將具有更多直接及/或交叉項乘積。
在下文中,參考針對索引移位(p1,p2)對及依據T=3之此規則的r描繪該最大-最小最佳化為基之選擇程序(12)的圖23及24。該選擇目標次頻帶索引係n=18且該上方圖針對給定時間索引修飾次頻帶訊號的振幅範例。正整數列係藉由七個值L={2,3,…,8}於此處給定。
圖23描繪針對具有r=1之候選者的搜尋。將該目標或合成次頻帶顯示成具有索引n=18。點虛線2301強調在該上分析次頻帶範圍及下合成次頻帶範圍中具有索引n=18之該次頻帶。針對l =2,3,…,8的可能索引移位對分別為(p1 ,p2 )={(2,4),(3,6),…,(8,16)},且該對應的分析次頻帶振幅樣本索引對,亦即,考慮用於確定最佳交叉項的次頻帶索引對列,係{(16,22),(15,24),…,(10,34)}。該等箭號群組描繪在考慮中的該等對。將由參考符號2302及2303所代表的該對(15,24)作為範例顯示。估算此等振幅對的最小者以針對交叉項的可能列提供個別最小振幅列(0,4,1,0,0,0,0)。因為l =3的該第二項目係最大的,該對(15,24)勝過具有r=1的候選者,且此選擇係藉由該粗箭號描畫。
圖24相似地描繪針對具有r=2之候選者的搜尋。將該目標或合成次頻帶顯示成具有索引n=18。點虛線2401強調在該上分析次頻帶範圍及下合成次頻帶範圍中具有索引n=18之該次頻帶。在此情形中,可能的索引移位對係(p1 ,p2 )={(4,2),(6,3),…,(16,8)}且對應的分析次頻帶振幅樣本索引對係{(14,20),(12,21),…,(2,26)},其之該對(6,24)係以參考符號2402及2403表示。估算此等振幅對的最小者提供該群組(0,0,0,0,3,1,0)。因為該第五項目係最大的,亦即,l =6,該對(6,24)勝過具有r=2的候選者,如藉由該粗箭號所描畫的。總體上,因為該對應振幅對的最小者小於r=1之選擇次頻帶對的最小者,目標次頻帶索引n=18的最終選擇落在(15,24)對及r=1。
應更注意的係當輸入訊號z(t)係具有基本頻率Ω的諧波序列,亦即,具有對應於交叉乘積加強音調參數的基本頻率,且Ω相較於分析濾波器庫的頻率解析度夠大時,由方程式(6)給定的分析次頻帶訊號xn (k)及由方程式(8)給定的x'n (k)係輸入訊號z(t)之分析的良好近似,其中該近似在不同次頻帶區域係有效的。其追隨沿著輸入訊號z(t)之頻率軸的諧波相位估算將藉由本發明而正確地外推之方程式(6)及(8-10)的比較。此特別針對純脈衝串而保持。脈衝串類特徵的訊號對該輸出音訊品質有誘人特性,例如由人聲及部分樂器所產生的該等訊號。
圖25、26、及27描繪在T=3的情形中本發明移調針對諧波訊號之模範實作的效能。該訊號具有基本頻率282.35Hz且將其在10至15kHz之考慮目標範圍中的振幅頻譜描畫於圖25中。N=512個次頻帶之濾波器庫係在48kHz的取樣頻率使用以實作該移調。第三級直接移調器(T=3)之輸出的振幅頻譜係描畫在圖26中。如可看出的,每個第三諧波係以上文略述之該理論所預測的高精確性再生,且該已察覺音調將係847Hz,為原始音調的三倍。圖27顯示施用交叉項乘積之移調器的輸出。所有諧波已由於該理論的近似實施樣態而重新產生瑕疵。針對此情形,該等側葉低於該訊號位準約40dB,且比高頻率內容的重生所需要的更多,該高頻率內容在知覺上無法與該原始諧波訊號區別。
在下文中,將參考用於統一語音及音訊編碼(USAC)之分別描繪模範編碼器2800及模範解碼器2900的圖28及29。USAC編碼器2800及解碼器2900的通用結構描述如下:首先,可能具有由MPEG環繞(MPEGS)功能單元所組成的共同預/後處理,以掌管立體音效或多頻道處理,及個別的加強SBR(eSBR)單元2801及2901,彼等在輸入訊號中掌管較高音訊頻率的參數表示並可能使用在本說明書中略述的該諧波移調法。然後有二通路,由修改先進音訊編碼(AAC)工具路徑所組成之一者及由線性預測編碼(LP或LPC域)為基路徑所組成的另一者,彼等特性依序為該LPC剩餘之頻域代表或時域代表。用於AAC及LPC二者之所有傳輸頻譜可能在量化及算術編碼後表示在MDCT域中。該時域代表使用ACELP激發編碼方案。
編碼器2800的加強頻譜帶複製(eSBR)單元2801可能包含本說明書所略述之該高頻重構系統。明確地說,eSBR單元2801可能包含分析濾波器庫301以產生複數個分析次頻帶訊號。然後此分析次頻帶訊號可能在非線性處理單元302中移調以產生複數個合成次頻帶訊號,然後其可能輸入至合成濾波器庫303以產生高頻成份。在eSBR單元2801中,在該編碼側,資訊群組可能確定為如何從低頻成份產生與該原始訊號之高頻成份最匹配的高頻成份。此資訊群組可能包含訊號特徵上的資訊,諸如該高頻成份之頻譜波封上的顯著基本頻率Ω,且其可能包含如何最佳地組合分析次頻帶訊號的資訊,亦即,諸如索引移位(p1 ,p2 )對的有限群組之資訊。與該資訊群組相關的編碼資料在位元串流多工器中合併其他編碼資訊並作為編碼音訊串流前傳至對應解碼器2900。
顯示於圖29中的解碼器2900也包含加強頻譜複製(eSBR)單元2901。此eSBR單元2901從編碼器2800接收編碼音訊位元串流或編碼訊號,並使用本說明書中略述之該等方法產生該訊號的高頻成份,其與已解碼低頻成份合併以產生已解碼訊號。eSBR單元2901可能包含本說明書略述之該等不同組件。明確地說,可能包含分析濾波器庫301、非線性處理單元302、以及合成濾波器庫303。eSBR單元2901可能使用由編碼器2800提供之高頻成份上的資訊,以實施該高頻重構。此種資訊可能係該訊號的基本頻率Ω,該原始頻率成份的頻譜波封及/或待使用之該等分析次頻帶上的資訊,以產生該已解碼訊號的該等合成次頻帶訊號及極高頻成份。
此外,圖28及29描繪USAC編碼器/解碼器的可能額外組件,諸如:
‧位元串流負載解多工器器具,其將該位元串流負載分割為用於各器具的部分,並將與該器具相關之該位元串流資訊提供給該等器具各者;
‧縮放因數無雜訊解碼器具,其取用來自該位元串流負載解多工器的資訊,解析該資訊,並解碼該霍夫曼及I)PCM編碼縮放因數;
‧頻譜無雜訊解碼器具,其取用來自該位元串流負載解多工器的資訊,解析該資訊,解碼該算術編碼資料,並重構該量化頻譜;
‧反量化器器具,其取用該頻譜的量化值,為轉換該等整數值至該未縮放重構頻譜;此量化器係伸縮量化器為佳,其伸縮因數取決於所選擇的核心編碼模式;
‧雜訊填充器具,其用於填充該解碼頻譜中的頻譜間隙,其在頻譜值量化為零時發生,例如,由於對該編碼器中的位元需求的強烈限制;
‧重縮放器具,其將該縮放因數的整數表示轉換為實際值,並將該非縮收反向量化頻譜乘以相關縮放因數;
‧M/S器具,如ISO/IEC 14496-3中所描述的;
‧暫時雜訊定形(TNS)器具,如ISO/IEC 14496-3中所描述的;
‧濾波器庫/區塊切換器具,其施用在該編碼器中實施之該頻率映射的反向;將反向修改離散餘弦轉換(IMDCT)用於該濾波器庫器具為佳;
‧時間變形濾波器庫/區塊切換器具,當該時間變形模式致能時,其取代正常的濾波器庫/區塊切換器具;該濾波器庫與正常之濾波器庫相同(IMDCT)為佳,此外藉由時間變化重取樣將該等窗化時域樣本從該變形時域映射至該線性時域;
‧MPEG環繞(MPEGS)器具,其藉由將精密的上混程序施用至由合適的空間參數所控制的輸入訊號,以從一或多個輸入訊號產生多個訊號;在該USAC狀況中,藉由傳輸沿著傳輸下混訊號側邊的參數側資訊,將MPEGS用於編碼多頻道訊號為佳;
‧訊號分類器器具,其分析該原始輸入訊號並從其產生觸發不同編碼模式之選擇的控制訊號;該輸入訊號的分析典型地係實作相關的並將嘗試針對給定輸入訊號框選擇最佳核心編碼模式;該訊號分類器的輸出也可能選擇性地用於影響其他器具的行為,例如,MPEG環繞、加強SBR、時間變形濾波器庫及其他器具;
‧LPC濾波器器具,其經由線性預測合成濾波器藉由濾波重構激發訊號以從激發域訊號產生時域訊號;以及
‧ACELP器具,其藉由組合長期預測器(適應字碼)及類脈衝序列(創新字碼),提供有效地代表時域激發訊號的方式。
圖30描繪在圖28及29中顯示之eSBR單元的實施例。eSBR單元3000將以解碼器為背景在下文中描述,其中至eSBR單元3000的輸入係訊號之低頻成份,也為人所知為低頻帶,及與特定訊號特徵相關的可能額外資訊,例如基本頻率Ω及/或可能的索引移位值(p1 ,p2 )。在該編碼器側,至該eSBR單元的輸入典型地將係完整訊號,然而該輸出將係與該等訊號特徵及/或索引移位值相關的額外資訊。
在圖30中,將低頻成份3013供應至QMF濾波器庫,以產生QMF頻率帶。此等QMF頻率帶未與此說明書略述的分析次頻帶誤認。該QMF頻率庫係用於在頻域中操作及合併該訊號之低及高頻成份的目的,而非在時域中。將低頻成份3014供應至與本說明書略述之用於高頻重構的該系統對應之移調單元3004。移調單元3004也可能接收額外資訊3011,諸如編碼訊號的基本頻率Ω及/或用於次頻帶選擇的可能索引移位(p1 ,p2 )對。移調單元3004產生該訊號的高頻成份3012,也為人所知為高頻帶,該訊號係藉由QMF濾波器庫3003轉移至頻域。將該QMF轉移低頻成份及該QMF轉移高頻成份二者提供至操作及合併單元3005。單元3005可能實施該高頻成份的波封調整並組合該已調整高頻成份及低頻成份。藉由反向QMF濾波器庫3001將該組合輸出訊號再轉移至時域。
該QMF濾波器庫典型地包含64個QMF頻率帶。然而,應注意降取樣低頻成份3013使得QMF濾波器庫3002僅需要32個QMF頻率帶可能係有利的。在此種情形中,低頻成份3013具有fs /4之頻寬,其中fs 係該訊號的取樣頻率。另一方面,高頻成份3012具有fs /2的頻寬。
描述於本說明書中的該方法及系統可能實作為軟體、軔體、及/或硬體。特定組件可能,例如實作為在數位訊號處理器或微處理器上運作之軟體。其他組件可能,例如實作為硬體及/或特定應用積體電路。在描述之方法及系統中遇到的該等訊號可能儲存在媒體中,諸如隨機存取記憶體或光學儲存媒體。彼等可能經由網路傳輸,諸如無線電網路、衛星網路、無線網路、或有線網路,例如,網際網路。使用本說明書描述之該方法及系統的典型裝置係機上盒或解碼音訊訊號的其他用戶端裝備。在該編碼側,該方法及系統可能使用在廣播站中,例如,在視訊頭端系統中。
本發明略述基於訊號之低頻成份用於實施該訊號之高頻重構的方法及系統。藉由使用來自低頻成份之次頻帶的組合,該方法及系統容許可能不藉由本技術之已為人所知的移調方法所產生之頻率及頻率帶的重構。此外,所描述的HTR法及系統容許低交越頻率的使用及/或大高頻帶從窄低頻帶產生。
101...核心解碼器
102、3004...移調單元
103...波封調整器
104...昇取樣器
201...諧波移調器
202...加總單元
301...分析濾波器庫
302...非線性處理單元
303...合成濾波器庫
401...直接處理單元
401-n...單輸入單輸出單元
402...交叉項處理
601...區塊
602...選擇增益單元
701...交叉項處理區塊
702...次頻帶加總單元
800-n...多輸入單輸出單元
801...第一分析次頻帶訊號
802...第二分析次頻帶訊號
803...合成次頻帶訊號
901...乘積操作
902...增益單元
1001、1002、1101、1102、1201、1202、1301、1302、1401、1402、1501、1502、1601、1602...圖
1003、1004、1408、1411...點虛線箭號
1005、1105、1205、1405...交越頻率
1103、1104、1510、1511...虛線箭號
1206、2301、2401...點虛線
1207...頻率響應
1208、1512、1513、1712、1713、1714、1715、1812、1813、1814、1815...箭號
1209、1210、1211、1606、1607、1608、1609、1610、1611、1710、1711、1811、2102、2103、2104...次頻帶
1306、1307、1308、1309...對角虛/點虛線箭號
1311、1312、1313、1314、1706、1707、1708、1709、1806、1807、1808、1809...分析次頻帶
1315、1316、1810...合成次頻帶
1406、1407、1409、1410...部分頻率
1506、1507...來源部分頻率
1508、1509...部分頻率成份
1901...暗色矩形
2001...分析窗
2002、2202...傅立葉轉換
2101...水平虛線
2201...合成窗
2302、2303、2402、2403...索引移位對
2800...編碼器
2801、2901...
3000...加強SBR單元
2900...解碼器
3001...反向QMF濾波器庫
3002、3003...QMF濾波器庫
3005...操作及合併單元
3011...額外資訊
3012...高頻成份
3013、3014...低頻成份
本發明現在將藉由說明範例而未限制本發明之範圍的方式描述。其將參考該等隨附圖式而描述,其中:
圖1描繪HFR加強音訊解碼器的操作;
圖2描繪使用數級之諧波移調器的操作;
圖3描繪頻域(FD)諧波移調器的操作;
圖4描繪本發明的交叉項處理之使用的操作;
圖5描繪先前技術之直接處理;
圖6描繪先前技術之單次頻帶的直接非線性處理;
圖7描繪本發明之交叉項處理的成份;
圖8描繪交叉項處理區塊的操作;
圖9描繪含括在圖8之該等MISO系統各者中的本發明之非線性處理;
圖10-18描繪本發明對模範週期訊號之諧波移調的效果;
圖19描繪短時間傅立葉轉換(STFT)的時間-頻率解析度;
圖20描繪窗函數的模範時間進程及其使用在合成側的傅立葉轉換;
圖21描繪正弦曲線輸入訊號的STFT;
圖22描繪該窗函數及其使用在該分析側上之根據圖20的傅立葉轉換;
圖23及24描繪針對合成濾波器帶次頻帶之交叉項加強確定合適的分析濾波器庫次頻帶;
圖25、26、及27描繪所描述之直接項及交叉項諧波移調法的實驗結果;
圖28及29分別描繪使用在本說明書中所略述的加強諧波移調方案之編碼器及解碼器的實施例;
圖30描繪在圖28及29中顯示之移調單元的實施例。
701-r...交叉項處理區塊
800-n...多輸入單輸出單元
801...第一分析次頻帶訊號
802...第二分析次頻帶訊號
803...合成次頻帶訊號

Claims (35)

  1. 一種用於從音訊訊號的低頻成份產生該音訊訊號之高頻成份的系統,包含:- 分析濾波器庫(301),提供該訊號之該低頻成份的複數個分析次頻帶訊號;- 非線性處理單元(302),藉由相乘該等複數個分析次頻帶訊號之第一及第二分析次頻帶訊號的相位並藉由組合該等相位相乘分析次頻帶訊號,以產生具有合成頻率之合成次頻帶訊號;以及- 合成濾波器庫(303),用於從該合成次頻帶訊號產生該音訊訊號的該高頻成份,其中該非線性處理單元(302)包含:- 第一及第二移調級的多輸入單輸出單元(800-n),分別從具有第一分析頻率ω及第二分析頻率(ω+Ω)的該第一(801)及該第二(802)分析次頻帶訊號產生該合成次頻帶訊號(803);- 該第一分析次頻帶訊號(801)係與該第一移調級(T-r)作相位相乘;- 該第二分析次頻帶訊號(803)係與該第二移調級r作相位相乘;- T>1;1≦r<T;以及-該合成頻率為(T-r).ω+r.(ω+Ω)。
  2. 如申請專利範圍第1項之系統,另外包含:- 增益單元(902),用於使該合成次頻帶訊號(803)乘 以增益參數。
  3. 如申請專利範圍第1項之系統,另外包含:- 複數個多輸入單輸出單元(800-n)及/或複數個非線性處理單元,其產生具有該合成頻率之複數個部分合成次頻帶訊號(803);以及- 次頻帶加總單元(702),用於組合該等複數個部分合成次頻帶訊號。
  4. 如申請專利範圍第1項之系統,其中該非線性處理單元(302)另外包含:- 直接處理單元(401),用於從該等複數個分析次頻帶訊號之第三分析次頻帶訊號產生另一合成次頻帶訊號;以及- 次頻帶加總單元,用於組合具有該合成頻率的合成次頻帶訊號。
  5. 如申請專利範圍第1項之系統,其中- 若該第一(801)及第二(802)分析次頻帶訊號之振幅的最小者小於該訊號之振幅的預界定分數,則該次頻帶加總單元忽略在該多輸入單輸出單元(800-n)中產生的該等合成次頻帶訊號。
  6. 如申請專利範圍第4項之系統,其中該直接處理單元(401)包含:- 第三移調級T'的單輸入單輸出單元(401-n),從表現出第三分析頻率的該第三分析次頻帶訊號產生該合成次頻帶訊號,其中 - 該第三分析次頻帶訊號係由該第三移調級T'作相位修改;- T'大於一;且- 該合成頻率對應於被乘以該第三移調級的該第三分析頻率。
  7. 如申請專利範圍第1項之系統,其中- 該訊號包含基本頻率;且- 該分析濾波器庫(301)呈現與該訊號之該基本頻率相關聯的頻率間距。
  8. 如申請專利範圍第1項之系統,其中- 該分析濾波器庫(301)具有基本上固定次頻帶間距△ω的N個分析次頻帶;- 分析次頻帶與分析次頻帶索引n相關聯,具有n{1,…,N};- 該合成濾波器庫(303)具有合成次頻帶;- 該合成次頻帶與合成次頻帶索引n相關聯;且- 該合成次頻帶及具有索引n之該分析次頻帶各個包含經由該因數T彼此相關的頻率範圍。
  9. 如申請專利範圍第8項之系統,其中- 該合成次頻帶訊號(803)與具有索引n之該合成次頻帶相關聯;- 該第一分析次頻帶訊號(801)與具有索引n-p1 之分析次頻帶相關聯;- 該第二分析次頻帶訊號(802)與具有索引n+p2 之分 析次頻帶相關聯;且- 該系統另外包含用於選擇p1 及p2 之索引選擇單元。
  10. 如申請專利範圍第9項之系統,其中- 該索引選擇單元可操作以從儲存在索引儲存單元中之有限的(p1 ,p2 )對列選擇索引移位p1 及p2
  11. 如申請專利範圍第10項之系統,其中- 該索引選擇單元可操作以選擇該(p1 ,p2 )對,使得包含該第一分析次頻帶訊號之振幅及該第二分析次頻帶訊號的振幅之群組的最小值最大化。
  12. 如申請專利範圍第9項之系統,其中該索引選擇單元可操作以決定有限的(p1 ,p2 )對列,使得- 該索引移位p1 =r.l;- 該索引移位p2 =(T-r).l;且- l係正整數。
  13. 如申請專利範圍第12項之系統,其中- 該索引選擇單元可操作以選擇該等參數l及r,使得包含該第一分析次頻帶訊號之振幅及該第二分析次頻帶訊號的振幅之該群組的最小值最大化。
  14. 如申請專利範圍第9項之系統,其中該索引選擇單元可操作以基於該訊號的特徵選擇該等索引移位p1 及p2
  15. 如申請專利範圍第14項之系統,其中- 該訊號包含基本頻率Ω; - 該索引選擇單元可操作以選擇該等索引移位p1 及p2 ,使得- 該等索引移位之和p1 +p2 近似於分數Ω/△ω;且- 彼等之分數p1 /p2 係r/(T-r)的倍數。
  16. 如申請專利範圍第14項之系統,其中- 該訊號包含基本頻率Ω;- 該索引選擇單元可操作以選擇該等索引移位p1 及p2 ,使得- 該等索引移位之和p1 +p2 近似於分數Ω/△ω;且- 該分數p1 /p2 等於r/(T-r)。
  17. 如申請專利範圍第1項之系統,另外包含:- 分析窗(2001),其隔離預界定時間實例k周圍之該低頻成份的預界定時間間隔;以及- 合成窗(2201),其隔離該預界定時間實例k周圍之該高頻成份的預界定時間間隔。
  18. 如申請專利範圍第17項之系統,其中- 該合成窗(2201)係該分析窗(2001)的時間標度版本。
  19. 一種用於解碼訊號的系統,包含:- 如申請專利範圍第1項之移調單元(102),用於從該訊號之該低頻成份產生該訊號的該高頻成份。
  20. 如申請專利範圍第19項之系統,其中該訊號係語音及/或音訊訊號。
  21. 如申請專利範圍第19項之系統,另外包含: - 核心解碼器(101),用於解碼該訊號的該低頻成份。
  22. 如申請專利範圍第19項之系統,另外包含:- 升取樣器(104),用於實施該低頻成份的升取樣,以產生已升取樣之低頻成份;- 波封調整器(103),以定形該高頻成份;以及- 成份加總單元,以將該已解碼訊號決定為該已升取樣低頻成份及該已調整高頻成份的和。
  23. 如申請專利範圍第19項之系統,另外包含:- 次頻帶選擇接收單元,用於接收容許該第一(801)及該第二(802)分析次頻帶訊號之選擇的資訊,該合成次頻帶訊號(803)是從該第一及該第二分析次頻帶訊號產生。
  24. 如申請專利範圍第23項之系統,其中- 該資訊與該訊號之基本頻率Ω相關聯。
  25. 如申請專利範圍第23項之系統,其中- 該資訊包含第一(801)及第二(802)分析次頻帶訊號對列。
  26. 如申請專利範圍第22項之系統,另外包含:- 波封接收單元,用於接收與該訊號之該高頻成份的該波封相關之資訊。
  27. 如申請專利範圍第21項之系統,另外包含:- 輸入單元,用於接收包含該低頻成份的該訊號;以及- 輸出單元,用於提供包含該低頻成份及該已產生之 高頻成份的該已解碼訊號。
  28. 一種用於從音訊訊號的低頻成份實施高頻成份之高頻再建構的方法,包含:- 提供第一頻率ω給該低頻成份的第一次頻帶訊號及提供第二頻率(ω+Ω)給該低頻成份的第二次頻帶訊號(301);- 將該第一次頻帶訊號的相位乘以第一移調因數(T-r),以得到第一移調頻帶訊號;- 將該第二次頻帶訊號的相位乘以第二移調因數r,以得到第二移調次頻帶訊號;其中T>1;及1r<T;及- 組合該第一及第二移調次頻帶訊號,以得到高頻(T-r).ω+r.(ω+Ω)的高頻成份(303)。
  29. 如申請專利範圍第28項之方法,其中該提供步驟包含:- 藉由分析濾波器庫(301)濾波該低頻成份,以產生該第一及該第二次頻帶訊號。
  30. 如申請專利範圍第28項之方法,其中該組合步驟包含:- 將該第一已移調次頻帶訊號乘以該第二已移調次頻帶訊號,以產生該高次頻帶訊號;以及- 將該高次頻帶訊號輸入至合成濾波器庫,以產生該高頻成份。
  31. 如申請專利範圍第28項之方法,更包含:- 解碼一被編碼音訊訊號,以得到該音訊訊號的該低 頻成份,其中該編碼訊號係由原始音訊訊號導出;且僅代表該原始訊號中低於交越頻率(1005)的頻率次頻帶的一部分。
  32. 一種用於解碼包含音訊訊號之已接收多媒體訊號的機上盒,該機上盒包含:- 如申請專利範圍第1項之移調單元(102),用於從該音訊訊號的低頻成份產生該訊號的高頻成份。
  33. 一種軟體程式,適於在處理器上執行且當在計算裝置上實行時適於實施如申請專利範圍第28項之該方法步驟。
  34. 一種儲存媒體,包含適於在處理器上執行且當在計算裝置上實行時適於實施如申請專利範圍第28項之該方法步驟的軟體程式。
  35. 一種電腦程式產品,包含當在電腦上執行時用於實施如申請專利範圍第28項之方法的可執行指令。
TW099101097A 2009-01-16 2010-01-15 交叉乘積加強之諧波移調 TWI430264B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US14522309P 2009-01-16 2009-01-16

Publications (2)

Publication Number Publication Date
TW201128634A TW201128634A (en) 2011-08-16
TWI430264B true TWI430264B (zh) 2014-03-11

Family

ID=42077387

Family Applications (2)

Application Number Title Priority Date Filing Date
TW099101097A TWI430264B (zh) 2009-01-16 2010-01-15 交叉乘積加強之諧波移調
TW102147225A TWI523005B (zh) 2009-01-16 2010-01-15 交叉乘積加強之諧波移調

Family Applications After (1)

Application Number Title Priority Date Filing Date
TW102147225A TWI523005B (zh) 2009-01-16 2010-01-15 交叉乘積加強之諧波移調

Country Status (21)

Country Link
US (8) US8818541B2 (zh)
EP (8) EP4300495A3 (zh)
JP (2) JP5237465B2 (zh)
KR (2) KR101589942B1 (zh)
CN (2) CN103632678B (zh)
AU (1) AU2010205583B2 (zh)
BR (3) BRPI1007050B1 (zh)
CA (7) CA3009237C (zh)
CL (1) CL2011001717A1 (zh)
ES (7) ES2904373T3 (zh)
HK (1) HK1162735A1 (zh)
MX (1) MX2011007563A (zh)
MY (1) MY180550A (zh)
PL (6) PL4145446T3 (zh)
RU (5) RU2495505C2 (zh)
SG (1) SG172976A1 (zh)
TR (1) TR201910073T4 (zh)
TW (2) TWI430264B (zh)
UA (1) UA99878C2 (zh)
WO (1) WO2010081892A2 (zh)
ZA (1) ZA201105923B (zh)

Families Citing this family (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
UA99878C2 (ru) * 2009-01-16 2012-10-10 Долби Интернешнл Аб Гармоническое преобразование, усовершенствованное перекрестным произведением
EP2953131B1 (en) 2009-01-28 2017-07-26 Dolby International AB Improved harmonic transposition
ES2906255T3 (es) 2009-01-28 2022-04-13 Dolby Int Ab Transposición armónica mejorada
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
TWI675367B (zh) 2009-05-27 2019-10-21 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US8971551B2 (en) 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
WO2014060204A1 (en) * 2012-10-15 2014-04-24 Dolby International Ab System and method for reducing latency in transposer-based virtual bass systems
TWI404050B (zh) * 2009-06-08 2013-08-01 Mstar Semiconductor Inc 多聲道音頻信號解碼方法與裝置
EP2306456A1 (en) * 2009-09-04 2011-04-06 Thomson Licensing Method for decoding an audio signal that has a base layer and an enhancement layer
KR101405022B1 (ko) 2009-09-18 2014-06-10 돌비 인터네셔널 에이비 입력 신호를 전위시키기 위한 시스템 및 방법, 상기 방법을 수행하는 소프트웨어 프로그램 및 컴퓨터 프로그램 제품을 포함하는 저장 매체
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
EP3998606B8 (en) 2009-10-21 2022-12-07 Dolby International AB Oversampling in a combined transposer filter bank
BR122019025131B1 (pt) 2010-01-19 2021-01-19 Dolby International Ab sistema e método para gerar um sinal transposto de frequência e/ou estendido no tempo a partir de um sinal de áudio de entrada e meio de armazenamento
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) * 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
ES2712304T3 (es) 2010-07-19 2019-05-10 Dolby Int Ab Procesamiento de señales de audio durante la reconstrucción de alta frecuencia
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
AU2015202647B2 (en) * 2010-09-16 2017-05-11 Dolby International Ab Cross product enhanced subband block based harmonic transposition
KR102073544B1 (ko) * 2010-09-16 2020-02-05 돌비 인터네셔널 에이비 교차 곱 강화된 서브밴드 블록 기반 고조파 전위
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9078077B2 (en) 2010-10-21 2015-07-07 Bose Corporation Estimation of synthetic audio prototypes with frequency-based input signal decomposition
US8675881B2 (en) * 2010-10-21 2014-03-18 Bose Corporation Estimation of synthetic audio prototypes
BR112013020324B8 (pt) 2011-02-14 2022-02-08 Fraunhofer Ges Forschung Aparelho e método para supressão de erro em fala unificada de baixo atraso e codificação de áudio
BR112013020592B1 (pt) 2011-02-14 2021-06-22 Fraunhofer-Gellschaft Zur Fôrderung Der Angewandten Forschung E. V. Codec de áudio utilizando síntese de ruído durante fases inativas
CA2920964C (en) 2011-02-14 2017-08-29 Christian Helmrich Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
ES2458436T3 (es) 2011-02-14 2014-05-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Representación de señal de información utilizando transformada superpuesta
MX2013009344A (es) 2011-02-14 2013-10-01 Fraunhofer Ges Forschung Aparato y metodo para procesar una señal de audio decodificada en un dominio espectral.
AR085361A1 (es) 2011-02-14 2013-09-25 Fraunhofer Ges Forschung Codificacion y decodificacion de posiciones de los pulsos de las pistas de una señal de audio
HUE058682T2 (hu) * 2011-02-18 2022-09-28 Ntt Docomo Inc Beszédkódoló és beszédkódoló eljárás
PL3040988T3 (pl) * 2011-11-02 2018-03-30 Telefonaktiebolaget Lm Ericsson (Publ) Dekodowanie audio w oparciu o wydajną reprezentację współczynników autoregresji
EP3544006A1 (en) 2011-11-11 2019-09-25 Dolby International AB Upsampling using oversampled sbr
US20130162901A1 (en) * 2011-12-22 2013-06-27 Silicon Image, Inc. Ringing suppression in video scalers
US8917197B2 (en) * 2012-01-03 2014-12-23 Nucript LLC System and method for improving performance of photonic samplers
EP3288033B1 (en) * 2012-02-23 2019-04-10 Dolby International AB Methods and systems for efficient recovery of high frequency audio content
CN102584191B (zh) * 2012-03-22 2014-05-14 上海大学 用蛇纹石尾矿制备堇青石陶瓷的方法
CN103368682B (zh) 2012-03-29 2016-12-07 华为技术有限公司 信号编码和解码的方法和设备
CA2899134C (en) * 2013-01-29 2019-07-30 Frederik Nagel Decoder for generating a frequency enhanced audio signal, method of decoding, encoder for generating an encoded signal and method of encoding using compact selection side information
KR101732059B1 (ko) 2013-05-15 2017-05-04 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
EP3731226A1 (en) 2013-06-11 2020-10-28 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Device and method for bandwidth extension for acoustic signals
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
FR3015754A1 (fr) * 2013-12-20 2015-06-26 Orange Re-echantillonnage d'un signal audio cadence a une frequence d'echantillonnage variable selon la trame
CA2934602C (en) 2013-12-27 2022-08-30 Sony Corporation Decoding apparatus and method, and program
DE102014003057B4 (de) * 2014-03-10 2018-06-14 Ask Industries Gmbh Verfahren zur Rekonstruierung hoher Frequenzen bei verlustbehafteter Audiokomprimierung
US9306606B2 (en) * 2014-06-10 2016-04-05 The Boeing Company Nonlinear filtering using polyphase filter banks
EP2963649A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using horizontal phase correction
EP2980792A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980798A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
TWI693594B (zh) 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10129659B2 (en) 2015-05-08 2018-11-13 Doly International AB Dialog enhancement complemented with frequency transposition
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9454343B1 (en) 2015-07-20 2016-09-27 Tls Corp. Creating spectral wells for inserting watermarks in audio signals
US9311924B1 (en) 2015-07-20 2016-04-12 Tls Corp. Spectral wells for inserting watermarks in audio signals
US9626977B2 (en) 2015-07-24 2017-04-18 Tls Corp. Inserting watermarks into audio signals that have speech-like properties
US10115404B2 (en) 2015-07-24 2018-10-30 Tls Corp. Redundancy in watermarking audio signals that have speech-like properties
TWI752166B (zh) * 2017-03-23 2022-01-11 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
US10573326B2 (en) * 2017-04-05 2020-02-25 Qualcomm Incorporated Inter-channel bandwidth extension
CN108108333B (zh) * 2017-05-02 2021-10-19 大连民族大学 一种伪双谱分离具有相同谐波频率成分信号的方法
JP7252976B2 (ja) * 2018-04-25 2023-04-05 ドルビー・インターナショナル・アーベー 後処理遅延低減との高周波再構成技術の統合
CN109003621B (zh) * 2018-09-06 2021-06-04 广州酷狗计算机科技有限公司 一种音频处理方法、装置及存储介质
CN109036457B (zh) * 2018-09-10 2021-10-08 广州酷狗计算机科技有限公司 恢复音频信号的方法和装置
CN110244290A (zh) * 2019-06-17 2019-09-17 电子科技大学 一种距离扩展目标的检测方法

Family Cites Families (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4048443A (en) 1975-12-12 1977-09-13 Bell Telephone Laboratories, Incorporated Digital speech communication system for minimizing quantizing noise
KR100289733B1 (ko) 1994-06-30 2001-05-15 윤종용 디지탈 오디오 부호화 방법 및 장치
JP3606388B2 (ja) 1994-10-31 2005-01-05 ソニー株式会社 オーデイオデータ再生方法及びオーデイオデータ再生装置
US5781880A (en) * 1994-11-21 1998-07-14 Rockwell International Corporation Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
TW303410B (en) 1996-04-19 1997-04-21 Kok Hua Liow Improved construction products and methods
US6252965B1 (en) 1996-09-19 2001-06-26 Terry D. Beard Multichannel spectral mapping audio apparatus and method
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
RU2256293C2 (ru) 1997-06-10 2005-07-10 Коудинг Технолоджиз Аб Усовершенствование исходного кодирования с использованием дублирования спектральной полосы
US5856674A (en) 1997-09-16 1999-01-05 Eaton Corporation Filament for ion implanter plasma shower
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6978236B1 (en) 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
JP5220254B2 (ja) 1999-11-16 2013-06-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 広帯域オーディオ伝送システム
US7742927B2 (en) 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
DE60000185T2 (de) 2000-05-26 2002-11-28 Lucent Technologies Inc Verfahren und Vorrichtung zur Audiokodierung und -dekodierung mittels Verschachtelung geglätteter Hüllkurven kritischer Bänder höherer Frequenzen
US7003467B1 (en) 2000-10-06 2006-02-21 Digital Theater Systems, Inc. Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio
EP1199711A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Encoding of audio signal using bandwidth expansion
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
SE0004818D0 (sv) * 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
US6889182B2 (en) * 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
US7013269B1 (en) * 2001-02-13 2006-03-14 Hughes Electronics Corporation Voicing measure for a speech CODEC system
FR2821501B1 (fr) 2001-02-23 2004-07-16 France Telecom Procede et dispositif de reconstruction spectrale d'un signal a spectre incomplet et systeme de codage/decodage associe
FR2821475B1 (fr) 2001-02-23 2003-05-09 France Telecom Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques
SE0101175D0 (sv) 2001-04-02 2001-04-02 Coding Technologies Sweden Ab Aliasing reduction using complex-exponential-modulated filterbanks
WO2003003345A1 (fr) 2001-06-29 2003-01-09 Kabushiki Kaisha Kenwood Dispositif et procede d'interpolation des composantes de frequence d'un signal
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
DE60230856D1 (de) * 2001-07-13 2009-03-05 Panasonic Corp Audiosignaldecodierungseinrichtung und audiosignalcodierungseinrichtung
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
WO2003046891A1 (en) 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
BR0305710A (pt) * 2002-08-01 2004-09-28 Matsushita Electric Ind Co Ltd Aparelho de decodificação de áudio e método de decodificação de áudio
JP3879922B2 (ja) 2002-09-12 2007-02-14 ソニー株式会社 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム
KR100501930B1 (ko) 2002-11-29 2005-07-18 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
RU2244386C2 (ru) 2003-03-28 2005-01-10 Корпорация "Самсунг Электроникс" Способ восстановления высокочастотной составляющей аудиосигнала и устройство для его реализации
SE0301272D0 (sv) 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Adaptive voice enhancement for low bit rate audio coding
JP4789622B2 (ja) * 2003-09-16 2011-10-12 パナソニック株式会社 スペクトル符号化装置、スケーラブル符号化装置、復号化装置、およびこれらの方法
EP1672618B1 (en) * 2003-10-07 2010-12-15 Panasonic Corporation Method for deciding time boundary for encoding spectrum envelope and frequency resolution
EP2221807B1 (en) 2003-10-23 2013-03-20 Panasonic Corporation Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof
US7668711B2 (en) * 2004-04-23 2010-02-23 Panasonic Corporation Coding equipment
KR101220621B1 (ko) 2004-11-05 2013-01-18 파나소닉 주식회사 부호화 장치 및 부호화 방법
BRPI0608269B8 (pt) * 2005-04-01 2019-09-03 Qualcomm Inc método e aparelho para quantização vetorial de uma representação de envelope espectral
US8311840B2 (en) * 2005-06-28 2012-11-13 Qnx Software Systems Limited Frequency extension of harmonic signals
KR100717058B1 (ko) 2005-11-28 2007-05-14 삼성전자주식회사 고주파 성분 복원 방법 및 그 장치
JP2007171339A (ja) * 2005-12-20 2007-07-05 Kenwood Corp オーディオ信号処理装置
CN101089951B (zh) * 2006-06-16 2011-08-31 北京天籁传音数字技术有限公司 频带扩展编码方法及装置和解码方法及装置
US20080109215A1 (en) 2006-06-26 2008-05-08 Chi-Min Liu High frequency reconstruction by linear extrapolation
JP2008033269A (ja) 2006-06-26 2008-02-14 Sony Corp デジタル信号処理装置、デジタル信号処理方法およびデジタル信号の再生装置
KR101435893B1 (ko) * 2006-09-22 2014-09-02 삼성전자주식회사 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
TWI308740B (en) 2007-01-23 2009-04-11 Ind Tech Res Inst Method of a voice signal processing
US20080208575A1 (en) 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
JP4905241B2 (ja) * 2007-04-27 2012-03-28 ヤマハ株式会社 高調波生成装置、低音増強装置、およびコンピュータプログラム
US7886303B2 (en) 2007-05-18 2011-02-08 Mediatek Inc. Method for dynamically adjusting audio decoding process
CN101105940A (zh) 2007-06-27 2008-01-16 北京中星微电子有限公司 音频编解码的量化方法、反变换方法及音频编解码装置
UA99878C2 (ru) * 2009-01-16 2012-10-10 Долби Интернешнл Аб Гармоническое преобразование, усовершенствованное перекрестным произведением

Also Published As

Publication number Publication date
SG172976A1 (en) 2011-08-29
RU2018130424A (ru) 2020-02-25
US11935551B2 (en) 2024-03-19
KR101589942B1 (ko) 2016-01-29
US20210366500A1 (en) 2021-11-25
CA3124108C (en) 2022-08-02
ES2885804T3 (es) 2021-12-15
ES2966639T3 (es) 2024-04-23
BR122019023704B1 (pt) 2020-05-05
US8818541B2 (en) 2014-08-26
US11031025B2 (en) 2021-06-08
WO2010081892A2 (en) 2010-07-22
KR20110128275A (ko) 2011-11-29
ES2734361T3 (es) 2019-12-05
RU2011133894A (ru) 2013-03-10
EP3598447A1 (en) 2020-01-22
RU2667629C1 (ru) 2018-09-21
CN103632678A (zh) 2014-03-12
TR201910073T4 (tr) 2019-07-22
AU2010205583B2 (en) 2013-02-07
EP4300495A2 (en) 2024-01-03
CL2011001717A1 (es) 2012-07-20
RU2013119725A (ru) 2014-11-10
KR101256808B1 (ko) 2013-04-22
MX2011007563A (es) 2011-09-06
US20200273476A1 (en) 2020-08-27
RU2018130424A3 (zh) 2021-11-15
EP3598445B1 (en) 2021-07-07
BRPI1007050B1 (pt) 2020-04-22
CA2748003A1 (en) 2010-07-22
CA3231911A1 (en) 2010-07-22
US11682410B2 (en) 2023-06-20
CN103632678B (zh) 2017-06-06
KR20130006723A (ko) 2013-01-17
CA3009237A1 (en) 2010-07-22
BRPI1007050A2 (pt) 2019-03-26
PL4145446T3 (pl) 2024-04-08
US10192565B2 (en) 2019-01-29
EP2380172B1 (en) 2013-07-24
EP3598447B1 (en) 2021-12-01
US20190115038A1 (en) 2019-04-18
WO2010081892A3 (en) 2010-11-18
EP3598446B1 (en) 2021-12-22
ES2904373T3 (es) 2022-04-04
CA3124108A1 (en) 2010-07-22
CA2926491C (en) 2018-08-07
CA3009237C (en) 2020-08-25
TW201128634A (en) 2011-08-16
JP2012515362A (ja) 2012-07-05
JP5597738B2 (ja) 2014-10-01
HK1162735A1 (en) 2012-08-31
US20240194211A1 (en) 2024-06-13
EP4145446B1 (en) 2023-11-22
JP2013148920A (ja) 2013-08-01
CA2748003C (en) 2016-05-24
PL3598446T3 (pl) 2022-03-28
EP3992966B1 (en) 2022-11-23
EP4145446A1 (en) 2023-03-08
PL3598447T3 (pl) 2022-02-14
JP5237465B2 (ja) 2013-07-17
TWI523005B (zh) 2016-02-21
EP2620941A1 (en) 2013-07-31
RU2495505C2 (ru) 2013-10-10
CA2926491A1 (en) 2010-07-22
BR122019023684B1 (pt) 2020-05-05
EP4300495A3 (en) 2024-02-21
TW201413709A (zh) 2014-04-01
EP2380172A2 (en) 2011-10-26
EP2620941B1 (en) 2019-05-01
CA3084938A1 (en) 2010-07-22
RU2765618C2 (ru) 2022-02-01
US20110305352A1 (en) 2011-12-15
US20230298606A1 (en) 2023-09-21
PL3598445T3 (pl) 2021-12-27
CA3084938C (en) 2021-08-24
PL3992966T3 (pl) 2023-03-20
ES2938858T3 (es) 2023-04-17
RU2638748C2 (ru) 2017-12-15
US20180033446A1 (en) 2018-02-01
MY180550A (en) 2020-12-02
CN102282612B (zh) 2013-07-24
UA99878C2 (ru) 2012-10-10
RU2646314C1 (ru) 2018-03-02
ES2427278T3 (es) 2013-10-29
EP3992966A1 (en) 2022-05-04
AU2010205583A1 (en) 2011-07-07
EP3598445A1 (en) 2020-01-22
ES2901735T3 (es) 2022-03-23
CN102282612A (zh) 2011-12-14
CA3162807C (en) 2024-04-23
PL2620941T3 (pl) 2019-11-29
CA3162807A1 (en) 2010-07-22
EP3598446A1 (en) 2020-01-22
US10586550B2 (en) 2020-03-10
US20140297295A1 (en) 2014-10-02
US9799346B2 (en) 2017-10-24
ZA201105923B (en) 2012-11-28

Similar Documents

Publication Publication Date Title
TWI430264B (zh) 交叉乘積加強之諧波移調
AU2013201597B2 (en) Cross product enhanced harmonic transposition