TW200912897A - Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding - Google Patents

Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding Download PDF

Info

Publication number
TW200912897A
TW200912897A TW097122276A TW97122276A TW200912897A TW 200912897 A TW200912897 A TW 200912897A TW 097122276 A TW097122276 A TW 097122276A TW 97122276 A TW97122276 A TW 97122276A TW 200912897 A TW200912897 A TW 200912897A
Authority
TW
Taiwan
Prior art keywords
frame
signal
time
residue
segment
Prior art date
Application number
TW097122276A
Other languages
English (en)
Other versions
TWI405186B (zh
Inventor
Vivek Rajendran
Ananthapadmanabhan A Kandhadai
Venkatesh Krishnan
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW200912897A publication Critical patent/TW200912897A/zh
Application granted granted Critical
Publication of TWI405186B publication Critical patent/TWI405186B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

200912897 九、發明說明: 【發明所屬之技術領域】 本揭示内容係關於音訊信號之編碼。
本申請案主張2007年6月13日所申請之名為「用於在包 括多個編碼模式之廣義音訊編碼系統中模式選擇的方法及 裝置(METHOD AND APPARATUS FOR MODE SELECTION IN A GENERALIZED AUDIO CODING SYSTEM INCLUDING MULTIPLE CODING MODES)」的臨時申請案第 〇 60/943,55 8號之優先權,且該案已讓與給其受讓人。 【先前技術】 特別在長距離電話、諸如語音ΙΡ(亦稱作VoIP,其中IP表 示網際網路協定)之封包交換電話及諸如蜂巢式電話之數 位無線電電話中’藉由數位技術傳輸音訊資訊(諸如,話 音及/或音樂)已變得普遍。此增長已產生對減少用於經由 傳輸頻道傳送語音通信之資訊量同時維持重建話音之感知 品質的關注。舉例而言,需要有效利用可用系統頻寬(尤 G 其在無線系統中)。有效使用系統頻寬之一種方法為使用 信號壓縮技術。對於載運話音信號之系統,出於此目的而 通常使用話音壓縮(或”話音編碼")技術。 經組態以藉由擷取關於人類話音產生之模型的參數來壓 縮話音之益件經常被稱作音訊編碼器、語音編碼器、編碼 解碼器、聲碼器或話音編碼器,且以下描述互換地使用此 等術語。音訊編碼器通常包括編碼器及解碼器。編碼器通 常接收作為稱作”訊框"之一系列樣本區塊的數位音訊信 132262.doc 200912897 號、分析每-訊框以榻取某些相關參數,且量化參數 生-相應系列經編碼訊框。經編碼訊框經由傳輸 即,有線或無線網路連接)傳輸至包括解碼器之接收器。、 或者,可儲存經編碼之音訊信號以用於在稍後時間進: 取及解碼。解碼n接收並處理經編碼純、將其逆量:以 產生該等參數,且使用經逆量化之參數再建話音訊框。以 碼激勵線性預測("CELP")為試圖匹配原始音訊信號之波 形的編碼方案。可能需要使用稱作寬鬆CELp(^hed code-excited linear_prediction, RCELp)之 CELp的變型來 編碼話音信號之訊框(尤其有聲訊框)。在RCELI^^碼方案 中’波形匹配約束為寬鬆的。RCELp編踢方案為音高規則 化("PR")編碼方案’其中可通常藉由改變基頻脈衝之相對 位置來調整在信號之基頻週期(亦稱作"延遲輪廓")之中的 變化以匹配或接近更平滑、合成的延遲輪廓。音高規則化 通常允許以較少位元編碼基頻資訊,其中感知品質稍有降 低至無降低。通常,並無規定調整量之資訊傳輸至解碼 器。以下文件描述包括RCELP編碼方案之編碼系統:第三 代合作夥伴計劃2("3GPP2")文件C.S0030-0, v3 〇 ,標題為 "Selectable Mode Vocoder (SMV) Service Option for Wideband Spread Spectrum Communication Systems" > 2004 年1月(在www.3gpp.org線上可用);及3GPP2文件〇_80014_ C,vl,〇,標題為"Enhanced Variable Rate Codec, Speech Service Options 3,68,and 70 for Wideband Spread Spectrum Digital Systems” ’ 2007 年 1 月(在 www.3gpp.org線 132262.doc 200912897 上可用)。用於有聲訊框之其他編碼方案(包括諸如原型基 頻週期(”ρρΡπ)之原型波形内插("PWI”)方案)亦可實施為 PR(例如,如在上文引用之3GPP2文件c.S0014_c之第 4·2·4,3部分中所描述)。男性說話者之基頻的通用範圍包 括50或70至150或200 Hz,且女性說話者之基頻的通用範 圍包括120或140至3 00或400 Hz。 經由公眾交換電話網路(”PSTN”)之音訊通信的頻寬傳統
上已限於300-3400千赫(kHz)之頻率範圍内。用於音訊通信 之更新近的網路(諸如,使用蜂巢式電話及/或¥〇11>之網路) 可能不具有相同頻寬限制,且可能需要使用此等網路以具 有傳輸及接收音訊通信(包括寬帶頻率範圍)之能力的裝 置:舉例而言’可能需要此等裝置支援延伸低達5g h… 或高達7 kHz或8 kHz之音頻範圍。亦可能需要此等裝置支 援可具有在傳統PSTN限制外之範圍中之音訊話音内'容的
=用立:如高品質音訊或音訊/視訊會議、多媒體服 務(堵如,音樂及/或電視等)之傳遞。 話^ 編碼器所支援之範圍延伸至更高頻率可改良可懂 度。牛例而吕’在話音信號中區分諸如,s,及,之摩擦 資訊:多為高頻率。高頻帶延伸亦可改良 ::: 號的其他品質’諸如存在。舉例而言,即使是—有 亦可具有遠遠超出PSTN頻率範圍之頻譜能量。有聲元音 【發明内容】 根據通用組態處理音訊信號之 規則化("PR”)編碼方㈣ 乂括根據音高 就之第—峨;及根據 132262.doc 200912897 非PR編碼方案編碼音訊信號之第二訊框。在此方法中,第 f訊框在音訊信號巾《且連續於第—訊框,且編碼第— 讯框包括基於時間偏移來時間修改基於第一訊框之第一作 號的區段1中時間修改包括⑷根據該時間偏移來時^ :移第一汛框之區段及(B)基於該時間偏移來時間扭曲第 d一信號之區段之中的-者。在此方法中,時間修改第—信 號之區段包括改變區段之基頻脈衝相對於第一信號之另— 基頻脈衝的位置。在此方法令,編碼第二訊框^括基於時 _來時間修改基於第二訊框之第二信號的區段,其中 ?間修改包括⑷根據該時間偏移來時間偏移第二訊框之 區段二(B)基於該時間偏移來時間扭曲第二信號之區段之 中=一者。亦描述具有用於以此方式處理音訊信號之訊框 。7的電腦可δ賣媒體’以及用於以類似方式處理音訊信 號之訊框的裝置及系統。 :據另通用組態處理音訊信號之訊框的方法包括根據 、辱方案編碼音則I;號之第—訊框;及根據pR編碼方 案編碼音訊信號之第二訊框。在此方法中,第二訊框在音 訊L就中跟隨且連續於第一訊框,且第一編碼方案為非pR 編碼方案。在此方法中,編碼第一訊框包括基於第一時間 偏移來時間修改基於第一訊框之第一信號的區段,其中時 :改包括(Α)根據第—時間偏移來時間偏移第一信號之 " ⑻基於帛時間偏移來時間扭曲第一信號之區段 的I在此方法令,編碼第二訊框包括基於第二時 間偏移來時間修改基於第二訊框之第二信號的區段,其中 132262.doc 200912897 時間修改包括⑷根據第二時間偏移來時間 之區段及⑻基於第:時間偏移來時 號 w示一 1s號夕ρ 段之中的-者。在此方法中,時間修改第 °° I5 之區殺^句 括改I區段之基頻脈衝相對於第二信 ° 乃—基頻脈衝66 位置,^第二時間偏移係基於來自第一信號之經時間修改 區段的資訊。亦描述具有用於以此方式處理音訊信號: 框之指令的電腦可讀媒體 以B田 貝跺體u及用於以類似方式處 信號之訊框的裝置及系統。 Γ 【實施方式】 本文中所描述之系統、方法及裝置可用以在多模式音來 編碼系統中在PR與非PR編碼方案之間轉變期間支援辦加 之感知品質,尤其可用於包括重疊相加(映杯心福) 非職碼方案(諸如,修改型離散餘弦變換den編碼 方案)之編碼系統。下文描述之組態駐留於經組態以使用 分碼多向近接(”CDMA”)無線介面的無線電話通信*** 中。然而,熟習此項技術者將理解具有本文中所描述之特 徵的方法及裝置可駐留於使用熟習此項技術者所已知之廣 泛範圍之技術的任何各種通信系統令,諸如經由有線及/ 或無線(例如,CDMA、TDMA、FDMa及 MTd scd叫 傳輸頻道使用語音IP(” v〇Ip")之系統。 清楚地預期且藉此揭示本文中所揭示之組態可經調適以 用於經封包交換(例如,經配置以根據諸如醫之協定載 運音訊傳輸的有線及/或無線網路)及/或電路交換之網路 中亦/月楚地預期且藉此揭示本文中所揭示之組態可經調 132262.doc 200912897 適以用於窄頻帶編碼系統(例如,編碼約為四千赫或五千 赫之音頻範圍的系統)中且用於寬頻帶編碼系統(例如,編 碼大於五千赫之音頻的系統)中,包括完整頻帶寬頻帶編 碼系統及分割頻帶寬頻帶編碼系統。 除非欠其上下文清楚地限制,否則術語,,信號"在本文中 用以指示其普通意義之任一者,包括在導線、匯流排或其 他傳輸媒體上表示之一記憶體位置(或記憶體位置之集合) 的狀態。除非受其上下文清楚地限制,否則術語”產生Ϊ在 本文中用以指示其普通意義之任一者,諸如計算或另外產 除非又其上下文清楚地限制,否則術語"計算"在本文 中用以指示其普通意義之任一者,諸如計算、評估、平滑 ^或自複數個值中進行選擇。除非受其上下文清楚地限 制’否則術語"獲得"用以指示且 相不,、日通思義之任一者,諸如 :導出、接收(例如,自外部器件)及/或操取(例如, i儲Λ元件之陣列)。在本描述及申請專利範圍中使用術 :包含”時,其並不排除其他元件或操作。術語"Α基於Β,, 用以指示其普通意義之任一 者,包括狀況⑴,,Α基於至少 1 於Β (右在特定情形下適當)。 除非另外指示,否則對呈右 何描_ ^ 謂具有特定特徵之裝置之操作的任 之亦炒彳 “欲揭不具有類似特徵之方法(且反 '、…、),且對根據特定組態之 一 容亦清楚地意欲揭示根據:呆乍的任何揭示内 舉^ t 據類似組態之方法(且反之亦然)。 =,除非另外指示,否 碼器的任何揭示内容亦清楚地音子具有特定特徵之音訊編 也〜欲揭不具有類似特徵之音 132262.doc 200912897 δ孔編碼的方法(且反之亦然), }且對根據特定組態之音訊編 石馬器的任何揭示内容亦清楚地咅 ^ "蒽也思欲揭不根據類似組態之音 δίΐ編碼的方法(且反之亦然)。 藉由引用文件之-部分的任何併人亦應理解為併入在該 部分内引用之術語或變數的定義,其中此等定義在文件中 之別處出現β 、互換地使用術語,,編碼器”、”編碼解碼器"及”編碼系統,, 以表π-系統,該系統包括經組態以接收音訊信號之訊框 (可能在諸如感知加權及/或其他濾波操作之—或多個預處 理操作後)的至少一編碼器及一 _ 久左組態以產生訊框之解碼 表示的相應解碼器。 如圖!中所說明,無線電話系統(例如,CDMA、 TDMA、FDMA及/或TD_SCDMA系統)通常包括經組態以與 無線電存取網路無線地通信之複數個行動用戶單元10,該 無線電存取網路包括複數個基地台(則)12及一或多個基地 台控制器(BSC)14。此系統亦通常包括耦接至BSC 14之行 動交換中心(MSC)16,其經組態以使無線電存取網路與習 知公眾交換電話網路斤灯…以介面連接。為了支援此介面 連接,MSC可包括或在其他方面與媒體閘道器通信,該媒 體閘道益充當網路之間的轉譯單元。媒體閘道器經組態以 在不同格式(諸如不同傳輸及/或編碼技術)之間轉換(例 如γ在分時多工(,,TDM”)語音與v〇Ip之間轉換),且亦可經 組‘禮以執行媒體串流功能,諸如回波(echo)消除、雙時多 頻(DTMF")及載頻調(tone)發送。bsc Μ經由回程 132262.doc 12- 200912897 (backhaul)線耦接至基地台12。回程線可經組態以支援任 何若干已知介面’包括E1/T1、ATM、IP、PPP、訊框t 繼、HDSL、ADSL或xDSL。基地台 12、BSC 14、MSC 16 及媒體閘道器(若存在;)之集合亦稱作"基礎結構”。 每一基地台12有利地包括至少一扇區(未圖示),每—扇 區包含全向天線或在徑向地遠離基地台12之特定方向上指 向的天線。或者,每一扇區可包含用於分集接收之兩個或 兩個以上天線。每一基地台12可經有利地設計以支援複數 個頻率指派《可將一扇區與一頻率指派之相交部分稱作— CDMA頻道。基地台12亦可稱作基地台收發器子系統 (BTS)12。或者,"基地台”可用於產業中以共同地指代bsc 14及一或多個BTS 12〇BTS 12亦可被表示為"蜂巢小區基 站"(cell site)12。或者,給定BTS 12之個別扇區可稱作蜂 巢小區基站。行動用戶單元10通常包括蜂巢式及/或個人 通k服務("PCS")電話、個人數位助理("pDA")及/或具有行 動電話能力之其他器件。此單元1〇可包括内部揚聲器及麥 克風 '包括揚聲器及麥克風之繫栓手機(tethered handset) 或耳機(例如,USB手機)或包括揚聲器及麥克風之無線耳 機(例如’使用由 Bluetooth Special Interest Group (Bellevue,WA)公布之藍芽協定之版本將音訊資訊傳達至 該單元的耳機)。此系統可經組態以根據IS_95標準之一或 多個版本(如由 Telecommunications Industry Amance (Arlington, VA))公開之 IS-95、IS-95A、IS-95B、 cdma2000)來使用 〇 132262.doc -13- 200912897 現描述蜂巢式電話系統之 、生刼作。基地台12自行動用 接收反向鏈路信號之集合。行動用戶單元 正:::話呼叫或其他通信。將由給定基地台12接收之 = 信號於該基地台12内加以處理,且將所得資
:遞至BSC14°BSC14提供通話資源分配及行動性管理 ^性’包括對基地台12之間的軟交遞之安排。BSC 14亦 將所接收之資料路由至獄16,其為與PSTN18之介面連 接提供額外路由服務。類似地,PSTN 18與刪16介面連 接,且MSC 16與聰14介輯接,職14又控制基地台 12以將前向鏈路信號之集合傳輪至行㈣戶單元ι〇之集 合。 / 圖1中所7F之蜂巢式電話系統的元件亦可經組態以支援 封包交換資料通信。如圖2中所示,Μ使絲接至一連 接至封包資料網路之閉道器路由器的封包f料服務節點 (PDSN)22在行動用戶單元1〇與外部封包資料網路24(例 如,諸如網際網路之公用網路)之間路由封包資料訊務。 PDSN 22又將資料路由至-或多個封包控制功能(pcF)2〇, 其各自伺服於一或多個BSC 14且充當封包資料網路與無線 電存取網路之間的鏈路。封包資料網路24亦可經實施以包 括區域網路("LAN”)、校園網路(”cAN”)、都會網路 ("MAN”)、廣域網路(” WAN”)、環狀網路、星形網路、訊 私環網路等。連接至網路24之使用者終端機可為pDA、膝 上型電腦、個人電腦、遊戲器件(此器件之實例包括ΧΒ〇χ 及 XBOX 360(Microsoft Corp., Redmond, WA)、第 3代遊戲 132262.doc •14. 200912897 機及攜帶型遊戲機(sony corp,T〇ky。,jp)及wu斑 DS⑽ntendo, Ky〇t〇, Jp)),及/或具有音訊處理能力且可經 組態以使用諸如Vo ί P之一或多個協定支援電話呼叫或其他 、^的任何器件。此終端機可包括内部揚聲器及麥克風、 ^㈣器及麥克風之繫检手機(例如,聰手機)或包括 #聲&及麥克風之無線耳機⑼如’使用如由Bluetooth
Specml lnterest Gr〇up(BeUevue, WA))公布之藍芽協定之版
曰λ資訊傳達至该終端機的耳機)。n统可經組態 以載運電話呼叫或其他通信作為不同無線電存取網路上之 :動用戶單元之間(例如,經由諸如νοΙΡ之一或多個協 疋)、仃動用戶單元與非行動使用者終端機之間,或兩個 非行動使㈣終端機之間的封包資料訊務,而始終不進入 PSTN。行動用戶單元1〇或其他使用者終端機亦可稱作”存 取終端機”。 圖3a說明音訊編碼器AE丨〇,其經配置以接收數位化音 Μ戒S1 〇〇(例如,作為一系、列訊框)及產生相應編碼信號 S200(例如,作為一系列相應編碼訊框)以用於在通信頻道 C100(例如,有線、光學及/或無線通信鏈路)上傳輪至音訊 解碼益AD1G。音訊料had職配置以解碼經編碼之音 Λ仏號S200的所接收版本S3〇〇及合成相應輸出話音信號 S400 。 … 音矾信號S100表示已根據在此項技術中已知之各種方法 中的任一者(諸如脈衝編碼調變("PCM”)、壓擴mu_law或A_ hw)經數位化及量化的類比信號(例如,如由麥克風所擷 132262.doc -15- 200912897 =)社號亦可已在類比及/或數位域中經受其他預處理 諸如雜訊抑制、感知加權及/或其他濾波操作。另 ^或其他’可在音訊編碼器aei〇内執行此等操作。音訊 L號S 100之執仃個體亦可表示已經數位化及量化之類比信 號(例如,如由麥克風之陣列所擷取)的組合。 圖3b說明音訊編碼器AE10之第一執行個體AE10a,其經 配置以接收經數位化音訊信號S100之第-執行個體S110及 產生經編碼信號S200之相應執行個體S21 0以用於在通信頻 道C1〇〇之第—執行個體C110上傳輸至音訊解碼器八〇10之 第一執行個體AD10a。音訊解碼器ADlOa經配置以解碼經 編碼之音訊信號S21〇的所接收版本S31〇及合成輸出話音信 號S400之相應執行個體S41〇。 圖3 b亦說明音訊編碼器AE丨〇之第二執行個體'Η 1仙,其 經配置以接收經數位化音訊信號S1 〇 0之第二執行個體s丨2 〇 及產生經編碼信號S200之相應執行個體S22〇以用於在通信 頻道ci〇〇之第二執行個體cl2〇上傳輸至音訊解碼器 之第二執行個體AD1〇b。音訊解碼器Am〇b經配置以解碼 經編碼之音訊信號S220的所接收版本832〇及合成輸出話音 信號S400之相應執行個體S42〇。 音訊編碼器AE10a及音訊解碼器AD1〇b(類似地,音訊編 碼器AElOb及音訊解碼器AD10a)可共同用於傳輸及接收話 音信號之任何通信器件中,其包括(例如)上文參看圖丨及圖 2所描述之用戶單元、使用者終端機、媒體閘道器、 或B S C。如本文甲所描述,音訊編碼器AE1 0可以許多不同 132262.doc •16· 200912897 方式來實施,且立& 9 5fl編碼器AElOa及AElOb可為音訊編碼 器AE10之不同竇妳mm π知的執行個體。同樣地,音訊解碼器 AD1〇可以許多不同方式來實施,且音訊解碼IIADlOa及 AD 10b可為日訊解碼器ADi〇之不同實施的執行個體。 音訊編碼器(例如,立
L U 如音訊編碼器AE10)將音訊信號之數位 2本處理為輸入資料之-系列訊框,其中每一訊框包含預 疋數目之樣本。儘管處理訊框或訊框之區段(亦稱作子訊 的操作亦可包括其輸人中之—或多個鄰近訊框的區 段’但此系列通常被實施為不相重疊的系列。音訊信號之 訊框通常足夠短以使得信號之頻譜包絡可被預期在訊框上 保持相對固疋。戒框通常對應於音訊信號之五毫秒與三十 五毫秒之間(或約四十至二百個樣本),其中二十毫秒為電 蛞應用之通用訊桓大小。通用訊框大小之其他實例包括十 毫私及—十毫秒。通常音訊信號之所有訊框具有同—長 度,且在本文中所描述之特定實例中假定統—的訊框長 ^产然而,亦清楚地預期且藉此揭示可使用不統-的餘 二十毫秒之訊桓長度對應於七千赫她)之取樣 的140個樣本、人千赫之取樣速率(窄頻帶編碼 型取樣速率)下的⑽個樣本,及16册之取樣速率:帶 編碼系統之-典型取樣速率)下的咖個樣本,然而可使: 視為適合於料應用之任何取樣速率。可用於話音 取樣速率的另一實例為j 2 8 ν 馬之 賞例為12·8此,且其他實例包括 kHz至38,4kHz之範圍中的其他速率。 2.8 132262.doc 200912897 在典型音訊通信會話(諸如,電話呼叫)中, =持沉默達約百分之六十的時間。用於此應用之音= π將通常經組態以區別含有話音或其他資訊之音气 訊框(”作用訊框")與僅含有背景雜訊或無聲之音訊^的 純(”不作用訊框,,)。可能f要實施音訊編碼器伽使用 碼模式及/或位元速率來編碼作用訊框及不作用訊 框。舉例而言,音訊編碼器 ° 你田% # , a只施以使用比編碼 編框少之位元(亦即’較低位元速率)來編碼不作用訊 框。亦可能需要音訊編碼器AE1()使用不同位元 碼不同類型之作用訊框。在此等狀況下,較低位元速率可 選擇性地用於含有相對較少話音資訊之訊框。通常用以編 碼作用訊框之位元速率的實例包括每訊框m個位元、每 訊框八十個位元及每訊框四十個位元;且通常用以編碼不 作用訊框之位元速率的實例包括每訊框十六個位元。在蜂 巢式電話系統(尤其與由Telec〇mmunicati_
Ass〇ciati〇n(Arnngton,VA))公布之加‘標準(is) 95或類 似產業標準相符合的系統)之情形下,此等四個位元速率 亦分別稱作"全速率半速率"、"四分之一速率"及"八分 之一速率1'。 可能需要音訊編碼器AE10將音訊信號之每一作用訊框 分類為若干不同類型中之一者。此等不同類型可包括有聲 S曰(例如表不元日聲之話音)的訊框、過渡訊框(例如, 表示話之開始或結束的訊框)、無聲話音(例如,表示摩擦 音之話音)的訊框,及非話音資訊(例如,音樂,諸如唱歌 132262.doc -18- 200912897 二::Ε1’〇===容)之訊框。可能需要實施 訊框。舉例而+,有聲碼模式來編碼^類型之 今… 框傾向於具有週期結構, ==為長期的(亦即,延續達一個以上訊框週期)且 =:基頻,且使用編碼此長期頻譜特徵之描述的編碼模
=有:訊框(或一連串有聲訊框)通常更有效。此等 ,、駟、式之實例包括碼激勵線性預測(” c E L η (: :::::)及原型基頻週—^ 忙及不作用訊框通常缺乏任何顯著的長期頻譜特徵且立 可㈣態以使用並非試圖描述此特徵之編碼模I 之=指框。雜訊激勵線性預測("nelp”)為此編碼模 h二:。音樂之訊框通常含有不同音調之混合物,且 傅立葉::可經組態以使用基於正弦分解之方法(諸如, H或餘弦變換)來編碼此等訊框(或對此等訊框之線性 =:(LPC)分析操作的殘餘物^ 〜”改型離散餘弦變換("MDCT")的編碼模式。 音訊編碼器_或音訊編碼之相應方法以在位 、丰…編碼模式(亦稱作"編碼 2擇。舉例而言,可實施音訊編碼器二= 對r渡訊框使用全—: 框(m , . Λ 7杀及針對通用音訊訊 或者,立/ 3有音樂之訊框)使用全速率MDCT方案。 -a訊編碼器AE10之此實施可經組態以針對含有有 J32262.doc 200912897 聲話音之至少一些訊框,尤其針對高聲訊框使用全速率 PPP方案。 亦可實施音訊編碼器AE10以支援一或多個編碼方案中 之每一者的多個位元速率,諸如全速率及半速率CELP方 案及/或全速率及四分之一速率PPP方案。包括穩定有聲話 音之週期之一系列中的訊框傾向於大量冗餘的,例如,以 使得可在小於全速率下編碼其中之至少一些而不顯著損失 感知品質。
多模式音訊編碼器(包括支援多個位元速率及/或編碼模 式之音訊編碼器)通常在低位元速率下提供有效音訊編 碼。熟習此項技術者將認識到增加編碼方案之數目將在選 擇編碼方案時允許較大靈活性,此可引起較低的平均位元 速率。然而,編碼方案之數目的增加將相應地增加整個系 統内之複雜性。用於任何給定系統中之可用方案的特定組 合將由可用系統資源及特定信號環境支配。多模式編碼技 術之實例描述於(例如)標題為"VARIABLE RATE SPEECH CODING"之美國專利第6,691,084號及標題為"ARBITRARY AVERAGE DATA RATES FOR VARIABLE RATE CODERS" 之美國公開案第2〇07/0171931號中。 圖4a說明音訊編碼器AE10之多模式實施AE2〇的方塊 圖。編碼器AE20包括編碼方案選擇器2〇及複數⑻個訊框 編碼器30a-3Op。p個訊框編碼器中之每一者經組態以根據 各別編碼模式來編碼訊框,且由編碼方案選擇琴2 〇產生之 編碼方案選擇信號用以控制音訊編喝器AE20之一對選擇 132262.doc -20- 200912897 器5M5〇b以為當前訊框選擇所要的編竭 =2°亦可經組態以控制選定訊樞編碼器;在選= 前訊框。應注意,音訊編W0之軟體 或勃體實料制編碼方案“ 1 #體 碼器中之一者或另一者 :丁 -疋向至訊框解 -及/或用於選擇器50b之類比實:未包括用於選擇器 頰比矾框編碼器30a-30p中之 =或兩者以上(可能所有)可共用共同結構, 數值之計算器(可能經組態 係
L) 不同階數之結果,諸如話音及==碼方案產生具有 具有較高階)職LPC殘餘產生器/崎較之不作用訊框 編:方案選擇㈣通常包括開放迴路決策模組,其 訊框且作出關於將哪—編碼模式或方案應用於訊 、成。此模組通常經組態以將訊框分類為作用或不作 =Γ經組態以將作用訊框分類為兩個或兩個以上不 ::::一者,諸如有聲、無聲、過渡或通用音訊。訊 二類可基於當前訊框之-或多個特徵,及/或一或多個 個Γ上框之—或多個特徵,諸如整個訊框能量、兩個或兩 (二不·同頻帶之每一者中的訊框能量、信雜比 叶算Μ週期性及越零率。可實施編碼方案選擇器20以 特徵之值、自音訊編碼器ΑΕ_—或多個其他 換組接收㈣㈣之值,及/或自包括音訊 器件⑽如,蜂巢式電話)的-❹個其他模組接收此= :/之:。訊框分類可包括比較此特徵之值或量值與= 及/或比較在此值中改變之量值與臨限值。 132262.doc -21 - 200912897 、開放迴路決策模組可經組態以選擇位元速率,在 速率下將根據一特定訊框含有之 6χ兀 框。此操作稱作"可變速率編碼”。型來編瑪該訊 態、音訊編碼器AD20以在較高位元速率(例如' 率需 碼過渡訊框、在較低位元速率(例如,四分之 、 碼無聲訊框,及在中間位元速率(例如,半速率)下:)= 0元速率(例如,全速率)下編碼有聲訊框。選定用乂 請匡之位元迷率亦可取決於諸如所要平均位元速率、、在 上位元速率之所要型式(其可用以支援所要平 準速率),及/或選定用於先前訊框之位元速率的標 編碼方案選擇器編執行封閉迴路編碼決策, 其中在使用開放迴路選定總民t安 μ ‘ 碼方案全部或部分編碼後獲得 :編=:或多個量測。可在封閉迴路測試”慮之效 m=m°)SNR、在諸如PPP話音編碼器之編碼方案 ϋ 旦化SNR =預料差置化SNR、相位量化㈣、振幅 感知SNR’及作為平穩性量測之當前訊框與過 ==的標準化交又相關。可實施編碼方案選擇_ 特徵之值、自音訊編碼器AE2〇 =收此等特徵之值,及/或自包括音訊編= 如冑巢式電話)的-或多個其他模組接收此等 值。若效能量測降到低於臨限值,料將位元速率 …編碼模式改變為被_給予較好品f的位元速率及/ 或編碼模式。可用以維持可變速率多模式音訊編碼器之品 I32262.doc -22· 200912897 質之封閉迴路分類方案的實例描述於標題為"method AND APPARATUS FOR MAINTAINING A TARGET BIT RATE IN A SPEECH CODER"之美國專利第 6,330,532號及
標題為"METHOD AND APPARATUS FOR PERFORMING SPEECH FRAME ENCODING MODE SELECTION IN A VARIABLE RATRE ENCODING SYSTEM"之美國專利第 5,911,128號中。 圖4b說明音訊解碼器AD10之實施AD20的方塊圖,該實 施AD20經組態以處理所接收之編碼音訊信號S300來產生 相應經解碼之音訊信號S400。音訊解碼器AD20包括編碼 方案偵測器60及複數(p)個訊框解碼器70a-70p。解碼器 70a-70p可經組態以對應於上文所描述之音訊編碼器aE2〇 的編碼器’以使得訊框解碼器70a經組態以解碼已由訊框 編碼器30a編碼之訊框,等等。訊框解碼器70a-70p中之兩 者或兩者以上(可能所有)可共用共同結構,諸如可根據一 組經解碼之LPC係數值組態之合成濾波器。在此狀況下, 訊框解碼器可主要在其用以產生激勵合成濾波器產生經解 碼之音訊信號的激勵信號之技術上不同。音訊解碼器 AD20通常亦包括後 置?慮波盗’其經組態以處理經解碼之 音訊信號S400以減少量化雜訊(例如,藉由強調共振峰頻 率及/或衰減頻譜谷值)且亦可包括自適應增益控制。包括 音訊解碼器AD20之器件(例如,蜂巢式電話)可包括數位/ 類比轉換器("DAC"),其經組態及配置以自經解碼之音訊 信號S400產生類比信號來輸出至聽筒、揚聲器或其他音訊 132262.doc -23- 200912897 =:或定位於器件之外殼内的音訊輸出塞孔。此 之前對:T、且悲以在將類比信號應用於塞孔及/或傳感器 f執行一或多個類比處理 波、均衡及/或放大)。 氣 編碼方案❹ΠΙ 60經組態㈣㈣應於所 訊信號S300之當前訊框的編碼方案 ^馬曰 戎焰m w _»·、 、田、爲碼位兀速率及/ ==:訊框之格式指示。編碼方案偵測器6。可經 声)ΓΓ速=或自裝置之另—部分(諸如,多工子 二)接收速率“,在該裝置内嵌入音訊解碼器AD2。。舉 方㈣測器60可經組態以自多工子層接收指 可經::::封包類型指示器。或者,編碼方案偵測器6〇 『Ί、’且態以自一或容>fiii奋虹γ ^ ^ , 一 "(诸如,訊框能量)確定經編碼 口孔框之位元速率。在一肚 ^ 中,編碼系統可經組態以僅 使用特疋位元速率之一編 ± + 果八以使仔經編碼之訊框的 =率亦指示編媽模式。在其他狀況下,經編 C, =括制編式(根據其來編碼訊框)的資訊(諸如,-或多個位元之一隼人、。 地$ _ ^ 、σ 貝矾(亦稱作”編碼索引")可明確 地或隱含地指示編碼模式 編碼模式無效的值)。 ’藉由指示對於其他可能 圖4b說明由編碼方案 _ ” 、j器60產生之編碼方案指示用以 控制音訊解碼器AD20之—斟,联神 7n 對選擇器90a及90b以選擇訊框 解碼器70a-7〇p之中的一
Amo之軟體或細體 ^實例。應注意,音訊解碼器 4 4 實刼可使用編碼方案指示以將執行流 疋向至訊框解碼器中之— 考或另一者,且此實施可未包括 132262.doc -24- 200912897 用於選擇器90&及/或用於選擇器9〇b之類比。 圖▲說月夕模式音訊編碼器ae2〇之實施A㈣的方塊 "〆實施AE22包括訊框編碼器3Ga、3Gb之實施32a、 3 2 b。在此實例中,绝 、 、、馬方案選擇器20之實施22經組態以 區別音訊信號S1 〇〇之作用呻拖伽τ a 丄 f用5fl框與不作用訊框。此操作亦稱 作"語音活動偵測",且可奢 了實施編碼方案選擇器22以包括語 音活動偵測器。舉例而士 。 編碼方案選擇器22可經組態以 輸出二進位值編碼方幸 Ο _ '、選擇4娩,其對於作用訊框為高的 (指示作用訊框編碼器32a$搜裡 之選擇)且對於不作用訊框為低的 (指示不作用訊框編碼器32b之選擇),且反之亦然。在此實 中由、扁碼方案選擇器22產生之編碼方案選擇信號用以 控制選擇器心、5Gb之實施%、似,以使得音訊信號 咖之母-tfi框由作用訊框編碼器仏(例如,cELp編碼 器)及不作用訊框編碼51 ^ 9 L么丨( 馬态32b(例如,NELp編碼器)之中的選 定一者來編碼。 編碼方案選擇器22可經纟且離其 」、二組態以基於訊框之能量及/或頻 谱内容的一或多個4#德·氺/-·>·:«: * 寻戊來執仃语音活動偵測,諸如訊框能 量、信雜比("SNR")、:;月他w ^ , 週期性、頻4分布(例如,頻譜傾斜) 及/或越零率。可實施編碼方宏m ^ 兩馬万案選擇器22以計算此等特徵 值自θ 1為石馬器AE22之一或多個其他模組接收此等 特徵之值及/或自包括音訊編碼器AM:之器件(例如,蜂 巢式電話)的一或多u 、 夕個其他模組接收此等特徵之值。此偵
測可包括比較此特傲夕/古4,θ U 特徵之值或量值與臨限值及/或比較在此
特徵中改變之量值(例如,相 A 相對於先别訊框)與臨限值。舉 132262.doc -25- 200912897 2而言,編石馬方案選擇器22可經組態以評估當前訊框之能 里且在能量值小於(或者,不大於)臨限值時將訊框分類為 不作用&企匕選擇器可、經組態以將訊框能量計算為訊框樣 本之平方的和。 編碼方案選擇器22之另一實施經組態以評估低頻帶(例 如3〇〇 Hz至2 kHz)及高頻帶(例如,2 kHz至4 kHz)之每 -者中的當前訊框之能量且在每一頻帶之能量值小於(或 者,不大於)各別臨限值時指#訊框為不作用#。此選擇 -可經”且態以藉由將通帶遽波器應用於訊框及計算經渡波 訊框之樣本之平方的和而計算頻帶中之訊框能量。此語音 活動偵測操作之一實例描述於第三代合作夥伴計劃2 (”3GPP2”)標準文 R•讀4-C,<0(2007年 i 月)之第 4._7節 中(在www_3gpp2,org線上可用)。 乂另外或其他’語音活動偵測操作可基於來自-或多個先 :訊框及’或—或多個隨後訊框之資訊。舉例而言,可能 需要組態料方案選㈣22以基於在兩個或兩個以上訊框 长平均數之訊框特徵的值而將訊框分類為作用或不作用 I::而要組態編碼方案選擇器22以使用基於來自先前 sfl框之育訊(例如,咎旦 者不雜訊位準、SNR)的臨限值分類訊 L〇=需要组態編碼方案選擇器22以將遵循音訊信號 用讯框至不作用訊框過渡的第一訊框中之一或 之行動:為作用的。在過渡後以此方式繼續先前分類狀態 之订動亦稱作”滞留,,。 圖5b說明多描^ 拉式日訊編碼器AE20之實施aE24的方塊 132262.doc •26- 200912897 圖,該實施AE24包括訊框編碼器3〇c、3〇d之實施、 32d。在此實例中’編碼方案選擇器2()之實施難組態以 區別音訊信號S1〇〇之話音訊框與非話音訊框(例如,音 樂舉例而言’編碼方案選擇器24可經組態以輸出二進 纟值編碼方案選擇信號,其對於話音訊框為高的(指示話 音訊框編碼器32e之選擇,諸如CELp編碼器)且對於非話音 訊框為低的(指示非話音訊框編碼器32d之選擇,諸如 MDCT編碼器)’或反之亦然。此分類可基於訊框之能量及/ P 編内容的-或多個特徵,諸如訊框能量、基頻、週期 性、頻譜分布(例如’倒頻譜係數、Lpc係數、線譜頻率 ("LSF"))及/或越零率。可實施編碼方案選擇器24以計算此 等特徵之值、自音訊編碼器奶4之一或多個其他模組接 收此等特徵之值,及/或自包括音訊編碼器ae24之器件(例 如,蜂巢式電話)的一或多個其他模組接收此等特徵之 值。此分類可包括比較此特徵之值或量值與臨限值及/或 &較在此特徵中改變之量值(例如,相對於先前訊框)與臨 ^ 限值。此分類可基於來自一或多個先前訊框及/或一或多 韻後訊框之資訊,其可用以更新多狀態模型(諸如,隱 馬爾可夫模型)。 在此實例中’由編碼方案選擇器24產生之編碼方案選擇 信號用以控制選擇器52a、52b,以使得音訊信號s⑽之每 一訊框由話音訊框編碼器32c及非話音訊框編碼器Kd之甲 的選定一者來編碼。圖以說明音訊編碼器ae24之實施 AE25的方塊圖,該實施則包括話音訊框編碼器仏之 132262.doc -27- 200912897 RCELP實施34c及非話音訊框編碼器32diMDCT實施34d。 圖6b說明多模式音訊編碼器AE2〇之實施ae26的方塊 圖,該實施AE26包括訊框編碼器3〇b、3〇d、3〇e、3〇f之實 轭32b 32d、32e、32f。在此實例中,編碼方案選擇器2〇 之實施26經組態以將音訊信號sl〇〇之訊框分類為有聲話 曰.、’、聲話曰不作用話音及非話音。此分類可基於上文 ' 所提及之訊框之能量及/或頻譜内容的一或多個特徵,可 包括比較此特徵之值或量值與臨限值及/或比較在此特徵 中改變之量值(例如,相對於先前訊框)與臨限值,且可基 於來自一或多個先前訊框及/或一或多個隨後訊框之資 訊。可實施編碼方案選擇器26以計算此等特徵之值、自音 訊編碼器AE26之一或多個其他模組接收此等特徵之值, 及/或自包括音訊編碼器AE26之器件(例如,蜂巢式電話) 的一或多個其他模組接收此等特徵之值。在此實例中由 編碼方案選擇器26產生之編碼方案選擇信號用以控制選擇 ^ 窃5〇&、5〇b之實施54a、5仆,以使得音訊信號81〇〇之每一 Λ框由有聲訊框編碼器32e(例如,或寬鬆 CELP(”RCELP")編碼器)、無聲訊框編碼器似(例如, N E L P編碼器)、非話音訊框編碼器3 2 d及不作用訊框編碼 器32b(例如,低速率NELp編碼器)之中的選定一者來編 喝0 由音訊編碼器AE10產生之經編碼訊框通常含有參數值 之一集合,可自該等參數值之該集合重建音訊信號之相應 訊框。參數值之此集合通常包括頻譜資訊,諸如訊框内 132262.doc -28- 200912897 篁在頻譜上之分布的描述。旦 此犯里分布亦稱作訊框之,,頻 率包絡”或”頻譜包絡"。訊彳 巩框之頻谱包絡的描述可且 用以編碼相應訊框之特定 、 具许茶而疋的不同形式及/或 其二:曰訊編媽器勒以包括封包蝴未圖示), 其經組a將該組參數值配置於封包中,以使得封包之大 小、格式及内容對應於選定用於彼訊框之特定編碼方案。 可實把音訊解碼器AD 1 〇之相雁本竑丨、,A』4 灸相應只施以包括解封包化器(未 圖不),其經組態以使該 更亥組參數值與封包中之其他資訊(諸 如,軚頭及/或其他路由資訊)分離。 音訊編碼器(諸如,音对欲 曰汛編碼态ΑΕ10)通常經組態以將訊 框之頻譜包絡的描述計瞀為 叶开為值之有序序列。在一些實施 中,音訊編碼器ΑΕ1〇經組能 一 上、,且態以汁异有序序列以使得每一 值指示在相應頻率下或在相應頻譜區域上信號之振幅或量 值。此描述之一實例為傅立葉或離散餘弦變換係數之有序 序列。 t 在其他實施中,音印始庄即 Λ編碼益ΑΕ1 〇經組態以將頻譜包絡 之描述計算為編碼模型 、i之參數值的有序序列,諸如線性預 測編碼(,,LPC”)分析之俜數 ^ 你数值的一集合。LPC係數值指示音 Μ號之”振’亦稱作”共振峰,,。通常將W係數值之有 序序列配置為一哎客彻a曰 4夕個向置’且可實施音訊編碼器以將此 等值計算為濾波係數或 4汉射係數。在該集合中係數值之數 目亦稱作LPC分析之”階數"’且由通信器件(諸如,蜂巢式 電話)之音訊編碼器執行的Lpc分析之典型階數的實例包括 4 6 8 1〇 、 12 、 16 、 20 、 24 、 28及32 。 132262.doc -29- 200912897 化形式s爲碼器AE10之實施的器件通常經組態以用量 引)跨’作為相應查找表或"碼薄"之中的一或多個索 ^ 輪頻道來傳輪頻譜包絡之描述。因此,可能需 之2編碼器侧以可經有效量化之形式計算LPC係數值 诸如線譜對("Lsp”)、LSF、導抗頻譜對(,.ISP")、 人頻率("ISF")、倒頻譜係數或對數面積比之值的集
V
:稽θ Λ編碼器AE1G亦可經組態以在轉換及/或量化之前 ’之有序序列執行-或多個其他處理 加權或其他遽波操作。 I 在-些狀況下,訊框之頻譜包絡的描述亦包括訊框之時 間貧訊的描述(例如’如在傅立葉或離散餘弦變換係數之 有序序列中)。在其他狀況下,封包之參數集合亦可包括 訊框之時間資訊的描述。時間資訊之描述的形式可視用以 編碼訊框之特定編碼模式而定。對於—些編碼模式(例 士對於CELP或PPP編碼模式,及對於一些MDCT編碼模 式)’時間貧訊之描述可包括由音訊解碼器用以激勵[PC模 型(例如,根據頻譜包絡之描述組態的合成遽波器)之激勵 信號的描述。激勵信號之描述通常基於對訊框Lpc分析操 作的殘餘物。激勵信號之描述通常以量化形式(例如,作 為相應碼薄之中的一或多個索引)顯現於封包中且可包括 關於激勵信號之至少-基頻分量的資訊。對於ppp編碼模 式,例如,經編碼之時間資訊可包括由音訊解碼器用以再 生激勵信號之基頻分量之原型的描述。對於虹咖或卿 —一·’、經編碼之時間資訊可包括一或多個基頻週期估 132262.doc -30- 200912897 計。關於基頻分量之資訊的描述通常以量化形 作為相應碼薄之中的一或多個索引)顯現於封包=例如, 音訊編碼器細之實施的各種元件可以視為適 期制之硬'、軟體及/或勤體的任何組合來實施。舉 而έ ’可將此等元件製造為駐留於 ' 1 J 曰曰月布曰μ Γ Ο 組中之兩個或兩個以上晶片中的電子及/或光學二 盗件之一實例為固定或可程式化邏輯元件(諸如 f邏輯問)之陣列,且此等元件之任-者可實施為3 固此轉列。此等70件之任兩者或兩者以上乃至全部可實 若干相同陣列内。此或此等陣列可實施於 ^曰曰β (例如’包括兩個或兩個以上晶片之晶片 =二情形同樣適用於相應音訊解碼器α⑽之實:的 :二所:述之音訊編碼器AEl。之各種實施的一或多個 二隼j個或部分地實施為-或多個指令集,該或該等 陣列上,諸如微::::::::或™ 處理器、場可程心…’理器、㈣心、數位信號 r,ASSP,m (,,fpga,,)、特殊應用標準產品 寺殊應用積體電路("ASic”)。音訊編碼器趟〇 實=各種元件的任_者亦可實施為—或多個電腦(例 :二:經程式化以執行一或多個指令集或指令序列之- 者ί兩去列的機器,亦稱作”處理器”),且此等元件之任兩 者或兩者以上乃$么 猫内。此情形同樣適二同一此電猫或若干相同電 ,用於相應音訊解碼器AD】0之各種實 I32262.doc 200912897 施的元件。 音訊編碼器AE10之實施的各種 H 7 合樘兀件可包括於用於有線 及/或,,,、線通信之器件内,諸如 蜂巢式電話或具有此通信 月匕力之其他器件。此器件可蛵 w TD 卞J组態以(例如,使用諸如
VoIP之一或多個協定)與電路 又換及/或封包交換網路通 #。此器件可經組態以對載 ^ n 逆、左編碼之訊框的信號執行操 作,堵如交錯、擊穿、卷積編 … ^差杈正編碼、網路協 疋(例如,乙太網路、丁Cp/tp、 y Γ c ^ £ cdma20〇〇)之一或多個層的 編碼、一或多個射頻(”RF”) 7 x尤學载波之調變,及/或 在頻道上一或多個調變載波之傳輪。 音訊解碼器AD10之實施的 件可包括於用於有線 及/或.、、、線通信之器件内,諸如 含m4 ¥果式電話或具有此通信 知力之其他态件。此器件 旰j厶組態以(例如,使用諸如 V〇n>2—或多個協定)與電 诸 ^ , 換及/或封包交換網路通 #。此器件可經組態以對载 你ϋ # 了戰連左編碼之訊框的信號執行操 作,诸如解交錯、解擊穿、卷 A LA ^ W鮮碼鍈差校正解碼、網 路協疋(例如,乙太網路、Tcp/Tp U/1P、edma200〇)之一或多個 層的解碼、一或多個射頻 a 先學載波之解調變, 及/或在頻道上一或多個調變載波之接收。 音訊編碼器AE10之實施之一 廿井命分壯* A多個凡件可能用於執行 並非與該裝置之操作直接相關 關的任務或執行並非與該裝置 之操作直接相關的其他指今隹 杜S 曰7集堵如與礙入有該裝置之器 件或系統之另一操作相關的任立 斤々 .y , g訊編碼器A£ 10之實 她之一或多個元件亦可能且古、 此具有共同結構(例如,用於在不 132262.doc -32- 200912897 5 —、執行程式碼之對應於不同元件之部分的處理器、經 Μ以在不同時間執行對應於不同㈣之任務的指令集' 〆在不同時間肖不同元件執行操作的電子及/或光學器件 的配置)。& #卜主jjy m 月形同樣適用於相應音訊解碼器AD丨〇之各種 實也=兀件。在一此實例中,將編碼方案選擇器20及訊框 馬器30a-3Op實施為經配置以執行於同一處理器上之指 此實例中,將編碼方案4貞測器60及訊框解碼 益7〇a-7〇p實施為經配置以執行於同一處理器上之指令 集。可實施訊框編碼器30a_3〇p之中的兩者或兩者以上: 共用在不同時間執行之一或多個指令集;㈣情形適用於 訊框解碼器70a-70p。 圖〜說明編碼音訊信號之訊框之方法M1G的流程圖。方 法MH)包括任務删,其計算上文所描述之訊框特徵(諸 如,能量及/或頻譜特徵)的值。基於所計算值,任務te2〇 選擇編碼方案(例如’如上文所描述參考編碼方案選㈣ 2〇之各種實施)。任務则根據敎編碼方案編碼訊框⑼ 如,如本文所描述參考訊框編碼器3〇a_3〇p之各種實施)以 產生經編碼之訊框。可選任務四似生包括經編碼之訊框 的封包。方法謂可經組態(例如,迭代)以編碼音訊信號 之一系列訊框中的每一者。 在方法難之實施的典型應用中,邏輯元件(例如,邏輯 閘)之陣列經組態以執行方法之各種任務中的一者、一者 以上乃至全部。亦可將任務中之一或多者(可能所有)實施 為實施於電腦程式產品(例如,一或多個資料儲存媒體, 132262.doc •33- 200912897 諸如碟片、快閃或其他非揮發性記憶卡 片等)中之程式碼(例如,—或多 體5己憶體晶 品可由包括邏輯元件之陣列(例如該電腦程式產 微控制器或其他有限狀態機)的 二微處理器、 或執行。方法ψ t 】如’電腦)讀取及/ 方法胸之實施的任務亦可由 機器執行。在此等或其他實施中,該 車列或 無線通信之器件内,諸如蜂 :矛可執订於用於 其他哭株,„ . 果式電話或具有此通信能力之 或多㈣ 組態以(例如,使用諸如偏P之一 或多個協定)與電路交換及/或 , ,L BS ,, 乂狹網路通#。舉例而 可包括經組態以接收經編碼之訊框的㈣路。 經組態以編碼音訊信號之訊框之裝置HO的方 充圖 襄置Fl〇包括用於瞀i 士 用於打訊框特徵(諸如,上文所描述 之-里及/或頻譜特徵)之值的構件FE1〇。裝置η〇亦包括 於所計算值而選擇編碼方案(例如,如上文所描述 >,、扁碼方案選擇器2〇之各種實施)之構件FE2〇。裝置⑽ 亦包括用於根據選定編碼方案來編碼訊框(例如,如本文 所描述參考訊框編碼器3〇a_3〇p之各種實施)以產生經編碼 之訊框的構件FE3〇。裝置F1〇亦包括用於產生包括經編碼 之訊框之封包的可選構件FE4G。裝置F1G可經組態以編碼 音訊信號之一系列訊樞中的每一者。 在PR編碼方案(諸如’ RCELp編碼方案)之典型實施或 PPP編碼方案之叹實施中使用可基於相關性之基頻估計 操作’每-訊框或子訊框估計基頻週期一次。可能需要將 基頻估計窗之中心定在訊框或子訊框之邊界處。將訊框典 132262.doc 200912897 型分割為子訊框包括每—訊框三個子訊框(例如,用於咖 樣本訊框之不重疊子訊框之每-者的53、53及54個樣 本)、每-訊框四個子訊框及每—訊框五個子訊框(例如, ⑽·樣本訊框巾之五個32樣本不重疊子純)。亦可能需 要檢查所估权基頻週期之中的—致性以避免誤差,諸如 基頻減半、基頻加倍、基頻三倍等。在基頻估計更新之 間,内插基頻週期以產生合成的延遲輪廓。可以逐樣本為 基礎或以較小頻率(例如,每第二或第三樣本)或較大頻率 ('如,在子樣本解析度下)為基礎執行此内插。描述於上 文提及之3GPP2文件C.S()()14_C中的增強型可變速率編碼 解碼器(”EVRC,,)(例如)使用八次過度取樣的合成延遲輪 廓。通常内插為線性或雙線性内插,且可使用一或多個多 相内«波器或另-適合技術來執行其。叹編碼方案(諸 如’ RCELP)通常經組態以在全速率或半速率下編碼訊
C 王,.、:而在其他速率(諸如,四分之_速率)下編碼的實施 亦為可能的。 使用具有無聲訊框之連續基頻輪廓可導致不良假影,諸 如蜂鳴。因此’對於無聲訊框而t,可能需要在每一子訊 t内使用恆疋基頻週期,從而在子訊框邊界處突然地切換 至另一㈣基頻週期。此技術之典型實例使用在2〇個樣本 至4〇個樣本(在8 kHz取樣速率下)之範圍每扣毫秒重複的基 頻週期之偽隨機序列。如上文所描述之語音活動偵測 ("VAD")操作可經組態以區別有聲訊框與無聲訊框,且此 操作通常基於諸如話音及/或殘餘物之自相關、越零率及/ 132262.doc -35- 200912897 或第一反射係數的因數。 PR編碼方案(例如,RCELp)執行話音信號之時間扭曲。 在此時間扭曲操作(其亦稱作”信號修改,,)中,將不同時間 偏移應用於信號之不同區段以使得改變信號之特徵^ 如,基頻脈衝)之間的原始日寺間關係、。舉例而言,可能需 料間扭曲信號以使得其基頻週期輪廓匹配合成的基頻: ㈣廓。時間偏移值通常在正的幾個毫秒至負的幾個毫秒 之範圍内。對於PR編碼器(例如,RCELp編碼器)而言通常 〇 #改殘餘物而非話音信號,因為可能需要避免改變絲峰 之位置然而β邊地預期且藉此揭示亦可使用經組態以 修改話音信號之PR編碼器(例如,RCELp編碼器)實踐下文 所主張之配置。 可期望將藉由使用連續扭曲修改殘餘物來獲得最好結 果。可以逐樣本為基礎或藉由壓縮及擴大殘餘物(例如, 子訊框或基頻週期)之區段來執行此扭曲。 ίέ 圖8說明在經時間扭曲至平滑延遲輪廓之前(波形Α)及之 ’ 後(波形B)之殘餘物的實例。在此實例中,垂直點線之間 的時間間隔指示規則的基頻週期。 連續扭曲可能計算起來太密集以致於不能實踐於攜帶 型、嵌入式、即時及/或電池供電應用中。因此,對於 RCELP或其他PR編碼器而言,更通常藉由時間偏移殘餘物 2區段來執行殘餘物之分段修改以使得時間偏移之量跨越 每一區段而為恆定的(儘管清楚地預期且藉此揭示亦可使 用經組態以使用連續扭曲來修改話音信號或修改殘餘物之 132262.doc -36- 200912897 RCELP或其他PR編碼器實踐下文所主張之配置)。此操作 可經組態以藉由偏移區段來修改當前殘餘物以使得每一基 頻脈衝匹配目標殘餘物中之相應基頻脈衝,其中該目標殘 餘物係基於來自先前訊框、子訊框、偏移訊框或信號之其 他區段的修改殘餘物。
圖9說明在分段修改之前(波形A)及之後(波形B)之殘餘 物的實例。在此圖中,點線說明以粗體展示之區段如何相 對於剩餘殘餘物向右偏移。可能需要每一區段之長度小於 基頻週期(例如,以使得每一偏移區段含有僅僅一個基頻 脈衝)。亦可能需要防止區段邊界在基頻脈衝下發生(例 如,將區段邊界限於殘餘物之低能量區域)。 分段修改程序通常包括選擇包括基頻脈衝之區段(亦稱 作"偏移訊框")。此操作之一實例描述於上文所提及之 EVRC文件C.S0014-C的第4.11.6·2節(4-95至4-99頁)中,該 節以引用的方式併入本文中作為一實例。通常將最後經修 改之樣本(或第一未經修改之樣本)選擇為偏移訊框之開 始。在EVRC實例中,區段選擇操作針對㈣偏移之脈衝 (例如,尚未修改之子訊框區域中的第一基頻脈衝)搜尋當 前子訊框殘餘物且相對於此脈衝之位置設定偏移訊框之末 端。子訊財含有Μ偏移純1使得偏移訊框選擇操 作(及分段修改程序之隨後操作)可針對單一子訊框經執行 若干次。 殘餘物與合成延遲輪廓 文所提及之EVRC文件 分段修改程序通常包括用以匹配 之操作。此操作之一實例描述於上 132262.doc •37- 200912897 C.S0014-C的第4 u 6 3節(4-99至4 ι〇ι頁)中該節以引用 的2式併入本文中作為一實例。此實例藉由自緩衝器擷取 先Θ子訊框之經修改殘餘物且將其映射至延遲輪廓而產生 目心殘餘物(例如,如上文所提及之evrc文件c遍Μ·。 的第4· 11.6.1節(4_95頁)中所描述,該節以引用的方式併入 本文中作為-實例)。在此實例中,&配操作產生暫時經 Ο改殘餘物,其係藉由偏移選定偏移訊框之複本、根據暫 時經修改殘餘物與目標殘餘物之間的相關性確定最佳偏 移及基於该最佳偏移計算時間偏移來達成。日寺間偏移通 常為累積值,以使得計算時間偏移之操作涉及基於最佳偏 移來更新所累積之時間偏移(例士口,描述於上文以引用的 方式併入之第4.11.6.3節的第4·π.6.3 ·4部分中)。 對於δ 4殘餘物之每一偏移訊框而言,藉由將相應計算 之時間偏移應用於當前殘餘物之對應於偏移訊框的區段而 達成分段修改。此修改操作之一實例描述於上文所提及之 £\^(:文件(:.80014-(:的第4.11.6.4節(4-101頁)中,該節以 引用的方式併入本文中作為一實例。通常時間偏移具有一 分數值以使得在高於取樣速率之解析度下執行修改程序。 在此狀況下,可能需要使用諸如線性或雙線性内插之内插 (可使用一或多個多相内插濾波器或另一適合技術來執行 其)而將時間偏移應用於殘餘物之相應區段。 圖1 0說明根據通用組態之rCELP編碼方法RM1 〇〇(例 如,方法M10之任務TE30的RCELP實施)的流程圖。方法 RM100包括計算當前訊框之殘餘物的任務RT1〇。任務 132262.doc -38- 200912897 尺丁1〇通常經配置以接收經取樣之音訊信號(其可經預處 理),諸如音訊信號S100。任務RT1〇通常經實施以包括線 性預測編碼("LPC")分析操作且可經组態以產生諸如線議 對(’’LSP”)之LPC參數的集合。任務灯1〇亦可包括其他處王: 操作’諸如-或多個感知加權及/或其他遽波操作。 方法RM1GG亦包括計算音訊信號之合成延遲輪廟的任務 RT2〇、自所產生之殘餘物選擇偏移訊框的任務rt3〇、基 f
於來自選定偏移訊框及延遲輪廊之資訊計算時間偏移的: 務T40 &基於所#算之時間偏移修改當前訊框之殘餘物 的任務RT50。 圖11况明RCELP編碼方法RMl〇〇之實施RMu〇的流程 圖方法RM110包括時間偏移計算任務RT40之實施 似2。任務RT42包括:任務RT60,其將先前子訊框之修 改殘餘物映射至當前子訊框之合成延遲輪廓;任務RT70, 其產生暫時經修改殘餘物(例如,基於選定偏移訊框);及 務RT80其更新時間偏移(例如,基於暫時經修改殘餘 物與經映射之過去經修改殘餘物之相應區段之間的相關 I·生)方法RM1GG之實施可包括於方法M1Q之實施内(例 如’包括於編碼任務则内),且如上文所述,邏輯元件 (例如’邏輯問)之陣列可經組態以執行該方法之各種任務 中的一者、一者以上乃至全部。 圖 12 a 說明 R c E L P 旬 始 σε ,>1 a框編碼窃34c之實施Rcl〇〇的方塊 =編碼器RC1〇〇包括:殘餘物產生器㈣,其經組態以 计异虽前訊框之殘餘物(例如,基於Lpc分析操作);及延 132262.doc -39· 200912897 遲輪廟計算IIR2G ’其經組態以計算音訊信號si⑼之合成 延遲輪廓(例如,基於當前及最近基頻估計)。編碼器 RCHK)亦包括:偏移訊框選擇器R3〇,其經組態以選擇當 前殘餘物之偏移訊框;日寺間偏移計算器R4〇,其經組態: 計算時間偏移(例 >,基於暫時經修改殘餘物來更新時間 偏移及殘餘物修改器R5G,其經組態以根據時間偏移修 改殘餘物(例如,將所計算之時間偏移應用於殘餘物之對 應於偏移訊框的區段)。 圖1 2b說明RCELP編碼器RC丨〇〇之實施Rc丨丨〇的方塊圖, 實施RC110包括時間偏移計算器R4〇之實施R42。計算器 R42包括:過去經修改殘餘物映射器R6〇,其經組態以將 先則子訊框之經修改殘餘物映射至當前子訊框之合成延遲 輪廓;暫時經修改殘餘物產生器R7〇 ’其經組態以基於選 定偏移訊框產生暫時經修改殘餘物;及時間偏移更新器 R80,其經組態以基於暫時經修改殘餘物與經映射之過去 經修改殘餘物之相應區段之間的相關性來計算(例如,更 新)時間偏移。編碼器尺匚丨⑻及尺以⑺之元件中的每一者可 由相應模組(諸如,一組邏輯閘及/或由一或多個處理器執 行之指令)實施。多模式編碼器(諸如,音訊編碼器AE20) 可包括編碼器RCl〇〇之執行個體或其實施,且在此狀況 下,可與經組態以執行其他編碼模式之訊框編碼器共用 RCELP訊框編碼器之元件中的一或多者(例如,殘餘物產 生器R10)。 圖13說明殘餘物產生器R1〇之實施R12的方塊圖。產生 132262.doc •40· 200912897 益R12包括LPC分析模組21〇,其經組態以基於音訊信號 SH)〇之當前訊框計算LPC係數值之集合1換區塊22〇經 組態以將LPC係數值之該集合轉換為LSF之集合,且量化 器230經組態以量化LSF(例如,作為一或多個碼薄素引)以 產生LPC參數SL10。逆量化器24〇經組態以自經量化之Lpc 參數S L1 0獲得一组經解踩夕τ e r? _ 、工解碼之LSF,且逆變換區塊250經組 態以自該組經解碼之LSF獲得經解碼之Lpc係數值之集 〇
合。根據經解碼之LPC係數值的該集合組態的白化渡波器 260(亦稱作分析濾波器)處理音訊信號si〇〇以產生Lpc殘餘 物SR10 〇亦可根據視為適合於特定應用之任何其他設 實施殘餘物產生器R 1 〇。 當時間偏移之值自一偏移訊框至另一偏移訊框改變時, 間隙或重疊可在偏移訊框之間的邊界處發生,且可能需要 殘餘物修改HR50或任務RT5G錢當情況下重複或省略此 區域中之信號的部分。亦可能需要實施編碼器rci〇〇或方 法RM100以將修改殘餘物儲存至緩衝器(例如,作為產生 用於對隨後訊框之殘餘物執行分段修改程序之目標殘餘物 的來源)。此緩衝器可經配置以將輸人提供至時間偏移計 算器㈣(例如,至過去經修改殘餘物映射器R60)或至時間 偏移片算任務RT40(例如,至映射任務RT6〇)。 圖12c說明RCELP編碼器Rci〇〇之實施rci〇5的方塊圖, =實施RC105包括此修改殘餘物緩衝器R9〇及時間偏移計 算R40之實施R44,該實施R44經組態以基於來自緩衝器 ㈣之資訊計算時間偏移。圖⑶說明RCELP編碼器Rci〇D5 132262.doc -41 . 200912897 及RCELP編碼|§RCll〇之實施尺匸丨^的方塊圖,該實施 RC1/ 5包括緩衝器R9〇之執行個體及過去經修改殘餘物映 射器R60之實施R62,該實施R62經組態以自緩衝器r9〇接 收過去經修改殘餘物。 圖14 5尤明用於音訊信號之訊框之RCELP編碼之裝置 RF100(例如,裝置F10之構件叩3〇的1^(^1^實施)的方塊 圖。裝置RF100包括用於產生殘餘物(例如,Lpc殘餘物)之 構件RF1 〇及用於叶算延遲輪廓(例如,藉由在當前基頻估 4與先剛基頻估計之間執行線性或雙線性内插)之構件 RF20。裝置RFi00亦包括用於選擇偏移訊框(例如,藉由定 位下一基頻脈衝)之構件RF3〇、用於計算時間偏移(例如, 藉由根據暫時經修改殘餘物與經映射之過去經修改殘餘物 之間的相關性更新時間偏移)之構件RF4〇,及用於修改殘 餘物(例如’藉由時間偏移殘餘物之對應於偏移訊框的區 段)之構件RF50。 經修改殘餘物通常用以計算當前訊框之激勵信號的固定 碼薄基值。圖15說明RCELP編碼方&RM1〇〇之實施尺^^⑶ 的流程圖,該實施RM120包括額外任務以支援此操作。任 務RT90扭曲自適應碼薄("ACB"),其藉由將其映射至延遲 輪廓而保留來自先前訊框之經解碼之激勵信號的複本。任 務RT100將基於當前LPC係數值之LPC合成濾波器應用於經 扭曲之ACB以獲得感知域中之ACB基值,且任務rt 11 0將 基於當前LPC係數值之LPC合成濾波器應用於當前經修改 殘餘物以獲得感知域中之當前經修改殘餘物。可能需要任 132262.doc -42- 200912897 務RT1 00及/或任務RT11 〇應用基於加權LPC係數值之集合 之LPC合成滤波器’如(例如)上文所提及之3〇ρρ2 EVRC文 件(1;.80014-(1:的第4.11.4.5節(4-84至4-86頁)中所描述。任 務RT 120計算兩個感知域信號之間的差以獲得固定碼簿 ("FCB")搜尋之目標’且任務RT130執行fcB搜尋以獲得激 勵信號之FCB基值。如上文所述,邏輯元件(例如,邏輯 閘)之陣列可經組態以執行方法RM 1〇〇之此實施之各種任 務中的一者、一者以上乃至全部。 包括RCELP編碼方案之現代多模式編碼系統(例如,包 括曰成編碼斋AE25之實施的編碼系統)將通常亦包括一咬 多個非RCELP編碼方案,諸如雜訊激勵線性預測 (NELP")’其通常用於無聲訊框(例如,口頭摩擦音)及僅 含有背景雜訊之訊框。非RCELP編碼方案之其他實例包括 原型波形内插("PWI”)及其變型(諸如,原型基頻週期 ("PPP”)),其通常用於高聲訊框。當RCELp編碼方案用以 編碼音訊信號之訊框,且非RCELP編碼方案用以編碼音訊 L號之鄰近訊框時,不連續性可出現於合成波形中係可能 的。 可能需要使用來自鄰近訊框之樣本來編碼訊框。以此方 式跨越訊框邊界編碼傾向於減少假影之感知效應,該等假 影歸因於諸如量化誤差、截斷、捨入、廢除多餘係數及其 類似物之因素而可能出現於訊框之間。此編碼方案之一實 例為修改型離散餘弦變換("MDCT")編碼方案。 MDCT編碼方案為非PR編碼方案,其通常用以編碼音樂 132262.doc • 43 - 200912897 及八他非話音聲音。舉例而言,如國際標準化組織(ISO)/ 國際電工委員會(IEC)文件亦已知為腳EG_4 之第3 °p刀)中規定之高級音訊編碼解碼器("AAC")為MDCT 、爲碼方案。上文所提及之3GPP2 EVRC文件C.SOOU-C的第 4.13郎(4-145至4-151頁)描述另一MDCT編碼方案,且此節 以引用的方式併入本文中作為一實例eMDCT編碼方案將 頻域中之音訊信號編碼為正弦波之混合物,而非編碼為信 號(其結構係基於基頻週期)’且更適於編碼歌聲、音樂及 正弦波之其他混合物。 MDCT編瑪方案使用在兩個或兩個以上連續訊框上延伸 (亦即’重疊兩個或兩個以上訊框)的編碼窗。對於Μ之訊 框長度,MDCT基於2Μ個樣本之輸入產生μ個係數。因 此’MDCT編碼方案之—特徵在於其允許變換窗在一或多 個訊框邊界上延伸而不增加表示經編碼之關所需 係數的數目。㈣,當此重疊編碼方案心編碼 吏 用PR編碼方案編碼之訊框的訊框時, 、又 應經解碼之訊框中。 以續性可出現於相 Μ個MDCT係數之計算可經表達為: 2Μ-1 X{k)= ^x{n)hk{n) 肛0 (EQ. i) 其中
(2n + M + l)(2k + \^' hk(n) = w(n\j~r: cos
AM (EQ. 2) 132262.doc -44- 200912897 k=0 ' 1.....M_1。函數w(n)通常經選擇為滿足條件 w2⑻+ w2〇 + M) = l(亦稱作 Princen-Bradley條件)之窗。 相應逆MDCT運算可經表達為: Λ/-1 (EQ. 3) x(n)= k=0 n=0、1.....顶-1,其中化)為M個所接收2MDCT係數 且為2M個經解碼之樣本。 圖16說明MDCT編碼方案之典型正弦窗形狀的三個實 例。滿足Princen-Bradley條件之此窗形狀可經表達為 w(n) = sin ηπ 2Μ (EQ. 4) 0“<2M ’其中n = 〇指示當前訊框之第一樣本。 如圖中所示,用以編碼當前訊框(訊框卩)之MDCT窗 在訊框P及訊框(p+1)上具有非零值,且在其他方面為零 值。用以編碼先前訊框(訊框(ρ_υ)2ΜΕ)(:τ窗8〇2在訊框 (Ρ-1)及訊框ρ上具有非零值,且在其他方面為零值,且用 以編碼隨後訊框(訊框(ρ +】))之MDCT窗8〇6經類似地配置。 在解碼H處,經解碼之序列以與輸人序列相同之方式經重 且且,.垄相加。圖25a說明由應用圖16中所示之窗8〇4及8〇6 產生之重疊相加區域的—實例。重疊相加操作消除由變換 引入之誤差且允許理想的重建(當w(n)滿足princen-Bradley 條件且不存在量化誤差時)。儘管mdct使用重曼窗函數, 仁其為經精禮·取樣之濾波器組,因為在重疊相加後,每一 132262.doc •45- 200912897 訊框輸入樣本之數目與每一訊框MDCT係數之數目相同。 圖17a s兒明MDCT訊框編碼器34d之實施ME1 〇〇的方塊 圖。殘餘物產生器Dl〇可經組態以使用經量化之Lpe參數 (例如,經量化之LSP,如上文以引用的方式併入之3Gpp2 EVRC文件C.S0014_C之第413節的第4 i3 2部分中所描述) 產生殘餘物。或者,殘餘物產生器D10可經組態以使用未 绞量化之LPC參數產生殘餘物。在包括RCELp編碼器 RC100及MDCT編碼器ME100之實施的多模式編碼器中, 殘餘物產生器R10及殘餘物產生器Di〇可實施為同一結 構。 編碼器ME100亦包括MDCT模組D20,其經組態以計算 MDCT係數(例如,根據上文在EQ.丨中所陳述之關於禅)的 表達式)°編碼器ME 100亦包括量化器D30,其經組態以處 理MDCT係數而產生經量化之編碼殘餘物信號S3〇。量化 器D3 0可經組態以使用精確的函數計算執行MDCT係數之 因數編碼。或者,量化器D30可經組態以使用(例如)在u,
Mittel 等人之,1Low Complexity Factorial Pulse Coding 〇f MDCT Coefficients Using Approximation of Combinatorial Functions," IEEE IC AS SP 2007,1-2 89 至 1-292 頁及在上文以 引用的方式併入之3GPP2 EVRC文件C.S0014-C之第4 13節 的第4.13.5部分中所描述的適當函數計算來執行mdct係 數之因數編碼。如圖17a中所示,MDCT編碼器ME1〇〇亦可 包括可選逆MDCT("IMDCT")模組D40,其經組態以基於經 量化之信號計算經解碼之樣本(例如,根據上文在EQ 3中 132262.doc •46· 200912897 所陳述之關於;C⑻的表達式)。 在-些狀況下,可能需要對音訊信號S10 S100之殘餘物執行MDCT運算 L唬 連异儘管LPC分析良好地適於 編碼人類話音之共振,伸装斟 、派仁其對於編碼非話音信號(諸如, 音樂)之特徵可能並不同樣有汾。 U锒有效。圖Pb說明MDCT訊框編 碼器34d之實施ME200的方塊圖,且 τ MDCT板組D20經组 態以接收音訊信號S100之訊框作為輸入。 、 Γ 圖16中所示之標準MDCT重疊方案需要在可執行變換之 前可用的2M個樣本。此方案在編碼系統上有效地強加加 個樣本之延遲約束(亦即’當前訊框之M個樣本加上Μ個預 看(lookahead)樣本)。多模式編碼器之其他 如,CELP、RCELP、狐P、PWI及/或ppp)通常經組^ 對較短延遲約束(例如,t前訊框之M個樣本加上、 M/3或M/4個預看樣本)操作。纟現代多模式編碼器⑽如, 請C、SMV、AMR)中,在編碼模式之間切換可經自動地 執行且可甚至在單一秒中發生若干次。尤其對於可能需要 包括編碼器以在特定速率下產生封包之傳輸器的電路交換 應用而言,可能需要此編碼器之編碼模式在同一延遲下操 作。 、 圖18說明可由MDCT模組D2〇應用以允許短於肘之預看時 間間隔之窗函數w(n)(例如,代替圖16中所說明之函數 w(n))的一實例。在圖18中所示之特定實例令預看時間 間隔為M/2個樣本長,但可實施此技術以允許L個樣本之任 意預看,其中L具有〇至肘之任何值。在此技術中(其實例 132262.doc 47- 200912897 描述於上文以引用的方式併入之3GPP2 EVRC文件 (:.80014-〇之第4.13節的第4.13.4部分(4-147頁)中及標題為 "SYSTEMS AND METHODS FOR MODIFYING A WINDOW WITH A FRAME ASSOCIATED WITH AN AUDIO SIGNAL" 之美國公開案第2008/0027719號中),MDCT窗以長度(M-L)/2之零填補區域開始及結束,且w(n)滿足Princen-Bradley條件。此窗函數之一實施可經表達如下:
w{n)
0<η< π f m-l\ M-L _2L C 2 乂 1, 2 <η 3M-L ~2~ M + L ~Τ 3M-L <
M-L~ΪΓ M + L
2L 3L + η — 〇, <
2 3M-L ~2~ 3M + L (EQ. 5) 2 3M + L ~2~ 2
<n< 2M 其中„ = 為當前訊框p之第一樣本且n = 3-~-L為下一訊框 (p +1)之第一樣本。根據此技術編碼之信號保持理想的重
建性質(不存在量化及數字誤差)。應注意對於L=M的狀 況,此窗函數與圖16中所說明之窗函數相同,且對於L=0 的狀況,w(n)=l(|“<^·)且在別處為零以使得不存在重 疊。 在包括PR及非PR編碼方案之多模式編碼器中,可能需 要確保合成波形跨越訊框邊界為連續的,在該訊框邊界處 當前編碼模式自PR編碼模式切換至非PR編碼模式(或反之 亦然)。編碼模式選擇器可在一秒中自一編碼方案切換至 132262.doc -48- 200912897 另一編碼方案若干次,且需要在 在彼專方案之間提供感知上 平滑的過渡。不幸地,橫跨調整 r π堂讯框與未調整訊框之間的 邊界之基頻週期可為顯著大哎,的 次小的,以使得PR編碼方案與 非PR編碼方案之間的切換可在 '、 、,解碼之k唬中產生可聞卡 搭聲或其他不連續性。另外’如上文所述,㈣編碼方幸 可使用在連續訊框上延伸之重疊相加窗來編碼音訊信號之 訊框’且可能需要避免在彼等 做寺運續訊框之間的邊界處時 偏移之變化。在此等狀況下 J月匕為要根據由pR編碼方案應 用之時間偏移來修改未調整訊框。 ^〜 圖19a說明根據通用組態處理音訊信號之訊框之方法 程⑽包括任務tug,其根㈣編碼 方案(例如,RCELP編碼方案)編碼第—訊框。方法μ⑽亦 包括任務Τ2Π),其根據物編石馬方案(例如,默丁編碼 方案)編碼音訊信號之第二訊框。如上文所述,第一訊框 及第二訊框中之一者或兩者可在此編碼之前及/或之後經 感知加權及/或以其他方式加以處理。 任務tuo包括子任務T12〇,其根據時間偏移丁時間修改 第一^號之區段,其中第-信號係基於第-訊框(例如, 第L號為第-訊框或第一訊框之殘餘物)。可藉由時間 偏移或藉由時間扭曲來執行時間修改。在一實施中,任務 W0藉由根據Τ值在時間上向前或向後地移動整個區段(亦 相對於訊框或音訊信號之另一區段)來時間偏移區 ,。此操作可包括内插樣本值以執行部分時間偏移。在另 一實施t ’任務T120基於時間偏移τ來時間扭曲區段。此 132262.doc •49- 200912897 操作可包括根據τ值移動區段之一樣本(例 >,第—樣本 及使區段之另一樣本(例如,最後樣本)移動-值,該值呈 有小於Τ之量值的量值。 八
任務Τ2Η)包括子任務T22G,其根據時間偏移了時間修改 第二信號之區段’纟中第二信號係基於第二訊框(例如, 第二信號為第二訊框或第二訊框之殘餘物)。在一實施 中’任務T220藉由根射值在時間上向前或向後地移動= 個區段(亦即,相對於訊框或音訊信號之另-區段)來時間 偏移區段。此操作可包括内插樣本值以執行部分時間偏 移在3實把中,任務丁22〇基於時間偏移丁來時間扭曲 區段。此操作可包括將區段映射至延遲輪廓。舉例而今, 此操作可包括根據Τ值移動區段之一樣本(例如,第一樣 本)及使區段之另—樣本(例如’最後樣本)移動一值,該值 具有小於τ之量值的量值。舉例而言,任務τΐ2〇可藉由將 其映射至已被縮短時間偏移Τ之值(例如,在Τ之負值的狀 兄下使變長)的相應時間間隔來時間扭曲訊框或其他區 段’在此狀況下,可在經扭曲之區段的末端將丁值重設為 任務Τ220所日㈣修改之區段可包括整個第二信號,或該 區段可為該信號之較短邱八 一 、平X短部分,啫如殘餘物之子訊框(例 如,初始子訊框)。通常任務Τ220(例如,在音訊信號議 之通LPC滤》皮之後)時間修改非量化殘餘物信 號之區段,諸 如圖17a中所示之殘餘物 T220亦可經實施以(例如 產生器D10的輸出。然而,任務 ,在MDCT-IMDCT處理後)時間修 132262.doc -50- 200912897 =解碼之殘餘物的區段’諸如圖17a中所示之信號州, 或音訊信號S 1 00之區段。 可能需要時間偏移丁為用以修改第一信號之
移:舉例而言’時間偏移τ可為應用於第—訊框之殘餘物 之最後時間偏移區段的時間偏移及/或由累積時間 最新近更新產生的值aRCELP編碼器RC⑽之實施可^且 =以執行任務TU0,在此狀況下,時間偏移τ可為在編碼 Λ框期間由區塊R40或區塊R80計算的最後時間偏移 值。 圖19b說明任務T11〇之實施7112的流程圖。任務η。包 括子任務Τ130,其基於來自先前子訊框之殘餘物(諸如, 最新近子訊框之修改殘餘物)的資訊而計算時間偏移。如 上文所論述’可能需要RCELp編碼方案產生基於先前子訊 框之修改殘餘物的目標殘餘物及根據選定偏移訊框與目標 殘餘物之相應區段之間的匹配來計算時間偏移。 圖1 9c忒明任務τ 11 2之實施τ 114的流程圖,該實施τ丨i 4 包括任務T130之實施T132。任務T132包括任務τΐ4〇,其 將先前殘餘物之樣本映射至延遲輪廓。如上文所論述,可 月匕㈤要RCELP編碼方案藉由將先前子訊框之經修改殘餘物 映射至當前子訊框之合成延遲輪廓而產生目標殘餘物。 可能需要組態任務Τ210以時間偏移第二信號以及隨後訊 框之任何部分,該部分用作編碼第二訊框之預看。舉例而 言,可能需要任務Τ210將時間偏移Τ應用於第二(非pR)訊 框之殘餘物且亦應用於隨後訊框之殘餘物的任何部分,該 132262.doc -51 - 200912897 部分2作編碼第二訊框之預看(例如,如上文參看mdct&
重且®所描述)。亦可旎需要組態任務T2丨〇以將時間偏移T 應用於使用非PR編碼方案(例如,MDCT編碼方案)編碼之 任何隨後連續訊框的殘餘物,且應用於對應於此等訊框之 任何預看區段。 圖25b說明兩個PR訊框之間的非pR訊框序列中之每一者 係藉由應用於第一 PR訊框之最後偏移訊框的時間偏移進行 偏移之實例。在此圖中,實線指示原始訊框隨時間之位 置,虛線指不訊框之偏移位置,且點線展示原始邊界與偏 移邊界之間的對應。較長垂直線指示訊框邊界,第一短垂 直線指不第一 PR訊框之最後偏移訊框的開始(其中峰值指 不偏移訊框之基頻脈衝),且最後短垂直線指示序列之最 後非PR訊框之預看區段的結束。在一實例中,pR訊框為 RCELP訊框,且非PR訊框為河1)(::丁訊框。在另一實例中, PRsfL框為RCELP訊框,一些非卩尺訊框為河1)(:丁訊框,且其 他非PR訊框為NELP或PWI訊框。 方法M100可適合於無基頻估計可用於當前非pR訊框之 狀況。然而,即使基頻估計可用於當前#pR訊框,亦可能 需要執行方法Μ1 00。在涉及在連續訊框之間重疊與相加 (諸如,具有MDCT窗)的非PR編碼方案中,可能需要使連 續訊框、任何相應預看及訊框之間的任何重疊區域偏移同 一偏移值。此一致性可有助於避免重建的音訊信號之品質 的降級。舉例而言,可能需要對促成重疊區域(諸如’ MDCT 1¾ )之訊框的兩者使用同一時間偏移值。 132262.doc -52- 200912897 圖20a說明MDCT編碼器MEl〇〇之實施me】i 〇的方塊圖。 編碼器M E i i 0包括時間修改器τ M】〇,其經配置以時間修 改由殘餘物I生器D10產生之殘餘物信號的區段以產生經 日寺間修改之殘餘物信號S20。在—實施中,_間修改器 Ml 0經組態以藉由根據τ值向前或向後地移動整個區段來 1 肖間偏移區段°此操作可包括内插樣本值以執行部分時間 . 丨移。在另-實施中,時間修改器TM10經組態以基於時 Μ偏移T時間扭曲區段。此操作可包括將區段映射至延遲 輪廓。舉例而言,此操作可包括根據Τ值移動區段之一樣 本(例如,第一樣本)及使另一樣本(例如,最後樣本)移動 一值,該值具有小於τ之量值的量值。舉例而言,任務 Τ120可藉由將其映射至已被縮短時間偏移τ之值(例如,在 Τ之負值的狀況下使變長)的相應時間間隔來時間扭曲訊框 或其他區段,在此狀況下,可在經扭曲之區段的末端將丁 值重設為零。如上文所述,時間偏移τ可為由1>尺編碼方案 Q 最近應用於經時間偏移區段之時間偏移及/或藉由PR編碼 方案由累積時間偏移之最近更新產生的值。在包括RCELp 編碼器RC105及MDCT編碼器ME110之實施的音訊編碼器 AE10之實施中,編碼器ME丨丨〇亦可經組態以將經時間修改 - 殘餘物信號S20儲存至緩衝器R9〇。 圖20b說明MDCT編碼器ME200之實施ME210的方塊圖。 編碼器ME200包括時間修改器TM10之執行個體,其經配 置以時間修改音訊信號S 100之區段來產生經時間修改之音 訊信號S25。如上文所述,音訊信號81〇〇可為經感知加權 132262.doc •53· 200912897 及/或以其他方式經濾波的數位信號❶在包括RCELP編碼 器RCl〇5及MDCT編碼器ME210之實施的音訊編碼器AE1〇 之實施中,編碼器ME2 1 0亦可經組態以將經時間修改之殘 餘物信號S20儲存至緩衝器R90。 圖213說明包括雜訊注入模組1)50之1^〇(:丁編碼器]^£11〇 之實施ME120的方塊圖。雜訊注入模組〇5〇經組態以在預 定頻率範圍内用雜訊替代經量化編碼殘餘物信號S3〇之零 值元素(例如’根據如上文以引用的方式併入之3Gpp2 EVRC文件C.S0014-C之第4.13節的第4.13.7部分(4-150頁) 中所描述的技術)。此操作可藉由減少在欠模型化 (imdermodeling)殘餘物線譜期間可能發生之音調假影的感 知而改良音訊品質。 圖2113說明河0(:1\編碼器1^丑110之實施1^£130的方塊圖。 編碼器ME 130包括共振峰強調模組D60,其經組態以執行 殘餘物信號S20之低頻共振峰區域的感知加權(例如,根據 如上文以引用的方式併入之3GPP2 EVRC文件C.S0014-C之 第4,13節的第4·13·3部分(4-147頁)中所描述的技術);及共 振岭解強調(formant deemphasis)模組D70,其經組態以移 除感知加權(例如,根據如3GPP2 EVRC文件C.S0014-C之 第4.13節的第4.13.9部分(4-151頁)中所描述的技術)。 圖22說明MDCT編碼器ME120及ME130之實施ME140的 方塊圖。MDCT編碼器MD 11〇之其他實施可經組態以在殘 餘物產生器D10與經解碼之殘餘物信號S4〇之間的處理路徑 中包括一或多個額外操作。 132262.doc -54- 200912897 圖23a說明根據通用組態之音訊信號河1^1〇〇之訊框的 MDCT編碼之方法(例如’方法M1〇之任務〇的湘^實 施)的流程圖。方法MM1〇〇包括產生訊框之殘餘物的任務 MT10。任務MT10通常經配置以接收經取樣音訊信號(其可 經預處理)(諸如,音訊信號sl〇〇)之訊框。任務mti〇通常 經實施以包括線性預測編碼(”Lpc”)分析操作且可經組態 以產生諸如線譜對(”Lsp")之Lpc參數之集合。任務mti〇 亦可包括其他處理操作,諸如一或多個感知加權及/或其 他渡波操作。 方法ΜΜ100包括時間修改所產生之殘餘物的任務 ΜΤ20。在一實施中,任務ΜΤ2〇藉由時間偏移殘餘物之區 段、根據Τ值向前或向後地移動整個區段而時間修改殘餘 物。此操作可包括内插樣本值以執行部分時間偏移。在另 一實施中,任務ΜΤ20藉由基於時間偏移Τ時間扭曲殘餘物 之區段而時間修改殘餘物。此操作可包括將區段映射至延 遲輪廓。舉例而言,此操作可包括根據Τ值移動區段之一 樣本’第-樣本)及使另一樣本(例如,最後樣本)移 動-值:該值具有小於τ之量值。時間偏移T可為由叹編 碼方案最近應用於,經時間㉟#區段之時間偏移及/或藉由 PR編碼方案由累積時間偏移之最近更新產生的值。在包括 RCELP編碼方法RM100及MDCT編碼方法MM1 〇〇之實施的 編碼方法M10之實施中,任務MT2〇亦可經組態以將經時間 t改之殘餘物信號S2〇儲存至經修改殘餘物緩衝器(例如, 可能由方法RM1G0用以產生下—訊框之目標殘餘物)。 132262.doc -55- 200912897 方法MMl 00包括任務MT30,其(例如,根據上文所陳述 之關於X(A〇的表達式)對經時間修改殘餘物執行MDCT運算 以產生MDCT係數之集合。任務MT30可應用如本文所描述 (如圖16或圖18中所示)之窗函數w(n)或可使用另一窗函數 ' 或演算法以執行MDCT運算。方法MM40包括任務MT40, , 其使用因數編碼、組合近似法、截斷、捨入及/或視為適 合於特定應用之任何其他量化操作來量化MDCT係數。在 此實例中,方法MM100亦包括可選任務MT50,其經組態 f》 以對經量化係數執行IMDCT運算以獲得經解碼之樣本之集 合(例如,根據上文所陳述之關於2⑻的表達式)。 方法MM100之實施可包括於方法M10之實施内(例如, 在編碼任務TE30内),且如上文所述,邏輯元件(例如,邏 輯閘)之陣列可經組態以執行方法之各種任務中的一者、 一者以上乃至全部。對於方法M10包括方法MM100及方法 RM100之兩者之實施的狀況,殘餘物計算任務RT10與殘餘 物產生任務MT10可共用共同操作(例如,可僅在LPC操作 之次序上不同)或可甚至被實施為同一任務。 圖23b說明用於音訊信號之訊框的MDCT編碼之裝置 MF100(例如,裝置F10之構件FE30的MDCT實施)的方塊 圖。裝置MF100包括用於產生訊框之殘餘物的構件 FM10(例如,藉由執行上文所描述之任務MT10的實施)。 裝置MF 1 00包括用於時間修改所產生之殘餘物的構件 FM20(例如,藉由執行上文所描述之任務MT20的實施)。 在包括RCELP編碼裝置RF100及MDCT編碼裝置MF100之實 132262.doc -56- 200912897 施的編碼裝置F10之實施中,構件FM2〇亦可經組態以將經 時間修改之殘餘物信號S20儲存至經修改殘餘物緩衝器(例 如,可能由裝置RF100用以產生下一訊框之目標殘餘物)。 裝置MF100亦包括用於對經時間修改殘餘物執行mdct運 算以獲彳于MDCT係數之集合之構件FM3〇(例如,藉由執行 上文所描述之任務MT30的實施)及用於量化MDCT係數之 構件FM4G(例如,H由執行±文所描述之任務Μτ4〇的實 施)。裝置MF100亦包括用於對量化係數執行mDCT運算 之可選構件FM50(例如,藉由執行上文所描述之任務 MT50) 〇 圖24a說明根據另一通用組態處理音訊信號之訊框之方 法M200的流程圖。方法M2〇〇之任務T51〇根據非pR編碼方 案(例如,MDCT編碼方案)編碼第一訊框。方法Μ2〇〇之任 務Τ610根據PR編碼方案(例如,RCELp編碼方案)編碼音訊 信號之第二訊框。 任務T510包括子任務T52〇,其根據第一時間偏移τ時間 修改第一信號之區段’其中第一信號係基於第一訊框(例 如,第一信號為第一(非PR)訊框或第一訊框之殘餘物)。 在一實例中,時間偏移Τ為如在RCELp編碼音訊信號中先 於第一訊框的訊框期間計算之所累積時間偏移的值(例 如,經最後更新之值)。任務T520所時間修改之區段可包 括整個第一信號’或該區段可為該信號之較短部分,諸如 殘餘物之子訊框(例如,最後子訊框)。通常任務Τ520時間 修改非量化殘餘物信號(例如,在音訊信號s丨之逆[pc濾 132262.doc -57- 200912897 波後)’諸如圖17a甲所示之殘餘物產生器〇1〇的輸出。然 而,任務T520亦可經實施以時間修改經解碼之殘餘物的區 段(例如,在MDCT_IMDCT處理後),諸如圖i7a中所示之 信號S40 ’或音訊信號S100之區段。 在一實施中,任務丁520藉由根據T值在時間上向前或向 後地移動整個區段(亦即,相對於訊框或音訊信號之另— 區段)來時間偏移區段。此操作可包括内插樣本值以執行 部分時間偏移。在另一實施中,任務丁52〇基於時間偏移丁 來時間扭曲區段。此操作可包括將區段映射至延遲輪廓。 舉例而言,此操作可包括根據T值移動區段之一樣本(例 如,第一樣本)及使區段之另一樣本(例如,最後樣本)移動 一值,該值具有小於τ之量值的量值。 任務Τ520可經組態以將經時間修改之信號儲存至緩衝器 (例如,至經修改殘餘物緩衝器)以可能由下文所描述之任 務Τ620使用(例如,以產生下一訊框之目標殘餘物)。任務 Τ520亦可經組態以更新1^編碼任務之其他狀態記憶體。 任務Τ520之一此實施將經解碼之量化殘餘物信號(諸如, 經解碼之殘餘物信號S4〇)儲存至自適應碼薄("Acb")記憔 體及1>尺編碼任務(例如,RCELP編碼方法RM12〇)之零輪入 回應濾波器狀態。 〜 任務T6 1 0包括子任務T620, ,其基於來自經時間修改區段
例而言,PR編碼方案可為RCELp編碼方案, 二訊框之殘餘物)。舉 3方案,其經組態以藉 132262.doc -58- 200912897 由使用第一訊框之殘餘物(包括經時間修改(例如,經時間 偏移)區段)代替過去經修改殘餘物來編碼上文所描述之第 二訊框。 在一實施中,任務T620藉由在時間上向前或向後地移動 整個區段(亦即,相對於訊框或音訊信號之另一區段)而將 第二時間偏移應用於區段。此操作可包括内插樣本值以執 订部分時間偏移。在另一實施中,任務T62〇時間扭曲區 段,其可包括將區段映射至延遲輪廓。舉例而言,此操作 可包括根據時間偏移來移動區段之一樣本(例如,第一樣 本)及使區段之另一樣本(例如,最後樣本)移動較小時間偏 移。 圖24b說明任務Τ62〇之實施Τ622的流程圖。任務τ622包 括子任務Τ630,其基於來自經時間修改區段之資訊計算第 一時間偏移。任務Τ622亦包括子任務Τ64〇 ,其將第二時間 偏移應用於第二信號之區段(在此實例中,應用於第二訊 框之殘餘物)。 圖24c說明任務Τ62〇之實施Τ624的流程圖。任務τ624包 括子任務丁650,其將經時間修改區段之樣本映射至音訊信 號之延遲輪廓。如上文所論述,可能需要RCELP編碼方案 藉由將先前子訊框之經修改殘餘物映射至#前子訊框之^ 成延遲輪摩而產生目標殘餘物。在此狀況下,RcELp編: 方案可經組態以藉由產生基於第_(#RCELp)訊框之殘餘 物(包括時間修改區段)的目標殘餘物而執行任務τ65〇。、 舉例而言,此RCELP編碼方案可經組 132262.doc -59- 200912897 (非RCELP)訊框之殘餘物(例如,經時間修改區段)映射至 當前訊框之合成延遲輪廓而產生目標殘餘物。RCELP編碼 方案亦可經組態以基於目標殘餘物計算時間偏移,及使用 經計算之時間偏移以時間扭曲第二訊框的殘餘物,如上文 所論述。圖24d說明任務T622及T624之實施T626的流程 圖,該實施T626包括任務T650、任務T630之實施T632(基 於來自經時間修改區段之經映射樣本的資訊計算第二時間 偏移)及任務Τ640。 如上文所述’可能需要傳輸及接收具有超過約300-3400 Hz之PSTN頻率範圍之頻率範圍的音訊信號。用於編碼此 信號之一方法為"全頻帶”技術,其編碼整個擴展頻率範圍 作為單一頻帶(例如’藉由定標PSTN範圍之編碼系統以覆 蓋擴展頻率範圍)。另一方法為外推來自PSTN信號之資訊 至擴展頻率範圍中(例如,基於來自PSTN範圍音訊信號之 資訊外推高於PSTN範圍之高頻帶範圍的激勵信號)。另一 方法為”分割頻帶”技術,其單獨地編碼在PSTN範圍外之音 訊信號的資訊(例如,諸如3500-7000 Hz或3500-8000 Hz之 高頻帶頻率範圍的資訊)。可在諸如標題為"丁1\1£-WARPING FRAMES OF WIDEBAND VOCODER”之美國公 開案第 2008/0052065 號及標題為"SYSTEMS, METHODS, AND APPARATUS FOR HIGHBAND TIME WARPING"之美 國公開案第2006/0282263號的文件中發現分割頻帶PR編碼 技術之描述。可能需要擴展分割頻帶編碼技術以在音訊信 號之窄頻帶及高頻帶部分兩者上包括方法Ml 00及/或M200 132262.doc -60- 200912897 之實施。 方法M100及/或M200可執行於方法^10之實施内。舉例 而言’任務T110及T210(類似地,任務丁51〇及丁61〇)可由如 方法Μ10執行之任務ΤΕ3 0之連續迭代執行以處理音訊信號 S100之連續訊框。方法Μ100及/或]VI200亦可由裝置Fi〇及/ 或裝置ΑΕ10之實施(例如,裝置ΑΕ2〇4αΕ25)執行。如上 文所述’此裝置可包括於攜帶型通信器件(諸如,蜂巢式 電活)中。此等方法及/或裝置亦可實施於基礎結構設備(諸 如,媒體閘道器)中。 提供所述組態之以上陳述以使任何熟習此項技術者能夠 製造或使用本文所揭示之方法及其他結構。本文所展示並 描述之流程圖、方塊圖、狀態圖及其他結構僅為實例,且 此等結構之其他變型亦處於本揭示内容之範疇内。對此等 組態之各種修改為可能的,且本文中所呈現之一般原理亦 可應用於其他組態。因此,本揭示内容不欲限於上文所展 不之組態,而與在本文中以任何方式揭示之原理及新穎特 徵最廣泛地一致,包括於所申請之附加申請專利範圍中, 該等申請專利範圍形成原始揭示内容之一部分。 除上文所提及之EVRC及SMV編碼解碼器以外,可與本 文中所描述之話音編碼器、話音編碼方法、話音解碼器及/ 或話音解碣方法一起使用或經調適一起使用的編碼解碼器 之實例包括如文件ETSI TS 126 092 V6.〇.〇(歐洲電信標準 化協會(ETSI"),SoPhia Antipolis Cedex,FR,2004 年 12 月) 中所描述的自適應多速率("AMR")話音編碼解碼器;及如 132262.doc 200912897 文件 ETSI TS 126 192 V6.0.0(ETSI, 2004 年 12 月)中所描述 的AMR寬頻帶話音編碼解碼器。 熟習此項技術者應理解,可使用多種不同技術及技藝之 任一者來表示資訊及信號。舉例而言,可在整個上述描述 中提及的資料、指令、命令、資訊、信號、位元及符號可 - 由電壓、電流、電磁波、磁場或磁性粒子、光場或光學粒 子或其任一組合表示。 熟習此項技術者將進一步暸解,結合本文所揭示之組態 (' 而描述的各種說明性邏輯區塊、模組、電路及操作可實施 為電子硬體、電腦軟體或兩者之組合。此等邏輯區塊、模 組、電路及操作可使用經設計以執行本文所述功能之通用 處理器、數位信號處理器("DSP”)、ASIC或ASSP、FPGA 或其他可程式化邏輯器件、離散閘或電晶體邏輯、離散硬 體組件或其任一組合來實施或執行。通用處理器可為微處 理器,但替代地,處理器可為任何習知處理器、控制器、 微控制器或狀態機。處理器亦可實施為計算器件之組合, £ 例如,一 DSP與一微處理器的組合、複數個微處理器之組 合、一或多個微處理器結合一 DSP核心之組合,或任何其 他此組態。
- 本文所述之方法及演算法的任務可直接以硬體、以可由 處理器執行之軟體模組或以該兩者之組合而實施。軟體模 組可駐留於隨機存取記憶體("RAM”)、唯讀記憶體 ("ROM”)、諸如快閃RAM之非揮發性RAM(nNVRAMn)、可 擦可程式ROM(”EPROM”)、 電可擦可程式ROM 132262.doc -62- 200912897 (”EEPR〇M”)、暫存器 此項技術t已知之任何直他;^取式碟片,娜或在 存媒體耗接至處理器以使得處理 %月㈣ 訊,且將資訊寫入至儲存媒體 =體讀取資 $虛理哭★抑 货代地錯存媒體可整合 可駐留二使Γ者Γ及錯存媒體可駐留於_中。該趟c 留於使用者終端機中。替代地,處理器及儲存媒體可 作為離散組件駐留於使用者終端機中。 、 Ο 電中的每—者可”部分地實施為硬連線 ::實施為製造成特殊應用積趙電路之電路組 辑而白_㈣或作為機器可讀 碼而自貝料儲存媒體載入或载入至資料儲存媒體之心 式,此機器可讀碼為可由邏輯元件陣列(諸如,微處理琴 =數:信號處理單元)執行的指令。資料儲存媒體; 為儲存几件之陣列,諸如半導體記憶體(其可包括(但不限 於)動態或靜態RAM、R0M及/或快閃RAM),或鐵電、磁
V 阻、雙向、聚合或相變記憶體;或碟片媒體,諸如磁碟或 光碟。術語"軟體,,應理解為包括源碼、組合語言碼、機器 碼、二進位碼、勒體、宏碼、微碼、可由邏輯元件之陣列 執行之指令的任-❹個集合或序列,及此等實例之 組合。 本文中所揭示之方法M10、RM1〇〇、龍1〇〇、Μ⑽及 Μ200的實施亦可切實地實施(例如,在上文列出之—或多 個貧料儲存媒體中)為可由包括邏輯元件之陣列(例如,處 理器、微處理器、微控制器或其他有限狀態機)的機器讀 132262.doc -63- 200912897 取及/或執行之一或多個指令集。因此,本揭示内容不欲 限於上文所展示之組態’而與在本文中以任何方式揭示之 原理及新穎特徵最廣泛地一致’包括於所申請之附加申請 專利範圍中’該等申請專利範圍形成原始揭示内容之一部 分0
可將本文中所描述之裝置(例如,AE10、AD10、 RC100、RF100、ME100、ME200、MF100)之各種實施的 凡件製造為駐留於(例如)同一晶片或晶片組中之兩個或兩 個晶片之中的電子及/或光學器件。此器件之一實例為固 定或可程式化邏輯元件(諸如,電晶體或閘)之陣列。本文 中所描述之裝置之各種實施的一或多個元件亦可整個或部 分地實施為經S己置以執行於—或多㈣定或可程式化邏輯 70件陣列(諸如’微處理器、嵌人式處理器、IP核心、數 位信號處理器、FPGA、ASSM ASIC)上的一或多個指令 集0 、文中所描述之裝置之實施的一或多個元件可能用於執 行並非與該裝置之操作直接相_任務或執行並非與該裳 ,之操作直接相關的其他指令#,諸如與嵌人有該裝置之 夯件或系統之另一操作相關的任務。此裝置之 多個元件亦可舻1女4 ^ ^ I、有/、同結構(例如,用於在不同時間執 式碼之對應於不同元件之部分的處理II、經執行以在 不同時間執行對應㈣同元件之任務的指 = 置時)間對不同元件執行操作之電子及/或光學設= 132262.doc -64· 200912897 圖26說明可用本文中所描述之系統及方法用作存取終端 機之音訊通k器件1 1 08之一實例的方塊圖。器件丨丨〇8包括 經組怨以控制器件11 08之操作的處理器丨丨〇2。處理器丨丨〇2 可經組態以控制器件11 08執行方法M丨或M2〇〇之實施。 器件1108亦可包括經組態以將指令及資料提供至處理器 1102之記憶體1104且可包括R〇m、ram及/或NVRAM。器 件1108亦包括含有收發器1120之外殼1122。收發器112〇包 括支援資料在器件1108與遠端位置之間傳輸及接收的傳輸 器111 0及接收器111 2。器件11 08之天線丨丨丨8附著至外殼 11 22且電耦接至收發器1120。 斋件1108包括經組態以偵測及量化由收發器丨丨2〇接收之 信號之位準的信號偵測器11〇6。舉例而言,信號债測器 1106可經組態以計算參數值,諸如總能量、每一偽雜訊晶 片之導頻能量(亦表達為Eb/No)及/或功率譜密度。写件 11 〇 8包括經組態以使器件1 i 〇 8之各種組件耦接在一起的匯 流排系統1126。除資料匯流排之外,匯流排系統U26可包 括功率匯流排、控制信號匯流排及/或狀態信號匯流排。 器件1108亦包括經組%、以處理由收發器1120接收及/或傳 輸之信號的DSP 1116。 在此實例中,器件1108經組態以在若干不同狀態中之任 一者中操作且包括狀態改變器1114,該狀態改變器1114經 組態以基於器件之當前狀態及由收發器112〇接收且由信號 偵測器1106偵測之信號而控制器件1108之狀態。在此實例 中,器件1108亦包括系統確定器1124 ’該系統確定器1124 132262.doc •65- 200912897 經組態以確定當前服務提供者不適當且控制器件i i 〇 8轉移 至不同服務提供者。 【圖式簡單說明】 圖1說明無線電話系統之實例。 圖2說明經組態以支援封包交換資料通信之蜂巢式電話 系統的實例。 圖3a說明包括音訊編碼器ΑΕ10及音訊解碼器AD1〇之編 碼系統的方塊圖。 圖3b說明一對編碼系統之方塊圖。 圖4a說明音訊編碼器ae1〇之多模式實施aE2()的方塊 圖。 圖扑說明音訊解碼器AD10之多模式實施AD20的方塊 圖。 圖5a說明音訊編碼器aE2〇之實施ae22的方塊圖。 圖5b說明音訊編碼器aE2〇之實施ae24的方塊圖。 圖6&說明音訊編碼器AE24之實施AE25的方塊圖。 圖6b說明音訊編碼器AE20之實施AE26的方塊圖。 圖7a說明編碼音訊信號之訊框之方法M1〇的流程圖。 圖7b說明經組態以編碼音訊信號之訊框之裝置F10的方 塊圖。 圖8說明在被時間扭曲至延遲輪廓之前及之後之殘餘物 的實例。 圖9說明在分段修改之前及之後之殘餘物的實例。 ®l〇說明RCELP編碼方法RMl〇〇之流程圖。 132262.doc -66- 200912897 圖11說明RCELP編碼方法RM1 00之實施RM11 0的流程 圖。 圖12a說明RCELP訊框編碼器34c之實施RC100的方塊 圖。 圖12b說明RCELP編碼器RC 100之實施RC110的方塊圖。 - 圖12c說明RCELP編碼器RC100之實施RC105的方塊圖。 圖12d說明RCELP編碼器RC110之實施RC115的方塊圖。 圖13說明殘餘產生器Rl〇之實施R12的方塊圖。 f ) 圖14說明RCELP編碼裝置RF100之方塊圖。 圖15說明RCELP編碼方法RM100之實施RM120的流程 圖。 圖1 6說明MDCT編碼方案之典型正弦窗形狀的三個實 例。 圖17a說明MDCT編碼器34d之實施ME100的方塊圖。 圖17b說明MDCT編碼器34d之實施ME200的方塊圖。 圖18說明與圖16中所說明之開窗技術不同之開窗技術的 / | 一實例。 圖19a說明根據通用組態處理音訊信號之訊框之方法 Ml 00的流程圖。 圖1外說明任務T110之實施T112的流程圖。 圖19c說明任務T112之實施T114的流程圖。 圖20a說明MDCT編碼器ME100之實施ME110的方塊圖。 圖20b說明MDCT編碼器ME200之實施ME210的方塊圖。 圖21&說明]^0(:7'編碼器]^丑100之實施]^丑120的方塊圖。 132262.doc -67- 200912897 圖21b說明MDCT編碼器ME100之實施ME130的方塊圖。 圖22說明MDCT編碼器ME 120及ME 130之實施ME 140的 方塊圖。 圖23a說明MDCT編碼方法MM1 00之流程圖。 圖23b說明MDCT編碼裝置MF100之方塊圖。 圖24a說明根據通用組態處理音訊信號之訊框之方法 M200的流程圖。 圖24b說明任務T620之實施T622的流程圖。 圖24c說明任務T620之實施T624的流程圖。 圖24d說明任務T622及T624之實施T626的流程圖。 圖25a說明由將MDCT窗應用於音訊信號之連續訊框而產 生之重疊相加區域的實例。 圖25b說明將時間偏移應用於非PR訊框序列之實例。 圖26說明音訊通信器件1108之方塊圖。 【主要元件符號說明】 10 行動用戶單元 12 基地台(BS)/基地台收發器子系統(BTS) 14 基地台控制器(BSC) 16 行動交換中心(MSC) 18 公眾交換電話網路(PSTN) 20 編碼方案選擇器 22 封包資料服務節點(PDSN)/編碼方案選擇器 24 封包資料網路/編碼方案選擇器 26 編碼方案選擇器 132262.doc -68- 200912897
30a 訊框編碼器 30p 訊框編碼器 32a 作用訊框編碼器 32b 不作用訊框編碼器 32c 話音訊框編碼器 32d 非話音訊框編碼器 32e 有聲訊框編碼器 32f 無聲訊框編碼器 34c R C E L P訊框編石馬 34d M D C T訊框編碼 50a 選擇器 50b 選擇器 52a 選擇器 52b 選擇器 54a 選擇器 54b 選擇器 60 編碼方案偵測器 70a 訊框解碼器 70p 訊框解碼器 90a 選擇器 90b 選擇器 210 LPC分析模組 220 變換區塊 230 量化器 132262.doc -69- 200912897
240 逆量化器 250 逆變換區塊 260 白化濾波器 802 MDCT 窗 804 MDCT 窗 806 MDCT 窗 1102 處理器 1104 記憶體 1106 信號偵測器 1108 音訊通信器件 1110 傳輸器 1112 接收器 1114 狀態改變器 1116 DSP 1118 天線 1120 收發器 1122 外殼 1124 糸統確定 1126 匯流排系統 A 波形 AD10 音訊解碼器 ADlOa 第一執行個體/音訊解碼器 ADlOb 第二執行個體/音訊解碼器 AD20 音訊解碼器 132262.doc -70- 200912897 AE10 音訊編碼器 AElOa 第一執行個體/音訊編碼器 AElOb 第二執行個體/音訊編碼器 AE20 多模式音訊編碼 AE22 音訊編碼器 AE24 音訊編碼 AE25 音訊編碼|§ AE26 音訊編碼|§ 1 B 波形 C100 通信頻道 Clio 第一執行個體 C120 第二執行個體 DIO 殘餘物產生器 D20 MDCT模組 D30 量化器 D40 逆MDCT模組 ^ D5 0 雜訊注入模組 D60 共振峰強調模組 D70 共振峰解強調模組 F10 裝置 FE10 用於計算訊框特徵之值的構件 FE20 用於選擇編碼方案之構件 FE30 用於根據選定編碼方案來編碼訊框之構件 FE40 用於產生封包之構件 132262.doc -71 - 200912897 FM10 用於產生訊框之殘餘物的構件 FM20 用於時間修改所產生之殘餘物的構件 FM30 用於執行MDCT運算之構件 FM40 用於量化MDCT係數之構件 FM50 用於執行IMDCT運算之構件 ME100 M D C T編碼 ME110 M D C Τ編碼 ME120 MDCT編碼器 ME 130 MDCT編碼器 ME140 MDCT編碼器 ME200 MDCT編碼器 ME210 MDCT編碼器 MF100 裝置 RIO 殘餘物產生器 R12 殘餘物產生器 R20 延遲輪廓計算器 R30 偏移訊框選擇器 R40 時間偏移計算器 R42 時間偏移計算器 R44 時間偏移計算器 R46 時間偏移計算器 R50 殘餘物修改器 R60 過去經修改殘餘物映射器 R62 過去經修改殘餘物映射器 132262.doc -72- 200912897
R70 暫時經修改殘餘物產生器 R80 時間偏移更新器 R90 經修改殘餘物緩衝器 RC100 R C E L P編石馬 RC105 RCELP編碼器 RC110 R C E L P編石馬裔 RC115 RCELP編碼器 RF10 用於產生殘餘物之構件 RF20 用於計算延遲輪廓之構件 RF30 用於選擇偏移訊框之構件 RF40 用於計算時間偏移之構件 RF50 用於修改殘餘物之構件 RF100 裝置 S20 經時間修改之殘餘物信號 S25 經時間修改之音訊信號 S30 經量化之編碼殘餘物信號 S35 經量化之編碼MDCT信號 S40 經解碼之殘餘物信號 S45 經解碼之MDCT信號 S50 經編碼之雜訊注入參數 S100 音訊信號 S110 第一執行個體 S120 第二執行個體 S200 經編碼之音訊信號 132262.doc -73- 200912897 S210 執行個體 S220 執行個體/音訊信號 S300 接收版本/所接收之編碼音訊信號 S310 接收版本 S320 接收版本 S400 經解碼之音訊信號/輸出話音信號 S410 執行個體 S420 執行個體 SL10 LPC參數 SR10 LPC殘餘物 TM10 時間修改器 132262.doc -74-

Claims (1)

  1. 200912897 十、申請專利範圍: 1. 一種處理一音訊信號之訊框的方法,該方法包含: 根據一音高規則化(PR)編碼方案來編碼該音訊信號之 一第一訊框;及 根據一非PR編碼方案來編碼該音訊信號之一 一士 不 '—' 〇7\* 框, 其中該第二訊框在該音訊信號中跟隨且連續於該第一 訊框,且 〇 其中該編碼一第一訊框包括基於一時間偏移來時間修 改一基於該第一訊框之第一信號的一區段,該時間修改 包括下列一者:(A)根據該時間偏移來時間偏移該第—訊 框之該區段;及(B)基於該時間偏移來時間扭曲該第一俨 號之該區段,且 其中該時間修改一第一信號之一區段包括改變該區段 之一基頻脈衝相對於該第一信號之另一基頻脈衝的一位 置,且 ( 其中該編碼一第二訊框包括基於該時間偏移來時間修 改一基於該第二訊框之第二信號的一區段,該時間修改 ' 包括下列一者:(A)根據該時間偏移來時間偏移該第二訊 框之該區段;及基於該時間偏移來時間扭曲該第二信 號之該區段。 2. 如請求項丨之方法,其中該編碼一第一訊框包括產生一 基於該第一信號之該經時間修改區段的第一編碼訊 框,且 132262.doc 200912897 其中該編碼一第二訊框包括產生一基於該第二信號之 該經時間修改區段的第二編碼訊框。 3.如°月求項1之方法,纟中該第一信號為該第-訊框之- /物且其中該第二信號為該第二訊框之一殘餘物。 4· Γ:求項1之方法,其中該第一信號及該第二信號為經 加榷之音訊信號。 5 ·如請求項1 唄1之方法,其中該編碼該第一訊 自料訊信號中先於該第一訊框之一第三訊框的:= 物的貝訊計算該時間偏移。 、 亡叫求項5之方法’其中該計算該時間偏移包括將該第 :訊框之該殘餘物的樣本映射至該音訊信號之一延遲輪 7.=:項6之方法,其令該編碼該第一訊框包括 8. “訊信號之-基頻週期的資訊計算該延遲輪廓。 如請求们之方法,其中㈣編碼方案為 ^ ^ > kj 線性預測編碼方案,且 m敫勵 其中該非PR編碼方案為下 性預測編碼方案…一修改型離二·(Α) 一雜訊激勵線 β 1離散餘弦變換編碼方牵· 及(c)—原型波形内插編碼方案。 /、, 9. 如請求項1之方法,其中 ° _ R編碼方案為一修改型齙 散餘弦變換編碼方案。 t離 1〇·如請求項1之方法,其令該編喝-第二訊框包括: 對該第二訊框之一殘餘物舶y_ (MDCT)iS « lv μ - 、 仃—修改型離散餘弦變換 (MDCT)運鼻以獲得一經編碼殘餘物;及 換 132262.doc 200912897 基於该、、、坐編碼殘餘物之 > ,v ^ D就執仃一逆MDCT運笼 以獲侍一經解碼殘餘物, 异 其中該第二信號係基於該經解碼殘餘物。 11. 如請求項1之方法,其中 娜馬第二訊框包括: 產生該弟二訊框之一殘餘物,甘A Η 纹馀物’其中該第二信號為該所 產生之殘餘物; 所 在該時間修改該第二传號夕 心心 亿唬之—區段之後,對包括該經 時間修改區段之該所產生 餘物執行-修改型離散餘 弦欠換運舁以獲得一經編碼殘餘物;及 基於該經編碼殘餘物產生一第二編碼訊框。 12. 如請求項1之方法,其中 甲这方法包含根據該時間偏移來 時間偏移該音訊信號中跟隨該第二訊框的一訊框 餘物的一區段。 1 3 .如請求項1之方法,直φ 电具中5玄方法包括基於該時間偏移來 時間修改一第二作缺$ fS· # _ _ ^ 乐一彳。琥之區焱,該第三信號係基於該音
    訊信號之跟隨該第二訊框的一第三訊框,且 —其中該編碼-第二訊框包括在—包括該第二信號及該 第三信號之該等經時間修改區段之樣本的窗上執行一修 改型離散餘弦變換(MDCT)運算。 14.如請求項13之方法,苴φ兮笙―户咕β丄 由再干該第一#唬具有Μ個樣本之一 長度,且該第三信號具有Μ個樣本之一長度,且 其中忒執行一MDCT運算包括產生乂個MDCT係數之一 集。該集合係基於:(A)包括該經時間修改區段之該第 二信號的Μ個樣本;及(B)該第三信號之至多3m/4個樣 132262.doc 200912897 本。 15.如請求項13之方法’其中該第二信號具有厘個樣本之一 長度’且該第三信號具有Μ個樣本之一長度,且
    其中該執行一 MDCT運算包括產生^1個]^〇(:丁係數之一 集合,該集合係基於2Μ個樣本之一序列,該序列:(Α) 包括該第二信號之Μ個樣本,該第二信號包括該經時間 修改區段;(Β)以至少Μ/8個零值樣本的一序列開始;及 (C)以至少Μ/8個零值樣本之一序列結束。 16. —種用於處理一音訊信號之訊框的裝置,該裝置包含: ^用於根據一音高規則化(pR)編碼方案來編碼該音訊信 號之一第一訊框的構件;及 用於根據一非PR編碼方案來編碼該音訊信號之一第二 訊框的構件, 其中該第二訊框在該音訊信號中跟隨且連續於該第一 訊框,且 其中用於編碼-第一訊框之該構件包括用於基於一時 間偏移來時間修改一基於該第一訊框之第一信號之一區 段的構件,用於時間修改之該構件經組態以執行下列一 者:(A)根據該時間偏移來時間偏移該第-訊框之該區 段;及⑻基於該時間偏移來時間扭曲該第—信號之該區 段,且 其中用於時間修改 態以改變該區段之_ 基頻脈衝的一位置, 一第一信號之一區段的該構件經組 基頻脈衝相對於該第一信號之另一 且 132262.doc 200912897 其中用於編碼一第-i 弟一訊框之該構件包括用於基於該時 :偏移來時間修改—基於該第二訊框之第二信號之一區 又的構件,用於時間修改之該構件經組態以執行下列一 者:㈧根據該時間偏移來時間偏移該第二訊框之該區 及⑻基於該時間偏移來時間扭曲該第二信號之該區 Γ L 殘^項16之裝置,其中該第—信號為該第—訊框之— 殘餘物’且其巾㈣二㈣為該第二訊框之 18·如請求項16之裝置,i 茂餘物 加權之音訊信號。… ^及該第二信號為經 19.=項16之裝置,其中用於編碼該第-訊框之該構件 「 术自該“…虎中先於該第-訊框之一第 9η Γ —殘餘物^訊計算該時間偏移之構件。 包括:裝置,其中用於編碼—第二訊框之該構件 ^產生該第:純之—峡物㈣件,其 k唬為該所產生之殘餘物;及 弟一 用於對包括該經時間修改區 行一修改型離散餘弦變換運算二之殘餘物執 構件, 獲仵一經編碼殘餘物的 ’、中用於編碼-第二訊框之該構件經組 編碼殘餘物產生一第二編碼訊框。、’ ”、-土於該經 ==:16之裝置,其中用於時間修 一構件經組態以根據該時間偏移來時間偏St 132262.doc 200912897 汛l號中跟隨該第二訊框之一訊框之一殘餘物的一區 段。 22.如請求項16之裝置,其中用於時間修改一第二信號之_ 區段的該構件經組態以基於該時間偏移來時間修改一第 一 L號之區段,該第三信號係基於該音訊信號之跟隨 該弟一訊*框之一第三訊框,且 其中用於編碼一第二訊框之該構件包括用於在一包括 該第二信號及該第三信號之該等經時間修改區段之樣本 的窗上執行一修改型離散餘弦變換(MDCT)運算的構 件。 23·如請求項22之裝置,其中該第二信號具有Μ個樣本之一 長度,且該第三信號具有Μ個樣本之一長度,且 其中用於執行一 MDCT運算之該構件經組態以產生Μ 個MDCT係數之一集合,該集合係基於:(Α)包括該經時 間修改區段之該第二信號的樣本;及(B)該第三信號 之至多3M/4個樣本。 24. —種用於處理一音訊信號之訊框的裝置,該裝置包含: 一第一訊框編碼器,其經組態以根據一音高規則化 (PR)編碼方案來編碼該音訊信號之一第一訊框;及 一第二訊框編碼器,其經組態以根據—非?11編碼方案 來編碼該音訊信號之一第二訊框, 其中該第二訊框在該音訊信號中跟隨且連續於該第— 訊框,且 其中該第一訊框編碼器包括一第一時間修改器,其經 132262.doc 200912897 組態以基於一時間偏移來時間修改一基於該第一訊框之 第一信號的一區段,該第一時間修改器經組態以執行下 列一者:(A)根據該時間偏移來時間偏移該第一訊框之該 區段;及(B)基於該時間偏移來時間扭曲該第一信號之該 區段,且 其中該第-時間纟改器、經組態卩?文變該區段之一基頻 脈衝相對於該第-信號之另一基頻脈衝的一位置,且 其中該第二訊框編碼器包括一第二時間修改器,其經 組態:基於該時間偏移來時間修改一基於該第二訊框之 第二信號的之H該第二時間修改m態以執行 下列—者:⑷根據該時間偏移來時間偏移該第二訊框之 該區奴’及(B)基於該時間偏移來時間扭曲該第二信號之 該區段。 25:項24之裝置,其中該第一信號為該第1框之-殘餘物’且其中該第二_ _ 26. 如請求項24之裝置,”:第二;5匡之-殘餘物。 /、τ 〇豕弟一#旎及該筮_ 加權之音訊信號。 第…為經 27. 如請求項24之裝置’其中該第一訊框編碼 :::::器二其經組態以基於來自該音訊信號中先:該 移。…之—第三訊框之—殘餘物的資訊計算該時間偏 θ长項24之裝置,其中該第二訊框編碣器包 殘餘物產生器,其經組態以產生該第二訊框 、’其中該第二信號為該所產生之殘餘物;及 132262.doc 200912897 一修改型離散餘弦變換(MDCT)模組,其經組態以對 包括該經時間修改區段之該所產生之殘餘物執行一 MDCT運算以獲得一經編碼殘餘物, 其中該第二訊框編碼器經組態以基於該經編碼殘餘物 產生一第二編碼訊框。 29. 如請求項24之裝置’其中該第二時間修改器經組態以根 據該時間偏移來時間偏移該音訊信號中跟隨該第二訊框 的一訊框之一殘餘物的一區段。 30. 如請求項24之裝置,其中該第二時間修改器經組態以基 於該時間偏移來時間修改一第三信號之一區段該第三 信號係基於該音訊信號之跟隨該第二訊框的—第三訊 框,且 —° 其中該第二訊框編碼器包括一修改型離散餘弦變換 (MDCT)模|且’該修改型離散餘弦變換(mdct)模組經組 〜、j在包括5玄第一 #號及該第三信號之該等經時間修 改區段之樣本的窗上執行一 MDCT運算。 31. 如咕求項30之裝置,其中該第二信號具有μ個樣本之一 長度,且該第三信號具有Μ個樣本之一長度,且 其中該MDCT模級經、组‘態以產生Μ個MDCT係數之一集 合’該集合係基於:(A)包括該經時 信號賴個樣本;及⑻該第三信號之至多個 32. 種電腦可頃媒體,其包含在由一處理器執行時引起該 處理益執行下列行動之指令: 根據一音高規則化(PR)編碼方案來編碼該音訊信號之 132262.doc 200912897 一第一訊框;及 根據一非PR編碼方案來編碼該音訊信號之一第二訊 框, 其中该第二訊框在該音訊信號中跟隨且連續於該第一 訊框,且 其中在經執行時引起該處理器編碼一第—訊框之該等 指令包括用於基於一時間偏移來時間修改一基於該第一 訊框之第一信號之一區段的指令,用於時間修改之該等 指令包括下列-者:⑷用於根據該時間偏移來時間偏移 第訊框之該區段的指令;及(B)用於基於該時間偏移 來時間扭曲該第一信號之該區段的指令,且 其中用於時間修改一第一信號之一區段的該等指令包 括用於改變該區段之一基頻脈衝相對於該第一信號之另 一基頻脈衝之一位置的指令,且 其中在經執行時引起該處理器編碼一第二訊框之該等 指令包括用於基於該時間偏移來時間修改一基於該第二 訊框之第二信號之一區段的指令,用於時間修改之該等 指令包括下列一者:(A)用於根據該時間偏移來時間偏移 該第二訊框之該區段的指令;及(B)用於基於該時間偏移 來時間扭曲該第二信號之該區段的指令。 33 - ^ .一種處理一音訊信號之訊框的方法,該方法包含: 根據一第一編碼方案來編碼該音訊信號之一第一訊 框;及 ° 根據一音咼規則化(PR)編碼方案來編碼該音訊信號之 132262.doc 200912897 一第二訊框, 其中該第二訊框在該音訊信號中跟隨且連續於該第 訊框,且 ~ 其中該第一編碼方案為一非PR編碼方案,且 • 纟中該編碼—第—訊框包括基於—第—時間偏移來時 '間修改一基於該第一訊框之第一信號的一區 于又,S亥時間 修改包括下列一者:(A)根據該第一時間偏移來時間偏移 戎第一信號之該區段;及基於該第一時間偏移來時間 Γ 扭曲該第一信號之該區段;且 其中該編碼一第二訊框包括基於一第二時間偏移來時 間修改一基於該第二訊框之第二信號的一區段,該時= 修改包括下列一者:(A)根據該第二時間偏移來時間偏移 s亥第二信號之該區段;及(B)基於該第二時間偏移來時間 扭曲該第二信號之該區段, 其中該時間修改一第二信號之一區段包括改變該區段 之一基頻脈衝相對於該第二信號之另一基頻脈衝的 . . TTT** 置,且 其中該第二時間偏移係基於來自該第一信號之該經時 間修改區段的資訊。 - 34.如請求項33之方法,其中該編碼一第一訊框包括產生— 基於該第一信號之該經時間修改區段的第一編碼訊 框,且 其中該編碼一第二訊框包括產生一基於該第二信號之 該經時間修改區段的第二編碼訊框。 132262.doc -10- 200912897 3 5.如請求項33之方法’其中該第一信號為該第一訊框之— 殘餘物,且其中該第二信號為該第二訊框之一殘餘物。 36. 如請求項33之方法’其中該第一信號及該第二信號為經 加權之音訊信號。 37. 如請求項33之方法’其中該時間修改該第二信號之一區 段包括基於來自該第一信號之該經時間修改區段的資訊 計算該第二時間偏移,且 其中該計算該第二時間偏移包括將該第一信號之該經 時間修改區段映射至一基於來自該第二訊框之資訊的延 遲輪廓。 38. 如請求項37之方法,其中該第二時間偏移係基於該經映 射區段之樣本與一暫時經修改殘餘物之樣本之間的—相 關性,且 其中該暫時經修改殘餘物係基於:(A)該第二訊框之 一殘餘物的樣本;及(B)該第一時間偏移。
    其中s亥時間修改該第二信號之一 區段包括根據該第二 時間偏移來時間偏移該殘餘物之—第一區段,且 其中該方法包含: 信號之該經時間修改區段的資訊計 算一不
    基於來自該第一 根據該第 132262.doc 200912897 梭如請求項33之方法,其t該第 殘餘物,且 ~矛一汛框之一 其中該時間修改該第二信號 時間偏移來時間偏移該殘餘物,“括根據该第二 —弟一區段,曰 其中該方法包含: ^於來自該殘餘物之該經時間修改之第—區段 '异—不同於該第二時間偏移之第三時間偏移;及' 根據該第三時間偏移來時間偏移該殘餘物之一第_ 區段。 < 弟一 41:=項Μ之方法,其中該時間修改該第二信號之-區 ^括將該第-信號之該經時間修改區段的樣本映射至 基於來自s亥第二訊框之資訊的延遲輪廓。 42. 如請求項33之方法,其申該方法包含: 將-基於該第—信號之該經時間修改區段的序 至一自適應碼薄緩衝器;及 一在該儲存之後’將該自適應碼薄緩衝器之樣本映射至 基於來自該第二訊框之資訊的延遲輪廓。 43. 如請求項33之方法,其中該第二信號為該第二訊框之一 餘物且其中該時間修改該第二信號之一區段包括日年 間:曲該第二訊框之該殘餘物,且 時 其中該方法包含基於來自該第二訊框之該經時間扭曲 殘餘物的資訊來時間扭曲該音訊信號之一第三訊框的一 殘餘物,其中該第三訊框在該音訊信號中連續於該第二 訊框。 132262.doc -12- 200912897 44·如凊求項33之方法,其中該第二信號為該第二訊框之— 殘餘物,且其中該時間修改該第二信號之一區段包括基 於(A)來自該第一信號之該經時間修改區段的資訊及(B) 來自該第二訊框之該殘餘物的資訊而計算該第二時間偏 移。
    45. 如請求項33之方法,其中該PR編碼方案為一寬鬆碼激勵 線丨生預測編碼方案,且其中該非PR編碼方案為下列一 者:(A) 一雜訊激勵線性預測編碼方案;(B)一修改型離 散餘弦變換編碼方案;及⑹一原型波形内插編碼方案。 46. 如5月求項33之方法,其中該非叹編碼方案為一修改型離 散餘弦變換編碼方案。 用长項3 3之方法’其中該編碼一第-訊框包括: 對該第-訊框之-殘餘物執行一修改型離散餘弦變換 (MDCT)運算以獲得一經編碼殘餘物;及 、對-基於該經編碼殘餘物之信號執行一逆· 以獲得一經解碼殘餘物, 信號係基於該 丹甲該第一 —-…^肝碼殘餘物。 伙如=扣之方法,其中該編碼―第―訊框包括: 生该第一訊框之一殘餘物,1 產生之殘餘物; ,、中遠弟一信號為該所 —口么叮丨曰J 1梦 時間修改區段之該所產生之 又之後,對包括該經 弦變換運曾以藉… 、物執行一修改型離散餘 良換運舁以獲得-經編碼殘餘物;〗 餘 基於該經編碼殘餘物產生一 —編碼訊框。 I32262.doc -13- 200912897 49.如請求項33之方法,其中該第一信號具有]^個樣本之— 長度,且該第二信號具有Μ個樣本之一長度,且 其中該編碼一第一訊框包括產生Μ個修改型離散餘弦 變換(MDCT)係數之一集合,該集合係基於:包括該經 時間修改區段之該第一信號的Μ個樣本;及該第二信號 之至多3Μ/4個樣本。 5〇.如請求項33之方法,其中該第一信號具有1^個樣本之— 長度,且該第二信號具有Μ個樣本之一長度,且 其中該編碼一第一訊框包括產生Μ個修改型離散餘弦 變換(MDCT)係數之一集合,該集合係基於2河個樣本之 一序列,該序列:(Α)包括該第一信號之Μ個樣本,該第 一信號包括該經時間修改區段;(Β)以至少Μ/8個零值樣 本之一序列開始;及(C)以至少Μ/8個零值樣本之一序列 結束。 51.
    一種用於處理-音訊信號之訊框的裝置,該方法包含: 用於根據-第-編碼方案來編碼該音訊信號之一第一 訊框的構件;及 口用於根據-音高規則化(p R)編碼方案來編碼該音訊信 號之一第二訊框的構件, p 第二訊框在該音訊信號中跟隨且連續於該第 訊框,且 ,、中該第一編碼方案為一非PR編碼方案,且 其中用於編碼一第一邙葙 構件包㈣於基於一第 時間偏移來時間修改—基 x乐几框之第一信號之 132262.doc • 14- 200912897 區段的構#肖於時間修改之該構件經組態以執行下 列-者:(A)根據該第—時間偏移來時間偏移該第—传號 之該區段;及(B)基於該第一時間偏移來時間扭曲㈣1 信號之該區段;且 其中用於編碼一第二訊框之該構件包括用於基於一第 二時間偏移來時間修改—基於該第二訊框之第二信號之 -區段的構件,用於日㈣修改之該構件經組態以執行下 列一者:⑷根據該第二時間偏移來時間偏移該第二作號 之該區段;及W基於該第二時間偏移來時間扭曲該第二 信號之該區段, 其中用於時間修改一第二信號之一區段的該構件經組 L以改變該區段之—基頻脈衝相對於該第二信號之另一 基頻脈衝的一位置,且 其中該第二時間偏移係基於來自該第-信號之該經時 間修改區段的資訊。 月求項51之裝置,其中該第一信號為該第一訊框之一 殘餘物’且其中該第二信號為該第:純之-殘餘物。 53. =求項51之裝置,其中該第一信號及該第二信號為經 加權之音訊信號。 54. 如5月求項51之褒置其中用於時間修改該第二信號之一 ::的:構件包括用於基於來自該第一信號之;:時間 少己區段的資訊計算該第二時間偏移之構件,且 :用於。十算該第二時間偏移之該構件包括用於將該 第一仏號之該經時間修改區段映射至一基於來自該第二 132262.doc -15- 200912897 訊框之資訊的延遲輪廓之構件。 55. 如請求項54之裝置,其中該第二時間偏移係基於該經映 射區段之樣本與一暫時經修改殘餘物之樣本之間的一相 關性,且 其中該暫時經修改殘餘物係基於:(A)該第二訊框之 一殘餘物的樣本;及(B)該第—時間偏移。 56. 如吻求項5丨之裝置’其中該第二信號為該第二訊框之一 殘餘物,且 C L &八中用於牯間修改§亥第二信號之一區段的該構件經組 態以根據該第二日夺間偏移來時間偏移該殘餘物之一第一 區段,且 其中該裝置包含: 用於基於來自該殘餘物之該經時間修改之第一區段 =訊計算-不同於該第二時間偏移之第三時間 構件;及 用於根據㈣三時間偏移來時間偏移該殘餘物之一 第一區段的構件。 57. 如請求項51之裝置’其中該 , 0 # ^ 观馮該第二訊框之一 殘餘物,且其中用於時間修改 ^ ^弟一仏唬之一區段的該 冓件I括用於基於(A)來自該第— 段的次# xw σ琥之該經時間修改區 的貝訊及(Β)來自該第二訊框之 ^货. 夕戈餘物的資訊而計算 該第二時間偏移之構件。 貝π叩〇r异 58. 如請求項51之裝置,其中用於編 包括: 弟—訊框之該構件 132262.doc -16- 200912897 一用於產生4第—訊框之—殘餘物的構件,其中該第— 信號為該所產生之殘餘物;及 Λ 用於對包括該經時間修改區段之該所產生之殘餘物執 =修改型離散餘弦變換運算以獲得—經編碼殘餘物的 構件,且 其中用於編碼一第一訊框之該構件經組態以基於該經 編碼殘餘物產生—第一編碼訊框。 月长項51之裝置,其中該第__信號具有肘個樣本之— 長度且該第二信號具有Μ個樣本之一長度,且 其中用於編碼一第一訊框之該構件包括用於產生Μ個 修改型離散餘弦變換(MDCT)係數之一集合的構件,該 集合係基於:包括該經時間修改區段之該第一信號的Μ 個樣本;及該第二信號之至多3Μ/4個樣本。 6〇·如清求項5 1之裝置,其中該第一信號具有Μ個樣本之一 長度,且該第二信號具有Μ個樣本之一長度,且 其中用於編碼一第一訊框之該構件包括用於產生1^個 修改型離散餘弦變換(MDCT)係數之一集合的構件,該 集s係基於2M個樣本之一序列,該序列:(a)包括該第 k號之Μ個樣本,該第一信號包括該經時間修改區 段;(Β)以至少Μ/8個零值樣本之一序列開始;及(c)以至 少M/8個零值樣本之一序列結束。 61·種用於處理一音訊信號之訊框的裝置,該方法包含: —第一訊框編碼器,其經組態以根據一第一編碼方案 來編碼該音訊信號之一第一訊框;及 132262.doc •17- 200912897 -第一汛框編碼器’其經組態以根據_音高規則化 (PR)編碼方案來編碼該音訊信號之-第二訊框, 其中該第二訊樞在該音訊信號中跟隨且連續於該第一 訊框,且 Λ 其中該第一編碼方案為-非PR編碼方案,且 其中該第一訊樞編褐考句 盗包括一第一時間修改器,其經 組態以基於一第一gi. pa ^ …"I 來時間修改—基於該第-訊 框之第一指唬的—區段, .__ v. Ο 又該弟一時間修改器經組態以執 仃下列一者:(A)根據該第— 弟時間偏移來時間偏移該第一 信號之該區段;及)其认4 第"”厂 第一時間偏移來時間扭曲該 第一 # 5虎之戎區段;且 其中該第二訊框編碼器 組態以基於一第二時…f第-時間修改器’其經 框之第二"的一 間修改-基於該第二訊 —下列一广區段’該第二時間修改器經組態以執 二之,[广)根據該第二時間偏移來時間偏移該第二 二及⑻基於該第二時間偏移來時間扭曲該 第一 # 5虎之該區段, 其中該第二時間修改涔 ^夕—組態以改變一第二信號之該 一位置,且 第一彳§號之另一基頻脈衝的 其中β亥第一時間偏移係#於忠ώ » 門倏将厂饥 ’、土於來自έ亥第一信號之該經時 間修改區段的資訊。 62.如請求項61之裝置,其 ^ ^ Λ, 彳5號為該第一訊框之一 殘餘物,且其中該第二信 〇 X弟—矾框之一殘餘物。 132262.doc -18· 200912897 63 .如請求項& 、 裝置’其中該第一信號及該第二信號為經 加權之音訊信號。 求員61之裝置,其中該第二時間修改器包括一時間 偏移計复% 4 ° ^、',、至組態以基於來自該第一信號之該經時 H盆改區段的資訊計算該第二時間偏移,且 上2中該時間偏移計算器包括一映射器,其經組態以將 吕亥弟 一' Ojfe 上 一 ^ §〜之邊經時間修改區段映射至一基於來自該第 一汛樞之資訊的延遲輪廓。 65·如請求項64之裝置,1 ,、甲該第一時間偏移係基於該經映 關!段之樣本與一暫時經修改殘餘物之樣本之間的-相 關性,且 一:中°玄暫時經修改殘餘物係基於:(A)該第二訊框之 餘物的樣本;及⑻該第一時間偏移。 66.如請求項61 殘餘物,I、〃 4第—彳第:訊框之— Cj :中該第二時間修改器經組態以根據 來時間偏移該殘餘物之—第一區段,且 丁間偏移 該偏移計算器經組態以基於來自該殘餘物之 門低第—區段的資訊計算-不同於該第-砗 間偏移之第三時間偏移,1 弟-時 來^二時間偏移器經組態以根據該第三時間偏移 來時間偏移該殘餘物之_第二區段。 川偏移 67.如請求項61之梦 叙 、置,其中該第二信號為該第二却i「 殘餘物,且皇中#笛_n+ >框之一 ㈣—時間修改器包括—時間偏移計算 132262.doc -19· 200912897 間偏移計算器經組態以基於(α)來自該第-信# μ、、坐扦間修改區段的資訊及(Β)來自嗲第-1 " 餘物的資,而“ )來自忒第-讯框之該殘 貝讯而計算該第二時間偏移。 68.㈣求項61之農置,其中該第一訊框編碼器包括: ㈣m產生器1經組態以產生該第—訊框之1 、 '、5亥第一信號為該所產生之殘餘物;及 Ο Ο 修改型離散餘弦變換(MDCT)模組,其經组態 匕括該經時間P改 >文£奴之该所產生之殘餘物執行— DCT運算,以獲得一經編碼殘餘物,且 其中該第-訊框編碼器經㈣以基於該經編瑪殘餘物 產生一第一編碼訊框。 月求項61之裝置,其中該第一信號具有μ個樣本之一 長度且該第二信號具有Μ個樣本之一長度,且 /、中該第一訊框編碼器包括一修改型離散餘弦變換 (MDCT)模組’其經組態以產生以個係數之一集 合’該集合係基於:包括該經時間修改區段之該第一信 號的Μ個樣本;及該第二信號之至多遍销樣本。 70.如咕求項61之裝置’其中該第一信號具有μ個樣本之一 長度且該第二信號具有Μ個樣本之一長度,且 八中亥第一訊框編碼器包括一修改型離散餘弦變換 (MDCT)模組’其經組態以產生⑷固mdct係數之一集 5該集δ係基於2M個樣本之一序列,該序列:(A)包 括及第一仏號之厘個樣本;該第一信號包括該經時間修 改區段;(Β)以至少Μ/8個零值樣本之一序列開始;及(c) 132262.doc -20- 200912897 以至少M/8個零值樣本之一序列結束。 71. 一種電腦可讀媒體,其包_ 丹匕3在由處理益執行時引起該 處理器執行下列行動之指令: 根據一第一編碼方案來編碼該音訊信號之一第一訊 框;及 ° 根據-音高規則化(PR)編碼方案來編碼該音訊信號之 一第二訊框, 其中該第二訊框在該音訊信號中跟隨且連續於該第— 訊框,且 其中該第一編碼方案為一非PR編碼方案,且 其中在由一處理器執行時引起該處理器編碼一第一訊 框之該等指令包括用於基於一第一時間偏移來時間修改 土於該第Λ框之第一信號之一區段的指令,用於 間修改之該等指入為& _ 、 知γ包括下列一者:(A)用於根據該第一 間偏移來時間偏移該第—信號之該區段的指令用
    於基於該第一時門低#十士 ()用 B偏移來時間扭曲該第一信號之該 的指令;且 〜^命矾仃時引起該處理器編碼一第_ 框之該等指令包括 — 匕括用於基於一第二時間偏移來時間 一基於該第二訊 框之苐二信號之一區段的指令, 間修改之該等指八勺虹 ; 間偏移來時間偏 罘— 神移5亥第二信號之該區段的指令; 於基於該第二iB) T間偏移來時間扭曲該第二信號之該 的指令, 132262.doc -21 - 200912897 其中用於時間修改—第二信號之一區段 括用於&變該區段之一I頻脈衝相對於該 一基頻脈衝之一位置的指令,且 其中該第二時間低必^ kts ___ ^间偏移係基於來自該第/ 間修改區段的資訊。 的該等指令包 第二信號之另 信號之該經時
    132262.doc -22·
TW097122276A 2007-06-13 2008-06-13 利用音高規則化及非音高規則化編碼用於信號編碼之系統,方法及裝置 TWI405186B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US94355807P 2007-06-13 2007-06-13
US12/137,700 US9653088B2 (en) 2007-06-13 2008-06-12 Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding

Publications (2)

Publication Number Publication Date
TW200912897A true TW200912897A (en) 2009-03-16
TWI405186B TWI405186B (zh) 2013-08-11

Family

ID=40133142

Family Applications (1)

Application Number Title Priority Date Filing Date
TW097122276A TWI405186B (zh) 2007-06-13 2008-06-13 利用音高規則化及非音高規則化編碼用於信號編碼之系統,方法及裝置

Country Status (10)

Country Link
US (1) US9653088B2 (zh)
EP (1) EP2176860B1 (zh)
JP (2) JP5405456B2 (zh)
KR (1) KR101092167B1 (zh)
CN (1) CN101681627B (zh)
BR (1) BRPI0812948A2 (zh)
CA (1) CA2687685A1 (zh)
RU (2) RU2010100875A (zh)
TW (1) TWI405186B (zh)
WO (1) WO2008157296A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI497486B (zh) * 2009-09-02 2015-08-21 Alcatel Lucent 呈現相容於不連續傳輸編解碼器之音樂信號的方法及實施此方法的裝置
US9524724B2 (en) 2013-01-29 2016-12-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filling in perceptual transform audio coding
TWI613644B (zh) * 2015-03-09 2018-02-01 弗勞恩霍夫爾協會 音訊編碼器、音訊解碼器、用以編碼音訊信號之方法、用以解碼經編碼音訊信號之方法、及相關電腦程式

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100788706B1 (ko) * 2006-11-28 2007-12-26 삼성전자주식회사 광대역 음성 신호의 부호화/복호화 방법
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
US8254588B2 (en) 2007-11-13 2012-08-28 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for providing step size control for subband affine projection filters for echo cancellation applications
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
RU2621965C2 (ru) 2008-07-11 2017-06-08 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы
KR101381513B1 (ko) * 2008-07-14 2014-04-07 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
KR101170466B1 (ko) 2008-07-29 2012-08-03 한국전자통신연구원 Mdct 영역에서의 후처리 방법, 및 장치
EP3373297B1 (en) * 2008-09-18 2023-12-06 Electronics and Telecommunications Research Institute Decoding apparatus for transforming between modified discrete cosine transform-based coder and hetero coder
WO2010047566A2 (en) * 2008-10-24 2010-04-29 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
EP2407963B1 (en) 2009-03-11 2015-05-13 Huawei Technologies Co., Ltd. Linear prediction analysis method, apparatus and system
JP5730860B2 (ja) * 2009-05-19 2015-06-10 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute 階層型正弦波パルスコーディングを用いるオーディオ信号の符号化及び復号化方法及び装置
WO2011047887A1 (en) * 2009-10-21 2011-04-28 Dolby International Ab Oversampling in a combined transposer filter bank
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
JP5304504B2 (ja) * 2009-07-17 2013-10-02 ソニー株式会社 信号符号化装置、信号復号装置、信号処理システム、これらにおける処理方法およびプログラム
US9147385B2 (en) 2009-12-15 2015-09-29 Smule, Inc. Continuous score-coded pitch correction
US8682653B2 (en) * 2009-12-15 2014-03-25 Smule, Inc. World stage for pitch-corrected vocal performances
KR101445294B1 (ko) * 2010-03-10 2014-09-29 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 코딩 컨텍스트의 피치 의존 적응을 이용하는 오디오 신호 디코더, 오디오 신호 인코더, 오디오 신호 디코딩 방법, 오디오 신호 인코딩 방법, 및 컴퓨터 프로그램
US10930256B2 (en) 2010-04-12 2021-02-23 Smule, Inc. Social music system and method with continuous, real-time pitch correction of vocal performance and dry vocal capture for subsequent re-rendering based on selectively applicable vocal effect(s) schedule(s)
GB2493470B (en) 2010-04-12 2017-06-07 Smule Inc Continuous score-coded pitch correction and harmony generation techniques for geographically distributed glee club
US9601127B2 (en) 2010-04-12 2017-03-21 Smule, Inc. Social music system and method with continuous, real-time pitch correction of vocal performance and dry vocal capture for subsequent re-rendering based on selectively applicable vocal effect(s) schedule(s)
MX2012001696A (es) * 2010-06-09 2012-02-22 Panasonic Corp Metodo de extension de ancho de banda, aparato de extension de ancho de banda, programa, circuito integrado, y aparato de descodificacion de audio.
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
US20120089390A1 (en) * 2010-08-27 2012-04-12 Smule, Inc. Pitch corrected vocal capture for telephony targets
US8924200B2 (en) * 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
US20120143611A1 (en) * 2010-12-07 2012-06-07 Microsoft Corporation Trajectory Tiling Approach for Text-to-Speech
PT2676267T (pt) 2011-02-14 2017-09-26 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
CN103620672B (zh) 2011-02-14 2016-04-27 弗劳恩霍夫应用研究促进协会 用于低延迟联合语音及音频编码(usac)中的错误隐藏的装置和方法
EP4243017A3 (en) * 2011-02-14 2023-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method decoding an audio signal using an aligned look-ahead portion
BR112012029132B1 (pt) 2011-02-14 2021-10-05 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Representação de sinal de informações utilizando transformada sobreposta
AU2012217216B2 (en) 2011-02-14 2015-09-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
EP2676266B1 (en) 2011-02-14 2015-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Linear prediction based coding scheme using spectral domain noise shaping
MY164797A (en) 2011-02-14 2018-01-30 Fraunhofer Ges Zur Foederung Der Angewandten Forschung E V Apparatus and method for processing a decoded audio signal in a spectral domain
TWI591468B (zh) 2011-03-30 2017-07-11 仁寶電腦工業股份有限公司 電子裝置與風扇控制方法
US9866731B2 (en) 2011-04-12 2018-01-09 Smule, Inc. Coordinating and mixing audiovisual content captured from geographically distributed performers
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
CA2853417A1 (en) * 2011-10-27 2013-05-02 Centre For Development Of Telematics (C-Dot) A communication system for managing leased line network with wireless fallback
CA2853017A1 (en) * 2011-10-27 2013-05-02 Centre For Development Of Telematics (C-Dot) A communication system for managing leased line network and a method thereof
KR101390551B1 (ko) * 2012-09-24 2014-04-30 충북대학교 산학협력단 저 지연 변형된 이산 코사인 변환 방법
SG11201503788UA (en) 2012-11-13 2015-06-29 Samsung Electronics Co Ltd Method and apparatus for determining encoding mode, method and apparatus for encoding audio signals, and method and apparatus for decoding audio signals
EP2757558A1 (en) 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
CN117275495A (zh) 2013-04-05 2023-12-22 杜比国际公司 音频信号的解码方法和解码器、介质以及编码方法
CN108364657B (zh) * 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
US9984706B2 (en) 2013-08-01 2018-05-29 Verint Systems Ltd. Voice activity detection using a soft decision mechanism
CN104681032B (zh) * 2013-11-28 2018-05-11 ***通信集团公司 一种语音通信方法和设备
WO2015104065A1 (en) * 2014-01-13 2015-07-16 Nokia Solutions And Networks Oy Method, apparatus and computer program
KR20160146910A (ko) * 2014-05-15 2016-12-21 텔레폰악티에볼라겟엘엠에릭슨(펍) 오디오 신호 분류 및 코딩
CN106683681B (zh) 2014-06-25 2020-09-25 华为技术有限公司 处理丢失帧的方法和装置
CN105225671B (zh) 2014-06-26 2016-10-26 华为技术有限公司 编解码方法、装置及***
CN110444219B (zh) * 2014-07-28 2023-06-13 弗劳恩霍夫应用研究促进协会 选择第一编码演算法或第二编码演算法的装置与方法
WO2016017238A1 (ja) * 2014-07-28 2016-02-04 日本電信電話株式会社 符号化方法、装置、プログラム及び記録媒体
CN112967727A (zh) * 2014-12-09 2021-06-15 杜比国际公司 Mdct域错误掩盖
CN104616659B (zh) * 2015-02-09 2017-10-27 山东大学 相位对重构语音声调感知影响方法及在人工耳蜗中应用
US11032602B2 (en) 2017-04-03 2021-06-08 Smule, Inc. Audiovisual collaboration method with latency management for wide-area broadcast
US11488569B2 (en) 2015-06-03 2022-11-01 Smule, Inc. Audio-visual effects system for augmentation of captured performance based on content thereof
US10210871B2 (en) * 2016-03-18 2019-02-19 Qualcomm Incorporated Audio processing for temporally mismatched signals
US11310538B2 (en) 2017-04-03 2022-04-19 Smule, Inc. Audiovisual collaboration system and method with latency management for wide-area broadcast and social media-type user interface mechanics

Family Cites Families (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5384891A (en) 1988-09-28 1995-01-24 Hitachi, Ltd. Vector quantizing apparatus and speech analysis-synthesis system using the apparatus
US5357594A (en) 1989-01-27 1994-10-18 Dolby Laboratories Licensing Corporation Encoding and decoding using specially designed pairs of analysis and synthesis windows
JPH0385398A (ja) 1989-08-30 1991-04-10 Omron Corp 扇風機の送風量ファジイ制御装置
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
FR2675969B1 (fr) 1991-04-24 1994-02-11 France Telecom Procede et dispositif de codage-decodage d'un signal numerique.
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JP3531177B2 (ja) 1993-03-11 2004-05-24 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法
TW271524B (zh) 1994-08-05 1996-03-01 Qualcomm Inc
EP0732687B2 (en) 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
US5704003A (en) * 1995-09-19 1997-12-30 Lucent Technologies Inc. RCELP coder
KR100389895B1 (ko) * 1996-05-25 2003-11-28 삼성전자주식회사 음성 부호화 및 복호화방법 및 그 장치
US6134518A (en) 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
WO1999010719A1 (en) 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US6169970B1 (en) 1998-01-08 2001-01-02 Lucent Technologies Inc. Generalized analysis-by-synthesis speech coding method and apparatus
ES2247741T3 (es) * 1998-01-22 2006-03-01 Deutsche Telekom Ag Metodo para conmutacion controlada por señales entre esquemas de codificacion de audio.
US6449590B1 (en) 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
US6754630B2 (en) * 1998-11-13 2004-06-22 Qualcomm, Inc. Synthesis of speech from pitch prototype waveforms by time-synchronous waveform interpolation
US6456964B2 (en) * 1998-12-21 2002-09-24 Qualcomm, Incorporated Encoding of periodic speech using prototype waveforms
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
JP3696091B2 (ja) 1999-05-14 2005-09-14 松下電器産業株式会社 オーディオ信号の帯域を拡張するための方法及び装置
US6330532B1 (en) 1999-07-19 2001-12-11 Qualcomm Incorporated Method and apparatus for maintaining a target bit rate in a speech coder
JP4792613B2 (ja) 1999-09-29 2011-10-12 ソニー株式会社 情報処理装置および方法、並びに記録媒体
JP4211166B2 (ja) * 1999-12-10 2009-01-21 ソニー株式会社 符号化装置及び方法、記録媒体、並びに復号装置及び方法
US7386444B2 (en) * 2000-09-22 2008-06-10 Texas Instruments Incorporated Hybrid speech coding and system
US6947888B1 (en) * 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
EP1199711A1 (en) 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Encoding of audio signal using bandwidth expansion
US6694293B2 (en) * 2001-02-13 2004-02-17 Mindspeed Technologies, Inc. Speech coding system with a music classifier
US7461002B2 (en) 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US7136418B2 (en) 2001-05-03 2006-11-14 University Of Washington Scalable and perceptually ranked signal coding and decoding
US6658383B2 (en) 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US6879955B2 (en) 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
CA2365203A1 (en) 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
EP1341160A1 (en) 2002-03-01 2003-09-03 Deutsche Thomson-Brandt Gmbh Method and apparatus for encoding and for decoding a digital information signal
US7116745B2 (en) 2002-04-17 2006-10-03 Intellon Corporation Block oriented digital communication system and method
JP4649208B2 (ja) 2002-07-16 2011-03-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオコーディング
US8090577B2 (en) * 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization
JP4178319B2 (ja) * 2002-09-13 2008-11-12 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声処理におけるフェーズ・アライメント
US20040098255A1 (en) 2002-11-14 2004-05-20 France Telecom Generalized analysis-by-synthesis speech coding method, and coder implementing such method
US7876966B2 (en) * 2003-03-11 2011-01-25 Spyder Navigations L.L.C. Switching between coding schemes
GB0321093D0 (en) 2003-09-09 2003-10-08 Nokia Corp Multi-rate coding
US7412376B2 (en) * 2003-09-10 2008-08-12 Microsoft Corporation System and method for real-time detection and preservation of speech onset in a signal
FR2867649A1 (fr) 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
US7516064B2 (en) 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
FI118834B (fi) * 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
CN1947407A (zh) 2004-04-09 2007-04-11 日本电气株式会社 音频通信方法和装置
US8032360B2 (en) * 2004-05-13 2011-10-04 Broadcom Corporation System and method for high-quality variable speed playback of audio-visual media
US7739120B2 (en) * 2004-05-17 2010-06-15 Nokia Corporation Selection of coding models for encoding an audio signal
CA2566368A1 (en) * 2004-05-17 2005-11-24 Nokia Corporation Audio encoding with different coding frame lengths
EP1793372B1 (en) 2004-10-26 2011-12-14 Panasonic Corporation Speech encoding apparatus and speech encoding method
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
CA2603246C (en) 2005-04-01 2012-07-17 Qualcomm Incorporated Systems, methods, and apparatus for anti-sparseness filtering
US7991610B2 (en) 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
US7751572B2 (en) 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
FR2891100B1 (fr) * 2005-09-22 2008-10-10 Georges Samake Codec audio utilisant la transformation de fourier rapide, le recouvrement partiel et une decomposition en deux plans basee sur l'energie.
US7720677B2 (en) 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
KR100715949B1 (ko) * 2005-11-11 2007-05-08 삼성전자주식회사 고속 음악 무드 분류 방법 및 그 장치
US8032369B2 (en) 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
KR100717387B1 (ko) * 2006-01-26 2007-05-11 삼성전자주식회사 유사곡 검색 방법 및 그 장치
KR100774585B1 (ko) * 2006-02-10 2007-11-09 삼성전자주식회사 변조 스펙트럼을 이용한 음악 정보 검색 방법 및 그 장치
US7987089B2 (en) 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US8239190B2 (en) 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
US20080249767A1 (en) * 2007-04-05 2008-10-09 Ali Erdem Ertan Method and system for reducing frame erasure related error propagation in predictive speech parameter coding
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI497486B (zh) * 2009-09-02 2015-08-21 Alcatel Lucent 呈現相容於不連續傳輸編解碼器之音樂信號的方法及實施此方法的裝置
US9524724B2 (en) 2013-01-29 2016-12-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filling in perceptual transform audio coding
US9792920B2 (en) 2013-01-29 2017-10-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filling concept
US10410642B2 (en) 2013-01-29 2019-09-10 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filling concept
US11031022B2 (en) 2013-01-29 2021-06-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filling concept
TWI613644B (zh) * 2015-03-09 2018-02-01 弗勞恩霍夫爾協會 音訊編碼器、音訊解碼器、用以編碼音訊信號之方法、用以解碼經編碼音訊信號之方法、及相關電腦程式
US10600428B2 (en) 2015-03-09 2020-03-24 Fraunhofer-Gesellschaft zur Foerderung der angewandten Forschug e.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal

Also Published As

Publication number Publication date
WO2008157296A1 (en) 2008-12-24
RU2470384C1 (ru) 2012-12-20
KR101092167B1 (ko) 2011-12-13
JP5405456B2 (ja) 2014-02-05
RU2010100875A (ru) 2011-07-20
BRPI0812948A2 (pt) 2014-12-09
CN101681627B (zh) 2013-01-02
JP2010530084A (ja) 2010-09-02
EP2176860A1 (en) 2010-04-21
TWI405186B (zh) 2013-08-11
JP2013242579A (ja) 2013-12-05
US20080312914A1 (en) 2008-12-18
JP5571235B2 (ja) 2014-08-13
CN101681627A (zh) 2010-03-24
US9653088B2 (en) 2017-05-16
EP2176860B1 (en) 2014-12-03
KR20100031742A (ko) 2010-03-24
CA2687685A1 (en) 2008-12-24

Similar Documents

Publication Publication Date Title
TW200912897A (en) Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
JP4991854B2 (ja) オーディオ信号に関連付けられるフレームを持つ窓を修正するためのシステムと方法
ES2318820T3 (es) Procedimiento y aparatos de cuantificacion predictiva del habla de voces.
KR101058760B1 (ko) 스피치 신호와 연관된 패킷에 식별자를 포함시키는 시스템 및 방법
JP5596189B2 (ja) 非アクティブフレームの広帯域符号化および復号化を行うためのシステム、方法、および装置
JP5373217B2 (ja) 可変レートスピーチ符号化
JP4112027B2 (ja) 再生成位相情報を用いた音声合成
RU2402826C2 (ru) Способы и устройство кодирования и декодирования части речевого сигнала диапазона высоких частот
JP4658596B2 (ja) 線形予測に基づく音声コーデックにおける効率的なフレーム消失の隠蔽のための方法、及び装置
ES2360176T3 (es) Alisamiento de discontinuidades entre tramas de habla.
JP4166673B2 (ja) 相互使用可能なボコーダ
TWI559298B (zh) 用於音訊信號之諧波頻寬延展之方法、裝置及電腦可讀儲存器件
RU2636685C2 (ru) Решение относительно наличия/отсутствия вокализации для обработки речи
ES2297578T3 (es) Procedimiento y aparato para submuestrear informacion del espectro de fase.
Gibson Speech coding for wireless communications
Berisha et al. Dual-mode wideband speech compression

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees