TWI606441B - 解碼裝置 - Google Patents

解碼裝置 Download PDF

Info

Publication number
TWI606441B
TWI606441B TW105133790A TW105133790A TWI606441B TW I606441 B TWI606441 B TW I606441B TW 105133790 A TW105133790 A TW 105133790A TW 105133790 A TW105133790 A TW 105133790A TW I606441 B TWI606441 B TW I606441B
Authority
TW
Taiwan
Prior art keywords
bits
unit
sub
band
bit
Prior art date
Application number
TW105133790A
Other languages
English (en)
Other versions
TW201705124A (zh
Inventor
金美英
吳殷美
Original Assignee
三星電子股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 三星電子股份有限公司 filed Critical 三星電子股份有限公司
Publication of TW201705124A publication Critical patent/TW201705124A/zh
Application granted granted Critical
Publication of TWI606441B publication Critical patent/TWI606441B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

解碼裝置
本發明是有關於音訊編碼及解碼而與製造相符的裝置、設備和物品,且特別是有關於雜訊填補方法、音訊解碼方法及裝置、記錄媒體以及使用以上的多媒體設備,其中雜訊填補方法用在沒有額外的資訊下從編碼器產生雜訊信號以及在頻譜洞中填補雜訊信號。
當對音訊信號編碼或解碼時,需要在有限位元數之範圍中有效率地利用有限的位元數來復原具最佳聲音品質之音訊信號。尤其,在低位元率下,音訊信號之編碼及解碼技術是需要來均勻地配置位元至敏銳重要的頻譜成分(spectral component),而代替集中位元到特定的頻率區域。
尤其,在低位元率下,當隨著位元執行編碼而配置到各頻帶,例如子帶(sub-band),由於因為不足夠的位元數而未經編碼的頻率成分,導致可能產生頻譜洞(spectral hole),因此造成聲音品質的下降。
一方面,本發明提供一種用來有效地配置位元到基於子帶敏銳重要的頻率區域之方法和裝置、音訊編碼及解碼裝置、記錄媒體以及使用以上的多媒體設備。
一方面,本發明提供一種用來有效地配置位元到基於子帶而具有低複雜度之敏銳重要的頻率區域之方法和裝置、音訊編碼及解碼裝置、記錄媒體以及使用以上的多媒體設備。
一方面,本發明提供一種用來從編碼器產生沒有額外資訊的雜訊信號並且將此雜訊填補進頻譜洞之雜訊填補方法、音訊解碼方法及裝置、記錄媒體以及使用以上的多媒體設備。
一方面,根據一或更多實施例,本發明提供一種雜訊填補方法,其包括:偵測一頻帶,包含藉由對於一位元串流解碼而從一頻譜獲得一部份經編碼為0;對於經偵測之頻帶產生雜訊成分;以及調節頻帶之能量,藉由利用雜訊成分及包含部份經編碼為0之頻帶之能量來產生及填補頻帶中的雜訊成分。
一方面,根據一或更多實施例,本發明提供一種雜訊填補方法,其包括:偵測一頻帶,包含藉由對於一位元串流解碼而從一頻譜獲得一部份經編碼為0;對於經偵測之頻帶產生雜訊成分;以及調節頻帶之平均能量,藉由利用雜訊成分之能量及包含部分經編碼為0之頻帶中的樣本數來產生及填補為1至頻帶內的雜訊成分。
一方面,根據一或更多實施例,本發明提供一音訊解碼方法,其包括:藉由不失真解碼及反量化在位元串流之經編碼頻譜來產生正規頻譜;藉由利用包含在位元串流中基於各頻帶之頻譜能量來執行正規化頻譜的包絡整形;從經包絡整形之頻譜來偵測包含一部分經編碼為0之頻帶,並且對於經偵測頻帶產生一雜訊成分;以及調節頻帶之能量,藉由利用雜訊成分的能量及包含部份經編碼為0之頻帶的能量來產生及填補頻帶內的雜訊成分。
一方面,根據一或更多實施例,本發明提供一音訊解碼方法,其包括:藉由不失真解碼及反量化包含在位元串流中之經編碼頻譜來產生正規頻譜;從正規化頻譜偵測包含一部分編碼為0之頻帶以及對於經偵測頻帶來產生雜訊成分;藉由利用雜訊成分之能量以及包含部份經編碼為0之頻帶中之樣本數來產生正規化雜訊頻譜,正規化雜訊中之頻譜之平均能量為1,頻譜中雜訊成分經產生且填補;以及藉由利用包含在位元串流中基於各頻帶之頻譜能量來執行正規化頻譜的包絡整形。
在此發明概念是能夠允許各式的改變、調整或是形式上的變更,而指定的實施例將會用圖示說明,並且在說明書裡詳細描述。然而必須讓人了解的是,在此指定的具體實施例並不會將當前說明的發明概念限制成一個特定的揭露形式,而是能夠包含各種調整、等效、或是任何一個能夠以本發明概念的精神及技術範圍下取代的例子。在下列的敘述當中,習知的功能和結構將不會再詳述,因為這些不必要的細節會模糊此發明的描述重點。
雖然在如同‘第一’及‘第二’術語中的用語能夠用來描述不同的元件,但這些元件不能夠限制這術語。這些術語習慣拿來將元件彼此區分。
在應用裡所使用的術語只是拿來描述指定的實施例,而不是有任何發明來限制在本發明概念。當談到此發明概念的功能時,雖然現在盡可能常廣泛地使用的一般項為選擇來使用在本發明概念的術語,這些也許會根據在藝術的普通技能、司法先例,或是新科技的出現的之中的發明而變化。除此之外,在特定的案子中,申請人有意所選擇的術語也許會使用,且在此案中,術語的意義將揭露在對應的發明描述中。相對應地,使用在本發明概念的術語應該不是藉由術語之簡單的名稱來定義,而是藉由術語的意義以及含括在本發明概念中的內容。
一單數的表達式包含一複數的表達式,除非他們在上下文中是很明顯的彼此不同。在應用中,應該要了解的是像是‘包含’及‘具有’這樣的術語是使用來表示實現的特徵、數量、步驟、操作、元件、部分、或一上述之組合的存在,而沒有事先將特徵、數量、步驟、操作、元件、部分、或一上述之組合的存在的可能性或一或更多其附加排除在外。
以下,藉由圖示的參考,本發明概念將全面地更加描述,其實施例將顯示在圖示內。就像圖示中之數字標示參考表示的如同元件一樣,於是它們重複的描述將省略。
如同在此使用的像是表達示“其中至少一”,當把其置於元件列之前,修改的是整個元件列而不是修改個別的元件列。
圖1是根據一實施例的音訊編碼裝置100的方塊圖。
圖1中的音訊編碼裝置100可包含轉換單元130、位元配置單元150、編碼單元170以及多工單元190。音訊編碼裝置100的元件可至少由一模組整合而成且至少以一處理器(例如,中央處理單元(CPU))實現。在此,音訊可以是指聽覺訊號(audio signal)、聲音訊號(voice signal)或是一由上列合成而得到的訊號,但為了方便描述,此後我們泛指音訊為聽覺訊號。
參閱圖1,轉換單元130可藉由將聽覺訊號由時域轉換到頻域而產生音訊頻譜。時域到頻域的轉換可以利用各種習知的方法,例如離散餘弦轉換(Discrete Cosine Transform,DCT)。
位元配置單元150可決定一遮罩臨界值,遮罩臨界值是藉由使用有關於音訊頻譜的頻譜能量或神經聲學模型以及藉由使用頻譜能量而基於在每個子帶上所配置的位元數來得之。在此,子帶是音訊頻譜的群聚樣本的單位,其可能因應不同的臨界帶而有一致或不一致的長度。當多數子帶有不一致的長度時,多數子帶在訊框中所含的樣本數,從起始樣本到最終樣本其將定成逐漸的增加。在此,子帶的數量或是在每個子帶訊框中的樣本數量可能會事先決定,要不就是在訊框分成預定數量的具有一致長度的子帶後,此一致長度將根據頻譜係數的配置來做調節。頻譜係數的配置可能藉由頻譜平坦度量測、最大值和最低值的差,或是最大值的微分值而決定。
根據一實施例,位元配置單元150可能會藉由利用基於各子帶中所得出之正規值估算出可允許位元數,也就是,平均頻譜能量,藉由平均頻譜能量配置位元,以及限制經配置位元數不超過可允許位元數。
編碼單元170可藉由量化和不失真編碼基於經配置位元數之音訊頻譜,來基於各子帶產生最終決定的關於經編碼頻譜的資訊。
多工單元190藉由多路傳輸此位元配置單元150所提供之經編碼正規值,以及編碼單元170所提供之有關經編碼頻譜的資訊,來產生位元串流。
音訊編碼裝置100可對選擇性子帶產生雜訊位準,並且將雜訊位準提供給音訊解碼裝置(圖7中700,圖12中1200)。
圖2是根據一實施例之位元配置單元200的方塊圖,其相對應於圖1中音訊編碼裝置100內的位元配置單元150。
圖2的位元配置單元200可包含正規估算單元210、正規編碼單元230,以及位元估算及配置單元250。
參閱圖2,正規估算單元210可得到正規值,正規值是相對應基於各子帶中的平均頻譜能量。舉例來說,正規值可藉由應用於ITU-T G.719中的方程式1計算求得之,但不以此為限。
(1)
在方程式1中,當P子帶(sub-band)或子部分(sub-sector)存在於一訊框中時,N(p)表示第p子帶或第p子部分的正規值,Lp 表示第p子帶或第p子部分的長度,換而言之,樣本數sp 或頻譜係數ep 分別表示第p子帶或第p子部分中的起始樣本和終止樣本,而y(k)表示樣本大小或是頻譜係數(即能量)。
藉由基於各子帶所得之正規值可提供給編碼單元(圖1中170)。
正規編碼單元230可量化及不失真的對從基於各子帶所得之正規值編碼。從基於各子帶而量化所得之正規值,或是藉由反量化已量化後之正規值所得之正規值可提供至位元估算及配置單元250。從基於各子帶量化及不失真的編碼後而所得之正規值可提供至多工單元(圖1中190)。
位元估算及配置單元250可藉由正規值估算及配置所需的位元數。更好的是,可使用反量化的正規值將,以致於編碼的部份及解碼部份能夠使用一樣的位元估算及配置過程。在本案中,將可能使用一個藉由考慮到遮罩效應的經調節的正規值。舉例來說,可能利用精神聽覺加權來調節正規值,如應用在ITU-T G.719的方程式2,但不以此為限。
(2)
在方程式2中,表示第p子帶經量化之正規值的索引值,表示第p子帶經調節之正規值的索引值,而表示對正規值調節之頻譜補償值。
位元估算及配置單元250可藉由利用基於各子帶之正規值計算出遮罩臨界值,並藉由遮罩臨界值估算出可察覺所需位元數。為達成此目的,如方程式3所示,基於各子帶所得之正規值可能等效地以dB單位表示頻譜能量。
(3)
就一個藉由使用頻譜能量來得到遮罩臨界值的方法而言,使用已有各種不同習知的方法。也就是,遮罩臨界值是與正好可察覺失真(Just Noticeable Distortion,JND)符合的值,而當一個量化雜訊比遮罩臨界值還低的時候,將不會察覺感知雜訊。於是,不被察覺的感知雜訊所需之最小位元數,可利用遮罩臨界值計算出來。舉例來說,可計算出信號遮罩比(Signal-to-Mask Ratio,SMR),藉由利用正規值對基於各子帶之遮罩臨界值的比率,並且對於所計算的SMR值,其滿足遮罩臨界值的位元數可能將利用6.025 dB ≒ 1 bit的關係式估算出來。雖然估算出來的位元數是所需不被察覺的感知雜訊之位元數的最低值,就壓縮而論,既然使用超過經估算位元數是沒有必要的,經估算位元數可視為成基於各子帶可允許位元數的最大值(在其下,經允許位元數)。可以小數點單位(decimal point unit)表示各子帶的經允許位元數。
位元估算及配置單元250可藉由利用基於各子帶的正規值以小數點單位執行位元配置。在此案例中,將依照各子帶之正規值一個比一個大的順序配置位元,而且可能調節成更多的位元,更多的位元是基於各個子帶藉由根據各子帶有關的正規值的可察覺重要性而配置到可察覺重要的子帶中。舉例說明,可察覺重要性可能透過ITU-T G.719中的精神聽覺加權而決定。
位元估算及配置單元250可依照各子帶之正規值一個比一個大的順序配置位元。換而言之,首先將對一個有最大正規值的子帶配置每個樣本的位元,而將改變有最大正規值之子帶的優先順序,此改變是藉由預設的單位將各子帶的正規值改成越來越小,於是位元將會經配置到其他的子帶。此過程在給定的訊框中會重複執行,直到總數為B的可允許位元數完全配置完畢。
位元估算及配置單元250可最後藉由限制經配置位元數不超過估算位元數來決定經配置的位元數。也就是對於每個子帶的可允許位元數。對所有的子帶而言,經配置位元數會與估算位元數比較,而如果經配置位元數大於估算位元數,經配置位元數會限制為估算位元數內。給定訊框中所有子帶的經配置位元數如前述所得的結果即為位元數的限制,如果給定訊框內所有子帶的經配置位元數比總可允許位元數B還小的話,位元數對應前述的不同,將可能均勻地分布在所有的子帶中或是根據可察覺重要性而非均勻地分布。
既然對於各子帶的可配置位元數能以小數點單位決定出來,而且限制為可允許位元數內,將可有效地分布在給定訊框中的總位元數。
根據一實施例,一個對各子帶估算和配置所需位元數的詳細方法如下所示。根據此方法,因為對各子帶的配置位元數能夠一次就決定出來,而不需要重複數次,將可降低複雜度。
舉例說明,一個可能達成最佳量化失真的和對各子帶經配置位元數解決方法,可能由實施表示於方程式4的Lagrange函數得之
(4)
在方程式4中,L表示Lagrange函數,D表示量化失真,B表示在給定訊框可允許總位元數,Nb 表示第b子帶的樣本數,而Lb 表示第b子帶中的各樣本的經配置位元數。在此,Nb Lb 表示第b子帶的經配置位元數,Λ表示Lagrange乘數作為最佳化係數。
藉由使用方程式4,當在考慮量化失真時,可能決定出Lb 以對於最小化包含在給定訊框中對各子帶經配置總位元數和可允許位元數之間的差。
量化失真D可藉由方程式5來表示。
(5)
在方程式5中,表示輸入頻譜,而表示解碼頻譜。在此,量化失真D可能表示為在一個隨意的訊框中關於輸入頻譜和解碼頻譜的均方誤差(Mean Square Error,MSE)。
方程式5之分母是藉由給定輸入頻譜所定出的常數,而對應地,既然方程式5中的分母不會影響到最佳化,方程式5可藉由方程式6化簡之。
(6)
藉由方程式7可定義正規值為有關輸入頻譜第b子帶的平均頻譜能量,藉由方程式8可定義正規值為對數量度量化,藉由方程式9可定義反量化正規值
(7)
(8)
(9)
在方程式7中,sb 和eb 分別表示在第b子帶的起始樣本和最終樣本。
例如在方程式10中,正規化頻譜yi 是藉由將輸入頻譜除以反量化正規值而得之,而例如在方程式11中,解碼頻譜是藉由將復原的正規化頻譜乘以反量化正規值而得之。
(10)
(11)
量化失真項可藉由使用方程式9到11而安排在方程式12之中。
(12)
通常,從量化失真和經配置位元數之間的關係可得知,每增加一樣本而增加一位元,其信號對雜訊比(Signal-to-Noise Ratio,SNR)會增加6.02 dB,而藉由使用此關係,可定義正規頻譜的量化失真於方程式13中。
(13)
在一真實音訊編碼案例中,方程式14可藉由實施dB度量值C而表示之,其值可因對應信號特徵而改變,但1位元/樣本(bit/sample) ≒ 6.025 dB的關係式是不會改變的。
(14)
在方程式14中,當C值為2,1位元/樣本 會對應為6.02 dB,而當C值為3,1位元/樣本 會對應為9.03 dB。
於是,方程式6可藉由方程式12和14而表示成方程式15。
(15)
為了從方程式15得到最理想的Lb 和λ,如同方程式16中對於Lb 和λ執行偏微分。
(16)
當方程式16已安排時,可藉由方程式17表示Lb
(17)
藉由使用方程式17,對於每個子帶樣本的經配置位元數可在給定訊框中可允許總位元數B的範圍內估算出,其對於每個子帶樣本的經配置位元數可將輸入頻譜的SNR值最大化。
藉由位元估算及配置單元250而決定出的基於各子帶的經配置位元數,可提供給編碼單元(圖1中170)。
圖3是根據另一實施例之位元配置單元300的方塊圖,對應於圖1中音訊編碼裝置100內位元配置單元150。
圖3中位元配置單元300可包含神經聽覺模型單元310、位元估算及配置單元330、度量因子估算單元350以及度量因子編碼單元370。位元配置單元300可由至少一模組集結而成,且至少由一處理器來實現。
參閱圖3,神經聽覺模型單元310可藉由從轉換單元(圖1中130)接收音訊頻譜而得到對於各子帶遮罩臨界值。
位元估算及配置單元330可藉由基於各子帶使用遮罩臨界值估算出可察覺所需位元數。也就是,可計算出基於各子帶SMR值,且對於經計算出的SMR值,滿足遮罩臨界值的位元數可藉由6.025 dB ≒ 1 bit的關係式估算出。雖然經估算位元數是不被察覺的感知雜訊所需位元數的最低值,既然就壓縮而論,使用超過經估算位元數是沒有必要的,經估算位元數可視為成基於各子帶之可允許位元數的最大值(此後稱為可允許位元數)。各子帶的可允許位元數能以小數點單位表示之。
位元估算及配置單元330可基於各子帶藉由使用頻譜能量以小數點單位執行位元配置。舉例來說在此案中,位元配置方法可利用方程式7到20來使用。
位元估算及配置單元330會比較所有子帶中的經配置位元數與經估算位元數,如果經配置位元數大於經估算位元數,經配置位元數會限制為經估算位元數內。給定訊框中所有子帶的經配置位元數如前述所得的結果即為位元數的限制,如果給定訊框內所有子帶的經配置位元數比總可允許位元數B還小的話,位元數對應前述的不同,將可能均勻地分布在所有的子帶中或是根據可察覺重要性而非均勻地分布。
度量因子估算單元350可利用最後經決定出之基於各子帶經配置位元數估算出度量因子。可提供基於各子帶的度量因子至編碼單元(圖1中170)。
度量因子編碼單元370可量化且不失真編碼基於各子帶經估算度量因子。可提供已編碼之基於各子帶度量因子至多工單元(圖1中190)。
圖4是根據另一實施例之位元配置單元400的方塊圖,對應於圖1中音訊編碼裝置100內位元配置單元150。
圖4中位元配置單元400,可包含正規估算單元410、位元估算及配置單元430、度量因子估算單元450以及度量因子編碼單元470。位元配置單元400可由至少一模組集結而成,且至少由一處理器來實現。
參閱圖4,正規估算單元410可得到基於各子帶之對應平均頻譜能量的正規值。
位元估算及配置單元430可藉由利用基於各子帶的頻譜能量得到遮罩臨界值,且估算可察覺所需位元數,也就是藉由利用遮罩臨界值所得之可允許位元數。
位元估算及配置單元430可基於各子帶藉由使用頻譜能量以小數點單位執行位元配置。舉例來說在此案中,位元配置方法可利用方程式7到20來使用。
位元估算及配置單元430會比較所有子帶中的經配置位元數與經估算位元數,如果經配置位元數大於經估算位元數,經配置位元數會限制為經估算位元數內。給定訊框中所有子帶的經配置位元數如前述所得的結果即為位元數的限制,如果給定訊框內所有子帶的經配置位元數比總可允許位元數B還小的話,位元數對應前述的不同,將可能均勻地分布在所有的子帶中或是根據可察覺重要性而非均勻地分布。
度量因子估算單元450可利用最後經決定出之基於各子帶經配置位元數估算出度量因子。基於各子帶的度量因子可提供至編碼單元(圖1中170)。
度量因子編碼單元470可量化且不失真編碼基於各子帶經估算度量因子。可提供已編碼之基於各子帶度量因子至多工單元(圖1中190)。
圖5是根據另一實施例之編碼單元500的方塊圖,對應於圖1中音訊編碼裝置100內編碼單元170。
圖5中位元配置單元500,可包含頻譜正規化單元510以及頻譜編碼單元530。編碼單元500可由至少一模組集結而成,且至少由一處理器來實現。
參閱圖5,頻譜正規化單元510可藉由利用位元配置單元(圖1中150)提供之正規值正規化頻譜。
頻譜編碼單元530可藉由利用各子帶之經配置位元數來量化正規化頻譜,並且不失真編碼量化的結果。舉例來說,階乘脈衝編碼(factorial pulse coding)可用在頻譜編碼,但不以此為限。根據階乘脈衝編碼,像是脈衝位置、脈衝強度、以及脈衝信號的資訊,可能表示成在經配置位元數之範圍內的階乘形式。
關於藉由頻譜編碼單元530編碼之頻譜可提供至多工單元(圖1中190)。
圖6是根據另一實施例之音訊編碼裝置600的方塊圖。
圖6中的音訊編碼裝置600可包含暫態偵測單元610、轉換單元630、位元配置單元650、編碼單元670以及多工單元690。音訊編碼裝置600的元件可至少由一個模組整合而成且至少以一個處理器實現。當與圖1的音訊編碼裝置100比較後會有一個差異,因為在圖6中音訊編碼裝置600更包含了暫態偵測單元610,其相同元件的詳述在此將省略。
參閱圖6,暫態偵測單元610可藉由分析音訊信號來偵測代表暫態特徵的間隔。可用各種不同習知的方法使用在偵測暫態區間上。暫態偵測單元610所提供的暫態訊號資訊可能會透過多工單元690而包含在位元串流。
轉換單元630可根據暫態區間偵測結果來決定出轉換的使用視窗大小,並且基於給定的視窗大小來執行時域到頻域間的轉換。舉例來說,短視窗可實施於其暫態間隔已經偵測的子帶,而長視窗可實施於其暫態間隔未經偵測的子帶。
位元配置單元650可分別藉由圖2、圖3及圖4中之位元配置單元200、300及400來實現。
編碼單元670可根據暫態區間偵測結果來定出用來編碼之視窗大小。
音訊編碼裝置600可對選擇性子帶產生雜訊位準,並且提供此雜訊位準給音訊解碼裝置(圖7中700,圖12中1200)。
圖7是根據一實施例之音訊解碼裝置700的方塊圖。
圖7中的音訊解碼裝置700可包含解多工單位710、位元配置單元730、解碼單元750以及反轉換單元770。音訊編碼裝置700的元件至少可能由一個模組整合而成且至少以一個處理器實現。
參閱圖7,解多工單元710可將位元串流解多工而析出量化且不失真編碼之正規值,以及關於編碼頻譜的資訊。
位元配置單元730可藉由從基於各子帶的量化及不失真編碼之正規值得到反量化正規值,以及藉由利用反量化正規值來決定經配置位元數。位元配置單元730在本質地操作上可和音訊編碼裝置100或600內的位元配置單元150或650相同。當正規值在音訊編碼裝置100或600中藉由精神聽覺加權調節時,反量化正規值可以同樣的方法,藉由音訊解碼裝置700來達成調節。
解碼單元750可藉由使用從解多工單元710提供之關於經編碼頻譜的資訊來不失真解碼以及反量化經編碼頻譜。舉例來說,脈衝解碼可用來對頻譜解碼。
反轉換單元770可藉由轉換解碼頻譜為時域,來產生復原的音訊信號。
圖8是根據另一實施例之位元配置單元800的方塊圖,對應在圖7中音訊解碼裝置700內位元配置單元730。
圖8中的位元配置單元800可包含正規解碼單元810以及位元估算及配置單元830。位元配置800的元件至少可能由一模組整合而成且至少以一個處理器實現。
參閱圖8,正規解碼單元810可藉由使用從解多工單元(圖7中710)提供之量化及不失真編碼之正規值得到反量化正規值。
位元估算及配置單元830可藉由利用反量化正規值來決定出經配置位元數。詳細而論,該位元估算及配置單元830可藉由利用頻譜能量得到遮罩臨界值,也就是基於各子帶且估算可察覺所需位元數的正規值,也就是藉由利用遮罩臨界值的可允許位元數。
位元估算及配置單元830可藉由使用頻譜能量以小數點單位執行位元配置,也就是基於各子帶的正規值。舉例來說在此案中,位元配置方法可利用方程式7到20來使用。
位元估算及配置單元830會比較所有子帶中的經配置位元數與經估算位元數,如果經配置位元數大於經估算位元數,經配置位元數會限制為經估算位元數內。給定訊框中所有子帶的經配置位元數如前述所得的結果即為位元數的限制,如果給定訊框內所有子帶的經配置位元數比總可允許位元數B還小的話,位元數對應前述的不同,將可能均勻地分布在所有的子帶中或是根據可察覺重要性而非均勻地分布。
圖9是根據一實施例之解碼單元900的方塊圖,對應在圖7中音訊解碼裝置700內解碼單元750。
圖9中的解碼單元900可包含頻譜解碼單元910、包絡整形單元930以及頻譜填補單元950。解碼單元900的元件至少可由一模組整合而成且至少以一個處理器實現。
參閱圖9,頻譜解碼單元910可藉由使用從解多工單元(圖7中710)提供之關於經編碼頻譜的資訊,以及位元配置單元(圖7中730)所提供之經配置位元數,來不失真解碼以及反量化經編碼頻譜。從解碼單元910所得之經解碼頻譜是正規化頻譜。
包絡整形單元930可在正規化之前藉由對正規化頻譜執行包絡整形來復原頻譜,正規化頻譜是由頻譜解碼單元910藉由從位元配置單元(圖7中730)使用反量化正規值而得之。
當包含經反量化為0之部分之子帶存在於由包絡整形單元930所提供之頻譜時,頻譜填補單元950可填補雜訊成分於子帶中經反量化為0之部分。根據另一實施例,可隨機地產生雜訊成分,或是藉由複製經反量化為非0之子帶的頻譜而產生,其雜訊鄰近於包含經反量化為0部分之子帶或是經反量化為非0之子帶的頻譜。根據另一實施例,調節可調節雜訊成分的能量,藉由對包含經反量化為0之部分的子帶產生經調節的雜訊成分,以及利用雜訊成分之能量對位元配置單元(圖7中730)來調節所提供之反量化正規值的比率,這比率也就是頻譜能量。根據另一實施例,可產生包含經反量化為0之部分的子帶的雜訊成分,且雜訊成分的平均能量可調節為1。
圖10是根據另一實施例之解碼單元1000的方塊圖,對應在圖7中音訊解碼裝置700內解碼單元750。
圖10中的解碼單元1000可包含頻譜解碼單元1010、頻譜填補單元1030以及包絡整形單元1050。解碼單元1000的元件至少可由一模組整合而成且至少以一個處理器實現。當圖10的解碼單元1000與圖9的解碼單元900比較後會有差異,其因為頻譜填補單元1030和包絡整形單元1050的安置的不同,其相同元件的詳述在此將省略。
參閱圖10,當包含一部分經反量化為0之子帶存在於由頻譜解碼單元1010所提供之正規化頻譜,頻譜填補單元1030可填補ㄧ雜訊成分於子帶中經反量化為0的部分。在此案中,各種不同的雜訊填補方法可使用來實施在圖9中頻譜填充單元950。最好的是,對於包含一部分經反量化為0之子帶,可產生雜訊成分,且雜訊成分的平均能量會調節為1。
包絡整形單元1050可在正規化之前復原頻譜,其對於頻譜包含藉由利用從位元配置單元(圖7中730)所得之反量化正規值而以雜訊成分填補之子帶。
圖11是根據另一實施例之音訊解碼裝置1100的方塊圖。
圖11中的音訊解碼裝置1100可包含解多工單位1110、度量因子解碼單元1130、頻譜解碼單元1150以及反轉換單元1170。音訊編碼裝置1100的元件至少可由一個模組整合而成且至少以一個處理器實現。
參閱圖11,解多工單元1110可將位元串流解多工而析出一經量化且不失真-經編碼(quantized and lossless-encoded)之度量因子,以及關於經編碼頻譜的資訊。
度量因子解碼單元1130可基於各子帶不失真解碼及反量化所述經量化且不失真-經編碼之度量因子。
頻譜解碼單元1150可藉由使用關於經編碼頻譜的資訊以及從解多工單元1110提供之度量因子來不失真解碼以及反量化經編碼頻譜。頻譜解碼單元1150可包含例如圖9中解碼單元900的相同元件。
反轉換單元1170可藉由頻譜解碼單元1150來轉換已解碼之頻譜至時域以產生經復原音訊信號。
圖12是根據另一實施例,音訊解碼裝置1200的一方塊圖。
圖12中的音訊解碼裝置1200可包含解多工單位1210、位元配置單元1230、解碼單元1250以及反轉換單元1270。音訊編碼裝置1200的元件至少可由一個模組整合而成且至少以一個處理器實現。
當圖12的音訊解碼裝置1200與圖7的音訊解碼裝置700比較後,會有差異在於其暫態訊號資訊是提供至解碼單元1250及反轉換單元1270,其相同元件的詳述在此將省略。
參閱圖12,解碼單元1250可藉由利用由解多工單元1210所提供的關於經編碼頻譜之資訊來解碼頻譜。在此案中,視窗大小可根據暫態訊號資訊而改變。
反轉換單元1270可藉由轉換已解碼之頻譜至時域來產生經復原音訊信號。在此案中,視窗大小可根據暫態訊號資訊而改變。
圖13是根據一實施例之位元配置方法的流程圖。
參閱圖13,在步驟1310中獲取各子帶的頻譜能量。頻譜能量可為正規值。
在步驟1320中,藉由實施基於各子帶之精神聽覺加權而調節量化正規值。
在步驟1330中,藉由利用基於各子帶調節量化正規值而配置位元。詳細而論,每樣本1位元是從具有較大的經調節之量化正規值之子帶來依序配置。也就是,對於具有最大經調節之量化正規值為5之子帶來說,配置每樣本1位元,而具有最大經調節之量化正規值之子帶的優先權會藉由減少子帶的量化正規值為2來改變,如此來讓位元配置到另一子帶。此過程會重複地執行直到在給定訊框中總可允許位元數明確地配置完。
圖14是根據另一實施例之位元配置方法的流程圖。
參閱圖14,在步驟1410中獲取各子帶的頻譜能量。頻譜能量可為正規值。
在步驟1420中,藉由利用基於各子帶之頻譜能量獲取遮罩臨界值。
在步驟1430中,藉由利用基於各子帶之遮罩臨界值以小數點單位估算出可允許位元數。
在步驟1440中,基於各子帶及基於頻譜能量的位元以小數點單位配置
在步驟1450中,基於各子帶之可允許位元數與經配置位元數相比較。
在步驟1460中,如果步驟1450中比較的結果為,對於給定子帶中經配置位元數大於可允許位元數,經配置位元數將限制為可允許位元數內。
在步驟1470中,如果步驟1450中比較的結果為,對於給定子帶中經配置位元數小於可允許位元數,經配置位元數將如同以往地使用,或者最終對於各子帶之經配置位元數是藉由利用可允許位元數,如同在步驟1460中限制的結果來決定之。
雖然沒有繪示,在步驟1470中定出之在給定訊框中對所有子帶之經配置位元數的總和,如果是較小或較大於給定訊框中之總可允許位元數,對應於不同的差異是,位元數可根據可察覺重要性均勻地分布在所有的子帶或是非均勻地分布之。
圖15是根據另一實施例之位元配置方法的流程圖。
參閱圖15,在步驟1500中獲取各子帶的反量化正規值。
在步驟1510中,藉由利用基於各子帶之反量化正規值獲取遮罩臨界值。
在步驟1520中,藉由利用基於各子帶之遮罩臨界值獲取SMR值。
在步驟1530中,藉由利用基於各子帶之SMR值以小數點單位估算出可允許位元數。
在步驟1540中,基於各子帶及基於頻譜能量(或反量化正規值)的位元以小數點單位配置。
在步驟1550中,基於各子帶之可允許位元數與經配置位元數相比較。
在步驟1560中,如果步驟1550中比較的結果為,對於給定子帶中經配置位元數大於可允許位元數,經配置位元數將限制為可允許位元數內。
在步驟1570中,如果步驟1550中比較的結果為,對於給定子帶中經配置位元數小於或等於可允許位元數,經配置位元數將例如以往地使用,或者最終對於各子帶之經配置位元數是藉由利用可允許位元數,例如在步驟1560中限制的結果來決定之。
雖然沒有繪示,在步驟1570中定出之在給定訊框中對所有子帶之經配置位元數的總和,如果是較小或較大於給定訊框中之總可允許位元數,位元數對應於不同的差異是,位元數可根據可察覺重要性均勻地分布在所有的子帶或是非均勻地分布之。
圖16是根據另一實施例之位元配置方法的流程圖。
參閱圖16,在步驟1610中將執行初始化。舉一個初始化的例子,當對各子帶之經配置位元數藉由利用方程式20估算時,對於所有子帶之整體複雜度可藉由計算常數值來降低。
在步驟1620中,對各子帶之經配置位元數藉由利用方程式17以小數點單位估算出。對各子帶之經配置位元數可藉由用每樣本經配置位元數Lb 乘以各子帶之每樣本之位元而獲得。當每樣本之位元之經配置位元數Lb 藉由利用方程式17計算出時,Lb 可具有小於0的值。在此案中例如方程式18所示,具有小於0之Lb 值會配置為0。
(18)
結果就是,包含在給定訊框中對所有子帶中經估算出的經配置位元數之總和,也許可大於在給定訊框中的可允許位元數B。
在步驟1630中,包含在給定訊框中之對於所有子帶之經配置位元數的總和與在給定訊框中可允許位元數B相比較。
在步驟1640中,藉由利用方程式19來對各子帶之位元重新分布,直到估算的包含在給定訊框中對所有子帶之經配置位元數總和相同於給定訊框中可允許位元數B。
(19)
在方程式19中,表示藉由第(k-1)次循環而決定出的位元數,而表示藉由第k次循環而決定出的位元數。藉由每次循環決定出的位元數必須不小於0,而對應地,在步驟1640對子帶執行是具有大於0的位元數。
在步驟1650中,如果步驟1630中比較的結果為,經估算的包含在給定訊框中對所有子帶之經配置位元數之總和同等於在給定訊框中可允許位元數B,各子帶之經配置位元數將如同以往地使用,或者最終對於各子帶之經配置位元數是藉由利用各子帶之經配置位元數,如同在步驟1640中重新分配的結果來決定之。
圖17是根據另一實施例之位元配置方法的流程圖。
參閱圖17,就像圖16中的步驟1610,在步驟1710中將執行初始化。就像圖16中的步驟1620,在步驟1720中,對各子帶之經配置位元數以小數點單位估算出,當各子帶之每樣本之經配置位元數Lb 小於0時,如同方程式18所示具有小於0之Lb 值會配置為0。
在步驟1730中,對各子帶之所需位元數的最低值以SNR的術語定義之,而在步驟1720中,大於0以及小於位元數之最低值的經配置位元數,會藉由限制經配置位元數為位元數的最低值來調節。就其本身而論,藉由限制各子帶之經配置位元數為位元數之最低值,減少降低聲音品質的可能性。舉例來說,在階乘脈衝編碼時,對於各子帶之所需位元數之最低值定義為對於脈衝編碼之所需位元數之最低值。階乘脈衝編碼藉由利用所有組合表示一訊號,其組合為非0脈衝位置、脈衝強度、以及脈衝信號的組合。在此案中,能表示脈衝之所有組合之偶發性數字N可藉由方程式20表示之。
(20)
在方程式20中,2i 表示偶發性信號之數字,其可用+/-來表示訊號在非0位置i上。
在方程式20中,F(n, i) 可藉由方程式21來定義,此方程式表示在給定n個樣本之對於選擇非0位置i之偶發性(occasional)數字,也就是位置。
(21)
在方程式20中,D(m, i)可藉由方程式22來表示,此方程式為對於表示在位置i經選擇之非0位置訊號之強度為m的偶發性數字。
(22)
所需位元之數字M來表示組合N,可藉由方程式23來表示。
(23)
其結果為,所需位元數之最低值Lb_min 對於編碼在給定第b子帶之對於樣本Nb 之值為1之脈衝的最低值,可藉由方程式24來表示。
(24)
在此案中,對於量化之經使用於傳送所需增益值的位元數可以階乘脈衝編碼加至所需位元數之最低值,並且可根據位元率而改變。基於各子帶之所需位元數的最低值可藉由從以階乘脈衝編碼之所需位元數之最低值之中的較大值決定出,以及在給定子帶之樣本數Nb 可於方程式25所示。舉例來說,基於各子帶之所需位元數的最低值,其值在每個樣本可設定為1位元。
(25)
當在步驟1730中位元經使用至不足夠時,既然標的位元率是小的,對於一子帶其經配置位元數大於0且小於位元數之最低值,移除經配置位元數而調節為0。除此之外,對一子帶其經配置位元數小於方程式24之所得時,可移除經配置位元數,並且對一子帶其經配置位元數大於方程式24之所得且小於方程式25的位元數最低值,可配置位元數之最低值。
在步驟1740中,在給定訊框中對於所有子帶之經配置位元數的總和會與在給定訊框中之可允許位元數相比較。
在步驟1750中,對一子帶之位元重新分布至其大於經配置位元數之最低值,直到估算的包含在給定訊框中對所有子帶之經配置位元數總和同等於給定訊框中可允許位元數。
在步驟1760中,不管各子帶之位元經配置位元數,在對於位元重新分布的先前之循環以及現在之循環之間,都將決定以改變。如果各子帶之經配置位元數在對於位元重新分布的先前之循環以及現在之循環之間沒有改變,或者直到估算的包含在給定訊框中對所有子帶之經配置位元數總和同等於給定訊框中可允許位元數,將執行步驟1740到1760。
在步驟1770中,如果如同在步驟1760中的決定結果,各子帶之經配置位元數在對於位元重新分布的先前之循環以及現在之循環之間沒有改變,會依序從最頂端子帶至最底端子帶移除位元,而將執行步驟1740到1760直到滿足於給定訊框中可允許位元數。
這也就是,對於一子帶其經配置位元數大於方程式25之位元數之最低值,當減少經配置位元數時執行經調節之運作,直到滿足於給定訊框中可允許位元數。如此之外,如果對於所有子帶經配置位元數同等於或小於方程式25之位元數之最低值,且在給定訊框中對所有子帶之經配置位元數總和大於給定訊框中可允許位元數,經配置位元數可從高頻帶至低頻帶移除。
根據如圖16及17的位元配置方法,對各子帶配置位元,在初始位元以一個頻譜能量或頻譜能量加權的次序配置到各子帶之後,對各子帶之所需位元數可一次就估算出,而不需要重複好幾次搜尋頻譜能量或加權頻譜能量之運作循環。除此之外,藉由重新分布位元至各子帶直到估算的包含在給定訊框中對所有子帶之經配置位元數總和相同於給定訊框中可允許位元數,有效的位元配置是可能達成的。又除此之外,藉由保證對任意子帶之位元數之最低值,要避免頻譜洞生成的發生也許是由於較小位元數的配置,所以充足的頻譜樣本數或脈衝數不能編碼之。
圖18是根據一實施例之雜訊填補方法的流程圖。圖18之雜訊填補方法可藉由圖9中解碼單元900來執行。
參閱圖18,在步驟1810中,藉由對位元串流執行頻譜解碼過程而產生正規化頻譜。
在步驟1830中,頻譜在正規化之前藉由對正規化頻譜執行包絡整形而復原,正規化頻譜是藉由利用包含在字元串流之基於各子帶的編碼正規值。
在步驟1850中,產生雜訊信號且填補進包含頻譜洞之子帶。
在步驟1870中,具有雜訊信號產生並填補入的子帶經整形。細節而論,對於具有雜訊信號產生並填補入的子帶,增益值gb 可藉由利用頻譜能量比率Etarget 計算出,頻譜能量比率Etarget 是藉由將對應子帶之對應平均頻譜能量的正規值與對於所產生雜訊信號之能量Enoise 的對應子帶樣本數來相成得之,例如方程式26。
(26)
如果頻譜成分經編碼且包含在具有雜訊信號產生並填補入的子帶中,在此案中,除了經編碼頻譜成分Ecoded 外,求得產生雜訊信號之能量Enoise ,以及與增益值gb ’可藉由方程式27來定義之。
(27)
最終雜訊頻譜S(k)藉由方程式28以及藉由實施增益值gb 或 gb ’來產生,增益值gb 或gb ’是藉由方程式26或27中,對於具有雜訊信號N(k)產生並填補入且執行雜訊整形的子帶中而得之。
(28)
如果一子帶中的一些頻譜成分已經經編碼,雜訊信號可藉由比較經編碼頻譜成分的脈衝數、經編碼頻譜成分能量的強度或對於具有各自臨界值之子帶的經配置位元數來產生。這也就是,如果一子帶中的一些頻譜成分已經經編碼,當預設情況滿足且然後執行雜訊填補運作時,可選擇性的產生雜訊信號。
圖19是根據另一實施例之雜訊填補方法的流程圖。圖19之雜訊填補方法可藉由圖10中解碼單元1000來執行。
參閱圖19,在步驟1910中,藉由對位元串流執行頻譜解碼過程而產生正規化頻譜。
在步驟1930中,產生雜訊信號且經填補進包含頻譜洞之子帶。
在步驟1950中,就像在步驟1910中產生之正規化頻譜,在步驟1930中其子帶包含雜訊信號的平均能量經調節為1。詳細而論,當在給定訊框中之樣本數為Nb ,且雜訊信號的能量為Enoise ,則增益值gb 可藉由方程式29而獲得。
(29)
如果頻譜成分經編碼且包含在具有雜訊信號產生並填補入的子帶中,在此案中,除了編碼頻譜成分Ecoded 外,求得產生雜訊信號之能量Enoise ,以及與增益值gb ’可藉由方程式30來定義之。
(30)
最終雜訊頻譜S(k)藉由方程式28以及藉由實施增益值gb 或gb ’來產生,增益值gb 或gb ’是藉由方程式29或30中,對於具有雜訊信號N(k)產生並填補入且執行雜訊整形的子帶中而得之。
在步驟1970中,頻譜在正規化之前藉由對正規化頻譜執行包絡整形而復原,其正規化頻譜是藉由利用包含在各子帶之編碼正規值,來包含在步驟1950中正規化之雜訊頻譜。
圖14至圖19的方法可藉由至少一處理裝置,例如中央處理單元(CPU),來程式化且執行。
根據一實施例,圖20是包含編碼模組之多媒體裝置的方塊圖。
參閱圖20,多媒體裝置2000可包含通訊單元2010以及編碼模組2030。此外,多媒體裝置2000可進一步包含儲存單元2050用來儲存音訊位元串流,其音訊位元串流例如根據音訊位元串流的使用之編碼結果而得之。再者,多媒體裝置2000可更進一步包含麥克風2070。這也就是,可選擇性地包含儲存單元2050以及麥克風2070。多媒體裝置2000可更進一步包含任意的解碼模組(未繪示),例如用來執行普通解碼功能之解碼模組,或是根據一實施例之解碼模組。可藉由至少一處理器實現編碼模組2030,例如中央處理單元(未繪示),以及藉由其他的元件(未繪示)包含進多媒體裝置2000中例如一體來整合而成。
通訊單元2010可接收至少一音訊信號或從外界提供編碼位元串流,或是傳送至少一經復原音訊信號或如同藉由編碼模組2030之編碼結果而得的經編碼位元串流。
通訊單元2010是安裝來透過無線網路來對外在多媒體裝置以傳輸及接收資料,無線網路例如無線網際網路、無線企業內部網路、無線電話網路、無線區域網路(LAN)、無線網路(Wi-Fi)、Wi-Fi Direct(WFD)、第三代無線通訊技術(3G)、***無線通訊技術(4G)、藍芽、紅外線數據聯盟(Infrared Data Association ,IrDA)、無線射頻辨識(RFID)、超寬頻(Ultra Wide Band,UWB)、Zigbee、或近場通信(Near Field Communication,NFC),或是有線網路,如同有線電話網路或有線網際網路。
根據一實施例,編碼模組2030可藉由轉換時域之音訊信號成頻域之音訊頻譜來產生位元串流,而音訊信號是透過通訊單元2010或麥克風2070來提供,基於頻帶以小數點單位來決定經配置位元數,如此在音訊頻譜之給定訊框中的可允許位元數範圍中存在於預設頻帶之頻譜的SNR值會最大化,基於頻帶來調節決定之經配置位元數,且藉由利用基於頻帶及頻譜能量之經調節的位元數來編碼音訊頻譜。
根據另一實施例,編碼模組2030可藉由轉換時域之音訊信號成頻域之音訊頻譜來產生位元串流,而音訊信號是透過通訊單元2010或麥克風2070來提供,藉由基於包含在給定音訊頻譜訊框之頻帶利用遮罩臨界值而以小數點單位估算可允許位元數,藉由利用頻譜能量來以小數點單位估算經配置位元數,調節經配置位元數不要超過可允許位元數,且藉由利用基於頻帶及頻譜能量之經調節的位元數來編碼音訊頻譜。
儲存單元2050可儲存由編碼模組2030產生的編碼位元串流。除此之外,儲存單元2050可儲存用於操作多媒體裝置2000的各種不同需求的程式。
麥克風2070可從使用者或外界來提供音訊信號至編碼模組2030。
根據一實施例,圖21是包含解碼模組之多媒體裝置的方塊圖。
在圖21中,多媒體裝置2100可包含通訊單元2110以及解碼模組2130。除此之外,圖21之多媒體裝置2100可進一步包含儲存單元2150用來儲存ㄧ經復原音訊信號。再來,圖21之多媒體裝置2100可更進一步包含揚聲器2170。這也就是,儲存單元2150以及揚聲器2170是選擇性的。圖21之多媒體裝置2100可更進一步包含編碼模組(未繪示),例如用來執行普通編碼功能之編碼模組,或是根據一實施例之解碼模組。解碼模組2130可藉由至少一處理器實現,例如中央處理單元(CPU)(未繪示),以及藉由其他的元件(未繪示)包含進多媒體裝置2100來整合而成。
參閱圖21,通訊單元2110可從接收從外界提供的至少音訊信號或編碼位元串流,或是傳送至少一解碼模組2130的解碼結果而得的經復原音訊信號或是編碼結果而得的音訊位元串流。通訊單元2110本質上可近似圖20中的通訊單元2010而實現。
根據一實施例,解碼模組2130可藉由接收透過通訊單元2110所提供之位元串流來產生經復原音訊信號,基於頻帶以小數點單位來決定經配置位元數,如此在音訊頻譜之給定訊框中的可允許位元數範圍中存在於預設頻帶之頻譜的SNR值會最大化,基於頻帶來調節決定之經配置位元數,藉由使用基於各頻帶及頻譜能量之經調節位元數來解碼包含在位元串流內之音訊頻譜,以及轉換解碼音訊頻譜成為時域音訊信號。
根據另一實施例,解碼模組2130可藉由接收透過通訊單元2110所提供位元串流來產生位元串流,藉由利用包含在給定訊框中基於頻帶遮罩臨界值以小數點單位估算可允許位元數,藉由利用頻譜能量以小數點單位估算經配置位元數,調節經配置位元數不超過可允許位元數,藉由利用基於頻帶及頻譜能量之經調節位元數來對包含在位元串流之音訊頻譜進行解碼,以及將解碼音訊頻譜轉換為時域音訊信號。
根據一實施例,解碼模組2130可對於包含一部分經解量化為0之子帶產生雜訊成分,以及藉由利用雜訊成分能量對反量化正規值的比率(如頻譜能量)來調節雜訊成分能量。根據另一實施例,解碼模組2130可對於子帶其包含一部份經反量化為0來產生雜訊成分,並調節雜訊成分之平均能量為1。
儲存單元2150可儲存藉由解碼模組2130所產生的經復原音訊信號。除此之外,儲存單元2150可儲存用來操作多媒體裝置2100的各種不同需求的程式。
揚聲器2170可輸出解碼模組2130所產生之經復原音訊信號到外界。
根據一實施例,圖22是包含編碼模組以及解碼模組之多媒體裝置的方塊圖。
在圖22中,多媒體裝置2200可包含通訊單元2210、編碼模組2220以及解碼模組2230。除此之外,多媒體裝置2200可進一步包含儲存單元2240用來儲存音訊位元串流,其音訊位元串流例如根據音訊位元串流或經復原音訊信號的使用之編碼結果而得之。再來,多媒體裝置2200可更進一步包含麥克風2250及/或揚聲器2260。編碼模組2220以及解碼模組2230可藉由至少一處理器實現,例如中央處理單元(CPU)(未繪示),以及藉由其他的元件(未繪示)包含進多媒體裝置2200中如同一體來整合而成。
因為圖22之多媒體裝置2200之元件對應圖20之多媒體裝置2000之元件,或對應圖21之多媒體裝置2100之元件,細節在此省略。
圖20、21及22中多媒體裝置2000、2100及2200的每一個可包含一個只能聲音通訊之終端設備,就像電話或行動電話,一個只能廣播或放音樂之裝置,就像電視或MP3播放器,或是由只能聲音通訊之終端設備和只能廣播或放音樂之裝置混和之終端裝置,但不以此為限。除此之外,可使用多媒體裝置2000、2100及2200的每一個如同客戶端、替換伺服端或是在客戶端與伺服端之間的變換器。
例如,當多媒體裝置2000、2100或2200為行動電話時,雖然未繪示,多媒體裝置2000、2100或2200可進一步包含使用者輸入單元,例如鍵盤,用來顯示藉由使用者介面或行動電話處理的資訊的顯示單元,以及用來控制行動電話的功能的處理器。除此之外,行動電話可進一步包含擁有圖像收集功能之攝相機單元,以及至少一個用來執行行動電話所需的功能的元件。
例如,當多媒體裝置2000、2100或2200為電視時,雖然未繪示,多媒體裝置2000、2100或2200可更進一步包含使用者輸入單元,例如鍵盤,用來顯示接收的廣播資訊的顯示單元,以及用來控制電視的所有功能的處理器。除此之外,電視可進一步包含至少用來執行電視之功能的元件。
根據實施例的方法能寫成電腦程式以及能以常用的數位電腦來執行此使用電腦可讀的儲存媒體之程式以實現。除此之外,在此實施例能使用的資料結構、程式命令或是資料檔案可以各種不同方法記錄在電腦可讀的紀錄媒體。電腦可讀的紀錄媒體是任何的能儲存資料的資料儲存裝置,其資料之後能藉由電腦系統來讀取。電腦可讀的紀錄媒體的例子包含磁性媒體,如硬盤,軟盤,磁帶,光學媒體,如CD-ROM和DVD光盤,磁光性媒體,如光讀碟片磁盤和硬體設備,如唯讀記憶體,隨機存取記憶體,和快閃記憶體,特別實現來儲存及執行程式命令。除此之外,電腦可讀的紀錄媒體可以是用來傳輸信號之傳輸媒體,其程式命令及資料結構指定在信號內。程式命令可包含藉由電腦編輯之機械語言碼以及藉由電腦使用編譯器來執行之高階語言碼。
雖然本發明已經特別參照其例示性實施例加以繪示以及描述,但應理解,在不脫離以下申請專利範圍之精神以及範疇之情況下,可在其中進行形式以及細節之各種改變。
100、600‧‧‧音訊編碼裝置
130、300、400、630‧‧‧轉換單元
150、200、650、730、800、1230‧‧‧位元配置單元
170、500、670‧‧‧編碼單元
190、690‧‧‧多工單元
210、410‧‧‧正規估算單元
230‧‧‧正規編碼單元
250、430、830‧‧‧位元估算及配置單元
310‧‧‧精神聽覺模型單元
330‧‧‧位元估算及配置單元
350、450‧‧‧度量因子估算單元
370、470‧‧‧度量因子編碼單元
510‧‧‧頻譜正規化單元
530‧‧‧頻譜編碼單元
610‧‧‧暫態偵測單元
700、1200‧‧‧音訊解碼裝置
710、1210‧‧‧解多工單元
750、900、1000、1250‧‧‧解碼單元
770、1270‧‧‧反轉換單元
810‧‧‧正規解碼單元
910、1010‧‧‧頻譜解碼單元
930、1050‧‧‧包絡整形單元
950、1030‧‧‧頻譜填補單元
2000、2100、2200‧‧‧多媒體裝置
2010、2110、2210‧‧‧通訊單元
2030、2220‧‧‧編碼模組
2050、2150、2240‧‧‧儲存單元
2070、2250‧‧‧麥克風
2130、2230‧‧‧解碼模組
2170、2260‧‧‧揚聲器
圖1是根據一實施例之音訊編碼裝置的方塊圖。 圖2是根據一實施例之在圖1中音訊編碼裝置的位元配置單元的方塊圖。 圖3是根據另一實施例之在圖1中音訊編碼裝置的位元配置單元的方塊圖。 圖4是根據另一實施例之在圖1中音訊編碼裝置的位元配置單元的方塊圖。 圖5是根據一實施例之在圖1中音訊編碼裝置中編碼單元的方塊圖。 圖6是根據另一實施例之音訊編碼裝置的方塊圖。 圖7是根據一實施例之音訊解碼裝置的方塊圖。 圖8是根據一實施例之在圖7中音訊解碼裝置中位元配置單元的方塊圖。 圖9是根據一實施例之在圖7中音訊解碼裝置中解碼單元的方塊圖。 圖10是根據另一實施例之在圖7中音訊解碼裝置中解碼單元的方塊圖。 圖11是根據另一實施例之音訊解碼裝置的方塊圖。 圖12是根據另一實施例之音訊解碼裝置的方塊圖。 圖13是根據一實施例之位元配置方法的流程圖。 圖14是根據另一實施例之位元配置方法的流程圖。 圖15是根據另一實施例之位元配置方法的流程圖。 圖16是根據另一實施例之位元配置方法的流程圖。 圖17是根據另一實施例之位元配置方法的流程圖。 圖18是根據一實施例之雜訊填補方法的流程圖。 圖19是根據另一實施例之雜訊填補方法的流程圖。 圖20是根據一實施例,包含編碼模組之多媒體裝置的方塊圖。 圖21是根據一實施例,包含解碼模組之多媒體裝置的方塊圖。 圖22是根據一實施例,包含編碼模組及解碼模組之多媒體裝置的方塊圖。
100‧‧‧音訊編碼裝置
130‧‧‧轉換單元
150‧‧‧位元配置單元
170‧‧‧編碼單元
190‧‧‧多工單元

Claims (1)

  1. 一種解碼裝置,包括:至少一個處理器,經組態以:對經編碼音訊或語音信號的位元串流進行解碼,以獲得多個子帶的頻譜係數;從所述多個子帶中選擇被施加雜訊填補的子帶,其中所述子帶為藉由將與所述子帶的位元配置相關的參數與參考值相比較來選擇,被選擇的所述子帶包含量化為零的所述頻譜係數;基於在被選擇的所述子帶的能量與在被選擇的所述子帶中的經解碼頻譜係數的能量之間的能量差異,獲得用於被選擇的所述子帶的雜訊增益;使用所述雜訊增益與隨機雜訊來產生雜訊成分;將所產生的所述雜訊成分施加至被選擇的所述子帶;以及基於將所產生的所述雜訊成分施加至被選擇的所述子帶,產生音訊或語音的重構信號。
TW105133790A 2011-05-13 2012-05-14 解碼裝置 TWI606441B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161485741P 2011-05-13 2011-05-13
US201161495014P 2011-06-09 2011-06-09

Publications (2)

Publication Number Publication Date
TW201705124A TW201705124A (zh) 2017-02-01
TWI606441B true TWI606441B (zh) 2017-11-21

Family

ID=47141906

Family Applications (5)

Application Number Title Priority Date Filing Date
TW105133790A TWI606441B (zh) 2011-05-13 2012-05-14 解碼裝置
TW101117138A TWI562132B (en) 2011-05-13 2012-05-14 Noise filling method
TW105133789A TWI576829B (zh) 2011-05-13 2012-05-14 位元配置裝置
TW106103488A TWI604437B (zh) 2011-05-13 2012-05-14 位元配置方法、裝置及電腦可讀取記錄媒體
TW101117139A TWI562133B (en) 2011-05-13 2012-05-14 Bit allocating method and non-transitory computer-readable recording medium

Family Applications After (4)

Application Number Title Priority Date Filing Date
TW101117138A TWI562132B (en) 2011-05-13 2012-05-14 Noise filling method
TW105133789A TWI576829B (zh) 2011-05-13 2012-05-14 位元配置裝置
TW106103488A TWI604437B (zh) 2011-05-13 2012-05-14 位元配置方法、裝置及電腦可讀取記錄媒體
TW101117139A TWI562133B (en) 2011-05-13 2012-05-14 Bit allocating method and non-transitory computer-readable recording medium

Country Status (15)

Country Link
US (7) US9236057B2 (zh)
EP (5) EP3346465A1 (zh)
JP (3) JP6189831B2 (zh)
KR (7) KR102053899B1 (zh)
CN (3) CN103650038B (zh)
AU (3) AU2012256550B2 (zh)
BR (1) BR112013029347B1 (zh)
CA (1) CA2836122C (zh)
MX (3) MX337772B (zh)
MY (2) MY186720A (zh)
RU (2) RU2705052C2 (zh)
SG (1) SG194945A1 (zh)
TW (5) TWI606441B (zh)
WO (2) WO2012157931A2 (zh)
ZA (1) ZA201309406B (zh)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100266989A1 (en) 2006-11-09 2010-10-21 Klox Technologies Inc. Teeth whitening compositions and methods
AU2012256550B2 (en) * 2011-05-13 2016-08-25 Samsung Electronics Co., Ltd. Bit allocating, audio encoding and decoding
AU2012276367B2 (en) 2011-06-30 2016-02-04 Samsung Electronics Co., Ltd. Apparatus and method for generating bandwidth extension signal
US8586847B2 (en) * 2011-12-02 2013-11-19 The Echo Nest Corporation Musical fingerprinting based on onset intervals
US11116841B2 (en) 2012-04-20 2021-09-14 Klox Technologies Inc. Biophotonic compositions, kits and methods
CN103854653B (zh) 2012-12-06 2016-12-28 华为技术有限公司 信号解码的方法和设备
PL2933799T3 (pl) 2012-12-13 2017-12-29 Panasonic Intellectual Property Corporation Of America Urządzenie kodujące głos, urządzenie dekodujące głos, sposób kodowania głosu i sposób dekodowania głosu
CN103107863B (zh) * 2013-01-22 2016-01-20 深圳广晟信源技术有限公司 一种分段平均码率的数字音频信源编码方法及装置
ES2834929T3 (es) * 2013-01-29 2021-06-21 Fraunhofer Ges Forschung Llenado con ruido en la codificación de audio por transformada perceptual
US20140276354A1 (en) 2013-03-14 2014-09-18 Klox Technologies Inc. Biophotonic materials and uses thereof
CN104282312B (zh) 2013-07-01 2018-02-23 华为技术有限公司 信号编码和解码方法以及设备
CN105745703B (zh) * 2013-09-16 2019-12-10 三星电子株式会社 信号编码方法和装置以及信号解码方法和装置
EP3063761B1 (en) * 2013-10-31 2017-11-22 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain
MX361028B (es) 2014-02-28 2018-11-26 Fraunhofer Ges Forschung Dispositivo de decodificación, dispositivo de codificación, método de decodificación, método de codificación, dispositivo de terminal y dispositivo de estación de base.
CN106409300B (zh) 2014-03-19 2019-12-24 华为技术有限公司 用于信号处理的方法和装置
RU2689181C2 (ru) 2014-03-31 2019-05-24 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, декодер, способ кодирования, способ декодирования и программа
CN105336339B (zh) 2014-06-03 2019-05-03 华为技术有限公司 一种语音频信号的处理方法和装置
US9361899B2 (en) * 2014-07-02 2016-06-07 Nuance Communications, Inc. System and method for compressed domain estimation of the signal to noise ratio of a coded speech signal
CN107077855B (zh) 2014-07-28 2020-09-22 三星电子株式会社 信号编码方法和装置以及信号解码方法和装置
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
EP3208800A1 (en) 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
CN105957533B (zh) * 2016-04-22 2020-11-10 杭州微纳科技股份有限公司 语音压缩方法、语音解压方法及音频编码器、音频解码器
CN106782608B (zh) * 2016-12-10 2019-11-05 广州酷狗计算机科技有限公司 噪声检测方法及装置
CN108174031B (zh) * 2017-12-26 2020-12-01 上海展扬通信技术有限公司 一种音量调节方法、终端设备及计算机可读存储介质
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10580424B2 (en) * 2018-06-01 2020-03-03 Qualcomm Incorporated Perceptual audio coding as sequential decision-making problems
US10734006B2 (en) 2018-06-01 2020-08-04 Qualcomm Incorporated Audio coding based on audio pattern recognition
CN108833324B (zh) * 2018-06-08 2020-11-27 天津大学 一种基于时域限幅噪声消除的haco-ofdm***接收方法
CN108922556B (zh) * 2018-07-16 2019-08-27 百度在线网络技术(北京)有限公司 声音处理方法、装置及设备
WO2020207593A1 (en) * 2019-04-11 2020-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program
CN110265043B (zh) * 2019-06-03 2021-06-01 同响科技股份有限公司 自适应有损或无损的音频压缩和解压缩演算方法
US11930230B2 (en) 2019-11-01 2024-03-12 Samsung Electronics Co., Ltd. Hub device, multi-device system including the hub device and plurality of devices, and operating method of the hub device and multi-device system

Family Cites Families (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4899384A (en) * 1986-08-25 1990-02-06 Ibm Corporation Table controlled dynamic bit allocation in a variable rate sub-band speech coder
JPH03181232A (ja) * 1989-12-11 1991-08-07 Toshiba Corp 可変レート符号化方式
JP2560873B2 (ja) * 1990-02-28 1996-12-04 日本ビクター株式会社 直交変換符号化復号化方法
JPH0414355A (ja) 1990-05-08 1992-01-20 Matsushita Electric Ind Co Ltd 構内交換機のリンガ信号送出方法
JPH04168500A (ja) * 1990-10-31 1992-06-16 Sanyo Electric Co Ltd 信号符号化方法
JPH05114863A (ja) * 1991-08-27 1993-05-07 Sony Corp 高能率符号化装置及び復号化装置
JP3141450B2 (ja) * 1991-09-30 2001-03-05 ソニー株式会社 オーディオ信号処理方法
EP0559348A3 (en) * 1992-03-02 1993-11-03 AT&T Corp. Rate control loop processor for perceptual encoder/decoder
JP3153933B2 (ja) * 1992-06-16 2001-04-09 ソニー株式会社 データ符号化装置及び方法並びにデータ復号化装置及び方法
JPH06348294A (ja) * 1993-06-04 1994-12-22 Sanyo Electric Co Ltd 帯域分割符号化装置
TW271524B (zh) 1994-08-05 1996-03-01 Qualcomm Inc
US5893065A (en) * 1994-08-05 1999-04-06 Nippon Steel Corporation Apparatus for compressing audio data
KR0144011B1 (ko) * 1994-12-31 1998-07-15 김주용 엠펙 오디오 데이타 고속 비트 할당 및 최적 비트 할당 방법
US5864802A (en) * 1995-09-22 1999-01-26 Samsung Electronics Co., Ltd. Digital audio encoding method utilizing look-up table and device thereof
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP3189660B2 (ja) 1996-01-30 2001-07-16 ソニー株式会社 信号符号化方法
JP3181232B2 (ja) 1996-12-19 2001-07-03 立川ブラインド工業株式会社 ロールブラインドのスクリーン取付装置
JP3328532B2 (ja) * 1997-01-22 2002-09-24 シャープ株式会社 デジタルデータの符号化方法
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
JP3802219B2 (ja) * 1998-02-18 2006-07-26 富士通株式会社 音声符号化装置
JP3515903B2 (ja) * 1998-06-16 2004-04-05 松下電器産業株式会社 オーディオ符号化のための動的ビット割り当て方法及び装置
JP4168500B2 (ja) 1998-11-04 2008-10-22 株式会社デンソー 半導体装置およびその実装方法
JP2000148191A (ja) * 1998-11-06 2000-05-26 Matsushita Electric Ind Co Ltd ディジタルオーディオ信号の符号化装置
TW477119B (en) * 1999-01-28 2002-02-21 Winbond Electronics Corp Byte allocation method and device for speech synthesis
JP2000293199A (ja) * 1999-04-05 2000-10-20 Nippon Columbia Co Ltd 音声符号化方法および記録再生装置
US6687663B1 (en) * 1999-06-25 2004-02-03 Lake Technology Limited Audio processing method and apparatus
US6691082B1 (en) 1999-08-03 2004-02-10 Lucent Technologies Inc Method and system for sub-band hybrid coding
JP2002006895A (ja) * 2000-06-20 2002-01-11 Fujitsu Ltd ビット割当装置および方法
JP4055336B2 (ja) * 2000-07-05 2008-03-05 日本電気株式会社 音声符号化装置及びそれに用いる音声符号化方法
JP4190742B2 (ja) 2001-02-09 2008-12-03 ソニー株式会社 信号処理装置及び方法
JP2004522198A (ja) * 2001-05-08 2004-07-22 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声符号化方法
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
KR100462611B1 (ko) * 2002-06-27 2004-12-20 삼성전자주식회사 하모닉 성분을 이용한 오디오 코딩방법 및 장치
US7272566B2 (en) * 2003-01-02 2007-09-18 Dolby Laboratories Licensing Corporation Reducing scale factor transmission cost for MPEG-2 advanced audio coding (AAC) using a lattice based post processing technique
FR2849727B1 (fr) * 2003-01-08 2005-03-18 France Telecom Procede de codage et de decodage audio a debit variable
JP2005202248A (ja) * 2004-01-16 2005-07-28 Fujitsu Ltd オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP2005265865A (ja) * 2004-02-16 2005-09-29 Matsushita Electric Ind Co Ltd オーディオ符号化のためのビット割り当て方法及び装置
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
KR100695125B1 (ko) * 2004-05-28 2007-03-14 삼성전자주식회사 디지털 신호 부호화/복호화 방법 및 장치
US7725313B2 (en) * 2004-09-13 2010-05-25 Ittiam Systems (P) Ltd. Method, system and apparatus for allocating bits in perceptual audio coders
US7979721B2 (en) * 2004-11-15 2011-07-12 Microsoft Corporation Enhanced packaging for PC security
CN1780278A (zh) 2004-11-19 2006-05-31 松下电器产业株式会社 子载波通信***中自适应调制与编码方法和设备
KR100657948B1 (ko) * 2005-02-03 2006-12-14 삼성전자주식회사 음성향상장치 및 방법
DE202005010080U1 (de) 2005-06-27 2006-11-09 Pfeifer Holding Gmbh & Co. Kg Verbindungsvorrichtung
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7734053B2 (en) * 2005-12-06 2010-06-08 Fujitsu Limited Encoding apparatus, encoding method, and computer product
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
JP2007264154A (ja) * 2006-03-28 2007-10-11 Sony Corp オーディオ信号符号化方法、オーディオ信号符号化方法のプログラム、オーディオ信号符号化方法のプログラムを記録した記録媒体及びオーディオ信号符号化装置
JP5114863B2 (ja) * 2006-04-11 2013-01-09 横浜ゴム株式会社 空気入りタイヤおよび空気入りタイヤの組立方法
SG136836A1 (en) * 2006-04-28 2007-11-29 St Microelectronics Asia Adaptive rate control algorithm for low complexity aac encoding
JP4823001B2 (ja) * 2006-09-27 2011-11-24 富士通セミコンダクター株式会社 オーディオ符号化装置
US7953595B2 (en) * 2006-10-18 2011-05-31 Polycom, Inc. Dual-transform coding of audio signals
KR101291672B1 (ko) * 2007-03-07 2013-08-01 삼성전자주식회사 노이즈 신호 부호화 및 복호화 장치 및 방법
DK3591650T3 (da) * 2007-08-27 2021-02-15 Ericsson Telefon Ab L M Fremgangsmåde og indretning til udfyldning af spektrale huller
CN101790757B (zh) * 2007-08-27 2012-05-30 爱立信电话股份有限公司 语音与音频信号的改进的变换编码
CN101239368A (zh) 2007-09-27 2008-08-13 骆立波 异型盖整平模具及其整平方法
MX2010004138A (es) * 2007-10-17 2010-04-30 Ten Forschung Ev Fraunhofer Codificacion de audio usando conversion de estereo a multicanal.
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
WO2010053287A2 (en) * 2008-11-04 2010-05-14 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
CN102222505B (zh) * 2010-04-13 2012-12-19 中兴通讯股份有限公司 可分层音频编解码方法***及瞬态信号可分层编解码方法
KR20140026229A (ko) * 2010-04-22 2014-03-05 퀄컴 인코포레이티드 음성 액티비티 검출
CN101957398B (zh) 2010-09-16 2012-11-28 河北省电力研究院 一种基于机电与电磁暂态混合仿真技术检测计算电网一次时间常数的方法
JP5609591B2 (ja) * 2010-11-30 2014-10-22 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
FR2969805A1 (fr) * 2010-12-23 2012-06-29 France Telecom Codage bas retard alternant codage predictif et codage par transformee
HUE037111T2 (hu) * 2011-03-10 2018-08-28 Ericsson Telefon Ab L M Nem-kódolt al-vektorok kitöltése transzformációsan kódolt audio jelekben
US9536534B2 (en) * 2011-04-20 2017-01-03 Panasonic Intellectual Property Corporation Of America Speech/audio encoding apparatus, speech/audio decoding apparatus, and methods thereof
AU2012256550B2 (en) * 2011-05-13 2016-08-25 Samsung Electronics Co., Ltd. Bit allocating, audio encoding and decoding
US8731949B2 (en) * 2011-06-30 2014-05-20 Zte Corporation Method and system for audio encoding and decoding and method for estimating noise level
RU2505921C2 (ru) * 2012-02-02 2014-01-27 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ и устройство кодирования и декодирования аудиосигналов (варианты)

Also Published As

Publication number Publication date
MX337772B (es) 2016-03-18
TW201301264A (zh) 2013-01-01
RU2018108586A (ru) 2019-02-26
US20170061971A1 (en) 2017-03-02
RU2018108586A3 (zh) 2019-04-24
KR102193621B1 (ko) 2020-12-21
KR20120127334A (ko) 2012-11-21
US20170316785A1 (en) 2017-11-02
US9489960B2 (en) 2016-11-08
CN103650038A (zh) 2014-03-19
CN105825859A (zh) 2016-08-03
MY186720A (en) 2021-08-12
BR112013029347B1 (pt) 2021-05-11
JP2019168699A (ja) 2019-10-03
KR20190139172A (ko) 2019-12-17
JP2017194690A (ja) 2017-10-26
MX2013013261A (es) 2014-02-20
CA2836122C (en) 2020-06-23
BR112013029347A2 (pt) 2017-02-07
KR20200143332A (ko) 2020-12-23
KR20220004778A (ko) 2022-01-11
ZA201309406B (en) 2021-05-26
SG194945A1 (en) 2013-12-30
RU2705052C2 (ru) 2019-11-01
AU2018200360B2 (en) 2019-03-07
KR20210011482A (ko) 2021-02-01
KR102284106B1 (ko) 2021-07-30
RU2013155482A (ru) 2015-06-20
WO2012157932A2 (en) 2012-11-22
AU2012256550B2 (en) 2016-08-25
TW201705123A (zh) 2017-02-01
CN103650038B (zh) 2016-06-15
TWI562133B (en) 2016-12-11
KR102053900B1 (ko) 2019-12-09
KR20190138767A (ko) 2019-12-16
EP2707874A2 (en) 2014-03-19
AU2016262702A1 (en) 2016-12-15
US20160035354A1 (en) 2016-02-04
TW201715512A (zh) 2017-05-01
MX345963B (es) 2017-02-28
JP2014514617A (ja) 2014-06-19
JP6726785B2 (ja) 2020-07-22
JP6189831B2 (ja) 2017-08-30
EP3937168A1 (en) 2022-01-12
CA2836122A1 (en) 2012-11-22
MY164164A (en) 2017-11-30
US10109283B2 (en) 2018-10-23
KR102053899B1 (ko) 2019-12-09
AU2016262702B2 (en) 2017-10-19
AU2018200360A1 (en) 2018-02-08
TW201250672A (en) 2012-12-16
EP3346465A1 (en) 2018-07-11
TWI604437B (zh) 2017-11-01
WO2012157932A3 (en) 2013-01-24
KR102409305B1 (ko) 2022-06-15
TWI562132B (en) 2016-12-11
AU2012256550A1 (en) 2014-01-16
EP2707875A4 (en) 2015-03-25
US9159331B2 (en) 2015-10-13
KR20120127335A (ko) 2012-11-21
US9773502B2 (en) 2017-09-26
KR102491547B1 (ko) 2023-01-26
TWI576829B (zh) 2017-04-01
US10276171B2 (en) 2019-04-30
WO2012157931A3 (en) 2013-01-24
RU2648595C2 (ru) 2018-03-26
EP2707875A2 (en) 2014-03-19
EP2707874A4 (en) 2014-12-03
US9236057B2 (en) 2016-01-12
TW201705124A (zh) 2017-02-01
US20160099004A1 (en) 2016-04-07
CN105825858B (zh) 2020-02-14
CN105825859B (zh) 2020-02-14
US20120288117A1 (en) 2012-11-15
US20180012605A1 (en) 2018-01-11
US9711155B2 (en) 2017-07-18
EP3385949A1 (en) 2018-10-10
US20120290307A1 (en) 2012-11-15
KR102209073B1 (ko) 2021-01-28
CN105825858A (zh) 2016-08-03
WO2012157931A2 (en) 2012-11-22

Similar Documents

Publication Publication Date Title
TWI606441B (zh) 解碼裝置
TWI616869B (zh) 音訊解碼方法、裝置及電腦可讀取記錄媒體