TWI489449B - 用於編碼音訊信號之位準估計之裝置及方法、用以產生輸出資料串流之裝置及方法、用於緩衝器管理之裝置、用以產生碼簿位準值之方法、用以儲存輸入資料之方法、及電腦程式 - Google Patents

用於編碼音訊信號之位準估計之裝置及方法、用以產生輸出資料串流之裝置及方法、用於緩衝器管理之裝置、用以產生碼簿位準值之方法、用以儲存輸入資料之方法、及電腦程式 Download PDF

Info

Publication number
TWI489449B
TWI489449B TW100136485A TW100136485A TWI489449B TW I489449 B TWI489449 B TW I489449B TW 100136485 A TW100136485 A TW 100136485A TW 100136485 A TW100136485 A TW 100136485A TW I489449 B TWI489449 B TW I489449B
Authority
TW
Taiwan
Prior art keywords
value
codebook
level
audio signal
values
Prior art date
Application number
TW100136485A
Other languages
English (en)
Other versions
TW201222530A (en
Inventor
Manfred Lutzky
Ralf Geiger
Markus Schnell
Marco Diatschuk
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW201222530A publication Critical patent/TW201222530A/zh
Application granted granted Critical
Publication of TWI489449B publication Critical patent/TWI489449B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/152Multipoint control units therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

用於編碼音訊信號之位準估計之裝置及方法、用以產生輸出資料串流之裝置及方法、用於緩衝器管理之裝置、用以產生碼簿位準值之方法、用 以儲存輸入資料之方法、及電腦程式
本發明係有關於音訊處理及更明確言之,係有關於編碼音訊信號於位元串流定義域之位準估計之裝置及方法。
音訊處理就多方面而言已經進階且成為許多研究如何有效地編碼與解碼音訊資料信號的主題。有效編碼例如係由MPEG AAC所提供(MPEG=動畫專家群;AAC=高階音訊編碼)。
依據MPEG AAC,音訊信號的頻譜值係採用定標因數、量化及碼簿編碼,更特別係霍夫曼碼簿。
在進行霍夫曼編碼前,編碼器將欲編碼至不同區段的多個頻譜係數集結成群。針對頻譜係數之各個區段,編碼器選擇霍夫曼碼簿用於霍夫曼編碼。MPEG AAC提供11個不同頻譜霍夫曼碼簿用以編碼頻譜資料,從該等碼簿中,編碼器選擇最適合用來編碼該區段的頻譜係數。編碼器提供碼簿識別符,該碼簿識別符識別用來該區段的頻譜係數之霍夫曼編碼的碼簿作為側邊資訊。
於解碼器側上,解碼器分析所接收的側邊資訊來決定多個頻譜霍夫曼碼簿中的哪一個業已用來編碼一區段之頻譜值。解碼器基於有關採用來編碼欲藉解碼器解碼的該區段之頻譜係數之霍夫曼碼簿的側邊資訊進行霍夫曼解碼。
在霍夫曼解碼後,在解碼器獲得多個量化頻譜值。解碼器然後進行反量化來將已經藉編碼器進行的非一致量化反相。藉此方式,在解碼器獲得反量化頻譜值。
但反量化頻譜值仍然可能未經定標。導出的未經定標頻譜值已經集結成定標因數帶,各個定標因數帶有個共通定標因數。針對各個定標因數帶的定標因數係可由解碼器利用作為編碼器所提供的側邊資訊。運用此項資訊,解碼器將定標因數帶的未經定標頻譜值乘以其定標因數。藉此方式獲得定標頻譜值。
現在參考第7至10圖解說依據技藝界現況對頻譜值之編碼及解碼。
第7圖例示說明依據技藝界現況之編碼器。該編碼器包含T/F濾波器排組710,該排組用以將應經編碼的音訊信號AS從時域變換至頻域來獲得頻域音訊信號。頻域音訊信號饋入定標因數單元720用以決定定標因數。定標因數單元720係適用於將頻域音訊信號的頻譜係數劃分成共享一個定標因數之數組頻譜係數,稱作定標因數帶。定標因數表示用來變更在個別定標因數帶中全部頻譜係數振幅之一增益值。此外,定標因數單元720適用於產生及輸出頻域音訊信號之未經定標頻譜係數。
又復,第7圖之編碼器用來量化該頻域音訊信號之未經定標頻譜係數之量化器。量化器730可以是非一致量化器。
量化後,經量化的音訊信號之未經定標頻譜係饋入霍夫曼編碼器740用以接受霍夫曼編碼。霍夫曼編碼係用來減少音訊信號之量化頻譜的冗餘。多個未經定標之量化頻譜係數集結成區段。雖然於MPEG-AAC提供11個可能的碼簿,但一個區段之全部頻譜係數係藉相同霍夫曼碼簿編碼。
編碼器將選出11個可能霍夫曼碼簿中之一者,該碼簿係特別適合用來編碼該區段之頻譜係數。藉此方式,針對一特定區段編碼器之霍夫曼碼簿的選擇係取決於該特定區段之頻譜值。然後該霍夫曼編碼頻譜係數可連同側邊資訊發射至解碼器,該側邊資訊例如包含曾經用來編碼一頻譜係數區段的霍夫曼碼簿、曾經用於特定定標因數帶之定標因數等的相關資訊。
二或四個頻譜係數係藉採用來霍夫曼編碼該區段之頻譜係數的霍夫曼碼簿之一碼字組編碼。編碼器連同下列資訊發射表示該編碼頻譜係數之碼字組給解碼器,該等資訊包括包含一區段長度之側邊資訊,以及有關用以編碼該區段之頻譜係數的霍夫曼碼簿資訊。
於MPEG AAC中,提供11個頻譜霍夫曼碼簿用來編碼該音訊信號之頻譜資料。不同頻譜霍夫曼碼簿可藉其碼簿指數(1至11間之值)加以識別。霍夫曼碼簿維度指示多少個頻譜係數係藉所考慮的霍夫曼碼簿之碼字組編碼。於MPEG AAC中,霍夫曼碼簿的大小為2或4,指示碼字組編碼二或四個音訊信號之頻譜值。
但不同霍夫曼碼簿有關其它性質也有別。舉例言之,可由霍夫曼碼簿編碼之頻譜係數最大絕對值係依碼簿而異,且可以是例如1、2、4、7、12或以上。此外,所考慮的霍夫曼碼簿可適用來編碼有符號值與否。
採用霍夫曼編碼,頻譜係數係藉不等長度的碼字組編碼。MPEG AAC提供具有最大絕對值1的兩個不同霍夫曼碼簿,具有最大絕對值2的兩個不同霍夫曼碼簿,具有最大絕對值4的兩個不同霍夫曼碼簿,具有最大絕對值7的兩個不同霍夫曼碼簿,及具有最大絕對值12的兩個不同霍夫曼碼簿,其中各個霍夫曼碼簿表示分開的機率分布函數。霍夫曼編碼器將經常性地選擇最佳匹配來編碼頻譜係數的霍夫曼碼簿。
第8圖例示說明依據技藝界現況之解碼器。霍夫曼編碼頻譜值係由霍夫曼解碼器750接收。霍夫曼解碼器750也接收針對各區段頻譜值,用來編碼頻譜值之有關霍夫曼碼簿資訊作為側邊資訊。然後霍夫曼解碼器750執行霍夫曼解碼來獲得未經定標的量化頻譜值。該未經定標的量化頻譜值係饋入反量化器760。該反量化器執行反量化來獲得經反量化之未經定標的頻譜值,該值饋入定標器770。定標器770也接收定標因數作為各個定標因數帶之側邊資訊。基於所接收的定標因數,定標器770將該未經定標的經反量化之頻譜值定標而獲得該經定標的經反量化之頻譜值。然後F/T濾波器排組780將該頻域音訊信號之經定標的經反量化頻譜值從頻域變換至時域來獲得時域音訊信號之樣本值。
第9圖例示說明依據技藝界現況之編碼器,該編碼器與第7圖編碼器之差異在於第9圖編碼器更進一步包含編碼器端TNS單元(TNS=時間性雜訊整形)。時間性雜訊整形可採用來就該音訊信號之頻譜資料部分進行濾波處理而控制量化雜訊之時間性形狀。編碼器端TNS單元715決定就欲編碼的頻域音訊信號之頻譜係數,進行線性預測編碼(LPC)計算。從LPC計算所得者包括反射係數,又稱PARCOR係數。若也藉LPC計算而導出的預測增益係不超過某個臨界值,則不使用時間性雜訊整形。但若預測增益係大於該臨界值,則使用時間性雜訊整形。編碼器端TNS單元去除小於某個臨界值之全部反射係數。其餘反射係數係轉換成線性預測係數且係用在編碼器作為雜訊整形濾波係數。然後編碼器端TNS單元針對該等頻譜係數執行濾波操作,對此採用TNS來獲得音訊信號之經處理的頻譜係數。指示TNS資訊之側邊資訊例如反射係數(PARCOR係數)係發射至解碼器。
第10圖例示說明依據技藝界現況之解碼器,該解碼器與第8圖例示說明之解碼器差異在於第10圖之解碼器額外包含解碼器端TNS單元775。解碼器端TNS單元接收音訊信號之反量化定標頻譜,及也接收TNS資訊,例如指示反射係數(PARCOR係數)的資訊。解碼器端TNS單元775處理音訊信號之反量化頻譜來獲得音訊信號之經處理的反量化頻譜。
針對多項應用,要緊地須測定或估計編碼音訊信號之位準例如能、振幅、或響度。此點對電傳會議系統特別為真。由在不同位置所在的數個參與者所進行的電傳會議係藉多點控制單元(MCU)掌控。其目的係為了混合多個輸入及輸出串流,此處該音訊資料係呈示於編碼格式。
依據技藝界現況,全部輸入串流係在MCU解碼,然後音訊資料進一步分析來識別混合至輸出串流的最主要串流。如此表示依據技藝界現況,全部輸入串流係經霍夫曼解碼、反量化、及定標用於隨後進一步分析輸入串流而識別最主要串流,例如具最高位準例如具最大能的串流。估計一個定標因數帶之位準例如能的技藝界現況辦法係針對全部頻譜值進行霍夫曼解碼及反量化,及藉加總全部反量化頻譜值平方而計算能。
本發明之目的係提供針對編碼音訊信號之位準估計提供改良構思。本發明之目的係係藉如申請專利範圍第1項之裝置、如申請專利範圍第12項之方法、如申請專利範圍第14項之方法、及如申請專利範圍第15項之電腦程式解決。
提出一種用於編碼音訊信號之位準估計之裝置。該裝置係包含碼簿決定器用以從多個碼簿中決定碼簿作為經識別碼簿,其中該音訊信號已經藉採用該經識別碼簿編碼。該裝置係更進一步包含估計單元係經組配來用以導算出與該經識別碼簿聯結之位準值作為導出位準值。又復,該估計單元係適用以使用該導出位準值估計該音訊信號之位準估值。
於一實施例中,該導出位準值可以是導出能值,及該用於位準估計的裝置可適用於進行能估計作為位準估計。於另一實施例中,該導出位準值可以是導出振幅值,及該用於位準估計的裝置可適用於進行振幅估計作為位準估計。於又一實施例中,該導出位準值可以是導出響度值,及該用於位準估計的裝置可適用於進行響度估計作為位準估計。
本發明係植基於發現為了減低全部解碼步驟的複雜度,例如能、振幅或響度等位準可從位元串流參數直接估計用來識別最主要串流。位準估計例如能估計、振幅估計或響度估計可植基於位元串流資訊,例如位元串流成分例如霍夫曼碼簿、定標因數、及例如TNS濾波係數。此等位元串流成分可用來估計依據AAC-ELD串流之位準(AAC-ELD;高階音訊編碼-加強低延遲)。如此,依據本發明並非必要完全解碼音訊位元串流,反而係藉基於決定已經採用來編碼音訊信號之碼簿而提供位準估計,係藉導出與該經識別之碼簿聯結之位準值,及藉使用該位準值估計該音訊信號之位準估值。
於一實施例中,估計單元包含定標單元。該定標單元係適用於導算出與該編碼音訊信號或該編碼音訊信號之一部分有關的定標因數作為導出定標因數。該定標單元係適用於基於該定標因數及該導出位準值而獲得定標位準值,例如定標能、振幅、或響度值。此外,該估計單元係適用於使用該定標位準值而估計該音訊信號之位準估值。。依據此一實施例,該位準估值係基於有關已經用來編碼該音訊信號之資訊提供,亦即與該經識別之碼簿及定標因數聯結之位準值。
於一實施例中,該導出位準值為能值,及該定標單元係適用於將該導出定標因數施加至該導出能值,而藉將該導出能值乘以該導出定標因數的平方而獲得定標位準值。藉此方式,以定標因數施加至依據MPEG-2 AAC的解碼器中未經定標經反量化頻譜係數的相似方式,導出的定標因數係施加在導出能上,但無需解碼頻譜係數。
於另一實施例中,導出能值為振幅值,及該定標單元係適用於將該導出定標因數施加至該導出振幅值而藉將該導出振幅值乘以該導出定標因數來獲得定標位準值。
於又一實施例中,該導出位準值為響度值,及該定標單元係適用於將該導出定標因數變換至導出響度值,藉將該導出響度值乘以導出定標因數之立方而獲得定標響度值。存在有替代之道來計算響度,諸如藉指數3/2計算。一般而言,當導出位準值為響度值時,定標因數須變換為響度定義域。
於另一實施例中,估計單元係經組配來使用特定位準值作為導出位準值來估計該音訊信號之位準估值。如此,該估計單元係特別經組配來基於特定類別的位準值而進行位準估算。
於一實施例中,導出位準值為導出能值,及該估計單元係經組配來使用碼簿位準值作為碼簿能值而估計能估值作為該音訊信號之位準估值,該碼簿能值係指示該經識別碼簿的全部碼字組之平均機率加權能和值中之和。各個平均機率加權和值指示該經識別碼簿之碼字組之機率加權能和值對與該碼簿聯結之維度值之比。各個機率加權能和值指示該經識別碼簿之一所考慮的碼字組之一能和值乘以與該經識別碼簿之該所考慮的碼字組聯結之一機率值之乘積。各個能和值指示經識別碼簿的碼字組一序列能值之數值。各序列能值指示針對該碼簿之各個碼字組,針對一碼字組之一序列數值的一序列反量化數值中之各值之一平方值。各序列數值為藉該碼簿之一碼字組編碼的一序列數值。
於又一實施例中,該估計單元進一步包含位準值導出器。該位準值導出器係適用於藉詢查在一記憶體中與該經識別之碼簿聯結的該位準值而導出該導出位準值。於又一實施例中,該位準值導出器係適用於從一本地資料庫請求與該經識別之碼簿聯結之該位準值。於又另一實施例中,該位準值導出器係適用於從一遠端電腦請求與該經識別之碼簿聯結之該位準值。
於另一實施例中,該裝置進一步包含一記憶體或一資料庫,其中業已儲存多個碼簿位準記憶體值,該等值指示一位準值係與一碼簿聯結,其中該等多個碼簿各自具有與其聯結之一碼簿位準記憶體值儲存在該記憶體或資料庫。該位準值導出器係經組配來藉從該記憶體或從該資料庫導出與該經識別之碼簿聯結之一碼簿位準記憶體值而導出與該經識別之碼簿聯結之該位準值作為該位準值。
於一實施例中,該記憶體或資料庫已經於其中儲存多個碼簿能記憶體值作為碼簿位準記憶體值,其中各個碼簿能記憶體值指示該經識別碼簿之全部碼字組的平均機率加權能和值的和。各個能和值指示該經識別碼簿之一碼字組的一序列能值數值。此外,各序列能值指示針對該碼簿之各個碼字組,一碼字組的一序列能值之一序列反量化數值中各值的平方值。各序列能值為由該碼簿之一碼字組所儲存的一序列數值。本實施例提出記憶體或資料庫,已經於其中儲存聯結特定碼簿之多個碼簿能記憶體值,其中該所儲存的碼簿能記憶體值具有特別適合用於能估計之特殊性質。
於另一實施例中,該記憶體或資料庫已經於其中儲存多個振幅值作為碼簿記憶體位準值。於又一實施例中,該記憶體或資料庫已經於其中儲存多個響度值作為碼簿記憶體位準值。
於另一實施例中,該估計單元進一步包含預測濾波器調整器。該預測濾波器調整器係適用於導出與該編碼音訊信號或該編碼音訊信號之一部分有關的一或多個預測濾波器係數作為導出預測濾波器係數。又復,該預測濾波器調整器係適用於基於該預測濾波器係數及該導出位準值而獲得預測濾波器調整位準值。此外,該估計單元係適用於使用該預測濾波器調整位準值而估計該音訊信號之位準估值。
依據另一實施例,提出一種針對一電傳會議系統的多個參與者產生背向資料串流之裝置。該裝置包含用以接收多個參與者資料串流包含來自該等多個參與者之音訊信號的接收器介面。此外,該用以產生背向資料串流之裝置包含依據前述實施例中之一者用於編碼音訊信號之位準估計的裝置。該位準估計裝置係配置用以針對各個參與者資料串流進行位準估計而未完全解碼該資料串流。此外,該用以產生背向資料串流之裝置包含決定器,該決定器係用來基於該位準估計,判定參與者資料串流是否將含括於該背向資料串流。此外,該用以產生背向資料串流之裝置包含混合器,該混合器係用以只混合欲含括於該背向資料串流的該參與者資料串流及不含括決定為不含括的該參與者資料串流。該用以產生背向資料串流之裝置係經組配來不會完全解碼判定為不含括於該背向資料串流的參與者資料串流。於一實施例中,該決定器係適用於當所考慮參與者資料串流之位準估計係低於臨界值時,決定該所考慮參與者資料串流係不含括於該背向資料串流。於又一實施例中,該決定器係適用於決定唯有含括於該背向資料串流之資料串流為有關特定定標因數帶,具有全部參與者資料串流之位準估計中的最高位準估計之該資料串流。
依據一實施例,提出一種產生聯結碼簿之位準值之方法。該方法包含:針對該碼簿之各個碼字組,決定與該碼簿之一碼字組聯結的一序列數值。針對該碼簿之各個碼字組,藉施加一反量化器至一碼字組的該序列數值之該等數值,而對該碼簿之各個碼字組決定一反量化數值序列。針對該碼簿之各個碼字組,藉求取一碼字組之反量化數值序列中之各值平方而對該碼簿之各個碼字組計算一序列位準值。藉針對該碼簿之各個碼字組加總該序列位準值,計算針對該碼簿之各個碼字組之一位準和值。針對該碼簿之各個碼字組,藉將一碼字組之該位準和值乘以與該碼字組聯結之一機率值而決定該碼簿之各個碼字組之一機率加權位準和值。針對該碼簿之各個碼字組,藉將一碼字組之機率加權位準和值除以與該碼簿聯結之一維度值而決定該碼簿之各個碼字組之一平均機率加權位準和值,及藉加總全部碼字組之平均機率加權位準和值而計算該碼簿之位準值。
圖式簡單說明
參考附圖解釋較佳實施例,附圖中第1圖顯示依據一實施例用於位準估計之裝置,第2圖顯示依據一實施例之估計單元,第3圖顯示依據另一實施例之估計單元,第4a及4b圖顯示用以產生位準值之方法,第5圖顯示依據又一實施例之估計單元,包含預測濾波器調整器,第6圖顯示用以產生背向資料串流之裝置,第7圖顯示依據技藝界現況之編碼器,第8圖顯示依據技藝界現況之解碼器,第9圖顯示依據技藝界現況之另一編碼器,及第10圖顯示依據技藝界現況之又一解碼器。
第1圖例示說明依據一實施例之裝置。該裝置包含碼簿決定器110及估計單元120。碼簿決定器110係適用於從多個碼簿中決定一個碼簿來作為經識別之碼簿,其中該音訊信號已經藉採用經識別之碼簿而編碼。估計單元120係適用於導出與該經識別之碼簿聯結之位準值諸如能值、振幅值或響度值作為導出位準值。此外,估計單元120係適用於使用所導出的位準值而估計音訊信號之位準估值,例如能估值、振幅估值或響度估值。舉例言之,碼簿決定器110可藉接收連同該編碼音訊信號一起發射的側邊資訊而決定碼簿,該碼簿已經由編碼器用來編碼音訊信號。更明確言之,側邊資訊可包含用以編碼所考慮之該音訊信號區段的碼簿之識別資訊。此種資訊例如可從編碼器發射至解碼器作為識別用於編碼所考慮之該音訊信號區段的霍夫曼碼簿的數字。
第2圖例示說明依據一實施例之估計單元。該估計單元包含位準值導出器210及定標單元220。該位準值導出器係適用於藉詢查於記憶體的位準值,藉從本地資料庫請求位準值,或藉從遠端電腦請求與該經識別之碼簿聯結之該位準值而導出與該經識別之碼簿聯結之位準值,亦即用來藉編碼器編碼頻譜資料之碼簿。於一實施例中,由位準值導出器詢查或請求的位準值可以是平均位準值,該平均位準值指示藉使用經識別之碼簿而編碼之經編碼未經定標頻譜值之平均位準。
藉此方式,導出位準值係非從實際頻譜值求出,反而係使用只取決於所採用的碼簿之平均位準值。如前文解釋,編碼器通常係適用於從多個碼簿中選出最佳匹配來編碼音訊信號之一區段的個別頻譜資料之該碼簿。例如就可編碼的最大絕對值而言,因碼簿不同,故藉霍夫曼碼簿所編碼的平均值因碼簿而異,及因此,藉特定碼簿編碼的編碼頻譜係數之平均位準值因碼簿而異。
如此,依據一實施例,採用特定霍夫曼碼簿用以編碼音訊信號之頻譜係數的平均位準值可針對各個霍夫曼碼簿決定,且例如可儲存在記憶體、資料庫或遠端電腦。然後位準值導出器單純只須詢查或請求已經採用來編碼頻譜資料的與該經識別之碼簿聯結之該位準值,來獲得與該經識別之碼簿聯結之該導出位準值。
但須考慮霍夫曼碼簿經常運用來編碼未經定標的頻譜值,如同MPEG AAC之情況。但然後當進行位準估計時,須將定標列入考慮。因此,第2圖之估計單元也包含定標單元220。定標單元係適用於導算出與該編碼音訊信號或該編碼音訊信號之一部分有關的定標因數作為導出定標因數。舉例言之,至於解碼器,定標單元220將針對各個定標因數帶決定一定標因數。舉例言之,藉接收從編碼器發射至解碼器的側邊資訊,定標單元220可接收有關定標因數帶之定標因數的資訊。又復,定標單元220係適用於基於定標因數及導出位準值而決定定標位準值。
於一實施例中,此處導出位準值為導出能值,定標單元係適用於施加定標因數於導出能值,藉將導出能值乘以導出定標因數之平方而獲得定標位準值。
於另一實施例中,此處導出位準值為導出振幅值,定標單元係適用於施加定標因數於導出振幅值,藉將導出振幅值乘以導出定標因數而獲得定標位準值。
於又一實施例中,此處導出位準值為導出響度值,定標單元(220)係適用於施加定標因數於導出響度值,藉將導出響度值乘以導出定標因數的立方而獲得定標位準值。存在有其它辦法來計算響度,諸如藉指數3/2。一般而言,當導出位準值為響度值時,定標因數必須變換至響度定義域。
此等實施例考慮能值係基於音訊信號之頻譜係數的平方測定,振幅值係基於音訊信號之頻譜係數的絕對值測定,及響度值係基於已經變換至響度定義域的音訊信號之頻譜係數測定。
估計單元係適用於使用定標位準值來估計音訊信號之位準估值。於第2圖之實施例中,估計單元係適用於輸出定標位準值作為位準估值。於此種情況下,未進行定標位準值之後處理。但如於第3圖之實施例中例示說明,估計單元也可係適用於進行後處理。因此,第3圖之估計單元包含後處理器230用以後處理一或多個定標位準值用來估計位準估值。藉測定多個定標位準值之平均值,估計單元之位準估值可藉後處理器230測定。此一平均值可由估計單元輸出作為位準估值。
與所呈示之實施例相反,估計例如一個定標因數帶能的技藝界現況辦法係針對全部頻譜值進行霍夫曼解碼及反量化,及藉加總全部反量化頻譜值的平方而計算能值。
但於所提示之實施例中,此種計算上複雜的技藝界現況處理程序係由平均位準估值所置換,該估值只取決於定標因數及碼簿使用而不依實際量化值決定。
本發明之實施例採用下述事實,霍夫曼碼簿係經設計來遵照專用統計學而提供最佳編碼。如此表示碼簿已經依 據資料之機率設計,例如AAC-ELD(AAC-ELD;高階音訊編碼-加強低延遲):頻譜線。此一處理程序可經顛倒來獲得依據該碼簿之資料機率。在碼簿內部之各個資料分錄(指數(i ))之機率係藉碼字組(c )之長度(l )給定。舉例言之,p(i )=2^-l (c )
亦即p(i )=2-l (c ) 其中p(i )為碼簿內部之資料分錄(指數(i ))之機率。
植基於此,預期位準可以下述方式預先計算及儲存:各個指數表示一序列整數值(x),例如頻譜線,此處該序列長度係取決於碼簿維度,例如針對AAC-ELD為2或4。
第4a及4b圖例示說明依據一實施例,一種用以產生與一碼簿聯結之位準值,例如能值、振幅值或響度值之方法。該方法包含:針對該碼簿之各個碼字組,決定與一碼簿之碼字組聯結的一序列數值(步驟410)。如前文已經解說,碼簿藉該碼簿之碼字組編碼一序列數值,例如2或4數值。該碼簿包含多個碼簿來編碼多序列數值。所決定之該序列數值為藉所考慮之該碼簿之碼字組編碼之該序列數值。步驟410係針對碼簿之各個碼字組進行。舉例言之,若碼簿包含81碼字組,則於步驟410決定81數值序列。
於步驟420,針對該碼簿之各個碼字組,藉施加反量化器至該數值序列的數值而針對該碼簿之各個碼字組決定反量化數值序列。如前文已經解釋,當編碼音訊信號之頻譜值時,編碼器通常採用量化,例如非線性量化。結果,此種量化須在解碼器反相。
隨後,於步驟430,針對該碼簿之各個碼字組決定一序列位準值。
若欲產生能值作為碼簿位準值,則針對各個碼字組決定一序列能值,及針對該碼簿之各個碼字組,計算反量化數值序列的各值平方。
但若欲產生振幅值作為碼簿位準值,則針對各個碼字組決定一序列振幅值,及針對該碼簿之各個碼字組,計算反量化數值序列的各值絕對值。
但若欲產生響度值作為碼簿位準值,則針對各個碼字組決定一序列響度值,及針對該碼簿之各個碼字組,計算反量化數值序列的各值立方。存在有替代之道來計算響度,諸如藉指數3/2計算。一般而言,當產生響度值作為碼簿位準值時,反量化數值序列之值須變換為響度定義域。
隨後,於步驟440,針對該碼簿之各個碼字組,係藉加總該數值序列之各值而求出針對該碼簿之各個碼字組的位準和值。
然後,於步驟450,針對該碼簿之各個碼字組,藉將一碼字組的位準和值乘以與該碼字組聯結之機率值,決定針對該碼簿之各個碼字組的機率加權位準和值。藉此方式,考慮該數值序列中之部分例如頻譜係數序列將不如其它頻譜係數序列般頻仍出現。與該碼字組聯結之機率值將此點列入考慮。當採用霍夫曼編碼時,此種機率值可從碼字組長度導出,原因在於較可能出現的碼字組係藉使用具有較短長度的碼字組編碼,而其它較不可能出現的碼字組將藉使用具有較長長度的碼字組編碼。
於步驟460,針對該碼簿之各個碼字組,藉將一碼字組的機率加權位準和值除以與該碼字組聯結之維度值,將決定針對該碼簿之各個碼字組的平均機率加權位準和值。維度值指示藉該碼簿之一碼字組編碼的頻譜值數字。藉此方式,決定平均機率加權位準和值,該值表示針對藉該碼字組編碼之頻譜係數的位準值(機率加權)。
然後,於步驟470,藉加總全部碼字組的平均機率加權位準和值而求出該碼簿之位準值。
須注意此種位準值的產生確實只須對碼簿進行一次。若決定碼簿之位準值,則此值單純經詢查且例如依據前述實施例藉裝置用於位準估計。
後文中,呈示依據一實施例用以產生與該碼簿聯結之能值之方法。為了估計以給定碼簿編碼之資料的預期能值,針對碼簿之各個指數,下列步驟只須進行一次:
A)施加反量化器至該序列之整數值(例如AAC-ELD:x^(4/3))
B)藉計算A)序列各值的平方求得能
C)建立B)序列之和
D)C)乘以該指數之給定機率
E)除以碼簿維度來獲得每一頻譜線之預期能
最後,藉E)求出的全部值須經加總來獲得完整碼簿之預期能。
此等步驟之輸出儲存於表中後,單純基於碼簿指數,亦即取決於使用哪個碼簿,可詢查估計能值。針對此一估計,實際頻譜值無須為霍夫曼解碼。
為了估計完整音訊訊框的頻譜資料之總能,須考慮定標因數。不具顯著量複雜度,定標因數可提取自位元串流。在施加至預期能之前,定標因數可經修改,例如可算出所使用的定標因數平方。然後預期能乘以所使用的定標因數平方。
依據前述實施例,可估計針對各個定標因數帶之頻譜位準而未解碼霍夫曼編碼頻譜值。該位準估值可用來識別具有低位準,例如具低功率之串流,其係與隨後混合程序無關。因此可避免此等串流的完整解碼。
依據一實施例,一種用於位準估計之裝置進一步包含記憶體或資料庫,其中儲存多個碼簿位準記憶體值,指示與一碼簿聯結之位準值,其中多個碼簿中之各者具有聯結的碼簿位準記憶體值儲存在記憶體或資料庫。此外,位準值導出器係經組配來用以藉從記憶體或從資料庫導出與經識別之碼簿聯結之碼簿位準記憶體值而導出與經識別之碼簿聯結之位準值。
若進一步處理步驟作為預測,諸如預測濾波係施加於編解碼器,例如用於AAC-ELD TNS(時間性雜訊整形)濾波,則可改變依據前述實施例估計之位準。此處,預測係數係在位元串流內部傳輸,例如針對TNS用作為PARCOR係數。
第5圖例示說明一實施例,其中該估計單元進一步包含預測濾波器調整器240。該預測濾波器調整器係適用於導出與編碼音訊信號或編碼音訊信號之一部分有關的一或多個預測濾波係數。該預測濾波器調整器係適用於基於預測濾波係數及導出位準值而獲得預測濾波器調整位準值。此外,估計單元係適用於使用該預測濾波器調整位準值而估計該音訊信號之位準估值。
於一實施例中,TNS之PARCOR係數係用作為預測濾波器係數。濾波處理之預測增益可以極為有效方式而從該等係數決定。有關TNS,預測增益可依下式計算:增益=1/prod(1-parcor^2)。
舉例言之,若考慮三個PARCOR係數例如parcor1 、parcor2 、及parcor3 ,增益係依下式計算:
至於n個PARCOR係數例如parcor1 、parcor2 、...及parcorn ,適用下式:
如此表示可估計通過濾波的音訊信號的放大而未施加濾波操作本身。
依據前述實施例中之一者,位準估計裝置可採用於電傳會議系統,例如用於多點控制單元(MCU)。
第6圖例示說明依據一實施例,用以針對電傳會議系統中的多個參與者產生背向資料串流之裝置。該裝置包含接收器介面610用以接收多個參與者資料串流p1、p2、...pn。參與者資料串流p1、p2、...pn包含來自多個參與者的音訊信號。此外,用以產生背向資料串流之裝置包含依據前述實施例中之一者用於編碼音訊信號的位準估計之裝置620,其中用於位準估計之裝置620係配置來對各個參與者資料串流進行位準估計,而未完全解碼資料串流。如第6圖例示說明,用於位準估計之裝置接收音訊資料串流p1、p2、...pn,及針對包含音訊信號的所接收之音訊資料串流p1、p2、...pn各自進行位準估計。裝置620輸送與音訊資料串流p1、p2、...pn有關的位準估計ee1 、ee2 、...een 給決定器630。決定器630係適用於基於各個參與者資料串流的位準估計,決定參與者資料串流是否將含括於背向資料串流。依據特定資料串流p1、p2、...pn是否含括於背向資料串流,決定器530然後遞送決定dec1 、dec2 、...decn 給各參與者資料串流之混合器640。混合器640也係適用於接收參與者資料串流p1、p2、...pn。基於決定dec1 、dec2 、...decn ,混合器640只混合欲含括於背向資料串流的參與者資料串流,而不包括決定不含括的參與者資料串流。
用以產生背向資料串流之裝置係經組配來不完整解碼不欲含括於背向資料串流的參與者資料串流。
於一實施例中,決定器630係適用於當所考慮之參與者資料串流的位準估計係低於臨界值時,決定該所考慮之參與者資料串流係不含括於背向資料串流。
於一實施例中,用以產生背向資料串流之裝置係適用於以逐一訊框為基礎,決定參與者資料串流是否欲含括於背向資料串流,例如針對各個音訊訊框,決定該參與者資料串流的整個音訊訊框是否將含括於背向資料串流。
於另一實施例中,用以產生背向資料串流之裝置係適用於以定標因數帶為基礎,決定參與者資料串流是否欲含括於背向資料串流,例如針對音訊訊框之不同定標因數帶,決定定標因數帶是否含括於背向資料串流的決策可以不同。
於又一實施例中,決定器630係適用於決定唯有含括於該背向資料串流之資料串流為有關一特定定標因數帶,具有全部參與者資料串流之位準估計中的最高位準估計之該資料串流。
於另一實施例中,決定器630係適用於決定含括於該背向資料串流之唯二資料串流為有關一特定定標因數帶,具有全部參與者資料串流之位準估計中的兩個最高位準估計之該資料串流。
於又一實施例中,第6圖中用於位準估計之裝置620並非針對音訊信號各者估計位準估值的單一位準估計裝置,反而裝置620包含多數n個用於位準估計之裝置,各個用於位準估計之裝置針對n個音訊信號串流中之一者提供位準估值。
用於位準估計之裝置也可應用於多個其它裝置。於一實施例中,提供用於緩衝器管理之裝置。該用於緩衝器管理之裝置包含用以存取一緩衝器之緩衝器音訊資料作為存取緩衝器音訊資料之一緩衝器存取單元,其中該緩衝器音訊資料包含一編碼音訊信號。此外,該用於緩衝器管理之裝置包含依據前述實施例中之一者用於編碼音訊信號之位準估計之裝置。又復,該用於緩衝器管理之裝置包含一決定器用以基於該編碼音訊信號之位準估計,決定該存取緩衝器音訊資料係將從該緩衝器刪除與否。
此種用於緩衝器管理之裝置係特別適合用於管理抖動緩衝器,例如採用於VoIP(透過網際網路協定之語音)者。依據一實施例,用於緩衝器管理之裝置係適用於將重要音訊訊框維持於緩衝器,及當緩衝器係在存在有緩衝器過度運轉狀態風險時,係適用於從該緩衝器刪除較不重要的訊框。舉例言之,緩衝器的整個音訊資料內容可經檢驗,及基於位準估計,用於緩衝器管理之裝置決定音訊資料內容(緩衝器音訊資料)是否欲從該緩衝器刪除。
於一實施例中,用以儲存輸入資料之裝置係適用於以逐一訊框為基礎,決定音訊資料係將被儲存或捨棄,例如針對各個音訊訊框,決定整個音訊訊框係將被儲存或捨棄。
雖然已經於裝置脈絡描述若干構面,但顯然此等構面也表示相對應方法之描述,此處區塊或裝置係相對應於方法步驟或方法步驟的特徵結構。同理,描述於方法步驟脈絡的構面也表示相對應裝置之相對應方塊或項目或特徵結構之描述。
取決於某些體現要求,本發明之實施例可在硬體或軟體中體現。體現可運用具有可電子式讀取控制信號儲存於其上且與可規劃電腦系統協作(或可協作)來執行個別方法的數位儲存媒體執行,例如軟碟、DVD、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體。
依據本發明之若干實施例包含具有可電子式讀取控制信號之非暫時性資料載體,該載體可與可規劃電腦系統協作來執行此處所述方法中之一者。
一般而言,本發明之實施例可體現為一種具有程式代碼的電腦程式產品,當該電腦程式產品係在電腦上跑時,該程式代碼可操作用以執行該等方法中之一者。程式代碼例如可儲存在機器可讀取載體上。
其它實施例包含儲存在機器可讀取載體上用以執行此處所述方法中之一者的電腦程式。
換言之,因此本發明方法之實施例為具有程式代碼的電腦程式,當該電腦程式係在電腦上跑時該程式代碼可用以執行此處所述方法中之一者。
因此本發明方法之又一實施例為資料載體(或數位儲存媒體,或電腦可讀取媒體)包含用以執行此處所述方法中之一者的電腦程式。
因此本發明方法之又一實施例為資料串流或一序列信號,表示用以執行此處所述方法中之一者的電腦程式。該資料串流或信號序列例如可經組配來透過資料通訊連結,例如透過網際網路轉移。
又一實施例包含處理裝置,例如電腦或可規劃邏輯裝置,其係經組配來或係適用於執行此處所述方法中之一者。
又一實施例包含電腦,該電腦上安裝有用以執行此處所述方法中之一者的電腦程式。
於若干實施例中,可規劃邏輯裝置(例如可現場規劃閘陣列)可用來執行此處所述方法的部分或全部功能。於若干實施例中,可現場規劃閘陣列可與微電腦協定來執行此處所述方法中之一者。通常該等方法較佳係藉任何硬體裝置執行。
前述實施例僅供舉例說明本發明之原理。須瞭解此處所述配置及細節的修改與變化為熟諳技藝人士顯然易知。因此意圖只受審查中之申請專利範圍之範圍所限,而非受藉描述與解說此處實施例所呈示的特定細節所限。
110...碼簿決定器
120...估計單元
210...位準值導出器
220...定標單元
230...後處理器
240...預測濾波器調整器
410-470...步驟
610...接收器介面
620...位準估計裝置
630...決定器
640...混合器
710...T/F濾波器排組
715...編碼器端TNS單元
720...定標因數單元
730...量化器
740...霍夫曼編碼器
750...霍夫曼解碼器
760...反量化器
770...定標器
775...解碼器端TNS單元
780...F/T濾波器排組
第1圖顯示依據一實施例用於位準估計之裝置,
第2圖顯示依據一實施例之估計單元,
第3圖顯示依據另一實施例之估計單元,
第4a及4b圖顯示用以產生位準值之方法,
第5圖顯示依據又一實施例之估計單元,包含預測濾波器調整器,
第6圖顯示用以產生背向資料串流之裝置,
第7圖顯示依據技藝界現況之編碼器,
第8圖顯示依據技藝界現況之解碼器,
第9圖顯示依據技藝界現況之另一編碼器,及
第10圖顯示依據技藝界現況之又一解碼器。
110‧‧‧碼簿決定器
120‧‧‧估計單元
idcb‧‧‧識別的碼簿
est‧‧‧位準估值

Claims (19)

  1. 一種用於一編碼音訊信號之位準估計之裝置,其係包含:一碼簿決定器,該碼簿決定器用以從多個碼簿中決定一碼簿作為一經識別碼簿,其中該音訊信號已經藉採用該經識別碼簿編碼,及一估計單元,該估計單元係經組配來用以導算出與該經識別碼簿相關聯之一位準值作為一導出位準值,及用以使用該導出位準值估計該音訊信號之一位準估值。
  2. 如申請專利範圍第1項之裝置,其中該估計單元包含一定標單元,其中該定標單元係適用於導算出與該編碼音訊信號或該編碼音訊信號之一部分有關的一定標因數作為一導出定標因數,其中該定標單元係適用於基於該定標因數及該導出位準值而獲得一定標位準值,及其中該估計單元係適用於使用該定標位準值而估計該音訊信號之一位準估值。
  3. 如申請專利範圍第2項之裝置,其中該導出位準值為一導出能值,及該定標單元係適用於將該導出定標因數施加至該導出能值以藉將該導出能值乘以該導出定標因數的平方而獲得一定標位準值,或其中該導出位準值為一導出振幅值,及該定標單元 係適用於將該導出定標因數施加至該導出振幅值以藉將該導出振幅值乘以該導出定標因數而獲得一定標位準值,或其中該導出位準值為一導出響度值,及該定標單元係適用於將該導出定標因數變換至響度定義域且施加變換的該導出定標因數至該導出響度值而獲得一定標位準值。
  4. 如申請專利範圍第1~3項中任一項之裝置,其中該估計單元係經組配來使用一碼簿位準值估計該音訊信號之一位準估值,該碼簿位準值係指示該經識別碼簿的全部碼字組之平均機率加權位準和值中之一和,其中各個平均機率加權位準和值指示該經識別碼簿之一碼字組之一機率加權位準和值對與該碼簿相關聯之一維度值的比,其中各個機率加權位準和值指示該經識別碼簿之一所考慮的碼字組之一位準和值乘以與該經識別碼簿之該所考慮的碼字組相關聯之一機率值的乘積,其中各個位準和值指示該經識別碼簿之一碼字組的一序列位準值之數值,其中當該碼簿位準值為一能值時,針對該碼簿之各個碼字組,各序列位準值指示針對一碼字組之一序列數值的一序列反量化數值中之各值之一平方值;或當該碼簿位準值為一振幅值時,針對該碼簿之各個碼字組,各序列位準值指示針對一碼字組之一序列數值的一序列 反量化數值中之各值之一絕對值;或當該碼簿位準值為一響度值時,針對該碼簿之各個碼字組,各序列位準值指示針對一碼字組之一序列數值的一序列反量化數值中之各值之一值被變換至一響度定義域,及其中各序列數值為藉該碼簿之一碼字組所編碼之一序列數值。
  5. 如申請專利範圍第1項之裝置,其中該估計單元進一步包含一位準值導出器,其中該位準值導出器係適用於藉詢查在一記憶體中與該經識別之碼簿相關聯的該位準值而導出該導出位準值,其中該位準值導出器係適用於從一本地資料庫請求與該經識別之碼簿相關聯之該位準值,或其中該位準值導出器係適用於從一遠端電腦請求與該經識別之碼簿相關聯之該位準值。
  6. 如申請專利範圍第5項之裝置,進一步包含一記憶體或一資料庫,業已於其中儲存多個碼簿位準記憶體值,該等值指示一位準值係與一碼簿相關聯,其中該等多個碼簿各自具有與其相關聯之一碼簿位準記憶體值儲存在該記憶體或資料庫中,及其中該位準值導出器係經組配來藉從該記憶體或從該資料庫導出與該經識別之碼簿相關聯之一碼簿位準記憶體值而導出與該經識別之碼簿相關聯之該位準值作為該位準值。
  7. 如申請專利範圍第6項之裝置,該記憶體或資料庫已經儲存多個碼簿位準記憶體值於其中,其中各個碼簿位準記憶體值指示一相關聯碼簿的全部碼字組之平均機率加權位準和值之一和,其中該相關聯碼簿係與該碼簿位準記憶體值相關聯,其中各個平均機率加權位準和值指示該相關聯碼簿之一碼字組的機率加權位準和值對與該相關聯碼簿相關聯之一維度值的比,其中各個機率加權位準和值指示該相關聯碼簿之一所考慮的碼字組之一位準和值乘以與該相關聯碼簿之該所考慮的碼字組相關聯之一機率值的乘積,其中各個位準和值指示該相關聯碼簿之一碼字組的一序列位準值之數值,其中當該碼簿位準記憶體值為一能值時,針對該相關聯碼簿之各個碼字組,各序列位準值指示針對一碼字組之一序列數值的一序列反量化數值中之各值之一平方值;或當該碼簿位準記憶體值為一振幅值時,針對該相關聯碼簿之各個碼字組,各序列位準值指示針對一碼字組之一序列數值的一序列反量化數值中之各值之一絕對值;或當該碼簿位準記憶體值為一響度值時,針對該相關聯碼簿之各個碼字組,各序列位準值指示針對一碼字組之一序列數值的一序列反量化數值中之各值之一值被變換至一響度定義域,及其中各序列數值為藉該相關聯碼簿之一碼字組所 編碼之一序列數值。
  8. 如申請專利範圍第1項之裝置,其中該估計單元進一步包含一預測濾波器調整器,其中該預測濾波器調整器係適用於導出與該編碼音訊信號或該編碼音訊信號之一部分有關的一或多個預測濾波器係數作為導出預測濾波器係數,其中該預測濾波器調整器係適用於基於該預測濾波器係數及該導出位準值而獲得一預測濾波器調整位準值,及其中該估計單元係適用於使用該預測濾波器調整位準值而估計該音訊信號之一位準估值。
  9. 一種用以產生一輸出資料串流之裝置,其係從輸入資料來產生該輸出資料串流,包含:一接收器介面用以接收包含一編碼音訊信號之該輸入資料,如前述申請專利範圍各項中任一項之用於該編碼音訊信號之位準估計之一裝置,一決定器用以基於針對該輸出資料串流部分的位準估計,決定該編碼音訊信號之一部分是否將含括於該輸出資料串流與否。
  10. 如申請專利範圍第9項之裝置,其中該裝置進一步包含一混合器,其中該裝置係適用於針對一電傳會議系統的多個參與者產生一背向資料串流作為一輸出資料串流, 其中該接收器係適用於接收包含來自該等多個參與者之音訊信號之多個參與者資料串流,其中該決定器係適用於基於針對各個參與者資料串流的位準估計而決定一參與者資料串流是否係含括於該背向資料串流,及一混合器用以只混合欲含括於該背向資料串流的該參與者資料串流及不含括決定為不含括的該參與者資料串流。
  11. 如申請專利範圍第10項之裝置,其中該決定器係適用於當一所考慮參與者資料串流之位準估計係低於一臨界值時,決定該所考慮參與者資料串流係不含括於該背向資料串流。
  12. 如申請專利範圍第10項之裝置,其中該決定器係適用於決定唯有含括於該背向資料串流之資料串流為有關一特定定標因數帶,具有全部參與者資料串流之位準估計中的最高位準估計之該資料串流。
  13. 一種用於緩衝器管理之裝置:用以存取一緩衝器之緩衝器音訊資料作為存取緩衝器音訊資料之一緩衝器存取單元,其中該緩衝器音訊資料包含一編碼音訊信號,如前述申請專利範圍各項中任一項之用於該編碼音訊信號之位準估計之一裝置,一決定器用以基於該編碼音訊信號之位準估計,決定該存取緩衝器音訊資料係將從該緩衝器刪除與否。
  14. 一種用以產生一碼簿位準值之方法,該碼簿位準值係與一碼簿相關聯,該方法係包含:針對該碼簿之各個碼字組,決定與該碼簿之一碼字組相關聯的一序列數值,針對該碼簿之各個碼字組,藉施加一反量化器至一碼字組的該序列數值之該等數值,而對該碼簿之各個碼字組決定一反量化數值序列,當一能值係產生作為碼簿位準值時,針對該碼簿之各個碼字組,藉決定一碼字組之反量化數值序列中之各值平方而對該碼簿之各個碼字組決定一序列位準值;或當一振幅值係產生作為碼簿位準值時,針對該碼簿之各個碼字組,藉決定一碼字組之反量化數值序列中之各值絕對值而對該碼簿之各個碼字組決定一序列位準值;或當一響度值欲決定作為碼簿位準值時,針對該碼簿之各個碼字組,藉將一碼字組之反量化數值序列中之各值變換至一響度定義域,針對該碼簿之各個碼字組,藉加總該序列位準值之數值而計算該碼簿之各個碼字組之一位準和值,針對該碼簿之各個碼字組,藉將一碼字組之該位準和值乘以與該碼字組相關聯之一機率值而決定該碼簿之各個碼字組之一機率加權位準和值,針對該碼簿之各個碼字組,藉將一碼字組之機率加權位準和值除以與該碼簿相關聯之一維度值而決定該碼簿之各個碼字組之一平均機率加權位準和值,及 藉加總全部碼字組之該等平均機率加權位準和值而計算該碼簿位準值。
  15. 如申請專利範圍第14項之方法,其中與該碼字組相關聯之機率值係依據下式計算:2-(l (c )) 其中l (c )指示該碼字組(c )之長度(l )。
  16. 一種用於一編碼音訊信號之位準估計之方法,該方法係包含:從多個碼簿決定一碼簿作為一經識別之碼簿,其中該音訊信號已經藉採用該經識別之碼簿加以編碼,導出與該經識別之碼簿相關聯之一位準值,及使用該位準值,估計該音訊信號之一位準估值。
  17. 一種用以產生一輸出資料串流之方法,其係從輸入資料來產生該輸出資料串流,該方法包含:接收包含一編碼音訊信號之該輸入資料,從多個碼簿決定一碼簿作為一經識別之碼簿,其中該音訊信號已經藉採用該經識別之碼簿加以編碼,導出與該經識別之碼簿相關聯之一位準值,及使用該位準值,估計該音訊信號之一位準估值,基於針對該輸出資料串流該部分之位準估值,決定該編碼音訊信號之一部分是否係含括於該輸出資料串流。
  18. 一種用以儲存輸入資料之方法,其係儲存包含一編碼音訊信號之輸入資料於一緩衝器中,該方法係包含: 接收包含一編碼音訊信號之該輸入資料,從多個碼簿決定一碼簿作為一經識別之碼簿,其中該音訊信號已經藉採用該經識別之碼簿加以編碼,導出與該經識別之碼簿相關聯之一位準值,及使用該位準值,估計該音訊信號之一位準估值,基於針對該輸出資料串流該部分之位準估值,決定該編碼音訊信號之一部分是否係儲存於該緩衝器。
  19. 一種電腦程式,當藉一電腦或一信號處理器執行時,實行如申請專利範圍第14至18項中任一項之方法。
TW100136485A 2010-10-07 2011-10-07 用於編碼音訊信號之位準估計之裝置及方法、用以產生輸出資料串流之裝置及方法、用於緩衝器管理之裝置、用以產生碼簿位準值之方法、用以儲存輸入資料之方法、及電腦程式 TWI489449B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US39073910P 2010-10-07 2010-10-07
PCT/EP2011/067466 WO2012045816A1 (en) 2010-10-07 2011-10-06 Apparatus and method for level estimation of coded audio frames in a bit stream domain

Publications (2)

Publication Number Publication Date
TW201222530A TW201222530A (en) 2012-06-01
TWI489449B true TWI489449B (zh) 2015-06-21

Family

ID=44741342

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100136485A TWI489449B (zh) 2010-10-07 2011-10-07 用於編碼音訊信號之位準估計之裝置及方法、用以產生輸出資料串流之裝置及方法、用於緩衝器管理之裝置、用以產生碼簿位準值之方法、用以儲存輸入資料之方法、及電腦程式

Country Status (15)

Country Link
US (1) US11238873B2 (zh)
EP (1) EP2625687B1 (zh)
JP (1) JP5792821B2 (zh)
KR (1) KR101412115B1 (zh)
CN (1) CN103250206B (zh)
AR (1) AR083368A1 (zh)
AU (1) AU2011311543B2 (zh)
BR (1) BR112013008462B1 (zh)
CA (1) CA2813898C (zh)
ES (1) ES2600313T3 (zh)
HK (1) HK1188327A1 (zh)
MX (1) MX2013003803A (zh)
RU (1) RU2553084C2 (zh)
TW (1) TWI489449B (zh)
WO (1) WO2012045816A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112013008462B1 (pt) 2010-10-07 2021-11-16 Fraunhofer-Gesellschaft Zur Forderung Der Angewadten Forschung E.V. Aparelho e método para estimativa de nivel de estruturas de áudio codificado em um dominio de fluxo de bits
CN104769669B (zh) * 2012-08-10 2020-09-29 弗劳恩霍夫应用研究促进协会 对参数音频对象编码运用残差概念的编码器、解码器、***及方法
EP2757558A1 (en) * 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
ES2739481T3 (es) 2013-06-21 2020-01-31 Fraunhofer Ges Forschung Escalador de tiempo, decodificador de audio, procedimiento y programa informático mediante el uso de un control de calidad
AU2014283320B2 (en) 2013-06-21 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Jitter buffer control, audio decoder, method and computer program
CN109920440B (zh) 2013-09-12 2024-01-09 杜比实验室特许公司 用于各种回放环境的动态范围控制
CN112185402B (zh) 2014-10-10 2024-06-04 杜比实验室特许公司 基于发送无关的表示的节目响度
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
GB2578625A (en) * 2018-11-01 2020-05-20 Nokia Technologies Oy Apparatus, methods and computer programs for encoding spatial metadata

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1521241A1 (en) * 2003-10-01 2005-04-06 Siemens Aktiengesellschaft Transmission of speech coding parameters with echo cancellation
CN101609674A (zh) * 2008-06-20 2009-12-23 华为技术有限公司 编解码方法、装置和***
CN101816038A (zh) * 2007-10-03 2010-08-25 朗讯科技公司 从已编码参数估计话音能量

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5701392A (en) * 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
JP3483958B2 (ja) * 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
US6553535B1 (en) * 1998-08-21 2003-04-22 Massachusetts Institute Of Technology Power-efficient communication protocol
US6704705B1 (en) * 1998-09-04 2004-03-09 Nortel Networks Limited Perceptual audio coding
CA2356869C (en) 1998-12-28 2004-11-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and devices for coding or decoding an audio signal or bit stream
JP3372908B2 (ja) 1999-09-17 2003-02-04 エヌイーシーマイクロシステム株式会社 マルチパルス探索処理方法と音声符号化装置
US7106794B2 (en) * 2000-08-11 2006-09-12 Broadcom Corporation System and method for Huffman shaping in a data communication system
US6944236B2 (en) * 2000-08-11 2005-09-13 Lucent Technologies Inc. Method of multiple-antenna wireless communication using space-time codes
RU2335845C2 (ru) * 2002-04-02 2008-10-10 Нокиа Корпорейшн Кодирование коэффициентов преобразования в кодерах и/или декодерах изображения/видеосигнала
US7617094B2 (en) * 2003-02-28 2009-11-10 Palo Alto Research Center Incorporated Methods, apparatus, and products for identifying a conversation
EP1775717B1 (en) 2004-07-20 2013-09-11 Panasonic Corporation Speech decoding apparatus and compensation frame generation method
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US7177804B2 (en) 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US8091006B2 (en) * 2006-06-02 2012-01-03 Nec Laboratories America, Inc. Spherical lattice codes for lattice and lattice-reduction-aided decoders
US8219409B2 (en) * 2008-03-31 2012-07-10 Ecole Polytechnique Federale De Lausanne Audio wave field encoding
EP2346029B1 (en) * 2008-07-11 2013-06-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, method for encoding an audio signal and corresponding computer program
US8565064B2 (en) * 2008-12-15 2013-10-22 Futurewei Technologies, Inc. System and method for employing six-bit rank 1 and 2 codebooks for four transmit antennas
WO2010104011A1 (ja) * 2009-03-10 2010-09-16 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体
BR112013008462B1 (pt) 2010-10-07 2021-11-16 Fraunhofer-Gesellschaft Zur Forderung Der Angewadten Forschung E.V. Aparelho e método para estimativa de nivel de estruturas de áudio codificado em um dominio de fluxo de bits

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1521241A1 (en) * 2003-10-01 2005-04-06 Siemens Aktiengesellschaft Transmission of speech coding parameters with echo cancellation
CN101816038A (zh) * 2007-10-03 2010-08-25 朗讯科技公司 从已编码参数估计话音能量
CN101609674A (zh) * 2008-06-20 2009-12-23 华为技术有限公司 编解码方法、装置和***

Also Published As

Publication number Publication date
CN103250206B (zh) 2015-07-15
HK1188327A1 (zh) 2014-04-25
AU2011311543A1 (en) 2013-05-02
JP5792821B2 (ja) 2015-10-14
BR112013008462B1 (pt) 2021-11-16
CN103250206A (zh) 2013-08-14
TW201222530A (en) 2012-06-01
EP2625687B1 (en) 2016-08-10
KR101412115B1 (ko) 2014-06-26
WO2012045816A1 (en) 2012-04-12
MX2013003803A (es) 2013-06-03
ES2600313T3 (es) 2017-02-08
BR112013008462A2 (pt) 2016-08-09
US11238873B2 (en) 2022-02-01
AU2011311543B2 (en) 2015-05-21
RU2013120547A (ru) 2014-11-20
EP2625687A1 (en) 2013-08-14
RU2553084C2 (ru) 2015-06-10
AR083368A1 (es) 2013-02-21
CA2813898C (en) 2017-05-23
JP2013543146A (ja) 2013-11-28
US20130226596A1 (en) 2013-08-29
KR20130112893A (ko) 2013-10-14
CA2813898A1 (en) 2012-04-12

Similar Documents

Publication Publication Date Title
TWI489449B (zh) 用於編碼音訊信號之位準估計之裝置及方法、用以產生輸出資料串流之裝置及方法、用於緩衝器管理之裝置、用以產生碼簿位準值之方法、用以儲存輸入資料之方法、及電腦程式
JP5710476B2 (ja) スーパーフレームにおいてlpcフィルタの量子化および逆量子化を行うためのデバイスおよび方法
TWI466106B (zh) 音訊或視訊編碼器、音訊或視訊解碼器及用以利用可變預測方向來處理多頻道音訊或視訊信號的相關方法
JP6452759B2 (ja) 先進量子化器
JP6494741B2 (ja) 符号化及び復号化のための符号化装置、復号化装置、システム及び方法
US8909521B2 (en) Coding method, coding apparatus, coding program, and recording medium therefor
JP2018511821A (ja) オーディオエンコーダ、オーディオデコーダ、オーディオ信号を符号化する方法、および符号化されたオーディオ信号を復号化する方法
Huang et al. Lossless audio compression in the new IEEE standard for advanced audio coding
KR101100280B1 (ko) 오디오 양자화
EP1668462A2 (en) A fast codebook selection method in audio encoding
CN109427338B (zh) 立体声信号的编码方法和编码装置
JP5336942B2 (ja) 符号化方法、復号方法、符号化器、復号器、プログラム
CN103503065A (zh) 用于衰减低精确度重构的信号区域的方法和解码器
JP6951554B2 (ja) ステレオ信号符号化の間に信号を再構成する方法及び機器
KR101757344B1 (ko) 인코딩된 신호를 처리하기 위한 장치와 방법 및 인코딩된 신호를 발생시키기 위한 인코더와 방법
Amada et al. Experimental evaluation of wavernn predictor for audio lossless coding
JP7318645B2 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
JP2008026372A (ja) 符号化データの符号化則変換方法および装置
JP5635213B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
Nanjundaswamy et al. Cascaded Long Term Prediction of Polyphonic Signals for Low Power Decoders