TW201523592A - 用於使用重疊範圍組合處理音訊信號之裝置及方法 - Google Patents
用於使用重疊範圍組合處理音訊信號之裝置及方法 Download PDFInfo
- Publication number
- TW201523592A TW201523592A TW103129185A TW103129185A TW201523592A TW 201523592 A TW201523592 A TW 201523592A TW 103129185 A TW103129185 A TW 103129185A TW 103129185 A TW103129185 A TW 103129185A TW 201523592 A TW201523592 A TW 201523592A
- Authority
- TW
- Taiwan
- Prior art keywords
- block
- modified
- signal
- range
- overlap
- Prior art date
Links
- 238000012545 processing Methods 0.000 title claims abstract description 47
- 230000005236 sound signal Effects 0.000 title claims abstract description 21
- 238000000034 method Methods 0.000 title claims description 60
- 230000003595 spectral effect Effects 0.000 claims abstract description 86
- 230000006870 function Effects 0.000 claims description 49
- 230000009467 reduction Effects 0.000 claims description 18
- 239000003607 modifier Substances 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 12
- 230000007704 transition Effects 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 230000008439 repair process Effects 0.000 claims description 7
- 239000002131 composite material Substances 0.000 claims description 5
- 238000009499 grossing Methods 0.000 claims description 5
- 238000005562 fading Methods 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 2
- 239000000203 mixture Substances 0.000 claims description 2
- 238000012986 modification Methods 0.000 abstract description 27
- 230000004048 modification Effects 0.000 abstract description 26
- 230000000694 effects Effects 0.000 description 23
- 238000004458 analytical method Methods 0.000 description 13
- 238000001228 spectrum Methods 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 7
- OVOUKWFJRHALDD-UHFFFAOYSA-N 2-[2-(2-acetyloxyethoxy)ethoxy]ethyl acetate Chemical compound CC(=O)OCCOCCOCCOC(C)=O OVOUKWFJRHALDD-UHFFFAOYSA-N 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 101000802640 Homo sapiens Lactosylceramide 4-alpha-galactosyltransferase Proteins 0.000 description 1
- 102100035838 Lactosylceramide 4-alpha-galactosyltransferase Human genes 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/147—Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Mathematical Optimization (AREA)
- Data Mining & Analysis (AREA)
- Computational Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Algebra (AREA)
- Discrete Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Quality & Reliability (AREA)
- Peptides Or Proteins (AREA)
- Control Of Amplification And Gain Control (AREA)
- Stereo-Broadcasting Methods (AREA)
- Analogue/Digital Conversion (AREA)
- Complex Calculations (AREA)
Abstract
本發明提供一種用於處理包含頻譜值之區塊之一序列的一音訊信號之裝置,其包含:一處理器,其用於使用用於一第一區塊之至少一個修改值來處理區塊之該序列以在一重疊範圍中獲得混疊減少或不含混疊之第一結果信號,以及使用用於區塊之該序列中之一第二區塊的至少一個第二不同修改值來處理區塊之該序列以在該重疊範圍中獲得一混疊減少或不含混疊之第二結果信號;以及一組合器,其用於在該重疊範圍中組合該第一結果信號與該第二結果信號以獲得用於該重疊範圍之一經處理信號。
Description
本發明係關於音訊處理,且特定言之係關於在音訊信號之混疊影響處理之情況下的音訊處理。
在正常操作中,修改型離散餘弦變換(MDCT)具有使其成為用於音訊寫碼應用之較適合工具的特徵。MDCT自重疊訊框產生臨界取樣頻譜信號表示且提供完美重建構。此情況意謂可藉由在重疊區中應用反向變換及重疊相加運算而自前向變換之頻譜係數重建構輸入信號。然而,若對頻譜係數應用額外處理,則相比於類似基於DFT之重疊處理的超取樣表示,MDCT具有一些缺點。諸如用於動態範圍控制或削波預防的更加相對簡單之時間及頻率相依增益控制可產生不合需要之副效應。因此,儘管基於MDCT之頻譜表示將可用於解碼器內部,但將在要求此類信號修改之若干應用中應用對音訊解碼之基於DFT之單獨
後處理。除計算複雜性以外的一個缺點為由此後處理引入的額外延遲。
用於MDCT時域混疊減少之常見方法為重新建立超取樣調變型複數交疊變換(modulated complex lapped transform,MCLT)。MCLT由組合MDCT與其複數對應物,修改型離散正弦變換(MDST)而產生。MCLT提供類似信號之DFT表示的類似特徵,且因此MCLT對抗由頻譜操縱引起之時域混疊(TDA)的穩固性可比得上DFT表示。但不幸地,自MDCT頻譜來計算MDST頻譜在計算上係極複雜的,且產生顯著信號延遲。因此,目前技術水平提供用於減少延遲及複雜性兩者之技術[2-3]。在此等方法中,將實數至複數(R2C)變換用於近似需要之MDST值。接著,在MCLT域中,應用對頻譜係數之操縱。之後,使用複數至實數(C2R)變換將複數值再次變換至MDCT域中。儘管就混疊穩固性而言此方法提供良好結果,但此方法具有一些缺點。首先,MDST係數係估計的且該等係數之準確度係由計算複雜性之量界定。其次,變換鏈R2C至C2R仍產生延遲。
[1] H. S. Malvar, “A modulated complex lapped transform and its applications to audio processing”, in Proc. IEEE Int. Conf. on Acoustics, Speech, and Signal Processing (ICASSP), Phoenix, March 1999.
[2] Kuech, F.; Edler, B., “Aliasing Reduction for Modified Discrete Cosine Transform Domain Filtering and its Application to Speech Enhancement”, in IEEE Workshop on
Applications of Signal Processing to Audio and Acoustics, 21-24 Oct. 2007.
[3] Edler, B., “Aliasing Reduction for Gain Control with Critically Sampled Filter Banks”, in First International Conference on Communications and Electronics, ICCE '06, 10-11 Oct. 2006.
[4] E. Larsen and R. M. Aarts. Audio Bandwidth Extension - Application to psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd, 2004.
[5] M. Dietz, L. Liljeryd, K. Kjörling and O. Kunz, “Spectral Band Replication, a novel approach in audio coding,” in 112th AES Convention, Munich, May 2002.
[6] P. Ekstrand, “Bandwidth Extension of Audio Signals by Spectral Band Replication”, in Proceedings of 1st IEEE Benelux Workshop on MPCA, Leuven, November 2002
本發明之一目標為提供一種用於處理一音訊信號之經改良概念。
此目標將藉由如技術方案1的一種用於處理一音訊信號之裝置、如技術方案15的一種處理一音訊信號之方法或如技術方案16的一種電腦程式來達成。
在本發明之一態樣中,一種用於處理包含頻譜值
之區塊之一序列的一音訊信號之裝置包含:一處理器,其用於使用用於一第一區塊之至少一個修改值來處理頻譜值之區塊之該序列以在一重疊範圍中獲得一混疊減少或不含混疊之第一結果信號,及使用來自頻譜值之區塊之該序列中之一第二區塊的至少一個第二不同修改值來處理頻譜值之區塊之該序列以在該重疊範圍中獲得混疊減少或不含混疊之第二結果信號。接著,組合該重疊範圍中之兩信號,該兩信號構成同一信號部分中之一者的某一表示,以獲得用於該重疊範圍之經處理信號。
較佳地,此組合依賴於自一個結果信號至另一結果信號之一平滑轉換,亦即該第一結果信號之一淡出且同時該第二結果信號之一淡入。
較佳地,該處理器包含一修改器,該修改器用於使用該至少一個第一修改值來修改該序列中之該第一區塊以獲得一第一經修改區塊,用於使用至少一個第二修改值來修改該序列中之該第二區塊以獲得一第二經修改區塊,用於使用該至少一個第一修改值來修改該第二區塊以獲得一第三經修改區塊,以及用於使用該至少一個第二修改值來修改該第一區塊以獲得一第四經修改區塊。一頻譜-時間轉換器經組配以用於將該第一經修改區塊至該第四經修改區塊轉換成其時間表示,且提供一重疊加法器,其用於將該第一經修改區塊及該第三經修改區塊重疊相加以獲得一結果信號,及用於將該第二經修改區塊及該第四經修改區塊之時間表示重疊相加以獲得該第二結果信號。因此,執
行兩個基本上平行之反變換操作,一個操作具有第一增益修改值且一個操作具有第二增益修改值。
當該增益修改值僅時變(亦即,遍及頻率範圍皆恆定)時,則僅一單一增益修改值被用於一區塊之修改。然而,若該增益修改值隨頻率變化,則藉由多個增益修改值來修改頻譜值之各區塊。一增益修改值可適用於各個別頻譜值或適用於一群組之頻譜值(諸如,2個、3個、4個或5個頻率鄰近之頻譜值)。然而,在一般狀況下,對於各頻譜線及每頻譜線可存在一單一增益修改值,藉由數個增益修改值來修改頻譜值之一區塊,其中該數目等於頻譜值之該區塊中的頻譜值之數目。
因此,根據此態樣,產生用於該重疊區之兩個混疊減少或不含混疊之輸出信號,且接著在彼等兩個輸出或結果信號之間執行一平滑轉換。
根據本發明之又一態樣,一種用於處理一音訊信號之裝置包含一處理器,該處理器用於使用用於該序列中之一第一區塊的至少一個第一修改值及用於頻譜值之區塊之該序列中之一第二區塊的至少一個第二不同修改值來計算一混疊影響信號。接著,估計一混疊錯誤信號,其中此混疊錯誤信號包括於該混疊影響或經受混疊之音訊信號中。接著,組合該混疊影響信號與該混疊錯誤信號,使得藉由該組合獲得之該信號為一混疊減少或不含混疊之信號。
換言之,另一態樣依賴於對一混疊影響信號及一
混疊錯誤信號之該計算及對兩信號之一後續組合,以便獲得該混疊減少或不含混疊之信號。較佳地,藉由進行如下操作來消除該混疊:藉由具有用於兩區塊之相等增益的一額外頻率-時間變換的該輸入信號在一重疊區中之一重建構;與一視窗函數或一相關函數之一乘法;一時間反轉;與該兩個增益或修改值之間的一增益差之一乘法;及自具有不同增益之處理之輸出的減法。
較佳地,所使用之該變換演算法為一修改型離散餘弦變換MDCT且該逆變換操作為一修改型離散餘弦反變換。或者,可使用其他此等混疊引入變換,諸如一MDST(修改型離散正弦變換)或一修改型離散正弦反變換(IMDST)或任何其他此變換,其中在分析側上,一時間部分中之樣本的一數目大於頻譜值之一數目,或替代性地陳述,其中兩個後續時間部分之間存在一重疊區,從而產生頻譜值之兩個後續區塊(亦即,產生在時間上隨後的頻譜值之區塊)。此處,頻譜值之兩區塊至少部分地相關於同一重疊區,亦即已最後產生頻譜值之該兩個時間後續區塊的彼等兩個時間部分之間的重疊區。此情況意謂在該分析側上,樣本之一區塊或一訊框中之時域樣本的數目大於一頻域表示區塊中之頻域值的數目,且在合成側上,合成時域樣本之數目大於用於合成時域樣本之重疊區塊的一區塊中之頻譜值的數目。
然而,作為該合成側上之一最後級,執行一重疊相加處理,使得最後,該重疊範圍中之樣本的一數目小於
一合成訊框中之時域樣本的數目,且較佳等於頻譜值之一區塊之頻譜值的數目。在後一狀況下,獲得一臨界取樣變換,且此等變換對本發明而言係較佳的,但本發明亦可應用於非臨界取樣變換,儘管相比於臨界取樣變換,此等變換具有某種額外額外負荷。
本發明態樣不僅可用於補償由時間-頻率變化之增益修改引起的混疊,亦能用於頻寬擴展(BWE)。在此使用狀況下,由BWE演算法之向上複製(copy-up)級產生的複製頻譜必須用一頻譜包絡成形,以儘可能接近地匹配原始頻譜包絡[4-6]。此頻譜包絡係大體上時間及頻率兩者相依的。儘管在大部分的目前先進技術BWE技術中,向上複製方案係恆定的,但有可能執行導致額外混疊之一時變向上複製。該新提議之混疊消除技術亦能夠處置此等BWE假影。
100、150‧‧‧處理器
102‧‧‧第一修改值
104‧‧‧混疊減少或不含混疊之第一結果信號
106‧‧‧第二修改值/增益因數
108‧‧‧混疊減少或不含混疊之第二結果信號
110、152、510‧‧‧組合器
112‧‧‧經處理音訊信號/不含混疊之信號
114‧‧‧頻譜值之區塊之序列
125‧‧‧差
154、810‧‧‧混疊影響信號
158‧‧‧混疊錯誤信號
170‧‧‧第一重疊範圍
191、304b‧‧‧第一區塊
192‧‧‧第二區塊
193、194、215、809‧‧‧區塊
201、214‧‧‧開視窗器/實際元件/區塊
202‧‧‧摺疊器/視窗函數
203‧‧‧時間-頻率轉換器/區塊
204b、205a、205b、206a‧‧‧部分
211‧‧‧修改器
212‧‧‧頻率-時間轉換器/實際元件/區塊
213‧‧‧摺疊器/實際元件/區塊
300‧‧‧源範圍
303、304、306‧‧‧重建構/頻率時間轉換器
306a、306b‧‧‧頻譜值區塊/第一區塊
306d‧‧‧項
307、308‧‧‧加權/乘法器
307a、307b、309、310、802‧‧‧乘法器
328、522‧‧‧加法器
329‧‧‧減法器或加法器
330‧‧‧乘法/開視窗器
332‧‧‧修補器
334‧‧‧目標範圍/頻譜值之區塊之序列
340‧‧‧時間反轉區塊
341‧‧‧組合器/區塊
351、551‧‧‧第一經修改區塊
352、552‧‧‧第二經修改區塊
353、553‧‧‧第三經修改區塊
354、554‧‧‧第四經修改區塊
361、362、363、364‧‧‧時域表示
501、502、503、504‧‧‧元件/IMDCT區塊
505、506‧‧‧重疊相加區塊/重疊相加處理操作
507、508、509、510‧‧‧增益乘法器/類似乘法功能性
520‧‧‧淡出區塊/淡出函數
521‧‧‧淡入區塊/淡入函數
561、563‧‧‧對應時間表示
562、564‧‧‧對應時間表示/線上信號
800‧‧‧前一區塊
801、805‧‧‧增益因數
804‧‧‧當前區塊
807、808‧‧‧IMDCT操作
隨後在隨附圖式之情況下論述本發明之較佳實施例,其中:圖1a為第一態樣之較佳實施例;圖1b為第二態樣之較佳實施例;圖1c為頻譜值之區塊之序列的示意性表示;圖1d為導致圖1c之區塊之序列的重疊時間部分之序列的示意性表示;圖2a說明混疊引入前向變換的實施;圖2b說明混疊減少反向變換的實施;圖3a說明第二態樣之另一實施例;
圖3b說明第二態樣之另一實施例;圖3c說明用於第一及第二態樣之頻寬擴展應用的示意圖;圖4說明用於第二態樣之混疊錯誤分量;圖5a說明第一態樣之實施例;圖5b說明第二態樣之實施例;圖6說明相關於第二態樣的藉由重建構、時間反轉及開視窗產生之混疊項;圖7說明訊框中之變化增益因數;圖8說明反MDCT處理之前的增益因數之應用;及圖9說明相關於圖8之處理的信號。
圖1a說明根據第一態樣的用於處理包含頻譜值之區塊之一序列的一音訊信號之裝置。用於處理之裝置包含處理器100,其用於使用用於一第一區塊之至少一個修改值102來處理頻譜值之區塊之該序列以獲得混疊減少或不含混疊之第一結果信號104。此外,該處理器使用不同於該第一修改值之至少一個第二不同修改值(亦即,第二修改值106)來處理區塊之該序列中之第二區塊(該第二區塊在時間上在該第一區塊之後或該第二區塊在時間上在該第一區塊之前且緊鄰該第一區塊),以獲得重疊範圍中之混疊減少或不含混疊之第二結果信號108。此後,該處理器產生用於同一重疊範圍之兩個不含混疊或至少混疊減少之時域信號。
將此等信號108輸入至組合器110中,該組合器用於在重疊範圍中組合第一結果信號與第二結果信號以獲得用於重疊範圍之經處理信號112。較佳地,該處理器經組配以用於產生用於重疊區之兩個不含混疊之輸出信號,且接著較佳執行彼等兩個不含混疊之輸出信號之間的平滑轉換。該處理器用以達成此操作之一個實施為佈建完全反變換處理,諸如用於兩區塊或用於該等區塊之兩不同修改值的IMDCT處理。換言之,該處理器產生用於第一區塊之重疊範圍、用於第一及第二區塊之同一修改值的完全IMDCT處理。此外,該處理器執行用於第一及第二區塊之完全IMDCT處理,但現在使用第二修改值。此等完全IMDCT處理操作均導致重疊範圍中之兩個不含混疊或至少混疊減少之時域結果信號,接著由組合器來組合該等時域結果信號。
隨後,在圖1b之情況下論述第二態樣。圖1b說明根據關於第二態樣之本發明之一實施例的用於處理包含頻譜值之區塊之一序列的一音訊信號之裝置。該裝置包含處理器150,該處理器用於使用用於頻譜值之區塊之序列114中之第一區塊的至少一個第一修改值102及使用用於頻譜值之區塊之序列114中之第二區塊的至少一個不同第二修改值106來計算混疊影響信號154。除混疊影響信號154之外,該處理器經組配以用於估計混疊錯誤信號158。此外,該裝置包含組合器152,該組合器用於組合混疊影響信號與混疊錯誤信號以使得藉由由組合器152進行之組合獲得的經處理音訊信號112為混疊減少或不含混疊之信號。
特定言之,根據圖1b中所說明之第二態樣,使用關於導致混疊影響信號154之同一重疊範圍的用於區塊之不同修改值來執行處理。然而,與將此混疊影響信號用於進一步處理且容許混疊誘發之錯誤的先前技術相比,本發明中並不進行此處理。實情為,處理器150另外計算混疊錯誤信號158,接著通常藉由減法或大體上加權線性組合而將混疊錯誤信號與混疊影響信號組合,使得經處理音訊信號較佳為不含混疊的,但即使在該組合或特定混疊錯誤信號並未完全準確計算時,組合仍然導致比混疊影響信號154具有較少混疊錯誤之經處理音訊信號。
在許多應用中,需要藉由在將頻譜係數饋送至IMDCT之前對該等頻譜係數應用增益因數而修改該等頻譜係數,使得:Y j (k)=g j (k).X j (k)
其中X j (k)為第j個訊框之MDCT頻譜,k為頻率索引,g j (k)為時間及頻率相依頻譜加權函數且Y j (k)為經濾波MDCT頻譜。圖8中亦展示增益因數之此應用。
特定言之,圖8說明典型先前技術MDCT合成系統,其中由乘法器802將具有時間索引j-1的前一區塊800之頻譜值乘以至少一個增益因數gj-1。此外,將具有時間索引j的當前區塊804乘以在805處所指示的用於當前區塊之增益因數gj或由該增益因數修改。特定言之,在801處所指示的用於具有時間索引j-1的前一區塊之增益因數801與用於當前區塊之增益因數gj 805彼此不同。此外,如圖8中所概
述,增益因數可係頻率相依的。由頻率索引k來說明此情況。因此,取決於增益因數屬於哪一區塊800或804,將具有索引k之各頻譜值乘以對應第一或第二增益因數801、805。因此,歸因於用於兩個區塊之增益因數為時變的及/或頻變的之事實,當應用圖8中之處理時,在處理中產生混疊錯誤。此處理由用於前一區塊800之IMDCT操作807及用於當前區塊804之又一IMDCT操作808組成。IMDCT操作由頻率時間變換及後續疊出操作組成,如在圖2b之情況下將進一步論述。接著,在實際相加之前,由區塊809執行另外包含合成開視窗器(synthesis windower)之重疊相加處理,以便最後獲得在810處所指示之混疊影響信號y(n)。因此,混疊影響信號810可通常恰好與圖154中以154所說明的混疊影響信號相同。
若兩個後續訊框中之增益不同,則混疊項不再彼此消除,如圖9中可看出(右邊),其中增益因數在頻率上係恆定的,但在時間上不恆定。在此實例中,增益為g 0(k)=1及g 1(k)=0.7,使得剩餘混疊分量為乘以0.3之因數的來自訊框0之混疊。
應注意,對於此簡單狀況(主要選擇該狀況以用於說明),頻域處理將並非必要的,此係由於可藉由應用合適之時間包絡而實現並無混疊問題之類似效應。然而,此實例有助於解釋混疊減少方案之基本想法。此處,剩餘混疊分量為乘以兩個增益因數之差(在吾人之實例中為0.3)的經時間反轉且經開視窗之輸入信號。因此,可藉由以下步
驟來消除混疊:
‧藉由具有用於兩個區塊之相等增益之額外IMDCT而重建構重疊區中之輸入信號
‧乘以函數w(n).w(N+n)
‧時間反轉
‧乘以增益差0.3
‧自具有不同增益之處理之輸出的減法
在圖6中說明前三個步驟之輸出。
在第一態樣中,計算用於重疊區之兩個不含混疊之輸出信號且接著在該兩個輸出信號之間執行平滑轉換。圖5a展示實施例之方塊圖。
自利用相等集合之增益因數g j-1(k)的對具有頻譜係數X j-1(k)及X j (k)之兩個受影響訊框的IMDCT處理獲得第一信號p 1,j (n)。兩個訊框之時域混疊分量彼此消除,此係由於不存在增益差。相應地自X j-1(k)及X j (k)產生第二信號p 2,j (n),但現在使用增益因數g j (k)。現在可藉由在重疊區內執行自p 1,j (n)朝向p 2,j (n)之平滑轉換而獲得頻譜形狀之變化:y(jN+n)=f(n).p 1,j (n)+(1-f(n)).p 2,j (n)
其中f(n)通常在間隔0 n<N中自1至0地單調遞減。對於f(n)=1-w 2(n)之狀況,可展示兩方法產生恰好相同之輸出(詳見附錄)。然而,獨立於MDCT窗口來選擇平滑轉換函數之自由給予此方法益處,在圖5a中說明此方法。
就純增益變化而論,第二程序可藉由產生兩個不含混疊之信號及執行平滑轉換而減少混疊分量。此處,藉由在兩個對應訊框中使用相等修補及相等增益因數而獲得兩個信號中之各者(參見圖5b)。對於恆定及固定修補,無需作出特殊區別。恆定修補將僅針對所有訊框推斷相等映射P j (k)=P(k)。
若增益因數不僅隨時間變化,而且隨頻率變化,則處理變得較複雜。在此狀況下,時間包絡之替換不再可能,且產生時間反轉輸入信號亦不提供用於減少混疊分量之合適信號。在以下實例中說明此情況,其中第一訊框中之增益再次在頻率上恆定(g 0(k)=1),但在第二訊框中,g 1(k)如圖7中所展示地變化。
此情況導致未消除之混疊分量,然而該未消除之混疊分量具有不同於圖9中所展示之形狀(右邊)的形狀。如在第一實例中所見,增益差導致未消除之混疊分量。因此,圖3a中展示該程序。
藉由圖3a中所說明之以下步驟來執行混疊減少:
‧藉由用增益差對原始係數加權(307、308)而產生額外頻譜係數:U j-1(k)=(g j (k)-g j-1(k)).X j-1(k)
U j (k)=(g j (k)-g j-1(k)).X j (k)
‧藉由用U j-1(k)及U j (k)進行額外IMDCT而在重疊區中重建構(303、304、306)輸入信號
‧乘以(330)函數w(n).w(N+n)
‧時間反轉(340)
‧組合,諸如對具有不同增益之處理之輸出的加法或減法
對於特定說明之MDCT實施,增益差項(g j (k)-g j-1(k))之次序判定是否必須自常規IMDCT輸出加上或減去時間反轉之輸出。對於其他MDCT實施,正負號可不同:(gj(k)-gj-1(k)):將時間反轉之輸出加至常規IMDCT輸出。
(gj-1(k)-gj(k)):自常規IMDCT輸出減去時間反轉之輸出。
因此,對於上文所描述之實施例且對於圖3a中之說明狀況(其中說明了(g j (k)-g j-1(k))),組合器341將實施為將兩輸入相加之加法器。
應注意,對於交疊變換之不同實施,需要之正負號可不同。舉例而言,對於奇數堆疊MDCT,存在至少四個實施例。此外,對於偶數堆疊MDCT或具有多個重疊之ELT,存在其他實施例。對於奇數堆疊MDCT,用於校正項之正負號不同。因此,區塊341中所執行之組合可包括加法或減法。
當前實例之混疊校正項係與經混疊IMDCT輸出一起展示於圖4中。
藉由映射函數P(k)来描述BWE演算法之向上複製級。對於將頻譜係數之下半部分複製至上半部分,該複製可如下:
增益函數在下半部分中可為恆定的且等於1:
若增益因數在頻譜之上半部分中可變化,則未消除之混疊可再次出現。然而,可以恰好以相同於如上文所描述之第一方法中所描述的方式來執行混疊減少,差別僅為在產生補償信號時亦必須考慮修補。可藉由在將經映射頻譜係數饋送至IMDCT時使用該等係數及用增益差適當地對該等係數進行加權而實現此操作。在此狀況下,下半部分中之所有增益差將為零。
較先進頻寬擴展可應用在訊框之間變化的修補。可藉由針對各訊框定義個別映射函數P j (k)来描述此情況。在此狀況下,混疊減少必須考慮到可將不同分量複製至影響常見重疊區的兩個訊框中之相同頻率索引。在產生混疊減少分量時必須考慮此情況。出於此目的,上文將第一訊框中之修補處理為在訊框j-1中具有g j-1(k)之增益且在訊框j中具有0之增益,並假定訊框j中之修補在訊框j-1中具有0之增益且在訊框j中具有g j (k)之增益。用於產生混疊減少信號之所得頻譜係數如下:U j (k)=-g j-1(k).X j-1(P j-1(k))+g j (k).X j-1(P j (k))
U j-1(k)=-g j-1(k).X j (P j-1(k))+g j (k).X j (P j (k))
在圖3b中展示此組配之方塊圖。
在以下章節中,關於類似性較詳細地論述圖3a
中以及圖5a及圖5b中之兩個態樣。
藉由如下方程式來定義自樣本位置jN開始之2N個樣本之訊框x j (n)的具有N個頻譜係數之頻率解析度之MDCT:
其中w(n)為長度2N之視窗函數,k為頻率索引,n為時域中之樣本索引。時間信號x(n)之訊框x j (n)如下定義:
藉由反向變換自頻譜分量Y j (k)獲得中間輸出訊框 ,0 n<2N:
藉由將重疊分段相加來計算反MDCT(IMDCT)處理之最後輸出:
其中縮寫且其中視窗條件為
w(N-1-n)=w(N+n)
及w 2(n)=1-w 2(N+n)
應用增益因數之後的在重疊區中之IMDCT之輸出為:
其中
重疊相加、開視窗及時間反轉之後的關於圖1b、圖3a所描述之第二態樣的混疊校正項為:
其中
餘弦項具有以下對稱性:
代入此等對稱性產生:
自y k (n)減去r k (n)使該等項構建混疊減少之輸出:
該等方程式對應於根據參考圖1a、圖5a及圖5b所說明及描述之第一態樣的藉由增益g j-1(k)及g j (k)重建構之信號之間的平滑轉換。
隨後,參看圖1c及圖1d,以便說明時間部分與區塊在編碼器或分析側上抑或解碼器或合成側上的關係。
圖1d說明第0時間部分至第三時間部分之示意性表示,且此等後續時間部分中之各時間部分具有某一重疊範圍170。基於此等時間部分,藉由關於展示混疊引入變換操作之分析側的圖2a所較詳細論述之處理來產生表示重疊時間部分的區塊序列中之區塊。
特定言之,當圖1d應用於分析側時,藉由應用分析視窗之開視窗器201對圖1d中所說明之時域信號開視窗。因此,為了獲得(例如)第0時間部分,開視窗器將分析視窗應用於(例如)2048個樣本(且特定言之應用於樣本1至樣本2048)。因此,N等於1024,且視窗具有2N個樣本之長度(在該實例中為2048)。接著,開視窗器應用又一分析操作,但並非將樣本2049作為區塊之第一樣本,而係將樣本1025作為區塊中之第一樣本以便獲得第一時間部分。此後,獲得50%重疊之1024個樣本長之第一重疊範圍170。針對第二及第三時間部分另外應用此程序,但此程序始終具有一重疊以便獲得某一重疊範圍170。
應強調,重疊未必必須為50%重疊,而是重疊可
較高及較低,且可甚至存在多重疊(亦即,兩個以上視窗之重疊),使得時域音訊信號之樣本並非僅有助於兩個視窗及因此之頻譜值之區塊,而樣本接著有助於甚至兩個以上視窗/頻譜值之區塊。另一方面,熟習此項技術者另外理解,存在可由圖2a之開視窗器201應用的具有0個部分及/或具有單一值之部分的其他視窗形狀。對於具有單一值之此等部分,似乎此等部分通常與之前或後續視窗之0個部分重疊,且因此位於具有單一值的視窗之恆定部分中的某一音訊樣本僅有助於頻譜值之單一區塊。
接著,將如由圖1d所獲得之視窗型時間部分轉遞至用於執行疊入操作之摺疊器202。此疊入操作可(例如)執行疊入,使得在摺疊器202之輸出處,僅存在每區塊具有N個樣本的取樣值之區塊。接著,在由摺疊器202執行之摺疊操作之後,應用時間-頻率轉換器,其為(例如)將輸入處之每區塊N個樣本轉換成時間-頻率轉換器203之輸出處的N個頻譜值之DCT-IV轉換器。
因此,在圖1c中說明在區塊203之輸出處所獲得的頻譜值之區塊之序列,特定展示具有在圖1a及圖1b中以102說明的相關聯第一修改值之第一區塊191且具有具有諸如圖1a及圖1b中所說明之106的相關聯第二修改值之第二區塊192。自然地,如所說明,該序列具有在第二區塊之前或甚至導引第一區塊之更多區塊193或194。第一及第二區塊191、192係(例如)藉由變換圖1d之視窗型第一時間部分以獲得第一區塊而獲得,且第二區塊係藉由用圖2a之時間-頻
率轉換器203變換圖1d之視窗型第二時間部分而獲得。因此,頻譜值之區塊之序列中的在時間上鄰近的頻譜值之兩區塊表示覆蓋第一時間部分及第二時間部分之重疊範圍。
隨後,論述圖2b以便說明對圖2a之編碼器或分析側處理之結果的合成側或解碼器側處理。將由圖2a之頻率轉換器203輸出的頻譜值之區塊之序列輸入至修改器211中。如所概述,對於圖1c至圖2b中所說明的實例,頻譜值之各區塊具有N個頻譜值。各區塊具有其相關聯修改值,諸如圖1a及圖1b中所說明之102、104。接著,在典型IMDCT操作或典型冗餘減少合成變換中,執行由頻率-時間轉換器212、用於疊出之摺疊器213、用於應用合成視窗之開視窗器214所說明之操作及由區塊215說明之重疊/加法器操作,以便獲得在重疊範圍中的時域信號。在該實例中,上述信號每區塊具有2N個值,使得在各重疊及加法運算之後,獲得N個新的不含混疊之時域樣本,其限制條件為修改值102、104不可隨時間或頻率變化。然而,若彼等值可隨時間及頻率變化,則區塊215之輸出信號並非不含混疊的,但此問題係由如在圖1b及圖1a之情況下所論述及如在本說明書中之其他圖式之情況下所論述的本發明之第一及第二態樣來解決。
隨後,給出由圖2a及圖2b中之區塊執行的程序之又一說明。
參考MDCT來例示說明,但可以類似及相似方式來處理其他混疊引入變換。作為交疊變換,MDCT相比於
其他傅里葉相關變換有點不尋常,此係因為MDCT之輸出為輸入之一半(而非相同數目)。特定言之,MDCT為線性函數F:R 2N →R N (其中R表示實數之集合)。根據如下公式將2N個實數x0、......、x2N-1變換成N個實數X0、......、XN-1:
(此變換前面的正規化係數(此處為單一性)為任意約定且在處理之間不同。僅下文的MDCT及IMDCT之正規化之乘積受約束。)
反MDCT被稱為IMDCT。因為存在不同數目之輸入及輸出,所以乍看之下可看出MDCT不應係可逆的。然而,藉由將時間鄰近之重疊區塊之重疊IMDCT相加來達成完美可逆性,從而使錯誤消除且原始資料被擷取;此技術被稱為時域混疊消除(TDAC)。
IMDCT根據如下公式將N個實數X0、......、XN-1變換成2N個實數y0、......、y2N-1:
(類似於DCT-IV、正交變換,反變換具有相同於前向變換之形式。)
在具有尋常視窗正規化之視窗型MDCT的狀況下(參見下文),應將IMDCT前面的正規化係數乘以2(亦即,變成2/N)。
在典型信號壓縮應用中,藉由使用乘以上文之
MDCT及IMDCT公式中之xn及yn的視窗函數wn(n=0......2N-1)來進一步改良變換性質,以便避免藉由使函數在n=0及2N之點處平滑地歸零而形成的彼等邊界處之不連續性。(亦即,吾人在MDCT之前及IMDCT之後對資料進行開視窗。)原則上,x及y可具有不同視窗函數,且視窗函數亦可自一個區塊至下一區塊改變(尤其針對組合不同大小之資料區塊之狀況),但為簡單起見,吾人考慮用於相等大小區塊之相同視窗函數的常見狀況。
對於對稱視窗wn=w2N-1-n,只要w滿足如下Princen-Bradley條件,則變換保持可逆(亦即,TDAC起作用):
使用各種視窗函數。藉由如下方程式給出產生被稱為調變型交疊變換之形式的視窗
且該視窗被用於MP3及MPEG-2 AAC,且
針對Vorbis。AC-3使用凱斯貝-塞爾導出(KBD)視窗,且MPEG-4 AAC亦可使用KBD視窗。
應注意,應用於MDCT之視窗不同於用於一些其他類型之信號分析的視窗,此係由於該等視窗必須滿足Princen-Bradley條件。此差異之原因中之一者為MDCT視窗
應用了兩次,用於MDCT(分析)及IMDCT(合成)兩者。
如藉由檢驗定義可看出,對於偶數N,MDCT基本上等效於DCT-IV,其中輸入被移位N/2且一次變換兩個N個資料區塊。藉由較謹慎地檢查此等效,可容易地導出類似TDAC之重要性質。
為了定義與DCT-IV之精確關係,吾人必須認識到DCT-IV對應於交替之偶數/奇數邊界條件:偶數在其左邊界處(大約n=-1/2),奇數在其右邊界處(大約n=N-1/2)等等(而非就DFT而言之週期性邊界)。此情況遵循一致性且因此若其輸入為
因此,若其輸入為長度N之陣列x,則吾人可想像將此陣列擴展為(x、-xR、-x、xR......)等等,其中xR表示逆序之x。
考慮具有2N個輸入及N個輸出之MDCT,其中吾人將輸入劃分成各自具有N/2之大小的四個區塊(a,b,c,d)。若吾人將此等資料向右移位N/2(自MDCT定義中之+N/2項起),則(b,c,d)擴展超過N個DCT-IV輸入之末端,因此吾人必須根據上文所描述之邊界條件將該等輸入「疊」回。
因此,2N個輸入(a,b,c,d)之MDCT恰好等效於N個輸入(-cR-d,a-bR)之DCT-IV,其中R表示如上之反轉。
針對圖2a中之視窗函數202例示此情況,a為部分204b、b為部分205a、c為部分205b且d為部分206a。
(以此方式,用以計算DCT-IV之任何演算法可直觀地應用於MDCT。)
類似地,上文之IMDCT公式恰好為DCT-IV之1/2(該公式為其自身之反數),其中輸出經擴展至(經由邊界條件)長度2N且往回向左移位N/2。反DCT-IV將簡單地送回來自上文之輸入(-cR-d,a-bR)。當此輸入經由邊界條件擴展並移位時,吾人獲得:IMDCT(MDCT(a,b,c,d))=(a-bR,b-aR,c+dR,d+cR)/2。
因此,一半之IMDCT輸出係冗餘的,此係由於b-aR=-(a-bR)R,且最後兩個項亦同樣如此。若吾人將輸入分組成具有大小N之較大區塊A、B,其中A=(a,b)且B=(c,d),則吾人可以較簡單之方式寫出此結果:IMDCT(MDCT(A,B))=(A-AR,B+BR)/2
吾人現在可理解TDAC工作之方式。假設吾人計算時間鄰近之50%重疊的2N區塊(B,C)之MDCT。將接著得到相似於上文之IMDCT:(B-BR,C+CR)/2。當將此結果與重疊之半部分中之先前IMDCT結果相加時,反向項消除且吾人僅獲得B,從而復原原始資料。
現在明瞭術語「時域混疊消除」之起源。使用擴展超出邏輯DCT-IV之邊界的輸入資料導致資料將以相同於將超出奈奎斯特頻率之頻率混疊至較低頻率之方式進行混疊,不同之處在於,此混疊出現在時域中而非頻域中:
吾人不能區分a及bR對(a,b,c,d)之MDCT,或等效地對IMDCT之結果(MDCT(a,b,c,d))=(a-bR,b-aR,c+dR,d+cR)/2的貢獻。當將組合c-dR等等相加時,該等組件恰好具有供組合進行消除之正確正負號。
對於奇數N(其很少用於實踐),N/2並非整數,因此MDCT並非簡單地為DCT-IV之移位置換。在此狀況下,半個樣本之額外移位意謂MDCT/IMDCT變得等效於DCT-III/II,且分析相似於上文。
上文中吾人已看到2N個輸入(a,b,c,d)之MDCT等效於N個輸入(-cR-d,a-bR)之DCT-IV。DCT-IV經設計以用於如下狀況:右邊界處之函數為奇數,且因此靠近右邊界之值接近於0。若輸入信號平滑,則狀況如下:a及bR之最右分量在輸入序列(a,b,c,d)中連續,且因此其差較小。吾人再看間隔的中部:若吾人將上文之表達式重寫為(-cR-d,a-bR)=(-d,a)-(b,c)R,則第二項(b,c)R在中部給出平滑轉變。然而,在第一項(-d,a)中,存在-d之右末端相接a之左末端的潛在不連續性。此為使用減少靠近朝向0的輸入序列(a,b,c,d)之邊界的分量之視窗函數的原因。
在上文中,已證明TDAC性質能用於普通MDCT,從而展示將時間鄰近區塊之IMDCT在其重疊之半部分中相加能復原原始資料。視窗型MDCT之此反性質之推導僅微較較複雜。
針對具有大小N之區塊A、B、C考慮2N個輸入(A,B)及(B,C)之重疊連續集合。自上文回顧:當將(A,B)及
(B,C)輸入至MDCT、IMDCT中且在其重疊之半部分中相加時,吾人獲得原始資料(B+B R )/2+(B-B R )/2=B。
現在吾人假設,吾人將MDCT輸入及IMDCT輸出兩者皆乘以長度2N之視窗函數。如上,吾人假定對稱視窗函數,該函數因此具有(W,W R )之形式,其中W為長度N向量且R如前所述地表示反轉。接著,可將Princen-Bradley條件寫為W 2+=(1,1,...),其中從元素方面執行平方及加法。
因此,替代對(A,B)執行MDCT,吾人現在對(WA,WRB)進行MDCT(其中從元素方面執行所有乘法)。當將此結果輸入至IMDCT中且再次乘以(從元素方面)視窗函數時,最後一半N變成:W R .(W R B+(W R B) R )=W R .(W R B+WB R )=WR 2B+WW R B R 。
(應注意,式子不再具有1/2之乘法,此係因為IMDCT正規化在視窗型狀況中以因數2不同。)
類似地,對(B,C)之視窗型MDCT及IMDCT在其前一半N中得到:W.(WB-W R B R )=W 2 B-WW R B R
當吾人將此等兩個半部分相加在一起時,吾人復原原始資料。當兩個重疊視窗半部分滿足Princen-Bradley條件時,在窗切換之情況下重建構亦係可能的。在此狀況下,混疊減少可恰好以相同於如上文所描述之方式進行。對於具有多個重疊之變換,將需要使用所有涉及增益值之兩個以上分支。
隨後,藉由參看圖5a及圖5b來較詳細地論述第一
態樣。特定言之,圖1a中所說明之處理器100可包括在圖5a中由參考數字100定義之框中所說明的元件501至506之全部或僅一部分。較佳地,處理器100包含一修改器,該修改器用於使用至少一個第一修改值102來修改說明為Xj-1的序列中之第一區塊以獲得第一經修改區塊551。較佳由可用數位或類比方式或以任何其他合適方式實施之增益乘法器510來執行此修改。此外,該修改器經組配以使用至少一個第二修改值106來修改指示為Xj(k)之第二區塊以獲得第二經修改區塊552。再次較佳由可以相同於乘法器510之方式或以一不同方式實施之乘法器509來執行此修改。此外,該修改器經組配以用於使用至少一個第一修改值102來修改第二區塊Xj(k)以獲得第三經修改區塊553,其中此修改再次可由可關於乘法器510或509以相同方式或以不同方式實施之乘法器508來執行。
此外,該修改器經組配以使用至少一個第二修改值106(亦即,Xj(k))來修改第一區塊xj-1以獲得第四經修改區塊554。較佳地,第四經修改區塊554再次由可關於乘法器510、509、508以相同方式或以不同方式實施之乘法器507產生。
此外,處理器100較佳地包含一頻譜-時間轉換器,其用於將第一至第四經修改區塊551至554轉換成對應時間表示561、562、563、564。特定言之,該頻譜-時間轉換器係實施為包含產生對應第一至第四經修改區塊561至564之IMDCT區塊501、502、503、504。該頻譜-時間轉換
器可實施為包含圖2b之實際元件212(頻率-時間轉換器)、213(用於疊出之摺疊器)及214(合成開視窗器)的IMDCT演算法。然而,該頻譜-時間轉換器可實施為任何其他混疊減少變換器,其在輸出處產生具有比其輸入處之樣本數目高的樣本數目之時域取樣值之區塊。
或者,對於計算有效之實施,不可計算全IMDCT或整個混疊減少反變換,而係僅計算含有混疊減少或混疊消除信號之時間分段。根據此思路(例如,在IMDCT之狀況下),可省略一個疊出操作及一半的合成開視窗操作。因此,該處理器可經組配以用於執行具有重疊範圍之交疊變換,且其中該處理器經組配以僅用於執行影響重疊範圍中之值的操作,而不用於執行不影響重疊範圍中之值的操作。關於圖2b,不影響重疊範圍之操作係影響前一區塊之第一半部分及當前區塊之第二半部分的對區塊213之疊出操作。此外,對於此有效實施,針對前一區塊之第一半部分及當前區塊之第二半部分的對應開視窗操作亦非必要的。此歸因於僅前一區塊之第二半部分及當前區塊之第一半部分用於重疊範圍的事實。
在圖5a中之實施例中,輸入至IMDCT區塊中之樣本的數目等於N,且由IMDCT區塊輸出之樣本的數目為2N。然而,只要由頻譜-時間轉換器輸出之樣本的數目大於輸入至對應頻譜-時間轉換器中之譜域樣本的數目,即可實施對應於其他重疊因數之其他數目比率。
此外,頻譜-時間轉換器可實施為含有用於待轉
換之各個別信號的個別頻譜時間轉換器,或可包含諸如僅圖5a之區塊501的單一頻譜時間轉換器及對應序列控制器,以便依序地在一經修改區塊之後變換另一個經修改區塊。
此外,處理器100包含一重疊加法器,其用於將第一經修改區塊561與第三經修改區塊563之表示重疊相加以獲得不含混疊或至少混疊減少之第一結果信號104。
此外,該重疊加法器經組配以用於將第二經修改區塊562與第四經修改區塊564之時間表示重疊相加以獲得亦不含混疊或至少混疊減少之第二結果信號108。由重疊相加區塊505來執行針對第一及第三時間表示之此重疊相加操作,且由又一重疊相加區塊506來執行針對第二及第四經修改區塊之時間表示(亦即,針對線上信號562及564)之另一重疊相加操作。此外,該重疊加法器可具有單獨之此等區塊或單一區塊及對應序列控制,或可以任何其他可想像方式來實施以便獲得所定義結果。較佳地,區塊505、506中之各者實施於圖2b之情況下所描述之對應區塊215中。
較佳地,圖5a中之組合器110經組配以藉由淡出第一結果信號104及藉由淡入第二結果信號108而組合該第一結果信號與該第二結果信號。為此目的,提供用於第一結果信號104之淡出區塊520及用於第二結果信號之淡入區塊521。可藉由在圖5a中說明為單獨元件之加法器522來執行實際組合。然而,應強調,組合器510之實際操作較佳為加權線性組合,其中對於各樣本,淡出函數520提供某一加
權因數,且接著將藉由此加權因數加權之對應樣本加至用藉由用於對應樣本之淡入函數521提供之加權因數加權的來自其他結果信號之對應樣本。
如所概述,處理器100經組配以在執行頻譜-時間轉換時執行一IMDCT操作,且此IMDCT操作可包含區塊212、213、214之功能性,但可以任何其他方式來實施該IMDCT操作,且基本上獲得相同於圖2a及圖2b之情況下所論述之結果的許多有效IMDCT演算法係熟知的。
此外,處理器100經組配以在計算在圖1d中以170說明之重疊範圍中的第一及第二結果信號時執行重疊相加處理操作505、506。此外,組合器104經組配以在組合範圍中(亦即,(例如)在此組合範圍等於重疊範圍之情況下,在重疊相加範圍)組合第一及第二結果信號。
因此,應強調,亦可將圖1d視為表示由合成側上之區塊215執行的重疊相加操作。接著,圖1d中之各「時間部分」表示由圖2b之合成開視窗器214輸出之區塊,且將一個經開視窗區塊之重疊範圍中的樣本加至下一經開視窗區塊之重疊範圍中的樣本。此外,視需要,用藉由諸如520之淡出函數及淡入函數522提供之加權因數對對應樣本加權。舉例而言,當第一時間部分對應於經開視窗區塊時,接著在圖1d中之重疊範圍170中,可在重疊範圍期間淡出第一時間部分,且同時可在重疊範圍內淡入第二時間部分。因此,淡出函數可提供較佳地以線性方式自1降低至0且遍及自1至N之樣本數目相等地分佈的淡出因數。因此,當經
開視窗區塊之長度為2N時,接著可將1與0之間的間隔分成N個相等間隔,且對於各間隔,可將淡出因數判定為(例如)各間隔之中心。類似地,淡入函數可為提供同樣具有N個相等間隔之自0至1線性地增加之淡入因數的函數。
然而,可應用除了線性函數之外的其他函數,且較佳地,對於各樣本,用於樣本之淡入因數與用於樣本之淡出因數的總和等於1,使得淡入/淡出或大體上平滑轉換並不導致音訊信號之振幅或響度變化。因此,用於平滑轉換範圍中之各樣本的淡出部分與淡入部分之總和係恆定的且較佳等於1。
較佳地,在圖5b之情況下的頻寬填充功能性之情況下應用本發明。頻寬擴展意謂擴展輸入信號之頻寬,使得由頻寬擴展技術產生之輸出信號通常具有比輸入信號高之頻寬。然而,另一方面,亦存在未必增加頻寬但填充輸入信號內之頻譜洞的頻寬填充技術。當將頻率上帶視為「頻譜洞」時,則頻寬填充功能性類似於頻寬擴展技術。然而,若存在相對於頻率位於頻譜值範圍下的輸入信號之頻譜洞,則頻寬填充功能性不擴展頻寬,但技術之結果具有相同於輸入之頻寬。在此情況下,(例如)SBR為頻寬擴展技術之實例,且智慧式間隙填充(IGF)為無需必須增加輸入信號之頻寬的一般頻寬填充功能性之實例。
較佳地,處理器100經組配以應用具有一修補函數的頻寬填充功能性以將頻譜值自源範圍300修補至目標範圍334,且該處理器經組配以在計算第一及第二結果信號
時應用該修補函數。例示性地,圖3c說明用於自具有高解析度或表示源範圍的頻譜值之區塊之序列產生在頻寬填充範圍或目標範圍中的頻譜值之區塊之序列334的一修補器。該修補器在圖3c中以332來指示且可經實施以應用如所說明之修補函數P(k)。視情況,如圖3c中所說明且在應用頻寬填充功能性之狀況下,處理器100與組合器110之構造相同,猶如未應用頻寬填充一般,以下事實除外:在圖5b中以334指示的頻譜值之區塊之序列為圖3c中之修補器的輸出,且增益因數102、106或大體上用於各區塊之修改因數係由諸如頻譜帶複製、智慧式間隙填充或任何其他頻寬填充功能性之某些頻寬填充功能性來定義。因此,修補器332可為處理器之部分或可實施為應用於至處理器中之輸入處的預處理級。
因此,用於處理音訊信號之裝置包含作為處理器100之部分抑或作為在圖1a之處理器100之前應用於信號處理方向上之區塊的修補器,其中此修補器經組配以用於根據用於第一區塊之修補函數在使用來自不同頻率範圍(亦即,來自源範圍)之頻譜值的頻寬填充範圍中產生第一區塊,且該修補器經另外組配以根據用於第二區塊之修補函數(其可為相同修補函數或不同修補函數)在使用來自不同頻率區或源區之頻譜值之頻譜範圍的頻寬填充範圍或目標範圍中產生該第二區塊。
此外,如在圖5a或圖5b之情況下已論述,該處理器經組配以執行類似乘法功能性510、509、508、507,該
功能性用於將增益函數或增益值用作修改值來修改第一及第二區塊。
在圖3a及圖3b之情況下論述本發明之第二態樣的其他實施例。
圖3a及圖3b皆展示用於處理包含頻譜值之區塊之一序列114的之音訊信號之裝置。各實施包含處理器150,其用於使用用於區塊序列114中之第一區塊的至少一個第一修改值102及用於該區塊序列中之第二區塊的至少一個不同第二修改值來計算混疊影響信號154。較佳地,用於計算混疊影響信號的處理器之功能性包含一增益修改器,其用於使用至少一個第一修改值來修改第一區塊以獲得第一經修改區塊351。此修改較佳由乘法器310來執行,但可如在圖5之對應乘法器510之情況下所論述地實施。此外,該增益修改器經組配以用於使用至少一個第二修改值106來修改第二區塊Xj(k)以獲得第二經修改區塊352。此修改再次可由乘法器309來執行,乘法器309又可如乘法器510之情況下所論述地實施。為產生混疊影響信號,處理器150包含用於將第一及第二經修改區塊轉換成時域表示361、362之一頻譜-時間轉換器,且另外,一重疊加法器經組配以用於將第一及第二區塊之時域表示(亦即,361及362)重疊相加以獲得混疊影響信號154。
此外,該處理器亦經組配以用於估計混疊錯誤信號。為此目的,處理器150包含由乘法器308及307說明的增益修改器之又一功能性,以便使用至少一個第一修改值102
或至少一個第二修改值106來修改第一區塊及第二區塊以獲得第三經修改區塊353及第四經修改區塊354。
此外,以303及304來說明頻譜-時間轉換器以分別將第三經修改區塊353及第四經修改區塊354轉換成時域表示363及364,且接著藉由用於將第三及第四經修改區塊之時域表示重疊相加之一重疊加法器來處理此等第三及第四經修改區塊以便獲得混疊錯誤信號158。
為了操縱混疊錯誤信號158以用於獲得與混疊影響信號158之良好組合,組合器包含用於應用視窗函數之開視窗器330及用於對信號進行時間反轉之時間反轉區塊340。
在頻域中(亦即,在執行區塊303及304中之頻譜-時間轉換之前的處理器中)應用增益修改值之間的差。為此目的,參看圖3a。特定言之,在此實施例中,處理器包含增益修改器,其經組配以用於使用至少一個第一修改值與至少一個第二修改值之間的差經由乘法器307來修改第一區塊xj-1,其中較佳為每頻率值或頻譜值(如由圖3a中之索引k所指示)計算計算此差。此外,增益修改器經組配以用於在乘法器308內使用差125來修改第二區塊,以便獲得第三經修改區塊353及第四經修改區塊354。在圖3a中所說明之此實施例中,組合器包含視窗330及時間反轉340。
儘管指示了組合器內之處理操作之序列,使得開視窗器330在時間反轉340之前的信號流方向上操作,但應明瞭,亦可反轉此等元件之操作的次序。
因此,圖3a中之處理器150即如此,使得增益修改器使用至少一個第一修改值或至少一個第二修改值來修改第一區塊及第二區塊。圖3a中之修改引發兩修改值,此歸因於如下事實:兩修改值之間的差實際上用於(例如)由乘法器308、307執行之修改,其中增益差在圖3a處以125指示。
此外,如所概述,較佳地應用開視窗操作330及時間反轉操作340。然而,對於其他實施(例如,當以不同方式實施頻譜-時間變換時),可完全不必要應用時間反轉340。此外,當未應用分析視窗或合成視窗時,但當僅應用(例如)「矩形視窗」時,接著亦可免除開視窗330。
然而,在較佳實施例中,說明開視窗器及時間反轉器運算子且該兩者係以說明次序定位。
隨後,較詳細地論述圖3b。圖3b相似於圖3a,相似之處在於增益「差」之應用被應用於頻域中。然而,歸因於應用修補操作之事實,不能顯式地應用增益差,但不同修補操作較佳得到解釋。
因此,為了獲得混疊錯誤信號,在如圖3c之情況下所論述的頻寬填充功能性之情況下的修補操作中,較佳應用以下程序。首先,計算頻譜值之區塊306a(其為第一區塊),但經由用於第二區塊之修補操作來修補第一區塊,且接著將此第一區塊306a乘以用於第二區塊之增益因數106。
此外,如所說明,產生頻譜值之第一區塊306b,該區塊相同於第一區塊304b(亦即,應用有與第一區塊相關聯之修補操作的第一區塊),且接著將信號乘以第一修改因
數102。接著,組合(諸如,在可實施為減法器或具有否定輸入之加法器等的329中減去或加在一起)由乘法器產生之信號。接著,獲得基本上對應於區塊353之第三經修改區塊。以類似方式獲得區塊354,亦即藉由用用於第二區塊之修補操作來修補第二區塊Xj,亦即藉由使用區塊304b及將此區塊乘以第二修改因數106。然而,第二區塊亦經受如以項306d指示的與第一區塊相關聯之修補演算法,且接著經由乘法器307b將結果乘以第一乘法因數。接著,在加法器328中將乘法器307a及307b之輸出信號加在一起以便最後獲得第四經修改區塊354。接著,第三及第四經修改區塊353及354經受如圖3a之情況下所論述的頻譜-時間變換,且接著使用如圖3b中所說明之區塊306對該等經修改區塊進行重疊相加。接著,執行組合器中之相同操作(諸如,開視窗330、時間反轉340及最後組合152),以便最後獲得不含混疊之信號112。
儘管本發明已在區塊表示實際或邏輯硬體組件之方塊圖之情況下加以描述,但本發明亦可藉由電腦實施方法來實施。在後一狀況下,區塊表示對應方法步驟,其中此等步驟代表藉由對應邏輯或實體硬體區塊執行之功能性。
儘管一些態樣已在裝置之情況下加以描述,但顯然,此等態樣亦表示對應方法之描述,其中區塊或器件對應於方法步驟或方法步驟之特徵。類似地,在方法步驟之情況下描述之態樣亦表示對應區塊或項或對應裝置之特徵
的描述。可藉由(或使用)硬體裝置(類似於(例如)微處理器、可規劃電腦或電子電路)來執行方法步驟中之一些或全部。在一些實施例中,可由此裝置來執行最重要方法步驟中的某一者或多者。
本發明的經傳輸或經編碼信號可儲存於數位儲存媒體上或可在諸如無線傳輸媒體之傳輸媒體或諸如網際網路之有線傳輸媒體上傳輸。
取決於某些實施要求,本發明之實施例可以硬體或以軟體實施。實施可使用其上儲存有電子可讀控制信號之數位儲存媒體(例如,軟碟、DVD、Blu-Ray、CD、ROM、PROM及EPROM、EEPROM或快閃記憶體)來執行,該等控制信號與可規劃電腦系統合作(或能夠與之合作),使得各別方法得到執行。因此,數位儲存媒體可係電腦可讀的。
根據本發明之一些實施例包含具有電子可讀控制信號之資料載體,該等控制信號能夠與可規劃電腦系統合作,使得本文中所描述之方法中的一者得到執行。
大體而言,本發明之實施例可實施為具有程式碼之電腦程式產品,程式碼可操作以用於在電腦程式產品於電腦上執行時執行該等方法中之一者。程式碼可(例如)儲存於機器可讀載體上。
其他實施例包含儲存於機器可讀載體上的用於執行本文中所描述之方法中之一者的電腦程式。
換言之,本發明方法之實施例因此為電腦程式,其具有用於在電腦程式於電腦上執行時執行本文中所描述
之方法中之一者的程式碼。
本發明方法之另一實施例因此為資料載體(或諸如數位儲存媒體或電腦可讀媒體之非暫時性儲存媒體),其包含記錄於其上的用於執行本文中所描述之方法中之一者的電腦程式。資料載體、數位儲存媒體或記錄媒體通常係有形的及/或非暫時性的。
本發明方法之另一實施例因此為表示用於執行本文中所描述之方法中之一者的電腦程式之資料串流或信號序列。資料串流或信號序列可(例如)經組配以經由資料通訊連接(例如,經由網際網路)而傳送。
另一實施例包含處理構件,例如,經組配或經調適以執行本文中所描述之方法中之一者的電腦或可規劃邏輯器件。
另一實施例包含電腦,其上安裝有用於執行本文中所描述之方法中之一者的電腦程式。
根據本發明之另一實施例包含經組配以將用於執行本文中所描述之方法中之一者的電腦程式傳送(例如,用電子方式或光學方式)至接收器的裝置或系統。接收器可(例如)為電腦、行動器件、記憶體器件或其類似者。裝置或系統可(例如)包含用於將電腦程式傳送至接收器之檔案伺服器。
在一些實施例中,可規劃邏輯器件(例如,場可規劃閘陣列)可用以執行本文中所描述之方法之功能性中的一些或全部。在一些實施例中,場可規劃閘陣列可與微
處理器合作以便執行本文中所描述之方法中之一者。大體而言,該等方法較佳藉由任何硬體裝置來執行。
上文所描述之實施例僅僅說明本發明之原理。應理解,熟習此項技術者將顯而易見本文中所描述之配置及細節的修改及變化。因此,意圖為僅由接下來之專利申請專利範圍之範疇來限制,而非由借助於對本文中之實施例之描述及解釋所呈現的特定細節來限制。
100‧‧‧處理器
102‧‧‧第一修改值
104‧‧‧混疊減少或不含混疊之第一結果信號
106‧‧‧第二修改值/增益因數
108‧‧‧混疊減少或不含混疊之第二結果信號
110‧‧‧組合器
112‧‧‧經處理音訊信號/不含混疊之信號
114‧‧‧頻譜值之區塊之序列
Claims (16)
- 一種用於處理包含頻譜值之區塊之一序列的一音訊信號之裝置:一處理器,其用於使用用於一第一區塊之至少一個修改值來處理區塊之該序列以在一重疊範圍中獲得混疊減少或不含混疊之第一結果信號,以及使用用於區塊之該序列中之一第二區塊的至少一個第二不同修改值來處理區塊之該序列以在該重疊範圍中獲得一混疊減少或不含混疊之第二結果信號;以及一組合器,其用於在該重疊範圍中組合該第一結果信號與該第二結果信號以獲得用於該重疊範圍之一經處理信號。
- 如請求項1之裝置,其中該處理器包含:一修改器,其用於使用該至少一個第一修改值來修改該序列中之該第一區塊以獲得一第一經修改區塊,用於使用該至少一個第二修改值來修改該序列中之該第二區塊以獲得一第二經修改區塊,用於使用該第二至少一個第一修改值來修改該第二區塊以獲得一第三經修改區塊,以及用於使用該至少一個第二修改值來修改該第一區塊以獲得一第四經修改區塊;一頻譜-時間轉換器,其用於將該第一經修改區塊至該第四經修改區塊轉換成一對應時間表示;以及一重疊加法器,其用於將該第一經修改區塊及該第 三經修改區塊之時間表示重疊相加以獲得該第一結果信號,以及用於將該第二經修改區塊及該第四經修改區塊之時間表示重疊相加以獲得該第二結果信號。
- 如請求項1或2之裝置,其中該組合器經組配以藉由對該第一結果信號進行淡出及藉由對該第二結果信號進行淡入以及將兩信號相加而組合該第一結果信號與該第二結果信號。
- 如前述請求項中任一項的裝置,其中該處理器經組配以在執行一頻譜-時間轉換時執行一修改型離散餘弦反變換操作。
- 如前述請求項中任一項的裝置,其中該處理器經組配以於在該重疊範圍中計算該第一結果信號及該第二結果信號時執行一重疊相加處理操作,且其中該組合器經組配以在一組合範圍中組合該第一結果信號與該第二結果信號,其中該組合範圍與該重疊範圍相同。
- 如前述請求項中任一項的裝置,其中該組合器經組配以執行一平滑轉換函數,其中該平滑轉換函數包含一淡出部分及一淡入部分,其中用於一平滑轉換範圍中之一樣本的該淡出部分之一加權係數與該淡入部分之一加權係數的一總和係恆定的。
- 如前述請求項中任一項的裝置,其中該組合器經組配以執行一平滑轉換操作,其中 該平滑轉換操作包含一單調遞減之淡出部分及一單調遞增之淡入部分。
- 如前述請求項中任一項的裝置,其中該處理器經組配以用於應用具有一修補函數之一頻寬填充操作以將頻譜值自一源範圍修補至一目標範圍,且其中該處理器經組配以用於在計算該第一結果信號及該第二結果信號時應用該修補函數。
- 如前述請求項中任一項的裝置,其進一步包含:一修補器,其用於根據用於該第一區塊之一修補函數而在使用來自一不同頻率範圍之頻譜值之一頻寬填充範圍中產生該第一區塊,以及用於根據與該第二區塊相關聯之一修補函數而在具有用於一不同頻率區之頻譜值之一頻寬填充範圍中產生該第二區塊。
- 如前述請求項中任一項的裝置,其中該處理器經組配以使用增益函數作為修改值而對該第一區塊及該第二區塊執行一乘法運算。
- 如前述請求項中任一項的裝置,其中該處理器經組配以處理區塊之該序列,其中該第一區塊與該第二區塊在時間上鄰近,且其中該第一區塊及該第二區塊以具有等於一時間部分之55%至45%之一重疊之方式在時間上鄰近。
- 如前述請求項中任一項的裝置,其中該處理器經組配以應用具有一頻譜-時間變換 部分及應用於該頻譜-時間變換部分之一輸出的一合成視窗部分之一頻譜-時間轉換操作。
- 如前述請求項中任一項的裝置,其中該處理器經組配以使用隨時間及頻率變化之修改值進行操作。
- 如前述請求項中任一項的裝置,其中該處理器經組配以用於執行具有一重疊範圍之交疊變換,且其中該處理器經組配以用於僅執行影響該重疊範圍中之值的操作,而不用於執行不影響該重疊範圍中之值的操作。
- 一種用於處理包含頻譜值之區塊之一序列的一音訊信號之方法:使用用於一第一區塊之至少一個修改值來處理區塊之該序列以在一重疊範圍中獲得混疊減少或不含混疊之第一結果信號,以及使用用於區塊之該序列中之一第二區塊的至少一個第二不同修改值來處理區塊之該序列以在該重疊範圍中獲得一混疊減少或不含混疊之第二結果信號;以及在該重疊範圍中組合該第一結果信號與該第二結果信號以獲得用於該重疊範圍之一經處理信號。
- 一種電腦程式,其在執行於一電腦或一處理器上時用於執行如請求項15之方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13181507 | 2013-08-23 | ||
PCT/EP2014/067944 WO2015025051A1 (en) | 2013-08-23 | 2014-08-22 | Apparatus and method for processing an audio signal using a combination in an overlap range |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201523592A true TW201523592A (zh) | 2015-06-16 |
TWI570708B TWI570708B (zh) | 2017-02-11 |
Family
ID=51392261
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW103129187A TWI570709B (zh) | 2013-08-23 | 2014-08-25 | 用於使用混疊錯誤信號處理音訊信號之裝置及方法 |
TW103129185A TWI570708B (zh) | 2013-08-23 | 2014-08-25 | 用於使用重疊範圍組合處理音訊信號之裝置及方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW103129187A TWI570709B (zh) | 2013-08-23 | 2014-08-25 | 用於使用混疊錯誤信號處理音訊信號之裝置及方法 |
Country Status (18)
Country | Link |
---|---|
US (2) | US10210879B2 (zh) |
EP (2) | EP3028275B1 (zh) |
JP (2) | JP6286552B2 (zh) |
KR (2) | KR101831286B1 (zh) |
CN (2) | CN105556600B (zh) |
AR (2) | AR097443A1 (zh) |
AU (2) | AU2014310547B2 (zh) |
BR (1) | BR112016003029B1 (zh) |
CA (2) | CA2921192C (zh) |
ES (2) | ES2650117T3 (zh) |
MX (2) | MX352576B (zh) |
MY (2) | MY184723A (zh) |
PL (1) | PL3028275T3 (zh) |
PT (1) | PT3028275T (zh) |
RU (2) | RU2643662C2 (zh) |
SG (2) | SG11201601032RA (zh) |
TW (2) | TWI570709B (zh) |
WO (2) | WO2015025052A1 (zh) |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6124895A (en) * | 1997-10-17 | 2000-09-26 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with video/audio data synchronization by dynamic audio frame alignment |
JP4281131B2 (ja) * | 1998-10-22 | 2009-06-17 | ソニー株式会社 | 信号符号化装置及び方法、並びに信号復号装置及び方法 |
US6226608B1 (en) * | 1999-01-28 | 2001-05-01 | Dolby Laboratories Licensing Corporation | Data framing for adaptive-block-length coding system |
US6658383B2 (en) * | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
US6963842B2 (en) * | 2001-09-05 | 2005-11-08 | Creative Technology Ltd. | Efficient system and method for converting between different transform-domain signal representations |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
US7876966B2 (en) * | 2003-03-11 | 2011-01-25 | Spyder Navigations L.L.C. | Switching between coding schemes |
DE102004021403A1 (de) * | 2004-04-30 | 2005-11-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalverarbeitung durch Modifikation in der Spektral-/Modulationsspektralbereichsdarstellung |
CN1862969B (zh) * | 2005-05-11 | 2010-06-09 | 尼禄股份公司 | 自适应块长、常数变换音频解码方法 |
US7974837B2 (en) * | 2005-06-23 | 2011-07-05 | Panasonic Corporation | Audio encoding apparatus, audio decoding apparatus, and audio encoded information transmitting apparatus |
DE102006010212A1 (de) * | 2006-03-06 | 2007-09-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Simulation von WFS-Systemen und Kompensation von klangbeeinflussenden WFS-Eigenschaften |
WO2007120452A1 (en) | 2006-04-04 | 2007-10-25 | Dolby Laboratories Licensing Corporation | Audio signal loudness measurement and modification in the mdct domain |
DE102006047197B3 (de) * | 2006-07-31 | 2008-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines reellen Subband-Signals zur Reduktion von Aliasing-Effekten |
DE102006051673A1 (de) * | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
KR101016224B1 (ko) * | 2006-12-12 | 2011-02-25 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 인코더, 디코더 및 시간 영역 데이터 스트림을 나타내는 데이터 세그먼트를 인코딩하고 디코딩하는 방법 |
CN101046964B (zh) * | 2007-04-13 | 2011-09-14 | 清华大学 | 基于重叠变换压缩编码的错误隐藏帧重建方法 |
ES2748843T3 (es) * | 2007-08-27 | 2020-03-18 | Ericsson Telefon Ab L M | Análisis/síntesis espectral de baja complejidad utilizando resolución temporal seleccionable |
CN101952888B (zh) * | 2007-12-21 | 2013-10-09 | 法国电信 | 一种具有合适的窗口的基于变换的编码和解码方法 |
ES2401487T3 (es) * | 2008-07-11 | 2013-04-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para la codificación/decodificación de una señal de audio utilizando un esquema de conmutación de generación de señal ajena |
EP2234103B1 (en) * | 2009-03-26 | 2011-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Device and method for manipulating an audio signal |
EP3352168B1 (en) * | 2009-06-23 | 2020-09-16 | VoiceAge Corporation | Forward time-domain aliasing cancellation with application in weighted or original signal domain |
CA2777073C (en) * | 2009-10-08 | 2015-11-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
TWI430263B (zh) * | 2009-10-20 | 2014-03-11 | Fraunhofer Ges Forschung | 音訊信號編碼器、音訊信號解碼器、使用混疊抵消來將音訊信號編碼或解碼之方法 |
PL2473995T3 (pl) * | 2009-10-20 | 2015-06-30 | Fraunhofer Ges Forschung | Koder sygnału audio, dekoder sygnału audio, sposób dostarczania zakodowanej reprezentacji treści audio, sposób dostarczania dekodowanej reprezentacji treści audio oraz program komputerowy do wykorzystania w zastosowaniach z małym opóźnieniem |
EP2524374B1 (en) * | 2010-01-13 | 2018-10-31 | Voiceage Corporation | Audio decoding with forward time-domain aliasing cancellation using linear-predictive filtering |
EP2372703A1 (en) * | 2010-03-11 | 2011-10-05 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Signal processor, window provider, encoded media signal, method for processing a signal and method for providing a window |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
EP4398246A2 (en) * | 2010-07-08 | 2024-07-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder using forward aliasing cancellation |
FR2969804A1 (fr) * | 2010-12-23 | 2012-06-29 | France Telecom | Filtrage perfectionne dans le domaine transforme. |
TWI483245B (zh) * | 2011-02-14 | 2015-05-01 | Fraunhofer Ges Forschung | 利用重疊變換之資訊信號表示技術 |
-
2014
- 2014-08-22 CN CN201480046719.7A patent/CN105556600B/zh active Active
- 2014-08-22 RU RU2016110398A patent/RU2643662C2/ru active
- 2014-08-22 RU RU2016110408A patent/RU2641253C2/ru active
- 2014-08-22 MY MYPI2016000290A patent/MY184723A/en unknown
- 2014-08-22 JP JP2016535499A patent/JP6286552B2/ja active Active
- 2014-08-22 SG SG11201601032RA patent/SG11201601032RA/en unknown
- 2014-08-22 MX MX2016001856A patent/MX352576B/es active IP Right Grant
- 2014-08-22 CN CN201480046726.7A patent/CN105556601B/zh active Active
- 2014-08-22 KR KR1020167007352A patent/KR101831286B1/ko active IP Right Grant
- 2014-08-22 ES ES14755081.8T patent/ES2650117T3/es active Active
- 2014-08-22 PT PT147550818T patent/PT3028275T/pt unknown
- 2014-08-22 PL PL14755081T patent/PL3028275T3/pl unknown
- 2014-08-22 CA CA2921192A patent/CA2921192C/en active Active
- 2014-08-22 JP JP2016535500A patent/JP6333379B2/ja active Active
- 2014-08-22 ES ES14758321.5T patent/ES2693559T3/es active Active
- 2014-08-22 AU AU2014310547A patent/AU2014310547B2/en active Active
- 2014-08-22 SG SG11201601298WA patent/SG11201601298WA/en unknown
- 2014-08-22 EP EP14755081.8A patent/EP3028275B1/en active Active
- 2014-08-22 CA CA2921195A patent/CA2921195C/en active Active
- 2014-08-22 EP EP14758321.5A patent/EP3036738B1/en active Active
- 2014-08-22 MX MX2016001961A patent/MX354372B/es active IP Right Grant
- 2014-08-22 BR BR112016003029-0A patent/BR112016003029B1/pt active IP Right Grant
- 2014-08-22 WO PCT/EP2014/067945 patent/WO2015025052A1/en active Application Filing
- 2014-08-22 MY MYPI2016000332A patent/MY175355A/en unknown
- 2014-08-22 KR KR1020167007348A patent/KR101820028B1/ko not_active Application Discontinuation
- 2014-08-22 AU AU2014310548A patent/AU2014310548B2/en active Active
- 2014-08-22 WO PCT/EP2014/067944 patent/WO2015025051A1/en active Application Filing
- 2014-08-25 TW TW103129187A patent/TWI570709B/zh active
- 2014-08-25 TW TW103129185A patent/TWI570708B/zh active
- 2014-08-25 AR ARP140103179A patent/AR097443A1/es active IP Right Grant
- 2014-08-25 AR ARP140103180A patent/AR097444A1/es active IP Right Grant
-
2016
- 2016-02-18 US US15/047,334 patent/US10210879B2/en active Active
- 2016-02-18 US US15/047,322 patent/US10157624B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7126328B2 (ja) | 符号化されたオーディオ信号を復号するためのデコーダおよびオーディオ信号を符号化するためのエンコーダ | |
JP6612846B2 (ja) | プロセッサおよびトランケートされた分析または合成窓のオーバーラップ部分を使用したオーディオ信号の処理方法 | |
TWI570708B (zh) | 用於使用重疊範圍組合處理音訊信號之裝置及方法 | |
JP7258135B2 (ja) | 処理されたオーディオ信号表現を提供するための装置およびオーディオ信号プロセッサ、オーディオデコーダ、オーディオエンコーダ、方法、ならびにコンピュータプログラム | |
BR112016003265B1 (pt) | Aparelho e método para processamento de um sinal de áudio utilizando um sinal de erro de distorção | |
BR112017001630B1 (pt) | Processador e método para processamento de um sinal de áudio utilizando análise truncada ou partes de sobreposição da janela de síntese |