CN1133151C - 纠正传输差错的声频信号解码方法 - Google Patents
纠正传输差错的声频信号解码方法 Download PDFInfo
- Publication number
- CN1133151C CN1133151C CN998004812A CN99800481A CN1133151C CN 1133151 C CN1133151 C CN 1133151C CN 998004812 A CN998004812 A CN 998004812A CN 99800481 A CN99800481 A CN 99800481A CN 1133151 C CN1133151 C CN 1133151C
- Authority
- CN
- China
- Prior art keywords
- frame
- composite filter
- audio signal
- estimation
- bit stream
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 230000005236 sound signal Effects 0.000 title claims abstract description 57
- 230000005540 biological transmission Effects 0.000 title description 18
- 238000012937 correction Methods 0.000 title description 4
- 238000001914 filtration Methods 0.000 claims abstract description 41
- 230000005284 excitation Effects 0.000 claims abstract description 23
- 239000002131 composite material Substances 0.000 claims description 134
- 238000004458 analytical method Methods 0.000 claims description 66
- 238000001228 spectrum Methods 0.000 claims description 52
- 238000005086 pumping Methods 0.000 claims description 51
- 238000013459 approach Methods 0.000 claims description 8
- 238000010835 comparative analysis Methods 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 230000002045 lasting effect Effects 0.000 claims 1
- 230000015572 biosynthetic process Effects 0.000 abstract description 9
- 238000003786 synthesis reaction Methods 0.000 abstract description 9
- 230000011664 signaling Effects 0.000 abstract description 2
- 230000002441 reversible effect Effects 0.000 description 51
- 230000006870 function Effects 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 10
- 238000005070 sampling Methods 0.000 description 10
- 230000003595 spectral effect Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000011084 recovery Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000006866 deterioration Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003716 rejuvenation Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/14—Digital recording or reproducing using self-clocking codes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
由与可能删除帧的数据(BFI)信令一起接收的二进制数据流(F)表示按相继帧编码的声频信号。对于每一帧,本发明方法在于利用合成滤波器(22)对基于二进制数据流中恢复(有效帧)的或者其它方法估测(删除帧)的激励参数(EX(n))形成的激励信号(∑k(n))进行滤波,以获得解码信号(En(t))。进行解码信号的线性预测至先前一帧,以估测有关当前帧的合成滤波器。只要未删除帧,所采用的合成滤波器符合估测的合成滤波器。如果删除帧n0,接下来的帧n0+i所采用的合成滤波器由有关帧n0+i的估测滤波器与自帧n0起所采用的至少一个合成滤波器的加权组合确定。
Description
技术领域
本发明涉及声频信号的数字编码领域,更具体地说,它涉及用于重构声频信号的解码方法,该声频信号是利用采用“反向LPC”合成滤波器的方法编码的。
背景技术
预测块编码***对待编码的声频信号(通常为语音或音乐)的取样的各连续帧进行分析,提取每帧的数个参数。对这些参数量化,以形成在传输信道上传送的比特流。
根据信道的质量和传输类型,发射的信号会受到干扰,在解码器接收的比特流中引起差错。可以隔离比特流中的这些差错。然而,它们常常是突发的,尤其是在具有高干扰度的移动无线电信道中和分组模式传输网络中。在这种情况下,相当于一个或多个信号帧的整个比特分组会差错或者接收不到。
所采用的传输***通常能够在解码器这一级上检测差错或丢失的帧。然后采用所谓的“丢失帧恢复”过程。这些过程使得解码器能够从丢失帧区域之前和之后的帧中恢复的取样外推出丢失信号取样。
发明内容
本发明的目的是一定程度上改善恢复丢失帧的技术,使存在丢失帧时强烈地限制解码器所感觉的主观信号退化。在连续或间歇地利用通常称为“反向LPC分析”的技术的预测编码器的情况中,这具有特别的好处。缩写“LPC”表示“线性预测编码”,“反向”表示分析是在当前帧前的信号上进行的。这一技术对于一般的传输差错和对于特定的丢失帧特别敏感。
最广泛使用的线性预测编码***是CELP(码激励线性预测)编码器。CELP编码器中的反向LPC被首次用在ITU-T(见ITU-T建议G.728)采纳的LD-CELP编码器中。这个编码器能够把比特率从64kbit/s降低到16kbit/s,而所感觉的主观质量不劣化。
反向LPC分析在于对合成信号而不是对原始声频信号的当前帧进行LPC分析。事实上,分析是对当前帧前的帧的合成信号取样进行的,因为在编码器(根据局部解码,这在分析合成编码器中通常是有用的)上和在远端解码器上都可提供信号。由于分析是在编码器和解码器上进行的,因此,不必传送获得的LPC系数。
与传统的“正向”LPC分析相比,其中对编码器输入端的信号运用线性预测,反向LPC分析提供更高的比特率,例如在CELP的情况中可以采用它丰富激励字典。此外,没有增大比特率,它显著地增大了分析的阶数,LPC合成滤波器对于LD-LPC编码器通常具有50个系数,相比而言,对于利用正向LPC分析的大多数编码器为10个系数。
由于LPC滤波器的阶数较高,反向LPC分析提供对音乐信号的更好模拟,音乐信号的频谱比语音信号的频谱要丰富得多。为什么这一技术很适合于对音乐信号编码的另一个原因是,音乐信号通常具有比语音信号平稳的频谱,这改善了反向LPC分析的性能。另一方面,反向LPC分析的校正功能需要:
(i)质量良好的合成信号,它必须非常接近于原始信号。这迫使编码比特率较高。已知当前CELP编码器的质量,13kbit/s似乎是下限。
(ii)短帧或足够平稳的信号。被分析的信号与待编码的信号之间存在一帧的延迟。因此,与信号平稳的平均时间相比,帧长度必须短。
(iii)编码器与解码器之间传输差错很少。一旦合成信号是不同的,编码器和解码器不再计算同一滤波器。那么,即使不存在任何新的干扰,也会引起大的偏差并被放大。
反向LPC分析编码器/解码器对传输差错的敏感性主要是由于下列递归现象:由于丢失帧恢复装置在编码器上产生的合成信号与在解码器上重构的合成信号之间的差引起在解码器上为下一帧计算的反向LPC滤波器与在编码器上计算的反向LPC滤波器之间的差,因为这些滤波器是基于差值信号计算的。这些滤波器又被用于产生下一帧的合成信号,因此,在编码器上和在解码器上将是不同的。因此该现象会传播、增大,并引起编码器和解码器偏差大且不可逆。由于反向LPC滤波器通常具有较高的阶数(30至50个系数),它们对合成信号的频谱产生很大作用(预测增益高)。
许多编码算法使用丢失帧恢复技术。通过一种手段或者另一种手段(例如,在移动无线电通信***中,通过从检测传输差错并能够校正一部分差错的信道解码器接收帧丢失信息)通知解码器丢失帧。丢失帧恢复装置的目的是从被视为有效的最前面一帧或多帧外推出丢失帧的取样。有些***利用直接从过去解码信号获取取样的波形替代技术(见D.J.Goodman等人:“在分组话音通信中恢复丢失话音段的波形替代技术”,″Waveform Substitution Techniques forRecovering Missing Speech Segment in Packet Voice Communication″,IEEETrans.On ASSP,Vol.ASSP-34,No.6,Dec.1986)外推这些取样。在CELP类型的预测编码器的情况中,例如,利用用于合成有效帧的合成模型替代丢失帧的取样。那么,丢失帧恢复过程必须提供不是供丢失帧用的合成所需的参数(见例如ITU-T建议G.723.l和G.729)。由预测编码器处理或编码的有些参数显现帧之间的高相关性。这特别可应用于LPC参数和话音的长期预测参数(LTP延迟和相关增益)。由于这一相关性,再次使用最后有效帧的参数来合成丢失帧而不是使用差错或随机参数更有利。
对于CELP编码算法,丢失帧的参数通常是以以下方式获得的:
-LPC滤波器或是通过仅复制参数或是通过引入一些衰减从最后有效帧的LPC参数获得的;
-话音/非语音检测在丢失帧的水平上确定信号的谐波含量(见ITU-T建议G.723.1);
-在非话音的情况中,激励信号是以部分随机方式产生的,例如通过随机地抽取码字和利用被略微衰减的过去激励增益(见ITU-T建议G.729)或者在过去激励中的随机选择(见ITU-T建议G.728);
-在话音信号的情况中,LTP延迟通常是在前一帧中计算的,可能有少许“抖动”以防止过度延长宏亮共振音,使得LTP增益等于1或非常接近于1。通常根据过去激励将激励信号限制为长期预测。
在利用正向LPC分析的编码***的情况中,LPC滤波器的参数是以简单方式从前一帧的参数种外推出的:第一丢失帧所采用的LPC滤波器通常是前一帧的滤波器,可能有衰减(即频谱轮廓少许平坦化以及预测增益减小)。这种衰减可以通过把频谱扩展系数应用到滤波器的系数上,或者如果这些系数由LSP(谱线对)代表,通过施加谱线对的最小间隔而获得(参见ITU-T建议G.723.1)。
频谱扩展技术是在ITU-T建议G.728的编码器的情况种提出的,它采用反向LPC分析:对于第一个丢失帧,基于过去(有效)合成信号首先计算一组LPC参数。将0.97的扩展因数应用于这一滤波器,对于每一个新的丢失帧,将这个因数反复地乘以0.97。注意只有该帧丢失时才使用这一技术。在接下来的第一个未丢失帧中,解码器所采用的LPC参数是按常规(即基于合成信号)计算的参数。
在正向LPC分析的情况中,不存在差错存储现象,这里除了对预测中使用的LPC滤波器进行量化外,还涉及LPC滤波器(在这种情况中,利用预测中的漏测因数或者MA型预测为在特定个数有效帧结束时预测器重新同步提供机构)。
在反向分析的情况中,差错是通过差错合成信号的方式传播的,在解码器上采用该信号产生接在丢失部分后的有效帧的LPC滤波器。因此,改善为丢失帧产生的合成信号(激励信号和增益的外推)是保证接下来LPC滤波器(基于前一合成信号计算的)更接近于在编码器上计算的滤波器的一种方法
上述的条件(i)至(iii)表明,对于远小于165kbit/s的比特率,纯反向分析的局限性很快变得明显。除了合成信号质量降低(它使LPC滤波器性能劣化)以外,通常必须接受较长的帧长度(10至30ms)以便降低比特率。注意劣化主要出现在频谱跃迁时,常常出现在非平稳的区域中。在平稳区中,对于总体上非常平稳的信号,如音乐,反向LPC分析非常明显地优于正向LPC分析。
为了保持反向分析的优点,尤其在对音乐信号编码中的良好性能,与降低比特率相结合,已经开发了混合式“正向/反向LPC分析编码***”(参见S.Proust等人“利用混合式正向/反向自适应LPC预测的双速率(8kbit/s和16kbit/s)低延迟CELP编码”Proc.Of the IEEE用于电信的语音编码专题文集,1995年9月,P.37-38,″Dual Rate Low Delay CELP(8kbits/s 16kbits/s)using a Mixed Backward/Forward Adaptive LPC Prediction″,Proc.of theIEEE Workshop on Speech Coding for Telecommunications,September1995,pages 37-38;和法国专利申请No.9704684)。
将两种类型LPC分析相组合可获得两种技术之优点,采用正向LPC分析对跃迁和非平稳的区域进行编码,采用高阶反向LPC分析对平稳区域进行编码。
把正向编码帧引入到反向编码帧中还能够使编码器和解码器在传输差错时不相互偏离,因此提供对这种差错的稳健性比纯反向编码大得多。然而,迄今为止,绝大多数的平稳信号是以反向模式编码的,对此传输差错的问题一直是关键问题。
这种混合的正向/反向***打算提供给有限或共享资源的网络上的多媒体应用,或者移动无线电通信。在这种类型的应用中,很可能出现比特分组的损失,这意味着为对丢失帧敏感的技术(如反向LPC分析)预设障碍。通过极大地降低丢失帧在采用反向LPC分析或混合正向/反向LPC分析的***中的影响,本发明特别适合于这种类型的应用。
还存在一些其它类型的既采用正向LPC分析又采用反向LPC分析的声频编码***。合成滤波器具体地可以是正向LPC滤波器和反向LPC滤波器的一种组合(脉冲响应的卷积)(参见EP-A-0782128)。然而,正向LPC滤波器的系数是由编码器计算并以量化形式传送的。反向LPC滤波器的系数是在把合成信号提供给正向LPC滤波器的逆滤波器后利用按照如上所述进行的反向LPC分析过程在编码器和解码器上联合确定的。
本发明的目的是由于传输信道质量差丢失一帧或多帧时或者由于在分组传输***中丢失或未接收一个分组时,利用反向LPC分析或者混合正向/反向LPC分析,在预测块编码***中改善由解码器产生的语音信号的主观质量。
因此,在连续利用反向LPC分析的***的情况中,本发明提出一种对代表按相继帧编码的声频信号的比特流进行解码的方法,该比特流与表示任何丢失帧的标记一起被接收,
这里,对每一帧,由激励参数形成激励信号,如果该帧是有效的则在比特流中恢复激励参数,如果该帧丢失则以其它一些方法估测,而且用合成滤波器对激励信号进行滤波,以获得解码声频信号,
这里,基于至先前一帧所获得的解码声频信号进行线性预测分析,以至少部分地估测与当前帧相关的合成滤波器,只要不存在丢失帧,用于对激励信号滤波的相继的合成滤波器滤符合所估测的合成滤波器,
这里,如果帧n0丢失,用于对除后续的帧n0+i的相关激励信号滤波的至少一个合成滤波器是由相对于帧n0+i估测的合成滤波器和自帧n0起一直被使用的至少一个合成滤波器的加权组合确定的。
对于接在一个或多个丢失帧之后的若干个帧,基于过去合成信号由解码器所估测的反向LPC滤波器不是实际用来重构合成信号的滤波器。为了合成后者,解码器采用一个按照这种方法估测的依赖于正向滤波器的LPC滤波器,以及用于合成一个或多个先前帧的滤波器,因为最后滤波器是基于有效合成信号计算的。这是借助于接在丢失帧后施加到LPC滤波器的加权组合获得的,该组合进行平滑化运算并在一定程度上促成平稳频谱平稳。这一组合会随至发送的最后有效帧的距离而变化。滤平丢失帧后合成所采用的LPC滤波器的轨迹的作用强烈限制偏差现象,由此显著地改善解码信号的主观质量。
反向LPC分析对于传输差错的敏感性主要由于前面所述的偏差现象。劣化的主要来源是在远端解码器上计算的滤波器和在本地解码器上计算的滤波器的累加偏差,这个偏差在合成信号中会引起严重畸变。因此,重要的是接在丢失帧之后的无差错帧的数目增大时,使两个计算的滤波器之间的差(按照频谱距离)减至最小并使差值趋向于零(编码***的重新收敛特性)。反向滤波器通常具有高的阶数,它对合成信号的频谱影响是首要的。本发明涉及的滤波器的收敛性确保合成信号的收敛性。这改善了存在丢失时合成信号的主观质量。
如果跟随在丢失帧n0之后的帧n0+1也丢失,那么,用于对帧n0+1的相关激励信号滤波的合成滤波器最好由用于对帧n0的有关激励信号滤波的合成滤波器确定。这两个滤波器可以是相同的。第二个滤波器同样可以通过应用如前所述的频谱扩展系数来确定。
在本发明的一个较佳实施例中,在所述加权组合中所使用的权重系数取决于帧n0+i与最后丢失帧n0之间的帧的数目i,所以所使用的合成滤波器逐渐接近于估测的合成滤波器。
具体而言,用于对帧n的相关激励信号滤波的每个合成滤波器由K个参数Pk(n)(1≤k≤K)表示,用于对帧n0+i的相关激励信号滤波的合成滤波器的参数Pk(n0+i)由以下方程式计算,帧n0+i跟随在i-1有效帧(i≥1)之后,它们之前是丢失帧n0:
在跟随丢失帧之后的第一有效帧中,系数α(i)的减小提供一个比较接近于为帧n0所采用的合成滤波器,它通常是已经在良好条件下确定的,能使帧n0中该滤波器的存储逐步丢失,从而移向为帧n0+i估测的滤波器。参数Pk(n)可以是合成滤波器的系数,即其脉冲响应。参数Pk(n)可以等效地为这些系数的其它表征,诸如在线性预测编码器中通常使用的反射系数、LAR(对数面积比)、PARCOR(部分相关)、LSP(谱线对)等。
对于i>1,系数α(i)可以由以下方程式计算:
α(i)=max{0,α(i-1)-β} (2)
这里β是一个取值范围在0至1的系数。
在本发明的一个较佳实施例中,在加权组合中所采用的权重系数取决于声频信号频谱平稳程度的估测(Istat(n)),从而使在弱平稳信号的情况中,用于对跟随在丢失帧n0后的帧n0+i(i≥1)的相关激励信号滤波的合成滤波器比在强平稳信号的情况中更接近于估测的合成滤波器。
因此,反向LPC滤波器的从动以及产生的平稳频谱适合作为测量的实际平均平稳信号频谱的函数。如果信号真是相当平稳的,平滑度较高(因而频谱平稳),在相反情况下则较差。在非常平稳频谱的情况中,相继的反向滤波器变化甚小。因此,可以使相继的滤波器高度地从动。这限制了偏差的风险并保证所需的平稳频谱。
声频信号频谱的平稳程度可以从包含在比特流的每个有效帧中的信息估测出。在有些***中,存在保留发送这种类型信息的比特率的选项,使得解码器能确定编码信号频谱平稳程度。
作为替代这一情况的另一种方法,声频信号频谱的平稳程度可以从解码器为对激励信号滤波所采用的相继的合成滤波器的比较分析来估测。它可以通过测量解码器所采用的相继的反向LPC滤波器之间的频谱距离(例如Itakura距离)的各种方法来测量。
利用以上的方程式(1)计算合成滤波器的参数中,能考虑声频信号频谱的平稳程度。于是,那么对于i>1,权重系数α(i)是声频信号频谱的估测平稳程度的递增函数。因此,当频谱高度平稳时解码器所采用的信号比它非平稳时缓慢地接近于估测滤波器。
具体而言,当由方程式(2)计算α(i)时,系数β可以是声频信号频谱的估测平稳程度的递减函数。
如上所述,本发明的方法可以应用于仅利用反向LPC分析的***上,对此合成滤波器具有形式为1/AB(z)的传递函数,这里AB(z)为z-1的多项式,其系数是由解码器从解码声频信号的线性预测分析获得的。
它也可以应用于以EP-A-0782128中所述的方式采用正向和反向LPC滤波器的脉冲响应的卷积的反向LPC分析与正向LPC分析相组合的***上。在这种情况下,合成滤波器具有形式为1/[AF(z).AB(z)]的传递函数,这里AF(z)和AB(z)为z-1的多项式,多项式AF(z)的系数是由包含在比特流的有效帧中的参数获得的,多项式AB(z)的系数是由解码器从应用于信号的线性预测分析获得的,所述信号是利用具有传递函数AF(z)的滤波器通过对解码声频信号滤波获得的。
在混合的正向/反向LPC分析编码***的情况下,本发明提出一种对代表按相继帧编码的声频信号的比特流进行解码的方法,该比特流与表示任何丢失帧的标记一起接收,比特流的每一个有效帧包括对与该帧相关的声频信号进行编码所应用的编码模式的指示,编码模式或是帧包含频谱参数的第一种编码模式或是第二种编码模式,
这里,对每一帧,由激励参数形成激励信号,如果该帧是有效的则在比特流中恢复激励参数,如果该帧丢失则以其它一些方法估测,而且用合成滤波器对激励信号进行滤波,以获得解码声频信号,
如果比特流表示第一种编码模式,用于对激励信号滤波的合成滤波器由所述频谱参数构成,
这里,基于至先前一帧所获得的解码声频信号进行线性预测分析,以至少部分地估测与当前帧相关的合成滤波器,这里,只要不存在丢失帧以及比特流表示第二种编码模式,则用于对激励信号滤波的相继的合成滤波器符合估测的合成滤波器,
这里,如果帧n0丢失,对前一有效帧比特流表示第二种编码模式,而且比特流表示第二种编码模式的多个有效帧跟随帧n0之后,则用于对后续的帧n0+i的相关激励信号滤波的至少一个合成滤波器是由相对于帧n0+i估测的合成滤波器和自帧n0起一直被使用的至少一个合成滤波器的加权组合确定的。
以上特征覆盖了以与仅利用反向编码的***中基本相同的方式在编码器正在以反向模式工作的周期中丢失帧的情况。
以上对仅利用反向编码的***描述的较佳实施例可以直接调换到混合正向/反向***的场合。
在使用时,声频信号频谱平稳程度可以从存在于比特流中的信息估测,以表示逐帧地对声频信号进行编码的模式,注意到这一点是有趣的。
估测的声频信号频谱的平稳程度具体地可以通过对用第二种编码模式处理的帧和用第一种编码模式处理的帧递减计数推导出,所述计数属于当前帧之前具有N帧左右持续时间的窗口,这里N是预定整数。
在编码器正在从正向模式向反向模式转变时丢失帧时,如果帧n0丢失,对前一有效帧比特流表示第一编码模式(或者第二编码模式),至少一个比特流表示第二编码模式的有效帧跟随在帧n0之后,那么用于对下一帧n0+1的相关激励信号滤波的合成滤波器可以从相对于帧n0估测的合成滤波器确定。用于对下一帧n0+1的相关激励信号滤波的滤波器具体地可以取为与相对于帧n0估测的合成滤波器的相同。
在以下参考附图给出的对本发明的非限定的实施例的描述中,本发明的其它特征和优点将变动更加清楚。
附图简述
图1是声频编码器的方框图,按照本发明能够对其输出比特流进行解码。
图2是利用按照本发明的正向LPC滤波器的声频解码器的方框图。
图3是估测在图2所示解码器中能够施加的信号频谱的平稳程度的流程图。
图4是在图2所示的解码器中能够应用的反向LPC滤波器计算的流程图。
具体实施方式
图1所示的声频编码器是混合正向/反向LPC合成编码器。待编码的声频信号Sn(t)以整数n标号的各连续数字帧的形式接收。每一帧包括L个取样。例如,一帧可以具有10ms持续时间,即对于8kHz的取样频率L=80。
编码器包括具有传递函数1/A(z)的合成滤波器5,这里A(z)是一个z-1多项式。滤波器5通常与相关解码器所采用的合成滤波器相同。滤波器5接收由残余误差编码模块6提供的激励信号En(t),在本机上形成解码器以无传输差错产生的合成信号∑n(t)。
由模块6提供的激励信号En(t)的特征在于激励参数EX(n)。由模块6进行的编码目的在于使本机合成信号∑n(t)在特定判别标准方面尽可能接近于输入信号Sn(t)。这个判别标准通常对应于使由滤波器滤除的编码差错∑n(t)-Sn(t)与基于合成滤波器5系数确定的特定知觉权重减至最小。编码模块6通常采用比帧短的数据块(子帧)。这里符号EX(n)表示由模块6为帧n的子帧确定的一组激励参数。
编码模块6能够进行通常的长期预测,以确定考虑话音间隙的长期预测延迟和相关增益,以及残余差错激励序列和相关增益。残余差错激励序列的形式取决于所涉及编码器的类型。在MP-LPC编码器的情况中,它相当于对其位置和/或幅度进行量化的一组脉冲。在CELP编码器的情况中,它相当于来自预定字典的码字。
多项式A(z)是合成滤波器5的传递函数的倒数,具有以下形式:
式中ak(n)是对帧n确定的线性预测系数。如图1中开关7的符号所示,这些系数根据由判定模块8确定的比特d(n)的值,或是由正向LPC分析10提供或是由反向LPC分析模块12提供,而判定模块8区分正向进行LPC分析的帧(d(n)=0)与反向进行LPC分析的帧(d(n)=1)。
将待编码的信号Sn(t)提供给线性预测分析模块10,它对信号Sn(t)进行正向LPC分析。存储器模块11接收信号Sn(t)并将其存储在分析时间窗口中,它通常覆盖至当前帧的几帧。模块10在这一时间窗口上对信号Sn(t)进行阶数KF阶(通常KF≈10)的线性预测计算,以确定其传递函数AF(z)具有以下形式的线性预测滤波器:
式中PF k(n)是在对帧n进行处理后所获得的k阶预测系数。
能够用于计算这些系数PF k(n)的线性预测分析方法在数字编码领域中是众所周知的。例如,参见L.R.Rabiner和R.W.Shafer的“语音信号的数字处理”,″Digital Processing of Speech Signals″,Prentice-Hall Int.,1978和J.D.Markel和A.H.Gray的“语音的线性预测”,″Linear Prediction ofSpeech″,Springer Verlag Berlin Heideberg,1976。
当d(n)=0(正向模式)时,将模块10计算的系数PF k(n)提供给合成滤波器5,换句话说对于1≤k≤K,K=KF且ak(n)=PF k(n)。模块10还对正向LPC滤波器进行量化。采用这种方法,对于d(n)=0,它确定每帧的量化参数Q(n)。确定帧n的参数Q(n)可以直接代表滤波器的系数PF k(n)。量化同样可以应用到反射系数、LAR(对数面积比)和LSP(线频谱对)等。d(n)=0时提供给滤波器5的系数PF k(n)对应于量化值。
把本机合成信号∑n(t)提供给线性预测分析模块12,它进行反向LPC分析。存储器模块13接收信号∑n(t)并将其存储在分析时间窗口中,该窗口通常覆盖至当前帧前一帧的多个帧。模块12在合成信号的这一窗口上进行KB阶(通常KB≈50)的线性预测计算,以确定其传递函数AB(z)具有以下形式的线性预测滤波器:
式中PB k(n)是在对帧n-1进行处理后的k阶的预测系数。
当d(n)=1(反向模式)时,将模块12计算的系数PB k(n)提供给合成滤波器5,换句话说对于1≤k≤K,K=KB且ak(n)=PB k(n)。
模块10、12分别提供预测增益GF(n)、GB(n),它已经达到最大,以获得其各自的预测系数PF k(n)、PB k(n)。判定模块8逐帧地分析增益GF(n)、GB(n)的值,以决定编码器以正向模式和以反向模块开始工作的时间。
一般地说,如果与正向预测增益GF(n)相比,反向预测增益GB(n)相对高一些和话,可以假设待编码的信号是略微平稳的。如果在相继多个帧上是这种情况,那么,使编码器以反向模式工作是明智的,所以模块8取d(n)=1。相反,在非平稳区中,它取d(n)=0。对于正向/反向判定方法的详细描述,见法国专利申请9704684。
图1示出编码器的输出复用器14,对比特流F进行格式化。比特流F包括每帧的正向/反向判定位d(n)。
当d(n)=0(正向模式)时,比特流F的帧n包括频谱参数Q(n),它对正向LPC滤波器的系数PF k(n)进行量化。帧其余部分包括由模块6确定的激励参数EX(n)。
当d(n)=1(反向模式)时,比特流F的帧n不包括任何频谱参数Q(n)。输出二进制比特率是相同的,提供多个位对残余差错激励进行编码。因此,模块6或是通过分配更多的位对一些参数(LTP延迟、增益等)进行量化,或是通过增加CELP字典的规模,能够丰富残余差错的编码。
例如,对于在电话频带(300-3400Hz)内工作的ACELP(代数字典CELP)编码器,二进制比特率可以是11.8kbit/s,采用10ms帧(L=80)、阶数KF=10的正向LPC分析、阶数KB=30的反向LPC分析,并将每一帧分隔成两个子帧(在处理第二个子帧中采用为每一帧计算的正向和反向LPC滤波器,并在处理该子帧中采用这些滤波器与为前一帧计算的这些滤波器之间的内插)。
解码器,图2示出其方框图,除比特流F外还接收表示丢失帧的标记BFI。
编码器的输出比特流F通常被馈送到信道编码器,它按照具有传输差错检测和/或纠正能力的码引入冗余度。在声频解码器的上行侧,相关信道解码器利用这一冗余度来检测传输差错以及可能对其中一部分进行纠正。如果帧的传输很差,以致于信道解码器的纠正能力不足以纠正,那么后者启动BFI标记,以便声频解码器采取适当的行动。
图2示出解码器的输入分用器20,对于所接收的比特流的每个有效帧n,它传递正向/反向判定d(n)、激励参数EX(n),如果d(n)=0,还传递频谱参数Q(n)。
当指出帧n为丢失帧时,解码器认为编码模式保持与最后有效帧的编码模式相同。因此,它采纳d(n)=d(n一1)。
对于一个有效正向模式帧(在比特流F中读出d(n)=0),模块21从接收的量化指数Q(n)计算正向LPC滤波器的系数PF k(n)(1≤k≤KF)。开关23、24,其位置如图2所示,把计算出的系数PF k(n)馈送到合成滤波器22,其传递函数是1/A(z)=1/AF(z),AF(z)由方程式(3)给出。
对于丢失帧如果d(n)=0,解码器继续以正向模式工作,把由估测器模块36提供的系数ak(n)提供给合成滤波器KF。
在反向模式帧n(在比特流中读出d(n)=1或者在丢失帧时保持该判定)的情况下,合成滤波器22的系数是由计算反向LPC滤波器的模块25确定的系数PB k(n)(1≤k≤KB),将下文中对其进行描述。合成滤波器22的传递函数是1/A(z),
对于有效帧n,合成模块26从比特流中读出的激励参数EX(n)计算激励信号
开关27处于图2所示的位置。在这种情况中,由合成模块26产生的激励信号
与由编码器的模块6为相同帧所传递的激励信号En(t)相同。与编码器中情况一样,如何计算激励信号取决于正向/反向判定位d(n)。
把合成信号
馈送给线性预测分析模块30,它以与图1所示编码器的模块12相同的方式进行反向LPC分析,以估测合成滤波器,其系数
≤k≤KB)提供给计算模块25。与帧n相关的系数Pk(n)是在考虑合成至帧n-1的信号后获得的。存储器模块31接收信号
并将其存储在与图1所示模块13相同的分析时间窗口中。然后,分析模块30与模块12一样基于所存储的合成信号进行相同的计算。
只要没有帧丢失,那么,模块25传送系数Pk(n),它等于由分析模块30提供的估测系数Pk(n)。因此,只要没有帧丢失,当然在比特流F的有效帧中不存在差错位的情况下,由解码器提供的合成信号
与在编码器上确定的合成信号∑n(t)完全相同。
各个模块33、34对至少一帧存储解码器接收的激励参数EX(n)和d(n)=0时的正向LPC滤波器的系数PF k(n),以致于如果一帧丢失的话能够恢复激励参数和/或正向LPC参数。如果BFI标记指出丢失帧,在这种情况中使用的参数是基于存储器33、34的内容由各个模块35、36提供的估测值。模块35和36能够采用的估测方法可以从以上所述的方法中选取。具体地说,模块35可以通过考虑有关话音/非话音检测器37提供的合成信号
的或多或少话音字符的信息,估测激励参数。
在指出丢失帧时反向LPC滤波器系数的恢复遵循由模块25对系数Pk(n)的计算。此计算有利地依赖于由估测器模块38产生的声频信号频谱平稳程度的估测Istat(n)。
模块38能够按照图3所示的流程图工作。在这个过程中,模块38采用两个计数器,其值表示为N0和N1,它们的比率N1/N0代表在由数字N限定的时间窗口中正向编码帧的比例,数字N的持续时间代表N个左右的信号帧(通常N≈100,即窗口为1s左右)。
帧n的估测值Istat(n)是数字N0和N1的函数f。具体地说,它可以是二元函数,例如:
如果N1>4N0(相对平稳),f(N0,N1)=1
或者
如果N1≤4N0(相对非平稳),f(N0,N1)=0
如果在当前帧n中由滤波器22传递的合成信号∑n(t)的能量E(∑n)低于所选的阈值,以致于能量不足的帧被忽略(步骤40),在帧n中不修改计数器N0和N1,在步骤41中模块38直接计算Istat(n)。如果不低于该阈值,在步骤42中它检查帧n所表示的编码模式(在比特流中读出的d(n)或者丢失帧时d(n)=d(n-1))。如果d(n)=0,在步骤43中计数器N0递增。如果d(n)=1,在步骤44中计数器N1递增。然后,模块38在步骤41中计算Istat(n),除非N0+N1的和达到数字N(步骤45),在这种情况中,两个计数N0和N1的值除以2后再计算。
模块25计算系数Pk(n)(1≤k≤KB)的过程可遵循图4的流程图。注意这个过程是对所有的n帧执行的,不论是有效的还是丢失的,而且不论采用正向还是反向编码。所计算的滤波器取决于权重系数α,它又取决于自最后丢失帧起已经消逝的帧数和相继的估测值Istat(n)。当前帧前的最后丢失帧的编号由n0表示。
在开始为帧n进行的处理时,模块25产生KB系数Pk(n),如果d(n)=1,将其提供给滤波器22,用于帧n的合成信号
如果d(n)=0,仅计算并存储系数Pk(n)。计算是在步骤50中进行的,利用方程式:
当至少一个有效帧N0+i接在丢失帧n0后时(i=1,2,…),方程式(7)等于于方程式(1)。
如果帧n是有效的(步骤51),模块25在步骤52中检查在比特流中读出的正向/反向判定位d(n)。
如果d(n)=1,模块25在步骤53至57中根据方程式(2)计算系数α的新值,象模块38相对于帧n估测一样,系数β被选作Istat(n)的递降函数。如果在步骤53中Istat(n)=0(相对非平稳信号),在步骤54中系数α减去β=β0。如果在步骤53中Istat(n)=1(相对平稳信号),在步骤55中系数α减去β=β1。如果Istat(n)是以二元方式确定的,如上所述,那么B0和B1的量可以分别等于0.5和0.1。在步骤56中,α的新值与0比较。如果α≥0,那么,相对于帧n的处理终止。如果α<0,那么在步骤57中将系数α设定为0。
在正向编码帧n(在步骤52中d(n)=0)的情况下,在步骤57中直接将系数α设定为0。
如果帧n丢失(步骤51),将当前帧的编号n分配为n0,指定最后丢失帧,在步骤58中将系数α初始化为其最大值αmax(0<αmax≤1)。
系数α的最大值αmax可以小于1。然而,最好选择值αmax=1。在这种情况下,如果帧n0丢失,那么由模块25计算的下一个滤波器Pk(n0+1)对应于在接收最后有效帧后计算的滤波器。如果存在多个连续的丢失帧,那么由模块25计算的滤波器保持等于接收最后有效帧后计算的滤波器。
如果在丢失帧后接收的第一个有效帧是正向编码的(d(n0+1)=0),那么合成滤波器22接收由模块21计算的有效系数PF k(n0+1)和有效激励信号。因此,象由分析模块30进行的合成滤波器的估测值
一样,合成信号
是比较可靠的。由于在步骤57中将系数α设定为0,因此对于下一帧n0+2,计算模块25可以采纳这一估测值
如果在丢失帧后接收的第一个有效帧是反向编码的(d(n0+1)=1),那么合成滤波器22接收该有效帧的系数Pk(n0+1)。选择αmax=1完全可避免在计算系数中需要考虑在对丢失帧n。的合成信号
处理后由模块30相对不太可靠地确定的估测值
是通过滤除差错的激励信号而获得的)。
如果接下来的帧n0+2等仍然是反向编码的,利用系数α使所用的合成滤波器平滑,系数α的值根据信号区或多或少的平稳情况或多或少地快速减小。在特定个数的帧(平稳情况中10帧,非平稳情况中2帧,具有指示值β1和β0)之后,系数α再次为0,换句话说,如果编码模式保持反向模式,则所采用的滤波器Pk(n0+i)变为等于模块30由合成信号估测的滤波器
以上的描述详细地说明了混合正向/反向编码***的例子。仅利用反向编码的编码器时,本发明的使用是十分相似的:
-输出比特流F不包含判定位d(n)和频谱参数Q(n),而仅包含激励参数EX(n),
-不需要图1中编码器的功能单元7、8、10和11,由反向LPC分析模块12计算的系数PB(n)被合成滤波器5直接使用,
-不需要图2中解码器的功能单元21、23、24、34和36,由模块25计算的系数Pk(n)被合成滤波器22直接使用。
如果计算模块25采用Istat(n),在解码器中不再提供判定位d(n),它必须以其它某种方法计算。如果发送的比特流不包含使编码器能够估测Istat(n)的任何特定信息,那么估测可以基于由模块25相继计算的合成滤波器Pk(n)的比较分析。如果在相继滤波器之间测得的频谱距离在特定时间窗口上保持相对较小,那么信号被视为相对平稳的。
Claims (33)
1.一种对代表按相继帧编码的声频信号(Sn(t))的比特流(F)进行解码的方法,所述比特流与表示任何丢失帧的标记(BFI)一起接收,
这里,对每一帧,由激励参数(EX(n))形成激励信号
如果该帧是有效的则在比特流中恢复激励参数,如果该帧丢失则以其它一些方法估测,而且借助用合成滤波器(22)对激励信号进行滤波,以获得解码声频信号
这里,基于至先前一帧所获得的解码声频信号进行线性预测分析,以至少部分地估测与当前帧相关的合成滤波器,只要不存在丢失帧,用于对除激励信号滤波的相继的合成滤波器滤符合估测的合成滤波器,
其特征在于,如果帧n0丢失,用于对后续的帧n0+i的相关激励信号滤波的至少一个合成滤波器是由相对于帧n0+i估测的合成滤波器和自帧n0起一直被使用的至少一个合成滤波器的加权组合确定的。
2.如权利要求1所述的方法,其特征在于:如果跟随在丢失帧n0后的帧n0+1也是丢失帧,那么,用于对与帧n0+1相关的激励信号滤波的合成滤波器由用于对与帧n0相关的激励信号滤波的合成滤波器确定。
3.如权利要求1所述的方法,其特征在于:在所述加权组合中所采用的权重系数取决于帧n0+i与最后丢失帧n0之间的帧的数目i,从而使所采用的合成滤波器逐步接近于所估测的合成滤波器。
5.如权利要求4所述的方法,其特征在于:α(1)=αmax。
6.如权利要求4所述的方法,其特征在于:对于i>1,系数α(i)是由方程式α(i)=max{0,α(i-1)-β}计算的,这里β是取值范围在0至1的系数。
7.如权利要求1所述的方法,其特征在于:在所述加权组合中所采用的权重系数取决于声频信号平稳程度的估测值(Istat(n)),从而使在弱平稳信号的情况中,用于对与跟随在丢失帧n0后的帧n0+i,i≥1,相关的激励信号滤波的合成滤波器比在高度平稳信号的情况中更接近于估测的合成滤波器。
8.如权利要求7所述的方法,其特征在于:声频信号频谱平稳的程度(Istat(n))是由包含在比特流的每个有效帧中的信息估测的。
9.如权利要求7所述的方法,其特征在于:声频信号频谱平稳的程度(Istat(n))是由用于对激励信号滤波的相继的合成滤波器的比较分析估测的。
10.如权利要求4或7所述的方法,其特征在于:对于i>1,权重系数α(i)是估测的声频信号频谱平稳程度(Istat(n))的递增函数。
11.如权利要求6或10所述的方法,其特征在于:系数β是估测的声频信号频谱平稳程度(Istat(n))的递减函数。
12.如权利要求11所述的方法,其特征在于:声频信号频谱平稳的程度(Istat(n))是以二元方式估测的,根据估测,系数β的取值为0.5或0.1。
15.一种对代表按相继帧编码的声频信号(Sn(t))的比特流(F)进行解码的方法,所述比特流与表示任何丢失帧的标记(BFI)一起接收,所述比特流的每一有效帧包括对与该帧相关的声频信号进行编码所应用的编码模式的指示(d(n)),所述编码模式或是帧包含频谱参数(Q(n))的第一种编码模式或是第二种编码模式,
如果比特流表示第一种编码模式,用于对激励信号滤波的合成滤波器是由所述频谱参数构成的,
这里,基于至先前一帧所获得的解码声频信号进行线性预测分析,以至少部分地估测与当前帧相关的合成滤波器,这里,只要不存在丢失帧而且比特流表示第二种编码模式,则用于对激励信号滤波的相继的合成滤波器符合估测的合成滤波器,
其特征在于,如果帧n0丢失,对前一有效帧比特流已经表示第二种编码模式,而且比特流表示第二种编码模式的多个有效帧跟随帧n0之后,则用于对后续的帧n0+i的相关激励信号滤波的至少一个合成滤波器是由相对于帧n0+i估测的合成滤波器和自帧n0起一直被使用的至少一个合成滤波器的加权组合确定的。
16.如权利要求15所述的方法,其特征在于:如果帧n0丢失并且随后是比特流表示第二种编码模式的至少一个有效帧,用于对后续的帧n0+i的相关激励信号滤波的合成滤波器是由相对于帧n0估测的合成滤波器确定的。
17.如权利要求15所述的方法,其特征在于:如果两个相继的帧n0和帧n0+i都丢失,对前一有效帧比特流已经表示第二种编码模式,则用于对与帧n0+i相关的激励信号滤波的合成滤波器是由用于对与帧n0相关的激励信号滤波的合成滤波器确定的。
18.如权利要求15所述的方法,其特征在于:在所述加权组合中所采用的权重系数(α(i),1-α(i))取决于帧n0+i与最后丢失帧n0之间的帧的数目i,从而使所采用的合成滤波器逐步接近于所估测的合成滤波器。
20.如权利要求19所述的方法,其特征在于:α(1)=αmax。
21.如权利要求19所述的方法,其特征在于:对于i>1,系数α(i)是利用方程式α(i)=max{0,α(i-1)-β}计算的,这里β是取值范围在0至1的系数。
22.如权利要求15所述的方法,其特征在于:在所述加权组合中所采用的权重系数取决于声频信号平稳程度的估测值(Istat(n)),从而使在弱平稳信号的情况中,用于对与跟随在丢失帧n0后且比特流表示第二种模式(i≥1)的帧n0+i相关的激励信号进行滤波的合成滤波器比在强平稳信号的情况中更接近于估测的合成滤波器。
23.如权利要求22所述的方法,其特征在于:声频信号频谱平稳的程度(Istat(n))是由包含在比特流(F)的每个有效帧中的信息(d(n))估测的。
24.如权利要求23所述的方法,其特征在于:估测声频信号频谱平稳的程度(Istat(n))的信息是表示声频信号编码模式(d(n))的信息。
25.如权利要求24所述的方法,其特征在于:估测的声频信号频谱平稳的程度(Istat(n))是通过对用第二种编码模式处理的帧和用第一种编码模式处理的帧递减计数导出的,所述计数属于当前帧前的时间窗口,具有N帧左右的持续周期,N是预定的整数。
26.如权利要求25所述的方法,其特征在于:声频信号频谱平稳的程度(Istat(n))是利用两个计数器递归地估测的,一个对于利用第一种编码模式处理的每一帧其值N0递增,另一个对于利用第二种编码模式处理的每一帧其值N1递减,当两个值之和达到数字N时两个计数器的值一起减小,估测的声频信号频谱平稳程度是比率N1/N0的递增函数。
27.如权利要求26所述的方法,其特征在于:估测的声频信号频谱平稳程度(Istat(n))是比率N1/N0的二元函数。
28.如权利要求22所述的方法,其特征在于:声频信号频谱平稳程度(Istat(n))是由用于对激励信号(Ek(n))滤波的相继的合成滤波器的比较分析估测的。
29.如权利要求19或22所述的方法,其特征在于:对于i>1,权重系数α(i)是估测的声频信号频谱平稳程度(Istat(n))的递增函数。
30.如权利要求21或29所述的方法,其特征在于:系数β是估测的声频信号频谱平稳程度(Istat(n))的递减函数。
31.如权利要求27或30所述的方法,其特征在于:根据估测的声频信号频谱平稳的程度(Istat(n)),系数β的取值为0.5或0.1。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR98/01441 | 1998-02-06 | ||
FR9801441A FR2774827B1 (fr) | 1998-02-06 | 1998-02-06 | Procede de decodage d'un flux binaire representatif d'un signal audio |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1263625A CN1263625A (zh) | 2000-08-16 |
CN1133151C true CN1133151C (zh) | 2003-12-31 |
Family
ID=9522700
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN998004812A Expired - Lifetime CN1133151C (zh) | 1998-02-06 | 1999-02-03 | 纠正传输差错的声频信号解码方法 |
Country Status (13)
Country | Link |
---|---|
US (1) | US6408267B1 (zh) |
EP (1) | EP1051703B1 (zh) |
JP (1) | JP3565869B2 (zh) |
KR (1) | KR100395458B1 (zh) |
CN (1) | CN1133151C (zh) |
AU (1) | AU756082B2 (zh) |
BR (1) | BRPI9904776B1 (zh) |
CA (1) | CA2285650C (zh) |
DE (1) | DE69911169T2 (zh) |
ES (1) | ES2209383T3 (zh) |
FR (1) | FR2774827B1 (zh) |
HK (1) | HK1027892A1 (zh) |
WO (1) | WO1999040573A1 (zh) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2784218B1 (fr) * | 1998-10-06 | 2000-12-08 | Thomson Csf | Procede de codage de la parole a bas debit |
US6584438B1 (en) * | 2000-04-24 | 2003-06-24 | Qualcomm Incorporated | Frame erasure compensation method in a variable rate speech coder |
FR2813722B1 (fr) | 2000-09-05 | 2003-01-24 | France Telecom | Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif |
EP1199709A1 (en) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Error Concealment in relation to decoding of encoded acoustic signals |
FR2830970B1 (fr) * | 2001-10-12 | 2004-01-30 | France Telecom | Procede et dispositif de synthese de trames de substitution, dans une succession de trames representant un signal de parole |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
JP4445328B2 (ja) * | 2004-05-24 | 2010-04-07 | パナソニック株式会社 | 音声・楽音復号化装置および音声・楽音復号化方法 |
US7706481B2 (en) * | 2004-08-20 | 2010-04-27 | Broadcom Corporation | Method and system for improving reception in wired and wireless receivers through redundancy and iterative processing |
US20060059411A1 (en) * | 2004-09-16 | 2006-03-16 | Sony Corporation And Sony Electronics, Inc. | Method and system for increasing channel coding gain |
KR100708123B1 (ko) * | 2005-02-04 | 2007-04-16 | 삼성전자주식회사 | 자동으로 오디오 볼륨을 조절하는 방법 및 장치 |
JP4606264B2 (ja) * | 2005-07-19 | 2011-01-05 | 三洋電機株式会社 | ノイズキャンセラ |
KR101393298B1 (ko) * | 2006-07-08 | 2014-05-12 | 삼성전자주식회사 | 적응적 부호화/복호화 방법 및 장치 |
CN101366080B (zh) * | 2006-08-15 | 2011-10-19 | 美国博通公司 | 一种更新解码器的状态的方法和*** |
WO2008022207A2 (en) * | 2006-08-15 | 2008-02-21 | Broadcom Corporation | Time-warping of decoded audio signal after packet loss |
JP2008058667A (ja) * | 2006-08-31 | 2008-03-13 | Sony Corp | 信号処理装置および方法、記録媒体、並びにプログラム |
CN100578618C (zh) * | 2006-12-04 | 2010-01-06 | 华为技术有限公司 | 一种解码方法及装置 |
FR2911228A1 (fr) * | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
EP2242048B1 (en) * | 2008-01-09 | 2017-06-14 | LG Electronics Inc. | Method and apparatus for identifying frame type |
CN101894565B (zh) * | 2009-05-19 | 2013-03-20 | 华为技术有限公司 | 语音信号修复方法和装置 |
US8344186B2 (en) * | 2010-02-02 | 2013-01-01 | Celanese International Corporation | Processes for producing ethanol from acetaldehyde |
CN108364657B (zh) | 2013-07-16 | 2020-10-30 | 超清编解码有限公司 | 处理丢失帧的方法和解码器 |
WO2015108358A1 (ko) * | 2014-01-15 | 2015-07-23 | 삼성전자 주식회사 | 선형 예측 부호화 계수를 양자화하기 위한 가중치 함수 결정 장치 및 방법 |
CN106683681B (zh) * | 2014-06-25 | 2020-09-25 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
CN111554309A (zh) * | 2020-05-15 | 2020-08-18 | 腾讯科技(深圳)有限公司 | 一种语音处理方法、装置、设备及存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3102015B2 (ja) * | 1990-05-28 | 2000-10-23 | 日本電気株式会社 | 音声復号化方法 |
US5450449A (en) * | 1994-03-14 | 1995-09-12 | At&T Ipm Corp. | Linear prediction coefficient generation during frame erasure or packet loss |
US5615298A (en) * | 1994-03-14 | 1997-03-25 | Lucent Technologies Inc. | Excitation signal synthesis during frame erasure or packet loss |
US5699485A (en) * | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
FR2742568B1 (fr) | 1995-12-15 | 1998-02-13 | Catherine Quinquis | Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application |
FR2762464B1 (fr) * | 1997-04-16 | 1999-06-25 | France Telecom | Procede et dispositif de codage d'un signal audiofrequence par analyse lpc "avant" et "arriere" |
-
1998
- 1998-02-06 FR FR9801441A patent/FR2774827B1/fr not_active Expired - Lifetime
-
1999
- 1999-02-03 AU AU21706/99A patent/AU756082B2/en not_active Expired
- 1999-02-03 ES ES99901696T patent/ES2209383T3/es not_active Expired - Lifetime
- 1999-02-03 BR BRPI9904776-4A patent/BRPI9904776B1/pt active IP Right Grant
- 1999-02-03 CA CA002285650A patent/CA2285650C/fr not_active Expired - Lifetime
- 1999-02-03 EP EP99901696A patent/EP1051703B1/fr not_active Expired - Lifetime
- 1999-02-03 CN CN998004812A patent/CN1133151C/zh not_active Expired - Lifetime
- 1999-02-03 DE DE69911169T patent/DE69911169T2/de not_active Expired - Lifetime
- 1999-02-03 WO PCT/FR1999/000221 patent/WO1999040573A1/fr active IP Right Grant
- 1999-02-03 JP JP54008199A patent/JP3565869B2/ja not_active Expired - Lifetime
- 1999-02-03 US US09/402,529 patent/US6408267B1/en not_active Expired - Lifetime
- 1999-02-03 KR KR10-1999-7009169A patent/KR100395458B1/ko not_active IP Right Cessation
-
2000
- 2000-11-08 HK HK00107084A patent/HK1027892A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
WO1999040573A1 (fr) | 1999-08-12 |
DE69911169T2 (de) | 2004-06-17 |
CA2285650A1 (fr) | 1999-08-12 |
BR9904776A (pt) | 2000-03-08 |
KR20010006091A (ko) | 2001-01-15 |
DE69911169D1 (de) | 2003-10-16 |
ES2209383T3 (es) | 2004-06-16 |
AU2170699A (en) | 1999-08-23 |
EP1051703B1 (fr) | 2003-09-10 |
FR2774827A1 (fr) | 1999-08-13 |
BRPI9904776B1 (pt) | 2015-07-14 |
JP3565869B2 (ja) | 2004-09-15 |
US6408267B1 (en) | 2002-06-18 |
JP2001511917A (ja) | 2001-08-14 |
CN1263625A (zh) | 2000-08-16 |
EP1051703A1 (fr) | 2000-11-15 |
CA2285650C (fr) | 2003-09-16 |
HK1027892A1 (en) | 2001-01-23 |
KR100395458B1 (ko) | 2003-08-25 |
FR2774827B1 (fr) | 2000-04-14 |
AU756082B2 (en) | 2003-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1133151C (zh) | 纠正传输差错的声频信号解码方法 | |
USRE49363E1 (en) | Variable bit rate LPC filter quantizing and inverse quantizing device and method | |
CN1266674C (zh) | 闭环多模混合域线性预测语音编解码器和处理帧的方法 | |
CN1121683C (zh) | 语音编码 | |
CN1143265C (zh) | 具有改进的语音编码器的传输*** | |
CN1121609C (zh) | 再现接收语音信号的方法和装置 | |
CN1241169C (zh) | 语音中非话音部分的低数据位速率编码 | |
CN1302459C (zh) | 用于编码和解码非话音语音的方法和设备 | |
CA2636684A1 (en) | A method for speech coding, method for speech decoding and their apparatuses | |
US5742733A (en) | Parametric speech coding | |
CN1347550A (zh) | Celp转发 | |
EP1339041A1 (en) | Audio decoder and audio decoding method | |
CN1188832C (zh) | 过滤语言帧的多脉冲内插编码 | |
CN1279510C (zh) | 用来对相位谱信息进行子抽样的方法和设备 | |
CN1145925C (zh) | 具有改进语音编码器和解码器的发射机 | |
US7024354B2 (en) | Speech decoder capable of decoding background noise signal with high quality | |
CN1231050A (zh) | 具有改进谐波语音编码器的发射机 | |
CN1262991C (zh) | 跟踪准周期性信号的相位的方法和设备 | |
CN1104093C (zh) | 语音传输*** | |
CN1875401A (zh) | 数字语音编码器中的谐波噪声加权 | |
Swaminathan et al. | A robust low rate voice codec for wireless communications | |
CN114913862A (zh) | 基于禁忌转移矩阵的声码器参数误码掩盖方法及*** | |
Jamrozik et al. | Enhanced quality modified multiband excitation model at 2400 bps |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term |
Granted publication date: 20031231 |
|
CX01 | Expiry of patent term |