CN1416561A - 语音解码器和一种语音解码方法 - Google Patents

语音解码器和一种语音解码方法 Download PDF

Info

Publication number
CN1416561A
CN1416561A CN01806171A CN01806171A CN1416561A CN 1416561 A CN1416561 A CN 1416561A CN 01806171 A CN01806171 A CN 01806171A CN 01806171 A CN01806171 A CN 01806171A CN 1416561 A CN1416561 A CN 1416561A
Authority
CN
China
Prior art keywords
expression
parameter expression
frequency band
filter
linear prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN01806171A
Other languages
English (en)
Other versions
CN1193344C (zh
Inventor
J·罗托拉-普基拉
J·韦尼奥
H·米科拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Technologies Oy
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=8557866&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN1416561(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of CN1416561A publication Critical patent/CN1416561A/zh
Application granted granted Critical
Publication of CN1193344C publication Critical patent/CN1193344C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Devices For Executing Special Programs (AREA)
  • Executing Machine-Instructions (AREA)

Abstract

一种语音解码器包括一个解码器(103),用于将线性预测编码语音信号变换成具有第一采样率和表示第一频带的第一样本流。另外,它包括一个声码器(105),用于将输入信号变换成具有第二采样率和表示第二频带的第二样本流,和组合装置(107),用于按被处理的形式组合第一和第二样本流。它也包括装置(301),用于根据解码器(103)在第一频带上使用的第一线性预测滤波器生成由声码器(105)在第二频带上使用的第二线性预测滤波器。通过无限脉冲响应滤波器外插是生成第二线性预测滤波器的优选方法。

Description

语音解码器和一种语音解码方法
本发明一般涉及对数字化编码语音进行解码的技术。特别是,本发明涉及从窄频带编码输入信号产生宽频带解码输出信号的技术。
数字电话***传统上依赖于具有固定采样率的标准化语音编码和解码程序,以保证在随意选取的发射机一接收机对之间的兼容性。第二代数字蜂窝网的发展和它们的功能上增强的终端已经导致这样一种状况,即关于采样率的完全一对一的兼容性不可能被保证,也就是在发射终端中的语音编码器可以使用与终端中语音解码器的输出采样率不同的输入采样率。由于复杂性的制约也可以对具有比实际输入信号窄的频带的信号实施对原始语音信号的线性预测或LP分析。一种先进的接收终端的语音解码器必须能够产生具有比在分析中所用的频带宽的LP滤波器并从窄频带输入参数产生宽带输出信号。从现有的窄带信息产生宽带LP滤波器也有较宽的适用性。
图1说明用于将窄带编码语音信号变换成宽带解码样本流的一种已知的原理,可用在具有高采样率的语音合成中。在发送端,原始语音信号已经在方框101中经受过低通滤波(LPF)。在低频子带上得到的信号已在窄带编码器102中编码。在接收端,将该编码信号送入窄带解码器103。它的输出是表示具有较低采样率的低频子带的样本流。为了增加采样率,将该信号送入采样率内插器104。
通过从方框103采用LP滤波器(未分开示出)估计从该信号中失去的较高频率并利用它作为声码器105的一部分实现LP滤波器,该声码器105使用白噪声信号作为它的输入。换句话说,在低频子带中的LP滤波器频响曲线在频率轴方向中被延伸,以便在合成产生高频子带的生成中覆盖较宽的频带。调节该白噪声的功率,使得该声码器输出的功率是适当的。声码器105的输出在方框106中被高通滤波(HPF)以防止与低频子带上的实际语音信号过多的重迭。在相加方框107中将该低和高频子带组合,将该组合送到语音合成器(未示出)用以产生最后的声频输出信号。
我们可以考虑一种示范性的情况,其中语音信号的原始采样率为12.8KHz,在解码器输出上的采样率应为16KHz。对于从0到6400Hz的频率,也就是从零到奈奎斯特频率已履行过LP分析,奈奎斯特频率是原始采样率的一半。因此,窄带解码器103实现一种其频响从0到6400Hz的LP滤波器。为了产生高频子带,该LP滤波器的频响在声码器105中被延伸,以便覆盖从0到8000Hz的频带,现在,在其中上限是考虑所希望的较高采样率的奈奎斯特频率。
在低和高频子带之间的某种程度的重迭通常是希望的,虽然并非必要;该重迭可以帮助达到最佳的主观声频质量。让我们假定目标定为重迭10%。这意味着在窄带解码器103中使用LP滤波器的整个频响0到6400Hz(当采样率Fs=12.8KHz时也就是0-0.5Fs),在声码器105中有效使用的只有LP滤波器频响的5600到8000Hz(当采样率Fs=16KHz时也就是0.35Fs-0.5Fs)。在此“有效地”意思是由于高通滤波器106的存在,频响的低端并不影响高端信号处理分支的输出。在5600到8000Hz范围内宽带LP滤波器的频响是4480到6400Hz范围内窄带LP滤波器的频响的被展宽的复制品。
窄带LP滤波器的频响在靠近原始的奈奎斯特频率的高端区域中有峰值的情况下,现有技术方案的缺陷变得显著了。图2用作说明这样一种情况。细曲线201表示0到8000Hz LP滤波器的频响。可用于分析具有采样率16KHz的语音信号。粗曲线202表示图1的方案将产生的组合频响。在4480Hz和6400Hz上的虚线203和204分别将窄带LP滤波器频响的部分定界线,在声码器中实施的宽带LP滤波器中被复制并展宽到5600Hz到8000Hz的间隔内。在窄带频响中近似4400Hz处的峰值和由此趋向频带上限的连续下坡使得组合频响曲线202与理想的宽带LP滤波器的频响201显著地不同。
为了实现图1的原理克服上面提出的缺陷,已知各种各样现有技术的方案。专利公布US 5,978,759公开了一种设备,使用一种编码簿或查找表将窄带语音展宽为宽带语音。一组表征窄带LP滤波器的参数被抽出,并作为对查找表的一个搜查密钥,使相应的宽带LP滤波器的特征参数可从查找表中的匹配的或接近匹配的项目(cntry)读出。从专利公布号JP 10124089A知道一种类似的解决方案。从专利公布号US 5,455,888知道一种稍有不同的方法,其中通过使用一种滤波器组产生较高的频率,而该滤波器组是通过使用一种查找表选取的。专利公布号US5,581,652提出通过使用编码簿从窄带语音重建宽带语音,使得信号的波形性质被利用。另外在所公开的国际专利申请号WO99/49454中还公开了一种方法,在其中语音信号被变换到频率域,识别该频率域信号的特征峰值,根据一种转换表选取一组宽带滤波器参数。
在搜索适当的宽带滤波器特征中使用查找表可以帮助避免图2中所示种类的灾害,但同时引入相当大的不灵活度。或者只有有限数量的可能的宽带滤波器可被实施,或者仅仅为此目的必须配置非常大的存储器。增加从中选取所存储的宽带滤波器的数目也增加了为搜索和建立其中的正确配置必须分配的时间,在实时操作如语音电话中是不希望的。
本发明的一个目的是提出一种语音解码器和一种用于对语音解码的方法,其中频带展宽用一种灵活的方式完成,在计算上是经济的,并良好地仿制出原先用较宽的带宽获得的特性。
通过从窄带LP滤波器产生宽带LP滤波器实现本发明的这些目的,从而根据在窄带LP滤波器极点方面的某些规律性运用外插法。
依据本发明一种语音处理设备包括:
-用于接收表示第一频带的线性预测编码的语音信号的输入。
-用于从线性预测编码的语音信号抽取描述与第一频带有关的第一线性预测滤波器的信息的装置,和
-用于将输入信号变换成表示第二频带的输出信号的声码器:
其特征在于包括:
-根据描述第一线性预测滤波器的信息产生在第二频带上由声码器使用的第二线性预测滤波器的装置。
本发明也适用于数字无线电话,其特征在于它包括至少一种上述种类的语音处理设备。
另外,本发明适用于一种包括以下步骤的语音解码方法:
-从线性预测编码语音信号抽取描述与第一频带有关的第一线性预测滤波器的信息,和
-将输入信号变换成表示第二频带的输出信号:
其特征在于它包括以下步骤:
-根据描述与第一频带有关的第一线性预测滤波器所抽取的信息,产生在将输入信号变换成输出信号中使用的第二线性预测滤波器。
对于LP滤波器存在几种众所周知的表示形式。特别是已知一种所谓的频率域表示法,在其中一个LP滤波器可以用一个LSF(LineSpectral Frequency)向量或一个ISF(Immettance SpectralFrequency)向量表示。频率域表示法具有与采样率无关的优点。
依据本发明一个窄带LP滤波器被动态地用作通过外插法构成一个宽带LP滤波器的基础。特别是本发明包含将窄带LP滤波器变换成频率域表示并通过将频率域表示的窄带LP滤波器外插形成频率域表示的宽带LP滤波器。最好一种足够高阶的IIR(Infinite ImpulseResponse)滤波器被用于外插,以便利用表征窄带LP滤波器的规律性。宽带LP滤波器的阶最好这样选取,使宽带和窄带LP滤波器阶的比率基本上等于宽带和窄带采样频率之比。对于IIR滤波器需要一组系数:最好通过分析反映窄带LP滤波器向量表示中相邻元素之间的差的差向量自相关来得到。
为了保证宽带LP滤波器在靠近奈奎斯特频率处不产生过多的放大,对宽带LP滤波器的向量表示的最后的元素设置某些限制是有利的。特别是在向量表示中的最后的元素和与采样频率成比例的奈奎斯特频率之间的差应该保持接近相同。很容易通过微分的定义规定这些限制,使得向量表示中相邻元素之间的差受到控制。
在所附的权利要求中具体地陈述了作为本发明特征的新特征。然而通过以下结合附图的特定实施方案的描述,本发明本身无论关于它的结构还是它的操作方法以及它的附加的目的和优点都将得到最好的理解。
图1示出一种已知的语音解码器。
图2示出一种已知的宽带LP滤波器的不利的频响。
图3a用作说明本发明的原理。
图3b用作说明将图3a的原理应用到一种语音解码器中。
图4示出图3b方案的细节。
图5示出图4方案的细节。
图6示出依据本发明的一种LP滤波器的有利的频响,和图7示出一种依据本发明的实施方案的数字无线电话。
图1和2已经在先前技术的描述中作了描述,所以以下的本发明和它的有利的实施方案的描述集中到图3a到6上。相同的参考标记用于附图中类似的部件。
图3a用作说明在抽取方框310中使用窄带输入信号抽取窄带LP滤波器的参数。窄带LP滤波器参数被带入外插方框301,在其中使用外插产生相应的宽带LP滤波器的参数。这些参数被带入声码器105。声码器使用某种宽带信号作为它的输入。声码器105从这些参数产生宽带LP滤波器,并利用它们将宽带输入信号变换成宽带输出信号。抽取方框310也可给出输出,它是一种窄带输出。
图3b示出如何可把图3a的原理应用到一种其他的已知的语音解码器中。在图1和图3b之间的比较示出将本发明引入用于变换窄带编码语音信号为宽带解码样本流与其他已知的原理相比的添加内容。本发明并不影响发送端:原始的语音信号在方框101中被低通滤波,在低频子带上所得到的信号在窄带编码器102中被编码。在接收端中较低的分支也可以是相当一致的:编码信号被送入窄带解码器103,为了增加低频子带输出的采样率,信号被带入采样率内插器104。然而,在方框103中所用的窄带LP滤波器并未被直接带入声码器105,而是带入外插方框301,在其中产生宽带LP滤波器。
在低频子带中LP滤波器的频响曲线并未被简单地延展来覆盖较宽的频带:不是被用作对任何以前产生的宽带LP滤波器库的一种搜索密钥的窄带LP滤波器特性。在方框301中实施的外插意味着产生一种唯一的宽带LP滤波器,并不只从一组选择物中选择最接近的匹配值。在这种意义上讲这是一种真正的自适应方法,即通过选择一种适当的外插算法。保证在每个窄带LP滤波器输入和相应的宽带LP滤波器输出之间的唯一关系是可能的。即使事先作为输入信息将遇到的窄带LP滤波器的有关信息了解甚少,外插法也工作。这是对于基于查找表的所有的解决方案一个明显的优点,因为只有当或多或少对它有了解时,才能构成这样的表,而窄带LP滤波器将落在这些目录中。另外,依据本发明的外插法只需要有限数量的存储器,因为只有算法本身才需要被存储。
在生成合成产生的高频子带中使用从方框301获得的宽带LP滤波器可以遵循从先前技术得知的模式。白噪声被作为输入数据送入声码器105,在产生表示高频子带的样本流中使用宽带LP滤波器。白噪声的功率被调节,使得声码器输出的功率是合适的。在方框106中声码器105的输出被高通滤波,在相加方框107中低和高频子带被组合。组合结果准备给语音合成器(未示出)用以产生最终的声频输出信号。
图4示出一种实现外插方框301的示范性方法。LP到LSF变换方框401将从解码器103获得的窄带LP滤波器变换到频率域。由外插方框402在频率域中完成实际的外插。它的输出被连到LSF到LP变换方框403,与在方框401中完成的变换相比,它实施一种逆变换。另外在方框403的输出和声码器105的控制输入之间连接一个增益控制器方框403,它的任务是将宽带LP滤波器的增益定标到适当的水平。
图5说明实现外插器402的一种示范性方法。它的输入被连到LP到LSF变换方框401的输出,所以作为对外插器402的一个输入得到窄带LP滤波器的向量表示fn。为了实施外插,通过分析滤波器产生器方框501中的向量fn生成外插滤波器。滤波器也可用一个向量描述,在此被标记为向量b。通过使用在方框501中生成的滤波器,窄带LP滤波器的向量表示fn在方框502中被变换为宽带LP滤波器的向量表示fw。最后,为了保证宽带LP滤波器在靠近对于较高采样率的奈奎斯特频率处不包含过多的放大,在将宽带LP滤波器递交到LSF到LP变换方框403以前,在方框503中需经受某些限制性的功能的作用。
现在我们将提供在以上图4和5中引入的各种功能方框内实施的操作的详细分析。作为一个事实,在对窄带语音信号解码过程中解码器103实现并使用一个LP滤波器。LP滤波器被指定为窄带LP滤波器,并通过一组LP滤波器系数为表征。同样也是一个事实,即实际上所有高质量语音解码器(和编码器)使用某些称为LSF或ISF的向量将LP滤波器系数量子化,所以在功能上如图4中方框401所示的LP到LSF变换甚至可以是解码器103的一部分。在整个这份描述中为了一致起见我们谈论LSF向量,但对于本领域的技术人员是明确的,本描述也适用于使用ISF向量。
LSF向量可被表示在余弦域中,在其中向量实际上被称为LSP(Line Spectral Pair)向量,或者被表示在频率域中。余弦域表示法(LSP向量)与采样率有关但频率域表示法则不同,所以如果,例如解码器103是某种现有的语音解码器,在其中只提供LSP向量作为对外插方框301的输入信息,最好将LSP向量首先变换成LSF向量。依据已知的公式很容易完成变换: f n ( i ) = arccos ( q n ( i ) ) F s . n π , i = 0 , . . . , n n - 1 . - - - ( 1 )
其中下标n一般表示“窄带”,fn(i)是窄带LSF向量的第i个元素,gn(i)是窄带LSF向量的第i个元素,fs、n是窄带采样率,nn是窄带LP滤波器的阶数。遵照LSP和LSF向量的定义,nn也是在窄带LSP和LSF向量中元素的数目。
在图3b,4和5所示的实施方案中,通过使用在方框501中生成的L阶外插滤波器在方框502中进行实际的外插。目前我们只假定方框501提供方框502一个滤波器向量b;随后我们将回到产生滤波器向量。用于产生宽带LSF向量fw的一个有利的公式是
Figure A0180617100122
其中下标w一般表示“宽带”fw(i)是宽带LSF向量的第i个元素,k是相加指数,L是外插滤波器的阶数,b(i-1)-k)是外插滤波器向量的第((i-1)-k)个元素。换句话说,与窄带LSF向量中的元素数目一样多,这在宽带LSF向量的开头是精确地相同的。在宽带LSF向量中的其余的元素被这样计算,使得每个新元素是在宽带LSF向量中以前的L个元素的加权和。在卷积顺序中权重是外插滤波器向量的元素,使得在计算fw(i)中,对于和作贡献最远的以前的元素fw(i-L)被用b(L-1)加权,对于和作贡献最近的以前的元素fw(i-1)被用b(o)加权。
外插公式(2)并不限制nw的值,也就是宽带LP滤波器的阶数。为了保持外插的精确度,这样选择nw的值是有利的,使得 n w = n n F s . w F s . n . - - - ( 3 )
意思是LP滤波器的阶数是按照采样频率的相对大小定标的。
宽带LP滤波器在接近奈奎斯特频率0.5Fs.w的频率上不应该产生过多的放大的要求可藉助于每个LP滤波器向量的最后的元素和相应的奈奎斯特频率之间的差进行公式化,其中差值被进一步用采样频率定标,依据公式 0.5 F s . w - f w ( n w - 1 ) F s . w ≥ 0.5 F s . n - f n ( n n - 1 ) F s . n . - - - ( 4 )
以上给出的对宽带LP滤波器的限制(3)和(4)限定了nw的选择和外插滤波器的定义。如何精确地实施这些限定是一件例行的工作站实验的问题。一种有利的方法是规定一个差向量D,使得D(k)=fw(k)-fn(k-1),k=nn.....nn-1           (5)
为了用某种方式限制差向量,例如,通过要求在差向量D中没有元素D(k)可以大于预先确定的限制值,或者差向量D的平方元素(D(k)2)之和不可以大于预定确定的限制值来达到。LP滤波器典型情况下具有低或高通滤波器特性,而不是带通或带阻滤波器特性。预先确定的限制值可用这样一种方式与这个事实有关系,即如果窄带LP滤波器具有低通滤波器特性,则限制值被增加,否则,如果窄带LP滤波器具有高通滤波器特性,则限制值被减小。其他涉及差向量D的可采用的限制很容易被本领域的技术人员想出来。
接着我们将描述产生滤波器向量b的某些有利的方法。LP滤波器极点的位置趋向于相互具有某种相关性,使得差向量D,它的元素描述相邻LP向量元素之间的差,包含某种规律性。我们可以计算自相关函数。 AC D ( k ) = Σ i = k n n ( D ( i ) - μ D ) ( D ( i - k ) - μ D ) , k = 1 , . . . , L - - - ( 6 ) 其中 μ D = Σ i = 1 n D ( i ) n n - - - ( 7 )
并找出它的最大值,也就是产生最高自相关度的指数k的值。我们可以将这个指数k的值标记为m。那末一种定义滤波器向量D的有利的方法为
滤波器向量b用这种方式遵循窄带LP滤波器的规律性。甚至外插的宽带LP滤波器的新元素通过在外插步骤中使用滤波器b继承了这种特性。
自相关函数(6)不具有明显的最大值自然是可能的。为了考虑这些情况我们可以规定外插滤波器向量b必须按照它们的重要性模拟窄带LP滤波器中所有的规律性。自相关可被用作这样一种定义的媒介物,例如依据公式
Figure A0180617100142
如果在自相关函数中有明显的最大值峰值,比较通用的定义(9)向以上给出的较简单的定义收敛。
宽带LP滤波器的LSF向量表示式准备被变换成实际的宽带LP滤波器,它可被用于处理具有采样率Fs.w的信号。对于宽带LP滤波器的LSP向量表示式是优选的情况。可依据以下的公式实现LSF到LSP的变换 q w ( i ) = cos ( f w ( i ) π F s . w ) , i = 0 , . . . , n w - 1 . - - - ( 10 )
应该指出,实施变换(10)所进入的余弦域具有奈奎斯特频率为0.5Fs.w,而由此完成窄带变换(1)的余弦域具有奈奎斯特频率为0.5Fs.n
所获得的宽带LP滤波器的总增益必须用从先前技术的解决方案已知的方法进行调节。如图4中子方框404所示的那样,可以在外插方框301中进行对增益的调节,或者可以是声码器105的一部分。作为与图1的先前技术解决方案的一个差别,可以指出,依据本发明产生的宽带LP滤波器的总增益可以允许大于先前技术宽带LP滤波器的总增益,因为象图2中所示的那样与理想响应大的偏差不可能发生因而也不需要防卫。
图6示出一种利用由依据本发明的外插法产生的宽带LP滤波器可以得到的典型的频响601。频响601非常紧密地跟随理想曲线201,该理想曲线201表示0到8000Hz LP滤波器的频响,可被用在对具有采样率16KHz的语音信号的分析中。外插法趋向于非常精确地模拟幅度谱的较大尺度的趋势,正确地确定频响中峰值的位置。本发明对于图1和2中所示的先前技术方案的一个重大的优点也在于宽带LP滤波器的频响是连续的,也就是它并没有任何象在先前技术宽带LP滤波器的频响中5600Hz处那样的瞬时的幅度变化。
为了将本发明的精神转化为对使用人可想像到的优点,单单一个语音解码器是不够的。图7示出一种数字无线电话,其中天线701被连到一个双工滤波器702,依次既连到一个接收方框703又连到一个发送方框704,用于在在无线电界面上接收和发送数字化的编码语音。接收方框703和发送方框704都被连到一个控制器方框704,分别用于传递接收到的控制信息和要发送的控制信息。另外,接收方框703和发送方框704被连到一个基带方框705,它包括分别用于处理接收到的语音和要发送的语音的基带频率的功能。基带方框705和控制器方框707被连到一个用户接口706,典型情况下由一个话筒,一个扬声器,一个键板和一个显示器组成(未在图7中专门示出)。
图7中较详细地示出基带方框705的一部分。接收方框703的最后部分是一个信道解码器,它的输出由信道解码的语音帧组成,需要经受语音解码和合成。从信道解码器获得的语音帧被暂时存储在帧缓存器710中,并由此读到实际的语音解码器711。后者实施从存储器712读出的语音解码算法。依据本发明,当语音解码器711发觉输入的语音信号的采样率应该提高,就采用以上描述的LP滤波器外插方法产生在生成合成产生的高频子带中需要的宽带LP滤波器。
典型情况下基带方框705是一个比较大的ASIC(ApplicationSpecific Integrated circuit)。本发明的使用有助于降低ASIC的复杂性和功率消耗。因为为了使用语音解码器只需要有限数量的存储器和部分数量的存储器存取,尤其是当与那些先前技术解决方案相比较时,它们为了存储各种各样的预先计算的宽带LP滤波器,要使用很大的查找表。本发明并不对ASIC的性能提出过多的要求,因为以上所描述的计算是比较容易实施的。

Claims (17)

1.一种语音处理设备,包括
-用于接收表示第一频带的线性预测编码语音信号的输入。
-用于从线性预测编码语音信号抽取描述与第一频带有关的第一线性预测滤波器的信息的装置(103,310)和
-用于将输入信号变换为表示第二频带的输出信号的声码器(105),
其特征在于它包括:
-用于根据描述第一线性预测滤波器的信息生成由声码器(105)在第二频带上使用的第二线性预测滤波器的装置(301)。
2.一种依据权利要求1的语音处理设备,其特征在于它包括:
-用于将描述第一线性预测滤波器的信息变换成频率域中的第一参数表达式的装置(401),
-用于将所述的第一参数表达式外插成频率域中的第二参数表达式的装置(402),和
-用于将所述的第二参数表达式变换成第二线性预测滤波器的装置(403)。
3.一种依据权利要求2的语音处理设备,其特征在于所述的用于将所述的第一参数表达式外插成频率域中第二参数表达式的装置(402)包括一个无限脉冲响应滤波器(502)。
4.一种依据权利要求3的语音处理设备,其特征在于它包括:用于从所述的第一参数表达式导出所述的无限脉冲响应滤波器的向量表达式的装置(501)。
5.一种依据权利要求2的语音处理设备,其特征在于它包括:用于限制所述的第二参数表达式的装置(404,503)。
6.一种依据权利要求1的语音处理设备,其特征在于它包括:
-用于将线性预测编码语音信号变换成具有第一采样率和表示第一频带的第一样本流的解码器(103)。
-用于将输入信号变换成具有第二采样率和表示第二频带的第二样本流的声码器(105)。
-用于将第一和第二样本流以所处理的形式组合的组合装置(107),和
-用于根据由解码器(103)在第一频带上使用的第一线性预测滤波器生成由声码器(105)在第二频带上使用的第二线性预测滤波器的装置(301)。
7.一种依据权利要求6的语音处理设备,其特征在于它包括:
-连接在解码器(103)和组合装置(107)之间的采样率内插器(104),和
-连接在声码器(105)和组合装置(107)之间的高通滤波器(106)。
8.一种数字无线电话,其特征在于它包括一种依据权利要求1的语音处理设备(711)。
9.一种用于处理数字编码语音的方法,包括以下步骤:
-从线性预测编码语音信号抽取(103)描述与第一频带有关的第一线性预测滤波器的信息,和
-将输入信号变换(105)成表示第二频带的输出信号,
其特征在于它包括以下步骤:
-根据所抽取的描述与第一频带有关的第一线性预测滤波器的信息,生成(301)在将输入信号变换成输出信号中要使用的第二线性预测滤波器。
10.一种依据权利要求9的方法,包括以下步骤:
-将线性预测编码语音信号变换(103)成具有第一采样率和表示第一频带的第一样本流。
-将输入信号变换成(105)具有第二采样率和表示第二频带的第二样本流,和
-将第一和第二样本流以所处理的形式组合(107),
其特征在于它包括以下步骤:
-根据由解码器在第一频带上使用的第一线性预测滤波器,生成由声码器在第二频带上使用的第二线性预测滤波器。
11.一种依据权利要求10的方法,其特征在于它包括以下步骤:
-将第一线性预测滤波器变换(401)成频率域中的第一参数表达式。
-将所述的第一参数表达式外插(402)成频率域中的第二参数表达式,和
-将所述的第二参数表达式变换(403)成第二线性预测滤波器。
12.一种依据权利要求10的方法,其特征在于将所述的第一参数表达式外插(402)为频率域中第二参数表达式的步骤包括利用一个无限脉冲响应滤波器对所述的第一参数表达式滤波器(502)的子步骤。
13.一种依据权利要求12的方法,其特征在于它包括从所述的第一参数表达式中观察到的规律性计算(501)对于所述的无限脉冲响应的向量表达式的步骤。
14.一种依据权利要求13的方法,其特征在于将所述的第一参数表达式外插(402)为频率域中第二参数表达式的步骤包括按以下公式确定(502)所述的第二参数表达式的值的子步骤
其中fw(i)是所述的第二参数表达式的第i个值,k是相加指数,L是所述的无限脉冲响应滤波器的阶数和b((i-1)-k)是对于所述的无限脉冲响应滤波器的向量表达式中第((i-1)-k)个元素。
15.一种依据权利要求14的方法,其特征在于它包括计算(501)对于所述的无限脉冲响应滤波器的向量表达式的子步骤,使得
Figure A0180617100042
和m是指数k的值,产生自相关函数的最大值 AC D ( k ) = Σ i = k n ( D ( i ) - μ D ) ( D ( i - k ) - μ D ) , k = 1 , . . . . . . , L 其中 μ D = Σ i = 1 n D ( i ) n n , D(k)=fn(k)-fn(k-1),k=0,...nn-1。
fn(i)是第一参数表达式的第i个元素。
nn是第一参数表达式中的元素数目。
16.一种依据权利要求14的方法,其特征在于它包括计算(501)对于所述的无限脉冲响应滤波器的向量表达式的子步骤,使得其中 AC D ( k ) = Σ i = k n ( D ( i ) - μ D ) ( D ( i - k ) - μ D ) . k = 1 , . . . , L . μ D = Σ i = 1 n D ( i ) n n . D(k)=fn(k)-fn(k-1),k=0,...nn-1。
fn(i)是第一参数表达式的第i个元素,
nn是第一参数表达式中的元素的数目。
17.一种依据权利要求14的方法,其特征在于它包括限制(503)所述的第二向量表达式以满足以下条件的步骤 n n ≈ n n F s . w F s . n 0.5 F s . n - f w ( n w - 1 ) F s . w ≥ 0.5 F s . n - f n ( n n - 1 ) F s . n . 其中
nw是第二参数表达式中的元素数目,nn是第一参数表达式中的元素数目,Fs.w是第二采样频率,Fs.n是第一采样频率,fn(i)是第一参数表达式中第i个元素,fw(i)是第二参数表达式中第i个元素。
CNB018061710A 2000-03-07 2001-03-06 语音解码器和一种语音解码方法 Expired - Lifetime CN1193344C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI20000524 2000-03-07
FI20000524A FI119576B (fi) 2000-03-07 2000-03-07 Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin

Publications (2)

Publication Number Publication Date
CN1416561A true CN1416561A (zh) 2003-05-07
CN1193344C CN1193344C (zh) 2005-03-16

Family

ID=8557866

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB018061710A Expired - Lifetime CN1193344C (zh) 2000-03-07 2001-03-06 语音解码器和一种语音解码方法

Country Status (15)

Country Link
US (1) US7483830B2 (zh)
EP (1) EP1264303B1 (zh)
JP (2) JP2003526123A (zh)
KR (1) KR100535778B1 (zh)
CN (1) CN1193344C (zh)
AT (1) ATE343835T1 (zh)
AU (1) AU2001242539A1 (zh)
BR (1) BRPI0109043B1 (zh)
CA (1) CA2399253C (zh)
DE (1) DE60124079T2 (zh)
ES (1) ES2274873T3 (zh)
FI (1) FI119576B (zh)
PT (1) PT1264303E (zh)
WO (1) WO2001067437A1 (zh)
ZA (1) ZA200205089B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1985304B (zh) * 2004-05-25 2011-06-22 诺基亚公司 用于增强型人工带宽扩展的***和方法
CN103650037A (zh) * 2011-07-01 2014-03-19 杜比实验室特许公司 采样率可分级的无损音频编码
CN116110409A (zh) * 2023-04-10 2023-05-12 南京信息工程大学 一种ASIP架构的大容量并行Codec2声码器***及编解码方法

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3467469B2 (ja) * 2000-10-31 2003-11-17 Necエレクトロニクス株式会社 音声復号装置および音声復号プログラムを記録した記録媒体
US6889182B2 (en) * 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
JP4937753B2 (ja) * 2004-09-06 2012-05-23 パナソニック株式会社 スケーラブル符号化装置およびスケーラブル符号化方法
EP1638083B1 (en) * 2004-09-17 2009-04-22 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited audio signals
WO2006062202A1 (ja) * 2004-12-10 2006-06-15 Matsushita Electric Industrial Co., Ltd. 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法
JP5046654B2 (ja) * 2005-01-14 2012-10-10 パナソニック株式会社 スケーラブル復号装置及びスケーラブル復号方法
KR100956877B1 (ko) * 2005-04-01 2010-05-11 콸콤 인코포레이티드 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치
JP4899359B2 (ja) 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
ES2827278T3 (es) 2014-04-17 2021-05-20 Voiceage Corp Método, dispositivo y memoria no transitoria legible por ordenador para codificación y decodificación predictiva linealde señales sonoras en la transición entre tramas que tienen diferentes tasas de muestreo
BR112016024372B1 (pt) * 2014-04-25 2020-11-03 Ntt Docomo, Inc. dispositivo de conversão de coeficiente de predição linear e método de conversão de coeficiente de predição linear
KR102002681B1 (ko) 2017-06-27 2019-07-23 한양대학교 산학협력단 생성적 대립 망 기반의 음성 대역폭 확장기 및 확장 방법
CN108198571B (zh) * 2017-12-21 2021-07-30 中国科学院声学研究所 一种基于自适应带宽判断的带宽扩展方法及***

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0685607A (ja) 1992-08-31 1994-03-25 Alpine Electron Inc 高域成分復元装置
JP2779886B2 (ja) 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
DE4343366C2 (de) 1993-12-18 1996-02-29 Grundig Emv Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen
JP3230790B2 (ja) 1994-09-02 2001-11-19 日本電信電話株式会社 広帯域音声信号復元方法
JP3230791B2 (ja) 1994-09-02 2001-11-19 日本電信電話株式会社 広帯域音声信号復元方法
JP3483958B2 (ja) 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
JP2798003B2 (ja) * 1995-05-09 1998-09-17 松下電器産業株式会社 音声帯域拡大装置および音声帯域拡大方法
DE69619284T3 (de) * 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
JPH0955778A (ja) * 1995-08-15 1997-02-25 Fujitsu Ltd 音声信号の広帯域化装置
JP3301473B2 (ja) 1995-09-27 2002-07-15 日本電信電話株式会社 広帯域音声信号復元方法
EP0878790A1 (en) 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
EP0945852A1 (en) 1998-03-25 1999-09-29 BRITISH TELECOMMUNICATIONS public limited company Speech synthesis
JP3541680B2 (ja) * 1998-06-15 2004-07-14 日本電気株式会社 音声音楽信号の符号化装置および復号装置
US6539355B1 (en) * 1998-10-15 2003-03-25 Sony Corporation Signal band expanding method and apparatus and signal synthesis method and apparatus
JP2000305599A (ja) * 1999-04-22 2000-11-02 Sony Corp 音声合成装置及び方法、電話装置並びにプログラム提供媒体
JP2003514263A (ja) * 1999-11-10 2003-04-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マッピング・マトリックスを用いた広帯域音声合成

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1985304B (zh) * 2004-05-25 2011-06-22 诺基亚公司 用于增强型人工带宽扩展的***和方法
US8712768B2 (en) 2004-05-25 2014-04-29 Nokia Corporation System and method for enhanced artificial bandwidth expansion
CN103650037A (zh) * 2011-07-01 2014-03-19 杜比实验室特许公司 采样率可分级的无损音频编码
CN103650037B (zh) * 2011-07-01 2015-12-09 杜比实验室特许公司 采样率可分级的无损音频编码
CN116110409A (zh) * 2023-04-10 2023-05-12 南京信息工程大学 一种ASIP架构的大容量并行Codec2声码器***及编解码方法
CN116110409B (zh) * 2023-04-10 2023-06-20 南京信息工程大学 一种ASIP架构的大容量并行Codec2声码器***及编解码方法

Also Published As

Publication number Publication date
ZA200205089B (en) 2003-04-30
ATE343835T1 (de) 2006-11-15
US7483830B2 (en) 2009-01-27
BRPI0109043B1 (pt) 2017-06-06
JP4777918B2 (ja) 2011-09-21
CN1193344C (zh) 2005-03-16
ES2274873T3 (es) 2007-06-01
DE60124079D1 (de) 2006-12-07
FI119576B (fi) 2008-12-31
KR20020081388A (ko) 2002-10-26
FI20000524A0 (fi) 2000-03-07
JP2007156506A (ja) 2007-06-21
CA2399253A1 (en) 2001-09-13
US20010027390A1 (en) 2001-10-04
CA2399253C (en) 2010-11-23
FI20000524A (fi) 2001-09-08
EP1264303A1 (en) 2002-12-11
DE60124079T2 (de) 2007-03-08
PT1264303E (pt) 2007-01-31
WO2001067437A1 (en) 2001-09-13
KR100535778B1 (ko) 2005-12-12
BR0109043A (pt) 2003-06-03
JP2003526123A (ja) 2003-09-02
EP1264303B1 (en) 2006-10-25
AU2001242539A1 (en) 2001-09-17

Similar Documents

Publication Publication Date Title
CN1193344C (zh) 语音解码器和一种语音解码方法
CN1151705C (zh) 多声道低比特率编码解码方法和设备
CN101622662B (zh) 编码装置和编码方法
CN1181467C (zh) 利用自适应噪声本底相加和噪声替换限制,增强信源编码和解码的方法和***
EP1914724B1 (en) Dual-transform coding of audio signals
CN102789782B (zh) 对输入数据流进行混合以及从中产生输出数据流
US7289951B1 (en) Method for improving the coding efficiency of an audio signal
CN102652336B (zh) 声音信号复原装置以及声音信号复原方法
MX2007014555A (es) Post-filtracion de codificador-descodificador de audio.
CN1185616A (zh) 音频带宽扩展***和方法
CN103620676A (zh) 对线性预测编码系数进行量化的方法、声音编码方法、对线性预测编码系数进行反量化的方法、声音解码方法以及记录介质
CN101542599A (zh) 用于编码和解码宽带语音信号的方法、装置和***
KR20050092107A (ko) 가변 레이트로 오디오를 인코딩 및 디코딩하는 방법
JP2004102186A (ja) 音響符号化装置及び音響符号化方法
CN104956438A (zh) 执行噪声调制和增益调节的***和方法
CN1470048A (zh) 在感知上改善的声信号编码
JPH09281995A (ja) 信号符号化装置及び方法
CN1216368C (zh) 用于扩展语音信号的频率范围的方法和***
CN1244090C (zh) 具备背景噪声再现的语音编码
CN101169934B (zh) 时域听觉阈值加权滤波器的构造方法和设备、编解码器
JP2000132194A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP4574320B2 (ja) 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体
JPH08137498A (ja) 音声符号化装置
CN1354456A (zh) 小波音频编码信号处理中块效应消除方法
JP2000132195A (ja) 信号符号化装置及び方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20160122

Address after: Espoo, Finland

Patentee after: Technology Co., Ltd. of Nokia

Address before: Espoo, Finland

Patentee before: Nokia Oyj

CX01 Expiry of patent term

Granted publication date: 20050316

CX01 Expiry of patent term