CN101124625A - 实现介于两种长时预测模型之间最优编码的方法和装置 - Google Patents

实现介于两种长时预测模型之间最优编码的方法和装置 Download PDF

Info

Publication number
CN101124625A
CN101124625A CNA200680003179XA CN200680003179A CN101124625A CN 101124625 A CN101124625 A CN 101124625A CN A200680003179X A CNA200680003179X A CN A200680003179XA CN 200680003179 A CN200680003179 A CN 200680003179A CN 101124625 A CN101124625 A CN 101124625A
Authority
CN
China
Prior art keywords
storehouse
classification
ltp
subframe
coded format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200680003179XA
Other languages
English (en)
Other versions
CN101124625B (zh
Inventor
***·格那尼亚
克劳德·拉姆林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of CN101124625A publication Critical patent/CN101124625A/zh
Application granted granted Critical
Publication of CN101124625B publication Critical patent/CN101124625B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及一种根据来自通过使用根据第一格式编码获得的信息项的第二格式编码的方法。尤其是对于语音信号编码,所述第一和第二格式利用通过搜索包含备选参数的库对LTP长时预测参数的搜索。该方法包括以下步骤:a)定义(25b)第二编码格式使用的库(25)的分级;b)恢复(23)在确定在根据第一格式的编码过程中的LTP参数的之后得到的先验信息用于选择(26)所述库的分级;c)将选择的分级应用(27)到所述库中的备选者上以选择(29)有限量的第一备选者;以及d)为了实施第二编码,只在所述有限量的备选者中执行LTP搜索(30)。

Description

实现介于两种长时预测模型之间最优编码的方法和装置
本发明涉及数字音频信号的压缩编/解码,尤其涉及语音信号和/或多媒体信号传输或者存储应用。本发明的目的在于基于至少一个第一长时预测(LongTerm Prediction,LTP)模型的参数有效地确定第二长时预测模型的参数。
压缩编码器使用数字音频信号的特性,例如在短时预测滤波器中利用的数字音频信号的局部平稳性(Local Stationarity),以及在LTP长时预测滤波器中利用的数字音频信号的谐振结构(harmonic structure)。尤其是,语音信号中的浊音(例如元音),由于声带的震动,具有长时相关性。长时相关性的模型用LTP滤波器P(z)表示,使用如下类型的合成滤波器可以获取谐振结构:
H LT ( z ) = 1 1 - P ( z )
最简单形式的长时预测滤波器是滤波器具有单一系数β(也称增益)和整数延迟T,从而P(z)=βz-T。延迟T也称为“基音”周期,或者简单地称为基音)。
目前,更为精细的模型针对:
-使用多个系数(称为“多抽头(multitap)”)建模: P ( z ) = Σ i = - k k β i z - T - i ;
-或者使用多个延迟建模: p ( z ) = Σ i = - 1 k β i z - iT ;
-或者使用分数延迟,该分数延迟利用内插滤波器 P ( z ) = β Σ i = 0 2 l - 1 p i z - ( T - 1 + i ) 使用过抽样和欠抽样,其中,对于具有分辨率(resolution)为1/D的延迟(T+1/D),系数Pi(i)由Pi(i)=hinter(iD-1),0≤1≤D-1给出,hinter是长度为2ID+1的内插滤波器。
滤波器的参数(延迟和增益)随着被编码的信号的变化而变化并且对于同一个信号随着时间而修正。例如,在语音编码中,寻找基音周期的范围(span)以覆盖人的声音的基本频率的范围(从低音到高音)。对于同一个说话的人而言,该频率也会暂时发生变化。同样地,滤波器的系数也随时间发展而变化。
对于编码,P(z)的参数通过开环分析、或者闭环分析、或者二者结合进行测定。开环分析是通过使要被建模的信号中的预测错误最小而执行的。闭环分析(称为“综合分析”)是使要被建模的语音信号和合成信号之间通常加权后的均方误差最小。通常,先用开环搜索测定基音的第一估计值,称为“开环基音”。然后,在这个锚定值(anchoring value)周围有限的范围内进行基于综合分析的搜索,以便得到基音的更精确的值。这些分析在抽样的区块(blocks ofsamples)上实现。开环分析的样本块长度和闭环分析的抽样的区块长度不需要相等。通常,针对多个闭环分析执行单个开环分析。
对于任一个LTP模型(单抽头(monotap)或者多抽头),在计算复杂度方面,测定LTP参数的开销非常大。通常包含跟在抽样的几个子区域(也称为子帧)上的多个闭环之后的抽样的大的区块上的一个开环。尤其对于编码,对于谐振滞后(harmonic lag)的开环搜索是开销非常大的操作。通常,需要计算大量值的信号的(实际上是在延迟变化的范围上)自相关函数。在根据UIT-TG.723.1标准的编码器中,延迟的这个范围包含125个整数延迟(从18到142),并且开环延迟每15ms进行估计(也就是针对120个抽样值的区块)。UIT-TG.729标准中的8k比特/秒编码器,每10ms执行一次开环分析(在每一个具有80个抽样值的区块上),并且探测(explore)124个整数延迟的范围(从20到143)。这个操作占该类型编码LTP分析的复杂度的近70%。
即使闭环针对开环中产生的延迟,它的计算和资源开销也非常大。它需要生成自适应激励(adptive excitaion)以及它们的滤波。例如,在G.723.1编码中,使用多抽头LTP模型,闭环分析通过探测多个候选基音值的增益矢量库,联合测定每一个子帧的矢量增益(βi)和滞后λ(假设侯选基音的情况下)。这个分析将近占用5.3k比特/秒G.723.1编码器一半的复杂度。
当多个编码必须由同一个处理单元执行时,例如负责并行管理众多通信的网关,或者发布众多多媒体内容的服务器,LTP分析的复杂度特别重要。在网络上运行的压缩格式的多样性会使复杂度的问题显得更为突出。需要面对(envisage)多个或者级联(或者“代码转换”),或者并行(多格式编码或者多模式编码)的编码。在传输链中,当编码器发送的压缩信号帧不能用该格式继续传送时,典型的方式是采用代码转换。代码转换可将帧转换为与其余的传输链兼容的另外一种格式。最基本的解决方案(并且目前最普通)是相邻地连接一个解码器和一个编码器。第一种格式的压缩帧到达后解压缩。解压缩后的信号重新压缩为能够被其余的传输链接受的第二种格式。一个解码器和一个编码器的级联称为串联(tandem)。然而,这种解决方案,从复杂度(特别是由于重新编码)来看,开销非常大,并且降低了质量,第二次编码基于解码后的信号完成,解码后的信号是原始信号的衰减版本(degraded version)。另外,帧在到达目的地之前,可能遇到多个串联的解码器和编码器,因此会进一步增加计算的成本,并且进一步增加质量的损耗。再进一步讲,与各串联操作相关的延迟累积,并且对通信的交互性有害。
对于多格式压缩***而言,同一内容需要压缩成几种格式(尤其是为了适应接入条件,网络,各种各样终端用户的终端,使用不同的格式广播同一内容的内容服务器的情形下),随着需求的格式数量的增加,多编码操作变得极其复杂,并且可能使***的资源很快饱和。另一种并行多编码的情形是具有后验决定(posteriori decision)的多模式压缩,根据后验决定,在每一个要被编码的信号段,执行多种压缩模式,选择能够最优化给定准则或者得到最好吞吐量/失真折衷的压缩方式。这里,每一种压缩模式的复杂度限制了它们的数量和/或导致严格受限数量的模式能够被选择先验(priori)。
目前,绝大多数的多编码操作没有充分考虑编码格式之间的相似性,然而这可以减少复杂度和计算延迟,同时限制引入的退化。对于同一编码格式的参数,编码器之间的区别在于模型,程序和/或计算的频率,或者是量化。
通常,现有的技术方案,努力通过使用第一格式选择的参数限制针对第二LTP模型的参数所探测的值的数量,来减少针对第二格式的LTP搜索的复杂度。
两个单抽头LTP模型之间的代码转换是最简单的情形。目前提出的绝大程序关于延迟之间的代码转换,当两个模型是相同的(相同的延迟库和相同的子帧长度)在实际信号级(一种说法为“局部”串联)执行LTP增益的代码转换,将延迟的二进制字段从一个比特流简单地复制到另外一个比特流已经足够了。当库因它们的分辨率(整数或者分数1/3,1/6等),和/或它们的值的范围而不同时,使用可能的变换(transformation),代码转换到二进制或者参数域。变换可能是量化,截断(truncation),加倍(doubling)或者***(spliting)。当两种格式的子帧的长度不同,可能提供延迟的内插。例如,内插重叠输出子帧的第一格式的延迟。当后者与先前子帧得到的延迟比较接近时,才可能会使用内插的延迟,否则执行传统的搜索。另外一个不用内插的直接方法在于从第一格式的这些延迟中选择一个延迟。该选择依据多个准则进行:上一子帧,和第二格式的子帧具有最多的相同抽样值的子帧,或者使依据LTP增益的准则最大化的子帧。测定的延迟为针对第二格式延迟搜索的锚定值。这个延迟可能用作第二格式开环延迟,在该开环延迟周围进行传统的或者受限的闭环搜索,或者作为它的第一估计值,或者作为延迟轨迹(delay trajectory)的锚定。
对于在单抽头LTP模型和多抽头LTP模型之间代码转换的情形,由于模型的差异,目前仅有的实施只是在信号域。绝大部分现有的代码转换技术局限在,通过选择第一格式的一个延迟,或者这些延迟的一个内插作为开环延迟,从而减少第二格式开环的复杂度。然而,已经提出了一些技术,也减少闭环的复杂度。
在文件WO-03058407中,单型模型(monotype model)的分数延迟λ′通过基于多抽头模型的系数(βi)的矢量测定,如下式所示:
λ ′ = λ - Σ j = - 2 2 j β j 2 Σ j = - 2 2 β j 2
在参考文件[1]中,“An Efficient Transcoding Algorithm for G.723.1 andG.729A Speech Coders(一种G.723.1和G.729A语音编码器的有效代码转换算法)”,Sung-Wan Yoon,Sung-Kyo Jung,Young-Cheol Park,and Dae-Hee Youn,Proc.Eurospeech 2001,pp.2499-2502,多抽头模型的增益矢量的闭环搜索限制在多抽头增益库(dictionary of multitap gains)中由第一格式的单抽头模型的增益测定的子集中。测定以及子集的构造按照下述方法实现:计算增益库中每一个矢量的全局增益(global gain);在对应库中170个矢量的170个全局增益的基础上,建立8个子集,这些子集中的单个子集按照第一单抽头模型的LTP增益选择。
在依据“Transcoding algorithm for G723.1 and AMR Speech Coders:forInteroperability between VoIP and Mobile Networks”(G723.1和AMR语音编码器的代码转换算法:针对VoIP和移动网络之间的互操作性),Sung-Wan Yoonand al.,Proc.Eurospeech 2003,pp.1101-1104的参考文件[2]的变量中,子集的建立通过如下方法学习:NB-AMR编码器的单抽头增益的变量范围被分为8个子部分,接着,对于每一个子部分,在NB-AMR串联上统计分析(statisticalstudy)可测定G.723.1标准的编码器的库中的M个增益矢量。这些增益矢量从统计的角度讲具有最大的可能性。对于包含85个矢量的库,M等于40;对于包含170个矢量的库,M等于85。在搜索增益的最优矢量期间,对库的探测仅限于与NB-AMR编码器增益所属的子部分有关的子集。
就发明人目前的了解,还没有两种多抽头之间LTP模型之间的代码转换技术。如上所述,目前绝大部分的技术方案只与单抽头LTP模型有关。有些技术建议了多抽头模型和单抽头模型之间的代码转换技术,但是仅限于减少搜索第二格式开环延迟的复杂度。
在仅有的少数一些减少闭环复杂度的建议方案中,其中一些基于将单抽头LTP滤波器(分数的或者其他的)近似为多抽头LTP滤波器。例如,近似多抽头滤波器的情形:
P multi ( z ) = Σ i = - k k β i z - T - i
通过非分数单抽头滤波器Pmono(z)=βz-(T-δ),估计增益β和延迟抖动δ,从而考虑所有的整数延迟T,使 P multi ( z ) ≅ P mono ( z ) .
利用单抽头LTP模型的多抽头LTP模型的近似在UIT-T G.723.1中已经使用了,实际上是估计自适应预滤波器,并且还控制LTP滤波器的不稳定性。在设计G.723.1标准的编码器中所进行的研究表明,在延迟的宽范围上,不是总可能用相同的增益β和相同的延迟抖动δ很满意地通过单抽头滤波器近似多抽头滤波器。对于同一增益矢量(βi),最优组合(β,δ)的估计值作为延迟T的函数变化很大。G.723.1标准的编码器中,已经有可能克服这个困难,因为稳定控制过程从估计的增益(它们可能很不相似)中挑选出最大的增益,并且当在相关的延迟范围上,当估计的增益极其不相同,或者延迟中的抖动太不相似或者太大时,对于多抽头模型的任一增益矢量禁用自适应预滤波器。如果自适应预滤波模块和长时预测滤波器不稳定性控制模块能够克服估计的困难,并且不降低性能,这些优点更加难以用LTP分析模块本身实现,LTP分析模块扮演着关于质量的重要角色。因此,参照所考虑的增益矢量和/或延迟,为库中170个条目(entry)中的每一个矢量计算的170个全局增益,参见上面的现有技术[1],可能远远不是最优增益。同样地,参照增益矢量(βi)和/或延迟λ,参考现有技术WO-03058407,分数延迟λ′的计算可能导致分数延迟的不良测定。
无论是分析还是统计的方法,在大范围的延迟上,利用单抽头LTP滤波器近似多抽头LTP滤波器(或者相反的近似)太不精确。为了解决这个问题,为了考虑增益β和/或抖动δ根据延迟T的变化,有可能需要对每一个延迟T保存一对(β,δ)。然而,这个解决方案因为需要为每一个增益矢量和范围上的每一个延迟保存一对(β,δ),所以在存储方面开销太大。在G.723.1编码器的多抽头LTP滤波器近似中,具有125个延迟范围,包括170个矢量和85个矢量的两个库,将要存储31875(=125*(85+170))对。并且,该技术方案不能解决用单抽头近似多抽头太不精确甚至错误的情形。需要指出的是,相反地,几对(β,δ)也可能构成多抽头LTP滤波器的很好的近似。
本发明目的在于改善这种状况。
首先,本发明的目的在于,从单系数(单抽头)LTP模型切换到多系数(多抽头)LTP模型,反之亦然,以及在两个多抽头模型之间切换。特别是,本发明提出了一种其复杂度可调的方法,尤其是作为在目标复杂度和所需质量之间的理想折衷的函数。用于实施根据本发明的方法的设备对于级联的多编码(代码转换)或者并行的多编码(多编码或者多模式编码)是非常有用的。
因此,本发明的第一个目的在于提供一种在通过实施根据第一格式编码的至少一个步骤获得的信息的基础上根据第二格式进行编码的方法。尤其是对于语音信号编码,所述第一和第二格式通过试探包含备选参数的至少一个库实施搜索LTP长时预测参数的步骤,为了更精细地搜索LTP参数,第一和第二编码格式至少之一使用具有多系数的滤波(以上所述的“多抽头”)。
根据本发明的一般概念,该方法包括以下步骤:
a)定义第二编码格式使用的至少一个库的分级;
b)恢复在确定在根据第一格式的编码过程中的LTP参数的之后得到的先验信息以选择所述库的至少一个分级;
c)将选择分级应用到所述库中的备选者上以选择有限量的第一备选者;和
d)为了实施第二编码,只在所述有限量的备选者中执行LTP搜索。
因此,本发明通过在库中分级的定义和在库的试探过程中使用这些分级而与现有技术不同。
通过研究下文中的详细描述和所附的附图,本发明其他的特征和优点将变得非常明显。
附图说明
图1a是本发明提供的一种使用了用于根据第二格式编码的设备的智能代码转换***的示意图;
图1b是本发明提供的一种使用了参照第二格式的编码设备的多编码***示意图;
图2是本发明提供的方法的主要步骤;
图3是本发明提供通过编码设备实施的器件的示意图;
图4a是CELP编码器(代表“码激励线性预测”)的示意图;
图4b是根据UIT-TG.729的编码的LTP分析的步骤;
图4c是根据UIT-T G.723.1(6.3k比特/秒)标准的编码器的LTP分析的步骤;
图5a是根据UIT-T G.723.1标准(30ms)的编码器的帧和根据UIT-T G.729(10ms)的编码器的帧之间的对应关系的示意图;
图5b是根据G.729编码器(5ms)的编码器的子帧和根据G.723.1编码器(7.5ms)的子帧之间的对应关系的示意图;
图6是基于G.723.1基音值的G.729的开环基音搜索;
图7a和图7b分别是在G.729编码器的偶数(相应地奇数)子帧和来自根据第一格式的编码器的G.723.1编码器的LTP参数序列之间的相互关联;
图8是G.723.1(右栏CD)的子帧与G.729(左栏CG)的子帧之间的关联表;
图9a和图9b是库(初始,在图9a中为85个矢量,在图9b中为170个矢量)中的试探的减小后的数量的直方图(沿纵坐标是出现的数量),以及根据CELP准则保证质量降低少于1%;以及
图10是在具体实施例中当构造几个分级时的第二库的N个元素的选择的示意图。
具体实施方式
因此本发明属于级联或者并行的多重编码,或者使用单抽头或者多抽头的建模以表示信号的长时预测的任何其他***。在两个模型中至少一个使用多抽头模型的情况中,本发明可以基于第一模型参数的知识确定第二模型的参数。为方便起见,仅仅描述从第一模型到第二模型转换的情况,但是应该理解,本发明还应用在从m(m>=1)个第一模型到n(n>=2)个第二模型的转换的情况中(其中m和n是自然数)。
参照图1a和图1b,进而考虑与两个编码***COD1和COD2对应的信号的两个LTP模型的情况。这涉及特别是通过智能代码转换以级联(图1a)从第一编码***COD1到第二编码***COD2的转换,或者通过优化多重编码(图1b)以并行从第一编码***COD1到第二编码***COD2的转换。第一编码器对给定信号(比如原始信号S0)执行其编码操作。从而,可以得到第一编码器选择的表示为LTP1的LTP参数。该编码器通过在编码处理中其自身的技术确定这些参数。第二编码器COD2必须同样地执行其编码。在代码转换的情况下,只有第一编码器COD1生成的进而包含参数LTP1的二进制编码的二进制序列BS1对第二编码器COD2是可用的。本发明从而可以应用于智能代码转换。在多并行编码的情况中,第一编码器COD1可用的原始信号S0(或者衍生版本)对于第二编码器COD2也是可用的,并且本发明可以应用于智能多编码。很明显,本发明还可以应用于多并行编码的具体情况中,即具有后验决定的多模式编码。
本发明属于在两个模型中至少一个是多抽头模型的情况中,从另一LTP模型的至少一个LTP1参数确定表示为LTP2的LTP模型的参数。代替在其定义集(或者“库”)中搜索第二编码格式的参数,本发明现在参照图2,提供下述步骤:
-在第二编码格式的库DIC2(图2中的标号25),初始确定序列ORD1,ORD2,.....(图2中的步骤25b),
-基于第一编码格式的至少一个参数LTP1,选择第二格式的库的至少一个序列(DIC2)(步骤26)。
-在步骤27中,获得库元素的有序的序列ei 2,ej 2,ek 2,......
-有利的是,试探(exploration)限于已经分级的库DIC2中的第一元素ei 2,ej 2,(步骤29),优选地是在步骤28中根据所需的质量/复杂度折衷(目标质量/允许的复杂度)选择元素号码。
这样,应该理解,通过实施本发明,可以限制在第二编码COD期间LTP搜索所属的第二库DIC2的元件的数量,同时保证编码COD2的高质量。在图2中,分别在第一编码器COD1和第二编码器COD2中执行的操作分为两个模块20和24,库DIC2(标号25)为第二编码器COD2可用的。在该侧,在步骤21中第一编码器COD1使用至少其自己的库DIC1(步骤22)确定参数LTP1。这样,应该理解,第一编码器COD1典型地基于原信号S0确定其参数LTP1的方法构成了先验信息(priori information)(步骤23),第二编码器使用该信息对其库DIC2分级。最后,通过在本发明的范围内应用第二编码器的库的分类获得的参数LTP2(步骤30)其本身将可以适于为根据又一第三编码格式(没有示出)的库分类服务,等等,以及进而为级联代码转换或并行多编码服务。
应该注意,所给图2仅仅是示例目的。例如,库DIC2的元素ei 2,ej 2,ek 2,…,的显示并不是后面将看到的实际显示。另外,在同一步骤中基本上结合执行在作为质量/复杂度准则(步骤28)的函数的搜索中所要考虑的库DIC2的分类(步骤25b)和其元素的限制。最后,图2中所示为第一编码器COD1向第二编码器COD2发送先验信息(步骤23)。然而,作为变型,第二编码器COD2可以从第一编码器简单地恢复第一编码器已经确定的LTP1参数的二进制编码,并通过第一编码器COD1使用的编码类型和库的具体知识获得先验信息。
图3中所示为在本发明范围内用于根据第二格式编码的装置。该装置通过根据第一格式实现编码使用编码信息(这里根据第一格式COD1从编码恢复的参数LTP1)。本发明范围内的装置包括,示例中所示的:
-存储器MEM,用于存储对应表,该表作为由第一编码格式确定的LTP1参数的函数定义了第二编码格式使用的库的分级(orders)。
-诸如界面31的器件,用于恢复给出在根据第一格式的编码过程中的LTP1参数基础上的至少一个先验信息的信号。
-在接收到所述信号时活动的器件32,用于查阅所述对应表并且选择第二格式的库的至少一个分级。
-计算器件,比如处理器35,用于:
*根据所选的分级(order)对第二格式的库33进行分级,从而由库33中选择有限数量的最初的备选者;和
*根据第二格式,并且如果适当的话用其他模块34,通过仅仅在该有限数量的备选者中执行LTP搜索,继续编码。
当然,处理器35管理该设备的所有或者一些模块。为此,其可以是计算机程序产品驱动的。本发明进一步目的为该计算机程序产品,该产品存储在处理器单元的存储器中,或者与所述处理单元的阅读器协作的可移动介质上,或者该产品是可以从远程地址进行下载的,并且包含用于实现本发明方法的所有或者一些步骤的指令。
应该具体理解,在本发明范围内,设备COD2可以直接恢复第一编码器COD1的LTP1参数,从而推导出所述的先验信息,进而是其库DIC2的分级,或者,作为变型,从第一编码器COD1直接接收关于其库的分级的先验信息。在后面的情况中,第一编码器COD1已经在本发明中起了具体作用。
本发明的目的还在于一种***,该***包括第一编码器和本发明范围内的设备。特别地,图3中的设备可以加入到编码***中,该***实现至少一个第一和一个第二编码格式。然后该***包括至少一个用于根据第一格式COD1编码的设备,和用于在本发明范围内编码然后应用第二格式COD2的设备。因此,本发明目的在于该***。如图1a中所示,用于根据第一格式编码的设备和用于根据第二格式编码的设备可以级联设置,用于代码转换。作为变型,如图1b所示,用于根据第一格式编码的设备和用于根据第二格式编码的设备可以并行设置,用于多重编码。
在本发明的实现中,假设第二编码器COD2可以从第一编码器COD1中恢复(当后者已经确定参数LTP1时)使其能够对它的库DIC2分级的信息(见图2)。从而,可以仅在这样分级的库DIC2的第一元素(ei 2,ej 2)进行LTP搜索,从而保持对第二编码的高质量。
有利的是,利用对第二库DIC进行分级可以为要被试探的分级后的元素的数量提供更大的弹性。然后,可能:
-自由调整质量/复杂度折衷;
-另外对于给定复杂度,优化质量;
-或者相反地,对于给定质量使复杂度最小化。
该调整可以在处理的开始时执行。还可以在要处理的每个区块中执行,作为第一编码格式的参数和/或要被编码的信号的特征的函数(例如,作为清浊音准则(voicing criterion)的函数)。对同一个区块,复杂度还作为LTP子帧的函数而变化。本发明提供了更大的弹性,从而可以动态分布第二编码器的模块之间可用的计算能力和/或资源,从而处理LTP子帧。
优选地,基于与第一LTP模型的参数相关联的库DIC1的初始划分,确定与第二LTP模型参数关联的库DIC2的分级。很明显,分级的确定包括根据特定准则对第二库DIC2的元素进行分级。通过库DIC2元素的目录给出等级(ranking)(或者“分级”)。
可以了解一下第一库DIC1的划分的几种类型。第一示例是N个元素的DIC1库的元素的示例性划分为大小为1的N个不相交的类。然后确定第二库的N个等级。可以选择更精细的划分,尤其是通过量化或者数据分类的公知技术(矢量或标量)。
有利的是,相似的分级可以一起构成组,该相当于修改第一库的初始划分,以及随后的第二库的分级的数量。一旦他们已经一起形成组,还可以重新计算分级。用于确定第一库划分为N类和计算第二库的N个分级的过程可以是迭代的,而且在迭代的过程可以改变数字N。作为变型或者补充,限制用于存储第二库的分级的存储器,针对这些分级的每一个分级,选择要被保持的元素的最大数量,该数量可以根据第一库的分级和/或分类而不同。
在进一步变型中,第一库的分类不必是不相交的。典型地,同一元素可以与第二库中多于一个分级相关联。然后,分级的选择和分级的组合可以考虑除了第一库的当前LTP参数以外的因素(factor)。
开始,通过统计和/或分析研究确定适于第二库的分级的数量和分级,作为根据第一模型的LTP参数的逐次序列的函数。从而该研究为与第一格式的LTP参数相关联的库的划分的每一分类定义第二格式的参数库的等级。在离线的集(off-line bank)通过关联同一分级的第一格式的LTP模型和第二格式的LTP模型执行统计研究。两个LTP分析并行设置为优选的学习配置(learningconfiguration)。当然,可以使用其他配置,具体,级联两个编码的传统串联。统计研究根据特定准则,为第一库的每一元素(或者其划分的每一类)保证第二库元素的等级。优选地,该准则估计对获得的信号的质量的影响。特别地,质量准则可以使用在编码中以选择第二LTP参数。当然,可以使用其他准则,具体地,为第一库的分类调用第二库的元素。而且,还可以使用准则的组合。
还可以执行分析研究以判断确定第二库的分级,作为第一库的划分的函数。优选地,该分析研究完成上述的统计研究。优选地限于满足分析近似的库的部分。
下面介绍在根据第一编码格式的LTP参数基础上确定第二编码格式的LTP参数。
在用于已知第一编码格式选择的LTP参数限制第二库的试探的算法设计框架内,优先使用第一库的划分和与第一库的划分相关联的第二库的分级。
为了介绍清楚,首先介绍当两个编码格式具有相同持续时间的LTP子帧时使用的算法的原理。每个第二编码格式的当前子帧对应一个第一编码格式的子帧。对该第一子帧,第一编码格式选择了LTP参数序列(称为“第一序列LTP1”)。由于与第一模型的LTP参数中的一个相关联的库的划分,通过选择与第一序列LTP1的元素的分类相关联的分级选择第二库的试探的分级。然后,根据这样确定的分级试探第二库。而且,作为质量/复杂度折衷的函数和/或可能为该分类保留的第二库元素最大数量的函数,限制被检测的元素的数量。通常,假设在第二库的所有元素中,仅检测通过已经选择的分级确定的第一元素。
当两个编码格式具有不同持续时间的LTP子帧时,可以将第二格式的当前子帧对应于第一格式的多于一个子帧。该情况如作为示例的图5b中所示。对于这些第一子帧,该第一编码格式选择LTP参数的多个序列。由于与第一模型的LTP参数中的一个相关联的库的划分,通过选择与第一序列元素的分类相关的分级预先选择第二库的试探的分级。可能出现如果为第一子帧选择的参数属于和第一库的划分相同的类,那么最后选择单一分级。然而,这是特殊情况。这将使我们回到对应相同持续时间的LTP子帧的前面方案。如果,方便的话,预先选择多于一个分级,可能保存仅仅一个分极(比如最预先选择的分级),或者其它对应第一格式子帧的分级,该子帧最多覆盖第二格式的当前子帧。
基于第一库的划分的LTP参数的类型,可以采用其他准则。取代保留仅仅一个分极,其他方案包括组合各种预先选择分级中至少一些。可以有几个组合的过程。例如,如果保留了K个分级,那么首先检测K个分级中每个分级的第一元素,同时消除任何冗余。获得K1个元素(K1≤K)。然后,添加由K个分级的第二元素构成的集(set)中选择K2个元素,从而K2≤K且K2≤N-K1,等等,并且直到获得N个元素,N等于第二库中将要检测的元素的最大数量。在图10中已经示意性示出了假借K个分级ORD1,ORD2,......,ORDK的第一元素选择出的N个元素ei,ej,...,ek,...。可以选择保存在集ENS中的元素的数量N,例如作为最大允许复杂度的函数。在该等级中,还可能偏爱最经常分等级在第一元素中的那些元素。
作为变型,还可以通过预先选择每个等级Ci(1≤i≤K)的Ni(≤N)个第一元素,构成等级的K个子集。选择Ni,从而∑Ni≥N,并且可能公正地处理等级,或者,相反地,偏爱特定等级。然后选择出现在K个子集中的所有元素和然后出现在K-1个子集中的元素,等等,直到保持N个元素。如果没有获得N个元素,通过,例如,连续取K个子集中的顺次的元素,完成元素的数量。
当然可以组合这些等级策略中的一些。很明显,在通用方式中,优先根据这样确定的“动态”分级试探第二库。当划分的类不相交并且第一库的元素属于多于一个类时,还可以应用用于从预定存储的分级中构造动态分级的过程。
下面是从第一LTP模型切换到第二LTP模型的三种情况,示出了本发明在各种模型和各种类型LTP参数的应用。当然,虽然所给示例仅仅用于第一和第二库,但是本发明可以容易地概括到多于一个第一和/或第二库。
从单抽头模型到多抽头模型切换的情况
格式COD1的单抽头模型的参数是可用的,并且寻找以最小的计算和/或资源代价确定格式COD2的多抽头模型的参数。对于每个子帧,编码器COD1确定单抽头LTP滤波器的参数对(λe,βe)。COD2子帧的编码需要确定多抽头LTP滤波器的参数对(λs,(βi)s)(其中i为增益标号(gain index))。因此第一模型的参数序列为(λe,βe)。第二模型的参数序列为(λs,(βi)s)。
通过一个已知现有技术过程可以确定延迟λs。例如,可能使用智能代码转换过程,该过程直接通过选择由COD1在与COD2的当前子帧共享最大抽样的子帧中确定的延迟作为延迟确定该延迟λs,(如果该延迟λe是分数,取其整数部分或者最接近的整数)。下面具体参照图7a和7b详细介绍该情况。
然后对于COD2的每个子帧,在本发明范围内以低复杂度,在COD1子帧的至少一个增益βe的基础上,确定增益矢量(βi)s。通过关联两个LTP模型的研究,执行第一库的划分(这里标量增益βe的库)。然后确定与该划分关联的第二库的分级。这些分级这里对应增益矢量(βi)s的全集(whole set)。在第一格式COD1为其与COD2的当前子帧相对应的子帧选择的标量LTP增益βe的基础上,预先选择与标量增益的分类相关联的第二库的分级。然后,保留这些分级中的一个分级,或者另外,动态地构造一个分级。最后,测试通过该分级确定的增益的第一N矢量,以选定最佳矢量(根据诸如通用CELP准则的准则)。可以想到,由于分级的作用,数量N作为例如所需质量/复杂度折衷的函数可以容易地调整。通常,N远远小于第二库的大小。
根据本发明的一个优点,在第一格式的单抽头LTP滤波器的至少一个增益的基础上,从而确定第二编码格式的多抽头LTP滤波器的增益的最佳矢量,同时相当地减少试探增益矢量的第二库的复杂度并且同时限制要被检测的增益矢量的数量。对比这里所给参考文献【2】,对于每个单抽头增益,关联固定大小的增益矢量的子集,本发明范围内的解决方案使作为目标质量和复杂度约束的函数调整库的试探成为可能。应该理解,本发明比上述参考文献中的预定的且固定的子集需要增益矢量库的各种分级的更多参与。
在下面作为实施例将要描述的从8-kbit/s UIT-T G.729编码器到6.3-kbit/sUIT-T G.723.1编码器的智能代码转换的情况中,这里的步骤将应用于关注在G.729编码器的LTP增益的基础上,在G.723.1的两个增益矢量库之间闭环搜索。
从多抽头模型到单抽头模型的切换的情况
该具体情况是前面情况的倒转。第一格式COD1的多抽头LTP模型的参数为可用,并且寻求以最小代价确定第二格式COD2的单抽头LTP模型的参数。当写入第二模型的参数序列(λe,(βi)e)时(其中i是增益标号),进而写入第一模型的参数序列(λs,βs)。在第一编码器COD1选择的至少一个参数序列的基础上,寻找以获得格式COD2的延迟λs和增益βs。从关联两个LTP模型的研究中,执行第一库的划分,在该情况中,该第一库为增益矢量(βi)e的库。然后在本发明的范围内,确定与第一库的划分相关的第二库的分级。这里,第二库包括抖动(jitter)值(λe-λs)的全集。在第一格式COD1选择的增益矢量(βi)e的基础上,对于对应COD2当前子帧的子帧,预先选择与这些增益矢量的分类相关联的第二库的分级。这里,可以保留这些分级中的一个,或者另外,动态地构造一个分级。最后,试探围绕一个或者多个锚定延迟λs′这样确定的“周边”值。通过现有技术中公知的过程确定锚定延迟(s)。
本发明从而提供了一种原创的解决方案,该方案使得基于第一编码格式的多抽头LTP模型的参数的知识,通过减少第二编码格式的单抽头LTP模型测试的延迟值的数量,减少确定延迟λs的复杂度成为可能。大部分现有技术过程仅仅使用延迟,不使用增益矢量。如在专利WO-03058407所述,这里使用两种类型的参数。然而,与最后的参考文献相比,增益矢量指的是几个抖动值的集,而不是在该参考文献中的单个值。根据本发明提供的优点其中之一,进而解决了关于由单个单抽头滤波器近似多抽头LTP滤波器的问题。
在一个有益的变型中,为了限制存储,分级后的邻域值为增加大小的间隔。该测量对于聚焦开环和/或闭环搜索尤其具有优点。后面将介绍一个实施例,涉及在6.3kbit/s UIT-T G.723.1编码器的LTP参数的基础上对于8-kbit/s UIT-T
G.729编码器的LTP延迟的闭环搜索。
从多抽头模型到多抽头模型切换的情况
据发明人所知,在现有技术中从没有研究过该情况。
第一格式COD1的多抽头模型参数为可用,并且寻求以最小代价确定第二格式COD2的多抽头模型的参数。因此,写入第一模型的参数序列(λe,(βi)e)。也写入第二模型的参数序列(λs,(βi)s)。在第一格式COD1所选的至少一个参数序列的基础上,寻求获得第二格式COD2的延迟λs和增益矢量(βi)s
通过现有技术公知的过程,在至少一个延迟λe的基础上确定延迟λs。假设,本发明的应用使得在第一格式COD1的子帧的至少一个增益矢量(βi)e的基础上,对于第二格式COD2的每个子帧,以低复杂度确定增益矢量(βi)s成为可能。通过关联两个多抽头LTP模型的研究,在本发明范围内执行第一库的划分,在该情况中第一库为增益矢量(βi)e的库。然后确定与该划分相关联的第二库的分级。在第一格式COD1选择的增益矢量(βi)e的基础上,对于对应第二格式COD2当前子帧的子帧,预先选择与这些增益矢量的分类关联的第二库的分级。从而,保留这些分级中的一个,或者另外,动态地并且渐进地构造一个分级。最后,测试通过该分级确定的第一增益矢量以选择最佳的。
下面介绍,描述UIT-T G.723.1编码中比特率6.3kbit/s和5.3kbit/s之间后者情况的示例性实施例。
示例性实施例
下面所示为三个示例性实施例,旨在说明在两个情况中的第一个情况下的两个不同编码格式UIT-T G.729和UIT-T G.723.1之间的代码转换,和在后一种情况中在多速率编码器(UIT-T G.723.1)中比特率的变化。首先给出这两个UIT-T编码器和他们LTP建模的描述。
8kbit/s的UIT-T G.729编码器和UIT-T G.723.1编码器(6.3kbit/s和5.3kbit/s)
这两个编码器属于CELP编码器族,该编码器基于综合分析。
基于综合分析的编码器
在这些编码器中,分析模型用于提取参数,该参数用于对要被编码的信号进行建模。这些信号以电话频率(Fe=8kHz)或者更高的频率抽样,例如对于宽带编码(从50Hz到7kHz的带宽)以16kHz进行抽样。根据应用和所需质量,压缩系数从1到16,从而这些编码器在电话带中工作在2到16kbit/s比特率,在宽带中工作在6到32kbit/s比特率。图4a中所示为CELP类型的数字编码和解码设备,该编码器基于目前最广范地用于编码语音信号的综合分析。语音信号S0被抽样并转换为一串抽样区块(L′),叫做帧。通常,每帧分作抽样的更小区块(L),叫做子帧。通过用两个时变滤波器对从增益放大后的内容(也叫做固定激励库)中提取的波形进行滤波分析每个区块。该抽取库是L抽样波形的有限集。第一滤波器是长时预测滤波器。“LTP”(长时预测)分析可以估计该长时预测器的参数,该长时预测器使用浊音的周期性。该预测器等同于存储各种延迟的过去激励的库。该库通常叫做“自适应激励库”。第二滤波器是短时预测滤波器。“LPC”(线性预测编码)分析过程使获得这些短时预测参数成为可能,该参数为声道的传递函数的表示并且是信号的频谱的特征。
这样,参照表示CELP编码器基本图的图4a,语音信号S0进行LPC分析41(没有详细示出),并且LTP分析与固定激励46和自适应激励45的内容的构造一起馈送至合成滤波器44。然而,在这样构造的环中,包括感知加权模块42和误差最小化模块43。
因此用于确定新息序列的方法是综合分析。在编码器,通过两个LTP和LPC滤波器对大量新息序列进行滤波,而且所选波形是根据通常称为CELP准则的感知加权准则生成最接近原始信号的合成信号。
8kbit/s的G.729的LTP模型(单抽头)
UIT-T G.729编码器工作在限于分段频带3.4kHz的语音信号,以8kHz抽样并且分为10毫秒的帧(例如,每帧80抽样)。每帧分为40抽样(5毫秒)的两个子帧(下面编号为0和1)。UIT-T G.729编码器的LTP模型是基于具有分数分辨率的单抽头模型。在每帧中,LTP分析为每个子帧确定延迟λi和增益βi。图4b所示为其中主要步骤。在每帧中,在值【20∶143】的范围中执行对开环延迟的搜索,表示为λOL(步骤401)。然后,在开环延迟λOL周围[λOL-3,λOL+3]的范围中以闭环搜索第一子帧的延迟(步骤402)。进而,通过使用基于综合的分析,用在范围
Figure A20068000317900241
中的1/3分数分辨率并且在范围[85;143]的整数分辨率下,确定偶子帧的延迟λ0
然后,用1/3分数分辨率通过在范围[int(λ0-52/3);int(λ0+42/3)]内关于λ0的综合分析确定第二子帧的延迟λ1,int(λ0)是可能的分数延迟λ0的整数部分(步骤404)。对于每个子帧,一旦确定了闭环延迟就计算增益β(步骤403和405)。在针对固定激励的搜索之后,通过以7比特的矢量量化和固定激励的增益一起量化增益β。从而,G.729的单抽头LTP增益的有限集(或者库)大小为128。
G.723.1的LTP模型(多抽头)
UIT-T G.723.1的编码器工作在限于分段频带3.4kHz的语音信号,以8kHz抽样并且分为30毫秒的帧(例如,每帧240抽样)。每帧包括4个7.5毫秒的子帧(60抽样),4个子帧两个一组分组为15毫秒的超级子帧(120抽样)的两组。UIT-T G.723.1的编码器使用5个分级的多抽头模型。对于6.3-kbit/s模式,通过预先存储有85条或者170条的两个库对长时预测器的系数进行矢量量化,而对于5.3-kbit/s模式使用仅仅170条的库对长时预测器的系数进行矢量量化。在6.3-kbit/s模式中,库中被试探的选项取决于偶子帧的延迟值。
图4c所示为G.723.1编码器的LTP分析的主要步骤。在每帧中,执行两个开环LTP分析(每个超级子帧一次)以在范围【18;142】内估计120抽样的各块的延迟λ′OL(i=0或者1)(步骤410)。然后,对于每个超级子帧,执行两个闭环LTP分析(每个超级子帧一个)。在范围【λ′OL-1;λ′OL+1】内以闭环搜索偶数子帧(子帧0和2)的相应延迟λ′OL。与该搜索一起,还通过综合分析试探增益矢量库(步骤411)。对于奇数子帧(子帧1和3),执行类似搜索(同时搜索增益矢量和以闭环搜索延迟),并且在闭环中对于延迟λ2i+1-1的搜索限于前一子帧的闭环延迟的附近【λ2i+1-1;λ2i+2】(步骤412)。
第一示例性实施例:在8-kbit/s的G.729的单抽头LTP参数的基础上确定6.3-kbit/s的G.723.1的多抽头LTP参数
如图5a中所示,通过采用通常的公共时间起点,G.723.1编码帧对应三个G.729编码帧。从而,很明显,G.729的子帧并不与G.723.1的子帧一致,但是正相反,后者(7.5ms)重叠前者(5ms)。图5b所示为G.723.1编码帧和三个G.729编码帧以及他们各自的子帧。G.723.1帧的子帧从0到3编号。G.729的三个帧一起构成一组,并且他们的子帧从0到5编号。
多抽头滤波器的延迟的确定
该延迟的确定是直接的。这样,对G.723.1的偶数子帧,也就是子帧0和2,采用与G.729的子帧1和4的延迟的整数部分相同的延迟。对于奇数子帧,在上述延迟(偶数子帧)附近执行闭环。该闭环等于G.723.1的闭环,但也是根据所需复杂度受到限制的,或者甚至被消除从而在两子帧,偶数和奇数中保持相同的延迟值。
多抽头滤波器的系数的确定
这里,仅仅考虑一个第一库,即G.729的128单抽头LTP增益集,反之,考虑两个可能的第二库(G.723.1增益矢量的两个库,根据子帧的延迟进行选择)。
一旦确定延迟,仍然要在G.723.1编码器选择的5个系数的矢量库中确定5个增益的矢量。本发明的应用使得将其试探限制于在G.729编码器的子帧的单抽头LTP增益基础上确定的有限量的增益矢量成为可能。
通过在同一编码器中关联G.723.1编码器的多抽头模型和G.729编码器的单抽头模型预先执行统计研究。该研究使对于每一个G.7291的128个单抽头LTP增益,根据他们对恢复的信号的质量的影响,对G.723.1的两个库的多抽头LTP增益的170个矢量和85个矢量进行分等成为可能。这里,CELP准则用于该目的。对于G.723.1两个库中的每个,进而已经获得与128个单抽头LTP增益集的基本划分相关联的128个分级(或者等级)。
G.723.1的每个子帧覆盖(至少部分地覆盖)G.729的两个子帧。首先,提取对应G.729子帧的这两个子帧的两个单抽头增益(表示为g1和g2)。这两个增益中的每个都关联多抽头系数的矢量库中的矢量等级C(gi)。通过G.723.1的偶数子帧的延迟值选择该库。
设N是G.723.1编码器当前子帧的多抽头增益矢量的允许的最大数量。如果G.729的两个增益相等,因此这里仅有一个等级,并且保留通过该增益矢量库的等级对元素的分级。否则,从两个不同的分级构造N个元素的分级。例如,通过预先选择他们的第一元素N1和N2(分别地)构造等级C(g1)和C(g2)的两个子集。N1和N2小于或者等于N。两个等级(N1=N2)可以被等同处理,或者可以偏爱其中一个。例如,可以偏爱与最大单抽头增益(典型地,如果g1>g2,那么0≤N1≤N2≤N)相关联的等级。还可能偏爱其G.729子帧与所考虑的G.723.1子帧重叠最大的等级。然后,首先选择属于两个子集的所有元素。通过在两个子集中交替地取出在其余元素中分等最好的元素,将形成库的集补充到N。这里,还可能通过补充以偏爱两个子集中的一个。当然可能组合这些策略中的一些。例如,选择N1=N2但是在选择公共元素之后,在可能补充其他等级的其余元素之前继续两个等级中的一个等级的其余元素。该策略还可以根据所考虑的G.723.1的子帧变化。
最后,对增益矢量库的试探限于通过这样构造的“动态”分级确定的N个矢量。该聚集的试探使选择最佳增益矢量成为可能。优选地,选择准则为通常由G.723.1使用的CELP准则,该准则用于试探具有5个LTP系数的矢量库。这里提出的解决方案允许大大减少G.723.1的LTP分析的复杂度,然而并不降低质量。作为性能的示例,对于两个库,图9a和9b表示试探的大小的直方图,该图保证相对于完全试探CELP准则中的损失严格少于1%。应该注意,试探的大小(沿着横坐标)是远远小于库的总的大小。这样,对于具有85个矢量的库,平均大小是39,对于170个矢量的库,平均大小是49。以使用的内容为基础,统计研究表明,甚至对于远远小于库的大小的平均试探大小(48代替85,49代替170),可以根据CELP准则(实际上在CELP准则中没有损失)优化受限的试探。聚集后的搜索导致与彻底搜索等效的性能,同时几乎试探不多于大小为85的库的一半和大小170的库的三分之一。这些数字清楚说明通过实现本发明得到的复杂度降低。
另外,对于两个库,128个分级的全部存储表示总共要存储128×(170+85)=32640个索引值。实际上,没有必要保留所有这些值,因为如上所述,仅仅有限的数量是必要的。这样,对于CELP准则中的零损失,试验显示足够存储大约13582个索引。通过选择CELP准则中的更弱的约束,该数量可以再次减少(降到11251,对于1%的损失)。通过采用单抽头增益集的除了基本划分之外的划分可以再次大大降低。
第二示例性实施例:在6.3-kbit/s的G.723.1的多抽头LTP参数的基础上确定8-kbit/s的G.729的单抽头LTP参数
与上述实施例正相反,G.723.1帧的多抽头LTP模型参数为可用,并且寻求获得三个帧的G.729的单抽头LTP参数,也就是6个子帧(见图5b)。
开环延迟的确定
取消开环搜索。为此,三个G.729帧的每个帧首先采用G.723.1编码器子帧中的一个子帧的延迟作为开环延迟。图6中所示为G.729的帧和G.723.1的子帧之间的对应。
然而,应该注意,G.723.1编码器选择的延迟可以在G.729编码器允许的值的范围之外。特别地,G.729编码器允许的最小值是19,而G.723.1编码器是18。对于避免该问题,可以有几种解决方案。典型地,例如,可以将从G.723.1编码器得到的延迟翻倍,或者更简单地将其加1。
闭环延迟的确定
一旦对于G.729编码器的三个帧固定了开环延迟,那么可以对每个子帧执行闭环搜索。可以想到值的范围为:
λ0∈[λOL-3;λOL+3]和 λ 1 ∈ [ int ( λ 0 - 5 2 3 ; int ( λ 0 + 4 2 3 ]
对于G.729编码器的基本闭环搜索包括首先连续地测试范围中所有整数值(对于λ0为7,对于λ1为10)。一旦选定了最佳整数值,测试各种分数(-2/3,-1/3,1/3,2/3)以根据所选准则确定最佳的分数,在这种情况下,为最大化CELP准则那个分数。对于偶数子帧,应该注意,仅仅当整数部分λ0小于85时搜索分数部分。
这里,第一库(上述给定的本发明的定义)是G.723.1编码器的两个LTP增益矢量库中的一个,第二库是锚定延迟附近的相邻整数值(或者抖动)的两个集中的一个。然后应该理解,一个方面,本发明可以容易地应用到多于一个第一库,另一方面可以应用于多于一个第二库。
为减少锚定值λ′附近的整数值(λOL或者int(λ0))的闭环搜索复杂度,提出,在本发明范围内,限制通过闭环测试的整数延迟值的数量。根据由G.723.1作出的LTP增益矢量的选择,仅仅测试减小后的数量值。在该受限的集中确定整数延迟。然后,以常用方式搜索分数部分。
通过在同一编码器内关联G.723.1的多抽头模型和G.729的单抽头模型预先执行统计研究。该研究使对于G.723.1的两个多抽头LTP库的每个增益矢量,根据他们对恢复的信号的质量的影响,为G.729(偶数和奇数子帧)周围的两个闭环搜索建立邻域值重要性分级成为可能。该分类使其可能根据质量和复杂度约束选择值的数量,并且对于G.729六个子帧的每一个,限制根据G.723.1的子帧作出的增益βi的选择的闭环的程度。通过使用图8中的子帧之间的对应,每个G.729子帧和G.723.1子帧的一个或者两个相关联。根据增益矢量βi的5个系数的矢量,以降低重要性的次序对邻域值λ′进行分等。然后确定测试的值的数量,作为所需复杂度的函数或者所需质量/复杂度比的函数。
图7a(分别在图7b中)所示为从G.723.1编码器得到的G.729的偶数子帧(分别为奇数)和参数序列(λj,(βi)j)之间的关联。
应该注意,对于一些子帧,锚定值λ′可能与为相关联的G.723.1子帧确定的参数序列(λj,(βi)j)的延迟λj不同。这点将随后解释,其中考虑子帧的奇偶性(奇数或者偶数)。在第一变型中,可以简单地忽略任何不同。优点是,在另一个变型中,分级后的邻近的集可以修正,作为差(λj-λ′)的函数,该集的大小也是可以修正的。优选地,根据增益(βi)j从该分级后的邻域的每个元素中减去差(λj-λ′),并且考虑给出该集的交集以定义邻域(neighborhood)(这里,如随后所示,对于偶数子帧间隔为[-3;3],对于奇数子帧间隔为[-5;4])。
还可能以使用受限的邻域为条件,作为在两个延迟之间的偏差为函数。从而向子帧,或者两个延迟之间的偏差,或者组合后的两个准则使用该策略。偶数子帧
必须在开环延迟λOL的周围范围[λOL-3;λOL+3]内执行本搜索。根据由G.723.1编码器所选的增益矢量,确定7个抖动值序列(-3,-2,-1,0,1,2,3)的分级。对于G.729编码器的子帧0(分别地2),仅仅有一个G.723.1的关联子帧,以及一个增益矢量和一个分级。另一方面,G.723.1编码器的两个子帧与G.729编码器的子帧4关联,如图7a所示。从而通过增益矢量(βi)2和(βi)3预先选择邻近的集的两个分级。如上所示,可以采用单个分级或者组合两个分级。如果采用仅仅与矢量(βi)3关联的分级,或者如果λ2=λ3是固定的(其中λ3是锚定值),则不执行具体的处理。否则,对应(βi)2的7个邻域的分级的集可以修正,作为λ23的函数。然后,根据(βi)3的分级的集可以用于完成。测试根据获得的分级的第一N个元素,大小N定义为复杂度的函数或者目标质量/复杂度折衷的函数。
奇数子帧
必须在前一(偶数)子帧的整数部分λ′2p附近的范围【λ′2p-52/3;λ′2p+42/3】内执行搜索。对于这些奇数子帧,就象对偶数子帧4那样,相关联的G.723.1子帧的参数序列(λj,(βi)j)的延迟λj可能不同于该锚定值λ′2p。根据由G.723.1编码器所选的增益矢量(βi)j,10个抖动值的集的分级被预先选择,并且作为差(λj-λ′2p)的函数修正。设N(N≤10)为被测值的最大允许数量。
为了确定有限的搜索范围,对于每个奇数子帧优选地执行下述步骤。
子帧1
整个搜索范围是[λ′0-52/3;λ′0+42/3。预先选择对应增益矢量(βi)0和(βi)1的两个分级。然后,分级后的邻域作为差λ1-λ′0和λ10的函数修正。限制这两个偏离,因为:
-一方面,G.729的闭环延迟λ0′在附近(在开环延迟的间隔[-3;3](这里,等于对应G.723.1的闭环延迟)),
-另一方面,在G.723.1编码器,因为差λ10在间隔[-1,2]内,所以偶数子帧的闭环延迟和随后的奇数子帧的闭环延迟之间的偏离是有限的。
根据修正后的邻域的第一N1和N2元素,构造大小为N的单一分级后的邻域。首先选择对两个子集公共的值,然后如果需要的话,通过交替地将其余值中的最佳值放到在两个子集中,完成该集。然后在构造的子集中执行闭环搜索。
子帧3
整个搜索范围是[λ′2-52/3;λ′2+42/3]。选择对应增益矢量(βi)2的分级。然后,分级后的邻域作为差(λ2-λ′2)函数修正。与前一情况正相反,λ2和λ2′之间的偏离在分级的邻域中是相当大的,通过减去该差修正的偏离可以为零。在该情况中,优选地为,在整个范围[λ′1-52/3;λ′1+42/3]内执行搜索。使用分级的邻域也是以|λ2-λ′2|上的阈值为条件的。例如,只有如果|λ2-λ′2|<3时,限制邻域,否则,试探整个范围[-5,4]。该变型的选择还取决于所允许的复杂度。
子帧5
整个搜索范围是[λ′4-52/3;λ′4+42/3]。选择对应增益矢量(βi)3的分级。然后,分级后的邻域作为差(λ3-λ′4)的函数修正。如在子帧1的情况中,该偏离是有限的。具体地,G.729的闭环延迟λ2′在开环延迟的邻域中,[-3,3](这里,等于G.723.1的闭环延迟λ3)。试探修正后的分级集的第一N个值。
这里的解决方案允许大大降低G.729编码的LTP分析的复杂度。相对于试探整个邻域,本发明使得如果G.723.1编码器的增益矢量在具有170条(分别85条)的库中,仅仅测试60%(分别40%)的邻域值成为可能。
第三示例性实施例:在6.3-kbit/s的G.723.1编码器的多抽头LTP参数的基础上确定5.3-kbit/s的G.723.1编码器的多抽头LTP参数
两个模型相同,仅仅选择的多抽头LTP增益矢量库不同。
多抽头滤波器延迟的确定
以与上述确定单抽头延迟相似的方式,在多抽头LTP参数的基础上,可能使用偶数子帧的延迟作为超级子帧的开环延迟,然后作为6.3-kbit/s模式选择的滤波器的5个系数的矢量的函数,限制5.3-kbit/s模式闭环延迟的变化范围。优选地,除了简单复制延迟之外,不需要其他处理。这样,5.3-kbit/s的每个子帧采用6.3-kbit/s模式为相同子帧选择的延迟作为延迟。
多抽头滤波器的系数的确定
需要根据本发明中定义的术语,这里有具有5.3-kbit/s模式的5个系数的170个矢量的单个第二库,但是需要考虑两个“第一库”。这两个第一库是G.723.1的6.3-kbit/s模式使用的增益矢量的两个库。
在该示例性实施例中,寻求在两个库(具有170或者85个矢量)中的一个库中通过6.3-kbit/s模式选择的增益矢量的基础上为5.3-kbit/s模式具有170条库中确定一个增益矢量。
两种情况中的一种可能微不足道,因为如果6.3-kbit/s模式为当前子帧使用相同的库(具有170个矢量的库),将诱使为5.3-kbit/s模式选择和6.3-kbit/s模式相同的矢量。然而,该方法产生信号的显著衰减。特别地,虽然LTP模型对于两个模式是相同的(相同的5个增益矢量和延迟的库),应该注意,编码处理的其它部分是不同的。从而LTP滤波不应用到相同的信号,这样对于5.3-kbit/s模式需要拓宽滤波器系数矢量的选择。
为此,在两个库中执行研究以关联每个矢量,具有170个矢量的库的矢量等级。
这样,为给5.3-kbit/s模式选择增益矢量,优选地,在6.3-kbit/s模式进行的增益矢量选择的基础上,在大的库中(170个矢量)试探仅仅限于与6.3-kbit/s模式选择的增益矢量相关联的等级的第一N个矢量。大小N取决于复杂度或者质量,或者所需的质量复杂度折衷。这样,如上所示,从该子集中选择最大化准则的增益矢量,该准则优选地为CELP准则。

Claims (29)

1.一种编码方法,该方法在通过实施根据第一格式编码的至少一步骤获得的信息的基础上根据第二格式进行编码,尤其是对于语音信号编码,所述第一和第二格式通过试探包含备选参数的至少一个库实施搜索LTP长时预测参数的步骤,为了更精细地搜索LTP参数,第一和第二编码格式至少之一使用具有多系数的滤波,其特征在于,包括以下步骤:
a)定义第二编码格式使用的至少一个库的分级;
b)恢复在确定在根据第一格式编码的过程中的LTP参数的之后得到的先验信息以选择所述库的至少一个分级;
c)将选择分级应用到所述库中的备选者上以选择有限量的第一备选者;和
d)为了实施第二编码,只在所述有限量的备选者中执行LTP搜索。
2.根据权利要求1所述的方法,其中,第一编码格式使用第一库,其特征在于,所述先验信息是第一库的划分的信息,该信息涉及该划分的类,其中在根据第一格式编码过程中获得的LTP参数属于该类。
3.根据权利要求2所述的方法,其特征在于,第一库的基本划分包括最初拟定在大小为1的N个不相交的类中的N个元素。
4.根据权利要求2所述的方法,其中,第一编码格式使用第一库,并且第二编码格式使用第二库,其特征在于,拟定在不相交的类中的第一库的划分,从而同一元素与第二库中的一个以上分级相关联。
5.根据权利要求2至4中任意一项所述的方法,其中,第一编码格式使用第一库,第二编码格式使用第二库,其特征在于,拟定相似的分级形成一组,从而动态地修正第一库的初始划分,以及第二库中分级的数量。
6.根据权利要求5所述的方法,其特征在于,进一步包括,拟定另一个操作,在于一旦第二库的分级在一起形成组,则连续地重新计算第二库的分级,并且动态地修正第一库的初始划分和/或已经这样形成组的分级。
7.根据权利要求2至6任意一项所述的方法,其中,第一编码格式使用第一库,第二编码格式使用第二库,其特征在于,对于第二库的每个分级,选择第二库保留的最大元素数量,作为第一库的类的函数和/或第二库的分级,从而减少存储第二库的分级的存储器资源。
8.根据上述任一权利要求所述的方法,其特征在于,选择所述有限量的备选者,作为第二编码的质量和复杂度之间的折衷的函数。
9.根据权利要求8所述的方法,其中,要被编码的输入信号按数据块进行处理,其特征在于,所述折衷对于要处理的各数据块是动态地确定的,作为第一编码格式的参数的函数和/或要被编码的信号的特征的函数。
10.根据权利要求9所述的方法,其特征在于,所述折衷是动态地确定的,作为每个数据块包含的LTP子帧的函数。
11.根据上述任一权利要求所述的方法,其特征在于,包括初始步骤,该步骤包括形成统计和/或分析研究,作为根据第一编码格式的LTP参数的连续序列的函数,从而测定第二编码格式使用的库中分级的数量和适当的分级。
12.根据权利要求2至11中任意一项所述的方法,要被编码的输入信号按数据块进行处理,每个数据块包括第一编码格式的第一LTP子帧,以及第二编码格式的第二LTP子帧,其特征在于,对于相同持续时间的第一和第二子帧,每一个第二编码格式的当前子帧对应第一编码格式的单个子帧,并且其中:
-第一编码格式为当前子帧选择第一LTP参数序列;
-在按与第一格式的LTP参数之一相关联的库的类的划分,通过选择与所述第一序列的元素的类相关联的分级,选择第二格式的库的试探的分级;和
-依据选择的分级,试探第二格式的库中有限量的第一备选者。
13.根据权利要求2至11中任意一项所述的方法,其中,要被编码的输入信号按数据块进行处理,每个数据块包括第一编码格式的第一LTP子帧,以及第二编码格式的第二LTP子帧,其特征在于,对于不同持续时间的第一和第二子帧:
-第一编码格式为基本上对应当第二当前子帧的第一子帧选择多个LTP参数序列;
-在按照与第一格式LTP参数之一相关联的库的类的划分的基础上,通过选择与所述LTP参数序列的元素的类相关联的分级,预先选择第二格式的库的试探的分级;
-在所述预选择的分级的基础上,测定至少一个首选的分级;和
-依据首选的分级,试探第二格式的所述库,试探限于它的第一元素。
14.根据权利要求13所述的方法,其特征在于,首选的分级是从为第二子帧预选择的分级中选择出的最佳预选择分级。
15.根据权利要求13所述的方法,其特征在于,首选的分级是与最多地重叠第二格式当前子帧的第一格式子帧相对应的分级。
16.根据权利要求13所述的方法,其特征在于,根据下述步骤保留第二格式的库的多个分级的组合,从而获得第二格式的库的N个元素的动态分级:
-预选择K个分级;
-检测K个分级中的每一个分级的第一个元素,同时消除冗余,以获得K1个元素,其中K1≤K;
-加入从包含K个分级的第二元素的集中选择K2个元素,同时消除冗余,其中,K2≤K,并且K2≤N-K1,重复这些步骤,直到获得所述N个元素。
17.根据权利要求13所述的方法,其特征在于,按照以下步骤保留第二格式的库的多个分级的组合,从而获得第二格式的库的N个元素的动态分级:
-通过预选择每个等级Ci中的第一Ni元素构造等级的K个子集,其中Ni≤N,下标i在1和K之间;
-选择Ni个元素,使∑Ni≥N;
-选择K个子集中出现的所有的元素,并且用选择K-i个子集中出现的元素重复后面步骤,其中i循环增加,直到保留N个元素。
18.根据上述任一权利要求所述的方法,其中第一编码格式对第一LTP子帧使用单系数滤波,而第二编码格式对第二LTP子帧使用多系数滤波,其特征在于,
-对于每一个第一子帧,通过实施第一编码格式,确定单系数LTP滤波器的第一参数对(λe,βe);
-为了编码第二当前子帧,在第一格式参数序列(λe,βe)的基础上确定多系数LTP滤波器的参数的多个对(λs,(βi)s),其中:
*确定LTP延迟λs,首选对应于在和第二当前子帧重叠最多的第一子帧上按第一编码格式确定的延迟;
*通过执行步骤b)、c)和d),在第一子帧的至少一个增益βe的基础上确定第二当前子帧的增益矢量(βi)s,其中第二格式的库的分级与第二子帧的增益矢量(βi)s的集相对应。
19.根据权利要求18所述的方法,其特征在于,为了编码第二当前子帧:
-在第一格式的第一LTP增益βe的基础上,预选择与第一LTP增益的类相关联的第二格式的库的分级,其中,第一LTP增益βe是为对应于第二当前子帧的一个或多个第一子帧而选择的;
-在为所述第二当前子帧所预选择的所述分级的基础上,首选动态地构造这些分级中的单一分级;和
-测试通过所述构造的分级确定的和第二增益的N个第一矢量,从而根据所选的准则,选择更佳的增益矢量以与和第二子帧相关联。
20.根据权利要求1至17任意一项所述的方法,其中,第二编码格式对第二LTP子帧使用单系数滤波,而第一编码格式对第一LTP子帧使用多系数滤波,其特征在于,
-对于每一个第一子帧,通过实施第一编码格式,确定LTP参数第一序列λe,(βi)e,该参数序列与包含多系数LTP滤波器的LTP延迟λe和相关联的增益矢量(βi)e的对相对应;
-执行第一格式增益矢量(βi)e的库的划分;
-为了按第二格式编码第二当前子帧,为对应于第二当前子帧的第一子帧确定的第二格式的库的分级,所述第二格式的库是由抖动值的集构造的,并且该库的所述分级与第一格式的库的划分相关联;
-确定抖动值的分级,在这样分级后的抖动值上并且在已经确定的一个或多个锚定延迟的附近连续地试探第二格式的LTP延迟值,所述一个或多个锚定延迟确定为第一子帧上的延迟λe的函数。
21.根据权利要求20所述的方法,其特征在于,根据选择的准则测试各种LTP延迟值。
22.根据权利要求20或21所述的方法,其特征在于,这样分级后的所述抖动值具有大小按试探的函数增加的幅值。
23.根据权利要求1至17任意一项所述的方法,其中,第一编码格式对第一LTP子帧使用多系数滤波,而第二编码格式对第二LTP子帧使用多系数滤波,其特征在于,
-在通过第一格式选择的并且包括为至少一个第一子帧确定的至少一个增益矢量(βi)e的参数的至少一个序列基础上,执行第一格式的库的划分,与第一格式的矢量增益(βi)e的库相对应;
-从而推导出与第二格式的增益矢量(βi)s的库相对应的第二格式的库的分级,所述分级与所述划分相关联;
-在为基本上覆盖第二当前子帧的第一子帧通过第一格式选择的增益矢量(βi)e的基础上,预选择第二库的分级,所述分级与所述划分的类相关联;
-保留一个预选择的分级;
-确定要与第二当前子帧相关联的几个增益矢量,作为保留的分级的函数;
-通过测试所述几个增益矢量,根据所选的准则选择最佳增益矢量。
24.根据权利要求19、21或23所述的方法,其特征在于,所选的准则是CELP标准。
25.一种按照第二编码格式进行编码的装置,该装置使用通过按照第一格式实施的编码获得的编码信息,尤其是对于语音信号编码,所述第一和第二格式通过试探包含备选参数的库实施对LTP长时预测参数的搜索,为了对更精细地搜索LTP参数,第一和第二编码格式至少之一使用具有多系数的滤波,其特征在于,包括以下步骤:
-存储器,用于存储作为由第一编码格式确定的LIP参数的函数定义第二的编码格式使用的库的分级的对应表;
-用于恢复给出关于在根据第一格式编码的过程中的LTP参数的至少一个先验信息的信号的器件;
-在接收到所述信号时活动的器件,用于查阅所述对应表并且选择第二格式的所述库的至少一个分级;
-计算器件,用于:
*根据所选的分级对第二格式的库进行分级,从而由库中选择有限量的最初的备选者;和
*通过仅仅在该有限量的备选者中执行LTP搜索,继续根据第二格式编码。
26.一种编码***,用于实施至少一种第一编码格式和一种第二格式编码,其特征在于,包括用于根据第一格式编码的至少一个设备和实施所述第二格式的如权利要求25所述的编码设备。
27.根据权利要求26所述的编码***,其特征在于,用于根据第一格式编码的设备和用于根据第二格式编码的设备级联设置,用于代码转换。
28.根据权利要求26所述的编码***,其特征在于,用于根据第一格式编码的设备和用于根据第二格式编码的设备并行设置,用于多编码。
29.一种计算机程序产品,存储于处理单元的存储器中,或者与所述处理单元上的阅读器协作的可移动介质上,或者可从远程站点下载,其特征在于,包含实施如权利要求1-24中任意一项权利要求所述的方法中的所有或者部分步骤的指令。
CN200680003179XA 2005-01-11 2006-01-09 实现介于两种长时预测模型之间最优编码的方法和装置 Expired - Fee Related CN101124625B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0500272A FR2880724A1 (fr) 2005-01-11 2005-01-11 Procede et dispositif de codage optimise entre deux modeles de prediction a long terme
FR0500272 2005-01-11
PCT/FR2006/000038 WO2006075078A1 (fr) 2005-01-11 2006-01-09 Procede et dispositif de codage optimise entre deux modeles de prediction a long terme

Publications (2)

Publication Number Publication Date
CN101124625A true CN101124625A (zh) 2008-02-13
CN101124625B CN101124625B (zh) 2012-02-29

Family

ID=34954835

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200680003179XA Expired - Fee Related CN101124625B (zh) 2005-01-11 2006-01-09 实现介于两种长时预测模型之间最优编码的方法和装置

Country Status (6)

Country Link
US (1) US8670982B2 (zh)
EP (1) EP1836699B1 (zh)
CN (1) CN101124625B (zh)
AT (1) ATE515019T1 (zh)
FR (1) FR2880724A1 (zh)
WO (1) WO2006075078A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103138874A (zh) * 2011-11-23 2013-06-05 ***通信集团公司 一种编解码动态协商方法及设备

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2839969B1 (fr) 2002-05-27 2005-04-01 Jean Couturier Liant hydraulique resultant du melange d'un liant sulfatique et d'un liant a caractere pouzzolanique
US7809719B2 (en) * 2007-02-08 2010-10-05 Microsoft Corporation Predicting textual candidates
US7912700B2 (en) * 2007-02-08 2011-03-22 Microsoft Corporation Context based word prediction
US8521520B2 (en) * 2010-02-03 2013-08-27 General Electric Company Handoffs between different voice encoder systems
US9406307B2 (en) * 2012-08-19 2016-08-02 The Regents Of The University Of California Method and apparatus for polyphonic audio signal prediction in coding and networking systems
US9830920B2 (en) 2012-08-19 2017-11-28 The Regents Of The University Of California Method and apparatus for polyphonic audio signal prediction in coding and networking systems

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6260009B1 (en) * 1999-02-12 2001-07-10 Qualcomm Incorporated CELP-based to CELP-based vocoder packet translation
US6687668B2 (en) * 1999-12-31 2004-02-03 C & S Technology Co., Ltd. Method for improvement of G.723.1 processing time and speech quality and for reduction of bit rate in CELP vocoder and CELP vococer using the same
JP2002202799A (ja) * 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
JP2002229599A (ja) * 2001-02-02 2002-08-16 Nec Corp 音声符号列の変換装置および変換方法
JP4231987B2 (ja) * 2001-06-15 2009-03-04 日本電気株式会社 音声符号化復号方式間の符号変換方法、その装置、そのプログラム及び記憶媒体
US6829579B2 (en) * 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
AU2003207498A1 (en) * 2002-01-08 2003-07-24 Dilithium Networks Pty Limited A transcoding scheme between celp-based speech codes
JP4263412B2 (ja) * 2002-01-29 2009-05-13 富士通株式会社 音声符号変換方法
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
US20040057521A1 (en) * 2002-07-17 2004-03-25 Macchina Pty Ltd. Method and apparatus for transcoding between hybrid video CODEC bitstreams
US7519532B2 (en) * 2003-09-29 2009-04-14 Texas Instruments Incorporated Transcoding EVRC to G.729ab
FR2867648A1 (fr) * 2003-12-10 2005-09-16 France Telecom Transcodage entre indices de dictionnaires multi-impulsionnels utilises en codage en compression de signaux numeriques
US7792670B2 (en) * 2003-12-19 2010-09-07 Motorola, Inc. Method and apparatus for speech coding

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103138874A (zh) * 2011-11-23 2013-06-05 ***通信集团公司 一种编解码动态协商方法及设备
CN103138874B (zh) * 2011-11-23 2016-07-06 ***通信集团公司 一种编解码动态协商方法及设备

Also Published As

Publication number Publication date
US8670982B2 (en) 2014-03-11
US20080306732A1 (en) 2008-12-11
EP1836699A1 (fr) 2007-09-26
ATE515019T1 (de) 2011-07-15
FR2880724A1 (fr) 2006-07-14
EP1836699B1 (fr) 2011-06-29
CN101124625B (zh) 2012-02-29
WO2006075078A1 (fr) 2006-07-20

Similar Documents

Publication Publication Date Title
CN101189662B (zh) 带多级码本和冗余编码的子带话音编解码器
US6879955B2 (en) Signal modification based on continuous time warping for low bit rate CELP coding
CN101925950B (zh) 音频编码器和解码器
CN101178899B (zh) 可变速率语音编码
EP1576585B1 (en) Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
CN101124625B (zh) 实现介于两种长时预测模型之间最优编码的方法和装置
CN101366080B (zh) 一种更新解码器的状态的方法和***
CN101903945B (zh) 编码装置、解码装置以及编码方法
KR101175651B1 (ko) 다중 압축 부호화 방법 및 장치
CN103384900A (zh) 在预测编码与变换编码之间交替的低延迟声音编码
CN102985966A (zh) 音频编码器和解码器及用于音频信号的编码和解码的方法
CN1890713B (zh) 用于数字信号压缩编码的多脉冲字典的索引间的编码转换的方法及***
CN103370880A (zh) 编码方法、解码方法、编码装置、解码装置、程序以及记录介质
CN104505097A (zh) 检索激励的固定贡献的量化增益的设备和方法
US7634402B2 (en) Apparatus for coding of variable bitrate wideband speech and audio signals, and a method thereof
JPH04270398A (ja) 音声符号化方式
CN101208741B (zh) 一种适用于数字信号短时相关性模型之间的互用性的方法
CN1525439A (zh) 广义综合分析语音编码方法和实施该方法的编码器
CN101847414A (zh) 用于语音编码的方法和设备
Prandoni et al. R/D optimal linear prediction
EP1267328A2 (en) Method of converting codes between speech coding and decoding systems, and device and program therefor
Jiang et al. Nonlinear prediction with deep recurrent neural networks for non-blind audio bandwidth extension
Ramo Improving LSF quantization performance with sorting
JPH0540500A (ja) 音声符号化装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120229

Termination date: 20160109

CF01 Termination of patent right due to non-payment of annual fee