CN105074820A - 用于确定内插因数组的***和方法 - Google Patents
用于确定内插因数组的***和方法 Download PDFInfo
- Publication number
- CN105074820A CN105074820A CN201380073344.9A CN201380073344A CN105074820A CN 105074820 A CN105074820 A CN 105074820A CN 201380073344 A CN201380073344 A CN 201380073344A CN 105074820 A CN105074820 A CN 105074820A
- Authority
- CN
- China
- Prior art keywords
- interpolation
- array
- value
- frame
- predictive mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 112
- 239000013598 vector Substances 0.000 claims description 222
- 238000009434 installation Methods 0.000 claims description 104
- 239000002131 composite material Substances 0.000 claims description 67
- 230000004044 response Effects 0.000 claims description 37
- 230000003595 spectral effect Effects 0.000 claims description 33
- 238000004590 computer program Methods 0.000 claims description 13
- 230000015572 biosynthetic process Effects 0.000 claims description 9
- 238000003786 synthesis reaction Methods 0.000 claims description 9
- 230000002194 synthesizing effect Effects 0.000 abstract 1
- 230000005284 excitation Effects 0.000 description 64
- 238000013139 quantization Methods 0.000 description 41
- 238000005303 weighing Methods 0.000 description 31
- 238000004458 analytical method Methods 0.000 description 27
- 238000001228 spectrum Methods 0.000 description 27
- 238000004891 communication Methods 0.000 description 25
- 238000010586 diagram Methods 0.000 description 21
- 238000001914 filtration Methods 0.000 description 20
- 239000000203 mixture Substances 0.000 description 16
- 230000008569 process Effects 0.000 description 16
- 238000006243 chemical reaction Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 238000011002 quantification Methods 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 9
- 230000005236 sound signal Effects 0.000 description 9
- 230000009466 transformation Effects 0.000 description 7
- 230000009471 action Effects 0.000 description 5
- 230000000903 blocking effect Effects 0.000 description 5
- 230000005611 electricity Effects 0.000 description 5
- 238000009432 framing Methods 0.000 description 5
- 230000008447 perception Effects 0.000 description 5
- 230000007774 longterm Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000000712 assembly Effects 0.000 description 3
- 238000000429 assembly Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000013213 extrapolation Methods 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000001568 sexual effect Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000000465 moulding Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Complex Calculations (AREA)
- Television Systems (AREA)
Abstract
本发明描述一种用于通过电子装置确定内插因数组的方法。所述方法包含基于当前帧特性和先前帧特性确定值。所述方法也包含确定所述值是否在一范围之外。所述方法进一步包含在所述值在所述范围之外的情况下基于所述值和预测模式指示符确定内插因数组。所述方法额外包含合成语音信号。
Description
相关申请案
本申请案与2013年2月21日申请的美国临时专利申请案第61/767,461号“用于确定一组内插因数的***和方法(SYSTEMSANDMETHODSFORDETERMININGASETOFINTERPOLATIONFACTORS)”有关且主张其优先权。
技术领域
本发明大体上涉及电子装置。更具体地说,本发明涉及用于确定内插因数组的***和方法。
背景技术
最近几十年中,电子装置的使用已变得普遍。明确地说,电子技术的进展已降低了愈加复杂且有用的电子装置的成本。成本降低和消费者需求已使电子装置的使用剧增,使得其在现代社会中几乎随处可见。由于电子装置的使用已推广开来,因此具有对电子装置的新的且改善的特征的需求。更具体地说,人们常常寻求执行新功能和/或更快、更高效且以更高质量执行功能的电子装置。
一些电子装置(例如,移动电话、智能型手机、音频记录器、摄录影机、计算机等)利用音频信号。这些电子装置可编码、存储和/或发射音频信号。例如,一智能型手机可获得、编码和发射用于电话呼叫的语音信号,同时另一智能型手机可接收所述语音信号并对其进行解码。
然而,在音频信号的编码、发射和解码中存在特定挑战。例如,音频信号可经编码以便减小发射所述音频信号所需的频宽量。当音频信号的一部分在传输中丢失时,可能难以呈现准确地解码的音频信号。从此论述可了解,改善解码的***和方法可为有益的。
发明内容
描述一种用于通过电子装置确定内插因数组的方法。所述方法包含基于当前帧特性和先前帧特性确定值。所述方法也包含确定所述值是否在一个范围之外。所述方法进一步包含在所述值在所述范围之外的情况下基于所述值和预测模式指示符确定内插因数组。所述方法额外包含合成语音信号。
确定所述内插因数组可基于所述值在所述范围之外的程度。可基于在所述范围外部的一或多个阈值确定所述值在所述范围之外的所述程度。
所述预测模式指示符可指示两个预测模式中的一者。所述预测模式指示符可指示三个或三个以上预测模式中的一者。
所述值可为基于当前帧合成滤波器脉冲响应能量和先前帧合成滤波器脉冲响应能量的能量比率。确定所述值是否在所述范围之外可包含确定所述能量比率是否小于阈值。所述值可包含当前帧第一反射系数和先前帧第一反射系数。确定所述值是否在所述范围之外可包含确定所述先前帧第一反射系数是否大于第一阈值和所述当前帧第一反射系数是否小于第二阈值。
所述方法可包含基于所述内插因数组内插子帧线谱频率(LSF)向量。基于所述内插因数组内插子帧LSF向量可包含用第一内插因数乘以当前帧末端LSF向量、用第二内插因数乘以先前帧末端LSF向量和用差因数乘以当前帧中间LSF向量。
所述内插因数组可包含两个或两个以上内插因数。所述方法可包含在所述值不在所述范围之外的情况下利用默认内插因数组。
所述预测模式指示符可指示当前帧的预测模式。所述预测模式指示符可指示先前帧的预测模式。
描述一种用于确定内插因数组的电子装置。所述电子装置包含值确定电路,所述值确定电路基于当前帧特性和先前帧特性确定值。所述电子装置也包含耦合到所述值确定电路的内插因数组确定电路。所述内插因数组确定电路确定所述值是否在一个范围之外且在所述值在所述范围之外的情况下基于所述值和预测模式指示符确定内插因数组。所述电子装置也包含合成语音信号的合成滤波器电路。
描述一种用于确定内插因数组的计算机程序产品。所述计算机程序产品包含具有指令的非暂时性有形计算机可读媒体。所述指令包含用于使电子装置基于当前帧特性和先前帧特性确定值的代码。所述指令也包含用于使所述电子装置确定所述值是否在一个范围之外的代码。所述指令进一步包含用于使所述电子装置在所述值在所述范围之外的情况下基于所述值和预测模式指示符确定内插因数组的代码。所述指令额外包含用于使所述电子装置合成语音信号的代码。
也描述一种用于确定内插因数组的设备。所述设备包含用于基于当前帧特性和先前帧特性确定值的装置。所述设备也包含用于确定所述值是否在一个范围之外的装置。所述设备进一步包含用于在所述值在所述范围之外的情况下基于所述值和预测模式指示符确定内插因数组的装置。所述设备额外包含用于合成语音信号的装置。
附图说明
图1为说明编码器和解码器的通用实例的框图;
图2为说明编码器和解码器的基本实施方案的实例的框图;
图3为说明宽带语音编码器和宽带语音解码器的实例的框图;
图4为说明编码器的更特定实例的框图;
图5为说明随时间推移的帧的实例的图;
图6为说明用于通过编码器对语音信号进行编码的方法的一个配置的流程图;
图7为说明经配置以用于确定内插因数组的电子装置的一个配置的框图;
图8为说明用于通过电子装置确定内插因数组的方法的一个配置的流程图;
图9为说明值确定模块的实例的框图;
图10为说明内插因数组确定模块的一个实例的框图;
图11为说明确定内插因数组的一个实例的图;
图12为说明确定内插因数组的另一实例的图;
图13包含合成语音波形的实例的曲线图;
图14包含合成语音波形的额外实例的曲线图;
图15为说明无线通信装置的一个配置的框图,在所述无线通信装置中可实施用于确定内插因数组的***和方法;和
图16说明可用于电子装置中的各种组件。
具体实施方式
现参考诸图描述各种配置,在诸图中,相似参考数字可指示功能上类似的元件。可以多种不同配置来布置和设计如诸图中所大体描述和说明的***和方法。因此,对如诸图中所表示的若干配置的以下更详细描述并不希望限制如所主张的范围,而仅表示***和方法。
图1为说明编码器104和解码器108的通用实例的框图。编码器104接收语音信号102。语音信号102可为在任何频率范围中的语音信号。例如,语音信号102可以16千位/秒(kbps)进行采样,且可为具有0千赫兹(kHz)到16kHz或0kHz到14kHz的大致频率范围的超宽带信号、具有0kHz到8kHz的大致频率范围的宽带信号或具有0kHz到4kHz的大致频率范围的窄频信号。在其它实例中,语音信号102可为具有50赫兹(Hz)到300Hz的大致频率范围的低频信号或具有4kHz到8kHz的大致频率范围的高频信号。用于语音信号102的其它可能频率范围包含300Hz到3400Hz(例如,公众交换电话网络(PSTN)的频率范围)、14kHz到20kHz、16kHz到20kHz和16kHz到32kHz。
编码器104对语音信号102进行编码以产生经编码语音信号106。大体来说,经编码语音信号106包含表示语音信号102的一或多个参数。所述参数中的一或多者可经量化。所述一或多个参数的实例包含滤波参数(例如,加权因数、线谱频率(LSF)、预测模式指示符、线谱对(LSP)、导抗谱频率(ISF)、导抗谱对(ISP)、部分相关(PARCOR)系数、反射系数和/或对数面积比率值(log-area-ratiovalue)等),和包含于经编码激发信号中的参数(例如,增益因数、自适应性码本索引、自适应性码本增益、固定码本索引和/或固定码本增益等)。所述参数可对应于一或多个频带。解码器108对经编码语音信号106进行解码以产生经解码语音信号110。例如,解码器108基于包含于经编码语音信号106中的一或多个参数而构建经解码语音信号110。经解码语音信号110可为原始语音信号102的大致重现。
编码器104可以硬件(例如,电路)、软件或两者的组合加以实施。例如,编码器104可实施为专用集成电路(ASIC)或具有指令的处理器。类似地,解码器108可以硬件(例如,电路)、软件或两者的组合加以实施。例如,解码器108可实施为专用集成电路(ASIC)或具有指令的处理器。编码器104与解码器108可实施于单独电子装置上或相同电子装置上。
图2为说明编码器204和解码器208的基本实施方案的实例的框图。编码器204可为结合图1描述的编码器104的一个实例。编码器204可包含分析模块212、系数变换214、量化器A216、反量化器A218、反系数变换A220、分析滤波器222和量化器B224。编码器204和/或解码器208的组件中的一或多者可以硬件(例如,电路)、软件或两者的组合加以实施。
编码器204接收语音信号202。应注意,语音信号202可包含如上文结合图1所述的任何频率范围(例如,语音频率的整个频带或语音频率的子频带)。
在此实例中,分析模块212将语音信号202的频谱包封编码为一组线性预测(LP)系数(例如,分析滤波器系数A(z)、其可应用于产生全极滤波器1/A(z),其中z为复数(complexnumber))。分析模块212通常将输入信号处理为语音信号202的一系列非重叠帧,其中针对每一帧或子帧计算一组新系数。在一些配置中,帧周期可为可预期语音信号202在其内在本地静止的周期。帧周期的一个常见实例为20毫秒(ms)(例如,在8kHz的采样率下等效于160个样本)。在一个实例中,分析模块212经配置以计算一组十个线性预测系数来表征每一20ms帧的共振峰结构。在另一实例中,可对于20ms帧利用12.8kHz的采样率。在此实例中,帧大小为256个样本,且分析模块212可计算一组16个线性预测系数(例如,16阶线性预测系数)。尽管这些为可根据本文中所揭示的***和方法实施的架构的实例,但应注意,这些实例不应限制所揭示的***和方法的范围,所揭示的***和方法可应用于任何架构。也有可能实施分析模块212以将语音信号202处理为一系列重叠帧。
分析模块212可经配置以直接分析每一帧的样本,或可首先根据开窗函数(例如,汉明窗(Hammingwindow))来对样本进行加权。也可在大于帧的窗(例如30ms窗)内执行分析。此窗可为对称的(例如,5-20-5,使得其紧接20毫秒帧之前和之后包含5ms)或不对称的(例如,10-20,使得其包含前一帧之后10ms)。分析模块212通常经配置以使用列文逊-杜宾(Levinson-Durbin)递回或勒鲁-盖恩(Leroux-Gueguen)算法来计算线性预测系数。在另一实施方案中,分析模块212可经配置以针对每一帧计算一组倒频谱系数而非一组线性预测系数。
通过量化所述系数,编码器204的输出速率可显著减小,而对重现质量具有相对较小的影响。线性预测系数难以高效地量化,且通常映射到例如LSF的另一表示以用于量化和/或熵编码。在图2的实例中,系数变换214将系数的集合变换成对应LSF向量(例如,一组LSF)。系数的其它一对一表示包含LSP、PARCOR系数、反射系数、对数面积比率值、ISP和ISF。例如,ISF可用于GSM(全球移动通信***)、AMR-WB(自适应性多速率宽带)编解码器中。为方便起见,术语“线谱频率”、“LSF”、“LSF向量”和相关术语可用以指LSF、LSP、ISF、ISP、PARCOR系数、反射系数和对数面积比率值中的一或多者。通常,一组系数与对应LSF向量之间的变换是可逆的,但一些配置可包含其中变换不可逆而无错误的编码器204实施方案。
量化器A216经配置以量化LSF向量(或其它系数表示)。编码器204可输出此量化的结果作为滤波参数228。量化器A216通常包含向量量化器,所述向量量化器将输入向量(例如,LSF向量)编码为对表或码本中的对应向量条目的索引。
如图2中所见,编码器204也通过使语音信号202传递经过根据系数的集合加以配置的分析滤波器222(也称为白化或预测错误滤波器)而产生残余信号。分析滤波器222可实施为有限脉冲响应(FIR)滤波器或无限脉冲响应(IIR)滤波器。此残余信号将通常含有未表示于滤波参数228中的语音频框的对感知重要的信息,例如,与音调相关的长期结构。量化器B224经配置以计算此残余信号的经量化表示用于作为经编码激发信号226而输出。在一些配置中,量化器B224包含向量量化器,所述向量量化器将输入向量编码为表或码本中的对应向量条目的索引。另外或替代地,量化器B224可经配置以发送一或多个参数,向量可在解码器208处从所述一或多个参数动态地加以产生,而非如在稀疏码本方法中从存储装置检索。此类方法用于例如代数CELP(码激发线性预测)的译码方案和例如3GPP2(第三代合作伙伴2)EVRC(增强型可变速率编解码器)的编解码器中。在一些配置中,经编码激发信号226和滤波参数228可包含于经编码语音信号106中。
编码器204根据对应解码器208将可获得的相同滤波器参数值来产生经编码激发信号226可为有益的。以此方式,所得经编码激发信号226可在一定程度上解决那些参数值中的非理想性,例如量化错误。因此,使用将在解码器208处可用的相同系数值来配置分析滤波器222可为有益的。在如图2中所说明的编码器204的基本实例中,反量化器A218对滤波参数228进行解量化。反系数变换A220将所得值映射回到一组对应系数。此组系数用以配置分析滤波器222以产生通过量化器B224量化的残余信号。
编码器204的一些实施方案经配置以通过识别在一组码本向量当中的最佳地匹配残余信号的一个码本向量来计算经编码激发信号226。然而,应注意,编码器204也可经实施以计算残余信号的经量化表示而不实际上产生所述残余信号。例如,编码器204可经配置以使用数个码本向量产生对应合成信号(例如,根据一组当前滤波参数)且选择与最佳地匹配感知加权域中的原始语音信号202的所产生信号相关联的码本向量。
解码器208可包含反量化器B230、反量化器C236、反系数变换B238和合成滤波器234。反量化器C236对滤波参数228(例如,LSF向量)进行解量化,且反系数变换B238将LSF向量变换成一组系数(例如,如上文参考编码器204的反量化器A218和反系数变换A220所描述)。反量化器B230对经编码激发信号226进行解量化以产生激发信号232。基于所述系数和激发信号232,合成滤波器234合成经解码语音信号210。换句话说,合成滤波器234经配置以根据经解量化的系数在光谱上对激发信号232进行塑形以产生经解码语音信号210。在一些配置中,解码器208也可将激发信号232提供到另一解码器,所述另一解码器可使用激发信号232来导出另一频带(例如,高频带)的激发信号。在一些实施方案中,解码器208可经配置以将关于激发信号232的额外信息(例如频谱倾斜、音调增益和滞后以及语音模式)提供到另一解码器。
具有编码器204和解码器208的***为合成式分析语音编解码器的基本实例。码本激发线性预测译码为合成式分析译码的一个风行家庭。此类译码器的实施方案可执行残余的波形编码,包含例如从固定和自适应性码本选择输入项、错误最小化操作和/或感知加权操作的操作。合成式分析译码的其它实施方案包含混合激发线性预测(MELP)、代数CELP(ACELP)、松弛CELP(RCELP)、规则脉冲激发(RPE)、多脉冲激发(MPE)、多脉冲CELP(MP-CELP),和向量总和激发线性预测(VSELP)译码。相关译码方法包含多频带激发(MBE)和原型波形内插(PWI)译码。标准化合成式分析语音编解码器的实例包含ETSI(欧洲电信标准协会)-GSM全速率编解码器(GSM06.10)(其使用残余激发线性预测(RELP))、GSM增强型全速率编解码器(ETSI-GSM06.60)、ITU(国际电信联盟)标准11.8kbpsG.729AnnexE译码器、用于IS-136(时分多址方案)的IS(临时标准)-641编解码器、GSM自适应性多速率(GSM-AMR)编解码器和4GVTM(***VocoderTM)编解码器(QUALCOMM公司,加利福尼亚州圣地牙哥)。可根据这些技术中的任一者或将语音信号表示为(A)描述滤波器的一组参数,和(B)用以驱动所述滤波器以重现所述语音信号的激发信号的任何其它语音译码技术(不管已知或是待开发)来实施编码器204和对应解码器208。
甚至在分析滤波器222已从语音信号202去除粗糙的频谱包封之后,大量精细谐波结构仍可保留,对于有声语音尤其如此。周期性结构与音调有关,且由相同说话者说出的不同有声声音可具有不同共振峰结构但具有类似的音调结构。
可通过使用一或多个参数值对音调结构的特性进行编码来提高译码效率和/或语音质量。音调结构的一个重要特性为第一谐波的频率(也称为基本频率),其通常在60赫兹(Hz)到400Hz的范围内。此特性通常编码为基本频率的倒数,也称为音调滞后。音调滞后指示一个音调周期中的样本的数目,且可编码为一或多个码本索引。来自男性说话者的语音信号倾向于比来自女性说话者的语音信号具有更大音调滞后。
与音调结构相关的另一信号特性为周期性,其指示谐波结构的强度,或换句话说,信号为谐波或非谐波的程度。周期性的两个典型指示项为零交叉和正规化从相关函数(NACF)。也可通过音调增益来指示周期性,音调增益通常编码为码本增益(例如,经量化自适应性码本增益)。
编码器204可包含经配置以对语音信号202的长期谐波结构进行编码的一或多个模块。在CELP编码的一些方法中,编码器204包含开环线性预测性译码(LPC)分析模块,其对短期特性或粗糙的频谱包封进行编码,随后为闭环长期预测分析阶段,其对精细音调或谐波结构进行编码。短期特性被编码为系数(例如,滤波参数228),且长期特性被编码为例如音调滞后和音调增益的参数的值。例如,编码器204可经配置而以包含一或多个码本索引(例如,固定码本索引和自适应性码本索引)和对应增益值的形式输出经编码激发信号226。残余信号的此经量化表示的计算(例如,通过量化器B224)可包含选择这些索引和计算这些值。音调结构的编码也可包含音调原型波形的内插,其操作可包含计算连续音调脉冲之间的差。对于对应于无声语音的帧(其通常为噪声样且非结构化的)可停用长期结构的模型化。
解码器208的一些实施方案可经配置以在已恢复长期结构(音调或谐波结构)之后将激发信号232输出到另一解码器(例如,高频带解码器)。例如,此类解码器可经配置以输出激发信号232作为经编码激发信号226的经解量化的版本。当然,也有可能实施解码器208使得另一解码器执行经编码激发信号226的反量化以获得激发信号232。
图3为说明宽带语音编码器342和宽带语音解码器358的实例的框图。宽带语音编码器342和/或宽带语音解码器358的一或多个组件可以硬件(例如,电路)、软件或两者的组合加以实施。宽带语音编码器342与宽带语音解码器358可实施于单独电子装置上或同一电子装置上。
宽带语音编码器342包含滤波器组A344、第一频带编码器348和第二频带编码器350。滤波器组A344经配置以对宽带语音信号340进行滤波以产生第一频带信号346a(例如,窄频信号)和第二频带信号346b(例如,高频信号)。
第一频带编码器348经配置以对第一频带信号346a进行编码以产生滤波参数352(例如,窄频(NB)滤波参数)和经编码激发信号354(例如,经编码窄频激发信号)。在一些配置中,第一频带编码器348可作为码本索引或以另一经量化形式产生滤波器参数352和经编码激发信号354。在一些配置中,第一频带编码器348可根据结合图2描述的编码器204加以实施。
第二频带编码器经350配置以根据经编码激发信号354中的信息对第二频带信号346b(例如,高频信号)进行编码以产生第二频带译码参数356(例如,高频译码参数)。第二频带编码器350可经配置以作为码本索引或以另一经量化形式产生第二频带译码参数356。宽带语音编码器342的一个特定实例经配置而以约8.55kbps的速率对宽带语音信号340进行编码,其中约7.55kbps用于滤波器参数352和经编码激发信号354,且约1kbps用于第二频带译码参数356。在一些实施方案中,滤波器参数352、经编码激发信号354和第二频带译码参数356可包含于经编码语音信号106中。
在一些配置中,第二频带编码器350可类似于结合图2描述的编码器204而加以实施。例如,第二频带编码器350可产生第二频带滤波器参数(例如,作为第二频带译码参数356的部分),如结合编码器204(结合图2加以描述)所描述。然而,第二频带编码器350可在一些方面中不同。例如,第二频带编码器350可包含第二频带激发产生器,所述第二频带激发产生器可基于经编码激发信号354产生第二频带激发信号。第二频带编码器350可利用所述第二频带激发信号产生合成的第二频带信号且确定第二频带增益因数。在一些配置中,第二频带编码器350可量化所述第二频带增益因数。因此,第二频带译码参数的实例包含第二频带滤波器参数和经量化第二频带增益因数。
将滤波器参数352、经编码激发信号354和第二频带译码参数356组合于单一位流中可为有益的。例如,对经编码信号一起进行多工以供传输(例如,经由有线、光学或无线传输信道)或存储(为经编码宽带语音信号)可为有益的。在一些配置中,宽带语音编码器342包含经配置以将滤波器参数352、经编码激发信号354和第二频带译码参数356组合成一经多工信号的多路复用器(未显示)。滤波器参数352、经编码激发信号354和第二频带译码参数356可为包含于如结合图1所描述的经编码语音信号106中的参数的实例。
在一些实施方案中,包含宽带语音编码器342的电子装置也可包含经配置以在例如有线、光学或无线信道的传输信道中传输经多工信号的电路。此类电子装置也可经配置以对信号执行一或多个信道编码操作,例如错误校正编码(例如,速率兼容性卷积编码)和/或错误检测编码(例如,循环冗余编码),和/或网络协议编码的一或多个层(例如,以太网、传输控制协议/因特网协议(TCP/IP)、cdma2000等)。
以下情况可为有益的:多路复用器经配置以作为经多工信号的可分离子流嵌入滤波器参数352与经编码激发信号354,使得可独立于所述经多工信号的另一部分(例如,高频和/或低频信号)而对滤波器参数352和经编码激发信号354进行复原和解码。例如,经多工信号可经布置而使得可通过去除第二频带译码参数356而复原滤波器参数352和经编码激发信号354。此类特征的一个潜在益处为避免了在将第二频带译码参数356传递到支持对滤波器参数352和经编码激发信号354的解码但不支持对第二频带译码参数356的解码的***之前对第二频带译码参数356进行转码的需要。
宽带语音解码器358可包含第一频带解码器360、第二频带解码器366和滤波器组B368。第一频带解码器360(例如,窄频解码器)经配置以对滤波器参数352和经编码激发信号354进行解码以产生经解码第一频带信号362a(例如,经解码窄频信号)。第二频带解码器366经配置以根据激发信号364(例如,窄频激发信号)、基于经编码激发信号354对第二频带译码参数356进行解码,以产生经解码第二频带信号362b(例如,经解码高频信号)。在此实例中,第一频带解码器360经配置以将激发信号364提供到第二频带解码器366。滤波器组B368经配置以组合经解码第一频带信号362a和经解码第二频带信号362b以产生经解码宽带语音信号370。
宽带语音解码器358的一些实施方案可包含多路分用器(未图示),所述多路分用器经配置以从经多工信号产生滤波器参数352、经编码激发信号354和第二频带译码参数356。包含宽带语音解码器358的电子装置可包含经配置以从例如有线、光学或无线信道的传输信道接收经多工信号的电路。此类电子装置也可经配置以对信号执行一或多个信道解码操作,例如错误校正解码(例如,速率兼容性卷积解码)和/或错误检测解码(例如,循环冗余解码),和/或网络协议解码的一或多个层(例如,以太网、TCP/IP、cdma2000)。
宽带语音编码器342中的滤波器组A344经配置以根据***频带方案对输入信号进行滤波以产生第一频带信号346a(例如,窄频或低频率子频带信号)和第二频带信号346b(例如,高频或高频率子频带信号)。取决于特定应用的设计准则,输出子频带可具有相等或不相等的频宽,且可重叠或不重叠。滤波器组A344的产生两个以上子频带的配置也为可能的。例如,滤波器组A344可经配置以产生一或多个低频信号,所述一或多个低频信号包含频率范围低于第一频带信号346a的频率范围(例如,50赫兹(Hz)到300Hz的范围)的分量。也有可能滤波器组A344经配置以产生一或多个额外高频信号,所述一或多个额外高频信号包含频率范围高于第二频带信号346b的频率范围(例如,14千赫兹(kHz)到20kHz、16kHz到20kHz或16kHz到32kHz的范围)的分量。在此类配置中,宽带语音编码器342可经实施以单独地对信号进行编码,且多路复用器可经配置以在经多工信号中包含额外经编码信号(例如,作为一或多个可分离的部分)。
图4为说明编码器404的更特定实例的框图。明确地说,图4说明用于低位速率语音编码的CELP合成式分析架构。在此实例中,编码器404包含成帧和预处理模块472、分析模块476、系数变换478、量化器480、合成滤波器484、求和器488、感知加权滤波和错误最小化模块492以及激发估计模块494。应注意,编码器404和/或编码器404的组件中的一或多者可以硬件(例如,电路)、软件或两者的组合加以实施。
语音信号402(例如,输入语音s)可为含有语音信息的电子信号。例如,可通过麦克风捕获声波语音信号且对其进行采样以产生语音信号402。在一些配置中,语音信号402可以16kbps进行采样。语音信号402可包括如上文结合图1所描述的频率范围。
语音信号402可提供到成帧和预处理模块472。成帧和预处理模块472可将语音信号402划分成一系列帧。每一帧可为一特定时段。例如,每一帧可对应于语音信号402的20ms。成帧和预处理模块472可对语音信号402执行其它操作,例如,滤波(例如,低通、高通和带通滤波中的一或多者)。因此,成帧和预处理模块472可基于语音信号402产生经预处理的语音信号474(例如,S(a),其中a为样本表编号)。
分析模块476可确定一组系数(例如,线性预测分析滤波器A(z))。例如,分析模块476可将经预处理的语音信号474的频谱包络编码为如结合图2所描述的一组系数。
所述系数可提供到系数变换478。系数变换478将所述组系数变换成如上文结合图2所描述的对应LSF向量(例如,LSF、LSP、ISF、ISP等)。
LSF向量提供到量化器480。量化器480将LSF向量量化成经量化LSF向量482。例如,量化器480可对LSF向量执行向量量化以产生经量化LSF向量482。此量化可为非预测性的(例如,先前帧LSF向量不用于量化过程中)或预测性的(例如,先前帧LSF向量用于量化过程中)。
在一些配置中,可利用两个预测模式中的一者:预测性量化模式或非预测性量化模式。在非预测性量化模式中,帧的LSF向量量化独立于任何先前帧LSF向量。在预测性量化模式中,帧的LSF向量量化取决于先前帧LSF向量。
在其它配置中,可利用三个或三个以上预测模式。在这些配置中,三个或三个以上预测模式中的每一者指示帧的LSF向量量化取决于先前帧LSF向量的相依性程度。在一个实例中,可利用三个预测模式。例如,在第一预测模式中,独立于(例如,不依赖于)任何先前帧LSF向量而量化帧的LSF向量。在第二预测模式中,取决于先前帧LSF量化LSF向量,但与第三预测模式相比具有较低相依性。在第三预测模式中,取决于先前帧量化LSF向量,与第二预测模式中相比具有较大相依性。
可经由预测系数来控制预测模式。例如,在一些配置中,可基于先前帧LSF向量和预测系数来量化当前帧LSF向量。对先前帧具有较大相依性的预测模式与具有较低相依性的预测模式相比可利用较高预测系数。在量化当前帧LSF向量时,较高预测系数可对先前帧LSF向量加较高权重,而较低预测系数可对先前帧LSF向量加较低权重。
量化器480可产生指示每一帧的预测模式的预测模式指示符431。预测模式指示符431可发送到解码器。在一些配置中,预测模式指示符431可指示用于帧的两个预测模式中的一者(例如,利用预测性量化或是非预测性量化)。例如,预测模式指示符431可指示帧是基于先前帧(例如,预测性)或是不基于先前帧(例如,非预测性)加以量化。在其它配置中,预测模式指示符431可指示三个或三个以上预测模式(对应于一帧的LSF向量量化取决于先前帧LSF向量的三个或三个以上相依性程度)中的一者。
在一些配置中,预测模式指示符431可指示当前帧的预测模式。在其它配置中,预测模式指示符431可指示先前帧的预测模式。在其它配置中,可利用每帧多个预测模式指示符431。例如,可发送对应于帧的两个帧预测模式指示符431,其中第一预测模式指示符431指示用于当前帧的预测模式,且第二预测模式指示符431指示用于先前帧的预测模式。
在一些配置中,可在子帧基础上产生和/或量化LSF向量。在一些实施方案中,仅对应于某些子帧(例如,每一帧的最后或末端子帧)的经量化LSF向量可发送到解码器。在一些配置中,量化器480也可确定经量化加权向量429。加权向量可用以量化对应于所发送的子帧的LSF向量(例如,末端LSF向量)之间的LSF向量(例如,中间LSF向量)。加权向量可经量化。例如,量化器480可确定对应于最佳地匹配实际加权向量的加权向量的码本或查找表的索引。经量化加权向量429(例如,索引)可发送到解码器。经量化LSF向量482、预测模式指示符431和/或经量化加权向量429可为上文结合图2所描述的滤波器参数228的实例。
经量化LSF提供到合成滤波器484。合成滤波器484基于经量化LSF向量482和激发信号496产生合成语音信号486(例如,重构建的语音)。例如,合成滤波器484基于经量化LSF向量482(例如,1/A(z))对激发信号496进行滤波。
由求和器488从经预处理的语音信号474减去合成语音信号486以产生错误信号490(也被称作预测错误信号)。错误信号490可表示经预处理的语音信号474与其估计(例如,合成语音信号486)之间的错误。错误信号490提供到感知加权滤波和错误最小化模块492。
感知加权滤波和错误最小化模块492基于错误信号490产生经加权错误信号493。例如,并非错误信号490的所有分量(例如,频率分量)皆同等地影响合成语音信号的感知质量。一些频带中的错误比其它频带中的错误对语音质量具有更大影响。感知加权滤波和错误最小化模块492可产生经加权错误信号493,经加权错误信号493减小对语音质量具有较大影响的频率分量中的错误,且将更多错误分配于对语音质量具有较少影响的其它频率分量中。
激发估计模块494基于来自感知加权滤波和错误最小化模块492的经加权错误信号493产生激发信号496和经编码激发信号498。例如,激发估计模块494估计表征错误信号490或经加权错误信号493的一或多个参数。经编码激发信号498可包含所述一或多个参数且可发送到解码器。例如,在CELP方法中,激发估计模块494可确定表征错误信号490(例如,经加权错误信号493)的参数,例如自适应性(或音调)码本索引、自适应性(或音调)码本增益、固定码本索引和固定码本增益。基于这些参数,激发估计模块494可产生激发信号496,激发信号496提供到合成滤波器484。在此方法中,自适应性码本索引、自适应性码本增益(例如,经量化自适应性码本增益)、固定码本索引和固定码本增益(例如,经量化固定码本增益)可发送到解码器作为经编码激发信号498。
经编码激发信号226可为上文结合图2所描述的经编码激发信号226的实例。因此,经量化LSF向量482、预测模式指示符431、经编码激发信号498和/或经量化加权向量429可包含于如上文结合图1所描述的经编码语音信号106中。
图5为说明随时间501推移的帧503的实例的图。每一帧503划分成数个子帧505。在图5中所说明的实例中,先前帧A503a包含4个子帧505a到505d,先前帧B503b包含4个子帧505e到505h,且当前帧C503c包含4个子帧505i到505l。典型帧503可占据20ms的时段,且可包含4个子帧,但可使用不同长度的帧和/或不同数目的子帧。每一帧可用对应帧编号来表示,其中n表示当前帧(例如,当前帧C503c)。此外,每一子帧可用对应子帧编号k来表示。
图5可用以说明编码器(例如,编码器404)中的LSF量化的一个实例。帧n中的每一子帧k具有对应LSF向量供用于分析和合成滤波器中。当前帧末端LSF向量527(例如,第n个帧的最后子帧LSF向量)表示为其中当前帧中间LSF向量525(例如,第n个帧的中间LSF向量)表示为“中间LSF向量”为时间501中的其它LSF向量之间(例如与之间)的LSF向量。先前帧末端LSF向量523的一个实例说明于图5中且表示为其中如本文所使用,术语“先前帧”可指当前帧之前的任何帧(例如,n-1、n-2、n-3等)。因此,“先前帧末端LSF向量”可为对应于当前帧之前的任何帧的末端LSF向量。在图5中所说明的实例中,先前帧末端LSF向量523对应于紧接在当前帧C503c(例如,帧n)之前的先前帧B503b(例如,帧n-1)的最后子帧505h。
每一LSF向量为M维的,其中LSF向量的每一维度对应于单一LSF值。例如,M对于宽带语音(例如,以16kHz采样的语音)通常为16。帧n的第k子帧的第iLSF维度表示为其中i={1,2,...,M}。
在帧n的量化过程中,可首先量化末端LSF向量此量化可为非预测性的(例如,先前帧末端LSF向量不用于量化过程中)或预测性的(例如,先前帧末端LSF向量用于量化过程中)。如上文所描述,可利用两个或两个以上预测模式。可接着量化中间LSF向量例如,编码器可选择加权向量,使得如在方程式(1)中所提供。
加权向量wn的第i维度对应于单一权重,且由wi,n表示,其中i={1,2,...,M}。也应注意,wi,n不受约束。明确地说,如果0≤wi,n≤1产生由和以及wi,n<0或wi,n>1界限的值(例如,内插),那么所得中间LSF向量可能在范围外部(例如,基于和的外插)。编码器可确定(例如,选择)加权向量wn,使得经量化中间LSF向量基于一些失真测量(例如,均方误差(MSE)或对数频谱失真(LSD))最接近于编码器中的实际中间LSF值。在量化过程中,编码器传输当前帧末端LSF向量的量化索引和加权向量wn的索引,其使得解码器能够重构建和
使用如由方程式(2)给出的内插因数αk和βk,基于和内插子帧LSF向量
应注意,αk和βk可使得0≤(αk,βk)≤1。内插因数αk和βk可为编码器和解码器两者皆已知的预定值。
因为当前帧中的LSF向量取决于先前帧末端LSF向量因此当估计先前帧末端LSF向量时(例如,当出现帧抹除时),当前帧的语音质量可能收到不利影响。例如,可基于估计的先前帧末端LSF向量内插当前帧的当前帧中间LSF向量和子帧LSF向量(例如,惟除外)。此可导致编码器与解码器之间失配的合成滤波器系数,此可在合成语音信号中产生伪声。
图6为说明用于通过编码器404对语音信号402进行编码的方法600的一个配置的流程图。例如,包含编码器404的电子装置可执行方法600。图6说明用于当前帧n的LSF量化程序。
编码器404可获得先前帧经量化末端LSF向量(602)。例如,编码器404可通过选择最接近于对应于先前帧n-1的末端LSF的码本向量而量化对应于先前帧(例如,)的末端LSF。
编码器404可量化当前帧末端LSF向量(例如,)(604)。编码器404在使用预测性LSF量化的情况下基于先前帧末端LSF向量量化当前帧末端LSF向量(604)。然而,量化当前帧LSF向量(604)在非预测性量化用于当前帧末端LSF的情况下并不基于先前帧末端LSF向量。
编码器404可通过确定加权向量(例如,wn)量化当前帧中间LSF向量(例如,)(606)。例如,编码器404可选择导致最接近于实际中间LSF向量的经量化中间LSF向量的加权向量。如方程式(1)中所说明,经量化中间LSF向量可基于加权向量、先前帧末端LSF向量和当前帧末端LSF向量。
编码器404可将经量化当前帧末端LSF向量和加权向量发送到解码器(608)。例如,编码器404可将当前帧末端LSF向量和加权向量提供到电子装置上的发射器,所述发射器可将所述当前帧末端LSF向量和所述加权向量发射到另一电子装置上的解码器。
本文中所揭示的***和方法的一些配置提供用于基于一或多个当前帧特性和一或多个先前帧特性确定LSF内插因数的方法。例如,本文中所揭示的***和方法可应用于在受损信道条件中操作的语音译码***。一些语音译码***在子帧基础上执行LSF在当前帧LSF与先前帧LSF之间的内插和/或外插。然而,取决于归因于被抹除帧而估计的LSF向量,在帧抹除条件下可导致语音伪声,其中估计的LSF向量用以产生正确接收的帧的子帧LSF向量。
图7为说明经配置以用于确定内插因数组的电子装置737的一个配置的框图。电子装置737包含解码器708。解码器708基于经量化加权向量729、经量化LSF向量782、预测模式指示符731和/或经编码激发信号798而产生经解码语音信号759(例如,合成语音信号)。可根据结合图7描述的解码器708而实施上文所述的解码器中的一或多者。电子装置737也包含被抹除帧检测器743。被抹除帧检测器743可与解码器708单独地实施或可实施于解码器708中。被抹除帧检测器743检测被抹除帧(例如,未被接收到或错误地接收的帧),且可在检测到被抹除帧时提供被抹除帧指示符767。例如,被抹除帧检测器743可基于杂凑函数、检查总和、重复码、校验位、循环冗余检查(CRC)等中的一或多者来检测被抹除帧。
应注意,包含于电子装置737和/或解码器708中的组件中的一或多者可以硬件(例如,电路)、软件或两者的组合加以实施。例如,值确定模块761和内插因数组确定模块765中的一或多者可以硬件(例如,电路)、软件或两者的组合加以实施。也应注意,图7或本文中的其它框图中的块内的箭头可表示组件之间的直接或间接耦合。例如,值确定模块761可耦合到内插因数组确定模块765。
解码器708基于所接收的参数产生经解码语音信号759(例如,合成语音信号)。所接收的参数的实例包含经量化LSF向量782、经量化加权向量729、预测模式指示符731和经编码激发信号798。解码器708包含反量化器A745、内插模块749、反系数变换753、合成滤波器757、值确定模块761、内插因数组确定模块765和反量化器B773中的一或多者。
解码器708接收经量化LSF向量782(例如,经量化LSF、LSP、ISF、ISP、PARCOR系数、反射系数或对数面积比率值)和经量化加权向量729。所接收的经量化LSF向量782可对应于子帧的子集。例如,经量化LSF向量782可仅包含对应于每一帧的最后子帧的经量化末端LSF向量。在一些配置中,经量化LSF向量782可为对应于查找表或码本的索引。另外或替代地,经量化加权向量729可为对应于查找表或码本的索引。
电子装置737和/或解码器708可从编码器接收预测模式指示符731。如上文所描述,预测模式指示符731指示每一帧的预测模式。例如,预测模式指示符731可指示帧的两个或两个以上预测模式中的一者。更具体地说,预测模式指示符731可指示利用预测性量化或是非预测性量化和/或帧的LSF向量量化取决于先前帧LSF向量的相依性程度。如上文结合图4所描述,预测模式指示符731可指示对应于当前帧(例如,帧n)和/或先前帧(例如,帧n-1)的一或多个预测模式。
当正确地接收到帧时,反量化器A745解量化所接收的经量化LSF向量729以产生经解量化的LSF向量747。例如,反量化器A745可基于对应于查找表或码本的索引(例如,经量化LSF向量782)而查找经解量化的LSF向量747。解量化经量化LSF向量782也可基于预测模式指示符731。经解量化的LSF向量747可对应于子帧的子集(例如,对应于每一帧的最后子帧的末端LSF向量)。此外,反量化器A745解量化经量化加权向量729以产生经解量化的加权向量739。例如,反量化器A745可基于对应于查找表或码本的索引(例如,经量化加权向量729)而查找经解量化的加权向量739。
当帧为被抹除帧时,被抹除帧检测器743可将被抹除帧指示符767提供到反量化器A745。当出现被抹除帧时,一或多个经量化LSF向量782和/或一或多个经量化加权向量729可能不被接收或可能含有错误。在此情况下,反量化器A745可基于来自先前帧(例如,在被抹除帧之前的帧)的一或多个LSF向量来估计一或多个经解量化的LSF向量747(例如,被抹除帧的末端LSF向量)。另外或替代地,反量化器A745可在出现被抹除帧时估计一或多个经解量化的加权向量739。经解量化的LSF向量747(例如,末端LSF向量)可提供到内插模块749且任选地提供到值确定模块761。
值确定电路761基于当前帧特性和先前帧特性确定值763。值763为指示先前帧特性与当前帧特性之间的改变程度的度量。帧特性的实例包含合成滤波器脉冲能量(例如,合成滤波器增益)、反射系数和频谱倾斜。帧特性的急剧改变在语音中可为非典型的,且可在未加以解决的情况下在合成语音信号中导致伪声。因此,值763可用以在帧抹除的情况下解决潜在伪声。
在一些配置中,值763可为能量比率。例如,值确定模块761可确定当前帧合成滤波器脉冲响应能量(例如,En)与先前帧合成滤波器脉冲响应能量(例如,En-1)的能量比率(例如,R)。
在一个方法中,值确定模块761可如下确定能量比率。值确定模块761可从经解量化的LSF向量747获得当前帧末端LSF向量(例如,)和先前帧末端LSF向量(例如,)。值确定模块761可分别对当前帧末端LSF向量和先前帧末端LSF向量执行反系数变换以获得当前帧末端合成滤波器(例如,)和先前帧末端合成滤波器(例如,)。值确定模块761可确定当前帧末端合成滤波器和先前帧末端合成滤波器的脉冲响应。例如,对应于和的合成滤波器的脉冲响应可分别表示为hn-1(i)和hn(i),其中i为脉冲响应的样本索引。应注意,所述脉冲响应(例如,hn-1(i)和hn(i))可能被截断,这是因为当前帧末端合成滤波器和先前帧末端合成滤波器为无限脉冲响应(IIR)滤波器。
当前帧合成滤波器脉冲能量为当前帧特性的一个实例。此外,先前帧合成滤波器脉冲响应能量为先前帧特性的一个实例。在一些配置中,值确定模块761可根据方程式(3)确定当前帧合成滤波器脉冲能量(例如,En)与先前帧合成滤波器脉冲响应能量(例如,En-1)。
在方程式(3)中,i为样本索引,且N为截断脉冲响应hn(i)的长度。如通过方程式(3)所说明,可截断当前帧合成滤波器脉冲能量和先前帧合成滤波器脉冲响应能量。在一些配置中,N可为128个样本。合成滤波器脉冲响应能量(例如,En和En-1)可为对应合成滤波器(例如,其基于LSF向量和)的增益的估计。
值确定模块761可根据方程式(4)确定当前帧合成滤波器脉冲能量(例如,En)与先前帧合成滤波器脉冲响应能量(例如,En-1)之间的能量比率。
在一些配置中,值763可为多维的。例如,值确定模块761可将值763确定为一组反射系数。例如,值确定模块761可确定当前帧第一反射系数(例如,R0n)和先前帧第一反射系数(例如,R0n-1)。在一些配置中,可从一或多个LSF向量(例如,经解量化的LSF向量747)和/或线性预测系数向量导出反射系数中的一或多者。例如,反射系数可基于LPC系数。所述值763可包含当前帧第一反射系数和先前帧第一反射系数。因此,值763可指示当前帧第一反射系数(例如,R0n)与先前帧第一反射系数(例如,R0n-1)之间的改变(如果存在)。在其它配置中,值763可包含每一帧的一或多个频谱倾斜,其可确定为高频带(例如,频谱范围的上半部分)能量与低频带(例如,频谱范围之下半部分)能量的比率。
值763可提供到内插因数组确定模块765。内插因数组确定模块765可确定值763(例如,能量比率、反射系数或频谱倾斜)是否在一个范围之外。所述范围指定表征规则语音的值763的网域。例如,所述范围可分开通常出现于规则语音中的值763与并不出现和/或极少出现于规则语音中的值763。例如,在所述范围之外的值763可指示与被抹除帧和/或不充分帧抹除隐藏一起出现的帧特性。因此,内插因数组确定模块765可基于值763和范围确定帧是否展现并不出现或极少出现于规则语音中的特性。
在一些配置中,范围可为多维的。例如,可在两个或两个以上维度中界定所述范围。在这些配置中,如果每一值763维度在每一范围维度的外部,多维值763可在所述范围之外。应注意,确定值763是否在范围(例如,第一范围)之外可等效地意味确定值763是否在另一范围(例如,第一范围的补数)内。
所述范围可基于一或多个阈值。在一个实例中,单一阈值可分开在所述范围内部的值763与在所述范围之外的值763。例如,高于阈值的所有值763可在范围之内,且低于阈值的所有值763可在范围之外。替代地,低于阈值的所有值763可在范围之内,且高于阈值的所有值763可在范围之外。在另一实例中,两个阈值可分开在所述范围内部的值763与在所述范围之外的值763。例如,在阈值之间的所有值763可在范围之内,而低于下阈值和高于上阈值的所有值763可在范围之外。替代地,在阈值之间的所有值763可在范围之外,而低于下阈值和高于上阈值的所有值763可在范围之内。如由这些实例所说明,范围可为连续或不连续的。在额外实例中,可利用两个以上阈值。在一些配置中,多维范围可基于至少两个阈值,其中第一阈值对应于范围的一个维度,而第二阈值对应于范围的另一维度。
在一些配置中,内插因数组确定模块765可通过确定能量比率(R)是否小于一或多个阈值和/或大于一或多个阈值而确定值763是否在所述范围之外。在其它配置中,内插因数组确定模块765可通过确定先前帧与当前帧的第一反射系数(R0)(或例如,频谱倾斜)之间的改变是否在多维范围之外而确定值763是否在所述范围之外。例如,电子装置737可确定先前帧第一反射系数(例如,R0n-1)是否大于一第一阈值和当前帧第一反射系数(例如,R0n)是否小于一第二阈值。
如果值763不在范围之外,那么内插因数组确定模块765可利用默认内插因数组。默认内插因数组可为在尚未出现帧抹除时(例如,在清洁信道条件中)使用的固定内插因数组。例如,内插因数组确定模块765可在值763不在范围之外时将默认内插因数组提供为内插因数组769。
内插因数组确定模块765可确定内插因数组769。例如,内插因数组确定模块765可在值763在范围之外时基于值763和预测模式指示符731确定内插因数组769。内插因数组为一组两个或两个以上内插因数。例如,内插因数组可包含内插因数α和β。在一些配置中,内插因数组可包含基于内插因数组中的其它内插因数的差因数。例如,内插因数组可包含内插因数α、β和差因数1-α-β。在一些配置中,内插因数组可包含用于一或多个子帧的两个或两个以上内插因数。例如,内插因数组可包含用于第k子帧的αk、βk和差因数1-αk-βk,其中k={1,...,K},且K为帧中的子帧的编号。内插因数(和例如差因数)用以内插经解量化的LSF向量747。
如果值763在范围之外,那么内插因数组确定模块765可基于值763和预测模式指示符731从内插因数组的群组确定(例如,选择)内插因数组769。例如,本文中所揭示的***和方法可基于值763和预测模式指示符731而提供自适应性机制以在预定义内插因数组(例如,不同组α和β)之间切换。
应注意,一些已知方法仅利用固定内插因数。例如,通过增强型可变速率编解码器B(EVRC-B)规范提供的一个已知方法可仅利用一个固定内插因数。在使用固定内插的方法中,内插因数可不改变或可不加以调适。然而,根据本文中所揭示的***和方法,电子装置737可基于值763和/或预测模式指示符731自适应性地确定不同内插因数组(例如,从多个内插因数组的群组自适应性地选择一内插因数组)。在一些情况下,可利用默认内插因数组。默认内插因数组可与用于清洁信道情况(例如,无被抹除帧)中的内插因数组相同。本文中所揭示的***和方法可检测偏离默认内插因数组的情况。
本文中所揭示的***和方法在处置由帧抹除引起的潜在伪声时可提供较大灵活性的益处。本文中所揭示的***和方法的另一益处可为可能不需要额外发信号。例如,可能不需要超出预测模式指示符731、经量化LSF向量782和/或经编码激发信号798的额外发信号以实施本文中所揭示的***和方法。
在一些配置中,确定内插因数组769可基于在范围之外的一或多个阈值。例如,可基于值763在范围之外的程度(如基于在范围之外的一或多个阈值而确定)而确定不同内插因数组。在其它配置中,可不利用在范围之外的阈值。在这些配置中,可仅利用对范围定界的一或多个阈值。例如,可基于值763在范围之外何处且基于预测模式指示符731而确定内插因数组769。确定内插因数组769可根据一或多个方法来实现。一些方法的实例给出如下。
在一个方法中,内插因数组确定模块765可基于能量比率(例如,R)确定内插因数组769(例如,αk、βk和1-αk-βk)。明确地说,如果R在范围之外,那么可假定被抹除帧(例如,帧n-1)的末端LSF被不正确地估计。因此,可选取不同组αk、βk和1-αk-βk,使得向当前帧(例如,正确接收的帧)末端LSF向量给出较大内插权重。此可帮助减少合成语音信号(例如,经解码语音信号759)中的伪声。
在一些配置中,也可结合能量比率(R)利用预测模式指示符731。预测模式指示符731可对应于当前帧(例如,对于当前帧末端LSF向量量化)。在此方法中,可基于帧预测模式为预测性或是非预测性的而确定内插因数组。如果当前帧(例如,帧n)利用非预测性量化,那么可假定当前帧末端经正确地量化。因此,与当前帧末端通过预测性量化加以量化的情况相比,可向当前帧末端给出较高内插权重。因此,在此方法中,内插因数组确定模块765利用能量比率(R)和当前帧利用预测性或是非预测性量化(例如,帧nLSF量化器的预测性或非预测性性质)来确定内插因数组769。
以下列表(1)说明可用于此方法中的内插因数组的实例。内插因数组确定模块765可基于值763和预测模式指示符731确定(例如,选择)内插因数组中的一者。在一些配置中,内插因数可从先前帧LSF向量相依性转变为增加的当前帧LSF向量相依性。在列表(1)中给出内插因数(例如,加权因数),在列表(1)中,每一列按βk、1-αk-βk和αk排序,其中每一列对应于每一子帧k,且k={1,2,3,4}。例如,每一内插因数组的第一列包含用于第一子帧的内插因数,第二列包含用于第二子帧的内插因数,以此类推。例如,如果Interpolation_factor_set_A被确定为内插因数组769,那么内插模块749在内插过程中根据方程式(2)对于第一子帧应用α1=0.30、β1=0.00和1-α1-β1=0.70。应注意,列表(1)中给出的内插因数组为实例。可根据本文中所揭示的***和方法利用其它内插因数组。
Interpolation_factor_set_A={0.00,0.70,0.30,
0.00,0.00,1.00,
0.00,0.00,1.00,
0.00,0.00,1.00};
Interpolation_factor_set_B={0.15,0.70,0.15,
0.05,0.65,0.30,
0.00,0.50,0.50,
0.00,0.0,1.00};
Interpolation_factor_set_C={0.10,0.70,0.20,
0.00,0.30,0.70,
0.00,0.10,0.90,
0.00,0.00,1.00};
Interpolation_factor_set_D={0.30,0.50,0.20,
0.15,0.65,0.20,
0.05,0.55,0.40,
0.00,0.00,1.00};
Interpolation_factor_set_E={0.55,0.45,0.00,
0.05,0.95,0.00,
0.00,0.55,0.45,
0.00,0.00,1.00};
列表(1)
在列表(2)中,可通过基于用于当前帧的能量比率(R)(例如,值763)和预测模式指示符731(例如,“frame_n_mode”)从列表(1)选择内插因数组中的一者而确定一个内插因数组769(例如,“pt_int_coeffs”)。例如,可基于当前帧预测模式为非预测性或是预测性且基于可用以确定R是否在范围外部和R在范围外部达何程度的两个阈值(例如,TH1、TH2)来确定内插因数组769。在列表(2)中,所述范围可被界定为R≥TH2。
if((R<TH1)&&(frame_n_mode==non-predictive))
pt_int_coeffs=Interpolation_factor_set_A;
elseif((R<TH1)&&(frame_n_mode==predictive))
pt_int_coeffs=Interpolation_factor_set_B;
elseif((R<TH2)&&(frame_n_mode==non-predictive))
/*R介于TH1与TH2之间,且利用非预测性量化*/
pt_int_coeffs=Interpolation_factor_set_C;
elseif((R<TH2)&&(frame_n_mode==predictive))
/*R介于TH1与TH2之间,且利用预测性量化*/
pt_int_coeffs=Interpolation_factor_set_D;
else/*默认*/
pt_int_coeffs=Interpolation_factor_set_E;
列表(2)
列表(2)因此说明确定所述值是否在范围外部和在所述值在范围外部的情况下基于所述值和帧预测模式确定内插因数组的一个实例。如列表(2)中所说明,在所述值不在范围外部的情况下可利用默认内插因数组(例如,Interpolation_factor_set_E)。在列表(2)中,可基于R在范围之外的程度自适应性地确定内插因数组A到D中的一者。具体地说,如果R在范围之外(例如,R<TH2),那么可选择Interpolation_factor_set_D,且如果R在范围之外达较大程度(例如,R<TH1),那么可选择Interpolation_factor_set_B。因此,TH1为在范围之外的阈值的一个实例。列表(2)也将Interpolation_factor_set_E说明为将在R不在范围外部时利用的默认内插因数组。在一个实例中,TH1=0.3且TH2=0.5。
在另一方法中,可基于先前帧第一反射系数(例如,R0n-1)和当前帧第一反射系数(例如,R0n)和/或预测模式指示符731确定内插因数组。例如,如果先前帧第一反射系数大于第一阈值(例如,R0n-1>TH1)且当前帧第一反射系数小于第二阈值(例如,R0n<TH2),那么可确定不同内插因数组。例如,R0n-1>TH1可指示高度无声的先前帧,而R0n<TH2可指示高度有声的当前帧。在此情况下,内插因数组确定模块765可确定减小高度无声帧(例如,帧n-1)的相依性的内插因数组769。此外,类似于如列表(2)中所说明的先前方法,预测模式指示符731可与第一反射系数一起用以确定内插因数组769。
在一些配置中,内插因数组确定模块765可另外或替代地基于先前帧预测模式确定内插因数组769。例如,先前帧预测模式可为在当前帧(例如,帧n)中发送的关于先前帧(例如,被抹除帧n-1)的帧预测模式(例如,预测性或非预测性LSF量化)的旁侧信息。例如,如果预测模式指示符731指示用于帧n-1的LSF量化为非预测性,那么内插因数组确定模块765可选择列表(1)中的对先前帧LSF向量具有最小相依性的Interpolation_factor_set_A。这是因为估计的先前帧末端LSF向量(例如,其可基于帧抹除隐藏而经由外插来加以估计)可能与实际先前帧末端LSF向量差异极大。应注意,先前帧预测模式可为指示先前帧的LSF向量量化取决于先前帧LSF向量的相依性程度的两个或两个以上预测模式中的一者。
在一些配置中,可依据被抹除帧指示符767而调节值确定模块761和/或内插因数组确定模块765的操作。例如,值确定模块761和内插因数组确定模块765可仅在指示被抹除帧之后才对一或多个帧操作。当内插因数组确定模块765不操作时,内插模块749可利用默认内插因数组。在其它配置中,值确定模块761和内插因数组确定模块765可对每一帧操作,而不顾和帧抹除。
经解量化的LSF向量747和经解量化的加权向量739可提供到内插模块749。内插模块749可基于经解量化的LSF向量747(例如,当前帧末端LSF向量和先前帧末端LSF向量)以及经解量化的加权向量739(例如,当前帧加权向量wn)来确定当前帧中间LSF向量(例如,)。可例如根据方程式(1)实现此操作。
内插模块749基于内插因数组769内插经解量化的LSF向量747和当前帧中间LSF向量以便产生子帧LSF向量(例如,用于当前帧的子帧LSF向量)。例如,内插模块749可基于和使用内插因数αk和βk根据方程式 内插子帧LSF向量内插因数αk和βk可使得0≤(αk,βk)≤1。此处,k为整数子帧编号,其中1≤k≤K-1,其中K为当前帧中的子帧的总数。内插模块749因此内插对应于当前帧中的每一子帧的LSF向量。
内插模块749将LSF向量751提供到反系数变换753。反系数变换753将LSF向量751变换成系数755(例如,用于合成滤波器的滤波器系数1/A(z))。系数755提供到合成滤波器757。
反量化器B773接收经编码激发信号798并对其进行解量化以产生激发信号775。在一个实例中,经编码激发信号798可包含固定码本索引、经量化固定码本增益、自适应性码本索引和经量化自适应性码本增益。在此实例中,反量化器B773基于固定码本索引查找固定码本输入项(例如,向量),且将经解量化的固定码本增益应用到固定码本输入项以获得固定码本贡献。此外,反量化器B773基于自适应性码本索引查找自适应性码本输入项,且将经解量化的自适应性码本增益应用于自适应性码本输入项以获得自适应性码本贡献。反量化器B773可接着对固定码本贡献和自适应性码本贡献进行求和以产生激发信号775。
合成滤波器757根据系数755对激发信号775进行滤波以产生经解码语音信号759。例如,可根据系数755配置合成滤波器757的极点。激发信号775接着传递经过合成滤波器757以产生经解码语音信号759(例如,合成语音信号)。
图8为说明用于通过电子装置737确定内插因数组的方法800的一个配置的流程图。电子装置737可基于当前帧特性和先前帧特性确定一值763(802)。在一个实例中,电子装置737可基于当前帧合成滤波器脉冲响应能量与先前帧合成滤波器脉冲响应能量确定能量比率,如结合图7所描述。在其它实例中,电子装置737可将值763确定为多个反射系数或频谱倾斜,如上文结合图7所描述。
电子装置737可确定所述值763是否在一个范围之外(804)。例如,电子装置737可基于一或多个阈值确定值763是否在一个范围之外(804),如上文结合图7所描述。例如,电子装置737可确定能量比率(R)是否小于一或多个阈值和/或大于一或多个阈值(804)。另外或替代地,电子装置737可确定先前帧第一反射系数(例如,R0n-1)是否大于第一阈值和当前帧第一反射系数(例如,R0n)是否小于第二阈值(804)。
如果值763不在所述范围之外(例如,在所述范围之内),那么电子装置737可利用默认内插因数组(810)。例如,电子装置737可基于当前帧末端LSF向量、当前帧中间LSF向量和先前帧末端LSF向量应用默认内插因数组来内插子帧LSF。
如果所述值在所述范围之外,那么电子装置737可基于所述值763和预测模式指示符731确定内插因数组769(806)。例如,如果值763在所述范围之外,那么电子装置737可基于所述值763和预测模式指示符731从内插因数组的群组确定(例如,选择)内插因数组769(806),如上文结合图7所描述。例如,可基于预测模式(例如,当前帧预测模式和/或先前帧预测模式)和/或基于值763在所述范围之外的程度(如基于在范围之外的一或多个阈值而确定)确定不同内插因数组(806)。在一些配置中,在所述值在范围之外时确定(806)的内插因数组可不为默认内插因数组。
电子装置737可基于内插因数组769内插子帧LSF向量,如上文结合图7所描述。例如,基于内插因数组769内插子帧LSF向量可包含用第一内插因数(例如,αk)乘以当前帧末端LSF向量(例如,)、用第二内插因数(例如,βk)乘以先前帧末端LSF向量(例如,)和用差因数(例如,(1-αk-βk))乘以当前帧中间LSF向量(例如,)。可对于帧中的每一子帧k针对对应内插因数(例如,αk和βk)重复此操作。可例如根据方程式(2)实现此操作。
电子装置737可合成语音信号(808)。例如,电子装置737可通过使激发信号775传递经过合成滤波器757而合成语音信号,如上文结合图7所描述。合成滤波器757的系数755可基于基于内插因数组769而内插的LSF向量751。在一些配置和/或情况下,可对于一或多个帧重复方法800。
应注意,在一些配置中,可组合结合图8描述的步骤、功能或程序中的一或多者。例如,电子装置737的一些配置可作为相同步骤的部分确定值763是否在范围之外(804)且基于所述值和预测模式指示符731确定内插因数组(806)。也应注意,在一些配置中,可将所述步骤、功能或程序中的一或多者划分成多个步骤、功能或程序。
应注意,增强型可变速率编解码器B(EVRC-B)可利用方法来使用第一反射系数在当前帧(例如,帧n)与先前帧(例如,帧n-1)之间的变化终止对先前帧LSF向量的相依性。然而,本文中所揭示的***和方法至少出于以下原因而不同于所述方法。
已知方法完全去除对应于被抹除帧的估计的先前帧末端LSF向量的相依性。然而,本文中所揭示的***和方法的一些配置利用对应于被抹除帧的估计的先前帧末端此外,本文中所揭示的***和方法的一些配置利用自适应性内插技术以实现更平滑的复原。例如,可自适应性地而非简单地利用默认内插因数组来确定内插因数组。此外,本文中所揭示的***和方法的一些配置在LSF内插过程中除先前帧末端LSF向量和当前帧末端LSF向量以外也利用中间LSF向量(例如,)。
本文中所揭示的***和方法的一些配置在LSF内插因数组确定过程中利用当前帧预测模式(如由例如预测模式指示符所指示)。已知方法可仅取决于帧的类型(例如,通过使用第一反射系数),而本文中所揭示的***和方法可通过考虑帧预测模式(例如,由LSF量化器所利用的预测)而利用帧特性以及错误传播的可能性。
图9为说明值确定模块961a到961c的实例的框图。明确地说,值确定模块A961a、值确定模块B961b和值确定模块C961c可为结合图7描述的值确定模块761的实例。值确定模块A961a、值确定模块B961b和值确定模块C961c和/或其一或多个组件可以硬件(例如,电路)、软件或两者的组合加以实施。
值确定模块A961a基于当前帧特性(例如,当前帧合成滤波器脉冲能量(例如,En))和先前帧特性(例如,先前帧合成滤波器脉冲响应能量(例如,En-1))确定能量比率933(例如,R)。能量比率933可为结合图7描述的值763的一个实例。值确定模块A961a包含反系数变换977、脉冲响应确定模块979和能量比率确定模块981。
反系数变换977从经解量化的LSF向量A947a获得当前帧末端LSF向量(例如,)和先前帧末端LSF向量(例如,)。反系数变换977变换当前帧末端LSF向量和先前帧末端LSF向量以分别获得用于当前帧末端合成滤波器(例如,)和先前帧末端合成滤波器(例如,)的系数。用于当前帧末端合成滤波器和先前帧末端合成滤波器的系数经提供到脉冲响应确定模块979。
脉冲响应确定模块979确定当前帧末端合成滤波器和先前帧末端合成滤波器的脉冲响应。例如,脉冲响应确定模块979通过脉冲信号激发当前帧末端合成滤波器和先前帧末端合成滤波器,其产生经截断脉冲响应(例如,hn-1(i)和hn(i))。所述经截断脉冲响应提供到能量比率确定模块981。
能量比率确定模块981根据方程式(3)确定经截断当前帧合成滤波器脉冲能量(例如,En)和经截断先前帧合成滤波器脉冲响应能量(例如,En-1)。能量比率确定模块981接着根据方程式(4)确定当前帧合成滤波器脉冲能量(例如,En)与先前帧合成滤波器脉冲响应能量(例如,En-1)之间的能量比率933。
值确定模块B961b基于语音信号901确定频谱倾斜935。值确定模块B961b包含频谱能量确定模块983和频谱倾斜确定模块985。频谱能量确定模块983可获得语音信号901。频谱能量确定模块983可经由快速傅立叶变换(FFT)将先前帧语音信号和当前帧语音信号变换成先前帧频域语音信号和当前帧频域语音信号。
频谱能量确定模块983可确定先前帧低频带频谱能量和先前帧高频带频谱能量。例如,先前帧频域语音信号和当前帧频域语音信号中的每一者可被***成若干频带以便计算每频带的能量。例如,频谱能量确定模块983可对先前帧频域语音信号的下半部分中的每一样本的平方求和以便获得先前帧低频带频谱能量。此外,频谱能量确定模块983可对先前帧频域语音信号的上半部分中的每一样本的平方求和以便获得先前帧上部频带频谱能量。
频谱能量确定模块983可确定当前帧低频带频谱能量和当前帧高频带频谱能量。例如,频谱能量确定模块983可对当前帧频域语音信号的下半部分中的每一样本的平方求和以便获得当前帧低频带频谱能量。此外,频谱能量确定模块983可对当前帧频域语音信号的上半部分中的每一样本的平方求和以便获得当前帧上部频带频谱能量。
先前帧低频带频谱能量、先前帧高频带频谱能量、当前帧低频带频谱能量和当前帧高频带频谱能量可提供到频谱倾斜确定模块985。频谱倾斜确定模块985将先前帧频带频谱能量除以先前帧低频带频谱能量以产生先前帧频谱倾斜。频谱倾斜确定模块985将当前帧高频带频谱能量除以当前帧低频带频谱能量以产生当前帧频谱倾斜。先前帧频谱倾斜935和当前帧频谱倾斜935可提供为值763。
值确定模块C961c基于LPC系数903确定第一反射系数907(例如,先前帧第一反射系数和当前帧第一反射系数)。例如,值确定模块C961c包含第一反射系数确定模块905。在一些配置中,第一反射系数确定模块905可根据列表(3)基于LPC系数903确定第一反射系数907。明确地说,列表(3)说明可用以将LPC系数903转换成第一反射系数907的C码的一个实例。可利用确定第一反射系数的其它已知方法。应注意,尽管第一反射系数907可传达频谱倾斜,但其在数值上可能不等于如由值确定模块B961b确定的频谱倾斜935(例如,高频带能量与低频带能量的比率)。
列表(3)
图10为说明内插因数组确定模块1065的一个实例的框图。内插因数组确定模块1065可以硬件(例如,电路)、软件或两者的组合加以实施。内插因数组确定模块1065包含阈值1087和内插因数组1089。阈值1087中的一或多者指定一个范围,如上文结合图7所描述。
内插因数组确定模块1065获得值1063(例如,能量比率933、一或多个频谱倾斜935和/或一或多个第一反射系数907)。内插因数组确定模块1065可确定值1063是否在范围之外,且可在值1063在所述范围之外的情况下基于所述值1063和预测模式指示符1031确定内插因数组1069。
在如上文结合列表(1)和列表(2)所描述的一个实例中,值1063为能量比率R,且内插因数组确定模块1065包含两个阈值:第一阈值TH1和第二阈值TH2。此外,内插因数组确定模块1065包含五个内插因数组1089,其中Interpolation_factor_set_E为默认内插因数组。此外,在此实例中,预测模式指示符1031可仅指示用于当前帧的两个预测模式中的一者:预测性或非预测性。
在此实例中,范围由第二阈值TH2指定。如果能量比率R大于或等于第二阈值TH2,那么能量比率R在范围内,且内插因数组确定模块1065将默认内插因数组(Interpolation_factor_set_E)提供为内插因数组1069。然而,如果能量比率R小于第二阈值TH2,那么内插因数组确定模块1065将基于能量比率R和1031确定内插因数组1089中的一者。
具体地说,如果能量比率R小于第一阈值TH1且预测模式指示符1031指示非预测性模式,那么内插因数组确定模块1065将Interpolation_factor_set_A提供为内插因数组1069。如果能量比率R小于第一阈值TH1且预测模式指示符1031指示预测性模式,那么内插因数组确定模块1065将Interpolation_factor_set_B提供为内插因数组1069。如果能量比率R(大于第一阈值TH1且)小于第二阈值TH2且预测模式指示符1031指示非预测性模式,那么内插因数组确定模块1065将Interpolation_factor_set_C提供为内插因数组1069。如果能量比率R(大于第一阈值TH1且)小于第二阈值TH2且预测模式指示符1031指示预测性模式,那么内插因数组确定模块1065将Interpolation_factor_set_D提供为内插因数组1069。
在另一实例中,值1063为一组反射系数,包含先前帧第一反射系数R0n-1和当前帧第一反射系数R0n。此外,内插因数组确定模块1065包含两个阈值:第一阈值TH1和第二阈值TH2(不应与描述于先前实例和列表(2)中的阈值TH1和TH2混淆)。此外,内插因数组确定模块1065包含三个内插因数组1089,其中第三内插因数组为默认内插因数组。此外,在此实例中,预测模式指示符1031可仅指示用于当前帧的两个预测模式中的一者:预测性或非预测性。
在此实例中,范围为由第一阈值TH1和第二阈值TH2指定的多维范围。如果先前帧第一反射系数R0n-1小于或等于第一阈值TH1且当前帧第一反射系数R0n大于或等于第二阈值TH2,那么值1063在所述范围之内,且内插因数组确定模块1065将默认内插因数组(Interpolation_factor_set_C)提供为内插因数组1069。
如果先前帧第一反射系数R0n-1大于第一阈值TH1且当前帧第一反射系数R0n小于第二阈值TH2,那么值1063在所述范围之外。在此情况下,内插因数组确定模块1065在预测模式指示符1031指示当前帧预测模式为非预测性的情况下将第一内插因数组1089提供为内插因数组1069,或在预测模式指示符1031指示当前帧预测模式为预测性的情况下将第二内插因数组1089提供为内插因数组1069。
图11为说明确定内插因数组的一个实例的图。明确地说,图11说明根据列表(2)基于能量比率1191和预测模式指示符确定内插因数组的实例。在此实例中,第一阈值1193a(TH1)为0.3,且第二阈值1193b(TH2)为0.5。如所说明,范围1195由第二阈值1193b指定(例如,范围1195大于或等于第二阈值1193b),且第一阈值1193a在范围1195之外。
如果能量比率1191在所述范围1195之内,那么电子装置737可利用为默认内插因数组的Interpolation_factor_set_E1199。如果能量比率1191小于第一阈值1193a(在范围1195之外)且当前帧预测模式为非预测性,那么电子装置737可确定Interpolation_factor_set_A1197a。如果能量比率1191小于第一阈值1193a(在范围1195之外)且当前帧预测模式为预测性,那么电子装置737可确定Interpolation_factor_set_B1197b。如果能量比率1191大于或等于第一阈值1193a且小于第二阈值1193b(在范围1195之外)且当前帧预测模式为非预测性,那么电子装置737可确定Interpolation_factor_set_C1197c。如果能量比率1191大于或等于第一阈值1193a且小于第二阈值1193b(在范围1195之外)且当前帧预测模式为预测性,那么电子装置737可确定Interpolation_factor_set_D1197d。
图12为说明确定内插因数组的另一实例的图。明确地说,图12说明基于当前帧第一反射系数1201、先前帧第一反射系数1203和预测模式指示符确定内插因数组的实例。在此实例中,第一阈值1211a(TH1)为0.65,且第二阈值1211b(TH2)为-0.42。如所说明,范围1209为由第一阈值1211a和第二阈值1211b指定的多维范围(例如,范围1209对于先前帧第一反射系数维度小于或等于第一阈值1211a,且对于当前帧第一反射系数维度大于或等于第二阈值1211b)。
如果由先前帧第一反射系数1203和当前帧第一反射系数指示的值在范围1209之内,那么电子装置737可利用为默认内插因数组的第三内插因数组1207。如果先前帧第一反射系数1203大于第一阈值1211a且当前帧第一反射系数1201小于第二阈值1211b(在范围1209之外)且当前帧预测模式为非预测性,那么电子装置737可确定第一内插因数组1205a。如果先前帧第一反射系数1203大于第一阈值1211a且当前帧第一反射系数1201小于第二阈值1211b(在范围1209之外)且当前帧预测模式为预测性,那么电子装置737可确定第二内插因数组1205b。
更具体地说,检查先前帧第一反射系数1203是否将>0.65。无声帧通常具有大的正第一反射系数。此外,检查当前帧第一反射系数1201是否将<-0.42。有声帧通常具有大的负第一反射系数。电子装置737在其中先前帧第一反射系数1203指示先前帧为无声帧且当前帧第一反射系数1201指示当前帧为有声帧的这些条件下可利用自适应性LSF内插。
在一些配置中,可使用额外或替代阈值。例如,电子装置可在先前帧为有声且当前帧为无声的相反情形中利用自适应性LSF内插(例如,确定其它内插因数组)。例如,如果先前帧第一反射系数小于第三阈值(例如,<-0.42,指示有声帧)且当前帧第一反射系数大于第四阈值(例如,>0.65,指示无声帧),那么电子装置737可在当前帧预测模式为非预测性的情况下确定第四内插因数组,或可在当前帧预测模式为预测性的情况下确定第五内插因数组。
图13包含合成语音波形的实例的曲线图1319a到1319c。曲线图1319a到1319c的横轴是按时间1315(例如,分钟、秒、毫秒)加以说明。曲线图1319a到1319c的纵轴是按相应振幅1313a到1313c(例如,电压或电流的样本振幅)加以说明。图13指示合成语音波形的一个20ms帧1317。
曲线图A1319a说明合成语音波形的一个实例,其中尚未出现帧抹除(例如,在清洁信道情况中)。因此,曲线图A1319a的帧1317可经观测以作为参考用于比较。
曲线图B1319b说明合成语音波形的另一实例。曲线图B1319b中的帧1317为被抹除帧之后的第一个正确接收的帧。在曲线图B1319b中,本文中所揭示的***和方法不适用于帧1317。如可观测到,曲线图B1319b中的帧1317展现伪声1321,伪声1321在结合曲线图A1319a所描述的情况下并不出现。
曲线图C1319c说明合成语音波形的另一实例。曲线图C1319c中的帧1317为被抹除帧之后的第一个正确接收的帧。在曲线图C1319c中,本文中所揭示的***和方法适用于帧1317。例如,电子装置737可基于用于帧1317(例如,方程式(2)中的帧n)的值763和预测模式指示符731确定内插因数组。如可观测到,曲线图C1319c中的帧1317不展现曲线图B1319b中的帧1317的语音伪声1321。例如,本文中所描述的自适应性LSF内插方案可避免或减少被抹除帧之后的合成语音中的语音伪声。
图14包含合成语音波形的额外实例的曲线图1419a到1419c。曲线图1419a到1419c的横轴是按时间1415(例如,分钟、秒、毫秒)加以说明。曲线图1419a到1419c的纵轴是按相应振幅1413a到1413c(例如,电压或电流的样本振幅)加以说明。图14指示合成语音波形的一个20ms帧1417。
曲线图A1419a说明合成语音波形的一个实例,其中尚未出现帧抹除(例如,在清洁信道情况中)。因此,曲线图A1419a的帧1417可经观测以作为参考用于比较。
曲线图B1419b说明合成语音波形的另一实例。曲线图B1419b中的帧1417为被抹除帧之后的第一个正确接收的帧。在曲线图B1419b中,本文中所揭示的***和方法不适用于帧1417。如可观测到,曲线图B1419b中的帧1417展现伪声1421,伪声1421在结合曲线图A1419a所描述的情况下并不出现。
曲线图C1419c说明合成语音波形的另一实例。曲线图C1419c中的帧1417为被抹除帧之后的第一个正确接收的帧。在曲线图C1419c中,本文中所揭示的***和方法适用于帧1417。例如,电子装置737可基于用于帧1417(例如,方程式(2)中的帧n)的值763和预测模式指示符731确定内插因数组。如可观测到,曲线图C1419c中的帧1417不展现曲线图B1419b中的帧1417的语音伪声1421。例如,本文中所描述的自适应性LSF内插方案可避免或减少被抹除帧之后的合成语音中的语音伪声。
图15为说明无线通信装置1537的一个配置的框图,在所述无线通信装置1537中可实施用于确定内插因数组的***和方法。图15中所说明的无线通信装置1537可为本文中所描述的电子装置中的至少一者的实例。无线通信装置1537可包含应用处理器1533。应用处理器1533通常处理指令(例如,运行程序)以执行无线通信装置1537上的功能。应用处理器1533可耦合到音频译码器/解码器(编解码器)1531。
音频编解码器1531可用于对音频信号进行译码和/或解码。音频编解码器1531可耦合到至少一个扬声器1523、听筒1525、输出插口1527和/或至少一个麦克风1529。扬声器1523可包含将电或电子信号转换成声波信号的一或多个电声转换器。例如,扬声器1523可用以播放音乐或输出扬声器电话交谈等。听筒1525可为可用以将声波信号(例如,语音信号)输出到用户的另一扬声器或电声转换器。例如,可使用听筒1525而使得仅一个用户可可靠地听到声学信号。输出插口1527可用于将例如头戴式耳机的其它装置耦合到无线通信装置1537以用于输出音频。扬声器1523、听筒1525和/或输出插口1527可通常用于从音频编解码器1531输出音频信号。至少一个麦克风1529可为将声学信号(例如用户的话音)转换成提供到音频编解码器1531的电或电子信号的声电转换器。
音频编解码器1531(例如,解码器)可包含值确定模块1561和/或内插因数组确定模块1565。值确定模块1561可如上文所描述而确定值。内插因数组确定模块1565可如上文所描述而确定内插因数组。
应用处理器1533也可耦合到电力管理电路1543。电力管理电路1543的一个实例为电力管理集成电路(PMIC),其可用以管理无线通信装置1537的电力消耗。电力管理电路1543可耦合到电池组1545。电池组1545可通常将电力提供到无线通信装置1537。例如,电池组1545和/或电力管理电路1543可耦合到包含于无线通信装置1537中的元件中的至少一者。
应用处理器1533可耦合到用于接收输入的至少一个输入装置1547。输入装置1547的实例包含红外线传感器、图像传感器、加速度计、触摸传感器、小键盘等。输入装置1547可允许用户与无线通信装置1537交互。应用处理器1533也可耦合到一或多个输出装置1549。输出装置1549的实例包含打印机、投影仪、屏幕、触觉装置等。输出装置1549可允许无线通信装置1537产生可由用户体验的输出。
应用处理器1533可耦合到应用存储器1551。应用存储器1551可为能够存储电子信息的任何电子装置。应用存储器1551的实例包含双数据速率同步动态随机存取存储器(DDRAM)、同步动态随机存取存储器(SDRAM)、快闪存储器等。应用存储器1551可为应用处理器1533提供存储。例如,应用存储器1551可存储用于使在应用处理器1533上运行的程序行使功能的数据和/或指令。
应用处理器1533可耦合到显示控制器1553,显示控制器1553又可耦合到显示器1555。显示控制器1553可为用以在显示器1555上产生图像的硬件块。例如,显示控制器1553可将来自应用处理器1533的指令和/或数据转译成可呈现在显示器1555上的图像。显示器1555的实例包含液晶显示器(LCD)面板、发光二极管(LED)面板、阴极射线管(CRT)显示器、等离子显示器等。
应用处理器1533可耦合到基带处理器1535。基带处理器1535通常处理通信信号。例如,基带处理器1535可对所接收的信号进行解调制和/或解码。另外或替代地,基带处理器1535可对信号进行编码和/或调制以准备传输。
基带处理器1535可耦合到基带存储器1557。基带存储器1557可为能够存储电子信息的任何电子装置,例如,SDRAM、DDRAM、快闪存储器等。基带处理器1535可从基带存储器1557读取信息(例如,指令和/或数据)和/或将信息写入到基带存储器1557。另外或替代地,基带处理器1535可使用存储于基带存储器1557中的指令和/或数据来执行通信操作。
基带处理器1535可耦合到射频(RF)收发器1536。RF收发器1536可耦合到功率放大器1539和一或多个天线1541。RF收发器1536可发射和/或接收射频信号。例如,RF收发器1536可使用功率放大器1539和至少一个天线1541发射RF信号。RF收发器1536也可使用所述一或多个天线1541接收RF信号。应注意,包含于无线通信装置1537中的元件中的一或多者可耦合到可致能元件之间的通信的通用总线。
图16说明可用于电子装置1637中的各种组件。所说明组件可位于同一物理结构内或位于单独外壳或结构中。可根据本文中所描述的装置中的一或多者实施结合图16描述的电子装置1637。电子装置1637包含处理器1673。处理器1673可为通用单芯片或多芯片微处理器(例如,ARM)、专用微处理器(例如,数字信号处理器(DSP))、微控制器、可编程门阵列等。处理器1673可被称为中央处理单元(CPU)。尽管图16的电子装置1637中仅展示单一处理器1673,但在一替代配置中,可使用处理器的组合(例如,ARM和DSP)。
电子装置1637也包含与处理器1673电子通信的存储器1667。即,处理器1673可从存储器1667读取信息和/或将信息写入到存储器1667。存储器1667可为能够存储电子信息的任何电子组件。存储器1667可为随机存取存储器(RAM)、只读存储器(ROM)、磁盘存储媒体、光学存储媒体、RAM中的快闪存储器装置、与处理器包含在一起的机载存储器、可编程只读存储器(PROM)、可抹除可编程只读存储器(EPROM)、电可抹除PROM(EEPROM)、寄存器等等,包含其组合。
数据1671a和指令1669a可存储在存储器1667中。所述指令1669a可包含一或多个程序(program)、例程、子例程、函数、程序(procedure)等。所述指令1669a可包含单一计算机可读陈述式或许多计算机可读陈述式。所述指令1669a可由处理器1673执行以实施上文所述的方法、功能和程序中的一或多者。执行所述指令1669a可涉及使用存储在存储器1667中的数据1671a。图16展示载入于处理器1673中的一些指令1669b和数据1671b(其可来自指令1669a和数据1671a)。
电子装置1637也可包含用于与其它电子装置通信的一或多个通信接口1677。通信接口1677可基于有线通信技术、无线通信技术,或两者。不同类型的通信接口1677的实例包含串列端口、平行端口、通用串列总线(USB)、以太网配接器、IEEE1394总线接口、小计算机***接口(SCSI)总线接口、红外线(IR)通信端口、蓝牙无线通信配接器等等。
电子装置1637也可包含一或多个输入装置1679和一或多个输出装置1683。不同种类的输入装置1679的实例包含键盘、鼠标、麦克风、遥控装置、按钮、操纵杆、轨迹球、触控板、光笔等。例如,电子装置1637可包含用于捕获声波信号的一或多个麦克风1681。在一个配置中,麦克风1681可为将声波信号(例如,话音、语音)转换成电或电子信号的转换器。不同种类的输出装置1683的实例包含扬声器、打印机等。例如,电子装置1637可包含一或多个扬声器1685。在一个配置中,扬声器1685可为将电或电子信号转换成声波信号的转换器。可通常包含于电子装置1637中的一个特定类型的输出装置为显示装置1687。配合本文中所揭示的配置使用的显示装置1687可利用任何适当的图像投影技术,例如,阴极射线管(CRT)、液晶显示器(LCD)、发光二极管(LED)、气体等离子、电致发光或其类似者。显示控制器1689也可经提供而用于将存储于存储器1667中的数据转换成在显示装置1687上展示的文字、图形和/或移动图像(在适当的情况下)。
电子装置1637的各种组件可通过一或多个总线耦合在一起,其可包含功率总线、控制信号总线、状态信号总线、数据总线等。为简单起见,各种总线在图16中说明为总线***1675。应注意,图16仅说明电子装置1637的一个可能配置。可利用各种其它架构和组件。
在以上描述中,参考数字有时已与各种术语结合使用。在术语与一参考数字结合使用的情况下,此可希望指代展示于诸图中的一或多者中的特定元件。在无参考数字而使用术语的情况下,此可希望泛指所述术语而不限于任何特定图。
术语“确定”涵盖多种动作,且因此“确定”可包括计算(calculating、computing)、处理、推导、研究、查找(例如,在表、数据库或另一数据结构中查找)、确定和其类似者。又,“确定”可包含接收(例如,接收信息)、存取(例如,存取存储器中的数据)和其类似者。又,“确定”可包含解析、选择、挑选、建立和其类似者。
片语“基于”并不意味着“仅基于”,除非另有明确指定。换句话说,片语“基于”描述“仅基于”和“至少基于”两者。
应注意,在兼容的情况下,结合本文中所描述的配置中的任一者描述的特征、功能、程序、组件、元件、结构等中的一或多者可与结合本文中所描述的其它配置中的任一者描述的功能、程序、组件、元件、结构等中的一或多者加以组合。换句话说,可根据本文中所揭示的***和方法实施本文中所描述的功能、程序、组件、元件等的任何兼容组合。
可将本文中所描述的功能作为一或多个指令存储于处理器可读或计算机可读媒体上。术语“计算机可读媒体”指可由计算机或处理器存取的任何可用媒体。作为实例而非限制,此类媒体可包括RAM、ROM、EEPROM、快闪存储器、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置或可用以存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。如本文所使用,磁盘和光盘包含紧密光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软碟和光盘,其中磁盘通常以磁性方式重现数据,而光盘通过激光以光学方式重现数据。应注意,计算机可读媒体可为有形的和非暂时性的。术语“计算机程序产品”指计算装置或处理器,其与可由所述计算装置或处理器执行、处理或计算的代码或指令(例如,“程序”)相组合。如本文所使用,术语“代码”可指可由计算装置或处理器执行的软件、指令、代码或数据。
软件或指令也可经由传输媒体加以传输。例如,如果使用同轴电缆、光缆、双绞线、数字用户线(DSL)或例如红外线、无线电和微波的无线技术从网站、服务器或其它远程源传输软件,那么同轴电缆、光缆、双绞线、DSL或例如红外线、无线电和微波的无线技术包含于传输媒体的定义中。
本文中所揭示的方法包括用于达成所描述方法的一或多个步骤或动作。所述方法步骤和/或动作可彼此互换而不脱离权利要求书的范围。换句话说,除非对于所描述方法的恰当操作需要步骤或动作的特定次序,否则可修改特定步骤和/或动作的次序和/或使用而不脱离权利要求书的范围。
应理解,权利要求书不限于上文所说明的精确配置和组件。可在本文中所描述的***、方法和设备的布置、操作和细节中进行各种修改、改变和变化而不脱离权利要求书的范围。
Claims (50)
1.一种用于通过电子装置确定内插因数组的方法,其包括:
基于当前帧特性和先前帧特性确定值;
确定所述值是否在一范围之外;
在所述值在所述范围之外的情况下基于所述值和预测模式指示符确定内插因数组;以及
合成语音信号。
2.根据权利要求1所述的方法,其中确定所述内插因数组是基于所述值在所述范围之外的程度。
3.根据权利要求2所述的方法,其中基于在所述范围之外的一或多个阈值确定所述值在所述范围之外的所述程度。
4.根据权利要求1所述的方法,其中所述预测模式指示符指示两个预测模式中的一者。
5.根据权利要求1所述的方法,其中所述预测模式指示符指示三个或三个以上预测模式中的一者。
6.根据权利要求1所述的方法,其中所述值为基于当前帧合成滤波器脉冲响应能量和先前帧合成滤波器脉冲响应能量的能量比率。
7.根据权利要求6所述的方法,其中确定所述值是否在所述范围之外包括确定所述能量比率是否小于阈值。
8.根据权利要求1所述的方法,其中所述值包含当前帧第一反射系数和先前帧第一反射系数。
9.根据权利要求8所述的方法,其中确定所述值是否在所述范围之外包括确定所述先前帧第一反射系数是否大于第一阈值和所述当前帧第一反射系数是否小于第二阈值。
10.根据权利要求1所述的方法,其中所述内插因数组包含两个或两个以上内插因数。
11.根据权利要求1所述的方法,其进一步包括基于所述内插因数组内插子帧线谱频率LSF向量。
12.根据权利要求11所述的方法,其中基于所述内插因数组内插子帧LSF向量包括用第一内插因数乘以当前帧末端LSF向量、用第二内插因数乘以先前帧末端LSF向量和用差因数乘以当前帧中间LSF向量。
13.根据权利要求1所述的方法,其进一步包括在所述值不在所述范围之外的情况下利用默认内插因数组。
14.根据权利要求1所述的方法,其中所述预测模式指示符指示当前帧的预测模式。
15.根据权利要求1所述的方法,其中所述预测模式指示符指示先前帧的预测模式。
16.一种用于确定内插因数组的电子装置,其包括:
值确定电路,其基于当前帧特性和先前帧特性确定值;
耦合到所述值确定电路的内插因数组确定电路,其中所述内插因数组确定电路确定所述值是否在一范围之外,且在所述值在所述范围之外的情况下基于所述值和预测模式指示符确定内插因数组;以及
合成滤波器电路,其合成语音信号。
17.根据权利要求16所述的电子装置,其中确定所述内插因数组是基于所述值在所述范围之外的程度。
18.根据权利要求17所述的电子装置,其中基于在所述范围之外的一或多个阈值确定所述值在所述范围之外的所述程度。
19.根据权利要求16所述的电子装置,其中所述预测模式指示符指示两个预测模式中的一者。
20.根据权利要求16所述的电子装置,其中所述预测模式指示符指示三个或三个以上预测模式中的一者。
21.根据权利要求16所述的电子装置,其中所述值为基于当前帧合成滤波器脉冲响应能量和先前帧合成滤波器脉冲响应能量的能量比率。
22.根据权利要求21所述的电子装置,其中确定所述值是否在所述范围之外包括确定所述能量比率是否小于阈值。
23.根据权利要求16所述的电子装置,其中所述值包含当前帧第一反射系数和先前帧第一反射系数。
24.根据权利要求23所述的电子装置,其中确定所述值是否在所述范围之外包括确定所述先前帧第一反射系数是否大于第一阈值和所述当前帧第一反射系数是否小于第二阈值。
25.根据权利要求16所述的电子装置,其中所述内插因数组包含两个或两个以上内插因数。
26.根据权利要求16所述的电子装置,其进一步包括耦合到所述内插因数组确定电路的内插电路,所述内插电路基于所述内插因数组内插子帧线谱频率LSF向量。
27.根据权利要求26所述的电子装置,其中基于所述内插因数组内插子帧LSF向量包括用第一内插因数乘以当前帧末端LSF向量、用第二内插因数乘以先前帧末端LSF向量和用差因数乘以当前帧中间LSF向量。
28.根据权利要求16所述的电子装置,其中所述内插因数组确定电路在所述值不在所述范围之外的情况下利用默认内插因数组。
29.根据权利要求16所述的电子装置,其中所述预测模式指示符指示当前帧的预测模式。
30.根据权利要求16所述的电子装置,其中所述预测模式指示符指示先前帧的预测模式。
31.一种用于确定内插因数组的计算机程序产品,其包括上面具有指令的非暂时性有形计算机可读媒体,所述指令包括:
用于使电子装置基于当前帧特性和先前帧特性确定值的代码;
用于使所述电子装置确定所述值是否在一范围之外的代码;
用于使所述电子装置在所述值在所述范围之外的情况下基于所述值和预测模式指示符确定内插因数组的代码;以及
用于使所述电子装置合成语音信号的代码。
32.根据权利要求31所述的计算机程序产品,其中确定所述内插因数组是基于所述值在所述范围之外的程度。
33.根据权利要求31所述的计算机程序产品,其中所述预测模式指示符指示两个预测模式中的一者。
34.根据权利要求31所述的计算机程序产品,其中所述预测模式指示符指示三个或三个以上预测模式中的一者。
35.根据权利要求31所述的计算机程序产品,其中所述值为基于当前帧合成滤波器脉冲响应能量和先前帧合成滤波器脉冲响应能量的能量比率。
36.根据权利要求31所述的计算机程序产品,其中所述值包含当前帧第一反射系数和先前帧第一反射系数。
37.根据权利要求31所述的计算机程序产品,其中所述内插因数组包含两个或两个以上内插因数。
38.根据权利要求31所述的计算机程序产品,其进一步包括用于使所述电子装置基于所述内插因数组内插子帧线谱频率LSF向量的代码。
39.根据权利要求31所述的计算机程序产品,其进一步包括用于使所述电子装置在所述值不在所述范围之外的情况下利用默认内插因数组的代码。
40.根据权利要求31所述的计算机程序产品,其中所述预测模式指示符指示当前帧的预测模式。
41.一种用于确定内插因数组的设备,其包括:
用于基于当前帧特性和先前帧特性确定值的装置;
用于确定所述值是否在一范围之外的装置;
用于在所述值在所述范围之外的情况下基于所述值和预测模式指示符确定内插因数组的装置;以及
用于合成语音信号的装置。
42.根据权利要求41所述的设备,其中确定所述内插因数组是基于所述值在所述范围之外的程度。
43.根据权利要求41所述的设备,其中所述预测模式指示符指示两个预测模式中的一者。
44.根据权利要求41所述的设备,其中所述预测模式指示符指示三个或三个以上预测模式中的一者。
45.根据权利要求41所述的设备,其中所述值为基于当前帧合成滤波器脉冲响应能量和先前帧合成滤波器脉冲响应能量的能量比率。
46.根据权利要求41所述的设备,其中所述值包含当前帧第一反射系数和先前帧第一反射系数。
47.根据权利要求41所述的设备,其中所述内插因数组包含两个或两个以上内插因数。
48.根据权利要求41所述的设备,其进一步包括用于基于所述内插因数组内插子帧线谱频率LSF向量的装置。
49.根据权利要求41所述的设备,其进一步包括用于在所述值不在所述范围之外的情况下利用默认内插因数组的装置。
50.根据权利要求41所述的设备,其中所述预测模式指示符指示当前帧的预测模式。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361767461P | 2013-02-21 | 2013-02-21 | |
US61/767,461 | 2013-02-21 | ||
US14/015,834 US9336789B2 (en) | 2013-02-21 | 2013-08-30 | Systems and methods for determining an interpolation factor set for synthesizing a speech signal |
US14/015,834 | 2013-08-30 | ||
PCT/US2013/057867 WO2014130084A1 (en) | 2013-02-21 | 2013-09-03 | Systems and methods for determining an interpolation factor set |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105074820A true CN105074820A (zh) | 2015-11-18 |
CN105074820B CN105074820B (zh) | 2019-01-15 |
Family
ID=51351892
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380073344.9A Active CN105074820B (zh) | 2013-02-21 | 2013-09-03 | 用于确定内插因数组的***和方法 |
Country Status (24)
Country | Link |
---|---|
US (1) | US9336789B2 (zh) |
EP (1) | EP2959483B1 (zh) |
JP (1) | JP6109968B2 (zh) |
KR (1) | KR101750645B1 (zh) |
CN (1) | CN105074820B (zh) |
AU (1) | AU2013378790B2 (zh) |
BR (1) | BR112015020134B1 (zh) |
CA (1) | CA2898171C (zh) |
DK (1) | DK2959483T3 (zh) |
ES (1) | ES2663013T3 (zh) |
HK (1) | HK1212500A1 (zh) |
HU (1) | HUE036987T2 (zh) |
IL (1) | IL240159B (zh) |
MY (1) | MY182586A (zh) |
PH (1) | PH12015501619B1 (zh) |
PL (1) | PL2959483T3 (zh) |
PT (1) | PT2959483T (zh) |
RU (1) | RU2607260C1 (zh) |
SG (1) | SG11201505450XA (zh) |
SI (1) | SI2959483T1 (zh) |
TW (1) | TWI518677B (zh) |
UA (1) | UA114233C2 (zh) |
WO (1) | WO2014130084A1 (zh) |
ZA (1) | ZA201506959B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016030568A1 (en) * | 2014-08-28 | 2016-03-03 | Nokia Technologies Oy | Audio parameter quantization |
US10847170B2 (en) * | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
CN111554322A (zh) * | 2020-05-15 | 2020-08-18 | 腾讯科技(深圳)有限公司 | 一种语音处理方法、装置、设备及存储介质 |
US20230377587A1 (en) | 2020-10-05 | 2023-11-23 | Nokia Technologies Oy | Quantisation of audio parameters |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5012518A (en) * | 1989-07-26 | 1991-04-30 | Itt Corporation | Low-bit-rate speech coder using LPC data reduction processing |
CN1119058A (zh) * | 1993-12-07 | 1996-03-20 | 艾利森电话股份有限公司 | Tdma无线***中的软纠错 |
CN1470052A (zh) * | 2000-10-18 | 2004-01-21 | ��˹��ŵ�� | 宽带语音编解码器中的高频增强层编码 |
CN1245706C (zh) * | 1999-09-22 | 2006-03-15 | 科恩格森特***股份有限公司 | 多模式语音编码器 |
WO2009059498A1 (fr) * | 2007-11-05 | 2009-05-14 | Huawei Technologies Co., Ltd. | Procédé de traitement de signal, dispositif de traitement et décodeur audio |
WO2010079165A1 (en) * | 2009-01-06 | 2010-07-15 | Skype Limited | Speech encoding |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4975956A (en) | 1989-07-26 | 1990-12-04 | Itt Corporation | Low-bit-rate speech coder using LPC data reduction processing |
US5832436A (en) * | 1992-12-11 | 1998-11-03 | Industrial Technology Research Institute | System architecture and method for linear interpolation implementation |
FR2729247A1 (fr) * | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
JPH09152896A (ja) | 1995-11-30 | 1997-06-10 | Oki Electric Ind Co Ltd | 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置 |
JP2000509847A (ja) * | 1997-02-10 | 2000-08-02 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声信号を伝送する伝送システム |
EP0878790A1 (en) | 1997-05-15 | 1998-11-18 | Hewlett-Packard Company | Voice coding system and method |
US6574593B1 (en) | 1999-09-22 | 2003-06-03 | Conexant Systems, Inc. | Codebook tables for encoding and decoding |
US6604070B1 (en) | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
US20040083097A1 (en) | 2002-10-29 | 2004-04-29 | Chu Wai Chung | Optimized windows and interpolation factors, and methods for optimizing windows, interpolation factors and linear prediction analysis in the ITU-T G.729 speech coding standard |
JP4365653B2 (ja) * | 2003-09-17 | 2009-11-18 | パナソニック株式会社 | 音声信号送信装置、音声信号伝送システム及び音声信号送信方法 |
WO2006009074A1 (ja) * | 2004-07-20 | 2006-01-26 | Matsushita Electric Industrial Co., Ltd. | 音声復号化装置および補償フレーム生成方法 |
CA2603246C (en) * | 2005-04-01 | 2012-07-17 | Qualcomm Incorporated | Systems, methods, and apparatus for anti-sparseness filtering |
FR2884989A1 (fr) * | 2005-04-26 | 2006-10-27 | France Telecom | Procede d'adaptation pour une interoperabilite entre modeles de correlation a court terme de signaux numeriques. |
US8532984B2 (en) * | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
US8260609B2 (en) * | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
CN102682774B (zh) * | 2006-11-10 | 2014-10-08 | 松下电器(美国)知识产权公司 | 参数解码方法及参数解码装置 |
US20090319263A1 (en) | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
US8428938B2 (en) * | 2009-06-04 | 2013-04-23 | Qualcomm Incorporated | Systems and methods for reconstructing an erased speech frame |
WO2011148230A1 (en) | 2010-05-25 | 2011-12-01 | Nokia Corporation | A bandwidth extender |
RU2606552C2 (ru) * | 2011-04-21 | 2017-01-10 | Самсунг Электроникс Ко., Лтд. | Устройство для квантования коэффициентов кодирования с линейным предсказанием, устройство кодирования звука, устройство для деквантования коэффициентов кодирования с линейным предсказанием, устройство декодирования звука и электронное устройство для этого |
-
2013
- 2013-08-30 US US14/015,834 patent/US9336789B2/en active Active
- 2013-09-03 AU AU2013378790A patent/AU2013378790B2/en active Active
- 2013-09-03 HU HUE13770729A patent/HUE036987T2/hu unknown
- 2013-09-03 RU RU2015139814A patent/RU2607260C1/ru active
- 2013-09-03 DK DK13770729.5T patent/DK2959483T3/en active
- 2013-09-03 JP JP2015559225A patent/JP6109968B2/ja active Active
- 2013-09-03 KR KR1020157024862A patent/KR101750645B1/ko active IP Right Grant
- 2013-09-03 ES ES13770729.5T patent/ES2663013T3/es active Active
- 2013-09-03 EP EP13770729.5A patent/EP2959483B1/en active Active
- 2013-09-03 WO PCT/US2013/057867 patent/WO2014130084A1/en active Application Filing
- 2013-09-03 CA CA2898171A patent/CA2898171C/en active Active
- 2013-09-03 BR BR112015020134-2A patent/BR112015020134B1/pt active IP Right Grant
- 2013-09-03 PT PT137707295T patent/PT2959483T/pt unknown
- 2013-09-03 PL PL13770729T patent/PL2959483T3/pl unknown
- 2013-09-03 SI SI201330951T patent/SI2959483T1/en unknown
- 2013-09-03 UA UAA201509011A patent/UA114233C2/uk unknown
- 2013-09-03 CN CN201380073344.9A patent/CN105074820B/zh active Active
- 2013-09-03 MY MYPI2015702607A patent/MY182586A/en unknown
- 2013-09-03 SG SG11201505450XA patent/SG11201505450XA/en unknown
-
2014
- 2014-01-10 TW TW103101043A patent/TWI518677B/zh active
-
2015
- 2015-07-22 PH PH12015501619A patent/PH12015501619B1/en unknown
- 2015-07-27 IL IL240159A patent/IL240159B/en active IP Right Grant
- 2015-09-18 ZA ZA2015/06959A patent/ZA201506959B/en unknown
-
2016
- 2016-01-07 HK HK16100114.3A patent/HK1212500A1/zh unknown
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5012518A (en) * | 1989-07-26 | 1991-04-30 | Itt Corporation | Low-bit-rate speech coder using LPC data reduction processing |
CN1119058A (zh) * | 1993-12-07 | 1996-03-20 | 艾利森电话股份有限公司 | Tdma无线***中的软纠错 |
CN1245706C (zh) * | 1999-09-22 | 2006-03-15 | 科恩格森特***股份有限公司 | 多模式语音编码器 |
CN1470052A (zh) * | 2000-10-18 | 2004-01-21 | ��˹��ŵ�� | 宽带语音编解码器中的高频增强层编码 |
CN1244907C (zh) * | 2000-10-18 | 2006-03-08 | 诺基亚有限公司 | 宽带语音编解码器中的高频增强层编码方法和装置 |
WO2009059498A1 (fr) * | 2007-11-05 | 2009-05-14 | Huawei Technologies Co., Ltd. | Procédé de traitement de signal, dispositif de traitement et décodeur audio |
CN101601217B (zh) * | 2007-11-05 | 2013-01-09 | 华为技术有限公司 | 一种信号处理方法、处理装置以及语音解码器 |
WO2010079165A1 (en) * | 2009-01-06 | 2010-07-15 | Skype Limited | Speech encoding |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10885926B2 (en) | Classification between time-domain coding and frequency domain coding for high bit rates | |
EP3039676B1 (en) | Adaptive bandwidth extension and apparatus for the same | |
CN104995674A (zh) | 用于减低潜在的帧不稳定性的***和方法 | |
CN104937662A (zh) | 用于线性预测译码中的自适应共振峰锐化的***、方法、设备和计算机可读媒体 | |
JP2017161917A (ja) | 平均符号化レートを制御するためのシステムおよび方法 | |
US9208775B2 (en) | Systems and methods for determining pitch pulse period signal boundaries | |
CN105074820A (zh) | 用于确定内插因数组的***和方法 | |
TW201435859A (zh) | 用於量化及解量化相位資訊之系統及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1212500 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |