CN1290077C - 用来对相位谱信息进行子抽样的方法和设备 - Google Patents
用来对相位谱信息进行子抽样的方法和设备 Download PDFInfo
- Publication number
- CN1290077C CN1290077C CNB031458505A CN03145850A CN1290077C CN 1290077 C CN1290077 C CN 1290077C CN B031458505 A CNB031458505 A CN B031458505A CN 03145850 A CN03145850 A CN 03145850A CN 1290077 C CN1290077 C CN 1290077C
- Authority
- CN
- China
- Prior art keywords
- prototype
- phase
- speech coder
- frame
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000001228 spectrum Methods 0.000 title abstract description 28
- 239000013598 vector Substances 0.000 claims abstract description 86
- 230000010363 phase shift Effects 0.000 claims abstract description 28
- 230000015572 biosynthetic process Effects 0.000 claims description 28
- 238000003786 synthesis reaction Methods 0.000 claims description 28
- 238000013139 quantization Methods 0.000 claims description 25
- 238000004891 communication Methods 0.000 claims description 18
- 238000011002 quantification Methods 0.000 claims description 15
- 238000004458 analytical method Methods 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 12
- 230000007704 transition Effects 0.000 description 11
- 238000005070 sampling Methods 0.000 description 10
- 230000000875 corresponding effect Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 239000002131 composite material Substances 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 206010038743 Restlessness Diseases 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 101150012579 ADSL gene Proteins 0.000 description 1
- 102100020775 Adenylosuccinate lyase Human genes 0.000 description 1
- 108700040193 Adenylosuccinate lyases Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/097—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using prototype waveform decomposition or prototype waveform interpolative [PWI] coders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
- Testing Electric Properties And Detecting Electric Faults (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
一种用来对相位谱信息进行子抽样的方法和设备,包括用来通过使用一帧的原型的相位谱信息的智能子抽样对该原型进行分析和重建的语音编码器。为分析原型,语音编码器生成一基准原型的相位参数,生成一当前原型的相位参数,并使当前原型的相位参数与基准原型的相位参数在多个频带中相关。为用线性相移值重建原型,语音编码器生成基准原型的相位参数,生成与原型相关的线性相移值集,并在多个频带上从相位参数和线性相移值相位失量。为用循环旋转值重建原型,语音编码器生成与原型有关的循环旋转值集,生成多个频带中的带通波型集,带通波形与基准原型的相位参数有关,并根据循环旋转值修改带通波形。
Description
本申请是2000年7月18日提交的,申请号为00813001.9,发明名称为《用来对相位谱信息进行子抽样的方法和设备》的申请的分案申请。
发明背景
I.发明领域
本发明总体上涉及语音处理领域,尤其涉及用来对将由语音编码器发送的相位谱信息进行子抽样的方法和设备。
II.背景技术
通过数字技术发送语音已变得普遍,特别是在长途和数字无线电话应用中更是如此。这接着增加了人们对确定在维持重建语音的可感质量的同时能在信道上发送最小信息量的兴趣。如果语音只是简单地通过抽样和数字化来发送,需要在每秒64千比特(kbps)的数量级上的数据速率以取得传统模拟电话的语音质量。然而,通过使用语音分析,加上合适的编码、发送及接收机端的合成,可实现数据速率的显著减少。
压缩语音的设备用于许多电信领域。典型的领域是无线通信。无线通信领域有许多应用,包括,例如,无绳电话、寻呼、无线本地环路,诸如蜂窝和PCS电话***、移动因特网协议(IP)电话和卫星通信***之类的无线电话。一种特别重要的应用是移动用户的无线电话。
至今,已经为包括如频分多址(FDMA),时分多址(TDMA)和码分多址(CDMA)的无线通信***开发了多种空中接口。与之相关,已建立多种国内和国际标准,包括,例如,高级移动电话业务(AMPS)、全球移动通信***(GSM)和过渡标准95(IS-95)。一典型的无线电话通信***是码分多址(CDMA)***。IS-95标准及其变体IS-95A、ANSI J-STD-08、IS-95B、建议第三代标准IS-95C和IS-2000等(此处统称IS-95)由电信工业协会(TIA)及其他广为人知的标准组织分布以说明蜂窝或PCS电话通信***的CDMA空中接口的使用。基本上按照IS-95标准的使用配置的典型无线通信***在专利号为5,103,459和4,901,307的美国专利中有描述,这两个专利已转让给本发明的受让人,在此完全引述供参考。
利用通过析取涉及人类语音生成模型的参数来压缩语音的技术的设备称为语音编码器。语音编码器把输入语音信号分成时间块或分析帧。语音编码器通常包括编码器和解码器。编码器分析输入语音帧以析取一些相关参数,然后把这些参数量化成二进制表示,即,一组数据位或二进制数据分组。数据分组通过通信信道发送给接收机和解码器。解码器处理这些数据分组,对它们进行去量化以生成参数,并用去量化参数重新合成语音帧。
语音编码器的功能是通过去掉语音中固有的全部自然冗余而把数字化语音信号压缩成低比特率信号。数字压缩是通过用一组参数来代表输入语音帧并采用量化而用一组数据位来代表这些参数而实现的。如果输入语音帧有几个比特Ni且由语音编码器生成的数据分组有几个比特No,则由语音编码器取得的压缩系数是Cr=Ni/No。我们所面临的挑战是,在取得目标压缩系数的同时,保持解码语音的高语音质量。语音编码器的性能取决于(1)语音模型或上述分析与合成过程的组合的工作情况是否良好;以及(2)参数量化过程以每秒No比特的目标比特率执行的情况。语音模型的目标因而是用每个帧的一小组参数来捕获语音信号的要素或目标语音质量。
或许语音编码器的设计中最重要的是对描述语音信号的好参数(包括失量)组的搜索。一组好参数要求在重建感知上精确的语音信号时采用低***带宽。音调、信号功率、频谱包络(或其共振峰)、振幅谱和相位谱是语音编码参数的例子。
语音编码器可实施为时域编码器,它试图通过利用高时间分辨率来处理以一次对小语音段(通常为5毫秒(ms)子帧)编码而捕获时域语音波形。对每个子帧,来自电码本空间的高准确度表示是通过业界已知的多种搜索算法发现的。或者,语音编码器可实施为频域编码器,它试图用参数(分析)组捕获输入语音帧的短期语音频谱并利用相应的合成过程以从频谱参数重新生成语音波形。参数量化器通过用存储码矢量来表示它们而按照A.Gersho和R.M.Gray所著的“Vector Quantization and Signal Compression”(1992年版)中描述的已知的量化技术保存这些参数。
广为人知的时域语音编码器是L.B Rabiner和R.W.Schafer所著的“DigitalProcessing of Speech Signals”(396-453,1978年)中描述的码激励线性预测(CELP)编码器,在此完全引述供参考。在CELP编码器中,语音信号中的短期相关或冗余通过线性预测(LP)分析而去除,线性预测分析找到短期共振峰滤波器的系数。把短期预测滤波器用于输入语音帧生成LP剩余信号,用长期预测滤波器参数和后续随机电码本对LP剩余信号进一步建模和量化。这样,CELP编码把对时域语音波形编码的任务分成对LP短期滤波器系数编码与对LP剩余编码这两个独立的任务。时域编码可以固定速率(即,用每个帧的相同数目的比特No)或以可变速率(不同的比特率用于不同类型的帧内容)来执行。可变速率编码器试图只使用把编译码器参数编码成足够获得目标质量的水平所需的比特数量。典型的可变速率CELP编码器在专利号为5,414,796的美国专利中有描述,该专利已转让给本发明的受让人,在此完全引述从参考。
诸如CELP编码器之类的时域编码器通常依赖于高数目的每帧比特数No,以保持时域语音波形的精准性。只要每帧的比特数No的数目相当大(例如,8kbps或以上),这样的编码器通常给出非常好的语音质量。然而,在低比特率(4kbps或以下)时,时域编码器因可供比特数目有限而不能保持高质量和强有力的性能。在低比特率时,有限的电码本空间切断普通时域编码器的波形匹配能力,普通时域编码器布署于较高速率商业应用中是很成功的。因此,尽管随时间的不断改进,许多运行在低比特率的CELP编码***遭遇通常以噪声为特征的感知上重大的失真。
目前对开发运行在中间至低的比特率(即,在2.4至4kbps的范围)的高质量语音编码器有剧升的研究兴趣和强烈的商业需求。应用领域包括无线电话、卫星通信、因特网电话、各种多媒体和语音流应用、语音邮件及其他语音存储***。驱动力是分组数据丢夫情况下对高容量的需要和对健康性能的要求。各种近来的语音编码标准化努力是推动研究和开发低速率语音编码算法的另一直接驱动力。低速率语音编码器按容许应用带宽生成更多信道或用户,且与合适信道编码的添加层耦合的低速率语音编码器能适合于编码器规格总比特预算,而在信道差错条件下提供健全的性能。
以低比特率对语音有效率地编码的一有效技术是多模编码。典型的多模编码技术在1998年12月21日申请的、序列号为09/217,341,标题为“VARIABLERATE SPEECH CODING”的美国申请中有描述,该申请书已转让给本发明的受让人,在此完全引述供参考。普通多模编码器把不同模式或编码一解码算法运用于不同类型的输入语音帧。每个模式或编码一解码过程定制成以最有效方式最佳地表示某种类型的语音段,例如,浊语音、清语音、过渡语音(例如,清和浊之间)及背景噪声(非话音)。外部的开环模式判定机制仔细查看输入语音帧并就哪一种模式适用于该帧作出判定。开环模式判定通常是通过从输入帧析取许多参数,就一些时间和频谱特征评价这些参数,并根据评价来决定模式来进行的。
以在2.4kbps级别上的速率运行的编码***通常本质上是参数的。也就是说,这样的编码***通过以有规律的间隔发送描述语音信号的音节周期和频谱包络(或共振峰)的参数而运行。说明这些所谓参数编码器的是LP声码器***。
LP声码器采用每一音节一个脉冲,周期地对浊语音信号建模。可以增强这一基于技术,从而除其他事物外还包括发送有关频谱包络的信息。尽管LP声码器一般提供合理的性能,它们可带来典型地以蜂音为特征的感知上重大的失真。
近几年中,已出现是波形编码器和参数编码器的混合的编码器。说明这些所谓混合编码器的是原型波形内插(PWI)语音编码器。PWI编码***亦可称为原型音节(pitch)周期(PPP)语音编码器。PWI编码***提供一种用来对浊语音编码的有效方法。PWI的基本概念是以固定间隔析取代表音节周期(原型波形)、发送其描述及通过在原型波形间内插重建语音信号。PWI方法可运行在或者LP剩余信号上或者语音信号上。典型的PWI或PPP语音编码器在1998年12月21日申请的,序列号为09/217,494、标题为“PERIODIC SPEECHCODING”的美国申请中有描述,该申请书已转让给本发明的受让人,在此完全引述供参数。其他PWI或PPP语音编码器在专利号为5,884,253的美国专利及W.Bastiaan Kleign和Wolfgang Granzow所著的“Method for WaveformInterpolation in Speech Coding”(1991年版)的215至230页中有描述。
在许多普通语音编码器中,给定音节原型的相位参数各自单独由编码器量化和发送。或者,相位参数可得到矢量量化以使带宽守恒。然而,在低比特率语音编码器中,发送最小数目的可能维持令人满意的语音质量的比特是有益的。因此,在一些普通语音编码器中,相位参数可根本不是由编码器发送的,而解码器可以或者不把相位用于重建,或者使用固定的存储相位参数组。在这两种情况的任一情况中,结果语音质量可降低。因此,提供一种减小从编码器向解码器发送相位谱信息所必需的单元的数目从而发送较少的相位信息的低速率语音编码器将是理想的。因而,需要一种每帧发送较少相位参数的语音编码器。
发明概要
本发明涉及一种每帧发送较少相位参数的语音编码器。相应地,在本发明的一个方面,一种在语音编码器中处理帧的原型的方法最好包括以下步骤:生成基准原型的多个相位参数、生成原型的多个相位参数,以及在多个频带中,使原型的相位参数和基准原型的相位参数相关联。
在本发明的另一方面,一种在语音编码器中处理帧的原型的方法最好包括以下步骤:生成基准原型的多个相位参数、生成与该原型有关的多个线性相移植,以及在多个频带上从这些相位参数和这些线性相移值合成相位矢量。
在本发明的另一方面,一种在语音编码器中处理帧的原型的方法最好包括以下步骤:生成与该原型有关的多个循环旋转值,在多个频带中生成多个带通波形(多个带通波形与基准原型的多个相位数有关)及根据多个循环旋转值修改多个带通波形。
在本发明的另一方面,一种语音编码器最好包括用来生成帧的基准原型的多个相位参数的装置,用来生成当前帧的当前原型的多个相位参数的装置及用来在多个频带中使当前原型的相位参数和基准原型的相位参数相关联的装置。
在本发明的另一方面,一种语音编码器最好包括用来生成帧的基准原型的多个相位参数的装置,用来生成与当前帧的当前原型关联的多个线性相移值的装置以及用来在多个频带上从这些相位参数和这些线性相移值合成相位矢量的装置。
在本发明的另一方面,一种语音编码器最好包括用来生成与当前帧的当前原型相关联的多个循环旋转值的装置,用来在多个频带中生成多个带通波形的装置(多个带通波形与帧的基准原型的多个相位参数有关)及用来根据多个循环旋转值修改多个带通波形的装置。
在本发明的另一方面,一种语音编码器最好包括配置成从正由语音编码器处理的当前帧析取当前原型的原型析取器,以及耦合到原型析取器并配置成生成帧的基准原型的多个相位参数,生成当前原型的多个相位参数且在多个频带中使当前原型的这些相位参数和基准原型的这些相位参数相关联的原型量化器。
在本发明的另一方面,一种语音编码器最好包括配置成从正由语音编码器处理的当前帧析取当前原型的原型析取器,以及耦合到原型析取器并配置成生成帧的基准原型的多个相位参数,生成与当前原型有关的多个线性相移值且在多个频带上从这些相位参数和线性相移值合成相位矢量的原型量化器。
在本发明的另一方面,语音编码器最好包括配置成从正由语音编码器处理的当前帧析取当前原型的原型析取器,以及耦合到原型析取器并配置成生成与当前原型有关的多个循环旋转值,在多个频带中生成多个带通波形(多个带通波形与帧的基准原型的多个相位参数有关)且根据多个循环旋转值修改多个带通波形的原型量化器。
附图简述
图1是无线电话***的方框图。
图2是由语音编码器终接在每一端的通信信道的方框图。
图3是编码器的方框图。
图4是解码器的方框图。
图5是说明语音编码判定过程的流程图。
图6A是语音信号幅度对时间的曲线图,而图6B是线性预测(LP)剩余幅度对时间的曲线图。
图7是原型音节周期语音编码器的方框图。
图8是可用于图7中的语音编码器中的原型量化器的方框图。
图9是可用于图7中的语音编码器中的原型去量化器的方框图。
图10是可用于图7中的语音编码器中的原型去量化器的方框图。
较佳实施例的详细描述
下文中描述的示例实施例驻留于配置成利用CDMA空中接口的无线电话通信***中。然而,本领域中的熟练人士明白,含有本发明特性的子抽样方法和设备可驻留于利用为本领域中的熟练人士所知的范围广泛的技术的各种通信***中的任一种中。
如图1所示,CDMA无线电话***通常包括多个移动用户单元10、多个基站12、基站控制器(BSC)14及移动交换中心(MSC)16。MSC16配置成与普通公交换电话网(PSTN)18交接(interface)。MSC16亦配置成与BSC14交接。BSC14通过迂回线路耦合到基站12。迂回线路可配置成支持几种已知接口包括(例如):E1/T1、ATM、IP、PPP、帧中继、HDSL、ADSL或XDSL中的任一种。应当理解,***中可有多于两个的BSC14。每个基站12最好包括至少一个扇区(未示出),每个扇区包含一指向一径向离开基站12的特定方向的全向天线或天线。或者,每个扇区可包含用于分集接收的两个天线。每个基站12最好设计成支持多个频率分配。扇区和频率分配的交点可称为CDMA信道。基站12亦可称为基站收发信机子***(BTS)12。或者,“基站”在业界可用来统称BSC14和一个或以上的BTS12。BTS12亦可表示为“区站”12。或者,给定BTS12的单独扇区可称为区站。移动用户单元10通常是蜂窝或PCS电话10。***最好配置成按照IS-95标准使用。
在蜂窝电话***的典型运行期间,基站12接收来自几组移动单元10的几组反向链路信号。移动单元10在进行电话呼叫或其他通信。由一给定基站12接收的每个反向链路信号在该基站12内处理。结果数据提交给BSC14。BSC14提供呼叫资源分配和包括基站12间软切换的协调(orchestration)的移动性管理功能。BSC14还把接收的数据发送给MSC16,MSC16提供用于与PSTN18交接的附加的路由选择业务。类似地,PSTN18与MSC16接口相连,而MSC16与MSC14交接,BSC14依次控制基站12向移动单元组10发送前向链路信号组。
在图2中,第一编码器100接收数字化语音样本S(n),并对这些样本S(n)编码,以在传输媒介102或通信信道102上向第一解码器104发送。解码器104对编码语音样本解码,并合成输出语音信号SSYNTH(n)。为在相反方向发送,第二编码器106对数字化的语音样本S(n)编码,数字化的语音样本S(n)在通信信道108上发送。第二解码器110接收并对编码语音样本解码,生成合成输出语音信号SSYNTH(n)。
语音样本S(n)表示已按照本领域中已知的各种方法,包括(例如),脉码调制(PCM)、压扩μ律或A律中的任一种得到数字化和量化的语音信号。如本领域中所知,语音样本S(n)组织到输入数据帧中,其中,每个帧包含一预置数目的数字化的语音样本S(n)。在一示例实施例中,利用8KHz的抽样率,每个20ms帧包含160个样本。在下面描述的实施例中,数据发送速率最好按帧而异:从13.2kbps(全速率)到6.2kbps(半速率)到2.6kbps(1/4速率)到1kbps(1/8速率)。使数据发送速率各异是有益的,因为对含有相对较少语音信息的帧可以有选择地利用较低比特率。如本领域中的熟练人员所知,可使用其他抽样速率、帧大小和数据发送速率。
第一编码器100与第二解码器110一起含有一个语音编码器或语音编译码器。语音编码器可用于任一用来发送语音信号的通信设备,包括,例如,用户单元,BTS或上面参考图1所述的BSC中。与此类似,第二编码器106和第一解码器104一起含有一个第二语音编码器。本领域中的熟练人士明白,语音编码器可用数字信号处理器(DSP)、专用集成电路(ASIC)、离散门逻辑、固件或任一普通可编程软件模块和微处理器来实施。软件模块可位于RAM存储器、按块擦除存储器、寄存器或本领域中所知的其他形式的可写存储介质内。或者,可用任一普通处理器、控制器或状态机代替微处理器。专门为语音编码设计的示例ASIC在专利号为5,727,123的美国专利及1994年2月16日提交的序列号为08/197,417标题为“VOCODER ASIC”的美国专利申请书中有描述,二者均已转让给本发明的受让人,在此引述供参考。
图3中,可用于语音编码器中的编码器200包括模式判定模块202,音调估计模块204、LP分析滤波器208、LP量化块210及剩余量化模块212。输入语音帧S(n)提供给模式判定模块202、音节估计模块204、LP分析模块206和LP分析滤波器208。模式判定模块202根据每个输入语音帧S(n)的周期性、能量、信噪比(SNR)或过零率等生成模式索引IM和模式M。按照周期性对语音帧归类的各种方法在专利号为5,911,128的美国专利中有描述,该专利已转让给本发明的受让人,在此引述供参考。这样的方法亦被并入电信工业协会工业过渡标准TIA/EIA IS-127和TIA/EIA IS-733中。示例模式判定方案在前面所提及的序列号09/217,341的美国专利申请书中亦有描述。
音节估计模块204根据每个输入语音帧S(n)生成音节索引IP和滞后值Po。LP分析模块206在每个输入语音帧S(n)上执行线性预测分析以生成LP参数a。LP参数a提供给LP量化模块210。LP量化模块210亦接收模式M,从而以取决于模式的方式执行量化过程。LP量化模块210生成LP索引ILp和量化的LP参数a。LP分析滤波器208除接收输入语音帧S(n)外还接收量化的LP参数a。LP分析滤波器208生成LP剩余信号R[n],LP剩余信号R[n]表示输入语音帧S(n)与基于量化线性预测参数a的重建语音间的差错。LP剩余R[n],模式M和量化LP参数a提供给剩余量化模块212。根据这些值,剩余量化模块212生成剩余索引IR和量化剩余信号R[n]。
在图4中可用于语音编码器中的解码器300包括LP参数解码模块302,剩余解码模块304、模式解码模块306和LP合成滤波器308。模式解码模块306接收并对模式索引IM解码,从中生成模式M。LP参数解码模块302接收模式M和LP索引IIP。LP参数解码模块302对接收的值解码,以生成量化LP参数a。剩余解码模块304接收剩余索引IR、音节索引IP和模式索引IM。剩余解码模块304对接收的值解码,以生成量化剩余信号R[n]。量化剩余信号R[n]和量化LP参数a提供给LP合成滤波器308,LP合成滤波器308从中合成解码输出语音信号S[n]。
图3的编码器200和图4的解码器300的各种模块的运行和实施为本领域中的人员所知,且在前文中所提及的专利号为5,414,796的美国专利及L.B.Rabiner与R.W.Schafer合著的“Digital Processing of Speech Signals“(1978年版)的396至453页中有描述。
如图5的流程图所示,根据一实施例的语音编器在处理用于发送的语音样本中遵循一组步骤。在步骤400中语音编码器接收连续帧中语音信号的数字样本。一旦接收一给定帧,语音编码器进入步骤402。步骤402中语音编码器检测该帧的能量。能量是帧的语音活动性的量度。语音检测是通过求数字语音样本的幅度的平方的和及把结果能量与阈值比较执行的。在一实施例中阈值根据背景噪声的变化水平适配。典型的可变阈值语音活动性检测器在前文提及的专利号为5,414,796的美国专利中有描述。一些清音可以是特别低能量的样本,可作为背景噪声被误编码。为防止此情况发生,如在前文提及的专利号为5,414,796的美国专利中所述,可使用低能量样本的频谱倾斜以把清音与背景噪声区分开。
检测帧的能量后,语音编码器进入步骤404。步骤404中语音编码器确定检测帧能量是否充足到把帧分为含有语音信息。若检测帧能量落于预置门限水平之后,语音编码器进入步骤406。步骤406中语音编码器把帧当作背景噪声(即,非话或静寂)编码。在一实施例中,背景噪声帧以1/8速率或1kbps编码。若步骤404中检测帧能量符合或超出预置门限水平,帧归类为语音而语音编码器进入步骤408。
步骤408中,语音编码器确定帧是否清音,即,语音编码器检验帧的周期性。周期性确定的各种已知方法包括,例如,使用过零和使用归一化自相关函数(NACF)。特别是,使用过零和NACF检测周期性在前文提及的专利号为5,911,128的美国专利和序列号为09/217,341的美国专利申请书中有描述。另外,以上用来区分浊音和清音的方法被并入电信工业协会过渡标准TIA/EIAIS-127和TIA/EIA IS-733中。若步骤408确定帧是清音,语音编码器进入步骤410。步骤410中语音编码器把帧作为清音编码。在一实施例中,清音帧以1/4速率或2.6kbps得到编码。若步骤408中未确定帧是清音,语音编码器进入步骤412。
步骤412中,例如,前文提及的专利号为5,911,128的美国专利中所述,语音编码器用本领域所知的周期性检测方法确定帧是否是过渡语音。若确定帧是过渡语音,语音编码器进入步骤414。步骤414中帧作为过渡语音(即,从清音向浊音过渡)编码。在一实施例中,过渡语音帧是按照1999年5月7日申请的序列号为09/307,294的、标题为“MULTIPULSE INTERPOLATIVECODING OF TRANSITION SPEECH FRAMES”的美国专利申请书描述的多脉冲内插编码方法编码的,该申请书已转证给本发明的受让人,在此完全引述供参考。在另一实施例中,过渡语音帧以全速率或13.2kbps编码。
若步骤412中语音编码器确定帧不是过渡语音,语音编码器进入步骤416。步骤416中语音编码器把帧作为浊音编码。在一实施例中可以半速率或6.2kbps浊音帧编码。亦可能全速率或13.2kbps(或全速率,8kbps,在8kCELP编码器中)对浊音帧编码。然而,本领域中的熟练人士明白,以半速率对浊音帧编码能通过利用浊音帧的稳态本质允许编码器存储宝贵的带宽。而且,不管用来对浊音编码的速率是什么,最好用以前帧的信息对浊音编码,因而可说成是对浊音预测编码。
普通技术人员能够认识到,可遵循图5所示的步骤对语音信号或相应的LP剩余编码。噪声、清音、过渡语音和浊音的滤形特点可看作是图6A的曲线图中时间函数。噪声、清音LP剩余、过渡语音LP剩余和浊音LP剩余可视为图6B的曲线图中时间的函数。
在一种实施例中,原型音节周期(PPP)语音编码器500包括反滤波器502,原型析取器504、原型量化器506、原型去量化508、内插/合成模块510和LPC合成模块512,如图7所示。语音编码器500可最好是DSP的部件,并可驻留于,例如,PCS或蜂窝电话***中的用户单元或基站中,或驻留于卫星***中的用户单元或网关中。
在语音编码器500中,将数字化语音信号S(n)(其中,n是帧号)提供给反LP滤波器502。在一特定实施例中,帧长是20ms。按照下列等式计算反滤波器的传递函数A(2):
A(z)=1-a1z-1-a2z-2-…-apz-p(略)
系数a1是具有按照已知方法选择的预置值的滤波器抽头,这些已知方法如专利号5,414,796的美国专利和序列号为09/217,494的美国专利申请书中所述,它们在前文中以完全引述供参考。数字P表示反LP滤波器502用于预测的前样本的数目。在一特定实施例中,P设定为10。
反滤波器502向原型析取器504提供LP剩余信号r(n)。原型析取器504从当前帧析取原型。原型是将由内插/合成模块510用来自类似地定位于帧中的前帧的原型线性地内插以在解码器端重建LP剩余信号的当前帧的部分。
原型析取器504向原型量化器506提供原型,原型量化器506按照下面参考图8所述的技术量化原型。量化值可从查阅表(未示出)获得,汇编成数据分组,数据分组包括滞后和其他电码本参数,用来通过信道发送。分组提供给发射机(未示出)并通过信道向接收机(亦未示出)发送。反LP滤波器502,原型析取器504和原型量化器506已完成对当前帧的PPP分析。
接收机接收数据分组并把数据分组提供给原型去量化器508。原型去量化器508按照下面参考图9所述的技术去量化数据分组。原型去量化器508向内插/合成模块510提供去量化原型。内插/合成模块510用来自类似定位于帧中的前帧的原型内插原型以重建当前帧的LP剩余信号。内插与帧合成最好按照专利号为5,884,253的美国专利和前文提及的序列号为09/217,494的美国专利申请书中所述的已知方法来完成。
内插/合成模块510向LPC合成模块512提供重建LP剩余信号r(n)。LPC合成模块512还接收来自发送数据分组的线谱对(LSP)值,LSP值用来执行重建LP剩余信号r(n)上的LPC滤波,以生成当前帧的重建语音信号S(n)。在一可选实施例中,可在执行当前帧的***/合成之前对原型执行语音信号S(n)的LPC合成。原型去量化器508,内插/合成模块510和LPC合成模块512已完成当前帧的PPP合成。
在一实施例中,原型量化器600采用有效发送的智能子抽样,执行原型相位的量化,如图8所示,原型建化器600包括第一和第二离散傅里叶级数(DFS)系数计算模块602、604、第一和第二分解模块606、608、频带标识模块610、幅度矢量量化器612、关联模块614和量化器616。
在原型量化器600中,基准原型提供给第一DFS系数计算模块602。第一DFS系数计算模块602计算基准原型的DFS系数,如下所述,并把基准原型的DFS系数提供给第一分解模块606。第一分解模块606把基准原型的DFS系数分解成幅度矢量和相位矢量,如下所述。第一分解模块606向关联模块614提供幅度矢量和相位矢量。
把当前原型提供给第二DFS系数计算模块602。第二DFS系数计算模块606计算当前原型的DFS系数,如下所述,并把当前原型的DFS系数提供给第二分解模块608。第二分解模块608把当前原型的DFS系数分解成幅度矢量和相位矢量,如下所述。第二分解模块608向关联模块614提供幅度矢量和相位矢量。
第二分解模块608还向频带标识模块610提供当前原型的幅度矢量和相位矢量。频带标识模块610标识用于关联的频带,如下所述,并向关联模块614提供频带标识索引。
第二分解模块608还向幅度矢量量化器612提供当前原型的幅度矢量。幅度矢量量化器612量化当前原型的幅度矢量,如下所述,并生成幅度量化参数用于发送。在一特定实施例中,幅度矢量量化器612同频带标识模块610(为求明晰这种联系未在附图中示出)和/或向关联模块614提供量化幅度值。
关联模块614在所有频带中关联,以确定全部频带的最佳线性相移,如下所述,在一可选实施例中,在带通信号上的时域中执行互相关以确定所有频带的最佳循环旋转,亦如下所述。关联模块614向量化器616提供线性相移值。在一可选实施例中,关联模块614向量化器616提供循环旋转值。量化器616量化接收值,如下所述,生成相位量化参数用于发送。
在一实施例中原型去量化器700用DFS的组成频带上的线性移执行原型相位谱的重建,如图9所示。原型去量化器700包括DFS系数计算模块702、反DFS计算模块704、分解模块706、组合模块708、频带标识模块701、幅度矢量去量化器712、合成模块714和相位去量化器716。
在原型去量化器700中,基准原型提供给DFS系数计算模块702。DFS系数计算模块702计算基准原型的DFS系数,如下所述,并向分解模块706提供基准原型的DFS系数。分解模块706把基准原型的DFS系数分解成幅度和相位矢量,如下所述。分解模块706向合成模块714提供基准相位(即,基准原型的相位矢量)。
相位量化参数由相位去量化器716接收。相位去量化器716去量化接收相位量化参数,如下所述,生成线性相移值。相位去量化器716向合成模块714提供线性相移值。
幅度矢量量化参数由幅度矢量去量化器712接收。幅度矢量去量化器712去量化接收幅度量化参数,如下所述,生成去量化幅度值。幅度矢量去量化器712向组合模块708提供量化幅度值。幅度矢量去量化器712还向频带标识模块710提供去量化幅度值。频带标识模块710标识频带用于组合,如下所述,并向合成模块714提供频带标识索引。
合成模块714从基准相位和线性相移值合成修改的相位矢量,如下所述。合成模块714向组合模块708提供修改的相位矢量值。
组合模块708将去量化幅度值和相位值组合起来,如下所述,生成重建的、修改的DFS系数矢量。组合模块708向反DFS计算模块704提供组合的幅度和相位矢量。反DFS计算模块704计算重建的、修改的DFS系数矢量的反DFS,如下所述,生成重建当前原型。
在一实施例中,原型去量化器800用在编码器端的原型波形的组成带通波形上的时域中执行的循环旋转执行原型相位谱的重建,如图9所示。原型去量化器800包括DFS系数计算模块802、带通波形加法器804、分解模块806、反DFS/带通信号生成模块808、频带标识模块810、幅度矢量去量化器812、合成模块814和相位去量化器816。
在原型去量化器800中,基准原型提供给DFS系数计算模块802。DFS系数计算模块802计算基准原型的DFS系数,如下所述,并向分解模块806提供基准原型的DFS系数。分解模块806把基准原型的DFS系数分解成幅度和相位矢量,如下所述。分解模块806向合成模块814提供基准相位(即,基准原型的相位矢量)。
相位量化参数由相位去量化器816接收。相位去量化器816去量化接收相位量化参数,如下所述,生成循环旋转值。相位去量化器816向合成模块814提供循环旋转值。
幅度矢量量化参数由幅度矢量去量化器812接收。幅度矢量去量化器812去量化接收幅度量化参数,如下所述,生成去量化幅度值。幅度矢量去量化器812向反DFS/带通信号生成模块808提供量化幅度值。幅度矢量去量化器812还向频带标识模块810提供去量化幅度值。频带标识模块810标识频带用于组合,如下所述,并向反FDS/带通信号生成模块808提供频带标识索引。
反DFS/带通信号生成模块808组合去量化幅度值和每个频带的基准相位值,并用每个频带的反DFS从组合计算带通信号,如下所述。反DFS/带通信号生成模块808向组成模块814提供带通信号。
合成模块814用去量化循环旋转值循环旋转每个带通信号,如下所述,生成修改的、旋转的带通信号。合成模块814向带通波形加法器804提供修改的、旋转的带通信号。带通波形加法器804求全部带通信号的和,以生成重建原型。
图8的原型量化器600和图9的原型去量化器700在正常工作中分别用来对原型音节周期波形的相位谱编码和解码。在发射机/编码器(图8),用DFS表达式
计算当前帧的原型SC(n)的相位谱φk c,Ck c是当前原型的复合DFS系数而ωo c是SC(n)的归一化基频。相位谱φk c是组成DFS的复合系数的角。用类似的方式计算基准原型的相位谱φk r,以提供Ck c和φk r。或者,基准原型的相位谱φk r在有基准原型的帧得到处理后得到存储,并且从存储器只是得到检索。在一特别实施例中,基准原型是来自前一帧的原型。来自基准帧和当前帧的两原型的复合DFS可表示为振幅谱和相位谱的乘积,如下面的等式所示: #应注意的是,振幅谱和相位谱是矢量,因为复合DFS亦是矢量。DFS矢量的每个单元是等于相应原型的时长的倒数的频率的谐波。对最大频率为FmHz(以至少2FmHz的速率抽样)的信号和FoHz的谐波频率,有M个谐波。谐波的数目M等于Fm/Fo。因此,每个原型相位谱矢量和振幅谱矢量由M个单元构成。
当前原型的DFS矢量划分成B个频带而对应每个B频带的时间信号是带通信号。频带的数目B限于小于谐波的数目M。求全部B带通时间信号的和会得出原始当前原型。以类似的方式,基准原型的DFS矢量亦划分成相同的B频带。(kbi)
对每个B频带,在对应基准原型的带通信号与对应当前原型的带通信号间执行互相关。互相关可在频域DFS矢量
上执行,其中,{kbi}是第i个频带bi中的谐波数集,而θi是第i个频带bi和可能的线性相移。互相关亦可按照下面的等式在对应的时域带通信号上(例如,用图10的去量化器800)执行:
L是当前原型的样本中的长度,而
和
分别是基准原型和当前原型的归一化基频,而ri是样本中的循环旋转。对应频带bi的带通时域信号sbi r(n)和sbi C分别由下列表达式给出:
在一实施例中,用量化幅度矢量
得到Ck C,如下面的等式所示:
互相关通过基准原型的带通DFS矢量的全部可能线性相移执行。或者,互相关可通过基准原型的带通FDS矢量的全部可能线性相移的子集执行。在一可选实施例中,利用时域方法,而互相关通过基准原型的带通时间信号的全部可能循环旋转执行。在一实施例中,互相关通过基准原型的带通时间信号的全部可循环旋转的子集执行。互相关过程生成对应每个B频带的互相关的最大值的B线性相移(或B循环旋转,在互相关在带通时间信号上的时域中执行的实施例中)。然后B个线性相移(或,在可迭实施例中,B循环旋转)取代M个原始相位谱矢量单元作为相位谱的代表得到量化和发送。独立地量化和发送振幅谱矢量。这样,基准原型的带通DFS矢量(或带通时间信号)最好用作电码本对当前帧的原型的对应DFS矢量(或带通信号)编码。相应地,需要较少单元量化和发送相位信息,从而实现相位信息的结果子抽样并产生更有效的发送。这在低比特率语音编码中特别有益,低比特率语音编码中由于缺少充足的比特,要么因大量的相位单元相位信息的量化很差,要么相位信根本没有发送,上述每种情况都导致低质量。因为有较少的单元需量化,上述实施例允许低比特率编码器维持的语音质量。
在接收机/解码器(图9)(如本领域中的熟练人士所理解,亦在解码器的编码器的复制端),B线性相移值运用到基准原型的DFS B频带划分的矢量的解码器的复制以生成修改原型DFS相位矢量:
然后,修改DFS矢量作为接收和解码振幅谱矢量与修改原型DFS相位矢量的乘积获得。然后用修改DFS矢量上的反DFS操作构建重建原型。在可选实施例中,其中,利用时域方法,每个B频带的振幅谱矢量与相同B频带的基准原型的相位矢量得到组合,而在组合上执行反DFS操作以生成B带通时间信号。然后,用B循环旋转值循环地旋转B带通时间信号。把全部B带通时间信号相加以生成重建原型。
这样,一种新颖的,用来对相位谱信息子抽样的方法和设备已得到描述。本领域中的熟练人士明白,结合此处揭示的实施例描述的各种说明性逻辑块和算法步骤可用以下实施或执行:数字信号处理器(DSP),专用集成电路(ASIC),离散门或晶体管逻辑,诸如,例如,寄存器和FIFO之类的离散硬件组件,执行一组固件指令的处理器或任一普通可编程较件模块,及处理器。处理器最好是微处理器,但处理器也可以是任一普通处理器、控制器、微控制器或状态机。软件模块可驻留于RAM存储器、按块擦除存储器、寄存器或本领域中所知的任一其他形式的可写存储媒介。熟练人士会进一步认识到,在整个上面的描述中可参考的数据、指令、命令、信息、信号、数据位、码元和码片最好采用电压、电流、电磁波、磁场或充粒子、光场或光粒子,或以上的任一组合。
这样,已示出并描述本发明的较佳实施例。然而,对本领域有普通技能的人而言明显的是,可不脱离本发明的精神和范围地对此处揭示的实施例作出许多改变。因此,本发明除按照下列权利要求外将不受限制。
Claims (25)
1.一种处理语音编码器中的帧的原型的方法,其特征在于,它包括以下步骤:
生成基准原型的多个相位参数;
产生与所述原型有关的多个线性相移值;以及
在多个频带上从所述相位参数和所述线性相移值来合成相位矢量。
2.如权利要求1所述的方法,其特征在于,所述生成步骤包括以下步骤:计算所述基准原型的离散傅里叶级数系数,并把所述离散傅里叶级数系数分解成所述基准原型的幅度矢量和相位矢量。
3.如权利要求1所述的方法,其特征在于,它还包含这样一个步骤,即,标识在其中执行合成步骤的频带。
4.如权利要求1所述的方法,其特征在于,所述帧是语音帧。
5.如权利要求1所述的方法,其特征在于,所述帧是线性预测剩余的帧。
6.如权利要求1所述的方法,其特征在于,所述产生步骤包含去量化与所述原型有关的多个量化相位参数,以产生多个线性相移值。
7.如权利要求3所述的方法,其特征在于,它还包含这样一个步骤,即,去量化与所述原型有关的多个幅度量化参数,以生成多个去量化的幅度参数,其中,所述标识步骤包括根据多个去量化的幅度参数来标识频带。
8.如权利要求1所述的方法,其特征在于,它还包含这样一些步骤,即,将所述合成的相位矢量与和所述原型有关的多个幅度参数组合起来,以生成一个组合矢量,并计算所述组合矢量的反离散傅里叶级数,以生成所述原型的重建版本。
9.一种语音编码器,其特征在于,它包括:
用来生成帧的基准原型的多个相位参数的装置;
用来产生与当前帧的当前原型有关的多个线性相移值的装置;以及
用来在多个频带上从所述相位参数和所述线性相移值合成相位矢量的装置。
10.如权利要求9所述的语音编码器,其特征在于,所述生成装置包括用来计算所述基准原型的离散傅里叶级数系数的装置,以及用来把所述离散傅里叶级数系数分解成所述基准原型的幅度矢量和相位矢量的装置。
11.如权利要求9所述的语音编码器,其特征在于,它还包含用来标识所述多个频带的装置。
12.如权利要求9所述的语音编码器,其特征在于,所述当前帧是一个语音帧。
13.如权利要求9所述的语音编码器,其特征在于,所述当前帧是一个线性预测剩余的帧。
14.如权利要求9所述的语音编码器,其特征在于,所述产生装置包括用来使与所述当前原型有关的多个量化相位参数去量化以产生多个线性相移值的装置。
15.如权利要求11所述的语音编码器,其特征在于,它还包含用来使与所述当前原型有关的多个幅度量化参数去量化以生成多个去量化的幅度参数的装置,其中,所述标识装置包括用来根据多个去量化的幅度参数标识多个频带的装置。
16.如权利要求9所述的语音编码器,其特征在于,它还包含用来将所述合成的相位矢量与和所述当前原型有关的多个幅度参数组合起来以生成组合的矢量的装置,以及用来计算所述组合的矢量的反离散傅里叶级数以生成所述当前原型的重建版本的装置。
17.如权利要求9所述的语音编码器,其特征在于,所述语音编码器驻留于无线通信***的用户单元中。
18.一种语音编码器,其特征在于,它包括:
配制成从正由所述语音编码器处理的当前帧中析取当前原型的原型析取器;以及
耦合到所述原型析取器并配置成生成帧的基准原型的多个相位参数、产生与所述当前原型有关的多个线性相移值以及在多个频带上从所述相位参数和所述线性相移值合成相位矢量的原型量化器,其中,原型量化器还配置成使与当前原型有关的多个量化相位信号去量化,以产生多个线性相位值。
19.如权利要求18所述的语音编码器,其特征在于,所述原型量化器进一步配置成计算所述基准原型的离散傅里叶级数系数,并把所述离散傅里叶级数系数分解成所述基准原型的幅度矢量和相位矢量。
20.如权利要求18所述的语音编码器,其特征在于,所述原型量化器进一步配置成标识所述多个频带。
21.如权利要求18所述的语音编码器,其特征在于,所述当前帧是一个语音帧。
22.如权利要求18所述的语音编码器,其特征在于,所述当前帧是一个线性预测剩余的帧。
23.如权利要求20所述的语音编码器,其特征在于,所述原型量化器进一步配置成使与所述当前原型有关的多个幅度量化参数去量化以生成多个去量化幅度参数,并且根据所述多个去量化的幅度参数识别所述多个频带。
24.如权利要求18所述的语音编码器,其特征在于,所述原型量化器进一步配置成将所述相位矢量与和所述当前原型有关的多个幅度参数组合起来以生成组合矢量,并计算所述组合矢量的反离散傅里叶级数以生成所述当前原型的重建版本。
25.如权利要求18所述的语音编码器,其特征在于,所述语音编码器驻留于无线通信***的用户单元中。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/356,491 | 1999-07-19 | ||
US09/356,491 US6397175B1 (en) | 1999-07-19 | 1999-07-19 | Method and apparatus for subsampling phase spectrum information |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB008130019A Division CN1279510C (zh) | 1999-07-19 | 2000-07-18 | 用来对相位谱信息进行子抽样的方法和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1510660A CN1510660A (zh) | 2004-07-07 |
CN1290077C true CN1290077C (zh) | 2006-12-13 |
Family
ID=23401657
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB008130019A Expired - Lifetime CN1279510C (zh) | 1999-07-19 | 2000-07-18 | 用来对相位谱信息进行子抽样的方法和设备 |
CNB031458505A Expired - Lifetime CN1290077C (zh) | 1999-07-19 | 2000-07-18 | 用来对相位谱信息进行子抽样的方法和设备 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB008130019A Expired - Lifetime CN1279510C (zh) | 1999-07-19 | 2000-07-18 | 用来对相位谱信息进行子抽样的方法和设备 |
Country Status (12)
Country | Link |
---|---|
US (3) | US6397175B1 (zh) |
EP (2) | EP1204968B1 (zh) |
JP (2) | JP4860859B2 (zh) |
KR (2) | KR100752001B1 (zh) |
CN (2) | CN1279510C (zh) |
AT (2) | ATE379832T1 (zh) |
AU (1) | AU6221600A (zh) |
BR (1) | BRPI0012537B1 (zh) |
DE (2) | DE60037286T2 (zh) |
ES (2) | ES2297578T3 (zh) |
HK (3) | HK1064196A1 (zh) |
WO (1) | WO2001006492A1 (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001082293A1 (en) * | 2000-04-24 | 2001-11-01 | Qualcomm Incorporated | Method and apparatus for predictively quantizing voiced speech |
JP4178319B2 (ja) * | 2002-09-13 | 2008-11-12 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声処理におけるフェーズ・アライメント |
US6789058B2 (en) * | 2002-10-15 | 2004-09-07 | Mindspeed Technologies, Inc. | Complexity resource manager for multi-channel speech processing |
US7376553B2 (en) * | 2003-07-08 | 2008-05-20 | Robert Patel Quinn | Fractal harmonic overtone mapping of speech and musical sounds |
EP1496500B1 (en) * | 2003-07-09 | 2007-02-28 | Samsung Electronics Co., Ltd. | Bitrate scalable speech coding and decoding apparatus and method |
PL3561810T3 (pl) * | 2004-04-05 | 2023-09-04 | Koninklijke Philips N.V. | Sposób kodowania lewego i prawego sygnału wejściowego audio, odpowiedni koder, dekoder i produkt w postaci programu komputerowego |
JP4207902B2 (ja) * | 2005-02-02 | 2009-01-14 | ヤマハ株式会社 | 音声合成装置およびプログラム |
KR101019936B1 (ko) * | 2005-12-02 | 2011-03-09 | 퀄컴 인코포레이티드 | 음성 파형의 정렬을 위한 시스템, 방법, 및 장치 |
US8090573B2 (en) * | 2006-01-20 | 2012-01-03 | Qualcomm Incorporated | Selection of encoding modes and/or encoding rates for speech compression with open loop re-decision |
US8346544B2 (en) * | 2006-01-20 | 2013-01-01 | Qualcomm Incorporated | Selection of encoding modes and/or encoding rates for speech compression with closed loop re-decision |
US8032369B2 (en) * | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
US9583117B2 (en) * | 2006-10-10 | 2017-02-28 | Qualcomm Incorporated | Method and apparatus for encoding and decoding audio signals |
KR20090122143A (ko) * | 2008-05-23 | 2009-11-26 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
EP2631906A1 (en) | 2012-02-27 | 2013-08-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Phase coherence control for harmonic signals in perceptual audio codecs |
PL3576087T3 (pl) * | 2013-02-05 | 2021-10-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Ukrywanie klatki utraconej sygnału audio |
RU2729603C2 (ru) | 2015-09-25 | 2020-08-11 | Войсэйдж Корпорейшн | Способ и система для кодирования стереофонического звукового сигнала с использованием параметров кодирования первичного канала для кодирования вторичного канала |
CN107424616B (zh) * | 2017-08-21 | 2020-09-11 | 广东工业大学 | 一种相位谱去除掩模的方法与装置 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5067158A (en) * | 1985-06-11 | 1991-11-19 | Texas Instruments Incorporated | Linear predictive residual representation via non-iterative spectral reconstruction |
US4901307A (en) | 1986-10-17 | 1990-02-13 | Qualcomm, Inc. | Spread spectrum multiple access communication system using satellite or terrestrial repeaters |
US5023910A (en) * | 1988-04-08 | 1991-06-11 | At&T Bell Laboratories | Vector quantization in a harmonic speech coding arrangement |
WO1990013112A1 (en) * | 1989-04-25 | 1990-11-01 | Kabushiki Kaisha Toshiba | Voice encoder |
JPH0332228A (ja) * | 1989-06-29 | 1991-02-12 | Fujitsu Ltd | ゲイン―シェイプ・ベクトル量子化方式 |
US5263119A (en) * | 1989-06-29 | 1993-11-16 | Fujitsu Limited | Gain-shape vector quantization method and apparatus |
US5388181A (en) * | 1990-05-29 | 1995-02-07 | Anderson; David J. | Digital audio compression system |
US5103459B1 (en) | 1990-06-25 | 1999-07-06 | Qualcomm Inc | System and method for generating signal waveforms in a cdma cellular telephone system |
CA2483322C (en) | 1991-06-11 | 2008-09-23 | Qualcomm Incorporated | Error masking in a variable rate vocoder |
US5884253A (en) | 1992-04-09 | 1999-03-16 | Lucent Technologies, Inc. | Prototype waveform speech coding with interpolation of pitch, pitch-period waveforms, and synthesis filter |
JPH0793000A (ja) * | 1993-09-27 | 1995-04-07 | Mitsubishi Electric Corp | 音声符号化装置 |
US5517595A (en) | 1994-02-08 | 1996-05-14 | At&T Corp. | Decomposition in noise and periodic signal waveforms in waveform interpolation |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
TW271524B (zh) | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
JPH08123494A (ja) * | 1994-10-28 | 1996-05-17 | Mitsubishi Electric Corp | 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置 |
US5692098A (en) * | 1995-03-30 | 1997-11-25 | Harris | Real-time Mozer phase recoding using a neural-network for speech compression |
IT1277194B1 (it) | 1995-06-28 | 1997-11-05 | Alcatel Italia | Metodo e relativi apparati di codifica e di decodifica di un segnale vocale campionato |
US5701391A (en) * | 1995-10-31 | 1997-12-23 | Motorola, Inc. | Method and system for compressing a speech signal using envelope modulation |
AU3702497A (en) * | 1996-07-30 | 1998-02-20 | British Telecommunications Public Limited Company | Speech coding |
US5903866A (en) * | 1997-03-10 | 1999-05-11 | Lucent Technologies Inc. | Waveform interpolation speech coding using splines |
JPH11224099A (ja) * | 1998-02-06 | 1999-08-17 | Sony Corp | 位相量子化装置及び方法 |
EP0987680B1 (en) * | 1998-09-17 | 2008-07-16 | BRITISH TELECOMMUNICATIONS public limited company | Audio signal processing |
US6266644B1 (en) * | 1998-09-26 | 2001-07-24 | Liquid Audio, Inc. | Audio encoding apparatus and methods |
US6754630B2 (en) | 1998-11-13 | 2004-06-22 | Qualcomm, Inc. | Synthesis of speech from pitch prototype waveforms by time-synchronous waveform interpolation |
US6449592B1 (en) * | 1999-02-26 | 2002-09-10 | Qualcomm Incorporated | Method and apparatus for tracking the phase of a quasi-periodic signal |
US6640209B1 (en) * | 1999-02-26 | 2003-10-28 | Qualcomm Incorporated | Closed-loop multimode mixed-domain linear prediction (MDLP) speech coder |
US6138089A (en) * | 1999-03-10 | 2000-10-24 | Infolio, Inc. | Apparatus system and method for speech compression and decompression |
WO2000060579A1 (en) * | 1999-04-05 | 2000-10-12 | Hughes Electronics Corporation | A frequency domain interpolative speech codec system |
-
1999
- 1999-07-19 US US09/356,491 patent/US6397175B1/en not_active Expired - Lifetime
-
2000
- 2000-07-18 WO PCT/US2000/019601 patent/WO2001006492A1/en active IP Right Grant
- 2000-07-18 CN CNB008130019A patent/CN1279510C/zh not_active Expired - Lifetime
- 2000-07-18 CN CNB031458505A patent/CN1290077C/zh not_active Expired - Lifetime
- 2000-07-18 AU AU62216/00A patent/AU6221600A/en not_active Abandoned
- 2000-07-18 EP EP00948764A patent/EP1204968B1/en not_active Expired - Lifetime
- 2000-07-18 AT AT05019543T patent/ATE379832T1/de not_active IP Right Cessation
- 2000-07-18 BR BRPI0012537A patent/BRPI0012537B1/pt active IP Right Grant
- 2000-07-18 KR KR1020077009507A patent/KR100752001B1/ko active IP Right Grant
- 2000-07-18 DE DE60037286T patent/DE60037286T2/de not_active Expired - Lifetime
- 2000-07-18 EP EP05019543A patent/EP1617416B1/en not_active Expired - Lifetime
- 2000-07-18 AT AT00948764T patent/ATE309600T1/de not_active IP Right Cessation
- 2000-07-18 DE DE60023913T patent/DE60023913T2/de not_active Expired - Lifetime
- 2000-07-18 JP JP2001511667A patent/JP4860859B2/ja not_active Expired - Lifetime
- 2000-07-18 ES ES05019543T patent/ES2297578T3/es not_active Expired - Lifetime
- 2000-07-18 ES ES00948764T patent/ES2256022T3/es not_active Expired - Lifetime
- 2000-07-18 KR KR1020027000728A patent/KR100754580B1/ko active IP Right Grant
-
2002
- 2002-02-01 US US10/066,073 patent/US6678649B2/en not_active Expired - Lifetime
- 2002-12-30 HK HK04106760A patent/HK1064196A1/xx unknown
- 2002-12-30 HK HK02109401.2A patent/HK1047816B/zh unknown
-
2003
- 2003-11-05 US US10/702,967 patent/US7085712B2/en not_active Expired - Lifetime
-
2006
- 2006-07-14 HK HK06107927A patent/HK1091583A1/xx not_active IP Right Cessation
-
2007
- 2007-08-17 JP JP2007213061A patent/JP4861271B2/ja not_active Expired - Lifetime
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1223989C (zh) | 可变速率语音编码器中的帧擦除补偿法及用该方法的装置 | |
CN1290077C (zh) | 用来对相位谱信息进行子抽样的方法和设备 | |
CN1158647C (zh) | 话音编码设备的频谱幅度量化 | |
CN1432176A (zh) | 用于预测量化有声语音的方法和设备 | |
CN1161749C (zh) | 保持语言编码中目标比特率的方法和装置 | |
CN1266674C (zh) | 闭环多模混合域线性预测语音编解码器和处理帧的方法 | |
CN1154086C (zh) | Celp转发 | |
CN1302459C (zh) | 用于编码和解码非话音语音的方法和设备 | |
CN102985969B (zh) | 编码装置、解码装置和编码方法、解码方法 | |
CN1241169C (zh) | 语音中非话音部分的低数据位速率编码 | |
CN1922658A (zh) | 音频信号的分类 | |
CN1623185A (zh) | 可伸缩音频编码的有效改进 | |
CN1922659A (zh) | 编码模式选择 | |
CN1692408A (zh) | 码分多址无线***的可变比特率宽带语音编码中的有效带内半空白-突发序列信令及半速率最大操作的方法和装置 | |
CN1212607C (zh) | 使用编码方案选择模型以减少对帧差错敏感性的预测语音编码器 | |
CN1361913A (zh) | 用于交织语音编码器中线状谱信息量化方法的方法和设备 | |
CN1272939A (zh) | 语音编码设备和语音解码设备 | |
CN1271596C (zh) | 话音编码设备中计算帧原型间线性相移的频带识别方法和装置 | |
CN1262991C (zh) | 跟踪准周期性信号的相位的方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1064196 Country of ref document: HK |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term |
Granted publication date: 20061213 |
|
CX01 | Expiry of patent term |