CN101506873B - 开环基音跟踪平滑 - Google Patents

开环基音跟踪平滑 Download PDF

Info

Publication number
CN101506873B
CN101506873B CN200680053928XA CN200680053928A CN101506873B CN 101506873 B CN101506873 B CN 101506873B CN 200680053928X A CN200680053928X A CN 200680053928XA CN 200680053928 A CN200680053928 A CN 200680053928A CN 101506873 B CN101506873 B CN 101506873B
Authority
CN
China
Prior art keywords
open
max
max2
previous
loop pitch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200680053928XA
Other languages
English (en)
Other versions
CN101506873A (zh
Inventor
杨高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mandus Bide Technology LLC
MACOM Technology Solutions Holdings Inc
Original Assignee
Mindspeed Technologies LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mindspeed Technologies LLC filed Critical Mindspeed Technologies LLC
Publication of CN101506873A publication Critical patent/CN101506873A/zh
Application granted granted Critical
Publication of CN101506873B publication Critical patent/CN101506873B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Transmission And Conversion Of Sensor Element Output (AREA)
  • Auxiliary Devices For Music (AREA)
  • Telephonic Communication Services (AREA)
  • Analogue/Digital Conversion (AREA)
  • Electrical Discharge Machining, Electrochemical Machining, And Combined Machining (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Soil Working Implements (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Telephone Function (AREA)

Abstract

提供一种用于执行以下算法的语音编码器,该算法包括:获得(205)来自语音信号当前帧的多个开环基音候选,这多个开环基音候选包括第一开环基音候选和第二开环基音候选;获得(205)来自一个或者多个先前帧的清浊度信息;以及使用来自一个或者多个先前帧的清浊度信息来选择(280)多个开环基音候选之一作为当前帧的最终基音。在一个方面中,来自一个或者多个先前帧的清浊度信息包括一个或者多个先前帧的先前基音。在又一方面中,选择当前帧的最终基音包括选择(210)来自具有最大长期相关值的开环基音候选的初始开环基音。

Description

开环基音跟踪平滑
相关申请
本申请基于通过援引整体结合于此的、申请日为2006年3月20日的美国临时申请第60/784,384号,并且要求该临时申请的优先权。
技术领域
本发明主要涉及语音编码。具体而言,本发明涉及开环基音(pitch)分析。
背景技术
语音压缩可以用来减少代表语音信号的位的数目,由此减少传输所需带宽。然而,语音压缩可能造成解压语音的质量降级。一般而言,更高的位速率将造成更高的质量而更低的位速率将造成更低的质量。然而,现代语音压缩技术如编码技术可以在相对低的位速率产生相对高质量的解压语音。一般而言,现代编码技术尝试代表语音信号对感知重要的特征而不保存实际语音波形。习惯称为编码解码器的语音压缩***包括编码器和解码器并且可以用来减少数字语音信号的位速率。已经为语音编码解码器开发许多算法,这些算法减少对原语音进行数字编码所需要的位的数目而又尝试维持高质量的重建语音。
国际电信联盟电信部门(ITU-T)于1996年采用了称为G.729建议书的长途质量语音编码算法,该建议书的标题为“Coding of Speech Signalsat 8bits/s  using  Conjugate-Structure  Algebraic-Core-ExcitedLinear-Predication(CS-ACELP)”,通过援引将该建议书整体结合于本申请中。
图1图示了如其中说明的G.729建议书的CS-ACELP(共轭结构代数-代码-激励-线性-预测)编码器100中的语音信号流。与图1中各块相邻的标号表示G.729建议书内对各块的操作和功能进行描述的节编号。如图所示,语音信号或者输入采样105进入高通和按比例缩减块(在G.729建议书的第3.1节中有描述),其中在逐帧基础上向输入采样105施加预处理。接着在逐帧基础上向预处理的语音信号施加LP分析115和开环基音搜索120。如图1中所示在开环基音搜索120之后在逐帧基础上向语音信号施加开环基音搜索125和代数搜索130,这样的结果是生成代码索引输出135。
如图1中所示,开环基音搜索120包括在G.729建议书的第3.4节中描述的查找开环基音延迟124。如其中说明的那样,为了减少搜索的复杂度以求最佳自适应-代码簿延迟而将搜索范围限制于从开环基音分析中获得的候选延迟Top。对每帧一次完成这一开环基音分析(10ms)。开环基音估计使用来自计算加权语音122的加权语音信号sw(n)并且实施如下。
在第一步骤中在以下三个范围中:
i=1:80,...,143
i=2:40,...,79
i=3:20,...,39
查找三个相关最大值:
R ( k ) = Σ n = 0 79 sw ( n ) sw ( n - k )
其中:
sw ( n ) = s ( n ) + Σ i = 1 10 a i y 1 i s ( n - i ) - Σ i = 1 10 a i y 2 i sw ( n - i ) , n = 0 , . . . , 39
通过下式正规化所得最大值R(ti),i=1,...,3:
R ′ ( t i ) = R ( t i ) Σ n sw 2 ( n - t i ) , i = 1 , . . . , 3
接着通过优选具有较低范围中的值的延迟来选择在这三个正规化相关值之中的更优值。这通过加权与较长延迟对应的正规化相关值来完成。确定最佳开环延迟Top如下:
Top=t1
R′(Top)=R′(t1)
如果R′(t2)≥0.85R′(Top)
R′(Top)=R′(t2)
Top=t2
结束
如果R′(t3)≥0.85R′(Top)
R′(Top)=R′(t3)
Top=t3
结束
将延迟范围分成三个部分并且优选较小值的上述过程用来避免选择基音倍数。平滑开环基音跟踪可以帮助稳定语音感知质量。具体而言,当在解码器侧应用帧擦除隐藏算法时时,平滑基音跟踪可以使基音预测(针对损失帧的基音估计)更容易。然而,G.729建议书的上述常规算法没有提供最优结果而可以进一步加以改进。例如,G.729建议书的常规算法有利地仅使用当前帧信息来平滑开环基音跟踪以便避免基音倍数。
因而在本领域中需要改进常规开环基音分析以获得用于稳定语音感知质量的更平滑开环基音跟踪。
发明内容
本发明涉及用于执行开环基音分析的方法和装置。
在一个方面中,一种语音编码器执行以下算法,该算法包括:获得包括第一开环基音候选(p_max1)、第二开环基音候选(p_max2)和第三开环基音候选(p_max3)的多个开环基音候选,其中p_max1>p_max2>p_max3;获得包括用于多个开环基音候选中各对应开环基音候选的第一相关值(max1)、第二相关值(max2)和第三相关值(max3)的多个长期相关值;从多个开环基音候选中选择初始开环基音(max),其中与max(p_max)对应的长期相关值在多个长期相关值之中具有最大长期相关值;如果p_max2小于p_max,则基于对来自一个或多个先前帧的清浊度信息的第一判决将max设置为max2而将p_max设置为p_max2,来自所述一个或多个先前帧的清浊度信息包括所述一个或多个先前帧的先前基音;以及如果p_max3小于p_max,则基于对来自一个或多个先前帧的清浊度信息的第二判决将p_max设置为p_max3,来自所述一个或多个先前帧的清浊度信息包括所述一个或多个先前帧的先前基音。
在一个方面,开环基音分析算法还可以包括:获得来自一个或者多个先前帧的清浊度信息;以及将来自一个或者多个先前帧的清浊度信息用于第一判决和第二判决中的各判决。在一个方面中,来自一个或者多个先前帧的清浊度信息包括一个或者多个先前帧的先前基音。另外在另一方面中,来自一个或者多个先前帧的清浊度信息是来自紧邻前一帧的基音。
在一个方面中,第一判决包括:如果先前基音与p_max2的差的绝对值小于第一预定比较值,则将第一阈值设置为第一预定阈值,而如果先前基音与p_max2的差的绝对值不小于第一预定比较值,则将第一阈值设置为第二预定阈值;以及确定与第一阈值相乘的max是否小于max2,其中第一预定比较值是10、第一预定阈值是0.7而第二预定阈值是0.9。
另一方面,一种对语音编码执行开环基音分析的装置包括:开环基音候选获得模块,用于获得包括第一开环基音候选p_max1、第二开环基音候选p_max2和第三开环基音候选p_max3的多个开环基音候选,其中p_max1>p_max2>p_max3;长期相关值获得模块,用于获得包括用于多个开环基音候选中各对应开环基音候选的第一相关值max1、第二相关值max2和第三相关值max3的多个长期相关值;初始开环基音选择模块,用于从多个开环基音候选中选择初始开环基音p_max,其中与p_max对应的长期相关值max在多个长期相关值之中具有最大长期相关值;第一设置模块,如果p_max2小于p_max,则基于对来自一个或多个先前帧的清浊度信息的第一判决将max设置为max2而将p_max设置为p_max2,来自所述一个或多个先前帧的清浊度信息包括一个或多个先前帧的先前基音;以及,第二设置模块,如果p_max3小于p_max,则基于对来自一个或多个先前帧的清浊度信息的第二判决将p_max设置为p_max3,来自一个或多个先前帧的清浊度信息包括一个或多个先前帧的先前基音。
在一个方面中,来自一个或者多个先前帧的清浊度信息包括一个或者多个先前帧的先前基音。在一个方面中,来自一个或者多个先前帧的清浊度信息是来自紧邻前一帧的基音。根据又一方面,第一判决包括:如果先前基音与p_max2的差的绝对值小于第一预定比较值,则将第一阈值设置为第一预定阈值,而如果先前基音与p_max2的差的所述绝对值不小于第一预定比较值,则将第一阈值设置为第二预定阈值;以及确定与所述第一阈值相乘的max是否小于max2,其中第一预定比较值是10、第一预定阈值是0.7而第二预定阈值是0.9。
本发明的这些和其它方面将进一步参照以下附图和说明书而变得清楚。本意在于使所有这样的附加***、特征和优点涵盖于本说明书中、在本发明的范围内并且受所附权利要求保护。
附图说明
本发明的特征和优点对于在阅读以下具体描述和附图之后的本领域技术人员而言将变得更容易明白,在附图中:
图1图示了G.729建议书的CS-ACELP编码器中的语音信号流,该编码器包括执行常规开环基音分析算法的查找开环基音延迟模块;以及
图2A和2B图示了根据本发明一个实施例用于在编码器中执行开环基音分析算法的流程图。
具体实施方式
虽然关于具体实施例描述本发明,但是如这里所附权利要求限定的本发明原理显然可以超出这里描述的本发明的具体所述实施例加以应用。例如,虽然结合G.729建议书的编码器来描述本发明的各种实施例,但是本申请的发明不限于特定标准而可以运用于任何***中。另外在本发明的描述中已经省略某些细节以免使本发明的发明方面变得不清楚。省略的细节在本领域普通技术人员的知识内。
在本申请中的附图及其附带具体描述仅涉及本发明的例子实施例。为了保持简洁,运用本发明原理的本发明其它实施例在本申请中没有具体加以描述也没有用当前附图具体加以图示。应当了然于心的是,除非另有指明,图中相似或者对应单元可以用相似或者对应标号来表示。
图2A和2B图示了根据本发明一个实施例用于在由控制器操作的比如G.729建议书的编码器这样的编码器中执行开环基音分析(PLPA)算法200的流程图。在一个实施例中,本发明的OLPA算法200提供一种通过利用来自一个或者多个先前帧的清浊度(voicing)信息来改进常规算法的平滑开环基音跟踪。
如图所示,OLPA算法200始于步骤205,在该步骤中初始开环基音分析获得来自多个搜索范围的多个开环基音候选,比如来自三(3)个搜索范围的三(3)个开环基音候选如下:
{p_max1,max1},{p_max2,max2},{{p_max3,max3},
其中p_max1、p_max2和p_max3表示开环基音候选,而max1、max2和max3表示用于开环基音候选的对应长期基音相关值,以及其中p_max1>p_max2>p_max3。在一个实施例中,搜索算法相互排斥。
接着在步骤210,OLPA算法200在开环基音候选之中选择具有最大基音长期基音相关值中最大值即max=MAX{max1,max2,max3}的开环基音候选,其中max表示最大基音长期基音相关值的最大值,而p_max表示与max对应的开环基音候选。例如,如果max2具有较max1和max3而言最大的基音长期基音相关值,则p_max初始将设置为p_max2。
随后在步骤215-245,OLPA算法200执行下文进一步描述的以下操作。
如p__max2<p_max    步骤215
如果(|pit_old-p_max 2|<10)步骤225
thresh=0.7步骤235
否则
thresh=0.9;步骤230
如果(max*thresh<max2){步骤240
max=max2;步骤245
p_max=p_max2;步骤245
}
状态220
在步骤215,OLPA算法200确定是否p_max2小于p_max。如果是这样,则OLPA算法200移到步骤225,否则OLPA算法200移到状态220。在步骤225,OLPA算法200确定小于p_max小的先前基音是否小于预定值,例如小于p_max2小的先前基音的绝对值是否小于10。如上所言,与常规方式不同,OLPA算法200使用来自一个或者多个先前帧的信息。例如在步骤225,先前帧如紧邻前一帧的基音信息在OLPA算法200中用于提供平滑开环基音跟踪。在其它实施例中,先前帧的数个基音值、除紧邻前一帧之外的先前帧的一个基音值或者来自先前帧的其它信息可以用滑开环基音跟踪。回到步骤225,如果小于p_max2小的先前基音小于预定值,则OLPA算法200进行到将阈值设置为预定值如0.7的步骤235。否则OLPA算法200进行到将阈值设置为不同预定值如0.9的步骤230。在任一情况下,在步骤230和235之后OLPA算法200移到步骤240,在该步骤中确定与在步骤230或者235确定的阈值相乘的max是否小于max2。如果不是,则OLPA算法200移到下文描述的状态220。否则OLPA算法200移到步骤245,在该步骤中max接收的max2值而p_max接收p_max2的值。在步骤245,OLPA算法200进一步移到下文描述的状态220。
就状态220而言,它是在步骤250-280执行的过程的开始状态,在该状态下OLPA算法200执行下文进一步描述的以下操作。
如果p_max3<p_max    步骤250
如果(|pit_old-p_max3|<5)步骤260
thresh=0.7;步骤270
否则
thresh=0.9;步骤265
如果(max*thresh<max3){步骤275
p_max=p_max3;步骤280
}
步骤255
OLPA算法200从状态220进行到步骤250,在该步骤中OLPA算法200确定p_max3是否p_max。如果是这样,则OLPA算法200移到步骤260,否则OLPA算法200移到状态255。在步骤260,OLPA算法200确定小于p_max3小的先前基音是否小于预定值,例如小于p_max小的先前基音的绝对值是否小于5。如上所言,与常规方式不同,OLPA算法200使用来自一个或者多个先前帧的信息。例如在步骤260,先前帧如紧邻前一帧的基音信息在OLPA算法200中用于提供平滑开环基音跟踪。在其它实施例中,先前帧的数个基音值、除紧邻前一帧之外的先前帧的一个基音值或者来自先前帧的其它信息可以用于平滑开环基音跟踪。回到步骤260,如果小于p_max3小的先前基音小于预定值,则OLPA算法200进行到将阈值设置为预定值如0.7的步骤270。否则OLPA算法200进行到将阈值设置为不同预定值如0.9的步骤265。在任一情况下,在步骤265和270之后OLPA算法200移到步骤275,在该步骤中确定与在步骤265和270确定的阈值相乘的max是否小于max3。如果不是,则OLPA算法200移到下文描述的状态255。否则OLPA算法200移到步骤280,在该步骤中p_max接收p_max3的值。换而言之,这时选择p_max3作为开环基音。在步骤280,OLPA算法200进一步移到下文描述的状态255。
在步骤255,OLPA算法200结束,并且当前值p_max表示所选开环基音的值而max表示用于p_max的对应长期基音相关值。
从本发明的以上描述中不言而喻,各种技术可以用于实施本发明的概念而不脱离本发明的范围。另外尽管已经参照某些实施例描述了本发明,但是本领域技术人员将认识到可以在形式和细节上做出改变而不脱离本发明的精神和范围。例如设想可以用软件实施这里公开的电路或者反之亦然。描述的实施例在所有方面都被认为是举例说明而不是进行限制。也应当理解本发明不限于这里描述的特定实施例而是能够有许多重新布置、修改和替换却不脱离本发明的范围。

Claims (10)

1.一种对语音编码执行开环基音分析的方法,包括:
获得包括第一开环基音候选p_max1、第二开环基音候选p_max2和第三开环基音候选p_max3的多个开环基音候选,其中p_max1>p_max2>p_max3;
获得包括用于所述多个开环基音候选中各对应开环基音候选的第一相关值max1、第二相关值max2和第三相关值max3的多个长期相关值;
从所述多个开环基音候选中选择初始开环基音p_max,其中与p_max对应的长期相关值max在多个长期相关值之中具有最大长期相关值;
如果p_max2小于p_max,则基于对来自一个或多个先前帧的清浊度信息的第一判决将max设置为max2而将p_max设置为p_max2,来自所述一个或多个先前帧的清浊度信息包括所述一个或多个先前帧的先前基音;以及
如果p_max3小于p_max,则基于对来自一个或多个先前帧的清浊度信息的第二判决将p_max设置为p_max3,来自所述一个或多个先前帧的清浊度信息包括所述一个或多个先前帧的先前基音。
2.根据权利要求1所述的方法,其中来自所述一个或者多个先前帧的所述清浊度信息包括所述一个或者多个先前帧的先前基音。
3.根据权利要求1所述的方法,其中来自所述一个或者多个先前帧的所述清浊度信息是来自紧邻前一帧的基音。
4.根据权利要求1所述的方法,其中所述第一判决包括:
如果先前基音与p_max2的差的绝对值小于第一预定比较值,则将第一阈值设置为第一预定阈值,而如果先前基音与p_max2的差的所述绝对值不小于所述第一预定比较值,则将所述第一阈值设置为第二预定阈值;以及
确定max乘以所述第一阈值是否小于max2。
5.根据权利要求4所述的方法,其中所述第一预定比较值是10、所述第一预定阈值是0.7而所述第二预定阈值是0.9。
6.一种对语音编码执行开环基音分析的装置,所述装置包括:
开环基音候选获得模块,用于获得包括第一开环基音候选p_max1、第二开环基音候选p_max2和第三开环基音候选p_max3的多个开环基音候选,其中p_max1>p_max2>p_max3;
长期相关值获得模块,用于获得包括用于所述多个开环基音候选中各对应开环基音候选的第一相关值max1、第二相关值max2和第三相关值max3的多个长期相关值;
初始开环基音选择模块,用于从所述多个开环基音候选中选择初始开环基音p_max,其中与p_max对应的长期相关值max在多个长期相关值之中具有最大长期相关值;
第一设置模块,如果p_max2小于p_max,则基于对来自一个或多个先前帧的清浊度信息的第一判决将max设置为max2而将p_max设置为p_max2,来自所述一个或多个先前帧的清浊度信息包括所述一个或多个先前帧的先前基音;以及
第二设置模块,如果p_max3小于p_max,则基于对来自一个或多个先前帧的清浊度信息的第二判决将p_max设置为p_max3,来自所述一个或多个先前帧的清浊度信息包括所述一个或多个先前帧的先前基音。
7.根据权利要求6所述的装置,其中来自所述一个或者多个先前帧的所述清浊度信息包括所述一个或者多个先前帧的先前基音。
8.根据权利要求6所述的装置,其中来自所述一个或者多个先前帧的所述清浊度信息是来自紧邻前一帧的基音。
9.根据权利要求6所述的装置,其中所述第一判决包括:
如果先前基音与p_max2的差的绝对值小于第一预定比较值,则将第一阈值设置为第一预定阈值,而如果先前基音与p_max2的差的所述绝对值不小于所述第一预定比较值,则将所述第一阈值设置为第二预定阈值;以及
确定与所述第一阈值相乘的max是否小于max2。
10.根据权利要求9所述的装置,其中所述第一预定比较值是10、所述第一预定阈值是0.7而所述第二预定阈值是0.9。
CN200680053928XA 2006-03-20 2006-10-27 开环基音跟踪平滑 Active CN101506873B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US78438406P 2006-03-20 2006-03-20
US60/784,384 2006-03-20
PCT/US2006/042096 WO2007111649A2 (en) 2006-03-20 2006-10-27 Open-loop pitch track smoothing

Publications (2)

Publication Number Publication Date
CN101506873A CN101506873A (zh) 2009-08-12
CN101506873B true CN101506873B (zh) 2012-08-15

Family

ID=38541563

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200680053928XA Active CN101506873B (zh) 2006-03-20 2006-10-27 开环基音跟踪平滑

Country Status (7)

Country Link
US (1) US8386245B2 (zh)
EP (2) EP1997104B1 (zh)
CN (1) CN101506873B (zh)
AT (1) ATE475170T1 (zh)
DE (1) DE602006015712D1 (zh)
ES (1) ES2347825T3 (zh)
WO (1) WO2007111649A2 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9251782B2 (en) 2007-03-21 2016-02-02 Vivotext Ltd. System and method for concatenate speech samples within an optimal crossing point
JP4882899B2 (ja) * 2007-07-25 2012-02-22 ソニー株式会社 音声解析装置、および音声解析方法、並びにコンピュータ・プログラム
US9082416B2 (en) * 2010-09-16 2015-07-14 Qualcomm Incorporated Estimating a pitch lag

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
US6260010B1 (en) * 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains
US6507814B1 (en) * 1998-08-24 2003-01-14 Conexant Systems, Inc. Pitch determination using speech classification and prior pitch estimation
CN1514994A (zh) * 2001-06-11 2004-07-21 ��˹��ŵ�� 用于编码语音信号中连续基音周期的方法和装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5793843A (en) * 1989-10-31 1998-08-11 Intelligence Technology Corporation Method and apparatus for transmission of data and voice
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
JPH1091194A (ja) * 1996-09-18 1998-04-10 Sony Corp 音声復号化方法及び装置
FI113903B (fi) * 1997-05-07 2004-06-30 Nokia Corp Puheen koodaus
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6564182B1 (en) * 2000-05-12 2003-05-13 Conexant Systems, Inc. Look-ahead pitch determination
US7136810B2 (en) * 2000-05-22 2006-11-14 Texas Instruments Incorporated Wideband speech coding system and method
KR100463417B1 (ko) * 2002-10-10 2004-12-23 한국전자통신연구원 상관함수의 최대값과 그의 후보값의 비를 이용한 피치검출 방법 및 그 장치
KR100516678B1 (ko) * 2003-07-05 2005-09-22 삼성전자주식회사 음성 코덱의 음성신호의 피치검출 장치 및 방법
KR20050008356A (ko) * 2003-07-15 2005-01-21 한국전자통신연구원 음성의 상호부호화시 선형 예측을 이용한 피치 지연 변환장치 및 방법
US7146309B1 (en) * 2003-09-02 2006-12-05 Mindspeed Technologies, Inc. Deriving seed values to generate excitation values in a speech coder

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
US6260010B1 (en) * 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains
US6507814B1 (en) * 1998-08-24 2003-01-14 Conexant Systems, Inc. Pitch determination using speech classification and prior pitch estimation
CN1514994A (zh) * 2001-06-11 2004-07-21 ��˹��ŵ�� 用于编码语音信号中连续基音周期的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Shaw-Hwa Hwang.Computational Improvement for G.729 standard.《Electrics Letters》.2000,第36卷(第13期), *

Also Published As

Publication number Publication date
EP1997104B1 (en) 2010-07-21
ATE475170T1 (de) 2010-08-15
WO2007111649A3 (en) 2009-04-30
EP1997104A4 (en) 2009-10-28
ES2347825T3 (es) 2010-11-04
EP2228789A1 (en) 2010-09-15
CN101506873A (zh) 2009-08-12
US20100241424A1 (en) 2010-09-23
WO2007111649A2 (en) 2007-10-04
EP2228789B1 (en) 2012-07-25
DE602006015712D1 (de) 2010-09-02
EP1997104A2 (en) 2008-12-03
US8386245B2 (en) 2013-02-26

Similar Documents

Publication Publication Date Title
CN101488345B (zh) 有效编码语音信号的信号修改方法
JP4187556B2 (ja) スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳
US20100280831A1 (en) Method and Device for Fast Algebraic Codebook Search in Speech and Audio Coding
EP0926660B1 (en) Speech encoding/decoding method
KR20060007412A (ko) 가변 비트 레이트 광대역 스피치 음성 코딩시의 이득양자화를 위한 방법 및 장치
EP2506253A2 (en) Audio signal processing method and device
EP2128855A1 (en) Voice encoding device and voice encoding method
CA2455059A1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
JPH09212188A (ja) 制約付き状態尤度を有する復号化された状態系列を用いた音声認識方法
CN103915100A (zh) 一种编码模式切换方法和装置、解码模式切换方法和装置
KR20040042903A (ko) 일반화된 분석에 의한 합성 스피치 코딩 방법 및 그방법을 구현하는 코더
EP0784846B1 (en) A multi-pulse analysis speech processing system and method
CN101506873B (zh) 开环基音跟踪平滑
Ribeiro et al. Phonetic vocoding with speaker adaptation.
CN106605263A (zh) 确定用于编码lpd/fd过渡帧的预算
EP1204092B1 (en) Speech decoder capable of decoding background noise signal with high quality
JPH113099A (ja) 音声符号化復号化システム、音声符号化装置及び音声復号化装置
JP3088204B2 (ja) コード励振線形予測符号化装置及び復号化装置
EP0537948B1 (en) Method and apparatus for smoothing pitch-cycle waveforms
CN112634868B (zh) 一种语音信号处理方法、装置、介质和设备
JP3410931B2 (ja) 音声符号化方法及び装置
JP3350340B2 (ja) 音声符号化方法および音声復号化方法
JPH09134196A (ja) 音声符号化装置
JPH02203399A (ja) 音声符号化方式
KR19980031894A (ko) 음성부호화에 있어서 선스펙트럼쌍 계수의 양자화 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: California, USA

Patentee after: Mandus bide technology LLC

Address before: California, USA

Patentee before: Mindspeed Technologies, Inc.

CP01 Change in the name or title of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20180330

Address after: Massachusetts, USA

Patentee after: MACOM technology solving holding Co.

Address before: California, USA

Patentee before: Mandus bide technology LLC

TR01 Transfer of patent right