CN102184731A - 一种韵律类和音质类参数相结合的情感语音转换方法 - Google Patents

一种韵律类和音质类参数相结合的情感语音转换方法 Download PDF

Info

Publication number
CN102184731A
CN102184731A CN2011101220344A CN201110122034A CN102184731A CN 102184731 A CN102184731 A CN 102184731A CN 2011101220344 A CN2011101220344 A CN 2011101220344A CN 201110122034 A CN201110122034 A CN 201110122034A CN 102184731 A CN102184731 A CN 102184731A
Authority
CN
China
Prior art keywords
speech
emotional
energy
signal
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011101220344A
Other languages
English (en)
Inventor
毛峡
韩林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN2011101220344A priority Critical patent/CN102184731A/zh
Publication of CN102184731A publication Critical patent/CN102184731A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Auxiliary Devices For Music (AREA)

Abstract

本发明提出了韵律类参数(基频、时长和能量)和音质类参数(共振峰)相结合的情感语音转换方法。其主要步骤包括:步骤一:对BHUDES情感语音样本(包含中性语音以及悲伤、愤怒、高兴和惊奇四种情感语音)进行特征参数的提取分析;步骤二:根据提取的特征参数,制定情感语音转换规则,定义各项转换常数;步骤三:对待转换的中性语音进行特征参数提取和基音同步标注;步骤四:通过步骤二的情感转换规则设定各项转换常数,对基频曲线,时长和能量进行修改,再基音同步叠加合成语音信号。步骤五:对步骤四的语音信号进行LPC分析,通过传递函数的极点对共振峰进行更改。最终得到富有表现力的情感语音。

Description

一种韵律类和音质类参数相结合的情感语音转换方法
技术领域
本发明涉及语音信号处理和人工智能领域,主要涉及一种韵律类和音质类参数相结合的情感语音转换方法。
背景技术
语音合成是人机交互中的一个重要组成部分。现在人们所希望听到的已不再是有很高可懂度的枯燥的机器音,而是能够表达情感的具有人情味的语音。现有的语音合成水平,解决的还是从文字到语音合成这个阶段,也就是文语转换(TTS:Text to Speech),语音中的情感信息并不能得到很好的表达。
另外情感语音还可以和其它多媒体技术结合,比如将情感语音配以相应的面部特征来表达情感,使声音和表情同步,这就是当前比较热门的“视觉语音(visualspeech)”技术。
从语音信号中提取情感特征,分析人的感情与语音信号的关联,将情感特征应用于语音合成方面的研究,是国内外该领域中近几年刚刚兴起的研究课题。但是,大量的模型还没有得到很好的解决。情感语音合成研究是情感计算与语音合成这两个领域的交叉课题,其中语音合成研究比较悠久,而情感计算则是相对年轻的研究领域。
PSOLA(Pitch Synchronous Overlap Add)是用于语音合成技术的一种波形拼接算法。它和早期的波形拼接有原则性的差别:该算法在调整语音单元拼接之前,能够对拼接单元进行基频,时长和能量的调整,并且在调整时以基音周期而不是传统的帧长为单位进行波形修改,把基音周期的完整性作为保证波形及频谱的平滑连续的基本前提。
在情感语音的转换中,PSOLA应用还不成熟,而且它只能对语音信号的韵律类参数进行修改,不能改变音质类参数。因此提出一种更加高效的转换方法具有很强的现实意义。
发明内容
本发明提出了一种同时更改韵律类参数和音质类参数的方法完成情感语音的转换。
本发明的主要内容为:对情感语音样本进行特征参数的提取统计,制定转换规则,然后根据规则更改语音的基频曲线以及共振峰位置,完成中性语音到四种情感语音(悲伤、愤怒、高兴和惊奇)的转换。
该方法的具体步骤如下:
步骤一:对情感语音样本(包含中性语音以及悲伤、愤怒、高兴和惊奇四种情感语音)进行特征参数的提取分析;
步骤二:根据提取的特征参数,制定情感语音转换规则,定义各项转换参数;
步骤三:对待转换的中性语音进行特征参数提取和基音同步标注;
步骤四:通过步骤二的情感转换规则设定修改参数,对基频曲线,时长和能量进行修改,再进行基音同步叠加合成语音信号;
步骤五:对步骤四的语音信号进行LPC分析,通过改变传递函数的极点对共振峰进行更改。
其中,在步骤一中,选取的语料为BHUDES(北航情感语音数据库),提取的特征参数包括基频、时长和能量以及共振峰。
在步骤二中,分别提取中性语音和四种情感语音的基频,时长和能量等特征参数,经过统计得出如下的转换规则:
Figure BDA0000060658290000021
在上面转换规则的基础上,定义UP_POSITION(上扬位置),DOWN_POSITION(下降位置),MEANf0(整体基频改变量),DUR_POSITION(延时位置),DUR_LEN(延时长度),ENERGY_SCALE(能量因子)等常数。
在步骤三中,首先要对输入的语音信号x(n)进行语音段和静音段以及清浊音的判决。
语音段和静音段判决采用基于短时能量和短时过零率的双门限法。
清浊判决方法采用预测残差能量er和第一阶反射系数r1相结合的方法,判决条件为:
若r1>0.2&er>threshold,则该帧为浊音;否则为清音。
r 1 = R ss ( 1 ) R ss ( 0 ) - - - ( 1 )
R ss ( 0 ) = 1 N Σ n = 1 N x ( n ) x ( n ) - - - ( 2 )
R ss ( 1 ) = 1 N Σ n = 1 N - 1 x ( n ) x ( n + 1 ) - - - ( 3 )
其中N为帧长,er为进行线性预测后的残差能量。
对浊音部分进行基音标注,对于清音部分采取等间距标注,方便计算。根据步骤二的转换规则,设定各项相关参数。
对已经完成基音同步标注的语音信号与一系列的基音同步窗函数相乘,得到一些列有重叠的短时分析信号。一般采用标准汉宁(Hanning)窗或汉明(Hamming)窗,窗长为两个基音周期,相邻的短时分析信号之间有大约50%的重叠部分。基音周期的准确性和起始位置非常重要,它将对合成语音的质量有很大的影响。本方法采用汉明(Hamming)窗,窗函数如式5所示:
ω ( n ) = 0.54 - 0.46 ( 2 πn / ( N - 1 ) ) 0 ≤ n ≤ N - 1 0 else - - - ( 5 )
原始信号x(n)与一系列的基音同步窗函数ωm(n)相乘的到的短时分析信号为:
xm(n)=ωm(nm-n)×x(n)       (6)
式中nm为基音标注点。
根据情感转换规则,建立转换波形与原始波形之间的基音周期的映射关系,见图2,再由此映射关系确定合成时所需要的短时合成信号序列。
将短时信号序列与目标基音周期同步排列,并重叠相加得到合成波形。此时,合成的语音波形y(n)就具有所期望的情感特征。
在步骤四中,设定步骤二中的UP_POSITION(上扬位置),DOWN_POSITION(下降位置),MEANf0(整体基频改变量),DUR_POSITION(延时位置),DUR_LEN(延时长度),ENERGY_SCALE(能量因子)等常数。
在步骤五中,先对语音信号进行LPC分析,在本方法中,分析阶数取12阶,流程见图3。对得到的传递函数的极点进行更改,从而对共振峰进行频率上的移动。
本发明的优点以及积极效果在于:由于本发明对语音的韵律类特征(基频、能量和时长)和音质类特征(共振峰)同时进行了更改,使转换后的情感语音更加自然。同时,在对基频曲线进行更改时,通过设定必要的参数,可以使韵律修改效果更好。
附图说明
图1 情感语音转换流程图
图2 基音周期的映射关系示意图
图3 LPC更改共振峰流程图
具体实施方式
本发明是一种将中性语音转换为四种情感语音的新方法。
本发明的主要内容为:对选取的BHUDES情感语音样本进行特征参数的提取统计,制定转换规则,然后根据规则更改语音的基频曲线以及共振峰位置,完成中性语音到四种情感语音(悲伤、愤怒、高兴和惊奇)的转换。
为了更清晰的阐述本发明的目的、技术方案及优点,以下结合附图,以中性语音转换为惊奇语音为实例做进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
具体实施方式见图1流程图,主要步骤如下:
步骤一:对情感语音样本(包含中性语音以及悲伤、愤怒、高兴和惊奇四种情感语音)进行特征参数的提取分析,提取的特征参数包括基频、时长和能量以及共振峰;
步骤二:根据提取的中性语音和四种情感语音的基频,时长和能量等特征参数,制定情感语音转换规则,定义各项转换常数;
步骤三:从步骤二的情感语音转换规则中抽取出惊奇语音的转换规则。
由转换规则可知惊奇的平均基频稍高,基频范围稍高,基频曲线的尾部存在上扬,能量稍高和共振峰位置稍高,时长较短。
首先要对输入的语音信号x(n)进行语音段和静音段以及清浊音的判决。
语音段和静音段判决采用基于短时能量和短时过零率的双门限法。
清浊判决方法采用预测残差能量er和第一阶反射系数r1相结合的方法,判决条件为:
若r1>0.2&er>threshold,则该帧为浊音;否则为清音。
r 1 = R ss ( 1 ) R ss ( 0 ) - - - ( 1 )
R ss ( 0 ) = 1 N Σ n = 1 N x ( n ) x ( n ) - - - ( 2 )
R ss ( 1 ) = 1 N Σ n = 1 N - 1 x ( n ) x ( n + 1 ) - - - ( 3 )
其中N为帧长,er为进行线性预测后的残差能量。
对浊音部分进行基音标注,对于清音部分采取等间距标注,方便计算。根据步骤二的转换规则,设定各项相关参数。
对已经完成基音同步标注的语音信号与一系列的基音同步窗函数相乘,得到一些列有重叠的短时分析信号。一般采用标准汉宁(Hanning)窗或汉明(Hamming)窗,窗长为两个基音周期,相邻的短时分析信号之间有大约50%的重叠部分。基音周期的准确性和起始位置非常重要,它将对合成语音的质量有很大的影响。本方法采用汉明(Hamming)窗,窗函数如式5所示:
ω ( n ) = 0.54 - 0.46 ( 2 πn / ( N - 1 ) ) 0 ≤ n ≤ N - 1 0 else - - - ( 5 )
原始信号x(n)与一系列的基音同步窗函数ωm(n)相乘的到的短时分析信号为:
xm(n)=ωm(nm-n)×x(n)       (6)
式中nm为基音标注点。
根据情感转换规则,建立转换波形与原始波形之间的基音周期的映射关系,再由此映射关系确定合成所需要的短时合成信号序列。
将短时信号序列与目标基音周期同步排列,并重叠相加得到合成波形。此时,合成的语音波形y(n)就具有所期望的情感特征。
步骤四:通过步骤二的情感转换规则设定UP_POSITION(上扬位置),DOWN_POSITION(下降位置),MEANf0(整体基频改变量),DUR_POSITION(延时位置),DUR_LEN(延时长度),ENERGY_SCALE(能量因子)等常数。然后对基频曲线,时长和能量进行修改,再基音同步叠加合成语音信号。
步骤五:对步骤四的语音信号进行LPC分析,通过传递函数的极点对共振峰进行更改。最终得到待转换的情感语音。

Claims (6)

1.本发明提出了韵律类参数(基频、时长和能量)和音质类参数(共振峰)相结合的情感语音转换方法,该方法的具体步骤如下:
步骤一:对BHUDES情感语音样本(包含中性语音以及悲伤、愤怒、高兴和惊奇四种情感语音)进行特征参数的提取分析;
步骤二:根据提取的特征参数,制定情感语音转换规则,定义各项转换常数
步骤三:对待转换的中性语音进行特征参数提取和基音同步标注;
步骤四:通过步骤二的情感转换规则设定修改参数,对基频曲线,时长和能量进行修改,再基音同步叠加合成语音信号;
步骤五:对步骤四的语音信号进行LPC分析,通过传递函数的极点对共振峰进行更改。
2.根据权利要求1所述方法,所述步骤一的主要特征在于对中性以及悲伤、愤怒、高兴和惊奇四种情感语音的参数提取。
3.根据权利要求1所述方法,所述步骤二的主要特征为:分别提取中性语音和四种情感语音的基频,时长和能量等特征参数,经过统计分析得出转换规则,并在上面转换规则的基础上,定义UP_POSITION(上扬位置),DOWN_POSITION(下降位置),MEANf0(整体基频改变量),DUR_POSITION(延时位置),DUR_LEN(延时长度),ENERGY_SCALE(能量因子)等常数。
4.根据权利要求1所述方法,所述步骤三中的主要特征为:首先要对输入的语音信号x(n)进行语音段和静音段以及清浊音的判决,语音段和静音段判决采用基于短时能量和短时过零率的双门限法;
清浊判决方法采用预测残差能量er和第一阶反射系数r1相结合的方法,判决条件为:若r1>0.2&er>threshold,则该帧为浊音,否则为清音;
r 1 = R ss ( 1 ) R ss ( 0 ) - - - ( 1 )
R ss ( 0 ) = 1 N Σ n = 1 N x ( n ) x ( n ) - - - ( 2 )
R ss ( 1 ) = 1 N Σ n = 1 N - 1 x ( n ) x ( n + 1 ) - - - ( 3 )
其中er为进行线性预测后的残差能量,N为帧长;
对浊音部分进行基音标注,对于清音部分采取等间距标注;根据步骤二的转换规则,设定各项相关参数;对已经完成基音同步标注点语音信号与一系列的基音同步窗函数相乘,得到一些列有重叠的短时分析信号,本方法采用汉明(hamming)窗,窗长为两个基音周期,相邻的短时分析信号之间有大约50%的重叠部分,窗函数如式5所示:
ω ( n ) = 0.54 - 0.46 ( 2 πn / ( N - 1 ) ) 0 ≤ n ≤ N - 1 0 else - - - ( 5 )
原始信号x(n)与一系列的基音同步窗函数ωm(n)相乘的到的短时分析信号为:
xm(n)=ωm(nm-n)×x(n)      (6)
式中nm为基音标注点。
5.根据权利要求1所述方法,所述步骤四中的主要特征为:根据情感转换规则,建立转换波形与原始波形之间的基音周期的映射关系,再由此映射关系确定合成所需要的短时合成信号序列,将短时信号序列与目标基音周期同步排列,并重叠相加得到合成波形。
6.根据权利要求5所述方法,其主要特征为:对语音信号进行LPC分析,在本方法中,分析阶数取12阶,对得到的传递函数的极点进行更改,从而改变声道传递函数,进而改变共振峰位置。
CN2011101220344A 2011-05-12 2011-05-12 一种韵律类和音质类参数相结合的情感语音转换方法 Pending CN102184731A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011101220344A CN102184731A (zh) 2011-05-12 2011-05-12 一种韵律类和音质类参数相结合的情感语音转换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011101220344A CN102184731A (zh) 2011-05-12 2011-05-12 一种韵律类和音质类参数相结合的情感语音转换方法

Publications (1)

Publication Number Publication Date
CN102184731A true CN102184731A (zh) 2011-09-14

Family

ID=44570897

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011101220344A Pending CN102184731A (zh) 2011-05-12 2011-05-12 一种韵律类和音质类参数相结合的情感语音转换方法

Country Status (1)

Country Link
CN (1) CN102184731A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102592590A (zh) * 2012-02-21 2012-07-18 华南理工大学 一种可任意调节的语音自然变声方法及装置
CN103903627A (zh) * 2012-12-27 2014-07-02 中兴通讯股份有限公司 一种语音数据的传输方法及装置
CN104934029A (zh) * 2014-03-17 2015-09-23 陈成钧 基于基音同步频谱参数的语音识别***和方法
CN105654941A (zh) * 2016-01-20 2016-06-08 华南理工大学 一种基于指向目标人变声比例参数的语音变声方法及装置
CN105741854A (zh) * 2014-12-12 2016-07-06 中兴通讯股份有限公司 一种语音信号的处理方法及终端
CN106205600A (zh) * 2016-07-26 2016-12-07 浪潮电子信息产业股份有限公司 一种可交互中文文本语音合成***及方法
CN106688034A (zh) * 2014-09-11 2017-05-17 微软技术许可有限责任公司 具有情感内容的文字至语音转换
CN107103900A (zh) * 2017-06-06 2017-08-29 西北师范大学 一种跨语言情感语音合成方法及***
CN107221344A (zh) * 2017-04-07 2017-09-29 南京邮电大学 一种语音情感迁移方法
CN107919138A (zh) * 2017-11-30 2018-04-17 维沃移动通信有限公司 一种语音中的情绪处理方法及移动终端
CN108447470A (zh) * 2017-12-28 2018-08-24 中南大学 一种基于声道和韵律特征的情感语音转换方法
CN110444192A (zh) * 2019-08-15 2019-11-12 广州科粤信息科技有限公司 一种基于语音技术的智能语音机器人
WO2019218773A1 (zh) * 2018-05-15 2019-11-21 中兴通讯股份有限公司 语音的合成方法及装置、存储介质、电子装置
CN110663080A (zh) * 2017-02-13 2020-01-07 法国国家科研中心 通过频谱包络共振峰的频移动态修改语音音色的方法和装置
CN111968626A (zh) * 2020-08-31 2020-11-20 腾讯科技(深圳)有限公司 变声处理方法、装置、设备及可读存储介质
WO2021127979A1 (zh) * 2019-12-24 2021-07-01 深圳市优必选科技股份有限公司 语音合成方法、装置、计算机设备及计算机可读存储介质
CN113066511A (zh) * 2021-03-16 2021-07-02 云知声智能科技股份有限公司 一种语音转换方法、装置、电子设备和存储介质
CN113409762A (zh) * 2021-06-30 2021-09-17 平安科技(深圳)有限公司 情感语音合成方法、装置、设备及存储介质
CN113555027A (zh) * 2021-07-26 2021-10-26 平安科技(深圳)有限公司 语音情感转换方法、装置、计算机设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1297561A (zh) * 1999-03-25 2001-05-30 松下电器产业株式会社 语音合成***与语音合成方法
US20020049594A1 (en) * 2000-05-30 2002-04-25 Moore Roger Kenneth Speech synthesis
CN101261832A (zh) * 2008-04-21 2008-09-10 北京航空航天大学 汉语语音情感信息的提取及建模方法
CN101369423A (zh) * 2007-08-17 2009-02-18 株式会社东芝 语音合成方法和装置
CN101620852A (zh) * 2008-07-01 2010-01-06 邹采荣 一种基于改进二次判别式的语音情感识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1297561A (zh) * 1999-03-25 2001-05-30 松下电器产业株式会社 语音合成***与语音合成方法
US20020049594A1 (en) * 2000-05-30 2002-04-25 Moore Roger Kenneth Speech synthesis
CN101369423A (zh) * 2007-08-17 2009-02-18 株式会社东芝 语音合成方法和装置
CN101261832A (zh) * 2008-04-21 2008-09-10 北京航空航天大学 汉语语音情感信息的提取及建模方法
CN101620852A (zh) * 2008-07-01 2010-01-06 邹采荣 一种基于改进二次判别式的语音情感识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《中国优秀硕士学位论文全文数据库 信息科技辑》 20080815 任蕊 基于Fujisaki模型的情感语音信号分析与合成 , *
《信号处理》 20070430 邵艳秋 等 韵律参数和频谱包络修改相结合的情感语音合成技术研究 第23卷, 第4期 *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102592590B (zh) * 2012-02-21 2014-07-02 华南理工大学 一种可任意调节的语音自然变声方法及装置
CN102592590A (zh) * 2012-02-21 2012-07-18 华南理工大学 一种可任意调节的语音自然变声方法及装置
CN103903627B (zh) * 2012-12-27 2018-06-19 中兴通讯股份有限公司 一种语音数据的传输方法及装置
CN103903627A (zh) * 2012-12-27 2014-07-02 中兴通讯股份有限公司 一种语音数据的传输方法及装置
CN104934029A (zh) * 2014-03-17 2015-09-23 陈成钧 基于基音同步频谱参数的语音识别***和方法
CN104934029B (zh) * 2014-03-17 2019-03-29 纽约市哥伦比亚大学理事会 基于基音同步频谱参数的语音识别***和方法
CN106688034A (zh) * 2014-09-11 2017-05-17 微软技术许可有限责任公司 具有情感内容的文字至语音转换
CN106688034B (zh) * 2014-09-11 2020-11-13 微软技术许可有限责任公司 具有情感内容的文字至语音转换
CN105741854A (zh) * 2014-12-12 2016-07-06 中兴通讯股份有限公司 一种语音信号的处理方法及终端
CN105654941A (zh) * 2016-01-20 2016-06-08 华南理工大学 一种基于指向目标人变声比例参数的语音变声方法及装置
CN106205600A (zh) * 2016-07-26 2016-12-07 浪潮电子信息产业股份有限公司 一种可交互中文文本语音合成***及方法
CN110663080A (zh) * 2017-02-13 2020-01-07 法国国家科研中心 通过频谱包络共振峰的频移动态修改语音音色的方法和装置
CN107221344A (zh) * 2017-04-07 2017-09-29 南京邮电大学 一种语音情感迁移方法
CN107103900A (zh) * 2017-06-06 2017-08-29 西北师范大学 一种跨语言情感语音合成方法及***
CN107919138A (zh) * 2017-11-30 2018-04-17 维沃移动通信有限公司 一种语音中的情绪处理方法及移动终端
CN107919138B (zh) * 2017-11-30 2021-01-08 维沃移动通信有限公司 一种语音中的情绪处理方法及移动终端
CN108447470A (zh) * 2017-12-28 2018-08-24 中南大学 一种基于声道和韵律特征的情感语音转换方法
WO2019218773A1 (zh) * 2018-05-15 2019-11-21 中兴通讯股份有限公司 语音的合成方法及装置、存储介质、电子装置
CN110556092A (zh) * 2018-05-15 2019-12-10 中兴通讯股份有限公司 语音的合成方法及装置、存储介质、电子装置
CN110444192A (zh) * 2019-08-15 2019-11-12 广州科粤信息科技有限公司 一种基于语音技术的智能语音机器人
WO2021127979A1 (zh) * 2019-12-24 2021-07-01 深圳市优必选科技股份有限公司 语音合成方法、装置、计算机设备及计算机可读存储介质
CN111968626A (zh) * 2020-08-31 2020-11-20 腾讯科技(深圳)有限公司 变声处理方法、装置、设备及可读存储介质
CN113066511A (zh) * 2021-03-16 2021-07-02 云知声智能科技股份有限公司 一种语音转换方法、装置、电子设备和存储介质
CN113409762A (zh) * 2021-06-30 2021-09-17 平安科技(深圳)有限公司 情感语音合成方法、装置、设备及存储介质
CN113409762B (zh) * 2021-06-30 2024-05-07 平安科技(深圳)有限公司 情感语音合成方法、装置、设备及存储介质
CN113555027A (zh) * 2021-07-26 2021-10-26 平安科技(深圳)有限公司 语音情感转换方法、装置、计算机设备及存储介质
CN113555027B (zh) * 2021-07-26 2024-02-13 平安科技(深圳)有限公司 语音情感转换方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN102184731A (zh) 一种韵律类和音质类参数相结合的情感语音转换方法
CN101064104B (zh) 基于语音转换的情感语音生成方法
CN107464559B (zh) 基于汉语韵律结构和重音的联合预测模型构建方法及***
CN101000765B (zh) 基于韵律特征的语音合成方法
CN101178896B (zh) 基于声学统计模型的单元挑选语音合成方法
CN101064103B (zh) 基于音节韵律约束关系的汉语语音合成方法及***
CN107103900A (zh) 一种跨语言情感语音合成方法及***
CN106971703A (zh) 一种基于hmm的歌曲合成方法及装置
CN102779508B (zh) 语音库生成设备及其方法、语音合成***及其方法
CN103531196B (zh) 一种波形拼接语音合成的选音方法
CN105374350B (zh) 语音标注方法及装置
CN102664003B (zh) 基于谐波加噪声模型的残差激励信号合成及语音转换方法
CN1815552B (zh) 基于线谱频率及其阶间差分参数的频谱建模与语音增强方法
CN106128450A (zh) 一种汉藏双语跨语言语音转换的方法及其***
CN102201234A (zh) 一种基于音调自动标注及预测的语音合成方法
CN103165126A (zh) 一种手机文本短信的语音播放的方法
CN105654942A (zh) 一种基于统计参数的疑问句、感叹句的语音合成方法
Urbain et al. Evaluation of HMM-based laughter synthesis
TWI503813B (zh) 可控制語速的韻律訊息產生裝置及語速相依之階層式韻律模組
CN101887719A (zh) 语音合成方法、***及具有语音合成功能的移动终端设备
CN1811912B (zh) 小音库语音合成方法
Bettayeb et al. Speech synthesis system for the holy quran recitation.
Kang et al. Connectionist temporal classification loss for vector quantized variational autoencoder in zero-shot voice conversion
Raju et al. Application of prosody modification for speech recognition in different emotion conditions
Bartkova et al. Prosodic parameters and prosodic structures of French emotional data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20110914