WO2008139919A1 - 音声合成装置、音声合成方法及び音声合成プログラム - Google Patents

音声合成装置、音声合成方法及び音声合成プログラム Download PDF

Info

Publication number
WO2008139919A1
WO2008139919A1 PCT/JP2008/058179 JP2008058179W WO2008139919A1 WO 2008139919 A1 WO2008139919 A1 WO 2008139919A1 JP 2008058179 W JP2008058179 W JP 2008058179W WO 2008139919 A1 WO2008139919 A1 WO 2008139919A1
Authority
WO
WIPO (PCT)
Prior art keywords
prosody
central segment
speech
segments
central
Prior art date
Application number
PCT/JP2008/058179
Other languages
English (en)
French (fr)
Inventor
Masanori Kato
Yasuyuki Mitsui
Reishi Kondo
Original Assignee
Nec Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nec Corporation filed Critical Nec Corporation
Priority to JP2009514094A priority Critical patent/JP5177135B2/ja
Priority to US12/599,317 priority patent/US8407054B2/en
Publication of WO2008139919A1 publication Critical patent/WO2008139919A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • G10L13/10Prosody rules derived from text; Stress or intonation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Navigation (AREA)

Abstract

 本発明は、接続歪みと韻律制御に伴う音質劣化の双方を十分に低減しつつ、韻律の乱れが小さい合成音声を生成することを目的とする。音声合成装置は、複数の音声素片の中から、中心素片を1つ選択する中心素片選択部と、中心素片を基に韻律情報を生成する韻律生成部と、中心素片と韻律情報とを基に中心素片区間以外の素片である非中心素片を選択する非中心素片選択部と、韻律情報と中心素片と非中心素片を基に合成音声波形を生成する波形生成部とを備える。音声合成装置は、韻律生成の元となる中心素片を先ず選択し、その中心素片を基に韻律情報を生成するので、中心素片の区間では接続歪みと韻律制御に伴う音質劣化の双方を低減することができる。また中心素片が選ばれなかった区間においては、中心素片に基づいて生成された韻律情報に適した素片を選択するため、合成音声の韻律の乱れを小さくできる。
PCT/JP2008/058179 2007-05-08 2008-04-28 音声合成装置、音声合成方法及び音声合成プログラム WO2008139919A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009514094A JP5177135B2 (ja) 2007-05-08 2008-04-28 音声合成装置、音声合成方法及び音声合成プログラム
US12/599,317 US8407054B2 (en) 2007-05-08 2008-04-28 Speech synthesis device, speech synthesis method, and speech synthesis program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2007-123422 2007-05-08
JP2007123422 2007-05-08

Publications (1)

Publication Number Publication Date
WO2008139919A1 true WO2008139919A1 (ja) 2008-11-20

Family

ID=40002133

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2008/058179 WO2008139919A1 (ja) 2007-05-08 2008-04-28 音声合成装置、音声合成方法及び音声合成プログラム

Country Status (3)

Country Link
US (1) US8407054B2 (ja)
JP (1) JP5177135B2 (ja)
WO (1) WO2008139919A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8630857B2 (en) * 2007-02-20 2014-01-14 Nec Corporation Speech synthesizing apparatus, method, and program
US9368104B2 (en) 2012-04-30 2016-06-14 Src, Inc. System and method for synthesizing human speech using multiple speakers and context
CN111583901B (zh) * 2020-04-02 2023-07-11 湖南声广科技有限公司 一种广播电台智能天气预报***及天气预报语音切分方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06318094A (ja) * 1993-05-07 1994-11-15 Sharp Corp 音声規則合成装置
JP2001117577A (ja) * 1999-10-19 2001-04-27 Victor Co Of Japan Ltd 音声合成装置
JP2002049386A (ja) * 2000-08-01 2002-02-15 Sharp Corp テキスト音声合成装置、テキスト音声合成方法及びその方法を記録した記録媒体
JP2005265874A (ja) * 2004-03-16 2005-09-29 Advanced Telecommunication Research Institute International 素片接続型音声合成装置
JP2005300919A (ja) * 2004-04-12 2005-10-27 Mitsubishi Electric Corp 音声合成装置
JP2005321630A (ja) * 2004-05-10 2005-11-17 Nippon Telegr & Teleph Corp <Ntt> 音声合成方法及びその装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2812104B2 (ja) 1992-10-26 1998-10-22 松下電器産業株式会社 超音波ワイヤボンディング装置
US6076060A (en) * 1998-05-01 2000-06-13 Compaq Computer Corporation Computer method and apparatus for translating text to sound
US20030158734A1 (en) * 1999-12-16 2003-08-21 Brian Cruickshank Text to speech conversion using word concatenation
JP2003271172A (ja) * 2002-03-15 2003-09-25 Sony Corp 音声合成方法、音声合成装置、プログラム及び記録媒体、並びにロボット装置
GB2392358A (en) * 2002-08-02 2004-02-25 Rhetorical Systems Ltd Method and apparatus for smoothing fundamental frequency discontinuities across synthesized speech segments
JP4223783B2 (ja) 2002-10-16 2009-02-12 シャープ株式会社 音声合成装置、音声合成方法、音声合成プログラム、および、プログラム記録媒体
JP3854593B2 (ja) 2003-09-16 2006-12-06 株式会社国際電気通信基礎技術研究所 音声合成装置及びそのためのコスト計算装置、並びにコンピュータプログラム
JP2006084854A (ja) 2004-09-16 2006-03-30 Toshiba Corp 音声合成装置、音声合成方法および音声合成プログラム
JP4551803B2 (ja) * 2005-03-29 2010-09-29 株式会社東芝 音声合成装置及びそのプログラム
JP2006337476A (ja) * 2005-05-31 2006-12-14 Canon Inc 音声合成方法および装置
US8036894B2 (en) * 2006-02-16 2011-10-11 Apple Inc. Multi-unit approach to text-to-speech synthesis
JP4648878B2 (ja) * 2006-07-10 2011-03-09 日本電信電話株式会社 様式指定型音声合成方法、及び様式指定型音声合成装置とそのプログラムと、その記憶媒体
JP2008020840A (ja) * 2006-07-14 2008-01-31 Sharp Corp 音声合成装置、音声合成方法およびコンピュータを音声合成装置として機能させるためのプログラム、ならびに、フィルタ生成装置、フィルタ生成方法およびコンピュータをフィルタ生成装置として機能させるためのプログラム
JP2008033133A (ja) * 2006-07-31 2008-02-14 Toshiba Corp 音声合成装置、音声合成方法および音声合成プログラム
US8630857B2 (en) * 2007-02-20 2014-01-14 Nec Corporation Speech synthesizing apparatus, method, and program

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06318094A (ja) * 1993-05-07 1994-11-15 Sharp Corp 音声規則合成装置
JP2001117577A (ja) * 1999-10-19 2001-04-27 Victor Co Of Japan Ltd 音声合成装置
JP2002049386A (ja) * 2000-08-01 2002-02-15 Sharp Corp テキスト音声合成装置、テキスト音声合成方法及びその方法を記録した記録媒体
JP2005265874A (ja) * 2004-03-16 2005-09-29 Advanced Telecommunication Research Institute International 素片接続型音声合成装置
JP2005300919A (ja) * 2004-04-12 2005-10-27 Mitsubishi Electric Corp 音声合成装置
JP2005321630A (ja) * 2004-05-10 2005-11-17 Nippon Telegr & Teleph Corp <Ntt> 音声合成方法及びその装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KATO M. ET AL.: "Nidan Tan'i Sentaku o Mochiita Koonshitsu Onsei Gosei", THE ACOUSTICAL SOCIETY OF JAPAN 2008 NEN SHUNKI KENKYU HAPPYOKAI KOEN RONBUNSHU KOEN YOSHI. KOEN RONBUN CD-ROM, 10 March 2008 (2008-03-10), pages 1-11-22 *

Also Published As

Publication number Publication date
JPWO2008139919A1 (ja) 2010-08-05
US20100211393A1 (en) 2010-08-19
JP5177135B2 (ja) 2013-04-03
US8407054B2 (en) 2013-03-26

Similar Documents

Publication Publication Date Title
MY153798A (en) Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
MX2009005159A (es) Un metodo y un aparato para descodificar una señal de audio.
CA2730198A1 (en) Audio signal synthesizer and audio signal encoder
MY143234A (en) Enhanced method for signal shaping in multi-channel audio reconstruction
MX2007004642A (es) Combinaciones polimericas para producir peliculas con un numero reducido de defectos.
WO2007117765A3 (en) Ex vivo generated tissue system
HK1128548A1 (en) Apparatus and method for multi -channel parameter transformation
WO2009096713A3 (ko) 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화, 복호화 방법 및 장치
ES2673319T3 (es) Control de coherencia de fase para señales armónicas en códecs de audio perceptual
WO2008030756A3 (en) Method and system for training a text-to-speech synthesis system using a specific domain speech database
EA201190258A1 (ru) Способ синтеза речи
HK1166104A1 (en) Enzyme associated with equol synthesis
ATE529854T1 (de) Signalverarbeitungsverfahren, verarbeitungsvorrichtung und sprachdecodierer
WO2009062119A3 (en) Microorganisms and methods for increased hydrogen production
EP2213617A4 (en) ELEMENT FOR PRODUCING A HYDROGEN GAS AND METHOD FOR PRODUCING THE HYDROGEN GAS
WO2010024551A3 (en) Method and system for 3d lip-synch generation with data faithful machine learning
CN102810309A (zh) 语音合成设备
WO2009142465A3 (en) A method and an apparatus for processing a signal
EP2001013A3 (en) Audio time scale modification algorithm for dynamic playback speed control
WO2010093224A3 (ko) 적응적 정현파 펄스 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치
SG115665A1 (en) Method and apparatus to generate an audio beam with high quality
WO2008139919A1 (ja) 音声合成装置、音声合成方法及び音声合成プログラム
WO2008147649A8 (en) Method for synthesizing speech
CA2573434A1 (en) Tone synthesis apparatus and method
TW200735636A (en) Method and apparatus for making VoIP connection through network

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 08752192

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2009514094

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 12599317

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 08752192

Country of ref document: EP

Kind code of ref document: A1