JP4125362B2 - 音声合成装置 - Google Patents
音声合成装置 Download PDFInfo
- Publication number
- JP4125362B2 JP4125362B2 JP2007516243A JP2007516243A JP4125362B2 JP 4125362 B2 JP4125362 B2 JP 4125362B2 JP 2007516243 A JP2007516243 A JP 2007516243A JP 2007516243 A JP2007516243 A JP 2007516243A JP 4125362 B2 JP4125362 B2 JP 4125362B2
- Authority
- JP
- Japan
- Prior art keywords
- characteristic
- utterance
- speech
- unit
- timbre
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000003860 storage Methods 0.000 claims description 62
- 230000015572 biosynthetic process Effects 0.000 claims description 38
- 238000003786 synthesis reaction Methods 0.000 claims description 38
- 239000003086 colorant Substances 0.000 claims description 4
- 210000001584 soft palate Anatomy 0.000 claims description 2
- 230000008451 emotion Effects 0.000 description 221
- 238000012545 processing Methods 0.000 description 73
- 230000014509 gene expression Effects 0.000 description 51
- 238000006243 chemical reaction Methods 0.000 description 48
- 238000010586 diagram Methods 0.000 description 34
- 238000000034 method Methods 0.000 description 31
- 230000008921 facial expression Effects 0.000 description 30
- 238000009826 distribution Methods 0.000 description 18
- 230000009466 transformation Effects 0.000 description 15
- 230000002996 emotional effect Effects 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 9
- 210000000056 organ Anatomy 0.000 description 8
- 238000011002 quantification Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 241000282414 Homo sapiens Species 0.000 description 5
- 238000001308 synthesis method Methods 0.000 description 5
- 230000001755 vocal effect Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 241001122315 Polites Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 210000000867 larynx Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Electrophonic Musical Instruments (AREA)
Description
図4および図5は、本発明の実施の形態1に係る音声合成装置の機能ブロック図である。図6は、図5に示す音声合成装置の推定式・閾値記憶部に記憶される情報の一例を示す図である。図7は自然発声音声での特徴的音色の出現頻度を子音ごとにまとめて示した図である。図8は特殊音声の発生位置の予測例を示す模式図である。図9は実施の形態1における音声合成装置の動作を示したフローチャートである。
なお、本実施の形態において、素片選択部606、標準音声素片データベース207、特殊音声素片データベース208、素片接続部209を設け、波形重畳法による音声合成方式での実現方法を示したが、図12に示すように、音声合成装置は、パラメータ素片を選択する素片選択部706と、標準音声パラメータ素片データベース307と、特殊音声変換規則記憶部308と、パラメータ変形部309と、波形生成部310とを設けるようにしてもよい。
なお、本実施の形態において、素片選択部606、標準音声素片データベース207、特殊音声素片データベース208、素片接続部209を設け、波形重畳法による音声合成方式での実現方法を示したが、図14に示すように、音声合成装置は、標準音声のパラメータ列を生成する合成パラメータ生成部406と、特殊音声変換規則記憶部308と、変換規則に従って標準音声パラメータから特殊音声を生成し、さらに所望の韻律の音声を実現するパラメータ変形部309と、波形生成部310とを設けるようにしてもよい。
なお、本実施の形態において、素片選択部206、標準音声素片データベース207、特殊音声素片データベース208、素片接続部209を設け、波形重畳法による音声合成方式での実現方法を示したが、図16に示すように、音声合成装置は、標準音声のパラメータ列を生成する標準音声パラメータ生成部507と、特徴的音色の音声のパラメータ列を生成する少なくとも1つの特殊音声パラメータ生成部508(特殊音声パラメータ生成部508a,508b,508c)と、標準音声パラメータ生成部507と、特殊音声パラメータ生成部508とを切り替えるスイッチ509と、合成パラメータ列から音声波形を生成する波形生成部310とを設けるようにしてもよい。
図19および図20は、本発明の実施の形態2の音声合成装置の機能ブロック図である。図19において、図4および図5と同じ構成要素については同じ符号を用い、適宜説明を省略する。
図25は、本発明の実施の形態3の音声合成装置の機能ブロック図である。図25において、図4および図19と同じ構成要素については同じ符号を用い、適宜説明を省略する。
(2)子音が/m/(両唇音でかつ鼻音)であり、かつアクセント句の前から3番目のモーラ
(3)子音が/n/(歯茎音でかつ鼻音)であり、かつアクセント句の先頭モーラ
(4)子音が/d/(歯茎音でかつ音声破裂子音)であり、かつアクセント句の先頭モーラ
(6)子音が/t/(歯茎音でかつ無声破裂音)であり、かつアクセント句の前から4番目のモーラ
(7)子音が/k/(軟口蓋音でかつ無声破裂音)であり、かつアクセント句の前から5番目のモーラ
(8)子音が/s/(歯音でかつ無声摩擦音)であり、アクセント句の前から6番目のモーラ
102、206、606、706 素片選択部
103 韻律制御部
104 パラメータ制御部
105 音声合成部
106 感情情報抽出部
107 感情制御情報変換部
108 感情制御部
109 感情入力インタフェース部
110、210、509、809、 スイッチ
202 感情入力部
203 特徴的音色選択部
204 特徴的音色音韻頻度決定部
205 韻律生成部
207 標準音声素片データベース
208 特殊音声素片データベース
209 素片接続部
221 感情強度特徴的音色頻度変換部
220 感情強度−頻度変換規則記憶部
307 標準音声パラメータ素片データベース
308 特殊音声変換規則記憶部
309 パラメータ変形部
310 波形生成部
406 合成パラメータ生成部
506 特殊音声位置決定部
507 標準音声パラメータ生成部
508 特殊音声パラメータ生成部
604 特徴的音色時間位置推定部
620 推定式・閾値記憶部
621 推定式選択部
622 特徴的音色音韻推定部
804 特徴的音色時間位置推定部
820 推定式記憶部
821 推定式選択部
823 判定閾値決定部
901 要素感情音色選択部
902 要素音色テーブル
903 要素音色選択部
1001 マークアップ言語解析部
Claims (6)
- 音声合成される音声波形の発話様態を取得する発話様態取得手段と、
言語処理されたテキストを、取得された前記発話様態で発話する際の韻律を生成する韻律生成手段と、
取得された前記発話様態で前記テキストを発話する際に観察される特徴的音色を、前記発話様態に基づき選択する特徴的音色選択手段と、
音韻と韻律とに基づいて前記特徴的音色の発生のしやすさを判断するための規則を記憶している記憶手段と、
前記テキストの音韻列と、前記特徴的音色と、前記韻律と、前記規則とに基づいて、前記音韻列を構成する音韻ごとに、前記特徴的音色で発話するか否かを判断して、前記特徴的音色で発話する発話位置である音韻を決定する発話位置決定手段と、
前記音韻列、前記韻律および前記発話位置に基づいて、前記発話様態で前記テキストを発話し、かつ前記発話位置決定手段で決定された発話位置において特徴的音色で前記テキストを発話するような音声波形を生成する波形合成手段と、
前記特徴的音色に基づいて、前記特徴的音色で発話する頻度を決定する頻度決定手段とを備え、
前記発話位置決定手段は、前記テキストの音韻列と、前記特徴的音色と、前記韻律と、前記規則と、前記頻度とに基づいて、前記音韻列を構成する音韻ごとに、前記特徴的音色で発話するか否かを判断して、前記特徴的音色で発話する発話位置である音韻を決定する
ことを特徴とする音声合成装置。 - 前記頻度決定手段は、モーラ、音節、音素または音声合成単位を単位として、前記頻度を決定する
ことを特徴とする請求項1に記載の音声合成装置。 - 音声合成される音声波形の発話様態を取得する発話様態取得手段と、
言語処理されたテキストを、取得された前記発話様態で発話する際の韻律を生成する韻律生成手段と、
取得された前記発話様態で前記テキストを発話する際に観察される特徴的音色を、前記発話様態に基づき選択する特徴的音色選択手段と、
音韻と韻律とに基づいて前記特徴的音色の発生のしやすさを判断するための規則を記憶している記憶手段と、
前記テキストの音韻列と、前記特徴的音色と、前記韻律と、前記規則とに基づいて、前記音韻列を構成する音韻ごとに、前記特徴的音色で発話するか否かを判断して、前記特徴的音色で発話する発話位置である音韻を決定する発話位置決定手段と、
前記音韻列、前記韻律および前記発話位置に基づいて、前記発話様態で前記テキストを発話し、かつ前記発話位置決定手段で決定された発話位置において特徴的音色で前記テキストを発話するような音声波形を生成する波形合成手段とを備え、
前記特徴的音色選択手段は、
発話様態と、複数の特徴的音色および当該特徴的音色で発話する頻度の組とを対応付けて記憶する要素音色記憶部と、
取得された前記発話様態に対応する前記複数の特徴的音色および当該特徴的音色で発話する頻度の組を前記要素音色記憶部より選択する選択部とを有し、
前記発話位置決定手段は、前記テキストの音韻列と、前記複数の特徴的音色および当該特徴的音色で発話する頻度の組と、前記韻律と、前記規則とに基づいて、前記音韻列を構成する音韻ごとに、前記複数の特徴的音色のうちのいずれかで発話するか否かを判断して、各特徴的音色で発話する発話位置である音韻を決定する
ことを特徴とする音声合成装置。 - 前記発話様態取得手段は、さらに、前記発話様態の強度を取得し、
前記要素音声記憶部は、前記発話様態および当該発話様態の強度の組と、前記複数の特徴的音色および当該特徴的音色で発話する頻度の組とを対応付けて記憶しており、
前記選択部は、取得された前記発話様態および当該発話様態の強度の組に対応する前記複数の特徴的音色および当該特徴的音色で発話する頻度の組を前記要素音色記憶部より選択する
ことを特徴とする請求項3に記載の音声合成装置。 - 音声合成される音声波形の発話様態を取得する発話様態取得手段と、
言語処理されたテキストを、取得された前記発話様態で発話する際の韻律を生成する韻律生成手段と、
取得された前記発話様態で前記テキストを発話する際に観察される特徴的音色を、前記発話様態に基づき選択する特徴的音色選択手段と、
音韻と韻律とに基づいて前記特徴的音色の発生のしやすさを判断するための規則を記憶している記憶手段と、
前記テキストの音韻列と、前記特徴的音色と、前記韻律と、前記規則とに基づいて、前記音韻列を構成する音韻ごとに、前記特徴的音色で発話するか否かを判断して、前記特徴的音色で発話する発話位置である音韻を決定する発話位置決定手段と、
前記音韻列、前記韻律および前記発話位置に基づいて、前記発話様態で前記テキストを発話し、かつ前記発話位置決定手段で決定された発話位置において特徴的音色で前記テキストを発話するような音声波形を生成する波形合成手段とを備え、
前記特徴的音色選択手段は、
発話様態と複数の特徴的音色とを対応付けて記憶する要素音色記憶部と、
取得された前記発話様態に対応する前記複数の特徴的音色を前記要素音色記憶部より選択する選択部とを有し、
前記発話位置決定手段は、前記テキストの音韻列と、前記複数の特徴的音色と、前記韻律と、前記規則とに基づいて、前記音韻列を構成する音韻ごとに、前記複数の特徴的音色のうちのいずれかで発話するか否かを判断して、前記複数の特徴的音色の発話位置が重ならないように、各特徴的音色で発話する発話位置である音韻を決定する
ことを特徴とする音声合成装置。 - 音声合成される音声波形の発話様態を取得する発話様態取得手段と、
取得された前記発話様態で、音声合成の対象であるテキストを発話する際に観測される特徴的音色を、前記発話様態に基づき選択する特徴的音色選択手段と、
特徴的音色「力み」により発話する音韻位置を示す規則は、(1)子音が/b/(両唇音でかつ音声破裂子音)であり、かつアクセント句の前から3番目のモーラ、(2)子音が/m/(両唇音でかつ鼻音)であり、かつアクセント句の前から3番目のモーラ、(3)子音が/n/(歯茎音でかつ鼻音)であり、かつアクセント句の先頭モーラ、(4)子音が/d/(歯茎音でかつ音声破裂子音)であり、かつアクセント句の先頭モーラであり、特徴的音色「かすれ」により発話する音韻位置を示す規則は、(5)子音が/h/(喉頭音でかつ無声摩擦音)であり、かつアクセント句の先頭のモーラまたはアクセント句の前から3番目のモーラ、(6)子音が/t/(歯茎音でかつ無声破裂音)であり、かつアクセント句の前から4番目のモーラ、(7)子音が/k/(軟口蓋音でかつ無声破裂音)であり、かつアクセント句の前から5番目のモーラ、(8)子音が/s/(歯音でかつ無声摩擦音)であり、アクセント句の前から6番目のモーラであることを記憶している記憶手段と、
前記特徴的音色選択手段が選択した特徴的音色が「力み」の場合は、前記テキストの音韻列において、前記記憶手段に記憶されている前記(1)〜(4)のいずれかの規則を満たす音韻の位置を、「力み」で発話する音韻位置と決定し、前記特徴的音色選択手段が選択した特徴的音色が「かすれ」の場合は、前記テキストの音韻列において、前記記憶手段に記憶されている前記(5)〜(8)のいずれかの規則を満たす音韻の位置を、「かすれ」で発話する音韻位置と決定する発話位置決定手段と、
前記発話位置決定手段によって決定された音韻位置を前記特徴的音色で発話させるような音声波形を生成する波形合成手段とを備える
ことを特徴とする音声合成装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005146027 | 2005-05-18 | ||
JP2005146027 | 2005-05-18 | ||
PCT/JP2006/309144 WO2006123539A1 (ja) | 2005-05-18 | 2006-05-02 | 音声合成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP4125362B2 true JP4125362B2 (ja) | 2008-07-30 |
JPWO2006123539A1 JPWO2006123539A1 (ja) | 2008-12-25 |
Family
ID=37431117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007516243A Expired - Fee Related JP4125362B2 (ja) | 2005-05-18 | 2006-05-02 | 音声合成装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8073696B2 (ja) |
JP (1) | JP4125362B2 (ja) |
CN (1) | CN101176146B (ja) |
WO (1) | WO2006123539A1 (ja) |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008102594A1 (ja) * | 2007-02-19 | 2008-08-28 | Panasonic Corporation | 力み変換装置、音声変換装置、音声合成装置、音声変換方法、音声合成方法およびプログラム |
WO2008149547A1 (ja) * | 2007-06-06 | 2008-12-11 | Panasonic Corporation | 声質編集装置および声質編集方法 |
JP2009042509A (ja) * | 2007-08-09 | 2009-02-26 | Toshiba Corp | アクセント情報抽出装置及びその方法 |
JP5238205B2 (ja) * | 2007-09-07 | 2013-07-17 | ニュアンス コミュニケーションズ,インコーポレイテッド | 音声合成システム、プログラム及び方法 |
JP5198046B2 (ja) * | 2007-12-07 | 2013-05-15 | 株式会社東芝 | 音声処理装置及びそのプログラム |
CN101727904B (zh) * | 2008-10-31 | 2013-04-24 | 国际商业机器公司 | 语音翻译方法和装置 |
WO2011001694A1 (ja) * | 2009-07-03 | 2011-01-06 | パナソニック株式会社 | 補聴器の調整装置、方法およびプログラム |
US8731932B2 (en) | 2010-08-06 | 2014-05-20 | At&T Intellectual Property I, L.P. | System and method for synthetic voice generation and modification |
US8965768B2 (en) | 2010-08-06 | 2015-02-24 | At&T Intellectual Property I, L.P. | System and method for automatic detection of abnormal stress patterns in unit selection synthesis |
TWI413104B (zh) * | 2010-12-22 | 2013-10-21 | Ind Tech Res Inst | 可調控式韻律重估測系統與方法及電腦程式產品 |
US20130030789A1 (en) * | 2011-07-29 | 2013-01-31 | Reginald Dalce | Universal Language Translator |
JP5148026B1 (ja) * | 2011-08-01 | 2013-02-20 | パナソニック株式会社 | 音声合成装置および音声合成方法 |
US10469623B2 (en) * | 2012-01-26 | 2019-11-05 | ZOOM International a.s. | Phrase labeling within spoken audio recordings |
CN103543979A (zh) * | 2012-07-17 | 2014-01-29 | 联想(北京)有限公司 | 一种输出语音的方法、语音交互的方法及电子设备 |
GB2505400B (en) * | 2012-07-18 | 2015-01-07 | Toshiba Res Europ Ltd | A speech processing system |
US9922641B1 (en) * | 2012-10-01 | 2018-03-20 | Google Llc | Cross-lingual speaker adaptation for multi-lingual speech synthesis |
US9959270B2 (en) | 2013-01-17 | 2018-05-01 | Speech Morphing Systems, Inc. | Method and apparatus to model and transfer the prosody of tags across languages |
US9418655B2 (en) * | 2013-01-17 | 2016-08-16 | Speech Morphing Systems, Inc. | Method and apparatus to model and transfer the prosody of tags across languages |
JP5807921B2 (ja) * | 2013-08-23 | 2015-11-10 | 国立研究開発法人情報通信研究機構 | 定量的f0パターン生成装置及び方法、f0パターン生成のためのモデル学習装置、並びにコンピュータプログラム |
US9195656B2 (en) | 2013-12-30 | 2015-11-24 | Google Inc. | Multilingual prosody generation |
JP6483578B2 (ja) * | 2015-09-14 | 2019-03-13 | 株式会社東芝 | 音声合成装置、音声合成方法およびプログラム |
CN106816158B (zh) | 2015-11-30 | 2020-08-07 | 华为技术有限公司 | 一种语音质量评估方法、装置及设备 |
JP6639285B2 (ja) * | 2016-03-15 | 2020-02-05 | 株式会社東芝 | 声質嗜好学習装置、声質嗜好学習方法及びプログラム |
US9817817B2 (en) | 2016-03-17 | 2017-11-14 | International Business Machines Corporation | Detection and labeling of conversational actions |
US20180018973A1 (en) | 2016-07-15 | 2018-01-18 | Google Inc. | Speaker verification |
US10789534B2 (en) | 2016-07-29 | 2020-09-29 | International Business Machines Corporation | Measuring mutual understanding in human-computer conversation |
CN107785020B (zh) * | 2016-08-24 | 2022-01-25 | 中兴通讯股份有限公司 | 语音识别处理方法及装置 |
CN108364631B (zh) * | 2017-01-26 | 2021-01-22 | 北京搜狗科技发展有限公司 | 一种语音合成方法和装置 |
US10204098B2 (en) * | 2017-02-13 | 2019-02-12 | Antonio GONZALO VACA | Method and system to communicate between devices through natural language using instant messaging applications and interoperable public identifiers |
CN107705783B (zh) * | 2017-11-27 | 2022-04-26 | 北京搜狗科技发展有限公司 | 一种语音合成方法及装置 |
US10418025B2 (en) * | 2017-12-06 | 2019-09-17 | International Business Machines Corporation | System and method for generating expressive prosody for speech synthesis |
EP3739572A4 (en) * | 2018-01-11 | 2021-09-08 | Neosapience, Inc. | METHOD AND DEVICE FOR TEXT-TO-LANGUAGE SYNTHESIS USING MACHINE LEARNING AND COMPUTER-READABLE STORAGE MEDIUM |
CN108615524A (zh) * | 2018-05-14 | 2018-10-02 | 平安科技(深圳)有限公司 | 一种语音合成方法、***及终端设备 |
CN109447234B (zh) * | 2018-11-14 | 2022-10-21 | 腾讯科技(深圳)有限公司 | 一种模型训练方法、合成说话表情的方法和相关装置 |
CN111192568B (zh) * | 2018-11-15 | 2022-12-13 | 华为技术有限公司 | 一种语音合成方法及语音合成装置 |
CN111128118B (zh) * | 2019-12-30 | 2024-02-13 | 科大讯飞股份有限公司 | 语音合成方法、相关设备及可读存储介质 |
CN111583904B (zh) * | 2020-05-13 | 2021-11-19 | 北京字节跳动网络技术有限公司 | 语音合成方法、装置、存储介质及电子设备 |
CN112270920A (zh) * | 2020-10-28 | 2021-01-26 | 北京百度网讯科技有限公司 | 一种语音合成方法、装置、电子设备和可读存储介质 |
CN112786012B (zh) * | 2020-12-31 | 2024-05-31 | 科大讯飞股份有限公司 | 一种语音合成方法、装置、电子设备和存储介质 |
CN113421544B (zh) * | 2021-06-30 | 2024-05-10 | 平安科技(深圳)有限公司 | 歌声合成方法、装置、计算机设备及存储介质 |
CN114420086B (zh) * | 2022-03-30 | 2022-06-17 | 北京沃丰时代数据科技有限公司 | 语音合成方法和装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0772900A (ja) | 1993-09-02 | 1995-03-17 | Nippon Hoso Kyokai <Nhk> | 音声合成の感情付与方法 |
JP3260275B2 (ja) | 1996-03-14 | 2002-02-25 | シャープ株式会社 | 活字入力で通話が可能な通信通話装置 |
JP2002268699A (ja) * | 2001-03-09 | 2002-09-20 | Sony Corp | 音声合成装置及び音声合成方法、並びにプログラムおよび記録媒体 |
JP2002311981A (ja) | 2001-04-17 | 2002-10-25 | Sony Corp | 自然言語処理装置および自然言語処理方法、並びにプログラムおよび記録媒体 |
JP2003233388A (ja) | 2002-02-07 | 2003-08-22 | Sharp Corp | 音声合成装置および音声合成方法、並びに、プログラム記録媒体 |
EP1345207B1 (en) * | 2002-03-15 | 2006-10-11 | Sony Corporation | Method and apparatus for speech synthesis program, recording medium, method and apparatus for generating constraint information and robot apparatus |
JP2003302992A (ja) | 2002-04-11 | 2003-10-24 | Canon Inc | 音声合成方法及び装置 |
JP2003337592A (ja) | 2002-05-21 | 2003-11-28 | Toshiba Corp | 音声合成方法及び音声合成装置及び音声合成プログラム |
JP3706112B2 (ja) | 2003-03-12 | 2005-10-12 | 独立行政法人科学技術振興機構 | 音声合成装置及びコンピュータプログラム |
-
2006
- 2006-05-02 WO PCT/JP2006/309144 patent/WO2006123539A1/ja active Application Filing
- 2006-05-02 JP JP2007516243A patent/JP4125362B2/ja not_active Expired - Fee Related
- 2006-05-02 CN CN2006800168735A patent/CN101176146B/zh not_active Expired - Fee Related
- 2006-05-02 US US11/914,427 patent/US8073696B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
WO2006123539A1 (ja) | 2006-11-23 |
CN101176146B (zh) | 2011-05-18 |
JPWO2006123539A1 (ja) | 2008-12-25 |
US8073696B2 (en) | 2011-12-06 |
US20090234652A1 (en) | 2009-09-17 |
CN101176146A (zh) | 2008-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4125362B2 (ja) | 音声合成装置 | |
JP7082357B2 (ja) | 機械学習を利用したテキスト音声合成方法、装置およびコンピュータ読み取り可能な記憶媒体 | |
JP7178028B2 (ja) | 多言語テキスト音声合成モデルを利用した音声翻訳方法およびシステム | |
JP4355772B2 (ja) | 力み変換装置、音声変換装置、音声合成装置、音声変換方法、音声合成方法およびプログラム | |
JP5665780B2 (ja) | 音声合成装置、方法およびプログラム | |
JP6266372B2 (ja) | 音声合成辞書生成装置、音声合成辞書生成方法およびプログラム | |
JP7228998B2 (ja) | 音声合成装置及びプログラム | |
JP5148026B1 (ja) | 音声合成装置および音声合成方法 | |
JP5039865B2 (ja) | 声質変換装置及びその方法 | |
JP2006227589A (ja) | 音声合成装置および音声合成方法 | |
Burkhardt et al. | Emotional speech synthesis 20 | |
JP2006293026A (ja) | 音声合成装置,音声合成方法およびコンピュータプログラム | |
Krstulovic et al. | An HMM-based speech synthesis system applied to German and its adaptation to a limited set of expressive football announcements. | |
Deka et al. | Development of assamese text-to-speech system using deep neural network | |
JP2001242882A (ja) | 音声合成方法及び音声合成装置 | |
JP3706112B2 (ja) | 音声合成装置及びコンピュータプログラム | |
JP5320341B2 (ja) | 発声用テキストセット作成方法、発声用テキストセット作成装置及び発声用テキストセット作成プログラム | |
JPH08335096A (ja) | テキスト音声合成装置 | |
JP6523423B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP3742206B2 (ja) | 音声合成方法及び装置 | |
Hofer | Emotional speech synthesis | |
JP3575919B2 (ja) | テキスト音声変換装置 | |
Hirose et al. | Superpositional modeling of fundamental frequency contours for HMM-based speech synthesis | |
Suzié et al. | DNN based expressive text-to-speech with limited training data | |
Georgila | 19 Speech Synthesis: State of the Art and Challenges for the Future |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080408 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080507 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4125362 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110516 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110516 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120516 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120516 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130516 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130516 Year of fee payment: 5 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |