JP2013117638A - 音声合成装置および音声合成プログラム - Google Patents
音声合成装置および音声合成プログラム Download PDFInfo
- Publication number
- JP2013117638A JP2013117638A JP2011265125A JP2011265125A JP2013117638A JP 2013117638 A JP2013117638 A JP 2013117638A JP 2011265125 A JP2011265125 A JP 2011265125A JP 2011265125 A JP2011265125 A JP 2011265125A JP 2013117638 A JP2013117638 A JP 2013117638A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- statistical model
- input sentence
- acoustic feature
- voice data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】音声合成装置1は、入力文を解析して音素ごとに分割する入力文解析手段30と、音素ごとに音声データの候補を列挙する音声データ候補列挙手段40と、音声データの候補の中から音響特徴量の差分の積算値が最小となる組み合わせを探索し、入力文に対応した音声データの組み合わせを決定する音声データ決定手段50と、入力文に対応する音響モデルの列を列挙する統計モデル列挙手段と、統計モデルを音声データの音響特徴量によって置き換えて統計モデルを修正する統計モデル修正手段60と、修正された統計モデルの列を平滑化して入力文に対応した音響特徴量の列として出力する音響特徴量列生成手段70と、生成された音響特徴量の列を音声波形に変換する音声波形変換手段80と、を備える。
【選択図】図1
Description
以下、本発明の第1実施形態に係る音声合成装置1について、図1〜図4を参照しながら詳細に説明する。音声合成装置1は、図1に示すように、入力文が入力され、当該入力文に対応した合成音声を生成して出力するものである。音声合成装置1は、具体的には予め音声データの音響特徴量を音素ごとにモデル化した統計モデルであるHMMを用いて音声合成を行う。なお、HMMとは、音声データを統計パラメータとしてモデル化したものである。
以下、音声合成装置1の動作について、図5を参照しながら簡単に説明する。
以下、本発明の第2実施形態に係る音声合成装置1Aについて、図6を参照しながら詳細に説明する。音声合成装置1Aは、図6に示すように、音声データ決定手段50の代わりに音声データ決定手段50Aを備えること以外は、前記した第1実施形態に係る音声合成装置1と同様の構成を備えている。従って、前記した音声合成装置1と重複する構成については、同じ符号を付して説明を省略し、動作についても説明を省略する。
ここで、前記した音声合成装置1,1Aは、一般的なコンピュータを、前記した各手段および各部として機能させるプログラムにより動作させることで実現することができる。このプログラムは、通信回線を介して配布することも可能であるし、CD−ROM等の記録媒体に書き込んで配布することも可能である。
10 統計モデル記憶手段
20 音声データ記憶手段
30 入力文解析手段
40 音声データ候補列挙手段
50,50A 音声データ決定手段
51 音響特徴量算出手段
52 特徴量距離算出手段
53 組み合わせ決定手段
54 韻律目標推定手段
55 韻律距離算出手段
60 統計モデル列挙手段
70 統計モデル修正手段
80 音響特徴量列生成手段
90 音声波形変換手段
Claims (4)
- 予め音声データの音響特徴量を音素ごとにモデル化した統計モデルを用いて、入力文に対応する音声を合成する音声合成装置であって、
前記入力文を解析し、前記統計モデルの単位である音素ごとに分割する入力文解析手段と、
前記入力文解析手段による解析結果に従って、前記音素ごとに、前記入力文に対応する音声データの候補を列挙する音声データ候補列挙手段と、
前記音声データ候補列挙手段によって列挙された前記音声データの候補の中から、音響特徴量の差分の積算値が最小となる組み合わせを探索することで、前記入力文に対応する音声データの組み合わせを決定する音声データ決定手段と、
前記入力文解析手段による解析結果に従って、前記音素ごとに、前記入力文に対応する前記統計モデルを列挙する統計モデル列挙手段と、
前記統計モデル列挙手段によって列挙された前記統計モデルを、前記音声データ決定手段によって決定された前記音声データの組み合わせから抽出した音響特徴量によって置き換えることで修正する統計モデル修正手段と、
前記統計モデル修正手段によって修正された前記統計モデルの列を平滑化し、前記入力文に対応する音響特徴量の列として出力する音響特徴量列生成手段と、
前記音響特徴量列生成手段によって生成された前記音響特徴量の列を音声波形に変換する音声波形変換手段と、
を備えることを特徴とする音声合成装置。 - 前記統計モデル修正手段は、前記音声データ決定手段によって決定された前記音声データの長さと、前記統計モデル列挙手段によって列挙された前記統計モデルによってモデル化された音素の長さとが異なる場合は、前記音声データの前後に位置する音声データによって当該音声データの長さを補間するか、前記音声データの一部を間引く、もしくは平均化することで、前記音声データの長さが前記統計モデルによってモデル化された音素の長さと一致するように調整し、前記統計モデルを前記調整後の音声データから抽出した音響特徴量によって置き換えることで、当該統計モデルを修正することを特徴とする請求項1に記載の音声合成装置。
- 予め定められた韻律モデルに従って、前記入力文における韻律の目標値を推定する韻律目標推定手段を備え、
前記音声データ決定手段は、前記音声データの候補の中から、当該音声データの音響特徴量の差分の積算値と、前記韻律目標手段によって推定された韻律の目標値との差分と、を合計した値が最小となる組み合わせを探索することで、前記入力文に対応した音声データの組み合わせを決定することを特徴とする請求項1または請求項2に記載の音声合成装置。 - 予め音声データの音響特徴量を音素ごとにモデル化した統計モデルを用いて、入力文に対応する音声を合成するために、コンピュータを、
前記入力文を解析し、前記統計モデルの単位である音素ごとに分割する入力文解析手段、
前記入力文解析手段による解析結果に従って、前記音素ごとに、前記入力文に対応する音声データの候補を列挙する音声データ候補列挙手段、
前記音声データ候補列挙手段によって列挙された前記音声データの候補の中から、音響特徴量の差分の積算値が最小となる組み合わせを探索することで、前記入力文に対応する音声データの組み合わせを決定する音声データ決定手段、
前記入力文解析手段による解析結果に従って、前記音素ごとに、前記入力文に対応する前記統計モデルを列挙する統計モデル列挙手段、
前記統計モデル列挙手段によって列挙された前記統計モデルを、前記音声データ決定手段によって決定された前記音声データの組み合わせから抽出した音響特徴量によって置き換えることで修正する統計モデル修正手段、
前記統計モデル修正手段によって修正された前記統計モデルの列を平滑化し、前記入力文に対応する音響特徴量の列として出力する音響特徴量列生成手段、
前記音響特徴量列生成手段によって生成された前記音響特徴量の列を音声波形に変換する音声波形変換手段、
として機能させるための音声合成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011265125A JP2013117638A (ja) | 2011-12-02 | 2011-12-02 | 音声合成装置および音声合成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011265125A JP2013117638A (ja) | 2011-12-02 | 2011-12-02 | 音声合成装置および音声合成プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013117638A true JP2013117638A (ja) | 2013-06-13 |
Family
ID=48712231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011265125A Pending JP2013117638A (ja) | 2011-12-02 | 2011-12-02 | 音声合成装置および音声合成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2013117638A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016042659A1 (ja) * | 2014-09-19 | 2016-03-24 | 株式会社東芝 | 音声合成装置、音声合成方法およびプログラム |
US9715873B2 (en) | 2014-08-26 | 2017-07-25 | Clearone, Inc. | Method for adding realism to synthetic speech |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004012584A (ja) * | 2002-06-04 | 2004-01-15 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識用情報作成方法、音響モデル作成方法、音声認識方法、音声合成用情報作成方法、音声合成方法及びそれらの装置、並びにプログラム及びそのプログラムを記録した記録媒体 |
JP2004139033A (ja) * | 2002-09-25 | 2004-05-13 | Nippon Hoso Kyokai <Nhk> | 音声合成方法、音声合成装置および音声合成プログラム |
JP2007163667A (ja) * | 2005-12-12 | 2007-06-28 | Nippon Hoso Kyokai <Nhk> | 音声合成装置および音声合成プログラム |
JP2008191477A (ja) * | 2007-02-06 | 2008-08-21 | Nippon Telegr & Teleph Corp <Ntt> | ハイブリッド型音声合成方法、及びその装置とそのプログラムと、その記憶媒体 |
-
2011
- 2011-12-02 JP JP2011265125A patent/JP2013117638A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004012584A (ja) * | 2002-06-04 | 2004-01-15 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識用情報作成方法、音響モデル作成方法、音声認識方法、音声合成用情報作成方法、音声合成方法及びそれらの装置、並びにプログラム及びそのプログラムを記録した記録媒体 |
JP2004139033A (ja) * | 2002-09-25 | 2004-05-13 | Nippon Hoso Kyokai <Nhk> | 音声合成方法、音声合成装置および音声合成プログラム |
JP2007163667A (ja) * | 2005-12-12 | 2007-06-28 | Nippon Hoso Kyokai <Nhk> | 音声合成装置および音声合成プログラム |
JP2008191477A (ja) * | 2007-02-06 | 2008-08-21 | Nippon Telegr & Teleph Corp <Ntt> | ハイブリッド型音声合成方法、及びその装置とそのプログラムと、その記憶媒体 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9715873B2 (en) | 2014-08-26 | 2017-07-25 | Clearone, Inc. | Method for adding realism to synthetic speech |
WO2016042659A1 (ja) * | 2014-09-19 | 2016-03-24 | 株式会社東芝 | 音声合成装置、音声合成方法およびプログラム |
JPWO2016042659A1 (ja) * | 2014-09-19 | 2017-04-27 | 株式会社東芝 | 音声合成装置、音声合成方法およびプログラム |
US10529314B2 (en) | 2014-09-19 | 2020-01-07 | Kabushiki Kaisha Toshiba | Speech synthesizer, and speech synthesis method and computer program product utilizing multiple-acoustic feature parameters selection |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5665780B2 (ja) | 音声合成装置、方法およびプログラム | |
US8338687B2 (en) | Apparatus and method for creating singing synthesizing database, and pitch curve generation apparatus and method | |
JP4241762B2 (ja) | 音声合成装置、その方法、及びプログラム | |
US8423367B2 (en) | Apparatus and method for creating singing synthesizing database, and pitch curve generation apparatus and method | |
JP5159279B2 (ja) | 音声処理装置及びそれを用いた音声合成装置。 | |
CN113724685B (zh) | 语音合成模型学习装置、语音合成模型学习方法及存储介质 | |
JP6293912B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP3910628B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP5269668B2 (ja) | 音声合成装置、プログラム、及び方法 | |
JP2010049196A (ja) | 声質変換装置及び方法、音声合成装置及び方法 | |
JP2012141354A (ja) | 音声合成方法、音声合成装置及び音声合成プログラム | |
JP4533255B2 (ja) | 音声合成装置、音声合成方法、音声合成プログラムおよびその記録媒体 | |
JP5930738B2 (ja) | 音声合成装置及び音声合成方法 | |
JP4247289B1 (ja) | 音声合成装置、音声合成方法およびそのプログラム | |
JP4829605B2 (ja) | 音声合成装置および音声合成プログラム | |
JP2013117638A (ja) | 音声合成装置および音声合成プログラム | |
JP2009133890A (ja) | 音声合成装置及びその方法 | |
JP2013164609A (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
JP5874639B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP6523423B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP5393546B2 (ja) | 韻律作成装置及び韻律作成方法 | |
JP4640063B2 (ja) | 音声合成方法,音声合成装置,およびコンピュータプログラム | |
JP2004233774A (ja) | 音声合成方法及び装置、並びに音声合成プログラム | |
JP2006084854A (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP2016151709A (ja) | 音声合成装置及び音声合成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20140326 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141104 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150915 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150929 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20160322 |