JP6291808B2 - 音声合成装置及び方法 - Google Patents
音声合成装置及び方法 Download PDFInfo
- Publication number
- JP6291808B2 JP6291808B2 JP2013244525A JP2013244525A JP6291808B2 JP 6291808 B2 JP6291808 B2 JP 6291808B2 JP 2013244525 A JP2013244525 A JP 2013244525A JP 2013244525 A JP2013244525 A JP 2013244525A JP 6291808 B2 JP6291808 B2 JP 6291808B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- sentence
- data
- start position
- phoneme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Description
図1に示す第1実施形態の音声発生装置及び音声合成装置は、音声合成によって音声データを生成する際に、音声の親しさの程度を増大させる構成例である。第1実施形態の音声発生装置及び音声合成装置は、文章を示すテキストデータに基づいて音声データを生成する音声合成装置である。
図2に示す第2実施形態の音声発生装置及び音声合成装置は、音声データが予め音声ファイルとして形成されている場合に音声の親しさの程度を増大させる構成例である。第2実施形態の音声発生装置及び音声合成装置は、文章の音声データを含む音声ファイルと、文章を示すテキストデータと、テキストデータのタイミングデータとに基づいて、音声データの韻律情報を修正する音声処理装置である。
図3に示す第3実施形態の音声発生装置及び音声合成装置は、人が話した音声の親しさの程度を増大させる構成例である。図3において、図2と同一部分には同一符号を付し、その説明を適宜省略する。
図1の韻律情報修正部13、図2及び図3の韻律情報修正部24における韻律情報の修正方法、及び、図2の修正位置検出部26、図3の修正位置検出部34における修正位置の検出方法について説明する。
14,25 合成部
16,27 D/A変換器(音声再生部)
17,28 スピーカ(音声再生部)
Claims (12)
- 文章を音声で表現するに際し、前記文章における最後の文節の最初の音素より後であり、前記最後の文節内のいずれかの位置を開始位置とし、前記開始位置以降の周波数を一定の周波数だけ上昇させるように韻律情報を修正する韻律情報修正部と、
前記韻律情報修正部によって修正された韻律情報と音道情報とを合成することにより、前記文章の音声データを生成する合成部と、
を備え、
前記韻律情報修正部は、前記最後の文節内の最初の音素を除くいずれかの音素に最も近い位置であり、前記文章の韻律が示す周波数特性の極点または変曲点を前記開始位置とする
ことを特徴とする音声合成装置。 - 前記韻律情報修正部は、前記開始位置より所定時間前の位置より前記開始位置まで周波数を連続的に変化させることを特徴とする請求項1に記載の音声合成装置。
- 前記韻律情報修正部は、前記所定時間前の位置を、前記開始位置より前に位置する極点または変曲点とすることを特徴とする請求項2に記載の音声合成装置。
- 前記音声合成装置は、前記文章を示すテキストデータに基づいて前記音声データを生成する音声合成装置であることを特徴とする請求項1〜3のいずれか1項に記載の音声合成装置。
- 前記音声合成装置は、前記文章の音声データを含む音声ファイルと、前記文章を示すテキストデータと、前記テキストデータのタイミングデータとに基づいて、前記音声データの韻律情報を修正する音声処理装置であることを特徴とする請求項1〜3のいずれか1項に記載の音声合成装置。
- 前記音声合成装置は、人が発する文章の音声をマイクロホンで収音した音声データと、前記マイクロホンで収音した音声データを音声認識することによって生成した前記文章を示すテキストデータとに基づいて、前記音声データの韻律情報を修正する音声処理装置であることを特徴とする請求項1〜3のいずれか1項に記載の音声合成装置。
- 文章の音声データを構成する韻律情報と音道情報とのうち、前記韻律情報における前記文章の最後の文節の最初の音素より後であり、前記最後の文節内のいずれかの位置を開始位置とし、前記開始位置以降の周波数を一定の周波数だけ上昇させるよう修正する韻律情報修正工程と、
前記韻律情報修正工程にて修正された韻律情報と前記音道情報とを合成して、前記文章の音声データを発音させたときの音声が有する親しさの程度を増大させた音声データを生成する合成工程と、
を含むことを特徴とする音声合成方法。 - 前記韻律情報修正工程にて、前記最後の文節内の最初の音素を除くいずれかの音素の子音または母音の位置を前記開始位置とすることを特徴とする請求項7に記載の音声合成方法。
- 前記韻律情報修正工程にて、前記いずれかの音素を前記最後の文節の最後の音素とすることを特徴とする請求項8に記載の音声合成方法。
- 入力音声データを入力する音声データ入力工程と、
前記入力音声データから音声を認識してテキストデータを出力する音声認識工程と、
前記テキストデータから前記開始位置を検出する開始位置検出工程と、
をさらに備えることを特徴とする請求項7〜9のいずれか1項に記載の音声合成方法。 - 前記開始位置検出工程にて、前記テキストデータに含まれる文節を検出することを特徴とする請求項10に記載の音声合成方法。
- 前記一定の周波数は40Hzであることを特徴とする請求項7〜11のいずれか1項に記載の音声合成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013244525A JP6291808B2 (ja) | 2013-11-27 | 2013-11-27 | 音声合成装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013244525A JP6291808B2 (ja) | 2013-11-27 | 2013-11-27 | 音声合成装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015102773A JP2015102773A (ja) | 2015-06-04 |
JP6291808B2 true JP6291808B2 (ja) | 2018-03-14 |
Family
ID=53378487
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013244525A Active JP6291808B2 (ja) | 2013-11-27 | 2013-11-27 | 音声合成装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6291808B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021090381A1 (ja) * | 2019-11-06 | 2021-05-14 | 三菱電機株式会社 | ピッチパターン補正装置、プログラム及びピッチパターン補正方法 |
JP7004872B2 (ja) * | 2019-11-06 | 2022-01-21 | 三菱電機株式会社 | ピッチパターン補正装置、プログラム及びピッチパターン補正方法 |
WO2021090379A1 (ja) * | 2019-11-06 | 2021-05-14 | 三菱電機株式会社 | ピッチパターン補正装置、プログラム及びピッチパターン補正方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05113795A (ja) * | 1991-05-31 | 1993-05-07 | Oki Electric Ind Co Ltd | 音声合成装置 |
JP3006240B2 (ja) * | 1991-10-31 | 2000-02-07 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 音声合成方法および装置 |
JPH06342297A (ja) * | 1993-06-02 | 1994-12-13 | Sony Corp | 音声合成装置 |
JP3616250B2 (ja) * | 1997-05-21 | 2005-02-02 | 日本電信電話株式会社 | 合成音声メッセージ作成方法、その装置及びその方法を記録した記録媒体 |
JP4651168B2 (ja) * | 2000-08-23 | 2011-03-16 | 任天堂株式会社 | 合成音声出力装置およびその方法並びに記録媒体 |
JP3625426B2 (ja) * | 2000-12-22 | 2005-03-02 | シャープ株式会社 | 音声合成装置 |
JP2003036100A (ja) * | 2001-07-23 | 2003-02-07 | Arcadia:Kk | 音声修正装置、音声修正方法 |
JP2004226505A (ja) * | 2003-01-20 | 2004-08-12 | Toshiba Corp | ピッチパタン生成方法、音声合成方法とシステム及びプログラム |
JP2007183421A (ja) * | 2006-01-06 | 2007-07-19 | Matsushita Electric Ind Co Ltd | 音声合成装置 |
JP2009047957A (ja) * | 2007-08-21 | 2009-03-05 | Toshiba Corp | ピッチパターン生成方法及びその装置 |
-
2013
- 2013-11-27 JP JP2013244525A patent/JP6291808B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015102773A (ja) | 2015-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4363590B2 (ja) | 音声合成 | |
JP4878538B2 (ja) | 音声合成装置 | |
US20050171778A1 (en) | Voice synthesizer, voice synthesizing method, and voice synthesizing system | |
US9147392B2 (en) | Speech synthesis device and speech synthesis method | |
JP6127422B2 (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
JP6291808B2 (ja) | 音声合成装置及び方法 | |
JP2012042974A (ja) | 音声合成装置 | |
Petrushin et al. | Whispered speech prosody modeling for TTS synthesis | |
JP6260228B2 (ja) | 音声合成装置及び方法 | |
JP5360489B2 (ja) | 音素符号変換装置および音声合成装置 | |
JP6260227B2 (ja) | 音声合成装置及び方法 | |
JP2000250401A (ja) | 言語学習方法、言語学習装置およびプログラムを記録した媒体 | |
JP2002525663A (ja) | ディジタル音声処理装置及び方法 | |
JP2007139868A (ja) | 語学学習装置 | |
JP2006139162A (ja) | 語学学習装置 | |
JP3578598B2 (ja) | 音声合成装置 | |
US20180330742A1 (en) | Speech acquisition device and speech acquisition method | |
JP4736524B2 (ja) | 音声合成装置及び音声合成プログラム | |
JPH07200554A (ja) | 文章読み上げ装置 | |
JP6894081B2 (ja) | 語学学習装置 | |
JP2016065976A (ja) | 音声変形装置及び方法 | |
JP6274470B1 (ja) | 上下発声母音表記方法 | |
Zainkó et al. | Expressive speech synthesis using emotion-specific speech inventories | |
Madaminjonov | Formation of a Speech Database in the Karakalpak Language for Speech Synthesis Systems | |
JP2023121372A (ja) | データ処理装置、データ処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160926 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170906 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170912 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171114 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180116 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180129 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6291808 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |