JP6011758B2 - 音声合成システム、音声合成方法、およびプログラム - Google Patents
音声合成システム、音声合成方法、およびプログラム Download PDFInfo
- Publication number
- JP6011758B2 JP6011758B2 JP2011196779A JP2011196779A JP6011758B2 JP 6011758 B2 JP6011758 B2 JP 6011758B2 JP 2011196779 A JP2011196779 A JP 2011196779A JP 2011196779 A JP2011196779 A JP 2011196779A JP 6011758 B2 JP6011758 B2 JP 6011758B2
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- unit
- voice
- speech
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Electrically Operated Instructional Devices (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
特徴量格納部12は、1以上の特徴量を格納し得る。1以上の特徴量とは、本実施形態ではメルケプストラムを用いているが、特に限定されることはなく、ケプストラムやLSP(Line Spectral Pairs)、PARCOR係数(Partial Auto-Correlation Coefficient)等、何でも良い。また、特徴量格納部12は、1以上の特徴量とともに音響モデル学習用データとして音声の基本周波数(F0)などを一緒に格納していても良い。
(1)16kHz音声から計算したメルケプストラム(従来技術)
(2)48kHz音声から本発明の音声処置装置によって得たメルケプストラム
2 モデル作成装置
3、4 音声合成装置
11 音声格納部
12 特徴量格納部
13 スペクトル取得部
14 切詰処理部
15 特徴量取得部
16 特徴量蓄積部
21 モデル格納部
22 モデル学習部
31 受付部
32、42 音声生成部
33 出力部
Claims (6)
- モデル作成装置と音声処置装置と音声合成装置とを具備する音声合成システムであって、
前記音声合成装置は、
前記モデル作成装置により取得された音声のモデルを格納し得るモデル格納部と、
音声合成する内容を示す情報である合成内容情報を受け付ける受付部と、
前記合成内容情報に対して、前記モデル格納部の音声のモデルを用いて、音声を生成する音声生成部と、
前記音声生成部が生成した音声を出力する出力部とを具備し、
前記モデル作成装置は、
音声のモデルを格納し得るモデル格納部と、
音声処置装置により蓄積された1以上の特徴量を格納している特徴量格納部と、
前記1以上の特徴量から音声のモデルを構成し、前記モデル格納部に蓄積するモデル学習部とを具備し、
前記音声処置装置は、
音声を格納し得る音声格納部と、
1以上の特徴量を格納し得る特徴量格納部と、
前記音声格納部に格納されている音声のスペクトルまたはスペクトル包絡を取得するスペクトル取得部と、
前記スペクトル取得部が取得したスペクトルまたはスペクトル包絡に対して、予め決められた閾値以上または閾値より大きい周波数のスペクトル部分のデータを削除する処理である切り詰める処理を行う切詰処理部と、
前記切り詰める処理を行ったスペクトルまたはスペクトル包絡から1以上の特徴量を取得する特徴量取得部と、
前記特徴量取得部が取得した1以上の特徴量を前記特徴量格納部に蓄積する特徴量蓄積部とを具備する、音声合成システム。 - 音声処置装置と音声合成装置とを具備する音声合成システムであって、
前記音声合成装置は、
前記音声処置装置により蓄積された1以上の特徴量を格納している特徴量格納部と、
音声合成する内容を示す情報である合成内容情報を受け付ける受付部と、
前記合成内容情報に対して、前記特徴量格納部の1以上の特徴量を用いて、音声を生成する音声生成部と、
前記音声生成部が生成した音声を出力する出力部とを具備し、
前記音声処置装置は、
音声を格納し得る音声格納部と、
1以上の特徴量を格納し得る特徴量格納部と、
前記音声格納部に格納されている音声のスペクトルまたはスペクトル包絡を取得するスペクトル取得部と、
前記スペクトル取得部が取得したスペクトルまたはスペクトル包絡に対して、予め決められた閾値以上または閾値より大きい周波数のスペクトル部分のデータを削除する処理である切り詰める処理を行う切詰処理部と、
前記切り詰める処理を行ったスペクトルまたはスペクトル包絡から1以上の特徴量を取得する特徴量取得部と、
前記特徴量取得部が取得した1以上の特徴量を前記特徴量格納部に蓄積する特徴量蓄積部とを具備する、音声合成システム。 - スペクトル取得部、切詰処理部、特徴量取得部、モデル学習部、受付部、音声生成部、および出力部により実現され得る音声合成方法であって、
前記スペクトル取得部が、音声のスペクトルまたはスペクトル包絡を取得するスペクトル取得ステップと、
前記切詰処理部が、前記スペクトル取得ステップで取得されたスペクトルまたはスペクトル包絡に対して、予め決められた閾値以上または閾値より大きい周波数のスペクトル部分のデータを削除する処理である切り詰める処理を行う切詰処理ステップと、
前記特徴量取得部が、前記切り詰める処理を行ったスペクトルまたはスペクトル包絡から1以上の特徴量を取得する特徴量取得ステップと、
前記モデル学習部が、前記1以上の特徴量から音声のモデルを構成するモデル学習ステップと、
前記受付部が、音声合成する内容を示す情報である合成内容情報を受け付ける受付ステップと、
前記音声生成部が、前記合成内容情報に対して、前記モデル学習ステップが構成した音声のモデルを用いて、音声を生成する音声生成ステップと、
前記出力部が、前記音声生成ステップで生成された音声を出力する出力ステップとを具備する音声合成方法。 - スペクトル取得部、切詰処理部、特徴量取得部、受付部、音声生成部、および出力部により実現され得る音声合成方法であって、
前記スペクトル取得部が、記録媒体に格納されている音声のスペクトルまたはスペクトル包絡を取得するスペクトル取得ステップと、
前記切詰処理部が、前記スペクトル取得ステップで取得されたスペクトルまたはスペクトル包絡に対して、予め決められた閾値以上または閾値より大きい周波数のスペクトル部分のデータを削除する処理である切り詰める処理を行う切詰処理ステップと、
前記特徴量取得部が、前記切り詰める処理を行ったスペクトルまたはスペクトル包絡から1以上の特徴量を取得する特徴量取得ステップと、
前記受付部が、音声合成する内容を示す情報である合成内容情報を受け付ける受付ステップと、
前記音声生成部が、前記合成内容情報に対して、前記特徴量取得部が取得した1以上の特徴量を用いて、音声を生成する音声生成ステップと、
前記出力部が、前記音声生成部が生成した音声を出力する出力ステップとを具備する音声合成方法。 - コンピュータを、
音声のスペクトルまたはスペクトル包絡を取得するスペクトル取得部と、
前記スペクトル取得部が取得したスペクトルまたはスペクトル包絡に対して、予め決められた閾値以上または閾値より大きい周波数のスペクトル部分のデータを削除する処理である切り詰める処理を行う切詰処理部と、
前記切り詰める処理を行ったスペクトルまたはスペクトル包絡から1以上の特徴量を取得する特徴量取得部と、
前記1以上の特徴量から音声のモデルを構成するモデル学習部と、
音声合成する内容を示す情報である合成内容情報を受け付ける受付部と、
前記合成内容情報に対して、前記音声のモデルを用いて、音声を生成する音声生成部と、
前記音声生成部が生成した音声を出力する出力部として機能させるためのプログラム。 - コンピュータを、
記録媒体に格納されている音声のスペクトルまたはスペクトル包絡を取得するスペクトル取得部と、
前記スペクトル取得部が取得したスペクトルまたはスペクトル包絡に対して、予め決められた閾値以上または閾値より大きい周波数のスペクトル部分のデータを削除する処理である切り詰める処理を行う切詰処理部と、
前記切り詰める処理を行ったスペクトルまたはスペクトル包絡から1以上の特徴量を取得する特徴量取得部と、
音声合成する内容を示す情報である合成内容情報を受け付ける受付部と、
前記合成内容情報に対して、前記特徴量取得部が取得した1以上の特徴量を用いて、音声を生成する音声生成部と、
前記音声生成部が生成した音声を出力する出力部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011196779A JP6011758B2 (ja) | 2011-09-09 | 2011-09-09 | 音声合成システム、音声合成方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011196779A JP6011758B2 (ja) | 2011-09-09 | 2011-09-09 | 音声合成システム、音声合成方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013057843A JP2013057843A (ja) | 2013-03-28 |
JP6011758B2 true JP6011758B2 (ja) | 2016-10-19 |
Family
ID=48133766
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011196779A Active JP6011758B2 (ja) | 2011-09-09 | 2011-09-09 | 音声合成システム、音声合成方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6011758B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111133507B (zh) * | 2019-12-23 | 2023-05-23 | 深圳市优必选科技股份有限公司 | 一种语音合成方法、装置、智能终端及可读介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3110105B2 (ja) * | 1991-10-08 | 2000-11-20 | 株式会社リコー | パターン認識方法 |
JP3576800B2 (ja) * | 1997-04-09 | 2004-10-13 | 松下電器産業株式会社 | 音声分析方法、及びプログラム記録媒体 |
CN102280109B (zh) * | 2004-05-19 | 2016-04-27 | 松下电器(美国)知识产权公司 | 编码装置、解码装置及它们的方法 |
JP2007017462A (ja) * | 2005-07-05 | 2007-01-25 | Advanced Telecommunication Research Institute International | データ作成装置及びコンピュータプログラム |
JP2009237254A (ja) * | 2008-03-27 | 2009-10-15 | Namco Bandai Games Inc | プログラム、情報記憶媒体、及び特定音認識システム |
DK2211339T3 (en) * | 2009-01-23 | 2017-08-28 | Oticon As | listening System |
-
2011
- 2011-09-09 JP JP2011196779A patent/JP6011758B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013057843A (ja) | 2013-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10347238B2 (en) | Text-based insertion and replacement in audio narration | |
US7739113B2 (en) | Voice synthesizer, voice synthesizing method, and computer program | |
JP2885372B2 (ja) | 音声符号化方法 | |
EP3061086B1 (en) | Text-to-speech performance evaluation | |
US11587547B2 (en) | Electronic apparatus and method for controlling thereof | |
CN103403797A (zh) | 语音合成装置以及语音合成方法 | |
JP2019008206A (ja) | 音声帯域拡張装置、音声帯域拡張統計モデル学習装置およびそれらのプログラム | |
WO2011025532A1 (en) | System and method for speech synthesis using frequency splicing | |
JP2011186143A (ja) | ユーザ挙動を学習する音声合成装置、音声合成方法およびそのためのプログラム | |
JP5807921B2 (ja) | 定量的f0パターン生成装置及び方法、f0パターン生成のためのモデル学習装置、並びにコンピュータプログラム | |
JP6013104B2 (ja) | 音声合成方法、装置、及びプログラム | |
JP6011758B2 (ja) | 音声合成システム、音声合成方法、およびプログラム | |
KR102198598B1 (ko) | 합성 음성 신호 생성 방법, 뉴럴 보코더 및 뉴럴 보코더의 훈련 방법 | |
KR102198597B1 (ko) | 뉴럴 보코더 및 화자 적응형 모델을 구현하기 위한 뉴럴 보코더의 훈련 방법 | |
JP6314879B2 (ja) | 音読評価装置、音読評価方法、及びプログラム | |
JP6170384B2 (ja) | 音声データベース生成システム、音声データベース生成方法、及びプログラム | |
JP5062178B2 (ja) | 音声収録システム、音声収録方法、および収録処理プログラム | |
JP5830364B2 (ja) | 韻律変換装置およびそのプログラム | |
Degottex et al. | A measure of phase randomness for the harmonic model in speech synthesis | |
CN113948062A (zh) | 数据转换方法及计算机存储介质 | |
JP5752488B2 (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
JP2021099454A (ja) | 音声合成装置、音声合成プログラム及び音声合成方法 | |
JP4787769B2 (ja) | F0値時系列生成装置、その方法、そのプログラム、及びその記録媒体 | |
JP6213217B2 (ja) | 音声合成装置及び音声合成用コンピュータプログラム | |
JP3881970B2 (ja) | 知覚試験用音声データセット作成装置、コンピュータプログラム、音声合成用サブコスト関数の最適化装置、及び音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140905 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150727 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150817 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150928 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160307 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160823 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160906 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6011758 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |