JP6347536B2 - 音合成方法及び音合成装置 - Google Patents
音合成方法及び音合成装置 Download PDFInfo
- Publication number
- JP6347536B2 JP6347536B2 JP2014036603A JP2014036603A JP6347536B2 JP 6347536 B2 JP6347536 B2 JP 6347536B2 JP 2014036603 A JP2014036603 A JP 2014036603A JP 2014036603 A JP2014036603 A JP 2014036603A JP 6347536 B2 JP6347536 B2 JP 6347536B2
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- group delay
- sound
- generated
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001308 synthesis method Methods 0.000 title claims description 33
- 238000001228 spectrum Methods 0.000 claims description 200
- 238000004458 analytical method Methods 0.000 claims description 72
- 238000000605 extraction Methods 0.000 claims description 29
- 238000000034 method Methods 0.000 claims description 25
- 230000005236 sound signal Effects 0.000 claims description 19
- 230000003595 spectral effect Effects 0.000 claims description 19
- 230000015572 biosynthetic process Effects 0.000 claims description 18
- 238000003786 synthesis reaction Methods 0.000 claims description 18
- 230000002194 synthesizing effect Effects 0.000 claims description 16
- 239000000284 extract Substances 0.000 claims description 11
- 230000001186 cumulative effect Effects 0.000 claims description 4
- 210000001260 vocal cord Anatomy 0.000 description 8
- 230000000875 corresponding effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 230000001755 vocal effect Effects 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000002238 attenuated effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
予め定めた帯域分割したスペクトルの尖度又はスペクトルフラットネスの値と群遅延スペクトルの変動量との対応関係に基づいて、前記帯域分割したスペクトルの尖度又はスペクトルフラットネスの任意の値に対応させた群遅延スペクトルの変動量を生成する第1工程と、
この第1工程で生成された前記群遅延スペクトルの変動量を用いて群遅延スペクトルを生成する第2工程と、
この第2工程で生成された群遅延スペクトルを積分又は累積和を計算して位相スペクトルに変換する第3工程と、
任意の振幅スペクトル又は任意のスペクトル包絡と、前記第3工程で変換された前記位相スペクトルとを組み合わせて複素スペクトルを求め、この複素スペクトルを逆フーリエ変換して1周期分の信号である1ピッチ波形を生成する第4工程と、
この第4工程で生成した前記1ピッチ波形を重畳加算して合成音を生成する第5工程と、
を備えており、
前記第2工程から第5工程を繰り返して合成用フレーム長の合成音を生成することを特徴とする。
予め定めた帯域分割したスペクトルの尖度又はスペクトルフラットネスの値と群遅延スペクトルの変動量との対応関係を記憶した記憶部と、
この記憶部に記憶された前記帯域分割したスペクトルの尖度又はスペクトルフラットネスの値と前記群遅延スペクトルの変動量との対応関係に基づいて、前記帯域分割したスペクトルの尖度又はスペクトルフラットネスの任意の値に対応させた群遅延スペクトルの変動量を生成する群遅延変動量生成部と、
この群遅延変動量生成部で生成された前記群遅延スペクトルの変動量を用いて群遅延スペクトルを生成する群遅延生成部と、
この群遅延生成部で生成された群遅延スペクトルを積分又は累積和を計算して位相スペクトルに変換する位相生成部と、
任意の振幅スペクトル又は任意のスペクトル包絡と、前記位相生成部で変換された前記位相スペクトルとを組み合わせて複素スペクトルを求め、この複素スペクトルを逆フーリエ変換して1周期分の信号である1ピッチ波形を生成する1ピッチ波形生成部と、
この1ピッチ波形生成部で生成した前記1ピッチ波形を重畳加算して合成音を生成する重畳加算部と、
を備えていることを特徴とする。
実施例1の音合成装置は、図1に示すように、分析部10と合成部20とを備えている。分析部10は、分析用信号抽出部11、スペクトル抽出部12、基本周波数抽出部13、及び指標抽出部14を有している。合成部20は群遅延変動量生成部21、群遅延生成部22、位相生成部23、1ピッチ波形生成部24、重畳加算部25、及び記憶部26を有している。この音合成装置を利用した音合成方法は、音合成装置に入力された音信号を分析部10で分析し、分析によって得られた情報に基づき、合成部20で合成音を生成する。
実施例2の音合成装置は、図11に示すように、分析部110において、線形予測分析部15、及び線形予測残差抽出部16を有し、合成部120において、残差駆動合成部27を有する点で実施例1と相違する。他の構成は実施例1と同様であり、同一の構成は同一の符号を付し、詳細な説明を省略する。
(1)実施例1及び2では、分析部を有して音合成装置に入力した音信号を分析し、分析した各信号を基にして合成部で合成音を生成したが、分析部を有さず、蓄積した信号を基に合成部で合成音を生成してもよい。
(2)実施例1及び2では、周期性を表す指標として帯域分割したスペクトルの尖度を利用したが、帯域分割したスペクトルの尖度の代わりに帯域分割したスペクトルのスペクトルフラットネスを利用してもよい。
(3)実施例1及び2では、分析用信号からスペクトルに対する尖度を抽出したが、スペクトル包絡の情報を取り除いた後の振幅スペクトルや、線形予測残差信号の振幅スペクトルからスペクトルに対する尖度を抽出してもよい。
(4)実施例1及び2では、群遅延生成部において、乱数を群遅延スペクトルの変動量に乗じたが、乱数の代わりに適当に生成しておいた群遅延スペクトルを群遅延データベースとして用意しておき、それに対して同様の処理をしてもよい。
(5)実施例1及び2では、位相生成部において、群遅延スペクトルを積分して位相スペクトルに変換したが、群遅延スペクトルの累積和を計算して位相スペクトルに変換してもよい。
(6)実施例1及び2では、1ピッチ波形生成部において、スペクトル包絡と位相スペクトルを組み合わせて複素スペクトルを求めたが、スペクトル包絡の代わりに振幅スペクトルを利用してもよい。
S4…第2工程
S5…第3工程
S6…第4工程
S7…第5工程
11…分析用信号抽出部
12…スペクトル抽出部
14…指標抽出部
21…群遅延変動量生成部
22…群遅延生成部
23…位相生成部
24…1ピッチ波形生成部
25…重畳加算部
26…記憶部
Claims (8)
- 合成音を生成する音合成方法であって、
予め定めた帯域分割したスペクトルの尖度又はスペクトルフラットネスの値と群遅延スペクトルの変動量との対応関係に基づいて、前記帯域分割したスペクトルの尖度又はスペクトルフラットネスの任意の値に対応させた群遅延スペクトルの変動量を生成する第1工程と、
この第1工程で生成された前記群遅延スペクトルの変動量を用いて群遅延スペクトルを生成する第2工程と、
この第2工程で生成された群遅延スペクトルを積分又は累積和を計算して位相スペクトルに変換する第3工程と、
任意の振幅スペクトル又は任意のスペクトル包絡と、前記第3工程で変換された前記位相スペクトルとを組み合わせて複素スペクトルを求め、この複素スペクトルを逆フーリエ変換して1周期分の信号である1ピッチ波形を生成する第4工程と、
この第4工程で生成した前記1ピッチ波形を重畳加算して合成音を生成する第5工程と、
を備えており、
前記第2工程から第5工程を繰り返して合成用フレーム長の合成音を生成することを特徴とする音合成方法。 - 前記帯域分割したスペクトルの尖度又は前記スペクトルフラットネスの任意の値は、入力された音信号に対して設定した時間長さのフレーム長の分析用信号から抽出される請求項1記載の音合成方法。
- 前記任意の振幅スペクトル又は任意のスペクトル包絡は、入力された音信号に対して設定した時間長さのフレーム長の分析用信号から抽出される請求項1又は2記載の音合成方法。
- 前記第2工程で生成される前記群遅延スペクトルは群遅延スペクトルの変動量に所定の係数を乗じて生成される請求項1乃至3のいずれか1項記載の音合成方法。
- 前記第2工程で生成される前記群遅延スペクトルは群遅延スペクトルの変動量に乱数を乗じて生成される請求項1乃至4のいずれか1項記載の音合成方法。
- 合成音を生成する音合成装置であって、
予め定めた帯域分割したスペクトルの尖度又はスペクトルフラットネスの値と群遅延スペクトルの変動量との対応関係を記憶した記憶部と、
この記憶部に記憶された前記帯域分割したスペクトルの尖度又はスペクトルフラットネスの値と前記群遅延スペクトルの変動量との対応関係に基づいて、前記帯域分割したスペクトルの尖度又はスペクトルフラットネスの任意の値に対応させた群遅延スペクトルの変動量を生成する群遅延変動量生成部と、
この群遅延変動量生成部で生成された前記群遅延スペクトルの変動量を用いて群遅延スペクトルを生成する群遅延生成部と、
この群遅延生成部で生成された群遅延スペクトルを積分又は累積和を計算して位相スペクトルに変換する位相生成部と、
任意の振幅スペクトル又は任意のスペクトル包絡と、前記位相生成部で変換された前記位相スペクトルとを組み合わせて複素スペクトルを求め、この複素スペクトルを逆フーリエ変換して1周期分の信号である1ピッチ波形を生成する1ピッチ波形生成部と、
この1ピッチ波形生成部で生成した前記1ピッチ波形を重畳加算して合成音を生成する重畳加算部と、
を備えていることを特徴とする音合成装置。 - 入力された音信号に対して設定した時間長さのフレーム長毎に分析用信号を抽出する分析用信号抽出部と、
この分析用信号抽出部で抽出された前記分析用信号から帯域分割したスペクトルの尖度又はスペクトルフラットネスの値を抽出する指標抽出部と、
を備えている請求項6記載の音合成装置。 - 入力された音信号に対して設定した時間長さのフレーム長毎に分析用信号を抽出する分析用信号抽出部と、
この分析用信号抽出部で抽出された前記分析用信号から前記振幅スペクトル又は前記スペクトル包絡を抽出するスペクトル抽出部と、
を備えている請求項6又は7記載の音合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014036603A JP6347536B2 (ja) | 2014-02-27 | 2014-02-27 | 音合成方法及び音合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014036603A JP6347536B2 (ja) | 2014-02-27 | 2014-02-27 | 音合成方法及び音合成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015161774A JP2015161774A (ja) | 2015-09-07 |
JP6347536B2 true JP6347536B2 (ja) | 2018-06-27 |
Family
ID=54184909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014036603A Active JP6347536B2 (ja) | 2014-02-27 | 2014-02-27 | 音合成方法及び音合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6347536B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017046904A1 (ja) * | 2015-09-16 | 2017-03-23 | 株式会社東芝 | 音声処理装置、音声処理方法及び音声処理プログラム |
CN109952609B (zh) * | 2016-11-07 | 2023-08-15 | 雅马哈株式会社 | 声音合成方法 |
CN112820267B (zh) * | 2021-01-15 | 2022-10-04 | 科大讯飞股份有限公司 | 波形生成方法以及相关模型的训练方法和相关设备、装置 |
CN113643717A (zh) * | 2021-07-07 | 2021-11-12 | 深圳市联洲国际技术有限公司 | 一种音乐节奏检测方法、装置、设备及存储介质 |
CN114333865A (zh) * | 2021-12-22 | 2022-04-12 | 广州市百果园网络科技有限公司 | 一种模型训练以及音色转换方法、装置、设备及介质 |
CN114360490B (zh) * | 2022-01-26 | 2024-07-09 | 腾讯科技(深圳)有限公司 | 语音合成方法、装置、计算机设备和存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100365704C (zh) * | 2002-11-25 | 2008-01-30 | 松下电器产业株式会社 | 声音合成方法以及声音合成装置 |
-
2014
- 2014-02-27 JP JP2014036603A patent/JP6347536B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015161774A (ja) | 2015-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6347536B2 (ja) | 音合成方法及び音合成装置 | |
US20200234691A1 (en) | Speech processing device, speech processing method, and computer program product | |
JP5085700B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP5275102B2 (ja) | 音声合成装置及び音声合成方法 | |
US8280738B2 (en) | Voice quality conversion apparatus, pitch conversion apparatus, and voice quality conversion method | |
JP5958866B2 (ja) | 音声分析合成のためのスペクトル包絡及び群遅延の推定システム及び音声信号の合成システム | |
JP6791258B2 (ja) | 音声合成方法、音声合成装置およびプログラム | |
JP5961950B2 (ja) | 音声処理装置 | |
JP2010049196A (ja) | 声質変換装置及び方法、音声合成装置及び方法 | |
JP2009163121A (ja) | 音声処理装置及びそのプログラム | |
JP6733644B2 (ja) | 音声合成方法、音声合成システムおよびプログラム | |
US20130311189A1 (en) | Voice processing apparatus | |
US20100217584A1 (en) | Speech analysis device, speech analysis and synthesis device, correction rule information generation device, speech analysis system, speech analysis method, correction rule information generation method, and program | |
JP6821970B2 (ja) | 音声合成装置および音声合成方法 | |
JP2018077283A (ja) | 音声合成方法 | |
WO2019172397A1 (ja) | 音処理方法、音処理装置および記録媒体 | |
JP2010008853A (ja) | 音声合成装置及びその方法 | |
JP2013033103A (ja) | 声質変換装置および声質変換方法 | |
JP6011039B2 (ja) | 音声合成装置および音声合成方法 | |
JP6834370B2 (ja) | 音声合成方法 | |
JP5573529B2 (ja) | 音声処理装置およびプログラム | |
JP5245962B2 (ja) | 音声合成装置、音声合成方法、プログラム及び記録媒体 | |
JP6930089B2 (ja) | 音響処理方法および音響処理装置 | |
JP6409417B2 (ja) | 音響処理装置 | |
JP2018077280A (ja) | 音声合成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161013 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170929 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171013 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180524 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180528 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6347536 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |