JP5552797B2 - 音声合成装置および音声合成方法 - Google Patents
音声合成装置および音声合成方法 Download PDFInfo
- Publication number
- JP5552797B2 JP5552797B2 JP2009256027A JP2009256027A JP5552797B2 JP 5552797 B2 JP5552797 B2 JP 5552797B2 JP 2009256027 A JP2009256027 A JP 2009256027A JP 2009256027 A JP2009256027 A JP 2009256027A JP 5552797 B2 JP5552797 B2 JP 5552797B2
- Authority
- JP
- Japan
- Prior art keywords
- segment
- speech
- information
- data
- library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Electrophonic Musical Instruments (AREA)
Description
図1は、本発明の第1実施形態に係る音声合成装置100のブロック図である。音声合成装置100は、歌唱音などの様々な音声(以下「合成音」という)を合成する装置であり、図1に示すように、制御装置10と記憶装置12と入力装置14と表示装置16と放音装置18とを具備するコンピュータシステムで実現される。音声合成装置100を楽曲の歌唱音の合成に利用する場合を以下では想定する。
次に、本発明の第2実施形態を説明する。なお、以下の各例示において作用や機能が第1実施形態と同等である要素については、以上と同じ符号を付して各々の詳細な説明を適宜に省略する。
図7は、本発明の第3実施形態における音声の合成を説明するための模式図である。図7に示すように、第3実施形態の記憶装置12は、第2実施形態と同様に、相異なる特性の音声から生成された複数(以下の例示では2個)の音声ライブラリL(L1,L2)を記憶する。
以上の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
以上の各形態においては、音声ライブラリLが音声素片毎に1個の素片データVを含む構成を便宜的に例示したが、素片データVを更に細分化した構成も採用され得る。例えば、音高(周波数)や音量などの音響的な属性(以下「素片属性」という)が相違する複数の素片データVを音声素片毎に音声ライブラリLに含ませる構成も採用され得る。素片選択部32は、指定音に指示された発音文字の音声素片に対応する複数の素片データVのうち、その指定音に対して指示された素片属性の素片データV(例えば音楽情報DSで指示される音高の素片データV)を選択する。
以上の各形態では、音声合成部26における素片データVの利用(素片選択部32による選択または素片加工部34による加工)を規定するための情報(以下「素片利用情報」という)を素片データV毎(音声素片毎)に付属情報Aに設定したが、以下に例示するように、複数の素片データVを単位として素片利用情報を設定する構成も採用され得る。素片利用情報は、第1実施形態における区間情報Pおよび特性情報Fと、第2実施形態における混合比Rと、第3実施形態における制御変数Xの設定値xAとを包括する概念である。
第1実施形態から第3実施形態は、以下の例示のように適宜に併合され得る。なお、以下の説明では、音声ライブラリL内の各素片データVに付属情報Aを適用した素片データVAで構成される仮想的な音声ライブラリLを便宜的に「仮想ライブラリ」と表記する。各形態の説明から理解されるように、実際には総ての音声素片に対応する素片データVAの集合(音声ライブラリ)が記憶装置12に生成される訳ではない(つまり、音声ライブラリLの各素片データVに対する付属情報Aの適用で素片データVAが順次に生成される)ことを考慮して、「仮想」という文言を付記した。
第1実施形態では、付属情報Aの区間情報Pが素片データVの素片波形Wの使用区間を指定する場合を例示したが、例えば、音楽情報DSにて継続的な発音が指示された母音の補間(クロスフェード)に使用される素片データVの区間を区間情報Pが指定する構成も採用される。例えば、「あさが(朝が)」という発音文字の音声を音声素片[#_a],[a],[a_s],[s_a],[a],[a_g],[g_a],[a_#]から生成する場合を想定すると、音声素片[s_a]のうち区間情報Pが示す後方の区間と、音声素片[a_g]のうち区間情報Pが示す前方の区間との補間で両者間の[a]の音声を合成する。
第3実施形態では、変数情報DPが記憶装置12に格納された場合を例示したが、変数指示部38が制御変数Xの指示値xBを指示する方法は適宜に変更される。例えば、入力装置14に対する入力に応じて変数指示部38が指示値xBを時系列に指示する構成や、通信網から順次に受信される指示値xBを変数指示部38が順次に素片選択部32に指示する構成も採用される。すなわち、変数指示部38は、制御変数Xの指示値xBを順次に指示する要素として包括され、変数情報DPを予め用意して記憶装置12に格納した構成は省略され得る。
以上の各形態では、素片データVが素片波形Wを示す場合を例示したが、素片データVの内容は適宜に変更される。例えば、音声素片を公知の手法で解析した結果を示す情報(例えば音声素片の周波数スペクトルに関する情報)を素片データVとして利用してもよい。
以上の各形態では、利用者からの指示に応じて音楽情報DSを編集したが、音楽情報DSの編集は省略され得る。すなわち、記憶装置12に予め記憶された音楽情報DSや、可搬型の記録媒体または通信網を介して音声合成装置100に提供された音楽情報DSを合成音の生成に利用する構成も採用される。したがって、以上の各形態における情報生成部24は省略され得る。
Claims (6)
- 音声素片を示す複数の素片データを含む音声ライブラリと、素片データの利用を規定する素片利用情報が、前記音声ライブラリ内の1個以上の素片データを単位として複数の前記単位の各々を対象に設定された付属情報とを記憶する記憶手段と、
指定音の時系列を示す音楽情報に応じて前記音声ライブラリの前記素片データを順次に選択する素片選択手段と、
前記素片選択手段が選択した各素片データを、前記付属情報にて当該素片データに設定された素片利用情報に応じて加工する素片加工手段と、
前記素片加工手段による加工後の素片データから音声を合成する合成処理手段と
を具備する音声合成装置。 - 音楽情報が指定する指定音に対応する各素片データの素片波形の時系列と、各素片波形のうち音声の合成に使用される使用区間の始点を示す始点指示子と、前記使用区間の終点を示す終点指示子とを表示装置に表示させ、利用者からの指示に応じて前記始点指示子および前記終点指示子の各々を移動させる表示制御手段を具備し、
前記付属情報にて各素片データに設定された素片利用情報は、当該素片データの素片波形のうち前記始点指示子および前記終点指示子で規定される使用区間を示す区間情報を含み、
前記素片加工手段は、前記素片選択手段が選択した素片データのうち前記区間情報が示す区間を抽出する
請求項1の音声合成装置。 - 前記表示制御手段は、前記音楽情報が示す指定音の時系列を示す画像を、前記素片波形の時系列と並列に前記表示装置に表示させる
請求項2の音声合成装置。 - 前記表示制御手段は、音楽情報が指定する指定音に対応する各素片データの特徴量の遷移を示す特性遷移画像を、前記素片波形毎に、当該素片波形と共通の時間軸のもとで前記表示装置に表示させ、利用者からの指示に応じて前記特性遷移画像を編集し、
前記付属情報にて各素片データに設定された素片利用情報は、当該素片データの特性遷移画像に応じた特徴量を示す特性情報を含み、
前記素片加工手段は、前記素片選択手段が選択した素片データの特徴量を前記特性情報に応じて制御する
請求項2または請求項3の音声合成装置。 - 前記記憶手段は、前記音声ライブラリにおける各素片データの音声素片の分類毎に前記素片利用情報が設定された付属情報を記憶し、
前記素片加工手段は、一の分類に属する各音声素片の素片データの加工に、前記付属情報にて当該一の分類に設定された前記素片利用情報を共通に適用する
請求項1から請求項4の何れかの音声合成装置。 - 音声素片を示す複数の素片データを含む音声ライブラリと、素片データの利用を規定する素片利用情報が、前記音声ライブラリ内の1個以上の素片データを単位として複数の前記単位の各々を対象に設定された付属情報とを記憶する記憶手段を具備するコンピュータが、
指定音の時系列を示す音楽情報に応じて前記音声ライブラリの前記素片データを順次に選択し、
前記選択した各素片データを、前記付属情報にて当該素片データに設定された素片利用情報に応じて加工し、
前記加工後の素片データから音声を合成する
音声合成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009256027A JP5552797B2 (ja) | 2009-11-09 | 2009-11-09 | 音声合成装置および音声合成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009256027A JP5552797B2 (ja) | 2009-11-09 | 2009-11-09 | 音声合成装置および音声合成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011100055A JP2011100055A (ja) | 2011-05-19 |
JP5552797B2 true JP5552797B2 (ja) | 2014-07-16 |
Family
ID=44191264
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009256027A Expired - Fee Related JP5552797B2 (ja) | 2009-11-09 | 2009-11-09 | 音声合成装置および音声合成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5552797B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9401138B2 (en) * | 2011-05-25 | 2016-07-26 | Nec Corporation | Segment information generation device, speech synthesis device, speech synthesis method, and speech synthesis program |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0950295A (ja) * | 1995-08-09 | 1997-02-18 | Fujitsu Ltd | 音声合成方法およびそのための装置 |
JPH11184490A (ja) * | 1997-12-25 | 1999-07-09 | Nippon Telegr & Teleph Corp <Ntt> | 規則音声合成による歌声合成方法 |
JP4736483B2 (ja) * | 2005-03-15 | 2011-07-27 | ヤマハ株式会社 | 歌データ入力プログラム |
JP4639932B2 (ja) * | 2005-05-06 | 2011-02-23 | 株式会社日立製作所 | 音声合成装置 |
JP2007086316A (ja) * | 2005-09-21 | 2007-04-05 | Mitsubishi Electric Corp | 音声合成装置、音声合成方法、音声合成プログラムおよび音声合成プログラムを記憶したコンピュータ読み取り可能な記憶媒体 |
JP4858173B2 (ja) * | 2007-01-05 | 2012-01-18 | ヤマハ株式会社 | 歌唱音合成装置およびプログラム |
JP4247289B1 (ja) * | 2007-11-14 | 2009-04-02 | 日本電信電話株式会社 | 音声合成装置、音声合成方法およびそのプログラム |
JP4844623B2 (ja) * | 2008-12-08 | 2011-12-28 | ヤマハ株式会社 | 合唱合成装置、合唱合成方法およびプログラム |
-
2009
- 2009-11-09 JP JP2009256027A patent/JP5552797B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011100055A (ja) | 2011-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2983168B1 (en) | Voice analysis method and device, voice synthesis method and device and medium storing voice analysis program | |
JP6236765B2 (ja) | 音楽データ編集装置および音楽データ編集方法 | |
US10354629B2 (en) | Sound control device, sound control method, and sound control program | |
JP6507579B2 (ja) | 音声合成方法 | |
JP6127371B2 (ja) | 音声合成装置および音声合成方法 | |
JP2007240564A (ja) | 歌唱合成装置および歌唱合成プログラム | |
JP5625321B2 (ja) | 音声合成装置およびプログラム | |
JP5423375B2 (ja) | 音声合成装置 | |
JP6390690B2 (ja) | 音声合成方法および音声合成装置 | |
JP6179221B2 (ja) | 音響処理装置および音響処理方法 | |
JP6255744B2 (ja) | 楽曲表示装置および楽曲表示方法 | |
JP6044284B2 (ja) | 音声合成装置 | |
JP5157922B2 (ja) | 音声合成装置、およびプログラム | |
JP5552797B2 (ja) | 音声合成装置および音声合成方法 | |
JP5176981B2 (ja) | 音声合成装置、およびプログラム | |
JP7124870B2 (ja) | 情報処理方法、情報処理装置およびプログラム | |
JP5935831B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP5790860B2 (ja) | 音声合成装置 | |
JP7127682B2 (ja) | 情報処理方法、情報処理装置およびプログラム | |
JP5641266B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP6286946B2 (ja) | 音声合成装置および音声合成方法 | |
JP5782799B2 (ja) | 音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120920 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130529 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130604 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130815 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140324 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140430 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140513 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5552797 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |