JP6497065B2 - 音声合成用ライブラリ生成装置および音声合成装置 - Google Patents
音声合成用ライブラリ生成装置および音声合成装置 Download PDFInfo
- Publication number
- JP6497065B2 JP6497065B2 JP2014259287A JP2014259287A JP6497065B2 JP 6497065 B2 JP6497065 B2 JP 6497065B2 JP 2014259287 A JP2014259287 A JP 2014259287A JP 2014259287 A JP2014259287 A JP 2014259287A JP 6497065 B2 JP6497065 B2 JP 6497065B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- speech
- library
- data
- segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、本発明の第1実施形態に係る音声合成装置100のブロック図である。第1実施形態の音声合成装置100は、複数の音声素片を連結する素片接続型の音声合成で任意の楽曲(以下「合成楽曲」という)の歌唱音声の音声信号Vを生成する信号処理装置である。
図3(a)は、第2ライブラリL2のうち2個の母音を配列した音声素片P[V-V]の素片データQの説明図である。図3(a)に例示される通り、第1ライブラリL1には、5種類の母音(あ,い,う,え,お)に対応する音声素片P([a-a],[i-i],[M-M],[e-e],[o-o])について、当該音声素片Pの音声波形を表す素片データQ([a-a],[i-i],[M-M],[e-e],[o-o])が記憶される。生成部32は、各音声素片P[V-V]([a-a],[i-i],[M-M],[e-e],[o-o])のうち特定母音以外の母音([a],[i],[e],[o])を特定母音[M]に置換した音声素片P[M-M]について第1ライブラリL1に記憶された素片データQ[M-M]を複製し、第2ライブラリL2における当該音声素片P[V-V]の素片データQとして記憶する。例えば、第2ライブラリL2の音声素片[a-a]については、音素[a]を特定母音[M]に置換した音声素片[M-M]について第1ライブラリL1に記憶された素片データQ[M-M]が複製される。なお、以上の説明では、同じ母音同士の組み合わせで構成される音声素片Pを例示したが、相異なる母音同士の組み合わせにより構成される音声素片P([a-i],[a-M],[a-e],[a-o],[i-a],[i-M],[i-e],[i-o],[M-a],[M-i],[M-e],[M-o],[o-a],[o-i],[o-M],[o-e])についても同様に、特定母音以外の母音([a],[i],[e],[o])を特定母音[M]に置換した音声素片P[M-M]について第1ライブラリL1に記憶された素片データQ[M-M]を複製し、第2ライブラリL2における当該音声素片P[V-V]の素片データQとして記憶する。
なお、特定母音のみで構成される音声素片P[M-M]については、第1ライブラリL1のうち当該音声素片[M-M]の素片データQ[M-M]が第2ライブラリL2に複製される。
図3(b)は、第2ライブラリL2のうち母音と子音とを配列した音声素片P[C,V]の素片データQの説明図である。図3(b)に例示される通り、生成部32は、各音声素片P[C,V]のうち特定母音以外の母音を特定母音[M]に置換した音声素片[C,M]について第1ライブラリL1に記憶された素片データQ[C,M]を複製し、第2ライブラリL2における当該音声素片[C,V]の素片データQとして記憶する。例えば、第2ライブラリL2の音声素片P[s-a]については、母音[a]を特定母音[M]に置換した音声素片[s-M]について第1ライブラリL1に記憶された素片データQ[s-M]が第2ライブラリL2に複製される。
図3(c)に例示される通り、特定母音[M]に音響特性(例えば受聴者が知覚する音韻)が近似する子音(以下「特定子音」という)[w]に特定母音[M]以外の各母音が後続する音声素片P([w-a],[w-i],[w-e],[w-o])および素片データQ([w-a],[w-i],[w-e],[w-o])については第1ライブラリL1に記憶されている。他方、特定子音[w]に特定母音[M]以外の各母音が後続する音声素片P[w-M]よび素片データQ[w-M]については、第1ライブラリL1に記憶されない場合を想定する。
図3(d)に例示される通り、第1ライブラリL1には、子音(以下「第1子音」という)[h]と母音[a],[e],[o]とを含む音声素片P([h-a],[h-e],[h-o])については素片データQ([h-a],[h-e],[h-o])が記憶されるが、第1子音[h]とそれ以外の母音[i],[M]とを含む音声素片P([h-i],[h-M])については素片データQが記憶されない場合が想定される。他方、第1ライブラリL1には、第1子音[h]とは相違する子音(以下「第2子音」という)[p\]と母音[a],[M],[e],[o]とを含む音声素片P([p\-a],[p\-M],[p\-e],[p\-o])についての素片データQ([p\-a],[p\-M],[p\-e],[p\-o])が記憶される。
第1実施形態では、第2ライブラリL2を既存の第1ライブラリL1から事前に生成して音声合成に利用した。第2実施形態では、合成情報Sに応じた音声信号Vを生成する場面において、第1実施形態で第1ライブラリL1から第2ライブラリL2を生成したのと同様の規則のもとで、素片選択部34が既存のライブラリLから素片データQを動的に選択することで、第2ライブラリL2を生成することなく曖昧な音声の音声信号Vを生成する。なお、以下に例示する各態様において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
素片選択部34は、発音文字X1に対応する音声素片Pが特定母音[M]以外の母音([a],[i],[e],[o])を含む場合、当該母音を特定母音[M]に置換した音声素片Pの素片データQをライブラリLから選択する。
素片選択部34は、発音文字X1に対応する音声素片Pが特定母音[M]以外の母音([a],[i],[e],[o])と子音とを含む場合、特定母音[M]以外の母音を特定母音[M]に置換した音声素片Pの素片データQをライブラリLから選択する。
発音文字X1に対応する音声素片Pが、特定子音[w]と特定母音[M]以外の母音[V]とを含む音声素片P[w-V]である場合、素片選択部34は、特定子音[w]と特定母音[M]以外の母音[V]とを含む音声素片P[w-V]の素片データQ[w-V]をライブラリLから選択し、当該素片データQ[w-V]のうち特定子音[w]の区間を示す素片データQ[w]を生成する。
発音文字X1に対応する音声素片Pが、第1子音[h]と特定母音[M]以外の母音[V]とを含む音声素片P[h-V]である場合、素片選択部34は、第1子音[h]とは相違する第2子音[p\]と特定母音[M]とを含む音声素片Pの素片データQをライブラリLから選択する。
第2実施形態では、発音文字X1に対応する音声素片Pの各素片データQを相互に連結することで明瞭な音声の音声信号Vを生成する動作と、発音文字X1に対応する音声素片の母音を特定母音[M]に置換した音声素片の各素片データQを相互に連結することで曖昧な音声の音声信号Vを生成する動作とを選択的に実行した。第3実施形態では、発音文字X1に対応する各音声素片Pについて、前者の素片データQ(以下「第1素片データQ1」という)と後者の素片データQ(以下「第2素片データQ2」という)とが混合される。
数式(2)の記号βは所定の定数(典型的には正数)である。数式(2)から理解される通り、音高X3が区間t内の最小値NLである音符(X3=NL)の混合比Kは最小値0となり、音高X3が区間t内の最大値NHである音符(X3=NH)の混合比Kは最大値βとなる。すなわち、混合比Kは、音高X3が高いほど増加するように最小値0と最大値βとの間の範囲内で音高X3に応じて変化する。図9に例示される通り、編集画面40の変数領域44には、音符毎の混合比Kが表示(グラフ表示)される。
第4実施形態では、第1ライブラリL1から第2ライブラリL2を事前に生成する第1実施形態の構成を前提として、第1ライブラリL1から選択された第1素片データQ1と、第2ライブラリL2から選択された音声素片Pの第2素片データQ2とを、第3実施形態と同様に混合して合成音声を生成する。
前述の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様を適宜に併合することも可能である。
Claims (5)
- 音声素片毎に素片データを含む音声合成用の第1ライブラリから第2ライブラリを生成する要素であって、複数の音声素片のうち特定母音以外の母音を含む音声素片について、前記第1ライブラリのうち当該母音を前記特定母音に置換した音声素片の素片データを含む第2ライブラリを生成する生成部
を具備する音声合成用ライブラリ生成装置。 - 音声素片毎に素片データを含む音声合成用の第1ライブラリから第2ライブラリを生成する要素であって、複数の音声素片のうち特定母音以外の母音を含む音声素片について、前記第1ライブラリのうち当該母音を前記特定母音に置換した音声素片の素片データを含む第2ライブラリを生成する生成部と、
前記第1ライブラリのうち合成対象の発音文字に対応する音声素片の第1素片データと、前記第2ライブラリのうち当該音声素片の第2素片データとを選択する素片選択部と、
前記第1素片データと前記第2素片データとを混合する素片混合部と、
前記素片混合部による混合後の素片データを利用して合成音声を生成する合成処理部と
を具備する音声合成装置。 - 音声素片毎に素片データを含む音声合成用のライブラリから合成対象の発音文字に対応する音声素片の素片データを選択する要素であって、受聴者が曖昧と知覚する傾向がある特定母音以外の母音を含む音声素片については、当該母音を前記特定母音に置換した音声素片の素片データを選択し、前記特定母音を含む音声素片については、当該特定母音を置換せずに音声素片の素片データを選択する素片選択部と、
前記素片選択部が選択した音声素片を利用して合成音声を生成する合成処理部と
を具備する音声合成装置。 - 前記素片選択部は、前記特定母音以外の母音を含む音声素片について、当該音声素片の第1素片データと、当該母音を前記特定母音に置換した音声素片の第2素片データとを選択し、
前記第1素片データと前記第2素片データとを混合する素片混合部を具備し、
前記合成処理部は、前記素片混合部による混合後の素片データを利用して合成音声を生成する
請求項3の音声合成装置。 - 合成対象の特徴量に応じた混合比を設定する変数設定部を具備し、
前記素片混合部は、前記変数設定部が設定した混合比で前記第1素片データと前記第2素片データとを混合する
請求項2または請求項4の音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014259287A JP6497065B2 (ja) | 2014-12-22 | 2014-12-22 | 音声合成用ライブラリ生成装置および音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014259287A JP6497065B2 (ja) | 2014-12-22 | 2014-12-22 | 音声合成用ライブラリ生成装置および音声合成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016118712A JP2016118712A (ja) | 2016-06-30 |
JP6497065B2 true JP6497065B2 (ja) | 2019-04-10 |
Family
ID=56244244
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014259287A Active JP6497065B2 (ja) | 2014-12-22 | 2014-12-22 | 音声合成用ライブラリ生成装置および音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6497065B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005071664A (ja) * | 2003-08-20 | 2005-03-17 | Sumitomo Wiring Syst Ltd | 端子金具 |
US8510112B1 (en) * | 2006-08-31 | 2013-08-13 | At&T Intellectual Property Ii, L.P. | Method and system for enhancing a speech database |
JP5176981B2 (ja) * | 2009-01-22 | 2013-04-03 | ヤマハ株式会社 | 音声合成装置、およびプログラム |
-
2014
- 2014-12-22 JP JP2014259287A patent/JP6497065B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016118712A (ja) | 2016-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6620462B2 (ja) | 合成音声編集装置、合成音声編集方法およびプログラム | |
JP6791258B2 (ja) | 音声合成方法、音声合成装置およびプログラム | |
TWI471855B (zh) | 語音合成資訊編輯裝置、儲存媒體及方法 | |
JP2013137520A (ja) | 音楽データ編集装置 | |
JP2013011863A (ja) | 音声合成装置 | |
JP2017040867A (ja) | 情報処理装置 | |
JP5625321B2 (ja) | 音声合成装置およびプログラム | |
JP5423375B2 (ja) | 音声合成装置 | |
JP2018077283A (ja) | 音声合成方法 | |
JP6497065B2 (ja) | 音声合成用ライブラリ生成装置および音声合成装置 | |
JP5092905B2 (ja) | 歌唱合成装置およびプログラム | |
JP4433734B2 (ja) | 音声分析合成装置、音声分析装置、及びプログラム | |
EP2634769B1 (en) | Sound synthesizing apparatus and sound synthesizing method | |
JP5102939B2 (ja) | 音声合成装置および音声合成プログラム | |
JP5552797B2 (ja) | 音声合成装置および音声合成方法 | |
JP2013050705A (ja) | 音声合成装置 | |
JP5790860B2 (ja) | 音声合成装置 | |
JP2010066636A (ja) | 音処理装置およびプログラム | |
JP5782751B2 (ja) | 音声合成装置 | |
JP6286946B2 (ja) | 音声合成装置および音声合成方法 | |
JP5310801B2 (ja) | 音声合成装置および音声合成プログラム | |
JP2005195968A (ja) | ピッチ変換装置 | |
JP2014170251A (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP5782799B2 (ja) | 音声合成装置 | |
JP6822075B2 (ja) | 音声合成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171023 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180919 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181002 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190225 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6497065 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |