JP3588266B2 - 音声合成方法、音声合成装置及び記録媒体 - Google Patents

音声合成方法、音声合成装置及び記録媒体 Download PDF

Info

Publication number
JP3588266B2
JP3588266B2 JP05405599A JP5405599A JP3588266B2 JP 3588266 B2 JP3588266 B2 JP 3588266B2 JP 05405599 A JP05405599 A JP 05405599A JP 5405599 A JP5405599 A JP 5405599A JP 3588266 B2 JP3588266 B2 JP 3588266B2
Authority
JP
Japan
Prior art keywords
synthesis
combination
computer
voice
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP05405599A
Other languages
English (en)
Other versions
JP2000250600A (ja
Inventor
啓之 平井
宏樹 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP05405599A priority Critical patent/JP3588266B2/ja
Publication of JP2000250600A publication Critical patent/JP2000250600A/ja
Application granted granted Critical
Publication of JP3588266B2 publication Critical patent/JP3588266B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、例えば入力された仮名漢字混じりの文章から音声を合成する場合に用いられる音声合成方法、その方法を実施するための音声合成装置及び音声合成のコンピュータプログラムが記録されている記録媒体に関する。
【0002】
【従来の技術】
近年、パーソナルコンピュータ等に代表される情報機器の普及に伴って、これらの機器とユーザである人間とのコミュニケーションをより容易に行うためにヒューマンインタフェース技術の向上が強く要望されるようになっている。このような状況において、人間にとって最も身近なコミュニケーション手段である音声を利用した情報機器が増加しており、電話情報サービス、文章読み上げシステム等のサービスも提供されつつある。このような情報機器と人間との音声によるコミュニケーションを実現するためには、音声合成が必須の技術である。
【0003】
音声合成の方式には、大別すると録音再生と規則合成との2つに分類できる。録音再生は、予め人間の発声した音声を記録しておき、必要に応じてこれらの音声を接続して音声を合成する方式である。また規則合成は、規則を用いて韻律情報を生成し、この韻律情報に基づいて音素又は音節等の合成単位を接続することによって音声を合成する方式である。
【0004】
録音再生方式では、実際に人間が発声した音声を利用しているので、一般に高い品質の音声を合成することができる。しかし、あらゆる状況における全ての音声を録音することは不可能であるために、限られた音声しか合成することができないという短所を有する。
【0005】
一方、規則合成方式では、録音再生方式のような自然な音声を合成することは困難であるが、任意の音声を合成することができるという長所を有する。そのため多分野に応用することが可能である。特に仮名漢字混じりの文章から規則を用いて音声に変換する文章音声合成においては、一般に広く利用されている文章が入力として用いられるため、最も盛んに研究されている音声合成技術である。
【0006】
図5は、従来の文章音声合成装置を示すブロック図である。図5において、11はCPUを示し、該CPU11に対してキーボード、マウス及びスキャナ等からなる入力部12と、ROM又はRAMで構成される言語辞書13及び音声辞書14と、スピーカ等からなる出力部15とが夫々接続されている。
【0007】
入力部12は、音声に変換するための文章を入力する入力部であり、ここで入力された文章はCPU11へ供給される。言語辞書13は、単語毎に読み及びアクセントの情報を格納している。CPU11は、この言語辞書13を参照して、入力された文章に対する読み及びアクセントを得る。音声辞書14は、音素又は音節等の合成単位毎に音響パラメータ及び音声波形データを格納している。CPU11は、言語辞書13から得た読み及びアクセントに基づいて、この音声辞書14から合成単位を選択し、選択された合成単位の音声波形データを接続することによって音声を合成する。出力部15は、CPU11において合成された音声をD/A変換して出力するための出力部である。
【0008】
自然で滑らかな音声を合成するためには、音響パラメータの差異により生じる歪み(以下、音響歪みという)及び合成単位の音声波形データを接続するときに生じる歪み(以下、接続歪みという)の2種類の歪みが小さくなる合成単位の組み合わせを生成する必要がある。ここで音響パラメータとは、基本周波数(F0)、継続時間長(DUR)、パワー(POW)等である。言語辞書13を参照して得られた読み及びアクセントに基づいて、処理対象である合成単位の音響パラメータの値が算出される。この算出された音響パラメータと音声辞書14に格納されている合成単位の音響パラメータとの差異が上述の音響パラメータの差異である。以下、音響歪みと接続歪みの合計を合成歪みという。
【0009】
膨大な合成単位の組み合わせの中から合成歪みが最小となる組み合わせを得るためには高速な探索が必要になる。探索の高速化を実現する一方法である動的プログラミング(DP:Dynamic Programming)について説明する。
DPは、部分的な解の状態を記憶しておき、これを更新していくことによって最終的な最適解を求める解法である。例えば、n個の合成単位のうちm個の合成単位までの最適解(部分的な解の状態)が与えられていたとする。次に合成単位を1個付け加えたときの最適解(m+1個の合成単位までの最適解)を、m個の合成単位までの最適解に基づいて求める。この処理をn個の合成単位まで繰り返すことにより最終的な最適解が求まる。これによりn個の合成単位のすべての組み合わせについて総当たり的に調べる必要がなくなり、効率的に解くことが可能となる。
【0010】
図6は、合成単位の組み合わせを示す説明図である。また、図7、図8、図9はDPを用いた合成単位の組み合わせ選択を示す説明図である。ここでは、5つの連続する合成単位の組み合わせのうち、合成歪みが最も小さくなる組み合わせを選択するものとする。また各合成単位には5つの候補があるものとする。なお、これらの図面において、合成単位の候補は○で示されている。
【0011】
図6において、5つの連続する合成単位の候補のすべての組み合わせが実線を用いて示されている。1番目の合成単位の候補と2番目の合成単位の候補との組み合わせは5×5=25通りある。ここでこれら25通りの組み合わせの合成歪みを計算するならば、組み合わせ1通りに対して1回の計算が必要となるので、その計算回数は25回となる。従って、5つの連続する合成単位の候補のすべての組み合わせの合成歪みの計算回数は、5×5×5×5×5=3125回となる。
【0012】
図7は、DPを用いることにより合成歪みの計算回数を減らすことができることを示している。まず、1番目の合成単位の候補と2番目の合成単位の候補との25通りの組み合わせから、合成歪みが最も小さい組み合わせを選ぶ。ここでは、その組み合わせが5通りあるものとする。図7において、これら5通りの組み合わせが太線を用いて示されている。次に、これら5通りの組み合わせと3番目の合成単位の候補との組み合わせ(5×5=25通り)から、合成歪みが最も小さい組み合わせを選ぶ。この場合も、その組み合わせは5通りあるものとする。その結果、3番目の合成単位の候補までの組み合わせの合成歪みの計算回数は、5×5+5×5=50回となる。
【0013】
以下、同様にして上述の処理を5番目の合成単位の候補まで繰り返すと、5つの連続する合成単位の候補の組み合わせの合成歪みの計算回数は、5×5+5×5+5×5+5×5=100回となる。
【0014】
図8は、音響歪みを利用して合成単位の候補の予備選択を行うことにより、合成歪みの計算回数を減らすことができることを示している。まず、各合成単位の5つの候補のうち、音響歪みが小さい方から4つの候補を選択し、音響歪みが最も大きい候補を1つ削除する(予備選択▲1▼)。図8において、削除された候補は点線の○で示されている。
【0015】
この予備選択▲1▼により、1番目の合成単位の候補と2番目の合成単位の候補との組み合わせは4×4=16通りとなる。次に、これら16通りの組み合わせから合成歪みが最も小さい組み合わせを選ぶ。ここでは、その組み合わせが4通りあるものとする。更にこれら4通りの組み合わせと3番目の合成単位の候補との組み合わせ(4×4=16通り)から、合成歪みが最も小さい組み合わせを選ぶ。この場合も、その組み合わせは4通りあるものとする。その結果、3番目の合成単位の候補までの組み合わせの合成歪みの計算回数は、4×4+4×4=32回となる。
【0016】
以下、同様にして上述の処理を5番目の合成単位の候補まで繰り返すと、5つの連続する合成単位の候補の組み合わせの合成歪みの計算回数は、4×4+4×4+4×4+4×4=64回となる。
【0017】
図9は、合成歪みを利用して、ある時点までの合成単位の組み合わせの予備選択を行うことにより、合成歪みの計算回数を減らすことができることを示している。ここで、ある時点tで合成歪みの小さい組み合わせが4通りあるものとする。この場合に、これら4通りの組み合わせから、合成歪みが小さい方から3通りの組み合わせを選択し、合成歪みの最も大きい1通りの組み合わせを削除する(予備選択▲2▼)。図9において、削除された組み合わせの終端である合成単位の候補は×で示されている。
【0018】
この予備選択▲2▼により、1番目の合成単位の候補と2番目の合成単位の候補との組み合わせは3×4=12通りとなる。ここで、これら12通りの組み合わせから合成歪みが最も小さい組み合わせを選ぶ。ここでは、その組み合わせが4通りあるものとする。再び予備選択▲2▼を行い、この4通りの組み合わせから合成歪みの小さい方から3通りの組み合わせを選択する。次に、これら3通りの組み合わせと3番目の合成単位の候補との組み合わせ(3×4=12通り)から、合成歪みが最も小さい組み合わせを選ぶ。この場合も、その組み合わせは4通りあるものとする。その結果、3番目の合成単位の候補までの組み合わせの合成歪みの計算回数は、3×4+3×4=24回となる。
【0019】
以下、同様にして、上述の処理を5番目の合成単位の候補まで繰り返すと、5つの連続する合成単位の候補の組み合わせの合成歪みの計算回数は、3×4+3×4+3×4+3×4=48回となる。
【0020】
【発明が解決しようとする課題】
以上のようにして合成歪みの計算回数を少なくすることにより、合成歪みが最小となる組み合わせを高速に探索することが可能となる。ここで上述の予備選択▲1▼で選択した候補の数を候補数と呼び、予備選択▲2▼で選択した組み合わせの数を組み合わせ数と呼ぶことにする。合成歪みの計算回数は候補数及び組み合わせ数に依存している。これら候補数及び組み合わせ数を小さくすればするほど合成歪みの計算回数は少なくなり、その結果探索範囲が狭くなるので、より高速な探索を行うことができる。しかし、この場合では、合成歪みが最も小さくなる組み合わせが探索範囲から排除されてしまう可能性が高いので、合成される音声の品質が劣化してしまうおそれがある。
【0021】
一方、候補数及び組み合わせ数を大きくすればするほど合成歪みの計算は多くなり、その結果探索範囲が広くなるので、探索に相当の時間を要することになる。しかし、この場合では、合成歪みが最も小さくなる組み合わせが探索範囲の中にある可能性が高いので、合成される音声は高品質になる。
【0022】
このように候補数及び組み合わせ数を変化させることによって、音声合成処理の所要時間及び合成された音声の品質を調節することができる。しかしながら従来の音声合成装置においては、候補数及び組み合わせ数を固定化してしまっているため、実時間で音声合成処理を行うことができない、又は音質が悪く自然で滑らかな音声を合成することができない等のおそれがある。
【0023】
本発明は斯かる事情に鑑みてなされたものであり、既に合成された音声を出力するに際して、その音声を蓄積し、この蓄積量に応じて候補数及び組み合わせ数を更新することによって、高品質な音声を実時間で合成することができる音声合成方法、その方法を実施するための音声合成装置及びその方法を実施するための音声合成のコンピュータプログラムが記録されている記録媒体の提供を目的とする。
【0025】
【課題を解決する為の手段】
発明に係る音声合成方法は、複数の合成単位を所定の数毎に分割して複数の合成単位列を形成し合成単位毎に、前記複数の合成単位を接続することによって音声を合成し、合成された音声を順次的に出力する音声合成方法において、合成された音声を蓄積するステップと、蓄積された音声の蓄積量を検出するステップと、動的プログラミングを用いて、検出された蓄積量に基づいて複数の合成単位の組み合わせを生成するステップと、生成された組み合わせに含まれる複数の合成単位を接続するステップとを有することを特徴とする。
【0026】
発明に係る音声合成装置は、複数の合成単位を所定の数毎に分割して複数の合成単位列を形成し、該合成単位毎に、前記複数の合成単位を接続することによって音声を合成し、合成された音声を順次的に出力する音声合成装置において、合成された音声を蓄積する蓄積手段と、該蓄積手段に蓄積された音声の蓄積量を検出する検出手段と、動的プログラミングを用いて、前記検出手段で検出された蓄積量に基づいて複数の合成単位組み合わせを生成する生成手段と、該生成手段で生成された組み合わせに含まれる複数の合成単位を接続する接続手段と
を備えることを特徴とする。
【0027】
発明に係る記録媒体は、コンピュータに複数の合成単位を所定の数毎に分割させて複数の合成単位列を形成し合成単位毎に、前記複数の合成単位をコンピュータに接続させることによって音声を合成し、合成された音声を順次的にコンピュータに出力させるプログラムが記録してある、コンピュータ読み取り可能な記録媒体において、コンピュータに、合成された音声を蓄積させるプログラムコード手段と、コンピュータに、蓄積された音声の蓄積量を検出させるプログラムコード手段と、コンピュータに、動的プログラミングを用いて、前記蓄積量に基づいて前記複数の合成単位組み合わせを生成させるプログラムコード手段と、コンピュータに、生成された組み合わせに含まれる複数の合成単位を接続させるプログラムコード手段とを有するプログラムが記録してあることを特徴とする。
【0028】
本発明にあっては、既に合成された音声を出力する前に、その音声を蓄積する蓄積手段を備え、この蓄積手段に蓄積された音声の蓄積量が多い場合は、DPを用いた合成単位の組み合わせ選択をするとき、候補数及び組み合わせ数を大きくする。その結果、合成歪みが最も小さくなる合成単位の組み合わせを確実に生成することができるので、この組み合わせに含まれる複数の合成単位を接続することによって高品質な音声を合成することができる。
【0029】
一方、蓄積手段に蓄積された音声の蓄積量が少ない場合は、DPを用いた合成単位の組み合わせ選択をするとき、候補数及び組み合わせ数を小さくする。その結果、合成単位の組み合わせ選択が短時間で終了するので、高速に音声を合成することができる。
【0030】
【発明の実施の形態】
以下、本発明をその実施の形態を示す図面に基づいて説明する。
図1は、本発明の音声合成方法を実施するための音声合成装置を示すブロック図である。図1において、11はCPUを示し、該CPU11に対して、キーボード、マウス及びスキャナ等からなる入力部12と、ROM又はRAMで構成される言語辞書13及び音声辞書14と、スピーカ等からなる出力部15と、バッファメモリである出力バッファ16とがそれぞれ接続されている。
【0031】
入力部12は、音声に変換するための文章を入力する入力部であり、ここで入力された文章はCPU11へ供給される。言語辞書13は、単語毎に読み及びアクセントの情報を格納している。CPU11は、この言語辞書13を参照して、入力された文章に対する読み及びアクセントを得る。音声辞書14は、音素又は音節等の合成単位毎に音響パラメータ及び音声波形データを格納している。CPU11はこの音声辞書14から合成単位を選択し、選択された合成単位の音声波形データを接続することによって音声を合成する。
また出力バッファ16は、CPU11において合成された音声を一時的に蓄積するためのバッファメモリである。出力部15は、CPU11において合成された音声をD/A変換して出力するための出力部である。CPU11は、出力部15の処理状況に応じて、出力バッファ16に蓄積された音声を出力部15へ供給する。
【0032】
図2は、CPU11の動作を示すフローチャートである。CPU11は入力部12から供給された文章を形態素解析して、単語に分解する(S201)。次に言語辞書13を参照して、分解された単語すべてに対して読み及びアクセントを得る(S202)。得られた読み及びアクセントに基づいて公知方法により、入力された文章を複数の連続する合成単位に変換し、これらの合成単位に対する音響パラメータを算出する(S203)。またCPU11は、これらの合成単位を所定の数毎に区切り、複数の合成単位列を形成する(S204)。
【0033】
次に合成単位列毎に、前記音響パラメータの値に基づいて、後述するDPを用いた合成単位の組み合わせの選択を行う(S205)。選択された組み合わせを構成している合成単位から、音声辞書14を参照して音声波形データを取得し、取得した音声波形データを波形重畳方式により接続することによって音声を合成する(S206)。S205及びS206の処理は、入力された文章中のすべての合成単位列に対して繰り返される(S207)。
【0034】
図3は、S205におけるDPを用いた合成単位の組み合わせ選択の処理手順を示すフローチャートである。まず、候補数Kの初期値として、予め設定してある値を設定する(S301)。次に合成単位(1) と音声辞書14に格納されているすべての合成単位との音響歪みを、後述する(1) 式を用いて演算する(S302)。ここで合成単位(n) とは、合成単位列に含まれる複数の合成単位のうち先頭からn番目の合成単位を表すものとする。
【0035】
Figure 0003588266
【0036】
ここでCpre (i , n) は、合成単位列に含まれる複数の合成単位のうち先頭からn番目の合成単位に音声辞書14中のi番目の合成単位を割り当てたときに生じるコストである。また、D(i , n) は、合成単位列に含まれる複数の合成単位のうち先頭からn番目の合成単位に音声辞書14中のi番目の合成単位を割り当てたときに生じる音響歪みである。(2) 式におけるWF0、WDUR 、WPOW は、各音響パラメータの距離に乗じる重みである。また、F0Dic (i) 、DURDic (i) 、POWDic (i) は、それぞれ音声辞書14中のi番目の合成単位のF0、DUR、POWの値であり、F0(n) 、DUR(n) 、POW(n) はそれぞれ合成単位列に含まれる複数の合成単位のうち先頭からn番目の合成単位に対して算出されたF0、DUR、POWの値である。
【0037】
S302において演算された音響歪みが小さい方からK個の合成単位の候補を選択し(予備選択▲1▼)、選択結果を選択結果列F1,i (i=1…K)に代入する(S303)。
次に、nに2を設定する(S304)。出力バッファ16に蓄積されている音声の蓄積量を検出し(S305)、その蓄積量が多い場合はK及び組み合わせ数Lを大きくする。またS305において、検出した音声蓄積量が少ない場合は、K及びLを小さくする(S306)。
【0038】
次に、合成単位(n) と音声辞書14に格納されているすべての合成単位との音響歪みを、(1) 式を用いて演算する(S307)。S307において演算された音響歪みが小さい方からK個の合成単位の候補を選択し(予備選択▲1▼)、選択結果を選択結果列Fn,i に代入する(S308)。合成単位(n−1) までの選択結果列Fn−1,i と、S308において選択された合成単位(n) の候補 (K個) との全ての組み合わせについての合成歪みを後述する(3) 式を用いて演算する(S309)。
【0039】
【数1】
Figure 0003588266
【0040】
ここでCall (Fn,i )は、選択結果列Fn,i のコストである。また、D(Xk−1 ,X)はXk−1 の合成単位の音声波形データとXの合成単位の音声波形データとを接続したときに生じる接続歪みである。(4) 式におけるWcF0 、WcPOWは各音響パラメータの距離に乗じる重みである。またF0DicE(i) 、POWDicE(i) は、それぞれ音声辞書14中のi番目の合成単位が選択結果列の終端にある場合のF0、POWの値である。
【0041】
S309において演算された合成歪みが少ないL通りの組み合わせを予備選択し(予備選択▲2▼)、選択結果を選択結果列Fn,i に代入する(S310)。S304からS308までの処理をn−1回繰り返すことにより(S311)、合成単位列に含まれるすべての合成単位の組み合わせを格納している選択結果列Fn,i が生成される。この選択結果列Fn,i のなかでコストが最も小さい、即ち合成歪みが最も少ない組み合わせを選択する(S312)。
【0042】
以上がS205におけるDPを用いた合成単位の組み合わせ選択の処理手順であり、その後にS206の手順が行われるのは前述のとおりである。
このように、出力バッファ16に蓄積された音声の蓄積量が多い場合には候補数及び組み合わせ数を大きくし、一方出力バッファ16に蓄積された音声の蓄積量が少ない場合には候補数及び組み合わせ数を小さくすることによって、高品質な音声を実時間で合成することができる。
【0043】
図4は、本発明の音声合成方法を実施するための記録媒体の実施の形態を示す模式図である。図4において、41はコンピュータを示し、該コンピュータ41に対して文字データ等を表示するディスプレイ42と、入力装置としてのキーボード43及びマウス44とがそれぞれ接続されている。コンピュータ41は上述したような音声合成のプログラムを、CD−ROM、MO等の可搬型記録媒体45、コンピュータ41と無線又は有線にてプログラム通信可能である、例えばセンタに備えられた回線先メモリ46、又はコンピュータ41に備付けられたRAM、ハードディスク等のコンピュータ側メモリ47等の記録媒体からロードする。
【0044】
【発明の効果】
以上のように、本発明の音声合成方法及びその方法を実施するための音声合成装置によれば、出力バッファに一時的に蓄積された音声の蓄積量に基づいて候補数及び組み合わせ数を更新することによって、高品質な音声を実時間で合成することが可能になるので、自然で滑らかな音声を生成することができる。
また本発明の音声合成方法を実施するための記録媒体によれば、その記録内容であるプログラムコードをコンピュータに読み取らせることによって以上のような音声合成方法を容易に実施することが可能になる。
【図面の簡単な説明】
【図1】本発明の音声合成方法を実施するための音声合成装置を示すブロック図である。
【図2】CPUの動作を示すフローチャートである。
【図3】DPを用いた合成単位の組み合わせ選択の処理手順を示すフローチャートである。
【図4】本発明の音声合成方法を実施するための記録媒体の実施の形態を示す模式図である。
【図5】従来の文章音声合成装置を示すブロック図である。
【図6】合成単位の組み合わせを示す説明図である。
【図7】DPを用いた合成単位の組み合わせ選択を示す説明図である。
【図8】DPを用いた合成単位の組み合わせ選択を示す説明図である。
【図9】DPを用いた合成単位の組み合わせ選択を示す説明図である。
【符号の説明】
11 CPU
12 入力部
13 言語辞書
14 音声辞書
15 出力部
16 出力バッファ
41 コンピュータ
42 ディスプレイ
43 キーボード
44 マウス
45 可搬型記録媒体
46 回線先メモリ
47 コンピュータ側メモリ

Claims (3)

  1. 複数の合成単位を所定の数毎に分割して複数の合成単位列を形成し、該合成単位列毎に、前記複数の合成単位を接続することによって音声を合成し、合成された音声を順次的に出力する音声合成方法において、
    合成された音声を蓄積するステップと、
    蓄積された音声の蓄積量を検出するステップと、
    動的プログラミングを用いて、検出された蓄積量に基づいて複数の合成単位の組み合わせを生成するステップと、
    生成された組み合わせに含まれる複数の合成単位を接続するステップと
    を有することを特徴とする音声合成方法。
  2. 複数の合成単位を所定の数毎に分割して複数の合成単位列を形成し、該合成単位列毎に、前記複数の合成単位を接続することによって音声を合成し、合成された音声を順次的に出力する音声合成装置において、
    合成された音声を蓄積する蓄積手段と、
    該蓄積手段に蓄積された音声の蓄積量を検出する検出手段と、
    動的プログラミングを用いて、前記検出手段で検出された蓄積量に基づいて複数の合成単位の組み合わせを生成する生成手段と、
    該生成手段で生成された組み合わせに含まれる複数の合成単位を接続する接続手段と
    を備えることを特徴とする音声合成装置。
  3. コンピュータに複数の合成単位を所定の数毎に分割させて複数の合成単位列を形成し、該合成単位列毎に、前記複数の合成単位をコンピュータに接続させることによって音声を合成し、合成された音声を順次的にコンピュータに出力させるプログラムが記録してある、コンピュータ読み取り可能な記録媒体において、
    コンピュータに、合成された音声を蓄積させるプログラムコード手段と、
    コンピュータに、蓄積された音声の蓄積量を検出させるプログラムコード手段と、
    コンピュータに、動的プログラミングを用いて、前記蓄積量に基づいて前記複数の合成単位の組み合わせを生成させるプログラムコード手段と、
    コンピュータに、生成された組み合わせに含まれる複数の合成単位を接続させるプログラムコード手段と
    を有するプログラムが記録してあることを特徴とするコンピュータ読み取り可能な記録媒体。
JP05405599A 1999-03-02 1999-03-02 音声合成方法、音声合成装置及び記録媒体 Expired - Fee Related JP3588266B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05405599A JP3588266B2 (ja) 1999-03-02 1999-03-02 音声合成方法、音声合成装置及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05405599A JP3588266B2 (ja) 1999-03-02 1999-03-02 音声合成方法、音声合成装置及び記録媒体

Publications (2)

Publication Number Publication Date
JP2000250600A JP2000250600A (ja) 2000-09-14
JP3588266B2 true JP3588266B2 (ja) 2004-11-10

Family

ID=12959940

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05405599A Expired - Fee Related JP3588266B2 (ja) 1999-03-02 1999-03-02 音声合成方法、音声合成装置及び記録媒体

Country Status (1)

Country Link
JP (1) JP3588266B2 (ja)

Also Published As

Publication number Publication date
JP2000250600A (ja) 2000-09-14

Similar Documents

Publication Publication Date Title
US6778962B1 (en) Speech synthesis with prosodic model data and accent type
JP4328698B2 (ja) 素片セット作成方法および装置
JP4680429B2 (ja) テキスト音声変換装置における高速読上げ制御方法
US7143038B2 (en) Speech synthesis system
US20090259475A1 (en) Voice quality change portion locating apparatus
JP2001034282A (ja) 音声合成方法、音声合成のための辞書構築方法、音声合成装置、並びに音声合成プログラムを記録したコンピュータ読み取り可能な媒体
JP2009139677A (ja) 音声処理装置及びそのプログラム
JP2001282278A (ja) 音声情報処理装置及びその方法と記憶媒体
JPH08123455A (ja) 音声合成方法及びシステム
JPH0573100A (ja) 音声合成方法及びその装置
JP3518898B2 (ja) 音声合成装置
JP3588266B2 (ja) 音声合成方法、音声合成装置及び記録媒体
JP3109778B2 (ja) 音声規則合成装置
EP0982684A1 (en) Moving picture generating device and image control network learning device
JP2004347653A (ja) 音声合成方法及びその装置並びにそのコンピュータプログラム及びそれを記憶した情報記憶媒体
JPH08335096A (ja) テキスト音声合成装置
JP2002062890A (ja) 音声合成方法および音声合成装置ならびに音声合成処理プログラムを記録した記録媒体
JP4454780B2 (ja) 音声情報処理装置とその方法と記憶媒体
JPH11249676A (ja) 音声合成装置
JP3081300B2 (ja) 残差駆動型音声合成装置
JPH11282484A (ja) 音声合成装置
JP2000172286A (ja) 中国語音声合成のための同時調音処理装置
JP3870583B2 (ja) 音声合成装置および記憶媒体
JP2573585B2 (ja) 音声スペクトルパタン生成装置
KR20010076625A (ko) 합성 데이터베이스 경량화를 위한 불필요한 합성단위 제거방법

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040427

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040511

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040712

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040803

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040812

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070820

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080820

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090820

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees