JPH10301599A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH10301599A
JPH10301599A JP9112642A JP11264297A JPH10301599A JP H10301599 A JPH10301599 A JP H10301599A JP 9112642 A JP9112642 A JP 9112642A JP 11264297 A JP11264297 A JP 11264297A JP H10301599 A JPH10301599 A JP H10301599A
Authority
JP
Japan
Prior art keywords
waveform
unit
frequency
conversion
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9112642A
Other languages
English (en)
Inventor
Atsushi Wakao
淳 若尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP9112642A priority Critical patent/JPH10301599A/ja
Publication of JPH10301599A publication Critical patent/JPH10301599A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 多彩な声質の合成音声を合成できる音声合成
装置を提供する。 【解決手段】 有声音については1ピッチ分の波形であ
り、無声音については1音素分の波形である、合成の最
小単位としての素片波形を記憶する波形記憶部3と、波
形記憶部3に記憶された素片波形を変換する波形変換部
2と、波形変換部2にて変換された素片波形を編集して
合成音を生成する合成部1とを有している。波形変換部
2にて各素片波形を変換し、変換された素片波形を用い
て合成音声を生成することで合成音の声質をピッチおよ
び発声速度と独立に変更する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、波形編集方式の音
声合成装置に関し、特に、様々な声質の合成音声を生成
することができる音声合成装置に関する。
【0002】
【従来の技術】テキスト音声合成における合成音の品質
は、年々向上している。それに伴い、利用者は、「多彩
な声質」の合成音声を求め始めている。人間の声は、声
帯等の音源で発生した音が声道を通過する際に、様々な
音色(スペクトル包絡)を付与されることで生じる。声
質は、このスペクトル包絡によって決定される。したが
って、このスペクトル包絡を変更することで、声質を変
更することが可能である。
【0003】一般に、音声合成装置は、波形編集方式と
パラメータ分析合成方式の二つに大別される。
【0004】パラメータ分析合成方式においては、スペ
クトル包絡はモデル化され、ホルマントなどの声質に影
響の大きいパラメータとして扱われる。このため、この
ようなパラメータを変更することによって、声質を容易
に変更できる。パラメータ分析合成方式における声質変
換法は、例えば、特開平8−83098号公報、特開平
8−248994号公報、特開昭57−105796号
公報、特開昭56−072500号公報、特開昭58−
168098号公報等にて開示されている。しかし、今
のところ、パラメータ分析合成方式は、波形編集方式と
比較して音質が悪いため、実用的ではない。
【0005】これに対し、比較的音質の良い波形編集方
式においては、スペクトル包絡は、モデル化されず、音
声波形の状態で扱われる。このため、波形編集方式にお
いては、声質の変更は容易でない。
【0006】波形編集方式音声合成方式におけるスペク
トル包絡の変更方法は、例えば、特開平8−15290
0号公報にて開示されている。図20は、この公報にて
開示されている音声合成装置の構成を示すブロック図で
ある。図20を参照して、入力テキストが合成部901
に入力されると、波形記憶部903から適切な波形を選
択、編集し、合成音を生成する。この合成音を波形伸縮
部902において時間伸縮(サンプリング周波数変換)
することで、合成音のスペクトル包絡が変化する。これ
により、声質を変化させる。図21は、有声音の伸縮の
様子を示した例であり、(A)は伸縮前の波形、(B)
は伸縮後の波形、(C)は伸縮前のスペクトル包絡、
(D)は伸縮後のスペクトル包絡である。有声音は、図
21の(A)のように、複数の1ピッチ波形の並んだも
のとして構成される。その間隔(中心間の距離)がピッ
チ周期(周波数の逆数)、全体の長さが発声時間、1ピ
ッチ波形をフーリエ変換したものがスペクトル包絡
(C)である。波形の時間伸縮を行うと、そのスペクト
ルも伸縮される。例えば、図21の例では、波形が伸張
されることにより、伸縮前のスペクトル包絡(D)は、
伸縮後のスペクトル包絡(C)と比べ、低周波数方向に
縮退している。このようにスペクトル包絡が変化するこ
とにより、声質は変更される。しかし、伸縮を行うこと
により、そのピッチ、発声時間も変化する。図21にお
いて、(A)と(B)とを比較すると、(B)の伸縮後
の波形は、ピッチ周期、発声時間とも倍の長さとなって
しまう。
【0007】これに対処するため、波形を編集する際、
即ち、図21における(A)の段階でピッチ周期、発声
時間を通常の半分とする必要がある。一般に、波形編集
後に何らかの変換を行う場合は、スペクトル包絡だけで
なく、ピッチや発声時間にも影響を与える。波形編集時
には、この影響を考慮する必要がある。
【0008】
【発明が解決しようとする課題】図20に示した手法で
は、伸縮に合わせて、波形編集時に発声速度やピッチを
変更するための余分な計算が必要となる。また、合成音
声のスペクトル包絡は、音韻によらず一律な規則で変更
されている。このような変更は、声道の形状に対応して
いると考えられる。しかし、人間の音声は、声帯等の音
源で生成される音が声道を通る際に音色(スペクトル包
絡)を付与されて生成する。したがって、スペクトル包
絡は、音源で発生した音が通過した声道の形状によって
決定される。しかし、音源の位置は音韻により異なる。
例えば、母音の場合には音源は喉の奥の声帯であるが、
摩擦音“s”の場合には舌を固い上蓋に近づけ、ここを
音源としている。つまり、声道の形状が同じように変化
しても、音源から発生した音が声道を通る距離等は異な
るため、声道の形状の変化の影響は音韻によって異な
る。したがって、主に音源から発生した音が通過する声
道の形状によって決まるスペクトル包絡の変化は、音韻
により異なるべきである。また、人間の音声には、ホル
マントと呼ばれるスペクトル包絡のピークが複数存在す
る。このようなホルマントは、声質に大きな影響を及ぼ
す。このため、多彩な声質を得るためには、複数のホル
マントをそれぞれ操作できることが望まれる。しかし、
図21における(C)のスペクトル包絡と(D)のスペ
クトル包絡とを比較すると、(C)の2つのホルマント
(スペクトル包絡のピーク)は、(D)において、いず
れも半分の周波数の位置にシフトしている。
【0009】本発明の課題は、多彩な声質の合成音声を
合成できる音声合成装置を提供することである。
【0010】
【課題を解決するための手段】本発明の第1の音声合成
装置は、合成の最小単位となる素片波形(有声:1ピッ
チ毎、無声:音素毎)を記憶する波形記憶部と前記波形
記憶部に記憶された素片波形を変換する波形変換部と前
記波形変換部で変換された素片波形を編集して合成音を
生成する合成部とを備え、波形変換部において各素片波
形を変換し、変換された素片波形を用いて合成音声を生
成することで合成音の声質をピッチ、発声長と独立に変
更することを特徴とする。
【0011】本発明の第2の音声合成装置は、合成の最
小単位となる素片波形(有声:1ピッチ毎、無声:音素
毎)を記憶する波形記憶部と前記波形記憶部に記憶され
た素片波形を変換する波形変換部と前記波形変換部で変
換された素片波形を編集して合成音を生成する合成部と
を備え、前記波形変換部が素片波形を時間伸縮する波形
伸縮部とから構成され、波形伸縮部において各素片波形
を伸縮し、伸縮された素片波形を用いて合成音声を生成
することを特徴とする。
【0012】本発明の第3の音声合成装置は、合成の最
小単位となる素片波形(有声:ピッチ毎、無声:音素
毎)を記憶する波形記憶部と前記波形記憶部に記憶され
た素片波形を変換する波形変換部と前記波形変換部で変
換された素片波形を編集して合成音を生成する合成部と
を備え、前記波形変換部が素片波形をフーリエ変換する
周波数変換部と前記周波数変換部でフーリエ変換された
素片波形スペクトルの周波数をシフトする周波数シフト
部と前記周波数シフト部で周波数シフトする際に必要な
パラメータを記憶したパラメータ記憶部と前記周波数シ
フト部で周波数シフトされた素片波形スペクトルをフー
リエ逆変換する周波数逆変換部から構成され、周波数シ
フト部において各素片波形スペクトルを周波数シフトす
ることで合成音の声質を変更することを特徴とする。
【0013】本発明の第4の音声合成装置は、合成の最
小単位となる素片波形(有声:ピッチ毎、無声:音素
毎)を記憶する波形記憶部と前記波形記憶部に記憶され
た素片波形を変換する波形変換部と前記波形変換部で変
換された素片波形を編集して合成音を生成する合成部と
を備え、前記波形変換部が素片波形をラプラス変換する
周波数変換部と前記周波数変換部でラプラス変換された
素片波形スペクトルの周波数をシフトする周波数シフト
部と前記周波数シフト部で周波数シフトする際に必要な
パラメータを記憶するパラメータ記憶部と前記周波数シ
フト部で周波数シフトされた素片波形スペクトルを逆ラ
プラス変換する周波数逆変換部から構成され、周波数シ
フト部において各素片波形スペクトルを周波数シフトす
ることで合成音の声質を変更することを特徴とする。
【0014】本発明の第5の音声合成装置は、合成の最
小単位となる素片波形(有声:ピッチ毎、無声:音素
毎)を記憶する波形記憶部と前記波形記憶部に記憶され
た素片波形を変換する波形変換部と前記波形変換部で変
換された素片波形を編集して合成音を生成する合成部と
を備え、前記波形変換部が前記波形記憶部に記憶された
素片波形の標本値列ベクトルに行列を積算する行列演算
部と前記行列演算部において用いる行列を記憶するパラ
メータ記憶部から構成され、素片波形の標本値列ベクト
ルに行列を積算することで第3、第4の発明と等価な変
換を実現することを特徴とする。
【0015】本発明の第6の音声合成装置は、第1から
第5のいずれかの発明の音声合成装置において素片波形
をいくつかのグループに分け、このグループ毎に異なる
パラメータで変換をすることを特徴とする。
【0016】本発明の第7の音声合成装置は、第6の発
明の音声合成装置において特に素片波形を有声音と無声
音の二つに分け、有声音のみを変換することを特徴とす
る。
【0017】本発明の第8の音声合成装置は、第1から
第7のいずれかの発明の音声合成装置にさらにパラメー
タの入力部を備え、パラメータを任意に設定できること
を特徴とする。
【0018】本発明の第9の音声合成装置は、第一から
第七のいずれかの音声合成装置において、前記波形変換
部が入力テキスト中に明示されたパラメータを用いて素
片波形を変換することを特徴とする。
【0019】本発明の第10の音声合成装置は、第1か
ら第9のいずれかの発明の音声合成装置において前記波
形変換部で変換された素片波形を記憶する波形記憶部を
備え前記波形記憶部に記憶された素片波形を用いて合成
音声を生成することを特徴とする。
【0020】本発明の第11の音声合成装置は、第1か
ら第9のいずれかの発明の音声合成装置において前記波
形変換部が前記合成部の韻律情報からパラメータを変更
することを特徴とする。
【0021】
【発明の実施の形態】以下、図面を参照して、本発明の
実施の形態による音声合成装置を説明する。
【0022】[実施の形態1]図1は、本発明の実施の
形態1の構成を示すブロック図である。図1を参照し
て、本発明の実施の形態1は、テキスト等の入力に基づ
いて波形記憶部3から選んだ素片波形を編集して合成音
を生成する合成部1と、素片波形を変換する波形変換部
2と、音素毎の波形と当該波形のラベルを記憶する波形
記憶部3とを有している。
【0023】ここで、素片波形とは、有声音の場合は1
ピッチ分の波形、無声音の場合は1音素分の波形を示
す。また、ラベルとは、当該波形がどの音であるかを示
す音素情報や当該波形がどのようなテキストから得られ
たのかを示す音素環境情報等を示す。また、当該音素が
有声音である場合には複数の素片波形から構成されてい
るため、本発明では、これを素片波形毎に分離する必要
がある。このため、有声音波形には、このような分離を
行うためのラベルをも用意される。
【0024】図2は、図1の波形変換部2をより詳細に
示すブロック図である。図2を参照して、波形変換部2
は、伸縮率を記憶するパラメータ記憶部2aと、パラメ
ータ記憶部2aに記憶された伸縮率を用いて素片波形を
時間伸縮する波形伸縮部2bとを備えている。
【0025】次に、図1および図2を参照して、本発明
の実施の形態1の動作について説明する。
【0026】合成したいテキストあるいは発音記号な
ど、それに準ずる発音情報が合成部1に入力されると、
合成部1は、このテキストを合成するために必要な素片
波形を波形記憶部3から選択する。
【0027】波形記憶部3は、例えば音素を単位として
区切られた波形と、そのラベルとを記憶している。ラベ
ルは、例えば「koNn;i;chiwa」というよう
に与えられる。ここで、最初のセミコロン(;)の前の
「koNn」は当該波形の直前の音素連鎖、2つのセミ
コロンの間の「i」は当該波形の音素、2つ目のセミコ
ロンの後の「chiwa」は当該波形の直後の音素連鎖
を示す。
【0028】また、当該波形が有声音である場合には、
前述のように素片波形毎に分離するためのラベルも持
つ。このラベルは、例えば素片波形の始端と終端の時刻
を「10;21;31;40;…」という形で与える。
この場合、有声音波形のうち0msecから10mse
cの部分は最初の1ピッチ波形、10msecから21
msecは次の1ピッチ波形…であることを示してい
る。
【0029】素片波形の選択は、例えば「a」が合成に
必要な場合、音素が「a」である音素波形を探す。この
候補が複数ある場合は、音素環境情報を用いて合成した
い「a」と前後の音素が同じ物を探す。例えば、「ka
kigouri」の「a」を合成したい場合、aの前後
の音素がkであることを示す「* k;a;k* 」となる
ラベルを持つ波形を探す。ここで、「*」は任意の音素
系列を示す。さらに候補が複数ある場合は、前後2つと
いうように増やして行く。また、前後どちらかのみ一
致、もしくは完全に一致するものがない場合に備え、同
一音素の音素波形には、予め優先順位を付けておく。ま
た、有声音の音素波形は、選択後、ラベルを用いて素片
波形に分割する。
【0030】選択が行われると、波形伸縮部2bは、選
択された素片波形を波形記憶部3から読み出し、パラメ
ータ記憶部2aに記憶されている伸縮率で時間伸縮す
る。時間伸縮は、例えば、サンプリング周波数変換の手
法で行われ、波形の元の周波数が20kHzで伸縮率が
0.5であれば20kHzから10kHzにサンプリン
グ周波数変換を行う。
【0031】伸縮された素片波形は、合成部1で所望の
ピッチ・発声速度となるように並べられ、合成音声とし
て出力される。
【0032】具体的には、例えば有声音の場合、図14
のように波形記憶部3に記憶された素片波形(1ピッチ
分の波形)(A)を波形伸縮部2において時間伸縮し、
素片波形(B)を生成する。次に、合成部1は、伸縮し
た素片波形(B)を所望のピッチ周期の間隔で所望の長
さとなるまで並べ、合成音(C)を得る。一方、無声音
の場合は、例えば、図16(a)および(b)に示すよ
うに、素片波形(1音素分の波形)を伸縮し、伸縮後の
波形が所望の長さとなるように調整する。無声音の場合
の長さの調整法としては、例えば、次のような方法が挙
げられる。図16(a)のように、伸縮後の波形(A)
の長さが所望の長さより短い場合は、伸縮後の波形
(A)からその一部(B)を抽出し、これを接続するこ
とで望む長さの波形(C)を得る。また、図16(b)
のように、伸縮後の波形(A)の長さが所望の長さより
長い場合は、伸縮後の波形(A)からその一部(D)を
削除することで、望む長さの波形(E)を得る。
【0033】ここで、比較例として、特開平8−152
900号公報にて開示された従来例では、図15のよう
に、素片波形(1ピッチ波形)(A)を並べた波形
(D)を生成し、これを伸縮することで望む声質、ピッ
チ、発声長の合成音(C)を生成している。しかし、こ
の手法では、(D)と(C)とを比較すればわかるよう
に、伸縮によってピッチ周期、発声長が変化する。この
ため、最終的な出力(C)の段階で望むピッチ周期、発
生長を得るには、素片波形(A)を並べて波形(D)を
作る段階で伸縮の影響を考慮して波形を並べる必要があ
る。一方、本発明では、図14のように、素片波形
(A)を予め伸縮し、伸縮された素片波形(B)を並べ
て合成音(C)を生成している。このため、素片波形
(B)を並べて合成音(C)を作る際に、望むピッチ周
期、発声長となるように並べればよく、余分な計算は必
要ない。
【0034】[実施の形態2]本発明の実施の形態2
は、実施の形態1と基本的に同じ構成である。異なる点
は、波形変換部2の構成ならびに動作である。
【0035】図3は、実施の形態2における図1の波形
変換部2を、より詳細に示すブロック図である。図3を
参照して、波形変換部2は、素片波形をフーリエ変換す
る周波数変換部2cと、フーリエ変換された素片波形ス
ペクトルの周波数をシフトする周波数シフト部2dと、
周波数シフトの際のパラメータを記憶するパラメータ記
憶部2aと、周波数シフトされた素片波形スペクトルを
フーリエ逆変換する周波数逆変換部2eとを備えてい
る。
【0036】次に、図1および図3を参照して、本発明
の実施の形態2の動作について説明する。
【0037】合成したいテキストあるいは発音記号など
それに準ずる発音情報が合成部1に入力されると、合成
部1は、このテキストを合成するために必要な素片波形
を波形記憶部3から選択する。選択方法は、実施の形態
1と同様である。選択が行われると、周波数変換部2c
は、選択された素片波形f(t)を読み出してフーリエ
変換を行って素片波形スペクトルS(ω)を計算し、周
波数シフト部2dに渡す。フーリエ変換は、以下の数式
1で表される。
【0038】
【数1】 周波数シフト部2dは、素片波形スペクトルx(ω)を
受け取ると、パラメータ記憶部2aから周波数の対応を
表す関数w(ω)を読み出し、周波数シフトを実行す
る。周波数シフトは、以下の数式2で与えられる。
【0039】
【数2】 図17に、周波数シフトの例を示す。図17において、
(B)は元の素片波形スペクトルである。この素片波形
スペクトルを図17の(A)で表される関数を用いて周
波数シフトすると、例えばω=2の場合、図17の
(A)からw(2)=1となるので、x(w(2)=x
(1)となり、図17の(B)のω=1のホルマントが
ω=2にシフトし、その結果、図17の(C)のような
スペクトルとなる。周波数シフトされた素片波形スペク
トルx′Sは、周波数逆変換部2eに渡される。周波数
逆変換部2eは、周波数シフトされた素片波形スペクト
ルx′をフーリエ逆変換する。フーリエ逆変換は以下の
数式3で表される。
【0040】
【数3】 フーリエ逆変換された素片波形f(t)は、合成部1で
所望のピッチ・発声速度となるように並べられ、合成音
声として出力される。
【0041】ここで、比較例の場合は、図21の(C)
の変換前のスペクトルの2つのホルマント(スペクトル
のピーク)は、図21の(D)の変換後、いずれも半分
の周波数の位置にある。このように従来は2つのホルマ
ントを同じようにしか変化できなかった。これに対し、
本発明の場合、図17の(B)のω=1,3の2つのホ
ルマントは、図17の(c)ではω=2,3.5とな
り、各々別の割合で変化させることができる。
【0042】尚、以上の説明では、波形が連続値を取る
ものとして説明したが、離散値を取る場合にも実現でき
る。この場合、フーリエ変換、フーリエ逆変換はそれぞ
れ、離散フーリエ変換、離散フーリエ逆変換に置き換え
る。この場合、変換前の素片波形をF[n]、変換前の
素片波形スペクトルをX[k]、変換後の素片波形を
F′[n]、変換前の素片波形スペクトルをX′
[k]、周波数シフトを示す関数をW[k]とすると、
(1)式、(2)式、(3)式は、以下の数式4および
数式5に置き換えられる。
【0043】
【数4】
【0044】
【数5】 ここで、Nは素片波形のサンプル数、Kは素片波形スペ
クトルのサンプル数である。以上の計算は、FFTによ
って行うことが可能である。
【0045】また、周波数シフトは、2変数の関数y
(ω,l)(離散値の場合はY[k,h])を用いて、
以下の数式6のように表現することもできる。
【0046】
【数6】 また、フーリエ変換、フーリエ逆変換の代わりに、ラプ
ラス変換、ラプラス逆変換を用いることもできる。この
場合、変換前の素片波形をf(t)、変換前の素片波形
スペクトルをx(s)、変換後の素片波形をf′
(t)、変換前の素片波形スペクトルをx′(s)、周
波数シフトを示す関数をw(s)とすると(1)式、
(2)式、(3)式は、以下の数式7に置き換えられ
る。
【0047】
【数7】 ここで、s=δ+jωである。この場合、周波数シフト
を表す関数W(s)は複素関数となり、より詳細な変換
を実現できる。
【0048】同様に、波形が離散値を取る場合は、ラプ
ラス変換、ラプラス逆変換はそれぞれ、Z変換、逆Z変
換に置き換える。この場合、変換前の素片波形をF
[n]、変換前の素片波形スペクトルをX[z]、変換
後の素片波形をF′[n]、変換前の素片波形スペクト
ルをX′[z]、周波数シフトを示す関数をW[z]と
すると、(1)式、(2)式、(3)式は、以下の数式
8に置き換えられる。
【0049】
【数8】 [実施の形態3]本発明の実施の形態3は、実施の形態
1と基本的に同じ構成である。異なる点は、波形変換部
2の構成ならびに動作である。
【0050】図4は、実施の形態3における図1の波形
変換部2をより詳細に示すブロック図である。図4を参
照して、波形変換部2は、素片波形の標本値列スペクト
ルに行列を積算する行列演算部2fと、行列演算部2f
で積算する行列を記憶するパラメータ記憶部2aとを備
えている。
【0051】次に、図1および図4を参照して、本発明
の実施の形態3の動作について説明する。
【0052】合成したいテキストあるいは発音記号など
それに準ずる発音情報が合成部1に入力されると、合成
部1は、このテキストを合成するために必要な素片波形
を波形記憶部3から選択する。選択方法は、実施の形態
1と同様である。選択が行われると、行列演算部2f
は、パラメータ記憶部2aから周波数シフトを表す行列
の要素A[i,n]を読み出して素片波形F[n]に積
算する。積算された素片波形F′[n′]は、合成部1
で所望のピッチ・発音速度となるように並べられ、合成
音声として出力される。周波数シフトされた波形F′
[n′]は、以下の数式9のように表せる。
【0053】
【数9】 予めA[n′,n]を計算し、行列波形記憶部に記憶す
ることで、合成音生成時の計算量を削減することが可能
である。
【0054】特に、W[k]の解像度はKによって決ま
るが、式の計算はKに無関係であるので、Kの値を十分
大きくすることができる。
【0055】[実施の形態4]本発明の実施の形態4
は、実施の形態1〜3のものと基本的に同じ構成であ
る。異なる点は、波形変換部2において、素片波形をそ
のラベルを用いていくつかのグループに分け、グループ
毎に伸縮率または周波数シフト関数等の変換パラメータ
を割り当てる点である。グループの分け方としては、例
えば音素の種類(母音、摩擦音、破裂音、等)、音素中
の素片波形の位置(有声音の場合)等によって分ける。
【0056】比較例の場合、図15のように、素片波形
(A)を並べた後で変換(伸縮)を行っている。このた
め、例えば波形(C)の(C1)と(C2)とで異なる
変換パラメータ(伸縮率)とすることは、不可能であ
る。これに対し、本発明では、素片波形(A)を変換
(伸縮)する際に、違う変換パラメータ(伸縮率)を用
いて(B1)、(B2)を生成すれば、合成音において
(C1)と(C2)とで違う変換パラメータ(伸縮率)
とすることができる。したがって、従来と比べ、より変
化に富んだ声質を実現することが可能となる。また、発
明が解決しようとする課題の項で述べたように、声道の
形状の変化の影響は、音韻により異なる。この影響を加
味して音韻毎に変換パラメータ(伸縮率)を設定するこ
とで、より自然な声質変換が可能となる。
【0057】次に、図1および図2を参照して、本発明
の実施の形態4の動作について説明する。尚、以下では
実施の形態1に即して説明するが、実施の形態2、3に
即した形での実現も無論可能である。
【0058】まず、予め、ラベルに応じたグループ分け
を定義する。ここでは、例えばラベルが「a」「i」
「u」「e」「o」である場合と、そうでない場合との
2つに分ける。そして、この2つのグループの伸縮率を
1.2、1.1とし、伸縮率をパラメータ記憶部2aに
記憶する。合成したいテキストあるいは発音記号などそ
れに準ずる発音情報が合成部1に入力されると、合成部
1はこのテキストを合成するために必要な素片波形を波
形記憶部3から選択する。選択方法は、実施の形態1と
同様である。選択が行われると、波形伸縮部2bは、選
択された素片波形を波形記憶部3から読み出す。波形伸
縮部2bは、読み出された素片波形のラベルからグルー
プ分けを行い、そのグループの伸縮率をパラメータ記憶
部2aから選択する。先の例では、ラベルが「a」
「i」「u」「e」「o」である場合は伸縮率1.2、
それ以外の場合は伸縮率1.1を選択する。波形伸縮部
2bは、選択された伸縮率で素片波形を伸縮する。伸縮
された素片波形は合成部1で所望のピッチ・発声速度と
なるように並べられ、合成音声として出力される。
【0059】[実施の形態5]本発明の実施の形態5
は、実施の形態1〜3のものと基本的に同じ構成であ
る。異なる点は、波形変換部2において、素片波形を有
声音、無声音の2つのグループに分け、有声音のみを変
換している点である。
【0060】次に、図1および図2を参照して、本発明
の実施の形態5の動作について説明する。尚、以下では
実施の形態1に即して説明するが、実施の形態2、3に
即した形での実現も無論可能である。
【0061】合成したいテキストあるいは発音記号など
それに準ずる発音情報が合成部1に入力されると、合成
部1は、このテキストを合成するために必要な素片波形
を波形記憶部3から選択する。選択方法は、実施の形態
1と同様である。選択が行われると、波形伸縮部2b
は、選択された素片波形を波形記憶部3から読み出す。
波形伸縮部2bは、読み出された素片波形のラベルから
有声音、無声音を判別する。そして、有声であれば、素
片波形をパラメータ記憶部2aに記憶された伸縮率で伸
縮を行い、合成部1に出力する。一方、無声であれば、
そのまま合成部1に出力する。素片波形は合成部1で所
望のピッチ・発声速度となるように並べられ、合成音声
として出力される。
【0062】有声音は、図14の(C)のように、複数
の素片波形(1ピッチ分の波形)が並んだものとして構
成される。したがって、有声音の発声長は個数と間隔
(ピッチ周期)を変えることにより調整する。これに対
し、無声音の場合、1つの素片波形(1音素分の波形)
から構成される。よって、発声長は素片波形の長さにの
み依存する。このため、素片波形を伸縮すると、発声長
も変化する。発声長を変えないためには、例えば先に図
16(a)および(b)で示したような処理が必要とな
る。しかし、このような波形の接続、削除は接続点での
スペクトル的な不連続が起こりやすく、音質劣化につな
がる。そこで、本発明においては、無声音の伸縮を行わ
ないことで、音質劣化を抑えることができる。
【0063】[実施の形態6]図5は、本発明の実施の
形態6の構成を示すブロック図である。図5を参照し
て、本発明の実施の形態6は、実施の形態1〜5に加
え、外部からの変換パラメータの入力を受け付け、波形
変換部2に変換パラメータを指定する入力部4を有して
いる。合成部1、波形変換部2、および波形記憶部3
は、実施の形態1〜5と同様な動作をする。
【0064】入力部4は、変換パラメータの入力を受け
付け、その情報を波形変換部2中のパラメータ記憶部2
aに書き込む。ここで、変換パラメータは、1つまたは
複数指定することができる。複数指定する場合は、この
変換パラメータは、実施の形態4における素片波形のグ
ループに対応している。また、変換パラメータのうち一
部または全部が指定されなかった場合、指定されなかっ
た変換パラメータは、パラメータ記憶部2aが予め記憶
している値とする。これにより、例えば利用者が、自分
の好みの合成音を得ることができる。
【0065】次に、図5を参照して、本発明の実施の形
態6の動作について説明する。尚、以下では実施の形態
2、4に即して説明するが、他の実施に即した形での実
現も無論可能である。
【0066】合成を行う前に、入力部4を用いて伸縮率
をパラメータ記憶部2aに予め書き込む。伸縮率の指定
の方法としては、例えば、ツールバーを用いることもで
きる。合成したいテキストあるいは発音記号などそれに
準ずる発音情報が合成部1に入力されると、合成部1
は、このテキストを合成するために必要な素片波形を波
形記憶部3から選択する。選択は、実施の形態1と同様
である。選択が行われると、波形変換部2は、選択され
た素片波形を波形記憶部3から読み出して伸縮を行う。
例えば、入力部4に母音1.5、子音1.2というよう
に入力されると、波形記憶部3におけるラベルが「a」
「i」「u」「e」「o」である素片波形は伸縮率1.
5、その他は伸縮率1.2で伸縮を行う。伸縮された素
片波形は合成部1で所望のピッチ、発声速度となるよう
に並べられ、合成音声として出力される。
【0067】[実施の形態7]図6は、本発明の実施の
形態7の構成を示すブロック図である。図6を参照し
て、本発明の実施の形態7は、実施の形態1〜5に加
え、入力テキスト等の情報から変換パラメータ情報を分
離するパラメータ抽出部6を有している。合成部1、波
形変換部2、および波形記憶部3は実施の形態1〜5と
同様な動作をする。
【0068】パラメータ抽出部6は、入力テキスト中に
記された変換パラメータを抽出して波形変換部2中のパ
ラメータ記憶部2aに書き込む。変換パラメータは、入
力テキスト中に一つまたは複数記述することができる。
複数記述した場合、変換パラメータは実施の形態4にお
ける素片波形のグループに対応している。また、変換パ
ラメータのうち一部または全部が記述されなかった場
合、記述されなかった変換パラメータは、パラメータ記
憶部2aが予め記憶している値とする。これにより、前
述の入力部4を持たなくても、利用者が自分の好みの合
成音を得ることができる。
【0069】次に、図6を参照して、本発明の実施の形
態7の動作について説明する。尚、以下では実施の形態
2、4に即して説明するが、他の実施に即した形での実
現も無論可能である。
【0070】合成したいテキストあるいは発音記号など
それに準ずる発音情報がパラメータ抽出部6に入力され
ると、パラメータ抽出部6は、それをテキスト情報と伸
縮率情報に分離する。ここで、例えば「\v1.1\s
1.2次の交差点を右に曲がってください」と入力され
たとする。ここで、「\」は特殊記号、その後のアルフ
ァベットは素片波形のグループを表すラベル(v:母
音、s:子音)、その後の数字は伸縮率である。この場
合、母音の伸縮率は1.1、子音の伸縮率は1.2とい
う指定に相当する。このテキストが入力された場合、パ
ラメータ抽出部6は、伸縮率とテキストを分離し、母音
で伸縮率1.1、子音で伸縮率1.2をパラメータ記憶
部2aに、テキスト「次の交差点を右に曲がって下さ
い」を合成部1に渡す。
【0071】合成部1は、このテキストを合成するため
に必要な素片波形を波形記憶部3から選択する。選択
は、実施の形態1と同様である。選択が行われると、波
形伸縮部2bは、選択された素片波形を波形記憶部3か
ら読み出して、パラメータ記憶部2aに記憶された伸縮
率で伸縮を行う。伸縮された素片波形は合成部1で所望
のピッチ、発声速度となるように並べられ、合成音声と
して出力される。
【0072】[実施の形態8]図7は、本発明の実施の
形態8の構成を示すブロック図である。図7を参照し
て、本発明の実施の形態8は、実施の形態1〜5に加
え、変換後の素片波形とそのラベルを記憶する第2の波
形記憶部5を有している。また、実施の形態6、7と同
様に、パラメータ抽出部6、入力部4を有する構成も可
能である。このような場合の構成は、図8および図9と
なる。
【0073】次に、図7を参照して、本発明の実施の形
態8の動作について説明する。尚、以下では実施の形態
2、4に即して説明するが、他の実施に即した形での実
現も無論可能である。
【0074】実施の形態8では、伸縮率が定義された時
点(合成を行う前)に波形変換部2において波形記憶部
3から読み出した素片波形を変換し、第2の波形記憶部
5に記憶する。第2の波形記憶部5は、波形変換部2に
おいて変換された素片波形を記憶しておく。また、第2
の波形記憶部5は、ラベルも波形記憶部3のものをコピ
ーして記憶する。合成音作成の際には、合成したいテキ
ストあるいは発音記号などそれに準ずる発音情報が合成
部1に入力されると、合成部1は、このテキストを合成
するために必要な素片波形を第2の波形記憶部5から選
択する。選択は、実施の形態1と同様である。この素片
波形は合成部1で所望のピッチ・発声速度となるように
並べられ、合成音声として出力される。
【0075】このように、素片波形の変換を予め行って
おくため、実施の形態7では、合成音生成の際の計算量
の削減ならびに処理の高速化が可能である。
【0076】[実施の形態9]図10は、本発明の実施
の形態9の構成を示すブロック図である。図10を参照
して、本発明の実施の形態9は、入力を元に適当な素片
波形を編集して合成音を生成する合成部1と、素片波形
を韻律情報を用いて決定した変換パラメータで変換する
変換部7と、伸縮前の素片波形とそのラベルを記憶する
波形記憶装置部3とを有している。また、図13を参照
して、変換部7は、1つまたは複数の変換パラメータを
記憶するパラメータ記憶部2aと、パラメータ変更部7
aから得られる変換パラメータから変換を行う波形変換
部7cと、過去に変換を行った素片波形のラベルを記憶
し、これをパラメータ変更部7aに渡す進行記憶部7b
と、韻律付与部1b、進行記憶部7bからの出力を元に
パラメータ記憶部2aに記憶された変換パラメータを変
更して波形変換部7cに渡すパラメータ変更部2eとを
備えている。波形変換部7cは、図2〜図4で示した波
形変換部からパラメータ記憶部を除いた構成を取る。合
成部1は、入力テキストの構文解析を行う構文解析部1
aと、構文解析されたテキストに韻律を付与する韻律付
与部1bと、韻律を付与されたテキストから適当な素片
波形を編集・合成する波形編集部1cとを備えている。
また、実施の形態6、7と同様に、入力部4、パラメー
タ抽出部6を有する構成も可能である。このような場合
の構成は、図11および図12となる。
【0077】次に、図10および図13を参照して、本
発明の実施の形態9の動作について説明する。尚、以下
では実施の形態2、4に即して説明するが、他の実施に
即した形での実現も無論可能である。
【0078】合成したいテキストあるいは発音記号など
それに準ずる物が合成部1に入力されると、構文解析部
1aは、これに構文解析を行う。ここでは、例えば「次
の交差点を右に曲がってください」というテキストが入
力されたとすると、構文解析部1aは、「次の/交差点
を/右に/曲がって/下さい」というように形態素と呼
ばれる単位に分割する。ここで、「/」は分割の位置を
示す。次に、その出力に対応し韻律付与部1bでアクセ
ント、イントネーション、ポーズ、リズム等の韻律情報
を付加する。韻律付与部1bでは例えば構文解析部1a
の出力「次の/交差点を/右に/曲がって/下さい」に
対し、「つぎ’の/こうさてんを/みぎに/まがって/
くださ’い」という読みとアクセントを付与する。ここ
で「’」はアクセントの位置を示す。韻律付与部1bの
出力は、波形編集部1cとパラメータ変更部7aとに送
られる。パラメータ変更部7aでは、この出力をもと
に、合成音声の各部分の伸縮率を決定する。例えば、パ
ラメータ記憶部2aには、各音素毎に図18のように伸
縮率が予め記憶されていたとする。また、伸縮率を変更
する規則として、「隣り合う音素間では大きな伸縮率の
違いが起きないようにする」、「アクセントのある音素
の伸縮率は高くする」と決まっていたとする。この場
合、韻律付与部1bの出力を用いない従来の合成装置の
場合には、図19の変更前の伸縮率で各音素の素片波形
は伸縮される。これに対し、本発明では「つぎ’の/こ
うさてんを/みぎに/まがって/くださ’い」という韻
律付与部1bの出力を用いて、図19の変更1、変更2
のように伸縮率を変更する。この例では、変更1は、
「隣り合う音素間では大きな伸縮率の違いが起きないよ
うにする」という規則から、/usa/の間の/s/の
伸縮率を左右の音素/u/、/a/に近づけている。ま
た、変更2は、「アクセントのある音素は伸縮率を高く
する」という規則から、アクセントのある/i/の伸縮
率を高くしている。下線の部分が変更を施された部分で
ある。したがって、パラメータ変更部7aは、図19の
変更2を最終的な伸縮率として保持する。波形編集部1
cは、テキストを合成するために必要な素片波形を波形
記憶部3から選択する。素片波形が選択されると、進行
記憶部7bは、選択された素片波形のラベルを蓄える。
そして、蓄えられたラベルをパラメータ変更部7aに出
力する。パラメータ変更部7aは、この蓄えられたラベ
ルから、現在、図19のどの部分を処理しているかを把
握し、その部分の伸縮率を波形変換部7cに渡す。波形
変換部7cは、パラメータ変更部7aから渡された伸縮
率で素片波形を伸縮し、波形編集部1cに渡す。波形編
集部1cは、この素片波形を所望のピッチ、発声長にな
るように並び変えて、合成音として出力する。
【0079】実施の形態9は、他の実施の形態とは異な
り、同じ素片波形が韻律情報の違いにより異なる変換パ
ラメータで変換されるので、より詳細に声質を変更する
ことが可能となることである。
【0080】
【発明の効果】本発明による音声合成装置は、以下の効
果を奏する。
【0081】第1に、従来方式とは異なり、素片波形を
編集する際、発声速度・ピッチを変換に合わせて計算す
る必要がない。
【0082】第2に、素片波形スペクトルを周波数シフ
トすることで声質をより多彩に変化させることができ
る。
【0083】第3に、変換が音質劣化につながるような
音韻の変換を行わない事によって合成音声の音質劣化を
抑えることができる。
【0084】第4に、音韻の種類や、韻律情報に応じて
変換パラメータを決定する事により、声質をより多彩に
変化させることができる。
【0085】第5に、予め変換を行った素片波形を記憶
する波形記憶部を持ち、合成時に変換を行わないため、
合成時の計算量を最小限に抑えられる。
【図面の簡単な説明】
【図1】本発明の実施の形態1〜5による音声合成装置
の構成を示すブロック図である。
【図2】本発明の実施の形態1を示す図であり、図1に
示す波形変換部を示すブロック図である。
【図3】本発明の実施の形態2を示す図であり、図1に
示す波形変換部を示すブロック図である。
【図4】本発明の実施の形態3を示す図であり、図1に
示す波形変換部を示すブロック図である。
【図5】本発明の実施の形態6による音声合成装置の構
成を示すブロック図である。
【図6】本発明の実施の形態7による音声合成装置の構
成を示すブロック図である。
【図7】本発明の実施の形態8による音声合成装置の構
成を示すブロック図である。
【図8】本発明の実施の形態8の他の例の構成を示すブ
ロック図である。
【図9】本発明の実施の形態8のさらに他の例の構成を
示すブロック図である。
【図10】本発明の実施の形態9による音声合成装置の
構成を示すブロック図である。
【図11】本発明の実施の形態9の他の例の構成を示す
ブロック図である。
【図12】本発明の実施の形態9のさらに他の例の構成
を示すブロック図である。
【図13】図10に示す変換部を示すブロック図であ
る。
【図14】本発明の有声音波形伸縮時の動作を説明する
ための図である。
【図15】比較例の有声音波形伸縮時の動作を説明する
ための図である。
【図16】本発明の実施の形態1による音声合成装置に
おける無声音波形の時間長を長く/短くする方法の一例
を示す図である。
【図17】本発明の実施の形態2による音声合成装置に
おける素片波形スペクトルの伸縮の様子を示す図であ
る。
【図18】本発明の実施の形態9による音声合成装置に
おける音素毎の伸縮率の一例を示す表図である。
【図19】本発明の実施の形態9による音声合成装置に
おける伸縮率の変更例を示す表図である。
【図20】従来例による音声合成装置の構成を示すブロ
ック図である。
【図21】図20に示す音声合成装置の動作を説明する
ための図である。
【符号の説明】
1 合成部 1a 構文解析部 1b 韻律付与部 1c 波形編集部 2 波形変換部 2a パラメータ記憶部 2b 波形伸縮部 2c 周波数変換部 2d 周波数シフト部 2e 周波数逆変換部 3 波形記憶部 4 入力部 5 第2の波形記憶部 6 パラメータ抽出部 7 変換部 7a パラメータ変更部 7b 進行記憶部 7c 波形変換部

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 有声音については1ピッチ分の波形であ
    り、無声音については1音素分の波形である、合成の最
    小単位としての素片波形を記憶する波形記憶部と、前記
    波形記憶部に記憶された素片波形を変換する波形変換部
    と、前記波形変換部にて変換された素片波形を編集して
    合成音を生成する合成部とを有する音声合成装置におい
    て、 前記波形変換部にて各素片波形を個々に変換し、変換さ
    れた素片波形を用いて合成音声を生成することで合成音
    の声質をピッチおよび発声速度と独立に変更することを
    特徴とする音声合成装置。
  2. 【請求項2】 有声音については1ピッチ分の波形であ
    り、無声音については1音素分の波形である、合成の最
    小単位としての素片波形を記憶する波形記憶部と、前記
    波形記憶部に記憶された素片波形を変換する波形変換部
    と、前記波形変換部にて変換された素片波形を編集して
    合成音を生成する合成部とを有する音声合成装置におい
    て、前記波形変換部は、素片波形を時間伸縮する波形伸
    縮部と、前記伸縮部における時間伸縮の割合を表すパラ
    メータを記憶するパラメータ記憶部とを備え、前記波形
    伸縮部にて素片波形を時間伸縮することによって合成音
    の声質を変更することを特徴とする音声合成装置。
  3. 【請求項3】 有声音については1ピッチ分の波形であ
    り、無声音については1音素分の波形である、合成の最
    小単位としての素片波形を記憶する波形記憶部と、前記
    波形記憶部に記憶された素片波形を変換する波形変換部
    と、前記波形変換部にて変換された素片波形を編集して
    合成音を生成する合成部とを有する音声合成装置におい
    て、前記波形変換部は、素片波形をフーリエ変換する周
    波数変換部と前記周波数変換部でフーリエ変換された素
    片波形スペクトルの周波数をシフトする周波数シフト部
    と、前記周波数シフト部で周波数シフトする際に必要な
    パラメータを記憶したパラメータ記憶部と、前記周波数
    シフト部で周波数シフトされた素片波形スペクトルをフ
    ーリエ逆変換する周波数逆変換部とを備え、前記周波数
    シフト部にて各素片波形スペクトルを周波数シフトする
    ことで合成音の声質を変更することを特徴とする音声合
    成装置。
  4. 【請求項4】 有声音については1ピッチ分の波形であ
    り、無声音については1音素分の波形である、合成の最
    小単位としての素片波形を記憶する波形記憶部と、前記
    波形記憶部に記憶された素片波形を変換する波形変換部
    と、前記波形変換部にて変換された素片波形を編集して
    合成音を生成する合成部とを有する音声合成装置におい
    て、前記波形変換部は、素片波形をラプラス変換する周
    波数変換部と、前記周波数変換部でラプラス変換された
    素片波形スペクトルの周波数をシフトする周波数シフト
    部と、前記周波数シフト部で周波数シフトする際に必要
    なパラメータを記憶するパラメータ記憶部と、前記周波
    数シフト部で周波数シフトされた素片波形スペクトルを
    逆ラプラス変換する周波数逆変換部とを備え、前記周波
    数シフト部にて各素片波形スペクトルを周波数シフトす
    ることで合成音の声質を変更することを特徴とする音声
    合成装置。
  5. 【請求項5】 有声音については1ピッチ分の波形であ
    り、無声音については1音素分の波形である、合成の最
    小単位としての素片波形を記憶する波形記憶部と、前記
    波形記憶部に記憶された素片波形を変換する波形変換部
    と、前記波形変換部にて変換された素片波形を編集して
    合成音を生成する合成部とを有する音声合成装置におい
    て、前記波形変換部は、記波形記憶部に記憶された素片
    波形の標本値列ベクトルに行列を積算する行列演算部
    と、行列が積算された素片波形の標本値列ベクトルに行
    列を積算する行列演算部と、前記行列演算部において用
    いる行列を記憶するパラメータ記憶部とを備え、素片波
    形の標本値列ベクトルに行列を積算することで素片波形
    を変換することを特徴とする音声合成装置。
  6. 【請求項6】 請求項1乃至5のいずれかに記載の音声
    合成装置において、素片波形を複数のグループに分け、
    該グループ毎に異なるパラメータで変換をすることを特
    徴とした音声合成装置。
  7. 【請求項7】 請求項6の音声合成装置において、素片
    波形を有声音と無声音の2つに分け、有声音のみを変換
    することを特徴とする音声合成装置。
  8. 【請求項8】 請求項1乃至7のいずれかに記載の音声
    合成装置において、さらに、パラメータの入力部を有
    し、パラメータを任意に設定できることを特徴とした音
    声合成装置。
  9. 【請求項9】 請求項1乃至7のいずれかに記載の音声
    合成装置において、前記波形変換部は、入力テキスト中
    に明示されたパラメータを用いて素片波形を変換するこ
    とを特徴とする音声合成装置。
  10. 【請求項10】 請求項1乃至9のいずれかに記載の音
    声合成装置において、前記波形変換部で変換された素片
    波形を記憶する第2の波形記憶部を備え、前記第2の波
    形記憶部に記憶された素片波形を用いて合成音声を生成
    することを特徴とする音声合成装置。
  11. 【請求項11】 請求項1乃至9のいずれかに記載の音
    声合成装置において、前記波形変換部は、前記合成部の
    韻律情報からパラメータを変更することを特徴とする音
    声合成装置。
JP9112642A 1997-04-30 1997-04-30 音声合成装置 Pending JPH10301599A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9112642A JPH10301599A (ja) 1997-04-30 1997-04-30 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9112642A JPH10301599A (ja) 1997-04-30 1997-04-30 音声合成装置

Publications (1)

Publication Number Publication Date
JPH10301599A true JPH10301599A (ja) 1998-11-13

Family

ID=14591848

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9112642A Pending JPH10301599A (ja) 1997-04-30 1997-04-30 音声合成装置

Country Status (1)

Country Link
JP (1) JPH10301599A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002311980A (ja) * 2001-04-18 2002-10-25 Nec Corp 音声合成方法、音声合成装置、半導体装置及び音声合成プログラム
JP2006126556A (ja) * 2004-10-29 2006-05-18 Nippon Telegr & Teleph Corp <Ntt> 音声波形データベース構築方法、この方法を実施する装置およびプログラム
JP2013033140A (ja) * 2011-08-02 2013-02-14 Nippon Hoso Kyokai <Nhk> 音声処理装置およびそのプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002311980A (ja) * 2001-04-18 2002-10-25 Nec Corp 音声合成方法、音声合成装置、半導体装置及び音声合成プログラム
JP2006126556A (ja) * 2004-10-29 2006-05-18 Nippon Telegr & Teleph Corp <Ntt> 音声波形データベース構築方法、この方法を実施する装置およびプログラム
JP4630038B2 (ja) * 2004-10-29 2011-02-09 日本電信電話株式会社 音声波形データベース構築方法、この方法を実施する装置およびプログラム
JP2013033140A (ja) * 2011-08-02 2013-02-14 Nippon Hoso Kyokai <Nhk> 音声処理装置およびそのプログラム

Similar Documents

Publication Publication Date Title
JP4302788B2 (ja) 音声合成用の基本周波数テンプレートを収容する韻律データベース
US7016841B2 (en) Singing voice synthesizing apparatus, singing voice synthesizing method, and program for realizing singing voice synthesizing method
Bonada et al. Synthesis of the singing voice by performance sampling and spectral models
EP1239457B1 (en) Voice synthesizing apparatus
EP1160764A1 (en) Morphological categories for voice synthesis
JPH10153998A (ja) 補助情報利用型音声合成方法、この方法を実施する手順を記録した記録媒体、およびこの方法を実施する装置
JPS62160495A (ja) 音声合成装置
US6212501B1 (en) Speech synthesis apparatus and method
JP2002202789A (ja) テキスト音声合成装置およびプログラム記録媒体
JP3576840B2 (ja) 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体
JP2761552B2 (ja) 音声合成方法
JP2009133890A (ja) 音声合成装置及びその方法
JPH0887297A (ja) 音声合成システム
JPH10301599A (ja) 音声合成装置
JPH08335096A (ja) テキスト音声合成装置
JP3109778B2 (ja) 音声規則合成装置
JPH1165597A (ja) 音声合成装置、音声合成及びcg合成出力装置、ならびに対話装置
JPS5972494A (ja) 規則合成方式
Bonada et al. Sample-based singing voice synthesizer using spectral models and source-filter decomposition
JP3081300B2 (ja) 残差駆動型音声合成装置
JPH11249676A (ja) 音声合成装置
JP2987089B2 (ja) 音声素片作成方法および音声合成方法とその装置
JP2703253B2 (ja) 音声合成装置
JPH11352997A (ja) 音声合成装置およびその制御方法
JP2004206144A (ja) 基本周波数パタン生成方法、及びプログラム記録媒体

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000712