JPH1091191A - 音声合成方法 - Google Patents

音声合成方法

Info

Publication number
JPH1091191A
JPH1091191A JP8246718A JP24671896A JPH1091191A JP H1091191 A JPH1091191 A JP H1091191A JP 8246718 A JP8246718 A JP 8246718A JP 24671896 A JP24671896 A JP 24671896A JP H1091191 A JPH1091191 A JP H1091191A
Authority
JP
Japan
Prior art keywords
frame
unit
synthesis
mapping function
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8246718A
Other languages
English (en)
Inventor
Takehiko Kagoshima
岳彦 籠嶋
Masami Akamine
政巳 赤嶺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP8246718A priority Critical patent/JPH1091191A/ja
Publication of JPH1091191A publication Critical patent/JPH1091191A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】自然性を損なうことなく任意の音韻継続時間長
の合成音声を生成できる音声合成方法を提供する。 【解決手段】合成しようとする音声信号の性質を表す第
1のフレーム単位の合成パラメータ(音源パラメータ2
04、声道パラメータ205)を用いて音声信号109
を合成する音声合成方法において、単位素片記憶部22
に合成パラメータとなる第2のフレーム単位の単位素片
を記憶しておき、入力された音韻継続時間長113の情
報に従ってマッピング関数生成部61で生成されたマッ
ピング関数を合成フレーム選択情報生成部63に与え
て、第1のフレームと第2のフレームとの対応付けを行
い、かつマッピング関数に基づいて第1のフレームに対
応する第2のフレームの単位素片を間引くかまたは繰り
返すことにより、合成パラメータを生成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、テキスト音声合成
のための音声合成方法に係り、特に音韻記号列、ピッチ
および音韻継続時間長などの情報から音声信号を生成す
る音声合成方法に関する。
【0002】
【従来の技術】任意の文章から人工的に音声信号を作り
出すことをテキスト音声合成という。テキスト音声合成
システムは、一般的に図8に示されるように、言語処理
部1、音韻処理部2および音声合成器3の3つの要素か
ら構成される。入力されたテキスト115は、まず言語
処理部1において形態素解析や構文解析などが行われ、
次に韻律処理部2においてアクセントやイントネーショ
ンの処理が行われて、音韻記号列111、ピッチパター
ン112および音韻継続時間長113などの情報が出力
される。最後に、音声合成器3で音節、音素、1ピッチ
区間などの基本となる小さな単位(単位素片)の特徴パ
ラメータを音韻記号列、ピッチパターン、音韻継続時間
長などの情報に従って選択し、ピッチや継続時間長を制
御して接続することによって合成音声信号109を生成
する。
【0003】自然音声では、発話の速度、意味内容、前
後の音韻などの影響で、音韻の継続時間長が様々に変化
している。そこで、自然音声に近い高品質な音声を合成
するためには、任意の継続時間長の音声を合成器によっ
て合成することが可能でなければならない。
【0004】このような継続時間長を変化させることが
できる音声合成器として、特開昭61−290499
「発声速度可変の音声合成装置」が知られている。この
音声合成器の原理は、音声の定常部において単位素片の
フレームを間引いて合成フレーム列を構成するととも
に、合成フレームのフレーム長を一様に変化させること
によって継続時間長を変化させるものである。
【0005】この従来の音声合成器の構成について図9
を用いて説明する。図9において、フレーム平均ピッチ
生成部28は、ピッチパターン112よりフレーム平均
ピッチ周期201を求めて出力する。素片情報記憶部2
5は、単位素片フレームのフレーム数、定常部の範囲お
よび過渡部の範囲などの素片情報を記憶しており、入力
された音韻記号列111に従って、対応する素片の素片
情報207を出力する。フレーム長生成部26は、素片
情報207に基づいて継続時間長が音韻継続時間長11
3と等しくなるようにフレーム長202と定常部伸縮率
208を求めて出力する。合成フレーム選択情報生成部
27は、素片情報207と定常部伸縮率208に従って
合成フレームのフレーム選択情報203を出力する。
【0006】単位素片記憶部22は、例えば合成単位を
音素とすると、全ての母音および全ての子音に対応する
単位素片の情報を記憶している。各単位素片は、例えば
当該音韻の音声信号を一定のフレーム周期で分析するこ
とによって生成され、複数の単位素片フレームにより構
成される。各単位素片フレームは音源パラメータおよび
声道パラメータから構成されており、フレーム選択情報
203に従って選択されたフレームの音源パラメータ2
04と声道パラメータ205が合成フレームの合成パラ
メータとして出力される。
【0007】音源生成部23は、フレーム平均ピッチ周
期201と音源パラメータ204に従って、フレーム長
202の長さの音源信号206を出力する。声道フィル
タ部24は、声道パラメータ205によって特性が決定
される声道フィルタを音源信号206で駆動することに
より合成音声信号109を生成する。
【0008】フレーム長生成部26の詳細な動作につい
て説明する。素片情報207より得られる当該単位素片
の定常部フレーム数および過渡部フレーム数をそれぞれ
a,nb とし、音韻継続時間長113をTとすると、
合成フレーム長202(f)と定常部伸縮率208
(v)は、次式を満たすように決定される。
【0009】 (vna +nb )f=T (1) 合成フレーム情報生成部27では、単位素片フレームの
うち定常部のフレームについて、定常部伸縮率208に
従って間引きまたは繰り返しを行って合成フレーム列を
生成し、各フレームのフレーム選択情報203を出力す
る。このようにして、任意の音韻継続時間長の音声を合
成することが可能である。
【0010】
【発明が解決しようとする課題】上述した従来の音声合
成器では、音声の定常部の間引きと過渡部の伸縮によっ
て音韻継続時間長の変化を実現しているが、自然音声に
おいては必ずしもこのようなモデルで音韻継続時間の異
なる音声を表すことはできない。すなわち、従来の音声
合成器は明瞭性を保つには有効であるが、そもそも自然
音声では定常部と過渡部の境界は明確ではなく、性質が
常に滑らかに変化しているため、過渡部と定常部に分類
して異なる処理を行うことは、自然性が低下する原因と
なる。
【0011】また、自然音声を分析することによって単
位素片を生成する場合、合成単位のフレームを過渡部と
定常部に分類する必要があり、このような分類は視察に
よって行わざるを得ないため、多大な労力を必要とす
る。
【0012】本発明は、このような従来の問題点を解決
するためになされたもので、自然性を損なうことなく任
意の音韻継続時間長の合成音声を生成できる音声合成方
法を提供することを目的とする。
【0013】
【課題を解決するための手段】上記の課題を解決するた
め、本発明は合成しようとする音声信号の性質を表す第
1のフレーム単位の合成パラメータを用いて音声信号を
合成するに際し、合成パラメータとなる第2のフレーム
単位の単位素片を記憶しておき、入力された音韻継続時
間長の情報に従って生成されたマッピング関数に基づい
て第1のフレームと第2のフレームとの対応付けを行
い、第1のフレームに対応する第2のフレームの単位素
片を合成パラメータとして生成することを特徴とする。
【0014】ここで、「合成パラメータ」とは、声道特
性、音源特性、1ピッチ長の音声波形など、音声信号の
性質を表すパラメータを表している。また、子音をC、
母音をVでそれぞれ表すと、「単位素片」とは、C,
V,CV,VCV,CVCなどの合成単位に対応して生
成された合成パラメータの系列を表すものとする。
【0015】本発明の第1の態様では、第1のフレーム
と第2のフレームとの対応付けを行った後、マッピング
関数に基づいて第1のフレームに対応する第2のフレー
ムの単位素片を間引くかまたは繰り返すことにより、合
成パラメータを生成する。
【0016】第1のフレームと第2のフレームとの対応
付けを行うマッピング関数は、音韻継続時間長に基づい
て生成されるため、このマッピング関数に基づいて第1
のフレームに対応する第2のフレームの単位素片を間引
くかまたは繰り返すことで合成パラメータを生成すれ
ば、合成音声信号の継続時間長が変化する。
【0017】本発明の第2の態様では、第1のフレーム
と第2のフレームとの対応付けを行うとともに、マッピ
ング関数に基づいて第1のフレームのフレーム長を変化
させ、第1のフレームに対応する第2のフレームの単位
素片を合成パラメータとして生成する。
【0018】このようにマッピング関数に基づいて第1
のフレームのフレーム長を変化させることによっても、
合成音声信号の継続時間長が変化する。本発明の第3の
態様では、第1および第2の態様を組み合わせ、第1の
フレームと第2のフレームとの対応付けを行った後、単
位素片の素片長が音韻継続時間長より小さい場合は第1
のフレームに対応する第2のフレームの単位素片を間引
くかまたは繰り返すことにより合成パラメータを生成
し、単位素片の素片長が音韻継続時間長以上の場合には
マッピング関数に基づいて第1のフレームのフレーム長
を設定し、第1のフレームに対応する第2のフレームの
単位素片を合成パラメータとして生成する。
【0019】このように本発明によると、音声そのもの
でなく合成パラメータを変化させることで音韻時間長を
変化させるため、マッピング関数として例えば傾きが音
韻境界付近で予め定められた略一定の値となる関数を用
いたり、マッピング関数を単位素片の過渡部と定常部を
指定する情報および音韻継続時間長とに従って生成する
ことにより、単位素片の伸縮度合いが連続的に変化する
ことになるため、音韻継続時間長の変化による合成音声
の自然性の低下がなく、音質の良好な音声合成が可能と
なる。
【0020】
【発明の実施の形態】以下では、音韻(C,V)を合成
単位とする規則合成器に本発明を適用した場合の実施形
態について説明するが、本発明はこのような合成単位に
限定されるものではなく、その他の合成単位の場合も適
用することが可能である。
【0021】(第1の実施形態)図1に、本発明の第1
の実施形態に係る音声合成器の構成を示す。本実施形態
は、合成しようとする音声信号の性質を表す第1のフレ
ーム(合成フレーム)単位の合成パラメータを用いて音
声信号を生成する場合、合成フレームのフレーム長を一
定とし、合成フレームとなる第2のフレーム(単位素片
フレーム)の間引きまたは繰り返しによって、合成音声
の音韻継続時間長を変更するようにしたものである。
【0022】本実施形態において、フレーム平均ピッチ
生成部28、単位素片記憶部22、音源生成部23およ
び声道フィルタ部24の動作は、図9に示した従来の音
声合成器と同様である。すなわち、フレーム平均ピッチ
生成部28は、ピッチパターン112よりフレーム平均
ピッチ周期201を求めて出力する。
【0023】単位素片記憶部22は、例えば合成単位を
音素とすると、全ての母音および全ての子音に対応する
単位素片の情報を記憶している。各単位素片は、例えば
当該音韻の音声信号を一定のフレーム周期で分析するこ
とによって生成され、複数のフレーム(以下、単位素片
フレームという)単位で構成される。単位素片フレーム
は、音源パラメータおよび声道パラメータから構成され
ており、単位素片記憶部22はフレーム選択情報203
に従って選択された単位素片フレームの音源パラメータ
204と声道パラメータ205を出力する。
【0024】音源生成部23は、フレーム平均ピッチ周
期201と音源パラメータ204に従って、フレーム長
202の長さの音源信号206を出力する。声道フィル
タ部24は、声道パラメータ205によって特性が決定
される声道フィルタを音源信号206で駆動することに
より、合成音声信号109を生成する。
【0025】また、素片情報記憶部64は、入力された
音韻記号列111に従って対応する素片の素片情報60
1を出力するが、この素片情報601には単位素片フレ
ームのフレーム数、単位素片フレームのフレーム長など
の情報が含まれ、定常部の範囲と過渡部の範囲の情報は
必ずしも含まれない点で従来の音声合成器と異なってい
る。
【0026】次に、本実施形態の特徴的な構成である時
間長制御部60について説明する。時間長制御部60
は、マッピング関数生成部61、フレーム長生成部62
および合成フレーム選択情報生成部63から構成されて
いる。マッピング関数生成部61は、素片情報601と
音韻継続時間長113に従って、合成フレーム列に対応
する時間の変数から単位素片のフレームに対応する時間
の変数へのマッピング関数602を生成する。フレーム
長生成部62は、音韻継続時間長113と素片情報60
1に従って、合成フレームのフレーム数603およびフ
レーム長202を求める。合成フレーム選択情報生成部
63は、フレーム数がフレーム数603で表される合成
フレームと、フレーム数がフレーム情報601で表され
る単位素片フレームをマッピング関数602を用いて対
応付けることによって合成フレーム列を生成し、各合成
フレームのフレーム選択情報203を出力する。
【0027】以下、各構成要素の詳細な説明に当たり、
記号を次のように定義する。 単位素片フレームのフレーム数:n′ 合成フレームのフレーム数 :n 単位素片フレームのフレーム長:f′ 合成フレームのフレーム長 :f 単位素片長 :T′=n′f′ 音韻継続時間長 :T 合成フレーム :Fi ,(i=1,2,3,…,n) 単位素片フレーム :F′j ,(j=1,2,3,…,n′) フレーム長生成部62は、合成フレームのフレーム数n
およびフレーム長fを次式に従って求める。
【0028】
【数1】
【0029】ただし、記号[]は整数に丸める演算を表
すものとする。マッピング関数生成部61は、合成フレ
ーム列に対応する時間の変数tから単位素片のフレーム
に対応する時間の変数t′へのマッピング関数t′=m
(t)を生成する。マッピング関数m(t)は、定義域
が0<t<T、値域が0<m(t)<T′の関数であ
る。また、マッピング関数m(t)は以下の条件式を満
たさなければならない。
【0030】
【数2】
【0031】式(6)は、関数m(t)が単調増加関数
であることを表している。m(t)の導関数m′(t)
は、マッピング関数m(t)の傾きに対応するため、単
位素片の伸縮の度合を表している。すなわち、m′
(t)>1の区間では単位素片のフレームが間引かれ、
m′(t)<1の区間では単位素片のフレームが繰り返
されれる。式(4)(5)(6)の条件を満たす関数の
例を以下に示す。
【0032】
【数3】
【0033】m1 (t)の導関数m′1 (t)は、0≦
t≦Tにおいて常に0以上となり、式(6)を満たして
いる。また、m′1 (t)には次のような特徴がある。 m′1 (0)=1 (8) m′1 (T)=1 (9) この式は、音韻の境界では単位素片を伸縮させないこと
を表している。すなわち、式(7)のマッピング関数m
1 (t)は、音韻の境界付近では単位素片の伸縮の度合
が小さく、音韻の中央部では伸縮の度合が大きく、かつ
伸縮の度合が連続的に変化するような関数である。
【0034】合成フレーム選択情報生成部63は、合成
フレームFi ,(i=1,2,3,…,n)と単位素片
フレームF′j ,(j=1,2,3,…,n′)をマッ
ピング関数m(t)を用いて対応付ける。合成フレーム
と単位素片フレームの対応付けは、各合成フレームのフ
レーム中心時刻をm(t)によってマッピングし、その
時刻が含まれる単位素片フレームとそれぞれ対応付ける
ことによって行う。
【0035】
【数4】
【0036】次に、本実施形態による合成フレーム列の
生成例を以下のパラメータの場合について、図2を用い
て説明する。 単位素片フレーム数:n′=12 単位素片フレーム長:f′=10msec 単位素片長 :T′=n′f′=120msec 音韻継続時間長 :T=45msec 式(7)にT=45,T′=120を代入することによ
って、マッピング関数m′1 (t)は以下のように求め
らる。
【0037】
【数5】 次に、合成フレーム数および合成フレーム長は、式
(2)(3)より以下のように求められる。
【0038】
【数6】 式(11)を用いてフレームをマッピングする。
【0039】
【数7】
【0040】以上の結果から、F1 =F′1 ,F2
F′3 ,F3 =F′6 ,F4 =F′10,F5 =F′12
なる。また、本実施形態の変形として、音韻の種類によ
って異なる種類のマッピング関数を用いることも可能で
ある。例えば、閉鎖区間(無音区間)に続く破裂区間
(有音区間)によって構成される無声破裂音などの場
合、なるべく閉鎖区間で伸縮させることが望ましいた
め、後ろほど伸縮の度合が小さくなるようなマッピング
関数を用いればよい。
【0041】(第2の実施形態)図3に、本発明の第2
の実施形態に係る音声合成器の構成を示す。本実施形態
は、単位素片フレームの間引き/繰り返しは行わず、合
成フレームのフレーム長を変化させることによって、合
成音声の継続時間長を変化させるようにしたものであ
る。すなわち、合成フレーム数nは単位素片フレームの
フレーム数n′と等しく、単位素片フレームはそのまま
合成フレーム列に対応する。
【0042】本実施形態において、フレーム平均ピッチ
生成部28、単位素片記憶部22、音源生成部23、声
道フィルタ部24および素片情報記憶部64の動作は、
図1に示した第1の実施形態の場合と同様であるため、
同一の参照符号を付して説明を省略する。
【0043】本実施形態の特徴的な構成である時間長制
御部70について説明する。まず、マッピング関数生成
部71は、素片情報601と音韻継続時間長113に従
って、単位素片のフレームに対応する時間の変数から合
成フレーム列に対応する時間の変数へのマッピング関数
701を生成する。フレーム長生成部72は、マッピン
グ関数701と素片情報601に従って、合成フレーム
のフレーム長202を求める。合成フレーム選択情報生
成部73は、単位素片フレームのフレーム選択情報20
3を順次出力する。
【0044】以下、各構成要素の詳細な説明に当たり、
記号を次のように定義する。 単位素片フレームのフレーム数:n′ 合成フレームのフレーム数 :n 単位素片フレームのフレーム長:f′ 合成フレームのフレーム長 :fi ,(i=1,2,3,…,n) 単位素片長 :T′=n′f′ 音韻継続時間長 :T 合成フレーム :Fi ,(i=1,2,3,…,n) 単位素片のフレーム :F′j ,(j=1,2,3,…,n) ただし、本実施形態においては単位素片フレームの間引
き/繰り返しを行わないため、次式の関係が成立する。 n=n′ (20) Fi =F′i (i=1,2,…,n) (21) マッピング関数生成部71は、単位素片フレームに対応
する時間の変数t′から合成フレーム列に対応する時間
の変数tへのマッピング関数t=r(t′)を生成す
る。マッピング関数r(t′)は、定義域が0<t′<
T′,値域が0<r(t′)<Tの関数である。また、
r(t′)は以下の条件式を満たさなければならない。
【0045】
【数8】
【0046】式(24)はr(t′)が単調増加関数で
あることを表している。r(t′)の導関数r′
(t′)は、マッピング関数r(t′)の傾きに対応す
るため、単位素片の伸縮の度合を表している。すなわ
ち、r′(t′)<1の区間では合成フレームのフレー
ム長が単位素片フレームのフレーム長よりも短くなり、
r′(t′)>1の区間では逆に長くなる。式(22)
(23)(24)の条件を満たす関数の例を以下に示
す。
【0047】
【数9】
【0048】r1 (t′)の導関数r′1 (t′)は、
0≦t′≦Tにおいて常に0以上となり、式(24)を
満している。また、r′1 (t′)には次のような特徴
がある。
【0049】 r′1 (0)=1 (26) r′1 (T)=1 (27) この式は、音韻の境界では単位素片を伸縮させないこと
を表している。すなわち、式(25)のマッピング関数
は、音韻の境界付近では単位素片の伸縮の度合が小さ
く、音韻の中央部では伸縮の度合が大きく、かつ伸縮の
度合が連続的に変化するような関数である。
【0050】フレーム長生成部72は、合成フレームの
フレーム長fi ,(i=1,2,…,n)をマッピング
関数r(t′)を用いて生成する。合成フレームのフレ
ーム長fi は、次式より求められる。
【0051】 fi =r(f′i)−r(f′(i−1))(i=1,2,…,n) (28) 次に、本実施形態による合成フレーム列の生成例を以下
のパラメータの場合について、図4を用いて説明する。
ただし、図2との比較のため図4は横軸をt、縦軸を
t′として描いている。
【0052】 単位素片フレームのフレーム数:n′=5 単位素片フレームのフレーム長:f′=10msec 単位素片長 :T′=n′f′=50msec 音韻継続時間長 :T=120msec 式(25)にT=120,T′=50を代入することに
より、マッピング関数は以下のように求められる。
【0053】
【数10】
【0054】次に、合成フレーム長は式(28)より以
下のように求められる。 f1 =17.28[msec] (30) f2 =27.36[msec] (31) f3 =30.72[msec] (32) f4 =27.36[msec] (33) f5 =17.28[msec] (34) また、本実施形態の変形として、定常部の範囲と過渡部
の範囲の情報を素片情報に含めて、定常部の範囲と過渡
部の範囲の情報と音韻継続時間長よりマッピング関数を
求めることも可能である。マッピング関数としては、例
えば図5で示されるような、過渡部で傾きが常に一定と
なり、定常部で傾きが滑らかに変化するような関数t=
2 (t′)を用いることができる。
【0055】(第3の実施形態)図6に、本発明の第3
の実施形態に係る音声合成器の構成を示す。本実施形態
は、単位素片の素片長が継続時間長よりも小さい場合は
第1の実施形態と同様に動作し、単位素片の素片長が継
続時間長以上の場合は第2の実施形態と同様に動作する
ものである。
【0056】本実施形態において、フレーム平均ピッチ
生成部28、単位素片記憶部22、音源生成部23、声
道フィルタ部24、素片情報記憶部64、時間長制御部
60および時間長制御部70の動作は、図1に示した第
1の実施形態および図3に示した第2の実施形態の場合
と同様であるため、同一の参照符号を付して説明を省略
する。
【0057】モード選択部81は、素片情報601と音
韻継続時間長113より、単位素片の素片長と音韻継続
時間長を比較してモード選択情報801を出力する。単
位素片の素片長をT′とし、音韻継続時間長をTとする
と、このモード選択情報801に従って、T>T′の場
合には時間長制御部60が選択され、T≦T′の場合に
は時間長制御部70が選択される。
【0058】第1の実施形態では、T<T′の場合にフ
レーム間引きによる情報欠落の可能性があり、また第2
の実施形態では、T>T′の場合にフレーム長が長くな
り過ぎてピッチ周期の変化が粗くなる可能性があるが、
本実施形態では、第1および第2の実施形態を組み合わ
せたことにより、情報欠落やピッチ周期の変化が粗くな
ることがなくなるため、より良好な合成音声が得られ
る。
【0059】(第4の実施形態)図7に、本発明の第4
の実施形態に係る音声合成器の構成を示す。本実施形態
は、第1の実施形態におけるマッピング関数生成部61
をマッピング関数選択部81およびマッピング関数記憶
部82で置き換えたものである。
【0060】本実施形態において、フレーム平均ピッチ
生成部28、単位素片記憶部22、音源生成部23、声
道フィルタ部24、素片情報記憶部64、フレーム長生
成部62、合成フレーム選択情報生成部63の動作は、
図1に示した第1の実施形態の場合と同様であるため、
同一の参照符号を付して説明を省略する。
【0061】マッピング関数記憶部82は、複数のマッ
ピング関数を記憶しており、マッピング関数選択情報8
01に従って選択されたマッピング関数602を出力す
る。マッピング関数選択部81は、マッピング関数記憶
部82に記憶されているマッピング関数の中から、素片
情報601と音韻継続時間長113に従って、適したマ
ッピング関数を選択し、マッピング関数選択情報801
を出力する。
【0062】
【発明の効果】以上説明したように、本発明によれば合
成パラメータとなる第2のフレーム単位の単位素片を記
憶しておき、入力された音韻継続時間長の情報に従って
生成されたマッピング関数に基づいて第1のフレームと
第2のフレームとの対応付けを行い、第1のフレームに
対応する第2のフレームの単位素片を合成パラメータと
して生成して、この合成パラメータを用いて音声信号を
合成することにより、任意の継続時間長の音声を合成す
ることが可能であって、しかも単位素片の伸縮の度合を
連続的に変化させることができるため、自然性にすぐれ
た合成音声を得ることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態を示すブロック図
【図2】本発明の第1の実施形態における合成フレーム
情報生成の一例を表す模式図
【図3】本発明の第2の実施形態を示すブロック図
【図4】第2の実施形態における合成フレーム情報生成
の一例を表す模式図
【図5】第2の実施形態における合成フレーム情報生成
の他の例を表す模式図
【図6】本発明の第3の実施形態を示すブロック図
【図7】本発明の第4の実施形態を示すブロック図
【図8】テキスト音声合成システムの構成を表すブロッ
ク図
【図9】従来の音声合成器を示すブロック図
【符号の説明】
1…言語処理部 2…韻律処理部 3…合成器 61,71…マッピング関数生成部 22…単位素片記憶部 23…音源生成部 24…声道フィルタ部 25,64…素片情報記憶部 26,62,72…フレーム長生成部 27,63,73…合成フレーム選択情報生成部 28…フレーム平均ピッチ生成部 60,70,80…時間長制御部 81…マッピング関数選択部 82…マッピング関数記憶部 109…合成音声信号 111…音韻記号列 112…ピッチパターン 113…音韻継続時間長 201…フレーム平均ピッチ 202…合成フレームのフレーム長 203…合成フレームのフレーム選択情報 204…音源パラメータ 205…声道パラメータ 206…音源信号 601…素片情報 602…マッピング関数 603…合成フレームのフレーム数

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】合成しようとする音声信号の性質を表す第
    1のフレーム単位の合成パラメータを用いて音声信号を
    合成する音声合成方法において、 前記合成パラメータとなる第2のフレーム単位の単位素
    片を記憶しておき、 入力された音韻継続時間長の情報に従って生成されたマ
    ッピング関数に基づいて第1のフレームと第2のフレー
    ムとの対応付けを行い、 第1のフレームに対応する第2のフレームの単位素片を
    前記合成パラメータとして生成することを特徴とする音
    声合成方法。
  2. 【請求項2】合成しようとする音声信号の性質を表す第
    1のフレーム単位の合成パラメータを用いて音声信号を
    合成する音声合成方法において、 前記合成パラメータとなる第2のフレーム単位の単位素
    片を記憶しておき、 入力された音韻継続時間長の情報に従って生成されたマ
    ッピング関数に基づいて第1のフレームと第2のフレー
    ムとの対応付けを行い、 かつ該マッピング関数に基づいて第1のフレームに対応
    する第2のフレームの単位素片を間引くかまたは繰り返
    すことにより、前記合成パラメータを生成することを特
    徴とする音声合成方法。
  3. 【請求項3】合成しようとする音声信号の性質を表す第
    1のフレーム単位の合成パラメータを用いて音声信号を
    合成する音声合成方法において、 前記合成パラメータとなる第2のフレーム単位の単位素
    片を記憶しておき、 入力された音韻継続時間長の情報に従って生成されたマ
    ッピング関数に基づいて第1のフレームと第2のフレー
    ムとの対応付けを行うとともに、 該マッピング関数に基づいて第1のフレームのフレーム
    長を変化させ、 第1のフレームに対応する第2のフレームの単位素片を
    前記合成パラメータとして生成することを特徴とする音
    声合成方法。
  4. 【請求項4】合成しようとする音声信号の性質を表す第
    1のフレーム単位の合成パラメータを用いて音声信号を
    合成する音声合成方法において、 前記合成パラメータとなる第2のフレーム単位の単位素
    片を記憶しておき、 入力された音韻継続時間長の情報に従って生成されたマ
    ッピング関数に基づいて第1のフレームと第2のフレー
    ムとの対応付けを行い、 前記単位素片の素片長が前記音韻継続時間長より小さい
    場合は該マッピング関数に基づいて第1のフレームに対
    応する第2のフレームの単位素片を間引くかまたは繰り
    返すことにより前記合成パラメータを生成し、 前記単位素片の素片長が前記音韻継続時間長以上の場合
    には該マッピング関数に基づいて第1のフレームのフレ
    ーム長を変化させ、 第1のフレームに対応する第2のフレームの単位素片を
    前記合成パラメータとして生成することを特徴とする音
    声合成方法。
  5. 【請求項5】前記マッピング関数として、その傾きが音
    韻境界付近で予め定められた略一定の値となる関数を用
    いることを特徴とする請求項1〜4のいずれか1項に記
    載の音声合成方法。
  6. 【請求項6】前記マッピング関数を前記単位素片の過渡
    部と定常部を指定する情報および前記音韻継続時間長と
    に従って生成することを特徴とする請求項1〜4のいず
    れか1項に記載の音声合成方法。
JP8246718A 1996-09-18 1996-09-18 音声合成方法 Pending JPH1091191A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8246718A JPH1091191A (ja) 1996-09-18 1996-09-18 音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8246718A JPH1091191A (ja) 1996-09-18 1996-09-18 音声合成方法

Publications (1)

Publication Number Publication Date
JPH1091191A true JPH1091191A (ja) 1998-04-10

Family

ID=17152623

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8246718A Pending JPH1091191A (ja) 1996-09-18 1996-09-18 音声合成方法

Country Status (1)

Country Link
JP (1) JPH1091191A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7016841B2 (en) 2000-12-28 2006-03-21 Yamaha Corporation Singing voice synthesizing apparatus, singing voice synthesizing method, and program for realizing singing voice synthesizing method
JP2018077281A (ja) * 2016-11-07 2018-05-17 ヤマハ株式会社 音声合成方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7016841B2 (en) 2000-12-28 2006-03-21 Yamaha Corporation Singing voice synthesizing apparatus, singing voice synthesizing method, and program for realizing singing voice synthesizing method
JP2018077281A (ja) * 2016-11-07 2018-05-17 ヤマハ株式会社 音声合成方法

Similar Documents

Publication Publication Date Title
Tabet et al. Speech synthesis techniques. A survey
JP4551803B2 (ja) 音声合成装置及びそのプログラム
US7016841B2 (en) Singing voice synthesizing apparatus, singing voice synthesizing method, and program for realizing singing voice synthesizing method
JP3910628B2 (ja) 音声合成装置、音声合成方法およびプログラム
US7991616B2 (en) Speech synthesizer
WO2005109399A1 (ja) 音声合成装置および方法
JP2005164749A (ja) 音声合成方法、音声合成装置および音声合成プログラム
JP2000305582A (ja) 音声合成装置
JP2009047837A (ja) 音声合成方法及びその装置
JP2008249808A (ja) 音声合成装置、音声合成方法及びプログラム
US6424937B1 (en) Fundamental frequency pattern generator, method and program
JPH0632020B2 (ja) 音声合成方法および装置
JPH0887296A (ja) 音声合成装置
JP2003337592A (ja) 音声合成方法及び音声合成装置及び音声合成プログラム
JP2001109500A (ja) 音声合成装置および方法
JP2009133890A (ja) 音声合成装置及びその方法
JP3281266B2 (ja) 音声合成方法及び装置
JP5175422B2 (ja) 音声合成における時間幅を制御する方法
JPH1091191A (ja) 音声合成方法
JPH09319394A (ja) 音声合成方法
JPH11249676A (ja) 音声合成装置
JPH06318094A (ja) 音声規則合成装置
JP3394281B2 (ja) 音声合成方式および規則合成装置
JPH09179576A (ja) 音声合成方法
JP2006084854A (ja) 音声合成装置、音声合成方法および音声合成プログラム