JP3278486B2 - 日本語音声合成システム - Google Patents

日本語音声合成システム

Info

Publication number
JP3278486B2
JP3278486B2 JP06207693A JP6207693A JP3278486B2 JP 3278486 B2 JP3278486 B2 JP 3278486B2 JP 06207693 A JP06207693 A JP 06207693A JP 6207693 A JP6207693 A JP 6207693A JP 3278486 B2 JP3278486 B2 JP 3278486B2
Authority
JP
Japan
Prior art keywords
vowel
time length
mora
consonant
energy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06207693A
Other languages
English (en)
Other versions
JPH06274195A (ja
Inventor
雅代 加藤
新一郎 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Secom Co Ltd
Original Assignee
Secom Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Secom Co Ltd filed Critical Secom Co Ltd
Priority to JP06207693A priority Critical patent/JP3278486B2/ja
Publication of JPH06274195A publication Critical patent/JPH06274195A/ja
Application granted granted Critical
Publication of JP3278486B2 publication Critical patent/JP3278486B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、日本語音声において単
音節に相当する韻律の単位であるモーラ(moras)を合
成する方法に関する。特に本発明ではモーラ間時間長を
調整し、日本語音声の自然的な合成を容易化することを
目的とする。
【0002】
【従来の技術】従来このような分野の技術として、CO
C(Context Oriented Clustering)法を用いたテキスト
合成ボードの試作(電子情報通信学会の技術研究報告:
1990年11月30日)に記載されたものがあった。
この文献に記載されているCOC法は、自然音声のデー
タベースから統計的手法により生成された種々のバリエ
ーションを含む音韻を合成単位とする手法である。
【0003】
【発明が解決しようとする課題】ところで、従来の日本
語音声合成システムによれば、下記のような問題が発生
する。図15は従来の音韻継続時間長の制御を説明する
図である。本図に示すように、音韻継続時間長制御法と
して従来から考えられてきた方法は音素ごとに時間長を
与える制御方法であり、人が発した言葉を分析すると、
各音素の時間が実に変化に富むものであることが分か
る。この方法で音素の時間長制御を行う場合、考慮しな
ければならない要因としては、自分自身の音の種類、1
つ前の音の種類、1つ後ろの音の種類、2つ前の音の種
類、2つ後ろの音の種類、単語内の位置、文章内の位
置、アクセントの有無等が挙げられる(梅木等:「文音
声における音韻継続時間長の設定」信学技報、SP90
−2(平02−04))。このように、音素の種類や連
なり方によって様々に異なって現れる時間長が言葉のリ
ズムといわれるが、自然な音声を合成する際には音素そ
れぞれに正確な時間長を与えることが必要になる。すな
わち、一種の音素に対してその前後に連なる音素に対応
して、リズムが異なるため、種々の音素データを蓄積
し、データの中から必要な部分を切り出して用いる必要
がある。しかし、ここに挙げられている要因だけでもそ
の組合せは天文学的な数になり、すべての場合を考慮す
ることは不可能である。またこれらの要因だけでは不十
分であることも既に分かっている。このため、膨大なデ
ータを蓄積せざるを得ず、また複雑な処理が必要になる
から日本語音声合成音の品質を向上するのが困難である
とういう問題があった。
【0004】したがって本発明は上記問題点に鑑み自然
な音声を簡単に合成できる日本語音声合成システムを提
供することを目的とする。
【0005】
【課題を解決するための手段】本発明は、前記問題点を
解決するために、単音節に相当する韻律の単位であるモ
ーラを合成する日本語音声合成システムにおいて、先行
母音の後半部時間長をdvp、前記二個のモーラ間の子
音部の時間長をdc、前記二個のモーラ間の後続母音の
前半部時間長をdvs、前記先行母音によって決定され
る定数をAvp,Bvp、前記子音によって決定される
定数をAc,Bc、さらに前記後続母音によって決定さ
れる定数をAvs,Bvsで表す場合、隣接する二個の
モーラにおける各母音部のエネルギー重心点間の時間間
隔Dcegvに対して、
【数3】 なる式を適用して、前記先行母音部の後半部時間長dv
p、前記子音部の時間長dcおよび後続母音部の前半部
時間長dvsを決定する手段を備えている。また、前記
時間間隔Dcegvに対して、
【数4】 なる式を適用して、前記先行母音部の後半部時間長dv
p、前記子音部の時間長dcおよび後続母音部の前半部
時間長dvsを決定する手段を備えている。さらに、前
記先行母音によって決定される定数Avpおよび前記後
続母音によって決定される定数Bvpは、母音の種類を
複数個のグループに分割し、各グループにおいてそれぞ
れ一定の値を使用することも可能である。
【0006】
【作用】本発明の、母音部エネルギー重心点間に母音長
・子音長規則を形成する日本語音声合成システムによれ
ば、任意の相隣合う2つのモーラの音声波形のエネルギ
ーを求め、該音声波形の母音部のエネルギーの時間積分
を取り、前記2つのモーラの前記エネルギーの時間積分
の重心点間である母音部エネルギー重心点位置間の時間
長によりモーラ間隔を求めると、前後の母音が変化して
も母音部エネルギー重心点位置間の時間長はほとんど変
化しない。さらに前の子音が変化しても前記母音部エネ
ルギー重心点位置間の時間長はほとんど変化しない。さ
らに前記モーラを構成する母音長、子音長が母音部エネ
ルギー重心点位置間の時間長と子音長とをパラメータと
してが決定される。したがって前記モーラ間隔、モーラ
を構成する母音長、子音長は定量的かつ正確に得られ
る。具体的には前記モーラを構成する母音長、子音長は
前記母音部エネルギー重心点位置間の時間長の一次関数
として定量的に決定し、さらに前記モーラを構成する母
音を複数にグループ化し各グループで前記一次関を形
成することにより前記モーラ間隔の定量化の処理が簡略
化される。したがって、合成すべき文章の音韻継続時間
を前記モーラ間隔で調整することにより、自然な日本語
合成音が簡単に得られるようになる。
【0007】
【実施例】以下本発明の実施例について図面を参照して
説明する。図1は本発明の実施例に係る日本語音声合成
システムの構成を示す図である。本図に示す日本語音声
合成システムは、合成文章が入力されると音声合成しよ
うとする日本語文を解析し、音声合成処理に必要なアク
セントの情報、ポーズ、母音の無音声化などといった発
音情報を加えた音韻記号列に変換するテキスト解析部1
と、該テキスト解析部1によって生成された音韻記号列
を後述するリズム規則により音韻継続時間長を制御する
音韻継続時間長生成部2と、該音韻継続時間長生成部2
のリズム規則により与えられる母音部エネルギー重心点
間時間長Dcegv(The Center of Energy Gravity of Vo
wels)を守るように音声のパワーパタンをパワー規則に
より決定する音響振幅パタン生成部3と、韻律制御規則
から各アクセント句についての単音節に相当する韻律の
単位であるモーラの含まれている個数、アクセント型か
ら点ピッチパタンを決めて、それらを補間して連続点ピ
ッチパタンを生成するピッチパタン生成部4と、前記パ
ワーパタンと前記連続点ピッチパタンをもとに音源を生
成する音源生成部5と、音韻性向上規則、音韻結合規則
により、母音・子音といった音韻の種類を決め、各音韻
のスペクトルを結合し、フォルマントパタンを作成する
スペクトルパタン生成部6と、前記得られた音源情報と
前記フォルマントパタンから合成音声を作成する音声合
成器7とを含む。
【0008】図2は図1の音韻継続時間長生成部2の構
成を示すブロック図である。本図に示す音韻継続時間長
生成部2はテキスト解析部1によって生成された音韻記
号列をVCV(母音/子音/母音)の区画単位に区分す
るVCV区画区分部21と、前記区画区分部21で区分
された各区画単位での子音及び発話速度SR(SpeechRa
te)をパラメータとして格納されているリズム規則から
母音部エネルギー重心点間時間長Dcegvを算出し各区間
部に設定する母音部エネルギー重心点間時間長設定部2
2と、母音部エネルギー重心点間時間長Dcegvを得た後
に、Dcegv間に存在する各母音・子音の継続時間長を決
定しその結果を音響振幅パタン生成部3、ピッチパタン
生成部4、音源生成部5に出力するDcegv内母音長・子
音長設定部23を具備する。
【0009】次に本発明の特徴部である音韻継続時間長
生成部2に母音部エネルギー重心点間時間長Dcegvを供
給するリズム規則について詳細に説明する。本発明者
は、高品質な日本語音声を容易に合成するために、日本
語にリズム法則を見い出し韻律規則として適用するこ
が不可欠であると考えた。なぜならこれまで多くの研究
者の努力にも関わらず、リズム規則は見い出されていな
かったからである。日本語の構造は、CV(子音/母
音)形、VCV(母音/子音/母音)形、CVC(子音
/母音/子音)などが考えられるが、以下に説明するよ
うに、日本語音声のリズムがVCV(母音/子音/母
音)形の母音部エネルギー重心点間の時間長として与え
られること、さらにこの時間長があるテンポの範囲内で
は母音間に存在する子音の種類によりほぼ一位に定まる
ことが明らかになった。
【0010】はじめに以下の日本語リズムの仮説に立脚
して説明を進める。すなわち、かなり小さな子供であっ
ても、日本語独特なリズム感を正しく形成することがで
きる。また、どんなモーラ系列であっても人は自然なリ
ズムで発音できる。これらの現象から日本語のリズム規
則は非常に単純なものでなければならないはずである。
このことについて金田一(日本語音韻の研究(196
7)東京堂出版)はつぎのような法則があると指摘して
いる。
【0011】〔法則〕日本語のリズムはモーラ単位でと
られ、基本的に等時性という単一概念で支配されてい
る。また、ゆっくり発声した場合を考察すると、リズム
はモーラ中の母音部でとられていることがわかる。さら
に、人はそのエネルギーを聞いていると考えられる。従
って、物理的なリズムを次のように定義することができ
る。
【0012】〔定義〕日本語のリズムはモーラ中の母音
部エネルギー重心点間の時間長で与えられる。日本語の
リズムは基本的に等時的であるが、これを乱す最大の要
因は、発声器官の構造から付随的に加わる物理的制約で
あると考えられる。この制約は母音発声時よりも子音発
声時の方が明らかに大きく、母音部エネルギー重心点間
の時間長は子音(27種類)の違いに大きく依存すると
思われる。
【0013】図3は母音部エネルギー重心点間時間長に
着目した時間長制御を示す図である。本図を用いて詳細
に説明すると、図中の音声波形による日本語のモーラ
は、一般に子音部と母音部とからなる。前述したとお
り、リズムのタイミングはモーラ中の母音部でとられて
いることから、とくにモーラ内の母音部のエネルギーに
着目する。すなわち母音部のエネルギーを求め、その部
分の重心を与える瞬間の点を母音部エネルギー重心点と
定義する。音節それぞれにつき1つずつ母音部エネルギ
ー重心点が決まるので、この母音部エネルギー重心点間
の時間長を図中の如くt1 、t2 、t3 、t4 とすれば
モーラ間の時間長を与えることができる。
【0014】この母音部エネルギー重心点に着目した時
間長制御法では、波形のエネルギーを考慮するため、母
音の種類の違いは考える必要がない。また母音部エネル
ギー重心点間に存在する子音部について考える。子音
は、母音に比べるとそのエネルギーが小さいけれど、発
音のしやすさ・しにくさといった物理的な制約を大きく
与えている。日本語のリズム法則は、エネルギー単位で
の等時性に基づいていると先に述べた。母音部エネルギ
ー重心点間の時間長は、本来等間隔であるべきものであ
るが、間に存在する子音の発生のしやすさ・しにくさで
この等時性が大きく乱され、実際には様々な時間長とな
って現れていると考えることができる。
【0015】そこで、以下のような仮説を設け、実音声
の分析を通して検証する。 〔仮説〕母音部エネルギー重心点間の時間長(リズム)
はあるテンポ以下では対象となる母音間の子音の種類の
みで定まり、前後の母音の種類には依らない。次に音声
資料と分析方法について説明する。音声資料として、7
モーラの無意味単語部を含む「それは、“こ○○めんか
い”です」という1文を用いた。発声者は男女一名ずつ
計2名である。
【0016】Ci をi 番目の子音、Vi をi 番目の母音
とすれば、無意味単語中の○部分はそれぞれC2 V2 、
C3 V3 と表すことができる。この第2・第3モーラ間
について先の仮説を検証するため、〔分析1〕前の母音
V2 が違う場合、〔分析2〕後ろの母音V3 が違う場
合、〔分析3〕前の子音C2 が違う場合、〔分析4〕間
に挟まれた子音C3 が違う場合、という4つの場合につ
いて母音部エネルギー重心点間時間長の分析を行った。
各音韻の種類毎に10回の発声をし、母音部エネルギー
重心点位置間の時間長の平均時間長と標準偏差を求めて
いる。この際、発話毎の起こるテンポの微妙な違いを吸
収するため、無意味単語部の継続時間すなわち発話速度
を7モーラ/秒に線形伸縮で正規化した。
【0017】なお、男女それぞれの分析結果は大局的に
同じ傾向が見られるため、以下1人(女声)の例でのみ
説明する。図4は前の母音が違う場合を示す図であり、
図5は図4の場合の母音部エネルギー重心点間時間長の
影響を示す図である。図3に示すように、子音1、母音
1、子音2、母音2の順に配列し、子音1、2、母音2
を固定して母音1を種々変化させて母音部エネルギー重
心点間の時間長が測定される。図5に示すように、◆は
母音部エネルギー重心点間の平均時間長、上下に伸びた
線分は標準偏差であり、横軸は第2モーラ及び第3のモ
ーラ目の音韻を、例えば「baba、biba、buba、beba 、
boba、 Nba」と、示している。図5では前の母音V2 が
違う場合の母音部エネルギー重心点間時間長が示されて
いるが、その平均時間長は139〜145msであり、
±約3.5msの幅で分布している。音韻継続時間長の
弁別限は約10〜20msである事実から(参照:橋本
等、第7回国際音響会議、129−132(197
1))、前の母音V2 の違いによる影響はほとんどない
ものといえる。
【0018】図6は後ろの母音が違う場合を示す図であ
り、図7は図6の場合の母音部エネルギー重心点間時間
長の影響を示す図である。上記と同様に図6に示すよう
に、子音1、2、母音1を固定して母音2を、例えば図
7に示すように「baba、babi、babu、babe、babo、 baN
de」と、種々変化させて母音部エネルギー重心点間時間
長が測定される。図7に示すように、後ろの母音V2 が
違っても、母音部エネルギー重心点間平均時間長の分布
は140〜154ms、±約7msであり、前の母音と
同様、後ろの母音V3 の違いによる影響もほとんどない
ことが分かる。
【0019】図8は前の子音が違う場合を示す図であ
り、図9は図8の母音部エネルギー重心点間時間長の影
響を示す図である。上記と同様に図7に示すように母音
1、2、子音2を固定して子音1を、例えば図9に示す
ように「byaba 、 baba 、 gyaba、…、naba」と、種々
変化させて母音部エネルギー重心点間時間長が測定され
る。図8に示すように、子音C2 が違う場合でも、母音
部エネルギー重心点間の平均時間は121〜153m
s、±約16msの幅で分布しており、弁別限(10〜
20ms)の域を考えると少ないながらも影響を及ぼし
ていることが分かる。
【0020】図10は間の子音が違う場合を示す図であ
り、図11は図10の場合の母音部エネルギー重心点間
時間長の影響を示す図である。上記と同様に図10に示
すように母音1、2、子音1を固定して子音2を、例え
ば「bara、bada、bawa、…、bahya 」と、種々変化させ
て母音部エネルギー重心点間時間長が測定される。図1
1に示すように、子音2が分析対象の母音に挟まれて、
違っている場合には、母音部エネルギー重心点間の平均
時間長分布幅は、113〜195ms、±約41msと
なっており、明らかに弁別限(10〜20ms)を越え
ている。
【0021】以上の結果から前の母音の種類の違いによ
る影響(図5)、後ろの母音の種類の違いよる影響(図
7)ではともに平均時間長は140ms近辺に集中して
いる。母音の種類ごとで若干のばらつきがみられるもの
の、人間が弁別限つまり約10〜20msの音の長さの
変化を認知できないことを考慮すると、母音の種類によ
る影響が無視できるものであると結論できる。それに対
し、間の子音の違いによる影響(図11)は約110〜
190msと幅広く分布し、種類の違いによる影響の大
きさが確認できた。
【0022】図12は母音部エネルギー重心点間の時間
長導出方法を説明する図である。本図(a)に示すよう
なそれぞれ子音部及び母音部からなる第iモーラ、第
(i+1)モーラの音声波形において、本図(b)に示
すような音声波形をエネルギーで表した音声エネルギー
Eに対して、本図(c)に示すような音声エネルギーの
和(積分)を取り、例えば、第iモーラ及び第(i+
1)モーラの全エネルギーの和をEtotal (i)、Eto
tal (i+1)とし、第iモーラ及び第(i+1)モー
ラの1/2Etotal (i)、1/2Etotal (i+1)
になる時間をそれぞれ第iモーラ及び第(i+1)モー
ラの母音部エネルギーの重心点とし、これらの間隔を母
音部エネルギー重心点間の時間長とする。
【0023】以上の方法で導出した各種の子音に対する
母音部エネルギー重心点間の時間長を下記表に示す。 以上では日本語音声のリズムを、母音部エネルギー重心
点間時間長(Dcegv)として定義し、規則化したが、D
cegv内の母音長・子音長配分に関する規則が定まってお
らず、従来は個々の母音長・子音長が規則的に決められ
なかった。以下のDcegv内の母音長・子音長の分析結果
に基づき、これを規則として図2のリズム規則に格納し
Dcegv内母音長・子音長設定部23で個々の母音長・子
音長が設定される。
【0024】図13はDcegv内時間長設定方法を説明す
る図である。本図に示すように、Dcegv内を先行母音後
半部dvp、子音部dc、後続母音前半部dvsの3分
割して考える。発話速度を変化させることにより得られ
る様々なDcegv値に対して、dvp、dc、dvsそれ
ぞれの値を求めた。前述のように音声資料には、7モー
ラの無意味単語部を含む「それは、“こ-/bx/-/kx/-め
んかい”です.」(Xは任意の母音)という一文を用
い、無意味単語中の第2、第3のモーラ間について分析
した。発声者は女性一名である。
【0025】図14は一例として、“こ-/ba/-/ka/-め
んかい”の分析結果であるDcegvとdvp、dc、dv
sを示すグラフである。図中は横軸は、発話時間を変化
させることにより得られたDcegv値〔ms〕、縦軸はそ
の時のDcegv値に対するdvp(○)、dc(▲)、d
vs(◇)値〔ms〕である。図14からは、dvp、
dc、dvsがDcegvをパラメータとする下記一次式で
近似できることが分かる。
【0026】
【数1】
【0027】ここで、Avp、Bvpは先行母音に関する係
数、Ac、Bcは子音に関する係数、Avs、Bvsは後続母
音に関する係数である。他の母音系列に関しても同様に
分析した結果、Dcegvの一次関数で弁別限以内に近似で
きることがわかった。母音の組み合わせそれぞれに対し
て求められた子音/k/における各係数の値を下記に示
す。この式は以下のように変形できる。
【0028】
【数5】
【0029】
【表1】
【0030】ところで、任意のVCV(母音/子音/母
音)について、先行母音と後続母音との組み合わせでは
25種類の係数を備えなければならず、記憶すべきデー
タが多くなるだけでなく処理が煩雑となる。そこで以下
にこの係数の使用の簡略化を行うための母音のグループ
化の一例として二つのグループ化の場合について説明す
る。
【0031】この係数を使用し、発話速度が11モーラ
/秒、7.7モーラ/秒、6モーラ/秒にあたるDcegv
値(100ms、160ms、200ms)につき、d
vp、dc、dvsを求めた。特にDcegvが100m
s,160msの結果を以下に示す。
【0032】
【表2】
【0033】表中の『差』は、各行ごとの共通先行母音
又は後続母音の時間長の最大値と最小値の差をいう。
『中央値』は各行の異なる先行母音又は後続母音の時間
長に関し(各行の最大値+最小値)/2の値である。先
行母音が/a/の場合、後続母音の種類が違ってもdvp
値にはほとんど差(10〜20ms以下)がない。同様
に、後続母音が/a/の場合、先行母音の種類が違っても
dvs値にはほとんど差がない。これにより、第1に母
音部の時間長は、隣接する母音の種類に関わりなく、自
身の種類だけで決定できると言える。
【0034】つぎに、Dcegv内のdvp、dc、dvs
の設定規則を次のように定める。すなわち、5母音の種
類/a//i//u//e//o/により時間長が異なるが、前記定義
による異なる5母音長の中央値を境にし、5母音を ・中央値より時間長が常に長いもの−/a//e/、 ・中央値より時間長が常に短いもの−/i//u//o/、 の2グループに分けることができる。したがって、第2
には継続時間長の弁別限(10〜20ms)を考慮する
と、5母音すべての組み合わせについて分析する必要が
なく、/a/、/i/ついて分析し、得られた結果を用いれば
よいことが分かる。すなわち、Dcegvが子音の種類によ
り決定される規則であるのに対し、Dcegv内部は、第2
には、母音の2グループ(継続時間長が長いものと短い
もの)で決まる規則である。なお、他の子音について行
った分析結果からも、同様の傾向が見られた。
【0035】以上の考察から、つまり、任意のVCV
(母音/子音/母音)のDcegv〔ms〕について以下の
式のように定めることができる。例えば、/x-k-x/とい
う音韻系列については、表1中の/aka/、/ika/、/aki/
の各係数を使用し、以下の関係式から、dvp、dc、
dvsが求められる。
【0036】
【数3】
【0037】本設定規則による継続時間長を実測値と比
較したところ、弁別限以内におさまり、精度良く設定で
きることが示された。以上母音の2グループ化について
説明したが、母音のグループ化は要求される精度と簡略
の程度とのバランスで決定され、すなわち使用する者
が求める精度応じて都合のよい複数のグループを選択
することができる。
【0038】
【発明の効果】以上説明したように本発明によれば、2
つのモーラのエネルギーの時間積分の重心点間である母
音部エネルギー重心点位置間の時間長によりモーラ間隔
を求め、2つのモーラの間の子音、発話速度をパラメー
タとしてモーラ間隔を決定し、母音部エネルギー重心点
位置間の時間長と子音長とをパラメータとしてモーラを
構成する母音長、子音長を決定して合成すべき文章の音
韻継続時間をモーラ間隔で調整するので、自然な日本語
合成音が簡単に得られるようになる。
【図面の簡単な説明】
【図1】本発明の実施例に係る日本語音声合成システム
の構成を示す図である。
【図2】図1の音韻継続時間長生成部2の構成を示すブ
ロック図である。
【図3】母音部エネルギー重心点時間長に着目した時間
長制御を示す図である。
【図4】前の母音が違う場合を示す図である。
【図5】図4の場合の母音部エネルギー重心点間時間長
の影響を示す図である。
【図6】後ろの母音が違う場合を示す図である。
【図7】図6の場合の母音部エネルギー重心点間時間長
の影響を示す図である。
【図8】前の子音が違う場合を示す図である。
【図9】図8の母音部エネルギー重心点間時間長の影響
を示す図である。
【図10】間の子音が違う場合を示す図である。
【図11】図10の場合の母音部エネルギー重心点間時
間長の影響を示す図である。
【図12】母音部エネルギー重心点間の時間長導出方法
を説明する図である。
【図13】Dcegv内時間長設定方法を説明する図であ
る。
【図14】一例として、“こ-/ba/-/ka/-めんかい”の
分析結果であるDcegvとdvp、dc、dvsを示すグ
ラフである。
【図15】従来の音韻継続時間長の制御を説明する図で
ある。
【符号の説明】
1…テキスト解析部 2…音韻継続時間長生成部 3…音源振幅パタン生成部 4…ピッチパタン生成部 5…音源生成部 6…スクペクトルパタン生成部 7…音声合成器 21…VCV区画区分部 22…母音部エネルギー重心点間時間長設定部 23…Dcegv内母音長・子音長設定部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平6−222793(JP,A) 特開 平6−266391(JP,A) 加藤雅代、橋本新一郎,母音エネルギ ー重心点に着目した日本語のリズム規則 について,電子情報通信学会技術研究報 告,日本,電子情報通信学会,VOL92 No.35 SP92 7−12,33−40 加藤雅代、橋本新一郎,母音エネルギ ー重心点に着目した日本語のリズム規則 について,日本音響学会研究発表会講演 論文集,日本,日本音響学会,VOL. 1991 秋期,249−250 加藤雅代、橋本新一郎,母音エネルギ ー重心点に着目した日本語のリズム規則 の拡張,日本音響学会研究発表会講演論 文集,日本,日本音響学会,VOL. 1992 春期,239−240 (58)調査した分野(Int.Cl.7,DB名) G10L 13/08 G10L 13/06

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 単音節に相当する韻律の単位であるモー
    ラを合成する日本語音声合成システムにおいて、 先行母音の後半部時間長をdvp、前記二個のモーラ間
    の子音部の時間長をdc、前記二個のモーラ間の後続母
    音の前半部時間長をdvs、前記先行母音によって決定
    される定数をAvp,Bvp、前記子音によって決定さ
    れる定数をAc,Bc、さらに前記後続母音によって決
    定される定数をAvs,Bvsで表す場合、隣接する二
    個のモーラにおける各母音部のエネルギー重心点間の時
    間間隔Dcegvに対して、 【数1】 なる式を適用して、前記先行母音部の後半部時間長dv
    p、前記子音部の時間長dcおよび後続母音部の前半部
    時間長dvsを決定する手段を備えることを特徴とす
    る、日本語音声合成システム。
  2. 【請求項2】 先行母音の後半部時間長をdvp、前記
    二個のモーラ間の子音部の時間長をdc、前記二個のモ
    ーラ間の後続母音の前半部時間長をdvs、前記先行母
    音によって決定される定数をAvp,Bvp、さらに前
    記後続母音によって決定される定数をAvs,Bvsで
    表す場合、隣接する二個のモーラにおける各母音部のエ
    ネルギー重心点間の時間間隔Dcegvに対して、 【数2】 なる式を適用して、前記先行母音部の後半部時間長dv
    p、前記子音部の時間長dcおよび後続母音部の前半部
    時間長dvsを決定する手段を備える、日本語音声合成
    システム。
  3. 【請求項3】 請求項1または2に記載の日本語音声合
    成システムにおいて、 前記先行母音によって決定される定数Avpおよび前記
    後続母音によって決定される定数Bvpは、母音の種類
    を複数個のグループに分割し、各グループにおいてそれ
    ぞれ一定の値を使用することを特徴とする、日本語音声
    合成システム。
JP06207693A 1993-03-22 1993-03-22 日本語音声合成システム Expired - Fee Related JP3278486B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06207693A JP3278486B2 (ja) 1993-03-22 1993-03-22 日本語音声合成システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06207693A JP3278486B2 (ja) 1993-03-22 1993-03-22 日本語音声合成システム

Publications (2)

Publication Number Publication Date
JPH06274195A JPH06274195A (ja) 1994-09-30
JP3278486B2 true JP3278486B2 (ja) 2002-04-30

Family

ID=13189628

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06207693A Expired - Fee Related JP3278486B2 (ja) 1993-03-22 1993-03-22 日本語音声合成システム

Country Status (1)

Country Link
JP (1) JP3278486B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3361066B2 (ja) 1998-11-30 2003-01-07 松下電器産業株式会社 音声合成方法および装置
JP6221258B2 (ja) 2013-02-26 2017-11-01 沖電気工業株式会社 信号処理装置、方法及びプログラム

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
加藤雅代、橋本新一郎,母音エネルギー重心点に着目した日本語のリズム規則について,日本音響学会研究発表会講演論文集,日本,日本音響学会,VOL.1991 秋期,249−250
加藤雅代、橋本新一郎,母音エネルギー重心点に着目した日本語のリズム規則について,電子情報通信学会技術研究報告,日本,電子情報通信学会,VOL92 No.35 SP92 7−12,33−40
加藤雅代、橋本新一郎,母音エネルギー重心点に着目した日本語のリズム規則の拡張,日本音響学会研究発表会講演論文集,日本,日本音響学会,VOL.1992 春期,239−240

Also Published As

Publication number Publication date
JPH06274195A (ja) 1994-09-30

Similar Documents

Publication Publication Date Title
Saino et al. An HMM-based singing voice synthesis system
EP0832481B1 (en) Speech synthesis
JP2000163088A (ja) 音声合成方法および装置
Pereira et al. Some acoustic characteristics of emotion.
JP3576840B2 (ja) 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体
JP3278486B2 (ja) 日本語音声合成システム
JP3278485B2 (ja) 日本語音声合成システム
JP5175422B2 (ja) 音声合成における時間幅を制御する方法
JP3267659B2 (ja) 日本語音声合成方法
JPH0580791A (ja) 音声規則合成装置および方法
JP3124791B2 (ja) 音声合成装置
JP3113101B2 (ja) 音声合成装置
JP3771565B2 (ja) 基本周波数パタン生成装置、基本周波数パタン生成方法、及びプログラム記録媒体
KR101348906B1 (ko) 음성 합성기의 화속변경방법
JP3083624B2 (ja) 音声規則合成装置
JP3368948B2 (ja) 音声規則合成装置
Dessai et al. Development of Konkani TTS system using concatenative synthesis
Zhang et al. Segment Duration and Proportion in Mandarin Singing
Lai F0 control model for mandarin singing voice synthesis
JPH1011083A (ja) テキスト音声変換装置
JP2853997B2 (ja) 音声合成方式
JP3297221B2 (ja) 音韻継続時間長制御方式
Eady et al. Pitch assignment rules for speech synthesis by word concatenation
JPH0695696A (ja) 音声合成方式
JPH1078795A (ja) 音声合成装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees