JPS5981697A - 規則による音声合成方法 - Google Patents

規則による音声合成方法

Info

Publication number
JPS5981697A
JPS5981697A JP19086182A JP19086182A JPS5981697A JP S5981697 A JPS5981697 A JP S5981697A JP 19086182 A JP19086182 A JP 19086182A JP 19086182 A JP19086182 A JP 19086182A JP S5981697 A JPS5981697 A JP S5981697A
Authority
JP
Japan
Prior art keywords
time
accent
pitch
phoneme
pitch frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP19086182A
Other languages
English (en)
Inventor
武田 昌一
市川 「あきら」
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP19086182A priority Critical patent/JPS5981697A/ja
Publication of JPS5981697A publication Critical patent/JPS5981697A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、規則による音声合成方法に関し、峙に音節コ
ード列とアクセント型から規則により高品質のアクセン
)kもつ任意の単語音声2合成する方法に関する。
〔従来技術〕
従来、規則により音声?合成する際、アクセント?与え
る方法として、ピッチ周波数の時間(化バタンで表わし
たとき、41図に示づ〜ように、]音節間が一定値とな
る階役状バタン等1種々の直線近似パタンを用いている
。しかし、こグ)Jコうな直線近似パタンは9本来の人
間の実音声?分析して抽出される自然なピッチパタンを
徂く近似したパタンであって、これにより得られるアク
セントがある種度不自然な感じになるのは免i′Lない
〔発明の目的〕
本発明の目的は、このような従来の欠点?改善するため
1人間の実音声の分析により抽出されるピッチパタンと
きわめてよく一致するピッチ周波数の時間変化パタンを
人工的に発生させ、任意の単語のアクセントに対応する
ピッチパタンを得ることができる規則による音声合成方
法をト早供することにある。
〔発明の概要〕
本発明の規則による音声合成方式は、アクセント型番号
と音節あるいは音韻に対応する音節コード番号とを入力
することにより、音韻持続時間?決定し、決定された音
引持続時間と上記アクセント型番号とからピッチ周波数
の時間変化パタンを発生することにより音声波形を合成
する音声合成装置において、上記ピッチ周波数の時間変
化バタンを臨界制動2次線形システムの出力として発生
させ、核臨界制動2次線形システムのパラメータを、上
記アクセント型と斤量に対応して登録されているテーブ
ルを検査することによって求めることに特徴を有する。
〔発明の実施例〕
以下1本発明の原理および実施例21図面により説明す
る。
本発明においては、ピッチバタン発生法として。
ピッチ制御機構モデルによる方法シ用いることに品質?
向上させている。このモデルは、ピッチ周波数の時間変
化バタン?臨界制動2次線形システムのステップ応答と
して実現したものでアル。また、このモデルは、ピッチ
周波数の時間変化パターンは、脳において発生されるス
テップ状の指令が声帯振動制御機構の機械的特性により
平滑化されて得られるものであるという考え方で干デル
化されたもので、このモデルによる予測値は相対誤差±
4%という高い精度で実音声の分析による実測値と一致
することが実険的に確昭されている0また。上記モデル
によるピッチバタン?用いで合成した音声と1分析・合
成による音声との間で、アクセント感の差異が殆んど識
別できないほど高い自然性が得られることも、知覚的に
・l存留されている。
第2図は、ピッチ制御機構モデルにより発生させたピッ
チ周波数の時間変化パタンの一例図である0 ピッチ周波数は、緩かで大まかな変化を表わす声立て成
分(第2図の点線の成分)と1局所的な細かめ変化2表
わすアクセント成分k =を畳したもの(第2図の実線
で表示)として9次式のように定式化される。
J、 (f(t)/ fv(Gv(を−τvl) −G
v(を−τ7□)十Aa(を−τa 1 )  ”a 
(’−τ3□))・・・・・・・・・(1)Gv(t)
 =αte”””μ(t)        −−−−−
−−・・(2)−()a(t) = (1−(1+βt
)e−”)At)   =−−・−(3)ここで、AV
は声立て成分の振幅、A、lはアクセント成分の振幅、
αは角立て成分の固有角周波q。
βはアクセント成分の固有角周波数、τylsτ7□τ
gls  τ8□はそれぞれ声立て開始、声立て終了。
アクセント開始、アクセント終了の時刻2表わすパラメ
ータ*  fminは最低周波数であり、μ(1)は単
位ステップ関数である。
(1)〜(3)式(こおいて、9種類のパラメータAV
Aa、α、β、τvl、τy2++ τale τa2
およびfminシ適当に制御することによって、さまざ
まなピッチ周波数の時間変化バタン2発生させることが
できる。
ここで説明の便宜上、アクセントは東京アクセントを用
いるとともに1次のように定峻する。すなわち、m拍単
醋の1型(i=1,2.・・・、m)のアクセントとは
、アクセント核が後からi拍目(前からm+1−i拍目
)にある場合2いうOアクセ〉ト核とは、アクセントの
ある音節の終り近くからピッチ周波数が急激に下降する
部分?いう0さらに、アクセント核のない平板型のアク
セントを0型と呼ぶこととし、後に助詞を付した場合。
助詞が低アクセントとなる1型と区別する。4拍単語に
ついて、音節を「QJ で表わL、アクセントの高低全
直線の高低により模式的に表わして。
具体例を挙げれば1次のようになる0 0型p丁万万61  例、しろくま 1型9下で百6七−例、くるしみ 2型S汀でZ口Oが 例、すりこぎ 3型p「ぴ上】λ邑例、あさがお 4型テロ○○○ が 例、けんリヨ〈 本発明では、上記(1)〜(3)式のモデルにより、任
意の拍数のすべてのアクセント型の単語のピッチ周波数
の時間変化パタンを、少数の制御パラメータにより発生
させることができる。しかも、このパタンシ用いて合成
した音声は、きわめて自然なアクセント感?有する。具
体的に、制御パラメータの種類は、前記(1)〜(3)
式中の9種類であり、上記バタン?発生させるために与
えなければならない制御パラメータの実現値は、1つの
単語について各制御パラメータ当り唯1個でよい。しか
も。
どのような単語とアクセント型が同じであるならば、単
語の種類と無関係に同一のパラメータ値を設定すること
ができるので、全体としては1拍数とアクセント型のみ
を変数とした小型のテーブルのみを用意すればよいこと
になる。このように。
制御情報量を少なくすることができる理由は、上記f1
)〜(3)式のモデルが、単語のもつ韻律的情報の基本
部分?音韻の種類、アクセント型1話者とは無関係に、
臨界制動2次遅れ型の固有パタンy = xe−”およ
びy=1 (1+x ) e−”に集約した形となって
おり、そのため制御パラメータとしては、アクセント型
や話者によって異なるアクセント立上り、立下りの相対
的タイミング、声立てやアクセントの振幅、連れの時定
数等、副次的な僅かな情報を担いさえすればよいからで
ある0したがって、上記の固有バタン?小規模かつ高速
な方法で発生させることができれば、ピッチバタン発生
処理部全体?小硯模化でき、しかもピッチ周波数の時間
変化パタンシ高速に発生させることが可能となるはずで
、ある。
本発明は、このような音声の韻律的特徴と音韻的・個人
的特徴とt分離でき、しかもこの韻律的特徴が他の要因
によらず、一定バタンで表わすことができるというへ(
こ着目して、モデル(こよりピッチ周波数の時間変化バ
タン全発生させる方法。
およびモデルを用いて任意拍数で任意アクセント型のピ
ッチ周波数の時間バタン2発生させるためのモデル・パ
ラメータの制御方法2与え、装置の小型化と高速化?達
成するものである。なお、〕<タンが一定であるため1
本発明では、パタン・テーブルを用意しておけばよく、
その実現値は、変数Xをテーブルのメモリの番地に対応
させた番地修飾によりきわめて高速に求めることができ
る。
しかも、変数の数も、100個程度用青しておけば十分
な、悄度の数値シ得ることができるので、メモリ容量を
小さく抑えることが可能である。
第3図は1本発明の実施例を示す規則による音声合成装
置のシステム・ブロック図である。
音声合成装置は、音声合成器1.規則部2.および学位
データ・ベース3から構成されている。
規則部2け、さらに音韻持続時間設定処理部4゜ピッチ
・バタン発生処理部51合成単位検索処理部6.および
学位接続処理部7より構成きれている。先ず、入力とし
て与えられたm拍゛単語の音韻系列0□、 V、、  
02.  V2.、曲、四〇、、、  Vm(コ(1:
でOkはに袖口の子音シ示すコード、■、はに袖口の母
音を示すコード?それぞれ表わす)、あるい[F節系列
(OV)、、 (eV)2・−・−=−(Ov)m((
OV)、はに袖口の音節を示すコードを表わす)。
およびアクセント型首号iより、各音韻Ok、V。
(k=1,2.・・・・・・・・・m)の持続時間を音
韻持続時間設定処理部4.により求め、音韻境界時刻τ
1τ2・・・・・・・・・、12m+1として出力する
。次に、得られた音韻境界時刻τ1.τ2・・・・・・
・・・12m+1と、アクセント型番号iより、ピッチ
周波数の時間変化パタンf(tl)、f(t2)叫・団
・f(tn)(nけ全フレーム数)あるいはピッチ周期
の時間変化バタン?ピッチ・バタン発生処理部5により
求め、そのピッチ周波数の時間変化パタンf(t、)、
f(t2)・・・・・・・・・f(tm)を合成器1の
ピッチ制御端子にフレーム周期ごとに入力する。他方、
入力として寿えられた音韻系列o1.  vlycm、
v2・・団団・Om。
Vm(あるいは音節系列)から合成単位虜索処叩部6に
よって単位コードi。¥求め、その静位コードicから
対応する合成単位のパラメータ時系列P1P2・・・・
・・・・・P、 (iはこの合成単位の総フレーム数)
、およびこの合成単位の始端時刻(合成単位をOv連鎖
すればτck)−終端時刻(同じ場合にτvk)、Cv
境界時刻τcvk等を、学位データ・ベース3を検索す
ることにより出力4″る(k=1,2.町・・、J)o
なお、上記パラメー夕晴系列は、具体的には、p次のP
ARCOR係数等ホルマントの特徴シ表わすパラメータ
p1.。
p2k 、・・・・・・・・・p12.音源振幅Ak、
および有声/無声情報Ukン要素とするベクトル22合
(p、1゜p2に、  ・・・・・・・・・p、、 −
Ak −Uk )T(Tは転置2表わす)の時系列であ
る。さらに、求められた合成単位のパラメータ時系列P
1.P2・・・・・・・・・P、を上記の各種境界時刻
τ。1.τ。yls  τv1・・・・・・・・・をも
とに、上記で求めた音韻境界時刻τ1.τ2・・・・・
・・・・τ2m+lにしたがって時間軸上に割当ててい
く。割当ては、拍数分の合成単位について行う。
その後1合成単位の前後部の境界が連続になるように、
境界部に間隙がある場合にはその間隙が埋まるように接
続補間し1合成単位データが重なる場合には重なった部
分や切断後適当な間隙の部分?補間曲線(直線)に置き
換える。この単位データ割当て、および接続処理により
、音韻接続時間が実質的に制御された合成単語パラメー
タの時系列p、 # p21・・・・・・・・・Pn(
nは単語の全フレーム数)が作成される。そして、最後
にその単語パラメータ時系列を、上記ピッチ周波数の時
間変化パタンf(を汎f(t2)、  ・・・・・・・
・・f (tn)と同期させて、フレーム周期とと(こ
合成器1の各パラメータtffll K端子に入力する
。このとき、合成器1の出力どして合成音声Sが得られ
る。
合成器1は1例えばPAROO几合成器全合成器ば実現
可能であり、単位データ・ベース3.規則部2のうち合
成単位検索処理部6および単位吸続処理部7は、すべて
従来の規則合成方式における対応する各処理部を用いる
ことにより実現可能である。
次に、規則部2のうちの音韻接続時間処理部4およびピ
ッチバタン発生処理部5の実施例を、詳細に説明する。
先ず、音韻持続時間処理部4は1例えば子音の持続時間
?求めるための子音長テーブルと、母音の持続時間を求
める計算回路により、実現可能である。ここで、子音長
テーブルは、あらかじめ自然に発話されたすべてのfI
類の子音について、それらの始端時刻t5および終端時
刻ie1.=計測し。
1 −1  の値?登録すること(こよって作成してお
く。1.、 1aの測定は、音声波形の観察により目視
で求めるか、あるいは後述のFFT(高速フーリエ変換
)による音韻境界時刻測定法によって実行することがで
きる。寸た。母音の持続時間らは1例えば次の実験式を
計算することにより求められる。
匂=λv(’vo−η!。+ O,+ d ) q ・
・・(4)ここで、λ7は母音の種類ごとの補正係数で
、例えばλv=1.00(Ialの場合)、0.08(
litの場合)、0.79(1μmの、場合)、0.9
6(letの場合)、0.93(lqlの場合)と定め
ればよい。1voは屑帛となる母音持続時間で1例えば
1.。= 136 ms (最後部音節以外)= 16
4m5(最後部音節)と定めればよい。toは、その音
節の子音の持続時間(ms)、ηは直前の子音の持続時
間l の母音に及ぼす影響の大きさを表わす係数で1例
えばη=O,43と定めればよい。
O□は単語の拍数による補正項で1例えば1拍。
2拍、・・・・・・・・・、10拍単梧の順fこ、85
,40゜15.0l−10,−15,−20、−23゜
−25と定めればよい(単位はIn5)。diげ、発話
速度制御のための項で、標準の速度で合成したい場合は
d=Om8、それよりも近い速度あるいは速い速度で合
成したい場合は適当に正あるい1.・コ負の値(1音節
当りの、中度変化量(m S ) )を力えればよい。
そしてqはアクセントの高低による補正係数で1例えば
q=0.7(i1拍袖口あり。
かつ用1拍目が低アクセントの場合)、1.0(上記以
外)と定めればよい。以上の実験値は一例であって、そ
の目的・要求される品質によってけ上記の値に拘束され
る必要はないし、上記係数あるいは項の一部?省略する
こともで入る。]二記(4)〒(:の演算は、加算器、
引轢器および乗算器の構成1、−より容易に実行するこ
とができる。最後に、?r韻境界時刻τ1.τ2.・・
・・・・・・・、τ2+n−)]は、上記の方法で求め
た子音持続時間’ck −および母音持続時間’vk 
’用いて次の漸化式により求められろ。
式中のサフィックスには、第に袖口(k=1−.2゜・
・・・・・・・・、m)の音韻持続時間であることを表
わす。
τI=IO(初期値)(5) 7□、=τ2に−+ +’ck          (
6)τ2に+1−T2に+1vk(7) ここで、初期値l。は適当に定める(例えば、E。
=100mS)。
次に1本発明で最も重要なピッチバタン発生処理部5の
実施例?、第4図〜第6図により説明する0 第4図は、ピッチバタン発生処理部5の内部論理ブロッ
ク図である。
先ず、合成しようとする単語のアクセント型番号iと拍
数mをもとに、ピッチ制御パラメータ・テーブル8の中
からそのアクセント型番号および拍数に対応するif)
〜(3)式における9種類のパラメータAV、Aa、α
、β、ΔTv工、ΔTv□。
ΔTa1−  ΔTa□、およびf  の値?検索し抽
出する。ただし、ΔTvl−ΔT[l v□、  ΔT
a、。
Δ′ra2(l−1,それぞれあらかじめ指定した音韻
境界時刻τk(k、=1.2、・・・・・・・・・2m
+1)を基準とした声立て開始、声立て終了、アクセン
ト開始。
アクセント終了の相対時刻である。基準とする音韻境界
時刻τ、の指定方法の一例を次1こ述べろ。
先ず、声立て開始相対時刻Δ′rv□および声立て終了
時刻ΔTv□についてはそれぞれ単語の語頭および語尾
のOvの境界の時刻τ2.τ2mを基準とする。すなわ
ち、これらの基準の時刻をそれぞれτsv、τev  
とすれば1次式が成立する。
τsv=τ2       ・・・・・・・・・ (8
)、eV   2m        ・・・・・・・・
・ (9)次に、アクセント開始相対時刻ΔTR1およ
びアクセント終了時刻ΔTa2については、それぞれア
クセントが低から高へ立ち上り開始直後の音節OVの先
頭、およびアクセントが高から低へ立ち下り開始直後の
音節Cvの先頭の時刻を基準とする。
第2図の例では、前者の基準の時刻τsa’よτ3であ
り、後者の基準の時刻Teaはτ5である。斤お0型で
は、このようなτ。は定められないで、この場合1こ限
り、τeaは72m+1と定める。また。
1型の場合には、単語の後に助詞が付110されている
ことシ仮定して上と同じくTeaハτ2m+1と定める
。以上の事項を式で示すと、アクセント型iにしたがっ
て、次のようになる。
・・・・・・・・・(10) ・・・・・・・・・(11) なお、ピッチ制御パラメータの検索に用いる拍数は、音
韻境界時刻τ□の個数M(=2m+1)全計数すること
により1次式で求めることができる0 上記(8)〜(12)式の演算は、演算回路9により実
行されるが、具体的には(8)〜(11)式テーブル倹
素により(12)式は引算器とシフトレジスタにより簡
単に実行できる。
次に、上記により求められた相対時刻ΔTpv、。
ΔT   ΔT 、Δ1゛8□および基準の音韻境界時
v2  *      al 刻τsv*  eve  τsaw  τe8より1次
の4個のτ 式によってパラメータτv1.τ7□、τale  τ
3゜シ求める。
τ  =τ  +ΔTv□     ・・・・・・・・
・(13)vl       sv τ =τ  +ΔTv2      ・・・・・・・・
・(14)v2       ev τ =τ  +ΔTa□     ・・・・・・・・・
(15)al       sa τ  =τ  +ΔII+、□     ・・・・・・
・・・(16)a2      ea 上記(13)〜(16)式は、それぞれ加算器10,1
1゜12.13により実行できる。続いて、τ9、。
τ9.〜.前1こ求めておいたα、およびフレーム時刻
tk(k=1.2,3・・・・・・・・・、n)?計算
回路14の入力として+11式中のGv(t−τvl)
−Gv(t −τ9□)全計算する。同じように、τa
im  τ8□、β、t、を計算回路150入力として
(1)式中の03(を−τal)  ’a(t−τ2□
)全計算する。さらに1両計算回路14,15の出方に
それぞれAV。
Aaを乗算器16.17により掛惇し、その結果シ加算
器18により加え合わせることにより、(1)式の右辺
の計算を実行する。そして、最後に、加算器18の出力
を入力として計算回路191こより指数関数eX y計
算した後0乗算器2oによりfrrl、nを掛算すれば
、その結果としてピッチ周波数の1サンプル・データf
(t、)が得られる。
第4図にもとづいて説明した上記演算を、フレーム周期
ごとに時々刻々と実行すれば1乗算器20の出力として
ピッチ周波数の時間変化パタンf(tl) 、f(t2
) 、−・・・・・f(in)が得られる。もし、ピッ
チ周波数の代りにピッチ周期T(t、)k求めたければ
、計算回路19をピッチ周波数を求める場合の逆数計算
?実行するよう変形し、かっ乗算器202割算器に変更
すればよい。また、ピ。
チ周波数は1次のような回路構成でも、求めることがで
きる。すなわち1乗算器2oを省き、ピッチ制御パラメ
ータ・テーブル8中に、f 、 の代りに’n fmi
n¥登録しておき、その1直を加算器18により乗算器
16,170出力とともに加算するように変更しても、
変更前と同一の機能を得ることができる。しかも、高価
な乗算器の代り1こ安価な加算器?用いるので、製作コ
ストは低下する。
このような変更回路によれば、ピッチ周期2求めるため
には、計算回路19をピッチ周波数を求める場合の逆数
計算シ実行するように変形するだけでよく、他の部分の
変更は不叩である。
第4図の実施例の中で、ピッチ制御パラメータ・テーブ
ル8に登録されているパラメータAV。
Aa、α、β、ΔTv1.ΔTv2s  ΔTa1− 
 ΔTa2および’minの値は1人間の自然な音声の
波形から分析、抽出したピッチ周波数の時間変化パタン
と(1)式のモデルによるピッチ周波数の時間変化パタ
ンの時間平均2乗誤差が醍小になるように、上記パラメ
ータ値を決定することによって、求めることができる。
ここで、音声波形からのピッチ周波数の抽出法には、い
くつかの公知の方法があるので、簡単に実現可能であり
、上記誤差t’!小にする最適化法も種々の公知の方法
があるので、これも簡単に実現可能である。なお、上記
のΔTv1゜ΔTv□、lTa□、ΔTa□については
、上記最適化τ 法により、直接求められるτ7□、τ7□、R1゜τ8
□シ用いて、さらに次の方法により決定する。
すなわち、ピッチ周波数の時間軸と同一の時間軸上に、
各フレームごとに上記音声波形にFFT(高速フーリエ
変換)を適用し、音声信号の周波数スペクトラムの時間
変化パタンを得る。このバタンの急変する時刻を読み取
ることによって音韻境界時刻シ求めることができるので
、これよりアクセント型にしたがい(8)〜(11)式
の規則によってτ@9.τevs  τsa、τ63を
求め、さらにこれらより(13)〜(16)式の関係に
もとづきΔI[v□、ΔTv□、ΔTa□、ΔT8□シ
決定することができる。
次に、計算回路14.15の実施例を第5図(a)、(
b)、第6図により説明する。
’Wz 511(a)は、(1)式におけるGv (を
−τv1)−Gv(を−τ9□)全計算する回路であり
、同図(b)は同式におけるGa(t−τal) −G
a(t−τ8゜)全計算する回路である。第5図(a)
では、先ず入力として与えられた声立て開始および終了
時刻τ9□、v2゜τ およびフレーム時刻tk(k=1.2.・・・・・・n
)より、それぞれ引算器21.22iこよりt−τyl
st−τv2を計算し、その出力を一方では単位ステッ
プ関数計算回路23.24にそれぞれ入力し。
それらの出力と上で求めた引算器21,220出力とを
それぞれ1乗算器25.26により掛け。
その結果にさらに乗算器27.28により、それぞれα
を掛ける。次に、これらの出カシそれぞれ。
関数g (x)= xe−x¥計算する関数テーブル2
9゜30に入力し、その出力としてGv(t−τ7□)
およびGv(t−rv2)、得る。さらに引算器31に
より前者から後者を引き、所望の計算哨果を得る。第5
図(b)では、各回路32〜42は順に第5図(a)の
各回路21〜31に対応しており、その機能は次の3点
シ除き第5図(a)と同一である。■引算器32.33
にはτ7□、τ7□の代りにそれぞれτ31s  τ8
゜が入力される。0乗算器38,39にはαの代りにβ
が入力される。■関数テーブル40.41はともに関数
h(x)=1−(1+x )e−”を与えるテーブルで
ある。
関数テーブル29.30あるいは40.41による関数
計′算ハ、具体的には予め上記g (x)、h (x)
全計算した結果全登録しておき、その登録場所の番地a
1.a2.−.−an(Nはg (x)あるいはh (
x)の値の登録1同数)をXに対応させておき、演算は
上記番地の修飾によるテーブル検索1こより実行する。
この方法によれば、関数計算を容易かつ高速に行うこと
ができる。ak(k=1.2.・・・。
N)とXとの対応付けは、たとえば、Xの変域X1≦X
≦X なるテーブルを作成するとすれば。
変換式 により行うことができる。ここに〔〕はガウス記号であ
る。なおM傘(aN−a、)/(X、−X、)はXl、
XM、Nが定まれば一定値であるから、ノくラメータα
あるいはβの代りにMαあるいはIMβの(直をピッチ
制御パラメータテーブル8に登録しておけば、(17)
式の変換は。
a、 = (x −x、) + a、     (1,
7)’と簡単になる。本実l面倒ではX、=0であるか
ら。
結局(17)’式は、Xの整数化のみの処理さえすれば
、先頭番地a1のメモリ・エリアの直接(X)による番
地修飾するだけでよいという意味になり。
実質的に変換は不要となるO 第5図(a)9. (b)では、各図面の上半分と下半
分で同一の回路を使用している。例えば、21と22゜
23と24,25と26.27と28.29と30は、
それぞれ同一の対である。そこで、同一の回路を一つに
まとめ装置規模を約172に縮小したのが第6図であり
1機能は第5図(a)あるいは第5図(b)と同じであ
る。以下第6図に示す回路q)機能について説明する。
基本的には第5図(a)あるいは第5図(b)で並列1
こ行われた上半分と下半分の処理シ1フレーム中に21
DIに分けて行うのが第6図の方式である。すなわち、
クロック信号OLは1フレーム中に2回パルス?発生し
、処理の起動?かける0捷ず、第1回目のクロック信号
OLのパルスをトリガとじて、シフトレジスタ43゜4
4にそれぞれτvt (あるいはτa1)、τv2(あ
るいはτ8□)を書込み、同時にバッファレジスタ51
をゼロクリアする。次にフレーム時刻へ(k=1,2.
・・・、n)からシフトレジスタ44の出力τ7□(あ
るいはτ8□)t!!引算機45により引き、その祷果
を一方では単位ステップ関数計算回路46に入力し、そ
の出力と上で求めた引算器45の出力とや乗算器47に
より卦け、その!青果にさらに乗算器48によりα(あ
るいはβ)?掛ける。次に、この出力を前記関数g (
x) (あるいはh (X) )を計算する関数テーブ
ル49に入力し、その出力としてGv(t−τ9□)(
あるいはoR(t−τ8□))シ得る。さらにこの値か
らバッファレジスタ51の出力(すなわち、第1回目の
起動時は0″)?引算器50(こより引き、その皓果t
バッファレジスタ51に書込む。以上の処理が終了後、
クロック信号OLが第2回目のパルスを発生する。この
パルス2トリガとしてシフトレジスタ43の内容をシフ
トレジス44にシフトさせる。
ただし、このときにはバッファレジスタ511こ対して
は何の操作も行わない(ゼロクリ−fは行わない)0こ
のときシフトレジスタ44にはτ7□(あるいはτ8、
)が格納されているので、す、下τ9□(あるいはτa
l)についてi 11cil目の処理と同じ処理?行っ
ていく。その結果、バッファレジスタ51に(は、第2
回目の処理結果Gv(t−τ7゜)(あるい(はGa(
t−τ81))から第1回目の処理結果Gv(t−τ7
□)(あるいはGa(を−τ32))シ引いた結果が格
納され、結局バッファレジスタ51の出力として所望の
GV(を−τvl) −Gv(t−τv2)(あるいは
Ga(t−τa、 ) −()、(1−τ3□))が得
られる。
最後に再び第4図に立ち戻り、計算回路19について説
明する。計算回路19は指数関数eX全計算する回路で
あり、前記g (x)あるいはh (x)を求める場合
と同様の方法により、容易かつ高速に計算や実行するこ
とができる。ただし、関数テーブルには eXO値シ登
録しておく。
以上に述べてきた実施例によれば、小型で実時間性に優
れ、しかも従来より自然性の高いアクセント感?有する
。規則による単語音声合成が可能となる。
最後に、装置規模および計算時間について具体例シ挙げ
る。
先ず、装置規模については、制御パラメータは9種類で
あるから単語ごとに9種類すべてに実現値?与えるとし
、単語の最大拍数210拍として所要パジメータテーブ
ルの容量を計$−1−ると。
585個の実現値を用意すればよいことになる。
2バイトデータとすれば所要メモリ容、Bt約IKBy
teである。また、パラメータの中には一定値として扱
ってよいものがあるので、このようなパラメータな省く
ことによってテーブルをさらに小容量化することができ
る− また関数テーブルも例えば100変数に対応する関数値
全用意しておけば精度的に十分であるから、3種類の関
数を用意するとして600Byteのメモリ容置があれ
ばよい。
次に、計算時間について言えば、ピッチ周波数の1サン
プルデータな計算するのに8蜆な時間は。
主としてテーブル検索に要する時間と10回程度の四則
演算に要する時間であり、固定小数点演算2行うとすれ
ばこれらの総和は数100μsのオーダとなる。フレー
ム間隔(5〜20m5)に比べて1〜2ケタ小さいので
、十分に実時間処理が可能である。
〔発明の効果〕
以上説明したように9本発明によれIt;I’、、極め
て自然性の高い任意の日本語単語アクセントを、一つの
単語につき各制御パラメータ当り唯−閏の実現値を与え
るという簡単な制御により発生きせることができるoし
かも、上記制御パラメータの実現値は、単語の拍数とア
クセント型滑号よりデープル?検索するという簡単な方
法により得ることができる。さら(こ、ピッチ周波数の
時間変化パタンは。
テーブル参照による関数値の実現と、少数回の四則演算
の組合せにより、容易に発生させることができる。
したがって1本発明は、任意語の音声合成装置の高品質
化、小型化、および高速化?実現する上で有用な手段を
提供することが可能である。
【図面の簡単な説明】
第1図は従来用いられている直線近似ピッチパタンの特
性曲線図、第2図はピッチ制御機構モデルにより発生さ
せたピッチ周波数の時間変化バタンの特性曲線図、第3
図は本発明の実施例シ示す規則による音声合成装置の全
体ブロック図、第4図は第3図におけるピッチバタン発
生処理部の回路構成図、第5図は関数計算を行うための
回路構成図、第6図は第5図の変形回路の構成図である
。 1・・・音声合成器、2・・・規則部、3・・・単位デ
ータベース、4・・・音韻持続時間設定処理部、5・・
・ピッチバタン発生処理部、6・・・合成単位検索処理
部。 7・・・単位接続処理部、8ピツチ制御パラメータテー
ブル、9・・・演算回路、14.15.19・・・計算
回路、23,24,34,35,46・・・単位ステッ
プ関数計算回路、29,30. 40,41,49・・
・関数テーブル、43,44・・・シフトレジスタ、5
1・・・バッファレジスタ。 84 図 2θ        fttnノ 第 5国 ((2) ty、 t2.  tyl (b) tt、 tp、tn 皐6額

Claims (2)

    【特許請求の範囲】
  1. (1)  アクセント型番号と音節あるいは音韻に対応
    する音節コード番号とt入力することにより。 音韻持続時間を決定し、決定された音韻持続時間と上記
    アクセント型番号とからピッチ周波数の時間変化パタン
    を発生することにより、音声波形?合成装置において、
    上記ピッチ周波数の時間変化パタンを臨界制動2次線形
    システムの出力として発生させ、該臨界制動2次J裟ス
    テムのパラメータを、上記アクセント型番号に対応して
    登録されであるテーブルな検索することにより求めるこ
    と全特徴とする規則による音声合成方法。
  2. (2)前記臨界制動2次線形システムは、関数テーブル
    の検索手段を主要部分とすること全特徴とする特許請求
    の範囲第1項記載の音声合成方法。
JP19086182A 1982-11-01 1982-11-01 規則による音声合成方法 Pending JPS5981697A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP19086182A JPS5981697A (ja) 1982-11-01 1982-11-01 規則による音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19086182A JPS5981697A (ja) 1982-11-01 1982-11-01 規則による音声合成方法

Publications (1)

Publication Number Publication Date
JPS5981697A true JPS5981697A (ja) 1984-05-11

Family

ID=16264987

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19086182A Pending JPS5981697A (ja) 1982-11-01 1982-11-01 規則による音声合成方法

Country Status (1)

Country Link
JP (1) JPS5981697A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6385797A (ja) * 1986-09-30 1988-04-16 藤崎 博也 音声合成装置
JPS6435598A (en) * 1987-07-31 1989-02-06 Kokusai Denshin Denwa Co Ltd Personal control system for voice synthesization
JPS6435599A (en) * 1987-07-31 1989-02-06 Kokusai Denshin Denwa Co Ltd Pitch control system for voice synthesization
JPH02239295A (ja) * 1989-03-14 1990-09-21 Sumitomo Electric Ind Ltd 音声合成装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6385797A (ja) * 1986-09-30 1988-04-16 藤崎 博也 音声合成装置
JPS6435598A (en) * 1987-07-31 1989-02-06 Kokusai Denshin Denwa Co Ltd Personal control system for voice synthesization
JPS6435599A (en) * 1987-07-31 1989-02-06 Kokusai Denshin Denwa Co Ltd Pitch control system for voice synthesization
JPH02239295A (ja) * 1989-03-14 1990-09-21 Sumitomo Electric Ind Ltd 音声合成装置

Similar Documents

Publication Publication Date Title
JP2595235B2 (ja) 音声合成装置
JPH02239293A (ja) 音声処理方法
JPS62160495A (ja) 音声合成装置
JP5846043B2 (ja) 音声処理装置
CN111696498A (zh) 键盘乐器以及键盘乐器的计算机执行的方法
JP3576840B2 (ja) 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体
JP2623586B2 (ja) 音声合成におけるピッチ制御方式
JP2002358090A (ja) 音声合成方法、音声合成装置及び記録媒体
JPS5981697A (ja) 規則による音声合成方法
Gu et al. A Mandarin-syllable Signal Synthesis Method with Increased Flexibility in Duration, Tone and Timbre
Delalez et al. Vokinesis: syllabic control points for performative singing synthesis.
JP2600384B2 (ja) 音声合成方法
Wen et al. Pitch-scaled spectrum based excitation model for HMM-based speech synthesis
Freixes et al. A unit selection text-to-speech-and-singing synthesis framework from neutral speech: proof of concept
JP6902759B2 (ja) 音響モデル学習装置、音声合成装置、方法およびプログラム
Nose et al. A style control technique for singing voice synthesis based on multiple-regression HSMM.
JPS5972494A (ja) 規則合成方式
JPH06318094A (ja) 音声規則合成装置
JPH09179576A (ja) 音声合成方法
JP2628994B2 (ja) 文−音声変換装置
JPS58168097A (ja) 音声合成装置
JP3495275B2 (ja) 音声合成装置
JPS58129500A (ja) 歌声合成装置
KR20220125005A (ko) 화자 적합성이 향상된 음성합성 모델 생성방법
JP3318290B2 (ja) 音声合成方法および装置