JPH04277B2 - - Google Patents

Info

Publication number
JPH04277B2
JPH04277B2 JP58079617A JP7961783A JPH04277B2 JP H04277 B2 JPH04277 B2 JP H04277B2 JP 58079617 A JP58079617 A JP 58079617A JP 7961783 A JP7961783 A JP 7961783A JP H04277 B2 JPH04277 B2 JP H04277B2
Authority
JP
Japan
Prior art keywords
speech synthesis
speech
memory
elements
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58079617A
Other languages
English (en)
Other versions
JPS59204097A (ja
Inventor
Yamato Sato
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP58079617A priority Critical patent/JPS59204097A/ja
Publication of JPS59204097A publication Critical patent/JPS59204097A/ja
Publication of JPH04277B2 publication Critical patent/JPH04277B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Liquid Developers In Electrophotography (AREA)
  • Audible-Bandwidth Dynamoelectric Transducers Other Than Pickups (AREA)
  • Flexible Shafts (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

【発明の詳細な説明】 この発明は単語より小さな音声要素に基づき任
意の連続音声を合成する音声合成方法に関するも
のである。
<従来技術> 任意の語・文の音声を合成する方式には、従来
から音声の最も基本的要素である音素(a、i、
p、k、s…など音声記号に相当する要素)から
合成する方式と、2音素連続の組(母音−子音、
母音−母音、子音−子音)であるDyad,VCV
(母音−子音−母音)などの音素の複合要素から
合成する方式とが知られている。音素から合成す
る方式は音素から他の音素への動作部分の実現
法、調音結合に伴なう変形などを「規則」によつ
て実現せねばならないが、現状ではこれらの知見
がすべて明らかになつているわけではなく、必ず
しも良い品質の合成音を提供してはくれない。音
素の複合要素による方法は、比較的現実的方法で
あり実用に供されている例もある。VCVやCVを
要素とする従来の方式では、合成要素の結合を主
に母音部で行つている。母音部は最も聞こえが大
きい部分であり、こゝでスペクトル・パラメータ
の結合歪みや音色の変化が生じ、合成音声の品質
をそこなうという欠点があつた。
<発明の目的> この発明は、合成音声の品質向上を図るため、
従来の複合要素の欠点を除去した新たな要素によ
る音声合成方法を提供するものである。
<発明の原理> すでに述べたように母音定常部における合成要
素の結合は、合成音の品質に悪影響を及ぼす可能
性がある。そこでCVC(C:子音、V:母音)型
の合成要素を設定する。この要素は母音部分が先
行子音と後続子音の影響を受けたものになつてい
る。すなわち、調音結合の影響を自然と含み、な
めらかな口の動きを実現できる要素である。ま
た、合成音にリズム感を与えるため母音の持続時
間を適切に設定しなければならないが、CVC型
要素では両側子音の影響で現実的な母音長が実現
されている。
発音が1音節としてなされる(母音−撥音)、
(母音と母音iの連続)も1つの要素の中に含ま
せると都合が良い。何故なら、これらの音韻連続
は、緊密度が非常に強いばかりでなく、日本語の
中での出現頻度の高い音韻連続であるからであ
る。
以上述べたように、この発明では音声合成要素
の基本形式としてCVC及びCVMC(Mは撥音N又
は母音i)を設定する。しかし、日本語の音韻の
種類を考慮すると、この基本形式の音声合成要素
は6千種を越すため、音声合成要素の数としては
現実的な個数を越えている。実際にはこれらの音
声合成要素の中には、日本語としてほとんど用い
られない音韻の連続もあるであろうし、例え用い
られるにせよ出現頻度の極めて小さいものもある
に違いない。そこでこの発明では日本語の音韻の
出現頻度に基づき、使用頻度の高いものは、
CVC又はCVMCを使用し、使用頻度の低いもの
については、CV、VC、VV、VN、NCなどの要
素を用いて合成することにより、合成要素の蓄積
メモリの低減と合成要素作成の作業量を大巾に小
なくする。第1図は一例として日本語の辞書見出
し語の分析から得られたCVC及びCVMCの累積
百分率を示すものであるが、出現頻度の高い約
1000個のCVC及びCVMC音韻連続で日本語単語
の90%がカバーされることが理解される。従つて
このような1000個の長単位要素とCV、VC、
VV、VN、CN等の短単位要素を用いて合成を行
なう。
<実施例> 第2図はこの発明の一実施例を示す。入力端子
1より、合成すべき語や文の文字系列が入力され
ると、合成要素名系列作成部2はいつたん入力文
字系列をCVC又はCMCの長単位要素の系列に分
割し、その各長単位要素の要素名を合成要素名照
合部3に送る。合成要素名照合部3は、長単位合
成要素名蓄積メモリ4より音声合成要素の名称を
読出し、これと合成要素名系列作成部2より転送
されてきた長単位要素名との照合をとり、メモリ
4に音声合成要素の名称があるか否かを判定し、
その結果を合成要素名系列作成部2に転送する。
長単位合成要素名蓄積メモリ4に該当の長単位要
素がなかつた場合、合成要素名系列作成部はその
なかつた長単位要素CVCをCV、VCに、CVMC
をCV、VM、MCの各短単位要素の系列に分割す
る。例えば、 sakurawa kireidesu (桜はきれいです) はsak+kur+raw+wa kir+re+ei+id+des+
su となり、下線部は〔reid〕という長単位要素の音
声合成要素がなかつたために、3つの短単位要素
に分割した例である。なお、語尾では〔wa〕、
〔su〕のように短単位要素が用いられる。
上記のようにして合成要素名系列作成部2から
合成要素名系列が得られると、その系列は音声合
成制御部5に送られる。各種のCVCとCVMCに
ついては長単位合成要素パラメータ蓄積メモリ6
に、すべてのCV、VCなどについては短単位合成
要素パラメータ蓄積メモリ7にそれぞれ音声合成
スペクトルパラメータが蓄えられている。音声合
成制御部5は、パラメータ読出部8を制御して入
力された合成要素名系列の各音声合成要素に対す
るパラメータをメモリ6,7の何れからか読み出
し、その情報をパラメータ平滑部9に送る。
パラメータ平滑部9では音声合成要素結合部分
及びその近傍でスペクトルパラメータ
(PARCOR係数、LSPパラメータ、ホルマントな
ど)及び振幅に関して以下のような荷重平均処理
を行ない、パラメータを平滑化する。
f=f+li+f-l Wi-fPf 但し、lj=-l Wj=1 Pf:パラメータ Wi:重み係数 f:フレーム番号 2l+1:荷重平均処理を行なう窓のフレーム長 この処理を音声合成要素の接合部の前後数フレ
ームに渡つて行う。
第3図はパラメータ平滑部9の実施例を示すも
のであり、合成要素のパラメータ蓄積メモリ6,
7から読み出された音声合成要素のパラメータは
いつたん入力バツフアメモリ21に蓄積される。
入力バツフアメモリ21はダブルバツフアになつ
ており、次に続く音声合成要素のパラメータも同
時に蓄積される。演算制御部22はパラメータの
平滑演算を制御する部分であり、平滑処理の不必
要な合成要素の区間では読出制御部23を介して
フレーム毎にパラメータを出力バツフアレジスタ
24に転送する。音声合成要素の結合部近傍のパ
ラメータ平滑区間では荷重平均処理を行う窓区間
のパラメータが入力バツフアメモリ21から順次
読出され、乗算器25によつてメモリ26に蓄積
されている重み係数との積がとられるとともに、
加算器27、累算レジスタ28によつて積和演算
がなされ、平滑化された窓中心のフレームのパラ
メータ値が出力バツフアレジスタ24に送られ
る。1合成要素全フレームのパラメータの出力バ
ツフアレジスタ24への転送が終了すると、次の
音声合成要素のパラメータが入力バツフアメモリ
21に書き込まれ、上記と同様の動作が繰返され
る。なお重み係数の窓区間内での包絡は三角波
形、ガウス波形など中心部が最大となるものであ
る。
このような処理を行う前のLSPパラメータの時
系列の例を第4図Aに、そのLSPパラメータの時
系列に前記平均化処理を行つた例を第4図Bに示
す。パラメータの平均化処理により例えば、「ザ」
と「グ」の結合部31、「ル」と「マ」との結合
部32はそれぞれ結合部33,34となり合成音
になめらかさを与えるとともに、接合部のパラメ
ータ値の急変に帰因する異音の混入を避けること
ができる。
第2図の説明に戻つて、パラメータ平滑部9で
音声合成要素のパラメータ時系列ができると、音
声合成制御部5は音源生成部10よりの駆動音源
信号を音声合成デイジタルフイルタ11へ供給
し、そのデイジタルフイルタ11のフイルタ特性
がパラメータ平滑部9からのパラメータ時系列に
より制御されて、合成音出力端子12に最終的な
合成音声信号が出力される。音源生成部10及び
音声合成デイジタルフイルタ11は音声合成器を
構成している。
<効果> 以上説明したように、この発明ではCVC及び
CVMCを音声合成の基本要素として用いるため、
聞こえの大きい母音部でのパラメータの線形結合
が避けられ、調音結合の影響が自然と含まれ、な
めらかな口の動きが実現され、従来以上に良い品
質の合成音が得られるばかりでなく、CV、VC、
VV、VN型合成要素を併用することにより、音
声合成要素の総数を減少せしめ、装置を経済的に
実現できる利点がある。また、音声合成要素の結
合に際してパラメータの平滑化処理をほどこす場
合は滑らかな合成音が得られるとともに、合成要
素結合部におけるパラメータの“とび”による異
音の混入を防ぐことが可能となる。
【図面の簡単な説明】
第1図は日本語単語中のCVC、CVMCの出現
累積百分率を示す図、第2図はこの発明の実施例
を示すブロツク図、第3図は第2図中のパラメー
タ平滑部9の具体例を示すブロツク図、第4図は
パラメータ平均化した場合と、しない場合との差
を示す図である。 1:文字系列入力端子、2:合成要素名系列作
成部、3:合成要素名照合部、4:長単位合成要
素名蓄積メモリ、5:音声合成制御部、6:長単
位合成要素パラメータ蓄積メモリ、7:短単位合
成要素パラメータ蓄積メモリ、8:パラメータ読
出部、9:パラメータ平滑部、10:音源生成
部、11:音声合成デイジタルフイルタ、12:
合成音出力端子、21:入力バツフアメモリ、2
2:演算制御部、23:読出制御部、24:出力
バツフアレジスタ、25:乗算器、26:メモ
リ、27:加算器、28:累算レジスタ。

Claims (1)

    【特許請求の範囲】
  1. 1 母音、母音連続又は母音−撥音連続の両側を
    子音ではさんだ形式の音声合成要素の名称を蓄積
    する第1メモリと、その前記各音声合成要素のス
    ペクトル・パラメータを蓄積する第2メモリと、
    2音素連続形式の音声合成要素のスペクトル・パ
    ラメータを蓄積する第3メモリと、音声合成器
    と、合成すべき音声に従つて、前記音声合成要素
    の名称を前記第1メモリを参照し、これに蓄積さ
    れているものについてはその音声合成要素のスペ
    クトル・パラメータを前記第2メモリから読み出
    し、第1メモリに蓄積されていないものについて
    は前記第3メモリから対応するスペクトル・パラ
    メータを読み出し、これら読み出されたスペクト
    ル・パラメータを相互に結合して連続したスペク
    トル・パラメータ時系列を作り出し、これを前記
    音声合成器に供給して連続音声を合成する手段と
    を具備する音声合成方法。
JP58079617A 1983-05-07 1983-05-07 音声合成方法 Granted JPS59204097A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58079617A JPS59204097A (ja) 1983-05-07 1983-05-07 音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58079617A JPS59204097A (ja) 1983-05-07 1983-05-07 音声合成方法

Publications (2)

Publication Number Publication Date
JPS59204097A JPS59204097A (ja) 1984-11-19
JPH04277B2 true JPH04277B2 (ja) 1992-01-06

Family

ID=13695012

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58079617A Granted JPS59204097A (ja) 1983-05-07 1983-05-07 音声合成方法

Country Status (1)

Country Link
JP (1) JPS59204097A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5868099A (ja) * 1981-10-19 1983-04-22 富士通株式会社 音声合成装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5868099A (ja) * 1981-10-19 1983-04-22 富士通株式会社 音声合成装置

Also Published As

Publication number Publication date
JPS59204097A (ja) 1984-11-19

Similar Documents

Publication Publication Date Title
JP3563772B2 (ja) 音声合成方法及び装置並びに音声合成制御方法及び装置
JPH0833744B2 (ja) 音声合成装置
JPH031200A (ja) 規則型音声合成装置
JP2623586B2 (ja) 音声合成におけるピッチ制御方式
JPH04277B2 (ja)
JP2740510B2 (ja) テキスト音声合成方式
JPS5972494A (ja) 規則合成方式
JP2596416B2 (ja) 文・音声変換装置
JPH0642158B2 (ja) 音声合成装置
JPH09179576A (ja) 音声合成方法
JP2577372B2 (ja) 音声合成装置および方法
JPS58168097A (ja) 音声合成装置
JP2900454B2 (ja) 音声合成装置の音節データ作成方式
JP2703253B2 (ja) 音声合成装置
JP2995774B2 (ja) 音声合成方式
JPH0756590A (ja) 音声合成装置、音声合成方法及び記録媒体
JPS5880699A (ja) 音声合成方式
JP2573586B2 (ja) 規則型音声合成装置
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JP2853997B2 (ja) 音声合成方式
JP3297221B2 (ja) 音韻継続時間長制御方式
JPH07129188A (ja) 音声合成装置
JP2942260B2 (ja) 音声合成装置
JPS61270800A (ja) 無声化音声合成方法
JPS6364098A (ja) 音声合成方式