JPS59204097A - 音声合成方法 - Google Patents

音声合成方法

Info

Publication number
JPS59204097A
JPS59204097A JP58079617A JP7961783A JPS59204097A JP S59204097 A JPS59204097 A JP S59204097A JP 58079617 A JP58079617 A JP 58079617A JP 7961783 A JP7961783 A JP 7961783A JP S59204097 A JPS59204097 A JP S59204097A
Authority
JP
Japan
Prior art keywords
speech
memory
elements
speech synthesis
synthesis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58079617A
Other languages
English (en)
Other versions
JPH04277B2 (ja
Inventor
大和 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP58079617A priority Critical patent/JPS59204097A/ja
Publication of JPS59204097A publication Critical patent/JPS59204097A/ja
Publication of JPH04277B2 publication Critical patent/JPH04277B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Liquid Developers In Electrophotography (AREA)
  • Audible-Bandwidth Dynamoelectric Transducers Other Than Pickups (AREA)
  • Flexible Shafts (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 この発明は単語より小さな音声要素に基づき任意の連続
音声を合成する音声合成方法に関するものである。
〈従来技術〉 任意の語・文の音声を合成する方式には、従来から音声
の最も基本的要素である音素(a+1+p、に、s・・
・など音声記号に相当する要素)から合成する方式と、
2音素連続の組(母音−子音、母音−母音、子音−子音
)であるDyad、VCV(母音−子音−母音)などの
音素の複合要素から合成する方式とが知られている。音
素から合成する方式は音素から他の音素への動作部分の
実現法、調音結合VC伴なう変形などを「規則」によっ
て実現せねばならないが、現状ではこれらの知見がすべ
て明らかになっているわけではなく、必ずしも良い品質
の合成音を提供してはくれない。音素の複合要素による
方法は、比較的現笑的方法であシ実用に供されている例
もある。vCVやCvを要素とする従来の方式では、合
成要素の結合を主に旬、音部で行っている。母音部は最
も聞こえが大きい部分であり、こ\でスペクトル・パラ
メータの結合歪みや音色の変化が生じ、合成に声の品質
をそこなうという欠点があった。
〈発明の目的〉 この発明は、合成音声の品質向上を図るプこめ、従来の
複合要素の欠点を除去した新たな要素による音声合成方
法を提供するものである。
〈発明の原理〉 すでに述べたように母音定常部における合成要素の結分
は、合成偶の品質に悪影響を及ぼす可能性がある。)そ
こでcvc(c:子音、■=母音)型の合成要素を設定
する。この要素は母音部分が先行子音と後続子音の影響
を受けたものになっている。
すなわち、調音結合の影響を自然と含み、なめらがな口
の動きを実現できる要素である。−ヰだ、合成音にリズ
ム感を与えるためm音゛の持続時間を適切に設定しなげ
ればならないが、CVC型要素では両側7−−7jの影
響で現実的な母音部が実現されている。
発音が1音節としてなされる(母音−扮音)、(m音と
は音lの連続)も1つの要素の中に含1せると都合が良
い。何故なら、これらの音韻連続は、緊密度が非常に強
いばかりでなく、日本語の中での出現頻度の高い音韻連
続であるからである。
以上述べたように、この発明では音声合成要素の基本形
式としてCVC及びCVIVIC(Mは撥右N又は母音
1)を設定する。しかし、[]本語の音韻の種類を考慮
すると、この基本形式の音声合成方法(d6千棟を越す
ため、音声合成要素の数としては現実的な個数を越えて
いる。実際にはこれらの音声合成要素の中には、日本語
としてほとんと用いられない音韻の連続もあるであろう
し5、例え用いられるにせよ出現頻度の極めて小さいも
のもあるに違いない。そこでこの発明では日本語の音韻
の出現頻度に基づき、使用頻度の高いものは、CVC又
はCV M Cを使用し、使用頻度の低いものについて
は、CV、VC,VV、VN、NC;!zどの要素を用
いて合成することにより、合成要素の蓄積メモリの低減
と合成要素作成の作業量を太11」に小なくする。第1
図は一例と1〜て日本語の辞’#:M、出し語の分析か
ら得られたCVC及びCViVICの累KRM分率を示
すものであるが、出現類1にの高い約1.000個のC
vC及びCV ivI C音韻連続で[」本語単語の9
0%がカバーされることが鯉解される。従ってこのよう
な1000個の長単位要素とCV、VC,VV、VN、
CN等の短単位要素を用いて合成を行なう。
〈実施例〉 第2図はこの発明の一実施例を示す。入力端子]」:す
、合成すべき詔や文の文字系列が入力されると、合成要
素名系列作成部2はいったん人力文字系列をCVC又(
d CV M Cの長単位要素の系列に分割(〜、その
各長単位要素の要素名を合成要素名照合部3に送る。合
成要素名照合部3は、多単位合成要素名M槓ノモリ4よ
り音声合成要素の名称を読出(−1これと合成要素名系
列作成部2より転送さ′I′1てきた長単位要素名との
照合をとり、メモリ4に音声合成要素の名称があるか否
かを判定し、その結果を合成要素名系列作成部2に転送
する。長単位合成要素名蓄積メモリ4に該当の長単位要
素がなかった場合、合成要素名系列作成部はそのなかっ
た長単位要素CVCをcv 、vcに、CV ivI 
CをCV、VM、MCの各短単位要素の系列に分割する
。例えば、 sad<ura、wa kireidesu  (桜は
きれいて丁)はsak + kur +raw+wa 
kir 十re + ei 十1d−)−des −1
−su となり、下線部は[reid 〕という長単位要素の音
声合成要素がなかつたために、3つの短単位要素に分割
した例である。なお、語尾では〔Wa〕、〔Su〕のよ
うに短単位要素が用いられる。
上記のようにして合成要素名系列作成部2から合成要素
名系列が得られると、その系列は音声合成制御部5に送
られる。各種のCVCとCVMCについては長単位合成
要素パラメータ蓄積メモリ6に、すべてのCV、VCな
どについては短単位合成要素パラメータ蓄積メモリ7に
それぞれ音声合成スペクトルパラメータが蓄えられてい
る。音声合成制御部5は、パラメータ読出部8を制御し
て人力された合成要素名系列の各音声合成要素に対する
パラメータをメモリ6.7の何れからか抗み出し、その
情YUをパラメータ平滑部9に送る。
パラメータ平滑部9では、音声合成要素結合部分及びそ
の近傍でスペクトルパラメータ(I)ARCOR係数、
LSPパラメータ、ポルマントなト)及び振幅に関して
以下のような荷重平均処理を行ない、パラメータを平滑
化する。
f+1 P f−悉〜M、(Pf 但し、Σ Wj二1 −−1 この処理を音声合成要素の接合部の前後数フレームに渡
って行う。
第3図はパラメータ平滑部9の実施例を示すものでアリ
、合成要素のパラメータ蓄積メモリ6゜7から読み出さ
れた音声合成要素の・くラメータはいったん人力バッフ
ァメモリ21に蓄積σれる。
入力バッファメモリ21はダブルバッファになっており
、次に続く音声合成要素のパラメータも同時に蓄積され
る。演算制御部22はパラメータの平滑演算を制御する
部分であり、平滑処理の不必要な合成要素の区間では読
出制御部23を介してフレーム毎にパラメータを出力バ
ッファレジスフ24に転送する。音声合成要素の結合部
近傍のパラメータ平滑区間では荷重平均処理を行う窓区
間のパラメータが入力バッファメモリ21から11貝次
仇出され、乗算器25によってメモリ26に蓄積されて
いる重み係数との積がとられるとともに、加算器27、
累算レジスタ28によって積和演算がなされ、平滑化さ
れた窓中心のフレームのパラメータ1直が出力バッファ
レジスフ24に送られる。
1合成要素全フレームのパラメータの出力バッファレジ
スタ24への転送が終了すると、次の音声合成要素のパ
ラメータが入カバソファメモリ2Jに書き込寸れ、上記
と同様の動作が繰返される。
なお重み係数の窓区間内での包絡は三角波形、ガウス波
形など中心部が最大となるものである。
この」:うな処理を行う前のLSPパラメータの時系列
の例を第4図Aに、そのLSPパラメータの時系列に前
記平均化処理を行った例を第4図13に示す。パラメー
タの平均化処理1により例えば、「ザ」と「グ」の結合
部31、「ル」と「マ」との結合部32はそれぞれ結合
部33 、3’4とな9合成音になめらかさを力えると
ともに、接合部のパラメータ値の急変に帰因する異音の
混入を避けることができる。
第2図の説明に戻って、パラメータ平滑部9で音声合成
要素のパラメータ時系列ができると、音声合成側1i1
=11部5はl−1源生成部]Oよりの駆動音源化−シ
)を音パー・合成テイジタルフィルタ11へ供給シ、そ
のデイジタルフイルり11のフィルり1寺性がパラメー
タ平t1″:’ FilS9からのパラメータ時系列に
より制御されて、合成音出力端1子12に最終的な合成
音声信号が出力される。詮源生ノ戊部10及び音声合成
テイジタルフィルタ11は音声合成器を構成している。
〈効 果〉 以上説明したように、この発明ではCVC及びCV M
 Cを音声合成の基本要素として用いるため、聞こえの
大きい母音部でのパラメータの線形結合が避けられ、調
音結合の影響が自然と含まれ、なめらかな口の動きが実
現され、従来以上に良い品質の合成音が得られるばかり
でなく、C■、VC、VV 、VN型合成要素を併用す
ることにより、音声合成要素の総数を減少せしめ、装置
を経済的に実現できる利点がある。捷た、音声合成要素
の結合に際してパラメータの平滑化処理をほどこす場合
は滑らかな合成音が得られるとともに、合成要素結合部
におけるパラメータの”とび″による異音の混入を防ぐ
ことが可能となる。
【図面の簡単な説明】
第1図は日本語単語中のCVC、CVMCの出現累積百
分率を示す図、第2図はこの発明の実施例を示すブロッ
ク図、第3図は第2図中のパラメ−り平滑部9の具体例
を示すブロック図、第4図はパラメータ平均化した場合
と、しない場合との差を示す図である。 に文字系列入力端子、2:合成要素名系列作成部、3:
合成要素名照合部、4:長年位合成要素名蓄積メモリ、
5:音声合成制御部、6:長単位合成要素パラメータ蓄
積メモリ、7:短単位合成要素パラメータ蓄積メモリ、
8:パラメータ読出部、9:パラメータ平滑部、10:
音源生成部、11:音声合成テイジタルフィルタ、12
:合成音出力端子、21:入カッ・ラフアノモリ、22
:演算制御部’1 23:ffl出劉徊1n15.24
 :出力バッファレジスタ、25:乗算器、26:メモ
リ、27:加算器、28:累遭ニレジスク。 特許出願人・ 日本電信電話公社 代 理  人  草  野    卓 オ 1 図 −CVC、!、−、1−7,1”  CVMCオX頌C
t′yP2  図 左 3 図 オ 4 図 A 力    す゛グ′  ル   マ    カ゛′yP
 4 図B

Claims (1)

    【特許請求の範囲】
  1. (1)母音、母音連続又は母音−撥音連続の両側を子音
    ではさんだ形式の音声合成要素の名称を蓄積する第1メ
    モリと、その前記各音声合成要素のスペクトル・パラメ
    ータを蓄積する第2メモリと、2音素連続形式の音声合
    成要素のスペクトル・・くラノークを蓄積する第3メモ
    リと、音声合成器と、合成すべき音声に従って、前記音
    声合成要素の名称を前記第1メモリを参照し、これに蓄
    積されているものについてはその音声合成要素のスペク
    トル・パラメータを前記第2メモリから読み出し、第1
    メモリに蓄積されでいないものについては前記第3メモ
    リから対応するスペクトル・パラメータを読み出し、こ
    れら読み出されたスペクトル・パラメータを相互に結合
    して連続したスペクトル・パラメータ時系列を作シ出し
    、これを前記音声合成器に供給して連続音声を合成する
    手段とを具備する音声合成方法。
JP58079617A 1983-05-07 1983-05-07 音声合成方法 Granted JPS59204097A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58079617A JPS59204097A (ja) 1983-05-07 1983-05-07 音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58079617A JPS59204097A (ja) 1983-05-07 1983-05-07 音声合成方法

Publications (2)

Publication Number Publication Date
JPS59204097A true JPS59204097A (ja) 1984-11-19
JPH04277B2 JPH04277B2 (ja) 1992-01-06

Family

ID=13695012

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58079617A Granted JPS59204097A (ja) 1983-05-07 1983-05-07 音声合成方法

Country Status (1)

Country Link
JP (1) JPS59204097A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5868099A (ja) * 1981-10-19 1983-04-22 富士通株式会社 音声合成装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5868099A (ja) * 1981-10-19 1983-04-22 富士通株式会社 音声合成装置

Also Published As

Publication number Publication date
JPH04277B2 (ja) 1992-01-06

Similar Documents

Publication Publication Date Title
JP3294604B2 (ja) 波形の加算重畳による音声合成のための処理装置
Childers et al. Voice conversion: Factors responsible for quality
JPS62160495A (ja) 音声合成装置
JPH031200A (ja) 規則型音声合成装置
JPS59204097A (ja) 音声合成方法
JPH1020887A (ja) 音声処理装置のピッチ抽出方法
JP3622990B2 (ja) 音声合成装置及び方法
JP2740510B2 (ja) テキスト音声合成方式
JPS6097396A (ja) 音声合成装置
JPS5888798A (ja) 音声合成方式
Ohtsuka et al. Aperiodicity control in ARX-based speech analysis-synthesis method
JPH09179576A (ja) 音声合成方法
JP3614874B2 (ja) 音声合成装置及び方法
JPS58168097A (ja) 音声合成装置
JP2900454B2 (ja) 音声合成装置の音節データ作成方式
JPS5880699A (ja) 音声合成方式
JP2853997B2 (ja) 音声合成方式
Glinski Diphone speech synthesis based on a pitch-adaptive short-time Fourier transform
JPS61270800A (ja) 無声化音声合成方法
Sassi et al. A text-to-speech system for Arabic using neural networks
JP2573587B2 (ja) ピッチパタン生成装置
JPS63285597A (ja) 音素接続形パラメ−タ規則合成方式
JPS63285596A (ja) 音声合成における発話速度変更方式
JPS5965897A (ja) 残差信号符号化方法
JPS6325700A (ja) 長音結合方法