JP3368948B2 - 音声規則合成装置 - Google Patents

音声規則合成装置

Info

Publication number
JP3368948B2
JP3368948B2 JP24799493A JP24799493A JP3368948B2 JP 3368948 B2 JP3368948 B2 JP 3368948B2 JP 24799493 A JP24799493 A JP 24799493A JP 24799493 A JP24799493 A JP 24799493A JP 3368948 B2 JP3368948 B2 JP 3368948B2
Authority
JP
Japan
Prior art keywords
power
envelope
rule
speech
vowel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP24799493A
Other languages
English (en)
Other versions
JPH07104790A (ja
Inventor
知樹 濱上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Secom Co Ltd
Original Assignee
Secom Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Secom Co Ltd filed Critical Secom Co Ltd
Priority to JP24799493A priority Critical patent/JP3368948B2/ja
Publication of JPH07104790A publication Critical patent/JPH07104790A/ja
Application granted granted Critical
Publication of JP3368948B2 publication Critical patent/JP3368948B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 【0001】 【産業上の利用分野】本発明は、音声規則合成装置に関
し、特に、音声規則合成装置におけるパワー包絡を作成
する技術に関するものである。 【0002】 【従来の技術】従来、音声規則合成におけるパワー制御
方法は、音源振幅パタン生成部において、スペクトルパ
タンに同期したパワーパタンを滑らかに結合、変形する
程度の処理しか行われていない。つまり、母音の中心位
置における1点のパワーを規則を用いて導出し、各母音
の中心位置間を適当に補間することにより、スペクトル
パタンに同期した自然発声パワーパタンを滑らかに変形
する方法が一般的であった。もとより、音声規則合成に
おいては、スペクトル制御等の工夫と比較すると、パワ
ー方法制御はとりたてて検討された例は極めて少ない。 【0003】ところが、最近の研究調査の結果、前記パ
ワー制御方法においては、パワー包絡の形状が継続時間
を始めとする他の知覚要素と無関係でない事が明らかと
なってきた(濱上等:「パワー包絡が聴覚に与える影響
について」日本音響学会講演論文集、平成4年11
月)。一方、母音部エネルギー重心位置を基準とした継
続時間長制御を行う規則音声合成方式(加藤:「母音部
エネルギー重心位置に着目した日本語リズム規則につい
て」電子情報通信学会技術研究報告(平成5年5月22
日))を用いる場合、エネルギー重心の位置とパワー包
絡の形状は直接的な相関から、継続時間長規則に従って
パワー包絡を制御する必要性がでてくる。 【0004】 【発明が解決しようとする課題】これらの立場からは、
パワー包絡の形状に対する新しいモデルが必要となる。
さらに、規則合成に用いるパワー制御モデルを考える上
でそれに望まれる事は、目的とする物理的特徴を直接規
則で制御できるモデルが得られることである。本発明
は、音声規則合成装置において、自然なパワー包絡を作
り、合成音声の品質を向上させることを目的とするもの
である。 【0005】 【課題を解決するための手段】本発明者は、高品質な規
則音声合成を実現するためには、パワーパタンの生成過
程を、より聴覚への影響を考慮した精度の高いモデルで
表し、それをパワーパタンに適用することが不可欠であ
ると考えた。なぜならば、従来の音声合成方式の改良が
主にスペクトルやピッチといった重要なパラメータに施
された結果、これまで重要視されていなかったパワー包
絡の形状が、合成音の品質劣化の原因として無視できな
くなってきたためである。 【0006】また、一般的な音声規則合成方式における
音韻継続時間長生成部では、母音のエネルギー重心位置
を元に各音韻の継続時間長を決定しており、パワー包絡
の概形そのものが、音韻継続時間長感覚に影響を与える
ことが確かめられているため、優れた継続時間長規則を
正確に合成音声に反映させられるようなパワー包絡モデ
ルが必要であると考えた。 【0007】始めに、自然発声されたパワー包絡を元
に、本発明のパワー包絡モデルの成り立ちを説明する。
図4は、「爆音が……」と発声した場合の音声パワー包
絡を示す。横軸に各音声をとり、縦軸は文章中の有声音
ブロックのピークパワーを、その文章中のピークパワー
で正規化したものである。これを結ぶ包絡がマクロ包絡
の概形となる。 【0008】ここで数回にわたり同様の発声を行った場
合、パワーの平均値で正規化された包絡の概形は、ある
ばらつきの範囲内(±4db)に収まり、発話中の自然
性に対するパワー変動の検知限界に一致していることが
分かった。すなわち、自然発声中には、もともと、検知
限界内のある程度のばらつきがあるもののある決まった
大まかなパワー概形の存在が認められる。これをマクロ
包絡とする。マクロ包絡は、発声中、母音のように安定
して大きなパワーを出す声帯振動を音源とする有声音の
パワー変化である。 【0009】一方、子音に特徴的な鋭いパワー変化が生
ずる箇所が存在する。この短時間のパワー変化は、***
等の破裂や摩擦などによって、子音のスペクトル変化に
同期して発生するものである。これをミクロ包絡とす
る。ミクロ包絡は子音の音韻性にとって極めて重要な役
割をもつ。本発明は、以上の原理に基づき、前記課題を
達成するため、音声規則合成装置において、パワー制御
部が、母音を始めとする有声音で特徴付けられる音声パ
ワーの緩やかな変化を制御するマクロ包絡モデルと、子
音の調音によって特徴付けられる細かいパワー変化を制
御するミクロ包絡モデルを、母音−子音−母音の組合せ
毎に記憶したデータベースを作成し、このデータベース
を用いて音声パワー包絡を形成する。 【0010】 【作用】本発明のパワー制御方法によれば、自然のパワ
ー包絡の母音の中心パワーを直線で結んだ大まかな概形
にある代表的なパターンを利用する。このパターンから
±4db程度の変化では聴覚上違和感を生じない。これ
により、母音の中心パワーを結ぶような大まかな概形
(マクロパタン)を母音中心パワーという少ないパラメ
ータで表現できる。一方、子音に特徴的に見られる鋭い
パワー変化(ミクロパターン)は、子音のスペクトルパ
ラメータと同期させて、マクロパタンと分離して扱うこ
とが可能となる。 【0011】合成すべき音声のパワーパタンを、母音の
中心パワーと、スペクトルに同期してデータベース化さ
れている正規化パワーパタンを用いてマクロな変化とミ
クロな変化で表現することによって、自然な合成音声が
得られるようになる。また、音声規則合成を実施する際
に、パワー包絡を規則によって決定するために、必要な
モデルとその制御方法を確立できるので、音声の低ビッ
トレート伝送方法において、パワーパラメータの情報量
削減に著しい効果を奏する。 【0012】自然発声された文章のパワー包絡中から、
前記の分離法を用いてマクロ包絡とミクロ包絡を求め再
合成した結果、自然音声のパワーパタンと遜色ない包絡
が得られることが確かめられた。また、このパワー包絡
を用いて合成された音声は、自然のパワー包絡を用いて
合成された合成音声と比べて、区別がつかないことが確
かめられた。 【0013】 【実施例】以下本発明の実施例について図面を参照して
説明する。図1は本発明の実施例に係る日本語音声合成
システムの構成を示す図である。文章入力装置1により
音声合成しようとする合成文章が入力される。テキスト
解析部2は、発音情報生成規則3を用いてこの合成文章
を解析し、音声合成処理に必要なアクセントの情報、ポ
ーズ、母音の無音声化などといった発音情報を加えた音
韻記号列に変換する。音韻継続時間長生成部4は、テキ
スト解析部2によって生成された音韻記号列をリズム規
則5により音韻継続時間長を決定する。 【0014】音響振幅パタン生成部6は、音声のパワー
包絡をパワー規則7により決定する。ピッチパタン生成
部8は、韻律制御規則9から各アクセント句について点
ピッチパタンを決めて、それらを補間して連続点ピッチ
パタンを生成する。音源生成部10は、前記パワーパタ
ンと前記ピッチパタンをもとに音源を生成する。スペク
トルパタン生成部11は、音韻性向上規則12により、
母音・子音といった音韻の種類から、音声合成基本単位
データベース13を検索し、音韻結合規則14により各
音韻のスペクトルを結合し、フォルマントパタンを作成
する。音声合成器15は、前記音源生成部10から得ら
れた音源情報と前記スペクトルパタン生成部11から得
られたフォルマントパタンから合成音声を作成する。作
成された合成音声はスピーカ16により外部に発声され
る。 【0015】次に、本発明の特徴部である音源振幅パタ
ン生成部6のパワー制御方法について説明する。最初に
マクロ包絡の分離法を図2を用いて述べる。図2に自然
音声パワー包絡21の一部が示される。図において、横
軸は時間で、Vは母音が発声された時、Cは子音が発声
された時を表す。縦軸はパワーをdBで表している。 【0016】まず、各母音V,Vについて、リズム規則
5が与える母音エネルギー重心(CEGV)時刻がアン
カーポイントとして決定される。次に、CEGV間のパ
ワー変化をCEGV間の子音に応じて合成する。そのた
めに、子音ターゲット(TC)という概念を導入する。
TCは「分割係数α」「ディップ係数β」の2つのパラ
メータからなり、予めVCV(母音−子音−母音)単位
毎にデータベース化する。 【0017】分割係数αは、VCV中の子音継続時間に
おいて最もパワーが少なくなる点を子音継続時間の内分
比で表す。ディップ係数β、VCVの2つのCEGVを
結んだ線分から見て、子音区間で最もパワーが小さくな
る点の落ち込み具合を、dBで表す。マクロ包絡22
は、先行するCEGVから始まりTCを余弦関数の形で
通過し、後続するCEGVに至る。このαとβによっ
て、VCVの調音の変化に伴うパワー変化を制御する。
このように、マクロ包絡22とは、ある母音から子音の
調音点を通過して次の母音へ至る過程における有声音パ
ワーの滑らかな変化をモデル化したものである。 【0018】次に、ミクロ包絡について図3を用いて述
べる。ミクロ包絡は、マクロ包絡22だけでは表し切れ
ない子音音源等の比較的変化の速いパワーパタンを扱
う。ミクロ包絡はデータベース化された正規化ミクロ包
絡を時間伸縮させることによって得る。予めデータベー
ス化される正規化ミクロ包絡の作り方は以下の通りであ
る。 【0019】自然発声のVCVパワー包絡31から、前
述の方法によりマクロ包絡22を求める。VCV波形の
子音区間を子音の波形特徴に応じた窓でパワー31を再
分析する。この再分析パワー包絡32からマクロ包絡2
2を差し引き差分パワー33を求める。差分パワーの子
音区間を数分の1程度の固定長に圧縮し、正規化ミクロ
包絡34とする。ここでは、10サンプルに圧縮し、正
規化ミクロ包絡34とする。 【0020】このミクロ包絡34は、VCVの組合せ毎
にパラメータ化される。次に、図1の音源振幅パタン生
成部6で振幅パタンを生成する方法について述べる。パ
ワー規則6には、規則合成に用いる音声の基本単位とし
て、VCVの組合せ発声パタンがデータベース化されて
いる。前述のマクロ包絡、ミクロ包絡の分離方法を用い
て各VCV毎に子音ターゲットパラメータと正規化ミク
ロ包絡を求めておく。 【0021】音韻継続時間長生成部4が与える母音部エ
ネルギー重心位置に、当該母音の種類と、その時点で韻
律制御規則が与える点ピッチ周波数、および当該文内文
節番号、文節内モーラ番号によって母音部重心パワー
(Pv)が決定される。Pv1,Pv2のパワーを持つ
2つの母音V1,V2間の子音Cについて、子音ターゲ
ットと正規化ミクロ包絡が検索され、与えられた継続時
間長内に当てはまるように伸縮操作され、マクロ包絡、
ミクロ包絡を作りこれを足し合わせた結果、合成パワー
方法が得られる。 【0022】 【発明の効果】以上説明したように、本発明によれば、
合成音の自然性に強く影響するマクロ包絡と、音韻性に
影響があるミクロ包絡を独立に扱うモデルを用いること
によって、容易に自然音声の形状に近いパワー包絡を生
成することができる。これにより、合成音声の品質を向
上させることができる。
【図面の簡単な説明】 【図1】本発明の実施例の音声合成システムの構成を示
す図。 【図2】図1のパワー規則に利用するマクロ包絡の求め
方を説明するための図。 【図3】図2のパワー規則に利用するミクロ包絡の求め
方を説明するための図。 【図4】自然発声におけるマクロ包絡のばらつきを説明
するためのグラフ。 【符号の説明】 1…文章入力装置 2…テキスト解析部 3…発音情報生成規則 4…音韻継続時間長生成部 5…リズム規則 6…音響振幅パタン生成部 7…パワー規則 8…ピッチパタン生成部 9…韻律制御規則 10…音源生成部 11…スクペクトルパタン生成部 12…音韻性向上規則 13…音声合成基本単位データベース 14…音韻結合規則 15…音声合成器 16…スピーカ 21…自然音声パワー包絡 22…マクロ包絡 31…VCVパワー包絡 32…再分析パワー包絡 33…差分パワー 34…正規化ミクロ包絡

Claims (1)

  1. (57)【特許請求の範囲】 【請求項1】 音声規則合成装置において、パワー制御
    部が、母音を始めとする有声音で特徴付けられる音声パ
    ワーの緩やかな変化を制御するマクロ包絡モデルと、子
    音の調音によって特徴付けられる細かいパワー変化を制
    御するミクロ包絡モデルを、母音−子音−母音の組合せ
    毎に記憶したデータベースを具備し、このデータベース
    を用いて音声パワー包絡を形成することを特徴とする音
    声規則合成装置。
JP24799493A 1993-10-04 1993-10-04 音声規則合成装置 Expired - Fee Related JP3368948B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24799493A JP3368948B2 (ja) 1993-10-04 1993-10-04 音声規則合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24799493A JP3368948B2 (ja) 1993-10-04 1993-10-04 音声規則合成装置

Publications (2)

Publication Number Publication Date
JPH07104790A JPH07104790A (ja) 1995-04-21
JP3368948B2 true JP3368948B2 (ja) 2003-01-20

Family

ID=17171616

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24799493A Expired - Fee Related JP3368948B2 (ja) 1993-10-04 1993-10-04 音声規則合成装置

Country Status (1)

Country Link
JP (1) JP3368948B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7630896B2 (en) 2005-03-29 2009-12-08 Kabushiki Kaisha Toshiba Speech synthesis system and method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7630896B2 (en) 2005-03-29 2009-12-08 Kabushiki Kaisha Toshiba Speech synthesis system and method

Also Published As

Publication number Publication date
JPH07104790A (ja) 1995-04-21

Similar Documents

Publication Publication Date Title
Saino et al. An HMM-based singing voice synthesis system
US6625575B2 (en) Intonation control method for text-to-speech conversion
US8719030B2 (en) System and method for speech synthesis
Macon et al. A singing voice synthesis system based on sinusoidal modeling
US7010488B2 (en) System and method for compressing concatenative acoustic inventories for speech synthesis
Liu et al. High quality voice conversion through phoneme-based linear mapping functions with straight for mandarin
JP2000305582A (ja) 音声合成装置
US20040030555A1 (en) System and method for concatenating acoustic contours for speech synthesis
Aryal et al. Foreign accent conversion through voice morphing.
JP3576840B2 (ja) 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体
JPH0887296A (ja) 音声合成装置
US7280969B2 (en) Method and apparatus for producing natural sounding pitch contours in a speech synthesizer
JP2904279B2 (ja) 音声合成方法および装置
Saitou et al. Analysis of acoustic features affecting" singing-ness" and its application to singing-voice synthesis from speaking-voice.
JP3368948B2 (ja) 音声規則合成装置
JP3437064B2 (ja) 音声合成装置
JP5175422B2 (ja) 音声合成における時間幅を制御する方法
JPH0580791A (ja) 音声規則合成装置および方法
Waghmare et al. Analysis of pitch and duration in speech synthesis using PSOLA
JP2848604B2 (ja) 音声合成装置
JP3078073B2 (ja) 基本周波数パタン生成方法
Ngo et al. Toward a rule-based synthesis of vietnamese emotional speech
Lai F0 control model for mandarin singing voice synthesis
JPH0836397A (ja) 音声合成装置
JP2004206144A (ja) 基本周波数パタン生成方法、及びプログラム記録媒体

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees