JP2703253B2 - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JP2703253B2
JP2703253B2 JP63040627A JP4062788A JP2703253B2 JP 2703253 B2 JP2703253 B2 JP 2703253B2 JP 63040627 A JP63040627 A JP 63040627A JP 4062788 A JP4062788 A JP 4062788A JP 2703253 B2 JP2703253 B2 JP 2703253B2
Authority
JP
Japan
Prior art keywords
speech
voice
unit
parameter
prosody
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63040627A
Other languages
English (en)
Other versions
JPH01216399A (ja
Inventor
成利 斉藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63040627A priority Critical patent/JP2703253B2/ja
Publication of JPH01216399A publication Critical patent/JPH01216399A/ja
Application granted granted Critical
Publication of JP2703253B2 publication Critical patent/JP2703253B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、自然性の高い合成音声を生成する音声合成
装置及び音声合成方法に関する。
(従来の技術) 従来より種々の音声合成の手法が提唱されており、そ
の1つに規則合成がある。この規則合成は、任意の入力
文字列を解析してその音韻情報と韻律情報とを求め、こ
れらの情報に従って予め定められた規則に基き、上記入
力文字列が示す音声を合成して出力するものである。こ
の規則合成によれば、任意の単語やフレーズの合成音声
を容易に生成することができる。この規則合成によって
生成された合成音声は、了解度の点では高品質である。
しかし、「キ、ク、シ、ス、チ、ツ、ピ、プ、ヒ、フ」
等の無声化する母音を含む単語や文章を音声合成する場
合についても良好な合成音声を得るには、無声化する母
音の音声素片パラメータファイルの音声パワーを適切な
ものに設定しなければならない。しかし、この設定は難
しく、前記音声素片パラメータファイルを作成するに
は、音声のエネルギーバランスの調節や明瞭度を考慮し
て相当の労力が必要となる。女声合成音声を出力するだ
けの規則合成装置では、試聴実験を繰り返し、無声化母
音の音声素片パラメータファイルを作成すればよい。し
かし、同時に複数種類の音声素片パラメータファイルを
備え、複数種類(例えば、女声、男声、子供の声の3種
類)の合成音声を出力することが可能な音声合成装置で
は、合成音声の種類だけ無声化母音の音声素片パラメー
タファイルを作成する必要があり、多大な労力を必要と
していた。
(発明が解決しようとする課題) このように従来の規則合成方式を採り、複数種類の合
成音声が出力可能な音声合成装置を開発するためには、
その種類の数だけ音声素片パラメータファイルを作成し
なければならない。しかし、これら音声素片パラメータ
ファイルは音声パワーの設定や明瞭度の問題から作成す
るのが難しく、特に無声化する母音の音節について、試
聴実験を繰返して作成しなければならず、その作成に多
大な労力を必要するという問題点があった。そこで本発
明は上記の欠点を除去するもので、規則合成される音声
の滑らかさ及び聞きとり易すさを損うことなく複数種類
の音声を合成でき且つ、無声化する母音の音節の音声素
片パラメータファイルの作成労力を軽減できる音声合成
装置及び音声合成方法を提供することを目的としてい
る。
[発明の構成] (課題を解決するための手段) 本発明は、入力文字列を解析して音韻記号列及び韻律
情報を求める文字列解析手段と、合成音声の種類の少な
くとも1種類の無声化母音の音声素片パラメータを格納
すると共に、合成音声の種類に合わせた複数種類の無声
化母音以外の音声素片パラメータを格納する音声素片パ
ラメータ格納手段と、前記文字列解析手段で求めた音声
記号列から、合成音声の種類を示す情報に基づき、前記
音声素片パラメータ格納手段を参照して音声パラメータ
列を生成する音声パラメータ列生成手段と、前記文字列
解析手段で求めた韻律情報及び合成音声の種類を示す情
報に基づいて決定する基本ピッチと音源規則に基づき、
韻律パラメータ列を生成する韻律パラメータ列生成手段
と、前記音声パラメータ列及び前記韻律パラメータ列に
基づき、合成音声を出力する音声合成手段とを設けた構
成を有している。
また、本発明は、入力文字列を解析して音韻記号列及
び韻律情報をそれぞれ求め、この求めた音声記号列に含
まれる音節が無声化母音である場合には予め決められた
特定の種類の音声パラメータを取り出し、また前記文字
列解析手段で求めた音声記号列に含まれる音節が無声化
母音以外である場合には複数の合成音声の種類から指定
された種類の音声素片パラメータを取り出し、音声パラ
メータ列を生成し、前記求めた韻律情報及び、指定され
た合成音声の種類の基づく基本ピッチと音源規則とに従
って、韻律パラメータ列を生成し、前記音声パラメータ
列及び前記韻律パラメータ列に基づき、合成音声を出力
する処理から成っている。
(作用) 本発明の音声合成装置及び音声合成方法において、音
声素片パラメータファイルには、予め、無声化母音以外
の音節については男声、女声、子供の声等合成する音声
の種類別に対応した音声素片パラメータを登録し且つ、
無声化母音の音節は1種類の音声素片パラメータを登録
しておく。音声パラメータ列作成手段は前記音声素片パ
ラメータファイルに登録されている1種類の無声化母音
の音声素片パラメータを、合成する音声の種類にかかわ
りなく共通に参照して、音声パラメータ列を作成する。
(実施例) 以下本発明の一実施例を図面を参照して説明する。第
1図は本発明の音声合成装置の一実施例を示したブロッ
ク図である。1は入力文字列100を解析して、その音韻
記号列200と韻律情報300及び選択情報を求める文字列解
析部である。この文字列解析部1にて求められた音韻記
号列200は、音声パラメータ列生成装置2に前記選択情
報と共に入力され、ここで音声素片パラメータファイル
3を参照して音声パラメータ列400に変換生成される。
一方、前記文字列解析部1で求められた韻律情報300
は、韻律パラメータ列生成装置4に前記選択情報と共に
与えられて、ここで韻律パラメータ列500に変換生成さ
れる。音声パラメータ列生成装置2によって変換生成さ
れた音声パラメータ列400と韻律パラメータ列生成装置
によって変換生成された韻律パラメータ列500は音声合
成器5に入力され、ここで入力されたこれらパラメータ
列400,500に従い且つ所定の合成規則に基づいて、前記
入力文字列に対応した合成音声600が生成出力される。
次に本実施例の動作について説明する。女声、男声、
子供の声等、複数種類の合成音声が出力可能な音声合成
装置では、いずれの種類の合成音を発生するかを選択指
定する選択信号が入力文字列100に付随して必要とな
る。本例では、この選択信号として例えば、α,β,γ
をそれぞれ女声、男声、子供の声を指定する選択信号入
力列とする。第2図は第1図に示した文字列解析部1の
詳細例を示したブロック図である。判別器11は前記選択
信号の種類を判別して男、女、子供のいずれの種類の合
成音出力が選択されているかの選択情報を音声パラメー
タ列生成装置2及び韻律パラメータ列生成装置4に送
る。音声パラメータ列生成装置2は前記選択情報から音
声素片パラメータファイル3の男声、女声、子供の声の
素片パラメータファイルのうちいずれを選択するかを決
め、韻律パラメータ列生成装置4は前記選択情報から男
声、女声、子供の声のいずれに基本ピッチf0を設定する
か又その音源規則を決める。更に、判別器11は上記α,
β,γの選択入力信号以外の入力信号(入力文字列)10
0を音声合成を行うための日本語テキストとみなして、
これら入力信号をテキスト解析部12に渡す。テキスト解
析部12は言語辞書13を用いて入力信号のテキスト解析を
行って音韻記号列200と韻律情報300を求める。このよう
にして求められた音韻記号列200と韻律情報300は音声パ
ラメータ列生成装置2及び韻律パラメータ列生成装置4
に与えられる。音声パラメータ列生成装置2は、先きに
判別器11から入力された選択情報によって、入力される
音韻記号列に対応する音声素片パラメータを音声素片パ
ラメータファイル3から取り出して、補間結合を行って
音声パラメータ列400を生成する。韻律パラメータ列生
成装置4は、先きに判別器11から入力された選択情報に
よって決められる基本ピッチf0及び音源規則と入力され
る韻律情報から、音源生成規則に基づいて韻律パラメー
タ列500を生成する。
ここで、文字列解析部1に入力される選択信号と文字
列が例えば、「β滑らかな音声が得られます。α機能を
選んで下さい。γ画面も表示しますか。」であったとす
る。この場合、音声パラメータ列生成装置2では、まず
選択信号βによって音声素片パラメータファイル3の中
の男声の素片パメータファイルが選択され、また、韻律
パラメータ列生成装置4では、男声基本ピッチf0と音源
生成規則が選択される。他方テキスト解析部12では、
「滑らかな音声が得られます」が言語辞書13を用いて解
析され、上記文字列に対応する音韻記号列200と韻律情
報列300が得られる。従って、音声パラメータ列生成装
置2及び韻律パラメータ列生成装置4にて上記文字列に
対応する音声パラメータ列400及び韻律パラメータ列500
が生成されて、これらパラメータ列が音声合成器5に入
力される。このため、音声合成器5からは男声の規則合
成音による「滑らかな音声が得られます」が出力され
る。同様にして、音声合成器5からは女声の規則合成音
で「機能を選んで下さい」が、続いて子供の規則合成音
で「画像も表示しますか」が出力される。
第3図は上記音声素片パラメータファイル3の構成例
を示した模式図である。音声素片パラメータ3として
は、ケプストラムパラメータ、LPCパラメータ、PARCOR
パラメータ、LSPパラメータ、ホルマントパラメータ等
があり、第3図(A)で示したものは女声素片パラメー
タファイル31、男声素片パラメータファイル32、子供の
声の素片パラメータファイル33及び無声化母音素片パラ
メータ50から成っており、女声、男声、子供の声が出力
可能な音声規則合成装置に用いられるようになってい
る。この音声素片パラメータファイル3には無声化母音
以外の音節(日本語百音節や外来語音節)については女
声、男声、子供の声それぞれの音節を自然音声から分析
してパラメータ化したものが登録されている。また無声
化母音の音節 については、女性アナウンサの自然音声を音声のエネル
ギーバランスや明瞭度を考慮して作成したものを共通の
無声化音声の音声素片パラメータ50として前記音声素片
パラメータファイル3に登録してある。なお、前記無音
化音声の音声素片パラメータは男性アナウンサ又は子供
の声を使って作成しても良いが、本例では1種類だけ登
録されている。
ここで、第1図に示した音声合成装置で を男声合成音声で出力する場合、音声パラメータ列生成
装置2は、「そ」、「き」に関して第3図(A)で示し
た音声素片パラメータファイル3の男声素片パラメータ
32を取り出し、 は無声化母音の共通データである無声化母音素化パラメ
ータ50を取り出して捕間結合を行って、対応する音声パ
ラメータ列400を生成する。女声合成音、子供の声の合
成音を生成する場合も同様である。第3図(B)は音声
素片パラメータファイル3にて無声化母音の音声素片パ
ラメータを男声、女声、子供の声を素片ファイルにそれ
ぞれ持たせた例であり、3つの無声化母音素片パラメー
タに同じものを登録してあるため、実質的には第3図
(A)に示したものと同じものになる。但し、第3図
(A)のように女性アナウンサの発声した無声化母音を
音声分析した無声化母音素片パラメータファイル50を共
用して用いる場合は、男声、子供の声の無声化母音のデ
ータをメモリに記憶しておく必要がなくなり、その分メ
モリが節約できる。ところで、無声化母音のうち特に、 は明瞭度、エネルギーバランスの点から作成しにくいも
のである。そこで本例では、これら については共通データとして無声化母音の音声素片パラ
メータ50に作成し、残りの無声化母音節 はそれぞれの自然音声を各パラメータファイルに登録し
てある。
本実施例によれば、音声素片パラメータ3に登録され
ている無声化母音素片パラメータ50としては例えば女性
の自然音声から作成した一種類だけであるため、従来の
如く、合成音声の種類別に前記無声化母音音声素片パラ
メータを作成する必要がなくなり、この無声化母音音声
素片パラメータの作成労力を大幅に削減することができ
る。しかも、前記1種類の無声化母音音声素片パラメー
タ50を共通データとして、女声の合成音作成の時は勿
論、男声、子供の声の合成音作成時に用いるため、いず
れの合成音も滑らかさ、聞き易さ等を損うことがない自
然性の高い高品質のものを規則合成することができる。
[発明の効果] 以上記述した如く本発明の音声合成装置及び音声合成
方法によれば、規則合成される音声の滑らかさ及び聞き
とり易すさを損うことなく、複数種類の音声を合成でき
且つ、無声化する母音の音節の音声素片パラメータファ
イルの作成労力を軽減できる効果がある。
【図面の簡単な説明】
第1図は本発明の音声合成装置の一実施例を示したブロ
ック図、第2図は第1図に示した文字列解析部の詳細例
を示したブロック図、第3図は第1図に示した音声素片
パラメータファイルの構成例を示した模式図である。 1……文字解析部 2……音声パラメータ列生成装置 3……音声素片パラメータファイル 4……韻律パラメータ列生成装置 5……音声合成器、11……判別器 12……テキスト解析部、13……言語辞書

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】入力文字列を解析して音韻記号列及び韻律
    情報を求める文字列解析手段と、 合成音声の種類の少なくとも1種類の無声化母音の音声
    素片パラメータを格納すると共に、合成音声の種類に合
    わせた複数種類の無声化母音以外の音声素片パラメータ
    を格納する音声素片パラメータ格納手段と、 前記文字列解析手段で求めた音声記号列から、合成音声
    の種類を示す情報に基づき、前記音声素片パラメータ格
    納手段を参照して音声パラメータ列を生成する音声パラ
    メータ列生成手段と、 前記文字列解析手段で求めた韻律情報及び合成音声の種
    類を示す情報に基づいて決定する基本ピッチと音源規則
    に基づき、韻律パラメータ列を生成する韻律パラメータ
    列生成手段と、 前記音声パラメータ列及び前記韻律パラメータ列に基づ
    き、合成音声を出力する音声合成手段とを具備すること
    を特徴とする音声合成装置。
  2. 【請求項2】入力文字列を解析して音韻記号列及び韻律
    情報をそれぞれ求め、 この求めた音声記号列に含まれる音節が無声化母音であ
    る場合には予め決められた特定の種類の音声パラメータ
    を取り出し、また前記文字列解析手段で求めた音声記号
    列に含まれる音節が無声化母音以外である場合には複数
    の合成音声の種類から指定された種類の音声素片パラメ
    ータを取り出し、音声パラメータ列を生成し、 前記求めた韻律情報及び、指定された合成音声の種類に
    基づく基本ピッチと音源規則とに従って、韻律パラメー
    タ列を生成し、 前記音声パラメータ列及び前記韻律パラメータ列に基づ
    き、合成音声を出力することを特徴とする音声合成方
    法。
JP63040627A 1988-02-25 1988-02-25 音声合成装置 Expired - Lifetime JP2703253B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63040627A JP2703253B2 (ja) 1988-02-25 1988-02-25 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63040627A JP2703253B2 (ja) 1988-02-25 1988-02-25 音声合成装置

Publications (2)

Publication Number Publication Date
JPH01216399A JPH01216399A (ja) 1989-08-30
JP2703253B2 true JP2703253B2 (ja) 1998-01-26

Family

ID=12585780

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63040627A Expired - Lifetime JP2703253B2 (ja) 1988-02-25 1988-02-25 音声合成装置

Country Status (1)

Country Link
JP (1) JP2703253B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3083624B2 (ja) 1992-03-13 2000-09-04 株式会社東芝 音声規則合成装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5176981B2 (ja) * 2009-01-22 2013-04-03 ヤマハ株式会社 音声合成装置、およびプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
小坂ら「単語音声中における無声化母音、長母音、副モーラ音の音響的特徴について」信学技報EA85−32(1985)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3083624B2 (ja) 1992-03-13 2000-09-04 株式会社東芝 音声規則合成装置

Also Published As

Publication number Publication date
JPH01216399A (ja) 1989-08-30

Similar Documents

Publication Publication Date Title
JPH0833744B2 (ja) 音声合成装置
US6212501B1 (en) Speech synthesis apparatus and method
JPH08335096A (ja) テキスト音声合成装置
JP2703253B2 (ja) 音声合成装置
van Rijnsoever A multilingual text-to-speech system
JP3113101B2 (ja) 音声合成装置
JP3081300B2 (ja) 残差駆動型音声合成装置
JPH037995A (ja) 歌音声合成データの作成装置
Hinterleitner et al. Speech synthesis
JPS62284398A (ja) 文・音声変換装置
JPH0358100A (ja) 規則型音声合成装置
JP2573586B2 (ja) 規則型音声合成装置
JPH01321496A (ja) 音声合成装置
JPH0635913A (ja) 文章読み上げ装置
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JP3088211B2 (ja) 基本周波数パタン生成装置
JPH1011083A (ja) テキスト音声変換装置
JP2624708B2 (ja) 音声合成装置
JPH0553595A (ja) 音声合成装置
JP2573587B2 (ja) ピッチパタン生成装置
JPH0572599B2 (ja)
JPH06168265A (ja) 言語処理装置および音声合成装置
JPH04243299A (ja) 音声出力装置
JPH08160990A (ja) 音声合成装置
JPH06138894A (ja) 音声合成装置及び音声合成方法