JPH0695692A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH0695692A
JPH0695692A JP4244645A JP24464592A JPH0695692A JP H0695692 A JPH0695692 A JP H0695692A JP 4244645 A JP4244645 A JP 4244645A JP 24464592 A JP24464592 A JP 24464592A JP H0695692 A JPH0695692 A JP H0695692A
Authority
JP
Japan
Prior art keywords
voice
speech
synthesized
units
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4244645A
Other languages
English (en)
Other versions
JP2886747B2 (ja
Inventor
Naoto Iwahashi
直人 岩橋
Yoshinori Kosaka
芳典 匂坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
A T R JIDO HONYAKU DENWA KENKYUSHO KK
Original Assignee
A T R JIDO HONYAKU DENWA KENKYUSHO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by A T R JIDO HONYAKU DENWA KENKYUSHO KK filed Critical A T R JIDO HONYAKU DENWA KENKYUSHO KK
Priority to JP4244645A priority Critical patent/JP2886747B2/ja
Publication of JPH0695692A publication Critical patent/JPH0695692A/ja
Application granted granted Critical
Publication of JP2886747B2 publication Critical patent/JP2886747B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 この発明は適切な音声単位セットを構成する
ことにより、音声単位間の接続によって生じるスペクト
ルの不連続を軽減でき、より人間の声に近い自然な合成
音声を出力できるような音声合成装置を提供することを
主要な特徴とする。 【構成】 入力部1から韻律パラメータ生成部2に出力
した音韻による韻律の情報を含む合成音声情報を入力
し、これらの合成音声情報により韻律規則辞書3に記述
されている音韻継続時間や基本周波数やパワーの制御規
則に基づいて、韻律パラメータを設定する。音声単位接
続部4によって音声単位セット5から合成に必要な音声
単位を選択し、選択された音声単位を韻律情報に従っ
て、圧縮,伸長した後接続し、合成音声の音声パラメー
タを生成する。生成された音声パラメータは音声合成部
6によって合成音声として合成され、出力部7から合成
音声が出力される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は音声合成装置に関し、
特に、音韻や音節などからなる音声の単位のセットから
適切な音声単位を選択し、それらを連結することにより
音声を出力するような音声合成装置に関する。
【0002】
【従来の技術】音声合成装置において、より人間に近い
自然な合成音声を出力するためには、音声の合成単位を
適切に選択する必要がある。そのような単位選択法とし
て、たとえば、武田,安部,匂坂などが発表した「選択
的に合成単位を用いる規則音声合成」電子情報通信学会
論文誌D−II No.12 1945頁〜1951
頁,1992年12月や、広川,箱田,佐藤などが発表
した「波形編集型方性方式におけるスペクトル連続性を
考慮した波形選択法」日本音響学会平成2年度秋季研究
発表会講演論文集1990年9月などがあり、これらの
発表では、音声単位間において、スペクトルが滑らかに
変化するよう音声単位間の接続を行なうことにより、合
成音声の品質の向上が可能であることが示されている。
【0003】
【発明が解決しようとする課題】しかしながら、前述の
単位選択法では、膨大なデータ容量(200メガバイド
以上)からなる非常に多くの音声単位を含む音声単位セ
ットを用いており、音声合成装置の実用上、この音声単
位セット中に含まれる音声単位セットの数を減らすこと
が望まれる。音声単位セット中の音声単位の数を適切な
操作を用いないで、経験的に減らすと、出力である合成
音声の品質が劣化してしまう。
【0004】小さな装置構成で音声合成装置を実現する
場合、出力の合成音声の品質の劣化を極力抑えながら容
量の小さい音声単位セットを構成することが課題となっ
ている。このような音声単位セットの構成法としては、
中島,浜田などが発表した「音韻環境に基づくクラスタ
リングによる規則合成法」電子情報通信学会論文誌D−
II Vol.J72−D−II No.8 1174
頁〜1179頁、1989年8月などがある。
【0005】しかしながら、上述の音声単位セットの構
成法では、出力された合成音声における音声単位間のス
ペクトル連続性は考慮されていないので、音声単位間の
接続部でスペクトルの不連続が生じ、合成音声の品質が
劣化していた。
【0006】それゆえに、この発明の主たる目的は、適
切な音声単位セットを構成することにより、音声単位間
の接続によって生じるスペクトルの不連続を軽減でき
て、より人間の声に近い自然な合成音声を出力できるよ
うな音声合成装置を提供することである。
【0007】
【課題を解決するための手段】請求項1に係る発明は、
音韻や音節など音声の単位のセットから、適当な音声単
位を選択し、それらを連結することにより、音声を出力
する音声合成装置において、出力される合成音声におけ
る合成単位間の接続点でのスペクトルの変化が滑らかに
なるように、音声単位を構成する。
【0008】請求項2に係る発明は、音声単位セット
を、当該音声単位セットよりも多くの音声単位を含む音
声単位データベースから適切に選択する。
【0009】請求項3に係る発明は、音声単位セットに
対して、これを用いた音声合成装置を構成した場合の、
出力の合成音声における音声単位間のスペクトル連続性
を総合的に評価するコスト関数として、音声単位セット
内における接続され得るすべての音声単位間でのスペク
トルの不連続度の和または最大値を用いて、このコスト
関数を音声単位セットの選択をする際に用いる。
【0010】
【作用】この発明に係る音声合成装置は、大容量の音声
単位データベース中から、音声単位セットを選択し、こ
れを用いて音声合成装置を構成する。音声単位セット
は、これを用いて構成された音声合成装置の出力の合成
音声における音声単位間の接続部で、スペクトルが滑ら
かに変化するように構成される。音声合成装置では、合
成する文章に必要な音声単位を接続して合成音声を出力
する。
【0011】
【実施例】図1はこの発明の一実施例の概略ブロック図
である。なお、図1に示した実施例において、パラメー
タの種類や数などは実施されるシステムにより、適当に
選択されるものである。図1を参照して、入力部1から
韻律パラメータ生成部2に出力したい合成音声情報が入
力される。合成音声の情報は、音韻、韻律の情報を含
む。これらの合成音声情報により、韻律規則辞書3に記
述されている音韻継続時間や基本周波数やパワーの制御
規則に基づいて、韻律パラメータ(音韻継続時間,基本
周波数,パワー)が設定される。さらに、音声単位接続
部4は、音声単位セット5から合成に必要な音声単位を
選択し、選択された音声単位の韻律情報に従って圧縮,
伸長した後、接続し、合成音声の音声パラメータを生成
する。音声単位接続部4で生成された音声パラメータは
音声合成部6によって合成音声として合成され、出力部
7によって合成音声が出力される。
【0012】図2は図1に示した音声単位セットを生成
する方法のブロック図である。図2を参照して、大容量
の音声単位データベース9から音声単位セット選択部1
0により音声単位5が選択される。
【0013】図3は図2に示した音声単位セット選択部
における問題を定式化した図である。図2に示す大容量
音声単位データベース9に含まれる音声単位全体を節点
とするネットワークG(V,E)から、その部分集合で
あるC(VC ,EC )を制約条件である第(2)式の下
で、コスト関数f(C)の第(1)式が小さくなるよう
に、選択するという組合せ最適化問題として定式化す
る。
【0014】言い換えれば、音声単位セットに関して与
えられているコスト関数が小さくなる音声単位セット
を、大容量音声単位データベース9から選択するという
ことである。ただし、音声単位セットは、大容量音声単
位データベース9の中の複数のクラスタから1つずつ音
声単位を選択したものであるという制約条件を満たすよ
うにする。クラスタは、1つ以上の音声単位からなって
いる。
【0015】ここで与えられるコスト関数は、出力合成
音声における音声単位接続部のスペクトル変化の滑らか
さを示すものである。ただし、図3に示した実施例で
は、スペクトル変化の滑らかさを計るだけでなく、音声
単位そのものの適切さを計るようにしている。音声単位
そのものの適切さは、音声単位内歪みを用いて評価され
る。音声単位内歪みは、大容量音声単位データベース9
のクラスタに属する音声単位の平均スペクトルのパラメ
ータと、音声単位のスペクトルパラメータ間のユークリ
ッド距離を用いて計算される。
【0016】図1に示した音声単位接続部4でのスペク
トル変化の滑らかさは、音声単位間歪みを用いて評価さ
れる。音声単位間歪みは、音声単位間の接続点での両側
の音声単位間のスペクトルパラメータのユークリッド距
離を用いる。コスト関数を示す第(1)式中でη=1.
0とすれば、コスト関数は、上述の2種類の歪みの総和
を表わすようになり、また、η=∞とすれば、上述の2
つの歪みの中での最大値を表わすようになる。
【0017】図4はこの発明の一実施例の音声単位選択
部における音声単位選択のアルゴリズムを示すフロー図
である。次に、図4を参照して、音声単位選択アルゴリ
ズムについて説明する。まず、ステップ(図示ではSP
と略称する)SP1において、大容量音声単位データベ
ース9からなるネットワークGから、拘束条件を満たす
当該ネットワークGの部分ネットワークC0 を任意選択
する。つまり当該大容量音声単位データベース9中の各
クラスタから、それぞれ任意に1つずつの音声単位を選
択し、選択された音声単位からなるネットワークを初期
のネットワークC0 とする。そして、ステップSP2に
おいてカウンタiとnに0にリセットする。
【0018】ステップSP3において、ネットワークC
i 中の節点を1つ任意に選択し、当該節点が属するとこ
ろのクラスタの属する節点で、当該節点を置き換えて構
成される1つ以上のネットワークのうちで、コスト関数
の値が最小になるところのネットワークをC′i とす
る。ステップSP4において、f(C′i )<f
(Ci)であるか否かを判別し、f(C′i )<f(C
i )であれば、ステップSP7においてCi + 1 =C′
i ,i=i+1,n=0とし、ステップSP3に戻る。
そうでなければ、ステップSP5において、n=n+1
として、ステップSP6に進む。ステップSP6におい
て、n>10,000であるか否かを判別し、n>1
0,000であればアルゴリズムは終了する。ここで、
値10,000は、1つの例であり、どの値に置き換え
てもよい。ステップSP6において、n>10,000
でなければ、前述のステップSP3に戻る。
【0019】なお、上述の実施例で用いたネットワーク
に対するコスト関数の定義や、音声単位セット選択アル
ゴリズムや2種類の歪みの定義については、上述の例に
限らず、様々な定義やアルゴリズムを使用することがで
きる。
【0020】
【発明の効果】以上のように、この発明によれば、出力
合成音声における音声単位間の接続点でのスペクトルの
変化が滑らかになるように、音声単位セットを構成する
ようにしたので、音声単位間の接続によって生じるスペ
クトルの不連続を軽減でき、より人間の声に近い自然な
合成音声を出力することができる。
【図面の簡単な説明】
【図1】この発明の一実施例の概略ブロック図である。
【図2】図1に示した音声単位セットを生成する方法の
ブロック図である。
【図3】図2に示した音声単位セット選択部における問
題を定式化した図である。
【図4】この発明の一実施例の音声単位セット部におけ
る音声単位セットのアルゴリズムを示すフロー図であ
る。
【符号の説明】
1 入力部 2 韻律パラメータ生成部 3 韻律規則辞書 4 音声単位接続部 5 音声単位セット 6 音声合成部 7 出力部 9 大容量音声単位データベース 10 音声単位セット選択部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 音韻や音節など音声の単位のセットか
    ら、適当な音声単位を選択し、これらを連結することに
    より音声を出力する音声合成装置において、 出力合成音声における合成単位間の接続点でのスペクト
    ルの変化が滑らかになるように、前記音声単位セットが
    構成されていることを特徴とする、音声合成装置。
  2. 【請求項2】 さらに、前記音声単位セットは、当該音
    声単位セットよりも多くの音声単位を含むデータベース
    中から、出力合成音声における合成単位間の接続点での
    スペクトルの変化が滑らかになるように選択されること
    を特徴とする、請求項1の音声合成装置。
  3. 【請求項3】 さらに、前記出力合成音声における合成
    単位間の接続点でのスペクトルの変化の滑らかさを評価
    するための指標として、音声単位セット中の音声単位を
    節点として持つネットワークに対して与えられるコスト
    関数を用いることを特徴とする、請求項1の音声合成装
    置。
JP4244645A 1992-09-14 1992-09-14 音声合成装置 Expired - Lifetime JP2886747B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4244645A JP2886747B2 (ja) 1992-09-14 1992-09-14 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4244645A JP2886747B2 (ja) 1992-09-14 1992-09-14 音声合成装置

Publications (2)

Publication Number Publication Date
JPH0695692A true JPH0695692A (ja) 1994-04-08
JP2886747B2 JP2886747B2 (ja) 1999-04-26

Family

ID=17121832

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4244645A Expired - Lifetime JP2886747B2 (ja) 1992-09-14 1992-09-14 音声合成装置

Country Status (1)

Country Link
JP (1) JP2886747B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002530703A (ja) * 1998-11-13 2002-09-17 ルノー・アンド・オスピー・スピーチ・プロダクツ・ナームローゼ・ベンノートシャープ 音声波形の連結を用いる音声合成

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5764299A (en) * 1980-10-06 1982-04-19 Sanyo Electric Co Voide synthesizer
JPS6432299A (en) * 1987-07-28 1989-02-02 Nec Corp Unit voice editing type rule synthesizer
JPH03141399A (ja) * 1989-10-27 1991-06-17 Ricoh Co Ltd 音声パラメータ結合方式

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5764299A (en) * 1980-10-06 1982-04-19 Sanyo Electric Co Voide synthesizer
JPS6432299A (en) * 1987-07-28 1989-02-02 Nec Corp Unit voice editing type rule synthesizer
JPH03141399A (ja) * 1989-10-27 1991-06-17 Ricoh Co Ltd 音声パラメータ結合方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002530703A (ja) * 1998-11-13 2002-09-17 ルノー・アンド・オスピー・スピーチ・プロダクツ・ナームローゼ・ベンノートシャープ 音声波形の連結を用いる音声合成

Also Published As

Publication number Publication date
JP2886747B2 (ja) 1999-04-26

Similar Documents

Publication Publication Date Title
US7277856B2 (en) System and method for speech synthesis using a smoothing filter
JP3078205B2 (ja) 波形の連結及び部分的重複化による音声合成方法
JP3563772B2 (ja) 音声合成方法及び装置並びに音声合成制御方法及び装置
JP2007249212A (ja) テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ
JP2001282278A (ja) 音声情報処理装置及びその方法と記憶媒体
US6424937B1 (en) Fundamental frequency pattern generator, method and program
JP2003108178A (ja) 音声合成装置及び音声合成用素片作成装置
JPH0695692A (ja) 音声合成装置
US6594631B1 (en) Method for forming phoneme data and voice synthesizing apparatus utilizing a linear predictive coding distortion
JP4274852B2 (ja) 音声合成方法及びその装置並びにそのコンピュータプログラム及びそれを記憶した情報記憶媒体
JP4490818B2 (ja) 定常音響信号のための合成方法
JPH07319495A (ja) 音声合成装置のための合成単位データ生成方式及び方法
JPH09319391A (ja) 音声合成方法
JP3109778B2 (ja) 音声規則合成装置
JP2002287784A (ja) 音声合成用圧縮素片作成装置、音声規則合成装置及びそれらに用いる方法並びにそのプログラム
JP4454780B2 (ja) 音声情報処理装置とその方法と記憶媒体
JP2002062890A (ja) 音声合成方法および音声合成装置ならびに音声合成処理プログラムを記録した記録媒体
JP2000231395A (ja) 音声合成方法及び装置
JPH11249676A (ja) 音声合成装置
JP3241582B2 (ja) 韻律制御装置及び方法
JP2003066983A (ja) 音声合成装置および音声合成方法、並びに、プログラム記録媒体
JPH1097268A (ja) 音声合成装置
JPH11282484A (ja) 音声合成装置
JP2000259164A (ja) 音声データ作成装置および声質変換方法
JPH10143196A (ja) 音声合成方法、その装置及びプログラム記録媒体

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990202