JPH06138894A

JPH06138894A - 音声合成装置及び音声合成方法

Info

Publication number: JPH06138894A
Application number: JP4311356A
Authority: JP
Inventors: Keiichi Yamada; 敬一山田; Yoshiaki Oikawa; 芳明及川; Naoto Iwahashi; 直人岩橋
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1992-10-27
Filing date: 1992-10-27
Publication date: 1994-05-20
Anticipated expiration: 2016-12-04
Also published as: JP3235747B2

Abstract

(57)【要約】【目的】本発明は、音声合成装置及び音声合成方法にお
いて、実際の人間の音声に比して品質の劣化が少なく違
和感のない合成音を発声する。【構成】周期性を有する有声部分に関しては実音声の分
析処理によつて得られた各１ピツチ周期分に対応する音
声波形データを、また周期性のない無声部分に関しては
実音声をそのまま音声波形データとして必要フレーム数
分メモリに貯えた音声単位内において、音声単位の前端
フレーム及び後端フレームには音声波形データと共に、
分析処理によりその音声波形データの包絡情報と微細構
造情報とを合わせ持たせる。さらに所定の韻律規則に従
つて合成音声のピツチパターンを生成し、また音韻規則
に従つて合成音声に必要な音声波形データをメモリから
読み出し、音声波形データ及びピツチパターンに基づい
て合成音を生成するようにしたことにより、実際の人間
の音声に比して品質の劣化が少なく違和感のない合成音
を発声し得る。

Description

【発明の詳細な説明】

【０００１】

【目次】以下の順序で本発明を説明する。産業上の利用分野従来の技術発明が解決しようとする課題課題を解決するための手段（図１）作用（図１）実施例（図１〜図４）発明の効果

【０００２】

【産業上の利用分野】本発明は音声合成装置及び音声合
成方法に関し、特に規則音声合成方式に従つて合成音を
生成するものに適用して好適なものである。

【０００３】

【従来の技術】従来、規則音声合成方式を用いた音声合
成装置においては、入力された文字の系列を解析した
後、所定の規則に従つてパラメータを合成することによ
り、いかなる言葉でも音声合成し得るようになされてい
る。すなわち、規則音声合成方式による音声合成装置
は、入力された文字の系列を解析した後、所定の規則に
従つて、各文節ごとにアクセントを検出し、各文節の並
びから文字系列全体としての抑揚やポース等を表現する
ピツチパラメータを合成する。

【０００４】さらに音声合成装置は、同様に所定の規則
に従つて各文節を例えばＣＶ単位のような音声単位に分
割した後、そのスペクトラムを表現する合成パラメータ
を生成する。これによりピツチパラメータ及び合成パラ
メータに基づいて合成音を発声するようになされてい
る。

【０００５】またより高品質な音声を合成するために、
音声単位として周期性を有する有声部分については実音
声を分析処理し、その１周期にあたる音声波形データを
それぞれ保持し、また周期性の無い無声部分について
は、実音声をそのまま音声波形データとして保持し、合
成時はこれらの音声波形データをピツチパラメータに基
づいて波形重畳して合成音を生成するようになされてい
る。

【０００６】

【発明が解決しようとする課題】ところで従来の波形重
畳の手法では、ピツチパラメータに基づいて音声単位内
の音声波形データを繰り返したり、あるいは間引くこと
によつてフレーム数を調整して音声を合成している。こ
こで用いられる個々の音声単位は、それが抽出された実
音声内での前後の音韻環境の影響を受けており、その影
響が合成音声内において表れてくる。

【０００７】すなわちある音声単位では合成時における
音韻環境と、抽出された実音声内ので音韻環境とが異な
る場合が生じてくる。これによつて合成音声の各音声単
位接続部において実音声と比べて不自然な音声波形が生
成され、周波数領域での不連続性が原因となつて異聴等
が発生し、合成音声の品質が劣化しやすいといつた問題
があつた。

【０００８】本発明は以上の点を考慮してなされたもの
で、実際の人間の音声に比して品質の劣化が少なく違和
感のない合成音を発声し得る音声合成装置及び音声合成
方法を提案しようとするものである。

【０００９】

【課題を解決するための手段】かかる課題を解決するた
めに本発明においては、個々の音声単位毎に、その音声
単位内において周期性を有する有声部分について、実音
声の分析処理によつて得られる各１ピツチ周期分に対応
する音声波形データを音声単位として必要フレーム数分
だけメモリに貯え、同時に音声単位の前端フレーム及び
後端フレームには、音声波形データと共に分析処理によ
つて得られる包絡情報及び微細構造情報を合わせてメモ
リに貯え、同時に音声単位内における周期性の無い無声
部分について、実音声をそのまま音声波形データとして
メモリに貯える音声単位記憶部２と、入力された音韻記
号と韻律記号に基づく所定の音韻規則及び韻律規則に従
つて、ピツチパターンを生成する音声合成規則部４と、
有声部分の合成時の補間フレームにおいて、先行音声単
位の後端フレーム及び後方音声単位の前端フレームの包
絡情報を補間して、先行音声単位の微細構造情報と合わ
せて時間波形を求め、その時間波形を補間フレームの音
声波形データとして、音声単位及びピツチパターンに基
づいて合成音を生成する音声合成部５とを設けるように
した。

【００１０】また本発明においては、入力された文字の
系列を解析して、単語、文節の境界及び基本アクセント
を検出する文章解析部３と、個々の音声単位毎に、その
音声単位内において周期性を有する有声部分について、
実音声の分析処理によつて得られる各１ピツチ周期分に
対応する音声波形データを音声単位として必要フレーム
数分だけメモリに貯え、同時に音声単位の前端フレーム
及び後端フレームには、音声波形データと共に分析処理
によつて得られる包絡情報及び微細構造情報を合わせて
メモリに貯え、同時に音声単位内における周期性のない
無声部分について、実音声をそのまま音声波形データと
してメモリに貯える音声単位記憶部２と、文章解析部３
の解析結果に基づく所定の音韻規則及び韻律規則に従つ
て、ピツチパターンを生成する音声合成規則部４と、有
声部分の合成時の補間フレームにおいて、先行音声単位
の後端フレーム及び後方音声単位の前端フレームの包絡
情報を補間して、先行音声単位の微細構造情報と合わせ
て時間波形を求め、その時間波形を補間フレームの音声
波形データとして、音声単位及びピツチパターンに基づ
いて合成音を生成する音声合成部５とを設けるようにし
た。

【００１１】また本発明においては、個々の音声単位毎
に、その音声単位内において周期性を有する有声部分に
ついて、実音声の分析処理によつて得られる各１ピツチ
周期分に対応する音声波形データを音声単位として必要
フレーム数分だけメモリにメモリに貯え、同時に音声単
位の前端フレーム及び後端フレームには、音声波形デー
タと共に分析処理によつて得られる包絡情報及び微細構
造情報を合わせてメモリにメモリに貯え、同時に音声単
位内における周期性の無い無声部分について、実音声を
そのまま音声波形データとしてメモリにメモリに貯え、
入力された音韻記号と韻律記号に基づく所定の音韻規則
及び韻律規則に従つて、ピツチパターンを生成し、有声
部分の合成時の補間フレームにおいて、先行音声単位の
後端フレーム及び後方音声単位の前端フレームの包絡情
報を補間して、先行音声単位の微細構造情報と合わせて
時間波形を求め、その時間波形を補間フレームの音声波
形データとして、音声単位及びピツチパターンに基づい
て合成音を生成するようにした。

【００１２】また本発明においては、入力された文字の
系列を解析して、単語、文節の境界及び基本アクセント
を検出し、個々の音声単位毎に、その音声単位内におい
て周期性を有する有声部分について、実音声の分析処理
によつて得られる各１ピツチ周期分に対応する音声波形
データを音声単位として必要フレーム数だけメモリに貯
え、同時に音声単位の前端フレーム及び後端フレームに
は、音声波形データと共に分析処理によつて得られる包
絡情報及び微細構造情報を合わせてメモリに貯え、同時
に音声単位内における周期性のない無声部分について、
実音声をそのまま音声波形データとしてメモリに貯え、
文字の系列の解析結果に基づく所定の音韻規則及び韻律
規則に従つて、ピツチパターンを生成し、有声部分の合
成時の補間フレームにおいて、先行音声単位の後端フレ
ーム及び後方音声単位の前端フレームの包絡情報を補間
して、先行音声単位の微細構造情報と合わせて時間波形
を求め、その時間波形を補間フレームの音声波形データ
として、音声単位及びピツチパターンに基づいて、合成
音を生成するようにした。

【００１３】また本発明においては、音声として日本語
に基づく音声を用いるようにした。

【００１４】

【作用】周期性を有する有声部分に関しては実音声の分
析処理によつて得られた各１ピツチ周期分に対応する音
声波形データを、また周期性のない無声部分に関しては
実音声をそのまま音声波形データとして必要フレーム数
分メモリに貯えた音声単位内において、音声単位の前端
フレーム及び後端フレームには音声波形データと共に、
分析処理によりその音声波形データの包絡情報と微細構
造情報とを合わせ持たせる。さらに所定の韻律規則に従
つて合成音声のピツチパターンを生成し、また音韻規則
に従つて合成音声に必要な音声波形データをメモリから
読み出し、音声波形データ及びピツチパターンに基づい
て合成音を生成するようにしたことにより、実際の人間
の音声に比して品質の劣化が少なく違和感のない合成音
を発声し得る。

【００１５】

【実施例】以下図面について、本発明の一実施例を詳述
する。

【００１６】図１において、１は全体として演算処理装
置を含んでなる音声合成装置の概略構成を示し、音声単
位記憶部２、文章解析部３、音声合成規則部４及び音声
合成部５に分割される。

【００１７】文章解析部３は、所定の入力装置から入力
されたテキスト入力（文字の系列で表された文章等でな
る）を、所定の辞書を基準にして解析し、仮名文字列に
変換した後、単語、文節毎に分解する。すなわち日本語
においては英語のように単語が分かち書きされていない
ことから、例えば「米国産業界」のような言葉は、「米
国／産業・界」、「米／国産／業界」のように２種類区
分化し得る。

【００１８】このため文章解析部３は、辞書を参考にし
ながら、言葉の連続関係及び単語の統計的性質を利用し
て、テキスト入力を単語、文節毎に分解するようになさ
れ、これにより単語、文節の境界を検出するようになさ
れている。さらに文章解析部３は、各単語毎に基本アク
セントを検出した後、音声合成規則部４に出力する。

【００１９】音声合成規則部４は、日本語の特徴に基づ
いて設定された所定の音韻規則に従つて、文章解析部３
の検出結果及びテキスト入力を処理するようになされて
いる。すなわち日本語の自然な音声は、言語学的特性に
基づいて区別すると、約 100程度の発声の単位に区分す
ることができる。例えば「さくら」という単語を発声の
単位に区分すると、「sa」＋「ak」＋「ku」＋「ur」＋
「ra」の５つのＣＶ／ＶＣ単位に分割することができ
る。

【００２０】さらに日本語は単語が連続する場合、連な
つた後ろの語の語頭音節が濁音化したり（すなわち続濁
でなる）、語頭以外のガ行音が鼻音化したりして、単語
単体の場合と発声が変化する特徴がある。従つて音声合
成規則部４は、これら日本語の特徴に従つて音韻規則が
設定されるようになされ、当該規則に従つてテキスト入
力を音韻記号列（すなわち上述の「sa」＋「ak」＋「k
u」＋「ur」＋「ra」等の連続する列でなる）に変換す
る。さらに音声合成規則部４は、当該音韻記号列に基づ
いて、音声単位記憶部２から各音声単位のデータをロー
ドする。

【００２１】ここで当該音声合成装置１は、波形編集の
手法を用いて合成音を発声するようになされ、音声単位
記憶部２からロードされるデータは、各ＣＶ／ＶＣ単位
で表される合成音を生成する際に用いられる波形データ
である。この波形合成に用いられる音声単位データは次
のように構成されている。すなわち音声単位データの有
声部に関しては、実音声の有声部分において１ピツチに
対応する音声波形データを必要なフレーム数だけメモリ
に貯えたものからなり、また音声単位データの無声部に
関しては、実音声の無声部分の波形を切り出してそのま
まメモリに貯えたものからなる。

【００２２】また図２に示すように音声単位データの有
声部の前端フレーム及び後端フレームは、音声波形デー
タ（図２（Ａ））と共に、ケプストラム分析法等の分析
処理によつて得られるその音声波形データの包絡情報
（図２（Ｂ））及び微細構造情報（図２（Ｃ））が同時
にメモリに貯えられる。従つて音声単位データがＣＶ／
ＶＣ単位である場合には、１つの音声単位ＣＶの子音部
Ｃが無声子音である時には無声部分の切り出し波形と、
１ピツチの音声波形からなる複数フレームにおいて、そ
の後端フレームには対応する音声波形の包絡情報と微細
構造情報も含まれている。

【００２３】これにより１つの音声単位データが構成さ
れ、また１つの音声単位ＣＶの子音部Ｃが有声子音であ
るときには、１ピツチの音声波形からなる複数フレーム
において、その先端フレーム及び後端フレームにそれぞ
れ対応する音声波形の包絡情報及び微細構造情報が含ま
れており、これにより１つの音声単位データが構成され
る。

【００２４】音声合成規則部４は、音声単位記憶部２か
らロードされた音声単位データをテキスト入力に応じた
順序（以下このデータを合成波形データと呼ぶ）で合成
し、かくして抑揚のない状態で、テキスト入力を読み上
げた合成音声波形を得ることができる。また合成波形デ
ータ内での、有声部における音声単位の連結では、次の
ような処理が行われる。

【００２５】音声合成部５において合成しようとするあ
る音韻連鎖Ｃ′ＶＣ″では、音声単位記憶部２からロー
ドされたデータＣ′Ｖ、ＶＣ″内の波形データ群を順に
並べ、音韻連鎖内の同一音素Ｖ内での接続部において
は、次の補間処理によつて得られる音声波形データを用
いる。これは、図３に示すように、先行音声単位Ｃ′Ｖ
の終端フレーム内の包絡情報と、後方音声単位ＶＣ″の
先端フレーム内の包絡情報を用いて線形補間等の補間処
理を行い、この補間処理によつて得られた包絡情報と先
行音声単位Ｃ′Ｖの終端フレーム内の微細構造情報を加
えたものを接続部における補間フレームの周波数情報と
する。

【００２６】この周波数情報を周波数領域から時間領域
へ変換し、接続部における補間フレームの音声波形デー
タとし、合成波形データに用いる。また、この補間処理
による音声単位の連結は、Ｃが有声子音であるような別
の音韻連鎖Ｖ′ＣＶ″における音声単位Ｖ′Ｃと音声単
位ＣＶ″の同一音素Ｃ内でも行われる。

【００２７】さらに音声合成規則部４は所定の韻律規則
に基づいて、テキスト入力を適当な長さで分割して、切
れ目（すなわちポーズでなる）を検出する。かくして、
例えばテキスト入力として図４（Ａ）に示すように、文
章「きれいな花を山田さんからもらいました」が入力さ
れた場合、当該テキスト入力は図４（Ｂ）に示すよう
に、「きれいな」、「はなを」、「やまださんから」、
「もらいました」に分解された後、「はなを」及び「や
まださんから」間にポーズが検出される。

【００２８】さらに音声合成規則部４は、韻律規則及び
各単語の基本アクセントに基づいて、各文節のアクセン
トを検出する。すなわち日本語の文節単体のアクセント
は、感覚的に仮名文字を単位として（以下モーラと呼
ぶ）高低の２レベルで表現することができる。このと
き、文節の内容等に応じて、文節のアクセント位置を区
別することができる。

【００２９】例えば、端、箸、橋は、２モーラの単語
で、それぞれアクセントのない０型、アクセントの位置
が先頭のモーラにある１型、アクセントの位置が２モー
ラ目にある２型に分類することができる。かくしてこの
実施例の場合音声合成規則部４は、テキスト入力の各文
節を、図４（Ｃ）に示すように、順次１型、２型、０
型、４型と分類し、これにより文節単位でアクセント及
びポーズを検出する。

【００３０】さらに音声合成規則部４は、アクセント及
びポーズの検出結果に基づいて、テキスト入力全体の抑
揚を表す基本ピツチパターンを生成する。すなわち、日
本語における文節のアクセントは感覚的に２レベルで表
し得るのに対し、実際の抑揚はアクセントの位置から徐
々に低下する特徴がある（図４（Ｄ））。さらに日本語
においては、文節が連続して１つの文章になると、ポー
ズから続くポーズに向かつて、抑揚が徐々に低下する特
徴がある（図４（Ｅ））。

【００３１】従つて音声合成規則部４はこのような日本
語の特徴に基づいて、テキスト入力全体の抑揚を表すパ
ラメータを各モーラ毎に生成した後、人間が発声した場
合と同様に抑揚が滑らかに変化するように、モーラ間に
補間によりパラメータを設定する。かくして音声合成規
則部４は、テキスト入力に応じた順序で、各モーラのパ
ラメータ及び補間したパラメータを合成し（以下ピツチ
パターンと呼ぶ）、これにより図４（Ｆ）に示すよう
に、テキスト入力を読み上げた音声の抑揚を表すピツチ
パターン（図４（Ｆ））を得るようになされている。

【００３２】音声合成部５は、合成波形データ及びピツ
チパターンに基づいて、波形合成処理を行ない合成音を
生成する。この波形合成処理は、次のようなことを行な
つている。すなわち合成音声の有声部においては、合成
波形データ内の１ピツチに対応した波形データをピツチ
パターンに基づいて並べ重畳していく。また合成音声の
無声部分においては、合成波形データ内の切り出し波形
をそのまま所望の合成音声の波形とする。

【００３３】これにより、ピツチパターンの変化に追従
して抑揚の変化する合成音を得ることができる。従つ
て、高品質な合成音声が得られる波形重畳方式の音声合
成システムにおいて、有声部分における音声単位接続部
での接続歪みを低減することができ、補間を行わない合
成方式や、時間軸上での単純な波形補間による合成方式
に比べ、接続部をよりなめらかに接続していくことがで
き、人間の音声に近い高品質な任意合成音が得ることが
できる。

【００３４】以上の構成において、所定の入力装置から
入力されたテキスト入力は、文章解析部２で所定の辞書
を基準にして解析され、単語、文節の境界及び基本アク
セントが検出される。この単語、文節の境界及び基本ア
クセントの検出結果は、音声合成規則部４で所定の音韻
規則に従つて処理され、抑揚のない状態でテキスト入力
を読み上げた音声を表す合成波形データが生成される。

【００３５】さらに単語、文節の境界及び基本アクセン
トの検出結果は、音声合成規則部４で、所定の韻律規則
に従つて処理され、テキスト入力全体の抑揚を表すピツ
チパターンが生成される。ピツチパターンは合成波形デ
ータと共に音声合成部５に出力され、ここでピツチパタ
ーン及び合成波形データに基づいて合成音が生成され
る。

【００３６】以上の構成によれば、高品質な合成音声が
得られる波形重畳方式の音声合成システムにおいて、有
声部分における音声単位接続部での接続歪みを低減する
ことができ、よりなめらかに音声単位を接続することに
よつて、人間の音声に近い高品質な合成音声を任意に生
成し得る音声合成装置１を実現できる。

【００３７】なお上述の実施例においては、音声合成部
５で合成しようとするある音韻連鎖Ｃ′ＶＣ″におい
て、先行音声単位Ｃ′Ｖの終端フレーム内の包絡情報
と、後方音声単位ＶＣ″の先端フレーム内の包絡情報と
を補間処理して得られた包絡情報に対して、先行音声単
位Ｃ′Ｖの終端フレーム内の微細構造情報の代わりに後
方音声単位ＶＣ″の先端フレーム内の微細構造情報を加
えたものを接続部における補間フレームの周波数情報と
してもよい。

【００３８】

【発明の効果】上述のように本発明によれば、高品質な
合成音声が得られる波形重畳方式の音声合成システムに
おいて、有声部分における音声単位接続部での接続歪み
を低減することができ、人間の音声に近い高品質な合成
音を任意に合成することができる音声合成装置を得るこ
とができる。

【図面の簡単な説明】

【図１】本発明の一実施例による音声合成装置を示すブ
ロツク図である。

【図２】音声単位データ内の先端フレーム及び終端フレ
ームのデータの説明に供する信号波形図である。

【図３】補間処理の説明に供する略線図である。

【図４】音声合成装置の動作の説明に供する略線図であ
る。

【符号の説明】

１……音声合成装置、２……音声単位記憶部、３……文
章解析部、４……音声合成規則部、５……音声合成部。

Claims

【特許請求の範囲】

【請求項１】個々の音声単位毎に、当該音声単位内にお
いて周期性を有する有声部分について、実音声の分析処
理によつて得られる各１ピツチ周期分に対応する音声波
形データを上記音声単位として必要フレーム数分だけメ
モリに貯え、同時に上記音声単位の前端フレーム及び後端フレームに
は、上記音声波形データと共に分析処理によつて得られ
る包絡情報及び微細構造情報を合わせて上記メモリに貯
え、同時に上記音声単位内における周期性の無い無声部分に
ついて、上記実音声をそのまま上記音声波形データとし
て上記メモリに貯える音声単位記憶部と、入力された音韻記号と韻律記号に基づく所定の音韻規則
及び韻律規則に従つて、ピツチパターンを生成する音声
合成規則部と、上記有声部分の合成時の補間フレームにおいて、先行音
声単位の上記後端フレーム及び後方音声単位の上記前端
フレームの上記包絡情報を補間して、上記先行音声単位
の上記微細構造情報と合わせて時間波形を求め、当該時
間波形を上記補間フレームの上記音声波形データとし
て、上記音声単位及び上記ピツチパターンに基づいて合
成音を生成する音声合成部とを具えることを特徴とする
音声合成装置。
【請求項２】入力された文字の系列を解析して、単語、
文節の境界及び基本アクセントを検出する文章解析部
と、個々の音声単位毎に、当該音声単位内において周期性を
有する有声部分について、実音声の分析処理によつて得
られる各１ピツチ周期分に対応する音声波形データを上
記音声単位として必要フレーム数分だけメモリに貯え、同時に上記音声単位の前端フレーム及び後端フレームに
は、上記音声波形データと共に分析処理によつて得られ
る包絡情報及び微細構造情報を合わせて上記メモリに貯
え、同時に上記音声単位内における周期性のない無声部分に
ついて、上記実音声をそのまま上記音声波形データとし
て上記メモリに貯える音声単位記憶部と、上記文章解析部の解析結果に基づく所定の音韻規則及び
韻律規則に従つて、ピツチパターンを生成する音声合成
規則部と、上記有声部分の合成時の補間フレームにおいて、先行音
声単位の上記後端フレーム及び後方音声単位の上記前端
フレームの上記包絡情報を補間して、上記先行音声単位
の上記微細構造情報と合わせて時間波形を求め、当該時
間波形を上記補間フレームの上記音声波形データとし
て、上記音声単位及び上記ピツチパターンに基づいて合
成音を生成する音声合成部とを具えることを特徴とする
音声合成装置。
【請求項３】個々の音声単位毎に、当該音声単位内にお
いて周期性を有する有声部分について、実音声の分析処
理によつて得られる各１ピツチ周期分に対応する音声波
形データを上記音声単位として必要フレーム数分だけメ
モリにメモリに貯え、同時に上記音声単位の前端フレーム及び後端フレームに
は、上記音声波形データと共に分析処理によつて得られ
る包絡情報及び微細構造情報を合わせて上記メモリにメ
モリに貯え、同時に上記音声単位内における周期性の無い無声部分に
ついて、上記実音声をそのまま上記音声波形データとし
て上記メモリにメモリに貯え、入力された音韻記号と韻律記号に基づく所定の音韻規則
及び韻律規則に従つて、ピツチパターンを生成し、上記有声部分の合成時の補間フレームにおいて、先行音
声単位の上記後端フレーム及び後方音声単位の上記前端
フレームの上記包絡情報を補間して、上記先行音声単位
の上記微細構造情報と合わせて時間波形を求め、当該時
間波形を上記補間フレームの上記音声波形データとし
て、上記音声単位及びピツチパターンに基づいて合成音
を生成するようにしたことを特徴とする音声合成方法。
【請求項４】入力された文字の系列を解析して、単語、
文節の境界及び基本アクセントを検出し、個々の音声単位毎に、当該音声単位内において周期性を
有する有声部分について、実音声の分析処理によつて得
られる各１ピツチ周期分に対応する音声波形データを上
記音声単位として必要フレーム数だけメモリに貯え、同時に上記音声単位の前端フレーム及び後端フレームに
は、上記音声波形データと共に分析処理によつて得られ
る包絡情報及び微細構造情報を合わせて上記メモリに貯
え、同時に上記音声単位内における周期性のない無声部分に
ついて、上記実音声をそのまま上記音声波形データとし
て上記メモリに貯え、上記文字の系列の解析結果に基づく所定の音韻規則及び
韻律規則に従つて、ピツチパターンを生成し、上記有声部分の合成時の補間フレームにおいて、先行音
声単位の上記後端フレーム及び後方音声単位の上記前端
フレームの上記包絡情報を補間して、上記先行音声単位
の上記微細構造情報と合わせて時間波形を求め、当該時
間波形を上記補間フレームの上記音声波形データとし
て、上記音声単位及び上記ピツチパターンに基づいて、
合成音を生成するようにしたことを特徴とする音声合成
方法。
【請求項５】上記音声として日本語に基づく音声を用い
るようにしたことを特徴とする請求項１、請求項２及び
請求項３、請求項４に記載の音声合成装置及び音声合成
方法。