JPH09325788A - 音声合成装置及び方法 - Google Patents

音声合成装置及び方法

Info

Publication number
JPH09325788A
JPH09325788A JP8142832A JP14283296A JPH09325788A JP H09325788 A JPH09325788 A JP H09325788A JP 8142832 A JP8142832 A JP 8142832A JP 14283296 A JP14283296 A JP 14283296A JP H09325788 A JPH09325788 A JP H09325788A
Authority
JP
Japan
Prior art keywords
voice
sampling period
speech
discrete
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8142832A
Other languages
English (en)
Inventor
Yoshinori Shiga
芳則 志賀
Yoshiyuki Hara
義幸 原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP8142832A priority Critical patent/JPH09325788A/ja
Publication of JPH09325788A publication Critical patent/JPH09325788A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】アナウンサ発声の収録や音声素片の再切り出し
を行うことなく、合成音声の声質を簡単に増やすことが
できるようにする。 【解決手段】第1の標本周期で標本化した離散音声信号
を分析して得られる音声の特徴パラメータをメモリ11
に、音声の基本周波数パターンをメモリ12に蓄積して
おき、メモリ11から読み出した特徴パラメータとメモ
リ12から読み出した基本周波数パターンとから合成フ
ィルタ処理部13にて離散音声信号を合成する。D/A
変換器14では、この離散音声信号を、声質切替部17
で切り替え指定された声質に応じて声質制御部18によ
り定められる第2の標本周期でアナログ音声信号に変換
する。このアナログ音声信号はアンプ15により増幅さ
れ、スピーカ16から音声として出力される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声をパラメータ
化して蓄積し、これから音声を合成する、あるいは音声
を細分化して蓄積し、その組み合わせによって任意の音
声を合成するのに好適な音声合成装置及び方法に関す
る。
【0002】
【従来の技術】本発明に係る音声合成装置として、音声
をパラメータ化して蓄積し、これから音声を合成する分
析合成装置と、音声を細分化して蓄積し、その組み合わ
せによって任意の音声を合成可能な規則合成装置がある
ことが知られている。以下では、これら分析合成装置と
規則合成装置の従来技術の例を図を参照しながら説明し
ていく。
【0003】図23は従来の分析合成装置の構成を示し
た図である。
【0004】図23において、メモリ311には、音声
を分析して得られるパラメータフレームの時系列と各フ
レームに対応した音声の有声・無声情報が記憶されてい
る。ここではパラメータとして低次のケプストラム係数
を利用している。
【0005】ところで、低次のケプストラム係数は次の
ようにして求めることができる。まず、アナウンサ等が
発声した音声データに、一定幅・一定周期で窓関数(こ
こではハニング窓)をかけ、各窓内の音声波形に対して
フーリエ変換を行い音声の短時間スペクトルを計算す
る。次に、得られた短時間スペクトルのパワーを対数化
して対数パワースペクトルを得た後、対数パワースペク
トルを逆フーリエ変換する。こうして計算されるのがケ
プストラム係数である。
【0006】一般に、高次のケプストラム係数は音声の
基本周波数情報を、低次のケプストラム係数は音声のス
ペクトル包絡情報を保持していることが知られている。
このうち、音声のスペクトル包絡を表わす低次ケプスト
ラムのみがメモリ311に蓄えられている。
【0007】一方、メモリ312には、所定の基本周波
数抽出方法により同じ音声から得られる、音声の基本周
波数の時系列パターンが記憶されている。基本周波数抽
出方法としては、例えば、Bruce G 等による文献「"An
Integrated Pitch TrackingAlgorithm for Speech Syst
ems",ICASSP 1993 」などの方法が挙げられる。
【0008】合成フィルタ処理部313は、これら2つ
のメモリ311,312より前述の各データを読み出
し、有声区間では前記基本周波数の時系列パターンに基
づいた周期パルスを、無声区間ではランダムノイズをそ
れぞれ音源として、音声のパラメータフレーム(ケプス
トラム)の時系列からフィルタ係数を算出し、合成フィ
ルタに与えて所望の音声を合成する。通常、この合成フ
ィルタには、ケプストラム係数を直接フィルタ係数とす
るLMA(Log Magnitude Approximation )フィルタを
用いている。ここまでの処理はプログラムによって行わ
れるのが一般的である。
【0009】さて、以上のようにして合成された音声は
離散信号であることから、合成フィルタ処理部313で
は最後に、この離散信号(離散波形)をD/A(ディジ
タル/アナログ)変換器314に供給する。これを受け
てD/A変換器314は、離散信号(離散音声信号)を
電気的なアナログ信号(アナログ音声信号)に変換す
る。こうして得られたアナログ信号でアンプ315を介
してスピーカ316等を駆動することにより聴覚で知覚
できる音声が合成される。
【0010】図24は従来の規則合成装置の構成を示し
た図である。
【0011】図24の規則合成装置はテキストを音韻と
韻律からなる記号列に変換し、その記号列から音声を生
成する文音声変換(Text-to-speech conversion:以下T
TSと称する)処理を行う。
【0012】この図24の規則合成装置におけるTTS
処理は、大きく分けて言語処理部411と音声合成部4
12の2つ処理部からなり、日本語の規則合成を例にと
ると次のように行われるのが一般的である。
【0013】まず言語処理部411では、テキストファ
イル413から入力されるテキスト(漢字かな混じり
文)に対して形態素解析・構文解析等の言語処理を加
え、形態素への分解、係り受け関係の推定等の処理を行
うと同時に、各形態素に読みとアクセント型を与える。
その後言語処理部412では、アクセントに関しては複
合語等のアクセント移動規則を用いて、読み上げの際の
区切りとなる句(以下、アクセント句と称する)毎のア
クセント型を決定する。通常TTSの言語処理部では、
こうして得られるアクセント句毎の読みとアクセント型
を記号列(以下、音声記号列と称する)として出力でき
るようになっている。
【0014】次に音声合成部412内では、得られた読
みに含まれる各音韻の継続時間を、その音韻の音韻環境
等をもとに、所定の規則によりの音韻継続時間計算処理
部414にて決定する。続いて上記のようにして得られ
る「読み」と「音韻の継続時間」に従って、音韻パラメ
ータ生成処理部415が音声素片メモリ416から順次
必要な音声素片を読み出し、読み出した音声素片を接続
して、合成すべき音声の特徴パラメータ系列を生成す
る。
【0015】ここで音声素片メモリ415は、予め作成
された多数の音声素片から構成されている。音声素片
は、アナウンサ等が発声した音声を分析して所定の音声
の特徴パラメータを得た後、所定の合成単位例えば日本
語の音節(子音+母音:以下CVと称する)単位で、日
本語の音声に含まれる全ての音節を前記特徴パラメータ
から切り出すことにより作成される。
【0016】音声合成部412ではさらに、ピッチ生成
処理部417が上記アクセント型をもとにピッチの高低
変化が生じる時点にて点ピッチを設定し、複数設定され
た点ピッチ間を直線補間することによりピッチのアクセ
ント成分を生成し、これにイントネーション成分(通常
は周波数軸上での単調減少直線)を重畳してピッチパタ
ーンを生成する。そして有声区間ではピッチパターンに
基づいた周期パルスを、無声区間ではランダムノイズを
それぞれ音源として、一方音声の特徴パラメータ系列か
らフィルタ係数を算出し、合成フィルタ処理部418に
与えて所望の音声を合成する。
【0017】ここまでの処理はプログラムによって行わ
れるのが一般的で、したがって合成された音声は離散信
号であるから、音声合成部412では最後に、この離散
信号をD/A変換器419に供給する。これを受けてD
/A変換器419は、離散信号(離散音声信号)を電気
的なアナログ信号(アナログ音声信号)に変換する。こ
うして得られたアナログ信号でアンプ420を介してス
ピーカ421等を駆動することにより聴覚で知覚できる
音声が合成できる。
【0018】
【発明が解決しようとする課題】音声合成装置に関し、
現在上記のような従来技術が存在しているが、この従来
の音声合成装置で合成される音声には次のような問題が
ある。即ち従来の音声合成装置では、合成音声の声の種
類(以下、声質と称する)に制約があり、音声素片ファ
イル作成時のアナウンサの声質か、あるいは音声の規則
合成によりそれが多少劣化した声質でしか合成できな
い。したがって、会話文等を音声合成するに当たって合
成音声の声質を増やそうとした場合、音声合成装置開発
者は新たに異なるアナウンサを雇い、発声を録音して、
音声素片の作成を始めからやり直さなければならない。
このため、アナウンサを雇うための賃金が必要となり、
またアナウンサの発声の収録・音声素片の切り出し等の
ために開発者は多大な労力を要することになる。そし
て、このことが装置開発のコストを増加させることにつ
ながる。
【0019】本発明はこのような事情を考慮してなされ
たものであり、その目的は、アナウンサ発声の収録や音
声素片の再切り出しを行うことなく、極めて容易な手段
で、合成音声の声質を増やすことのできる音声合成装置
及び方法を提供することにある。
【0020】
【課題を解決するための手段】本発明の第1の観点に係
る音声合成装置は、第1の標本周期で標本化した離散音
声信号を分析して得られる音声の特徴パラメータを蓄積
する蓄積手段と、この蓄積手段より読み出した音声の特
徴パラメータを入力として離散音声信号を合成する合成
手段と、この合成手段によって合成された離散音声信号
を上記第1の標本周期とは異なる第2の標本周期でアナ
ログ音声信号に変換するディジタル/アナログ変換手段
とを備えたことを特徴とする。
【0021】こり他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記ディジタル/
アナログ変換手段では、合成手段によって合成された離
散音声信号が声質選択手段により選択指定された声質に
応じて定められる第2の標本周期でアナログ音声信号に
変換される構成とすることも可能である。
【0022】この発明においては、音声分析時の標本周
期である第1の標本周期とディジタル/アナログ(D/
A)変換での第2の標本周期とを異ならせることによ
り、音声のスペクトルが周波数対数軸上でシフトするか
ら、同じ特徴パラメータを用いて異なる声質の音声を合
成することができる。
【0023】次に、本発明の第2の観点に係る音声合成
装置は、第1の標本周期で標本化した離散音声信号に第
1のフレーム周期で時間窓をかけて分析して得られる音
声の特徴パラメータフレームの時系列から、上記第1の
フレーム周期とは異なる第2のフレーム周期で離散音声
信号を合成する合成手段と、この合成手段によって合成
された離散音声信号を上記第1の標本周期とは異なる第
2の標本周期でアナログ音声信号に変換するディジタル
/アナログ変換手段とを備えたことを特徴とする。ここ
で、上記第2のフレーム周期を、第1のフレーム周期、
第1の標本周期及び当該第1の標本周期とは異なる第2
の標本周期に基づいて定めるとよい。
【0024】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記合成手段で
は、声質選択手段により選択指定された声質に応じて定
められる第2のフレーム周期で離散音声信号が合成さ
れ、上記ディジタル/アナログ変換手段では、合成手段
によって合成された離散音声信号が声質選択手段により
選択指定された声質に応じて定められる第2の標本周期
でアナログ音声信号に変換される構成とすることも可能
である。
【0025】この発明においては、音声分析時の第1の
標本周期とD/A変換での第2の標本周期を異ならせる
ことにより、音声のスペクトルを周波数対数軸上でシフ
トさせ、同じ特徴パラメータを用いて異なる声質の音声
を合成することができるが、さらにここで、合成時の第
2のフレーム周期を、第1のフレーム周期、第1の標本
周期及び第2の標本周期に基づいて定めるとか、合成時
の第2のフレーム周期とD/A変換時の第2の標本周期
を声質選択手段で選択指定された声質に応じて定めるな
どして、上記第2のフレーム周期を分析時の窓の周期
(第1のフレーム周期)と異ならせることにより、合成
する音声の発話速度を適切に制御できるから、声質を変
化させながら自然な発話速度の音声が合成できる。
【0026】次に、本発明の第3の観点に係る音声合成
装置は、第1の標本周期で標本化した離散音声信号を分
析して得られる音声の特徴パラメータを蓄積する特徴パ
ラメータ蓄積手段と、音声の基本周波数パターンを蓄積
するピッチパターン蓄積手段と、このピッチパターン蓄
積手段から読み出した基本周波数パターンを上記第1の
標本周期及び第1の標本周期とは異なる第2の標本周期
に基づいて変調するピッチパターン変調手段と、上記特
徴パラメータ蓄積手段から読み出した特徴パラメータと
上記ピッチパターン変調手段にて変調された基本周波数
パターンとから離散音声信号を合成する合成手段と、こ
の合成手段によって合成された離散音声信号を上記第2
の標本周期でアナログ音声信号に変換するディジタル/
アナログ変換手段とを備えたことを特徴とする。
【0027】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記ピッチパター
ン変調手段では、基本周波数パターンに対して声質選択
手段により選択指定された声質に応じた変調が行われ、
上記ディジタル/アナログ変換手段では、合成手段によ
って合成された離散音声信号が声質選択手段により選択
指定された声質に応じて定められる第2の標本周期でア
ナログ音声信号に変換される構成とすることも可能であ
る。
【0028】この発明においては、音声分析時の標本周
期である第1の標本周期とD/A変換の第2の標本周期
を異ならせることにより、音声のスペクトルを周波数対
数軸上でシフトさせ、同じ特徴パラメータを用いて異な
る声質の音声を合成することができるが、さらにここ
で、合成の基本周波数パターンを第1の標本周期及び第
2の標本周期に基づいて定めるとか、声質選択手段によ
り選択指定された声質に応じて第2の標本周期を定め、
選択指定された声質に応じて合成の基本周波数パターン
を定めることで、合成する音声のピッチ(声の高さ)を
適切に制御できるから、声質を変化させながら自然なピ
ッチの音声が合成できる。
【0029】次に、本発明の第4の観点に係る音声合成
装置は、第1の標本周期で標本化した離散音声信号から
作成した音声素片を、与えられた音韻情報に基づいて選
択し接続することによって離散音声信号を合成する音声
合成手段と、この音声合成手段によって合成された離散
音声信号を上記第1の標本周期とは異なる第2の標本周
期でアナログ音声信号に変換するディジタル/アナログ
変換手段とを備えたことを特徴とする。
【0030】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記ディジタル/
アナログ変換手段では、合成手段によって合成された離
散音声信号が声質選択手段により選択指定された声質に
応じて定められる第2の標本周期でアナログ音声信号に
変換される構成とすることも可能である。
【0031】この発明においては、音声素片作成時の第
1の標本周期とD/A変換の第2の標本周期を異ならせ
ることにより、音声のスペクトルが周波数対数軸上でシ
フトするから、同じ音声素片を用いて異なる声質の音声
を合成することができる。
【0032】次に、本発明の第5の観点に係る音声合成
装置は、第1の標本周期で標本化した離散音声信号から
作成した音声素片を、与えられた音韻情報に基づいて選
択し、この選択した音声素片を、合成される音声の発話
速度または発話時間に関係する発話速度パラメータに応
じて接続することによって離散音声信号を合成する音声
合成手段であって、使用する発話速度パラメータを上記
第1の標本周期及び第1の標本周期とは異なる第2の標
本周期に基づいて決定する音声合成手段と、この音声合
成手段によって合成された離散音声信号を上記第2の標
本周期でアナログ音声信号に変換するディジタル/アナ
ログ変換手段とを備えたことを特徴とする。
【0033】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記音声合成手段
では、使用する発話速度パラメータが声質選択手段によ
り選択指定された声質に応じて決定され、上記ディジタ
ル/アナログ変換手段では、音声合成手段によって合成
された離散音声信号が声質選択手段により選択指定され
た声質に応じて定められる第2の標本周期でアナログ音
声信号に変換される構成とすることも可能である。
【0034】この発明においては、音声素片作成時の第
1の標本周期とD/A変換の第2の標本周期を異ならせ
ることにより、音声のスペクトルを周波数対数軸上でシ
フトさせ、同じ特徴パラメータを用いて異なる声質の音
声を合成することができるが、さらにここで、合成時に
使用される発話速度パラメータを、第1の標本周期及び
第2の標本周期に応じて定めるとか、声質選択手段によ
り選択指定された声質に応じて第2の標本周期を定め、
選択指定された声質に応じて発話速度パラメータを定め
ることで、合成する音声の発話速度を適切に制御できる
から、声質を変化させながら自然な発話速度で音声が合
成できる。
【0035】次に、本発明の第6の観点に係る音声合成
装置は、与えられた音韻情報に含まれる各音韻の継続時
間を決定する一方、第1の標本周期で標本化した離散音
声信号から作成した音声素片を上記音韻情報に基づいて
選択し、上記決定した各音韻の継続時間に基づいて上記
選択した音声素片を接続することによって離散音声信号
を合成する音声合成手段であって、使用する音韻継続時
間を上記第1の標本周期及び第1の標本周期とは異なる
第2の標本周期に基づいて決定する音声合成手段と、こ
の音声合成手段によって合成された離散音声信号をアナ
ログ音声信号に変換するディジタル/アナログ変換手段
とを備えたことを特徴とする。
【0036】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記音声合成手段
では、使用する音韻継続時間が声質選択手段により選択
指定された声質に応じて決定され、上記ディジタル/ア
ナログ変換手段では、音声合成手段によって合成された
離散音声信号が声質選択手段により選択指定された声質
に応じて定められる第2の標本周期でアナログ音声信号
に変換される構成とすることも可能である。
【0037】この発明においては、音声素片作成時の第
1の標本周期とD/A変換の第2の標本周期を異ならせ
ることにより、音声のスペクトルを周波数対数軸上でシ
フトさせ、同じ特徴パラメータを用いて異なる声質の音
声を合成することができるが、さらにここで、合成時の
音韻継続時間を第1の標本周期及び第2の標本周期に応
じて定めるとか、声質選択手段により選択指定された声
質に応じて第2の標本周期を定め、選択指定された声質
に応じて音韻継続時間を定めることで、合成する音声の
発話速度を適切に制御できるから、声質を変化させなが
ら自然な発話速度で音声が合成できる。
【0038】次に、本発明の第7の観点に係る音声合成
装置は、第1の標本周期で標本化した離散音声信号から
作成した音声素片を、与えられた音韻情報に基づいて選
択し、この選択した音声素片を時間軸方向に伸縮させな
がら接続することによって離散音声信号を合成する音声
合成手段と、この音声合成手段によって合成された離散
音声信号を上記第1の標本周期とは異なる第2の標本周
期でアナログ音声信号に変換するディジタル/アナログ
変換手段とを備えたことを特徴とする。ここで、音声合
成手段における音声素片接続時の音声素片に対する時間
軸方向への伸縮の度合いを、上記第1の標本周期及び第
2の標本周期に基づいて定めるとよい。
【0039】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記音声合成手段
では、選択した音声素片を声質選択手段により選択指定
された声質に応じて定められる度合いで時間軸方向に伸
縮させながら接続するように構成され、上記ディジタル
/アナログ変換手段では、音声合成手段によって合成さ
れた離散音声信号が声質選択手段により選択指定された
声質に応じて定められる第2の標本周期でアナログ音声
信号に変換される構成とすることも可能である。
【0040】この発明においては、音声素片作成時の第
1の標本周期とD/A変換の第2の標本周期を異ならせ
ることにより、音声のスペクトルを周波数対数軸上でシ
フトさせ、同じ特徴パラメータを用いて異なる声質の音
声を合成することができるが、さらにここで、合成時に
音声素片を第1の標本周期及び第2の標本周期に基づい
て定められる度合いで時間軸方向に伸縮させながら接続
するとか、声質選択手段により選択指定された声質に応
じて第2の標本周期を定め、選択指定された声質に応じ
て定められる度合いで音声素片を時間軸方向に伸縮させ
ながら接続することで、合成する音声の発話速度を適切
に制御でき、なおかつ、合成する音声のスペクトル過渡
部分の時間変化も適切に制御できるから、声質を変化さ
せながら自然な発話速度で明瞭な音声が合成できる。
【0041】次に、本発明の第8の観点に係る音声合成
装置は、第1の標本周期で標本化した離散音声信号に第
1のフレーム周期の時間窓をかけて分析して得られる音
声の特徴パラメータフレームの時系列から所定の合成単
位で切り出した音声素片を複数蓄積する音声素片蓄積手
段と、この音声素片蓄積手段から入力音韻情報に基づい
て上記音声素片を選択し接続して合成パラメータフレー
ムの時系列を生成する合成パラメータフレーム時系列生
成手段と、この合成パラメータフレーム時系列生成手段
により生成された合成パラメータフレームの時系列から
上記第1のフレーム周期とは異なる第2のフレーム周期
で離散音声信号を合成する合成手段と、この合成手段に
よって合成された離散音声信号を上記第1の標本周期と
は異なる第2の標本周期でアナログ音声信号に変換する
ディジタル/アナログ変換手段とを備えたことを特徴と
する。ここで、第2のフレーム周期を、第1のフレーム
周期、第1の標本周期及び当該第1の標本周期とは異な
る第2の標本周期に基づいて定めるとよい。
【0042】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記合成手段で
は、声質選択手段により選択指定された声質に応じて定
められる第2のフレーム周期で離散音声信号が合成さ
れ、上記ディジタル/アナログ変換手段では、合成手段
によって合成された離散音声信号が声質選択手段により
選択指定された声質に応じて定められる第2の標本周期
でアナログ音声信号に変換される構成とすることも可能
である。
【0043】この発明においては、音声素片作成時の第
1の標本周期とD/A変換の第2の標本周期を異ならせ
ることにより、音声のスペクトルを周波数対数軸上でシ
フトさせ、同じ特徴パラメータを用いて異なる声質の音
声を合成することができるが、さらにここで、合成時の
第2のフレーム周期を、第1のフレーム周期、第1の標
本周期及び第2の標本周期に基づいて定めるとか、合成
時の第2のフレーム周期とD/A変換時の第2の標本周
期を声質選択手段で選択指定された声質に応じて定める
などして、上記第2のフレーム周期を分析時の窓の周期
(第1のフレーム周期)と異ならせることにより、合成
する音声の発話速度を適切に制御できるから、声質を変
化させながら自然な発話速度の音声が合成できる。
【0044】次に、本発明の第9の観点に係る音声合成
装置は、韻律情報と音韻情報を入力として第1の標本周
期で標本化した離散音声信号から作成した音声素片を複
数蓄積する音声素片蓄積手段と、上記第1の標本周期及
び第1の標本周期とは異なる第2の標本周期に基づいて
上記韻律情報から音声の基本周波数パターンを生成する
ピッチパターン生成手段と、上記音韻情報に基づいて上
記音声素片蓄積手段から音声素片を選択的に読み出し接
続することによって音声の音韻パラメータを生成する音
韻パラメータ生成手段と、この音韻パラメータ生成手段
によって生成された音韻パラメータと上記ピッチパター
ン生成手段によって生成された基本周波数パターンから
離散音声信号を合成する合成手段と、この合成手段によ
って合成された離散音声信号を上記第2の標本周期でア
ナログ音声信号に変換するディジタル/アナログ変換手
段とを備えたことを特徴とする。
【0045】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記ピッチパター
ン生成手段では、声質選択手段により選択指定された声
質に応じて韻律情報から音声の基本周波数パターンが生
成され、上記ディジタル/アナログ変換手段では、合成
手段によって合成された離散音声信号が声質選択手段に
より選択指定された声質に応じて定められる第2の標本
周期でアナログ音声信号に変換される構成とすることも
可能である。
【0046】この発明においては、音声素片作成時の第
1の標本周期とD/A変換の第2の標本周期を異ならせ
ることにより、音声のスペクトルを周波数対数軸上でシ
フトさせ、同じ特徴パラメータを用いて異なる声質の音
声を合成することができるが、さらにここで、合成の基
本周波数パターンを第1の標本周期及び第2の標本周期
に基づいて定めるとか、基本周波数パターンとD/A変
換時の第2の標本周期を声質選択手段で選択指定された
声質に応じて定めることにより、合成する音声のピッチ
(声の高さ)を適切に制御できるから、声質を変化させ
ながら自然なピッチの音声が合成できる。
【0047】次に、本発明の第10の観点に係る音声合
成装置は、前記第1の観点に係る音声合成装置に対応す
るもので、ディジタル/アナログ変換手段でのD/A変
換の対象となる離散音声信号の標本周期を第1の標本周
期とは異なる第2の標本周期に変換する標本周期変換手
段を備えると共に、当該ディジタル/アナログ変換手段
での離散音声信号からのアナログ音声信号への変換が上
記第2の標本周期とは異なる第3の周期で行われる構成
としたことを特徴とする。
【0048】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記標本周期変換
手段では、合成手段によって合成された離散音声信号の
標本周期が声質選択手段により選択指定された声質に応
じて定められる第2の標本周期に変換される構成とする
ことも可能である。
【0049】この発明においては、音声分析時の第1の
標本周期とは異なる第2の標本周期に合成音声(離散音
声信号)を変換した後、第2の標本周期とは異なる第3
の標本周期でD/A変換を行うことにより、音声のスペ
クトルが周波数対数軸上でシフトするから、同じ特徴パ
ラメータを用いて異なる声質の音声を合成することがで
きる。なお、元の声質の音声を合成するには、第1の標
本周期=第2の標本周期=第3の標本周期とすればよ
い。
【0050】次に、本発明の第11の観点に係る音声合
成装置は、前記第2の観点に係る音声合成装置に対応す
るもので、ディジタル/アナログ変換手段でのD/A変
換の対象となる離散音声信号の標本周期を第1の標本周
期とは異なる第2の標本周期に変換する標本周期変換手
段を備えると共に、当該ディジタル/アナログ変換手段
での離散音声信号からのアナログ音声信号への変換が上
記第2の標本周期とは異なる第3の周期で行われる構成
としたことを特徴とする。ここで、離散音声信号を合成
する第2のフレーム周期を、第1のフレーム周期、第2
の標本周期及び第3の標本周期に基づいて定めるとよ
い。
【0051】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、合成手段では、声
質選択手段により選択指定された声質に応じて定められ
る第2のフレーム周期で離散音声信号が合成され、標本
変換手段では、合成手段によって合成された離散音声信
号が声質選択手段により選択指定された声質に応じて定
められる第2の標本周期に変換される構成とすることも
可能である。
【0052】この発明においては、音声分析時の第1の
標本周期とは異なる第2の標本周期に合成音声を変換し
た後、第2の標本周期とは異なる第3の標本周期でD/
A変換を行うことにより、音声のスペクトルを周波数対
数軸上でシフトさせた効果がでるから、同じ特徴パラメ
ータを用いて異なる声質の音声を合成することができる
が、さらにここで、合成時の第2のフレーム周期を、第
1のフレーム周期、第2の標本周期及び第3の標本周期
に基づいて定めるとか、第2の標本周期と合成時の第2
のフレーム周期を声質選択手段で選択指定された声質に
応じて定めるなどして、上記第2のフレーム周期を分析
時の窓の周期(第1のフレーム周期)と異ならせること
により、合成する音声の発話速度を適切に制御できるか
ら、声質を変化させながら自然な発話速度の音声が合成
できる。
【0053】次に、本発明の第12の観点に係る音声合
成装置は、前記第3の観点に係る音声合成装置に対応す
るもので、ピッチパターン蓄積手段から読み出した基本
周波数パターンを第1の標本周期、第1の標本周期とは
異なる第2の標本周期及び第2の標本周期とは異なる第
3の標本周期に基づいて変調するピッチパターン変調手
段と、ディジタル/アナログ変換手段でのD/A変換の
対象となる離散音声信号の標本周期を上記第2の標本周
期に変換する標本周期変換手段とを備えると共に、当該
ディジタル/アナログ変換手段での離散音声信号からの
アナログ音声信号への変換が上記第3の周期で行われる
構成としたことを特徴とする。
【0054】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、ピッチパターン変
調手段では、ピッチパターン蓄積手段から読み出した基
本周波数パターンを対象に、声質選択手段により選択指
定された声質に応じた変調が行われ、標本周期変換手段
では、ディジタル/アナログ変換手段でのD/A変換の
対象となる離散音声信号の標本周期が声質選択手段によ
り選択指定された声質に応じて定められる第2の標本周
期に変換される構成とすることも可能である。
【0055】この発明においては、音声分析時の第1の
標本周期とは異なる第2の標本周期に合成音声を変換し
た後、第2の標本周期とは異なる第3の標本周期でD/
A変換を行うことにより、音声のスペクトルが周波数対
数軸上でシフトするため、同じ特徴パラメータを用いて
異なる声質の音声を合成することができるが、さらにこ
こで、合成の基本周波数パターンを第1の標本周期とは
異なる第2の標本周期及び第2の標本周期とは異なる第
3の標本周期に基づいて定めるとか、第2の標本周期と
合成の基本周波数パターンを声質選択手段で選択指定さ
れた声質に応じて定めることにより、合成する音声のピ
ッチ(声の高さ)を適切に制御できるから、声質を変化
させながら自然なピッチの音声が合成できる。
【0056】次に、本発明の第13の観点に係る音声合
成装置は、前記第4の観点に係る音声合成装置に対応す
るもので、音声合成手段にて合成した離散音声信号の標
本周期を第1の標本周期とは異なる第2の標本周期に当
該音声合成手段にて変換する構成とすると共に、この標
本周期が変換された離散音声信号をディジタル/アナロ
グ変換手段により上記第2の標本周期とは異なる第3の
周期でアナログ音声信号に変換する構成としたことを特
徴とする。
【0057】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記音声合成手段
では、合成した離散音声信号の標本周期が声質選択手段
により選択指定された声質に応じて定められる第2の標
本周期に変換される構成とすることも可能である。
【0058】この発明においては、音声素片作成時の第
1の標本周期とは異なる第2の標本周期に合成音声を変
換した後、第2の標本周期とは異なる第3の標本周期で
D/A変換を行うことにより、音声のスペクトルが周波
数対数軸上でシフトするから、同じ音声素片を用いて異
なる声質の音声を合成することができる。なお、元の声
質の音声を合成するには、第1の標本周期=第2の標本
周期=第3の標本周期とすればよい。
【0059】次に、本発明の第14の観点に係る音声合
成装置は、前記第5の観点に係る音声合成装置に対応す
るもので、音声合成手段にて合成した離散音声信号の標
本周期を第1の標本周期とは異なる第2の標本周期に当
該音声合成手段にて変換することが可能で、上記第2の
標本周期への標本周期変換を行う際の合成処理には、標
本周期の変換を行わないときとは異なる値の発話速度パ
ラメータを用いる構成とすると共に、上記音声合成手段
から出力される離散音声信号をディジタル/アナログ変
換手段により上記第2の標本周期とは異なる第3の周期
でアナログ音声信号に変換する構成としたことを特徴と
する。ここで、合成処理で使用する発話速度パラメータ
を第2の標本周期及び第3の標本周期に基づいて定める
とよい。
【0060】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記音声合成手段
では、使用する発話速度パラメータと第2の標本周期が
声質選択手段により選択指定された声質に応じて定めら
れる構成とすることも可能である。
【0061】この発明においては、音声素片作成時の第
1の標本周期とは異なる第2の標本周期に合成音声を変
換した後、第2の標本周期とは異なる第3の標本周期で
D/A変換を行うことにより、音声のスペクトルが周波
数対数軸上でシフトするため、同じ特徴パラメータを用
いて異なる声質の音声を合成することができるが、さら
にここで、合成時に使用される発話速度パラメータを、
標本周期の変換を行わないとき(第1の標本周期に変換
することと等価)に用いる値と異ならせるとか、第2の
標本周期及び第3の標本周期に応じて定めるとか、声質
選択手段により選択指定された声質に応じて第2の標本
周期を定め、選択指定された声質に応じて発話速度パラ
メータを定めることで、合成する音声の発話速度を適切
に制御できるから、声質を変化させながら自然な発話速
度で音声が合成できる。
【0062】次に、本発明の第15の観点に係る音声合
成装置は、前記第6の観点に係る音声合成装置に対応す
るもので、音声合成手段にて合成した離散音声信号の標
本周期を第1の標本周期とは異なる第2の標本周期に当
該音声合成手段にて変換することが可能で、上記第2の
標本周期への標本周期変換を行う際の合成処理では、標
本周期の変換を行わないときとは異なる音韻継続時間と
なるような音韻継続時間決定を行う構成とすると共に、
上記音声合成手段から出力される離散音声信号をディジ
タル/アナログ変換手段により上記第2の標本周期とは
異なる第3の周期でアナログ音声信号に変換する構成と
したことを特徴とする。ここで、合成処理で使用する音
韻継続時間を第2の標本周期及び第3の標本周期に基づ
いて定めるとよい。
【0063】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記音声合成手段
では、使用する音韻継続時間と第2の標本周期が声質選
択手段により選択指定された声質に応じて定められる構
成とすることも可能である。
【0064】この発明においては、音声素片作成時の第
1の標本周期とは異なる第2の標本周期に合成音声を変
換した後、第2の標本周期とは異なる第3の標本周期で
D/A変換を行うことにより、音声のスペクトルが周波
数対数軸上でシフトするため、同じ特徴パラメータを用
いて異なる声質の音声を合成することができるが、さら
にここで、合成時に使用される音韻継続時間を、標本周
期の変換を行わないとき(第1の標本周期に変換するこ
とと等価)に用いる値と異ならせるとか、第2の標本周
期及び第3の標本周期に応じて定めるとか、声質選択手
段により選択指定された声質に応じて第2の標本周期を
定め、選択指定された声質に応じて音韻継続時間を定め
ることで、合成する音声の発話速度を適切に制御できる
から、声質を変化させながら自然な発話速度で音声が合
成できる。
【0065】次に、本発明の第16の観点に係る音声合
成装置は、前記第7の観点に係る音声合成装置に対応す
るもので、第1の標本周期で標本化した離散音声信号か
ら作成した音声素片を、与えられた音韻情報に基づいて
選択し、この選択した音声素片を時間軸方向に伸縮させ
ながら接続することによって離散音声信号を合成する音
声合成手段であって、上記合成した離散音声信号の標本
周期を上記第1の標本周期とは異なる第2の標本周期に
変換することが可能な音声合成手段と、この音声合成手
段から出力される離散音声信号を上記第2の標本周期と
は異なる第3の標本周期でアナログ音声信号に変換する
ディジタル/アナログ変換手段とを備えたことを特徴と
する。ここで、音声合成手段における声素片接続時の音
声素片に対する時間軸方向への伸縮の度合いを、上記第
2の標本周期及び第3の標本周期に基づいて定めるとよ
い。
【0066】この発明においては、音声素片作成時の第
1の標本周期とは異なる第2の標本周期に合成音声を変
換した後、第2の標本周期とは異なる第3の標本周期で
D/A変換を行うことにより、音声のスペクトルが周波
数対数軸上でシフトするため、同じ特徴パラメータを用
いて異なる声質の音声を合成することができるが、さら
にここで、音声素片を時間軸方向に伸縮させながら接続
することによって、例えば、第2の標本周期及び第3の
標本周期に基づいて定められる度合いで時間軸方向に伸
縮させながら接続することによって、合成する音声の発
話速度を適切に制御でき、なおかつ、合成する音声のス
ペクトル過渡部分の時間変化も適切に制御できるから、
声質を変化させながら自然な発話速度で明瞭な音声が合
成できる。
【0067】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記音声合成手段
では、選択した音声素片を声質選択手段により選択指定
された声質に応じて定められる度合いで時間軸方向に伸
縮させながら接続することによって離散音声信号を合成
し、この合成した離散音声信号の標本周期を選択指定さ
れた声質に応じて定められる第2の標本周期に変換する
構成とすることも可能である。この場合、選択された声
質に応じて定められる第2の標本周期に合成音声を変換
した後、第3の標本周期でD/A変換を行うことによ
り、音声のスペクトルが周波数対数軸上でシフトするた
め、同じ特徴パラメータを用いて異なる声質の音声を合
成することができるが、さらにここで、合成時に音声素
片を選択された声質に応じた度合で時間軸方向に伸縮さ
せながら接続することによって、合成する音声の発話速
度を適切に制御でき、なおかつ、合成する音声のスペク
トル過渡部分の時間変化も適切に制御できるから、声質
を変化させながら自然な発話速度で明瞭な音声が合成で
きる。
【0068】次に、本発明の第17の観点に係る音声合
成装置は、前記第8の観点に係る音声合成装置に対応す
るもので、第1の標本周期で標本化した離散音声信号に
第1のフレーム周期の時間窓をかけて分析して得られる
音声の特徴パラメータフレームの時系列から所定の合成
単位で切り出した音声素片を複数蓄積する音声素片蓄積
手段と、この音声素片蓄積手段から入力音韻情報に基づ
いて音声素片を選択し接続して合成パラメータフレーム
の時系列を生成する合成パラメータフレーム時系列生成
手段と、この合成パラメータフレーム時系列生成手段に
より生成された合成パラメータフレームの時系列から上
記第1のフレーム周期とは異なる第2のフレーム周期で
離散音声信号を合成する合成手段と、この合成手段によ
って合成された離散音声信号の標本周期を上記第1の標
本周期とは異なる第2の標本周期に変換する標本周期変
換手段と、この標本周期変換手段によって標本周期が変
換された離散音声信号を上記第2の標本周期とは異なる
第3の標本周期でアナログ音声信号に変換するディジタ
ル/アナログ変換手段とを備えたことを特徴とする。こ
こで、上記第2のフレーム周期を、上記第1のフレーム
周期、第2の標本周期及び第3の標本周期に基づいて定
めるとよい。
【0069】この発明においては、音声素片作成時の第
1の標本周期とは異なる第2の標本周期に合成音声を変
換した後、第2の標本周期とは異なる第3の標本周期で
D/A変換を行うことにより、音声のスペクトルが周波
数対数軸上でシフトするため、同じ特徴パラメータを用
いて異なる声質の音声を合成することができるが、さら
にここで、合成時の第2のフレーム周期を第1のフレー
ム周期、第2の標本周期及び第3の標本周期に基づいて
定めるなどして、分析時の窓の周期(第1のフレーム周
期)と異ならせることにより、合成する音声の発話速度
を適切に制御できるから、声質を変化させながら自然な
発話速度の音声が合成できる。
【0070】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記音声合成手段
では、上記第2のフレーム周期と第2の標本周期が声質
選択手段により選択指定された声質に応じて定められる
構成とすることも可能である。この場合、選択された声
質に応じて定められる第2の標本周期に合成音声を変換
した後、第3の標本周期でD/A変換を行うことによ
り、音声のスペクトルが周波数対数軸上でシフトするた
め、同じ特徴パラメータを用いて異なる声質の音声を合
成することができるが、さらにここで、合成時の第2の
フレーム周期を選択された声質に応じて定め、分析時の
窓の周期(第1のフレーム周期)と異ならせることによ
り、合成する音声の発話速度を適切に制御できるから、
声質を変化させながら自然な発話速度の音声が合成でき
る。
【0071】次に、本発明の第18の観点に係る音声合
成装置は、前記第9の観点に係る音声合成装置に対応す
るもので、第1の標本周期とは異なる第2の標本周期及
び第2の標本周期とは異なる第3の標本周期に基づいて
入力韻律情報から音声の基本周波数パターンを生成する
ピッチパターン生成手段と、(入力音韻情報に基づいて
生成された音韻パラメータと上記ピッチパターン生成手
段によって生成された基本周波数パターンとから)合成
された離散音声信号の標本周期を上記第2の標本周期に
変換する標本周期変換手段と、この標本周期変換手段に
よって標本周期が変換された離散音声信号を上記第3の
標本周期でアナログ音声信号に変換するディジタル/ア
ナログ変換手段とを備えたことを特徴とする。
【0072】この発明においては、音声素片作成時の第
1の標本周期とは異なる第2の標本周期に合成音声を変
換した後、第2の標本周期とは異なる第3の標本周期で
D/A変換を行うことにより、音声のスペクトルが周波
数対数軸上でシフトするため、同じ特徴パラメータを用
いて異なる声質の音声を合成することができるが、さら
にここで、第2の標本周期及び第3の標本周期に基づい
て合成の基本周波数パターンを定めることにより、合成
する音声のピッチ(声の高さ)を適切に制御できるか
ら、声質を変化させながら自然なピッチの音声が合成で
きる。
【0073】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記ピッチパター
ン生成手段では、声質選択手段により選択指定された声
質に応じて上記韻律情報から音声の基本周波数パターン
が生成され、上記標本周期変換手段では、合成された離
散音声信号の標本周期が声質選択手段により選択指定さ
れた声質に応じて定められる第2の標本周期に変換され
る構成とすることも可能である。この場合、選択された
声質に応じて定められる第2の標本周期に合成音声を変
換した後、第3の標本周期でD/A変換を行うことによ
り、音声のスペクトルが周波数対数軸上でシフトするた
め、同じ特徴パラメータを用いて異なる声質の音声を合
成することができるが、さらにここで、選択された声質
に応じて合成の基本周波数パターンを決定することによ
り、合成する音声のピッチ(声の高さ)を適切に制御で
きるから、声質を変化させながら自然なピッチの音声が
合成できる。
【0074】
【発明の実施の形態】以下、本発明の実施の形態につき
図面を参照して説明する。
【0075】[第1の実施形態]図1は本発明の第1の
実施形態に係る音声の分析合成装置の概略構成を示すブ
ロック図である。
【0076】図1において、メモリ11には、1102
5Hz(第1の標本周期)でサンプリング(標本化)し
た音声(離散音声信号)に対して、フレーム周期(第1
のフレーム周期)10msecで窓幅20msecのハニング窓
をかけ、従来技術にて説明した手順で得られる0次〜2
5次までの低次ケプストラム係数のパラメータフレーム
の時系列(特徴パラメータ)と、各フレームに対応した
音声の有声・無声情報が記憶されている。低次ケプスト
ラム係数については従来技術において説明済みであるの
で、ここでは省略する。
【0077】一方、メモリ12には、所定の基本周波数
抽出方法により同じ音声から得られる、音声の基本周波
数の時系列パターンが記憶されている。
【0078】合成フィルタ処理部13は、これら2つの
メモリ11,12より各データを読み出し、メモリ11
より読み出された音声のパラメータフレーム(ケプスト
ラム係数)をフィルタ係数とするLMAフィルタ(図示
せず)を、有声区間ではメモリ12より読み出された音
声の基本周波数の時系列パターン(ピッチパターン)に
基づいた周期パルスで、無声区間ではランダムノイズで
駆動することにより所望の音声(離散音声信号)を合成
する。
【0079】ここまでの処理はプログラムによって行わ
れるため、合成フィルタ処理部13(内のLMAフィル
タ)から出力される音声は離散音声信号である。そこ
で、この離散音声信号をD/A変換器14に供給し、電
気的なアナログ信号に変換する。こうして得られた音声
のアナログ信号をアンプ15にて増幅し、スピーカ16
を駆動することにより聴覚で知覚できる音声を得ること
ができる。
【0080】ここまでは従来技術で挙げた(図23の分
析合成装置の)例とほぼ同じである。本実施形態のポイ
ントは、声質切替部17及び声質制御部18が加えられ
たことにある。なお、D/A変換器14はハードウェア
により構成されているが、その変換のサンプリング周波
数はソフトウェアから制御可能なようになっている。
【0081】声質切替部17は、ユーザによる指定もし
くはアプリケーションプログラム等によって合成する際
の声質を切り替え指定することができるようになってい
る。本実施形態では、この声質切替部17にて3種類の
声質が指定可能であるものとする。
【0082】声質制御部18は、声質切替部17で指定
された声質に応じて11025Hz,12000HZ,
10000Hzのいずれかのサンプリング周波数(第2
の標本周期)でディジタル/アナログ変換(D/A変
換)を行うようにD/A変換器14を制御する。
【0083】メモリ11に蓄えられたケプストラムを作
成した際の音声のサンプリング周波数(第1の標本周
期)と同じサンプリング周波数、即ち11025Hz
で、D/A変換器14がD/A変換が行えば、元の音声
の声質で音声合成することができる。
【0084】一方、D/A変換器14が他のサンプリン
グ周波数(第1の標本周期とは異なる第2の標本周期)
でD/A変換すれば、図2に示すように、音声スペクト
ル(図はスペクトル包絡)を周波数軸方向にシフトした
効果が得られるため、音声の個人性が変化し、こうして
得られるアナログ音声信号の声質は、元となる音声の声
質とは異なったものとなる。
【0085】[第2の実施形態]前記第1の実施形態に
おいては、声質切替部17及び声質制御部18を設けた
ことで、合成音声の声質を簡単に増やすことができるも
のの、合成される音声のスピードが声質により異なる。
【0086】即ち、(ケプストラム作成時のサンプリン
グ周波数)>(D/A変換のサンプリング周波数)のと
きには、合成される音声のスピードは遅くなる。逆に、
(ケプストラム作成時のサンプリング周波数)<(D/
A変換のサンプリング周波数)のときには、合成される
音声のスピードは早くなる。
【0087】このような合成される音声のスピードの違
いは、D/A変換時のサンプリング周波数が前記第1の
実施形態程度の違い(91%,109%)ではあまり問
題とはならない。しかし以下に述べるように、D/A変
換時のサンプリング周波数(第2の標本周期)が、メモ
リ11に蓄えられたケプストラムを作成した際の音声の
サンプリング周波数(第1の標本周期)と大きく異なる
場合には、問題となる。
【0088】まず、ケプストラム作成時のサンプリング
周波数と合成時のD/A変換のサンプリング周波数の比
が1に近ければ声質は変化も小さく、逆にこの比が1か
ら離れれば声質は大きく変化する。したがって、声質を
大きく変えようとすれば、これら両サンプリング周波数
の比を例えば50%,200%程度に設定すればよい
が、これでは合成音声のスピードもそれぞれ元の音声の
50%,200%、即ち半分と倍になり、かなり聞きづ
らくなる。
【0089】そこで、合成時のD/A変換のサンプリン
グ周波数がケプストラム作成時のサンプリング周波数と
大きく異なった場合でも、合成音声のスピードを一定に
できるようにした第2の実施形態につき説明する。
【0090】図3は本発明の第2の実施形態に係る音声
の分析合成装置の概略構成を示すブロック図であり、図
1と同一部分には同一符号を付してある。
【0091】本実施形態のポイントは、図1中の合成フ
ィルタ処理部13に代えて、合成時のフレーム周期が制
御可能な合成フィルタ処理部23を設けると共に、図1
中の声質制御部18に代えて、D/A変換のサンプリン
グ周波数だけでなく合成時のフレーム周期を制御する声
質制御部28を設け、当該声質制御部28により、声質
切替部17の指定に応じて、D/A変換器14でのD/
A変換のサンプリング周波数と同時に、合成フィルタ処
理部23での合成時のフレーム周期を制御するところに
ある。
【0092】本実施形態では、前記第1の実施形態と同
様に声質切替部17にて3種類の声質が指定可能であ
る。声質制御部28は声質切替部17で指定された声質
に応じて、例えば11025Hz,8000Hz,16
000Hzのいずれかのサンプリング周波数でD/A変
換を行うようにD/A変換器14を制御する。
【0093】同時に声質制御部28は、声質切替部17
によって指定された声質に応じて、合成フィルタ処理部
23で行われる合成のフレーム周期を設定する。これに
より合成フィルタ処理部23では、メモリ11より読み
出された音声のパラメータフレーム(ケプストラム係
数)を設定されたフレーム周期で(LMAフィルタに)
入力し、当該フレーム周期で音声(離散音声信号)を合
成する。
【0094】合成のフレーム周期は次式により与えられ
る。
【0095】 (フレーム周期) =(分析フレーム周期)×(分析サンプリング周期)/(D/A変換の サンプリング周期) =(分析フレーム周期)×(D/A変換のサンプリング周波数)/(分 析サンプリング周波数) したがって、ケプストラム作成時(分析時)の音声のサ
ンプリング周波数(第1の標本周期)と同じサンプリン
グ周波数、即ち11025HzでD/A変換を行う際に
は、声質制御部28は上式に基づき、合成時のフレーム
周期をケプストラム作成時のフレーム周期である分析フ
レーム周期(第1のフレーム周期)と同じ10msecで合
成するよう合成フィルタ処理部13を制御する。但し、
メモリ11に蓄えられたケプストラムは前記第1の実施
形態と同じ条件で作成されているものとする。
【0096】また声質制御部28は、ケプストラム作成
時(分析時)の音声のサンプリング周波数とは異なるサ
ンプリング周波数(第1の標本周期とは異なる第2の標
本周期)、例えば8000HzにてD/A変換を行う場
合には、 10[msec]×8000[Hz]/11025[Hz]=7.3[m
sec] のフレーム周期(第1のフレーム周期とは異なる第2の
フレーム周期)で合成を行うよう制御し、16000H
zにてD/A変換を行う場合には、 10[msec]×16000[Hz]/11025[Hz]=14.
5[msec] のフレーム周期(第1のフレーム周期とは異なる第2の
フレーム周期)で合成を行うよう制御する。
【0097】このように本実施形態においては、分析時
と異なるサンプリング周波数(第1の標本周期とは異な
る第2の標本周期)でD/A変換したときの合成音声の
スピードの変化を、合成フィルタ処理部23での合成の
フレーム周期(第2のフレーム周期)をケプストラム作
成時(分析時)のフレーム周期(第1のフレーム周期)
とは異ならせることで相殺することができる。
【0098】したがって、分析時のサンプリング周波数
と異なる8000Hzあるいは16000HzでD/A
変換を行っても、同じスピードの音声のアナログ信号を
得ることができる。
【0099】[第3の実施形態]ところで、前記第1の
実施形態においては、D/A変換のサンプリング周波数
を分析時のものと変えると、声の高さ、即ち音声のピッ
チの変化を招く。
【0100】即ち、(ケプストラム作成時のサンプリン
グ周波数)>(D/A変換のサンプリング周波数)のと
きには、合成される音声のピッチは低くなる。逆に、
(ケプストラム作成時のサンプリング周波数)<(D/
A変換のサンプリング周波数)のときには、合成される
音声のピッチは高くなる。
【0101】このような合成される音声のピッチの違い
は、D/A変換時のサンプリング周波数が前記第1の実
施形態程度の違い(91%,109%)ではあまり問題
とはならない。しかし、声質を大きく変えようとして、
両サンプリング周波数の比を例えば50%,200%程
度に設定すれば、合成音声のピッチもそれぞれ50%,
200%と変化するため、ケプストラム作成時と同じ1
1025HzでD/A変換したときの音声(あるいは原
音声)と比較して、前者はピッチが1[oct] (オクター
ブ)低い音声が合成され、後者は1[oct] 高い音声が合
成されるので聞きづらくなるという問題が発生する。
【0102】そこで、合成時のD/A変換のサンプリン
グ周波数がケプストラム作成時のサンプリング周波数と
大きく異なった場合でも、合成音声のピッチを一定にで
きるようにした第3の実施形態につき説明する。
【0103】図4は本発明の第3の実施形態に係る音声
の分析合成装置の概略構成を示すブロック図であり、図
1と同一部分には同一符号を付してある。
【0104】本実施形態のポイントは、図1中の合成フ
ィルタ処理部13に代えて、合成時のフレーム周期が制
御可能な合成フィルタ処理部33を設けると共に、メモ
リ12と合成フィルタ処理部33との間にメモリ12よ
り読み出された基本周波数(の時系列)パターン(ピッ
チパターン)を周波数の異なる別の基本周波数パターン
に変換(ピッチ変調)して合成フィルタ処理部33に与
えるピッチ変調処理部31を設け、さらに図1中の声質
制御部18に代えて、D/A変換のサンプリング周波数
だけでなく合成時のフレーム周期及びピッチの変調を制
御する声質制御部38を設け、当該声質制御部38によ
り、声質切替部17の指定に応じて、D/A変換器14
でのサンプリング周波数と合成フィルタ処理部33での
合成時のフレーム周期を制御すると同時に、ピッチ変調
処理部31でのピッチの変調を制御するところにある。
【0105】本実施形態では、前記第1の実施形態と同
様に声質切替部17にて3種類の声質を指定可能であ
る。声質制御部38は声質切替部17で指定された声質
に応じて、例えば11025Hz,8000Hz,16
000Hzのいずれかのサンプリング周波数でD/A変
換を行うようにD/A変換器14を制御する。
【0106】声質制御部38は、声質切替部17によっ
て指定された声質に応じて、D/A変換器14のD/A
変換のサンプリング周波数を設定すると同時に、合成フ
ィルタ処理部33で行われる合成のフレーム周期を設定
する。合成のフレーム周期は次式により与えられる。
【0107】 (フレーム周期) =(分析フレーム周期)×(分析サンプリング周期)/(D/A変換の サンプリング周期) =(分析フレーム周期)×(D/A変換のサンプリング周波数)/(分 析サンプリング周波数) なお、メモリ11に蓄えられたケプストラムは前記第1
の実施形態と同じ条件で作成されているものとする。
【0108】声質制御部38はさらに、合成フィルタ処
理部33に与えるピッチ(ピッチパターン)が、 (合成フィルタ処理部33に与えるピッチ) =(メモリ12より読み出したピッチ)×(D/A変換のサンプリング 周期)/(分析時のサンプリング周期) =(メモリ12より読み出したピッチ)×(分析時のサンプリング周波 数)/(D/A変換のサンプリング周波数) となるように、ピッチ変調処理部31を制御する。
【0109】したがって、ケプストラム作成時の音声の
サンプリング周波数(第1の標本周期)と同じサンプリ
ング周波数、即ち11025HzでD/A変換を行う際
には、声質制御部38は上式に基づき、合成フィルタ処
理部33に与えるピッチを分析時と同じピッチとなるよ
うピッチ変調処理部31を制御する。
【0110】また声質制御部38は、ケプストラム作成
時(分析時)の音声のサンプリング周波数とは異なるサ
ンプリング周波数(第1の標本周期とは異なる第2の標
本周期)、例えば8000HzにてD/A変換を行う場
合には、分析時のピッチを(11025[Hz]/8000
[Hz])倍して合成フィルタ処理部33に与えるように、
16000HzでD/A変換を行う場合には、同じく分
析時のピッチを(11025[Hz]/16000[Hz])倍
して合成フィルタ処理部33に与えるように、ピッチ変
調処理部31を制御する。
【0111】このように本実施形態においては、合成フ
ィルタ処理部33に与えるピッチを声質制御部38の制
御のもとでピッチ変調処理部31にて予め変調しておく
ことにより、分析時と異なるサンプリング周波数でD/
A変換したときに生じる合成音声のピッチの変化を相殺
することができる。
【0112】したがって、分析時のサンプリング周波数
と異なる8000Hzあるいは16000HzでD/A
変換を行っても、同じ声の高さの音声のアナログ信号を
得ることができる。
【0113】[第4の実施形態]図5は本発明の第4の
実施形態に係る音声の規則合成装置の概略構成を示すブ
ロック図である。
【0114】この音声規則合成装置は、例えばパーソナ
ルコンピュータ等の情報処理装置上で専用のソフトウェ
ア(文音声変換ソフトウェア)を実行することにより実
現されるもので、文音声変換(TTS)処理機能、即ち
テキストから音声を生成する文音声変換処理(文音声合
成処理)機能を有しており、その機能構成は、大別して
言語処理部41と、音声合成部42とに分けられる。
【0115】言語処理部41は、入力文、例えば漢字か
な混じり文を解析して読み情報とアクセント情報を生成
する処理と、これら情報に基づき音韻記号系列・アクセ
ント情報が記述された音声記号列を生成する処理を司
る。
【0116】音声合成部42は、言語処理部41の出力
である音声記号列をもとに音声を生成する処理を司る。
【0117】さて、図5の音声規則合成装置において、
文音声変換(読み上げ)の対象となる文書(ここでは日
本語文書)はテキストファイル43として保存されてい
る。本装置では、文音声変換ソフトウェアに従い、当該
ファイル43から漢字かな混じり文を1文ずつ読み出し
て、言語処理部41及び音声合成部422 により以下に
述べる文音声変換処理を行い、音声を合成する。
【0118】まず、テキストファイル43から読み出さ
れた漢字かな混じり文は、言語処理部41内の言語解析
処理部44に入力される。
【0119】言語解析処理部44は、入力される漢字か
な混じり文に対して形態素解析を行い、読み情報とアク
セント情報を生成する。形態素解析とは、与えられた文
の中で、どの文字列が語句を構成しているか、そしてそ
の語の構造がどのようなものかを解析する作業である。
【0120】そのために言語解析処理部44は、文の最
小構成要素である「形態素」を見出し語にもつ形態素辞
書45と形態素間の接続規則が登録されている接続規則
ファイル46を利用する。即ち言語解析処理部44は、
入力文と形態素辞書45とを照合することで得られる全
ての形態素系列候補を求め(総当たり法)、その中か
ら、接続規則ファイル46を参照して文法的に前後に接
続できる組み合わせを出力する。形態素辞書45には、
解析時に用いられる文法情報と共に、形態素の読み並び
にアクセントの型が登録されている。このため、形態素
解析により形態素が定まれば、同時に読みとアクセント
型も与えることができる。
【0121】例えば、「公園へ行って本を読みます」と
いう文に対して形態素解析を行うと、 /公園/ヘ/行って/本/を/読み/ます/。
【0122】と形態素に分割される。各形態素に読みと
アクセント型が与えられ、 /コウエン/エ/イッテ/ホ^ン/ヲ/ヨミ/マ^ス/ となる。ここで「^」の入っている形態素は、その直前
の音節でピッチが高く、その直後の音節ではピッチが落
ちるアクセントであることを意味する。また「^」がな
い場合は、平板型のアクセントであることを意味する。
【0123】ところで、人間が文章を読むときには、こ
のような形態素単位でアクセントを付けて読むことはせ
ず、幾つかの形態素をひとまとめにして、そのまとまり
にアクセントを付けて読んでいる。
【0124】そこで、このようなことを考慮して、言語
解析処理部44ではさらに、一つのアクセント句(アク
セントを与える単位)で形態素をまとめると同時に、ま
とめたことによるアクセントの移動も推定する。これに
加えて言語解析処理部44は、母音の無声化や読み上げ
の際のポーズ(息継ぎ)等の情報も付加し、上記の例で
は、最終的に次のような読み情報を生成する。
【0125】/コーエンエ/イッテ./ホ^ンオ/ヨミ
マ^(ス)/ ここで、ピリオド「.」は息継ぎを、「( )」は母音
が無声化した音節を表わす。
【0126】さて、上記のようにして言語処理部41内
の言語解析処理部44により読み情報が生成されると、
音声合成部42内の音韻継続時間計算処理部47が起動
される。音韻継続時間計算処理部47は、言語解析処理
部44で生成した読み情報に従って、入力文に含まれる
各音節の子音部ならびに母音部の継続時間(単位はms)
を決定する。
【0127】この音韻継続時間計算処理部47での継続
時間の決定処理は、子音(C)と母音(V)の境界(C
Vわたり)の位置が等間隔に並ぶようにするという、極
めて簡単なアルゴリズムにより実現されている。
【0128】CVわたりの間隔(発話速度パラメータと
してのCVわたりの間隔)は、音声合成部42内の発話
速度制御部48より与えられる。図示しないが、本実施
形態で用いられるソフトウェアではユーザが合成音声の
スピードを指定することが可能となっている。そして、
ユーザが指定した音声のスピードがこの発話速度制御部
48に与えられることにより、当該発話速度制御部48
が(音韻継続時間計算処理部47での継続時間の決定処
理にて決定される)先程のCVわたりの間隔を調整して
合成音声の速度を実際に変化させている。但し、日本語
の音声は、発声の速度を変えても子音の継続時間はほぼ
一定であることが分析結果から分かっているので、子音
の継続時間は一定に保ち、母音の継続時間を調節してC
Vわたりの間隔を変える。
【0129】音韻継続時間計算処理部47により入力文
に含まれる各音節の(子音部ならびに母音部の)継続時
間が決定されると、同じ音声合成部42内のピッチ生成
処理部49が起動される。ピッチ生成処理部49は音韻
継続時間計算処理部47により決定された継続時間と、
(言語処理部41内の)言語解析処理部44により決定
されたアクセント情報に基づいて、まず点ピッチ位置を
設定する。次にピッチ生成処理部49は、設定した複数
の点ピッチを直線で補間して例えば10msec毎のピッチ
パターン(基本周波数パターン)を得る。
【0130】一方、音声合成部42内の音韻パラメータ
生成処理部50は、(言語処理部41内の)言語解析処
理部44から渡される音声記号列の音韻情報をもとに音
韻パラメータを生成する処理を、例えばピッチ生成処理
部49によるピッチパターン生成処理と並行して次のよ
うに行う。
【0131】まず本実施形態では、サンプリング周波数
11025Hz(第1の標本周期)で標本化した実音声
を改良ケプストラム法により窓長20msec、フレーム周
期(第1のフレーム周期)10msecで分析して得た0次
から25次のケプストラム係数を子音+母音(CV)の
単位で日本語音声の合成に必要な全音節を切り出した計
137個の音声素片が蓄積された音声素片ファイル(図
示せず)が用意されている。この音声素片ファイルの内
容は、文音声変換ソフトウェアに従う文音声変換処理の
開始時に、例えばメインメモリ(図示せず)に確保され
た音声素片領域(以下音声素片メモリと称する)51に
読み込まれているものとする。
【0132】音韻パラメータ生成処理部50は、(言語
処理部41内の)言語解析処理部44から渡される音声
記号列中の音韻情報に従って、上記したCV単位の音声
素片を音声素片メモリ51から順次読み出し、読み出し
た音声素片を接続することにより合成すべき音声の音韻
パラメータ(特徴パラメータ)を生成する。
【0133】ピッチ生成処理部49によりピッチパター
ンが生成され、音韻パラメータ生成処理部50により音
韻パラメータが生成されると、音声合成部42内の合成
フィルタ処理部52が起動される。この合成フィルタ処
理部52は、図6に示すように、ホワイトノイズ発生部
521、インパルス発生部522、駆動音源切替部52
3、及びLMAフィルタ524から構成されており、上
記生成されたピッチパターンと音韻パラメータから、次
のようにして音声を合成する。
【0134】まず、音声の有声部(V)では、駆動音源
切替部523によりインパルス発生部522側に切り替
えられる。インパルス発生部522は、ピッチ生成処理
部49により生成されたピッチパターンに応じた間隔の
インパルスを発生し、このインパルスを音源としてLM
Aフィルタ524を駆動する。
【0135】一方、音声の無声部(U)では、駆動音源
切替部523によりホワイトノイズ発生部521側に切
り替えられる。ホワイトノイズ発生部521はホワイト
ノイズを発生し、このホワイトノイズを音源としてLM
Aフィルタ524を駆動する。LMAフィルタ524は
音声のケプストラムを直接フィルタ係数とするものであ
る。
【0136】本実施形態において音韻パラメータ生成処
理部50により生成された音韻パラメータは前記したよ
うにケプストラムであることから、この音韻パラメータ
がLMAフィルタ524のフィルタ係数となり、駆動音
源切替部523により切り替えられる音源によって駆動
されることで、合成音声を出力する。
【0137】合成フィルタ処理部52(内のLMAフィ
ルタ524)により合成された音声は離散音声信号であ
り、D/A変換器53によりアナログ信号に変換し、ア
ンプ54を通してスピーカ55に出力することで、初め
て音として聞くことができる。
【0138】ここまでの処理は、図24を参照しながら
[従来技術]の欄にて説明した例とほぼ同じである。
【0139】本実施形態のポイントは、音声合成部42
内に(図1中の声質切替部17及び声質制御部18に相
当する)声質切替部56及び声質制御部57が加えられ
たことにある。なお、D/A変換器53はハードウェア
により構成されているが、その変換のサンプリング周波
数はソフトウェアから制御可能なようになっている。
【0140】声質切替部56は、ユーザによる指定もし
くはアプリケーションプログラム等によって合成する際
の声質を切り替えることができるようになっている。本
実施形態では、この声質切替部56にて3種類の声質が
指定可能であるものとする。
【0141】声質制御部57は、声質切替部56で指定
された声質に応じて11025Hz,12000HZ,
10000Hzのいずれかのサンプリング周波数でD/
A変換を行うようにD/A変換器53を制御する。
【0142】音声素片を作成した際のサンプリング周波
数(第1の標本周期)と同じサンプリング周波数、即ち
11025HzでD/A変換器53がD/A変換を行え
ば、元の音声の声質で音声合成することができる。一
方、D/A変換器53が他のサンプリング周波数(第1
の標本周期とは異なる第2の標本周期)でD/A変換す
れば、前記第1の実施形態で既に述べたように、音声ス
ペクトルを図2に示すように周波数軸方向にシフトした
効果が得られるため、音声の個人性が変化し、こうして
得られるアナログ音声信号の声質は、音声素片の元とな
っている音声の声質とは異なったものとなる。
【0143】[第5の実施形態]前記第4の実施形態に
おいては、声質切替部56及び声質制御部57を設けた
ことで、合成音声の声質を簡単に増やすことができるも
のの、合成される音声のスピードが声質により異なる。
【0144】即ち、(素片作成時のサンプリング周波
数)>(D/A変換のサンプリング周波数)のときに
は、合成される音声のスピードは遅くなる。逆に、(素
片作成時のサンプリング周波数)<(D/A変換のサン
プリング周波数)のときには、合成される音声のスピー
ドは早くなる。
【0145】このような合成される音声のスピードの違
いは、D/A変換時のサンプリング周波数が前記第4の
実施形態程度の違い(91%,109%)ではあまり問
題とはならない。しかし以下に述べるように、D/A変
換時のサンプリング周波数が、音声素片メモリ51に読
み込まれている音声素片を作成した際の音声のサンプリ
ング周波数と大きく異なる場合には、問題となる。
【0146】まず、素片作成時のサンプリング周波数と
合成時のD/A変換のサンプリング周波数の比が1に近
ければ声質は変化も小さく、逆にこの比が1から離れれ
ば声質は大きく変化する。したがって、声質を大きく変
えようとすれば、これら両サンプリング周波数の比を例
えば50%,200%程度に設定すればよいが、これで
は合成音声のスピードもそれぞれ元の音声の50%,2
00%、即ち半分と倍になり聞きづらくなる。
【0147】そこで、合成時のD/A変換のサンプリン
グ周波数が素片作成時のサンプリング周波数と大きく異
なった場合でも、合成音声のスピードを一定にできるよ
うにした第5の実施形態につき説明する。
【0148】図7は本発明の第5の実施形態に係る音声
の規則合成装置の概略構成を示すブロック図であり、図
5と同一部分には同一符号を付してある。
【0149】本実施形態のポイントは、図5中の発話速
度制御部48に代えて、合成音声のスピード(発話速
度)が制御可能な発話速度制御部68を設けると共に、
図5中の声質制御部57に代えて、D/A変換のサンプ
リング周波数だけでなく合成音声のスピードを制御する
声質制御部67を設け、当該声質制御部67により、声
質切替部56の指定に応じて、D/A変換器53でのD
/A変換のサンプリング周波数と同時に発話速度制御部
48での合成音声のスピードを制御するところにある。
【0150】本実施形態では、前記第4の実施形態と同
様に声質切替部56にて3種類の声質が指定可能であ
る。声質制御部67は声質切替部56で指定された声質
に応じて、例えば11025Hz,8000Hz,16
000Hzのいずれかのサンプリング周波数でD/A変
換を行うようにD/A変換器53を制御する。
【0151】同時に声質制御部67は、声質切替部56
によって指定された声質に応じて、発話速度制御部48
を次のように制御する。即ち声質制御部67は、先に説
明したCVわたりの間隔が、 (CVわたりの間隔)=(11025HzでD/A変換
時のCVわたりの間隔)×(D/A変換のサンプリング
周波数)/(素片作成時のサンプリング周波数) となるよう発話速度制御部68を制御する。
【0152】したがって、8000HzにてD/A変換
を行う際には、声質制御部67は上式に基づき、110
25HzでD/A変換するときのCVわたり間隔の(1
1025[Hz]/8000[Hz])倍のCVわたり間隔とな
るよう発話速度制御部68を制御する。また声質制御部
67は、16000HzでD/A変換を行う場合には、
11025HzでD/A変換するときのCVわたり間隔
の(11025[Hz]/16000[Hz])倍のCVわたり
間隔となるよう発話速度制御部68を制御する。
【0153】このように本実施形態においては、音声素
片作成時と異なるサンプリング周波数(第1の標本周期
とは異なる第2の標本周期)でD/A変換したときの合
成音声のスピードの変化を、CVわたりの間隔(発話速
度パラメータ)を変えることで相殺することができる。
したがって、音声素片作成時のサンプリング周波数と異
なる8000Hzあるいは16000HzでD/A変換
を行っても、ほぼ同じスピードの音声のアナログ信号を
得ることができる。
【0154】[第6の実施形態]前記第5の実施形態に
基づいて規則合成を行えば、確かに声質を変えながらも
合成される音声のスピードをほぼ一定に保つことが簡単
に実現できる。しかし既に説明したように、音韻継続時
間計算処理部47での処理(音韻継続時間計算処理)で
は、CVわたりの間隔を変えても子音の音韻継続時間を
音節毎に一定にするため、音声素片作成時と異なるサン
プリング周波数でD/A変換すると、子音の継続時間が
縮んだり、間延びしたりし、この結果、合成される音声
の明瞭性・自然性に影響を及ぼすことがある。
【0155】そこで、合成される音声の子音の継続時間
を音節毎に一定に保つことができるようにした第6の実
施形態につき説明する。
【0156】図8は本発明の第6の実施形態に係る音声
の規則合成装置の概略構成を示すブロック図であり、図
5または図7と同一部分には同一符号を付してある。
【0157】本実施形態のポイントは、図7中の音韻継
続時間計算処理部47に代えて、音韻継続時間が制御可
能な音韻継続時間計算処理部77を設けると共に、図7
中の声質制御部67に代えて、D/A変換のサンプリン
グ周波数だけでなく音韻継続時間による合成音声のスピ
ードを制御する声質制御部87を設け、当該声質制御部
87により、声質切替部56の指定に応じて、D/A変
換器53でのD/A変換のサンプリング周波数と同時に
音韻継続時間計算処理部77での音韻継続時間を制御す
るところにある。
【0158】本実施形態では、前記第5の実施形態と同
様に声質切替部56にて3種類の声質が指定可能であ
る。声質制御部87は声質切替部56で指定された声質
に応じて、例えば11025Hz,8000Hz,16
000Hzのいずれかのサンプリング周波数でD/A変
換を行うようにD/A変換器53を制御する。
【0159】同時に声質制御部87は、声質切替部56
によって指定された声質に応じて、音韻継続時間計算処
理部77を次のように制御する。即ち声質制御部87
は、全ての音韻の継続時間、つまり子音の継続時間と母
音の継続時間が (音韻継続時間)=(11025HzでD/A変換時の
音韻継続時間)×(D/A変換のサンプリング周波数)
/(素片作成時のサンプリング周波数) となるよう音韻継続時間計算処理部77を制御する。
【0160】したがって、8000HzにてD/A変換
を行う際には、声質制御部87は上式に基づき、110
25HzでD/A変換するときの音韻継続時間の(80
00[Hz]/11025[Hz])倍の音韻継続時間となるよ
う音韻継続時間計算処理部77を制御する。また声質制
御部87は、16000HzでD/A変換を行う場合に
は、11025HzでD/A変換するときの音韻継続時
間の(16000[Hz]/11025[Hz])倍の音韻継続
時間となるよう音韻継続時間計算処理部77を制御す
る。
【0161】このように本実施形態においては、音声素
片作成時と異なるサンプリング周波数(第1の標本周期
とは異なる第2の標本周期)でD/A変換したときの合
成音声のスピードの変化を、各音韻継続時間を変えるこ
とで相殺することができ、かつ合成される音声の子音の
継続時間を音節毎に一定に保つことができる。
【0162】[第7の実施形態]前記第5または第6の
実施形態に基づいて合成を行えば、確かに声質を変えな
がらも合成される音声のスピードをほぼ一定に保つこと
ができる。しかし、音声素片作成時のサンプリング周波
数とD/A変換時のサンプリング周波数とを違えるとい
うことは、レコードの早回しや遅回しとほぼ同じである
から、音声の過渡部分で時間的に縮んだり間延びするこ
とは避けられない。
【0163】例をあげれば、/わ/という発声は、/う
/に近い口の形から急激に唇を開いて/あ/へ移る運動
を発声器管が行う。したがって、D/A変換時のサンプ
リング周波数を落して、レコードの遅回しのようなこと
をすれば、この変化が緩やかになり、/わ/ではなく、
/うあー/のように聞こえてくる。
【0164】そこで、素片作成時と異なるサンプリング
周波数でD/A変換したときに生じる合成音声過渡部分
の時間的方向の縮みや間延びを抑えることができるよう
にした第7の実施形態につき説明する。
【0165】図9は本発明の第7の実施形態に係る音声
の規則合成装置の概略構成を示すブロック図であり、図
8と同一部分には同一符号を付してある。
【0166】本実施形態のポイントは、図8中の音韻パ
ラメータ生成処理部50に代えて、(音声素片からな
る)音韻パラメータを時間軸方向へ伸縮する機能が付加
された音韻パラメータ生成処理部90を設けると共に、
図8中の声質制御部87に代えて、D/A変換のサンプ
リング周波数及び音韻継続時間だけでなく音韻パラメー
タの時間軸方向への伸縮を制御する声質制御部97を設
け、当該声質制御部97により、声質切替部56の指定
に応じて、D/A変換器53でのD/A変換のサンプリ
ング周波数及び音韻継続時間計算処理部77での音韻継
続時間を制御する他に、音韻パラメータ生成処理部90
を制御し、合成音声の過渡部が縮んでしまうような場合
には、予め音韻パラメータを時間方向に引き伸ばして音
韻パラメータを作成させ、合成音声の過渡部が間延びす
るような場合には、予め音韻パラメータを時間方向に圧
縮して音韻パラメータを作成させるところにある。
【0167】本実施形態では、前記第6の実施形態と同
様に声質切替部56にて3種類の声質が指定可能であ
る。声質制御部97は声質切替部56で指定された声質
に応じて、11025Hz,8000Hz,16000
Hzのいずれかのサンプリング周波数でD/A変換を行
うようにD/A変換器413を制御する。
【0168】同時に声質制御部97は、声質切替部56
によって指定された声質に応じて、全ての音韻の継続時
間、即ち子音の継続時間と母音の継続時間を (音韻継続時間)=(11025HzでD/A変換時の
音韻継続時間)×(D/A変換のサンプリング周波数)
/(素片作成時のサンプリング周波数) となるよう音韻継続時間計算処理部77を制御する。
【0169】さらに、声質制御部97は音韻パラメータ
生成処理部90を制御し、D/A変換のサンプリング周
波数(第2の標本周期)を素片作成時のサンプリング周
波数(第1の標本周期)とは異ならせることによって合
成音声の過渡部が縮んでしまうような場合には、予め音
韻パラメータを時間方向に引き伸ばして音韻パラメータ
を作成させ、合成音声の過渡部が間延びするような場合
には、予め音韻パラメータを時間方向に圧縮して音韻パ
ラメータを作成させる。
【0170】もっと正確には、声質制御部97は、素片
自身の長さを、(D/A変換のサンプリング周波数/素
片作成時のサンプリング周波数)倍となる伸縮を行って
から接続補間し、音韻パラメータを生成させる。
【0171】即ち、本実施形態における声質制御部97
は、11025HzにてD/A変換を行う場合には、音
声素片の伸縮は行わずに音韻パラメータを生成し、80
00HzでD/A変換を行う場合には、音声素片を(8
000[Hz]/11025[Hz])倍の長さに縮めてから接
続補間して音韻パラメータを生成し、16000Hzで
D/A変換を行う場合には、音声素片を(16000[H
z]/11025[Hz])倍の長さに延ばしてから接続補間
して音韻パラメータを生成するよう音韻パラメータ生成
処理部90を制御する。
【0172】このように本実施形態においては、素片作
成時と異なるサンプリング周波数(第1の標本周期とは
異なる第2の標本周期)でD/A変換したときに生じる
合成音声過渡部分の時間方向の縮みや間延びを、予め音
韻パラメータ生成時に音声素片を伸縮させておくことで
相殺することができる。
【0173】[第8の実施形態]前述の第5乃至第7の
実施形態は、ケプストラムやLPCなどを利用した音声
規則合成、即ち音声波形を分析して得られるパラメータ
を用いた音声規則合成だけではなく、波形合成(による
規則合成)にも応用は可能である。しかし、パラメータ
を用いた音声規則合成では、前述の第5乃至第7の実施
形態を用いずとも、声質を変えながら、合成音声のスピ
ードを一定にし、かつ音声過渡部の縮み間延びを起こさ
せない簡便な方法が適用可能である。
【0174】そこで、この簡便な方法を、パラメータを
用いた音声規則合成に適用した第8の実施形態につき説
明する。
【0175】図10は本発明の第8の実施形態に係る音
声の規則合成装置の概略構成を示すブロック図であり、
図5と同一部分には同一符号を付してある。
【0176】本実施形態のポイントは、図5中の合成フ
ィルタ処理部52に代えて、合成時のフレーム周期が制
御可能な合成フィルタ処理部112を設けると共に、図
5中の声質制御部57に代えて、D/A変換のサンプリ
ング周波数だけでなく合成時のフレーム周期を制御する
声質制御部117を設け、当該声質制御部117によ
り、声質切替部56の指定に応じて、D/A変換器53
でのD/A変換のサンプリング周波数と同時に、合成フ
ィルタ処理部112での合成時のフレーム周期を制御す
るところにある。
【0177】本実施形態では、前記第4の実施形態と同
様に声質切替部56にて3種類の声質が指定可能であ
る。声質制御部117は声質切替部56で指定された声
質に応じて、11025Hz,8000Hz,1600
0Hzのいずれかのサンプリング周波数でD/A変換を
行うようにD/A変換器53を制御する。
【0178】同時に声質制御部117は、声質切替部5
6によって指定された声質に応じて、合成フィルタ処理
部112で行われる合成のフレーム周期を設定する。こ
れにより合成フィルタ処理部112では、音韻パラメー
タ生成処理部50により生成された音韻パラメータ(ケ
プストラム)を設定されたフレーム周期で(LMAフィ
ルタに)入力し、当該フレーム周期で音声(離散音声信
号)を合成する。
【0179】合成のフレーム周期は次式により与えられ
る。
【0180】 (フレーム周期) =(素片作成時のフレーム周期)×(素片作成時のサンプリング周期) /(D/A変換のサンプリング周期) =(素片作成時のフレーム周期)×(D/A変換のサンプリング周波数 )/(素片作成時のサンプリング周波数) したがって、音声素片作成時の音声のサンプリング周波
数(第1の標本周期)と同じサンプリング周波数、即ち
11025HzでD/A変換を行う際には、声質制御部
117は上式に基づき、合成時のフレーム周期を音声素
片作成時のフレーム周期(第1のフレーム周期)と同じ
10msecで合成するよう合成フィルタ処理部112を制
御する。
【0181】また声質制御部117は、音声素片作成時
の音声のサンプリング周波数とは異なるサンプリング周
波数(第1の標本周期とは異なる第2の標本周期)、例
えば8000HzにてD/A変換を行う場合には、 10[msec]×8000[Hz]/11025[Hz]=7.3[m
sec] のフレーム周期(第1のフレーム周期とは異なる第2の
フレーム周期)で合成を行うよう制御し、16000H
zにてD/A変換を行う場合には、 10[msec]×16000[Hz]/11025[Hz]=14.
5[msec] のフレーム周期(第1のフレーム周期とは異なる第2の
フレーム周期)で合成を行うよう制御する。
【0182】このように本実施形態においては、音声素
片作成時と異なるサンプリング周波数(第1の標本周期
とは異なる第2の標本周期)でD/A変換したときの合
成音声のスピードの変化を、合成フィルタ処理部112
での合成のフレーム周期(第2のフレーム周期)を音声
素片作成時のフレーム周期(第1のフレーム周期)とは
異ならせることで相殺することができる。
【0183】したがって、音声素片作成時のサンプリン
グ周波数とは異なる8000Hzあるいは16000H
zでD/A変換を行っても、同じスピードの音声のアナ
ログ信号を得ることができる。また同時に、音声素片作
成時と異なるサンプリング周波数でD/A変換したとき
に生じる音声過渡部の縮みや間延びも防ぐことができ
る。
【0184】[第9の実施形態]前記第4乃至第8の実
施形態にはもう1つの問題点が存在する。それは、D/
A変換のサンプリング周波数を素片作成時のものに変え
ると、声の高さ即ち音声のピッチが変化してしまうとい
うことである。例えば、(素片作成時のサンプリング周
波数)>(D/A変換のサンプリング周波数)のときに
は、合成される音声のピッチは低くなる。逆に、(素片
作成時のサンプリング周波数)<(D/A変換のサンプ
リング周波数)のときには、合成される音声のピッチは
高くなる。
【0185】このような合成される音声のピッチの違い
は、D/A変換時のサンプリング周波数が前記第4の実
施形態程度の違い(91%,109%)ではあまり問題
とはならない。
【0186】しかし、声質を大きく変えようとして、両
サンプリング周波数の比を例えば50%,200%程度
に設定すれば、合成音声のピッチもそれぞれ50%,2
00%になる。この場合、11025HzでD/A変換
したときの音声と比較して、前者はピッチが1[oct] 低
い音声が合成され、後者は1[oct] 高い音声が合成され
るので聞きづらくなるという問題が発生する。
【0187】そこで、合成時のD/A変換のサンプリン
グ周波数が音声素片作成時のサンプリング周波数と大き
く異なった場合でも、合成音声のピッチを一定にできる
ようにした第9の実施形態につき説明する。
【0188】図11は本発明の第9の実施形態に係る音
声の規則合成装置の概略構成を示すブロック図であり、
図5と同一部分には同一符号を付してある。
【0189】本実施形態のポイントは、図5中の合成フ
ィルタ処理部52に代えて、合成時のフレーム周期及び
合成音声のピッチが制御可能な合成フィルタ処理部13
2を設けると共に、ピッチ生成処理部49と合成フィル
タ処理部132との間にピッチ生成処理部49で生成さ
れたピッチパターン(基本周波数パターン)を周波数の
異なる別のピッチパターンに変換(ピッチ変調)して合
成フィルタ処理部132に与えるピッチ変調処理部13
8を設け、さらに図5中の声質制御部57に代えて、D
/A変換のサンプリング周波数だけでなく合成時のフレ
ーム周期及びピッチの変調を制御する声質制御部137
を設け、当該声質制御部137により、声質切替部56
の指定に応じて、D/A変換器53でのサンプリング周
波数と合成フィルタ処理部132での合成のフレーム周
期を制御すると同時に、ピッチ変調処理部138でのピ
ッチの変調を制御するところにある。
【0190】本実施形態では、前記第4の実施形態と同
様に声質切替部56にて3種類の声質が指定可能であ
る。声質制御部137は声質切替部56で指定された声
質に応じて、11025Hz,8000Hz,1600
0Hzのいずれかのサンプリング周波数でD/A変換を
行うようにD/A変換器53を制御する。
【0191】同時に声質制御部137は、声質切替部5
6によって指定された声質に応じて、合成フィルタ処理
部132で行われる合成のフレーム周期を設定する。合
成のフレーム周期は次式により与えられる。
【0192】 (フレーム周期) =(素片作成時のフレーム周期)×(素片作成時のサンプリング周期) /(D/A変換のサンプリング周期) =(素片作成時のフレーム周期)×(D/A変換のサンプリング周波数 )/(素片作成時のサンプリング周波数) 声質制御部137はさらに、合成フィルタ処理部132
に与えるピッチ(ピッチパターン)が、 (合成フィルタ処理部132に与えるピッチ) =(ピッチ生成処理部49で生成されたピッチ)×(D/A変換のサン プリング周期)/(素片作成時のサンプリング周期) =(ピッチ生成処理部49で生成されたピッチ)×(素片作成時のサン プリング周波数)/(D/A変換のサンプリング周波数) となるように、ピッチ変調処理部138を制御する。
【0193】したがって、音声素片作成時の音声のサン
プリング周波数と同じサンプリング周波数、即ち110
25HzでD/A変換を行う際には、声質制御部137
は、音声素片作成時と同じピッチをそのまま合成フィル
タ処理部132に与えるようピッチ変調処理部138を
制御する。
【0194】また声質制御部137は、8000Hzに
てD/A変換を行う場合には、音声素片作成時のピッチ
を(11025[Hz]/8000[Hz])倍して合成フィル
タ処理部132に与えるよう制御し、16000Hzに
てD/A変換を行う場合には(11025[Hz]/160
00[Hz])倍して合成フィルタ処理部132に与えるよ
うに制御する。
【0195】このように本実施形態においては、合成フ
ィルタ処理部132に与えるピッチを声質制御部137
の制御のもとでピッチ変調処理部138にて予め変調し
ておくことにより、音声素片作成時と異なるサンプリン
グ周波数(第1の標本周期とは異なる第2の標本周期)
でD/A変換したときに生じる合成音声のピッチの変化
を相殺することができる。
【0196】したがって、音声素片作成時のサンプリン
グ周波数と異なる8000Hzあるいは16000Hz
でD/A変換を行っても、同じ声の高さの音声のアナロ
グ信号を得ることができる。
【0197】以上に述べた第1乃至第9の実施形態で
は、いずれも、合成フィルタ処理部から出力される合成
音声(離散音声信号)をD/A変換器で電気的なアナロ
グ信号に変換する際のD/A変換のサンプリング周波数
が音質制御部からの指示により可変される場合について
説明したが、これに限るものではない。例えば合成フィ
ルタ処理部から出力される合成音声(離散音声信号)の
サンプリング周波数自体を可変するようにしても構わな
い。
【0198】以下、合成音声(離散音声信号)のサンプ
リング周波数自体を可変するようにした第10乃至第1
8の実施形態について、第10の実施形態から順に説明
する。
【0199】[第10の実施形態]図12は本発明の第
10の実施形態に係る音声の分析合成装置の概略構成を
示すブロック図である。
【0200】図12において、メモリ141には、11
025Hz(第1の周期)でサンプリング(標本化)し
た音声(離散音声信号)に対して、フレーム周期(第1
のフレーム周期)10msecで窓幅20msecのハニング窓
をかけ、従来技術にて説明した手順で得られる0次〜2
5次までの低次ケプストラム係数のパラメータフレーム
の時系列(特徴パラメータ)と、各フレームに対応した
音声の有声・無声情報が記憶されている。低次ケプスト
ラム係数については従来技術において説明済みであるの
で、ここでは省略する。
【0201】一方、メモリ142には、所定の基本周波
数抽出方法により同じ音声から得られる、音声の基本周
波数の時系列パターンが記憶されている。
【0202】合成フィルタ処理部143は、これら2つ
のメモリ141,142より各データを読み出し、メモ
リ142より読み出された音声のパラメータフレーム
(ケプストラム係数)をフィルタ係数とするLMAフィ
ルタ(図示せず)を、有声区間では上記基本周波数の時
系列パターン(ピッチパターン)に基づいた周期パルス
で、無声区間ではランダムノイズで駆動することにより
所望の音声(離散音声信号)を合成する。
【0203】ここまでの処理はプログラムによって行わ
れるため、合成フィルタ処理部143(内のLMAフィ
ルタ)から出力される音声は離散音声信号である。そこ
で、この離散音声信号をD/A変換器144に供給し、
電気的なアナログ信号に変換する。こうして得られた音
声のアナログ信号をアンプ145にて増幅し、スピーカ
146を駆動することにより聴覚で知覚できる音声を得
ることができる。
【0204】ここまでは従来技術で挙げた(図23の分
析合成装置の)例とほぼ同じである。
【0205】この図12の構成は、前記第1の実施形態
に係る図1の分析合成装置の構成に対応するもので、図
1の構成においてD/A変換器でのD/A変換のサンプ
リング周波数を可変する代わりに、合成音声(離散音声
信号)のサンプリング周波数自体を可変する点に特徴が
ある。
【0206】即ち本実施形態のポイントは、合成フィル
タ処理部143とD/A変換器144との間に、当該合
成フィルタ処理部143の出力である合成音声のサンプ
リング周波数を変換するサンプリング周波数変換処理部
149を設けると共に、(図1中の声質切替部17及び
声質制御部18に対応する)声質切替部147及び声質
制御部148を設け、当該声質制御部148が、合成フ
ィルタ処理部143から出力される合成音声のサンプリ
ング周波数を声質切替部147で指定された声質で決ま
る周波数(第2の標本周期)に変換するようにサンプリ
ング周波数変換処理部149を制御するところにある。
ここで、D/A変換器144でのD/A変換のサンプリ
ング周波数(第3の標本周期)は固定であり、ケプスト
ラム作成時の音声のサンプリング周波数(第1の標本周
期)に一致するものとする。
【0207】本実施形態において、声質切替部147
は、図1中の声質切替部17と同様に(ユーザによる指
定もしくはアプリケーションプログラム等によって)3
種類の声質が指定可能であり、声質制御部148は、声
質切替部147で指定された声質に応じて、合成フィル
タ処理部143から出力される合成音声のサンプリング
周波数を、11025Hz(=未変換),12000H
Z,10000Hzのいずれかに変換するように、サン
プリング周波数変換処理部149を制御する。
【0208】したがって、合成音声のサンプリング周波
数を、メモリ141に蓄えられたケプストラムを作成し
た際の音声のサンプリング周波数と同じサンプリング周
波数、即ち11025Hzに変換すれば、元の音声の声
質で音声合成することができる。なお、合成音声のサン
プリング周波数を、ケプストラム作成時の音声のサンプ
リング周波数と同じサンプリング周波数に変換すること
は、サンプリング周波数の変換を行わないことと等価で
あり、サンプリング周波数変換処理部149における変
換処理を行わなくても構わない。
【0209】一方、他のサンプリング周波数(第1の標
本周期とは異なる第2の標本周期)に変換(11025
Hzから12000Hz、あるいは11025Hzから
10000Hzに変換)すれば、図13に示すように、
音声スペクトルを周波数軸方向にシフトした効果が得ら
れるため、音声の個人性が変化し、こうして得られるア
ナログ音声信号の声質は、元となる音声の声質とは異な
ったものとなる。
【0210】ここで、サンプリング周波数変換処理部1
49によるサンプリング周波数変換処理の詳細を説明す
る。このサンプリング周波数変換には種々の方法が適用
可能であるが、本実施形態では、図14に示す構成によ
る簡便な方法を用いているものとする。
【0211】サンプリング周波数変換処理部149は、
図14(a)に示すように、サンプリング周波数拡大器
149a、ローパスフィルタ(LPF)149b及びサ
ンプリング周波数圧縮器149cから構成されている。
【0212】サンプリング周波数変換処理部149内の
サンプリング周波数拡大器149aには、合成フィルタ
処理部143の出力である合成音声(音声データ)が供
給される。この合成音声のサンプリング周波数がf1 で
あるものとする。
【0213】図14(a)のサンプリング周波数変換処
理部149で、サンプリング周波数f1 からf2 =(L
/M)f1 に周波数変換するには、図14(b)に示す
ように、まずサンプリング周波数拡大器149aにて、
サンプリング周波数f1 の音声データのサンプルs1 間
に(L−1)個の零サンプルs0 を挿入する。
【0214】次に、サンプリング周波数拡大器149a
から出力される音声データ、即ちサンプルs1 間に(L
−1)個の零サンプルs0 が挿入された音声データを、
エイリアシング防止のために、f1 またはf2 の小さい
方(min(f1 ,f2 )を遮断周波数とするローパス
フィルタ(ローパス型のディジタルフィルタ)149b
に通す。ここで、サンプリング周波数拡大器149aで
の零サンプル挿入によるゲイン低下(1/L倍)を防ぐ
ために、ローパスフィルタ149bは、通過帯域でL倍
のゲインを持つ。
【0215】最後に、ローパスフィルタ149bを通過
した音声データに対して、周波数圧縮器149cにおい
て、図14(b)に示すように、Mサンプル毎に1サン
プルのみを取り出す間引き処理を行うことにより、サン
プリング周波数f2 =(L/M)f1 の音声データが得
られる。
【0216】したがって、前記した例のように、サンプ
リング周波数を11025Hzから12000Hzに変
換する場合であれば、 f1 =11025[Hz] f2 =12000[Hz] f2 =(12000/11025)f1 =(160/147)f1 であるので、サンプリング周波数変換処理部149で
は、 L=160 M=147 (LPFの遮断周波数)=min(f1 ,f2 )=f1
=11025[Hz] として、上述した処理を行えばよい。
【0217】同様に、サンプリング周波数を11025
Hzから10000Hzに変換する場合であれば、 f1 =11025[Hz] f2 =10000[Hz] f2 =(10000/11025)f1 =(400/441)f1 であるので、サンプリング周波数変換処理部149で
は、 L=400 M=441 (LPFの遮断周波数)=min(f1 ,f2 )=f1
=10000[Hz] として、上述した処理を行えばよい。
【0218】[第11の実施形態]前記第10の実施形
態においては、声質切替部147、声質制御部148及
びサンプリング周波数変換処理部149を設けたこと
で、合成音声の声質を簡単に増やすことができるもの
の、合成される音声のスピードが声質により異なる。
【0219】即ち、(サンプリング周波数変換処理後の
サンプリング周波数)>(D/A変換のサンプリング周
波数)のときには、合成される音声のスピードは遅くな
る。逆に、(サンプリング周波数変換処理後のサンプリ
ング周波数)<(D/A変換のサンプリング周波数)の
ときには、合成される音声のスピードは早くなる。
【0220】このような合成される音声のスピードの違
いは、サンプリング周波数変換処理後のサンプリング周
波数が前記第10の実施形態程度の違い(91%,10
9%)ではあまり問題とはならない。しかし以下に述べ
るように、サンプリング周波数変換処理後のサンプリン
グ周波数がD/A変換時のサンプリング周波数と大きく
異なる場合には、問題となる。
【0221】まず、サンプリング周波数変換処理後のサ
ンプリング周波数と合成時のD/A変換のサンプリング
周波数の比が1に近ければ声質は変化も小さく、逆にこ
の比が1から離れれば声質は大きく変化する。したがっ
て、声質を大きく変えようとすれば、これら両サンプリ
ング周波数の比を例えば50%,200%程度に設定す
ればよいが、これでは合成音声のスピードもそれぞれ元
の音声の200%,50%、即ち倍と半分になり、かな
り聞きづらくなる。
【0222】そこで、サンプリング周波数変換処理後の
サンプリング周波数がD/A変換のサンプリング周波数
と大きく異なった場合でも、合成音声のスピードを一定
にできるようにした第11の実施形態につき説明する。
【0223】図15は本発明の第11の実施形態に係る
音声の分析合成装置の概略構成を示すブロック図であ
り、図12と同一部分には同一符号を付してある。
【0224】この図15の構成は、前記第2の実施形態
に係る図3の分析合成装置の構成に対応するもので、図
3の構成においてD/A変換器でのD/A変換のサンプ
リング周波数を可変する代わりに、合成音声(離散音声
信号)のサンプリング周波数自体を可変するものであ
る。
【0225】本実施形態のポイントは、図12中の合成
フィルタ処理部143に代えて、合成時のフレーム周期
が制御可能な合成フィルタ処理部153を設けると共
に、図12中の声質制御部148に代えて、サンプリン
グ周波数変換処理部149の変換するサンプリング周波
数だけでなく合成時のフレーム周期を制御する声質制御
部158を設け、当該声質制御部158により、声質切
替部147の指定に応じて、サンプリング周波数変換処
理部149でのサンプリング周波数変換処理と同時に、
合成フィルタ処理部153での合成時のフレーム周期を
制御するところにある。ここで、D/A変換器144で
のD/A変換のサンプリング周波数(第3の標本周期)
は前記第10の実施形態と同様に固定であり、ケプスト
ラム作成時の音声のサンプリング周波数(第1の標本周
期)に一致するものとする。
【0226】本実施形態では、前記第10の実施形態と
同様に声質切替部147にて3種類の声質が指定可能で
ある。声質制御部158は声質切替部147で指定され
た声質に応じて、例えば11025Hz(=未変換),
8000Hz,16000Hzのいずれかのサンプリン
グ周波数への変換を行うようにサンプリング周波数変換
処理部149を制御する。
【0227】同時に声質制御部158は、声質切替部1
47によって指定された声質に応じて、合成フィルタ処
理部153で行われる合成のフレーム周期を設定する。
合成のフレーム周期は次式により与えられる。
【0228】 (フレーム周期) =(分析フレーム周期)×(サンプリング周波数変換後のサンプリング 周期)/(D/A変換のサンプリング周期) =(分析フレーム周期)×(D/A変換のサンプリング周波数)/(サ ンプリング周波数変換後のサンプリング周波数) したがって上式に基づき、D/A変換のサンプリング周
波数と同じサンプリング周波数、即ち11025Hzへ
のサンプリング周波数変換処理を行う(=サンプリング
周波数変換処理を行わない)際には、声質制御部158
は上式に基づき、合成時のフレーム周期を分析時(ケプ
ストラム作成時)のフレーム周期(第1のフレーム周
期)と同じ10msecで合成するよう合成フィルタ処理部
153を制御する。但し、メモリ141に蓄えられたケ
プストラムは前記第10の実施形態と同じ条件で作成さ
れているものとする。
【0229】また声質制御部158は、ケプストラム作
成時(分析時)の音声のサンプリング周波数とは異なる
サンプリング周波数(第1の標本周期とは異なる第2の
標本周期)、例えば8000Hzへのサンプリング周波
数変換処理を行う場合には、 10[msec]×11025[Hz]/8000[Hz]=13.8
[msec] のフレーム周期(第1のフレーム周期とは異なる第2の
フレーム周期)で合成を行うよう制御し、16000H
zへのサンプリング周波数変換処理を行う場合には、 10[msec]×11025[Hz]/16000[Hz]=6.9
[msec] のフレーム周期(第1のフレーム周期とは異なる第2の
フレーム周期)で合成を行うよう制御する。
【0230】このように本実施形態においては、分析時
と異なるサンプリング周波数(第1の標本周期とは異な
る第2の標本周期)にサンプリング周波数変換処理した
ときの合成音声のスピードの変化を、合成フィルタ処理
部153における合成のフレーム周期を(第2のフレー
ム周期)をケプストラム作成時(分析時)のフレーム周
期(第1のフレーム周期)とは異ならせることで相殺す
ることができる。
【0231】したがって、分析時のサンプリング周波数
と異なる8000Hzあるいは16000Hzへのサン
プリング周波数変換処理を行っても、同じスピードの音
声のアナログ信号を得ることができる。
【0232】[第12の実施形態]ところで、前記第1
0の実施形態においては、サンプリング周波数変換処理
を行ってからD/A変換すると、声の高さ、即ち音声の
ピッチの変化を招く。
【0233】即ち、(サンプリング周波数変換処理後の
サンプリング周波数)>(D/A変換のサンプリング周
波数)のときには、合成される音声のピッチは低くな
る。逆に、(サンプリング周波数変換処理後のサンプリ
ング周波数)<(D/A変換のサンプリング周波数)の
ときには、合成される音声のピッチは高くなる。
【0234】このような合成される音声のピッチの違い
は、サンプリング周波数変換処理後のサンプリング周波
数がD/A変換のサンプリング周波数に比べ、前記第1
0の実施形態程度の違い(91%,109%)ではあま
り問題とはならない。
【0235】しかし、声質を大きく変えようとして、両
サンプリング周波数の比を例えば50%,200%程度
に設定すれば、合成音声のピッチもそれぞれ50%,2
00%と変化するため、ケプストラム作成時と同じ11
025Hzにサンプリング周波数変換処理した(あるい
は変換処理しない)ときの音声(あるいは原音声)と比
較して、前者はピッチが1[oct] (オクターブ)高い音
声が合成され、後者は1[oct] 低い音声が合成されるの
で聞きづらくなるという問題が発生する。
【0236】そこで、サンプリング周波数変換処理後の
サンプリング周波数がケプストラム作成時のサンプリン
グ周波数と大きく異なった場合でも、合成音声のピッチ
を一定にできるようにした第12の実施形態につき説明
する。
【0237】図16は本発明の第12の実施形態に係る
音声の分析合成装置の概略構成を示すブロック図であ
り、図12と同一部分には同一符号を付してある。
【0238】この図16の構成は、前記第3の実施形態
に係る図4の分析合成装置の構成に対応するもので、図
4の構成においてD/A変換器でのD/A変換のサンプ
リング周波数を可変する代わりに、合成音声(離散音声
信号)のサンプリング周波数自体を可変するものであ
る。
【0239】本実施形態のポイントは、図12中の合成
フィルタ処理部143に代えて、合成時のフレーム周期
が制御可能な合成フィルタ処理部163を設けると共
に、メモリ142と合成フィルタ処理部163との間に
メモリ142より読み出された基本周波数(の時系列)
パターン(ピッチパターン)を周波数の異なる別のピッ
チパターンに変換(ピッチ変調)して合成フィルタ処理
部163に与えるピッチ変調処理部161を設け、さら
に図12中の声質制御部148に代えて、サンプリング
周波数変換処理部149の変換するサンプリング周波数
だけでなく合成時のフレーム周期及びピッチの変調を制
御する声質制御部168を設け、当該声質制御部168
により、声質切替部147の指定に応じて、サンプリン
グ周波数変換処理部149でのサンプリング周波数変換
処理と合成フィルタ処理部163での合成時のフレーム
周期を制御すると同時に、ピッチ変調処理部161での
ピッチの変調を制御するところにある。ここで、D/A
変換器144でのD/A変換のサンプリング周波数(第
3の標本周期)は前記第10の実施形態と同様に固定で
あり、ケプストラム作成時の音声のサンプリング周波数
(第1の標本周期)に一致するものとする。
【0240】本実施形態では、前記第10の実施形態と
同様に声質切替部147にて3種類の声質が指定可能で
ある。声質制御部168は声質切替部147で指定され
た声質に応じて、例えば11025Hz(=未変換),
8000Hz,16000Hzのいずれかのサンプリン
グ周波数への変換を行うようにサンプリング周波数変換
処理部149を制御する。
【0241】声質制御部168は、声質切替部147に
よって指定された声質に応じて、サンプリング周波数変
換処理部149の変換するサンプリング周波数を設定す
ると同時に、合成フィルタ処理部163で行われる合成
のフレーム周期を設定する。合成のフレーム周期は次式
により与えられる。
【0242】 (フレーム周期) =(分析フレーム周期)×(サンプリング周波数変換後のサンプリング 周期)/(D/A変換のサンプリング周期) =(分析フレーム周期)×(D/A変換のサンプリング周波数)/(サ ンプリング周波数変換後のサンプリング周波数) なお、メモリ141に蓄えられたケプストラムは前記第
10の実施形態と同じ条件で作成されているものとす
る。
【0243】声質制御部168はさらに、合成フィルタ
処理部163に与えるピッチ(ピッチパターン)が、 (合成フィルタ処理部163に与えるピッチ) =(メモリ142より読み出したピッチ)×(D/A変換のサンプリン グ周期)/(サンプリング周波数変換処理後のサンプリング周期) =(メモリ142より読み出したピッチ)×(サンプリング周波数変換 処理後のサンプリング周波数)/(D/A変換のサンプリング周波数) となるように、ピッチ変調処理部161を制御する。
【0244】したがって、D/A変換のサンプリング周
波数と同じサンプリング周波数、即ち11025Hzへ
のサンプリング周波数変換処理を行う(=サンプリング
周波数変換処理を行わない)際には、声質制御部168
は上式に基づき、合成フィルタ処理部163に与えるピ
ッチを分析時(ケプストラム作成時)と同じピッチとな
るようピッチ変調処理部161を制御する。
【0245】また声質制御部168は、ケプストラム作
成時(分析時)の音声のサンプリング周波数とは異なる
サンプリング周波数(第1の標本周期とは異なる第2の
標本周期)、例えば8000Hzへのサンプリング周波
数変換処理を行う場合には、メモリ142から読み出し
たピッチを(8000[Hz]/11025[Hz])倍して合
成フィルタ処理部163に与えるように、16000H
zへのサンプリング周波数変換処理を行う場合には、メ
モリ142から読み出したピッチを(16000[Hz]/
11025[Hz])倍して合成フィルタ処理部163に与
えるように、ピッチ変調処理部161を制御する。
【0246】このように本実施形態においては、合成フ
ィルタ処理部163に与えるピッチを声質制御部168
の制御のもとでピッチ変調処理部161にて予め変調し
ておくことにより、D/A変換時のサンプリング周波数
(第3の標本周期)とは異なるサンプリング周波数(第
2の標本周期)へサンプリング周波数変換処理したとき
に生じる合成音声のピッチの変化を相殺することができ
る。
【0247】したがって、D/A変換時のサンプリング
周波数と異なる8000Hzあるいは16000Hzへ
のサンプリング周波数変換処理を行っても、同じ声の高
さの音声のアナログ信号を得ることができる。
【0248】[第13の実施形態]図17は本発明の第
13の実施形態に係る音声の規則合成装置の概略構成を
示すブロック図である。
【0249】この音声規則合成装置は、例えばパーソナ
ルコンピュータ等の情報処理装置上で専用のソフトウェ
ア(文音声変換ソフトウェア)を実行することにより実
現されるもので、文音声変換(TTS)処理機能、即ち
テキストから音声を生成する文音声変換処理(文音声合
成処理)機能を有しており、その機能構成は、大別して
言語処理部171、音声合成部172とに分けられる。
【0250】言語処理部171は、入力文、例えば漢字
かな混じり文を解析して読み情報とアクセント情報を生
成する処理と、これら情報に基づき音韻記号系列・アク
セント情報が記述された音声記号列を生成する処理を司
る。
【0251】音声合成部172は、言語処理部171の
出力である音声記号列をもとに音声を生成する処理を司
る。
【0252】さて、図17の音声規則合成装置におい
て、文音声変換(読み上げ)の対象となる文書(ここで
は日本語文書)はテキストファイル173として保存さ
れている。本装置では、文音声変換ソフトウェアに従
い、当該ファイル173から漢字かな混じり文を1文ず
つ読み出して、言語処理部171及び音声合成部172
により以下に述べる文音声変換処理を行い、音声を合成
する。
【0253】まず、テキストファイル173から読み出
された漢字かな混じり文は、言語処理部171内の言語
解析処理部174に入力される。
【0254】言語解析処理部174は、入力される漢字
かな混じり文に対して形態素解析を行い、読み情報とア
クセント情報を生成する。
【0255】そのために言語解析処理部174は、文の
最小構成要素である「形態素」を見出し語にもつ形態素
辞書175と形態素間の接続規則が登録されている接続
規則ファイル176を利用する。即ち言語解析処理部1
74は、入力文と形態素辞書175とを照合することで
得られる全ての形態素系列候補を求め(総当たり法)、
その中から、接続規則ファイル176を参照して文法的
に前後に接続できる組み合わせを出力する。形態素辞書
175には、解析時に用いられる文法情報と共に、形態
素の読み並びにアクセントの型が登録されている。この
ため、形態素解析により形態素が定まれば、同時に読み
とアクセント型も与えることができる。
【0256】例えば、「公園へ行って本を読みます」と
いう文に対して形態素解析を行うと、 /公園/ヘ/行って/本/を/読み/ます/。
【0257】と形態素に分割される。各形態素に読みと
アクセント型が与えられ、 /コウエン/エ/イッテ/ホ^ン/ヲ/ヨミ/マ^ス/ となる。ここで「^」の入っている形態素は、その直前
の音節でピッチが高く、その直後の音節ではピッチが落
ちるアクセントであることを意味する。また「^」がな
い場合は、平板型のアクセントであることを意味する。
【0258】ところで、人間が文章を読むときには、こ
のような形態素単位でアクセントを付けて読むことはせ
ず、幾つかの形態素をひとまとめにして、そのまとまり
にアクセントを付けて読んでいる。
【0259】そこで、このようなことを考慮して、言語
解析処理部174ではさらに、一つのアクセント句(ア
クセントを与える単位)で形態素をまとめると同時に、
まとめたことによるアクセントの移動も推定する。これ
に加えて言語解析処理部44は、母音の無声化や読み上
げの際のポーズ(息継ぎ)等の情報も付加し、上記の例
では、最終的に次のような読み情報を生成する。
【0260】/コーエンエ/イッテ./ホ^ンオ/ヨミ
マ^(ス)/ ここで、ピリオド「.」は息継ぎを、「( )」は母音
が無声化した音節を表わす。
【0261】さて、上記のようにして言語処理部171
内の言語解析処理部174により読み情報が生成される
と、音声合成部172内の音韻継続時間計算処理部17
7が起動される。音韻継続時間計算処理部177は、言
語解析処理部174で生成した読み情報に従って、入力
文に含まれる各音節の子音部ならびに母音部の継続時間
(単位はms)を決定する。
【0262】この音韻継続時間計算処理部177での継
続時間の決定処理は、子音(C)と母音(V)の境界
(CVわたり)の位置が等間隔に並ぶようにするとい
う、極めて簡単なアルゴリズムにより実現されている。
【0263】CVわたりの間隔は、音声合成部172内
の発話速度制御部178より与えられる。図示しない
が、本実施形態で用いられるソフトウェアではユーザが
合成音声のスピードを指定することが可能となってい
る。そして、ユーザが指定した音声のスピードがこの発
話速度制御部178に与えられることにより、当該発話
速度制御部178が(音韻継続時間計算処理部177で
の継続時間の決定処理にて決定される)先程のCVわた
りの間隔を調整して合成音声の速度を実際に変化させて
いる。但し、日本語の音声は、発声の速度を変えても子
音の継続時間はほぼ一定であることが分析結果から分か
っているので、子音の継続時間は一定に保ち、母音の継
続時間を調節してCVわたりの間隔を変える。
【0264】音韻継続時間計算処理部177により入力
文に含まれる各音節の(子音部ならびに母音部の)継続
時間が決定されると、同じ音声合成部172内のピッチ
生成処理部179が起動される。ピッチ生成処理部17
9は音韻継続時間計算処理部177により決定された継
続時間と、(言語処理部171内の)言語解析処理部1
74により決定されたアクセント情報に基づいて、まず
点ピッチ位置を設定する。次にピッチ生成処理部179
は、設定した複数の点ピッチを直線で補間して例えば1
0msec毎のピッチパターン(基本周波数パターン)を得
る。
【0265】一方、音声合成部172内の音韻パラメー
タ生成処理部180は、(言語処理部171内の)言語
解析処理部174から渡される音声記号列の音韻情報を
もとに音韻パラメータを生成する処理を、例えばピッチ
生成処理部179によるピッチパターン生成処理と並行
して次のように行う。
【0266】まず本実施形態では、サンプリング周波数
11025Hzで標本化した実音声を改良ケプストラム
法により窓長20msec、フレーム周期10msecで分析し
て得た0次から25次のケプストラム係数を子音+母音
(CV)の単位で日本語音声の合成に必要な全音節を切
り出した計137個の音声素片が蓄積された音声素片フ
ァイル(図示せず)が用意されている。この音声素片フ
ァイルの内容は、文音声変換ソフトウェアに従う文音声
変換処理の開始時に、例えばメインメモリ(図示せず)
に確保された音声素片領域(以下音声素片メモリと称す
る)181に読み込まれているものとする。
【0267】音韻パラメータ生成処理部180は、(言
語処理部171内の)言語解析処理部174から渡され
る音声記号列中の音韻情報に従って、上記したCV単位
の音声素片を音声素片メモリ181から順次読み出し、
読み出した音声素片を接続することにより合成すべき音
声の音韻パラメータ(特徴パラメータ)を生成する。
【0268】ピッチ生成処理部179によりピッチパタ
ーンが生成され、音韻パラメータ生成処理部180によ
り音韻パラメータが生成されると、音声合成部172内
の合成フィルタ処理部182が起動される。この合成フ
ィルタ処理部182は、図5中の合成フィルタ処理部5
2と同様に、図6に示したような構成となっている。し
たがって合成フィルタ処理部182は、上記生成された
ピッチパターンと音韻パラメータから、次のようにして
音声を合成する。
【0269】まず、音声の有声部(V)では、駆動音源
切り替え部523によりインパルス発生部522側に切
り替えられる。インパルス発生部522は、ピッチ生成
処理部179により生成されたピッチパターンに応じた
間隔のインパルスを発生し、このインパルスを音源とし
てLMAフィルタ524を駆動する。
【0270】一方、音声の無声部(U)では、駆動音源
切り替え部523によりホワイトノイズ発生部521側
に切り替えられる。ホワイトノイズ発生部521はホワ
イトノイズを発生し、このホワイトノイズを音源として
LMAフィルタ524を駆動する。LMAフィルタ52
4は音声のケプストラムを直接フィルタ係数とするもの
である。
【0271】本実施形態において音韻パラメータ生成処
理部180により生成された音韻パラメータは前記した
ようにケプストラムであることから、この音韻パラメー
タがLMAフィルタ524のフィルタ係数となり、駆動
音源切り替え部523により切り替えられる音源によっ
て駆動されることで、合成音声を出力する。
【0272】合成フィルタ処理部172(内のLMAフ
ィルタ524)により合成された音声は離散音声信号で
あり、D/A変換器183によりアナログ信号に変換
し、アンプ184を通してスピーカ185に出力するこ
とで、初めて音として聞くことができる。
【0273】ここまでの処理は、図31を参照しながら
[従来技術]の欄にて説明した例とほぼ同じである。
【0274】この図17の構成は、前記第4の実施形態
に係る図5の音声規則合成装置の構成に対応するもの
で、図5の構成においてD/A変換器でのD/A変換の
サンプリング周波数を可変する代わりに、合成音声(離
散音声信号)のサンプリング周波数自体を可変する点に
特徴がある。
【0275】即ち本実施形態のポイントは、合成フィル
タ処理部182とD/A変換器183との間に、当該合
成フィルタ処理部183の出力である合成音声のサンプ
リング周波数を変換するサンプリング周波数変換処理部
188を設けると共に、(図5中の声質切替部56及び
声質制御部57に対応する)声質切替部186及び声質
制御部187を設け、当該声質制御部187が、合成フ
ィルタ処理部182から出力される合成音声のサンプリ
ング周波数を声質切替部186で指定された声質で決ま
る周波数に変換するようにサンプリング周波数変換処理
部188を制御するところにある。ここで、D/A変換
器183でのD/A変換のサンプリング周波数(第3の
標本周期)は固定であり、音声素片作成時の音声のサン
プリング周波数(第1の標本周期)に一致するものとす
る。
【0276】本実施形態において、声質切替部186
は、図5中の声質切替部56と同様に(ユーザによる指
定もしくはアプリケーションプログラム等によって)3
種類の声質が指定可能であり、声質制御部187は、声
質切替部186で指定された声質に応じて、合成フィル
タ処理部182から出力される合成音声のサンプリング
周波数を、11025Hz(=未変換),12000H
Z,10000Hzのいずれかに変換するように、サン
プリング周波数変換処理部188を制御する。
【0277】したがって、合成音声のサンプリング周波
数を、メモリ181に蓄えられた音声素片を作成した際
のサンプリング周波数(第1の標本周期)と同じサンプ
リング周波数、即ち11025Hzに変換するならば
(あるいはサンプリング周波数変換処理を行わないなら
ば)、元の音声の声質で音声合成することができる。
【0278】一方、音声素片作成時とは異なるサンプリ
ング周波数(第1の標本周期とは異なる第2の標本周
期)、例えば11025Hzから12000Hz、ある
いは11025Hzから10000Hzへのサンプリン
グ周波数変換処理を行えば、既に述べたが、音声スペク
トルを図13に示したように周波数軸方向にシフトした
効果が得られるため、音声の個人性が変化し、こうして
得られるアナログ音声信号の声質は、音声素片の元とな
っている音声の声質とは異なったものとなる。
【0279】[第14の実施形態]前記第13の実施形
態においては、声質切替部186、声質制御部187及
びサンプリング周波数変換処理部188を設けたこと
で、合成音声の声質を簡単に増やすことができるもの
の、合成される音声のスピードが声質により異なる。
【0280】即ち、(サンプリング周波数変換処理後の
サンプリング周波数)>(D/A変換のサンプリング周
波数)のときには、合成される音声のスピードは遅くな
る。逆に、(サンプリング周波数変換処理後のサンプリ
ング周波数)<(D/A変換のサンプリング周波数)の
ときには、合成される音声のスピードは早くなる。
【0281】このような合成される音声のスピードの違
いは、サンプリング周波数変換処理後のサンプリング周
波数が前記第13の実施形態程度の違い(91%,10
9%)ではあまり問題とはならない。しかし以下に述べ
るように、サンプリング周波数変換処理後のサンプリン
グ周波数がD/A変換時のサンプリング周波数と大きく
異なる場合には、問題となる。
【0282】まず、サンプリング周波数変換処理後のサ
ンプリング周波数と合成時のD/A変換のサンプリング
周波数の比が1に近ければ声質は変化も小さく、逆にこ
の比が1から離れれば声質は大きく変化する。したがっ
て、声質を大きく変えようとすれば、これら両サンプリ
ング周波数の比を例えば50%,200%程度に設定す
ればよいが、これでは合成音声のスピードもそれぞれ元
の音声の200%,50%、即ち倍と半分になり、かな
り聞きづらくなる。
【0283】そこで、サンプリング周波数変換処理後の
サンプリング周波数がD/A変換のサンプリング周波数
と大きく異なった場合でも、合成音声のスピードを一定
にできるようにした第14の実施形態につき説明する。
【0284】図18は本発明の第14の実施形態に係る
音声の規則合成装置の概略構成を示すブロック図であ
り、図17と同一部分には同一符号を付してある。
【0285】この図18の構成は、前記第5の実施形態
に係る図7の音声規則合成装置の構成に対応するもの
で、図7の構成においてD/A変換器でのD/A変換の
サンプリング周波数を可変する代わりに、合成音声(離
散音声信号)のサンプリング周波数自体を可変するもの
である。
【0286】本実施形態のポイントは、図17中の発話
速度制御部178に代えて、合成音声のスピード(発話
速度)が制御可能な発話速度制御部198を設けると共
に、図17中の声質制御部187に代えて、サンプリン
グ周波数変換処理部188の変換するサンプリング周波
数だけでなく合成音声のスピードを制御する声質制御部
197を設け、当該声質制御部197により、声質切替
部186の指定に応じて、サンプリング周波数変換処理
部188でのサンプリング周波数変換処理と同時に、発
話速度制御部198での合成音声のスピードを制御する
ところにある。ここで、D/A変換器183でのD/A
変換のサンプリング周波数(第3の標本周期)は固定で
あり、前記第13の実施形態と同様に音声素片作成時の
音声のサンプリング周波数(第1の標本周期)に一致す
るものとする。
【0287】本実施形態では、前記第13の実施形態と
同様に声質切替部186にて3種類の声質が指定可能で
ある。声質制御部197は声質切替部186で指定され
た声質に応じて、例えば11025Hz,8000H
z,16000Hzのいずれかのサンプリング周波数へ
の変換を行うようにサンプリング周波数変換処理部18
8を制御する。
【0288】同時に声質制御部197は、声質切替部1
86によって指定された声質に応じて、発話速度制御部
198を次のように制御する。即ち声質制御部197
は、先に説明したCVわたりの間隔が、 (CVわたりの間隔)=(11025Hzへのサンプリ
ング周波数変換時のCVわたりの間隔)×(D/A変換
のサンプリング周波数)/サンプリング周波数変換後の
サンプリング周波数) となるよう発話速度制御部198を制御する。
【0289】したがって、8000Hzへのサンプリン
グ周波数変換を行う際には、声質制御部197は上式に
基づき、11025Hzへサンプリング周波数変換する
とき(あるいはサンプリング周波数変換をしないとき)
のCVわたり間隔の(11025[Hz]/8000[Hz])
倍のCVわたり間隔となるよう発話速度制御部198を
制御する。また声質制御部197は、16000Hzへ
のサンプリング周波数変換を行う際には、11025H
zでサンプリング周波数変換するとき(あるいはサンプ
リング周波数変換をしないとき)のCVわたり間隔の
(11025[Hz]/16000[Hz])倍のCVわたり間
隔となるよう発話速度制御部198を制御する。
【0290】このように本実施形態においては、発話速
度制御部198の制御でCVわたりの間隔(発話速度パ
ラメータ)を変えることにより、素片作成時と異なるサ
ンプリング周波数(第1の標本周期とは異なる第2の標
本周期)へのサンプリング周波数変換処理をした後、素
片作成時と同じサンプリング周波数(第2の標本周期と
は異なる第3の標本周期)でD/A変換したときに生じ
る合成音声のスピードの変化を相殺することができる。
【0291】したがって、素片作成時のサンプリング周
波数と異なる8000Hzあるいは16000Hzへの
サンプリング周波数変換処理を行った後、素片作成時と
同じサンプリング周波数でD/A変換を行っても、ほぼ
同じスピードの音声のアナログ信号を得ることができ
る。
【0292】[第15の実施形態]前記第14の実施形
態に基づいて規則合成を行えば、確かに声質を変えなが
らも合成される音声のスピードをほぼ一定に保つことが
簡単に実現できる。しかし既に説明したように、音韻継
続時間計算処理部177での処理(音韻継続時間計算処
理)では、CVわたりの間隔を変えても子音の音韻継続
時間を音節毎に一定にするため、素片作成時と異なるサ
ンプリング周波数へ合成音声を変換した後、素片作成時
と同じサンプリング周波数でD/A変換すると、子音の
継続時間が縮んだり、間延びしたりし、この結果、合成
される音声の明瞭性・自然性に影響を及ぼすことがあ
る。
【0293】そこで、合成される音声の子音の継続時間
を音節毎に一定に保つことができるようにした第15の
実施形態につき説明する。
【0294】図19は本発明の第15の実施形態に係る
音声の規則合成装置の概略構成を示すブロック図であ
り、図17または図18と同一部分には同一符号を付し
てある。
【0295】この図19の構成は、前記第6の実施形態
に係る図8の音声規則合成装置の構成に対応するもの
で、図8の構成においてD/A変換器でのD/A変換の
サンプリング周波数を可変する代わりに、合成音声(離
散音声信号)のサンプリング周波数自体を可変するもの
である。
【0296】本実施形態のポイントは、図18中の音韻
継続時間計算処理部177に代えて、音韻継続時間が制
御可能な音韻継続時間計算処理部207を設けると共
に、図18中の声質制御部197に代えて、サンプリン
グ周波数変換処理部188の変換するサンプリング周波
数だけでなく合成音声のスピードを制御する声質制御部
217を設け、当該声質制御部217により、声質切替
部186の指定に応じて、サンプリング周波数変換処理
部188でのサンプリング周波数変換処理と同時に、音
韻継続時間計算処理部207での音韻継続時間を制御す
るところにある。ここで、D/A変換器183でのD/
A変換のサンプリング周波数(第3の標本周期)は固定
であり、前記第13の実施形態と同様に音声素片作成時
の音声のサンプリング周波数(第1の標本周期)に一致
するものとする。
【0297】本実施形態では、前記第14の実施形態と
同様に声質切替部186にて3種類の声質が指定可能で
ある。声質制御部217は声質切替部186で指定され
た声質に応じて、例えば11025Hz(=未変換),
8000Hz,16000Hzのいずれかのサンプリン
グ周波数へのサンプリング周波数変換処理を行うように
サンプリング周波数変換処理部188を制御する。
【0298】同時に声質制御部217は、声質切替部1
86によって指定された声質に応じて、音韻継続時間計
算処理部207を次のように制御する。即ち声質制御部
217は、全ての音韻の継続時間、つまり子音の継続時
間と母音の継続時間が (音韻継続時間)=(11025Hzへのサンプリング
周波数変換時の音韻継続時間)×(D/A変換のサンプ
リング周波数)/(サンプリング周波数変換後のサンプ
リング周波数) となるよう音韻継続時間計算処理部207を制御する。
【0299】したがって、8000Hzへのサンプリン
グ周波数変換処理を行う際には、声質制御部217は上
式に基づき、11025Hzへサンプリング周波数変換
するとき(あるいはサンプリング周波数変換をしないと
き)の音韻継続時間の(11025[Hz]/8000[H
z])倍の音韻継続時間となるよう音韻継続時間計算処理
部207を制御する。また声質制御部217は、160
00Hzへのサンプリング周波数変換処理を行う際に
は、11025Hzへサンプリング周波数変換するとき
(あるいはサンプリング周波数変換をしないとき)の音
韻継続時間の(11025[Hz]/16000[Hz])倍の
音韻継続時間となるよう音韻継続時間計算処理部207
を制御する。
【0300】このよう本実施形態においては、素片作成
時と異なるサンプリング周波数(第1の標本周期とは異
なる第2の標本周期)へサンプリング周波数変換処理
し、素片作成時と同じサンプリング周波数(第2の標本
周期とは異なる第3の標本周期)でD/A変換したとき
に生じる合成音声のスピードの変化を、各音韻継続時間
を一定の割合で変えることで相殺することができ、かつ
合成される音声の子音の継続時間を音節毎に一定に保つ
ことができる。
【0301】[第16の実施形態]前記第14または第
15の実施形態に基づいて合成を行えば、確かに声質を
変えながらも合成される音声のスピードをほぼ一定に保
つことができる。しかし、D/A変換器183へ入力す
る音声のサンプリング周波数(サンプリング周波数変換
処理後のサンプリング周波数)とD/A変換のサンプリ
ング周波数とを違えるということは、レコードの早回し
や遅回しとほぼ同じであるから、音声の過渡部分の時間
的に縮んだり間延びすることは避けられない。
【0302】例をあげれば、/ わ/ という発声は、/ う
/ に近い口の形から急激に唇を開いて/ あ/ へ移る運動
を発声器管が行う。したがって、D/A変換時のサンプ
リング周波数を落して、レコードの遅回しのようなこと
をすれば、この変化が緩やかになり、/ わ/ ではなく、
/ うあー/ のように聞こえてくる。
【0303】そこで、D/A変換器183へ入力する音
声のサンプリング周波数(サンプリング周波数変換処理
後のサンプリング周波数)と異なるサンプリング周波数
でD/A変換したときに生じる合成音声過渡部分の時間
的方向の縮みや間延びを抑えることができるようにした
第16の実施形態につき説明する。
【0304】図20は本発明の第16の実施形態に係る
音声の規則合成装置の概略構成を示すブロック図であ
り、図19と同一部分には同一符号を付してある。
【0305】この図20の構成は、前記第7の実施形態
に係る図9の音声規則合成装置の構成に対応するもの
で、図9の構成においてD/A変換器でのD/A変換の
サンプリング周波数を可変する代わりに、合成音声(離
散音声信号)のサンプリング周波数自体を可変するもの
である。
【0306】本実施形態のポイントは、図19中の音韻
パラメータ生成処理部180に代えて、(音声素片から
なる)音韻パラメータを時間軸方向へ伸縮する機能が付
加された音韻パラメータ生成処理部230を設けると共
に、図19中の声質制御部217に代えて、音韻継続時
間及びサンプリング周波数変換処理部188の変換する
サンプリング周波数だけでなく音韻パラメータの時間軸
方向への伸縮を制御する声質制御部237を設け、当該
声質制御部237により、声質切替部186の指定に応
じて、サンプリング周波数変換処理部188でのサンプ
リング周波数変換処理及び音韻継続時間計算処理部20
7での音韻継続時間を制御する他に、音韻パラメータ生
成処理部230を制御し、合成音声の過渡部が縮んでし
まうような場合には、予め音韻パラメータを時間方向に
引き伸ばして音韻パラメータを作成させ、合成音声の過
渡部が間延びするような場合には、予め音韻パラメータ
を時間方向に圧縮して音韻パラメータを作成させるとこ
ろにある。ここで、D/A変換器183でのD/A変換
のサンプリング周波数(第3の標本周期)は固定であ
り、前記第13の実施形態と同様に音声素片作成時の音
声のサンプリング周波数(第1の標本周期)に一致する
ものとする。
【0307】本実施形態では、前記第15の実施形態と
同様に声質切替部186にて3種類の声質が指定可能で
ある。声質制御部237は声質切替部186で指定され
た声質に応じて、11025Hz(=未変換),800
0Hz,16000Hzのいずれかのサンプリング周波
数へのサンプリング周波数変換処理を行うようにサンプ
リング周波数変換処理部188を制御する。
【0308】同時に声質制御部237は、声質切替部1
86によって指定された声質に応じて、全ての音韻の継
続時間、即ち子音の継続時間と母音の継続時間を (音韻継続時間)=(11025Hzへのサンプリング
変換時の音韻継続時間)×(D/A変換のサンプリング
周波数)/(サンプリング周波数変換処理後のサンプリ
ング周波数) となるよう音韻継続時間計算処理部207を制御する。
【0309】さらに、声質制御部237は音韻パラメー
タ生成処理部230を制御し、D/A変換器183への
入力となる合成音声のサンプリング周波数(サンプリン
グ周波数変換処理後のサンプリング周波数)とD/A変
換器183でのD/A変換のサンプリング周波数が異な
るために、合成音声の過渡部が縮んでしまうような場合
には、予め音韻パラメータを時間方向に引き伸ばして音
韻パラメータを作成させ、合成音声の過渡部が間延びす
るような場合には、予め音韻パラメータを時間方向に圧
縮して音韻パラメータを作成させる。
【0310】もっと正確には、声質制御部237は、素
片自身の長さを、(D/A変換のサンプリング周波数/
サンプリング周波数変換処理後のサンプリング周波数)
倍となるように伸縮を行ってから接続補間し、音韻パラ
メータを生成させる。
【0311】即ち、本実施形態における声質制御部23
7は、サンプリング周波数変換処理部188が1102
5Hz(メモリ181に蓄えられた音声素片を作成した
際のサンプリング周波数と同じサンプリング周波数)へ
のサンプリング周波数変換処理を行う(言い換えれば、
サンプリング周波数変換処理を行わない)場合には、音
声素片の伸縮は行わずに音韻パラメータを生成し、80
00へのサンプリング周波数変換処理を行う場合には、
音声素片を(11025[Hz]/8000[Hz])倍の長さ
に延ばしてから接続補間して音韻パラメータを生成し、
16000Hzへのサンプリング周波数変換処理を行う
場合には、音声素片を(11025[Hz]/16000[H
z])倍の長さに縮めてから接続補間して音韻パラメータ
を生成するよう音韻パラメータ生成処理部230を制御
する。
【0312】このように本実施形態においては、D/A
変換器183への入力となる合成音声のサンプリング周
波数(サンプリング周波数変換処理後のサンプリング周
波数、第2の標本周期)とD/A変換器183でのD/
A変換のサンプリング周波数(第3の標本周期)を異な
らせたことによって生じる合成音声過渡部分の時間方向
の縮みや間延びを、予め音韻パラメータ生成時に音声素
片を伸縮させておくことで打ち消すことができる。
【0313】[第17の実施形態]前述の第14乃至第
16の実施形態は、ケプストラムやLPCなどを利用し
た音声規則合成、即ち音声波形を分析して得られるパラ
メータを用いた音声規則合成だけではなく、波形合成
(による規則合成)にも応用は可能である。しかし、パ
ラメータを用いた音声規則合成では、前述の第14乃至
第16の実施形態を用いずとも、声質を変えながら、合
成音声のスピードを一定にし、かつ音声過渡部の縮み間
延びを起こさせない簡便な方法が適用可能である。
【0314】そこで、この簡便な方法を、パラメータを
用いた音声規則合成に適用した第17の実施形態につき
説明する。
【0315】図21は本発明の第17の実施形態に係る
音声の規則合成装置の概略構成を示すブロック図であ
り、図17と同一部分には同一符号を付してある。
【0316】この図21の構成は、前記第8の実施形態
に係る図10の音声規則合成装置の構成に対応するもの
で、図10の構成においてD/A変換器でのD/A変換
のサンプリング周波数を可変する代わりに、合成音声
(離散音声信号)のサンプリング周波数自体を可変する
ものである。
【0317】本実施形態のポイントは、図17中の合成
フィルタ処理部182に代えて、合成時のフレーム周期
が制御可能な合成フィルタ処理部252を設けると共
に、図17中の声質制御部187に代えて、サンプリン
グ周波数変換処理部188の変換するサンプリング周波
数だけでなく合成時のフレーム周期を制御する声質制御
部257を設け、当該声質制御部257により、声質切
替部186の指定に応じて、サンプリング周波数変換処
理部188でのサンプリング周波数変換処理と同時に、
合成フィルタ処理部252での合成時のフレーム周期を
制御するところにある。ここで、D/A変換器183で
のD/A変換のサンプリング周波数(第3の標本周期)
は固定であり、前記第13の実施形態と同様に音声素片
作成時の音声のサンプリング周波数(第1の標本周期)
に一致するものとする。
【0318】本実施形態では、前記第13の実施形態と
同様に声質切替部186にて3種類の声質が指定可能で
ある。声質制御部257は声質切替部186で指定され
た声質に応じて、11025Hz(=未変換),800
0Hz,16000Hzのいずれかのサンプリング周波
数へのサンプリング周波数変換処理を行うようにサンプ
リング周波数変換処理部188を制御する。
【0319】同時に声質制御部257は、声質切替部1
86によって指定された声質に応じて、合成フィルタ処
理部252で行われる合成のフレーム周期を設定する。
合成のフレーム周期は次式により与えられる。
【0320】 (フレーム周期) =(素片作成時のフレーム周期)×(サンプリング周波数変換後のサンプ リング周期)/(D/A変換のサンプリング周期) =(素片作成時のフレーム周期)×(D/A変換のサンプリング周波数) /(サンプリング周波数変換後のサンプリング周波数) したがって、D/A変換時のサンプリング周波数と同じ
サンプリング周波数、即ち11025Hzへのサンプリ
ング周波数変換処理を行う(言い換えれば、サンプリン
グ周波数変換処理を行わない)際には、声質制御部25
7は上式に基づき、フレーム周期をケプストラム作成時
と同じ10msecで合成するよう合成フィルタ処理部25
2を制御する。
【0321】また声質制御部257は、音声素片作成時
の音声のサンプリング周波数とは異なるサンプリング周
波数(第1の標本周期とは異なる第2の標本周期)、例
えば8000Hzへのサンプリング周波数変換処理を行
う際には、 10[msec]×11025[Hz]/8000[Hz]=13.8
[msec] のフレーム周期(第1のフレーム周期とは異なる第2の
フレーム周期)で合成を行うよう制御し、16000H
zへのサンプリング周波数変換処理を行う際には、 10[msec]×11025[Hz]/16000[Hz]=6.9
[msec] のフレーム周期(第1のフレーム周期とは異なる第2の
フレーム周期)で合成を行うよう制御する。
【0322】このように本実施形態においては、D/A
変換器183への入力である合成音声のサンプリング周
波数(第2の標本周期)とD/A変換器183でのD/
A変換のサンプリング周波数(第3の標本周期)を違え
たときに生じる合成音声のスピードの変化を、合成フィ
ルタ処理部252における合成のフレーム周期(第2の
フレーム周期)を音声素片作成時のフレーム周期(第1
のフレーム周期)とは異ならせることで相殺することが
できる。
【0323】したがって、D/A変換器183でのD/
A変換のサンプリング周波数(11025Hz)とは異
なる8000Hzあるいは16000Hzへサンプリン
グ周波数を変換した後、11025Hzのサンプリング
周波数でD/A変換を行っても、同じスピードの音声の
アナログ信号を得ることができる。また同時に、音声素
片作成時と異なるサンプリング周波数でD/A変換した
ときに生じる音声過渡部の縮みや間延びも同時に防ぐこ
とができる。
【0324】[第18の実施形態]前記第13乃至第1
7の実施形態にはもう1つの問題点が存在する。それ
は、D/A変換器183への入力となる音声のサンプリ
ング周波数(=サンプリング周波数変換処理後のサンプ
リング周波数)とD/A変換のサンプリング周波数が異
なると、声の高さ即ち音声のピッチが変化してしまうと
いうことである。例えば、(サンプリング周波数変換処
理後のサンプリング周波数)>(D/A変換のサンプリ
ング周波数)のときには、合成される音声のピッチは低
くなる。逆に、(サンプリング周波数変換処理後のサン
プリング周波数)<(D/A変換のサンプリング周波
数)のときには、合成される音声のピッチは高くなる。
【0325】このような合成される音声のピッチの違い
は、サンプリング周波数変換処理後のサンプリング周波
数が前記第13の実施形態程度の違い(91%,109
%)ではあまり問題とはならない。
【0326】しかし、声質を大きく変えようとして、両
サンプリング周波数の比を例えば50%,200%程度
に設定すれば、合成音声のピッチはそれぞれ200%,
50%になる。この場合、11025Hzへサンプリン
グ周波数変換処理したとき(あるいはサンプリング周波
数変換を行わないとき)の合成音声と比較して、前者は
ピッチが1[oct] 高い音声が合成され、後者は1[oct]
低い音声が合成されるので聞きづらくなるという問題が
発生する。
【0327】図22は本発明の第18の実施形態に係る
音声の規則合成装置の概略構成を示すブロック図であ
り、図17と同一部分には同一符号を付してある。
【0328】この図22の構成は、前記第9の実施形態
に係る図11の音声規則合成装置の構成に対応するもの
で、図11の構成においてD/A変換器でのD/A変換
のサンプリング周波数を可変する代わりに、合成音声
(離散音声信号)のサンプリング周波数自体を可変する
ものである。
【0329】本実施形態のポイントは、図17中の合成
フィルタ処理部182に代えて、合成時のフレーム周期
及び合成音声のピッチが制御可能な合成フィルタ処理部
272を設けると共に、ピッチ生成処理部179と合成
フィルタ処理部272の間にピッチ生成処理部179で
生成されたピッチパターン(基本周波数パターン)を周
波数の異なる別のピッチパターンに変換(ピッチ変調)
して合成フィルタ処理部272に与えるピッチ変調処理
部278を設け、さらに図17中の声質制御部187に
代えて、サンプリング周波数変換処理部188の変換す
るサンプリング周波数だけでなく合成時のフレーム周期
及びピッチの変調を制御する声質制御部277を設け、
当該声質制御部277により、声質切替部186の指定
に応じて、サンプリング周波数変換処理部188でのサ
ンプリング周波数変換処理及び合成フィルタ処理部27
2での合成のフレーム周期を制御すると同時に、ピッチ
変調処理部278でのピッチの変調を制御するところに
ある。ここで、D/A変換器183でのD/A変換のサ
ンプリング周波数(第3の標本周期)は固定であり、前
記第13の実施形態と同様に音声素片作成時の音声のサ
ンプリング周波数(第1の標本周期)に一致するものと
する。
【0330】本実施形態では、前記第13の実施形態と
同様に声質切替部186にて3種類の声質が指定可能で
ある。声質制御部277は声質切替部186で指定され
た声質に応じて、例えば11025Hz(=未変換),
8000Hz,16000Hzのいずれかのサンプリン
グ周波数への変換を行うようにサンプリング周波数変換
処理部188を制御する。
【0331】同時に声質制御部277は、声質切替部1
86によって指定された声質に応じて、合成フィルタ処
理部272で行われる合成のフレーム周期を設定する。
合成のフレーム周期は次式により与えられる。
【0332】 (フレーム周期) =(素片作成時のフレーム周期)×(サンプリング周波数変換後のサンプ リング周期)/(D/A変換のサンプリング周期) =(素片作成時のフレーム周期)×(D/A変換のサンプリング周波数) /(サンプリング周波数変換後のサンプリング周波数) 声質制御部277はさらに、合成フィルタ処理部272
に与えるピッチを、 (合成フィルタ処理部272に与えるピッチ) =(11025[Hz]へのサンプリング周波数変換時のピッチ)×(D/A 変換のサンプリング周期)/(サンプリング周波数変換処理後のサンプリング周 期) =(11025[Hz]へのサンプリング周波数変換時のピッチ)×(サンプ リング周波数変換処理後のサンプリング周波数)/(D/A変換のサンプリング 周波数) となるように、ピッチ変調処理部278を制御する。
【0333】したがって、D/A変換時のサンプリング
周波数と同じサンプリング周波数、即ち11025[Hz]
へのサンプリング周波数変換処理を行う(言い換えれ
ば、サンプリング周波数変換処理を行わない)際には、
声質制御部277は、ピッチ生成処理部179が生成し
たピッチをそのまま合成フィルタ処理部272に与える
ようにピッチ変調処理部278を制御する。
【0334】また声質制御部277は、8000Hzへ
のサンプリング周波数変換処理を行う際には、ピッチ生
成処理部179が生成したピッチを(8000[Hz]/1
1025[Hz])倍して合成フィルタ処理部272に与え
るよう制御し、16000Hzへのサンプリング周波数
変換処理を行う際には、ピッチ生成処理部179が生成
したピッチを(16000[Hz]/11025[Hz])倍し
て合成合成フィルタ処理部272に与えるように制御す
る。
【0335】このように本実施形態においては、合成フ
ィルタ処理部272に与えるピッチを声質制御部277
の制御のもとで予め変調しておくことにより、D/A変
換器183への入力である合成音声のサンプリング周波
数(第2の標本周期)とD/A変換器183でのD/A
変換のサンプリング周波数(第3の標本周期)を違えた
ときに生じる合成音声のピッチの変化を相殺することが
できる。
【0336】したがって、8000Hzあるいは160
00Hzへサンプリング周波数を変換した後、1102
5Hzのサンプリング周波数でD/A変換を行っても、
同じ声の高さの音声のアナログ信号を得ることができ
る。
【0337】以上本発明の実施形態について説明してき
たが、本発明はこれら実施形態に限定されるものではな
い。
【0338】例えば、前記全ての実施形態では、音声の
特徴パラメータとしてケプストラムを使用しているが、
LPCやPARCORなど他のパラメータであっても本
発明は適用可能であり、同様な効果が得られる。声質の
数も全ての実施形態において3種類としたが、2種類ま
たは4種類以上でもよい。言語処理部に関しても形態素
解析以外に構文解析等が挿入されても全く問題なく、ま
た日本語のTTSに限らず英語やその他の言語のTTS
に応用可能である。
【0339】また、継続時間決定の方法に関してもCV
わたり間隔一定といった方法でなく、統計的な手法に基
づいた制御によっても構わない。ピッチ生成に関して
も、点ピッチによる方法でなくとも、例えば藤崎モデル
を利用した場合でも本発明は適用可能である。
【0340】要するに本発明はその要旨に逸脱しない範
囲で種々変形して実施することができる。
【0341】
【発明の効果】以上詳述したように本発明によれば、デ
ィジタル/アナログ変換手段に入力される合成された離
散音声信号の標本周期と当該離散音声信号を上記ディジ
タル/アナログ変換手段でアナログ音声信号に変換する
際の標本周期(変換周期)とが異なるように制御するこ
とで、あるいはディジタル/アナログ変換手段に入力さ
れる合成された離散音声信号の標本周期と当該離散音声
信号を上記ディジタル/アナログ変換手段でアナログ音
声信号に変換する際の標本周期(変換周期)との比を選
択指定された声質に応じて可変制御することで、アナウ
ンサ発声の収録や音声素片の再切り出しを行うことな
く、合成音声の声質を簡単に増やすことができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る音声の分析合成
装置の概略構成を示すブロック図。
【図2】同実施形態においてD/A変換のサンプリング
周波数を変えることにより得られる効果を説明するため
の図。
【図3】本発明の第2の実施形態に係る音声の分析合成
装置の概略構成を示すブロック図。
【図4】本発明の第3の実施形態に係る音声の分析合成
装置の概略構成を示すブロック図。
【図5】本発明の第4の実施形態に係る音声の規則合成
装置の概略構成を示すブロック図。
【図6】合成フィルタ処理部の構成を示すブロック図。
【図7】本発明の第5の実施形態に係る音声の規則合成
装置の概略構成を示すブロック図。
【図8】本発明の第6の実施形態に係る音声の規則合成
装置の概略構成を示すブロック図。
【図9】本発明の第7の実施形態に係る音声の規則合成
装置の概略構成を示すブロック図。
【図10】本発明の第8の実施形態に係る音声の規則合
成装置の概略構成を示すブロック図。
【図11】本発明の第9の実施形態に係る音声の規則合
成装置の概略構成を示すブロック図。
【図12】本発明の第10の実施形態に係る音声の分析
合成装置の概略構成を示すブロック図。
【図13】同実施形態においてD/A変換器への入力と
なる合成音声のサンプリング周波数を変えることにより
得られる効果を説明するための図。
【図14】サンプリング周波数変換処理部の構成を、そ
の動作と共に説明するための図。
【図15】本発明の第11の実施形態に係る音声の分析
合成装置の概略構成を示すブロック図。
【図16】本発明の第12の実施形態に係る音声の分析
合成装置の概略構成を示すブロック図。
【図17】本発明の第13の実施形態に係る音声の規則
合成装置の概略構成を示すブロック図。
【図18】本発明の第14の実施形態に係る音声の規則
合成装置の概略構成を示すブロック図。
【図19】本発明の第15の実施形態に係る音声の規則
合成装置の概略構成を示すブロック図。
【図20】本発明の第16の実施形態に係る音声の規則
合成装置の概略構成を示すブロック図。
【図21】本発明の第17の実施形態に係る音声の規則
合成装置の概略構成を示すブロック図。
【図22】本発明の第18の実施形態に係る音声の規則
合成装置の概略構成を示すブロック図。
【図23】従来の音声の分析合成装置の概略構成を示す
ブロック図。
【図24】従来の音声の規則合成装置の概略構成を示す
ブロック図。
【符号の説明】
11,141…メモリ(特徴パラメータ蓄積手段)、 12,142…メモリ(ピッチパターン蓄積手段)、 13,23,33,52,,112,132,143,
153,163,182,252,272…合成フィル
タ処理部(合成手段)、 14,53,144,183…D/A変換器(ディジタ
ル/アナログ変換手段)、 17,56,147,186…声質切替部(声質選択手
段)、 18,28,38,57,67,87,97,117,
137,148,158,168,187,197,2
17,237,257,277…声質制御部、 31,138,161,278…ピッチ変調処理部(ピ
ッチパターン変調手段)、 42,62,72,92,102,122,172,1
92,202,222,242,262…音声合成部
(音声合成手段)、 47,77,177,207…音韻継続時間計算処理
部、 48,68,178,198…発話速度制御部、 49,179…ピッチ生成処理部、 50,90,180,230…音韻パラメータ生成処理
部(合成パラメータフレーム時系列生成手段)、 51,181…音声素片メモリ(素片蓄積手段)、 149,188…サンプリング周波数変換処理部(標本
周期変換手段)。

Claims (132)

    【特許請求の範囲】
  1. 【請求項1】 第1の標本周期で標本化した離散音声信
    号を分析して得られる音声の特徴パラメータを蓄積する
    蓄積手段と、 この蓄積手段より読み出した音声の特徴パラメータを入
    力として離散音声信号を合成する合成手段と、 この合成手段によって合成された離散音声信号を前記第
    1の標本周期とは異なる第2の標本周期でアナログ音声
    信号に変換するディジタル/アナログ変換手段とを具備
    することを特徴とする音声合成装置。
  2. 【請求項2】 第1の標本周期で標本化した離散音声信
    号を分析して得られる音声の特徴パラメータを蓄積手段
    に蓄積しておき、前記蓄積手段より読み出した音声の特
    徴パラメータを入力として離散音声信号を合成する音声
    合成方法において、 前記合成した離散音声信号を前記第1の標本周期とは異
    なる第2の標本周期でアナログ音声信号に変換すること
    を特徴とする音声合成方法。
  3. 【請求項3】 第1の標本周期で標本化した離散音声信
    号を分析して得られる音声の特徴パラメータを蓄積する
    蓄積手段と、 この蓄積手段より読み出した音声の特徴パラメータを入
    力として離散音声信号を合成する合成手段と、 合成する音声の声質を選択指定するための声質選択手段
    と、 前記合成手段によって合成された離散音声信号を前記声
    質選択手段により選択指定された声質に応じて定められ
    る第2の標本周期でアナログ音声信号に変換するディジ
    タル/アナログ変換手段とを具備することを特徴とする
    音声合成装置。
  4. 【請求項4】 第1の標本周期で標本化した離散音声信
    号を分析して得られる音声の特徴パラメータを蓄積手段
    に蓄積しておき、前記蓄積手段より読み出した音声の特
    徴パラメータを入力として離散音声信号を合成する音声
    合成方法において、 合成する音声の声質の選択指定の受け付けを行い、 前記合成した離散音声信号を前記受け付けた声質に応じ
    て定められる第2の標本周期でアナログ音声信号に変換
    することを特徴とする音声合成方法。
  5. 【請求項5】 第1の標本周期で標本化した離散音声信
    号に第1のフレーム周期で時間窓をかけて分析して得ら
    れる音声の特徴パラメータフレームの時系列から、前記
    第1のフレーム周期とは異なる第2のフレーム周期で離
    散音声信号を合成する合成手段と、 この合成手段によって合成された離散音声信号を前記第
    1の標本周期とは異なる第2の標本周期でアナログ音声
    信号に変換するディジタル/アナログ変換手段とを具備
    することを特徴とする音声合成装置。
  6. 【請求項6】 第1の標本周期で標本化した離散音声信
    号に第1のフレーム周期で時間窓をかけて分析して得ら
    れる音声の特徴パラメータフレームの時系列から、前記
    第1のフレーム周期とは異なる第2のフレーム周期で離
    散音声信号を合成し、 この第2のフレーム周期で合成した離散音声信号を前記
    第1の標本周期とは異なる第2の標本周期でアナログ音
    声信号に変換することを特徴とする音声合成方法。
  7. 【請求項7】 第1の標本周期で標本化した離散音声信
    号に第1のフレーム周期で時間窓をかけて分析して得ら
    れる音声の特徴パラメータフレームの時系列から、前記
    第1のフレーム周期、前記第1の標本周期及び前記第1
    の標本周期とは異なる第2の標本周期に基づいて定めら
    れる第2のフレーム周期で離散音声信号を合成する合成
    手段と、 この合成手段によって合成された離散音声信号を前記第
    2の標本周期でアナログ音声信号に変換するディジタル
    /アナログ変換手段とを具備することを特徴とする音声
    合成装置。
  8. 【請求項8】 第1の標本周期で標本化した離散音声信
    号に第1のフレーム周期で時間窓をかけて分析して得ら
    れる音声の特徴パラメータフレームの時系列から、前記
    第1のフレーム周期、前記第1の標本周期及び前記第1
    の標本周期とは異なる第2の標本周期に基づいて定めら
    れる第2のフレーム周期で離散音声信号を合成し、 この第2のフレーム周期で合成した離散音声信号を前記
    第2の標本周期でアナログ音声信号に変換することを特
    徴とする音声合成方法。
  9. 【請求項9】 第1の標本周期で標本化した離散音声信
    号に第1のフレーム周期で時間窓をかけて分析して得ら
    れる音声の特徴パラメータフレームの時系列を蓄積する
    蓄積手段と、 合成する音声の声質を選択指定するための声質選択手段
    と、 前記蓄積手段より読み出した特徴パラメータフレームの
    時系列から、前記声質選択手段により選択指定された声
    質に応じて定められる第2のフレーム周期で離散音声信
    号を合成する合成手段と、 この合成手段によって合成された離散音声信号を前記声
    質選択手段により選択指定された声質に応じて定められ
    る第2の標本周期でアナログ音声信号に変換するディジ
    タル/アナログ変換手段とを具備することを特徴とする
    音声合成装置。
  10. 【請求項10】 第1の標本周期で標本化した離散音声
    信号に第1のフレーム周期で時間窓をかけて分析して得
    られる音声の特徴パラメータフレームの時系列を蓄積手
    段に蓄積しておき、前記蓄積手段より読み出した特徴パ
    ラメータフレームの時系列から離散音声信号を合成する
    音声合成方法において、 合成する音声の声質の選択指定を受け付け、 前記特徴パラメータフレームの時系列からの離散音声信
    号の合成処理を、前記受け付けた声質に応じて定められ
    る第2のフレーム周期で行い、 この第2のフレーム周期で合成した離散音声信号を前記
    受け付けた声質に応じて定められる第2の標本周期でア
    ナログ音声信号に変換することを特徴とする音声合成方
    法。
  11. 【請求項11】 第1の標本周期で標本化した離散音声
    信号に第1のフレーム周期で時間窓をかけて分析して得
    られる音声の特徴パラメータフレームの時系列から、前
    記第1のフレーム周期、前記第1の標本周期及び前記第
    1の標本周期とは異なる第2の標本周期をもとに 第2のフレーム周期=第1のフレーム周期×第1の標本
    周期/第2の標本周期 で定められる第2のフレーム周期で離散音声信号を合成
    する合成手段と、 この合成手段によって合成された離散音声信号を前記第
    2の標本周期でアナログ音声信号に変換するディジタル
    /アナログ変換手段とを具備することを特徴とする音声
    合成装置。
  12. 【請求項12】 第1の標本周期で標本化した離散音声
    信号に第1のフレーム周期で時間窓をかけて分析して得
    られる音声の特徴パラメータフレームの時系列から、前
    記第1のフレーム周期、前記第1の標本周期及び前記第
    1の標本周期とは異なる第2の標本周期をもとに 第2のフレーム周期=第1のフレーム周期×第1の標本
    周期/第2の標本周期 で定められる第2のフレーム周期で離散音声信号を合成
    し、 この第2のフレーム周期で合成した離散音声信号を前記
    第2の標本周期でアナログ音声信号に変換することを特
    徴とする音声合成方法。
  13. 【請求項13】 第1の標本周期で標本化した離散音声
    信号を分析して得られる音声の特徴パラメータを蓄積す
    る特徴パラメータ蓄積手段と、 音声の基本周波数パターンを蓄積するピッチパターン蓄
    積手段と、 前記特徴パラメータ蓄積手段から読み出した特徴パラメ
    ータと前記ピッチパターン蓄積手段から読み出した基本
    周波数パターンとから離散音声信号を合成する合成手段
    と、 この合成手段によって合成された離散音声信号をアナロ
    グ音声信号に変換するディジタル/アナログ変換手段で
    あって、前記アナログ音声信号への変換を前記第1の標
    本周期または前記第1の標本周期とは異なる第2の標本
    周期で選択的に行うことが可能なディジタル/アナログ
    変換手段と、 このディジタル/アナログ変換手段にて前記第2の標本
    周期でアナログ音声信号への変換が行われる際には、前
    記ピッチパターン蓄積手段から読み出した基本周波数パ
    ターンとは異なる基本周波数パターンを生成して前記合
    成手段に与えるピッチパターン生成手段とを具備するこ
    とを特徴とする音声合成装置。
  14. 【請求項14】 第1の標本周期で標本化した離散音声
    信号を分析して得られる音声の特徴パラメータを特徴パ
    ラメータ蓄積手段に蓄積しておくと共に、音声の基本周
    波数パターンをピッチパターン蓄積手段に蓄積してお
    き、前記特徴パラメータ蓄積手段から読み出した特徴パ
    ラメータと前記ピッチパターン蓄積手段から読み出した
    基本周波数パターンとから離散音声信号を合成し、この
    合成した離散音声信号をアナログ音声信号に変換する音
    声合成方法において、 前記アナログ音声信号への変換を前記第1の標本周期で
    行う第1のモードと前記第1の標本周期とは異なる第2
    の標本周期で行う第2のモードとを用意し、 前記第2のモード時の合成処理では、前記ピッチパター
    ン蓄積手段から読み出した基本周波数パターンとは異な
    る基本周波数パターンを生成して前記離散音声信号の合
    成に用いるようにしたことを特徴とする音声合成方法。
  15. 【請求項15】 第1の標本周期で標本化した離散音声
    信号を分析して得られる音声の特徴パラメータを蓄積す
    る特徴パラメータ蓄積手段と、 音声の基本周波数パターンを蓄積するピッチパターン蓄
    積手段と、 前記ピッチパターン蓄積手段から読み出した基本周波数
    パターンを前記第1の標本周期及び前記第1の標本周期
    とは異なる第2の標本周期に基づいて変調するピッチパ
    ターン変調手段と、 前記特徴パラメータ蓄積手段から読み出した特徴パラメ
    ータと前記ピッチパターン変調手段にて変調された基本
    周波数パターンとから離散音声信号を合成する合成手段
    と、 この合成手段によって合成された離散音声信号を前記第
    2の標本周期でアナログ音声信号に変換するディジタル
    /アナログ変換手段とを具備することを特徴とする音声
    合成装置。
  16. 【請求項16】 第1の標本周期で標本化した離散音声
    信号を分析して得られる音声の特徴パラメータを特徴パ
    ラメータ蓄積手段に蓄積しておくと共に、音声の基本周
    波数パターンをピッチパターン蓄積手段に蓄積してお
    き、 前記ピッチパターン蓄積手段から読み出した基本周波数
    パターンを前記第1の標本周期及び前記第1の標本周期
    とは異なる第2の標本周期に基づいて変調し、 前記特徴パラメータ蓄積手段から読み出した特徴パラメ
    ータと前記ピッチ変調した基本周波数パターンとから離
    散音声信号を合成し、 この合成した離散音声信号を前記第2の標本周期でアナ
    ログ音声信号に変換することを特徴とする音声合成方
    法。
  17. 【請求項17】 第1の標本周期で標本化した離散音声
    信号を分析して得られる音声の特徴パラメータを蓄積す
    る特徴パラメータ蓄積手段と、 音声の基本周波数パターンを蓄積するピッチパターン蓄
    積手段と、 合成する音声の声質を選択指定するための声質選択手段
    と、 前記ピッチパターン蓄積手段から読み出した基本周波数
    パターンを対象に、前記声質選択手段により選択指定さ
    れた声質に応じた変調を行うピッチパターン変調手段
    と、 前記特徴パラメータ蓄積手段から読み出した特徴パラメ
    ータと前記ピッチパターン変調手段にて変調された基本
    周波数パターンとから離散音声信号を合成する合成手段
    と、 この合成手段によって合成された離散音声信号を前記声
    質選択手段により選択指定された声質に応じて定められ
    る第2の標本周期でアナログ音声信号に変換するディジ
    タル/アナログ変換手段とを具備することを特徴とする
    音声合成装置。
  18. 【請求項18】 第1の標本周期で標本化した離散音声
    信号を分析して得られる音声の特徴パラメータを特徴パ
    ラメータ蓄積手段に蓄積しておくと共に、音声の基本周
    波数パターンをピッチパターン蓄積手段に蓄積してお
    き、前記特徴パラメータ蓄積手段から読み出した特徴パ
    ラメータと前記ピッチパターン蓄積手段から読み出した
    基本周波数パターンとに基づく離散音声信号の合成を行
    う音声合成方法において、 合成する音声の声質の選択指定を受け付け、 前記ピッチパターン蓄積手段から読み出した基本周波数
    パターンを対象に、前記受け付けた声質に応じた変調を
    行い、 前記特徴パラメータ蓄積手段から読み出した特徴パラメ
    ータと前記変調された基本周波数パターンとから離散音
    声信号を合成し、 この合成した離散音声信号を前記受け付けた声質に応じ
    て定められる第2の標本周期でアナログ音声信号に変換
    することを特徴とする音声合成方法。
  19. 【請求項19】 第1の標本周期で標本化した離散音声
    信号を分析して得られる音声の特徴パラメータを蓄積す
    る特徴パラメータ蓄積手段と、 音声の基本周波数パターンを蓄積するピッチパターン蓄
    積手段と、 前記ピッチパターン蓄積手段から読み出した基本周波数
    パターンを、前記第1の標本周期及び前記第1の標本周
    期とは異なる第2の標本周期をもとに(第2の標本周期
    /第1の標本周期)倍に変調するピッチパターン変調手
    段と、 前記特徴パラメータ蓄積手段から読み出した特徴パラメ
    ータと前記ピッチパターン変調手段にて変調された基本
    周波数パターンとから離散音声信号を合成する合成手段
    と、 この合成手段によって合成された離散音声信号を前記第
    2の標本周期でアナログ音声信号に変換するディジタル
    /アナログ変換手段とを具備することを特徴とする音声
    合成装置。
  20. 【請求項20】 第1の標本周期で標本化した離散音声
    信号を分析して得られる音声の特徴パラメータを特徴パ
    ラメータ蓄積手段に蓄積しておくと共に、音声の基本周
    波数パターンをピッチパターン蓄積手段に蓄積してお
    き、 前記ピッチパターン蓄積手段から読み出した基本周波数
    パターンを、前記第1の標本周期及び前記第1の標本周
    期とは異なる第2の標本周期をもとに(第2の標本周期
    /第1の標本周期)倍に変調し、 前記特徴パラメータ蓄積手段から読み出した特徴パラメ
    ータと前記変調された基本周波数パターンとから離散音
    声信号を合成し、 この合成した離散音声信号を上記第2の標本周期でアナ
    ログ音声信号に変換することを特徴とする音声合成方
    法。
  21. 【請求項21】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し接続することによって離散音声信号を合成
    する音声合成手段と、 この音声合成手段によって合成された離散音声信号を前
    記第1の標本周期とは異なる第2の標本周期でアナログ
    音声信号に変換するディジタル/アナログ変換手段とを
    具備することを特徴とする音声合成装置。
  22. 【請求項22】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し接続することによって離散音声信号を合成
    し、 この合成した離散音声信号を前記第1の標本周期とは異
    なる第2の標本周期でアナログ音声信号に変換すること
    を特徴とする音声合成方法。
  23. 【請求項23】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し接続することによって離散音声信号を合成
    する音声合成手段と、 合成する音声の声質を選択指定するための声質選択手段
    と、 前記音声合成手段によって合成された離散音声信号を前
    記声質選択手段により選択指定された声質に応じて定め
    られる第2の標本周期でアナログ音声信号に変換するデ
    ィジタル/アナログ変換手段とを具備することを特徴と
    する音声合成装置。
  24. 【請求項24】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し接続することによって離散音声信号を合成
    する音声合成方法において、 合成する音声の声質の選択指定の受け付けを行い、 前記合成した離散音声信号を前記受け付けた声質に応じ
    て定められる第2の標本周期でアナログ音声信号に変換
    することを特徴とする音声合成方法。
  25. 【請求項25】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し、この選択した音声素片を、合成される音
    声の発話速度または発話時間に関係する発話速度パラメ
    ータに応じて接続することによって離散音声信号を合成
    する音声合成手段と、 この音声合成手段によって合成された離散音声信号をア
    ナログ音声信号に変換するディジタル/アナログ変換手
    段であって、前記アナログ音声信号への変換を前記第1
    の標本周期または前記第1の標本周期とは異なる第2の
    標本周期で選択的に行うことが可能なディジタル/アナ
    ログ変換手段とを具備し、 前記音声合成手段は、前記ディジタル/アナログ変換手
    段にて前記第2の標本周期でアナログ音声信号への変換
    が行われる際には、前記第1の標本周期でアナログ音声
    信号への変換が行われるときとは異なる値の前記発話速
    度パラメータを用いるように構成されていることを特徴
    とする音声合成装置。
  26. 【請求項26】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し、この選択した音声素片を、合成される音
    声の発話速度または発話時間に関係する発話速度パラメ
    ータに応じて接続することによって離散音声信号を合成
    し、この合成した離散音声信号をアナログ音声信号に変
    換する音声合成方法において、 前記アナログ音声信号への変換を前記第1の標本周期で
    行う第1のモードと前記第1の標本周期とは異なる第2
    の標本周期で行う第2のモードとを用意し、 前記第2のモード時の合成処理では、前記第1の標本周
    期でアナログ音声信号への変換が行われるときとは異な
    る値の前記発話速度パラメータを用いるようにしたこと
    を特徴とする音声合成方法。
  27. 【請求項27】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し、この選択した音声素片を、合成される音
    声の発話速度または発話時間に関係する発話速度パラメ
    ータに応じて接続することによって離散音声信号を合成
    する音声合成手段であって、使用する前記発話速度パラ
    メータを前記第1の標本周期及び前記第1の標本周期と
    は異なる第2の標本周期に基づいて決定する音声合成手
    段と、 この音声合成手段によって合成された離散音声信号を前
    記第2の標本周期でアナログ音声信号に変換するディジ
    タル/アナログ変換手段とを具備することを特徴とする
    音声合成装置。
  28. 【請求項28】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し、この選択した音声素片を、合成される音
    声の発話速度または発話時間に関係する発話速度パラメ
    ータに応じて接続することによって離散音声信号を合成
    する音声合成方法において、 合成時に使用する前記発話速度パラメータを前記第1の
    標本周期及び前記第1の標本周期とは異なる第2の標本
    周期に基づいて決定すると共に、 前記合成した離散音声信号を前記第2の標本周期でアナ
    ログ音声信号に変換することを特徴とする音声合成方
    法。
  29. 【請求項29】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し、この選択した音声素片を、合成される音
    声の発話速度または発話時間に関係する発話速度パラメ
    ータに応じて接続することによって離散音声信号を合成
    する音声合成手段と、 合成する音声の声質を選択指定するための声質選択手段
    と、 前記音声合成手段によって合成された離散音声信号を前
    記声質選択手段により選択指定された声質に応じて定め
    られる第2の標本周期でアナログ音声信号に変換するデ
    ィジタル/アナログ変換手段とを具備し、 前記音声合成手段は、使用する前記発話速度パラメータ
    を前記声質選択手段により選択指定された声質に応じて
    決定するように構成されていることを特徴とする音声合
    成装置。
  30. 【請求項30】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し、この選択した音声素片を、合成される音
    声の発話速度または発話時間に関係する発話速度パラメ
    ータに応じて接続することによって離散音声信号を合成
    する音声合成方法において、 合成する音声の声質の選択指定の受け付けを行い、 合成時に使用する前記発話速度パラメータを前記受け付
    けた声質に応じて決定すると共に、 前記合成した離散音声信号を前記受け付けた声質に応じ
    て定められる第2の標本周期でアナログ音声信号に変換
    することを特徴とする音声合成方法。
  31. 【請求項31】 与えられた音韻情報に含まれる各音韻
    の継続時間を決定する一方、第1の標本周期で標本化し
    た離散音声信号から作成した音声素片を前記音韻情報に
    基づいて選択し、前記決定した各音韻の継続時間に基づ
    いて前記選択した音声素片を接続することによって離散
    音声信号を合成する音声合成手段と、 この音声合成手段によって合成された離散音声信号をア
    ナログ音声信号に変換するディジタル/アナログ変換手
    段であって、前記アナログ音声信号への変換を前記第1
    の標本周期または前記第1の標本周期とは異なる第2の
    標本周期で選択的に行うことが可能なディジタル/アナ
    ログ変換手段とを具備し、 前記音声合成手段は、前記ディジタル/アナログ変換手
    段にて前記第2の標本周期でアナログ音声信号への変換
    が行われる際には、前記第1の標本周期でアナログ音声
    信号への変換が行われるときとは異なる音韻継続時間と
    なるよう前記音韻継続時間の決定を行うように構成され
    ていることを特徴とする音声合成装置。
  32. 【請求項32】 与えられた音韻情報に含まれる各音韻
    の継続時間を決定する一方、第1の標本周期で標本化し
    た離散音声信号から作成した音声素片を前記音韻情報に
    基づいて選択し、前記決定した各音韻の継続時間に基づ
    いて前記選択した音声素片を接続することによって離散
    音声信号を合成し、この合成した離散音声信号をアナロ
    グ音声信号に変換する音声合成方法において、 前記アナログ音声信号への変換を前記第1の標本周期で
    行う第1のモードと前記第1の標本周期とは異なる第2
    の標本周期で行う第2のモードとを用意し、 前記第2のモード時の合成処理では、前記第1の標本周
    期でアナログ音声信号への変換が行われるときとは異な
    る音韻継続時間となるよう前記音韻継続時間の決定を行
    うようにしたことを特徴とする音声合成方法。
  33. 【請求項33】 与えられた音韻情報に含まれる各音韻
    の継続時間を決定する一方、第1の標本周期で標本化し
    た離散音声信号から作成した音声素片を前記音韻情報に
    基づいて選択し、前記決定した各音韻の継続時間に基づ
    いて前記選択した音声素片を接続することによって離散
    音声信号を合成する音声合成手段であって、使用する前
    記音韻継続時間を前記第1の標本周期及び前記第1の標
    本周期とは異なる第2の標本周期に基づいて決定する音
    声合成手段と、 この音声合成手段によって合成された離散音声信号を前
    記第2の標本周期でアナログ音声信号に変換するディジ
    タル/アナログ変換手段とを具備することを特徴とする
    音声合成装置。
  34. 【請求項34】 与えられた音韻情報に含まれる各音韻
    の継続時間を決定する一方、第1の標本周期で標本化し
    た離散音声信号から作成した音声素片を前記音韻情報に
    基づいて選択し、前記決定した各音韻の継続時間に基づ
    いて前記選択した音声素片を接続することによって離散
    音声信号を合成する音声合成方法において、 合成時に使用する前記音韻継続時間を前記第1の標本周
    期及び前記第1の標本周期とは異なる第2の標本周期に
    基づいて決定すると共に、 前記合成した離散音声信号を前記第2の標本周期でアナ
    ログ音声信号に変換することを特徴とする音声合成方
    法。
  35. 【請求項35】 与えられた音韻情報に含まれる各音韻
    の継続時間を決定する一方、第1の標本周期で標本化し
    た離散音声信号から作成した音声素片を前記音韻情報に
    基づいて選択し、前記決定した各音韻の継続時間に基づ
    いて前記選択した音声素片を接続することによって離散
    音声信号を合成する音声合成手段と、 合成する音声の声質を選択指定するための声質選択手段
    と、 前記音声合成手段によって合成された離散音声信号を前
    記声質選択手段により選択指定された声質に応じて定め
    られる第2の標本周期でアナログ音声信号に変換するデ
    ィジタル/アナログ変換手段とを具備し、 前記音声合成手段は、合成時に使用する前記音韻継続時
    間を前記声質選択手段により選択指定された声質に応じ
    て決定するように構成されていることを特徴とする音声
    合成装置。
  36. 【請求項36】 与えられた音韻情報に含まれる各音韻
    の継続時間を決定する一方、第1の標本周期で標本化し
    た離散音声信号から作成した音声素片を前記音韻情報に
    基づいて選択し、前記決定した各音韻の継続時間に基づ
    いて前記選択した音声素片を接続することによって離散
    音声信号を合成する音声合成方法において、 合成する音声の声質の選択指定の受け付けを行い、 合成時に使用する前記音韻継続時間を前記受け付けた声
    質に応じて決定すると共に、 前記合成した離散音声信号を前記受け付けた声質に応じ
    て定められる第2の標本周期でアナログ音声信号に変換
    することを特徴とする音声合成方法。
  37. 【請求項37】 前記音声合成手段は、前記ディジタル
    /アナログ変換手段にて前記第2の標本周期でアナログ
    音声信号への変換が行われる際には、前記第1の標本周
    期でアナログ音声信号への変換が行われるときの音韻継
    続時間の(第1の標本周期/第2の標本周期)倍の音韻
    継続時間となるよう前記音韻継続時間の決定を行うこと
    を特徴とする請求項31記載の音声合成装置。
  38. 【請求項38】 前記第2のモード時の合成処理では、
    前記第1の標本周期でアナログ音声信号への変換が行わ
    れるときの音韻継続時間の(第1の標本周期/第2の標
    本周期)倍の音韻継続時間となるよう前記音韻継続時間
    の決定を行うことを特徴とする請求項32記載の音声合
    成方法。
  39. 【請求項39】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し、この選択した音声素片を時間軸方向に伸
    縮させながら接続することによって離散音声信号を合成
    する音声合成手段と、 この音声合成手段によって合成された離散音声信号を前
    記第1の標本周期とは異なる第2の標本周期でアナログ
    音声信号に変換するディジタル/アナログ変換手段とを
    具備することを特徴とする音声合成装置。
  40. 【請求項40】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し、この選択した音声素片を時間軸方向に伸
    縮させながら接続することによって離散音声信号を合成
    し、 この合成した離散音声信号を前記第1の標本周期とは異
    なる第2の標本周期でアナログ音声信号に変換すること
    を特徴とする音声合成方法。
  41. 【請求項41】 前記音声合成手段は、前記選択した音
    声素片を接続する際には、当該音声素片を前記第1の標
    本周期及び前記第2の標本周期に基づいて定められる度
    合いで時間軸方向に伸縮させながら接続することを特徴
    とする請求項39記載の音声合成装置。
  42. 【請求項42】 前記選択した音声素片を接続する際に
    は、当該音声素片を前記第1の標本周期及び前記第2の
    標本周期に基づいて定められる度合いで時間軸方向に伸
    縮させながら接続することを特徴とする請求項40記載
    の音声合成方法。
  43. 【請求項43】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し、この選択した音声素片を時間軸方向に伸
    縮させながら接続することによって離散音声信号を合成
    する音声合成手段と、 合成する音声の声質を選択指定するための声質選択手段
    と、 前記音声合成手段によって合成された離散音声信号を前
    記声質選択手段により選択指定された声質に応じて定め
    られる第2の標本周期でアナログ音声信号に変換するデ
    ィジタル/アナログ変換手段とを具備し、 前記音声合成手段は、前記選択した音声素片を前記声質
    選択手段により選択指定された声質に応じて定められる
    度合いで時間軸方向に伸縮させながら接続するように構
    成されていることを特徴とする音声合成装置。
  44. 【請求項44】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し、この選択した音声素片を接続することに
    よって離散音声信号を合成し、この合成した離散音声信
    号をアナログ音声信号に変換するする音声合成方法にお
    いて、 合成する音声の声質の選択指定の受け付けを行い、 前記選択した音声素片を接続する際には、当該音声素片
    を前記受け付けた声質に応じて定められる度合いで時間
    軸方向に伸縮させながら接続し、 前記合成した離散音声信号をアナログ音声信号に変換す
    る際には、前記受け付けた声質に応じて定められる第2
    の標本周期でアナログ音声信号に変換することを特徴と
    する音声合成方法。
  45. 【請求項45】 前記音声合成手段は、前記選択した音
    声素片を接続する際には、当該音声素片を時間軸方向に
    (第1の標本周期/ 第2の標本周期)倍の大きさで伸縮
    させながら接続することを特徴とする請求項39記載の
    音声合成装置。
  46. 【請求項46】 前記選択した音声素片を接続する際に
    は、当該音声素片を時間軸方向に(第1の標本周期/ 第
    2の標本周期)倍の大きさで伸縮させながら接続するこ
    とを特徴とする請求項40記載の音声合成方法。
  47. 【請求項47】 第1の標本周期で標本化した離散音声
    信号に第1のフレーム周期の時間窓をかけて分析して得
    られる音声の特徴パラメータフレームの時系列から所定
    の合成単位で切り出した音声素片を複数蓄積する音声素
    片蓄積手段と、 この音声素片蓄積手段から入力音韻情報に基づいて前記
    音声素片を選択し接続して合成パラメータフレームの時
    系列を生成する合成パラメータフレーム時系列生成手段
    と、 この合成パラメータフレーム時系列生成手段により生成
    された合成パラメータフレームの時系列から前記第1の
    フレーム周期とは異なる第2のフレーム周期で離散音声
    信号を合成する合成手段と、 この合成手段によって合成された離散音声信号を前記第
    1の標本周期とは異なる第2の標本周期でアナログ音声
    信号に変換するディジタル/アナログ変換手段とを具備
    することを特徴とする音声合成装置。
  48. 【請求項48】 第1の標本周期で標本化した離散音声
    信号に第1のフレーム周期の時間窓をかけて分析して得
    られる音声の特徴パラメータフレームの時系列から所定
    の合成単位で切り出した音声素片を音声素片蓄積手段に
    複数蓄積しておき、 前記音声素片蓄積手段から入力音韻情報に基づいて前記
    音声素片を選択し接続して合成パラメータフレームの時
    系列を生成し、 この生成した合成パラメータフレームの時系列から前記
    第1のフレーム周期とは異なる第2のフレーム周期で離
    散音声信号を合成し、 この合成した離散音声信号を前記第1の標本周期とは異
    なる第2の標本周期でアナログ音声信号へ変換すること
    を特徴とする音声合成方法。
  49. 【請求項49】 第1の標本周期で標本化した離散音声
    信号に第1のフレーム周期の時間窓をかけて分析して得
    られる音声の特徴パラメータフレームの時系列から所定
    の合成単位で切り出した音声素片を複数蓄積する音声素
    片蓄積手段と、 この音声素片蓄積手段から入力音韻情報に基づいて前記
    音声素片を選択し接続して合成パラメータフレームの時
    系列を生成する合成パラメータフレーム時系列生成手段
    と、 この合成パラメータフレーム時系列生成手段により生成
    された合成パラメータフレームの時系列から、前記第1
    のフレーム周期、前記第1の標本周期及び前記第1の標
    本周期とは異なる第2の標本周期に基づいて定められる
    第2のフレーム周期で離散音声信号を合成する合成手段
    と、 この合成手段によって合成された離散音声信号を前記第
    2の標本周期でアナログ音声信号に変換するディジタル
    /アナログ変換手段とを具備することを特徴とする音声
    合成装置。
  50. 【請求項50】 第1の標本周期で標本化した離散音声
    信号に第1のフレーム周期の時間窓をかけて分析して得
    られる音声の特徴パラメータフレームの時系列から所定
    の合成単位で切り出した音声素片を音声素片蓄積手段に
    複数蓄積しておき、 前記音声素片蓄積手段から入力音韻情報に基づいて前記
    音声素片を選択し接続して合成パラメータフレームの時
    系列を生成し、 この生成した合成パラメータフレームの時系列から、前
    記第1のフレーム周期、前記第1の標本周期及び前記第
    1の標本周期とは異なる第2の標本周期に基づいて定め
    られる第2のフレーム周期で離散音声信号を合成し、 この合成した離散音声信号を前記第2の標本周期でアナ
    ログ音声信号へ変換することを特徴とする音声合成方
    法。
  51. 【請求項51】 第1の標本周期で標本化した離散音声
    信号に第1のフレーム周期の時間窓をかけて分析して得
    られる音声の特徴パラメータフレームの時系列から所定
    の合成単位で切り出した音声素片を複数蓄積する音声素
    片蓄積手段と、 合成する音声の声質を選択指定するための声質選択手段
    と、 前記音声素片蓄積手段から入力音韻情報に基づいて前記
    音声素片を選択し接続して合成パラメータフレームの時
    系列を生成する合成パラメータフレーム時系列生成手段
    と、 この合成パラメータフレーム時系列生成手段により生成
    された合成パラメータフレームの時系列から、前記声質
    選択手段により選択指定された声質に応じて定められる
    第2のフレーム周期で離散音声信号を合成する合成手段
    と、 この合成手段によって合成された離散音声信号を前記声
    質選択手段により選択指定された声質に応じて定められ
    る第2の標本周期でアナログ音声信号に変換するディジ
    タル/アナログ変換手段とを具備することを特徴とする
    音声合成装置。
  52. 【請求項52】 第1の標本周期で標本化した離散音声
    信号に第1のフレーム周期の時間窓をかけて分析して得
    られる音声の特徴パラメータフレームの時系列から所定
    の合成単位で切り出した音声素片を音声素片蓄積手段に
    複数蓄積しておき、前記音声素片蓄積手段から入力音韻
    情報に基づいて前記音声素片を選択し接続して合成パラ
    メータフレームの時系列を生成し、この生成した合成パ
    ラメータフレームの時系列から離散音声信号を合成する
    音声合成方法において、 合成する音声の声質の選択指定の受け付けを行い、 前記合成パラメータフレームの時系列から離散音声信号
    を合成する合成処理を、前記受け付けた声質に応じて定
    められる第2のフレーム周期で行うと共に、 前記合成した離散音声信号を前記受け付けた声質に応じ
    て定められる第2の標本周期でアナログ音声信号に変換
    することを特徴とする音声合成方法。
  53. 【請求項53】 第1の標本周期で標本化した離散音声
    信号に第1のフレーム周期の時間窓をかけて分析して得
    られる音声の特徴パラメータフレームの時系列から所定
    の合成単位で切り出した音声素片を複数蓄積する音声素
    片蓄積手段と、 この音声素片蓄積手段から入力音韻情報に基づいて前記
    音声素片を選択し接続して合成パラメータフレームの時
    系列を生成する合成パラメータフレーム時系列生成手段
    と、 この合成パラメータフレーム時系列生成手段により生成
    された合成パラメータフレームの時系列から、前記第1
    のフレーム周期、前記第1の標本周期及び前記第1の標
    本周期とは異なる第2の標本周期をもとに 第2のフレーム周期=第1のフレーム周期×第1の標本
    周期/第2の標本周期 で定められる第2のフレーム周期で離散音声信号を合成
    する合成手段と、 この合成手段によって合成された離散音声信号を前記第
    2の標本周期でアナログ音声信号に変換するディジタル
    /アナログ変換手段とを具備することを特徴とする音声
    合成装置。
  54. 【請求項54】 第1の標本周期で標本化した離散音声
    信号に第1のフレーム周期の時間窓をかけて分析して得
    られる音声の特徴パラメータフレームの時系列から所定
    の合成単位で切り出した音声素片を音声素片蓄積手段に
    複数蓄積しておき、 前記音声素片蓄積手段から入力音韻情報に基づいて前記
    音声素片を選択し接続して合成パラメータフレームの時
    系列を生成し、 この生成した合成パラメータフレームの時系列から、前
    記第1のフレーム周期、前記第1の標本周期及び前記第
    1の標本周期とは異なる第2の標本周期をもとに 第2のフレーム周期=第1のフレーム周期×第1の標本
    周期/第2の標本周期 で定められる第2のフレーム周期で離散音声信号を合成
    し、 この合成した離散音声信号を前記第2の標本周期でアナ
    ログ音声信号へ変換することを特徴とする音声合成方
    法。
  55. 【請求項55】 韻律情報と音韻情報を入力として第1
    の標本周期で標本化した離散音声信号から作成した音声
    素片を複数蓄積する音声素片蓄積手段と、 前記韻律情報から音声の基本周波数パターンを生成する
    ピッチパターン生成手段と、 前記音韻情報に基づいて前記音声素片蓄積手段から音声
    素片を選択的に読み出し接続することによって音声の音
    韻パラメータを生成する音韻パラメータ生成手段と、 この音韻パラメータ生成手段によって生成された音韻パ
    ラメータと前記ピッチパターン生成手段によって生成さ
    れた基本周波数パターンから離散音声信号を合成する合
    成手段と、 この合成手段によって合成された離散音声信号をアナロ
    グ音声信号に変換するディジタル/アナログ変換手段で
    あって、前記アナログ音声信号への変換を前記第1の標
    本周期または前記第1の標本周期とは異なる第2の標本
    周期で選択的に行うことが可能なディジタル/アナログ
    変換手段とを具備し、 前記ピッチパターン生成手段は、前記ディジタル/アナ
    ログ変換手段にて前記第2の標本周期でアナログ音声信
    号への変換が行われる際には、前記第1の標本周期でア
    ナログ音声信号への変換が行われるときとは異なる基本
    周波数パターンとなるよう前記基本周波数パターンを生
    成するように構成されていることを特徴とする音声合成
    装置。
  56. 【請求項56】 韻律情報と音韻情報を入力として第1
    の標本周期で標本化した離散音声信号から作成した音声
    素片を音声素片蓄積手段に複数蓄積しておき、前記韻律
    情報から音声の基本周波数パターンを生成すると共に、
    前記音韻情報に基づいて前記音声素片蓄積手段から音声
    素片を選択的に読み出し接続することによって音声の音
    韻パラメータを生成し、この生成した音韻パラメータと
    基本周波数パターンから離散音声信号を合成し、この合
    成した離散音声信号をアナログ音声信号に変換する音声
    合成方法において、 前記アナログ音声信号への変換を前記第1の標本周期で
    行う第1のモードと前記第1の標本周期とは異なる第2
    の標本周期で行う第2のモードとを用意し、 前記第2のモード時の合成処理に用いる基本周波数パタ
    ーンが、前記第1のモード時の合成処理に用いると基本
    周波数パターンとは異なるよう前記基本周波数パターン
    を生成するようにしたことを特徴とする音声合成方法。
  57. 【請求項57】 韻律情報と音韻情報を入力として第1
    の標本周期で標本化した離散音声信号から作成した音声
    素片を複数蓄積する音声素片蓄積手段と、 前記第1の標本周期及び前記第1の標本周期とは異なる
    第2の標本周期に基づいて前記韻律情報から音声の基本
    周波数パターンを生成するピッチパターン生成手段と、 前記音韻情報に基づいて前記音声素片蓄積手段から音声
    素片を選択的に読み出し接続することによって音声の音
    韻パラメータを生成する音韻パラメータ生成手段と、 この音韻パラメータ生成手段によって生成された音韻パ
    ラメータと前記ピッチパターン生成手段によって生成さ
    れた基本周波数パターンから離散音声信号を合成する合
    成手段と、 この合成手段によって合成された離散音声信号を前記第
    2の標本周期でアナログ音声信号に変換するディジタル
    /アナログ変換手段とを具備することを特徴とする音声
    合成装置。
  58. 【請求項58】 韻律情報と音韻情報を入力として第1
    の標本周期で標本化した離散音声信号から作成した音声
    素片を音声素片蓄積手段に複数蓄積しておき、 前記第1の標本周期及び前記第1の標本周期とは異なる
    第2の標本周期に基づいて前記韻律情報から音声の基本
    周波数パターンを生成すると共に、前記音韻情報に基づ
    いて前記音声素片蓄積手段から音声素片を選択的に読み
    出し接続することによって音声の音韻パラメータを生成
    し、 この生成した音韻パラメータと基本周波数パターンから
    離散音声信号を合成し、 この合成した離散音声信号を前記第2の標本周期でアナ
    ログ音声信号に変換することを特徴とする音声合成方
    法。
  59. 【請求項59】 韻律情報と音韻情報を入力として第1
    の標本周期で標本化した離散音声信号から作成した音声
    素片を複数蓄積する音声素片蓄積手段と、 合成する音声の声質を選択指定するための声質選択手段
    と、 この声質選択手段により選択指定された声質に応じて前
    記韻律情報から音声の基本周波数パターンを生成するピ
    ッチパターン生成手段と、 前記音韻情報に基づいて前記音声素片蓄積手段から音声
    素片を選択的に読み出し接続することによって音声の音
    韻パラメータを生成する音韻パラメータ生成手段と、 この音韻パラメータ生成手段によって生成された音韻パ
    ラメータと前記ピッチパターン生成手段によって生成さ
    れた基本周波数パターンから離散音声信号を合成する合
    成手段と、 この合成手段によって合成された離散音声信号を前記声
    質選択手段により選択指定された声質に応じて定められ
    る第2の標本周期でアナログ音声信号に変換するディジ
    タル/アナログ変換手段とを具備することを特徴とする
    音声合成装置。
  60. 【請求項60】 韻律情報と音韻情報を入力として第1
    の標本周期で標本化した離散音声信号から作成した音声
    素片を音声素片蓄積手段に複数蓄積しておき、前記韻律
    情報から音声の基本周波数パターンを生成すると共に、
    前記音韻情報に基づいて前記音声素片蓄積手段から音声
    素片を選択的に読み出し接続することによって音声の音
    韻パラメータを生成し、この生成した音韻パラメータと
    基本周波数パターンから離散音声信号を合成する音声合
    成方法において、 合成する音声の声質の選択指定の受け付けを行い、 合成処理に用いる前記基本周波数パターンを前記受け付
    けた声質に応じて前記韻律情報から生成すると共に、 前記合成した離散音声信号を前記受け付けた声質に応じ
    て定められる第2の標本周期でアナログ音声信号に変換
    することを特徴とする音声合成方法。
  61. 【請求項61】 前記ピッチパターン生成手段は、前記
    ディジタル/アナログ変換手段にて前記第2の標本周期
    でアナログ音声信号への変換が行われる際には、前記第
    1の標本周期でアナログ音声信号への変換が行われると
    きに生成する基本周波数パターンに対して、基本周波数
    が(第2の標本周期/第1の標本周期)倍の基本周波数
    パターンを生成することを特徴とする請求項55記載の
    音声合成装置。
  62. 【請求項62】 前記第2のモード時の合成処理に用い
    る基本周波数パターンを、その基本周波数が、前記第1
    のモード時の合成処理に用いる基本周波数パターンの基
    本周波数の(第2の標本周期/第1の標本周期)倍とな
    るよう生成することを特徴とする請求項56記載の音声
    合成方法。
  63. 【請求項63】 第1の標本周期で標本化した離散音声
    信号を分析して得られる音声の特徴パラメータを蓄積す
    る蓄積手段と、 この蓄積手段より読み出した音声の特徴パラメータを入
    力として離散音声信号を合成する合成手段と、 この合成手段によって合成された離散音声信号の標本周
    期を前記第1の標本周期とは異なる第2の標本周期に変
    換する標本周期変換手段と、 この標本周期変換手段により標本周期が変換された離散
    音声信号を前記第2の標本周期とは異なる第3の標本周
    期でアナログ音声信号に変換するディジタル/アナログ
    変換手段とを具備することを特徴とする音声合成装置。
  64. 【請求項64】 第1の標本周期で標本化した離散音声
    信号を分析して得られる音声の特徴パラメータを蓄積手
    段に蓄積しておき、前記蓄積手段より読み出した音声の
    特徴パラメータを入力として離散音声信号を合成する音
    声合成方法において、 前記合成した離散音声信号の標本周期を前記第1の標本
    周期とは異なる第2の標本周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第2の標本周期とは異なる第3の標本周期でアナ
    ログ音声信号に変換することを特徴とする音声合成方
    法。
  65. 【請求項65】 第1の標本周期で標本化した離散音声
    信号を分析して得られる音声の特徴パラメータを蓄積す
    る蓄積手段と、 この蓄積手段より読み出した音声の特徴パラメータを入
    力として離散音声信号を合成する合成手段と、 合成する音声の声質を選択指定するための声質選択手段
    と、 前記合成手段によって合成された離散音声信号の標本周
    期を前記声質選択手段により選択指定された声質に応じ
    て定められる第2の標本周期に変換する標本周期変換手
    段と、 この標本周期変換手段によって標本周期が変換された離
    散音声信号を前記第2の標本周期とは異なる(但し、第
    2の標本周期が第1の標本周期に一致する場合を除く)
    第3の標本周期でアナログ音声信号に変換するディジタ
    ル/アナログ変換手段とを具備することを特徴とする音
    声合成装置。
  66. 【請求項66】 第1の標本周期で標本化した離散音声
    信号を分析して得られる音声の特徴パラメータを蓄積手
    段に蓄積しておき、前記蓄積手段より読み出した音声の
    特徴パラメータを入力として離散音声信号を合成する音
    声合成方法において、 合成する音声の声質の選択指定の受け付けを行い、 前記合成した離散音声信号の標本周期を前記受け付けた
    声質に応じて定められる第2の標本周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第2の標本周期とは異なる(但し、第2の標本周
    期が第1の標本周期に一致する場合を除く)第3の標本
    周期でアナログ音声信号に変換することを特徴とする音
    声合成方法。
  67. 【請求項67】 第1の標本周期で標本化した離散音声
    信号に第1のフレーム周期で時間窓をかけて分析して得
    られる音声の特徴パラメータフレームの時系列から、前
    記第1のフレーム周期とは異なる第2のフレーム周期で
    離散音声信号を合成する合成手段と、 この合成手段によって合成された離散音声信号の標本周
    期を前記第1の標本周期とは異なる第2の標本周期に変
    換する標本周期変換手段と、 この標本周期変換手段によって標本周期が変換された離
    散音声信号を前記第2の標本周期とは異なる第3の標本
    周期でアナログ音声信号に変換するディジタル/アナロ
    グ変換手段とを具備することを特徴とする音声合成装
    置。
  68. 【請求項68】 第1の標本周期で標本化した離散音声
    信号に第1のフレーム周期で時間窓をかけて分析して得
    られる音声の特徴パラメータフレームの時系列から、前
    記第1のフレーム周期とは異なる第2のフレーム周期で
    離散音声信号を合成し、 この第2のフレーム周期で合成した離散音声信号の標本
    周期を前記第1の標本周期とは異なる第2の標本周期に
    変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第2の標本周期とは異なる第3の標本周期でアナ
    ログ音声信号に変換することを特徴とする音声合成方
    法。
  69. 【請求項69】 第1の標本周期で標本化した離散音声
    信号に第1のフレーム周期で時間窓をかけて分析して得
    られる音声の特徴パラメータフレームの時系列から、前
    記第1のフレーム周期、前記第1の標本周期とは異なる
    第2の標本周期及び前記第2の標本周期とは異なる第3
    の標本周期に基づいて定められる第2のフレーム周期で
    離散音声信号を合成する合成手段と、 この合成手段によって合成された離散音声信号の標本周
    期を前記第2の標本周期に変換する標本周期変換手段
    と、 この標本周期変換手段によって標本周期が変換された離
    散音声信号を前記第3の標本周期でアナログ音声信号に
    変換するディジタル/アナログ変換手段とを具備するこ
    とを特徴とする音声合成装置。
  70. 【請求項70】 第1の標本周期で標本化した離散音声
    信号に第1のフレーム周期で時間窓をかけて分析して得
    られる音声の特徴パラメータフレームの時系列から、前
    記第1のフレーム周期、前記第1の標本周期とは異なる
    第2の標本周期及び前記第2の標本周期とは異なる第3
    の標本周期に基づいて定められる第2のフレーム周期で
    離散音声信号を合成し、 この第2のフレーム周期で合成した離散音声信号の標本
    周期を前記第2の標本周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第3の標本周期でアナログ音声信号に変換するこ
    とを特徴とする音声合成方法。
  71. 【請求項71】第1の標本周期で標本化した離散音声信
    号に第1のフレーム周期で時間窓をかけて分析して得ら
    れる音声の特徴パラメータフレームの時系列を蓄積する
    蓄積手段と、 合成する音声の声質を選択指定するための声質選択手段
    と、 前記蓄積手段より読み出した特徴パラメータフレームの
    時系列から、前記声質選択手段により選択指定された声
    質に応じて定められる第2のフレーム周期で離散音声信
    号を合成する合成手段と、 この合成手段によって合成された離散音声信号の標本周
    期を前記声質選択手段により選択指定された声質に応じ
    て定められる第2の標本周期に変換する標本周期変換手
    段と、 この標本周期変換手段によって標本周期が変換された離
    散音声信号を前記第2の標本周期とは異なる(但し、第
    2の標本周期が第1の標本周期に一致する場合を除く)
    第3の標本周期でアナログ音声信号に変換するディジタ
    ル/アナログ変換手段とを具備することを特徴とする音
    声合成装置。
  72. 【請求項72】 第1の標本周期で標本化した離散音声
    信号に第1のフレーム周期で時間窓をかけて分析して得
    られる音声の特徴パラメータフレームの時系列を蓄積手
    段に蓄積しておき、前記蓄積手段より読み出した特徴パ
    ラメータフレームの時系列から離散音声信号を合成する
    音声合成方法において、 合成する音声の声質の選択指定を受け付け、 前記特徴パラメータフレームの時系列からの離散音声信
    号の合成処理を、前記受け付けた声質に応じて定められ
    る第2のフレーム周期で行い、 この第2のフレーム周期で合成した離散音声信号の標本
    周期を前記受け付けた声質に応じて定められる第2の標
    本周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第2の標本周期とは異なる(但し、第2の標本周
    期が第1の標本周期に一致する場合を除く)第3の標本
    周期でアナログ音声信号に変換することを特徴とする音
    声合成方法。
  73. 【請求項73】 第1の標本周期で標本化した離散音声
    信号に第1のフレーム周期で時間窓をかけて分析して得
    られる音声の特徴パラメータフレームの時系列から、前
    記第1のフレーム周期、前記第1の標本周期とは異なる
    第2の標本周期及び前記第2の標本周期とは異なる第3
    の標本周期をもとに 第2のフレーム周期=第1のフレーム周期×第2の標本
    周期/第3の標本周期 で定められる第2のフレーム周期で離散音声信号を合成
    する合成手段と、 この合成手段によって合成された離散音声信号の標本周
    期を前記第2の標本周期に変換する標本周期変換手段
    と、 この標本周期変換手段によって標本周期が変換された離
    散音声信号を前記第3の標本周期でアナログ音声信号に
    変換するディジタル/アナログ変換手段とを具備するこ
    とを特徴とする音声合成装置。
  74. 【請求項74】 第1の標本周期で標本化した離散音声
    信号に第1のフレーム周期で時間窓をかけて分析して得
    られる音声の特徴パラメータフレームの時系列から、前
    記第1のフレーム周期、前記第1の標本周期とは異なる
    第2の標本周期及び前記第2の標本周期とは異なる第3
    の標本周期をもとに 第2のフレーム周期=第1のフレーム周期×第2の標本
    周期/第3の標本周期 で定められる第2のフレーム周期で離散音声信号を合成
    し、 この第2のフレーム周期で合成した離散音声信号の標本
    周期を前記第2の標本周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第3の標本周期でアナログ音声信号に変換するこ
    とを特徴とする音声合成方法。
  75. 【請求項75】 第1の標本周期で標本化した離散音声
    信号を分析して得られる音声の特徴パラメータを蓄積す
    る特徴パラメータ蓄積手段と、 音声の基本周波数パターンを蓄積するピッチパターン蓄
    積手段と、 前記特徴パラメータ蓄積手段から読み出した特徴パラメ
    ータと前記ピッチパターン蓄積手段から読み出した基本
    周波数パターンとから離散音声信号を合成する合成手段
    と、 この合成手段によって合成された離散音声信号の標本周
    期を変換するための標本周期変換手段であって、前記第
    1の標本周期または前記第1の標本周期とは異なる第2
    の標本周期への変換を選択的に行うことが可能な標本周
    期変換手段と、 この標本周期変換手段により標本周期が変換された離散
    音声信号を前記第2の標本周期とは異なる第3の標本周
    期でアナログ音声信号に変換するディジタル/アナログ
    変換手段と、 前記標本周期変換手段にて前記第2の標本周期への標本
    周期変換が行われる際には、前記ピッチパターン蓄積手
    段から読み出した基本周波数パターンとは異なる基本周
    波数パターンを生成して前記合成手段に与えるピッチパ
    ターン生成手段とを具備することを特徴とする音声合成
    装置。
  76. 【請求項76】 第1の標本周期で標本化した離散音声
    信号を分析して得られる音声の特徴パラメータを特徴パ
    ラメータ蓄積手段に蓄積しておくと共に、音声の基本周
    波数パターンをピッチパターン蓄積手段に蓄積してお
    き、前記特徴パラメータ蓄積手段から読み出した特徴パ
    ラメータと前記ピッチパターン蓄積手段から読み出した
    基本周波数パターンとから離散音声信号を合成する音声
    合成方法において、 前記合成した離散音声信号の標本周期を前記第1の標本
    周期のままとする第1のモードと前記第1の標本周期と
    は異なる第2の標本周期とする第2のモードとを用意
    し、 前記第2のモード時には、 前記ピッチパターン蓄積手段から読み出した基本周波数
    パターンとは異なる基本周波数パターンを生成して前記
    離散音声信号の合成に用い、 この合成した離散音声信号の標本周期を前記第2の標本
    周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第2の標本周期とは異なる第3の標本周期でアア
    ナログ音声信号に変換することを特徴とする音声合成方
    法。
  77. 【請求項77】 第1の標本周期で標本化した離散音声
    信号を分析して得られる音声の特徴パラメータを蓄積す
    る特徴パラメータ蓄積手段と、 音声の基本周波数パターンを蓄積するピッチパターン蓄
    積手段と、 前記ピッチパターン蓄積手段から読み出した基本周波数
    パターンを前記第1の標本周期とは異なる第2の標本周
    期及び前記第2の標本周期とは異なる第3の標本周期に
    基づいて変調するピッチパターン変調手段と、 前記特徴パラメータ蓄積手段から読み出した特徴パラメ
    ータと前記ピッチパターン変調手段にて変調された基本
    周波数パターンとから離散音声信号を合成する合成手段
    と、 この合成手段によって合成された離散音声信号の標本周
    期を前記第2の標本周期に変換する標本周期変換手段
    と、 この標本周期変換手段によって標本周期が変換された離
    散音声信号を前記第3の標本周期でアナログ音声信号に
    変換するディジタル/アナログ変換手段とを具備するこ
    とを特徴とする音声合成装置。
  78. 【請求項78】 第1の標本周期で標本化した離散音声
    信号を分析して得られる音声の特徴パラメータを特徴パ
    ラメータ蓄積手段に蓄積しておくと共に、音声の基本周
    波数パターンをピッチパターン蓄積手段に蓄積してお
    き、 前記ピッチパターン蓄積手段から読み出した基本周波数
    パターンを第1の標本周期とは異なる第2の標本周期及
    び前記第2の標本周期とは異なる第3の標本周期に基づ
    いて変調し、 前記特徴パラメータ蓄積手段から読み出した特徴パラメ
    ータと前記ピッチ変調した基本周波数パターンとから離
    散音声信号を合成し、 この合成した離散音声信号の標本周期を前記第2の標本
    周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第3の標本周期でアナログ音声信号に変換するこ
    とを特徴とする音声合成方法。
  79. 【請求項79】 第1の標本周期で標本化した離散音声
    信号を分析して得られる音声の特徴パラメータを蓄積す
    る特徴パラメータ蓄積手段と、 音声の基本周波数パターンを蓄積するピッチパターン蓄
    積手段と、 合成する音声の声質を選択指定するための声質選択手段
    と、 前記ピッチパターン蓄積手段から読み出した基本周波数
    パターンを対象に、前記声質選択手段により選択指定さ
    れた声質に応じた変調を行うピッチパターン変調手段
    と、 前記特徴パラメータ蓄積手段から読み出した特徴パラメ
    ータと前記ピッチパターン変調手段にて変調された基本
    周波数パターンとから離散音声信号を合成する合成手段
    と、 この合成手段によって合成された離散音声信号の標本周
    期を前記声質選択手段により選択指定された声質に応じ
    て定められる第2の標本周期に変換する標本周期変換手
    段と、 この標本周期変換手段によって標本周期が変換された離
    散音声信号を前記第2の標本周期とは異なる(但し、第
    2の標本周期が第1の標本周期に一致する場合を除く)
    第3の標本周期でアナログ音声信号に変換するディジタ
    ル/アナログ変換手段とを具備することを特徴とする音
    声合成装置。
  80. 【請求項80】 第1の標本周期で標本化した離散音声
    信号を分析して得られる音声の特徴パラメータを特徴パ
    ラメータ蓄積手段に蓄積しておくと共に、音声の基本周
    波数パターンをピッチパターン蓄積手段に蓄積してお
    き、前記特徴パラメータ蓄積手段から読み出した特徴パ
    ラメータと前記ピッチパターン蓄積手段から読み出した
    基本周波数パターンとに基づく離散音声信号の合成を行
    う音声合成方法において、 合成する音声の声質の選択指定を受け付け、 前記ピッチパターン蓄積手段から読み出した基本周波数
    パターンを対象に、前記受け付けた声質に応じた変調を
    行い、 前記特徴パラメータ蓄積手段から読み出した特徴パラメ
    ータと前記変調された基本周波数パターンとから離散音
    声信号を合成し、 この合成した離散音声信号の標本周期を前記受け付けた
    声質に応じて定められる第2の標本周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第2の標本周期とは異なる(但し、第2の標本周
    期が第1の標本周期に一致する場合を除く)第3の標本
    周期でアナログ音声信号に変換することを特徴とする音
    声合成方法。
  81. 【請求項81】 第1の標本周期で標本化した離散音声
    信号を分析して得られる音声の特徴パラメータを蓄積す
    る特徴パラメータ蓄積手段と、 音声の基本周波数パターンを蓄積するピッチパターン蓄
    積手段と、 前記ピッチパターン蓄積手段から読み出した基本周波数
    パターンを、前記第1の標本周期とは異なる第2の標本
    周期及び前記第2の標本周期とは異なる第3の標本周期
    をもとに(第3の標本周期/第2の標本周期)倍に変調
    するピッチパターン変調手段と、 前記特徴パラメータ蓄積手段から読み出した特徴パラメ
    ータと前記ピッチパターン変調手段にて変調された基本
    周波数パターンとから離散音声信号を合成する合成手段
    と、 この合成手段によって合成された離散音声信号の標本周
    期を前記第2の標本周期に変換する標本周期変換手段
    と、 この標本周期変換手段によって標本周期が変換された離
    散音声信号を前記第3の標本周期でアナログ音声信号に
    変換するディジタル/アナログ変換手段とを具備するこ
    とを特徴とする音声合成装置。
  82. 【請求項82】 第1の標本周期で標本化した離散音声
    信号を分析して得られる音声の特徴パラメータを特徴パ
    ラメータ蓄積手段に蓄積しておくと共に、音声の基本周
    波数パターンをピッチパターン蓄積手段に蓄積してお
    き、 前記ピッチパターン蓄積手段から読み出した基本周波数
    パターンを、前記第1の標本周期とは異なる第2の標本
    周期及び前記第2の標本周期とは異なる第3の標本周期
    をもとに(第3の標本周期/第2の標本周期)倍に変調
    し、 前記特徴パラメータ蓄積手段から読み出した特徴パラメ
    ータと前記変調された基本周波数パターンとから離散音
    声信号を合成し、 この合成した離散音声信号の標本周期を前記第2の標本
    周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第3の標本周期でアナログ音声信号に変換するこ
    とを特徴とする音声合成方法。
  83. 【請求項83】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し接続することによって離散音声信号を合成
    し、この合成した離散音声信号の標本周期を前記第1の
    標本周期とは異なる第2の標本周期に変換する音声合成
    手段と、 この音声合成手段によって合成され且つ標本周期が変換
    された離散音声信号を前記第2の標本周期とは異なる第
    3の標本周期でアナログ音声信号に変換するディジタル
    /アナログ変換手段とを具備することを特徴とする音声
    合成装置。
  84. 【請求項84】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し接続することによって離散音声信号を合成
    し、 この合成した離散音声信号の標本周期を前記第1の標本
    周期とは異なる第2の標本周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第2の標本周期とは異なる第3の標本周期でアナ
    ログ音声信号に変換することを特徴とする音声合成方
    法。
  85. 【請求項85】 合成する音声の声質を選択指定するた
    めの声質選択手段と、 第1の標本周期で標本化した離散音声信号から作成した
    音声素片を、与えられた音韻情報に基づいて選択し接続
    することによって離散音声信号を合成する音声合成手段
    であって、前記合成した離散音声信号の標本周期を前記
    声質選択手段により選択指定された声質に応じて定めら
    れる第2の標本周期に変換する音声合成手段と、 この音声合成手段から出力される離散音声信号を前記第
    2の標本周期とは異なる(但し、第2の標本周期が第1
    の標本周期に一致する場合を除く)第3の標本周期でア
    ナログ音声信号に変換するディジタル/アナログ変換手
    段とを具備することを特徴とする音声合成装置。
  86. 【請求項86】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し接続することによって離散音声信号を合成
    する音声合成方法において、 合成する音声の声質の選択指定の受け付けを行い、 前記合成した離散音声信号の標本周期を前記受け付けた
    声質に応じて定められる第2の標本周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第2の標本周期とは異なる(但し、第2の標本周
    期が第1の標本周期に一致する場合を除く)第3の標本
    周期でアナログ音声信号に変換することを特徴とする音
    声合成方法。
  87. 【請求項87】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し、この選択した音声素片を、合成される音
    声の発話速度または発話時間に関係する発話速度パラメ
    ータに応じて接続することによって離散音声信号を合成
    する音声合成手段であって、前記合成した離散音声信号
    の標本周期を前記第1の標本周期とは異なる第2の標本
    周期に変換することが可能な音声合成手段と、 この音声合成手段から出力される離散音声信号を前記第
    2の標本周期とは異なる第3の標本周期でアナログ音声
    信号に変換するディジタル/アナログ変換手段とを具備
    し、 前記音声合成手段は、前記第2の標本周期への標本周期
    変換を行う際の合成処理には、標本周期の変換を行わな
    いときとは異なる値の前記発話速度パラメータを用いる
    ように構成されていることを特徴とする音声合成装置。
  88. 【請求項88】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し、この選択した音声素片を、合成される音
    声の発話速度または発話時間に関係する発話速度パラメ
    ータに応じて接続することによって離散音声信号を合成
    する音声合成方法において、 前記合成した離散音声信号の標本周期を前記第1の標本
    周期のままとする第1のモードと前記第1の標本周期と
    は異なる第2の標本周期とする第2のモードとを用意
    し、 前記第2のモード時には、 前記第1のモード時とは異なる値の前記発話速度パラメ
    ータを用いて前記離散音声信号を合成して、この合成し
    た離散音声信号の標本周期を前記第2の標本周期に変換
    し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第2の標本周期とは異なる第3の標本周期でアナ
    ログ音声信号に変換することを特徴とする音声合成方
    法。
  89. 【請求項89】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し、この選択した音声素片を、合成される音
    声の発話速度または発話時間に関係する発話速度パラメ
    ータに応じて接続することによって離散音声信号を合成
    する音声合成手段であって、前記合成した離散音声信号
    の標本周期を前記第1の標本周期とは異なる第2の標本
    周期に変換することが可能な音声合成手段と、 この音声合成手段から出力される離散音声信号を前記第
    2の標本周期とは異なる第3の標本周期でアナログ音声
    信号に変換するディジタル/アナログ変換手段とを具備
    し、 前記音声合成手段は、使用する前記発話速度パラメータ
    を前記第2の標本周期及び前記第3の標本周期に基づい
    て決定するように構成されていることを特徴とする音声
    合成装置。
  90. 【請求項90】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し、この選択した音声素片を、合成される音
    声の発話速度または発話時間に関係する発話速度パラメ
    ータに応じて接続することによって離散音声信号を合成
    する音声合成方法において、 前記合成した離散音声信号の標本周期を前記第1の標本
    周期のままとする第1のモードと前記第1の標本周期と
    は異なる第2の標本周期とする第2のモードとを用意
    し、 前記第2のモード時には、 使用する前記発話速度パラメータを前記第2の標本周期
    及び前記第2の標本周期とは異なる第3の標本周期に基
    づいて決定して前記離散音声信号を合成した後、この合
    成した離散音声信号の標本周期を前記第2の標本周期に
    変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第3の標本周期でアナログ音声信号に変換するこ
    とを特徴とする音声合成方法。
  91. 【請求項91】 合成する音声の声質を選択指定するた
    めの声質選択手段と、 第1の標本周期で標本化した離散音声信号から作成した
    音声素片を、与えられた音韻情報に基づいて選択し、こ
    の選択した音声素片を、合成される音声の発話速度また
    は発話時間に関係する発話速度パラメータに応じて接続
    することによって離散音声信号を合成する音声合成手段
    であって、前記合成した離散音声信号の標本周期を前記
    声質選択手段により選択指定された声質に応じて定めら
    れる第2の標本周期に変換する音声合成手段と、 前記音声合成手段から出力される離散音声信号を前記第
    2の標本周期とは異なる(但し、第2の標本周期が第1
    の標本周期に一致する場合を除く)第3の標本周期でア
    ナログ音声信号に変換するディジタル/アナログ変換手
    段とを具備し、 前記音声合成手段は、使用する前記発話速度パラメータ
    を前記声質選択手段により選択指定された声質に応じて
    決定するように構成されていることを特徴とする音声合
    成装置。
  92. 【請求項92】 第1の標本周期で標本化した離散音声
    信号から作成した音声素片を、与えられた音韻情報に基
    づいて選択し、この選択した音声素片を、合成される音
    声の発話速度または発話時間に関係する発話速度パラメ
    ータに応じて接続することによって離散音声信号を合成
    する音声合成方法において、 合成する音声の声質の選択指定の受け付けを行い、 使用する前記発話速度パラメータを前記受け付けた声質
    に応じて決定して前記離散音声信号を合成した後、この
    合成した離散音声信号の標本周期を前記受け付けた声質
    に応じて定められる第2の標本周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第2の標本周期とは異なる(但し、第2の標本周
    期が第1の標本周期に一致する場合を除く)第3の標本
    周期でアナログ音声信号に変換することを特徴とする音
    声合成方法。
  93. 【請求項93】 与えられた音韻情報に含まれる各音韻
    の継続時間を決定する一方、第1の標本周期で標本化し
    た離散音声信号から作成した音声素片を前記音韻情報に
    基づいて選択し、前記決定した各音韻の継続時間に基づ
    いて前記選択した音声素片を接続することによって離散
    音声信号を合成する音声合成手段であって、前記合成し
    た離散音声信号の標本周期を前記第1の標本周期とは異
    なる第2の標本周期に変換することが可能な音声合成手
    段と、 この音声合成手段から出力される離散音声信号を前記第
    2の標本周期とは異なる第3の標本周期でアナログ音声
    信号に変換するディジタル/アナログ変換手段とを具備
    し、 前記音声合成手段は、前記第2の標本周期への標本周期
    変換を行う際の合成処理では、標本周期変換を行わない
    ときとは異なる音韻継続時間となるよう前記音韻継続時
    間の決定を行うように構成されていることを特徴とする
    音声合成装置。
  94. 【請求項94】 与えられた音韻情報に含まれる各音韻
    の継続時間を決定する一方、第1の標本周期で標本化し
    た離散音声信号から作成した音声素片を前記音韻情報に
    基づいて選択し、前記決定した各音韻の継続時間に基づ
    いて前記選択した音声素片を接続することによって離散
    音声信号を合成する音声合成方法において、 前記合成した離散音声信号の標本周期を前記第1の標本
    周期のままとする第1のモードと前記第1の標本周期と
    は異なる第2の標本周期とする第2のモードとを用意
    し、 前記第2のモード時には、 前記第1のモード時とは異なる音韻継続時間となるよう
    前記音韻継続時間の決定を行って前記離散音声信号の合
    成に用い、 前記合成した離散音声信号の標本周期を前記第2の標本
    周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第2の標本周期とは異なる第3の標本周期でアナ
    ログ音声信号に変換することを特徴とする音声合成方
    法。
  95. 【請求項95】 与えられた音韻情報に含まれる各音韻
    の継続時間を決定する一方、第1の標本周期で標本化し
    た離散音声信号から作成した音声素片を前記音韻情報に
    基づいて選択し、前記決定した各音韻の継続時間に基づ
    いて前記選択した音声素片を接続することによって離散
    音声信号を合成する音声合成手段であって、前記合成し
    た離散音声信号の標本周期を前記第1の標本周期とは異
    なる第2の標本周期に変換することが可能な音声合成手
    段と、 この音声合成手段から出力される離散音声信号を前記第
    2の標本周期とは異なる第3の標本周期でアナログ音声
    信号に変換するディジタル/アナログ変換手段とを具備
    し、 上記音声合成手段は、合成時に使用する前記音韻継続時
    間を前記第2の標本周期及び前記第3の標本周期に基づ
    いて決定するように構成されていることを特徴とする音
    声合成装置。
  96. 【請求項96】 与えられた音韻情報に含まれる各音韻
    の継続時間を決定する一方、第1の標本周期で標本化し
    た離散音声信号から作成した音声素片を前記音韻情報に
    基づいて選択し、前記決定した各音韻の継続時間に基づ
    いて前記選択した音声素片を接続することによって離散
    音声信号を合成する音声合成方法において、 合成時に使用する前記音韻継続時間を前記第1の標本周
    期とは異なる第2の標本周期及び前記第2の標本周期と
    は異なる第3の標本周期に基づいて決定すると共に、 前記合成した離散音声信号の標本周期を前記第2の標本
    周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第3の標本周期でアナログ音声信号に変換するこ
    とを特徴とする音声合成方法。
  97. 【請求項97】 合成する音声の声質を選択指定するた
    めの声質選択手段と、 与えられた音韻情報に含まれる各音韻の継続時間を決定
    する一方、第1の標本周期で標本化した離散音声信号か
    ら作成した音声素片を前記音韻情報に基づいて選択し、
    前記決定した各音韻の継続時間に基づいて前記選択した
    音声素片を接続することによって離散音声信号を合成す
    る音声合成手段であって、前記合成した離散音声信号の
    標本周期を前記声質選択手段により選択指定された声質
    に応じて定められる第2の標本周期に変換する音声合成
    手段と、 この音声合成手段から出力される離散音声信号を前記第
    2の標本周期とは異なる(但し、第2の標本周期が第1
    の標本周期に一致する場合を除く)第3の標本周期でア
    ナログ音声信号に変換するディジタル/アナログ変換手
    段とを具備し、 前記音声合成手段は、合成時に使用する前記音韻継続時
    間を前記声質選択手段により選択指定された声質に応じ
    て決定するように構成されていることを特徴とする音声
    合成装置。
  98. 【請求項98】 与えられた音韻情報に含まれる各音韻
    の継続時間を決定する一方、第1の標本周期で標本化し
    た離散音声信号から作成した音声素片を前記音韻情報に
    基づいて選択し、前記決定した各音韻の継続時間に基づ
    いて前記選択した音声素片を接続することによって離散
    音声信号を合成する音声合成方法において、 合成する音声の声質の選択指定の受け付けを行い、 使用する前記音韻継続時間を前記受け付けた声質に応じ
    て決定して前記離散音声信号を合成した後、この合成し
    た離散音声信号の標本周期を前記受け付けた声質に応じ
    て定められる第2の標本周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第2の標本周期とは異なる(但し、第2の標本周
    期が第1の標本周期に一致する場合を除く)第3の標本
    周期でアナログ音声信号に変換することを特徴とする音
    声合成方法。
  99. 【請求項99】 与えられた音韻情報に含まれる各音韻
    の継続時間を決定する一方、第1の標本周期で標本化し
    た離散音声信号から作成した音声素片を前記音韻情報に
    基づいて選択し、前記決定した各音韻の継続時間に基づ
    いて前記選択した音声素片を接続することによって離散
    音声信号を合成する音声合成手段であって、前記合成し
    た離散音声信号の標本周期を前記第1の標本周期とは異
    なる第2の標本周期に変換することが可能な音声合成手
    段と、 この音声合成手段から出力される離散音声信号を前記第
    2の標本周期とは異なる第3の標本周期でアナログ音声
    信号に変換するディジタル/アナログ変換手段とを具備
    し、 前記音声合成手段は、前記第2の標本周期への標本周期
    変換を行う際の合成処理には、標本周期の変換を行わな
    いときに決定される音韻継続時間の(第2の標本周期/
    第3の標本周期)倍の音韻継続時間を用いるように構成
    されていることを特徴とする音声合成装置。
  100. 【請求項100】 与えられた音韻情報に含まれる各音
    韻の継続時間を決定する一方、第1の標本周期で標本化
    した離散音声信号から作成した音声素片を前記音韻情報
    に基づいて選択し、前記決定した各音韻の継続時間に基
    づいて前記選択した音声素片を接続することによって離
    散音声信号を合成する音声合成方法において、 前記合成した離散音声信号の標本周期を前記第1の標本
    周期のままとする第1のモードと前記第1の標本周期と
    は異なる第2の標本周期とする第2のモードとを用意
    し、 前記第2のモード時には、 前記第2の標本周期及び前記第2の標本周期とは異なる
    第3の標本周期を用い、前記第1のモード時に決定され
    る音韻継続時間の(第2の標本周期/第3の標本周期)
    倍となるよう前記音韻継続時間の決定を行って前記離散
    音声信号の合成に用い、 前記合成した離散音声信号の標本周期を前記第2の標本
    周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第3の標本周期でアナログ音声信号に変換するこ
    とを特徴とする音声合成方法。
  101. 【請求項101】 第1の標本周期で標本化した離散音
    声信号から作成した音声素片を、与えられた音韻情報に
    基づいて選択し、この選択した音声素片を時間軸方向に
    伸縮させながら接続することによって離散音声信号を合
    成する音声合成手段であって、前記合成した離散音声信
    号の標本周期を前記第1の標本周期とは異なる第2の標
    本周期に変換することが可能な音声合成手段と、 この音声合成手段から出力される離散音声信号を前記第
    2の標本周期とは異なる第3の標本周期でアナログ音声
    信号に変換するディジタル/アナログ変換手段とを具備
    することを特徴とする音声合成装置。
  102. 【請求項102】 第1の標本周期で標本化した離散音
    声信号から作成した音声素片を、与えられた音韻情報に
    基づいて選択し、この選択した音声素片を時間軸方向に
    伸縮させながら接続することによって離散音声信号を合
    成し、 この合成した離散音声信号の標本周期を前記第1の標本
    周期とは異なる第2の標本周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第2の標本周期とは異なる第3の標本周期でアナ
    ログ音声信号に変換することを特徴とする音声合成方
    法。
  103. 【請求項103】 前記音声合成手段は、前記選択した
    音声素片を接続する際には、当該音声素片を前記第2の
    標本周期及び前記第3の標本周期に基づいて定められる
    度合いで時間軸方向に伸縮させながら接続することを特
    徴とする請求項101記載の音声合成装置。
  104. 【請求項104】 前記選択した音声素片を接続する際
    には、当該音声素片を前記第2の標本周期及び前記第3
    の標本周期に基づいて定められる度合いで時間軸方向に
    伸縮させながら接続することを特徴とする請求項102
    記載の音声合成方法。
  105. 【請求項105】 合成する音声の声質を選択指定する
    ための声質選択手段と、 第1の標本周期で標本化した離散音声信号から作成した
    音声素片を、与えられた音韻情報に基づいて選択し、こ
    の選択した音声素片を前記声質選択手段により選択指定
    された声質に応じて定められる度合いで時間軸方向に伸
    縮させながら接続することによって離散音声信号を合成
    する音声合成手段であって、前記合成した離散音声信号
    の標本周期を前記声質選択手段により選択指定された声
    質に応じて定められる第2の標本周期に変換する音声合
    成手段と、 この音声合成手段から出力される離散音声信号を前記第
    2の標本周期とは異なる(但し、第2の標本周期が第1
    の標本周期に一致する場合を除く)第3の標本周期でア
    ナログ音声信号に変換するディジタル/アナログ変換手
    段とを具備することを特徴とする音声合成装置。
  106. 【請求項106】 第1の標本周期で標本化した離散音
    声信号から作成した音声素片を、与えられた音韻情報に
    基づいて選択し、この選択した音声素片を接続すること
    によって離散音声信号を合成し、この合成した離散音声
    信号をアナログ音声信号に変換するする音声合成方法に
    おいて、 合成する音声の声質の選択指定の受け付けを行い、 前記選択した音声素片を接続する際には、当該音声素片
    を前記受け付けた声質に応じて定められる度合いで時間
    軸方向に伸縮させながら接続し、 前記離散音声信号を合成した際には、当該離散音声信号
    の標本周期を前記受け付けた声質に応じて定められる第
    2の標本周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第2の標本周期とは異なる(但し、第2の標本周
    期が第1の標本周期に一致する場合を除く)第3の標本
    周期でアナログ音声信号に変換することを特徴とする音
    声合成方法。
  107. 【請求項107】 前記音声合成手段は、前記選択した
    音声素片を接続する際には、当該音声素片を時間軸方向
    に(第2の標本周期/ 第3の標本周期)倍の大きさで伸
    縮させながら接続することを特徴とする請求項103記
    載の音声合成装置。
  108. 【請求項108】 前記選択した音声素片を接続する際
    には、当該音声素片を時間軸方向に(第2の標本周期/
    第3の標本周期)倍の大きさで伸縮させながら接続する
    ことを特徴とする請求項104記載の音声合成方法。
  109. 【請求項109】 第1の標本周期で標本化した離散音
    声信号に第1のフレーム周期の時間窓をかけて分析して
    得られる音声の特徴パラメータフレームの時系列から所
    定の合成単位で切り出した音声素片を複数蓄積する音声
    素片蓄積手段と、 この音声素片蓄積手段から入力音韻情報に基づいて前記
    音声素片を選択し接続して合成パラメータフレームの時
    系列を生成する合成パラメータフレーム時系列生成手段
    と、 この合成パラメータフレーム時系列生成手段により生成
    された合成パラメータフレームの時系列から前記第1の
    フレーム周期とは異なる第2のフレーム周期で離散音声
    信号を合成する合成手段と、 この合成手段によって合成された離散音声信号の標本周
    期を前記第1の標本周期とは異なる第2の標本周期に変
    換する標本周期変換手段と、 この標本周期変換手段によって標本周期が変換された離
    散音声信号を前記第2の標本周期とは異なる第3の標本
    周期でアナログ音声信号に変換するディジタル/アナロ
    グ変換手段とを具備することを特徴とする音声合成装
    置。
  110. 【請求項110】 第1の標本周期で標本化した離散音
    声信号に第1のフレーム周期の時間窓をかけて分析して
    得られる音声の特徴パラメータフレームの時系列から所
    定の合成単位で切り出した音声素片を音声素片蓄積手段
    に複数蓄積しておき、 前記音声素片蓄積手段から入力音韻情報に基づいて前記
    音声素片を選択し接続して合成パラメータフレームの時
    系列を生成し、 この生成した合成パラメータフレームの時系列から前記
    第1のフレーム周期とは異なる第2のフレーム周期で離
    散音声信号を合成し、 この第2のフレーム周期で合成した離散音声信号の標本
    周期を前記第1の標本周期とは異なる第2の標本周期に
    変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第2の標本周期とは異なる第3の標本周期でアナ
    ログ音声信号に変換することを特徴とする音声合成方
    法。
  111. 【請求項111】 第1の標本周期で標本化した離散音
    声信号に第1のフレーム周期の時間窓をかけて分析して
    得られる音声の特徴パラメータフレームの時系列から所
    定の合成単位で切り出した音声素片を複数蓄積する音声
    素片蓄積手段と、 この音声素片蓄積手段から入力音韻情報に基づいて前記
    音声素片を選択し接続して合成パラメータフレームの時
    系列を生成する合成パラメータフレーム時系列生成手段
    と、 この合成パラメータフレーム時系列生成手段により生成
    された合成パラメータフレームの時系列から、前記第1
    のフレーム周期、前記第1の標本周期とは異なる第2の
    標本周期及び前記第2の標本周期とは異なる第3の標本
    周期に基づいて定められる第2のフレーム周期で離散音
    声信号を合成する合成手段と、 この合成手段によって合成された離散音声信号の標本周
    期を前記第2の標本周期に変換する標本周期変換手段
    と、 この標本周期変換手段によって標本周期が変換された離
    散音声信号を前記第3の標本周期でアナログ音声信号に
    変換するディジタル/アナログ変換手段とを具備するこ
    とを特徴とする音声合成装置。
  112. 【請求項112】 第1の標本周期で標本化した離散音
    声信号に第1のフレーム周期の時間窓をかけて分析して
    得られる音声の特徴パラメータフレームの時系列から所
    定の合成単位で切り出した音声素片を音声素片蓄積手段
    に複数蓄積しておき、 前記音声素片蓄積手段から入力音韻情報に基づいて前記
    音声素片を選択し接続して合成パラメータフレームの時
    系列を生成し、 この生成した合成パラメータフレームの時系列から、前
    記第1のフレーム周期、前記第1の標本周期とは異なる
    第2の標本周期及び前記第2の標本周期とは異なる第3
    の標本周期に基づいて定められる第2のフレーム周期で
    離散音声信号を合成し、 この第2のフレーム周期で合成した離散音声信号の標本
    周期を前記第2の標本周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第3の標本周期でアナログ音声信号に変換するこ
    とを特徴とする音声合成方法。
  113. 【請求項113】 第1の標本周期で標本化した離散音
    声信号に第1のフレーム周期の時間窓をかけて分析して
    得られる音声の特徴パラメータフレームの時系列から所
    定の合成単位で切り出した音声素片を複数蓄積する音声
    素片蓄積手段と、 合成する音声の声質を選択指定するための声質選択手段
    と、 前記音声素片蓄積手段から入力音韻情報に基づいて前記
    音声素片を選択し接続して合成パラメータフレームの時
    系列を生成する合成パラメータフレーム時系列生成手段
    と、 この合成パラメータフレーム時系列生成手段により生成
    された合成パラメータフレームの時系列から、前記声質
    選択手段により選択指定された声質に応じて定められる
    第2のフレーム周期で離散音声信号を合成する合成手段
    と、 この合成手段によって合成された離散音声信号の標本周
    期を前記声質選択手段により選択指定された声質に応じ
    て定められる第2の標本周期に変換する標本周期変換手
    段と、 この標本周期変換手段によって標本周期が変換された離
    散音声信号を前記第2の標本周期とは異なる(但し、第
    2の標本周期が第1の標本周期に一致する場合を除く)
    第3の標本周期でアナログ音声信号に変換するディジタ
    ル/アナログ変換手段とを具備することを特徴とする音
    声合成装置。
  114. 【請求項114】 第1の標本周期で標本化した離散音
    声信号に第1のフレーム周期の時間窓をかけて分析して
    得られる音声の特徴パラメータフレームの時系列から所
    定の合成単位で切り出した音声素片を音声素片蓄積手段
    に複数蓄積しておき、前記音声素片蓄積手段から入力音
    韻情報に基づいて前記音声素片を選択し接続して合成パ
    ラメータフレームの時系列を生成し、この生成した合成
    パラメータフレームの時系列から離散音声信号を合成す
    る音声合成方法において、 合成する音声の声質の選択指定の受け付けを行い、 前記合成パラメータフレームの時系列から離散音声信号
    を合成する合成処理を、前記受け付けた声質に応じて定
    められる第2のフレーム周期で行うと共に、 前記合成した離散音声信号の標本周期を前記受け付けた
    声質に応じて定められる第2の標本周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第2の標本周期とは異なる(但し、第2の標本周
    期が第1の標本周期に一致する場合を除く)第3の標本
    周期でアナログ音声信号に変換することを特徴とする音
    声合成方法。
  115. 【請求項115】 第1の標本周期で標本化した離散音
    声信号に第1のフレーム周期の時間窓をかけて分析して
    得られる音声の特徴パラメータフレームの時系列から所
    定の合成単位で切り出した音声素片を複数蓄積する音声
    素片蓄積手段と、 この音声素片蓄積手段から入力音韻情報に基づいて前記
    音声素片を選択し接続して合成パラメータフレームの時
    系列を生成する合成パラメータフレーム時系列生成手段
    と、 この合成パラメータフレーム時系列生成手段により生成
    された合成パラメータフレームの時系列から、前記第1
    の標本周期とは異なる第2の標本周期及び前記第2の標
    本周期とは異なる第3の標本周期をもとに 第2のフレーム周期=第1のフレーム周期×第2の標本
    周期/第3の標本周期 で定められる第2のフレーム周期で離散音声信号を合成
    する合成手段と、 この合成手段によって合成された離散音声信号の標本周
    期を前記第2の標本周期に変換する標本周期変換手段
    と、 この標本周期変換手段によって標本周期が変換された離
    散音声信号を前記第3の標本周期でアナログ音声信号に
    変換するディジタル/アナログ変換手段とを具備するこ
    とを特徴とする音声合成装置。
  116. 【請求項116】 第1の標本周期で標本化した離散音
    声信号に第1のフレーム周期の時間窓をかけて分析して
    得られる音声の特徴パラメータフレームの時系列から所
    定の合成単位で切り出した音声素片を音声素片蓄積手段
    に複数蓄積しておき、 前記音声素片蓄積手段から入力音韻情報に基づいて前記
    音声素片を選択し接続して合成パラメータフレームの時
    系列を生成し、 この生成した合成パラメータフレームの時系列から、前
    記第1の標本周期とは異なる第2の標本周期及び前記第
    2の標本周期とは異なる第3の標本周期をもとに 第2のフレーム周期=第1のフレーム周期×第2の標本
    周期/第3の標本周期 で定められる第2のフレーム周期で離散音声信号を合成
    し、 この第2のフレーム周期で合成した離散音声信号の標本
    周期を前記第2の標本周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第3の標本周期でアナログ音声信号に変換するこ
    とを特徴とする音声合成方法。
  117. 【請求項117】 韻律情報と音韻情報を入力として第
    1の標本周期で標本化した離散音声信号から作成した音
    声素片を複数蓄積する音声素片蓄積手段と、 前記韻律情報から音声の基本周波数パターンを生成する
    ピッチパターン生成手段と、 前記音韻情報に基づいて前記音声素片蓄積手段から音声
    素片を選択的に読み出し接続することによって音声の音
    韻パラメータを生成する音韻パラメータ生成手段と、 この音韻パラメータ生成手段によって生成された音韻パ
    ラメータと前記ピッチパターン生成手段によって生成さ
    れた基本周波数パターンから離散音声信号を合成する合
    成手段と、 この合成手段によって合成された離散音声信号の標本周
    期を変換するための標本周期変換手段であって、前記第
    1の標本周期または前記第1の標本周期とは異なる第2
    の標本周期への標本周期変換を選択的に行うことが可能
    な標本周期変換手段と、 この標本周期変換手段によって標本周期が変換された離
    散音声信号を前記第2の標本周期とは異なる第3の標本
    周期でアナログ音声信号に変換するディジタル/アナロ
    グ変換手段とを具備し、 前記ピッチパターン生成手段は、前記標本周期変換手段
    にて前記第2の標本周期への標本周期変換が行われる際
    には、前記第1の標本周期への標本周期変換が行われる
    ときとは異なる基本周波数パターンとなるよう前記基本
    周波数パターンを生成するように構成されていることを
    特徴とする音声合成装置。
  118. 【請求項118】 韻律情報と音韻情報を入力として第
    1の標本周期で標本化した離散音声信号から作成した音
    声素片を音声素片蓄積手段に複数蓄積しておき、前記韻
    律情報から音声の基本周波数パターンを生成すると共
    に、前記音韻情報に基づいて前記音声素片蓄積手段から
    音声素片を選択的に読み出し接続することによって音声
    の音韻パラメータを生成し、この生成した音韻パラメー
    タと基本周波数パターンから離散音声信号を合成し、こ
    の合成した離散音声信号をアナログ音声信号に変換する
    音声合成方法において、 前記合成した離散音声信号の標本周期を前記第1の標本
    周期のままとする第1のモードと前記第1の標本周期と
    は異なる第2の標本周期とする第2のモードとを用意
    し、 前記第2のモード時には、 前記第1のモード時とは異なる基本周波数パターンとな
    るよう前記基本周波数パターンを生成して前記離散音声
    信号の合成に用い、 前記合成した離散音声信号の標本周期を前記第2の標本
    周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第2の標本周期とは異なる第3の標本周期でアナ
    ログ音声信号に変換することを特徴とする音声合成方
    法。
  119. 【請求項119】 韻律情報と音韻情報を入力として第
    1の標本周期で標本化した離散音声信号から作成した音
    声素片を複数蓄積する音声素片蓄積手段と、 前記第1の標本周期とは異なる第2の標本周期及び前記
    第2の標本周期とは異なる第3の標本周期に基づいて前
    記韻律情報から音声の基本周波数パターンを生成するピ
    ッチパターン生成手段と、 前記音韻情報に基づいて前記音声素片蓄積手段から音声
    素片を選択的に読み出し接続することによって音声の音
    韻パラメータを生成する音韻パラメータ生成手段と、 この音韻パラメータ生成手段によって生成された音韻パ
    ラメータと前記ピッチパターン生成手段によって生成さ
    れた基本周波数パターンから離散音声信号を合成する合
    成手段と、 この合成手段によって合成された離散音声信号の標本周
    期を前記第2の標本周期に変換する標本周期変換手段
    と、 この標本周期変換手段によって標本周期が変換された離
    散音声信号を前記第3の標本周期でアナログ音声信号に
    変換するディジタル/アナログ変換手段とを具備するこ
    とを特徴とする音声合成装置。
  120. 【請求項120】 韻律情報と音韻情報を入力として第
    1の標本周期で標本化した離散音声信号から作成した音
    声素片を音声素片蓄積手段に複数蓄積しておき、 前記第1の標本周期とは異なる第2の標本周期及び前記
    第2の標本周期とは異なる第3の標本周期に基づいて前
    記韻律情報から音声の基本周波数パターンを生成すると
    共に、前記音韻情報に基づいて前記音声素片蓄積手段か
    ら音声素片を選択的に読み出し接続することによって音
    声の音韻パラメータを生成し、 この生成した音韻パラメータと基本周波数パターンから
    離散音声信号を合成し、 この合成した離散音声信号の標本周期を前記第2の標本
    周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第3の標本周期でアナログ音声信号に変換するこ
    とを特徴とする音声合成方法。
  121. 【請求項121】 韻律情報と音韻情報を入力として第
    1の標本周期で標本化した離散音声信号から作成した音
    声素片を複数蓄積する音声素片蓄積手段と、 合成する音声の声質を選択指定するための声質選択手段
    と、 この声質選択手段により選択指定された声質に応じて前
    記韻律情報から音声の基本周波数パターンを生成するピ
    ッチパターン生成手段と、 前記音韻情報に基づいて前記音声素片蓄積手段から音声
    素片を選択的に読み出し接続することによって音声の音
    韻パラメータを生成する音韻パラメータ生成手段と、 この音韻パラメータ生成手段によって生成された音韻パ
    ラメータと前記ピッチパターン生成手段によって生成さ
    れた基本周波数パターンから離散音声信号を合成する合
    成手段と、 この合成手段によって合成された離散音声信号の標本周
    期を前記声質選択手段により選択指定された声質に応じ
    て定められる第2の標本周期に変換する標本周期変換手
    段と、 この標本周期変換手段によって標本周期が変換された離
    散音声信号を前記第2の標本周期とは異なる(但し、第
    2の標本周期が第1の標本周期に一致する場合を除く)
    第3の標本周期でアナログ音声信号に変換するディジタ
    ル/アナログ変換手段とを具備することを特徴とする音
    声合成装置。
  122. 【請求項122】 韻律情報と音韻情報を入力として第
    1の標本周期で標本化した離散音声信号から作成した音
    声素片を音声素片蓄積手段に複数蓄積しておき、前記韻
    律情報から音声の基本周波数パターンを生成すると共
    に、前記音韻情報に基づいて前記音声素片蓄積手段から
    音声素片を選択的に読み出し接続することによって音声
    の音韻パラメータを生成し、この生成した音韻パラメー
    タと基本周波数パターンから離散音声信号を合成する音
    声合成方法において、 合成する音声の声質の選択指定の受け付けを行い、 合成処理に用いる前記基本周波数パターンを前記受け付
    けた声質に応じて前記韻律情報から生成し、 前記合成した離散音声信号の標本周期を前記受け付けた
    声質に応じて定められる第2の標本周期に変換し、 この第2の標本周期への標本周期変換後の離散音声信号
    を前記第2の標本周期とは異なる(但し、第2の標本周
    期が第1の標本周期に一致する場合を除く)第3の標本
    周期でアナログ音声信号に変換することを特徴とする音
    声合成方法。
  123. 【請求項123】 前記ピッチパターン生成手段は、前
    記標本周期変換手段にて前記第2の標本周期への標本周
    期変換が行われる際には、前記第1の標本周期への標本
    周期変換が行われるときに生成する基本周波数パターン
    に対して、基本周波数が(第3の標本周期/第2の標本
    周期)倍の基本周波数パターンを生成することを特徴と
    する請求項117記載の音声合成装置。
  124. 【請求項124】 前記第2のモード時の合成処理に用
    いる基本周波数パターンを、その基本周波数が、前記第
    1のモード時の合成処理に用いる基本周波数パターンの
    基本周波数の(第3の標本周期/第2の標本周期)倍と
    なるよう生成することを特徴とする請求項118記載の
    音声合成方法。
  125. 【請求項125】 音声の特徴パラメータを蓄積する蓄
    積手段と、 この蓄積手段から読み出した音声の特徴パラメータを入
    力として離散音声信号を合成する合成手段と、 この合成手段によって合成された離散音声信号をアナロ
    グ音声信号に変換するディジタル/アナログ変換手段
    と、 このディジタル/アナログ変換手段に入力される離散音
    声信号の標本周期と当該離散音声信号を前記ディジタル
    /アナログ変換手段でアナログ音声信号に変換する際の
    変換周期とが異なるように制御する制御手段とを具備す
    ることを特徴とする音声合成装置。
  126. 【請求項126】 音声の特徴パラメータを蓄積手段に
    蓄積しておき、前記蓄積手段から読み出した音声の特徴
    パラメータを入力として離散音声信号を合成し、この合
    成した離散音声信号をアナログ音声信号に変換する音声
    合成方法において、 前記アナログ音声信号への変換の対象となる離散音声信
    号の標本周期と当該離散音声信号をアナログ音声信号に
    変換する際の変換周期とが異なるようにすることを特徴
    とする音声合成方法。
  127. 【請求項127】 音声の特徴パラメータを蓄積する蓄
    積手段と、 この蓄積手段から読み出した音声の特徴パラメータを入
    力として離散音声信号を合成する合成手段と、 この合成手段によって合成された離散音声信号をアナロ
    グ音声信号に変換するディジタル/アナログ変換手段
    と、 合成する音声の声質を選択指定するための声質選択手段
    と、 前記ディジタル/アナログ変換手段に入力される離散音
    声信号の標本周期と当該離散音声信号を前記ディジタル
    /アナログ変換手段でアナログ音声信号に変換する際の
    変換周期との比を、前記声質選択手段により選択指定さ
    れた声質に応じて可変する制御手段とを具備することを
    特徴とする音声合成装置。
  128. 【請求項128】 音声の特徴パラメータを蓄積手段に
    蓄積しておき、前記蓄積手段から読み出した音声の特徴
    パラメータを入力として離散音声信号を合成し、この合
    成した離散音声信号をアナログ音声信号に変換する音声
    合成方法において、 合成する音声の声質の選択指定の受け付けを行い、 前記アナログ音声信号への変換の対象となる離散音声信
    号の標本周期と当該離散音声信号をアナログ音声信号に
    変換する際の変換周期との比を、前記受け付けた声質に
    応じて可変することを特徴とする音声合成方法。
  129. 【請求項129】 予め作成された音声素片を蓄積する
    蓄積手段と、 与えられた音韻情報に基づいて前記蓄積手段より音声素
    片を選択し接続することによって離散音声信号を合成す
    る合成手段と、 この合成手段によって合成された離散音声信号をアナロ
    グ音声信号に変換するディジタル/アナログ変換手段
    と、 このディジタル/アナログ変換手段に入力される離散音
    声信号の標本周期と当該離散音声信号を前記ディジタル
    /アナログ変換手段でアナログ音声信号に変換する際の
    変換周期とが異なるように制御する制御手段とを具備す
    ることを特徴とする音声合成装置。
  130. 【請求項130】 予め作成された音声素片を蓄積手段
    に蓄積しておき、与えられた音韻情報に基づいて前記蓄
    積手段より音声素片を選択し接続することによって離散
    音声信号を合成し、この合成した離散音声信号をアナロ
    グ音声信号に変換する音声合成方法において、 前記アナログ音声信号への変換の対象となる離散音声信
    号の標本周期と当該離散音声信号をアナログ音声信号に
    変換する際の変換周期とが異なるようにすることを特徴
    とする音声合成方法。
  131. 【請求項131】 予め作成された音声素片を蓄積する
    蓄積手段と、 与えられた音韻情報に基づいて前記蓄積手段より音声素
    片を選択し接続することによって離散音声信号を合成す
    る合成手段と、 この合成手段によって合成された離散音声信号をアナロ
    グ音声信号に変換するディジタル/アナログ変換手段
    と、 合成する音声の声質を選択指定するための声質選択手段
    と、 前記ディジタル/アナログ変換手段に入力される離散音
    声信号の標本周期と当該離散音声信号を前記ディジタル
    /アナログ変換手段でアナログ音声信号に変換する際の
    変換周期との比を、前記声質選択手段により選択指定さ
    れた声質に応じて可変する制御手段とを具備することを
    特徴とする音声合成装置。
  132. 【請求項132】 予め作成された音声素片を蓄積手段
    に蓄積しておき、与えられた音韻情報に基づいて前記蓄
    積手段より音声素片を選択し接続することによって離散
    音声信号を合成し、この合成した離散音声信号をアナロ
    グ音声信号に変換する音声合成方法において、 合成する音声の声質の選択指定の受け付けを行い、 前記アナログ音声信号への変換の対象となる離散音声信
    号の標本周期と当該離散音声信号をアナログ音声信号に
    変換する際の変換周期との比を、前記受け付けた声質に
    応じて可変することを特徴とする音声合成方法。
JP8142832A 1996-06-05 1996-06-05 音声合成装置及び方法 Pending JPH09325788A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8142832A JPH09325788A (ja) 1996-06-05 1996-06-05 音声合成装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8142832A JPH09325788A (ja) 1996-06-05 1996-06-05 音声合成装置及び方法

Publications (1)

Publication Number Publication Date
JPH09325788A true JPH09325788A (ja) 1997-12-16

Family

ID=15324662

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8142832A Pending JPH09325788A (ja) 1996-06-05 1996-06-05 音声合成装置及び方法

Country Status (1)

Country Link
JP (1) JPH09325788A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1169476A (ja) * 1997-08-26 1999-03-09 Secom Co Ltd 発声補助用人工喉頭
JP2010169889A (ja) * 2009-01-22 2010-08-05 Yamaha Corp 音声合成装置、およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1169476A (ja) * 1997-08-26 1999-03-09 Secom Co Ltd 発声補助用人工喉頭
JP2010169889A (ja) * 2009-01-22 2010-08-05 Yamaha Corp 音声合成装置、およびプログラム

Similar Documents

Publication Publication Date Title
JP4125362B2 (ja) 音声合成装置
US7010488B2 (en) System and method for compressing concatenative acoustic inventories for speech synthesis
JPH031200A (ja) 規則型音声合成装置
JP2000305582A (ja) 音声合成装置
JPH10153998A (ja) 補助情報利用型音声合成方法、この方法を実施する手順を記録した記録媒体、およびこの方法を実施する装置
US6212501B1 (en) Speech synthesis apparatus and method
JP3673471B2 (ja) テキスト音声合成装置およびプログラム記録媒体
JPH0632020B2 (ja) 音声合成方法および装置
JP2761552B2 (ja) 音声合成方法
US6829577B1 (en) Generating non-stationary additive noise for addition to synthesized speech
JPH09325788A (ja) 音声合成装置及び方法
JP3742206B2 (ja) 音声合成方法及び装置
JP2001034284A (ja) 音声合成方法及び装置、並びに文音声変換プログラムを記録した記録媒体
JP3233036B2 (ja) 歌唱音合成装置
JP3575919B2 (ja) テキスト音声変換装置
JP3081300B2 (ja) 残差駆動型音声合成装置
JPH09179576A (ja) 音声合成方法
WO2023182291A1 (ja) 音声合成装置、音声合成方法及びプログラム
JPH0990987A (ja) 音声合成方法及び装置
JP3994333B2 (ja) 音声辞書作成装置、音声辞書作成方法、及び、プログラム
JPS5914752B2 (ja) 音声合成方式
JPH1195797A (ja) 音声合成装置及び方法
JPH10301599A (ja) 音声合成装置
JP2001312300A (ja) 音声合成装置
JP2956936B2 (ja) 音声合成装置の発声速度制御回路