JPH09325788A

JPH09325788A - 音声合成装置及び方法

Info

Publication number: JPH09325788A
Application number: JP8142832A
Authority: JP
Inventors: Yoshinori Shiga; 芳則志賀; Yoshiyuki Hara; 義幸原
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1996-06-05
Filing date: 1996-06-05
Publication date: 1997-12-16

Abstract

(57)【要約】【課題】アナウンサ発声の収録や音声素片の再切り出し
を行うことなく、合成音声の声質を簡単に増やすことが
できるようにする。【解決手段】第１の標本周期で標本化した離散音声信号
を分析して得られる音声の特徴パラメータをメモリ１１
に、音声の基本周波数パターンをメモリ１２に蓄積して
おき、メモリ１１から読み出した特徴パラメータとメモ
リ１２から読み出した基本周波数パターンとから合成フ
ィルタ処理部１３にて離散音声信号を合成する。Ｄ／Ａ
変換器１４では、この離散音声信号を、声質切替部１７
で切り替え指定された声質に応じて声質制御部１８によ
り定められる第２の標本周期でアナログ音声信号に変換
する。このアナログ音声信号はアンプ１５により増幅さ
れ、スピーカ１６から音声として出力される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声をパラメータ
化して蓄積し、これから音声を合成する、あるいは音声
を細分化して蓄積し、その組み合わせによって任意の音
声を合成するのに好適な音声合成装置及び方法に関す
る。

【０００２】

【従来の技術】本発明に係る音声合成装置として、音声
をパラメータ化して蓄積し、これから音声を合成する分
析合成装置と、音声を細分化して蓄積し、その組み合わ
せによって任意の音声を合成可能な規則合成装置がある
ことが知られている。以下では、これら分析合成装置と
規則合成装置の従来技術の例を図を参照しながら説明し
ていく。

【０００３】図２３は従来の分析合成装置の構成を示し
た図である。

【０００４】図２３において、メモリ３１１には、音声
を分析して得られるパラメータフレームの時系列と各フ
レームに対応した音声の有声・無声情報が記憶されてい
る。ここではパラメータとして低次のケプストラム係数
を利用している。

【０００５】ところで、低次のケプストラム係数は次の
ようにして求めることができる。まず、アナウンサ等が
発声した音声データに、一定幅・一定周期で窓関数（こ
こではハニング窓）をかけ、各窓内の音声波形に対して
フーリエ変換を行い音声の短時間スペクトルを計算す
る。次に、得られた短時間スペクトルのパワーを対数化
して対数パワースペクトルを得た後、対数パワースペク
トルを逆フーリエ変換する。こうして計算されるのがケ
プストラム係数である。

【０００６】一般に、高次のケプストラム係数は音声の
基本周波数情報を、低次のケプストラム係数は音声のス
ペクトル包絡情報を保持していることが知られている。
このうち、音声のスペクトル包絡を表わす低次ケプスト
ラムのみがメモリ３１１に蓄えられている。

【０００７】一方、メモリ３１２には、所定の基本周波
数抽出方法により同じ音声から得られる、音声の基本周
波数の時系列パターンが記憶されている。基本周波数抽
出方法としては、例えば、Bruce G 等による文献「"An
Integrated Pitch TrackingAlgorithm for Speech Syst
ems",ICASSP 1993 」などの方法が挙げられる。

【０００８】合成フィルタ処理部３１３は、これら２つ
のメモリ３１１，３１２より前述の各データを読み出
し、有声区間では前記基本周波数の時系列パターンに基
づいた周期パルスを、無声区間ではランダムノイズをそ
れぞれ音源として、音声のパラメータフレーム（ケプス
トラム）の時系列からフィルタ係数を算出し、合成フィ
ルタに与えて所望の音声を合成する。通常、この合成フ
ィルタには、ケプストラム係数を直接フィルタ係数とす
るＬＭＡ（Log Magnitude Approximation ）フィルタを
用いている。ここまでの処理はプログラムによって行わ
れるのが一般的である。

【０００９】さて、以上のようにして合成された音声は
離散信号であることから、合成フィルタ処理部３１３で
は最後に、この離散信号（離散波形）をＤ／Ａ（ディジ
タル／アナログ）変換器３１４に供給する。これを受け
てＤ／Ａ変換器３１４は、離散信号（離散音声信号）を
電気的なアナログ信号（アナログ音声信号）に変換す
る。こうして得られたアナログ信号でアンプ３１５を介
してスピーカ３１６等を駆動することにより聴覚で知覚
できる音声が合成される。

【００１０】図２４は従来の規則合成装置の構成を示し
た図である。

【００１１】図２４の規則合成装置はテキストを音韻と
韻律からなる記号列に変換し、その記号列から音声を生
成する文音声変換（Text-to-speech conversion:以下Ｔ
ＴＳと称する）処理を行う。

【００１２】この図２４の規則合成装置におけるＴＴＳ
処理は、大きく分けて言語処理部４１１と音声合成部４
１２の２つ処理部からなり、日本語の規則合成を例にと
ると次のように行われるのが一般的である。

【００１３】まず言語処理部４１１では、テキストファ
イル４１３から入力されるテキスト（漢字かな混じり
文）に対して形態素解析・構文解析等の言語処理を加
え、形態素への分解、係り受け関係の推定等の処理を行
うと同時に、各形態素に読みとアクセント型を与える。
その後言語処理部４１２では、アクセントに関しては複
合語等のアクセント移動規則を用いて、読み上げの際の
区切りとなる句（以下、アクセント句と称する）毎のア
クセント型を決定する。通常ＴＴＳの言語処理部では、
こうして得られるアクセント句毎の読みとアクセント型
を記号列（以下、音声記号列と称する）として出力でき
るようになっている。

【００１４】次に音声合成部４１２内では、得られた読
みに含まれる各音韻の継続時間を、その音韻の音韻環境
等をもとに、所定の規則によりの音韻継続時間計算処理
部４１４にて決定する。続いて上記のようにして得られ
る「読み」と「音韻の継続時間」に従って、音韻パラメ
ータ生成処理部４１５が音声素片メモリ４１６から順次
必要な音声素片を読み出し、読み出した音声素片を接続
して、合成すべき音声の特徴パラメータ系列を生成す
る。

【００１５】ここで音声素片メモリ４１５は、予め作成
された多数の音声素片から構成されている。音声素片
は、アナウンサ等が発声した音声を分析して所定の音声
の特徴パラメータを得た後、所定の合成単位例えば日本
語の音節（子音＋母音：以下ＣＶと称する）単位で、日
本語の音声に含まれる全ての音節を前記特徴パラメータ
から切り出すことにより作成される。

【００１６】音声合成部４１２ではさらに、ピッチ生成
処理部４１７が上記アクセント型をもとにピッチの高低
変化が生じる時点にて点ピッチを設定し、複数設定され
た点ピッチ間を直線補間することによりピッチのアクセ
ント成分を生成し、これにイントネーション成分（通常
は周波数軸上での単調減少直線）を重畳してピッチパタ
ーンを生成する。そして有声区間ではピッチパターンに
基づいた周期パルスを、無声区間ではランダムノイズを
それぞれ音源として、一方音声の特徴パラメータ系列か
らフィルタ係数を算出し、合成フィルタ処理部４１８に
与えて所望の音声を合成する。

【００１７】ここまでの処理はプログラムによって行わ
れるのが一般的で、したがって合成された音声は離散信
号であるから、音声合成部４１２では最後に、この離散
信号をＤ／Ａ変換器４１９に供給する。これを受けてＤ
／Ａ変換器４１９は、離散信号（離散音声信号）を電気
的なアナログ信号（アナログ音声信号）に変換する。こ
うして得られたアナログ信号でアンプ４２０を介してス
ピーカ４２１等を駆動することにより聴覚で知覚できる
音声が合成できる。

【００１８】

【発明が解決しようとする課題】音声合成装置に関し、
現在上記のような従来技術が存在しているが、この従来
の音声合成装置で合成される音声には次のような問題が
ある。即ち従来の音声合成装置では、合成音声の声の種
類（以下、声質と称する）に制約があり、音声素片ファ
イル作成時のアナウンサの声質か、あるいは音声の規則
合成によりそれが多少劣化した声質でしか合成できな
い。したがって、会話文等を音声合成するに当たって合
成音声の声質を増やそうとした場合、音声合成装置開発
者は新たに異なるアナウンサを雇い、発声を録音して、
音声素片の作成を始めからやり直さなければならない。
このため、アナウンサを雇うための賃金が必要となり、
またアナウンサの発声の収録・音声素片の切り出し等の
ために開発者は多大な労力を要することになる。そし
て、このことが装置開発のコストを増加させることにつ
ながる。

【００１９】本発明はこのような事情を考慮してなされ
たものであり、その目的は、アナウンサ発声の収録や音
声素片の再切り出しを行うことなく、極めて容易な手段
で、合成音声の声質を増やすことのできる音声合成装置
及び方法を提供することにある。

【００２０】

【課題を解決するための手段】本発明の第１の観点に係
る音声合成装置は、第１の標本周期で標本化した離散音
声信号を分析して得られる音声の特徴パラメータを蓄積
する蓄積手段と、この蓄積手段より読み出した音声の特
徴パラメータを入力として離散音声信号を合成する合成
手段と、この合成手段によって合成された離散音声信号
を上記第１の標本周期とは異なる第２の標本周期でアナ
ログ音声信号に変換するディジタル／アナログ変換手段
とを備えたことを特徴とする。

【００２１】こり他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記ディジタル／
アナログ変換手段では、合成手段によって合成された離
散音声信号が声質選択手段により選択指定された声質に
応じて定められる第２の標本周期でアナログ音声信号に
変換される構成とすることも可能である。

【００２２】この発明においては、音声分析時の標本周
期である第１の標本周期とディジタル／アナログ（Ｄ／
Ａ）変換での第２の標本周期とを異ならせることによ
り、音声のスペクトルが周波数対数軸上でシフトするか
ら、同じ特徴パラメータを用いて異なる声質の音声を合
成することができる。

【００２３】次に、本発明の第２の観点に係る音声合成
装置は、第１の標本周期で標本化した離散音声信号に第
１のフレーム周期で時間窓をかけて分析して得られる音
声の特徴パラメータフレームの時系列から、上記第１の
フレーム周期とは異なる第２のフレーム周期で離散音声
信号を合成する合成手段と、この合成手段によって合成
された離散音声信号を上記第１の標本周期とは異なる第
２の標本周期でアナログ音声信号に変換するディジタル
／アナログ変換手段とを備えたことを特徴とする。ここ
で、上記第２のフレーム周期を、第１のフレーム周期、
第１の標本周期及び当該第１の標本周期とは異なる第２
の標本周期に基づいて定めるとよい。

【００２４】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記合成手段で
は、声質選択手段により選択指定された声質に応じて定
められる第２のフレーム周期で離散音声信号が合成さ
れ、上記ディジタル／アナログ変換手段では、合成手段
によって合成された離散音声信号が声質選択手段により
選択指定された声質に応じて定められる第２の標本周期
でアナログ音声信号に変換される構成とすることも可能
である。

【００２５】この発明においては、音声分析時の第１の
標本周期とＤ／Ａ変換での第２の標本周期を異ならせる
ことにより、音声のスペクトルを周波数対数軸上でシフ
トさせ、同じ特徴パラメータを用いて異なる声質の音声
を合成することができるが、さらにここで、合成時の第
２のフレーム周期を、第１のフレーム周期、第１の標本
周期及び第２の標本周期に基づいて定めるとか、合成時
の第２のフレーム周期とＤ／Ａ変換時の第２の標本周期
を声質選択手段で選択指定された声質に応じて定めるな
どして、上記第２のフレーム周期を分析時の窓の周期
（第１のフレーム周期）と異ならせることにより、合成
する音声の発話速度を適切に制御できるから、声質を変
化させながら自然な発話速度の音声が合成できる。

【００２６】次に、本発明の第３の観点に係る音声合成
装置は、第１の標本周期で標本化した離散音声信号を分
析して得られる音声の特徴パラメータを蓄積する特徴パ
ラメータ蓄積手段と、音声の基本周波数パターンを蓄積
するピッチパターン蓄積手段と、このピッチパターン蓄
積手段から読み出した基本周波数パターンを上記第１の
標本周期及び第１の標本周期とは異なる第２の標本周期
に基づいて変調するピッチパターン変調手段と、上記特
徴パラメータ蓄積手段から読み出した特徴パラメータと
上記ピッチパターン変調手段にて変調された基本周波数
パターンとから離散音声信号を合成する合成手段と、こ
の合成手段によって合成された離散音声信号を上記第２
の標本周期でアナログ音声信号に変換するディジタル／
アナログ変換手段とを備えたことを特徴とする。

【００２７】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記ピッチパター
ン変調手段では、基本周波数パターンに対して声質選択
手段により選択指定された声質に応じた変調が行われ、
上記ディジタル／アナログ変換手段では、合成手段によ
って合成された離散音声信号が声質選択手段により選択
指定された声質に応じて定められる第２の標本周期でア
ナログ音声信号に変換される構成とすることも可能であ
る。

【００２８】この発明においては、音声分析時の標本周
期である第１の標本周期とＤ／Ａ変換の第２の標本周期
を異ならせることにより、音声のスペクトルを周波数対
数軸上でシフトさせ、同じ特徴パラメータを用いて異な
る声質の音声を合成することができるが、さらにここ
で、合成の基本周波数パターンを第１の標本周期及び第
２の標本周期に基づいて定めるとか、声質選択手段によ
り選択指定された声質に応じて第２の標本周期を定め、
選択指定された声質に応じて合成の基本周波数パターン
を定めることで、合成する音声のピッチ（声の高さ）を
適切に制御できるから、声質を変化させながら自然なピ
ッチの音声が合成できる。

【００２９】次に、本発明の第４の観点に係る音声合成
装置は、第１の標本周期で標本化した離散音声信号から
作成した音声素片を、与えられた音韻情報に基づいて選
択し接続することによって離散音声信号を合成する音声
合成手段と、この音声合成手段によって合成された離散
音声信号を上記第１の標本周期とは異なる第２の標本周
期でアナログ音声信号に変換するディジタル／アナログ
変換手段とを備えたことを特徴とする。

【００３０】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記ディジタル／
アナログ変換手段では、合成手段によって合成された離
散音声信号が声質選択手段により選択指定された声質に
応じて定められる第２の標本周期でアナログ音声信号に
変換される構成とすることも可能である。

【００３１】この発明においては、音声素片作成時の第
１の標本周期とＤ／Ａ変換の第２の標本周期を異ならせ
ることにより、音声のスペクトルが周波数対数軸上でシ
フトするから、同じ音声素片を用いて異なる声質の音声
を合成することができる。

【００３２】次に、本発明の第５の観点に係る音声合成
装置は、第１の標本周期で標本化した離散音声信号から
作成した音声素片を、与えられた音韻情報に基づいて選
択し、この選択した音声素片を、合成される音声の発話
速度または発話時間に関係する発話速度パラメータに応
じて接続することによって離散音声信号を合成する音声
合成手段であって、使用する発話速度パラメータを上記
第１の標本周期及び第１の標本周期とは異なる第２の標
本周期に基づいて決定する音声合成手段と、この音声合
成手段によって合成された離散音声信号を上記第２の標
本周期でアナログ音声信号に変換するディジタル／アナ
ログ変換手段とを備えたことを特徴とする。

【００３３】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記音声合成手段
では、使用する発話速度パラメータが声質選択手段によ
り選択指定された声質に応じて決定され、上記ディジタ
ル／アナログ変換手段では、音声合成手段によって合成
された離散音声信号が声質選択手段により選択指定され
た声質に応じて定められる第２の標本周期でアナログ音
声信号に変換される構成とすることも可能である。

【００３４】この発明においては、音声素片作成時の第
１の標本周期とＤ／Ａ変換の第２の標本周期を異ならせ
ることにより、音声のスペクトルを周波数対数軸上でシ
フトさせ、同じ特徴パラメータを用いて異なる声質の音
声を合成することができるが、さらにここで、合成時に
使用される発話速度パラメータを、第１の標本周期及び
第２の標本周期に応じて定めるとか、声質選択手段によ
り選択指定された声質に応じて第２の標本周期を定め、
選択指定された声質に応じて発話速度パラメータを定め
ることで、合成する音声の発話速度を適切に制御できる
から、声質を変化させながら自然な発話速度で音声が合
成できる。

【００３５】次に、本発明の第６の観点に係る音声合成
装置は、与えられた音韻情報に含まれる各音韻の継続時
間を決定する一方、第１の標本周期で標本化した離散音
声信号から作成した音声素片を上記音韻情報に基づいて
選択し、上記決定した各音韻の継続時間に基づいて上記
選択した音声素片を接続することによって離散音声信号
を合成する音声合成手段であって、使用する音韻継続時
間を上記第１の標本周期及び第１の標本周期とは異なる
第２の標本周期に基づいて決定する音声合成手段と、こ
の音声合成手段によって合成された離散音声信号をアナ
ログ音声信号に変換するディジタル／アナログ変換手段
とを備えたことを特徴とする。

【００３６】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記音声合成手段
では、使用する音韻継続時間が声質選択手段により選択
指定された声質に応じて決定され、上記ディジタル／ア
ナログ変換手段では、音声合成手段によって合成された
離散音声信号が声質選択手段により選択指定された声質
に応じて定められる第２の標本周期でアナログ音声信号
に変換される構成とすることも可能である。

【００３７】この発明においては、音声素片作成時の第
１の標本周期とＤ／Ａ変換の第２の標本周期を異ならせ
ることにより、音声のスペクトルを周波数対数軸上でシ
フトさせ、同じ特徴パラメータを用いて異なる声質の音
声を合成することができるが、さらにここで、合成時の
音韻継続時間を第１の標本周期及び第２の標本周期に応
じて定めるとか、声質選択手段により選択指定された声
質に応じて第２の標本周期を定め、選択指定された声質
に応じて音韻継続時間を定めることで、合成する音声の
発話速度を適切に制御できるから、声質を変化させなが
ら自然な発話速度で音声が合成できる。

【００３８】次に、本発明の第７の観点に係る音声合成
装置は、第１の標本周期で標本化した離散音声信号から
作成した音声素片を、与えられた音韻情報に基づいて選
択し、この選択した音声素片を時間軸方向に伸縮させな
がら接続することによって離散音声信号を合成する音声
合成手段と、この音声合成手段によって合成された離散
音声信号を上記第１の標本周期とは異なる第２の標本周
期でアナログ音声信号に変換するディジタル／アナログ
変換手段とを備えたことを特徴とする。ここで、音声合
成手段における音声素片接続時の音声素片に対する時間
軸方向への伸縮の度合いを、上記第１の標本周期及び第
２の標本周期に基づいて定めるとよい。

【００３９】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記音声合成手段
では、選択した音声素片を声質選択手段により選択指定
された声質に応じて定められる度合いで時間軸方向に伸
縮させながら接続するように構成され、上記ディジタル
／アナログ変換手段では、音声合成手段によって合成さ
れた離散音声信号が声質選択手段により選択指定された
声質に応じて定められる第２の標本周期でアナログ音声
信号に変換される構成とすることも可能である。

【００４０】この発明においては、音声素片作成時の第
１の標本周期とＤ／Ａ変換の第２の標本周期を異ならせ
ることにより、音声のスペクトルを周波数対数軸上でシ
フトさせ、同じ特徴パラメータを用いて異なる声質の音
声を合成することができるが、さらにここで、合成時に
音声素片を第１の標本周期及び第２の標本周期に基づい
て定められる度合いで時間軸方向に伸縮させながら接続
するとか、声質選択手段により選択指定された声質に応
じて第２の標本周期を定め、選択指定された声質に応じ
て定められる度合いで音声素片を時間軸方向に伸縮させ
ながら接続することで、合成する音声の発話速度を適切
に制御でき、なおかつ、合成する音声のスペクトル過渡
部分の時間変化も適切に制御できるから、声質を変化さ
せながら自然な発話速度で明瞭な音声が合成できる。

【００４１】次に、本発明の第８の観点に係る音声合成
装置は、第１の標本周期で標本化した離散音声信号に第
１のフレーム周期の時間窓をかけて分析して得られる音
声の特徴パラメータフレームの時系列から所定の合成単
位で切り出した音声素片を複数蓄積する音声素片蓄積手
段と、この音声素片蓄積手段から入力音韻情報に基づい
て上記音声素片を選択し接続して合成パラメータフレー
ムの時系列を生成する合成パラメータフレーム時系列生
成手段と、この合成パラメータフレーム時系列生成手段
により生成された合成パラメータフレームの時系列から
上記第１のフレーム周期とは異なる第２のフレーム周期
で離散音声信号を合成する合成手段と、この合成手段に
よって合成された離散音声信号を上記第１の標本周期と
は異なる第２の標本周期でアナログ音声信号に変換する
ディジタル／アナログ変換手段とを備えたことを特徴と
する。ここで、第２のフレーム周期を、第１のフレーム
周期、第１の標本周期及び当該第１の標本周期とは異な
る第２の標本周期に基づいて定めるとよい。

【００４２】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記合成手段で
は、声質選択手段により選択指定された声質に応じて定
められる第２のフレーム周期で離散音声信号が合成さ
れ、上記ディジタル／アナログ変換手段では、合成手段
によって合成された離散音声信号が声質選択手段により
選択指定された声質に応じて定められる第２の標本周期
でアナログ音声信号に変換される構成とすることも可能
である。

【００４３】この発明においては、音声素片作成時の第
１の標本周期とＤ／Ａ変換の第２の標本周期を異ならせ
ることにより、音声のスペクトルを周波数対数軸上でシ
フトさせ、同じ特徴パラメータを用いて異なる声質の音
声を合成することができるが、さらにここで、合成時の
第２のフレーム周期を、第１のフレーム周期、第１の標
本周期及び第２の標本周期に基づいて定めるとか、合成
時の第２のフレーム周期とＤ／Ａ変換時の第２の標本周
期を声質選択手段で選択指定された声質に応じて定める
などして、上記第２のフレーム周期を分析時の窓の周期
（第１のフレーム周期）と異ならせることにより、合成
する音声の発話速度を適切に制御できるから、声質を変
化させながら自然な発話速度の音声が合成できる。

【００４４】次に、本発明の第９の観点に係る音声合成
装置は、韻律情報と音韻情報を入力として第１の標本周
期で標本化した離散音声信号から作成した音声素片を複
数蓄積する音声素片蓄積手段と、上記第１の標本周期及
び第１の標本周期とは異なる第２の標本周期に基づいて
上記韻律情報から音声の基本周波数パターンを生成する
ピッチパターン生成手段と、上記音韻情報に基づいて上
記音声素片蓄積手段から音声素片を選択的に読み出し接
続することによって音声の音韻パラメータを生成する音
韻パラメータ生成手段と、この音韻パラメータ生成手段
によって生成された音韻パラメータと上記ピッチパター
ン生成手段によって生成された基本周波数パターンから
離散音声信号を合成する合成手段と、この合成手段によ
って合成された離散音声信号を上記第２の標本周期でア
ナログ音声信号に変換するディジタル／アナログ変換手
段とを備えたことを特徴とする。

【００４５】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記ピッチパター
ン生成手段では、声質選択手段により選択指定された声
質に応じて韻律情報から音声の基本周波数パターンが生
成され、上記ディジタル／アナログ変換手段では、合成
手段によって合成された離散音声信号が声質選択手段に
より選択指定された声質に応じて定められる第２の標本
周期でアナログ音声信号に変換される構成とすることも
可能である。

【００４６】この発明においては、音声素片作成時の第
１の標本周期とＤ／Ａ変換の第２の標本周期を異ならせ
ることにより、音声のスペクトルを周波数対数軸上でシ
フトさせ、同じ特徴パラメータを用いて異なる声質の音
声を合成することができるが、さらにここで、合成の基
本周波数パターンを第１の標本周期及び第２の標本周期
に基づいて定めるとか、基本周波数パターンとＤ／Ａ変
換時の第２の標本周期を声質選択手段で選択指定された
声質に応じて定めることにより、合成する音声のピッチ
（声の高さ）を適切に制御できるから、声質を変化させ
ながら自然なピッチの音声が合成できる。

【００４７】次に、本発明の第１０の観点に係る音声合
成装置は、前記第１の観点に係る音声合成装置に対応す
るもので、ディジタル／アナログ変換手段でのＤ／Ａ変
換の対象となる離散音声信号の標本周期を第１の標本周
期とは異なる第２の標本周期に変換する標本周期変換手
段を備えると共に、当該ディジタル／アナログ変換手段
での離散音声信号からのアナログ音声信号への変換が上
記第２の標本周期とは異なる第３の周期で行われる構成
としたことを特徴とする。

【００４８】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記標本周期変換
手段では、合成手段によって合成された離散音声信号の
標本周期が声質選択手段により選択指定された声質に応
じて定められる第２の標本周期に変換される構成とする
ことも可能である。

【００４９】この発明においては、音声分析時の第１の
標本周期とは異なる第２の標本周期に合成音声（離散音
声信号）を変換した後、第２の標本周期とは異なる第３
の標本周期でＤ／Ａ変換を行うことにより、音声のスペ
クトルが周波数対数軸上でシフトするから、同じ特徴パ
ラメータを用いて異なる声質の音声を合成することがで
きる。なお、元の声質の音声を合成するには、第１の標
本周期＝第２の標本周期＝第３の標本周期とすればよ
い。

【００５０】次に、本発明の第１１の観点に係る音声合
成装置は、前記第２の観点に係る音声合成装置に対応す
るもので、ディジタル／アナログ変換手段でのＤ／Ａ変
換の対象となる離散音声信号の標本周期を第１の標本周
期とは異なる第２の標本周期に変換する標本周期変換手
段を備えると共に、当該ディジタル／アナログ変換手段
での離散音声信号からのアナログ音声信号への変換が上
記第２の標本周期とは異なる第３の周期で行われる構成
としたことを特徴とする。ここで、離散音声信号を合成
する第２のフレーム周期を、第１のフレーム周期、第２
の標本周期及び第３の標本周期に基づいて定めるとよ
い。

【００５１】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、合成手段では、声
質選択手段により選択指定された声質に応じて定められ
る第２のフレーム周期で離散音声信号が合成され、標本
変換手段では、合成手段によって合成された離散音声信
号が声質選択手段により選択指定された声質に応じて定
められる第２の標本周期に変換される構成とすることも
可能である。

【００５２】この発明においては、音声分析時の第１の
標本周期とは異なる第２の標本周期に合成音声を変換し
た後、第２の標本周期とは異なる第３の標本周期でＤ／
Ａ変換を行うことにより、音声のスペクトルを周波数対
数軸上でシフトさせた効果がでるから、同じ特徴パラメ
ータを用いて異なる声質の音声を合成することができる
が、さらにここで、合成時の第２のフレーム周期を、第
１のフレーム周期、第２の標本周期及び第３の標本周期
に基づいて定めるとか、第２の標本周期と合成時の第２
のフレーム周期を声質選択手段で選択指定された声質に
応じて定めるなどして、上記第２のフレーム周期を分析
時の窓の周期（第１のフレーム周期）と異ならせること
により、合成する音声の発話速度を適切に制御できるか
ら、声質を変化させながら自然な発話速度の音声が合成
できる。

【００５３】次に、本発明の第１２の観点に係る音声合
成装置は、前記第３の観点に係る音声合成装置に対応す
るもので、ピッチパターン蓄積手段から読み出した基本
周波数パターンを第１の標本周期、第１の標本周期とは
異なる第２の標本周期及び第２の標本周期とは異なる第
３の標本周期に基づいて変調するピッチパターン変調手
段と、ディジタル／アナログ変換手段でのＤ／Ａ変換の
対象となる離散音声信号の標本周期を上記第２の標本周
期に変換する標本周期変換手段とを備えると共に、当該
ディジタル／アナログ変換手段での離散音声信号からの
アナログ音声信号への変換が上記第３の周期で行われる
構成としたことを特徴とする。

【００５４】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、ピッチパターン変
調手段では、ピッチパターン蓄積手段から読み出した基
本周波数パターンを対象に、声質選択手段により選択指
定された声質に応じた変調が行われ、標本周期変換手段
では、ディジタル／アナログ変換手段でのＤ／Ａ変換の
対象となる離散音声信号の標本周期が声質選択手段によ
り選択指定された声質に応じて定められる第２の標本周
期に変換される構成とすることも可能である。

【００５５】この発明においては、音声分析時の第１の
標本周期とは異なる第２の標本周期に合成音声を変換し
た後、第２の標本周期とは異なる第３の標本周期でＤ／
Ａ変換を行うことにより、音声のスペクトルが周波数対
数軸上でシフトするため、同じ特徴パラメータを用いて
異なる声質の音声を合成することができるが、さらにこ
こで、合成の基本周波数パターンを第１の標本周期とは
異なる第２の標本周期及び第２の標本周期とは異なる第
３の標本周期に基づいて定めるとか、第２の標本周期と
合成の基本周波数パターンを声質選択手段で選択指定さ
れた声質に応じて定めることにより、合成する音声のピ
ッチ（声の高さ）を適切に制御できるから、声質を変化
させながら自然なピッチの音声が合成できる。

【００５６】次に、本発明の第１３の観点に係る音声合
成装置は、前記第４の観点に係る音声合成装置に対応す
るもので、音声合成手段にて合成した離散音声信号の標
本周期を第１の標本周期とは異なる第２の標本周期に当
該音声合成手段にて変換する構成とすると共に、この標
本周期が変換された離散音声信号をディジタル／アナロ
グ変換手段により上記第２の標本周期とは異なる第３の
周期でアナログ音声信号に変換する構成としたことを特
徴とする。

【００５７】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記音声合成手段
では、合成した離散音声信号の標本周期が声質選択手段
により選択指定された声質に応じて定められる第２の標
本周期に変換される構成とすることも可能である。

【００５８】この発明においては、音声素片作成時の第
１の標本周期とは異なる第２の標本周期に合成音声を変
換した後、第２の標本周期とは異なる第３の標本周期で
Ｄ／Ａ変換を行うことにより、音声のスペクトルが周波
数対数軸上でシフトするから、同じ音声素片を用いて異
なる声質の音声を合成することができる。なお、元の声
質の音声を合成するには、第１の標本周期＝第２の標本
周期＝第３の標本周期とすればよい。

【００５９】次に、本発明の第１４の観点に係る音声合
成装置は、前記第５の観点に係る音声合成装置に対応す
るもので、音声合成手段にて合成した離散音声信号の標
本周期を第１の標本周期とは異なる第２の標本周期に当
該音声合成手段にて変換することが可能で、上記第２の
標本周期への標本周期変換を行う際の合成処理には、標
本周期の変換を行わないときとは異なる値の発話速度パ
ラメータを用いる構成とすると共に、上記音声合成手段
から出力される離散音声信号をディジタル／アナログ変
換手段により上記第２の標本周期とは異なる第３の周期
でアナログ音声信号に変換する構成としたことを特徴と
する。ここで、合成処理で使用する発話速度パラメータ
を第２の標本周期及び第３の標本周期に基づいて定める
とよい。

【００６０】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記音声合成手段
では、使用する発話速度パラメータと第２の標本周期が
声質選択手段により選択指定された声質に応じて定めら
れる構成とすることも可能である。

【００６１】この発明においては、音声素片作成時の第
１の標本周期とは異なる第２の標本周期に合成音声を変
換した後、第２の標本周期とは異なる第３の標本周期で
Ｄ／Ａ変換を行うことにより、音声のスペクトルが周波
数対数軸上でシフトするため、同じ特徴パラメータを用
いて異なる声質の音声を合成することができるが、さら
にここで、合成時に使用される発話速度パラメータを、
標本周期の変換を行わないとき（第１の標本周期に変換
することと等価）に用いる値と異ならせるとか、第２の
標本周期及び第３の標本周期に応じて定めるとか、声質
選択手段により選択指定された声質に応じて第２の標本
周期を定め、選択指定された声質に応じて発話速度パラ
メータを定めることで、合成する音声の発話速度を適切
に制御できるから、声質を変化させながら自然な発話速
度で音声が合成できる。

【００６２】次に、本発明の第１５の観点に係る音声合
成装置は、前記第６の観点に係る音声合成装置に対応す
るもので、音声合成手段にて合成した離散音声信号の標
本周期を第１の標本周期とは異なる第２の標本周期に当
該音声合成手段にて変換することが可能で、上記第２の
標本周期への標本周期変換を行う際の合成処理では、標
本周期の変換を行わないときとは異なる音韻継続時間と
なるような音韻継続時間決定を行う構成とすると共に、
上記音声合成手段から出力される離散音声信号をディジ
タル／アナログ変換手段により上記第２の標本周期とは
異なる第３の周期でアナログ音声信号に変換する構成と
したことを特徴とする。ここで、合成処理で使用する音
韻継続時間を第２の標本周期及び第３の標本周期に基づ
いて定めるとよい。

【００６３】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記音声合成手段
では、使用する音韻継続時間と第２の標本周期が声質選
択手段により選択指定された声質に応じて定められる構
成とすることも可能である。

【００６４】この発明においては、音声素片作成時の第
１の標本周期とは異なる第２の標本周期に合成音声を変
換した後、第２の標本周期とは異なる第３の標本周期で
Ｄ／Ａ変換を行うことにより、音声のスペクトルが周波
数対数軸上でシフトするため、同じ特徴パラメータを用
いて異なる声質の音声を合成することができるが、さら
にここで、合成時に使用される音韻継続時間を、標本周
期の変換を行わないとき（第１の標本周期に変換するこ
とと等価）に用いる値と異ならせるとか、第２の標本周
期及び第３の標本周期に応じて定めるとか、声質選択手
段により選択指定された声質に応じて第２の標本周期を
定め、選択指定された声質に応じて音韻継続時間を定め
ることで、合成する音声の発話速度を適切に制御できる
から、声質を変化させながら自然な発話速度で音声が合
成できる。

【００６５】次に、本発明の第１６の観点に係る音声合
成装置は、前記第７の観点に係る音声合成装置に対応す
るもので、第１の標本周期で標本化した離散音声信号か
ら作成した音声素片を、与えられた音韻情報に基づいて
選択し、この選択した音声素片を時間軸方向に伸縮させ
ながら接続することによって離散音声信号を合成する音
声合成手段であって、上記合成した離散音声信号の標本
周期を上記第１の標本周期とは異なる第２の標本周期に
変換することが可能な音声合成手段と、この音声合成手
段から出力される離散音声信号を上記第２の標本周期と
は異なる第３の標本周期でアナログ音声信号に変換する
ディジタル／アナログ変換手段とを備えたことを特徴と
する。ここで、音声合成手段における声素片接続時の音
声素片に対する時間軸方向への伸縮の度合いを、上記第
２の標本周期及び第３の標本周期に基づいて定めるとよ
い。

【００６６】この発明においては、音声素片作成時の第
１の標本周期とは異なる第２の標本周期に合成音声を変
換した後、第２の標本周期とは異なる第３の標本周期で
Ｄ／Ａ変換を行うことにより、音声のスペクトルが周波
数対数軸上でシフトするため、同じ特徴パラメータを用
いて異なる声質の音声を合成することができるが、さら
にここで、音声素片を時間軸方向に伸縮させながら接続
することによって、例えば、第２の標本周期及び第３の
標本周期に基づいて定められる度合いで時間軸方向に伸
縮させながら接続することによって、合成する音声の発
話速度を適切に制御でき、なおかつ、合成する音声のス
ペクトル過渡部分の時間変化も適切に制御できるから、
声質を変化させながら自然な発話速度で明瞭な音声が合
成できる。

【００６７】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記音声合成手段
では、選択した音声素片を声質選択手段により選択指定
された声質に応じて定められる度合いで時間軸方向に伸
縮させながら接続することによって離散音声信号を合成
し、この合成した離散音声信号の標本周期を選択指定さ
れた声質に応じて定められる第２の標本周期に変換する
構成とすることも可能である。この場合、選択された声
質に応じて定められる第２の標本周期に合成音声を変換
した後、第３の標本周期でＤ／Ａ変換を行うことによ
り、音声のスペクトルが周波数対数軸上でシフトするた
め、同じ特徴パラメータを用いて異なる声質の音声を合
成することができるが、さらにここで、合成時に音声素
片を選択された声質に応じた度合で時間軸方向に伸縮さ
せながら接続することによって、合成する音声の発話速
度を適切に制御でき、なおかつ、合成する音声のスペク
トル過渡部分の時間変化も適切に制御できるから、声質
を変化させながら自然な発話速度で明瞭な音声が合成で
きる。

【００６８】次に、本発明の第１７の観点に係る音声合
成装置は、前記第８の観点に係る音声合成装置に対応す
るもので、第１の標本周期で標本化した離散音声信号に
第１のフレーム周期の時間窓をかけて分析して得られる
音声の特徴パラメータフレームの時系列から所定の合成
単位で切り出した音声素片を複数蓄積する音声素片蓄積
手段と、この音声素片蓄積手段から入力音韻情報に基づ
いて音声素片を選択し接続して合成パラメータフレーム
の時系列を生成する合成パラメータフレーム時系列生成
手段と、この合成パラメータフレーム時系列生成手段に
より生成された合成パラメータフレームの時系列から上
記第１のフレーム周期とは異なる第２のフレーム周期で
離散音声信号を合成する合成手段と、この合成手段によ
って合成された離散音声信号の標本周期を上記第１の標
本周期とは異なる第２の標本周期に変換する標本周期変
換手段と、この標本周期変換手段によって標本周期が変
換された離散音声信号を上記第２の標本周期とは異なる
第３の標本周期でアナログ音声信号に変換するディジタ
ル／アナログ変換手段とを備えたことを特徴とする。こ
こで、上記第２のフレーム周期を、上記第１のフレーム
周期、第２の標本周期及び第３の標本周期に基づいて定
めるとよい。

【００６９】この発明においては、音声素片作成時の第
１の標本周期とは異なる第２の標本周期に合成音声を変
換した後、第２の標本周期とは異なる第３の標本周期で
Ｄ／Ａ変換を行うことにより、音声のスペクトルが周波
数対数軸上でシフトするため、同じ特徴パラメータを用
いて異なる声質の音声を合成することができるが、さら
にここで、合成時の第２のフレーム周期を第１のフレー
ム周期、第２の標本周期及び第３の標本周期に基づいて
定めるなどして、分析時の窓の周期（第１のフレーム周
期）と異ならせることにより、合成する音声の発話速度
を適切に制御できるから、声質を変化させながら自然な
発話速度の音声が合成できる。

【００７０】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記音声合成手段
では、上記第２のフレーム周期と第２の標本周期が声質
選択手段により選択指定された声質に応じて定められる
構成とすることも可能である。この場合、選択された声
質に応じて定められる第２の標本周期に合成音声を変換
した後、第３の標本周期でＤ／Ａ変換を行うことによ
り、音声のスペクトルが周波数対数軸上でシフトするた
め、同じ特徴パラメータを用いて異なる声質の音声を合
成することができるが、さらにここで、合成時の第２の
フレーム周期を選択された声質に応じて定め、分析時の
窓の周期（第１のフレーム周期）と異ならせることによ
り、合成する音声の発話速度を適切に制御できるから、
声質を変化させながら自然な発話速度の音声が合成でき
る。

【００７１】次に、本発明の第１８の観点に係る音声合
成装置は、前記第９の観点に係る音声合成装置に対応す
るもので、第１の標本周期とは異なる第２の標本周期及
び第２の標本周期とは異なる第３の標本周期に基づいて
入力韻律情報から音声の基本周波数パターンを生成する
ピッチパターン生成手段と、（入力音韻情報に基づいて
生成された音韻パラメータと上記ピッチパターン生成手
段によって生成された基本周波数パターンとから）合成
された離散音声信号の標本周期を上記第２の標本周期に
変換する標本周期変換手段と、この標本周期変換手段に
よって標本周期が変換された離散音声信号を上記第３の
標本周期でアナログ音声信号に変換するディジタル／ア
ナログ変換手段とを備えたことを特徴とする。

【００７２】この発明においては、音声素片作成時の第
１の標本周期とは異なる第２の標本周期に合成音声を変
換した後、第２の標本周期とは異なる第３の標本周期で
Ｄ／Ａ変換を行うことにより、音声のスペクトルが周波
数対数軸上でシフトするため、同じ特徴パラメータを用
いて異なる声質の音声を合成することができるが、さら
にここで、第２の標本周期及び第３の標本周期に基づい
て合成の基本周波数パターンを定めることにより、合成
する音声のピッチ（声の高さ）を適切に制御できるか
ら、声質を変化させながら自然なピッチの音声が合成で
きる。

【００７３】この他、合成する音声の声質を選択指定す
るための声質選択手段をさらに設け、上記ピッチパター
ン生成手段では、声質選択手段により選択指定された声
質に応じて上記韻律情報から音声の基本周波数パターン
が生成され、上記標本周期変換手段では、合成された離
散音声信号の標本周期が声質選択手段により選択指定さ
れた声質に応じて定められる第２の標本周期に変換され
る構成とすることも可能である。この場合、選択された
声質に応じて定められる第２の標本周期に合成音声を変
換した後、第３の標本周期でＤ／Ａ変換を行うことによ
り、音声のスペクトルが周波数対数軸上でシフトするた
め、同じ特徴パラメータを用いて異なる声質の音声を合
成することができるが、さらにここで、選択された声質
に応じて合成の基本周波数パターンを決定することによ
り、合成する音声のピッチ（声の高さ）を適切に制御で
きるから、声質を変化させながら自然なピッチの音声が
合成できる。

【００７４】

【発明の実施の形態】以下、本発明の実施の形態につき
図面を参照して説明する。

【００７５】［第１の実施形態］図１は本発明の第１の
実施形態に係る音声の分析合成装置の概略構成を示すブ
ロック図である。

【００７６】図１において、メモリ１１には、１１０２
５Ｈｚ（第１の標本周期）でサンプリング（標本化）し
た音声（離散音声信号）に対して、フレーム周期（第１
のフレーム周期）１０msecで窓幅２０msecのハニング窓
をかけ、従来技術にて説明した手順で得られる０次〜２
５次までの低次ケプストラム係数のパラメータフレーム
の時系列（特徴パラメータ）と、各フレームに対応した
音声の有声・無声情報が記憶されている。低次ケプスト
ラム係数については従来技術において説明済みであるの
で、ここでは省略する。

【００７７】一方、メモリ１２には、所定の基本周波数
抽出方法により同じ音声から得られる、音声の基本周波
数の時系列パターンが記憶されている。

【００７８】合成フィルタ処理部１３は、これら２つの
メモリ１１，１２より各データを読み出し、メモリ１１
より読み出された音声のパラメータフレーム（ケプスト
ラム係数）をフィルタ係数とするＬＭＡフィルタ（図示
せず）を、有声区間ではメモリ１２より読み出された音
声の基本周波数の時系列パターン（ピッチパターン）に
基づいた周期パルスで、無声区間ではランダムノイズで
駆動することにより所望の音声（離散音声信号）を合成
する。

【００７９】ここまでの処理はプログラムによって行わ
れるため、合成フィルタ処理部１３（内のＬＭＡフィル
タ）から出力される音声は離散音声信号である。そこ
で、この離散音声信号をＤ／Ａ変換器１４に供給し、電
気的なアナログ信号に変換する。こうして得られた音声
のアナログ信号をアンプ１５にて増幅し、スピーカ１６
を駆動することにより聴覚で知覚できる音声を得ること
ができる。

【００８０】ここまでは従来技術で挙げた（図２３の分
析合成装置の）例とほぼ同じである。本実施形態のポイ
ントは、声質切替部１７及び声質制御部１８が加えられ
たことにある。なお、Ｄ／Ａ変換器１４はハードウェア
により構成されているが、その変換のサンプリング周波
数はソフトウェアから制御可能なようになっている。

【００８１】声質切替部１７は、ユーザによる指定もし
くはアプリケーションプログラム等によって合成する際
の声質を切り替え指定することができるようになってい
る。本実施形態では、この声質切替部１７にて３種類の
声質が指定可能であるものとする。

【００８２】声質制御部１８は、声質切替部１７で指定
された声質に応じて１１０２５Ｈｚ，１２０００ＨＺ，
１００００Ｈｚのいずれかのサンプリング周波数（第２
の標本周期）でディジタル／アナログ変換（Ｄ／Ａ変
換）を行うようにＤ／Ａ変換器１４を制御する。

【００８３】メモリ１１に蓄えられたケプストラムを作
成した際の音声のサンプリング周波数（第１の標本周
期）と同じサンプリング周波数、即ち１１０２５Ｈｚ
で、Ｄ／Ａ変換器１４がＤ／Ａ変換が行えば、元の音声
の声質で音声合成することができる。

【００８４】一方、Ｄ／Ａ変換器１４が他のサンプリン
グ周波数（第１の標本周期とは異なる第２の標本周期）
でＤ／Ａ変換すれば、図２に示すように、音声スペクト
ル（図はスペクトル包絡）を周波数軸方向にシフトした
効果が得られるため、音声の個人性が変化し、こうして
得られるアナログ音声信号の声質は、元となる音声の声
質とは異なったものとなる。

【００８５】［第２の実施形態］前記第１の実施形態に
おいては、声質切替部１７及び声質制御部１８を設けた
ことで、合成音声の声質を簡単に増やすことができるも
のの、合成される音声のスピードが声質により異なる。

【００８６】即ち、（ケプストラム作成時のサンプリン
グ周波数）＞（Ｄ／Ａ変換のサンプリング周波数）のと
きには、合成される音声のスピードは遅くなる。逆に、
（ケプストラム作成時のサンプリング周波数）＜（Ｄ／
Ａ変換のサンプリング周波数）のときには、合成される
音声のスピードは早くなる。

【００８７】このような合成される音声のスピードの違
いは、Ｄ／Ａ変換時のサンプリング周波数が前記第１の
実施形態程度の違い（９１％，１０９％）ではあまり問
題とはならない。しかし以下に述べるように、Ｄ／Ａ変
換時のサンプリング周波数（第２の標本周期）が、メモ
リ１１に蓄えられたケプストラムを作成した際の音声の
サンプリング周波数（第１の標本周期）と大きく異なる
場合には、問題となる。

【００８８】まず、ケプストラム作成時のサンプリング
周波数と合成時のＤ／Ａ変換のサンプリング周波数の比
が１に近ければ声質は変化も小さく、逆にこの比が１か
ら離れれば声質は大きく変化する。したがって、声質を
大きく変えようとすれば、これら両サンプリング周波数
の比を例えば５０％，２００％程度に設定すればよい
が、これでは合成音声のスピードもそれぞれ元の音声の
５０％，２００％、即ち半分と倍になり、かなり聞きづ
らくなる。

【００８９】そこで、合成時のＤ／Ａ変換のサンプリン
グ周波数がケプストラム作成時のサンプリング周波数と
大きく異なった場合でも、合成音声のスピードを一定に
できるようにした第２の実施形態につき説明する。

【００９０】図３は本発明の第２の実施形態に係る音声
の分析合成装置の概略構成を示すブロック図であり、図
１と同一部分には同一符号を付してある。

【００９１】本実施形態のポイントは、図１中の合成フ
ィルタ処理部１３に代えて、合成時のフレーム周期が制
御可能な合成フィルタ処理部２３を設けると共に、図１
中の声質制御部１８に代えて、Ｄ／Ａ変換のサンプリン
グ周波数だけでなく合成時のフレーム周期を制御する声
質制御部２８を設け、当該声質制御部２８により、声質
切替部１７の指定に応じて、Ｄ／Ａ変換器１４でのＤ／
Ａ変換のサンプリング周波数と同時に、合成フィルタ処
理部２３での合成時のフレーム周期を制御するところに
ある。

【００９２】本実施形態では、前記第１の実施形態と同
様に声質切替部１７にて３種類の声質が指定可能であ
る。声質制御部２８は声質切替部１７で指定された声質
に応じて、例えば１１０２５Ｈｚ，８０００Ｈｚ，１６
０００Ｈｚのいずれかのサンプリング周波数でＤ／Ａ変
換を行うようにＤ／Ａ変換器１４を制御する。

【００９３】同時に声質制御部２８は、声質切替部１７
によって指定された声質に応じて、合成フィルタ処理部
２３で行われる合成のフレーム周期を設定する。これに
より合成フィルタ処理部２３では、メモリ１１より読み
出された音声のパラメータフレーム（ケプストラム係
数）を設定されたフレーム周期で（ＬＭＡフィルタに）
入力し、当該フレーム周期で音声（離散音声信号）を合
成する。

【００９４】合成のフレーム周期は次式により与えられ
る。

【００９５】（フレーム周期）＝（分析フレーム周期）×（分析サンプリング周期）／（Ｄ／Ａ変換のサンプリング周期）＝（分析フレーム周期）×（Ｄ／Ａ変換のサンプリング周波数）／（分析サンプリング周波数）したがって、ケプストラム作成時（分析時）の音声のサ
ンプリング周波数（第１の標本周期）と同じサンプリン
グ周波数、即ち１１０２５ＨｚでＤ／Ａ変換を行う際に
は、声質制御部２８は上式に基づき、合成時のフレーム
周期をケプストラム作成時のフレーム周期である分析フ
レーム周期（第１のフレーム周期）と同じ１０msecで合
成するよう合成フィルタ処理部１３を制御する。但し、
メモリ１１に蓄えられたケプストラムは前記第１の実施
形態と同じ条件で作成されているものとする。

【００９６】また声質制御部２８は、ケプストラム作成
時（分析時）の音声のサンプリング周波数とは異なるサ
ンプリング周波数（第１の標本周期とは異なる第２の標
本周期）、例えば８０００ＨｚにてＤ／Ａ変換を行う場
合には、１０[msec]×８０００[Hz]／１１０２５[Hz]＝７．３[m
sec] のフレーム周期（第１のフレーム周期とは異なる第２の
フレーム周期）で合成を行うよう制御し、１６０００Ｈ
ｚにてＤ／Ａ変換を行う場合には、１０[msec]×１６０００[Hz]／１１０２５[Hz]＝１４．
５[msec] のフレーム周期（第１のフレーム周期とは異なる第２の
フレーム周期）で合成を行うよう制御する。

【００９７】このように本実施形態においては、分析時
と異なるサンプリング周波数（第１の標本周期とは異な
る第２の標本周期）でＤ／Ａ変換したときの合成音声の
スピードの変化を、合成フィルタ処理部２３での合成の
フレーム周期（第２のフレーム周期）をケプストラム作
成時（分析時）のフレーム周期（第１のフレーム周期）
とは異ならせることで相殺することができる。

【００９８】したがって、分析時のサンプリング周波数
と異なる８０００Ｈｚあるいは１６０００ＨｚでＤ／Ａ
変換を行っても、同じスピードの音声のアナログ信号を
得ることができる。

【００９９】［第３の実施形態］ところで、前記第１の
実施形態においては、Ｄ／Ａ変換のサンプリング周波数
を分析時のものと変えると、声の高さ、即ち音声のピッ
チの変化を招く。

【０１００】即ち、（ケプストラム作成時のサンプリン
グ周波数）＞（Ｄ／Ａ変換のサンプリング周波数）のと
きには、合成される音声のピッチは低くなる。逆に、
（ケプストラム作成時のサンプリング周波数）＜（Ｄ／
Ａ変換のサンプリング周波数）のときには、合成される
音声のピッチは高くなる。

【０１０１】このような合成される音声のピッチの違い
は、Ｄ／Ａ変換時のサンプリング周波数が前記第１の実
施形態程度の違い（９１％，１０９％）ではあまり問題
とはならない。しかし、声質を大きく変えようとして、
両サンプリング周波数の比を例えば５０％，２００％程
度に設定すれば、合成音声のピッチもそれぞれ５０％，
２００％と変化するため、ケプストラム作成時と同じ１
１０２５ＨｚでＤ／Ａ変換したときの音声（あるいは原
音声）と比較して、前者はピッチが１[oct] （オクター
ブ）低い音声が合成され、後者は１[oct] 高い音声が合
成されるので聞きづらくなるという問題が発生する。

【０１０２】そこで、合成時のＤ／Ａ変換のサンプリン
グ周波数がケプストラム作成時のサンプリング周波数と
大きく異なった場合でも、合成音声のピッチを一定にで
きるようにした第３の実施形態につき説明する。

【０１０３】図４は本発明の第３の実施形態に係る音声
の分析合成装置の概略構成を示すブロック図であり、図
１と同一部分には同一符号を付してある。

【０１０４】本実施形態のポイントは、図１中の合成フ
ィルタ処理部１３に代えて、合成時のフレーム周期が制
御可能な合成フィルタ処理部３３を設けると共に、メモ
リ１２と合成フィルタ処理部３３との間にメモリ１２よ
り読み出された基本周波数（の時系列）パターン（ピッ
チパターン）を周波数の異なる別の基本周波数パターン
に変換（ピッチ変調）して合成フィルタ処理部３３に与
えるピッチ変調処理部３１を設け、さらに図１中の声質
制御部１８に代えて、Ｄ／Ａ変換のサンプリング周波数
だけでなく合成時のフレーム周期及びピッチの変調を制
御する声質制御部３８を設け、当該声質制御部３８によ
り、声質切替部１７の指定に応じて、Ｄ／Ａ変換器１４
でのサンプリング周波数と合成フィルタ処理部３３での
合成時のフレーム周期を制御すると同時に、ピッチ変調
処理部３１でのピッチの変調を制御するところにある。

【０１０５】本実施形態では、前記第１の実施形態と同
様に声質切替部１７にて３種類の声質を指定可能であ
る。声質制御部３８は声質切替部１７で指定された声質
に応じて、例えば１１０２５Ｈｚ，８０００Ｈｚ，１６
０００Ｈｚのいずれかのサンプリング周波数でＤ／Ａ変
換を行うようにＤ／Ａ変換器１４を制御する。

【０１０６】声質制御部３８は、声質切替部１７によっ
て指定された声質に応じて、Ｄ／Ａ変換器１４のＤ／Ａ
変換のサンプリング周波数を設定すると同時に、合成フ
ィルタ処理部３３で行われる合成のフレーム周期を設定
する。合成のフレーム周期は次式により与えられる。

【０１０７】（フレーム周期）＝（分析フレーム周期）×（分析サンプリング周期）／（Ｄ／Ａ変換のサンプリング周期）＝（分析フレーム周期）×（Ｄ／Ａ変換のサンプリング周波数）／（分析サンプリング周波数）なお、メモリ１１に蓄えられたケプストラムは前記第１
の実施形態と同じ条件で作成されているものとする。

【０１０８】声質制御部３８はさらに、合成フィルタ処
理部３３に与えるピッチ（ピッチパターン）が、（合成フィルタ処理部３３に与えるピッチ）＝（メモリ１２より読み出したピッチ）×（Ｄ／Ａ変換のサンプリング周期）／（分析時のサンプリング周期）＝（メモリ１２より読み出したピッチ）×（分析時のサンプリング周波数）／（Ｄ／Ａ変換のサンプリング周波数）となるように、ピッチ変調処理部３１を制御する。

【０１０９】したがって、ケプストラム作成時の音声の
サンプリング周波数（第１の標本周期）と同じサンプリ
ング周波数、即ち１１０２５ＨｚでＤ／Ａ変換を行う際
には、声質制御部３８は上式に基づき、合成フィルタ処
理部３３に与えるピッチを分析時と同じピッチとなるよ
うピッチ変調処理部３１を制御する。

【０１１０】また声質制御部３８は、ケプストラム作成
時（分析時）の音声のサンプリング周波数とは異なるサ
ンプリング周波数（第１の標本周期とは異なる第２の標
本周期）、例えば８０００ＨｚにてＤ／Ａ変換を行う場
合には、分析時のピッチを（１１０２５[Hz]／８０００
[Hz]）倍して合成フィルタ処理部３３に与えるように、
１６０００ＨｚでＤ／Ａ変換を行う場合には、同じく分
析時のピッチを（１１０２５[Hz]／１６０００[Hz]）倍
して合成フィルタ処理部３３に与えるように、ピッチ変
調処理部３１を制御する。

【０１１１】このように本実施形態においては、合成フ
ィルタ処理部３３に与えるピッチを声質制御部３８の制
御のもとでピッチ変調処理部３１にて予め変調しておく
ことにより、分析時と異なるサンプリング周波数でＤ／
Ａ変換したときに生じる合成音声のピッチの変化を相殺
することができる。

【０１１２】したがって、分析時のサンプリング周波数
と異なる８０００Ｈｚあるいは１６０００ＨｚでＤ／Ａ
変換を行っても、同じ声の高さの音声のアナログ信号を
得ることができる。

【０１１３】［第４の実施形態］図５は本発明の第４の
実施形態に係る音声の規則合成装置の概略構成を示すブ
ロック図である。

【０１１４】この音声規則合成装置は、例えばパーソナ
ルコンピュータ等の情報処理装置上で専用のソフトウェ
ア（文音声変換ソフトウェア）を実行することにより実
現されるもので、文音声変換（ＴＴＳ）処理機能、即ち
テキストから音声を生成する文音声変換処理（文音声合
成処理）機能を有しており、その機能構成は、大別して
言語処理部４１と、音声合成部４２とに分けられる。

【０１１５】言語処理部４１は、入力文、例えば漢字か
な混じり文を解析して読み情報とアクセント情報を生成
する処理と、これら情報に基づき音韻記号系列・アクセ
ント情報が記述された音声記号列を生成する処理を司
る。

【０１１６】音声合成部４２は、言語処理部４１の出力
である音声記号列をもとに音声を生成する処理を司る。

【０１１７】さて、図５の音声規則合成装置において、
文音声変換（読み上げ）の対象となる文書（ここでは日
本語文書）はテキストファイル４３として保存されてい
る。本装置では、文音声変換ソフトウェアに従い、当該
ファイル４３から漢字かな混じり文を１文ずつ読み出し
て、言語処理部４１及び音声合成部４２2 により以下に
述べる文音声変換処理を行い、音声を合成する。

【０１１８】まず、テキストファイル４３から読み出さ
れた漢字かな混じり文は、言語処理部４１内の言語解析
処理部４４に入力される。

【０１１９】言語解析処理部４４は、入力される漢字か
な混じり文に対して形態素解析を行い、読み情報とアク
セント情報を生成する。形態素解析とは、与えられた文
の中で、どの文字列が語句を構成しているか、そしてそ
の語の構造がどのようなものかを解析する作業である。

【０１２０】そのために言語解析処理部４４は、文の最
小構成要素である「形態素」を見出し語にもつ形態素辞
書４５と形態素間の接続規則が登録されている接続規則
ファイル４６を利用する。即ち言語解析処理部４４は、
入力文と形態素辞書４５とを照合することで得られる全
ての形態素系列候補を求め（総当たり法）、その中か
ら、接続規則ファイル４６を参照して文法的に前後に接
続できる組み合わせを出力する。形態素辞書４５には、
解析時に用いられる文法情報と共に、形態素の読み並び
にアクセントの型が登録されている。このため、形態素
解析により形態素が定まれば、同時に読みとアクセント
型も与えることができる。

【０１２１】例えば、「公園へ行って本を読みます」と
いう文に対して形態素解析を行うと、／公園／ヘ／行って／本／を／読み／ます／。

【０１２２】と形態素に分割される。各形態素に読みと
アクセント型が与えられ、／コウエン／エ／イッテ／ホ＾ン／ヲ／ヨミ／マ＾ス／となる。ここで「＾」の入っている形態素は、その直前
の音節でピッチが高く、その直後の音節ではピッチが落
ちるアクセントであることを意味する。また「＾」がな
い場合は、平板型のアクセントであることを意味する。

【０１２３】ところで、人間が文章を読むときには、こ
のような形態素単位でアクセントを付けて読むことはせ
ず、幾つかの形態素をひとまとめにして、そのまとまり
にアクセントを付けて読んでいる。

【０１２４】そこで、このようなことを考慮して、言語
解析処理部４４ではさらに、一つのアクセント句（アク
セントを与える単位）で形態素をまとめると同時に、ま
とめたことによるアクセントの移動も推定する。これに
加えて言語解析処理部４４は、母音の無声化や読み上げ
の際のポーズ（息継ぎ）等の情報も付加し、上記の例で
は、最終的に次のような読み情報を生成する。

【０１２５】／コーエンエ／イッテ．／ホ＾ンオ／ヨミ
マ＾（ス）／ここで、ピリオド「．」は息継ぎを、「（）」は母音
が無声化した音節を表わす。

【０１２６】さて、上記のようにして言語処理部４１内
の言語解析処理部４４により読み情報が生成されると、
音声合成部４２内の音韻継続時間計算処理部４７が起動
される。音韻継続時間計算処理部４７は、言語解析処理
部４４で生成した読み情報に従って、入力文に含まれる
各音節の子音部ならびに母音部の継続時間（単位はms）
を決定する。

【０１２７】この音韻継続時間計算処理部４７での継続
時間の決定処理は、子音（Ｃ）と母音（Ｖ）の境界（Ｃ
Ｖわたり）の位置が等間隔に並ぶようにするという、極
めて簡単なアルゴリズムにより実現されている。

【０１２８】ＣＶわたりの間隔（発話速度パラメータと
してのＣＶわたりの間隔）は、音声合成部４２内の発話
速度制御部４８より与えられる。図示しないが、本実施
形態で用いられるソフトウェアではユーザが合成音声の
スピードを指定することが可能となっている。そして、
ユーザが指定した音声のスピードがこの発話速度制御部
４８に与えられることにより、当該発話速度制御部４８
が（音韻継続時間計算処理部４７での継続時間の決定処
理にて決定される）先程のＣＶわたりの間隔を調整して
合成音声の速度を実際に変化させている。但し、日本語
の音声は、発声の速度を変えても子音の継続時間はほぼ
一定であることが分析結果から分かっているので、子音
の継続時間は一定に保ち、母音の継続時間を調節してＣ
Ｖわたりの間隔を変える。

【０１２９】音韻継続時間計算処理部４７により入力文
に含まれる各音節の（子音部ならびに母音部の）継続時
間が決定されると、同じ音声合成部４２内のピッチ生成
処理部４９が起動される。ピッチ生成処理部４９は音韻
継続時間計算処理部４７により決定された継続時間と、
（言語処理部４１内の）言語解析処理部４４により決定
されたアクセント情報に基づいて、まず点ピッチ位置を
設定する。次にピッチ生成処理部４９は、設定した複数
の点ピッチを直線で補間して例えば１０msec毎のピッチ
パターン（基本周波数パターン）を得る。

【０１３０】一方、音声合成部４２内の音韻パラメータ
生成処理部５０は、（言語処理部４１内の）言語解析処
理部４４から渡される音声記号列の音韻情報をもとに音
韻パラメータを生成する処理を、例えばピッチ生成処理
部４９によるピッチパターン生成処理と並行して次のよ
うに行う。

【０１３１】まず本実施形態では、サンプリング周波数
１１０２５Ｈｚ（第１の標本周期）で標本化した実音声
を改良ケプストラム法により窓長２０msec、フレーム周
期（第１のフレーム周期）１０msecで分析して得た０次
から２５次のケプストラム係数を子音＋母音（ＣＶ）の
単位で日本語音声の合成に必要な全音節を切り出した計
１３７個の音声素片が蓄積された音声素片ファイル（図
示せず）が用意されている。この音声素片ファイルの内
容は、文音声変換ソフトウェアに従う文音声変換処理の
開始時に、例えばメインメモリ（図示せず）に確保され
た音声素片領域（以下音声素片メモリと称する）５１に
読み込まれているものとする。

【０１３２】音韻パラメータ生成処理部５０は、（言語
処理部４１内の）言語解析処理部４４から渡される音声
記号列中の音韻情報に従って、上記したＣＶ単位の音声
素片を音声素片メモリ５１から順次読み出し、読み出し
た音声素片を接続することにより合成すべき音声の音韻
パラメータ（特徴パラメータ）を生成する。

【０１３３】ピッチ生成処理部４９によりピッチパター
ンが生成され、音韻パラメータ生成処理部５０により音
韻パラメータが生成されると、音声合成部４２内の合成
フィルタ処理部５２が起動される。この合成フィルタ処
理部５２は、図６に示すように、ホワイトノイズ発生部
５２１、インパルス発生部５２２、駆動音源切替部５２
３、及びＬＭＡフィルタ５２４から構成されており、上
記生成されたピッチパターンと音韻パラメータから、次
のようにして音声を合成する。

【０１３４】まず、音声の有声部（Ｖ）では、駆動音源
切替部５２３によりインパルス発生部５２２側に切り替
えられる。インパルス発生部５２２は、ピッチ生成処理
部４９により生成されたピッチパターンに応じた間隔の
インパルスを発生し、このインパルスを音源としてＬＭ
Ａフィルタ５２４を駆動する。

【０１３５】一方、音声の無声部（Ｕ）では、駆動音源
切替部５２３によりホワイトノイズ発生部５２１側に切
り替えられる。ホワイトノイズ発生部５２１はホワイト
ノイズを発生し、このホワイトノイズを音源としてＬＭ
Ａフィルタ５２４を駆動する。ＬＭＡフィルタ５２４は
音声のケプストラムを直接フィルタ係数とするものであ
る。

【０１３６】本実施形態において音韻パラメータ生成処
理部５０により生成された音韻パラメータは前記したよ
うにケプストラムであることから、この音韻パラメータ
がＬＭＡフィルタ５２４のフィルタ係数となり、駆動音
源切替部５２３により切り替えられる音源によって駆動
されることで、合成音声を出力する。

【０１３７】合成フィルタ処理部５２（内のＬＭＡフィ
ルタ５２４）により合成された音声は離散音声信号であ
り、Ｄ／Ａ変換器５３によりアナログ信号に変換し、ア
ンプ５４を通してスピーカ５５に出力することで、初め
て音として聞くことができる。

【０１３８】ここまでの処理は、図２４を参照しながら
［従来技術］の欄にて説明した例とほぼ同じである。

【０１３９】本実施形態のポイントは、音声合成部４２
内に（図１中の声質切替部１７及び声質制御部１８に相
当する）声質切替部５６及び声質制御部５７が加えられ
たことにある。なお、Ｄ／Ａ変換器５３はハードウェア
により構成されているが、その変換のサンプリング周波
数はソフトウェアから制御可能なようになっている。

【０１４０】声質切替部５６は、ユーザによる指定もし
くはアプリケーションプログラム等によって合成する際
の声質を切り替えることができるようになっている。本
実施形態では、この声質切替部５６にて３種類の声質が
指定可能であるものとする。

【０１４１】声質制御部５７は、声質切替部５６で指定
された声質に応じて１１０２５Ｈｚ，１２０００ＨＺ，
１００００Ｈｚのいずれかのサンプリング周波数でＤ／
Ａ変換を行うようにＤ／Ａ変換器５３を制御する。

【０１４２】音声素片を作成した際のサンプリング周波
数（第１の標本周期）と同じサンプリング周波数、即ち
１１０２５ＨｚでＤ／Ａ変換器５３がＤ／Ａ変換を行え
ば、元の音声の声質で音声合成することができる。一
方、Ｄ／Ａ変換器５３が他のサンプリング周波数（第１
の標本周期とは異なる第２の標本周期）でＤ／Ａ変換す
れば、前記第１の実施形態で既に述べたように、音声ス
ペクトルを図２に示すように周波数軸方向にシフトした
効果が得られるため、音声の個人性が変化し、こうして
得られるアナログ音声信号の声質は、音声素片の元とな
っている音声の声質とは異なったものとなる。

【０１４３】［第５の実施形態］前記第４の実施形態に
おいては、声質切替部５６及び声質制御部５７を設けた
ことで、合成音声の声質を簡単に増やすことができるも
のの、合成される音声のスピードが声質により異なる。

【０１４４】即ち、（素片作成時のサンプリング周波
数）＞（Ｄ／Ａ変換のサンプリング周波数）のときに
は、合成される音声のスピードは遅くなる。逆に、（素
片作成時のサンプリング周波数）＜（Ｄ／Ａ変換のサン
プリング周波数）のときには、合成される音声のスピー
ドは早くなる。

【０１４５】このような合成される音声のスピードの違
いは、Ｄ／Ａ変換時のサンプリング周波数が前記第４の
実施形態程度の違い（９１％，１０９％）ではあまり問
題とはならない。しかし以下に述べるように、Ｄ／Ａ変
換時のサンプリング周波数が、音声素片メモリ５１に読
み込まれている音声素片を作成した際の音声のサンプリ
ング周波数と大きく異なる場合には、問題となる。

【０１４６】まず、素片作成時のサンプリング周波数と
合成時のＤ／Ａ変換のサンプリング周波数の比が１に近
ければ声質は変化も小さく、逆にこの比が１から離れれ
ば声質は大きく変化する。したがって、声質を大きく変
えようとすれば、これら両サンプリング周波数の比を例
えば５０％，２００％程度に設定すればよいが、これで
は合成音声のスピードもそれぞれ元の音声の５０％，２
００％、即ち半分と倍になり聞きづらくなる。

【０１４７】そこで、合成時のＤ／Ａ変換のサンプリン
グ周波数が素片作成時のサンプリング周波数と大きく異
なった場合でも、合成音声のスピードを一定にできるよ
うにした第５の実施形態につき説明する。

【０１４８】図７は本発明の第５の実施形態に係る音声
の規則合成装置の概略構成を示すブロック図であり、図
５と同一部分には同一符号を付してある。

【０１４９】本実施形態のポイントは、図５中の発話速
度制御部４８に代えて、合成音声のスピード（発話速
度）が制御可能な発話速度制御部６８を設けると共に、
図５中の声質制御部５７に代えて、Ｄ／Ａ変換のサンプ
リング周波数だけでなく合成音声のスピードを制御する
声質制御部６７を設け、当該声質制御部６７により、声
質切替部５６の指定に応じて、Ｄ／Ａ変換器５３でのＤ
／Ａ変換のサンプリング周波数と同時に発話速度制御部
４８での合成音声のスピードを制御するところにある。

【０１５０】本実施形態では、前記第４の実施形態と同
様に声質切替部５６にて３種類の声質が指定可能であ
る。声質制御部６７は声質切替部５６で指定された声質
に応じて、例えば１１０２５Ｈｚ，８０００Ｈｚ，１６
０００Ｈｚのいずれかのサンプリング周波数でＤ／Ａ変
換を行うようにＤ／Ａ変換器５３を制御する。

【０１５１】同時に声質制御部６７は、声質切替部５６
によって指定された声質に応じて、発話速度制御部４８
を次のように制御する。即ち声質制御部６７は、先に説
明したＣＶわたりの間隔が、（ＣＶわたりの間隔）＝（１１０２５ＨｚでＤ／Ａ変換
時のＣＶわたりの間隔）×（Ｄ／Ａ変換のサンプリング
周波数）／（素片作成時のサンプリング周波数）となるよう発話速度制御部６８を制御する。

【０１５２】したがって、８０００ＨｚにてＤ／Ａ変換
を行う際には、声質制御部６７は上式に基づき、１１０
２５ＨｚでＤ／Ａ変換するときのＣＶわたり間隔の（１
１０２５[Hz]／８０００[Hz]）倍のＣＶわたり間隔とな
るよう発話速度制御部６８を制御する。また声質制御部
６７は、１６０００ＨｚでＤ／Ａ変換を行う場合には、
１１０２５ＨｚでＤ／Ａ変換するときのＣＶわたり間隔
の（１１０２５[Hz]／１６０００[Hz]）倍のＣＶわたり
間隔となるよう発話速度制御部６８を制御する。

【０１５３】このように本実施形態においては、音声素
片作成時と異なるサンプリング周波数（第１の標本周期
とは異なる第２の標本周期）でＤ／Ａ変換したときの合
成音声のスピードの変化を、ＣＶわたりの間隔（発話速
度パラメータ）を変えることで相殺することができる。
したがって、音声素片作成時のサンプリング周波数と異
なる８０００Ｈｚあるいは１６０００ＨｚでＤ／Ａ変換
を行っても、ほぼ同じスピードの音声のアナログ信号を
得ることができる。

【０１５４】［第６の実施形態］前記第５の実施形態に
基づいて規則合成を行えば、確かに声質を変えながらも
合成される音声のスピードをほぼ一定に保つことが簡単
に実現できる。しかし既に説明したように、音韻継続時
間計算処理部４７での処理（音韻継続時間計算処理）で
は、ＣＶわたりの間隔を変えても子音の音韻継続時間を
音節毎に一定にするため、音声素片作成時と異なるサン
プリング周波数でＤ／Ａ変換すると、子音の継続時間が
縮んだり、間延びしたりし、この結果、合成される音声
の明瞭性・自然性に影響を及ぼすことがある。

【０１５５】そこで、合成される音声の子音の継続時間
を音節毎に一定に保つことができるようにした第６の実
施形態につき説明する。

【０１５６】図８は本発明の第６の実施形態に係る音声
の規則合成装置の概略構成を示すブロック図であり、図
５または図７と同一部分には同一符号を付してある。

【０１５７】本実施形態のポイントは、図７中の音韻継
続時間計算処理部４７に代えて、音韻継続時間が制御可
能な音韻継続時間計算処理部７７を設けると共に、図７
中の声質制御部６７に代えて、Ｄ／Ａ変換のサンプリン
グ周波数だけでなく音韻継続時間による合成音声のスピ
ードを制御する声質制御部８７を設け、当該声質制御部
８７により、声質切替部５６の指定に応じて、Ｄ／Ａ変
換器５３でのＤ／Ａ変換のサンプリング周波数と同時に
音韻継続時間計算処理部７７での音韻継続時間を制御す
るところにある。

【０１５８】本実施形態では、前記第５の実施形態と同
様に声質切替部５６にて３種類の声質が指定可能であ
る。声質制御部８７は声質切替部５６で指定された声質
に応じて、例えば１１０２５Ｈｚ，８０００Ｈｚ，１６
０００Ｈｚのいずれかのサンプリング周波数でＤ／Ａ変
換を行うようにＤ／Ａ変換器５３を制御する。

【０１５９】同時に声質制御部８７は、声質切替部５６
によって指定された声質に応じて、音韻継続時間計算処
理部７７を次のように制御する。即ち声質制御部８７
は、全ての音韻の継続時間、つまり子音の継続時間と母
音の継続時間が（音韻継続時間）＝（１１０２５ＨｚでＤ／Ａ変換時の
音韻継続時間）×（Ｄ／Ａ変換のサンプリング周波数）
／（素片作成時のサンプリング周波数）となるよう音韻継続時間計算処理部７７を制御する。

【０１６０】したがって、８０００ＨｚにてＤ／Ａ変換
を行う際には、声質制御部８７は上式に基づき、１１０
２５ＨｚでＤ／Ａ変換するときの音韻継続時間の（８０
００[Hz]／１１０２５[Hz]）倍の音韻継続時間となるよ
う音韻継続時間計算処理部７７を制御する。また声質制
御部８７は、１６０００ＨｚでＤ／Ａ変換を行う場合に
は、１１０２５ＨｚでＤ／Ａ変換するときの音韻継続時
間の（１６０００[Hz]／１１０２５[Hz]）倍の音韻継続
時間となるよう音韻継続時間計算処理部７７を制御す
る。

【０１６１】このように本実施形態においては、音声素
片作成時と異なるサンプリング周波数（第１の標本周期
とは異なる第２の標本周期）でＤ／Ａ変換したときの合
成音声のスピードの変化を、各音韻継続時間を変えるこ
とで相殺することができ、かつ合成される音声の子音の
継続時間を音節毎に一定に保つことができる。

【０１６２】［第７の実施形態］前記第５または第６の
実施形態に基づいて合成を行えば、確かに声質を変えな
がらも合成される音声のスピードをほぼ一定に保つこと
ができる。しかし、音声素片作成時のサンプリング周波
数とＤ／Ａ変換時のサンプリング周波数とを違えるとい
うことは、レコードの早回しや遅回しとほぼ同じである
から、音声の過渡部分で時間的に縮んだり間延びするこ
とは避けられない。

【０１６３】例をあげれば、／わ／という発声は、／う
／に近い口の形から急激に唇を開いて／あ／へ移る運動
を発声器管が行う。したがって、Ｄ／Ａ変換時のサンプ
リング周波数を落して、レコードの遅回しのようなこと
をすれば、この変化が緩やかになり、／わ／ではなく、
／うあー／のように聞こえてくる。

【０１６４】そこで、素片作成時と異なるサンプリング
周波数でＤ／Ａ変換したときに生じる合成音声過渡部分
の時間的方向の縮みや間延びを抑えることができるよう
にした第７の実施形態につき説明する。

【０１６５】図９は本発明の第７の実施形態に係る音声
の規則合成装置の概略構成を示すブロック図であり、図
８と同一部分には同一符号を付してある。

【０１６６】本実施形態のポイントは、図８中の音韻パ
ラメータ生成処理部５０に代えて、（音声素片からな
る）音韻パラメータを時間軸方向へ伸縮する機能が付加
された音韻パラメータ生成処理部９０を設けると共に、
図８中の声質制御部８７に代えて、Ｄ／Ａ変換のサンプ
リング周波数及び音韻継続時間だけでなく音韻パラメー
タの時間軸方向への伸縮を制御する声質制御部９７を設
け、当該声質制御部９７により、声質切替部５６の指定
に応じて、Ｄ／Ａ変換器５３でのＤ／Ａ変換のサンプリ
ング周波数及び音韻継続時間計算処理部７７での音韻継
続時間を制御する他に、音韻パラメータ生成処理部９０
を制御し、合成音声の過渡部が縮んでしまうような場合
には、予め音韻パラメータを時間方向に引き伸ばして音
韻パラメータを作成させ、合成音声の過渡部が間延びす
るような場合には、予め音韻パラメータを時間方向に圧
縮して音韻パラメータを作成させるところにある。

【０１６７】本実施形態では、前記第６の実施形態と同
様に声質切替部５６にて３種類の声質が指定可能であ
る。声質制御部９７は声質切替部５６で指定された声質
に応じて、１１０２５Ｈｚ，８０００Ｈｚ，１６０００
Ｈｚのいずれかのサンプリング周波数でＤ／Ａ変換を行
うようにＤ／Ａ変換器４１３を制御する。

【０１６８】同時に声質制御部９７は、声質切替部５６
によって指定された声質に応じて、全ての音韻の継続時
間、即ち子音の継続時間と母音の継続時間を（音韻継続時間）＝（１１０２５ＨｚでＤ／Ａ変換時の
音韻継続時間）×（Ｄ／Ａ変換のサンプリング周波数）
／（素片作成時のサンプリング周波数）となるよう音韻継続時間計算処理部７７を制御する。

【０１６９】さらに、声質制御部９７は音韻パラメータ
生成処理部９０を制御し、Ｄ／Ａ変換のサンプリング周
波数（第２の標本周期）を素片作成時のサンプリング周
波数（第１の標本周期）とは異ならせることによって合
成音声の過渡部が縮んでしまうような場合には、予め音
韻パラメータを時間方向に引き伸ばして音韻パラメータ
を作成させ、合成音声の過渡部が間延びするような場合
には、予め音韻パラメータを時間方向に圧縮して音韻パ
ラメータを作成させる。

【０１７０】もっと正確には、声質制御部９７は、素片
自身の長さを、（Ｄ／Ａ変換のサンプリング周波数／素
片作成時のサンプリング周波数）倍となる伸縮を行って
から接続補間し、音韻パラメータを生成させる。

【０１７１】即ち、本実施形態における声質制御部９７
は、１１０２５ＨｚにてＤ／Ａ変換を行う場合には、音
声素片の伸縮は行わずに音韻パラメータを生成し、８０
００ＨｚでＤ／Ａ変換を行う場合には、音声素片を（８
０００[Hz]／１１０２５[Hz]）倍の長さに縮めてから接
続補間して音韻パラメータを生成し、１６０００Ｈｚで
Ｄ／Ａ変換を行う場合には、音声素片を（１６０００[H
z]／１１０２５[Hz]）倍の長さに延ばしてから接続補間
して音韻パラメータを生成するよう音韻パラメータ生成
処理部９０を制御する。

【０１７２】このように本実施形態においては、素片作
成時と異なるサンプリング周波数（第１の標本周期とは
異なる第２の標本周期）でＤ／Ａ変換したときに生じる
合成音声過渡部分の時間方向の縮みや間延びを、予め音
韻パラメータ生成時に音声素片を伸縮させておくことで
相殺することができる。

【０１７３】［第８の実施形態］前述の第５乃至第７の
実施形態は、ケプストラムやＬＰＣなどを利用した音声
規則合成、即ち音声波形を分析して得られるパラメータ
を用いた音声規則合成だけではなく、波形合成（による
規則合成）にも応用は可能である。しかし、パラメータ
を用いた音声規則合成では、前述の第５乃至第７の実施
形態を用いずとも、声質を変えながら、合成音声のスピ
ードを一定にし、かつ音声過渡部の縮み間延びを起こさ
せない簡便な方法が適用可能である。

【０１７４】そこで、この簡便な方法を、パラメータを
用いた音声規則合成に適用した第８の実施形態につき説
明する。

【０１７５】図１０は本発明の第８の実施形態に係る音
声の規則合成装置の概略構成を示すブロック図であり、
図５と同一部分には同一符号を付してある。

【０１７６】本実施形態のポイントは、図５中の合成フ
ィルタ処理部５２に代えて、合成時のフレーム周期が制
御可能な合成フィルタ処理部１１２を設けると共に、図
５中の声質制御部５７に代えて、Ｄ／Ａ変換のサンプリ
ング周波数だけでなく合成時のフレーム周期を制御する
声質制御部１１７を設け、当該声質制御部１１７によ
り、声質切替部５６の指定に応じて、Ｄ／Ａ変換器５３
でのＤ／Ａ変換のサンプリング周波数と同時に、合成フ
ィルタ処理部１１２での合成時のフレーム周期を制御す
るところにある。

【０１７７】本実施形態では、前記第４の実施形態と同
様に声質切替部５６にて３種類の声質が指定可能であ
る。声質制御部１１７は声質切替部５６で指定された声
質に応じて、１１０２５Ｈｚ，８０００Ｈｚ，１６００
０Ｈｚのいずれかのサンプリング周波数でＤ／Ａ変換を
行うようにＤ／Ａ変換器５３を制御する。

【０１７８】同時に声質制御部１１７は、声質切替部５
６によって指定された声質に応じて、合成フィルタ処理
部１１２で行われる合成のフレーム周期を設定する。こ
れにより合成フィルタ処理部１１２では、音韻パラメー
タ生成処理部５０により生成された音韻パラメータ（ケ
プストラム）を設定されたフレーム周期で（ＬＭＡフィ
ルタに）入力し、当該フレーム周期で音声（離散音声信
号）を合成する。

【０１７９】合成のフレーム周期は次式により与えられ
る。

【０１８０】（フレーム周期）＝（素片作成時のフレーム周期）×（素片作成時のサンプリング周期）／（Ｄ／Ａ変換のサンプリング周期）＝（素片作成時のフレーム周期）×（Ｄ／Ａ変換のサンプリング周波数）／（素片作成時のサンプリング周波数）したがって、音声素片作成時の音声のサンプリング周波
数（第１の標本周期）と同じサンプリング周波数、即ち
１１０２５ＨｚでＤ／Ａ変換を行う際には、声質制御部
１１７は上式に基づき、合成時のフレーム周期を音声素
片作成時のフレーム周期（第１のフレーム周期）と同じ
１０msecで合成するよう合成フィルタ処理部１１２を制
御する。

【０１８１】また声質制御部１１７は、音声素片作成時
の音声のサンプリング周波数とは異なるサンプリング周
波数（第１の標本周期とは異なる第２の標本周期）、例
えば８０００ＨｚにてＤ／Ａ変換を行う場合には、１０[msec]×８０００[Hz]／１１０２５[Hz]＝７．３[m
sec] のフレーム周期（第１のフレーム周期とは異なる第２の
フレーム周期）で合成を行うよう制御し、１６０００Ｈ
ｚにてＤ／Ａ変換を行う場合には、１０[msec]×１６０００[Hz]／１１０２５[Hz]＝１４．
５[msec] のフレーム周期（第１のフレーム周期とは異なる第２の
フレーム周期）で合成を行うよう制御する。

【０１８２】このように本実施形態においては、音声素
片作成時と異なるサンプリング周波数（第１の標本周期
とは異なる第２の標本周期）でＤ／Ａ変換したときの合
成音声のスピードの変化を、合成フィルタ処理部１１２
での合成のフレーム周期（第２のフレーム周期）を音声
素片作成時のフレーム周期（第１のフレーム周期）とは
異ならせることで相殺することができる。

【０１８３】したがって、音声素片作成時のサンプリン
グ周波数とは異なる８０００Ｈｚあるいは１６０００Ｈ
ｚでＤ／Ａ変換を行っても、同じスピードの音声のアナ
ログ信号を得ることができる。また同時に、音声素片作
成時と異なるサンプリング周波数でＤ／Ａ変換したとき
に生じる音声過渡部の縮みや間延びも防ぐことができ
る。

【０１８４】［第９の実施形態］前記第４乃至第８の実
施形態にはもう１つの問題点が存在する。それは、Ｄ／
Ａ変換のサンプリング周波数を素片作成時のものに変え
ると、声の高さ即ち音声のピッチが変化してしまうとい
うことである。例えば、（素片作成時のサンプリング周
波数）＞（Ｄ／Ａ変換のサンプリング周波数）のときに
は、合成される音声のピッチは低くなる。逆に、（素片
作成時のサンプリング周波数）＜（Ｄ／Ａ変換のサンプ
リング周波数）のときには、合成される音声のピッチは
高くなる。

【０１８５】このような合成される音声のピッチの違い
は、Ｄ／Ａ変換時のサンプリング周波数が前記第４の実
施形態程度の違い（９１％，１０９％）ではあまり問題
とはならない。

【０１８６】しかし、声質を大きく変えようとして、両
サンプリング周波数の比を例えば５０％，２００％程度
に設定すれば、合成音声のピッチもそれぞれ５０％，２
００％になる。この場合、１１０２５ＨｚでＤ／Ａ変換
したときの音声と比較して、前者はピッチが１[oct] 低
い音声が合成され、後者は１[oct] 高い音声が合成され
るので聞きづらくなるという問題が発生する。

【０１８７】そこで、合成時のＤ／Ａ変換のサンプリン
グ周波数が音声素片作成時のサンプリング周波数と大き
く異なった場合でも、合成音声のピッチを一定にできる
ようにした第９の実施形態につき説明する。

【０１８８】図１１は本発明の第９の実施形態に係る音
声の規則合成装置の概略構成を示すブロック図であり、
図５と同一部分には同一符号を付してある。

【０１８９】本実施形態のポイントは、図５中の合成フ
ィルタ処理部５２に代えて、合成時のフレーム周期及び
合成音声のピッチが制御可能な合成フィルタ処理部１３
２を設けると共に、ピッチ生成処理部４９と合成フィル
タ処理部１３２との間にピッチ生成処理部４９で生成さ
れたピッチパターン（基本周波数パターン）を周波数の
異なる別のピッチパターンに変換（ピッチ変調）して合
成フィルタ処理部１３２に与えるピッチ変調処理部１３
８を設け、さらに図５中の声質制御部５７に代えて、Ｄ
／Ａ変換のサンプリング周波数だけでなく合成時のフレ
ーム周期及びピッチの変調を制御する声質制御部１３７
を設け、当該声質制御部１３７により、声質切替部５６
の指定に応じて、Ｄ／Ａ変換器５３でのサンプリング周
波数と合成フィルタ処理部１３２での合成のフレーム周
期を制御すると同時に、ピッチ変調処理部１３８でのピ
ッチの変調を制御するところにある。

【０１９０】本実施形態では、前記第４の実施形態と同
様に声質切替部５６にて３種類の声質が指定可能であ
る。声質制御部１３７は声質切替部５６で指定された声
質に応じて、１１０２５Ｈｚ，８０００Ｈｚ，１６００
０Ｈｚのいずれかのサンプリング周波数でＤ／Ａ変換を
行うようにＤ／Ａ変換器５３を制御する。

【０１９１】同時に声質制御部１３７は、声質切替部５
６によって指定された声質に応じて、合成フィルタ処理
部１３２で行われる合成のフレーム周期を設定する。合
成のフレーム周期は次式により与えられる。

【０１９２】（フレーム周期）＝（素片作成時のフレーム周期）×（素片作成時のサンプリング周期）／（Ｄ／Ａ変換のサンプリング周期）＝（素片作成時のフレーム周期）×（Ｄ／Ａ変換のサンプリング周波数）／（素片作成時のサンプリング周波数）声質制御部１３７はさらに、合成フィルタ処理部１３２
に与えるピッチ（ピッチパターン）が、（合成フィルタ処理部１３２に与えるピッチ）＝（ピッチ生成処理部４９で生成されたピッチ）×（Ｄ／Ａ変換のサンプリング周期）／（素片作成時のサンプリング周期）＝（ピッチ生成処理部４９で生成されたピッチ）×（素片作成時のサンプリング周波数）／（Ｄ／Ａ変換のサンプリング周波数）となるように、ピッチ変調処理部１３８を制御する。

【０１９３】したがって、音声素片作成時の音声のサン
プリング周波数と同じサンプリング周波数、即ち１１０
２５ＨｚでＤ／Ａ変換を行う際には、声質制御部１３７
は、音声素片作成時と同じピッチをそのまま合成フィル
タ処理部１３２に与えるようピッチ変調処理部１３８を
制御する。

【０１９４】また声質制御部１３７は、８０００Ｈｚに
てＤ／Ａ変換を行う場合には、音声素片作成時のピッチ
を（１１０２５[Hz]／８０００[Hz]）倍して合成フィル
タ処理部１３２に与えるよう制御し、１６０００Ｈｚに
てＤ／Ａ変換を行う場合には（１１０２５[Hz]／１６０
００[Hz]）倍して合成フィルタ処理部１３２に与えるよ
うに制御する。

【０１９５】このように本実施形態においては、合成フ
ィルタ処理部１３２に与えるピッチを声質制御部１３７
の制御のもとでピッチ変調処理部１３８にて予め変調し
ておくことにより、音声素片作成時と異なるサンプリン
グ周波数（第１の標本周期とは異なる第２の標本周期）
でＤ／Ａ変換したときに生じる合成音声のピッチの変化
を相殺することができる。

【０１９６】したがって、音声素片作成時のサンプリン
グ周波数と異なる８０００Ｈｚあるいは１６０００Ｈｚ
でＤ／Ａ変換を行っても、同じ声の高さの音声のアナロ
グ信号を得ることができる。

【０１９７】以上に述べた第１乃至第９の実施形態で
は、いずれも、合成フィルタ処理部から出力される合成
音声（離散音声信号）をＤ／Ａ変換器で電気的なアナロ
グ信号に変換する際のＤ／Ａ変換のサンプリング周波数
が音質制御部からの指示により可変される場合について
説明したが、これに限るものではない。例えば合成フィ
ルタ処理部から出力される合成音声（離散音声信号）の
サンプリング周波数自体を可変するようにしても構わな
い。

【０１９８】以下、合成音声（離散音声信号）のサンプ
リング周波数自体を可変するようにした第１０乃至第１
８の実施形態について、第１０の実施形態から順に説明
する。

【０１９９】［第１０の実施形態］図１２は本発明の第
１０の実施形態に係る音声の分析合成装置の概略構成を
示すブロック図である。

【０２００】図１２において、メモリ１４１には、１１
０２５Ｈｚ（第１の周期）でサンプリング（標本化）し
た音声（離散音声信号）に対して、フレーム周期（第１
のフレーム周期）１０msecで窓幅２０msecのハニング窓
をかけ、従来技術にて説明した手順で得られる０次〜２
５次までの低次ケプストラム係数のパラメータフレーム
の時系列（特徴パラメータ）と、各フレームに対応した
音声の有声・無声情報が記憶されている。低次ケプスト
ラム係数については従来技術において説明済みであるの
で、ここでは省略する。

【０２０１】一方、メモリ１４２には、所定の基本周波
数抽出方法により同じ音声から得られる、音声の基本周
波数の時系列パターンが記憶されている。

【０２０２】合成フィルタ処理部１４３は、これら２つ
のメモリ１４１，１４２より各データを読み出し、メモ
リ１４２より読み出された音声のパラメータフレーム
（ケプストラム係数）をフィルタ係数とするＬＭＡフィ
ルタ（図示せず）を、有声区間では上記基本周波数の時
系列パターン（ピッチパターン）に基づいた周期パルス
で、無声区間ではランダムノイズで駆動することにより
所望の音声（離散音声信号）を合成する。

【０２０３】ここまでの処理はプログラムによって行わ
れるため、合成フィルタ処理部１４３（内のＬＭＡフィ
ルタ）から出力される音声は離散音声信号である。そこ
で、この離散音声信号をＤ／Ａ変換器１４４に供給し、
電気的なアナログ信号に変換する。こうして得られた音
声のアナログ信号をアンプ１４５にて増幅し、スピーカ
１４６を駆動することにより聴覚で知覚できる音声を得
ることができる。

【０２０４】ここまでは従来技術で挙げた（図２３の分
析合成装置の）例とほぼ同じである。

【０２０５】この図１２の構成は、前記第１の実施形態
に係る図１の分析合成装置の構成に対応するもので、図
１の構成においてＤ／Ａ変換器でのＤ／Ａ変換のサンプ
リング周波数を可変する代わりに、合成音声（離散音声
信号）のサンプリング周波数自体を可変する点に特徴が
ある。

【０２０６】即ち本実施形態のポイントは、合成フィル
タ処理部１４３とＤ／Ａ変換器１４４との間に、当該合
成フィルタ処理部１４３の出力である合成音声のサンプ
リング周波数を変換するサンプリング周波数変換処理部
１４９を設けると共に、（図１中の声質切替部１７及び
声質制御部１８に対応する）声質切替部１４７及び声質
制御部１４８を設け、当該声質制御部１４８が、合成フ
ィルタ処理部１４３から出力される合成音声のサンプリ
ング周波数を声質切替部１４７で指定された声質で決ま
る周波数（第２の標本周期）に変換するようにサンプリ
ング周波数変換処理部１４９を制御するところにある。
ここで、Ｄ／Ａ変換器１４４でのＤ／Ａ変換のサンプリ
ング周波数（第３の標本周期）は固定であり、ケプスト
ラム作成時の音声のサンプリング周波数（第１の標本周
期）に一致するものとする。

【０２０７】本実施形態において、声質切替部１４７
は、図１中の声質切替部１７と同様に（ユーザによる指
定もしくはアプリケーションプログラム等によって）３
種類の声質が指定可能であり、声質制御部１４８は、声
質切替部１４７で指定された声質に応じて、合成フィル
タ処理部１４３から出力される合成音声のサンプリング
周波数を、１１０２５Ｈｚ（＝未変換），１２０００Ｈ
Ｚ，１００００Ｈｚのいずれかに変換するように、サン
プリング周波数変換処理部１４９を制御する。

【０２０８】したがって、合成音声のサンプリング周波
数を、メモリ１４１に蓄えられたケプストラムを作成し
た際の音声のサンプリング周波数と同じサンプリング周
波数、即ち１１０２５Ｈｚに変換すれば、元の音声の声
質で音声合成することができる。なお、合成音声のサン
プリング周波数を、ケプストラム作成時の音声のサンプ
リング周波数と同じサンプリング周波数に変換すること
は、サンプリング周波数の変換を行わないことと等価で
あり、サンプリング周波数変換処理部１４９における変
換処理を行わなくても構わない。

【０２０９】一方、他のサンプリング周波数（第１の標
本周期とは異なる第２の標本周期）に変換（１１０２５
Ｈｚから１２０００Ｈｚ、あるいは１１０２５Ｈｚから
１００００Ｈｚに変換）すれば、図１３に示すように、
音声スペクトルを周波数軸方向にシフトした効果が得ら
れるため、音声の個人性が変化し、こうして得られるア
ナログ音声信号の声質は、元となる音声の声質とは異な
ったものとなる。

【０２１０】ここで、サンプリング周波数変換処理部１
４９によるサンプリング周波数変換処理の詳細を説明す
る。このサンプリング周波数変換には種々の方法が適用
可能であるが、本実施形態では、図１４に示す構成によ
る簡便な方法を用いているものとする。

【０２１１】サンプリング周波数変換処理部１４９は、
図１４（ａ）に示すように、サンプリング周波数拡大器
１４９ａ、ローパスフィルタ（ＬＰＦ）１４９ｂ及びサ
ンプリング周波数圧縮器１４９ｃから構成されている。

【０２１２】サンプリング周波数変換処理部１４９内の
サンプリング周波数拡大器１４９ａには、合成フィルタ
処理部１４３の出力である合成音声（音声データ）が供
給される。この合成音声のサンプリング周波数がｆ1 で
あるものとする。

【０２１３】図１４（ａ）のサンプリング周波数変換処
理部１４９で、サンプリング周波数ｆ1 からｆ2 ＝（Ｌ
／Ｍ）ｆ1 に周波数変換するには、図１４（ｂ）に示す
ように、まずサンプリング周波数拡大器１４９ａにて、
サンプリング周波数ｆ1 の音声データのサンプルｓ1 間
に（Ｌ−１）個の零サンプルｓ0 を挿入する。

【０２１４】次に、サンプリング周波数拡大器１４９ａ
から出力される音声データ、即ちサンプルｓ1 間に（Ｌ
−１）個の零サンプルｓ0 が挿入された音声データを、
エイリアシング防止のために、ｆ1 またはｆ2 の小さい
方（ｍｉｎ（ｆ1 ，ｆ2 ）を遮断周波数とするローパス
フィルタ（ローパス型のディジタルフィルタ）１４９ｂ
に通す。ここで、サンプリング周波数拡大器１４９ａで
の零サンプル挿入によるゲイン低下（１／Ｌ倍）を防ぐ
ために、ローパスフィルタ１４９ｂは、通過帯域でＬ倍
のゲインを持つ。

【０２１５】最後に、ローパスフィルタ１４９ｂを通過
した音声データに対して、周波数圧縮器１４９ｃにおい
て、図１４（ｂ）に示すように、Ｍサンプル毎に１サン
プルのみを取り出す間引き処理を行うことにより、サン
プリング周波数ｆ2 ＝（Ｌ／Ｍ）ｆ1 の音声データが得
られる。

【０２１６】したがって、前記した例のように、サンプ
リング周波数を１１０２５Ｈｚから１２０００Ｈｚに変
換する場合であれば、ｆ1 ＝１１０２５[Hz] ｆ2 ＝１２０００[Hz] ｆ2 ＝（１２０００／１１０２５）ｆ1 ＝（１６０／１４７）ｆ1 であるので、サンプリング周波数変換処理部１４９で
は、Ｌ＝１６０Ｍ＝１４７（ＬＰＦの遮断周波数）＝ｍｉｎ（ｆ1 ，ｆ2 ）＝ｆ1
＝１１０２５[Hz] として、上述した処理を行えばよい。

【０２１７】同様に、サンプリング周波数を１１０２５
Ｈｚから１００００Ｈｚに変換する場合であれば、ｆ1 ＝１１０２５[Hz] ｆ2 ＝１００００[Hz] ｆ2 ＝（１００００／１１０２５）ｆ1 ＝（４００／４４１）ｆ1 であるので、サンプリング周波数変換処理部１４９で
は、Ｌ＝４００Ｍ＝４４１（ＬＰＦの遮断周波数）＝ｍｉｎ（ｆ1 ，ｆ2 ）＝ｆ1
＝１００００[Hz] として、上述した処理を行えばよい。

【０２１８】［第１１の実施形態］前記第１０の実施形
態においては、声質切替部１４７、声質制御部１４８及
びサンプリング周波数変換処理部１４９を設けたこと
で、合成音声の声質を簡単に増やすことができるもの
の、合成される音声のスピードが声質により異なる。

【０２１９】即ち、（サンプリング周波数変換処理後の
サンプリング周波数）＞（Ｄ／Ａ変換のサンプリング周
波数）のときには、合成される音声のスピードは遅くな
る。逆に、（サンプリング周波数変換処理後のサンプリ
ング周波数）＜（Ｄ／Ａ変換のサンプリング周波数）の
ときには、合成される音声のスピードは早くなる。

【０２２０】このような合成される音声のスピードの違
いは、サンプリング周波数変換処理後のサンプリング周
波数が前記第１０の実施形態程度の違い（９１％，１０
９％）ではあまり問題とはならない。しかし以下に述べ
るように、サンプリング周波数変換処理後のサンプリン
グ周波数がＤ／Ａ変換時のサンプリング周波数と大きく
異なる場合には、問題となる。

【０２２１】まず、サンプリング周波数変換処理後のサ
ンプリング周波数と合成時のＤ／Ａ変換のサンプリング
周波数の比が１に近ければ声質は変化も小さく、逆にこ
の比が１から離れれば声質は大きく変化する。したがっ
て、声質を大きく変えようとすれば、これら両サンプリ
ング周波数の比を例えば５０％，２００％程度に設定す
ればよいが、これでは合成音声のスピードもそれぞれ元
の音声の２００％，５０％、即ち倍と半分になり、かな
り聞きづらくなる。

【０２２２】そこで、サンプリング周波数変換処理後の
サンプリング周波数がＤ／Ａ変換のサンプリング周波数
と大きく異なった場合でも、合成音声のスピードを一定
にできるようにした第１１の実施形態につき説明する。

【０２２３】図１５は本発明の第１１の実施形態に係る
音声の分析合成装置の概略構成を示すブロック図であ
り、図１２と同一部分には同一符号を付してある。

【０２２４】この図１５の構成は、前記第２の実施形態
に係る図３の分析合成装置の構成に対応するもので、図
３の構成においてＤ／Ａ変換器でのＤ／Ａ変換のサンプ
リング周波数を可変する代わりに、合成音声（離散音声
信号）のサンプリング周波数自体を可変するものであ
る。

【０２２５】本実施形態のポイントは、図１２中の合成
フィルタ処理部１４３に代えて、合成時のフレーム周期
が制御可能な合成フィルタ処理部１５３を設けると共
に、図１２中の声質制御部１４８に代えて、サンプリン
グ周波数変換処理部１４９の変換するサンプリング周波
数だけでなく合成時のフレーム周期を制御する声質制御
部１５８を設け、当該声質制御部１５８により、声質切
替部１４７の指定に応じて、サンプリング周波数変換処
理部１４９でのサンプリング周波数変換処理と同時に、
合成フィルタ処理部１５３での合成時のフレーム周期を
制御するところにある。ここで、Ｄ／Ａ変換器１４４で
のＤ／Ａ変換のサンプリング周波数（第３の標本周期）
は前記第１０の実施形態と同様に固定であり、ケプスト
ラム作成時の音声のサンプリング周波数（第１の標本周
期）に一致するものとする。

【０２２６】本実施形態では、前記第１０の実施形態と
同様に声質切替部１４７にて３種類の声質が指定可能で
ある。声質制御部１５８は声質切替部１４７で指定され
た声質に応じて、例えば１１０２５Ｈｚ（＝未変換），
８０００Ｈｚ，１６０００Ｈｚのいずれかのサンプリン
グ周波数への変換を行うようにサンプリング周波数変換
処理部１４９を制御する。

【０２２７】同時に声質制御部１５８は、声質切替部１
４７によって指定された声質に応じて、合成フィルタ処
理部１５３で行われる合成のフレーム周期を設定する。
合成のフレーム周期は次式により与えられる。

【０２２８】（フレーム周期）＝（分析フレーム周期）×（サンプリング周波数変換後のサンプリング周期）／（Ｄ／Ａ変換のサンプリング周期）＝（分析フレーム周期）×（Ｄ／Ａ変換のサンプリング周波数）／（サンプリング周波数変換後のサンプリング周波数）したがって上式に基づき、Ｄ／Ａ変換のサンプリング周
波数と同じサンプリング周波数、即ち１１０２５Ｈｚへ
のサンプリング周波数変換処理を行う（＝サンプリング
周波数変換処理を行わない）際には、声質制御部１５８
は上式に基づき、合成時のフレーム周期を分析時（ケプ
ストラム作成時）のフレーム周期（第１のフレーム周
期）と同じ１０msecで合成するよう合成フィルタ処理部
１５３を制御する。但し、メモリ１４１に蓄えられたケ
プストラムは前記第１０の実施形態と同じ条件で作成さ
れているものとする。

【０２２９】また声質制御部１５８は、ケプストラム作
成時（分析時）の音声のサンプリング周波数とは異なる
サンプリング周波数（第１の標本周期とは異なる第２の
標本周期）、例えば８０００Ｈｚへのサンプリング周波
数変換処理を行う場合には、１０[msec]×１１０２５[Hz]／８０００[Hz]＝１３．８
[msec] のフレーム周期（第１のフレーム周期とは異なる第２の
フレーム周期）で合成を行うよう制御し、１６０００Ｈ
ｚへのサンプリング周波数変換処理を行う場合には、１０[msec]×１１０２５[Hz]／１６０００[Hz]＝６．９
[msec] のフレーム周期（第１のフレーム周期とは異なる第２の
フレーム周期）で合成を行うよう制御する。

【０２３０】このように本実施形態においては、分析時
と異なるサンプリング周波数（第１の標本周期とは異な
る第２の標本周期）にサンプリング周波数変換処理した
ときの合成音声のスピードの変化を、合成フィルタ処理
部１５３における合成のフレーム周期を（第２のフレー
ム周期）をケプストラム作成時（分析時）のフレーム周
期（第１のフレーム周期）とは異ならせることで相殺す
ることができる。

【０２３１】したがって、分析時のサンプリング周波数
と異なる８０００Ｈｚあるいは１６０００Ｈｚへのサン
プリング周波数変換処理を行っても、同じスピードの音
声のアナログ信号を得ることができる。

【０２３２】［第１２の実施形態］ところで、前記第１
０の実施形態においては、サンプリング周波数変換処理
を行ってからＤ／Ａ変換すると、声の高さ、即ち音声の
ピッチの変化を招く。

【０２３３】即ち、（サンプリング周波数変換処理後の
サンプリング周波数）＞（Ｄ／Ａ変換のサンプリング周
波数）のときには、合成される音声のピッチは低くな
る。逆に、（サンプリング周波数変換処理後のサンプリ
ング周波数）＜（Ｄ／Ａ変換のサンプリング周波数）の
ときには、合成される音声のピッチは高くなる。

【０２３４】このような合成される音声のピッチの違い
は、サンプリング周波数変換処理後のサンプリング周波
数がＤ／Ａ変換のサンプリング周波数に比べ、前記第１
０の実施形態程度の違い（９１％，１０９％）ではあま
り問題とはならない。

【０２３５】しかし、声質を大きく変えようとして、両
サンプリング周波数の比を例えば５０％，２００％程度
に設定すれば、合成音声のピッチもそれぞれ５０％，２
００％と変化するため、ケプストラム作成時と同じ１１
０２５Ｈｚにサンプリング周波数変換処理した（あるい
は変換処理しない）ときの音声（あるいは原音声）と比
較して、前者はピッチが１[oct] （オクターブ）高い音
声が合成され、後者は１[oct] 低い音声が合成されるの
で聞きづらくなるという問題が発生する。

【０２３６】そこで、サンプリング周波数変換処理後の
サンプリング周波数がケプストラム作成時のサンプリン
グ周波数と大きく異なった場合でも、合成音声のピッチ
を一定にできるようにした第１２の実施形態につき説明
する。

【０２３７】図１６は本発明の第１２の実施形態に係る
音声の分析合成装置の概略構成を示すブロック図であ
り、図１２と同一部分には同一符号を付してある。

【０２３８】この図１６の構成は、前記第３の実施形態
に係る図４の分析合成装置の構成に対応するもので、図
４の構成においてＤ／Ａ変換器でのＤ／Ａ変換のサンプ
リング周波数を可変する代わりに、合成音声（離散音声
信号）のサンプリング周波数自体を可変するものであ
る。

【０２３９】本実施形態のポイントは、図１２中の合成
フィルタ処理部１４３に代えて、合成時のフレーム周期
が制御可能な合成フィルタ処理部１６３を設けると共
に、メモリ１４２と合成フィルタ処理部１６３との間に
メモリ１４２より読み出された基本周波数（の時系列）
パターン（ピッチパターン）を周波数の異なる別のピッ
チパターンに変換（ピッチ変調）して合成フィルタ処理
部１６３に与えるピッチ変調処理部１６１を設け、さら
に図１２中の声質制御部１４８に代えて、サンプリング
周波数変換処理部１４９の変換するサンプリング周波数
だけでなく合成時のフレーム周期及びピッチの変調を制
御する声質制御部１６８を設け、当該声質制御部１６８
により、声質切替部１４７の指定に応じて、サンプリン
グ周波数変換処理部１４９でのサンプリング周波数変換
処理と合成フィルタ処理部１６３での合成時のフレーム
周期を制御すると同時に、ピッチ変調処理部１６１での
ピッチの変調を制御するところにある。ここで、Ｄ／Ａ
変換器１４４でのＤ／Ａ変換のサンプリング周波数（第
３の標本周期）は前記第１０の実施形態と同様に固定で
あり、ケプストラム作成時の音声のサンプリング周波数
（第１の標本周期）に一致するものとする。

【０２４０】本実施形態では、前記第１０の実施形態と
同様に声質切替部１４７にて３種類の声質が指定可能で
ある。声質制御部１６８は声質切替部１４７で指定され
た声質に応じて、例えば１１０２５Ｈｚ（＝未変換），
８０００Ｈｚ，１６０００Ｈｚのいずれかのサンプリン
グ周波数への変換を行うようにサンプリング周波数変換
処理部１４９を制御する。

【０２４１】声質制御部１６８は、声質切替部１４７に
よって指定された声質に応じて、サンプリング周波数変
換処理部１４９の変換するサンプリング周波数を設定す
ると同時に、合成フィルタ処理部１６３で行われる合成
のフレーム周期を設定する。合成のフレーム周期は次式
により与えられる。

【０２４２】（フレーム周期）＝（分析フレーム周期）×（サンプリング周波数変換後のサンプリング周期）／（Ｄ／Ａ変換のサンプリング周期）＝（分析フレーム周期）×（Ｄ／Ａ変換のサンプリング周波数）／（サンプリング周波数変換後のサンプリング周波数）なお、メモリ１４１に蓄えられたケプストラムは前記第
１０の実施形態と同じ条件で作成されているものとす
る。

【０２４３】声質制御部１６８はさらに、合成フィルタ
処理部１６３に与えるピッチ（ピッチパターン）が、（合成フィルタ処理部１６３に与えるピッチ）＝（メモリ１４２より読み出したピッチ）×（Ｄ／Ａ変換のサンプリング周期）／（サンプリング周波数変換処理後のサンプリング周期）＝（メモリ１４２より読み出したピッチ）×（サンプリング周波数変換処理後のサンプリング周波数）／（Ｄ／Ａ変換のサンプリング周波数）となるように、ピッチ変調処理部１６１を制御する。

【０２４４】したがって、Ｄ／Ａ変換のサンプリング周
波数と同じサンプリング周波数、即ち１１０２５Ｈｚへ
のサンプリング周波数変換処理を行う（＝サンプリング
周波数変換処理を行わない）際には、声質制御部１６８
は上式に基づき、合成フィルタ処理部１６３に与えるピ
ッチを分析時（ケプストラム作成時）と同じピッチとな
るようピッチ変調処理部１６１を制御する。

【０２４５】また声質制御部１６８は、ケプストラム作
成時（分析時）の音声のサンプリング周波数とは異なる
サンプリング周波数（第１の標本周期とは異なる第２の
標本周期）、例えば８０００Ｈｚへのサンプリング周波
数変換処理を行う場合には、メモリ１４２から読み出し
たピッチを（８０００[Hz]／１１０２５[Hz]）倍して合
成フィルタ処理部１６３に与えるように、１６０００Ｈ
ｚへのサンプリング周波数変換処理を行う場合には、メ
モリ１４２から読み出したピッチを（１６０００[Hz]／
１１０２５[Hz]）倍して合成フィルタ処理部１６３に与
えるように、ピッチ変調処理部１６１を制御する。

【０２４６】このように本実施形態においては、合成フ
ィルタ処理部１６３に与えるピッチを声質制御部１６８
の制御のもとでピッチ変調処理部１６１にて予め変調し
ておくことにより、Ｄ／Ａ変換時のサンプリング周波数
（第３の標本周期）とは異なるサンプリング周波数（第
２の標本周期）へサンプリング周波数変換処理したとき
に生じる合成音声のピッチの変化を相殺することができ
る。

【０２４７】したがって、Ｄ／Ａ変換時のサンプリング
周波数と異なる８０００Ｈｚあるいは１６０００Ｈｚへ
のサンプリング周波数変換処理を行っても、同じ声の高
さの音声のアナログ信号を得ることができる。

【０２４８】［第１３の実施形態］図１７は本発明の第
１３の実施形態に係る音声の規則合成装置の概略構成を
示すブロック図である。

【０２４９】この音声規則合成装置は、例えばパーソナ
ルコンピュータ等の情報処理装置上で専用のソフトウェ
ア（文音声変換ソフトウェア）を実行することにより実
現されるもので、文音声変換（ＴＴＳ）処理機能、即ち
テキストから音声を生成する文音声変換処理（文音声合
成処理）機能を有しており、その機能構成は、大別して
言語処理部１７１、音声合成部１７２とに分けられる。

【０２５０】言語処理部１７１は、入力文、例えば漢字
かな混じり文を解析して読み情報とアクセント情報を生
成する処理と、これら情報に基づき音韻記号系列・アク
セント情報が記述された音声記号列を生成する処理を司
る。

【０２５１】音声合成部１７２は、言語処理部１７１の
出力である音声記号列をもとに音声を生成する処理を司
る。

【０２５２】さて、図１７の音声規則合成装置におい
て、文音声変換（読み上げ）の対象となる文書（ここで
は日本語文書）はテキストファイル１７３として保存さ
れている。本装置では、文音声変換ソフトウェアに従
い、当該ファイル１７３から漢字かな混じり文を１文ず
つ読み出して、言語処理部１７１及び音声合成部１７２
により以下に述べる文音声変換処理を行い、音声を合成
する。

【０２５３】まず、テキストファイル１７３から読み出
された漢字かな混じり文は、言語処理部１７１内の言語
解析処理部１７４に入力される。

【０２５４】言語解析処理部１７４は、入力される漢字
かな混じり文に対して形態素解析を行い、読み情報とア
クセント情報を生成する。

【０２５５】そのために言語解析処理部１７４は、文の
最小構成要素である「形態素」を見出し語にもつ形態素
辞書１７５と形態素間の接続規則が登録されている接続
規則ファイル１７６を利用する。即ち言語解析処理部１
７４は、入力文と形態素辞書１７５とを照合することで
得られる全ての形態素系列候補を求め（総当たり法）、
その中から、接続規則ファイル１７６を参照して文法的
に前後に接続できる組み合わせを出力する。形態素辞書
１７５には、解析時に用いられる文法情報と共に、形態
素の読み並びにアクセントの型が登録されている。この
ため、形態素解析により形態素が定まれば、同時に読み
とアクセント型も与えることができる。

【０２５６】例えば、「公園へ行って本を読みます」と
いう文に対して形態素解析を行うと、／公園／ヘ／行って／本／を／読み／ます／。

【０２５７】と形態素に分割される。各形態素に読みと
アクセント型が与えられ、／コウエン／エ／イッテ／ホ＾ン／ヲ／ヨミ／マ＾ス／となる。ここで「＾」の入っている形態素は、その直前
の音節でピッチが高く、その直後の音節ではピッチが落
ちるアクセントであることを意味する。また「＾」がな
い場合は、平板型のアクセントであることを意味する。

【０２５８】ところで、人間が文章を読むときには、こ
のような形態素単位でアクセントを付けて読むことはせ
ず、幾つかの形態素をひとまとめにして、そのまとまり
にアクセントを付けて読んでいる。

【０２５９】そこで、このようなことを考慮して、言語
解析処理部１７４ではさらに、一つのアクセント句（ア
クセントを与える単位）で形態素をまとめると同時に、
まとめたことによるアクセントの移動も推定する。これ
に加えて言語解析処理部４４は、母音の無声化や読み上
げの際のポーズ（息継ぎ）等の情報も付加し、上記の例
では、最終的に次のような読み情報を生成する。

【０２６０】／コーエンエ／イッテ．／ホ＾ンオ／ヨミ
マ＾（ス）／ここで、ピリオド「．」は息継ぎを、「（）」は母音
が無声化した音節を表わす。

【０２６１】さて、上記のようにして言語処理部１７１
内の言語解析処理部１７４により読み情報が生成される
と、音声合成部１７２内の音韻継続時間計算処理部１７
７が起動される。音韻継続時間計算処理部１７７は、言
語解析処理部１７４で生成した読み情報に従って、入力
文に含まれる各音節の子音部ならびに母音部の継続時間
（単位はms）を決定する。

【０２６２】この音韻継続時間計算処理部１７７での継
続時間の決定処理は、子音（Ｃ）と母音（Ｖ）の境界
（ＣＶわたり）の位置が等間隔に並ぶようにするとい
う、極めて簡単なアルゴリズムにより実現されている。

【０２６３】ＣＶわたりの間隔は、音声合成部１７２内
の発話速度制御部１７８より与えられる。図示しない
が、本実施形態で用いられるソフトウェアではユーザが
合成音声のスピードを指定することが可能となってい
る。そして、ユーザが指定した音声のスピードがこの発
話速度制御部１７８に与えられることにより、当該発話
速度制御部１７８が（音韻継続時間計算処理部１７７で
の継続時間の決定処理にて決定される）先程のＣＶわた
りの間隔を調整して合成音声の速度を実際に変化させて
いる。但し、日本語の音声は、発声の速度を変えても子
音の継続時間はほぼ一定であることが分析結果から分か
っているので、子音の継続時間は一定に保ち、母音の継
続時間を調節してＣＶわたりの間隔を変える。

【０２６４】音韻継続時間計算処理部１７７により入力
文に含まれる各音節の（子音部ならびに母音部の）継続
時間が決定されると、同じ音声合成部１７２内のピッチ
生成処理部１７９が起動される。ピッチ生成処理部１７
９は音韻継続時間計算処理部１７７により決定された継
続時間と、（言語処理部１７１内の）言語解析処理部１
７４により決定されたアクセント情報に基づいて、まず
点ピッチ位置を設定する。次にピッチ生成処理部１７９
は、設定した複数の点ピッチを直線で補間して例えば１
０msec毎のピッチパターン（基本周波数パターン）を得
る。

【０２６５】一方、音声合成部１７２内の音韻パラメー
タ生成処理部１８０は、（言語処理部１７１内の）言語
解析処理部１７４から渡される音声記号列の音韻情報を
もとに音韻パラメータを生成する処理を、例えばピッチ
生成処理部１７９によるピッチパターン生成処理と並行
して次のように行う。

【０２６６】まず本実施形態では、サンプリング周波数
１１０２５Ｈｚで標本化した実音声を改良ケプストラム
法により窓長２０msec、フレーム周期１０msecで分析し
て得た０次から２５次のケプストラム係数を子音＋母音
（ＣＶ）の単位で日本語音声の合成に必要な全音節を切
り出した計１３７個の音声素片が蓄積された音声素片フ
ァイル（図示せず）が用意されている。この音声素片フ
ァイルの内容は、文音声変換ソフトウェアに従う文音声
変換処理の開始時に、例えばメインメモリ（図示せず）
に確保された音声素片領域（以下音声素片メモリと称す
る）１８１に読み込まれているものとする。

【０２６７】音韻パラメータ生成処理部１８０は、（言
語処理部１７１内の）言語解析処理部１７４から渡され
る音声記号列中の音韻情報に従って、上記したＣＶ単位
の音声素片を音声素片メモリ１８１から順次読み出し、
読み出した音声素片を接続することにより合成すべき音
声の音韻パラメータ（特徴パラメータ）を生成する。

【０２６８】ピッチ生成処理部１７９によりピッチパタ
ーンが生成され、音韻パラメータ生成処理部１８０によ
り音韻パラメータが生成されると、音声合成部１７２内
の合成フィルタ処理部１８２が起動される。この合成フ
ィルタ処理部１８２は、図５中の合成フィルタ処理部５
２と同様に、図６に示したような構成となっている。し
たがって合成フィルタ処理部１８２は、上記生成された
ピッチパターンと音韻パラメータから、次のようにして
音声を合成する。

【０２６９】まず、音声の有声部（Ｖ）では、駆動音源
切り替え部５２３によりインパルス発生部５２２側に切
り替えられる。インパルス発生部５２２は、ピッチ生成
処理部１７９により生成されたピッチパターンに応じた
間隔のインパルスを発生し、このインパルスを音源とし
てＬＭＡフィルタ５２４を駆動する。

【０２７０】一方、音声の無声部（Ｕ）では、駆動音源
切り替え部５２３によりホワイトノイズ発生部５２１側
に切り替えられる。ホワイトノイズ発生部５２１はホワ
イトノイズを発生し、このホワイトノイズを音源として
ＬＭＡフィルタ５２４を駆動する。ＬＭＡフィルタ５２
４は音声のケプストラムを直接フィルタ係数とするもの
である。

【０２７１】本実施形態において音韻パラメータ生成処
理部１８０により生成された音韻パラメータは前記した
ようにケプストラムであることから、この音韻パラメー
タがＬＭＡフィルタ５２４のフィルタ係数となり、駆動
音源切り替え部５２３により切り替えられる音源によっ
て駆動されることで、合成音声を出力する。

【０２７２】合成フィルタ処理部１７２（内のＬＭＡフ
ィルタ５２４）により合成された音声は離散音声信号で
あり、Ｄ／Ａ変換器１８３によりアナログ信号に変換
し、アンプ１８４を通してスピーカ１８５に出力するこ
とで、初めて音として聞くことができる。

【０２７３】ここまでの処理は、図３１を参照しながら
［従来技術］の欄にて説明した例とほぼ同じである。

【０２７４】この図１７の構成は、前記第４の実施形態
に係る図５の音声規則合成装置の構成に対応するもの
で、図５の構成においてＤ／Ａ変換器でのＤ／Ａ変換の
サンプリング周波数を可変する代わりに、合成音声（離
散音声信号）のサンプリング周波数自体を可変する点に
特徴がある。

【０２７５】即ち本実施形態のポイントは、合成フィル
タ処理部１８２とＤ／Ａ変換器１８３との間に、当該合
成フィルタ処理部１８３の出力である合成音声のサンプ
リング周波数を変換するサンプリング周波数変換処理部
１８８を設けると共に、（図５中の声質切替部５６及び
声質制御部５７に対応する）声質切替部１８６及び声質
制御部１８７を設け、当該声質制御部１８７が、合成フ
ィルタ処理部１８２から出力される合成音声のサンプリ
ング周波数を声質切替部１８６で指定された声質で決ま
る周波数に変換するようにサンプリング周波数変換処理
部１８８を制御するところにある。ここで、Ｄ／Ａ変換
器１８３でのＤ／Ａ変換のサンプリング周波数（第３の
標本周期）は固定であり、音声素片作成時の音声のサン
プリング周波数（第１の標本周期）に一致するものとす
る。

【０２７６】本実施形態において、声質切替部１８６
は、図５中の声質切替部５６と同様に（ユーザによる指
定もしくはアプリケーションプログラム等によって）３
種類の声質が指定可能であり、声質制御部１８７は、声
質切替部１８６で指定された声質に応じて、合成フィル
タ処理部１８２から出力される合成音声のサンプリング
周波数を、１１０２５Ｈｚ（＝未変換），１２０００Ｈ
Ｚ，１００００Ｈｚのいずれかに変換するように、サン
プリング周波数変換処理部１８８を制御する。

【０２７７】したがって、合成音声のサンプリング周波
数を、メモリ１８１に蓄えられた音声素片を作成した際
のサンプリング周波数（第１の標本周期）と同じサンプ
リング周波数、即ち１１０２５Ｈｚに変換するならば
（あるいはサンプリング周波数変換処理を行わないなら
ば）、元の音声の声質で音声合成することができる。

【０２７８】一方、音声素片作成時とは異なるサンプリ
ング周波数（第１の標本周期とは異なる第２の標本周
期）、例えば１１０２５Ｈｚから１２０００Ｈｚ、ある
いは１１０２５Ｈｚから１００００Ｈｚへのサンプリン
グ周波数変換処理を行えば、既に述べたが、音声スペク
トルを図１３に示したように周波数軸方向にシフトした
効果が得られるため、音声の個人性が変化し、こうして
得られるアナログ音声信号の声質は、音声素片の元とな
っている音声の声質とは異なったものとなる。

【０２７９】［第１４の実施形態］前記第１３の実施形
態においては、声質切替部１８６、声質制御部１８７及
びサンプリング周波数変換処理部１８８を設けたこと
で、合成音声の声質を簡単に増やすことができるもの
の、合成される音声のスピードが声質により異なる。

【０２８０】即ち、（サンプリング周波数変換処理後の
サンプリング周波数）＞（Ｄ／Ａ変換のサンプリング周
波数）のときには、合成される音声のスピードは遅くな
る。逆に、（サンプリング周波数変換処理後のサンプリ
ング周波数）＜（Ｄ／Ａ変換のサンプリング周波数）の
ときには、合成される音声のスピードは早くなる。

【０２８１】このような合成される音声のスピードの違
いは、サンプリング周波数変換処理後のサンプリング周
波数が前記第１３の実施形態程度の違い（９１％，１０
９％）ではあまり問題とはならない。しかし以下に述べ
るように、サンプリング周波数変換処理後のサンプリン
グ周波数がＤ／Ａ変換時のサンプリング周波数と大きく
異なる場合には、問題となる。

【０２８２】まず、サンプリング周波数変換処理後のサ
ンプリング周波数と合成時のＤ／Ａ変換のサンプリング
周波数の比が１に近ければ声質は変化も小さく、逆にこ
の比が１から離れれば声質は大きく変化する。したがっ
て、声質を大きく変えようとすれば、これら両サンプリ
ング周波数の比を例えば５０％，２００％程度に設定す
ればよいが、これでは合成音声のスピードもそれぞれ元
の音声の２００％，５０％、即ち倍と半分になり、かな
り聞きづらくなる。

【０２８３】そこで、サンプリング周波数変換処理後の
サンプリング周波数がＤ／Ａ変換のサンプリング周波数
と大きく異なった場合でも、合成音声のスピードを一定
にできるようにした第１４の実施形態につき説明する。

【０２８４】図１８は本発明の第１４の実施形態に係る
音声の規則合成装置の概略構成を示すブロック図であ
り、図１７と同一部分には同一符号を付してある。

【０２８５】この図１８の構成は、前記第５の実施形態
に係る図７の音声規則合成装置の構成に対応するもの
で、図７の構成においてＤ／Ａ変換器でのＤ／Ａ変換の
サンプリング周波数を可変する代わりに、合成音声（離
散音声信号）のサンプリング周波数自体を可変するもの
である。

【０２８６】本実施形態のポイントは、図１７中の発話
速度制御部１７８に代えて、合成音声のスピード（発話
速度）が制御可能な発話速度制御部１９８を設けると共
に、図１７中の声質制御部１８７に代えて、サンプリン
グ周波数変換処理部１８８の変換するサンプリング周波
数だけでなく合成音声のスピードを制御する声質制御部
１９７を設け、当該声質制御部１９７により、声質切替
部１８６の指定に応じて、サンプリング周波数変換処理
部１８８でのサンプリング周波数変換処理と同時に、発
話速度制御部１９８での合成音声のスピードを制御する
ところにある。ここで、Ｄ／Ａ変換器１８３でのＤ／Ａ
変換のサンプリング周波数（第３の標本周期）は固定で
あり、前記第１３の実施形態と同様に音声素片作成時の
音声のサンプリング周波数（第１の標本周期）に一致す
るものとする。

【０２８７】本実施形態では、前記第１３の実施形態と
同様に声質切替部１８６にて３種類の声質が指定可能で
ある。声質制御部１９７は声質切替部１８６で指定され
た声質に応じて、例えば１１０２５Ｈｚ，８０００Ｈ
ｚ，１６０００Ｈｚのいずれかのサンプリング周波数へ
の変換を行うようにサンプリング周波数変換処理部１８
８を制御する。

【０２８８】同時に声質制御部１９７は、声質切替部１
８６によって指定された声質に応じて、発話速度制御部
１９８を次のように制御する。即ち声質制御部１９７
は、先に説明したＣＶわたりの間隔が、（ＣＶわたりの間隔）＝（１１０２５Ｈｚへのサンプリ
ング周波数変換時のＣＶわたりの間隔）×（Ｄ／Ａ変換
のサンプリング周波数）／サンプリング周波数変換後の
サンプリング周波数）となるよう発話速度制御部１９８を制御する。

【０２８９】したがって、８０００Ｈｚへのサンプリン
グ周波数変換を行う際には、声質制御部１９７は上式に
基づき、１１０２５Ｈｚへサンプリング周波数変換する
とき（あるいはサンプリング周波数変換をしないとき）
のＣＶわたり間隔の（１１０２５[Hz]／８０００[Hz]）
倍のＣＶわたり間隔となるよう発話速度制御部１９８を
制御する。また声質制御部１９７は、１６０００Ｈｚへ
のサンプリング周波数変換を行う際には、１１０２５Ｈ
ｚでサンプリング周波数変換するとき（あるいはサンプ
リング周波数変換をしないとき）のＣＶわたり間隔の
（１１０２５[Hz]／１６０００[Hz]）倍のＣＶわたり間
隔となるよう発話速度制御部１９８を制御する。

【０２９０】このように本実施形態においては、発話速
度制御部１９８の制御でＣＶわたりの間隔（発話速度パ
ラメータ）を変えることにより、素片作成時と異なるサ
ンプリング周波数（第１の標本周期とは異なる第２の標
本周期）へのサンプリング周波数変換処理をした後、素
片作成時と同じサンプリング周波数（第２の標本周期と
は異なる第３の標本周期）でＤ／Ａ変換したときに生じ
る合成音声のスピードの変化を相殺することができる。

【０２９１】したがって、素片作成時のサンプリング周
波数と異なる８０００Ｈｚあるいは１６０００Ｈｚへの
サンプリング周波数変換処理を行った後、素片作成時と
同じサンプリング周波数でＤ／Ａ変換を行っても、ほぼ
同じスピードの音声のアナログ信号を得ることができ
る。

【０２９２】［第１５の実施形態］前記第１４の実施形
態に基づいて規則合成を行えば、確かに声質を変えなが
らも合成される音声のスピードをほぼ一定に保つことが
簡単に実現できる。しかし既に説明したように、音韻継
続時間計算処理部１７７での処理（音韻継続時間計算処
理）では、ＣＶわたりの間隔を変えても子音の音韻継続
時間を音節毎に一定にするため、素片作成時と異なるサ
ンプリング周波数へ合成音声を変換した後、素片作成時
と同じサンプリング周波数でＤ／Ａ変換すると、子音の
継続時間が縮んだり、間延びしたりし、この結果、合成
される音声の明瞭性・自然性に影響を及ぼすことがあ
る。

【０２９３】そこで、合成される音声の子音の継続時間
を音節毎に一定に保つことができるようにした第１５の
実施形態につき説明する。

【０２９４】図１９は本発明の第１５の実施形態に係る
音声の規則合成装置の概略構成を示すブロック図であ
り、図１７または図１８と同一部分には同一符号を付し
てある。

【０２９５】この図１９の構成は、前記第６の実施形態
に係る図８の音声規則合成装置の構成に対応するもの
で、図８の構成においてＤ／Ａ変換器でのＤ／Ａ変換の
サンプリング周波数を可変する代わりに、合成音声（離
散音声信号）のサンプリング周波数自体を可変するもの
である。

【０２９６】本実施形態のポイントは、図１８中の音韻
継続時間計算処理部１７７に代えて、音韻継続時間が制
御可能な音韻継続時間計算処理部２０７を設けると共
に、図１８中の声質制御部１９７に代えて、サンプリン
グ周波数変換処理部１８８の変換するサンプリング周波
数だけでなく合成音声のスピードを制御する声質制御部
２１７を設け、当該声質制御部２１７により、声質切替
部１８６の指定に応じて、サンプリング周波数変換処理
部１８８でのサンプリング周波数変換処理と同時に、音
韻継続時間計算処理部２０７での音韻継続時間を制御す
るところにある。ここで、Ｄ／Ａ変換器１８３でのＤ／
Ａ変換のサンプリング周波数（第３の標本周期）は固定
であり、前記第１３の実施形態と同様に音声素片作成時
の音声のサンプリング周波数（第１の標本周期）に一致
するものとする。

【０２９７】本実施形態では、前記第１４の実施形態と
同様に声質切替部１８６にて３種類の声質が指定可能で
ある。声質制御部２１７は声質切替部１８６で指定され
た声質に応じて、例えば１１０２５Ｈｚ（＝未変換），
８０００Ｈｚ，１６０００Ｈｚのいずれかのサンプリン
グ周波数へのサンプリング周波数変換処理を行うように
サンプリング周波数変換処理部１８８を制御する。

【０２９８】同時に声質制御部２１７は、声質切替部１
８６によって指定された声質に応じて、音韻継続時間計
算処理部２０７を次のように制御する。即ち声質制御部
２１７は、全ての音韻の継続時間、つまり子音の継続時
間と母音の継続時間が（音韻継続時間）＝（１１０２５Ｈｚへのサンプリング
周波数変換時の音韻継続時間）×（Ｄ／Ａ変換のサンプ
リング周波数）／（サンプリング周波数変換後のサンプ
リング周波数）となるよう音韻継続時間計算処理部２０７を制御する。

【０２９９】したがって、８０００Ｈｚへのサンプリン
グ周波数変換処理を行う際には、声質制御部２１７は上
式に基づき、１１０２５Ｈｚへサンプリング周波数変換
するとき（あるいはサンプリング周波数変換をしないと
き）の音韻継続時間の（１１０２５[Hz]／８０００[H
z]）倍の音韻継続時間となるよう音韻継続時間計算処理
部２０７を制御する。また声質制御部２１７は、１６０
００Ｈｚへのサンプリング周波数変換処理を行う際に
は、１１０２５Ｈｚへサンプリング周波数変換するとき
（あるいはサンプリング周波数変換をしないとき）の音
韻継続時間の（１１０２５[Hz]／１６０００[Hz]）倍の
音韻継続時間となるよう音韻継続時間計算処理部２０７
を制御する。

【０３００】このよう本実施形態においては、素片作成
時と異なるサンプリング周波数（第１の標本周期とは異
なる第２の標本周期）へサンプリング周波数変換処理
し、素片作成時と同じサンプリング周波数（第２の標本
周期とは異なる第３の標本周期）でＤ／Ａ変換したとき
に生じる合成音声のスピードの変化を、各音韻継続時間
を一定の割合で変えることで相殺することができ、かつ
合成される音声の子音の継続時間を音節毎に一定に保つ
ことができる。

【０３０１】［第１６の実施形態］前記第１４または第
１５の実施形態に基づいて合成を行えば、確かに声質を
変えながらも合成される音声のスピードをほぼ一定に保
つことができる。しかし、Ｄ／Ａ変換器１８３へ入力す
る音声のサンプリング周波数（サンプリング周波数変換
処理後のサンプリング周波数）とＤ／Ａ変換のサンプリ
ング周波数とを違えるということは、レコードの早回し
や遅回しとほぼ同じであるから、音声の過渡部分の時間
的に縮んだり間延びすることは避けられない。

【０３０２】例をあげれば、/ わ/ という発声は、/ う
/ に近い口の形から急激に唇を開いて/ あ/ へ移る運動
を発声器管が行う。したがって、Ｄ／Ａ変換時のサンプ
リング周波数を落して、レコードの遅回しのようなこと
をすれば、この変化が緩やかになり、/ わ/ ではなく、
/ うあー/ のように聞こえてくる。

【０３０３】そこで、Ｄ／Ａ変換器１８３へ入力する音
声のサンプリング周波数（サンプリング周波数変換処理
後のサンプリング周波数）と異なるサンプリング周波数
でＤ／Ａ変換したときに生じる合成音声過渡部分の時間
的方向の縮みや間延びを抑えることができるようにした
第１６の実施形態につき説明する。

【０３０４】図２０は本発明の第１６の実施形態に係る
音声の規則合成装置の概略構成を示すブロック図であ
り、図１９と同一部分には同一符号を付してある。

【０３０５】この図２０の構成は、前記第７の実施形態
に係る図９の音声規則合成装置の構成に対応するもの
で、図９の構成においてＤ／Ａ変換器でのＤ／Ａ変換の
サンプリング周波数を可変する代わりに、合成音声（離
散音声信号）のサンプリング周波数自体を可変するもの
である。

【０３０６】本実施形態のポイントは、図１９中の音韻
パラメータ生成処理部１８０に代えて、（音声素片から
なる）音韻パラメータを時間軸方向へ伸縮する機能が付
加された音韻パラメータ生成処理部２３０を設けると共
に、図１９中の声質制御部２１７に代えて、音韻継続時
間及びサンプリング周波数変換処理部１８８の変換する
サンプリング周波数だけでなく音韻パラメータの時間軸
方向への伸縮を制御する声質制御部２３７を設け、当該
声質制御部２３７により、声質切替部１８６の指定に応
じて、サンプリング周波数変換処理部１８８でのサンプ
リング周波数変換処理及び音韻継続時間計算処理部２０
７での音韻継続時間を制御する他に、音韻パラメータ生
成処理部２３０を制御し、合成音声の過渡部が縮んでし
まうような場合には、予め音韻パラメータを時間方向に
引き伸ばして音韻パラメータを作成させ、合成音声の過
渡部が間延びするような場合には、予め音韻パラメータ
を時間方向に圧縮して音韻パラメータを作成させるとこ
ろにある。ここで、Ｄ／Ａ変換器１８３でのＤ／Ａ変換
のサンプリング周波数（第３の標本周期）は固定であ
り、前記第１３の実施形態と同様に音声素片作成時の音
声のサンプリング周波数（第１の標本周期）に一致する
ものとする。

【０３０７】本実施形態では、前記第１５の実施形態と
同様に声質切替部１８６にて３種類の声質が指定可能で
ある。声質制御部２３７は声質切替部１８６で指定され
た声質に応じて、１１０２５Ｈｚ（＝未変換），８００
０Ｈｚ，１６０００Ｈｚのいずれかのサンプリング周波
数へのサンプリング周波数変換処理を行うようにサンプ
リング周波数変換処理部１８８を制御する。

【０３０８】同時に声質制御部２３７は、声質切替部１
８６によって指定された声質に応じて、全ての音韻の継
続時間、即ち子音の継続時間と母音の継続時間を（音韻継続時間）＝（１１０２５Ｈｚへのサンプリング
変換時の音韻継続時間）×（Ｄ／Ａ変換のサンプリング
周波数）／（サンプリング周波数変換処理後のサンプリ
ング周波数）となるよう音韻継続時間計算処理部２０７を制御する。

【０３０９】さらに、声質制御部２３７は音韻パラメー
タ生成処理部２３０を制御し、Ｄ／Ａ変換器１８３への
入力となる合成音声のサンプリング周波数（サンプリン
グ周波数変換処理後のサンプリング周波数）とＤ／Ａ変
換器１８３でのＤ／Ａ変換のサンプリング周波数が異な
るために、合成音声の過渡部が縮んでしまうような場合
には、予め音韻パラメータを時間方向に引き伸ばして音
韻パラメータを作成させ、合成音声の過渡部が間延びす
るような場合には、予め音韻パラメータを時間方向に圧
縮して音韻パラメータを作成させる。

【０３１０】もっと正確には、声質制御部２３７は、素
片自身の長さを、（Ｄ／Ａ変換のサンプリング周波数／
サンプリング周波数変換処理後のサンプリング周波数）
倍となるように伸縮を行ってから接続補間し、音韻パラ
メータを生成させる。

【０３１１】即ち、本実施形態における声質制御部２３
７は、サンプリング周波数変換処理部１８８が１１０２
５Ｈｚ（メモリ１８１に蓄えられた音声素片を作成した
際のサンプリング周波数と同じサンプリング周波数）へ
のサンプリング周波数変換処理を行う（言い換えれば、
サンプリング周波数変換処理を行わない）場合には、音
声素片の伸縮は行わずに音韻パラメータを生成し、８０
００へのサンプリング周波数変換処理を行う場合には、
音声素片を（１１０２５[Hz]／８０００[Hz]）倍の長さ
に延ばしてから接続補間して音韻パラメータを生成し、
１６０００Ｈｚへのサンプリング周波数変換処理を行う
場合には、音声素片を（１１０２５[Hz]／１６０００[H
z]）倍の長さに縮めてから接続補間して音韻パラメータ
を生成するよう音韻パラメータ生成処理部２３０を制御
する。

【０３１２】このように本実施形態においては、Ｄ／Ａ
変換器１８３への入力となる合成音声のサンプリング周
波数（サンプリング周波数変換処理後のサンプリング周
波数、第２の標本周期）とＤ／Ａ変換器１８３でのＤ／
Ａ変換のサンプリング周波数（第３の標本周期）を異な
らせたことによって生じる合成音声過渡部分の時間方向
の縮みや間延びを、予め音韻パラメータ生成時に音声素
片を伸縮させておくことで打ち消すことができる。

【０３１３】［第１７の実施形態］前述の第１４乃至第
１６の実施形態は、ケプストラムやＬＰＣなどを利用し
た音声規則合成、即ち音声波形を分析して得られるパラ
メータを用いた音声規則合成だけではなく、波形合成
（による規則合成）にも応用は可能である。しかし、パ
ラメータを用いた音声規則合成では、前述の第１４乃至
第１６の実施形態を用いずとも、声質を変えながら、合
成音声のスピードを一定にし、かつ音声過渡部の縮み間
延びを起こさせない簡便な方法が適用可能である。

【０３１４】そこで、この簡便な方法を、パラメータを
用いた音声規則合成に適用した第１７の実施形態につき
説明する。

【０３１５】図２１は本発明の第１７の実施形態に係る
音声の規則合成装置の概略構成を示すブロック図であ
り、図１７と同一部分には同一符号を付してある。

【０３１６】この図２１の構成は、前記第８の実施形態
に係る図１０の音声規則合成装置の構成に対応するもの
で、図１０の構成においてＤ／Ａ変換器でのＤ／Ａ変換
のサンプリング周波数を可変する代わりに、合成音声
（離散音声信号）のサンプリング周波数自体を可変する
ものである。

【０３１７】本実施形態のポイントは、図１７中の合成
フィルタ処理部１８２に代えて、合成時のフレーム周期
が制御可能な合成フィルタ処理部２５２を設けると共
に、図１７中の声質制御部１８７に代えて、サンプリン
グ周波数変換処理部１８８の変換するサンプリング周波
数だけでなく合成時のフレーム周期を制御する声質制御
部２５７を設け、当該声質制御部２５７により、声質切
替部１８６の指定に応じて、サンプリング周波数変換処
理部１８８でのサンプリング周波数変換処理と同時に、
合成フィルタ処理部２５２での合成時のフレーム周期を
制御するところにある。ここで、Ｄ／Ａ変換器１８３で
のＤ／Ａ変換のサンプリング周波数（第３の標本周期）
は固定であり、前記第１３の実施形態と同様に音声素片
作成時の音声のサンプリング周波数（第１の標本周期）
に一致するものとする。

【０３１８】本実施形態では、前記第１３の実施形態と
同様に声質切替部１８６にて３種類の声質が指定可能で
ある。声質制御部２５７は声質切替部１８６で指定され
た声質に応じて、１１０２５Ｈｚ（＝未変換），８００
０Ｈｚ，１６０００Ｈｚのいずれかのサンプリング周波
数へのサンプリング周波数変換処理を行うようにサンプ
リング周波数変換処理部１８８を制御する。

【０３１９】同時に声質制御部２５７は、声質切替部１
８６によって指定された声質に応じて、合成フィルタ処
理部２５２で行われる合成のフレーム周期を設定する。
合成のフレーム周期は次式により与えられる。

【０３２０】（フレーム周期）＝（素片作成時のフレーム周期）×（サンプリング周波数変換後のサンプリング周期）／（Ｄ／Ａ変換のサンプリング周期）＝（素片作成時のフレーム周期）×（Ｄ／Ａ変換のサンプリング周波数）／（サンプリング周波数変換後のサンプリング周波数）したがって、Ｄ／Ａ変換時のサンプリング周波数と同じ
サンプリング周波数、即ち１１０２５Ｈｚへのサンプリ
ング周波数変換処理を行う（言い換えれば、サンプリン
グ周波数変換処理を行わない）際には、声質制御部２５
７は上式に基づき、フレーム周期をケプストラム作成時
と同じ１０msecで合成するよう合成フィルタ処理部２５
２を制御する。

【０３２１】また声質制御部２５７は、音声素片作成時
の音声のサンプリング周波数とは異なるサンプリング周
波数（第１の標本周期とは異なる第２の標本周期）、例
えば８０００Ｈｚへのサンプリング周波数変換処理を行
う際には、１０[msec]×１１０２５[Hz]／８０００[Hz]＝１３．８
[msec] のフレーム周期（第１のフレーム周期とは異なる第２の
フレーム周期）で合成を行うよう制御し、１６０００Ｈ
ｚへのサンプリング周波数変換処理を行う際には、１０[msec]×１１０２５[Hz]／１６０００[Hz]＝６．９
[msec] のフレーム周期（第１のフレーム周期とは異なる第２の
フレーム周期）で合成を行うよう制御する。

【０３２２】このように本実施形態においては、Ｄ／Ａ
変換器１８３への入力である合成音声のサンプリング周
波数（第２の標本周期）とＤ／Ａ変換器１８３でのＤ／
Ａ変換のサンプリング周波数（第３の標本周期）を違え
たときに生じる合成音声のスピードの変化を、合成フィ
ルタ処理部２５２における合成のフレーム周期（第２の
フレーム周期）を音声素片作成時のフレーム周期（第１
のフレーム周期）とは異ならせることで相殺することが
できる。

【０３２３】したがって、Ｄ／Ａ変換器１８３でのＤ／
Ａ変換のサンプリング周波数（１１０２５Ｈｚ）とは異
なる８０００Ｈｚあるいは１６０００Ｈｚへサンプリン
グ周波数を変換した後、１１０２５Ｈｚのサンプリング
周波数でＤ／Ａ変換を行っても、同じスピードの音声の
アナログ信号を得ることができる。また同時に、音声素
片作成時と異なるサンプリング周波数でＤ／Ａ変換した
ときに生じる音声過渡部の縮みや間延びも同時に防ぐこ
とができる。

【０３２４】［第１８の実施形態］前記第１３乃至第１
７の実施形態にはもう１つの問題点が存在する。それ
は、Ｄ／Ａ変換器１８３への入力となる音声のサンプリ
ング周波数（＝サンプリング周波数変換処理後のサンプ
リング周波数）とＤ／Ａ変換のサンプリング周波数が異
なると、声の高さ即ち音声のピッチが変化してしまうと
いうことである。例えば、（サンプリング周波数変換処
理後のサンプリング周波数）＞（Ｄ／Ａ変換のサンプリ
ング周波数）のときには、合成される音声のピッチは低
くなる。逆に、（サンプリング周波数変換処理後のサン
プリング周波数）＜（Ｄ／Ａ変換のサンプリング周波
数）のときには、合成される音声のピッチは高くなる。

【０３２５】このような合成される音声のピッチの違い
は、サンプリング周波数変換処理後のサンプリング周波
数が前記第１３の実施形態程度の違い（９１％，１０９
％）ではあまり問題とはならない。

【０３２６】しかし、声質を大きく変えようとして、両
サンプリング周波数の比を例えば５０％，２００％程度
に設定すれば、合成音声のピッチはそれぞれ２００％，
５０％になる。この場合、１１０２５Ｈｚへサンプリン
グ周波数変換処理したとき（あるいはサンプリング周波
数変換を行わないとき）の合成音声と比較して、前者は
ピッチが１[oct] 高い音声が合成され、後者は１[oct]
低い音声が合成されるので聞きづらくなるという問題が
発生する。

【０３２７】図２２は本発明の第１８の実施形態に係る
音声の規則合成装置の概略構成を示すブロック図であ
り、図１７と同一部分には同一符号を付してある。

【０３２８】この図２２の構成は、前記第９の実施形態
に係る図１１の音声規則合成装置の構成に対応するもの
で、図１１の構成においてＤ／Ａ変換器でのＤ／Ａ変換
のサンプリング周波数を可変する代わりに、合成音声
（離散音声信号）のサンプリング周波数自体を可変する
ものである。

【０３２９】本実施形態のポイントは、図１７中の合成
フィルタ処理部１８２に代えて、合成時のフレーム周期
及び合成音声のピッチが制御可能な合成フィルタ処理部
２７２を設けると共に、ピッチ生成処理部１７９と合成
フィルタ処理部２７２の間にピッチ生成処理部１７９で
生成されたピッチパターン（基本周波数パターン）を周
波数の異なる別のピッチパターンに変換（ピッチ変調）
して合成フィルタ処理部２７２に与えるピッチ変調処理
部２７８を設け、さらに図１７中の声質制御部１８７に
代えて、サンプリング周波数変換処理部１８８の変換す
るサンプリング周波数だけでなく合成時のフレーム周期
及びピッチの変調を制御する声質制御部２７７を設け、
当該声質制御部２７７により、声質切替部１８６の指定
に応じて、サンプリング周波数変換処理部１８８でのサ
ンプリング周波数変換処理及び合成フィルタ処理部２７
２での合成のフレーム周期を制御すると同時に、ピッチ
変調処理部２７８でのピッチの変調を制御するところに
ある。ここで、Ｄ／Ａ変換器１８３でのＤ／Ａ変換のサ
ンプリング周波数（第３の標本周期）は固定であり、前
記第１３の実施形態と同様に音声素片作成時の音声のサ
ンプリング周波数（第１の標本周期）に一致するものと
する。

【０３３０】本実施形態では、前記第１３の実施形態と
同様に声質切替部１８６にて３種類の声質が指定可能で
ある。声質制御部２７７は声質切替部１８６で指定され
た声質に応じて、例えば１１０２５Ｈｚ（＝未変換），
８０００Ｈｚ，１６０００Ｈｚのいずれかのサンプリン
グ周波数への変換を行うようにサンプリング周波数変換
処理部１８８を制御する。

【０３３１】同時に声質制御部２７７は、声質切替部１
８６によって指定された声質に応じて、合成フィルタ処
理部２７２で行われる合成のフレーム周期を設定する。
合成のフレーム周期は次式により与えられる。

【０３３２】（フレーム周期）＝（素片作成時のフレーム周期）×（サンプリング周波数変換後のサンプリング周期）／（Ｄ／Ａ変換のサンプリング周期）＝（素片作成時のフレーム周期）×（Ｄ／Ａ変換のサンプリング周波数）／（サンプリング周波数変換後のサンプリング周波数）声質制御部２７７はさらに、合成フィルタ処理部２７２
に与えるピッチを、（合成フィルタ処理部２７２に与えるピッチ）＝（１１０２５[Hz]へのサンプリング周波数変換時のピッチ）×（Ｄ／Ａ変換のサンプリング周期）／（サンプリング周波数変換処理後のサンプリング周期）＝（１１０２５[Hz]へのサンプリング周波数変換時のピッチ）×（サンプリング周波数変換処理後のサンプリング周波数）／（Ｄ／Ａ変換のサンプリング周波数）となるように、ピッチ変調処理部２７８を制御する。

【０３３３】したがって、Ｄ／Ａ変換時のサンプリング
周波数と同じサンプリング周波数、即ち１１０２５[Hz]
へのサンプリング周波数変換処理を行う（言い換えれ
ば、サンプリング周波数変換処理を行わない）際には、
声質制御部２７７は、ピッチ生成処理部１７９が生成し
たピッチをそのまま合成フィルタ処理部２７２に与える
ようにピッチ変調処理部２７８を制御する。

【０３３４】また声質制御部２７７は、８０００Ｈｚへ
のサンプリング周波数変換処理を行う際には、ピッチ生
成処理部１７９が生成したピッチを（８０００[Hz]／１
１０２５[Hz]）倍して合成フィルタ処理部２７２に与え
るよう制御し、１６０００Ｈｚへのサンプリング周波数
変換処理を行う際には、ピッチ生成処理部１７９が生成
したピッチを（１６０００[Hz]／１１０２５[Hz]）倍し
て合成合成フィルタ処理部２７２に与えるように制御す
る。

【０３３５】このように本実施形態においては、合成フ
ィルタ処理部２７２に与えるピッチを声質制御部２７７
の制御のもとで予め変調しておくことにより、Ｄ／Ａ変
換器１８３への入力である合成音声のサンプリング周波
数（第２の標本周期）とＤ／Ａ変換器１８３でのＤ／Ａ
変換のサンプリング周波数（第３の標本周期）を違えた
ときに生じる合成音声のピッチの変化を相殺することが
できる。

【０３３６】したがって、８０００Ｈｚあるいは１６０
００Ｈｚへサンプリング周波数を変換した後、１１０２
５Ｈｚのサンプリング周波数でＤ／Ａ変換を行っても、
同じ声の高さの音声のアナログ信号を得ることができ
る。

【０３３７】以上本発明の実施形態について説明してき
たが、本発明はこれら実施形態に限定されるものではな
い。

【０３３８】例えば、前記全ての実施形態では、音声の
特徴パラメータとしてケプストラムを使用しているが、
ＬＰＣやＰＡＲＣＯＲなど他のパラメータであっても本
発明は適用可能であり、同様な効果が得られる。声質の
数も全ての実施形態において３種類としたが、２種類ま
たは４種類以上でもよい。言語処理部に関しても形態素
解析以外に構文解析等が挿入されても全く問題なく、ま
た日本語のＴＴＳに限らず英語やその他の言語のＴＴＳ
に応用可能である。

【０３３９】また、継続時間決定の方法に関してもＣＶ
わたり間隔一定といった方法でなく、統計的な手法に基
づいた制御によっても構わない。ピッチ生成に関して
も、点ピッチによる方法でなくとも、例えば藤崎モデル
を利用した場合でも本発明は適用可能である。

【０３４０】要するに本発明はその要旨に逸脱しない範
囲で種々変形して実施することができる。

【０３４１】

【発明の効果】以上詳述したように本発明によれば、デ
ィジタル／アナログ変換手段に入力される合成された離
散音声信号の標本周期と当該離散音声信号を上記ディジ
タル／アナログ変換手段でアナログ音声信号に変換する
際の標本周期（変換周期）とが異なるように制御するこ
とで、あるいはディジタル／アナログ変換手段に入力さ
れる合成された離散音声信号の標本周期と当該離散音声
信号を上記ディジタル／アナログ変換手段でアナログ音
声信号に変換する際の標本周期（変換周期）との比を選
択指定された声質に応じて可変制御することで、アナウ
ンサ発声の収録や音声素片の再切り出しを行うことな
く、合成音声の声質を簡単に増やすことができる。

【図面の簡単な説明】

【図１】本発明の第１の実施形態に係る音声の分析合成
装置の概略構成を示すブロック図。

【図２】同実施形態においてＤ／Ａ変換のサンプリング
周波数を変えることにより得られる効果を説明するため
の図。

【図３】本発明の第２の実施形態に係る音声の分析合成
装置の概略構成を示すブロック図。

【図４】本発明の第３の実施形態に係る音声の分析合成
装置の概略構成を示すブロック図。

【図５】本発明の第４の実施形態に係る音声の規則合成
装置の概略構成を示すブロック図。

【図６】合成フィルタ処理部の構成を示すブロック図。

【図７】本発明の第５の実施形態に係る音声の規則合成
装置の概略構成を示すブロック図。

【図８】本発明の第６の実施形態に係る音声の規則合成
装置の概略構成を示すブロック図。

【図９】本発明の第７の実施形態に係る音声の規則合成
装置の概略構成を示すブロック図。

【図１０】本発明の第８の実施形態に係る音声の規則合
成装置の概略構成を示すブロック図。

【図１１】本発明の第９の実施形態に係る音声の規則合
成装置の概略構成を示すブロック図。

【図１２】本発明の第１０の実施形態に係る音声の分析
合成装置の概略構成を示すブロック図。

【図１３】同実施形態においてＤ／Ａ変換器への入力と
なる合成音声のサンプリング周波数を変えることにより
得られる効果を説明するための図。

【図１４】サンプリング周波数変換処理部の構成を、そ
の動作と共に説明するための図。

【図１５】本発明の第１１の実施形態に係る音声の分析
合成装置の概略構成を示すブロック図。

【図１６】本発明の第１２の実施形態に係る音声の分析
合成装置の概略構成を示すブロック図。

【図１７】本発明の第１３の実施形態に係る音声の規則
合成装置の概略構成を示すブロック図。

【図１８】本発明の第１４の実施形態に係る音声の規則
合成装置の概略構成を示すブロック図。

【図１９】本発明の第１５の実施形態に係る音声の規則
合成装置の概略構成を示すブロック図。

【図２０】本発明の第１６の実施形態に係る音声の規則
合成装置の概略構成を示すブロック図。

【図２１】本発明の第１７の実施形態に係る音声の規則
合成装置の概略構成を示すブロック図。

【図２２】本発明の第１８の実施形態に係る音声の規則
合成装置の概略構成を示すブロック図。

【図２３】従来の音声の分析合成装置の概略構成を示す
ブロック図。

【図２４】従来の音声の規則合成装置の概略構成を示す
ブロック図。

【符号の説明】

１１，１４１…メモリ（特徴パラメータ蓄積手段）、１２，１４２…メモリ（ピッチパターン蓄積手段）、１３，２３，３３，５２，，１１２，１３２，１４３，
１５３，１６３，１８２，２５２，２７２…合成フィル
タ処理部（合成手段）、１４，５３，１４４，１８３…Ｄ／Ａ変換器（ディジタ
ル／アナログ変換手段）、１７，５６，１４７，１８６…声質切替部（声質選択手
段）、１８，２８，３８，５７，６７，８７，９７，１１７，
１３７，１４８，１５８，１６８，１８７，１９７，２
１７，２３７，２５７，２７７…声質制御部、３１，１３８，１６１，２７８…ピッチ変調処理部（ピ
ッチパターン変調手段）、４２，６２，７２，９２，１０２，１２２，１７２，１
９２，２０２，２２２，２４２，２６２…音声合成部
（音声合成手段）、４７，７７，１７７，２０７…音韻継続時間計算処理
部、４８，６８，１７８，１９８…発話速度制御部、４９，１７９…ピッチ生成処理部、５０，９０，１８０，２３０…音韻パラメータ生成処理
部（合成パラメータフレーム時系列生成手段）、５１，１８１…音声素片メモリ（素片蓄積手段）、１４９，１８８…サンプリング周波数変換処理部（標本
周期変換手段）。

Claims

【特許請求の範囲】

【請求項１】第１の標本周期で標本化した離散音声信
号を分析して得られる音声の特徴パラメータを蓄積する
蓄積手段と、この蓄積手段より読み出した音声の特徴パラメータを入
力として離散音声信号を合成する合成手段と、この合成手段によって合成された離散音声信号を前記第
１の標本周期とは異なる第２の標本周期でアナログ音声
信号に変換するディジタル／アナログ変換手段とを具備
することを特徴とする音声合成装置。
【請求項２】第１の標本周期で標本化した離散音声信
号を分析して得られる音声の特徴パラメータを蓄積手段
に蓄積しておき、前記蓄積手段より読み出した音声の特
徴パラメータを入力として離散音声信号を合成する音声
合成方法において、前記合成した離散音声信号を前記第１の標本周期とは異
なる第２の標本周期でアナログ音声信号に変換すること
を特徴とする音声合成方法。
【請求項３】第１の標本周期で標本化した離散音声信
号を分析して得られる音声の特徴パラメータを蓄積する
蓄積手段と、この蓄積手段より読み出した音声の特徴パラメータを入
力として離散音声信号を合成する合成手段と、合成する音声の声質を選択指定するための声質選択手段
と、前記合成手段によって合成された離散音声信号を前記声
質選択手段により選択指定された声質に応じて定められ
る第２の標本周期でアナログ音声信号に変換するディジ
タル／アナログ変換手段とを具備することを特徴とする
音声合成装置。
【請求項４】第１の標本周期で標本化した離散音声信
号を分析して得られる音声の特徴パラメータを蓄積手段
に蓄積しておき、前記蓄積手段より読み出した音声の特
徴パラメータを入力として離散音声信号を合成する音声
合成方法において、合成する音声の声質の選択指定の受け付けを行い、前記合成した離散音声信号を前記受け付けた声質に応じ
て定められる第２の標本周期でアナログ音声信号に変換
することを特徴とする音声合成方法。
【請求項５】第１の標本周期で標本化した離散音声信
号に第１のフレーム周期で時間窓をかけて分析して得ら
れる音声の特徴パラメータフレームの時系列から、前記
第１のフレーム周期とは異なる第２のフレーム周期で離
散音声信号を合成する合成手段と、この合成手段によって合成された離散音声信号を前記第
１の標本周期とは異なる第２の標本周期でアナログ音声
信号に変換するディジタル／アナログ変換手段とを具備
することを特徴とする音声合成装置。
【請求項６】第１の標本周期で標本化した離散音声信
号に第１のフレーム周期で時間窓をかけて分析して得ら
れる音声の特徴パラメータフレームの時系列から、前記
第１のフレーム周期とは異なる第２のフレーム周期で離
散音声信号を合成し、この第２のフレーム周期で合成した離散音声信号を前記
第１の標本周期とは異なる第２の標本周期でアナログ音
声信号に変換することを特徴とする音声合成方法。
【請求項７】第１の標本周期で標本化した離散音声信
号に第１のフレーム周期で時間窓をかけて分析して得ら
れる音声の特徴パラメータフレームの時系列から、前記
第１のフレーム周期、前記第１の標本周期及び前記第１
の標本周期とは異なる第２の標本周期に基づいて定めら
れる第２のフレーム周期で離散音声信号を合成する合成
手段と、この合成手段によって合成された離散音声信号を前記第
２の標本周期でアナログ音声信号に変換するディジタル
／アナログ変換手段とを具備することを特徴とする音声
合成装置。
【請求項８】第１の標本周期で標本化した離散音声信
号に第１のフレーム周期で時間窓をかけて分析して得ら
れる音声の特徴パラメータフレームの時系列から、前記
第１のフレーム周期、前記第１の標本周期及び前記第１
の標本周期とは異なる第２の標本周期に基づいて定めら
れる第２のフレーム周期で離散音声信号を合成し、この第２のフレーム周期で合成した離散音声信号を前記
第２の標本周期でアナログ音声信号に変換することを特
徴とする音声合成方法。
【請求項９】第１の標本周期で標本化した離散音声信
号に第１のフレーム周期で時間窓をかけて分析して得ら
れる音声の特徴パラメータフレームの時系列を蓄積する
蓄積手段と、合成する音声の声質を選択指定するための声質選択手段
と、前記蓄積手段より読み出した特徴パラメータフレームの
時系列から、前記声質選択手段により選択指定された声
質に応じて定められる第２のフレーム周期で離散音声信
号を合成する合成手段と、この合成手段によって合成された離散音声信号を前記声
質選択手段により選択指定された声質に応じて定められ
る第２の標本周期でアナログ音声信号に変換するディジ
タル／アナログ変換手段とを具備することを特徴とする
音声合成装置。
【請求項１０】第１の標本周期で標本化した離散音声
信号に第１のフレーム周期で時間窓をかけて分析して得
られる音声の特徴パラメータフレームの時系列を蓄積手
段に蓄積しておき、前記蓄積手段より読み出した特徴パ
ラメータフレームの時系列から離散音声信号を合成する
音声合成方法において、合成する音声の声質の選択指定を受け付け、前記特徴パラメータフレームの時系列からの離散音声信
号の合成処理を、前記受け付けた声質に応じて定められ
る第２のフレーム周期で行い、この第２のフレーム周期で合成した離散音声信号を前記
受け付けた声質に応じて定められる第２の標本周期でア
ナログ音声信号に変換することを特徴とする音声合成方
法。
【請求項１１】第１の標本周期で標本化した離散音声
信号に第１のフレーム周期で時間窓をかけて分析して得
られる音声の特徴パラメータフレームの時系列から、前
記第１のフレーム周期、前記第１の標本周期及び前記第
１の標本周期とは異なる第２の標本周期をもとに第２のフレーム周期＝第１のフレーム周期×第１の標本
周期／第２の標本周期で定められる第２のフレーム周期で離散音声信号を合成
する合成手段と、この合成手段によって合成された離散音声信号を前記第
２の標本周期でアナログ音声信号に変換するディジタル
／アナログ変換手段とを具備することを特徴とする音声
合成装置。
【請求項１２】第１の標本周期で標本化した離散音声
信号に第１のフレーム周期で時間窓をかけて分析して得
られる音声の特徴パラメータフレームの時系列から、前
記第１のフレーム周期、前記第１の標本周期及び前記第
１の標本周期とは異なる第２の標本周期をもとに第２のフレーム周期＝第１のフレーム周期×第１の標本
周期／第２の標本周期で定められる第２のフレーム周期で離散音声信号を合成
し、この第２のフレーム周期で合成した離散音声信号を前記
第２の標本周期でアナログ音声信号に変換することを特
徴とする音声合成方法。
【請求項１３】第１の標本周期で標本化した離散音声
信号を分析して得られる音声の特徴パラメータを蓄積す
る特徴パラメータ蓄積手段と、音声の基本周波数パターンを蓄積するピッチパターン蓄
積手段と、前記特徴パラメータ蓄積手段から読み出した特徴パラメ
ータと前記ピッチパターン蓄積手段から読み出した基本
周波数パターンとから離散音声信号を合成する合成手段
と、この合成手段によって合成された離散音声信号をアナロ
グ音声信号に変換するディジタル／アナログ変換手段で
あって、前記アナログ音声信号への変換を前記第１の標
本周期または前記第１の標本周期とは異なる第２の標本
周期で選択的に行うことが可能なディジタル／アナログ
変換手段と、このディジタル／アナログ変換手段にて前記第２の標本
周期でアナログ音声信号への変換が行われる際には、前
記ピッチパターン蓄積手段から読み出した基本周波数パ
ターンとは異なる基本周波数パターンを生成して前記合
成手段に与えるピッチパターン生成手段とを具備するこ
とを特徴とする音声合成装置。
【請求項１４】第１の標本周期で標本化した離散音声
信号を分析して得られる音声の特徴パラメータを特徴パ
ラメータ蓄積手段に蓄積しておくと共に、音声の基本周
波数パターンをピッチパターン蓄積手段に蓄積してお
き、前記特徴パラメータ蓄積手段から読み出した特徴パ
ラメータと前記ピッチパターン蓄積手段から読み出した
基本周波数パターンとから離散音声信号を合成し、この
合成した離散音声信号をアナログ音声信号に変換する音
声合成方法において、前記アナログ音声信号への変換を前記第１の標本周期で
行う第１のモードと前記第１の標本周期とは異なる第２
の標本周期で行う第２のモードとを用意し、前記第２のモード時の合成処理では、前記ピッチパター
ン蓄積手段から読み出した基本周波数パターンとは異な
る基本周波数パターンを生成して前記離散音声信号の合
成に用いるようにしたことを特徴とする音声合成方法。
【請求項１５】第１の標本周期で標本化した離散音声
信号を分析して得られる音声の特徴パラメータを蓄積す
る特徴パラメータ蓄積手段と、音声の基本周波数パターンを蓄積するピッチパターン蓄
積手段と、前記ピッチパターン蓄積手段から読み出した基本周波数
パターンを前記第１の標本周期及び前記第１の標本周期
とは異なる第２の標本周期に基づいて変調するピッチパ
ターン変調手段と、前記特徴パラメータ蓄積手段から読み出した特徴パラメ
ータと前記ピッチパターン変調手段にて変調された基本
周波数パターンとから離散音声信号を合成する合成手段
と、この合成手段によって合成された離散音声信号を前記第
２の標本周期でアナログ音声信号に変換するディジタル
／アナログ変換手段とを具備することを特徴とする音声
合成装置。
【請求項１６】第１の標本周期で標本化した離散音声
信号を分析して得られる音声の特徴パラメータを特徴パ
ラメータ蓄積手段に蓄積しておくと共に、音声の基本周
波数パターンをピッチパターン蓄積手段に蓄積してお
き、前記ピッチパターン蓄積手段から読み出した基本周波数
パターンを前記第１の標本周期及び前記第１の標本周期
とは異なる第２の標本周期に基づいて変調し、前記特徴パラメータ蓄積手段から読み出した特徴パラメ
ータと前記ピッチ変調した基本周波数パターンとから離
散音声信号を合成し、この合成した離散音声信号を前記第２の標本周期でアナ
ログ音声信号に変換することを特徴とする音声合成方
法。
【請求項１７】第１の標本周期で標本化した離散音声
信号を分析して得られる音声の特徴パラメータを蓄積す
る特徴パラメータ蓄積手段と、音声の基本周波数パターンを蓄積するピッチパターン蓄
積手段と、合成する音声の声質を選択指定するための声質選択手段
と、前記ピッチパターン蓄積手段から読み出した基本周波数
パターンを対象に、前記声質選択手段により選択指定さ
れた声質に応じた変調を行うピッチパターン変調手段
と、前記特徴パラメータ蓄積手段から読み出した特徴パラメ
ータと前記ピッチパターン変調手段にて変調された基本
周波数パターンとから離散音声信号を合成する合成手段
と、この合成手段によって合成された離散音声信号を前記声
質選択手段により選択指定された声質に応じて定められ
る第２の標本周期でアナログ音声信号に変換するディジ
タル／アナログ変換手段とを具備することを特徴とする
音声合成装置。
【請求項１８】第１の標本周期で標本化した離散音声
信号を分析して得られる音声の特徴パラメータを特徴パ
ラメータ蓄積手段に蓄積しておくと共に、音声の基本周
波数パターンをピッチパターン蓄積手段に蓄積してお
き、前記特徴パラメータ蓄積手段から読み出した特徴パ
ラメータと前記ピッチパターン蓄積手段から読み出した
基本周波数パターンとに基づく離散音声信号の合成を行
う音声合成方法において、合成する音声の声質の選択指定を受け付け、前記ピッチパターン蓄積手段から読み出した基本周波数
パターンを対象に、前記受け付けた声質に応じた変調を
行い、前記特徴パラメータ蓄積手段から読み出した特徴パラメ
ータと前記変調された基本周波数パターンとから離散音
声信号を合成し、この合成した離散音声信号を前記受け付けた声質に応じ
て定められる第２の標本周期でアナログ音声信号に変換
することを特徴とする音声合成方法。
【請求項１９】第１の標本周期で標本化した離散音声
信号を分析して得られる音声の特徴パラメータを蓄積す
る特徴パラメータ蓄積手段と、音声の基本周波数パターンを蓄積するピッチパターン蓄
積手段と、前記ピッチパターン蓄積手段から読み出した基本周波数
パターンを、前記第１の標本周期及び前記第１の標本周
期とは異なる第２の標本周期をもとに（第２の標本周期
／第１の標本周期）倍に変調するピッチパターン変調手
段と、前記特徴パラメータ蓄積手段から読み出した特徴パラメ
ータと前記ピッチパターン変調手段にて変調された基本
周波数パターンとから離散音声信号を合成する合成手段
と、この合成手段によって合成された離散音声信号を前記第
２の標本周期でアナログ音声信号に変換するディジタル
／アナログ変換手段とを具備することを特徴とする音声
合成装置。
【請求項２０】第１の標本周期で標本化した離散音声
信号を分析して得られる音声の特徴パラメータを特徴パ
ラメータ蓄積手段に蓄積しておくと共に、音声の基本周
波数パターンをピッチパターン蓄積手段に蓄積してお
き、前記ピッチパターン蓄積手段から読み出した基本周波数
パターンを、前記第１の標本周期及び前記第１の標本周
期とは異なる第２の標本周期をもとに（第２の標本周期
／第１の標本周期）倍に変調し、前記特徴パラメータ蓄積手段から読み出した特徴パラメ
ータと前記変調された基本周波数パターンとから離散音
声信号を合成し、この合成した離散音声信号を上記第２の標本周期でアナ
ログ音声信号に変換することを特徴とする音声合成方
法。
【請求項２１】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し接続することによって離散音声信号を合成
する音声合成手段と、この音声合成手段によって合成された離散音声信号を前
記第１の標本周期とは異なる第２の標本周期でアナログ
音声信号に変換するディジタル／アナログ変換手段とを
具備することを特徴とする音声合成装置。
【請求項２２】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し接続することによって離散音声信号を合成
し、この合成した離散音声信号を前記第１の標本周期とは異
なる第２の標本周期でアナログ音声信号に変換すること
を特徴とする音声合成方法。
【請求項２３】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し接続することによって離散音声信号を合成
する音声合成手段と、合成する音声の声質を選択指定するための声質選択手段
と、前記音声合成手段によって合成された離散音声信号を前
記声質選択手段により選択指定された声質に応じて定め
られる第２の標本周期でアナログ音声信号に変換するデ
ィジタル／アナログ変換手段とを具備することを特徴と
する音声合成装置。
【請求項２４】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し接続することによって離散音声信号を合成
する音声合成方法において、合成する音声の声質の選択指定の受け付けを行い、前記合成した離散音声信号を前記受け付けた声質に応じ
て定められる第２の標本周期でアナログ音声信号に変換
することを特徴とする音声合成方法。
【請求項２５】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し、この選択した音声素片を、合成される音
声の発話速度または発話時間に関係する発話速度パラメ
ータに応じて接続することによって離散音声信号を合成
する音声合成手段と、この音声合成手段によって合成された離散音声信号をア
ナログ音声信号に変換するディジタル／アナログ変換手
段であって、前記アナログ音声信号への変換を前記第１
の標本周期または前記第１の標本周期とは異なる第２の
標本周期で選択的に行うことが可能なディジタル／アナ
ログ変換手段とを具備し、前記音声合成手段は、前記ディジタル／アナログ変換手
段にて前記第２の標本周期でアナログ音声信号への変換
が行われる際には、前記第１の標本周期でアナログ音声
信号への変換が行われるときとは異なる値の前記発話速
度パラメータを用いるように構成されていることを特徴
とする音声合成装置。
【請求項２６】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し、この選択した音声素片を、合成される音
声の発話速度または発話時間に関係する発話速度パラメ
ータに応じて接続することによって離散音声信号を合成
し、この合成した離散音声信号をアナログ音声信号に変
換する音声合成方法において、前記アナログ音声信号への変換を前記第１の標本周期で
行う第１のモードと前記第１の標本周期とは異なる第２
の標本周期で行う第２のモードとを用意し、前記第２のモード時の合成処理では、前記第１の標本周
期でアナログ音声信号への変換が行われるときとは異な
る値の前記発話速度パラメータを用いるようにしたこと
を特徴とする音声合成方法。
【請求項２７】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し、この選択した音声素片を、合成される音
声の発話速度または発話時間に関係する発話速度パラメ
ータに応じて接続することによって離散音声信号を合成
する音声合成手段であって、使用する前記発話速度パラ
メータを前記第１の標本周期及び前記第１の標本周期と
は異なる第２の標本周期に基づいて決定する音声合成手
段と、この音声合成手段によって合成された離散音声信号を前
記第２の標本周期でアナログ音声信号に変換するディジ
タル／アナログ変換手段とを具備することを特徴とする
音声合成装置。
【請求項２８】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し、この選択した音声素片を、合成される音
声の発話速度または発話時間に関係する発話速度パラメ
ータに応じて接続することによって離散音声信号を合成
する音声合成方法において、合成時に使用する前記発話速度パラメータを前記第１の
標本周期及び前記第１の標本周期とは異なる第２の標本
周期に基づいて決定すると共に、前記合成した離散音声信号を前記第２の標本周期でアナ
ログ音声信号に変換することを特徴とする音声合成方
法。
【請求項２９】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し、この選択した音声素片を、合成される音
声の発話速度または発話時間に関係する発話速度パラメ
ータに応じて接続することによって離散音声信号を合成
する音声合成手段と、合成する音声の声質を選択指定するための声質選択手段
と、前記音声合成手段によって合成された離散音声信号を前
記声質選択手段により選択指定された声質に応じて定め
られる第２の標本周期でアナログ音声信号に変換するデ
ィジタル／アナログ変換手段とを具備し、前記音声合成手段は、使用する前記発話速度パラメータ
を前記声質選択手段により選択指定された声質に応じて
決定するように構成されていることを特徴とする音声合
成装置。
【請求項３０】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し、この選択した音声素片を、合成される音
声の発話速度または発話時間に関係する発話速度パラメ
ータに応じて接続することによって離散音声信号を合成
する音声合成方法において、合成する音声の声質の選択指定の受け付けを行い、合成時に使用する前記発話速度パラメータを前記受け付
けた声質に応じて決定すると共に、前記合成した離散音声信号を前記受け付けた声質に応じ
て定められる第２の標本周期でアナログ音声信号に変換
することを特徴とする音声合成方法。
【請求項３１】与えられた音韻情報に含まれる各音韻
の継続時間を決定する一方、第１の標本周期で標本化し
た離散音声信号から作成した音声素片を前記音韻情報に
基づいて選択し、前記決定した各音韻の継続時間に基づ
いて前記選択した音声素片を接続することによって離散
音声信号を合成する音声合成手段と、この音声合成手段によって合成された離散音声信号をア
ナログ音声信号に変換するディジタル／アナログ変換手
段であって、前記アナログ音声信号への変換を前記第１
の標本周期または前記第１の標本周期とは異なる第２の
標本周期で選択的に行うことが可能なディジタル／アナ
ログ変換手段とを具備し、前記音声合成手段は、前記ディジタル／アナログ変換手
段にて前記第２の標本周期でアナログ音声信号への変換
が行われる際には、前記第１の標本周期でアナログ音声
信号への変換が行われるときとは異なる音韻継続時間と
なるよう前記音韻継続時間の決定を行うように構成され
ていることを特徴とする音声合成装置。
【請求項３２】与えられた音韻情報に含まれる各音韻
の継続時間を決定する一方、第１の標本周期で標本化し
た離散音声信号から作成した音声素片を前記音韻情報に
基づいて選択し、前記決定した各音韻の継続時間に基づ
いて前記選択した音声素片を接続することによって離散
音声信号を合成し、この合成した離散音声信号をアナロ
グ音声信号に変換する音声合成方法において、前記アナログ音声信号への変換を前記第１の標本周期で
行う第１のモードと前記第１の標本周期とは異なる第２
の標本周期で行う第２のモードとを用意し、前記第２のモード時の合成処理では、前記第１の標本周
期でアナログ音声信号への変換が行われるときとは異な
る音韻継続時間となるよう前記音韻継続時間の決定を行
うようにしたことを特徴とする音声合成方法。
【請求項３３】与えられた音韻情報に含まれる各音韻
の継続時間を決定する一方、第１の標本周期で標本化し
た離散音声信号から作成した音声素片を前記音韻情報に
基づいて選択し、前記決定した各音韻の継続時間に基づ
いて前記選択した音声素片を接続することによって離散
音声信号を合成する音声合成手段であって、使用する前
記音韻継続時間を前記第１の標本周期及び前記第１の標
本周期とは異なる第２の標本周期に基づいて決定する音
声合成手段と、この音声合成手段によって合成された離散音声信号を前
記第２の標本周期でアナログ音声信号に変換するディジ
タル／アナログ変換手段とを具備することを特徴とする
音声合成装置。
【請求項３４】与えられた音韻情報に含まれる各音韻
の継続時間を決定する一方、第１の標本周期で標本化し
た離散音声信号から作成した音声素片を前記音韻情報に
基づいて選択し、前記決定した各音韻の継続時間に基づ
いて前記選択した音声素片を接続することによって離散
音声信号を合成する音声合成方法において、合成時に使用する前記音韻継続時間を前記第１の標本周
期及び前記第１の標本周期とは異なる第２の標本周期に
基づいて決定すると共に、前記合成した離散音声信号を前記第２の標本周期でアナ
ログ音声信号に変換することを特徴とする音声合成方
法。
【請求項３５】与えられた音韻情報に含まれる各音韻
の継続時間を決定する一方、第１の標本周期で標本化し
た離散音声信号から作成した音声素片を前記音韻情報に
基づいて選択し、前記決定した各音韻の継続時間に基づ
いて前記選択した音声素片を接続することによって離散
音声信号を合成する音声合成手段と、合成する音声の声質を選択指定するための声質選択手段
と、前記音声合成手段によって合成された離散音声信号を前
記声質選択手段により選択指定された声質に応じて定め
られる第２の標本周期でアナログ音声信号に変換するデ
ィジタル／アナログ変換手段とを具備し、前記音声合成手段は、合成時に使用する前記音韻継続時
間を前記声質選択手段により選択指定された声質に応じ
て決定するように構成されていることを特徴とする音声
合成装置。
【請求項３６】与えられた音韻情報に含まれる各音韻
の継続時間を決定する一方、第１の標本周期で標本化し
た離散音声信号から作成した音声素片を前記音韻情報に
基づいて選択し、前記決定した各音韻の継続時間に基づ
いて前記選択した音声素片を接続することによって離散
音声信号を合成する音声合成方法において、合成する音声の声質の選択指定の受け付けを行い、合成時に使用する前記音韻継続時間を前記受け付けた声
質に応じて決定すると共に、前記合成した離散音声信号を前記受け付けた声質に応じ
て定められる第２の標本周期でアナログ音声信号に変換
することを特徴とする音声合成方法。
【請求項３７】前記音声合成手段は、前記ディジタル
／アナログ変換手段にて前記第２の標本周期でアナログ
音声信号への変換が行われる際には、前記第１の標本周
期でアナログ音声信号への変換が行われるときの音韻継
続時間の（第１の標本周期／第２の標本周期）倍の音韻
継続時間となるよう前記音韻継続時間の決定を行うこと
を特徴とする請求項３１記載の音声合成装置。
【請求項３８】前記第２のモード時の合成処理では、
前記第１の標本周期でアナログ音声信号への変換が行わ
れるときの音韻継続時間の（第１の標本周期／第２の標
本周期）倍の音韻継続時間となるよう前記音韻継続時間
の決定を行うことを特徴とする請求項３２記載の音声合
成方法。
【請求項３９】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し、この選択した音声素片を時間軸方向に伸
縮させながら接続することによって離散音声信号を合成
する音声合成手段と、この音声合成手段によって合成された離散音声信号を前
記第１の標本周期とは異なる第２の標本周期でアナログ
音声信号に変換するディジタル／アナログ変換手段とを
具備することを特徴とする音声合成装置。
【請求項４０】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し、この選択した音声素片を時間軸方向に伸
縮させながら接続することによって離散音声信号を合成
し、この合成した離散音声信号を前記第１の標本周期とは異
なる第２の標本周期でアナログ音声信号に変換すること
を特徴とする音声合成方法。
【請求項４１】前記音声合成手段は、前記選択した音
声素片を接続する際には、当該音声素片を前記第１の標
本周期及び前記第２の標本周期に基づいて定められる度
合いで時間軸方向に伸縮させながら接続することを特徴
とする請求項３９記載の音声合成装置。
【請求項４２】前記選択した音声素片を接続する際に
は、当該音声素片を前記第１の標本周期及び前記第２の
標本周期に基づいて定められる度合いで時間軸方向に伸
縮させながら接続することを特徴とする請求項４０記載
の音声合成方法。
【請求項４３】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し、この選択した音声素片を時間軸方向に伸
縮させながら接続することによって離散音声信号を合成
する音声合成手段と、合成する音声の声質を選択指定するための声質選択手段
と、前記音声合成手段によって合成された離散音声信号を前
記声質選択手段により選択指定された声質に応じて定め
られる第２の標本周期でアナログ音声信号に変換するデ
ィジタル／アナログ変換手段とを具備し、前記音声合成手段は、前記選択した音声素片を前記声質
選択手段により選択指定された声質に応じて定められる
度合いで時間軸方向に伸縮させながら接続するように構
成されていることを特徴とする音声合成装置。
【請求項４４】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し、この選択した音声素片を接続することに
よって離散音声信号を合成し、この合成した離散音声信
号をアナログ音声信号に変換するする音声合成方法にお
いて、合成する音声の声質の選択指定の受け付けを行い、前記選択した音声素片を接続する際には、当該音声素片
を前記受け付けた声質に応じて定められる度合いで時間
軸方向に伸縮させながら接続し、前記合成した離散音声信号をアナログ音声信号に変換す
る際には、前記受け付けた声質に応じて定められる第２
の標本周期でアナログ音声信号に変換することを特徴と
する音声合成方法。
【請求項４５】前記音声合成手段は、前記選択した音
声素片を接続する際には、当該音声素片を時間軸方向に
（第１の標本周期/ 第２の標本周期）倍の大きさで伸縮
させながら接続することを特徴とする請求項３９記載の
音声合成装置。
【請求項４６】前記選択した音声素片を接続する際に
は、当該音声素片を時間軸方向に（第１の標本周期/ 第
２の標本周期）倍の大きさで伸縮させながら接続するこ
とを特徴とする請求項４０記載の音声合成方法。
【請求項４７】第１の標本周期で標本化した離散音声
信号に第１のフレーム周期の時間窓をかけて分析して得
られる音声の特徴パラメータフレームの時系列から所定
の合成単位で切り出した音声素片を複数蓄積する音声素
片蓄積手段と、この音声素片蓄積手段から入力音韻情報に基づいて前記
音声素片を選択し接続して合成パラメータフレームの時
系列を生成する合成パラメータフレーム時系列生成手段
と、この合成パラメータフレーム時系列生成手段により生成
された合成パラメータフレームの時系列から前記第１の
フレーム周期とは異なる第２のフレーム周期で離散音声
信号を合成する合成手段と、この合成手段によって合成された離散音声信号を前記第
１の標本周期とは異なる第２の標本周期でアナログ音声
信号に変換するディジタル／アナログ変換手段とを具備
することを特徴とする音声合成装置。
【請求項４８】第１の標本周期で標本化した離散音声
信号に第１のフレーム周期の時間窓をかけて分析して得
られる音声の特徴パラメータフレームの時系列から所定
の合成単位で切り出した音声素片を音声素片蓄積手段に
複数蓄積しておき、前記音声素片蓄積手段から入力音韻情報に基づいて前記
音声素片を選択し接続して合成パラメータフレームの時
系列を生成し、この生成した合成パラメータフレームの時系列から前記
第１のフレーム周期とは異なる第２のフレーム周期で離
散音声信号を合成し、この合成した離散音声信号を前記第１の標本周期とは異
なる第２の標本周期でアナログ音声信号へ変換すること
を特徴とする音声合成方法。
【請求項４９】第１の標本周期で標本化した離散音声
信号に第１のフレーム周期の時間窓をかけて分析して得
られる音声の特徴パラメータフレームの時系列から所定
の合成単位で切り出した音声素片を複数蓄積する音声素
片蓄積手段と、この音声素片蓄積手段から入力音韻情報に基づいて前記
音声素片を選択し接続して合成パラメータフレームの時
系列を生成する合成パラメータフレーム時系列生成手段
と、この合成パラメータフレーム時系列生成手段により生成
された合成パラメータフレームの時系列から、前記第１
のフレーム周期、前記第１の標本周期及び前記第１の標
本周期とは異なる第２の標本周期に基づいて定められる
第２のフレーム周期で離散音声信号を合成する合成手段
と、この合成手段によって合成された離散音声信号を前記第
２の標本周期でアナログ音声信号に変換するディジタル
／アナログ変換手段とを具備することを特徴とする音声
合成装置。
【請求項５０】第１の標本周期で標本化した離散音声
信号に第１のフレーム周期の時間窓をかけて分析して得
られる音声の特徴パラメータフレームの時系列から所定
の合成単位で切り出した音声素片を音声素片蓄積手段に
複数蓄積しておき、前記音声素片蓄積手段から入力音韻情報に基づいて前記
音声素片を選択し接続して合成パラメータフレームの時
系列を生成し、この生成した合成パラメータフレームの時系列から、前
記第１のフレーム周期、前記第１の標本周期及び前記第
１の標本周期とは異なる第２の標本周期に基づいて定め
られる第２のフレーム周期で離散音声信号を合成し、この合成した離散音声信号を前記第２の標本周期でアナ
ログ音声信号へ変換することを特徴とする音声合成方
法。
【請求項５１】第１の標本周期で標本化した離散音声
信号に第１のフレーム周期の時間窓をかけて分析して得
られる音声の特徴パラメータフレームの時系列から所定
の合成単位で切り出した音声素片を複数蓄積する音声素
片蓄積手段と、合成する音声の声質を選択指定するための声質選択手段
と、前記音声素片蓄積手段から入力音韻情報に基づいて前記
音声素片を選択し接続して合成パラメータフレームの時
系列を生成する合成パラメータフレーム時系列生成手段
と、この合成パラメータフレーム時系列生成手段により生成
された合成パラメータフレームの時系列から、前記声質
選択手段により選択指定された声質に応じて定められる
第２のフレーム周期で離散音声信号を合成する合成手段
と、この合成手段によって合成された離散音声信号を前記声
質選択手段により選択指定された声質に応じて定められ
る第２の標本周期でアナログ音声信号に変換するディジ
タル／アナログ変換手段とを具備することを特徴とする
音声合成装置。
【請求項５２】第１の標本周期で標本化した離散音声
信号に第１のフレーム周期の時間窓をかけて分析して得
られる音声の特徴パラメータフレームの時系列から所定
の合成単位で切り出した音声素片を音声素片蓄積手段に
複数蓄積しておき、前記音声素片蓄積手段から入力音韻
情報に基づいて前記音声素片を選択し接続して合成パラ
メータフレームの時系列を生成し、この生成した合成パ
ラメータフレームの時系列から離散音声信号を合成する
音声合成方法において、合成する音声の声質の選択指定の受け付けを行い、前記合成パラメータフレームの時系列から離散音声信号
を合成する合成処理を、前記受け付けた声質に応じて定
められる第２のフレーム周期で行うと共に、前記合成した離散音声信号を前記受け付けた声質に応じ
て定められる第２の標本周期でアナログ音声信号に変換
することを特徴とする音声合成方法。
【請求項５３】第１の標本周期で標本化した離散音声
信号に第１のフレーム周期の時間窓をかけて分析して得
られる音声の特徴パラメータフレームの時系列から所定
の合成単位で切り出した音声素片を複数蓄積する音声素
片蓄積手段と、この音声素片蓄積手段から入力音韻情報に基づいて前記
音声素片を選択し接続して合成パラメータフレームの時
系列を生成する合成パラメータフレーム時系列生成手段
と、この合成パラメータフレーム時系列生成手段により生成
された合成パラメータフレームの時系列から、前記第１
のフレーム周期、前記第１の標本周期及び前記第１の標
本周期とは異なる第２の標本周期をもとに第２のフレーム周期＝第１のフレーム周期×第１の標本
周期／第２の標本周期で定められる第２のフレーム周期で離散音声信号を合成
する合成手段と、この合成手段によって合成された離散音声信号を前記第
２の標本周期でアナログ音声信号に変換するディジタル
／アナログ変換手段とを具備することを特徴とする音声
合成装置。
【請求項５４】第１の標本周期で標本化した離散音声
信号に第１のフレーム周期の時間窓をかけて分析して得
られる音声の特徴パラメータフレームの時系列から所定
の合成単位で切り出した音声素片を音声素片蓄積手段に
複数蓄積しておき、前記音声素片蓄積手段から入力音韻情報に基づいて前記
音声素片を選択し接続して合成パラメータフレームの時
系列を生成し、この生成した合成パラメータフレームの時系列から、前
記第１のフレーム周期、前記第１の標本周期及び前記第
１の標本周期とは異なる第２の標本周期をもとに第２のフレーム周期＝第１のフレーム周期×第１の標本
周期／第２の標本周期で定められる第２のフレーム周期で離散音声信号を合成
し、この合成した離散音声信号を前記第２の標本周期でアナ
ログ音声信号へ変換することを特徴とする音声合成方
法。
【請求項５５】韻律情報と音韻情報を入力として第１
の標本周期で標本化した離散音声信号から作成した音声
素片を複数蓄積する音声素片蓄積手段と、前記韻律情報から音声の基本周波数パターンを生成する
ピッチパターン生成手段と、前記音韻情報に基づいて前記音声素片蓄積手段から音声
素片を選択的に読み出し接続することによって音声の音
韻パラメータを生成する音韻パラメータ生成手段と、この音韻パラメータ生成手段によって生成された音韻パ
ラメータと前記ピッチパターン生成手段によって生成さ
れた基本周波数パターンから離散音声信号を合成する合
成手段と、この合成手段によって合成された離散音声信号をアナロ
グ音声信号に変換するディジタル／アナログ変換手段で
あって、前記アナログ音声信号への変換を前記第１の標
本周期または前記第１の標本周期とは異なる第２の標本
周期で選択的に行うことが可能なディジタル／アナログ
変換手段とを具備し、前記ピッチパターン生成手段は、前記ディジタル／アナ
ログ変換手段にて前記第２の標本周期でアナログ音声信
号への変換が行われる際には、前記第１の標本周期でア
ナログ音声信号への変換が行われるときとは異なる基本
周波数パターンとなるよう前記基本周波数パターンを生
成するように構成されていることを特徴とする音声合成
装置。
【請求項５６】韻律情報と音韻情報を入力として第１
の標本周期で標本化した離散音声信号から作成した音声
素片を音声素片蓄積手段に複数蓄積しておき、前記韻律
情報から音声の基本周波数パターンを生成すると共に、
前記音韻情報に基づいて前記音声素片蓄積手段から音声
素片を選択的に読み出し接続することによって音声の音
韻パラメータを生成し、この生成した音韻パラメータと
基本周波数パターンから離散音声信号を合成し、この合
成した離散音声信号をアナログ音声信号に変換する音声
合成方法において、前記アナログ音声信号への変換を前記第１の標本周期で
行う第１のモードと前記第１の標本周期とは異なる第２
の標本周期で行う第２のモードとを用意し、前記第２のモード時の合成処理に用いる基本周波数パタ
ーンが、前記第１のモード時の合成処理に用いると基本
周波数パターンとは異なるよう前記基本周波数パターン
を生成するようにしたことを特徴とする音声合成方法。
【請求項５７】韻律情報と音韻情報を入力として第１
の標本周期で標本化した離散音声信号から作成した音声
素片を複数蓄積する音声素片蓄積手段と、前記第１の標本周期及び前記第１の標本周期とは異なる
第２の標本周期に基づいて前記韻律情報から音声の基本
周波数パターンを生成するピッチパターン生成手段と、前記音韻情報に基づいて前記音声素片蓄積手段から音声
素片を選択的に読み出し接続することによって音声の音
韻パラメータを生成する音韻パラメータ生成手段と、この音韻パラメータ生成手段によって生成された音韻パ
ラメータと前記ピッチパターン生成手段によって生成さ
れた基本周波数パターンから離散音声信号を合成する合
成手段と、この合成手段によって合成された離散音声信号を前記第
２の標本周期でアナログ音声信号に変換するディジタル
／アナログ変換手段とを具備することを特徴とする音声
合成装置。
【請求項５８】韻律情報と音韻情報を入力として第１
の標本周期で標本化した離散音声信号から作成した音声
素片を音声素片蓄積手段に複数蓄積しておき、前記第１の標本周期及び前記第１の標本周期とは異なる
第２の標本周期に基づいて前記韻律情報から音声の基本
周波数パターンを生成すると共に、前記音韻情報に基づ
いて前記音声素片蓄積手段から音声素片を選択的に読み
出し接続することによって音声の音韻パラメータを生成
し、この生成した音韻パラメータと基本周波数パターンから
離散音声信号を合成し、この合成した離散音声信号を前記第２の標本周期でアナ
ログ音声信号に変換することを特徴とする音声合成方
法。
【請求項５９】韻律情報と音韻情報を入力として第１
の標本周期で標本化した離散音声信号から作成した音声
素片を複数蓄積する音声素片蓄積手段と、合成する音声の声質を選択指定するための声質選択手段
と、この声質選択手段により選択指定された声質に応じて前
記韻律情報から音声の基本周波数パターンを生成するピ
ッチパターン生成手段と、前記音韻情報に基づいて前記音声素片蓄積手段から音声
素片を選択的に読み出し接続することによって音声の音
韻パラメータを生成する音韻パラメータ生成手段と、この音韻パラメータ生成手段によって生成された音韻パ
ラメータと前記ピッチパターン生成手段によって生成さ
れた基本周波数パターンから離散音声信号を合成する合
成手段と、この合成手段によって合成された離散音声信号を前記声
質選択手段により選択指定された声質に応じて定められ
る第２の標本周期でアナログ音声信号に変換するディジ
タル／アナログ変換手段とを具備することを特徴とする
音声合成装置。
【請求項６０】韻律情報と音韻情報を入力として第１
の標本周期で標本化した離散音声信号から作成した音声
素片を音声素片蓄積手段に複数蓄積しておき、前記韻律
情報から音声の基本周波数パターンを生成すると共に、
前記音韻情報に基づいて前記音声素片蓄積手段から音声
素片を選択的に読み出し接続することによって音声の音
韻パラメータを生成し、この生成した音韻パラメータと
基本周波数パターンから離散音声信号を合成する音声合
成方法において、合成する音声の声質の選択指定の受け付けを行い、合成処理に用いる前記基本周波数パターンを前記受け付
けた声質に応じて前記韻律情報から生成すると共に、前記合成した離散音声信号を前記受け付けた声質に応じ
て定められる第２の標本周期でアナログ音声信号に変換
することを特徴とする音声合成方法。
【請求項６１】前記ピッチパターン生成手段は、前記
ディジタル／アナログ変換手段にて前記第２の標本周期
でアナログ音声信号への変換が行われる際には、前記第
１の標本周期でアナログ音声信号への変換が行われると
きに生成する基本周波数パターンに対して、基本周波数
が（第２の標本周期／第１の標本周期）倍の基本周波数
パターンを生成することを特徴とする請求項５５記載の
音声合成装置。
【請求項６２】前記第２のモード時の合成処理に用い
る基本周波数パターンを、その基本周波数が、前記第１
のモード時の合成処理に用いる基本周波数パターンの基
本周波数の（第２の標本周期／第１の標本周期）倍とな
るよう生成することを特徴とする請求項５６記載の音声
合成方法。
【請求項６３】第１の標本周期で標本化した離散音声
信号を分析して得られる音声の特徴パラメータを蓄積す
る蓄積手段と、この蓄積手段より読み出した音声の特徴パラメータを入
力として離散音声信号を合成する合成手段と、この合成手段によって合成された離散音声信号の標本周
期を前記第１の標本周期とは異なる第２の標本周期に変
換する標本周期変換手段と、この標本周期変換手段により標本周期が変換された離散
音声信号を前記第２の標本周期とは異なる第３の標本周
期でアナログ音声信号に変換するディジタル／アナログ
変換手段とを具備することを特徴とする音声合成装置。
【請求項６４】第１の標本周期で標本化した離散音声
信号を分析して得られる音声の特徴パラメータを蓄積手
段に蓄積しておき、前記蓄積手段より読み出した音声の
特徴パラメータを入力として離散音声信号を合成する音
声合成方法において、前記合成した離散音声信号の標本周期を前記第１の標本
周期とは異なる第２の標本周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第２の標本周期とは異なる第３の標本周期でアナ
ログ音声信号に変換することを特徴とする音声合成方
法。
【請求項６５】第１の標本周期で標本化した離散音声
信号を分析して得られる音声の特徴パラメータを蓄積す
る蓄積手段と、この蓄積手段より読み出した音声の特徴パラメータを入
力として離散音声信号を合成する合成手段と、合成する音声の声質を選択指定するための声質選択手段
と、前記合成手段によって合成された離散音声信号の標本周
期を前記声質選択手段により選択指定された声質に応じ
て定められる第２の標本周期に変換する標本周期変換手
段と、この標本周期変換手段によって標本周期が変換された離
散音声信号を前記第２の標本周期とは異なる（但し、第
２の標本周期が第１の標本周期に一致する場合を除く）
第３の標本周期でアナログ音声信号に変換するディジタ
ル／アナログ変換手段とを具備することを特徴とする音
声合成装置。
【請求項６６】第１の標本周期で標本化した離散音声
信号を分析して得られる音声の特徴パラメータを蓄積手
段に蓄積しておき、前記蓄積手段より読み出した音声の
特徴パラメータを入力として離散音声信号を合成する音
声合成方法において、合成する音声の声質の選択指定の受け付けを行い、前記合成した離散音声信号の標本周期を前記受け付けた
声質に応じて定められる第２の標本周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第２の標本周期とは異なる（但し、第２の標本周
期が第１の標本周期に一致する場合を除く）第３の標本
周期でアナログ音声信号に変換することを特徴とする音
声合成方法。
【請求項６７】第１の標本周期で標本化した離散音声
信号に第１のフレーム周期で時間窓をかけて分析して得
られる音声の特徴パラメータフレームの時系列から、前
記第１のフレーム周期とは異なる第２のフレーム周期で
離散音声信号を合成する合成手段と、この合成手段によって合成された離散音声信号の標本周
期を前記第１の標本周期とは異なる第２の標本周期に変
換する標本周期変換手段と、この標本周期変換手段によって標本周期が変換された離
散音声信号を前記第２の標本周期とは異なる第３の標本
周期でアナログ音声信号に変換するディジタル／アナロ
グ変換手段とを具備することを特徴とする音声合成装
置。
【請求項６８】第１の標本周期で標本化した離散音声
信号に第１のフレーム周期で時間窓をかけて分析して得
られる音声の特徴パラメータフレームの時系列から、前
記第１のフレーム周期とは異なる第２のフレーム周期で
離散音声信号を合成し、この第２のフレーム周期で合成した離散音声信号の標本
周期を前記第１の標本周期とは異なる第２の標本周期に
変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第２の標本周期とは異なる第３の標本周期でアナ
ログ音声信号に変換することを特徴とする音声合成方
法。
【請求項６９】第１の標本周期で標本化した離散音声
信号に第１のフレーム周期で時間窓をかけて分析して得
られる音声の特徴パラメータフレームの時系列から、前
記第１のフレーム周期、前記第１の標本周期とは異なる
第２の標本周期及び前記第２の標本周期とは異なる第３
の標本周期に基づいて定められる第２のフレーム周期で
離散音声信号を合成する合成手段と、この合成手段によって合成された離散音声信号の標本周
期を前記第２の標本周期に変換する標本周期変換手段
と、この標本周期変換手段によって標本周期が変換された離
散音声信号を前記第３の標本周期でアナログ音声信号に
変換するディジタル／アナログ変換手段とを具備するこ
とを特徴とする音声合成装置。
【請求項７０】第１の標本周期で標本化した離散音声
信号に第１のフレーム周期で時間窓をかけて分析して得
られる音声の特徴パラメータフレームの時系列から、前
記第１のフレーム周期、前記第１の標本周期とは異なる
第２の標本周期及び前記第２の標本周期とは異なる第３
の標本周期に基づいて定められる第２のフレーム周期で
離散音声信号を合成し、この第２のフレーム周期で合成した離散音声信号の標本
周期を前記第２の標本周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第３の標本周期でアナログ音声信号に変換するこ
とを特徴とする音声合成方法。
【請求項７１】第１の標本周期で標本化した離散音声信
号に第１のフレーム周期で時間窓をかけて分析して得ら
れる音声の特徴パラメータフレームの時系列を蓄積する
蓄積手段と、合成する音声の声質を選択指定するための声質選択手段
と、前記蓄積手段より読み出した特徴パラメータフレームの
時系列から、前記声質選択手段により選択指定された声
質に応じて定められる第２のフレーム周期で離散音声信
号を合成する合成手段と、この合成手段によって合成された離散音声信号の標本周
期を前記声質選択手段により選択指定された声質に応じ
て定められる第２の標本周期に変換する標本周期変換手
段と、この標本周期変換手段によって標本周期が変換された離
散音声信号を前記第２の標本周期とは異なる（但し、第
２の標本周期が第１の標本周期に一致する場合を除く）
第３の標本周期でアナログ音声信号に変換するディジタ
ル／アナログ変換手段とを具備することを特徴とする音
声合成装置。
【請求項７２】第１の標本周期で標本化した離散音声
信号に第１のフレーム周期で時間窓をかけて分析して得
られる音声の特徴パラメータフレームの時系列を蓄積手
段に蓄積しておき、前記蓄積手段より読み出した特徴パ
ラメータフレームの時系列から離散音声信号を合成する
音声合成方法において、合成する音声の声質の選択指定を受け付け、前記特徴パラメータフレームの時系列からの離散音声信
号の合成処理を、前記受け付けた声質に応じて定められ
る第２のフレーム周期で行い、この第２のフレーム周期で合成した離散音声信号の標本
周期を前記受け付けた声質に応じて定められる第２の標
本周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第２の標本周期とは異なる（但し、第２の標本周
期が第１の標本周期に一致する場合を除く）第３の標本
周期でアナログ音声信号に変換することを特徴とする音
声合成方法。
【請求項７３】第１の標本周期で標本化した離散音声
信号に第１のフレーム周期で時間窓をかけて分析して得
られる音声の特徴パラメータフレームの時系列から、前
記第１のフレーム周期、前記第１の標本周期とは異なる
第２の標本周期及び前記第２の標本周期とは異なる第３
の標本周期をもとに第２のフレーム周期＝第１のフレーム周期×第２の標本
周期／第３の標本周期で定められる第２のフレーム周期で離散音声信号を合成
する合成手段と、この合成手段によって合成された離散音声信号の標本周
期を前記第２の標本周期に変換する標本周期変換手段
と、この標本周期変換手段によって標本周期が変換された離
散音声信号を前記第３の標本周期でアナログ音声信号に
変換するディジタル／アナログ変換手段とを具備するこ
とを特徴とする音声合成装置。
【請求項７４】第１の標本周期で標本化した離散音声
信号に第１のフレーム周期で時間窓をかけて分析して得
られる音声の特徴パラメータフレームの時系列から、前
記第１のフレーム周期、前記第１の標本周期とは異なる
第２の標本周期及び前記第２の標本周期とは異なる第３
の標本周期をもとに第２のフレーム周期＝第１のフレーム周期×第２の標本
周期／第３の標本周期で定められる第２のフレーム周期で離散音声信号を合成
し、この第２のフレーム周期で合成した離散音声信号の標本
周期を前記第２の標本周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第３の標本周期でアナログ音声信号に変換するこ
とを特徴とする音声合成方法。
【請求項７５】第１の標本周期で標本化した離散音声
信号を分析して得られる音声の特徴パラメータを蓄積す
る特徴パラメータ蓄積手段と、音声の基本周波数パターンを蓄積するピッチパターン蓄
積手段と、前記特徴パラメータ蓄積手段から読み出した特徴パラメ
ータと前記ピッチパターン蓄積手段から読み出した基本
周波数パターンとから離散音声信号を合成する合成手段
と、この合成手段によって合成された離散音声信号の標本周
期を変換するための標本周期変換手段であって、前記第
１の標本周期または前記第１の標本周期とは異なる第２
の標本周期への変換を選択的に行うことが可能な標本周
期変換手段と、この標本周期変換手段により標本周期が変換された離散
音声信号を前記第２の標本周期とは異なる第３の標本周
期でアナログ音声信号に変換するディジタル／アナログ
変換手段と、前記標本周期変換手段にて前記第２の標本周期への標本
周期変換が行われる際には、前記ピッチパターン蓄積手
段から読み出した基本周波数パターンとは異なる基本周
波数パターンを生成して前記合成手段に与えるピッチパ
ターン生成手段とを具備することを特徴とする音声合成
装置。
【請求項７６】第１の標本周期で標本化した離散音声
信号を分析して得られる音声の特徴パラメータを特徴パ
ラメータ蓄積手段に蓄積しておくと共に、音声の基本周
波数パターンをピッチパターン蓄積手段に蓄積してお
き、前記特徴パラメータ蓄積手段から読み出した特徴パ
ラメータと前記ピッチパターン蓄積手段から読み出した
基本周波数パターンとから離散音声信号を合成する音声
合成方法において、前記合成した離散音声信号の標本周期を前記第１の標本
周期のままとする第１のモードと前記第１の標本周期と
は異なる第２の標本周期とする第２のモードとを用意
し、前記第２のモード時には、前記ピッチパターン蓄積手段から読み出した基本周波数
パターンとは異なる基本周波数パターンを生成して前記
離散音声信号の合成に用い、この合成した離散音声信号の標本周期を前記第２の標本
周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第２の標本周期とは異なる第３の標本周期でアア
ナログ音声信号に変換することを特徴とする音声合成方
法。
【請求項７７】第１の標本周期で標本化した離散音声
信号を分析して得られる音声の特徴パラメータを蓄積す
る特徴パラメータ蓄積手段と、音声の基本周波数パターンを蓄積するピッチパターン蓄
積手段と、前記ピッチパターン蓄積手段から読み出した基本周波数
パターンを前記第１の標本周期とは異なる第２の標本周
期及び前記第２の標本周期とは異なる第３の標本周期に
基づいて変調するピッチパターン変調手段と、前記特徴パラメータ蓄積手段から読み出した特徴パラメ
ータと前記ピッチパターン変調手段にて変調された基本
周波数パターンとから離散音声信号を合成する合成手段
と、この合成手段によって合成された離散音声信号の標本周
期を前記第２の標本周期に変換する標本周期変換手段
と、この標本周期変換手段によって標本周期が変換された離
散音声信号を前記第３の標本周期でアナログ音声信号に
変換するディジタル／アナログ変換手段とを具備するこ
とを特徴とする音声合成装置。
【請求項７８】第１の標本周期で標本化した離散音声
信号を分析して得られる音声の特徴パラメータを特徴パ
ラメータ蓄積手段に蓄積しておくと共に、音声の基本周
波数パターンをピッチパターン蓄積手段に蓄積してお
き、前記ピッチパターン蓄積手段から読み出した基本周波数
パターンを第１の標本周期とは異なる第２の標本周期及
び前記第２の標本周期とは異なる第３の標本周期に基づ
いて変調し、前記特徴パラメータ蓄積手段から読み出した特徴パラメ
ータと前記ピッチ変調した基本周波数パターンとから離
散音声信号を合成し、この合成した離散音声信号の標本周期を前記第２の標本
周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第３の標本周期でアナログ音声信号に変換するこ
とを特徴とする音声合成方法。
【請求項７９】第１の標本周期で標本化した離散音声
信号を分析して得られる音声の特徴パラメータを蓄積す
る特徴パラメータ蓄積手段と、音声の基本周波数パターンを蓄積するピッチパターン蓄
積手段と、合成する音声の声質を選択指定するための声質選択手段
と、前記ピッチパターン蓄積手段から読み出した基本周波数
パターンを対象に、前記声質選択手段により選択指定さ
れた声質に応じた変調を行うピッチパターン変調手段
と、前記特徴パラメータ蓄積手段から読み出した特徴パラメ
ータと前記ピッチパターン変調手段にて変調された基本
周波数パターンとから離散音声信号を合成する合成手段
と、この合成手段によって合成された離散音声信号の標本周
期を前記声質選択手段により選択指定された声質に応じ
て定められる第２の標本周期に変換する標本周期変換手
段と、この標本周期変換手段によって標本周期が変換された離
散音声信号を前記第２の標本周期とは異なる（但し、第
２の標本周期が第１の標本周期に一致する場合を除く）
第３の標本周期でアナログ音声信号に変換するディジタ
ル／アナログ変換手段とを具備することを特徴とする音
声合成装置。
【請求項８０】第１の標本周期で標本化した離散音声
信号を分析して得られる音声の特徴パラメータを特徴パ
ラメータ蓄積手段に蓄積しておくと共に、音声の基本周
波数パターンをピッチパターン蓄積手段に蓄積してお
き、前記特徴パラメータ蓄積手段から読み出した特徴パ
ラメータと前記ピッチパターン蓄積手段から読み出した
基本周波数パターンとに基づく離散音声信号の合成を行
う音声合成方法において、合成する音声の声質の選択指定を受け付け、前記ピッチパターン蓄積手段から読み出した基本周波数
パターンを対象に、前記受け付けた声質に応じた変調を
行い、前記特徴パラメータ蓄積手段から読み出した特徴パラメ
ータと前記変調された基本周波数パターンとから離散音
声信号を合成し、この合成した離散音声信号の標本周期を前記受け付けた
声質に応じて定められる第２の標本周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第２の標本周期とは異なる（但し、第２の標本周
期が第１の標本周期に一致する場合を除く）第３の標本
周期でアナログ音声信号に変換することを特徴とする音
声合成方法。
【請求項８１】第１の標本周期で標本化した離散音声
信号を分析して得られる音声の特徴パラメータを蓄積す
る特徴パラメータ蓄積手段と、音声の基本周波数パターンを蓄積するピッチパターン蓄
積手段と、前記ピッチパターン蓄積手段から読み出した基本周波数
パターンを、前記第１の標本周期とは異なる第２の標本
周期及び前記第２の標本周期とは異なる第３の標本周期
をもとに（第３の標本周期／第２の標本周期）倍に変調
するピッチパターン変調手段と、前記特徴パラメータ蓄積手段から読み出した特徴パラメ
ータと前記ピッチパターン変調手段にて変調された基本
周波数パターンとから離散音声信号を合成する合成手段
と、この合成手段によって合成された離散音声信号の標本周
期を前記第２の標本周期に変換する標本周期変換手段
と、この標本周期変換手段によって標本周期が変換された離
散音声信号を前記第３の標本周期でアナログ音声信号に
変換するディジタル／アナログ変換手段とを具備するこ
とを特徴とする音声合成装置。
【請求項８２】第１の標本周期で標本化した離散音声
信号を分析して得られる音声の特徴パラメータを特徴パ
ラメータ蓄積手段に蓄積しておくと共に、音声の基本周
波数パターンをピッチパターン蓄積手段に蓄積してお
き、前記ピッチパターン蓄積手段から読み出した基本周波数
パターンを、前記第１の標本周期とは異なる第２の標本
周期及び前記第２の標本周期とは異なる第３の標本周期
をもとに（第３の標本周期／第２の標本周期）倍に変調
し、前記特徴パラメータ蓄積手段から読み出した特徴パラメ
ータと前記変調された基本周波数パターンとから離散音
声信号を合成し、この合成した離散音声信号の標本周期を前記第２の標本
周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第３の標本周期でアナログ音声信号に変換するこ
とを特徴とする音声合成方法。
【請求項８３】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し接続することによって離散音声信号を合成
し、この合成した離散音声信号の標本周期を前記第１の
標本周期とは異なる第２の標本周期に変換する音声合成
手段と、この音声合成手段によって合成され且つ標本周期が変換
された離散音声信号を前記第２の標本周期とは異なる第
３の標本周期でアナログ音声信号に変換するディジタル
／アナログ変換手段とを具備することを特徴とする音声
合成装置。
【請求項８４】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し接続することによって離散音声信号を合成
し、この合成した離散音声信号の標本周期を前記第１の標本
周期とは異なる第２の標本周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第２の標本周期とは異なる第３の標本周期でアナ
ログ音声信号に変換することを特徴とする音声合成方
法。
【請求項８５】合成する音声の声質を選択指定するた
めの声質選択手段と、第１の標本周期で標本化した離散音声信号から作成した
音声素片を、与えられた音韻情報に基づいて選択し接続
することによって離散音声信号を合成する音声合成手段
であって、前記合成した離散音声信号の標本周期を前記
声質選択手段により選択指定された声質に応じて定めら
れる第２の標本周期に変換する音声合成手段と、この音声合成手段から出力される離散音声信号を前記第
２の標本周期とは異なる（但し、第２の標本周期が第１
の標本周期に一致する場合を除く）第３の標本周期でア
ナログ音声信号に変換するディジタル／アナログ変換手
段とを具備することを特徴とする音声合成装置。
【請求項８６】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し接続することによって離散音声信号を合成
する音声合成方法において、合成する音声の声質の選択指定の受け付けを行い、前記合成した離散音声信号の標本周期を前記受け付けた
声質に応じて定められる第２の標本周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第２の標本周期とは異なる（但し、第２の標本周
期が第１の標本周期に一致する場合を除く）第３の標本
周期でアナログ音声信号に変換することを特徴とする音
声合成方法。
【請求項８７】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し、この選択した音声素片を、合成される音
声の発話速度または発話時間に関係する発話速度パラメ
ータに応じて接続することによって離散音声信号を合成
する音声合成手段であって、前記合成した離散音声信号
の標本周期を前記第１の標本周期とは異なる第２の標本
周期に変換することが可能な音声合成手段と、この音声合成手段から出力される離散音声信号を前記第
２の標本周期とは異なる第３の標本周期でアナログ音声
信号に変換するディジタル／アナログ変換手段とを具備
し、前記音声合成手段は、前記第２の標本周期への標本周期
変換を行う際の合成処理には、標本周期の変換を行わな
いときとは異なる値の前記発話速度パラメータを用いる
ように構成されていることを特徴とする音声合成装置。
【請求項８８】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し、この選択した音声素片を、合成される音
声の発話速度または発話時間に関係する発話速度パラメ
ータに応じて接続することによって離散音声信号を合成
する音声合成方法において、前記合成した離散音声信号の標本周期を前記第１の標本
周期のままとする第１のモードと前記第１の標本周期と
は異なる第２の標本周期とする第２のモードとを用意
し、前記第２のモード時には、前記第１のモード時とは異なる値の前記発話速度パラメ
ータを用いて前記離散音声信号を合成して、この合成し
た離散音声信号の標本周期を前記第２の標本周期に変換
し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第２の標本周期とは異なる第３の標本周期でアナ
ログ音声信号に変換することを特徴とする音声合成方
法。
【請求項８９】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し、この選択した音声素片を、合成される音
声の発話速度または発話時間に関係する発話速度パラメ
ータに応じて接続することによって離散音声信号を合成
する音声合成手段であって、前記合成した離散音声信号
の標本周期を前記第１の標本周期とは異なる第２の標本
周期に変換することが可能な音声合成手段と、この音声合成手段から出力される離散音声信号を前記第
２の標本周期とは異なる第３の標本周期でアナログ音声
信号に変換するディジタル／アナログ変換手段とを具備
し、前記音声合成手段は、使用する前記発話速度パラメータ
を前記第２の標本周期及び前記第３の標本周期に基づい
て決定するように構成されていることを特徴とする音声
合成装置。
【請求項９０】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し、この選択した音声素片を、合成される音
声の発話速度または発話時間に関係する発話速度パラメ
ータに応じて接続することによって離散音声信号を合成
する音声合成方法において、前記合成した離散音声信号の標本周期を前記第１の標本
周期のままとする第１のモードと前記第１の標本周期と
は異なる第２の標本周期とする第２のモードとを用意
し、前記第２のモード時には、使用する前記発話速度パラメータを前記第２の標本周期
及び前記第２の標本周期とは異なる第３の標本周期に基
づいて決定して前記離散音声信号を合成した後、この合
成した離散音声信号の標本周期を前記第２の標本周期に
変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第３の標本周期でアナログ音声信号に変換するこ
とを特徴とする音声合成方法。
【請求項９１】合成する音声の声質を選択指定するた
めの声質選択手段と、第１の標本周期で標本化した離散音声信号から作成した
音声素片を、与えられた音韻情報に基づいて選択し、こ
の選択した音声素片を、合成される音声の発話速度また
は発話時間に関係する発話速度パラメータに応じて接続
することによって離散音声信号を合成する音声合成手段
であって、前記合成した離散音声信号の標本周期を前記
声質選択手段により選択指定された声質に応じて定めら
れる第２の標本周期に変換する音声合成手段と、前記音声合成手段から出力される離散音声信号を前記第
２の標本周期とは異なる（但し、第２の標本周期が第１
の標本周期に一致する場合を除く）第３の標本周期でア
ナログ音声信号に変換するディジタル／アナログ変換手
段とを具備し、前記音声合成手段は、使用する前記発話速度パラメータ
を前記声質選択手段により選択指定された声質に応じて
決定するように構成されていることを特徴とする音声合
成装置。
【請求項９２】第１の標本周期で標本化した離散音声
信号から作成した音声素片を、与えられた音韻情報に基
づいて選択し、この選択した音声素片を、合成される音
声の発話速度または発話時間に関係する発話速度パラメ
ータに応じて接続することによって離散音声信号を合成
する音声合成方法において、合成する音声の声質の選択指定の受け付けを行い、使用する前記発話速度パラメータを前記受け付けた声質
に応じて決定して前記離散音声信号を合成した後、この
合成した離散音声信号の標本周期を前記受け付けた声質
に応じて定められる第２の標本周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第２の標本周期とは異なる（但し、第２の標本周
期が第１の標本周期に一致する場合を除く）第３の標本
周期でアナログ音声信号に変換することを特徴とする音
声合成方法。
【請求項９３】与えられた音韻情報に含まれる各音韻
の継続時間を決定する一方、第１の標本周期で標本化し
た離散音声信号から作成した音声素片を前記音韻情報に
基づいて選択し、前記決定した各音韻の継続時間に基づ
いて前記選択した音声素片を接続することによって離散
音声信号を合成する音声合成手段であって、前記合成し
た離散音声信号の標本周期を前記第１の標本周期とは異
なる第２の標本周期に変換することが可能な音声合成手
段と、この音声合成手段から出力される離散音声信号を前記第
２の標本周期とは異なる第３の標本周期でアナログ音声
信号に変換するディジタル／アナログ変換手段とを具備
し、前記音声合成手段は、前記第２の標本周期への標本周期
変換を行う際の合成処理では、標本周期変換を行わない
ときとは異なる音韻継続時間となるよう前記音韻継続時
間の決定を行うように構成されていることを特徴とする
音声合成装置。
【請求項９４】与えられた音韻情報に含まれる各音韻
の継続時間を決定する一方、第１の標本周期で標本化し
た離散音声信号から作成した音声素片を前記音韻情報に
基づいて選択し、前記決定した各音韻の継続時間に基づ
いて前記選択した音声素片を接続することによって離散
音声信号を合成する音声合成方法において、前記合成した離散音声信号の標本周期を前記第１の標本
周期のままとする第１のモードと前記第１の標本周期と
は異なる第２の標本周期とする第２のモードとを用意
し、前記第２のモード時には、前記第１のモード時とは異なる音韻継続時間となるよう
前記音韻継続時間の決定を行って前記離散音声信号の合
成に用い、前記合成した離散音声信号の標本周期を前記第２の標本
周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第２の標本周期とは異なる第３の標本周期でアナ
ログ音声信号に変換することを特徴とする音声合成方
法。
【請求項９５】与えられた音韻情報に含まれる各音韻
の継続時間を決定する一方、第１の標本周期で標本化し
た離散音声信号から作成した音声素片を前記音韻情報に
基づいて選択し、前記決定した各音韻の継続時間に基づ
いて前記選択した音声素片を接続することによって離散
音声信号を合成する音声合成手段であって、前記合成し
た離散音声信号の標本周期を前記第１の標本周期とは異
なる第２の標本周期に変換することが可能な音声合成手
段と、この音声合成手段から出力される離散音声信号を前記第
２の標本周期とは異なる第３の標本周期でアナログ音声
信号に変換するディジタル／アナログ変換手段とを具備
し、上記音声合成手段は、合成時に使用する前記音韻継続時
間を前記第２の標本周期及び前記第３の標本周期に基づ
いて決定するように構成されていることを特徴とする音
声合成装置。
【請求項９６】与えられた音韻情報に含まれる各音韻
の継続時間を決定する一方、第１の標本周期で標本化し
た離散音声信号から作成した音声素片を前記音韻情報に
基づいて選択し、前記決定した各音韻の継続時間に基づ
いて前記選択した音声素片を接続することによって離散
音声信号を合成する音声合成方法において、合成時に使用する前記音韻継続時間を前記第１の標本周
期とは異なる第２の標本周期及び前記第２の標本周期と
は異なる第３の標本周期に基づいて決定すると共に、前記合成した離散音声信号の標本周期を前記第２の標本
周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第３の標本周期でアナログ音声信号に変換するこ
とを特徴とする音声合成方法。
【請求項９７】合成する音声の声質を選択指定するた
めの声質選択手段と、与えられた音韻情報に含まれる各音韻の継続時間を決定
する一方、第１の標本周期で標本化した離散音声信号か
ら作成した音声素片を前記音韻情報に基づいて選択し、
前記決定した各音韻の継続時間に基づいて前記選択した
音声素片を接続することによって離散音声信号を合成す
る音声合成手段であって、前記合成した離散音声信号の
標本周期を前記声質選択手段により選択指定された声質
に応じて定められる第２の標本周期に変換する音声合成
手段と、この音声合成手段から出力される離散音声信号を前記第
２の標本周期とは異なる（但し、第２の標本周期が第１
の標本周期に一致する場合を除く）第３の標本周期でア
ナログ音声信号に変換するディジタル／アナログ変換手
段とを具備し、前記音声合成手段は、合成時に使用する前記音韻継続時
間を前記声質選択手段により選択指定された声質に応じ
て決定するように構成されていることを特徴とする音声
合成装置。
【請求項９８】与えられた音韻情報に含まれる各音韻
の継続時間を決定する一方、第１の標本周期で標本化し
た離散音声信号から作成した音声素片を前記音韻情報に
基づいて選択し、前記決定した各音韻の継続時間に基づ
いて前記選択した音声素片を接続することによって離散
音声信号を合成する音声合成方法において、合成する音声の声質の選択指定の受け付けを行い、使用する前記音韻継続時間を前記受け付けた声質に応じ
て決定して前記離散音声信号を合成した後、この合成し
た離散音声信号の標本周期を前記受け付けた声質に応じ
て定められる第２の標本周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第２の標本周期とは異なる（但し、第２の標本周
期が第１の標本周期に一致する場合を除く）第３の標本
周期でアナログ音声信号に変換することを特徴とする音
声合成方法。
【請求項９９】与えられた音韻情報に含まれる各音韻
の継続時間を決定する一方、第１の標本周期で標本化し
た離散音声信号から作成した音声素片を前記音韻情報に
基づいて選択し、前記決定した各音韻の継続時間に基づ
いて前記選択した音声素片を接続することによって離散
音声信号を合成する音声合成手段であって、前記合成し
た離散音声信号の標本周期を前記第１の標本周期とは異
なる第２の標本周期に変換することが可能な音声合成手
段と、この音声合成手段から出力される離散音声信号を前記第
２の標本周期とは異なる第３の標本周期でアナログ音声
信号に変換するディジタル／アナログ変換手段とを具備
し、前記音声合成手段は、前記第２の標本周期への標本周期
変換を行う際の合成処理には、標本周期の変換を行わな
いときに決定される音韻継続時間の（第２の標本周期／
第３の標本周期）倍の音韻継続時間を用いるように構成
されていることを特徴とする音声合成装置。
【請求項１００】与えられた音韻情報に含まれる各音
韻の継続時間を決定する一方、第１の標本周期で標本化
した離散音声信号から作成した音声素片を前記音韻情報
に基づいて選択し、前記決定した各音韻の継続時間に基
づいて前記選択した音声素片を接続することによって離
散音声信号を合成する音声合成方法において、前記合成した離散音声信号の標本周期を前記第１の標本
周期のままとする第１のモードと前記第１の標本周期と
は異なる第２の標本周期とする第２のモードとを用意
し、前記第２のモード時には、前記第２の標本周期及び前記第２の標本周期とは異なる
第３の標本周期を用い、前記第１のモード時に決定され
る音韻継続時間の（第２の標本周期／第３の標本周期）
倍となるよう前記音韻継続時間の決定を行って前記離散
音声信号の合成に用い、前記合成した離散音声信号の標本周期を前記第２の標本
周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第３の標本周期でアナログ音声信号に変換するこ
とを特徴とする音声合成方法。
【請求項１０１】第１の標本周期で標本化した離散音
声信号から作成した音声素片を、与えられた音韻情報に
基づいて選択し、この選択した音声素片を時間軸方向に
伸縮させながら接続することによって離散音声信号を合
成する音声合成手段であって、前記合成した離散音声信
号の標本周期を前記第１の標本周期とは異なる第２の標
本周期に変換することが可能な音声合成手段と、この音声合成手段から出力される離散音声信号を前記第
２の標本周期とは異なる第３の標本周期でアナログ音声
信号に変換するディジタル／アナログ変換手段とを具備
することを特徴とする音声合成装置。
【請求項１０２】第１の標本周期で標本化した離散音
声信号から作成した音声素片を、与えられた音韻情報に
基づいて選択し、この選択した音声素片を時間軸方向に
伸縮させながら接続することによって離散音声信号を合
成し、この合成した離散音声信号の標本周期を前記第１の標本
周期とは異なる第２の標本周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第２の標本周期とは異なる第３の標本周期でアナ
ログ音声信号に変換することを特徴とする音声合成方
法。
【請求項１０３】前記音声合成手段は、前記選択した
音声素片を接続する際には、当該音声素片を前記第２の
標本周期及び前記第３の標本周期に基づいて定められる
度合いで時間軸方向に伸縮させながら接続することを特
徴とする請求項１０１記載の音声合成装置。
【請求項１０４】前記選択した音声素片を接続する際
には、当該音声素片を前記第２の標本周期及び前記第３
の標本周期に基づいて定められる度合いで時間軸方向に
伸縮させながら接続することを特徴とする請求項１０２
記載の音声合成方法。
【請求項１０５】合成する音声の声質を選択指定する
ための声質選択手段と、第１の標本周期で標本化した離散音声信号から作成した
音声素片を、与えられた音韻情報に基づいて選択し、こ
の選択した音声素片を前記声質選択手段により選択指定
された声質に応じて定められる度合いで時間軸方向に伸
縮させながら接続することによって離散音声信号を合成
する音声合成手段であって、前記合成した離散音声信号
の標本周期を前記声質選択手段により選択指定された声
質に応じて定められる第２の標本周期に変換する音声合
成手段と、この音声合成手段から出力される離散音声信号を前記第
２の標本周期とは異なる（但し、第２の標本周期が第１
の標本周期に一致する場合を除く）第３の標本周期でア
ナログ音声信号に変換するディジタル／アナログ変換手
段とを具備することを特徴とする音声合成装置。
【請求項１０６】第１の標本周期で標本化した離散音
声信号から作成した音声素片を、与えられた音韻情報に
基づいて選択し、この選択した音声素片を接続すること
によって離散音声信号を合成し、この合成した離散音声
信号をアナログ音声信号に変換するする音声合成方法に
おいて、合成する音声の声質の選択指定の受け付けを行い、前記選択した音声素片を接続する際には、当該音声素片
を前記受け付けた声質に応じて定められる度合いで時間
軸方向に伸縮させながら接続し、前記離散音声信号を合成した際には、当該離散音声信号
の標本周期を前記受け付けた声質に応じて定められる第
２の標本周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第２の標本周期とは異なる（但し、第２の標本周
期が第１の標本周期に一致する場合を除く）第３の標本
周期でアナログ音声信号に変換することを特徴とする音
声合成方法。
【請求項１０７】前記音声合成手段は、前記選択した
音声素片を接続する際には、当該音声素片を時間軸方向
に（第２の標本周期/ 第３の標本周期）倍の大きさで伸
縮させながら接続することを特徴とする請求項１０３記
載の音声合成装置。
【請求項１０８】前記選択した音声素片を接続する際
には、当該音声素片を時間軸方向に（第２の標本周期/
第３の標本周期）倍の大きさで伸縮させながら接続する
ことを特徴とする請求項１０４記載の音声合成方法。
【請求項１０９】第１の標本周期で標本化した離散音
声信号に第１のフレーム周期の時間窓をかけて分析して
得られる音声の特徴パラメータフレームの時系列から所
定の合成単位で切り出した音声素片を複数蓄積する音声
素片蓄積手段と、この音声素片蓄積手段から入力音韻情報に基づいて前記
音声素片を選択し接続して合成パラメータフレームの時
系列を生成する合成パラメータフレーム時系列生成手段
と、この合成パラメータフレーム時系列生成手段により生成
された合成パラメータフレームの時系列から前記第１の
フレーム周期とは異なる第２のフレーム周期で離散音声
信号を合成する合成手段と、この合成手段によって合成された離散音声信号の標本周
期を前記第１の標本周期とは異なる第２の標本周期に変
換する標本周期変換手段と、この標本周期変換手段によって標本周期が変換された離
散音声信号を前記第２の標本周期とは異なる第３の標本
周期でアナログ音声信号に変換するディジタル／アナロ
グ変換手段とを具備することを特徴とする音声合成装
置。
【請求項１１０】第１の標本周期で標本化した離散音
声信号に第１のフレーム周期の時間窓をかけて分析して
得られる音声の特徴パラメータフレームの時系列から所
定の合成単位で切り出した音声素片を音声素片蓄積手段
に複数蓄積しておき、前記音声素片蓄積手段から入力音韻情報に基づいて前記
音声素片を選択し接続して合成パラメータフレームの時
系列を生成し、この生成した合成パラメータフレームの時系列から前記
第１のフレーム周期とは異なる第２のフレーム周期で離
散音声信号を合成し、この第２のフレーム周期で合成した離散音声信号の標本
周期を前記第１の標本周期とは異なる第２の標本周期に
変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第２の標本周期とは異なる第３の標本周期でアナ
ログ音声信号に変換することを特徴とする音声合成方
法。
【請求項１１１】第１の標本周期で標本化した離散音
声信号に第１のフレーム周期の時間窓をかけて分析して
得られる音声の特徴パラメータフレームの時系列から所
定の合成単位で切り出した音声素片を複数蓄積する音声
素片蓄積手段と、この音声素片蓄積手段から入力音韻情報に基づいて前記
音声素片を選択し接続して合成パラメータフレームの時
系列を生成する合成パラメータフレーム時系列生成手段
と、この合成パラメータフレーム時系列生成手段により生成
された合成パラメータフレームの時系列から、前記第１
のフレーム周期、前記第１の標本周期とは異なる第２の
標本周期及び前記第２の標本周期とは異なる第３の標本
周期に基づいて定められる第２のフレーム周期で離散音
声信号を合成する合成手段と、この合成手段によって合成された離散音声信号の標本周
期を前記第２の標本周期に変換する標本周期変換手段
と、この標本周期変換手段によって標本周期が変換された離
散音声信号を前記第３の標本周期でアナログ音声信号に
変換するディジタル／アナログ変換手段とを具備するこ
とを特徴とする音声合成装置。
【請求項１１２】第１の標本周期で標本化した離散音
声信号に第１のフレーム周期の時間窓をかけて分析して
得られる音声の特徴パラメータフレームの時系列から所
定の合成単位で切り出した音声素片を音声素片蓄積手段
に複数蓄積しておき、前記音声素片蓄積手段から入力音韻情報に基づいて前記
音声素片を選択し接続して合成パラメータフレームの時
系列を生成し、この生成した合成パラメータフレームの時系列から、前
記第１のフレーム周期、前記第１の標本周期とは異なる
第２の標本周期及び前記第２の標本周期とは異なる第３
の標本周期に基づいて定められる第２のフレーム周期で
離散音声信号を合成し、この第２のフレーム周期で合成した離散音声信号の標本
周期を前記第２の標本周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第３の標本周期でアナログ音声信号に変換するこ
とを特徴とする音声合成方法。
【請求項１１３】第１の標本周期で標本化した離散音
声信号に第１のフレーム周期の時間窓をかけて分析して
得られる音声の特徴パラメータフレームの時系列から所
定の合成単位で切り出した音声素片を複数蓄積する音声
素片蓄積手段と、合成する音声の声質を選択指定するための声質選択手段
と、前記音声素片蓄積手段から入力音韻情報に基づいて前記
音声素片を選択し接続して合成パラメータフレームの時
系列を生成する合成パラメータフレーム時系列生成手段
と、この合成パラメータフレーム時系列生成手段により生成
された合成パラメータフレームの時系列から、前記声質
選択手段により選択指定された声質に応じて定められる
第２のフレーム周期で離散音声信号を合成する合成手段
と、この合成手段によって合成された離散音声信号の標本周
期を前記声質選択手段により選択指定された声質に応じ
て定められる第２の標本周期に変換する標本周期変換手
段と、この標本周期変換手段によって標本周期が変換された離
散音声信号を前記第２の標本周期とは異なる（但し、第
２の標本周期が第１の標本周期に一致する場合を除く）
第３の標本周期でアナログ音声信号に変換するディジタ
ル／アナログ変換手段とを具備することを特徴とする音
声合成装置。
【請求項１１４】第１の標本周期で標本化した離散音
声信号に第１のフレーム周期の時間窓をかけて分析して
得られる音声の特徴パラメータフレームの時系列から所
定の合成単位で切り出した音声素片を音声素片蓄積手段
に複数蓄積しておき、前記音声素片蓄積手段から入力音
韻情報に基づいて前記音声素片を選択し接続して合成パ
ラメータフレームの時系列を生成し、この生成した合成
パラメータフレームの時系列から離散音声信号を合成す
る音声合成方法において、合成する音声の声質の選択指定の受け付けを行い、前記合成パラメータフレームの時系列から離散音声信号
を合成する合成処理を、前記受け付けた声質に応じて定
められる第２のフレーム周期で行うと共に、前記合成した離散音声信号の標本周期を前記受け付けた
声質に応じて定められる第２の標本周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第２の標本周期とは異なる（但し、第２の標本周
期が第１の標本周期に一致する場合を除く）第３の標本
周期でアナログ音声信号に変換することを特徴とする音
声合成方法。
【請求項１１５】第１の標本周期で標本化した離散音
声信号に第１のフレーム周期の時間窓をかけて分析して
得られる音声の特徴パラメータフレームの時系列から所
定の合成単位で切り出した音声素片を複数蓄積する音声
素片蓄積手段と、この音声素片蓄積手段から入力音韻情報に基づいて前記
音声素片を選択し接続して合成パラメータフレームの時
系列を生成する合成パラメータフレーム時系列生成手段
と、この合成パラメータフレーム時系列生成手段により生成
された合成パラメータフレームの時系列から、前記第１
の標本周期とは異なる第２の標本周期及び前記第２の標
本周期とは異なる第３の標本周期をもとに第２のフレーム周期＝第１のフレーム周期×第２の標本
周期／第３の標本周期で定められる第２のフレーム周期で離散音声信号を合成
する合成手段と、この合成手段によって合成された離散音声信号の標本周
期を前記第２の標本周期に変換する標本周期変換手段
と、この標本周期変換手段によって標本周期が変換された離
散音声信号を前記第３の標本周期でアナログ音声信号に
変換するディジタル／アナログ変換手段とを具備するこ
とを特徴とする音声合成装置。
【請求項１１６】第１の標本周期で標本化した離散音
声信号に第１のフレーム周期の時間窓をかけて分析して
得られる音声の特徴パラメータフレームの時系列から所
定の合成単位で切り出した音声素片を音声素片蓄積手段
に複数蓄積しておき、前記音声素片蓄積手段から入力音韻情報に基づいて前記
音声素片を選択し接続して合成パラメータフレームの時
系列を生成し、この生成した合成パラメータフレームの時系列から、前
記第１の標本周期とは異なる第２の標本周期及び前記第
２の標本周期とは異なる第３の標本周期をもとに第２のフレーム周期＝第１のフレーム周期×第２の標本
周期／第３の標本周期で定められる第２のフレーム周期で離散音声信号を合成
し、この第２のフレーム周期で合成した離散音声信号の標本
周期を前記第２の標本周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第３の標本周期でアナログ音声信号に変換するこ
とを特徴とする音声合成方法。
【請求項１１７】韻律情報と音韻情報を入力として第
１の標本周期で標本化した離散音声信号から作成した音
声素片を複数蓄積する音声素片蓄積手段と、前記韻律情報から音声の基本周波数パターンを生成する
ピッチパターン生成手段と、前記音韻情報に基づいて前記音声素片蓄積手段から音声
素片を選択的に読み出し接続することによって音声の音
韻パラメータを生成する音韻パラメータ生成手段と、この音韻パラメータ生成手段によって生成された音韻パ
ラメータと前記ピッチパターン生成手段によって生成さ
れた基本周波数パターンから離散音声信号を合成する合
成手段と、この合成手段によって合成された離散音声信号の標本周
期を変換するための標本周期変換手段であって、前記第
１の標本周期または前記第１の標本周期とは異なる第２
の標本周期への標本周期変換を選択的に行うことが可能
な標本周期変換手段と、この標本周期変換手段によって標本周期が変換された離
散音声信号を前記第２の標本周期とは異なる第３の標本
周期でアナログ音声信号に変換するディジタル／アナロ
グ変換手段とを具備し、前記ピッチパターン生成手段は、前記標本周期変換手段
にて前記第２の標本周期への標本周期変換が行われる際
には、前記第１の標本周期への標本周期変換が行われる
ときとは異なる基本周波数パターンとなるよう前記基本
周波数パターンを生成するように構成されていることを
特徴とする音声合成装置。
【請求項１１８】韻律情報と音韻情報を入力として第
１の標本周期で標本化した離散音声信号から作成した音
声素片を音声素片蓄積手段に複数蓄積しておき、前記韻
律情報から音声の基本周波数パターンを生成すると共
に、前記音韻情報に基づいて前記音声素片蓄積手段から
音声素片を選択的に読み出し接続することによって音声
の音韻パラメータを生成し、この生成した音韻パラメー
タと基本周波数パターンから離散音声信号を合成し、こ
の合成した離散音声信号をアナログ音声信号に変換する
音声合成方法において、前記合成した離散音声信号の標本周期を前記第１の標本
周期のままとする第１のモードと前記第１の標本周期と
は異なる第２の標本周期とする第２のモードとを用意
し、前記第２のモード時には、前記第１のモード時とは異なる基本周波数パターンとな
るよう前記基本周波数パターンを生成して前記離散音声
信号の合成に用い、前記合成した離散音声信号の標本周期を前記第２の標本
周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第２の標本周期とは異なる第３の標本周期でアナ
ログ音声信号に変換することを特徴とする音声合成方
法。
【請求項１１９】韻律情報と音韻情報を入力として第
１の標本周期で標本化した離散音声信号から作成した音
声素片を複数蓄積する音声素片蓄積手段と、前記第１の標本周期とは異なる第２の標本周期及び前記
第２の標本周期とは異なる第３の標本周期に基づいて前
記韻律情報から音声の基本周波数パターンを生成するピ
ッチパターン生成手段と、前記音韻情報に基づいて前記音声素片蓄積手段から音声
素片を選択的に読み出し接続することによって音声の音
韻パラメータを生成する音韻パラメータ生成手段と、この音韻パラメータ生成手段によって生成された音韻パ
ラメータと前記ピッチパターン生成手段によって生成さ
れた基本周波数パターンから離散音声信号を合成する合
成手段と、この合成手段によって合成された離散音声信号の標本周
期を前記第２の標本周期に変換する標本周期変換手段
と、この標本周期変換手段によって標本周期が変換された離
散音声信号を前記第３の標本周期でアナログ音声信号に
変換するディジタル／アナログ変換手段とを具備するこ
とを特徴とする音声合成装置。
【請求項１２０】韻律情報と音韻情報を入力として第
１の標本周期で標本化した離散音声信号から作成した音
声素片を音声素片蓄積手段に複数蓄積しておき、前記第１の標本周期とは異なる第２の標本周期及び前記
第２の標本周期とは異なる第３の標本周期に基づいて前
記韻律情報から音声の基本周波数パターンを生成すると
共に、前記音韻情報に基づいて前記音声素片蓄積手段か
ら音声素片を選択的に読み出し接続することによって音
声の音韻パラメータを生成し、この生成した音韻パラメータと基本周波数パターンから
離散音声信号を合成し、この合成した離散音声信号の標本周期を前記第２の標本
周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第３の標本周期でアナログ音声信号に変換するこ
とを特徴とする音声合成方法。
【請求項１２１】韻律情報と音韻情報を入力として第
１の標本周期で標本化した離散音声信号から作成した音
声素片を複数蓄積する音声素片蓄積手段と、合成する音声の声質を選択指定するための声質選択手段
と、この声質選択手段により選択指定された声質に応じて前
記韻律情報から音声の基本周波数パターンを生成するピ
ッチパターン生成手段と、前記音韻情報に基づいて前記音声素片蓄積手段から音声
素片を選択的に読み出し接続することによって音声の音
韻パラメータを生成する音韻パラメータ生成手段と、この音韻パラメータ生成手段によって生成された音韻パ
ラメータと前記ピッチパターン生成手段によって生成さ
れた基本周波数パターンから離散音声信号を合成する合
成手段と、この合成手段によって合成された離散音声信号の標本周
期を前記声質選択手段により選択指定された声質に応じ
て定められる第２の標本周期に変換する標本周期変換手
段と、この標本周期変換手段によって標本周期が変換された離
散音声信号を前記第２の標本周期とは異なる（但し、第
２の標本周期が第１の標本周期に一致する場合を除く）
第３の標本周期でアナログ音声信号に変換するディジタ
ル／アナログ変換手段とを具備することを特徴とする音
声合成装置。
【請求項１２２】韻律情報と音韻情報を入力として第
１の標本周期で標本化した離散音声信号から作成した音
声素片を音声素片蓄積手段に複数蓄積しておき、前記韻
律情報から音声の基本周波数パターンを生成すると共
に、前記音韻情報に基づいて前記音声素片蓄積手段から
音声素片を選択的に読み出し接続することによって音声
の音韻パラメータを生成し、この生成した音韻パラメー
タと基本周波数パターンから離散音声信号を合成する音
声合成方法において、合成する音声の声質の選択指定の受け付けを行い、合成処理に用いる前記基本周波数パターンを前記受け付
けた声質に応じて前記韻律情報から生成し、前記合成した離散音声信号の標本周期を前記受け付けた
声質に応じて定められる第２の標本周期に変換し、この第２の標本周期への標本周期変換後の離散音声信号
を前記第２の標本周期とは異なる（但し、第２の標本周
期が第１の標本周期に一致する場合を除く）第３の標本
周期でアナログ音声信号に変換することを特徴とする音
声合成方法。
【請求項１２３】前記ピッチパターン生成手段は、前
記標本周期変換手段にて前記第２の標本周期への標本周
期変換が行われる際には、前記第１の標本周期への標本
周期変換が行われるときに生成する基本周波数パターン
に対して、基本周波数が（第３の標本周期／第２の標本
周期）倍の基本周波数パターンを生成することを特徴と
する請求項１１７記載の音声合成装置。
【請求項１２４】前記第２のモード時の合成処理に用
いる基本周波数パターンを、その基本周波数が、前記第
１のモード時の合成処理に用いる基本周波数パターンの
基本周波数の（第３の標本周期／第２の標本周期）倍と
なるよう生成することを特徴とする請求項１１８記載の
音声合成方法。
【請求項１２５】音声の特徴パラメータを蓄積する蓄
積手段と、この蓄積手段から読み出した音声の特徴パラメータを入
力として離散音声信号を合成する合成手段と、この合成手段によって合成された離散音声信号をアナロ
グ音声信号に変換するディジタル／アナログ変換手段
と、このディジタル／アナログ変換手段に入力される離散音
声信号の標本周期と当該離散音声信号を前記ディジタル
／アナログ変換手段でアナログ音声信号に変換する際の
変換周期とが異なるように制御する制御手段とを具備す
ることを特徴とする音声合成装置。
【請求項１２６】音声の特徴パラメータを蓄積手段に
蓄積しておき、前記蓄積手段から読み出した音声の特徴
パラメータを入力として離散音声信号を合成し、この合
成した離散音声信号をアナログ音声信号に変換する音声
合成方法において、前記アナログ音声信号への変換の対象となる離散音声信
号の標本周期と当該離散音声信号をアナログ音声信号に
変換する際の変換周期とが異なるようにすることを特徴
とする音声合成方法。
【請求項１２７】音声の特徴パラメータを蓄積する蓄
積手段と、この蓄積手段から読み出した音声の特徴パラメータを入
力として離散音声信号を合成する合成手段と、この合成手段によって合成された離散音声信号をアナロ
グ音声信号に変換するディジタル／アナログ変換手段
と、合成する音声の声質を選択指定するための声質選択手段
と、前記ディジタル／アナログ変換手段に入力される離散音
声信号の標本周期と当該離散音声信号を前記ディジタル
／アナログ変換手段でアナログ音声信号に変換する際の
変換周期との比を、前記声質選択手段により選択指定さ
れた声質に応じて可変する制御手段とを具備することを
特徴とする音声合成装置。
【請求項１２８】音声の特徴パラメータを蓄積手段に
蓄積しておき、前記蓄積手段から読み出した音声の特徴
パラメータを入力として離散音声信号を合成し、この合
成した離散音声信号をアナログ音声信号に変換する音声
合成方法において、合成する音声の声質の選択指定の受け付けを行い、前記アナログ音声信号への変換の対象となる離散音声信
号の標本周期と当該離散音声信号をアナログ音声信号に
変換する際の変換周期との比を、前記受け付けた声質に
応じて可変することを特徴とする音声合成方法。
【請求項１２９】予め作成された音声素片を蓄積する
蓄積手段と、与えられた音韻情報に基づいて前記蓄積手段より音声素
片を選択し接続することによって離散音声信号を合成す
る合成手段と、この合成手段によって合成された離散音声信号をアナロ
グ音声信号に変換するディジタル／アナログ変換手段
と、このディジタル／アナログ変換手段に入力される離散音
声信号の標本周期と当該離散音声信号を前記ディジタル
／アナログ変換手段でアナログ音声信号に変換する際の
変換周期とが異なるように制御する制御手段とを具備す
ることを特徴とする音声合成装置。
【請求項１３０】予め作成された音声素片を蓄積手段
に蓄積しておき、与えられた音韻情報に基づいて前記蓄
積手段より音声素片を選択し接続することによって離散
音声信号を合成し、この合成した離散音声信号をアナロ
グ音声信号に変換する音声合成方法において、前記アナログ音声信号への変換の対象となる離散音声信
号の標本周期と当該離散音声信号をアナログ音声信号に
変換する際の変換周期とが異なるようにすることを特徴
とする音声合成方法。
【請求項１３１】予め作成された音声素片を蓄積する
蓄積手段と、与えられた音韻情報に基づいて前記蓄積手段より音声素
片を選択し接続することによって離散音声信号を合成す
る合成手段と、この合成手段によって合成された離散音声信号をアナロ
グ音声信号に変換するディジタル／アナログ変換手段
と、合成する音声の声質を選択指定するための声質選択手段
と、前記ディジタル／アナログ変換手段に入力される離散音
声信号の標本周期と当該離散音声信号を前記ディジタル
／アナログ変換手段でアナログ音声信号に変換する際の
変換周期との比を、前記声質選択手段により選択指定さ
れた声質に応じて可変する制御手段とを具備することを
特徴とする音声合成装置。
【請求項１３２】予め作成された音声素片を蓄積手段
に蓄積しておき、与えられた音韻情報に基づいて前記蓄
積手段より音声素片を選択し接続することによって離散
音声信号を合成し、この合成した離散音声信号をアナロ
グ音声信号に変換する音声合成方法において、合成する音声の声質の選択指定の受け付けを行い、前記アナログ音声信号への変換の対象となる離散音声信
号の標本周期と当該離散音声信号をアナログ音声信号に
変換する際の変換周期との比を、前記受け付けた声質に
応じて可変することを特徴とする音声合成方法。