JP3284634B2 - 規則音声合成装置 - Google Patents

規則音声合成装置

Info

Publication number
JP3284634B2
JP3284634B2 JP36046192A JP36046192A JP3284634B2 JP 3284634 B2 JP3284634 B2 JP 3284634B2 JP 36046192 A JP36046192 A JP 36046192A JP 36046192 A JP36046192 A JP 36046192A JP 3284634 B2 JP3284634 B2 JP 3284634B2
Authority
JP
Japan
Prior art keywords
duration
speed
phoneme
speech
utterance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP36046192A
Other languages
English (en)
Other versions
JPH06202682A (ja
Inventor
芳明 及川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP36046192A priority Critical patent/JP3284634B2/ja
Publication of JPH06202682A publication Critical patent/JPH06202682A/ja
Application granted granted Critical
Publication of JP3284634B2 publication Critical patent/JP3284634B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば音素,音節記号
或いは文字の系列から音声を合成する規則音声合成装置
に関するものである。
【0002】
【従来の技術】例えば音素,音節記号或いは文字の系列
から音声を合成する従来の規則音声合成装置の構成図を
図7に示す。
【0003】この図7に示す規則音声合成装置の入力端
子101には言語処理等などを終えた記号列信号が供給
され、入力端子105には発声速度を指令する発声速度
指令信号が供給される。また、出力端子111からは合
成された合成音声信号が出力される。
【0004】上記入力端子101を介した記号列信号は
記号列解析部102へ入力され、ここで当該記号列信号
に含まれる音韻に関する情報と韻律に関する情報に分離
抽出され出力される。上記音韻情報は発声される音に関
する情報であり、上記韻律に関する情報はアクセント、
イントネーションに関する情報である。
【0005】上記記号列解析部102から出力される上
記音韻に関する情報は音韻継続時間長算出部104とパ
ラメータ接続部108へ入力され、上記韻律に関する情
報はピッチパターン生成部109へ入力される。
【0006】 上記音韻に関する情報が供給される上記
音韻継続時間長算出部104では、入力された音韻に関
する情報より各音韻の継続時間を算出し出力する。この
算出には、例えば統計的手法の数量化I類によるモデル
化を用いた方法などが用いられる。なお、この方法は海
木,阿部,武田,匂坂らによって研究され平成2年3月
の日本音響学会講演論文集の「統計的手法を用いた文音
声における音韻継続時間設定」に発表されている。
【0007】ここでは、この方法を用いた場合を考え
る。この方法は、通常の発声速度で朗読した音声データ
ベースを分析対象とし、各音韻の継続長に影響を与える
要因(当該音韻の種類、隣接の音韻の種類、モーラ長な
ど)ごとに、どれだけ継続長が変化するかというパラメ
ータを求めて保持しておき、入力された音韻の環境を判
別して、その環境に該当する値を前記保持しているパラ
メータから読み出し、各音韻の継続時間長を算出すると
いうものである。
【0008】図7に戻って、上記パラメータは、通常発
声速度用継続時間長パラメータ保持部103に保持され
ている。この通常発声速度用継続時間長パラメータ保持
部103からのパラメータが、上記音韻継続時間長算出
部104に送られることで、当該音韻継続時間長算出部
104にて上記各音韻の継続時間長が算出される。この
音韻継続時間長算出部104から出力された各音韻の通
常発声速度の継続時間長は、発声速度制御部106へ入
力される。
【0009】当該発声速度制御部106では、上記入力
端子105を介して入力された発声速度指令信号により
指定された発声速度を実現するように、上記通常発声速
度の継続長を調整し、速度制御された継続時間長として
出力する。当該速度制御された継続時間長は上記パラメ
ータ接続部108と、ピッチパターン生成部109へ入
力される。
【0010】上記パラメータ接続部108では、速度制
御された各音韻の継続時間長と、前記音韻に関する情報
とに基づいて、素片データベース107から各素片のパ
ラメータを読み出して接続し、パラメータ列を生成す
る。生成されたパラメータ列は合成部110へ出力され
る。
【0011】一方、上記ピッチパターン生成部109で
は、前記韻律に関する情報と上記速度制御された継続時
間長とから、ピッチパターンを生成する。生成されたピ
ッチパターンは合成部110へ出力される。
【0012】上記合成部110では、上記パラメータ列
とピッチパターンより音声波形を合成して、出力端子1
11を介して合成音声信号を出力する。
【0013】
【発明が解決しようとする課題】上述した従来の規則音
声合成装置において、上記発声速度制御部106では、
入力された通常発声速度の各音韻の継続時間長から、指
定された発声速度を実現するために、例えば、各音韻の
継続時間長に一律に係数を乗じて調整したり、音韻の種
類ごとに乗じる係数を変えるなどの方法によりコントロ
ールされている。
【0014】しかし、実際の音声では音韻の種類によっ
て発声速度による変化の仕方が変わるものであるのに対
し、上記従来の調整方法のように、通常発声速度の各音
韻の継続時間長に一律に係数を乗じた場合には、これを
実現できない。また、音韻の種類ごとに乗じる係数を変
えた場合には、規則が煩雑になるという問題点がある。
【0015】更に、上記従来の調整方法を用いて合成さ
れた音声は、実際に発声速度を変えて発声した音声の継
続時間長とは異なったものとなるため不自然さがある。
【0016】そこで、本発明は、出力合成音声の速度を
変える場合であっても、システム構成を簡略化でき、よ
り自然な合成音声を得ることができる規則音声合成装置
を提供することを目的とするものである。
【0017】
【課題を解決するための手段】本発明の規則音声合成装
置は、上述の目的を達成するために提案されたものであ
り、少なくとも2以上の発声速度で発声されたポーズ長
を含む各音韻の継続時間長に関するパラメータを保持す
るパラメータ保持部と、音声合成する際に、指定された
発声速度に対応した各音韻の継続時間長を、前記パラメ
ータ保持部に保持しているパラメータから補間して求め
ることにより、合成音声を形成する合成音声形成部とを
有してなるものである。
【0018】ここで、上記少なくとも2以上の発声速度
は、遅読み用、通常読み用、早読み用に対応した発声速
度である。また、上記補間は、直線補間を用いることが
できる。
【0019】すなわち、本発明の規則音声合成装置は、
遅読み、通常速度読み、早読みを行う時などの少なくと
も2つ以上の発声速度で発声されたポーズ長を含む各音
韻の継続時間長に関するパラメータを、それぞれのデー
タベースから抽出し、これらパラメータを保持してお
き、音声を合成する際に、指定された発声速度に対応し
たポーズ長を含む各音韻の継続時間長を、前記保持して
いるパラメータから補間して求めることにより、合成音
声を形成するようにしたものである。
【0020】
【作用】本発明によれば、早読み用、通常発声速度用、
遅読み用などの少なくとも2つ以上の発声速度で発声し
た場合のパラメータから、各発声速度の場合の音韻の継
続時間長を求め、指定発声速度の場合の継続時間長を、
各発声速度の場合の継続時間長から補間して求めるよう
にしている。
【0021】
【実施例】以下、本発明の実施例について図面を参照し
ながら説明する。
【0022】本発明実施例の規則音声合成装置は、図1
に示すように、遅読み、通常速度、早読みした時などの
少なくとも2以上の発声速度で発声されたポーズ長を含
む各音韻の継続時間長に関するパラメータを保持するパ
ラメータ保持部としての早読み用継続時間長パラメータ
保持部204,通常発声速度用継続時間長パラメータ保
持部206,遅読み用継続時間長パラメータ保持部20
8と、音声を合成する際に、入力端子209を介して入
力される指定速度指令信号により指定された発声速度に
対応したポーズ長を含む各音韻の継続時間長を、前記パ
ラメータ保持部204,206,208に保持している
パラメータから補間して求めることにより合成音声を形
成する合成音声形成部の主要構成要素としての早読み用
継続時間長算出部203,通常発声速度用継続時間長算
出部205,遅読み用継続時間長算出部207,指定速
度継続時間長算出部210等を有してなるものである。
【0023】この図1に示す本実施例の規則音声合成装
置の入力端子201には言語処理等などを終えた記号列
信号が供給され、入力端子209には発声速度を指令す
る発声速度指令信号が供給される。また、出力端子21
5からは合成された合成音声信号が出力される。
【0024】上記入力端子201を介した記号列信号は
記号列解析部202へ入力され、ここで当該記号列信号
に含まれる音韻に関する情報と韻律に関する情報に分離
抽出され出力される。上記音韻情報は発声される音に関
する情報であり、上記韻律に関する情報はアクセント、
イントネーションに関する情報である。
【0025】上記記号列解析部202から出力される上
記音韻に関する情報は、早読み用継続時間長算出部20
3、通常速度用継続時間長算出部205、遅読み用継続
時間長算出部207と、パラメータ接続部211へ入力
される。また、上記韻律に関する情報はピッチパターン
生成部213へ入力される。
【0026】各継続時間算出部203,205,207
では、それぞれ対応する上記各パラメータ保持部20
4,206,205から上記遅読み、通常速度、早読み
時の発声速度で発声されたポーズ長を含む各音韻の継続
時間長に関するパラメータを読み出し、それぞれ継続時
間長を算出して出力する。これら算出された各発声速度
での継続時間長は、指定速度の継続時間長算出部210
へ入力される。
【0027】指定速度の継続時間長算出部210では、
入力端子209を介して供給される発声速度指令信号に
よって指定される発声速度を実現するように継続時間長
を算出する。この算出部210での算出方法は、例えば
後述する図2〜図6で述べる補間としての直線補間の計
算のアルゴリズムを使用する。この継続時間長算出部2
10で求められた継続時間長は、速度制御された継続時
間長として出力され、上記ピッチパターン生成部213
とパラメータ接続部211とに送られる。
【0028】上記パラメータ接続部211では、上記指
定速度の継続時間長算出部210からの上記速度制御さ
れた各音韻の継続時間長と、上記音韻に関する情報とに
基づいて、素片データベース212から各素片のパラメ
ータを読み出して接続し、パラメータ列を生成する。こ
の生成されたパラメータ列は合成部214へ出力され
る。
【0029】一方、上記ピッチパターン生成部213で
は、上記韻律に関する情報と、上記指定速度の継続時間
長算出部210からの速度制御された継続時間長から、
ピッチパターンを生成する。この生成されたピッチパタ
ーンは合成部214へ出力される。
【0030】上記合成部214では、パラメータ列とピ
ッチパターンより音声波形を合成して、出力端子215
を介して合成音声信号を出力する。
【0031】ここで、上記図1に示した本実施例の規則
音声合成装置において行われる上記補間として直線補間
を用いた場合の継続時間長の算出は、以下のように一律
の係数を乗じる方法を用いて求められる。
【0032】すなわち、例えば図2に示すように、ある
音韻の継続継続時間長をt[msec]とし、その音韻の早読
み用のパラメータから求められた継続時間長をt1[mse
c] 、通常発声速度用のパラメータから求められた継続
時間長をt2[msec] 、遅読み用のパラメータから求めら
れた継続時間長をt3[msec] とし、各発声速度の平均発
声速度をs1[モーラ/sec] 、s2[モーラ/sec] 、s3[モ
ーラ/sec] としたとする。
【0033】この場合において、例えば図3に示すよう
に、入力された発声速度指令s[ モーラ/sec] が、s1
<s<s2 の場合(通常発声速度より早く、早読み用の
発声速度より遅い場合)には、 t=t1+(t1-t2)/(s1-s2)*(s-s2) [msec] として求めることができる。
【0034】また、例えば図4に示すように、入力され
た発声速度指令s[ モーラ/sec] が、s2 <s<s3
場合(遅読み用の発声速度より早く、通常発声速度より
遅い場合)には、 t=t2+(t3-t2)/(s3-s2)*(s-s2) [msec] として求めることができる。
【0035】さらに、例えば図5に示すように、入力さ
れた発声速度指令s[ モーラ/sec]が、s1 <sの場合
(早読み用の発声速度より早い場合)には、 t=t1 * s/s1 [msec] として求めることができる。
【0036】またさらに、例えば図6に示すように、入
力された発声速度指令s[ モーラ/sec] が、s3 <sの
場合(遅読み用より遅い場合)には、 t=t3 * s/s3 [msec] として求めることができる。
【0037】上述したように、本実施例の規則音声合成
装置においては、それぞれのデータベースから抽出さ
れ、遅読み、通常速度、早読みした時などの少なくとも
2つ以上の発声速度で発声されたポーズ長を含む各音韻
の継続時間長に関するパラメータを、上記パラメータ保
持部204,206,208に保持しておき、音声を合
成する際に、上記合成音声形成部で、上記指定された発
声速度に対応したポーズ長を含む各音韻の継続時間長を
前記保持しているパラメータから補間して求めることに
より、合成音声を形成するようにしたことによって、出
力合成音声の速度を変える場合であっても、システム構
成を従来の装置と比較してそれほど複雑にすることな
く、より自然な合成音声を得ることができるようにな
る。
【0038】
【発明の効果】本発明によれば、少なくとも2以上の発
声速度で発声されたポーズ長を含む各音韻の継続時間長
に関するパラメータを保持し、音声を合成する際に、指
定された発声速度に対応したポーズ長を含む各音韻の継
続時間長を、先に保持しているパラメータから補間して
求めることにより、合成音声を形成するようにしたこと
で、出力合成音声の速度を変える場合であっても、シス
テム構成を従来の装置と比較してそれほど複雑にするこ
となく、より自然な合成音声を得ることができるように
なる。
【図面の簡単な説明】
【図1】本発明実施例の規則音声合成装置の概略構成を
示すブロック回路図である。
【図2】本発明実施例の補間として直線補間を用いた場
合の継続長の算出について説明するための図である。
【図3】図2の例においてs1 <s<s2 の場合の継続
長の算出について説明するための図である。
【図4】図2の例においてs2 <s<s3 の場合の継続
長の算出について説明するための図である。
【図5】図2の例においてs1 <sの場合の継続長の算
出について説明するための図である。
【図6】図2の例においてs3 <sの場合の継続長の算
出について説明するための図である。
【図7】従来の規則音声合成装置の概略構成を示すブロ
ック回路図である。
【符号の説明】
202・・・・・・記号列解析部 203・・・・・・早読み用継続時間長算出部 204・・・・・・早読み用継続時間パラメータ保持部 205・・・・・・通常発声速度用継続時間長算出部 206・・・・・・通常発声速度用継続時間パラメータ
保持部 207・・・・・・遅読み用継続時間長算出部 208・・・・・・遅読み用継続時間パラメータ保持部 210・・・・・・指定速度の継続時間長算出部 211・・・・・・パラメータ接続部 212・・・・・・素片データベース 213・・・・・・ピッチパターン生成部 214・・・・・・合成部

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 少なくとも2以上の発声速度で発声され
    ポーズ長を含む各音韻の継続時間長に関するパラメー
    タを保持するパラメータ保持部と、 音声合成する際に、指定された発声速度に対応した各音
    韻の継続時間長を、前記パラメータ保持部に保持してい
    るパラメータから補間して求めることにより、合成音声
    を形成する合成音声形成部とを有してなることを特徴と
    する規則音声合成装置。
  2. 【請求項2】 上記少なくとも2以上の発声速度は、遅
    読み用、通常読み用、早読み用に対応した発声速度であ
    ることを特徴とする請求項1記載の規則音声合成装置。
  3. 【請求項3】 上記補間は、直線補間であることを特徴
    とする請求項1記載の規則音声合成装置。
JP36046192A 1992-12-29 1992-12-29 規則音声合成装置 Expired - Fee Related JP3284634B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP36046192A JP3284634B2 (ja) 1992-12-29 1992-12-29 規則音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36046192A JP3284634B2 (ja) 1992-12-29 1992-12-29 規則音声合成装置

Publications (2)

Publication Number Publication Date
JPH06202682A JPH06202682A (ja) 1994-07-22
JP3284634B2 true JP3284634B2 (ja) 2002-05-20

Family

ID=18469510

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36046192A Expired - Fee Related JP3284634B2 (ja) 1992-12-29 1992-12-29 規則音声合成装置

Country Status (1)

Country Link
JP (1) JP3284634B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101334995B (zh) * 2007-06-25 2011-08-03 富士通株式会社 文本到语音转换设备及其转换方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101334995B (zh) * 2007-06-25 2011-08-03 富士通株式会社 文本到语音转换设备及其转换方法

Also Published As

Publication number Publication date
JPH06202682A (ja) 1994-07-22

Similar Documents

Publication Publication Date Title
JP3985814B2 (ja) 歌唱合成装置
JP3563772B2 (ja) 音声合成方法及び装置並びに音声合成制御方法及び装置
JPH031200A (ja) 規則型音声合成装置
JPH0632020B2 (ja) 音声合成方法および装置
JP3576840B2 (ja) 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体
JP3732793B2 (ja) 音声合成方法、音声合成装置及び記録媒体
JPH08254993A (ja) 音声合成装置
JP2761552B2 (ja) 音声合成方法
JP2600384B2 (ja) 音声合成方法
JP3284634B2 (ja) 規則音声合成装置
JP2001242882A (ja) 音声合成方法及び音声合成装置
JP3437064B2 (ja) 音声合成装置
JP4451665B2 (ja) 音声を合成する方法
JP5175422B2 (ja) 音声合成における時間幅を制御する方法
JP3742206B2 (ja) 音声合成方法及び装置
JP3233036B2 (ja) 歌唱音合成装置
JP3394281B2 (ja) 音声合成方式および規則合成装置
JP3081300B2 (ja) 残差駆動型音声合成装置
JP2573586B2 (ja) 規則型音声合成装置
JP2956936B2 (ja) 音声合成装置の発声速度制御回路
JP2001100777A (ja) 音声合成方法及び装置
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JP3515268B2 (ja) 音声合成装置
JPH056191A (ja) 音声合成装置
JPH0553595A (ja) 音声合成装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020205

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080308

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090308

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100308

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees