JP2003005774A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JP2003005774A
JP2003005774A JP2001191713A JP2001191713A JP2003005774A JP 2003005774 A JP2003005774 A JP 2003005774A JP 2001191713 A JP2001191713 A JP 2001191713A JP 2001191713 A JP2001191713 A JP 2001191713A JP 2003005774 A JP2003005774 A JP 2003005774A
Authority
JP
Japan
Prior art keywords
voice
speed
speech
text
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001191713A
Other languages
English (en)
Inventor
Yumiko Kato
弓子 加藤
Katsuyoshi Yamagami
勝義 山上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2001191713A priority Critical patent/JP2003005774A/ja
Publication of JP2003005774A publication Critical patent/JP2003005774A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 入力されたテキストを音声に変換した
際に、音声速度を標準の速度に対して大きく変化させた
場合であっても、音声の自然性を損なわず、かつ、入力
されたテキストの意味が正確にわかるようにすること。 【解決手段】 本発明は、使用者が入力した音声の速
さが所定の範囲外にある場合に、音声に変換しようとす
るテキストをそのテキストと同等の意味を持ちかつ異な
る表現を持つテキストに変換し、変換したテキストを音
声に変換し出力し音声の単位時間あたりの情報量を調節
することで音声の速度を調節するようにしたものであ
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、テキストを音声に
変換する音声合成装置に関するものである。
【0002】
【従来の技術】従来より、テキストを音声に変換する音
声合成装置がある。従来の音声合成装置は、音韻である
音素の時間長を線形に伸縮することによって、音声速度
を調節している。また、特開平06−266391号公
報には、母音重心点間の時間長のバランスを保持してそ
れぞれの音素時間長を伸縮することによって、音声速度
を調節する方法が開示されている。これらの音声速度を
調節する方法は、単位時間あたりの音韻数のみを調整す
ることによって音声速度を調節している。
【0003】また、特許第3124791号公報には、
発話速度に応じてポーズの頻度やポーズの時間長を調整
することによって、音声速度を調節する方法が開示され
ている。
【0004】また、特開平9−311775号公報に
は、発話速度を変えるのではなく、使用者のテキストに
対する参照レベル、つまり参照時間か参照速度によって
決定されるユーザーの文書を参照する態度の指標に応じ
て、タイトルのみあるいは文書全体の音声に変換するテ
キストを削除することによって音声の速さを調節する方
法が開示されている。
【0005】
【発明が解決しようとする課題】しかしながら、特開平
06−266391号公報や特許第3124791号公
報に記載された音声速度調整方法は、単位時間あたりの
音韻数を変化させているが、発話全体の音韻の数を変化
させない。すなわち、音韻あたりの時間長を変化させて
いる。この音韻あたりの時間長がある所定の範囲を超え
ると、音韻を判別することが不可能になる。よって、こ
のように単位時間あたりの音韻数を変化させる音声速度
調整方法は、音声の自然性を損なわずに話速を変化させ
ることのできる範囲が狭い。言い換えれば、音声速度を
標準の速度に対して大きく変化させる場合には、音声の
自然性が損なわれる可能性がある。
【0006】また、特開平9−311775号公報に記
載された音声速度調整方法は、話速を上げるために、使
用者のテキスト参照レベルに応じて一部を削除したテキ
スト部分のみを読み上げることになる。つまり、この方
法は、入力されたテキストの情報すべてを音声に変換す
ることができず、一部が削除されたテキストに含まれる
情報の部分しか音声に変換できない。このため、使用者
のテキスト参照レベルが標準に比べて大きく異なる場合
は、削除するテキスト部分が多くなり、入力されたテキ
ストの意味を正確に認識できない可能性がある。
【0007】本発明はかかる点に鑑みてなされたもので
あり、入力されたテキストを変換した音声を生成する際
に、音声速度を標準の速度に対して大きく変化させた場
合であっても、音声の自然性を損なわず、かつ、入力さ
れたテキストの意味が正確にわかるようにすることを目
的とする。
【0008】
【課題を解決するための手段】本発明は、使用者が入力
した音声の速さが所定の範囲外にある場合に、音声に変
換しようとするテキストをそのテキストと同等の意味を
持ちかつ異なる表現を持つテキストに変換し、変換した
テキストを音声に変換し出力することで、音声の単位時
間あたりの情報量を調節するようにしたものである。
【0009】このように、テキストを単純に削除するの
ではなく同等の意味を持つ異なる表現に変えたテキスト
を音声に変換することで、話速を変化させることなく、
かつ入力されたテキストの意味が正確にわかるようにす
ることができる。
【0010】
【発明の実施の形態】本発明の第1の態様にかかる音声
合成装置は、使用者が音声に変換するためのテキストを
入力する入力手段と、使用者が音声の速さを段階的ある
いは連続的に調節する速さ調節手段と、使用者が入力し
た音声の速さが所定の範囲外にある場合に、前記テキス
トを同等の意味を持ちかつ異なる表現を持つテキストに
変換することで音声の単位時間あたりの情報量を調節す
る文体変換手段と、テキスト情報を音声に変換して出力
する音声生成手段と、を具備した形態を採る。
【0011】この構成により、要約のように情報量を減
少させることなく、口調としての音声の速度を自由に調
整することが可能になる。この結果、入力されたテキス
トを変換した音声を生成する際に、音声速度を標準の速
度に対して大きく変化させた場合であっても、音声の自
然性を損なわず、かつ、入力されたテキストの意味が正
確にわかるようにすることができる。
【0012】本発明の第2の態様は、第1の態様にかか
る音声合成装置において、使用者が入力した音声の速さ
が所定の範囲内にある場合には、前記使用者が前記速さ
調節手段より入力した音声の速さに応じて、出力する音
声の単位時間あたりの音韻数を増減する発話速度調整手
段、出力する音声に含まれるポーズの時間長を伸縮する
ポーズ長調整手段、および出力する音声に含まれるポー
ズの頻度を増減するポーズ頻度調整手段のいずれか1つ
の手段を用いて音声の速さを調節し、使用者が入力した
音声の速さが所定の範囲外にある場合には前記発話速度
調節手段、前記ポーズ長調整手段、および前記ポーズ頻
度調整手段のいずれかひとつの手段を用いて音声の速さ
を調節すると共に前記文体変換手段を用いて音声の速さ
を調整するものである。
【0013】この構成により、使用者が入力した音声の
速さが所定の範囲外にある場合には前記発話速度調節手
段、前記ポーズ長調整手段、および前記ポーズ頻度調整
手段のいずれかひとつの手段を用いて音声の速さを調節
すると共に前記文体変換手段を用いて音声の速さを調整
できる。これにより、情報量を減少させることなく、か
つ発話速度だけでない、口調としての音声の速度を自由
に調整することが可能になる。
【0014】本発明の第3の態様は、第1の態様または
第2の態様にかかる音声合成装置において、前記文体変
換手段は言語情報に基づき冗長語の追加または削除また
は変更を行うものである。
【0015】この構成により、音声の自然性を損なわ
ず、かつ、入力されたテキストの意味が正確にわかるよ
うにできる。
【0016】本発明の第4の態様は、第1の態様または
第2の態様にかかる音声合成装置において、前記文体変
換手段は言語情報に基づき略語を省略されていない表現
に変更するまたは特定の単語あるいは単語列を略語に変
更するものである。
【0017】この構成により、音声の自然性を損なわ
ず、かつ、入力されたテキストの意味が正確にわかるよ
うにできる。
【0018】本発明の第5の態様は、第1の態様または
第2の態様にかかる音声合成装置において、前記文体変
換手段は言語情報に基づき付属語を含む特定の単語列を
付属語を含まない複合語に変更するまたは特定の複合語
を付属語を含む単語列に変換するものである。
【0019】この構成により、音声の自然性を損なわ
ず、かつ、入力されたテキストの意味が正確にわかるよ
うにできる。
【0020】本発明の第6の態様は、指定された音声の
速さが所定の範囲外にある場合に、音声に変換するため
のテキストを同等の意味を持ちかつ異なる表現を持つテ
キストに変換することで音声の単位時間あたりの情報量
を調節する工程と、前記異なる表現を持つテキストを音
声に変換して出力する工程と、を具備したことを特徴と
する音声合成方法である。
【0021】以下、本発明の実施の一形態にかかる音声
合成装置について説明する。まず、音声合成装置の構成
について図1を用いて説明する。図1は、上記実施の形
態にかかる音声合成装置の機能ブロック図である。
【0022】本実施の形態にかかる音声合成装置1は、
音声に変換するテキストが入力されるテキスト入力部1
0が設けられている。テキスト入力部10は、入力され
たテキストを出力する。言語処理部20は、テキスト入
力部10より出力されたテキストを言語処理解析する。
具体的には、言語処理部20は、テキストを形態素解析
および構文解析し、少なくとも、読みおよびアクセント
が含まれる音声合成用の中間言語および形態素解析結
果、構文解析結果を出力する。
【0023】文体変換部30は、言語処理部20より出
力された言語処理解析結果に基づき、テキスト入力部1
0で入力されたテキストと同等の意味を持ちかつ異なる
表現を持つようにテキストを変換する。
【0024】文体変換部30は、言語情報に基づき冗長
語の追加または削除または変更を行う付属語変換部31
と、言語情報に基づき略語を省略されていない表現に変
更するまたは特定の単語あるいは単語列を略語に変更す
る略語変換部32と、言語情報に基づき付属語を含む特
定の単語列を付属語を含まない複合語に変更するまたは
特定の複合語を付属語を含む単語列に変換する複合語変
換部33と、から構成される。
【0025】波形生成部40は、言語処理部20で解析
されたテキスト、あるいは言語処理部20で解析され文
体変換部30で表現を変換されたテキストの解析結果に
基づき音声波形を生成する。
【0026】波形生成部40は、出力する音声の単位時
間あたりの音韻数を増減する発話速度調整部41と、出
力する音声に含まれるポーズの頻度を増減するポーズ頻
度調整部42と、ポーズの時間長を伸縮するポーズ長調
整部43と、ポーズ長調整部43の出力に応じて音声波
形を生成する音声合成部44と、から構成される。
【0027】電気音響変換機50は、波形生成部40が
生成した音声波形を音声に変換して出力する。調整入力
部60は、使用者が出力音声の話速を調整するための信
号を入力する部分である。
【0028】また、制御部70は、調整入力部60より
入力された調整信号に従って文体変換部30、波形生成
部40を制御する。具体的には、制御部70は、調整入
力部60から入力された話速パラメータが標準話速に対
して何倍かを判断する。そして、制御部70は、その倍
率に応じて、発話速度調整部41、ポーズ頻度調整部4
2、およびポーズ長調整部43からひとつの処理部を選
択し、選択した処理部を用いて音声波形を生成する。ま
た、制御部70は、倍率が所定の範囲を超える場合は、
付属語変換部31、略語変換部32、および複合語変換
部33からひとつの処理部を選択し、選択した処理部を
用いて言語処理解析したテキストを変換する。
【0029】以下、上記実施の形態にかかる音声合成装
置の動作について図2を用いて詳細に説明する。図2
は、上記実施の形態における音声合成装置の動作を示す
流れ図である。
【0030】まず、制御部70が、テキストの入力に先
立って調整入力部60より入力された話速パラメータを
取得する(ステップ110)。次に、テキスト入力部10
が、音声合成の対象となるテキストを受け付け、言語処
理部20に出力する(ステップ120)。そして、言語処
理部20は、テキスト入力部10より入力されたテキス
トを形態素解析および構文解析し、少なくとも、読みお
よびアクセントが含まれる音声合成用の中間言語および
形態素解析結果、構文解析結果を出力する(ステップ1
30)。
【0031】次に、制御部70は、ステップ110で取
得した話速パラメータがあらかじめ定められた標準話速
と等しいか判断する(ステップ140)。制御部70が
話速パラメータと標準話速が等しいと判断した場合は、
音声合成部44があらかじめ定められた標準発話速度、
標準ポーズ頻度、標準ポーズ長を用い、ステップ130
で言語処理部20より出力された中間言語に従って音声
波形を生成し、出力する(ステップ150)。そして、
電気音響変換機50が、音声合成部44が生成した音声
波形を音声に変換して出力する(ステップ160)。
【0032】一方、ステップ140で話速パラメータが
標準話速と異なる場合、制御部70は、話速パラメータ
が標準の1/2.2倍から2.2倍の範囲内にあるか判
断する(ステップ170)。ステップ170で話速パラ
メータが標準の1/2.2倍から2.2倍の範囲内にあ
ると判断した場合は、発話速度調整部41が話速パラメ
ータに応じて単位時間あたりの音韻数を調整した音声波
形を生成する(ステップ180)。そして、電気音響変
換機50が、音声合成部44が生成した音声波形を音声
に変換して出力する(ステップ160)。
【0033】一方、ステップ170で話速パラメータが
標準の1/2.2倍以下あるいは2.2倍以上であると
判断した場合には、発話速度調整部41が単位時間あた
りの音韻数に標準の1/2.2倍あるいは2.2倍に対
応する音韻数を適用する(ステップ190)。しかしなが
ら、話速パラメータが標準の1/2.2倍以下あるいは
2.2倍以上である場合は、音韻数を単位時間あたりの
音韻数に標準の1/2.2倍あるいは2.2倍に対応す
る音韻数を適用するだけでは、話速を十分に調節できて
いない。よって、音声合成装置1は、さらに、話速を調
節する動作に移行する。
【0034】まず、制御部70は、話速パラメータと標
準話速の1/2倍および2倍を比較する(ステップ20
0)。ステップ200において話速パラメータが標準話
速の1/2倍から2倍の範囲内にあると判断した場合、
ステップ190で調整された発話速度に対し、ポーズ頻
度部42を用いてポーズ頻度を調整する処理、またはポ
ーズ長調整部43を用いてポーズ長を調節する処理の少
なくとも一方の処理を行い、生成した音声波形を出力す
る(ステップ210)。そして、電気音響変換機50
が、音声合成部44が生成した音声波形を音声に変換し
て出力する(ステップ160)。
【0035】一方、ステップ200において話速パラメ
ータが標準話速の1/2倍から2倍の範囲外にある場
合、ポーズ頻度調整部42およびポーズ長調整部43は
標準話速の1/2倍あるいは2倍に対応するポーズ頻度
およびポーズ長を適用する(ステップ220)。しかしな
がら、話速パラメータが標準の1/2倍以下あるいは2
倍以上である場合は、ポーズ頻度およびポーズ長に標準
の1/2倍あるいは2倍に対応するポーズ頻度およびポ
ーズ長を適用するだけでは、話速を十分に調節できてい
ない。よって、音声合成装置1は、さらに、話速を調節
する動作に移行する。
【0036】まず、制御部70は、話速パラメータが標
準話速の1/2.5倍から2.5倍の範囲内にあるかを
判断する(ステップ230)。ステップ230において
話速パラメータが標準話速の1/2.5倍から2.5倍
の範囲内にあると判断した場合、音声合成装置1は、ス
テップ130で言語処理部20より出力された中間言語
を、ステップ190で調整された発話速度と、ステップ
220で調整されたポーズ頻度およびポーズ長を用いて
処理した音声波形を音声出力する(ステップ160)。
【0037】一方、ステップ230において話速パラメ
ータが標準話速の1/2.5倍から2.5倍の範囲外に
あると判断した場合、制御部70は、さらに話速パラメ
ータが標準の1/3.2倍から3.2倍の範囲内にある
か判断する(ステップ240)。そして、話速パラメー
タが標準の1/3.2倍から3.2倍の範囲内にある場
合には、付属語変換部31が話速パラメータに応じて付
属語の冗長度を調整する(ステップ250)。具体的に
は、付属語変換部31は、ステップ130で言語処理部
20より出力された中間言語のうち付属語部分の中間言
語を、調整された話速パラメータに対応する冗長度の付
属語の情報に変換する。例えば、付属語変換部31は、
話速パラメータが標準話速に比べて速い場合は、中間言
語「です」を「だ」に変換する。一方、付属語変換部3
1は、話速パラメータが標準話速に比べて遅い場合は、
中間言語「です」を「である」に変換するなどの変換を
する。
【0038】一方、ステップ240において、話速パラ
メータが標準の1/3.2倍以下あるいは3.2倍以上
の場合には、付属語変換部31は、標準話速の1/3.
2倍あるいは3.2倍に対応する冗長度の付属語を、ス
テップ130で言語処理部20より出力された中間言語
のうち付属語部分の中間言語に適用する。これにより、
付属語変換部31は、付属語部分の中間言語を入力され
た話速パラメータに対応する冗長度の付属語の情報に変
換する(ステップ260)。しかしながら、話速パラメー
タが標準の1/3.2倍以下あるいは3.2倍以上であ
る場合は、標準の1/3.2倍あるいは3.2倍に対応
する冗長度の付属語を、ステップ130で言語処理部2
0より出力された中間言語のうち付属語部分の中間言語
に適用するだけでは、話速を十分に調節できていない。
よって、音声合成装置1は、さらに、話速を調節する動
作に移行する。
【0039】まず、制御部70は、話速パラメータが標
準話速の1/3倍から3倍の範囲内にあるかを比較する
(ステップ270)。ステップ270において話速パラ
メータが標準話速の1/3倍から3倍の範囲内にあると
判断した場合、ステップ190で調整された発話速度
と、ステップ220で調整されたポーズ頻度およびポー
ズ長と、ステップ260で変換された中間言語に従って
音声波形を生成し、生成した音声波形を音声にして出力
する(ステップ160)。
【0040】一方、ステップ270において話速パラメ
ータが標準話速の1/3倍から3倍の範囲外にあると判
断した場合、制御部70は、話速パラメータが標準の1
/3.3倍以上であるか3倍以上であるか判断する(ス
テップ280)。
【0041】ステップ280において、話速パラメータ
が標準の1/3.3倍以上であるか3倍以上であると判
断した場合には、略語変換部32が話速パラメータに応
じて文中の略語の頻度を調整する(ステップ290)。
具体的には、略語変換部32は、ステップ130で言語
処理部20より出力された中間言語が調整された話速パ
ラメータに応じた文中の略語の頻度になるように、略語
に変換可能な複合語に対応する中間言語を略語に変換、
あるいは、略語に対応する中間言語の部分を複合語に変
換する(ステップ290)。例えば、略語変換部32
は、音声の出力時間を短くする場合には、「第1研究開
発部」という複合語を「第1研」などのような略語に変
換し、音声の出力時間を長くする場合には、「第1研」
という略語を「第1研究開発部」などのような複合語に
変換する。
【0042】そして、変換した中間言語を音声波形に
し、音声として出力する(ステップ160)。
【0043】さらに、制御部70は、話速パラメータと
標準話速の1/3.3倍とを比較する(ステップ30
0)。ステップ300において話速パラメータが標準話
速の1/3.3倍以上であると判断した場合、ステップ
190で調整された発話速度と、ステップ220で調整
されたポーズ頻度およびポーズ長と、ステップ260、
ステップ290で変換された中間言語に従って音声波形
を生成し、生成した音声波形を音声にして出力する(ス
テップ160)。
【0044】一方、ステップ220において、話速パラ
メータが標準話速の1/3.3倍を下回ると判断した場
合、複合語変換部33が話速パラメータに応じて文中の
複合語の品度を調整して、ステップ130で言語処理部
20より出力された中間言語のうち複合語に対応する中
間言語の部分に対して、複合語を構成する単語の切れ目
にあたる位置に付属語の情報を挿入する(ステップ31
0)。例えば、複合語変換部33は、音声の出力時間を
長くする場合は「参加登録書類」という複合語を「参加
の登録の書類」というように付属語を挿入し、音声の出
力時間を短くする場合は「参加の登録の書類」という付
属語で接続された表現を「参加登録書類」というように
付属語を削除する。
【0045】そして、音声合成装置1は、ステップ19
0で調整された発話速度と、ステップ220で調整され
たポーズ頻度およびポーズ長と、ステップ260、ステ
ップ290およびステップ310で変換された中間言語
に従って音声波形を生成し、生成した音声波形を音声に
して出力する(ステップ160)。
【0046】次に、上記実施の形態の話速パラメータ設
定方法および話速調節方法について図3を用いて説明す
る。図3は、話速調整の入力インタフェースの1例と入
力に対応する話速調整を実現するための方式を示したも
のである。
【0047】本実施の形態では、調整入力部60とし
て、スクロールバーを表示している。そして、操作者が
スクロールバーのインジケータ301をマウスなどでス
ライドさせることで話速パラメータを調節するようにな
っている。また、スクロールバーのスクロールボタン3
02、303をマウスでクリックすることでも話速パラ
メータを調節できる。
【0048】そして、操作者が入力した話速パラメータ
が標準話速の1/2.2倍から2.2倍である場合には
この範囲で有効な音声速度調整方法である発話速度調節
を行る。また、入力した話速パラメータが標準話速の1
/2.2倍から2.2倍を超え、かつ話速パラメータが
標準話速の1/2.5倍から2.5倍の範囲内である場
合にはこの範囲で有効な音声速度調節方法であるポーズ
頻度およびポーズ長の調節を発話速度調節に加えて行
う。
【0049】また、入力した話速パラメータが標準話速
の1/2.5倍から2.5倍を超え、かつ話速パラメー
タが標準話速の1/3.2倍から3.2倍の範囲内であ
る場合にはこの範囲で有効な音声調節方法である冗長語
の頻度調節(付属語の変換)を発話速度調節、ポーズ頻
度およびポーズ長の調節に加えて行う。さらに、入力し
た話速パラメータが標準話速の1/3.2倍から3.2
倍を超え、かつ話速パラメータが標準話速の1/3.3
倍から3倍の範囲内である場合には、この範囲で有効な
音声調節方法である複合語の結合と分離、略語の使用を
発話速度調節、ポーズ頻度およびポーズ長の調節、およ
び冗長語の頻度調節に加えて行う。さらに、入力した話
速パラメータが標準話速の1/3.3倍以下である場合
には、この範囲で有効な音声調節方法である助詞の挿入
を行う。
【0050】以上説明したように、上記実施の形態によ
れば、要約のように情報量を減少させることなく、かつ
発話速度だけでない、口調としての音声の速度を自由に
調整することが可能になる。この結果、入力されたテキ
ストを変換した音声を生成する際に、音声速度を標準の
速度に対して大きく変化させた場合であっても、音声の
自然性を損なわず、かつ、入力されたテキストの意味が
正確にわかるようにすることができる。
【0051】さらに、複数のパラメータの調整を、速さ
調整という1次元の調整により行うため、使用者にとっ
て操作しやすい構成となる。
【0052】
【発明の効果】以上説明したように、本発明によれば、
入力されたテキストを変換した音声を生成する際に、音
声速度を標準の速度に対して大きく変化させた場合であ
っても、音声の自然性を損なわず、かつ、入力されたテ
キストの意味が正確にわかるようにできる。
【図面の簡単な説明】
【図1】本発明の一実施の形態にかかる音声合成装置の
機能ブロック図
【図2】上記実施の形態にかかる音声合成装置の動作を
示す流れ図
【図3】上記実施の形態にかかる音声合成装置の調整入
力部の一例と動作の模式図
【符号の説明】
1 音声合成装置 10 テキスト入力部 20 言語処理部 30 文体変換部 31 付属語変換部 32 略語変換部 33 複合語変換部 40 波形生成部 41 発話速度調整部 42 ポーズ頻度調整部 43 ポーズ長調整部 44 音声合成部 50 電気音響変換機 60 調整入力部 70 制御部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 使用者が音声に変換するためのテキスト
    を入力する入力手段と、使用者が音声の速さを段階的あ
    るいは連続的に調節する速さ調節手段と、使用者が入力
    した音声の速さが所定の範囲外にある場合に、前記テキ
    ストを同等の意味を持ちかつ異なる表現を持つテキスト
    に変換することで音声の単位時間あたりの情報量を調節
    する文体変換手段と、テキスト情報を音声に変換して出
    力する音声生成手段と、を具備したことを特徴とする音
    声合成装置。
  2. 【請求項2】 使用者が入力した音声の速さが所定の範
    囲内にある場合には、前記使用者が前記速さ調節手段よ
    り入力した音声の速さに応じて、出力する音声の単位時
    間あたりの音韻数を増減する発話速度調整手段、出力す
    る音声に含まれるポーズの時間長を伸縮するポーズ長調
    整手段、および出力する音声に含まれるポーズの頻度を
    増減するポーズ頻度調整手段のいずれか1つの手段を用
    いて音声の速さを調節し、使用者が入力した音声の速さ
    が所定の範囲外にある場合には前記発話速度調節手段、
    前記ポーズ長調整手段、および前記ポーズ頻度調整手段
    のいずれか1つの手段を用いて音声の速さを調節すると
    共に前記文体変換手段を用いて音声の速さを調整するこ
    とを特徴とする請求項1に記載の音声合成装置。
  3. 【請求項3】 前記文体変換手段は言語情報に基づき冗
    長語の追加または削除または変更を行うものであること
    を特徴とする請求項1または請求項2の音声合成装置。
  4. 【請求項4】 前記文体変換手段は言語情報に基づき略
    語を省略されていない表現に変更するまたは特定の単語
    あるいは単語列を略語に変更するものであることを特徴
    とする請求項1または請求項2の音声合成装置。
  5. 【請求項5】 前記文体変換手段は言語情報に基づき付
    属語を含む特定の単語列を付属語を含まない複合語に変
    更するまたは特定の複合語を付属語を含む単語列に変換
    するものであることを特徴とする請求項1または請求項
    2の音声合成装置。
  6. 【請求項6】 指定された音声の速さが所定の範囲外に
    ある場合に、音声に変換するためのテキストを同等の意
    味を持ちかつ異なる表現を持つテキストに変換すること
    で音声の単位時間あたりの情報量を調節する工程と、前
    記異なる表現を持つテキストを音声に変換して出力する
    工程と、を具備したことを特徴とする音声合成方法。
JP2001191713A 2001-06-25 2001-06-25 音声合成装置 Pending JP2003005774A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001191713A JP2003005774A (ja) 2001-06-25 2001-06-25 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001191713A JP2003005774A (ja) 2001-06-25 2001-06-25 音声合成装置

Publications (1)

Publication Number Publication Date
JP2003005774A true JP2003005774A (ja) 2003-01-08

Family

ID=19030294

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001191713A Pending JP2003005774A (ja) 2001-06-25 2001-06-25 音声合成装置

Country Status (1)

Country Link
JP (1) JP2003005774A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004109659A1 (ja) * 2003-06-05 2004-12-16 Kabushiki Kaisha Kenwood 音声合成装置、音声合成方法及びプログラム
KR101014462B1 (ko) * 2007-06-28 2011-02-14 후지쯔 가부시끼가이샤 음성 읽어내기를 위한 장치, 기록 매체 및 방법
KR20180059971A (ko) * 2016-11-28 2018-06-07 최명길 두족류 낚시용 인조미끼 어셈블리

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004109659A1 (ja) * 2003-06-05 2004-12-16 Kabushiki Kaisha Kenwood 音声合成装置、音声合成方法及びプログラム
EP1630791A1 (en) * 2003-06-05 2006-03-01 Kabushiki Kaisha Kenwood Speech synthesis device, speech synthesis method, and program
EP1630791A4 (en) * 2003-06-05 2008-05-28 Kenwood Corp SPEECH SYNTHESIS DEVICE, SPEECH SYNTHESIS METHOD, AND PROGRAM
US8214216B2 (en) 2003-06-05 2012-07-03 Kabushiki Kaisha Kenwood Speech synthesis for synthesizing missing parts
KR101014462B1 (ko) * 2007-06-28 2011-02-14 후지쯔 가부시끼가이샤 음성 읽어내기를 위한 장치, 기록 매체 및 방법
KR20180059971A (ko) * 2016-11-28 2018-06-07 최명길 두족류 낚시용 인조미끼 어셈블리

Similar Documents

Publication Publication Date Title
JP5198046B2 (ja) 音声処理装置及びそのプログラム
JP3384646B2 (ja) 音声合成装置及び読み上げ時間演算装置
JPH0632020B2 (ja) 音声合成方法および装置
JP3518898B2 (ja) 音声合成装置
JP2001242882A (ja) 音声合成方法及び音声合成装置
JP2003005774A (ja) 音声合成装置
JPH08335096A (ja) テキスト音声合成装置
JP3006240B2 (ja) 音声合成方法および装置
JP3113101B2 (ja) 音声合成装置
JPH07140996A (ja) 音声規則合成装置
JPH0580791A (ja) 音声規則合成装置および方法
JP3685648B2 (ja) 音声合成方法及び音声合成装置、並びに音声合成装置を備えた電話機
JP3575919B2 (ja) テキスト音声変換装置
JP2002304186A (ja) 音声合成装置、音声合成方法および音声合成プログラム
JPH0887289A (ja) 音声規則合成装置
JP2703253B2 (ja) 音声合成装置
JPH06214585A (ja) 音声合成装置
JPH11259094A (ja) 規則音声合成装置
JP2956936B2 (ja) 音声合成装置の発声速度制御回路
JPH11282494A (ja) 音声合成装置および記憶媒体
JP3292218B2 (ja) 音声メッセージ作成装置
JP3303428B2 (ja) 音声合成装置のアクセント成分基本テーブルの作成方法
JP3088211B2 (ja) 基本周波数パタン生成装置
JPH08211896A (ja) 音声合成編集方式および装置
JPH0635913A (ja) 文章読み上げ装置