JPH05260082A - テキスト読み上げ装置 - Google Patents

テキスト読み上げ装置

Info

Publication number
JPH05260082A
JPH05260082A JP4054985A JP5498592A JPH05260082A JP H05260082 A JPH05260082 A JP H05260082A JP 4054985 A JP4054985 A JP 4054985A JP 5498592 A JP5498592 A JP 5498592A JP H05260082 A JPH05260082 A JP H05260082A
Authority
JP
Japan
Prior art keywords
text
voice
unit
sender
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4054985A
Other languages
English (en)
Inventor
Yoshinori Shiga
芳則 志賀
Yoshiyuki Hara
義幸 原
Tsuneo Nitta
恒雄 新田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP4054985A priority Critical patent/JPH05260082A/ja
Publication of JPH05260082A publication Critical patent/JPH05260082A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

(57)【要約】 【目的】送信側から送られたテキストを受信側で受け取
り、そのテキストを音声の規則合成により合成音で読み
上げる際に、送信元に対応した声質での読み上げが行
え、受信側利用者は合成音声に飽きたり疲れたりするこ
となく,さらには読み上げの際の声質により送信者を判
断することもできるようにする。 【構成】入出力装置1で入力したテキストを送信者ID
と共に送信側メールシステム2を通じてメールとして送
信すると、そのメールはメッセージ通信システム4を介
して受信側メールシステム5に送られ、同システム5で
受け取られる。このメールの内容は入出力装置7で必要
なときに出力することができ、このとき、入出力装置7
から音声合成装置6に受信テキストと共に送信者IDが
渡されると、同合成装置6内の声質切替部10の声質切
替動作により、そのテキストが送信者IDに対応した声
質の合成音声で出力される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、電子メール等の通信シ
ステムの送信側から送られたテキストを受信側で受け取
り、その受け取ったテキストを音声の規則合成により合
成音で読み上げるテキスト読み上げ装置に関する。
【0002】
【従来の技術】音声の規則合成は、特定の人間が実際に
発声した音声を観測或いは分析することによって得られ
る音声パラメータを、子音+母音(CV)や母音+子音
+母音(VCV)、子音+母音+子音(CVC)等の単
位で音声素片として予め用意しておき、入力される音韻
系列に従ってこれら音声素片を補間接続し、こうして得
られた音韻パラメータと、他方で生成されたピッチパタ
ーンからなる韻律パラメータとを合成器に送って音声を
合成するものである。
【0003】したがって、このような音声の規則合成方
式を用いて、電子メール等の通信システムの受信側で受
け取ったテキストを読み上げる場合にも、従来は、読み
上げ装置に予め用意されている上記のような音声素片を
使って音声の合成を行っていた。
【0004】
【発明が解決しようとする課題】上記したように従来の
テキスト読み上げ装置では、装置に予め用意されている
音声素片だけを用いて、送信元等に無関係に音声の合成
を行っており、その合成音の声質は常に変わらなかっ
た。しかし、絶えず同じ声質でテキストが読み上げられ
ていると、合成音声に飽きる、聞くのに疲れるといった
問題があった。
【0005】そこで、本発明は、テキスト読み上げの際
の声質を、同テキストと共に送受信される送信元識別コ
ードに応じて自動的に切り替えることによって、受信側
システム利用者が合成音声に飽きたり疲れたりすること
がなく、さらには声質により送信者の判断も可能となる
ような、電子メール等の通信システムにおけるテキスト
読み上げ装置を提供することを第1の目的とする。
【0006】また、本発明は、送信側がテキストと共に
声質に関連するパラメータを送り、受信側でこの声質関
連パラメータを用いて音声を合成することで、送信者が
意図した声質でテキストの読み上げを行うことができ、
受信側システム利用者が合成音声に飽きたり疲れたりす
ることがなく、声質により送信者の判断も可能となるよ
うな、電子メール等の通信システムにおけるテキスト読
み上げ装置を提供することを第2の目的とする。
【0007】
【課題を解決するための手段】本発明は上記課題を解決
するために、通信系の送信側で少なくともテキストを通
信媒体に送り、受信側でそのテキストを受け取り、受け
取ったテキストを音声の規則合成により合成音で読み上
げるテキスト読み上げ装置において、受信側で受け取っ
たテキストを読み上げる合成音の声質を、このテキスト
と共に送信側から送られる送信元識別コードに応じて切
り替えるための声質切替手段を受信側に備えたことを第
1の特徴とする。
【0008】また本発明は、送信側から受信側にテキス
トを送る際に、音声の規則合成の際必要となるパラメー
タのうち少なくとも声質に関連するパラメータを併せて
送るテキスト・声質関連パラメータ送信手段を送信側に
備え、受信側では、このテキスト・声質関連パラメータ
送信手段から送られたパラメータを用いて規則合成によ
りテキストを読み上げるようにしたことを第2の特徴と
する。
【0009】
【作用】上記の構成によれば、送信側から送られたテキ
ストを受信側で受け取り、そのテキストを音声の規則合
成で読み上げる際に、絶えず同じ声質の合成音で読み上
げられるのではなく、読み上げる合成音の声質が、受信
側に設けられた声質切替手段により、送信側からテキス
トと共に送られる送信元識別コードに応じて切り替えら
れる。これにより、受信側システム利用者が合成音声に
飽きたり、疲れたりすることなく、さらには声質により
送信者を知ることもできるようになる。
【0010】また、上記の構成によれば、送信側のテキ
スト・声質関連パラメータ送信手段から受信側にテキス
トを送る際には、音声の規則合成の際必要となるパラメ
ータのうち少なくとも声質に関連するパラメータ(声質
関連パラメータ)がこのテキストと併せて送られる。受
信側では、送信側から送られたテキストを受け取り、そ
のテキストを読み上げる際には、このテキストと共に送
られた声質関連パラメータをもとに音声を規則合成す
る。
【0011】これにより、送信側システム利用者は自分
が意図した声質にて受信側でのテキスト読み上げを行わ
せることができる。また、受信側で合成される音声の声
質は送信者により異なるので、受信側システム利用者は
合成音声に飽きたり疲れたりすることなく、声質により
送信者を知ることもできる。
【0012】
【実施例】以下、図面を参照して本発明の実施例につき
説明する。 (第1実施例)図1は本発明のテキスト読み上げ装置を
適用する電子メールシステムの第1実施例を示すシステ
ム構成図である。
【0013】図1において、1,7はテキストの入出力
等を行う入出力装置、2,5は入出力装置1,7と接続
されたメールシステムである。メールシステム2,5は
メールの処理を司る。
【0014】4はメールシステム2,5間のメール転送
を司るメッセージ通信システム、3,6は入出力装置
1,7と接続されたテキスト読み上げのための音声合成
装置である。この音声合成装置3,6には、送信側から
テキストと共に送られた送信元を示す送信元識別コード
(以下、送信者IDと称する)に応じて、テキストを読
み上げる合成音の声質を切り替えるための声質切替部1
0が設けられている。
【0015】図2は図1における音声合成装置6(3)
のブロック構成図である。音声合成装置6(3)は、例
えば4つの音声素片記憶部11〜14を有している。音
声素片記憶部11には、母音へのわたりの途中までを含
む子音の音声パラメータからなる子音素片Cvと母音か
ら子音へ移るときの母音過渡部素片vcが記憶されてい
る。また、音声素片記憶部12〜14には、それぞれ声
質の異なる母音の音声パラメータからなる母音素片が記
憶されている。
【0016】音声合成装置6(3)はまた、音声素片記
憶部12〜14のうちの1つを選択する音声素片切替部
15と、送信者IDとこの送信者IDで示される送信者
に固有の母音素片が記憶されている音声素片記憶部に割
り当てられた番号(素片記憶部番号)との対応関係が記
述された送信者ID/素片記憶部番号対応テーブル16
と、素片切替制御部17とを有している。この素片切替
制御部17は、図1の入出力装置7(1)から渡される
送信側からの送信者IDをもとに送信者ID/素片記憶
部番号対応テーブル16を参照して対応する素片記憶部
番号を求め、その番号により音声素片切替部15を制御
する。音声素片切替部15、送信者ID/素片記憶部番
号対応テーブル16及び素片切替制御部17は、図1に
おける声質切替部10を構成する。
【0017】音声合成装置6(3)は更に、図1の入出
力装置7(1)から渡される送信側からのテキストの言
語解析に基づく音韻系列、アクセント情報の生成、各音
韻長の決定等を行う言語解析・音韻長決定部18と、言
語解析・音韻長決定部18で生成されたアクセント情報
と音韻長に基づく韻律パラメータの生成を行う韻律パラ
メータ生成部19と、音韻パラメータ生成部20と、合
成器フィルタ21とを有している。
【0018】音韻パラメータ生成部20は、言語解析・
音韻長決定部18で生成された音韻系列と音韻長に従
い、音声素片記憶部11に記憶されている音声素片及び
声素片切替部15によって選択された母音素片記憶部1
2〜14のうちの1つに記憶されている音声素片を用い
て音韻パラメータを生成する。また合成器フィルタ21
は、韻律パラメータ生成部19からの韻律パラメータと
音韻パラメータ生成部20からの音韻パラメータをもと
に、合成音声を生成する。
【0019】ここで、図1及び図2の構成の動作を、入
出力装置1及びメールシステム2側からメールを送信
し、メールシステム5及び入出力装置7側で受けて、音
声合成装置6にてテキスト読み上げを行う場合を例に説
明する。
【0020】まず入出力装置1で入力したテキストを送
信側メールシステム2を通じてメールとして送信する
と、そのメールはメッセージ通信システム4を介して受
信側メールシステム5に送られる。送信の際、メールは
その中にテキスト(テキスト情報)と共に送信元を示す
識別コードである送信者IDを持って送り出される。
【0021】受信側メールシステム5に送られたメール
は、同システム5で受け取られる。このシステム5が受
け取ったメールの内容は入出力装置7で必要なときに出
力することができる。図1の構成では、このとき、入出
力装置7から音声合成装置6に受信テキストと共に送信
者IDを渡すことで、同合成装置6内の声質切替部10
の声質切替動作により、そのテキストを送信者IDに対
応した声質の合成音声で出力することができる。
【0022】この音声合成装置6での音声合成処理につ
いて以下に説明する。まず、音声素片記憶部11及び音
声素片記憶部12〜14に記憶される音声素片の作成方
法について詳述する。
【0023】音声素片の作成にあたっては、まず、発声
リストに従ってアナウンサ等が発声した音声データを用
意する。そして、この音声データに20msec程度の
一定時間長の時間窓を掛け、10msec程度の一定時
間シフトをしながら各窓内でケプストラム分析を行う。
【0024】次に、各フレームのパワースペクトラムや
音声パワーを見ながら、素片として切り出したいフレー
ム範囲に対応するケプストラムパラメータを抜き出し、
音声素片とする。図3(a)は、音声データの1つの音
韻からCv,vc素片を切り出している例を示す。この
ように過渡区間に関しては、比較的広い範囲で(フレー
ム数を多く)切り出しを行う。Cv,vc素片は上述し
たように音声素片記憶部11に記憶される。
【0025】一方、定常区間である母音部は1フレーム
分のケプストラムパラメータのみ切り出す。ここでは、
3名の発声者の音声データ中の各母音(日本語の場合、
/a/,/i/,/u/,/e/,/o/ )から前記のようにケプストラム
パラメータの切り出しを行い、それぞれ音声素片記憶部
12〜14に記憶させる。具体的には、音声素片記憶部
12,13には、送信者となる得る特定の2名が発声し
た音声から作成された音声素片(母音素片)が記憶さ
れ、音声素片記憶部14には、アナウンサが発声した音
声から作成された音声素片(母音素片)が記憶される。
【0026】上記特定の2名と対応する音声素片記憶部
12,13との関係を示す情報は、この2名の発声者に
固有の送信者ID(例えば送信者ID#1,#2とす
る)と対応する音声素片記憶部12,13に割り当てら
れた番号との対の形で、送信者ID/素片記憶部番号対
応テーブル16に登録される。
【0027】さて、図2に戻って、図1の入出力装置7
から音声合成装置6に渡されたメール中のテキストは、
この音声合成装置6内の言語解析・音韻長決定部18に
導かれる。言語解析・音韻長決定部18は、このテキス
トを対象として言語解析を行い、音韻系列、アクセント
情報を生成し、それに各音韻長を決定する。
【0028】また、図1の入出力装置7から音声合成装
置6に渡されたメール中の送信者IDは、この音声合成
装置6に設けられた声質切替部10内の素片切替制御部
17に導かれる。素片切替制御部17は、この送信者I
Dをもとに送信者ID/素片記憶部番号対応テーブル1
6を参照し、この送信者IDと対をなして登録されてい
る素片記憶部番号を求める。
【0029】この結果、送信者IDがID#1であれ
ば、音声素片記憶部12を示す素片記憶部番号が求めら
れ、ID#2であれば、音声素片記憶部13を示す素片
記憶部番号が求められる。素片切替制御部17は、求め
た素片記憶部番号を素片切替制御部17に与える。
【0030】これに対し、送信者IDがID#1または
ID#2以外の場合、即ち入出力装置7から渡された送
信者IDが送信者ID/素片記憶部番号対応テーブル1
6に登録されていない場合には、素片切替制御部17
は、同制御部17内に予め用意されている音声素片記憶
部14を示す素片記憶部番号を素片切替制御部17に与
える。
【0031】音声素片切替部15は、素片切替制御部1
7から与えられる素片記憶部番号をもとに、同番号の指
定する音声素片記憶部12〜14のうちの1つを選択し
て、音韻パラメータ生成部20に切替接続する。これに
より、入出力装置7から渡された送信者IDがID#1
であれば音声素片記憶部12が、ID#2であれば音声
素片記憶部13が、それ以外であれば音声素片記憶部1
4が、音韻パラメータ生成部20に接続されることにな
る。
【0032】さて、言語解析・音韻長決定部18での言
語解析によって生成されたアクセント情報は音韻長と共
に韻律パラメータ生成部19に渡され、音韻系列(読み
に関する情報)は音韻長と共に音韻パラメータ生成部2
0に渡される。
【0033】韻律パラメータ生成部19は、言語解析・
音韻長決定部18から渡されたアクセント情報と音韻
長、さらには自身が保持する送信者に無関係の基本ピッ
チ(例えば、音声素片記憶部14に記憶されている母音
素片のもととなった音声の発声者の基本ピッチ)に応じ
てピッチパターンからなる韻律パラメータを生成する。
【0034】一方、音韻パラメータ生成部20は、言語
解析・音韻長決定部18から渡された音韻系列(読みの
音韻系列)をもとに、必要な音声素片を、母音素片につ
いては音声素片切替部15によって切替接続されている
音声素片記憶部12〜14のうちの1つから、子音素片
(ここでは、Cv素片及びvc素片)については音声素
片記憶部11から、それぞれ読み出し、これらを言語解
析・音韻長決定部18から渡された各音韻長に従って補
間接続して音韻パラメータを生成する。
【0035】したがって、入出力装置7から渡された送
信者IDがID#1であれば音声素片記憶部11及び
(そのID#1の送信者が発声した音声より作成された
母音素片が記憶されている)音声素片記憶部12から、
ID#2であれば音声素片記憶部11及び(そのID#
2の送信者が発声した音声より作成された母音素片が記
憶されている)音声素片記憶部13から、それ以外であ
れば音声素片記憶部11及び(アナウンサ発声の音声よ
り作成された母音素片が記憶されている)音声素片記憶
部14から、それぞれ必要な音声素片が読み出され、音
韻パラメータの生成に用いられる。
【0036】ここで、音韻パラメータ生成部20による
音韻パラメータ生成のための素片間の接続は、図3
(b)に示すように行われる。即ち、フレームの繰り返
し区間と補間区間を挿入・調節して、言語解析・音韻長
決定部18で決定された各音韻長に合わせながら素片間
が接続されていく。ここでは、補間方法としてケプスト
ラムパラメータ各次数の線形補間を用いている。
【0037】音韻パラメータ生成部20によって生成さ
れた音韻パラメータは合成器フィルタ21に供給され
る。この合成器フィルタ21には、韻律パラメータ生成
部19によって生成された韻律パラメータも供給され
る。合成器フィルタ21は、例えばLMAフィルタ(対
数振幅特性近似フィルタ)であり、韻律パラメータ生成
部19からの韻律パラメータをもとに音源パルスを生成
し、音韻パラメータ生成部20からの音韻パラメータを
フィルタ係数として合成音声を作り出す。
【0038】このようにして合成された音声は、母音部
分だけが、選択された母音素片(即ち、声質切替部10
内の音声素片切替部15によって音韻パラメータ生成部
20に切替接続された音声素片記憶部12〜14のうち
の1つより読み出した母音素片)から得られる声質とな
る。ところが、母音部は音声の声質に最も影響を与える
部分である。
【0039】したがって、送信者IDがID#1または
ID#2の特定の送信者から送られたメール(中のテキ
スト)を読み上げる場合には、母音部以外に、送信者に
無関係の者(アナウンサ)が発声した音声から作成され
た音声素片(が記憶された音声素片記憶部11の情報)
を共通に用いていても、その送信者の声質で読み上げを
行うことができる。即ち本実施例によれば、母音部以外
については、送信者IDがID#1またはID#2の特
定の送信者が発声した音声から作成された音声素片(が
記憶される音声素片記憶部)を用意していなくても、そ
の特定の送信者の声質で読み上げを行うことができる。
【0040】これに対し、メールがID#1またはID
#2以外の送信者IDの送信者からのものであれば、上
記したようにアナウンサ発声の音声から作成された音声
素片が記憶された音声素片記憶部11及び音声素片記憶
部14が用いられ、一定の声質での読み上げが行われ
る。
【0041】なお、上記第1実施例で述べた音声合成装
置6(3)における声質切り替えのための手段は同実施
例に限定されるものではなく、例えば、合成音声の高品
質化のために、音声素片記憶部11〜14内の各音声素
片と同時に、音源残差信号を保持しておき、合成の際こ
れを合成器フィルタ21に渡すようにしてもよい。
【0042】また、上記第1実施例では、韻律パラメー
タ生成部19での韻律パラメータ生成に、送信者に無関
係の基本ピッチを用いているが、これに限るものではな
い。例えば、音声素片記憶部12〜14に記憶されてい
る母音素片のもととなった音声の3名の発声者の基本ピ
ッチ(がそれぞれ記憶される3つの基本ピッチ記憶部)
を用意し、音声素片切替部15によって選択された音声
素片記憶部に対応する基本ピッチを用いるようにしても
よい。このようにした場合、合成音声の声質が、母音素
片のもととなった音声の発声者の声質により近くなる。
【0043】(第2実施例)次に、本発明の第2実施例
について説明する。図4は本発明のテキスト読み上げ装
置を適用する電子メールシステムの第2実施例を示すシ
ステム構成図であり、図1と同一部分には同一符号を付
して説明を省略する。
【0044】図4において、41,47はテキストの入
出力等を行う入出力装置である。この入出力装置41,
47が図1の入出力装置1,7と異なるのは、テキスト
を送る際に、音声の規則合成の際必要となるパラメータ
のうち少なくとも声質に関連するパラメータ、例えばそ
の送信者に固有の母音素片、基本ピッチ及び各母音の残
差信号(音源残差信号)を併せて送るテキスト・声質関
連パラメータ送出部50を有している点である。43,
46は入出力装置41,47と接続された音声合成装置
である。この音声合成装置43,46は、送信側から送
られたテキストを、同テキストと共に送られた声質関連
パラメータを用いて規則合成により読み上げる。
【0045】図5は図4における音声合成装置46(4
3)のブロック構成図である。音声合成装置46(4
3)は、図1の入出力装置47(41)から渡される送
信側からの基本ピッチを記憶するための基本ピッチ記憶
部51と、同じく母音素片を記憶するための外部音声素
片記憶部52と、同じく各母音の音源残差信号を記憶す
るための音源残差記憶部53と、前記第1実施例で述べ
た子音素片Cvと母音過渡部素片vcが記憶されている
(図2の音声素片記憶部11に相当する)音声素片記憶
部54と、制御部55とを有している。制御部55は、
上記記憶部51〜53に対する情報記憶を制御する。
【0046】音声合成装置46(43)はまた、入出力
装置47(41)から渡される送信側からのテキストの
言語解析に基づく音韻系列、アクセント情報の生成、各
音韻長の決定等を行う言語解析・音韻長決定部58と、
言語解析・音韻長決定部58で生成されたアクセント情
報及び音韻長と基本ピッチ記憶部51に記憶された基本
ピッチに基づく韻律パラメータの生成を行う韻律パラメ
ータ生成部59と、音韻パラメータ生成部60と、合成
器フィルタ61とを有している。音韻パラメータ生成部
60は、言語解析・音韻長決定部58で生成された音韻
系列及び音韻長に従い、外部音声素片記憶部52及び音
声素片記憶部54に記憶されている音声素片を用いて音
韻パラメータを生成する。また合成器フィルタ61は例
えばLMAフィルタであり、韻律パラメータ生成部59
からの韻律パラメータ、音韻パラメータ生成部60から
の音韻パラメータ及び音源残差記憶部53からの音源残
差信号をもとに、合成音声を生成する。
【0047】ここで、図4及び図5の構成の動作を、入
出力装置41及びメールシステム2側からメールを送信
し、メールシステム5及び入出力装置47側で受けて、
音声合成装置46にてテキスト読み上げを行う場合を例
に説明する。
【0048】まず入出力装置41で入力したテキストを
送信する際には、同装置41内のテキスト・声質関連パ
ラメータ送出部50により、同テキストと共に、同テキ
ストの送信者に固有の声質関連パラメータ、例えばその
送信者の発声した音声により作成された母音素片、送信
者の声の基本ピッチ及び各母音の残差信号(音源残差信
号)を含む情報が併せてメールシステム2に送出され
る。
【0049】テキスト・声質関連パラメータ送出部50
から送出されたテキスト及び声質関連パラメータ(母音
素片、基本ピッチ及び各母音の音源残差信号)を含む情
報は、送信側メールシステム2を通じてメールとして送
信され、メッセージ通信システム4を介して受信側メー
ルシステム5に送られる。
【0050】受信側メールシステム5に送られたメール
は、同システム5で受け取られる。このシステム5が受
け取ったメールの内容は入出力装置47で必要なときに
出力することができる。図4の構成では、このとき、入
出力装置47から音声合成装置46に対し、受信したテ
キストと共に受信した声質関連パラメータ(母音素片、
基本ピッチ及び各母音の音源残差信号)を渡すことで、
同合成装置46により、そのテキストを送信者に対応し
た声質の合成音声で出力することができる。
【0051】この音声合成装置46での音声合成処理に
ついて以下に説明する。まず、図4の入出力装置47か
ら音声合成装置46に渡されたメール中の声質関連パラ
メータ(母音素片、基本ピッチ及び各母音の音源残差信
号)は、この音声合成装置46に設けられた図5に示す
制御部55に導かれる。制御部55は、入出力装置47
から渡された(送信者に固有の)声質関連パラメータの
うち、母音素片は外部音声素片記憶部52に、基本ピッ
チは基本ピッチ記憶部51に、各母音の音源残差信号は
音源残差記憶部53に、それぞれ格納する。
【0052】また、図4の入出力装置47から音声合成
装置46に渡されたメール中のテキストは、この音声合
成装置46に設けられた図5に示す言語解析・音韻長決
定部58に導かれる。言語解析・音韻長決定部58は、
このテキストを対象として言語解析を行い、音韻系列、
アクセント情報及び各音韻長を求める。言語解析・音韻
長決定部58で求められたアクセント情報は音韻長と共
に韻律パラメータ生成部59に渡され、音韻系列は音韻
長と共に音韻パラメータ生成部60に渡される。
【0053】韻律パラメータ生成部59は、言語解析・
音韻長決定部58から渡されたアクセント情報及び音韻
長と、基本ピッチ記憶部51に記憶されている送信者に
固有の基本ピッチに応じてピッチパターンからなる韻律
パラメータを生成する。
【0054】一方、音韻パラメータ生成部60は、言語
解析・音韻長決定部58から渡された音韻系列(読みの
音韻系列)に従い、必要な音声素片を、母音素片につい
ては外部音声素片記憶部52から、子音素片(ここで
は、Cv素片及びvc素片)については音声素片記憶部
54から、それぞれ読み出し、これらを言語解析・音韻
長決定部58から渡された各音韻長に従って補間接続し
て音韻パラメータを生成する。この素片間の接続は、前
記第1実施例で図3(b)を参照して説明したように行
われる。
【0055】音韻パラメータ生成部60によって生成さ
れた音韻パラメータは合成器フィルタ61に供給され
る。この合成器フィルタ61には、韻律パラメータ生成
部59によって生成された韻律パラメータも供給され
る。合成器フィルタ61は、韻律パラメータ生成部59
からの韻律パラメータと音源残差記憶部53に記憶され
ている各母音の音源残差信号ををもとにフィルタ音源信
号を生成し、音韻パラメータ生成部60からの音韻パラ
メータをフィルタ係数として合成音声を作り出す。
【0056】このように本実施例(第2実施例)によれ
ば、音声の声質に最も影響の大きい母音部音声は、送信
側から送られて外部音声素片記憶部52に記憶された母
音素片、即ち送信者自身の音声データから作成された母
音素片をもとに作られる。したがって、母音部以外に
は、送信者に無関係の者(アナウンサ)が発声した音声
から作成された音声素片(が記憶された音声素片記憶部
54の情報)を共通に用いていても、受信側ではメール
送信者の声質で音声を合成することができる。
【0057】なお、上記第2実施例では、声質関連パラ
メータとして、母音素片、基本ピッチ及び音源残差信号
の3種を用いているが、例えば母音素片の1種のみ或い
は母音素片を含む2種のみを用いてもよく、さらに発声
速度などの別のパラメータを加えても構わない。
【0058】以上、本発明の第1及び第2実施例につい
て説明したが、本発明はこれらの実施例に限定されるも
のではない。例えば、合成パラメータの種類や音声素片
接続方法についても限定はなく、ケプストラムパラメー
タ以外でもLPC(Linear Predictive Coding)等他の
合成パラメータを使用しても構わない。要するに本発明
はその要旨を逸脱しない範囲で種々変形して実施するこ
とができる。
【0059】
【発明の効果】以上詳述したように、本発明のテキスト
読み上げ装置によれば、受信側でテキストを受け取り合
成音で読み上げる際、テキストと共に送られてくる送信
元識別コードによって、読み上げる合成音の声質を切り
替える構成としたので、受信側となっている利用者が合
成音声に飽きたり、疲れたりすることなく、さらには声
質により送信者を判断することもできるようになる。
【0060】また、本発明によれば、送信側から受信側
にテキストを送る際に、音声の規則合成の際必要となる
声質に関わるパラメータを併せて送り、受信側ではその
パラメータを規則合成の際に用いる構成としたので、送
信元が意図した声質でテキストの読み上げを行うことが
でき、テキストの送信者によって読み上げの声質が異な
り、受信側利用者は合成音声に飽きたり疲れたりするこ
となく、さらには声質により送信者を判断することもで
きる。
【図面の簡単な説明】
【図1】本発明のテキスト読み上げ装置を適用する電子
メールシステムの第1実施例を示すシステム構成図。
【図2】図1における音声合成装置6(3)の構成を示
すブロック図。
【図3】音声素片の切り出しと音声素片接続を説明する
ための図。
【図4】本発明のテキスト読み上げ装置を適用する電子
メールシステムの第2実施例を示すシステム構成図。
【図5】図4における音声合成装置46(43)の構成
を示すブロック図。
【符号の説明】
1,7,41,47…入出力装置、2,5…メールシス
テム、3,6,43,46…音声合成装置、4…メッセ
ージ通信システム、10…声質切替部、11〜14,5
4…音声素片記憶部、15…音声素片切替部、16…送
信者ID/素片記憶部番号対応テーブル、17…素片切
替制御部、18,58…言語解析・音韻長決定部、1
9,59…韻律パラメータ生成部、20,60…音韻パ
ラメータ生成部、21,61…合成器フィルタ、50…
テキスト・声質関連パラメータ送出部、51…基本ピッ
チ記憶部、52…外部音声素片記憶部、53…音源残差
記憶部。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.5 識別記号 庁内整理番号 FI 技術表示箇所 G10L 5/04 F 8946−5H

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 通信系の送信側で少なくともテキストと
    送信元識別コードを通信媒体に送り、受信側でそのテキ
    ストと送信元識別コードを受け取り、受け取ったテキス
    トを音声の規則合成により合成音で読み上げるテキスト
    読み上げ装置において、 前記読み上げる合成音の声質を前記受け取った送信元識
    別コードに応じて切り替えるための声質切替手段を備え
    たことを特徴とするテキスト読み上げ装置。
  2. 【請求項2】 通信系の送信側で少なくともテキストを
    通信媒体に送り、受信側でそのテキストを受け取り、受
    け取ったテキストを音声の規則合成により合成音で読み
    上げるテキスト読み上げ装置において、 送信側から受信側に前記テキストを送る際に、音声の規
    則合成の際必要となるパラメータのうち少なくとも声質
    に関連するパラメータを併せて送るテキスト・声質関連
    パラメータ送信手段を備え、 受信側では、前記テキスト・声質関連パラメータ送信手
    段から送られた前記パラメータを用いて規則合成により
    前記テキストを読み上げることを特徴とするテキスト読
    み上げ装置。
JP4054985A 1992-03-13 1992-03-13 テキスト読み上げ装置 Pending JPH05260082A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4054985A JPH05260082A (ja) 1992-03-13 1992-03-13 テキスト読み上げ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4054985A JPH05260082A (ja) 1992-03-13 1992-03-13 テキスト読み上げ装置

Publications (1)

Publication Number Publication Date
JPH05260082A true JPH05260082A (ja) 1993-10-08

Family

ID=12985948

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4054985A Pending JPH05260082A (ja) 1992-03-13 1992-03-13 テキスト読み上げ装置

Country Status (1)

Country Link
JP (1) JPH05260082A (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR960042519A (ko) * 1995-05-29 1996-12-21 다까노 야스아끼 음성 합성 장치
JPH10260815A (ja) * 1997-03-18 1998-09-29 Toshiba Corp 音声合成方法
EP0901000A2 (en) * 1997-07-31 1999-03-10 Toyota Jidosha Kabushiki Kaisha Message processing system and method for processing messages
US6289085B1 (en) 1997-07-10 2001-09-11 International Business Machines Corporation Voice mail system, voice synthesizing device and method therefor
EP1248251A2 (de) * 2001-04-06 2002-10-09 Siemens Aktiengesellschaft Verfahren und System zur automatischen Umsetzung von Textnachrichten in Sprachnachrichten
JP2002297501A (ja) * 2001-03-30 2002-10-11 Fujitsu Ten Ltd 通信端末
GB2399728A (en) * 2003-02-12 2004-09-22 Bosch Gmbh Robert Voice synthesis of received information with a profile determined by the sender
JP2006337432A (ja) * 2005-05-31 2006-12-14 Kenwood Corp 複数のキャラクタによる音声案内を行う音声合成装置、そのプログラム及びこのプログラムが記録された情報記録媒体
US7379873B2 (en) 2002-07-08 2008-05-27 Yamaha Corporation Singing voice synthesizing apparatus, singing voice synthesizing method and program for synthesizing singing voice
JP2013504947A (ja) * 2009-09-14 2013-02-07 ティヴォ インク 多機能マルチメディア装置
US9026445B2 (en) 2005-10-03 2015-05-05 Nuance Communications, Inc. Text-to-speech user's voice cooperative server for instant messaging clients
US9781377B2 (en) 2009-12-04 2017-10-03 Tivo Solutions Inc. Recording and playback system based on multimedia content fingerprints

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR960042519A (ko) * 1995-05-29 1996-12-21 다까노 야스아끼 음성 합성 장치
JPH10260815A (ja) * 1997-03-18 1998-09-29 Toshiba Corp 音声合成方法
US6289085B1 (en) 1997-07-10 2001-09-11 International Business Machines Corporation Voice mail system, voice synthesizing device and method therefor
EP0901000A2 (en) * 1997-07-31 1999-03-10 Toyota Jidosha Kabushiki Kaisha Message processing system and method for processing messages
EP0901000A3 (en) * 1997-07-31 2000-06-28 Toyota Jidosha Kabushiki Kaisha Message processing system and method for processing messages
US6625257B1 (en) 1997-07-31 2003-09-23 Toyota Jidosha Kabushiki Kaisha Message processing system, method for processing messages and computer readable medium
JP2002297501A (ja) * 2001-03-30 2002-10-11 Fujitsu Ten Ltd 通信端末
EP1248251A2 (de) * 2001-04-06 2002-10-09 Siemens Aktiengesellschaft Verfahren und System zur automatischen Umsetzung von Textnachrichten in Sprachnachrichten
EP1248251A3 (de) * 2001-04-06 2009-10-07 Siemens Aktiengesellschaft Verfahren und System zur automatischen Umsetzung von Textnachrichten in Sprachnachrichten
US7379873B2 (en) 2002-07-08 2008-05-27 Yamaha Corporation Singing voice synthesizing apparatus, singing voice synthesizing method and program for synthesizing singing voice
GB2399728A (en) * 2003-02-12 2004-09-22 Bosch Gmbh Robert Voice synthesis of received information with a profile determined by the sender
JP2006337432A (ja) * 2005-05-31 2006-12-14 Kenwood Corp 複数のキャラクタによる音声案内を行う音声合成装置、そのプログラム及びこのプログラムが記録された情報記録媒体
US9026445B2 (en) 2005-10-03 2015-05-05 Nuance Communications, Inc. Text-to-speech user's voice cooperative server for instant messaging clients
JP2013504947A (ja) * 2009-09-14 2013-02-07 ティヴォ インク 多機能マルチメディア装置
US9648380B2 (en) 2009-09-14 2017-05-09 Tivo Solutions Inc. Multimedia device recording notification system
US10097880B2 (en) 2009-09-14 2018-10-09 Tivo Solutions Inc. Multifunction multimedia device
US10805670B2 (en) 2009-09-14 2020-10-13 Tivo Solutions, Inc. Multifunction multimedia device
US11653053B2 (en) 2009-09-14 2023-05-16 Tivo Solutions Inc. Multifunction multimedia device
US9781377B2 (en) 2009-12-04 2017-10-03 Tivo Solutions Inc. Recording and playback system based on multimedia content fingerprints

Similar Documents

Publication Publication Date Title
US6405169B1 (en) Speech synthesis apparatus
US4624012A (en) Method and apparatus for converting voice characteristics of synthesized speech
US7233901B2 (en) Synthesis-based pre-selection of suitable units for concatenative speech
JPH05260082A (ja) テキスト読み上げ装置
EP0239394B1 (en) Speech synthesis system
JPH1091189A (ja) 発声速度変換装置
US20020072909A1 (en) Method and apparatus for producing natural sounding pitch contours in a speech synthesizer
JPH08335096A (ja) テキスト音声合成装置
JP3437064B2 (ja) 音声合成装置
JP3083624B2 (ja) 音声規則合成装置
JPS6223888B2 (ja)
EP1543497A1 (en) Method of synthesis for a steady sound signal
JP2004185055A (ja) 電子メールシステム及び通信端末
JP3575919B2 (ja) テキスト音声変換装置
JPH10124082A (ja) 歌声合成装置
JP3113101B2 (ja) 音声合成装置
JPH09179576A (ja) 音声合成方法
JPH05224688A (ja) テキスト音声合成装置
JP2577372B2 (ja) 音声合成装置および方法
JP2573586B2 (ja) 規則型音声合成装置
JP2956936B2 (ja) 音声合成装置の発声速度制御回路
JP2910587B2 (ja) 音声合成装置
JPH11282484A (ja) 音声合成装置
JP2624708B2 (ja) 音声合成装置
JPH04243299A (ja) 音声出力装置