JP2002023778A - 音声合成装置、音声合成システム、音声合成方法及び記憶媒体 - Google Patents

音声合成装置、音声合成システム、音声合成方法及び記憶媒体

Info

Publication number
JP2002023778A
JP2002023778A JP2000199929A JP2000199929A JP2002023778A JP 2002023778 A JP2002023778 A JP 2002023778A JP 2000199929 A JP2000199929 A JP 2000199929A JP 2000199929 A JP2000199929 A JP 2000199929A JP 2002023778 A JP2002023778 A JP 2002023778A
Authority
JP
Japan
Prior art keywords
text data
voice
speech
importance
priority
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000199929A
Other languages
English (en)
Inventor
Hiroyuki Kimura
裕行 木村
Hironori Goto
裕典 後藤
Tomoyuki Isonuma
伴幸 磯沼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2000199929A priority Critical patent/JP2002023778A/ja
Priority to US09/891,389 priority patent/US7031924B2/en
Publication of JP2002023778A publication Critical patent/JP2002023778A/ja
Priority to US11/357,021 priority patent/US20060143012A1/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 複数のテキストデータが同時に発声された場
合でも、重要度に応じて大きな音声で聞くことができる
ようにした音声合成装置、音声合成システム、音声合成
方法及び記憶媒体を提供する。 【解決手段】 テキストデータの音声波形を生成し、複
数のテキストデータの音声出力の重なり合いを検知する
音声波形生成部209と、各テキストデータの重要度パ
ラメータに基づき音量の割合を設定し、重なり合いが検
知された各々のテキストデータから生成された音声波形
を異なる音量で音声合成し出力する音声出力部210と
を備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声合成装置、音
声合成システム、音声合成方法及び記憶媒体に関し、特
に、テキストデータを合成音声に変換して出力する場合
に好適な音声合成装置、音声合成システム、音声合成方
法及び記憶媒体に関する。
【0002】
【従来の技術】従来、文字情報を音声出力する機能を有
する音声合成装置がある。従来の音声合成装置におい
て、音声出力するデータは、予め電子化されたテキスト
データとして準備されたものでなければならなかった。
即ち、そのテキストデータは、パーソナルコンピュータ
上におけるエディタやワードプロセッサなどで作成した
文章や、インターネット上のHTML(HyperText Mark
up Language)文章である。
【0003】また、音声合成装置から上記のようなテキ
ストデータを音声で出力する場合、殆どの場合が、1入
力からのテキストデータを、音声合成装置に予め設定さ
れている1種類の音声で出力していた。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の音声合成装置においては、同時に複数のテキストデ
ータの入力を受け付け、更にそれらの合成音声出力を重
ね合わせて出力し、それらを聞き分けられるように出力
することはできないという問題があった。
【0005】本発明は、上述した点に鑑みなされたもの
であり、複数のテキストデータが同時に発声された場合
でも、重要度に応じて大きな音声で聞くことができるよ
うにした音声合成装置、音声合成システム、音声合成方
法及び記憶媒体を提供することを目的とする。
【0006】
【課題を解決するための手段】上記目的を達成するた
め、請求項1記載の発明は、テキストデータを合成音声
に変換して出力する音声合成装置であって、前記テキス
トデータの音声波形を生成する音声波形生成手段と、複
数の前記テキストデータの音声出力の重なり合いを検知
する重なり合い検知手段と、前記重なり合いが検知され
た各々の前記テキストデータから生成された音声波形を
異なる音量で音声合成し出力する音声出力手段とを有す
ることを特徴とする。
【0007】上記目的を達成するため、請求項2記載の
発明は、前記音声出力手段は前記複数のテキストデータ
の優先度に基づいて前記複数のテキストデータに係る合
成音声の音量を決定することを特徴とする。
【0008】上記目的を達成するため、請求項3記載の
発明は、前記複数のテキストデータの重要度を設定する
重要度設定手段を備えたことを特徴とする。
【0009】上記目的を達成するため、請求項4記載の
発明は、前記重要度は、予め設定された複数のレベルか
ら所望レベルを選択可能であることを特徴とする。
【0010】上記目的を達成するため、請求項5記載の
発明は、表示手段と、前記重なり合い検知手段の出力に
応答して前記重要度を設定するための設定画面を表示す
るよう前記表示手段を制御する表示制御手段とを備える
ことを特徴とする。
【0011】上記目的を達成するため、請求項6記載の
発明は、前記複数のテキストデータと前記複数のテキス
トデータの優先度を示す優先度データとを装置外部より
受信する受信手段を備えたことを特徴とする。
【0012】上記目的を達成するため、請求項7記載の
発明は、前記音声出力手段は、二つの音声が重なる場
合、一方の音声の音量の割合をa/(a+b)とし、他
方の音量の割合をb/(a+b)とする(a:一方の音
声の重要度に係るパラメータ、b:他方の音声の重要度
に係るパラメータ)ことを特徴とする。
【0013】上記目的を達成するため、請求項8記載の
発明は、前記音声出力手段は、三つ以上の音声が重なる
場合、それぞれの出力の音声の音量の割合を、当該音声
の重要度に係る重要度パラメータの値を重なって出力さ
れる全ての音声の重要度パラメータの総和で割った値と
することを特徴とする。
【0014】上記目的を達成するため、請求項9記載の
発明は、前記音声出力手段は、特に重要度が高いテキス
トデータに対しては特に大きな音量を割り振る設定が可
能であることを特徴とする。
【0015】上記目的を達成するため、請求項10記載
の発明は、テキストデータを合成音声に変換して出力す
る音声合成装置と、該音声合成装置に前記テキストデー
タを送信する情報処理装置とを具備してなる音声合成シ
ステムであって、前記音声合成装置は、前記情報処理装
置から送信された前記テキストデータの音声波形を生成
する音声波形生成手段と、複数の前記テキストデータの
音声出力の重なり合いを検知する重なり合い検知手段
と、前記重なり合いが検知された各々の前記テキストデ
ータから生成された音声波形を異なる音量で音声合成し
出力する音声出力手段とを有することを特徴とする。
【0016】上記目的を達成するため、請求項11記載
の発明は、前記音声合成装置の前記音声出力手段は前記
複数のテキストデータの優先度に基づいて前記複数のテ
キストデータに係る合成音声の音量を決定することを特
徴とする。
【0017】上記目的を達成するため、請求項12記載
の発明は、前記音声合成装置は、前記複数のテキストデ
ータの重要度を設定する重要度設定手段を備えたことを
特徴とする。
【0018】上記目的を達成するため、請求項13記載
の発明は、前記重要度は、予め設定された複数のレベル
から所望レベルを選択可能であることを特徴とする。
【0019】上記目的を達成するため、請求項14記載
の発明は、前記音声合成装置は、表示手段と、前記重な
り合い検知手段の出力に応答して前記重要度を設定する
ための設定画面を表示するよう前記表示手段を制御する
表示制御手段とを備えることを特徴とする。
【0020】上記目的を達成するため、請求項15記載
の発明は、前記音声合成装置は、前記複数のテキストデ
ータと前記複数のテキストデータの優先度を示す優先度
データとを装置外部より受信する受信手段を備えたこと
を特徴とする。
【0021】上記目的を達成するため、請求項16記載
の発明は、前記音声合成装置の前記音声出力手段は、二
つの音声が重なる場合、一方の音声の音量の割合をa/
(a+b)とし、他方の音量の割合をb/(a+b)と
する(a:一方の音声の重要度に係るパラメータ、b:
他方の音声の重要度に係るパラメータ)ことを特徴とす
る。
【0022】上記目的を達成するため、請求項17記載
の発明は、前記音声合成装置の前記音声出力手段は、三
つ以上の音声が重なる場合、それぞれの出力の音声の音
量の割合を、当該音声の重要度に係る重要度パラメータ
の値を重なって出力される全ての音声の重要度パラメー
タの総和で割った値とすることを特徴とする。
【0023】上記目的を達成するため、請求項18記載
の発明は、前記音声合成装置の前記音声出力手段は、特
に重要度が高いテキストデータに対しては特に大きな音
量を割り振る設定が可能であることを特徴とする。
【0024】上記目的を達成するため、請求項19記載
の発明は、テキストデータを合成音声に変換して出力す
る音声合成装置に適用される音声合成方法であって、前
記テキストデータの音声波形を生成する音声波形生成工
程と、複数の前記テキストデータの音声出力の重なり合
いを検知する重なり合い検知工程、前記重なり合いが検
知された各々の前記テキストデータから生成された音声
波形を異なる音量で音声合成し出力する音声出力工程と
を有することを特徴とする。
【0025】上記目的を達成するため、請求項20記載
の発明は、前記音声出力工程では前記複数のテキストデ
ータの優先度に基づいて前記複数のテキストデータに係
る合成音声の音量を決定することを特徴とする。
【0026】上記目的を達成するため、請求項21記載
の発明は、前記複数のテキストデータの重要度を設定す
る重要度設定工程を備えたことを特徴とする。
【0027】上記目的を達成するため、請求項22記載
の発明は、前記重要度は、予め設定された複数のレベル
から所望レベルを選択可能であることを特徴とする。
【0028】上記目的を達成するため、請求項23記載
の発明は、表示工程と、前記重なり合い検知工程の出力
に応答して前記重要度を設定するための設定画面を表示
するよう前記表示工程を制御する表示制御工程とを備え
ることを特徴とする。
【0029】上記目的を達成するため、請求項24記載
の発明は、前記複数のテキストデータと前記複数のテキ
ストデータの優先度を示す優先度データとを装置外部よ
り受信する受信工程を有するたことを特徴とする。
【0030】上記目的を達成するため、請求項25記載
の発明は、前記音声出力工程は、二つの音声が重なる場
合、一方の音声の音量の割合をa/(a+b)とし、他
方の音量の割合をb/(a+b)とする(a:一方の音
声の重要度に係るパラメータ、b:他方の音声の重要度
に係るパラメータ)ことを特徴とする。
【0031】上記目的を達成するため、請求項26記載
の発明は、前記音声出力工程は、三つ以上の音声が重な
る場合、それぞれの出力の音声の音量の割合を、当該音
声の重要度に係る重要度パラメータの値を重なって出力
される全ての音声の重要度パラメータの総和で割った値
とすることを特徴とする。
【0032】上記目的を達成するため、請求項27記載
の発明は、前記音声出力工程は、特に重要度が高いテキ
ストデータに対しては特に大きな音量を割り振る設定が
可能であることを特徴とする。
【0033】上記目的を達成するため、請求項28記載
の発明は、テキストデータを合成音声に変換して出力す
る音声合成装置に適用される音声合成方法を実行するプ
ログラムを記憶したコンピュータにより読み出し可能な
記憶媒体であって、前記音声合成方法は、前記テキスト
データの音声波形を生成するように制御する音声波形生
成ステップと、複数の前記テキストデータの音声出力の
重なり合いを検知するように制御する重なり合い検知ス
テップと、前記重なり合いが検知された各々の前記テキ
ストデータから生成された音声波形を異なる音量で音声
合成し出力するように制御する音声出力ステップとを有
することを特徴とする。
【0034】上記目的を達成するため、請求項29記載
の発明は、前記音声出力ステップは前記複数のテキスト
データの優先度に基づいて前記複数のテキストデータに
係る合成音声の音量を決定するように制御することを特
徴とする。
【0035】上記目的を達成するため、請求項30記載
の発明は、前記複数のテキストデータの重要度を設定す
るように制御する重要度設定ステップを備えたことを特
徴とする。
【0036】上記目的を達成するため、請求項31記載
の発明は、前記重要度は、予め設定された複数のレベル
から所望レベルを選択可能であることを特徴とする。
【0037】上記目的を達成するため、請求項32記載
の発明は、表示ステップと、前記重なり合い検知ステッ
プの出力に応答して前記重要度を設定するための設定画
面を表示するよう前記表示ステップを制御する表示制御
ステップとを有することを特徴とする。
【0038】上記目的を達成するため、請求項33記載
の発明は、前記複数のテキストデータと前記複数のテキ
ストデータの優先度を示す優先度データとを装置外部よ
り受信するように制御する受信ステップを有することを
特徴とする。
【0039】上記目的を達成するため、請求項34記載
の発明は、前記音声出力ステップは、二つの音声が重な
る場合、一方の音声の音量の割合をa/(a+b)と
し、他方の音量の割合をb/(a+b)とする(a:一
方の音声の重要度に係るパラメータ、b:他方の音声の
重要度に係るパラメータ)ように制御することを特徴と
する。
【0040】上記目的を達成するため、請求項35記載
の発明は、前記音声出力ステップは、三つ以上の音声が
重なる場合、それぞれの出力の音声の音量の割合を、当
該音声の重要度に係る重要度パラメータの値を重なって
出力される全ての音声の重要度パラメータの総和で割っ
た値とすることを特徴とする。
【0041】上記目的を達成するため、請求項36記載
の発明は、前記音声出力ステップは、特に重要度が高い
テキストデータに対しては特に大きな音量を割り振る設
定が可能であることを特徴とする。
【0042】上記目的を達成するため、請求項37記載
の発明は、テキストデータを合成音声に変換して出力す
る音声合成装置であって、複数の前記テキストデータの
優先度に従って前記複数のテキストデータの合成音声を
生成して同時に出力する音声合成手段を備えることを特
徴とする。
【0043】上記目的を達成するため、請求項38記載
の発明は、前記音声合成手段は前記複数のテキストデー
タの優先度に従って各テキストデータの合成音声の音量
を設定することを特徴とする。
【0044】上記目的を達成するため、請求項39記載
の発明は、前記複数のテキストデータに対する重要度を
設定する重要度設定手段を備えることを特徴とする。
【0045】上記目的を達成するため、請求項40記載
の発明は、前記複数のテキストデータと前記複数のテキ
ストデータの優先度を示す優先度データとを装置外部よ
り受信する受信手段を備えたことを特徴とする。
【0046】上記目的を達成するため、請求項41記載
の発明は、テキストデータを合成音声に変換して出力す
る音声合成装置であって、前記テキストデータの音声波
形を生成する音声波形生成手段と、前記複数のテキスト
データから生成された音声波形を異なる音量で音声合成
し同時に出力する音声出力手段とを備えることを特徴と
する。
【0047】上記目的を達成するため、請求項42記載
の発明は、前記音声出力手段は前記複数のテキストデー
タの優先度に従って各テキストデータの合成音声の音量
を設定することを特徴とする。
【0048】上記目的を達成するため、請求項43記載
の発明は、前記複数のテキストデータに対する重要度を
設定する重要度設定手段を備えることを特徴とする。
【0049】上記目的を達成するため、請求項44記載
の発明は、前記複数のテキストデータと前記複数のテキ
ストデータの優先度を示す優先度データとを装置外部よ
り受信する受信手段を備えたことを特徴とする。
【0050】上記目的を達成するため、請求項45記載
の発明は、テキストデータを合成音声に変換して出力す
る音声合成装置に適用される音声合成方法であって、複
数の前記テキストデータの優先度に従って前記複数のテ
キストデータの合成音声を生成して同時に出力する音声
出力工程を有することを特徴とする。
【0051】上記目的を達成するため、請求項46記載
の発明は、前記音声出力工程では前記複数のテキストデ
ータの優先度に従って各テキストデータの合成音声の音
量を設定することを特徴とする。
【0052】上記目的を達成するため、請求項47記載
の発明は、前記複数のテキストデータに対する重要度を
設定する重要度設定工程を有することを特徴とする。
【0053】上記目的を達成するため、請求項48記載
の発明は、前記複数のテキストデータと前記複数のテキ
ストデータの優先度を示す優先度データとを装置外部よ
り受信する受信工程を有することを特徴とする。
【0054】上記目的を達成するため、請求項49記載
の発明は、テキストデータを合成音声に変換して出力す
る音声合成装置に適用される音声合成方法であって、前
記テキストデータの音声波形を生成する音声波形生成工
程と、前記複数のテキストデータから生成された音声波
形を異なる音量で音声合成し同時に出力する音声出力工
程とを有することを特徴とする。
【0055】上記目的を達成するため、請求項50記載
の発明は、前記音声出力工程では前記複数のテキストデ
ータの優先度に従って各テキストデータの合成音声の音
量を設定することを特徴とする。
【0056】上記目的を達成するため、請求項51記載
の発明は、前記複数のテキストデータに対する重要度を
設定する重要度設定工程を有することを特徴とする。
【0057】上記目的を達成するため、請求項52記載
の発明は、前記複数のテキストデータと前記複数のテキ
ストデータの優先度を示す優先度データとを装置外部よ
り受信する受信工程を有することを特徴とする。
【0058】上記目的を達成するため、請求項53記載
の発明は、テキストデータを合成音声に変換して出力す
る音声合成装置に適用される音声合成方法を実行するプ
ログラムを記憶したコンピュータにより読み出し可能な
記憶媒体であって、複数の前記テキストデータの優先度
に従って前記複数のテキストデータの合成音声を生成し
て同時に出力するように制御する音声出力ステップを有
することを特徴とする。
【0059】上記目的を達成するため、請求項54記載
の発明は、前記音声出力ステップでは前記複数のテキス
トデータの優先度に従って各テキストデータの合成音声
の音量を設定するように制御することを特徴とする。
【0060】上記目的を達成するため、請求項55記載
の発明は、前記複数のテキストデータに対する重要度を
設定するように制御する重要度設定ステップを有するこ
とを特徴とする。
【0061】上記目的を達成するため、請求項56記載
の発明は、前記複数のテキストデータと前記複数のテキ
ストデータの優先度を示す優先度データとを装置外部よ
り受信するように制御する受信ステップを有することを
特徴とする。
【0062】上記目的を達成するため、請求項57記載
の発明は、テキストデータを合成音声に変換して出力す
る音声合成装置に適用される音声合成方法を実行するプ
ログラムを記憶したコンピュータにより読み出し可能な
記憶媒体であって、前記テキストデータの音声波形を生
成するように制御する音声波形生成ステップと、前記複
数のテキストデータから生成された音声波形を異なる音
量で音声合成し同時に出力するように制御する音声出力
ステップとを有することを特徴とする。
【0063】上記目的を達成するため、請求項58記載
の発明は、前記音声出力ステップは前記複数のテキスト
データの優先度に従って各テキストデータの合成音声の
音量を設定するように制御することを特徴とする。
【0064】上記目的を達成するため、請求項59記載
の発明は、前記複数のテキストデータに対する重要度を
設定するように制御する重要度設定ステップを有するこ
とを特徴とする。
【0065】上記目的を達成するため、請求項60記載
の発明は、前記複数のテキストデータと前記複数のテキ
ストデータの優先度を示す優先度データとを装置外部よ
り受信するように制御する受信ステップを有することを
特徴とする。
【0066】
【発明の実施の形態】以下、本発明の実施の形態を図面
に基づいて詳細に説明する。
【0067】本発明の実施の形態は、他のコンピュータ
(サーバコンピュータ)から非同期に送られてくるテキ
ストデータを音声出力するシステムにおいて、1つのテ
キストデータの音声出力が終了する前に、次のテキスト
データが送られてきたとき、それらのテキストデータに
設定された重要度のパラメータに従って、先に音声出力
中の音声と後から重なって出力される音声との音量の割
合を変えて出力するシステムである。本実施形態では、
2つ以上の音声が重ならない前提で説明するが、更に3
つ以上の音声が重なることが予想される場合も同様に処
理することができる。
【0068】図1は本発明の実施の形態に係る音声合成
装置の構成例を示すブロック図である。音声合成装置
は、CPU101、ハードディスクコントローラ(HD
C)102、ハードディスク(HD)103、キーボー
ド104、ポインティングデバイス(PD)105、R
AM106、通信回線インターフェイス(I/F)10
7、VRAM108、表示コントローラ109、モニタ
110、サウンドカード111、スピーカ112を備え
ている。図中150はサーバコンピュータである。
【0069】上記各部の構成を詳述すると、CPU10
1は、本装置全体の制御を行う中央演算処理装置であ
り、後述の図4のフローチャートに示す処理を実行す
る。ハードディスクコントローラ102は、ハードディ
スク103内のデータやプログラムの制御を行う。ハー
ドディスク103内には、プログラム113と、音声波
形生成部(後述)において入力された漢字かな混じり文
を解析し読み情報を得る時に参照される漢字等の読みや
アクセント情報が登録されている辞書114と、発声す
る文字列に従って音声の素片を接続する際に必要になる
音声素片データ115が格納されている。
【0070】キーボード104は、文字・数字・記号等
の入力に用いる。ポインティングデバイス105は、プ
ログラム開始などの指示に用いるものであり、例えばマ
ウスやディジタイザなどから構成されている。RAM1
06は、プログラムやデータを格納する。通信回線イン
ターフェイス107は、外部のサーバコンピュータ15
0との間でデータのやり取りを行う。本実施形態では通
信形態はTCP/IP(Transmission Contorol Protoc
ol/Internet Protocol)を用いている。表示コントロー
ラ109は、VRAM108に格納された映像データを
映像信号としてモニタ110に出力する制御を行う。サ
ウンドカード111は、CPU101で生成されRAM
106に格納された音声波形データをスピーカ112を
通して出力している。
【0071】図2は本発明の実施の形態に係る音声合成
装置のプログラムのモジュール関係を示す説明図であ
る。音声合成装置は、辞書114、音声素片データ11
5、メインルーチン初期化部201、音声処理初期化部
202、通信データ処理部204、通信データ格納部2
06、表示文章データ格納部207、文章表示部20
8、音声波形生成部209、音声出力部210、初期化
部203・受信部205を有する通信処理部211、音
響パラメータ212、出力パラメータ213を備えてい
る。
【0072】上記各部の機能を詳述すると、本実施形態
のシステムが起動すると、先ず、メインルーチン220
のメインルーチン初期化部201にてプログラム全体の
初期化が行われる。次に、通信処理部211の初期化部
203にて通信部230の初期化が行われ、音声処理初
期化部202にて音声部240の初期化が行われる。本
実施形態では通信形態はTCP/IPを用いている。
【0073】通信処理部211の初期化部203にて通
信部230の初期化が終了すると、通信処理部211の
受信部205が起動し、サーバコンピュータ150から
音声合成装置に送信されるテキストデータを受信できる
ようになる。このテキストデータには、テキストデータ
の重要度を示すパラメータが付けられている。通信処理
部211の受信部205にてこのテキストデータを受信
すると、受信されたテキストデータは通信データ格納部
206に格納される。
【0074】メインルーチン初期化部201にてメイン
ルーチン220全体の初期化が終了すると、通信データ
処理部204は通信データ格納部206の監視を開始す
る。受信されたテキストデータが通信データ格納部20
6に格納されると、通信データ処理部204はそのテキ
ストデータを読み込み、モニタ110に表示するための
表示文章を格納する表示文章データ格納部207にテキ
ストデータを格納する。
【0075】文章表示部208は、表示文章データ格納
部207にデータがあるのを検知すると、そのデータを
モニタ110に表示できる形態に変換して、VRAM1
08上に置く。この結果、モニタ110に表示文章が表
示されることになる。この際、テキストデータの重要度
を示すパラメータに従って、テキストデータに何らかの
処理を施して表示文章とする場合は(例えば重要な文章
の場合は、文字を大きくしたり、太くしたり、色を変え
たり等)、その処理を通信データ処理部204にて行
う。
【0076】また、通信データ処理部204は、受信さ
れたテキストデータを音声波形生成部209に送り、音
声波形生成部209にてテキストデータの音声波形の生
成を行う。その際、テキストデータに何らかの処理を施
して音声波形を生成する場合は、その処理を通信データ
処理部204にて行う。音声波形生成部209にて辞書
114、音声素片データ115、音響パラメータ212
を参照しながら、受信したテキストデータの音声波形を
生成する。生成された波形は、重要度を示すパラメータ
が付けられた状態で、ミキシング機能を持つ音声出力部
210に渡される。
【0077】図3は本発明の実施の形態に係る音声合成
装置の音声出力部210の詳細構成を示す説明図であ
る。音声合成装置の音声出力部210は、一時蓄積部3
01、コントロール部302、音声再生部304、ミキ
シング部305を備えている。図中303は音声波形、
306は重要度パラメータである。
【0078】上記各部の機能を詳述すると、一時蓄積部
301は、音声波形生成部209より送られてきた、重
要度を示すパラメータ306が付随した音声波形303
を一時的に蓄積する。コントロール部302は、音声出
力部210の全体をコントロールするものであり、常
時、一時蓄積部301に音声波形303が送られてきた
かどうかをチェックしており、音声波形303が送られ
てきた場合は、音声再生部304に送って音声再生を開
始する。
【0079】音声再生部304は、上記図2の出力パラ
メータ213から、音声出力に必要な予め設定されたパ
ラメータ(サンプリングレート、データのビット数等の
こと)に従って、音声波形303の再生を実行する。
尚、音声再生部304は少なくとも2つ以上(実際は、
同時に音声合成が予想される数だけ必要)存在し、コン
トロール部302は音声波形303が送られてきた場合
は、その時点で使用されていない音声再生部304に音
声波形303を送って、再生を実行する。また、音声再
生部304をソフト的なプロセスとして構成し、コント
ロール部302は音声波形303が送られてくる毎に音
声再生部304のプロセスを生成し、音声波形303の
再生が終わった時点で、その音声再生部304のプロセ
スを消滅させるような構成であっても構わない。
【0080】音声再生部304が出力する個々の音声デ
ータは、少なくとも2つ以上(実際は、同時に音声合成
が予想される数だけ必要)の入力部を持つミキシング部
305に送られ、ミキシング部305は音声データを合
成して、最終的な合成音声データを上記図1のスピーカ
112から出力する。この際、コントロール部302
は、音声波形303に付随して送られてきた、その音声
波形の重要度を示す重要度パラメータ306に従って、
個々のミキシングの音量調整をミキシング部305に対
して行うようになっている。
【0081】図7は本発明の実施の形態に係るプログラ
ム及び関連データが記憶媒体から装置に供給される概念
例を示す説明図である。プログラム及び関連データは、
フロッピディスクやCD−ROM等の記憶媒体701を
装置702に装備された記憶媒体ドライブ挿入口703
に挿入することで供給される。その後、プログラム及び
関連データを記憶媒体701から一旦ハードディスクに
インストールしハードディスクからRAMにロードする
か、或いはハードディスクにインストールせずに直接R
AMにロードすることで、プログラム及び関連データを
実行することが可能となる。
【0082】この場合、本発明の実施の形態に係る音声
合成装置においてプログラムを実行する場合は、上記図
7に示したような手順で音声合成装置にプログラム及び
関連データを供給するか、或いは音声合成装置に予めプ
ログラム及び関連データを格納しておくことで、プログ
ラム実行が可能となる。
【0083】図6は本発明の実施の形態に係るプログラ
ム及び関連データを記憶した記憶媒体の記憶内容の構成
例を示す説明図である。記憶媒体は、例えばボリューム
情報601、ディレクトリ情報602、プログラム実行
ファイル603(図1のプログラム113に相当)、プ
ログラム関連データファイル604(図1の辞書11
4、音声素片データ115等に相当)等の記憶内容で構
成される。プログラムは、後述の図4のフローチャート
に基づきプログラムコード化されたものである。
【0084】尚、本発明の特許請求の範囲と本発明の実
施の形態との対応関係は下記の通りである。音声波形生
成手段は音声波形生成部209に対応し、重なり合い検
知手段、音量割合設定手段、音声出力手段は音声出力部
210に対応し、重要度設定手段はモニタ110上の音
声重要度設定画面に対応する。
【0085】次に、上記の如く構成された本発明の実施
の形態に係る音声合成装置の動作を図4、図5を参照し
ながら詳細に説明する。図4は音声合成装置の音声波形
生成部209より音声波形が音声出力部210に送られ
てきた時から音声を出力するまでの処理の流れ図、図5
は音声合成装置のモニタ110に表示される音声の重要
度を設定する設定画面を示す説明図である。
【0086】先ずステップS401で、コントロール部
302は音声再生部304の動作状態を調べて、現在音
声を出力中かどうかを確認する。その結果、音声を出力
中であれば、ステップS402にて、現在出力中の音声
の重要度パラメータ306と、これから出力する音声の
重要度パラメータ306を使って、合成する音量の割合
の設定を行う(この合成する音量の割合の設定方法は後
で説明する)。現在音声を出力中でない場合は、ステッ
プS403にて、これから出力する音声に対して音量が
100%であるとの設定を行う。
【0087】次にステップS404で、音声波形を音声
再生部304の1つを使って音声の再生を行う。再生さ
れた音声は、ステップS405で、必要な音量のミキシ
ングが行われ、最終的な音声の出力となる。この際、音
声再生部304にて現在再生中の他の音声がある場合
は、ミキシング部305で、現在再生中の音声に新しく
再生された音声が、上記ステップS402で設定された
音量の割合に従ってミキシングされて、音声出力が行わ
れることになる。現在再生中の音声がない場合は、再生
された音声はミキシング部305を通過するが、上記ス
テップS403でそのまま100%の音量設定がなされ
ているので、何の処理もなされずにそのまま音声出力が
行われることになる。
【0088】このように、複数の音声出力が重なり合う
ことを検知した時、それぞれの音声を重要度に応じて、
合成する音量の割合を変えることによって、複数の音声
が重なっても、重要度に応じた音量で聞き取れるように
なる。
【0089】次に、各テキストデータに係る重要度の設
定処理について説明する。
【0090】前述の如く、複数のテキストデータの重な
りが検知されると、この検知出力に応じてCPU101
の不図示のプログラムルーチンが動作し、VRAM10
8、表示コントローラ110を制御して図5に示す重要
度設定画面をモニタ110条に表示させる。
【0091】図5の音声合成装置のモニタ110に表示
される重要度を設定する設定画面において、操作者が
「音声の重要度の設定」領域503で各テキストデータ
毎の重要度のパラメータを選択する。該設定画面では、
重要度は例えば1から10までのレベルで設定でき、数
字の大きい方が重要度が高いことを示している。操作者
が「OK」ボタン501を押下することにより、音声合
成するテキストデータに、設定された重要度のパラメー
タが付けられるようになっている。
【0092】合成する音声の設定方法は、現在出力中の
音声の重要度パラメータがa、これから出力する音声の
重要度パラメータがbであった場合、現在出力中の音声
の音量の割合がa/(a+b)となり、これから出力す
る音声の音量の割合がb/(a+b)となる。
【0093】なお、ここでは二つのテキストデータそれ
ぞれについて重要度を設定したが、どちらか一方、例え
ば、後から受信したテキストデータについてのみ重要度
bの設定を行い、先のテキストデータの重要度aを(a
+b=10)となるよう自動的に設定するようにしても
よい。
【0094】また3つ以上の音声が重なる可能性がある
場合は、それぞれの出力の音量の割合は、自分の重要度
パラメータの値を、重なって出力される全ての音声の重
要度パラメータの総和で割った値となる。
【0095】また、上記設定では、重要度に比例して音
量を設定するようになっているが、特に重要度の高いデ
ータに関しては、特に大きな音量を割り振るような設定
にすることも可能である。
【0096】また、本形態では、図5の設定画面を用い
てユーザが任意に重要度を設定したが、これに限らず、
サーバ150から送られる各テキストデータに吹かされ
ている重要度データをそのまま用いて、各テキストデー
タに係る合成音声の音量を決定してもよい。
【0097】以上説明したように、本発明の実施の形態
に係る音声合成装置によれば、複数の音声出力が重なっ
た場合、その音声の重要度に応じて音量の割合が決定さ
れるので、重要度に応じた音量で聞き取れるようにな
る。本実施形態を用いれば、例えば遊園地で各場所から
送られてきたテキスト情報を、サーバコンピュータを介
して音声放送するシステムにおいて、イベント案内、迷
子案内、緊急避難誘導等、情報に応じて重要度のパラメ
ータを設定することによって、同時に音声放送が行われ
ても、重要な情報ほど大きな音量で聞けるという活用が
可能になる。
【0098】[他の実施の形態]上述した本発明の実施
の形態においては、音声合成装置を適用する具体例とし
て、遊園地におけるイベント案内/迷子案内/緊急避難
誘導等に関する音声放送の場合を例に上げたが、これ以
外に、例えばモーターショー等の各種催事施設における
催事案内/管内呼出し等に関する音声放送、カーレース
場等の各種スポーツ施設におけるレース競技案内/管内
呼出し等に関する音声放送など、各種分野に適用可能で
あり、上記実施形態と同様の効果が得られる。
【0099】尚、本発明は、複数の機器から構成される
システムに適用しても、1つの機器からなる装置に適用
してもよい。上述した実施形態の機能を実現するソフト
ウエアのプログラムコードを記憶した記憶媒体を、シス
テム或いは装置に供給し、そのシステム或いは装置のコ
ンピュータ(またはCPUやMPU)が記憶媒体等の媒
体に格納されたプログラムコードを読み出し実行するこ
とによっても、達成されることは言うまでもない。
【0100】この場合、記憶媒体等の媒体から読み出さ
れたプログラムコード自体が上述した実施形態の機能を
実現することになり、そのプログラムコードを記憶した
記憶媒体等の媒体は本発明を構成することになる。プロ
グラムコードを供給するための記憶媒体等の媒体として
は、例えば、フロッピディスク、ハードディスク、光デ
ィスク、光磁気ディスク、CD−ROM、CD−R、磁
気テープ、不揮発性のメモリカード、ROM、或いはネ
ットワークを介してのダウンロードなどの方法を用いる
ことができる。
【0101】また、コンピュータが読み出したプログラ
ムコードを実行することにより、上述した実施形態の機
能が実現されるだけでなく、そのプログラムコードの指
示に基づき、コンピュータ上で稼働しているOSなどが
実際の処理の一部または全部を行い、その処理によって
上述した実施形態の機能が実現される場合も含まれるこ
とは言うまでもない。
【0102】更に、記憶媒体等の媒体から読出されたプ
ログラムコードが、コンピュータに挿入された機能拡張
ボードやコンピュータに接続された機能拡張ユニットに
備わるメモリに書込まれた後、そのプログラムコードの
指示に基づき、その機能拡張ボードや機能拡張ユニット
に備わるCPUなどが実際の処理の一部または全部を行
い、その処理によって上述した実施形態の機能が実現さ
れる場合も含まれることは言うまでもない。
【0103】
【発明の効果】以上説明したように、請求項1〜9、3
7〜44記載の音声合成装置によれば、複数のテキスト
データの合成音声を重ね合わせて発声する場合、それぞ
れのテキストデータを重要度に応じて音量の割合を変え
て発声させることで、複数のテキストデータが同時に発
声された場合でも、重要度に応じて大きな音声で聞くこ
とができる音声合成装置を提供できるという効果を奏す
る。
【0104】また、請求項10〜18記載の音声合成シ
ステムによれば、音声合成システムを、音声合成装置
と、該音声合成装置へテキストデータを送信する情報処
理装置から構成することで、上記と同様に、複数のテキ
ストデータが同時に発声された場合でも、重要度に応じ
て大きな音声で聞くことができるという効果を奏する。
【0105】また、請求項19〜27、45〜52記載
の音声合成方法によれば、音声合成方法を音声合成装置
で実行することで、上記と同様に、複数のテキストデー
タが同時に発声された場合でも、重要度に応じて大きな
音声で聞くことができるという効果を奏する。
【0106】また、請求項28〜36、53〜60記載
の記憶媒体によれば、記憶媒体から音声合成方法を読み
出し、音声合成装置で実行することで、上記と同様に、
複数のテキストデータが同時に発声された場合でも、重
要度に応じて大きな音声で聞くことができるという効果
を奏する。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る音声合成装置の構成
例を示すブロック図である。
【図2】本発明の実施の形態に係る音声合成装置のプロ
グラムのモジュールの構成例を示す説明図である。
【図3】本発明の実施の形態に係る音声合成装置のプロ
グラムのモジュールにおける音声出力部の詳細構成例を
示す説明図である。
【図4】本発明の実施の形態に係る音声合成装置の音声
波形生成部より音声波形が音声出力部に送られてきた時
から音声を出力するまでの処理を示す流れ図である。
【図5】本発明の実施の形態に係る音声合成装置のモニ
タに表示される音声の重要度の設定画面を示す説明図で
ある。
【図6】本発明の実施の形態に係るプログラム及び関連
データを記憶した記憶媒体の記憶内容の構成例を示す説
明図である。
【図7】本発明の実施の形態に係るプログラム及び関連
データが記憶媒体から装置に供給される概念例を示す説
明図である。
【符号の説明】
209 音声波形生成部 210 音声出力部 303 音声波形 306 重要度パラメータ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 磯沼 伴幸 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 Fターム(参考) 5B009 RB31 RD00 TA11 5D045 AA07 AA20

Claims (60)

    【特許請求の範囲】
  1. 【請求項1】 テキストデータを合成音声に変換して出
    力する音声合成装置であって、 前記テキストデータの音声波形を生成する音声波形生成
    手段と、複数の前記テキストデータの音声出力の重なり
    合いを検知する重なり合い検知手段と、前記重なり合い
    が検知された各々の前記テキストデータから生成された
    音声波形を異なる音量で音声合成し出力する音声出力手
    段とを有することを特徴とする音声合成装置。
  2. 【請求項2】 前記音声出力手段は前記複数のテキスト
    データの優先度に基づいて前記複数のテキストデータに
    係る合成音声の音量を決定することを特徴とする請求項
    1記載の音声合成装置。
  3. 【請求項3】 前記複数のテキストデータの重要度を設
    定する重要度設定手段を備えたことを特徴とする請求項
    2記載の音声合成装置。
  4. 【請求項4】 前記重要度は、予め設定された複数のレ
    ベルから所望レベルを選択可能であることを特徴とする
    請求項3記載の音声合成装置。
  5. 【請求項5】 表示手段と、前記重なり合い検知手段の
    出力に応答して前記重要度を設定するための設定画面を
    表示するよう前記表示手段を制御する表示制御手段とを
    備えることを特徴とする請求項3または4記載の音声合
    成装置。
  6. 【請求項6】 前記複数のテキストデータと前記複数の
    テキストデータの優先度を示す優先度データとを装置外
    部より受信する受信手段を備えたことを特徴とする請求
    項2記載の音声合成装置。
  7. 【請求項7】 前記音声出力手段は、二つの音声が重な
    る場合、一方の音声の音量の割合をa/(a+b)と
    し、他方の音量の割合をb/(a+b)とする(a:一
    方の音声の重要度に係るパラメータ、b:他方の音声の
    重要度に係るパラメータ)ことを特徴とする請求項1記
    載の音声合成装置。
  8. 【請求項8】 前記音声出力手段は、三つ以上の音声が
    重なる場合、それぞれの出力の音声の音量の割合を、当
    該音声の重要度に係る重要度パラメータの値を重なって
    出力される全ての音声の重要度パラメータの総和で割っ
    た値とすることを特徴とする請求項1記載の音声合成装
    置。
  9. 【請求項9】 前記音声出力手段は、特に重要度が高い
    テキストデータに対しては特に大きな音量を割り振る設
    定が可能であることを特徴とする請求項1記載の音声合
    成装置。
  10. 【請求項10】 テキストデータを合成音声に変換して
    出力する音声合成装置と、該音声合成装置に前記テキス
    トデータを送信する情報処理装置とを具備してなる音声
    合成システムであって、 前記音声合成装置は、前記情報処理装置から送信された
    前記テキストデータの音声波形を生成する音声波形生成
    手段と、複数の前記テキストデータの音声出力の重なり
    合いを検知する重なり合い検知手段と、前記重なり合い
    が検知された各々の前記テキストデータから生成された
    音声波形を異なる音量で音声合成し出力する音声出力手
    段とを有することを特徴とする音声合成システム。
  11. 【請求項11】 前記音声合成装置の前記音声出力手段
    は前記複数のテキストデータの優先度に基づいて前記複
    数のテキストデータに係る合成音声の音量を決定するこ
    とを特徴とする請求項10記載の音声合成システム。
  12. 【請求項12】 前記音声合成装置は、前記複数のテキ
    ストデータの重要度を設定する重要度設定手段を備えた
    ことを特徴とする請求項11記載の音声合成システム。
  13. 【請求項13】 前記重要度は、予め設定された複数の
    レベルから所望レベルを選択可能であることを特徴とす
    る請求項12記載の音声合成システム。
  14. 【請求項14】 前記音声合成装置は、表示手段と、前
    記重なり合い検知手段の出力に応答して前記重要度を設
    定するための設定画面を表示するよう前記表示手段を制
    御する表示制御手段とを備えることを特徴とする請求項
    12または13記載の音声合成システム。
  15. 【請求項15】 前記音声合成装置は、前記複数のテキ
    ストデータと前記複数のテキストデータの優先度を示す
    優先度データとを装置外部より受信する受信手段を備え
    たことを特徴とする請求項11記載の音声合成システ
    ム。
  16. 【請求項16】 前記音声合成装置の前記音声出力手段
    は、二つの音声が重なる場合、一方の音声の音量の割合
    をa/(a+b)とし、他方の音量の割合をb/(a+
    b)とする(a:一方の音声の重要度に係るパラメー
    タ、b:他方の音声の重要度に係るパラメータ)ことを
    特徴とする請求項10記載の音声合成システム。
  17. 【請求項17】 前記音声合成装置の前記音声出力手段
    は、三つ以上の音声が重なる場合、それぞれの出力の音
    声の音量の割合を、当該音声の重要度に係る重要度パラ
    メータの値を重なって出力される全ての音声の重要度パ
    ラメータの総和で割った値とすることを特徴とする請求
    項10記載の音声合成システム。
  18. 【請求項18】 前記音声合成装置の前記音声出力手段
    は、特に重要度が高いテキストデータに対しては特に大
    きな音量を割り振る設定が可能であることを特徴とする
    請求項10記載の音声合成システム。
  19. 【請求項19】 テキストデータを合成音声に変換して
    出力する音声合成装置に適用される音声合成方法であっ
    て、 前記テキストデータの音声波形を生成する音声波形生成
    工程と、複数の前記テキストデータの音声出力の重なり
    合いを検知する重なり合い検知工程、前記重なり合いが
    検知された各々の前記テキストデータから生成された音
    声波形を異なる音量で音声合成し出力する音声出力工程
    とを有することを特徴とする音声合成方法。
  20. 【請求項20】 前記音声出力工程では前記複数のテキ
    ストデータの優先度に基づいて前記複数のテキストデー
    タに係る合成音声の音量を決定することを特徴とする請
    求項19記載の音声合成方法。
  21. 【請求項21】 前記複数のテキストデータの重要度を
    設定する重要度設定工程を備えたことを特徴とする請求
    項20記載の音声合成装置。
  22. 【請求項22】 前記重要度は、予め設定された複数の
    レベルから所望レベルを選択可能であることを特徴とす
    る請求項21記載の音声合成方法。
  23. 【請求項23】 表示工程と、前記重なり合い検知工程
    の出力に応答して前記重要度を設定するための設定画面
    を表示するよう前記表示工程を制御する表示制御工程と
    を備えることを特徴とする請求項21または22記載の
    音声合成方法。
  24. 【請求項24】 前記複数のテキストデータと前記複数
    のテキストデータの優先度を示す優先度データとを装置
    外部より受信する受信工程を有するたことを特徴とする
    請求項20記載の音声合成方法。
  25. 【請求項25】 前記音声出力工程は、二つの音声が重
    なる場合、一方の音声の音量の割合をa/(a+b)と
    し、他方の音量の割合をb/(a+b)とする(a:一
    方の音声の重要度に係るパラメータ、b:他方の音声の
    重要度に係るパラメータ)ことを特徴とする請求項19
    記載の音声合成方法。
  26. 【請求項26】 前記音声出力工程は、三つ以上の音声
    が重なる場合、それぞれの出力の音声の音量の割合を、
    当該音声の重要度に係る重要度パラメータの値を重なっ
    て出力される全ての音声の重要度パラメータの総和で割
    った値とすることを特徴とする請求項19記載の音声合
    成方法。
  27. 【請求項27】 前記音声出力工程は、特に重要度が高
    いテキストデータに対しては特に大きな音量を割り振る
    設定が可能であることを特徴とする請求項19記載の音
    声合成方法。
  28. 【請求項28】 テキストデータを合成音声に変換して
    出力する音声合成装置に適用される音声合成方法を実行
    するプログラムを記憶したコンピュータにより読み出し
    可能な記憶媒体であって、 前記音声合成方法は、前記テキストデータの音声波形を
    生成するように制御する音声波形生成ステップと、複数
    の前記テキストデータの音声出力の重なり合いを検知す
    るように制御する重なり合い検知ステップと、前記重な
    り合いが検知された各々の前記テキストデータから生成
    された音声波形を異なる音量で音声合成し出力するよう
    に制御する音声出力ステップとを有することを特徴とす
    る記憶媒体。
  29. 【請求項29】 前記音声出力ステップは前記複数のテ
    キストデータの優先度に基づいて前記複数のテキストデ
    ータに係る合成音声の音量を決定するように制御するこ
    とを特徴とする請求項28記載の記憶媒体。
  30. 【請求項30】 前記複数のテキストデータの重要度を
    設定するように制御する重要度設定ステップを備えたこ
    とを特徴とする請求項29記載の記憶媒体。
  31. 【請求項31】 前記重要度は、予め設定された複数の
    レベルから所望レベルを選択可能であることを特徴とす
    る請求項30記載の記憶媒体。
  32. 【請求項32】 表示ステップと、前記重なり合い検知
    ステップの出力に応答して前記重要度を設定するための
    設定画面を表示するよう前記表示ステップを制御する表
    示制御ステップとを有することを特徴とする請求項30
    または31記載の記憶媒体。
  33. 【請求項33】 前記複数のテキストデータと前記複数
    のテキストデータの優先度を示す優先度データとを装置
    外部より受信するように制御する受信ステップを有する
    ことを特徴とする請求項29記載の音声合成装置。
  34. 【請求項34】 前記音声出力ステップは、二つの音声
    が重なる場合、一方の音声の音量の割合をa/(a+
    b)とし、他方の音量の割合をb/(a+b)とする
    (a:一方の音声の重要度に係るパラメータ、b:他方
    の音声の重要度に係るパラメータ)ように制御すること
    を特徴とする請求項19記載の記憶媒体。
  35. 【請求項35】 前記音声出力ステップは、三つ以上の
    音声が重なる場合、それぞれの出力の音声の音量の割合
    を、当該音声の重要度に係る重要度パラメータの値を重
    なって出力される全ての音声の重要度パラメータの総和
    で割った値とすることを特徴とする請求項28記載の記
    憶媒体。
  36. 【請求項36】 前記音声出力ステップは、特に重要度
    が高いテキストデータに対しては特に大きな音量を割り
    振る設定が可能であることを特徴とする請求項28記載
    の記憶媒体。
  37. 【請求項37】 テキストデータを合成音声に変換して
    出力する音声合成装置であって、 複数の前記テキストデータの優先度に従って前記複数の
    テキストデータの合成音声を生成して同時に出力する音
    声合成手段を備えることを特徴とする音声合成装置。
  38. 【請求項38】 前記音声合成手段は前記複数のテキス
    トデータの優先度に従って各テキストデータの合成音声
    の音量を設定することを特徴とする請求項37記載の音
    声合成装置。
  39. 【請求項39】 前記複数のテキストデータに対する重
    要度を設定する重要度設定手段を備えることを特徴とす
    る請求項37記載の音声合成装置。
  40. 【請求項40】 前記複数のテキストデータと前記複数
    のテキストデータの優先度を示す優先度データとを装置
    外部より受信する受信手段を備えたことを特徴とする請
    求項37記載の音声合成装置。
  41. 【請求項41】 テキストデータを合成音声に変換して
    出力する音声合成装置であって、 前記テキストデータの音声波形を生成する音声波形生成
    手段と、前記複数のテキストデータから生成された音声
    波形を異なる音量で音声合成し同時に出力する音声出力
    手段とを備えることを特徴とする音声合成装置。
  42. 【請求項42】 前記音声出力手段は前記複数のテキス
    トデータの優先度に従って各テキストデータの合成音声
    の音量を設定することを特徴とする請求項41記載の音
    声合成装置。
  43. 【請求項43】 前記複数のテキストデータに対する重
    要度を設定する重要度設定手段を備えることを特徴とす
    る請求項41記載の音声合成装置。
  44. 【請求項44】 前記複数のテキストデータと前記複数
    のテキストデータの優先度を示す優先度データとを装置
    外部より受信する受信手段を備えたことを特徴とする請
    求項41記載の音声合成装置。
  45. 【請求項45】 テキストデータを合成音声に変換して
    出力する音声合成装置に適用される音声合成方法であっ
    て、 複数の前記テキストデータの優先度に従って前記複数の
    テキストデータの合成音声を生成して同時に出力する音
    声出力工程を有することを特徴とする音声合成方法。
  46. 【請求項46】 前記音声出力工程では前記複数のテキ
    ストデータの優先度に従って各テキストデータの合成音
    声の音量を設定することを特徴とする請求項45記載の
    音声合成方法。
  47. 【請求項47】 前記複数のテキストデータに対する重
    要度を設定する重要度設定工程を有することを特徴とす
    る請求項45記載の音声合成方法。
  48. 【請求項48】 前記複数のテキストデータと前記複数
    のテキストデータの優先度を示す優先度データとを装置
    外部より受信する受信工程を有することを特徴とする請
    求項45記載の音声合成方法。
  49. 【請求項49】 テキストデータを合成音声に変換して
    出力する音声合成装置に適用される音声合成方法であっ
    て、 前記テキストデータの音声波形を生成する音声波形生成
    工程と、前記複数のテキストデータから生成された音声
    波形を異なる音量で音声合成し同時に出力する音声出力
    工程とを有することを特徴とする音声合成方法。
  50. 【請求項50】 前記音声出力工程では前記複数のテキ
    ストデータの優先度に従って各テキストデータの合成音
    声の音量を設定することを特徴とする請求項49記載の
    音声合成方法。
  51. 【請求項51】 前記複数のテキストデータに対する重
    要度を設定する重要度設定工程を有することを特徴とす
    る請求項49記載の音声合成方法。
  52. 【請求項52】 前記複数のテキストデータと前記複数
    のテキストデータの優先度を示す優先度データとを装置
    外部より受信する受信工程を有することを特徴とする請
    求項49記載の音声合成方法。
  53. 【請求項53】 テキストデータを合成音声に変換して
    出力する音声合成装置に適用される音声合成方法を実行
    するプログラムを記憶したコンピュータにより読み出し
    可能な記憶媒体であって、 複数の前記テキストデータの優先度に従って前記複数の
    テキストデータの合成音声を生成して同時に出力するよ
    うに制御する音声出力ステップを有することを特徴とす
    る記憶媒体。
  54. 【請求項54】 前記音声出力ステップでは前記複数の
    テキストデータの優先度に従って各テキストデータの合
    成音声の音量を設定するように制御することを特徴とす
    る請求項53記載の記憶媒体。
  55. 【請求項55】 前記複数のテキストデータに対する重
    要度を設定するように制御する重要度設定ステップを有
    することを特徴とする請求項53記載の記憶媒体。
  56. 【請求項56】 前記複数のテキストデータと前記複数
    のテキストデータの優先度を示す優先度データとを装置
    外部より受信するように制御する受信ステップを有する
    ことを特徴とする請求項53記載の記憶媒体。
  57. 【請求項57】 テキストデータを合成音声に変換して
    出力する音声合成装置に適用される音声合成方法を実行
    するプログラムを記憶したコンピュータにより読み出し
    可能な記憶媒体であって、 前記テキストデータの音声波形を生成するように制御す
    る音声波形生成ステップと、前記複数のテキストデータ
    から生成された音声波形を異なる音量で音声合成し同時
    に出力するように制御する音声出力ステップとを有する
    ことを特徴とする記憶媒体。
  58. 【請求項58】 前記音声出力ステップは前記複数のテ
    キストデータの優先度に従って各テキストデータの合成
    音声の音量を設定するように制御することを特徴とする
    請求項57記載の記憶媒体。
  59. 【請求項59】 前記複数のテキストデータに対する重
    要度を設定するように制御する重要度設定ステップを有
    することを特徴とする請求項57記載の記憶媒体。
  60. 【請求項60】 前記複数のテキストデータと前記複数
    のテキストデータの優先度を示す優先度データとを装置
    外部より受信するように制御する受信ステップを有する
    ことを特徴とする請求項57記載の記憶媒体。
JP2000199929A 2000-06-30 2000-06-30 音声合成装置、音声合成システム、音声合成方法及び記憶媒体 Pending JP2002023778A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2000199929A JP2002023778A (ja) 2000-06-30 2000-06-30 音声合成装置、音声合成システム、音声合成方法及び記憶媒体
US09/891,389 US7031924B2 (en) 2000-06-30 2001-06-27 Voice synthesizing apparatus, voice synthesizing system, voice synthesizing method and storage medium
US11/357,021 US20060143012A1 (en) 2000-06-30 2006-02-21 Voice synthesizing apparatus, voice synthesizing system, voice synthesizing method and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000199929A JP2002023778A (ja) 2000-06-30 2000-06-30 音声合成装置、音声合成システム、音声合成方法及び記憶媒体

Publications (1)

Publication Number Publication Date
JP2002023778A true JP2002023778A (ja) 2002-01-25

Family

ID=18697873

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000199929A Pending JP2002023778A (ja) 2000-06-30 2000-06-30 音声合成装置、音声合成システム、音声合成方法及び記憶媒体

Country Status (1)

Country Link
JP (1) JP2002023778A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002054383A1 (fr) * 2000-12-28 2002-07-11 Sharp Kabushiki Kaisha Dispositif de synthese vocale de texte et support d'enregistrement de programme
JP2008135891A (ja) * 2006-11-27 2008-06-12 Sony Computer Entertainment Inc 音声処理装置および音声処理方法
WO2013069178A1 (en) * 2011-11-09 2013-05-16 Sony Corporation Voice control device, voice control method and program
JP2016189195A (ja) * 2016-05-25 2016-11-04 ソニー株式会社 携帯端末、情報処理装置、およびプログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002054383A1 (fr) * 2000-12-28 2002-07-11 Sharp Kabushiki Kaisha Dispositif de synthese vocale de texte et support d'enregistrement de programme
US7249021B2 (en) 2000-12-28 2007-07-24 Sharp Kabushiki Kaisha Simultaneous plural-voice text-to-speech synthesizer
JP2008135891A (ja) * 2006-11-27 2008-06-12 Sony Computer Entertainment Inc 音声処理装置および音声処理方法
WO2013069178A1 (en) * 2011-11-09 2013-05-16 Sony Corporation Voice control device, voice control method and program
JP2013101248A (ja) * 2011-11-09 2013-05-23 Sony Corp 音声制御装置、音声制御方法、およびプログラム
US9299349B2 (en) 2011-11-09 2016-03-29 Sony Corporation Voice control device, voice control method and program
US9557962B2 (en) 2011-11-09 2017-01-31 Sony Corporation Voice control device, voice control method and program
US9830128B2 (en) 2011-11-09 2017-11-28 Sony Corporation Voice control device, voice control method and program
JP2016189195A (ja) * 2016-05-25 2016-11-04 ソニー株式会社 携帯端末、情報処理装置、およびプログラム

Similar Documents

Publication Publication Date Title
US6560574B2 (en) Speech recognition enrollment for non-readers and displayless devices
US5131311A (en) Music reproducing method and apparatus which mixes voice input from a microphone and music data
JP3102335B2 (ja) フォルマント変換装置およびカラオケ装置
JP3248981B2 (ja) 計算機
US20030045274A1 (en) Mobile communication terminal, sensor unit, musical tone generating system, musical tone generating apparatus, musical tone information providing method, and program
US7031924B2 (en) Voice synthesizing apparatus, voice synthesizing system, voice synthesizing method and storage medium
JP2001331175A (ja) 副旋律生成装置及び方法並びに記憶媒体
US7122731B2 (en) Musical information processing terminal, control method therefor, and program for implementing the method
JPH10326176A (ja) 音声対話制御方法
JP2002023778A (ja) 音声合成装置、音声合成システム、音声合成方法及び記憶媒体
JPH11259081A (ja) 歌唱採点表示カラオケ装置
JP3116937B2 (ja) カラオケ装置
JP2002023787A (ja) 音声合成装置、音声合成システム、音声合成方法及び記憶媒体
JPH06195953A (ja) データ処理装置
JP6596903B2 (ja) 情報提供システムおよび情報提供方法
JP2000206987A (ja) 音声認識装置
JP3974069B2 (ja) 合唱曲や重唱曲を処理するカラオケ演奏方法およびカラオケシステム
JP2004258564A (ja) スコアデータ編集装置、スコアデータ表示装置およびプログラム
JP2002032098A (ja) 音声出力装置、音声出力システム、音声出力方法及び記憶媒体
JPH09179572A (ja) 音声変換回路とカラオケ装置
JP3471672B2 (ja) ボーカル音量の自動フェードアウト機能を備えたカラオケ装置
JP2005037827A (ja) 楽音発生装置
JP2003177766A (ja) 作詞支援装置及びそれに用いる作詞支援プログラム
JP4161714B2 (ja) カラオケ装置
JPH08146977A (ja) カラオケ装置

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060327

RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20070626