JP2003005776A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JP2003005776A
JP2003005776A JP2001188509A JP2001188509A JP2003005776A JP 2003005776 A JP2003005776 A JP 2003005776A JP 2001188509 A JP2001188509 A JP 2001188509A JP 2001188509 A JP2001188509 A JP 2001188509A JP 2003005776 A JP2003005776 A JP 2003005776A
Authority
JP
Japan
Prior art keywords
word
sentence
unit divided
information
notation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001188509A
Other languages
English (en)
Inventor
Keiko Inagaki
敬子 稲垣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2001188509A priority Critical patent/JP2003005776A/ja
Publication of JP2003005776A publication Critical patent/JP2003005776A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】二つの辞書を必要とせず、通常使用しない表記
の単語を選ばない。 【解決手段】単語の表記,読みとアクセント,品詞情報
及び単語の表記の入力文中でのに出現頻度の情報を記憶
した辞書3を備え、形態素解析手段1により、入力文を
受け辞書3を用いて単語の表記の単位に分割した単語単
位分割文を出力し、単語候補選択手段2により、この単
語単位分割文を複数受けたときにこれらの文のうちか
ら、辞書3内の頻度情報を使用して最も出現頻度の高い
単語の表記の組に分割された文を選択し、音声波形発生
手段により、この選択した文内のそれぞれの単語の表記
に対して辞書3を使用して単語の読みとアクセントをそ
れぞれ付与した発音情報を生成し、この発音情報に基づ
いて単語単位分割文全体のイントネーションとリズムと
を示す韻律情報を生成し、発音情報と韻律情報とに基づ
いて音声波形を生成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声合成装置に関
し、特に漢字かな混じり文に応じた音声波形を生成する
音声合成装置に関する。
【0002】
【従来の技術】従来、この種の音声合成装置は、入力し
た漢字かな混じり文を正しい単語の読みとアクセント及
び正しいイントネーションとリズムにより読み上げるた
めに用いられている。
【0003】この従来の音声合成装置のブロック図であ
る図6を参照すると、従来の音声合成装置は、単語の表
記,単語の読みとアクセント及び単語の品詞情報を単語
の表記毎に記憶した辞書と、漢字かな混じり文(入力
文)を受け辞書を用いてこの漢字かな混じり文を単語の
表記の単位に分割した単語単位分割文を作成しこの作成
した単語単位分割文が複数あるときには、例えば自立語
の数の最も少ない単語単位分割文を選んでこの選んだ単
語単位分割文を出力する形態素解析手段(この形態素解
析手段で行う形態素解析には種々の方法がある。例え
ば、文頭から辞書と照合し、文法的な接続関係をチェッ
クしながら順に単語系列に区分する「左最長一致法」と
呼ばれる方法があり、これは多くの日本語音声合成装置
の形態素解析に用いられている。)と、形態素解析手段
より漢字かな混じり文に対応する単語単位分割文を受け
この受けた単語単位分割文内のそれぞれの単語の表記に
対して辞書を使用して単語の読みとアクセントをそれぞ
れ付与しこの付与した単語単位分割文の発音情報と、こ
の単語単位分割文の発音情報から生成した単語単位分割
文全体のイントネーションとリズムとを示す韻律情報と
を基にして音声波形を生成する音声波形発生手段とを有
する構成である。
【0004】形態素解析手段で、漢字かな混じり文を辞
書を使用して単語の表記の単位に分割し単語単位分割文
を作成する場合、辞書にない表記の単語を未知語として
処理し、読みを付ける。この未知語の読み付け処理の性
能向上が、音声合成合成装置の読み誤り率の削減には効
果大であるため、未知語処理に関する様々な研究が行わ
れている。特に従来の合成音声装置は、入力テキストに
漢字かな混じり文を想定しているため、かな文字だけか
らなる文字列の読み誤り率は非常に高かった。これを回
避するため、例えば、特開2001−5479号公報に
記載の技術では、入力が漢字の混ざらない文字列であっ
ても、正確な読み上げを行えるように、漢字が混ざらな
い文字列には、英数仮名に特化した辞書を用いること
で、かな文字だけからなる文字列でも読み上げ精度を維
持しようとしている。しかし、この方法は、漢字が少し
でも混じった場合には対応できない。
【0005】かな文字列を多く含む文字列の読み上げ精
度を向上させるためのもう一つの方法として、一つの単
語に対し同音、同意味で異なる表記(異表記)を多数記
述する方法がある。例えば、「送信」に対し異表記とし
て、「そうしん」や「ソウシン」、「そう信」、「送し
ん」、「ソーシン」を登録しておき、漢字かな混じり
文、平仮名文、カタカナ文、口語文などが入力文であっ
た場合にも読み上げ精度を維持させる。これら異表記の
中には、他の表記と比べ、通常の漢字かな混じり文では
あまり見られない記述のものも含まれている。異表記が
多数登録されている辞書を用いて形態素解析を行うと、
解析結果として通常はあまり使われない単語列に分割さ
れてしまうことがある。例えば“秤”(名詞)の異表記
として”はかり”が登録されている辞書を用いて、「ト
ラックはかりに衝突しても。。。」という文を解析させ
ると、「はかりに」の部分を”は仮に”ではなく、”秤
に”の異表記”はかり”として解析してしてしまうこと
がある。この場合「はかりに」は”は仮に”と”秤に”
のどちらと解釈しても形態素解析上は正しいため、形態
素解析だけでどちらを選ぶかを判断することはできな
い。これを正しい単語に分割させるためには、文の意味
を考える必要がある。しかし、意味解析を行うには、辞
書の整備やシステムの構築にかかる工数が大きく、また
実現方法が確立されていないため、現在はどこの音声合
成装置にも搭載されていない。そのため現状では、辞書
に異表記を追加すればするほど、通常のかな漢字文の解
析精度が落ちる傾向にあり、最適な単語単位分割文の選
択方法を見つけることが重要課題となっている。
【0006】
【発明が解決しようとする課題】上述した従来の音声合
成装置は、形態素解析手段により、単語単位分割文を複
数作成したときには、例えば自立語の数の最も少ない単
語単位分割文を選ぶようにしているため、正しい単語単
位分割文が選ばれているか否か定かでないという問題が
ある。また、漢字かな混じりの辞書と英数仮名辞書を用
意し、漢字かな混じり文の解析には漢字かな混じりの辞
書、仮名列のみの文には英数仮名辞書を用いることで、
仮名列のみの文の解析精度を維持させているが、漢字か
な混じり文に関しては考慮されていない。そのため漢字
かな混じりの辞書に多数の異表記を登録すると、通常は
あまり使われない表記の単語が選ばれるおそれがあると
いう問題がある。
【0007】本発明の目的はこのような従来の欠点を除
去するため、定かに正しい単語単位分割文を選び、漢字
かな混じり辞書と英数仮名辞書との性質の異なる二つの
辞書を必要とせず、通常あまり使われない表記の単語が
選ばれるおそれのない音声合成装置を提供することにあ
る。
【0008】
【課題を解決するための手段】本発明の第1の音声合成
装置は、漢字かな混じり文を受けこの漢字かな混じり文
を単語の表記を単位にして分割しこの分割した単語単位
分割文を出力する形態素解析手段と、前記形態素解析手
段より前記漢字かな混じり文に対応する前記単語単位分
割文を受けこの受けた単語単位分割文が複数あるときに
この複数の前記単語単位分割文のうちから、最も出現頻
度の高い前記単語の前記表記の組に分割された前記単語
単位分割文を選択する単語候補選択手段と、前記単語候
補選択手段により選択した前記単語単位分割文内のそれ
ぞれの前記単語の前記表記に対して前記単語の前記読み
とアクセントをそれぞれ付与して前記単語単位分割文の
発音情報とし、この単語単位分割文の前記発音情報に基
づいて前記単語単位分割文全体のイントネーションとリ
ズムとを示す韻律情報を生成し、前記発音情報と前記韻
律情報とに基づいて音声波形を生成する音声波形発生手
段と、を備えて構成されている。
【0009】本発明の第2の音声合成装置は、漢字かな
混じり文を受けこの漢字かな混じり文を単語の表記を単
位にして分割しこの分割した単語単位分割文を出力する
形態素解析手段と、前記形態素解析手段より前記漢字か
な混じり文に対応する前記単語単位分割文を受けこの受
けた単語単位分割文が複数あるときにこの複数の前記単
語単位分割文のうちから、この単語単位分割文内のそれ
ぞれの前記単語の前記表記にそれぞれ対応した、漢字か
な混じり文に出現する頻度を示すそれぞれの予め定めた
頻度情報の前記単語単位分割文全体における評価が最も
高い前記単語単位分割文を選択する単語候補選択手段
と、前記単語候補選択手段により選択した前記単語単位
分割文内のそれぞれの前記単語の前記表記に対して前記
単語の前記読みとアクセントをそれぞれ付与して前記単
語単位分割文の発音情報とし、この単語単位分割文の前
記発音情報に基づいて前記単語単位分割文全体のイント
ネーションとリズムとを示す韻律情報を生成し、前記発
音情報と前記韻律情報とに基づいて音声波形を生成する
音声波形発生手段と、を備えて構成されている。
【0010】本発明の第3の音声合成装置は、単語の表
記,前記単語の読みとアクセント,前記単語の品詞情報
及び前記単語の前記表記が漢字かな混じり文中に出現す
る頻度を示す頻度情報を前記単語の前記表記毎に記憶し
た辞書と、前記漢字かな混じり文を受け前記辞書を用い
てこの漢字かな混じり文を前記単語の前記表記の単位に
分割した単語単位分割文を出力する形態素解析手段と、
前記形態素解析手段より前記漢字かな混じり文に対応す
る前記単語単位分割文を受けこの受けた単語単位分割文
が複数あるときにこの複数の前記単語単位分割文のうち
から、前記辞書内の前記頻度情報を使用して最も出現頻
度の高い前記単語の前記表記の組に分割された前記単語
単位分割文を選択する単語候補選択手段と、前記単語候
補選択手段により選択した前記単語単位分割文内のそれ
ぞれの前記単語の前記表記に対して前記辞書を使用して
前記単語の前記読みとアクセントをそれぞれ付与して前
記単語単位分割文の発音情報とし、この単語単位分割文
の前記発音情報に基づいて前記単語単位分割文全体のイ
ントネーションとリズムとを示す韻律情報を生成し、前
記発音情報と前記韻律情報とに基づいて音声波形を生成
する音声波形発生手段と、を備えて構成されている。
【0011】また、本発明の第3の音声合成装置は、前
記漢字かな混じり文の分野に対応する複数の前記頻度情
報を前記単語の前記表記毎に記憶した前記辞書と、前記
漢字かな混じり文の分野を示す分野情報を受けこの分野
情報に対応する前記辞書内の前記頻度情報を使用して、
前記形態素解析手段より受けた複数の前記単語単位分割
文のうちから、最も出現頻度の高い前記単語の前記表記
の組に分割された前記単語単位分割文を選択する前記単
語候補選択手段と、を備えて構成されている。
【0012】本発明の第4の音声合成装置は、単語の表
記,前記単語の読みとアクセント,前記単語の品詞情報
及び前記単語の前記表記が漢字かな混じり文中に出現す
る頻度を示す頻度情報を前記単語の前記表記毎に記憶し
た辞書と、前記漢字かな混じり文を受け前記辞書を用い
てこの漢字かな混じり文を前記単語の前記表記の単位に
分割した単語単位分割文を出力する形態素解析手段と、
前記形態素解析手段より前記漢字かな混じり文に対応す
る前記単語単位分割文を受けこの受けた単語単位分割文
が複数あるときにこの複数の前記単語単位分割文のうち
の、この単語単位分割文内のそれぞれの前記単語の前記
表記にそれぞれ対応した、前記辞書内のそれぞれの前記
頻度情報の前記単語単位分割文全体における評価が最も
高い前記単語単位分割文を選択する単語候補選択手段
と、前記単語候補選択手段により選択した前記単語単位
分割文内のそれぞれの前記単語の前記表記に対して前記
辞書を使用して前記単語の前記読みとアクセントをそれ
ぞれ付与して前記単語単位分割文の発音情報とし、この
単語単位分割文の前記発音情報に基づいて前記単語単位
分割文全体のイントネーションとリズムとを示す韻律情
報を生成し、前記発音情報と前記韻律情報とに基づいて
音声波形を生成する音声波形発生手段と、を備えて構成
されている。
【0013】また、本発明の第4の音声合成装置は、前
記漢字かな混じり文の分野に対応する複数の前記頻度情
報を前記単語の前記表記毎に記憶した前記辞書と、前記
漢字かな混じり文の分野を示す分野情報を受けこの分野
情報に対応する前記辞書内の前記頻度情報を使用して、
前記形態素解析手段より受けた複数の前記単語単位分割
文のうちから、この単語単位分割文内のそれぞれの前記
単語の前記表記にそれぞれ対応した、それぞれの前記頻
度情報の前記単語単位分割文全体における評価が最も高
い前記単語単位分割文を選択する単語候補選択手段と、
を備えて構成されている。
【0014】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。
【0015】図1は、本発明の音声合成装置の一つの実
施の形態を示すブロック図である。
【0016】図1に示す本実施の形態は、単語の表記,
単語の読みとアクセント,単語の品詞情報及び単語の表
記が漢字かな混じり文中に出現する頻度を示す頻度情報
を単語の表記毎に記憶した辞書3と、漢字かな混じり文
を受け辞書3を用いてこの漢字かな混じり文を単語の表
記の単位に分割した単語単位分割文を出力する形態素解
析手段1と、形態素解析手段1より漢字かな混じり文に
対応する単語単位分割文を受けこの受けた単語単位分割
文が複数あるときにこの複数の単語単位分割文のうちか
ら、辞書3内の頻度情報を使用して最も出現頻度の高い
単語の表記の組に分割された単語単位分割文を選択す
る、すなわち、この複数の単語単位分割文のうちの、こ
の単語単位分割文内のそれぞれの単語の表記にそれぞれ
対応した、辞書3内のそれぞれの頻度情報の単語単位分
割文全体における評価が最も高い単語単位分割文を選択
する単語候補選択手段2と、単語候補選択手段2により
選択した単語単位分割文内のそれぞれの単語の表記に対
して辞書3を使用して単語の読みとアクセントをそれぞ
れ付与して単語単位分割文の発音情報とし、この単語単
位分割文の発音情報に基づいて単語単位分割文全体のイ
ントネーションとリズムとを示す韻律情報を生成し、発
音情報と韻律情報とに基づいて音声波形を生成する音声
波形発生手段とにより構成されている。
【0017】音声波形発生手段は、単語候補選択手段2
により選択した単語単位分割文内のそれぞれの単語の表
記に対して辞書3を使用して単語の読みとアクセントを
それぞれ付与して単語単位分割文の発音情報を生成する
発音情報生成手段4と、発音情報生成手段4が生成した
発音情報から単語単位分割文全体のイントネーションと
リズムとを示す韻律情報を生成する韻律情報生成手段5
と、単語単位分割文の発音情報(例えば、それぞれの単
語の読みとアクセント等)と韻律情報(例えば、イント
ネーションとリズム等)とを基にして音声を音声合成す
るための細かな単位に分割したデータである音声波形デ
ータ7を用いて音声波形を生成する音声波形生成手段6
とにより構成されている。
【0018】単語候補選択手段2は、単語の表記が漢字
かな混じり文に出現する頻度を示す予め定めた数値であ
る頻度情報の単語単位分割文全体における合計が最も大
である単語単位分割文を選択するようにしている。
【0019】次に、本実施の形態の音声合成装置の動作
を図2及び図3を参照して詳細に説明する。
【0020】図2は、漢字かな混じり文に対応する複数
の単語単位分割文とこららの頻度情報の一例を示す図で
あり、入力した漢字かな混じり文の一部(そう信じ)と
二つの単語単位分割文の一部(そう信/じ、そう/信
じ)とこれらの頻度情報(「そう信」の頻度は2、
「じ」の頻度は1、「そう」の頻度は5、「信じ」の頻
度は5)とこの合計とを示している。
【0021】図3は、辞書の記憶内容の一例を示す図で
あり、単語の表記,単語の読みとアクセント(’で示す
部分にアクセントがある),単語の品詞情報及び単語の
頻度情報を単語の表記毎に記憶している様子を示してい
る。頻度情報(出現頻度と記載。)は、表記が文中に現
れる頻度を示す数値であり、この数値としては、例え
ば、ほとんど使われない表記である場合は1、他の表記
の方が一般的であるが1よりも使われることがある場合
を2、2より多い出現頻度だが4よりも低い場合を3、
最も多く出現するわけではないが3より上である場合は
4、他の記述よりも明らかに使われることが多い場合を
5として付与する。
【0022】図1において、単語の表記,単語の読みと
アクセント,単語の品詞情報及び単語の表記が漢字かな
混じり文中に出現する頻度を示す頻度情報を単語の表記
毎に記憶した辞書3を予め定めた用意しておく。形態素
解析手段1により、漢字かな混じり文(例えば、「田中
氏はそう信じ、疑わなかった。」)を入力しこの入力し
た漢字かな混じり文(入力文)を辞書3を用いて単語の
表記の単位に分割した単語単位分割文を作成する。この
とき、「そう信じ」の単語分割候補として「そう信/
じ」(”送信時“の意)と「そう/信じ」(”そう
“と”信じる“の連用中止の意)の2候補(すなわち、
2つの単語単位分割文)が求められる。単語候補選択手
段2は、形態素解析手段1より2つの単語単位分割文を
受け、この2つの候補(「そう信/じ」と「そう/信
じ」)に対し辞書3を用いて、個々の単語の頻度を求
め、それら候補の中から合計の大きい方を選択する。す
なわち、図2に示す「そう信じ」の2候補の形態素解析
結果(単語分割)と頻度情報及び合計より、候補1の頻
度合計が3、候補2の頻度合計が10であるため、候補
2が選択され、発音情報生成手段4には「そう/信じ」
という単語分割結果を含む単語単位分割文のみが送られ
る。発音情報生成手段4は、単語候補選択手段2により
選択した単語単位分割文内のそれぞれの単語の表記に対
して辞書3を使用して単語の読みとアクセントをそれぞ
れ付与して単語単位分割文の発音情報を生成する。
【0023】韻律情報生成手段5は、発音情報生成手段
4が生成した発音情報から単語単位分割文全体のイント
ネーションとリズムとを示す韻律情報を生成する。すな
わち、韻律情報生成手段5は、発音情報生成手段4が生
成した入力文の発音情報に基づいて入力文を読み上げる
際のリズムやイントネーションのパタンを生成する。韻
律情報生成手段5には、リズムを決めるための継続時間
長制御とイントネーションを決めるためのピッチパタン
制御がある。継続時間長制御としては、例えば母音の中
心(その母音らしい安定したスペクトルを示す時刻)の
間隔を一定に保つ母音中心の間隔の制御を基本とした継
続時間長制御のモデルがある。このモデルでは、合成音
声中の母音間時間長を発話速度、母音の種別、先行する
音韻の種別、アクセント位置などの情報を用いて統計的
に推定を行うものである。ピッチパタン制御には、例え
ば文を構成する各アクセント句の品詞の情報や文中での
位置情報により正規化ピッチパタンを推定したあとアク
セント型によってその形状を補正する方法がある。正規
化ピッチパタンは、文中の各アクセント句の最初の母音
中心のピッチ周波数、ピーク周波数、アクセント句の最
後の母音中心点のピッチ周波数を取り出し、文の先頭ア
クセント句のピークのピッチ周波数で、それぞれの値を
割った値がつくるパタンである。
【0024】音声波形生成手段6は、発音情報生成手段
4が生成した発音情報と韻律情報生成手段5が生成した
韻律情報とを基にして音声を音声合成するための細かな
単位に分割したデータである音声波形データ7を用いて
音声波形を生成する。すなわち、音声波形生成手段6
は、韻律情報生成手段5が生成したリズムやイントネー
ションパタンにしたがって、音声波形データ7にあらか
じめ蓄えておいた音声を編集して入力文に対する音声信
号を生成する。音声波形データ7には、大量の単語や文
を発声した音声を、合成するための細かい単位に分割し
て蓄積しておく。合成する単位としては、例えば子音と
母音の前半部分(CV)、母音の後半部分と子音(V
C)の単位を用いることができる。音声波形生成手段6
は、単位音声の前後の音素環境と合成したい音声の音素
環境が出来るだけ一致するように音声波形データ7より
単位音声を選択する。選択された単位音声は、韻律情報
生成手段5が生成したリズムやイントネーションパタン
に合わせて、継続時間長の調節やピッチ周波数の変更を
行いながら単位音声を編集する。単位音声どうしを接続
する際の方法や接続する位置は、あらかじめそれぞれの
音素の性質に合わせて決めておく。また接続点では、そ
れぞれの単位音声が滑らかにつながるように補間処理を
行う。このようにして編集された音声データを元に実際
の音声波形を生成する方式としては、例えば波形編集方
式がある。
【0025】以上の説明では、辞書3に、単語の表記毎
に一つの頻度情報をそれぞれ記憶しておき、形態素解析
手段1により、入力した漢字かな混じり文をこの辞書3
を用いて単語の表記の単位に分割した単語単位分割文に
して出力し、単語候補選択手段2により、形態素解析手
段1より漢字かな混じり文に対応する単語単位分割文を
受けこの受けた単語単位分割文が複数あるときにこの複
数の単語単位分割文のうちから、辞書3内のこの頻度情
報を使用して最も出現頻度の高い単語の表記の組に分割
された単語単位分割文を選択するようにしたが、漢字か
な混じり文の分野(例えば、電子メール、新聞、技術論
文、住所録等。)に対応する複数の頻度情報を単語の表
記毎に記憶した、分野別頻度情報を備えた辞書の記憶内
容の一例を示す図である図4に示す辞書9を備え、分野
別頻度情報を使用した音声合成装置の一つの実施の形態
を示すブロック図である図5に示すようにして、単語候
補選択手段8により、漢字かな混じり文の分野を示す分
野情報を受け(この情報は、本装置の外部よりユーザの
指示により受けても良く、また、入力した漢字かな混じ
り文を調べてこの入力文の分野を決め、この決めた分野
情報を受けても良い。)この分野情報に対応する頻度情
報をこの辞書9より得て、この得た頻度情報を使用して
形態素解析手段1より受けた複数の単語単位分割文のう
ちから、最も出現頻度の高い単語の表記の組に分割され
た単語単位分割文を選択するようにしてもよい。
【0026】
【発明の効果】以上説明したように、本発明の音声合成
装置によれば、単語の表記,単語の読みとアクセント,
単語の品詞情報及び単語の表記が漢字かな混じり文中に
出現する頻度を示す頻度情報を単語の表記毎に記憶した
辞書を備え、形態素解析手段により、漢字かな混じり文
を受け辞書を用いてこの漢字かな混じり文を単語の表記
の単位に分割した単語単位分割文を出力し、単語候補選
択手段により、形態素解析手段より漢字かな混じり文に
対応する単語単位分割文を受けこの受けた単語単位分割
文が複数あるときにこの複数の単語単位分割文のうちか
ら、辞書内の頻度情報を使用して最も出現頻度の高い単
語の表記の組に分割された単語単位分割文を選択し、音
声波形発生手段により、単語候補選択手段により選択し
た単語単位分割文内のそれぞれの単語の表記に対して辞
書を使用して単語の読みとアクセントをそれぞれ付与し
て単語単位分割文の発音情報とし、この単語単位分割文
の発音情報に基づいて単語単位分割文全体のイントネー
ションとリズムとを示す韻律情報を生成し、発音情報と
韻律情報とに基づいて音声波形を生成するため、単語候
補選択手段により、辞書内の頻度情報を使用して最も出
現頻度の高い単語の表記の組に分割された単語単位分割
文を選択するので、定かに正しい単語単位分割文を選ぶ
ことができ、また、単語の表記が漢字かな混じり文中に
出現する頻度を示す頻度情報を単語の表記毎に記憶した
辞書を備えたので、漢字かな混じり辞書と英数仮名辞書
との性質の異なる二つの辞書が必要とならず、更に、単
語の表記が漢字かな混じり文中に出現する頻度を示す頻
度情報を単語の表記毎に記憶した辞書を備え、単語候補
選択手段により、辞書内の頻度情報を使用して最も出現
頻度の高い単語の表記の組に分割された単語単位分割文
を選択するので、通常はあまり使われない表記の単語が
選ばれるおそれがない。
【0027】また、漢字かな混じり文の分野に対応する
複数の頻度情報を単語の表記毎に記憶した辞書を備え、
単語候補選択手段により、漢字かな混じり文の分野を示
す分野情報を受けこの分野情報に対応する頻度情報をこ
の辞書より得て、この得た頻度情報を使用して、形態素
解析手段より受けた複数の単語単位分割文のうちから、
最も出現頻度の高い単語の表記の組に分割された単語単
位分割文を選択するようにしたため、漢字かな混じり文
の分野に応じた頻度情報により単語単位分割文を選択す
るので、より正しい読み上げが可能となる。
【図面の簡単な説明】
【図1】本発明の音声合成装置の一つの実施の形態を示
すブロック図である。
【図2】漢字かな混じり文に対応する複数の単語単位分
割文とこららの頻度情報の一例を示す図である。
【図3】辞書の記憶内容の一例を示す図である。
【図4】分野別頻度情報を備えた辞書の記憶内容の一例
を示す図である。
【図5】分野別頻度情報を使用した音声合成装置の一つ
の実施の形態を示すブロック図である。
【図6】従来の音声合成装置のブロック図である。
【符号の説明】
1 形態素解析手段 2 単語候補選択手段 3 辞書 4 発音情報生成手段 5 韻律情報生成手段 6 音声波形生成手段 7 音声波形データ 8 単語候補選択手段 9 辞書

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 漢字かな混じり文を受けこの漢字かな混
    じり文を単語の表記を単位にして分割しこの分割した単
    語単位分割文を出力する形態素解析手段と、 前記形態素解析手段より前記漢字かな混じり文に対応す
    る前記単語単位分割文を受けこの受けた単語単位分割文
    が複数あるときにこの複数の前記単語単位分割文のうち
    から、最も出現頻度の高い前記単語の前記表記の組に分
    割された前記単語単位分割文を選択する単語候補選択手
    段と、 前記単語候補選択手段により選択した前記単語単位分割
    文内のそれぞれの前記単語の前記表記に対して前記単語
    の前記読みとアクセントをそれぞれ付与して前記単語単
    位分割文の発音情報とし、この単語単位分割文の前記発
    音情報に基づいて前記単語単位分割文全体のイントネー
    ションとリズムとを示す韻律情報を生成し、前記発音情
    報と前記韻律情報とに基づいて音声波形を生成する音声
    波形発生手段と、 を備えたことを特徴とする音声合成装置。
  2. 【請求項2】 漢字かな混じり文を受けこの漢字かな混
    じり文を単語の表記を単位にして分割しこの分割した単
    語単位分割文を出力する形態素解析手段と、 前記形態素解析手段より前記漢字かな混じり文に対応す
    る前記単語単位分割文を受けこの受けた単語単位分割文
    が複数あるときにこの複数の前記単語単位分割文のうち
    から、この単語単位分割文内のそれぞれの前記単語の前
    記表記にそれぞれ対応した、漢字かな混じり文に出現す
    る頻度を示すそれぞれの予め定めた頻度情報の前記単語
    単位分割文全体における評価が最も高い前記単語単位分
    割文を選択する単語候補選択手段と、 前記単語候補選択手段により選択した前記単語単位分割
    文内のそれぞれの前記単語の前記表記に対して前記単語
    の前記読みとアクセントをそれぞれ付与して前記単語単
    位分割文の発音情報とし、この単語単位分割文の前記発
    音情報に基づいて前記単語単位分割文全体のイントネー
    ションとリズムとを示す韻律情報を生成し、前記発音情
    報と前記韻律情報とに基づいて音声波形を生成する音声
    波形発生手段と、 を備えたことを特徴とする音声合成装置。
  3. 【請求項3】 前記音声波形発生手段は、前記単語候補
    選択手段により選択した前記単語単位分割文内のそれぞ
    れの前記単語の前記表記に対して前記単語の前記読みと
    アクセントをそれぞれ付与して前記単語単位分割文の前
    記発音情報を生成する発音情報生成手段と、 前記発音情報生成手段が生成した前記発音情報から前記
    単語単位分割文全体のイントネーションとリズムとを示
    す前記韻律情報を生成する韻律情報生成手段と、 前記単語単位分割文の前記発音情報と前記韻律情報とを
    基にして音声を音声合成するための細かな単位に分割し
    たデータである音声波形データを用いて音声波形を生成
    する音声波形生成手段と、 を備えたことを特徴とする請求項1又は2記載の音声合
    成装置。
  4. 【請求項4】 単語の表記,前記単語の読みとアクセン
    ト,前記単語の品詞情報及び前記単語の前記表記が漢字
    かな混じり文中に出現する頻度を示す頻度情報を前記単
    語の前記表記毎に記憶した辞書と、 前記漢字かな混じり文を受け前記辞書を用いてこの漢字
    かな混じり文を前記単語の前記表記の単位に分割した単
    語単位分割文を出力する形態素解析手段と、 前記形態素解析手段より前記漢字かな混じり文に対応す
    る前記単語単位分割文を受けこの受けた単語単位分割文
    が複数あるときにこの複数の前記単語単位分割文のうち
    から、前記辞書内の前記頻度情報を使用して最も出現頻
    度の高い前記単語の前記表記の組に分割された前記単語
    単位分割文を選択する単語候補選択手段と、 前記単語候補選択手段により選択した前記単語単位分割
    文内のそれぞれの前記単語の前記表記に対して前記辞書
    を使用して前記単語の前記読みとアクセントをそれぞれ
    付与して前記単語単位分割文の発音情報とし、この単語
    単位分割文の前記発音情報に基づいて前記単語単位分割
    文全体のイントネーションとリズムとを示す韻律情報を
    生成し、前記発音情報と前記韻律情報とに基づいて音声
    波形を生成する音声波形発生手段と、 を備えたことを特徴とする音声合成装置。
  5. 【請求項5】 単語の表記,前記単語の読みとアクセン
    ト,前記単語の品詞情報及び前記単語の前記表記が漢字
    かな混じり文中に出現する頻度を示す頻度情報を前記単
    語の前記表記毎に記憶した辞書と、 前記漢字かな混じり文を受け前記辞書を用いてこの漢字
    かな混じり文を前記単語の前記表記の単位に分割した単
    語単位分割文を出力する形態素解析手段と、 前記形態素解析手段より前記漢字かな混じり文に対応す
    る前記単語単位分割文を受けこの受けた単語単位分割文
    が複数あるときにこの複数の前記単語単位分割文のうち
    の、この単語単位分割文内のそれぞれの前記単語の前記
    表記にそれぞれ対応した、前記辞書内のそれぞれの前記
    頻度情報の前記単語単位分割文全体における評価が最も
    高い前記単語単位分割文を選択する単語候補選択手段
    と、 前記単語候補選択手段により選択した前記単語単位分割
    文内のそれぞれの前記単語の前記表記に対して前記辞書
    を使用して前記単語の前記読みとアクセントをそれぞれ
    付与して前記単語単位分割文の発音情報とし、この単語
    単位分割文の前記発音情報に基づいて前記単語単位分割
    文全体のイントネーションとリズムとを示す韻律情報を
    生成し、前記発音情報と前記韻律情報とに基づいて音声
    波形を生成する音声波形発生手段と、 を備えたことを特徴とする音声合成装置。
  6. 【請求項6】 前記漢字かな混じり文の分野に対応する
    複数の前記頻度情報を前記単語の前記表記毎に記憶した
    前記辞書と、 前記漢字かな混じり文の分野を示す分野情報を受けこの
    分野情報に対応する前記辞書内の前記頻度情報を使用し
    て、前記形態素解析手段より受けた複数の前記単語単位
    分割文のうちから、最も出現頻度の高い前記単語の前記
    表記の組に分割された前記単語単位分割文を選択する前
    記単語候補選択手段と、 を備えたことを特徴とする請求項4記載の音声合成装
    置。
  7. 【請求項7】 前記漢字かな混じり文の分野に対応する
    複数の前記頻度情報を前記単語の前記表記毎に記憶した
    前記辞書と、 前記漢字かな混じり文の分野を示す分野情報を受けこの
    分野情報に対応する前記辞書内の前記頻度情報を使用し
    て、前記形態素解析手段より受けた複数の前記単語単位
    分割文のうちから、この単語単位分割文内のそれぞれの
    前記単語の前記表記にそれぞれ対応した、それぞれの前
    記頻度情報の前記単語単位分割文全体における評価が最
    も高い前記単語単位分割文を選択する単語候補選択手段
    と、 を備えたことを特徴とする請求項5記載の音声合成装
    置。
  8. 【請求項8】 前記音声波形発生手段は、 前記単語候補選択手段により選択した前記単語単位分割
    文内のそれぞれの前記単語の前記表記に対して前記辞書
    を使用して前記単語の前記読みとアクセントをそれぞれ
    付与して前記単語単位分割文の発音情報を生成する発音
    情報生成手段と、 前記発音情報生成手段が生成した前記発音情報から前記
    単語単位分割文全体のイントネーションとリズムとを示
    す韻律情報を生成する韻律情報生成手段と、 前記単語単位分割文の前記発音情報と前記韻律情報とを
    基にして音声を音声合成するための細かな単位に分割し
    たデータである音声波形データを用いて音声波形を生成
    する音声波形生成手段と、 を備えたことを特徴とする請求項4、5、6又は7記載
    の音声合成装置。
  9. 【請求項9】 前記単語候補選択手段は、前記単語の前
    記表記が前記漢字かな混じり文に出現する頻度を示す予
    め定めた数値である前記頻度情報の前記単語単位分割文
    全体における合計が最も大である前記単語単位分割文を
    選択するようにしたことを特徴とする請求項2、4、
    5、6、7又は8記載の音声合成装置。
JP2001188509A 2001-06-21 2001-06-21 音声合成装置 Withdrawn JP2003005776A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001188509A JP2003005776A (ja) 2001-06-21 2001-06-21 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001188509A JP2003005776A (ja) 2001-06-21 2001-06-21 音声合成装置

Publications (1)

Publication Number Publication Date
JP2003005776A true JP2003005776A (ja) 2003-01-08

Family

ID=19027598

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001188509A Withdrawn JP2003005776A (ja) 2001-06-21 2001-06-21 音声合成装置

Country Status (1)

Country Link
JP (1) JP2003005776A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004226505A (ja) * 2003-01-20 2004-08-12 Toshiba Corp ピッチパタン生成方法、音声合成方法とシステム及びプログラム
WO2007006769A1 (en) 2005-07-12 2007-01-18 International Business Machines Corporation System, program, and control method for speech synthesis
JP2008158998A (ja) * 2006-12-26 2008-07-10 Yafoo Japan Corp 語句又は文章分析方法、サーバ
JP2012141681A (ja) * 2010-12-28 2012-07-26 Yahoo Japan Corp クエリセグメント位置決定装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004226505A (ja) * 2003-01-20 2004-08-12 Toshiba Corp ピッチパタン生成方法、音声合成方法とシステム及びプログラム
WO2007006769A1 (en) 2005-07-12 2007-01-18 International Business Machines Corporation System, program, and control method for speech synthesis
CN101223572B (zh) * 2005-07-12 2011-07-06 纽昂斯通讯公司 用于语音合成的***、程序和控制方法
US8751235B2 (en) 2005-07-12 2014-06-10 Nuance Communications, Inc. Annotating phonemes and accents for text-to-speech system
JP2008158998A (ja) * 2006-12-26 2008-07-10 Yafoo Japan Corp 語句又は文章分析方法、サーバ
JP2012141681A (ja) * 2010-12-28 2012-07-26 Yahoo Japan Corp クエリセグメント位置決定装置

Similar Documents

Publication Publication Date Title
US6778962B1 (en) Speech synthesis with prosodic model data and accent type
KR900009170B1 (ko) 규칙합성형 음성합성시스템
US6477495B1 (en) Speech synthesis system and prosodic control method in the speech synthesis system
JP5198046B2 (ja) 音声処理装置及びそのプログラム
WO2004066271A1 (ja) 音声合成装置,音声合成方法および音声合成システム
Narasimhan et al. Schwa-deletion in Hindi text-to-speech synthesis
JP2003005776A (ja) 音声合成装置
JPH06282290A (ja) 自然言語処理装置およびその方法
JP3371761B2 (ja) 氏名読み音声合成装置
JP3589972B2 (ja) 音声合成装置
JPH07262191A (ja) 単語分割方法、および音声合成装置
JPH06318094A (ja) 音声規則合成装置
JPH11338498A (ja) 音声合成装置
JP3279261B2 (ja) 定型文コーパス作成装置、方法及び記録媒体
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法
JPH11212586A (ja) 音声合成装置
JPH08185197A (ja) 日本語解析装置、及び日本語テキスト音声合成装置
JPH06176023A (ja) 音声合成システム
JPH08160983A (ja) 音声合成装置
Tian et al. Modular design for Mandarin text-to-speech synthesis
JPH05210482A (ja) 発音辞書管理方法
JPH10161847A (ja) 文章データ音声変換システム
JP2003308084A (ja) 音声合成方法および音声合成装置
JPH02234198A (ja) テキスト音声合成システム
Liang et al. A bi-lingual Mandarin-to-taiwanese text-to-speech system.

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050317

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20070118

A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080902