JP3357796B2 - 音声合成装置及び同装置における韻律情報生成方法 - Google Patents

音声合成装置及び同装置における韻律情報生成方法

Info

Publication number
JP3357796B2
JP3357796B2 JP23645296A JP23645296A JP3357796B2 JP 3357796 B2 JP3357796 B2 JP 3357796B2 JP 23645296 A JP23645296 A JP 23645296A JP 23645296 A JP23645296 A JP 23645296A JP 3357796 B2 JP3357796 B2 JP 3357796B2
Authority
JP
Japan
Prior art keywords
prosodic
prosody
word
words
strength
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP23645296A
Other languages
English (en)
Other versions
JPH1083192A (ja
Inventor
孝章 新居
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP23645296A priority Critical patent/JP3357796B2/ja
Publication of JPH1083192A publication Critical patent/JPH1083192A/ja
Application granted granted Critical
Publication of JP3357796B2 publication Critical patent/JP3357796B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、任意文章が与えら
れたとき、その文章の構造より、文章中の韻律語から構
成される韻律句間の境界強度を求め、この境界強度を用
いて韻律制御を行なうことにより、自然性の高い音声を
合成する音声合成装置及び同装置における韻律情報生成
方法に関する。
【0002】
【従来の技術】一般に、単語中の音節固有の特徴と単語
固有の特徴であるアクセント型に従った規則だけで単語
連鎖である文の音声を合成すると不自然になる。任意の
文章の音声合成において、より自然性の高い合成音声を
発声するためには、文の構文構造の解析が必要である。
文の解析結果は、韻律特徴を決めるための構造的な情報
を提供するので、韻律(イントネーション)の自然な制
御のためには、正確な構文構造だけでなく意味的な構造
や文脈情報までも必要であるといわれている。
【0003】ところで、従来のテキスト−音声変換シス
テムでは、限定された構文解析を行なっている。これら
の解析は種々の方法で行なわれている。品詞の分類を詳
細にし2つの隣合う形態素連鎖の特徴だけから韻律特徴
を推定する方法も提案されている。また連接する3文節
間の関係を使って韻律制御を行なう手法もある。
【0004】これらは文全体の構造を計算する際に、文
構造の曖昧性をなくし文の全体構造を唯一に定めるため
にコストがかかることと、構文構造と韻律構造の間に
は、間接的な関係があることが指摘され、文全体の構造
を得なくてもある程度の韻律制御が可能であることによ
る。
【0005】
【発明が解決しようとする課題】しかしながら、例えば
文末の「〜でしょうか」が疑問であるか疑念であるかに
よってピッチ形状が違うこと、「〜は〜で〜は〜だ」の
ように文全体で対比構造を持つ文では、対比部分を示す
ためポーズ(△部分:「〜は〜で(△)〜は〜だ」)
が、「〜は〜で〜だ」という文のポーズ(△部分:「〜
は(△)〜で〜だ」)と位置も大きさも違うことなど、
限定された文構造による構文情報によって韻律制御を行
なうと、正しく意味を伝達しない、聞き難い、不自然な
単調な発声になってしまうのである。
【0006】また、文全体の構文情報を用いて文章の自
然な韻律を生成しようとする場合においても、例えば
「あらゆる現実をすべて自分のほうへねじ曲げたの
だ。」という文のように1韻律句が長くなる際の適切な
処理には構文構造情報は対応しない。
【0007】本発明は上記事情を考慮してなされたもの
でその目的は、文全体のイントネーションの自然性を向
上させる柔軟な韻律制御が実現できる音声合成装置及び
同装置における韻律情報生成方法を提供することにあ
る。
【0008】
【課題を解決するための手段】本発明の音声合成装置
は、入力されたテキスト情報を対象とする形態素解析を
行ない、その解析結果から1つのアクセント型を決める
最小単位である韻律語を生成し、その韻律語の連鎖を形
成する韻律語形成手段と、上記韻律語の連鎖における各
韻律語間の依存強度を求める韻律語間依存強度決定手段
と、上記韻律語の連鎖における各韻律語間の依存強度を
基に韻律語間の係り受け関係を求める韻律語間係り受け
解析手段と、得られた係り受け関係から各韻律語の受け
数を求める韻律語受け数決定手段と、得られた韻律語間
の依存強度、係り受け関係、及び受け数のうちの少なく
とも1つを用いて隣接する韻律語間の結合強度を決定す
る隣接韻律語間結合強度決定手段と、得られた隣接韻律
語間の結合強度により韻律句の境界強度を決定する韻律
句境界強度決定手段と、上記韻律句境界強度を加味して
上記テキスト情報の韻律情報を生成する韻律情報生成手
段とを備えたことを特徴とする。
【0009】このような構成の音声合成装置において
は、文章中の韻律語から、韻律語間の依存強度、係り受
け構造、及び受け数のうちの少なくとも1つの情報を用
いて、隣接する韻律語間の結合強度を決定して韻律句間
の境界強度を求め、この境界強度を用いて韻律制御のた
めの韻律情報を生成することにより、韻律語を制御単位
とした簡便な処理で自然な韻律制御が可能となる。
【0010】ここで、韻律語間の依存強度を求めるの
に、各韻律語の文法属性間の相互依存関係を表す相互依
存関係テーブルを用いるとよい。また、隣接韻律語間結
合強度の決定に用いる係り受け関係として、テキスト情
報中の対象となる韻律語が文末までに係る韻律語数と後
続の韻律語が文末までに係る韻律語数との差を示す境界
の深さを用いるとよい。
【0011】また、上記韻律情報生成手段による韻律情
報生成においては、韻律語の連鎖に対して、予め定めら
れている1呼気に許される規定モーラ数、韻律句のモー
ラ数及び上記韻律句境界強度から各韻律句と後続する韻
律句との境界に設定する韻律制御指令を決定するように
するとよい。例えば、規定モーラ数以上のモーラ数を有
する韻律句については、該当する隣韻律語間結合強度を
もとに、当該韻律区内の韻律語間を分離し、規定モーラ
数よりも少ないモーラ数を有する韻律句については、後
続の韻律句の隣韻律語間結合強度をもとに、後続の韻律
句と融合して1つの呼気段落とするとよい。
【0012】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して説明する。図1は本発明の一実施形態
に係る音声合成装置の構成を示すブロック図である。
【0013】図1に示す音声合成装置は、入力部11、
言語処理部12、音韻処理部13、音響パラメータ生成
部14、音声波形生成部15及び出力部16から構成さ
れる。
【0014】ここで、上記した各構成要素の説明をする
前に韻律語について説明する。“韻律語”とは、言語音
上、有意義の最小単位である文節素連鎖において、その
連鎖中にピッチ変化が認められるもの(自律韻律素と呼
ぶ)、ピッチ変化が認められないもの(他律韻律素と呼
ぶ)の連鎖から、少なくとも1つの自律韻律素もしくは
語基(語の基本となる、それ以上分割できないもの)に
所属する他律韻律素自体、或いは少なくとも1つの自律
韻律素もしくは語基に所属する他律韻律素と、それに後
続する1個以上の助辞、接辞に所属する他律韻律素を結
合したものとする。
【0015】一般に、“形態素”は、有意義の言語形態
上の最小単位であり、語の構成要素である(森岡健二、
「語彙の形成」、明治書院1987)。そして、形態素
は語基、接辞、助辞に分類される。語基は概念もしくは
観念を示す形態で自由形式と束縛形式がある。形態素を
さらに分解すると音節の連鎖となり文節素連鎖に対応す
る。したがって文節素連鎖を通じて形態素と韻律素が対
応する。音声合成における音調処理の基本単位として自
律・他律韻律素を用い、その連鎖から構成されるものを
韻律語として用いる。
【0016】次に、上述の各構成要素について説明す
る。まず言語処理部12は、入力部11により入力され
る任意の文章(テキスト情報)、例えば漢字仮名交じり
文から韻律語を生成し、隣接韻律語間結合強度を決定す
る部分である。この言語処理部12は、韻律語形成部1
21、韻律語間依存強度決定部122、韻律語間係り受
け解析部123、韻律語受け数決定部124及び隣接韻
律語間結合強度決定部125からなる。
【0017】韻律語形成部121は、入力部11から送
られた漢字仮名交じり文を入力し、当該漢字仮名交じり
文を対象に(図示せぬ形態素解析用の辞書に登録されて
いる)形態素解析情報を参照して形態素解析を行って、
自律・他律韻律素を求め、韻律素連鎖を基に、自律韻律
素であるか他律韻律素であるかを判断し、少なくとも1
つの自律韻律素もしくは語基に所属する他律韻律素自体
により、或いは少なくとも1つの自律韻律素もしくは語
基に所属する他律韻律素と、それに後続する1個以上の
助辞、接辞に所属する他律韻律素を結合することで、韻
律語を構成する。このようにして、韻律語形成部121
にて韻律語の連鎖が形成される。
【0018】さて、上記形態素解析情報には、韻律素毎
に、文法属性名、読み、形態分類(語基、助辞、接
辞)、韻律素の分類(自律韻律素、他律韻律素)が含ま
れている他、自律韻律素である場合には、その基本アク
セント型が含まれている。韻律語形成部121は、この
形態素解析情報を参照することで、韻律語に属性(読
み、アクセント型、文法属性、韻律語のモーラ数)を設
定して出力する。
【0019】韻律語間依存強度決定部122は、韻律語
形成部121にて形成された韻律語連鎖を入力として、
韻律語に設定された文法属性情報を基に、文法属性間の
相互依存関係表(図示せず)を参照して、2つの韻律語
間に依存関係を設定する。この文法属性間の相互依存関
係表(相互依存関係テーブル)の内容例を図2に示す。
ここでは、2つの韻律語の文法属性の組み合わせ毎に、
その韻律語間の依存の強さの度合い(依存強度)が、2
0,40,60,80,100の5段階で予め登録され
ている。
【0020】韻律語間依存強度決定部122は、韻律語
形成部121にて形成された韻律語連鎖の先頭の韻律語
から末尾の韻律語に至るまで、文法属性間の相互依存関
係表を参照することで、すべての2つの韻律語間に依存
関係を設定し、その韻律語間に依存強度を設定する。
【0021】韻律語間係り受け解析部123は、韻律語
形成部121にて形成された韻律語連鎖の先頭の韻律語
から末尾の韻律語に至るすべての韻律語間の依存関係か
ら文中における係り受け関係を解析する。
【0022】この係り受け関係の解析においては、文構
造を表現するために、曖昧性を削減するための図3の例
に示すような原則を用いて韻律語間の係り受け関係を決
定する。この原則は次の通りである。
【0023】(原則1)係り受けのリンクは交差しない
(図3(a)参照) (原則2)前方の韻律語への修飾は禁止する(図3
(b)参照) (原則3)ある1つの韻律語は同時に2つ以上の韻律語
に係らない(図3(c)参照) (原則4)韻律語間の依存強度の強いものを優先する
(図3(d)参照) (原則5)ある1つの韻律語に依存し最近接するものを
優先する(図3(e)参照) 図4に、入力漢字仮名交じり文(入力テキスト情報)が
「あらゆる現実をすべて自分のほうへねじ曲げたの
だ。」という文の場合の、韻律語間係り受け解析部12
3での係り受け解析結果の例を示す。ここで、連続する
番号1,2,3,4,5,6が付された「あらゆる」
「現実を」「すべて」「自分の」「ほうへ」「ねじ曲げ
たのだ」の各語は韻律語である。この図4からは、例え
ば「あらゆる」の係り先は、番号2が付された「現実
を」であり、その依存強度は60であることが分かる。
【0024】韻律語受け数決定部124は、韻律語間係
り受け解析部123にて解析された文中における係り受
け関係から、それぞれの韻律語の受け数を決定する。受
け数は韻律語に係るリンクの数を受け数とする。図4に
は、この受け数の例も併せて示してある。
【0025】隣接韻律語間結合強度決定部125は、韻
律語間依存強度決定部122で得られた2つの韻律語間
の依存強度、韻律語間係り受け解析部123で得られた
係り受け関係から求められる係り受け構造における境界
の深さ、及び韻律語受け数決定部124で得られた受け
数の情報をもとに、隣接する韻律語間の結合強度を決定
する。ここで、境界の深さとは、隣接韻律語間結合強度
決定の対象となる文(入力テキスト情報)中の韻律語が
文末までに係る韻律語数と後続の韻律語が文末までに係
る韻律語数との差を示すもので、図4には、この境界の
深さの例も併せて示してある。
【0026】さて、上記隣接韻律語間の結合強度は、主
に言語情報をもとに、構文情報を考慮して、韻律語間の
境界の依存関係の強さを表すもので、以下の(a1)〜(a5)
の5種類の強度区分に分類される。
【0027】(a1)特殊境界 記号や括弧、引用などのように、言語外のもの(音声と
して発声しないもの)との関係などが、これに当たる。
ここでは、相互依存関係テーブル上で韻律語間依存強度
が20のものに相当する。この他、後続の韻律語の受け
数が0のものとの関係もこれに当たる。
【0028】(a2)独立境界 助詞「は」、「も」「について」などがつく名詞と用言
との関係や、接続助詞「から」、「たり」、「し」など
と用言との関係などの他、提題と叙述の依存関係など
が、これに当たる。ここでは、相互依存関係テーブル上
で韻律語間依存強度が40のものに相当する。この他、
読点、更には境界の深さが2以上で且つ後続の韻律語の
受け数が1以上の関係もこれに当たる。
【0029】(a3)連接境界 状況的な補語と用言との関係や、接続助詞「ので」、
「だから」などと用言との関係、用言の連用形と用言と
の関係、意図などを示す副詞と用言との関係などが、こ
れに当たる。ここでは、相互依存関係テーブル上で韻律
語間依存強度が60のものに相当する。この他、境界の
深さが0の関係(隣接韻律語間が依存するもの)も、こ
れに当たる。
【0030】(a4)連結境界 主語、目的語、補語と用言との関係、接続助詞「なが
ら」、「つつ」と用言の関係、時、場所などの副詞と用
言との関係、連体語と名詞との関係などが、これに当た
る。ここでは、相互依存関係テーブル上で韻律語間依存
強度が80のものに相当する。この他、境界の深さが1
で且つ後続の韻律語の受け数が1以上の関係も、これに
当たる。
【0031】(a5)結合境界 語を構成する接頭辞、接尾辞と名詞、用言との関係、用
言と助動詞、補助用言の連鎖などが、これに当たる。こ
こでは、相互依存関係テーブル上で韻律語間依存強度が
100のもの(接続して1文節に対応する)に相当す
る。
【0032】ここで、上記(a1)〜(a5)に区分される隣接
韻律語間結合強度は、(a1)の特殊境界が最も弱く、(a2)
→(a3)→(a4)の順で強くなり、(a5)の結合境界が最も強
い。以上の隣接韻律語間結合強度(の区分)は、韻律語
間依存強度決定部122で得られた2つの韻律語間の依
存強度、韻律語間係り受け解析部123で得られた係り
受け関係から求められる係り受け構造における境界の深
さ、及び韻律語受け数決定部124で得られた受け数の
情報をもとに、隣接韻律語間結合強度決定部125にて
決定される。この(言語処理部12内の)隣接韻律語間
結合強度決定部125で決定された韻律語連鎖における
隣接韻律語間結合強度の情報は音韻処理部13に渡され
る。
【0033】音韻処理部13は、この韻律語連鎖におけ
る隣接韻律語間結合強度の情報を基に、韻律句における
境界強度を決定してピッチパターンを生成するためのフ
レーズ立ち上げ位置やフレーズ指令の大きさ、ポーズ位
置、ポーズ長などの韻律情報(韻律制御情報)を求め
る。音韻処理部13はまた、得られた韻律情報等から、
韻律記号列と音韻記号列を生成する。この音韻処理部1
3で生成された韻律記号列と音韻記号列は音響パラメー
タ生成部14に渡される。
【0034】音響パラメータ生成部14は、音韻処理部
13から渡された韻律記号列と音韻記号列を基にして、
音声波形生成部15内の音声合成器(図示せず)を駆動
するための音響パラメータ系列を生成する。この系列
は、音声波形生成部15に送られて、出力部16を通じ
て出力される。
【0035】ここで音韻処理部13の詳細を説明する。
まず音韻処理部13は、韻律句境界強度決定部131、
韻律情報生成部132及び音韻記号・韻律記号生成部1
33からなる。
【0036】韻律句境界強度決定部131は、韻律語連
鎖から韻律句を形成し、韻律句の境界における強度を決
定する。韻律句は1つ以上の韻律語連鎖から構成され、
どの韻律語同士を結合するかは、言語処理部12から音
韻処理部13に渡された隣接韻律語間結合強度を韻律句
境界強度決定部131が参照することにより決定され
る。ここでは、予め規定した値100より強い結合強度
(値が100の結合強度)を有する2つの韻律語は融合
されて、韻律句として生成される。なお、ここで予め規
定した値は、適宜指定する値でもよい。
【0037】韻律句境界強度決定部131は、生成した
韻律句の境界において、言語処理部12から渡された対
応する隣接韻律語間結合強度を参照して、以下に示す韻
律句境界強度を決定する。これは韻律情報におけるピッ
チパターンを生成するための情報に対応するものであ
る。
【0038】さて、上記韻律句境界強度は、韻律上の境
界の強度を示すもので、以下の(b1)〜(b4)4種類の強度
区分に分類される。 (b1)独立境界 主に大きいポーズを挿入するか、または大きなフレーズ
の立ち上げ行なう境界に対応する。
【0039】(b2)連接境界 主に小さいポーズを挿入するか、またはフレーズの立ち
上げ行なう境界に対応する。
【0040】(b3)連結境界 主にフレーズの追加を行なう境界に対応する。 (b4)なし ポーズ、フレーズ共に追加しない(句境界にならない)
境界に対応する。
【0041】以上の(b1)〜(b4)の韻律句境界強度と前記
(a1)〜(a5)の隣接韻律語間結合強度との対応関係は以下
の通りである。 (b1)独立境界←→(a1)特殊境界、(a2)独立境界 (b2)連接境界←→(a3)連接境界 (b3)連結境界←→(a4)連結境界 (b4)なし ←→(a5)結合境界 韻律句境界強度決定部131では、上記した韻律句の境
界における強度を決定する際に、韻律句を構成する各韻
律語のアクセント処理を行ない、韻律句を構成する韻律
語連鎖における韻律句全体の読み、並びにモーラ数を決
定する。この韻律句境界強度決定部131での決定結果
は韻律情報生成部132に渡される。
【0042】韻律情報生成部132は、韻律句連鎖の入
力に対して、予め定められている1呼気に許されるモー
ラ数(規定モーラ数)と、韻律句に既に設定されている
モーラ数(韻律句のモーラ数)を参照して、韻律句境界
強度から当該韻律句と後続する韻律句との境界にどのよ
うな韻律制御指令を与えるか(韻律制御操作を施すか)
を判定する。
【0043】即ち韻律情報生成部132は、規定モーラ
数以上のモーラ数を有する韻律句については、韻律句を
構成している韻律語連鎖の中で、韻律語間の隣接韻律語
間結合度を参照することで、当該韻律句内の韻律語間を
分離したり、逆にモーラ数が少ない韻律句については、
後続の韻律句の隣接韻律語間結合度を参照することで融
合して1つの呼気段落とし、句境界に適切な韻律制御指
令を与える。
【0044】このように韻律情報生成部132は、再計
算をしながら次々と句境界の韻律制御指令を求める処理
を、最終の韻律句の処理が終わるまで続ける。図5及び
図6は、韻律情報生成のアルゴリズムを示したものであ
る。なお、ここで予め規定した値は、適時指定する値で
もよい。
【0045】上記韻律情報は、各句境界における韻律制
御指令の概算的レベルを示す。この韻律制御指令の概算
的レベルには、フレーズ立ち上げ指令の大きさの概算的
レベルと、ポーズ(休止区間長)挿入指令の大きさの概
算的レベルと、モーラ長指令値(規定モーラ数)の概算
的レベルとがある。
【0046】音韻記号・韻律記号生成部133における
上記韻律記号列の生成処理では、上記韻律制御指令(フ
レーズ立ち上げ指令、ポーズ挿入指令)の位置情報(フ
レーズ立ち上げ位置、ポーズ挿入位置)と概算的レベル
(各指令の大きさ)が記号に変換される。また、予め規
定している1呼気に許されるモーラ数などのモーラ長指
令値も同様に概算的レベルで示される。これは発声速度
などにより適時変更・指定してもよい。
【0047】本実施形態において、フレーズ立ち上げ指
令の大きさの概算的レベルは、(フ1),(フ2),
(フ3)の3レベルが設定されるようになっており、そ
の大小関係は(フ1)>(フ2)>(フ3)である。
【0048】また、ポーズ挿入指令の大きさの概算的レ
ベルは(ポ1),(ポ2),(ポ3)の3レベルが設定
されるようになっており、その大小関係は(ポ1)>
(ポ2)>(ポ3)である。
【0049】また、モーラ長指令値の概算的レベルは
S,T,Uの3レベルが設定されるようになっており、
その大小関係はU>T>Sである。なお、1文における
先頭には(フ1)、文末には(ポ1)を挿入するものと
する。また読点には(フ1)、(ポ1)を挿入するもの
とする。
【0050】さて本実施形態では、文中における韻律句
の連鎖には文頭から連続する番号n(n=1〜N、Nは
末尾の最終韻律句)が付与されている。韻律情報生成部
132での各韻律句境界における韻律情報の生成は、1
番目の韻律句から処理が始まり、N番目の韻律句の処理
が終了するまで、図5に示すアルゴリズムに従って行な
われる。以下、n番目の韻律句の処理を図5に示すアル
ゴリズムに従って説明する。
【0051】(処理1)まずn番目の韻律句において、
後続する韻律句との境界における境界強度(の区分)を
韻律句境界強度決定部131の結果から取得する処理を
行なう(ステップS2)。なお、nの初期値は1である
(ステップS1)。
【0052】(処理2)次に、ステップS2の結果、n
番目の韻律句において、後続する韻律句との境界(句境
界)における境界強度が独立境界であったならば(ステ
ップS3)、当該句境界に(フ2)、(ポ2)を挿入す
る(ステップS4〜S6)。
【0053】但し、直前の句境界(フ1)または(フ
2)からの距離がSモーラ以下ならば(ステップS
4)、当該句境界に(フ3)、(ポ2)を挿入する(ス
テップS7)。
【0054】また直後の文末までの距離がTモーラ以下
の場合は、当該句境界に(フ3)のみを挿入する(ステ
ップS8)。この場合、直前の独立境界からの距離がU
モーラ以上離れているならば(ステップS9)、休止を
伴わない連接境界において、(ポ3)を挿入する(ステ
ップS10)。
【0055】次にnがNに一致しないならば、当該nを
1インクリメントし(ステップS11,S12)、上記
(処理1の)ステップS2に戻り処理を続ける。 (処理3)一方、n番目の韻律句において、後続する韻
律句との境界における境界強度(の区分)が(独立境界
ではなくて)連結境界であったならば(ステップS1
3)、当該句境界に(フ3)を挿入する(ステップS1
4,S15)。
【0056】但し、直前の句境界(フ1)、(フ2)ま
たは(フ3)からの距離がSモーラ以下ならば(ステッ
プS14)、何も挿入しない。このことは、後続の韻律
句と融合して1つの呼気段落とすることを意味する。次
にnを1インクリメントし(ステップS12)、上記
(処理1の)ステップS2に戻り処理を続ける。
【0057】(処理4)また、直前の連結境界からの距
離がTモーラ以上の連結境界の場合(ステップS1
6)、連接境界間における連結境界において、隣接韻律
語結合強度の最も弱い境界に(フ3)を挿入する(ステ
ップS17,S18)。但し、各連接境界における隣接
韻律語結合強度がすべて等しい場合、連結境界間におけ
る全ての韻律句連鎖がTモーラ以下になるように均等に
連接境界に(フ3)を挿入する(ステップS19)。
【0058】韻律情報生成部132では、上記した一連
の処理がn=1からn=NまでN回繰り返し実行される
(ステップS11)。韻律情報生成部132での処理結
果は音韻記号・韻律記号生成部133に渡される。音韻
記号・韻律記号生成部133は、韻律情報生成部132
での処理結果から得られる、テキスト情報を構成する語
彙のそれぞれの読み、及び読みに対する語音の表層にお
ける音調変化を基に音韻記号列を生成すると共に、韻律
句境界の音調性質と韻律情報を基に韻律記号列を生成す
る。ここでは、語音に対応する音節音の記号、アクセン
トを指示する記号、休止区間長を指定する記号が生成さ
れることになる。
【0059】この音韻記号列と韻律記号列は、音響パラ
メータ生成部14に渡される。音響パラメータ生成部1
4は、この音韻記号列と韻律記号列から音声合成器を駆
動するための音響パラメータ系列を生成する。この系列
は、音声波形生成部15に送られて、出力部16を通じ
て出力される。
【0060】以上、図1の構成の音声合成装置における
各構成要素の基本機能について説明した。次に、当該音
声合成装置における動作の具体例を、図7及び図8を参
照して、図7(a)に示す入力テキスト情報(図4
(a)に示したのと同一の漢字仮名交じり文)に対する
韻律処理の場合につき説明する。
【0061】まず、入力部11から送られた漢字仮名交
じり文「あらゆる現実をすべて自分のほうへねじ曲げた
のだ。」は、言語処理部12(内の韻律語形成部12
1)における形態素解析処理に供され、その形態素解析
結果から、自律・他律韻律素の連鎖において、少なくと
も1の自律韻律素もしくは語基に所属する他律韻律素自
体により、或いは少なくとも1つの自律韻律素もしくは
語基に所属する他律韻律素と、それに後続する1個以上
の助辞、接辞に所属する他律韻律素を結合することで、
韻律語が構成される。
【0062】このようにして、上記漢字仮名交じり文の
形態素解析結果から形成される韻律語の連鎖は、次のよ
うになる。 [あらゆる][現実|を][すべて][自分|の][ほ
う|へ][ねじ曲げた|のだ] ここで、“|”で区切られたものは自律・他律韻律素
を、“[”と“]”とで囲まれたものは韻律語を示す。
【0063】次に言語処理部12(内の韻律語間依存強
度決定部122)では、(韻律語形成部121により形
成された)上記韻律語の連鎖を対象に図2の相互依存関
係テーブルを参照することで、韻律語を単位として、韻
律語間の依存強度が決定される。ここでは、(末尾の韻
律語を除く)各韻律語について、後続するすべての韻律
語間の組合わせにおいての依存関係(依存強度)が図7
(b)のように得られる。依存強度は、前記したように
5段階の数値で示される。0以外は依存関係があること
を示し、数値が大きいほど依存関係が強いことを示す。
【0064】次に言語処理部12(内の韻律語間係り受
け解析部123)では、図7(b)に示したような韻律
語間の依存強度を基に、係り受け関係が求められる。こ
こでは、文構造を近似するために、曖昧性を削減するた
めの原則を適用することにより、図7(c)のような係
り受けの構造が得られる。
【0065】次に言語処理部12(内の韻律語受け数決
定部124)では、図7(c)に示した係り受けの構造
から、図7(d)に示すような各韻律語の受け数が求め
られる。この韻律語の受け数は、上記の係り受けの構造
上で、前方の韻律語からどの程度係られているかを示す
ものである。
【0066】次に言語処理部12(内の隣接韻律語間結
合強度決定部125)では、それまでに(韻律語間依存
強度決定部122、韻律語間係り受け解析部123及び
韻律語受け数決定部124により)得られている、韻律
語間の依存強度、係り受け構造(から求められる境界の
深さ)、及び受け数の情報を用いて、図8(a)に示す
ような隣接する韻律語間の結合強度(の区分)が決定さ
れる。
【0067】音韻処理部13では、言語処理部12にて
得られた韻律語連鎖における隣接韻律語間結合強度(の
区分)から、以下に述べるように韻律情報を生成する。
まず音韻処理部13(内の韻律句境界強度決定部13
1)では、図8(a)に示した韻律語連鎖における隣接
韻律語間結合強度を基に、韻律句における境界強度(の
区分)が求められる。この例では、韻律語連鎖における
各々の韻律語が韻律句となり、各韻律句の境界強度(の
区分)は図8(b)に示すようになる。ここでは、韻律
句を構成する韻律語連鎖における韻律句全体の読み、並
びにモーラ数も決定される。このモーラ数については図
4(b)を参照されたい。
【0068】次に音韻処理部13(内の韻律情報生成部
132)では、上記韻律句における境界強度(の区分)
とモーラ数の情報を基に、韻律情報が生成される。ここ
では、図5及び図6に示すアルゴリズムに従って、図8
(c)に示すような概算的レベルで表される韻律制御指
令(フレーズ立ち上げ指令、ポーズ挿入指令)が与えら
れる。なお、S,T,Uの示すモーラ数は、S=4,T
=15,U=35であるものとする。
【0069】このように、フレーズ立ち上げ位置やフレ
ーズ指令の大きさ、ポーズ位置やポーズ長などの韻律情
報が求められると、音韻処理部13(内の音韻記号・韻
律記号生成部133)では、テキスト情報を構成する語
彙のそれぞれの読み、読みに対する語音の表層における
音調変化、韻律句境界の音調性質と韻律情報を基に、音
節音の記号(からなる音韻記号列)、及びアクセントを
指示する記号、休止区間長を指定する記号(からなる韻
律記号列)が生成される。
【0070】すると音響パラメータ生成部14では、音
韻処理部13(内の音韻記号・韻律記号生成部133)
で求められた韻律記号列と音韻記号列を基にして、音声
合成器を駆動するための音響パラメータ系列が生成され
る。音声波形生成部15では、この音響パラメータ系列
から音声波形が生成され、出力部16を通じて音声出力
される。
【0071】このように本実施形態においては、文章中
の韻律語から、韻律語間の依存強度、係り受け構造、及
び受け数の(うちの少なくとも1つの)情報を用いて、
隣接する韻律語間の結合強度を決定して韻律句間の境界
強度を求め、この境界強度を用いて韻律制御を行なうこ
とにより、韻律語を制御単位とした簡便な処理で自然な
韻律制御が可能となる。
【0072】以上に述べた図1の構成の音声合成装置
は、コンピュータ、例えば図9に示すパーソナルコンピ
ュータ90を、入力部11、言語処理部12、音韻処理
部13、音響パラメータ生成部14、音声波形生成部1
5、及び出力部16として機能させるためのプログラム
を記録した記録媒体、例えばフロッピーディスク(F
D)91を用い、当該フロッピーディスク91をパーソ
ナルコンピュータ90に装着して、当該フロッピーディ
スク91に記録されているプログラムをパーソナルコン
ピュータで90で読み取り実行させることにより実現さ
れる。
【0073】
【発明の効果】以上説明したように、本発明によれば、
韻律語を構成単位としてテキスト情報を解析し、韻律語
間の依存関係、係り受け関係、受け数により隣接韻律語
間の結合強度を設定することで、それに基づいて韻律句
の結合強度を求め、句境界における韻律情報を生成する
ことで、文全体の自然な韻律制御を可能とすることがで
きる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る音声合成装置の構成
を示すブロック図。
【図2】韻律語間の依存関係設定時に参照される相互依
存関係テーブルの内容例を示す図。
【図3】韻律語間の係り受け関係の解析において適用さ
れる、文構造の曖昧性を削減するための原則例を示す
図。
【図4】入力テキスト情報の例と、その入力テキスト情
報に対する言語処理部12での言語処理結果である、韻
律語間の依存強度、係り受け関係、受け数、各韻律語の
モーラ数、境界の深さ、隣接韻律語間の結合強度の例を
対比して示す図。
【図5】韻律情報生成部132における韻律情報生成の
アルゴリズムの一部を示す図。
【図6】韻律情報生成部132における韻律情報生成の
アルゴリズムの残りを示す図。
【図7】図1の構成の音声合成装置における動作の具体
例を説明するための図。
【図8】図1の構成の音声合成装置における動作の具体
例を説明するための図。
【図9】図1の構成の音声合成装置の各部の機能を実現
するためのプログラムを記録したフロッピーディスクが
装着されるパーソナルコンピュータの外観を示す図。
【符号の説明】
11…入力部、 12…言語処理部、 13…音韻処理部、 14…音響パラメータ生成部、 15…音声波形生成部、 16…出力部、 121…韻律語形成部、 122…韻律語間依存強度決定部、 123…韻律語間係り受け解析部、 124…韻律語受け数決定部、 125…隣接韻律語間結合強度決定部、 131…韻律句境界強度決定部、 132…韻律情報生成部、 133…音韻記号・韻律記号生成部。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 13/08

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力されたテキスト情報から韻律情報と
    音韻情報を生成し、この韻律情報と音韻情報から音声合
    成に必要な音響パラメータを生成し、この音響パラメー
    タに従って合成器を駆動して音声波形を生成して出力す
    る音声合成装置において、 前記入力されたテキスト情報を対象とする形態素解析を
    行ない、その解析結果から1つのアクセント型を決める
    最小単位である韻律語を生成し、その韻律語の連鎖を形
    成する韻律語形成手段と、 前記韻律語形成手段により形成された韻律語の連鎖にお
    ける各韻律語間の依存強度を求める韻律語間依存強度決
    定手段と、 前記韻律語間依存強度決定手段により求められた前記韻
    律語の連鎖における各韻律語間の依存強度を基に韻律語
    間の係り受け関係を求める韻律語間係り受け解析手段
    と、 前記韻律語間係り受け解析手段により求められた韻律語
    間の係り受け関係から前記韻律語の連鎖における各韻律
    語の受け数を求める韻律語受け数決定手段と、 前記韻律語間依存強度決定手段、前記韻律語間係り受け
    解析手段、及び前記韻律語受け数決定手段によりそれぞ
    れ求められた韻律語間の依存強度、係り受け関係、及び
    受け数のうちの少なくとも1つを用いて、前記韻律語の
    連鎖における隣接する韻律語間の結合強度を決定する隣
    接韻律語間結合強度決定手段と、 前記隣接韻律語間結合強度決定手段により得られた隣接
    韻律語間の結合強度により韻律句の境界強度を決定する
    韻律句境界強度決定手段と、 前記韻律句境界強度決定手段により得られた前記韻律句
    境界強度を加味して前記テキスト情報の韻律情報を生成
    する韻律情報生成手段とを具備することを特徴とする音
    声合成装置。
  2. 【請求項2】 各韻律語の文法属性間の相互依存関係を
    表す相互依存関係テーブルを更に具備し、 前記韻律語間依存強度決定手段は、前記韻律語形成手段
    により形成された韻律語連鎖を入力として、韻律語の文
    法属性情報を基に、前記相互依存関係テーブルを参照す
    ることで、前記韻律語間依存強度を求めることを特徴と
    する請求項1記載の音声合成装置。
  3. 【請求項3】 前記隣接韻律語間結合強度決定手段によ
    る隣接韻律語間結合強度の決定に用いられる前記係り受
    け関係が、前記テキスト情報中の対象となる韻律語が文
    末までに係る韻律語数と後続の韻律語が文末までに係る
    韻律語数との差を示す境界の深さであることを特徴とす
    る請求項1記載の音声合成装置。
  4. 【請求項4】 前記韻律情報生成手段は、前記韻律語の
    連鎖に対して、予め定められている1呼気に許される規
    定モーラ数、韻律句のモーラ数及び前記韻律句境界強度
    から各韻律句と後続する韻律句との境界に設定する韻律
    制御指令を決定することを特徴とする請求項1記載の音
    声合成装置。
  5. 【請求項5】 前記韻律情報生成手段は、前記規定モー
    ラ数以上のモーラ数を有する韻律句については、該当す
    る前記隣韻律語間結合強度をもとに、当該韻律区内の韻
    律語間を分離し、前記規定モーラ数よりも少ないモーラ
    数を有する韻律句については、後続の韻律句の前記隣韻
    律語間結合強度をもとに、後続の韻律句と融合して1つ
    の呼気段落とすることを特徴とする請求項4記載の音声
    合成装置。
  6. 【請求項6】 入力されたテキスト情報から韻律情報と
    音韻情報を生成し、この韻律情報と音韻情報から音声合
    成に必要な音響パラメータを生成し、この音響パラメー
    タに従って合成器を駆動して音声波形を生成して出力す
    る音声合成装置に適用される韻律情報生成方法におい
    て、 前記入力されたテキスト情報を対象とする形態素解析を
    行ない、その解析結果から1つのアクセント型を決める
    最小単位である韻律語を生成し、その韻律語の連鎖を形
    成する第1のステップと、 前記韻律語の連鎖における各韻律語間の依存強度を求め
    る第2のステップと、 前記韻律語の連鎖における各韻律語間の依存強度を基に
    韻律語間の係り受け関係を求める第3のステップと、 前記韻律語間の係り受け関係から前記韻律語の連鎖にお
    ける各韻律語の受け数を求める第4のステップと、 前記韻律語間の依存強度、係り受け関係、及び受け数の
    うちの少なくとも1つを用いて、前記韻律語の連鎖にお
    ける隣接する韻律語間の結合強度を決定する第5のステ
    ップと、 前記隣接韻律語間の結合強度により韻律句の境界強度を
    決定する第6のステップと、 前記韻律句境界強度を加味して前記テキスト情報の韻律
    情報を生成する第7のステップとを具備することを特徴
    とする韻律情報生成方法。
JP23645296A 1996-09-06 1996-09-06 音声合成装置及び同装置における韻律情報生成方法 Expired - Fee Related JP3357796B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23645296A JP3357796B2 (ja) 1996-09-06 1996-09-06 音声合成装置及び同装置における韻律情報生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23645296A JP3357796B2 (ja) 1996-09-06 1996-09-06 音声合成装置及び同装置における韻律情報生成方法

Publications (2)

Publication Number Publication Date
JPH1083192A JPH1083192A (ja) 1998-03-31
JP3357796B2 true JP3357796B2 (ja) 2002-12-16

Family

ID=17000966

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23645296A Expired - Fee Related JP3357796B2 (ja) 1996-09-06 1996-09-06 音声合成装置及び同装置における韻律情報生成方法

Country Status (1)

Country Link
JP (1) JP3357796B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4636673B2 (ja) * 2000-11-16 2011-02-23 パナソニック株式会社 音声合成装置および音声合成方法
JP4559950B2 (ja) 2005-10-20 2010-10-13 株式会社東芝 韻律制御規則生成方法、音声合成方法、韻律制御規則生成装置、音声合成装置、韻律制御規則生成プログラム及び音声合成プログラム

Also Published As

Publication number Publication date
JPH1083192A (ja) 1998-03-31

Similar Documents

Publication Publication Date Title
US7280968B2 (en) Synthetically generated speech responses including prosodic characteristics of speech inputs
US6751592B1 (en) Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically
US8219398B2 (en) Computerized speech synthesizer for synthesizing speech from text
US20030163314A1 (en) Customizing the speaking style of a speech synthesizer based on semantic analysis
US7010489B1 (en) Method for guiding text-to-speech output timing using speech recognition markers
US7558389B2 (en) Method and system of generating a speech signal with overlayed random frequency signal
JP3357796B2 (ja) 音声合成装置及び同装置における韻律情報生成方法
JPH08335096A (ja) テキスト音声合成装置
JP3006240B2 (ja) 音声合成方法および装置
JPH0580791A (ja) 音声規則合成装置および方法
JPS62138898A (ja) 音声規則合成方式
JP4260071B2 (ja) 音声合成方法、音声合成プログラム及び音声合成装置
JPH05224688A (ja) テキスト音声合成装置
JP2703253B2 (ja) 音声合成装置
JP3522005B2 (ja) 音声合成装置
JPH11296193A (ja) 音声合成装置
JP2001100777A (ja) 音声合成方法及び装置
JPH06214585A (ja) 音声合成装置
JP3088211B2 (ja) 基本周波数パタン生成装置
JPH0635913A (ja) 文章読み上げ装置
JPH08160983A (ja) 音声合成装置
JPH08328578A (ja) テキスト音声合成装置
JPH05333892A (ja) ピッチパタン生成装置
JPH07134713A (ja) 音声合成装置
JPH08160990A (ja) 音声合成装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081004

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081004

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091004

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101004

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111004

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111004

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121004

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131004

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees