JP3078074B2 - 基本周波数パタン生成方法 - Google Patents

基本周波数パタン生成方法

Info

Publication number
JP3078074B2
JP3078074B2 JP03344628A JP34462891A JP3078074B2 JP 3078074 B2 JP3078074 B2 JP 3078074B2 JP 03344628 A JP03344628 A JP 03344628A JP 34462891 A JP34462891 A JP 34462891A JP 3078074 B2 JP3078074 B2 JP 3078074B2
Authority
JP
Japan
Prior art keywords
phrase
accent
component
control mechanism
fundamental frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03344628A
Other languages
English (en)
Other versions
JPH05173591A (ja
Inventor
隆 矢頭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP03344628A priority Critical patent/JP3078074B2/ja
Publication of JPH05173591A publication Critical patent/JPH05173591A/ja
Application granted granted Critical
Publication of JP3078074B2 publication Critical patent/JP3078074B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声合成に用いる基
本周波数パタン生成方法に関する。
【0002】
【従来の技術】文字情報を入力し、それを音声に変換し
て出力する音声合成装置は、出力語彙の制限がないこと
から録音・再生型の音声合成に取って代る技術として期
待されている。この種の合成装置に於いて、音声のアク
セント、イントネ−ションを表現する声帯振動の基本周
波数(ピッチ)パタンの生成技術は自然な合成音を得る
上で非常に重要な要素技術である。
【0003】音声のピッチパタンは、個々の単語のアク
セント型のみならず文章構造、意味等の影響を強く受け
るため、実際の音声から抽出した基本周波数パタンを種
々用意して、此等を組合せて文章全体のパタンとすると
いう方法では実現が困難であり、適切なモデル化が不可
欠となる。
【0004】音声の基本周波数パタン生成モデルとして
は、幾つかの方法が提案されているが、対数軸上の基本
周波数パタンを文頭から文末に向かう緩やかな下降(イ
ントネ−ション)に対応するフレ−ズ成分と、局所的な
起伏(アクセント)に対応するアクセント成分の和で表
現されるとし、フレ−ズ成分はインパルス状のフレ−ズ
指令に対する臨界制動2次線形系の応答であるとの近似
の基に、また、アクセント成分はステップ状のアクセン
ト指令に対する臨界制動2次線形系の応答であるとの近
似の基に定式化したモデルが一般に広く用いられている
(広瀬啓吉、藤崎博也、河井恒、山口幹雄:“基本周波
数パタン生成過程モデルに基づく文章音声の合成”、電
子情報通信学会論文誌 ’89/01 Vol.J72
−A No.1 参照)。
【0005】図5は従来の基本周波数パタン生成モデル
を示すブロック図である。このモデルでは対数基本周波
数ln F0(t)は時刻tの関数として次式で与えられ
る。
【0006】
【数1】
【0007】ここでFmin は基底周波数、Apiは文章中
のi番目のフレ−ズ指令の大きさ、Aajは文章中のj番
目のアクセント指令の大きさ、Iは一文章中のフレ−ズ
指令の数、Jは一文章中のアクセント指令の数、T0i
i番目のフレ−ズ指令の開始時点、T1j,T2jは其々j
番目のアクセント指令の開始時点と終了時点である。
【0008】また、Gp(t)、Ga(t)は其々フレ−ズ
制御機構のインパルス応答関数、アクセント制御機構の
ステップ応答関数であり、t≧0の範囲で次式(2)、
(3)で与えられる(t<0ではGp(t)=Ga(t)=
0)。
【0009】 Gp(t)=αt・exp(−αt) (2) Ga(t)=Min[1−(1+βt)・exp(−βt),θ)] (3)
【0010】ここで、α、βは其々フレ−ズ制御機構の
応答の速さ、アクセント制御機構の応答の速さを決める
定数であり、α=3.0、β=20.0程度の値を用い
る。また、θはアクセント成分の上限値で通常θ=0.
9等に選ばれる。
【0011】人間の発声では平坦に発声しても、発声の
初めはピッチが高く、以後呼気圧の低下などにより自然
にピッチが下がる性質があり、このピッチの自然下降成
分をモデル化したものが前述のフレ−ズ制御機構であ
る。
【0012】一方、アクセントについては、標準語の場
合、単語のアクセントは第1モ−ラから第2モ−ラにか
けて必ず顕著なピッチの上昇または下降があり、かつ、
単語内でのピッチの顕著な下降は一ヶ所のみに限られ
る。従って、n個のモ−ラから成る単語には(n+1)
種のアクセント型が存在する。各アクセント型はピッチ
の下降する位置に着目して0型、1型、2型、3型(第
iモ−ラと第i+1モ−ラとの間でピッチが顕著に下降
するものがi型であり、0型は平板アクセントとも言
う)と呼ぶ。ピッチの上昇、下降は、前述の基本周波数
生成モデルのアクセント指令の始点、終点に対応する。
【0013】
【発明が解決しようとする課題】図6(a) は、従来モデ
ルのフレ−ズ制御機構によるフレ−ズ成分の形状を示し
たものであり、初めは比較的急峻に立ち上がりその後徐
々に減衰してある時間経過後殆ど0となるような漸近型
の減少パタンとなる。図6(a) は通常用いられる応答の
速さ(α=3.0)のパタン例であるが、約2秒でフレ
−ズ成分はほぼ0となる。
【0014】しかしながら、実際の音声では2秒を越え
るような長いフレ−ズも少なくない。このような場合、
従来のフレ−ズ制御機構ではフレ−ズ後半部分のピッチ
の自然降下成分が表現されず、聴感上フレ−ズ終端部分
のピッチが不自然に上昇したように感じられる。
【0015】前記フレ−ズ成分生成関数(式(2))に
おける定数αを小さくすればフレ−ズ成分の減衰も緩や
かになり、フレ−ズ後半の自然降下成分を確保すること
が可能である(図6(b) 参照)が、同時に立ち上がり速
度も鈍り、実際の音声の立ち上がり形状に合わなくなる
という問題がある。従って、従来のフレ−ズ制御機構で
は、フレ−ズ成分のモデル化に際して、立ち上がりの応
答速度と減衰速度の双方を適当に満足するような値に妥
協せざるを得ず、自然音声のフレ−ズ形状に近付けるの
が困難であるという問題、更には、生成し得るフレ−ズ
成分の長さが自ずと限定される、という問題が生じる。
【0016】この発明は、以上述べた問題を解決し、立
ち上がりの応答速度と減衰速度の双方を独立に制御して
自然音声のフレ−ズ形状に近付けると共に、種々の長さ
のフレ−ズに適応して自然なピッチパタンの生成が可能
な基本周波数パタン生成方法を提供することを目的とす
る。
【0017】
【課題を解決するための手段】この発明は、前記課題を
解決するために、入力文章の解析により算出される韻律
を生成する為のアクセント指令とフレーズ指令を入力
し、対数軸上の基本周波数パタンを、イントネーション
に対応するフレーズ成分と、アクセントに対応するアク
セント成分との和で表す基本周波数パタン生成法におい
て、bi及びciを入力文のi番目のフレーズに対する
フレーズ制御機構の応答の早さを決める定数、aiを入
力文のi番目のフレーズに対するフレーズ制御機構の応
答の強さを補正する定数として、フレーズ成分を次式
(4)で表される時刻tのインパルス応答関数で近似す
ると共に、前記定数ai、bi、ciを基本周波数を付
与するフレーズの長さに応じて設定することを特徴とす
る。
【0018】 Gpi(t)=ai・tci・exp(−bit) (4)
【0019】尚、パタン形状の設定に当たっては、(c
i /bi )の値を0.2〜0.4の範囲に設定するのが
好適であり、bi はフレ−ズの長さに応じて1.0〜
4.5の範囲に設定するのが好適である。
【0020】
【作用】前記式(4)によれば、立ち上がりの応答速
度、即ちフレ−ズの開始時点から極大値に達するまでの
時間は(ci /bi )秒で与えられる。一方、減衰速度
は定数bi に比例するから、与えられたフレ−ズの長さ
に応じて定数bi を制御し、立ち上がりの応答速度に応
じてci を制御することにより、フレ−ズの立ち上がり
応答と立ち下がり応答を独立に制御することが可能とな
る。また、定数aiは、前記関数(式(4))の極大値
が所望の値となるように設定可能であり、定数bi 、c
i を調整することにより変化する関数の応答の強さ(前
記関数の極大値)を所望の値に補正するように作用す
る。
【0021】図2は関数式(4)による生成パタンを示
したもので、図2(a)は立ち上がりの応答速度が速
く、減衰が遅い例であり、図2(b)は逆に立ち上がり
の応答が遅く、減衰が速い場合である。このように、本
発明によれば、定数の調整により、立ち上がりと立ち下
がりのパタン形状を任意に設定することが可能である。
従って、フレ−ズ成分のモデル化に際して、立ち上がり
及び立ち下がりの何れか一方の応答速度に拘束されるこ
となく、自然音声のフレ−ズ成分の形状に最も適したパ
タンを与えることが出来る。
【0022】更に、本発明によれば、定数ai 、bi
i は、前述のようにフレ−ズの長さに応じて設定可能
である。具体的には、定数の組(ai 、bi 、ci )を
予め複数組用意しておき、生成すべきフレ−ズ成分の長
さに応じて最も好適な組合せを選択することが可能で、
種々の長さのフレ−ズに対応することが可能となる。以
上の作用により前記課題が解決される。
【0023】
【実施例】図1はこの発明の第1の実施例を示す装置の
機能ブロック図であり、文字列入力部10、文字列解析
部11、フレ−ズ制御機構12、アクセント制御機構1
3、定数設定部14、声帯振動機構15、基本周波数出
力端子16から構成されている。以下、第1の実施例に
おける基本周波数の生成方法につき説明する。
【0024】先ず、文字列入力部10から、音声に変換
されるべき文章の韻律記号付き仮名文字列が入力され
る。韻律記号付き仮名文字列とは、例えば表1に示され
る文字列であり、音声に変換されるべき文章の読みに対
応する仮名文字列とフレ−ズ記号、アクセント記号、休
止記号(区切り記号)等の韻律制御記号から成る。
【0025】
【表1】
【0026】文字列解析部11では入力された韻律記号
付き仮名文字列に基づき、フレ−ズ制御機構12の入力
であるフレ−ズ指令を決定すると共にアクセント制御機
構13の入力であるアクセント指令を決定する。
【0027】フレ−ズ指令の大きさ(式(1)のApi
は入力文字列中に挿入されているフレ−ズ記号の種類に
応じて表2の如く決められる。
【0028】
【表2】
【0029】フレ−ズ指令の開始時点は、同じく入力文
字列に於いて、仮名文字列中のフレ−ズ記号の挿入位置
に応じて決められる。例えば、表1に示される文字列で
は、第1フレ−ズのフレ−ズ記号P1 に対して、当該フ
レ−ズの第1音節「キ」の始端を基準に、通常100〜
200msさかのぼった時点に設定される。
【0030】アクセント指令の大きさ及び指令の時点は
休止記号、アクセント記号の位置、種類に応じて決定さ
れる。アクセント記号はアクセント核のある音節の直後
に挿入されて語のアクセント位置を示すと共にその種類
によってアクセントの強さを表している。アクセント記
号の種類に応じたアクセント指令の大きさを表3に示
す。アクセント記号の無い語については平板型(0型)
アクセントと見做され、同じく表3の指令の大きさが与
えられる。
【0031】
【表3】
【0032】アクセント指令の開始時点はアクセント型
によっても異なるが、語の第1モ−ラもしくは第2モ−
ラの母音開始時点を基準に決められる。指令の終了時点
は、アクセント記号の位置によりアクセント核の次のモ
−ラの母音開始時点を基準に求められる。平板型の場合
は語の最終モ−ラが基準となる。
【0033】以上のようにして決定されたフレ−ズ指
令、アクセント指令は其々フレ−ズ制御機構12、アク
セント立ち上げ制御機構13、に送られる。
【0034】フレ−ズ制御機構12では与えられたフレ
−ズ指令に対するインパルス応答関数である式(4)を
計算してフレ−ズ成分を生成するが、これに先立って合
成すべきフレ−ズの長さに応じて式(4)の定数ai
i 、ci の値の設定が定数生設定部14で行われる。
この定数値の設定に当たっては、実際の音声のフレ−ズ
成分に適合した値を予め観測により定めておく必要があ
るが、本実施例ではフレ−ズ長に応じて3種の定数の組
合せを用いることとする。
【0035】図4は、前記定数値とフレ−ズ成分の形状
との関係を示したものであり、図示のように、減衰速度
が変っても立ち上がりの応答速度には殆ど変化がなく、
フレ−ズ長に応じたフレ−ズ成分パタンの生成が可能と
なる。
【0036】定数設定部14では、文字列解析部11か
ら得られるフレ−ズのモ−ラ数を基に、前述の3種類の
定数の組合せの一つを選択してフレ−ズ制御機構12に
出力する。フレ−ズの長さは該フレ−ズを構成する各音
韻の継続時間から算出されるが、フレ−ズ長とフレ−ズ
成分の長さとの関係はそれほど厳密なものではないた
め、本実施例では入力文字列から容易に求まるモ−ラ数
で代用している。
【0037】一方アクセント制御機構13では、文字列
解析部11から与えられたアクセント指令に対して、式
(3)のステップ応答関数によりアクセント成分を計算
する。
【0038】このようにして、全ての指令に対するフレ
−ズ成分、アクセント成分は加算されて声帯振動機構1
5に出力され、声帯振動機構15では前記フレ−ズ成
分、アクセント成分に対数基本周波数の下限値ln F
min を加算して対数基本周波数とし、更に指数変換を行
って基本周波数F0(t)を出力端子16から出力する。
【0039】図3は、この発明の第2の実施例を示すブ
ロック図であり、文字列入力部20、文字列解析部2
1、フレ−ズ制御機構22、フレ−ズパタンテ−ブル2
3、アクセント制御機構24、アクセントパタンテ−ブ
ル25、声帯振動機構26、対数変換テ−ブル27、基
本周波数出力端子28から構成されている。以下、第2
の実施例における基本周波数の生成方法を説明する。
【0040】韻律記号付き仮名文字列を入力して、フレ
−ズ指令、アクセント指令を生成する文字列入力部2
0、文字列解析部21の動作は第1の実施例と同様であ
るので説明を省略する。文字列解析部21で決定された
フレ−ズ指令及びアクセント指令は、其々フレ−ズ制御
機構22、アクセント制御機構24に入力される。
【0041】フレ−ズ制御機構22、アクセント制御機
構24では、指令に基づき各成分を生成するが、この時
前式(3)、(4)を逐一計算する代わりに本実施例で
は、フレ−ズ制御機構22のインパルス応答関数及びア
クセント制御機構24のステップ応答関数の応答パタン
を予め計算して其々フレ−ズパタンテ−ブル23、アク
セントパタンテ−ブル25に記憶しておき、この記憶内
容を参照して各成分の応答値を算出する。フレ−ズパタ
ンテ−ブル23には前述の第1の実施例における3種の
フレ−ズパタンを記憶しておき、フレ−ズ制御機構22
では文字列解析部21から出力されるモ−ラ数に応じて
好適なフレ−ズパタンを選択する。
【0042】声帯振動機構26においても、対数基本周
波数を基本周波数に変換する際に指数変換が必要となる
ので、ここでも対数変換テ−ブル27を備えている。実
際に音声合成に使用するのは基本周波数ではなく、ピッ
チ周期(基本周波数の逆数)である場合が多いため、対
数変換テ−ブル27は対数基本周波数を直接ピッチ周期
に変換するテ−ブルとしても良い。
【0043】
【発明の効果】以上、詳細に説明したように、本発明の
基本周波数パタン生成方法によれば、対数軸上の基本周
波数パタンにおけるフレ−ズ成分を、立ち上がり速度
と、減衰速度を別個に制御し得るインパルス応答関数と
して近似したため、フレ−ズ成分をモデル化するに当た
り立ち上がりの応答速度と減衰速度のうちの何れか一方
に拘束されることなく自然音声のフレ−ズ形状により近
いモデルが設定できる。
【0044】さらに、本発明では基本周波数パタンを生
成すべきフレ−ズの長さに応じてフレ−ズ成分の形状を
選択するため、種々の長さのフレ−ズに対して自然音声
に近いフレ−ズ成分が生成出来る。従って、本発明によ
る基本周波数パタン生成方法を用いて音声合成を行うこ
とにより、より自然な抑揚をもった合成音が生成でき
る。
【図面の簡単な説明】
【図1】本発明の第1の実施例を示す装置の機能ブロッ
ク図である。
【図2】式(4)による生成パタンの例を示す図であ
る。
【図3】本発明の第2の実施例を示す装置の機能ブロッ
ク図である。
【図4】式(4)の定数値とフレ−ズ成分の形状との関
係を示す図である。
【図5】従来の基本周波数パタン生成モデルを示すブロ
ック図である。
【図6】従来方法によるフレ−ズ成分の形状を示した図
である。
【符号の説明】
10 文字列入力部 11 文字列解析部 12 フレ−ズ制御機構 13 アクセント制御機構 14 定数設定部 15 声帯振動機構 16 基本周波数出力端子 20 文字列入力部 21 文字列解析部 22 フレ−ズ制御機構 23 フレ−ズパタンテ−ブル 24 アクセント制御機構 25 アクセントパタンテ−ブル 26 声帯振動機構 27 指数変換テ−ブル 28 基本周波数出力端子
フロントページの続き (56)参考文献 特開 昭64−28695(JP,A) 特開 平2−129700(JP,A) 特開 昭62−138898(JP,A) 藤崎、須藤「日本語単語アクセントの 基本周波数パタンとその生成機構のモデ ル」音響学会誌27巻9号、pp.445− 453(1971) (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 21/06 JICSTファイル(JOIS)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力文章の解析により算出される韻律を
    生成する為のアクセント指令とフレーズ指令を入力し、
    対数軸上の基本周波数パタンを、イントネーションに対
    応するフレーズ成分と、アクセントに対応するアクセン
    ト成分との和で表す基本周波数パタン生成法において、 bi及びciを入力文のi番目のフレーズに対するフレ
    ーズ制御機構の応答の早さを決める定数、aiを入力文
    のi番目のフレーズに対するフレーズ制御機構の応答の
    強さを補正する定数として、 フレーズ成分をGpi
    (t)=ai・tci・exp(−bit)なる時刻t
    のインパルス応答関数で近似すると共に、前記定数a
    i、bi、ciを基本周波数を付与するフレーズの長さ
    に応じて設定することを特徴とする基本周波数パタン生
    成方法。
JP03344628A 1991-12-26 1991-12-26 基本周波数パタン生成方法 Expired - Fee Related JP3078074B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03344628A JP3078074B2 (ja) 1991-12-26 1991-12-26 基本周波数パタン生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03344628A JP3078074B2 (ja) 1991-12-26 1991-12-26 基本周波数パタン生成方法

Publications (2)

Publication Number Publication Date
JPH05173591A JPH05173591A (ja) 1993-07-13
JP3078074B2 true JP3078074B2 (ja) 2000-08-21

Family

ID=18370736

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03344628A Expired - Fee Related JP3078074B2 (ja) 1991-12-26 1991-12-26 基本周波数パタン生成方法

Country Status (1)

Country Link
JP (1) JP3078074B2 (ja)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
藤崎、須藤「日本語単語アクセントの基本周波数パタンとその生成機構のモデル」音響学会誌27巻9号、pp.445−453(1971)

Also Published As

Publication number Publication date
JPH05173591A (ja) 1993-07-13

Similar Documents

Publication Publication Date Title
EP0427485B1 (en) Speech synthesis apparatus and method
US7565291B2 (en) Synthesis-based pre-selection of suitable units for concatenative speech
US20040030555A1 (en) System and method for concatenating acoustic contours for speech synthesis
JPH0632020B2 (ja) 音声合成方法および装置
JP3078074B2 (ja) 基本周波数パタン生成方法
JP2001242882A (ja) 音声合成方法及び音声合成装置
JP3078073B2 (ja) 基本周波数パタン生成方法
JPH0580791A (ja) 音声規則合成装置および方法
US7130799B1 (en) Speech synthesis method
JP3771565B2 (ja) 基本周波数パタン生成装置、基本周波数パタン生成方法、及びプログラム記録媒体
JP2001100777A (ja) 音声合成方法及び装置
JPH05134691A (ja) 音声合成方法および装置
JP3081300B2 (ja) 残差駆動型音声合成装置
JP3314116B2 (ja) 音声規則合成装置
JP3397406B2 (ja) 音声合成装置及び音声合成方法
JP2848604B2 (ja) 音声合成装置
JP3284634B2 (ja) 規則音声合成装置
JPH11161297A (ja) 音声合成方法及び装置
JP3303428B2 (ja) 音声合成装置のアクセント成分基本テーブルの作成方法
JPH0519780A (ja) 音声規則合成装置および方法
JPH09292897A (ja) 音声合成装置
JP2003005774A (ja) 音声合成装置
JPH056191A (ja) 音声合成装置
JPH06214585A (ja) 音声合成装置
JP2573587B2 (ja) ピッチパタン生成装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000530

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080616

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090616

Year of fee payment: 9

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090616

Year of fee payment: 9

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees