JP3485586B2 - 音声合成方法 - Google Patents

音声合成方法

Info

Publication number
JP3485586B2
JP3485586B2 JP25838792A JP25838792A JP3485586B2 JP 3485586 B2 JP3485586 B2 JP 3485586B2 JP 25838792 A JP25838792 A JP 25838792A JP 25838792 A JP25838792 A JP 25838792A JP 3485586 B2 JP3485586 B2 JP 3485586B2
Authority
JP
Japan
Prior art keywords
mora
pitch
accent
difference
accent phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP25838792A
Other languages
English (en)
Other versions
JPH05224690A (ja
Inventor
誠 橋本
徹 北村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP25838792A priority Critical patent/JP3485586B2/ja
Publication of JPH05224690A publication Critical patent/JPH05224690A/ja
Application granted granted Critical
Publication of JP3485586B2 publication Critical patent/JP3485586B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、規則による音声合成方
法に関し、特に、音声の音韻やアクセントの自然性に大
きく影響する合成音声のピッチパターン生成方法に関す
る。
【0002】
【従来の技術】近年、規則による音声合成の研究が、ヒ
ューマンインタフェースの重要な技術として盛んに行わ
れている。規則による音声合成は、文字列等から形態素
解析によって品詞情報を決定し、単語辞書との照合によ
り単語の読みを決定した後に、この読みに応じた単語の
アクセント型、アクセント結合、フレーズを求め、これ
らの情報からピッチパターンの決定を行うと共に、単語
の読みに応じた音声素片(例えばパーコール係数やLS
P係数)を接続することにより音声データを生成する。
即ち、音声データとは、パーコール係数列とこれに応じ
たピッチパターンとアンプ情報である。この中でもピッ
チパターンは、合成音声の自然性の善し悪しに大きな影
響を及ぼすものとして位置付けられている。
【0003】従来のピッチパターン生成には、文章の構
造からフレーズ成分とアクセント成分を決定した後に、
各モーラの重心点のピッチを推定し、直線補間すること
によりピッチパターンを生成する点ピッチモデルを用い
る方法が知られている。(電子通信学会論文誌Vol.
J63-D No.9 pp.715-722, 1980.9) また、ニューラルネットにより各フレーズに対する先頭
モーラ、ピッチ周波数がピークをとるモーラ、末尾モー
ラの各ピッチ周波数の値を推定する方法なども知られて
いる。(音声研究会資料 SP89-111, 1990.1) これら、従来のピッチパターンの生成方法は、いずれも
各モーラに対するピッチ周波数の絶対値を一義的に推定
する方法であり、前後のモーラとのつながり(ピッチ周
波数の変化量)については考慮されていない。従って、
これらの方法では、モーラ間でのピッチパターンの変化
量が安定しないといった問題がある。
【0004】
【発明が解決しようとする課題】上述のように、合成音
声の自然性を左右する要因としては、ピッチ周波数の絶
対値よりも変化量の方がより重要であるにもかかわら
ず、従来の方法は、いずれも各モーラに対するピッチ周
波数の変動を推定するものではなかった。
【0005】本発明は、このような問題を解決するため
になされたものであり、規則による音声合成において、
合成音声の自然性を向上させるために、合成音声の自然
性に大きな影響を及ぼすピッチ周波数の変化量を考慮し
てピッチパターンを生成するものである。
【0006】
【課題を解決するための手段】本発明のピッチパターン
生成方法は、任意の文字列のモーラ毎に、当該モーラの
重心点のピッチ周波数と前記当該モーラに対する先行モ
ーラの重心点のピッチ周波数との差を推定するピッチ差
推定処理と、上記ピッチ差推定処理により求められたピ
ッチ差からピッチパターンを形成するピッチパターン生
成処理とを備えたものであって、上記ピッチパターン生
成処理が、少なくとも、当該モーラを含むアクセント句
における当該モーラのモーラ位置、分割されたフレーズ
における当該モーラを含むアクセント句位置、当該モー
ラを含むアクセント句のモーラ数、当該モーラを含むア
クセント句のアクセント型、当該モーラを含むアクセン
ト句の先行アクセント句のアクセント型についての情報
と、連接するモーラ重心点間のピッチ周波数の差との対
応関係から、各モーラの重心点のピッチ周波数と先行す
るモーラの重心点のピッチ周波数とのピッチ差を求め、
求められたピッチ差に基づいてピッチパターンを生成す
ることを特徴とする。
【0007】 さらに、本発明の音声合成方法は、入力
された任意の文字列の各モーラに対するピッチを生成す
るピッチパターン生成処理と、音声合成に必要な音声パ
ラメータからなる音声素片を蓄える音声素片メモリと、
上記文字列に必要な上記音声素片を接続して音声データ
を生成する音声素片接続処理を備えたものであって、上
記ピッチパターン生成処理が、少なくとも、当該モーラ
を含むアクセント句における当該モーラのモーラ位置、
分割されたフレーズにおける当該モーラを含むアクセン
ト句位置、当該モーラを含むアクセント句のモーラ数、
当該モーラを含むアクセント句のアクセント型、当該モ
ーラを含むアクセント句の先行アクセント句のアクセン
ト型についての情報と、連接するモーラ重心点間のピッ
チ周波数の差との対応関係に基づいて、該当モーラの重
心点のピッチ周波数と先行するモーラの重心点のピッチ
周波数とのピッチ差を求め、求められたピッチ差に基づ
いてピッチパターンを生成することを特徴とする。
【0008】 又、本発明の音声合成方法は、入力され
た任意の文字列の各モーラに対するピッチを生成するピ
ッチパターン生成処理と、音声合成に必要な音声パラメ
ータからなる音声素片を蓄える音声素片メモリと、上記
文字列に必要な上記音声素片を接続して音声データを生
成する音声素片接続処理を備えたものであって、上記ピ
ッチパターン生成処理が、少なくとも、当該モーラを含
むアクセント句における当該モーラのモーラ位置、分割
されたフレーズにおける当該モーラを含むアクセント句
位置、当該モーラを含むアクセント句のモーラ数、当該
モーラを含むアクセント句のアクセント型、当該モーラ
を含むアクセント句の先行アクセント句のアクセント型
についての情報と、連接するモーラ重心点間のピッチ周
波数の差との対応関係に基づいて、該当モーラの重心点
のピッチ周波数と先行するモーラの重心点のピッチ周波
数とのピッチ差を求め、求められたピッチ差に基づいて
ピッチパターンを生成することを特徴とする。
【0009】
【作用】本発明の音声合成方法では、まず、任意の文字
列の各モーラ対して、当該モーラの重心点のピッチ周波
数と当該モーラに対する先行モーラの重心点のピッチ周
波数との差を推定する。このような差の推定は、少なく
とも、当該モーラを含むアクセント句における当該モー
ラのモーラ位置、分割されたフレーズにおける当該モー
ラを含むアクセント句位置、当該モーラを含むアクセン
ト句のモーラ数、当該モーラを含むアクセント句のアク
セント型、当該モーラを含むアクセント句の先行アクセ
ント句のアクセント型についての情報と、連接するモー
ラ重心点間のピッチ周波数の差との対応関係から求めら
れものであって、たとえば、上記の各情報と上記のピッ
チ周波数との差との対応を記録した対応表、又は、入力
層へ上記各情報を入力すると、出力層がモーラ間のピッ
チ差を出力するように学習されているニューラルネット
ワーク等を用いて行われる。
【0010】次に、上述の推定によって、連接するモー
ラ毎のピッチ差を用いたピッチパターンの生成を生成す
ることができる。
【0011】
【実施例】最初に、本発明の音声合成方法を用いた規則
合成装置について説明する。 [実施例1]図1は、本発明の音声合成方法を用いた規
則合成装置の実施例を示すブロック図である。図1にお
いて、1は規則音声合成させる文字列の入力を行う文字
コード記号列入力部、2はその文字列を単語単位に分割
し、品詞情報を決定する形態素解析部、3はその単語の
読みを決定する読み決定部、4は単語の読みを記憶して
いる単語辞書、5は単語の読みに基づくアクセントを決
定するアクセント決定部、6は単語毎のアクセントを記
憶しているアクセント辞書、7は上記文字列のフレーズ
を決定するフレーズ決定部である。尚、フレーズとは文
頭乃至読点、読点乃至読点、読点乃至句点、息継ぎ乃至
息継ぎ、又はポーズ乃至ポーズ等の呼気段落をいう。
【0012】8は上記文字列のピッチパターンを生成す
るピッチパターン生成部、9は当該モーラの重心点のピ
ッチ周波数と当該モーラに対する先行モーラの重心点の
ピッチ周波数との差を推定するピッチ差推定部、10は
音声の素片を接続する素片接続部、11は音声素片を格
納した音声素片テーブル、12はDA変換部、13はス
ピーカである。
【0013】図2は、入力文字列を形態素解析した結果
である。
【0014】図3は、入力文字列の形態素解析結果に対
して読み決定を行った結果である。
【0015】図4は、入力文字列をアクセント句単位で
表したものである。図4において、41は入力文字列の
第5モーラ、42は入力文字列の第1アクセント句、4
3は入力文字列の第2アクセント句である。
【0016】図5は、入力文字列のピッチパターンであ
る。
【0017】図6は、対応表を用いたピッチ差推定部
(9)である。図6において、60は当該モーラを含む
アクセント句に対するモーラ位置の例、61は当該モー
ラを含むアクセント句位置の例、62は当該モーラを含
むアクセント句のモーラ数の例、63は当該モーラを含
むアクセント句のアクセント型の例、64は当該モーラ
を含むアクセント句の先行アクセント句のアクセント型
の例、65は当該モーラと先行モーラのピッチ周波数の
差の例である。
【0018】これより、本実施例の処理動作を、2アク
セント句からなる1フレーズの文字列「道を尋ねる」を
用いて説明する。
【0019】文字コード記号列入力部(1)から入力さ
れた文字列は、形態素解析部(2)によって単語単位に
分割され、各単語の品詞が決定される。図2は、本実施
例の文字列「道を尋ねる」を単語単位に分割し、各単語
に対して品詞を付与した結果である。
【0020】品詞が決定されると、読み決定部(3)に
送られ、単語辞書(4)との照合により各単語の読みが
決定される。図3に、本実施例の文字列「道を尋ねる」
に対して読み決定を行った結果を示す。
【0021】単語の読みが決定されると、アクセント決
定部(5)に送られ、アクセント辞書(6)との照合に
より単語のアクセントが決定され、規則によりアクセン
ト結合が行われてアクセント句が形成されるとともに、
アクセント句に対するアクセントが決定される。これに
より、本実施例の文字列「みちをたずねる」は、図4に
示されるように、第一アクセント句「みちを」(42)
と第2アクセント句「たずねる」(43)の2つのアク
セント句に分けられる。
【0022】アクセントが決定されたあとは、フレーズ
決定部(7)でフレーズの決定が行われる。本実施例の
文字列では、文字列全体で1つのフレーズを形成してい
るが、例えば「こうばんまでいって、みちをたずねた」
といった文字列であれば、「こうばんまでいって」と
「みちをたずねた」の2つのフレーズに分割される。
【0023】次に、ピッチ差の推定が行われるが、本実
施例では、文字列「みちをたずねる」の第4モ−ラ
「た」と第5モ−ラ「ず」の重心点ピッチ周波数の差を
図6の対応表を用いて推定する場合について説明する。
【0024】 ここで、対応表は、 1)当該モーラを含むアクセント句における当該モーラ
モーラ位置 2)分割されたフレーズにおける当該モーラを含むアク
セント句位置 3)当該モーラを含むアクセント句のモーラ数 4)当該モーラを含むアクセント句のアクセント型 5)当該モーラを含むアクセント句の先行アクセント句
のアクセント型 の5つのパラメータに対応する形で当該モーラと先行モ
ーラとのピッチ差を自然対数で記述したものである。こ
のような対応表は、例えば、大量の文を用いて、アクセ
ント型やモーラ数が多種の値を取る条件下での文のモー
ラ間のピッチ差を記録することにより作成される。
【0025】本実施例の文字列の場合、当該モーラであ
る第5モ−ラ「ず」は、モーラ数が4でアクセント型が
3型である第2アクセント句(43)の第2モーラ(4
1)である。これは、対応表においては、当該モーラを
含むアクセント句に対するモーラ位置「2」(60)、
当該モーラを含むアクセント句位置「2」(61)、当
該モーラを含むアクセント句のモーラ数「4」(6
2)、当該モーラを含むアクセント句のアクセント型
「3」(63)、当該モーラを含むアクセント句の先行
アクセント句(42)のアクセント型「0」(64)、
の5個のパラメータ「2,2,4,3,0」で表され
る。したがって、対応表より、当該モ−ラ「ず」と先行
モーラ「た」との重心点ピッチ周波数の差は自然対数
で、「+0.147」(65)と推定される。
【0026】ところで、本方法では、注目モーラとこれ
に先行する先行モーラとの母音重心点のピッチ周波数の
差を推定しているので、第1アクセント句の第1モーラ
(文頭の第1モーラ)とこれに先行する先行モーラとの
推定をどのように取り扱うかという問題が生じる。
【0027】そこで、第1アクセント句の第1モーラ
と、このモーラに先行する先行モーラとの母音重心点の
ピッチ周波数の差を推定する場合は、本実施例では、第
1アクセント句の第1モーラに対する先行アクセント句
のアクセント型を1型として、この値と第1アクセント
句の第1モーラとの母音重心点のピッチ周波数の差を求
めることとしている。
【0028】これは、第1アクセント句の第1モーラに
対する先行アクセント句のアクセント型として1型を採
用したのは、その1型のアクセント句の後方部分はピッ
チ周波数の値が下降しているからであり、この結果、第
1アクセント句の第1モーラに対する先行モーラから、
第1アクセント句の第1モーラへの繋がりは違和感がな
く、自然な音声発声と看做せることとなる。
【0029】このようにして、「みちをたずねる」の各
モーラに対して、当該モーラの重心点ピッチ周波数と先
行モーラの重心点ピッチ周波数との差が、自然対数で、
第1モ−ラから順次、「−0.061, 0.396, −0.224, −
0.300, 0.147, −0.142, −0.320」と推定される。
【0030】ピッチパターン生成部(8)では、あらか
じめ設定された音声区間の始端、および、終端のピッチ
周波数と、ピッチ差推定部(9)で推定された各値に基
づいて各モーラの重心点におけるピッチ周波数を推定
し、図5に示されるような点ピッチパターンが生成され
る。
【0031】ピッチパターンが生成されると、素片接続
部(10)において、CVC(子音+母音+子音)など
の音声素片(例えば、パーコール係数、あるいはLSP
係数)をあらかじめ格納している素片テーブル(11)
から当該文に必要な音声素片が選ばれて各素片が接続さ
れ、デジタル信号である音声データが作成される。音声
データはDA変換部(12)によってアナログ信号に変
換され、スピーカ(13)から合成音声として出力され
る。
【0032】尚、上述の実施例では、図6に示す5つの
パラメータから構成された対応表に基づいて、1フレー
ズからなる文字列のピッチパターンの生成を行ったが、
この5つのパラメータの一部に代えて、又はこの5つの
パラメータに加えて言語情報に関するパラメータ、例え
ば注目モーラが無声音であるか否か、注目モーラが無声
子音を伴うか否か、注目モーラが撥音であるか否か、注
目モーラが拗音であるか否か、注目モーラが有声子音を
伴うか否か、注目モーラの子音が摩擦音であるか否か、
注目モーラの子音が半母音であるか否か、注目モーラの
子音が鼻音であるか否か、注目モーラの子音が破擦音で
あるか否か、注目モーラの子音が破裂音であるか否か、
注目モーラを含む単語の品詞が何であるか、又は注目モ
ーラを含むアクセント句が強調されるか否か、等を採用
して対応表を作成してもよい。
【0033】また、上述の実施例では、1フレーズから
なる文字列のピッチパターンの生成を行ったが、図6の
対応表の5つのパラメータ、上述の言語情報に関するパ
ラメータ、フレーズ位置、又はフレーズ数等を用いた対
応表によって、複数フレーズの文字列のピッチパターン
の生成を行うことも可能である。 [実施例2]次に、実施例1のピッチ差推定部(9)に
ニューラルネットワークを用いた実施例について説明す
る。
【0034】図7は、ニューラルネットを用いたピッチ
差推定部(9)である。図7において、71は入力層、
72は中間層、73は出力層である。
【0035】ピッチ差推定部(9)部分以外の処理につ
いては処理動作1と同じであるため、以下ではピッチ差
推定部における処理についてのみ説明する。
【0036】本実施例では、読みで表された本実施例の
文字列「みちをたずねる」の第4モ−ラ「た」と第5モ
−ラ「ず」の重心点ピッチ周波数の差をニューラルネッ
トにより推定する場合について説明する。
【0037】ピッチ差推定部(9)で用いるニューラル
ネットワークでは、入力層(71)に、 1)当該モーラを含むアクセント句における当該モーラ
モーラ位置 2)分割されたフレーズにおける当該モーラを含むアク
セント句位置 3)当該モーラを含むアクセント句のモーラ数 4)当該モーラを含むアクセント句のアクセント型 5)当該モーラを含むアクセント句の先行アクセント句
のアクセント型 の5つのパラメータを入力する。
【0038】また、このニューラルネットワークは、出
力層(73)が、当該モーラの重心点のピッチ周波数と
先行するモーラの重心点のピッチ周波数との差を出力す
るように学習されているものとする。
【0039】ここで、当該モーラである第5モ−ラ
「ず」は、モーラ数が4でアクセント型が3型である第
2アクセント句(43)の第2モーラ(41)であるの
で、ニューラルネットの入力層への入力パラメータは、
当該モーラを含むアクセント句に対するモーラ位置
「2」、当該モーラを含むアクセント句位置「2」、当
該モーラを含むアクセント句のモーラ数「4」、当該モ
ーラを含むアクセント句のアクセント型「3」、当該モ
ーラを含むアクセント句の先行アクセント句(42)の
アクセント型「0」、の5つ「2,2,4,3,0」と
なる。
【0040】ニューラルネットワークは、入力層(7
1)に「2,2,4,3,0」の5個の情報が入力され
た場合に、ある値を出力層(73)に出力するように学
習されており、この学習によって決定されている係数に
従い、ニューラルネットワークの各ユニットに対する重
み付けがなされる。これによって、出力層(73)から
は、例えば、自然対数で、当該モ−ラ「ず」と先行モー
ラ「た」との重心点ピッチ周波数の差「+0.147」
が推定されて出力される。
【0041】本実施例においても、第1の実施例と同様
に、第1アクセント句の第1モーラと先行モーラとの重
心点ピッチ周波数の差をニューラルネットを用いて推定
させる場合は、例えば、当該モーラを含むアクセント句
の先行アクセント句のアクセント型を「1」(0型以外
だとみなせる情報)として学習させておき、入力層への
入力パラメータの内、当該モーラを含むアクセント句の
先行アクセント句のアクセント型を「1」(学習時に用
いた入力情報)として推定させている。
【0042】このようにして、「みちをたずねる」の各
モーラに対して、当該モーラの重心点ピッチ周波数と先
行モ−ラの重心点ピッチ周波数との差が、自然対数で、
第1モーラから順次、「−0.061, 0.396, −0.224, −
0.300, 0.147, −0.142, −0.320」と推定される。
【0043】尚、上述の第2の実施例では、ニューラル
ネットワークの入力層を5ユニット、中間層を1層とし
ているが、各ユニット数、層数はこの限りではない。
【0044】また、上述の第2の実施例では、5つのパ
ラメータを入力することによって学習したニューラルネ
ットを用いて、1フレーズからなる文字列のピッチパタ
ーンの生成を行ったが、この5つのパラメータの一部に
代えて、又はこの5つのパラメータに加えて言語情報に
関するパラメータ、例えば注目モーラが無声音であるか
否か、注目モーラが無声子音を伴うか否か、注目モーラ
が撥音であるか否か、注目モーラが拗音であるか否か、
注目モーラが有声子音を伴うか否か、注目モーラの子音
が摩擦音であるか否か、注目モーラの子音が半母音であ
るか否か、注目モーラの子音が鼻音であるか否か、注目
モーラの子音が破擦音であるか否か、注目モーラの子音
が破裂音であるか否か、注目モーラを含む単語の品詞が
何であるか、又は注目モーラを含むアクセント句が強調
されるか否か、等を採用して学習を行わせたニューラル
ネットを用いてもよい。
【0045】更に、上述の第2の実施例では、1フレー
ズからなる文字列のピッチパターンの生成を行ったが、
上述の言語情報に関するパラメータ、フレーズ位置、又
はフレーズ数等を用いて学習させたニューラルネットに
よって、複数フレーズの文字列のピッチパターンの生成
を行うことも可能である。
【0046】
【発明の効果】以上のように、本発明によれば、各モー
ラに対して、当該モーラの重心点のピッチ周波数と当該
モーラの先行モーラの重心点のピッチ周波数との差を推
定することにより、ピッチ周波数の変動からピッチパタ
ーンを生成し、合成音声の自然性を向上させることがで
きる。
【図面の簡単な説明】
【図1】本発明を用いた規則合成の一実施例を示すブロ
ック図
【図2】入力文字列を形態素解析した結果を示す図
【図3】入力文字列の形態素解析結果の読みを決定した
結果を示す図
【図4】入力文字列をアクセント句単位で表した図
【図5】入力文字列のピッチパターンを表す図
【図6】ピッチ差推定部(9)に用いる対応表を表す図
【図7】ピッチ差推定部(9)に用いるニューラルネッ
トワークの構成図
【符号の説明】
1 文字コード記号列入力部 2 形態素解析部 3 読み決定部 4 単語辞書 5 アクセント決定部 6 アクセント辞書 7 フレーズ決定部 8 ピッチパターン生成部 9 ピッチ差推定部 10 素片接続部 11 素片テーブル 12 DA変換部 13 スピーカ 41 入力文字列の第5モーラ「ず」 42 入力文字列の第1アクセント句 43 入力文字列の第2アクセント句 71 ニューラルネットワークの入力層 72 ニューラルネットワークの中間層 73 ニューラルネットワークの出力層
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 13/06 - 13/08 JICSTファイル(JOIS)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 任意の文字列のモーラ毎に当該モーラの
    重心点のピッチ周波数と前記当該モーラに対する先行モ
    ーラの重心点のピッチ周波数との差を推定するピッチ差
    推定処理と、上記ピッチ差推定処理により求められたピ
    ッチ差からピッチパターンを形成するピッチパターン生
    成処理からなるピッチパターン生成方法において、 上記ピッチパターン生成処理が、少なくとも、当該モー
    ラを含むアクセント句における当該モーラのモーラ位
    置、分割されたフレーズにおける当該モーラを含むアク
    セント句位置、当該モーラを含むアクセント句のモーラ
    数、当該モーラを含むアクセント句のアクセント型、当
    該モーラを含むアクセント句の先行アクセント句のアク
    セント型についての情報と、連接するモーラ重心点間の
    ピッチ周波数の差との対応関係から、各モーラの重心点
    のピッチ周波数と先行するモーラの重心点のピッチ周波
    数とのピッチ差を求め、求められたピッチ差に基づいて
    ピッチパターンを生成することを特徴とするピッチパタ
    ーン生成方法。
  2. 【請求項2】 入力された任意の文字列の各モーラに対
    するピッチを生成するピッチパターン生成処理と、音声
    合成に必要な音声パラメータからなる音声素片を蓄える
    音声素片メモリと、上記文字列に必要な上記音声素片を
    接続して音声データを生成する音声素片接続処理とを備
    えた音声合成方法において、 上記ピッチパターン生成処理が、少なくとも、当該モー
    ラを含むアクセント句における当該モーラのモーラ位
    置、分割されたフレーズにおける当該モーラを含むアク
    セント句位置、当該モーラを含むアクセント句のモーラ
    数、当該モーラを含むアクセント句のアクセント型、当
    該モーラを含むアクセント句の先行アクセント句のアク
    セント型についての情報と、連接するモーラ重心点間の
    ピッチ周波数の差との対応関係に基づいて、該当モーラ
    の重心点のピッチ周波数と先行するモーラの重心点のピ
    ッチ周波数とのピッチ差を求め、求められたピッチ差に
    基づいてピッチパターンを生成することを特徴とする音
    声合成方法。
JP25838792A 1991-09-30 1992-09-28 音声合成方法 Expired - Fee Related JP3485586B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25838792A JP3485586B2 (ja) 1991-09-30 1992-09-28 音声合成方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP3-251734 1991-09-30
JP25173491 1991-09-30
JP25838792A JP3485586B2 (ja) 1991-09-30 1992-09-28 音声合成方法

Publications (2)

Publication Number Publication Date
JPH05224690A JPH05224690A (ja) 1993-09-03
JP3485586B2 true JP3485586B2 (ja) 2004-01-13

Family

ID=26540334

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25838792A Expired - Fee Related JP3485586B2 (ja) 1991-09-30 1992-09-28 音声合成方法

Country Status (1)

Country Link
JP (1) JP3485586B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101223571B (zh) * 2005-07-20 2011-05-18 松下电器产业株式会社 音质变化部位确定装置及音质变化部位确定方法

Also Published As

Publication number Publication date
JPH05224690A (ja) 1993-09-03

Similar Documents

Publication Publication Date Title
JP3720136B2 (ja) ピッチ輪郭を決定するためのシステムおよび方法
EP1221693B1 (en) Prosody template matching for text-to-speech systems
US6778962B1 (en) Speech synthesis with prosodic model data and accent type
US7603278B2 (en) Segment set creating method and apparatus
JP3854713B2 (ja) 音声合成方法および装置および記憶媒体
US7155390B2 (en) Speech information processing method and apparatus and storage medium using a segment pitch pattern model
Khan et al. Concatenative speech synthesis: A review
JPH10116089A (ja) 音声合成用の基本周波数テンプレートを収容する韻律データベース
US8626510B2 (en) Speech synthesizing device, computer program product, and method
EP2070084A2 (en) Prosody conversion
US20040030555A1 (en) System and method for concatenating acoustic contours for speech synthesis
Bellegarda et al. Statistical prosodic modeling: from corpus design to parameter estimation
JP4533255B2 (ja) 音声合成装置、音声合成方法、音声合成プログラムおよびその記録媒体
JP5874639B2 (ja) 音声合成装置、音声合成方法及び音声合成プログラム
JP3485586B2 (ja) 音声合成方法
Gu et al. A Sentence-Pitch-Contour Generation Method Using VQ/HMM for Mandarin Text-to-speech
JP2001034284A (ja) 音声合成方法及び装置、並びに文音声変換プログラムを記録した記録媒体
JP3270668B2 (ja) テキストからスピーチへの人工的ニューラルネットワークに基づく韻律の合成装置
JP3286354B2 (ja) ピッチパターンの生成方法
JP3286353B2 (ja) 音声合成方法
Masri et al. Arabic Text-to-speech (TTS) Data Preparation
JP2001100777A (ja) 音声合成方法及び装置
JP5012444B2 (ja) 韻律生成装置、韻律生成方法、および、韻律生成プログラム
JP3397406B2 (ja) 音声合成装置及び音声合成方法
JP2003330482A (ja) 基本周波数パターン生成方法、基本周波数パターン生成装置、音声合成方法、音声合成装置、基本周波数パターン生成プログラムおよび音声合成プログラム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071024

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081024

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees