JPH08263095A - 音声素片選択方法および音声合成装置 - Google Patents

音声素片選択方法および音声合成装置

Info

Publication number
JPH08263095A
JPH08263095A JP7060962A JP6096295A JPH08263095A JP H08263095 A JPH08263095 A JP H08263095A JP 7060962 A JP7060962 A JP 7060962A JP 6096295 A JP6096295 A JP 6096295A JP H08263095 A JPH08263095 A JP H08263095A
Authority
JP
Japan
Prior art keywords
unit
synthesis
speech
segment
phoneme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7060962A
Other languages
English (en)
Other versions
JP3346671B2 (ja
Inventor
Takao Koyama
貴夫 小山
Noriya Murakami
憲也 村上
Ayanori Yoshitani
文徳 吉谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP06096295A priority Critical patent/JP3346671B2/ja
Publication of JPH08263095A publication Critical patent/JPH08263095A/ja
Application granted granted Critical
Publication of JP3346671B2 publication Critical patent/JP3346671B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 音声波形素片を用いた規則合成装置におい
て、ノイズ混入の有無を予測するとともに一定品質以上
の合成音声を得るための合成単位を選択する。 【構成】 一次選択部42において所定の評価基準を用
いて入力テキストに対応する複数の合成単位の候補を選
び出し、次いで、二次選択部43において、複数の候補
から最も素片接続の歪みが小さくなるように素片(合成
単位)を選び出す。つまり2段階の素片選択を行う。2
段階目の合成単位の選択は、素片間のケプストラム距離
を接続コストとし、素片間の接続コストが最小となるよ
うにパスを選択する。合成品質判定部44では、合成時
に一定品質が得られるか否かを判定し、得られない場合
は代替素片生成部45から代替素片処理を得て合成素片
抽出部46に送る。合成単位抽出部46は、該当する素
片の実データ(PCMデータ)を素片辞書5から抽出し
て後段の素片変形接続部に出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声合成装置に関し、
特に、合成単位(音声波形素片)の選択技術に関する。
【0002】
【従来の技術】従来、音声波形素片を用いた規則合成装
置では、大量の音声波形をPCM(Pulse code modulat
ion)方式によりディジタルの音声波形データ(PCM
データ)に変換して蓄積し、該音声波形データに対して
音素単位で位置情報、ピッチ形状、継続時間長、パワ等
の韻律情報及び前後の音素の種類等を記述しておくのが
一般的である。音声合成を行う際には、入力テキストに
対して規則により韻律パタンを設定し、該韻律パタンに
最も近くなるように音声素片を選択し、更に選択された
素片の韻律を変形して、目標の韻律パタンに近くなるよ
うにすることで、LSP(Line Spectrum Pair)を用い
た合成音声を行う場合に比べて高品質な規則音声合成を
行うことを可能にしている。このような音声波形素片を
用いた規則合成装置については、「広川著、波形辞書を
用いた規則合成法、電子通信学会信学技報SP88−9(198
8‐5)」の記載を参考にすることができる。
【0003】
【発明が解決しようとする課題】上述の音声合成手法で
は、音声波形をPCMデータ上で接続するため、素片間
のスペクトル形状が大きく異なり、素片接続部における
異音またはノイズ発生の原因になることがある。音声波
形素片を用いた規則合成装置においては、このような素
片接続部でのノイズ混入の有無によって、合成音声の品
質が大きく左右される。しかし、従来の手法では、蓄積
情報として、スペクトル形状等の自然音声のパラメタを
有していないため、韻律的な滑らかさと音韻系列の一致
しか波形選択の基準にすることができず、素片接続部に
おけるノイズ混入の予測ができない。そのため、合成音
声を実際に人間が聴取するか、または何らかの音響分析
を行わなければ品貿の善し悪しを判断できない問題があ
った。
【0004】本発明の課題は、上記問題点に鑑み、音声
波形素片を用いた規則合成装置において合成単位を選択
する際に、合成単位間の連続性を考慮した素片選択を可
能とし、さらに素片接続部におけるノイズ混入の有無及
び合成音声全体の品質を評価することを可能にする技術
を提供することにある。
【0005】
【課題を解決するための手段】本発明は、まず、音声素
片選択方法を提供する。この方法は、複数の音声素片を
蓄積した素片辞書から音声合成に用いる合成単位を選択
する際に、素片間ケプストラム距離の特定情報、例えば
該距離の代表値を合成単位毎に前記素片辞書に蓄積する
段階と、合成対象音声の韻律パタンに類似する複数の合
成単位を類似度の高い順に抽出する段階と、抽出した複
数の合成単位から前記素片間ケプストラム距離に基づく
接続コストが最小となる合成単位の組を選択する段階と
をこの順に実行することを特徴とする。前記選択された
合成単位の組に基づく合成音声の品質が所定の基準値よ
り大きいときは、接続コストを大きくしている合成単位
を隣接素片間ケプストラム距離が最小となる代替素片に
置き換える。なお、この場合の合成音声の品質は、例え
ば素片間ケプストラム距離の積算値で評価することがで
き、評価の閾値は、実験的に決定することができる。
【0006】本発明は、また、上記方法の実施に適した
音声合成装置をも提供する。この装置は、複数の音声素
片を素片間ケプストラム距離の特定情報と共に蓄積した
素片辞書と、該素片辞書から音声合成に用いる合成単位
を選択する音声素片選択部と、選択された合成単位に基
づいて合成音声を生成する手段とを有する音声合成装置
であって、前記音声素片選択部が、合成対象音声の韻律
パタンに類似する複数の合成単位を類似度の高い順に抽
出する一次選択部と、抽出した複数の合成単位から前記
素片間ケプストラム距離に基づく接続コストが最小とな
る合成単位の組を選択する二次選択部とを有することを
特徴とする。
【0007】上記構成の音声合成装置において、音声素
片選択部は、さらに、前記二次選択部で選択された合成
単位の組に基づく合成音声の品質を定量化するととも
に、これにより得られた定量値の良否を判定する合成品
質判定部と、前記定量値の良否判定が否のときに当該合
成単位の組における隣接素片間ケプストラム距離が最小
となる代替素片を生成する代替素片生成部とを有し、接
続コストを大きくしている合成単位を前記代替素片に置
き換える。なお、前記代替素片生成部は、韻律パタンが
目標値に近い複数の先行音置き換え候補及び後続音置き
換え候補を選択する第1の手段と、隣接素片の接続コス
トが最も小さい先行音置き換え候補の組を前記代替素片
として特定する第2の手段とを有するものである。
【0008】
【作用】本発明では、従来の手法と同様に韻律パタンと
の類似度の高いものを合成単位候補として抽出した後、
素片接続部同士のケプストラム距離を接続コストとし、
例えば動的計画法を用いて、接続コストが最小となる合
成単位の組を選び出す。これにより、与えられた合成単
位中で最も声道特性の連続性が高いものを選び出すこと
ができる。この場合、合成単位を選択した際の接続コス
トを参照することで、合成音声へのノイズ混入状況を推
定することが可能となる。また、合成品質低下の原因と
なる部分では、接続コストが大きく、異音またはノイズ
混入が発生しやすいので、接続コストが大きい合成単位
がある場合には、これに代えて、他の代替素片に置き換
える。
【0009】
【実施例】以下、図面を参照して本発明の好適な実施例
を説明する。図1は、本発明の一実施例に係る音声合成
装置の構成図である。まず、図1を参照して本実施例の
音声合成装置の全体的な処理の概要を説明する。この音
声合成装置1は、入力端子INから入力した漢字仮名混
じりの日本語テキストをテキスト解析部2へ送る。テキ
スト解析部2では、図示しない辞書を用いて入力テキス
トを文節に切り分け、各々の文節に対してローマ字表記
の読みを付与し、更にアクセント型を各文節に付与す
る。ここで得られた各文節の読み及びアクセント型は、
韻律生成部3に送出される。
【0010】韻律生成部3では、文節単位の読み情報と
アクセント型情報に基づきピッチパタン、音韻継続時間
長パタン、パワパタンの3種の韻律パタンを生成する。
ここで生成された韻律パタンと文節単位のローマ字読み
情報が、素片選択部4へ送られる。素片選択部4では、
与えられたテキストの読み情報及び韻律パタンを考慮し
て素片辞書5の中から合成に使用するのに適した合成単
位を選択する。これについては後で詳述する。素片選択
部4で選択された合成単位は、素片変形接続部6へ送ら
れる。素片変形接続部6では、素片選択部4で選択され
た合成単位を組み合わせることで得られる韻律パタン
を、韻律生成部3で生成された韻律パタンに近くなるよ
うに変形処理を行い、変形後の素片を接続して出力端子
OUTへ送る。なお、本実施例の音声合成装置1は、V
CV型の音声波形素片単位(合成単位)を用い、合成品
質を向上させるために、各VCV単位種類に複数の合成
単位を用意しているものとする。
【0011】次に、本実施例で用いる素片辞書5の構成
例を、図2を用いて説明する。本音声合成装置1は、大
量の音声波形をPCMデータに変換し、さらに、該音声
波形に音韻情報、韻律情報、及びスペクトル情報をそれ
ぞれ対応させて波形辞書5に蓄積している。そして、テ
キスト解析部2で推定された入力テキストの韻律パタン
に基づいて素片辞書5から最適の合成単位を選び出し、
選び出された合成単位を滑らかに接続することで合成音
声を得る。
【0012】従来の同様の音声合成方式では、辞書情報
としてスペクトル情報を有していないため、韻律的な滑
らかさと音韻系列の一致しか波形選択の基準にすること
が出来なかった。そこで、本実施例では、素片辞書5を
作成する際にケプストラム分析を行い、そこで現われる
ケプストラムの低次の項を特徴ベクトルとし、無音区間
以外の全てのベクトルを用いてクラスタリングを行う。
そして、クラスタリング処理後は、各クラスタに識別番
号を付与し、各合成単位の始端・終端位置のケプストラ
ムがどのクラスタに属しているかを辞書情報として登録
する。これにより、スペクトル包絡レベルでの素片連続
性を監視し、異音化及びノイズの混入を予め予測するこ
とが可能となる。
【0013】この素片辞書5は、例えば、図2(a)に
示すように、素片辞書テーブル201に、素片を一意に
扱うための素片番号、素片の音韻環境を示す音韻種類を
格納している。また、韻律情報として、素片境界におけ
るピッチ周波数、素片継続時間情報、及びパワを格納し
ている。ピッチ周波数の分析位置は、VCV単位におけ
る素片始端位置及び素片終端位置におけるピッチ周波数
を用いる。また、継続時間情報として、素片始端位置、
子音始端位置、及び素片終端位置の情報を用い、さらに
素片全体の長さ自体及び先行母音と後続音節の境界位置
を知ることが可能な情報、例えば後述のケプストラム距
離テ−ブル701に保持された距離の代表値(素片間ケ
プストラム距離の代表値)をも格納している。パワ情報
はケプストラム0次の情報を用いている。ケプストラム
の低次項は、クラスタリングした際にカテゴリ番号と一
対一で対応するようにテーブル形式で保存されている。
これについては後述する。なお、記憶容量に余裕がある
場合には、ケプストラムの情報をクラスタリングしなく
とも良い。また、分析位置に関しては、ケプストラムに
おいても素片始端及び終端位置で分析を行う。
【0014】図2(b)の「あか」/aka/から合成
単位を作成する際の例では、合成単位「aka」210
を作成する場合に、該当する素片始端位置206及び素
片終端位置207でのピッチ周波数を分析して用いる。
但し、「#a」209や「a#」211のような語頭や
語尾などから得られる、先行又は後続の母音がない場合
には、ピッチ周波数は一意に0Hzとする。なお、合成
単位表記で/#/は、ポーズ等の無音区間を表すものと
する。また、各始端位置及び終端位置もピッチ周波数を
分析した位置と同様の位置であり、合成単位「aka」
210の子音始端位置は、音節境界203の情報を使用
する。但し、母音連接で子音がない場合にも音節の開始
位置を子音始端位置とする。
【0015】次に、素片選択部4の詳細な構成を図3〜
図9を参照して説明する。素片選択部4には、本音声合
成装置1に入力された日本語テキストのローマ字表記と
韻律パタンとが入力される。ここでは、先ずローマ字表
記から合成に使用する全てのVCV単位の種類を探索区
間抽出部41で抽出する。決定されたVCV単位種類に
基づき、図4に示す内容例の探索区間検索テーブル40
1を参照して素片辞書5内の探索区間を決定する。次に
一次選択部42に処理を移す。
【0016】一次選択部42では、各々の合成単位につ
いて、既に求めている探索区間内においてピッチ、継続
時間長及びパワの韻律情報により合成に使用するのに適
した素片を選び出す。韻律情報を用いて合成に適した合
成単位を決定するときは、韻律生成部3で決定された韻
律パタンと音声素片が持つ韻律パタンを比較して評価値
を算出する。評価の基準は、目標韻律パタンに類似した
ものほど評価値が小さくなるような式を利用する。その
評価値Hevを得る式の例を下記に示す。
【0017】
【数1】 Hev=P+D2+E2・・・(1) 但し P={(先行母音ピッチ目標値−素片先行母音ピッチ)
2 +(先行母音ピッチ目標値−素片先行母音ピッチ)2} D=(継続時間長目標値・素片継続時間長) E=(パワ目標値・素片パワ)
【0018】上記評価式Hevの各パラメタは、韻律生
成部3及び素片辞書5から得られるものである。この評
価式Hevを用いて、探索区間内全ての合成単位を評価
し、評価値の小さい順から上位侯補として図5に示す内
容の候補テーブル501に登録する。本実施例では、同
一種類で多数の韻律のバリエーションを持った合成単位
から、合成しようとする音声の韻律パタンに近いものを
式(1)を用いて抽出している。式(1)の評価値によれば、
辞書内にある合成単位に対して近さの序列を行うことが
可能であり、評価値の小さいものほど目標とする韻律パ
タンに近く、上位の候補として登録される。この処理
は、合成に用いる各々の合成単位で行う。
【0019】図5に示す候補テーブル501は、「あ
か」/aka/を合成する場合の例を示すものであり、
この場合に必要な合成単位は、/#a/、/aka/、
/a#/である。各々の合成単位に対して、目標韻律パ
タンと辞書内の対応する種類の素片を式(1)を用いて評
価し、評価値の最小のものを第1候補とし、順次小さい
方から上位候補として登録していく。登録する際は、素
片を一意に指している素片番号を用いて記述する。ま
た、候補数に関する制限を加えることも可能であり、個
々の合成単位種類において同一の候補数を用意する必要
はない。ここで、候補数に上限を設けることで、後段の
二次選択部43での処理を軽減することができる。ま
た、評価値Hevに対して上限のしきい値を設けること
によって候補数を制限することができる。以上の処理
を、合成に用いる全ての合成単位に適用して上記探索区
間テーブル401に格納する情報を生成し、これを二次
選択部43へ送る。
【0020】二次選択部43では、一次選択部42で得
られた合成単位候補のうち、最も素片接続の歪みが小さ
くなるように素片(合成単位)を選び出す。その処理概
念を図6及び図7を参照して説明する。二次選択部43
では、一次選択部42で決定された合成単位候補から、
スペクトルの連続性を考慮して最終的に合成に用いる合
成単位を選び出す。合成単位の選択は、素片間のケプス
トラム距離を接続コストとし、素片間の接続コストが最
小となるようにパスを選択する。
【0021】最小パスの選択には、例えば動的計画法
(DP:Dynamic Programming)により効率的に実現す
ることができる。図6の例では、太線のパスの接続コス
トが最小であり、選択結果としては、/#a/が第1候
補、/aka/が第2候補、/a#/が第1候補として
選択されている。なお、パスの接続コストは、先頭から
CD(ケプストラム距離、以下同じ)1,CD2,CD
3・・・,CDnなる変数で保持し、これらを後述の合
成品質の判定に用いる。また、各クラスタ間の距離を図
7に示すケプストラム距離テーブル701の形で保持
し、二次選択部43における接続コストの計算を簡略化
している。以上の処理により得られた、接続歪最小パス
のコストを合成品質判定部44へ送出する。
【0022】合成品質判定部44では、後段の素片変形
接続部6における接続コストのRMS値(root means s
quare)Rcを計算し、その値が予め設定した値より小
さい場合には、合成単位抽出部46に処理を移す。一
方、Rcがしきい値より大きい場合には、代替素片生成
部45に処理を移す。合成品質判定部44でRcを計算
する際には、例えば式(2)を用いることができる。
【0023】
【0024】一般的に合成品質低下の原因となる部分で
は、接続コストが大きく、異音またはノイズ混入が発生
しやすい。よってこの様な場合には、接続コストが大き
い素片に代わり、他の素片を組み合わせて作成した素片
に置き換える必要がある。そのための処理を行うのが代
替素片生成部45であり、代替素片が必要な素片種類と
韻律パタン及び前後の素片のケプストラム情報が入力さ
れる。代替素片生成部45では、Rcの値を大きくして
いる素片を順番に代替素片置き換え侯補として蓄積す
る。生成された置き換え候補順に基づき、代替素片生成
情報を順次生成し、Rcの値がしきい値を下回った時点
で代替素片生成処理を停止する。そしてこのときの代替
素片生成情報を合成単位抽出部46に送出する。なお、
置き換え可能な素片が生成できない場合には、二次選択
部43で得られた素片候補をそのまま合成単位抽出部4
6に出力する。
【0025】代替素片生成部45における処理の詳細を
図8及び図9を用いて説明する。図8を参照して、代替
処理判定部451では、求められた接続コストが、予め
設定していたしきい値よりも大きくなった場合、例えば
置き換え対象VCV素片の子音Cが有声音か無声音であ
るかを判定し、無声音である場合に代替素片生成処理を
行う。
【0026】代替素片候補抽出部452では、図9上段
に示すVCV単位の先行母音V部分901と後続音節C
V部分902を最小単位として扱う。先行母音Vに関し
ては、母音種類及び後続の子音Cの種類が一致してお
り、更に韻律パタンが目標値に近いものを一次選択部4
2と同様に式(1)を用いて候補順位を設定する。また、
後続音節CVでは、先行母音Vによらず韻律パタンが目
標値に近いものを一次選択部42と同様に選び出し、候
補順位を設定する。ここで得られた先行母音Vの候補及
び後続音節CVの候補をそれぞれ代替素片選択部453
に送出する。代替素片選択部453では、先行母音V及
び後続音節CVの各候補に関して、各々の隣接素片との
接続コストが最も小さいものを置き換え素片として採用
する。素片生成部454では、ここで得られた、先行母
音置き換え素片と後続音節置き換え素片を図9後段に示
すごとく組み合わせて代替素片を生成する。合成単位抽
出部46は、素片の実データ(PCMデータ)を素片辞
書5から抽出し、これを代替素片生成情報または素片候
補と共に素片変形接続部6に出力する。
【0027】このように、本実施例によれば、韻律パタ
ンと素片結合部におけるスペクトル包絡の連続性の双方
を考慮して合成単位を選択することが可能となり、ま
た、合成単位選択時に用いるケプストラム距離の積算値
を評価基準として用いることで、合成音品質の低下原因
となるノイズ混入の有無を予測することが可能となる。
さらに、接続コストが大きい場合には、素片辞書5内の
他の代替素片を品質劣化の原因になっている素片と置き
換えるようにしたので、常に一定品質以上の合成音声を
生成することが可能となる。なお、本実施例で用いた素
片(合成単位)やパラメタ値は、本発明を説明する上で
便宜的に用いたものなので、必ずしもこのような例に限
定されるものでないことは勿論である。
【0028】
【発明の効果】以上の説明から明らかなように、本発明
によれば、最も声道特性の連続性が高い合成音声の選定
と、合成音声へのノイズ混入状況の推定が可能となり、
従来の問題点を解消することができる。また、合成品質
低下の原因となっている合成単位がについては、これに
代えて、品質向上に寄与する他の代替素片に置き換えら
れるので、合成される音声の品質が常に一定以上になる
効果がある。なお、本発明は、パーソナルコンピュータ
等に接続する音声合成装置や、音声合成ソフトウェアに
適用することが可能であり、また、電話を用いたチケッ
ト予約等、様々なサーピスに応用することも容易とな
る。
【図面の簡単な説明】
【図1】本発明の一実施例に係る音声合成装置の一実施
例を示すブロック図。
【図2】(a)は本実施例で用いる素片辞書内のテーブ
ル内容説明図、(b)は合成単位の説明図。
【図3】本実施例による素片選択部のブロック構成図。
【図4】図3の素片選択部で用いる候捕テーブルの一例
を示す説明図。
【図5】本実施例により素片辞書を探索する区間を決定
する際に用いるテーブルの概念説明図。
【図6】本実施例により素片選択部の二次選択部で素片
選択を行う場合の概念図。
【図7】図3の素片選択部で用いるケプストラム距離テ
ーブルの概念図。
【図8】本実施例による代替素片生成部のブロック構成
図。
【図9】本発明で代替素片を生成する際の概念説明図。
【符号の説明】
1 音声合成装置 2 テキスト解析部 3 韻律生成部 4 素片選択部 5 素片辞書 6 素片変形接続部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 複数の音声素片を蓄積した素片辞書から
    音声合成に用いる合成単位を選択する音声素片選択方法
    において、素片間ケプストラム距離の特定情報を合成単
    位毎に前記素片辞書に蓄積する段階と、合成対象音声の
    韻律パタンに類似する複数の合成単位を類似度の高い順
    に抽出する段階と、抽出した複数の合成単位から前記素
    片間ケプストラム距離に基づく接続コストが最小となる
    合成単位の組を選択する段階とを有することを特徴とす
    る音声素片選択方法。
  2. 【請求項2】 前記選択された合成単位の組に基づく合
    成音声の品質が所定の基準値より大きいときに、接続コ
    ストを大きくしている合成単位を隣接素片間ケプストラ
    ム距離が最小となる代替素片に置き換えることを特徴と
    する請求項1記載の音声素片選択方法。
  3. 【請求項3】 複数の音声素片を素片間ケプストラム距
    離の特定情報と共に蓄積した素片辞書と、該素片辞書か
    ら音声合成に用いる合成単位を選択する音声素片選択部
    と、選択された合成単位に基づいて合成音声を生成する
    手段とを有する音声合成装置であって、前記音声素片選
    択部が、合成対象音声の韻律パタンに類似する複数の合
    成単位を類似度の高い順に抽出する一次選択部と、抽出
    した複数の合成単位から前記素片間ケプストラム距離に
    基づく接続コストが最小となる合成単位の組を選択する
    二次選択部とを有することを特徴とする音声合成装置。
  4. 【請求項4】 前記音声素片選択部は、さらに、前記二
    次選択部で選択された合成単位の組に基づく合成音声の
    品質を定量化するとともに、これにより得られた定量値
    の良否を判定する合成品質判定部と、前記定量値の良否
    判定が否のときに当該合成単位の組における隣接素片間
    ケプストラム距離が最小となる代替素片を生成する代替
    素片生成部とを有し、接続コストを大きくしている合成
    単位を前記代替素片に置き換えることを特徴とする請求
    項3記載の音声合成装置。
  5. 【請求項5】 前記代替素片生成部は、韻律パタンが目
    標値に近い複数の先行音置き換え候補及び後続音置き換
    え候補を選択する第1の手段と、隣接素片の接続コスト
    が最も小さい先行音置き換え候補の組を前記代替素片と
    して特定する第2の手段とを有することを特徴とする請
    求項4記載の音声合成装置。
JP06096295A 1995-03-20 1995-03-20 音声素片選択方法および音声合成装置 Expired - Fee Related JP3346671B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06096295A JP3346671B2 (ja) 1995-03-20 1995-03-20 音声素片選択方法および音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06096295A JP3346671B2 (ja) 1995-03-20 1995-03-20 音声素片選択方法および音声合成装置

Publications (2)

Publication Number Publication Date
JPH08263095A true JPH08263095A (ja) 1996-10-11
JP3346671B2 JP3346671B2 (ja) 2002-11-18

Family

ID=13157551

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06096295A Expired - Fee Related JP3346671B2 (ja) 1995-03-20 1995-03-20 音声素片選択方法および音声合成装置

Country Status (1)

Country Link
JP (1) JP3346671B2 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002530703A (ja) * 1998-11-13 2002-09-17 ルノー・アンド・オスピー・スピーチ・プロダクツ・ナームローゼ・ベンノートシャープ 音声波形の連結を用いる音声合成
JP2005265895A (ja) * 2004-03-16 2005-09-29 Advanced Telecommunication Research Institute International 素片接続型音声合成装置及び方法
JP2006313176A (ja) * 2005-05-06 2006-11-16 Hitachi Ltd 音声合成装置
JP2008026452A (ja) * 2006-07-19 2008-02-07 Kddi Corp 音声合成装置、方法及びプログラム
WO2008102710A1 (ja) * 2007-02-20 2008-08-28 Nec Corporation 音声合成装置及び方法とプログラム
WO2010116549A1 (ja) * 2009-03-30 2010-10-14 株式会社東芝 音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法
JP2015152790A (ja) * 2014-02-14 2015-08-24 カシオ計算機株式会社 音声合成装置、方法、およびプログラム
JP2017151291A (ja) * 2016-02-25 2017-08-31 三菱電機株式会社 音声合成装置及び音声合成方法
CN112216267A (zh) * 2020-09-15 2021-01-12 北京捷通华声科技股份有限公司 一种韵律预测的方法、装置、设备及存储介质

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002530703A (ja) * 1998-11-13 2002-09-17 ルノー・アンド・オスピー・スピーチ・プロダクツ・ナームローゼ・ベンノートシャープ 音声波形の連結を用いる音声合成
JP4586386B2 (ja) * 2004-03-16 2010-11-24 株式会社国際電気通信基礎技術研究所 素片接続型音声合成装置及び方法
JP2005265895A (ja) * 2004-03-16 2005-09-29 Advanced Telecommunication Research Institute International 素片接続型音声合成装置及び方法
JP2006313176A (ja) * 2005-05-06 2006-11-16 Hitachi Ltd 音声合成装置
JP4639932B2 (ja) * 2005-05-06 2011-02-23 株式会社日立製作所 音声合成装置
JP2008026452A (ja) * 2006-07-19 2008-02-07 Kddi Corp 音声合成装置、方法及びプログラム
WO2008102710A1 (ja) * 2007-02-20 2008-08-28 Nec Corporation 音声合成装置及び方法とプログラム
US8630857B2 (en) 2007-02-20 2014-01-14 Nec Corporation Speech synthesizing apparatus, method, and program
JP5434587B2 (ja) * 2007-02-20 2014-03-05 日本電気株式会社 音声合成装置及び方法とプログラム
WO2010116549A1 (ja) * 2009-03-30 2010-10-14 株式会社東芝 音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法
JP2015152790A (ja) * 2014-02-14 2015-08-24 カシオ計算機株式会社 音声合成装置、方法、およびプログラム
JP2017151291A (ja) * 2016-02-25 2017-08-31 三菱電機株式会社 音声合成装置及び音声合成方法
CN112216267A (zh) * 2020-09-15 2021-01-12 北京捷通华声科技股份有限公司 一种韵律预测的方法、装置、设备及存储介质

Also Published As

Publication number Publication date
JP3346671B2 (ja) 2002-11-18

Similar Documents

Publication Publication Date Title
CA2351842C (en) Synthesis-based pre-selection of suitable units for concatenative speech
EP1168299B1 (en) Method and system for preselection of suitable units for concatenative speech
US7809572B2 (en) Voice quality change portion locating apparatus
JP3910628B2 (ja) 音声合成装置、音声合成方法およびプログラム
JP5320363B2 (ja) 音声編集方法、装置及び音声合成方法
JP3346671B2 (ja) 音声素片選択方法および音声合成装置
JP5343293B2 (ja) 音声編集合成装置及び音声編集合成方法
JP2001265375A (ja) 規則音声合成装置
Abdelmalek et al. High quality Arabic text-to-speech synthesis using unit selection
JPH01284898A (ja) 音声合成方法
KR20100085433A (ko) 다중 목표운율 이용한 고음질 음성합성 방법
JPH08335096A (ja) テキスト音声合成装置
JP4167084B2 (ja) 音声合成方法及び装置、並びに音声合成プログラム
EP1589524B1 (en) Method and device for speech synthesis
JP2004354644A (ja) 音声合成方法及びその装置並びにそのコンピュータプログラム及びそれを記憶した情報記憶媒体
Dong et al. A Unit Selection-based Speech Synthesis Approach for Mandarin Chinese.
JP3571925B2 (ja) 音声情報処理装置
Fujisawa et al. Prosody-based unit selection for Japanese speech synthesis
JP3378448B2 (ja) 音声素片選択方法,音声合成装置,及び命令記憶媒体
JPH10247097A (ja) 自然発話音声波形信号接続型音声合成装置
JPH09230893A (ja) 規則音声合成方法及び音声合成装置
Anilkumar et al. Building of Indian Accent Telugu and English Language TTS Voice Model Using Festival Framework
JP2003108170A (ja) 音声合成学習方法および音声合成学習装置
JP2003108180A (ja) 音声合成方法および音声合成装置
JP2000066695A (ja) 素片辞書、音声合成方法及び装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080906

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080906

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090906

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090906

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100906

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110906

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120906

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees