JP3133347B2 - 韻律制御装置 - Google Patents

韻律制御装置

Info

Publication number
JP3133347B2
JP3133347B2 JP02410265A JP41026590A JP3133347B2 JP 3133347 B2 JP3133347 B2 JP 3133347B2 JP 02410265 A JP02410265 A JP 02410265A JP 41026590 A JP41026590 A JP 41026590A JP 3133347 B2 JP3133347 B2 JP 3133347B2
Authority
JP
Japan
Prior art keywords
variable
prosody
symbol string
speech
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP02410265A
Other languages
English (en)
Other versions
JPH04363634A (ja
Inventor
哲也 酒寄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP02410265A priority Critical patent/JP3133347B2/ja
Publication of JPH04363634A publication Critical patent/JPH04363634A/ja
Application granted granted Critical
Publication of JP3133347B2 publication Critical patent/JP3133347B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、規則音声合成装置の韻
律制御装置に関する。
【0002】
【従来の技術】規則音声合成装置の韻律制御方式として
は、例えば、特開昭63−46498号公報に「韻律制
御方式」として本出願人により出願され開示されている
ものがあり、これは、数量化類や重回帰分析などの多
変量解析の手法を用いて韻律を制御するものである。ま
た、その韻律制御方式に関する他の例として、やはり本
出願人により発案されたものとして、回帰数セットを
話者やその時の状況に応じて選択的に用いることによっ
て、異なった話者特性や口調を容易に表現可能としたも
のがある。
【0003】
【発明が解決しようとする課題】従来、規則音声合成装
置による合成音は、自然さに欠け、聴いていて違和感を
感じるという大きな欠点を有している。このような問題
は主に韻律の制御に起因するものである。近年の研究に
より徐々にではあるがそのような違和感は減少し、自然
な合成音声が合成できるようになりつつある。しかし、
人間は常に一定の韻律パターンで話しているのではな
く、また、話者によっても韻律パターンは当然異なる。
このように従来における合成音声の韻律は変化が乏し
く、長時間の聴取にはまだ苦痛であるのが現実である。
【0004】前述したような従来例によって韻律パター
ンを生成する場合は、韻律パターンを分析・予測するた
めの変数選択が重要な問題となる。特に、回帰分析にお
いてむやみに変数を増やすことは、未知の入力に対する
予測精度の低下を招きかねない。従来の方法ではどのよ
うな話者や口調に対しても一通りの変数セットを用いる
ため、最大公約数的な変数のとり方をしなければなら
ず、これによりきめ細かな分析や予測が困難となる。
【0005】
【課題を解決するための手段】本発明では、予め用意し
た音声素片パラメータ系列を音韻・韻律を表現する入力
記号列に従って読出し、音声パラメータ結合規則によっ
て前記音声素片パラメータ系列を接続し、韻律制御規則
によって音韻・韻律を表現する入力記号列に応じた音韻
継続時間長、ピッチパターン、振幅パターンなどを計算
することにより韻律を付加する規則音声合成装置におい
て、入力記号列から変数抽出規則によって複数の変数を
抽出しこれらの変数の中から異なる話者や発声形態毎に
最適な変数セットを選択するとともに前記変数抽出規則
及び前記最適化された変数セット並びにこの最適な変数
セットと前記入力記号列及び音声データとから得た最適
な係数セットを記憶するカテゴリマッピング手段を設
け、異なる話者や発声形態に応じて変数セットを前記カ
テゴリマッピング手段で記憶された中から選択する変数
記憶選択手段を有し、この変数記憶選択手段で選択され
た変数セット及び対応する係数セットを前記カテゴリマ
ッピング手段で記憶された中から取り出し、これらの変
数セットと係数セットと入力記号列とによって合成音声
の韻律パターンを生成するようにした。
【0006】
【作用】カテゴリマッピング手段と変数記憶選択手段と
を用いることによって、従来においては画一的であった
合成音声の韻律パターンを、変数選択も含めてきめ細か
く制御することが可能となる。
【0007】
【実施例】本発明の一実施例を図面に基づいて説明す
る。図1及び図2は、規則音声合成装置における韻律制
御装置の構成例を示すものである。まず、図1に示すよ
うに、テンプレート音声部1にはラベリング2が接続さ
れ、このラベリング2にはカテゴリマッピング手段とし
てのカテゴリマッピング部3が接続されている。このカ
テゴリマッピング部3には、回帰分析部4が接続されて
いる。また、図2に示すように、前記カテゴリマッピン
グ部3には、回帰予測部5が接続されている。
【0008】この場合、前記カテゴリマッピング部3
は、入力記号列6から変数抽出規則としてのカテゴリ判
定規則7によって複数の変数を抽出しこれらの変数の中
から異なる話者や発声形態毎に最適な変数セット8を選
択する働きがある。また、ここでは、前記カテゴリ判定
規則7や前記最適化された変数セット8、さらには、回
帰係数セット9を記憶すると共に、これらを合成音声の
使用目的や話者特性に応じて選択的に用いる、図示しな
い変数記憶選択手段が設けられている。
【0009】このような構成において、本実施例では、
韻律パターンの例として、音韻継続時間長を取り上げ、
韻律パターンの分析・予測に数量化類を用いる場合に
ついて考える。以下、予め人間の発声した音声データセ
ットが与えられているものとし、これをここではテンプ
レート音声と呼ぶ。本実施例の構成及び動作を、テンプ
レート音声に含まれる韻律パターンの特徴を分析し学習
する分析時と、その結果に基づいて韻律パターンを生成
する合成時に分けて説明する。
【0010】まず、分析時における動作を説明する。図
1は分析時における構成を示すものである。テンプレー
ト音声部1から得られた人間の発声したテンプレート音
声からラベリング部2によって音韻境界位置を決定し、
個々の音韻の継続時間長を計測し、これを目的変数とす
る。一方、カテゴリマッピング部3において、ラベリン
グ部2によって付与されたラベル列からカテゴリ判定規
則7によって説明変数を求める。数量化類における説
明変数は一般に要因アイテムと呼ばれ、サンプルがどの
カテゴリに該当するかという定性的なものである。ここ
で重要となるのは、どの要因アイテムを採用するか、さ
らには、どのようなカテゴリに分けるかという問題であ
る。そこで、本実施例においては、最大公約数的な変数
セットをとらずに、分析対象のテンプレート音声に対し
て最適化した変数選択を行う。変数選択の方法として
は、分散比や自由度調整済み寄与率などを評価関数とし
た前進選択法・後退消去法・逐次法などの既知の手法を
使用することができる。このようにして選択された最適
な変数セットを用いて回帰分析部4により回帰分析を行
い、これにより回帰係数セット9を求める。
【0011】次に、合成時における動作を説明する。図
2は合成時における構成を示すものである。発声対象と
なるテキスト或いは概念などから、分析時に入力とした
ラベル列に対応するような入力記号列6が得られている
ものとする。この入力記号列6から、分析時に用いたカ
テゴリ判定規則7と、最適化された変数セット8とによ
って、カテゴリマッピング部3において適切なカテゴリ
へのマッピングが行われる。その後、分析時に求められ
た回帰係数セット9を用いて、入力記号列6に対応する
音韻継続時間長パターンを計算する。このように音声を
合成することによって、与えられたテンプレート音声の
特徴を再現するような合成音声を得ることができる。ま
た、話者や発声形態などの異なるテンプレート音声につ
いて別々に分析し、カテゴリ判定規則7、最適化された
変数セット8、回帰係数セット9を変数記憶選択手段に
よって記憶し適宜使い分けることによって、多彩な韻律
パターン10を適切に設定して変化に富んだ音声を再現
することが可能となる。
【0012】
【発明の効果】本発明は、予め用意した音声素片パラメ
ータ系列を音韻・韻律を表現する入力記号列に従って読
出し、音声パラメータ結合規則によって前記音声素片パ
ラメータ系列を接続し、韻律制御規則によって音韻・韻
律を表現する入力記号列に応じた音韻継続時間長、ピッ
チパターン、振幅パターンなどを計算することにより韻
律を付加する規則音声合成装置において、入力記号列か
ら変数抽出規則によって複数の変数を抽出しこれらの変
数の中から異なる話者や発声形態毎に最適な変数セット
を選択するとともに前記変数抽出規則及び前記最適化さ
れた変数セット並びにこの最適な変数セットと前記入力
記号列及び音声データとから得た最適な係数セットを記
憶するカテゴリマッピング手段を設け、異なる話者や発
声形態に応じて変数セットを前記カテゴリマッピング手
段で記憶された中から選択する変数記憶選択手段を
し、この変数記憶選択手段で選択された変数セット及び
対応する係数セットを前記カテゴリマッピング手段で記
憶された中から取り出し、これらの変数セットと係数セ
ットと入力記号列とによって合成音声の韻律パターンを
生成するようにしたので、従来においては画一的であっ
た合成音声の韻律パターンを、変数選択も含めてきめ細
かく制御することが可能となり、これにより自然な音声
を合成することができるものである。
【図面の簡単な説明】
【図1】本発明の一実施例である音声分析時における構
成を示すブロック図である。
【図2】本発明の一実施例である音声合成時における構
成を示すブロック図である。 3 カテゴリマッピング手段 6 入力記号列 7 変数抽出規則 8 変数セット
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 13/00 - 13/08 G10L 21/00 - 21/06

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 予め用意した音声素片パラメータ系列を
    音韻・韻律を表現する入力記号列に従って読出し、音声
    パラメータ結合規則によって前記音声素片パラメータ系
    列を接続し、韻律制御規則によって音韻・韻律を表現す
    る入力記号列に応じた音韻継続時間長、ピッチパター
    ン、振幅パターンなどを計算することにより韻律を付加
    する規則音声合成装置において、入力記号列から変数抽
    出規則によって複数の変数を抽出しこれらの変数の中か
    ら異なる話者や発声形態毎に最適な変数セットを選択す
    とともに前記変数抽出規則及び前記最適化された変数
    セット並びにこの最適な変数セットと前記入力記号列及
    び音声データとから得た最適な係数セットを記憶する
    テゴリマッピング手段を設け、異なる話者や発声形態に
    応じて変数セットを前記カテゴリマッピング手段で記憶
    された中から選択する変数記憶選択手段を有し、この変
    数記憶選択手段で選択された変数セット及び対応する係
    数セットを前記カテゴリマッピング手段で記憶された中
    から取り出し、これらの変数セットと係数セットと入力
    記号列とによって合成音声の韻律パターンを生成するよ
    うにしたことを特徴とする韻律制御装置。
JP02410265A 1990-12-13 1990-12-13 韻律制御装置 Expired - Fee Related JP3133347B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02410265A JP3133347B2 (ja) 1990-12-13 1990-12-13 韻律制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02410265A JP3133347B2 (ja) 1990-12-13 1990-12-13 韻律制御装置

Publications (2)

Publication Number Publication Date
JPH04363634A JPH04363634A (ja) 1992-12-16
JP3133347B2 true JP3133347B2 (ja) 2001-02-05

Family

ID=18519453

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02410265A Expired - Fee Related JP3133347B2 (ja) 1990-12-13 1990-12-13 韻律制御装置

Country Status (1)

Country Link
JP (1) JP3133347B2 (ja)

Also Published As

Publication number Publication date
JPH04363634A (ja) 1992-12-16

Similar Documents

Publication Publication Date Title
US5940797A (en) Speech synthesis method utilizing auxiliary information, medium recorded thereon the method and apparatus utilizing the method
US4912768A (en) Speech encoding process combining written and spoken message codes
JP4125362B2 (ja) 音声合成装置
JP4539537B2 (ja) 音声合成装置,音声合成方法,およびコンピュータプログラム
WO2006095925A1 (ja) 音声合成装置、音声合成方法及びプログラム
JP3673471B2 (ja) テキスト音声合成装置およびプログラム記録媒体
CN111370024A (zh) 一种音频调整方法、设备及计算机可读存储介质
JPH1097267A (ja) 声質変換方法および装置
JP2001034280A (ja) 電子メール受信装置および電子メールシステム
JP3133347B2 (ja) 韻律制御装置
JP3094622B2 (ja) テキスト音声合成装置
WO2004027753A1 (en) Method of synthesis for a steady sound signal
JP2536169B2 (ja) 規則型音声合成装置
JPH05224689A (ja) 音声合成装置
JP3081300B2 (ja) 残差駆動型音声合成装置
US7130799B1 (en) Speech synthesis method
JPH09179576A (ja) 音声合成方法
JP3083624B2 (ja) 音声規則合成装置
CN113255313B (zh) 音乐生成方法、装置、电子设备和存储介质
JP2642617B2 (ja) 音声合成装置
JP3241582B2 (ja) 韻律制御装置及び方法
JPH11161297A (ja) 音声合成方法及び装置
JPH11109992A (ja) 音声素片データベースの作成方法、音声合成方法、音声素片データベース、音声素片データベース作成装置および音声合成装置
Jayasinghe Machine Singing Generation Through Deep Learning
JP3967571B2 (ja) 音源波形生成装置、音声合成装置、音源波形生成方法およびプログラム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071124

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081124

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees