JPH06318094A - 音声規則合成装置 - Google Patents

音声規則合成装置

Info

Publication number
JPH06318094A
JPH06318094A JP5106683A JP10668393A JPH06318094A JP H06318094 A JPH06318094 A JP H06318094A JP 5106683 A JP5106683 A JP 5106683A JP 10668393 A JP10668393 A JP 10668393A JP H06318094 A JPH06318094 A JP H06318094A
Authority
JP
Japan
Prior art keywords
synthesis
speech
unit
information
target spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5106683A
Other languages
English (en)
Other versions
JP3109778B2 (ja
Inventor
Osamu Kimura
治 木村
Nobuyoshi Umiki
延佳 海木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP05106683A priority Critical patent/JP3109778B2/ja
Publication of JPH06318094A publication Critical patent/JPH06318094A/ja
Application granted granted Critical
Publication of JP3109778B2 publication Critical patent/JP3109778B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 大量の音声データから演算量が比較的少な
く、しかも素片接続部のスペクトル歪みの少ない素片を
選択することにより、明瞭性及び自然性が高い合成音声
を出力できる音声規則合成装置を提供することにある。 【構成】 自然音声を分析して音韻毎にラベル付けされ
た音声合成パラメータを格納する音声パラメータファイ
ル(16)と、出力音声を組み立てるために適切な合成
単位の情報を設定する合成単位設定部(14)と、音韻
情報、音律情報、及び合成単位設定部で設定された情報
に基づいて合成単位での接続部におけるターゲットスペ
クトルを算出するターゲットスペクトル算出部(15)
と、ターゲットスペクトル算出部で算出されたターゲッ
トスペクトルに基づいて音声パラメータファイルに格納
されている音声合成パラメータから適切な合成素片を選
択する合成素片選択部(17)と、合成素片選択部で選
択された合成素片を接続する合成素片接続部(18)と
を備えている。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、合成音声を生成する音
声規則合成装置に関する。
【0002】
【従来の技術】規則に従って音声を合成する従来の音声
合成装置では、音声の合成単位として音韻や、音節、V
CV(母音・子音・母音)連接、CVC(子音・母音・
子音)連接、単語など音韻との対応や、調音結合を考慮
した単位を設定し、自然音声を分析して作成した音声合
成パラメータ値を記憶しておき、入力文字列に対応する
単位の音声合成パラメータ(以下、合成素片と呼ぶ)の
編集、結合、変形により音声を合成していた。
【0003】
【発明が解決しようとする課題】しかしながら、上述し
た従来の音声合成装置では、同じ音素や音節で、単位毎
に発声して集めた音と文章中に現れる音がかなり異なる
ため、合成音の自然さに欠けるという問題点があった。
【0004】例えば、単音節などを発声した自然音声を
分析したもので文章の音声を合成すると、一音一音はっ
きりと発音しているような印象の合成音になってしま
う。合成音の速度をあげるほどその傾向が強い。
【0005】また、あらかじめ文章や単語のように合成
単位よりも長い単位で発声した自然音声を大量に持ち、
最適な素片を選択して合成素片として用いると、調音結
合はすでに表現されているので自然性が向上するが、最
適な素片を選択する規則がまだ見い出されていない。
【0006】特に、合成素片の接続による歪みを少なく
するために、合成素片の接続部のスペクトル歪みを考慮
して素片を選択するには、素片間のスペクトル間距離を
算出する必要があり、素片の組合せの多さから多大の演
算量が必要であるという問題点があった。
【0007】本発明の目的は、大量の音声データから演
算量が比較的少なく、しかも素片接続部のスペクトル歪
みの少ない素片を選択することにより、明瞭性及び自然
性が高い合成音声を出力できる音声規則合成装置を提供
することにある。
【0008】
【課題を解決するための手段】本発明の目的は、自然音
声を分析して音韻毎にラベル付けされた音声合成パラメ
ータを格納する記憶手段と、出力音声を組み立てるため
に適切な合成単位の情報を設定する設定手段と、音韻情
報、音律情報、及び設定手段で設定された情報に基づい
て合成単位での接続部におけるターゲットスペクトルを
算出する算出手段と、算出手段で算出されたターゲット
スペクトルに基づいて記憶手段に格納されている音声合
成パラメータから適切な合成素片を選択する選択手段
と、選択手段で選択された合成素片を接続する接続手段
とを備えている音声規則合成装置によって達成される。
【0009】
【作用】本発明の音声規則合成装置では、設定手段は、
音節やVCV(母音・子音・母音)音韻系列など出力音
声を組み立てる上で適切な合成単位を設定し、算出手段
は、音韻情報と韻律情報および上記合成単位設定部から
の情報により上記合成単位での接続部におけるターゲッ
トスペクトルを算出し、記憶手段は、大量の自然音声を
分析して音韻毎にラベル付けされた音声合成パラメータ
値を格納し、選択手段は、算出手段からの情報により、
記憶手段より適切な合成素片を選択し、接続手段は、選
択された合成素片を接続する。
【0010】
【実施例】以下、図面を参照して、本発明の音声規則合
成装置の実施例を説明する。
【0011】図1は、本発明の音声規則合成装置の一実
施例の構成を示すブロック図である。
【0012】図1の音声規則合成装置は、テキスト入力
端子11に接続されておりテキスト入力端子から入力さ
れた変換すべきテキストを基に形態素解析、漢字かな変
換、アクセント処理等を行なって出力するテキスト解析
部12、テキスト解析部12に接続されておりテキスト
解析部12から出力された解析情報を基にピッチパタ
ン、各音素毎の時間長パタン、及び振幅パタンを生成し
て出力する韻律情報生成部13、テキスト解析部12に
接続されておりテキスト解析部12から出力された解析
情報を基に出力音声を組み立てるために合成単位に分割
して出力する設定手段である合成単位設定部14、韻律
情報生成部13及び合成単位設定部14に接続されてお
り合成単位設定部14で合成単位に分割された前後の音
韻系列と韻律情報生成部13からの情報を基に最適なタ
ーゲットスペクトルを算出して出力する算出手段である
ターゲットスペクトル算出部15、ターゲットスペクト
ル算出部15に接続されており大量の音声データを基に
合成に必要な音響パラメータを分析、作成するして出力
する記憶手段である音声パラメータファイル16、ター
ゲットスペクトル算出部15及び音声パラメータファイ
ル16に接続されており合成素片の接続部のスペクトル
がターゲットスペクトルに最も近いものを音声パラメー
タファイル16の中から選択して出力する選択手段であ
る合成素片選択部17、合成素片選択部17に接続され
ており選択された素片同士を結合して出力する接続手段
である合成素片接続部8、韻律情報生成部13及び合成
素片接続部18に接続されており合成素片接続部18で
得られた合成素片系列及び韻律情報生成部13で得られ
た韻律情報を基に合成音声を生成して出力端子20に出
力する合成音声生成部19によって構成されている。
【0013】次に、図1の音声規則合成装置の動作を説
明する。
【0014】テキスト入力端子11より音声に変換すべ
きテキストが入力されると、テキスト解析部12より係
り受けなどの構文解析や品詞解析などの形態素解析、及
び漢字かな変換、アクセント処理が行われ、合成単位設
定部14、韻律情報生成部13に必要な解析情報が送出
される。その解析情報としては合成単位設定部14に対
しては音韻の区別を示す記号列、韻律情報生成部13に
対しては呼気段落内モーラ数、アクセント形、発声スピ
ードなどである。
【0015】韻律情報生成部13は、これらの情報を基
にピッチパタン、各音素毎の時間長パタン、及び振幅パ
タンを規則により生成する。
【0016】合成単位設定部14は、入力された音韻記
号列を、音節やVCV音韻系列など出力音声を組み立て
る上で適切な合成単位に分割し、その分割された音韻系
列をターゲットスペクトル算出部15に出力する。
【0017】ターゲットスペクトル算出部15は、合成
単位に分割された前後の音韻系列と、韻律情報生成部1
3からの情報を基に最適なターゲットスペクトルを算出
する。
【0018】音声パラメータファイル16は、大量の音
声データを基にオフライン処理であらかじめ作成してお
く。例えば、アナウンサ一人による単語、文章など数時
間分の音声データに対しデジタルソナグラムによる視察
により音韻ラベリングを施して、合成に必要な音響パラ
メータを分析しておく。
【0019】合成素片選択部17は、合成素片の接続部
のスペクトルが、上記ターゲットスペクトルに最も近い
ものを音声パラメータファイル16の中から選択する。
【0020】合成素片接続部18は、選択された素片ど
うしの結合を行なって合成波形生成部19に送出する。
【0021】合成音声生成部19は、合成素片接続部1
8で得られた合成素片系列と、韻律情報生成部13で得
られた韻律情報を基にして合成音声を生成し、生成した
音声を出力端子10に出力される。
【0022】上述した構成では、テキスト解析部12を
設けているが、あらかじめテキスト解析を行い、その解
析情報を本装置へ入力した場合には、テキスト解析部1
2を省略できる。
【0023】同様に、あらかじめ韻律のパタンを生成し
本装置へ入力した場合は、韻律情報生成部13を省略で
きる。
【0024】ここで用いる音響パラメータ及び合成音声
を生成するための合成器については、特に規定するもの
はなく全てに対して適用可能である。
【0025】次に、図2のフローチャートを参照して、
上記ターゲットスペクトル算出部15の動作を詳細に述
べる。
【0026】図2は、/oNsei/を合成する場合の
/N/のターゲットを算出する一例を示している。
【0027】まず、前後の合成単位と韻律情報を入力し
(ステップS1)、接続部の音韻を中心に音韻系列を設
定し(ステップS2)、音声パラメータファイル16か
らその音韻系列を含む音声パラメータを検索する(ステ
ップS3)。
【0028】もし、候補が見つからない場合は、順次検
索音韻系列を両側から削除しながら検索を行なう。例え
ば/oNse/を含む音声パラメータがないときは、/
oNs/→/Ns/→/N/となる。
【0029】次に、韻律情報から接続部のピッチ条件を
設定し(ステップS4)、候補の絞り込みを行なう(ス
テップS5)。このピッチ条件は、例えばピッチの±5
%などとする。もし該当するものがなければ、ピッチ条
件を±10%、15%……と広げていく。
【0030】次に、候補の中から接続部の音韻の継続長
に最も近いものを選択し(ステップS6)、選択された
音声パラメータから接続音韻の中心のスペクトルを算出
し(ステップS7)、ターゲットスペクトルとする(ス
テップS8)。
【0031】以上の処理で接続部のターゲットスペクト
ルを算出する。
【0032】次に、図1の音声規則合成装置による音声
規則の合成処理を具体的に説明する。
【0033】例えば「音声」という単語がテキスト入力
端子11に入力されると、テキスト解析部12で/oN
sei/という音韻系列と韻律情報が生成される。そし
て、合成単位をVCVとすると、合成単位設定部14で
/So/、/oN/、/Nse/、/ei/、/iS/
の5つの合成単位に分割される。ただし、/S/は無音
をあらわす。次に合成単位毎に素片を選択して行くが、
以下に/Nse/の場合の例を示す。
【0034】まず、ターゲットスペクトル算出部15で
/oN/と/Nse/の接続部のターゲットスペクトル
を算出する。この場合、/oNse/の音韻系列の音声
パラメータを音声パラメータファイル16から検索し、
韻律情報からの絞り込みによって選択された音声パラメ
ータの/N/の時間的中心であるスペクトルをターゲッ
トスペクトルSP1とする。
【0035】同様に/Nse/と/ei/との接続部の
ターゲットスペクトルSP2も算出する。
【0036】次に、合成素片選択部17で、/Nse/
の音韻系列を持つ音声パラメータを音声パラメータファ
イル16から検索する。次に、ターゲットスペクトルS
P1、SP2と検索された候補毎に/N/及び/e/の
部分のスペクトル距離の最小値を算出し、その最小値の
和が最も小さい候補を合成素片として選択する。このよ
うにして合成単位毎に素片を選択した後、合成素片の接
続をターゲットスペクトルとの距離が最小の位置で行な
い、合成波形を生成する。
【0037】このように接続部における最適なターゲッ
トスペクトルを設定し、これに最も近いスペクトルを持
つ合成素片を接続していくことによって、接続歪みの少
ない合成音声が得られる。
【0038】従来のターゲットスペクトルを設定しない
で接続歪みの少ない合成を行なう方式では、接続する合
成素片間の組合せの多さのために多大の計算量を要して
いたのに対し、本装置では計算量の大幅な削減が可能で
ある。
【0039】更に、計算量及びメモリを削減する方法と
して、音韻系列及び韻律情報毎にあらかじめターゲット
スペクトルを算出し、そのターゲットスペクトルに最適
な合成素片をテーブル登録しておく。
【0040】例えば、VCV単位の合成でハツオン/N
/も母音として考えると、接続部は/a、i、u、e、
o、N/の6種類である。
【0041】最小のハード構成を考えると、あらかじめ
普通の高さで発声した単母音の定常部を分析しておき、
それぞれのスペクトルをターゲットスペクトルとする。
【0042】次に、上記合成素片選択部17と同様のア
ルゴリズムで、ターゲットスペクトルに最適な合成素片
を選択し、これをテーブル登録しておく。そして合成時
には、そのテーブルを参照することによって合成素片を
選択する。この場合、VCV毎に1種類の合成素片が対
応しているテーブルを構築できる。
【0043】この方法では、合成時に検索処理を行なう
方法に比べて合成音の品質が落ちる可能性はあるが、テ
ーブルに記述された合成素片のみを音声パラメータファ
イルにメモリするだけでよく、更に合成時に検索処理を
行なわないので、計算量及びメモリを大幅に削減でき
る。
【0044】また、もう少し大きなハード構成が可能な
ら、複数の高さで発声した単母音の定常部をターゲット
にしたり、調音結合の影響を強く受ける音韻系列(例え
ば無声化や鼻音化)の音声からターゲットを作成し、合
成素片テーブルを作成することによって更に高品質化を
はかることができる。
【0045】
【発明の効果】本発明の音声規則合成装置は、自然音声
を分析して音韻毎にラベル付けされた音声合成パラメー
タを格納する記憶手段と、出力音声を組み立てるために
適切な合成単位の情報を設定する設定手段と、音韻情
報、音律情報、及び設定手段で設定された情報に基づい
て合成単位での接続部におけるターゲットスペクトルを
算出する算出手段と、算出手段で算出されたターゲット
スペクトルに基づいて記憶手段に格納されている音声合
成パラメータから適切な合成素片を選択する選択手段
と、選択手段で選択された合成素片を接続する接続手段
とを備えているので、大量の音声パラメータを蓄積して
おき、音声の合成のために最適な合成素片を抽出して接
続することにより出力音声を合成する。その結果、少な
い計算量で明瞭性が高くしかも自然性のよい音声を得る
ことができる。
【図面の簡単な説明】
【図1】本発明の音声規則合成装置の一実施例の構成を
示すブロック図である。
【図2】図1の音声規則合成装置によるターゲットスペ
クトルの算出処理を説明するためのフローチャートであ
る。
【符号の説明】
11 テキスト入力端子 12 テキスト解析部 13 韻律情報生成部 14 合成単位設定部 15 ターゲットスペクトル算出部 16 音声パラメータファイル 17 合成素片選択部 18 合成素片接続部 19 合成音声生成部 20 音声出力端子

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 自然音声を分析して音韻毎にラベル付け
    された音声合成パラメータを格納する記憶手段と、出力
    音声を組み立てるために適切な合成単位の情報を設定す
    る設定手段と、音韻情報、音律情報、及び該設定手段で
    設定された情報に基づいて該合成単位での接続部におけ
    るターゲットスペクトルを算出する算出手段と、該算出
    手段で算出された該ターゲットスペクトルに基づいて該
    記憶手段に格納されている該音声合成パラメータから適
    切な合成素片を選択する選択手段と、該選択手段で選択
    された該合成素片を接続する接続手段とを備えているこ
    とを特徴とする音声規則合成装置。
JP05106683A 1993-05-07 1993-05-07 音声規則合成装置 Expired - Fee Related JP3109778B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05106683A JP3109778B2 (ja) 1993-05-07 1993-05-07 音声規則合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05106683A JP3109778B2 (ja) 1993-05-07 1993-05-07 音声規則合成装置

Publications (2)

Publication Number Publication Date
JPH06318094A true JPH06318094A (ja) 1994-11-15
JP3109778B2 JP3109778B2 (ja) 2000-11-20

Family

ID=14439869

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05106683A Expired - Fee Related JP3109778B2 (ja) 1993-05-07 1993-05-07 音声規則合成装置

Country Status (1)

Country Link
JP (1) JP3109778B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002091475A (ja) * 2000-09-18 2002-03-27 Matsushita Electric Ind Co Ltd 音声合成方法
WO2004109659A1 (ja) * 2003-06-05 2004-12-16 Kabushiki Kaisha Kenwood 音声合成装置、音声合成方法及びプログラム
KR100564740B1 (ko) * 2002-12-14 2006-03-27 한국전자통신연구원 화행 정보를 이용한 음성 합성 방법 및 장치
WO2008139919A1 (ja) * 2007-05-08 2008-11-20 Nec Corporation 音声合成装置、音声合成方法及び音声合成プログラム
US7765103B2 (en) 2003-06-13 2010-07-27 Sony Corporation Rule based speech synthesis method and apparatus

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07205055A (ja) * 1994-01-12 1995-08-08 Max Co Ltd 手持ち作業用衝撃工具のグリップ装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002091475A (ja) * 2000-09-18 2002-03-27 Matsushita Electric Ind Co Ltd 音声合成方法
KR100564740B1 (ko) * 2002-12-14 2006-03-27 한국전자통신연구원 화행 정보를 이용한 음성 합성 방법 및 장치
WO2004109659A1 (ja) * 2003-06-05 2004-12-16 Kabushiki Kaisha Kenwood 音声合成装置、音声合成方法及びプログラム
US8214216B2 (en) 2003-06-05 2012-07-03 Kabushiki Kaisha Kenwood Speech synthesis for synthesizing missing parts
US7765103B2 (en) 2003-06-13 2010-07-27 Sony Corporation Rule based speech synthesis method and apparatus
WO2008139919A1 (ja) * 2007-05-08 2008-11-20 Nec Corporation 音声合成装置、音声合成方法及び音声合成プログラム
US8407054B2 (en) 2007-05-08 2013-03-26 Nec Corporation Speech synthesis device, speech synthesis method, and speech synthesis program

Also Published As

Publication number Publication date
JP3109778B2 (ja) 2000-11-20

Similar Documents

Publication Publication Date Title
US6778962B1 (en) Speech synthesis with prosodic model data and accent type
EP2270773B1 (en) Apparatus and method for creating singing synthesizing database, and pitch curve generation apparatus and method
JPH10171484A (ja) 音声合成方法および装置
JPH0833744B2 (ja) 音声合成装置
JP5320363B2 (ja) 音声編集方法、装置及び音声合成方法
JP2009139677A (ja) 音声処理装置及びそのプログラム
JP4533255B2 (ja) 音声合成装置、音声合成方法、音声合成プログラムおよびその記録媒体
JP3109778B2 (ja) 音声規則合成装置
JP4829605B2 (ja) 音声合成装置および音声合成プログラム
US6829577B1 (en) Generating non-stationary additive noise for addition to synthesized speech
JPH08335096A (ja) テキスト音声合成装置
JP2004354644A (ja) 音声合成方法及びその装置並びにそのコンピュータプログラム及びそれを記憶した情報記憶媒体
EP1589524B1 (en) Method and device for speech synthesis
JPH037995A (ja) 歌音声合成データの作成装置
JP2900454B2 (ja) 音声合成装置の音節データ作成方式
JP2703253B2 (ja) 音声合成装置
JPH0863187A (ja) 音声合成装置
JPH06167989A (ja) 音声合成装置
JP2573586B2 (ja) 規則型音声合成装置
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JP2004206144A (ja) 基本周波数パタン生成方法、及びプログラム記録媒体
JP3313310B2 (ja) 音声合成装置及び合成方法
JP2675883B2 (ja) 音声合成方式
JP2004347994A (ja) 音声合成装置、音声合成方法およびこの音声合成方法を実行するプログラム
JP2003308084A (ja) 音声合成方法および音声合成装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080914

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080914

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090914

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees