JPH0553595A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH0553595A
JPH0553595A JP3218375A JP21837591A JPH0553595A JP H0553595 A JPH0553595 A JP H0553595A JP 3218375 A JP3218375 A JP 3218375A JP 21837591 A JP21837591 A JP 21837591A JP H0553595 A JPH0553595 A JP H0553595A
Authority
JP
Japan
Prior art keywords
voice
speech
unit
parameter
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3218375A
Other languages
English (en)
Inventor
Takeshi Fujita
武 藤田
Yasunori Ohora
恭則 大洞
Takashi Aso
隆 麻生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP3218375A priority Critical patent/JPH0553595A/ja
Publication of JPH0553595A publication Critical patent/JPH0553595A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 本発明の目的は、指示した声質の合成音声を
作り出すために適切な音声パラメータを使用することに
よつて、明瞭で自然な合成音を得る音声合成装置を提供
することにある。 【構成】 パラメータ化された音声素片と駆動音源とを
一定の規則に従つて順次結合して、音声を出力する音声
合成装置であつて、複数の性別,声の高さ,発声速度,
アクセントの強調量を含む声質パラメータと複数の音声
パラメータとを対応させて記憶する記憶手段と、合成時
に前記声質パラメータの指定に従つて、対応する音声パ
ラメータに基づき音声を合成する音声合成手段とを備
え、合成音の声質を変化できることを特徴とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は規則合成方式、すなわち
パラメータ化された音声素片と駆動音源とを一定の規則
に従つて順次結合して、音声を出力する音声合成装置に
関するものてある。
【0002】
【従来の技術】VcV(母音−子音−母音)素片やcV
(子音−母音)素片などの音声素片を合成の基本単位と
して、任意の音声を作り出す規則合成方式では、各素片
のスペクトルパラメータ(メルケプストラム,PARC
OR,LPC,LSPなど)と駆動音源信号(インパル
ス列など)を一定の規則に従つて結合し、これを音声合
成器に与えることによつて合成音声を得ている。
【0003】規則合成方式による合成音声の声質を左右
する要素としては、性別,声の高さ,発声速度,アクセ
ント強調量や音量などがあるが、声質を変化させる方法
としては、従来から、スペクトルパラメータを変化させ
る方法や、合成フイルタの係数を変化させる方法または
駆動音源信号への基本周波数の時間パターン変化をさせ
る方法などが行なわれている。
【0004】スペクトルパラメータを変化させる方法に
は、音声素片接続の際に、スペクトルパラメータをその
まま接続するのではなく、スペクトルパラメータの時間
軸を伸縮させて接続する方法がある。この方法による
と、同じパラメータで異なる発声速度の合成音を作り出
すことが可能となる。
【0005】合成フイルタの係数を変化させる方法は、
人間が発声した音声をスペクトルパラメータに変換した
方法を逆にして、スペクトルパラメータから音声に逆変
換するのではなく、変換の際に合成フイルタの係数を調
整することにより、音声スペクトルの高域または低域を
強調したりすることによつて、原音声とは音色の異なる
合成音声を作る方法である。
【0006】駆動音源信号の基本周波数の時間パターン
を変化させる方法は、スペクトルパラメータを作成する
際に、人間が実際に発声したものとは異なる基本周波数
の時間パターンを音声合成器に与えることによつて、様
々な音色の音声を合成する方法である。基本周波数を高
く設定することによつて女性音声を、基本周波数を低く
設定することによつて男性音声を合成することができ
る。また、基本周波数の時間的な変化の度合を大きく設
定することによつてめりはりのある合成音声を、小さく
設定することによつてめりはりのない合成音を作ること
ができる。
【0007】
【発明が解決しようとしている課題】しかしながら、上
述した従来技術には以下のような問題点がある。
【0008】合成の基本単位である音声素片としては、
単語あるいは文章として発声された人間の音声の中から
該当する部分を切り出したものを使用しているが、この
音声素片は作成された時の環境に大きく依存している。
例えば、同じ音声素片でも、発声者,性別,発声速度な
どの違いによつてスペクトルパラメータはかなり異なっ
ている。
【0009】このため、ある特定の環境下において作成
された1個の音声素片から、別の環境の音声素片を作り
出すことは非常に困難である。また、従来行なわれてい
たような方法による声質の変化では、合成音が不自然な
ものとなつたり明瞭性に欠ける聞きとりにくいものにな
つてしまつている。
【0010】本発明は、前記従来の欠点を除去し、指示
した声質の合成音声を作り出すために適切な音声パラメ
ータを使用することによつて、明瞭で自然な合成音を得
る音声合成装置を提供する。
【0011】
【課題を解決するための手段】この課題を解決するため
に、本発明の音声合成装置は、パラメータ化された音声
素片と駆動音源とを一定の規則に従つて順次結合して、
音声を出力する音声合成装置であつて、複数の性別,声
の高さ,発声速度,アクセントの強調量を含む声質パラ
メータと複数の音声パラメータとを対応させて記憶する
記憶手段と、合成時に前記声質パラメータの指定に従つ
て、対応する音声パラメータに基づき音声を合成する音
声合成手段とを備え、合成音の声質を変化できる。かか
る構成により、指示した声質の合成音声を作り出すため
に適切な音声パラメータを使用することによつて、明瞭
で自然な合成音を得ることを可能とする。
【0012】
【実施例】以下、本発明の実施例について図面を参照し
ながら詳細に説明する。
【0013】図1は本実施例の音声合成装置の構成を示
すブロツク図である。
【0014】101は文字系列入力部であり、合成すべ
き音声の文字表記および性別,声の高さ,発声速度,ア
クセント強調量などの声質制御記号を入力する。102
は音韻系列生成部であり、文字系列入力部101より入
力された文字表記を、例えばVcV音節やcV音節など
の音韻系列へ変換する。103Aおよび103Bは音声
メモリであり、音声を規則によつて合成するために必要
な全ての音声素片パラメータと同時に、それら音声素片
の声質を表す性別,声の高さ,発声速度,アクセント強
調量などの声質パラメータを格納している。104は音
声メモリ格納部であり、音声メモリ103Aや103B
を有している。
【0015】105は音声パラメータ接続部であり、文
字系列入力部101より入力した声質制御記号と音韻系
列生成部102より得られる音韻系列とに応じて、音声
メモリ格納部104から適切な音声素片パラメータを取
り出し順次接続する。106はピツチパターン生成部で
あり、文字系列入力部101より入力した声質制御記号
によつて文字系列に対応するピツチパターンを生成す
る。107は駆動音源であり、有声区間に対してはイン
パルス列のような音源信号を、無声区間に対しては白色
雑音のような音源信号をそれぞれ生成して、音声合成部
108に供給する。
【0016】108は音声合成部であり、音声パラメー
タ接続部105で得られる音声パラメータ、ピツチパタ
ーン生成部106で得られるピツチパターンおよび駆動
音源107からの音源とを一定の規則に基づいて順次結
合して音声を合成する。尚、本例では音声メモリ103
を2つとしているが、数に限定はない。
【0017】図2は音声メモリ103を説明するための
図である。
【0018】201は音声パラメータ格納部であり、イ
ンデツクス部202と音声素片パラメータ部203から
なる。
【0019】インデツクス部202は、各音韻のインデ
ツクス番号に対応する音声素片パラメータが音声素片パ
ラメータ部203のどの位置に格納されているかを示す
メモリ中のアドレスを格納している。例えば、インデツ
クス番号が1の音声素片パラメータは音声素片パラメー
タ格納部203の5フレーム目から9フレーム目までに
格納されており、インデツクス番号が1535の音声素
片パラメータは音声素片パラメータ格納部203の32
167フレーム目から32171フレーム目までに格納
されている。音声素片パラメータ格納部203は音声規
則合成に必要な音声素片パラメータを格納している。
【0020】204は声質パラメータ格納部であり、音
声素片パラメータ格納部203の音声素片パラメータに
対応する性別,声の高さ,発声速度,アクセント強調量
の声質パラメータを格納している。
【0021】図3はVcVによる音声規則合成の場合
の、音韻とインデツクス部202のインデツクス番号の
関係を説明するための図である。
【0022】この図から例えば、/nSE/という音韻
はインデツクス番号が1571であり、インデツクス部
202からその音声パラメータは音声素片パラメータ格
納部203の33007フレーム目から格納されている
ことがわかる。また/EI/という音韻はインデツクス
番号が1025であり、インデツクス部202からその
音声パラメータは音声素片パラメータ格納部203の2
0933フレーム目から格納されていることがわかる。
【0023】図4はピツチパターン生成部106を説明
するための図である。
【0024】文字系列入力部101で例えば「{V2}
OnSEI」と入力された場合には、アクセント辞書4
01より「OnSEI」という文字列に対応するアクセ
ントパターンを取り出し、また音声メモリ格納部104
に格納されている音声メモリ103の中から、{V2}
に対応するものを選び、その声質(声の高さ,アクセン
ト強調量等)を使って変形し、「{V2}OnSEI」
という文字系列に対応するピツチパターンを生成する。
【0025】図5はVcVによる音声規則合成による場
合の、音韻系列生成部102と音声パラメータ接続部1
05とを説明するための図である。
【0026】文字列入力部101で例えば「{V2}O
nSEI」と入力された場合には、音韻系列生成部10
2は「{V2}/QO//On//nSE//EI//
IQ/」を出力する。音声パラメータ接続部105は音
声メモリ格納部104にある音声メモリ103の中から
{V2}に対応するものを選ぶ。さらに、「/QO/,
/On/,/nSE/,/EI/,/IQ/」の各音韻
に対応するインデツクス番号が図3から「4,153
5,1571,1025,745」で与えられるので、
これらに対応する音声素片パラメータを音声素片パラメ
ータ部203より取り出す。次に前記音声素片パラメー
タ部203より取り出した音声素片パラメータを、声質
パラメータ格納部204より取り出した発声速度情報に
基づいて接続する。
【0027】図6は実施例の構成での実行例である。
【0028】601は本実施例の音声合成装置のうち音
声メモリ103を取り除いた部分であり、103Aは声
質{V1}に対応する音声メモリ、103Bは声質{V
2}に対応する音声メモリである。この時文字系列入力
部101への入力が「{V1}OnSEI1{V2}O
nSEI」であるとすると、まず声質制御記号{V1}
によつて、音声メモリ103Aが選択される。文字系列
「OnSEI」によつて音声メモリ103Aから声質
{V1}に対応するピツチパターンおよびパラメータを
生成し、音声波形を合成し出力する。次に、声質制御記
号{V2}によつて、音声メモリ103Bが選択され
る。文字系列「OnSEI」によつて音声メモリ103
Bから声質{V2}に対応するピツチパターンおよびパ
ラメータを生成し、音声波形を合成し出力する。
【0029】尚、{V1},{V2}で示した声質制御
信号は、声質パラメータ格納部204に示した性別,声
の高さ,発生速度,アクセント強調量を示すものに限定
されず、他の声質に関連する情報、あるいは声質制御信
号に近い声質パラメータを選択するものであつてもよ
い。
【0030】本発明は、複数の機器から構成されるシス
テムに適用しても、1つの機器から成る装置に適用して
も良い。また、本発明はシステム或は装置にプログラム
を供給することによつて達成される場合にも適用できる
ことは言うまでもない。
【0031】
【発明の効果】本発明により、指示した声質の合成音声
を作り出すために適切な音声パラメータを使用すること
によつて、明瞭で自然な合成音を得る音声合成装置を提
供できる。
【図面の簡単な説明】
【図1】本実施例の音声合成装置の構成を示すブロツク
図である。
【図2】音声メモリ103を説明する図である。
【図3】VcVによる音声規則合成の場合の、音韻とイ
ンデツクス番号の関係を説明する図である。
【図4】ピツチパターン生成部106を説明する図であ
る。
【図5】VcVによる音声規則合成の場合の音韻系列生
成部102と音声パラメータ接続部105とを説明する
図である。
【図6】本実施例の構成での実行例を説明する図であ
る。
【符号の説明】
101…文字系列入力部、102…音韻系列生成部、1
03A,103B…音声メモリ、104…音声メモリ格
納部、105…音声パラメータ接続部、106…ピツチ
パターン生成部、107…駆動音源、108…音声合成

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 パラメータ化された音声素片と駆動音源
    とを一定の規則に従つて順次結合して、音声を出力する
    音声合成装置であつて、 複数の性別,声の高さ,発声速度,アクセントの強調量
    を含む声質パラメータと複数の音声パラメータとを対応
    させて記憶する記憶手段と、 合成時に前記声質パラメータの指定に従つて、対応する
    音声パラメータに基づき音声を合成する音声合成手段と
    を備え、 合成音の声質を変化できることを特徴とする音声合成装
    置。
JP3218375A 1991-08-29 1991-08-29 音声合成装置 Pending JPH0553595A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3218375A JPH0553595A (ja) 1991-08-29 1991-08-29 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3218375A JPH0553595A (ja) 1991-08-29 1991-08-29 音声合成装置

Publications (1)

Publication Number Publication Date
JPH0553595A true JPH0553595A (ja) 1993-03-05

Family

ID=16718914

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3218375A Pending JPH0553595A (ja) 1991-08-29 1991-08-29 音声合成装置

Country Status (1)

Country Link
JP (1) JPH0553595A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001041448A1 (fr) * 1999-11-30 2001-06-07 Ecchandes Inc. Systeme d'acquisition de donnees, oeil artificiel, dispositif de vision, capteur d'images, et appareil associe
WO2020089961A1 (ja) 2018-10-29 2020-05-07 健一 海沼 音声処理装置、およびプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001041448A1 (fr) * 1999-11-30 2001-06-07 Ecchandes Inc. Systeme d'acquisition de donnees, oeil artificiel, dispositif de vision, capteur d'images, et appareil associe
CN100355284C (zh) * 1999-11-30 2007-12-12 伊强德斯股份有限公司 视觉装置
WO2020089961A1 (ja) 2018-10-29 2020-05-07 健一 海沼 音声処理装置、およびプログラム

Similar Documents

Publication Publication Date Title
JP3563772B2 (ja) 音声合成方法及び装置並びに音声合成制御方法及び装置
JPH031200A (ja) 規則型音声合成装置
JP3732793B2 (ja) 音声合成方法、音声合成装置及び記録媒体
JP2564641B2 (ja) 音声合成装置
JP3307283B2 (ja) 歌唱音合成装置
JP5175422B2 (ja) 音声合成における時間幅を制御する方法
AU6081399A (en) Device and method for digital voice processing
JPH0553595A (ja) 音声合成装置
JP3233036B2 (ja) 歌唱音合成装置
JP3081300B2 (ja) 残差駆動型音声合成装置
JP2703253B2 (ja) 音声合成装置
JP2573586B2 (ja) 規則型音声合成装置
WO2023182291A1 (ja) 音声合成装置、音声合成方法及びプログラム
JPS5914752B2 (ja) 音声合成方式
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JPH0836397A (ja) 音声合成装置
JP2586040B2 (ja) 音声編集合成装置
JP3284634B2 (ja) 規則音声合成装置
JPH06250685A (ja) 音声合成方式および規則合成装置
JPH04125699A (ja) 残差駆動型音声合成装置
JPH1011083A (ja) テキスト音声変換装置
Singh et al. Removal of spectral discontinuity in concatenated speech waveform
Siivola A survey of methods for the synthesis of the singing voice
JP2573587B2 (ja) ピッチパタン生成装置
JPH0572599B2 (ja)

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20001204