JPS63110499A - ピツチパタン生成装置 - Google Patents

ピツチパタン生成装置

Info

Publication number
JPS63110499A
JPS63110499A JP25749086A JP25749086A JPS63110499A JP S63110499 A JPS63110499 A JP S63110499A JP 25749086 A JP25749086 A JP 25749086A JP 25749086 A JP25749086 A JP 25749086A JP S63110499 A JPS63110499 A JP S63110499A
Authority
JP
Japan
Prior art keywords
pitch
value
signal line
sent
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP25749086A
Other languages
English (en)
Other versions
JP2573587B2 (ja
Inventor
幸夫 三留
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61257490A priority Critical patent/JP2573587B2/ja
Publication of JPS63110499A publication Critical patent/JPS63110499A/ja
Application granted granted Critical
Publication of JP2573587B2 publication Critical patent/JP2573587B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)
  • Vending Machines For Individual Products (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、文字列などの音声を表す情報から規則により
音声を合成する際のピッチパタン、即ち音声の基本周波
数の時間変化パタンを生成する装置に関する。
〈従来の技術〉 任意の文章や単語の読み等を表す文字列から音声を合成
するいわゆる音声の規則合成においては、音声合成すべ
き文章などの構造や、却語のアクセント等にもとづいて
、ピッチパタン、即ち音声の基本周波数の時間変化パタ
ンを生成することが、自然な合成音声を生成するために
重要である。
このような音声の規則合成におけるピッチパタンの生成
の例は、三位と伏木田による日本音響学会音声研究会資
料885−31(1985,7)、「ホルマント、cv
−vc型規則合成」に示されている。この音声の規則合
成は、音声合成規則として、時間長規則、ピッチ規則、
ポーズ規則、パラメータ編集規則などがあり、あらかじ
め自然音声を分析して得られたcv−vc<cは子音V
は母音を表す)を単位とするホルマントパラメータをm
4Aし、それをホルマント型音声合成器に与えることで
任意の音声を合成するものである。
この中てピンチ規則は、呼気段落の貝さ或は文節の長さ
やアクセント更に音素の時間長などの音声情報に基づい
て、各cv−vcの始端および呼気段落のr!一端での
ピッチ周波数の値を決め、それらを直線補間することに
より音声合成フレーム毎のピッチを決定する規則である
。ここで、各CV−■Cの始端および呼気段落の終端で
のピッチ周波数の値を決める際には、まず、nrp気段
落の始端から終端へ向けて直線的に下降する呼気段落成
分を生成し、それに文節(アクセント節)の成分を重畳
する。この文節の成分は、始端から第一の音節の終端に
向けて上昇し、アクセントのないものはそのまま一定値
を続け、アクセントのあるものはアクセント核から下降
するものである。
一方、ピッチパタンを生成する第二の従来例としては、
広瀬、藤崎、大田による、音響学会講演論文集(197
9,6)2−2−2に示された「日本語文音声の基本周
波数パタンの分析と特徴抽出」がある。
これは、文節(アクセント節)と呼気段落の二つのピッ
チパタンを、それぞれ2次の線形フィルタにステップ入
力を加えたときの出力として生成し、それらの和として
文音声のピッチパタンを生成するものである。
何れの例も、日本語はかりでなく他の言語の音声、例え
ば英語などにも応用することができる。
これらの例に共通ずるのは、入力の音声情報に基づいて
各種のパラメータ、例えば第一の例では呼気段落の始端
や終端のピッチ周波数あるいは文節成分のピッチ変化の
振幅、第二の例では線形フィルタの時間数やステップ入
力の振幅や継続時間などの値を決定し、それから音声合
成フレーム毎のピッチパタンを合成することである。
(発明が解決しようとする問題点) しかしながら、このような従来のピッチパタン生成装置
においては、同一の文章あるいは単語、更には、構文が
同一の文章や音節数やアクセントが同一の単語などは、
常に同一の規則が適用されるなめ、常に同じように発音
されることになる。
そのため、従来のピッチパタン生成装置によって生成さ
れたピッチパタンを用いた合成音声は機械的で不自然な
印象をうけ、長時間聞くと疲れるといった問題があった
単語や単文が長文の一部として現れる場合には、前後関
係が異なるならば、規則によっては少し異なって合成さ
れる場合もある。しかし、単語などが句読点によって区
切られ単独で現れ、規則がその前後を考慮しないような
場合にはいつも同じ様に合成されることになる。
このような状況は、テキストが長くなれはなるほど発生
する可能性か高くなり、不自然さが目立つことになる。
本発明の目的は、従来のピッチパタン生成装置に若干の
回昂を追加した程度の簡単な構成で、より自然な音声を
合成し得るピッチパタン生成装置を提供することにある
(問題点を解決するための手段) 前述の問題点を解決するために本発明が提供する手段は
、入力された音声情報に基づいてピッチパタンを生成す
るためのパラメータの値を決定する手段と、そのパラメ
ータの値からピッチパタンを生成する手段とを有するピ
ッチパタン生成装置であって、ランダムデータを発生ず
る手段と、そのランダムデータの値に応じて前記のパラ
メータの値を変化させる手段とを更に有することを特徴
とする。
(作用) 本発明は、ピッチパタンを生成するためのパラメータの
値を従来と同様に決定し、その値をランダムに変化させ
てピッチパタンを生成することにより、機械的な合成音
声の発生を避けようとするものである。これは、実際に
人間が同一の文章などを音読する場合には、韻律などは
発声の度に確率的に揺らぐという性質があり、それを実
現することで自然性を向上させようとするものである。
そのために、ランダムデータを発生する手段によって生
成されたランダムデータに応じて、パラメータ値を変化
させる手段により、従来と同様に決定されたピッチパタ
ンを生成するためのパラメータ値を変化させ、それから
ピッチパタンを生成するのである。
このとき、あらかじめ実際に人間が発声しな音声を分析
しピンチ抽出して、パラメータの値の統計的な分布を調
べておき、その分布にもとづいてパラメータ値の変化さ
せる景を決定する。
ランクムデータを発生ずる手段としては、従来から合同
法によるものやM系列によるもの等が知られており、い
ずれの方法に基づくものでも利用可能である。
(実施例) 次に、図面を参照して本発明の詳細な説明する。
第1図は、本発明の一実施例のブロック図である。図に
おいて、101は制御回路、102はピッチパラメータ
値生成回路、103はデータ補間回路、104はデータ
分布値メモリ、105は乱数発生回路、106は乗算器
、107は加算器である。
ピンチパラメータ値生成回路102は、前述の第一の従
来例におけるものと同様に、制御回118101から信
号線113を介して送られる音素系列に基づいて、ピッ
チパラメータ値、即ち呼気段落の始端や終端のピッチ周
波数あるいは文節成分のピッチ変化の振幅等の値を生成
し、信号線120に送出する。
データ補間回路103も、第一の従来例におけるものと
同様に、信号線116から送られる時間長データに基づ
いて、信号線121がら入力されるピッチパラメータ値
から決定した各cv−vcの始端および呼気段落の終端
でのピッチ周波数の値の間を補間しビンチバクンを生成
する。
データ分布値メモリ 104には、各ピッチパラメータ
値の分布するね天領が記憶されていて、制御回路101
から信号線114を介して送られる指示に従って、その
分布の最大値を信号線117へと送り出す。
乱数発生回路105では、制御回路101がら信号線1
15を介して送られる指示に従って、絶対値が1以下の
正負の乱数が発生され信号線118へと送り出される。
乗算器106では、データ分布値メモリ 104がら送
られるデータの分布の最大値に、乱数発生回路105か
ら送られる乱数が乗じられ、その積が信号=  7 − 線119を介して加算器107へと送られる。
加算器107では、ピッチパラメータ値生成回路102
から送られるピッチパラメータ値と、乗算器106から
送られるデータ分布値と乱数の積か加え合わされて新た
なピッチパラメータ値として信号線121を介してデー
タ補間回路103に送られる。
制御回路101は、信号線111から音素系列と時間長
データが入力されると、音素系列を信号線113を介し
てピッチパラメータ値生成回路102に送りピッチパラ
メータ値を発生させ、時間長データを信号線116を介
してデータ補間回路103に送る。更に、信号線114
を介してデータ分布値メモリ 104に指示を送りデー
タの分布の最大値を発生させ、信号線115を介して乱
数発生回路105に指示を送り乱数を発生させる。
こうして、ピッチパラメータ値生成回路102で生成さ
れたピッチパラメータ値に、データ分布値メモリ 10
4で生成されたデータの分布の最大値と乱数発生回路1
05で生成された乱数の積が加算され、その新たなピッ
チパラメータ値と時間長デー夕に基づいてピッチパタン
か生成され、信号線112から出力される。
第2図は、本発明の第二の実施例のブロック図である。
図において、201は制御回路、202は時定数−ステ
ップパラメータ値生成回路、203は文節バタン用フィ
ルタ、204は呼気段落バタン用フィルタ、205は加
算器、206はデータ分布値メモリ、207は乱数発生
回路、208は乗算器、209は加算器である。
時定数−ステップパラメータ値生成回路202は、前述
の第二の従来例と同様に、入力の音声情報に基づいて、
文節バタン用フィルタ203と呼気段落パタン用フィル
タ 204の時定数やステップパラメータ即ちステップ
入力の振幅や継続時間などの値を決定し、信号線214
へと送り出す。
文節バタン用フィルタ203は、信号線221を介して
与えられる係数値を用いて信号線220から入力される
ステップ信号をフィルタリングして文節のピッチパタン
を生成し信号線223へと送り出す。
呼気段落バタン用フィルタ204は、信号線218を介
しで与えられる係数値を用いて信号線219がら入力さ
れるステップ信号をフィルタリングして呼気段落のピッ
チパタンを生成し信号線222へと送り出す。
加算器205では、文節バタン用フィルタ203がら送
られる文節のピッチパタンと、呼気段落バタン用フィル
タ204から送られる呼気段落のピッチパタンとか加え
合わされて文章のピッチパタンが生成される。
これら、時定数−ステップパラメータ値生成回路202
、文節バタン用フィルタ203、呼気段落バタン用フィ
ルタ204、加算器205は、第二の従来例と同様に動
作するものである。
データ分布値メモリ 206には、二つのフィルタ20
3と 204のための時定数と、ステップパラメータの
分布の最大値が記憶されており、信号線217を介して
制御回路201から送られる指示に従って各パラメータ
の分布の最大値が信号線225へと送られる。
乱数発生回路207では、制御回路201から信号線2
16を介して送られる指示に従って、絶対値が1以下の
正負の乱数が発生され信号線224へと送り出される。
乗算器208では、データ分布値メモリ 206から送
られるデータの分布の最大値に、乱数発生回路207か
ら送られる乱数か乗じられ、その積が信号線226を介
して加算器209へと送られる。
加算器209では、時定数−ステップパラメータ値生成
回I?8202で生成された時定数やステップパラメー
タの値と乗算器208がら送られる各パラメータの分布
値と乱数の積が加え合わされて新たな時定数やステップ
パラメータ値として信号線215を介して制御回路20
1に送られる。
制御回路201は、信号線211から入力される音声情
報を信号線213を介して時定数−ステップパラメータ
値生成回路202に送り、時定数とステップパラメータ
の値を決定させる。また、データ分布値メモリ206と
乱数発生口B207に指示を送り、加算器209から送
られる新たな時定数とステップパラメータ値に基づいて
、二つのフィルタ 203と204のためのフィルタの
係数と入力ステップ信号を生成し、二つのフィルタに送
る。
このようにして、文章のピッチパタンが生成され信号線
212から出力される。
(発明の効果) 以上説明したように、本発明によれば、合成しようとす
る音声情報に同一の表現が繰り返し現れても、各種の音
声合成パラメータの値がその都度微妙に異なった値がと
られるため、明瞭性が損なわれることなく自然な合成音
が得られるという効果がある。
【図面の簡単な説明】
第1図および第2図は本発明の第一および第二の実施例
をそれぞれ示すブロック図である。 図において、101は制御回路、102はピッチパラメ
ータ値生成回路、103はデータ補間回路、104はデ
ータ分布値メモリ、105は乱数発生回路、106は乗
算器、107は加算器、201は制御回路、202は時
定数−ステップパラメータ値生成回路、203は文節バ
タン用フィルタ、204は呼気段落バタン用フィルタ、
205は加算器、206はデータ分布値メモリ、207
は乱数発生回路、208は乗算器、209は加算器であ
る。

Claims (1)

    【特許請求の範囲】
  1. 入力された音声情報に基づいてピッチパタンを生成する
    ためのパラメータの値を決定する手段と、そのパラメー
    タの値からピッチパタンを生成する手段とを有するピッ
    チパタン生成装置において、ランダムデータを発生する
    手段と、そのランダムデータの値に応じて前記のパラメ
    ータの値を変化させる手段とを更に有することを特徴と
    するピッチパタン生成装置。
JP61257490A 1986-10-29 1986-10-29 ピッチパタン生成装置 Expired - Fee Related JP2573587B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61257490A JP2573587B2 (ja) 1986-10-29 1986-10-29 ピッチパタン生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61257490A JP2573587B2 (ja) 1986-10-29 1986-10-29 ピッチパタン生成装置

Publications (2)

Publication Number Publication Date
JPS63110499A true JPS63110499A (ja) 1988-05-14
JP2573587B2 JP2573587B2 (ja) 1997-01-22

Family

ID=17307014

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61257490A Expired - Fee Related JP2573587B2 (ja) 1986-10-29 1986-10-29 ピッチパタン生成装置

Country Status (1)

Country Link
JP (1) JP2573587B2 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5660499A (en) * 1979-10-22 1981-05-25 Casio Computer Co Ltd Audible sounddsource circuit for voice synthesizer

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5660499A (en) * 1979-10-22 1981-05-25 Casio Computer Co Ltd Audible sounddsource circuit for voice synthesizer

Also Published As

Publication number Publication date
JP2573587B2 (ja) 1997-01-22

Similar Documents

Publication Publication Date Title
JPH0833744B2 (ja) 音声合成装置
KR970037209A (ko) 음성 출력 장치(speech synthsizer)
JPH031200A (ja) 規則型音声合成装置
JPS62231998A (ja) 音声合成方法および装置
Levinson et al. Speech synthesis in telecommunications
AU769036B2 (en) Device and method for digital voice processing
JP2001242882A (ja) 音声合成方法及び音声合成装置
JP2573587B2 (ja) ピッチパタン生成装置
JPH0580791A (ja) 音声規則合成装置および方法
JP3394281B2 (ja) 音声合成方式および規則合成装置
JP2573586B2 (ja) 規則型音声合成装置
Dessai et al. Development of Konkani TTS system using concatenative synthesis
JP2577372B2 (ja) 音声合成装置および方法
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JP3862300B2 (ja) 音声合成に用いる情報の処理方法および装置
Muralishankar et al. Human touch to Tamil speech synthesizer
JP2001100777A (ja) 音声合成方法及び装置
Khudoyberdiev The Algorithms of Tajik Speech Synthesis by Syllable
JPH06214585A (ja) 音声合成装置
JP2001166787A (ja) 音声合成装置および自然言語処理方法
JPS63110500A (ja) 音声時間長デ−タ生成装置
JPH08160990A (ja) 音声合成装置
JPH05333892A (ja) ピッチパタン生成装置
JPS63212995A (ja) 音声合成装置
JPH04362998A (ja) ピッチパターン分析装置及び合成装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees