JPS5880699A

JPS5880699A - 音声合成方式

Info

Publication number: JPS5880699A
Application number: JP56179915A
Authority: JP
Inventors: 佐藤大和
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 1981-11-09
Filing date: 1981-11-09
Publication date: 1983-05-14
Also published as: JPS5914752B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】こＯ蓋＠は・任意０＠０−合成、あるいは・テンホヤ声
の高さｔ可変にできる音声合成方式に関し、特に品質の
良い合成音を得るための駆動音源信号の生成方法に係わ
る。

任意の１ｔＩｔ作り出す音声合成法においては、単語よ
り小さな音声単位、例えば音素、音節、ｖＣＶ（母音−
子音−母音）などを合成の基本単位とし、これらを一定
の規則に基づいて結合して単語中文の合成を行う。一方
、声の高さのパタンは・これらの合成単位の結合とは独
立に、アクセントやイントネーシ曹ン情報から、単１６
るいは文全体のパターンとして決められる。声の高さは
、音声合成フィルタの駆動音源の周期（ピッチという）
で決ｔｐ、を声合成においては、規則によって定められ
たピッチ周期の時系列から駆動音源信号を生成する必要
がるる・従来、有声音の駆動音源信号としては、インパルスの系
列が用いられてきたが、これは人間が発声する際の声帯
の音源信号とは異った４ので５１９−最終的に得られる
合成音声の波形も現実の音声のものと差異があって、品
質の良い音声が得られないという欠点があった。駆動音
源信号として、インパルス系列のかわりに、声帯振動に
伴なう空気流の振動波形を近似的に模擬した三角波が用
いられること％あるが・その事情はインパルスｔａの場
合と全く同じである＠この発明は、任意曙の合成を可能とする音声合成方式、
特にその駆動音ｍ信号の生成に関するものである。

仁の発明は音声の線形予測分析によって得られる残差信
号から１周期分の音源要素を抽出し、この音源要素を利
用して駆動音源信号を生成することにより従来より高品
質の合成音を得ゐことができるようにすることにある・以下、第１図を用いてこの発明の実施例ｔ＠明する＠仁
の音声合成装置の主制御ｓ１は合成すべき音声を構成す
る合成単位名の系列、これら単位の持続時間、母音部の
ピッチ周波数を入カパソフア２に書込む。音声合成単位
結合処理部！Ｓは、入カパソフア２から合成単位名の系
列を読取り−ｌこの情報に基づいて音声合成単位読出制
御１１４を介して音声合成単位バラメータメモリ３から
合成単位名のスペクトルパラメータを読み出して単＃ｌ
！あるいは文音声としての結合を図９、合成パラメータ
・バッファメモリ６に出方する◇音声合、成単位パラメ
ータメモリ３には、音素、音節、ＶＣＶなどの各合成単
位名が、ＰＡＲＣＯＲ，ＩＪＰ、声道断面積係数、ホル
マント等のパラメータの形式で表現されて蓄積されてい
る。どの合成単位、バラメータ形式を採用するかは要求
される音声品質、音声情報量、音声生成処理量とも関連
してお夕１ｇ！求される装置に応じて適切な選択がなさ
れる。

ｆｓＷ素メそり７には、各音声合成単位名を線形予測分
析して得られる残差信号から抽出された音源要素が蓄積
されておタ、駆動音源信号生成処理部９は、入力バッフ
ァメモリ２からの合成単位名系列を絖３１１１９．この
情報にもとすと、音源要素続出制御部８を介して音源要
素ｔ−読み出し、入カパソファ２かも得たピッチに基づ
いて連続音声の駆動音源信号を生成するとと４１＃こ、
その生成駆動音源信号を駆動音源信号バッファメモ！７
１０１こ転送する・こＯ実施例では、音声合成単位結合
処理ｓ５と駆動音源信号処理部９とが分離した構成にな
っているが、処理能力の高いプルセッサを用い・るなど
により、同一処理部で上記二つの処理を行なわせること
も可能である。前記線形予測分析の残差信号から音源要
素の抽出は合成単位ごとに単独に発声したもＯの線形予
測分析の残差信号又は連続して発声してた４０線形予測
分析の残差信号から切出して各合成単位ごとに切出し得
る。

合成パラメータバッツアメモリ６および駆動管源信号バ
ッフアメモり１０は、それぞれ一定周期で面切替え一方
で書込み、他方で読出すダブルバッファ構成となってお
り・これら続出されたデータは音声合成ディジタルフィ
ルタ１．１に供給される。音声合成ディジタルフィルタ
１１では、ｆ声合成のモデルに基づいて合成が行なわれ
、その合成出力はディジタル・アナログ変換器１２およ
び低域−波器１３によって出力端子１１こ連続したアナ
ａダ音声波形として出力される。

第２図は、駆動音源信号生成法を示す４のである・音声
合成単位は、発声された音声データを線形予測分析する
ことにより、スペクトルパラメータが抽出されて作られ
るが、その際残差信号も同時に求められる。有声音の場
合、残差信号は周期的構造をもち、−足音一区間に対し
て代表的１周期波形が切り出されて音源要素とされる。

第２図中の１５がこの−ｔＳ要素に和尚する。音源要素
の切り出しは、母音区間全体で１音源要素で代表するこ
とも可能であるが、母音の入渡り部、定常部川波り部等
の各区−分銀に音源要素をわｐ当てるなど、高い品質を
得るために、更に細かい区分を行ってもよい０子音部に
対しては、有声音の場合は母ｔｏ場合と同様に１周期波
形が抽出されるが、無声子音のように周期的性質を有し
ない波形に対しては、当該子音区分全体の残差波形が音
源要素として切出される。無声子音に関しては、残差信
号を蓄積せず、従来の音声合成のように白雑音駆動にて
音声を合成し、母音部等聴覚的に型費な有声音部分のみ
残差波形を用いるようにしてもよい。

上記のように抽出された音源要素は、音源要素メモリ７
にあらかじめ蓄積される◎音声合成にあたっては、有声
音の場合ピッチ周期に基づいて駆動音源信号が生成石れ
る。長さＴｏをもつ音源要素ＩＳに対し、’ｆ１＞　Ｔ
Ｏｌｋ　＆ピッチー期　の音源信号を生成する際は、最
も簡単には第２図に示すように７０以上の区間をθづめ
にした駆動音源波形１６を生成すれば良いＯｌたＴｓ　
＜　７６なるピッチ周期Ｔ露の場合は、音源要素１５を
適中で打切った波形の系列１７を生成する仁とにより、
駆動音＃信号が得られる。ｔた。無声子音Ｏ場合番１音
源費素メ峰り７に蓄えられた波形ｔそＯ普壕駆動音＃［
（１１号として用いる。

第３図は、各種波形管示し、波形１８は、１かざぐる壕
が・・・・・・・−・−”と発声した実音声の〔ざ〕の
部分のｉ形、波形１９は・この実施例に基づいて合成さ
れた同一音声の同一部分の波形、波形２０Ｇズ、ｃの発
明により生成されｔ躯動曾Ｓ信号、波形２１は、従来方
式でめるインパルス系列を駆動音源信号とした場合の合
成音の波形である。ａｌｓ１９と波形２１とを実音声液
形１８と比較すれば明らかなように、この発明によって
実音声に極めて近い波形を実現できることがわかる。

以上説明したように、この発明によれば任意語の合成に
おいて、音声合成単位の残差信号・から抽出した音源要
素を用いて駆動音源信号を生成することｌこより、実音
声に近い合成音波形が得られるため１発声者の声質を保
存した自然性の高い合成音が実現できる。また、こ、の
発明を音声の規則合成ばかりでなく、音声分析合成方式
を用いた残差駆動形の音声合成に適用すれば、声の高さ
やテンポ・リズム等を自由に制御でき、適用範囲の広い
音声合成が声現できる０

【図面の簡単な説明】

第１図は、この発明の実施例を示すブ四ツタ図、第２図
は、駆動音Ｓ信号の実現法を示す波形図、第３図は・、
実音声波形と合成音波形の比較を示す波形図でめる・１：主制御部、２：入カバツツア、３：音声合成単位パ
ラメータメモリ、４：音声合成単位読出し制御部、５：
を声合成単位結合処理部、６：合成パツメー！バッツァ
メモリ、７：音源要素メモリ、８：音源要素読出し制御
部、９：駆動音源信号生成処理部、１０：駆動晋源偏号
バソフアメ篭り、ｌｌ：ｆ声舎成デイジメルフィルタ、
１８：ディジタル・アナ四グ変換−１１３：低域−波器
、１４：出力熾子、　ｌｓ：音源要素波形、ｔ６．１？
：有声音の駆動音源波形、１８：実音声波形、１１１：
本発明によゐ合成音波形、２０：本発明による駆動ｆ源
波形。２１：従来方式の合成音波形。特許出願人　日本電信電話公社代理人草舒　卓

Claims

【特許請求の範囲】

（１）　　４）合成単位のスペクＦルバツメーメを配憶
する音声合成単位パツメータメ峰りと、少くとも有声音
について各合成単位の、曽形予橢分析残差信号から抽出
した１周期分の膏源發素を配憶する音源要素メ篭りとを
設け、合成すべｌＩｆ声の合成単位名系列とピッチとを
入力して、その入力された各合成単位名によりそれぞれ
上記音声合成本位パラメータメ篭す及び膏ｇ＊素メ峰り
ｔ読出し、その続出された音源要素を上記ビ′ツチで結
合して音源駆動信号を作り、七〇膏源１１１１ｆ号を音
声合成フィルタへ供給し、その音声合成フィルＩＯ係数
を１妃読出され＊＼ベクトルパラメータにより制御し、
その音声合成フィルタから合成音声を得る音声合成方式
。