JPS5880699A - 音声合成方式 - Google Patents
音声合成方式Info
- Publication number
- JPS5880699A JPS5880699A JP56179915A JP17991581A JPS5880699A JP S5880699 A JPS5880699 A JP S5880699A JP 56179915 A JP56179915 A JP 56179915A JP 17991581 A JP17991581 A JP 17991581A JP S5880699 A JPS5880699 A JP S5880699A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- speech
- synthesis unit
- synthesis
- waveform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
こO蓋@は・任意0@0−合成、あるいは・テンホヤ声
の高さt可変にできる音声合成方式に関し、特に品質の
良い合成音を得るための駆動音源信号の生成方法に係わ
る。
の高さt可変にできる音声合成方式に関し、特に品質の
良い合成音を得るための駆動音源信号の生成方法に係わ
る。
任意の1tIt作り出す音声合成法においては、単語よ
り小さな音声単位、例えば音素、音節、vCV(母音−
子音−母音)などを合成の基本単位とし、これらを一定
の規則に基づいて結合して単語中文の合成を行う。一方
、声の高さのパタンは・これらの合成単位の結合とは独
立に、アクセントやイントネーシ曹ン情報から、単16
るいは文全体のパターンとして決められる。声の高さは
、音声合成フィルタの駆動音源の周期(ピッチという)
で決tp、を声合成においては、規則によって定められ
たピッチ周期の時系列から駆動音源信号を生成する必要
がるる・ 従来、有声音の駆動音源信号としては、インパルスの系
列が用いられてきたが、これは人間が発声する際の声帯
の音源信号とは異った4ので519−最終的に得られる
合成音声の波形も現実の音声のものと差異があって、品
質の良い音声が得られないという欠点があった。駆動音
源信号として、インパルス系列のかわりに、声帯振動に
伴なう空気流の振動波形を近似的に模擬した三角波が用
いられること%あるが・その事情はインパルスtaの場
合と全く同じである@ この発明は、任意曙の合成を可能とする音声合成方式、
特にその駆動音m信号の生成に関するものである。
り小さな音声単位、例えば音素、音節、vCV(母音−
子音−母音)などを合成の基本単位とし、これらを一定
の規則に基づいて結合して単語中文の合成を行う。一方
、声の高さのパタンは・これらの合成単位の結合とは独
立に、アクセントやイントネーシ曹ン情報から、単16
るいは文全体のパターンとして決められる。声の高さは
、音声合成フィルタの駆動音源の周期(ピッチという)
で決tp、を声合成においては、規則によって定められ
たピッチ周期の時系列から駆動音源信号を生成する必要
がるる・ 従来、有声音の駆動音源信号としては、インパルスの系
列が用いられてきたが、これは人間が発声する際の声帯
の音源信号とは異った4ので519−最終的に得られる
合成音声の波形も現実の音声のものと差異があって、品
質の良い音声が得られないという欠点があった。駆動音
源信号として、インパルス系列のかわりに、声帯振動に
伴なう空気流の振動波形を近似的に模擬した三角波が用
いられること%あるが・その事情はインパルスtaの場
合と全く同じである@ この発明は、任意曙の合成を可能とする音声合成方式、
特にその駆動音m信号の生成に関するものである。
仁の発明は音声の線形予測分析によって得られる残差信
号から1周期分の音源要素を抽出し、この音源要素を利
用して駆動音源信号を生成することにより従来より高品
質の合成音を得ゐことができるようにすることにある・ 以下、第1図を用いてこの発明の実施例t@明する@仁
の音声合成装置の主制御s1は合成すべき音声を構成す
る合成単位名の系列、これら単位の持続時間、母音部の
ピッチ周波数を入カパソフア2に書込む。音声合成単位
結合処理部!Sは、入カパソフア2から合成単位名の系
列を読取り−lこの情報に基づいて音声合成単位読出制
御114を介して音声合成単位バラメータメモリ3から
合成単位名のスペクトルパラメータを読み出して単#l
!あるいは文音声としての結合を図9、合成パラメータ
・バッファメモリ6に出方する◇音声合、成単位パラメ
ータメモリ3には、音素、音節、VCVなどの各合成単
位名が、PARCOR,IJP、声道断面積係数、ホル
マント等のパラメータの形式で表現されて蓄積されてい
る。どの合成単位、バラメータ形式を採用するかは要求
される音声品質、音声情報量、音声生成処理量とも関連
してお夕1g!求される装置に応じて適切な選択がなさ
れる。
号から1周期分の音源要素を抽出し、この音源要素を利
用して駆動音源信号を生成することにより従来より高品
質の合成音を得ゐことができるようにすることにある・ 以下、第1図を用いてこの発明の実施例t@明する@仁
の音声合成装置の主制御s1は合成すべき音声を構成す
る合成単位名の系列、これら単位の持続時間、母音部の
ピッチ周波数を入カパソフア2に書込む。音声合成単位
結合処理部!Sは、入カパソフア2から合成単位名の系
列を読取り−lこの情報に基づいて音声合成単位読出制
御114を介して音声合成単位バラメータメモリ3から
合成単位名のスペクトルパラメータを読み出して単#l
!あるいは文音声としての結合を図9、合成パラメータ
・バッファメモリ6に出方する◇音声合、成単位パラメ
ータメモリ3には、音素、音節、VCVなどの各合成単
位名が、PARCOR,IJP、声道断面積係数、ホル
マント等のパラメータの形式で表現されて蓄積されてい
る。どの合成単位、バラメータ形式を採用するかは要求
される音声品質、音声情報量、音声生成処理量とも関連
してお夕1g!求される装置に応じて適切な選択がなさ
れる。
fsW素メそり7には、各音声合成単位名を線形予測分
析して得られる残差信号から抽出された音源要素が蓄積
されておタ、駆動音源信号生成処理部9は、入力バッフ
ァメモリ2からの合成単位名系列を絖31119.この
情報にもとすと、音源要素続出制御部8を介して音源要
素t−読み出し、入カパソファ2かも得たピッチに基づ
いて連続音声の駆動音源信号を生成するとと41#こ、
その生成駆動音源信号を駆動音源信号バッファメモ!7
101こ転送する・こO実施例では、音声合成単位結合
処理s5と駆動音源信号処理部9とが分離した構成にな
っているが、処理能力の高いプルセッサを用い・るなど
により、同一処理部で上記二つの処理を行なわせること
も可能である。前記線形予測分析の残差信号から音源要
素の抽出は合成単位ごとに単独に発声したもOの線形予
測分析の残差信号又は連続して発声してた40線形予測
分析の残差信号から切出して各合成単位ごとに切出し得
る。
析して得られる残差信号から抽出された音源要素が蓄積
されておタ、駆動音源信号生成処理部9は、入力バッフ
ァメモリ2からの合成単位名系列を絖31119.この
情報にもとすと、音源要素続出制御部8を介して音源要
素t−読み出し、入カパソファ2かも得たピッチに基づ
いて連続音声の駆動音源信号を生成するとと41#こ、
その生成駆動音源信号を駆動音源信号バッファメモ!7
101こ転送する・こO実施例では、音声合成単位結合
処理s5と駆動音源信号処理部9とが分離した構成にな
っているが、処理能力の高いプルセッサを用い・るなど
により、同一処理部で上記二つの処理を行なわせること
も可能である。前記線形予測分析の残差信号から音源要
素の抽出は合成単位ごとに単独に発声したもOの線形予
測分析の残差信号又は連続して発声してた40線形予測
分析の残差信号から切出して各合成単位ごとに切出し得
る。
合成パラメータバッツアメモリ6および駆動管源信号バ
ッフアメモり10は、それぞれ一定周期で面切替え一方
で書込み、他方で読出すダブルバッファ構成となってお
り・これら続出されたデータは音声合成ディジタルフィ
ルタ1.1に供給される。音声合成ディジタルフィルタ
11では、f声合成のモデルに基づいて合成が行なわれ
、その合成出力はディジタル・アナログ変換器12およ
び低域−波器13によって出力端子11こ連続したアナ
aダ音声波形として出力される。
ッフアメモり10は、それぞれ一定周期で面切替え一方
で書込み、他方で読出すダブルバッファ構成となってお
り・これら続出されたデータは音声合成ディジタルフィ
ルタ1.1に供給される。音声合成ディジタルフィルタ
11では、f声合成のモデルに基づいて合成が行なわれ
、その合成出力はディジタル・アナログ変換器12およ
び低域−波器13によって出力端子11こ連続したアナ
aダ音声波形として出力される。
第2図は、駆動音源信号生成法を示す4のである・音声
合成単位は、発声された音声データを線形予測分析する
ことにより、スペクトルパラメータが抽出されて作られ
るが、その際残差信号も同時に求められる。有声音の場
合、残差信号は周期的構造をもち、−足音一区間に対し
て代表的1周期波形が切り出されて音源要素とされる。
合成単位は、発声された音声データを線形予測分析する
ことにより、スペクトルパラメータが抽出されて作られ
るが、その際残差信号も同時に求められる。有声音の場
合、残差信号は周期的構造をもち、−足音一区間に対し
て代表的1周期波形が切り出されて音源要素とされる。
第2図中の15がこの−tS要素に和尚する。音源要素
の切り出しは、母音区間全体で1音源要素で代表するこ
とも可能であるが、母音の入渡り部、定常部川波り部等
の各区−分銀に音源要素をわp当てるなど、高い品質を
得るために、更に細かい区分を行ってもよい0子音部に
対しては、有声音の場合は母to場合と同様に1周期波
形が抽出されるが、無声子音のように周期的性質を有し
ない波形に対しては、当該子音区分全体の残差波形が音
源要素として切出される。無声子音に関しては、残差信
号を蓄積せず、従来の音声合成のように白雑音駆動にて
音声を合成し、母音部等聴覚的に型費な有声音部分のみ
残差波形を用いるようにしてもよい。
の切り出しは、母音区間全体で1音源要素で代表するこ
とも可能であるが、母音の入渡り部、定常部川波り部等
の各区−分銀に音源要素をわp当てるなど、高い品質を
得るために、更に細かい区分を行ってもよい0子音部に
対しては、有声音の場合は母to場合と同様に1周期波
形が抽出されるが、無声子音のように周期的性質を有し
ない波形に対しては、当該子音区分全体の残差波形が音
源要素として切出される。無声子音に関しては、残差信
号を蓄積せず、従来の音声合成のように白雑音駆動にて
音声を合成し、母音部等聴覚的に型費な有声音部分のみ
残差波形を用いるようにしてもよい。
上記のように抽出された音源要素は、音源要素メモリ7
にあらかじめ蓄積される◎音声合成にあたっては、有声
音の場合ピッチ周期に基づいて駆動音源信号が生成石れ
る。長さToをもつ音源要素ISに対し、’f1> T
Olk &ピッチー期 の音源信号を生成する際は、最
も簡単には第2図に示すように70以上の区間をθづめ
にした駆動音源波形16を生成すれば良いOlたTs
< 76なるピッチ周期T露の場合は、音源要素15を
適中で打切った波形の系列17を生成する仁とにより、
駆動音#信号が得られる。tた。無声子音O場合番1音
源費素メ峰り7に蓄えられた波形tそO普壕駆動音#[
(11号として用いる。
にあらかじめ蓄積される◎音声合成にあたっては、有声
音の場合ピッチ周期に基づいて駆動音源信号が生成石れ
る。長さToをもつ音源要素ISに対し、’f1> T
Olk &ピッチー期 の音源信号を生成する際は、最
も簡単には第2図に示すように70以上の区間をθづめ
にした駆動音源波形16を生成すれば良いOlたTs
< 76なるピッチ周期T露の場合は、音源要素15を
適中で打切った波形の系列17を生成する仁とにより、
駆動音#信号が得られる。tた。無声子音O場合番1音
源費素メ峰り7に蓄えられた波形tそO普壕駆動音#[
(11号として用いる。
第3図は、各種波形管示し、波形18は、1かざぐる壕
が・・・・・・・−・−”と発声した実音声の〔ざ〕の
部分のi形、波形19は・この実施例に基づいて合成さ
れた同一音声の同一部分の波形、波形20Gズ、cの発
明により生成されt躯動曾S信号、波形21は、従来方
式でめるインパルス系列を駆動音源信号とした場合の合
成音の波形である。als19と波形21とを実音声液
形18と比較すれば明らかなように、この発明によって
実音声に極めて近い波形を実現できることがわかる。
が・・・・・・・−・−”と発声した実音声の〔ざ〕の
部分のi形、波形19は・この実施例に基づいて合成さ
れた同一音声の同一部分の波形、波形20Gズ、cの発
明により生成されt躯動曾S信号、波形21は、従来方
式でめるインパルス系列を駆動音源信号とした場合の合
成音の波形である。als19と波形21とを実音声液
形18と比較すれば明らかなように、この発明によって
実音声に極めて近い波形を実現できることがわかる。
以上説明したように、この発明によれば任意語の合成に
おいて、音声合成単位の残差信号・から抽出した音源要
素を用いて駆動音源信号を生成することlこより、実音
声に近い合成音波形が得られるため1発声者の声質を保
存した自然性の高い合成音が実現できる。また、こ、の
発明を音声の規則合成ばかりでなく、音声分析合成方式
を用いた残差駆動形の音声合成に適用すれば、声の高さ
やテンポ・リズム等を自由に制御でき、適用範囲の広い
音声合成が声現できる0
おいて、音声合成単位の残差信号・から抽出した音源要
素を用いて駆動音源信号を生成することlこより、実音
声に近い合成音波形が得られるため1発声者の声質を保
存した自然性の高い合成音が実現できる。また、こ、の
発明を音声の規則合成ばかりでなく、音声分析合成方式
を用いた残差駆動形の音声合成に適用すれば、声の高さ
やテンポ・リズム等を自由に制御でき、適用範囲の広い
音声合成が声現できる0
第1図は、この発明の実施例を示すブ四ツタ図、第2図
は、駆動音S信号の実現法を示す波形図、第3図は・、
実音声波形と合成音波形の比較を示す波形図でめる・ 1:主制御部、2:入カバツツア、3:音声合成単位パ
ラメータメモリ、4:音声合成単位読出し制御部、5:
を声合成単位結合処理部、6:合成パツメー!バッツァ
メモリ、7:音源要素メモリ、8:音源要素読出し制御
部、9:駆動音源信号生成処理部、10:駆動晋源偏号
バソフアメ篭り、ll:f声舎成デイジメルフィルタ、
18:ディジタル・アナ四グ変換−113:低域−波器
、14:出力熾子、 ls:音源要素波形、t6.1?
:有声音の駆動音源波形、18:実音声波形、111:
本発明によゐ合成音波形、20:本発明による駆動f源
波形。 21:従来方式の合成音波形。 特許出願人 日本電信電話公社 代理人草舒 卓
は、駆動音S信号の実現法を示す波形図、第3図は・、
実音声波形と合成音波形の比較を示す波形図でめる・ 1:主制御部、2:入カバツツア、3:音声合成単位パ
ラメータメモリ、4:音声合成単位読出し制御部、5:
を声合成単位結合処理部、6:合成パツメー!バッツァ
メモリ、7:音源要素メモリ、8:音源要素読出し制御
部、9:駆動音源信号生成処理部、10:駆動晋源偏号
バソフアメ篭り、ll:f声舎成デイジメルフィルタ、
18:ディジタル・アナ四グ変換−113:低域−波器
、14:出力熾子、 ls:音源要素波形、t6.1?
:有声音の駆動音源波形、18:実音声波形、111:
本発明によゐ合成音波形、20:本発明による駆動f源
波形。 21:従来方式の合成音波形。 特許出願人 日本電信電話公社 代理人草舒 卓
Claims (1)
- (1) 4)合成単位のスペクFルバツメーメを配憶
する音声合成単位パツメータメ峰りと、少くとも有声音
について各合成単位の、曽形予橢分析残差信号から抽出
した1周期分の膏源發素を配憶する音源要素メ篭りとを
設け、合成すべlIf声の合成単位名系列とピッチとを
入力して、その入力された各合成単位名によりそれぞれ
上記音声合成本位パラメータメ篭す及び膏g*素メ峰り
t読出し、その続出された音源要素を上記ビ′ツチで結
合して音源駆動信号を作り、七〇膏源1111f号を音
声合成フィルタへ供給し、その音声合成フィルIO係数
を1妃読出され*\ベクトルパラメータにより制御し、
その音声合成フィルタから合成音声を得る音声合成方式
。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56179915A JPS5914752B2 (ja) | 1981-11-09 | 1981-11-09 | 音声合成方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56179915A JPS5914752B2 (ja) | 1981-11-09 | 1981-11-09 | 音声合成方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5880699A true JPS5880699A (ja) | 1983-05-14 |
JPS5914752B2 JPS5914752B2 (ja) | 1984-04-05 |
Family
ID=16074135
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP56179915A Expired JPS5914752B2 (ja) | 1981-11-09 | 1981-11-09 | 音声合成方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5914752B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6391695A (ja) * | 1986-10-03 | 1988-04-22 | 株式会社 コルグ | 楽器音再生方式 |
US6553343B1 (en) | 1995-12-04 | 2003-04-22 | Kabushiki Kaisha Toshiba | Speech synthesis method |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8940354B2 (en) | 2009-06-12 | 2015-01-27 | Mars, Incorporated | Polymer gelation of oils |
US20150257407A1 (en) | 2012-09-28 | 2015-09-17 | Mars, Incorporated | Heat resistant chocolate |
-
1981
- 1981-11-09 JP JP56179915A patent/JPS5914752B2/ja not_active Expired
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6391695A (ja) * | 1986-10-03 | 1988-04-22 | 株式会社 コルグ | 楽器音再生方式 |
US6553343B1 (en) | 1995-12-04 | 2003-04-22 | Kabushiki Kaisha Toshiba | Speech synthesis method |
US7184958B2 (en) | 1995-12-04 | 2007-02-27 | Kabushiki Kaisha Toshiba | Speech synthesis method |
Also Published As
Publication number | Publication date |
---|---|
JPS5914752B2 (ja) | 1984-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3408477B2 (ja) | フィルタパラメータとソース領域において独立にクロスフェードを行う半音節結合型のフォルマントベースのスピーチシンセサイザ | |
US5400434A (en) | Voice source for synthetic speech system | |
JP3294604B2 (ja) | 波形の加算重畳による音声合成のための処理装置 | |
JPH031200A (ja) | 規則型音声合成装置 | |
JP3732793B2 (ja) | 音声合成方法、音声合成装置及び記録媒体 | |
JP2001034280A (ja) | 電子メール受信装置および電子メールシステム | |
JP5360489B2 (ja) | 音素符号変換装置および音声合成装置 | |
JPS5880699A (ja) | 音声合成方式 | |
JP5175422B2 (ja) | 音声合成における時間幅を制御する方法 | |
JP2008058379A (ja) | 音声合成システム及びフィルタ装置 | |
JP5560769B2 (ja) | 音素符号変換装置および音声合成装置 | |
JP3081300B2 (ja) | 残差駆動型音声合成装置 | |
JP3394281B2 (ja) | 音声合成方式および規則合成装置 | |
JPH11161297A (ja) | 音声合成方法及び装置 | |
JPS58168097A (ja) | 音声合成装置 | |
JP2004206144A (ja) | 基本周波数パタン生成方法、及びプログラム記録媒体 | |
JPH0464080B2 (ja) | ||
JP2573585B2 (ja) | 音声スペクトルパタン生成装置 | |
JPH0553595A (ja) | 音声合成装置 | |
Butler et al. | Articulatory constraints on vocal tract area functions and their acoustic implications | |
May et al. | Speech synthesis using allophones | |
JPS63262699A (ja) | 音声分析,合成装置 | |
JPH0962295A (ja) | 音声素片作成方法および音声合成方法とその装置 | |
JPS60113299A (ja) | 音声合成装置 | |
JP2001166787A (ja) | 音声合成装置および自然言語処理方法 |