JPS6225800A - 音声分析合成方式 - Google Patents

音声分析合成方式

Info

Publication number
JPS6225800A
JPS6225800A JP60164133A JP16413385A JPS6225800A JP S6225800 A JPS6225800 A JP S6225800A JP 60164133 A JP60164133 A JP 60164133A JP 16413385 A JP16413385 A JP 16413385A JP S6225800 A JPS6225800 A JP S6225800A
Authority
JP
Japan
Prior art keywords
spectral envelope
parameter
parameters
lsp
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60164133A
Other languages
English (en)
Inventor
武田 昌一
市川 熹
浅川 吉章
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60164133A priority Critical patent/JPS6225800A/ja
Publication of JPS6225800A publication Critical patent/JPS6225800A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、音声分析合成方式に係わり、特に規則合成に
おける女声の音質改善に関する。
〔発明の背景〕
任、σの文章或いは単語のテキストより、これに対応す
る音声を合成する手法は「規則による音声合成」或いは
111.に「規則合成」と呼ばれている。
規則合成の音声では、一般に、音韻のつながりや、持続
時間、或いはピッチ変化などの特徴を外部から規則によ
り与えているため、自然の音声のものとは異なっている
、したがって、規則合成によるr′f声は、これらの自
然の音声の特徴をそのまま保存し、でいるいわゆる「分
析合成」による音声の音rαよIj、心い。特に女声の
場合、上記の要因以外に、人声特(fの音質劣化が起こ
る。この音質劣化は、人件の声が高いことに起因してい
る。すなわち、女声のピッチ周波数(声の高さを規定す
る周波数)はほぼ150〜I =10 Cト17〕に分
布しており、この周波数帯には/1/、/ u /、鼻
音等の第1ホルマント周波数が含まれる。そのため、こ
れらの音韻では、ピンチ周波数と第1ホルマント周波数
の分離が困難であり、線形予測分析(L P G分析)
を行っても第1ホルマントを反映するスペクトル包絡成
分とピッチを反映する音源成分とに完全には分にできな
い。
一般に、分析の次数(スペクトル包絡パラメータの個数
)を通常値われる8〜12次に設定すると、上記の音韻
ではピンチ周波数近傍に鋭いスペクトルのピークを持つ
ようにスペクトル包絡パラメータの値が設定されてしま
う。そのため、従来のPARCOR或いはL S I’
1分析合成方式のように極端にモデル化した音源を用い
ると、(参j!(:箱811.広川:”LSP−CV合
成方式レしt9ける駆動音源の検討パ、日木斤普学会講
演論文果1−6−20.昭和57年1o JJ)スペク
トル化τ・名パラメータに狙われた音源特性(こモデル
音源の特性が重畳して、合成音声波形の異常な振幅の膨
張や、ピッチ周波数と第1ホルマレ(〜周波数の微妙な
ずれに基づくうなりにより、著しい音質劣化が起こる。
分析合成の9合は、このt″f質劣化は、″′残差圧縮
法″と呼ばれる方式の採用により防ぐことが可能である
。すなわち、音声分析の段階で抽出した残差波形の情報
を合成器の音源として用いているため、スペクトル包絡
パラメータと音源パラメータの情報の相補効果により、
−上記のような1f源の重畳やうなりは発生しない。し
かし7ながら、規則合成の場合は、ピンチ周波数は分析
とは無関係に外部から′jえるため、上記の相補効果は
一般には期待できない。したがって、広範囲にピッチ周
波数を変化させて音声を合成する規則合成では、やはり
上記の音質劣化が発生する。
〔発明の目的〕
本発明の目的は、1〕記のような女声のピッチ周波数帯
に第1ホルマントが存在するために発生する音質劣化の
影Wを受は雅い音声分析合成方式を提供すること、特に
規則合成への適用に対して効果的な方法を提供すること
にある。
〔発明の概要〕
第1図は、女声の/1/の波形の一部のスペクトル、ス
ペクトル包絡およびLSPパラメータを表示したもので
ある。この図は、ピッチ周波数と第1ホルマン1−周波
数がほとんど一致した場合の例であり、この場合、スペ
クトル包絡曲線は、この周波数近傍で鋭いピークを持っ
ている。また、これに対応して、第1 f、、 S P
パラメータω1と第2 L S I)パラメータの2が
異常に接近していることがわかる。
他方LSPパラメータは、以下の特性を有していること
が知ら九でいる。
(1)  隣合うL S Pパラメータがお互いに接近
すると、その近傍でスペクトル包絡に山ができ、近づけ
ば近づく程、山のピークは鋭くなる。
逆に、遠ざかると、谷ができる。
(2)  音声波形のサンプリング周波数をf 、、f
A形予測の次数をP、第1次の!、、、 S I)パラ
メータの値をωi (i=1,2,3.    、p)
としたとき、 δω□=ωよ−ωi □” f rr/ (P + 1
)      (1)f 、=f s/2 (f n:
ナイキスト周波数)ω。二〇 が成立する場合は、そのスペクトル包絡は完全に平坦と
なる。
以1−より、ピッチ周波数の影響による第1ホルマント
の過剰推定は、上記LSPパラメータの性質を利用して
、極端に接近している隣合うLSPパラメータを引き離
すことにより、防止できることがわかる。但し、引き離
す際に、値を変えたLSPパラメータが反対個のLSP
パラメータ(例えば、ω2の場合はω1に対してω、)
に接近すると、今度はそこに偽の山(ホルマント)が発
生したり、或いは、ω1の場合にはOに近づくと直流成
分が発生する。したがって、LSPパラメータの引き離
しは、問題となっている第1ホルマントを除いて高々ス
ペクトル包絡の形状に大きな影響をダえない程度に留め
る必要がある。
なおこの処理は、ピッチ周波数帯にのみ適用されるべき
であって、それより高い周波数帯のホルマントに影響を
ケ、えることは望ましくない。そこで、上記のLSPパ
ラメータの引き離しの処理は、ピッチ周波数帯の上限値
をしきい値に設定し、LSPパラメータ値がこのしきい
値以下の場合に限って実行するようにする。
以上の条件を考慮した第1ホルマント過剰推定防止アル
ゴリズムは、例えば次のように構成できる。
いま δω□=δωi/δωm e a n        
    (2)δωmean=f n/ (p+1) 
          (3)としたとき、 δω、〈δω、h(しきい値)(4) かつ ω、≦fth                   
   (5)ならば ω□′=(ωよ、+Q0、)/2 l=2,3.・・・
、p   (6)なるω、′にω、を置き換える。ただ
し、f thは、ピッチ周波数の上限をケえるしきい値
であり、例えばf th= 500 [Hz ] ナト
ニ選(iレル。
勿論、上記のアルゴリズムは一例であり、変形アルゴリ
ズムはこれ以外にも数多く存在する。しかし、要はピッ
チ周波数と第1ホルマント周波数の干渉に起因して生ず
る線形予測のスペクトル過剰推定を、近接するLSPパ
ラメータの値を引き離すように変換することにより防止
することが基本であり、これを実現する任意のアルゴリ
ズムを採用することができる。本発明は、このような任
意のアルゴリズム群を総称したものである。この本発明
の総称的概念を「バンド幅拡張法」(B andwid
th B roadening M ethod略して
BBM)と呼ぶことにする。
ここでもし、直流成分が重畳する恐れがある場合(例え
ば音源に残差情報を用いる場合、残差の一部に手を加え
ると直流成分が発生し、合成波形が直流成分を含むこと
がある。)、合成の過程で、音源波形か出力の音声波形
をバイパス・フィルタに通せばよい。
なお本発明は、勿論従来のPARCORやLSP合成方
式に適用しても有効であるが、残差圧縮法に適用すれば
、スペクトル包絡情報と音源(残差)情報の相補性によ
り、更に有効な働きをする。
〔発明の実施例〕
以下、本発明の実施例を第2図により説明する。
第2図の(a)は、上で述べた原理を応用したし音声分
析部の一例を示している。以下の説明は。
1フレ一ム分の処理について行うが、全体の音声データ
については、ここで述べる処理を逐次的に繰り返すこと
により、適用することができる。まず、音声波形XJが
線形予測分析器(LPG分析器)1に入力され、その出
力として線形予測パラメータ (LPGパラメータ)α
□ (i=1.2゜・・・・・・y p)が求められる
。次いで、LPGパラメータはLPC−LSP変換手段
2により、LSPパラメータωlに変換される0次に、
前述したバンド幅拡張法をBBM手段3により適用し、
過剰推定の第1ホルマントを修正したLSPパラメータ
ω、′を得る。更に、この修正されたLSPパラメータ
ω□′ をLS P−PARCOR変換手段4によりP
ARCOR係数に□′に変換し、これらの値を合成器8
の逆特性を持つ逆フィルタ5に設定する。しかる後に、
原音声波形Xjをこの逆フィルタ5に通過させ、その出
力として残差波形U、を得る。そして次に、残差波形u
Jがら代表残差抽出手段6により、lピンチ分の残差波
形(代表残差)uJ″が抽出される。以上の音声分析部
により、スペクトル包絡パラメータ(P A RCOR
係数に□′、あるいはLSPパラメータω、′)および
音源パラメータ(代表残差)uj″が抽出され、一旦記
憶手段に格納された後に合成部に送られるが、あるいは
直接合成部に送られる。
次に、音声合成部について説明する。第2図の(b)は
、音声合成部の一例を示している。音声分析部により求
められた、スペクトル包絡パラメータの値は、音声合成
器8に設定される。但し、音声合成器8がPARCOR
合成器であるかLSP合成器であるかによって、それに
対応してスペクトル包絡パラメータにはPARCOR係
数に1′あるいはLSPパラメータω□′が用いられる
。他方、代表残差uJ′は音源生成部7により、他から
与えられたピッチ周波数fo′に相当するピッチ周期ご
との繰り返し波形に変換される。
但し、無声音の場合は1フレ一ム分の残差がそのまま出
力される。この音源生成部7がらの出力として音源波形
U。′が得られる。I&後に、音源波形uJ′が予めス
ペクトル包絡パラメータ値が設定されている合成器8に
入力され、その出力として合成音声波形xJ′が得られ
る。
以上の処理は、本発明の中心であるBBM手段3を除い
ては、すべて公知であり、実現可能である。
〔発明の効果〕
本発明の効果を実音声を用いて定量的に評価した結果を
示す、評価尺度として、下記の(7)式で定義されるパ
ワー歪み率を用いている。パワー歪み率は、本来のピッ
チ周波数を用いて合成した音声に対する、ピッチ周波数
を変化させて合成した音声のパワーの歪みを原音声の平
均パワーで正規化して表している。すなわち、パワー歪
み率は、ピッチと第1ホルマントの干渉に起因する合成
音声波形の異常な振幅の膨張や、ピッチ周波数と第1ホ
ルマント周波数のずれに起因する合成音声波形の振幅の
収縮を反映している。なお、ピッチ周波数を変化させる
ときは、合成器の入力となる音源パワーが一定となるよ
うに振幅補正を施している。
いまパワー歪み率をDで表せば、Dは :有音部の総フレーム数 P□     :原音声有音部第1フレームの1フレー
ム内の平均パワー :ピッチ周波数変換係数 foよ    :分析・抽出した第1フレームのピッチ
周波数 Pi’(foi):fotなるピッチ周波数で音源駆動
した合成音声の1フレ ーム内の平均パワー 第3図の(a)は女声/ a /にBBMを適用し−た
場合と適用しない場合を比較して示したものである0女
声/ a /のように、第1ホルマント周波数がピッチ
周波数帯よりも高い場合には、BBMは動作していない
。しかしながら、同図(b)に示す女声/i/の場合に
は、第1ホルマント周波数がピッチ周波数帯に入ってい
るため、BBMが動作して、振幅の歪を抑制しているこ
とがわかる。
第4図は、女性の発話した゛振込連絡を致します′″と
いう文章音声について、BBMの効果を評価した結果で
ある。図より、明らかにBBMによる、振幅の歪を抑制
する効果が認められる。さらに第5図は、BBMの効果
を女声の合成音声波形/5uzuki/で示した例であ
る。同図(a)はBBMを施さない場合の波形であり、
全体的に波形の振幅の乱れが見られる。それに対して、
同図(b)はBBMを施した場合の波形であり、振幅の
乱れは殆ど見られない。
以上示したように、本発明によれば、ピンチと第1ホル
マントの干渉に起因する音質劣化を有効に防ぐことが可
能であり、女声の合成音声の音質改善に顕著な効果があ
る。特に、規則合成のように外部からピッチ周波数を与
える場合の音質改善効果は著しい。
なお、本発明は、LSPパラメータという、音声分析合
成のパラメータを直接扱っているため、特殊な変換のた
めに処理が複雑になるという欠点第1図は従来方式の問
題点を示し、新しい方式を導くための説明図(女声/i
/の音声波形のスペクトル、スペクトル包絡、およびL
SPパラメータ)、第2図は本発明の一実施例を示す図
、第3図〜第5図は本発明の詳細な説明する図である。
3 : BBM手段(バンド幅拡張法によるLSP周波
数計算部) 代理人 弁理士 小 川 」 男 菊2図 l6

Claims (1)

  1. 【特許請求の範囲】 1、音声波形をスペクトル包絡のパラメータと音源のパ
    ラメータとに分解する音声分析方式において、スペクト
    ル包絡のパラメータとして線スペクトル対LSPを求め
    、一定の周波数以下で隣合うLSPパラメータの値の差
    が予め定めたしきい値以下の場合に、該値の差を所定の
    値にまで大きくして、この変更したLSPパラメータの
    値を改めてスペクトル包絡のパラメータとして用いるこ
    とを特徴とする音声分析合成方式。 2、音声波形を、スペクトル包絡のパラメータと音源の
    パラメータとに分解する音声分析方式におけるスペクト
    ル包絡のパラメータとしてLSPパラメータ以外のパラ
    メータ(例えば PARCOR係数、線形予測係数等)を用いる音声分析
    方式において、該スペクトル包絡に対応するLSPパラ
    メータを求め、該LSPパラメータに特許請求の範囲第
    1項の変更を施したLSPパラメータを該スペクトル包
    絡パラメータに変換して用いることを特徴とする音声分
    析合成方式。 3、特許請求の範囲第1項記載の方式において、求めた
    スペクトル包絡パラメータの値を合成器の逆フィルタに
    与え、該逆フィルタに音声波形を通過させることにより
    得られる残差波形を求めることを特徴とする音声分析合
    成方式。 4、特許請求の範囲第1項記載の方式において、求めた
    スペクトル包絡パラメータ、或いは該スペクトル包絡パ
    ラメータおよび特許請求の範囲第3項の音声分析方式に
    より求めた残差波形を基に生成した音源波形を用いるこ
    とを特徴とする音声分析合成方式。
JP60164133A 1985-07-26 1985-07-26 音声分析合成方式 Pending JPS6225800A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60164133A JPS6225800A (ja) 1985-07-26 1985-07-26 音声分析合成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60164133A JPS6225800A (ja) 1985-07-26 1985-07-26 音声分析合成方式

Publications (1)

Publication Number Publication Date
JPS6225800A true JPS6225800A (ja) 1987-02-03

Family

ID=15787369

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60164133A Pending JPS6225800A (ja) 1985-07-26 1985-07-26 音声分析合成方式

Country Status (1)

Country Link
JP (1) JPS6225800A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH045700A (ja) * 1990-04-23 1992-01-09 Mitsubishi Electric Corp 音声復号化装置及び音声符号化・復号化装置
JP2007243709A (ja) * 2006-03-09 2007-09-20 Fujitsu Ltd 利得調整方法及び利得調整装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH045700A (ja) * 1990-04-23 1992-01-09 Mitsubishi Electric Corp 音声復号化装置及び音声符号化・復号化装置
JP2007243709A (ja) * 2006-03-09 2007-09-20 Fujitsu Ltd 利得調整方法及び利得調整装置

Similar Documents

Publication Publication Date Title
US6741960B2 (en) Harmonic-noise speech coding algorithm and coder using cepstrum analysis method
JP4624552B2 (ja) 狭帯域言語信号からの広帯域言語合成
Okamoto et al. An investigation of subband WaveNet vocoder covering entire audible frequency range with limited acoustic features
US9390728B2 (en) Voice analysis apparatus, voice synthesis apparatus, voice analysis synthesis system
He et al. Automatic detection of glottal stop in cleft palate speech
Roberts et al. Time-scale modification using fuzzy epoch-synchronous overlap-add (FESOLA)
JPS6225800A (ja) 音声分析合成方式
US10354671B1 (en) System and method for the analysis and synthesis of periodic and non-periodic components of speech signals
JPH1097274A (ja) 話者認識方法及び装置
CN106935243A (zh) 一种基于melp的低比特数字语音矢量量化方法和***
JP3398968B2 (ja) 音声分析合成方法
JP3921416B2 (ja) 音声合成装置及び音声明瞭化方法
JP2002372982A (ja) 音響信号分析方法及び装置
JPH0756599A (ja) 広帯域音声信号復元方法
JPH0876799A (ja) 広帯域音声信号復元方法
Mezzalama et al. Experiments in automatic classification of laryngeal pathology
JPH02294699A (ja) 音声分析合成方式
Van Rossum et al. A perceptual evaluation of V/U detectors
JPH02284200A (ja) 音声分析合成方式
Ishaq et al. Vowel enhancement in early stage spanish esophageal speech using natural glottal flow pulse and vocal tract frequency warping
Singh et al. Separation of PCG signal from Mixture of Speech and PCG Signals with Genetic Algorithm-Based Filter Banks
JPS58111994A (ja) 音声パラメ−タの修正方式
JPS62278598A (ja) 帯域分割型ボコ−ダ
JPS63131200A (ja) 音声分析および合成方式
KR940008839B1 (ko) 켑스트럼 분석에 의한 음성 파형코딩의 피치 변경 방법