JP3197975B2 - ピッチ制御方法及び装置 - Google Patents

ピッチ制御方法及び装置

Info

Publication number
JP3197975B2
JP3197975B2 JP6142293A JP6142293A JP3197975B2 JP 3197975 B2 JP3197975 B2 JP 3197975B2 JP 6142293 A JP6142293 A JP 6142293A JP 6142293 A JP6142293 A JP 6142293A JP 3197975 B2 JP3197975 B2 JP 3197975B2
Authority
JP
Japan
Prior art keywords
pitch
formant
control
voice
pitch frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP6142293A
Other languages
English (en)
Other versions
JPH06250695A (ja
Inventor
貴夫 小山
雄偉 閔
憲也 村上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP6142293A priority Critical patent/JP3197975B2/ja
Publication of JPH06250695A publication Critical patent/JPH06250695A/ja
Application granted granted Critical
Publication of JP3197975B2 publication Critical patent/JP3197975B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声波形のピッチ制御
を行う方法及び装置に関し、特に、帯域通過フィルタを
用いてホルマントパワを制御し、自然音声におけるピッ
チ周波数とホルマントパワの相関関係を模擬することを
可能とするピッチ制御方法及び装置に関する。
【0002】
【従来の技術】音声合成技術における従来のピッチ制御
の一例として、「音声波形のローカルピーク抽出とピッ
チ制御への応用」(平成3年10月号、音響学会講演論
文集2−6−1)に記載された装置がある。このピッチ
制御装置のように、音声波形をそのままピッチ制御する
場合は、まず、入力音声信号からそのローカルピーク位
置を抽出し、このピーク位置を基準にピッチ単位で波形
切り出し用の窓関数を決定し、この窓関数により波形を
切り出し、目標ピッチ周期になるように、切り出した波
形を再度重ね合わせて合成音声を生成していた。
【0003】
【発明が解決しようとする課題】このような従来技術で
は、入力された音声から切り出した音声のピッチ周期を
変更して再度重ね合わせを行うため、ピッチ周期が変更
された後も従前の声道特性はほぼ保存される。そのた
め、ピッチ周波数に対応する声道特性が再現できず、ピ
ッチ制御幅が大きくなるにつれて違和感が増す問題があ
った
【0004】本発明はかかる問題点に鑑みてなされたも
ので、音声波形のピッチ周期の更新に従ってピッチ周波
数に対応する声道特性を再現し、より自然音声に近いピ
ッチ制御音声を生成するピッチ制御方法及びこの方法を
実現する装置を提供することにある。
【0005】
【課題を解決するための手段】上記目的を達成する本発
明のピッチ制御方法は、ピッチ構造を有する入力音声信
号の波形切出しと該切出し波形の重ね合わせとを行うこ
とで合成音声のピッチ周波数を目標値に制御する方法に
おいて、入力音声信号のピッチ周波数とホルマントパワ
との相関関係を多項式関数に近似させ、この多項式関数
から前記目標値に対応するホルマントパワを決定すると
ともに、波形重ね合わせ時に合成される音声のホルマン
トパワを前記決定されたホルマントパワに近づけるよう
にしたものである。
【0006】この方法は、複数のホルマントを網羅する
帯域通過フィルタと、入力音声信号のピッチ周波数及び
その制御目標値を算出するピッチ周波数算出手段と、音
韻毎のピッチ周波数とホルマントパワ値との相関関係を
近似した多項式関数を保持する関数保持手段と、音韻に
応じて前記関数保持手段から特定の多項式関数を選択す
る関数選択手段と、選択された多項式関数と前記ピッチ
周波数及びその制御目標値とに基づいて前記帯域通過フ
ィルタの利得を制御するフィルタ制御手段と、を少なく
とも備える装置によって実現される。なお、前記帯域通
過フィルタは、好ましくは、個々に利得調整可能な複数
の帯域通過フィルタ群にて構成する。
【0007】
【作用】ピッチ周波数とホルマントパワ値との間には相
関関係が認められる。しかも、この相関関係は二次又は
三次の多項式関数にて近似することができる。本発明の
ピッチ制御方法及び装置は、この点に着目したものであ
り、ピッチ構造を有する音声信号のピッチ周波数とホル
マントパワ値、即ち、スペクトル包絡の極大値との相関
関係を近似した多項式関数を予め用意し、この多項式関
数と入力音声のピッチ周波数等とを対応させ、帯域通過
フィルタの利得を制御することで、ピッチ変換に伴う声
道特性の変化を再現することができる。これにより、ピ
ッチ変換幅を大きくした場合の合成音声の違和感が抑制
される。
【0008】
【実施例】以下、図面を参照して本発明の実施例を説明
する。図1は本発明の一実施例に係るピッチ制御装置の
ブロック構成図である。このピッチ制御装置は、入力さ
れた音声信号及びその処理に必要な作業領域を確保でき
る記憶装置(図示省略)を有している。
【0009】図1において、101は入力端子であり、音
声信号と入力音声信号の音素表記記号とが前段装置から
導かれる。前処理部102では、音声信号を本装置の処理
部の信号形態と合致するディジタルデータに変換する。
また、音素表記記号よりピッチ制御可能な有声音か否か
を判断する。ここで、有声音の場合は以下のピッチ制御
処理を行い、無声音の場合はピッチ制御処理は行わな
い。以下、有声音のピッチ制御処理に関して説明する。
【0010】前処理部102でディジタルデータに変換さ
れた音声信号が、ホルマント抽出部103に導かれる。ホ
ルマント抽出部103では、音声区間の数フレームでケプ
ストラムによりスペクトル包絡から入力音声のホルマン
トを抽出し、スペクトル包絡形状及びホルマント位置を
記憶装置に格納する。次に、ローカルピーク抽出部104
において、ピーク探索法により入力音声のピーク位置を
抽出し、記憶装置に格納する。ここまでに計算されたス
ペクトル包絡、ホルマント位置、ローカルピーク位置、
音声信号、及び、音素表記記号を制御係数設定部106へ
出力する。制御係数設定部106では、音素表記記号から
ホルマントの制御目標値を決定するための制御関数を選
択する。この選択基準については後述する。また、ロー
カルピーク位置から各ピーク位置に対応するピッチ周波
数を算出する。そして、入力音声のピッチ周波数、ホル
マントの大きさ、及び、制御値入力部105より入力され
たピッチ制御幅からピッチ制御係数とフィルタ制御係数
とを設定し、これらを音声変形部107に出力する。
【0011】音声変形部107では、ピッチ同期型波形重
畳法により音声波形のピッチ周期を変形する。この変形
波形を、制御係数設定部106で設定されたフィルタ制御
係数に基づいて利得決定された帯域通過フィルタを用
い、ホルマントの大きさを目標値に近くなるように制御
する。そして、後処理部108でアナログデータへの変換
等を行い、出力端子109に出力する。
【0012】次に、制御係数設定部106に関する詳細な
説明を図2を参照して説明する。制御係数設定部106
は、制御関数保持部201、制御関数選択部202、ピッチ計
算部203、ピッチ変換係数算出部204、及び、フィルタ係
数制御値算出部205より構成される。
【0013】制御関数保持部201は、ピッチ周波数とホ
ルマントパワとの相関関係を記述した多項式を各音素に
関して第1〜第4ホルマントまで保持している。これら
ホルマントパワに関する相関関係の音素毎のセットを制
御関数と称する。制御関数選択部202は、入力された音
素記号表記に基づき、制御関数保持部201から制御関数
を選択する。次に、ピッチ計算部203において、ローカ
ルピーク位置の情報から各ピーク位置に対応するピッチ
周波数を算出する。ピッチ変換係数算出部204では、制
御値入力部105から与えられる制御幅と入力音声のロー
カルピーク位置により、ピッチ制御後のピーク間隔比率
を決定する。このピーク間隔比率をピッチ変換係数と称
する。フィルタ係数制御値算出部205では、入力音声の
ホルマントの大きさと制御目標のピッチ周波数における
ホルマントの理想値とから帯域通過フィルタの利得を算
出する。この利得の算出処理を第1〜第4ホルマントま
で夫々行い、これをフィルタ係数制御値とする。ここで
得られたピッチ変換係数及びフィルタ係数制御値は、音
声信号等と共に音声変形部107(図1参照)に導かれ
る。
【0014】図3は、音声変形部107の詳細ブロック図
である。以下、この音声変形部107の詳細を図3を参照
して説明する。波形重畳位置決定部301では、入力音声
のローカルピーク位置と前述のピッチ変換係数から、ピ
ッチ制御後の目標となるローカルピーク位置を算出す
る。この際、ピークの繰り返しや間引き処理により、入
力音声の時間長が保存されるようにする。波形重畳処理
部302では、入力音声と目標音声のローカルピーク位置
との対応に基づき、ピッチ毎に重畳処理を行い、ピッチ
周期を更新する(ピッチ周期型波形重畳法)。次に、フ
ィルタ係数設定部303において、先に決定したフィルタ
係数に基づき、各ホルマントに対応する帯域のフィルタ
利得を設定する。フィルタ処理部304では、フィルタ係
数設定部303で利得設定された帯域通過フィルタを用
い、ピッチ周期を更新した音声信号を処理する。以上の
処理を行った音声信号を後処理部108に出力する。
【0015】次に、ピッチ周波数とホルマントパワとの
相関関係を用いた制御関数の詳細を図4、図5及び図8
を参照して説明する。ピッチ周波数とホルマントパワと
は、図8に示すような相関が認められる。この相関関係
は、二次又は三次の多項式関数により近似することがで
きる。例えば、図8に例示したプロットの近似式は、y
をパワ、xをピッチ周波数とすると、下式で表される。 y=−0.005x2+1.312x−7.040
【0016】図4は、この相関関係を、二次の多項式関
数曲線401で近似した例である。なお、この相関関係
は、話者、音韻、ホルマント(第Nホルマント)によっ
て異なるので、本実施例のピッチ制御装置に適用する際
には、必要なだけの相関関係を予め分析し、夫々近似し
た多項式関数を求める。
【0017】図5は、/a/〜/o/までの5母音の第
1〜第4ホルマント(F1〜F4)に関するピッチとホ
ルマントとの相関関係を示す概念図である。本実施例で
は、二次又は三次の多項式関数により近似を行っている
が、分析する声道特性の挙動により、適当な近似手法又
はパタンテーブルを使用することができる。
【0018】前述の近似式関数を用いてピッチ制御後の
ホルマントを制御する方法を以下に述べる。図4におい
て、第一のプロット点402は、入力音声の任意のピッチ
周波数foとそのときのホルマントパワPoとの対応位置
をプロットしたものである。これに対して、第二のプロ
ット点403は制御目標点であり、ピッチ周波数foと前述
のピッチ制御幅とから目標ピッチ周波数faを算出す
る。この目標ピッチ周波数faを算出した後、相関関係
を表す多項式関数の変数xにこの値faを代入し、目標
ピッチにおける該当ホルマントパワPaを算出する。相
関関係のホルマントパワ軸は対数であるので、ホルマン
トを制御するフィルタの利得Fn-gainは、Pa-Poで計
算する。なお、Fnは第1〜第4ホルマントに対応し、
実際には、F1-gain〜F4-gainと表す。
【0019】ホルマントの大きさを制御する帯域通過フ
ィルタの特性に関する詳細を図6及び図7を参照して説
明する。ホルマントを制御するための帯域通過フィルタ
は、図6に示すように、通過帯域が狭く、且つ、個々の
利得の調整が可能な複数の帯域通過フィルタ602を組み
合わせて構成する。このようにすれば、イコライザ的に
個々の利得を調整することができる。なお、全体を単純
に組み合わせた場合、理想的には通過域が平坦特性601
を持つ一つの帯域通過フィルタと等価になる。ホルマン
トの大きさを制御する際には、先に計算したホルマント
位置の情報と前記利得Fn-gainとに基づいて各帯域通過
フィルタの利得を調整する。
【0020】図7は、ホルマントを制御するために利得
を操作した帯域通過フィルタの理想特性の例を示す説明
図である。図7の例では、低域のホルマントを強調する
フィルタ設定701と、中域のホルマントパワを低下させ
るフィルタの設定702、及び、全体での理想特性703の例
が示されている。
【0021】このように、本実施例のピッチ制御装置に
よれば、ピッチ同期型波形重畳法によりピッチ制御がな
され、合成音声のホルマントパワが変化したときは、制
御値入力部105、制御係数設定部106、音声変形部
107によって随時修正されるので、ピッチ変換に伴う
声道特性の変化を再現することができ、より自然音声に
近いピッチ制御音声を生成することができる。なお、本
発明は、必ずしもこの実施例に限定されるものではな
く。その要旨を逸脱しない範囲で手順ないし構成を変更
することができる。例えば、近似した多項式関数のモデ
ルをより一層精密にすることで、合成音声の振幅制御機
構を同時に実現することが可能となる。
【0022】
【発明の効果】以上、詳細に説明したように、本発明の
ピッチ制御方法は、入力音声信号のピッチ周波数とホル
マントパワとの相関関係を利用し、波形重ね合わせ時に
合成される音声のホルマントパワを目標となるピッチ周
波数に対応するものに近づけるので、ピッチ周波数変化
に伴う声道特性の変化が忠実に再現される効果がある。
また、本発明のピッチ制御装置によれば、合成後のホル
マントを決定する帯域通過フィルタの利得が上記相関関
係に基づくフィルタ制御手段の出力値によって制御さ
れ、上記ピッチ制御方法の実現が容易且つ確実になる効
果がある。なお、帯域通過フィルタを、個々に利得調整
可能な複数の帯域フィルタ群で構成することで、声道特
性の再現がより忠実になり、合成音声の自然性が向上す
る。
【図面の簡単な説明】
【図1】本発明の一実施例の全体構成を示すブロック図
である。
【図2】本実施例の制御係数設定部の詳細ブロック図で
ある。
【図3】本実施例の音声変形部の詳細ブロック図であ
る。
【図4】ピッチ周波数とホルマントパワの相関関係を近
似した例を示す説明図である。
【図5】5母音の第1〜第4ホルマントの相関関係の登
録例を示す説明図である。
【図6】ホルマント制御に用いるフィルタ群の理想特性
を示す説明図である。
【図7】ホルマントを制御するために利得を操作したフ
ィルタの理想特性を示す説明図である。
【図8】実際の音声信号から分析したピッチ周波数とホ
ルマントパワとの相関関係を示す説明図である。
【符号の説明】
102・・・前処理部 103・・・ホルマント抽出部 104・・・ローカルピーク抽出部 105・・・制御値入力部 106・・・制御係数設定部 107・・・音声変形部 108・・・後処理部 201・・・制御関数保持部 202・・・制御関数選択部 203・・・ピッチ計算部 204・・・ピッチ変換係数算出部 205・・・フィルタ係数制御値算出部 301・・・波形重畳位置決定部 302・・・波形重畳処理部 303・・・フィルタ係数設定部 304・・・フィルタ処理部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭57−171398(JP,A) 特開 平3−200299(JP,A) 特開 昭57−161800(JP,A) 特開 昭61−75399(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 11/04

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 ピッチ構造を有する入力音声信号の波形
    切出しと該切出し波形の重ね合わせとを行うことで合成
    音声のピッチ周波数を目標値に制御するピッチ制御方法
    において、前記入力音声信号のピッチ周波数とホルマン
    トパワとの相関関係を多項式関数に近似させ、この多項
    式関数から前記目標値に対応するホルマントパワを決定
    するとともに、前記波形重ね合わせ時に合成される音声
    のホルマントパワを前記決定されたホルマントパワに近
    づけることを特徴とするピッチ制御方法。
  2. 【請求項2】 請求項1記載のピッチ制御方法を実現す
    る装置であって、複数のホルマントを網羅する帯域通過
    フィルタと、入力音声信号のピッチ周波数及びその制御
    目標値を算出するピッチ周波数算出手段と、音韻毎のピ
    ッチ周波数とホルマントパワとの相関関係を近似した多
    項式関数を保持する関数保持手段と、音韻に応じて前記
    関数保持手段から特定の多項式関数を選択する関数選択
    手段と、選択された多項式関数と前記ピッチ周波数及び
    その制御目標値とに基づいて前記帯域通過フィルタの利
    得を制御するフィルタ制御手段と、を少なくとも備える
    ことを特徴とするピッチ制御装置。
  3. 【請求項3】 前記帯域通過フィルタは、個々に利得調
    整可能な複数の帯域通過フィルタ群からなることを特徴
    とする請求項2記載のピッチ制御装置。
JP6142293A 1993-02-26 1993-02-26 ピッチ制御方法及び装置 Expired - Lifetime JP3197975B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6142293A JP3197975B2 (ja) 1993-02-26 1993-02-26 ピッチ制御方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6142293A JP3197975B2 (ja) 1993-02-26 1993-02-26 ピッチ制御方法及び装置

Publications (2)

Publication Number Publication Date
JPH06250695A JPH06250695A (ja) 1994-09-09
JP3197975B2 true JP3197975B2 (ja) 2001-08-13

Family

ID=13170642

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6142293A Expired - Lifetime JP3197975B2 (ja) 1993-02-26 1993-02-26 ピッチ制御方法及び装置

Country Status (1)

Country Link
JP (1) JP3197975B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101733182B1 (ko) * 2015-06-19 2017-05-08 주식회사 리빙케어 냉온겸용 정수장치

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5567901A (en) * 1995-01-18 1996-10-22 Ivl Technologies Ltd. Method and apparatus for changing the timbre and/or pitch of audio signals
US6046395A (en) * 1995-01-18 2000-04-04 Ivl Technologies Ltd. Method and apparatus for changing the timbre and/or pitch of audio signals
US6336092B1 (en) * 1997-04-28 2002-01-01 Ivl Technologies Ltd Targeted vocal transformation
CN113066476B (zh) * 2019-12-13 2024-05-31 科大讯飞股份有限公司 合成语音处理方法及相关装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101733182B1 (ko) * 2015-06-19 2017-05-08 주식회사 리빙케어 냉온겸용 정수장치

Also Published As

Publication number Publication date
JPH06250695A (ja) 1994-09-09

Similar Documents

Publication Publication Date Title
JP3563772B2 (ja) 音声合成方法及び装置並びに音声合成制御方法及び装置
JPH04328798A (ja) パブリックアドレス明瞭度強調システム
JP3430985B2 (ja) 合成音生成装置
JP3732793B2 (ja) 音声合成方法、音声合成装置及び記録媒体
JPH0193795A (ja) 音声の発声速度変換方法
JPH05307399A (ja) 音声分析方式
JP3197975B2 (ja) ピッチ制御方法及び装置
JP4214842B2 (ja) 音声合成装置及び音声合成方法
JPH04358200A (ja) 音声合成装置
JP2904279B2 (ja) 音声合成方法および装置
JP3841596B2 (ja) 音素データの生成方法及び音声合成装置
JPH05307395A (ja) 音声合成装置
JP3379348B2 (ja) ピッチ変換器
JP2841797B2 (ja) 音声分析・合成装置
JPH0580796A (ja) 話速制御型補聴方法および装置
JP2612867B2 (ja) 音声ピッチ変換方法
JP2615856B2 (ja) 音声合成方法とその装置
JP3241582B2 (ja) 韻律制御装置及び方法
JPH02247700A (ja) 音声合成装置
JP3083830B2 (ja) 音声の発声時間長制御方法および装置
JP3336098B2 (ja) 音声効果装置
JPS6363100A (ja) 声質変換方法
JP3317458B2 (ja) 音声合成方法
JP3270869B2 (ja) 音程変換装置
JP2000242287A (ja) 発声補助装置およびプログラム記録媒体

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080608

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090608

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100608

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100608

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110608

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120608

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120608

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130608

Year of fee payment: 12

EXPY Cancellation because of completion of term