JP3197975B2 - ピッチ制御方法及び装置 - Google Patents
ピッチ制御方法及び装置Info
- Publication number
- JP3197975B2 JP3197975B2 JP6142293A JP6142293A JP3197975B2 JP 3197975 B2 JP3197975 B2 JP 3197975B2 JP 6142293 A JP6142293 A JP 6142293A JP 6142293 A JP6142293 A JP 6142293A JP 3197975 B2 JP3197975 B2 JP 3197975B2
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- formant
- control
- voice
- pitch frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Electrophonic Musical Instruments (AREA)
Description
を行う方法及び装置に関し、特に、帯域通過フィルタを
用いてホルマントパワを制御し、自然音声におけるピッ
チ周波数とホルマントパワの相関関係を模擬することを
可能とするピッチ制御方法及び装置に関する。
の一例として、「音声波形のローカルピーク抽出とピッ
チ制御への応用」(平成3年10月号、音響学会講演論
文集2−6−1)に記載された装置がある。このピッチ
制御装置のように、音声波形をそのままピッチ制御する
場合は、まず、入力音声信号からそのローカルピーク位
置を抽出し、このピーク位置を基準にピッチ単位で波形
切り出し用の窓関数を決定し、この窓関数により波形を
切り出し、目標ピッチ周期になるように、切り出した波
形を再度重ね合わせて合成音声を生成していた。
は、入力された音声から切り出した音声のピッチ周期を
変更して再度重ね合わせを行うため、ピッチ周期が変更
された後も従前の声道特性はほぼ保存される。そのた
め、ピッチ周波数に対応する声道特性が再現できず、ピ
ッチ制御幅が大きくなるにつれて違和感が増す問題があ
った
ので、音声波形のピッチ周期の更新に従ってピッチ周波
数に対応する声道特性を再現し、より自然音声に近いピ
ッチ制御音声を生成するピッチ制御方法及びこの方法を
実現する装置を提供することにある。
明のピッチ制御方法は、ピッチ構造を有する入力音声信
号の波形切出しと該切出し波形の重ね合わせとを行うこ
とで合成音声のピッチ周波数を目標値に制御する方法に
おいて、入力音声信号のピッチ周波数とホルマントパワ
との相関関係を多項式関数に近似させ、この多項式関数
から前記目標値に対応するホルマントパワを決定すると
ともに、波形重ね合わせ時に合成される音声のホルマン
トパワを前記決定されたホルマントパワに近づけるよう
にしたものである。
帯域通過フィルタと、入力音声信号のピッチ周波数及び
その制御目標値を算出するピッチ周波数算出手段と、音
韻毎のピッチ周波数とホルマントパワ値との相関関係を
近似した多項式関数を保持する関数保持手段と、音韻に
応じて前記関数保持手段から特定の多項式関数を選択す
る関数選択手段と、選択された多項式関数と前記ピッチ
周波数及びその制御目標値とに基づいて前記帯域通過フ
ィルタの利得を制御するフィルタ制御手段と、を少なく
とも備える装置によって実現される。なお、前記帯域通
過フィルタは、好ましくは、個々に利得調整可能な複数
の帯域通過フィルタ群にて構成する。
関関係が認められる。しかも、この相関関係は二次又は
三次の多項式関数にて近似することができる。本発明の
ピッチ制御方法及び装置は、この点に着目したものであ
り、ピッチ構造を有する音声信号のピッチ周波数とホル
マントパワ値、即ち、スペクトル包絡の極大値との相関
関係を近似した多項式関数を予め用意し、この多項式関
数と入力音声のピッチ周波数等とを対応させ、帯域通過
フィルタの利得を制御することで、ピッチ変換に伴う声
道特性の変化を再現することができる。これにより、ピ
ッチ変換幅を大きくした場合の合成音声の違和感が抑制
される。
する。図1は本発明の一実施例に係るピッチ制御装置の
ブロック構成図である。このピッチ制御装置は、入力さ
れた音声信号及びその処理に必要な作業領域を確保でき
る記憶装置(図示省略)を有している。
声信号と入力音声信号の音素表記記号とが前段装置から
導かれる。前処理部102では、音声信号を本装置の処理
部の信号形態と合致するディジタルデータに変換する。
また、音素表記記号よりピッチ制御可能な有声音か否か
を判断する。ここで、有声音の場合は以下のピッチ制御
処理を行い、無声音の場合はピッチ制御処理は行わな
い。以下、有声音のピッチ制御処理に関して説明する。
れた音声信号が、ホルマント抽出部103に導かれる。ホ
ルマント抽出部103では、音声区間の数フレームでケプ
ストラムによりスペクトル包絡から入力音声のホルマン
トを抽出し、スペクトル包絡形状及びホルマント位置を
記憶装置に格納する。次に、ローカルピーク抽出部104
において、ピーク探索法により入力音声のピーク位置を
抽出し、記憶装置に格納する。ここまでに計算されたス
ペクトル包絡、ホルマント位置、ローカルピーク位置、
音声信号、及び、音素表記記号を制御係数設定部106へ
出力する。制御係数設定部106では、音素表記記号から
ホルマントの制御目標値を決定するための制御関数を選
択する。この選択基準については後述する。また、ロー
カルピーク位置から各ピーク位置に対応するピッチ周波
数を算出する。そして、入力音声のピッチ周波数、ホル
マントの大きさ、及び、制御値入力部105より入力され
たピッチ制御幅からピッチ制御係数とフィルタ制御係数
とを設定し、これらを音声変形部107に出力する。
畳法により音声波形のピッチ周期を変形する。この変形
波形を、制御係数設定部106で設定されたフィルタ制御
係数に基づいて利得決定された帯域通過フィルタを用
い、ホルマントの大きさを目標値に近くなるように制御
する。そして、後処理部108でアナログデータへの変換
等を行い、出力端子109に出力する。
説明を図2を参照して説明する。制御係数設定部106
は、制御関数保持部201、制御関数選択部202、ピッチ計
算部203、ピッチ変換係数算出部204、及び、フィルタ係
数制御値算出部205より構成される。
ルマントパワとの相関関係を記述した多項式を各音素に
関して第1〜第4ホルマントまで保持している。これら
ホルマントパワに関する相関関係の音素毎のセットを制
御関数と称する。制御関数選択部202は、入力された音
素記号表記に基づき、制御関数保持部201から制御関数
を選択する。次に、ピッチ計算部203において、ローカ
ルピーク位置の情報から各ピーク位置に対応するピッチ
周波数を算出する。ピッチ変換係数算出部204では、制
御値入力部105から与えられる制御幅と入力音声のロー
カルピーク位置により、ピッチ制御後のピーク間隔比率
を決定する。このピーク間隔比率をピッチ変換係数と称
する。フィルタ係数制御値算出部205では、入力音声の
ホルマントの大きさと制御目標のピッチ周波数における
ホルマントの理想値とから帯域通過フィルタの利得を算
出する。この利得の算出処理を第1〜第4ホルマントま
で夫々行い、これをフィルタ係数制御値とする。ここで
得られたピッチ変換係数及びフィルタ係数制御値は、音
声信号等と共に音声変形部107(図1参照)に導かれ
る。
である。以下、この音声変形部107の詳細を図3を参照
して説明する。波形重畳位置決定部301では、入力音声
のローカルピーク位置と前述のピッチ変換係数から、ピ
ッチ制御後の目標となるローカルピーク位置を算出す
る。この際、ピークの繰り返しや間引き処理により、入
力音声の時間長が保存されるようにする。波形重畳処理
部302では、入力音声と目標音声のローカルピーク位置
との対応に基づき、ピッチ毎に重畳処理を行い、ピッチ
周期を更新する(ピッチ周期型波形重畳法)。次に、フ
ィルタ係数設定部303において、先に決定したフィルタ
係数に基づき、各ホルマントに対応する帯域のフィルタ
利得を設定する。フィルタ処理部304では、フィルタ係
数設定部303で利得設定された帯域通過フィルタを用
い、ピッチ周期を更新した音声信号を処理する。以上の
処理を行った音声信号を後処理部108に出力する。
相関関係を用いた制御関数の詳細を図4、図5及び図8
を参照して説明する。ピッチ周波数とホルマントパワと
は、図8に示すような相関が認められる。この相関関係
は、二次又は三次の多項式関数により近似することがで
きる。例えば、図8に例示したプロットの近似式は、y
をパワ、xをピッチ周波数とすると、下式で表される。 y=−0.005x2+1.312x−7.040
数曲線401で近似した例である。なお、この相関関係
は、話者、音韻、ホルマント(第Nホルマント)によっ
て異なるので、本実施例のピッチ制御装置に適用する際
には、必要なだけの相関関係を予め分析し、夫々近似し
た多項式関数を求める。
1〜第4ホルマント(F1〜F4)に関するピッチとホ
ルマントとの相関関係を示す概念図である。本実施例で
は、二次又は三次の多項式関数により近似を行っている
が、分析する声道特性の挙動により、適当な近似手法又
はパタンテーブルを使用することができる。
ホルマントを制御する方法を以下に述べる。図4におい
て、第一のプロット点402は、入力音声の任意のピッチ
周波数foとそのときのホルマントパワPoとの対応位置
をプロットしたものである。これに対して、第二のプロ
ット点403は制御目標点であり、ピッチ周波数foと前述
のピッチ制御幅とから目標ピッチ周波数faを算出す
る。この目標ピッチ周波数faを算出した後、相関関係
を表す多項式関数の変数xにこの値faを代入し、目標
ピッチにおける該当ホルマントパワPaを算出する。相
関関係のホルマントパワ軸は対数であるので、ホルマン
トを制御するフィルタの利得Fn-gainは、Pa-Poで計
算する。なお、Fnは第1〜第4ホルマントに対応し、
実際には、F1-gain〜F4-gainと表す。
ィルタの特性に関する詳細を図6及び図7を参照して説
明する。ホルマントを制御するための帯域通過フィルタ
は、図6に示すように、通過帯域が狭く、且つ、個々の
利得の調整が可能な複数の帯域通過フィルタ602を組み
合わせて構成する。このようにすれば、イコライザ的に
個々の利得を調整することができる。なお、全体を単純
に組み合わせた場合、理想的には通過域が平坦特性601
を持つ一つの帯域通過フィルタと等価になる。ホルマン
トの大きさを制御する際には、先に計算したホルマント
位置の情報と前記利得Fn-gainとに基づいて各帯域通過
フィルタの利得を調整する。
を操作した帯域通過フィルタの理想特性の例を示す説明
図である。図7の例では、低域のホルマントを強調する
フィルタ設定701と、中域のホルマントパワを低下させ
るフィルタの設定702、及び、全体での理想特性703の例
が示されている。
よれば、ピッチ同期型波形重畳法によりピッチ制御がな
され、合成音声のホルマントパワが変化したときは、制
御値入力部105、制御係数設定部106、音声変形部
107によって随時修正されるので、ピッチ変換に伴う
声道特性の変化を再現することができ、より自然音声に
近いピッチ制御音声を生成することができる。なお、本
発明は、必ずしもこの実施例に限定されるものではな
く。その要旨を逸脱しない範囲で手順ないし構成を変更
することができる。例えば、近似した多項式関数のモデ
ルをより一層精密にすることで、合成音声の振幅制御機
構を同時に実現することが可能となる。
ピッチ制御方法は、入力音声信号のピッチ周波数とホル
マントパワとの相関関係を利用し、波形重ね合わせ時に
合成される音声のホルマントパワを目標となるピッチ周
波数に対応するものに近づけるので、ピッチ周波数変化
に伴う声道特性の変化が忠実に再現される効果がある。
また、本発明のピッチ制御装置によれば、合成後のホル
マントを決定する帯域通過フィルタの利得が上記相関関
係に基づくフィルタ制御手段の出力値によって制御さ
れ、上記ピッチ制御方法の実現が容易且つ確実になる効
果がある。なお、帯域通過フィルタを、個々に利得調整
可能な複数の帯域フィルタ群で構成することで、声道特
性の再現がより忠実になり、合成音声の自然性が向上す
る。
である。
ある。
る。
似した例を示す説明図である。
録例を示す説明図である。
を示す説明図である。
ィルタの理想特性を示す説明図である。
ルマントパワとの相関関係を示す説明図である。
Claims (3)
- 【請求項1】 ピッチ構造を有する入力音声信号の波形
切出しと該切出し波形の重ね合わせとを行うことで合成
音声のピッチ周波数を目標値に制御するピッチ制御方法
において、前記入力音声信号のピッチ周波数とホルマン
トパワとの相関関係を多項式関数に近似させ、この多項
式関数から前記目標値に対応するホルマントパワを決定
するとともに、前記波形重ね合わせ時に合成される音声
のホルマントパワを前記決定されたホルマントパワに近
づけることを特徴とするピッチ制御方法。 - 【請求項2】 請求項1記載のピッチ制御方法を実現す
る装置であって、複数のホルマントを網羅する帯域通過
フィルタと、入力音声信号のピッチ周波数及びその制御
目標値を算出するピッチ周波数算出手段と、音韻毎のピ
ッチ周波数とホルマントパワとの相関関係を近似した多
項式関数を保持する関数保持手段と、音韻に応じて前記
関数保持手段から特定の多項式関数を選択する関数選択
手段と、選択された多項式関数と前記ピッチ周波数及び
その制御目標値とに基づいて前記帯域通過フィルタの利
得を制御するフィルタ制御手段と、を少なくとも備える
ことを特徴とするピッチ制御装置。 - 【請求項3】 前記帯域通過フィルタは、個々に利得調
整可能な複数の帯域通過フィルタ群からなることを特徴
とする請求項2記載のピッチ制御装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6142293A JP3197975B2 (ja) | 1993-02-26 | 1993-02-26 | ピッチ制御方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6142293A JP3197975B2 (ja) | 1993-02-26 | 1993-02-26 | ピッチ制御方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH06250695A JPH06250695A (ja) | 1994-09-09 |
JP3197975B2 true JP3197975B2 (ja) | 2001-08-13 |
Family
ID=13170642
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6142293A Expired - Lifetime JP3197975B2 (ja) | 1993-02-26 | 1993-02-26 | ピッチ制御方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3197975B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101733182B1 (ko) * | 2015-06-19 | 2017-05-08 | 주식회사 리빙케어 | 냉온겸용 정수장치 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5567901A (en) * | 1995-01-18 | 1996-10-22 | Ivl Technologies Ltd. | Method and apparatus for changing the timbre and/or pitch of audio signals |
US6046395A (en) * | 1995-01-18 | 2000-04-04 | Ivl Technologies Ltd. | Method and apparatus for changing the timbre and/or pitch of audio signals |
US6336092B1 (en) * | 1997-04-28 | 2002-01-01 | Ivl Technologies Ltd | Targeted vocal transformation |
CN113066476B (zh) * | 2019-12-13 | 2024-05-31 | 科大讯飞股份有限公司 | 合成语音处理方法及相关装置 |
-
1993
- 1993-02-26 JP JP6142293A patent/JP3197975B2/ja not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101733182B1 (ko) * | 2015-06-19 | 2017-05-08 | 주식회사 리빙케어 | 냉온겸용 정수장치 |
Also Published As
Publication number | Publication date |
---|---|
JPH06250695A (ja) | 1994-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3563772B2 (ja) | 音声合成方法及び装置並びに音声合成制御方法及び装置 | |
JPH04328798A (ja) | パブリックアドレス明瞭度強調システム | |
JP3430985B2 (ja) | 合成音生成装置 | |
JP3732793B2 (ja) | 音声合成方法、音声合成装置及び記録媒体 | |
JPH0193795A (ja) | 音声の発声速度変換方法 | |
JPH05307399A (ja) | 音声分析方式 | |
JP3197975B2 (ja) | ピッチ制御方法及び装置 | |
JP4214842B2 (ja) | 音声合成装置及び音声合成方法 | |
JPH04358200A (ja) | 音声合成装置 | |
JP2904279B2 (ja) | 音声合成方法および装置 | |
JP3841596B2 (ja) | 音素データの生成方法及び音声合成装置 | |
JPH05307395A (ja) | 音声合成装置 | |
JP3379348B2 (ja) | ピッチ変換器 | |
JP2841797B2 (ja) | 音声分析・合成装置 | |
JPH0580796A (ja) | 話速制御型補聴方法および装置 | |
JP2612867B2 (ja) | 音声ピッチ変換方法 | |
JP2615856B2 (ja) | 音声合成方法とその装置 | |
JP3241582B2 (ja) | 韻律制御装置及び方法 | |
JPH02247700A (ja) | 音声合成装置 | |
JP3083830B2 (ja) | 音声の発声時間長制御方法および装置 | |
JP3336098B2 (ja) | 音声効果装置 | |
JPS6363100A (ja) | 声質変換方法 | |
JP3317458B2 (ja) | 音声合成方法 | |
JP3270869B2 (ja) | 音程変換装置 | |
JP2000242287A (ja) | 発声補助装置およびプログラム記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080608 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090608 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100608 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100608 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110608 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120608 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120608 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130608 Year of fee payment: 12 |
|
EXPY | Cancellation because of completion of term |