JP3354363B2 - 音声変換装置 - Google Patents
音声変換装置Info
- Publication number
- JP3354363B2 JP3354363B2 JP30917695A JP30917695A JP3354363B2 JP 3354363 B2 JP3354363 B2 JP 3354363B2 JP 30917695 A JP30917695 A JP 30917695A JP 30917695 A JP30917695 A JP 30917695A JP 3354363 B2 JP3354363 B2 JP 3354363B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- speech
- speaker
- conversion
- conversion coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
【0001】
【発明の属する技術分野】この発明は、たとえば、第1
の話者の音声を第2の話者の音声に変換する音声変換装
置に関する。
の話者の音声を第2の話者の音声に変換する音声変換装
置に関する。
【0002】
【従来の技術】第1の話者の入力音声から音声合成パラ
メータを抽出し、抽出された音声合成パラメータを変換
係数を用いて変換し、変換された音声合成パラメータか
ら音声を合成することにより入力音声を第2の話者の音
声に変換する音声変換装置が知られている。
メータを抽出し、抽出された音声合成パラメータを変換
係数を用いて変換し、変換された音声合成パラメータか
ら音声を合成することにより入力音声を第2の話者の音
声に変換する音声変換装置が知られている。
【0003】
【発明が解決しようとする課題】この発明は、第1の話
者の入力音声から、第1の話者と第2の話者との中間の
出力音声を得ることができる音声変換装置を提供するこ
とを目的とする。
者の入力音声から、第1の話者と第2の話者との中間の
出力音声を得ることができる音声変換装置を提供するこ
とを目的とする。
【0004】この発明は、第1の話者の入力音声に基づ
いて、第1の話者の音声から第2の話者の音声に徐々に
変化していく出力音声を得ることができる音声変換装置
を提供することを目的とする。
いて、第1の話者の音声から第2の話者の音声に徐々に
変化していく出力音声を得ることができる音声変換装置
を提供することを目的とする。
【0005】
【課題を解決するための手段】この発明の音声変換装置
は、第1の話者の入力音声から音声合成パラメータを抽
出し、抽出された音声合成パラメータを変換係数を用い
て変換し、変換された音声合成パラメータから音声を合
成することにより入力音声を第2の話者の音声に変換す
る音声変換装置において、合成音声が第1の話者の音声
から第2の話者の音声に徐々に接近していくように、変
換係数を徐々に変化させていく変換係数制御手段、入力
音声から音声合成パラメータを抽出する音声分析手段、
音声分析手段によって抽出された音声合成パラメータ
を、変換係数制御手段によって生成された変換係数を用
いて変換する音声合成パラメータ変換手段、および音声
合成パラメータ変換手段によって得られた音声合成パラ
メータに基づいて音声を合成する音声合成手段を備えて
いることを特徴とする。
は、第1の話者の入力音声から音声合成パラメータを抽
出し、抽出された音声合成パラメータを変換係数を用い
て変換し、変換された音声合成パラメータから音声を合
成することにより入力音声を第2の話者の音声に変換す
る音声変換装置において、合成音声が第1の話者の音声
から第2の話者の音声に徐々に接近していくように、変
換係数を徐々に変化させていく変換係数制御手段、入力
音声から音声合成パラメータを抽出する音声分析手段、
音声分析手段によって抽出された音声合成パラメータ
を、変換係数制御手段によって生成された変換係数を用
いて変換する音声合成パラメータ変換手段、および音声
合成パラメータ変換手段によって得られた音声合成パラ
メータに基づいて音声を合成する音声合成手段を備えて
いることを特徴とする。
【0006】
【0007】
【0008】
【0009】変換係数の時間に対する変化の割合を設定
するための設定手段を設けておくことが好ましい。この
場合には、変換係数制御手段は、設定手段によって設定
された変化の割合で、変換係数を変化させる。
するための設定手段を設けておくことが好ましい。この
場合には、変換係数制御手段は、設定手段によって設定
された変化の割合で、変換係数を変化させる。
【0010】この発明による第2の音声変換装置では、
第1の話者の入力音声に基づいて、第1の話者の音声か
ら第2の話者の音声に徐々に変化していく出力音声が得
られる。
第1の話者の入力音声に基づいて、第1の話者の音声か
ら第2の話者の音声に徐々に変化していく出力音声が得
られる。
【0011】
【発明の実施の形態】以下、図面を参照して、この発明
の実施の形態について説明する。
の実施の形態について説明する。
【0012】図1は、音声変換装置の構成を示してい
る。音声変換装置は、入力音声を分析して音声合成パラ
メータを生成する音声分析部1、音声合成パラメータを
変換係数Wを用いて変換する音声合成パラメータ変換部
2、変換された音声合成パラメータから音声を合成する
音声合成部3、変換係数Wを制御するための変換係数制
御部4および音声変換モードの設定、その他の設定を行
なうための操作部5を備えている。
る。音声変換装置は、入力音声を分析して音声合成パラ
メータを生成する音声分析部1、音声合成パラメータを
変換係数Wを用いて変換する音声合成パラメータ変換部
2、変換された音声合成パラメータから音声を合成する
音声合成部3、変換係数Wを制御するための変換係数制
御部4および音声変換モードの設定、その他の設定を行
なうための操作部5を備えている。
【0013】音声変換モードには、話者Aの音声を話者
Bの音声に変換する第1モード、話者Aの音声を話者A
と話者Bの中間の音声に変換する第2モード、および話
者Aの音声を話者Aの音声から話者Bの音声に徐々に変
換していく第3モードがある。
Bの音声に変換する第1モード、話者Aの音声を話者A
と話者Bの中間の音声に変換する第2モード、および話
者Aの音声を話者Aの音声から話者Bの音声に徐々に変
換していく第3モードがある。
【0014】(1)第1モードの説明 まず、第1モードが設定されている場合の動作について
説明する。
説明する。
【0015】話者Aの音声が入力音声として、音声分析
部1に入力される。音声分析部1では、入力音声を分析
し、音声合成パラメータを生成する。この例では、音声
分析部1では、入力音声波形のフォルマントパラメータ
(フォルマント周波数と、その帯域幅とを表すパラメー
タ)Fa=(f1,f2,…fn)が抽出される。
部1に入力される。音声分析部1では、入力音声を分析
し、音声合成パラメータを生成する。この例では、音声
分析部1では、入力音声波形のフォルマントパラメータ
(フォルマント周波数と、その帯域幅とを表すパラメー
タ)Fa=(f1,f2,…fn)が抽出される。
【0016】音声合成パラメータ変換部2では、変換係
数Wを用い、数式1に基づいて、フォルマントパラメー
タFa=(f1,f2,…fn)をFb=(f1' ,f
2',…fn' )に変換する。第1モードが設定されて
いる場合には、変換係数Wとしては、話者Aに対するフ
ォルマントパラメータFaを話者Bに対するフォルマン
トパラメータFbに変換するための変換係数wが用いら
れる。
数Wを用い、数式1に基づいて、フォルマントパラメー
タFa=(f1,f2,…fn)をFb=(f1' ,f
2',…fn' )に変換する。第1モードが設定されて
いる場合には、変換係数Wとしては、話者Aに対するフ
ォルマントパラメータFaを話者Bに対するフォルマン
トパラメータFbに変換するための変換係数wが用いら
れる。
【0017】
【数1】
【0018】つまり、入力音声波形のフォルマントパラ
メータFa=(f1,f2,…fn)が、話者Bに対す
るフォルマントパラメータFb=(f1’,f2’,…
fn’)に変換される。話者Aに対するフォルマントパ
ラメータFaを話者Bに対するフォルマントパラメータ
Fbに変換するための変換係数wは、話者Aの音声のフ
ォルマントパラメータと話者Bの音声のフォルマントパ
ラメータとを複数サンプリングしておき、これらのサン
プルと数式1とを用いて求められている。
メータFa=(f1,f2,…fn)が、話者Bに対す
るフォルマントパラメータFb=(f1’,f2’,…
fn’)に変換される。話者Aに対するフォルマントパ
ラメータFaを話者Bに対するフォルマントパラメータ
Fbに変換するための変換係数wは、話者Aの音声のフ
ォルマントパラメータと話者Bの音声のフォルマントパ
ラメータとを複数サンプリングしておき、これらのサン
プルと数式1とを用いて求められている。
【0019】音声合成部3では、音声合成パラメータ変
換部2によって得られたフォルマントパラメータFb=
(f1’,f2’,…fn’)から音声を合成する。こ
れにより、話者Bに対する音声が得られる。
換部2によって得られたフォルマントパラメータFb=
(f1’,f2’,…fn’)から音声を合成する。こ
れにより、話者Bに対する音声が得られる。
【0020】(2)第2モードの説明 第2モードが設定されている場合の動作について説明す
る。
る。
【0021】話者Aの音声が入力音声として、音声分析
部1に入力される。音声分析部1では、入力音声を分析
し、音声合成パラメータを生成する。この例では、音声
分析部1では、入力音声波形のフォルマントパラメータ
Fa=(f1,f2,…fn)が抽出される。
部1に入力される。音声分析部1では、入力音声を分析
し、音声合成パラメータを生成する。この例では、音声
分析部1では、入力音声波形のフォルマントパラメータ
Fa=(f1,f2,…fn)が抽出される。
【0022】変換係数制御部4では、話者Aに対するフ
ォルマントパラメータFaを話者Bに対するフォルマン
トパラメータFbに変換するための変換係数wから、話
者Aと話者Bとの中間の音声を得るための変換係数Wを
生成する。
ォルマントパラメータFaを話者Bに対するフォルマン
トパラメータFbに変換するための変換係数wから、話
者Aと話者Bとの中間の音声を得るための変換係数Wを
生成する。
【0023】話者Aと話者Bとの中間の音声を得るため
の変換係数Wは、次の数式2に基づいて求められる。
の変換係数Wは、次の数式2に基づいて求められる。
【0024】
【数2】
【0025】ここで、xの値(0≦x≦1)は、操作部
5によって指定される。xの値が大きいほど出力音声は
話者Aに近くなり、xの値が小さいほど(yの値が大き
いほど)出力音声は話者Bに近くなる。
5によって指定される。xの値が大きいほど出力音声は
話者Aに近くなり、xの値が小さいほど(yの値が大き
いほど)出力音声は話者Bに近くなる。
【0026】音声合成パラメータ変換部2では、変換係
数制御部4によって生成された変換係数W(=x・w+
y)を用いて、数式1によりフォルマントパラメータF
a=(f1,f2,…fn)をFb=(f1’,f
2’,…fn’)に変換する。
数制御部4によって生成された変換係数W(=x・w+
y)を用いて、数式1によりフォルマントパラメータF
a=(f1,f2,…fn)をFb=(f1’,f
2’,…fn’)に変換する。
【0027】つまり、数式1に基づいて、入力音声波形
のフォルマントパラメータFa=(f1,f2,…f
n)が、話者Aと話者Bとの中間の音声に対するフォル
マントパラメータFb=(f1’,f2’,…fn’)
に変換される。
のフォルマントパラメータFa=(f1,f2,…f
n)が、話者Aと話者Bとの中間の音声に対するフォル
マントパラメータFb=(f1’,f2’,…fn’)
に変換される。
【0028】音声合成部3では、音声合成パラメータ変
換部2によって得られたフォルマントパラメータFb=
(f1’,f2’,…fn’)から音声を合成する。こ
れにより、話者Aと話者Bとの中間の音声が得られる。
換部2によって得られたフォルマントパラメータFb=
(f1’,f2’,…fn’)から音声を合成する。こ
れにより、話者Aと話者Bとの中間の音声が得られる。
【0029】(3)第3モードの説明 第3モードが設定されている場合の動作について説明す
る。
る。
【0030】話者Aの音声が入力音声として、音声分析
部1に入力される。音声分析部1では、入力音声を分析
し、音声合成パラメータを生成する。この例では、音声
分析部1では、入力音声波形のフォルマントパラメータ
Fa=(f1,f2,…fn)が抽出される。
部1に入力される。音声分析部1では、入力音声を分析
し、音声合成パラメータを生成する。この例では、音声
分析部1では、入力音声波形のフォルマントパラメータ
Fa=(f1,f2,…fn)が抽出される。
【0031】変換係数制御部4では、話者Aに対するフ
ォルマントパラメータFaを話者Bに対するフォルマン
トパラメータFbに変換するための変換係数wから、話
者Aと話者Bとの中間の音声を得るための変換係数Wを
上記数式2に基づいて生成する。
ォルマントパラメータFaを話者Bに対するフォルマン
トパラメータFbに変換するための変換係数wから、話
者Aと話者Bとの中間の音声を得るための変換係数Wを
上記数式2に基づいて生成する。
【0032】第3モードが設定されている場合には、変
換係数制御部4では、数式2の変換係数W中のxを0か
ら1に徐々に変化させる。単位時間に対するxの変化
量、すなわちxの変化率は、操作部5によって指定され
る。
換係数制御部4では、数式2の変換係数W中のxを0か
ら1に徐々に変化させる。単位時間に対するxの変化
量、すなわちxの変化率は、操作部5によって指定され
る。
【0033】音声合成パラメータ変換部2では、変換係
数制御部4によって生成された変換係数W(=x・w+
y)を用いて、数式1によりフォルマントパラメータF
a=(f1,f2,…fn)をFb=(f1’,f
2’,…fn’)に変換する。変換係数W(=x・w+
y)中のxが0から1に徐々に変化するので、数式1に
より得られるフォルマントパラメータFb=(f1’,
f2’,…fn’)も、話者Aの音声に対応するものか
ら、話者Bの音声に対応するものに徐々に変化する。
数制御部4によって生成された変換係数W(=x・w+
y)を用いて、数式1によりフォルマントパラメータF
a=(f1,f2,…fn)をFb=(f1’,f
2’,…fn’)に変換する。変換係数W(=x・w+
y)中のxが0から1に徐々に変化するので、数式1に
より得られるフォルマントパラメータFb=(f1’,
f2’,…fn’)も、話者Aの音声に対応するものか
ら、話者Bの音声に対応するものに徐々に変化する。
【0034】音声合成部3では、音声合成パラメータ変
換部2によって得られたフォルマントパラメータFb=
(f1’,f2’,…fn’)から音声を合成する。し
たがって、合成された音声は、話者Aの音声から話者B
の音声に徐々に変化していく。
換部2によって得られたフォルマントパラメータFb=
(f1’,f2’,…fn’)から音声を合成する。し
たがって、合成された音声は、話者Aの音声から話者B
の音声に徐々に変化していく。
【0035】上記実施の形態では、音声合成パラメータ
としてフォルマントパラメータ(フォルマント周波数と
その帯域幅とを表すパラメータ)が用いられているが、
音声合成パラメータとして線スペクトル対( LSP: li
ne spectral pair) 、パーコール(PARCOR:part
ial auto correlation) 、ケプストラム(Cepstrum)や調
音パラメータ等を用いてもよい。
としてフォルマントパラメータ(フォルマント周波数と
その帯域幅とを表すパラメータ)が用いられているが、
音声合成パラメータとして線スペクトル対( LSP: li
ne spectral pair) 、パーコール(PARCOR:part
ial auto correlation) 、ケプストラム(Cepstrum)や調
音パラメータ等を用いてもよい。
【0036】
【発明の効果】この発明によれば、第1の話者の入力音
声から、第1の話者と第2の話者との中間の出力音声を
得ることができる。
声から、第1の話者と第2の話者との中間の出力音声を
得ることができる。
【0037】この発明によれば、第1の話者の入力音声
に基づいて、第1の話者の音声から第2の話者の音声に
徐々に変化していく出力音声を得ることができる。
に基づいて、第1の話者の音声から第2の話者の音声に
徐々に変化していく出力音声を得ることができる。
【図1】音声変換装置の概略構成を示す構成図である。
1 音声分析部 2 音声合成パラメータ変換部 3 音声合成部 4 変換係数制御部 5 操作部
Claims (2)
- 【請求項1】 第1の話者の入力音声から音声合成パラ
メータを抽出し、抽出された音声合成パラメータを変換
係数を用いて変換し、変換された音声合成パラメータか
ら音声を合成することにより入力音声を第2の話者の音
声に変換する音声変換装置において、 合成音声が第1の話者の音声から第2の話者の音声に徐
々に接近していくように、変換係数を徐々に変化させて
いく変換係数制御手段、 入力音声から音声合成パラメータを抽出する音声分析手
段、 音声分析手段によって抽出された音声合成パラメータ
を、変換係数制御手段によって生成された変換係数を用
いて変換する音声合成パラメータ変換手段、および音声
合成パラメータ変換手段によって得られた音声合成パラ
メータに基づいて音声を合成する音声合成手段、 を備えていることを特徴とする音声変換装置。 - 【請求項2】 変換係数の時間に対する変化の割合を設
定するための設定手段が設けられており、変換係数制御
手段は、設定手段によって設定された変化の割合で、変
換係数を変化させていくものである請求項1に記載の音
声変換装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30917695A JP3354363B2 (ja) | 1995-11-28 | 1995-11-28 | 音声変換装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30917695A JP3354363B2 (ja) | 1995-11-28 | 1995-11-28 | 音声変換装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09146597A JPH09146597A (ja) | 1997-06-06 |
JP3354363B2 true JP3354363B2 (ja) | 2002-12-09 |
Family
ID=17989854
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP30917695A Expired - Fee Related JP3354363B2 (ja) | 1995-11-28 | 1995-11-28 | 音声変換装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3354363B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4720974B2 (ja) * | 2004-12-21 | 2011-07-13 | 株式会社国際電気通信基礎技術研究所 | 音声発生装置およびそのためのコンピュータプログラム |
JP4928465B2 (ja) | 2005-12-02 | 2012-05-09 | 旭化成株式会社 | 声質変換システム |
-
1995
- 1995-11-28 JP JP30917695A patent/JP3354363B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH09146597A (ja) | 1997-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2763322B2 (ja) | 音声処理方法 | |
JP4624552B2 (ja) | 狭帯域言語信号からの広帯域言語合成 | |
JP6024191B2 (ja) | 音声合成装置および音声合成方法 | |
EP2555188B1 (en) | Bandwidth extension apparatuses and methods | |
JP4170217B2 (ja) | ピッチ波形信号生成装置、ピッチ波形信号生成方法及びプログラム | |
EP1701336B1 (en) | Sound processing apparatus and method, and program therefor | |
EP1806740B1 (en) | Pitch converting apparatus | |
CN109416911B (zh) | 声音合成装置及声音合成方法 | |
JPWO2004049304A1 (ja) | 音声合成方法および音声合成装置 | |
JPH11327595A (ja) | スペクトロ―テンポラル自己相関を用いたピッチ決定装置及び方法 | |
JP2002082685A (ja) | 音声帯域拡張装置及び音声帯域拡張方法 | |
US6513007B1 (en) | Generating synthesized voice and instrumental sound | |
JP3354363B2 (ja) | 音声変換装置 | |
JPH03136100A (ja) | 音声処理方法及び装置 | |
US5864796A (en) | Speech synthesis with equal interval line spectral pair frequency interpolation | |
JPH04358200A (ja) | 音声合成装置 | |
US20030118176A1 (en) | Telephone apparatus | |
JP4757971B2 (ja) | ハーモニー音付加装置 | |
JP2001117600A (ja) | 音声信号処理装置および音声信号処理方法 | |
JP2003271200A (ja) | 音声合成方法および音声合成装置 | |
JP3414150B2 (ja) | コーラス効果付与装置 | |
JP3125951B2 (ja) | フォルマント制御方法 | |
JP2000242287A (ja) | 発声補助装置およびプログラム記録媒体 | |
JP2001312300A (ja) | 音声合成装置 | |
JP2535807B2 (ja) | 音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070927 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080927 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |