JPH08254992A - 話速変換装置 - Google Patents

話速変換装置

Info

Publication number
JPH08254992A
JPH08254992A JP7058665A JP5866595A JPH08254992A JP H08254992 A JPH08254992 A JP H08254992A JP 7058665 A JP7058665 A JP 7058665A JP 5866595 A JP5866595 A JP 5866595A JP H08254992 A JPH08254992 A JP H08254992A
Authority
JP
Japan
Prior art keywords
section
expansion
contraction ratio
contraction
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7058665A
Other languages
English (en)
Inventor
Hideki Kojima
英樹 小島
Akihiro Kimura
晋太 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP7058665A priority Critical patent/JPH08254992A/ja
Publication of JPH08254992A publication Critical patent/JPH08254992A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 本発明は入力音声の話速を変換して出力する
話速変換装置に関し、話速を遅くする場合でも自然で聞
き取りやすい音声を出力する話速変換装置の実現を目的
とする。 【構成】 入力音声信号を音声区間と無音区間とに分割
する区間分割部と、指定された伸縮倍率と予め設定され
た閾値とを比較して、該指定伸縮倍率が該閾値未満であ
る場合は入力伸縮倍率を音声区間の伸縮倍率として決定
し、該指定伸縮倍率が該閾値以上である場合は該閾値を
音声区間の伸縮倍率として決定すると共に、前記入力伸
縮倍率に基づいて無音区間の伸縮倍率を決定する伸縮倍
率決定部と、前記伸縮倍率決定部が決定した音声区間の
伸縮倍率により音声区間を伸縮して出力する音声区間伸
縮部と、前記伸縮倍率決定部が決定した前記無音区間の
伸縮倍率により無音区間を伸縮して出力する無音区間伸
縮部と、前記伸縮された音声区間と前記伸縮された無音
区間とを接続して出力する区間接続部とを備えて構成す
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は入力音声の話速を変換し
て出力する話速変換装置に関するものである。
【0002】
【従来の技術】近年、入力音声の話速を変換して出力す
る話速変換装置が実現しつつある。この話速変換装置に
は様々な用途がある。例えば留守番電話等で実際の話速
よりも高速再生することにより利便性を高めることがで
き、また語学学習等で外国語を聞き取りやすくするため
に話速を遅くしたりすることができる。特に聴覚障害者
や高齢者にとっては早口で話された音声は大変聞き取り
づらいので、話速を遅くして出力する話速変換装置は大
変有用なものとなる。
【0003】音声波形は図5に示すように略同一の波形
を複数回繰り返して形成される。この繰り返し周期のこ
とをピッチ周期という。話速変換装置はこの音声波形を
ピッチ単位で切りだして、切り出した1周期波形を所定
のアルゴリズムで原波形に挿入していくことにより話速
を遅くし、また原波形から所定のアルゴリズムで1周期
波形を間引いていくことにより話速を速くする。
【0004】
【発明が解決しようとする課題】しかし全ての音声波形
について上述の伸縮処理を行った場合は、話速を遅くし
すぎると人間の聴覚では話している内容が聞き取りにく
くなってしまう。この理由を図6を用いて、ワ(wa)とい
う音を発音することを例にして説明図する。この図6で
は説明のため、実際の音声波形に代えて記号を用いて表
現している。記号wは各時間軸上で子音wの1周期波形
が存在する部分であり、記号aは各時間軸上で母音aの
1周期波形が存在する部分のことを示すものである。
【0005】時間軸(a)は人間が一般的な速さでwaの音
を発音した場合の例であり、子音wの1周期波形と母音
aの1周期波形とがそれぞれ複数回繰り返してwaの音声
波形が形成される。そして人間が時間軸(a)よりもゆ
っくり話をする場合には、時間軸(b)に示すように子音
wはほとんで長さが変わらず、母音aだけを長く伸ばす
ように発音がなされる。
【0006】ところがこれを話速変換装置を用いて音を
伸ばそうとすると、時間軸(c)に示すように子音wと母
音aとが同じ割合で伸長されてしまうことになる。この
ような音声波形は人間の通常な会話では発音されない極
めて不自然な音声であり、人間の耳には非常に聞き取り
にくいものである。子音と母音とを区別して抽出し、母
音だけを伸長するようにできれば望ましいのであるが、
現在の音声認識技術では単語等の抽出を行うのが限界で
あり、一つ一つの音を認識して切り出す技術は実現して
いないので、子音と母音とを切りわけて処理をすること
は大変に困難である。
【0007】そこで、入力信号から無音区間を抽出し
て、この無音区間だけを伸長して話速を遅くすることが
考案されている。入力信号から音声区間と無音区間とを
区別することは、例えばパワーを計算して閾値よりもパ
ワーが大きい区間を音声区間として抽出する、等の方法
により容易になし得る。しかし無音区間のみを引き延ば
す方法では話速を遅くしても肝心の音声区間が遅くなら
ないので、ゆっくり話しているという感じが得られなか
った。
【0008】本発明はこのような課題に鑑みなされたも
のであり、話速を遅くした場合も自然で聞き取りやすい
音声を出力し得る話速変換装置の実現を目的とする。
【0009】
【課題を解決するための手段】本発明の話速変換装置
は、上記の目的を解決するために、音声区間の伸縮率に
規制(閾値)を設け、一定値以上の伸縮は行わず、指定
された伸縮率に変えて規定の伸縮率(閾値)で伸縮する
ことによって、伸縮された音声の自然さを維持しようと
したことに特徴がある。
【0010】具体的には、第一の発明(請求項1)の話
速変換装置は、図1に示すように、入力音声信号を音声
区間と無音区間とを分割する区間分割部と、指定された
伸縮倍率と予め設定された閾値とを比較して、該指定伸
縮倍率が該閾値未満である場合は該指定伸縮倍率を音声
区間の伸縮倍率として決定し、該指定伸縮倍率が該閾値
以上である場合は該閾値を音声区間の伸縮倍率として決
定すると共に、前記指定伸縮倍率に基づいて無音区間の
伸縮倍率を決定する伸縮倍率決定部と、前記伸縮倍率決
定部が決定した音声区間の伸縮倍率により音声区間を伸
縮して出力する音声区間伸縮部と、前記伸縮倍率決定部
が決定した前記無音区間の伸縮倍率により無音区間を伸
縮して出力する無音区間伸縮部と、前記伸縮された音声
区間と前記伸縮された無音区間とを接続して出力する区
間接続部とを備えて構成したことを特徴とする。
【0011】また第二の発明(請求項3)の話速変換装
置は、図2に示すように、入力音声信号を声帯の振動に
より発せられる音が存在する有声区間と、声帯を振動さ
せずに発せられる音が存在する無声区間と、いずれの音
も存在しない無音区間とに分割する区間分割部と、指定
された伸縮倍率と予め設定された閾値とを比較して、該
指定伸縮倍率が該閾値未満である場合は指定伸縮倍率を
有声区間の伸縮倍率として決定し、該指定伸縮倍率が該
閾値以上である場合は該閾値を有声区間の伸縮倍率とし
て決定すると共に、前記指定伸縮倍率に基づいて無音区
間の伸縮倍率を決定する伸縮倍率決定部と、前記伸縮倍
率決定部が決定した有声区間の伸縮倍率により有声区間
を伸縮して出力する有声区間伸縮部と、前記伸縮倍率決
定部が決定した前記無音区間の伸縮倍率により無音区間
を伸縮して出力する無音区間伸縮部と、前記伸縮された
有声区間と前記伸縮された無音区間と前記無声区間とを
接続して出力する区間接続部とを備えて構成したことを
特徴とする。
【0012】なお、請求項1と請求項3の構成におい
て、区間検出部は無音区間を検出した場合は該無音区間
の長さが一定長を超える場合にのみ無音区間として認識
し、無音区間伸縮部に送出するように構成することがよ
り望ましい(請求項2,請求項4)。
【0013】
【作用】請求項1の発明は、図1の原理図に示すよう
に、ユーザが指定した指定伸縮倍率と予め設定された閾
値とを比較して、指定伸縮倍率が閾値より小さい場合は
この入力伸縮倍率のとおりに音声区間を伸縮させ、指定
伸縮倍率が閾値より大きい場合は閾値を伸縮倍率として
音声区間を伸長するように構成したことに特徴がある。
これによりユーザが話速を遅くすることを指定した場合
には音声区間も遅くなるので実際にゆっくり話している
という感じが得られる。またユーザが一定倍率(閾値)
以上話速を遅くすることを指定した場合は、音声区間に
ついては該一定倍率までしか伸長させないが、無音区間
については指定伸縮倍率に基づいて伸長を行った後で、
伸長された音声区間と伸長された無音区間とを接続す
る。これにより、指定伸縮倍率が大きい場合でも、音声
区間が遅くなりすぎて不自然な発音になることを防ぐこ
とができる。なお、無音区間の伸縮倍率については指定
伸縮倍率をそのまま適用して良いが、前記閾値にも基づ
いて伸縮倍率を決定するようにして、音声区間が一定値
(閾値)以上には伸長されない分、その分無音区間の伸
長倍率を高くすれば、生成される出力信号の入力信号に
対する伸縮倍率は、指定された伸縮倍率に近いものが得
られる。
【0014】また請求項3の発明では、音声区間を更に
有声区間と無声区間とに分割し、有声区間のみを閾値ま
で伸長させて、無声区間は伸長させないようにした。こ
こで定義する「有声」とは声帯を振動させて発音する音
のことであり、全ての母音と、一部の子音(b,w,y,z等)
がこれに該当する。一方「無声」とは声帯を振動させず
に発音される音のことであり、子音の一部(k,s,h等) が
これに該当する。
【0015】このように構成したのは、「発明が解決し
ようとする課題」の項で説明したように、音声の伸長を
人間の自然な発音に近くするためには、子音は伸長させ
ずに母音のみを伸長することが望ましいのであるが、実
際には子音区間と母音区間とをリアルタイムに解析して
分割するのが困難であるので、有声区間と無声区間とに
分割することにより代替したものである。有声区間と無
声区間とは、例えば低域パワーを調べ、低域パワーが閾
値以上であれば有声区間とみなし、低域パワーが閾値以
下であれば無声区間とみなすようにすることにより、容
易に分割できる(声帯を振動させる「有声」は低域周波
数成分が多く、声帯を振動させないで発生させる「無
声」は高域周波数成分が多いため)。
【0016】無声区間は必ず子音であるので、これを伸
長させなければ、子音が伸長され過ぎて不自然な感じと
なることを防ぐことができる。このため請求項3の発明
は、請求項1の発明よりも更に人間の発音に近い伸長音
声が得られる。但し、上記のように有声区間にも子音が
含まれるので、これを伸長させすぎるとやはり不自然と
なってしまうので、閾値以上には伸長させないようにし
た。
【0017】また、無音区間の中には言葉そのものが発
音されていない合間だけではなく、破裂音(p) を発音し
た時などにも短い無音区間が生じる場合がある。このよ
うな無音区間も伸長させてしまうとかえって聞き取りに
くくなるので、請求項2または請求項4に記載したよう
に、無音区間を検出した場合はどれくらい連続している
かを調べ、一定長以上のときのみ伸縮処理をするように
し、一定長以下の場合は伸縮処理をしないように構成す
るのが望ましい。
【0018】
【実施例】以下、本発明の実施例を図面を参照して説明
する。図3は本発明の一実施例の構成を示すブロック図
である。なお、本実施例は本発明の請求項3に記載の発
明に関するものである。請求項1に記載の発明について
はこれを簡略化することにより実現できるので、後で図
3の実施例との相違点のみを説明することにする。
【0019】図3中で、請求項3の発明の原理図である
図2と同一の構成要件については、同一の参照符号を付
与している。また図3のパワー検出部211,無音区間検出
部212,低域パワー計算部213,有声区間検出部214 は図2
の区分分割部21を構成するものであり、図3のピッチ算
出部231,ローパスフィルタ部232,ピークピッキング部23
3,有声区間伸縮処理部234 は図2の有声区間伸縮部23を
構成するものである。また伸縮倍率決定部22には閾値記
憶部221 が接続されている。更に本実施例では音声波形
をデジタル信号として取り扱うものであるので、入力音
声波形をデジタル信号化するA/Dコンバータ26と、伸
縮処理がなされたデジタル信号をアナログ音声信号に変
換して出力するD/Aコンバータ27を設けている。
【0020】以下、本実施例の動作について説明する。
入力音声信号はA/Dコンバータ26によってデジタル信
号化された後、一定時間毎 (数〜数十ms程度) に分割さ
れる。この分割された処理単位をフレームと称する。パ
ワー計算部211 で入力音声のフレーム毎にパワーを計算
し、無音区間検出部212 は算出されたパワーと閾値とを
比較して、パワーが小さいフレームを無音区間とみな
す。無音区間検出部212 で無音区間であるとみなされた
フレームについては、後続するフレームをも調べてい
き、無音区間のフレームがどれくらいの長さ(期間)で
連続するかを調べる。もしも無音区間が一定長より短い
場合(フレーム数が所定数より少ない場合)は、これは
無音区間とみなさず、そのフレームは無声区間とみなし
て後述する処理を行う。
【0021】これは上述したように、破裂音(p) を発音
した時などに生じる短い無音区間も伸長させてしまうと
かえって聞き取りにくくなるので、これを防ぐためであ
る。そして一定長以上続く無音区間の各フレームは後述
するように無音区間伸縮部で伸縮処理がなされる。一方
無音区間以外のフレームについては、まず低域パワー計
算部213 にて低域パワーが計算される。そして有声区間
検出部214 では算出された低域パワーと閾値とを比較し
て、低域パワーが閾値より大きいフレームを有声区間と
みなし、低域パワーが閾値より小さいフレームについて
は無声区間とみなす。
【0022】有声区間と判定されたフレームについて
は、伸縮倍率決定部22が指定した伸縮倍率に基づいて音
声波形の伸縮がなされる。この伸縮処理を図4を用いて
説明する。まずフレーム内の原波形(a)について、その
平均ピッチ周期をピッチ算出部231にて算出する。この
平均ピッチ周期は、例えば自己相関分析(原波形と、原
波形をシフトさせた参照波形とを乗算していくことによ
り相関値を求め、最も相関値が高い参照波形のシフト量
を平均ピッチ周期とする)により算出できる。ローパス
フィルタ232 ではピッチ算出部231 にて算出した平均ピ
ッチ周波数よりやや高めのカットオフ周波数で音声波形
を低域濾波し、正弦波状の連続波形(b) を生成する。
ピークピッキング部233 はこの連続波形(b) からピー
クピッキング(波の頂点を抽出する)を行って、このピ
ークを基に音声波形をピッチ単位で1周期波形毎に分割
して、有声区間伸縮処理部234 に通知する。
【0023】有声区間伸縮処理部234 は、ピークピッキ
ング部233 が求めた1周期波形の区切りを基に対応する
原波形(a)を1周期波形毎に分割し、伸縮倍率決定部22
より通知された伸縮倍率にて音声波形の伸縮を行い、区
間接続部25に出力する。この伸縮方法としては、例えば
前記日本音響学会誌50巻7 号の509 〜520 頁に開示され
ている方法がある。これを音声の伸長処理のみについて
簡単に説明する(短縮方法については省略する)。
【0024】ピークピッキング部233 によりピッチ周期
で分割された1周期波形を、説明上、図4(c)に示すよ
うにa,b,c,…と記号を付与する。一方この原波形
の時間軸(c)を時間軸上で一様に引き延ばしたものを図
4(d)とする。そして原波形の1周期波形を、この時間
軸(d)(a’,b’,…)に順次当てはめていくことに
より、伸長波形を生成する。時間軸(d)上のa’の区間
は、原波形aに対応する部分であるので、最初の周期に
ついては波形aをそのままあてはめば良い。しかし次の
周期については波形aをそのままあてはめた場合、時間
軸(d)上のb’の区間にまでまたがってしまう。このた
めこの部分には波形bを当てはめた方が原波形により近
似した波形となる可能性がある。このためこの部分に波
形aをあてはめた場合に波形aと区間a’との重複部分
a”が区間a’にどれくらい重複しているかを示す重複
率a”/a’と、波形bを当てはめた場合に波形bと区
間b’との重複部分b”が区間b’にどれくらい重複し
ているかを示す重複率b”/b’とを比較して、重複率
の大きい方の波形を採用して当てはめる。このように、
伸長した時間軸(d)との重複率が最も大きくなるよう
に、原波形の1周期波形を当てはめていくことにより、
伸長処理を行う。
【0025】無音区間伸縮部24では無音区間とされたフ
レームについて、伸縮倍率決定部22より通知された伸縮
倍率にて延長または短縮を行い区間接続部25に出力す
る。伸縮された有声区間のフレームと、伸縮された無音
区間のフレームと、無声区間のフレーム(有声区間検出
部214 よりそのまま送出される) は、入力音声でのフレ
ームの順番に合わせて区間接続部25で接続される。区間
接続部25の出力はD/Aコンバータ27にてアナログ音声
信号に変換されて出力される。
【0026】次に、伸縮倍率決定部25による有声区間,
無音区間それぞれの伸縮倍率の決定方法について説明す
る。前述したように伸縮倍率決定部22には閾値記憶部22
1 が接続されている。この閾値記憶部221 が記憶する閾
値は、ユーザの入力により設定しても良く、また予め固
定値をROMに記憶させるようにしても良い。
【0027】入力された伸縮倍率が閾値記憶部221 に設
定された閾値倍率未満である場合は、この入力伸縮倍率
を有声区間、無音区間それぞれの伸縮倍率として採用
し、有声区間伸縮処理部234,無音区間伸長部24を制御す
る。一方先述したように、有声区間は伸長倍率が大きす
ぎると有声である子音区間が長くなり過ぎる場合が生じ
るので、指定された伸縮倍率が閾値以上である場合は閾
値を有声区間の閾値として採用し、これ以上の伸長は行
わない。
【0028】一方無音区間については指定伸縮倍率をそ
のまま用いて伸縮処理を行っても良いが、入力音声信号
に対して指定伸縮倍率にまで伸長された出力音声信号を
得るためには、有声区間の伸長倍率が一定値に規制され
る分、無音区間の伸長倍率をより大きくした方が良い。
この無音区間の伸縮倍率の求めかたは様々なものが考え
られるが、例えば下記の式を適用することが考えられ
る。 無音区間伸縮倍率=2×入力伸縮倍率−閾値(有声区間
伸縮倍率) 上式での係数の2は一例であり、使用実績をみて適宜変
更しても良い。また上式によれば伸縮倍率が入力伸縮倍
率のみに基づいて算出している。厳密に言えば入力音声
の有声区間と無音区間との比率により、得られる出力音
声の長さと入力音声×入力伸縮倍率との値が異なること
になるが、実際の会話では有声区間と無音区間との比率
が極端に異なる場合はまず無いので、実用上では十分で
ある。
【0029】勿論精度をより高めたい場合には無音区間
と有声区間との長さをフレームの数をカウントして求
め、両者の実際の長さに基づいて伸縮倍率決定部22が動
的に無音区間の伸縮倍率を変えても良い。但し本発明の
話速変換装置は人間が聞き取りやすい音声を得られれば
目的は達成されるので、実用上は無音区間の倍率は固定
でも問題はなく、あえて処理を重くする必要性は小さい
と考えられる。
【0030】また無声区間については伸縮処理をしてい
ないが、これも無声区間は音声区間に占める割合が小さ
いので、特に実用上の問題は無い。以上、本発明の請求
項3に係わる実施例について説明したが、請求項1に記
載の発明は、音声区間を有声区間と無声区間に分割せず
に処理を行うものであるので、上記実施例の構成を簡略
化することにより実現できる。
【0031】即ち、低域パワー213 と有声区間検出部21
4 を省略し、無音区間検出部の出力を直接ピッチ算出部
231 に入力するようにして、上記実施例に記載した有声
区間の伸縮処理と同様の処理を、音声区間について実行
するように構成すれば良い。
【0032】
【発明の効果】以上説明したように、本発明の話速変換
装置によれば、話速を遅くするように指定した場合には
無音区間または有声区間の伸長がなされるので実際にゆ
っくり話しているという感じが得られるものであり、か
つ、一定閾値以上には伸長させないので、音声が遅くな
り過ぎて(特に子音の区間が延び過ぎて)聞き取れなく
なることが無いという理想的な話速変換音声を得ること
ができる。
【図面の簡単な説明】
【図1】本発明の請求項1の原理図である。
【図2】本発明の請求項3の原理図である。
【図3】本発明の一実施例の構成を示すブロック図であ
る。
【図4】本発明の一実施例における有声区間の伸長処理
を説明する図である。
【図5】音声波形の一例を示す図である。
【図6】従来技術による音声伸長処理とその問題点を説
明する図である。
【符号の説明】
11,21 区間分類部 12,22 伸縮倍率決定部 13 音声区間伸縮部 23 有声区間伸縮部 14,25 無音区間伸縮部 15,25 区間接続部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】入力音声信号を音声区間と無音区間とに分
    割する区間分割部と、 指定された伸縮倍率と予め設定された閾値とを比較し
    て、該指定伸縮倍率が該閾値未満である場合は該指定伸
    縮倍率を音声区間の伸縮倍率として決定し、該指定伸縮
    倍率が該閾値以上である場合は該閾値を音声区間の伸縮
    倍率として決定すると共に、前記指定伸縮倍率に基づい
    て無音区間の伸縮倍率を決定する伸縮倍率決定部と、 前記伸縮倍率決定部が決定した音声区間の伸縮倍率によ
    り音声区間を伸縮して出力する音声区間伸縮部と、 前記伸縮倍率決定部が決定した前記無音区間の伸縮倍率
    により無音区間を伸縮して出力する無音区間伸縮部と、 前記伸縮された音声区間と前記伸縮された無音区間とを
    接続して出力する区間接続部とを備えて構成したことを
    特徴とする話速変換装置。
  2. 【請求項2】前記区間分割部は、無音区間を検出した際
    には該無音区間の長さが一定長を超える場合にのみ無音
    区間として認識し、無音区間伸縮部に送出することを特
    徴とする請求項1に記載の話速変換装置。
  3. 【請求項3】入力音声信号を声帯の振動により発せられ
    る音が存在する有声区間と、声帯を振動させずに発せら
    れる音が存在する無声区間と、いずれの音も存在しない
    無音区間とに分割する区間分割部と、 指定された伸縮倍率と予め設定された閾値とを比較し
    て、該指定伸縮倍率が該閾値未満である場合は指定伸縮
    倍率を有声区間の伸縮倍率として決定し、該指定伸縮倍
    率が該閾値以上である場合は該閾値を有声区間の伸縮倍
    率として決定すると共に、前記指定伸縮倍率に基づいて
    無音区間の伸縮倍率を決定する伸縮倍率決定部と、 前記伸縮倍率決定部が決定した有声区間の伸縮倍率によ
    り有声区間を伸縮して出力する有声区間伸縮部と、 前記伸縮倍率決定部が決定した前記無音区間の伸縮倍率
    により無音区間を伸縮して出力する無音区間伸縮部と、 前記伸縮された有声区間と前記伸縮された無音区間と前
    記無声区間とを接続して出力する区間接続部とを備えて
    構成したことを特徴とする話速変換装置。
  4. 【請求項4】前記区間分割部は、無音区間を検出した際
    には該無音区間の長さが一定長を超える場合にのみ無音
    区間として認識し、無音区間伸縮部に送出することを特
    徴とする請求項2に記載の話速変換装置。
JP7058665A 1995-03-17 1995-03-17 話速変換装置 Withdrawn JPH08254992A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7058665A JPH08254992A (ja) 1995-03-17 1995-03-17 話速変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7058665A JPH08254992A (ja) 1995-03-17 1995-03-17 話速変換装置

Publications (1)

Publication Number Publication Date
JPH08254992A true JPH08254992A (ja) 1996-10-01

Family

ID=13090891

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7058665A Withdrawn JPH08254992A (ja) 1995-03-17 1995-03-17 話速変換装置

Country Status (1)

Country Link
JP (1) JPH08254992A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998049673A1 (fr) * 1997-04-30 1998-11-05 Nippon Hoso Kyokai Procede et dispositif destines a detecter des parties vocales, procede de conversion du debit de parole et dispositif utilisant ce procede et ce dispositif
JP2000242300A (ja) * 1999-02-22 2000-09-08 Nippon Telegr & Teleph Corp <Ntt> 音声速度変換装置、音声速度変換方法および音声速度変換方法を実行するプログラムを記録した記録媒体
JP2008058956A (ja) * 2006-07-31 2008-03-13 Matsushita Electric Ind Co Ltd 音声再生装置
JP2009105666A (ja) * 2007-10-23 2009-05-14 Panasonic Electric Works Co Ltd 拡声通話装置
JP2015156550A (ja) * 2014-02-20 2015-08-27 富士通株式会社 音声通信装置および音声処理プログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998049673A1 (fr) * 1997-04-30 1998-11-05 Nippon Hoso Kyokai Procede et dispositif destines a detecter des parties vocales, procede de conversion du debit de parole et dispositif utilisant ce procede et ce dispositif
US6236970B1 (en) 1997-04-30 2001-05-22 Nippon Hoso Kyokai Adaptive speech rate conversion without extension of input data duration, using speech interval detection
JP2000242300A (ja) * 1999-02-22 2000-09-08 Nippon Telegr & Teleph Corp <Ntt> 音声速度変換装置、音声速度変換方法および音声速度変換方法を実行するプログラムを記録した記録媒体
JP2008058956A (ja) * 2006-07-31 2008-03-13 Matsushita Electric Ind Co Ltd 音声再生装置
JP2009105666A (ja) * 2007-10-23 2009-05-14 Panasonic Electric Works Co Ltd 拡声通話装置
JP2015156550A (ja) * 2014-02-20 2015-08-27 富士通株式会社 音声通信装置および音声処理プログラム

Similar Documents

Publication Publication Date Title
US8898055B2 (en) Voice quality conversion device and voice quality conversion method for converting voice quality of an input speech using target vocal tract information and received vocal tract information corresponding to the input speech
US7010488B2 (en) System and method for compressing concatenative acoustic inventories for speech synthesis
JPH031200A (ja) 規則型音声合成装置
JP2002082685A (ja) 音声帯域拡張装置及び音声帯域拡張方法
JPH0632020B2 (ja) 音声合成方法および装置
JP3439307B2 (ja) 発声速度変換装置
JPH0193795A (ja) 音声の発声速度変換方法
JPH09325798A (ja) 音声認識装置
JPH08254992A (ja) 話速変換装置
JP2904279B2 (ja) 音声合成方法および装置
Pfitzinger Unsupervised speech morphing between utterances of any speakers
JPH05307395A (ja) 音声合成装置
JP3432443B2 (ja) 音声速度変換装置、音声速度変換方法および音声速度変換方法を実行するプログラムを記録した記録媒体
JP3575919B2 (ja) テキスト音声変換装置
JPH1083193A (ja) 音声合成装置および音声素片作成方法
JP2001350500A (ja) 話速変更装置
JP2006038956A (ja) 音声速度遅延装置及び方法
JP3750676B2 (ja) 音声合成装置および音声合成方法
JPH10224898A (ja) 補聴器
JP2004139049A (ja) 話者正規化方法及びそれを用いた音声認識装置
JPH07210192A (ja) 出力データ制御方法及び装置
JPH02293900A (ja) 音声合成装置
JP3302075B2 (ja) 合成パラメータ変換方法および装置
JP5677137B2 (ja) 韻律変換装置およびプログラム
Inbanila et al. Investigation of Speech Synthesis, Speech Processing Techniques and Challenges for Enhancements

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20020604