JP3249567B2 - 話速変換方法および装置 - Google Patents

話速変換方法および装置

Info

Publication number
JP3249567B2
JP3249567B2 JP05178792A JP5178792A JP3249567B2 JP 3249567 B2 JP3249567 B2 JP 3249567B2 JP 05178792 A JP05178792 A JP 05178792A JP 5178792 A JP5178792 A JP 5178792A JP 3249567 B2 JP3249567 B2 JP 3249567B2
Authority
JP
Japan
Prior art keywords
section
speech
voice
voiced
speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP05178792A
Other languages
English (en)
Other versions
JPH05257490A (ja
Inventor
龍 池沢
章 中村
栄一 宮坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP05178792A priority Critical patent/JP3249567B2/ja
Priority to US07/950,411 priority patent/US5305420A/en
Priority to EP96119237A priority patent/EP0766229B1/en
Priority to DK92116292T priority patent/DK0534410T3/da
Priority to DK96119237T priority patent/DK0766229T3/da
Priority to EP92116292A priority patent/EP0534410B1/en
Publication of JPH05257490A publication Critical patent/JPH05257490A/ja
Application granted granted Critical
Publication of JP3249567B2 publication Critical patent/JP3249567B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、聴覚障害者や高齢者等
の音声聴取に好適な話速変換方法および装置に関する。
【0002】
【発明の概要】本発明は、聴覚障害者や高齢者等の音声
聴取に好適な話速変換方法および装置に関するものであ
って、受聴音声の発声する速さ(話速)を遅くする際
に、文章間の無音区間を聴感上違和感のない範囲で最短
に短縮し、かつ話速を一定の規則に基づいて変化させる
ことにより、発話時間を原音声の発話時間に保ったまま
全体としてゆっくりとした聴きやすい良好な音声に変換
することを図るものである。
【0003】
【従来の技術】品質を保ったまま、話速を変換する技術
自体が発展途上である上、実時間(枠)との「ずれ」を
考慮した技術は未開発である。
【0004】
【発明が解決しようとする課題】音声の話速のみを一様
に遅くすることにより、特に高齢者や聴覚障害者等にと
っては、はるかに聴きやすくすることが可能であるが、
この操作によって音声の発話時間も必然的に伸張する。
しかし、放送や朗読カセット等では、伸張前の音声の発
話時間は、決められた時間内に収まるように発話されて
いるから、このような音声を伸張すると上記制限時間内
に収まらなくなる可能性が生じる。また、テレビジョン
等のように音声と映像を同期して提供するような場合
に、音声のみを伸張すると、映像との間に時間的な「ず
れ」が生じ、これが聞き取りに悪影響を及ぼすことが考
えられる。
【0005】本発明の目的は、上述した時間的な「ず
れ」に伴う問題点を解決するため、発話音声中の意味上
重要な部分の話速は適度に遅くし、それ以外の部分は逆
に速めることによって、発話時間を実質的に伸張させる
ことなく、全体としてゆっくりとした聞きやすい音声に
変換する話速変換方法および装置を提供することにあ
る。
【0006】
【課題を解決するための手段】上記目的を達成するた
め、請求項1の話速変換方法の発明は、受聴音声の発生
する速さ(以下、話速という)を遅くする際に、音声の
ピッチ(基本周波数)の変化に応じて、ピッチの高いと
ころでは話速を緩め、低いところでは話速を早めること
を特徴とする。
【0007】上記目的を達成するため、請求項2の話速
変換方法の発明は、話速を遅くする際に、声立てと次の
声立ての区間を単位にしてこの区間の開始点ではゆっく
りとした話速を設定し、その終了点に向かって音声の基
本周波数の大まかな変化に追従して徐々に話速を早める
ことを特徴とする。
【0008】ここで、話速を遅くする際にさらに、文章
間の無音区間を予め実験で求めた聴感上違和感のない範
囲でできるだけ短い時間に短縮することを特徴とするこ
とができる。また、前記予め実験で求めた聴感上違和感
のない範囲でできるだけ短い時間が、862ms〜ほぼ
1000msの範囲であることを特徴とすることができ
る。
【0009】上記目的を達成するため、請求項5の話速
変換装置の発明は、音声信号を有声、無声、無音の別に
識別する音声識別手段と、該音声識別手段により識別さ
れた無音区間が文章間の無音区間か否かを判定する無音
区間判定手段と、該無音区間判定手段により文章間の無
音区間と判定された場合は当該無音区間を予め実験で求
めた聴感上違和感のない範囲でできるだけ短い時間に短
縮する無音区間短縮手段と、前記音声識別手段により識
別された有声区間が声立て開始のものか否かを判定する
有声区間判定手段と、該有声区間判定手段により声立て
開始と判定された場合は声立てと次の声立ての区間を単
位にしてこの区間の開始点ではゆっくりとした話速を設
定し、その終了点に向かって音声の基本周波数の大まか
な変化に追従して徐々に話速を速める話速変換処理を行
う有声区間伸張手段とを具備したことを特徴とする。
【0010】
【作用】本発明は、受聴音声の発生する速さ(話速)を
遅くする際に、音声のピッチ(基本周波数)の変化に応
じて、ピッチの高いところでは話速を緩め、低いところ
では話速を早めることに特徴がある。また、本発明は、
話速を遅くする際に、声立てと次の声立ての区間を単位
にしてこの区間の開始点ではゆっくりとした話速を設定
し、その終了点に向かって音声の基本周波数の大まかな
変化に追従して徐々に話速を早めることに特徴がある。
【0011】さらに、本発明では、文章間の無音区間に
着目し、文章間の無音区間を予め実験で求めた聴感上違
和感のない範囲でできるだけ短い時間に短縮するように
している。その一例として、その聴感上違和感のない範
囲でできるだけ短い時間が、862ms〜ほぼ1000
msの範囲であるとしている。
【0012】従って、本発明によれば、受聴者の希望に
あったゆっくりとした聴きやすい音声を発話時間が伸張
することなく、実時間の枠内で聴取することが可能にな
る。
【0013】
【実施例】以下、図面を参照して本発明の実施例を詳細
に説明する。
【0014】(1)装置構成 図1に本発明の一実施例の装置構成を示す。音声入力回
路1は音声信号を入力するための一般的な構成の回路で
あり、必要に応じて例えばマイクロホン、音調回路、ア
ナログディジタル変換器、音声記憶再生(録音)回路、
音声記憶媒体(例えば、ICメモリ、ハードディスク、
フロッピーディスクまたはVTR)、およびインタフェ
ース回路等を包含している。CPU(中央演算処理装
置)2は装置全体の制御および演算等を司り、例えば公
知のワンチップマイクロコンピュータやパーソナルコン
ピュータ等が適用できる。プログラムメモリ(PRO
M)3はCPU2が実行する本発明に係わる図2に示す
ような制御手順(プログラム)、およびテーブル、定数
等をあらかじめ格納している。
【0015】入力バッファ4および処理バッファ5はC
PU2が作業域として使用する不図示のRAM(ランダ
ムアクセスメモリ)内に確保されており、音声入力回路
1から入力されたディジタル音声信号は後述のフレーム
単位で順次入力バッファ4に一時格納され、次に入力バ
ッファ4に格納された音声信号は後述のセグメント毎に
処理バッファ5に一時格納される。ファイル6は本発明
に係わる有声区間の伸張と無音区間の短縮の処理を施さ
れた音声信号を格納するメモリであり、例えば上記のR
AMの他に、ICメモリやフロッピーディスク等の音声
記憶媒体が適用できる。
【0016】音声出力回路7はファイル6内の音声信号
を外部に出力するための一般的な構成の回路であり、必
要に応じて例えばインタフェース回路、ディジタルアナ
ログ変換器、スピーカー、録音装置(あるいは放送機
器)等を包含している。なお、後述の図2に示す手順を
公知技術により全てハード化して専用機として構成する
ことも勿論可能である。
【0017】(2)動作例 図2は本発明の一実施例の動作手順を示す。本実施例で
は、受聴音声の発声する速さ(話速)を遅くする際に、
無音区間を聴感上の違和感なく最短に短縮し、かつ発話
音声中の意味上重要な部分は通例音声のピッチ(基本周
波数)が高いところであり、そのピッチの高いところは
通例声立て開始時であるということに着目して、声立て
と次の声立ての区間を単位にしてこの区間の開始点では
ゆっくりとした話速を設定し、終了点に向って音声の基
本周波数の大まかな変化に追随して徐々に話速を速める
ように処理している。
【0018】ステップS1:まず最初に音声入力回路1
からの入力音声信号をフレームと呼ばれる一定長の部分
に切り出し、入力バッファ4に格納する。本実施例で
は、フレーム長は例えば3.3msである。
【0019】ステップS2:フレーム毎に有声、無声、
無音の判定を行う。この判定方法として、一例として公
知の自己相関法と零クロス法を適用できる。勿論その他
の判定方法でもよい。人が発声する有声および無声以外
の入力音(例えば、低レベルの雑音や背景音等)は原則
として無音として処理する。
【0020】ステップS3:今回と前回のフレームの上
記種類が同じであればステップS1に戻り、異なった場
合、例えば有声から無声に変化すれば後段の処理に進
む。これにより同一種類(区間)の音声が入力バッファ
4に格納されることになる。
【0021】ステップS4:1秒間に発声されるモーラ
数の平均から、後述のスレッショールド値Th1,Th
2,Th3を設定する。モーラは、短母音を含む1音節
の長さに相当する。日本語ではほぼ仮名1文字(拗音で
は2字)に相当する。なお、このステップS4の処理は
最初の段階のときだけ、あるいは所定時間毎に行っても
よい。
【0022】ステップS5:無声または無音から始まっ
て有声で終わる区間を1ブロック(Bn :n=1,2,
…)とする。このブロック内ではステップS2の判定に
応じて無音区間(an )、無声区間(bn )、有声区間
(Cn )の3つに大別され、その区間毎に下記の各処理
系に送られる。b1 とc1 の境界の時刻をt1,s と表現
し、初回の声立てをα1とする(図3参照)。
【0023】ステップS6:図3に示すように、n番目
の有声区間の開始点(tn,s )と1つの前の有声区間の
終了点(tn-1,e )との間の時間間隔Tn (Tn =t
n,s −tn-1,e )を算出する。
【0024】ステップS7:Tn と声立てを判別するた
めのスレッショールド値Th1とを比較する。Tn があ
るスレッショールド値Th1を越えた場合には、tn,s
の時点を声立てαm と判断し(図3参照)、ステップS
8に進む。なお、本処理の開始時点で前の有声区間がな
いときは後述のステップS11に飛ぶ。
【0025】ステップS8:1つ前の声立てαm-1 と1
つ前の有声区間の終了点tn-1,e の範囲を1セグメント
とする。図3の例では、T5 =t6,s −t5,e >Th1
とすると、t6,s の時点が声立てα2 、区間(t5,e
1,s )が1セグメントとなる。そして、ステップS1
1,S12,S15の処理によりこれまでに処理バッフ
ァ5に格納されている1セグメントの開始点の有声区間
長の伸張倍率rs を1≦rs ≦2の範囲内であらかじめ
決めた値に設定して伸張する。この伸張倍率をこのセグ
メントの終了点に向って徐々に小さくし、終了点の有声
区間長の伸張倍率re が0.7≦re ≦1となるように
する。図4に図3のセグメント1に属する有声区間の伸
張倍率の求め方の一例を示す。セグメント開始点の有声
区間c1は伸張されてc1 ′=rs ・c1 、c2 はc
2 ′=r2 ・c2 となる。セグメント終了点の有声区間
5 はc5 ′=re ・c5 となるが、re はre ≦1で
あるから、実際的には短縮される。有声区間以外の無音
区間an 、無声区間bn については処理を施さず、不変
である。
【0026】すなわち、一般に声立て部分(一単位の中
の前半部分)の音声は意味上、重要であることが多いの
で、上記のように話速を適度に遅くすることによって聴
きやすさが向上する。話速の変化は、適当な関数f
(t)を用いて変化させる。本実施例では、一例として
図4に示すような余弦関数を用いた。この場合、f
(t)は次式(1)で表現される。
【0027】
【数1】
【0028】ステップS9:ステップS8で話速変換さ
れた音声データをファイル6に落とす。
【0029】ステップS10:処理バッファ5をクリア
する。
【0030】ステップS11:ステップS7でTn ≦T
h1の場合、またはステップS10を処理した場合はこ
のステップS11に進む。ステップS7が否定判定の場
合は有声区間が一単位に収まっていると判断し、この有
声区間を処理バッファ5に蓄える。ステップS10を通
った場合は声立て開始時点の有声区間が処理バッファ5
に蓄えられることになる。入力バッファ4を次の音声デ
ータの処理のためにクリアし、本処理作業の終了指示が
発生されてなければ(ステップS16)ステップS1に
戻る。
【0031】ステップS12:無声区間については、入
力バッファ4から常に処理バッファ5に転送して蓄え
る。その後、入力バッファ4をクリアし、ステップS1
6を経てステップS1に戻る。
【0032】ステップS13:音声の種類別区間が無音
区間の場合は、無音区間の長さと、文章間の区切り(句
点)を判別するためのスレッショールド値Th2とを比
較する。無音区間がTh2を越えた場合、この無音区間
を文章と文章の区切り(句点)と判断し、次のステップ
S14に進み、それ以外はステップS15に飛ぶ。
【0033】ステップS14:句点と判定した無音区間
を以下の手順で短縮する。
【0034】聴感上の違和感なく最短に短縮するため、
短縮無音区間の時間長はスレッショールド値Th3とな
る。無音区間の時間長をan 、削除する区間の時間長を
n、削除後の無音区間の時間長をen とした場合、en
は図5の(B)に示すように、 en =an −dn ・・・(2) となる。この際、分析時の無音範囲の指定誤りから、無
声部分までも長い無音の一部と識別してしまう可能性が
あるため、an の先頭から、dn を削除するのではな
く、図5の(A)に示すように、an の中心点からdn
部分を削除する。また、dn の両端には、数msのテー
パーをかけて平滑化し、これによりクリック音の発生を
防止する。ここでの無音とは前述のように人から発生さ
れた音声以外の音を含むので、この平滑化処理が有用と
なる。
【0035】上式(2)においてen の値はen ≧Th
3での範囲で可変値として設定してもよいが、処理を簡
単にするためen をTh3に近い一定値(例えば862
ms)に設定した場合は、上式(2)からdn はan
より変わる可変値となる。次に、ステップS15に進
む。
【0036】ステップS15:無音区間を処理バッファ
5に蓄える。入力バッファ4をクリアし、ステップS1
6を経てステップS1に戻る。
【0037】ステップS16:音声入力回路1に音声信
号のデータがなくなった場合、あるいは作業中止命令が
あった場合は本処理ルーチンは終了し、メインの待機ル
ーチン等に復帰する。
【0038】(3)実験例 本実施例の実験例では、136秒のニュース文に適応し
たが、この場合、話速の平均が9.6モーラ/秒であ
り、これを基に、Th1,Th2,Th3をTh1=3
50ms、Th2=Th3=1000msに設定した。
この時、心理実験により、話速制御については、一単位
内の開始点の話速(有声区間長の伸張倍率)が原音声の
1.0〜1.3倍、終了点の話速が0.9〜1.0倍の
範囲では自然性、わかりやすさにおいて高い評価が得ら
れ、また、無音区間の短縮については、短縮した無音区
間(en )が最低でも862ms存在すれば、聴感上違
和感がないという知見が得られた。
【0039】その結果から、話速を1.2倍というゆっ
くりした話速から0.92倍という速い話速に変化さ
せ、長い無音区間(文章間の「ま」)を1200msに
短縮することによって、原音声、変換音声とも発話時間
が合致し、良好な話速変換音声が得られることが確認で
きた。
【0040】(4)その他の実施例 上記実施例のステップS8(図2参照)の処理中におい
て、話速が変わってもそのピッチが変わらないように処
理することにより、高品質の音質が保てる。この処理方
法としては、例えば特願平3−245960号「話速制
御型補聴方法および装置」に開示された音声信号の処理
方法が好適である。
【0041】また、上記実施例において有声区間長の伸
張倍率rs ,re 無音区間の削除後の時間長en 等をあ
らかじめ決めた一定値としたが、ダイヤルやキーボード
等から使用者が希望の値にセット可能な可変値としても
よい。これにより、例えば視聴者の希望に合せたり、あ
るいは放送時間内にぴったりと合わせる編集作業等がよ
り容易となる。
【0042】また、上記実施例の有声区間の伸張処理の
代りに、音声のピッチ(基本周波数)を公知のピッチ抽
出方法により直接検出し、ピッチの変化に応じて、ピッ
チの高いところでは話速を緩め、低いところでは話速を
速めるように処理してもよい。
【0043】
【発明の効果】以上説明したように、本発明によれば、
受聴音声の発生する速さ(話速)を遅くする際に、音声
のピッチ(基本周波数)の変化に応じて、ピッチの高い
ところでは話速を緩め、低いところでは話速を早めるよ
うにし、また、声立てと次の声立ての区間を単位にして
この区間の開始点ではゆっくりとした話速を設定し、そ
の終了点に向かって音声の基本周波数の大まかな変化に
追従して徐々に話速を早めるようにし、さらには文章間
の無音区間を予め実験で求めた聴感上違和感のない範囲
でできるだけ短い時間に短縮するようにしているので、
発話時間を原音声の発話時間に保ったまま全体としてゆ
っくりとした聴きやすい良好な音声に変換できる効果が
得られる。
【図面の簡単な説明】
【図1】本発明の一実施例の装置構成を示すブロック図
である。
【図2】本発明の一実施例の処理内容を示すフローチャ
ートである。
【図3】本発明の一実施例の処理に基づく音声データの
セグメンテーションを示す線図である。
【図4】本発明の一実施例の話速変化を示すタイミング
チャートである。
【図5】本発明の一実施例の処理に基づく原波形(A)
と文章間の長い無音区間を短縮した波形(B)とを示す
波形図である。
【符号の説明】
1 音声入力回路 2 CPU 3 PROM 4 入力バッファ 5 処理バッファ 6 ファイル 7 音声出力回路 an 無音区間 bn 無声区間 cn 有声区間 cn ′ 伸張した有声区間 Bn 無声または無音から始まって有声で終わる区間 Th1 声立てを判別するためのスレッショールド値 Th2 文章間の区切り(句点)を判別するためのスレ
ッショールド値 rs 開始点における有声区間長の伸張倍率 re 終了点における有声区間長の伸張倍率
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平1−93795(JP,A) 電子情報通信学会技術研究報告 SP 92−56 話速変換に伴う時間伸長を吸収 するための一方法 (58)調査した分野(Int.Cl.7,DB名) G10L 21/04

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 受聴音声の発生する速さ(以下、話速と
    いう)を遅くする際に、音声のピッチ(基本周波数)の
    変化に応じて、ピッチの高いところでは話速を緩め、低
    いところでは話速を早めることを特徴とする話速変換方
    法。
  2. 【請求項2】 話速を遅くする際に、声立てと次の声立
    ての区間を単位にしてこの区間の開始点ではゆっくりと
    した話速を設定し、その終了点に向かって音声の基本周
    波数の大まかな変化に追従して徐々に話速を早めること
    を特徴とする話速変換方法。
  3. 【請求項3】 話速を遅くする際にさらに、文章間の無
    音区間を予め実験で求めた聴感上違和感のない範囲でで
    きるだけ短い時間に短縮することを特徴とする請求項1
    または2に記載の話速変換方法。
  4. 【請求項4】 前記予め実験で求めた聴感上違和感のな
    い範囲でできるだけ短い時間が、862ms〜ほぼ10
    00msの範囲であることを特徴とする請求項3に記載
    の話速変換方法。
  5. 【請求項5】 音声信号を有声、無声、無音の別に識別
    する音声識別手段と、 該音声識別手段により識別された無音区間が文章間の無
    音区間か否かを判定する無音区間判定手段と、 該無音区間判定手段により文章間の無音区間と判定され
    た場合は当該無音区間を予め実験で求めた聴感上違和感
    のない範囲でできるだけ短い時間に短縮する無音区間短
    縮手段と、 前記音声識別手段により識別された有声区間が声立て開
    始のものか否かを判定する有声区間判定手段と、 該有声区間判定手段により声立て開始と判定された場合
    は声立てと次の声立ての区間を単位にしてこの区間の開
    始点ではゆっくりとした話速を設定し、その終了点に向
    かって音声の基本周波数の大まかな変化に追従して徐々
    に話速を速める話速変換処理を行う有声区間伸張手段と
    を具備したことを特徴とする話速変換装置。
JP05178792A 1991-09-25 1992-03-10 話速変換方法および装置 Expired - Lifetime JP3249567B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP05178792A JP3249567B2 (ja) 1992-03-10 1992-03-10 話速変換方法および装置
US07/950,411 US5305420A (en) 1991-09-25 1992-09-22 Method and apparatus for hearing assistance with speech speed control function
EP96119237A EP0766229B1 (en) 1991-09-25 1992-09-23 Method and apparatus for hearing assistance with speech speed control function
DK92116292T DK0534410T3 (da) 1991-09-25 1992-09-23 Fremgangsmåde og apparat til hørehjælp med talehastighedsstyrefunktion
DK96119237T DK0766229T3 (da) 1991-09-25 1992-09-23 Fremgangsmåde og apparat til hørehjælp med talehastighedsstyrefunktion
EP92116292A EP0534410B1 (en) 1991-09-25 1992-09-23 Method and apparatus for hearing assistance with speech speed control function

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05178792A JP3249567B2 (ja) 1992-03-10 1992-03-10 話速変換方法および装置

Publications (2)

Publication Number Publication Date
JPH05257490A JPH05257490A (ja) 1993-10-08
JP3249567B2 true JP3249567B2 (ja) 2002-01-21

Family

ID=12896658

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05178792A Expired - Lifetime JP3249567B2 (ja) 1991-09-25 1992-03-10 話速変換方法および装置

Country Status (1)

Country Link
JP (1) JP3249567B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5611018A (en) * 1993-09-18 1997-03-11 Sanyo Electric Co., Ltd. System for controlling voice speed of an input signal
ATE218002T1 (de) * 1994-12-08 2002-06-15 Univ California Verfahren und vorrichtung zur verbesserung des sprachverständnisses bei sprachbehinderten personen
WO1996037880A1 (fr) * 1995-05-25 1996-11-28 Sanyo Electric Co., Ltd. Dispositif d'enregistrement et de reproduction
JPH09198089A (ja) * 1996-01-19 1997-07-31 Matsushita Electric Ind Co Ltd 再生速度変換装置
JP3432443B2 (ja) * 1999-02-22 2003-08-04 日本電信電話株式会社 音声速度変換装置、音声速度変換方法および音声速度変換方法を実行するプログラムを記録した記録媒体
JP2001312298A (ja) * 2000-04-27 2001-11-09 Nippon Hoso Kyokai <Nhk> 話速変換処理装置、話速変換処理方法、記録媒体および話速変換処理装置の使用法
JP5054477B2 (ja) * 2007-09-26 2012-10-24 日本放送協会 補聴装置
JP5412204B2 (ja) * 2009-07-31 2014-02-12 日本放送協会 適応的な話速変換装置及びプログラム
JP5593244B2 (ja) 2011-01-28 2014-09-17 日本放送協会 話速変換倍率決定装置、話速変換装置、プログラム、及び記録媒体
JP2014228691A (ja) * 2013-05-22 2014-12-08 日本電気株式会社 航空管制用音声通信装置および音声処理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
電子情報通信学会技術研究報告 SP92−56 話速変換に伴う時間伸長を吸収するための一方法

Also Published As

Publication number Publication date
JPH05257490A (ja) 1993-10-08

Similar Documents

Publication Publication Date Title
US5828994A (en) Non-uniform time scale modification of recorded audio
JP4523257B2 (ja) 音声データ処理方法、プログラム及び音声信号処理システム
US6205420B1 (en) Method and device for instantly changing the speed of a speech
JP3249567B2 (ja) 話速変換方法および装置
JPH11175082A (ja) 音声対話装置及び音声対話用音声合成方法
JP2000152394A (ja) 軽度難聴者用補聴装置、軽度難聴者対応伝送システム、軽度難聴者対応記録再生装置、及び軽度難聴者対応再生装置
JP4953767B2 (ja) 音声生成装置
Cooke et al. Combining spectral and temporal modification techniques for speech intelligibility enhancement
JP3219892B2 (ja) リアルタイム話速変換装置
JP6314879B2 (ja) 音読評価装置、音読評価方法、及びプログラム
Nakamura et al. A new approach to compensate degeneration of speech intelligibility for elderly listeners-development of a portable real time speech rate conversion system
JP2001184100A (ja) 話速変換装置
JP3187242B2 (ja) 話速変換装置
Junqua et al. Influence of the speaking style and the noise spectral tilt on the Lombard reflex and automatic speech recognition
JP3373933B2 (ja) 話速変換装置
JPH09152889A (ja) 話速変換装置
JPH07230293A (ja) 音声認識装置
JP4313724B2 (ja) 音声再生速度調節方法、音声再生速度調節プログラム、およびこれを格納した記録媒体
JP3187241B2 (ja) 話速変換装置
JP2867744B2 (ja) 音声再生装置
JPH08110796A (ja) 音声強調方法および装置
JP2002304186A (ja) 音声合成装置、音声合成方法および音声合成プログラム
JPH1078798A (ja) 音声信号処理装置
KR100384898B1 (ko) 발화속도 조절기능을 이용한 음성/영상의 동기화 방법
Holland et al. The effect of slowing speech rate at natural boundaries on older adults' memory for auditorially presented stories

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081109

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091109

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101109

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111109

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121109

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121109

Year of fee payment: 11