JP2001184100A - 話速変換装置 - Google Patents

話速変換装置

Info

Publication number
JP2001184100A
JP2001184100A JP36768299A JP36768299A JP2001184100A JP 2001184100 A JP2001184100 A JP 2001184100A JP 36768299 A JP36768299 A JP 36768299A JP 36768299 A JP36768299 A JP 36768299A JP 2001184100 A JP2001184100 A JP 2001184100A
Authority
JP
Japan
Prior art keywords
speech speed
period
signal
sound
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP36768299A
Other languages
English (en)
Inventor
Kotaro Machidera
侯大郎 待寺
Chikako Ohara
千賀子 大原
Yoichi Katsuki
陽一 勝木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anritsu Corp
Original Assignee
Anritsu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anritsu Corp filed Critical Anritsu Corp
Priority to JP36768299A priority Critical patent/JP2001184100A/ja
Publication of JP2001184100A publication Critical patent/JP2001184100A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Abstract

(57)【要約】 【課題】 入力された任意の信号時間長(原音録音時
間)を有する音声信号を希望した再生時間で再生する。 【解決手段】 連続した音声信号をデジタル的に解析す
る音声解析部10と、この音声解析部で解析されたデジ
タル信号を記憶する録音バッファ11と、連続した音声
信号の原音録音時間を検出する原音録音時間検出手段1
6と、この検出された原音録音時間R0と希望再生時間
1との比で示される基準話速倍率Mを算出する基準話
速倍率算出手段18と、再生指示に応動して、録音バッ
ファ11から出力されるデジタル信号を合成して先に算
出された基準話速倍率Mに対応した話速倍率Yで新たな
デジタル信号を再生する信号合成部12とを備えてい
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声の話速を変更す
る話速変換装置に関する。
【0002】
【従来の技術】例えば外国語を学習する方法として、実
際にその外国語を耳で聞いて学習する学習法が効果的で
ある。この場合、同じ会話を繰り返し聴くことが重要で
ある。したがって、外国語を聴く能力を向上させるため
に、簡便な方法として、例えば、数分〜十数分の会話又
はナレーションを録音したテープを再生して学習する。
【0003】この場合、語学学習専用のテープレコーダ
においては、音声の再生速度を一定の範囲で可変できる
ように構成されている。
【0004】また、語学学習以外にも、演説やナレーシ
ョンやニュース原稿を一旦テープレコーダに録音して、
後で再生する場合においても、再生速度を一定の範囲で
可変できることが望ましい。
【0005】しかし、ただ単に音声の再生速度を変更さ
せたのみでは、再生される音声の周波数が変化してしま
い、音声が不自然に聞こえる。
【0006】このような不都合を解消するために、話す
速度、すなわち話速を変化させたとしても、音声の周波
数は変化せず、ただ話し方がゆっくりになったり、早口
になるのみで自然に聞こえる話速変換手法が提唱されて
いる。
【0007】次に、この話速変換手法を図11及び図1
2を用いて説明する。図11は、例えば「 It's diffi
cult for me to finish… 」と話した場合の音声信号
1の波形図である。図12はこの音声信号1の拡大図で
ある。周知のように、音声には子音と母音とがあり、音
声信号1にもそれに対応した子音と母音とがある。図示
するように子音は1個の無声音2で構成され、母音は複
数の有声音3で構成されている。また、音声信号1には
音声の途切れたときの無音4が存在する。
【0008】ここで、無声音2又は有声音3の継続期間
を有音期間5と称し、無音4の継続期間を無音期間6と
称する。
【0009】子音を構成する無声音2は比較的高い周波
数成分を有し、母音を構成する複数の有声音3はほぼ同
一波形を有する。したがって、話速を速くするために
は、母音を構成する複数の有声音3のうちの1個又は複
数の有声音3を間引いて、間引いた有声音3の前後の有
声音3どうし、又は無声音2と有声音3、又は有声音3
と無音4とを接続する。よって、母音の継続時間を短縮
でき、結果として音声信号1の全体の時間を短くでき、
音声の周波数や音質を変更することなく話速を速くでき
る。また、無声期間6の時間を短縮することによって話
速を速くすることもできる。
【0010】逆に、話速を遅くする場合は、母音を構成
する複数の有声音3に対して同一の有声音3を挿入して
母音の継続時間を長くすればよい。また、無声期間6の
時間を伸張することによって話速を遅くすることもでき
る。
【0011】有音期間5を短縮・伸張することによっ
て、話速変換を自動的に行うためには、音声信号1に含
まれる無声音2と有声音3と無音4とを区分けする必要
がある。この区分手法として、母音は複数の有声音3が
継続する性質を利用して、音声信号1に対して自己相関
関数を算出することにより、無声音2と有声音3との区
分け、及び各有声音3の継続時間(ピッチ)が検出す
る。
【0012】そして、母音を構成する複数の有声音3の
うち何個の有声音3を間引くか、又は何個の有声音3を
挿入するかで、音声信号1の話速が定まる。
【0013】したがって、このような話速変換機能が組
込まれた音声再生装置を用いることにより、語学学習者
は、違和感なく、速い速度又は遅い速度で会話やナレー
ションを聴くことができる。
【0014】また、必要に応じて、違和感なく、演説や
ナレーションやニュース原稿の話速を変更できる。
【0015】
【発明が解決しようとする課題】しかしながら、上述し
た話速変換機能が組込まれた音声再生装置においても、
まだ改良すべき次のような課題があった。
【0016】すなわち、講演会や放送局においては、予
め与えられた時間に合うように、演説やナレーションや
ニュース原稿が録音されている場合が多い。しかし、与
えられた時間が急に変更になる場合がしばしばある。
【0017】しかし、上述した話速変換機能が組込まれ
た音声再生装置においては、再生される音声の話速を通
常話速に対して何%上昇させるか、又は、通常話速に対
して何%低下させるかを指示できたが、再生時間そのも
のを指定できなかった。そのために、適当に、話速倍率
を指定して、再生させていた。その結果、再生時間が与
えられた時間内に正確に収まらない問題が生じる。
【0018】特に、放送局における放送時間は秒単位ま
で厳格に定められている。演説やナレーションは、たと
え圧縮・伸張しない状態においても、与えられた時間に
秒単位で収まることはない。したがって、録音時間が不
確かであるのに、適当な話速倍率を設定して、再生され
た演説やナレーションを放送時間内に秒単位まで厳格に
収めることは至難の業である。
【0019】本発明はこのような事情に鑑みてなされた
ものであり、希望再生時間を与えるのみで任意時間長を
有した音声信号を、違和感なく与えられた希望再生時間
で正確に再生でき、使い勝手を大幅に向上できる話速変
換装置を提供することを目的とする。
【0020】
【課題を解決するための手段】上記課題を解消するため
に、本発明の話速変換装置においては、連続した音声信
号をデジタル的に解析する音声解析部と、この音声解析
部で解析されたデジタル信号を記憶する録音バッファ
と、連続した音声信号の原音録音時間を検出する原音録
音時間検出手段と、この検出された原音録音時間と希望
再生時間との比で示される基準話速倍率を算出する基準
話速倍率算出手段と、再生指示に応動して、録音バッフ
ァから出力されるデジタル信号を合成して算出された基
準話速倍率に対応した話速倍率で新たなデジタル信号を
再生する信号合成部とを備えている。
【0021】また、発明の話速変換装置においては、連
続した音声信号をデジタル的に解析する音声解析部と、
この音声解析部で解析されたデジタル信号を記憶する録
音バッファと、連続した音声信号の原音録音時間を検出
する原音録音時間検出手段と、この検出された原音録音
時間と希望再生時間との比で示される基準話速倍率を算
出する基準話速倍率算出手段と、再生指示に応動して、
録音バッファから出力されるデジタル信号を合成して指
定された話速倍率で新たなデジタル信号を再生する信号
合成部と、算出された基準話速倍率に対応した話速倍率
を算出して前記信号合成部へ送出する話速算出部とを備
えている。
【0022】このように構成された話速変換装置におい
ては、入力された連続する音声信号は音声解析部で、例
えば有音期間、無音期間、無声音、有声音、無音等に区
分(解析)される。この音声解析部でデジタル的に解析
されたデジタル信号(デジタルの音声信号)は録音バッ
ファに記憶保持される。
【0023】また、入力された連続する音声信号の信号
時間長で示される原音録音時間が検出され、例えば操作
入力された希望再生時間との比で示される基準話速倍率
が算出される。そして、この基準話速倍率から話速倍率
が算出される。ここで、話速倍率とは、速度変換を実施
していない状態の音声の話速を1(基準)とした場合の
話速の倍率である。
【0024】外部から再生指示が出されると、録音バッ
ファに記憶保持されている解析されたデジタル信号(デ
ジタルの音声信号)は信号合成部にて話速算出部で指定
され話速倍率を有する新たなデジタル信号(デジタルの
音声信号)として再生される。
【0025】したがって、操作者は、たとえ、入力され
た音声信号の信号時間長(原音録音時間)が不明であっ
たとしても、希望再生時間のみを指定するのみで、再生
された音声信号が希望再生時間に正確に収まる。
【0026】また、別の発明の話速変換装置において
は、上述した発明の話速変換装置に対して、さらに、連
続する音声信号の累積有音期間を算出する累積有音期間
算出手段と、連続する音声信号の累積無音期間を算出す
る累積無音期間算出手段とを備えている。そして、話速
算出部は、算出された累積有音期間と累積無音期間とか
ら、有音期間の話速倍率を変更することによって基準話
速倍率が得られる有音目標話速倍率を算出して、デジタ
ル信号の有音期間に有音目標話速倍率の話速倍率を信号
合成部へ送出し、デジタルの音声信号の無音期間に期間
変更なしを信号合成部へ送出する。
【0027】このように構成された話速変換装置におい
ては、連続した音声信号の話速倍率を変更する手段とし
て、連続した音声信号における無音期間はそのまま変更
せずに、有音期間の時間を例えば、有声音を間引いた
り、同一有声音を付加することによって変更している。
【0028】さらに、別の発明の話速変換装置において
は、上述した発明の話速変換装置に対して、さらに、連
続した音声信号の累積有音期間を算出する累積有音期間
算出手段と、連続した音声信号の累積無音期間を算出す
る累積無音期間算出手段とを備えている。そして、話速
算出部は、算出された累積有音期間と累積無音期間とか
ら、無音期間を変更することによって基準話速倍率が得
られる無音目標期間を算出して、デジタル信号の有音期
間に無音目標期間を信号合成部へ送出し、デジタル信号
の有音期間に1の話速倍率を信号合成部へ送出する。
【0029】このように構成された話速変換装置におい
ては、入力された音声信号の話速倍率を変更する手段と
して、入力された音声信号における有音期間はそのまま
変更せずに、無音期間の継続時間を圧縮又は伸張してい
る。
【0030】さらに、別の発明の話速変換装置において
は、上述した発明の話速変換装置の話速算出部は、連続
した音声信号の開始時刻から規定時間経過するまでの期
間内に、時間経過に伴って予め設定された初期話速倍率
から基準話速倍率近傍の目標話速倍率まで変化させ、か
つ規定時間経過後に、目標話速倍率を維持する話速倍率
を順次算出して信号合成部へ送出する。
【0031】このように構成された話速変換装置におい
ては、再生された演説やナレーションの冒頭部分のみ通
常話速に近い話速倍率で、規定時間経過後に基準話速倍
率近傍の目標話速倍率で再生される。よって、再生され
た演説やナレーションの冒頭部分を聞き逃すことはな
い。
【0032】
【発明の実施の形態】以下、本発明の各実施形態を図面
を用いて説明する。 (第1実施形態)図1は本発明の第1実施形態に係る話
速変換装置の概略構成を示すブロック図である。入力端
子7に対して図11に示した音声信号1と同一構成の一
連の連続した音声信号aが入力される。したがって、こ
の音声信号aは、図12に示すように、子音に対応する
無声音2と、母音に対応する有声音3と、無音4とで構
成されている。そして、図12に示すように、無声音2
又は有声音3からなる有音期間5の継続期間をT1
し、無音4からなる無音期間6の継続期間をT0とす
る。
【0033】入力端子7から入力されたアナログの音声
信号aは、A/D変換器8でデジタルの音声信号に変換
された後、音声信号メモリ9に蓄積される。音声解析部
10は、この音声信号メモリ9に書込まれた一連のデジ
タルの音声信号a1を無声音2と、有声音3と、無音4
とに区分けする。具体的には、音声信号a1の信号レベ
ルを調べて、有音期間5と無音期間6とを区分けする。
その後、各有音期間5の信号に対して自己相関解析を実
施して、この有音期間5を無声音2と有声音3とに区分
けする。音声解析部10で、無声音2と有声音3と無音
4とに区分けされた音声信号a2は一旦録音バッファ1
1へ書込まれて記憶保持される。
【0034】信号合成部12は、外部から再生開始指令
が入力されると、この録音バッファ11に書込まれてい
る音声解析されたデジタルの音声信号a2を取込んで、
この取込んだ音声信号a2における有音期間5における
各母音を構成する複数の有声音3のうち、話速算出部1
9にで指定された話速倍率Yに対応した数だけ間引くか
又は追加する。また、この取込んだ音声信号a2におけ
る無音期間6の継続期間を話速算出部19にて指定され
た話速倍率Yに応じて短縮又は伸張する。そして、信号
合成部12は、入力された音声信号a2における無声音
2と、間引き又は追加後の有声音3と、短縮又は伸張さ
れた無音4とを接続して新たな音声信号a3を合成して
出力する。
【0035】信号合成部12から出力された新たな音声
信号a3は出力バッファ13に一旦格納した後、D/A
変換14でアナログの音声信号a4に変換されて、出力
端子15から出力される。
【0036】したがって、出力端子15から出力された
新たなアナログの音声信号a4は、入力端子7に入力さ
れたアナログの音声信号aに対して、指定された話速倍
率Yに対する分だけ短縮又は伸張され、その分、再生さ
れた演説又はナレーションの再生時間が短縮又は伸張さ
れる。
【0037】A/D変換器8から出力されたデジタルの
音声信号a1は音声信号メモリ9へ書込まれると共に、
録音時間検出部16へ入力される。録音時間検出部16
は、図2に示すように、入力された音声信号a(a1
の信号時間長で示される原音録音時間R0を検出して、
次の基準話速倍率算出部18へ送出する。
【0038】希望再生時間入力部17は操作者が操作入
力した、図2に示す、出力端子15から出力されるアナ
ログの音声信号a4の信号時間長である再生時間RIを次
の基準話速倍率算出部18へ送出する。
【0039】基準話速倍率算出部18は、入力された音
声信号a(a1)の原音録音時間R0を出力される音声信
号a4の希望再生時間RIで除算した基準話速倍率Mを算
出して次の話速算出部19へ送出する。
【0040】M=R0/RI この第1実施形態の話速変換装置の話速算出部19は、
入力された基準話速倍率Mをそのまま話速倍率Yとし
て、信号合成部12へ送出する。
【0041】Y=M 前述したように、信号合成部12は、取込んだデジタル
の音声信号a2を圧縮・伸張して話速倍率Yを有するデ
ジタルの音声信号a3として出力する。
【0042】このように構成された第1実施形態の話速
変換装置においては、入力端子7から入力された音声信
号aの信号時間長を示す原音録音時間R0が自動的に測
定される。そして、操作者が希望再生時間R1を操作入
力すると、基準話速倍率Mが自動的に算出されて、信号
合成部12へ話速倍率Yとして印加される。
【0043】したがって、操作者としては、入力された
音声信号aの原音録音時間R0に係わらず、希望再生時
間R1を操作入力のみで、高い精度の希望再生時間R1
有する音声信号a4を再生できる。
【0044】よって、放送局のように放送時間を秒単位
で制御する環境下でこの話速変換装置を使用する場合
に、高い精度の希望再生時間R1が確保されるので、こ
の話速変換装置の使い勝手を大幅に向上できる。
【0045】(第2実施形態)図3は本発明の第2実施
形態に係わる話速変換装置の概略構成を示すブロック図
である。図1に示す第1実施形態の話速変換装置と同一
部分には同一符号を付して、重複する部分の詳細説明を
省略する。
【0046】この第2実施形態の話速変換装置において
は、音声解析部10から出力された、有音期間5、無音
期間6、無声音2、有声音3、無音4に区分(解析)さ
れたデジタルの音声信号a2は順次録音バッファ11に
書込まれると共に、累積有音期間算出部20及び累積無
音期間算出部21へ入力される。
【0047】累積有音期間算出部20は、図2に示すよ
うに、入力された1原音録音時間R 0分の音声信号a
2(a)に含まれる全ての有音期間T1を累積した累積有
音期間TS1を算出して話速算出部19aへ送出する。同
様に、累積無音期間算出部21は、図2に示すように、
入力された1原音録音時間R0分の音声信号a2(a)に
含まれる全ての無音期間T0を累積した累積無音期間T
S0を算出して話速算出部19aへ送出する。
【0048】さらに、再生指示が入力され、信号合成部
12が録音バッファ11に記憶されたデジタルの音声信
号a2の読出しを開始すると、録音バッファ11から音
声信号a2が信号合成部12へ入力されると共に、話速
算出部19aへ入力される。したがって、話速算出部1
9aには、デジタルの音声信号a2が入力開始前に、基
準話速倍率M、累積有音期間TS1、累積無音期間TS0
が入力されている。
【0049】そして、この話速算出部19aは図4に示
す流れ図に従って、話速倍率Yを算出して信号合成部1
2へ送出する処理を実施する。
【0050】前述したように、基準話速倍率M、累積有
音期間TS1、累積無音期間TS0 を取込む(P1)。次
に、有音目標話速倍率N1を算出する(P2)。この有
音目標話速倍率N1は、各無音期間TS0はそのままで、
各有音期間TS1を圧縮・伸張して希望再生時R1を得る
ために、各有音期間TS1に作用させるため話速倍率Yで
ある。この有音目標話速倍率N1は下式から導かれる。
【0051】 (TS1/N1)+TS0=(TS1+TS0)/M N1=(M・TS1)/(TS1+TS0―M・TS0) そして、録音バッファ11から出力されたデジタルの音
声信号a2が入力開始されると(P3)、例えば、0.
01秒等の微小時間Δtの経過を待って(P4)、この
デジタルの音声信号a2が終了していないことを確認し
(P5)、現在時点におけるデジタルの音声信号a2
信号状態が有音期間5(T1)の場合は(P6)、先に
求めた有音目標話速倍率N1を話速倍率Yとして信号合
成部12へ送出する(P7)。Y=N1現在時点におけ
るデジタルの音声信号a2の信号状態が無音期間6
(T0)の場合は(P6)、無音期間6(T0)変更なし
指示となる、話速倍率1を話速倍率Yとして信号合成部
12へ送出する(P8)。 Y=1 そして、P5にて、デジタルの音声信号a2が終了する
と、この話速倍率算出処理を終了する。
【0052】このように、構成された第2実施形態の話
速変換装置においては、先に説明した第1実施形態の話
速変換装置と同様に、希望再生時間R1を指定すると、
この希望再生時間R1を有する音声信号a4を再生するこ
ことができる。
【0053】さらに、この第2実施形態の話速変換装置
においては、話速算出部19aから、信号合成部12へ
入力される話速倍率Yは、無音期間6(T0)で1に設
定され、すなわち無音期間6(T0)変更なしに設定さ
れ、有音期間5(T1)で有音目標話速倍率N1に設定さ
れる。したがって、たとえ入力された音声信号aが大幅
に短縮又は伸張されたとしても、言葉と言葉との間の無
音期間6は変化されずに確保されるので、より自然に聞
こえる。
【0054】(第3実施形態)図5は本発明の第3実施
形態の話速変換装置に組込まれた話速算出部19aの話
速倍率Yの算出処理を示す流れ図である。なお、この第
3実施形態の話速変換装置のブロック構成図は、図3に
示した第2実施形態の話速変換装置のブロック構成図と
同じであるので説明を省略する。異なるところは、話速
算出部19aの話速倍率Yの算出処理内容のみである。
【0055】そして、第3実施形態の話速算出部19a
は図5に示す流れ図に従って、話速倍率Yを算出して信
号合成部12へ送出する処理を実施する。
【0056】図4と同様に、基準話速倍率M、累積有音
期間TS1、累積無音期間TS0 を取込んで(Q1)、無
音目標期間を得るための無音目標話速倍率N0を算出す
る(Q2)。この無音目標期間を得るための無音目標話
速倍率N0は、各有音期間TS 1はそのままで、各無音期
間TS0を圧縮・伸張して希望再生時R1を得るために、
各無音期間TS0に作用させるため話速倍率Yである。こ
の無音目標話速倍率N0は下式から導かれる。
【0057】 TS1+(TS0/N0)=(TS1+TS0)/M N0=(M・TS0)/(TS1+TS0―M・TS1) そして、録音バッファ11から出力されたデジタルの音
声信号a2が入力開始されると(Q3)、例えば、0.
01秒等の微小時間Δtの経過を待って(Q4)、この
デジタルの音声信号a2が終了していないことを確認し
(Q5)、現在時点におけるデジタルの音声信号a2
信号状態が無音期間6(T0)の場合は(Q6)、先に
求めた無音目標話速倍率N0を話速倍率Yとして信号合
成部12へ送出する(Q7)。 Y=N0 現在時点におけるデジタルの音声信号a2の信号状態が
有音期間5(T1)の場合は(Q6)、話速倍率1を話
速倍率Yとして信号合成部12へ送出する(Q8)。 Y=1 そして、Q5にて、デジタルの音声信号a2が終了する
と、この話速倍率算出処理を終了する。
【0058】このように構成された第3話速変換装置に
おいては、先に説明した第1実施形態の話速変換装置と
同様に、希望再生時間R1を指定すると、この希望再生
時間R1を有する音声信号a4を再生するこことができ
る。
【0059】さらに、この第3実施形態の話速変換装置
においては、話速算出部19aから信号合成部12へ入
力される話速倍率Yは、有音期間5(T1)で1に設定
され、無音期間6(T0)で無音目標話速倍率N0に設定
される。
【0060】したがって、例えば、無音期間6(T0
が多い、間延びした演説やナレーションを希望再生時間
1に短縮する場合に、この手法を採用することによっ
て、引き締まった聞き易い再生音声とすることができ
る。
【0061】(第4実施形態)図6は本発明の第4実施
形態の話速変換装置に組込まれた話速算出部19aから
信号合成部12へ印加される話速倍率Yの時間特性を示
す図である。なお、この第4実施形態の話速変換装置の
ブロック構成図は、図3に示した第2実施形態の話速変
換装置のブロック構成図と同じであるので説明を省略す
る。異なるところは、話速算出部19aの話速倍率Yの
算出処理内容のみである。
【0062】この話速算出部19aは、図6に示すよう
に、この話速算出部19aに入力されたデジタルの音声
信号a3の開始時刻(t=0)から規定時間TB経過する
までの期間内に、時間経過に伴って予め設定された初期
話速倍率B(=1)から基準話速倍率M近傍の目標話速
倍率Nまで変化させ、かつ規定時間T経過後に、目標話
速倍率Nを維持する話速倍率Yを順次算出して信号合成
部12へ送出する。
【0063】具体的には、この話速算出部19aは、図
7に示す流れ図に従って、話速倍率Yを算出して信号合
成部12へ送出する処理を実施する。
【0064】先ず、基準話速倍率M、規定時間TB、原
音録音時間R0を取込んで(S1)、目標話速倍率Nを
算出する(S2)。具体的には、図6に示すように、話
速倍率Yが基準話速倍率Mを下回る面積S1と、話速倍
率Yが基準話速倍率Mを上回る面積S2とが等しくなる
ように目標話速倍率Nを算出する。
【0065】S1=(M―1)TB/2 S2=(N―M)(R0―TB) N=[(M―1)TB/2(R0―B)]+M そして、録音バッファ11から出力されたデジタルの音
声信号a2が入力開始されると、S3にて、経過時間t
を初期化する(t=0)。例えば、0.01秒等の微小
時間Δtの経過を待って(S4)、S5にて経過時間t
を更新する(t=t+Δt)。そして、更新後の経過時
間tが規定時間TB未満の場合(S6)、下式に示す話
速倍率Yの算出を行う(S7)。 Y=[(N―1)/TB]t+1 算出した話速倍率Yを信号合成部12へ送出する(S
8)。そして、S4へ戻り、次の微小時間Δtの経過を
待つ。
【0066】S6にて、更新後の経過時間tが規定時間
Bに達すると、目標話速倍率Y=Nを信号合成部9へ
送出する。
【0067】このように構成された第4実施形態の話速
変換装置においては、図6に示すように、時刻(経過時
間)t=0で録音バッファ11から解析済みのデジタル
の音声信号a2が信号合成部12及び話速算出部19a
へ入力開始されると、出力端子15から出力される音声
信号a4の話速は通常話速(Y=1)である。そして、
経過時間tが増加すると、話速倍率Yも増加する。
【0068】そして、経過時間tが規定時間TBに達す
ると、話速倍率Yが基準話速倍率Mを若干上回る目標話
速倍率Nに達する(Y=N)。規定時間TBを経過した
後は、話速倍率Yは目標話速倍率Nを維持する。
【0069】したがって、この第4実施形態の話速変換
装置を採用することによって、先に説明した第1実施形
態の話速変換装置と同様に、希望再生時間R1を指定す
ると、この希望再生時間R1を有する音声信号a4を再生
するこことができる。さらに、演説やナレーションの冒
頭部分のみ通常に近い話速でその後は目標話速Nの話速
なる。よって、演説やナレーションの冒頭部分を聞き逃
すことはない。
【0070】(第5実施形態)図8は本発明の第5実施
形態の話速変換装置に組込まれた話速算出部19aから
信号合成部12へ印加される話速倍率Yの時間特性を示
す図である。なお、この第5実施形態の話速変換装置の
ブロック構成図は、図3に示した第2実施形態の話速変
換装置のブロック構成図と同じであるので説明を省略す
る。異なるところは、話速算出部19aの話速倍率Yの
算出処理内容のみである。
【0071】この話速算出部19aは、図8に示すよう
に、この話速算出部19aに入力されたデジタルの音声
信号a3の有音期間5(T1)の開始時刻(tS=0)か
らの経過期間tSが規定時間TB経過するまでの期間内
に、時間経過に伴って予め設定された初期話速倍率B
(=1)から基準話速倍率M近傍の目標話速倍率Nまで
変化させ、かつ規定時間TB経過後に、目標話速倍率N
を維持し、さらに、デジタルの音声信号a3が経過期間
S=tEで無音期間6(T0)に変化すると、1とな
り、次の有音期間5(T1)まで1を維持する話速倍率
Yを順次算出して信号合成部12へ送出する。但し、無
音期間6の継続期間tQがしきい値時間TSHより短い場
合は、話速倍率Yは1に戻らない。
【0072】具体的には、この話速算出部19aは、図
10に示す流れ図に従って、話速倍率Yを算出して信号
合成部12へ送出する処理を実施する。
【0073】先ず、基準話速倍率M、規定時間TB、話
し始め話速倍率Bを取込んで(A1)、目標話速倍率N
を算出する(A2)。具体的には、図6に示すように、
話速倍率Yが基準話速倍率Mを下回る面積S1と、話速
倍率Yが基準話速倍率Mを上回る面積S2とが等しくな
るように目標話速倍率Nを算出する。なお、有音期間5
の時間長T1(tS=0〜tS=tE)は単語や文節によっ
てまちまちであるので、平均的な値を用いて目標話速倍
率Nを算出する。
【0074】そして、録音バッファ11から出力された
デジタルの音声信号a2が入力開始されると、例えば、
0.01秒等の微小時間Δtの経過を待って(A3)、
A4にてデジタルの音声信号a2のその時点での解析結果
を取込む(A4)。そして、デジタルの音声信号a2
有音期間5であれば(A5)、有音期間フラグの状態を
調べる(A6)。0に解除されたままであると、今回初
めて有音期間5に入ったと判断して、A7にて、有音期
間フラグを1に設定するとともに、有音経過時間tS
初期化する(tS=0)。さらに、無音股間フラグを0
に解除する(A8)。
【0075】なお、A6にて、既に有音期間フラグが1
に設定されたままであると、前回以前に有音期間5に入
ったと判断して、A9にて、有音経過時間tSを更新す
る( tS=tS+Δt)。
【0076】そして、下式で示す話速倍率Yを算出する
(A10)。
【0077】 Y=N―(N―B)exp[―tS/(TB/5)] この算出した話速倍率Yを信号合成部12へ送出する
(A11)。そして、A3へ戻り、次の微小時間Δtが
経過するのを待つ。
【0078】また、A5にて、現在時点でデジタルの音
声信号a2が有音期間5でなくて無音期間6の場合であ
れば、無音期間フラグの状態を調べる(A12)。0に
解除されたままであると、今回初めて無音期間6に入っ
たと判断して、A13にて、無音期間フラグを1に設定
するとともに、無音経過時間tQを初期化する(tQ
0)。そして、A9へ進み、有音経過時間tSを更新す
る(tS=tS+Δt)。さらに、前述した話速倍率Yを
算出して(A10)、信号合成部12へ送出する(A1
1)。そして、A3へ戻り、次の微小時間Δtが経過す
るのを待つ。
【0079】A12にて、既に無音期間フラグが1に設
定されたままであると、前回以前に無音期間6に入った
と判断して、A14にて、無音経過時間tQを更新する
(tQ=tQ+Δt)。そして、更新後の無音経過時間t
Qが予め設定されているしきい値TSHを超えたか否かを
調べる(A15)。
【0080】無音経過時間tQがしきい値時間TSHを超
えていなければ、A9へ進み、有音経過時間tSを更新
する(tS=tS+Δt)。さらに、話速倍率Yを算出し
て(A10)、信号合成部12へ送出する(A11)。
そして、A3へ戻り、次の微小時間Δtが経過するのを
待つ。
【0081】A15にて、無音経過時間tQがしきい値
時間TSHを超えると、初めて有音期間フラグを0に解除
する(A16)。そして、A3へ戻り、次の微小時間Δ
tが経過するのを待つ。
【0082】このように構成された第5実施形態の話速
変換装置においては、図9に示すように、録音バッファ
11から解析済みのデジタルの音声信号a2が信号合成
部12及び話速算出部19aへ入力開始されると、出力
端子15から出力される音声信号a4の話速倍率Yは、
有音期間5(T1)が開始される毎に、通常話速に近い
話し開始話速倍率Bから、規定時間TB内に、基準話速
倍率M近傍の目標話速倍率Nまで増加し、該当有音期間
5(T1)が継続する限りは、目標話速倍率Nを維持す
る。
【0083】したがって、この第5実施形態の話速変換
装置を採用することによって、先に説明した第1実施形
態の話速変換装置と同様に、希望再生時間R1を指定す
ると、この希望再生時間R1を有する音声信号a4を再生
するこことができる。
【0084】さらに、演説やナレーションにおける音声
が一定のしきい値時間TSHを超えると、話速倍率Yがほ
ぼ通常の値Bにも戻るので、次の話し始めは通常の話速
となるので、非常に聞き易くなる。
【0085】
【発明の効果】以上説明したように、本発明の話速変換
装置においては、希望再生時間を与えるのみで任意時間
長を有した音声信号を、違和感なく与えられた希望再生
時間で正確に再生できる。したがって、使い勝手を大幅
に向上できる。
【図面の簡単な説明】
【図1】本発明の第1実施形態に係わる話速変換装置の
概略構成を示すブロック図
【図2】録音及び再生する音声信号の信号構成を示す模
式図
【図3】本発明の第2実施形態に係わる話速変換装置の
概略構成を示すブロック図
【図4】同第2実施形態に係わる話速変換装置に組込ま
れた話速算出部の話速倍率の算出処理を示す流れ図
【図5】本発明の第3実施形態に係わる話速変換装置に
組込まれた話速算出部の話速倍率の算出処理を示す流れ
【図6】本発明の第4実施形態に係わる話速変換装置に
組込まれた話速算出部から出力された話速倍率の変化を
示す図
【図7】同第4実施形態に係わる話速変換装置に組込ま
れた話速算出部の話速倍率の算出処理を示す流れ図
【図8】本発明の第5実施形態に係わる話速変換装置に
組込まれた話速算出部から出力された話速倍率の変化を
示す図
【図9】同じく第5実施形態に係わる話速変換装置に組
込まれた話速算出部から出力された話速倍率の変化を示
す図
【図10】同第5実施形態に係わる話速変換装置に組込
まれた話速算出部の話速倍率の算出処理を示す流れ図
【図11】一般的な音声信号波形を示す図
【図12】一般的な音声信号の詳細を示す図
【符号の説明】
2…無声音 3…有声音 4…無音 5…有音期間 5…無音期間 8…A/D変換器 9…音声信号メモリ 10…音声解析部 11…録音バッファ 12…信号合成部 13…出力バッファ 14…D/A変換器 16…録音時間検出部 17…希望再生時間入力部 18…基準話速倍率算出部 19,18a…話速算出部 20…累積有音期間算出部 21…累積無音期間算出部
【手続補正書】
【提出日】平成12年1月7日(2000.1.7)
【手続補正1】
【補正対象書類名】図面
【補正対象項目名】全図
【補正方法】変更
【補正内容】
【図1】
【図2】
【図4】
【図6】
【図9】
【図3】
【図5】
【図7】
【図11】
【図8】
【図10】
【図12】
───────────────────────────────────────────────────── フロントページの続き (72)発明者 勝木 陽一 東京都港区南麻布五丁目10番27号 アンリ ツ株式会社内 Fターム(参考) 5D045 AA07 BA02 5D080 AA05 BA01 DA02 FA31 FA39 GA02 GA16

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 連続した音声信号をデジタル的に解析す
    る音声解析部(10)と、 この音声解析部で解析されたデジタル信号を記憶する録
    音バッファ(11)と、 前記連続した音声信号の原音録音時間を検出する原音録
    音時間検出手段(16)と、 この検出された原音録音時間(R0)と希望再生時間
    (R1)との比で示される基準話速倍率(M)を算出す
    る基準話速倍率算出手段(18)と、 再生指示に応動して、前記録音バッファから出力される
    デジタル信号を合成して前記算出された基準話速倍率
    (M)に対応した話速倍率(Y)で新たなデジタル信号
    を再生する信号合成部(12)とを備えたことを特徴と
    する話速変換装置。
  2. 【請求項2】 連続した音声信号をデジタル的に解析す
    る音声解析部(10)と、 この音声解析部で解析されたデジタル信号を記憶する録
    音バッファ(11)と、 前記連続した音声信号の原音録音時間を検出する原音録
    音時間検出手段(16)と、 この検出された原音録音時間(R0)と希望再生時間
    (R1)との比で示される基準話速倍率(M)を算出す
    る基準話速倍率算出手段(18)と、 再生指示に応動して、前記録音バッファから出力される
    デジタル信号を合成して指定された話速倍率(Y)で新
    たなデジタル信号を再生する信号合成部(12)と、 前記算出された基準話速倍率(M)に対応した話速倍率
    (Y)を算出して前記信号合成部へ送出する話速算出部
    (19)とを備えたことを特徴とする話速変換装置。
  3. 【請求項3】 前記連続した音声信号の累積有音期間を
    算出する累積有音期間算出手段(20)と、前記連続し
    た音声信号の累積無音期間を算出する累積無音期間算出
    手段(21)とを備え、 前記話速算出部(19a)は、前記算出された累積有音
    期間と累積無音期間とから、前記有音期間の話速倍率を
    変更することによって前記基準話速倍率(M)が得られ
    る有音目標話速倍率(N1)を算出して、前記デジタル
    信号の有音期間に前記有音目標話速倍率の話速倍率を前
    記信号合成部へ送出し、前記デジタル信号の無音期間に
    期間変更無しを前記信号合成部へ送出することを特徴と
    する請求項2記載の話速変換装置。
  4. 【請求項4】 前記連続した音声信号の累積有音期間を
    算出する累積有音期間算出手段(20)と、前記連続し
    た音声信号の累積無音期間を算出する累積無音期間算出
    手段(21)とを備え、 前記話速算出部(19a)は、前記算出された累積有音
    期間と累積無音期間とから、前記無音期間を変更するこ
    とによって前記基準話速倍率(M)が得られる無音目標
    期間(M0)を算出して、前記デジタル信号の有音期間
    に前記無音目標期間(N0)の話速倍率を前記信号合成
    部へ送出し、前記デジタル信号の有音期間に1の話速倍
    率を前記信号合成部へ送出することを特徴とする請求項
    2記載の話速変換装置。
  5. 【請求項5】 前記話速算出部(19a)は、前記連続
    した音声信号の開始時刻から規定時間経過するまでの期
    間内に、時間経過に伴って予め設定された初期話速倍率
    から前記基準話速倍率近傍の目標話速倍率まで変化さ
    せ、かつ前記規定時間経過後に、前記目標話速倍率を維
    持する話速倍率を順次算出して前記信号合成部へ送出す
    ることを特徴とする請求項2記載の話速変換装置。
JP36768299A 1999-12-24 1999-12-24 話速変換装置 Withdrawn JP2001184100A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP36768299A JP2001184100A (ja) 1999-12-24 1999-12-24 話速変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36768299A JP2001184100A (ja) 1999-12-24 1999-12-24 話速変換装置

Publications (1)

Publication Number Publication Date
JP2001184100A true JP2001184100A (ja) 2001-07-06

Family

ID=18489934

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36768299A Withdrawn JP2001184100A (ja) 1999-12-24 1999-12-24 話速変換装置

Country Status (1)

Country Link
JP (1) JP2001184100A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003200507B2 (en) * 2002-02-15 2004-04-22 Yoshikazu Kasahara Method and apparatus for rapid language acquisition
WO2006008810A1 (ja) * 2004-07-21 2006-01-26 Fujitsu Limited 速度変換装置、速度変換方法及びプログラム
JP2007298621A (ja) * 2006-04-28 2007-11-15 Nippon Hoso Kyokai <Nhk> 音声データ時間長調整装置およびそのプログラム
JP2008058956A (ja) * 2006-07-31 2008-03-13 Matsushita Electric Ind Co Ltd 音声再生装置
JP2008107706A (ja) * 2006-10-27 2008-05-08 Yamaha Corp 話速変換装置およびプログラム
JP2008107381A (ja) * 2006-10-23 2008-05-08 Mitsubishi Electric Corp 話速変換装置及び話速変換制御方法
JP2010164785A (ja) * 2009-01-16 2010-07-29 Konami Digital Entertainment Co Ltd 刻限通知装置、刻限通知方法、ならびに、プログラム
CN112565881A (zh) * 2020-12-28 2021-03-26 北京五街科技有限公司 一种自适应的视频播放方法
CN112565880A (zh) * 2020-12-28 2021-03-26 北京五街科技有限公司 一种讲解类视频的播放方法
CN114067787A (zh) * 2021-12-17 2022-02-18 广东讯飞启明科技发展有限公司 一种语音语速自适应识别***

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003200507B2 (en) * 2002-02-15 2004-04-22 Yoshikazu Kasahara Method and apparatus for rapid language acquisition
US7672840B2 (en) 2004-07-21 2010-03-02 Fujitsu Limited Voice speed control apparatus
WO2006008810A1 (ja) * 2004-07-21 2006-01-26 Fujitsu Limited 速度変換装置、速度変換方法及びプログラム
JP2007298621A (ja) * 2006-04-28 2007-11-15 Nippon Hoso Kyokai <Nhk> 音声データ時間長調整装置およびそのプログラム
JP4740790B2 (ja) * 2006-04-28 2011-08-03 日本放送協会 音声データ時間長調整装置およびそのプログラム
JP2008058956A (ja) * 2006-07-31 2008-03-13 Matsushita Electric Ind Co Ltd 音声再生装置
JP2008107381A (ja) * 2006-10-23 2008-05-08 Mitsubishi Electric Corp 話速変換装置及び話速変換制御方法
JP2008107706A (ja) * 2006-10-27 2008-05-08 Yamaha Corp 話速変換装置およびプログラム
JP2010164785A (ja) * 2009-01-16 2010-07-29 Konami Digital Entertainment Co Ltd 刻限通知装置、刻限通知方法、ならびに、プログラム
CN112565881A (zh) * 2020-12-28 2021-03-26 北京五街科技有限公司 一种自适应的视频播放方法
CN112565880A (zh) * 2020-12-28 2021-03-26 北京五街科技有限公司 一种讲解类视频的播放方法
CN112565881B (zh) * 2020-12-28 2023-03-24 北京五街科技有限公司 自适应的视频播放方法和***
CN112565880B (zh) * 2020-12-28 2023-03-24 北京五街科技有限公司 讲解类视频的播放方法和***
CN114067787A (zh) * 2021-12-17 2022-02-18 广东讯飞启明科技发展有限公司 一种语音语速自适应识别***

Similar Documents

Publication Publication Date Title
JP2955247B2 (ja) 話速変換方法およびその装置
KR101334366B1 (ko) 오디오 배속 재생 방법 및 장치
JP2007086316A (ja) 音声合成装置、音声合成方法、音声合成プログラムおよび音声合成プログラムを記憶したコンピュータ読み取り可能な記憶媒体
JP2001184100A (ja) 話速変換装置
KR20050010927A (ko) 오디오 신호 처리 장치
JP2008116643A (ja) 音声生成装置
JP3378672B2 (ja) 話速変換装置
JP4778402B2 (ja) 休止時間長算出装置及びそのプログラム、並びに音声合成装置
US7092884B2 (en) Method of nonvisual enrollment for speech recognition
JP3373933B2 (ja) 話速変換装置
JP3081469B2 (ja) 話速変換装置
JP2001154684A (ja) 話速変換装置
JP2734028B2 (ja) 音声収録装置
JP4381108B2 (ja) 話速変換装置における時報処理装置
JP2007256815A (ja) 音声再生装置、音声再生方法、音声再生プログラム
KR100359988B1 (ko) 실시간 화속 변환 장치
JPH09146587A (ja) 話速変換装置
JP3201327B2 (ja) 録音再生装置
JP2007248750A (ja) 音声再生装置
JP2000162954A (ja) 言語学習装置及びこれを具備した電子機器
KR20010029111A (ko) 외국어 청취 보조 장치
JPH11143496A (ja) 音声録音再生装置
JPH04176244A (ja) 音声情報処理装置
JP2962777B2 (ja) 音声信号の時間軸伸長圧縮装置
JP2004061625A (ja) テキスト音声合成装置、テキスト音声合成方法、テキスト音声合成プログラム、および、プログラム記録媒体

Legal Events

Date Code Title Description
A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20041214