JP3189597B2 - 音声時間軸変換装置 - Google Patents

音声時間軸変換装置

Info

Publication number
JP3189597B2
JP3189597B2 JP26020694A JP26020694A JP3189597B2 JP 3189597 B2 JP3189597 B2 JP 3189597B2 JP 26020694 A JP26020694 A JP 26020694A JP 26020694 A JP26020694 A JP 26020694A JP 3189597 B2 JP3189597 B2 JP 3189597B2
Authority
JP
Japan
Prior art keywords
data
section
sound
time axis
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP26020694A
Other languages
English (en)
Other versions
JPH08123483A (ja
Inventor
正之 三崎
武志 則松
和彦 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP26020694A priority Critical patent/JP3189597B2/ja
Priority to EP95306302A priority patent/EP0702354A1/en
Publication of JPH08123483A publication Critical patent/JPH08123483A/ja
Application granted granted Critical
Publication of JP3189597B2 publication Critical patent/JP3189597B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ビデオテープレコーダ
ー(VTR)等で音声の低速再生を行なう際に必要とな
る、音声の時間軸の長さを任意に伸長を行なうことを可
能にする音声時間軸変換装置に関するものである。
【0002】
【従来の技術】従来より、ある速度で記録された音声信
号を記録時の速度と異なる速度で再生する音声時間軸変
換装置は存在する。例えば、テープレコーダーではテー
プの走行スピードを調節して再生速度を早めたり遅めた
りすることができる。しかし、再生スピードが変化する
のに伴って同時に音程も変化してしまうので、内容が聞
きづらくなってしまう。そこで、音程を変化させずに再
生速度を変化させることの可能な音声時間軸変換装置が
提案されている。
【0003】以下、従来の音声時間軸変換装置について
図面を参照しながら説明する。図4は従来の音声時間軸
変換装置の構成を表すブロック図である。図4におい
て、1は音響信号の記録および再生を行なう記録再生
部、2は再生されたアナログ信号をデジタル信号に変換
するA/D変換器、3はデジタルデータを記録するため
のバッファメモリ、4はD/A変換器、5はバッファメ
モリへのデータの書き込みを制御する制御部、6はメモ
リのデータの読み出しを制御する読み出し制御部であ
る。
【0004】以上のように構成された音声時間軸変換装
置について以下にその動作を説明する。ここでは、記録
媒体への記録速度以下で音声信号を再生する場合に、音
程を記録時の状態に戻して再生する音声時間軸変換装置
について説明する。
【0005】まず、記録再生部1において、記録時のM
倍(0<M<1)の速度で音響信号が再生される。ここ
で記録再生部とは、例えばVTR、テープレコーダー等
である。次に、記録再生部1から再生された音響信号
は、再生速度に反比例したサンプリング周期T/Mで、
A/D変換器2によりデジタル信号に変換される。ここ
で、Tは記録時の音響信号について標本化定理を満足す
るサンプリング周期であり、M倍速再生された音響信号
の場合には、その1/Mの周期になる。A/D変換され
たこれらのデジタル信号は、書き込み制御部5によって
周期T/Mでバッファメモリ3に順次記録されていく。
ここで、バッファメモリ3に記録された各デジタル信号
を、周期Tで読み出し再生すれば、記録時の音程に復元
できるが、出力信号を連続して出し続けるには入力信号
データが不足し、時間的に空白となる区間ができる。そ
のため、読み出し制御部6ではバッファメモリ3に蓄え
られたデジタル信号を数10msecのフレーム単位で2度
繰り返して読みだしを行う区間を設けるようにして、不
足するデータを補うようにする。読み出し制御部6によ
り読み出されたデジタル信号を、D/A変換器4により
サンプリング周期Tでアナログ信号に変換する。これら
一連の処理により、音程を変化させずに音声時間軸変換
が実現できる。ここで説明したような、音程一定で速度
のみを変換する技術については、例えば「『会話の時間
軸を圧縮/伸長するテープ・レコーダ』、小坂,横堀,
藤田,日経エレクトロニクス(1976.7.26)」
に詳しく解説されている。
【0006】図5は1/2倍速の場合の処理例を示して
いる。(a)は記録時のデータを示しており、(b)は
バッファメモリに蓄えられていくデータの時間的位置を
示している。(b)の各ブロックを2回づつ繰り返しな
がらサンプリング周期Tで再生したものが(c)のデー
タ列となり、これは(a)のデータ列と音程が同じであ
り、時間軸が2倍のスケールになっている。
【0007】
【発明が解決しようとする課題】上記した従来例では、
記録時の音程を保ち、音声速度は記録媒体の再生速度と
同一であり、記録時より遅く変換されている。ここで、
VTR等で画像情報を詳細にゆっくりと見たい場合など
において、記録媒体の再生速度を遅くしていくと、従来
の時間軸変換装置を用いた場合には、音声速度も画像と
同様に遅くなっていく。ここで、人間の会話速度を違和
感無く可変できる幅については、0.75〜1.5倍程
度といわれている。したがって、主として画像情報を詳
細にゆっくりと見たい場合に記録媒体の再生速度をあま
り遅くすると、再生される音声速度が必要以上に遅くな
りすぎて違和感が起こり、かえって聴き取りにくくな
る。また、これを回避するために、現在の記録媒体の再
生速度よりも早い速度で音声を聴取しようとすると、再
生すべき音声信号データが時間的に見て不足してしま
う。この場合、不足する音声データ区間が定期的に発生
し、この区間に無音データを挿入するなどの手段を用い
たとしても、不連続な音声信号となり極めて不自然な再
生音となる。
【0008】本発明は、上記課題を解決するもので、記
録媒体から記録速度以下の再生速度で読み出した場合
に、音声の速度は必要以上に遅くせず、不連続点を生じ
ることもなく、聴き取りやすい音声を聴取することが可
能な音声時間軸変換装置を提供することを目的とする。
【0009】
【課題を解決するための手段】上記課題を解決するため
に、請求項1記載の音声時間軸変換装置は、記録媒体に
記憶された音響信号を記録時のM(0<M<1)倍の速
度で読み出す再生部と、再生部で読み出されたアナログ
信号をデジタル信号へと変換するA/D変換器と、A/
D変換器の出力データを記憶する入力バッファと、音響
信号の有音区間と無音区間の判定を行なう有音無音判定
部と、入力バッファの音声データに時間軸伸長を行う時
間軸制御部と、時間軸制御部の出力データを記憶る出
力バッファと、出力バッファ内に記憶されているデータ
のデータ残量を計測するデータ残量監視部と、データ残
量監視部から得られたデータ残量に応じて時間軸伸長
伸長比を有音区間と無音区間の各々独立に決定する伸長
比制御部と、出力バッファに記録されている音声データ
をアナログ信号に変換するD/A変換器とを備え、時間
軸制御部は、有音無音判定部の出力信号と伸長比制御部
の出力信号に基づいて、無音区間の伸長比が有音区間の
伸長比より大きい伸長比で入力バッファの音声データを
時間軸伸長することを特徴とする。
【0010】
【0011】請求項記載の音声時間軸変換装置は、
力バッファの音声データを、無音区間1/M以上の伸
長比で、有音区間1.0以上1/M以下の伸長比で時
間軸伸長する時間軸制御部を備えたものである。
【0012】請求項記載の音声時間軸変換装置は、
力バッファ内のデータ残量が所定の値以下の場合、入力
バッファの音声データを、無音区間1/M以上の伸長
比で、有音区間は1/Mの伸長比で時間軸伸長する時間
制御部を備えたものである。
【0013】
【作用】上記の構成によれば、有音無音の判定の結果を
もとに、無音区間の伸長比を有音区間より大きくした時
間軸圧縮を行った後にバッファメモリに書き込みを行
う。この際に、バッファメモリ内に記録しているデータ
のデータ残量を計測し、データ残量が少なくなるほど伸
長比を大きくし、また、無音区間の割合が少なくても自
動的に伸長比を加減してバッファメモリに絶えず十分な
データが確保される構成にしたことにより、可能な限り
有音区間の再生速度を記録時に近い値に保って再生する
ことができ、聴き取りやすいスロー再生音を得ることが
できる。
【0014】また、バッファメモリに残っているデータ
の数であるデータ残量が極めて少ない場合には、有音区
間でも1/Mの伸長比で時間軸伸長して音切れを防ぎ、
それ以外の場合には無音区間の伸長比をデータ残量をも
とに調整する。これによって、音声の速度は所定の固定
値で再生しつつ、バッファメモリが空になることによっ
て出力信号がとぎれることもない、違和感の無い自然な
再生音を得ることができる。
【0015】
【実施例】以下、本発明の第1の実施例について図面を
参照しながら説明する。
【0016】図1は本発明の第1の実施例における音声
時間軸変換装置の構成を示すブロック図である。
【0017】図1において、101は音響信号の記録お
よび再生を行なう記録再生部、102は記録再生部1で
再生されたアナログ信号をデジタル信号に変換するA/
D変換器、103はAD変換された音響信号を一旦記録
するための入力バッファ、104は入力バッファから詠
み出されたデジタル信号列が有音区間であるか無音区間
であるかを判定する有音無音判定部、105は、入力バ
ッファから読み出された信号に対して所定の伸長比で時
間軸伸長処理を行う時間軸制御部、106は入力バッフ
ァからのデータの読み出しおよびそのアドレスを制御す
る読み出し制御部、107は出力バッファへのデータの
書き込みおよびそのアドレスを制御する書き込み制御
部、108は時間軸制御部で処理されたデータを一時的
に蓄える出力バッファ、109は出力バッファに一時的
に保存しているデータサイズを監視するデータ残量監視
部、110は時間軸制御部の伸長比をデータ残量監視部
の出力に応じて決定する伸長比制御部、111は出力バ
ッファに記録されたデジタルデータをアナログ信号に変
換するD/A変換器である。
【0018】以上のように構成された音声時間軸変換装
置について、以下その動作を図1を参照しながら詳細に
説明する。
【0019】まず、記録再生部101から記録時のM
(0<M<1)倍の速度で音響信号が読み出される。以
後、速度とは記録速度に対する相対速度を表すこととす
る。ここで、記録再生部101での記録時のサンプリン
グ周期をTとすると、記録再生部101よりM倍速で再
生された音響信号は逐次A/D変換器102によりサン
プリング周期T/Mでデジタル信号系列に変換されて、
入力バッファ103に書き込まれる。一方、D/A変換
器111は記録時と同じサンプリング周期Tでアナログ
信号への変換が行われるので、単位時間あたり入力信号
に比べて1/M倍の信号が出力バッファには適宜準備さ
れていなければならない。その際に、入力信号全体に同
じ割合の時間軸伸長を施すのではなく、無音区間には有
音区間より大きい伸長比で時間軸伸縮することで有音区
間の伸長比を下げるように動作させるのが基本的な考え
方である。
【0020】入力バッファから読み出された信号系列か
ら、有音無音判定部104によりそのサンプル値列が有
音区間であるか無音区間であるかの判定が行われる。こ
の有音/無音判定は公知の技術により容易に判定でき
る。この判定結果をもとに、時間軸制御部106は、入
力バッファから読み出したデータに対して時間軸伸長処
理を施して、出力バッファ108へ出力する。その際に
は、無音区間には無音区間用の伸長比で時間軸伸長し、
有音区間には有音区間用の伸長比で時間軸伸長が行われ
る。これらの伸長比はデータ残量監視部109で求めら
れたデータ残量をもとに伸長比制御部110で設定値を
与えられる。
【0021】データ残量監視部は、出力バッファに書き
込まれているが、D/A変換器111にはまだ出力され
ていないデータの残量をモニタしており、そのデータ残
量によって有音区間用伸長比と無音区間用伸長比を決定
する。したがって、出力バッファへのデータの溜まり具
合に応じて伸長比を調整することで、出力バッファが空
になることを防いでいる。
【0022】データ残量と伸長比の関係は例えば図2
(a)のように1次関数で与えられるものでも、あるい
は階段状に変化するものでもかまわない。図2(a)の
例において出力バッファが空に近い状態ほど伸長
大きくして、出力バッファにデータを溜まりやすくして
いる。特に無音区間の伸長を大きくしている。これ
は、有音区間の伸長を下げても出力バッファが空にな
らないようするためである。図2(b)の例では、有音
区間はデータ残量が0にならない限り伸長比1、すなわ
ち、記録時と同一の音声の速度で再生されることにな
る。この場合、有音区間の伸長が固定の1の状態で
は、有音区間が連続すると出力バッファ内のデータ残量
が急激に減少することになるので、無音区間の伸長
おおむね大きめにして、出力バッファにデータが溜まり
やすくしている。時間軸伸長することで出力バッファが
空にならないようにデータ数を増加させることはできる
が、むやみに大きい値の伸長比を与えていると出力バッ
ファの容量を越えてしまうことになり、出力信号の連続
性を保てなくなる。このため、データ残量が多くなるに
連れて、伸長比は小さく押さえてある。
【0023】以下は、記録媒体の再生速度を記録時の2
/3倍(M=2/3)にした場合を一例にとって、動作
説明を行う。
【0024】まず、図2の伸長比設定テーブルは、デー
タ残量が0のとき、有音区間の伸長を1.5にして、
入力信号に有音が与えられても出力バッファが空になる
ことを防いでいる。また、データ残量がほぼ出力バッフ
ァ容量と等しい場合には、無音区間の伸長比は1.5以
下に抑える必要がある。
【0025】図3は無音区間と有音区間とを別々の時間
軸伸長比で時間軸伸長を行う場合の処理の様子を時間軸
に関し模式的に示したものである。(a)の記録時の入
力信号に対して(b)は2/3倍の再生速度で記録媒体
から音声を再生した場合である。ここで、入力信号の無
音区間の割合に依存して無音区間、有音区間の伸長比を
決める必要がある。(c)と(d)には無音区間の割合
の異なる2つの例を示す。入力信号1から6の部分にお
いて、(c)の例では1,2,3が無音区間で、4,
5,6が有音区間とした場合の処理を行っている。
(d)の例では1,2が無音区間で、3,4,5,6が
有音区間とした場合の処理を行っている。この例では有
音区間の伸長比はともに1.0にしているため、無音区
間の伸長比は、(c)の例では2.0、(d)の例では
2.5となる。これらの例のように、無音区間の割合が
あらかじめ推定できれば、出力バッファから過不足なく
出力データをD/A変換器に供給し続けられるので、伸
長比を一定に固定しておけばよい。しかし、再生するソ
ースの種類によって無音の含まれる割合は様々である。
したがって、出力バッファに蓄えられたデータの量をモ
ニタしその値によって伸長比を決定し、出力バッファで
出力データの時間的な過不足を吸収することによって、
無音の割合が予想できない音声であっても、無音区間と
有音区間の伸長比を独立に設定することができる。
【0026】ここで、時間軸変換処理の解説については
例えば「『高品質音声速度変換方式のDSPによる実
現』、鈴木,三崎,電子情報通信学会 音声研究会資料
SP90-34、(1990.8.23)」などに詳しく記述されてい
る。
【0027】このような伸長比の制御を行なうことによ
り、無音区間の割合により時間軸伸長する伸長比が少々
変化するが、記録時の音声の速度以下で、かつ、記録媒
体の再生速度より早い音声の速度で、音声信号を聴取で
きることになる。
【0028】以上のように、本実施例によれば、データ
残量に基づいて有音区間・無音区間各々独立に時間軸伸
長比を設定し、データ残量が予め定めた一定量より少な
い時には有音区間の伸長比を1/Mに設定して出力信号
が途切れることを防ぎつつ、有音区間をできるだけ記録
時の音声の速度に近くする伸長比の制御を行うことで、
記録媒体の再生速度が遅くなっても違和感なく聞き取り
やすい再生音を得ることができる。
【0029】
【発明の効果】以上のように、本発明は、記録速度のM
倍(0<M<1)で再生された音響信号を有音無音判定
部で有音区間と無音区間の判定をし、時間軸制御部では
有音区間と無音区間に対して独立に設定した伸長比で時
間軸伸長して出力バッファに蓄え、出力バッファに記録
されているデータ残量に応じて無音区間および有音区間
の伸長比を予め定めた規則により決定し、無音区間伸長
比を1/M以上かつ、有音区間伸長比を1.0以上1/
M以下に設定して各々の伸長比を独立に変化させること
で、有音区間の音声の速度を再生速度より早くできる。
また、有音区間伸長比は、データ残量が所定の値以下の
場合には1/Mに設定し、それ以外の場合には指定した
固定値に設定し、かつ、無音区間伸長比を1/M以上の
範囲でデータ残量に対応した変換規則に基づいて決定す
ることにより、音声の速度は再生速度より早い一定値で
再生することができる。したがって、有音区間の音声の
速度をより記録時に近い値にして出力できる。また、無
音区間の含まれる割合に応じて無音伸長比と有音伸長
比、あるいは、無音伸長比のみを調整できるように、デ
ータ残量監視部を設けており、その結果、どのような入
力信号が与えられても、出力信号が途切れることなく再
生できる。
【0030】このように、本発明によれば、画像信号を
ゆっくりと見る都合によって、記録媒体の再生速度を遅
くしても音声信号を必要以上に遅い音声の速度で聞く必
要はなくなり、違和感の無い聞き取りやすいスロー再生
を可能にする音声時間軸変換装置を提供することができ
る。
【図面の簡単な説明】
【図1】本発明の実施例の音声時間軸変換装置の構成を
示すブロック図
【図2】本実施例の伸長比設定テーブルの説明図
【図3】本実施例の時間軸伸長処理の模式図
【図4】従来例の音声時間軸変換装置のブロック図
【図5】従来の時間軸伸長処理の模式図
【符号の説明】
101 記録再生部 102 A/D変換器 103 入力バッファ 104 有音無音判定部 105 時間軸制御部 106 読み出し制御部 107 書き込み制御部 108 出力バッファ 109 データ残量監視部 110 伸長比制御部 111 D/A変換器
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平7−191695(JP,A) 特開 平7−192392(JP,A) 特開 平6−289895(JP,A) 特開 平5−73089(JP,A) 特開 平3−205656(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 21/00 - 21/06

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 記録媒体に記憶された音響信号を記録時
    のM(0<M<1)倍の速度で読み出す再生部と、 前記再生部で読み出されたアナログ信号をデジタル信号
    へと変換するA/D変換器と、 前記AD変換器の出力データを記憶する入力バッファ
    と、前記音響信号 の有音区間と無音区間の判定を行なう有音
    無音判定部と、前記入力 バッファの音声データに時間軸伸長を行う時間
    軸制御部と、 前記時間軸制御部の出力データを記憶する出力バッファ
    と、 前記出力バッファ内に記憶されているデータのデータ残
    量を計測するデータ残量監視部と、 前記データ残量監視部から得られたデータ残量に応じ
    間軸伸長の伸長比を有音区間と無音区間の各々独立に
    決定する伸長比制御部と、 前記出力バッファに記録されている音声データをアナロ
    グ信号に変換するD/A変換器とを備え 前記時間軸制御部は、前記有音無音判定部の出力信号と
    前記伸長比制御部の出力信号に基づいて、無音区間の伸
    長比が有音区間の伸長比より大きい伸長比で前記入力バ
    ッファの音声データを時間軸伸長する ことを特徴とする
    音声時間軸変換装置。
  2. 【請求項2】 時間軸制御部は、入力バッファの音声デ
    ータを、無音区間1/M以上の伸長比で、有音区間
    1.0以上1/M以下の伸長比で時間軸伸長することを
    特徴とする請求項記載の音声時間軸変換装置。
  3. 【請求項3】 時間軸制御部は、出力バッファ内のデー
    タ残量が所定の値以下の場合、入力バッファの音声デー
    タを、無音区間1/M以上の伸長比で、有音区間は1
    /Mの伸長比で時間軸伸長することを特徴とする請求項
    1または請求項2記載の音声時間軸変換装置。
JP26020694A 1994-09-14 1994-10-25 音声時間軸変換装置 Expired - Fee Related JP3189597B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP26020694A JP3189597B2 (ja) 1994-10-25 1994-10-25 音声時間軸変換装置
EP95306302A EP0702354A1 (en) 1994-09-14 1995-09-08 Apparatus for modifying the time scale modification of speech

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26020694A JP3189597B2 (ja) 1994-10-25 1994-10-25 音声時間軸変換装置

Publications (2)

Publication Number Publication Date
JPH08123483A JPH08123483A (ja) 1996-05-17
JP3189597B2 true JP3189597B2 (ja) 2001-07-16

Family

ID=17344820

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26020694A Expired - Fee Related JP3189597B2 (ja) 1994-09-14 1994-10-25 音声時間軸変換装置

Country Status (1)

Country Link
JP (1) JP3189597B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001255894A (ja) * 2000-03-13 2001-09-21 Sony Corp 再生速度変換装置及び方法
US7978959B2 (en) * 2000-08-10 2011-07-12 Thomsong Licensing Memory addressing method suitable for systems having a variable speed data reproduction capability

Also Published As

Publication number Publication date
JPH08123483A (ja) 1996-05-17

Similar Documents

Publication Publication Date Title
EP1481392B1 (en) Trick mode audio playback
US6085157A (en) Reproducing velocity converting apparatus with different speech velocity between voiced sound and unvoiced sound
JPH10260694A (ja) 話速変換装置、話速変換方法及び記録媒体
JP3189597B2 (ja) 音声時間軸変換装置
JPH08328586A (ja) 音声時間軸変換装置
JP3189587B2 (ja) 音声時間軸変換装置
JPH09138698A (ja) 音声記録再生装置
JP3081469B2 (ja) 話速変換装置
JP3357742B2 (ja) 話速変換装置
JPH08292790A (ja) ビデオテープレコーダ
JP3966814B2 (ja) 簡易再生方法とこの方法に利用可能な簡易再生装置、復号方法、復号装置
JP2874607B2 (ja) 音声時間軸変換装置
JPH08211894A (ja) 音声通信機および音声通信システム
JPH0573089A (ja) 音声再生方法
JP2001318700A (ja) 話速変換装置
JPH08292796A (ja) 再生装置
JPH0854895A (ja) 再生装置
JPH04367898A (ja) 音声再生装置
JP2962777B2 (ja) 音声信号の時間軸伸長圧縮装置
JPH08255000A (ja) 音声信号再生装置
KR20010085664A (ko) 화속 변환 장치
JPH05303400A (ja) 音声再生装置と音声再生方法
JPH05100698A (ja) 音声記録再生装置
JPS62125577A (ja) 音声蓄積再生装置
JPH08315501A (ja) 録音用音声処理回路

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees