JPH09154107A - 映像・音声再生装置 - Google Patents

映像・音声再生装置

Info

Publication number
JPH09154107A
JPH09154107A JP7309174A JP30917495A JPH09154107A JP H09154107 A JPH09154107 A JP H09154107A JP 7309174 A JP7309174 A JP 7309174A JP 30917495 A JP30917495 A JP 30917495A JP H09154107 A JPH09154107 A JP H09154107A
Authority
JP
Japan
Prior art keywords
video
audio
voice
signal
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7309174A
Other languages
English (en)
Inventor
Koji Tanaka
浩司 田中
Masayuki Iida
正幸 飯田
Masanori Miyatake
正典 宮武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP7309174A priority Critical patent/JPH09154107A/ja
Publication of JPH09154107A publication Critical patent/JPH09154107A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Abstract

(57)【要約】 【課題】 この発明は、音声が話速変換される映像・音
声再生装置において、出力映像と出力音声とのずれを低
減することができる映像・音声再生装置を提供すること
を目的とする。 【解決手段】 映像源および音源から映像および音声を
それぞれ再生する映像・音声再生装置において、音源か
ら送られてくる音声信号のうち、少なくとも音声区間の
音声信号に対して話速変換を行なって、上記音声信号の
話速を遅くさせて出力させる音声出力手段12、映像源
から送られてくる映像信号に対して、音声出力手段12
から出力される音声信号の遅延量を算出する遅延量算出
手段45、ならびに算出された遅延量に応じて、映像源
から送られてくる映像信号を遅延させて出力させる映像
出力手段7、8を備えている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、映像および音声
を再生する映像・音声再生装置に関する。
【0002】
【従来の技術】ビデオテープレコーダ(VTR)におい
ては、再生開始時に設定された再生速度で、映像および
音声が再生されている。短い時間で、再生を行いたい場
合には、たとえば、2倍速の再生速度で映像および音声
を再生することができる。
【0003】しかしながら、2倍速再生のような高速再
生を行った場合には、再生音声が聴き取りにくくなる。
そこで、VTRの2倍速再生時に再生された音声を時間
軸圧縮伸長処理することにより、音声の出力速度をゆっ
くりさせる話速変換技術がすでに開発されている。この
際、話速変換された音声は、音声メモリに蓄積された後
に出力される。出力映像と出力音声とのずれが大きくな
らないように、入力音声のうち、無音区間の信号は話速
変換されずに削除される。つまり入力音声のうち、音声
区間の信号のみが話速変換される。
【0004】また、音声メモリに蓄積されており、かつ
未だ読み出されていない音声データ量が所定値に達する
と、つまり、出力映像と出力音声とのずれが所定値に達
すると、音声メモリはクリアされ、出力映像と出力音声
とのずれが一旦零とされる。
【0005】出力映像と出力音声とのずれの大きさは、
入力音声に含まれている無音区間の量によって変動す
る。つまり、無音区間が多いほど出力映像と出力音声と
のずれは小さくなる。逆に無音区間が少ないほど、出力
映像と出力音声とのずれは大きくなる。したがって、出
力映像と出力音声とのずれの大きさは変動する。
【0006】
【発明が解決しようとする課題】この発明は、音声が話
速変換される映像・音声再生装置において、出力映像と
出力音声との時間ずれを低減することができる映像・音
声再生装置を提供することを目的とする。
【0007】
【課題を解決するための手段】この発明による映像・音
声再生装置は、映像源および音源から映像および音声を
それぞれ再生する映像・音声再生装置において、音源か
ら送られてくる音声信号のうち、少なくとも音声区間の
音声信号に対して話速変換を行なって、上記音声信号の
話速を遅くさせて出力させる音声出力手段、映像源から
送られてくる映像信号に対して、音声出力手段から出力
される音声信号の遅延量を算出する遅延量算出手段、な
らびに算出された遅延量に応じて、映像源から送られて
くる映像信号を遅延させて出力させる映像出力手段を備
えていることを特徴とする。
【0008】この発明による映像・音声再生装置では、
映像源から送られてくる映像信号に対して、音声出力手
段から出力される音声信号の遅延量が算出される。そし
て、算出された遅延量に基づいて、映像源から送られて
くる映像信号が遅延せしめられて出力される。このた
め、出力映像と出力音声とのずれを低減させることがで
きる。
【0009】音声出力手段としては、たとえば、音声メ
モリ、音源から送られてくる音声信号が、音声区間の音
声か無音区間の音声かを判別する判別手段、音源から送
られてくる音声信号が、音声区間の音声または継続長が
所定値未満である無音区間の音声であるときには、上記
音声信号をその音声速度が遅くなるように時間軸圧縮伸
長処理する手段、ならびに音源から送られてくる音声信
号が、継続長が所定値以上の無音区間の音声であるとき
には、上記音声信号を削除する手段を備えているものが
用いられる。
【0010】遅延量算出手段としては、たとえば、上記
音声メモリに蓄積されておりかつ未だ出力されていない
音声信号のデータ量に基づいて、遅延量を算出するもの
が用いられる。
【0011】映像出力手段としては、たとえば、映像源
から送られてくる映像信号を格納する画像メモリ、なら
びに画像メモリからの映像信号の読み出しを、遅延量算
出手段によって算出された遅延量に基づいて制御するこ
とにより、映像源から送られてくる映像信号を遅延量に
応じて遅延して出力させる手段を備えているものが用い
られる。
【0012】
【発明の実施の形態】以下、図面を参照して、この発明
をビデオテープレコーダに適用した場合の実施の形態に
ついて説明する。
【0013】図1は、ビデオテープレコーダ(VTR)
の概略構成を示している。このVTRの動作モードに
は、従来のVTRが備えている一般的な再生モードの他
に、高速再生時に出力音声をゆっくりさせる話速変換再
生モードがある。
【0014】2つの回転ヘッド2、3は、ビデオテープ
1の映像トラックを再生する。回転ヘッド2、3によっ
て交互に再生された映像は、ヘッド切り替え回路4を介
して映像再生回路5に供給され、映像再生回路5で映像
信号に変換される。映像再生回路5によって得られた映
像信号は、セレクタ6に送られる。セレクタ6は、一般
的な再生モードが選択されているときには、送られてき
た映像信号を、そのまま、図示しない表示装置に供給す
る。
【0015】話速変換再生モードが選択されているとき
には、セレクタ6は送られてきた映像信号を画像メモリ
7に送る。したがって、話速変換再生モードが選択され
ているときには、映像再生回路5によって得られた映像
信号は、画像メモリ7を介して、表示装置に供給され
る。画像メモリ7からの画像の読み出しは、映像遅延制
御部8によって制御される。映像遅延制御部8は、後述
する音声分析・加工部12から制御信号に基づいて、画
像メモリ7からの画像の読み出しを制御する。ここで画
像メモリ7とは、画像信号を記録できるものであり、半
導体素子からなるメモリ、光磁気や磁気バブルからなる
磁気メモリ等をいう。
【0016】オーディオヘッド9は、ビデオテープ1の
オーディオトラックを再生する。オーディオヘッド9に
よって読み出された音声信号は、セレクタ10に送られ
る。セレクタ10は、一般的な再生モードが選択されて
いるときには、オーディオヘッド9によって読み出され
た音声信号を、音声再生回路11に供給する。音声再生
回路11は、入力された音声信号を再生して出力する。
【0017】話速変換再生モードが選択されているとき
には、セレクタ10は、オーディオヘッド9によって読
み出された音声信号を音声分析・加工部12に送る。音
声分析・加工部12は、入力された音声信号を分析する
とともに、分析結果に応じて入力された音声信号を加工
する。また、映像再生回路5から出力される映像に対す
る出力音声の遅延量を算出し、算出された遅延量に応じ
た制御信号を映像遅延制御部8に送る。
【0018】モータ制御部13は、キャプスタンモータ
14を制御する。モータ制御部13は、図示しない操作
部によって設定された再生速度に基づいて、キャプスタ
ンモータ14を制御する。
【0019】以下、話速変換再生モードが設定されてい
るときの動作について説明する。
【0020】図2は、音声分析・加工部12の構成例を
示している。
【0021】音声分析・加工部12は、音声信号入力部
41、区間判別部42、信号処理部43、音声メモリ4
4、遅延量算出部45および音声信号出力部46を備え
ている。信号処理部43は、時間軸圧縮伸長部51、削
除部52等を備えている。
【0022】音声信号入力部41は、たとえば、増幅
部、A/D変換部、フレームメモリ等を備えている。音
声信号入力部41に入力された信号は、増幅された後、
ディジタル信号に変換されて、フレームメモリに格納さ
れる。音声信号入力部41の出力は、区間判別部42と
信号処理部43とに送られる。この実施例では、音声分
析・加工部12にアナログ信号が入力される場合を示し
たが、ICメモリ等から読み出されたディジタル信号を
音声分析・加工部12に入力するようにしてもよい。こ
の場合には、音声信号入力部41にA/D変換部を設け
る必要はない。
【0023】区間判別部42では、入力信号が音声区間
であるか無音区間であるかが判別される。区間判別部4
2においては、たとえば、音声信号入力部41のフレー
ムメモリに格納された1フレーム分の音声データが無音
区間であるか音声区間であるかが判定される。
【0024】無音区間であるか音声区間であるかの判定
は、たとえば、音声信号入力部41のフレームメモリに
格納された1フレーム分の音声データのパワー平均が所
与のしきい値以上か否かによって行われる。つまり、パ
ワー平均が所与のしきい値以上であれば、音声区間と判
別され、パワー平均が所与のしきい値より小さければ、
無音区間と判定される。
【0025】より具体的に説明すると、音声信号入力部
41のフレームメモリから読み出された1フレーム分の
音声データの平均パワー値Pが計算される。この平均パ
ワー値Pは、サンプリングされた1フレーム内の各音声
データの振幅をi0 ,i1 ,…iN -1(Nは1フレーム
分の音声データ数)とすると、次の数式1によって算出
される。
【0026】
【数1】
【0027】算出された平均パワー値Pは、しきい値T
hと比較される。平均パワー値Pがしきい値Th以上
(P≧Th)のときには、現フレームが音声区間である
ことを示す信号が、平均パワー値Pがしきい値Thより
小さい(P<Th)ときには、現フレームが無音区間で
あることを示す信号が、区間判別部42から出力され
る。区間判別部42による判別結果は、信号処理部43
に送られる。区間判別部としては、平均パワー値Pに基
づいて区間を判別するものの他、パワースペクトル等の
公知の技術によって区間を判別するものを用いてもよ
い。なお、無音区間には、人間の発する音声以外の定常
雑音および背景雑音も含まれる。
【0028】信号処理部43では、音声信号入力部41
から送られてくる入力信号に対して、区間判別部42の
判別結果に応じた処理が行なわれる。つまり、継続長が
所定値以上の無音区間の入力信号は、削除部52によっ
て削除される。また、音声区間の入力信号および継続長
が所定値未満の無音区間の入力信号に対しては、時間軸
圧縮伸長部51によって、現在の再生速度倍率をnとし
て1/n以上の圧縮率で時間軸圧縮伸長処理が施され
る。
【0029】たとえば、話速変換再生モードによる再生
開始時に再生速度が2倍速に設定されている場合には、
音声区間の入力音声および継続長が所定値未満の無音区
間の入力音声は、時間軸圧縮伸長部51によってたとえ
ば、圧縮率2/3で圧縮伸長処理されて出力される。ま
た、継続長が所定値以上の無音区間の入力音声は、削除
部52によって削除される。
【0030】時間軸圧縮伸長部51で用いられる時間軸
圧縮伸長法としては、たとえば、ポインタ移動制御によ
る重複加算法(Pointer Interval Control Overlap and
Add: PICOLA)、TDHS(Time Domain Harmonic Scaling)
法等がある。
【0031】PICOLAを用いて、入力信号(時間軸
圧縮伸長部51への入力音声データ)を圧縮率2/3で
圧縮する方法について、図3を用いて簡単に説明する。
まず、入力信号からピッチ周期が抽出される。抽出され
たピッチ周期をTpとする。波形Aに対しては、1から
0へ直線的に向かう重み(重み関数K1)がつけられ
て、波形A’が作成される。波形Bに対しては0から1
に向かう重み(重み関数K2)がつけられて、波形B’
が作成される。
【0032】そして、これらの波形A’およびB’が加
え合わされ、長さTpの波形A’*B’が作成される。
これらの重みは、波形A’*B’の前後の接続点での連
続性を保つためにつけられている。次に、ポインタが、
圧縮率に基づいて決定される長さである3Tp分だけ移
動され、同様な操作が行われる。これにより、3つの波
形A、B、Cから2つの波形A’*B’とCとが得られ
る。このようにして、3ピッチ周期分の信号が、2ピッ
チ周期分の信号に圧縮される。これにより、出力音声
は、標準音声速度の3/2倍速となる。ただし、音程は
元のままとなる。
【0033】信号処理部43の出力は、音声メモリ44
に一旦蓄積された後、音声信号出力部46に送られて出
力される。音声信号出力部46は、D/A変換部を備え
ている。音声メモリ44から音声信号出力部46に送ら
れてきたディジタル信号は、アナログ信号に変換されて
音声信号出力部46から出力される。この実施例では、
音声分析・加工部12から音声信号をアナログ信号とし
て出力する場合を示したが、音声分析・加工部12から
音声信号をディジタル信号として出力するようにしても
よい。この場合には、音声信号出力部46にD/A変換
部を設ける必要はない。
【0034】なお、音声分析・加工部12の入出力信号
が共にアナログ信号である場合には、音声信号出力部4
6内のD/A変換部のサンプリング周波数は、標準サン
プリング周波数fSOに設定され、音声信号入力部41内
のA/D変換部のサンプリング周波数は、現在の再生速
度倍率をnとすると、n・fSOに設定される。したがっ
て、高速再生時においても、出力音声の音程は元の音程
となる。
【0035】また、音声分析・加工部12の入出力信号
が共にディジタル信号である場合には、現在の再生速度
倍率をnとすると、音声信号出力部46から出力される
データの出力速度に対して、音声信号入力部41に入力
されるデータの入力速度は、n倍となるように設定され
る。したがって、高速再生時においても、出力音声の音
程は元の音程となる。
【0036】なお、上記実施の形態では、音声メモリ4
は、信号処理部43の後段に配置されているが、信号処
理部43の前段(音声信号入力部41の後段)に音声メ
モリを配置するようにしてもよい。この場合も、出力さ
れる映像に対する出力音声の遅延量は、音声メモリの未
読み出しデータ量となる。
【0037】遅延量算出部45は、音声メモリ44内に
書き込まれているが読み出されていない音声データの量
(未読み出しデータ量)を算出する。この未読み出しデ
ータ量は、入力音声に対する出力音声の遅延量に応じた
値となる。言い換えれば、映像再生回路5から出力され
る映像に対する出力音声の遅延量に応じた値となる。遅
延量算出部45によって算出された遅延量は、信号処理
部43に送られるとともに、映像遅延制御部8にも送ら
れる。音声分析・加工部12は、遅延量算出部45から
送られてきた遅延量が所定値に達した場合には、音声メ
モリ44を一旦クリアする。
【0038】映像遅延量制御部8は、遅延量算出部45
から送られてきた遅延量に応じて、出力映像が遅延する
ように、画像メモリ7からの映像の読み出しを制御す
る。具体的には、遅延量算出部45から送られてきた遅
延量に応じて、画像メモリ7からの映像の読み出し速度
を遅くする。あるいは、遅延量算出部45から送られて
きた遅延量に応じて、画像メモリ7から同じ映像を繰り
返して読み出す。したがって、出力映像と出力音声との
間の時間的なずれが低減される。
【0039】上記実施の形態では、VTRの高速再生時
への応用例について説明したが、通常速度の音声をゆっ
くりした音声に変換する聴覚補助や語学学習用途にもこ
の発明を適用できることはいうまでもない。また、VT
R以外として、レーザディスク、ディジタルビデオディ
スク、TV、TV電話、TV会議システム等にも、この
発明を適用することができる。
【0040】
【発明の効果】この発明によれば、音声が話速変換され
る映像・音声再生装置において、出力映像と出力音声と
のずれを低減させることができる。
【図面の簡単な説明】
【図1】ビデオテープレコーダの概略構成を示す構成図
である。
【図2】図1の音声分析・加工部の構成を示すブロック
図である。
【図3】PICOLAを用いた時間軸圧縮伸長法を説明
するための模式図である。
【符号の説明】
2、3 回転ヘッド 5 映像再生回路 7 画像メモリ 8 映像遅延制御部 9 オーディオヘッド 12 音声分析・加工部 41 音声信号入力部 42 区間判別部 43 信号処理部 44 音声メモリ 45 遅延量算出部 46 音声信号出力部 51 時間軸圧縮伸長部 52 削除部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 映像源および音源から映像および音声を
    それぞれ再生する映像・音声再生装置において、 音源から送られてくる音声信号のうち、少なくとも音声
    区間の音声信号に対して話速変換を行なって、上記音声
    信号の話速を遅くさせて出力させる音声出力手段、 映像源から送られてくる映像信号に対して、音声出力手
    段から出力される音声信号の遅延量を算出する遅延量算
    出手段、ならびに算出された遅延量に応じて、映像源か
    ら送られてくる映像信号を遅延させて出力させる映像出
    力手段、 を備えていることを特徴とする映像・音声再生装置。
  2. 【請求項2】 音声出力手段は、 音声メモリ、 音源から送られてくる音声信号が、音声区間の音声か無
    音区間の音声かを判別する判別手段、 音源から送られてくる音声信号が、音声区間の音声また
    は継続長が所定値未満である無音区間の音声であるとき
    には、上記音声信号をその音声速度が遅くなるように時
    間軸圧縮伸長処理する手段、ならびに、 音源から送られてくる音声信号が、継続長が所定値以上
    の無音区間の音声であるときには、上記音声信号を削除
    する手段、 を備えている請求項1に記載の映像・音声再生装置。
  3. 【請求項3】 遅延量算出手段は、音声メモリに蓄積さ
    れておりかつ未だ出力されていない音声信号のデータ量
    に基づいて、遅延量を算出するものである請求項2に記
    載の映像・音声再生装置。
  4. 【請求項4】 映像出力手段は、 映像源から送られてくる映像信号を格納する画像メモ
    リ、ならびに 画像メモリからの映像信号の読み出しを、遅延量算出手
    段によって算出された遅延量に基づいて制御することに
    より、映像源から送られてくる映像信号を遅延量に応じ
    て遅延して出力させる手段、 を備えている請求項3に記載の映像・音声再生装置。
JP7309174A 1995-11-28 1995-11-28 映像・音声再生装置 Pending JPH09154107A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7309174A JPH09154107A (ja) 1995-11-28 1995-11-28 映像・音声再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7309174A JPH09154107A (ja) 1995-11-28 1995-11-28 映像・音声再生装置

Publications (1)

Publication Number Publication Date
JPH09154107A true JPH09154107A (ja) 1997-06-10

Family

ID=17989829

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7309174A Pending JPH09154107A (ja) 1995-11-28 1995-11-28 映像・音声再生装置

Country Status (1)

Country Link
JP (1) JPH09154107A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007047312A (ja) * 2005-08-08 2007-02-22 Sony Corp 話速変換装置
JP2009105666A (ja) * 2007-10-23 2009-05-14 Panasonic Electric Works Co Ltd 拡声通話装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007047312A (ja) * 2005-08-08 2007-02-22 Sony Corp 話速変換装置
JP2009105666A (ja) * 2007-10-23 2009-05-14 Panasonic Electric Works Co Ltd 拡声通話装置

Similar Documents

Publication Publication Date Title
JP4895418B2 (ja) 音声再生方法および音声再生装置
KR20000068955A (ko) 음성처리방법, 음성처리장치 및 기록재생장치
JP3630609B2 (ja) 音声情報再生方法ならびに装置
EP1483908B1 (en) Audio frequency scaling during video trick modes utilizing digital signal processing
JPH10260694A (ja) 話速変換装置、話速変換方法及び記録媒体
JPS5982608A (ja) 音声の再生速度制御方式
JPH09154107A (ja) 映像・音声再生装置
JP3378672B2 (ja) 話速変換装置
JPH09147472A (ja) 映像・音声再生装置
JPH09152889A (ja) 話速変換装置
JP3162945B2 (ja) ビデオテープレコーダ
JP4212253B2 (ja) 話速変換装置
JP3081469B2 (ja) 話速変換装置
JP3357742B2 (ja) 話速変換装置
JP2000099097A (ja) 信号再生装置及び方法、音声信号再生装置、並びに、音声信号の速度変換方法
JPH09146587A (ja) 話速変換装置
JPH08292796A (ja) 再生装置
JP2874607B2 (ja) 音声時間軸変換装置
JPH05303400A (ja) 音声再生装置と音声再生方法
JPH0854895A (ja) 再生装置
JPH08293137A (ja) 再生装置
JPH0713596A (ja) 音声速度変換方法
KR100359988B1 (ko) 실시간 화속 변환 장치
JP2001318700A (ja) 話速変換装置
JP3530310B2 (ja) 磁気記録再生装置