JP2874607B2 - 音声時間軸変換装置 - Google Patents

音声時間軸変換装置

Info

Publication number
JP2874607B2
JP2874607B2 JP7234903A JP23490395A JP2874607B2 JP 2874607 B2 JP2874607 B2 JP 2874607B2 JP 7234903 A JP7234903 A JP 7234903A JP 23490395 A JP23490395 A JP 23490395A JP 2874607 B2 JP2874607 B2 JP 2874607B2
Authority
JP
Japan
Prior art keywords
data
control unit
time axis
read
speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP7234903A
Other languages
English (en)
Other versions
JPH08137492A (ja
Inventor
和彦 佐藤
正之 三崎
武志 則松
公治 渡辺
憲和 上野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP7234903A priority Critical patent/JP2874607B2/ja
Publication of JPH08137492A publication Critical patent/JPH08137492A/ja
Application granted granted Critical
Publication of JP2874607B2 publication Critical patent/JP2874607B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ビデオテープレコーダ
ー(VTR)等で音声の低速再生を行なう際に必要とな
る、音声の時間軸の長さを任意に伸長を行うことを可能
にする音声時間軸変換装置に関するものである。
【0002】
【従来の技術】従来より、音声信号を記録時の速度と異
なる速度で再生する音声時間軸変換装置は存在する。例
えばテープレコーダーではテープの走行スピードを調節
して再生速度を速くしたり遅くしたりすることができ
る。しかし、再生スピードが変化するのに伴って同時に
音程も変化してしまうので、内容が聴きづらくなってし
まう。そこで、音程を変化させずに再生速度を変化させ
ることの可能な音声時間軸変換装置が提案されている。
【0003】以下、従来の音声時間軸変換装置について
図面を参照しながら説明する。図8は従来の音声時間軸
変換装置の構成を表すブロック図である。図8において
1は音響信号の記録および再生を行なう記録再生部、2
は再生されたアナログ信号をデジタル信号に変換するA
/D変換器、3はデジタルデータを蓄積するためのバッ
ファメモリ、4はD/A変換器、5はバッファメモリへ
のデータの書き込みを制御する書き込み制御部、6はバ
ッファメモリのデータの読み出しを制御する読み出し制
御部である。
【0004】以上のように構成された音声時間軸変換装
置について以下にその動作を説明する。ここでは記録媒
体への記録速度以下で音声信号を再生する場合に、音程
を記録時の状態に戻して再生する音声時間軸変換装置に
ついて説明する。
【0005】まず、記録再生部1は記録時の速度で音響
信号を再生する。ここで記録再生部とは、例えばVT
R、テープレコーダー等である。次に、記録再生部1か
ら再生された音響信号を、A/D変換器2により標本化
定理を満足するサンプリング周期Tでデジタル信号に変
換させる。A/D変換されたこれらのデジタル信号を、
書き込み制御部5により周期Tで順次バッファメモリ3
に蓄積させる。次に、バッファメモリ3に蓄積された各
デジタル信号を、一定時間に対応する区間ごとにグルー
プ化し、それぞれの区間を少なくとも2回以上繰り返し
連続で読み出す。最後に、読み出し制御部6により読み
出されたデジタル信号を、D/A変換器4によりサンプ
リング周期Tでアナログ信号に変換する。これら一連の
処理により音程を変化させずに音声時間軸変換が実現で
きる。
【0006】図9は時間軸変換速度比0.5の場合の処
理例を示している。(a)は記録時のデータを示してお
り、(b)はバッファメモリに蓄えられたデータを示し
ている。(b)の各ブロックを2回ずつ繰り返しながら
サンプリング周期Tで再生したものが(c)のデータ列
となり、これは(a)のデータ列と音程が同じであり長
さが時間軸方向に2倍になっている。
【0007】
【発明が解決しようとする課題】上述した従来例では、
音程は記録時のものと変わらないが、音声の速度が記録
媒体からの再生速度だけに依存してしまい、均一の再生
速度の制御しか行えない。さらに、繰り返されるブロッ
ク間では音声の連続性が損なわれ再生音の品質は低下し
聴きづらいのものになる。また、記録媒体からの再生速
度よりも遅い速度に変換する場合には入力信号を蓄積し
ておくバッファメモリが不足する可能性がある。その場
合、バッファメモリ上のデータを減らすために何らかの
データを破棄しなければならず、その結果、情報の欠落
が生じる。
【0008】本発明は、上記課題を解決するものであ
り、記録媒体から記録速度を含めてそれ以下の再生速度
で読み出した場合に、情報の欠落をできるだけ抑制しな
がら自動的に聴きやすい速度に変更することが可能な音
声時間軸変換装置を提供することを目的とする。
【0009】
【課題を解決するための手段】上記課題を解決するため
に本発明の請求項1記載の音声時間軸変換装置は、記録
再生部(101)、A/D変換器(102)、有音無音
判定部(103)、バッファメモリ(105)、書き込
み制御部(104)、時間軸制御部(109)、読み出
し制御部(106)、データ残量監視部(107)、適
応速度制御部(108)、D/A変換器(110)から
なる音声時間軸変換装置であって、記録再生部(10
1)は、記録媒体に記憶された音響信号を記録時のM倍
(M≦1)の速度比で読み出し、A/D変換器(10
2)は、記録再生部(101)で読み出された音響信号
をデジタルデータに変換し、有音無音判定部(103)
は、A/D変換器(102)の出力するデジタルデータ
の有音部分と無音部分の判定を行い、書き込み制御部
(104)は、有音無音判定部(103)の判定が有音
部分のデジタルデータのみをバッファメモリ(105)
に書き込むように書き込みアドレスを制御し、時間軸制
御部(109)は、適応速度制御部(108)が決定し
た時間軸変換速度比に基づいて読み出し制御部(40
1)に読み出し処理を行わせると共に、バッファメモリ
(105)から読み出されるデジタルデータに時間軸伸
張を行って出力し、読み出し制御部(106)は、デジ
タルデータをバッファメモリ(105)から読み出すよ
うに読み出しアドレスを制御し、データ残量監視部(1
07)は、書き込み制御部(104)が最後に制御した
書き込みアドレスと読み出し制御部(106)が最後に
制御した読み出しアドレスに基づいてバッファメモリ
(105)の未処理データ量を監視し、適応速度制御部
(108)は、データ残量監視部(107)の未処理デ
ータ量に基づいて時間軸変換速度比を決定し、D/A変
換器(110)は、時間軸制御部(109)が出力する
デジタルデータをアナログ信号に変換することを特徴と
するものである。
【0010】請求項2記載の音声時間軸変換装置は、
録再生部(101)、A/D変換器(102)、有音無
音判定部(103)、バッファメモリ(105)、書き
込み制御部(104)、時間軸制御部(109)、読み
出し制御部(106)、データ残量監視部(107)、
適応速度制御部(108)、D/A変換器(110)か
らなる音声時間軸変換装置であって、記録再生部(10
1)は、記録媒体に記憶された音響信号を記録時のM倍
(M≦1)の速度比で読み出し、A/D変換器(10
2)は、記録再生部(101)で読み出された音響信号
をデジタルデータに変換し、有音無音判定部(103)
は、A/D変換器(102)の出力するデジタルデータ
の有音部分と無音部分の判定を行い、書き込み制御部
(104)は、データ残量監視部(107)の未処理デ
ータ量が一定量以下の場合には、A/D変換器(10
2)の出力するデジタルデータをバッファメモリ(10
5)に書き込むように書き込みアドレスを制御し、デー
タ残量監視部(107)の未処理データ量が一定量以上
の場合には、有音無音判定部(103)の判定が有音部
分のデジタルデータのみをバッファメモリ(105)に
書き込むように書き込みアドレスを制御し、時間軸制御
部(109)は、適応速度制御部(108)が決定した
時間軸変換速度比に基づいて読み出し制御部(401)
に読み出し処理を行わせると共に、バッファメモリ(1
05)から読み出されるデジタルデータに時間軸伸張を
行って出力し、読み出し制御部(106)は、デジタル
データをバッファメモリ(105)から読み出すように
読み出しアドレスを制御し、データ残量監視部(10
7)は、書き込み制御部(104)が最後に制御した書
き込みアドレスと読み出し制御部(106)が最後に制
御した読み出しアドレスに基づいてバッファメモリ(1
05)の未処理データ量を監視し、適応速度制御部(1
08)は、データ残量監視部(107)の未処理データ
量に基づいて時間軸変換速度比を決定し、D/A変換器
(110)は、時間軸制御部(109)が出力するデジ
タルデータをアナログ信号に変換することを特徴とする
ものである。
【0011】請求項3記載の発明は、時間軸制御部(1
09)は、制御回路(401)、切替回路(402)、
クロスフェード手段(403、404)からなり、制御
回路(401)は、適応速度制御部(108)が決定し
た時間軸変換速度比に基づいてクロスフェード区間と無
処理区間を決定して読み出し制御部(401)に読み出
し処理を行わせると共に、時間軸変換速度比に基づいて
切替回路(402)の切替制御を行い、切替回路(40
2)は、バッファメモリ(105)から入力されるデジ
タルデータをD/A変換器(110)、若しくは、クロ
スフェード手段(403、404)に切替出力し、クロ
スフェード手段(403、404)は、A、Bの順に互
いに隣り合うクロスフェード区間A、Bにおいて、単調
増加する重み係数をクロスフェード区間Aに掛け合わせ
た値と、単調減少する重み係数をクロスフェード区間B
に掛け合わせた値とを加算してD/A変換器(110)
へ出力することを特徴とするものである。
【0012】請求項4記載の発明は、適応速度制御部
(110)の決定する時間軸変換速度比は、速度M以下
であって、未処理データ量に比例することを特徴とする
ものである。
【0013】請求項5記載の発明は、適応速度制御部
(110)の決定する時間軸変換速度比は、速度M以下
であって、未処理データ量に非線形に対応することを特
徴とするものである。
【0014】
【作用】請求項1記載の構成によれば、有音無音の判定
の結果、有音と判定された区間のみをバッファメモリに
蓄積し、書き込みと読み出しのアドレス位置からデータ
残量を計測し、その残量に応じて残量の多いときはでき
るだけ再生速度に近い速度で、残量が少なくなるにつれ
て徐々に低速になるといったように、無音の量に応じて
自動的に速度を調整でき、可能な限り有音部を遅く再生
することが可能となる。また、記録速度と同じ速度で再
生する場合でも、無音の量に応じて時間軸変換後の速度
を記録速度より低速になるように制御すれば、もともと
早口の音声や外国語ソースの聴き取りを容易にすること
も可能である。
【0015】請求項2記載の構成によれば、データ残量
が少ない時点では入力信号の有音無音判定結果にかかわ
らずすべてのデータをバッファメモリに蓄積することに
より、読み出すべきデータがなくなり途中で再生音が無
音状態となる(ミュート状態となる)ことがなく、違和
感の少ない自然な再生音を得ることができる。
【0016】請求項3記載の構成によれば、クロスフェ
ード処理区間長および無処理区間長の長さを調整するこ
とによって、任意の時間軸変換速度比で時間軸変換する
ことができる。さらに、クロスフェード処理を行う区間
長を固定長にすれば、バッファメモリに蓄積されたデー
タを直接出力する無処理区間長を調節するだけで、任意
の時間軸変換速度比を得ることができ、非常に簡単な構
成で任意の速度に変換可能な音声時間軸変換装置が実現
できる。
【0017】請求項4記載の構成によれば、データ残量
と時間軸変換速度比が比例して変化するので、音声の速
度が急激に変化することが抑えられ、音声が聴き取りや
すくなる。
【0018】請求項5記載の構成によれば、低速の速度
に長くとどまるような非線形の変換規則を設定すれば、
時間軸変換速度比を低く抑えようとする効果により低速
側で安定して音声を再生することが可能であり、非常に
聴き取りやすい音声時間軸変換装置が実現できる。
【0019】
【実施例】以下、本発明の第1の実施例について図面を
参照しながら説明する。図1は本発明の第1の実施例に
おける音声時間軸変換装置の構成を示すブロック図であ
る。図1において、101は音響信号の記録および再生
を行う記録再生部、102は記録再生部1で再生された
アナログ信号をデジタル信号に変換するA/D変換器、
103は変換されたデジタル信号列が有音部であるか無
音部であるかを判定する有音無音判定部、104は有音
部と判定された信号列を書き込むバッファメモリ105
上への書き込みおよびそのアドレスを制御する書き込み
制御部、106はバッファメモリ105に蓄積されたデ
ータの読み出しおよびそのアドレスを制御する読み出し
制御部、107は現在のバッファメモリ105上への書
き込みアドレスと読み出しアドレスの位置関係からデー
タ残量を計測するデータ残量監視部、108はデータ残
量監視部で得られたデータ残量から時間軸変換速度比を
決定する適応速度制御部、109は適応速度制御部で決
定された時間軸変換速度比に従って時間軸の変換処理を
行う時間軸制御部、110は時間軸変換されたデジタル
データをアナログ信号に変換するD/A変換器である。
【0020】以上のように構成された音声時間軸変換装
置について、以下その動作を図1を参照しながら詳細に
説明する。
【0021】まず、記録再生部101から記録時のM
(≦1)倍の速度で音響信号が読み出される。以後、時
間軸変換速度比とは記録速度に対する相対速度を表すこ
ととする。ここで、記録再生部101での記録時のサン
プリング周期をTとすると、記録再生部101よりM倍
速で再生された音響信号は逐次A/D変換器102によ
りサンプリング周期T/Mでデジタル信号系列に変換さ
れる。有音無音判定部103によりこのサンプル値列が
有音部であるか無音部であるかを判定する。
【0022】有音部か無音部かの判定は例えば次のよう
に行う。デジタル信号のサンプル値列をSiとすると、
N個のサンプル値系列に対して(数1)を満たす場合
に、そのサンプル値列は有音、満たさない場合は無音で
あると判定する。ここでPthはあらかじめ定めた有音無
音判定のためのしきい値である。
【0023】
【数1】
【0024】ここで、バッファメモリ105上で次にデ
ータを格納すべきアドレスを指し示すポインタ(以降、
書き込みポインタと呼ぶ)をPwとすると、上記(数
1)で有音と判定された場合には、書き込み制御部10
4によりそのサンプル値系列が書き込みポインタPwの
示すバッファメモリ105のアドレス位置に順次格納さ
れ、その都度Pwはインクリメントされる。逆に、無音
と判定された場合には、書き込み制御部104はバッフ
ァメモリ105へのデータの書き込み動作を停止する。
これによりバッファメモリ105には有音部のデータの
みが蓄積される。
【0025】なお、ここでは(数1)を満たす場合に有
音、満たさない場合に無音と判定したが、(数1)を満
たす区間に対してその前方、あるいは後方に続く無音と
判定された短いサンプル値列を有音区間に含めてもよ
い。
【0026】読み出し制御部106では、バッファメモ
リ105のデータを周期Tで順次読み出し、時間軸制御
部109へ送る。ここで次に読み出すべきバッファメモ
リ105上のデータのアドレスを示すポインタ(以降、
読み出しポインタと呼ぶ)をPrとすると、データ残量
監視部107は、前記書き込みポインタPwと読み出し
ポインタPrとの位置関係から、バッファメモリ105
上のまだ処理されていないデータの残量を逐次計測す
る。
【0027】図2はデータ残量の計測方法を示す説明図
であり、2つのポインタの位置関係により同図(a)
(b)の2つの場合が考えられる。図2において、バッ
ファメモリの開始アドレスをa0、終了アドレスをa
n-1(ただし、an-1>a0)とすると、まだ読み出されてい
ないデータ残量Zは図2の斜線部分で示され、次式で計
算できる。
【0028】
【数2】
【0029】これは、バッファメモリ105をいわゆる
巡回メモリとして扱っていることと等価である。ここ
で、メモリからデータを読み出し出力するためには、巡
回メモリ上で書き込みポインタPwが読み出しポインタ
Prより先行していなければならないため、PwとPr
が重なっている場合(Pw=Pr)は、読み出し制御部
106が読み出し動作を停止し、読み出しポインタPr
はそのときのアドレス値を維持する。ここで、PwとP
rが重なった状態として、図2(a)の状態からPrが
Pwに追いついた場合と、図2(b)の状態からPwが
Prに追いついた場合の2通りの状態が考えられる。前
者は未処理データの量が0になった場合であり、後者は
未処理データの量がバッファメモリ105の容量と等し
くなった場合である。前者では、未処理データが完全に
なくなったのであるが、後者では、未処理データがバッ
ファメモリ105を埋めてしまい残っている。しかし後
者の場合も、これらの未処理データをすべて破棄しデー
タ残量を0にリセットする。
【0030】適応速度制御部108では、データ残量監
視部107で得られたデータ残量Zの値をもとに、時間
軸変換速度比を設定する。すなわち、データ残量が多い
場合はできるだけ再生速度に近い速度に、データ残量が
少ない場合はできるだけ書き込みポインタPwに読み出
しポインタPrが追いつかないような遅い速度に、時間
軸変換後の速度がなるように時間軸変換速度比を設定す
る。
【0031】以下、適応速度制御部108の動作を、記
録再生部101から記録速度と同じ速度で再生した場合
について説明する。ここでは時間軸変換後の速度の最大
値を記録速度と同じ、最小値をVoとする。図3はデー
タ残量とそれに対する時間軸変換速度比の関係を示して
おり、これが時間軸変換速度比を設定するための規則と
なる。図3(a)はデータ残量と時間軸変換速度比を線
形に対応づける規則を示している。この場合、時間軸変
換速度比Vは次式により算出できる。
【0032】
【数3】
【0033】図3(b)はデータ残量と時間軸変換速度
比を非線形に対応づける規則の例を示したものである。
ここで、2次曲線に対応づけるとすると、時間軸変換速
度比Vは次式により算出できる。
【0034】
【数4】
【0035】図3(a)の場合は、データ残量の増減に
おいて滑らかに時間軸変換速度比を変更することがで
き、一方、図3(b)の場合はある程度の量のデータが
バッファメモリ105に蓄積されるまでは、できるだけ
遅い速度で安定させることができるという特徴がある。
図3(c)は非線形の対応付けを階段状に規定した場合
の例であり、時間軸変換速度比Vは次式により算出でき
る。
【0036】
【数5】
【0037】図3(c)に示した規則は、(b)の規則
とほぼ同等の制御を、より少ない演算量、回路規模で実
現することが可能である。
【0038】このように、図3の対応規則に基づき時間
軸変換速度比を決定することにより、記録速度と同じ速
度で再生された信号でも、無音部分がある程度以上存在
する入力信号に対しては、有音部分の速度を再生速度よ
りも遅い速度に設定することが可能であり、また、無音
部分が含まれない信号が継続する場合は最大の時間軸変
換速度比(ここでは記録速度に等しい速度、つまり、
1)が設定されるので、情報の欠落が発生しない。
【0039】なお、ここでは時間軸変換速度比の最大値
を1、すなわち記録速度としたが、最大値を1より小さ
な値(例えば0.8)としても同様の規則が設定でき
る。ただし、この場合は有音が継続したときに記録速度
で再生された信号に対しても最大でも0.8未満の時間
軸変換速度比にしか設定されないため、バッファメモリ
が一杯になりデータの書き込みができずにデータの一部
を廃棄する必要が生じる場合がある。これは、例えば図
2(b)において、PwがPrに追いついた場合に相当
するが、この場合上で述べたようにデータ残量を0にリ
セットすることにより、今までに蓄積されたバッファメ
モリの容量分のデータを廃棄することになる。
【0040】例えば、バッファメモリの容量を256K
ビット、サンプリング周波数を10kHz、1サンプル
を8ビットデータとして扱う場合では、32Kポイント
(約3.2秒)の有音データを廃棄することになる。
【0041】このように時間軸変換後の速度の最大値を
低く抑えるような設定を行えば、無音の量によってはデ
ータの一部が欠落するが、データ全体をよりゆっくりし
た聴きやすい速度で再生することが可能となる。
【0042】適応速度制御部108により決定された時
間軸変換速度比Vの値は、時間軸制御部109に送出さ
れ、時間軸制御部109により時間軸変換速度比Vに応
じた時間軸の変換処理が施される。
【0043】図4は時間軸制御部109の詳細構成を示
すブロック図である。図4において、401は全体の制
御を行う制御回路、402は制御回路の指令により重み
づけ加算を行うクロスフェード処理か無処理かを切り替
える切替回路、403は一時的にデータを保持するラッ
チ回路、404は重みづけ加算処理を行うクロスフェー
ド回路であり、その他のブロックは図1の同名のブロッ
クと同一のものであるので同番号を付してある。以下、
図4に沿って時間軸制御部109の動作を説明する。
【0044】まず、制御回路401は時間軸変換速度比
Vを実現するために、クロスフェード区間長Kと無処理
区間長Sを決定する。ここでは、クロスフェード区間長
Kを固定値とするが、時間軸変換速度比Vに応じてKの
値を可変にすることももちろん可能である。
【0045】図5は時間軸変換処理を説明するための模
式図であり、図5(a)は処理前のデータ、図5(b)
は処理後のデータを表している。また、図5(b)のデ
ータ列Aとデータ列Bに挟まれた長さKの部分は、デー
タ列Aとデータ列Bをクロスフェード処理して得られた
データ列である。
【0046】ここで、時間軸変換速度比Vを実現するた
めには、処理前のデータ列A、B、Cの合計の長さ(2
K+S)の1/Vが時間軸処理後のデータ列長(3K+
S)になるようにSを設定すればよい。そこで、無処理
区間長Sは次式により算出される。
【0047】
【数6】
【0048】今、読み出しポインタPrが図5(a)の
データ列Aの先頭を指しているとして、クロスフェード
処理について説明する。クロスフェード処理は、3つの
処理からなる。
【0049】まず第1の処理について説明する。図6は
クロスフェード処理の一部をフローチャートで示したも
のである。まず、時間軸変換速度比Vを参照しながら制
御回路401は切替回路402を無処理側に切り替える
(S11)。次に、読み出し制御部106にポインタP
rの示すデータを読み出すように指令する(S12)。
そして、読み出されたデータは、無処理で直接D/A変
換器110に入力される(S13)。最後に、読み出し
ポインタPrがインクリメントされる(S14)。そし
て、データ列Aを全て処理するまで、上記の動作を繰り
返す(S15)。
【0050】次に第2の処理について説明する。まず、
制御回路401は読み出し制御部106に読み出しポイ
ンタPrがデータ列Aの先頭を指すように指令する。次
に、制御回路401は切替回路402をクロスフェード
処理前に切り替えるとともに、読み出し制御部106に
読み出しポインタPrの示すデータを読み出すように指
令する。読み出されたデータはラッチ回路403に入力
され保持される。次に、制御回路401は読み出し制御
部106に、Kサンプル先の(Pr+K)のアドレスの
示すデータを読み出すように指令する。読み出されたデ
ータは直接クロスフェード回路404に入力される。こ
のデータと直前にラッチ回路403に保持されたデータ
の2つのデータを用いて重みづけ加算を実行する。ここ
で、図5(a)のデータ列Aをd0、d1、・・・、dK-1、デ
ータ列BをdK、dK+1、・・・、d2K-1とする。また、単調
増加する重み関数をw1(t)(ただし、0≦w1(t)≦1、t
=0,1,・・・,K-1)、単調減少する関数をw2(t)=1-w1(t)
とすると、重みづけ加算後の値Ctは次式により得られ
る。
【0051】
【数7】
【0052】この後、読み出しポインタPrはインクリ
メントされる。制御回路401は上記と同じ処理とK回
続けて行う。図5(a)のデータ列Aとデータ列Bとの
クロスフェード処理がすべて終了した後、読み出しポイ
ンタはクロスフェード開始時のPrの値にKを加えたP
r+Kの値に設定される。
【0053】次に第3の処理について説明する。第2の
処理が終了した時点では、読み出しポインタPrはデー
タ列Bの先頭を指しているので、このまま第1の処理に
おけるデータ列Aに対する処理と同様の処理をデータ列
Bに対して施す。具体的には、制御回路401は、切替
回路402を無処理側に切り替え、読み出し制御部10
6にポインタPrの示すデータを読み出すように指令す
る。読み出されたデータは無処理で直接D/A変換器1
10に入力される。最後に読み出しポインタPrがイン
クリメントされる。データ列Bをすべて処理するまで、
上記動作を繰り返す。
【0054】これらの3つの処理の結果クロスフェード
処理が終了すると、制御回路401は切替回路402を
無処理側に切り替え、(数6)で決定された長さSに該
当する個数のデータがバッファメモリ105から読み出
され、直接D/A変換器110に入力される。
【0055】以降、長さ3Kのクロスフェード処理され
たデータと長さSの無処理データを交互に出力すること
を繰り返すことにより、時間軸変換速度比Vでの時間軸
変換が実現できる。ある時点に適応速度制御部108で
設定される時間軸変換速度比が変更された場合は、(数
6)により無処理区間長を変更し、以降上記と同様の処
理を続けることにより、随時、時間軸変換速度比を変更
する。
【0056】このようにして時間軸変換処理されたデー
タ列は、最終的に周期TでD/A変換器110によりア
ナログ信号に変換される。その結果、音程が記録時と同
一で、速度が再生速度M以下で適応的に切り替わる音声
信号を得ることができる。
【0057】以上のように、上記した第1の実施例によ
ると、有音無音判定部103と、書き込みポインタと読
み出しポインタの位置関係からデータ残量を計測するデ
ータ残量監視部107と、データ残量に応じて時間軸変
換速度比を決定する適応速度制御部108とを設け、デ
ータ残量が多い場合は時間軸変換後の速度を徐々に速
く、データ残量が少ない場合には徐々に遅くなるように
制御することにより、低速に再生された音声信号をその
中に含まれる無音の量に応じて再生速度以下のゆっくり
した速度で、しかも情報の欠落がほとんど生じることな
く聴取することが可能となる。
【0058】また、クロスフェード区間長と無処理区間
長を調整することによって、希望する速度に時間軸を変
換することのできる時間軸制御部109を設けたことに
より、高品質の時間軸変換が実現できる。さらに、クロ
スフェード区間長をあらかじめ設定した値に固定する
と、無処理区間長のみを変更するだけで任意の速度での
時間軸変換が達成され、非常に簡単な構成で音声時間軸
変換装置を実現することができる。
【0059】特にVTRなどのように画像を伴った記録
再生部では、例えば画像は1倍速再生で、音声のみを1
倍速以下のゆっくりした速度で再生することができ、聴
き易さが向上する効果が大きい。
【0060】次に、本発明の音声時間軸変換装置の第2
の実施例について説明する。本実施例の音声時間軸変換
装置の基本構成は図1に示したブロック図と同一であ
り、書き込み制御部104の動作のみが異なる。
【0061】図7は本実施例の書き込み制御部の動作を
示すフローチャートである。以下では、図7を参照しな
がら書き込み制御部の動作についてのみ説明する。書き
込み制御部104はデータ残量監視部107により計測
されたデータ残量Zの値を逐次取り込み(S1)、あら
かじめ設定したしきい値Zthと比較する(S2)。ここ
でZがZthよりも大きい場合はデータ残量が多いので、
有音無音判定部103の結果から現在の入力データが有
音か無音かを判断し(S3)、有音である場合のみその
データをバッファメモリ105に書き込み(S4)、書
き込みポインタPwをインクリメントする(S5)。S
2においてZがZthよりも小さい場合はデータ残量が少
ないので、有音無音の判定結果にかかわらず、データを
バッファメモリ105に書き込み、書き込みポインタP
wをインクリメントする。
【0062】上記した一連の処理では、無音が多く含ま
れる信号の場合に、図2(a)において読み出しポイン
タPrが書き込みポインタPwに追いつかないよう、す
なわちデータ残量が0にならないように制御している。
【0063】以上のように、上記した第2の実施例によ
ると、データ残量があらかじめ定めた一定量より少ない
ときにはすべてのデータをバッファメモリに蓄積する書
き込み制御部を設けたことにより、有音区間が少ない信
号を再生するときにデータ残量が0にならずに再生音が
途切れる(ミュート状態になる)ことが防止され、違和
感の少ない自然な再生が可能な音声時間軸変換装置を実
現することができる。
【0064】
【発明の効果】以上のように、本発明では、記録速度M
(≦1)倍で再生された音響信号から有音無音判定によ
り有音部分のみをバッファメモリに蓄積し、書き込みと
読み出しのアドレス位置からバッファメモリに蓄積され
ているデータ残量を計測し、その結果に応じて、残量の
少ないときにはできるだけ低速に、残量が多くなるにつ
れて徐々に再生速度に近づくように、無音の量に応じて
自動的に時間軸変換後の速度を調整できるように構成し
たことにより、低速再生時に、音程は記録時と同一で、
しかも再生速度よりも遅く聴きやすい速度で音声を再生
することが可能な音声時間軸変換装置を提供することが
できる。これにより、記録速度で再生した音声をさらに
遅くすることが可能となり、早口の言葉や外国語ソース
の聴き取りを容易にすることができる。
【0065】また、クロスフェード区間長と無処理区間
長を調整することで、希望する速度に時間軸を変換する
時間軸制御部を設けることにより、任意の速度での時間
軸変換処理が実現でき、さらに、クロスフェード長を一
定にすれば、無処理区間長を調節するだけで任意の速度
での時間軸変換が実現できるので、簡単な回路構成で時
間軸変換された高品質な再生音を提供することができ
る。
【0066】また、データ残量が少ない時には有音無音
の判定にかかわらずすべてのデータをバッファメモリに
蓄積するように構成することにより、有音区間が少ない
信号を再生するときに出力するデータがなくなり再生途
中でミュート状態になることがなく、違和感の少ない自
然な再生音声を出力する音声時間軸変換装置を提供する
ことができる。
【図面の簡単な説明】
【図1】本発明の一実施例における音声時間軸変換装置
の構成を示すブロック図
【図2】本実施例のメモリ残量の計測方法の説明図
【図3】本実施例に係る適応速度制御部の速度設定方法
の説明図
【図4】本実施例に係る時間軸制御部の回路図
【図5】本実施例に係る時間軸制御部の動作を示す原理
【図6】本実施例に係る時間軸制御部の動作の一部を示
すフローチャート
【図7】本発明の第2の実施例に係る書き込み制御部の
動作を示すフローチャート
【図8】従来例の音声時間軸変換装置のブロック図
【図9】従来例の音声時間軸変換装置のデータ処理方法
を示す原理図
【符号の説明】
101 記録再生部 102 A/D変換器 103 有音無音判定部 104 書き込み制御部 105 バッファメモリ 106 読み出し制御部 107 データ残量監視部 108 適応速度制御部 109 時間軸制御部 110 D/A変換器
───────────────────────────────────────────────────── フロントページの続き (72)発明者 渡辺 公治 大阪府門真市大字門真1006番地 松下電 器産業株式会社内 (72)発明者 上野 憲和 大阪府門真市大字門真1006番地 松下電 器産業株式会社内 (56)参考文献 特開 平7−191695(JP,A) 特開 平3−2794(JP,A) 特開 平6−289895(JP,A) 特開 平4−11300(JP,A) 特開 平3−205656(JP,A) (58)調査した分野(Int.Cl.6,DB名) G10L 3/02 G11B 20/02

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 記録再生部(101)、A/D変換器
    (102)、有音無音判定部(103)、バッファメモ
    リ(105)、書き込み制御部(104)、時間軸制御
    部(109)、読み出し制御部(106)、データ残量
    監視部(107)、適応速度制御部(108)、D/A
    変換器(110)からなる音声時間軸変換装置であっ
    て、 記録再生部(101)は、記録媒体に記憶された音響信
    号を記録時のM倍(M≦1)の速度比で読み出し、 A/D変換器(102)は、記録再生部(101)で読
    み出された音響信号をデジタルデータに変換し、 有音無音判定部(103)は、A/D変換器(102)
    の出力するデジタルデータの有音部分と無音部分の判定
    を行い、 書き込み制御部(104)は、有音無音判定部(10
    3)の判定が有音部分のデジタルデータのみをバッファ
    メモリ(105)に書き込むように書き込みアドレスを
    制御し、 時間軸制御部(109)は、適応速度制御部(108)
    が決定した時間軸変換速度比に基づいて読み出し制御部
    (401)に読み出し処理を行わせると共に、バッファ
    メモリ(105)から読み出されるデジタルデータに時
    間軸伸張を行って出力し、 読み出し制御部(106)は、デジタルデータをバッフ
    ァメモリ(105)から読み出すように読み出しアドレ
    スを制御し、 データ残量監視部(107)は、書き込み制御部(10
    4)が最後に制御した書き込みアドレスと読み出し制御
    部(106)が最後に制御した読み出しアドレスに基づ
    いてバッファメモリ(105)の未処理データ量を監視
    し、 適応速度制御部(108)は、データ残量監視部(10
    7)の未処理データ量に基づいて時間軸変換速度比を決
    定し、 D/A変換器(110)は、時間軸制御部(109)が
    出力するデジタルデータをアナログ信号に変換する 音声
    時間軸変換装置。
  2. 【請求項2】 記録再生部(101)、A/D変換器
    (102)、有音無音判定部(103)、バッファメモ
    リ(105)、書き込み制御部(104)、時間軸制御
    部(109)、読み出し制御部(106)、データ残量
    監視部(107)、適応速度制御部(108)、D/A
    変換器(110)からなる音声時間軸変換装置であっ
    て、 記録再生部(101)は、記録媒体に記憶された音響信
    号を記録時のM倍(M≦1)の速度比で読み出し、 A/D変換器(102)は、記録再生部(101)で読
    み出された音響信号をデジタルデータに変換し、 有音無音判定部(103)は、A/D変換器(102)
    の出力するデジタルデータの有音部分と無音部分の判定
    を行い、 書き込み制御部(104)は、 データ残量監視部(107)の未処理データ量が一定量
    以下の場合には、A/D変換器(102)の出力するデ
    ジタルデータをバッファメモリ(105)に書き込むよ
    うに書き込みアドレスを制御し、 データ残量監視部(107)の未処理データ量が一定量
    以上の場合には、有音無音判定部(103)の判定が有
    音部分のデジタルデータのみをバッファメモリ(10
    5)に書き込むように書き込みアドレスを制御し、 時間軸制御部(109)は、適応速度制御部(108)
    が決定した時間軸変換速度比に基づいて読み出し制御部
    (401)に読み出し処理を行わせると共に、バッファ
    メモリ(105)から読み出されるデジタルデータに時
    間軸伸張を行って出力し、 読み出し制御部(106)は、デジタルデータをバッフ
    ァメモリ(105)から読み出すように読み出しアドレ
    スを制御し、 データ残量監視部(107)は、書き込み制御部(10
    4)が最後に制御した書き込みアドレスと読み出し制御
    部(106)が最後に制御した読み出しアドレスに基づ
    いてバッファメモリ(105)の未処理データ量を監視
    し、 適応速度制御部(108)は、データ残量監視部(10
    7)の未処理データ量に基づいて時間軸変換速度比を決
    定し、 D/A変換器(110)は、時間軸制御部(109)が
    出力するデジタルデータをアナログ信号に変換する 音声
    時間軸変換装置。
  3. 【請求項3】 時間軸制御部(109)は、制御回路
    (401)、切替回路(402)、クロスフェード手段
    (403、404)からなり、 制御回路(401)は、適応速度制御部(108)が決
    定した時間軸変換速度比に基づいてクロスフェード区間
    と無処理区間を決定して読み出し制御部(401)に読
    み出し処理を行わせると共に、時間軸変換速度比に基づ
    いて切替回路(402)の切替制御を行い、 切替回路(402)は、バッファメモリ(105)から
    入力されるデジタルデータをD/A変換器(110)、
    若しくは、クロスフェード手段(403、404)に切
    替出力し、 クロスフェード手段(403、404)は、A、Bの順
    に互いに隣り合うクロスフェード区間A、Bにおいて、
    単調増加する重み係数をクロスフェード区間Aに掛け合
    わせた値と、単調減少する重み係数をクロスフェード区
    間Bに掛け合わせた値とを加算してD/A変換器(11
    0)へ出力する 請求項1乃至2に記載の音声時間軸変換
    装置。
  4. 【請求項4】 適応速度制御部(110)の決定する時
    間軸変換速度比は、速度M以下であって、未処理データ
    量に比例する 請求項1乃至3に記載の音声時間軸変換装
    置。
  5. 【請求項5】 適応速度制御部(110)の決定する時
    間軸変換速度比は、速度M以下であって、未処理データ
    量に非線形に対応する 請求項1乃至3に記載の音声時間
    軸変換装置。
JP7234903A 1994-09-14 1995-09-13 音声時間軸変換装置 Expired - Fee Related JP2874607B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7234903A JP2874607B2 (ja) 1994-09-14 1995-09-13 音声時間軸変換装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP6-220132 1994-09-14
JP22013294 1994-09-14
JP7234903A JP2874607B2 (ja) 1994-09-14 1995-09-13 音声時間軸変換装置

Publications (2)

Publication Number Publication Date
JPH08137492A JPH08137492A (ja) 1996-05-31
JP2874607B2 true JP2874607B2 (ja) 1999-03-24

Family

ID=26523555

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7234903A Expired - Fee Related JP2874607B2 (ja) 1994-09-14 1995-09-13 音声時間軸変換装置

Country Status (1)

Country Link
JP (1) JP2874607B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4558620B2 (ja) * 2005-10-03 2010-10-06 株式会社ディーアンドエムホールディングス 再生装置及び再生方法
WO2009025142A1 (ja) * 2007-08-22 2009-02-26 Nec Corporation 話者速度変換システムおよびその方法ならびに速度変換装置

Also Published As

Publication number Publication date
JPH08137492A (ja) 1996-05-31

Similar Documents

Publication Publication Date Title
JP4334355B2 (ja) トリックモード・オーディオ再生
US6085157A (en) Reproducing velocity converting apparatus with different speech velocity between voiced sound and unvoiced sound
US20050190087A1 (en) AGC circuit, AGC circuit gain control method, and program for the AGC circuit gain control method
JPH10260694A (ja) 話速変換装置、話速変換方法及び記録媒体
JP2874607B2 (ja) 音声時間軸変換装置
JP3189587B2 (ja) 音声時間軸変換装置
EP0702354A1 (en) Apparatus for modifying the time scale modification of speech
JP3162945B2 (ja) ビデオテープレコーダ
JP4542805B2 (ja) 変速再生方法及び装置、並びにプログラム
JP3357742B2 (ja) 話速変換装置
JP3189597B2 (ja) 音声時間軸変換装置
JPH04168499A (ja) 時間軸圧縮伸長装置
JPH09138698A (ja) 音声記録再生装置
JPH08328586A (ja) 音声時間軸変換装置
JPH0573089A (ja) 音声再生方法
JP3966814B2 (ja) 簡易再生方法とこの方法に利用可能な簡易再生装置、復号方法、復号装置
JP2001318700A (ja) 話速変換装置
JPH05303400A (ja) 音声再生装置と音声再生方法
JPH09154107A (ja) 映像・音声再生装置
JPH04367898A (ja) 音声再生装置
JP2962777B2 (ja) 音声信号の時間軸伸長圧縮装置
US20020004722A1 (en) Voice speed converting apparatus
JP3498319B2 (ja) 自動演奏装置
JP2910068B2 (ja) 音声再生装置
JPH08293137A (ja) 再生装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees