JPH0573089A - 音声再生方法 - Google Patents

音声再生方法

Info

Publication number
JPH0573089A
JPH0573089A JP3237666A JP23766691A JPH0573089A JP H0573089 A JPH0573089 A JP H0573089A JP 3237666 A JP3237666 A JP 3237666A JP 23766691 A JP23766691 A JP 23766691A JP H0573089 A JPH0573089 A JP H0573089A
Authority
JP
Japan
Prior art keywords
section
ratio
time
length
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3237666A
Other languages
English (en)
Inventor
Masayuki Misaki
正之 三崎
Ryoji Suzuki
良二 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3237666A priority Critical patent/JPH0573089A/ja
Publication of JPH0573089A publication Critical patent/JPH0573089A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 本発明は記録された会話音声信号を、高速再
生または低速再生したときに、より自然に聞こえるよう
な音声再生方法を提供することを目的とする。 【構成】 所定のブロック内において、音声区間長のブ
ロック全体に対する比と所望の時間圧縮比(時間伸長
比)とを比較し、無音区間および音声区間に独立した圧
縮比(伸長比)を与えて時間圧縮(時間伸長)を行う音
声再生方法である。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、記録された会話音声信
号などを再生する際に、通常速度以外の速度に変更して
も音程の変化を生じずに不都合なく聴取できるようにす
る音声再生方法に関するものである。
【0002】
【従来の技術】従来より、記録した音声信号の再生速度
を可変する機能をもつ様々な装置が提案されている。最
も簡単な例はアナログテープレコーダのキュー(早送り
再生)、レビュー(巻戻し再生)であるが、これらの高
速再生音声は通常速度の音声と比べると音程・速度の両
方が変化しているため、内容を聴取するのはほとんど不
可能である。また、高速/低速再生時にも音程が変化し
ないように補償する速度変換処理を利用した音声再生方
法も提案されている。以下、速度変換処理を行なう従来
の音声再生方法について、図面を参照しながら説明を行
なう。
【0003】(図4)は、従来の音声再生方法のフロー
チャートを示すものである。まず、時間圧伸比RCEを決
定する。ここで、時間圧伸比RCEは以下のように示され
る。
【0004】
【数1】
【0005】(数1)より明らかなように、通常速度よ
り高速で再生する場合は、RCEは1より小さい値をと
り、通常速度より低速で再生する場合には、RCEは1よ
り大きい値をとる。このRCEをパラメータとして入力音
声信号に対して速度変換処理を施す。速度変換処理は音
程を通常再生時と同様に保ったまま速度のみを変更する
処理を行なうものである。速度変換処理については例え
ば『ディジタル音声処理』古井貞煕著、東海大学出版会
のTDHSアルゴリズムの項目を参照されたい。そし
て、引続き処理を繰り返して行う場合には、RCEを変更
するかどうかを確認し、RCEを決定してから、速度変換
処理を行う。以上の動作を繰り返すことにより、ユーザ
ーが所望とする再生速度で音声信号を再生するものであ
る。
【0006】
【発明が解決しようとする課題】しかし上記の構成で
は、入力信号の状態によらずに、一様に時間軸伸縮を行
なう速度変換処理を行なって再生速度を変化させてい
る。これにより、再生音の音程は保存されているが、再
生速度を通常速度から大きく変更する場合でも、無音区
間と音声区間の区別なく一様に時間伸縮を行っているた
め、人間の発声法とは異なった不自然な再生音に感じら
れるという課題を有している。また、常時、速度変換処
理による処理歪が、情報を伝達している音声区間に対し
て加わっている。
【0007】本発明は上記の課題を解決するもので、再
生速度を変更してもできるだけ自然な発声として聞き取
ることができ、しかも音声区間に対する処理歪を低減し
た再生音を得るための音声再生方法を提供することを目
的とする。
【0008】
【課題を解決するための手段】この目的を達成するため
に本発明の音声再生方法では、1ブロック内で音声区間
長とブロック長との比RVを考慮して、無音区間および音
声区間に対する圧縮比(伸長比)をそれぞれ別に設定し
て時間圧縮(時間伸長)を行う方法を採用している。ま
た、時間圧縮比(時間伸長比)とRVとを比較し、できる
限り無音区間の圧縮(伸長)に重点をかけ、音声区間の
圧縮(伸長)は時間圧縮率(時間伸長率)が大きいとき
にしか行われないような方法としている。
【0009】
【作用】この方法によって、ブロック内の無音区間およ
び音声区間に対する圧縮比(伸長比)をそれぞれRVに対
応して決定している。ここでRVは1.0のとき100%音声区
間であり、0.0のとき100%無音区間である。まず、時間
圧縮の場合には、ブロック内に無音区間が多く含まれて
おり時間圧縮比RCよりk・RVが小さいときには、無音区間
を圧縮することだけで所望の時間圧縮比を実現でき、ブ
ロック内に無音区間が少なくRCよりk・RVが大きいときに
は無音区間の圧縮だけでは所望の時間圧縮比を実現でき
ないので、音声区間の圧縮も同時に行う。ここで定数k
は、1より大きい値であり、無音区間圧縮のマージンを
決定する。
【0010】次に、時間伸長の場合には、ブロック内に
無音区間があまり含まれておらず時間伸長比REよりk/R
Vが小さいときには、無音区間を伸長することだけで所
望の時間伸長比を実現し、ブロック内に無音区間が多く
REよりk/RVが大きいときには無音区間の伸長だけで所
望の時間伸長比を実現するには限界があるので、音声区
間の伸長も同時に行う。ここで定数kは、1より小さい
値であり、無音区間伸長のマージンを決定する。
【0011】このように制御を行うことによって、再生
速度を変更してもできるだけ自然な発声として聞き取る
ことができ、しかも音声区間に対する処理が少なく処理
歪を低減した再生音を得ることができる。
【0012】
【実施例1】以下本発明の実施例1について、図面を参
照しながら説明する。
【0013】(図1)は本発明の第1の実施例における
フローチャートを示すものである。(図1)に用いてい
る記号について説明する。RVは以下の(数2)に示すよ
うに、ブロック内の音声区間長の総和とブロック長全体
との比である。
【0014】
【数2】
【0015】RCは以下の(数3)に示すように入力信号
を時間圧縮する圧縮比である。
【0016】
【数3】
【0017】また、ブロック長全体の時間長をTB、無音
区間の時間長の総和をTS、音声区間の時間長の総和を
TV、無音区間に対する時間圧縮の圧縮比をCS、音声区間
に対する時間圧縮の圧縮比をCVとする。これら、TB,TS,
TV,CS,CVでRCを書き表すと以下の(数4)のようにな
る。
【0018】
【数4】
【0019】また、TBとTS,TVの関係式は以下の(数
5)のようになる。
【0020】
【数5】
【0021】次に(図1)のフローチャートの説明を行
う。まず、入力信号は1ブロック分だけバッファメモリ
に読み込まれる。そしてこのブロック内の信号に関して
音声区間と無音区間の判定を行い、RVを求める。そし
て、このRVに定数k(k>1)を掛け合わせたk・RVとRCとの
比較を行い、RC≧k・RVの場合および、RC<k・RVの場合の
CSおよびCVの値を次の(表1)のように計算する。
【0022】
【表1】
【0023】ここで、RVの値が小さいとき、すなわちブ
ロック内の無音区間の比率が大きいときには、RC≧k・RV
の条件が満たされ易く、音声区間の時間圧縮は行われ
ず、無音区間の時間圧縮のみによって目標の時間圧縮比
が実現される。逆に、ブロック内にあまり無音区間がな
いときには、RC<k・RVの条件が満たされ易く、無音区
間、または音声区間の時間圧縮が行われる。さらに、RV
の値によって2通りの場合に分かれる。RVに対するCS
よびCVの値の変化をグラフにしたものを(図2(a)
(b))に示す。この図より明らかなように、RVが0か
ら1まで変化していくときの無音区間または音声区間に
対する圧縮の様子は、まず、無音区間の圧縮だけが行わ
れ、そして、無音区間と音声区間の両方の圧縮が行わ
れ、そして1近傍では音声区間の圧縮のみ行われる。
【0024】(表1)に示したように、CSとCVとを決定
したのち、ブロック内のデータに対して処理を行う。無
音区間には圧縮比CSに基づいて圧縮を行い、音声区間に
は圧縮比CVに基づいて圧縮を行う。以上で1ブロックに
対する処理は終わり、次のブロックに対しても同様の処
理を行うかどうかを確認する。
【0025】以上のように本実施例によれば、現在のブ
ロックに於けるRVの値に応じて無音区間および、音声区
間に対する圧縮比を変更している。そして、無音区間が
多いブロックでは音声区間には圧縮を行わずに、無音区
間のみ圧縮してブロック全体を所望の圧縮比RCにしてい
るため、音声区間に対する処理歪がなく、自然な高速再
生を実現できる。
【0026】以下本発明の第2の実施例について、図面
を参照しながら説明する。(図3)は本発明の第2の実
施例におけるフローチャートを示すものである。(図
3)に用いている記号について説明する。REは以下の
(数6)に示すように入力信号を時間伸長する伸長比で
ある。
【0027】
【数6】
【0028】また、RV、TB、TS、TVは第1の実施例と同
様である。無音区間に対する時間伸長の伸長比をES、音
声区間に対する時間伸長の伸長比をEVとする。これら、
TB、TS、TV、ES、EVでREを書き表すと以下の(数7)の
ようになる。
【0029】
【数7】
【0030】次に(図3)のフローチャートの説明を行
う。まず、入力信号は1ブロック分だけバッファメモリ
に読み込まれる。そしてこのブロック内の信号に関して
音声区間と無音区間の判定を行い、RVを求める。そし
て、このRVの逆数に定数k(k<1)を掛け合わせたk/RV
REとの比較を行い、RE≧k・RVの場合および、RE<k・RV
場合のESおよびEVの値を次の(表2)のように計算す
る。
【0031】
【表2】
【0032】ここで、RVの値が大きいとき、すなわちブ
ロック内の無音区間の比率が小さいときには、RE≧k/R
Vの条件が満たされ易く、音声区間の時間伸長は行われ
ず、無音区間の時間伸長のみによって目標の時間伸長比
が実現される。逆に、ブロック内に無音区間が多く存在
するときには、RE<k/RVの条件が満たされ易く、無音
区間、または音声区間の時間伸長が平行して行われる。
(表2)に示したように、ESとEVとを決定したのち、ブ
ロック内のデータに対して処理を行う。無音区間には伸
長比ESに基づいて伸長を行い、音声区間には伸長比EV
基づいて伸長を行う。以上で1ブロックに対する処理は
終わり、次のブロックに対しても同様の処理を行うかど
うかを確認する。
【0033】以上のように本実施例によれば、現在のブ
ロックに於けるRVの値に応じて無音区間および、音声区
間に対する伸長比を変更している。そして、無音区間が
少ないブロックでは音声区間には伸長を行わずに、無音
区間のみ伸長してブロック全体を所望の伸長比REにして
いるため、音声区間に対する処理歪がなく、自然な低速
再生を実現できる。
【0034】
【発明の効果】以上詳述したように本発明は、所定のブ
ロック長における音声区間長とブロック長全体との比RV
を求め、この値と所望の圧縮比(伸長比)とを比較し、
その結果により、(1)無音区間のみを圧縮する(伸長す
る)ことで全体の時間圧縮(時間伸長)を行う、あるい
は(2)無音区間と音声区間とに独立した圧縮比(伸長
比)を設置して時間圧縮(時間伸長)を行うかを選択し
て音声再生を行う方法である。この方法により、高速再
生する場合に、無音区間が多く含まれているブロックに
対しては、無音区間の圧縮のみで時間圧縮を実現し、低
速再生する場合に、無音区間が少ないブロックに対して
は、無音区間の伸長のみで時間伸長を実現するものであ
る。したがって、元の信号の音声区間に対して処理を加
えない場合には、処理歪が少なくなる。また、高速再生
時には不要な無音区間を削除し、低速再生時には考える
余裕を与える無音区間を挿入することで、人間にとって
自然に音声を聴取することができる音声再生方法を提供
するものである。
【図面の簡単な説明】
【図1】本発明の第1の実施例における音声再生方法の
フローチャートである。
【図2】(a)は本発明の第1の実施例におけるRVとCS
の関係を示すグラフである。 (b)は本発明の第1の実施例におけるRVとCvの関係を
示すグラフである。
【図3】本発明の第2の実施例における音声再生方法の
フローチャートである。
【図4】従来の音声再生方法のフローチャートである。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 所定のブロック長の範囲内で音声区間あ
    るいは無音区間の判定を行い、音声区間長とブロック長
    全体との比RVを求め、目標とする時間圧縮比RCよりk・RV
    (kは1以上の定数)が小さいあるいは等しい値のときは、
    無音区間のみを圧縮することで時間長を圧縮し、RCより
    k・RVが大きい値をとるときには、無音区間または音声区
    間に対して所定の圧縮比で圧縮を行って時間長を圧縮
    し、以上の処理を繰り返して行い音声を高速再生する音
    声再生方法。
  2. 【請求項2】 所定のブロック長の範囲内で音声区間あ
    るいは無音区間の判定を行い、音声区間長とブロック長
    全体との比RVを求め、目標とする時間伸長比REよりk/R
    V(kは1以下の定数)が小さいあるいは等しい値のとき
    は、無音区間を伸長することで時間長を伸長し、REより
    k/RVが大きい値をとるときには、無音区間または音声
    区間に対して所定の伸長比で伸長を行って時間長を伸長
    し、以上の処理を繰り返して行い音声を低速再生する音
    声再生方法。
JP3237666A 1991-09-18 1991-09-18 音声再生方法 Pending JPH0573089A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3237666A JPH0573089A (ja) 1991-09-18 1991-09-18 音声再生方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3237666A JPH0573089A (ja) 1991-09-18 1991-09-18 音声再生方法

Publications (1)

Publication Number Publication Date
JPH0573089A true JPH0573089A (ja) 1993-03-26

Family

ID=17018710

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3237666A Pending JPH0573089A (ja) 1991-09-18 1991-09-18 音声再生方法

Country Status (1)

Country Link
JP (1) JPH0573089A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5611018A (en) * 1993-09-18 1997-03-11 Sanyo Electric Co., Ltd. System for controlling voice speed of an input signal
WO2006077626A1 (ja) * 2005-01-18 2006-07-27 Fujitsu Limited 話速変換方法及び話速変換装置
JP2007094060A (ja) * 2005-09-29 2007-04-12 Yamaha Corp コンテンツ再生装置、コンテンツ再生方法、及びコンテンツ再生プログラム
JP2007094004A (ja) * 2005-09-29 2007-04-12 Kowa Co 音声信号の時間軸圧伸方法および音声信号の時間軸圧伸装置
CN113496705A (zh) * 2021-08-19 2021-10-12 杭州华橙软件技术有限公司 音频处理方法和装置、存储介质及电子设备

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5611018A (en) * 1993-09-18 1997-03-11 Sanyo Electric Co., Ltd. System for controlling voice speed of an input signal
WO2006077626A1 (ja) * 2005-01-18 2006-07-27 Fujitsu Limited 話速変換方法及び話速変換装置
JPWO2006077626A1 (ja) * 2005-01-18 2008-06-12 富士通株式会社 話速変換方法及び話速変換装置
JP4630876B2 (ja) * 2005-01-18 2011-02-09 富士通株式会社 話速変換方法及び話速変換装置
US7912710B2 (en) 2005-01-18 2011-03-22 Fujitsu Limited Apparatus and method for changing reproduction speed of speech sound
JP2007094060A (ja) * 2005-09-29 2007-04-12 Yamaha Corp コンテンツ再生装置、コンテンツ再生方法、及びコンテンツ再生プログラム
JP2007094004A (ja) * 2005-09-29 2007-04-12 Kowa Co 音声信号の時間軸圧伸方法および音声信号の時間軸圧伸装置
CN113496705A (zh) * 2021-08-19 2021-10-12 杭州华橙软件技术有限公司 音频处理方法和装置、存储介质及电子设备
CN113496705B (zh) * 2021-08-19 2024-03-08 杭州华橙软件技术有限公司 音频处理方法和装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
JP4523257B2 (ja) 音声データ処理方法、プログラム及び音声信号処理システム
US6085157A (en) Reproducing velocity converting apparatus with different speech velocity between voiced sound and unvoiced sound
JPH10260694A (ja) 話速変換装置、話速変換方法及び記録媒体
JPH0573089A (ja) 音声再生方法
JP3162945B2 (ja) ビデオテープレコーダ
JP2867744B2 (ja) 音声再生装置
JP3189587B2 (ja) 音声時間軸変換装置
JP3357742B2 (ja) 話速変換装置
JPH09152889A (ja) 話速変換装置
JP3081469B2 (ja) 話速変換装置
JPH09138698A (ja) 音声記録再生装置
US20020065569A1 (en) Reproducing apparatus
EP0702354A1 (en) Apparatus for modifying the time scale modification of speech
JP2962777B2 (ja) 音声信号の時間軸伸長圧縮装置
JP3189597B2 (ja) 音声時間軸変換装置
JP2874607B2 (ja) 音声時間軸変換装置
JPH0854895A (ja) 再生装置
JPH08211894A (ja) 音声通信機および音声通信システム
JP4529859B2 (ja) 音声再生装置
JPH09146587A (ja) 話速変換装置
JP2001318700A (ja) 話速変換装置
JPH05303400A (ja) 音声再生装置と音声再生方法
JPH10214098A (ja) 音声変換玩具
KR20010085664A (ko) 화속 변환 장치
JP3530310B2 (ja) 磁気記録再生装置