JP2002313015A - 音声再生方法と音声再生装置 - Google Patents

音声再生方法と音声再生装置

Info

Publication number
JP2002313015A
JP2002313015A JP2002037001A JP2002037001A JP2002313015A JP 2002313015 A JP2002313015 A JP 2002313015A JP 2002037001 A JP2002037001 A JP 2002037001A JP 2002037001 A JP2002037001 A JP 2002037001A JP 2002313015 A JP2002313015 A JP 2002313015A
Authority
JP
Japan
Prior art keywords
audio signal
zero
cross point
original audio
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002037001A
Other languages
English (en)
Inventor
Shin Tanaka
伸 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shinano Kenshi Co Ltd
Original Assignee
Shinano Kenshi Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shinano Kenshi Co Ltd filed Critical Shinano Kenshi Co Ltd
Priority to JP2002037001A priority Critical patent/JP2002313015A/ja
Publication of JP2002313015A publication Critical patent/JP2002313015A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Abstract

(57)【要約】 【課題】 再生速度を変化させた時にも音程が変化しな
い音声再生方法と音声再生装置を提供する。 【解決手段】 記録媒体に記録された原音声信号aを、
カットオフ周波数を基本周波数Fpの中間値に設定して
低域ろ波することで、基本周波数Fpで構成される基本
音声信号dを抽出し、基本音声信号dのゼロクロス点D
を検出し、ゼロクロス点Dが検出された際には、読出し
た原音声信号aを、ゼロクロス点Dと対応する位置で複
数のフレームC(C1,C2,C3,C4,C5,C6 )
に区切り、話速度データfが1以上の場合にはフレーム
の一部を省略し、話速度データfが1未満の場合にはフ
レームの一部を1回若しくは2回以上連続して再生し、
ゼロクロス点Dが検出されなかった際には、話速度デー
タfが1以上の場合には原音声信号aの内の1/f分を
再生し、また話速度データfが1未満の場合には原音声
信号aの内の(1/f−1)分を再生するのに加えて読
出した全原音声信号を連続して再生する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はCD(コンパクトデ
ィスク)等の記録媒体に記録された原音声信号を読み出
して再生する音声再生方法に関し、特に再生速度を変化
させた時にも音程が変化しない音声再生方法と音声再生
装置に関する。
【0002】
【従来の技術】従来、CDやカセットテープ、ビデオテ
ープ等の記録媒体に記録された音声信号を再生する際
に、標準の再生速度に対して再生速度を変えて再生する
場合がある。例えば、短時間で所定量の内容を聞きたい
場合には再生速度を上げ、また早口などの理由で聞き取
りにくい場合には再生速度を下げてゆっくり再生するの
である。このように再生速度を変えるには、CDの回転
速度やテープの走行速度を上げたり、また下げたりする
ことで実現される。ところが、この音声再生方法ではC
D等の記録媒体から読み出される音声信号自体の周波数
も再生速度の変化に合わせて変化するため、音程も変化
して聞きにくいという課題があった。
【0003】そこで、音程はそのままにして再生速度の
みを変換する方法として、図8に示すように原音声信号
aをある一定の時間長tの複数のフレームA(一例とし
てA1 〜A6 ,・・・・・)に分割し、それらを組
み合わせて再生速度を変化させる方法がある。例えば2
倍速で再生する場合には、フレームAを一つ置きに間引
いて連続再生(一例としてA1 ,A3 ,A5 ,・
・・を再生)することによって、再生音声信号cの全体
の再生時間を半分にすることが可能となり、しかも原音
声信号aの周波数(周期T)はある程度元のままである
から音声の音程を殆ど変えることなく再生できるのであ
る。
【0004】なお、選択されたフレーム(A1 ,A3
,A5 )を連続させる際に、単純にそのまま繋げて
再生すると、音声信号bのように繋ぎ目部分B1 〜B
4において信号が不連続となり、この部分で耳障りなノ
イズを発生し、聞きにくい。そこで、再生する各フレー
ムA毎に窓関数を乗算して各フレームA間の始点と終点
部分での原音声信号aのレベルを強制的に合わせ、再生
音声信号cのようにする。これによって再生時のノイズ
の低減を図っている。窓関数の一例としては下記式に示
すようなものが使用される。 W(n) = 0.5-0.5cos( 2πn/M)
【0005】
【発明が解決しようとする課題】しかしながら、従来の
音声再生方法には次のような課題がある。窓関数を使用
する再生方法では、上述したように各フレームの繋ぎ目
部分を強制的に合わせるために、原音声信号の繋ぎ目部
分のレベルを所定のレベル、一例としてゼロ若しくはゼ
ロに近いレベルに強制的に変更するので、繋ぎ目部分で
の音声信号の周期が基本周期と大きく異なる場合が生じ
てその部分での音程がやはり変わってしまうという課題
がある。また、繋ぎ目部分とそれ以外の部分の原音声信
号の周波数の連続性が損なわれるため、音質も劣化する
という課題もある。
【0006】従って、本発明は上記課題を解決すべくな
され、その目的とするところは、再生速度を変化させた
時にも音程が変化しない音声再生方法と音声再生装置を
提供することにある。
【0007】
【課題を解決するための手段】上記課題を解決するた
め、本発明は次の構成を備える。すなわち、請求項1記
載の発明は、記録媒体に記録された原音声信号を読み出
して再生する音声再生方法において、前記原音声信号を
予め決められたデータ量ずつ順次読み出し、該読み出し
た原音声信号を、基本周波数を抽出するため、カットオ
フ周波数を基本周波数の中間値に設定して低域ろ波する
ことで、基本周波数で構成される基本音声信号を抽出
し、該基本音声信号の立ち上がり若しくは立ち下がりゼ
ロクロス点を検出し、該ゼロクロス点が検出された際に
は、前記読出した原音声信号を、時間軸上において前記
ゼロクロス点と対応する位置で複数のフレームに区切
り、話速度データfが1以上の場合には該フレームの一
部を省略し、話速度データfが1未満の場合にはフレー
ムの一部を1回若しくは2回以上繰り返しつつ連続して
再生し、前記ゼロクロス点が検出されなかった際には、
話速度データfが1以上の場合には前記読出した原音声
信号の内の1/f分を再生し、また話速度データfが1
未満の場合には読出した原音声信号の内の(1/f−
1)分を再生するのに加えて読出した全原音声信号を連
続して再生することを特徴とする。
【0008】また、請求項2記載の発明は、記録媒体に
記録された原音声信号を読み出して再生する音声再生装
置において、前記原音声信号を、基本周波数を抽出する
ため、カットオフ周波数を基本周波数の中間値に設定し
て低域ろ波して、基本周波数で構成される基本音声信号
を抽出するフィルタ部と、前記基本音声信号の立ち上が
り若しくは立ち下がりゼロクロス点を検出するゼロクロ
ス点検出部と、前記ゼロクロス点が検出された際には、
前記読出した原音声信号を、時間軸上において前記ゼロ
クロス点と対応する位置で複数のフレームに区切り、話
速度データfが1以上の場合には該フレームの一部を省
略し、話速度データfが1未満の場合にはフレームの一
部を1回若しくは2回以上繰り返しつつ連続して出力
し、前記ゼロクロス点が検出されなかった際には、話速
度データfが1以上の場合には前記読出した原音声信号
の内の1/f分を出力し、また話速度データfが1未満
の場合には読出した原音声信号の内の(1/f−1)分
を出力するのに加えて読出した全原音声信号を連続して
出力する信号変換処理部とを具備することを特徴とす
る。これらによれば、有声音部分の各フレームの繋ぎ目
部分での音声信号の周期は基本音声信号の周期と変わら
ず、また連続性も損なわれないため、フレームの一部を
省略して圧縮したり、また1回若しくは2回以上繰り返
して伸長して音声信号を再生しても、音程が変化せず、
音質の劣化も少なくなる。また、ゼロクロス点が検出さ
れない部分、つまり無声音部分では、フレームに区切る
ことなく原音声信号の一部を省略して圧縮したり、また
1回若しくは2回以上繰り返して伸長しても人の耳には
音質の劣化として聞こえにくい高い周波数であるため、
問題はない。
【0009】
【発明の実施の形態】以下、本発明の好適な実施形態に
ついて添付図面と共に詳述する。まず、図1と共に発明
に係る音声再生方法の基本原理について説明する。最初
に、本発明に至る経緯について概略説明する。音声に
は、母音のように声帯振動が音源となってほぼ周期的な
振動波形となる有声音と、サ行子音のように声帯は振動
せず、口腔内において舌、歯、唇などで作られたせばめ
の部位に空気流を吹きつけて生じた雑音が音源となる無
声音とがある。そして、この有声音部分が上述した各フ
レームの繋ぎ目部分にあたってその連続性が損なわれた
場合には、音質の劣化(ノイズの発生等による)が人が
耳で聞いてわかる程度に大きくなるが、一方無声音部分
の連続性が損なわれても無声音の周波数が有声音の周波
数、つまり声帯振動周波数(約70Hz〜約350Hz 。音声の
基本周波数に対応する。)よりも十分高いために人の耳
には音質の劣化として聞こえにくい。よって、少なくと
も有声音部分の連続性を確保しておけば、フレームの一
部を省略して圧縮したり、また1回若しくは2回以上繰
り返して伸長して音声信号を再生しても、音程が変化せ
ず、音質の劣化も少なくなると判断したのである。
【0010】続いて音声再生方法の特徴点は、原音声信
号aを複数のフレーム(一例としてC1 〜C6 ,・
・・)に区切る際に、原音声信号aから基本周波数Fp
(基本周期Tp )で構成される基本音声信号dを低域ろ
波して抽出し、この基本音声信号dの立ち上がり若しく
は立ち下がりゼロクロス点(図1においては一例として
立ち上がりゼロクロス点)Dを検出し、原音声信号a
を、時間軸上においてゼロクロス点D(図1中の黒点)
と対応する位置で区切る点にある。図1では一例として
各フレームは4Tp となるように区切られている。
【0011】これにより、複数のフレームC1 〜C6
の一部を省略し、または1回若しくは2回以上繰り返
しつつ連続して再生する際(一例としてフレームを一つ
置きに再生し、倍速再生する場合を示す)に、再生音声
信号eを構成する各フレーム(C1 ,C3 ,C5
)間の繋ぎ目部分は、従来のように強制的に信号のレ
ベルを合わせることなく常にゼロクロス点で連続し、ま
たフレームを区切る際には信号の立ち上がり若しくは立
ち下がりゼロクロス点の一方に統一してあるために音声
信号eの位相も繋ぎ目部分で反転することがないから各
フレーム(C1,C3 ,C5 )に含まれる信号の連
続性も損なわれない。よって、このようにして発生させ
た再生音声信号eを再生した際に、従来のように繋ぎ目
部分の周波数が基本周波数Fp から大きく変化してその
部分での音程が変わったり、また信号の連続性が損なわ
れることで音質が劣化するということが生じない。な
お、図1において音声信号eは、繋ぎ目部分の状態を分
かりやすくするために基本音声信号dを用いて表現して
いるが、実際には再生させるべく選択された原音声信号
aの各フレーム(C1 ,C3 ,C5 )で構成され
る。
【0012】また、再生速度を標準より下げる場合に
は、複数のフレームC1 〜C6 の一部を省略する代
わりに、または1回若しくは2回以上繰り返しつつ連続
させるようにすればよい。具体的には、一例として再生
音声信号eを原音声信号aの各フレームC1 〜C6
を1回ずつ繰り返してC1 ,C1 ,C2 ,C2,
C3 ,C3 ,C4 ,C4 ,C5 ,C5 ,C
6 ,C6 というように連続させて構成し、出力させ
ることで、原音声信号aの0.5倍速の再生が可能とな
る。また、C1 ,C1 ,C2 ,C3 ,C4 ,
C4 ,C5,C6 というように連続させて構成し、
出力させることで原音声信号aの0.75倍速の再生が
可能となる。
【0013】次に、本発明に係る音声再生方法を実現す
る音声再生回路の一実施の形態について図2〜図7を用
いて説明する。一例として記録媒体にランダムアクセス
可能なCD−ROM(単に、CDとも言う)を使用した
音声式電子ブックの音声再生回路10を用いて説明する
が、記録媒体は磁気テープやフロッピディスク、またR
AM等の半導体記憶素子で構成されたICカードであっ
ても良い。CDには本などを朗読した原音声信号aが、
PCMデータの形で記録されている。
【0014】音声再生回路10の概要構成について図2
と図6を用いて説明する。音声再生回路10には、光ピ
ックアップを有する読取部12がCD14から読み取っ
た前述のPCMデータが入力される。入力データ用リン
グメモリ(単に入力リングメモリとも言う)16では、
読取部12が出力するPCMデータを順次記憶する。
【0015】演算用マイコン18は、入力リングメモリ
16からPCMデータを書き込まれた順番で、予め決め
られたデータ量(主フレームE分)ずつ順次読み出すと
共に、演算用メモリ20に記憶する。そして読みだした
データから成る1主フレームE分の原音声信号aから基
本周波数Fp (なお、音声により若干変動する)で構成
される基本音声信号dを抽出し、基本音声信号dの立ち
上がり若しくは立ち下がりゼロクロス点Dを検出し、演
算用メモリ20に記憶された1主フレームE分の原音声
信号aを時間軸上においてゼロクロス点と対応する位置
で複数の副フレーム(C1 〜C11)に区切り、制御
用マイコン22から入力された話速度データfに基づい
て、標準の速度から再生速度を早める場合には副フレー
ムCの一部を省略し、また再生速度を遅くする場合には
1回若しくは2回以上同じ副フレームCを繰り返すよう
にして演算用メモリ20から読み出し、再生する原音声
信号aの副フレームを出力データ用リングメモリ(単
に、出力リングメモリとも言う)24に順次書き込む。
そして出力リングメモリ24に書き込まれたPCMデー
タが再生音声信号eを構成する。
【0016】最後にDAC(Digital to Analog Conver
ter )26が出力リングメモリ24に記憶された複数の
副フレームCから成る原音声信号aを連続して一定の速
度で読み出し、アナログ信号に変換することで話速度が
変換された状態で再生音声信号eを再生できる。DAC
26から出力された再生音声信号eは不図示のスピーカ
から音声として出力される。なお、制御用マイコン22
は話速度を決定する話速度データfを演算用マイコン1
8に指定する機能を有している。また、外部フラッシュ
メモリ28には演算用マイコン18の動作を規定するプ
ログラムが記憶される。また、入力リングメモリ16や
出力リングメモリ24の各記憶容量は、演算用マイコン
18の処理速度を考慮して、双方のメモリ16、24が
空になったり、またFull状態とならないように予め設定
する。また、入力リングメモリ16、出力リングメモリ
24、演算用メモリ20は一つのメモリの記憶エリアを
分割して使用することも可能である。
【0017】さらに演算用マイコン18の内部構成と話
速度変換処理動作について図3〜図7を用いて詳細に説
明する。ディジタルフィルタ部(以下、単にフィルタ部
とも言う)30は、原音声信号aのPCMデータを低域
ろ波し、無声音成分を除いた音声の基本周波数Fp (約
70Hz〜約350Hz )で構成される基本音声信号dを抽出す
る。具体的には一例として、2次のバタワース型IIR
ローパスフィルタを2段用いて形成し、そのカットオフ
周波数を基本周波数(約70Hz〜約350Hz )の中間値であ
る 200Hzに設定する。この構成により、フィルタ部30
からは図1、図6、図7に示されるような基本周波数F
p (基本周期Tp )から成る基本音声信号dが出力され
る。
【0018】ゼロクロス点検出部32では、入力された
基本音声信号dの立ち上がり若しくは立ち下がりゼロク
ロス点を主フレームE毎に検出する。本実施の形態では
立ち上がりゼロクロス点Dを検出する構成となってい
る。また、ゼロクロス点検出部32では入力された1主
フレームE分の基本音声信号dをゼロクロス点Dの位置
で、基本周期Tp の所定の倍数の間隔で区切り、複数の
副フレームCn (nは自然数)に分割する。そして各
副フレームCの境界部分の情報を、例えば各主フレーム
の先頭から位置を演算用メモリ20に記憶されるアドレ
ス情報として出力する(これらはゼロクロス情報gと言
う)。また、音有無判定部34ではゼロクロス点検出部
32においてゼロクロス点Dが検出されるか否かを判断
しており、検出されない場合には無声音期間または音声
無し期間を意味する無音信号hを出力する。なお、音有
無判定部34を設けずにゼロクロス点検出部32におい
て無音信号hを出力させる構成としてもよい。
【0019】信号変換処理部36では、制御用マイコン
22から指定された話速度データf(f倍速再生を示す
データ、fは実数値)に基づいて話速度変換処理を行
う。なお、変換処理フローは主フレームE内にゼロクロ
ス点Dが検出される場合と無い場合とで異なるため、分
けて説明する。最初に、ゼロクロス点Dが検出される場
合、つまり音有無判定部34から無音信号hが入力され
ない場合について説明する。信号変換処理部36は図4
の処理フローに示すように、ゼロクロス情報gに基づき
副フレームCの数をカウントしながら、副フレームCの
原音声信号aを演算用メモリ20から読み出し(ステッ
プ100)、f回に1回の割合となったら現在の副フレ
ームCの原音声信号aを出力リングメモリ24内に順次
連続させて記憶させ(ステップ102)、その他の場合
には記憶しない(ステップ104)。なお、出力リング
メモリ24へは各副フレームCの原音声信号aは連続し
た状態となるように再生音声信号eとして記憶させる。
【0020】演算用メモリ20に記憶された主フレーム
E内の副フレームCの終了を検出しつつ(ステップ10
6)、副フレームCがまだ残っている場合には次の副フ
レームCに移り(ステップ108)、再度ステップ10
0に移行する。また、副フレームCが終了したら演算用
メモリ20に記憶された主フレームE分の原音声信号a
のPCMデータの信号変換処理を終了させる。なお、主
フレームEの後端に1基本周期Tp に満たない部分Iが
生じた場合には演算用メモリ20に残しておき、次の主
フレームEを読み込んだ際にその主フレームEの先頭に
付加し、部分Iを含めた1主フレームEとして同様に処
理する。そして演算用メモリ20に記憶された主フレー
ムE分の原音声信号aのPCMデータの変換処理が終了
したら、演算用マイコン18は入力リングメモリ16か
ら次に処理すべきPCMデータを1主フレームE分だけ
読み出して演算用メモリ20に記憶し、再度この処理フ
ローを行う。
【0021】具体例を図6を用いて説明すると、f=
2、つまり2倍速再生をさせる場合の信号変換処理は、
各主フレームE毎に、副フレーム(C1 〜C11)の
数を副フレームC1 から順次カウントしながら2回に
1回の割合で副フレームC内の原音声信号aを演算用メ
モリ20から読み出し(斜線で示される副フレームが読
み出される)、出力リングメモリ24内に順次連続させ
ながら記憶させる。これにより、出力リングメモリ24
に記憶された当該主フレームEにかかる再生音声信号e
のPCMデータ量は変換前のものに比べて1/2とな
り、再生速度が2倍となる。
【0022】また、f=1.5、つまり1.5倍速再生
をさせる場合の信号変換処理は、副フレームCの原音声
信号aを1.5回に1回の割合、つまり3回に2回の割
合で演算用メモリ20から読み出し(斜線で示される副
フレームが読み出される)、出力リングメモリ24内に
順次連続させながら記憶させる。これにより、出力リン
グメモリ24に記憶された再生音声信号eのPCMデー
タ量は変換前のものに比べて2/3となり、再生速度が
1.5倍となる。また、f=1、つまり標準速度での再
生の場合には、1回に1回の割合、つまり主フレームE
を構成する全ての副フレーム(C1 〜C11)のPC
Mデータが出力リングメモリ24に記憶されるため、再
生速度が標準再生速度となる。
【0023】また、以上はfが1以上の場合についてで
あるが、f<1の場合には、再生速度がf倍となるよう
に所定の数の副フレームC置きにその副フレームCを繰
り返して再生し、出力リングメモリ24に記憶される再
生音声信号eのPCMデータ量を、主フレームEのPC
Mデータ量の1/f倍とする。これにより、再生速度が
f倍となる。
【0024】具体例を図6に示す。f=0.75、つま
り0.75倍速再生をさせる場合の信号変換処理は、各
主フレームE毎に、副フレームCの数をカウントしなが
ら分割された副フレームCの原音声信号aを読み出すと
共に、3回に1回の割合で同じ副フレームCを再度繰り
返して読み出して出力リングメモリ24内に順次副フレ
ームC同士が連続するように記憶させる。これにより、
出力リングメモリ24に記憶された当該主フレームEに
かかる再生音声信号eのPCMデータ量は変換前のもの
に比べて4/3(=1/0.75)となり、再生速度が
0.75倍となる(塗り潰された副フレームC1 ,C
4 ,C7 ,C10が2回連続して読み出される)。
なお、fの値によっては主フレームE内のデータ量と出
力リングメモリ24に記憶されたデータ量(出力データ
量)との関係が、fの値に一致しない場合があるが、こ
のような場合には(主フレームデータ量/出力データ
量)の値がfの値に最も近くなるように、省略したり、
また繰り返したりする副フレームCの割合を決定する。
【0025】次に、ゼロクロス点が検出されなかった場
合、つまり音有無判定部34から無音信号hが入力され
た場合について説明する。信号変換処理部36は図5の
処理フローに示すように、fが1以上の場合には、各主
フレームEの先頭から当該主フレームE内に含まれる全
PCMデータの標本数(サンプル数)の1/f個分のP
CMデータ(小数点以下は切り捨て等を行い整数化させ
る)を読み出して出力リングメモリ24内に順次連続さ
せて記憶させる。これにより、出力リングメモリ24に
記憶された当該主フレームEにかかる再生音声信号eの
PCMデータ量は変換前のものに比べて1/fとなり、
再生速度がf倍となる。
【0026】具体例を図7に示す。f=2、つまり2倍
速再生をさせる場合の信号変換処理は、各主フレームE
毎に当該主フレームE内に含まれる全PCMデータの標
本数の1/2個分のPCMデータ(小数点以下は切り捨
て等を行い整数化させる)を読み出して出力リングメモ
リ24内に順次記憶させる。これにより、出力リングメ
モリ24に記憶された当該主フレームEにかかる再生音
声信号eのPCMデータ量は変換前のものに比べて1/
2となり、再生速度が2倍となる。1.5倍の場合も同
様。
【0027】また、fが1未満の場合には、各主フレー
ムEの先頭から当該主フレームE内に含まれる全PCM
データの標本数の(1/f−1)個分のPCMデータ
(小数点以下は切り捨て等を行い整数化させる)を読み
出して出力リングメモリ24内に順次記憶させ、その後
さらに主フレームEの全PCMデータを連続して記憶さ
せる。これにより、出力リングメモリ24に記憶された
当該主フレームEにかかる再生音声信号eのPCMデー
タ量は変換前のものに比べて1/fとなり、再生速度が
f倍となる。
【0028】具体例を図7に示す。f=0.75、つま
り0.75倍速再生をさせる場合の信号変換処理は、各
主フレームE毎に当該主フレームE内に含まれる全PC
Mデータの標本数の(1/0.75−1=1/3)個分
のPCMデータ(小数点以下は切り捨て等を行い整数化
させる)を読み出して出力リングメモリ24内に順次記
憶させ、その後さらに主フレームEの全PCMデータを
連続して記憶させる。これにより、出力リングメモリ2
4に記憶された当該主フレームEにかかる再生音声信号
eのPCMデータ量は変換前のものに比べて(1/3+
1=4/3=1/f)となり、再生速度がf倍となる。
無音の主フレームEが連続する場合には上記処理フロー
を繰り返し行う。
【0029】また、f<0.5の場合には1の主フレー
ムE内に含まれる全副フレームCを1回ずつ繰り返した
り、また無音の場合にはPCMデータを全標本数分だけ
繰り返しても、出力リングメモリ24に記憶されるPC
Mデータ量はもとの主フレームEに含まれるデータ量の
2倍にしかならないため、fの値に応じて特定の副フレ
ームを2回繰り返して記憶させたり、また無音の場合に
はPCMデータをさらに必要な標本数分だけ繰り返して
記憶させるようにする。
【0030】以上、本発明の好適な実施例について種々
述べてきたが、本発明は上述の実施例に限定されるので
はなく、発明の精神を逸脱しない範囲で多くの改変を施
し得るのはもちろんである。
【0031】
【発明の効果】本発明に係る音声再生方法と音声再生装
置によれば、ゼロクロス点が検出される有音声部分で
は、原音声信号をゼロクロス点と対応する位置で複数の
フレームに区切り、フレームの一部を省略して圧縮し再
生速度を上げて音声信号を再生したり、また1回若しく
は2回以上繰り返して伸長して再生速度を下げて音声信
号を再生しているため、再生される音声信号の周期は基
本音声信号の周期と変らず、また各フレームの繋ぎ目部
分での連続性も損なわれないため、音程が変化せず、音
質の劣化も少なくなるという効果がある。また、ゼロク
ロス点が検出されない部分、つまり無声音部分では、再
生信号が不連続になっても高い周波数であるため人の耳
には音質の劣化として聞こえにくいということを考慮し
て、有音声部分のようにフレームに区切ることはせず
に、再生速度を速める場合には原音声信号の1/f(こ
こでfは話速度データ)分のみを出力したり、また再生
速度を遅くする場合には原音声信号の(1/f−1)分
に加えて全原音声信号を連続して出力するという簡単な
処理で再生速度を変えている。これにより、有音声部分
と無声音部分を含めて全体的に再生速度を、音程が変化
せず、しかも音質の劣化の少ない状態で変化させること
ができるという効果を奏する。
【図面の簡単な説明】
【図1】本発明に係る音声再生方法の基本原理を説明す
る説明図である。
【図2】本発明に係る音声再生装置の構成を示すブロッ
ク図である。
【図3】図2の演算用マイコンの構成を示すブロック図
である。
【図4】図2の音声再生装置の動作手順を示すフローチ
ャートである(主フレーム内の原音声信号aが有音の場
合)。
【図5】図2の音声再生装置の動作手順を示すフローチ
ャートである(主フレーム内の原音声信号aが無音の場
合)。
【図6】図4の音声再生装置の処理動作を示す説明図で
ある。
【図7】図5の音声再生装置の処理動作を示す説明図で
ある。
【図8】従来の音声再生方法の動作原理を説明する説明
図である。
【符号の説明】
C 副フレーム D ゼロクロス点 Tp 基本周期 a 原音声信号 d 基本音声信号 e 再生音声信号

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 記録媒体に記録された原音声信号を読み
    出して再生する音声再生方法において、 前記原音声信号を予め決められたデータ量ずつ順次読み
    出し、 該読み出した原音声信号を、基本周波数を抽出するた
    め、カットオフ周波数を基本周波数の中間値に設定して
    低域ろ波することで、基本周波数で構成される基本音声
    信号を抽出し、 該基本音声信号の立ち上がり若しくは立ち下がりゼロク
    ロス点を検出し、 該ゼロクロス点が検出された際には、前記読出した原音
    声信号を、時間軸上において前記ゼロクロス点と対応す
    る位置で複数のフレームに区切り、話速度データfが1
    以上の場合には該フレームの一部を省略し、話速度デー
    タfが1未満の場合にはフレームの一部を1回若しくは
    2回以上繰り返しつつ連続して再生し、 前記ゼロクロス点が検出されなかった際には、話速度デ
    ータfが1以上の場合には前記読出した原音声信号の内
    の1/f分を再生し、また話速度データfが1未満の場
    合には読出した原音声信号の内の(1/f−1)分を再
    生するのに加えて読出した全原音声信号を連続して再生
    することを特徴とする音声再生方法。
  2. 【請求項2】 記録媒体に記録された原音声信号を読み
    出して再生する音声再生装置において、 前記原音声信号を、基本周波数を抽出するため、カット
    オフ周波数を基本周波数の中間値に設定して低域ろ波し
    て、基本周波数で構成される基本音声信号を抽出するフ
    ィルタ部と、 前記基本音声信号の立ち上がり若しくは立ち下がりゼロ
    クロス点を検出するゼロクロス点検出部と、 前記ゼロクロス点が検出された際には、前記読出した原
    音声信号を、時間軸上において前記ゼロクロス点と対応
    する位置で複数のフレームに区切り、話速度データfが
    1以上の場合には該フレームの一部を省略し、話速度デ
    ータfが1未満の場合にはフレームの一部を1回若しく
    は2回以上繰り返しつつ連続して出力し、前記ゼロクロ
    ス点が検出されなかった際には、話速度データfが1以
    上の場合には前記読出した原音声信号の内の1/f分を
    出力し、また話速度データfが1未満の場合には読出し
    た原音声信号の内の(1/f−1)分を出力するのに加
    えて読出した全原音声信号を連続して出力する信号変換
    処理部とを具備することを特徴とする音声再生装置。
JP2002037001A 2002-02-14 2002-02-14 音声再生方法と音声再生装置 Pending JP2002313015A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002037001A JP2002313015A (ja) 2002-02-14 2002-02-14 音声再生方法と音声再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002037001A JP2002313015A (ja) 2002-02-14 2002-02-14 音声再生方法と音声再生装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP8350852A Division JPH10187188A (ja) 1996-12-27 1996-12-27 音声再生方法と音声再生装置

Publications (1)

Publication Number Publication Date
JP2002313015A true JP2002313015A (ja) 2002-10-25

Family

ID=19192619

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002037001A Pending JP2002313015A (ja) 2002-02-14 2002-02-14 音声再生方法と音声再生装置

Country Status (1)

Country Link
JP (1) JP2002313015A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9361905B2 (en) 2013-01-28 2016-06-07 Shinano Kenshi Kabushiki Kaisha Voice data playback speed conversion method and voice data playback speed conversion device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9361905B2 (en) 2013-01-28 2016-06-07 Shinano Kenshi Kabushiki Kaisha Voice data playback speed conversion method and voice data playback speed conversion device

Similar Documents

Publication Publication Date Title
JPH10187188A (ja) 音声再生方法と音声再生装置
JP5367932B2 (ja) オーディオ速度変換を可能にするシステムおよび方法
JP2010283605A (ja) 映像処理装置及び方法
TW200304123A (en) Audio frequency scaling during video trick modes utilizing digital signal processing
JPS5982608A (ja) 音声の再生速度制御方式
JP2002313015A (ja) 音声再生方法と音声再生装置
JP4542805B2 (ja) 変速再生方法及び装置、並びにプログラム
US6070135A (en) Method and apparatus for discriminating non-sounds and voiceless sounds of speech signals from each other
JP4089713B2 (ja) 波形データ再生装置および記録媒体
JPH08195028A (ja) 音声処理回路
JP3731476B2 (ja) 波形データ解析方法、波形データ解析装置および記録媒体
JP2001154684A (ja) 話速変換装置
JP2002073098A (ja) 音声再生装置、音声再生方法、画像音声再生装置および画像音声再生方法
JP4648183B2 (ja) 連続メディアデータ短縮再生方法、複合メディアデータ短縮再生方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
KR0138464B1 (ko) 화음데이터가 기록된 영상가요매체와 그 재생장치
JPH01267700A (ja) 音声処理装置
JP2005204003A (ja) 連続メディアデータ高速再生方法、複合メディアデータ高速再生方法、多チャンネル連続メディアデータ高速再生方法、映像データ高速再生方法、連続メディアデータ高速再生装置、複合メディアデータ高速再生装置、多チャンネル連続メディアデータ高速再生装置、映像データ高速再生装置、プログラム、および、記録媒体
JPH0242497A (ja) 音声記録再生装置
JPH01152499A (ja) 倍速再生装置
JPH10224743A (ja) 音声信号記録再生装置及び音声信号記録再生方法
JP2005165370A (ja) 波形データ解析方法、波形データ解析装置およびコンピュータ読み取り可能な記録媒体
JPS5817499A (ja) 可変速式音声再生装置
JPH05303400A (ja) 音声再生装置と音声再生方法
JP2004039096A (ja) インデックス情報作成方法および装置
JPH04216353A (ja) 音声時間軸圧縮伸長方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051026

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051206