JPH10187188A - 音声再生方法と音声再生装置 - Google Patents

音声再生方法と音声再生装置

Info

Publication number
JPH10187188A
JPH10187188A JP8350852A JP35085296A JPH10187188A JP H10187188 A JPH10187188 A JP H10187188A JP 8350852 A JP8350852 A JP 8350852A JP 35085296 A JP35085296 A JP 35085296A JP H10187188 A JPH10187188 A JP H10187188A
Authority
JP
Japan
Prior art keywords
audio signal
frame
zero
reproducing
original audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8350852A
Other languages
English (en)
Inventor
Shin Tanaka
伸 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shinano Kenshi Co Ltd
Original Assignee
Shinano Kenshi Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shinano Kenshi Co Ltd filed Critical Shinano Kenshi Co Ltd
Priority to JP8350852A priority Critical patent/JPH10187188A/ja
Priority to US08/827,909 priority patent/US6026067A/en
Priority to GB9707160A priority patent/GB2320791B/en
Priority to DE19714688A priority patent/DE19714688C2/de
Priority to CN97113136A priority patent/CN1113345C/zh
Publication of JPH10187188A publication Critical patent/JPH10187188A/ja
Priority to US09/384,543 priority patent/US6088313A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/40Rhythm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/01Correction of time axis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/005Reproducing at a different information rate from the information rate of recording
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/375Tempo or beat alterations; Music timing control
    • G10H2210/385Speed change, i.e. variations from preestablished tempo, tempo change, e.g. faster or slower, accelerando or ritardando, without change in pitch
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/09Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being zero crossing rates
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2545CDs

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Abstract

(57)【要約】 【課題】 再生速度を変化させた時にも音程が変化しな
い音声再生方法と音声再生装置を提供する。 【解決手段】 記録媒体に記録された原音声信号aを読
み出して再生する音声再生方法において、原音声信号a
を低域ろ波して基本音声信号d(基本周期Tp から構成
される)を抽出し、基本音声信号dの立ち上がりゼロク
ロス点Dを検出し、ゼロクロス点Dが検出された際に
は、原音声信号aを、時間軸上においてゼロクロス点D
と対応する位置で複数の副フレームC(C1,C2,C3,C
4,C5,C6 )に区切り、再生速度を早める場合には副フ
レームCの一部を省略し、再生速度を遅くする場合には
1回若しくは2回以上繰り返しつつ再生音声信号eとし
て連続して再生する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はCD(コンパクトデ
ィスク)等の記録媒体に記録された原音声信号を読み出
して再生する音声再生方法に関し、特に再生速度を変化
させた時にも音程が変化しない音声再生方法と音声再生
装置に関する。
【0002】
【従来の技術】従来、CDやカセットテープ、ビデオテ
ープ等の記録媒体に記録された音声信号を再生する際
に、標準の再生速度に対して再生速度を変えて再生する
場合がある。例えば、短時間で所定量の内容を聞きたい
場合には再生速度を上げ、また早口などの理由で聞き取
りにくい場合には再生速度を下げてゆっくり再生するの
である。このように再生速度を変えるには、CDの回転
速度やテープの走行速度を上げたり、また下げたりする
ことで実現される。ところが、この音声再生方法ではC
D等の記録媒体から読み出される音声信号自体の周波数
も再生速度の変化に合わせて変化するため、音程も変化
して聞きにくいという課題があった。
【0003】そこで、音程はそのままにして再生速度の
みを変換する方法として、図8に示すように原音声信号
aをある一定の時間長tの複数のフレームA(一例とし
てA 1 〜A6 ,・・・・・)に分割し、それらを組み合
わせて再生速度を変化させる方法がある。例えば2倍速
で再生する場合には、フレームAを一つ置きに間引いて
連続再生(一例としてA1 ,A3 ,A5 ,・・・を再
生)することによって、再生音声信号cの全体の再生時
間を半分にすることが可能となり、しかも原音声信号a
の周波数(周期T)はある程度元のままであるから音声
の音程を殆ど変えることなく再生できるのである。
【0004】なお、選択されたフレーム(A1 ,A3
5 )を連続させる際に、単純にそのまま繋げて再生す
ると、音声信号bのように繋ぎ目部分B1 〜B4 におい
て信号が不連続となり、この部分で耳障りなノイズを発
生し、聞きにくい。そこで、再生する各フレームA毎に
窓関数を乗算して各フレームA間の始点と終点部分での
原音声信号aのレベルを強制的に合わせ、再生音声信号
cのようにする。これによって再生時のノイズの低減を
図っている。窓関数の一例としては下記式に示すような
ものが使用される。 W(n) = 0.5-0.5cos( 2πn/M)
【0005】
【発明が解決しようとする課題】しかしながら、従来の
音声再生方法には次のような課題がある。窓関数を使用
する再生方法では、上述したように各フレームの繋ぎ目
部分を強制的に合わせるために、原音声信号の繋ぎ目部
分のレベルを所定のレベル、一例としてゼロ若しくはゼ
ロに近いレベルに強制的に変更するので、繋ぎ目部分で
の音声信号の周期が基本周期と大きく異なる場合が生じ
てその部分での音程がやはり変わってしまうという課題
がある。また、繋ぎ目部分とそれ以外の部分の原音声信
号の周波数の連続性が損なわれるため、音質も劣化する
という課題もある。
【0006】従って、本発明は上記課題を解決すべくな
され、その目的とするところは、再生速度を変化させた
時にも音程が変化しない音声再生方法と音声再生装置を
提供することにある。
【0007】
【課題を解決するための手段】上記課題を解決するた
め、本発明は次の構成を備える。すなわち、請求項1記
載の発明は、記録媒体に記録された原音声信号を読み出
して再生する音声再生方法において、前記原音声信号を
低域ろ波して基本音声信号を抽出し、該基本音声信号の
立ち上がり若しくは立ち下がりゼロクロス点を検出し、
該ゼロクロス点が検出された際には、前記原音声信号
を、時間軸上において前記ゼロクロス点と対応する位置
で複数のフレームに区切り、該フレームの一部を省略
し、または1回若しくは2回以上繰り返しつつ連続して
再生することを特徴とする。
【0008】また、請求項2記載の発明は、記録媒体に
記録された原音声信号を読み出して再生する音声再生装
置において、前記原音声信号を低域ろ波して基本音声信
号を抽出するフィルタ部と、前記基本音声信号の立ち上
がり若しくは立ち下がりゼロクロス点を前記主フレーム
毎に検出するゼロクロス点検出部と、前記ゼロクロス点
が検出された際には、前記原音声信号を、時間軸上にお
いて前記ゼロクロス点と対応する位置で複数のフレーム
に区切ると共に、該フレームの一部を省略し、または1
回若しくは2回以上繰り返しつつ連続して出力させる信
号変換処理部とを具備することを特徴とする。これらに
よれば、各フレームの繋ぎ目部分での音声信号の周期は
基本音声信号の周期と変わらず、また連続性も損なわれ
ないため、フレームの一部を省略して圧縮したり、また
1回若しくは2回以上繰り返して伸長して音声信号を再
生しても、音程が変化せず、音質の劣化も少なくなる。
【0009】
【発明の実施の形態】以下、本発明の好適な実施形態に
ついて添付図面と共に詳述する。まず、図1と共に発明
に係る音声再生方法の基本原理について説明する。最初
に、本発明に至る経緯について概略説明する。音声に
は、母音のように声帯振動が音源となってほぼ周期的な
振動波形となる有声音と、サ行子音のように声帯は振動
せず、口腔内において舌、歯、唇などで作られたせばめ
の部位に空気流を吹きつけて生じた雑音が音源となる無
声音とがある。そして、この有声音部分が上述した各フ
レームの繋ぎ目部分にあたってその連続性が損なわれた
場合には、音質の劣化(ノイズの発生等による)が人が
耳で聞いてわかる程度に大きくなるが、一方無声音部分
の連続性が損なわれても無声音の周波数が有声音の周波
数、つまり声帯振動周波数(約70Hz〜約350Hz 。音声の
基本周波数に対応する。)よりも十分高いために人の耳
には音質の劣化として聞こえにくい。よって、少なくと
も有声音部分の連続性を確保しておけば、フレームの一
部を省略して圧縮したり、また1回若しくは2回以上繰
り返して伸長して音声信号を再生しても、音程が変化せ
ず、音質の劣化も少なくなると判断したのである。
【0010】続いて音声再生方法の特徴点は、原音声信
号aを複数のフレーム(一例としてC1 〜C6 ,・・
・)に区切る際に、原音声信号aから基本周波数Fp
(基本周期Tp )で構成される基本音声信号dを低域ろ
波して抽出し、この基本音声信号dの立ち上がり若しく
は立ち下がりゼロクロス点(図1においては一例として
立ち上がりゼロクロス点)Dを検出し、原音声信号a
を、時間軸上においてゼロクロス点D(図1中の黒点)
と対応する位置で区切る点にある。図1では一例として
各フレームは4Tp となるように区切られている。
【0011】これにより、複数のフレームC1 〜C6
一部を省略し、または1回若しくは2回以上繰り返しつ
つ連続して再生する際(一例としてフレームを一つ置き
に再生し、倍速再生する場合を示す)に、再生音声信号
eを構成する各フレーム(C 1 ,C3 ,C5 )間の繋ぎ
目部分は、従来のように強制的に信号のレベルを合わせ
ることなく常にゼロクロス点で連続し、またフレームを
区切る際には信号の立ち上がり若しくは立ち下がりゼロ
クロス点の一方に統一してあるために音声信号eの位相
も繋ぎ目部分で反転することがないから各フレーム(C
1 ,C3 ,C5)に含まれる信号の連続性も損なわれな
い。よって、このようにして発生させた再生音声信号e
を再生した際に、従来のように繋ぎ目部分の周波数が基
本周波数Fp から大きく変化してその部分での音程が変
わったり、また信号の連続性が損なわれることで音質が
劣化するということが生じない。なお、図1において音
声信号eは、繋ぎ目部分の状態を分かりやすくするため
に基本音声信号dを用いて表現しているが、実際には再
生させるべく選択された原音声信号aの各フレーム(C
1 ,C3 ,C5 )で構成される。
【0012】また、再生速度を標準より下げる場合に
は、複数のフレームC1 〜C6 の一部を省略する代わり
に、または1回若しくは2回以上繰り返しつつ連続させ
るようにすればよい。具体的には、一例として再生音声
信号eを原音声信号aの各フレームC1 〜C6 を1回ず
つ繰り返してC1 ,C1 ,C2 ,C2 ,C3 ,C3 ,C
4 ,C4 ,C5 ,C5 ,C6 ,C6 というように連続さ
せて構成し、出力させることで、原音声信号aの0.5
倍速の再生が可能となる。また、C1 ,C1 ,C 2 ,C
3 ,C4 ,C4 ,C5 ,C6 というように連続させて構
成し、出力させることで原音声信号aの0.75倍速の
再生が可能となる。
【0013】次に、本発明に係る音声再生方法を実現す
る音声再生回路の一実施の形態について図2〜図7を用
いて説明する。一例として記録媒体にランダムアクセス
可能なCD−ROM(単に、CDとも言う)を使用した
音声式電子ブックの音声再生回路10を用いて説明する
が、記録媒体は磁気テープやフロッピディスク、またR
AM等の半導体記憶素子で構成されたICカードであっ
ても良い。CDには本などを朗読した原音声信号aが、
PCMデータの形で記録されている。
【0014】音声再生回路10の概要構成について図2
と図6を用いて説明する。音声再生回路10には、光ピ
ックアップを有する読取部12がCD14から読み取っ
た前述のPCMデータが入力される。入力データ用リン
グメモリ(単に入力リングメモリとも言う)16では、
読取部12が出力するPCMデータを順次記憶する。
【0015】演算用マイコン18は、入力リングメモリ
16からPCMデータを書き込まれた順番で、予め決め
られたデータ量(主フレームE分)ずつ順次読み出すと
共に、演算用メモリ20に記憶する。そして読みだした
データから成る1主フレームE分の原音声信号aから基
本周波数Fp (なお、音声により若干変動する)で構成
される基本音声信号dを抽出し、基本音声信号dの立ち
上がり若しくは立ち下がりゼロクロス点Dを検出し、演
算用メモリ20に記憶された1主フレームE分の原音声
信号aを時間軸上においてゼロクロス点と対応する位置
で複数の副フレーム(C1 〜C11)に区切り、制御用マ
イコン22から入力された話速度データfに基づいて、
標準の速度から再生速度を早める場合には副フレームC
の一部を省略し、また再生速度を遅くする場合には1回
若しくは2回以上同じ副フレームCを繰り返すようにし
て演算用メモリ20から読み出し、再生する原音声信号
aの副フレームを出力データ用リングメモリ(単に、出
力リングメモリとも言う)24に順次書き込む。そして
出力リングメモリ24に書き込まれたPCMデータが再
生音声信号eを構成する。
【0016】最後にDAC(Digital to Analog Conver
ter )26が出力リングメモリ24に記憶された複数の
副フレームCから成る原音声信号aを連続して一定の速
度で読み出し、アナログ信号に変換することで話速度が
変換された状態で再生音声信号eを再生できる。DAC
26から出力された再生音声信号eは不図示のスピーカ
から音声として出力される。なお、制御用マイコン22
は話速度を決定する話速度データfを演算用マイコン1
8に指定する機能を有している。また、外部フラッシュ
メモリ28には演算用マイコン18の動作を規定するプ
ログラムが記憶される。また、入力リングメモリ16や
出力リングメモリ24の各記憶容量は、演算用マイコン
18の処理速度を考慮して、双方のメモリ16、24が
空になったり、またFull状態とならないように予め設定
する。また、入力リングメモリ16、出力リングメモリ
24、演算用メモリ20は一つのメモリの記憶エリアを
分割して使用することも可能である。
【0017】さらに演算用マイコン18の内部構成と話
速度変換処理動作について図3〜図7を用いて詳細に説
明する。ディジタルフィルタ部(以下、単にフィルタ部
とも言う)30は、原音声信号aのPCMデータを低域
ろ波し、無声音成分を除いた音声の基本周波数Fp (約
70Hz〜約350Hz )で構成される基本音声信号dを抽出す
る。具体的には一例として、2次のバタワース型IIR
ローパスフィルタを2段用いて形成し、そのカットオフ
周波数を基本周波数(約70Hz〜約350Hz )の中間値であ
る 200Hzに設定する。この構成により、フィルタ部30
からは図1、図6、図7に示されるような基本周波数F
p (基本周期Tp )から成る基本音声信号dが出力され
る。
【0018】ゼロクロス点検出部32では、入力された
基本音声信号dの立ち上がり若しくは立ち下がりゼロク
ロス点を主フレームE毎に検出する。本実施の形態では
立ち上がりゼロクロス点Dを検出する構成となってい
る。また、ゼロクロス点検出部32では入力された1主
フレームE分の基本音声信号dをゼロクロス点Dの位置
で、基本周期Tp の所定の倍数の間隔で区切り、複数の
副フレームCn (nは自然数)に分割する。そして各副
フレームCの境界部分の情報を、例えば各主フレームの
先頭から位置を演算用メモリ20に記憶されるアドレス
情報として出力する(これらはゼロクロス情報gと言
う)。また、音有無判定部34ではゼロクロス点検出部
32においてゼロクロス点Dが検出されるか否かを判断
しており、検出されない場合には無声音期間または音声
無し期間を意味する無音信号hを出力する。なお、音有
無判定部34を設けずにゼロクロス点検出部32におい
て無音信号hを出力させる構成としてもよい。
【0019】信号変換処理部36では、制御用マイコン
22から指定された話速度データf(f倍速再生を示す
データ、fは実数値)に基づいて話速度変換処理を行
う。なお、変換処理フローは主フレームE内にゼロクロ
ス点Dが検出される場合と無い場合とで異なるため、分
けて説明する。最初に、ゼロクロス点Dが検出される場
合、つまり音有無判定部34から無音信号hが入力され
ない場合について説明する。信号変換処理部36は図4
の処理フローに示すように、ゼロクロス情報gに基づき
副フレームCの数をカウントしながら、副フレームCの
原音声信号aを演算用メモリ20から読み出し(ステッ
プ100)、f回に1回の割合となったら現在の副フレ
ームCの原音声信号aを出力リングメモリ24内に順次
連続させて記憶させ(ステップ102)、その他の場合
には記憶しない(ステップ104)。なお、出力リング
メモリ24へは各副フレームCの原音声信号aは連続し
た状態となるように再生音声信号eとして記憶させる。
【0020】演算用メモリ20に記憶された主フレーム
E内の副フレームCの終了を検出しつつ(ステップ10
6)、副フレームCがまだ残っている場合には次の副フ
レームCに移り(ステップ108)、再度ステップ10
0に移行する。また、副フレームCが終了したら演算用
メモリ20に記憶された主フレームE分の原音声信号a
のPCMデータの信号変換処理を終了させる。なお、主
フレームEの後端に1基本周期Tp に満たない部分Iが
生じた場合には演算用メモリ20に残しておき、次の主
フレームEを読み込んだ際にその主フレームEの先頭に
付加し、部分Iを含めた1主フレームEとして同様に処
理する。そして演算用メモリ20に記憶された主フレー
ムE分の原音声信号aのPCMデータの変換処理が終了
したら、演算用マイコン18は入力リングメモリ16か
ら次に処理すべきPCMデータを1主フレームE分だけ
読み出して演算用メモリ20に記憶し、再度この処理フ
ローを行う。
【0021】具体例を図6を用いて説明すると、f=
2、つまり2倍速再生をさせる場合の信号変換処理は、
各主フレームE毎に、副フレーム(C1 〜C11)の数を
副フレームC1 から順次カウントしながら2回に1回の
割合で副フレームC内の原音声信号aを演算用メモリ2
0から読み出し(斜線で示される副フレームが読み出さ
れる)、出力リングメモリ24内に順次連続させながら
記憶させる。これにより、出力リングメモリ24に記憶
された当該主フレームEにかかる再生音声信号eのPC
Mデータ量は変換前のものに比べて1/2となり、再生
速度が2倍となる。
【0022】また、f=1.5、つまり1.5倍速再生
をさせる場合の信号変換処理は、副フレームCの原音声
信号aを1.5回に1回の割合、つまり3回に2回の割
合で演算用メモリ20から読み出し(斜線で示される副
フレームが読み出される)、出力リングメモリ24内に
順次連続させながら記憶させる。これにより、出力リン
グメモリ24に記憶された再生音声信号eのPCMデー
タ量は変換前のものに比べて2/3となり、再生速度が
1.5倍となる。また、f=1、つまり標準速度での再
生の場合には、1回に1回の割合、つまり主フレームE
を構成する全ての副フレーム(C1 〜C11)のPCMデ
ータが出力リングメモリ24に記憶されるため、再生速
度が標準再生速度となる。
【0023】また、以上はfが1以上の場合についてで
あるが、f<1の場合には、再生速度がf倍となるよう
に所定の数の副フレームC置きにその副フレームCを繰
り返して再生し、出力リングメモリ24に記憶される再
生音声信号eのPCMデータ量を、主フレームEのPC
Mデータ量の1/f倍とする。これにより、再生速度が
f倍となる。
【0024】具体例を図6に示す。f=0.75、つま
り0.75倍速再生をさせる場合の信号変換処理は、各
主フレームE毎に、副フレームCの数をカウントしなが
ら分割された副フレームCの原音声信号aを読み出すと
共に、3回に1回の割合で同じ副フレームCを再度繰り
返して読み出して出力リングメモリ24内に順次副フレ
ームC同士が連続するように記憶させる。これにより、
出力リングメモリ24に記憶された当該主フレームEに
かかる再生音声信号eのPCMデータ量は変換前のもの
に比べて4/3(=1/0.75)となり、再生速度が
0.75倍となる(塗り潰された副フレームC1
4 ,C7 ,C10が2回連続して読み出される)。な
お、fの値によっては主フレームE内のデータ量と出力
リングメモリ24に記憶されたデータ量(出力データ
量)との関係が、fの値に一致しない場合があるが、こ
のような場合には(主フレームデータ量/出力データ
量)の値がfの値に最も近くなるように、省略したり、
また繰り返したりする副フレームCの割合を決定する。
【0025】次に、ゼロクロス点が検出されなかった場
合、つまり音有無判定部34から無音信号hが入力され
た場合について説明する。信号変換処理部36は図5の
処理フローに示すように、fが1以上の場合には、各主
フレームEの先頭から当該主フレームE内に含まれる全
PCMデータの標本数(サンプル数)の1/f個分のP
CMデータ(小数点以下は切り捨て等を行い整数化させ
る)を読み出して出力リングメモリ24内に順次連続さ
せて記憶させる。これにより、出力リングメモリ24に
記憶された当該主フレームEにかかる再生音声信号eの
PCMデータ量は変換前のものに比べて1/fとなり、
再生速度がf倍となる。
【0026】具体例を図7に示す。f=2、つまり2倍
速再生をさせる場合の信号変換処理は、各主フレームE
毎に当該主フレームE内に含まれる全PCMデータの標
本数の1/2個分のPCMデータ(小数点以下は切り捨
て等を行い整数化させる)を読み出して出力リングメモ
リ24内に順次記憶させる。これにより、出力リングメ
モリ24に記憶された当該主フレームEにかかる再生音
声信号eのPCMデータ量は変換前のものに比べて1/
2となり、再生速度が2倍となる。1.5倍の場合も同
様。
【0027】また、fが1未満の場合には、各主フレー
ムEの先頭から当該主フレームE内に含まれる全PCM
データの標本数の(1/f−1)個分のPCMデータ
(小数点以下は切り捨て等を行い整数化させる)を読み
出して出力リングメモリ24内に順次記憶させ、その後
さらに主フレームEの全PCMデータを連続して記憶さ
せる。これにより、出力リングメモリ24に記憶された
当該主フレームEにかかる再生音声信号eのPCMデー
タ量は変換前のものに比べて1/fとなり、再生速度が
f倍となる。
【0028】具体例を図7に示す。f=0.75、つま
り0.75倍速再生をさせる場合の信号変換処理は、各
主フレームE毎に当該主フレームE内に含まれる全PC
Mデータの標本数の(1/0.75−1=1/3)個分
のPCMデータ(小数点以下は切り捨て等を行い整数化
させる)を読み出して出力リングメモリ24内に順次記
憶させ、その後さらに主フレームEの全PCMデータを
連続して記憶させる。これにより、出力リングメモリ2
4に記憶された当該主フレームEにかかる再生音声信号
eのPCMデータ量は変換前のものに比べて(1/3+
1=4/3=1/f)となり、再生速度がf倍となる。
無音の主フレームEが連続する場合には上記処理フロー
を繰り返し行う。
【0029】また、f<0.5の場合には1の主フレー
ムE内に含まれる全副フレームCを1回ずつ繰り返した
り、また無音の場合にはPCMデータを全標本数分だけ
繰り返しても、出力リングメモリ24に記憶されるPC
Mデータ量はもとの主フレームEに含まれるデータ量の
2倍にしかならないため、fの値に応じて特定の副フレ
ームを2回繰り返して記憶させたり、また無音の場合に
はPCMデータをさらに必要な標本数分だけ繰り返して
記憶させるようにする。
【0030】以上、本発明の好適な実施例について種々
述べてきたが、本発明は上述の実施例に限定されるので
はなく、発明の精神を逸脱しない範囲で多くの改変を施
し得るのはもちろんである。
【0031】
【発明の効果】本発明に係る音声再生方法と音声再生装
置によれば、各フレームの繋ぎ目部分での音声信号の周
期は基本音声信号の周期と変わらず、また連続性も損な
われないため、フレームの一部を省略して圧縮したり、
また1回若しくは2回以上繰り返して伸長して音声信号
を再生しても、音程が変化せず、音質の劣化も少なくな
るという効果がある。
【図面の簡単な説明】
【図1】本発明に係る音声再生方法の基本原理を説明す
る説明図である。
【図2】本発明に係る音声再生装置の構成を示すブロッ
ク図である。
【図3】図2の演算用マイコンの構成を示すブロック図
である。
【図4】図2の音声再生装置の動作手順を示すフローチ
ャートである(主フレーム内の原音声信号aが有音の場
合)。
【図5】図2の音声再生装置の動作手順を示すフローチ
ャートである(主フレーム内の原音声信号aが無音の場
合)。
【図6】図4の音声再生装置の処理動作を示す説明図で
ある。
【図7】図5の音声再生装置の処理動作を示す説明図で
ある。
【図8】従来の音声再生方法の動作原理を説明する説明
図である。
【符号の説明】
C 副フレーム D ゼロクロス点 Tp 基本周期 a 原音声信号 d 基本音声信号 e 再生音声信号
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成9年12月5日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】請求項2
【補正方法】変更
【補正内容】
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0008
【補正方法】変更
【補正内容】
【0008】また、請求項2記載の発明は、記録媒体に
記録された原音声信号を読み出して再生する音声再生装
置において、前記原音声信号を低域ろ波して基本音声信
号を抽出するフィルタ部と、前記基本音声信号の立ち上
がり若しくは立ち下がりゼロクロス点を検出するゼロク
ロス点検出部と、前記ゼロクロス点が検出された際に
は、前記原音声信号を、時間軸上において前記ゼロクロ
ス点と対応する位置で複数のフレームに区切ると共に、
該フレームの一部を省略し、または1回若しくは2回以
上繰り返しつつ連続して出力させる信号変換処理部とを
具備することを特徴とする。これらによれば、各フレー
ムの繋ぎ目部分での音声信号の周期は基本音声信号の周
期と変わらず、また連続性も損なわれないため、フレー
ムの一部を省略して圧縮したり、また1回若しくは2回
以上繰り返して伸長して音声信号を再生しても、音程が
変化せず、音質の劣化も少なくなる。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 記録媒体に記録された原音声信号を読み
    出して再生する音声再生方法において、 前記原音声信号を低域ろ波して基本音声信号を抽出し、 該基本音声信号の立ち上がり若しくは立ち下がりゼロク
    ロス点を検出し、 該ゼロクロス点が検出された際には、前記原音声信号
    を、時間軸上において前記ゼロクロス点と対応する位置
    で複数のフレームに区切り、 該フレームの一部を省略し、または1回若しくは2回以
    上繰り返しつつ連続して再生することを特徴とする音声
    再生方法。
  2. 【請求項2】 記録媒体に記録された原音声信号を読み
    出して再生する音声再生装置において、 前記原音声信号を低域ろ波して基本音声信号を抽出する
    フィルタ部と、 前記基本音声信号の立ち上がり若しくは立ち下がりゼロ
    クロス点を前記主フレーム毎に検出するゼロクロス点検
    出部と、 前記ゼロクロス点が検出された際には、前記原音声信号
    を、時間軸上において前記ゼロクロス点と対応する位置
    で複数のフレームに区切ると共に、該フレームの一部を
    省略し、または1回若しくは2回以上繰り返しつつ連続
    して出力させる信号変換処理部とを具備することを特徴
    とする音声再生装置。
JP8350852A 1996-12-27 1996-12-27 音声再生方法と音声再生装置 Pending JPH10187188A (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP8350852A JPH10187188A (ja) 1996-12-27 1996-12-27 音声再生方法と音声再生装置
US08/827,909 US6026067A (en) 1996-12-27 1997-04-07 Method and apparatus for reproducing audio signals at various speeds by dividing original audio signals into a sequence of frames based on zero-cross points
GB9707160A GB2320791B (en) 1996-12-27 1997-04-08 Method of reproducing audio signals and audio player
DE19714688A DE19714688C2 (de) 1996-12-27 1997-04-09 Verfahren zur Reproduzierung von Audiosignalen und Audioabspielgerät
CN97113136A CN1113345C (zh) 1996-12-27 1997-05-16 重现音频信号的方法和一种放音机
US09/384,543 US6088313A (en) 1996-12-27 1999-08-27 Method and apparatus for reproducing audio signals at various speeds by dividing original audio signals into a sequence of frames based on zero-cross points

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8350852A JPH10187188A (ja) 1996-12-27 1996-12-27 音声再生方法と音声再生装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2002037001A Division JP2002313015A (ja) 2002-02-14 2002-02-14 音声再生方法と音声再生装置

Publications (1)

Publication Number Publication Date
JPH10187188A true JPH10187188A (ja) 1998-07-14

Family

ID=18413331

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8350852A Pending JPH10187188A (ja) 1996-12-27 1996-12-27 音声再生方法と音声再生装置

Country Status (5)

Country Link
US (2) US6026067A (ja)
JP (1) JPH10187188A (ja)
CN (1) CN1113345C (ja)
DE (1) DE19714688C2 (ja)
GB (1) GB2320791B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010002937A (ja) * 2009-10-07 2010-01-07 Casio Comput Co Ltd 音声分析合成装置、音声分析装置、音声合成装置、及びプログラム
US7693398B2 (en) 2004-06-01 2010-04-06 Hitachi, Ltd. Digital information reproducing apparatus and method
WO2014115696A1 (ja) * 2013-01-28 2014-07-31 シナノケンシ株式会社 音声データ再生速度変換方法および音声データ再生速度変換装置

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19713286A1 (de) * 1997-03-29 1998-10-01 Thomson Brandt Gmbh Gerät zur CD-Wiedergabe mit veränderbarer Geschwindigkeit oder Richtung
JPH1168576A (ja) * 1997-08-22 1999-03-09 Hitachi Ltd データ伸張装置
US6292454B1 (en) * 1998-10-08 2001-09-18 Sony Corporation Apparatus and method for implementing a variable-speed audio data playback system
US8290351B2 (en) 2001-04-03 2012-10-16 Prime Research Alliance E., Inc. Alternative advertising in prerecorded media
US6738059B1 (en) * 1998-12-18 2004-05-18 Kabushiki Kaisha Sega Enterprises Apparatus and methods for image processing using mixed display objects
WO2002013185A1 (en) * 2000-08-09 2002-02-14 Thomson Licensing S.A. Method and system for enabling audio speed conversion
US20020184047A1 (en) * 2001-04-03 2002-12-05 Plotnick Michael A. Universal ad queue
US7161887B2 (en) * 2001-11-13 2007-01-09 Digeo, Inc. Method and apparatus for extracting digital data from a medium
US7286749B2 (en) * 2002-04-16 2007-10-23 Canon Kabushiki Kaisha Moving image playback apparatus, moving image playback method, and computer program thereof with determining of first voice period which represents a human utterance period and second voice period other than the first voice period
JP2005244751A (ja) * 2004-02-27 2005-09-08 Kyocera Corp 音声通信システム及び移動局
US7464028B2 (en) * 2004-03-18 2008-12-09 Broadcom Corporation System and method for frequency domain audio speed up or slow down, while maintaining pitch
TWI253059B (en) * 2004-08-04 2006-04-11 Via Tech Inc Sound fast-forward method and device
JP4413809B2 (ja) * 2005-03-29 2010-02-10 富士通マイクロエレクトロニクス株式会社 半導体装置の製造方法
EP1739676A1 (en) * 2005-06-29 2007-01-03 Hitachi, Ltd. Digital broadcasting receiving device and digital information receiving device, and playback method
CN101110247B (zh) 2007-08-17 2011-04-20 华为技术有限公司 音频文件的播放方法及装置
JP4952469B2 (ja) * 2007-09-19 2012-06-13 ソニー株式会社 情報処理装置、情報処理方法およびプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB599090A (en) * 1944-10-11 1948-03-04 Oerlikon Maschf Bipolar electrolyser
US3104284A (en) * 1961-12-29 1963-09-17 Ibm Time duration modification of audio waveforms
US4091242A (en) * 1977-07-11 1978-05-23 International Business Machines Corporation High speed voice replay via digital delta modulation
JPS6066365A (ja) * 1983-09-21 1985-04-16 Sony Corp ミュ−ティング回路
JPH04216353A (ja) * 1990-12-14 1992-08-06 Sanyo Electric Co Ltd 音声時間軸圧縮伸長方法
US5175769A (en) * 1991-07-23 1992-12-29 Rolm Systems Method for time-scale modification of signals

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7693398B2 (en) 2004-06-01 2010-04-06 Hitachi, Ltd. Digital information reproducing apparatus and method
JP2010002937A (ja) * 2009-10-07 2010-01-07 Casio Comput Co Ltd 音声分析合成装置、音声分析装置、音声合成装置、及びプログラム
WO2014115696A1 (ja) * 2013-01-28 2014-07-31 シナノケンシ株式会社 音声データ再生速度変換方法および音声データ再生速度変換装置
US9361905B2 (en) 2013-01-28 2016-06-07 Shinano Kenshi Kabushiki Kaisha Voice data playback speed conversion method and voice data playback speed conversion device

Also Published As

Publication number Publication date
GB2320791B (en) 2001-02-07
GB2320791A (en) 1998-07-01
US6088313A (en) 2000-07-11
DE19714688A1 (de) 1998-07-02
DE19714688C2 (de) 2002-10-31
GB9707160D0 (en) 1997-05-28
CN1186303A (zh) 1998-07-01
US6026067A (en) 2000-02-15
CN1113345C (zh) 2003-07-02

Similar Documents

Publication Publication Date Title
JPH10187188A (ja) 音声再生方法と音声再生装置
JP5367932B2 (ja) オーディオ速度変換を可能にするシステムおよび方法
JPS5982608A (ja) 音声の再生速度制御方式
WO1998044483A1 (en) Time scale modification of audiovisual playback and teaching listening comprehension
KR100251497B1 (ko) 음성신호 변속재생방법 및 그 장치
JP2002313015A (ja) 音声再生方法と音声再生装置
US6070135A (en) Method and apparatus for discriminating non-sounds and voiceless sounds of speech signals from each other
JP3620787B2 (ja) 音声データの符号化方法
KR0138464B1 (ko) 화음데이터가 기록된 영상가요매체와 그 재생장치
TW442740B (en) Method for changing articulation speed
JP2002073098A (ja) 音声再生装置、音声再生方法、画像音声再生装置および画像音声再生方法
KR0146596B1 (ko) 가요반주기기의 음정레벨 비교표시방법
JP4648183B2 (ja) 連続メディアデータ短縮再生方法、複合メディアデータ短縮再生方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JPS6253093B2 (ja)
JPH0242497A (ja) 音声記録再生装置
JPH01267700A (ja) 音声処理装置
JPH01152499A (ja) 倍速再生装置
JP2005204003A (ja) 連続メディアデータ高速再生方法、複合メディアデータ高速再生方法、多チャンネル連続メディアデータ高速再生方法、映像データ高速再生方法、連続メディアデータ高速再生装置、複合メディアデータ高速再生装置、多チャンネル連続メディアデータ高速再生装置、映像データ高速再生装置、プログラム、および、記録媒体
JPS6040633B2 (ja) 無声破裂音源付きの音声合成装置
JPS60214399A (ja) 情報処理装置
JPS59216195A (ja) 音声処理方式
JPH10224743A (ja) 音声信号記録再生装置及び音声信号記録再生方法
JPH02201497A (ja) デジタル信号記録再生装置
JP2004039096A (ja) インデックス情報作成方法および装置
JPH05303400A (ja) 音声再生装置と音声再生方法