JPS5982608A - 音声の再生速度制御方式 - Google Patents

音声の再生速度制御方式

Info

Publication number
JPS5982608A
JPS5982608A JP57192310A JP19231082A JPS5982608A JP S5982608 A JPS5982608 A JP S5982608A JP 57192310 A JP57192310 A JP 57192310A JP 19231082 A JP19231082 A JP 19231082A JP S5982608 A JPS5982608 A JP S5982608A
Authority
JP
Japan
Prior art keywords
section
frame
signal
silent
steady
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57192310A
Other languages
English (en)
Inventor
Katsumi Hosoya
細谷 克美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP57192310A priority Critical patent/JPS5982608A/ja
Publication of JPS5982608A publication Critical patent/JPS5982608A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 発明の技術分野 本発明は、録音した音声を再生する際、再生音の周波数
を変化させることなく、再生速度を増加または減少させ
ることができる音声の再生速度制御方式に関するもので
ある。
従来技術と問題点 テープレコーダ等に於いて、再生速度を変化させると、
再生音の周波数が再生速度の変化に伴なって変化し、大
変聞きづらいものとなる。このような欠点をなくす為に
、音声を数10ミリ秒毎のフレームに分割し、フレーム
を単位として音声の間引き或は補間を行なうことによシ
、再生音の周波数を変化させることなく、再生速度を増
加或は減少できるようにしたものも提案されているが、
間引き或は補間を行なった後の隣接するフレームの接続
部の不連続点でクリック音が生じる為、再生音の明瞭性
が低下する欠点があった。
また上述の如き欠点を改善する為に、フレーム接続部の
相互相関係数を計算し、フレームを連続的に接続できる
ように接続時期を微調整する方式も提案されているが、
間引きまたは補間を行なうフレームの長さと位置とを、
音声の性質とは無関係に固定的に決定している為、破裂
音のような短時間に状態が変化する音素の明瞭性が低下
する欠点があった。
また、この他にも、無音の部分のみを伸縮する方式も提
案されているが、この方式では実質的々音声部分の速度
制御は不可能である。
発明の目的 本発明は前述の如き欠点を改善したものであり、その目
的は、再生音の周波数を変化させることなく、且つ再生
音の品質を劣化させることなく、再生速度を増加或は減
少できるようにすることにある。以下実施例について詳
細に説明する。
発明の実施例 先ず、第1図の音声信号波形図を参照して、本発明の詳
細な説明する。同図に於いて、aは無音区間、bは定常
無声子音区間、Cは非定常区間、dは定常母音区間を表
わしている。
無音区間a1定常無声子音区間すに於いては、図示の如
く波形の振幅が小さい為、適当な区間長で間引き或は補
間を行なっても、再生音の明瞭性にはほとんど影響がな
い。また、定常母音区間dに於いては、図示の如く音声
の基本周期T毎に類似の波形が繰返されるので、基本周
期Tで間引き或は補間を行なうことによシ、音声の周波
数成分を変えることなく、シかも波形の不連続点をほと
んど生じることなく、再生音の伸縮が可能である。
しかし、非定常区間Cに於いては、音声波形の性質が急
激に変化するものであるから、間引き或は補間を行なう
と、音素としての特徴が失なわれたシ、短い音素の場合
には、音素そのものが欠落したシして再生者の明瞭性が
低下する。
本発明は、上述した理由により、無音区間a1定常無声
子音区間すに於いては、適当な区間長で間引き或は補間
を行ない、また、非定常区間Cに於いては間引きも補間
にも行なわず、定常母音区間dに於いては、音声の基本
周期Tf:単位として間引き或は補間を行なうようにし
、音声の周波数成分を変化させることなく、シかも不連
続点をほとんど生じさせることなく、再生速度を増加或
は減少できるようにしたものである。
第2図は本発明の実施例のブロック線図であり、1はア
ナログ音声信号の入力端子、2はAD変換器、3は入力
バッファメモリ、4は無音検出部、5は定常性判定部、
6は基本周期抽出部、7は補間/間引き部、8は出力バ
ッファメモリ、9はDA変換器、IOは出力端子である
入力端子1からのアナログ音声信号はAD変換器2でデ
ィジタル符号化された後、一定周期tのクロック信号に
よシ人カバツファメモリ3に蓄積される。入カバツ7ア
3からは、lフレーム毎に音声データが読出され、無音
検出部4に転送される。
尚、1フレームには例えば32ミリ秒分の音声データが
収容されているとする。無音検出部4では、フレーム内
の音声データに基づいて、そのフレームに対応する音声
信号のパワーと零交差数とを算出し、それらが予め定め
た閾値よシ大きい場合は、そのフレームは有音、即ち、
非定常区間C或は定常母音区間dであるとみなし、定常
性判定部5へ音声データを転送する。また、予め定めた
閾値以下の場合は、そのフレームは無音、即ち無音区間
a或は無声子音区間すであるとみなし、フレーム内の音
声データを補間/間引き部7へ転送する。
定常性判定部5はフレーム内の音声テークに基づいて、
そのフレームに対応する音声信号の自己相関係数を算出
し、その極太値が予め定められている閾値より大きい場
合は、そのフレームは周期性を有する、即ち、定常母音
区間dであるとみなし、フレーム内の音声データを基本
周期抽出部6に転送する。また、自己相関係数の極大値
が予め淀められている閾値以下の場合は、そのフレーム
は非定常区間Cであるとみなし、フレーム内の音声デー
タを出力バッファメモリ9に加える。
基本周期抽出部6は自己相関係数の極太値を力える係数
から音声信号の基本周期Tを算出し、音声データと共に
算出した基本周期Tを補間/間引き部7へ転送する。
補間/間引き部7は基本周期抽出部6よシ転送されてき
た音声データについては、基本周期Tを単位とし、所望
の再生速度に合わせた補間或は間引きを行ない、補間或
は間引きを行なった音声データを出力バッファメモリ8
に転送するものであり、例えば再生速度を1/2にする
場合には、第3図(A)に示すように、1フレームを、
基本周期Tを単位とする区間(1)〜(n−1)と余り
の区間(n)とに分割し、区間(1)〜(n−1)につ
いては、各区間を2回繰返しながら補間して出力し、余
シの区間(n)については、そのまま1回だけ出力する
ものである。また、例えば再生速度を2倍にする場合に
は、同図(B)に示すように、1フレームを、基本周期
Tを単位とする区間(1)〜(n−1)と余りの区間(
n)とに分割し、区間(1)〜(n−1)については、
1つおきに間引きして出力し、余りの区間(n)につい
てはそのまま出力するものである。
また、無音検出部4から直接転送されて来た音声データ
については、補間/間引き部7は、一定の長さく例えば
5ミリ秒)を単位とし、所望の再生速度に合わせた補間
或は間引きを行ない、補間或は間引きを行なった音声デ
ータを出力バッファメモリ8に転送する。出力バッファ
メモリ8に蓄積された音声データは一定周期tのクロッ
ク信号により読出され、DA変換器9を介して出力端子
10よ多出力される。
発明の詳細 な説明したように、本発明は、録音した音声データを一
定長のフレームに分割するフレーム分割手段(実施例に
於いては入力バッファメモリ3等から成る)と、各フレ
ームが無音区間、無声子音区間、定常母音区間、非定常
区間の何れに対応しているかを検出する検出手段(実施
例に於いては無音検出部4と定常判定部5とから成る)
と、定常母音区間に於ける音声の基本周期を抽出する基
本周期抽出手段(実施例に於いては基本周期抽出部6か
ら成る)とを備え、音声波形が周期的に変化する定常母
音区間に対応したフレームについては、該フレームに収
容されている音声データを、音声の基本周期を単位とし
て補間或は間引きした後に再生するようにしたものであ
るから、不連続部分を減少させることができ、また、音
声波形が急激に変化する非定常区間に対応するフレーム
については、該フレームに収容されている音声データを
そのまま再生するものであるから、再生音の歪みを抑え
ることができ、従って、本発明によれば、再生速度を変
化させた場合に於いても高品質の再生音を得ることがで
きる利点がある。従って、本発明を、高速再生テープレ
コーダ、VTRの高速再生時の音声、留守番電話の高速
読出し、音声メールシステムの音声メツセージ編集、低
速再生を利用した口述筆記マシン、語学練習機など種々
の音声処理装置に適用すれば、非常に有効である。
【図面の簡単な説明】
れぞれ音声データの補間、間引き方法の説明図である。 1は入力端子、2はAD変換器、3は入力バッファメモ
リ、4は無音検出部、5は定常性判定部、6は基本周期
検出部、7は補間/間引き部、8は出力バッファメモリ
、9はDA変換器、10は出力端子である。 特許出願人 日本電信電話公社 代理人弁理士 玉 蟲 久 五 部(外3名)′M 1
 図 −ITI− 第 3 図

Claims (1)

    【特許請求の範囲】
  1. 録音した音声データの再生速度を制御する音声の再生速
    度制御方式に於いて、前記音声データを一定長のフレー
    ムに分割するフレーム分割手段と、前記各フレームが無
    音区間、無声子音区間、定常母音区間、非定常区間の何
    れに対応しているかを検出する検出手段と、前記定常母
    音区間に於ける音声の基本周期を抽出する基本周期抽出
    手段とを備え、前記無音区間及び無声子音区間に対応す
    るフレームについては、該フレームに収容されている音
    声データを、一定の長さを単位として、補間或は間引き
    した後に再生し、前記定常母音区間に対応するフレーム
    については、該フレームに収容されている音声データを
    、前記基本周期抽出手段で抽出した基本周期を単位とし
    て、補間或は間引きした後に再生し、前記非定常区間に
    対応したフレームについては、該フレームに収容されて
    いる音声データをそのまま再生することを特徴とする音
    声の再生速度制御方式。
JP57192310A 1982-11-01 1982-11-01 音声の再生速度制御方式 Pending JPS5982608A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57192310A JPS5982608A (ja) 1982-11-01 1982-11-01 音声の再生速度制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57192310A JPS5982608A (ja) 1982-11-01 1982-11-01 音声の再生速度制御方式

Publications (1)

Publication Number Publication Date
JPS5982608A true JPS5982608A (ja) 1984-05-12

Family

ID=16289141

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57192310A Pending JPS5982608A (ja) 1982-11-01 1982-11-01 音声の再生速度制御方式

Country Status (1)

Country Link
JP (1) JPS5982608A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61122700A (ja) * 1984-11-19 1986-06-10 富士通株式会社 合成音声発声速度制御方式
JPS61290499A (ja) * 1985-06-18 1986-12-20 日本電気株式会社 発声速度可変の音声合成装置
JPS63204300A (ja) * 1987-02-20 1988-08-23 富士通株式会社 符号化伝送装置
JPS63234299A (ja) * 1987-03-20 1988-09-29 株式会社日立製作所 音声分析合成方式
JPS649500A (en) * 1987-07-01 1989-01-12 Hitachi Ltd Voice analysis and synchronization method and apparatus
FR2695750A1 (fr) * 1992-09-17 1994-03-18 Lefevre Frank Dispositif de traitement d'un signal sonore et appareil comportant un tel dispositif.
WO1995014297A1 (fr) * 1992-09-17 1995-05-26 Frank Lefevre Dispositif de traitement d'un signal sonore et appareil comportant un tel dispositif
JPH07192391A (ja) * 1993-09-25 1995-07-28 Daewoo Electron Co Ltd レーザディスクプレーヤーの再生速度調節装置
WO1996013826A1 (fr) * 1994-10-28 1996-05-09 Nippon Steel Corporation Dispositif de decodage de donnees codees et systeme de decodage de donnees audio/video multiplexees faisant appel a ce dispositif
WO1997026647A1 (fr) * 1996-01-19 1997-07-24 Matsushita Electric Industrial Co., Ltd. Changeur de vitesse de lecture
WO2017164216A1 (ja) * 2016-03-24 2017-09-28 ヤマハ株式会社 音響処理方法および音響処理装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61122700A (ja) * 1984-11-19 1986-06-10 富士通株式会社 合成音声発声速度制御方式
JPS61290499A (ja) * 1985-06-18 1986-12-20 日本電気株式会社 発声速度可変の音声合成装置
JPS63204300A (ja) * 1987-02-20 1988-08-23 富士通株式会社 符号化伝送装置
JPS63234299A (ja) * 1987-03-20 1988-09-29 株式会社日立製作所 音声分析合成方式
JPS649500A (en) * 1987-07-01 1989-01-12 Hitachi Ltd Voice analysis and synchronization method and apparatus
WO1995014297A1 (fr) * 1992-09-17 1995-05-26 Frank Lefevre Dispositif de traitement d'un signal sonore et appareil comportant un tel dispositif
FR2695750A1 (fr) * 1992-09-17 1994-03-18 Lefevre Frank Dispositif de traitement d'un signal sonore et appareil comportant un tel dispositif.
JPH07192391A (ja) * 1993-09-25 1995-07-28 Daewoo Electron Co Ltd レーザディスクプレーヤーの再生速度調節装置
WO1996013826A1 (fr) * 1994-10-28 1996-05-09 Nippon Steel Corporation Dispositif de decodage de donnees codees et systeme de decodage de donnees audio/video multiplexees faisant appel a ce dispositif
US5765136A (en) * 1994-10-28 1998-06-09 Nippon Steel Corporation Encoded data decoding apparatus adapted to be used for expanding compressed data and image audio multiplexed data decoding apparatus using the same
WO1997026647A1 (fr) * 1996-01-19 1997-07-24 Matsushita Electric Industrial Co., Ltd. Changeur de vitesse de lecture
US6085157A (en) * 1996-01-19 2000-07-04 Matsushita Electric Industrial Co., Ltd. Reproducing velocity converting apparatus with different speech velocity between voiced sound and unvoiced sound
WO2017164216A1 (ja) * 2016-03-24 2017-09-28 ヤマハ株式会社 音響処理方法および音響処理装置
US10891966B2 (en) 2016-03-24 2021-01-12 Yamaha Corporation Audio processing method and audio processing device for expanding or compressing audio signals

Similar Documents

Publication Publication Date Title
US6205420B1 (en) Method and device for instantly changing the speed of a speech
Arons Techniques, perception, and applications of time-compressed speech
JP2000511651A (ja) 記録されたオーディオ信号の非均一的時間スケール変更
JPS5982608A (ja) 音声の再生速度制御方式
JPH10187188A (ja) 音声再生方法と音声再生装置
JP3619946B2 (ja) 話速変換装置、話速変換方法及び記録媒体
US6085157A (en) Reproducing velocity converting apparatus with different speech velocity between voiced sound and unvoiced sound
JP2001184100A (ja) 話速変換装置
JPH09152889A (ja) 話速変換装置
US6070135A (en) Method and apparatus for discriminating non-sounds and voiceless sounds of speech signals from each other
JP2001154684A (ja) 話速変換装置
JP3081469B2 (ja) 話速変換装置
JP2734028B2 (ja) 音声収録装置
JPH0854895A (ja) 再生装置
JP3201327B2 (ja) 録音再生装置
KR100359988B1 (ko) 실시간 화속 변환 장치
JPH09146587A (ja) 話速変換装置
JPS62125577A (ja) 音声蓄積再生装置
JPH05303400A (ja) 音声再生装置と音声再生方法
JPH08292796A (ja) 再生装置
KR100337996B1 (ko) 음성신호재생속도제어장치및제어방법
JPH10214098A (ja) 音声変換玩具
JP2962777B2 (ja) 音声信号の時間軸伸長圧縮装置
KR0172879B1 (ko) 브이씨알의 가변음성신호처리장치
JPS59124386A (ja) 音程可変装置