JPH07129190A - 話速変換方法及び話速変換装置並びに電子装置 - Google Patents

話速変換方法及び話速変換装置並びに電子装置

Info

Publication number
JPH07129190A
JPH07129190A JP16723294A JP16723294A JPH07129190A JP H07129190 A JPH07129190 A JP H07129190A JP 16723294 A JP16723294 A JP 16723294A JP 16723294 A JP16723294 A JP 16723294A JP H07129190 A JPH07129190 A JP H07129190A
Authority
JP
Japan
Prior art keywords
voice
speed conversion
speech speed
processing
switch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP16723294A
Other languages
English (en)
Inventor
Yoshito Nene
義人 禰寝
Yukio Kumagai
幸夫 熊谷
Masashi Takamiya
正志 高宮
Yasunori Kawauchi
保憲 川内
Nobuo Hataoka
信夫 畑岡
Juichi Morikawa
寿一 森川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP16723294A priority Critical patent/JPH07129190A/ja
Priority to DE1994621774 priority patent/DE69421774T2/de
Priority to EP19940114160 priority patent/EP0643380B1/en
Priority to US08/301,994 priority patent/US5717818A/en
Priority to CA 2131730 priority patent/CA2131730A1/en
Publication of JPH07129190A publication Critical patent/JPH07129190A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【目的】 音声を入力し、該入力音声のピッチを変化さ
せずに、音声の速度のみを変更する。また、音声の原デ
ータを記憶しておき、常時、音声の原データに基づいた
話の速度の変調を可能にする。 【構成】 話速変換方法であって、話速変換を必要とす
る時に指定した時間の間のみ入力音声の話速変換処理が
行われ、それ以外の時間の間には話速変換が行われな
い。また、音声を入力する手段と、該入力音声の速度を
変更する話速変換処理手段と、該話速変換処理手段の出
力を聞き手の耳に音声出力する手段とを有する話速変換
装置であって、前記話速変換装置に話速変換処理用スイ
ッチを設け、該話速変換処理用スイッチがオン(ON)
している間だけ前記入力音声の話速を変更して出力し、
当該話速変換処理用スイッチがオフ(OFF)している
間には入力音声の話速を変更せずに出力する手段を設け
た。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声の速度を変調する
話速変換方法及び話速変換装置並びに電子装置に関し、
特に対話等にその装置を用いるための制御技術に適用し
て有効な技術に関するものである。
【0002】
【従来の技術】難聴者の聴覚を補助する手段として、従
来アナログ回路を用いて音声の振幅及びその周波数特性
を加工するアナログ型補聴器が主に使用されてきた。こ
れに対し、近年、ディジタル信号処理を聴覚障害の補償
に応用するための研究開発が盛んに行われている。この
研究開発動向については、例えば、日本音響学会誌(1
991年47巻10号、P760〜P765)「聴覚障
害補償へのディジタル技術の応用」やJ.Acoust.So
c.Am.(90(2),Pt.1,Aug.1991)”Speech-p
erception aids for hearing-impaied people :Curre
nt status and needed research ”等に詳述されてい
る。
【0003】一般に、聴力の損失を補うためには、音圧
レベルの増幅とダイナミックレンジの圧縮を、使用者の
聴力特性に合わせて周波数毎に行う。従来のアナログ補
聴器では、このような処理をアナログ回路で実現してい
る。また、近年、開発されているディジタル補聴器で
は、この処理をディジタルフィルタ等のソフトウエアで
実現することで、使用者の聴力特性への適合がより詳細
に行えるようにしている。
【0004】このような動向の中、近年、ディジタル信
号処理により音声のピッチを変えずに早さだけを変え
て、より高次な言語処理速度の衰えも含めた聴覚系全般
に渡った補聴を行おうとする試みがなされている。この
ような話速変換技術については、例えば、電子情報通信
学会技術研究報告(Vol.92 No.207 SP92-54「高
齢者向け音声加工を行うポータブルDSPシステムの開
発」や同(SP92-55)「高品質リアルタイム話速変換シ
ステム」などに詳述されている。
【0005】
【発明が解決しようとする課題】前記従来の技術におい
ては、話速変換を行う音声として、テレビ/ラジオ等の
放送音声やテープレコーダ等に録音された音声を対象と
していた。すなわち、聞き手に対して一方的に与えられ
る音声だけが話速変換の対象であった。
【0006】しかし、従来の補聴器が入力音声の種類に
よらず使用できることを考えると、話速変換装置も前記
以外の音声を入力として扱えることが望ましい。特に、
対話における相手の音声を、ゆっくり聞くことができれ
ば、高齢者や難聴者の聴覚を補助するばかりでなく、健
聴者が慣れていない外国語会話での聞き取りを補助する
場合などにも使用することが可能となる。
【0007】本発明の目的は、話の速度を必要に応じて
変換して再生することが可能な技術を提供することにあ
る。
【0008】本発明の他の目的は、音声の原データを記
憶しておき、常時、音声の原データに基づいた話の速度
の変換が可能な技術を提供することにある。
【0009】本発明の他の目的は、話速変換装置を対話
等に利用するための装置の制御手段を提供することにあ
る。
【0010】本発明の他の目的は、話速変換装置の応用
範囲の拡大が可能な技術を提供することにある。
【0011】本発明の他の目的は、話速変換装置の記憶
装置(メモリ)を有効に利用することができる技術を提
供することにある。
【0012】本発明の他の目的は、話速変換装置の記憶
装置(メモリ)の読み出しポインタ戻しが可能な技術を
提供することにある。
【0013】本発明の他の目的は、話速変換装置におい
て、接続するAV機器のコントロールが可能な技術を提
供することにある。
【0014】本発明の他の目的は、話速変換装置におい
て、連続的話速変換を行うことが可能な技術を提供する
ことにある。
【0015】本発明の他の目的は、話速変換装置の操作
性の向上をはかることが可能な技術を提供することにあ
る。
【0016】本発明の他の目的は、話速変換装置の低消
費電力化が可能な技術を提供することにある。
【0017】本発明の前記ならびにその他の目的及び新
規な特徴は、本明細書の記述及び添付図面によって明ら
かにする。
【0018】
【課題を解決するための手段】本願によって開示される
発明のうち代表的なものの概要を簡単に説明すれば、以
下のとおりである。
【0019】(1)音声を入力し、該入力音声のピッチ
を変化させずに、音声の速度のみを変更する話速変換方
法であって、話速変換を聞き手が必要とする時に指定し
た時間の間のみ入力音声の話速変換処理が行われ、それ
以外の時間の間には話速変換が行われないものである。
【0020】(2)音声を入力する手段と、該入力音声
の速度を変更する話速変換処理手段と、該話速変換処理
手段の出力を聞き手の耳に音声出力する手段とを有する
話速変換装置であって、前記話速変換装置に話速変換処
理用スイッチを設け、該話速変換処理用スイッチがオン
(ON)している間だけ前記入力音声の話速を変更して
出力し、当該話速変換処理用スイッチがオフ(OFF)
している間には入力音声の話速を変更せずに出力する手
段を設けたものである。
【0021】(3)原音声を符号化して蓄積し、該蓄積
された符号化音声を読み出し、前記原音声のピッチを変
化させずに、音声の速度のみを変更する話速変換方法で
あって、話速変換を必要とする時に指定した時間の間の
み入力音声の話速変換処理が行われ、それ以外の時間の
間には話速変換が行われないものである。
【0022】(4)原音声を入力する手段と、該入力音
声を符号化して蓄積する記憶手段と、該蓄積された符号
化音声を読出して前記入力音声の速度を変更する話速変
換処理手段と、該話速変換処理手段の出力を聞き手の耳
に音声出力する手段とを有する話速変換装置であって、
前記話速変換装置に話速変換処理用スイッチを設け、該
話速変換処理用スイッチがオン(ON)している間だけ
前記入力音声の話速を変更して出力し、当該話速変換処
理用スイッチがオフ(OFF)している間には入力音声
の話速を変更せずに出力する手段を設けたものである。
【0023】(5)前記記憶手段は、フレーム単位で記
憶する手段を有するものである。
【0024】(6)前記話速変換処理における波形伸長
/短縮処理の決定は、フレームのパワーとしきい値との
比較して行う手段を有し、前記しきい値を可変にしたも
のである。
【0025】(7)前記話速変換装置に話速を選択する
話速選択用スイッチを設け、該話速選択用スイッチで選
択された話速に変更する手段を設けたものである。
【0026】(8)前記話速変換装置にオーディオ・ビ
デオ機器を制御する手段(AVコントロール)を設けた
ものである。
【0027】(9)前記話速変換装置にリピート用スイ
ッチを設け、該リピート用スイッチがオン(ON)して
いる間は再生音声をリピートする手段を設けたものであ
る。
【0028】(10)前記リピート手段は、1回押す毎
に数秒ずつバックさせる手段、戻っている間は時々間欠
音を発生させる手段、リングバッファの端まで行ったら
それ以上戻れなくする手段、リピート時の話速を選択す
る手段のうち少なくとも1つの手段を有するものであ
る。
【0029】(11)前記リピート時の話速を選択する
手段は、デフォルト値でリピート、ゆっくりリピート、
早聴きでリピート、リピートが徐々に早くなるのうち少
なくとも2つ以上を有するものである。
【0030】(12)前記話速変換装置において、話速
変換またはリピート動作によって実時間からの遅れが生
じた場合に、前記記憶されている情報を再生している間
に、前記遅れ量の調整を行う追いかけ手段を設けたもの
である。
【0031】(13)前記追いかけ手段は、ゆっくりと
再生するモードが終ると追いかけがスタートする手段、
リピート後にリピート開始時点まで再生すると追いかけ
がスタートする手段、追いかけ時の話速を選択する手
段、追いついたら入力音声をそのまま出力するスルーモ
ードに自動的に移る手段、及び追いついたら報知信号音
(メッセージ)を発生する手段のうち少なくとも1つを
有するものである。
【0032】(14)前記追いかけ時の話速を選択する
手段は、現実まで一気にスキップする手段、早聞きで現
実を追いかける手段、及び遅れたまま平行移動する手段
のうち少なくとも1つを有するものである。
【0033】(15)前記話速変換装置の一側面の操作
し易い一周辺部に前記話速変換処理用スイッチ、話速選
択用スイッチ、リピート用スイッチ、及びリセットスイ
ッチのうち少なくとも1つを設けたものである。
【0034】(16)前記リセットスイッチは、リピー
ト動作中もしくは追いかけ動作中に該スイッチをオンす
るとその動作を中止し現実にスキップし、その後はスル
ーモードに移る手段を有するものである。
【0035】(17)前記話速変換処理手段は、外部か
らの割り込み要求信号を入力するための端子を有するデ
ィジタルシグナルプロセッサで実行されるソフトウエア
として提供され、前記話速変換処理用スイッチによる話
速変換処理の制御または話速変換速度の切り替えは、該
割り込み要求信号を入力する端子を通じて、ディジタル
シグナルプロセッサに与えられるものである。
【0036】(18)前記話速変換装置の出力音声を両
耳用ヘッドホンを通して聞く手段を有するものである。
【0037】(19)音響信号を電気信号に変換するマ
イクロホンと、該マイクロホン出力を増幅するアナログ
アンプと、該アナログアンプの出力の高周波成分を取り
除くローパスフィルタと、該ローパスフィルタ出力のア
ナログ信号をディジタル信号に変換するA/D変換器
と、音声の速度を変更する処理をディジタル信号処理に
より実行するディジタルシグナルプロセッサと、入力音
声データや信号処理結果のデータを保存する記憶手段
と、該ディジタルシグナルプロセッサの行う音声の速度
を変更する処理を制御する手段と、処理のパラメータを
変更する手段と、ディジタル音声データをアナログ値に
変換するD/A変換器と、該D/A変換器の出力の高周
波成分を取り除く第2のローパスフィルタと、該第2の
ローパスフィルタの出力を増幅する第2のアナログアン
プと、該第2のアナログアンプの出力を音響信号に変換
し両耳に与えるヘッドホンとを有する話速変換装置であ
る。
【0038】(20)音響信号を電気信号に変換するマ
イクロホンと、該マイクロホン出力を増幅するアナログ
アンプと、該アナログアンプの出力の高周波成分を取り
除くローパスフィルタと、該ローパスフィルタ出力のア
ナログ信号をディジタル信号に変換するA/D変換器
と、入力音声データや信号処理結果のデータを保存する
記憶手段と、該蓄積された情報を読み出して音声の速度
を変更する処理をディジタル信号処理により実行するデ
ィジタルシグナルプロセッサと、該ディジタルシグナル
プロセッサの行う音声の速度を変調する処理を制御する
手段と、処理のパラメータを変更する手段と、ディジタ
ル音声データをアナログ値に変換するD/A変換器と、
該D/A変換器の出力の高周波成分を取り除く第2のロ
ーパスフィルタと、該第2のローパスフィルタの出力を
増幅する第2のアナログアンプと、該第2のアナログア
ンプの出力を音響信号に変換し両耳に与えるヘッドホン
とを有する話速変換装置である。
【0039】(21)前記話速変換処理手段は、複数の
入力フレームバッファを用いたフレーム単位のパイプラ
イン処理で行われ、各フレームのデータに対して、まず
フレームの先頭部分に対しピッチ抽出処理を施してその
部分のピッチを検出し、その検出された1ピッチ長分の
データを出力バッファに転送し、2ピッチ長分のデータ
に対し、0から1に変化する窓関数と1から0に変化す
る窓関数をかけ、それぞれの窓関数をかけた結果のデー
タを加算して2ピッチ分の時間長を持つ合成波形を作り
出し、先に転送した1ピッチ分のデータの後に挿入し、
先にピッチ抽出処理を施したデータ上の位置から2ピッ
チ分離れた位置を先頭に、再びピッチ検出処理を行い、
その位置でのピッチ検出を行い、最後のピッチ検出で得
られたピッチ長を単位にn(nは整数)ピッチ分のデー
タを出力バッファに転送する一連の手順をフレーム全体
に渡って繰り返して行う話速変換装置である。
【0040】(22)前記話速変換処理手段は、入力フ
レーム中のデータの平均パワーを計算し、該平均パワー
が予め設定したしきい値より大きかった場合にのみ実行
され、小さかった場合には、該フレームに含まれるデー
タがそのまま出力バッファに転送される話速変換装置で
ある。
【0041】(23)前記入力フレーム中のデータの平
均パワーに対するしきい値処理において、第2のしきい
値を設け、該第2のしきい値より小さい平均パワーを持
つフレームが、予め設定した時間しきい値より長い時間
連続した場合には、該時間しきい値を越えて連続した前
記第2のしきい値よりも平均パワーが小さいフレームの
データが、出力バッファに転送されることを禁止したも
のである。
【0042】(24)前記各スイッチは、マイクロホン
がスイッチのクリック音を拾わないような柔らかい接触
感のスイッチからなるものである。
【0043】(25)前記各スイッチは、見なくてもど
のスイッチかわかるような触感の異なる表面形態であ
る。
【0044】(26)前記マイクロホンと装置本体との
距離を変えて、装置を胸ポケットに入れて使用する場合
にマイクロホンと衣服とが直接接触しないようにするた
めの布擦れ音防止手段が設けられている。
【0045】(27)前記話速変換装置の所定の位置
に、現在からの時間遅れ量が目視可能な表示手段を設け
たものである。
【0046】(28)前記記憶手段としてリングバッフ
ァを用い、該リングバッファ上での時間遅れを表わすカ
ウンタで遅れ時間の管理する手段を設けたものである。
【0047】(29)前記スルーモードの他に、プロセ
ッサのクロックサイクルを下げ、スローモードと同様の
処理を行うスタンバイモードを設けたものである。
【0048】(30)電源スイッチをオン(ON)、オ
フ(OFF)、オンとオフ中間の3段階とし、前記中間
位置にスイッチを合わせた時、音声信号処理系中のアナ
ログ入出力系を互いに短絡し、アナログ入出力系間にあ
るディジタル処理系への電源供給を中止するアナログス
ルーモードで動作するものである。
【0049】(31)電話器のハンドセットと電話器本
体との間に前記(2),(4)乃至(30)のうちいず
れか1つの話速変換手段を設けた電話器である。
【0050】(32)前記請求項2,4乃至30のうち
いずれか1つの話速変換手段を電話交換器の中に設けた
電話交換器である。
【0051】
【作用】前述の手段の項の(1)及び(2)によれば、
音声を入力し、該入力音声のピッチを変化させずに、音
声の速度のみを変更する際に、話速変換を必要とする時
に指定した時間の間のみ入力音声の話速変換処理が行わ
れ、それ以外の時間の間には話速変換が行われないの
で、ラジオ音声のように一方的に聞き手に与えられる音
声だけでなく、対話のような状況でも話速変換装置を利
用できるようになり、聞き手自身の発話を妨害すること
なく、話速変換を施す音声を聞き手が選択できる。
【0052】また、補聴器、外国語学習器、電話器等に
おいて、話し手の音声の特徴を変えることなく、ゆっく
りとした話速で聞くことができる。
【0053】前述の手段の項の(3)及び(4)によれ
ば、原音声を符号化して蓄積し、該蓄積された符号化音
声を読み出し、前記原音声のピッチを変化させずに、音
声の速度のみを変更する場合等において、話速変換を必
要とする時に指定した時間の間のみ入力音声の話速変換
処理が行われ、それ以外の時間の間には話速変換が行わ
れないので、前記(1)及び(2)の効果の上に、メモ
リの有効利用、原音声のリピート機能、ボイスメモリ機
能、リピート音声の話速変換機能、早聞き再生機能等を
もたせることができる。
【0054】前述の手段の項の(5)によれば、フレー
ム単位で記憶するので、書き込及び読み出しの効率を向
上することができる。
【0055】前述の手段の項の(6)によれば、話速変
換処理における波形伸長処理、短縮処理、無音区間削除
処理の決定は、フレームのパワーとしきい値とを比較し
て行い、かつ、前記しきい値を入力された音声の大きさ
に応じて変更するので、使用環境条件に応じた話速変換
処理ができる。
【0056】前述の手段の項の(7)によれば、話速変
換装置に話速を選択する話速選択用スイッチ及びを設
け、該話速選択用スイッチで選択された話速に変更する
手段を設けたので、聞き手自身が聞く音声の話速を選択
することができる。
【0057】前述の手段の項の(8)によれば、話速変
換装置にオーディオ・ビデオ機器を制御する手段(AV
コントロール)を設けたことにより、話速変換伸長/短
縮率とは全く無関係に、メモリ容量が不足する場合に、
外部機器の再生動作をポーズする信号を出して、一時的
に話速変換装置への音声入力を中止し、メモリの空き領
域ができた際には、該ポーズ信号の出力を中止して再び
外部機器からの音声入力を始める動作を繰り返すので、
長時間に渡り、話速変換を連続して使用することが可能
となる。
【0058】前述の手段の項の(9)乃至(11)によ
れば、話速変換装置に話速をリピート用スイッチを設
け、該リピート用スイッチがオン(ON)している間は
再生音声をリピートする手段を設けたので、リピート音
声の話速変換を行うことができる。
【0059】前述の手段の項の(12)乃至(14)に
よれば、話速変換装置に記憶されている情報の聞きたい
ところまで追いかける追いかけ手段を設けたので、話速
変換装置の応用範囲の拡大、操作時間の短縮、使い勝手
の向上等をはかることができる。
【0060】前述の手段の項の(15)及び(16)に
よれば、話速変換装置の一側面の操作し易い一周辺部に
前記話速変換処理用スイッチ、話速選択用スイッチ、リ
ピート用スイッチ、及びリセットスイッチのうち少なく
とも1つを設けたので、話速変換装置の応用範囲の拡
大、操作時間の短縮、使い勝手の向上等をはかることが
できる。
【0061】前述の手段の項の(17)乃至(23)に
よれば、話速変換処理手段は、外部からの割り込み要求
信号を入力するための端子を有するディジタルシグナル
プロセッサで実行されるソフトウエアとして提供され、
前記話速変換処理用スイッチによる話速変換処理の制御
または話速変換速度の切り替えは、該割り込み要求信号
を入力する端子を通じて、ディジタルシグナルプロセッ
サに与えられる。
【0062】また、前記話速変換処理手段は、複数の入
力フレームバッファを用いたフレーム単位のパイプライ
ン処理で行われ、各フレームのデータに対して、まずフ
レームの先頭部分に対しピッチ抽出処理を施してその部
分のピッチを検出し、その検出された1ピッチ長分のデ
ータを出力バッファに転送し、2ピッチ長分のデータに
対し、0から1に変化する窓関数と1から0に変化する
窓関数をかけ、それぞれの窓関数をかけた結果のデータ
を加算して2ピッチ分の時間長を持つ合成波形を作り出
し、先に転送した1ピッチ分のデータの後に挿入し、先
にピッチ抽出処理を施したデータ上の位置から2ピッチ
分離れた位置を先頭に、再びピッチ検出処理を行い、そ
の位置でのピッチ検出を行い、最後のピッチ検出で得ら
れたピッチ長を単位にn(nは整数)ピッチ分のデータ
を出力バッファに転送する一連の手順をフレーム全体に
渡って繰り返して行う。
【0063】また、前記話速変換処理手段は、入力フレ
ーム中のデータの平均パワーを計算し、該平均パワーが
予め設定したしきい値より大きかった場合にのみ実行さ
れ、小さかった場合には、該フレームに含まれるデータ
がそのまま出力バッファに転送される。
【0064】また、前記入力フレーム中のデータの平均
パワーに対するしきい値処理において、第2のしきい値
を設け、該第2のしきい値より小さい平均パワーを持つ
フレームが、予め設定した時間しきい値より長い時間連
続した場合には、該時間しきい値を越えて連続した前記
第2のしきい値よりも平均パワーが小さいフレームのデ
ータが、出力バッファに転送される。
【0065】このように、話速変換処理手段を構成する
ことにより、話速変換処理の効率を向上と再生音声の品
質劣下防止をはかることができる。
【0066】前述の手段の項の(24)によれば、マイ
クロホンがスイッチのクリック音を拾わないので、スイ
ッチ操作時の大きな雑音を防止することができる。
【0067】前述の手段の項の(25)によれば、見な
くてもどのスイッチかわかるような触感の異なる表面形
態となっているので、操作性を向上することができる。
【0068】前述の手段の項の(26)によれば、マイ
クロホンの布擦れ音防止手段を設けたので、雑音の侵入
を低減することができる。
【0069】前述の手段の項の(27)によれば、話速
変換装置の所定の位置に、現在からの時間遅れ量が目視
可能な表示手段を設けたので、操作時間の短縮、使い勝
手の向上等をはかることができる。
【0070】前述の手段の項の(28)によれば、記憶
手段としてリングバッファを用い、該リングバッファ上
での時間遅れを表わすカウンタで遅れ時間を管理する手
段を設けたので、リピード処理、追いかけ処理等を容易
に行うことができる。
【0071】前述の手段の項の(29)によれば、スル
ーモードの他にスタンバイモードを設けたので、低消費
電力化をはかることができる。
【0072】前述の手段の項の(30)によれば、電源
スイッチをオン(ON)、オフ(OFF)、オンとオフ
中間の3段階とし、アナログスローモードを設けたの
で、低電力化をはかることができる。
【0073】前述の手段の項の(31)によれば、電話
器のハンドセットと装置本体との間に前記話速変換手段
を設けたので、聞き手自身の発話を妨害することなく、
話速変換を施す音声を聞き手が選択できる。
【0074】また、電話器において、話し手の音声の特
徴を変えることなく、ゆっくりとした話速で聞くことが
できる。
【0075】前述の手段の項の(32)によれば、話速
変換手段を電話交換器の中に設けたので、聞き手自身の
発話を妨害することなく、話速変換を施す音声を聞き手
が選択できる。
【0076】
【実施例】以下、本発明を実施例を図面を用いて詳細に
説明する。なお、実施例を説明するための全図におい
て、同一機能を有するものは同一符号を付け、その繰り
返しの説明は省略する。
【0077】(実施例1)図1は、本発明による実施例
1の内部回路の概略構成を示すブロック図であり、1は
DSP(ディジタルシグナルプロセッサ)、11は話速
変換処理を行うソフトウエア、12はシリアルポート、
13は外部割り込みフラグ用端子、14はフラグレジス
タ、2は音声メモリ(出力バッファ)、3はセレクタス
イッチ、4はPTL(Push-To-Listen)スイッチ、
5はA/D変換器、6はD/A変換器、7はローパスフ
ィルタ、8はローパスフィルタ、9はアナログアンプ、
10はアナログアンプ、321はマイクロホン、325
は両耳用ヘッドホン(イヤホン)である。
【0078】本実施例1の話速変換装置において、図1
に示すように、音声はマイクロホン321に入力され音
声信号(電気信号)として出力される。この音声信号は
アンプ10及びローパスフィルタ7を通してA/D変換
器5に入力され、A/D変換器5において、予め設定し
た時間間隔でアナログ値からディジタル値に変換され
る。
【0079】前記ディジタル値に変換された音声信号
は、DSP1に入力される。そして、音声信号の話速変
換処理は、DSP1上のソフトウエア11で実現され
る。PTLスイッチ4は、DSP1の持つ外部割り込み
フラグ用端子13に接続されており、PTLスイッチ4
の状態は、この端子13に対応するDSP1の内部のフ
ラグレジスタ14の数値として表現される。DSP1上
のソフトウエア11では、このフラグレジスタ14の数
値に応じて、話速変換処理を行うか行わないかの判定を
する。
【0080】話速変換処理が施されたディジタル音声デ
ータは、出力バッファメモリ2に保持される。D/A変
換器6は出力バッファメモリ2のデータを、予め設定し
た時間間隔でディジタル値からアナログ値に変換する。
この変換により得られたアナログ信号はローパスフィル
タ8を通してアナログアンプ9に入力され、聞き手の好
み音圧レベルで両耳用ヘッドホン325により音として
出力される。
【0081】本実施例1では、PTLスイッチ4に2種
類のスイッチが用意されている。その1つは押ボタンを
押している間だけ導通するスイッチである。もう1つは
手を押ボタンから離しても、導通した状態が維持される
スイッチである。前者は対話の場合に利用し、後者は、
従来の利用方法である、ラジオ音声などの一方的に与え
られる音声を連続的に話速変換する場合などに用いる。
また、本実施例1では、PTLスイッチ4の他にセレク
タスイッチ3がDSP1の持つ外部割り込みフラグ用端
子13に接続されている。セレクタスイッチ3を切り替
えることにより、フラグレジスタ14の数値を変え、ソ
フトウエア11はこの数値に応じて話速変換処理の伸長
率を変更する。
【0082】図2は本実施例1のDSP1内で実行され
る話速変換処理を説明するための図である。本実施例1
の話速変換処理は、音声信号のピッチ(基本周期)を検
出し、検出されたピッチ単位で波形の長さを延ばす方式
で、数10ミリ秒分の音声データ集合(以下これをフレ
ームと呼ぶ)を1回の処理の単位としている。したがっ
て、DSP1内部には少なくとも2つのフレーム長の入
力バッファを用意し、一方のバッファにA/D変換器か
らデータを入力している間に、他方のバッファに蓄積さ
れていたデータを処理する(パイプライン処理)。処理
後のデータは十分に大きい容量を持つ出力バッファ2に
蓄積される。各フレームのデータに対する処理の手順は
以下の通りである。
【0083】まず、(a)フレームの先頭部分に対しピ
ッチ抽出処理(図示せず)を施しその部分のピッチを検
出する。
【0084】(b)次にその検出された1ピッチ長分の
データを出力バッファ2に転送する。
【0085】(c)次に2ピッチ長分のデータに対し、
0から1に変化する窓関数と1から0に変化する窓関数
をかける。
【0086】ただし、窓関数をかけ始めるデータ上の位
置は1ピッチ分ずらす。そして、それぞれの窓関数をか
けた結果のデータを加算して2ピッチ分の時間長を持つ
合成波形を作り出し、先に転送した1ピッチ分のデータ
の後に挿入する。
【0087】(d)次に、先にピッチ抽出処理を施した
データ上の位置から2ピッチ分離れた位置を先頭に、再
びピッチ検出処理(図示せず)を行い、その位置でのピ
ッチ検出を行う。一般に音声のピッチは常に変動してお
り、先に検出したピッチとは異なるピッチが2回目の検
出では得られる。
【0088】(e)この最後のピッチ検出で得られたピ
ッチ長を単位にnピッチ分のデータを出力バッファに転
送する。
【0089】以上の(a)〜(e)の手順をフレーム全
体に渡って繰り返して行う。
【0090】ピッチ長は入力音声に依存するので、1フ
レームでの繰り返し回数は一定ではない。また、前記
(e)の処理のnの値を変えることで、異なる伸長率が
実現される。例えば、n=1とする入力バッファ中の3
ピッチ分のデータから4ピッチ分のデータが生成される
ので、伸長率は4/3=1.33倍となる。同様にn=
0では1.50倍、n=2では1.25倍となる。
【0091】また、本実施例1では、前記図2の話速変
換処理は、全てのフレームに対して施すのではなく、各
フレーム毎の平均パワーを計算し、パワーが予め設定し
ておいたしきい値Thを越えた場合にのみ、前記説明し
た図2の処理を施すようにしている。そして,パワーが
しきい値Thを越えなかったフレームのデータはそのま
ま出力バッファに転送される。図3にこのしきい値処理
の概念を示す。
【0092】図3では、フレーム毎のパワーがしきい値
Thを越えた部分を伸長区間として表わした。このしき
い値処理により、音声信号の立ち上がり及び立ち下がり
の部分は、処理が施されず原音のまま出力されるので、
音声の立ち上がり及び立ち下がりに含まれる音声の特
徴、例えば、子音の特徴が崩されないという利点があ
る。
【0093】さらに、本実施例1では、図3に示したフ
レーム毎の平均パワーに対するしきい値処理において、
第2のしきい値Toを設けている。そして、この第2の
しきい値Toよりもパワーが低いフレームが1秒以上続
いた場合には、1秒以上続くToよりパワーの低いフレ
ームを出力しないようにしている。これにより、出力バ
ッファに貯められるデータ量の削減が図られる。
【0094】図3ではこの出力されない部分を削除区間
として表わした。出力バッファ2では、話速変換後処理
後のデータがフレーム単位で1度に書き込まれるのと平
行して、一定の時間間隔でD/A変換器6に1つずつデ
ータが出力される。出力バッファ2のアドレスはリング
状に設定されており、最後尾のアドレスと先頭のアドレ
スが連続している。
【0095】したがって、このリング状のアドレス空間
において、話速変換処理後のデータの書き込み先を指す
アドレスポインタPiを、D/A変換器に送るデータを指
すアドレスポインタPoが追いかけるように動作する。
本実施例1では、Poの進む速度に比べPiの進む速度の
方が速いので、いづれPiがPoを追い越してしまう。こ
の時点で、それまで出力バッファ2に蓄えられていた情
報は、出力されることなく書き換えられてしまう。
【0096】したがって、話速変換動作を開始してから
このような状態になるまでの時間が、本実施例1の話速
変換処理の対応できる入力音声の時間長となる。前記し
きい値Toによるデータ量の削減は、この対応可能な時
間長を長くする効果を持つ。
【0097】なお、前記図2及び図3を用いて説明した
話速変換処理の信号処理方式に関しては、電子情報通信
学会技術研究報告SP92-150(1993-03)
「難聴者による話速変換方式の評価」、あるいは日本音
響学会講演論文集(平成5年3月)1-7-6「ポータブ
ルDSPシステムを用いた話速変換方式の検討」に報告
されている。
【0098】図4は本実施例1の話速変換装置の利用形
態を示す図である。図4ではPTLスイッチ4は、装置
の上面に配置されているが、この配置位置は別の部位で
あっても構わない。一方、PTLスイッチ4の横には話
速変換の伸長率を変更するためのセレクタスイッチ3が
用意されている。セレクタスイッチ3の状態はPTLス
イッチ4と同様、DSP1の外部割り込みフラグの端子
を通じて、DSP1上のソフトウエアから観測できるよ
うにしてあり、PTLスイッチ4を押した時のセレクタ
スイッチ3の状態で、前記話速変換処理中のn値を変更
する。PTLスイッチ4とセレクタスイッチ3を交互に
操作することで、発話単位で伸長率を変更することも可
能である。
【0099】図5は前記制御手順をフローチャートで表
わしたものである。話速変換処理は、例えば、数10ミ
リ秒の時間長のフレームを処理の単位としているが、A
/D変換及びD/A変換はそれよりも短い一定の時間間
隔、例えば、数10マイクロ秒で行われる処理である。
このためA/D変換とD/A変換及びそれに伴なう処理
は、図5に示すように、割り込み処理として実現され
る。話速変換処理及び割り込み待ちの処理を行っている
間に、A/D変換器及びD/A変換器の接続されている
シリアルポートからの割り込み信号で、割り込み処理が
行われる。
【0100】以上の説明からわかるように、本実施例1
によれば、ラジオ音声のように一方的に聞き手に与えら
れる音声だけでなく、対話のような状況でも話速変換装
置を利用できるようになり、聞き手自身の発話を妨害す
ることなく、話速変換を施す音声を聞き手が選択でき
る。
【0101】また、本実施例1の話速変換装置は、高齢
者等に見られる音声の聞き取り能力の衰えを補助するこ
とに利用することができる。そして、健聴者が聞き慣れ
ていない外国語を聞くような状況でも使用できることは
言うまでもない。
【0102】(実施例2)図6乃至図10は、本発明に
よる話速変換装置の実施例2の外観構成を示す図であ
り、図6は正面から見た正面平面図、図7は背面から見
た背面平面図、図8は上から見た上平面図、図9は左側
から見た左側平面図、図10は右側から見た右側平面図
である。
【0103】図6乃至図10において、101は話速変
換装置の本体、102は裏蓋、103は指かけ用へこ
み、104はスロースイッチ(スロー押ボタン)、10
5はリピートスイッチ(リピート押ボタン)、106は
リセットスイッチ(リセット押ボタン)、321はマイ
クロホン、108は音量ボリューム、109は電源スイ
ッチ、110はイヤホン端子、111は外部入力端子、
112はAVコントロール端子、113は話速切換スイ
ッチ(話速設定スイッチ)である。
【0104】本実施例2の話速変換装置は、図6乃至図
10に示すように、話速変換装置の本体101の片手で
操作しやすい位置、例えば、正面上辺部にスロースイッ
チ104、リピートスイッチ105、リセットスイッチ
106が設けられ、右側平面図に話速切換スイッチ11
3が設けられている。
【0105】前記スロースイッチ104の押ボタンは、
押される頻度が高いので、他の押ボタンよりも大きめに
してある。そして、ゆっくり押ボタンを押し続けるた
め、疲れるので固定することもできるようにしてある。
例えば、 押して横にスライドするとロックするスラ
イドロック方式、 2度クリックするとロックするダ
ブルクリック方式、 リセット押ボタンが押された場
合には解除する方式等のものを使用する。
【0106】前記話速切換スイッチ(話速設定スイッ
チ)113は、スロースイッチ104と交互に操作がで
きるように、同じ指で操作できる範囲に近づけて配置し
てある。
【0107】前記実施例の位置以外にもリングスイッ
チ、スライドスイッチ等を用いてさらに操作しやすくす
ることもできる。
【0108】前記音量ボリューム108も、常に適切な
音量で聴取することを可能にするために、調整しやすい
同じ指で届く範囲に配置する。
【0109】また、前記スロースイッチ104、リピー
トスイッチ105、リセットスイッチ106、話速切換
スイッチ113等の使用頻度の高いスイッチは、マイク
ロホン321がスイッチのクリック音を拾わないように
柔らかい接触感のスイッチを使用することが好ましい。
例えば、導電性ラバ等を使用したスイッチを用いる。
【0110】また、前記各スイッチの外観は、見なくて
もどの種のスイッチかわかるように触感の異なる表面状
態に構成することが好ましい。
【0111】前記指かけ用へこみ103を開けると、リ
ピート時の話速選択用スイッチなどのいくつかのスイッ
チが見えるようになっている。
【0112】本実施例2の話速変換装置の内部回路構成
は、前記図1に示す実施例1の回路構成と同様になって
いる。
【0113】前記実施例1のPTLスイッチ4として、
前記スロースイッチ104、リピートスイッチ105、
リセットスイッチ106等が用いられている。また、前
記実施例1のセレクタスイッチ3としては、話速切換ス
イッチ(話速設定スイッチ)113が用いられている。
そして、話速切換スイッチ(話速設定スイッチ)113
がDSP1の持つ外部割り込みフラグ用端子13に接続
されている。話速切換スイッチ113を切り替えること
により、フラグレジスタ14の数値を変え、ソフトウエ
ア11はこの数値に応じて話速変換処理の伸長率を変更
する。
【0114】図11は、本実施例2の話速変換装置の機
能構成を示すブロック図であり、21は音声入力部、2
2は入力バッファ、23は中央処理部(CPU)、24
はリングバッファメモリ(図1の音声メモリ2に対
応)、25は機能選択部、26は出力バッファ、27は
音声出力部である。
【0115】前記本実施例2の構成各部を、前記実施例
1の構成とを図1を参照して対応させると、前記音声入
力部21は、図1に示すマイクロホン321、アナログ
アンプ(増幅器)10、ローパスフィルタ7、A/D変
換器5からなっている。
【0116】前記入力バッファ22は、前記音声入力部
21によってディジタル信号変換された音声を保持する
ためのものであり、その後の信号処理を施す単位である
1フレーム分のデータを保持できるだけの大きさを持
つ。この入力バッファ22は、リングバッファメモリ
(図1の音声メモリ2に対応)24の一部のアドレスを
割り当てることにより実現できる。
【0117】前記中央処理部(CPU)23は、図1に
示すDSP1上で実行させるソフトウエアの部分に対応
するものであり、音声圧縮部23A、無音圧縮部23
B、解凍部23C、波形処理部(話速変換処理部)23
D、制御部23Eを有している。
【0118】前記機能選択部25は、図1に示すスイッ
チ3,4及び外部割り込みフラグ用端子13の部分が対
応し、前記スロースイッチ104、リピートスイッチ1
05、リセットスイッチ106、話速切換スイッチ11
3等で構成される。
【0119】前記出力バッファ26は、前記波形処理部
23Dで処理された結果のデータを保持するためのもの
であり、実際には、2つ存在しており、各々波形処理に
よって伸長された1フレーム分のデータが、十分入るだ
けの大きさを有する。前記実施例1では、入力バッファ
が2つあり、それらを交互に使用して、パイプライン処
理を実現したものと同様に、本実施例2では、2つの出
力バッファを交互に用いて、パイプライン処理を実現す
る。
【0120】すなわち、1フレーム分の波形加工処理を
実行し、一方の出力バッファにその結果を保存している
間、もう一方の出力バッファから前回のサイクルで処理
を終えた波形処理結果を音声出力部27を通じて出力す
る。この出力バッファ26は、リングバッファメモリ
(図1の音声メモリ2に対応)24の一部のアドレスを
割り当てることにより実現できる。
【0121】前記入力バッファ22へのデータ入力及び
出力バッファ26からの出力は、前記実施例1と同様
に、A/D変換器5及びD/A変換器6のサンプリング
レート間隔で行われる。このため、DSP1で実行され
る処理は、フレーム単位の波形処理とサンプリング間隔
で実行される割り込み処理とからなる。
【0122】すなわち、1フレーム分のデータを波形処
理している間に、何度も割り込み処理が実行され、見か
け上2つの処理が、同時に実行される。
【0123】前記リングバッファメモリ24としては、
公知のものを用い、その書き込み・読み出しは、フレー
ム単位で行われる。以下にその詳細につて説明する。
【0124】(書き込み動作)図11において、音声入
力部21により入力された音声データは、入力バッファ
22に保持される。入力バッファ22は、1データあた
り16ビットの符号長が割り当てられ、1フレーム分の
数のデータを保持できるだけの容量があり、図1に示す
音声メモリ2上の一部のアドレスを割り当てることによ
って実現されている。
【0125】図11に示す制御部23Eは、この入力バ
ッファ22の状態を監視しており、音声データが1フレ
ーム分溜るごとに、この1フレーム分のデータを、音声
圧縮部23Aに転送する。
【0126】音声圧縮部23Aでは、入力された1フレ
ーム分の音声データの情報圧縮処理を行い、圧縮結果の
データをリングバッファメモリ24へ保存する。この圧
縮処理には、いくつかの方法が考えられる。その一例
は、図12に示された差分データの保存方法である。図
12は、本実施例2の音声圧縮部23Aの圧縮処理を説
明するための模式図である。
【0127】この圧縮処理では、各フレームの先頭デー
タから順に、「1つ前のデータとの差」が計算される。
図12(a)においては、これらの差分を△1,△2,
…と表現してある。圧縮処理の出力データは、フレーム
先頭のデータを、上位8ビットと下位8ビットに分割し
た後に、前記差分データ△1,△2,…を1データ8ビ
ット符号長として並べたものである。入力データの1つ
のデータは16ビットのディジタル符号長を有するが、
音声信号のようなサンプリング間隔に比べて十分緩やか
に変化する入力信号の場合には、1つ前のサンプル値と
の差分はあまり大きくならないので、図12(b)に示
すように、半分の8ビットの符号長があれば、十分表現
できる。このため、圧縮処理の前と後とでは、データの
容量は約半分になるが、そこに含まれている内容は、処
理の途中で差分が8ビットの符号長では表現できないほ
ど大きくならない限り、欠落することはない。
【0128】リングバッファメモリ24への保存は、こ
のようにフレーム単位で半分の容量に圧縮されたデータ
を、リングバッファメモリ24上に、時間的な順序が保
たれるように並べられる。
【0129】なお、フレームの切れ目がわかるように、
各フレームの圧縮データの先頭には、フレームヘッダが
付加される。圧縮処理部では、前記図12の圧縮処理と
共に、そのフレームの全データの絶対値の総和を計算
し、この結果をこのフレームのパワー値として、前記フ
レームヘッダ部に記録する作業も、同じに行う。
【0130】波形伸長/短縮処理を施すフレームの決定
は、フレームのパワーとしきい値Thとの比較により行
っている。また、無音区間削除処理は、フレームのパワ
ーとしきい値Toとの比較により行っている。
【0131】これらのしいき値は、固定の値を使用する
のではなく、入力される音声の大きさに応じて、変更す
ることが望ましい。例えば、静かな部屋の中で使ってい
る場合と、背景雑音が大きい状況とでは、当然これらの
しきい値を上手に調整しないと、うまく話速変換できな
い。
【0132】具体的な実現方法は、過去数秒間のフレー
ムパワーの最大/最小値を記憶しておき、これらの値を
元に、前記しきい値を決定するようにしている。例え
ば、1フレームの時間長を50ミリ秒(msec)とし、
5秒毎にこれらのしきい値を変更しようとする場合に
は、100フレーム処理を行う毎に1度しきい値Thの
変更処理を行えばよい。
【0133】前述したように、フレーム毎のパワーは、
図11の音声圧縮部でフレーム単位に情報圧縮を行う毎
に全入力について、必ず計算されており、その情報はフ
レームヘッダに記録されて、リングバッファ24に保存
される。
【0134】このフレームパワーの計算の際に、最大フ
レームパワーPmax及び最小フレームパワーPminとの比
較を行い、必要ならば更新するようにする。この最大フ
レームパワーPmax及びPminは5秒毎(100フレーム
毎)にリセットされるようにしておけば、過去5秒間の
最大最小フレームパワーがいつも残るようになる。
【0135】しきい値の計算は、例えば、Thを最大フ
レームパワーPmaxと最小フレームパワーPminの間の1
0%に、Toを5%に設定する。式で表現すれば、次式
(数1)及び(数2)となる。
【0136】
【数1】Th=|Pmax−Pmin|*0.10+Pmin
【0137】
【数2】To=|Pmax−Pmin|*0.05+Pmin 次に、本実施例2のリングバッファメモリ24への原
(生)データ保存方法を説明したので、無音区間圧縮の
詳細についても説明する。
【0138】無音区間圧縮の機能は、前記実施例1の図
3で説明したように、1秒以上連続した無音区間(有音
/無音しきい値Toよりパワーが小さい期間)を削除す
るものである。
【0139】無音圧縮処理は、図11に示す無音圧縮部
23Bが行う。この無音圧縮処理は、後述する1フレー
ムを単位として実行される処理(以下、メイン処理と称
する)とは独立した処理であり、1フレーム分のメイン
処理終了後行われる。(図14では、「遅れ量=0」判
定(S143)と「PowerON?」判定(S14
4)の間で行われる(図示はしていない)。
【0140】無音圧縮部23Bでは、入力バッファ22
に溜まったデータを一定の単位(例えば1/4フレー
ム)毎に加算してパワーを算出し、そのパワーが「有音
/無音しきい値を下から上に横切った」時に無音圧縮動
作を開始する。なぜならば、無音区間が終了する時は、
パワーが小から大に変化する時であり、このときでない
と、それまで続いていた無音区間が、1秒以上あったか
否かの判断ができないからである。
【0141】無音圧縮処理が開始されると、まず、リン
グバッファメモリ24のフレームヘッダを、過去の方向
に遡りながら検索する。リングバッファメモリ24上の
圧縮データは、フレーム単位に圧縮されており、前述の
とおりフレームヘッダにそのフレームのパワー値が記録
されている。もし、1秒以上続いてパワーがToより低
いフレームが続いていたら、無音削除可能となり、リン
グバッファメモリ24への入力ポインタを、無音区間が
1秒続いた時点まで戻す。次の圧縮データの入力は、こ
の戻された時点から上書きするように記録する。これに
より、現時点の直前の1秒以上続く無音区間が、常に削
除される。
【0142】(読み出し動作)後述する本実施例2の装
置のメイン処理は、フレーム単位で行われる。そこで、
図11に示す波形処理部23Dが現在処理中のフレーム
データを保持し、リングバッファメモリ24からの読み
だしは、フレーム単位でまとめて行う。すなわち、まと
めて取り出す場合には、リングバッファメモリ24への
アドレッシングが単純にアドレスを1つずつ増やす処理
で済むため、1つずつデータを取り出すよりも効率が良
い。
【0143】リングバッファメモリ24に保存されてい
るデータは、前述のとおり、圧縮されたデータであるた
め、波形処理を行う前に、この圧縮を解凍して元のデー
タに戻す必要がある。図11に示す解凍部23Cは、こ
のためのものである。まず、1フレーム分の圧縮データ
を入力とし、先頭の2つの8ビットデータを16ビット
の上位/下位に配置して先頭データを作る。次に、圧縮
データの3つ目の値を先の先頭データに加え、2番目の
データを復元する。次に、その次の圧縮データ値をこの
2番目のデータに加えて3番目のデータを復元する。以
下次々に圧縮データを1つ前の復元データに加算する作
業を繰り返すことにより、全てのフレームデータを復元
させる。
【0144】次に、本実施例2の話速変換装置の基本動
作を簡単に説明する。
【0145】図11に示すように、音声入力部21によ
ってディジタル信号変換された音声は、まず、入力バッ
ファ22に入力される。入力バッファ22から読み出さ
れた音声信号は、DSP1(図1)のCPU23内の音
声圧縮部23Aに送られ、音声信号にデータ圧縮処理が
施され、リングバッファメモリ24に記憶される。ま
た、前記音声信号は無音圧縮部23Bに送られ、必要な
場合には無音圧縮処理をリングバッファメモリ24に記
憶されているデータに施す。
【0146】リングバッファメモリ24に記憶されてい
る音声信号のデータは、フレーム単位で解凍部23Cに
送られ、解凍部23Cで圧縮処理された音声データを解
凍し、波形処理部(話速変換処理部)23Dに入力す
る。波形処理部(話速変換処理部)23Dでは、機能選
択部25により設定された条件に基づいて話速変換処理
等を行う。この話速変換処理等が施されたディジタル音
声データは、出力バッファ26に保持される。出力バッ
ファ26のデータを読み出して、音声出力部27から話
速変換処理等が施された音声を出力する。
【0147】すなわち、出力バッファ26のデータを読
み出して、図1に示すように、D/A変換器6により設
定した時間間隔でディジタル値からアナログ値に変換す
る。この変換により得られたアナログ信号はローパスフ
ィルタ8を通してアナログアンプ9に入力され、聞き手
の好み音圧レベルで両耳用ヘッドホン325により音と
して出力される。
【0148】次に、本実施例2における1フレームを単
位として実行される処理(以下、メイン処理と称する)
について図11,図13,図14を用いて説明する。
【0149】図13及び図14は本実施例2におけるメ
イン処理の手順を示すフローチャートである。
【0150】本実施例2におけるメイン処理は、図13
に示すように、Power ONして、「フェードイン」処
理を行う(S131)。すなわち、電源投入直後では、
出力バッファ26に入っているデータは、不定である。
このため、電源投入直後には、音声とは無関係なデータ
出力される可能性があり、これを音声出力部27からそ
のまま出力した場合、非常に大きなレベルの雑音となる
可能性がある。このことを防止するため、本実施例2で
は、フェードイン処理が実行され、電源投入後の一定時
間、音声出力部の出力が、出力バッファ内のデータに関
係なく、徐々に大きな音になるように出力バッファ内の
データの値が調整される。具体的には、出力バッファか
らD/A変換器に1データ転送する毎にこのデータ値に
係数を掛け算し、この係数値を時間的に変化させること
で、この機能を実現する。この動作は図11に示す制御
部23Eが実行する。
【0151】その後、「スルーモード」処理に入る。ス
ルーモード処理では、まず、「読書ポインタ一致」処理
が行われる(S132)。この読書ポインタ一致処理
は、音声入力部21からデータを入力する際に、入力バ
ッファ22へ入力した直後に、出力バッファ26にも同
じデータを入力する処理である。この動作は、メモリ上
の入力番地を指す入力ポインタの値を、入力バッファ2
2へデータを入力した直後に、出力データのメモリ上の
番地を指す出力ポインタの値に、一致させることによっ
て実現する。この動作は、図11では制御部23Eが行
う。
【0152】読書ポインタ一致後、スルーモードでは、
スロースイッチ104及びリピートスイッチ105が押
された状態(ON状態)をチェックし(S133,S1
34)、両方とも押されていない状態(OFF状態)の
場合には、前の読書ポインタ一致処理(S132)に戻
り、スルーモードを続ける。したがって、スルーモード
を続けている間に生じる割り込み処理では、必ず入力さ
れたデータがそのまま出力されるため、音声出力部27
は、入力音声と同じになる。
【0153】前記スロースイッチ104、リピートスイ
ッチ105、リセットスイッチ106の各スイッチは、
図11では機能選択部25の中に含まれており、その状
態のチェックは制御部23Eが行う。
【0154】前記スルーモード中にリピートスイッチ1
05が押される(ONする)と、別に用意したリピート
フラグ(図示せず)を0から1にして、「読みだしポイ
ンタ戻し」ルーチンを行う(S135)。この読みだし
ポインタ戻しルーチンの内部の処理手順のフローチャー
トを図16に示す。この図16の説明は後述する。
【0155】前記スルーモード中にスロースイッチ10
4が押されると、図13に示すように、「伸長処理にパ
ラメータ設定」を行うルーチン(S136)に飛ぶ。こ
のルーチンの内部の処理手順のフローチャートを図17
に示す。この図17の説明は後述する。
【0156】伸長処理にパラメータ設定が行われた後
は、1フレーム分の波形伸長または短縮処理が行われる
(S137)。この1フレーム分の波形伸長処理の内部
の処理手段のフローチャートを図18及び図19に示
す。この図18及び図19の説明は後述する。
【0157】前記1フレームの分の処理が終了した後
は、各スイッチ類の押されているか否かの状態のチェッ
クに入る。ところで、1フレームの処理は、1フレーム
の時間長以内で終了するため、数10ミリ秒(msec)
のオーダーで完了する。一方、ユーザーが各スイッチ
(押ボタン)を押した場合、どんなに短い期間押し下げ
たとしても、これ以上の時間押し下げ状態が持続するよ
うなスイッチデバイスが本装置には使用される。このた
め、1フレームの処理を行う毎にスイッチの押し下げ状
態をチェックすれば、ユーザーに反応遅れを感じさせな
い程度の時間遅れで、希望する動作に移行できる。
【0158】まず、リセットスイッチ106が押し下げ
られているか否かをチェックする(S138)。もし、
リセットスイッチ106が押し下げられている(S13
8のYesの場合)ならば、この時点で強制的にスルーモ
ードに移行する。
【0159】リセットスイッチ106が押し下げられて
いない(S138のNoの場合)ならば、図14に示す
ように、スロースイッチ104が押し下げられているか
否かをチェックする(S139)。もし、スロースイッ
チ104が押し下げられている(ONの場合:S139
のYesの場合)ならば、波形伸長処理を続けて次のフレ
ームでも行うよう伸長処理にパラメータをセットするル
ーチンに戻る。スロースイッチ104が押し下げ続けて
いる場合には、このループを回り続けることになる。ま
た、リピート再生及び追いかけ再生中にスロースイッチ
104を押し下げ続けた場合にも、このループを回り続
けることなる。
【0160】スロースイッチ104が開放されてた場合
(OFFの場合:S139のNoの場合)には、次のリ
ピートの押し下げ状態の判定に移る(S140)。この
時点で、リピートスイッチ105の押し下げが検出され
るケースは、「リピート再生中にリピートスイッチを押
した」か「追いかけ再生中にリピートスイッチを押し
た」かのいずれかである。どちらの場合にしても、その
時のリングバッファメモリ24の出力ポインタの位置か
ら約5秒戻った付近の無音部分よりリピート再生を開始
するように、読み出しポインタ戻しルーチンへ分岐す
る。
【0161】スロースイッチ104が開放されており、
リピートスイッチ105も押し下げられていない場合に
は、次のリピート終了判定に移る(S141)。リピー
ト動作は、出力ポインタが、スルーモードからリピート
スイッチ105の押し下げによりリピート動作に移った
時の出力ポインタの位置に戻るまで、連続して続けられ
る。すなわち、ここでの判定により、現在リピートモー
ドにあり、かつ、出力ポインタの位置が、リピートを開
始した時点での出力ポインタ位置まで戻っていない場合
には、前記の1フレーム分の波形伸長・短縮処理に戻る
よう処理ループが形成される。これ以降の処理は、追い
かけ再生のための処理である。
【0162】リピート再生が終了した後及びスロー(ゆ
っくり)再生が終了した後は、追いかけ再生に移動す
る。追いかけ再生とは、1フレーム毎の波形短縮処理を
繰り返すことによって実現される早聞き再生によって、
リピートあるいはスロー(ゆっくり)再生により生じた
実時間からの遅れを取り戻す動作である。ここの部分の
処理では、追いかけ再生のための波形短縮処理用にパラ
メータ設定を行う(S142)。
【0163】実時間からの遅れ量は、リピートボタンを
押し下げた時及び波形伸長処理を実行した時に増加し、
逆に波形短縮処理を実行した時には減少する。
【0164】なお、後述する1フレーム分の波形伸長・
短縮処理の手順(フローチャート)を示す図18及び図
19には、この遅れ量の増加/減少を行う処理は図示さ
れていない。
【0165】この実時間からの遅れ量があるかないかを
判定し(S143)、まだ、遅れ量がある場合には、追
いかけ再生を連続して行うため、処理ループを形成して
いる。すなわち、追いかけ再生は、遅れ量が0になるま
で続けて行われるという動作が、この判定により実現さ
れる。
【0166】ところで、以上説明したメイン処理では、
話速変換あるいはリピート動作によって生じた実時間か
らの時間遅れは、カウンタを用いて「遅れ量」として管
理されている。
【0167】実時間からの時間遅れは、現在のサンプル
データが入力されるリングバッファ24上の位置と、出
力を行っているデータの位置入力されているリングバッ
ファ24上の位置の差、すなわち、2つのポインタが示
すアドレスの差でも管理することが可能であるが、本発
明では前述のように遅れ量カウンタで管理する方式を用
いる。これは、リングバッファ24上の入出力ポインタ
間のアドレスの差では、遅れ量を正しく表現できない場
合があるからである。
【0168】例えば、リングバッファ24に割り当てる
メモリアドレス空間を、0番地から1000番地とする
と、プログラム中では「1000番地の次は0番地に飛
ぶ」として扱うことにより、リングバッファ24を実現
する。このため入出力ポインタがこのアドレスの切れ目
をまたいでいる場合には、単純にアドレス値の差を取っ
ただけでは、この間のデータ量を表現できない。アドレ
ス計算により、このポインタ間のデータ量を知るには、
2つのポインタがその位置に至るまでの経過を踏まえた
複雑な場合分けを含むアドレス値計算が必要になる。
【0169】本発明の話速変換装置では、リングバッフ
ァ24へのデータの読み書きを行う毎に、遅れ量カウン
タの値を増減させることで時間遅れ量を管理し、複雑な
アドレス計算による処理量の増大を防いでいる。
【0170】前記メイン処理は、電源スイッチがOFF
にされるまで、前記の処理を繰り返して行う無限ループ
になっている(S144)。
【0171】電源スイッチがOFFになった場合には、
いきなり処理を停止するのではなく、一定時間処理を続
けてから停止する(ミュート)(S145)。この間、
出力される音声の大きさが徐々に小さくなるような処理
をここで行う。
【0172】具体的には、始めのフェードイン動作と同
様、割り込処理において、出力バッファ26から図1に
示すD/A変換器6に1データ転送する毎にこのデータ
値に係数を掛け算し、この係数値を時間的に変化させる
ことで、この機能を実現する。この動作は図11に示す
制御部23Eが実行する。
【0173】図15は、以上説明した本実施例2におけ
る各モード間の遷移を模式的に示す状態遷移図であり、
この図15によれば、スイッチ操作に伴うモードの切り
替わり方が良くわかるであろう。なお、図15中のスタ
ンバイモードについては後に詳しく説明する。
【0174】以下、前述した本実施例2の各ルーチンの
処理動作の詳細について説明する。
【0175】図16は読書ポインタ戻しルーチンの処理
手順を示すフローチャートである。
【0176】本実施例2の読書ポインタ戻しルーチン
は、リピート機能を実現するために必要なリングバァフ
ァ24からデータを読みだす位置を指す出力ポインタの
値を変えるための具体的な方法である。
【0177】図16に示すように、まず、現時点での出
力ポインタ位置をPoutにセットする(S161)。次
に、現時点での実時間から遅れ量をDに設定(セット)
する(S162)。
【0178】もし、現時点ですでに遅れ量が大きく、さ
らに、5秒分遅れ量(B5)を増やすと、リングバッフ
ァメモリ24のサイズを越えてしまうかを判定し(S1
63)、越えてしまうと判定される場合(S163のY
esの場合)には、Pout及びDはそのままにして(S1
69,S170)、このルーチンを終了する。
【0179】5秒分遅れ量(B5)を増加しても大丈夫
な場合(S163のNoの場合)には、ポインタを5秒
分戻し(−B5)、遅れ量を5秒分増やす(+B5)
(S164)。
【0180】次に、リピートの開始が、言葉の切れ目に
なるように、逆方向に無音区間をサーチする処理を開始
する。まず、リングバッファメモリ24上でPoutが指
す位置から、逆方向にデータをアクセスし、1フレーム
分のパワーを計算する(S165)。
【0181】この時、1フレーム分(F)出力ポインタ
を戻す(−F)と、遅れ量もさらに1フレーム分増える
ことになる(+F)が、遅れ量が1フレーム分増える
と、遅れ量のトータル量がリングバッファメモリサイズ
を越えてしまうかを判断し(S166)、越えてしまう
と判断される場合(S166のYesの場合)には、この
無音部分サーチを中止し、この時のPout及びDを出力
ポインタ値及び遅れ量としてセットし(S169,S1
70)、このルーチンを終了する。
【0182】1フレーム分出力ポインタを戻しても、ト
ータルの遅れ量がリングバッファメモリサイズを越えな
い場合(S166のNoの場合)には、Poutを1フレー
ム分の長さ戻し、遅れ量Dを1フレーム分増やして(S
167)から、計算された1フレーム分のパワーWと有
音/無音のしきい値との比較を行う(S168)。1フ
レーム分のパワーWがこのしきい値より小さい場合に
は、このフレーム付近が言葉の切れ目であると判断して
(S168のNoの場合)には、この時のPout及びDを
出力ポインタ値及び遅れ量としてセットし(S169,
S170)、このルーチンを終了する。
【0183】もし、1フレーム分のパワーWがこのしき
い値より大きい場合(S168のYesの場合)には、さ
らに、1フレーム戻り、同じように無音部分サーチを続
け、無音部分が検出されるが、遅れ量がリングバッファ
メモリサイズを越えるまで続けられる。このようにし
て、リピートスイッチ105が押された際の出力ポイン
タ戻しの処理を完了する。
【0184】図17及び図18は、本実施例2における
1フレーム分の波形伸長・短縮処理手順を示すフローチ
ャートである。
【0185】本実施例2における1フレーム分の波形伸
長・短縮処理は、図17及び図18に示すように、ま
ず、始めに、今回の1フレーム分のデータのパワーを計
算する(S171)。次に、このパワー値Pをしきい値
Thと比較し(S172)、しきい値Thより大きいパ
ワーを有するフレームについては、以下に述べる処理を
施し、しきい値Thより小さいパワーを有するフレーム
のデータは、何もせずにそのまま出力してリングバッフ
ァ24へ転送するか(S173)、子音強調処理を施し
てから出力バッファ26へ転送する。子音強調を行うか
否かは、隠しスイッチの1つであるモードスイッチの状
態によって決定する。
【0186】子音強調処理の具体的な実現方法として
は、例えば、しきい値Th以上のパワーを持つフレーム
の直前のしきい値Th以下のパワーを持つフレームを子
音とみなして、そのフレーム中のデータの値を大きくす
る方法が考えられる。
【0187】前記パワー判定でしきい値Thより大きい
パワーを有するフレーム(S172のYesの場合)で
は、まず、1フレームのデータ数を未処理データ量を表
わす変数Zに記憶してから(S174)、フレームの先
頭からピッチ抽出処理を行う(S175)。ピッチ抽出
処理には、いくつかの方法が考えられるが、例えば、良
く知られた自己相関を用いたアルゴリズムによりフレー
ム先頭でのピッチ長を抽出する。
【0188】次に、この抽出されたピッチ長2個分のデ
ータ量と、未処理データの量とを比較し(S176)、
未処理データ量Zが、この抽出されたピッチの2個分の
データ量より少ない場合には、この処理を中止する。
【0189】未処理データ量Zが2ピッチ分以上ある場
合(S176のYesの場合)には、まず、前転送処理を
行う(S178)。前転送処理とは、以下に述べる合成
波形挿入処理の前に、入力データの一部を、そのまま出
力バッファ26に転送する処理であり、前記実施例1の
図2の(b)の部分に相当する。前転送処理で転送する
データ数は、ピッチ単位で設定するが、その数は波形伸
長率/短縮率により異なり、後述する図19で説明する
パラメータ設定ルーチンにより、この数Npfが設定さ
れる(S177)。前転送処理した(S178)後に
は、未処理データ量Zを、転送したデータ数の分だけ少
なくする(S179)。
【0190】次に、図19に示したパラメータ設定ルー
チン中の設定される別のパラメータPtriに応じて、
合成波形生成のための△窓関数を適用する位置を決める
(S180)。伸長と短縮で異なるのは、△窓関数を用
いて合成波形を生成するときの、窓関数をかける現波形
上の位置だけである。
【0191】すなわち、波形伸長の場合には、図2で示
したように、1ピッチ分の波形から2ピッチ分の波形が
生成されるように、△窓関数を適用する(S181)。
一方、波形短縮の場合には、図20から図22で示した
ように、3ピッチあるいは4ピッチ分の波形から2ピッ
チ分の波形が生成されるように、△窓関数を適用する。
この合成波形の挿入により、実時間からの遅れ量が変化
する(図示せず)。
【0192】合成波形挿入処理の後には、未処理データ
量Zを、処理データ数の分だけ少なくする(S18
2)。
【0193】次に、もう1度、ピッチ抽出処理を行う
(S183)。これは人間の音声のピッチが常に変動し
ていることに対応する処理で、ピッチの抽出をやり直す
ことによって、実際のピッチ長と、処理を行うピッチ長
との誤差を減少させ、その結果として、伸長/短縮後の
波形における歪みの増加を防いでいる。
【0194】次に、図18に示すように、未処理データ
数と、新たに抽出したピッチ長の2個分のデータ量との
比較を行う(S184)。もし、2ピッチ分のデータ量
が残っていなければ(S184のNoの場合)、ただち
に、この処理を中止する。
【0195】2ピッチ分以上のデータ量が残っていれば
(S184のYesの場合)、後転送処理を行う。後転送
処理とは、前転送処理と同様の処理で前記実施例1にお
ける図2の(e)の部分に相当する。後転送処理で転送
するデータ数は、ピッチ単位で設定するが、その数は波
形伸長率/短縮率により異なり、図19で説明するパラ
メータ設定ルーチンによりこの数Nprが設定される
(S185)。後転送処理(S186)の後には、未処
理データ量Zを、転送したデータ数の分だけ少なくする
(S187)。
【0196】以上の処理が、途中2回行われる2ピッチ
分のデータ量と未処理量との比較で、この処理が中断さ
れるまで、連続して繰り返し行われる。
【0197】図19は本実施例2における伸長処理にパ
ラメータを設定するパラメータ設定処理ルーチンの処理
手順を示すフローチャートである。
【0198】図19に示すパラメータ設定ルーチンは、
実は、図13及び図14に示すメイン処理の中で2回使
われている。そのうちの1回は前記1フレーム分の波形
伸長・短縮処理ルーチンの直前で行われ、もう1回は、
リピート終了判定後の「短縮処理にパラメータを設定す
る処理」で使われる。
【0199】ところで、波形短縮処理とは、ゆっくり聞
いた後、またはリピートを行った後に続けて行う「追い
かけ処理(早聞き処理)」を実現するためのものであ
る。波形伸長処理の中で行っていた△窓関数を用いた合
成波形の生成を、窓関数をかける位置を伸長する場合と
逆方向にずらして行うと、波形短縮になる。
【0200】図19において、始めに伸長か短縮かの判
定を行う(S191)。これは前述の2回のうちのどち
らかを判定する。
【0201】伸長処理にパラメータ設定を行う場合に
は、この判定の後、話速選択スイッチの位置をチェック
し(S192)、スイッチ位置に応じて伸長率eを設定
し(S193)、伸長率eに応じて波形伸長処理の中で
使われるパラメータNpfとNprの位置を設定し(S
194,S195)、さらに、波形伸長処理の中で行わ
れる△窓との積和演算を始める位置を示すパラメータP
triを設定して、このルーチンを終わる。
【0202】一方、短縮処理にパラメータ設定を行う場
合には、図19の右側のフローを実行する。まず、追い
かけモードスイッチ(隠しスイッチの一つ)の位置をチ
ェックし(S196)、追いかけモード(Mcat)が
「飛び」「早聞き」「1倍」のどれに設定されているか
をチェックする(S197,S198)。
【0203】「飛び」に設定されている場合、追いかけ
モード(Mcat)は、実際には「追いかけ」ではなく、
スロースイッチ(ゆっくり押ボタン)を離した途端に現
実に飛ぶように機能する(S199)。具体的には、こ
の部分で強制的にスルーモードに戻す分岐処理を行う。
【0204】追いかけモード(Mcat)スイッチが「1
倍」にセットされている場合には、短縮率sを1倍に設
定し(S200)、ステップS202に移る。
【0205】追いかけモード(Mcat)スイッチが「1
倍」にセットされていない場合には、追いかけモード時
の図19の真中のフローを通り短縮率sがセットされ
(S201)、短縮率sに応じて波形短縮処理の中で使
われるパラメータNpfとNprの値を設定し(S20
2)、さらに、波形短縮処理の中で行われる△窓との積
和演算を始める位置を示すパラメータPtriを設定し
て(S203)、このルーチンを終わる。
【0206】(実施例3)図23及び図24は、本発明
による本実施例3の連続話速変換手段を付加した話速変
換装置の全体動作の処理手順を示すフローチャートであ
る。
【0207】本実施例3の連続話速変換手段を付加した
話速変換装置における連続話速変換基本的には、スロー
スイッチ(ゆっくり押ボタン)104を押し続けて、ゆ
っくり再生を続けて行う動作のことである。ただし、一
定の波形伸長率で波形伸長を続けると、時間遅れがどん
どん蓄積してしまい、最後には、実時間からの遅れ量が
リングバッファ24の容量を越えてしまい、それ以上ゆ
っくり聞き続けることが不可能になる。
【0208】そこで、ゆっくり再生を行う際に、波形を
伸長する期間と、逆に波形を短縮する期間を、取り混ぜ
て、実時間から遅れが、どんどん増えないようにするの
が、連続話速変換手段である。
【0209】連続話速変換モードへの切換えは、いくつ
かの方法が考えられるが、単に、スロースイッチを長め
に押しつづけている場合と、連続話速変換モードに入る
場合とで明確な区別をした方がわかりやすいので、例え
ば、スロースイッチをダブルクリック(短い時間間隔で
の2度押し)したり、スロースイッチを押しながら横に
ずらすと、ロックするスイッチ部品を用いたりしてこの
切換えを実現する。
【0210】本実施例3の図23及び図24に示すフロ
ーチャート中の各処理は、前記の図13及び図14で説
明したメイン処理での処理手順と全く同じである。
【0211】本実施例3の連続話速変換手段は、図23
及び図24におけるステップS231において、連続話
速変換処理か否かをチェックする(S231)。連続話
速変換処理であれば(S231のYesの場合)、1フレ
ーム分の波形伸長・短縮処理する(S232)。次に、
リセットスイッチ106が押されている(ONしてい
る)か否かを判定し(S233)、リセットスイッチ1
06が押されていない(OFFしている)場合、1フレ
ーム数カウントUPし(S234)、伸長期間か否かを
判定し(S235)、伸長期間であれば(S235のY
esの場合)、ステップS232に戻る。伸長期間でなれ
ば(S235のNoの場合)、短縮処理にパラメータを
設定する(S236)。次に、遅れ量が0であるをチェ
ックし(S237)、遅れ量が0である場合(S237
のYesの場合)、ステップS232に戻る。遅れ量が0
でない場合(S237のNoの場合)、伸長処理にパラ
メータを設定し(S238)、スレーム数カウンタをリ
セットし(S239)、ステップS232に戻り、連続
話速変換処理動作が繰り返される。前記ステップS23
1において、連続話速変換処理でない場合(S231の
Noの場合)、前述したメイン処理ルーチン(スルーモー
ド)に移る。
【0212】すなわち、本実施例3の連続話速変換手段
は、あらかじめ決められた時間間隔で、ゆっくり再生と
追い付き再生を交互に繰り返す方法である。この方法に
よれば、必ず一定時間毎に実時間に追い付くことが可能
となる。そして、波形伸長と波形短縮を切り替えの管理
は、フレーム数のカウントで行う。例えば、約5秒分の
フレーム数を伸長処理したら、その後短縮処理を繰り返
し行い、遅れ量が0になったら、フレームカウントを0
に戻して、再び伸長処理を繰り返す。
【0213】また、連続話速変換モードから抜け出すに
は、リセットスイッチ106を押し下げ、スルーモード
に戻すことで達成する。
【0214】(実施例4)図25及び図26は、本発明
による前記実施例3と異なる本実施例4の連続話速変換
手段を付加した話速変換装置の全体動作の処理手順を示
すフローチャートである。
【0215】本実施例4の連続話速変換手段を付加した
話速変換装置における連続話速変換は、パワーの大きい
フレームが波形伸長を行い、パワーの小さいフレームは
波形短縮が行う動作である。
【0216】本実施例4の連続話速変換手段は、図25
及び図26における、ステップS251において、連続
話速変換処理か否かをチェックする。連続話速変換処理
であれば(S251のYesの場合)、リセットスイッチ
106が押されている(ONしている)か否かを判定し
(S252)、リセットスイッチ106が押されていな
い(OFFしている)場合、1フレーム分のパワーを算
出する(S253)。次に、算出された1フレーム分の
パワーがしきい値Thよりも大きいか否かをチェックし
(S254)、算出された1フレーム分のパワーがしき
い値Thよりも小さい場合(S251のNoの場合)に
は、短縮処理にパラメータを設定し(S256)、ステ
ップS257に移る。算出された1フレーム分のパワー
がしきい値Thよりも大さい場合(S254のYesの場
合)には、伸長処理にパラメータを設定し(S25
5)、1フレーム分の波形伸長・短縮処理を行い(S2
57)、ステップS252に戻り、連続話速変換処理動
作が繰り返される。前記ステップS251において、連
続話速変換処理でない場合(S251のNoの場合)、前
述したメイン処理ルーチン(スルーモード)に移る。
【0217】すなわち、連続話速変換モードに入ると、
1フレーム分のパワーが算出され、しきい値Thとの比
較により、伸長あるいは短縮がフレーム毎に施される。
連続話速変換モードから抜けだすには、リセットスイッ
チ106を押し下げる。
【0218】本実施例4によれば、音声のパワーに応じ
てゆっくりになったり早口になったりする。
【0219】一般に、通常の会話では、相手に聞いても
らいたい重要な部分は、声が大きくなり、あまり重要で
ない部分は声が小さくなる傾向があることから、本実施
例4による話速制御の方が、より自然に近い出力音声が
得られるという特徴がある。
【0220】ただし、パワーの大きい部分と小さい部分
の出現確率は必ずしも等しくないので、実施例3の場合
のように、必ず一定時間間隔で実時間に追い付く保証は
ない。
【0221】また、連続話速変換モードに入るための、
ユーザーからの指示方法としては、スロースイッチ(ゆ
っくり押ボタン)104を押した後、横にスライドして
ロックする方法や、スロースイッチ(ゆっくり押ボタ
ン)104をダブルクリック(短い時間間隔で2度続け
て押し下げる)などが、考えられる。これらの方法を用
いれば、スロースイッチ(ゆっくり押ボタン)104を
押して、「ゆっくり再生をさせよう」とする意図と、そ
の動作を「連続させよう」という意図と、同じ押ボタン
の押し方の違いで表現できるため、別に連続話速変換用
の押ボタンを設けるのに比較して、より直感的でわかり
やすい操作方式が提供できるようになる。
【0222】これまでの実施例2,3,4では、波形伸
長処理により「ゆっくり」再生する場合の波形の「伸長
率」は、装置上に設けた「話速設定スイッチ」の設定に
よって決められ、波形短縮処理により「早聞き」再生す
る際の波形の「短縮率」は、あらかじめ(プログラム中
で)決められた「デフィルト値」を用いるものとして、
説明してきた。
【0223】しかし、図27に示した「アクセル型スイ
ッチ」による波形伸長/短縮率の変更が行えるようにす
ると、本装置が提供する「音声の時間軸上を自由に行き
来できる」という機能を、使用者がより直感的に使うこ
とが可能となる。
【0224】アクセル型スイッチを中心に設定している
時は、前述の実施例2,3,4のスルーモードが実行さ
れる。スライドスイッチを手前側に引くと、波形伸長処
理となり実時間から遅れながら「ゆっくり再生」が実行
される。そして、スライドスイッチを向う側に押すと、
逆に波形短縮処理となり(実時間からの遅れが0になる
まで)早聞き再生が実行される。
【0225】この際、制御部は、波形伸長及び短縮率
を、スライドスイッチの中心からの距離に応じて変化さ
せる。しかし、前述の実施例の図20から図22の説明
でもわかるように、伸長率/短縮率は、整数の比で表す
ことのできる、いくつかの値しか設定できないので、実
際には、スライドスイッチの中心からの距離に応じて、
数段階の値が選択できるように設定すればよい。
【0226】また、このアクセル型スイッチから使用者
が指を離すと、自動的に中心にレバーが戻るように力が
かかるようにすると、使用者はスライドスイッチを中心
以外の途中の位置に維持することが、しやすくなるの
で、より使い勝手のよい操作方法を実現できる。なお、
このレバーが中心に戻るように力を生じさせるために
は、スイッチデバイスの内部に、2つのスプリングを設
け、両側から均等の力でレバーを引っ張る等の機械的な
手段を持たせることにより、実現できる。
【0227】(実施例5)図28は、本発明による実施
例5のAVコントロール手段を付加した話速変換装置の
機能構成を示すブロック図、図29は、本実施例5のA
Vコントロール手段の動作を説明するための図、図30
及び図31は、本実施例3におけるAVコントロール手
段を付加した話速変換装置のメイン処理の動作手順を示
すフローチャートである。
【0228】本実施例5のAVコントロール手段を付加
した話速変換装置は、図28に示すように、前記図11
に示す実施例1の話速変換装置の機能構成に、AVコン
トロール部28を追加し、制御部23Eに接続した機能
構成にしたものである。
【0229】前記制御部28は、AVコントロール信号
出力を行う条件になったか否かを判定し、AVコントロ
ール部28を動作させ、AVコントロール部28はAV
コントロール信号の出力開始/停止を行う。
【0230】AVコントロール手段とは、図29に示す
ように、スロー(ゆっくり)再生またはリピート再生に
より、実時間からの遅れ量が、一定の量(図29では3
0秒となっている)を越えた場合に、AVコントロール
信号を出力し、さらに、追いかけ再生を経て遅れ量が0
になったときに、同信号の出力を中止するソフトウエア
である。
【0231】AVコントロール信号は、本装置の外に取
り出され、テープレコーダやビデオ等の録音再生装置の
再生動作を一時停止させるために用いられる。この手段
により、本装置のリングバッファ24の容量を越えるよ
うな長い時間の連続する入力声を、連続してゆっくり聞
き続けることが可能となる。
【0232】図30及び図31において、点線で囲んだ
部分が、前記図12及び図13のフローチャートに付加
したAVコントロール手段の動作手順を示すステップで
あり、AVコントロール信号出力を行う条件になったか
否かの判定する(S301)。AVコントロール信号出
力の判定は、スロー(ゆっくり)再生またはリピート再
生1フレーム分の波長伸長/短縮処理を繰り返し行うル
ープの中で、実時間からの遅れ量が30秒以上あるか否
かを判定し(S301)、30以上実時間から遅れがあ
る場合には、AVコントロール信号出力を開始する(S
302)ことで実現される。
【0233】一方、AVコントロール信号を停止させる
処理は、追いかけ再生処理のループを抜け出す判定であ
る。「遅れ量=0」判定の直後に行われる(S30
3)。
【0234】(実施例6)図32は本発明による実施例
6の話速変換装置のマイクロホンの配置を説明するため
の図であり、101は話速変換装置本体、321はマイ
クロホン、322はマイクロホン321を支持するため
の伸縮自在な支柱、323はマイクロホン321を支持
するためのフレキシブルな支柱、324はマイクロホン
321と話速変換装置本体101とを有線で電気的に接
続するための電気コードである。
【0235】図33は本実施例6の変形例を示す図であ
り、101は話速変換装置本体、104はスロースイ
チ、105はリピートスイッチ、106はリセットスイ
ッチ、321はマイクロホン、324はマイクロホン3
21と話速変換装置本体101とを電気的に接続するた
めの電気コード、325はイヤホン、300は接続部材
である。
【0236】本実施例6の話速変換装置のマイクロホン
の配置は、図32(a)に示すように、伸縮自在な支柱
322によってマイクロホン321を支持している。こ
のようにマイクロホン321支持することにより、話速
変換装置本体101からマイクロホン321が離される
ので、本体を胸ポケットに入れて使用する際の布擦れ音
を防止することができる。
【0237】また、図32(b)に示すように、フレキ
シブルな支柱323によってマイクロホン321を支持
している。このようにマイクロホン321支持すること
により、話速変換装置本体101からマイクロホン32
1が離され、かつ、すきな方向にねじ曲げられるので、
本体を胸ポケットに入れて使用する際の布擦れ音を防止
することができる。
【0238】また、図32(b)に示すように、マイク
ロホン321と話速変換装置本体101とを有線(もし
くは無線)で電気的に接続している。このようにマイク
ロホン321と話速変換装置本体101とを有線(もし
くは無線)で電気的に接続し、マイクロホン321を話
速変換装置本体101から独立させ、話し手の近くにマ
イクロホン321を配置するので、S/N比を向上させ
ることができる。
【0239】また、図33に示すように、話速変換装置
本体101とマイクロホン321,イヤホン325とを
接続部材300を介在させて電気コードで電気的に接続
する。そして、前記接続部材300の上にスロースイッ
チ104、リピートスイッチ105、リセットスイッチ
106等の操作スイッチを設ける。このようにすること
により、本体を胸ポケットに入れて使用する際の布擦れ
音を防止することができ、かつ、S/N比を向上させる
ことができ、さらに、使い勝手をよくすることができ
る。
【0240】(実施例7)図34は、本発明による実施
例7の話速変換装置の遅れ時間表示手段を説明するため
の図であり、341は表示部、342は表示画面であ
る。
【0241】本実施例7における遅れ時間表示手段は、
図34に示すように、前記スロー再生及びリピート再生
時に話し手の音声が実際の話速よりどの位遅れているか
を表示するものである。例えば、図34において、人の
画像1個で10秒遅れていることにして、現在から遅れ
ている時間を人の表示画像の数で表示する。このように
することにより、現在からの時間遅れ量を目で見てわか
るので、話し手、聞く手ともに話速変換の調節を容易に
することができるので、使い勝手良く使用することがで
きる。
【0242】時間遅れの視覚表示は、例えば、図6に示
した話速変換装置本体正面の中央に液晶ディスプレイを
設置し、その液晶ディスプレイ上に、図34に示すよう
な表示画面を表示することで実現する。そして、この表
示部は、図11の制御部23Eに接続される「液晶ディ
スプレイドライバ」によって制御される(図示はしてい
ない)。
【0243】表示される時間遅れ量は、図13及び14
で示されたメイン処理の中では、遅れ量カウンタで常に
管理されているので、この遅れ量カウンタの持つ数値を
10秒単位に換算し、対応する個数の人画像を前記ディ
スプレイに表示すればよい。この表示動作は、図11の
制御部23Eが前記ディスプレイドライバを通じて行う
が、表示を書き換えるタイミングは、1フレームの処理
が終了毎に行えれば十分である。例えば、図14のS1
37とS138の間で、この表示処理を行う。
【0244】(実施例8)図35は、本発明による話速
変換装置の実施例8の話速変換装置の電源装置を説明す
るための図であり、1000は話速変換装置に係わる装
置の部分、1はDSP、5はA/D変換器、6はD/A
変換器、9はアナログアンプ、10はアナログアンプ、
1001は電源、1002は電力供給線、1003は切
換スイッチである。
【0245】本実施例8の話速変換装置は、図15の状
態遷移図で示したようにスルーモードの他にスタンバイ
モードを設け、一定時間スルーモードが続くと、自動的
にスタンバイモードに入るようにしている。すなわち、
スロー(ゆっくり)スイッチとリピートスイッチのいず
れかが押される(ONされる)と、クロック周波数が高
くなり、各処理を行う。
【0246】また、スルーモードでは、DSP1は早い
クロックで動作しているが、話速変換等の処理はしてい
ないので、パワーが無駄になっている。そこで、スタン
バイモードでは、DSP1の動作クロックを落として、
データの入出力だけを行うことで、消費電力を下げる。
そして、メモリへの保存だけは行っておく。これによ
り、ボイスメモリ機能が実現される。
【0247】さらに、図35に示すように、アナログス
ルーモードの時は、切換スイッチ1003を電力供給線
1002を切断する接点側に接続するともに、アナログ
アンプ10とアナログアンプ9とが直接接続する接点側
に接続してDSP1、A/D変換器5、D/A変換器6
及び周辺ディジタル回路への電力供給を行わない。この
時、メモリへの保存も行わない。すなわち、入出力のア
ナログ系を直接接続して、単なるアナログ増幅器として
動作させる。前記切換スイッチとしては、図35に示す
ようなオン(ON)、オフ(OFF)、オン(ON)と
オフ(OFF)との中間の3段階スイッチとし、アナロ
グスルーモードを設ける。
【0248】前記説明からわかるように、本実施例8に
よれば、オン(ON)、オフ(OFF)、オン(ON)
とオフ(OFF)との中間の3段階スイッチとし、アナ
ログスルーモードを設けたので、低電力化をはかること
ができ、かつ、電源の使用範囲を拡大することができ
る。
【0249】(実施例9)図36は、本発明による話速
変換手段を電話器に適用した実施例9を説明するための
図であり、2000は本発明による話速変換手段、30
00は電話器本体、3001は送受話器、3002は電
話線である。
【0250】本実施例9の電話器は、図36に示すよう
に、送受話器3001と電話器本体3000との間に本
発明による話速変換手段2000を挿入したものであ
る。話速変換手段2000は、例えば、電話器本体30
00を載置する台のような形状に構成する。
【0251】また、コードレスハンドセットもしくはコ
ードレス子器の送受話器3001の場合には、送受話器
3001と電話器本体3000との間に無線方式で話速
変換手段2000を挿入したものである。
【0252】なお、本発明による話速変換手段は、交換
器の中に話速変換手段として用い、ユーザからのリクエ
ストによって動作させることもできる。
【0253】このように構成することにより、電話の話
声をゆっくり聞くことができる。また、話し手側にはス
ルーの音声をフィードバックし、聞き手には話声をゆっ
くり聞こえるようにして老人等に電話をする際に、話し
手側は普通に話すことができるので、話しづらいという
ことがない。
【0254】また、ディジタル回路ならば、話速変換手
段内部にA/D手段はいらない。
【0255】(実施例10)図37は、本発明による話
速変換手段を構内放送に適用した実施例10を説明する
ための図であり、2000は話速変換手段、321はマ
イクロホン、325はイヤホン、4003は増幅器、4
004スピーカである。
【0256】本実施例10の電話器は、図37に示すよ
うに、マイクロホン321、イヤホン325とスピーカ
4004の増幅器4003との間に本発明による話速変
換手段2000を挿入したものである。
【0257】このように構成することにより、話し手が
話速変換動作を制御しなくても聞き手は適性な話速で聞
くことができる。例えば、話し手が勝手にべらべら高話
速(もうスピード)で話しても、聞き手は適性な話速で
聞くことができる。
【0258】また、ゆっくり話した場合にも、スピーカ
に聞き手は適性な話速で聞くことができるようにするこ
とも可能である。
【0259】以上の説明からわかるように、本発明は、
電話器、電話交換器、構内放送以外の話速変換の必要な
技術分野、例えば、補聴器、語学学習、海外旅行、音楽
等に適用できる。
【0260】例えば、語学学習、海外旅行グッズにおい
て、以下のような場合に応用できる。
【0261】(1)録音された音声を続けてゆっくり聞
く。
【0262】(2)レベルの向上に応じて、伸長率を変
化させる。
【0263】(3)普通の速度で聞いてみて、わからな
い部分を繰り返してゆっくり聞く。
【0264】(4)ゆっくり聞いた後、もう一度元の速
度で聞く。
【0265】(5)ゆっくりリピートの後に真似して発
音する。
【0266】(6)真似して発音と元の音声とを聞き比
べる。
【0267】(7)1つのソースを複数の人が同時に、
自分の好みの話速で聞く。
【0268】また、テープレコーダ、CD,MD等ディ
ジタルオーディオ機器との組み合せにおいては、ディジ
タル出力を持つ機器なら、話速変換装置にA/D変換器
が不要となる。
【0269】また、音楽用において、以下の点につい
て、変更を施せば応用できる。 ・伸長フレームのパワーによる判定をやらない(テンポ
がくるうからである)。 ・ピッチ抽出範囲を音声よりも広くする。 ・波形伸長処理を固定長のピッチで行う。これの音声の
場合はピッチを検出してその検出されたピッチで処理す
る。 ・変換動作をフットスイッチでできるようにする。これ
によれば、楽器を弾きながらコントロールできる。 以上、本発明を実施例に基づき具体的に説明したが、本
発明は、前記実施例に限定されるものではなく、その要
旨を逸脱しない範囲において、種々変更し得ることは勿
論である。
【0270】
【発明の効果】本願において開示される発明のうち代表
的なものによって得られる効果を簡単に説明すれば、以
下のとおりである。
【0271】(1)ラジオ音声のように一方的に聞き手
に与えられる音声だけでなく、対話のような状況でも話
速変換装置を利用できるようになるので、聞き手自身の
発話を妨害することなく、話速変換を施す音声を聞き手
が選択できる。
【0272】また、補聴器、外国語学習器、電話器等に
おいて、話し手の音声の特徴を変えることなく、ゆっく
りとした話速で聞くことができる。
【0273】(2)記憶装置(メモリ)の有効利用、原
音声のリピート機能、ボイスメモリ機能、リピート音声
の話速変換機能、早聞き再生機能等をもたせることがで
きる。
【0274】(3)話速選択用スイッチで選択された話
速に変更する手段を設けたので、聞き手自身が聞く音声
の話速を選択することができる。
【0275】(4)リピート用スイッチがオン(ON)
している間は再生音声をリピートする手段を設けたの
で、リピート音声の話速変換を行うことができる。
【0276】(5)話速変換装置に記憶されている情報
の聞きたいところまで追いかける追いかけ手段を設けた
ので、話速変換装置の応用範囲の拡大、操作時間の短
縮、使い勝手の向上等をはかることができる。
【0277】(6)話速変換装置の一側面の操作し易い
一周辺部に上記話速変換処理用スイッチ、話速選択用ス
イッチ、リピート用スイッチ、及びリセットスイッチの
うち少なくとも1つを設けたので、話速変換装置の応用
範囲の拡大、操作時間の短縮、使い勝手の向上等をはか
ることができる。
【0278】(7)話速変換処理の効率を向上すること
ができる。
【0279】(8)話速変換処理における波形伸長処
理、短縮処理、無音区間削除処理の決定は、フレームの
パワーとしきい値とを比較して行い、かつ、前記しきい
値を入力された音声の大きさに応じて変更するので、使
用環境条件に応じた話速変換処理ができる。
【0280】(9)マイクロホンがスイッチのクリック
音を拾わないので、再生音声を正確に聞くことができ
る。
【0281】(10)見なくてもどのスイッチかわかる
ような触感の異なる表面形態となっているので、操作性
を向上することができる。
【0282】(11)マイクロホンの布擦れ音防止手段
を設けたので、雑音の侵入を低減することができる。
【0283】(12)話速変換装置の所定の位置に、現
在からの時間遅れ量が目視可能な表示手段を設けたの
で、操作時間の短縮、使い勝手の向上等をはかることが
できる。
【0284】(13)記憶手段としてリングバッファを
用い、該リングバッファ上での時間遅れを表わすカウン
タで遅れ時間を管理する手段を設けたので、リピート処
理、追いかけ処理等を複雑なポインタアドレスの計算を
容易に行うことができる。
【0285】(14)スルーモードの他にスタンバイモ
ード及びアナログスルーモードを設けたので、低消費電
力化をはかることができる。
【0286】(15)電源スイッチをオン(ON)、オ
フ(OFF)、オンとオフ中間の3段階とし、アナログ
スルーモードを設けたので、低電力化をはかることがで
き、かつ、電源の使用範囲を拡大することができる。
【0287】(16)電話器のハンドセットと装置本体
との間に前記話速変換手段を設けたので、聞き手自身の
発話を妨害することなく、話速変換を施す音声を聞き手
が選択できる。
【0288】(17)電話器において、話し手の音声の
特徴を変えることなく、ゆっくりとした話速で聞くこと
ができる。
【0289】(18)話速変換手段を電話交換器の中に
設けたので、聞き手自身の発話を妨害することなく、話
速変換を施す音声を聞き手が選択できる。
【図面の簡単な説明】
【図1】本発明による実施例1の内部回路の概略構成を
示すブロック図である。
【図2】本実施例1のDSP内で実行される話速変換処
理を説明するための図である。
【図3】本実施例1のしきい値処理の概念を説明するた
めの図である。
【図4】本実施例1の話速変換装置の利用形態を示す図
である。
【図5】本実施例1の話速変換装置の制御手順を示すフ
ローチャートである。
【図6】本発明による実施例2の話速変換装置の正面か
ら見た正面平面図である。
【図7】本実施例2の話速変換装置の背面から見た背面
平面図である。
【図8】本実施例2の話速変換装置の上から見た上平面
図である。
【図9】本実施例2の話速変換装置の左側から見た左側
平面図である。
【図10】本実施例2の話速変換装置の右側から見た右
側平面図である。
【図11】本実施例2の話速変換装置の機能構成を示す
ブロック図である。
【図12】本実施例2の音声圧縮処理部の圧縮処理を説
明するための模式図である。
【図13】本実施例2におけるメイン処理の手順を示す
フローチャートである。
【図14】図13のフローチャートの続きである。
【図15】本実施例2における各モード間の遷移を模式
的に示す状態遷移図である。
【図16】本実施例2における読書ポインタ戻しルーチ
ンの処理手順を示すフローチャートである。
【図17】本実施例2における1フレーム分の波形長・
短縮処理手順を示すフローチャートである。
【図18】図17のフローチャートの続きである。
【図19】本実施例2におけるパラメータ設定処理手順
を示すフローチャートである。
【図20】本実施例2におけるデータの圧縮処理を説明
するための図である。
【図21】本実施例2におけるデータの圧縮処理を説明
するための図である。
【図22】本実施例2におけるデータの圧縮処理を説明
するための図である。
【図23】本発明による実施例3の連続話速変換手段を
付加した話速変換装置の全体動作の処理手順を示すフロ
ーチャートである。
【図24】図23のフローチャートの続きである。
【図25】本発明による前記実施例3と異なる実施例4
の連続話速変換手段を付加した話速変換装置の全体動作
の処理手順を示すフローチャートである。
【図26】図25のフローチャートの続きである。
【図27】本実施例4における連続話速変換手段に用い
るアクセル型スイッチを説明するための模式図である。
【図28】本発明による実施例5のAVコントロール手
段を付加した話速変換装置の機能構成を示すブロック図
である。
【図29】本実施例5のAVコントロール手段の動作を
説明するための図である。
【図30】本実施例5のAVコントロール手段を付加し
た話速変換装置のメイン処理手順を示すフローチャート
である。
【図31】図30のフローチャートの続きである。
【図32】本発明による実施例6の話速変換装置のマイ
クロホンの配置を説明するための図である。
【図33】本実施例6の変形例の構成を示す図である。
【図34】本発明による実施例7の話速変換装置の遅れ
時間表示手段を説明するための図である。
【図35】本発明による実施例8の話速変換装置の電源
装置を説明するための図である。
【図36】本発明による話速変換手段を電話器に適用し
た実施例9を説明するための図である。
【図37】本発明による話速変換手段を構内放送に適用
した実施例10を説明するための図である。
【符号の説明】
1…DSP(ディジタルシグナルプロセッサ)、11…
話速変換処理を行うソフトウエア、12…シリアルポー
ト、13…外部割り込みフラグ用端子、14…フラグレ
ジスタ、2…音声メモリ、3…セレクタスイッチ、4…
PTLスイッチ、5…A/D変換器、6…D/A変換
器、7…ローパスフィルタ、8…ローパスフィルタ、9
…アナログアンプ、10…アナログアンプ、321…マ
イクロホン、325…両耳用ヘッドホン(イヤホン)、
101は話速変換装置の本体、102は裏蓋、103…
指かけ用へこみ、104…スロースイッチ(スロー押ボ
タン)、105…リピートスイッチ(リピート押ボタ
ン)、106…リセットスイッチ(リセット押ボタ
ン)、108…音量ボリューム、109…電源スイッ
チ、110…イヤホン端子、111…外部入力端子、1
12…AVコントロール端子、113…話速切換スイッ
チ(話速設定スイッチ)、21…音声入力部、22…入
力バッファ、23…中央処理部(CPU)、24…リン
グバッファメモリ、25…機能選択部、26…出力バッ
ファ、27…音声出力部、28…AVコントローラ。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 川内 保憲 茨城県勝田市稲田1410番地 株式会社日立 製作所AV機器事業部内 (72)発明者 畑岡 信夫 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 森川 寿一 神奈川県横浜市戸塚区吉田町292番地 株 式会社日立製作所試作開発センタ内

Claims (32)

    【特許請求の範囲】
  1. 【請求項1】 音声を入力し、該入力音声のピッチを変
    化させずに、音声の速度のみを変更する話速変換方法で
    あって、話速変換を聞き手が必要とする時に指定した時
    間の間のみ入力音声の話速変換処理が行われ、それ以外
    の時間の間には話速変換が行われないことを特徴とする
    話速変換方法。
  2. 【請求項2】 音声を入力する手段と、該入力音声の速
    度を変更する話速変換処理手段と、該話速変換処理手段
    の出力を聞き手の耳に音声出力する手段とを有する話速
    変換装置であって、前記話速変換装置に話速変換処理用
    スイッチを設け、該話速変換処理用スイッチがオン(O
    N)している間だけ前記入力音声の話速を変更して出力
    し、当該話速変換処理用スイッチがオフ(OFF)して
    いる間には入力音声の話速を変更せずに出力する手段を
    設けたことを特徴とする話速変換装置。
  3. 【請求項3】 原音声を符号化して蓄積し、該蓄積され
    た符号化音声を読み出し、前記原音声のピッチを変化さ
    せずに、音声の速度のみを変更する話速変換方法であっ
    て、話速変換を必要とする時に指定した時間の間のみ入
    力音声の話速変換処理が行われ、それ以外の時間の間に
    は話速変換が行われないことを特徴とする話速変換方
    法。
  4. 【請求項4】 原音声を入力する手段と、該入力音声を
    符号化して蓄積する記憶手段と、該蓄積された符号化音
    声を読出して前記入力音声の速度を変更する話速変換処
    理手段と、該話速変換処理手段の出力を聞き手の耳に音
    声出力する手段とを有する話速変換装置であって、前記
    話速変換装置に話速変換処理用スイッチを設け、該話速
    変換処理用スイッチがオン(ON)している間だけ前記
    入力音声の話速を変更して出力し、当該話速変換処理用
    スイッチがオフ(OFF)している間には入力音声の話
    速を変更せずに出力する手段を設けたことを特徴とする
    話速変換装置。
  5. 【請求項5】 前記記憶手段は、フレーム単位で記憶す
    る手段を有することを特徴とする請求項4に記載の話速
    変換装置。
  6. 【請求項6】 前記話速変換処理における波形伸長/短
    縮処理の決定は、フレームのパワーとしきい値とを比較
    して行う手段を有し、前記しきい値を可変にしたことを
    特徴とする請求項5に記載の話速変換装置。
  7. 【請求項7】 前記話速変換装置に話速を選択する話速
    選択用スイッチを設け、該話速選択用スイッチで選択さ
    れた話速に変更する手段を設けたことを特徴とする請求
    項2,4乃至6のうちいずれか1項に記載の話速変換装
    置。
  8. 【請求項8】 前記話速変換装置にオーディオ・ビデオ
    機器を制御する手段(AVコントロール)を設けたこと
    を特徴とする請求項7に記載の話速変換装置。
  9. 【請求項9】 前記話速変換装置にリピート用スイッチ
    を設け、該リピート用スイッチがオン(ON)している
    間は再生音声をリピートする手段を設けたことを特徴と
    する請求項2,4乃至8のうちいずれか1項に記載の話
    速変換装置。
  10. 【請求項10】 前記リピート手段は、1回押す毎に数
    秒ずつバックさせる手段、戻っている間は時々間欠音を
    発生させる手段、リングバッファの端まで行ったらそれ
    以上戻れなくする手段、リピート時の話速を選択する手
    段のうち少なくとも1つの手段を有することを特徴とす
    る請求項9に記載の話速変換装置。
  11. 【請求項11】 前記リピート時の話速を選択する手段
    は、デフォルト値でリピート、ゆっくりリピート、早聴
    きでリピート、リピートが徐々に早くなるのうち少なく
    とも2つ以上を有することを特徴とする請求項10に記
    載の話速変換装置。
  12. 【請求項12】 前記話速変換装置において、話速変換
    またはリピート動作によって実時間からの遅れが生じた
    場合に、前記記憶されている情報を再生している間に、
    前記遅れ量の調整を行う追いかけ手段を設けたことを特
    徴とする請求項2,4乃至11のうちいずれか1項に記
    載の話速変換装置。
  13. 【請求項13】 前記追いかけ手段は、ゆっくりと再生
    するモードが終ると追いかけがスタートする手段、リピ
    ート後にリピート開始時点まで再生すると追いかけがス
    タートする手段、追いかけ時の話速を選択する手段、追
    いついたら入力音声をそのまま出力するスルーモードに
    自動的に移る手段、及び追いついたら報知信号音(メッ
    セージ)を発生する手段のうち少なくとも1つを有する
    ことを特徴とする請求項12に記載の話速変換装置。
  14. 【請求項14】 前記追いかけ時の話速を選択する手段
    は、現実まで一気にスキップする手段、早聞きで現実を
    追いかける手段、及び遅れたまま平行移動する手段のう
    ち少なくとも1つを有することを特徴とする請求項13
    に記載の話速変換装置。
  15. 【請求項15】 前記話速変換装置の一側面の操作し易
    い一周辺部に前記話速変換処理用スイッチ、話速選択用
    スイッチ、リピート用スイッチ、及びリセットスイッチ
    のうち少なくとも1つを設けたことを特徴とする請求項
    2,4乃至14のうちいずれか1項に記載の話速変換装
    置。
  16. 【請求項16】 前記リセットスイッチは、リピート動
    作中もしくは追いかけ動作中に該スイッチをオンすると
    その動作を中止し現実にスキップし、その後はスルーモ
    ードに移る手段を有することを特徴とする請求項15に
    記載の話速変換装置。
  17. 【請求項17】 前記話速変換処理手段は、外部からの
    割り込み要求信号を入力するための端子を有するディジ
    タルシグナルプロセッサで実行されるソフトウエアとし
    て提供され、前記話速変換処理用スイッチによる話速変
    換処理の制御または話速変換速度の切り替えは、該割り
    込み要求信号を入力する端子を通じて、ディジタルシグ
    ナルプロセッサに与えられることを特徴とする請求項
    2,4乃至16のうちいずれか1項に記載の話速変換装
    置。
  18. 【請求項18】 前記話速変換装置の出力音声を両耳用
    ヘッドホンを通して聞く手段を有することを特徴とする
    請求項2,4乃至16のうちいずれか1項に記載の話速
    変換装置。
  19. 【請求項19】 音響信号を電気信号に変換するマイク
    ロホンと、該マイクロホン出力を増幅するアナログアン
    プと、該アナログアンプの出力の高周波成分を取り除く
    ローパスフィルタと、該ローパスフィルタ出力のアナロ
    グ信号をディジタル信号に変換するA/D変換器と、音
    声の速度を変更する処理をディジタル信号処理により実
    行するディジタルシグナルプロセッサと、入力音声デー
    タや信号処理結果のデータを保存する記憶手段と、該デ
    ィジタルシグナルプロセッサの行う音声の速度を変更す
    る処理を制御する手段と、処理のパラメータを変更する
    手段と、ディジタル音声データをアナログ値に変換する
    D/A変換器と、該D/A変換器の出力の高周波成分を
    取り除く第2のローパスフィルタと、該第2のローパス
    フィルタの出力を増幅する第2のアナログアンプと、該
    第2のアナログアンプの出力を音響信号に変換し両耳に
    与えるヘッドホンとを有することを特徴とする話速変換
    装置。
  20. 【請求項20】 音響信号を電気信号に変換するマイク
    ロホンと、該マイクロホン出力を増幅するアナログアン
    プと、該アナログアンプの出力の高周波成分を取り除く
    ローパスフィルタと、該ローパスフィルタ出力のアナロ
    グ信号をディジタル信号に変換するA/D変換器と、入
    力音声データや信号処理結果のデータを保存する記憶手
    段と、該蓄積された情報を読み出して音声の速度を変更
    する処理をディジタル信号処理により実行するディジタ
    ルシグナルプロセッサと、該ディジタルシグナルプロセ
    ッサの行う音声の速度を変更する処理を制御する手段
    と、処理のパラメータを変更する手段と、ディジタル音
    声データをアナログ値に変換するD/A変換器と、該D
    /A変換器の出力の高周波成分を取り除く第2のローパ
    スフィルタと、該第2のローパスフィルタの出力を増幅
    する第2のアナログアンプと、該第2のアナログアンプ
    の出力を音響信号に変換し両耳に与えるヘッドホンとを
    有することを特徴とする話速変換装置。
  21. 【請求項21】 前記話速変換処理手段は、複数の入力
    フレームバッファを用いたフレーム単位のパイプライン
    処理で行われ、各フレームのデータに対して、まず、フ
    レームの先頭部分に対しピッチ抽出処理を施してその部
    分のピッチを検出し、その検出された1ピッチ長分のデ
    ータを出力バッファに転送し、2ピッチ長分のデータに
    対し、0から1に変化する窓関数と1から0に変化する
    窓関数をかけ、それぞれの窓関数をかけた結果のデータ
    を加算して2ピッチ分の時間長を持つ合成波形を作り出
    し、先に転送した1ピッチ分のデータの後に挿入し、先
    にピッチ抽出処理を施したデータ上の位置から2ピッチ
    分離れた位置を先頭に、再びピッチ検出処理を行い、そ
    の位置でのピッチ検出を行い、最後のピッチ検出で得ら
    れたピッチ長を単位にn(nは整数)ピッチ分のデータ
    を出力バッファに転送する一連の手順をフレーム全体に
    渡って繰り返して行うことを特徴とする請求項19また
    は20に記載の話速変換装置。
  22. 【請求項22】 前記話速変換処理手段は、入力フレー
    ム中のデータの平均パワーを計算し、該平均パワーが予
    め設定したしきい値より大きかった場合にのみ実行さ
    れ、小さかった場合には、該フレームに含まれるデータ
    がそのまま出力バッファに転送されることを特徴とする
    請求項21に記載の話速変換装置。
  23. 【請求項23】 前記入力フレーム中のデータの平均パ
    ワーに対するしきい値処理において、第2のしきい値を
    設け、該第2のしきい値より小さい平均パワーを持つフ
    レームが、予め設定した時間しきい値より長い時間連続
    した場合には、該時間しきい値を越えて連続した前記第
    2のしきい値よりも平均パワーが小さいフレームのデー
    タが、出力バッファに転送されることを禁止したことを
    特徴とする請求項22に記載の話速変換装置。
  24. 【請求項24】 前記各スイッチは、マイクロホンがス
    イッチのクリック音を拾わないような柔らかい接触感の
    スイッチからなることを特徴とする請求項2,4乃至1
    8のうちいずれか1項に記載の話速変換装置。
  25. 【請求項25】 前記各スイッチは、見なくてもどのス
    イッチかわかるような触感の異なる表面形態であること
    を特徴とする請求項24に記載の話速変換装置。
  26. 【請求項26】 前記マイクロホンと装置本体との距離
    を変えて、装置本体を胸ポケットに入れて使用する場合
    にマイクロホンと衣服とが直接接触しないようにするた
    めの布擦れ音防止手段が設けられていることを特徴とす
    る請求項2,4乃至25うちいずれか1項に記載の話速
    変換装置。
  27. 【請求項27】 前記話速変換装置の所定の位置に、現
    在からの時間遅れ量が目視可能な表示手段を設けたこと
    を特徴とする請求項2,4乃至26のうちいずれか1項
    に記載の話速変換装置。
  28. 【請求項28】 前記記憶手段としてリングバッファを
    用い、該リングバッファ上での時間遅れを表わすカウン
    タで遅れ時間の管理する手段を設けたことを特徴とする
    請求項4乃至27のうちいずれか1項に記載の話速変換
    装置。
  29. 【請求項29】 前記スルーモードの他に、プロセッサ
    のクロックサイクルを下げ、スルーモードと同様の処理
    を行うスタンバイモードを設けたことを特徴とする請求
    項19乃至28のうちいずれか1項に記載の話速変換装
    置。
  30. 【請求項30】 電源スイッチをオン(ON)、オフ
    (OFF)、オンとオフ中間の3段階とし、前記中間位
    置にスイッチを合わせた時、音声信号処理系中のアナロ
    グ入出力系を互いに短絡し、アナログ入出力系間にある
    ディジタル処理系への電源供給を中止するアナログスル
    ーモードで動作する電源供給手段を有することを特徴と
    する請求項2,4乃至29のうちいずれか1項に記載の
    話速変換装置。
  31. 【請求項31】 電話器のハンドセットと電話器本体と
    の間に前記請求項2,4乃至30のうちいずれか1項に
    記載の話速変換手段を設けたことを特徴とする電話器。
  32. 【請求項32】 前記請求項2,4乃至30のうちいず
    れか1項に記載の話速変換手段を電話交換器の中に設け
    たことを特徴とする電話交換器。
JP16723294A 1992-08-18 1994-07-19 話速変換方法及び話速変換装置並びに電子装置 Pending JPH07129190A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP16723294A JPH07129190A (ja) 1993-09-10 1994-07-19 話速変換方法及び話速変換装置並びに電子装置
DE1994621774 DE69421774T2 (de) 1993-09-10 1994-09-08 Verfahren und Vorrichtung zur Geschwindigkeitskonversion von Sprache
EP19940114160 EP0643380B1 (en) 1993-09-10 1994-09-08 Speech speed conversion method and apparatus
US08/301,994 US5717818A (en) 1992-08-18 1994-09-09 Audio signal storing apparatus having a function for converting speech speed
CA 2131730 CA2131730A1 (en) 1993-09-10 1994-09-09 Speech speed conversion method and speech speed conversion apparatus

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP5-225449 1993-09-10
JP22544993 1993-09-10
JP16723294A JPH07129190A (ja) 1993-09-10 1994-07-19 話速変換方法及び話速変換装置並びに電子装置

Publications (1)

Publication Number Publication Date
JPH07129190A true JPH07129190A (ja) 1995-05-19

Family

ID=26491341

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16723294A Pending JPH07129190A (ja) 1992-08-18 1994-07-19 話速変換方法及び話速変換装置並びに電子装置

Country Status (4)

Country Link
EP (1) EP0643380B1 (ja)
JP (1) JPH07129190A (ja)
CA (1) CA2131730A1 (ja)
DE (1) DE69421774T2 (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001255894A (ja) * 2000-03-13 2001-09-21 Sony Corp 再生速度変換装置及び方法
JP2001290499A (ja) * 2000-04-07 2001-10-19 Sony Corp 話速変換装置およびスピーカ装置
JP2001290500A (ja) * 2000-04-07 2001-10-19 Sony Corp 話速変換装置、スピーカ装置、テレビジョン受像機
JP2004506244A (ja) * 2000-08-10 2004-02-26 トムソン ライセンシング ソシエテ アノニム 可変速度データ再生機能を備えたシステム用のメモリアドレス指定方法
US6928408B1 (en) 1999-12-03 2005-08-09 Fujitsu Limited Speech data compression/expansion apparatus and method
US7260035B2 (en) 2003-06-20 2007-08-21 Matsushita Electric Industrial Co., Ltd. Recording/playback device
JP2007219188A (ja) * 2006-02-17 2007-08-30 Kyushu Univ 子音加工装置、音声情報伝達装置及び子音加工方法
WO2007145079A1 (ja) * 2006-06-12 2007-12-21 Kazuo Ishikawa 反復再生学習機およびプログラム
JP2008292720A (ja) * 2007-05-24 2008-12-04 Yamaha Corp 音声送信装置
JP2012530954A (ja) * 2009-06-22 2012-12-06 ロゼッタ ストーン エルティーディー 言語コミュニケーションを改善する方法と装置
JP2014102379A (ja) * 2012-11-20 2014-06-05 Nippon Hoso Kyokai <Nhk> 音声再生装置および音声合成再生装置ならびにこれらのプログラム
WO2017068858A1 (ja) * 2015-10-19 2017-04-27 ソニー株式会社 情報処理装置、情報処理システム及びプログラム

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100302370B1 (ko) * 1997-04-30 2001-09-29 닛폰 호소 교카이 음성구간검출방법과시스템및그음성구간검출방법과시스템을이용한음성속도변환방법과시스템
JP2990265B1 (ja) * 1998-08-03 1999-12-13 北陸先端科学技術大学院大学長 補聴器およびその周波数特性の設定方法
US7149412B2 (en) * 2002-03-01 2006-12-12 Thomson Licensing Trick mode audio playback
EP1840877A4 (en) * 2005-01-18 2008-05-21 Fujitsu Ltd ELOCUTION SPEED CHANGING METHOD AND ELOCUTION SPEED CHANGING DEVICE
DE102005021524A1 (de) * 2005-05-10 2006-11-16 Siemens Ag Verfahren und Vorrichtung zum Eingeben von Zeichen in eine Datenverarbeitungsanlage
CN110364177A (zh) * 2019-07-11 2019-10-22 努比亚技术有限公司 语音处理方法、移动终端及计算机可读存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4630301B1 (en) * 1985-06-04 1999-09-07 Well Made Toy Mfg Co Voice activated echo generator
DE4227826C2 (de) * 1991-08-23 1999-07-22 Hitachi Ltd Digitales Verarbeitungsgerät für akustische Signale

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6928408B1 (en) 1999-12-03 2005-08-09 Fujitsu Limited Speech data compression/expansion apparatus and method
JP2001255894A (ja) * 2000-03-13 2001-09-21 Sony Corp 再生速度変換装置及び方法
JP4513163B2 (ja) * 2000-04-07 2010-07-28 ソニー株式会社 話速変換装置およびスピーカ装置
JP2001290499A (ja) * 2000-04-07 2001-10-19 Sony Corp 話速変換装置およびスピーカ装置
JP2001290500A (ja) * 2000-04-07 2001-10-19 Sony Corp 話速変換装置、スピーカ装置、テレビジョン受像機
JP2004506244A (ja) * 2000-08-10 2004-02-26 トムソン ライセンシング ソシエテ アノニム 可変速度データ再生機能を備えたシステム用のメモリアドレス指定方法
US7260035B2 (en) 2003-06-20 2007-08-21 Matsushita Electric Industrial Co., Ltd. Recording/playback device
JP2007219188A (ja) * 2006-02-17 2007-08-30 Kyushu Univ 子音加工装置、音声情報伝達装置及び子音加工方法
WO2007145079A1 (ja) * 2006-06-12 2007-12-21 Kazuo Ishikawa 反復再生学習機およびプログラム
JP2008292720A (ja) * 2007-05-24 2008-12-04 Yamaha Corp 音声送信装置
JP2012530954A (ja) * 2009-06-22 2012-12-06 ロゼッタ ストーン エルティーディー 言語コミュニケーションを改善する方法と装置
US8840400B2 (en) 2009-06-22 2014-09-23 Rosetta Stone, Ltd. Method and apparatus for improving language communication
JP2014102379A (ja) * 2012-11-20 2014-06-05 Nippon Hoso Kyokai <Nhk> 音声再生装置および音声合成再生装置ならびにこれらのプログラム
WO2017068858A1 (ja) * 2015-10-19 2017-04-27 ソニー株式会社 情報処理装置、情報処理システム及びプログラム
JPWO2017068858A1 (ja) * 2015-10-19 2018-08-02 ソニー株式会社 情報処理装置、情報処理システム及びプログラム
US10666995B2 (en) 2015-10-19 2020-05-26 Sony Corporation Information processing apparatus, information processing system, and program
US11081136B2 (en) 2015-10-19 2021-08-03 Sony Corporation Information processing apparatus, information processing system, and program

Also Published As

Publication number Publication date
DE69421774D1 (de) 1999-12-30
DE69421774T2 (de) 2000-08-10
CA2131730A1 (en) 1995-03-11
EP0643380B1 (en) 1999-11-24
EP0643380A2 (en) 1995-03-15
EP0643380A3 (en) 1995-05-24

Similar Documents

Publication Publication Date Title
US5717818A (en) Audio signal storing apparatus having a function for converting speech speed
JPH07129190A (ja) 話速変換方法及び話速変換装置並びに電子装置
US20200186114A1 (en) Audio Signal Adjustment Method, Storage Medium, and Terminal
US9531338B2 (en) Signal processing apparatus, signal processing method, program, signal processing system, and communication terminal
KR100283421B1 (ko) 음성 속도 변환 방법 및 그 장치
US20080276793A1 (en) Beat enhancement device, sound output device, electronic apparatus and method of outputting beats
WO2019033987A1 (zh) 提示方法、装置、存储介质及终端
KR100916726B1 (ko) 청력 역치 측정 장치 및 그 방법과 그를 이용한 오디오신호 출력 장치 및 그 방법
JP2014515140A (ja) 骨伝導振動子を備えるユーザインタフェースを制御するためのシステムおよび装置
CN112185324B (zh) 调音方法、装置、存储介质、智能设备及调音***
US20050190087A1 (en) AGC circuit, AGC circuit gain control method, and program for the AGC circuit gain control method
EP2849341A1 (en) Loudness control at audio rendering of an audio signal
JPH0556499A (ja) デイジタル補聴器
JP2010230972A (ja) 音信号処理装置、その方法、そのプログラム、および、再生装置
JP6904255B2 (ja) 情報処理システム及びプログラム
CN106293607B (zh) 自动切换音频输出模式的方法及***
US7356153B2 (en) Hearing assistive apparatus having sound replay capability
JP2008040431A (ja) 音声加工装置
JP2006020231A (ja) オーディオ再生装置
CN113261305A (zh) 耳机、声学信号处理方法和程序
JPH1049191A (ja) 話速変換装置
KR101696997B1 (ko) Dsp 내장 코덱을 이용한 소음에 따른 출력 음향 크기 자동 조정 장치
KR100703923B1 (ko) 멀티미디어기기를 위한 입체음향 최적화 장치 및 방법
JPH10209779A (ja) オーディオ装置
KR101060546B1 (ko) 사용자의 청력에 맞게 오디오 재생파일을 변환하는 장치