JP3432443B2 - 音声速度変換装置、音声速度変換方法および音声速度変換方法を実行するプログラムを記録した記録媒体 - Google Patents

音声速度変換装置、音声速度変換方法および音声速度変換方法を実行するプログラムを記録した記録媒体

Info

Publication number
JP3432443B2
JP3432443B2 JP04392099A JP4392099A JP3432443B2 JP 3432443 B2 JP3432443 B2 JP 3432443B2 JP 04392099 A JP04392099 A JP 04392099A JP 4392099 A JP4392099 A JP 4392099A JP 3432443 B2 JP3432443 B2 JP 3432443B2
Authority
JP
Japan
Prior art keywords
section
voice
speed
waveform
expansion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04392099A
Other languages
English (en)
Other versions
JP2000242300A (ja
Inventor
伸哉 植垣
宏之 西
亮造 布川
弘行 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP04392099A priority Critical patent/JP3432443B2/ja
Publication of JP2000242300A publication Critical patent/JP2000242300A/ja
Application granted granted Critical
Publication of JP3432443B2 publication Critical patent/JP3432443B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声における人の
話す声の速さを変化させて、元の音声よりも速い速度ま
たは遅い速度の音声を作成するための装置に関するもの
である。
【0002】
【従来の技術】従来、デジタルで保存されている音声を
対象として、音声の再生速度を変更させる手段が多く提
案されてきた。以前は、再生速度の変更に伴い音声のピ
ッチが変わってしまっていたが、最近、ピッチの変更を
伴わない音声再生速度変換方法が発明された。そのた
め、音声を効率的に聞き取るために、元の音声よりも速
い速度で再生する早聞き機能や、お年よりや耳の不自由
な方のために、元の声よりも遅い速度で再生する遅聞き
機能が、デジタル機器の中に普通に利用されるようにな
ってきた。この早聞き機能や遅聞き機能は、音声の全体
に対して一律の割合で波形を間引くか、または繰り返す
ことで実現されてきた。
【0003】
【発明が解決しようとする課題】しかし、従来の音声速
度変換方法は、元の音声の発話速度を考慮せず、音声全
体に対して一律の割合で波形を間引く、または繰り返す
手法であった。そのため、元の音声が速い場合には、変
換された音声も想定以上に速く、元の音声がゆっくりし
ている場合は、変換された速度も想定以上にゆっくりと
してしまうといった問題点があり、利用者が好みの速度
で再生する場合の妨げとなっていた。
【0004】本発明は、このような課題を解決するため
のものであり、元の音声の有音無音判別結果、および無
音区間の長さや発話速度を利用して、音声波形を間引
く、または繰り返す割合を設定する音声速度変換装置を
提供することを目的としている。
【0005】
【課題を解決するための手段】請求項1の発明による音
声速度変換装置は、音声を取り込む音声入力手段と、前
記音声入力手段によって取り込んだ音声の発話速度を算
出する発話速度算出手段と、目標再生速度を設定する目
標速度設定手段と、音声の有音区間と無音区間とを判別
する有音無音判別手段と、前記有音無音判別手段によっ
て判別された有音区間の音声波形を間引く、または繰り
返す割合である有音区間伸縮率を設定する有音区間伸縮
率設定手段と、前記有音無音判別手段によって判別され
た無音区間の音声波形を間引く、または繰り返す割合で
ある無音区間伸縮率を設定する無音区間伸縮率設定手段
と、前記有音区間伸縮率に基づき、有音区間の音声波形
を間引くか、または繰り返すことにより有音区間の伸縮
波形を生成し、前記無音区間伸縮率に基づき、無音区間
の音声波形を間引くか、または繰り返すことにより無音
区間の伸縮波形を生成する波形生成手段と、前記目標速
度設定手段によって設定した目標再生速度と、前記発話
速度算出手段によって算出した発話速度とを比較し、前
記無音区間の伸縮波形の再生速度が、前記目標再生速度
と同程度の速度となるように、前記無音区間伸縮率設定
手段に無音区間伸縮率を可変設定させる第1の制御部
と、前記有音無音判別手段によって判別された各有音区
間毎に、前記発話速度算出手段によって有音区間毎発話
速度を算出させる第2の制御部と、前記目標速度設定手
段によって設定した目標再生速度と、前記発話速度算出
手段によって算出した有音区間毎発話速度とを比較し、
前記有音区間の伸縮波形の再生速度が、前記目標再生速
度と同程度の速度となるように、前記各有音区間毎に、
前記有音区間伸縮率設定手段に有音区間伸縮率を可変設
定させる第3の制御部と、前記波形生成手段によって生
成した有音区間と無音区間の伸縮波形を入力し、伸縮音
声を出力する音声出力手段とを有することを特徴とし、
音声を伸縮することを目的としている。
【0006】請求項2の発明による音声速度変換装置
は、請求項1の発明において、さらに、前記第3の制御
部は、前記無音区間の伸縮波形の再生時間が一定時間に
なるように、各無音区間毎に、前記無音区間伸縮率設定
手段に無音区間伸縮率を可変設定させる制御を行うこと
を特徴とし、音声を伸縮することを目的としている。
【0007】請求項3の発明による音声速度変換方法
は、音声を取り込み、該音声の発話速度を算出し、該音
声の有音区間と無音区間とを判別し、該音声の目標再生
速度を設定し、該目標再生速度と、前記発話速度とを比
較し、前記無音区間の伸縮波形の再生速度が、前記目標
再生速度と同程度の速度となるように、該無音区間の音
声波形を間引く、または繰り返す割合である無音区間伸
縮率を可変設定し、判別された各有音区間毎に、有音区
間毎発話速度を算出し、前記目標再生速度と、前記有音
区間毎発話速度とを比較し、前記有音区間の伸縮波形の
再生速度が、前記目標再生速度と同程度の速度となるよ
うに、前記各有音区間毎に、該有音区間の音声波形を間
引く、または繰り返す割合である有音区間伸縮率を可変
設定し、該有音区間伸縮率に基づき、有音区間の音声波
形を間引くか、または繰り返すことにより有音区間の伸
縮波形を生成し、前記無音区間伸縮率に基づき、無音区
間の音声波形を間引くか、または繰り返すことにより無
音区間の伸縮波形を生成し、該有音区間と無音区間の伸
縮波形より伸縮音声を出力することを特徴とし、音声を
伸縮することを目的としている。
【0008】請求項4の発明による音声速度変換方法
は、請求項3の発明において、さらに前記無音区間の伸
縮波形の再生時間が一定時間になるように、各無音区間
毎に、前記無音区間伸縮率設定手段に無音区間伸縮率を
可変設定することを特徴とし、音声を伸縮することを目
的としている。
【0009】請求項5の発明による音声速度変換方法を
実行するプログラムを記録した記録媒体は、音声を取り
込み、該音声の発話速度を算出し、該音声の有音区間と
無音区間とを判別し、該音声の目標再生速度を設定し、
該目標再生速度と、前記発話速度とを比較し、前記無音
区間の伸縮波形の再生速度が、前記目標再生速度と同程
度の速度となるように、該無音区間の音声波形を間引
く、または繰り返す割合である無音区間伸縮率を可変設
定し、判別された各有音区間毎に、有音区間毎発話速度
を算出し、前記目標再生速度と、前記有音区間毎発話速
度とを比較し、前記有音区間の伸縮波形の再生速度が、
前記目標再生速度と同程度の速度となるように、前記各
有音区間毎に、該有音区間の音声波形を間引く、または
繰り返す割合である有音区間伸縮率を可変設定し、該有
音区間伸縮率に基づき、有音区間の音声波形を間引く
か、または繰り返すことにより有音区間の伸縮波形を生
成し、前記無音区間伸縮率に基づき、無音区間の音声波
形を間引くか、または繰り返すことにより無音区間の伸
縮波形を生成し、該有音区間と無音区間の伸縮波形より
伸縮音声を出力することを特徴とし、音声を伸縮するこ
とを目的としている。
【0010】請求項6の発明による音声速度変換方法を
実行するプログラムを記録した記録媒体は、請求項5の
発明において、さらに、前記無音区間の伸縮波形の再生
時間が一定時間になるように、各無音区間毎に、前記無
音区間伸縮率設定手段に無音区間伸縮率を可変設定する
ことを特徴とし、音声を伸縮することを目的としてい
る。
【0011】
【0012】以上のように、本発明は、音声の発話速度
を算出し、この発話速度に応じて、音声を間引く割合や
繰り返す割合を可変的に設定することで、従来とは異な
り元の音声発話速度によらず聴取者の好みの速さの音声
を作り出すことが可能となる。
【0013】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態を説明する。図1は、本発明の第1実施形態であ
る音声速度変換装置の構成を示すブロック図である。こ
の装置は、音声を入力する音声入力部101と、入力され
た音声の発話速度を算出する発話速度算出部102と、音
声伸縮率を設定する音声伸縮率設定部103と、前記音声
伸縮率に基づいて、入力された音声の波形を間引くか、
または繰り返す波形生成部104と、この波形生成部104が
生成した波形を音声として出力する音声出力部105とを
備える。
【0014】上記構成の接続関係を説明する。音声入力
部101の出力は、発話速度算出部102および波形生成部10
4に入力される。発話速度算出部102の出力は、音声伸縮
率設定部103に入力され、この音声伸縮率設定部103の出
力は、前記波形生成部104に入力される。波形生成部104
の出力は、音声出力部105に入力される。
【0015】次に、図6に示すフローチャートを参照し
て、本実施形態の動作を説明する。なお、以下の文中に
おけるS100等は、フローチャート中のステップを示す。
まず、音声入力部101に音声が入力される(S100)。次
に、入力された音声波形が発話速度算出部102に送ら
れ、ここで発話速度が算出される(S101)。発話速度の算
出には、一例として、特開平5-289691号公報「発話速度
測定装置」に開示されている動的尺度を用いた方法を利
用することが考えられる。
【0016】次に、算出された発話速度が音声伸縮率設
定部103に通知され、ここで通知された発話速度に応じ
た音声伸縮率が設定される(S102)。この音声伸縮率設定
の一例として、発話速度を、速い速度の区分、中間速度
の区分、遅い速度の区分の3段階に区分し、算出された
発話速度が速い速度の区分に属する場合には、前記音声
波形を繰り返す処理を行うように前記音声伸縮率を設定
し、発話速度が遅い速度の区分に属する場合には、波形
を間引く処理を行うように前記音声伸縮率を設定し、発
話速度が中間速度の区分に属する場合には、波形処理を
行わない制御を行うように前記音声伸縮率を設定する。
【0017】次に、設定された音声伸縮率が波形生成部
104に送られ、ここで、この音声伸縮率に基づいて音声
波形を間引くか、または繰り返す波形作成処理が行わ
れ、音声波形が伸縮される(S103)。この波形処理は、一
例として、ピッチ単位で波形処理を行うPICOLA方式を用
い、発話者のピッチ変化が起こらない間引き処理を行う
ことが考えられる。最後に、伸縮された音声波形が音声
出力部105に送られ、ここで音声に変換されて出力され
る(S104)。
【0018】図2は、本発明の第2実施形態である音声
速度変換装置のブロック図である。なお、以下の説明に
おいて、同一の構成には同一の符号を付し、その説明を
省略するものとする。第2実施形態の装置は、第1実施
形態の装置に加え、目標の音声再生速度を設定する目標
速度設定部117と、この目標速度設定部117の出力および
前記発話速度算出部102の出力を入力する制御部116とを
備え、この制御部116の出力は、前記音声伸縮率設定部1
03に入力されている。制御部116は、発話速度算出部102
で算出された発話速度と、目標速度設定部117で設定さ
れた目標再生速度とを比較し、再生速度が目標再生速度
とほぼ同程度となるように、音声伸縮率設定部103に音
声伸縮率を可変設定する制御を行う。
【0019】図7は、この装置の動作を示すフローチャ
ートである。音声入力部101による音声の入力(S100)お
よび発話速度算出部102による発話速度の算出(S101)
は、第1実施形態と同様である。前記S100、S101と並行
して、目標速度設定部117において目標再生速度が設定
される(S114)。
【0020】次に、制御部116において、前記発話速度
算出部102で算出された発話速度と、前記目標速度設定
部117で設定された目標再生速度とが比較され、再生速
度が目標再生速度とほぼ同程度となるように、音声伸縮
率設定部103に音声伸縮率が設定される(S112)。すなわ
ち、制御部116は、発話速度と目標再生速度とを比較
し、発話速度が速い場合には音声波形を繰り返す処理を
行う音声伸縮率を設定し、発話速度が遅い場合には波形
を間引く処理を行う音声伸縮率を設定する制御を行う。
この音声伸縮率に基づいた音声の伸縮(S103)および音
声の出力(S104)のステップは、第1実施形態と同様であ
る。
【0021】図3は、本発明の第3実施形態のブロック
図である。第3実施形態には、第2実施形態の構成に加
え、音声の有音無音を判別する有音無音判別部128と、
有音区間伸縮率を設定する有音区間伸縮率設定部129
と、無音区間伸縮率を設定する無音区間伸縮率設定部13
0とが設けられている。前記有音無音判別部128は、音声
の有音無音を判別し、音声波形を有音区間と無音区間と
に分ける。そして、前記有音区間伸縮率とは、有音区間
の音声波形を間引くか、または繰り返す割合であり、無
音区間伸縮率とは、無音区間の波形を間引くか、または
繰り返す割合である
【0022】前記有音無音判別部128、有音区間伸縮率
設定部129、無音区間伸縮率設定部130の接続関係を説明
する。有音無音判別部128には、音声入力部101の出力が
入力され、この有音無音判別部128の出力は、制御部126
に入力されている。制御部126の出力は、有音区間伸縮
率設定部129および無音区間伸縮率設定部130に入力さ
れ、これらの有音区間伸縮率設定部129および無音区間
伸縮率設定部130の出力は、どちらも波形生成部124に入
力されている。
【0023】制御部126は、有音無音判別部128で判別さ
れた有音区間と無音区間とのそれぞれにおいて、音声伸
縮率を可変設定する制御を行う。すなわち、制御部126
は、有音区間伸縮率設定部129に有音区間伸縮率を可変
設定する制御と、無音区間伸縮率設定部130に無音区間
伸縮率を可変設定する制御とを個別に行う。そして、波
形生成部124は、設定された有音区間伸縮率と無音区間
伸縮率を用いて、音声入力部101から入力された音声波
形を間引くか、または繰り返す処理を行う。
【0024】図8は、この装置の動作を示すフローチャ
ートである。音声の入力(S100)、発話速度の算出(S1
01)、目標再生速度の設定(S114)のステップは、第2
実施形態と同様である。前記発話速度の算出(S101)と
並行して、有音無音判別部128で音声の有音無音の判別
が行われ、入力された音声波形が有音区間と無音区間と
に区分される(S125)。
【0025】制御部126は、有音区間に区分された音声
波形から有音区間伸縮率を算出し、この有音区間伸縮率
を有音区間伸縮率設定部129に設定し(S126)、無音区
間に区分された音声波形から無音区間伸縮率を算出し、
この無音区間伸縮率を無音区間伸縮率設定部130に設定
する(S127)。
【0026】これらの有音区間伸縮率および無音区間伸
縮率は、どちらも、発話速度が目標再生速度より遅い場
合には波形を繰り返すように、発話速度が目標再生速度
より速い場合には波形を間引くように設定される。ただ
し、有音区間伸縮率と無音区間伸縮率とを比較すると、
無音区間伸縮率の方が、波形を繰り返す度合いが小さ
く、波形を間引く度合いが大きいので、無音区間の方を
より大幅に縮小させることができる。
【0027】波形生成部124は、前記有音区間伸縮率に
基づき有音区間の音声波形を伸縮し、前記無音区間伸縮
率に基づき無音区間の音声波形を伸縮する(S123)。こ
こでの伸縮の方法は、第2実施形態におけるS103と同様
である。また、伸縮された音声を音声出力部105から出
力するステップS104も、第2実施形態におけるS104と同
様である。
【0028】図4は、本発明の第4実施形態のブロック
図である。第4実施形態は、ブロック図レベルでは、第
3実施形態と同一の構成となっているが、制御部136内
部における制御が異なっている。異なる点は、無音区間
が一定時間になるような無音区間伸縮率が算出される点
である。すなわち、複数の区間に分割されている無音区
間において、各無音区間毎に個別の無音区間伸縮率が算
出される。
【0029】図9は、第4実施形態の動作を示すフロー
チャートである。S137において、上述した無音区間が一
定時間になるような設定が行われる。すなわち、制御部
136で、無音区間が一定時間になるような無音区間伸縮
率が算出され、算出された無音区間伸縮率が、無音区間
伸縮率設定部130に設定される。さらに詳細には、前記
有音無音の判定(S125)において、無音区間に区分され
た各区間に対しては、制御部136において、前記各無音
区間が一定時間になるように、各無音区間毎に無音区間
伸縮率が算出され、これらの無音区間伸縮率が無音区間
伸縮率設定部130に設定される。これ以外の動作は、第
3実施形態と同様である。
【0030】図5は、本発明の第5実施形態を示すブロ
ック図である。第5実施形態は、ブロック図レベルで
は、第4実施形態と同一の構成となっているが、制御部
146内部における制御が異なっている。異なる点は、複
数の区間に分割されている有音区間において、各有音区
間毎に個別の有音区間伸縮率が算出される点である。
【0031】図10は、第5実施形態の動作を示すフロ
ーチャートである。有音無音判定部128において、有音
無音の判定が行われ(S125)、発話速度算出部102にお
いて、前記判定によって有音区間に区分された各区間毎
に発話速度が算出される(S141)。そして、制御部146
において、前記各有音区間毎の発話速度に応じて、各有
音区間毎の有音区間伸縮率が算出され、これらの有音区
間伸縮率が有音区間伸縮率設定部129に設定される。
【0032】また、前記有音無音の判定(S125)におい
て、無音区間に区分された各区間に対しては、制御部14
6において、前記各無音区間が一定時間になるように、
各無音区間毎に無音区間伸縮率が算出され、これらの無
音区間伸縮率が無音区間伸縮率設定部130に設定され
る。
【0033】そして、波形生成部124においては、上記
各有音区間および各無音区間の音声波形が、これらの各
区間毎に設定された伸縮率で伸縮される。上記以外の動
作は、第4実施形態と同様である。
【0034】図11は、第5実施形態による音声波形変
換の一例である。発話速度が速い有音区間では音声波形
の短縮率が小さいが、発話速度が遅い有音区間では短縮
率が大きい。また、各無音区間は、全て一定時間に変換
される。
【0035】
【発明の効果】以上説明したように、本発明では、音声
の発話速度を算出し、再生速度が一定の速度になるよう
に音声を間引くための割合や繰り返すための割合を可変
的に設定することで、従来とは異なり、元の音声の発話
速度によらず、一定の速さの音声を作り出すことが可能
となる。そして、本発明は、留守番電話やボイスメール
の聞き取り、議事録作成や音声の翻訳作業、英会話レッ
スンの補助、ニュースや本の朗読の聞き取りおよび蓄積
された映像付き音声の聞き取り等の用途に効果がある。
【0036】また、本発明では、音声の発話速度を算出
し、その発話速度と目標再生速度とを比較し、再生速度
が前記目標再生速度と同程度の速度になるように音声を
間引くための割合や繰り返すための割合を可変的に設定
することで、従来とは異なり、元の音声の発話速度によ
らず、聴取者の好みの速さの音声を作り出すことが可能
となる。
【0037】また、無音有音を区別し、冗長である無音
部分の伸縮率を有音部分の伸縮率とは異なる設定にした
ので、より効率の良い伸縮ができる。さらに、無音区間
を短縮可能な限界の長さまで短縮することで、より効率
の良い伸縮ができる。さらにまた、個々の有音区間毎に
有音区間伸縮率を設定することで、より効率の良い伸縮
ができる。
【図面の簡単な説明】
【図1】 本発明の第1実施形態のブロック図。
【図2】 本発明の第2実施形態のブロック図。
【図3】 本発明の第3実施形態のブロック図。
【図4】 本発明の第4実施形態のブロック図。
【図5】 本発明の第5実施形態のブロック図。
【図6】 第1実施形態のフローチャート。
【図7】 第2実施形態のフローチャート。
【図8】 第3実施形態のフローチャート。
【図9】 第4実施形態のフローチャート。
【図10】 第5実施形態のフローチャート。
【図11】 第5実施形態による音声波形変換の一例を
示す図。
【符号の説明】
101 音声入力部(音声入力手段) 102 発話速度算出部(発話速度算出手段) 103 音声伸縮率設定部(音声伸縮率設定手段) 104、124 波形生成部(波形生成手段) 105 音声出力部(音声出力手段) 116、126、136、146 制御部 117 目標速度設定部 128 有音無音判別部 129 有音区間伸縮率設定部 130 無音区間伸縮率設定部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 松井 弘行 東京都新宿区西新宿三丁目19番2号 日 本電信電話株式会社内 (56)参考文献 特開 平10−70790(JP,A) 特開 平9−325798(JP,A) 特開 平8−254992(JP,A) 特開 平5−257490(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 21/04 G10L 13/08

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声を取り込む音声入力手段と、 前記音声入力手段によって取り込んだ音声の発話速度を
    算出する発話速度算出手段と、目標再生速度を設定する目標速度設定手段と、 音声の有音区間と無音区間とを判別する有音無音判別手
    段と、 前記有音無音判別手段によって判別された有音区間の音
    声波形を間引く、または繰り返す割合である有音区間伸
    縮率を設定する有音区間伸縮率設定手段と、 前記有音無音判別手段によって判別された無音区間の音
    声波形を間引く、または繰り返す割合である無音区間伸
    縮率を設定する無音区間伸縮率設定手段と、 前記有音区間伸縮率に基づき、有音区間の音声波形を間
    引くか、または繰り返すことにより有音区間の伸縮波形
    を生成し、前記無音区間伸縮率に基づき、無音区間の音
    声波形を間引くか、または繰り返すことにより無音区間
    の伸縮波形を生成する波形生成手段と、 前記目標速度設定手段によって設定した目標再生速度
    と、前記発話速度算出手段によって算出した発話速度と
    を比較し、前記無音区間の伸縮波形の再生速度が、前記
    目標再生速度と同程度の速度となるように、前記無音区
    間伸縮率設定手段に無音区間伸縮率を可変設定させる第
    1の制御部と、 前記有音無音判別手段によって判別された各有音区間毎
    に、前記発話速度算出手段によって有音区間毎発話速度
    を算出させる第2の制御部と、 前記目標速度設定手段によって設定した目標再生速度
    と、前記発話速度算出手段によって算出した有音区間毎
    発話速度とを比較し、前記有音区間の伸縮波形の再生速
    度が、前記目標再生速度と同程度の速度となるように、
    前記各有音区間毎に、前記有音区間伸縮率設定手段に有
    音区間伸縮率を可変設定させる第3の制御部と、 前記波形生成手段によって生成した有音区間と無音区間
    の伸縮波形を入力し、伸縮音声を出力する音声出力手段
    とを有することを特徴とする音声速度変換装置。
  2. 【請求項2】 前記第3の制御部は、前記無音区間の伸
    縮波形の再生時間が 一定時間になるように、各無音区間
    毎に、前記無音区間伸縮率設定手段に無音区間伸縮率を
    可変設定させる制御を行う ことを特徴とする請求項1に
    記載の音声速度変換装置。
  3. 【請求項3】 音声を取り込み、 該音声の発話速度を算出し、 該音声の有音区間と無音区間とを判別し、 該音声の目標再生速度を設定し、 該目標再生速度と、前記発話速度とを比較し、前記無音
    区間の伸縮波形の再生速度が、前記目標再生速度と同程
    度の速度となるように、該無音区間の音声波形を間引
    く、または繰り返す割合である無音区間伸縮率を可変設
    定し、 判別された各有音区間毎に、有音区間毎発話速度を算出
    し、 前記目標再生速度と、前記有音区間毎発話速度とを比較
    し、前記有音区間の伸縮波形の再生速度が、前記目標再
    生速度と同程度の速度となるように、前記各有音区間毎
    に、該有音区間の音声波形を間引く、または繰り返す割
    合である有音区間伸縮率を可変設定し、 該有音区間伸縮率に基づき、有音区間の音声波形を間引
    くか、または繰り返すことにより有音区間の伸縮波形を
    生成し、前記無音区間伸縮率に基づき、無音区間の音声
    波形を間引くか、または繰り返すことにより無音区間の
    伸縮波形を生成し、 該有音区間と無音区間の伸縮波形より伸縮音声を出力す
    ことを特徴とする音声速度変換方法。
  4. 【請求項4】 前記無音区間の伸縮波形の再生時間が一
    定時間になるように、各無音区間毎に、前記無音区間伸
    縮率設定手段に無音区間伸縮率を可変設定する ことを特
    徴とする請求項1に記載の音声速度変換方法。
  5. 【請求項5】 音声を取り込み、 該音声の発話速度を算出し、 該音声の有音区間と無音区間とを判別し、 該音声の目標再生速度を設定し、 該目標再生速度と、前記発話速度とを比較し、前記無音
    区間の伸縮波形の再生速度が、前記目標再生速度と同程
    度の速度となるように、該無音区間の音声波形を間引
    く、または繰り返す割合である無音区間伸縮率を可変設
    定し、 判別された各有音区間毎に、有音区間毎発話速度を算出
    し、 前記目標再生速度と、前記有音区間毎発話速度とを比較
    し、前記有音区間の伸縮波形の再生速度が、前記目標再
    生速度と同程度の速度となるように、前記各有音区間毎
    に、該有音区間の音声波形を間引く、または繰り返す割
    合である有音区間伸縮率を可変設定し、 該有音区間伸縮率に基づき、有音区間の音声波形を間引
    くか、または繰り返すことにより有音区間の伸縮波形を
    生成し、前記無音区間伸縮率に基づき、無音区間の音声
    波形を間引くか、または繰り返すことにより無音区間の
    伸縮波形を生成し、 該有音区間と無音区間の伸縮波形より伸縮音声を出力す
    ことを特徴とする音声速度変換方法を実行するプログ
    ラムを記録した記録媒体。
  6. 【請求項6】 前記無音区間の伸縮波形の再生時間が一
    定時間になるように、各無音区間毎に、前記無音区間伸
    縮率設定手段に無音区間伸縮率を可変設定する ことを特
    徴とする請求項1に記載の音声速度変換方法を実行する
    プログラムを記録した記録媒体。
JP04392099A 1999-02-22 1999-02-22 音声速度変換装置、音声速度変換方法および音声速度変換方法を実行するプログラムを記録した記録媒体 Expired - Fee Related JP3432443B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04392099A JP3432443B2 (ja) 1999-02-22 1999-02-22 音声速度変換装置、音声速度変換方法および音声速度変換方法を実行するプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04392099A JP3432443B2 (ja) 1999-02-22 1999-02-22 音声速度変換装置、音声速度変換方法および音声速度変換方法を実行するプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2000242300A JP2000242300A (ja) 2000-09-08
JP3432443B2 true JP3432443B2 (ja) 2003-08-04

Family

ID=12677157

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04392099A Expired - Fee Related JP3432443B2 (ja) 1999-02-22 1999-02-22 音声速度変換装置、音声速度変換方法および音声速度変換方法を実行するプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3432443B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7440900B2 (en) * 2002-03-15 2008-10-21 Microsoft Corporation Voice message processing system and method
US7337108B2 (en) * 2003-09-10 2008-02-26 Microsoft Corporation System and method for providing high-quality stretching and compression of a digital audio signal
JP2005309173A (ja) * 2004-04-23 2005-11-04 Nippon Hoso Kyokai <Nhk> 音声合成制御装置、その方法、そのプログラムおよび音声合成用データ生成装置
JP5128869B2 (ja) * 2007-08-06 2013-01-23 株式会社ストレートワード 通訳支援システム、通訳支援プログラム、通訳支援方法
JP5691721B2 (ja) * 2011-03-25 2015-04-01 三菱電機株式会社 音声データ処理装置
JP6098149B2 (ja) * 2012-12-12 2017-03-22 富士通株式会社 音声処理装置、音声処理方法および音声処理プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3249567B2 (ja) * 1992-03-10 2002-01-21 日本放送協会 話速変換方法および装置
JPH08254992A (ja) * 1995-03-17 1996-10-01 Fujitsu Ltd 話速変換装置
JP3961616B2 (ja) * 1996-05-22 2007-08-22 ヤマハ株式会社 話速変換方法および話速変換機能付補聴器
JPH09325798A (ja) * 1996-06-06 1997-12-16 Matsushita Electric Ind Co Ltd 音声認識装置

Also Published As

Publication number Publication date
JP2000242300A (ja) 2000-09-08

Similar Documents

Publication Publication Date Title
US6205420B1 (en) Method and device for instantly changing the speed of a speech
JP4245060B2 (ja) サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム
JP3017715B2 (ja) 音声再生装置
JP4523257B2 (ja) 音声データ処理方法、プログラム及び音声信号処理システム
JP3439307B2 (ja) 発声速度変換装置
JP3432443B2 (ja) 音声速度変換装置、音声速度変換方法および音声速度変換方法を実行するプログラムを記録した記録媒体
JP4752516B2 (ja) 音声対話装置および音声対話方法
JP3379348B2 (ja) ピッチ変換器
JP3327936B2 (ja) 話速制御型補聴装置
JP3841596B2 (ja) 音素データの生成方法及び音声合成装置
JPH0916193A (ja) 話速変換装置
JP3219892B2 (ja) リアルタイム話速変換装置
JP3185363B2 (ja) 補聴器
JPH09152889A (ja) 話速変換装置
JPH08254992A (ja) 話速変換装置
JP2007094004A (ja) 音声信号の時間軸圧伸方法および音声信号の時間軸圧伸装置
JPH07210192A (ja) 出力データ制御方法及び装置
JP3083830B2 (ja) 音声の発声時間長制御方法および装置
JP6313619B2 (ja) 音声信号処理装置及びプログラム
JPH06222794A (ja) 音声速度変換方法
JPH06250695A (ja) ピッチ制御方法及び装置
JPH10224898A (ja) 補聴器
JPH09146587A (ja) 話速変換装置
JP2006038956A (ja) 音声速度遅延装置及び方法
JPH0883095A (ja) 話速変換方法および装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090523

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090523

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100523

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100523

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110523

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120523

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130523

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees