JP3912913B2 - 音声合成方法及び装置 - Google Patents
音声合成方法及び装置 Download PDFInfo
- Publication number
- JP3912913B2 JP3912913B2 JP24595098A JP24595098A JP3912913B2 JP 3912913 B2 JP3912913 B2 JP 3912913B2 JP 24595098 A JP24595098 A JP 24595098A JP 24595098 A JP24595098 A JP 24595098A JP 3912913 B2 JP3912913 B2 JP 3912913B2
- Authority
- JP
- Japan
- Prior art keywords
- amplitude
- magnification
- fine
- speech
- unvoiced
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001308 synthesis method Methods 0.000 title claims description 12
- 238000000034 method Methods 0.000 claims description 37
- 230000015572 biosynthetic process Effects 0.000 claims description 15
- 238000003786 synthesis reaction Methods 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 11
- 230000002194 synthesizing effect Effects 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims 1
- 230000006870 function Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 8
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
- G10L13/07—Concatenation rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electrophonic Musical Instruments (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Description
【発明の属する技術分野】
本発明は音声合成方法及び装置に関し、特に、合成音声のパワー制御を行なう音声合成方法及び装置に関する。
【0002】
【従来の技術】
従来より、所望の合成音声を得るための音声合成方法として、あらかじめ収録し蓄えられた音素片を複数の微細素片に分割し、分割の結果得られた複数の微細素片に対して間隔変更・繰り返し・間引き等の処理を行うことによって所望の時間長・基本周波数を持つ合成音を得る方法がある。
【0003】
図5は、音声波形を微細素片に分割する方法を模式的に示した図である。図5の(a)に示された音声波形は、図5の(b)に示されているような切り出し窓関数によって、図5の(c)に示されるような微細素片に分割される。このとき、有声音の部分(音声波形の後半部)では、原音声のピッチ間隔に同期した切り出し窓関数が用いられる。一方、無声音の部分では、適当な間隔の切り出し窓関数が用いられる。
【0004】
切り出し窓関数によって得られたこれらの微細素片を間引いて用いることにより、合成音声の継続時間長を短縮することができる。一方、これらの微細素片を繰り返して用いることにより、合成音声の継続時間長を伸長することができる。
【0005】
また、有声音の部分では、微細素片の間隔を詰めることにより合成音声の基本周波数を上げることが可能となる。一方、微細素片の間隔を広げることにより合成音声の基本周波数を下げることが可能となる。
【0006】
以上のような繰り返し・間引き・間隔変更の後、微細素片を再び重畳することにより、図5の(d)に示すような所望の合成音声が得られる。
【0007】
また、合成音声のパワー制御は、一般に次のように行なわれる。すなわち、目標となる音素の平均パワーp0が与えられた場合、上記手順によって得られた合成音声の平均パワーpを求め、上記手順によって得られた合成音声に√(p0/p)を乗ずることにより、所望の平均パワーを持つ合成音声が得られる。なお、パワーは、振幅の2乗値あるいは振幅の2乗値を適当な区間で積分した値として定義される。パワーが大きければ合成音の音量が大きくなり、小さければ音量が小さくなる。
【0008】
図6は、一般的な合成音声のパワー制御を説明する図である。図6の(a)〜(d)に示される音声波形、切り出し窓関数、微細素片、合成波形は、それぞれ図5の(a)〜(d)に対応する。図6の(e)では、図6の(d)で示される合成波形に、√(p0/p)を乗することにより得られた、パワー制御された合成音声を示している。
【0009】
【発明が解決しようとする課題】
しかしながら、上述のパワー制御方式では、無声音と有声音とが同じ倍率で拡大されることになり、無声音において雑音性の異音が顕著になる場合があり、合成音声の品質が劣化するという問題がある。
【0010】
本発明は上記の問題に鑑みてなされたものであり、合成音声の品質の劣化を低減したパワー制御を実現する音声合成方法及び装置を提供することを目的とする。
【0011】
【課題を解決するための手段】
上記の目的を達成するための本発明の一態様による音声合成方法はたとえば以下の工程を備える。すなわち、
あらかじめ登録された音素片を合成して合成音声を生成する音声合成方法であって、
合成音声の目標パワーに基づいて、有声部分の微細素片に対する第1振幅倍率と無声部分の微細素片に対する第2振幅倍率とを求める倍率獲得工程と、
合成すべき音素片より微細素片抽出する抽出工程と、
前記抽出工程において抽出された微細素片のうち、有声部分の微細素片に第1振幅変更倍率を乗じ、無声部分の微細素片に第2振幅変更倍率を乗ずる振幅変更工程と、
前記振幅変更工程によって処理された微細素片を用いて合成音声を得る合成工程とを備える。
【0012】
また、上記の目的を達成するための、本発明の音声合成装置はたとえば以下の構成を備える。すなわち、
あらかじめ登録された音素片を合成して合成音声を生成する音声合成装置であって、
合成音声の目標パワーに基づいて、有声部分の微細素片に対する第1振幅倍率と無声部分の微細素片に対する第2振幅倍率とを求める倍率獲得手段と、
合成すべき音素片より微細素片を抽出する抽出手段と、
前記抽出手段において抽出された微細素片のうち、有声部分の微細素片に第1振幅変更倍率を乗じ、無声部分の微細素片に第2振幅変更倍率を乗ずる振幅変更手段と、
前記振幅変更手段によって処理された微細素片を用いて合成音声を得る合成手段とを備える。
【0013】
【発明の実施の形態】
以下、添付の図面を参照して、本発明の好適な実施形態を説明する。
【0014】
[第1の実施形態]
図1は本発明の一実施形態におけるハードウェア構成を示すブロック図である。図1において、H1は数値演算・制御等の処理を行なう中央処理装置であり、以下で説明する手順に従って演算、処理を行なう。H2はRAM・ROM等を備えた記憶装置であり、以下で説明する手順や処理に必要な制御プログラムや一時的なデータが格納される。H3はディスク装置等からなる外部記憶装置であり、合成音の元となる音素片を登録した素片辞書が格納される。
【0015】
H4はスピーカ等の出力装置であり、合成された音声が出力される。ただし、本実施形態は他の装置の一部、或いはプログラムの一部として組み込まれることも可能であり、この場合には出力は他の装置・プログラムの入力に接続されるものとなる。H5はキーボード等の入力装置であり、音声合成の対象となる文章や合成音を制御するためのコマンドなどが入力される。ただし、本発明は他の装置・プログラムの一部として組み込まれることも可能であり、この場合には入力は他の装置・プログラムを通じて間接的に行われることになる。なお、他の装置としては、たとえば、カーナビや留守録電話機、或いは他の家電製品が含まれる。また、キーボード以外の入力としては、たとえば通信回線を通じて配送されてくるテキスト情報等がある。また、スピーカ以外の出力としては、電話回線等への出力や、MD等の録音装置への録音等が考えられる。また、H6はバスであり、上述した各構成を接続する。
【0016】
以上のハードウェア構成を踏まえて本発明の一実施形態による音声合成処理をを説明する。詳細な処理手順を説明する前に、本実施形態の処理概要を図4を参照して説明しておく。図4は本実施形態による音声合成処理におけるパワー制御の概要を説明する図である。本実施形態では、音素パワー目標値に基づいて無声音声部分の微細素片波形に対する振幅倍率sと有声音声の微細素片波形に対する振幅倍率rを決定し、各微細素片の振幅を変更した後に、微細素片の繰り返し・間引き・間隔変更処理を行なう。そして、微細素片を再び重畳することにより、図4の(d)に示すような、所望のパワーの合成音声を得る。
【0017】
図2は本発明の一実施形態を示すフローチャートである。以下、本フローチャートに即して説明を行う。
【0018】
まず、合成対象設定ステップS1において合成対象を設定する。本実施形態では、合成対象として音素(名),目標とする音素の平均パワーp0,継続時間長d,基本周波数の時系列f(t)を設定する。これらの値は、入力装置H5を介して直接入力されてもよいし、他のモジュールによって、入力文に対する言語解析結果や統計的な処理を用いて計算されてもよい。
【0019】
次に、音素片選択ステップS2において、合成対象の音素を合成する際のもととなる音素片Aを素片辞書から選択する。なお、音素片Aの最も基本となる選択基準は上述の音素名である。また、その他の選択基準として、たとえば、前後に接続される音素片(音素名でもよい)との接続の良さや、合成目標となる時間長・基本周波数・パワーに対する「近さ」等を基準にすることが可能である。次に、音素片パワー計算ステップS3において、音素片Aの平均パワーpを計算する。平均パワーは振幅の2乗の時間平均として計算される。ただし、音素片の平均パワーを予め計算してディスク等に記憶しておき、合成時にはパワーを計算する代わりに記録されたものを読み出すようにしてもよい。次に、振幅変更倍率計算ステップS4において、音素片の振幅を変更する際の、有声音に対する倍率rおよび無声音に対する倍率sを計算する。なお、振幅変更倍率計算ステップS4の過程の詳細については、図3を参照して後述する。
【0020】
次に、ループカウンタ初期化ステップS5においてループカウンタiを0に初期化する。
【0021】
次に、微細素片選択ステップS6において、音素片Aを構成する微細素片のうち、i番目の微細素片α(i)を選択する。微細素片α(i)は、図4の(a)に示されるような音素片に、図4の(b)で示されるような切り出し窓関数を乗ずることによって得られる。
【0022】
次に、有声/無声分岐ステップS7において、微細素片選択ステップS6で選択された微細素片α(i)が有声の素片か無声の素片かを判断し、素の判断結果によって処理を分岐する。ここで、α(i)が有声の時には振幅変更(有声)ステップS8に処理を移し、α(i)が無声の場合には振幅変更(無声)ステップS9に処理を移す。
【0023】
振幅変更(有声)ステップS8では、振幅変更倍率計算ステップS4において求めた振幅変更倍率rを用いて、微細素片α(i)の振幅をr倍し、ループカウンタ更新ステップS10に進む。一方、振幅変更(無声)ステップS9では、振幅変更倍率計算ステップS4において求めた振幅変更倍率sを用いて、微細素片α(i)の振幅をs倍し、ループカウンタ更新ステップS10に進む。
【0024】
ループカウンタ更新ステップS10では、ループカウンタiの値に1を加える。次に、終了判定ステップS11において、ループカウンタiが音素片Aに含まれる微細素片数に等しいか判定し、等しい場合には合成音生成ステップS12に処理を移し、等しくない場合には微細素片選択ステップS6に戻る。
【0025】
合成音生成ステップS12では、以上のようにしてr倍もしくはs倍された微細素片について、合成対象設定ステップS1において設定された基本周波数f(t)・継続時間長dに応じて波形変形や波形接続といった処理を行い、合成音を生成する。
【0026】
次に、上述した振幅変更倍率計算ステップS4の過程の詳細について説明する。図3は、振幅変更倍率計算ステップS4の過程を詳細に示したフローチャートである。
【0027】
まず、振幅変更倍率初期設定ステップS13において、振幅変更倍率rおよびsを√(p0/p)に設定する。次に、ステップS14において、有声音に対する振幅変更倍率rが、許容される上限値rmaxより大きいか判定する。この判定の結果、r>rmaxの場合にはクリッビング(有声音:上限)ステップS15に進み、r>rmaxでない場合はステップS16に進む。クリッピング(有声音:上限)ステップS15では、有声音に対する振幅変更倍率rを上限値rmaxに設定し、ステップS18に処理を移す。ステップS16では、有声音に対する振幅変更倍率rが許容される下限値rminより小さいか判定し、r<rminの場合にはクリッピング(有声音:下限)ステップS17に進み、r<rminでない場合はステップS18に進む。クリッピング(有声音:下限)ステップS17では、有声音に対する振幅変更倍率rを下限値rminに設定し、ステップS18に処理を移す。
【0028】
ステップS18において、無声音に対する振幅変更倍率sが許容される上限値smaxより大きいか判定し、s>smaxの場合にはクリッピング(無声音:上限)ステップS19に進み、s>smaxでない場合はステップS20に進む。クリッピング(無声音:上限)ステップS19では、無声音に対する振幅変更倍率sを上限値smaxに設定し、振幅変更倍率計算を終了する。ステップS20では、無声音に対する振幅変更倍率sが許容される下限値sminより小さいか判定し、s<sminの場合にはクリッビング(無声音:下限)ステップS21に進み、s<sminでない場合は振幅変更倍率計算を終了する。クリッピング(無声音:下限)ステップS21では、無声音に対する振幅変更倍率sを下限値sminに設定し、振幅変更倍率計算を終了する。
【0029】
以上説明したように、本実施形態によれば、設定されたパワーに応じた合成音声を得る際に、有声音声、無声音声のそれぞれに適応した振幅変更倍率で微細素片の振幅を変更するので、品質の良好な合成音声を得ることができる。特に、無声音声の振幅倍率を所定の大きさでクリッピングするので、無声音声部分の雑音性の異音が低減される。
なお、音声合成装置では、パワーの目標値自体が、何らかの方法で求められた推定値である場合がる。従って、このような場合の推定エラーによる異常値に対処するために、図3の処理では、常識的な倍率を外れないような上下のクリッピングを行なっている。また、有声、無声の判定は確実に行なえるものではなく、どちらとも言えない場合があるので、有声・無声の判定ミスにも対処できるようにするという意味でも有声音について上限値を設けてある。
【0030】
なお、上述の実施形態において、パワーの目標値pは1音素につき1つの値が設定されるものとした。しかし、音素をN個の区間に分割し、各区間に対するパワーの目標値pk(1≦k≦N)を設定することも可能である。この場合、N個に分割された各区間について、上述の処理を適用すればよい。すなわち、分割された各区間の音声波形を独立した音素とみなして上述の図2、図3の処理を適用すればよい。
【0031】
また、上記実施形態において、微細素片α(i)を得るための方法として音素片Aに窓関数を乗ずる方法を示したが、より複雑な信号処理によって微細素片を得ても良い。例えば、音素片Aを適当な区間でケプストラム分析し、得られたフィルタに対するインパルス応答波形を用いても良い。
【0032】
なお、本発明は、複数の機器(例えばホストコンピュータ,インタフェイス機器,リーダ,プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置に適用してもよい。
【0033】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【0034】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0035】
プログラムコードを供給するための記憶媒体としては、例えば、フロッピディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD−R,磁気テープ,不揮発性のメモリカード,ROMなどを用いることができる。
【0036】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0037】
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0038】
【発明の効果】
以上説明したように、本発明によれば、合成音声のパワーを制御する際に、有声音と無声音とで異なる振幅変更倍率を乗ずることが可能となり、無声音で雑音性の異音を生じさせない音声合成が可能となる。
【0039】
【図面の簡単な説明】
【図1】本発明の一実施形態におけるハードウェア構成を示すブロック図である。
【図2】本発明の一実施形態を示すフローチャートである。
【図3】振幅変更倍率計算ステップS4の過程を詳細に示したフローチャートである。
【図4】本実施形態による音声合成処理におけるパワー制御の概要を説明する図である。
【図5】音声波形を微細素片に分割する方法を模式的に示した図である。
【図6】一般的な合成音声のパワー制御を説明する図である。
Claims (11)
- あらかじめ登録された音素片を合成して合成音声を生成する音声合成方法であって、
合成音声の目標パワーに基づいて、有声部分の微細素片に対する第1振幅倍率と無声部分の微細素片に対する第2振幅倍率とを求める倍率獲得工程と、
合成すべき音素片より微細素片を抽出する抽出工程と、
前記抽出工程において抽出された微細素片のうち、有声部分の微細素片に第1振幅変更倍率を乗じ、無声部分の微細素片に第2振幅変更倍率を乗ずる振幅変更工程と、
前記振幅変更工程によって処理された微細素片を用いて合成音声を得る合成工程と
を備えることを特徴とする音声合成方法。 - 合成すべき音素片の平均パワーを求める平均パワー獲得工程を更に備え、
前記倍率獲得工程は、前記目標パワーと、前記平均パワー獲得工程によって得られた平均パワーとに基づいて、前記第1振幅倍率と第2振幅倍率を求める
ことを特徴とする請求項1に記載の音声合成方法。 - 前記倍率獲得工程は、前記目標パワーと前記平均パワーに基づいて有声部分の振幅倍率と無声部分の振幅倍率とを求め、該有声部分と無声部分のそれぞれの振幅倍率を有声部分と無声部分のそれぞれに設定された上限パワー値でクリッピングすることにより前記第1及び第2振幅倍率を得る
ことを特徴とする請求項1または2に記載の音声合成方法。 - 前記倍率獲得工程は、前記目標パワーと前記平均パワーに基づいて有声部分の振幅倍率と無声部分の振幅倍率とを求め、該有声部分と無声部分のそれぞれの振幅倍率を有声部分と無声部分のそれぞれに設定された下限パワー値でクリッピングすることにより前記第1及び第2振幅倍率を得る
ことを特徴とする請求項1乃至3のいずれかに記載の音声合成方法。 - 前記合成工程は、前記振幅変更工程によって処理された微細素片に対して、間引き、繰り返し、間隔変更の少なくともいずれかを施して、音素波形を合成する
ことを特徴とする請求項1に記載の音声合成方法。 - あらかじめ登録された音素片を合成して合成音声を生成する音声合成装置であって、
合成音声の目標パワーに基づいて、有声部分の微細素片に対する第1振幅倍率と無声部分の微細素片に対する第2振幅倍率とを求める倍率獲得手段と、
合成すべき音素片より微細素片を抽出する抽出手段と、
前記抽出手段において抽出された微細素片のうち、有声部分の微細素片に第1振幅変更倍率を乗じ、無声部分の微細素片に第2振幅変更倍率を乗ずる振幅変更手段と、
前記振幅変更手段によって処理された微細素片を用いて合成音声を得る合成手段と
を備えることを特徴とする音声合成装置。 - 合成すべき音素片の平均パワーを求める平均パワー獲得手段を更に備え、
前記倍率獲得手段は、前記目標パワーと、前記平均パワー獲得手段によって得られた平均パワーとに基づいて、前記第1振幅倍率と第2振幅倍率を求める
ことを特徴とする請求項6に記載の音声合成装置。 - 前記倍率獲得手段は、前記目標パワーと前記平均パワーに基づいて有声部分の振幅倍率と無声部分の振幅倍率とを求め、該有声部分と無声部分のそれぞれの振幅倍率を有声部分と無声部分のそれぞれに設定された上限パワー値でクリッピングすることにより前記第1及び第2振幅倍率を得る
ことを特徴とする請求項6または7に記載の音声合成装置。 - 前記倍率獲得手段は、前記目標パワーと前記平均パワーに基づいて有声部分の振幅倍率と無声部分の振幅倍率とを求め、該有声部分と無声部分のそれぞれの振幅倍率を有声部分と無声部分のそれぞれに設定された下限パワー値でクリッピングすることにより前記第1及び第2振幅倍率を得る
ことを特徴とする請求項6乃至8のいずれかに記載の音声合成装置。 - 前記合成手段は、前記振幅変更手段によって処理された微細素片に対して、間引き、繰り返し、間隔変更の少なくともいずれかを施して、音素波形を合成する
ことを特徴とする請求項6に記載の音声合成装置。 - コンピュータに、あらかじめ登録された音素片を合成して合成音声を生成する音声合成処理を行なわせるための制御プログラムを格納した記憶媒体であって、該制御プログラムが、
合成音声の目標パワーに基づいて、有声部分の微細素片に対する第1振幅倍率と無声部分の微細素片に対する第2振幅倍率とを求める倍率獲得工程のコードと、
合成すべき音素片より微細素片を抽出する抽出工程のコードと、
前記抽出工程において抽出された微細素片のうち、有声部分の微細素片に第1振幅変更倍率を乗じ、無声部分の微細素片に第2振幅変更倍率を乗ずる振幅変更工程のコードと、
前記振幅変更工程によって処理された微細素片を用いて合成音声を得る合成工程のコードとを備えることを特徴とする記憶媒体。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP24595098A JP3912913B2 (ja) | 1998-08-31 | 1998-08-31 | 音声合成方法及び装置 |
US09/386,049 US6993484B1 (en) | 1998-08-31 | 1999-08-30 | Speech synthesizing method and apparatus |
EP99306926A EP0984425B1 (en) | 1998-08-31 | 1999-08-31 | Speech synthesizing method and apparatus |
DE69908518T DE69908518T2 (de) | 1998-08-31 | 1999-08-31 | Verfahren und Vorrichtung zur Sprachsynthese |
US11/181,462 US7162417B2 (en) | 1998-08-31 | 2005-07-13 | Speech synthesizing method and apparatus for altering amplitudes of voiced and invoiced portions |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP24595098A JP3912913B2 (ja) | 1998-08-31 | 1998-08-31 | 音声合成方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000075879A JP2000075879A (ja) | 2000-03-14 |
JP3912913B2 true JP3912913B2 (ja) | 2007-05-09 |
Family
ID=17141275
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP24595098A Expired - Fee Related JP3912913B2 (ja) | 1998-08-31 | 1998-08-31 | 音声合成方法及び装置 |
Country Status (4)
Country | Link |
---|---|
US (2) | US6993484B1 (ja) |
EP (1) | EP0984425B1 (ja) |
JP (1) | JP3912913B2 (ja) |
DE (1) | DE69908518T2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3912913B2 (ja) * | 1998-08-31 | 2007-05-09 | キヤノン株式会社 | 音声合成方法及び装置 |
US7369994B1 (en) | 1999-04-30 | 2008-05-06 | At&T Corp. | Methods and apparatus for rapid acoustic unit selection from a large speech corpus |
US7546241B2 (en) | 2002-06-05 | 2009-06-09 | Canon Kabushiki Kaisha | Speech synthesis method and apparatus, and dictionary generation method and apparatus |
US20050096898A1 (en) * | 2003-10-29 | 2005-05-05 | Manoj Singhal | Classification of speech and music using sub-band energy |
WO2009023807A1 (en) * | 2007-08-15 | 2009-02-19 | Massachusetts Institute Of Technology | Speech processing apparatus and method employing feedback |
US20110029326A1 (en) * | 2009-07-28 | 2011-02-03 | General Electric Company, A New York Corporation | Interactive healthcare media devices and systems |
US20110029325A1 (en) * | 2009-07-28 | 2011-02-03 | General Electric Company, A New York Corporation | Methods and apparatus to enhance healthcare information analyses |
KR20170051856A (ko) * | 2015-11-02 | 2017-05-12 | 주식회사 아이티매직 | 사운드 신호에서 진단 신호를 추출하는 방법 및 진단 장치 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4071695A (en) * | 1976-08-12 | 1978-01-31 | Bell Telephone Laboratories, Incorporated | Speech signal amplitude equalizer |
US4128737A (en) | 1976-08-16 | 1978-12-05 | Federal Screw Works | Voice synthesizer |
JPS5853352B2 (ja) * | 1979-10-03 | 1983-11-29 | 日本電信電話株式会社 | 音声合成器 |
US4433210A (en) * | 1980-06-04 | 1984-02-21 | Federal Screw Works | Integrated circuit phoneme-based speech synthesizer |
ATE9415T1 (de) * | 1980-12-09 | 1984-09-15 | The Secretary Of State For Industry In Her Britannic Majesty's Government Of The United Kingdom Of Great Britain And | Spracherkennungssystem. |
US5091952A (en) * | 1988-11-10 | 1992-02-25 | Wisconsin Alumni Research Foundation | Feedback suppression in digital signal processing hearing aids |
JPH05158129A (ja) | 1991-10-09 | 1993-06-25 | Canon Inc | カメラ |
JPH0650890A (ja) | 1992-03-16 | 1994-02-25 | Agency Of Ind Science & Technol | 官能基推定方法 |
US5327520A (en) | 1992-06-04 | 1994-07-05 | At&T Bell Laboratories | Method of use of voice message coder/decoder |
JPH06222314A (ja) | 1993-01-26 | 1994-08-12 | Furukawa Electric Co Ltd:The | 光外部変調器 |
JP3089940B2 (ja) | 1993-03-24 | 2000-09-18 | 松下電器産業株式会社 | 音声合成装置 |
JPH0839981A (ja) | 1994-07-28 | 1996-02-13 | Pentel Kk | 合成樹脂製ペン先 |
JP3289511B2 (ja) | 1994-09-19 | 2002-06-10 | 株式会社明電舎 | 音声合成用音源データ作成方法 |
JPH08232388A (ja) | 1995-02-23 | 1996-09-10 | Yuichiro Tsukuda | 転倒防止用伸縮天井 |
US5978764A (en) * | 1995-03-07 | 1999-11-02 | British Telecommunications Public Limited Company | Speech synthesis |
WO1996032711A1 (en) * | 1995-04-12 | 1996-10-17 | British Telecommunications Public Limited Company | Waveform speech synthesis |
JPH08329845A (ja) | 1995-06-02 | 1996-12-13 | Oki Electric Ind Co Ltd | ガス放電パネル |
JP3257661B2 (ja) | 1995-06-19 | 2002-02-18 | 太平洋セメント株式会社 | 畳 |
GB9600774D0 (en) | 1996-01-15 | 1996-03-20 | British Telecomm | Waveform synthesis |
US5774836A (en) * | 1996-04-01 | 1998-06-30 | Advanced Micro Devices, Inc. | System and method for performing pitch estimation and error checking on low estimated pitch values in a correlation based pitch estimator |
SE509919C2 (sv) * | 1996-07-03 | 1999-03-22 | Telia Ab | Metod och anordning för syntetisering av tonlösa konsonanter |
JP3342310B2 (ja) | 1996-09-02 | 2002-11-05 | シャープ株式会社 | 音声復号化装置 |
JP3349905B2 (ja) | 1996-12-10 | 2002-11-25 | 松下電器産業株式会社 | 音声合成方法および装置 |
JP3954681B2 (ja) | 1997-02-20 | 2007-08-08 | リコー光学株式会社 | 液晶プロジェクター用の液晶デバイス及び液晶デバイス用の対向基板 |
JP3953582B2 (ja) | 1997-05-29 | 2007-08-08 | 大日本印刷株式会社 | 易開口包装袋及びその製造方法 |
JP3902860B2 (ja) * | 1998-03-09 | 2007-04-11 | キヤノン株式会社 | 音声合成制御装置及びその制御方法、コンピュータ可読メモリ |
JP3912913B2 (ja) * | 1998-08-31 | 2007-05-09 | キヤノン株式会社 | 音声合成方法及び装置 |
JP3728172B2 (ja) * | 2000-03-31 | 2005-12-21 | キヤノン株式会社 | 音声合成方法および装置 |
JP3728173B2 (ja) * | 2000-03-31 | 2005-12-21 | キヤノン株式会社 | 音声合成方法、装置および記憶媒体 |
-
1998
- 1998-08-31 JP JP24595098A patent/JP3912913B2/ja not_active Expired - Fee Related
-
1999
- 1999-08-30 US US09/386,049 patent/US6993484B1/en not_active Expired - Fee Related
- 1999-08-31 DE DE69908518T patent/DE69908518T2/de not_active Expired - Lifetime
- 1999-08-31 EP EP99306926A patent/EP0984425B1/en not_active Expired - Lifetime
-
2005
- 2005-07-13 US US11/181,462 patent/US7162417B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20050251392A1 (en) | 2005-11-10 |
US7162417B2 (en) | 2007-01-09 |
DE69908518T2 (de) | 2004-05-06 |
EP0984425A2 (en) | 2000-03-08 |
US6993484B1 (en) | 2006-01-31 |
EP0984425A3 (en) | 2001-03-21 |
DE69908518D1 (de) | 2003-07-10 |
EP0984425B1 (en) | 2003-06-04 |
JP2000075879A (ja) | 2000-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7054815B2 (en) | Speech synthesizing method and apparatus using prosody control | |
US6778962B1 (en) | Speech synthesis with prosodic model data and accent type | |
EP0140777B1 (en) | Process for encoding speech and an apparatus for carrying out the process | |
EP1643486B1 (en) | Method and apparatus for preventing speech comprehension by interactive voice response systems | |
US6266637B1 (en) | Phrase splicing and variable substitution using a trainable speech synthesizer | |
US8175881B2 (en) | Method and apparatus using fused formant parameters to generate synthesized speech | |
US6202049B1 (en) | Identification of unit overlap regions for concatenative speech synthesis system | |
JP4632384B2 (ja) | 音声情報処理装置及びその方法と記憶媒体 | |
JP4406440B2 (ja) | 音声合成装置、音声合成方法及びプログラム | |
JP2001282278A (ja) | 音声情報処理装置及びその方法と記憶媒体 | |
CN111128116B (zh) | 一种语音处理方法、装置、计算设备及存储介质 | |
US7249021B2 (en) | Simultaneous plural-voice text-to-speech synthesizer | |
US7162417B2 (en) | Speech synthesizing method and apparatus for altering amplitudes of voiced and invoiced portions | |
US6601030B2 (en) | Method and system for recorded word concatenation | |
US10079011B2 (en) | System and method for unit selection text-to-speech using a modified Viterbi approach | |
US6832192B2 (en) | Speech synthesizing method and apparatus | |
JP4454780B2 (ja) | 音声情報処理装置とその方法と記憶媒体 | |
EP1589524B1 (en) | Method and device for speech synthesis | |
JP2703253B2 (ja) | 音声合成装置 | |
EP1640968A1 (en) | Method and device for speech synthesis | |
JP2005241789A (ja) | 素片接続型音声合成装置及び方法、並びに音声素片データベースの作成方法 | |
JP2006133559A (ja) | 録音編集・テキスト音声合成併用型音声合成装置、録音編集・テキスト音声合成併用型音声合成プログラム、記録媒体 | |
JP2004053738A (ja) | 音声合成方法および装置並びに音声合成用辞書生成方法および装置 | |
JPH10254495A (ja) | 音声合成方法及び音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040618 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040628 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20040922 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041122 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20041201 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20050128 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070130 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100209 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110209 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120209 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130209 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140209 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |