JP3912913B2 - 音声合成方法及び装置 - Google Patents

音声合成方法及び装置 Download PDF

Info

Publication number
JP3912913B2
JP3912913B2 JP24595098A JP24595098A JP3912913B2 JP 3912913 B2 JP3912913 B2 JP 3912913B2 JP 24595098 A JP24595098 A JP 24595098A JP 24595098 A JP24595098 A JP 24595098A JP 3912913 B2 JP3912913 B2 JP 3912913B2
Authority
JP
Japan
Prior art keywords
amplitude
magnification
fine
speech
unvoiced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP24595098A
Other languages
English (en)
Other versions
JP2000075879A (ja
Inventor
雅章 山田
康弘 小森
充 大塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP24595098A priority Critical patent/JP3912913B2/ja
Priority to US09/386,049 priority patent/US6993484B1/en
Priority to EP99306926A priority patent/EP0984425B1/en
Priority to DE69908518T priority patent/DE69908518T2/de
Publication of JP2000075879A publication Critical patent/JP2000075879A/ja
Priority to US11/181,462 priority patent/US7162417B2/en
Application granted granted Critical
Publication of JP3912913B2 publication Critical patent/JP3912913B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules
    • G10L13/07Concatenation rules
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は音声合成方法及び装置に関し、特に、合成音声のパワー制御を行なう音声合成方法及び装置に関する。
【0002】
【従来の技術】
従来より、所望の合成音声を得るための音声合成方法として、あらかじめ収録し蓄えられた音素片を複数の微細素片に分割し、分割の結果得られた複数の微細素片に対して間隔変更・繰り返し・間引き等の処理を行うことによって所望の時間長・基本周波数を持つ合成音を得る方法がある。
【0003】
図5は、音声波形を微細素片に分割する方法を模式的に示した図である。図5の(a)に示された音声波形は、図5の(b)に示されているような切り出し窓関数によって、図5の(c)に示されるような微細素片に分割される。このとき、有声音の部分(音声波形の後半部)では、原音声のピッチ間隔に同期した切り出し窓関数が用いられる。一方、無声音の部分では、適当な間隔の切り出し窓関数が用いられる。
【0004】
切り出し窓関数によって得られたこれらの微細素片を間引いて用いることにより、合成音声の継続時間長を短縮することができる。一方、これらの微細素片を繰り返して用いることにより、合成音声の継続時間長を伸長することができる。
【0005】
また、有声音の部分では、微細素片の間隔を詰めることにより合成音声の基本周波数を上げることが可能となる。一方、微細素片の間隔を広げることにより合成音声の基本周波数を下げることが可能となる。
【0006】
以上のような繰り返し・間引き・間隔変更の後、微細素片を再び重畳することにより、図5の(d)に示すような所望の合成音声が得られる。
【0007】
また、合成音声のパワー制御は、一般に次のように行なわれる。すなわち、目標となる音素の平均パワーp0が与えられた場合、上記手順によって得られた合成音声の平均パワーpを求め、上記手順によって得られた合成音声に√(p0/p)を乗ずることにより、所望の平均パワーを持つ合成音声が得られる。なお、パワーは、振幅の2乗値あるいは振幅の2乗値を適当な区間で積分した値として定義される。パワーが大きければ合成音の音量が大きくなり、小さければ音量が小さくなる。
【0008】
図6は、一般的な合成音声のパワー制御を説明する図である。図6の(a)〜(d)に示される音声波形、切り出し窓関数、微細素片、合成波形は、それぞれ図5の(a)〜(d)に対応する。図6の(e)では、図6の(d)で示される合成波形に、√(p0/p)を乗することにより得られた、パワー制御された合成音声を示している。
【0009】
【発明が解決しようとする課題】
しかしながら、上述のパワー制御方式では、無声音と有声音とが同じ倍率で拡大されることになり、無声音において雑音性の異音が顕著になる場合があり、合成音声の品質が劣化するという問題がある。
【0010】
本発明は上記の問題に鑑みてなされたものであり、合成音声の品質の劣化を低減したパワー制御を実現する音声合成方法及び装置を提供することを目的とする。
【0011】
【課題を解決するための手段】
上記の目的を達成するための本発明の一態様による音声合成方法はたとえば以下の工程を備える。すなわち、
あらかじめ登録された音素片を合成して合成音声を生成する音声合成方法であって、
合成音声の目標パワーに基づいて、有声部分の微細素片に対する第1振幅倍率と無声部分の微細素片に対する第2振幅倍率とを求める倍率獲得工程と、
合成すべき音素片より微細素片抽出する抽出工程と、
前記抽出工程において抽出された微細素片のうち、有声部分の微細素片に第1振幅変更倍率を乗じ、無声部分の微細素片に第2振幅変更倍率を乗ずる振幅変更工程と、
前記振幅変更工程によって処理された微細素片を用いて合成音声を得る合成工程とを備える。
【0012】
また、上記の目的を達成するための、本発明の音声合成装置はたとえば以下の構成を備える。すなわち、
あらかじめ登録された音素片を合成して合成音声を生成する音声合成装置であって、
合成音声の目標パワーに基づいて、有声部分の微細素片に対する第1振幅倍率と無声部分の微細素片に対する第2振幅倍率とを求める倍率獲得手段と、
合成すべき音素片より微細素片を抽出する抽出手段と、
前記抽出手段において抽出された微細素片のうち、有声部分の微細素片に第1振幅変更倍率を乗じ、無声部分の微細素片に第2振幅変更倍率を乗ずる振幅変更手段と、
前記振幅変更手段によって処理された微細素片を用いて合成音声を得る合成手段とを備える。
【0013】
【発明の実施の形態】
以下、添付の図面を参照して、本発明の好適な実施形態を説明する。
【0014】
[第1の実施形態]
図1は本発明の一実施形態におけるハードウェア構成を示すブロック図である。図1において、H1は数値演算・制御等の処理を行なう中央処理装置であり、以下で説明する手順に従って演算、処理を行なう。H2はRAM・ROM等を備えた記憶装置であり、以下で説明する手順や処理に必要な制御プログラムや一時的なデータが格納される。H3はディスク装置等からなる外部記憶装置であり、合成音の元となる音素片を登録した素片辞書が格納される。
【0015】
H4はスピーカ等の出力装置であり、合成された音声が出力される。ただし、本実施形態は他の装置の一部、或いはプログラムの一部として組み込まれることも可能であり、この場合には出力は他の装置・プログラムの入力に接続されるものとなる。H5はキーボード等の入力装置であり、音声合成の対象となる文章や合成音を制御するためのコマンドなどが入力される。ただし、本発明は他の装置・プログラムの一部として組み込まれることも可能であり、この場合には入力は他の装置・プログラムを通じて間接的に行われることになる。なお、他の装置としては、たとえば、カーナビや留守録電話機、或いは他の家電製品が含まれる。また、キーボード以外の入力としては、たとえば通信回線を通じて配送されてくるテキスト情報等がある。また、スピーカ以外の出力としては、電話回線等への出力や、MD等の録音装置への録音等が考えられる。また、H6はバスであり、上述した各構成を接続する。
【0016】
以上のハードウェア構成を踏まえて本発明の一実施形態による音声合成処理をを説明する。詳細な処理手順を説明する前に、本実施形態の処理概要を図4を参照して説明しておく。図4は本実施形態による音声合成処理におけるパワー制御の概要を説明する図である。本実施形態では、音素パワー目標値に基づいて無声音声部分の微細素片波形に対する振幅倍率sと有声音声の微細素片波形に対する振幅倍率rを決定し、各微細素片の振幅を変更した後に、微細素片の繰り返し・間引き・間隔変更処理を行なう。そして、微細素片を再び重畳することにより、図4の(d)に示すような、所望のパワーの合成音声を得る。
【0017】
図2は本発明の一実施形態を示すフローチャートである。以下、本フローチャートに即して説明を行う。
【0018】
まず、合成対象設定ステップS1において合成対象を設定する。本実施形態では、合成対象として音素(名),目標とする音素の平均パワーp0,継続時間長d,基本周波数の時系列f(t)を設定する。これらの値は、入力装置H5を介して直接入力されてもよいし、他のモジュールによって、入力文に対する言語解析結果や統計的な処理を用いて計算されてもよい。
【0019】
次に、音素片選択ステップS2において、合成対象の音素を合成する際のもととなる音素片Aを素片辞書から選択する。なお、音素片Aの最も基本となる選択基準は上述の音素名である。また、その他の選択基準として、たとえば、前後に接続される音素片(音素名でもよい)との接続の良さや、合成目標となる時間長・基本周波数・パワーに対する「近さ」等を基準にすることが可能である。次に、音素片パワー計算ステップS3において、音素片Aの平均パワーpを計算する。平均パワーは振幅の2乗の時間平均として計算される。ただし、音素片の平均パワーを予め計算してディスク等に記憶しておき、合成時にはパワーを計算する代わりに記録されたものを読み出すようにしてもよい。次に、振幅変更倍率計算ステップS4において、音素片の振幅を変更する際の、有声音に対する倍率rおよび無声音に対する倍率sを計算する。なお、振幅変更倍率計算ステップS4の過程の詳細については、図3を参照して後述する。
【0020】
次に、ループカウンタ初期化ステップS5においてループカウンタiを0に初期化する。
【0021】
次に、微細素片選択ステップS6において、音素片Aを構成する微細素片のうち、i番目の微細素片α(i)を選択する。微細素片α(i)は、図4の(a)に示されるような音素片に、図4の(b)で示されるような切り出し窓関数を乗ずることによって得られる。
【0022】
次に、有声/無声分岐ステップS7において、微細素片選択ステップS6で選択された微細素片α(i)が有声の素片か無声の素片かを判断し、素の判断結果によって処理を分岐する。ここで、α(i)が有声の時には振幅変更(有声)ステップS8に処理を移し、α(i)が無声の場合には振幅変更(無声)ステップS9に処理を移す。
【0023】
振幅変更(有声)ステップS8では、振幅変更倍率計算ステップS4において求めた振幅変更倍率rを用いて、微細素片α(i)の振幅をr倍し、ループカウンタ更新ステップS10に進む。一方、振幅変更(無声)ステップS9では、振幅変更倍率計算ステップS4において求めた振幅変更倍率sを用いて、微細素片α(i)の振幅をs倍し、ループカウンタ更新ステップS10に進む。
【0024】
ループカウンタ更新ステップS10では、ループカウンタiの値に1を加える。次に、終了判定ステップS11において、ループカウンタiが音素片Aに含まれる微細素片数に等しいか判定し、等しい場合には合成音生成ステップS12に処理を移し、等しくない場合には微細素片選択ステップS6に戻る。
【0025】
合成音生成ステップS12では、以上のようにしてr倍もしくはs倍された微細素片について、合成対象設定ステップS1において設定された基本周波数f(t)・継続時間長dに応じて波形変形や波形接続といった処理を行い、合成音を生成する。
【0026】
次に、上述した振幅変更倍率計算ステップS4の過程の詳細について説明する。図3は、振幅変更倍率計算ステップS4の過程を詳細に示したフローチャートである。
【0027】
まず、振幅変更倍率初期設定ステップS13において、振幅変更倍率rおよびsを√(p0/p)に設定する。次に、ステップS14において、有声音に対する振幅変更倍率rが、許容される上限値rmaxより大きいか判定する。この判定の結果、r>rmaxの場合にはクリッビング(有声音:上限)ステップS15に進み、r>rmaxでない場合はステップS16に進む。クリッピング(有声音:上限)ステップS15では、有声音に対する振幅変更倍率rを上限値rmaxに設定し、ステップS18に処理を移す。ステップS16では、有声音に対する振幅変更倍率rが許容される下限値rminより小さいか判定し、r<rminの場合にはクリッピング(有声音:下限)ステップS17に進み、r<rminでない場合はステップS18に進む。クリッピング(有声音:下限)ステップS17では、有声音に対する振幅変更倍率rを下限値rminに設定し、ステップS18に処理を移す。
【0028】
ステップS18において、無声音に対する振幅変更倍率sが許容される上限値smaxより大きいか判定し、s>smaxの場合にはクリッピング(無声音:上限)ステップS19に進み、s>smaxでない場合はステップS20に進む。クリッピング(無声音:上限)ステップS19では、無声音に対する振幅変更倍率sを上限値smaxに設定し、振幅変更倍率計算を終了する。ステップS20では、無声音に対する振幅変更倍率sが許容される下限値sminより小さいか判定し、s<sminの場合にはクリッビング(無声音:下限)ステップS21に進み、s<sminでない場合は振幅変更倍率計算を終了する。クリッピング(無声音:下限)ステップS21では、無声音に対する振幅変更倍率sを下限値sminに設定し、振幅変更倍率計算を終了する。
【0029】
以上説明したように、本実施形態によれば、設定されたパワーに応じた合成音声を得る際に、有声音声、無声音声のそれぞれに適応した振幅変更倍率で微細素片の振幅を変更するので、品質の良好な合成音声を得ることができる。特に、無声音声の振幅倍率を所定の大きさでクリッピングするので、無声音声部分の雑音性の異音が低減される。
なお、音声合成装置では、パワーの目標値自体が、何らかの方法で求められた推定値である場合がる。従って、このような場合の推定エラーによる異常値に対処するために、図3の処理では、常識的な倍率を外れないような上下のクリッピングを行なっている。また、有声、無声の判定は確実に行なえるものではなく、どちらとも言えない場合があるので、有声・無声の判定ミスにも対処できるようにするという意味でも有声音について上限値を設けてある。
【0030】
なお、上述の実施形態において、パワーの目標値pは1音素につき1つの値が設定されるものとした。しかし、音素をN個の区間に分割し、各区間に対するパワーの目標値pk(1≦k≦N)を設定することも可能である。この場合、N個に分割された各区間について、上述の処理を適用すればよい。すなわち、分割された各区間の音声波形を独立した音素とみなして上述の図2、図3の処理を適用すればよい。
【0031】
また、上記実施形態において、微細素片α(i)を得るための方法として音素片Aに窓関数を乗ずる方法を示したが、より複雑な信号処理によって微細素片を得ても良い。例えば、音素片Aを適当な区間でケプストラム分析し、得られたフィルタに対するインパルス応答波形を用いても良い。
【0032】
なお、本発明は、複数の機器(例えばホストコンピュータ,インタフェイス機器,リーダ,プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置に適用してもよい。
【0033】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【0034】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0035】
プログラムコードを供給するための記憶媒体としては、例えば、フロッピディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD−R,磁気テープ,不揮発性のメモリカード,ROMなどを用いることができる。
【0036】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0037】
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0038】
【発明の効果】
以上説明したように、本発明によれば、合成音声のパワーを制御する際に、有声音と無声音とで異なる振幅変更倍率を乗ずることが可能となり、無声音で雑音性の異音を生じさせない音声合成が可能となる。
【0039】
【図面の簡単な説明】
【図1】本発明の一実施形態におけるハードウェア構成を示すブロック図である。
【図2】本発明の一実施形態を示すフローチャートである。
【図3】振幅変更倍率計算ステップS4の過程を詳細に示したフローチャートである。
【図4】本実施形態による音声合成処理におけるパワー制御の概要を説明する図である。
【図5】音声波形を微細素片に分割する方法を模式的に示した図である。
【図6】一般的な合成音声のパワー制御を説明する図である。

Claims (11)

  1. あらかじめ登録された音素片を合成して合成音声を生成する音声合成方法であって、
    合成音声の目標パワーに基づいて、有声部分の微細素片に対する第1振幅倍率と無声部分の微細素片に対する第2振幅倍率とを求める倍率獲得工程と、
    合成すべき音素片より微細素片を抽出する抽出工程と、
    前記抽出工程において抽出された微細素片のうち、有声部分の微細素片に第1振幅変更倍率を乗じ、無声部分の微細素片に第2振幅変更倍率を乗ずる振幅変更工程と、
    前記振幅変更工程によって処理された微細素片を用いて合成音声を得る合成工程と
    を備えることを特徴とする音声合成方法。
  2. 合成すべき音素片の平均パワーを求める平均パワー獲得工程を更に備え、
    前記倍率獲得工程は、前記目標パワーと、前記平均パワー獲得工程によって得られた平均パワーとに基づいて、前記第1振幅倍率と第2振幅倍率を求める
    ことを特徴とする請求項1に記載の音声合成方法。
  3. 前記倍率獲得工程は、前記目標パワーと前記平均パワーに基づいて有声部分の振幅倍率と無声部分の振幅倍率とを求め、該有声部分と無声部分のそれぞれの振幅倍率を有声部分と無声部分のそれぞれに設定された上限パワー値でクリッピングすることにより前記第1及び第2振幅倍率を得る
    ことを特徴とする請求項1または2に記載の音声合成方法。
  4. 前記倍率獲得工程は、前記目標パワーと前記平均パワーに基づいて有声部分の振幅倍率と無声部分の振幅倍率とを求め、該有声部分と無声部分のそれぞれの振幅倍率を有声部分と無声部分のそれぞれに設定された下限パワー値でクリッピングすることにより前記第1及び第2振幅倍率を得る
    ことを特徴とする請求項1乃至3のいずれかに記載の音声合成方法。
  5. 前記合成工程は、前記振幅変更工程によって処理された微細素片に対して、間引き、繰り返し、間隔変更の少なくともいずれかを施して、音素波形を合成する
    ことを特徴とする請求項1に記載の音声合成方法。
  6. あらかじめ登録された音素片を合成して合成音声を生成する音声合成装置であって、
    合成音声の目標パワーに基づいて、有声部分の微細素片に対する第1振幅倍率と無声部分の微細素片に対する第2振幅倍率とを求める倍率獲得手段と、
    合成すべき音素片より微細素片を抽出する抽出手段と、
    前記抽出手段において抽出された微細素片のうち、有声部分の微細素片に第1振幅変更倍率を乗じ、無声部分の微細素片に第2振幅変更倍率を乗ずる振幅変更手段と、
    前記振幅変更手段によって処理された微細素片を用いて合成音声を得る合成手段と
    を備えることを特徴とする音声合成装置。
  7. 合成すべき音素片の平均パワーを求める平均パワー獲得手段を更に備え、
    前記倍率獲得手段は、前記目標パワーと、前記平均パワー獲得手段によって得られた平均パワーとに基づいて、前記第1振幅倍率と第2振幅倍率を求める
    ことを特徴とする請求項6に記載の音声合成装置。
  8. 前記倍率獲得手段は、前記目標パワーと前記平均パワーに基づいて有声部分の振幅倍率と無声部分の振幅倍率とを求め、該有声部分と無声部分のそれぞれの振幅倍率を有声部分と無声部分のそれぞれに設定された上限パワー値でクリッピングすることにより前記第1及び第2振幅倍率を得る
    ことを特徴とする請求項6または7に記載の音声合成装置。
  9. 前記倍率獲得手段は、前記目標パワーと前記平均パワーに基づいて有声部分の振幅倍率と無声部分の振幅倍率とを求め、該有声部分と無声部分のそれぞれの振幅倍率を有声部分と無声部分のそれぞれに設定された下限パワー値でクリッピングすることにより前記第1及び第2振幅倍率を得る
    ことを特徴とする請求項6乃至8のいずれかに記載の音声合成装置。
  10. 前記合成手段は、前記振幅変更手段によって処理された微細素片に対して、間引き、繰り返し、間隔変更の少なくともいずれかを施して、音素波形を合成する
    ことを特徴とする請求項6に記載の音声合成装置。
  11. コンピュータに、あらかじめ登録された音素片を合成して合成音声を生成する音声合成処理を行なわせるための制御プログラムを格納した記憶媒体であって、該制御プログラムが、
    合成音声の目標パワーに基づいて、有声部分の微細素片に対する第1振幅倍率と無声部分の微細素片に対する第2振幅倍率とを求める倍率獲得工程のコードと、
    合成すべき音素片より微細素片を抽出する抽出工程のコードと、
    前記抽出工程において抽出された微細素片のうち、有声部分の微細素片に第1振幅変更倍率を乗じ、無声部分の微細素片に第2振幅変更倍率を乗ずる振幅変更工程のコードと、
    前記振幅変更工程によって処理された微細素片を用いて合成音声を得る合成工程のコードとを備えることを特徴とする記憶媒体
JP24595098A 1998-08-31 1998-08-31 音声合成方法及び装置 Expired - Fee Related JP3912913B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP24595098A JP3912913B2 (ja) 1998-08-31 1998-08-31 音声合成方法及び装置
US09/386,049 US6993484B1 (en) 1998-08-31 1999-08-30 Speech synthesizing method and apparatus
EP99306926A EP0984425B1 (en) 1998-08-31 1999-08-31 Speech synthesizing method and apparatus
DE69908518T DE69908518T2 (de) 1998-08-31 1999-08-31 Verfahren und Vorrichtung zur Sprachsynthese
US11/181,462 US7162417B2 (en) 1998-08-31 2005-07-13 Speech synthesizing method and apparatus for altering amplitudes of voiced and invoiced portions

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24595098A JP3912913B2 (ja) 1998-08-31 1998-08-31 音声合成方法及び装置

Publications (2)

Publication Number Publication Date
JP2000075879A JP2000075879A (ja) 2000-03-14
JP3912913B2 true JP3912913B2 (ja) 2007-05-09

Family

ID=17141275

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24595098A Expired - Fee Related JP3912913B2 (ja) 1998-08-31 1998-08-31 音声合成方法及び装置

Country Status (4)

Country Link
US (2) US6993484B1 (ja)
EP (1) EP0984425B1 (ja)
JP (1) JP3912913B2 (ja)
DE (1) DE69908518T2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3912913B2 (ja) * 1998-08-31 2007-05-09 キヤノン株式会社 音声合成方法及び装置
US7369994B1 (en) 1999-04-30 2008-05-06 At&T Corp. Methods and apparatus for rapid acoustic unit selection from a large speech corpus
US7546241B2 (en) 2002-06-05 2009-06-09 Canon Kabushiki Kaisha Speech synthesis method and apparatus, and dictionary generation method and apparatus
US20050096898A1 (en) * 2003-10-29 2005-05-05 Manoj Singhal Classification of speech and music using sub-band energy
WO2009023807A1 (en) * 2007-08-15 2009-02-19 Massachusetts Institute Of Technology Speech processing apparatus and method employing feedback
US20110029326A1 (en) * 2009-07-28 2011-02-03 General Electric Company, A New York Corporation Interactive healthcare media devices and systems
US20110029325A1 (en) * 2009-07-28 2011-02-03 General Electric Company, A New York Corporation Methods and apparatus to enhance healthcare information analyses
KR20170051856A (ko) * 2015-11-02 2017-05-12 주식회사 아이티매직 사운드 신호에서 진단 신호를 추출하는 방법 및 진단 장치

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4071695A (en) * 1976-08-12 1978-01-31 Bell Telephone Laboratories, Incorporated Speech signal amplitude equalizer
US4128737A (en) 1976-08-16 1978-12-05 Federal Screw Works Voice synthesizer
JPS5853352B2 (ja) * 1979-10-03 1983-11-29 日本電信電話株式会社 音声合成器
US4433210A (en) * 1980-06-04 1984-02-21 Federal Screw Works Integrated circuit phoneme-based speech synthesizer
ATE9415T1 (de) * 1980-12-09 1984-09-15 The Secretary Of State For Industry In Her Britannic Majesty's Government Of The United Kingdom Of Great Britain And Spracherkennungssystem.
US5091952A (en) * 1988-11-10 1992-02-25 Wisconsin Alumni Research Foundation Feedback suppression in digital signal processing hearing aids
JPH05158129A (ja) 1991-10-09 1993-06-25 Canon Inc カメラ
JPH0650890A (ja) 1992-03-16 1994-02-25 Agency Of Ind Science & Technol 官能基推定方法
US5327520A (en) 1992-06-04 1994-07-05 At&T Bell Laboratories Method of use of voice message coder/decoder
JPH06222314A (ja) 1993-01-26 1994-08-12 Furukawa Electric Co Ltd:The 光外部変調器
JP3089940B2 (ja) 1993-03-24 2000-09-18 松下電器産業株式会社 音声合成装置
JPH0839981A (ja) 1994-07-28 1996-02-13 Pentel Kk 合成樹脂製ペン先
JP3289511B2 (ja) 1994-09-19 2002-06-10 株式会社明電舎 音声合成用音源データ作成方法
JPH08232388A (ja) 1995-02-23 1996-09-10 Yuichiro Tsukuda 転倒防止用伸縮天井
US5978764A (en) * 1995-03-07 1999-11-02 British Telecommunications Public Limited Company Speech synthesis
WO1996032711A1 (en) * 1995-04-12 1996-10-17 British Telecommunications Public Limited Company Waveform speech synthesis
JPH08329845A (ja) 1995-06-02 1996-12-13 Oki Electric Ind Co Ltd ガス放電パネル
JP3257661B2 (ja) 1995-06-19 2002-02-18 太平洋セメント株式会社
GB9600774D0 (en) 1996-01-15 1996-03-20 British Telecomm Waveform synthesis
US5774836A (en) * 1996-04-01 1998-06-30 Advanced Micro Devices, Inc. System and method for performing pitch estimation and error checking on low estimated pitch values in a correlation based pitch estimator
SE509919C2 (sv) * 1996-07-03 1999-03-22 Telia Ab Metod och anordning för syntetisering av tonlösa konsonanter
JP3342310B2 (ja) 1996-09-02 2002-11-05 シャープ株式会社 音声復号化装置
JP3349905B2 (ja) 1996-12-10 2002-11-25 松下電器産業株式会社 音声合成方法および装置
JP3954681B2 (ja) 1997-02-20 2007-08-08 リコー光学株式会社 液晶プロジェクター用の液晶デバイス及び液晶デバイス用の対向基板
JP3953582B2 (ja) 1997-05-29 2007-08-08 大日本印刷株式会社 易開口包装袋及びその製造方法
JP3902860B2 (ja) * 1998-03-09 2007-04-11 キヤノン株式会社 音声合成制御装置及びその制御方法、コンピュータ可読メモリ
JP3912913B2 (ja) * 1998-08-31 2007-05-09 キヤノン株式会社 音声合成方法及び装置
JP3728172B2 (ja) * 2000-03-31 2005-12-21 キヤノン株式会社 音声合成方法および装置
JP3728173B2 (ja) * 2000-03-31 2005-12-21 キヤノン株式会社 音声合成方法、装置および記憶媒体

Also Published As

Publication number Publication date
US20050251392A1 (en) 2005-11-10
US7162417B2 (en) 2007-01-09
DE69908518T2 (de) 2004-05-06
EP0984425A2 (en) 2000-03-08
US6993484B1 (en) 2006-01-31
EP0984425A3 (en) 2001-03-21
DE69908518D1 (de) 2003-07-10
EP0984425B1 (en) 2003-06-04
JP2000075879A (ja) 2000-03-14

Similar Documents

Publication Publication Date Title
US7054815B2 (en) Speech synthesizing method and apparatus using prosody control
US6778962B1 (en) Speech synthesis with prosodic model data and accent type
EP0140777B1 (en) Process for encoding speech and an apparatus for carrying out the process
EP1643486B1 (en) Method and apparatus for preventing speech comprehension by interactive voice response systems
US6266637B1 (en) Phrase splicing and variable substitution using a trainable speech synthesizer
US8175881B2 (en) Method and apparatus using fused formant parameters to generate synthesized speech
US6202049B1 (en) Identification of unit overlap regions for concatenative speech synthesis system
JP4632384B2 (ja) 音声情報処理装置及びその方法と記憶媒体
JP4406440B2 (ja) 音声合成装置、音声合成方法及びプログラム
JP2001282278A (ja) 音声情報処理装置及びその方法と記憶媒体
CN111128116B (zh) 一种语音处理方法、装置、计算设备及存储介质
US7249021B2 (en) Simultaneous plural-voice text-to-speech synthesizer
US7162417B2 (en) Speech synthesizing method and apparatus for altering amplitudes of voiced and invoiced portions
US6601030B2 (en) Method and system for recorded word concatenation
US10079011B2 (en) System and method for unit selection text-to-speech using a modified Viterbi approach
US6832192B2 (en) Speech synthesizing method and apparatus
JP4454780B2 (ja) 音声情報処理装置とその方法と記憶媒体
EP1589524B1 (en) Method and device for speech synthesis
JP2703253B2 (ja) 音声合成装置
EP1640968A1 (en) Method and device for speech synthesis
JP2005241789A (ja) 素片接続型音声合成装置及び方法、並びに音声素片データベースの作成方法
JP2006133559A (ja) 録音編集・テキスト音声合成併用型音声合成装置、録音編集・テキスト音声合成併用型音声合成プログラム、記録媒体
JP2004053738A (ja) 音声合成方法および装置並びに音声合成用辞書生成方法および装置
JPH10254495A (ja) 音声合成方法及び音声合成装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040618

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040628

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040922

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041122

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20041201

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20050128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070130

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100209

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110209

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120209

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130209

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140209

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees