JP2001034282A - 音声合成方法、音声合成のための辞書構築方法、音声合成装置、並びに音声合成プログラムを記録したコンピュータ読み取り可能な媒体 - Google Patents

音声合成方法、音声合成のための辞書構築方法、音声合成装置、並びに音声合成プログラムを記録したコンピュータ読み取り可能な媒体

Info

Publication number
JP2001034282A
JP2001034282A JP11205945A JP20594599A JP2001034282A JP 2001034282 A JP2001034282 A JP 2001034282A JP 11205945 A JP11205945 A JP 11205945A JP 20594599 A JP20594599 A JP 20594599A JP 2001034282 A JP2001034282 A JP 2001034282A
Authority
JP
Japan
Prior art keywords
dictionary
word
prosody
waveform
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11205945A
Other languages
English (en)
Inventor
Osamu Kasai
治 笠井
Toshiyuki Mizoguchi
稔幸 溝口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KCE Tokyo Inc
Konami Group Corp
Original Assignee
Konami Corp
KCE Tokyo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konami Corp, KCE Tokyo Inc filed Critical Konami Corp
Priority to JP11205945A priority Critical patent/JP2001034282A/ja
Priority to TW089113028A priority patent/TW523734B/zh
Priority to EP00115589A priority patent/EP1071073A3/en
Priority to KR10-2000-0041301A priority patent/KR100522889B1/ko
Priority to CN00120198A priority patent/CN1117344C/zh
Priority to US09/621,544 priority patent/US6826530B1/en
Publication of JP2001034282A publication Critical patent/JP2001034282A/ja
Priority to HK01104509A priority patent/HK1034129A1/xx
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • G10L13/047Architecture of speech synthesisers
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F2300/00Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
    • A63F2300/60Methods for processing data by generating or executing the game program
    • A63F2300/6063Methods for processing data by generating or executing the game program for sound processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 ビデオゲーム等に用いて好適な音声合成方
法、音声合成のための辞書構築方法、音声合成装置、並
びに音声合成プログラムを記録したコンピュータ読み取
り可能な媒体を提供すること。 【解決手段】 発話者または発話時の感情・状況または
発話内容のうちの少なくとも1つが異なる音声合成処理
の単位(タスク)を複数設定し(s1)、各タスクに対
応した単語辞書、韻律辞書及び波形辞書を構築し(s
2)、ゲームシステム等より合成すべき文字列がタスク
の指定とともに入力された際、該指定されたタスクの単
語辞書、韻律辞書及び波形辞書を用いて音声合成処理す
る(s3)ことにより、発話者の個性や発話時の感情・
状況、発話内容を反映した音声メッセージを作成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ビデオゲーム等に
用いて好適な音声合成方法、音声合成のための辞書構築
方法、音声合成装置、並びに音声合成プログラムを記録
したコンピュータ読み取り可能な媒体に関するものであ
る。
【0002】
【従来の技術】近年、電話による時報案内、銀行のAT
Mにおける音声ガイダンス等のように音声メッセージ
(人間が話す言葉)を繰り返し出力する必要のあるサー
ビスの普及や、各種の電気製品等のマン・マシン・イン
ターフェースの向上要求に伴って、機械から音声メッセ
ージを出力させようとするニーズが増加している。
【0003】従来の音声メッセージを出力する方法とし
ては、予め決められたセリフや文章を生身の人間に発声
させ、これを収録して記憶装置に記録しておき、必要な
場面でそのまま再生して出力する方法(以下、記録再生
方法と呼ぶ。)や、音声メッセージを構成する様々な語
に対応する音声データを記憶させておき、任意に入力さ
れた文字列(テキスト)に従って前記音声データを組み
合わせて出力する方法、いわゆる音声合成方法があっ
た。
【0004】前述した記録再生方法では、品質の高い音
声メッセージを出力できる反面、決められたセリフや文
章以外の音声メッセージを出力することはできず、ま
た、出力しようとするセリフや文章の数に比例した容量
の記憶装置が必要となってしまうという問題があった。
【0005】一方、音声合成方法では、任意に入力され
た文字列、即ち任意の言葉に対応した音声メッセージを
出力することができ、また、必要な記憶容量も記録再生
方法に比べて少なくて済むが、文字列によっては不自然
さの残る音声メッセージになるという問題があった。
【0006】
【発明が解決しようとする課題】ところで、近年のビデ
オゲームでは、ゲーム機本体の性能向上や記録媒体の容
量増加に伴い、BGMや効果音とともにゲームに登場す
るキャラクタによる音声メッセージの出力を可能とした
ものが増えつつある。
【0007】この際、ビデオゲームのようなエンタテイ
メント性(娯楽性)の高いものでは、ゲームキャラクタ
毎に声質の異なる音声メッセージを出力し、また、発話
時の感情・状況を反映した音声メッセージを出力したい
という要望が強く、さらに、プレイヤーが任意に入力・
設定したプレイヤーキャラクタの名前(呼び方)をゲー
ムキャラクタから発声させたいという要望も出てきてい
る。
【0008】このような要望にかなった音声メッセージ
の出力を前述した記録再生方法で実現しようとすると、
特にプレイヤーが任意に入力・設定するプレイヤーキャ
ラクタの名前(呼び方)のような数千から数万にも及ぶ
ような言葉の全てについて音声を収録し再生することに
なり、収録に要する時間や費用、必要な記憶装置の容量
を考慮すると事実上不可能であった。
【0009】一方、音声合成方法では、任意に入力・設
定したプレイヤーキャラクタの名前を発声させることは
比較的容易であるが、従来の音声合成方法は明瞭で自然
な音声メッセージの作成のみを目標としていたため、発
話者の個性、発話時の感情や状況に応じた音声メッセー
ジを合成するようなこと、即ちゲームキャラクタ毎に声
質の異なる音声メッセージを出力させたり、ゲームキャ
ラクタの感情・状況を反映した音声メッセージを出力さ
せたりすることは全くできなかった。
【0010】本発明の目的は、ビデオゲームのようなエ
ンタテイメント性(娯楽性)の高い用途に好適な、発話
者の個性、発話時の感情や状況、もしくは様々な発話内
容に応じた音声メッセージを作成し得る音声合成方法、
音声合成のための辞書構築方法、音声合成装置、並びに
音声合成プログラムを記録したコンピュータ読み取り可
能な媒体を提供することにある。
【0011】
【課題を解決するための手段】本発明では、前記目的を
達成するため、単語辞書、韻律辞書及び波形辞書を用い
て音声メッセージを作成する音声合成方法において、発
話者または発話時の感情・状況または発話内容のうちの
少なくとも1つが異なる音声合成処理の単位(以下、こ
れをタスクと呼ぶ。)を複数設定し、各タスクに対応す
る少なくとも韻律辞書及び波形辞書を構築し、音声合成
すべき文字列がタスクの指定とともに入力された際、該
当タスクに対応した単語辞書、韻律辞書及び波形辞書を
用いて音声合成処理することを特徴とする。
【0012】本発明によれば、音声合成処理を、複数の
発話者、発話時の複数の感情・状況、複数の発話内容と
いったタスクに分けて、タスク毎に辞書を構築して音声
合成処理を行うため、発話者の個性、発話時の感情や状
況、発話内容に応じた音声メッセージを容易に作成する
ことができる。
【0013】また、前述した複数のタスク毎の辞書は、
タスクに対応した単語辞書を作成し、単語辞書中の全て
の単語からモデルとなり得る文字列を選出して音声収録
台本を作成し、音声収録台本に従って発話者の音声を収
録し、該収録した音声から韻律辞書及び波形辞書を構築
し、これらを各タスクについて行うこと、あるいは、タ
スクに対応した単語辞書とともに単語変形規則を作成
し、タスクに対応した単語辞書に含まれる全ての単語を
該タスクに対応した単語変形規則に従って変形処理し、
変形処理した単語辞書中の全ての単語からモデルとなり
得る文字列を選出して音声収録台本を作成し、音声収録
台本に従って発話者の音声を収録し、該収録した音声か
ら韻律辞書及び波形辞書を構築し、これらを各タスクに
ついて行うこと、もしくは、タスクに対応した単語変形
規則を作成し、単語辞書に含まれる全ての単語をタスク
に対応した単語変形規則に従って変形処理し、変形処理
した単語辞書中の全ての単語からモデルとなり得る文字
列を選出して音声収録台本を作成し、音声収録台本に従
って発話者の音声を収録し、該収録した音声から韻律辞
書及び波形辞書を構築し、これらを各タスクについて行
うことによって構築される。
【0014】本発明によれば、タスクに応じた音声収録
台本を簡単に作成することができ、この台本に従って音
声を収録して各辞書を構築することができ、また、文字
列変形処理を行うことにより、辞書の容量を増やすこと
なく、多様な内容表現を含む音声メッセージを容易に作
成することができる。
【0015】また、これらの辞書を用いる音声合成方法
は、合成すべき文字列とともに入力されるタスクの指定
に応じて単語辞書、韻律辞書及び波形辞書を切り替え、
切り替え後の単語辞書、韻律辞書及び波形辞書を用いて
合成すべき文字列に対応する音声メッセージを合成処理
することにより行われる。
【0016】この際、各辞書が、少なくとも1つの文字
を含む単語をそのアクセント型とともに多数収録した単
語辞書、該単語辞書に収録された単語に対する韻律を示
す韻律モデルデータのうちの代表的な韻律モデルデータ
を収録した韻律辞書、収録音声を合成単位の音声データ
として収録した波形辞書である場合、音声合成処理は、
合成すべき文字列のアクセント型を単語辞書から判定
し、合成すべき文字列とアクセント型に基づいて韻律辞
書から韻律モデルデータを選択し、選択した韻律モデル
データに基づいて合成すべき文字列の各文字に対応する
波形データを波形辞書から選択し、該選択した波形デー
タ同士を接続することにより行うことができる。
【0017】また、これらの辞書を用いる別の音声合成
方法は、合成すべき文字列とともに入力されるタスクの
指定に応じて単語辞書、韻律辞書及び波形辞書並びに単
語変形規則を切り替え、合成すべき文字列を単語変形規
則に従って変形処理し、切り替え後の単語辞書、韻律辞
書及び波形辞書を用いて変形処理後の文字列に対応する
音声メッセージを合成処理すること、もしくは、合成す
べき文字列とともに入力されたタスクの指定に応じて韻
律辞書及び波形辞書並びに単語変形規則を切り替え、合
成すべき文字列を単語変形規則に従って変形処理し、単
語辞書、切り替え後の韻律辞書及び波形辞書を用いて変
形処理後の文字列に対応する音声メッセージを合成処理
することにより行われる。
【0018】また、この際、各辞書が、少なくとも1つ
の文字を含む単語をそのアクセント型とともに多数収録
した単語辞書、該単語辞書に収録された単語に対する韻
律を示す韻律モデルデータのうちの代表的な韻律モデル
データを収録した韻律辞書、収録音声を合成単位の音声
データとして収録した波形辞書であり、単語変形規則
が、文字列の変形規則を収録した単語変形規則である場
合、音声合成処理は、合成すべき文字列のアクセント型
を単語辞書または単語変形規則から判定し、合成すべき
文字列とアクセント型に基づいて韻律辞書から韻律モデ
ルデータを選択し、選択した韻律モデルデータに基づい
て合成すべき文字列の各文字に対応する波形データを波
形辞書から選択し、該選択した波形データ同士を接続す
ることにより行うことができる。
【0019】また、前述した辞書を用いる音声合成装置
は、合成すべき文字列とともに入力されるタスクの指定
に応じて単語辞書、韻律辞書及び波形辞書を切り替える
手段と、切り替え後の単語辞書、韻律辞書及び波形辞書
を用いて合成すべき文字列に対応する音声メッセージを
合成処理する手段とを備えてなっている。
【0020】また、前述した辞書を用いる別の音声合成
装置は、合成すべき文字列とともに入力されるタスクの
指定に応じて単語辞書、韻律辞書及び波形辞書並びに単
語変形規則を切り替える手段と、合成すべき文字列を単
語変形規則に従って変形処理する手段と、切り替え後の
単語辞書、韻律辞書及び波形辞書を用いて変形処理後の
文字列に対応する音声メッセージを合成処理する手段と
を備えて、もしくは、合成すべき文字列とともに入力さ
れたタスクの指定に応じて韻律辞書及び波形辞書並びに
単語変形規則を切り替える手段と、合成すべき文字列を
単語変形規則に従って変形処理する手段と、単語辞書、
切り替え後の韻律辞書及び波形辞書を用いて変形処理後
の文字列に対応する音声メッセージを合成処理する手段
とを備えてなっている。
【0021】また、前述したような音声合成装置は、音
声合成プログラムを記録したコンピュータ読み取り可能
な媒体において、前記プログラムはコンピュータに読み
取られた際、このコンピュータを、発話者または発話時
の感情・状況または発話内容のうちの少なくとも1つが
異なる複数の音声合成処理の単位(タスク)にそれぞれ
対応した単語辞書、韻律辞書及び波形辞書と、合成すべ
き文字列とともに入力されるタスクの指定に応じて単語
辞書、韻律辞書及び波形辞書を切り替える手段と、切り
替え後の単語辞書、韻律辞書及び波形辞書を用いて合成
すべき文字列に対応する音声メッセージを合成処理する
手段として機能させる音声合成プログラムを記録したコ
ンピュータ読み取り可能な媒体、または、発話者または
発話時の感情・状況または発話内容のうちの少なくとも
1つが異なる複数の音声合成処理の単位(タスク)にそ
れぞれ対応した単語辞書、韻律辞書及び波形辞書並びに
単語変形規則と、合成すべき文字列とともに入力された
タスクの指定に応じて単語辞書、韻律辞書及び波形辞書
並びに単語変形規則を切り替える手段と、合成すべき文
字列を単語変形規則に従って変形処理する手段と、切り
替え後の単語辞書、韻律辞書及び波形辞書を用いて変形
処理後の文字列に対応する音声メッセージを合成処理す
る手段として機能させる音声合成プログラムを記録した
コンピュータ読み取り可能な媒体、もしくは、単語辞書
と、発話者または発話時の感情・状況のいずれかが異な
る複数の音声合成処理の単位(タスク)にそれぞれ対応
した韻律辞書及び波形辞書並びに単語変形規則と、合成
すべき文字列とともに入力されたタスクの指定に応じて
韻律辞書及び波形辞書並びに単語変形規則を切り替える
手段と、合成すべき文字列を単語変形規則に従って変形
処理する手段と、単語辞書、切り替え後の韻律辞書及び
波形辞書を用いて変形処理後の文字列に対応する音声メ
ッセージを合成処理する手段として機能させる音声合成
プログラムを記録したコンピュータ読み取り可能な媒体
によって実現される。
【0022】
【発明の実施の形態】図1は本発明の音声合成方法、こ
こでは音声合成のための辞書構築を含む広義の音声合成
方法の全体の流れを示すものである。
【0023】まず、発話者または発話時の感情・状況ま
たは発話内容のうちの少なくとも1つが異なる音声合成
処理の単位(タスク)を複数設定する(s1)。この作
業は音声合成の目的に応じて手作業で行われる。
【0024】図2はタスクを説明するためのもので、図
中、A1,A2,A3は複数の異なる発話者、B1,B
2,B3は複数の異なる感情・状況、C1,C2,C3
は複数の異なる発話内容を表している。なお、ここでい
う発話内容とは単一の言葉を示すものではなく、相手に
対する呼びかけの言葉、嬉しい時に発しそうな言葉とい
った、一定の定義に従う言葉の集合を示している。
【0025】図2において、発話者A1が感情・状況B
1である時に発話内容C1の発話を行うというケース
(A1−B1−C1)が1つのタスクとなり、発話者A
1が感情・状況B2である時に発話内容C1の発話を行
うというケース(A1−B2−C1)は別の1つのタス
クとなる。同様に、発話者A2が感情・状況B1である
時に発話内容C2の発話を行うというケース(A2−B
1−C2)、発話者A2が感情・状況B2である時に発
話内容C3の発話を行うというケース(A2−B2−C
3)、発話者A3が感情・状況B3である時に発話内容
C2の発話を行うというケース(A2−B2−C3)
も、それぞれ全て別の1つのタスクとなる。
【0026】この際、常に、複数の発話者、複数の発話
時の感情・状況、複数の発話内容の全てを網羅したタス
クが設定されるわけではない。つまり、発話者A1につ
いては感情・状況B1,B2,B3が設定され、また、
感情・状況B1,B2,B3のそれぞれに関して発話内
容C1,C2,C3が設定される、全部で9通りのタス
クが設定されたとしても、発話者A2については感情・
状況B1,B2のみが設定され、また、その感情・状況
B1に関しては発話内容C1,C2のみが設定され、感
情・状況B2に関しては発話内容C3のみが設定され
る、全部で3通りのタスクしか設定されないようなこと
もあり、どのようなタスクを設定するかは音声合成の目
的に応じて任意に決定される。
【0027】また、ここでは発話者、発話時の感情・状
況、発話内容が全て複数として説明したが、音声合成の
目的によってはそのうちのいずれか1つまたは2つが一
種類に限定されたタスクを設定することもある。
【0028】図3は具体的なタスクの一例を示すもの
で、ここではビデオゲームにおけるゲームキャラクタの
音声メッセージを合成する場合の例、特に発話内容をプ
レイヤーキャラクタに対する呼びかけのみに限定した例
を示す。
【0029】図3では、「光」という発話者(ゲームキ
ャラクタ)については「幼年期に普通の呼びかけ」、
「普通に呼びかけ」、「電話で普通に呼びかけ」、「告
白・再会時に感極まって呼びかけ」という4つの感情・
状況が設定され、これらがそれぞれ別々のタスク1,
2,3,4として設定され、また、「茜」という発話者
については「普通に呼びかけ」、「電話で普通に呼びか
け」、「告白・下校時に親しげに呼びかけ」という3つ
の感情・状況が設定され、これらがそれぞれ別々のタス
ク5,6,7として設定されている。
【0030】なお、各タスクにおけるメッセージ例は、
後述するタスク毎の単語変形処理を加えた例を示してい
る。
【0031】そして、このようにして設定した複数のタ
スク毎に、音声合成に必要な辞書、即ち単語辞書、韻律
辞書及び波形辞書を構築する(s2)。
【0032】ここで、単語辞書とは、少なくとも1つの
文字を含む単語をそのアクセント型とともに多数収録し
たものであり、例えば図3で説明したタスクでいえば、
入力されることが予想されるプレイヤーキャラクタの名
前を表す単語をそのアクセント型とともに多数収録した
ものである。また、韻律辞書とは、単語辞書に収録され
た単語に対する韻律を示す韻律モデルデータのうちの代
表的な韻律モデルデータを収録したものであり、波形辞
書とは、収録音声を合成単位の音声データとして収録し
たものである。
【0033】なお、単語辞書については、後述する単語
変形処理を加えれば、発話者または感情・状況の異なる
タスクにおいて共通化することもでき、特に発話内容を
一種類に限定すれば、1つのみとすることもできる。
【0034】そして、図示しない入力手段やゲームシス
テム等より、合成すべき文字列がタスクの指定とともに
入力された際、該当タスクに対応した単語辞書、韻律辞
書及び波形辞書を用いて音声合成処理を行う(s3)。
【0035】図4は本発明の音声合成のための辞書構築
方法の流れを示すものである。
【0036】まず、前記設定した複数のタスクの発話
者、発話時の感情・状況、発話内容に応じた単語辞書を
手作業で作成する(s21)。また、この際、必要に応
じて単語変形規則を作成する(s22)。
【0037】ここで、単語変形規則とは、単語辞書に収
録された単語を、発話者または感情・状況の異なるタス
クに対応した単語に変換処理するための規則を定めたも
のであり、この変換処理によって前述したように、1つ
の単語辞書を仮想的に発話者または感情・状況の異なる
タスクに対応した複数の単語辞書として扱うことを可能
とする。
【0038】図5は単語変形規則の一例を示すもので、
ここでは図3で説明した「タスク5」に対応した変形規
則、即ちプレイヤーキャラクタに対する呼びかけとし
て、名前(プレイヤーキャラクタの名前)から2モーラ
のあだ名を作成する時の規則の例を示す。
【0039】次に、前記作成した単語辞書または単語辞
書及び単語変形規則から、あるタスクに対応した単語辞
書または単語辞書及び単語変形規則を選択する(s2
3)。この時、単語変形規則があれば、単語変形処理を
実行する(s24)。
【0040】単語変形処理は、タスクに対応した単語辞
書に含まれる全ての単語を該タスクに対応した単語変形
規則に従って変形処理することによって行う。
【0041】図3、図5の例についていえば、単語辞書
に収録されたプレイヤーキャラクタの名前を1つずつ取
り出し、2モーラ以上の通常の名前であれば、先頭2モ
ーラに対応する文字に「くん」を付けて、また、1モー
ラの名前であれば、その1モーラに対応する文字に「ー
くん」を付けて、また、その他の特殊な名前であれば長
音化、促音化、撥音化する等の変形を加えてあだ名を作
成し、さらにまた、あだ名を作成するような場合にはア
クセントを頭高にする等のアクセントに対する変形も行
うという処理である。
【0042】次に、前記単語辞書に収録された全ての単
語またはこれに前述した単語変形処理を加えた全ての単
語から、文字列選出規則に従って文字列を選出して音声
収録台本を作成する(s25)。
【0043】文字列選出規則とは、単語辞書に収録され
た全ての単語またはこれに前述した単語変形処理を加え
た全ての単語から、モデルとなり得る文字列を選出する
ための規則を定めたものであり、前述したプレイヤーキ
ャラクタの名前を多数収録した単語辞書からモデルとな
り得る文字列、即ち名前を選出する場合には、1)1モ
ーラから6モーラまでの名前、2)それぞれのモーラ毎
に異なるアクセント型の単語を少なくとも1つ採用、等
である。この規則に従って選出された文字列の一例を図
6に示す。
【0044】ところで、単語辞書に含まれる単語は、辞
書作成の際の発話内容の定義を狭くする程、パターンが
限定され、類似度の大きい単語が多くなる。単語辞書に
類似度の大きい単語が多く含まれる場合、各単語にその
重要度・出現確率(頻度)を表す情報を付与しておき、
この情報を利用した選出基準を前述したモーラ数やアク
セント型の指定等とともに文字列選出規則に含めておく
ことにより、音声収録台本中に実際の音声合成において
合成すべき文字列として入力される文字列もしくはこれ
に類似した文字列が含まれる確率を高くすることがで
き、これによって、実際の音声合成における品位を高め
ることが可能となる。
【0045】次に、前述した如くして作成したタスクに
対応した音声収録台本に従って発話者の音声を収録する
(s26)。これはタスクに対応した発話者(声優等)
をスタジオ等に招き、台本に沿って発声した音声をマイ
クで収録し、テープレコーダ等に記録する通常の工程で
ある。
【0046】最後に、収録した音声から韻律辞書及び波
形辞書を構築する(s27)。なお、この辞書構築に関
する処理の詳細については本願の対象とするところでな
く、周知のアルゴリズム、処理方法をそのまま用いるこ
とができるので、省略する。
【0047】以上の処理を全タスク分繰り返し行う(s
28)。なお、前述したように、単語変形処理によって
1つの単語辞書を仮想的に発話者または感情・状況の異
なるタスクに対応した複数の単語辞書として扱う際に
は、単語辞書についてはそのままとし、単語変形規則の
みを異なるタスクに対応するものを選択して行う。ま
た、s24〜s27の処理はタスク毎に全てを順番に行
う必要があるわけではなく、同時並列的に行ってもかま
わない。
【0048】図7は所定のタスクに対応した単語辞書に
収録された単語を該タスクに対応した単語変形規則に従
って変形処理し、さらに文字列選出規則に従って選出し
て所定のタスクに対応した音声収録台本を作成するまで
のようすの一例を示すものである。
【0049】ここで、単語変形規則は、図3で説明した
「タスク2」に対応した変形規則、即ちプレイヤーキャ
ラクタに対する呼びかけとして、名前(プレイヤーキャ
ラクタの名前)に「くん」を付けて作成する時の規則で
あり、文字列選出規則は、1)変形後が3モーラから8
モーラ以内、2)全モーラ毎に異なるアクセント型の単
語を少なくとも1つ採用、3)出現確率の高い語を優
先、4)台本に収録する文字列の個数を予め指定(指定
を越えた時点で選出終了)、である。
【0050】本例では、「あきよしくん」、「むつよし
くん」とも6モーラで同じ中高型のアクセント型(図
中、実線で表記)を備えているが、「あきよし」の方が
出現確率が高いので、「あきよしくん」が選択され、台
本出力される。なお、「さえもんざぶろうくん」は10
モーラなので台本出力されない。
【0051】なお、これまで述べた音声合成のための辞
書構築方法には、人間の手作業による辞書作成や音声収
録等の現場での作業が含まれるため、全ての工程を装置
もしくはプログラムによって実現することはできない
が、単語変形工程、文字列選出工程についてはそれぞれ
の規則に従う処理を実行する装置もしくはプログラムに
よって実現可能である。
【0052】図8は本発明の音声合成方法、ここでは前
述した如くして作成されたタスク毎の単語辞書、韻律辞
書及び波形辞書を用いて実際の音声合成を行う狭義の音
声合成方法の流れを示すものである。
【0053】まず、図示しない入力手段やゲームシステ
ム等より、合成すべき文字列及びタスクの指定が入力さ
れると、該タスクの指定に応じて単語辞書、韻律辞書及
び波形辞書を、また、辞書構築の段階で単語変形処理が
行われている場合はこれに加えて単語変形規則を切り替
える(s31)。
【0054】次に、辞書構築の段階で単語変形処理が行
われている場合は、前記切り替えた単語変形規則に従っ
て、前記合成すべき文字列に対する単語変形処理を実行
する(s32)。なお、ここで用いる単語変形規則は、
辞書構築の段階で用いた規則を基本的にそのまま使用す
る。
【0055】次に、合成すべき文字列のアクセント型を
単語辞書または単語変形規則から判定する(s33)。
具体的には合成すべき文字列と単語辞書に収録された単
語とを比較し、同一の単語があればそのアクセント型を
採用し、なければ同一モーラ数の単語のうち、類似する
文字列を有する単語のアクセント型を採用する。なお、
同一の単語がない場合、合成すべき文字列と同一モーラ
数の単語に現れ得る全てのアクセント型から、オペレー
タ(ゲームプレイヤー)等が図示しない入力手段より任
意に選択できるようにしても良い。
【0056】また、この時、前記単語変形処理の段階に
おいて前述した辞書構築で説明したアクセントに対する
変形処理が行われた場合は、前記単語変形規則に従うア
クセント型を採用する。
【0057】次に、合成すべき文字列とアクセント型に
基づいて韻律辞書から韻律モデルデータを選択し(s3
4)、選択した韻律モデルデータに基づいて合成すべき
文字列の各文字に対応する波形データを波形辞書から選
択し(s35)、該選択した波形データ同士を接続して
(s36)、合成音声データを作成する。
【0058】なお、s34〜36に関する処理の詳細に
ついては本願の対象とするところでなく、周知のアルゴ
リズム、処理方法をそのまま用いることができるので、
省略する。
【0059】図9は本発明の音声合成装置の機能ブロッ
ク図を示すもので、図中、11−1,11−2,……1
1−nはタスク1,タスク2,……タスクn用辞書、1
2−1,12−2,……12−nはタスク1,タスク
2,……タスクn用変形規則、13は辞書・変形規則切
り替え手段、14は単語変形手段、15はアクセント型
判定手段、16は韻律モデル選択手段、17は波形選択
手段、18は波形接続手段である。
【0060】タスク1〜タスクn用辞書11−1〜11
−nは、それぞれタスク1〜タスクn用の単語辞書、韻
律辞書及び波形辞書(の記憶部)である。また、タスク
1〜タスクn用変形規則12−1〜12−nは、それぞ
れタスク1〜タスクn用の単語変形規則(の記憶部)で
ある。
【0061】辞書・変形規則切り替え手段13は、合成
すべき文字列とともに入力されるタスクの指定に応じ
て、使用するタスク1〜タスクn用辞書11−1〜11
−nのうちの1つ、並びにタスク1〜タスクn用変形規
則12−1〜12−nのうちの1つを切り替え選択して
各部に供給する。
【0062】単語変形手段14は、合成すべき文字列を
前記選択された単語変形規則に従って変形処理する。ア
クセント型判定手段15は、合成すべき文字列のアクセ
ント型を前記選択された単語辞書または単語変形規則か
ら判定する。
【0063】韻律モデル選択手段16は、合成すべき文
字列とアクセント型に基づいて前記選択された韻律辞書
から韻律モデルデータを選択する。波形選択手段17
は、選択した韻律モデルデータに基づいて合成すべき文
字列の各文字に対応する波形データを前記選択された波
形辞書から選択する。波形接続手段18は、該選択した
波形データ同士を接続して合成音声データを作成する。
【0064】
【発明の効果】以上説明したように、本発明によれば、
音声合成処理を、複数の発話者、発話時の複数の感情・
状況、複数の発話内容といったタスクに分けて、タスク
毎に辞書を構築して音声合成処理を行うため、発話者の
個性、発話時の感情や状況、発話内容に応じた音声メッ
セージを容易に作成することができる。
【0065】また、本発明によれば、タスク毎に辞書構
築及び音声合成処理において文字列変形処理を行うこと
により、辞書の容量を増やすことなく、多様な内容表現
を含む音声メッセージを容易に作成することができる。
【図面の簡単な説明】
【図1】本発明の音声合成方法の全体を示すフローチャ
ート
【図2】タスクの説明図
【図3】具体的なタスクの一例を示す図
【図4】本発明の音声合成のための辞書構築方法を示す
フローチャート
【図5】単語変形規則の一例を示す図
【図6】選出された文字列の一例を示す図
【図7】単語辞書、単語変形規則、文字列選出規則に従
って音声収録台本を作成するまでのようすの一例を示す
【図8】本発明の音声合成方法を示すフローチャート
【図9】本発明の音声合成装置の機能ブロック図
【符号の説明】
11−1〜11−n:タスク1〜タスクn用辞書、12
−1〜12−n:タスク1〜タスクn用変形規則、1
3:辞書・変形規則切り替え手段、14:単語変形手
段、15:アクセント型判定手段、16:韻律モデル選
択手段、17:波形選択手段、18:波形接続手段。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 溝口 稔幸 東京都千代田区神田神保町3番25号 株式 会社コナミコンピュータエンタテインメン ト東京内 Fターム(参考) 5D045 AA07 9A001 BB02 BB03 BB04 DD11 GZ05 HH16 HH18 HH33 JJ65 JJ72 JJ76 KK45 KK56 KK60

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】 単語辞書、韻律辞書及び波形辞書を用い
    て音声メッセージを作成する音声合成方法において、 発話者または発話時の感情・状況または発話内容のうち
    の少なくとも1つが異なる音声合成処理の単位(タス
    ク)を複数設定し、 各タスクに対応する少なくとも韻律辞書及び波形辞書を
    構築し、 合成すべき文字列がタスクの指定とともに入力された
    際、該当タスクに対応した単語辞書、韻律辞書及び波形
    辞書を用いて音声合成処理することを特徴とする音声合
    成方法。
  2. 【請求項2】 発話者または発話時の感情・状況または
    発話内容のうちの少なくとも1つが異なる複数の音声合
    成処理の単位(タスク)にそれぞれ対応した単語辞書、
    韻律辞書及び波形辞書を構築する辞書構築方法であっ
    て、 タスクに対応した単語辞書を作成し、 単語辞書中の全ての単語からモデルとなり得る文字列を
    選出して音声収録台本を作成し、 音声収録台本に従って発話者の音声を収録し、 該収録した音声から韻律辞書及び波形辞書を構築し、 これらを各タスクについて行うことを特徴とする音声合
    成のための辞書構築方法。
  3. 【請求項3】 発話者または発話時の感情・状況または
    発話内容のうちの少なくとも1つが異なる複数の音声合
    成処理の単位(タスク)にそれぞれ対応した単語辞書、
    韻律辞書及び波形辞書を構築する辞書構築方法であっ
    て、 タスクに対応した単語辞書とともに単語変形規則を作成
    し、 タスクに対応した単語辞書に含まれる全ての単語を該タ
    スクに対応した単語変形規則に従って変形処理し、 変形処理した単語辞書中の全ての単語からモデルとなり
    得る文字列を選出して音声収録台本を作成し、 音声収録台本に従って発話者の音声を収録し、 該収録した音声から韻律辞書及び波形辞書を構築し、 これらを各タスクについて行うことを特徴とする音声合
    成のための辞書構築方法。
  4. 【請求項4】 単語辞書と、発話者または発話時の感情
    ・状況のいずれかが異なる複数の音声合成処理の単位
    (タスク)にそれぞれ対応した韻律辞書及び波形辞書と
    を構築する辞書構築方法であって、 タスクに対応した単語変形規則を作成し、 単語辞書に含まれる全ての単語をタスクに対応した単語
    変形規則に従って変形処理し、 変形処理した単語辞書中の全ての単語からモデルとなり
    得る文字列を選出して音声収録台本を作成し、 音声収録台本に従って発話者の音声を収録し、 該収録した音声から韻律辞書及び波形辞書を構築し、 これらを各タスクについて行うことを特徴とする音声合
    成のための辞書構築方法。
  5. 【請求項5】 発話者または発話時の感情・状況または
    発話内容のうちの少なくとも1つが異なる複数の音声合
    成処理の単位(タスク)にそれぞれ対応した単語辞書、
    韻律辞書及び波形辞書を用いる音声合成方法であって、 合成すべき文字列とともに入力されるタスクの指定に応
    じて単語辞書、韻律辞書及び波形辞書を切り替え、 切り替え後の単語辞書、韻律辞書及び波形辞書を用いて
    合成すべき文字列に対応する音声メッセージを合成処理
    することを特徴とする音声合成方法。
  6. 【請求項6】 各辞書が、少なくとも1つの文字を含む
    単語をそのアクセント型とともに多数収録した単語辞
    書、該単語辞書に収録された単語に対する韻律を示す韻
    律モデルデータのうちの代表的な韻律モデルデータを収
    録した韻律辞書、収録音声を合成単位の音声データとし
    て収録した波形辞書である場合、音声合成処理は、 合成すべき文字列のアクセント型を単語辞書から判定
    し、 合成すべき文字列とアクセント型に基づいて韻律辞書か
    ら韻律モデルデータを選択し、 選択した韻律モデルデータに基づいて合成すべき文字列
    の各文字に対応する波形データを波形辞書から選択し、 該選択した波形データ同士を接続することにより行うこ
    とを特徴とする請求項5記載の音声合成方法。
  7. 【請求項7】 発話者または発話時の感情・状況または
    発話内容のうちの少なくとも1つが異なる複数の音声合
    成処理の単位(タスク)にそれぞれ対応した単語辞書、
    韻律辞書及び波形辞書並びに単語変形規則を用いる音声
    合成方法であって、 合成すべき文字列とともに入力されるタスクの指定に応
    じて単語辞書、韻律辞書及び波形辞書並びに単語変形規
    則を切り替え、 合成すべき文字列を単語変形規則に従って変形処理し、 切り替え後の単語辞書、韻律辞書及び波形辞書を用いて
    変形処理後の文字列に対応する音声メッセージを合成処
    理することを特徴とする音声合成方法。
  8. 【請求項8】 単語辞書と、発話者または発話時の感情
    ・状況のいずれかが異なる複数の音声合成処理の単位
    (タスク)にそれぞれ対応した韻律辞書及び波形辞書並
    びに単語変形規則とを用いる音声合成方法であって、 合成すべき文字列とともに入力されたタスクの指定に応
    じて韻律辞書及び波形辞書並びに単語変形規則を切り替
    え、 合成すべき文字列を単語変形規則に従って変形処理し、 単語辞書、切り替え後の韻律辞書及び波形辞書を用いて
    変形処理後の文字列に対応する音声メッセージを合成処
    理することを特徴とする音声合成方法。
  9. 【請求項9】 各辞書が、少なくとも1つの文字を含む
    単語をそのアクセント型とともに多数収録した単語辞
    書、該単語辞書に収録された単語に対する韻律を示す韻
    律モデルデータのうちの代表的な韻律モデルデータを収
    録した韻律辞書、収録音声を合成単位の音声データとし
    て収録した波形辞書であり、単語変形規則が、文字列の
    変形規則を収録した単語変形規則である場合、音声合成
    処理は、 合成すべき文字列のアクセント型を単語辞書または単語
    変形規則から判定し、 合成すべき文字列とアクセント型に基づいて韻律辞書か
    ら韻律モデルデータを選択し、 選択した韻律モデルデータに基づいて合成すべき文字列
    の各文字に対応する波形データを波形辞書から選択し、 該選択した波形データ同士を接続することにより行うこ
    とを特徴とする請求項7または8記載の音声合成方法。
  10. 【請求項10】 発話者または発話時の感情・状況また
    は発話内容のうちの少なくとも1つが異なる複数の音声
    合成処理の単位(タスク)にそれぞれ対応した単語辞
    書、韻律辞書及び波形辞書を用いる音声合成装置であっ
    て、 合成すべき文字列とともに入力されるタスクの指定に応
    じて単語辞書、韻律辞書及び波形辞書を切り替える手段
    と、 切り替え後の単語辞書、韻律辞書及び波形辞書を用いて
    合成すべき文字列に対応する音声メッセージを合成処理
    する手段とを備えたことを特徴とする音声合成装置。
  11. 【請求項11】 各辞書が、少なくとも1つの文字を含
    む単語をそのアクセント型とともに多数収録した単語辞
    書、該単語辞書に収録された単語に対する韻律を示す韻
    律モデルデータのうちの代表的な韻律モデルデータを収
    録した韻律辞書、収録音声を合成単位の音声データとし
    て収録した波形辞書である場合、音声合成処理手段は、 合成すべき文字列のアクセント型を単語辞書から判定す
    る手段と、 合成すべき文字列とアクセント型に基づいて韻律辞書か
    ら韻律モデルデータを選択する手段と、 選択した韻律モデルデータに基づいて合成すべき文字列
    の各文字に対応する波形データを波形辞書から選択する
    手段と、 該選択した波形データ同士を接続する手段とからなるこ
    とを特徴とする請求項10記載の音声合成装置。
  12. 【請求項12】 発話者または発話時の感情・状況また
    は発話内容のうちの少なくとも1つが異なる複数の音声
    合成処理の単位(タスク)にそれぞれ対応した単語辞
    書、韻律辞書及び波形辞書並びに単語変形規則を用いる
    音声合成装置であって、 合成すべき文字列とともに入力されるタスクの指定に応
    じて単語辞書、韻律辞書及び波形辞書並びに単語変形規
    則を切り替える手段と、 合成すべき文字列を単語変形規則に従って変形処理する
    手段と、 切り替え後の単語辞書、韻律辞書及び波形辞書を用いて
    変形処理後の文字列に対応する音声メッセージを合成処
    理する手段とを備えたことを特徴とする音声合成装置。
  13. 【請求項13】 単語辞書と、発話者または発話時の感
    情・状況のいずれかが異なる複数の音声合成処理の単位
    (タスク)にそれぞれ対応した韻律辞書及び波形辞書並
    びに単語変形規則とを用いる音声合成装置であって、 合成すべき文字列とともに入力されたタスクの指定に応
    じて韻律辞書及び波形辞書並びに単語変形規則を切り替
    える手段と、 合成すべき文字列を単語変形規則に従って変形処理する
    手段と、 単語辞書、切り替え後の韻律辞書及び波形辞書を用いて
    変形処理後の文字列に対応する音声メッセージを合成処
    理する手段とを備えたことを特徴とする音声合成装置。
  14. 【請求項14】 各辞書が、少なくとも1つの文字を含
    む単語をそのアクセント型とともに多数収録した単語辞
    書、該単語辞書に収録された単語に対する韻律を示す韻
    律モデルデータのうちの代表的な韻律モデルデータを収
    録した韻律辞書、収録音声を合成単位の音声データとし
    て収録した波形辞書であり、単語変形規則が、文字列の
    変形規則を収録した単語変形規則である場合、音声合成
    処理手段は、 合成すべき文字列のアクセント型を単語辞書または単語
    変形規則から判定する手段と、 合成すべき文字列とアクセント型に基づいて韻律辞書か
    ら韻律モデルデータを選択する手段と、 選択した韻律モデルデータに基づいて合成すべき文字列
    の各文字に対応する波形データを波形辞書から選択する
    手段と、 該選択した波形データ同士を接続する手段とからなるこ
    とを特徴とする請求項12または13記載の音声合成装
    置。
  15. 【請求項15】 音声合成プログラムを記録したコンピ
    ュータ読み取り可能な媒体において、 前記プログラムはコンピュータに読み取られた際、この
    コンピュータを、 発話者または発話時の感情・状況または発話内容のうち
    の少なくとも1つが異なる複数の音声合成処理の単位
    (タスク)にそれぞれ対応した単語辞書、韻律辞書及び
    波形辞書と、 合成すべき文字列とともに入力されるタスクの指定に応
    じて単語辞書、韻律辞書及び波形辞書を切り替える手段
    と、 切り替え後の単語辞書、韻律辞書及び波形辞書を用いて
    合成すべき文字列に対応する音声メッセージを合成処理
    する手段として機能させることを特徴とする音声合成プ
    ログラムを記録したコンピュータ読み取り可能な媒体。
  16. 【請求項16】 各辞書が、少なくとも1つの文字を含
    む単語をそのアクセント型とともに多数収録した単語辞
    書、該単語辞書に収録された単語に対する韻律を示す韻
    律モデルデータのうちの代表的な韻律モデルデータを収
    録した韻律辞書、収録音声を合成単位の音声データとし
    て収録した波形辞書である場合、音声合成処理手段は、 合成すべき文字列のアクセント型を単語辞書から判定す
    る手段と、 合成すべき文字列とアクセント型に基づいて韻律辞書か
    ら韻律モデルデータを選択する手段と、 選択した韻律モデルデータに基づいて合成すべき文字列
    の各文字に対応する波形データを波形辞書から選択する
    手段と、 該選択した波形データ同士を接続する手段とからなるこ
    とを特徴とする請求項15記載の音声合成プログラムを
    記録したコンピュータ読み取り可能な媒体。
  17. 【請求項17】 音声合成プログラムを記録したコンピ
    ュータ読み取り可能な媒体において、 前記プログラムはコンピュータに読み取られた際、この
    コンピュータを、 発話者または発話時の感情・状況または発話内容のうち
    の少なくとも1つが異なる複数の音声合成処理の単位
    (タスク)にそれぞれ対応した単語辞書、韻律辞書及び
    波形辞書並びに単語変形規則と、 合成すべき文字列とともに入力されたタスクの指定に応
    じて単語辞書、韻律辞書及び波形辞書並びに単語変形規
    則を切り替える手段と、 合成すべき文字列を単語変形規則に従って変形処理する
    手段と、 切り替え後の単語辞書、韻律辞書及び波形辞書を用いて
    変形処理後の文字列に対応する音声メッセージを合成処
    理する手段として機能させることを特徴とする音声合成
    プログラムを記録したコンピュータ読み取り可能な媒
    体。
  18. 【請求項18】 音声合成プログラムを記録したコンピ
    ュータ読み取り可能な媒体において、 前記プログラムはコンピュータに読み取られた際、この
    コンピュータを、 単語辞書と、発話者または発話時の感情・状況のいずれ
    かが異なる複数の音声合成処理の単位(タスク)にそれ
    ぞれ対応した韻律辞書及び波形辞書並びに単語変形規則
    と、 合成すべき文字列とともに入力されたタスクの指定に応
    じて韻律辞書及び波形辞書並びに単語変形規則を切り替
    える手段と、 合成すべき文字列を単語変形規則に従って変形処理する
    手段と、 単語辞書、切り替え後の韻律辞書及び波形辞書を用いて
    変形処理後の文字列に対応する音声メッセージを合成処
    理する手段として機能させることを特徴とする音声合成
    プログラムを記録したコンピュータ読み取り可能な媒
    体。
  19. 【請求項19】 各辞書が、少なくとも1つの文字を含
    む単語をそのアクセント型とともに多数収録した単語辞
    書、該単語辞書に収録された単語に対する韻律を示す韻
    律モデルデータのうちの代表的な韻律モデルデータを収
    録した韻律辞書、収録音声を合成単位の音声データとし
    て収録した波形辞書であり、単語変形規則が、文字列の
    変形規則を収録した単語変形規則である場合、音声合成
    処理手段は、 合成すべき文字列のアクセント型を単語辞書または単語
    変形規則から判定する手段と、 合成すべき文字列とアクセント型に基づいて韻律辞書か
    ら韻律モデルデータを選択する手段と、 選択した韻律モデルデータに基づいて合成すべき文字列
    の各文字に対応する波形データを波形辞書から選択する
    手段と、 該選択した波形データ同士を接続する手段とからなるこ
    とを特徴とする請求項17または18記載の音声合成プ
    ログラムを記録したコンピュータ読み取り可能な媒体。
JP11205945A 1999-07-21 1999-07-21 音声合成方法、音声合成のための辞書構築方法、音声合成装置、並びに音声合成プログラムを記録したコンピュータ読み取り可能な媒体 Pending JP2001034282A (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP11205945A JP2001034282A (ja) 1999-07-21 1999-07-21 音声合成方法、音声合成のための辞書構築方法、音声合成装置、並びに音声合成プログラムを記録したコンピュータ読み取り可能な媒体
TW089113028A TW523734B (en) 1999-07-21 2000-06-30 Speech synthesizing method, dictionary organizing method for speech synthesis, speech synthesis apparatus, and computer-readable medium recording speech synthesis program
EP00115589A EP1071073A3 (en) 1999-07-21 2000-07-19 Dictionary organizing method for variable context speech synthesis
KR10-2000-0041301A KR100522889B1 (ko) 1999-07-21 2000-07-19 음성합성방법,음성합성장치 및 음성합성 프로그램을 기록한 컴퓨터판독 가능한 매체
CN00120198A CN1117344C (zh) 1999-07-21 2000-07-21 声音合成方法和装置、用于声音合成的词典构筑方法
US09/621,544 US6826530B1 (en) 1999-07-21 2000-07-21 Speech synthesis for tasks with word and prosody dictionaries
HK01104509A HK1034129A1 (en) 1999-07-21 2001-06-29 Method and apparatus for speech synthesis, dictionary organizing method for speech synthesis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11205945A JP2001034282A (ja) 1999-07-21 1999-07-21 音声合成方法、音声合成のための辞書構築方法、音声合成装置、並びに音声合成プログラムを記録したコンピュータ読み取り可能な媒体

Publications (1)

Publication Number Publication Date
JP2001034282A true JP2001034282A (ja) 2001-02-09

Family

ID=16515324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11205945A Pending JP2001034282A (ja) 1999-07-21 1999-07-21 音声合成方法、音声合成のための辞書構築方法、音声合成装置、並びに音声合成プログラムを記録したコンピュータ読み取り可能な媒体

Country Status (7)

Country Link
US (1) US6826530B1 (ja)
EP (1) EP1071073A3 (ja)
JP (1) JP2001034282A (ja)
KR (1) KR100522889B1 (ja)
CN (1) CN1117344C (ja)
HK (1) HK1034129A1 (ja)
TW (1) TW523734B (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8170876B2 (en) 2007-12-07 2012-05-01 Kabushiki Kaisha Toshiba Speech processing apparatus and program
US8234117B2 (en) 2006-03-29 2012-07-31 Canon Kabushiki Kaisha Speech-synthesis device having user dictionary control
KR101203188B1 (ko) 2011-04-14 2012-11-22 한국과학기술원 개인 운율 모델에 기반하여 감정 음성을 합성하기 위한 방법 및 장치 및 기록 매체
JP2013231999A (ja) * 2006-10-19 2013-11-14 Sony Computer Entertainment Europe Ltd 音声録音における音声特性を変換するための装置および方法

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002282543A (ja) * 2000-12-28 2002-10-02 Sony Computer Entertainment Inc オブジェクトの音声処理プログラム、オブジェクトの音声処理プログラムを記録したコンピュータ読み取り可能な記録媒体、プログラム実行装置、及びオブジェクトの音声処理方法
JP2002268699A (ja) * 2001-03-09 2002-09-20 Sony Corp 音声合成装置及び音声合成方法、並びにプログラムおよび記録媒体
GB2380847A (en) * 2001-10-10 2003-04-16 Ncr Int Inc Self-service terminal having a personality controller
EP1345207B1 (en) * 2002-03-15 2006-10-11 Sony Corporation Method and apparatus for speech synthesis program, recording medium, method and apparatus for generating constraint information and robot apparatus
WO2004109659A1 (ja) * 2003-06-05 2004-12-16 Kabushiki Kaisha Kenwood 音声合成装置、音声合成方法及びプログラム
GB2427109B (en) * 2005-05-30 2007-08-01 Kyocera Corp Audio output apparatus, document reading method, and mobile terminal
KR100644814B1 (ko) * 2005-11-08 2006-11-14 한국전자통신연구원 발화 스타일 조절을 위한 운율모델 생성 방법 및 이를이용한 대화체 음성합성 장치 및 방법
US20070150281A1 (en) * 2005-12-22 2007-06-28 Hoff Todd M Method and system for utilizing emotion to search content
KR100789223B1 (ko) * 2006-06-02 2008-01-02 박상철 문자열 대응 사운드 발생 시스템
KR100859532B1 (ko) 2006-11-06 2008-09-24 한국전자통신연구원 대응 문형 패턴 기반 자동통역 방법 및 장치
GB2447263B (en) * 2007-03-05 2011-10-05 Cereproc Ltd Emotional speech synthesis
CN101727904B (zh) * 2008-10-31 2013-04-24 国际商业机器公司 语音翻译方法和装置
US8321225B1 (en) 2008-11-14 2012-11-27 Google Inc. Generating prosodic contours for synthesized speech
US8364488B2 (en) * 2009-01-15 2013-01-29 K-Nfb Reading Technology, Inc. Voice models for document narration
US10375534B2 (en) 2010-12-22 2019-08-06 Seyyer, Inc. Video transmission and sharing over ultra-low bitrate wireless communication channel
US9082400B2 (en) 2011-05-06 2015-07-14 Seyyer, Inc. Video generation based on text
JP2013072903A (ja) * 2011-09-26 2013-04-22 Toshiba Corp 合成辞書作成装置および合成辞書作成方法
GB2501067B (en) * 2012-03-30 2014-12-03 Toshiba Kk A text to speech system
US9368104B2 (en) * 2012-04-30 2016-06-14 Src, Inc. System and method for synthesizing human speech using multiple speakers and context
US9311913B2 (en) * 2013-02-05 2016-04-12 Nuance Communications, Inc. Accuracy of text-to-speech synthesis
GB2516965B (en) 2013-08-08 2018-01-31 Toshiba Res Europe Limited Synthetic audiovisual storyteller
KR102222122B1 (ko) * 2014-01-21 2021-03-03 엘지전자 주식회사 감성음성 합성장치, 감성음성 합성장치의 동작방법, 및 이를 포함하는 이동 단말기
US10803850B2 (en) * 2014-09-08 2020-10-13 Microsoft Technology Licensing, Llc Voice generation with predetermined emotion type
JP2018155774A (ja) * 2017-03-15 2018-10-04 株式会社東芝 音声合成装置、音声合成方法およびプログラム
US10671251B2 (en) 2017-12-22 2020-06-02 Arbordale Publishing, LLC Interactive eReader interface generation based on synchronization of textual and audial descriptors
US11443646B2 (en) 2017-12-22 2022-09-13 Fathom Technologies, LLC E-Reader interface system with audio and highlighting synchronization for digital books
CN113920983A (zh) * 2021-10-25 2022-01-11 网易(杭州)网络有限公司 数据处理方法、装置、存储介质和电子装置

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4692941A (en) * 1984-04-10 1987-09-08 First Byte Real-time text-to-speech conversion system
FR2636163B1 (fr) * 1988-09-02 1991-07-05 Hamon Christian Procede et dispositif de synthese de la parole par addition-recouvrement de formes d'onde
JPH04350699A (ja) * 1991-05-28 1992-12-04 Sharp Corp テキスト音声合成装置
US5384893A (en) * 1992-09-23 1995-01-24 Emerson & Stern Associates, Inc. Method and apparatus for speech synthesis based on prosodic analysis
SE9301596L (sv) * 1993-05-10 1994-05-24 Televerket Anordning för att öka talförståelsen vid översätttning av tal från ett första språk till ett andra språk
US5860064A (en) * 1993-05-13 1999-01-12 Apple Computer, Inc. Method and apparatus for automatic generation of vocal emotion in a synthetic text-to-speech system
JP3397406B2 (ja) * 1993-11-15 2003-04-14 ソニー株式会社 音声合成装置及び音声合成方法
JP2770747B2 (ja) * 1994-08-18 1998-07-02 日本電気株式会社 音声合成装置
JPH08328590A (ja) * 1995-05-29 1996-12-13 Sanyo Electric Co Ltd 音声合成装置
JPH09171396A (ja) * 1995-10-18 1997-06-30 Baisera:Kk 音声発生システム
US5913193A (en) * 1996-04-30 1999-06-15 Microsoft Corporation Method and system of runtime acoustic unit selection for speech synthesis
JPH10153998A (ja) * 1996-09-24 1998-06-09 Nippon Telegr & Teleph Corp <Ntt> 補助情報利用型音声合成方法、この方法を実施する手順を記録した記録媒体、およびこの方法を実施する装置
JPH1097290A (ja) * 1996-09-24 1998-04-14 Sanyo Electric Co Ltd 音声合成装置
US5905972A (en) * 1996-09-30 1999-05-18 Microsoft Corporation Prosodic databases holding fundamental frequency templates for use in speech synthesis
US5966691A (en) * 1997-04-29 1999-10-12 Matsushita Electric Industrial Co., Ltd. Message assembler using pseudo randomly chosen words in finite state slots
JP3667950B2 (ja) * 1997-09-16 2005-07-06 株式会社東芝 ピッチパターン生成方法
JPH11231885A (ja) * 1998-02-19 1999-08-27 Fujitsu Ten Ltd 音声合成装置
US6101470A (en) * 1998-05-26 2000-08-08 International Business Machines Corporation Methods for generating pitch and duration contours in a text to speech system
AU772874B2 (en) * 1998-11-13 2004-05-13 Scansoft, Inc. Speech synthesis using concatenation of speech waveforms
JP2000155594A (ja) * 1998-11-19 2000-06-06 Fujitsu Ten Ltd 音声案内装置
US6144939A (en) * 1998-11-25 2000-11-07 Matsushita Electric Industrial Co., Ltd. Formant-based speech synthesizer employing demi-syllable concatenation with independent cross fade in the filter parameter and source domains
JP2000206982A (ja) * 1999-01-12 2000-07-28 Toshiba Corp 音声合成装置及び文音声変換プログラムを記録した機械読み取り可能な記録媒体
US6202049B1 (en) * 1999-03-09 2001-03-13 Matsushita Electric Industrial Co., Ltd. Identification of unit overlap regions for concatenative speech synthesis system
US6185533B1 (en) * 1999-03-15 2001-02-06 Matsushita Electric Industrial Co., Ltd. Generation and synthesis of prosody templates
US6697780B1 (en) * 1999-04-30 2004-02-24 At&T Corp. Method and apparatus for rapid acoustic unit selection from a large speech corpus
US6505152B1 (en) * 1999-09-03 2003-01-07 Microsoft Corporation Method and apparatus for using formant models in speech systems
GB2376394B (en) * 2001-06-04 2005-10-26 Hewlett Packard Co Speech synthesis apparatus and selection method

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8234117B2 (en) 2006-03-29 2012-07-31 Canon Kabushiki Kaisha Speech-synthesis device having user dictionary control
JP2013231999A (ja) * 2006-10-19 2013-11-14 Sony Computer Entertainment Europe Ltd 音声録音における音声特性を変換するための装置および方法
US8825483B2 (en) 2006-10-19 2014-09-02 Sony Computer Entertainment Europe Limited Apparatus and method for transforming audio characteristics of an audio recording
US8170876B2 (en) 2007-12-07 2012-05-01 Kabushiki Kaisha Toshiba Speech processing apparatus and program
KR101203188B1 (ko) 2011-04-14 2012-11-22 한국과학기술원 개인 운율 모델에 기반하여 감정 음성을 합성하기 위한 방법 및 장치 및 기록 매체

Also Published As

Publication number Publication date
CN1117344C (zh) 2003-08-06
EP1071073A3 (en) 2001-02-14
KR20010021104A (ko) 2001-03-15
KR100522889B1 (ko) 2005-10-19
US6826530B1 (en) 2004-11-30
CN1282017A (zh) 2001-01-31
HK1034129A1 (en) 2001-11-09
TW523734B (en) 2003-03-11
EP1071073A2 (en) 2001-01-24

Similar Documents

Publication Publication Date Title
JP2001034282A (ja) 音声合成方法、音声合成のための辞書構築方法、音声合成装置、並びに音声合成プログラムを記録したコンピュータ読み取り可能な媒体
CN101578659B (zh) 音质转换装置及音质转换方法
US6873952B1 (en) Coarticulated concatenated speech
US7269557B1 (en) Coarticulated concatenated speech
US20070112570A1 (en) Voice synthesizer, voice synthesizing method, and computer program
JP2001034283A (ja) 音声合成方法、音声合成装置及び音声合成プログラムを記録したコンピュータ読み取り可能な媒体
JPS60102697A (ja) 記述メッセージコードと音声メッセージコードを結合する音声符号化方法
JP2007079397A (ja) 対話方法、対話装置、対話プログラムおよび記録媒体
JP2001034280A (ja) 電子メール受信装置および電子メールシステム
KR20220070979A (ko) 발화 스타일 인코딩 네트워크 이용한 스타일 음성 합성 장치 및 음성 합성 방법
JP3518898B2 (ja) 音声合成装置
JP4648878B2 (ja) 様式指定型音声合成方法、及び様式指定型音声合成装置とそのプログラムと、その記憶媒体
JP2001242882A (ja) 音声合成方法及び音声合成装置
JPH0419799A (ja) 音声合成装置
JPH08335096A (ja) テキスト音声合成装置
JPH07319495A (ja) 音声合成装置のための合成単位データ生成方式及び方法
JP4651168B2 (ja) 合成音声出力装置およびその方法並びに記録媒体
JPH11249679A (ja) 音声合成装置
JP2894447B2 (ja) 複合音声単位を用いた音声合成装置
JP4758931B2 (ja) 音声合成装置、方法、プログラム及びその記録媒体
JP6922306B2 (ja) 音声再生装置、および音声再生プログラム
JP3241582B2 (ja) 韻律制御装置及び方法
KR20240100869A (ko) 상대 음성 및 대화 발화 정보 기반 대화형 감성 음성합성 방법
JP3588266B2 (ja) 音声合成方法、音声合成装置及び記録媒体
JP2573586B2 (ja) 規則型音声合成装置

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050428

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20060427