JP2001343987A - 音声合成方法、および音声合成装置 - Google Patents

音声合成方法、および音声合成装置

Info

Publication number
JP2001343987A
JP2001343987A JP2000162242A JP2000162242A JP2001343987A JP 2001343987 A JP2001343987 A JP 2001343987A JP 2000162242 A JP2000162242 A JP 2000162242A JP 2000162242 A JP2000162242 A JP 2000162242A JP 2001343987 A JP2001343987 A JP 2001343987A
Authority
JP
Japan
Prior art keywords
information
candidate
sound
prolonged
long
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000162242A
Other languages
English (en)
Inventor
Makoto Hashimoto
誠 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2000162242A priority Critical patent/JP2001343987A/ja
Publication of JP2001343987A publication Critical patent/JP2001343987A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 テキストから合成音声を生成するテキスト
音声変換において、従来から知られている長音化処理を
用いる場合、同じ単語であっても、通常の発声のように
長音化して発声したい場合と一音一音明確に発音させた
い場合があったとき、夫々の場合に応じて長音化/非長
音化の切り替えを行うことは不可能であった。 【解決手段】 長音化設定手段を設けることにより、長
音化する可能性のある長音化候補位置の情報や言語情報
を利用して、一音一音明確に発音させたい場合には長音
化せず、通常発声の場合は長音化するように長音化の切
り替えを行うことができるようにする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声素片を接続す
ることによって、入力されたテキスト情報に対する合成
音声を生成する音声合成方法、およびその装置に関す
る。具体的には、長音化する可能性のある特定の音声の
位置に対して、長音の音声素片を採用するか否かの設定
に関する。
【0002】
【従来の技術】近年、漢字かな混じり文章のテキストを
入力すると、その文章に対する合成音声を生成する音声
合成方法、あるいはその装置が開発されており、その合
成音声の品質を向上させる試みが続けられている。
【0003】このような合成音声の品質を左右する重要
な要因の1つに、長音の処理を如何に行うかという点が
ある。
【0004】たとえば、従来、文章の読み情報として与
えられる平仮名あるいは片仮名のテキスト情報に基づ
き、各テキスト毎に対応する音声素片を接続する音声合
成方法においては、長音の省略が可能か否かの情報に基
づいて、合成音声の品質の向上を図る提案がされてい
る。具体的には、単語「コンピューター」の発声に関
し、単語の末尾の長音「ー」については、省略が可能で
あるとする情報が付与される。一方、この末尾の前方に
位置する長音「ー」には省略不可能であるとする情報が
付与されるのである。結果、合成音声による「コンピュ
ーター」、あるいは「コンピュータ」なる発声は許容さ
れるが、「コンピュター」、あるいは「コンピュタ」な
る発声は禁止される(特開平3−156663号)。
【0005】日本語の発音における長音の特性上、従来
装置のような長音の付加や省略の処置とは異なり、特定
の音声の位置において、その読み情報に対する音声素片
に代えて、長音の音声素片を採用することが好ましい場
合がある。
【0006】例えば、単語「経験」の読みは、カタカナ
表記で「ケイケン」となるが、実際には、カタカナ表記
で「ケーケン」と発音する方が音声の品質がよく、聞き
手にとって自然に聞こえるのである。このことは、エ段
音(「エ」、「ケ」、「セ」、・・・)の直後の「イ」
は、長音に変更して発音することができるとする発音規
則による。
【0007】また、オ段音(「オ」、「コ」、「ソ」、
・・・)の直後の「ウ」を長音に変更することができる
とする発音規則により、たとえば、読みとして「ホウコ
ク」が与えられる単語「報告」が「ホーコク」と発音す
る方が聞き手にとって自然に聞こえるのである。これら
の発音規則としては、NHK発行の「発音アクセント辞
典」などに詳しい。
【0008】従って、従来の音声合成方法においては、
通常は、発音規則に基づき、特定の読みに対して長音の
音声を割り当てて音声合成を行っていた。
【0009】一方、音声合成装置の用途によっては、た
とえば、漢字の読みの学習教材として使用するため、単
語「経験」は読み「ケイケン」のとおり、一音毎に
「ケ」、「イ」、「ケ」、「ン」と聞えるように音声合
成を行うことが必要となる場合がある。
【0010】しかしながら、従来の音声合成装置におい
ては、長音への変更が許容された特定の読み情報に対す
る長音化を行うか否かについては、入力された読みの情
報(たとえば、テキスト情報)を解析する過程におい
て、一義的に決定されていた。たとえば、長音への変更
が許容された特定の読み情報が全て長音情報に変更され
る変換テーブル機能を持つ言語辞書を用いることによっ
て、長音への変更が許容された特定の読みの音声は全て
を長音化されることになる。
【0011】このように、従来の音声合成装置において
は、特定の読み情報を長音情報に変更する(以後、長音
化と称する)か否かについて、ユーザーが自由に設定す
ることはできなかった。
【0012】一方、同じ長音化が可能な音声(音素、単
語、句などの単位)であっても、その音声が文章中のど
こに存在するかによって、あるいはその言語情報(品
詞、体言であるかどうか、自律語であるかどうか)など
の環境の違いによって、長音化の処理が好ましい場合と
好ましいくない場合がある。即ち、長音可の処理によっ
て、聞き取り易くなる場合も、かえって聞きづらくなる
場合もある。
【0013】このように、従来の長音化のための処理を
行う場合では、同じ単語であっても、通常の発声のよう
に長音化させたい場合と、読みの一音一音を明確に発音
させたい場合があったとしても、任意に長音化と非長音
化との切り替えを行うことはできなかった。
【0014】
【発明が解決しようとする課題】従来の音声合成方法、
あるいはその装置においては、前述の不都合を解消する
ために、言語辞書に長音化に対応した読みと非長音化に
対応した読みの両方を登録することにより、長音化/非
長音化を指定することができるようにする方法も考えら
れる。然し乍ら、この方法では、指定をその都度変更し
ない限り、長音化と非長音化のどちらかに固定されてし
まう不都合があり、自由な設定は行われていなかった。
さらに、この場合は、登録語数が増えるに従って、言語
辞書が膨大になるという問題があった。
【0015】また、小型機器などに搭載される音声合成
システムにおいては、入力テキストが漢字かな混じりで
はなく、片仮名テキスト(片仮名コード列)である場合
もある。この場合、見出しや読み、品詞などを登録する
ための言語辞書は省略されることが多いため、長音化と
非長音化との切り替えは困難であった。
【0016】従って、本発明は、長音化の候補がある語
句などについて、通常の発音のように長音化させたい場
合と、読みのとおり一音一音明確に発音させたい場合と
の両方に適応できる音声合成方法、及びその装置を提供
することを目的とする。
【0017】
【課題を解決するための手段】本発明の音声合成方法
は、音声の読み情報に基づいて、長音とは異なる音声に
ついての読み情報を長音に対応する長音情報に変更する
長音化処理を行うことが可能な長音化候補位置を予め設
定しておき、該長音化候補位置に対して前記長音化処理
を実行するか否かの設定を可能としたものである。これ
によって、長音化の候補に対して、選択的に長音化を行
うことができるので、合成音声の用途や目的などに応じ
た聞き取りの容易な音声合成方法を実現できる。
【0018】また、本発明の音声合成方法は、入力され
たテキスト情報を解析することによって少なくとも読み
情報を生成する解析処理と、生成された読み情報に基づ
いて、長音とは異なる音声についての読み情報を長音に
対応する長音情報に変更する長音化処理を行うことが可
能な長音化候補位置を検出する長音化候補検出処理と、
検出された各長音化候補位置の読み情報を前記長音情報
に変更するか否かを設定した規則に基づき、所定の音声
の読み情報を前記長音情報に変更する長音化処理と、該
長音化処理された読み情報に基づいて音声素片を編集し
て合成音声を生成する素片編集処理とからなるものであ
る。これによって、長音化を行う規則を設定することに
より、聞き取り易い合成音声を生成することができる。
【0019】この場合の規則は、文中の長音化候補の位
置情報に基づいており、この位置情報として、長音化候
補が含まれる文の位置、長音化候補が含まれる文節の位
置、長音化候補が含まれる単語の位置、長音化候補が含
まれるモーラの位置、長音化候補が含まれる音節の位
置、長音化候補が含まれるポーズで挟まれた区間の位
置、長音化候補が含まれるアクセント句の位置、あるい
は長音化候補が含まれる呼気段落の位置がある。長音化
候補の存在位置に依存する日本語の言語上の長音化に関
する規則を設定でき、自然な合成音声を生成することが
できる。
【0020】また、この場合の規則は、文中の長音化候
補の言語情報、即ち、品詞情報、体言、体言止め、自立
語、あるいは付属語などに基づいている。長音化候補の
言語情報に依存する日本語の言語上の長音化に関する規
則を設定でき、自然な合成音声を生成することができ
る。
【0021】さらに、本発明の音声合成装置は、入力さ
れたテキスト情報を解析することによって少なくとも読
み情報を生成する解析処理部と、生成された読み情報に
基づいて、長音とは異なる音声についての読み情報を長
音に対応する長音情報に変更できる長音化候補位置を検
出する長音化候補検出処理部と、検出された各長音化候
補位置の読み情報を長音に変更するか否かを設定した規
則を備えた長音化設定部と、該長音化設定部に備えられ
た規則により定められた位置の読み情報を前記長音情報
に変更する長音化処理部と、該長音化処理された読み情
報に基づいて、音声素片を編集して合成音声を生成する
音声合成部とからなるものである。従って、長音化を行
う規則が設定でき、聞き取り易い合成音声を生成する音
声合成装置を実現することができる。
【0022】
【発明の実施の形態】本発明の実施の形態を図1乃至図
6に基づいて説明する。
【0023】図1は本発明の音声合成装置の構成を示す
ブロック図である。同装置においては、漢字かな混じり
文章がテキスト情報1aとして入力されるのに対して、素
片合成方式により合成音声7aを生成するものであり、
この合成音声7aの特定箇所における長音化/非長音化
の切り替え処理が可能となっている。
【0024】まず、入力されたテキスト情報1a(漢字か
な混じり文章)に対して、その単語ごとの「読み」や
「品詞」などを判定し、「アクセント」や「ポーズ」な
どを決定する。このため、解析部1においては、図示し
ていないが、たとえば、一般的な形態素解析のためのシ
ステムに用いられる単語単位の「読み」、「品詞」、
「アクセント」、「ポーズ」の情報を記憶した言語辞書
を備えており、テキスト情報1aに対しての照合処理に
より、これらの情報が割り当てられることになる。な
お、ここでは、読みの情報のために、音節レベルまでの
検出が行われている。
【0025】長音化候補検出部2は、テキスト解析部1
によって解析された結果に対して長音化する可能性のあ
る箇所を検出するものである。ここでの検出方法として
は、たとえば、図2に示すように長音化候補リストが使
用される。このリストには、日本語の発音規則において
長音化が認められる読みとその条件となる直前の読みの
組み合わせ(2音節、あるいは3音節)が蓄積されてお
り、たとえば、エ段音の直後の「イ」、あるいはオ段音
の直後の「ウ」が長音化の候補として含まれている。
【0026】このような長音化候補リストを用いる場
合、テキスト解析部1から得られる読み情報、即ち、読
みの文字列(例えば、カタカナテキストの文字列)に対
し、第2音節以降の文字列とリスト内の文字列とが一致
するかどうかを検索し、一致した部分を長音化の可能性
のある箇所、即ち、長音化の候補の位置として検出する
ことができる。
【0027】また、この長音化候補検出部2において
は、テキスト解析部1に用いられる言語辞書の各単語に
対して、その単語の特定の部分が長音化する可能性があ
るか否かの情報を付与させておき、入力されたテキスト
情報の解析時に、この言語辞書により合致した単語に付
与された長音化の可能性を示す情報を検出することも可
能である。
【0028】長音化設定部3には、あらかじめ特定の音
声箇所に対する長音化/非長音化の規則が設定されてい
る。この長音化/非長音化の規則は、図3に示すよう
に、複数の条件により構成されている。この場合、規則
1は、「長音化候補の音節が文節中の第1音節以外で、
且つ、その単語が固有名詞であれば、すべて長音化させ
ない」とするものである。規則2は、「長音化候補の音
節が文節中の最終音節で、且つ、その文節位置が文中の
最終文節ならば、普通名詞について、ずべて長音化させ
ない」とするものである。規則3は「文節中の第1音節
以外の体言止の場合は、すべて長音化させない」とする
ものである。この場合、以上の規則1〜3により、これ
らの規則に該当しない長音化候補の音節には、長音化が
行われる規則が設定されていることと見なすことができ
る。
【0029】長音化処理部4は、長音化設定部3に設定
された規則に基づいて、長音化する可能性のある箇所に
対する長音化/非長音化を決定する。即ち、規則に従っ
て特定の候補の読み情報について、長音の読み情報
「ー」への変更が行われる。
【0030】音素・韻律決定部5では、前記長音化処理
部4にて決定された長音化が施された読み情報を用い
て、音素記号列への変換と、テキスト解析部1で決定さ
れたアクセントやポーズなどの情報に基づいた韻律情報
(例えば、基本周波数、パワー、音素継続時間長)の決
定を行う。この音素・韻律決定部5で得られた結果は、
たとえば、図4に示すように、各音素に対して韻律情報
が与えられる。図4において、各音素記号に対応する基
本周波数は音の高さを表す情報、音素継続時間長は音の
長さを表す情報、パワー係数は音声素片にかけるパワー
の重み係数を意味する。パワー係数が1.0の場合は、
音声データベースから選択された音声素片のパワーをそ
のまま利用することを意味する。
【0031】従って、長音化された音節に関しては、直
前の母音の音素が延長されることになる。たとえば、
「e」の場合、この音素継続時間長102msecが延
長されるのであるが、この延長時間と共に基本周波数の
変動やパワーの変動も制御することができる。なお、こ
れらの情報は音素・韻律決定部5にて一義的に設定する
こともできるが、テキスト解析部1に備えられる言語辞
書において単語毎、あるいは文章中の単語の位置を反映
した設定を行うことも可能である。
【0032】音声合成部7では、音素・韻律決定部5か
ら得られる音素記号列に合致するように、音声データベ
ース6から適切な音声素片を選択し、それらを接続する
ことによって、テキスト1aに対応し、所定の長音化処
理がなされた合成音声7aが生成される。
【0033】以上においては、文節中における長音化候
補位置に関する規則(規則1、2、3)に基づいて、長
音化/非長音化の設定を行う場合について、例示した
が、本発明の実施例はこれに限られない。即ち、本発明
においては、長音化候補となる音素やそれを備える単語
が含まれる文章の位置、同様に長音化候補が含まれる文
の位置、長音化候補が含まれる文節の位置、長音化候補
が含まれる単語の位置、長音化候補が含まれるモーラの
位置、長音化候補が含まれる音節の位置、長音化候補が
含まれるポーズで挟まれた区間の位置、長音化候補が含
まれるアクセント句の位置、あるいは長音化候補が含ま
れる呼気段落の位置に基づいて、長音化/非長音化の設
定を行うことも可能である。このように音声の単位を木
目細かく細分化した上での長音化の候補の位置を考慮す
るためには、音素、モーラ、ポーズの区間、アクセント
句、吸気段落などに関する情報を備えた言語辞書を備え
ることによって、夫々の位置関係が解析できることにな
る。
【0034】次に、本発明において、特定箇所のみ非長
音化の設定を行った場合の動作例を図5のフローチャー
トを用いて説明する。
【0035】まず、ステップ10で、テキストが入力さ
れたことを検知すると、テキスト解析部1においてステ
ップ11のテキスト解析に移る。例えば、入力テキスト
が「国道1号線、京橋付近、渋滞です。」であった場
合、ステップ11では、漢字の読み、アクセント、ポー
ズ情報などが決定される。漢字かな混じり文を入力とす
る場合、テキスト解析のステップにおいて、見出し、見
出し、品詞、読み、音素記号列などの言語的情報を記述
した言語辞書が参照される。
【0036】ステップ12にて、ステップ11による解
析の出力に対して、長音化候補検出部2にて長音化候補
リスト(図2)を参照することによって、長音化の可能
性のある部分があるか否かを検索する。ここで、長音化
の候補が存在する場合は、ステップ13に進み、長音化
設定部3の長音化/非長音化規則(図3)を参照して、
長音化/非長音化の設定が行われているか否かを判定
し、この設定がされていればステップ15に進む。この
ステップ13にて、長音化の設定が行われていなけれ
ば、ステップ14に進み、長音化処理部4にて通常の長
音化処理を行いステップ17に進む。図3の場合、規則
1、2、3のいずれにも該当しないものは、通常の長音
化が行われることになる。
【0037】さて、ステップ15では、抽出された長音
化候補位置の音素記号に対して、長音化/非長音化の設
定条件との比較を行い、設定条件に合致する長音化候補
位置の音素記号が存在するか否かを抽出する。これが存
在した場合は、ステップ16において、該当する箇所を
設定内容に従って、長音化処理部4にて長音化または非
長音化の処理を行いステップ17に進む。存在しなかっ
た場合は、そのままステップ17に進む。
【0038】ステップ17からステップ20までは、通
常の素片編集方式の音声合成処理と同じである。まず、
ステップ17では、以上のステップにより処理された長
音化の部分あるいは非長音化の部分を含む入力テキスト
に対して、音素・韻律決定部5により、音素時系列への
変換による音素情報と、各音素あるいは短時間毎の韻律
情報(主に、基本周波数、パワー、音素継続時間長)を
決定する。ステップ18では、音声データベース6か
ら、音素情報と韻律情報に基づいて、最適な音声素片を
選択し、ステップ19にて各音声素片の接続と、韻律情
報に基づいた韻律制御を行って、ステップ20で合成音
声を生成する。
【0039】これにより、テキスト全体だけでなく、特
定箇所に対する長音化/非長音化の設定を行うことが可
能となり、単語などによって一音一音明確に発音させた
い場合が生じても柔軟に対応できるため、所望の合成音
声を生成することができる。
【0040】次に、本発明を適用した一例として、入力
テキストの内容が「国道1号線、京橋駅付近、渋滞で
す。」であり、長音化設定部3の規則の内容が図6に示
すように「地名のみ長音化させない」とした場合につい
て以下に説明を加える。
【0041】まず、テキスト解析部1によって、漢字の
読みやアクセント、ポーズなどの情報が決定される。ア
クセント情報を上向き矢印「↑」、ポーズ情報を三角印
「△」で現すと、上記のテキストの場合、「こ↑くどう
いちごうせん△きょ↑うばしふ↓きん△じゅ↑うたいで
↓す」といった読みを主体とした中間情報が生成され
る。
【0042】このとき、「京橋」が地名である固有名
詞、「国道」「1号線」「付近」「渋滞」が普通名詞、
「です」が助動詞、などの品詞情報も決定される。
【0043】長音化候補検出部2は、図2の長音化候補
リストを参照するか、または言語辞書に登録された長音
化の可能性を示す情報を参照して「きょうばし」「こく
どう」「いちごうせん」の3単語が長音化する可能性の
ある長音化候補の音素を含んだ長音化対象語として抽出
される。
【0044】長音化処理部4では、長音化/非長音化設
定内容と長音化対象語の内容を解析し、この場合、地名
である「きょうばし」のみが設定内容に合致すると判断
され、「きょうばし」は長音化されず、「こくどう」と
「いちごうせん」は、それぞれ長音化されて「こくど
ー」「いちごーせん」に変換される。
【0045】従って、この段階で生成された中間情報は
「こ↑くどーいちごーせん△きょ↑うばしふ↓きん△じ
ゅ↑うたいで↓す」となる。この中間情報と品詞情報に
基づき、音素・韻律決定部5において音素情報と韻律情
報(主に、基本周波数、パワー、音素継続時間長)が決
められる。
【0046】この後、音声合成部7において、音素・韻
律決定部5から得られる音素情報と韻律情報に基づい
て、音声データベースからの最適音声素片の選択と音声
素片の接続に加えて、韻律制御処理等が行われ、所望の
合成音声が生成される。
【0047】なお本実施例では、音素情報に変換する前
に長音化/非長音化の処理を行っているが、音素情報に
変換された後に行うことも可能である。
【0048】以上においては、読み情報に対応する文中
の長音化候補が含まれる語句に関する言語情報が「地
名」であるという品詞情報に基づいた規則について例示
したが、この言語情報として、品詞情報、体言、体言止
め、自立語、あるいは付属語などであるか否か(言語辞
書に辞書情報として記憶されている)に基づく規則が利
用できる。
【0049】たとえば、体言止の場合、その体言の語を
強調するために、その語が長音化候補を含んでいた場合
であっても、その長音化を禁止して、一音一音明瞭に発
音させることができる。本発明の音声合成装置の用途
(言語の学習教材など)により、読みを明確に発声した
い語の音声を非長音化すること、強調した発声を行いた
い語の音声を非長音化すること、自然で明瞭な発音をし
たい語の音声を長音化することの規則を設定することが
でき、この場合には、その語の品詞情報、その語が体言
であるか否か、あるいはその語が自立語であるか付属語
であるかなどに基づいく規則が可能となる。
【0050】また、図2の長音化候補リストは、日本語
の音節に対する候補を示しているが、外来語に対応させ
るためには、さらに候補が追加される可能性がある。
【0051】また、通常、長音化する可能性が生じる音
素または音節は、文節中の第2音節以降となることが言
語学上知られているので、これを強制的な規則とし、図
3の設定可能な規則においては、「文節中の第1音節以
外」という部分的な規則の設定は省略できる構成しても
よい。
【0052】
【発明の効果】以上の説明から明らかなように、本発明
によれば、音声合成処理の際の柔軟な長音化/非長音化
の処理が可能となり、従来技術であれば必ず長音化され
ていた単語の発音を一音一音明確に発音させたいような
場合への対応が可能となり、所望の合成音声を生成する
ことができる効果を奏する。
【図面の簡単な説明】
【図1】実施の形態のブロック図
【図2】実施の形態における長音化候補リストの内容を
示す模式図
【図3】実施の形態における長音化/非長音化規則の内
容を示す模式図
【図4】実施の形態における音素・韻律決定部の出力内
容を示す模式図
【図5】実施の形態におけるフローチャートを示す図
【図6】他の実施の形態における長音化/非長音化規則
を示す図
【符号の説明】
1a…テキスト 1 …テキスト解析部 2 …長音化箇所検出部 3 …長音化設定部 4 …長音化処理部 5 …音素・韻律決定部 6 …音声データベース 7 …音声合成部 7a …合成音声

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 音声の読み情報に基づいて、長音とは異
    なる音声についての読み情報を長音に対応する長音情報
    に変更する長音化処理を行うことが可能な長音化候補位
    置を予め設定しておき、該長音化候補位置に対して前記
    長音化処理を実行するか否かの設定を可能とした音声合
    成方法。
  2. 【請求項2】 入力されたテキスト情報を解析すること
    によって少なくとも読み情報を生成する解析処理と、生
    成された読み情報に基づいて、長音とは異なる音声につ
    いての読み情報を長音に対応する長音情報に変更する長
    音化処理を行うことが可能な長音化候補位置を検出する
    長音化候補検出処理と、検出された各長音化候補位置の
    読み情報を前記長音情報に変更するか否かを設定した規
    則に基づき、所定の音声の読み情報を前記長音情報に変
    更する長音化処理と、該長音化処理された読み情報に基
    づいて音声素片を編集して合成音声を生成する素片編集
    処理とからなる音声合成方法。
  3. 【請求項3】 前記長音化処理にて設定される規則は、
    音声の読み情報における前記長音化候補位置に関する位
    置情報に基づくことを特徴とする請求項2記載の音声合
    成方法。
  4. 【請求項4】 前記長音化候補位置に関する位置情報と
    は、長音化候補が含まれる文章の位置、長音化候補が含
    まれる文の位置、長音化候補が含まれる文節の位置、長
    音化候補が含まれる単語の位置、長音化候補が含まれる
    モーラの位置、長音化候補が含まれる音節の位置、長音
    化候補が含まれるポーズで挟まれた区間の位置、長音化
    候補が含まれるアクセント句の位置、あるいは長音化候
    補が含まれる呼気段落の位置である請求項3記載の音声
    合成方法。
  5. 【請求項5】 前記長音化処理にて設定される規則は、
    読み情報に対応する文中の長音化候補が含まれる語句に
    関する言語情報に基づいていることを特徴する請求項2
    記載の音声合成方法。
  6. 【請求項6】 前記言語情報は、品詞情報、体言、体言
    止め、自立語、あるいは付属語である請求項5記載の音
    声合成方法。
  7. 【請求項7】 入力されたテキスト情報を解析すること
    によって少なくとも読み情報を生成する解析処理部と、
    生成された読み情報に基づいて、長音とは異なる音声に
    ついての読み情報を長音に対応する長音情報に変更でき
    る長音化候補位置を検出する長音化候補検出処理部と、
    検出された各長音化候補位置の読み情報を長音に変更す
    るか否かを設定した規則を備えた長音化設定部と、該長
    音化設定部に備えられた規則により定められた位置の読
    み情報を前記長音情報に変更する長音化処理部と、該長
    音化処理された読み情報に基づいて、音声素片を編集し
    て合成音声を生成する音声合成部とからなる音声合成装
    置。
JP2000162242A 2000-05-31 2000-05-31 音声合成方法、および音声合成装置 Pending JP2001343987A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000162242A JP2001343987A (ja) 2000-05-31 2000-05-31 音声合成方法、および音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000162242A JP2001343987A (ja) 2000-05-31 2000-05-31 音声合成方法、および音声合成装置

Publications (1)

Publication Number Publication Date
JP2001343987A true JP2001343987A (ja) 2001-12-14

Family

ID=18666163

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000162242A Pending JP2001343987A (ja) 2000-05-31 2000-05-31 音声合成方法、および音声合成装置

Country Status (1)

Country Link
JP (1) JP2001343987A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005070611A (ja) * 2003-08-27 2005-03-17 Oki Electric Ind Co Ltd 音声合成方法
JP2007156273A (ja) * 2005-12-07 2007-06-21 Nippon Telegr & Teleph Corp <Ntt> 読み付与装置、読み付与方法及びプログラム
JP2013205638A (ja) * 2012-03-28 2013-10-07 Yamaha Corp 音声合成装置
CN111028823A (zh) * 2019-12-11 2020-04-17 广州酷狗计算机科技有限公司 音频生成方法、装置、计算机可读存储介质及计算设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005070611A (ja) * 2003-08-27 2005-03-17 Oki Electric Ind Co Ltd 音声合成方法
JP2007156273A (ja) * 2005-12-07 2007-06-21 Nippon Telegr & Teleph Corp <Ntt> 読み付与装置、読み付与方法及びプログラム
JP2013205638A (ja) * 2012-03-28 2013-10-07 Yamaha Corp 音声合成装置
US9552806B2 (en) 2012-03-28 2017-01-24 Yamaha Corporation Sound synthesizing apparatus
CN111028823A (zh) * 2019-12-11 2020-04-17 广州酷狗计算机科技有限公司 音频生成方法、装置、计算机可读存储介质及计算设备
CN111028823B (zh) * 2019-12-11 2024-06-07 广州酷狗计算机科技有限公司 音频生成方法、装置、计算机可读存储介质及计算设备

Similar Documents

Publication Publication Date Title
US6751592B1 (en) Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically
JPH0922297A (ja) 音声‐テキスト変換のための方法および装置
JP2006048056A (ja) 混合言語テキスト音声合成
JP4704254B2 (ja) 読み修正装置
JPH05165486A (ja) テキスト音声変換装置
KR101747873B1 (ko) 음성인식을 위한 언어모델 생성 장치 및 방법
Stöber et al. Speech synthesis using multilevel selection and concatenation of units from large speech corpora
JP5343293B2 (ja) 音声編集合成装置及び音声編集合成方法
JP2001343987A (ja) 音声合成方法、および音声合成装置
JP3366253B2 (ja) 音声合成装置
JP3060276B2 (ja) 音声合成装置
JP2001117583A (ja) 音声認識装置および音声認識方法、並びに記録媒体
JPH09244677A (ja) 音声合成システム
JPH096378A (ja) テキスト音声変換装置
JPH0634175B2 (ja) 文章読上げ装置
JP2000276189A (ja) 日本語ディクテーションシステム
JPH0229797A (ja) テキスト音声変換装置
Leonardo et al. A general approach to TTS reading of mixed-language texts
JPH0760378B2 (ja) 文章読み上げ装置
JP2728440B2 (ja) 音声出力装置
KR20030079460A (ko) 텍스트/음성 변환 장치 및 방법
JPH07134596A (ja) 音声合成用音声持続時間処理方法及びその装置
JPH02234198A (ja) テキスト音声合成システム
JPH02247696A (ja) テキスト音声合成装置
JPH06176023A (ja) 音声合成システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050201

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20051227

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070312

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070327

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070724