JPH11344997A - 音声合成方法 - Google Patents

音声合成方法

Info

Publication number
JPH11344997A
JPH11344997A JP10152884A JP15288498A JPH11344997A JP H11344997 A JPH11344997 A JP H11344997A JP 10152884 A JP10152884 A JP 10152884A JP 15288498 A JP15288498 A JP 15288498A JP H11344997 A JPH11344997 A JP H11344997A
Authority
JP
Japan
Prior art keywords
information
speech
unit
accent
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10152884A
Other languages
English (en)
Inventor
Makoto Hashimoto
誠 橋本
Hiroki Onishi
宏樹 大西
Hiroyuki Hirai
啓之 平井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP10152884A priority Critical patent/JPH11344997A/ja
Publication of JPH11344997A publication Critical patent/JPH11344997A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 従来の素片接続型音声合成は、韻律制御処
理、音声データベースから最適な素片を選択する検索処
理、接続歪を低減させる接続処理等の処理を必要とし、
音声データベース容量も大きいため、簡易な音声合成シ
ステムに使用するには音質劣化の原因となっていた。 【解決手段】 テキスト情報を入力する文字情報入力部
と、入力されたテキストを解析して表記情報とアクセン
ト情報を出力する文字情報解析部と、あらかじめ複数の
音程情報を有する音声素片を記憶しておく音声データベ
ースと、該音声データベースに記憶されている音声素片
を取り出して接続することによって合成音声を生成する
音声合成部とを有し、音声データベースから取り出され
る音声素片は、前記文字情報解析部の出力である表記情
報とアクセント情報に合致、又は類似した音声素片であ
ることを特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声素片を接続す
ることによって、入力されたテキストに対する音声を生
成する音声合成方法に係わり、アクセント情報の単純化
によって、処理量を低減しながら、かつ適切なアクセン
ト情報に従ってテキスト情報を正確に読み上げることが
できる音声合成方法に関する。
【0002】
【従来の技術】録音した単語程度の長さの音声を接続し
て所望の文章音声を生成する録音編集による音声合成方
法が従来から知られている。これは、「次は」、「京
都」、「行き」等の単語を予め記憶しておき、これらを
組み合わせることで文章を生成する方法である。このよ
うな技術は、駅や電車のアナウンス等に利用されてい
る。
【0003】例えば、「次の電車は、快速京都行きで
す。」という内容の音声を生成させる場合は、図6の如
き、予め録音してある音声データから、「次」「京都」
「電車」「行き」「快速」「は」「の」「です」の音声
を選んで接続する。
【0004】このような技術は、駅や電車のアナウンス
等に利用されている。
【0005】更に、音声波形のまま接続する波形素片接
続型音声合成方法や、また音声データを分析して得られ
るパラメータを接続するパラメータ合成方法が知られて
いる。これらは、単語よりも短い素片、例えば、音素や
CV(子音+母音)、CVC(子音+母音+子音)等の
音声素片を音声データベースから選択して接続すること
で、所望の音声を生成しようとするものである。「波形
素片接続型音声合成方法」は、音声波形をそのままディ
ジタル化したものをデータベースとして記憶しておくた
め音質がよい。「パラメータ合成方法」は、音声分析に
よって得られるスペクトルや基本周波数、音韻継続時間
長等の音響的パラメータを記憶しておき、これらのパラ
メータを接続しようとするものである。パラメータ合成
方法は、音声を一旦パラメータに変換するため音質劣化
が生じやすい。
【0006】
【発明が解決しようとする課題】しかしながら、従来の
録音編集による音声合成方法では、生成される文章全体
の韻律、特にアクセント型等が考慮されていなかったた
め、接続後の音声全体の自然性が欠けるという問題があ
った。
【0007】また、素片接続型音声合成は、韻律制御処
理、音声データベースから最適な素片を選択する検索処
理、接続歪を低減させる接続処理等の処理を必要とし、
音声データベース容量も大きいため、簡易な音声合成シ
ステムに使用するには音質劣化の原因となるデータベー
ス容量の削減や処理量の削減が必要であるという問題点
があった。
【0008】従って、本発明は上記の事情に鑑み、デー
タ容量、処理量を大幅に削減し、かつ、最適なアクセン
ト情報に従ってテキスト情報を正確に読み上げることが
可能な音声合成方法を提供することを目的とする。
【0009】
【課題を解決するための手段】本発明の音声合成方法
は、テキスト情報を入力する文字情報入力部と、入力さ
れたテキストを解析して表記情報とアクセント情報を出
力する文字情報解析部と、あらかじめ複数の音程情報を
有する音声素片を記憶しておく音声データベースと、該
音声データベースに記憶されている音声素片を取り出し
て接続することによって合成音声を生成する音声合成部
とを有し、音声データベースから取り出される音声素片
は、前記文字情報解析部の出力である表記情報とアクセ
ント情報に合致、又は類似した音声素片であることを特
徴とする。
【0010】また、前記音声データベースに記憶された
音声素片の音程情報を高低の2種類とし、前記文字情報
解析部で出力するアクセント情報は、高低のどちらかを
示すものであることを特徴とする。
【0011】前記音声データベースに記憶しておく音声
素片は、単音節、音素、モーラ、CV(子音+母音)、
VC(母音+子音)、VV(母音+母音)のうちいずれ
かであることを特徴とする。
【0012】
【発明の実施の形態】本発明の実施の形態を図1乃至図
5に基づいて説明する。
【0013】図1は、本発明の音声合成方法の概略ブロ
ック図である。図1において、入力された文字情報が文
字情報解析部1により解析され、音素列決定部1aで音
素列情報が、更にその音素列決定部1aの後段のアクセ
ント情報決定部1bで入力文字列のアクセント情報が決
定される。
【0014】ここで、音素列決定部1aは、文字情報入
力部から入力された文字情報に対応した音素記号を求め
る。具体的には、例えば文字情報が「おおにし」であれ
ば「/oonisi/」の音声列情報を求める。
【0015】次に、アクセント情報決定部1bは、音素
列情報に対するアクセント情報を決定する。具体的に
は、例えば、文字情報が「おおにし」であればアクセン
ト型が平板型であるという情報が決定される。
【0016】音素列決定部1aで決定された「音素列情
報」、及びアクセント情報決定部1bで決定された「ア
クセント情報」は、音声素片取り出し部2に送られる。
音声素片取り出し部2は、音声データベース3から音素
列情報とアクセント情報に合致した素片を選択する。
【0017】音声素片取り出し部2で選択された素片
は、音声素片接続部4に送られた後、接続されて合成音
声として出力される。
【0018】このとき、音声素片接続部4は、図2に示
すように、例えば音声データベース3から選択された音
素が例えば「o」、「o」、「ni」、及び「si」で
あり、また夫々の音素の音程情報が「低い」、「高
い」、「高い」、及び「高い」であり、それらの音素を
接続することにより合成音声として出力する。次に、本
発明を適用した一例としてナンバーディスプレイ対応の
電話機について説明する。
【0019】図3において、公衆電話回線に接続された
受信部200は、その回線を介して音声、及び電話番号
情報を取得する。このうち、電話番号情報は送信元番号
抽出部201で抽出されて表示部202に送られて表示
される。
【0020】送信元番号抽出部201で抽出された番号
情報は、登録データ検索部203に送られる。登録デー
タベース204には、図4に示すように、「登録番
号」、「電話番号」、「名前情報」、及び「アクセント
情報」が予め登録されており、登録データ検索部203
は、送信元番号抽出部201から送信されてきた電話番
号情報が、登録データベース204に登録されているか
否かを検索し、登録されている場合、名前情報を文字情
報解析部1に送る。
【0021】尚、図4に示した「アクセント情報」のう
ち「0型」とは、アクセント核がないものをいい、「1
型」とは、1モーラ目にアクセント核があるものをい
う。
【0022】文字情報解析部1、音声素片取り出し部
2、及び音声素片接続部4の動作は前述した通りである
ので、ここでは割愛する。
【0023】次に、図5は、公衆電話回線を介して受信
した番号情報を、予め登録データベース204に登録し
ておいた送信相手側の名前を読み出した後、読み上げる
際の動作を説明するためのフローチャートである。
【0024】図5において、ステップS101で、電話
が着信状態となったか否かを判断し、着信状態であれ
ば、ステップS102に進む。ステップS102では送
信元番号抽出部201によって抽出された電話番号の表
示が許可されていれば、ステップS103で送信元の電
話番号情報を表示部202に表示する。
【0025】ステップS104では、登録データ検索部
203によって、送信元番号抽出部201から送られた
電話番号情報に対応する名前情報が、登録データベース
204に登録されているかどうかを調べ、登録されてい
れば、ステップS105で登録データベース204から
名前情報の取得を行う。
【0026】次に、ステップS106では、取得された
名前情報を表示部202に表示する。これによって、表
示部202には、ステップS103で処理された電話番
号情報、及びステップS106で処理された名前情報が
表示されることになる。
【0027】ステップS107では、名前情報を解析す
る。具体的には、ステップS108で音素列決定部1a
により名前情報を音素列に変換する。次に、ステップS
109では、アクセント情報決定部1bにより、登録デ
ータベース204から取得したデータに基づき、アクセ
ント情報を決定する。
【0028】ステップS110では、取得された名前情
報、及びアクセント情報に基づいて、音声素片取り出し
部2により、音声データベース3から最適な音声素片を
選択する。ステップS111では、それらの素片を接続
して、ステップS112で固定メッセージ(例えば、
「さんからお電話です」)と接続して合成音声を生成す
る。
【0029】ステップS113では、通常の電話機能処
理、即ち受話器を上げることにより、送信元と通話をす
ることができる。
【0030】次に、登録データベース204への名前情
報の登録方法について説明する。名前情報の登録モード
になると、以下のようなメッセージを表示して、名前の
入力を待つ。
【0031】「ナマエヲ ニュウリョクシテ クダサ
イ」この指令を受けて、使用者は、電話機の図示しない
ボタンの押下によって名前を入力する。入力された名前
情報の文字数に基づいてアクセントをつけた合成音声を
生成すると同時に、以下のようなメッセージを表示す
る。
【0032】「アクセントヲ トウロクシマス。オンセ
イシュツリョク ボタンヲ オシテクダサイ」合成音出
力指示を検知すると、アクセントをつけた合成音声を出
力すると同時に以下のようなメッセージを表示する。
【0033】「OKナラバ1ヲ、ダメナラバ0ヲ オシテ
クダサイ」ここで、「0」が押下された場合、アクセン
ト型を変えた合成音声を生成出力する。
【0034】一方、「1」が押下された場合は、アクセ
ント情報として記憶装置に登録する。登録された情報の
フォーマットは、図4(a)のようにアクセント型を記
述しておいてもよいし、図4(b)のようにアクセント
記号を直接書き込むようにしておいてもよい。図4
(b)の場合は、使用者が直接アクセント情報を入力で
きる。図4(b)中の「ニ*シダ」の「*」は「ニ」の
後にアクセント核があることを意味している。
【0035】本実施の形態では、登録音声のアクセント
選択をボタン操作で行う方法について示したが、名前情
報の入力時に図4(b)のようにアクセント記号も付加す
るようにしたり、音声認識を利用してもよいことはいう
までもない。また、登録された時点で音素列に変換し、
音素列を記憶しておくようにしてもよい。音声登録時に
表示するメッセージは合成音声で出力してもよい。登録
する情報を、名前ではなく会社名等にしても何ら処理を
変えることなく登録と合成音声出力が可能であることは
いうまでもない。
【0036】更に、本実施の形態では、音声データベー
ス204に記憶しておく音声素片は、単音節、音素、モ
ーラのうちいずれでもよいし、CV(子音+母音)、V
C(母音+子音)、VV(母音+母音)、CVC(子音
+母音+子音)などのように音素環境を考慮したものに
してもよい。
【0037】
【発明の効果】以上の説明から明らかなように、本発明
によれば、音声合成処理の際の処理量や音声データベー
スに登録しておくべきデータ登録容量の削減が必要な場
合にでも、正しいアクセントで文字情報を読み上げるこ
とができる効果を奏する。
【図面の簡単な説明】
【図1】本発明の音声合成方法の概略ブロック図であ
る。
【図2】音声データベース3から選択された音素を接続
する際の模式図である。
【図3】本発明を電話機に適用した場合の概略構成図で
ある。
【図4】登録データベース204に登録されている登録
情報である。
【図5】本発明を適用した電話機において、送信元の名
前情報を読み上げる際の動作説明をするためのフローチ
ャートである。
【図6】従来の録音編集による音声合成方法における、
音声データを示した図である。
【符号の説明】
1 …文字情報解析部 1a…音素列決定部 1b…アクセント情報決定部 2 …音声素片取り出し部 3 …音声データベース 4 …音声素片接続部 200 …受信部 201 …送信元番号抽出部 202 …表示部 203 …登録データ検索部 204 …登録データベース

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 テキスト情報を入力する文字情報入力部
    と、入力されたテキストを解析して表記情報とアクセン
    ト情報を出力する文字情報解析部と、あらかじめ複数の
    音程情報を有する音声素片を記憶しておく音声データベ
    ースと、該音声データベースに記憶されている音声素片
    を取り出して接続することによって合成音声を生成する
    音声合成部とを有し、音声データベースから取り出され
    る音声素片は、前記文字情報解析部の出力である表記情
    報とアクセント情報に合致、又は類似した音声素片であ
    ることを特徴とする音声合成方法。
  2. 【請求項2】 前記音声データベースに記憶された音声
    素片の音程情報を高低の2種類とし、前記文字情報解析
    部で出力するアクセント情報は、高低のどちらかを示す
    ものであることを特徴とする請求項1記載の音声合成方
    法。
  3. 【請求項3】 前記音声データベースに記憶しておく音
    声素片は、単音節、音素、モーラ、CV(子音+母
    音)、VC(母音+子音)、VV(母音+母音)のうち
    いずれかであることを特徴とする請求項1記載の音声合
    成方法。
JP10152884A 1998-06-02 1998-06-02 音声合成方法 Pending JPH11344997A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10152884A JPH11344997A (ja) 1998-06-02 1998-06-02 音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10152884A JPH11344997A (ja) 1998-06-02 1998-06-02 音声合成方法

Publications (1)

Publication Number Publication Date
JPH11344997A true JPH11344997A (ja) 1999-12-14

Family

ID=15550236

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10152884A Pending JPH11344997A (ja) 1998-06-02 1998-06-02 音声合成方法

Country Status (1)

Country Link
JP (1) JPH11344997A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007079476A (ja) * 2005-09-16 2007-03-29 Nippon Hoso Kyokai <Nhk> 音声合成装置および音声合成プログラム
JP2008139438A (ja) * 2006-11-30 2008-06-19 Fujitsu Ltd 音声処理装置、端末装置、音声情報管理装置、および、プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007079476A (ja) * 2005-09-16 2007-03-29 Nippon Hoso Kyokai <Nhk> 音声合成装置および音声合成プログラム
JP4580317B2 (ja) * 2005-09-16 2010-11-10 日本放送協会 音声合成装置および音声合成プログラム
JP2008139438A (ja) * 2006-11-30 2008-06-19 Fujitsu Ltd 音声処理装置、端末装置、音声情報管理装置、および、プログラム

Similar Documents

Publication Publication Date Title
US7124082B2 (en) Phonetic speech-to-text-to-speech system and method
US20070088547A1 (en) Phonetic speech-to-text-to-speech system and method
JPH10260692A (ja) 音声の認識合成符号化/復号化方法及び音声符号化/復号化システム
WO2005093713A1 (ja) 音声合成装置
US6212501B1 (en) Speech synthesis apparatus and method
JPH11231885A (ja) 音声合成装置
JP3518898B2 (ja) 音声合成装置
JPH08335096A (ja) テキスト音声合成装置
JPH11344997A (ja) 音声合成方法
JPH06337876A (ja) 文章読み上げ装置
JP2000056789A (ja) 音声合成装置及び電話機
JP2006139162A (ja) 語学学習装置
JP3685648B2 (ja) 音声合成方法及び音声合成装置、並びに音声合成装置を備えた電話機
JP3626398B2 (ja) テキスト音声合成装置、テキスト音声合成方法及びその方法を記録した記録媒体
JPH11249679A (ja) 音声合成装置
JP2536169B2 (ja) 規則型音声合成装置
JP2003029774A (ja) 音声波形辞書配信システム、音声波形辞書作成装置、及び音声合成端末装置
JP4543919B2 (ja) 語学学習装置
KR100650071B1 (ko) 악음·음성 재생 장치 및 악음·음성 재생 방법
JP2000231396A (ja) セリフデータ作成装置、セリフ再生装置、音声分析合成装置及び音声情報転送装置
JPH064090A (ja) テキスト音声変換方法および装置
JP2007140079A (ja) 再生装置
JP2001042883A (ja) テキスト音声合成装置
JPH03214197A (ja) 音声合成装置
JP3292218B2 (ja) 音声メッセージ作成装置