JP3034554B2 - 日本語文章読上げ装置及び方法 - Google Patents

日本語文章読上げ装置及び方法

Info

Publication number
JP3034554B2
JP3034554B2 JP2093895A JP9389590A JP3034554B2 JP 3034554 B2 JP3034554 B2 JP 3034554B2 JP 2093895 A JP2093895 A JP 2093895A JP 9389590 A JP9389590 A JP 9389590A JP 3034554 B2 JP3034554 B2 JP 3034554B2
Authority
JP
Japan
Prior art keywords
information
data
accent
synthesized
phoneme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2093895A
Other languages
English (en)
Other versions
JPH03293398A (ja
Inventor
良明 寺本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2093895A priority Critical patent/JP3034554B2/ja
Publication of JPH03293398A publication Critical patent/JPH03293398A/ja
Application granted granted Critical
Publication of JP3034554B2 publication Critical patent/JP3034554B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔目次〕 概要 産業上の利用分野 従来の技術(第5,6図) 発明が解決しようとする課題 課題を解決するための手段(第1,2図) 作用(第1,2図) 実施例(第3,4図) 発明の効果 〔概要〕 日本語文章を表す文字データ列を解析して、対応する
音韻情報を出力する単語同定部と、出力された当該音韻
情報に基づいて、呼気段落情報等の韻律情報を付与する
韻律付与部と、付与された韻律情報及び前記音韻情報を
含む音韻データを解析し、対応する特徴パラメータを合
成する特徴パラメータ合成部と、合成された特徴パラメ
ータを合成音声に変換して出力する合成音声発生器とを
有する日本語文章読上げ装置及び方法に関し、 単語同定等に費やす時間を短縮し、これにより上位装
置の手を煩わすことがなく、また、複雑なインタフェー
スを用いることなく、使い勝手の良い、かつ、迅速に処
理が行われる高速な日本語文章読上げ装置及び方法を提
供することを目的とし、 所定の単語列毎に、当該単語列を識別する識別データ
とともに対応する音韻データを保持し、識別データが指
定された場合には、対応する単語列の音韻情報を取り出
して前記特徴パラメータ合成部に送出する音韻データ保
持送出部を設けた構成である。
〔産業上の利用分野〕
本発明は日本語文章読上げ装置及び方法に係り、特に
入力する日本語文章を表す文字データ列を解析して、対
応する音韻及びアクセント型等の音韻情報を出力する単
語同定部と、出力された当該音韻情報に基づいて、呼気
段落情報、フレーズ境界情報、アクセント境界情報、ア
クセント句毎のアクセント型等の韻律情報を付与する韻
律付与部と、付与された韻律情報及び前記音韻情報を含
め音韻データを解析し、対応する特徴パラメータを合成
する特徴パラメータ合成部と、合成された特徴パラメー
タを合成音声に変換して出力する合成音声発生器とを有
する日本語文章読上げ装置及び方法に関する。
本発明に係る日本語読上げ装置はCPU等に用いられる
ディスプレイ装置の代りに用いられたり、マルチメディ
アの一つとしての機能を応用した分野、すなわち、CAI
(computer assisted instruction;電子計算機による教
育システムであり、プログラム学習による個人別教授を
電子計算機と対話しながら行うようにしたもの)等での
音声ガイダンスとしての用法がある。
〔従来の技術〕
従来、第5図に示すような第一の従来例に係る日本語
文章読上げ装置があった。
当該装置は同図に示すように、入力する日本語文章に
対応する文字系列データを単語辞書と照合することによ
り候補単語を抽出し、これらの単語の組合せのうちで最
適な単語列を選択し、同定された単語に対応する音韻、
アクセント型及び文法等の音韻情報を出力する単語同定
部41と、同定された単語に含まれている音韻情報に基づ
いて、呼気段落情報、フレーズ境界情報、アクセント境
界情報、アクセント句毎のアクセント型等の韻律情報を
付与する韻律付与部42と、付与された韻律情報及び前記
音韻情報を含む音韻データを解析し、音節ファイルから
対応する声道特性パラメータを取り出して結合させると
ともに、ピッチ等の音源パラメータを計算して求め声道
特性パラメータに付与する特徴パラメータ合成部43と、
合成された特徴パラメータを合成音声に変換する合成音
声発生器44とを有するものである。
一方、第二の従来例に係る日本語文章読上げ装置を第
6図に示す。
当該装置は同図に示すように、入力する日本語文章に
対応する文字系列データを単語辞書と照合することによ
り候補単語を抽出し、これらの単語の組み合せのうちで
最適な単語列を選択し、同定された単語に対応する音
韻、アクセント型及び文法等の音韻情報を出力する単語
同定部51と、同定された単語に含まれている音韻情報に
基づいて、呼気段落情報、フレーズ境界情報、アクセン
ト境界情報、アクセント句毎のアクセント型等の韻律情
報を付与する韻律付与部52とを有するとともに、付与さ
れた韻律情報及び前記音韻情報を含む音韻データを受け
取り、受け取った音韻データを前記特徴パラメータ合成
部53に送出する音韻データ保持送出部を上位装置50内に
設け、当該音韻データを解析し、音節ファイルから対応
する声道特性パラメータを取り出して結合させるととも
に、ピッチ等の音源パラメータを計算して声道特性パラ
メータに付与する特徴パラメータ合成部53と、合成され
た特徴パラメータを合成音声に変換する合成音声発生器
54とを有するものである。
これにより、第一の従来例に比べ、次のような利点が
生ずる。
すなわち、特徴パラメータ合成と音声合成の処理時間
の方が単語同定と韻律付与の処理時間よりもかなり小さ
いので、上位装置50からデータを送ってから音声合成を
開始するまでのオーバヘッド時間を十分小さくすること
ができる。また、上位装置50で韻律情報を含む音韻デー
タを操作することができるので、発生に関するもう少し
詳細な情報を追加して付与することができる。
〔発明が解決しようとする課題〕 ところで、第二の従来例は、第一の従来例に比べ処理
時間の短縮等の利点はあるが、次のような問題点をも有
していた。
すなわち、上位装置50と日本語読上け装置とのインタ
フェース(データのやりとり)が非常に複雑となり、上
位装置の負担が増大し、むしろ、上位装置の方が処理が
複雑になるという問題点を有していた。
そこで、本発明は上位装置の負担を増大させることな
く、かつ、処理時間を短縮し、発生に関するもう少し詳
細な情報を追加することができるに日本語文章読上げ装
置及び方法を提供することを目的としてなされたもので
ある。
〔課題を解決するための手段〕
以上の技術的課題を解決するため、第一の発明は第1
図に示すように、入力する日本語文章を表す文字データ
列を解析して、対応する音韻及びアクセント型等の音韻
情報を出力する単語同定部1と、出力された当該音韻情
報に基づいて、呼気段落情報、フレーズ境界情報、アク
セント境界情報、アクセント句毎のアクセント型等の韻
律情報を付与する韻律付与部2と、付与された韻律情報
及び前記音韻情報を含む音韻データを解析し、対応する
特徴パラメータを合成する特徴パラメータ合成部3と、
合成された特徴パラメータを合成音声に変換して出力す
る合成音声発生器4とを有する日本語文章読上げ装置に
おいて、所定の単語列毎に、当該単語列を識別する識別
データとともに対応する音韻データを保持し、識別デー
タが指定された場合には、対応する単語列の音韻情報を
取り出して前記特徴パラメータ合成部3に送出する音韻
データ保持送出部5を設けたものである。
第二の発明は第2図に示すように、日本語文章を表す
文字データ列を入力し(S1)、入力した文字データ列を
解析し、対応する音韻及びアクセント型等の音韻情報を
出力し(S2)、出力された当該音韻情報に基づいて、呼
気段落情報、フレーズ境界情報、アクセント境界情報、
アクセント句毎のアクセント型等の韻律情報を付与(S
3)し、付与された韻律情報及び前記音韻情報を含む音
韻データを解析し、対応する特徴パラメータを合成(S
6)し、合成された特徴パラメータを合成音声に変換し
て合成音声を出力(S7)する日本語文章読上げ方法にお
いて、 所定の単語列毎に、当該単語列を識別する識別データ
とともに対応する音韻データを保持(S4)し、 識別データが指定された場合(S5)には、 対応する単語列の音韻情報を取り出した後、特徴パラ
メータの合成を行う(S6)ものである。
〔作用〕
続いて、第一及び第二の発明に係る読上げ装置及び方
法の動作について説明する。
日本語の文章の読み上げを行うには、第1図及び第2
図に示すように、ステップS1で読み上げようとする日本
語文章を表す単語データ列が所定の単語列を識別する識
別データに対応させて入力すると、ステップS2で前記単
語同定部1は当該日本語文章を表す文字データ列に対応
する音韻情報を、例えば、単語辞書と照合することによ
り候補単語を抽出し、選択した最適な単語列に相当する
音韻情報を出力する。出力された音韻情報は識別データ
に対応させて前記韻律付与部2に送出される。
ステップS3で当該韻律付与部2は同定された単語に含
まれる、音韻(読み)、アクセント型、文法、…等の情
報を用いて、音韻情報に対し、呼気段落情報、フレーズ
境界情報、アクセント句毎のアクセント型等の情報が付
与される。
ここで、「呼気段落」とは息継ぎ等の呼気を伴うとこ
ろの、一息で発声される文章のまとまりをいう。
「フレーズ境界」とは句等に相当する発語区分毎の緩
やかな声得の高さの上げ下げであり、イントネーション
において、声の立て直しを行う境界をいう。
「アクセント句境界」とはほぼ、単語毎の局所的な声
の高さの上げ下げを伴なったまとまりに分ける境界をい
う。
こうして韻律情報が付与された各単語は、ステップS4
で前記識別データとともに、前記音韻データ保持送出部
5に一旦保持される。
保持された当該音韻情報は、ステップS5で前記識別デ
ータを指定した読出しの指示があると、ステップS6で当
該音韻情報は前記特徴パラメータ合成部3に送出され、
特徴パラメータの合成が行われることになる。
ここで、「特徴パラメータ」とは音声の特徴を表現す
るために指定されるパラメータであって、声質を表す音
源パラメータと、言語的内容を表わす声道特性パラメー
タの二種類があり、音源パラメータには基本周波数(ピ
ッチ)や振幅等があり、声道特性パラメータにはLPC係
数、PARCOR係数、LSP係数、ホルマント周波数等があ
る。
「特徴パラメータ合成」とは入力する音韻データを解
読し、例えば、それに対応する(cv&v)音節ファイル
から、対応する特徴パラメータの声道特性パラメータを
取り出して結合させる。また、ピッチ等の音源パラメー
タを計算して求め、声道パラメータに付与するといった
処理を行うことになる。
合成された当該パラメータは前記合成音声発生器4に
送出され、ステップS7で入力した日本語の文章が合成音
声で読み上げられることになる。
〔実施例〕
次に、本発明の実施例に係る日本語文章読上げ及び方
法装置について説明する。
第3図に本実施例に係る全体機器構成図を示す。
本システムは同図に示すように、読み上げの指示とと
もに、読み上げようとするデータを出力する上位装置10
と、本実施例に係る日本語文章読上げ装置20とからなっ
ている。
上位装置10はCPU10aと、インタフェース10bと、表示
部10c、ファイル10d、プリンタ装置10e等の入出力装置
を伴なっている。
また、日本語文章読上げ装置20は同図に示すように、
単語同定等を行うCPU21と、単語の同定を行うために使
用する辞書等が格納されているメモリ22と、前記合成音
声発生器14とを有するものである。
また、当該合成音声発生器14は同図に示すように、後
述する特徴パラメータに基づいて音声の合成を行う音声
合成部としてのDSP14aと、スピーカ制御部14bと、スピ
ーカ14cとを有するものである。
第4図には本実施例に係る日本語文章読上げ装置を機
能的に示したものであり、読上げの指示や読み上げよう
とする日本語の文章を識別データとしての識別番号に対
応させて入力させる上位装置10と、当該上位装置10から
入力したコマンドを解読して対応する信号及びデータを
出力するコマンド・データ解析処理部16と、入力する漢
字かなまじり日本語文章に対応する文字データ列を単語
辞書11aと照合することにより候補単語を抽出し、これ
らの単語の組み合せのうちで最適な単語列を選択し、同
定された単語に対応する音韻、アクセント型及び文法等
の音韻情報を出力する単語同定部11と、同定された単語
に含まれている音韻情報に基づいて、呼気段落情報、フ
レーズ境界情報、アクセント境界情報、アクセント句毎
のアクセント型等の韻律情報を付与する韻律付与部12
と、付与された韻律情報及び前記音韻情報を含む音韻デ
ータを解析し、音節ファイルから対応する声道パラメー
タを取り出して結合させるとともに、ピッチ等の音源パ
ラメータを計算して求め、声道パラメータに付与する特
徴パラメータ合成部13と、合成された特徴パラメータを
合成音声に変換する合成音声発生器14と、所定の単語列
毎に、当該単語列を識別する識別番号(データ)ととも
に、対応する音韻データを保持し、識別データが指定さ
れた場合には、対応する単語列の音韻情報を取り出して
前記特徴パラメータ合成部13に送出する音韻データ保持
送出部15を有するものである。
ここで、コマンド・データ解析処理部16、単語同定部
11、韻律付与部12、特徴パラメータ合成部13は前記CPU2
1及びメモリ22に相当するものである。また、前記音韻
データ保持送出部15は前記メモリ22等に相当し、第4図
に示すように、書込み部15aと、読出し部15bと、解析テ
キスト一時蓄積バッファ15cとを有するものである。
さらに、前記スピーカ制御部14bは第3図に示すよう
に、ディジタル・データをアナログ・データへ変換する
D/A変換器141bと、LPF142bと、増幅器143bとを有するも
のである。
続いて、本実施例に係る日本語文章読上げ装置の動作
を説明する。
本実施例は、第一の従来例と異なり、日本語文章を入
力して単純に読み上げを行う通常のコマンドの他に、次
の2つのコマンドを追加する。
一つのコマンドとしては上位装置から日本語文章及び
それを識別するための識別番号を入力し、それを解析
(単語同定+韻律付与)して韻律情報を含む音韻データ
を生成して前記バッファ15cに前記識別番号と一緒に蓄
えておくコマンドである。
もう1つのコマンドとして、上位装置から識別番号を
与えることにより、解析テキスト一時蓄積バッファ15c
上からそれに対応する韻律情報を含む音韻データを取り
出し、そのデータを処理することにより前記特徴パラメ
ータ合成部13により特徴パラメータ合成を行うコマンド
である。
前記上位装置10から識別番号“1"、日本語文章「音声
処理しますか?」という文章を表す文字データ列と識別
番号との対応を示すコマンドが送られる。
すると、前記単語同定部11は、この日本語文章を表す
文字データ列について、単語辞書11aと照合することに
より、候補単語を抽出し、これらの候補単語の組み合せ
の中で最適な単語列を選択し、該当する音韻情報を出力
する。
出力された当該音韻情報は前記韻律付与部12により同
定された単語に含まれている音韻(読み)、アクセント
型、文法、情報を用いて、音韻情報に対して呼気段落情
報、フレーズ境界情報、アクセント境界情報、アクセン
ト句等のアクセント型等の情報を付与する。
こうして、音韻情報に付与された音韻データ「オンセ
ーショ リ_シマ*スカ?」が生成されることになる。
生成された音韻データ「オンセーショ リ_シマ*ス
カ?」は、識別番号“1"と一緒に前記書込み部15aによ
り解析テキスト一時蓄積バッファ15cに書き込まれるこ
とになる。
その後、当該音韻データ保持送出部15に識別番号“1"
の文章を発声しなさいというコマンドが送られると、前
記読出し部15bにより、当該識別番号“1"に対応して格
納されている前記音韻データを受け取ると、先程示した
対応する韻律情報を含む音韻データ「オンセーショ リ
_シマ*スカ?」が前記解析テキスト一時蓄積バッファ
15cから読み出され、前記特徴パラメータ合成部13に送
出されることになる。
当該特徴パラメータは前記合成音声発声器14の音声合
成部14aとしてのDSPに送られ、音声合成され、さらに、
前記スピーカ制御部14bによりアナログ変換されてスピ
ーカ14cから合成音声が発声することになる。
尚、データベース検索等の種々アプリケーションにお
いて、音声を使用しようとした場合には通常、例えば、
以下に示すような、操作者に操作を促すようなメッセー
ジを音声合成することが普通である。
その場合、上位装置はアプリケーションを起動する前
に識別番号とそれに対応する日本語文章を予め本装置に
送っておくことが必要であるが、アプリケーションが音
声合成を行いたい場合にはいつでも、任意の識別番号を
指定するだけで、それに対応する音声を即時に合成する
ことが可能である。
すなわち、本実施例にあっては、音声合成をマルチメ
ディアの音声ガイダンスという機能として扱った場合
に、「時間のかかる単語同定+韻律付与の処理を予め
行っておくため、上位装置からコマンドを送ってから音
声を合成し始めるまでの時間を短縮することができる。
上位装置上のアプリケーションとのインタフェースと
して複雑なものが必要でない。」という2つの利点を有
する。
〔発明の効果〕
以上説明したように、本発明では、韻律付与された音
韻データを一旦前記音韻データ保持送出部に保持し、対
応する識別データの指定があった場合には、該当する音
韻データが出力され前記特徴パラメータ合成部に入力す
るようにしている。
したがって、従来のように上位装置の手を煩わせるこ
となく、識別データの入力のみで、対応する音韻データ
が送出されるようにしている。
したがって、単語同定等に費やす時間を短縮するとと
も、これにより上位装置の手を煩わすことがない。ま
た、複雑なインタフェースを用いることなく、使い勝手
の良い、かつ、迅速に処理が行われ、さらに発生に関す
るもう少し詳細な情報を追加することができる、高速な
日本語文章読上げ装置及び方法を提供することができる
ことになる。
【図面の簡単な説明】
第1図は第一の発明の原理ブロック図、第2図は第二の
発明の原理流れ図、第3図は実施例に係る全体機器構成
図、第4図は実施例に係る日本語文章読上げ装置を示す
ブロック図、第5図は第一の従来例に係るブロック図、
及び第6図は第二の従来例に係る日本語文章読上げ装置
を示す図である。 1,11……単語同定部 2,12……韻律付与部 3,13……特徴パラメータ合成部 4,14……合成音声発生器 5,15……音韻データ保持送出部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 13/00 - 13/08 JICSTファイル(JOIS)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】入力する日本語文章を表す文字データ列を
    解析して、対応する音韻及びアクセント型等の音韻情報
    を出力する単語同定部(1)と、出力された当該音韻情
    報に基づいて、呼気段落情報、フレーズ境界情報、アク
    セント境界情報、アクセント句毎のアクセント型等の韻
    律情報を付与する韻律付与部(2)と、付与された韻律
    情報及び前記音韻情報を含む音韻データを解析し、対応
    する特徴パラメータを合成する特徴パラメータ合成部
    (3)と、合成された特徴パラメータを合成音声に変換
    して出力する合成音声発生器(4)とを有する日本語文
    章読上げ装置において、 所定の単語列毎に、当該単語列を識別する識別データと
    ともに対応する音韻データを保持し、識別データが指定
    された場合には、対応する単語列の音韻情報を取り出し
    て前記特徴パラメータ合成部(3)に送出する音韻デー
    タ保持送出部(5)を設けたことを特徴とする日本語文
    章読上げ装置。
  2. 【請求項2】日本語文章を表す文字データ列を入力し
    (S1)、入力した文字データ列を解析し、対応する音韻
    及びアクセント型等の音韻情報を出力し(S2)、出力さ
    れた当該音韻情報に基づいて、呼気段落情報、フレーズ
    境界情報、アクセント境界情報、アクセント句毎のアク
    セント型等の韻律情報を付与(S3)し、付与された韻律
    情報及び前記音韻情報を含む音韻データを解析し、対応
    する特徴パラメータを合成(S6)し、合成された特徴パ
    ラメータを合成音声に変換して合成音声を出力(S7)す
    る日本語文章読上げ方法において、 所定の単語列毎に、当該単語列を識別する識別データと
    ともに対応する音韻データを保持(S4)し、 識別データが指定された場合(S5)には、 対応する単語列の音韻情報を取り出した後、特徴パラメ
    ータの合成を行う(S6)ことを特徴とする日本語文章読
    上げ方法。
JP2093895A 1990-04-11 1990-04-11 日本語文章読上げ装置及び方法 Expired - Lifetime JP3034554B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2093895A JP3034554B2 (ja) 1990-04-11 1990-04-11 日本語文章読上げ装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2093895A JP3034554B2 (ja) 1990-04-11 1990-04-11 日本語文章読上げ装置及び方法

Publications (2)

Publication Number Publication Date
JPH03293398A JPH03293398A (ja) 1991-12-25
JP3034554B2 true JP3034554B2 (ja) 2000-04-17

Family

ID=14095220

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2093895A Expired - Lifetime JP3034554B2 (ja) 1990-04-11 1990-04-11 日本語文章読上げ装置及び方法

Country Status (1)

Country Link
JP (1) JP3034554B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04369694A (ja) * 1991-06-19 1992-12-22 A T R Jido Honyaku Denwa Kenkyusho:Kk 音声規則合成装置
JP3036430B2 (ja) 1996-04-12 2000-04-24 日本電気株式会社 文章読み上げ装置

Also Published As

Publication number Publication date
JPH03293398A (ja) 1991-12-25

Similar Documents

Publication Publication Date Title
JP4054507B2 (ja) 音声情報処理方法および装置および記憶媒体
US5758320A (en) Method and apparatus for text-to-voice audio output with accent control and improved phrase control
JPH10116089A (ja) 音声合成用の基本周波数テンプレートを収容する韻律データベース
JPH0632020B2 (ja) 音声合成方法および装置
JPH05165486A (ja) テキスト音声変換装置
Hamad et al. Arabic text-to-speech synthesizer
JP3034554B2 (ja) 日本語文章読上げ装置及び方法
JPH08335096A (ja) テキスト音声合成装置
JP2536169B2 (ja) 規則型音声合成装置
JPH07200554A (ja) 文章読み上げ装置
JP2001117752A (ja) 情報処理装置および情報処理方法、並びに記録媒体
JP2703253B2 (ja) 音声合成装置
JP3397406B2 (ja) 音声合成装置及び音声合成方法
JP2000172286A (ja) 中国語音声合成のための同時調音処理装置
Evans et al. An approach to producing new languages for talking applications for use by blind people
JPH09292897A (ja) 音声合成装置
JPH0667685A (ja) 音声合成装置
JPH06214585A (ja) 音声合成装置
Kayte et al. Artificially Generatedof Concatenative Syllable based Text to Speech Synthesis System for Marathi
JP2888847B2 (ja) 文章読み上げ装置とその方法及び言語処理装置とその方法
JP2000322075A (ja) 音声合成装置および自然言語処理方法
JPH11327594A (ja) 音声合成辞書作成システム
JPH07181995A (ja) 音声合成装置及び音声合成方法
JPH08160990A (ja) 音声合成装置
JP2001166787A (ja) 音声合成装置および自然言語処理方法