JPH06243137A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH06243137A
JPH06243137A JP5026745A JP2674593A JPH06243137A JP H06243137 A JPH06243137 A JP H06243137A JP 5026745 A JP5026745 A JP 5026745A JP 2674593 A JP2674593 A JP 2674593A JP H06243137 A JPH06243137 A JP H06243137A
Authority
JP
Japan
Prior art keywords
voice information
storage unit
input
voice
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5026745A
Other languages
English (en)
Inventor
Osamu Totokawa
外 川 修 都
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP5026745A priority Critical patent/JPH06243137A/ja
Publication of JPH06243137A publication Critical patent/JPH06243137A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 日本語の漢字・仮名混じり文を音声に変換す
る日本語音声合成装置において、かっこ等の注釈の音声
化を分かりやすくする。 【構成】 従来の音声合成装置に、記号に対する音声情
報を単語辞書15に加え、注釈に対する音声情報を決定
するための規則を格納した注釈用音声情報規則16を加
え、注釈を音声化するかどうかを指示するための手段を
入力手段11に加える。 【効果】 注釈をいくつかの種類に分類し、各々に違な
る属性を与えているため、各々に対して発音するかしな
いかの細かな指定をユーザが指定することができ、種々
の注釈を含む入力文に対してより分かりやすい音声を提
供できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、日本語文書を音声情報
に変換して音声を出力する音声合成装置に関するもので
ある。
【0002】
【従来の技術】従来の日本語文書を音声に変換して音声
を出力する音声合成装置は、入力文字列に対して、単語
辞書から得られる単語の表記や品詞情報を参照しながら
形態素分割を行ない、その結果得られる各形態素の対応
する音声情報を利用して、出力音声情報を生成してい
た。
【0003】図6は従来の音声合成装置の構成を示す機
能ブロック図である。図6において、1は入力文字列を
入力するための入力手段、2は入力手段1から入力され
た入力文字列を記憶する入力文字列記憶部、3は生成さ
れた音声情報を記憶する出力音声情報記憶部、4は出力
音声情報記憶部3に記憶された音声情報をもとに音声を
出力する出力手段、5は単語の表記に対応する品詞情報
と意味情報とを格納した単語辞書、6は入力文字列記憶
部2に格納された入力に対する単語の表記と品詞情報と
意味情報とからなる形態素分割結果を記憶する形態素分
割結果記憶部、7は単語辞書5と入力文字列記憶部2を
参照しながら形態素分割を行ない、結果を形態素分割結
果記憶部6に格納する音声情報生成制御部である。
【0004】以下、従来の音声合成装置について、「接
続(前接)情報」という入力が与えられた場合の動作に
ついて説明する。まず図4に示す単語辞書を用いて形態
素分割を行ない、生成された発音記号生成結果を以下に
示す。 se tu zo ku ka Q ko ze n
se tu *jo u ho u
【0005】注釈の開始を表わす記号『(』は発音記号
“ka Q ko”に、注釈の終了を表わす記号『)』
は発音記号“*”に一意に変換される。発音記号“Q”
は促音を表わす記号として、また発音記号“*”はなに
も発音しない記号(以後、無発音記号と呼ぶ)として扱
われる。注釈の終了を表わす記号『)』を無発音記号に
変換するのは、発音記号“ka Q ko to ji
ru”に変換すると、「せつぞくかっこぜんせつかっ
ことじるじょうほう」と、かえって聞きづらい発音にな
るためである。
【0006】
【発明が解決しようとする課題】例えば、入力として
「接続(前接)情報[1]」を音声合成装置に与える
と、発音記号は以下のようになる。 se tu zo ku ka Q ko ze n
se tu *jo u ho u ka Q ko
i ti *
【0007】『[』は脚注を表わす記号であり、発音記
号“ka Q ko”に一意に変換され、この発音記号
は「せつぞくかっこぜんせつじょうほうかっこ1」と発
音される。この発音はユーザにとって聞きづらい。これ
は、一意に注釈開始記号を発音記号に変換しているから
である。上記例では「せつぞくかっこぜんせつじょうほ
う」と脚注を発音しないほうが、より分かりやすい。か
といって、例えば「前接情報[1]」という入力に対し
ては「ぜんせつじょうほうかっこ1」と脚注開始記号を
発音記号に変換したほうが、よりよい入力も考えられる
ため、一意に脚注開始記号を無発音記号に変換するわけ
にはいかない。
【0008】本発明は、このような従来の問題を解決す
るものであり、種々の注釈を含む入力文に対して分かり
やすい音声を出力することのできる音声合成装置を提供
することを目的とする。
【0009】
【課題を解決するための手段】本発明は、上記目的を達
成するために、従来の音声合成装置に、記号に対する音
声情報を単語辞書に加えるとともに、注釈に対する音声
情報を決定するための規則を格納した注釈音声情報規則
を加え、さらに注釈を音声化するかどうかを指示するた
めの手段を入力手段に加えたものである。
【0010】
【作用】本発明は、上記構成により、種々の注釈に対す
る音声情報を区別することができるため、より分かりや
すい音声をユーザに容易に提供することができる。
【0011】
【実施例】以下、本発明の一実施例における音声合成装
置について図面を参照しながら説明する。図1は本発明
の一実施例における音声合成装置の構成を示す機能ブロ
ック図である。図1において、11は入力文字列を入力
するための入力手段、12は入力手段11から入力され
た入力文字列を記憶する入力文字列記憶部、13は生成
された音声情報を記憶する出力音声情報記憶部、14は
出力音声情報記憶部13に記憶された音声情報をもとに
音声を出力する出力手段、15は単語の表記に対応する
品詞情報と意味情報と少なくとも読みを含む音声情報と
を格納した単語辞書、16は注釈の少なくとも読みを含
む音声情報を決定するための規則を格納した注釈用音声
情報規則、17は入力文字列記憶部12に格納された入
力に対する単語の表記と品詞情報と意味情報と少なくと
も読みを含む音声情報とからなる形態素分割結果を記憶
する形態素分割結果記憶部、18は単語辞書15と入力
文字列記憶部12を参照しながら形態素分割を行ない、
結果を形態素分割結果記憶部17に格納し、注釈用音声
情報規則16を参照して形態素分割結果記憶部17に格
納されている分割形態素の中で記号に対応する音声情報
を変更してその音声情報を出力音声情報記憶部13に格
納する音声情報生成制御部である。
【0012】図2は本実施例の音声合成装置の回路ブロ
ック図であり、21はリードオンリーメモリ(以下、R
OMと略称する。)、22はキーボード、23は中央処
理装置(以下、CPUと略称する。)、24はスピー
カ、25はランダムアクセスメモリ(以下、RAMと略
称する。)である。
【0013】図1に示した入力手段11はキーボード2
2により、単語辞書15はROM21により、入力文字
列記憶部12と出力情報記憶部13と形態素分割結果記
憶部17はRAM25により、音声情報生成制御部18
は、CPU23がRPM21およびRAM25とデータ
のやりとりを行ないながらROM21に記憶されたプロ
グラムを実行することにより、出力手段14はスピーカ
24により、それぞれ実現されている。
【0014】次に、上記のように構成された本発明の一
実施例の動作について、入力文として「接続(前接)情
報[1]」が与えられ、ユーザが注釈のうち脚注のみを
音声化しないことを指示した場合の動作を、図3のフロ
ーチャートに基づき説明する。
【0015】ステップ31において、音声情報生成制御
部18は、図4に示す単語辞書15を参照しながら入力
文に対する形態素分割を行ない、形態素分割結果を形態
素分割結果記憶部17に格納する。上記例では、この辞
書での脚注『[1]』に対する読みの情報はまだ“ka
Q ko i ti *”である。
【0016】ステップ32において、音声情報生成制御
部18は、形態素分割結果を形態素分割結果記憶部17
に格納されている分割形態素の中で、注釈用音声情報規
則16に対する適用可能性の検査が終わってない分割形
態素があるかどうかを検査する。注釈用音声情報規則1
6に対する適用可能性の検査がまだ終了していなけれ
ば、ステップ33に進む。そうでなれば処理を終了す
る。
【0017】ステップ33において、音声情報生成制御
部18は、形態素分割結果を形態素分割結果記憶部17
に格納されている分割形態素に対応する表記と品詞情報
と意味情報と音声情報とを参照して、図5に示す注釈用
音声情報規則16の中から、分割形態素と同一表記を持
ち、かつ適用可能な規則を検索する。上記例では、規則
番号1の規則が適応可能な規則である。この規則は、
「記号1と数詞2があり、記号1と記号2の意味情報が
同じであったならば、読みを『記号1,数詞,記号2』
を脚注とみなす」ということを表わす。
【0018】ステップ34において、音声情報生成制御
部18は、分割形態素と同一表記を持ち、かつ適用可能
な規則があったかどうか検査する。無ければステップ3
2に戻り、規則適応可能性の検査が終了していない分割
形態素を検出する。あればステップ35に進む。上記例
では、記号1と記号2は共に図5における意味情報『p
arl』を持っているため、規則1を適応可能な規則と
判断する。
【0019】ステップ35において、音声情報生成制御
部18は、入力手段11から入力された注釈の属性と同
じ属性を持つかどうかを検査する。同じ属性であればス
テップ36に進む。そうでなければステップ37に進
む。上記例では、入力手段11から入力された注釈の属
性は『脚注』であり、これは規則1の属性と一致するた
め、ステップ36に進む。
【0020】ステップ36において、音声情報生成制御
部18は、入力手段11から入力された注釈に対する指
示に従い、検出された適用可能な注釈用音声情報規則1
6を分割形態素に対して適用する。上記例では、適用可
能な注釈用音声情報規則16から『[1]』に対する読
みは“ka Q ko i ti *”となるが、入力
手段11から「脚注は発音しない」よう指示されている
ため、『[1]』に対する読みを“*”に変更し、出力
音声情報記憶部13に格納する。上記例における出力音
声情報記憶部13の内容を以下に示す。これは「せつぞ
くかっこぜんせつじょうほう」と発音される。 se tu zo ku ka Q ko ze n
se tu *jo u ho u *
【0021】ステップ37において、音声情報生成制御
部18は、検出された適用可能な注釈用音声情報規則1
6を分割形態素に対して適用する。
【0022】以上のように、本実施例は、従来の音声合
成装置に、注釈に対する音声情報を単語辞書15に加え
るとともに、注釈に対する音声情報を決定するために注
釈の前後の単語の品詞情報や意味情報を利用した注釈用
音声情報規則16を加え、ユーザが注釈を発音するかど
うかを入力手段11から指示することにより、注釈を含
めた文全体の構文解釈や意味の解析を行なわなくとも、
注釈の読み分けを容易に実現することができる。
【0023】
【発明の効果】以上説明したように、本発明は、注釈を
いくつかの種類に分類し、各々に異なる属性を与えてい
るため、各々に対して発音するかしないかの細かな指定
をユーザが指定することができ、種々の注釈を含む入力
文に対するより分かりやすい音声をユーザに提供するこ
とができる。
【図面の簡単な説明】
【図1】本発明の一実施例における音声合成装置の機能
ブロック図
【図2】同装置の回路ブロック図
【図3】本発明の一実施例における動作を示すフローチ
ャート
【図4】本発明の一実施例における単語辞書の例を示す
一覧図
【図5】本発明の一実施例における注釈用音声情報規則
の例を示す一覧図
【図6】従来の音声合成装置の機能ブロック図
【符号の説明】
11 入力手段 12 入力文字列記憶部 13 出力音声情報記憶部 14 出力手段 15 単語辞書 16 注釈用音声情報規則 17 形態素分割結果記憶部 18 音声情報生成制御部 21 ROM 22 キーボード 23 CPU 24 スピーカ 25 RAM

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 日本語の漢字・仮名混じり文を音声に変
    換する日本語音声合成装置において、単語の表記に対応
    する品詞情報と意味情報と少なくとも読みを含む音声情
    報とを格納した単語辞書と、注釈の少なくとも読みを含
    む音声情報を決定するための規則を格納した注釈用音声
    情報規則と、入力文字列の入力および注釈を音声化する
    かどうかを指示するための入力手段と、前記入力手段か
    ら入力された入力文字列を記憶する入力文字列記憶部
    と、前記入力文字列記憶部に格納された入力文字列に対
    する単語の表記と品詞情報と意味情報と少なくとも読み
    を含む音声情報とからなる形態素分割結果を記憶する形
    態素分割結果記憶部と、前記単語辞書および前記入力文
    字列記憶部を参照しながら形態素分割を行ない、結果を
    前記形態素分割結果記憶部に格納し、前記入力手段から
    入力された指示に従って前記注釈用音声情報規則を参照
    して規則を適応できる各形態素に対応する形態素分割結
    果記憶部中の音声情報を変更してその音声情報を出力す
    る音声情報生成制御部と、前記音声情報生成制御から出
    力された音声情報を記憶する出力音声情報記憶部と、前
    記出力音声情報記憶部に記憶された音声情報をもとに音
    声を出力する出力手段とを備えた音声合成装置。
JP5026745A 1993-02-16 1993-02-16 音声合成装置 Pending JPH06243137A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5026745A JPH06243137A (ja) 1993-02-16 1993-02-16 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5026745A JPH06243137A (ja) 1993-02-16 1993-02-16 音声合成装置

Publications (1)

Publication Number Publication Date
JPH06243137A true JPH06243137A (ja) 1994-09-02

Family

ID=12201843

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5026745A Pending JPH06243137A (ja) 1993-02-16 1993-02-16 音声合成装置

Country Status (1)

Country Link
JP (1) JPH06243137A (ja)

Similar Documents

Publication Publication Date Title
WO2000045377A9 (en) A method and apparatus for performing spoken language translation
WO2000045290A9 (en) A method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
JP2007206975A (ja) 言語情報変換装置及びその方法
US20010029443A1 (en) Machine translation system, machine translation method, and storage medium storing program for executing machine translation method
JPS61285570A (ja) 音声入力装置
JP3589972B2 (ja) 音声合成装置
JP6411015B2 (ja) 音声合成装置、音声合成方法、およびプログラム
JP3518340B2 (ja) 読み韻律情報設定方法及び装置及び読み韻律情報設定プログラムを格納した記憶媒体
JPH06243137A (ja) 音声合成装置
JPH07262191A (ja) 単語分割方法、および音声合成装置
JP2002510075A (ja) 派生された単語を使用する音声認識辞書の拡張
JPH08190562A (ja) 機械翻訳装置
JPH06186993A (ja) 音声合成装置
JPH06289889A (ja) 音声合成装置
KR0180650B1 (ko) 음성합성기의 한국어 문장분석방법
JP3573889B2 (ja) 音声出力装置
JP3971577B2 (ja) 音声合成装置および音声合成方法、携帯端末器、音声合成プログラム、並びに、プログラム記録媒体
JP2721018B2 (ja) 音声規則合成装置
JP3402480B2 (ja) 文書朗読装置
JPS6160167A (ja) 日本語ワ−ドプロセツサ
JPH0728825A (ja) 音声合成装置
JPH09185629A (ja) 機械翻訳方法
JP3353873B2 (ja) 機械翻訳装置
Coleman Improved prediction of stress in out-of-vocabulary words
Nojoumian Towards the development of an automatic diacritizer for the Persian orthography based on the Xerox finite state transducer