JPH02184897A - 文章読み上げ装置 - Google Patents

文章読み上げ装置

Info

Publication number
JPH02184897A
JPH02184897A JP1004174A JP417489A JPH02184897A JP H02184897 A JPH02184897 A JP H02184897A JP 1004174 A JP1004174 A JP 1004174A JP 417489 A JP417489 A JP 417489A JP H02184897 A JPH02184897 A JP H02184897A
Authority
JP
Japan
Prior art keywords
word
words
information
compound
composite
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1004174A
Other languages
English (en)
Inventor
Yoshiaki Teramoto
寺本 良明
Takayuki Oyama
大山 隆之
Mitsuko Kaseda
加世田 光子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1004174A priority Critical patent/JPH02184897A/ja
Publication of JPH02184897A publication Critical patent/JPH02184897A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔1既  要〕 漢字かな混じり文を自然な音声で読み上げる文章読み上
げ装置に関し、 複合単語を一つの単語として単語辞書に登録する構成に
おいて、複数のアクセント句を有する複合単語の言語解
析を容易にすることを目的とし、漢字かな混じり文が入
力され、その言語解析により得られた読みその他の音韻
情報、および単語間のポーズ、アクセント結合その他の
韻律情報に基づいて音声を合成する文章読み上げ装置に
おいて、複数の単語から構成される複合単語が各構成単
語の情報を含めて一つの単語として登録される単語辞書
と、この単語辞書を用いて複合単語の同定処理を行った
後に、各構成単語に分解する複合単語分解手段と備え構
成する。
〔産業上の利用分野〕
本発明は、日本語の漢字かな混じり文(テキスト)を自
然な音声で読み上げる文章読み上げ装置に関する。
従来の音声合成は、音韻情報および韻律情報を人手によ
り与え、「規則による合成」の手法を用いて目的の音声
を発生させるものであった。
ところで、ワードプロセッサやOCR技術の発達により
日本語文章の入力は容易になっているが、その校正作業
においては、現在でも例えば二人の一方が読み手になっ
た読み合わせが行われている。
したがって、今後の音声合成システムでは、これらの日
本語文章(分かち書き化されていない漢字かな混じり文
)から直接、連続音声に自動変換し、読み上げることが
できる装置が望まれている。
〔従来の技術〕
漢字かな混じり文を読み上げるには、文章中の単語を正
しく認定(同定)し、単語に正しい音韻(読み)とアク
セントを自動付与するとともに、文に自然なアクセント
ボーズ、イントネーションなどを自動付与するための言
語解析技術が必要である。
したがって、入力装置から入力された漢字かな混じり文
を読み上げる文章読み上げ装置の構成は、この言語解析
を行う言語処理部と、ここで得られた音韻情報および韻
律情報をもとに対応する音声を合成する音声合成部とに
大きく分けることができる。
すなわち、言語処理部は、入力された漢字かな混じり文
を所定の単位(単語、単語列)に分解し、それぞれの読
み、アクセント情報、文法情報を付与する単語同定処理
を行った後に、再び複合語、文節、文節相互の関係(ア
クセント句、呼気段落)の順に高次の言語単位に再構成
する処理を行い、複合した語あるいは文としての音韻情
報の修正およびアクセント、イントネーションなどの韻
律情報を決定し、各情報を音声合成部に渡す構成である
ところで、日本語の漢字かな混じり文は、単語と単語と
の境界に空白その他の記号を入れない(分かち書き化さ
れていない)ので、言語処理部では単語境界を推定して
単語同定処理が行われている。しかし、この単語境界の
推定は容易ではなく、またそれを誤れば解析誤り(例え
ばアクセントの乱れや読み違い)を起こしやすいので、
一連の複数の単語から構成される複合単語を一つの単語
として単語辞書に登録し、単語同定処理における解析誤
りを低減させる方法が一般的に行われている。
この複合単語を一つの単語として登録する方法は、同じ
表記で異なる読みをもつ単語の解析においても有効であ
り、その読み分けを容易にする方法としても利用されて
いる。
たとえば、「私は町へ丘ユ亙」と「私はその動作を丘ユ
友Jを読み分けさせるには、表記「へ行った」および「
を行った」をそれぞれ音n「エイツタ」および「オオコ
ナッタ」として単語辞書に登録させることにより、それ
ぞれの単語同定が容易になる。
〔発明が解決しようとする課題〕
ところで、このような構成の文章読み上げ装置では、単
語辞書を参照して各単語の同定処理が行われるが、それ
に続いて行われる複合した語あるいは文としての音韻情
報の修正およびアクセント結合などの韻律情報の設定は
、各単語ごとのアクセント句を最小単位として扱ってい
る。
ところが、一つの単語として登録される複合単語には、
複数個のアクセント句が形成される場合があるが、従来
方式による韻律情報の設定では、複数のアクセント句を
有する複合単語についての処理は想定されていない。し
たがって、そのような複合単語を含む言語処理では、そ
のアクセント句境界および各々のアクセント型その他の
韻律に関する付加的な情報を単語辞書中に含める必要が
あり、またその情報があることを踏まえた上で、種々の
音韻情報および韻律情報を設定する処理が必要になって
くる。
本発明は、複合単語を一つの単語として単語辞書に登録
する構成において、複数のアクセント句を有する複合単
語の言語解析を容易にする文章読み上げ装置を提供する
ことを目的とする。
〔課題を解決するための手段〕
第1図は、本発明の原理ブロック図である。
図において、文章読み上げ装置は、漢字かな混じり文が
入力され、その言語解析により得られた読みその他の音
韻情報、および単語間のポーズ、アクセント結合その他
の韻律情報に基づいて音声を合成する構成である。
単語辞書11は、複数の単語から構成される複合単語が
各構成単語の情報を含めて一つの単語として登録される
複合単語分解手段13は、この単語辞書11を用いて複
合単語の同定処理を行った後に、各構成単語に分解する
〔作 用〕
本発明は、単語辞書11に登録されている複合単語の各
構成単語の情報を用いて、複合単語分解手段13がその
複合単語を各構成単語に分解する。
したがって、複合単語が複数のアクセント句を含んでい
ても、それ以降の処理においては各構成単語に分解され
ているので、アクセント結合その他の文としての音韻情
報および韻律情報の決定が、単一の単語に対する場合と
同様の構成および処理により行うことが可能である。
〔実施例〕
以下、図面に基づいて本発明の実施例について詳細に説
明する。
第2図は、本発明の一実施例構成を示すブロック図であ
る。
図において、主制御部21には、入力装置23、前処理
部25、単語同定部27、音韻・韻律処理部29、音声
合成部31およびスピーカ33が接続される。また、単
語同定部27には単語辞書35が接続され、音声合成部
31には音声ファイル37が接続される。なお、前処理
部25、単語同定部27、音韻・韻律処理部29は、言
語処理部を機能分割したものである。
入力装置23から入力された漢字かな混じり文は、前処
理部25において蓄積および所定の単位(例えば句読点
ごと)の分割処理が行われる。
単語同定部27は、単語辞書35を参照しながら単語あ
るいは単語列を同定し、それぞれの読み、アクセント情
報、文法情報を取り出す、なお、単語辞書35には、単
語同定を行うための表記、単語間の接続関係を表す文法
属性およびその他の単語属性と、次段の音韻・韻律処理
部29の処理に用いる音韻(読み)、アクセントおよび
アクセント結合属性とがそれぞれ登録されている。
音韻・韻律処理部29は、複合語、文節、文節相互の関
係の順に高次の言語単位に再構成する処理を行う。すな
わち、単語同定部27で得られた単語の読みをもとに、
単語の連接によって生ずる連濁あるいは音便化情報を得
る音韻規則、および単語・文節境界の文法情報をもとに
、アクセント句、呼気段落の決定、その他音調制御情報
を得る韻律規則に従って、音声合成に必要な種々の制御
情報(音韻情報および韻律情報)を作成する。
音声合成部31は、音声ファイル37を参照して各制御
情報に従った音声信号を合成し、スピーカ33から連続
音声として出力する。
ここで、本発明の特徴とするところは、第3図に示すよ
うに、複合単語については、表記、文法属性、単語属性
、音韻、アクセントおよびアクセント結合属性の他に、
それを示すフラグと構成単語の情報が登録された単語辞
書35を備え、さらに単語同定部27に、複合単語とし
て同定処理されたものについて各構成単語に分解する複
合単語分解部41を設け、各単語ごとの情報を音■・韻
律処理部29に送出する構成にある。
なお、複合単語の構成単語の情報として、各単語ごとに
その表記長、音韻長および文法属性が設定される。
以下、第4図に示す複合単語分解部41の処理内容を示
すフローチャートを参照して、本発明実施例の動作につ
いて説明する。
複合単語分解部41では、単語同定された各単語をそれ
ぞれ取り出し、単語辞書35に登録されていた情報に複
合単語を示すフラグが設定されていたか否かを判断する
そのフラグの設定があれば、単語同定された単語が複合
単語であるので、その構成単語ごとにそれぞれ設定され
ている情報(表記長、音韻長および文法属性)を取り出
し、またフラグの設定がなければそれ自身が一つの単語
であるので以下の分解処理は行わない。
次に、フラグの検出により各構成単語に対応する情報が
取り出された場合には、それぞれ単語辞書35を参照し
て対応する単語を同定し、すでに得られている情報の他
にアクセント型やアクセント結合属性などの各情報を取
り出し、複合単語を複数の単語に置き換える。
以上の処理を単語同定されたすべての単語について繰り
返す。
このように、複合単語として単語同定された単語につい
ても、単一の単語と同様の各構成単語に分解されて音韻
・韻律処理部29に送出されるので、それ以下の処理で
は複合単語であったことを考慮することなく、通常の処
理で高次の言語単位に再構成し、文としての音韻情報お
よび韻律情報を決定することができる。
なお、複合単語の構成単語の情報としてその表記長、音
韻長および文法属性の三つに留めたのは、それを基にし
て単語辞書を参照し同定処理を行うのに必要かつ十分な
情報といえるからである。
また、その他の情報を構成単語の情報として持たないの
は、各単語の情報としてすでに単語辞書内にあり、各構
成単語の同定処理により容易に単語辞書から得ることが
できるためである。したがって、単語辞書は同一の情報
を重複して持つ必要がなく、そのデータ量を最小限に抑
えることができる。
〔発明の効果〕 上述したように、本発明によれば、一つの単語として登
録される複合単語が複数のアクセント句を含んでいても
、各構成単語に分解されるので、単語同定処理に続く音
韻情報および韻律情報の設定にはまったく影響がない。
したがって、文章読み上げ装置は、複合単語をその構成
単語に分解する処理を付加するだけで、大幅な変更を施
すことな(高精度の言語解析を行うことができ、実用的
には極めて有用である。
【図面の簡単な説明】
第1図は本発明の原理ブロック図、 第2図は本発明の一実施例構成を示すブロック図、第3
図は本発明による単語辞書の構成例を示す図、。 第4図は複合単語分解部の処理内容を示すフローチャー
トである。 37は音声ファイル、 41は複合単語分解部である。 図において、 11は単語辞書、 13は複合単語分解手段、 21は主制御部、 23は入力装置、 25は前処理部、 27は単語同定部、 29は音韻・韻律処理部、 31は音声合成部、 33はスピーカ、 35は単語辞書、 本発明原理ブロック図 第 図 単語辞書の構成例 第 図

Claims (1)

    【特許請求の範囲】
  1. (1)漢字かな混じり文が入力され、その言語解析によ
    り得られた読みその他の音韻情報、および単語間のポー
    ズ、アクセント結合その他の韻律情報に基づいて音声を
    合成する文章読み上げ装置において、 複数の単語から構成される複合単語が各構成単語の情報
    を含めて一つの単語として登録される単語辞書(11)
    と、 この単語辞書(11)を用いて複合単語の同定処理を行
    った後に、各構成単語に分解する複合単語分解手段(1
    3)と を備えたことを特徴とする文章読み上げ装置。
JP1004174A 1989-01-10 1989-01-10 文章読み上げ装置 Pending JPH02184897A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1004174A JPH02184897A (ja) 1989-01-10 1989-01-10 文章読み上げ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1004174A JPH02184897A (ja) 1989-01-10 1989-01-10 文章読み上げ装置

Publications (1)

Publication Number Publication Date
JPH02184897A true JPH02184897A (ja) 1990-07-19

Family

ID=11577355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1004174A Pending JPH02184897A (ja) 1989-01-10 1989-01-10 文章読み上げ装置

Country Status (1)

Country Link
JP (1) JPH02184897A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63165925A (ja) * 1986-12-27 1988-07-09 Fujitsu Ltd 文章読み上げ装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63165925A (ja) * 1986-12-27 1988-07-09 Fujitsu Ltd 文章読み上げ装置

Similar Documents

Publication Publication Date Title
US6751592B1 (en) Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically
JPH05165486A (ja) テキスト音声変換装置
RU2386178C2 (ru) Способ предварительной обработки текста
Akinwonmi Development of a prosodic read speech syllabic corpus of the Yoruba language
Khamdamov et al. Syllable-Based Reading Model for Uzbek Language Speech Synthesizers
JPH02184897A (ja) 文章読み上げ装置
Romsdorfer Polyglot text-to-speech synthesis: Text analysis & prosody control
Hussain To-sound conversion for Urdu text-to-speech system
JPH05134691A (ja) 音声合成方法および装置
JP3234371B2 (ja) 音声合成用音声持続時間処理方法及びその装置
Bellegdi et al. Automatic rule based phonetic transcription and syllabification for quranic text
JPH0634175B2 (ja) 文章読上げ装置
Kaur et al. BUILDING AText-TO-SPEECH SYSTEM FOR PUNJABI LANGUAGE
JP2888847B2 (ja) 文章読み上げ装置とその方法及び言語処理装置とその方法
JPH0229797A (ja) テキスト音声変換装置
JPH096378A (ja) テキスト音声変換装置
JP2614912B2 (ja) 文章読み上げ装置
JPH02234198A (ja) テキスト音声合成システム
Evans et al. An approach to producing new languages for talking applications for use by blind people
Kayte et al. Artificially Generatedof Concatenative Syllable based Text to Speech Synthesis System for Marathi
FalDessai Development of a Text to Speech System for Devanagari Konkani
KR0136423B1 (ko) 발음 제어 기호의 유효성 판정을 이용한 음운 변동 처리 방법
JPH04199421A (ja) 文書読上げ装置
Granström et al. A danish text-to-speech system using a text normalizer based on morph analysis.
JPH02244095A (ja) 文章読み上げ装置