JPS63157264A - 文章読み上げ装置 - Google Patents
文章読み上げ装置Info
- Publication number
- JPS63157264A JPS63157264A JP61305933A JP30593386A JPS63157264A JP S63157264 A JPS63157264 A JP S63157264A JP 61305933 A JP61305933 A JP 61305933A JP 30593386 A JP30593386 A JP 30593386A JP S63157264 A JPS63157264 A JP S63157264A
- Authority
- JP
- Japan
- Prior art keywords
- word
- katakana
- dictionary
- character
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015572 biosynthetic process Effects 0.000 claims description 16
- 238000003786 synthesis reaction Methods 0.000 claims description 16
- 238000012986 modification Methods 0.000 claims 1
- 230000004048 modification Effects 0.000 claims 1
- 238000000034 method Methods 0.000 abstract description 4
- 230000002194 synthesizing effect Effects 0.000 abstract 1
- 235000016496 Panda oleosa Nutrition 0.000 description 5
- 240000000220 Panda oleosa Species 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 241000282376 Panthera tigris Species 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
- 239000002966 varnish Substances 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔概要〕
文章読み上げ装置において、入力されたカタカナ文字列
中に辞書には存在しない1文字の未知語が発見された場
合、その1文字の未知語をその直前のカタカナ単語に含
めて単語を同定することにより、読み上げを自然にする
と共に了解性を向上させる 〔産業上の利用分野〕 本発明は1表記された文章を入力して読み上げ出力を行
う文章読み上げ装置に関するものであり。
中に辞書には存在しない1文字の未知語が発見された場
合、その1文字の未知語をその直前のカタカナ単語に含
めて単語を同定することにより、読み上げを自然にする
と共に了解性を向上させる 〔産業上の利用分野〕 本発明は1表記された文章を入力して読み上げ出力を行
う文章読み上げ装置に関するものであり。
特に辞書に存在しない1文字のカタカナ語が発生した場
合に、読み上げを自然にすると共に了解性を向上させた
文章読み上げ装置に関する。
合に、読み上げを自然にすると共に了解性を向上させた
文章読み上げ装置に関する。
日本語文の形で表記された文章を文字入力し、その正し
い読みを音声出力する文章読み上げ装置は。
い読みを音声出力する文章読み上げ装置は。
文書の確認や校正などの多くの用途において有用なもの
として、最近注目されている。
として、最近注目されている。
第3図は、従来の文章読み上げ装置の基本的な構成を示
したものである。
したものである。
第3図において、31はディスプレイ、32はキーボー
ド、33は主制御部、34は文書ファイル、35は文書
入力制御部、36はマツチング単語同定部、37は辞書
、38は規則合成部、39はスピーカーである。
ド、33は主制御部、34は文書ファイル、35は文書
入力制御部、36はマツチング単語同定部、37は辞書
、38は規則合成部、39はスピーカーである。
主制御部33は0文書入力制御部35.マツチング単語
同定部36及び規則合成部38を制御する。
同定部36及び規則合成部38を制御する。
文書ファイル34は2文書人力制御部35により入力さ
れた文書を蓄積する。
れた文書を蓄積する。
文書入力制御部35は、ディスプレイ31及びキーボー
ド32を用いて日本語文章を入力し1文書ファイル34
に出力する。
ド32を用いて日本語文章を入力し1文書ファイル34
に出力する。
マツチング単語同定部36は、主制御部33から送られ
てきた表記文字列と辞書37中の単語とをマツチングさ
せ1表記文字列を構成する各単語を同定するとともに、
読み列を生成する。
てきた表記文字列と辞書37中の単語とをマツチングさ
せ1表記文字列を構成する各単語を同定するとともに、
読み列を生成する。
辞書37には、単語の表記とその読み、用法等の文法が
登録されている。単語には、漢字語、カタカナ語、漢字
かな混じり語等が含まれる。
登録されている。単語には、漢字語、カタカナ語、漢字
かな混じり語等が含まれる。
規則合成部38は、マツチング単語同定部36により生
成された読み列に文章読み上げの発生上の規則を通用し
、修飾してから音声合成し、規則合成音列を生成する。
成された読み列に文章読み上げの発生上の規則を通用し
、修飾してから音声合成し、規則合成音列を生成する。
規則合成音列は、スピーカー39から音声出力される。
動作において1例えばキーボード32から人力された漢
字かな混じりの文書は1文書入力側′411部35によ
り文書ファイル34に蓄積される。
字かな混じりの文書は1文書入力側′411部35によ
り文書ファイル34に蓄積される。
蓄積された文書は、主制御部33においてマツチングの
処理単位(例えば1句点ごと)に区切られてマツチング
単語同定部36へ送られ、辞書37中の単語とマツチン
グがとられる。
処理単位(例えば1句点ごと)に区切られてマツチング
単語同定部36へ送られ、辞書37中の単語とマツチン
グがとられる。
辞書37中に存在する単語は、辞書37中の読み、アク
セント等の情報が与えられ、規則合成部38により合成
音声に変換されてスピーカー39から出力される。
セント等の情報が与えられ、規則合成部38により合成
音声に変換されてスピーカー39から出力される。
辞書37中に存在しない文字列は、基本的には読めない
訳であるが、カタカナ又はひらがなの部分には、1文字
づつ読みを与え、漢字表記部分には1例えば合図音に置
き喚えて発生する。
訳であるが、カタカナ又はひらがなの部分には、1文字
づつ読みを与え、漢字表記部分には1例えば合図音に置
き喚えて発生する。
従来の文′11読み上げ装置では、マツチング単語同定
部36の処理において、辞書37中に存在しない文字列
は未知語として扱い、その未知語が。
部36の処理において、辞書37中に存在しない文字列
は未知語として扱い、その未知語が。
カタカナ又はひらがなの場合には、1文字づつ読みを与
える構成になっているため、読みが不自然になるという
問題があった。
える構成になっているため、読みが不自然になるという
問題があった。
例えば1次の例のように、カタカナ文字列の1部だけが
辞書37中に存在する場合、不自然に切れたり、不自然
なアクセントで合成出力されてしまう。
辞書37中に存在する場合、不自然に切れたり、不自然
なアクセントで合成出力されてしまう。
例) 「ドラボン」 (ズ)
「タイガー」 (ス)「ファン」
「アメリカ」 (ン)「コーヒー」
「データJ (−) rフロー」
但し。
「」:辞書37中に存在する単語
():辞書37中に存在しない部分
〔問題点を解決するための手段〕
本発明は、入力されたカタカナ文字列に辞書に存在しな
い1文字の未知語が発生した場合、その1文字の未知語
をその直前の単語に含めて文字列を同定することにより
、読み上げを自然にすると共に了解性を向上させるもの
である。
い1文字の未知語が発生した場合、その1文字の未知語
をその直前の単語に含めて文字列を同定することにより
、読み上げを自然にすると共に了解性を向上させるもの
である。
第1図は1本発明の基本構成を示す図である。
第1図において、1はディスプレイ、2はキーボード、
3は主制御部、4は文書ファイル、5は文書入力制御n
部、6はマツチング単語同定部、7は辞書、8はカタカ
ナ処理部、9は規則合成部。
3は主制御部、4は文書ファイル、5は文書入力制御n
部、6はマツチング単語同定部、7は辞書、8はカタカ
ナ処理部、9は規則合成部。
10はスピーカーである。
主制御部3は1文書入力制御部5.マツチング単語同定
部6.カタカナ処理部8及び規則合成部9を制御する。
部6.カタカナ処理部8及び規則合成部9を制御する。
文8ファイル4は1文書入力制御部5により入力された
文書を蓄積する。
文書を蓄積する。
文書入力制御部5は、ディスプレイl及びキーボード2
を用いて日本語文章を人力し1文書ファイル4に出力す
る。
を用いて日本語文章を人力し1文書ファイル4に出力す
る。
マツチング単語同定部6は、主制御部3から送られてき
た表記文字列と辞書7中の単語とをマツチングさせ1表
記文字列を構成する各単語を同定するとともに、読み列
を生成する。
た表記文字列と辞書7中の単語とをマツチングさせ1表
記文字列を構成する各単語を同定するとともに、読み列
を生成する。
辞書7には、単語の表記とその読み、用法等の文法が登
録されている。単語には、漢字語、カタカナ語、漢字か
な混じり語等が含まれる。
録されている。単語には、漢字語、カタカナ語、漢字か
な混じり語等が含まれる。
カタカナ処理部8は、入力されたカタカナ文字列中に辞
書(7)に存在しない1文字の未知語が発生した場合、
その1文字の未知語をその直前の単語に含めて文字列を
同定する処理を行う。
書(7)に存在しない1文字の未知語が発生した場合、
その1文字の未知語をその直前の単語に含めて文字列を
同定する処理を行う。
規則合成部9は、マツチング単語同定部6により生成さ
れた読み列に文章読み上げの発生上の規則を適用し、修
飾してから音声合成し、規則合成音列を生成する。規則
合成音列は、ス°ビーカー10から音声出力される。
れた読み列に文章読み上げの発生上の規則を適用し、修
飾してから音声合成し、規則合成音列を生成する。規則
合成音列は、ス°ビーカー10から音声出力される。
規則合成部9は、マツチング単語同定部6によりマツチ
ングされた単語を音声合成し、スピーカー10から音声
出力する。
ングされた単語を音声合成し、スピーカー10から音声
出力する。
キーボード2から入力された漢字かな混じりの文書は1
文書入力制御部5により文書ファイル4に蓄積される。
文書入力制御部5により文書ファイル4に蓄積される。
14Bされた文書は、主制御部3においてマツチングの
処理単位(例えば1句点ごと)に区切られてマツチング
単語同定部6へ送られ、辞書7中の単語とマツチングが
とられる。
処理単位(例えば1句点ごと)に区切られてマツチング
単語同定部6へ送られ、辞書7中の単語とマツチングが
とられる。
辞書7中に存在する単語は、辞書7中の読み。
アクセント等の情報が与えられ、規則合成部9により合
成音声に変換されてスピーカーlOから出力される。
成音声に変換されてスピーカーlOから出力される。
辞書7中に存在しない文字列は、それがカタカナ文字列
の場合、カタカナ処理部8へ送られる。
の場合、カタカナ処理部8へ送られる。
カタカナ処理部8では、送られてきたカタカナ文字列の
中、1文字の未知語が出現したものについて、その直前
にカタカナ単語があれば、それらをまとめて1単語とし
て同定し直すという処理を行う。
中、1文字の未知語が出現したものについて、その直前
にカタカナ単語があれば、それらをまとめて1単語とし
て同定し直すという処理を行う。
第2図は2本発明の1実施例構成を示す図である。
文書ファイルから取り出された漢字かな混じりの文書は
、マツチング単語同定部6において辞書゛7とのマツチ
ングがとられる。第2図では省略しであるが、辞書7に
は漢字の単語も存在する。
、マツチング単語同定部6において辞書゛7とのマツチ
ングがとられる。第2図では省略しであるが、辞書7に
は漢字の単語も存在する。
マツチングの結果、単語が決定されるが、入力文字列の
中には辞書7中には存在しないものもある。それが漢字
の場合には読みを決定することができないが、カタカナ
文字列の場合には読みを容易に決定することができる。
中には辞書7中には存在しないものもある。それが漢字
の場合には読みを決定することができないが、カタカナ
文字列の場合には読みを容易に決定することができる。
また、カタカナ単語には、?3N数形のような形をした
固有名詞(例、タイガー五)2表記のゆらぎ(例、デー
タニ)9品詞による違い(例、アメリカーンー)等があ
り、マツチングの結果、同定された単語の後に1文字の
未知語(辞書に存在しない文字列)が発生しやすい傾向
がある。
固有名詞(例、タイガー五)2表記のゆらぎ(例、デー
タニ)9品詞による違い(例、アメリカーンー)等があ
り、マツチングの結果、同定された単語の後に1文字の
未知語(辞書に存在しない文字列)が発生しやすい傾向
がある。
そこで、カタカナ処理部8では、1文字のカタカナ単語
は、その直前のカタカナ単語とまとめて1つの単語にし
、アクセントは直前のカタカナ単語に与えられたものを
そのまま与える。
は、その直前のカタカナ単語とまとめて1つの単語にし
、アクセントは直前のカタカナ単語に与えられたものを
そのまま与える。
このようにして与えられた単語の読みとアクセントは、
規則合成部9へ送られ1合成音声に変換されてスピーカ
ー10から出力される。
規則合成部9へ送られ1合成音声に変換されてスピーカ
ー10から出力される。
次に、いくつかの例文を示す。
但し。
「」:辞書7に存在する単語
()二カタカナ未知語
r にカタカナ処理部8で決められた単語を表す。
(入力文)
・・・ドラゴンズは・・・
・・・タイガースファンの・・・
・・・アメリカンコーヒーが・・・
・・・データーフローを・・・
(マツチング単語同定後)
・・・「ドラボン」 (ズ)「は」・・・・・・「タイ
ガーJ (ス)「ファン」 [のJ・・・・・・「アメ
リカ」 (ン)「コーヒー」 「が」・・・・・・「デ
ータJ (−) 「フロー」 「を」・・・(カタ
カナ処理後) ・・・「ドラゴンズ」 「は」・・・ ・・・「タイガースJ 「ファンJ 「の」・・・・・
・「アメリカン」 「コーヒーJ rがJ・・・・・
・「データーJ 「フロー」 「をJ・・・〔発明の効
果) 本発明によれば、カタカナ文字列の読み上げの自然性と
了解性が向上する。
ガーJ (ス)「ファン」 [のJ・・・・・・「アメ
リカ」 (ン)「コーヒー」 「が」・・・・・・「デ
ータJ (−) 「フロー」 「を」・・・(カタ
カナ処理後) ・・・「ドラゴンズ」 「は」・・・ ・・・「タイガースJ 「ファンJ 「の」・・・・・
・「アメリカン」 「コーヒーJ rがJ・・・・・
・「データーJ 「フロー」 「をJ・・・〔発明の効
果) 本発明によれば、カタカナ文字列の読み上げの自然性と
了解性が向上する。
第1図は本発明の基本構成を示す図、第2図は本発明の
1実施例構成を示す図、第3図は従来例を示す図である
。 第1図において。 1:ディスプレイ 2:キーボード 3:主制御部 4:文書ファイル 5:文書入力制御部 6:マツチング単語同定部 7;辞書 8:カタカナ処理部 9:規則合成部 10ニスビーカー
1実施例構成を示す図、第3図は従来例を示す図である
。 第1図において。 1:ディスプレイ 2:キーボード 3:主制御部 4:文書ファイル 5:文書入力制御部 6:マツチング単語同定部 7;辞書 8:カタカナ処理部 9:規則合成部 10ニスビーカー
Claims (1)
- 入力された文書の表記文字列に基づき、辞書(7)を用
いて単語を同定し、読み列を生成するマッチング単語同
定部(6)と、さらに規則にしたがいアクセント等の発
生上の修飾を行って音声合成し、規則合成音列を生成す
る規則合成部(9)とを備えた文章読み上げ装置におい
て、上記表記文字列に含まれるカタカナ文字列中に、マ
ッチング単語同定部(6)が辞書(7)を用いて単語同
定することができなかった1文字の未知語があった場合
、この未知語を直前のカタカナ単語に含ませて単語同定
を行わせるカタカナ処理部(8)を設けたことを特徴と
する文章読み上げ装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61305933A JPS63157264A (ja) | 1986-12-22 | 1986-12-22 | 文章読み上げ装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61305933A JPS63157264A (ja) | 1986-12-22 | 1986-12-22 | 文章読み上げ装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63157264A true JPS63157264A (ja) | 1988-06-30 |
JPH0377532B2 JPH0377532B2 (ja) | 1991-12-10 |
Family
ID=17951042
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61305933A Granted JPS63157264A (ja) | 1986-12-22 | 1986-12-22 | 文章読み上げ装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS63157264A (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58181098A (ja) * | 1982-04-16 | 1983-10-22 | 日本電信電話株式会社 | 文節アクセント決定装置 |
-
1986
- 1986-12-22 JP JP61305933A patent/JPS63157264A/ja active Granted
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58181098A (ja) * | 1982-04-16 | 1983-10-22 | 日本電信電話株式会社 | 文節アクセント決定装置 |
Also Published As
Publication number | Publication date |
---|---|
JPH0377532B2 (ja) | 1991-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS63157226A (ja) | 会話型文章読み上げ装置 | |
JPS63157264A (ja) | 文章読み上げ装置 | |
JP2000352990A (ja) | 外国語音声合成装置 | |
JP3029403B2 (ja) | 文章データ音声変換システム | |
JP2614912B2 (ja) | 文章読み上げ装置 | |
JP2658476B2 (ja) | 文書点字化装置 | |
JPH03196198A (ja) | 音声規則合成装置 | |
JP2996978B2 (ja) | テキスト音声合成装置 | |
JPH0760378B2 (ja) | 文章読み上げ装置 | |
JP2888847B2 (ja) | 文章読み上げ装置とその方法及び言語処理装置とその方法 | |
JPS60122429A (ja) | 単音節音声入力方式 | |
Granström et al. | A danish text-to-speech system using a text normalizer based on morph analysis. | |
JPH01300334A (ja) | 文章読み上げ装置 | |
JP2584222B2 (ja) | 音声合成装置 | |
JPH054676B2 (ja) | ||
JP2622834B2 (ja) | 文音声変換装置 | |
JPH05189194A (ja) | 文書読み上げ装置 | |
JPH0375898B2 (ja) | ||
JPH02234198A (ja) | テキスト音声合成システム | |
JPH04331998A (ja) | 音声合成方式 | |
JPH02244095A (ja) | 文章読み上げ装置 | |
JPH1153357A (ja) | 情報処理用の新しい日本語表音コード | |
Creager et al. | Beginners' Hebrew Grammar | |
JPH0690629B2 (ja) | 文・音声変換方法 | |
JPH05333893A (ja) | 文書読み上げ装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |