JPH07334493A - 文書読み上げ方法及び文書読上装置 - Google Patents

文書読み上げ方法及び文書読上装置

Info

Publication number
JPH07334493A
JPH07334493A JP6131644A JP13164494A JPH07334493A JP H07334493 A JPH07334493 A JP H07334493A JP 6131644 A JP6131644 A JP 6131644A JP 13164494 A JP13164494 A JP 13164494A JP H07334493 A JPH07334493 A JP H07334493A
Authority
JP
Japan
Prior art keywords
code
conversion
code section
document
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6131644A
Other languages
English (en)
Other versions
JP3556269B2 (ja
Inventor
Osamu Kaseno
修 加瀬野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP13164494A priority Critical patent/JP3556269B2/ja
Publication of JPH07334493A publication Critical patent/JPH07334493A/ja
Application granted granted Critical
Publication of JP3556269B2 publication Critical patent/JP3556269B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 そのまま読まれることを目的としていないコ
ード変換によって生成された部分と、そのまま読まれる
ことを目的とした残りの部分とを区別して、そのまま読
まれることを目的していない意味不明な文字列を読み上
げないようにすること。 【構成】 コード変換区間検出及び削除部2は記憶部1
からテキストを読み出す際に、読み出した文字列がコー
ド変換された意味を成さない文字列であるか無いかをチ
ェックし、そうである場合はこの文字列部分をスキップ
することにより、読み上げ対象テキストの読んで意味の
ある文字列部分のみを文音声変換部3に渡す。このた
め、文音声変換部3は読んで意味のある文章部分のみを
音声データに変換した後、これをスピーカ4から出力す
る。これにより、意味を成す文字列のみが読み上げら
れ、上記したコード変換された意味を成さない文字列は
読み上げられなくなる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字列コードの中にコ
ード変換された区間を有するテキストを音声の規則合成
により合成音で読み上げる文書読み上げ方法及びこの方
法を採用した文書読上装置に関する。
【0002】
【従来の技術】近時、漢字仮名混じりの文を解析し、そ
の文が示す音声情報を規則合成により音声合成して出力
する音声合成装置が種々開発されている。この種の音声
合成装置は、銀行業務における電話紹介サービスや、新
聞校閲システム、文書読み上げ装置等として幅広く利用
され始めている。又、通信手段の一つとして、ネットワ
ーク接続されたコンピュータ上でテキストを交換する電
子メールが幅広く使用されているが、電子メール等のよ
うな使用できるコードの制限された通信手段を使用する
には、テキスト中の文字列コードをそのまま送ることの
できない場合があり、送ることができない文字列コード
を使用可能な文字列コードに変換しなければならなかっ
た。
【0003】上記のように電子メール上では、使用する
ことのできるコードの種類に制限のあることがあり、そ
の場合、送信するテキスト中にバイナリファイル等の任
意のコードが含まれるものは、その制限に抵触してしま
い、そのままでは送ることができなかった。そのため、
このようなファイルは使用可能な文字列になるようにコ
ード変換を行なって送信し、受信側でその文字列を元に
戻すといったことが行われている。このように、電子メ
ール内にはそのまま読まれることを目的とした文字列の
他に、そのまま読まれることを目的とせずファイルを送
るためにコード変換により生成された文字列が混在する
ことがある。更に、電子メールの表題行等では、ASC
IIコードの使用のみが許されており、日本語等を使え
ないことがある。そのような環境下でASCIIコード
以外の文字を使用しようとした場合、それをASCII
コードのみからなる文字列にコード変換して挿入してお
き、受信側でそれを元に戻して見るといったことが行わ
れている。
【0004】又、仕様が異なる例えば漢字が使用できな
い外国製のコンピュータに日本語を使用できるコンピュ
ータで作成したテキストを入力したり、送信する場合も
上記のように入力又は送信するコードに制限が生じ、テ
キストの一部を使用可能な文字列になるようにコード変
換して入力又は送信することになる。このため、各種情
報処理装置や通信装置を通したテキストはそれを構成す
る文字列コードの一部がコード変換されている場合があ
ちらこちらで生じることになる。
【0005】ところで、上記のようにコード変換され、
そのままでは意味を持たず、そのまま読まれることを目
的としないコードが存在するテキストを例えば上記した
音声合成装置を用いた文書読上装置にて読み上げる時、
従来の読み上げ方法では、読み上げることを前提として
いないコード部分と、他の読み上げることができるコー
ド部分とを区別することがなかったために、そのまま全
文を読み上げてしまっていた。このため、訳の分からな
い読み上げ部分が生じてしまい、聞き手に違和感や不快
感を与えるという不具合があった。
【0006】
【発明が解決しようとする課題】上記のように従来の音
声合成装置による読み上げ方法にあっては、読み上げ対
象テキスト中に存在するそのまま読まれることを目的と
せず、コード変換によって生成された部分と、そのまま
読まれることを目的としたコード部分とを区別しないた
め、そのまま読まれることを目的していない意味不明な
文字列もそのまま読み上げの対象となって、訳の分から
ない読み上げ部分が生じるため、聞き手に違和感や不快
感を与えるという不具合があった。
【0007】そこで本発明はこのような事情を考慮して
なされたもので、そのまま読まれることを目的とせずコ
ード変換によって生成された部分と、そのまま読まれる
ことを目的とした他の部分とを区別して、そのまま読ま
れることを目的していない意味不明な文字列を読み上げ
ないようにするか、又は元の意味のある文字列に戻して
読み上げることができる文書読み上げ方法及び文書読上
装置を提供することを目的としている。
【0008】
【課題を解決するための手段】本発明は文書を構成して
いるコードを音声の規則合成によって音声データに変換
し、これを音声出力することにより文書を読み上げる文
書読上装置において、前記文書を構成するコードの中で
コード変換された変換コード区間を検出する検出手段
と、この検出手段によって検出された変換コード区間の
代わりに前記変換コード区間が文中に挿入されていたこ
とを示す文字列コードを作成するメッセージ作成手段
と、このメッセージ作成手段によって作成された文字列
コードを前記変換コード区間を除いた残りのコード区間
中に挿入して音声データに変換させる制御手段とを具備
した構成を有する。この構成に前記検出手段によって検
出された変換コード区間からその変換コード区間に係り
一部情報を抽出する抽出手段を加えて、メッセージ作成
手段により前記一部情報を含んだメッセージを作成する
構成と、更に前記抽出手段とメッセージ作成手段に代わ
って、前記検出手段によって検出された変換コード区間
を元の変換コードに復元する復元手段を設け、この復元
手段によって復元したコード区間を前記制御手段により
前記変換コード区間を除いた残りのコード区間に挿入し
て音声データに変換させる構成とがある。
【0009】
【作用】本発明によれば、読み上げる文書から、実際に
そのまま読み上げる必要のないコード変換された変換コ
ード区間の文字列を検出して削除することにより、意味
のある文字列コード部分のみを読み上げることができ
る。更に、前記コード変換された区間に代わって、この
ような区間が挿入されたことを示すメッセージを作成し
て、これを読み上げたり、或いは前記変換コード区間か
ら抽出した一部情報を含んだ同様のメッセージを作成し
て読み上げることにより、変換コード区間が存在したこ
とを聞き手に知らせたり、或いは前記変換コード区間を
元の文字列コードに復元して、この復元したコードを読
み上げることによって、意味のない文字列を読み上げて
聞き手に違和感や不快感を与えることをなくすことがで
きる。
【0010】
【実施例】以下、本発明の一実施例を図面を参照して説
明する。図1は本発明の文書読み上げ方法を採用した本
発明の文書読上装置の一実施例を示したブロック図であ
る。1は読み上げ対象となるテキストを格納した記憶
部、2は記憶部1よりテキストの内容を逐次読み出し、
コード変換を受けている区間をコード変換部分の持つ特
徴や制約によって特定することによりその部分を抜き出
したり、必要に応じて、その部分からコード変換された
文字列を削除した旨を示すメッセージを代わりに挿入す
るコード変換区間検出及び削除部、3はコード変換区間
検出及び削除部2で編集されたテキストの内容に従った
音声合成を行なう文音声変換部、4は音声出力用のスピ
ーカである。
【0011】次に本実施例の文書読み上げ方法について
図1及び図2に示したフローチャートを参照して説明す
る。まず、オペレータは図示されない入力部から読み上
げ対象テキストを指定すると共に、このテキストの読み
上げ開始を装置に指示する。これにより、コード変換区
間検出及び削除部2はステップ201にて読み上げ対象
テキストの読み出しを開始するために記憶部1にアクセ
スし、ステップ202にて記憶部1に読み上げ対象テキ
ストがまだ残っているかをチェックする。ここで、テキ
ストが残っていなければ動作を終了し、残っていればス
テップ203に進む。
【0012】ステップ203にて、コード変換区間検出
及び削除部2はまだ残っているテキストの次の1行を記
憶部1から取り出し、ステップ204に進む。ステップ
204では、取り出した1行を解析し、これがコード変
換された部分のヘッダーであるかどうかをヘッダーが満
たすべき条件を検査することにより判定する。但し、こ
こでは、ヘッダーのみを見れば、それに続く行がコード
変換されているか否かの検査が可能で、コード変換区間
の終点も判定できるものとする。ここで、ヘッダーでな
いことが分かればステップ207へ進み、ヘッダーであ
ればステップ205に進む。ステップ207にて、コー
ド変換区間検出及び削除部2はヘッダーの情報よりコー
ド変換されている部分の終点を算出し、記憶部1からの
空読み等により、前記コード変換区間を読み上げの対象
から削除する処理を行った後、ステップ202に戻る。
【0013】ステップ205に進んだ場合、コード変換
区間検出及び削除部2は記憶部1から読み出したコード
を文音声変換部3に入力する。このため、文音声変換部
3は文音声変換により前記入力コードを音声データに変
換して、ステップ206に進む。ステップ206にて、
文音声変換部3は文音声変換により得られた音声データ
をスピーカ4から出力して、ステップ202に戻る。
【0014】図7は図2のフローチャートで示したテキ
ストのコード変換のされている区間については読み上げ
ないようにする読み上げ方法を用いた場合の入力文と、
実際に読み上げられる文例を示した図である。図7
(A)に示したテキストが読み上げのために与えられる
原文(入力文)で、図7(B)に示した右側のテキスト
が実際に読み上げられる文に相当する。
【0015】図7(A)に示した原文の場合、「以下に
ファイルを添付します。」まで、コード変換された部分
が無いとすると、そこまでは、読み上げにそのまま使わ
れることとなる。しかし、その次の行の「〈〈Type
Aprog.gz3lines〉〉」がTypeAとい
うコード変換フォーマットのヘッダーの書式に合致し、
その行に続く3行がこのコード変換方法によって生成さ
れた行であることが、コード変換区間検出及び削除部2
の解析によって判明すると、その行と、それに続く3行
は実際には読み上げないようにする。ここで、「〈〈T
ypeAprog.gz3lines〉〉」という行
が、TypeAというコード変換法によって生成された
テキストの先頭であり、且つこのテキストを復号して生
成されるのが、prog.gzという名前のファイルで
あり、これに続く3行がこの変換法によって生成された
テキストであることを表している。従って、このような
形式に合致する行がテキスト中に存在すれば、これはこ
の変換方法によるテキスト部分の開始であることが保証
されているものとする。しかし、場合によっては本当に
この方法によって生成されたものかを、この変換法の持
つ制約等により検査する必要があることもある。
【0016】そして、上記した4行の後のテキストに、
コード変換のフォーマットに合致する部分が存在しなけ
れば、それらは、そのまま実際の読み上げに使用される
こととなる。これにより、図7(A)に示したテキスト
の場合、実際に読み上げられるのは、コード変換された
部分を除いた、図7(B)に示した右側のテキストとい
うことになる。
【0017】本実施例によれば、読み上げ対象となって
いるテキスト中にあるコード変換された意味のない文字
列を区別することができ、このコード変換区間が特定さ
れると、この区間を削除して、意味のある文字列部分の
みを読み上げることができるため、上記のようなコード
変換区間を含んだテキストを、聞き手に違和感や不快感
等を与えることなく、意味のある部分のみを一貫して読
み上げることができる。
【0018】図3は本発明の文書読み上げ方法の他の実
施例を示したフローチャートである。まず、オペレータ
は図示されない入力部から読み上げ対象テキストを指定
すると共に、このテキストの読み上げ開始を装置に指示
する。これにより、コード変換区間検出及び削除部2は
ステップ301にて読み上げ対象テキストの読み出しを
開始するために記憶部1にアクセスし、ステップ302
にて記憶部1に読み上げ対象テキストがまだ残っている
かをチェックする。ここで、テキストが残っていなけれ
ば、動作を終了し、残っていればステップ303に進
む。
【0019】ステップ303にて、コード変換区間検出
及び削除部2はまだ残っているテキストの次の1行を記
憶部1から取り出した後、ステップ304に進む。ステ
ップ304では、取り出した1行を解析し、これがコー
ド変換された区間のヘッダーであるかどうかをヘッダー
が満たすべき条件を検査することにより判定する。但
し、ここでは、ヘッダーのみを見れば、それに続く行が
コード変換されているか否かの検査が可能で、コード変
換部の終点も判定できるものとする。ここで、ヘッダー
でないことが分かればステップ307へ跳び、ヘッダー
であればステップ305に進む。
【0020】コード変換区間検出及び削除部2はステッ
プ305にて記憶部1から取り出したコード変換のされ
ている区間について記憶部1からの空読み等により、こ
のコード変換部を読み上げの対象から削除し、その代わ
りにテキストのその場所にコード変換された区間が挿入
されていた旨を示す文章(メッセージ)を作成して、ス
テップ307に進む。ステップ307にて、コード変換
区間検出及び削除部2は記憶部1から読み出したコード
を文音声変換部3に入力する。このため、文音声変換部
3は文音声変換により前記入力コードを音声データに変
換して、ステップ308に進む。ステップ308にて、
文音声変換部3は文音声変換により得られた音声データ
をスピーカ4から出力して、ステップ302に戻る。
【0021】図8はテキストのコード変換のされている
区間については、その部分にコード変換されたテキスト
が挿入されていることを報告するのみにとどめ、実際に
は読み上げないようにする図3のフローチャートで示し
た読み上げ方法を用いた場合の入力文と、実際に読み上
げられる文例を示した図である。図8(A)に示したテ
キストが読み上げのために与えられる原文で、図8
(B)に示した右側のテキストが実際に読み上げられる
文に相当する。
【0022】図8(A)に示した原文の場合、「以下に
ファイルを添付します。」まで、コード変換された部分
がないとすると、そこまでは、実際の読み上げにもその
まま使われることとなる。しかし、その次の行の
「〈〈TypeAprog.gz3lines〉〉」
が、TypeAというコード変換フォーマットのヘッダ
ーの書式に合致し、その行に続く3行がこのコード変換
方法によって生成された行であることが解析によって判
明すると、その行と、それに続く3行は実際には読み上
げないようにし、代わりに、「この部分にコード変換さ
れたファイルが挿入されています。」という文を挿入
し、この文を読み上げることにより、そこにコード変換
により生成された文が挿入されていることを聞き手に報
告する。そして、このこれら4行の後のテキストに、コ
ード変換のフォーマットに合致する部分が存在ししなけ
れば、それらは、そのまま実際の読み上げに使用される
こととなる。
【0023】従って、図8(A)に示したテキストの場
合、実際に読み上げられるのは、コード変換された区間
を除き、代わりに、そこにコード変換されたファイルが
存在することを報告する文章を挿入した、図8(B)の
右側のテキストということになる。
【0024】本実施例によれば、読み上げ対象となって
いるテキスト中にあるコード変換された意味のない文字
列を区別することができ、このコード変換区間が特定さ
れると、この区間を削除して、その代わりにコード変換
区間が挿入されていた旨を、聞き手に知らせる文を作成
し、この文を前記コード変換区間の代わりに読み上げる
と共に、残りの意味のある文字列区間のみを読み上げ
て、コード変換区間が存在したことを聞き手に知らせる
ことができる。これにより、上記のようなコード変換区
間を含んだテキストを、聞き手に違和感や不快感等を与
えることなく読み上げることができる。
【0025】図4は本発明の更に他の文書読み上げ方法
を採用した本発明の文書読上装置の他の実施例を示した
ブロック図である。1は読み上げ対象となるテキストを
格納した記憶部、2は記憶部1よりテキストの内容を逐
次読み出し、コード変換を受けている場所をコード変換
区間の持つ特徴や制約によって特定することによりその
部分を抜き出すコード変換区間検出及び削除部、3はテ
キスト結合部5から入力される文音声変換部、4は音声
出力用のスピーカ、5はコード変換区間検出及び削除部
2の出力と情報抽出部6の出力を結合するテキスト結合
部(加算器)、6はコード変換区間検出及び削除部によ
り特定されたコード変換区間よりファイル名等の情報を
抽出し、それに基づいてメッセージを作成したり、或い
は前記コード変換区間を復号化して元の文字列コードに
変換する情報抽出部である。
【0026】次に文書読み上げ方法の第3の実施例につ
いて図4及び図5のフローチヤートを参照して説明す
る。まず、オペレータは図示されない入力部から読み上
げ対象テキストを指定すると共に、このテキストの読み
上げ開始を装置に指示する。これにより、コード変換区
間検出及び削除部2はステップ501にて読み上げ対象
テキストの読み出しを開始するために記憶部1にアクセ
スし、ステップ502にて記憶部1に読み上げ対象テキ
ストがまだ残っているかをチェックする。ここで、テキ
ストが残っていなければ、動作を終了し、残っていれば
ステップ503に進む。
【0027】ステップ503にて、コード変換区間検出
及び削除部2はまだ残っているテキストの次の1行を記
憶部1から取り出した後、ステップ504に進む。ステ
ップ504では、取り出した1行を解析し、これがコー
ド変換された部分のヘッダーであるかどうかをヘッダー
が満たすべき条件を検査することにより判定する。但
し、ここでは、ヘッダーのみを見れば、それに続く行が
コード変換されているか否かの検査が可能で、コード変
換区間の終点も判定できるものとする。ここで、ヘッダ
ーでないことが分かればステップ508へ跳び、ヘッダ
ーであればステップ505へ進む。
【0028】次にコード変換区間検出及び削除部2はス
テップ505にて記憶部1から前記コード変換されてい
る区間を読み出し、これを情報抽出部6に渡す。これに
より、情報抽出部6はステップ506にて前記渡された
コード変換区間を解析することにより、そこに納められ
たファイルのファイル名を抽出し、更にステップ507
にて前記コード変換区間に前記抽出されたファイル名の
ファイルが挿入されていたことを示す旨の文を作成し、
これをテキスト結合部5を介して文音声変換部3に入力
してステップ508に進む。ステップ508にて、文音
声変換部3は文音声変換により前記入力コードを音声デ
ータに変換して、ステップ509に進む。ステップ50
9にて、文音声変換部3は文音声変換により得られた音
声データをスピーカ4から出力して、ステップ502に
戻る。
【0029】図9はテキストのコード変換されている区
間については、その部分にコード変換された文が挿入さ
れていることと、それを解析することにより判明するフ
ァイル名等を報告するのみにとどめ、実際には読み上げ
ないようにする図5に示した読み上げ方法を用いた場合
の入力文と、実際に読み上げられる文例を示した図であ
る。図9(A)に示したテキストが読み上げのために与
えられる原文で、図9(B)に示した右側のテキストが
実際に読み上げられる文に相当する。
【0030】図9(A)に示した原文の場合、「以下に
ファイルを添付します。」まで、コード変換された部分
がないとすると、そこまでは、実際の読み上げにもその
まま使われることとなる。しかし、その次の行のしか
し、その次の行の「〈〈TypeAprog.gz3l
ines〉〉」が、TypeAというコード変換フォー
マットのヘッダーの書式に合致し、そこに含まれるファ
イルの名前がprog.gzであり、その行に続く3行
がこのコード変換方法によって生成された行であること
が解析によって判明すると、その行と、それに続く3行
は読み上げないようにし、その代わりに、「この部分に
prog.gzという名のファイルがTypeA形式で
挿入されています。」という文を挿入し、この文を読み
上げることにより、そこにprog.gzという名のフ
ァイルがコード変換されて挿入されていることを聞き手
に報告する。
【0031】上記した4行の後のテキストに、コード変
換のフォーマットに合致する部分が存在しなければ、そ
れらは、そのまま実際の読み上げに使用されることとな
る。従って、図9(A)に示したテキストの場合、実際
に読み上げられるのは、コード変換された区間を除き、
その代わりに、この区間にコード変換されたファイルが
存在することを報告する文を挿入した、図9(B)に示
した右側のテキストになる。
【0032】本実施例によれば、読み上げ対象テキスト
に挿入されているコード変換区間を特定すると、この区
間を解析してファイル名を抽出し、前記コード変換区間
に代わって前記抽出されたファイル名のコード変換区間
が挿入されていた旨のメッセージを読み上げることがで
きるため、意味のある文字列のみを読み上げると共に、
コード変換区間が挿入されていたことをそのファイル名
を告げて聞き手に知らせることができ、聞き手に違和感
や不快感を与えることなくテキストを円滑に読み上げる
ことができる。
【0033】図6は図4に示した構成における本発明の
文書読み上げ方法の更に他の実施例を示したフローチャ
ートである。まず、オペレータは図示されない入力部か
ら読み上げ対象テキストを指定すると共に、このテキス
トの読み上げ開始を装置に指示する。これにより、コー
ド変換区間検出及び削除部2はステップ601にて読み
上げ対象テキストの読み出しを開始するために記憶部1
にアクセスし、ステップ602にて記憶部1に読み上げ
対象テキストがまだ残っているかをチェックする。ここ
で、テキストが残っていなければ、動作を終了し、残っ
ていればステップ603に進む。
【0034】ステップ603にて、コード変換区間検出
及び削除部2はまだ残っているテキストの次の1行を記
憶部1から取り出した後、ステップ604に進む。ステ
ップ604では、取り出した1行を解析し、これがコー
ド変換された部分のヘッダーであるかどうかをヘッダー
が満たすべき条件を検査することにより判定する。但
し、ここでは、ヘッダーのみを見れば、それに続く行が
コード変換されているか否かの検査が可能で、コード変
換部分の終点も判定できるものとする。ここで、ヘッダ
ーでないことが分かればステップ607へ跳び、ヘッダ
ーであればステップ605に進む。
【0035】次にコード変換区間検出及び削除部2はス
テップ605にて記憶部1から前記コード変換されてい
る部分を読み出し、これを情報抽出部6に渡す。これに
より、情報抽出部6はステップ606にてコード変換区
間検出及び削除部2から渡された前記コード変換区間を
解析することにより、そこに納められたコード変換文字
列を復号化して元の文字列に戻し、これをテキスト結合
部5を介して文音声変換部3に入力してステップ607
に進む。ステップ607にて、文音声変換部3は文音声
変換により前記入力コードを音声データに変換して、ス
テップ608に進む。ステップ608にて、文音声変換
部3は文音声変換により得られた音声データをスピーカ
4から出力して、ステップ602に戻る。
【0036】図10はテキストのコード変換されている
区間については、それを復号化したものを読み上げに用
い、コード変換によって生成されたテキスト自体は読み
上げない図6のフローチャートに示した読み上げ方法を
用いた場合の入力文と、実際に読み上げられる文例を示
した図である。図10(A)に示したテキストが読み上
げのために与えられる原文で、図10(B)に示した右
側のテキストが実際に読み上げられる文に相当する。
【0037】図10(A)に示した原文の場合、先頭の
行の「〈〈TypeB3lines〉〉」が、Type
Bというコード変換フォーマットのヘッダーの書式に合
致し、その行に続く3行がこのコード変換方法によって
生成された行であることが解析によって判明すると、そ
の行と、それに続く3行は実際には読み上げないように
し、代わりに、それらを復号して生成される「お久しぶ
りです。お元気ですか?」という文を実際に読み上げる
文として挿入する。ここで、「〈〈TypeB3lin
es〉〉」という行がTypeBというコード変換方法
によって生成されたテキストの先頭であり、且つこのテ
キストを復号して生成されるのが、読まれることを意図
したテキストであり、これに続く3行がこの変換法によ
って生成されたテキストであることを示しており、この
形式に合う行が存在すれば、これはこの変換方法による
テキスト部分の開始であることが保証されているものと
する。実際には、本当にこの方法によって生成されたも
のであるか否かを、この変換法の持つ制約等により検査
する必要がある場合もある。
【0038】従って、図10(A)に示したテキストの
場合、文章がコード変換により生成されたテキストのみ
であるので、実際に読み上げられるのはコード変換され
たテキストを復号化して得られた、図10(B)の右側
に示したテキストということになる。
【0039】本実施例によれば、記憶部1から読み出し
たテキスト中に挿入されている変換コード区間を復号化
して得た文章を、前記コード変換区間の代わりにテキス
ト中に挿入し、このテキストを読み上げるため、テキス
トの内容を全て意味のある文章として読み上げることが
でき、聞き手に違和感や不快感を与えることがなくなる
と共に、テキストの内容を欠落することなく全て読み上
げることができる。
【0040】尚、本発明は上述した実施例に限定される
ものではない。即ち、上記実施例で使用したコード変換
フォーマットでは、コード変換区間の最初の1行のみを
検査すれば、それがコード変換された区間の先頭である
ことや、その終点などがわかることを仮定していたが、
コード変換区間を複数行を読み込むことによって、検査
できるようなフォーマットのものでも良い。又、実施例
では、行単位でコード変換された部分とそれ以外の部分
の判定を行っていたが、文字単位で行ない、行の一部に
コード変換された文字列が挿入されているようなもので
も良い。更に、実施例では、複数のコード変換用のフォ
ーマットを扱うことを特に考慮して記述してはいない
が、各フォーマットの持つ特徴や制約により処理を場合
分けすることにより、1つの装置で複数のフォーマット
を扱えるようにしても良い。又、実施例では、コード変
換された部分の処理部と、文音声変換し、音声出力する
部分がまとめて1つのプログラムとして記述されている
が、それぞれを別のプログラムとして実行し、コード変
換区間の処理を行なったテキストを文音声変換及び音声
出力するようなプログラムに渡すようにしても良い。
【0041】
【発明の効果】以上記述したような本発明の文書読み上
げ方法及び文書読上装置によれば、そのまま読まれるこ
とを目的とせずコード変換によって生成された部分と、
そのまま読まれることを目的とした他の部分とを区別し
て、そのまま読まれることを目的していない意味不明な
文字列を読み上げないようにするか、又は元の意味のあ
る文字列に戻して読み上げることができる。
【図面の簡単な説明】
【図1】本発明の文書読上装置の一実施例を示したブロ
ック図。
【図2】図1に示した装置上の第1の文書読み上げ方法
の処理の流れの一実施例を示したフローチャート。
【図3】図1に示した装置上の第2の文書読み上げ方法
の処理の流れの一実施例を示したフローチャート。
【図4】本発明の文書読上装置の他の実施例を示したブ
ロック図。
【図5】図4に示した装置上の第1の文書読み上げ方法
の処理の流れの一実施例を示したフローチャート。
【図6】図4に示した装置上の第2の文書読み上げ方法
の処理の流れの一実施例を示したフローチャート。
【図7】図3のフローチャートで示した読み上げ方法を
用いた場合の入力文と、実際に読み上げられる文例を示
した図。
【図8】図4のフローチャートで示した読み上げ方法を
用いた場合の入力文と、実際に読み上げられる文例を示
した図。
【図9】図5のフローチャートで示した読み上げ方法を
用いた場合の入力文と、実際に読み上げられる文例を示
した図。
【図10】図6のフローチャートで示した読み上げ方法
を用いた場合の入力文と、実際に読み上げられる文例を
示した図。
【符号の説明】
1…記憶部 2…コード変換
区間検出及び削除部 3…文音声変換部 4…スピーカ 5…テキスト結合部 6…情報抽出部

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 文書を構成しているコードを音声の規則
    合成によって音声データに変換し、これを音声出力する
    ことにより文書を読み上げる際の文書読み上げ方法にあ
    って、前記文書を構成するコードの中で、コード変換さ
    れた変換コード区間と他のコード区間とを区別し、前記
    変換コード区間を除いた残りのコード区間のみを音声デ
    ータに変換することを特徴とした文書読み上げ方法。
  2. 【請求項2】 請求項1記載の文書読み上げ方法にあっ
    て、前記変換コード区間の代わりに、前記変換コード区
    間が文中に挿入されていたことを示す文字列コードを作
    成し、これを前記変換コード区間を除いた残りのコード
    区間中に挿入して音声データに変換することを特徴とし
    た文書読み上げ方法。
  3. 【請求項3】 請求項1記載の文書読み上げ方法にあっ
    て、前記変換コード区間からその変換コードが示す一部
    情報を取得し、この一部情報を用いて前記変換コード区
    間が文中に挿入されていたことを示す文字列コードを作
    成し、これを前記変換コード区間の代わりに、前記変換
    コード区間を除いた残りのコード区間中に挿入して音声
    データに変換することを特徴とした文書読み上げ方法。
  4. 【請求項4】 請求項1記載の文書読み上げ方法にあっ
    て、前記変換コード区間を元の変換前のコード区間に復
    元した後、この復元したコード区間を前記変換コード区
    間の代わりに、前記変換コード区間を除いた残りのコー
    ド区間中に挿入して音声データに変換することを特徴と
    した文書読み上げ方法。
  5. 【請求項5】 文書を構成しているコードを音声の規則
    合成によって音声データに変換し、これを音声出力する
    ことにより文書を読み上げる文書読上装置において、前
    記文書を構成するコードの中でコード変換された変換コ
    ード区間を検出する検出手段と、この検出手段によって
    検出された変換コード区間を除去し、残りのコード区間
    のみを音声データに変換させる制御手段とを具備したこ
    とを特徴とした文書読上装置。
  6. 【請求項6】 文書を構成しているコードを音声の規則
    合成によって音声データに変換し、これを音声出力する
    ことにより文書を読み上げる文書読上装置において、前
    記文書を構成するコードの中でコード変換された変換コ
    ード区間を検出する検出手段と、この検出手段によって
    検出された変換コード区間の代わりに前記変換コード区
    間が文中に挿入されていたことを示す文字列コードを作
    成するメッセージ作成手段と、このメッセージ作成手段
    によって作成された文字列コードを前記変換コード区間
    を除いた残りのコード区間中に挿入して音声データに変
    換させる制御手段とを具備したことを特徴とした文書読
    上装置。
  7. 【請求項7】 文書を構成しているコードを音声の規則
    合成によって音声データに変換し、これを音声出力する
    ことにより文書を読み上げる文書読上装置において、前
    記文書を構成するコードの中でコード変換された変換コ
    ード区間を検出する検出手段と、この検出手段によって
    検出された変換コード区間からその変換コード区間に関
    わる一部情報を抽出する抽出手段と、この抽出手段によ
    り抽出された一部情報を用いて前記変換コード区間が文
    中に挿入されていたことを示す文字列コードを作成する
    メッセージ作成手段と、このメッセージ作成手段によっ
    て作成された文字列コードを前記変換コード区間を除い
    た残りのコード区間中に挿入して音声データに変換させ
    る制御手段とを具備したことを特徴とした文書読上装
    置。
  8. 【請求項8】 文書を構成しているコードを音声の規則
    合成によって音声データに変換し、これを音声出力する
    ことにより文書を読み上げる文書読上装置において、前
    記文書を構成するコードの中でコード変換された変換コ
    ード区間を検出する検出手段と、この検出手段によって
    検出された変換コード区間を元の変換前のコード区間に
    復元する復元手段と、この復元手段によって復元したコ
    ード区間を前記変換コード区間の代わりに前記変換コー
    ド区間を除いた残りのコード区間中に挿入して音声デー
    タに変換させる制御手段とを具備したことを特徴とした
    文書読上装置。
JP13164494A 1994-06-14 1994-06-14 文書読み上げ方法及び文書読上装置 Expired - Fee Related JP3556269B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13164494A JP3556269B2 (ja) 1994-06-14 1994-06-14 文書読み上げ方法及び文書読上装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13164494A JP3556269B2 (ja) 1994-06-14 1994-06-14 文書読み上げ方法及び文書読上装置

Publications (2)

Publication Number Publication Date
JPH07334493A true JPH07334493A (ja) 1995-12-22
JP3556269B2 JP3556269B2 (ja) 2004-08-18

Family

ID=15062879

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13164494A Expired - Fee Related JP3556269B2 (ja) 1994-06-14 1994-06-14 文書読み上げ方法及び文書読上装置

Country Status (1)

Country Link
JP (1) JP3556269B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999008179A1 (fr) * 1997-08-08 1999-02-18 Sony Corporation Transformateur et procede de transformation de donnees caracteres

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999008179A1 (fr) * 1997-08-08 1999-02-18 Sony Corporation Transformateur et procede de transformation de donnees caracteres

Also Published As

Publication number Publication date
JP3556269B2 (ja) 2004-08-18

Similar Documents

Publication Publication Date Title
EP0598598B1 (en) Text-to-speech processor, and parser for use in such a processor
EP0797155A2 (en) Translating machine
EP1217537A2 (en) Method and apparatus for embedding translation information in text-based image data
US20060106609A1 (en) Speech synthesis system
US20140093170A1 (en) Document processing device, image processing apparatus, document processing method and computer program product
US7269789B2 (en) Document information processing apparatus
US8271263B2 (en) Multi-language text fragment transcoding and featurization
JPH05266069A (ja) 中国語と日本語との間の双方向機械翻訳方式
US20050086057A1 (en) Speech recognition apparatus and its method and program
JPH11316762A (ja) 電子メール要約転送表示方法及び装置及び電子メール要約転送表示プログラムを格納した記憶媒体
JPH07334493A (ja) 文書読み上げ方法及び文書読上装置
US8185565B2 (en) Information processing apparatus, control method, and storage medium
JP3094896B2 (ja) 文章読み上げ方式
KR100544375B1 (ko) 문서파일로부터 명함정보를 추출하기 위한 장치와 방법,및 상기 방법을 기록한 기록매체
Grand Mime overview
JP4007661B2 (ja) 自然言語統計データベース装置
JPH10161825A (ja) 文字化け検査方法及び文字化け検査用データ作成装置
KR20020081912A (ko) 웹상에서의 음성 서비스 방법
JPH11353310A (ja) 文書送信装置、文書送信方法および文書送信プログラムを記録した記録媒体
JP3379633B2 (ja) アクティブメッセージ生成方法および装置ならびにアクティブメッセージ生成プログラムを記録した記録媒体
KR100837775B1 (ko) 비트맵 오브젝트를 이용한 웹메모 변환 및 전송 방법과 그를 위한 웹메모 생성 장치
JP2000075874A (ja) 情報処理装置および情報処理コンピュータプログラムを記録した記録媒体
JP2003141106A (ja) 隠蔽文章抽出方法及び装置
JPH10187712A (ja) 文書処理方法及び装置及び記憶媒体
JPH083718B2 (ja) 音声出力装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040427

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040512

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090521

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090521

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100521

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110521

Year of fee payment: 7

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110521

Year of fee payment: 7

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120521

Year of fee payment: 8

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120521

Year of fee payment: 8

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees