JP3556269B2 - 文書読み上げ方法及び文書読上装置 - Google Patents

文書読み上げ方法及び文書読上装置 Download PDF

Info

Publication number
JP3556269B2
JP3556269B2 JP13164494A JP13164494A JP3556269B2 JP 3556269 B2 JP3556269 B2 JP 3556269B2 JP 13164494 A JP13164494 A JP 13164494A JP 13164494 A JP13164494 A JP 13164494A JP 3556269 B2 JP3556269 B2 JP 3556269B2
Authority
JP
Japan
Prior art keywords
code
document
code conversion
header
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP13164494A
Other languages
English (en)
Other versions
JPH07334493A (ja
Inventor
修 加瀬野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP13164494A priority Critical patent/JP3556269B2/ja
Publication of JPH07334493A publication Critical patent/JPH07334493A/ja
Application granted granted Critical
Publication of JP3556269B2 publication Critical patent/JP3556269B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Description

【0001】
【産業上の利用分野】
本発明は、文字列コードの中にコード変換された区間を有するテキストを音声の規則合成により合成音で読み上げる文書読み上げ方法及びこの方法を採用した文書読上装置に関する。
【0002】
【従来の技術】
近時、漢字仮名混じりの文を解析し、その文が示す音声情報を規則合成により音声合成して出力する音声合成装置が種々開発されている。この種の音声合成装置は、銀行業務における電話紹介サービスや、新聞校閲システム、文書読み上げ装置等として幅広く利用され始めている。又、通信手段の一つとして、ネットワーク接続されたコンピュータ上でテキストを交換する電子メールが幅広く使用されているが、電子メール等のような使用できるコードの制限された通信手段を使用するには、テキスト中の文字列コードをそのまま送ることのできない場合があり、送ることができない文字列コードを使用可能な文字列コードに変換しなければならなかった。
【0003】
上記のように電子メール上では、使用することのできるコードの種類に制限のあることがあり、その場合、送信するテキスト中にバイナリファイル等の任意のコードが含まれるものは、その制限に抵触してしまい、そのままでは送ることができなかった。そのため、このようなファイルは使用可能な文字列になるようにコード変換を行なって送信し、受信側でその文字列を元に戻すといったことが行われている。このように、電子メール内にはそのまま読まれることを目的とした文字列の他に、そのまま読まれることを目的とせずファイルを送るためにコード変換により生成された文字列が混在することがある。更に、電子メールの表題行等では、ASCIIコードの使用のみが許されており、日本語等を使えないことがある。そのような環境下でASCIIコード以外の文字を使用しようとした場合、それをASCIIコードのみからなる文字列にコード変換して挿入しておき、受信側でそれを元に戻して見るといったことが行われている。
【0004】
又、仕様が異なる例えば漢字が使用できない外国製のコンピュータに日本語を使用できるコンピュータで作成したテキストを入力したり、送信する場合も上記のように入力又は送信するコードに制限が生じ、テキストの一部を使用可能な文字列になるようにコード変換して入力又は送信することになる。このため、各種情報処理装置や通信装置を通したテキストはそれを構成する文字列コードの一部がコード変換されている場合があちらこちらで生じることになる。
【0005】
ところで、上記のようにコード変換され、そのままでは意味を持たず、そのまま読まれることを目的としないコードが存在するテキストを例えば上記した音声合成装置を用いた文書読上装置にて読み上げる時、従来の読み上げ方法では、読み上げることを前提としていないコード部分と、他の読み上げることができるコード部分とを区別することがなかったために、そのまま全文を読み上げてしまっていた。このため、訳の分からない読み上げ部分が生じてしまい、聞き手に違和感や不快感を与えるという不具合があった。
【0006】
【発明が解決しようとする課題】
上記のように従来の音声合成装置による読み上げ方法にあっては、読み上げ対象テキスト中に存在するそのまま読まれることを目的とせず、コード変換によって生成された部分と、そのまま読まれることを目的としたコード部分とを区別しないため、そのまま読まれることを目的していない意味不明な文字列もそのまま読み上げの対象となって、訳の分からない読み上げ部分が生じるため、聞き手に違和感や不快感を与えるという不具合があった。
【0007】
そこで本発明はこのような事情を考慮してなされたもので、そのまま読まれることを目的とせずコード変換によって生成された部分と、そのまま読まれることを目的とした他の部分とを区別して、そのまま読まれることを目的していない意味不明な文字列を読み上げないようにするか、又は元の意味のある文字列に戻して読み上げることができる文書読み上げ方法及び文書読上装置を提供することを目的としている。
【0008】
【課題を解決するための手段】
本発明は文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる文書読み上げ方法であり、文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし1行づつ取り出し、取り出した1行を解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、ヘッダーが検出された場合には、前記ヘッダーに基づきコード変換区間の終点を検出してコード変換区間のコードを読み上げの対象から削除し、ヘッダーが検出さなかった場合には、前記取り出した1行のコードを音声データに変換することを特徴とする。また、文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる際の文書読み上げ方法であって、文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし1行づつ取り出し、取り出した1行を解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、ヘッダーが検出された場合には、前記ヘッダーに基づきコード変換区間の終点を検出してコード変換区間のコードを読み上げの対象から削除し、前記コード変換区間が文中に挿入されていたことを示す文字列コードを作成し、前記コード変換区間に、前記文字列コードを挿入して音声データに変換することを特徴とする。また、文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる際の文書読み上げ方法であって、文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし1行づつ取り出し、取り出した1行を解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、ヘッダーが検出された場合には、前記ヘッダーに基づきコード変換区間の終点を検出してコード変換区間のコードを読み出し、読み出したコードに基づき前記コード変換区間の内容を代表する情報を抽出し、前記代表する情報を含む文字列コードを作成し、前記コード変換区間に前記代表する情報を含む文字コードを挿入して音声データに変換することを特徴とする。また、文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる際の文書読み上げ方法であって、文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし1行づつ取り出し、取り出した1行を解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、ヘッダーが検出された場合には、前記ヘッダーに基づきコード変換区間の終点を検出してコード変換区間のコードを読み出し、前記コード変換区間のコード変換文を該コード変換文に含まれるコード変換方法情報に基づき元のコードに復元し、前記コード変換区間に前記復元したコードを前記コード変換文に代えて挿入して音声データに変換することを特徴とする。
更に、本発明は文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる文書読上装置であり、文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし1行づつ取り出すアクセス手段と、取り出した1行を構成するコードを解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、該ヘッダーに基づきコード変換区間の終点を検出してコード変換されたコード変換区間を検出する検出手段と、この検出手段によってヘッダーが検出された場合にはコード変換区間のコードを除去し、ヘッダーが検出されない場合には前記取り出した1行のコードを音声データに変換させる制御手段とを具備したことを特徴する。また、文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる文書読上装置において、文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし1行づつ取り出すアクセス手段と、取り出した1行を構成するコードを解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、該ヘッダーに基づきコード変換区間の終点を検出してコード変換されたコード変換区間を検出する検出手段と、この検出手段によって検出されたコード変換区間のコードの代わりに、前記コード変換区間が文中に挿入されていたことを示す文字列コードを作成するメッセージ作成手段と、このメッセージ作成手段によって作成された文字列コードを前記コード変換区間に挿入して音声データに変換させる制御手段とを具備したことを特徴とする。また、文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる文書読上装置において、文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし1行づつ取り出すアクセス手段と、取り出した1行を構成するコードを解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、該ヘッダーに基づきコード変換区間の終点を検出してコード変換されたコード変換区間を検出する検出手段と、この検出手段によって検出されたコード変換区間のコードに基づき当該コード変換区間の内容を代表する情報を抽出し、抽出した情報を含む文字列コードを作成するメッセージ作成手段と、このメッセージ作成手段によって作成された文字列コードを前記変換コードに代えて挿入して音声データに変換させる制御手段とを具備したことを特徴とする。また、文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる文書読上装置において、文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし1行づつ取り出すアクセス手段と、取り出した1行を構成するコードを解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、該ヘッダーに基づきコード変換区間の終点を検出してコード変換されたコード変換区間を検出する検出手段と、この検出手段によって検出されたコード変換区間のコード変換文を、該コード変換文に含まれるコード変換方法情報に基づき元のコードに復元する復元手段と、この復元手段によって復元したコードを前記コード変換文に代えて挿入して音声データに変換させる制御手段とを具備したことを特徴とする。
【0009】
【作用】
本発明では、読み上げる文書から、実際にそのまま読み上げる必要のないコード変換されたコード変換区間の文字列を検出して削除することにより、意味のある文字列コード部分のみを読み上げる。また、コード変換された区間に代えて、このようなコード変換区間の存在を示すメッセージを作成して、これを読み上げる。また、コード変換区間の部分においては、当該コード変換区間の内容を代表する情報を含む文字列のメッセージを作成して読み上げる。更に、変換コードの部分においては、変換コードを文書に含まれるコード変換方法情報に基づき元のコードに復元し、この復元したコードを読み上げる。
【0010】
【実施例】
以下、本発明の一実施例を図面を参照して説明する。図1は本発明の文書読み上げ方法を採用した本発明の文書読上装置の一実施例を示したブロック図である。1は読み上げ対象となるテキストを格納した記憶部、2は記憶部1よりテキストの内容を逐次読み出し、コード変換を受けている区間をコード変換部分の持つ特徴や制約によって特定することによりその部分を抜き出したり、必要に応じて、その部分からコード変換された文字列を削除した旨を示すメッセージを代わりに挿入するコード変換区間検出及び削除部、3はコード変換区間検出及び削除部2で編集されたテキストの内容に従った音声合成を行なう文音声変換部、4は音声出力用のスピーカである。
【0011】
次に本実施例の文書読み上げ方法について図1及び図2に示したフローチャートを参照して説明する。まず、オペレータは図示されない入力部から読み上げ対象テキストを指定すると共に、このテキストの読み上げ開始を装置に指示する。これにより、コード変換区間検出及び削除部2はステップ201にて読み上げ対象テキストの読み出しを開始するために記憶部1にアクセスし、ステップ202にて記憶部1に読み上げ対象テキストがまだ残っているかをチェックする。ここで、テキストが残っていなければ動作を終了し、残っていればステップ203に進む。
【0012】
ステップ203にて、コード変換区間検出及び削除部2はまだ残っているテキストの次の1行を記憶部1から取り出し、ステップ204に進む。ステップ204では、取り出した1行を解析し、これがコード変換された部分のヘッダーであるかどうかをヘッダーが満たすべき条件を検査することにより判定する。但し、ここでは、ヘッダーのみを見れば、それに続く行がコード変換されているか否かの検査が可能で、コード変換区間の終点も判定できるものとする。ここで、ヘッダーでないことが分かればステップ207へ進み、ヘッダーであればステップ205に進む。ステップ207にて、コード変換区間検出及び削除部2はヘッダーの情報よりコード変換されている部分の終点を算出し、記憶部1からの空読み等により、前記コード変換区間を読み上げの対象から削除する処理を行った後、ステップ202に戻る。
【0013】
ステップ205に進んだ場合、コード変換区間検出及び削除部2は記憶部1から読み出したコードを文音声変換部3に入力する。このため、文音声変換部3は文音声変換により前記入力コードを音声データに変換して、ステップ206に進む。ステップ206にて、文音声変換部3は文音声変換により得られた音声データをスピーカ4から出力して、ステップ202に戻る。
【0014】
図7は図2のフローチャートで示したテキストのコード変換のされている区間については読み上げないようにする読み上げ方法を用いた場合の入力文と、実際に読み上げられる文例を示した図である。図7(A)に示したテキストが読み上げのために与えられる原文(入力文)で、図7(B)に示した右側のテキストが実際に読み上げられる文に相当する。
【0015】
図7(A)に示した原文の場合、「以下にファイルを添付します。」まで、コード変換された部分が無いとすると、そこまでは、読み上げにそのまま使われることとなる。しかし、その次の行の「〈〈TypeAprog.gz3lines〉〉」がTypeAというコード変換フォーマットのヘッダーの書式に合致し、その行に続く3行がこのコード変換方法によって生成された行であることが、コード変換区間検出及び削除部2の解析によって判明すると、その行と、それに続く3行は実際には読み上げないようにする。ここで、「〈〈TypeAprog.gz3lines〉〉」という行が、TypeAというコード変換法によって生成されたテキストの先頭であり、且つこのテキストを復号して生成されるのが、prog.gzという名前のファイルであり、これに続く3行がこの変換法によって生成されたテキストであることを表している。従って、このような形式に合致する行がテキスト中に存在すれば、これはこの変換方法によるテキスト部分の開始であることが保証されているものとする。しかし、場合によっては本当にこの方法によって生成されたものかを、この変換法の持つ制約等により検査する必要があることもある。
【0016】
そして、上記した4行の後のテキストに、コード変換のフォーマットに合致する部分が存在しなければ、それらは、そのまま実際の読み上げに使用されることとなる。これにより、図7(A)に示したテキストの場合、実際に読み上げられるのは、コード変換された部分を除いた、図7(B)に示した右側のテキストということになる。
【0017】
本実施例によれば、読み上げ対象となっているテキスト中にあるコード変換された意味のない文字列を区別することができ、このコード変換区間が特定されると、この区間を削除して、意味のある文字列部分のみを読み上げることができるため、上記のようなコード変換区間を含んだテキストを、聞き手に違和感や不快感等を与えることなく、意味のある部分のみを一貫して読み上げることができる。
【0018】
図3は本発明の文書読み上げ方法の他の実施例を示したフローチャートである。まず、オペレータは図示されない入力部から読み上げ対象テキストを指定すると共に、このテキストの読み上げ開始を装置に指示する。これにより、コード変換区間検出及び削除部2はステップ301にて読み上げ対象テキストの読み出しを開始するために記憶部1にアクセスし、ステップ302にて記憶部1に読み上げ対象テキストがまだ残っているかをチェックする。ここで、テキストが残っていなければ、動作を終了し、残っていればステップ303に進む。
【0019】
ステップ303にて、コード変換区間検出及び削除部2はまだ残っているテキストの次の1行を記憶部1から取り出した後、ステップ304に進む。ステップ304では、取り出した1行を解析し、これがコード変換された区間のヘッダーであるかどうかをヘッダーが満たすべき条件を検査することにより判定する。但し、ここでは、ヘッダーのみを見れば、それに続く行がコード変換されているか否かの検査が可能で、コード変換部の終点も判定できるものとする。ここで、ヘッダーでないことが分かればステップ307へ跳び、ヘッダーであればステップ305に進む。
【0020】
コード変換区間検出及び削除部2はステップ305にて記憶部1から取り出したコード変換のされている区間について記憶部1からの空読み等により、このコード変換部を読み上げの対象から削除し、その代わりにテキストのその場所にコード変換された区間が挿入されていた旨を示す文章(メッセージ)を作成して、ステップ307に進む。ステップ307にて、コード変換区間検出及び削除部2は記憶部1から読み出したコードを文音声変換部3に入力する。このため、文音声変換部3は文音声変換により前記入力コードを音声データに変換して、ステップ308に進む。ステップ308にて、文音声変換部3は文音声変換により得られた音声データをスピーカ4から出力して、ステップ302に戻る。
【0021】
図8はテキストのコード変換のされている区間については、その部分にコード変換されたテキストが挿入されていることを報告するのみにとどめ、実際には読み上げないようにする図3のフローチャートで示した読み上げ方法を用いた場合の入力文と、実際に読み上げられる文例を示した図である。図8(A)に示したテキストが読み上げのために与えられる原文で、図8(B)に示した右側のテキストが実際に読み上げられる文に相当する。
【0022】
図8(A)に示した原文の場合、「以下にファイルを添付します。」まで、コード変換された部分がないとすると、そこまでは、実際の読み上げにもそのまま使われることとなる。しかし、その次の行の「〈〈TypeAprog.gz3lines〉〉」が、TypeAというコード変換フォーマットのヘッダーの書式に合致し、その行に続く3行がこのコード変換方法によって生成された行であることが解析によって判明すると、その行と、それに続く3行は実際には読み上げないようにし、代わりに、「この部分にコード変換されたファイルが挿入されています。」という文を挿入し、この文を読み上げることにより、そこにコード変換により生成された文が挿入されていることを聞き手に報告する。そして、このこれら4行の後のテキストに、コード変換のフォーマットに合致する部分が存在ししなければ、それらは、そのまま実際の読み上げに使用されることとなる。
【0023】
従って、図8(A)に示したテキストの場合、実際に読み上げられるのは、コード変換された区間を除き、代わりに、そこにコード変換されたファイルが存在することを報告する文章を挿入した、図8(B)の右側のテキストということになる。
【0024】
本実施例によれば、読み上げ対象となっているテキスト中にあるコード変換された意味のない文字列を区別することができ、このコード変換区間が特定されると、この区間を削除して、その代わりにコード変換区間が挿入されていた旨を、聞き手に知らせる文を作成し、この文を前記コード変換区間の代わりに読み上げると共に、残りの意味のある文字列区間のみを読み上げて、コード変換区間が存在したことを聞き手に知らせることができる。これにより、上記のようなコード変換区間を含んだテキストを、聞き手に違和感や不快感等を与えることなく読み上げることができる。
【0025】
図4は本発明の更に他の文書読み上げ方法を採用した本発明の文書読上装置の他の実施例を示したブロック図である。1は読み上げ対象となるテキストを格納した記憶部、2は記憶部1よりテキストの内容を逐次読み出し、コード変換を受けている場所をコード変換区間の持つ特徴や制約によって特定することによりその部分を抜き出すコード変換区間検出及び削除部、3はテキスト結合部5から入力される文音声変換部、4は音声出力用のスピーカ、5はコード変換区間検出及び削除部2の出力と情報抽出部6の出力を結合するテキスト結合部(加算器)、6はコード変換区間検出及び削除部により特定されたコード変換区間よりファイル名等の情報を抽出し、それに基づいてメッセージを作成したり、或いは前記コード変換区間を復号化して元の文字列コードに変換する情報抽出部である。
【0026】
次に文書読み上げ方法の第3の実施例について図4及び図5のフローチヤートを参照して説明する。まず、オペレータは図示されない入力部から読み上げ対象テキストを指定すると共に、このテキストの読み上げ開始を装置に指示する。これにより、コード変換区間検出及び削除部2はステップ501にて読み上げ対象テキストの読み出しを開始するために記憶部1にアクセスし、ステップ502にて記憶部1に読み上げ対象テキストがまだ残っているかをチェックする。ここで、テキストが残っていなければ、動作を終了し、残っていればステップ503に進む。
【0027】
ステップ503にて、コード変換区間検出及び削除部2はまだ残っているテキストの次の1行を記憶部1から取り出した後、ステップ504に進む。ステップ504では、取り出した1行を解析し、これがコード変換された部分のヘッダーであるかどうかをヘッダーが満たすべき条件を検査することにより判定する。但し、ここでは、ヘッダーのみを見れば、それに続く行がコード変換されているか否かの検査が可能で、コード変換区間の終点も判定できるものとする。ここで、ヘッダーでないことが分かればステップ508へ跳び、ヘッダーであればステップ505へ進む。
【0028】
次にコード変換区間検出及び削除部2はステップ505にて記憶部1から前記コード変換されている区間を読み出し、これを情報抽出部6に渡す。これにより、情報抽出部6はステップ506にて前記渡されたコード変換区間を解析することにより、そこに納められたファイルのファイル名を抽出し、更にステップ507にて前記コード変換区間に前記抽出されたファイル名のファイルが挿入されていたことを示す旨の文を作成し、これをテキスト結合部5を介して文音声変換部3に入力してステップ508に進む。ステップ508にて、文音声変換部3は文音声変換により前記入力コードを音声データに変換して、ステップ509に進む。ステップ509にて、文音声変換部3は文音声変換により得られた音声データをスピーカ4から出力して、ステップ502に戻る。
【0029】
図9はテキストのコード変換されている区間については、その部分にコード変換された文が挿入されていることと、それを解析することにより判明するファイル名等を報告するのみにとどめ、実際には読み上げないようにする図5に示した読み上げ方法を用いた場合の入力文と、実際に読み上げられる文例を示した図である。図9(A)に示したテキストが読み上げのために与えられる原文で、図9(B)に示した右側のテキストが実際に読み上げられる文に相当する。
【0030】
図9(A)に示した原文の場合、「以下にファイルを添付します。」まで、コード変換された部分がないとすると、そこまでは、実際の読み上げにもそのまま使われることとなる。しかし、その次の行のしかし、その次の行の「〈〈TypeAprog.gz3lines〉〉」が、TypeAというコード変換フォーマットのヘッダーの書式に合致し、そこに含まれるファイルの名前がprog.gzであり、その行に続く3行がこのコード変換方法によって生成された行であることが解析によって判明すると、その行と、それに続く3行は読み上げないようにし、その代わりに、「この部分にprog.gzという名のファイルがTypeA形式で挿入されています。」という文を挿入し、この文を読み上げることにより、そこにprog.gzという名のファイルがコード変換されて挿入されていることを聞き手に報告する。
【0031】
上記した4行の後のテキストに、コード変換のフォーマットに合致する部分が存在しなければ、それらは、そのまま実際の読み上げに使用されることとなる。従って、図9(A)に示したテキストの場合、実際に読み上げられるのは、コード変換された区間を除き、その代わりに、この区間にコード変換されたファイルが存在することを報告する文を挿入した、図9(B)に示した右側のテキストになる。
【0032】
本実施例によれば、読み上げ対象テキストに挿入されているコード変換区間を特定すると、この区間を解析してファイル名を抽出し、前記コード変換区間に代わって前記抽出されたファイル名のコード変換区間が挿入されていた旨のメッセージを読み上げることができるため、意味のある文字列のみを読み上げると共に、コード変換区間が挿入されていたことをそのファイル名を告げて聞き手に知らせることができ、聞き手に違和感や不快感を与えることなくテキストを円滑に読み上げることができる。
【0033】
図6は図4に示した構成における本発明の文書読み上げ方法の更に他の実施例を示したフローチャートである。まず、オペレータは図示されない入力部から読み上げ対象テキストを指定すると共に、このテキストの読み上げ開始を装置に指示する。これにより、コード変換区間検出及び削除部2はステップ601にて読み上げ対象テキストの読み出しを開始するために記憶部1にアクセスし、ステップ602にて記憶部1に読み上げ対象テキストがまだ残っているかをチェックする。ここで、テキストが残っていなければ、動作を終了し、残っていればステップ603に進む。
【0034】
ステップ603にて、コード変換区間検出及び削除部2はまだ残っているテキストの次の1行を記憶部1から取り出した後、ステップ604に進む。ステップ604では、取り出した1行を解析し、これがコード変換された部分のヘッダーであるかどうかをヘッダーが満たすべき条件を検査することにより判定する。但し、ここでは、ヘッダーのみを見れば、それに続く行がコード変換されているか否かの検査が可能で、コード変換部分の終点も判定できるものとする。ここで、ヘッダーでないことが分かればステップ607へ跳び、ヘッダーであればステップ605に進む。
【0035】
次にコード変換区間検出及び削除部2はステップ605にて記憶部1から前記コード変換されている部分を読み出し、これを情報抽出部6に渡す。これにより、情報抽出部6はステップ606にてコード変換区間検出及び削除部2から渡された前記コード変換区間を解析することにより、そこに納められたコード変換文字列を復号化して元の文字列に戻し、これをテキスト結合部5を介して文音声変換部3に入力してステップ607に進む。ステップ607にて、文音声変換部3は文音声変換により前記入力コードを音声データに変換して、ステップ608に進む。ステップ608にて、文音声変換部3は文音声変換により得られた音声データをスピーカ4から出力して、ステップ602に戻る。
【0036】
図10はテキストのコード変換されている区間については、それを復号化したものを読み上げに用い、コード変換によって生成されたテキスト自体は読み上げない図6のフローチャートに示した読み上げ方法を用いた場合の入力文と、実際に読み上げられる文例を示した図である。図10(A)に示したテキストが読み上げのために与えられる原文で、図10(B)に示した右側のテキストが実際に読み上げられる文に相当する。
【0037】
図10(A)に示した原文の場合、先頭の行の「〈〈TypeB3lines〉〉」が、TypeBというコード変換フォーマットのヘッダーの書式に合致し、その行に続く3行がこのコード変換方法によって生成された行であることが解析によって判明すると、その行と、それに続く3行は実際には読み上げないようにし、代わりに、それらを復号して生成される「お久しぶりです。お元気ですか?」という文を実際に読み上げる文として挿入する。ここで、「〈〈TypeB3lines〉〉」という行がTypeBというコード変換方法によって生成されたテキストの先頭であり、且つこのテキストを復号して生成されるのが、読まれることを意図したテキストであり、これに続く3行がこの変換法によって生成されたテキストであることを示しており、この形式に合う行が存在すれば、これはこの変換方法によるテキスト部分の開始であることが保証されているものとする。実際には、本当にこの方法によって生成されたものであるか否かを、この変換法の持つ制約等により検査する必要がある場合もある。
【0038】
従って、図10(A)に示したテキストの場合、文章がコード変換により生成されたテキストのみであるので、実際に読み上げられるのはコード変換されたテキストを復号化して得られた、図10(B)の右側に示したテキストということになる。
【0039】
本実施例によれば、記憶部1から読み出したテキスト中に挿入されている変換コード区間を復号化して得た文章を、前記コード変換区間の代わりにテキスト中に挿入し、このテキストを読み上げるため、テキストの内容を全て意味のある文章として読み上げることができ、聞き手に違和感や不快感を与えることがなくなると共に、テキストの内容を欠落することなく全て読み上げることができる。
【0040】
尚、本発明は上述した実施例に限定されるものではない。即ち、上記実施例で使用したコード変換フォーマットでは、コード変換区間の最初の1行のみを検査すれば、それがコード変換された区間の先頭であることや、その終点などがわかることを仮定していたが、コード変換区間を複数行を読み込むことによって、検査できるようなフォーマットのものでも良い。又、実施例では、行単位でコード変換された部分とそれ以外の部分の判定を行っていたが、文字単位で行ない、行の一部にコード変換された文字列が挿入されているようなものでも良い。更に、実施例では、複数のコード変換用のフォーマットを扱うことを特に考慮して記述してはいないが、各フォーマットの持つ特徴や制約により処理を場合分けすることにより、1つの装置で複数のフォーマットを扱えるようにしても良い。又、実施例では、コード変換された部分の処理部と、文音声変換し、音声出力する部分がまとめて1つのプログラムとして記述されているが、それぞれを別のプログラムとして実行し、コード変換区間の処理を行なったテキストを文音声変換及び音声出力するようなプログラムに渡すようにしても良い。
【0041】
【発明の効果】
以上記述したように本発明の文書読み上げ方法及び文書読上装置によれば、そのまま読まれることを目的とせずコード変換によって生成された部分と、そのまま読まれることを目的とした他の部分とを区別して、そのまま読まれることを目的していない意味不明な文字列を読み上げないので、聞き手に違和感や不快感を与えることをなくすことができる。また、コード変換された区間に代えて、このようなコード変換区間の存在を示すメッセージを作成して、これを読み上げるので、コード変換区間の存在を知ることができる。また、コード変換区間の部分においては、当該コード変換区間の内容を代表する情報を含む文字列のメッセージを作成して読み上げるので、コード変換区間の内容を知ることができる。更に、変換コードの部分においては、変換コードを元のコードに復元し、この復元したコードを読み上げるので、元の意味のある文字列を知ることができる。
【図面の簡単な説明】
【図1】本発明の文書読上装置の一実施例を示したブロック図。
【図2】図1に示した装置上の第1の文書読み上げ方法の処理の流れの一実施例を示したフローチャート。
【図3】図1に示した装置上の第2の文書読み上げ方法の処理の流れの一実施例を示したフローチャート。
【図4】本発明の文書読上装置の他の実施例を示したブロック図。
【図5】図4に示した装置上の第1の文書読み上げ方法の処理の流れの一実施例を示したフローチャート。
【図6】図4に示した装置上の第2の文書読み上げ方法の処理の流れの一実施例を示したフローチャート。
【図7】図3のフローチャートで示した読み上げ方法を用いた場合の入力文と、実際に読み上げられる文例を示した図。
【図8】図4のフローチャートで示した読み上げ方法を用いた場合の入力文と、実際に読み上げられる文例を示した図。
【図9】図5のフローチャートで示した読み上げ方法を用いた場合の入力文と、実際に読み上げられる文例を示した図。
【図10】図6のフローチャートで示した読み上げ方法を用いた場合の入力文と、実際に読み上げられる文例を示した図。
【符号の説明】
1…記憶部 2…コード変換区間検出及び削除部
3…文音声変換部 4…スピーカ
5…テキスト結合部 6…情報抽出部

Claims (8)

  1. 文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる際の文書読み上げ方法であって、
    文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし1行づつ取り出し
    取り出した1行を解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し
    ヘッダーが検出された場合には、前記ヘッダーに基づきコード変換区間の終点を検出してコード変換区間のコードを読み上げの対象から削除し、
    ヘッダーが検出さなかった場合には、前記取り出した1行のコードを音声データに変換することを特徴とした文書読み上げ方法。
  2. 文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる際の文書読み上げ方法であって、
    文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし1行づつ取り出し、
    取り出した1行を解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、
    ヘッダーが検出された場合には、前記ヘッダーに基づきコード変換区間の終点を検出してコード変換区間のコードを読み上げの対象から削除し、
    前記コード変換区間が文中に挿入されていたことを示す文字列コードを作成し、
    前記コード変換区間に、前記文字列コードを挿入して音声データに変換することを特徴とした文書読み上げ方法。
  3. 文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる際の文書読み上げ方法であって、
    文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし1行づつ取り出し、
    取り出した1行を解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、
    ヘッダーが検出された場合には、前記ヘッダーに基づきコード変換区間の終点を検出してコード変換区間のコードを読み出し、
    読み出したコードに基づき前記コード変換区間の内容を代表する情報を抽出し、
    前記代表する情報を含む文字列コードを作成し、
    前記コード変換区間に前記代表する情報を含む文字コードを挿入して音声データに変換することを特徴とした文書読み上げ方法。
  4. 文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる際の文書読み上げ方法であって、
    文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし1行づつ取り出し、
    取り出した1行を解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、
    ヘッダーが検出された場合には、前記ヘッダーに基づきコード変換区間の終点を検出してコード変換区間のコードを読み出し、
    前記コード変換区間のコード変換文を該コード変換文に含まれるコード変換方法情報に基づき元のコードに復元し、
    前記コード変換区間に前記復元したコードを前記コード変換文に代えて挿入して音声データに変換することを特徴とした文書読み上げ方法。
  5. 文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる文書読上装置において、
    文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし1行づつ取り出すアクセス手段と、
    取り出した1行を構成するコードを解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、該ヘッダーに基づきコード変換区間の終点を検出してコード変換されたコード変換区間を検出する検出手段と、
    この検出手段によってヘッダーが検出された場合にはコード変換区間のコードを除去し、ヘッダーが検出されない場合には前記取り出した1行のコードを音声データに変換させる制御手段と
    を具備したことを特徴とした文書読上装置。
  6. 文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる文書読上装置において、
    文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし1行づつ取り出すアクセス手段と、
    取り出した1行を構成するコードを解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、該ヘッダーに基づきコード変換区間の終点を検出してコード変換されたコード変換区間を検出する検出手段と、
    この検出手段によって検出されたコード変換区間のコードの代わりに、前記コード変換区間が文中に挿入されていたことを示す文字列コードを作成するメッセージ作成手段と、
    このメッセージ作成手段によって作成された文字列コードを前記コード変換区間に挿入して音声データに変換させる制御手段と
    を具備したことを特徴とした文書読上装置。
  7. 文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる文書読上装置において、
    文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし1行づつ取り出すアクセス手段と、
    取り出した1行を構成するコードを解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、該ヘッダーに基づきコード変換区間の終点を検出してコード変換されたコード変換区間を検出する検出手段と、
    この検出手段によって検出されたコード変換区間のコードに基づき当該コード変換区間の内容を代表する情報を抽出し、抽出した情報を含む文字列コードを作成するメッセージ作成手段と、
    このメッセージ作成手段によって作成された文字列コードを前記変換コードに代えて挿入して音声データに変換させる制御手段と
    を具備したことを特徴とした文書読上装置。
  8. 文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる文書読上装置において、
    文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし1行づつ取り出すアクセス手段と、
    取り出した1行を構成するコードを解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、該ヘッダーに基づきコード変換区間の終点を検出してコード変換されたコード変換区間を検出する検出手段と、
    この検出手段によって検出されたコード変換区間のコード変換文を、該コード変換文に含まれるコード変換方法情報に基づき元のコードに復元する復元手段と、
    この復元手段によって復元したコードを前記コード変換文に代えて挿入して音声データに変換させる制御手段と
    を具備したことを特徴とした文書読上装置。
JP13164494A 1994-06-14 1994-06-14 文書読み上げ方法及び文書読上装置 Expired - Fee Related JP3556269B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13164494A JP3556269B2 (ja) 1994-06-14 1994-06-14 文書読み上げ方法及び文書読上装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13164494A JP3556269B2 (ja) 1994-06-14 1994-06-14 文書読み上げ方法及び文書読上装置

Publications (2)

Publication Number Publication Date
JPH07334493A JPH07334493A (ja) 1995-12-22
JP3556269B2 true JP3556269B2 (ja) 2004-08-18

Family

ID=15062879

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13164494A Expired - Fee Related JP3556269B2 (ja) 1994-06-14 1994-06-14 文書読み上げ方法及び文書読上装置

Country Status (1)

Country Link
JP (1) JP3556269B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6411931B1 (en) * 1997-08-08 2002-06-25 Sony Corporation Character data transformer and transforming method

Also Published As

Publication number Publication date
JPH07334493A (ja) 1995-12-22

Similar Documents

Publication Publication Date Title
US11799881B2 (en) Resisting the spread of unwanted code and data
EP0598598B1 (en) Text-to-speech processor, and parser for use in such a processor
KR101247075B1 (ko) 마크업 언어 데이터의 인코딩
US20030005001A1 (en) Data processing method, and encoder, decoder and XML parser for encoding and decoding an XML document
US20060106609A1 (en) Speech synthesis system
JP2007265458A (ja) 複数の圧縮オプションを生成する方法およびコンピュータ
US20140093170A1 (en) Document processing device, image processing apparatus, document processing method and computer program product
US7814408B1 (en) Pre-computing and encoding techniques for an electronic document to improve run-time processing
JP3556269B2 (ja) 文書読み上げ方法及び文書読上装置
JPH11316762A (ja) 電子メール要約転送表示方法及び装置及び電子メール要約転送表示プログラムを格納した記憶媒体
JPH11175307A (ja) 文書読上げ方法および装置
JP2003345798A (ja) 翻訳制御方法,翻訳制御装置およびその処理プログラム
JP2007058645A (ja) Xmlデータ圧縮装置、xmlデータ圧縮方法及びxmlデータ圧縮プログラム
JP4007661B2 (ja) 自然言語統計データベース装置
JP3879893B2 (ja) ファクシミリ通信装置
KR100544375B1 (ko) 문서파일로부터 명함정보를 추출하기 위한 장치와 방법,및 상기 방법을 기록한 기록매체
JPH11272442A (ja) 音声合成装置およびプログラムを記憶した媒体
TW434492B (en) Hyper text-to-speech conversion method
JP2004133918A (ja) 文字情報処理装置、通信端末装置、情報提供サーバ及び文字情報処理装置用プログラム
JPH11167398A (ja) 音声合成装置
CN114398309A (zh) 一种文件解析方法、装置、电子设备及存储介质
KR100837775B1 (ko) 비트맵 오브젝트를 이용한 웹메모 변환 및 전송 방법과 그를 위한 웹메모 생성 장치
JP2003202881A (ja) マークアップ言語文書変換処理方法,マークアップ言語文書変換装置,そのプログラムおよびそのプログラムの記録媒体
AU2012258355B2 (en) Resisting the Spread of Unwanted Code and Data
JP3379633B2 (ja) アクティブメッセージ生成方法および装置ならびにアクティブメッセージ生成プログラムを記録した記録媒体

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040427

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040512

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090521

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090521

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100521

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110521

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110521

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120521

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120521

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees