JP3556269B2

JP3556269B2 - 文書読み上げ方法及び文書読上装置

Info

Publication number: JP3556269B2
Application number: JP13164494A
Authority: JP
Inventors: 修加瀬野
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1994-06-14
Filing date: 1994-06-14
Publication date: 2004-08-18
Anticipated expiration: 2019-08-18
Also published as: JPH07334493A

Description

【０００１】
【産業上の利用分野】
本発明は、文字列コードの中にコード変換された区間を有するテキストを音声の規則合成により合成音で読み上げる文書読み上げ方法及びこの方法を採用した文書読上装置に関する。
【０００２】
【従来の技術】
近時、漢字仮名混じりの文を解析し、その文が示す音声情報を規則合成により音声合成して出力する音声合成装置が種々開発されている。この種の音声合成装置は、銀行業務における電話紹介サービスや、新聞校閲システム、文書読み上げ装置等として幅広く利用され始めている。又、通信手段の一つとして、ネットワーク接続されたコンピュータ上でテキストを交換する電子メールが幅広く使用されているが、電子メール等のような使用できるコードの制限された通信手段を使用するには、テキスト中の文字列コードをそのまま送ることのできない場合があり、送ることができない文字列コードを使用可能な文字列コードに変換しなければならなかった。
【０００３】
上記のように電子メール上では、使用することのできるコードの種類に制限のあることがあり、その場合、送信するテキスト中にバイナリファイル等の任意のコードが含まれるものは、その制限に抵触してしまい、そのままでは送ることができなかった。そのため、このようなファイルは使用可能な文字列になるようにコード変換を行なって送信し、受信側でその文字列を元に戻すといったことが行われている。このように、電子メール内にはそのまま読まれることを目的とした文字列の他に、そのまま読まれることを目的とせずファイルを送るためにコード変換により生成された文字列が混在することがある。更に、電子メールの表題行等では、ＡＳＣＩＩコードの使用のみが許されており、日本語等を使えないことがある。そのような環境下でＡＳＣＩＩコード以外の文字を使用しようとした場合、それをＡＳＣＩＩコードのみからなる文字列にコード変換して挿入しておき、受信側でそれを元に戻して見るといったことが行われている。
【０００４】
又、仕様が異なる例えば漢字が使用できない外国製のコンピュータに日本語を使用できるコンピュータで作成したテキストを入力したり、送信する場合も上記のように入力又は送信するコードに制限が生じ、テキストの一部を使用可能な文字列になるようにコード変換して入力又は送信することになる。このため、各種情報処理装置や通信装置を通したテキストはそれを構成する文字列コードの一部がコード変換されている場合があちらこちらで生じることになる。
【０００５】
ところで、上記のようにコード変換され、そのままでは意味を持たず、そのまま読まれることを目的としないコードが存在するテキストを例えば上記した音声合成装置を用いた文書読上装置にて読み上げる時、従来の読み上げ方法では、読み上げることを前提としていないコード部分と、他の読み上げることができるコード部分とを区別することがなかったために、そのまま全文を読み上げてしまっていた。このため、訳の分からない読み上げ部分が生じてしまい、聞き手に違和感や不快感を与えるという不具合があった。
【０００６】
【発明が解決しようとする課題】
上記のように従来の音声合成装置による読み上げ方法にあっては、読み上げ対象テキスト中に存在するそのまま読まれることを目的とせず、コード変換によって生成された部分と、そのまま読まれることを目的としたコード部分とを区別しないため、そのまま読まれることを目的していない意味不明な文字列もそのまま読み上げの対象となって、訳の分からない読み上げ部分が生じるため、聞き手に違和感や不快感を与えるという不具合があった。
【０００７】
そこで本発明はこのような事情を考慮してなされたもので、そのまま読まれることを目的とせずコード変換によって生成された部分と、そのまま読まれることを目的とした他の部分とを区別して、そのまま読まれることを目的していない意味不明な文字列を読み上げないようにするか、又は元の意味のある文字列に戻して読み上げることができる文書読み上げ方法及び文書読上装置を提供することを目的としている。
【０００８】
【課題を解決するための手段】
本発明は文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる文書読み上げ方法であり、文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし１行づつ取り出し、取り出した１行を解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、ヘッダーが検出された場合には、前記ヘッダーに基づきコード変換区間の終点を検出してコード変換区間のコードを読み上げの対象から削除し、ヘッダーが検出さなかった場合には、前記取り出した１行のコードを音声データに変換することを特徴とする。また、文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる際の文書読み上げ方法であって、文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし１行づつ取り出し、取り出した１行を解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、ヘッダーが検出された場合には、前記ヘッダーに基づきコード変換区間の終点を検出してコード変換区間のコードを読み上げの対象から削除し、前記コード変換区間が文中に挿入されていたことを示す文字列コードを作成し、前記コード変換区間に、前記文字列コードを挿入して音声データに変換することを特徴とする。また、文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる際の文書読み上げ方法であって、文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし１行づつ取り出し、取り出した１行を解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、ヘッダーが検出された場合には、前記ヘッダーに基づきコード変換区間の終点を検出してコード変換区間のコードを読み出し、読み出したコードに基づき前記コード変換区間の内容を代表する情報を抽出し、前記代表する情報を含む文字列コードを作成し、前記コード変換区間に前記代表する情報を含む文字コードを挿入して音声データに変換することを特徴とする。また、文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる際の文書読み上げ方法であって、文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし１行づつ取り出し、取り出した１行を解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、ヘッダーが検出された場合には、前記ヘッダーに基づきコード変換区間の終点を検出してコード変換区間のコードを読み出し、前記コード変換区間のコード変換文を該コード変換文に含まれるコード変換方法情報に基づき元のコードに復元し、前記コード変換区間に前記復元したコードを前記コード変換文に代えて挿入して音声データに変換することを特徴とする。
更に、本発明は文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる文書読上装置であり、文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし１行づつ取り出すアクセス手段と、取り出した１行を構成するコードを解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、該ヘッダーに基づきコード変換区間の終点を検出してコード変換されたコード変換区間を検出する検出手段と、この検出手段によってヘッダーが検出された場合にはコード変換区間のコードを除去し、ヘッダーが検出されない場合には前記取り出した１行のコードを音声データに変換させる制御手段とを具備したことを特徴する。また、文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる文書読上装置において、文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし１行づつ取り出すアクセス手段と、取り出した１行を構成するコードを解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、該ヘッダーに基づきコード変換区間の終点を検出してコード変換されたコード変換区間を検出する検出手段と、この検出手段によって検出されたコード変換区間のコードの代わりに、前記コード変換区間が文中に挿入されていたことを示す文字列コードを作成するメッセージ作成手段と、このメッセージ作成手段によって作成された文字列コードを前記コード変換区間に挿入して音声データに変換させる制御手段とを具備したことを特徴とする。また、文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる文書読上装置において、文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし１行づつ取り出すアクセス手段と、取り出した１行を構成するコードを解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、該ヘッダーに基づきコード変換区間の終点を検出してコード変換されたコード変換区間を検出する検出手段と、この検出手段によって検出されたコード変換区間のコードに基づき当該コード変換区間の内容を代表する情報を抽出し、抽出した情報を含む文字列コードを作成するメッセージ作成手段と、このメッセージ作成手段によって作成された文字列コードを前記変換コードに代えて挿入して音声データに変換させる制御手段とを具備したことを特徴とする。また、文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる文書読上装置において、文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし１行づつ取り出すアクセス手段と、取り出した１行を構成するコードを解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、該ヘッダーに基づきコード変換区間の終点を検出してコード変換されたコード変換区間を検出する検出手段と、この検出手段によって検出されたコード変換区間のコード変換文を、該コード変換文に含まれるコード変換方法情報に基づき元のコードに復元する復元手段と、この復元手段によって復元したコードを前記コード変換文に代えて挿入して音声データに変換させる制御手段とを具備したことを特徴とする。
【０００９】
【作用】
本発明では、読み上げる文書から、実際にそのまま読み上げる必要のないコード変換されたコード変換区間の文字列を検出して削除することにより、意味のある文字列コード部分のみを読み上げる。また、コード変換された区間に代えて、このようなコード変換区間の存在を示すメッセージを作成して、これを読み上げる。また、コード変換区間の部分においては、当該コード変換区間の内容を代表する情報を含む文字列のメッセージを作成して読み上げる。更に、変換コードの部分においては、変換コードを文書に含まれるコード変換方法情報に基づき元のコードに復元し、この復元したコードを読み上げる。
【００１０】
【実施例】
以下、本発明の一実施例を図面を参照して説明する。図１は本発明の文書読み上げ方法を採用した本発明の文書読上装置の一実施例を示したブロック図である。１は読み上げ対象となるテキストを格納した記憶部、２は記憶部１よりテキストの内容を逐次読み出し、コード変換を受けている区間をコード変換部分の持つ特徴や制約によって特定することによりその部分を抜き出したり、必要に応じて、その部分からコード変換された文字列を削除した旨を示すメッセージを代わりに挿入するコード変換区間検出及び削除部、３はコード変換区間検出及び削除部２で編集されたテキストの内容に従った音声合成を行なう文音声変換部、４は音声出力用のスピーカである。
【００１１】
次に本実施例の文書読み上げ方法について図１及び図２に示したフローチャートを参照して説明する。まず、オペレータは図示されない入力部から読み上げ対象テキストを指定すると共に、このテキストの読み上げ開始を装置に指示する。これにより、コード変換区間検出及び削除部２はステップ２０１にて読み上げ対象テキストの読み出しを開始するために記憶部１にアクセスし、ステップ２０２にて記憶部１に読み上げ対象テキストがまだ残っているかをチェックする。ここで、テキストが残っていなければ動作を終了し、残っていればステップ２０３に進む。
【００１２】
ステップ２０３にて、コード変換区間検出及び削除部２はまだ残っているテキストの次の１行を記憶部１から取り出し、ステップ２０４に進む。ステップ２０４では、取り出した１行を解析し、これがコード変換された部分のヘッダーであるかどうかをヘッダーが満たすべき条件を検査することにより判定する。但し、ここでは、ヘッダーのみを見れば、それに続く行がコード変換されているか否かの検査が可能で、コード変換区間の終点も判定できるものとする。ここで、ヘッダーでないことが分かればステップ２０７へ進み、ヘッダーであればステップ２０５に進む。ステップ２０７にて、コード変換区間検出及び削除部２はヘッダーの情報よりコード変換されている部分の終点を算出し、記憶部１からの空読み等により、前記コード変換区間を読み上げの対象から削除する処理を行った後、ステップ２０２に戻る。
【００１３】
ステップ２０５に進んだ場合、コード変換区間検出及び削除部２は記憶部１から読み出したコードを文音声変換部３に入力する。このため、文音声変換部３は文音声変換により前記入力コードを音声データに変換して、ステップ２０６に進む。ステップ２０６にて、文音声変換部３は文音声変換により得られた音声データをスピーカ４から出力して、ステップ２０２に戻る。
【００１４】
図７は図２のフローチャートで示したテキストのコード変換のされている区間については読み上げないようにする読み上げ方法を用いた場合の入力文と、実際に読み上げられる文例を示した図である。図７（Ａ）に示したテキストが読み上げのために与えられる原文（入力文）で、図７（Ｂ）に示した右側のテキストが実際に読み上げられる文に相当する。
【００１５】
図７（Ａ）に示した原文の場合、「以下にファイルを添付します。」まで、コード変換された部分が無いとすると、そこまでは、読み上げにそのまま使われることとなる。しかし、その次の行の「〈〈ＴｙｐｅＡｐｒｏｇ．ｇｚ３ｌｉｎｅｓ〉〉」がＴｙｐｅＡというコード変換フォーマットのヘッダーの書式に合致し、その行に続く３行がこのコード変換方法によって生成された行であることが、コード変換区間検出及び削除部２の解析によって判明すると、その行と、それに続く３行は実際には読み上げないようにする。ここで、「〈〈ＴｙｐｅＡｐｒｏｇ．ｇｚ３ｌｉｎｅｓ〉〉」という行が、ＴｙｐｅＡというコード変換法によって生成されたテキストの先頭であり、且つこのテキストを復号して生成されるのが、ｐｒｏｇ．ｇｚという名前のファイルであり、これに続く３行がこの変換法によって生成されたテキストであることを表している。従って、このような形式に合致する行がテキスト中に存在すれば、これはこの変換方法によるテキスト部分の開始であることが保証されているものとする。しかし、場合によっては本当にこの方法によって生成されたものかを、この変換法の持つ制約等により検査する必要があることもある。
【００１６】
そして、上記した４行の後のテキストに、コード変換のフォーマットに合致する部分が存在しなければ、それらは、そのまま実際の読み上げに使用されることとなる。これにより、図７（Ａ）に示したテキストの場合、実際に読み上げられるのは、コード変換された部分を除いた、図７（Ｂ）に示した右側のテキストということになる。
【００１７】
本実施例によれば、読み上げ対象となっているテキスト中にあるコード変換された意味のない文字列を区別することができ、このコード変換区間が特定されると、この区間を削除して、意味のある文字列部分のみを読み上げることができるため、上記のようなコード変換区間を含んだテキストを、聞き手に違和感や不快感等を与えることなく、意味のある部分のみを一貫して読み上げることができる。
【００１８】
図３は本発明の文書読み上げ方法の他の実施例を示したフローチャートである。まず、オペレータは図示されない入力部から読み上げ対象テキストを指定すると共に、このテキストの読み上げ開始を装置に指示する。これにより、コード変換区間検出及び削除部２はステップ３０１にて読み上げ対象テキストの読み出しを開始するために記憶部１にアクセスし、ステップ３０２にて記憶部１に読み上げ対象テキストがまだ残っているかをチェックする。ここで、テキストが残っていなければ、動作を終了し、残っていればステップ３０３に進む。
【００１９】
ステップ３０３にて、コード変換区間検出及び削除部２はまだ残っているテキストの次の１行を記憶部１から取り出した後、ステップ３０４に進む。ステップ３０４では、取り出した１行を解析し、これがコード変換された区間のヘッダーであるかどうかをヘッダーが満たすべき条件を検査することにより判定する。但し、ここでは、ヘッダーのみを見れば、それに続く行がコード変換されているか否かの検査が可能で、コード変換部の終点も判定できるものとする。ここで、ヘッダーでないことが分かればステップ３０７へ跳び、ヘッダーであればステップ３０５に進む。
【００２０】
コード変換区間検出及び削除部２はステップ３０５にて記憶部１から取り出したコード変換のされている区間について記憶部１からの空読み等により、このコード変換部を読み上げの対象から削除し、その代わりにテキストのその場所にコード変換された区間が挿入されていた旨を示す文章（メッセージ）を作成して、ステップ３０７に進む。ステップ３０７にて、コード変換区間検出及び削除部２は記憶部１から読み出したコードを文音声変換部３に入力する。このため、文音声変換部３は文音声変換により前記入力コードを音声データに変換して、ステップ３０８に進む。ステップ３０８にて、文音声変換部３は文音声変換により得られた音声データをスピーカ４から出力して、ステップ３０２に戻る。
【００２１】
図８はテキストのコード変換のされている区間については、その部分にコード変換されたテキストが挿入されていることを報告するのみにとどめ、実際には読み上げないようにする図３のフローチャートで示した読み上げ方法を用いた場合の入力文と、実際に読み上げられる文例を示した図である。図８（Ａ）に示したテキストが読み上げのために与えられる原文で、図８（Ｂ）に示した右側のテキストが実際に読み上げられる文に相当する。
【００２２】
図８（Ａ）に示した原文の場合、「以下にファイルを添付します。」まで、コード変換された部分がないとすると、そこまでは、実際の読み上げにもそのまま使われることとなる。しかし、その次の行の「〈〈ＴｙｐｅＡｐｒｏｇ．ｇｚ３ｌｉｎｅｓ〉〉」が、ＴｙｐｅＡというコード変換フォーマットのヘッダーの書式に合致し、その行に続く３行がこのコード変換方法によって生成された行であることが解析によって判明すると、その行と、それに続く３行は実際には読み上げないようにし、代わりに、「この部分にコード変換されたファイルが挿入されています。」という文を挿入し、この文を読み上げることにより、そこにコード変換により生成された文が挿入されていることを聞き手に報告する。そして、このこれら４行の後のテキストに、コード変換のフォーマットに合致する部分が存在ししなければ、それらは、そのまま実際の読み上げに使用されることとなる。
【００２３】
従って、図８（Ａ）に示したテキストの場合、実際に読み上げられるのは、コード変換された区間を除き、代わりに、そこにコード変換されたファイルが存在することを報告する文章を挿入した、図８（Ｂ）の右側のテキストということになる。
【００２４】
本実施例によれば、読み上げ対象となっているテキスト中にあるコード変換された意味のない文字列を区別することができ、このコード変換区間が特定されると、この区間を削除して、その代わりにコード変換区間が挿入されていた旨を、聞き手に知らせる文を作成し、この文を前記コード変換区間の代わりに読み上げると共に、残りの意味のある文字列区間のみを読み上げて、コード変換区間が存在したことを聞き手に知らせることができる。これにより、上記のようなコード変換区間を含んだテキストを、聞き手に違和感や不快感等を与えることなく読み上げることができる。
【００２５】
図４は本発明の更に他の文書読み上げ方法を採用した本発明の文書読上装置の他の実施例を示したブロック図である。１は読み上げ対象となるテキストを格納した記憶部、２は記憶部１よりテキストの内容を逐次読み出し、コード変換を受けている場所をコード変換区間の持つ特徴や制約によって特定することによりその部分を抜き出すコード変換区間検出及び削除部、３はテキスト結合部５から入力される文音声変換部、４は音声出力用のスピーカ、５はコード変換区間検出及び削除部２の出力と情報抽出部６の出力を結合するテキスト結合部（加算器）、６はコード変換区間検出及び削除部により特定されたコード変換区間よりファイル名等の情報を抽出し、それに基づいてメッセージを作成したり、或いは前記コード変換区間を復号化して元の文字列コードに変換する情報抽出部である。
【００２６】
次に文書読み上げ方法の第３の実施例について図４及び図５のフローチヤートを参照して説明する。まず、オペレータは図示されない入力部から読み上げ対象テキストを指定すると共に、このテキストの読み上げ開始を装置に指示する。これにより、コード変換区間検出及び削除部２はステップ５０１にて読み上げ対象テキストの読み出しを開始するために記憶部１にアクセスし、ステップ５０２にて記憶部１に読み上げ対象テキストがまだ残っているかをチェックする。ここで、テキストが残っていなければ、動作を終了し、残っていればステップ５０３に進む。
【００２７】
ステップ５０３にて、コード変換区間検出及び削除部２はまだ残っているテキストの次の１行を記憶部１から取り出した後、ステップ５０４に進む。ステップ５０４では、取り出した１行を解析し、これがコード変換された部分のヘッダーであるかどうかをヘッダーが満たすべき条件を検査することにより判定する。但し、ここでは、ヘッダーのみを見れば、それに続く行がコード変換されているか否かの検査が可能で、コード変換区間の終点も判定できるものとする。ここで、ヘッダーでないことが分かればステップ５０８へ跳び、ヘッダーであればステップ５０５へ進む。
【００２８】
次にコード変換区間検出及び削除部２はステップ５０５にて記憶部１から前記コード変換されている区間を読み出し、これを情報抽出部６に渡す。これにより、情報抽出部６はステップ５０６にて前記渡されたコード変換区間を解析することにより、そこに納められたファイルのファイル名を抽出し、更にステップ５０７にて前記コード変換区間に前記抽出されたファイル名のファイルが挿入されていたことを示す旨の文を作成し、これをテキスト結合部５を介して文音声変換部３に入力してステップ５０８に進む。ステップ５０８にて、文音声変換部３は文音声変換により前記入力コードを音声データに変換して、ステップ５０９に進む。ステップ５０９にて、文音声変換部３は文音声変換により得られた音声データをスピーカ４から出力して、ステップ５０２に戻る。
【００２９】
図９はテキストのコード変換されている区間については、その部分にコード変換された文が挿入されていることと、それを解析することにより判明するファイル名等を報告するのみにとどめ、実際には読み上げないようにする図５に示した読み上げ方法を用いた場合の入力文と、実際に読み上げられる文例を示した図である。図９（Ａ）に示したテキストが読み上げのために与えられる原文で、図９（Ｂ）に示した右側のテキストが実際に読み上げられる文に相当する。
【００３０】
図９（Ａ）に示した原文の場合、「以下にファイルを添付します。」まで、コード変換された部分がないとすると、そこまでは、実際の読み上げにもそのまま使われることとなる。しかし、その次の行のしかし、その次の行の「〈〈ＴｙｐｅＡｐｒｏｇ．ｇｚ３ｌｉｎｅｓ〉〉」が、ＴｙｐｅＡというコード変換フォーマットのヘッダーの書式に合致し、そこに含まれるファイルの名前がｐｒｏｇ．ｇｚであり、その行に続く３行がこのコード変換方法によって生成された行であることが解析によって判明すると、その行と、それに続く３行は読み上げないようにし、その代わりに、「この部分にｐｒｏｇ．ｇｚという名のファイルがＴｙｐｅＡ形式で挿入されています。」という文を挿入し、この文を読み上げることにより、そこにｐｒｏｇ．ｇｚという名のファイルがコード変換されて挿入されていることを聞き手に報告する。
【００３１】
上記した４行の後のテキストに、コード変換のフォーマットに合致する部分が存在しなければ、それらは、そのまま実際の読み上げに使用されることとなる。従って、図９（Ａ）に示したテキストの場合、実際に読み上げられるのは、コード変換された区間を除き、その代わりに、この区間にコード変換されたファイルが存在することを報告する文を挿入した、図９（Ｂ）に示した右側のテキストになる。
【００３２】
本実施例によれば、読み上げ対象テキストに挿入されているコード変換区間を特定すると、この区間を解析してファイル名を抽出し、前記コード変換区間に代わって前記抽出されたファイル名のコード変換区間が挿入されていた旨のメッセージを読み上げることができるため、意味のある文字列のみを読み上げると共に、コード変換区間が挿入されていたことをそのファイル名を告げて聞き手に知らせることができ、聞き手に違和感や不快感を与えることなくテキストを円滑に読み上げることができる。
【００３３】
図６は図４に示した構成における本発明の文書読み上げ方法の更に他の実施例を示したフローチャートである。まず、オペレータは図示されない入力部から読み上げ対象テキストを指定すると共に、このテキストの読み上げ開始を装置に指示する。これにより、コード変換区間検出及び削除部２はステップ６０１にて読み上げ対象テキストの読み出しを開始するために記憶部１にアクセスし、ステップ６０２にて記憶部１に読み上げ対象テキストがまだ残っているかをチェックする。ここで、テキストが残っていなければ、動作を終了し、残っていればステップ６０３に進む。
【００３４】
ステップ６０３にて、コード変換区間検出及び削除部２はまだ残っているテキストの次の１行を記憶部１から取り出した後、ステップ６０４に進む。ステップ６０４では、取り出した１行を解析し、これがコード変換された部分のヘッダーであるかどうかをヘッダーが満たすべき条件を検査することにより判定する。但し、ここでは、ヘッダーのみを見れば、それに続く行がコード変換されているか否かの検査が可能で、コード変換部分の終点も判定できるものとする。ここで、ヘッダーでないことが分かればステップ６０７へ跳び、ヘッダーであればステップ６０５に進む。
【００３５】
次にコード変換区間検出及び削除部２はステップ６０５にて記憶部１から前記コード変換されている部分を読み出し、これを情報抽出部６に渡す。これにより、情報抽出部６はステップ６０６にてコード変換区間検出及び削除部２から渡された前記コード変換区間を解析することにより、そこに納められたコード変換文字列を復号化して元の文字列に戻し、これをテキスト結合部５を介して文音声変換部３に入力してステップ６０７に進む。ステップ６０７にて、文音声変換部３は文音声変換により前記入力コードを音声データに変換して、ステップ６０８に進む。ステップ６０８にて、文音声変換部３は文音声変換により得られた音声データをスピーカ４から出力して、ステップ６０２に戻る。
【００３６】
図１０はテキストのコード変換されている区間については、それを復号化したものを読み上げに用い、コード変換によって生成されたテキスト自体は読み上げない図６のフローチャートに示した読み上げ方法を用いた場合の入力文と、実際に読み上げられる文例を示した図である。図１０（Ａ）に示したテキストが読み上げのために与えられる原文で、図１０（Ｂ）に示した右側のテキストが実際に読み上げられる文に相当する。
【００３７】
図１０（Ａ）に示した原文の場合、先頭の行の「〈〈ＴｙｐｅＢ３ｌｉｎｅｓ〉〉」が、ＴｙｐｅＢというコード変換フォーマットのヘッダーの書式に合致し、その行に続く３行がこのコード変換方法によって生成された行であることが解析によって判明すると、その行と、それに続く３行は実際には読み上げないようにし、代わりに、それらを復号して生成される「お久しぶりです。お元気ですか？」という文を実際に読み上げる文として挿入する。ここで、「〈〈ＴｙｐｅＢ３ｌｉｎｅｓ〉〉」という行がＴｙｐｅＢというコード変換方法によって生成されたテキストの先頭であり、且つこのテキストを復号して生成されるのが、読まれることを意図したテキストであり、これに続く３行がこの変換法によって生成されたテキストであることを示しており、この形式に合う行が存在すれば、これはこの変換方法によるテキスト部分の開始であることが保証されているものとする。実際には、本当にこの方法によって生成されたものであるか否かを、この変換法の持つ制約等により検査する必要がある場合もある。
【００３８】
従って、図１０（Ａ）に示したテキストの場合、文章がコード変換により生成されたテキストのみであるので、実際に読み上げられるのはコード変換されたテキストを復号化して得られた、図１０（Ｂ）の右側に示したテキストということになる。
【００３９】
本実施例によれば、記憶部１から読み出したテキスト中に挿入されている変換コード区間を復号化して得た文章を、前記コード変換区間の代わりにテキスト中に挿入し、このテキストを読み上げるため、テキストの内容を全て意味のある文章として読み上げることができ、聞き手に違和感や不快感を与えることがなくなると共に、テキストの内容を欠落することなく全て読み上げることができる。
【００４０】
尚、本発明は上述した実施例に限定されるものではない。即ち、上記実施例で使用したコード変換フォーマットでは、コード変換区間の最初の１行のみを検査すれば、それがコード変換された区間の先頭であることや、その終点などがわかることを仮定していたが、コード変換区間を複数行を読み込むことによって、検査できるようなフォーマットのものでも良い。又、実施例では、行単位でコード変換された部分とそれ以外の部分の判定を行っていたが、文字単位で行ない、行の一部にコード変換された文字列が挿入されているようなものでも良い。更に、実施例では、複数のコード変換用のフォーマットを扱うことを特に考慮して記述してはいないが、各フォーマットの持つ特徴や制約により処理を場合分けすることにより、１つの装置で複数のフォーマットを扱えるようにしても良い。又、実施例では、コード変換された部分の処理部と、文音声変換し、音声出力する部分がまとめて１つのプログラムとして記述されているが、それぞれを別のプログラムとして実行し、コード変換区間の処理を行なったテキストを文音声変換及び音声出力するようなプログラムに渡すようにしても良い。
【００４１】
【発明の効果】
以上記述したように本発明の文書読み上げ方法及び文書読上装置によれば、そのまま読まれることを目的とせずコード変換によって生成された部分と、そのまま読まれることを目的とした他の部分とを区別して、そのまま読まれることを目的していない意味不明な文字列を読み上げないので、聞き手に違和感や不快感を与えることをなくすことができる。また、コード変換された区間に代えて、このようなコード変換区間の存在を示すメッセージを作成して、これを読み上げるので、コード変換区間の存在を知ることができる。また、コード変換区間の部分においては、当該コード変換区間の内容を代表する情報を含む文字列のメッセージを作成して読み上げるので、コード変換区間の内容を知ることができる。更に、変換コードの部分においては、変換コードを元のコードに復元し、この復元したコードを読み上げるので、元の意味のある文字列を知ることができる。
【図面の簡単な説明】
【図１】本発明の文書読上装置の一実施例を示したブロック図。
【図２】図１に示した装置上の第１の文書読み上げ方法の処理の流れの一実施例を示したフローチャート。
【図３】図１に示した装置上の第２の文書読み上げ方法の処理の流れの一実施例を示したフローチャート。
【図４】本発明の文書読上装置の他の実施例を示したブロック図。
【図５】図４に示した装置上の第１の文書読み上げ方法の処理の流れの一実施例を示したフローチャート。
【図６】図４に示した装置上の第２の文書読み上げ方法の処理の流れの一実施例を示したフローチャート。
【図７】図３のフローチャートで示した読み上げ方法を用いた場合の入力文と、実際に読み上げられる文例を示した図。
【図８】図４のフローチャートで示した読み上げ方法を用いた場合の入力文と、実際に読み上げられる文例を示した図。
【図９】図５のフローチャートで示した読み上げ方法を用いた場合の入力文と、実際に読み上げられる文例を示した図。
【図１０】図６のフローチャートで示した読み上げ方法を用いた場合の入力文と、実際に読み上げられる文例を示した図。
【符号の説明】
１…記憶部２…コード変換区間検出及び削除部
３…文音声変換部４…スピーカ
５…テキスト結合部６…情報抽出部

Claims

文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる際の文書読み上げ方法であって、
文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし１行づつ取り出し、
取り出した１行を解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、
ヘッダーが検出された場合には、前記ヘッダーに基づきコード変換区間の終点を検出してコード変換区間のコードを読み上げの対象から削除し、
ヘッダーが検出さなかった場合には、前記取り出した１行のコードを音声データに変換することを特徴とした文書読み上げ方法。
文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる際の文書読み上げ方法であって、
文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし１行づつ取り出し、
取り出した１行を解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、
ヘッダーが検出された場合には、前記ヘッダーに基づきコード変換区間の終点を検出してコード変換区間のコードを読み上げの対象から削除し、
前記コード変換区間が文中に挿入されていたことを示す文字列コードを作成し、
前記コード変換区間に、前記文字列コードを挿入して音声データに変換することを特徴とした文書読み上げ方法。
文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる際の文書読み上げ方法であって、
文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし１行づつ取り出し、
取り出した１行を解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、
ヘッダーが検出された場合には、前記ヘッダーに基づきコード変換区間の終点を検出してコード変換区間のコードを読み出し、
読み出したコードに基づき前記コード変換区間の内容を代表する情報を抽出し、
前記代表する情報を含む文字列コードを作成し、
前記コード変換区間に前記代表する情報を含む文字コードを挿入して音声データに変換することを特徴とした文書読み上げ方法。
文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる際の文書読み上げ方法であって、
文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし１行づつ取り出し、
取り出した１行を解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、
ヘッダーが検出された場合には、前記ヘッダーに基づきコード変換区間の終点を検出してコード変換区間のコードを読み出し、
前記コード変換区間のコード変換文を該コード変換文に含まれるコード変換方法情報に基づき元のコードに復元し、
前記コード変換区間に前記復元したコードを前記コード変換文に代えて挿入して音声データに変換することを特徴とした文書読み上げ方法。
文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる文書読上装置において、
文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし１行づつ取り出すアクセス手段と、
取り出した１行を構成するコードを解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、該ヘッダーに基づきコード変換区間の終点を検出してコード変換されたコード変換区間を検出する検出手段と、
この検出手段によってヘッダーが検出された場合にはコード変換区間のコードを除去し、ヘッダーが検出されない場合には前記取り出した１行のコードを音声データに変換させる制御手段と
を具備したことを特徴とした文書読上装置。
文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる文書読上装置において、
文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし１行づつ取り出すアクセス手段と、
取り出した１行を構成するコードを解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、該ヘッダーに基づきコード変換区間の終点を検出してコード変換されたコード変換区間を検出する検出手段と、
この検出手段によって検出されたコード変換区間のコードの代わりに、前記コード変換区間が文中に挿入されていたことを示す文字列コードを作成するメッセージ作成手段と、
このメッセージ作成手段によって作成された文字列コードを前記コード変換区間に挿入して音声データに変換させる制御手段と
を具備したことを特徴とした文書読上装置。
文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる文書読上装置において、
文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし１行づつ取り出すアクセス手段と、
取り出した１行を構成するコードを解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、該ヘッダーに基づきコード変換区間の終点を検出してコード変換されたコード変換区間を検出する検出手段と、
この検出手段によって検出されたコード変換区間のコードに基づき当該コード変換区間の内容を代表する情報を抽出し、抽出した情報を含む文字列コードを作成するメッセージ作成手段と、
このメッセージ作成手段によって作成された文字列コードを前記変換コードに代えて挿入して音声データに変換させる制御手段と
を具備したことを特徴とした文書読上装置。
文書を構成しているコードを音声の規則合成によって音声データに変換し、これを音声出力することにより文書を読み上げる文書読上装置において、
文書の読み上げ指示を受けると、記憶部に記憶された文書にアクセスし１行づつ取り出すアクセス手段と、
取り出した１行を構成するコードを解析し、コード変換フォーマットのヘッダー書式に合致するか否かに基づきヘッダーを検出し、該ヘッダーに基づきコード変換区間の終点を検出してコード変換されたコード変換区間を検出する検出手段と、
この検出手段によって検出されたコード変換区間のコード変換文を、該コード変換文に含まれるコード変換方法情報に基づき元のコードに復元する復元手段と、
この復元手段によって復元したコードを前記コード変換文に代えて挿入して音声データに変換させる制御手段と
を具備したことを特徴とした文書読上装置。