JP2004171174A

JP2004171174A - 文章読み上げ装置、読み上げのためのプログラム及び記録媒体

Info

Publication number: JP2004171174A
Application number: JP2002334694A
Authority: JP
Inventors: Takao Kato; 隆夫加藤
Original assignee: Brother Industries Ltd
Current assignee: Brother Industries Ltd
Priority date: 2002-11-19
Filing date: 2002-11-19
Publication date: 2004-06-17

Abstract

【課題】文章読み上げ装置において、登録されていない未知語について、ユーザーがその未知語の読みを入力すること、その読みに従って文章を読み上げるようにする。
【解決手段】文章読み上げ装置１は、読み上げ文章中に解析不能な未知語があったときは、その単語を抽出し、抽出された未知語を図示のように文章表示か画面に表示する。表示された未知語について読みが入力されると、入力された未知語とその読みが登録され、以後はその読みによって読み上げがなされる。
【選択図】図７

Description

【０００１】
【発明が属する技術分野】
本発明は、文章を音声合成技術を用いて合成音声として出力する文章読み上げ装置、読み上げのためのプログラム及び同プログラムを記録した記録媒体に関する。
【０００２】
【従来の技術】
文章を音声合成技術を用いて音声として出力することによって文章を読み上げる機能（文章読み上げ装置）が携帯情報端末（ＰＤＡ）に組み込まれるようになってきている。このような装置において、読み上げる書籍（新聞等を含む）の文章の中に読み方が複数ある単語または辞書に登録されておらず読み方の分からない単語がある場合がある。
【０００３】
このような場合、例えば特許文献１に開示された文書読上装置では、文書読み上げ中、読み上げ対象文書中から複数読み単語を検出し、その複数の読みを暫定学習データファイルから読み出して表示装置に表示し、その中から読み候補を指定することで、その読みを優先順位１位の読み候補に更新し、以後の読み上げを更新された読みにより行うようにしている。
【０００４】
このように、前記従来公知のものは、複数読みを暫定学習データファイルに記述されたその読みの優先順位の１番高いものを採用しており、暫定学習ファイルにないものについては単語辞書に記述されている読みの第１優先順位の読みに従い読み上げるようになっている。
【０００５】
【特許文献１】
特開平６−３３２８９９号公報（要約、段落（００１７）、段落（００２２））
【０００６】
【発明が解決しようとする課題】
前記従来の文書読上装置では複数読み単語については、選択した読みでその後も読み上げを行うことができる。しかし、この文書読上装置では単語辞書にない未知語については対応できない。
【０００７】
そこで、本発明は前記の問題点を解決するためになされたものであって、その第１の目的は文章の読み上げ中に、未知語についてユーザーがその未知語の読みを入力でき、その後は入力した読みで文章を読み上げることができるようにすることである。
【０００８】
第２の目的は、未知語に予め未知語マークを付与しておくことにより、読み上げ中に未知語の抽出を容易かつ迅速に行い、未知語の入力処理を円滑に行えるようにすることである。
【０００９】
【課題を解決するための手段】
請求項１の発明は、文章を解析し、該解析に従って音声を合成して読み上げる文章読み上げ装置において、読み上げ文章中の解析不能な未知語を抽出する手段と、抽出された未知語を表示する手段と、表示された未知語の読みを入力する手段と、入力された未知語をその読みと共に登録する手段とを備えている。この請求項１に記載の文章読み上げ装置では、前記未知語が登録された読みに従って読み上げられる。
【００１０】
請求項２の発明は、請求項１に記載された文章読み上げ装置において、読み上げ文章の形態素解析において解析不能の単語に未知語マークを付与する手段を備えている。この請求項２に記載の文章読み上げ装置では、前記未知語を抽出する手段が未知語に付与された未知語マークを検索して抽出を行う。
【００１１】
請求項３の発明は、文章を解析し、該解析に従って音声を合成して読み上げるためにコンピュータに、読み上げ文章中の解析不能な未知語を抽出する手順と、抽出された未知語を表示手段に表示する手順と、表示された未知語の読みを入力状態に移行する手順と、抽出された未知語を入力された読みと共に記憶手段に登録する手順と、前記未知語を登録された読みに従って読み上げるためのデータを生じる手順とを実行させることを特徴とする文章読み上げ装置用プログラムである。この請求項３に記載の発明によれば、上述の手順がコンピュータにより実行される。
【００１２】
請求項４の発明は、文章を解析し、該解析に従って音声を合成して読み上げるためにコンピュータに読み上げ文章中の解析不能な未知語を抽出する手順と、抽出された未知語に対して、未知語マークを付与する手順とを実行させることを特徴とする文章読み上げ装置用プログラムである。この請求項４に記載の発明によれば、上述の手順がコンピュータにより実行される。
【００１３】
請求項５に記載の発明は、請求項４に記載の手順に加えて、前記未知語マークを検出する手順と、前記未知語マークを付与された単語に読みを入力するための状態に移行する手順とをコンピュータに実行させるものである。この請求項５に記載の発明によれば、上述の手順がコンピュータにより実行される。
【００１４】
請求項６の発明は、請求項３乃至５のいずれかに記載のプログラムを記録したコンピュータ読み取り可能な記録媒体である。この請求項５の発明によれば、請求項３又は４に記載の発明と同様の作用を奏する。
【００１５】
【発明の実施の形態】
本発明の実施の形態に係る文章読み上げ装置について図面を参照しながら説明する。
【００１６】
図１は本発明の実施の形態に係る携帯端末装置による文章読み上げ装置の正面図である。文章読み上げ装置１は、図示のように、文字、画像が表示される液晶ディスプレイ２と、ユーザが各種キー操作を行うための操作キー３と、ユーザがスタイラス等を利用して入力するために液晶ディスプレイ２の表面に貼付されたタッチパネル４、スピーカ５、並びにイヤフォン（図示略）への音声出力のための出力端子部（図示略）を備えている。
【００１７】
次に上記文章読み上げ装置１の概略構成を示すブロック図である図２を参照して、上記装置の構成を説明する。
【００１８】
文章読み上げ装置１は、ＣＰＵ１０と、ＲＯＭ６と、ＲＡＭ７と、表示装置である上記液晶ディスプレイ２を含む表示装置９と、上記操作キー３及びタッチパネル４を含む入力装置８と、上記スピーカ５や出力端子部を含む音声出力装置５とを備えている。
【００１９】
ＲＯＭ６には、上記文章読み上げ装置１のＯＳ（制御プログラム）を記憶した領域（装置のプログラム領域）６１，上記装置１の電子ブックとして機能させるための電子ブックリーダプログラムを記憶した領域（電子ブックリーダプログラム領域）６２、文章読み上げ処理を実行させるための音声読み上げプログラムを記憶した領域（音声読み上げプログラム領域）６３等各種のプログラム記憶領域が設けられている。さらに、音声合成辞書データを記憶した領域（音声合成辞書データ領域）６５、音声合成音素データを記憶した領域（音声合成音素データ領域）６６、アクセント処理用辞書データを記憶した領域（アクセント処理用データ領域）６７等、読み上げ文章の形態素解析及び音声合成に必要なデータを記憶するためのデータ記憶領域が設けられている。
【００２０】
ＲＡＭ７には、音声合成のためのデータ処理の中間結果を記憶するためのワーク領域７１、ユーザが使用する各種データを記憶するためのユーザデータ領域７２、文章読み上げ装置１で読み上げられる書籍データを記憶するための書籍データ領域７３が設けられている。さらに解析できない単語（未知語）に関する情報を登録（記憶）するための領域として単語登録領域７４、及び、複数読みのある単語についてその読みを選択した場合その選択結果を記憶するための単語学習領域７５が設けられている。尚、上記データ領域７３は、文章読み上げ装置１外から取り込まれた書籍データも記憶されるように構成されている。
【００２１】
ＣＰＵ１０は、本実施の形態に係る文章読み上げ装置１においては、ＲＯＭ６に格納されている各種プログラムに基づいて、入力装置８、液晶ディスプレイ２、スピーカ５等について制御を行う。
【００２２】
ＣＰＵ１０は書籍データから、ＲＯＭ６の電子ブックリーダプログラム及び音声読み上げ用プログラムを使って音声合成データを作成し、このデータをスピーカ５に供給して合成音を出力する。合成音をスピーカ５に代えてイヤフォンから出力するようにしてもよいことは勿論である。
【００２３】
次に、実施の形態に係る文章読み上げ装置１のソフトウェアの構成を説明する。
【００２４】
図３は文章読み上げ装置１の文章読み上げ処理に関連する各プログラムの関連を示すブロック図である。
【００２５】
図中、電子ブックリーダプログラムは、携帯情報端末（ＰＤＡ）において、頁送り、文字組み、段組、頁サイズの変更、フォント設定、ルビ表示等の処理を実行させるためのプログラムである。
【００２６】
音声読み上げプログラムは書籍データ（テキストデータ）を合成音声で読み上げるためのプログラムで、上記電子ブックリーダプログラムに連動して動作するプログラムである。この該音声読み上げプログラムは、更に音声パラメータ変換プログラム、音声出力プログラム及びルビ情報切り出し及び登録プログラムを備えている。
【００２７】
音声パラメータ変換プログラムは読み上げ用文章から、音声合成単語辞書及びアクセント処理用辞書データを使って読み上げ用音声パラメータ文字列を作成する。音声出力プログラムは、上記音声パラメータ変換プログラムによって作成された読み上げ用音声パラメータ文字列に基づいて音声合成音素データを使って出力音声データを作成する。
【００２８】
未知語読み取得及び登録プログラムは、読み上げ文書について形態素解析を行う際に、辞書にないつまり解析できない単語（未知語）を見つけた時にその単語に未知語マークを付与（未知語であることを示すためのデータであって、文章の一部としては読まれないデータ）しておき、文書読み上げ中にその単語を検索して液晶ディスプレイ２に表示して、ユーザーがその読みを入力し、未知語とその読みとの組を上記単語登録領域７４に登録するまでの一連の処理を行うためのプログラムである。
【００２９】
読み選択及び学習プログラムは、同様に、読み上げ文書について形態素解析を行う際に、複数読み単語を見つけた時にその単語に複数読みマークを付与（複数読み語であることを示すためのデータであって、文章の一部としては読まれないデータ）しておき、文書読み上げ中にその単語を検索して液晶ディスプレイ２に表示して、ユーザーが複数の読みから優先順位第１位としての読みを選択し、その単語の読みの組を上記単語学習領域７５に登録するまでの一連の処理を行うためのプログラムである。
【００３０】
次に、上記文章読み上げ装置１の読み上げ処理について、読み上げ処理を図４のフローチャートを参照して説明する。
【００３１】
文章の読み上げ処理は、文章読み上げ装置１の液晶ディスプレイ２の表示画面に応じて、例えば読み上げ開始を入力するために操作キー３を操作することで開始され、以下のステップに従って実施される。
【００３２】
即ち、ステップＳ１０１において、ＣＰＵ１０は書籍データから、実際には液晶ディスプレイ２に表示された複数の文章の中から次に読み上げる１文章分のデータを切り出す（抽出する）。
【００３３】
切り出し文の一例として「今日は北京旅行の日です。」とする。
【００３４】
ステップＳ１０２において、音声合成辞書データ領域６５の音声合成辞書データを参照して１文章のデータを単語単位に分割して、各単語の読みとアクセント情報を取得する形態素解析を行う。
【００３５】
ここで、複数読みがある単語に対しては、既にユーザーによりどの読みが適切か選択され、その選択された読みが単語学習領域７５に登録されている場合はその読みを利用し、上記登録がない場合はあとで読みの選択ができるように所定の複数読みマークを付す。
【００３６】
また、この形態素解析において解析できない単語（以下未知語という）に対しては、あとで該単語の読みを取得するために複数読みマークとは異なる所定の未知語マークを付しておく。
【００３７】
上記例の解析結果は次のようになる。
【００３８】
単語分割として今日／は／北京／旅行／の／日／です／。
読みとしてキョー／ワ／ペキン／リョコー／ノ／ヒ／デス
アクセント情報として２＊１０＊０＊
（なお、数字はその位置でアクセントが落ちる。「０」は平板なアクセント、「＊」はアクセント位置の情報を持たない。）
【００３９】
続いてステップＳ１０３においてアクセント処理用データ領域６７のアクセント処理用データを参照し単語単位の読み、アクセント情報を基にして読み上げ用の音声パラメータ文字列を作成する。
【００４０】
上記例では、次のようになる。
アクセントと処理文字列キョ’ーワ／ペキンリョ’コーノ／ヒデ’ス｜（「／」は読み上げ単位の区切り位置、「｜」はポーズ位置、「’」はアクセントの落ちる位置）
【００４１】
ステップＳ１０４では、上記作成された音声パラメータ文字列を順に先頭から音声出力しながら読み上げていく。
【００４２】
この時上記複数読みマークの付された単語が存在する時は、液晶ディスプレイ２に複数の読みを表示してユーザーに優先順位１のものを操作キー３によって選択してもらい、この優先順位で読みを単語学習領域７５に記憶する。
【００４３】
又、未知語マークのある単語については、同様に液晶ディスプレイ２に表示してユーザーに読みを操作キー３によって入力してもらい、その読みを単語登録領域７４に登録する。なお、以後はこの登録された読みで文章の読み上げを行う。即ち、未知語に対して未知語マークを付与しその後、未知語マークを検出して、その検出された未知語マークを付与された単語の読みをユーザーが入力する状態に移行している。
【００４４】
ステップＳ１０５において、音声パラメータ文字列を基にして、音声合成音素データ領域６６のデータを参照して音素同士の結合・変形等を行い、出力音声データを作成する。
【００４５】
ステップＳ１０６において、出力音声データをアナログ変換してスピーカ５から音声出力する。
【００４６】
図５は、読み選択及び未知語読み取得処理のフローチャートである。
ステップＳ２０１においては、図４におけるステップＳ１０３で作成された音声パラメータ文字列を単語毎に検索し、複数読みマークの付された単語があるか否かを判定し（Ｓ２０２）、あると判定された時（ステップＳ２０２，ＹＥＳ）ステップＳ２０４に進む。
【００４７】
ステップＳ２０４では読み上げを一次停止し、当該単語の読み選択一覧を液晶ディスプレイ２表示する。
【００４８】
例えば、「大勢」という「たいせい」「おおぜい」の２通りの読みのある単語について、まだどちらの読みにするのか学習（登録）していない場合は読み上げを一旦停止し、例えば、図６に示す複数読みの選択画面で読み選択一覧を表示する。
【００４９】
次にステップＳ２０５において、ユーザーが読みを選択したかを判定し、選択された場合（ステップＳ２０５、ＹＥＳ）、ステップＳ２０６に進み、その読み単語学習領域７５に記憶し、読み上げを再開し（Ｓ２０９）、読み上げ処理を進める（Ｓ２１０）。なお、ステップＳ２０５では、ユーザーが読みを選択するまでは、次のステップＳ２０６には進まない。
【００５０】
ステップＳ２０２で複数読みマークが付された単語がない場合でも（Ｓ２０２，ＮＯ）、ステップＳ２０３で未知語マークの付された単語があると判定された時は（ステップＳ２０３，ＹＥＳ）、ステップＳ２０７に進み、読み上げを一次停止し、液晶ディスプレイ２に未知語の読みを入力する入力画面を表示する。例えば、未知語マークの付された「朝青龍」という単語の読みについて、まだ登録されていない場合は読み上げを一旦停止し、図７に示す入力画面を表示して読みの入力を促す。
【００５１】
なお、ステップＳ２０３において、未知語マークの付された単語がないと判定されたとき（ステップＳ２０３，ＮＯ）はそのまま読み上げ処理を進める（ステップ２１０）。
【００５２】
ステップＳ２０８において、ユーザーにより未知語の読みが入力された場合は（ステップＳ２０８、ＹＥＳ）、ステップＳ２０９に進み、その読みを登録して読み上げを再開し、その読み上げ処理を進める（Ｓ２１０）。なお、未知語の読みが入力されなかった場合は（ステップＳ２０８、ＮＯ）、ユーザーが読みを入力するまで次のステップＳ２０９には進まない。
【００５３】
このようにステップＳ２０１〜Ｓ２１０までの処理を順次行い、書籍データが最終まで読み上げられたと判定されたとき（Ｓ２１１、ＹＥＳ）、処理は終了する。
【００５４】
以上の処理は、文章読み上げ装置１のＣＰＵ１０がＲＯＭ６に格納したプログラムの指示及びデータに基づき、入力文章を解析し、解析に従って音声を合成して文章を読み上げる手順で行うが、その際に、本発明の実施の形態では、ＣＰＵ１０に読み上げ文章中の解析不能な未知語を抽出する手順と、抽出された未知語を表示手段に表示する手順と、表示された未知語の読みを入力する手順と、入力された未知語をその読みと共に記憶手段に登録する手順と、上記未知語を登録された読みに従って読み上げる手順とを実行させ、更に、読み上げ文章の形態素解析において解析不能の単語に未知語マークを付与する手順と、未知語に付与された未知語マークを検索する未知語抽出を行う手順を実行させることを文章読み上げ装置用プログラムをも提供するものである。
【００５５】
また、本プログラムは、従来周知のフレキシブルディスク、ＣＤＲＯＭ、ＤＶＤＲＯＭ、ＭＯ、ＨＤＤ等の任意のコンピュータ読み取り可能な記録媒体に記録して、或いはインターネット等のネットワーク網を介して提供することができる。
【００５６】
上述した実施の形態においては合成音声を発生するためのスピーカ５を備える１つの装置において、図４、図５に示すプログラムを全て処理しているが、各プログラムやプログラムの一部を別々の装置で処理して、最終的にスピーカ５から合成音声を生じても良い。例えば第１のコンピュータがステップＳ１０１〜Ｓ１０３を処理して、インターネットを介して音声パラメータ文字列のデータを第２のコンピュータに出力して、第２のコンピュータがステップＳ１０４〜Ｓ１０６を処理する。更に、合成音声を生じさせる装置は、文章読み上げの専用装置に限らず、読み上げ以外の他の機能を有するＰＡＤ、パソコン、携帯電話、カーナビゲーション端末、ＴＶ等であっても良い。尚、読み上げられる文章は、書籍に限らず、手紙（電子メールを含む）、道案内、宣伝、並びに歌詞などであっても良い。また、ＲＡＭ７に記憶されたデータは、装置の電源が落されると消失するが、装置の電源が落されても、継続して記憶されても良い。そして図４に示すステップＳ１０１〜Ｓ１０６については、一文章毎に処理する必要はなく、複数の文章毎について行っても良い。
【００５７】
【発明の効果】
本願の請求項１に記載の発明によれば、解析できない未知語があると文章読み上げ処理中に、未知語についてその読みの入力画面を表示し、ユーザーが読みを入力することでその読みが登録され、ユーザーにとって自然な手順で未知語についても正しい読みで読み上げることができ、読み上げを極めて自然に行うことができる。
【００５８】
本願の請求項２に記載の発明によれば、前記請求項１に記載の発明の効果に加え、読み上げ文章の解析時に未知語に予めマークを付与しておくことで読み上げ中に未知語の抽出が迅速に行われ、読み上げ中の処理がスムースに行われる。
【００５９】
本願の請求項３に記載の発明によれば、コンピュータに各手順を実行させ、未知語の読みの入力状態に移行して、入力された読みを用いて様々な語の読み上げのためのデータを生じることができる。
【００６０】
本願の請求項４に記載の発明によれば、コンピュータに各手順を実行させ、未知語の単語に未知語マークを付与しており、その未知語マークを付与された単語に関する後の処理を迅速に行うことができる。
【００６１】
本願の請求項５に記載の発明によれば、請求項４に記載の手順に加えて、更に各手順をコンピュータに実行させ、付与された未知語マークが検出されて、単語の読みの入力状態となるので、迅速に入力を行うことができる。
【００６２】
本願の請求項６に記載の発明によれば、請求項３乃至５のいずれかに記載の本発明のプログラムを記録媒体に記録したことで本プログラムを容易に提供することができる。
【図面の簡単な説明】
【図１】本発明の実施の形態である文章読み上げ装置の正面図である。
【図２】本発明の実施の形態である文章読み上げ装置の概略構成を示すブロック図である。
【図３】本発明の実施の形態である文章読み上げ装置の読み上げソフトウェアのソフトウェア構成を示すブロック図である。
【図４】読み上げ処理のフローチャートである。
【図５】読み選択及び未知語読み取得処理のフローチャートである。
【図６】複数読み一覧表示した文章読み上げ装置の図である。
【図７】未知語の読み入力画面時の文章読み上げ装置の図である。
【符号の説明】
１・・・文章読み上げ装置、２・・・液晶ディスプレイ、３・・・操作キー、４・・・タッチパネル、５・・・スピーカー、６・・・ＲＯＭ、７・・・ＲＡＭ、８・・・入力装置、９・・・表示装置、１０・・・ＣＰＵ。

Claims

文章を解析し、該解析に従って音声を合成して読み上げる文章読み上げ装置において、
読み上げ文章中の解析不能な未知語を抽出する手段と、
抽出された未知語を表示する手段と、
表示された未知語の読みを入力する手段と
抽出された未知語を入力された読みと共に登録する手段と、
を備え、
前記未知語を登録された読みに従って読み上げることを特徴とする文章読み上げ装置。
請求項１に記載された文章読み上げ装置において、
読み上げ文章の形態素解析において解析不能の単語に未知語マークを付与する手段を備え、かつ、
前記未知語を抽出する手段は、未知語に付与された未知語マークを検索して抽出を行うことを特徴とする文章読み上げ装置。
文章を解析し、該解析に従って音声を合成して読み上げるためにコンピュータに、
読み上げ文章中の解析不能な未知語を抽出する手順と、
抽出された未知語を表示手段に表示する手順と、
表示された未知語の読みを入力状態に移行する手順と
抽出された未知語を入力された読みと共に記憶手段に登録する手順と、
前記未知語を登録された読みに従って読み上げるためのデータを生じる手順とを実行させることを特徴とする文章読み上げ装置用プログラム。
文章を解析し、該解析に従って音声を合成して読み上げるためにコンピュータに、
読み上げ文章中の解析不能な未知語を抽出する手順と、抽出された未知語に対して、未知語マークを付与する手順とを実行させることを特徴とする読み上げのためのプログラム。
請求項４に記載された読み上げるためのプログラムにおいて、
前記未知語マークを検出する手順と、
前記未知語マークを付与された単語に読みを入力するための状態に移行する手順とを実行させることを特徴とする読み上げのためのプログラム。
請求項３乃至５のいずれかに記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。