JP2004171174A - 文章読み上げ装置、読み上げのためのプログラム及び記録媒体 - Google Patents
文章読み上げ装置、読み上げのためのプログラム及び記録媒体 Download PDFInfo
- Publication number
- JP2004171174A JP2004171174A JP2002334694A JP2002334694A JP2004171174A JP 2004171174 A JP2004171174 A JP 2004171174A JP 2002334694 A JP2002334694 A JP 2002334694A JP 2002334694 A JP2002334694 A JP 2002334694A JP 2004171174 A JP2004171174 A JP 2004171174A
- Authority
- JP
- Japan
- Prior art keywords
- reading
- unknown word
- text
- word
- unknown
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【課題】文章読み上げ装置において、登録されていない未知語について、ユーザーがその未知語の読みを入力すること、その読みに従って文章を読み上げるようにする。
【解決手段】文章読み上げ装置1は、読み上げ文章中に解析不能な未知語があったときは、その単語を抽出し、抽出された未知語を図示のように文章表示か画面に表示する。表示された未知語について読みが入力されると、入力された未知語とその読みが登録され、以後はその読みによって読み上げがなされる。
【選択図】 図7
【解決手段】文章読み上げ装置1は、読み上げ文章中に解析不能な未知語があったときは、その単語を抽出し、抽出された未知語を図示のように文章表示か画面に表示する。表示された未知語について読みが入力されると、入力された未知語とその読みが登録され、以後はその読みによって読み上げがなされる。
【選択図】 図7
Description
【0001】
【発明が属する技術分野】
本発明は、文章を音声合成技術を用いて合成音声として出力する文章読み上げ装置、読み上げのためのプログラム及び同プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】
文章を音声合成技術を用いて音声として出力することによって文章を読み上げる機能(文章読み上げ装置)が携帯情報端末(PDA)に組み込まれるようになってきている。このような装置において、読み上げる書籍(新聞等を含む)の文章の中に読み方が複数ある単語または辞書に登録されておらず読み方の分からない単語がある場合がある。
【0003】
このような場合、例えば特許文献1に開示された文書読上装置では、文書読み上げ中、読み上げ対象文書中から複数読み単語を検出し、その複数の読みを暫定学習データファイルから読み出して表示装置に表示し、その中から読み候補を指定することで、その読みを優先順位1位の読み候補に更新し、以後の読み上げを更新された読みにより行うようにしている。
【0004】
このように、前記従来公知のものは、複数読みを暫定学習データファイルに記述されたその読みの優先順位の1番高いものを採用しており、暫定学習ファイルにないものについては単語辞書に記述されている読みの第1優先順位の読みに従い読み上げるようになっている。
【0005】
【特許文献1】
特開平6−332899号公報(要約、段落(0017)、段落(0022))
【0006】
【発明が解決しようとする課題】
前記従来の文書読上装置では複数読み単語については、選択した読みでその後も読み上げを行うことができる。しかし、この文書読上装置では単語辞書にない未知語については対応できない。
【0007】
そこで、本発明は前記の問題点を解決するためになされたものであって、その第1の目的は文章の読み上げ中に、未知語についてユーザーがその未知語の読みを入力でき、その後は入力した読みで文章を読み上げることができるようにすることである。
【0008】
第2の目的は、未知語に予め未知語マークを付与しておくことにより、読み上げ中に未知語の抽出を容易かつ迅速に行い、未知語の入力処理を円滑に行えるようにすることである。
【0009】
【課題を解決するための手段】
請求項1の発明は、文章を解析し、該解析に従って音声を合成して読み上げる文章読み上げ装置において、読み上げ文章中の解析不能な未知語を抽出する手段と、抽出された未知語を表示する手段と、表示された未知語の読みを入力する手段と、入力された未知語をその読みと共に登録する手段とを備えている。この請求項1に記載の文章読み上げ装置では、前記未知語が登録された読みに従って読み上げられる。
【0010】
請求項2の発明は、請求項1に記載された文章読み上げ装置において、読み上げ文章の形態素解析において解析不能の単語に未知語マークを付与する手段を備えている。この請求項2に記載の文章読み上げ装置では、前記未知語を抽出する手段が未知語に付与された未知語マークを検索して抽出を行う。
【0011】
請求項3の発明は、文章を解析し、該解析に従って音声を合成して読み上げるためにコンピュータに、読み上げ文章中の解析不能な未知語を抽出する手順と、抽出された未知語を表示手段に表示する手順と、表示された未知語の読みを入力状態に移行する手順と、抽出された未知語を入力された読みと共に記憶手段に登録する手順と、前記未知語を登録された読みに従って読み上げるためのデータを生じる手順とを実行させることを特徴とする文章読み上げ装置用プログラムである。この請求項3に記載の発明によれば、上述の手順がコンピュータにより実行される。
【0012】
請求項4の発明は、文章を解析し、該解析に従って音声を合成して読み上げるためにコンピュータに読み上げ文章中の解析不能な未知語を抽出する手順と、抽出された未知語に対して、未知語マークを付与する手順とを実行させることを特徴とする文章読み上げ装置用プログラムである。この請求項4に記載の発明によれば、上述の手順がコンピュータにより実行される。
【0013】
請求項5に記載の発明は、請求項4に記載の手順に加えて、前記未知語マークを検出する手順と、前記未知語マークを付与された単語に読みを入力するための状態に移行する手順とをコンピュータに実行させるものである。この請求項5に記載の発明によれば、上述の手順がコンピュータにより実行される。
【0014】
請求項6の発明は、請求項3乃至5のいずれかに記載のプログラムを記録したコンピュータ読み取り可能な記録媒体である。この請求項5の発明によれば、請求項3又は4に記載の発明と同様の作用を奏する。
【0015】
【発明の実施の形態】
本発明の実施の形態に係る文章読み上げ装置について図面を参照しながら説明する。
【0016】
図1は本発明の実施の形態に係る携帯端末装置による文章読み上げ装置の正面図である。文章読み上げ装置1は、図示のように、文字、画像が表示される液晶ディスプレイ2と、ユーザが各種キー操作を行うための操作キー3と、ユーザがスタイラス等を利用して入力するために液晶ディスプレイ2の表面に貼付されたタッチパネル4、スピーカ5、並びにイヤフォン(図示略)への音声出力のための出力端子部(図示略)を備えている。
【0017】
次に上記文章読み上げ装置1の概略構成を示すブロック図である図2を参照して、上記装置の構成を説明する。
【0018】
文章読み上げ装置1は、CPU10と、ROM6と、RAM7と、表示装置である上記液晶ディスプレイ2を含む表示装置9と、上記操作キー3及びタッチパネル4を含む入力装置8と、上記スピーカ5や出力端子部を含む音声出力装置5とを備えている。
【0019】
ROM6には、上記文章読み上げ装置1のOS(制御プログラム)を記憶した領域(装置のプログラム領域)61,上記装置1の電子ブックとして機能させるための電子ブックリーダプログラムを記憶した領域(電子ブックリーダプログラム領域)62、文章読み上げ処理を実行させるための音声読み上げプログラムを記憶した領域(音声読み上げプログラム領域)63等各種のプログラム記憶領域が設けられている。さらに、音声合成辞書データを記憶した領域(音声合成辞書データ領域)65、音声合成音素データを記憶した領域(音声合成音素データ領域)66、アクセント処理用辞書データを記憶した領域(アクセント処理用データ領域)67等、読み上げ文章の形態素解析及び音声合成に必要なデータを記憶するためのデータ記憶領域が設けられている。
【0020】
RAM7には、音声合成のためのデータ処理の中間結果を記憶するためのワーク領域71、ユーザが使用する各種データを記憶するためのユーザデータ領域72、文章読み上げ装置1で読み上げられる書籍データを記憶するための書籍データ領域73が設けられている。さらに解析できない単語(未知語)に関する情報を登録(記憶)するための領域として単語登録領域74、及び、複数読みのある単語についてその読みを選択した場合その選択結果を記憶するための単語学習領域75が設けられている。尚、上記データ領域73は、文章読み上げ装置1外から取り込まれた書籍データも記憶されるように構成されている。
【0021】
CPU10は、本実施の形態に係る文章読み上げ装置1においては、ROM6に格納されている各種プログラムに基づいて、入力装置8、液晶ディスプレイ2、スピーカ5等について制御を行う。
【0022】
CPU10は書籍データから、ROM6の電子ブックリーダプログラム及び音声読み上げ用プログラムを使って音声合成データを作成し、このデータをスピーカ5に供給して合成音を出力する。合成音をスピーカ5に代えてイヤフォンから出力するようにしてもよいことは勿論である。
【0023】
次に、実施の形態に係る文章読み上げ装置1のソフトウェアの構成を説明する。
【0024】
図3は文章読み上げ装置1の文章読み上げ処理に関連する各プログラムの関連を示すブロック図である。
【0025】
図中、電子ブックリーダプログラムは、携帯情報端末(PDA)において、頁送り、文字組み、段組、頁サイズの変更、フォント設定、ルビ表示等の処理を実行させるためのプログラムである。
【0026】
音声読み上げプログラムは書籍データ(テキストデータ)を合成音声で読み上げるためのプログラムで、上記電子ブックリーダプログラムに連動して動作するプログラムである。この該音声読み上げプログラムは、更に音声パラメータ変換プログラム、音声出力プログラム及びルビ情報切り出し及び登録プログラムを備えている。
【0027】
音声パラメータ変換プログラムは読み上げ用文章から、音声合成単語辞書及びアクセント処理用辞書データを使って読み上げ用音声パラメータ文字列を作成する。音声出力プログラムは、上記音声パラメータ変換プログラムによって作成された読み上げ用音声パラメータ文字列に基づいて音声合成音素データを使って出力音声データを作成する。
【0028】
未知語読み取得及び登録プログラムは、読み上げ文書について形態素解析を行う際に、辞書にないつまり解析できない単語(未知語)を見つけた時にその単語に未知語マークを付与(未知語であることを示すためのデータであって、文章の一部としては読まれないデータ)しておき、文書読み上げ中にその単語を検索して液晶ディスプレイ2に表示して、ユーザーがその読みを入力し、未知語とその読みとの組を上記単語登録領域74に登録するまでの一連の処理を行うためのプログラムである。
【0029】
読み選択及び学習プログラムは、同様に、読み上げ文書について形態素解析を行う際に、複数読み単語を見つけた時にその単語に複数読みマークを付与(複数読み語であることを示すためのデータであって、文章の一部としては読まれないデータ)しておき、文書読み上げ中にその単語を検索して液晶ディスプレイ2に表示して、ユーザーが複数の読みから優先順位第1位としての読みを選択し、その単語の読みの組を上記単語学習領域75に登録するまでの一連の処理を行うためのプログラムである。
【0030】
次に、上記文章読み上げ装置1の読み上げ処理について、読み上げ処理を図4のフローチャートを参照して説明する。
【0031】
文章の読み上げ処理は、文章読み上げ装置1の液晶ディスプレイ2の表示画面に応じて、例えば読み上げ開始を入力するために操作キー3を操作することで開始され、以下のステップに従って実施される。
【0032】
即ち、ステップS101において、CPU10は書籍データから、実際には液晶ディスプレイ2に表示された複数の文章の中から次に読み上げる1文章分のデータを切り出す(抽出する)。
【0033】
切り出し文の一例として「今日は北京旅行の日です。」とする。
【0034】
ステップS102において、音声合成辞書データ領域65の音声合成辞書データを参照して1文章のデータを単語単位に分割して、各単語の読みとアクセント情報を取得する形態素解析を行う。
【0035】
ここで、複数読みがある単語に対しては、既にユーザーによりどの読みが適切か選択され、その選択された読みが単語学習領域75に登録されている場合はその読みを利用し、上記登録がない場合はあとで読みの選択ができるように所定の複数読みマークを付す。
【0036】
また、この形態素解析において解析できない単語(以下未知語という)に対しては、あとで該単語の読みを取得するために複数読みマークとは異なる所定の未知語マークを付しておく。
【0037】
上記例の解析結果は次のようになる。
【0038】
単語分割として 今日/は /北京 /旅行/の/日/です/。
読みとして キョー / ワ /ペキン /リョコー/ノ /ヒ/デス
アクセント情報として 2 * 1 0 * 0 *
(なお、数字はその位置でアクセントが落ちる。「0」は平板なアクセント、「*」はアクセント位置の情報を持たない。)
【0039】
続いてステップS103においてアクセント処理用データ領域67のアクセント処理用データを参照し単語単位の読み、アクセント情報を基にして読み上げ用の音声パラメータ文字列を作成する。
【0040】
上記例では、次のようになる。
アクセントと処理文字列 キョ’ーワ/ペキンリョ’コーノ/ヒデ’ス| (「/」は読み上げ単位の区切り位置、「|」はポーズ位置、「’」はアクセントの落ちる位置)
【0041】
ステップS104では、上記作成された音声パラメータ文字列を順に先頭から音声出力しながら読み上げていく。
【0042】
この時上記複数読みマークの付された単語が存在する時は、液晶ディスプレイ2に複数の読みを表示してユーザーに優先順位1のものを操作キー3によって選択してもらい、この優先順位で読みを単語学習領域75に記憶する。
【0043】
又、未知語マークのある単語については、同様に液晶ディスプレイ2に表示してユーザーに読みを操作キー3によって入力してもらい、その読みを単語登録領域74に登録する。なお、以後はこの登録された読みで文章の読み上げを行う。即ち、未知語に対して未知語マークを付与しその後、未知語マークを検出して、その検出された未知語マークを付与された単語の読みをユーザーが入力する状態に移行している。
【0044】
ステップS105において、音声パラメータ文字列を基にして、音声合成音素データ領域66のデータを参照して音素同士の結合・変形等を行い、出力音声データを作成する。
【0045】
ステップS106において、出力音声データをアナログ変換してスピーカ5から音声出力する。
【0046】
図5は、読み選択及び未知語読み取得処理のフローチャートである。
ステップS201においては、図4におけるステップS103で作成された音声パラメータ文字列を単語毎に検索し、複数読みマークの付された単語があるか否かを判定し(S202)、あると判定された時(ステップS202,YES)ステップS204に進む。
【0047】
ステップS204では読み上げを一次停止し、当該単語の読み選択一覧を液晶ディスプレイ2表示する。
【0048】
例えば、「大勢」という「たいせい」「おおぜい」の2通りの読みのある単語について、まだどちらの読みにするのか学習(登録)していない場合は読み上げを一旦停止し、例えば、図6に示す複数読みの選択画面で読み選択一覧を表示する。
【0049】
次にステップS205において、ユーザーが読みを選択したかを判定し、選択された場合(ステップS205、YES)、ステップS206に進み、その読み単語学習領域75に記憶し、読み上げを再開し(S209)、読み上げ処理を進める(S210)。なお、ステップS205では、ユーザーが読みを選択するまでは、次のステップS206には進まない。
【0050】
ステップS202で複数読みマークが付された単語がない場合でも(S202,NO)、ステップS203で未知語マークの付された単語があると判定された時は(ステップS203,YES)、ステップS207に進み、読み上げを一次停止し、液晶ディスプレイ2に未知語の読みを入力する入力画面を表示する。例えば、未知語マークの付された「朝青龍」という単語の読みについて、まだ登録されていない場合は読み上げを一旦停止し、図7に示す入力画面を表示して読みの入力を促す。
【0051】
なお、ステップS203において、未知語マークの付された単語がないと判定されたとき(ステップS203,NO)はそのまま読み上げ処理を進める(ステップ210)。
【0052】
ステップS208において、ユーザーにより未知語の読みが入力された場合は(ステップS208、YES)、ステップS209に進み、その読みを登録して読み上げを再開し、その読み上げ処理を進める(S210)。なお、未知語の読みが入力されなかった場合は(ステップS208、NO)、ユーザーが読みを入力するまで次のステップS209には進まない。
【0053】
このようにステップS201〜S210までの処理を順次行い、書籍データが最終まで読み上げられたと判定されたとき(S211、YES)、処理は終了する。
【0054】
以上の処理は、文章読み上げ装置1のCPU10がROM6に格納したプログラムの指示及びデータに基づき、入力文章を解析し、解析に従って音声を合成して文章を読み上げる手順で行うが、その際に、本発明の実施の形態では、CPU10に読み上げ文章中の解析不能な未知語を抽出する手順と、抽出された未知語を表示手段に表示する手順と、表示された未知語の読みを入力する手順と、入力された未知語をその読みと共に記憶手段に登録する手順と、上記未知語を登録された読みに従って読み上げる手順とを実行させ、更に、読み上げ文章の形態素解析において解析不能の単語に未知語マークを付与する手順と、未知語に付与された未知語マークを検索する未知語抽出を行う手順を実行させることを文章読み上げ装置用プログラムをも提供するものである。
【0055】
また、本プログラムは、従来周知のフレキシブルディスク、CDROM、DVDROM、MO、HDD等の任意のコンピュータ読み取り可能な記録媒体に記録して、或いはインターネット等のネットワーク網を介して提供することができる。
【0056】
上述した実施の形態においては合成音声を発生するためのスピーカ5を備える1つの装置において、図4、図5に示すプログラムを全て処理しているが、各プログラムやプログラムの一部を別々の装置で処理して、最終的にスピーカ5から合成音声を生じても良い。例えば第1のコンピュータがステップS101〜S103を処理して、インターネットを介して音声パラメータ文字列のデータを第2のコンピュータに出力して、第2のコンピュータがステップS104〜S106を処理する。更に、合成音声を生じさせる装置は、文章読み上げの専用装置に限らず、読み上げ以外の他の機能を有するPAD、パソコン、携帯電話、カーナビゲーション端末、TV等であっても良い。尚、読み上げられる文章は、書籍に限らず、手紙(電子メールを含む)、道案内、宣伝、並びに歌詞などであっても良い。また、RAM7に記憶されたデータは、装置の電源が落されると消失するが、装置の電源が落されても、継続して記憶されても良い。そして図4に示すステップS101〜S106については、一文章毎に処理する必要はなく、複数の文章毎について行っても良い。
【0057】
【発明の効果】
本願の請求項1に記載の発明によれば、解析できない未知語があると文章読み上げ処理中に、未知語についてその読みの入力画面を表示し、ユーザーが読みを入力することでその読みが登録され、ユーザーにとって自然な手順で未知語についても正しい読みで読み上げることができ、読み上げを極めて自然に行うことができる。
【0058】
本願の請求項2に記載の発明によれば、前記請求項1に記載の発明の効果に加え、読み上げ文章の解析時に未知語に予めマークを付与しておくことで読み上げ中に未知語の抽出が迅速に行われ、読み上げ中の処理がスムースに行われる。
【0059】
本願の請求項3に記載の発明によれば、コンピュータに各手順を実行させ、未知語の読みの入力状態に移行して、入力された読みを用いて様々な語の読み上げのためのデータを生じることができる。
【0060】
本願の請求項4に記載の発明によれば、コンピュータに各手順を実行させ、未知語の単語に未知語マークを付与しており、その未知語マークを付与された単語に関する後の処理を迅速に行うことができる。
【0061】
本願の請求項5に記載の発明によれば、請求項4に記載の手順に加えて、更に各手順をコンピュータに実行させ、付与された未知語マークが検出されて、単語の読みの入力状態となるので、迅速に入力を行うことができる。
【0062】
本願の請求項6に記載の発明によれば、請求項3乃至5のいずれかに記載の本発明のプログラムを記録媒体に記録したことで本プログラムを容易に提供することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態である文章読み上げ装置の正面図である。
【図2】本発明の実施の形態である文章読み上げ装置の概略構成を示すブロック図である。
【図3】本発明の実施の形態である文章読み上げ装置の読み上げソフトウェアのソフトウェア構成を示すブロック図である。
【図4】読み上げ処理のフローチャートである。
【図5】読み選択及び未知語読み取得処理のフローチャートである。
【図6】複数読み一覧表示した文章読み上げ装置の図である。
【図7】未知語の読み入力画面時の文章読み上げ装置の図である。
【符号の説明】
1・・・文章読み上げ装置、2・・・液晶ディスプレイ、3・・・操作キー、4・・・タッチパネル、5・・・スピーカー、6・・・ROM、7・・・RAM、8・・・入力装置、9・・・表示装置、10・・・CPU。
【発明が属する技術分野】
本発明は、文章を音声合成技術を用いて合成音声として出力する文章読み上げ装置、読み上げのためのプログラム及び同プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】
文章を音声合成技術を用いて音声として出力することによって文章を読み上げる機能(文章読み上げ装置)が携帯情報端末(PDA)に組み込まれるようになってきている。このような装置において、読み上げる書籍(新聞等を含む)の文章の中に読み方が複数ある単語または辞書に登録されておらず読み方の分からない単語がある場合がある。
【0003】
このような場合、例えば特許文献1に開示された文書読上装置では、文書読み上げ中、読み上げ対象文書中から複数読み単語を検出し、その複数の読みを暫定学習データファイルから読み出して表示装置に表示し、その中から読み候補を指定することで、その読みを優先順位1位の読み候補に更新し、以後の読み上げを更新された読みにより行うようにしている。
【0004】
このように、前記従来公知のものは、複数読みを暫定学習データファイルに記述されたその読みの優先順位の1番高いものを採用しており、暫定学習ファイルにないものについては単語辞書に記述されている読みの第1優先順位の読みに従い読み上げるようになっている。
【0005】
【特許文献1】
特開平6−332899号公報(要約、段落(0017)、段落(0022))
【0006】
【発明が解決しようとする課題】
前記従来の文書読上装置では複数読み単語については、選択した読みでその後も読み上げを行うことができる。しかし、この文書読上装置では単語辞書にない未知語については対応できない。
【0007】
そこで、本発明は前記の問題点を解決するためになされたものであって、その第1の目的は文章の読み上げ中に、未知語についてユーザーがその未知語の読みを入力でき、その後は入力した読みで文章を読み上げることができるようにすることである。
【0008】
第2の目的は、未知語に予め未知語マークを付与しておくことにより、読み上げ中に未知語の抽出を容易かつ迅速に行い、未知語の入力処理を円滑に行えるようにすることである。
【0009】
【課題を解決するための手段】
請求項1の発明は、文章を解析し、該解析に従って音声を合成して読み上げる文章読み上げ装置において、読み上げ文章中の解析不能な未知語を抽出する手段と、抽出された未知語を表示する手段と、表示された未知語の読みを入力する手段と、入力された未知語をその読みと共に登録する手段とを備えている。この請求項1に記載の文章読み上げ装置では、前記未知語が登録された読みに従って読み上げられる。
【0010】
請求項2の発明は、請求項1に記載された文章読み上げ装置において、読み上げ文章の形態素解析において解析不能の単語に未知語マークを付与する手段を備えている。この請求項2に記載の文章読み上げ装置では、前記未知語を抽出する手段が未知語に付与された未知語マークを検索して抽出を行う。
【0011】
請求項3の発明は、文章を解析し、該解析に従って音声を合成して読み上げるためにコンピュータに、読み上げ文章中の解析不能な未知語を抽出する手順と、抽出された未知語を表示手段に表示する手順と、表示された未知語の読みを入力状態に移行する手順と、抽出された未知語を入力された読みと共に記憶手段に登録する手順と、前記未知語を登録された読みに従って読み上げるためのデータを生じる手順とを実行させることを特徴とする文章読み上げ装置用プログラムである。この請求項3に記載の発明によれば、上述の手順がコンピュータにより実行される。
【0012】
請求項4の発明は、文章を解析し、該解析に従って音声を合成して読み上げるためにコンピュータに読み上げ文章中の解析不能な未知語を抽出する手順と、抽出された未知語に対して、未知語マークを付与する手順とを実行させることを特徴とする文章読み上げ装置用プログラムである。この請求項4に記載の発明によれば、上述の手順がコンピュータにより実行される。
【0013】
請求項5に記載の発明は、請求項4に記載の手順に加えて、前記未知語マークを検出する手順と、前記未知語マークを付与された単語に読みを入力するための状態に移行する手順とをコンピュータに実行させるものである。この請求項5に記載の発明によれば、上述の手順がコンピュータにより実行される。
【0014】
請求項6の発明は、請求項3乃至5のいずれかに記載のプログラムを記録したコンピュータ読み取り可能な記録媒体である。この請求項5の発明によれば、請求項3又は4に記載の発明と同様の作用を奏する。
【0015】
【発明の実施の形態】
本発明の実施の形態に係る文章読み上げ装置について図面を参照しながら説明する。
【0016】
図1は本発明の実施の形態に係る携帯端末装置による文章読み上げ装置の正面図である。文章読み上げ装置1は、図示のように、文字、画像が表示される液晶ディスプレイ2と、ユーザが各種キー操作を行うための操作キー3と、ユーザがスタイラス等を利用して入力するために液晶ディスプレイ2の表面に貼付されたタッチパネル4、スピーカ5、並びにイヤフォン(図示略)への音声出力のための出力端子部(図示略)を備えている。
【0017】
次に上記文章読み上げ装置1の概略構成を示すブロック図である図2を参照して、上記装置の構成を説明する。
【0018】
文章読み上げ装置1は、CPU10と、ROM6と、RAM7と、表示装置である上記液晶ディスプレイ2を含む表示装置9と、上記操作キー3及びタッチパネル4を含む入力装置8と、上記スピーカ5や出力端子部を含む音声出力装置5とを備えている。
【0019】
ROM6には、上記文章読み上げ装置1のOS(制御プログラム)を記憶した領域(装置のプログラム領域)61,上記装置1の電子ブックとして機能させるための電子ブックリーダプログラムを記憶した領域(電子ブックリーダプログラム領域)62、文章読み上げ処理を実行させるための音声読み上げプログラムを記憶した領域(音声読み上げプログラム領域)63等各種のプログラム記憶領域が設けられている。さらに、音声合成辞書データを記憶した領域(音声合成辞書データ領域)65、音声合成音素データを記憶した領域(音声合成音素データ領域)66、アクセント処理用辞書データを記憶した領域(アクセント処理用データ領域)67等、読み上げ文章の形態素解析及び音声合成に必要なデータを記憶するためのデータ記憶領域が設けられている。
【0020】
RAM7には、音声合成のためのデータ処理の中間結果を記憶するためのワーク領域71、ユーザが使用する各種データを記憶するためのユーザデータ領域72、文章読み上げ装置1で読み上げられる書籍データを記憶するための書籍データ領域73が設けられている。さらに解析できない単語(未知語)に関する情報を登録(記憶)するための領域として単語登録領域74、及び、複数読みのある単語についてその読みを選択した場合その選択結果を記憶するための単語学習領域75が設けられている。尚、上記データ領域73は、文章読み上げ装置1外から取り込まれた書籍データも記憶されるように構成されている。
【0021】
CPU10は、本実施の形態に係る文章読み上げ装置1においては、ROM6に格納されている各種プログラムに基づいて、入力装置8、液晶ディスプレイ2、スピーカ5等について制御を行う。
【0022】
CPU10は書籍データから、ROM6の電子ブックリーダプログラム及び音声読み上げ用プログラムを使って音声合成データを作成し、このデータをスピーカ5に供給して合成音を出力する。合成音をスピーカ5に代えてイヤフォンから出力するようにしてもよいことは勿論である。
【0023】
次に、実施の形態に係る文章読み上げ装置1のソフトウェアの構成を説明する。
【0024】
図3は文章読み上げ装置1の文章読み上げ処理に関連する各プログラムの関連を示すブロック図である。
【0025】
図中、電子ブックリーダプログラムは、携帯情報端末(PDA)において、頁送り、文字組み、段組、頁サイズの変更、フォント設定、ルビ表示等の処理を実行させるためのプログラムである。
【0026】
音声読み上げプログラムは書籍データ(テキストデータ)を合成音声で読み上げるためのプログラムで、上記電子ブックリーダプログラムに連動して動作するプログラムである。この該音声読み上げプログラムは、更に音声パラメータ変換プログラム、音声出力プログラム及びルビ情報切り出し及び登録プログラムを備えている。
【0027】
音声パラメータ変換プログラムは読み上げ用文章から、音声合成単語辞書及びアクセント処理用辞書データを使って読み上げ用音声パラメータ文字列を作成する。音声出力プログラムは、上記音声パラメータ変換プログラムによって作成された読み上げ用音声パラメータ文字列に基づいて音声合成音素データを使って出力音声データを作成する。
【0028】
未知語読み取得及び登録プログラムは、読み上げ文書について形態素解析を行う際に、辞書にないつまり解析できない単語(未知語)を見つけた時にその単語に未知語マークを付与(未知語であることを示すためのデータであって、文章の一部としては読まれないデータ)しておき、文書読み上げ中にその単語を検索して液晶ディスプレイ2に表示して、ユーザーがその読みを入力し、未知語とその読みとの組を上記単語登録領域74に登録するまでの一連の処理を行うためのプログラムである。
【0029】
読み選択及び学習プログラムは、同様に、読み上げ文書について形態素解析を行う際に、複数読み単語を見つけた時にその単語に複数読みマークを付与(複数読み語であることを示すためのデータであって、文章の一部としては読まれないデータ)しておき、文書読み上げ中にその単語を検索して液晶ディスプレイ2に表示して、ユーザーが複数の読みから優先順位第1位としての読みを選択し、その単語の読みの組を上記単語学習領域75に登録するまでの一連の処理を行うためのプログラムである。
【0030】
次に、上記文章読み上げ装置1の読み上げ処理について、読み上げ処理を図4のフローチャートを参照して説明する。
【0031】
文章の読み上げ処理は、文章読み上げ装置1の液晶ディスプレイ2の表示画面に応じて、例えば読み上げ開始を入力するために操作キー3を操作することで開始され、以下のステップに従って実施される。
【0032】
即ち、ステップS101において、CPU10は書籍データから、実際には液晶ディスプレイ2に表示された複数の文章の中から次に読み上げる1文章分のデータを切り出す(抽出する)。
【0033】
切り出し文の一例として「今日は北京旅行の日です。」とする。
【0034】
ステップS102において、音声合成辞書データ領域65の音声合成辞書データを参照して1文章のデータを単語単位に分割して、各単語の読みとアクセント情報を取得する形態素解析を行う。
【0035】
ここで、複数読みがある単語に対しては、既にユーザーによりどの読みが適切か選択され、その選択された読みが単語学習領域75に登録されている場合はその読みを利用し、上記登録がない場合はあとで読みの選択ができるように所定の複数読みマークを付す。
【0036】
また、この形態素解析において解析できない単語(以下未知語という)に対しては、あとで該単語の読みを取得するために複数読みマークとは異なる所定の未知語マークを付しておく。
【0037】
上記例の解析結果は次のようになる。
【0038】
単語分割として 今日/は /北京 /旅行/の/日/です/。
読みとして キョー / ワ /ペキン /リョコー/ノ /ヒ/デス
アクセント情報として 2 * 1 0 * 0 *
(なお、数字はその位置でアクセントが落ちる。「0」は平板なアクセント、「*」はアクセント位置の情報を持たない。)
【0039】
続いてステップS103においてアクセント処理用データ領域67のアクセント処理用データを参照し単語単位の読み、アクセント情報を基にして読み上げ用の音声パラメータ文字列を作成する。
【0040】
上記例では、次のようになる。
アクセントと処理文字列 キョ’ーワ/ペキンリョ’コーノ/ヒデ’ス| (「/」は読み上げ単位の区切り位置、「|」はポーズ位置、「’」はアクセントの落ちる位置)
【0041】
ステップS104では、上記作成された音声パラメータ文字列を順に先頭から音声出力しながら読み上げていく。
【0042】
この時上記複数読みマークの付された単語が存在する時は、液晶ディスプレイ2に複数の読みを表示してユーザーに優先順位1のものを操作キー3によって選択してもらい、この優先順位で読みを単語学習領域75に記憶する。
【0043】
又、未知語マークのある単語については、同様に液晶ディスプレイ2に表示してユーザーに読みを操作キー3によって入力してもらい、その読みを単語登録領域74に登録する。なお、以後はこの登録された読みで文章の読み上げを行う。即ち、未知語に対して未知語マークを付与しその後、未知語マークを検出して、その検出された未知語マークを付与された単語の読みをユーザーが入力する状態に移行している。
【0044】
ステップS105において、音声パラメータ文字列を基にして、音声合成音素データ領域66のデータを参照して音素同士の結合・変形等を行い、出力音声データを作成する。
【0045】
ステップS106において、出力音声データをアナログ変換してスピーカ5から音声出力する。
【0046】
図5は、読み選択及び未知語読み取得処理のフローチャートである。
ステップS201においては、図4におけるステップS103で作成された音声パラメータ文字列を単語毎に検索し、複数読みマークの付された単語があるか否かを判定し(S202)、あると判定された時(ステップS202,YES)ステップS204に進む。
【0047】
ステップS204では読み上げを一次停止し、当該単語の読み選択一覧を液晶ディスプレイ2表示する。
【0048】
例えば、「大勢」という「たいせい」「おおぜい」の2通りの読みのある単語について、まだどちらの読みにするのか学習(登録)していない場合は読み上げを一旦停止し、例えば、図6に示す複数読みの選択画面で読み選択一覧を表示する。
【0049】
次にステップS205において、ユーザーが読みを選択したかを判定し、選択された場合(ステップS205、YES)、ステップS206に進み、その読み単語学習領域75に記憶し、読み上げを再開し(S209)、読み上げ処理を進める(S210)。なお、ステップS205では、ユーザーが読みを選択するまでは、次のステップS206には進まない。
【0050】
ステップS202で複数読みマークが付された単語がない場合でも(S202,NO)、ステップS203で未知語マークの付された単語があると判定された時は(ステップS203,YES)、ステップS207に進み、読み上げを一次停止し、液晶ディスプレイ2に未知語の読みを入力する入力画面を表示する。例えば、未知語マークの付された「朝青龍」という単語の読みについて、まだ登録されていない場合は読み上げを一旦停止し、図7に示す入力画面を表示して読みの入力を促す。
【0051】
なお、ステップS203において、未知語マークの付された単語がないと判定されたとき(ステップS203,NO)はそのまま読み上げ処理を進める(ステップ210)。
【0052】
ステップS208において、ユーザーにより未知語の読みが入力された場合は(ステップS208、YES)、ステップS209に進み、その読みを登録して読み上げを再開し、その読み上げ処理を進める(S210)。なお、未知語の読みが入力されなかった場合は(ステップS208、NO)、ユーザーが読みを入力するまで次のステップS209には進まない。
【0053】
このようにステップS201〜S210までの処理を順次行い、書籍データが最終まで読み上げられたと判定されたとき(S211、YES)、処理は終了する。
【0054】
以上の処理は、文章読み上げ装置1のCPU10がROM6に格納したプログラムの指示及びデータに基づき、入力文章を解析し、解析に従って音声を合成して文章を読み上げる手順で行うが、その際に、本発明の実施の形態では、CPU10に読み上げ文章中の解析不能な未知語を抽出する手順と、抽出された未知語を表示手段に表示する手順と、表示された未知語の読みを入力する手順と、入力された未知語をその読みと共に記憶手段に登録する手順と、上記未知語を登録された読みに従って読み上げる手順とを実行させ、更に、読み上げ文章の形態素解析において解析不能の単語に未知語マークを付与する手順と、未知語に付与された未知語マークを検索する未知語抽出を行う手順を実行させることを文章読み上げ装置用プログラムをも提供するものである。
【0055】
また、本プログラムは、従来周知のフレキシブルディスク、CDROM、DVDROM、MO、HDD等の任意のコンピュータ読み取り可能な記録媒体に記録して、或いはインターネット等のネットワーク網を介して提供することができる。
【0056】
上述した実施の形態においては合成音声を発生するためのスピーカ5を備える1つの装置において、図4、図5に示すプログラムを全て処理しているが、各プログラムやプログラムの一部を別々の装置で処理して、最終的にスピーカ5から合成音声を生じても良い。例えば第1のコンピュータがステップS101〜S103を処理して、インターネットを介して音声パラメータ文字列のデータを第2のコンピュータに出力して、第2のコンピュータがステップS104〜S106を処理する。更に、合成音声を生じさせる装置は、文章読み上げの専用装置に限らず、読み上げ以外の他の機能を有するPAD、パソコン、携帯電話、カーナビゲーション端末、TV等であっても良い。尚、読み上げられる文章は、書籍に限らず、手紙(電子メールを含む)、道案内、宣伝、並びに歌詞などであっても良い。また、RAM7に記憶されたデータは、装置の電源が落されると消失するが、装置の電源が落されても、継続して記憶されても良い。そして図4に示すステップS101〜S106については、一文章毎に処理する必要はなく、複数の文章毎について行っても良い。
【0057】
【発明の効果】
本願の請求項1に記載の発明によれば、解析できない未知語があると文章読み上げ処理中に、未知語についてその読みの入力画面を表示し、ユーザーが読みを入力することでその読みが登録され、ユーザーにとって自然な手順で未知語についても正しい読みで読み上げることができ、読み上げを極めて自然に行うことができる。
【0058】
本願の請求項2に記載の発明によれば、前記請求項1に記載の発明の効果に加え、読み上げ文章の解析時に未知語に予めマークを付与しておくことで読み上げ中に未知語の抽出が迅速に行われ、読み上げ中の処理がスムースに行われる。
【0059】
本願の請求項3に記載の発明によれば、コンピュータに各手順を実行させ、未知語の読みの入力状態に移行して、入力された読みを用いて様々な語の読み上げのためのデータを生じることができる。
【0060】
本願の請求項4に記載の発明によれば、コンピュータに各手順を実行させ、未知語の単語に未知語マークを付与しており、その未知語マークを付与された単語に関する後の処理を迅速に行うことができる。
【0061】
本願の請求項5に記載の発明によれば、請求項4に記載の手順に加えて、更に各手順をコンピュータに実行させ、付与された未知語マークが検出されて、単語の読みの入力状態となるので、迅速に入力を行うことができる。
【0062】
本願の請求項6に記載の発明によれば、請求項3乃至5のいずれかに記載の本発明のプログラムを記録媒体に記録したことで本プログラムを容易に提供することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態である文章読み上げ装置の正面図である。
【図2】本発明の実施の形態である文章読み上げ装置の概略構成を示すブロック図である。
【図3】本発明の実施の形態である文章読み上げ装置の読み上げソフトウェアのソフトウェア構成を示すブロック図である。
【図4】読み上げ処理のフローチャートである。
【図5】読み選択及び未知語読み取得処理のフローチャートである。
【図6】複数読み一覧表示した文章読み上げ装置の図である。
【図7】未知語の読み入力画面時の文章読み上げ装置の図である。
【符号の説明】
1・・・文章読み上げ装置、2・・・液晶ディスプレイ、3・・・操作キー、4・・・タッチパネル、5・・・スピーカー、6・・・ROM、7・・・RAM、8・・・入力装置、9・・・表示装置、10・・・CPU。
Claims (6)
- 文章を解析し、該解析に従って音声を合成して読み上げる文章読み上げ装置において、
読み上げ文章中の解析不能な未知語を抽出する手段と、
抽出された未知語を表示する手段と、
表示された未知語の読みを入力する手段と
抽出された未知語を入力された読みと共に登録する手段と、
を備え、
前記未知語を登録された読みに従って読み上げることを特徴とする文章読み上げ装置。 - 請求項1に記載された文章読み上げ装置において、
読み上げ文章の形態素解析において解析不能の単語に未知語マークを付与する手段を備え、かつ、
前記未知語を抽出する手段は、未知語に付与された未知語マークを検索して抽出を行うことを特徴とする文章読み上げ装置。 - 文章を解析し、該解析に従って音声を合成して読み上げるためにコンピュータに、
読み上げ文章中の解析不能な未知語を抽出する手順と、
抽出された未知語を表示手段に表示する手順と、
表示された未知語の読みを入力状態に移行する手順と
抽出された未知語を入力された読みと共に記憶手段に登録する手順と、
前記未知語を登録された読みに従って読み上げるためのデータを生じる手順とを実行させることを特徴とする文章読み上げ装置用プログラム。 - 文章を解析し、該解析に従って音声を合成して読み上げるためにコンピュータに、
読み上げ文章中の解析不能な未知語を抽出する手順と、抽出された未知語に対して、未知語マークを付与する手順とを実行させることを特徴とする読み上げのためのプログラム。 - 請求項4に記載された読み上げるためのプログラムにおいて、
前記未知語マークを検出する手順と、
前記未知語マークを付与された単語に読みを入力するための状態に移行する手順とを実行させることを特徴とする読み上げのためのプログラム。 - 請求項3乃至5のいずれかに記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002334694A JP2004171174A (ja) | 2002-11-19 | 2002-11-19 | 文章読み上げ装置、読み上げのためのプログラム及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002334694A JP2004171174A (ja) | 2002-11-19 | 2002-11-19 | 文章読み上げ装置、読み上げのためのプログラム及び記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004171174A true JP2004171174A (ja) | 2004-06-17 |
Family
ID=32699011
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002334694A Pending JP2004171174A (ja) | 2002-11-19 | 2002-11-19 | 文章読み上げ装置、読み上げのためのプログラム及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004171174A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007047859A (ja) * | 2005-08-05 | 2007-02-22 | Nissan Motor Co Ltd | 文章解析方法、文章解析プログラム、文章解析装置、および文章解析システム |
WO2008062529A1 (fr) * | 2006-11-24 | 2008-05-29 | Fujitsu Limited | Dispositif de lecture de phrase, procédé de commande de dispositif de lecture de phrase et programme de commande du dispositif de lecture de phrase |
JP2008146019A (ja) * | 2006-11-16 | 2008-06-26 | Seiko Epson Corp | 音声合成用辞書作成システム、半導体集積回路装置及び半導体集積回路装置の製造方法 |
US8374845B2 (en) | 2007-09-25 | 2013-02-12 | Kabushiki Kaisha Toshiba | Retrieving apparatus, retrieving method, and computer program product |
CN112309406A (zh) * | 2020-09-21 | 2021-02-02 | 北京沃东天骏信息技术有限公司 | 声纹注册方法、装置和计算机可读存储介质 |
US20220245382A1 (en) * | 2021-02-02 | 2022-08-04 | Google Llc | Generating Assistive Indications Based on Detected Characters |
-
2002
- 2002-11-19 JP JP2002334694A patent/JP2004171174A/ja active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007047859A (ja) * | 2005-08-05 | 2007-02-22 | Nissan Motor Co Ltd | 文章解析方法、文章解析プログラム、文章解析装置、および文章解析システム |
JP2008146019A (ja) * | 2006-11-16 | 2008-06-26 | Seiko Epson Corp | 音声合成用辞書作成システム、半導体集積回路装置及び半導体集積回路装置の製造方法 |
WO2008062529A1 (fr) * | 2006-11-24 | 2008-05-29 | Fujitsu Limited | Dispositif de lecture de phrase, procédé de commande de dispositif de lecture de phrase et programme de commande du dispositif de lecture de phrase |
US8315873B2 (en) | 2006-11-24 | 2012-11-20 | Fujitsu Limited | Sentence reading aloud apparatus, control method for controlling the same, and control program for controlling the same |
US8374845B2 (en) | 2007-09-25 | 2013-02-12 | Kabushiki Kaisha Toshiba | Retrieving apparatus, retrieving method, and computer program product |
CN112309406A (zh) * | 2020-09-21 | 2021-02-02 | 北京沃东天骏信息技术有限公司 | 声纹注册方法、装置和计算机可读存储介质 |
US20220245382A1 (en) * | 2021-02-02 | 2022-08-04 | Google Llc | Generating Assistive Indications Based on Detected Characters |
US11769323B2 (en) * | 2021-02-02 | 2023-09-26 | Google Llc | Generating assistive indications based on detected characters |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007206317A (ja) | オーサリング方法、オーサリング装置およびプログラム | |
JP4872323B2 (ja) | Htmlメール生成システム、通信装置、htmlメール生成方法、及び記録媒体 | |
JP6645063B2 (ja) | ターゲット文字列の推定 | |
JP4738847B2 (ja) | データ検索装置および方法 | |
JP4967519B2 (ja) | 音声認識装置 | |
JP5119671B2 (ja) | 音声出力装置及び音声出力プログラム | |
KR100931464B1 (ko) | 음성출력장치 및 음성출력프로그램을 기록한 기록매체 | |
JP2008268478A (ja) | アクセント調整可能な音声合成装置 | |
JP2004171174A (ja) | 文章読み上げ装置、読み上げのためのプログラム及び記録媒体 | |
JP2007086309A (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP5819147B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP4640063B2 (ja) | 音声合成方法,音声合成装置,およびコンピュータプログラム | |
JP3762300B2 (ja) | テキスト入力処理装置及び方法並びにプログラム | |
JP5975033B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP2580565B2 (ja) | 音声情報辞書作成装置 | |
JP3838507B2 (ja) | 文章読み上げ装置、読み上げのためのプログラム、及び、記録媒体 | |
JP5125404B2 (ja) | 省略語判定装置、コンピュータプログラム、テキスト解析装置及び音声合成装置 | |
JP3284976B2 (ja) | 音声合成装置及びコンピュータ可読記録媒体 | |
JP2006098552A (ja) | 音声情報生成装置、音声情報生成プログラム及び音声情報生成方法 | |
JP4305515B2 (ja) | 音声出力装置及び音声出力プログラム | |
JP7280055B2 (ja) | 歌唱発音文字列自動補正プログラム及び歌唱発音文字列自動補正装置 | |
JP7243418B2 (ja) | 歌詞入力方法およびプログラム | |
JP3414326B2 (ja) | 音声合成用辞書登録装置及び方法 | |
JP2007178692A (ja) | 文字入力装置および方法 | |
JP2008250090A (ja) | 発音学習支援装置及び発音学習支援プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040913 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060209 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060608 |