JP4014361B2 - 音声合成装置及び音声合成方法並びに音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

音声合成装置及び音声合成方法並びに音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP4014361B2
JP4014361B2 JP2001022729A JP2001022729A JP4014361B2 JP 4014361 B2 JP4014361 B2 JP 4014361B2 JP 2001022729 A JP2001022729 A JP 2001022729A JP 2001022729 A JP2001022729 A JP 2001022729A JP 4014361 B2 JP4014361 B2 JP 4014361B2
Authority
JP
Japan
Prior art keywords
text
hypertext
link destination
speech
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001022729A
Other languages
English (en)
Other versions
JP2002229578A (ja
Inventor
和正 本田
智一 森尾
浩幸 勘座
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2001022729A priority Critical patent/JP4014361B2/ja
Publication of JP2002229578A publication Critical patent/JP2002229578A/ja
Application granted granted Critical
Publication of JP4014361B2 publication Critical patent/JP4014361B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、音声合成装置及び音声合成方法並びに音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体に関する。特に、ハイパーテキストの読み上げを行う音声合成装置及び音声合成方法並びに音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体に関する。
【0002】
【従来の技術】
従来より、漢字かな混じり文の文章を読み上げるテキスト音声合成技術が知られている(古井著「ディジタル音声処理」(東海大学出版会)。
【0003】
一方、近年、インターネットの発展とともに、WWW(World WideWeb)における情報の記述書式としてISO/IEC15445で規定されているHTML(Hiper Text Markup Language)で記述されたハイパーテキストを読み上げるハイパーテキスト読上装置が提案されている(特開平8−83089号公報)。このハイパーテキスト読上装置によれば、テキスト中からハイパーリンクの部分を検出し、そのハイパーリンクの部分の読上音声と通常の部分の読上音声とを変化させて出力することにより、ハイパーリンクが設定されている部分を音声で知覚させることができる。
【0004】
【発明が解決しようとする課題】
しかしながら、上記ハイパーテキスト読上装置は、テキスト中のハイパーリンクの存在を読上音声の違いからユーザに知覚させることが可能であるが、リンク先の内容についてまでは読み上げられないため、そのリンク先にどのような情報が存在しているかをユーザに知らせることはできなかった。
【0005】
本発明は、ハイパーテキストを読み上げる音声合成装置において、ハイパーリンクによりネットワーク状に繋がれているリンク先の情報を読み上げ可能な音声合成装置を提供することを主な目的とする。
【0006】
【課題を解決するための手段】
本発明は、ハイパーテキストで示される情報を表示する表示手段と、入力ハイパーテキスト中のリンク先を示す属性情報を解析すると共に、この解析結果に従って上記入力ハイパーテキスト中からインターネット上のハイパーテキストの接続先を表すリンク先を示すリンク先情報を抽出するリンク先情報抽出手段と、上記リンク先情報に対応するインターネット上のハイパーテキストを上記リンク先情報が示すインターネット上のリンク先から取得した後、当該ハイパーテキストに含まれると共に、読み上げテキストであることを表すマークアップ情報に基づいて、当該ハイパーテキストからリンク先の読み上げハイパーテキストを抽出するリンク先読み上げテキスト抽出手段と、上記抽出されたリンク先の読み上げハイパーテキストに基づいてリンク先の読み上げテキストを生成するリンク先読み上げテキスト生成手段と、上記入力ハイパーテキストに対する上記表示手段による表示処理を維持させる一方、上記インターネット上から取得したハイパーテキストから抽出および生成されたリンク先の読み上げテキストを音声合成する音声合成手段と、を有することを特徴とする音声合成装置を提供する。
【0007】
本発明によれば、入力されたハイパーテキスト中のリンク先の情報を取得し、このリンク先情報に対応するインターネット上のハイパーテキストを上記リンク先情報が示すインターネット上のリンク先から取得した後、当該ハイパーテキストから、マークアップ情報に基づいてリンク先の読み上げテキストを生成できるため、入力されたハイパーテキスト中のリンク先のハイパーテキストから抽出および生成された読み上げテキストを読み上げることが可能である。その際に、上記入力ハイパーテキストに対する上記表示手段による表示処理を維持させるので、リンク先の表示後に元の本文の表示に戻るという煩わしい作業を回避することが可能になる。さらに、予め上記リンク先のハイパーテキスト中に読み上げるべきテキストを指定するマークアップ情報が挿入されている場合には、その指定された部分のテキストだけを読み上げるようにすることができ、余分な情報を読み上げなくて済む。
【0008】
また、本発明は、上記入力ハイパーテキストに基づいて本文の読み上げテキストを生成する本文読み上げテキスト生成手段と、上記生成された本文の読み上げテキストと上記生成されたリンク先の読み上げテキストとを切り替えて音声合成する切替音声合成手段と、をさらに有することを特徴とする音声合成装置を提供する。
【0009】
本発明によれば、本文の読み上げテキストとリンク先の読み上げテキストとを切り替えて出力することができるため、入力されたハイパーテキストで示される情報のうち本文に関する読み上げテキスト情報とリンク先に関する読み上げテキスト情報とを、ユーザが希望する通りの順序で音声合成することが可能である。
【0010】
また、本発明は、所望のリンク先の入力を受け付ける入力手段をさらに有し、上記入力手段でリンク先の入力を受け付けた場合には、上記切替音声合成手段によって該リンク先の読み上げテキストを音声合成する一方、上記表示手段で上記本文の読み上げテキストを表示することを特徴とする音声合成装置を提供する。
【0011】
本発明によれば、ユーザが所望のリンク先を入力した場合、そのリンク先の情報を音声合成する一方、現在表示されている本文情報をそのまま表示し続けることができるため、リンク先の表示後に元の本文の表示に戻るという煩わしい作業を回避することが可能である。
【0012】
また、本発明は、上記入力手段によるリンク先の入力は、カーソルを含むポインタが、上記表示されている本文の読み上げテキスト中におけるリンク先を表す文字又は画像を含む表示情報に移動することによって行われることを特徴とする音声合成装置を提供する。
【0013】
また、本発明は、上記リンク先の読み上げテキストの音声合成が要求された場合に、上記リンク先の読み上げテキストに対応する情報を表示させるか否かを選択する選択手段をさらに有することを特徴とする音声合成装置を提供する。
【0014】
本発明によれば、現在表示されているWebページを目で見ながら、その表示を他のWebページに切り替えることなくリンク先の情報を音声合成によって取得することができると共に、ユーザが希望するときに現在音声合成されている情報に対応する表示に切り替えることが可能である。
【0015】
また、本発明は、入力ハイパーテキストで示される情報を表示するステップと、入力ハイパーテキスト中のリンク先を示す属性情報を解析すると共に、この解析結果に従って上記入力ハイパーテキスト中からインターネット上のハイパーテキストの接続先を表すリンク先を示すリンク先情報を抽出するステップと、上記リンク先情報に対応するインターネット上のハイパーテキストを上記リンク先情報が示すインターネット上のリンク先から取得した後、当該ハイパーテキストに含まれると共に、読み上げテキストであることを表すマークアップ情報に基づいて、当該ハイパーテキストからリンク先の読み上げハイパーテキストを抽出するステップと、上記抽出されたリンク先の読み上げハイパーテキストに基づいてリンク先の読み上げテキストを生成するステップと、上記入力ハイパーテキストに対する上記表示処理を維持させる一方、上記インターネット上から取得したハイパーテキストから抽出および生成されたリンク先の読み上げテキストを音声合成するステップと、を有することを特徴とする音声合成方法を提供する。
【0016】
本発明によれば、入力されたハイパーテキスト中のリンク先の情報を取得し、このリンク先情報に対応するインターネット上のハイパーテキストを上記リンク先情報が示すインターネット上のリンク先から取得した後、当該ハイパーテキストから、マークアップ情報に基づいてリンク先の読み上げテキストを生成できるため、入力されたハイパーテキスト中のリンク先のハイパーテキストから抽出および生成された読み上げテキストを読み上げることが可能である。その際に、上記入力ハイパーテキストに対する表示処理を維持させるので、リンク先の表示後に元の本文の表示に戻るという煩わしい作業を回避することが可能になる。さらに、予め上記リンク先のハイパーテキスト中に読み上げるべきテキストを指定するマークアップ情報が挿入されている場合には、その指定された部分のテキストだけを読み上げるようにすることができ、余分な情報を読み上げなくて済む。
【0017】
また、本発明は、上記音声合成方法の各ステップをコンピュータに実行させるための音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体を提供する。
【0018】
本発明によれば、入力されたハイパーテキスト中のリンク先の情報が示すインターネット上のリンク先から取得したハイパーテキストからリンク先の読み上げテキストを生成できるため、入力されたハイパーテキスト中のリンク先のハイパーテキストから抽出および生成された読み上げテキストを読み上げることが可能である。
【0019】
また、上記本発明は、上記リンク先のテキストの読み上げテキストを生成するリンク先読み上げテキスト生成手段を有して、上記取得したハイパーテキストの一部又は全部を加工してリンク先の読み上げテキストを生成ようにすることが望ましい。
【0020】
上記構成によれば、テキストの要約技術を用いて、取得したハイパーテキストの一部又は全部の情報を加工するため、リンク先の情報を要約したテキストを生成することができ、リンク先の情報量が多い場合でも適切な情報を音声合成することが可能になる。
【0021】
【発明の実施の形態】
(実施の形態1)
図1は、本発明に係る音声合成装置の一形態を示す機能ブロック図である。この音声合成装置100は、ハイパーテキスト解釈部101、読み上げテキスト生成部102、言語処理部103、音声合成部104、音声出力部105で構成される。
【0022】
本実施の形態では、音声合成装置100は汎用のパーソナルコンピュータに内蔵され、ネットワークを介して受信されるハイパーテキストを音声合成して出力する場合について説明を行うが、本発明はこれに限定されるものではなく、入力されたハイパーテキストに対して音声合成を行うような装置全般に対して適用可能である。
【0023】
図1に示すように、音声合成装置100にはハイパーテキストが入力される。このハイパーテキストはWWWサーバでのドキュメントを記述するための言語として広く知られているHTML等のマークアップ言語で記述されている。また、このハイパーテキストには、インターネット上のリソースのロケーションを指し示すための情報であるURL(Uniform Resource Locator)や文章等が埋め込められている。一般に、インターネット上でブラウザを使用して様々なサーバに接続できるようにすることをリンクと呼び、特にハイパーテキストを使用して接続先を指定することをハイパーリンクと呼ぶ。以下の説明では、特に断らない限り、ハイパーリンクのことを単にリンクと呼ぶこととする。また、ハイパーテキストに埋め込められたURLにより指定される接続先のことをリンク先と呼ぶこととする。
【0024】
ハイパーテキスト解釈部101は、入力されたハイパーテキスト中に記述された属性情報を解析する。解析の結果、入力ハイパーテキストの本文の内容を示す情報(以下、本文の読み上げテキストという)は言語処理部103に出力される一方、リンク先を示すURL(以下、リンク先情報という)は文字列を要素とする配列で表され、読み上げテキスト生成部102に出力される。
【0025】
読み上げテキスト生成部102は、ハイパーテキスト解釈部101から出力されたリンク先情報で示されるリンク先にネットワークを介して接続し、リンク先に記録されている情報(以下、リンク情報という)を示すハイパーテキストを取得して、そのハイパーテキスト中の属性情報に基づいてリンク先の読み上げテキストを生成し、言語処理部103に出力する。
【0026】
言語処理部103は、ハイパーテキスト解釈部101の出力する本文の読み上げテキスト及び読み上げテキスト生成部102の出力するリンク先の読み上げテキストを入力とし、それらが示すテキスト情報を解析して、読み上げるテキスト情報を表す文字列と、その文字列に対応する音の高さと継続時間の数値とをそれぞれ記憶した配列とを音声合成部104に出力する。
【0027】
音声合成部104は、言語処理部103の出力した情報から音声波形を表す時系列の数値の配列を生成し音声出力部105へ出力する。
【0028】
音声出力部105は、スピーカなどの音声出力装置を有し、音声合成部104から出力された合成波形をD/A変換して出力する。
【0029】
図2は、本実施の形態に係る音声合成装置100にハイパーテキストが入力され、ハイパーテキスト解釈部101及び読み上げテキスト生成部102において、そのハイパーテキストから読み上げるテキスト情報を生成する際の具体例を説明するための概念図である。
【0030】
図2(a)は、入力されるハイパーテキストの一例である。図2(a)において、<a href=…>から</a>までがリンクの記述であり、<ahref=…>及び</a>がリンクを示す属性情報である。また、“hokkaido.html”及び“touhoku.html”がリンク先情報である。この例では、このハイパーテキストは、北海道の天気の情報及び東北の天気の情報にリンクされていることが示されている。
【0031】
図2(b)は、読み上げテキスト生成部102において生成されるリンク先の読み上げテキストの一例である。このリンク先の読み上げテキストは、リンク先(hokkaido.html)のサーバに蓄積されている情報であり、ハイパーテキスト解釈部101において、リンクを示す属性情報(<a href=…>及び</a>)からリンク先情報(hokkaido.html)を抽出し、読み上げテキスト生成部102において、そのリンク先に接続して、そのリンク先情報に対応するハイパーテキストを取得する。その後、その取得したハイパーテキスト中の属性情報に基づいてリンク先の読み上げテキストを生成する。この場合、ハイパーテキスト中の全ての属性情報に対応する情報をリンク先の読み上げテキストとして生成するようにしてもよいし、ハイパーテキスト中のリンクを示す属性情報以外で示される属性情報に対応する情報をリンク先の読み上げテキストとして生成するようにしておいてもよい。
【0032】
図2(c)は、ハイパーテキスト解釈部101において生成される本文の読み上げテキストの一例である。この本文の読み上げテキストは、ハイパーテキスト内のリンクを示す属性情報以外で示される属性情報で示される情報である。
(実施の形態2)図3は、本発明に係る音声合成装置の別の形態を示す機能ブロック図である。図1と同一の構成要素には同一の符号を付し、同じ説明は省略する。
【0033】
読み上げテキスト管理部106は、ハイパーテキスト解釈部101及び読み上げテキスト生成部102から入力されたテキスト情報を適切な順序で言語処理部103に出力するように管理する。
【0034】
図4は読み上げテキスト管理部106における処理の一例を示すフローチャートである。図4に従って読み上げテキスト管理部106の処理を説明すると以下の通りである。
【0035】
ハイパーテキスト解釈部101及び読み上げテキスト生成部102から読み上げテキスト管理部106にテキスト情報が入力されると、テキスト情報を構成するそれぞれの文字列を区別して記憶する(S101)。すなわち、ハイパーテキスト解釈部101から入力された本文の読み上げテキストの文字列を配列Hに、読み上げテキスト生成部102から入力されたリンク先の読み上げテキストの文字列を配列Yにそれぞれ記憶する。このとき、ハイパーテキスト解釈部101から入力された文字列の数をN、読み上げテキスト生成部102から入力された文字列の数をMとした場合、配列H、Yには、それぞれ、H[1]、H[2]、…H[N]、Y[1]、Y[2]…、Y[M]が記憶される。
【0036】
次に、ループの制御変数iに1を代入し(S102)、H[i]を言語処理部103に出力する(S103)。さらに次に、制御変数iに1を加え(S104)、i<Nの条件を満足するかどうかを判定する(S105)。条件を満足する場合は、S103に戻り、ハイパーテキスト解釈部101から入力された文字列を出力し終えるまで処理を繰り返す。出力し終えると、制御変数iを1に初期化し直し(S106)、Y[i]を言語処理部103に出力する(S107)。さらに次に、制御変数iに1を加え(S108)、i<Mの条件を満足するかどうかを判定する(S109)。条件を満足する場合は、S107に戻り、読み上げテキスト生成部102から入力された文字列を出力し終えるまで処理を繰り返す。
【0037】
以上の処理により、まず、本文の読み上げテキストを音声合成し、その次にリンク先の読み上げテキストを音声合成することが可能である。
【0038】
本実施の形態では、まず本文の読み上げテキストを出力し、その次にリンク先の読み上げテキストを出力するようにテキスト情報を管理しているが、順番を逆にして出力したり、それぞれを交互に出力するようにしても良い。すなわち、読み上げテキスト管理部106において、本文の読み上げテキストの出力とリンク先の読み上げテキストの出力とを切り替え可能に設定したり、本文の読み上げテキスト又はリンク先の読み上げテキストを出力するか否かを制限したりするようにしてもよい。
(実施の形態3)図5は、本発明に係る音声合成装置の別の形態を示す機能ブロック図である。図1と同一の構成要素には同一の符号を付し、同じ説明は省略する。
【0039】
テキスト要約部107は、読み上げテキスト生成部102からリンク先の読み上げテキストを受け取り、そのテキスト情報を要約して、その要約情報を読み上げテキスト生成部102に返す。テキスト情報の要約については、既存のテキスト要約技術を用いて行えば良い。
【0040】
このような構成により、入力されたハイパーテキスト中に設定されているリンク先の情報を要約したテキストを生成することができるため、リンク先の情報量が多い場合でも適切な情報を音声合成することが可能である。
(実施の形態4)図6は、本発明に係る音声合成装置の別の形態を示す機能ブロック図である。図1と同一の構成要素には同一の符号を付し、同じ説明は省略する。
【0041】
テキスト翻訳部108は、読み上げテキスト生成部102からリンク先の読み上げテキストを受け取り、そのテキスト情報を予め設定しておいたユーザの使用言語に翻訳して、その翻訳情報を読み上げテキスト生成部102に返す。テキスト情報の翻訳については、既存の自然言語自動翻訳技術(長尾真監修「日本語情報処理」社団法人電子通信学会)を用いて行えば良い。
【0042】
このような構成により、入力されたハイパーテキスト中に設定されているリンク先の情報を予めユーザが設定しておいた使用言語に翻訳することができるため、ユーザが理解できない言語の情報でもユーザが理解できる言語で音声合成することが可能である。
(実施の形態5)図7は、本発明に係る音声合成装置の別の形態を示す機能ブロック図である。図1と同一の構成要素には同一の符号を付し、同じ説明は省略する。
【0043】
読み上げテキスト抽出部109は、読み上げテキスト生成部102からリンク情報を受け取り、そのリンク情報にテキスト読み上げ用の属性情報がある場合には、その部分を抽出して、その読み上げ情報を読み上げテキスト生成部102に返す。
【0044】
テキスト読み上げ用の属性情報について、図8を参照して説明すると以下の通りである。
【0045】
図8は、テキスト読み上げ用の属性情報が設定されたハイパーテキストからその部分を抽出する場合の一例を説明するための図である。図8(a)中の<speak>がテキスト読み上げ用の属性情報を示しており、<speak>(テキスト読み上げ開始タグ)と</speak>(テキスト読み上げ終了タグ)とに挟まれたテキスト情報が、図8(b)のように読み上げ情報として抽出される。
【0046】
このように、予めリンク情報の中に読み上げるべき情報が指定されている場合は、その部分だけを読み上げるようにすることができ、余分な情報を読み上げなくて済む。
(実施の形態6)図9は、本発明に係る音声合成装置の別の形態を示す機能ブロック図である。図1と同一の構成要素には同一の符号を付し、同じ説明は省略する。
【0047】
表示部112は、液晶ディスプレイなどの表示デバイスを備え、ハイパーテキストで示される情報を表示するものである。なお、表示する際には既存のWWWブラウザなどのハイパーテキストを表示させるためのソフトウエアが利用される。
【0048】
入力部111は、ユーザ所望のリンク先の入力を受け付ける。そのリンク先を示す文字列は読み上げテキスト生成部102及びハイパーテキスト入力部110に出力される。この入力部111は、キーボードやマウスなどの入力デバイスを備えており、表示部112に表示されるWWWブラウザ画面を介してキーボードでURLをタイプしたり、マウスでリンク先を表す文字や画像をクリックすることにより、対応する文字列を読み上げテキスト生成部102及びハイパーテキスト管理部110に出力させる。
【0049】
ハイパーテキスト管理部110は、WWWブラウザを介して表示部112に表示させるWebページの基となるハイパーテキストを決定し出力する。例えば、本発明に係る音声合成装置を搭載したパソコンを起動した場合などの初期状態では、WWWブラウザで予め設定されているスタートページを表示部112に表示させるように決定する。また、入力部111又は読み上げテキスト生成部102からリンク先を示す文字列が入力されると、その文字列に対応するリンク先の情報を表すハイパーテキストを取得して、そのハイパーテキストを表示部112及びハイパーテキスト解釈部101に出力する。
【0050】
また、現在表示部112に表示されているWebページにおいて、ユーザがリンク先を指定した場合、現在表示されているWebページはそのまま表示を維持する一方、指定されたリンク先の情報を読み上げるようにするか、又は、現在表示されているWebページをリンク先のWebページに切り替えると共に、指定されたリンク先の情報を読み上げるようにするかをユーザが選択可能なインタフェースを提供することもできる。後者の場合は、例えば、ページの切り替えを行うボタンを表す画像を表示部112に表示させておき、入力部111でそのボタンが選択されると、ハイパーテキスト管理部110において、現在読み上げられている文章に対応するリンク先のハイパーテキストを取得し、そのハイパーテキストが示す情報を表示部112に出力するようにしておけば良い。
【0051】
このような構成により、現在表示されているWebページを目で見ながら、その表示を他のWebページに切り替えることなくリンク先の情報を音声合成によって取得することができると共に、ユーザが希望するときに現在音声合成されている情報に対応する表示に切り替えることができる。
【0052】
また、入力部111において、マウスでリンク先を表す文字や画像にカーソルを移動させた時に、リンク先の文字列を読み上げテキスト生成部102に出力するようにしても良い。このような構成により、現在表示中のWebページはそのままで、指定されたリンク先の情報を音声合成により読み上げることができる。
【0053】
また、現在音声合成で読み上げているリンク先に対応する文字列を読み上げテキスト生成部102から表示部112に出力して、そのリンク先に対応する文字を、例えば点滅させるなど他の文字とは変化させて表示させることにより、現在音声合成で読み上げているリンク先をユーザに知らせるようにすることができる。なお、表示の変化のさせ方については、点滅させる以外に、例えば、リンク先の文字や画像の付近にスピーカの画像を表示させても良い。
【0054】
また、図10に示すように、リンク先表示部113を設け、そこに、音声で読み上げを行うテキストに対応するリンク先を表す文字列を表示するようにしておいても良い。
【0055】
なお、本実施の形態では、入力部111において、マウスでリンク先をクリックした場合は、リンク先の文字列をハイパーテキスト管理部110に出力し、カーソルをリンク先に移動した場合は、リンク先の文字列を読み上げテキスト生成部102に出力するようにしているが、それらの出力先は逆にしても良いし、両方に出力するようにしても良い。
(実施の形態7)本実施の形態に係る音声合成装置は、上述の実施の形態3〜6に係る音声合成装置を組み合わせた構成、すなわち、実施の形態1に係る音声合成装置の各構成に加えて、テキスト要約部107とテキスト翻訳部108と読み上げテキスト抽出部109とハイパーテキスト管理部110と入力部111と表示部112とリンク先表示部とを備える構成の音声合成装置(図示せず)である。本実施の形態では、この音声合成装置が搭載されたパソコンにおいて、WWWブラウザが起動してスタートページが表示される場合の読み上げテキスト生成部102における処理について説明する。
【0056】
図11は、読み上げテキスト生成部102における処理の一例を示すフローチャートである。図11に従って読み上げテキスト生成部102の処理を説明すると以下の通りである。
【0057】
WWWブラウザが起動すると、スタートページに対応するハイパーテキストがハイパーテキスト管理部110に入力されて表示部112でスタートページが表示されると共に、ハイパーテキスト解釈部101でハイパーテキスト中の属性情報が解析されてリンク先情報が読み上げテキスト生成部102に入力される。
【0058】
リンク先情報は文字列を要素とする配列Aで表され、要素数をNとすると、A[1]、A[2]、…、A[N]と表される。リンク先情報が読み上げテキスト生成部102に入力されると、ループの制御変数iに1が代入される(S201)。次に、A[i]に対応するリンク先情報から読み上げテキストを生成し、リンク先を表す文字列と対応させて記憶させる(S202)。S202における詳細な処理については後述する。
【0059】
さらに次に、制御変数iに1を加え(S203)、i<Nの条件を満足するかどうかを判定する(S204)。条件を満足する場合は、S202に戻り、リンク先情報の文字列の最後(A[n])まで処理を繰り返す。
【0060】
S204において、リンク先情報の最後の文字まで処理が終了すると、次に入力部111からのデータを受け付ける。入力部111からリンク先を指定する文字列が入力されると、その指定されたリンク先に対応する読み上げテキストを表す文字列を言語処理部103に出力し、リンク先を表す文字列をリンク先表示部113に表示させる。また、入力部111から表示ページの切り替え指示が入力されると、リンク先表示部113に表示されている文字列が読み上げテキスト生成部102からハイパーテキスト管理部110に出力され、リンク先のページが表示部112に表示される。また、S205において、入力部111からの入力がなければ、入力があるまで待つ。
【0061】
図12は、上述のS202における処理の詳細なフローチャートである。
【0062】
リンク先情報を表す文字列A[i]で指定されるリンク先から、リンク情報を取得しバッファに記憶しておく。なお、リンク情報は、周知のHTTPプロトコル(ハイパーテキスト転送プロトコル)などを利用して取得することができる。
【0063】
次に、取得したリンク情報に、例えば<speak>などで示されるテキスト読み上げ用の属性情報があるかどうかについて判断され(S302)、テキスト読み上げ用の属性情報がある場合は、S306に進み、テキスト読み上げ用の情報を抽出し、その情報を読み上げテキスト情報としてリンク先を表す文字列と対応させて記憶する。
【0064】
S302においてテキスト読み上げ用の属性情報がない場合は、S303に進みリンク情報の翻訳が必要であるかどうかについて判断する。リンク情報のハイパーテキストのヘッダ部分に記述されている言語とユーザの使用言語とが比較され、異なっていれば翻訳が必要と判断して、リンク情報を翻訳する(S304)。一致していれば翻訳は不要と判断して、S305に進む。
【0065】
S305では、リンク情報を要約して、その情報を読み上げテキスト情報として、リンク先を表す文字列と対応させて記憶する。
【0066】
なお、上述の実施の形態1〜実施の形態7における音声合成装置の各構成を任意に組み合わせた音声合成装置を提供することも可能である。このように各構成を任意に組み合わせた場合でも、それぞれの実施の形態で説明した同様の作用効果を奏することは明らかである。
【0067】
また、上述の各実施の形態における処理の一部又は全部をコンピュータによる処理に適した命令の順番付けられた列からなるもの(プログラム)として提供することも可能である。また、そのプログラムのインストール、実行、プログラムの流通のために、そのプログラムを記録したコンピュータ読取可能な記録媒体として提供することも可能である。
【0068】
【発明の効果】
本発明では、ハイパーテキストを読み上げる音声合成装置において、ハイパーリンクによりネットワーク状に繋がれているリンク先のハイパーテキストから抽出および生成された読み上げテキストを、本文の読み上げテキストを表示した状態で、読み上げ可能な音声合成装置を提供することができる。
【図面の簡単な説明】
【図1】 本発明の実施の形態1に係る音声合成装置の機能ブロック図である。
【図2】 本発明の実施の形態1に係る音声合成装置の入力となるハイパーテキストと、そのハイパーテキストから生成されるテキスト情報の概念図である。
【図3】 本発明の実施の形態2に係る音声合成装置の機能ブロック図である。
【図4】 本発明の実施の形態2に係る音声合成装置のテキスト管理部の処理を示すフローチャートである。
【図5】 本発明の実施の形態3に係る音声合成装置の機能ブロック図である。
【図6】 本発明の実施の形態4に係る音声合成装置の機能ブロック図である。
【図7】 本発明の実施の形態5に係る音声合成装置の機能ブロック図である。
【図8】 本発明の実施の形態5に係る音声合成装置の読み上げテキスト抽出部の動作を示す概念図である。
【図9】 本発明の実施の形態6に係る音声合成装置の機能ブロック図である。
【図10】 本発明の実施の形態6に係る音声合成装置の機能ブロック図である。
【図11】 本発明の実施の形態7に係る音声合成装置の読み上げテキスト生成部の処理を示すフローチャートである。
【図12】 本発明の実施の形態7に係る音声合成装置の読み上げテキスト生成部の処理を示すフローチャートである。
【符号の説明】
100 音声合成装置
101 ハイパーテキスト解釈部
102 読み上げテキスト生成部
103 言語処理部
104 音声合成部
105 音声出力部
106 読み上げテキスト管理部
107 テキスト要約部
108 テキスト翻訳部
109 読み上げテキスト抽出部
110 ハイパーテキスト管理部
111 入力部
112 表示部
113 リンク先表示部

Claims (7)

  1. ハイパーテキストで示される情報を表示する表示手段と、
    入力ハイパーテキスト中のリンク先を示す属性情報を解析すると共に、この解析結果に従って上記入力ハイパーテキスト中から、インターネット上のハイパーテキストの接続先を表すリンク先を示すリンク先情報を抽出するリンク先情報抽出手段と、
    上記リンク先情報に対応するインターネット上のハイパーテキストを上記リンク先情報が示すインターネット上のリンク先から取得した後、当該ハイパーテキストに含まれると共に、読み上げテキストであることを表すマークアップ情報に基づいて、当該ハイパーテキストからリンク先の読み上げハイパーテキストを抽出するリンク先読み上げテキスト抽出手段と、
    上記抽出されたリンク先の読み上げハイパーテキストに基づいてリンク先の読み上げテキストを生成するリンク先読み上げテキスト生成手段と、
    上記入力ハイパーテキストに対する上記表示手段による表示処理を維持させる一方、上記インターネット上から取得したハイパーテキストから抽出および生成されたリンク先の読み上げテキストを音声合成する音声合成手段と、
    を有することを特徴とする音声合成装置。
  2. 上記入力ハイパーテキストに基づいて本文の読み上げテキストを生成する本文読み上げテキスト生成手段と、
    上記生成された本文の読み上げテキストと上記生成されたリンク先の読み上げテキストとを切り替えて音声合成する切替音声合成手段と、
    をさらに有することを特徴とする請求項1に記載の音声合成装置。
  3. 所望のリンク先の入力を受け付ける入力手段をさらに有して、
    上記入力手段でリンク先の入力を受け付けた場合には、上記切替音声合成手段によって該リンク先の読み上げテキストを音声合成する一方、上記表示手段で上記本文の読み上げテキストを表示することを特徴とする請求項2に記載の音声合成装置。
  4. 上記入力手段によるリンク先の入力は、カーソルを含むポインタが、上記表示されている本文の読み上げテキスト中におけるリンク先を表す文字又は画像を含む表示情報に移動することによって行われることを特徴とする請求項3に記載の音声合成装置。
  5. 上記リンク先の読み上げテキストの音声合成が要求された場合に、上記リンク先の読み上げテキストに対応する情報を表示させるか否かを選択する選択手段をさらに有することを特徴とする請求項1、請求項2、又は請求項3に記載の音声合成装置。
  6. 入力ハイパーテキストで示される情報を表示するステップと、
    入力ハイパーテキスト中のリンク先を示す属性情報を解析すると共に、この解析結果に従って上記入力ハイパーテキスト中から、インターネット上のハイパーテキストの接続先を表すリンク先を示すリンク先情報を抽出するステップと、
    上記リンク先情報に対応するインターネット上のハイパーテキストを上記リンク先情報が示すインターネット上のリンク先から取得した後、当該ハイパーテキストに含まれると共に、読み上げテキストであることを表すマークアップ情報に基づいて、当該ハイパーテキストからリンク先の読み上げハイパーテキストを抽出するステップと、
    上記抽出されたリンク先の読み上げハイパーテキストに基づいてリンク先の読み上げテキストを生成するステップと、
    上記入力ハイパーテキストに対する上記表示処理を維持させる一方、上記インターネット上から取得したハイパーテキストから抽出および生成されたリンク先の読み上げテキストを音声合成するステップと、
    を有することを特徴とする音声合成方法。
  7. 請求項6に記載の音声合成方法の各ステップをコンピュータに実行させるための音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2001022729A 2001-01-31 2001-01-31 音声合成装置及び音声合成方法並びに音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP4014361B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001022729A JP4014361B2 (ja) 2001-01-31 2001-01-31 音声合成装置及び音声合成方法並びに音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001022729A JP4014361B2 (ja) 2001-01-31 2001-01-31 音声合成装置及び音声合成方法並びに音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2002229578A JP2002229578A (ja) 2002-08-16
JP4014361B2 true JP4014361B2 (ja) 2007-11-28

Family

ID=18888102

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001022729A Expired - Fee Related JP4014361B2 (ja) 2001-01-31 2001-01-31 音声合成装置及び音声合成方法並びに音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP4014361B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4768375B2 (ja) * 2005-09-20 2011-09-07 富士通株式会社 ジャンプ処理抑止プログラム
JP4823977B2 (ja) * 2007-06-26 2011-11-24 京セラ株式会社 電子機器及びその制御方法
JP4935658B2 (ja) 2007-12-11 2012-05-23 ブラザー工業株式会社 ブラウザプログラムおよび情報処理装置
JP5112273B2 (ja) * 2008-12-12 2013-01-09 株式会社日立製作所 通信装置
JP5338298B2 (ja) * 2008-12-19 2013-11-13 カシオ計算機株式会社 ページ閲覧装置およびプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09251367A (ja) * 1996-03-14 1997-09-22 Toshiba Corp 情報処理装置及び同装置に用いられる機能指示方法
JP3864197B2 (ja) * 1998-02-27 2006-12-27 日本電信電話株式会社 音声クライアント端末装置
JPH11288364A (ja) * 1998-04-02 1999-10-19 Canon Inc 情報閲覧方法及び装置並びに記憶媒体
JP2000099072A (ja) * 1998-09-21 2000-04-07 Ricoh Co Ltd 文書読み上げ装置
JP2000187493A (ja) * 1998-12-22 2000-07-04 Sumitomo Electric Ind Ltd 音声出力装置および車載用コンピュータ
JP2001014319A (ja) * 1999-06-28 2001-01-19 Nissan Motor Co Ltd ハイパーテキストアクセス装置
JP2001043064A (ja) * 1999-07-30 2001-02-16 Canon Inc 音声情報処理方法、装置及び記憶媒体
JP4194741B2 (ja) * 2000-06-30 2008-12-10 ヤフー株式会社 画面読み上げソフトを使用する利用者に向けたWebページ案内サーバー及び方法

Also Published As

Publication number Publication date
JP2002229578A (ja) 2002-08-16

Similar Documents

Publication Publication Date Title
JP4225703B2 (ja) 情報アクセス方法、情報アクセスシステムおよびプログラム
US7054952B1 (en) Electronic document delivery system employing distributed document object model (DOM) based transcoding and providing interactive javascript support
US5748186A (en) Multimodal information presentation system
US6829746B1 (en) Electronic document delivery system employing distributed document object model (DOM) based transcoding
US6725424B1 (en) Electronic document delivery system employing distributed document object model (DOM) based transcoding and providing assistive technology support
US7228495B2 (en) Method and system for providing an index to linked sites on a web page for individuals with visual disabilities
JP2008021002A (ja) Webサーバ装置、表示情報音声合成装置及びプログラム
JP2007507033A (ja) ナビゲーション・オブジェクトの改善された描画
JP2006244296A (ja) 読み上げ用ファイル作成装置、リンク読み上げ装置、及びプログラム
JP4935658B2 (ja) ブラウザプログラムおよび情報処理装置
JP4771915B2 (ja) Htmlテキストを変換する装置、方法、およびプログラム
JP2007328510A (ja) コンテンツ変換装置、コンテンツ表示装置、コンテンツ閲覧装置、コンテンツ変換方法、コンテンツ閲覧方法およびプログラム
WO2007018102A1 (ja) 携帯型情報機器及び携帯型情報機器の表示方法
JP2004287758A (ja) Webアプリケーション統合方法/プログラム/記録媒体、ポータルサーバ
JP2009176231A (ja) クライアント装置およびクライアント制御プログラム
JP4014361B2 (ja) 音声合成装置及び音声合成方法並びに音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体
JP5267342B2 (ja) マッシュアッププログラム、マッシュアップ装置及びマッシュアップ方法
KR100491613B1 (ko) 웹문서의 클로즈업 기능을 구비한 정보통신기기와 이것을 이용한 웹문서의 디스플레이 방법 및 그 방법을 기록한 기록매체
JP5338298B2 (ja) ページ閲覧装置およびプログラム
JP2011216112A (ja) 表示プログラム
JPH10162002A (ja) インターネットブラウジング装置
JP4515186B2 (ja) 音声辞書作成装置、音声辞書作成方法、及びプログラム
JP2005128955A (ja) 情報処理方法および記憶媒体、プログラム
JP2002014893A (ja) 画面読み上げソフトを使用する利用者に向けたWebページ案内サーバー
WO2013061719A1 (ja) 音声合成情報付きのテキストデータ提供装置及びテキストデータ提供方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040409

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040420

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040618

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040618

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040618

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041227

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050517

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050713

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050905

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20051014

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070911

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100921

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110921

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120921

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130921

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees