JP2002041556A - Method and device for relaying hyper text for voice browsing, and recording medium - Google Patents
Method and device for relaying hyper text for voice browsing, and recording mediumInfo
- Publication number
- JP2002041556A JP2002041556A JP2000231219A JP2000231219A JP2002041556A JP 2002041556 A JP2002041556 A JP 2002041556A JP 2000231219 A JP2000231219 A JP 2000231219A JP 2000231219 A JP2000231219 A JP 2000231219A JP 2002041556 A JP2002041556 A JP 2002041556A
- Authority
- JP
- Japan
- Prior art keywords
- hypertext
- voice
- text
- link
- browser
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、音声ブラウジング
のためのハイパーテキスト中継方法及び装置並びに記録
媒体に関わり、特に、読み上げるリンクの指定をブラウ
ザからの音声入力によって行う音声ブラウジングのため
のハイパーテキスト中継方法及び装置並びに記録媒体に
関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a hypertext relay method and apparatus for voice browsing and a recording medium, and more particularly to a hypertext relay for voice browsing in which a link to be read is specified by voice input from a browser. The present invention relates to a method and an apparatus, and a recording medium.
【0002】[0002]
【従来の技術】近年、インターネット等のコンピュータ
ネットワークを介し、ハイパーテキストに基づいて、ハ
イパーテキストの表示装置によるその要求、受信、表示
という動作を実現するWWW(World Wide Web)という
枠組みが一般に普及した。ハイパーテキストには、他の
ハイパーテキストの在処を示すURL(uniformresourc
e locator)とそのラベルを記述することができる。ラ
ベルには、テキストやイメージなどを用いる。2. Description of the Related Art In recent years, a framework called WWW (World Wide Web) for realizing operations of requesting, receiving, and displaying a hypertext by a hypertext based display device via a computer network such as the Internet has become popular. . The hypertext contains a URL (uniformresourc) indicating the location of another hypertext.
e locator) and its label. For the label, a text or an image is used.
【0003】ハイパーテキスト上のURLとそのラベル
とを合わせてリンクと呼ぶ。ハイパーテキストの表示装
置はブラウザと呼ばれ、コンピュータネットワークとハ
イパーテキスト中継装置(プロキシ サーバー)を介
し、以下のように機能する。まず、ハイパーテキストを
ブラウザに表示すると、ブラウザはリンク部分を異なる
色などによって強調表示する。ユーザは、マウスなどの
ポインティング装置により、このようなリンク部分に対
して、クリック操作を行い、リンクに指定されているハ
イパーテキストを選択する。このとき、ブラウザは、中
継装置にユーザが選択したハイパーテキストの送信要求
を行う。中継装置は、ブラウザからの送信要求から、該
当するハイパーテキストの在処をコンピュータネットワ
ークから特定し、該当ハイパーテキストをコンピュータ
ネットワークから要求元のブラウザへ送信する。ブラウ
ザは、中継装置が送信するハイパーテキストをユーザに
対して表示する。[0003] The URL and the label on the hypertext are collectively called a link. The hypertext display device is called a browser, and functions as follows via a computer network and a hypertext relay device (proxy server). First, when the hypertext is displayed in the browser, the browser highlights the link portion with a different color or the like. The user performs a click operation on such a link portion using a pointing device such as a mouse, and selects hypertext specified in the link. At this time, the browser requests the relay device to transmit the hypertext selected by the user. The relay device specifies the location of the relevant hypertext from the computer network from the transmission request from the browser, and transmits the relevant hypertext from the computer network to the requesting browser. The browser displays the hypertext transmitted by the relay device to the user.
【0004】WWWの普及に伴い、ハイパーテキストの
仕様も多様化・高機能化し、その表示装置であるブラウ
ザもこれに対応してきた。このような状況において、人
間が発声する音声を用いてブラウジングする方法が発明
された。これを音声ブラウジングと呼ぶことにする。特
開平10−154063号公報(特願平8−312016号)には、既
存のハイパーテキストに音声ブラウジングを可能とする
命令を付加するハイパーテキスト中継方法及び装置が示
されている。また、特開平10−222342号公報(特願平9
−24024号)には、音声入力機能をブラウザに追加・拡
張するハイパーテキスト音声制御方法及び装置が示され
ている。音声ブラウジングは、これら双方の発明により
以下のように実現される。[0004] With the spread of WWW, the specification of hypertext has also become diversified and sophisticated, and a browser as a display device has been adapted to this. In such a situation, a method of browsing using a voice uttered by a human has been invented. This is called audio browsing. Japanese Patent Application Laid-Open No. H10-155403 (Japanese Patent Application No. 8-312016) discloses a hypertext relay method and apparatus for adding an instruction enabling voice browsing to existing hypertext. Also, Japanese Patent Application Laid-Open No. Hei 10-222342 (Japanese Patent Application No.
No. 24024) discloses a hypertext voice control method and apparatus for adding and extending a voice input function to a browser. Voice browsing is realized as follows by both of these inventions.
【0005】まず、ブラウザがあるハイパーテキストを
音声ブラウジングのためのハイパーテキスト中継装置に
対して要求する。その中継装置は、要求があったハイパ
ーテイストに以下のような音声コマンドを付与する。 ・「リンク読み上げ」−>(T1,・・・,Ti,・・・,
Tn) ・「Wijへジャンプ」−>ジャンプ(URLi) ただし、Ti及びURLiは、あるリンクLiのそれぞ
れテキスト部分及びURL部分とする。WijはTiに
含まれるある語とする。[0005] First, a browser requests a hypertext from a hypertext relay device for voice browsing. The relay device adds the following voice command to the requested hypertaste.・ "Link reading"-> (T1, ..., Ti, ...,
Tn) "Jump to Wij"-> Jump (URLi) Here, Ti and URLi are a text part and a URL part of a certain link Li, respectively. Wij is a word included in Ti.
【0006】次に、中継装置は、以上のような音声コマ
ンドをハイパーテキストへ付与し、その要求元であるブ
ラウザへ送信し、ブラウザはそのハイパーテキストをユ
ーザへ表示する。このとき、このブラウザが音声入出力
機能を備えたものであれば、ユーザは以下のような操作
を行うことができる。 ・「リンク読み上げ」という音声入力を行って、ハイパ
ーテキストのリンク部分全てのテキストを読み上げさせ
る。 ・「〜へジャンプ」という音声入力を行って、「〜」を
含むリンクが指定するハイパーテキストを呼び出す。[0006] Next, the relay device gives the voice command as described above to the hypertext, transmits the command to the browser that has made the request, and the browser displays the hypertext to the user. At this time, if the browser has a voice input / output function, the user can perform the following operation.・ Speech input “link readout” is performed to read out the text of all hypertext link portions.・ Speech input “jump to” is performed, and a hypertext specified by a link including “to” is called.
【0007】[0007]
【発明が解決しようとする課題】本発明は、音声ブラウ
ジングの誤動作予防と対話的音声ブラウジングの高度化
を解決すべき課題とする。まず、音声入力によるハイパ
ーテキストの呼び出しではリンクのテキストの表現によ
っては誤動作を招くという問題がある。これは、リンク
のそれぞれが同じ単語をそのテキストにもつ場合に生じ
る。例えば、あるハイパーテキストのリンクのテキスト
が以下のようであったとする。SUMMARY OF THE INVENTION It is an object of the present invention to prevent malfunction of voice browsing and to enhance interactive voice browsing. First, there is a problem in that a hypertext call by voice input causes a malfunction depending on the expression of a link text. This occurs when each of the links has the same word in its text. For example, assume that the text of a hypertext link is as follows.
【0008】「内閣総理大臣の健康状態」 「江戸時代の粋な庶民生活」 「健康的な食生活への助言」 ここで、ユーザは、「健康的な食生活への助言」が表す
ハイパーテキストをブラウズするために、「健康へジャ
ンプ」という音声入力をしたとしても、「内閣総理大臣
の健康状態」が表すハイパーテキストがブラウズされる
可能性がある。「生活へジャンプ」という音声入力をし
たとしても同様である。ユーザは、「助言へジャンプ」
と発声する必要がある。[0008] "Health condition of the Prime Minister""Nice life of the common people in the Edo period""Advisory for healthy eating habits" Here, the user is a hypertext represented by "Advising healthy eating habits" Even if you say "Jump to health" to browse, the hypertext that represents "the health condition of the Prime Minister" may be browsed. The same is true even if a voice input “jump to life” is made. The user "jumps to advice"
It is necessary to say.
【0009】次に、音声対話を実現するという観点か
ら、従来の音声ブラウジングのための操作は、不自然あ
るいは不完全であることが問題となる。つまり、従来の
音声ブラウジングにおいては、音声はブラウザに対する
命令としてのみ用いられ、人間対人間における対話と異
なり、一方的なものであり相互的ではない。音声出力と
しては、従来の技術では、リンク部分全てのテキストを
読み上げる機能がある。本発明は、この機能の相互性を
さらに高めるために、ユーザが音声入力した語と一致す
るリンクのテキストのみを読み上げる機能を追加・拡張
する。[0009] Next, from the viewpoint of realizing voice dialogue, there is a problem that the conventional operation for voice browsing is unnatural or incomplete. That is, in conventional voice browsing, voice is used only as a command to the browser, and unlike a human-to-human conversation, it is unilateral and not interactive. As the audio output, in the conventional technology, there is a function of reading out the text of the entire link portion. In order to further enhance the reciprocity of this function, the present invention adds and expands a function of reading out only the text of a link that matches a word spoken by the user.
【0010】[0010]
【課題を解決するための手段】本発明は、音声ブラウジ
ングの誤動作予防と対話的音声ブラウジングの高度化の
ために、ユーザが音声入力した語と一致するリンクのテ
キストのみを読み上げる機能を追加・拡張する。まず、
ブラウザがあるハイパーテキストHTを音声ブラウジン
グのためのハイパーテキスト中継装置に対して要求す
る。その中継装置は、HTからリンク部分L1,・・・,
Lnを抽出する。それぞれのLiに対して、テキスト部
分TiおよびURL部分URLiに分割し、Tiからさ
らに音声認識のための音声認識語(Wi1,・・・,Wi
m)を特定する。これらの単語Wijを含むテキストT
iのみを読み上げる、以下のような音声コマンドを作成
する。 「Wijを読み上げ」−>読み上げ(Ti) 次に、中継装置は、以上のような音声コマンドをハイパ
ーテキストへ付与し、その要求元であるブラウザへ送信
し、ブラウザはそのハイパーテキストをユーザに表示す
る。このとき、このブラウザが音声入出力機能を備えた
ものであれば、ユーザは以下のような操作を行うことが
できる。「〜を読み上げ」という音声入力を行って、
「〜」を含むリンクのテキストを読み上げさせる。SUMMARY OF THE INVENTION The present invention adds / extends a function of reading out only text of a link that matches a word input by a user in order to prevent malfunction of voice browsing and to enhance interactive voice browsing. I do. First,
A browser requests a hypertext HT from a hypertext relay device for audio browsing. The relay device transmits link portions L1,.
Extract Ln. For each Li, it is divided into a text part Ti and a URL part URLi, and a speech recognition word (Wi1,..., Wi,
m) is specified. Text T containing these words Wij
Create the following voice command that reads out only i. “Speak Wij” —> Speech (Ti) Next, the relay device attaches the voice command as described above to the hypertext, transmits the command to the browser that has made the request, and the browser displays the hypertext to the user. I do. At this time, if the browser has a voice input / output function, the user can perform the following operation. Speak "Read aloud"
Have the text of the link containing "~" be read aloud.
【0011】[0011]
【発明の実施の形態】図1に本発明の原理構成図を示
す。ユーザは音声により音声ブラウザを介して中継装置
に対してハイパーテキストの取得を要求し、中継装置
は、コンピュータネットワークからハイパーテキストを
読み込んで音声ブラウザに送信し、このブラウザはハイ
パーテキストを表示する。また、ユーザは音声により音
声ブラウザへリンクの読み上げを指示する。FIG. 1 is a diagram showing the principle of the present invention. The user requests the relay device to acquire the hypertext by voice via the voice browser, and the relay device reads the hypertext from the computer network and transmits the hypertext to the voice browser, and the browser displays the hypertext. Further, the user instructs the voice browser to read out the link by voice.
【0012】図2に、本発明を適用するハイパーテキス
トブラウジングシステムの構成図を示す。ハイパーテキ
ストブラウジングシステムは、インターネット等のコン
ピュータネットワーク1、中継装置2、音声ブラウザ3
を備え、コンピュータネットワーク1と中継装置2は通
信回線4、及び中継装置2と音声ブラウザ3は通信回線
5を介して接続されている。FIG. 2 shows a configuration diagram of a hypertext browsing system to which the present invention is applied. The hypertext browsing system includes a computer network 1 such as the Internet, a relay device 2, and a voice browser 3.
The computer network 1 and the relay device 2 are connected via a communication line 4, and the relay device 2 and the voice browser 3 are connected via a communication line 5.
【0013】中継装置2は、ハイパーテキスト読込部2
1、リンク抽出部22、音声認識語特定部23、音声コマン
ド作成部24、ハイパーテキスト付与部25、要求元ブラウ
ザ送信部26、及びバッファ27から構成される。また、音
声ブラウザ3は、ブラウザ31、音声認識装置32、コマン
ド解釈実行装置33、音声入力装置34、音声合成装置35、
及び音声出力装置36から構成される。中継装置2と音声
ブラウザ3の動作を説明する。 (1)ハイパーテキスト読込部21は、音声ブラウザ3か
らハイパーテキストが要求されると通信回線4で接続さ
れているコンピュータネットワーク1からハイパーテキ
ストを読み込んでバッファ27に格納する。 (2)リンク抽出部22は、バッファ27のハイパーテキスト
に対して、リンク部分を抽出する。 (3)音声認識特定部23は、リンク抽出部22で抽出された
リンクをテキスト部分とURL部分に分割し、テキスト
部分からさらに音声認識のための音声認識語を特定す
る。(特開平10−154063号公報 参照) (4)音声コマンド作成部24は、音声認識特定部23で特定
された全ての音声認識語に対して、その単語を含むリン
クのテキストを読み上げる音声コマンドを作成する。 (5)ハイパーテキスト付与部25は、音声コマンド作成部2
4で作成された音声コマンドをハイパーテキストに付与
する。 (6)要求元ブラウザ送信部26は、音声コマンドが付与さ
れたハイパーテキストをブラウザ31に通信回線5を介し
て送信する。 (7)ブラウザ31は、音声コマンドが付与されたハイパー
テキストを受信して表示装置に表示し、音声合成装置3
5、及び音声出力装置36を介して出力し、また、音声認
識装置32に出力する。 (8)音声入力装置34は、ユーザのマイク等からのコマン
ド音声を入力し、音声認識装置32に音声データを出力す
る。 (9)音声認識装置32は、音声データを音声認識し、ブラ
ウザ31から受け取った音声コマンドの中で最も近いもの
を選択してコマンド解釈実行装置33に出力する。 (10)コマンド解釈実行装置33は、音声認識装置32から受
け取った音声コマンドを解釈してその結果に基づいてブ
ラウザ31の動作を制御する。 (11)ブラウザ31は、音声コマンドを中継装置2に送信す
る。 (12)中継装置2は、音声コマンドを受信し、コマンドを
実行してテキストをコンピュータネットワークから読み
込んでブラウザ31に送信する。The relay device 2 includes a hypertext reading unit 2
1. A link extraction unit 22, a speech recognition word identification unit 23, a speech command creation unit 24, a hypertext assignment unit 25, a request source browser transmission unit 26, and a buffer 27. The speech browser 3 includes a browser 31, a speech recognition device 32, a command interpretation execution device 33, a speech input device 34, a speech synthesis device 35,
And an audio output device 36. The operation of the relay device 2 and the voice browser 3 will be described. (1) When a hypertext is requested from the voice browser 3, the hypertext reading unit 21 reads the hypertext from the computer network 1 connected via the communication line 4 and stores the hypertext in the buffer 27. (2) The link extraction unit 22 extracts a link portion from the hypertext in the buffer 27. (3) The speech recognition specifying unit 23 divides the link extracted by the link extracting unit 22 into a text portion and a URL portion, and further specifies a speech recognition word for speech recognition from the text portion. (Refer to Japanese Patent Application Laid-Open No. H10-154063) (4) The voice command creation unit 24 outputs a voice command to read out the text of a link including the word for all the voice recognition words specified by the voice recognition specification unit 23. create. (5) The hypertext giving unit 25 is the voice command creating unit 2
Attach the voice command created in step 4 to the hypertext. (6) The request source browser transmission unit 26 transmits the hypertext to which the voice command has been added to the browser 31 via the communication line 5. (7) The browser 31 receives the hypertext to which the voice command has been added, displays it on the display device, and
5, and output via the voice output device 36 and to the voice recognition device 32. (8) The voice input device 34 inputs a command voice from a user's microphone or the like and outputs voice data to the voice recognition device 32. (9) The voice recognition device 32 performs voice recognition of the voice data, selects the closest voice command from the voice commands received from the browser 31, and outputs the selected voice command to the command interpretation execution device 33. (10) The command interpretation and execution device 33 interprets the voice command received from the voice recognition device 32 and controls the operation of the browser 31 based on the result. (11) The browser 31 transmits the voice command to the relay device 2. (12) The relay device 2 receives the voice command, executes the command, reads the text from the computer network, and transmits the text to the browser 31.
【0014】図3のフローチャートを参照して本発明の
ハイパーテキスト中継方法の具体例を説明する。まず、
(a)ブラウザは以下のようなハイパーテキストを音声ブ
ラウジングのためのハイパーテキスト中継装置に対して
要求する。 これは、<内閣総理大臣の健康状態>です。 これは、<江戸時代の粋な庶民生活>です。A specific example of the hypertext relay method of the present invention will be described with reference to the flowchart of FIG. First,
(a) The browser requests the following hypertext from the hypertext relay device for audio browsing. This is <the health condition of the Prime Minister>. This is the <style of the common people in the Edo period>.
【0015】これは、<健康的な食生活への助言>で
す。 ただし、<>で囲まれたテキストはリンクであることを
示す。 次に、(b)中継装置はコンピュータネットワークからハ
イパーテキストを取得してハイパーテキストからリンク
を以下のように抽出する。 <内閣総理大臣の健康状態> <江戸時代の粋な庶民生活> <健康的な食生活への助言> それぞれのリンクに対して、テキスト部分およびURL
部分に分割し、(c)テキスト部分から音声認識のための
音声認識語を以下のように特定する。This is <advice for healthy eating habits>. However, the text surrounded by <> indicates a link. Next, (b) the relay device acquires the hypertext from the computer network and extracts a link from the hypertext as follows. <Health condition of the Prime Minister><Nice life of the common people in the Edo era><Advisory advice for healthy eating habits> For each link, text part and URL
It is divided into parts, and (c) speech recognition words for speech recognition are specified from the text part as follows.
【0016】内閣、・・・、健康、状態、江戸、・・
・、庶民、生活、健康、・・・生活、・・・、助言 (d)これらのすべての単語に対して、それぞれの単語と
一致するリンクのテキストのみを読み上げる以下のよう
な音声コマンドを作成する。 「内閣」を読み上げ−>読み上げ(「内閣総理大臣の健康状態」) ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 「健康」を読み上げ−>読み上げ(「内閣総理大臣の健康状態」) 「状態」を読み上げ−>読み上げ(「内閣総理大臣の健康状態」) 「江戸」を読み上げ−>読み上げ(「江戸時代の粋な庶民生活」) ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 「庶民」を読み上げ−>読み上げ(「江戸時代の粋な庶民生活」) 「生活」を読み上げ−>読み上げ(「江戸時代の粋な庶民生活」) 「健康」を読み上げ−>読み上げ(「健康的な食生活への助言」) ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 「生活」を読み上げ−>読み上げ(「健康的な食生活への助言」) ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 「助言」を読み上げ−>読み上げ(「健康的な食生活への助言」) (e)中継装置は、以上のような音声コマンドをハイパー
テキストへ付与し、(f)その要求元であるブラウザへ送
信し、ブラウザはそのハイパーテキストをユーザに表示
する。このとき、このブラウザが音声入出力機能を備え
た音声ブラウザであれば、ユーザは例えば以下のような
操作を行うことができる。Cabinet, health, condition, Edo,
・, Common people, life, health, ... life, ..., advice (d) For all these words, create the following voice command that reads only the text of the link that matches each word I do. Read "Cabinet"-> Read ("Prime Minister's health") ... "Health"Speaking-> Speaking ("Prime Minister's Health") Speaking "State"-> Speaking ("Prime Minister's Health") Speaking "Edo"-> Speaking ("Stylish ordinary life in the Edo period" )) ………………………………………………………………………………………………………………………………. Read aloud "Life"-> Read aloud ("Nice life of the common people in the Edo era") Read aloud "Health"-> Read aloud ("Advice to a healthy diet") ···················································································· (Get advice for a healthy diet) ····························································································· (e) Relay The apparatus gives the voice command as described above to the hypertext, and (f) transmits the command to the browser that has made the request, and the browser displays the hypertext to the user. At this time, if the browser is a voice browser having a voice input / output function, the user can perform the following operation, for example.
【0017】「助言を読み上げ」という音声入力を行っ
て、音声合成機能により、テキスト「健康的な食生活へ
の助言」を読み上げさせる。また、中継装置2は、CP
Uやメモリ等を有するコンピュータとアクセス主体とな
るユーザが利用するユーザ端末と記録媒体とから構成さ
れ、記録媒体は、CD−ROM、磁気ディスク、半導体
メモリ等の機械読み取り可能な記録媒体であり、ここに
記録されたテキスト中継方法を実行させるプログラムは
コンピュータに読み取られ、コンピュータの動作を制御
し、コンピュータ上に前述した実施の形態における各構
成要素を実現する。A voice input of "speak out advice" is performed, and the text "advice to healthy eating habits" is read out by the voice synthesis function. Also, the relay device 2
A computer having a U, a memory, and the like, a user terminal used by a user who is an access subject, and a recording medium, wherein the recording medium is a machine-readable recording medium such as a CD-ROM, a magnetic disk, and a semiconductor memory; The program for executing the text relay method recorded here is read by a computer, controls the operation of the computer, and realizes each component in the above-described embodiment on the computer.
【0018】[0018]
【発明の効果】本発明は、リンクのテキストに含まれる
単語を用いた音声入力により、そのテキストを読み上げ
させることができる。これにより、現在用いようとして
いる単語でただしく音声ブラウズできるかどうかは、本
発明により確認できる。例えば、あるハイパーテキスト
のリンクのテキストが以下のようであったとする。 「内閣総理大臣の健康状態」 「江戸時代の粋な庶民生活」 「健康的な食生活への助言」 ここで、ユーザは、「健康的な食生活への助言」が表す
ハイパーテキストをブラウズするために、「健康を読み
上げ」という音声入力でそのリンクのテキストを読み上
げさせる。それにより、例えば、「内閣総理大臣の健康
状態」と読み上げられたときには、「健康へジャンプ」
では「内閣総理大臣の健康状態」が表すハイパーテキス
トをブラウズすることになりかねないことがわかる。本
発明が提供する機能をユーザが用いることで誤ったブラ
ウジングを事前に避けることができるという効果があ
る。 また、音声の入力に対し、その内容に即した音声
の出力で答える、より人間対人間における対話に近い形
での音声ブラウジングを可能とした。According to the present invention, the text can be read aloud by voice input using a word included in the text of the link. By this means, it can be confirmed by the present invention whether or not the current word to be used can be properly browsed. For example, assume that the text of a hypertext link is as follows. "Health condition of the Prime Minister""Nice life of the common people in the Edo era""Advisory for healthy eating habits" Here, the user browses the hypertext represented by "Advising healthy eating habits" For this purpose, the text of the link is read aloud by voice input of “reading out health”. Thus, for example, when the phrase "Health condition of the Prime Minister" is read out, "Jump to health"
Then you can see that you may be browsing the hypertext that represents "the health condition of the Prime Minister." By using the function provided by the present invention by a user, there is an effect that erroneous browsing can be avoided in advance. In addition, it is possible to perform voice browsing in a form closer to a human-to-human conversation, in which a voice input corresponding to the content is answered with a voice output.
【図1】本発明の原理構成図。FIG. 1 is a diagram illustrating the principle of the present invention.
【図2】本発明を適用するハイパーテキストブラウジン
グシステムの構成図。FIG. 2 is a configuration diagram of a hypertext browsing system to which the present invention is applied.
【図3】本発明のハイパーテキスト中継方法の具体例を
説明するフローチャート。FIG. 3 is a flowchart illustrating a specific example of the hypertext relay method of the present invention.
1 コンピュータネットワーク 2 中継装置 3 音声ブラウザ 4、5 通信回線 21 ハイパーテキスト読込部 22 リンク抽出部 23 音声認識語特定部 24 音声コマンド作成部 25 ハイパーテキスト付与部 26 要求元ブラウザ送信部 31 ブラウザ 32 音声認識装置 33 コマンド解釈実行装置 34 音声入力装置 35 音声合成装置 36 音声出力装置 REFERENCE SIGNS LIST 1 computer network 2 relay device 3 voice browser 4, 5 communication line 21 hypertext reading unit 22 link extraction unit 23 voice recognition word specification unit 24 voice command creation unit 25 hypertext addition unit 26 requesting browser transmission unit 31 browser 32 voice recognition Device 33 Command interpreter 34 Voice input device 35 Voice synthesizer 36 Voice output device
Claims (3)
分を抽出し、それぞれのリンクに対して、テキスト部分
およびURL部分に分割し、それらのテキストからさら
に音声認識のための音声認識部を特定し、その全ての音
声認識語に対して、その単語を含むリンクのテキストを
読み上げる音声コマンドを作成し、音声コマンドをハイ
パーテキストへ付与し、その要求元であるブラウザへ送
信することを特徴とする音声ブラウジングのためのテキ
スト中継方法。1. A link portion is extracted from a requested hypertext, a link portion is divided into a text portion and a URL portion for each link, and a speech recognition unit for speech recognition is further specified from those texts. Speech browsing characterized by creating a speech command that reads out the text of a link containing the word for all of the speech recognition words, adding the speech command to the hypertext, and transmitting the hypertext to a browser that has requested the speech command. Text relay method for
部分を抽出するリンク抽出部と、それぞれのリンクに対
して、テキスト部分およびURL部分に分割し、それら
のテキストからさらに音声認識のための音声認識語を特
定する音声認識語特定部と、その全ての音声認識語に対
して、その単語を含むリンクのテキストを読み上げる音
声コマンドを作成する音声コマンド作成部と、音声コマ
ンドをハイパーテキストへ付与するハイパーテキスト付
与部と、音声コマンドを付与したハイパーテキストをそ
の要求元であるブラウザへ送信する要求元ブラウザ送信
部から構成されることを特徴とする音声ブラウジングの
ためのテキスト中継装置。2. A link extraction unit for extracting a link portion from a requested hypertext, a text portion and a URL portion for each link, and a speech recognition word for speech recognition from those texts. A voice recognition word specifying unit for specifying a voice command, a voice command generation unit for generating a voice command for reading out a text of a link including the word for all the voice recognition words, and a hypertext for adding the voice command to the hypertext A text relay device for voice browsing, comprising: an assigning unit; and a request source browser transmitting unit that transmits a hypertext to which a voice command has been assigned to a browser that has requested the hypertext.
分を抽出し、それぞれのリンクに対して、テキスト部分
およびURL部分に分割し、それらのテキストからさら
に音声認識のための音声認識語を特定する処理と、その
全ての音声認識語に対して、その単語を含むリンクのテ
キストを読み上げる音声コマンドを作成し、音声コマン
ドをハイパーテキストへ付与する処理と、音声コマンド
を付与したハイパーテキストをその要求元であるブラウ
ザへ送信する処理からなる音声ブラウジングのためのテ
キスト中継方法をコンピュータに実行させるプログラム
を記録した記録媒体。3. A process for extracting a link portion from a requested hypertext, dividing each link into a text portion and a URL portion, and further specifying a speech recognition word for speech recognition from those texts. For all of the voice recognition words, a voice command that reads out the text of the link containing the word is created, and the voice command is attached to the hypertext. A recording medium on which a program for causing a computer to execute a text relay method for audio browsing including a process of transmitting to a certain browser is recorded.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000231219A JP3825234B2 (en) | 2000-07-31 | 2000-07-31 | Hypertext relay method and apparatus for voice browsing, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000231219A JP3825234B2 (en) | 2000-07-31 | 2000-07-31 | Hypertext relay method and apparatus for voice browsing, and recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002041556A true JP2002041556A (en) | 2002-02-08 |
JP3825234B2 JP3825234B2 (en) | 2006-09-27 |
Family
ID=18724085
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000231219A Expired - Fee Related JP3825234B2 (en) | 2000-07-31 | 2000-07-31 | Hypertext relay method and apparatus for voice browsing, and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3825234B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020181587A (en) * | 2014-01-23 | 2020-11-05 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | Method and apparatus of displaying information |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10154063A (en) * | 1996-11-22 | 1998-06-09 | Nippon Telegr & Teleph Corp <Ntt> | Hyper text relaying method and device therefor |
JPH10222342A (en) * | 1997-02-06 | 1998-08-21 | Nippon Telegr & Teleph Corp <Ntt> | Hypertext speech control method and device therefor |
JPH1125098A (en) * | 1997-06-24 | 1999-01-29 | Internatl Business Mach Corp <Ibm> | Information processor and method for obtaining link destination file and storage medium |
-
2000
- 2000-07-31 JP JP2000231219A patent/JP3825234B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10154063A (en) * | 1996-11-22 | 1998-06-09 | Nippon Telegr & Teleph Corp <Ntt> | Hyper text relaying method and device therefor |
JPH10222342A (en) * | 1997-02-06 | 1998-08-21 | Nippon Telegr & Teleph Corp <Ntt> | Hypertext speech control method and device therefor |
JPH1125098A (en) * | 1997-06-24 | 1999-01-29 | Internatl Business Mach Corp <Ibm> | Information processor and method for obtaining link destination file and storage medium |
Non-Patent Citations (1)
Title |
---|
桂浦誠,外2名: "音声キーワードによるネットサーフィンの実現", 情報処理学会研究報告, vol. 第98巻,第12号, CSNG199800412010, 5 February 1998 (1998-02-05), JP, pages 69 - 74, ISSN: 0000747000 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020181587A (en) * | 2014-01-23 | 2020-11-05 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | Method and apparatus of displaying information |
JP7086137B2 (en) | 2014-01-23 | 2022-06-17 | アドバンスド ニュー テクノロジーズ カンパニー リミテッド | How and equipment to display information |
Also Published As
Publication number | Publication date |
---|---|
JP3825234B2 (en) | 2006-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11347801B2 (en) | Multi-modal interaction between users, automated assistants, and other computing services | |
KR100561228B1 (en) | Method for VoiceXML to XHTML+Voice Conversion and Multimodal Service System using the same | |
JP4225703B2 (en) | Information access method, information access system and program | |
US7685252B1 (en) | Methods and systems for multi-modal browsing and implementation of a conversational markup language | |
JP4090040B2 (en) | Method and system for creating a two-way multimodal dialogue and related browsing mechanism | |
US7016848B2 (en) | Voice site personality setting | |
JP3864197B2 (en) | Voice client terminal | |
US20030046316A1 (en) | Systems and methods for providing conversational computing via javaserver pages and javabeans | |
GB2383918A (en) | Collecting user-interest information regarding a picture | |
JP2002251233A (en) | Method for managing dynamic context and system for the same | |
Wang | SALT: A spoken language interface for web-based multimodal dialog systems | |
JP2005527020A (en) | Simultaneous multimodal communication system and method using simultaneous multimodal tags | |
JP2008145769A (en) | Interaction scenario creation system, its method, and program | |
US20040201591A1 (en) | Data transfer method, data transfer program, storage medium and information terminal | |
JP3714159B2 (en) | Browser-equipped device | |
JPH10154063A (en) | Hyper text relaying method and device therefor | |
JP2002041556A (en) | Method and device for relaying hyper text for voice browsing, and recording medium | |
JP2002091473A (en) | Information processor | |
JPH10322478A (en) | Hypertext access device in voice | |
JP4014361B2 (en) | Speech synthesis apparatus, speech synthesis method, and computer-readable recording medium recording speech synthesis program | |
JPH10326178A (en) | Information processor and program storage medium | |
JP2007164210A (en) | System for converting content to voice | |
Wang | SALT: an XML application for web-based multimodal dialog management | |
JP2005181358A (en) | Speech recognition and synthesis system | |
WO2011004000A2 (en) | Information distributing system with feedback mechanism |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050621 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050805 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20050805 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060613 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060629 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090707 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100707 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110707 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120707 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130707 Year of fee payment: 7 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |