JP2002041556A - Method and device for relaying hyper text for voice browsing, and recording medium - Google Patents

Method and device for relaying hyper text for voice browsing, and recording medium

Info

Publication number
JP2002041556A
JP2002041556A JP2000231219A JP2000231219A JP2002041556A JP 2002041556 A JP2002041556 A JP 2002041556A JP 2000231219 A JP2000231219 A JP 2000231219A JP 2000231219 A JP2000231219 A JP 2000231219A JP 2002041556 A JP2002041556 A JP 2002041556A
Authority
JP
Japan
Prior art keywords
hypertext
voice
text
link
browser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000231219A
Other languages
Japanese (ja)
Other versions
JP3825234B2 (en
Inventor
Hideaki Iwamoto
秀明 岩本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000231219A priority Critical patent/JP3825234B2/en
Publication of JP2002041556A publication Critical patent/JP2002041556A/en
Application granted granted Critical
Publication of JP3825234B2 publication Critical patent/JP3825234B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a method for relaying hyper text for preventing the malfunction of voice browsing and performing interactive browsing. SOLUTION: A browser requests a hyper text to the hyper text relay apparatus for voice browsing and the relay apparatus acquires the hyper text from a computer network and extracts a link from the hyper text. Each of links is divided into a text part and a URL part, a voice recognition word for voice recognition is specified from the text part, a voice command for reading only the text of the link matching with each of words is prepared concerning all these words, this voice command is applied to the hyper text and transmitted to the browser of a request source, and the browser displays that hyper text.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、音声ブラウジング
のためのハイパーテキスト中継方法及び装置並びに記録
媒体に関わり、特に、読み上げるリンクの指定をブラウ
ザからの音声入力によって行う音声ブラウジングのため
のハイパーテキスト中継方法及び装置並びに記録媒体に
関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a hypertext relay method and apparatus for voice browsing and a recording medium, and more particularly to a hypertext relay for voice browsing in which a link to be read is specified by voice input from a browser. The present invention relates to a method and an apparatus, and a recording medium.

【0002】[0002]

【従来の技術】近年、インターネット等のコンピュータ
ネットワークを介し、ハイパーテキストに基づいて、ハ
イパーテキストの表示装置によるその要求、受信、表示
という動作を実現するWWW(World Wide Web)という
枠組みが一般に普及した。ハイパーテキストには、他の
ハイパーテキストの在処を示すURL(uniformresourc
e locator)とそのラベルを記述することができる。ラ
ベルには、テキストやイメージなどを用いる。
2. Description of the Related Art In recent years, a framework called WWW (World Wide Web) for realizing operations of requesting, receiving, and displaying a hypertext by a hypertext based display device via a computer network such as the Internet has become popular. . The hypertext contains a URL (uniformresourc) indicating the location of another hypertext.
e locator) and its label. For the label, a text or an image is used.

【0003】ハイパーテキスト上のURLとそのラベル
とを合わせてリンクと呼ぶ。ハイパーテキストの表示装
置はブラウザと呼ばれ、コンピュータネットワークとハ
イパーテキスト中継装置(プロキシ サーバー)を介
し、以下のように機能する。まず、ハイパーテキストを
ブラウザに表示すると、ブラウザはリンク部分を異なる
色などによって強調表示する。ユーザは、マウスなどの
ポインティング装置により、このようなリンク部分に対
して、クリック操作を行い、リンクに指定されているハ
イパーテキストを選択する。このとき、ブラウザは、中
継装置にユーザが選択したハイパーテキストの送信要求
を行う。中継装置は、ブラウザからの送信要求から、該
当するハイパーテキストの在処をコンピュータネットワ
ークから特定し、該当ハイパーテキストをコンピュータ
ネットワークから要求元のブラウザへ送信する。ブラウ
ザは、中継装置が送信するハイパーテキストをユーザに
対して表示する。
[0003] The URL and the label on the hypertext are collectively called a link. The hypertext display device is called a browser, and functions as follows via a computer network and a hypertext relay device (proxy server). First, when the hypertext is displayed in the browser, the browser highlights the link portion with a different color or the like. The user performs a click operation on such a link portion using a pointing device such as a mouse, and selects hypertext specified in the link. At this time, the browser requests the relay device to transmit the hypertext selected by the user. The relay device specifies the location of the relevant hypertext from the computer network from the transmission request from the browser, and transmits the relevant hypertext from the computer network to the requesting browser. The browser displays the hypertext transmitted by the relay device to the user.

【0004】WWWの普及に伴い、ハイパーテキストの
仕様も多様化・高機能化し、その表示装置であるブラウ
ザもこれに対応してきた。このような状況において、人
間が発声する音声を用いてブラウジングする方法が発明
された。これを音声ブラウジングと呼ぶことにする。特
開平10−154063号公報(特願平8−312016号)には、既
存のハイパーテキストに音声ブラウジングを可能とする
命令を付加するハイパーテキスト中継方法及び装置が示
されている。また、特開平10−222342号公報(特願平9
−24024号)には、音声入力機能をブラウザに追加・拡
張するハイパーテキスト音声制御方法及び装置が示され
ている。音声ブラウジングは、これら双方の発明により
以下のように実現される。
[0004] With the spread of WWW, the specification of hypertext has also become diversified and sophisticated, and a browser as a display device has been adapted to this. In such a situation, a method of browsing using a voice uttered by a human has been invented. This is called audio browsing. Japanese Patent Application Laid-Open No. H10-155403 (Japanese Patent Application No. 8-312016) discloses a hypertext relay method and apparatus for adding an instruction enabling voice browsing to existing hypertext. Also, Japanese Patent Application Laid-Open No. Hei 10-222342 (Japanese Patent Application No.
No. 24024) discloses a hypertext voice control method and apparatus for adding and extending a voice input function to a browser. Voice browsing is realized as follows by both of these inventions.

【0005】まず、ブラウザがあるハイパーテキストを
音声ブラウジングのためのハイパーテキスト中継装置に
対して要求する。その中継装置は、要求があったハイパ
ーテイストに以下のような音声コマンドを付与する。 ・「リンク読み上げ」−>(T1,・・・,Ti,・・・,
Tn) ・「Wijへジャンプ」−>ジャンプ(URLi) ただし、Ti及びURLiは、あるリンクLiのそれぞ
れテキスト部分及びURL部分とする。WijはTiに
含まれるある語とする。
[0005] First, a browser requests a hypertext from a hypertext relay device for voice browsing. The relay device adds the following voice command to the requested hypertaste.・ "Link reading"-> (T1, ..., Ti, ...,
Tn) "Jump to Wij"-> Jump (URLi) Here, Ti and URLi are a text part and a URL part of a certain link Li, respectively. Wij is a word included in Ti.

【0006】次に、中継装置は、以上のような音声コマ
ンドをハイパーテキストへ付与し、その要求元であるブ
ラウザへ送信し、ブラウザはそのハイパーテキストをユ
ーザへ表示する。このとき、このブラウザが音声入出力
機能を備えたものであれば、ユーザは以下のような操作
を行うことができる。 ・「リンク読み上げ」という音声入力を行って、ハイパ
ーテキストのリンク部分全てのテキストを読み上げさせ
る。 ・「〜へジャンプ」という音声入力を行って、「〜」を
含むリンクが指定するハイパーテキストを呼び出す。
[0006] Next, the relay device gives the voice command as described above to the hypertext, transmits the command to the browser that has made the request, and the browser displays the hypertext to the user. At this time, if the browser has a voice input / output function, the user can perform the following operation.・ Speech input “link readout” is performed to read out the text of all hypertext link portions.・ Speech input “jump to” is performed, and a hypertext specified by a link including “to” is called.

【0007】[0007]

【発明が解決しようとする課題】本発明は、音声ブラウ
ジングの誤動作予防と対話的音声ブラウジングの高度化
を解決すべき課題とする。まず、音声入力によるハイパ
ーテキストの呼び出しではリンクのテキストの表現によ
っては誤動作を招くという問題がある。これは、リンク
のそれぞれが同じ単語をそのテキストにもつ場合に生じ
る。例えば、あるハイパーテキストのリンクのテキスト
が以下のようであったとする。
SUMMARY OF THE INVENTION It is an object of the present invention to prevent malfunction of voice browsing and to enhance interactive voice browsing. First, there is a problem in that a hypertext call by voice input causes a malfunction depending on the expression of a link text. This occurs when each of the links has the same word in its text. For example, assume that the text of a hypertext link is as follows.

【0008】「内閣総理大臣の健康状態」 「江戸時代の粋な庶民生活」 「健康的な食生活への助言」 ここで、ユーザは、「健康的な食生活への助言」が表す
ハイパーテキストをブラウズするために、「健康へジャ
ンプ」という音声入力をしたとしても、「内閣総理大臣
の健康状態」が表すハイパーテキストがブラウズされる
可能性がある。「生活へジャンプ」という音声入力をし
たとしても同様である。ユーザは、「助言へジャンプ」
と発声する必要がある。
[0008] "Health condition of the Prime Minister""Nice life of the common people in the Edo period""Advisory for healthy eating habits" Here, the user is a hypertext represented by "Advising healthy eating habits" Even if you say "Jump to health" to browse, the hypertext that represents "the health condition of the Prime Minister" may be browsed. The same is true even if a voice input “jump to life” is made. The user "jumps to advice"
It is necessary to say.

【0009】次に、音声対話を実現するという観点か
ら、従来の音声ブラウジングのための操作は、不自然あ
るいは不完全であることが問題となる。つまり、従来の
音声ブラウジングにおいては、音声はブラウザに対する
命令としてのみ用いられ、人間対人間における対話と異
なり、一方的なものであり相互的ではない。音声出力と
しては、従来の技術では、リンク部分全てのテキストを
読み上げる機能がある。本発明は、この機能の相互性を
さらに高めるために、ユーザが音声入力した語と一致す
るリンクのテキストのみを読み上げる機能を追加・拡張
する。
[0009] Next, from the viewpoint of realizing voice dialogue, there is a problem that the conventional operation for voice browsing is unnatural or incomplete. That is, in conventional voice browsing, voice is used only as a command to the browser, and unlike a human-to-human conversation, it is unilateral and not interactive. As the audio output, in the conventional technology, there is a function of reading out the text of the entire link portion. In order to further enhance the reciprocity of this function, the present invention adds and expands a function of reading out only the text of a link that matches a word spoken by the user.

【0010】[0010]

【課題を解決するための手段】本発明は、音声ブラウジ
ングの誤動作予防と対話的音声ブラウジングの高度化の
ために、ユーザが音声入力した語と一致するリンクのテ
キストのみを読み上げる機能を追加・拡張する。まず、
ブラウザがあるハイパーテキストHTを音声ブラウジン
グのためのハイパーテキスト中継装置に対して要求す
る。その中継装置は、HTからリンク部分L1,・・・,
Lnを抽出する。それぞれのLiに対して、テキスト部
分TiおよびURL部分URLiに分割し、Tiからさ
らに音声認識のための音声認識語(Wi1,・・・,Wi
m)を特定する。これらの単語Wijを含むテキストT
iのみを読み上げる、以下のような音声コマンドを作成
する。 「Wijを読み上げ」−>読み上げ(Ti) 次に、中継装置は、以上のような音声コマンドをハイパ
ーテキストへ付与し、その要求元であるブラウザへ送信
し、ブラウザはそのハイパーテキストをユーザに表示す
る。このとき、このブラウザが音声入出力機能を備えた
ものであれば、ユーザは以下のような操作を行うことが
できる。「〜を読み上げ」という音声入力を行って、
「〜」を含むリンクのテキストを読み上げさせる。
SUMMARY OF THE INVENTION The present invention adds / extends a function of reading out only text of a link that matches a word input by a user in order to prevent malfunction of voice browsing and to enhance interactive voice browsing. I do. First,
A browser requests a hypertext HT from a hypertext relay device for audio browsing. The relay device transmits link portions L1,.
Extract Ln. For each Li, it is divided into a text part Ti and a URL part URLi, and a speech recognition word (Wi1,..., Wi,
m) is specified. Text T containing these words Wij
Create the following voice command that reads out only i. “Speak Wij” —> Speech (Ti) Next, the relay device attaches the voice command as described above to the hypertext, transmits the command to the browser that has made the request, and the browser displays the hypertext to the user. I do. At this time, if the browser has a voice input / output function, the user can perform the following operation. Speak "Read aloud"
Have the text of the link containing "~" be read aloud.

【0011】[0011]

【発明の実施の形態】図1に本発明の原理構成図を示
す。ユーザは音声により音声ブラウザを介して中継装置
に対してハイパーテキストの取得を要求し、中継装置
は、コンピュータネットワークからハイパーテキストを
読み込んで音声ブラウザに送信し、このブラウザはハイ
パーテキストを表示する。また、ユーザは音声により音
声ブラウザへリンクの読み上げを指示する。
FIG. 1 is a diagram showing the principle of the present invention. The user requests the relay device to acquire the hypertext by voice via the voice browser, and the relay device reads the hypertext from the computer network and transmits the hypertext to the voice browser, and the browser displays the hypertext. Further, the user instructs the voice browser to read out the link by voice.

【0012】図2に、本発明を適用するハイパーテキス
トブラウジングシステムの構成図を示す。ハイパーテキ
ストブラウジングシステムは、インターネット等のコン
ピュータネットワーク1、中継装置2、音声ブラウザ3
を備え、コンピュータネットワーク1と中継装置2は通
信回線4、及び中継装置2と音声ブラウザ3は通信回線
5を介して接続されている。
FIG. 2 shows a configuration diagram of a hypertext browsing system to which the present invention is applied. The hypertext browsing system includes a computer network 1 such as the Internet, a relay device 2, and a voice browser 3.
The computer network 1 and the relay device 2 are connected via a communication line 4, and the relay device 2 and the voice browser 3 are connected via a communication line 5.

【0013】中継装置2は、ハイパーテキスト読込部2
1、リンク抽出部22、音声認識語特定部23、音声コマン
ド作成部24、ハイパーテキスト付与部25、要求元ブラウ
ザ送信部26、及びバッファ27から構成される。また、音
声ブラウザ3は、ブラウザ31、音声認識装置32、コマン
ド解釈実行装置33、音声入力装置34、音声合成装置35、
及び音声出力装置36から構成される。中継装置2と音声
ブラウザ3の動作を説明する。 (1)ハイパーテキスト読込部21は、音声ブラウザ3か
らハイパーテキストが要求されると通信回線4で接続さ
れているコンピュータネットワーク1からハイパーテキ
ストを読み込んでバッファ27に格納する。 (2)リンク抽出部22は、バッファ27のハイパーテキスト
に対して、リンク部分を抽出する。 (3)音声認識特定部23は、リンク抽出部22で抽出された
リンクをテキスト部分とURL部分に分割し、テキスト
部分からさらに音声認識のための音声認識語を特定す
る。(特開平10−154063号公報 参照) (4)音声コマンド作成部24は、音声認識特定部23で特定
された全ての音声認識語に対して、その単語を含むリン
クのテキストを読み上げる音声コマンドを作成する。 (5)ハイパーテキスト付与部25は、音声コマンド作成部2
4で作成された音声コマンドをハイパーテキストに付与
する。 (6)要求元ブラウザ送信部26は、音声コマンドが付与さ
れたハイパーテキストをブラウザ31に通信回線5を介し
て送信する。 (7)ブラウザ31は、音声コマンドが付与されたハイパー
テキストを受信して表示装置に表示し、音声合成装置3
5、及び音声出力装置36を介して出力し、また、音声認
識装置32に出力する。 (8)音声入力装置34は、ユーザのマイク等からのコマン
ド音声を入力し、音声認識装置32に音声データを出力す
る。 (9)音声認識装置32は、音声データを音声認識し、ブラ
ウザ31から受け取った音声コマンドの中で最も近いもの
を選択してコマンド解釈実行装置33に出力する。 (10)コマンド解釈実行装置33は、音声認識装置32から受
け取った音声コマンドを解釈してその結果に基づいてブ
ラウザ31の動作を制御する。 (11)ブラウザ31は、音声コマンドを中継装置2に送信す
る。 (12)中継装置2は、音声コマンドを受信し、コマンドを
実行してテキストをコンピュータネットワークから読み
込んでブラウザ31に送信する。
The relay device 2 includes a hypertext reading unit 2
1. A link extraction unit 22, a speech recognition word identification unit 23, a speech command creation unit 24, a hypertext assignment unit 25, a request source browser transmission unit 26, and a buffer 27. The speech browser 3 includes a browser 31, a speech recognition device 32, a command interpretation execution device 33, a speech input device 34, a speech synthesis device 35,
And an audio output device 36. The operation of the relay device 2 and the voice browser 3 will be described. (1) When a hypertext is requested from the voice browser 3, the hypertext reading unit 21 reads the hypertext from the computer network 1 connected via the communication line 4 and stores the hypertext in the buffer 27. (2) The link extraction unit 22 extracts a link portion from the hypertext in the buffer 27. (3) The speech recognition specifying unit 23 divides the link extracted by the link extracting unit 22 into a text portion and a URL portion, and further specifies a speech recognition word for speech recognition from the text portion. (Refer to Japanese Patent Application Laid-Open No. H10-154063) (4) The voice command creation unit 24 outputs a voice command to read out the text of a link including the word for all the voice recognition words specified by the voice recognition specification unit 23. create. (5) The hypertext giving unit 25 is the voice command creating unit 2
Attach the voice command created in step 4 to the hypertext. (6) The request source browser transmission unit 26 transmits the hypertext to which the voice command has been added to the browser 31 via the communication line 5. (7) The browser 31 receives the hypertext to which the voice command has been added, displays it on the display device, and
5, and output via the voice output device 36 and to the voice recognition device 32. (8) The voice input device 34 inputs a command voice from a user's microphone or the like and outputs voice data to the voice recognition device 32. (9) The voice recognition device 32 performs voice recognition of the voice data, selects the closest voice command from the voice commands received from the browser 31, and outputs the selected voice command to the command interpretation execution device 33. (10) The command interpretation and execution device 33 interprets the voice command received from the voice recognition device 32 and controls the operation of the browser 31 based on the result. (11) The browser 31 transmits the voice command to the relay device 2. (12) The relay device 2 receives the voice command, executes the command, reads the text from the computer network, and transmits the text to the browser 31.

【0014】図3のフローチャートを参照して本発明の
ハイパーテキスト中継方法の具体例を説明する。まず、
(a)ブラウザは以下のようなハイパーテキストを音声ブ
ラウジングのためのハイパーテキスト中継装置に対して
要求する。 これは、<内閣総理大臣の健康状態>です。 これは、<江戸時代の粋な庶民生活>です。
A specific example of the hypertext relay method of the present invention will be described with reference to the flowchart of FIG. First,
(a) The browser requests the following hypertext from the hypertext relay device for audio browsing. This is <the health condition of the Prime Minister>. This is the <style of the common people in the Edo period>.

【0015】これは、<健康的な食生活への助言>で
す。 ただし、<>で囲まれたテキストはリンクであることを
示す。 次に、(b)中継装置はコンピュータネットワークからハ
イパーテキストを取得してハイパーテキストからリンク
を以下のように抽出する。 <内閣総理大臣の健康状態> <江戸時代の粋な庶民生活> <健康的な食生活への助言> それぞれのリンクに対して、テキスト部分およびURL
部分に分割し、(c)テキスト部分から音声認識のための
音声認識語を以下のように特定する。
This is <advice for healthy eating habits>. However, the text surrounded by <> indicates a link. Next, (b) the relay device acquires the hypertext from the computer network and extracts a link from the hypertext as follows. <Health condition of the Prime Minister><Nice life of the common people in the Edo era><Advisory advice for healthy eating habits> For each link, text part and URL
It is divided into parts, and (c) speech recognition words for speech recognition are specified from the text part as follows.

【0016】内閣、・・・、健康、状態、江戸、・・
・、庶民、生活、健康、・・・生活、・・・、助言 (d)これらのすべての単語に対して、それぞれの単語と
一致するリンクのテキストのみを読み上げる以下のよう
な音声コマンドを作成する。 「内閣」を読み上げ−>読み上げ(「内閣総理大臣の健康状態」) ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 「健康」を読み上げ−>読み上げ(「内閣総理大臣の健康状態」) 「状態」を読み上げ−>読み上げ(「内閣総理大臣の健康状態」) 「江戸」を読み上げ−>読み上げ(「江戸時代の粋な庶民生活」) ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 「庶民」を読み上げ−>読み上げ(「江戸時代の粋な庶民生活」) 「生活」を読み上げ−>読み上げ(「江戸時代の粋な庶民生活」) 「健康」を読み上げ−>読み上げ(「健康的な食生活への助言」) ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 「生活」を読み上げ−>読み上げ(「健康的な食生活への助言」) ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 「助言」を読み上げ−>読み上げ(「健康的な食生活への助言」) (e)中継装置は、以上のような音声コマンドをハイパー
テキストへ付与し、(f)その要求元であるブラウザへ送
信し、ブラウザはそのハイパーテキストをユーザに表示
する。このとき、このブラウザが音声入出力機能を備え
た音声ブラウザであれば、ユーザは例えば以下のような
操作を行うことができる。
Cabinet, health, condition, Edo,
・, Common people, life, health, ... life, ..., advice (d) For all these words, create the following voice command that reads only the text of the link that matches each word I do. Read "Cabinet"-> Read ("Prime Minister's health") ... "Health"Speaking-> Speaking ("Prime Minister's Health") Speaking "State"-> Speaking ("Prime Minister's Health") Speaking "Edo"-> Speaking ("Stylish ordinary life in the Edo period" )) ………………………………………………………………………………………………………………………………. Read aloud "Life"-> Read aloud ("Nice life of the common people in the Edo era") Read aloud "Health"-> Read aloud ("Advice to a healthy diet") ···················································································· (Get advice for a healthy diet) ····························································································· (e) Relay The apparatus gives the voice command as described above to the hypertext, and (f) transmits the command to the browser that has made the request, and the browser displays the hypertext to the user. At this time, if the browser is a voice browser having a voice input / output function, the user can perform the following operation, for example.

【0017】「助言を読み上げ」という音声入力を行っ
て、音声合成機能により、テキスト「健康的な食生活へ
の助言」を読み上げさせる。また、中継装置2は、CP
Uやメモリ等を有するコンピュータとアクセス主体とな
るユーザが利用するユーザ端末と記録媒体とから構成さ
れ、記録媒体は、CD−ROM、磁気ディスク、半導体
メモリ等の機械読み取り可能な記録媒体であり、ここに
記録されたテキスト中継方法を実行させるプログラムは
コンピュータに読み取られ、コンピュータの動作を制御
し、コンピュータ上に前述した実施の形態における各構
成要素を実現する。
A voice input of "speak out advice" is performed, and the text "advice to healthy eating habits" is read out by the voice synthesis function. Also, the relay device 2
A computer having a U, a memory, and the like, a user terminal used by a user who is an access subject, and a recording medium, wherein the recording medium is a machine-readable recording medium such as a CD-ROM, a magnetic disk, and a semiconductor memory; The program for executing the text relay method recorded here is read by a computer, controls the operation of the computer, and realizes each component in the above-described embodiment on the computer.

【0018】[0018]

【発明の効果】本発明は、リンクのテキストに含まれる
単語を用いた音声入力により、そのテキストを読み上げ
させることができる。これにより、現在用いようとして
いる単語でただしく音声ブラウズできるかどうかは、本
発明により確認できる。例えば、あるハイパーテキスト
のリンクのテキストが以下のようであったとする。 「内閣総理大臣の健康状態」 「江戸時代の粋な庶民生活」 「健康的な食生活への助言」 ここで、ユーザは、「健康的な食生活への助言」が表す
ハイパーテキストをブラウズするために、「健康を読み
上げ」という音声入力でそのリンクのテキストを読み上
げさせる。それにより、例えば、「内閣総理大臣の健康
状態」と読み上げられたときには、「健康へジャンプ」
では「内閣総理大臣の健康状態」が表すハイパーテキス
トをブラウズすることになりかねないことがわかる。本
発明が提供する機能をユーザが用いることで誤ったブラ
ウジングを事前に避けることができるという効果があ
る。 また、音声の入力に対し、その内容に即した音声
の出力で答える、より人間対人間における対話に近い形
での音声ブラウジングを可能とした。
According to the present invention, the text can be read aloud by voice input using a word included in the text of the link. By this means, it can be confirmed by the present invention whether or not the current word to be used can be properly browsed. For example, assume that the text of a hypertext link is as follows. "Health condition of the Prime Minister""Nice life of the common people in the Edo era""Advisory for healthy eating habits" Here, the user browses the hypertext represented by "Advising healthy eating habits" For this purpose, the text of the link is read aloud by voice input of “reading out health”. Thus, for example, when the phrase "Health condition of the Prime Minister" is read out, "Jump to health"
Then you can see that you may be browsing the hypertext that represents "the health condition of the Prime Minister." By using the function provided by the present invention by a user, there is an effect that erroneous browsing can be avoided in advance. In addition, it is possible to perform voice browsing in a form closer to a human-to-human conversation, in which a voice input corresponding to the content is answered with a voice output.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の原理構成図。FIG. 1 is a diagram illustrating the principle of the present invention.

【図2】本発明を適用するハイパーテキストブラウジン
グシステムの構成図。
FIG. 2 is a configuration diagram of a hypertext browsing system to which the present invention is applied.

【図3】本発明のハイパーテキスト中継方法の具体例を
説明するフローチャート。
FIG. 3 is a flowchart illustrating a specific example of the hypertext relay method of the present invention.

【符号の説明】[Explanation of symbols]

1 コンピュータネットワーク 2 中継装置 3 音声ブラウザ 4、5 通信回線 21 ハイパーテキスト読込部 22 リンク抽出部 23 音声認識語特定部 24 音声コマンド作成部 25 ハイパーテキスト付与部 26 要求元ブラウザ送信部 31 ブラウザ 32 音声認識装置 33 コマンド解釈実行装置 34 音声入力装置 35 音声合成装置 36 音声出力装置 REFERENCE SIGNS LIST 1 computer network 2 relay device 3 voice browser 4, 5 communication line 21 hypertext reading unit 22 link extraction unit 23 voice recognition word specification unit 24 voice command creation unit 25 hypertext addition unit 26 requesting browser transmission unit 31 browser 32 voice recognition Device 33 Command interpreter 34 Voice input device 35 Voice synthesizer 36 Voice output device

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】要求されたハイパーテキストからリンク部
分を抽出し、それぞれのリンクに対して、テキスト部分
およびURL部分に分割し、それらのテキストからさら
に音声認識のための音声認識部を特定し、その全ての音
声認識語に対して、その単語を含むリンクのテキストを
読み上げる音声コマンドを作成し、音声コマンドをハイ
パーテキストへ付与し、その要求元であるブラウザへ送
信することを特徴とする音声ブラウジングのためのテキ
スト中継方法。
1. A link portion is extracted from a requested hypertext, a link portion is divided into a text portion and a URL portion for each link, and a speech recognition unit for speech recognition is further specified from those texts. Speech browsing characterized by creating a speech command that reads out the text of a link containing the word for all of the speech recognition words, adding the speech command to the hypertext, and transmitting the hypertext to a browser that has requested the speech command. Text relay method for
【請求項2】 要求されたハイパーテキストからリンク
部分を抽出するリンク抽出部と、それぞれのリンクに対
して、テキスト部分およびURL部分に分割し、それら
のテキストからさらに音声認識のための音声認識語を特
定する音声認識語特定部と、その全ての音声認識語に対
して、その単語を含むリンクのテキストを読み上げる音
声コマンドを作成する音声コマンド作成部と、音声コマ
ンドをハイパーテキストへ付与するハイパーテキスト付
与部と、音声コマンドを付与したハイパーテキストをそ
の要求元であるブラウザへ送信する要求元ブラウザ送信
部から構成されることを特徴とする音声ブラウジングの
ためのテキスト中継装置。
2. A link extraction unit for extracting a link portion from a requested hypertext, a text portion and a URL portion for each link, and a speech recognition word for speech recognition from those texts. A voice recognition word specifying unit for specifying a voice command, a voice command generation unit for generating a voice command for reading out a text of a link including the word for all the voice recognition words, and a hypertext for adding the voice command to the hypertext A text relay device for voice browsing, comprising: an assigning unit; and a request source browser transmitting unit that transmits a hypertext to which a voice command has been assigned to a browser that has requested the hypertext.
【請求項3】要求されたハイパーテキストからリンク部
分を抽出し、それぞれのリンクに対して、テキスト部分
およびURL部分に分割し、それらのテキストからさら
に音声認識のための音声認識語を特定する処理と、その
全ての音声認識語に対して、その単語を含むリンクのテ
キストを読み上げる音声コマンドを作成し、音声コマン
ドをハイパーテキストへ付与する処理と、音声コマンド
を付与したハイパーテキストをその要求元であるブラウ
ザへ送信する処理からなる音声ブラウジングのためのテ
キスト中継方法をコンピュータに実行させるプログラム
を記録した記録媒体。
3. A process for extracting a link portion from a requested hypertext, dividing each link into a text portion and a URL portion, and further specifying a speech recognition word for speech recognition from those texts. For all of the voice recognition words, a voice command that reads out the text of the link containing the word is created, and the voice command is attached to the hypertext. A recording medium on which a program for causing a computer to execute a text relay method for audio browsing including a process of transmitting to a certain browser is recorded.
JP2000231219A 2000-07-31 2000-07-31 Hypertext relay method and apparatus for voice browsing, and recording medium Expired - Fee Related JP3825234B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000231219A JP3825234B2 (en) 2000-07-31 2000-07-31 Hypertext relay method and apparatus for voice browsing, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000231219A JP3825234B2 (en) 2000-07-31 2000-07-31 Hypertext relay method and apparatus for voice browsing, and recording medium

Publications (2)

Publication Number Publication Date
JP2002041556A true JP2002041556A (en) 2002-02-08
JP3825234B2 JP3825234B2 (en) 2006-09-27

Family

ID=18724085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000231219A Expired - Fee Related JP3825234B2 (en) 2000-07-31 2000-07-31 Hypertext relay method and apparatus for voice browsing, and recording medium

Country Status (1)

Country Link
JP (1) JP3825234B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020181587A (en) * 2014-01-23 2020-11-05 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited Method and apparatus of displaying information

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10154063A (en) * 1996-11-22 1998-06-09 Nippon Telegr & Teleph Corp <Ntt> Hyper text relaying method and device therefor
JPH10222342A (en) * 1997-02-06 1998-08-21 Nippon Telegr & Teleph Corp <Ntt> Hypertext speech control method and device therefor
JPH1125098A (en) * 1997-06-24 1999-01-29 Internatl Business Mach Corp <Ibm> Information processor and method for obtaining link destination file and storage medium

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10154063A (en) * 1996-11-22 1998-06-09 Nippon Telegr & Teleph Corp <Ntt> Hyper text relaying method and device therefor
JPH10222342A (en) * 1997-02-06 1998-08-21 Nippon Telegr & Teleph Corp <Ntt> Hypertext speech control method and device therefor
JPH1125098A (en) * 1997-06-24 1999-01-29 Internatl Business Mach Corp <Ibm> Information processor and method for obtaining link destination file and storage medium

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
桂浦誠,外2名: "音声キーワードによるネットサーフィンの実現", 情報処理学会研究報告, vol. 第98巻,第12号, CSNG199800412010, 5 February 1998 (1998-02-05), JP, pages 69 - 74, ISSN: 0000747000 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020181587A (en) * 2014-01-23 2020-11-05 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited Method and apparatus of displaying information
JP7086137B2 (en) 2014-01-23 2022-06-17 アドバンスド ニュー テクノロジーズ カンパニー リミテッド How and equipment to display information

Also Published As

Publication number Publication date
JP3825234B2 (en) 2006-09-27

Similar Documents

Publication Publication Date Title
US11347801B2 (en) Multi-modal interaction between users, automated assistants, and other computing services
KR100561228B1 (en) Method for VoiceXML to XHTML+Voice Conversion and Multimodal Service System using the same
JP4225703B2 (en) Information access method, information access system and program
US7685252B1 (en) Methods and systems for multi-modal browsing and implementation of a conversational markup language
JP4090040B2 (en) Method and system for creating a two-way multimodal dialogue and related browsing mechanism
US7016848B2 (en) Voice site personality setting
JP3864197B2 (en) Voice client terminal
US20030046316A1 (en) Systems and methods for providing conversational computing via javaserver pages and javabeans
GB2383918A (en) Collecting user-interest information regarding a picture
JP2002251233A (en) Method for managing dynamic context and system for the same
Wang SALT: A spoken language interface for web-based multimodal dialog systems
JP2005527020A (en) Simultaneous multimodal communication system and method using simultaneous multimodal tags
JP2008145769A (en) Interaction scenario creation system, its method, and program
US20040201591A1 (en) Data transfer method, data transfer program, storage medium and information terminal
JP3714159B2 (en) Browser-equipped device
JPH10154063A (en) Hyper text relaying method and device therefor
JP2002041556A (en) Method and device for relaying hyper text for voice browsing, and recording medium
JP2002091473A (en) Information processor
JPH10322478A (en) Hypertext access device in voice
JP4014361B2 (en) Speech synthesis apparatus, speech synthesis method, and computer-readable recording medium recording speech synthesis program
JPH10326178A (en) Information processor and program storage medium
JP2007164210A (en) System for converting content to voice
Wang SALT: an XML application for web-based multimodal dialog management
JP2005181358A (en) Speech recognition and synthesis system
WO2011004000A2 (en) Information distributing system with feedback mechanism

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050621

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050805

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20050805

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060613

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060629

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090707

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100707

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110707

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120707

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130707

Year of fee payment: 7

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees