JP2001075968A - 情報検索方法及びそれを記録した記録媒体 - Google Patents
情報検索方法及びそれを記録した記録媒体Info
- Publication number
- JP2001075968A JP2001075968A JP24553599A JP24553599A JP2001075968A JP 2001075968 A JP2001075968 A JP 2001075968A JP 24553599 A JP24553599 A JP 24553599A JP 24553599 A JP24553599 A JP 24553599A JP 2001075968 A JP2001075968 A JP 2001075968A
- Authority
- JP
- Japan
- Prior art keywords
- information
- recognition
- user
- server
- recognition result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
大きく削減し、使用方法が容易で、かつ、所望の情報を
取得するまでの時間を大幅に削減する、音声制御による
情報検索方法を記録した記録媒体を提供する。 【解決手段】 演算手段1、表示手段2、記憶手段3、
通信手段6、キーボード4、指示手段5、音声入力手段
7から構成される情報処理装置上で動作するプログラム
として実現され、複数の音声認識結果から得られたアク
セス用のコードデータと、テンプレートとを用いてサー
バのアクセス命令を作成し、直接目的のWebページに
アクセスすることで、サーバへのアクセス回数も1回だ
けとなる。この結果、目的のWebページに至る経路情
報を知らなくても所望の情報を入手することができる。
Description
ーバの提供する情報へのアクセスを実現するための情報
検索方法及びそれを記録した記録媒体に関する。
組表、天気、ニュースなどさまざまな情報が提供されて
いる。利用者は、携帯型の情報処理装置上で、情報アク
セス用のアプリケーションであるブラウザを使用して、
任意の場所から必要な情報にアクセス可能となった。利
用者はなんらかの情報を知りたい場合には、最初にポー
タルと呼ばれる起点となるWebページにアクセスし、
前記Webページから関連するページを順次指示するこ
とで目的の情報を得ることができる。
(Hyper Text Markup Langua
ge)文書を解析し、表示用データを作成し画面に提示
する。このとき画面サイズが文書サイズより小さい場合
は、文書の一部分のみ表示し、利用者は必要に応じて表
示画面のスクロールを指示する。Webページによって
は、1つのページに多くの情報を含んでいる場合があ
り、利用者は目的とする情報を知るためには、前記当す
る場所までページをスクロールする必要がある。特に携
帯型の情報処理装置では、表示画面が小さいために移動
量は大きくなる問題が生じる。
より、多くの利用者がオフィスや自宅以外の様々な場所
で利用する機会が増えている。これまでのように机の前
でイスに座りながらキーボードやマウスで操作するスタ
イルだけではなく、場所・用途に適応した入力方法が必
要になってきている。
用化され始めており、メニュー選択や、文書入力手段と
して利用されている。最近では音声制御で、WWW(W
orld Wide Web)上のWebページにアク
セスする方法も実現されている。例えば、予め登録され
たキーワード発話により、そのキーワードに対応したW
ebページへのアクセスを実現した音声制御ブラウザが
利用されている。この方法では、ポータルと呼ばれる他
のWebページへのリンクを集めたWebページには、
音声でアクセスできるが、そこからリンク先のページへ
の移動は、利用者がマウスやキーボードなどの他の手段
で指示する必要がある。
ーと呼ばれるリンク先を示す文章そのものを発話する方
法(特開平10−124293号)、あるいは、アンカ
ー内の文章から選択したキーワードを発話する方法(特
開平11−25098号)など、音声の指示だけで関連
するWebページへの移動を実現する方法が提案されて
いる。
された文書を解析し、TAGと呼ばれる識別子を手がか
りに、アンカー文とリンク先情報(URL)を取得し、
メモリに対応関係を一時的に記録し、音声辞書には、ア
ンカー文の読みデータ、あるいはアンカー文から抽出し
たキーワードの読みデータを登録する。音声認識エンジ
ンが利用者の発話を認識すると、システムは認識結果に
対応するリンク先情報(URL)を取得し、ブラウザに
そのURLのWebページをアクセスする命令を与え
る。ブラウザはWebページ取得後、システムは再びH
TML文章を解析することで更なる移動を実現する。
ページまでアクセス可能となったが、サーバが提供する
情報が多い場合には、そのWebページの構成を把握し
ていないと、目的のWebページへの到達までに試行錯
誤を繰り返すこことなる。また、目的のWebページま
での到達方法を把握していても、何回もの指示を必要と
する。それゆえ、必要とする情報の取得には手間や時間
がかかり、利用者の利便性を損ねている。
場合など、通信回線の状況に遅延時間は左右されやす
く、またWebページのデータ量が大きい場合には、数
分から十数分のアクセス時間が必要となる。
定キーワードの認識ができない場合がある。そのような
場合のため何らかの代替手段は必要である。また、予め
認識対象をエンジンに登録しておく必要があり、対象と
する件数が多い場合には、認識に要するメモリサイズや
遅延時間など、携帯情報処理装置を考慮すると実用上の
課題が生じる。
場合には、一旦検索条件を設定するぺージに戻り、再度
入力を行う必要があり、これも利用者の利便性を損ねて
いる。従来、複数の種類のデータを音声で入力する場合
には、銀行のATMように予め決められた手順に従って
入力を行う必要があり、システム主導で対話が進んでい
く。
画面を利用者に提示し、利用者にデータ入力を行うスロ
ットを選択させ、そのスロットに関連した認識辞書を準
備して、データ入力を行う方法が考えられる。この方法
ではスロットに関連したデータしか認識しないため、他
のスロット向けの単語を誤認識することはない。また、
誤認識が生じた場合でも、正しく認識するまで再度発話
するだけで良い。しかしこの方法では、指示手段でスロ
ットを指定する手間が生じる。
来の音声制御ブラウザでは、必要な情報の所得までに要
する手間や時間が多いという問題があった。
指示の手間を大きく削減し、使用方法が容易で、かつ、
所望の情報を取得するまでの時間を大幅に削減する、音
声制御による情報検索方法及びそれを記録した記録媒体
を提供することを目的とする。
通信回線を通じて、ハイパーテキスト方式によってサー
バから提供される複数の表示単位から構成される集合情
報から、利用者が必要とする情報を検索する方法であっ
て、前記利用者が前記必要とする情報に関して発声した
音声の内容を認識する音声認識ステップと、前記音声認
識ステップにおいて認識した認識結果を所定の条件に基
づいて分類する認識結果分類ステップと、前記認識結果
分類ステップにより分類した1つ以上の認識結果を利用
して、前記集合情報から、前記必要とする情報を検索す
るためのアクセス命令を作成するアクセス命令作成ステ
ップと、前記アクセス命令作成ステップにおいて作成し
たアクセス命令を、前記電気通信回線を通じて前記サー
バへ送信する送信ステップと、前記検索した情報を、前
記電気通信回線を通じて前記サーバから受信する受信ス
テップと、前記受信ステップにおいて受信した情報の一
部または全体を出力する出力ステップと、を有すること
を特徴とする情報検索方法である。
いて受信した情報から、前記認識結果に関連する情報を
選択する関連情報選択ステップを有することを特徴とす
る請求項1記載の情報検索方法である。
ステップは、前記認識結果分類ステップにより認識した
1つ以上の認識結果を利用して複数のアクセス命令を作
成することを特徴とする請求項1記載の情報検索方法で
ある。
ップにより分類した認識結果を、その分類に対応させた
状態で前記利用者に表示する表示ステップを有すること
を特徴とする請求項1、2、3記載の情報検索方法であ
る。
で認識する利用者の状況を認識する状況認識ステップを
有し、前記アクセス命令作成ステップは、前記認識結果
分類ステップにより分類した前記1つ以上の音声に基づ
く認識結果と、前記状況認識ステップにおいて認識した
1つ以上の状況に基づく認識結果を利用して前記アクセ
ス命令を作成することを特徴とする請求項1記載の情報
検索方法である。
の他の状態を認識する認識入力ステップと、前記アクセ
ス命令作成ステップは、前記認識結果分類ステップによ
り分類した前記1つ以上の音声に基づく認識結果と、前
記認識入力ステップにおいて認識した他の状態に基づく
認識結果を利用して前記アクセス命令を作成することを
特徴とする請求項1に記載の情報検索方法である。
て、ハイパーテキスト方式によってサーバから提供され
る複数の表示単位から構成される集合情報から、利用者
が必要とする情報を検索する方法を実現するためのプロ
グラムを記録した記録媒体であって、前記利用者が前記
必要とする情報に関して発声した音声の内容を認識する
音声認識機能と、前記音声認識機能において認識した認
識結果を所定の条件に基づいて分類する認識結果分類機
能と、前記認識結果分類機能により分類した1つ以上の
認識結果を利用して、前記集合情報から、前記必要とす
る情報を検索するためのアクセス命令を作成するアクセ
ス命令作成機能と、前記アクセス命令作成機能において
作成したアクセス命令を、前記電気通信回線を通じて前
記サーバへ送信する送信機能と、前記検索した情報を、
前記電気通信回線を通じて前記サーバから受信する受信
機能と、前記受信機能において受信した情報の一部また
は全体を出力する出力機能と、を実現するプログラムを
記録したことを特徴とする情報検索方法の記録媒体であ
る。
て、ハイパーテキスト方式によってサーバから提供され
る複数の表示単位から構成される集合情報から、利用者
が必要とする情報を検索する装置であって、前記利用者
が前記必要とする情報に関して発声した音声の内容を認
識する音声認識手段と、前記音声認識手段において認識
した認識結果を所定の条件に基づいて分類する認識結果
分類手段と、前記認識結果分類手段により分類した1つ
以上の認識結果を利用して、前記集合情報から、前記必
要とする情報を検索するためのアクセス命令を作成する
アクセス命令作成手段と、前記アクセス命令作成手段に
おいて作成したアクセス命令を、前記電気通信回線を通
じて前記サーバへ送信する送信手段と、前記検索した情
報を、前記電気通信回線を通じて前記サーバから受信す
る受信手段と、前記受信手段において受信した情報の一
部または全体を出力する出力手段と、を有することを特
徴とする情報検索装置である。
によれば、利用者は複数のキーワードの発話、あるいは
文章を発話するだけで、ハイパーテキスト方式によって
サーバから提供される複数の表示単位から構成される集
合情報から、利用者が必要とする情報を検索する場合
に,大幅に手間とアクセスまでの遅延時間を減少させる
ことが可能となる。
で、スクロールなどの手間を省くことが可能となり、小
型の情報処理装置での利便性が良くなる。
ることにより利便性を向上しつつ、入力時の手間を削減
している。
外の認識手段と組み合わせることで、入力の手間の削減
や音声入力ができない場合でも所望の情報にアクセス可
能となる。
基づいて説明する。
る。
ク図の一例であり、演算手段1、表示手段2、記憶手段
3、通信手段6、キーボード4、指示手段5、音声入力
手段7から構成される情報処理装置上で動作するプログ
ラムとして実現する。
体、あるいは通信手段6を通じてこの情報処理装置に読
み込まれるものとする。
されるメモリと呼ばれるRAM、永久に保存するための
ハードディスクなどの装置を用いる。RAMには本プロ
グラムや認識用辞書データやリンク管理テーブルなどの
作業用の変数が格納され、ハードディスクは、受信した
HTML文章のキャッシュ、音声認識用の音素データ、
読みデータ辞書などを記録する。
るビデオメモリ、DA変換部、CRTや液晶表示装置な
どで構成する。
AN、RS232C、セントロニクス、SCSI,US
B,IEEE1394など、あるいはケーブルを使用し
ない、無線LAN、赤外線通信、PHSデータ通信など
で実現する。
アキュポイント、ペン入力などで実現する。
接続し、入力された音声信号を、AD変換を通じてディ
ジタル信号に変換する。入力されたデータはメモリに格
納する。
手段とバス9を通じて接続されデータの送受信を行う。
理は、コンポーネント化されたブラウザモジュールを使
用することにより可能である。例えばマイクロソフト社
のブラウザは容易に他のプログラムからその機能を利用
できる。
状況を説明するため、タスクを駅施設の検索と仮定す
る。
しては、「駅前探検クラブ(商標、以下同様)」、ht
tp://ekimae.toshiba.co.jp
/などが存在する(平成11年8月17日現在)。利用
者は、このWebページを通じて、利用者が東京駅のタ
クシー乗り場に関する情報を音声指示で取得することと
設定する。
のアクセスを説明する。
をブラウザに記録しておき、ホームページやポータルと
呼ばれる起点となるWebページにアクセスする。
路線名を指定、さらに駅名を指定、最後に施設を指定す
るというように順番に検索用キーを指定することで、最
終的に所望のWebページにたどりつく。
するデータベースを所持しており、CGI(Commo
n Gateway Interface)と呼ばれる
技術を用いて、利用者からの問い合わせに対し、データ
ベースを検索し、問い合わせ毎に返答用のWebページ
を作成し、クライアントであるブラウザにHTML文章
を送信する。
るため識別子の例であり、図3に示す11から14の4
つの要素で構成される。
ージを示すものである。
ある。
ムは、これらを検索用のキーとしてデータベースを検索
する。
者がWebページを順番にアクセスする毎にCGI用の
コードが付与され、サーバは全てのコードが取得できた
場合に、データベースの検索を行う。このときサーバは
受信したコードの妥当性を検査し、正しければ各々のコ
ードをキーにデータベースを検索し、その結果をクライ
アントに送信する。
索用のパラメータ付加してを送信しているが、他のパラ
メータ送信方法(例えば、異なるプロトコルを使用す
る)でも同等の効果を有する。
施例に係るフローチャートの一例である。
動作する。
力手段7からの定期的割り込みにより、一定量の音声デ
ータを音声入力手段7から読み出し、メモリに記憶す
る。
たデータを用いて入力された音声データの類似度を計算
する。
した入力データを音声データとみなし、そのデータにフ
ーリエ変換を行い、周波数信号に変換し、特徴データを
作成する。
ら各単語の音素モデルを作成し、入力データの特徴デー
タと複数からなる認識単語データの特徴データとの距離
計算を行い、各単語についてのスコアーを求める。
合には、最良のスコアが得られた単語を認識結果して出
力する。
る。認識結果がエラーの場合には、ステップ101に戻
って音声入力待ちの状態となる。
名、全ての駅名、全ての施設名の読みデータである。
与したテーブルを作成し、予め記憶手段3に格納してお
く。
別、コードの並びになっている。同時にシステム制御用
の単語も登録する。例では、検索開始のトリガーとなる
単語を示す。同様の属性データと関連付けたテーブルを
作成する。テーブルは、左から順に、読みデータ、表示
データ、種別である。
語、例えば「とうきょう」をキーとし、上述したテーブ
ルを検索する。「とうきょう」のキーからは、表示用の
データ「東京」、入力されたデータの種類「駅」、デー
タベース検索用のコード「0000100」が得られ
る。
なものだけでなく、日時など動的に変化するものがあ
る。
認識エンジンからは「あす」という情報が得られる。こ
のような場合は、当日(仮に99年7月14日と仮定す
る)の情報を利用して、検索用コード990715を作
成するステップを準備する。この場合、上記のテーブル
は、データの種類に演算を、検索用のコードには日付計
算用の演算識別子を入れておく。演算手段1には、検索
用のコードと表示用のデータを作成するサブルーチンを
準備しておく。
る。判定方法は、データベースへのアクセス用に必要な
コードが全てそろったか検査する。
設コードの3つが入力されたか確認する。
一定期間入力を待ち、その期間内に更なる入力が行われ
ない場合は、これまで入力されたデータを確定したもの
と判断する。
御用のデータを登録しておき、入力された単語が制御命
令を示す単語と一致したら検索開始する方法でも同様の
効果が得られる。
入力をトリガーに用いる方法もある。
トに、確定したコードを挿入しWeb上のサーバへのア
クセス用データを作成する。
ようなURLをテンプレートとして準備しておく。
従い、前記テンプレートの前記当する部分、例えば駅を
示すコードであれば「ekiCode=」のあとに確定
したコード「0000100」を挿入する。テンプレー
トはタスクに応じて予め記憶手段3に記録しておき、タ
スクが決定した時点で記憶手段3から取得する。
示する。
ータを利用し、自動的に決定する方法も考えられる。
たら駅施設検索であることが決まるように、各々関連付
けたテーブルを記憶手段3に予め準備することで実現で
きる。
RLを用いて、通信手段6を通じて情報取得要求を送信
する。
HTML文書を一旦情報処理装置のメモリやキャッシュ
に保存する。
き解析し、表示用データを作成し、表示手段2を通じて
利用者に表示する。
ラウザと呼ばれるモジュールを利用することにより容易
に実現できる。
で、利用者は他の施設に関して再度アクセスする場合が
ある。
利用者の施設名の発話により、ステップ101からステ
ップ104を通じて、表示用データ、データの種類、検
索用コードがメモリに記憶される。入力終了判定ステッ
プ(ステップ106)では、前回入力された路線デー
タ、駅データと新たに入力された施設データから入力終
了と判定する。
得られたアクセス用のコードデータと、テンプレートと
を用いてサーバのアクセス命令を作成し、直接目的のW
ebページにアクセスすることで、サーバへのアクセス
回数も1回だけとなる。この結果、目的のWebページ
に至る経路情報を知らなくても所望の情報を入手するこ
とができる。また従来、複数回のアクセスが必要であっ
たが、その回数を1度に低減でき情報所得時の通信遅延
時間を短くすることができる。
用者は必要な情報を取得する場合には、必要なキーワー
ドを発話するだけでという容易な方法で、かつ入手まで
の遅延時間の少ない音声制御によるWebサーバへのイ
ンタフェースが実現できる。
ーワードを複数回発話する方式を説明したが、音声認技
術の他の方式であるワードスポット方式でも実現でき
る。
連する1つ以上のキーワードを抽出し、それらを用いて
前述のステップを実行することとなる。
析に計算機資源が必要となるが、反面利用者は会話に近
い形で質問を入力できる利点がある。
いて説明する。上記アクセス方式と重複する部分を除
き、異なるステップのみ説明する。
示すものである。
度を計算し、閾値以上の単語に関して、認識結果とスコ
アーや発話時刻情報を属性として出力する。通常このよ
うな単語の集まりをキーワードラティスと呼ぶ。
の切れ目をうまく検出できない場合があり、ラティスの
中には不要な単語が多く含まれている。
プ113)では、予め登録された文法的制約、各候補の
スコアー、発話時刻情報を元に利用者の発話を推定す
る。
した文の中に含まれるキーワードを取得する(ステップ
114)。
通知し、再度利用者からの入力を待つ(ステップ11
1)。
したステップ106から109と同じ処理を行うことに
より、自然言語を用いてインターネット上のサーバから
必要な情報が取得できる。
出力手段に用いることも可能である。
なく、与えられた文字データを音声データに変換する音
声合成エンジンモジュールが必要となる。音声合成エン
ジンは、プログラムや、DSPを使用して実現可能であ
る。音声認識及び音声合成を用いるインタフェースは、
ハンズフリーで使用でき、両手がふさがっている状況で
も必要な情報を得ることが可能となる。
アクセスを例にしたが、駅施設に限定されるものではな
く、旅行情報、株価、本、パソコンのパーツ、料理レシ
ピ、医療情報、テレビ番組、ニュース、地図、中古車、
不動産、オークションなど他の多くの分野にも容易に適
用可能である。
bページにアクセスすることも考えられる。
NDの論理演算を組み合わせて検索式を作り、検索サー
ビスを提供するWebページにアクセスし、検索結果を
取得して提示する。
り、AND,OR,NOTなどの論理式を組み合わせて
検索することも可能である。
を自装置に有する方式を説明したが、音声認識手段をサ
ーバクライアント方式で構成する方法も可能である。
ーバである他の情報処理装置とコネクションを確立し、
入力された音声信号をデジタル化したデータそのもの、
あるいは特徴データに変換した後のデータをサーバに送
信し、認識結果を受信することにより実現する。
ることで、前記情報を提供するWebページに一度でア
クセスが可能となり、従来の方法と比較して大幅に手順
や時間の短縮が実現できる。
る。
とする。
の実施例と同様の状況を想定するが、本説明では、サー
バから送信された情報(ステップ128)に複数の情報
が含まれている場合を仮定する。
ス乗り場」が含まれているものとする。
実施例の説明には影響しないので、ここでは施設の数を
2つとする。
例のステップ101から108と同様である。
元に解析し、利用者に必要な情報のみ選択する。
3)で得られた、施設を示す情報である「タクシー乗り
場」をキーにして、図10に示す文字情報から、関連す
る情報のみを選択する。
示す表示用文字データを作成し、表示手段3に出力す
る。
ているが、そのまま解釈すると前記当件数が0件となっ
てしまう。そのような応答は、利用者の立場で考えると
不便なものである。ゆえに前記当するものがない場合、
次候補を提示する様にプログラムを作成しておく。もち
ろん選択したデータに、京浜東北線に係る情報がある場
合は、施設同様に(ステップ123)で取得した表示デ
ータ「京浜東北」を手がかりに、前記当するデータのみ
選択すれば良い。
報のみ表示することで、スクロークなどの手間を省くこ
とが可能となり、小型の情報処理装置、例えば、時計、
携帯電話、カードなどでの利用が可能となる。
て説明する。
とする。
の実施例と同様の状況を想定するが、本実施例では、必
要な情報に複数回のアクセスが必要なものと仮定する。
カーとして提示されており、アンカーを順番に選択して
いくことにより、必要なWebページにアクセスできる
ものと仮定する。ここではサービスの例として、路線
名、駅名、施設名を順番に選択して、次々にWebペー
ジを更新するサーバを対象とする。
要なキーワードはメモリに記録されているものとする。
第3の実施例では図5に示すコードデータは使用せず、
認識結果をもとに、表示データと種別データを対にして
一時的にメモリに記録しておく。
すでに指定されているものとする。タスクに対応したW
ebページのURLは、予めタスクと対応させて記憶手
段3に記憶させておき、それを検索することにより取得
する。
信する。
をスタックに格納しておき、キーワードを用いてアクセ
ス命令を作成する毎に、スタックから前記キーワードを
削除していき、残りのキーワードを計数することで実現
できる。
み、受信したHTML文章を、TAGを手がかりにアン
カーとリンク先識別子(URL)に分類し、その対応表
を作成する。最初の路線名を選択するWebページの場
合は、路線名を示すアンカーと路線に対応した駅を選択
するWebページのURLが対になったデータが作成さ
れる。
では「京浜東北」を取得し、ステップ140で作成した
アンカーとリンク先識別子テーブルを検索し、京浜東北
線の駅を指定するWebページへのURLを取得できる
(ステップ136)。
るまでステップ136からステップ140を繰り返すこ
とで所望の情報を含むWebページにアクセスできる。
前記ページ取得後は、TAGを解析して画面データを作
成し表示手段に出力する(ステップ141)。
ージへ順番にアクセスする必要がある場合でも。最初に
利用者がキーワードを音声で入力することで容易に所望
の情報を取得することが可能である。
報選択ステップとの併用により、第1の実施例や第2の
実施例で述べた効果を得ることが可能となる。
する。
するものとする。また、本実施例の効果を示せるように
第1の実施例と同様の状況を想定する。
されたデータの種別を示す。この例では、上から順に、
タスクの種類、路線名、駅名、施設名を示している。ス
ロット21はデータ入力領域である。
り、利用者が入力すべき情報でないため、他のスロット
と異なる方式で表示している。
データと関連する情報をメモリに記憶する。
3)は、認識結果に基づき対応表を調べ、入力されたデ
ータを分類する。
分類結果に基づきその種別に対応したスロットに表示デ
ータを提示する。
ムからのフィードバックを得ることが可能となり、認識
エンジンが認識エラーを起こした場合でも、再度発話す
ることにより、スロットのデータを更新することが可能
となる。
の実施例のステップ126から130と同様である。
バックが得られ、間違って認識された場合には、利用者
は再度発話することにより訂正することができるので、
スロットを指定する必要がなく利便性は向上する。
システム主導ではなく、利用者が任意のスロットを選択
でき、利用者主導の対話が可能となる。
ている前回の入力データをスロットに表示することによ
り、異なる条件で再度アクセスする場合に、利用者は変
更すべき条件を容易に確認することができる。
ワードの入力手段として、音声認識手段のみ使用してい
るが、本実施例は、状況認識手段や、他の認識手段の結
果をそのまま、あるいは、演算を施しキーワードを作成
する。
状況認識手段や1つ以上の認識用入力手段をバス9に付
加して実現する。
ドリーダー、無線TAG、赤外線通信、無線通信、有線
通信などが利用できる。
ンサ、加速度センサ、圧力センサ、ペンタブレット、節
電位測定装置などが利用できる。認識用入力手段は、物
理的に計測可能な信号に、予め決められた演算を行い、
記憶手段3に記録されている辞書データと比較し、検索
用のコードデータや制御用命令に変換する。
ースをアクセスすることで地名や建造物、会社名に変換
することで、場所や対象物に関するキーワードを得るこ
とができる。これにより現在地や対象物に関する情報を
入力しなくてもよい。
バを有して、各展示物の情報を提供をする場合がある。
合、バーコードリーダを展示物のバーコードに近づけ、
バーコードの値を対象物の識別コードとして用いること
で、容易に対象物を特定することが可能となる。
別用データを得る。無線の有効範囲に立ち入ると、コネ
クションを設定する方法なども利用できる。
認識手段で「製作年代」と発話することで、上記のコー
ドと製作年代を示すコードを合わせて、サーバにURL
を送信することで、利用者は容易に目の前の展示物の製
作年代に関しての情報をえることが可能となる。
い場合や、説明プレートの漢字が読めない場合などキー
ワードの発話ができないような状況でも、利用者は関連
情報を取得可能となる。
識、節電位認識などを併用することにより、どうしても
音声認識が成功しない場合でも、所望のキーワードを入
力することが可能となる。
の認識手段との併用により、音声認識で明示的にキーワ
ードを入力しなくても、あるいは入力できないような状
況でも、検索用のキーワードが準備でき、それゆえ利用
者のキーワード入力に係る負荷をさらに低減したインタ
フェースの提供が可能となる。
ードの発話、あるいは文章を発話するだけで、ハイパー
テキスト方式によってサーバから提供される複数の表示
単位から構成される集合情報から、利用者が必要とする
情報を検索する場合に,大幅に手間とアクセスまでの遅
延時間を減少させることが可能となる。
クロールなどの手間を省くことが可能となり、小型の情
報処理装置での利便性が良くなる。
より利便性を向上しつつ、入力時の手間を削減してい
る。
で、入力の手間の削減や音声入力ができない場合でも所
望の情報にアクセス可能となる。
のブロック図である。
ある。
ード認識を示す図である。
Claims (8)
- 【請求項1】電気通信回線を通じて、ハイパーテキスト
方式によってサーバから提供される複数の表示単位から
構成される集合情報から、利用者が必要とする情報を検
索する方法であって、 前記利用者が前記必要とする情報に関して発声した音声
の内容を認識する音声認識ステップと、 前記音声認識ステップにおいて認識した認識結果を所定
の条件に基づいて分類する認識結果分類ステップと、 前記認識結果分類ステップにより分類した1つ以上の認
識結果を利用して、前記集合情報から、前記必要とする
情報を検索するためのアクセス命令を作成するアクセス
命令作成ステップと、 前記アクセス命令作成ステップにおいて作成したアクセ
ス命令を、前記電気通信回線を通じて前記サーバへ送信
する送信ステップと、 前記検索した情報を、前記電気通信回線を通じて前記サ
ーバから受信する受信ステップと、 前記受信ステップにおいて受信した情報の一部または全
体を出力する出力ステップと、 を有することを特徴とする情報検索方法。 - 【請求項2】前記受信ステップにおいて受信した情報か
ら、前記認識結果に関連する情報を選択する関連情報選
択ステップを有することを特徴とする請求項1記載の情
報検索方法。 - 【請求項3】前記アクセス命令作成ステップは、 前記認識結果分類ステップにより認識した1つ以上の認
識結果を利用して複数のアクセス命令を作成することを
特徴とする請求項1記載の情報検索方法。 - 【請求項4】前記認識結果分類ステップにより分類した
認識結果を、その分類に対応させた状態で前記利用者に
表示する表示ステップを有することを特徴とする請求項
1、2、3記載の情報検索方法。 - 【請求項5】前記利用者の状況を認識する状況認識ステ
ップを有し、 前記アクセス命令作成ステップは、 前記認識結果分類ステップにより分類した前記1つ以上
の音声に基づく認識結果と、前記状況認識ステップにお
いて認識した1つ以上の状況に基づく認識結果を利用し
て前記アクセス命令を作成することを特徴とする請求項
1記載の情報検索方法。 - 【請求項6】前記状況認識ステップで認識する利用者の
状況以外の他の状態を認識する認識入力ステップと、 前記アクセス命令作成ステップは、 前記認識結果分類ステップにより分類した前記1つ以上
の音声に基づく認識結果と、前記認識入力ステップにお
いて認識した他の状態に基づく認識結果を利用して前記
アクセス命令を作成することを特徴とする請求項5に記
載の情報検索方法。 - 【請求項7】電気通信回線を通じて、ハイパーテキスト
方式によってサーバから提供される複数の表示単位から
構成される集合情報から、利用者が必要とする情報を検
索する方法を実現するためのプログラムを記録した記録
媒体であって、 前記利用者が前記必要とする情報に関して発声した音声
の内容を認識する音声認識機能と、 前記音声認識機能において認識した認識結果を所定の条
件に基づいて分類する認識結果分類機能と、 前記認識結果分類機能により分類した1つ以上の認識結
果を利用して、前記集合情報から、前記必要とする情報
を検索するためのアクセス命令を作成するアクセス命令
作成機能と、 前記アクセス命令作成機能において作成したアクセス命
令を、前記電気通信回線を通じて前記サーバへ送信する
送信機能と、 前記検索した情報を、前記電気通信回線を通じて前記サ
ーバから受信する受信機能と、 前記受信機能において受信した情報の一部または全体を
出力する出力機能と、 を実現するプログラムを記録したことを特徴とする情報
検索方法の記録媒体。 - 【請求項8】電気通信回線を通じて、ハイパーテキスト
方式によってサーバから提供される複数の表示単位から
構成される集合情報から、利用者が必要とする情報を検
索する装置であって、 前記利用者が前記必要とする情報に関して発声した音声
の内容を認識する音声認識手段と、 前記音声認識手段において認識した認識結果を所定の条
件に基づいて分類する認識結果分類手段と、 前記認識結果分類手段により分類した1つ以上の認識結
果を利用して、前記集合情報から、前記必要とする情報
を検索するためのアクセス命令を作成するアクセス命令
作成手段と、 前記アクセス命令作成手段において作成したアクセス命
令を、前記電気通信回線を通じて前記サーバへ送信する
送信手段と、 前記検索した情報を、前記電気通信回線を通じて前記サ
ーバから受信する受信手段と、 前記受信手段において受信した情報の一部または全体を
出力する出力手段と、 を有することを特徴とする情報検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP24553599A JP2001075968A (ja) | 1999-08-31 | 1999-08-31 | 情報検索方法及びそれを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP24553599A JP2001075968A (ja) | 1999-08-31 | 1999-08-31 | 情報検索方法及びそれを記録した記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001075968A true JP2001075968A (ja) | 2001-03-23 |
Family
ID=17135150
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP24553599A Pending JP2001075968A (ja) | 1999-08-31 | 1999-08-31 | 情報検索方法及びそれを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2001075968A (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005538583A (ja) * | 2002-08-20 | 2005-12-15 | テレノール アーアスアー | 通信ネットワークを介しサービス、アプリケーション及び/またはコンテンツにアクセスするためのシステム及び方法 |
JP2005539427A (ja) * | 2002-09-16 | 2005-12-22 | フランス テレコム | オーディオビジュアルコンテンツを記述するデータを取得する方法、そのためのシステム、ブロードキャストサーバ、記述サーバ、および受信端末 |
JP2006508448A (ja) * | 2002-11-28 | 2006-03-09 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ワードクラス情報を割り当てる方法 |
JP2006072539A (ja) * | 2004-08-31 | 2006-03-16 | Xing Inc | 情報提供方法、情報提供システム、提供装置及びコンピュータプログラム |
US7272455B2 (en) | 2002-09-20 | 2007-09-18 | Kabushiki Kaisha Toshiba | Remote controlling device, program and system with control command changing function |
JP2008097082A (ja) * | 2006-10-06 | 2008-04-24 | Mitsubishi Electric Corp | 音声対話装置 |
JP2010271769A (ja) * | 2009-05-19 | 2010-12-02 | Seiko Epson Corp | 画像処理方法及び装置、並びに、そのためのコンピュータプログラム |
US9928030B2 (en) | 2014-03-28 | 2018-03-27 | Panasonic Intellectual Property Management Co., Ltd. | Speech retrieval device, speech retrieval method, and display device |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06274539A (ja) * | 1993-03-18 | 1994-09-30 | Fujitsu Ltd | 質疑応答システム |
JPH10260976A (ja) * | 1997-03-18 | 1998-09-29 | Ricoh Co Ltd | 音声対話方法 |
JPH10283362A (ja) * | 1997-04-02 | 1998-10-23 | Casio Comput Co Ltd | 携帯情報端末及び記憶媒体 |
JPH11110186A (ja) * | 1997-10-02 | 1999-04-23 | Nippon Telegr & Teleph Corp <Ntt> | ブラウザシステム、音声プロキシサーバ、リンク項目の読み上げ方法及びリンク項目の読み上げプログラムを格納した記憶媒体 |
-
1999
- 1999-08-31 JP JP24553599A patent/JP2001075968A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06274539A (ja) * | 1993-03-18 | 1994-09-30 | Fujitsu Ltd | 質疑応答システム |
JPH10260976A (ja) * | 1997-03-18 | 1998-09-29 | Ricoh Co Ltd | 音声対話方法 |
JPH10283362A (ja) * | 1997-04-02 | 1998-10-23 | Casio Comput Co Ltd | 携帯情報端末及び記憶媒体 |
JPH11110186A (ja) * | 1997-10-02 | 1999-04-23 | Nippon Telegr & Teleph Corp <Ntt> | ブラウザシステム、音声プロキシサーバ、リンク項目の読み上げ方法及びリンク項目の読み上げプログラムを格納した記憶媒体 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005538583A (ja) * | 2002-08-20 | 2005-12-15 | テレノール アーアスアー | 通信ネットワークを介しサービス、アプリケーション及び/またはコンテンツにアクセスするためのシステム及び方法 |
JP2005539427A (ja) * | 2002-09-16 | 2005-12-22 | フランス テレコム | オーディオビジュアルコンテンツを記述するデータを取得する方法、そのためのシステム、ブロードキャストサーバ、記述サーバ、および受信端末 |
US7272455B2 (en) | 2002-09-20 | 2007-09-18 | Kabushiki Kaisha Toshiba | Remote controlling device, program and system with control command changing function |
US9996675B2 (en) | 2002-11-28 | 2018-06-12 | Nuance Communications, Inc. | Method to assign word class information |
JP2006508448A (ja) * | 2002-11-28 | 2006-03-09 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ワードクラス情報を割り当てる方法 |
US10923219B2 (en) | 2002-11-28 | 2021-02-16 | Nuance Communications, Inc. | Method to assign word class information |
US10515719B2 (en) | 2002-11-28 | 2019-12-24 | Nuance Communications, Inc. | Method to assign world class information |
US8032358B2 (en) | 2002-11-28 | 2011-10-04 | Nuance Communications Austria Gmbh | Classifying text via topical analysis, for applications to speech recognition |
US8612209B2 (en) | 2002-11-28 | 2013-12-17 | Nuance Communications, Inc. | Classifying text via topical analysis, for applications to speech recognition |
US8965753B2 (en) | 2002-11-28 | 2015-02-24 | Nuance Communications, Inc. | Method to assign word class information |
JP2006072539A (ja) * | 2004-08-31 | 2006-03-16 | Xing Inc | 情報提供方法、情報提供システム、提供装置及びコンピュータプログラム |
JP2008097082A (ja) * | 2006-10-06 | 2008-04-24 | Mitsubishi Electric Corp | 音声対話装置 |
JP2010271769A (ja) * | 2009-05-19 | 2010-12-02 | Seiko Epson Corp | 画像処理方法及び装置、並びに、そのためのコンピュータプログラム |
US9928030B2 (en) | 2014-03-28 | 2018-03-27 | Panasonic Intellectual Property Management Co., Ltd. | Speech retrieval device, speech retrieval method, and display device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8380516B2 (en) | Retrieval and presentation of network service results for mobile device using a multimodal browser | |
US6385586B1 (en) | Speech recognition text-based language conversion and text-to-speech in a client-server configuration to enable language translation devices | |
US7548858B2 (en) | System and method for selective audible rendering of data to a user based on user input | |
TWI353585B (en) | Computer-implemented method,apparatus, and compute | |
US8620659B2 (en) | System and method of supporting adaptive misrecognition in conversational speech | |
US7593854B2 (en) | Method and system for collecting user-interest information regarding a picture | |
EP0854417A2 (en) | Voice activated control unit | |
GB2383247A (en) | Multi-modal picture allowing verbal interaction between a user and the picture | |
US20050010422A1 (en) | Speech processing apparatus and method | |
CN101681365A (zh) | 用于分布式语音搜索的方法和装置 | |
MXPA04006532A (es) | Uso combinado de un lenguaje de marca por pasos y una herramienta de desarrollo orientada por objetos. | |
JP3862470B2 (ja) | データ処理装置及び方法、ブラウザシステム、ブラウザ装置、記録媒体 | |
JPH07222248A (ja) | 携帯型情報端末における音声情報の利用方式 | |
KR20100045337A (ko) | 번역 결과가 합성된 만화 컨텐츠를 제공하고 이러한 만화 컨텐츠에 대한 정보를 키워드 검색에 노출시키기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 | |
JP2001075968A (ja) | 情報検索方法及びそれを記録した記録媒体 | |
JP3714159B2 (ja) | ブラウザ搭載装置 | |
Agarwal et al. | Voice Browsing the Web for Information Access | |
US20020077814A1 (en) | Voice recognition system method and apparatus | |
WO2021161856A1 (ja) | 情報処理装置及び情報処理方法 | |
JP4756764B2 (ja) | プログラム及び情報処理装置並びに情報処理方法 | |
JP2002099294A (ja) | 情報処理装置 | |
WO2002099786A1 (en) | Method and device for multimodal interactive browsing | |
KR20050040983A (ko) | 음성을 이용한 웹 브라우징 시스템 및 제어방법 | |
JP2001092845A (ja) | 文書取得方法及び記録媒体 | |
JP6298806B2 (ja) | 音声翻訳システム及びその制御方法、並びに音声翻訳プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050315 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050428 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050719 |