JP2001075968A

JP2001075968A - 情報検索方法及びそれを記録した記録媒体

Info

Publication number: JP2001075968A
Application number: JP24553599A
Authority: JP
Inventors: Akihiko Sugikawa; 明彦杉川
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1999-08-31
Filing date: 1999-08-31
Publication date: 2001-03-23

Abstract

(57)【要約】【課題】利用者が情報処理装置に与える指示の手間を
大きく削減し、使用方法が容易で、かつ、所望の情報を
取得するまでの時間を大幅に削減する、音声制御による
情報検索方法を記録した記録媒体を提供する。【解決手段】演算手段１、表示手段２、記憶手段３、
通信手段６、キーボード４、指示手段５、音声入力手段
７から構成される情報処理装置上で動作するプログラム
として実現され、複数の音声認識結果から得られたアク
セス用のコードデータと、テンプレートとを用いてサー
バのアクセス命令を作成し、直接目的のＷｅｂページに
アクセスすることで、サーバへのアクセス回数も１回だ
けとなる。この結果、目的のＷｅｂページに至る経路情
報を知らなくても所望の情報を入手することができる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、例えば、Ｗｅｂサ
ーバの提供する情報へのアクセスを実現するための情報
検索方法及びそれを記録した記録媒体に関する。

【０００２】

【従来の技術】近年、インターネット上に、時刻表、番
組表、天気、ニュースなどさまざまな情報が提供されて
いる。利用者は、携帯型の情報処理装置上で、情報アク
セス用のアプリケーションであるブラウザを使用して、
任意の場所から必要な情報にアクセス可能となった。利
用者はなんらかの情報を知りたい場合には、最初にポー
タルと呼ばれる起点となるＷｅｂページにアクセスし、
前記Ｗｅｂページから関連するページを順次指示するこ
とで目的の情報を得ることができる。

【０００３】一般的にブラウザは、受信したＨＴＭＬ
（ＨｙｐｅｒＴｅｘｔＭａｒｋｕｐＬａｎｇｕａ
ｇｅ）文書を解析し、表示用データを作成し画面に提示
する。このとき画面サイズが文書サイズより小さい場合
は、文書の一部分のみ表示し、利用者は必要に応じて表
示画面のスクロールを指示する。Ｗｅｂページによって
は、１つのページに多くの情報を含んでいる場合があ
り、利用者は目的とする情報を知るためには、前記当す
る場所までページをスクロールする必要がある。特に携
帯型の情報処理装置では、表示画面が小さいために移動
量は大きくなる問題が生じる。

【０００４】一方、近年、携帯型情報処理装置の普及に
より、多くの利用者がオフィスや自宅以外の様々な場所
で利用する機会が増えている。これまでのように机の前
でイスに座りながらキーボードやマウスで操作するスタ
イルだけではなく、場所・用途に適応した入力方法が必
要になってきている。

【０００５】音声入力は、ハードウェアの進歩と共に実
用化され始めており、メニュー選択や、文書入力手段と
して利用されている。最近では音声制御で、ＷＷＷ（Ｗ
ｏｒｌｄＷｉｄｅＷｅｂ）上のＷｅｂページにアク
セスする方法も実現されている。例えば、予め登録され
たキーワード発話により、そのキーワードに対応したＷ
ｅｂページへのアクセスを実現した音声制御ブラウザが
利用されている。この方法では、ポータルと呼ばれる他
のＷｅｂページへのリンクを集めたＷｅｂページには、
音声でアクセスできるが、そこからリンク先のページへ
の移動は、利用者がマウスやキーボードなどの他の手段
で指示する必要がある。

【０００６】このような問題に対処するために、アンカ
ーと呼ばれるリンク先を示す文章そのものを発話する方
法（特開平１０−１２４２９３号）、あるいは、アンカ
ー内の文章から選択したキーワードを発話する方法（特
開平１１−２５０９８号）など、音声の指示だけで関連
するＷｅｂページへの移動を実現する方法が提案されて
いる。

【０００７】上記提案では、受信後したＨＴＭＬで記述
された文書を解析し、ＴＡＧと呼ばれる識別子を手がか
りに、アンカー文とリンク先情報（ＵＲＬ）を取得し、
メモリに対応関係を一時的に記録し、音声辞書には、ア
ンカー文の読みデータ、あるいはアンカー文から抽出し
たキーワードの読みデータを登録する。音声認識エンジ
ンが利用者の発話を認識すると、システムは認識結果に
対応するリンク先情報（ＵＲＬ）を取得し、ブラウザに
そのＵＲＬのＷｅｂページをアクセスする命令を与え
る。ブラウザはＷｅｂページ取得後、システムは再びＨ
ＴＭＬ文章を解析することで更なる移動を実現する。

【０００８】このように音声だけで、目的とするＷｅｂ
ページまでアクセス可能となったが、サーバが提供する
情報が多い場合には、そのＷｅｂページの構成を把握し
ていないと、目的のＷｅｂページへの到達までに試行錯
誤を繰り返すこことなる。また、目的のＷｅｂページま
での到達方法を把握していても、何回もの指示を必要と
する。それゆえ、必要とする情報の取得には手間や時間
がかかり、利用者の利便性を損ねている。

【０００９】特に、Ｗｅｂページを順番にたどっていく
場合など、通信回線の状況に遅延時間は左右されやす
く、またＷｅｂページのデータ量が大きい場合には、数
分から十数分のアクセス時間が必要となる。

【００１０】音声認識技術は、完全ではなく、時には特
定キーワードの認識ができない場合がある。そのような
場合のため何らかの代替手段は必要である。また、予め
認識対象をエンジンに登録しておく必要があり、対象と
する件数が多い場合には、認識に要するメモリサイズや
遅延時間など、携帯情報処理装置を考慮すると実用上の
課題が生じる。

【００１１】条件を変更して同じサーバに再度検索する
場合には、一旦検索条件を設定するぺージに戻り、再度
入力を行う必要があり、これも利用者の利便性を損ねて
いる。従来、複数の種類のデータを音声で入力する場合
には、銀行のＡＴＭように予め決められた手順に従って
入力を行う必要があり、システム主導で対話が進んでい
く。

【００１２】それに対して、図１４のようなデータ入力
画面を利用者に提示し、利用者にデータ入力を行うスロ
ットを選択させ、そのスロットに関連した認識辞書を準
備して、データ入力を行う方法が考えられる。この方法
ではスロットに関連したデータしか認識しないため、他
のスロット向けの単語を誤認識することはない。また、
誤認識が生じた場合でも、正しく認識するまで再度発話
するだけで良い。しかしこの方法では、指示手段でスロ
ットを指定する手間が生じる。

【００１３】

【発明が解決しようとする課題】以上説明したように従
来の音声制御ブラウザでは、必要な情報の所得までに要
する手間や時間が多いという問題があった。

【００１４】本発明は、利用者が情報処理装置に与える
指示の手間を大きく削減し、使用方法が容易で、かつ、
所望の情報を取得するまでの時間を大幅に削減する、音
声制御による情報検索方法及びそれを記録した記録媒体
を提供することを目的とする。

【００１５】

【課題を解決するための手段】請求項１の発明は、電気
通信回線を通じて、ハイパーテキスト方式によってサー
バから提供される複数の表示単位から構成される集合情
報から、利用者が必要とする情報を検索する方法であっ
て、前記利用者が前記必要とする情報に関して発声した
音声の内容を認識する音声認識ステップと、前記音声認
識ステップにおいて認識した認識結果を所定の条件に基
づいて分類する認識結果分類ステップと、前記認識結果
分類ステップにより分類した１つ以上の認識結果を利用
して、前記集合情報から、前記必要とする情報を検索す
るためのアクセス命令を作成するアクセス命令作成ステ
ップと、前記アクセス命令作成ステップにおいて作成し
たアクセス命令を、前記電気通信回線を通じて前記サー
バへ送信する送信ステップと、前記検索した情報を、前
記電気通信回線を通じて前記サーバから受信する受信ス
テップと、前記受信ステップにおいて受信した情報の一
部または全体を出力する出力ステップと、を有すること
を特徴とする情報検索方法である。

【００１６】請求項２の発明は、前記受信ステップにお
いて受信した情報から、前記認識結果に関連する情報を
選択する関連情報選択ステップを有することを特徴とす
る請求項１記載の情報検索方法である。

【００１７】請求項３の発明は、前記アクセス命令作成
ステップは、前記認識結果分類ステップにより認識した
１つ以上の認識結果を利用して複数のアクセス命令を作
成することを特徴とする請求項１記載の情報検索方法で
ある。

【００１８】請求項４の発明は、前記認識結果分類ステ
ップにより分類した認識結果を、その分類に対応させた
状態で前記利用者に表示する表示ステップを有すること
を特徴とする請求項１、２、３記載の情報検索方法であ
る。

【００１９】請求項５の発明は、前記状況認識ステップ
で認識する利用者の状況を認識する状況認識ステップを
有し、前記アクセス命令作成ステップは、前記認識結果
分類ステップにより分類した前記１つ以上の音声に基づ
く認識結果と、前記状況認識ステップにおいて認識した
１つ以上の状況に基づく認識結果を利用して前記アクセ
ス命令を作成することを特徴とする請求項１記載の情報
検索方法である。

【００２０】請求項６の発明は、前記利用者の状況以外
の他の状態を認識する認識入力ステップと、前記アクセ
ス命令作成ステップは、前記認識結果分類ステップによ
り分類した前記１つ以上の音声に基づく認識結果と、前
記認識入力ステップにおいて認識した他の状態に基づく
認識結果を利用して前記アクセス命令を作成することを
特徴とする請求項１に記載の情報検索方法である。

【００２１】請求項７の発明は、電気通信回線を通じ
て、ハイパーテキスト方式によってサーバから提供され
る複数の表示単位から構成される集合情報から、利用者
が必要とする情報を検索する方法を実現するためのプロ
グラムを記録した記録媒体であって、前記利用者が前記
必要とする情報に関して発声した音声の内容を認識する
音声認識機能と、前記音声認識機能において認識した認
識結果を所定の条件に基づいて分類する認識結果分類機
能と、前記認識結果分類機能により分類した１つ以上の
認識結果を利用して、前記集合情報から、前記必要とす
る情報を検索するためのアクセス命令を作成するアクセ
ス命令作成機能と、前記アクセス命令作成機能において
作成したアクセス命令を、前記電気通信回線を通じて前
記サーバへ送信する送信機能と、前記検索した情報を、
前記電気通信回線を通じて前記サーバから受信する受信
機能と、前記受信機能において受信した情報の一部また
は全体を出力する出力機能と、を実現するプログラムを
記録したことを特徴とする情報検索方法の記録媒体であ
る。

【００２２】請求項８の発明は、電気通信回線を通じ
て、ハイパーテキスト方式によってサーバから提供され
る複数の表示単位から構成される集合情報から、利用者
が必要とする情報を検索する装置であって、前記利用者
が前記必要とする情報に関して発声した音声の内容を認
識する音声認識手段と、前記音声認識手段において認識
した認識結果を所定の条件に基づいて分類する認識結果
分類手段と、前記認識結果分類手段により分類した１つ
以上の認識結果を利用して、前記集合情報から、前記必
要とする情報を検索するためのアクセス命令を作成する
アクセス命令作成手段と、前記アクセス命令作成手段に
おいて作成したアクセス命令を、前記電気通信回線を通
じて前記サーバへ送信する送信手段と、前記検索した情
報を、前記電気通信回線を通じて前記サーバから受信す
る受信手段と、前記受信手段において受信した情報の一
部または全体を出力する出力手段と、を有することを特
徴とする情報検索装置である。

【００２３】請求項１，２，３，４，７，８に係る発明
によれば、利用者は複数のキーワードの発話、あるいは
文章を発話するだけで、ハイパーテキスト方式によって
サーバから提供される複数の表示単位から構成される集
合情報から、利用者が必要とする情報を検索する場合
に，大幅に手間とアクセスまでの遅延時間を減少させる
ことが可能となる。

【００２４】また、利用者の望む情報のみ表示すること
で、スクロールなどの手間を省くことが可能となり、小
型の情報処理装置での利便性が良くなる。

【００２５】さらに、利用者主導での入力方式を提供す
ることにより利便性を向上しつつ、入力時の手間を削減
している。

【００２６】請求項５，６に係る発明によれば、音声以
外の認識手段と組み合わせることで、入力の手間の削減
や音声入力ができない場合でも所望の情報にアクセス可
能となる。

【００２７】

【発明の実施の形態】以下、本発明の実施形態を図面に
基づいて説明する。

【００２８】第１の実施例本発明の第１の実施例を、図１から図８を用いて説明す
る。

【００２９】図１は、情報処理装置の構成を示すブロッ
ク図の一例であり、演算手段１、表示手段２、記憶手段
３、通信手段６、キーボード４、指示手段５、音声入力
手段７から構成される情報処理装置上で動作するプログ
ラムとして実現する。

【００３０】また、ＣＤ−ＲＯＭやＦＤなどの記録媒
体、あるいは通信手段６を通じてこの情報処理装置に読
み込まれるものとする。

【００３１】記憶手段３、一時的なデータの保持に使用
されるメモリと呼ばれるＲＡＭ、永久に保存するための
ハードディスクなどの装置を用いる。ＲＡＭには本プロ
グラムや認識用辞書データやリンク管理テーブルなどの
作業用の変数が格納され、ハードディスクは、受信した
ＨＴＭＬ文章のキャッシュ、音声認識用の音素データ、
読みデータ辞書などを記録する。

【００３２】表示手段２は、表示内容を一時的に記憶す
るビデオメモリ、ＤＡ変換部、ＣＲＴや液晶表示装置な
どで構成する。

【００３３】通信手段６は、ケーブルを使用する有線Ｌ
ＡＮ、ＲＳ２３２Ｃ、セントロニクス、ＳＣＳＩ，ＵＳ
Ｂ，ＩＥＥＥ１３９４など、あるいはケーブルを使用し
ない、無線ＬＡＮ、赤外線通信、ＰＨＳデータ通信など
で実現する。

【００３４】指示手段５は、マウス、トラックボール、
アキュポイント、ペン入力などで実現する。

【００３５】音声入力手段７は、マイクや外部アンプと
接続し、入力された音声信号を、ＡＤ変換を通じてディ
ジタル信号に変換する。入力されたデータはメモリに格
納する。

【００３６】演算手段１は、ＣＰＵとも呼ばれ上記の各
手段とバス９を通じて接続されデータの送受信を行う。

【００３７】ＨＴＭＬ文章を解析し画面に表示を行う処
理は、コンポーネント化されたブラウザモジュールを使
用することにより可能である。例えばマイクロソフト社
のブラウザは容易に他のプログラムからその機能を利用
できる。

【００３８】（状況の説明）本実施例が有効に機能する
状況を説明するため、タスクを駅施設の検索と仮定す
る。

【００３９】このような情報を提供するＷｅｂページと
しては、「駅前探検クラブ（商標、以下同様）」、ｈｔ
ｔｐ：／／ｅｋｉｍａｅ．ｔｏｓｈｉｂａ．ｃｏ．ｊｐ
／などが存在する（平成１１年８月１７日現在）。利用
者は、このＷｅｂページを通じて、利用者が東京駅のタ
クシー乗り場に関する情報を音声指示で取得することと
設定する。

【００４０】（従来のアクセス方式）最初に従来方式で
のアクセスを説明する。

【００４１】利用者は、駅前探検クラブへのポインター
をブラウザに記録しておき、ホームページやポータルと
呼ばれる起点となるＷｅｂページにアクセスする。

【００４２】次に利用者はタスクを指定して、２番目に
路線名を指定、さらに駅名を指定、最後に施設を指定す
るというように順番に検索用キーを指定することで、最
終的に所望のＷｅｂページにたどりつく。

【００４３】前記Ｗｅｂページのサーバは、駅施設に関
するデータベースを所持しており、ＣＧＩ（Ｃｏｍｍｏ
ｎＧａｔｅｗａｙＩｎｔｅｒｆａｃｅ）と呼ばれる
技術を用いて、利用者からの問い合わせに対し、データ
ベースを検索し、問い合わせ毎に返答用のＷｅｂページ
を作成し、クライアントであるブラウザにＨＴＭＬ文章
を送信する。

【００４４】図２は、東京駅のタクシー乗り場を検索す
るため識別子の例であり、図３に示す１１から１４の４
つの要素で構成される。

【００４５】１１は、ＵＲＬと呼ばれる特定のＷｅｂペ
ージを示すものである。

【００４６】１２から１４は、ＣＧＩ用のパラメータで
ある。

【００４７】１２は、路線を示すコードである。

【００４８】１３は、駅を示すコードである。

【００４９】１４は、施設を示すコードである。

【００５０】サーバ上のデータベースアクセスプログラ
ムは、これらを検索用のキーとしてデータベースを検索
する。

【００５１】上記のサーバへのアクセスの例では、利用
者がＷｅｂページを順番にアクセスする毎にＣＧＩ用の
コードが付与され、サーバは全てのコードが取得できた
場合に、データベースの検索を行う。このときサーバは
受信したコードの妥当性を検査し、正しければ各々のコ
ードをキーにデータベースを検索し、その結果をクライ
アントに送信する。

【００５２】この従来例では、ＵＲＬにデータベース検
索用のパラメータ付加してを送信しているが、他のパラ
メータ送信方法（例えば、異なるプロトコルを使用す
る）でも同等の効果を有する。

【００５３】（本実施例のアクセス方式）図４は、本実
施例に係るフローチャートの一例である。

【００５４】本プログラムは、図１の情報処理装置上で
動作する。

【００５５】１．ステップ１０１プログラムは、音声入
力手段７からの定期的割り込みにより、一定量の音声デ
ータを音声入力手段７から読み出し、メモリに記憶す
る。

【００５６】２．ステップ１０２そのメモリに記憶され
たデータを用いて入力された音声データの類似度を計算
する。

【００５７】類似度計算は、予め決められた条件を満た
した入力データを音声データとみなし、そのデータにフ
ーリエ変換を行い、周波数信号に変換し、特徴データを
作成する。

【００５８】また、辞書に登録した単語と音素モデルか
ら各単語の音素モデルを作成し、入力データの特徴デー
タと複数からなる認識単語データの特徴データとの距離
計算を行い、各単語についてのスコアーを求める。

【００５９】計算結果が予め決められた閾値を超える場
合には、最良のスコアが得られた単語を認識結果して出
力する。

【００６０】閾値に達しない場合には、エラーを出力す
る。認識結果がエラーの場合には、ステップ１０１に戻
って音声入力待ちの状態となる。

【００６１】認識辞書に登録する内容は、全ての路線
名、全ての駅名、全ての施設名の読みデータである。

【００６２】また、各読みデータに対して属性情報を付
与したテーブルを作成し、予め記憶手段３に格納してお
く。

【００６３】図５はテーブルへの登録方法である。

【００６４】読みデータに対して、表示用データ、種
別、コードの並びになっている。同時にシステム制御用
の単語も登録する。例では、検索開始のトリガーとなる
単語を示す。同様の属性データと関連付けたテーブルを
作成する。テーブルは、左から順に、読みデータ、表示
データ、種別である。

【００６５】３．ステップ１０３ステップ１０２で認識が成功したならば、認識結果の単
語、例えば「とうきょう」をキーとし、上述したテーブ
ルを検索する。「とうきょう」のキーからは、表示用の
データ「東京」、入力されたデータの種類「駅」、デー
タベース検索用のコード「００００１００」が得られ
る。

【００６６】４．ステップ１０４得られたデータは、一旦メモリに記録する。

【００６７】タスクによっては、検索用のコードは固定
なものだけでなく、日時など動的に変化するものがあ
る。

【００６８】例えば、利用者が「明日」と発話したら、
認識エンジンからは「あす」という情報が得られる。こ
のような場合は、当日（仮に９９年７月１４日と仮定す
る）の情報を利用して、検索用コード９９０７１５を作
成するステップを準備する。この場合、上記のテーブル
は、データの種類に演算を、検索用のコードには日付計
算用の演算識別子を入れておく。演算手段１には、検索
用のコードと表示用のデータを作成するサブルーチンを
準備しておく。

【００６９】５．ステップ１０５次に、プログラムは入力が終了したかどうか、判定す
る。判定方法は、データベースへのアクセス用に必要な
コードが全てそろったか検査する。

【００７０】上記の例では、路線コード、駅コード、施
設コードの３つが入力されたか確認する。

【００７１】この場合、誤認識の可能性もありうるので
一定期間入力を待ち、その期間内に更なる入力が行われ
ない場合は、これまで入力されたデータを確定したもの
と判断する。

【００７２】あるいは認識エンジン辞書にプログラム制
御用のデータを登録しておき、入力された単語が制御命
令を示す単語と一致したら検索開始する方法でも同様の
効果が得られる。

【００７３】あるいは、ボタンなどの指示手段５からの
入力をトリガーに用いる方法もある。

【００７４】６．ステップ１０６アクセス命令作成ステップは、準備してあるテンプレー
トに、確定したコードを挿入しＷｅｂ上のサーバへのア
クセス用データを作成する。

【００７５】例えば、駅施設情報アクセス用には図６の
ようなＵＲＬをテンプレートとして準備しておく。

【００７６】前ステップで確定したコードをその種別に
従い、前記テンプレートの前記当する部分、例えば駅を
示すコードであれば「ｅｋｉＣｏｄｅ＝」のあとに確定
したコード「００００１００」を挿入する。テンプレー
トはタスクに応じて予め記憶手段３に記録しておき、タ
スクが決定した時点で記憶手段３から取得する。

【００７７】タスクの設定は、予め利用者が明示的に指
示する。

【００７８】あるいは、入力されたキーワードの種類デ
ータを利用し、自動的に決定する方法も考えられる。

【００７９】例えば、路線名、駅名、施設名が入力され
たら駅施設検索であることが決まるように、各々関連付
けたテーブルを記憶手段３に予め準備することで実現で
きる。

【００８０】７．ステップ１０７アクセス送信命令ステップは、前ステップで作成したＵ
ＲＬを用いて、通信手段６を通じて情報取得要求を送信
する。

【００８１】８．ステップ１０８ＨＴＭＬ文書受信ステップは、サーバから送られてきた
ＨＴＭＬ文書を一旦情報処理装置のメモリやキャッシュ
に保存する。

【００８２】９．ステップ１０９画面表示ステップは、受信した文書をＴＡＧ情報に基づ
き解析し、表示用データを作成し、表示手段２を通じて
利用者に表示する。

【００８３】ステップ１０７からステップ１０９は、ブ
ラウザと呼ばれるモジュールを利用することにより容易
に実現できる。

【００８４】さらに、画面表示（ステップ１０９）の後
で、利用者は他の施設に関して再度アクセスする場合が
ある。

【００８５】ここでは仮に「バス乗り場」と仮定する。
利用者の施設名の発話により、ステップ１０１からステ
ップ１０４を通じて、表示用データ、データの種類、検
索用コードがメモリに記憶される。入力終了判定ステッ
プ（ステップ１０６）では、前回入力された路線デー
タ、駅データと新たに入力された施設データから入力終
了と判定する。

【００８６】以上要約すると、複数の音声認識結果から
得られたアクセス用のコードデータと、テンプレートと
を用いてサーバのアクセス命令を作成し、直接目的のＷ
ｅｂページにアクセスすることで、サーバへのアクセス
回数も１回だけとなる。この結果、目的のＷｅｂページ
に至る経路情報を知らなくても所望の情報を入手するこ
とができる。また従来、複数回のアクセスが必要であっ
たが、その回数を１度に低減でき情報所得時の通信遅延
時間を短くすることができる。

【００８７】以上説明したように、本実施例により、利
用者は必要な情報を取得する場合には、必要なキーワー
ドを発話するだけでという容易な方法で、かつ入手まで
の遅延時間の少ない音声制御によるＷｅｂサーバへのイ
ンタフェースが実現できる。

【００８８】（他のアクセス形式）上記の説明では、キ
ーワードを複数回発話する方式を説明したが、音声認技
術の他の方式であるワードスポット方式でも実現でき
る。

【００８９】すなわち、利用者の自由発話から検索に関
連する１つ以上のキーワードを抽出し、それらを用いて
前述のステップを実行することとなる。

【００９０】このワードスポット方式では、ラティス解
析に計算機資源が必要となるが、反面利用者は会話に近
い形で質問を入力できる利点がある。

【００９１】この方法を図７に示すフローチャートを用
いて説明する。上記アクセス方式と重複する部分を除
き、異なるステップのみ説明する。

【００９２】１．ステップ１１１利用者からの音声が入力される。

【００９３】図８は、その利用者から入力された文章を
示すものである。

【００９４】２．ステップ１１２認識エンジンは、単語辞書に登録された各データの類似
度を計算し、閾値以上の単語に関して、認識結果とスコ
アーや発話時刻情報を属性として出力する。通常このよ
うな単語の集まりをキーワードラティスと呼ぶ。

【００９５】３．ステップ１１３ワードスポット方式は、けん切りと呼ばれる単語と単語
の切れ目をうまく検出できない場合があり、ラティスの
中には不要な単語が多く含まれている。

【００９６】それゆえ、ラティス解析ステップ（ステッ
プ１１３）では、予め登録された文法的制約、各候補の
スコアー、発話時刻情報を元に利用者の発話を推定す
る。

【００９７】４．ステップ１１４推定結果が決められた条件を満たしている場合は、推定
した文の中に含まれるキーワードを取得する（ステップ
１１４）。

【００９８】基準に達しない場合は、その旨を利用者に
通知し、再度利用者からの入力を待つ（ステップ１１
１）。

【００９９】以下のステップ１１５から１１８は、前述
したステップ１０６から１０９と同じ処理を行うことに
より、自然言語を用いてインターネット上のサーバから
必要な情報が取得できる。

【０１００】（変更例１）他の実施例として音声合成を
出力手段に用いることも可能である。

【０１０１】この場合、表示手段３は必ずしも必要では
なく、与えられた文字データを音声データに変換する音
声合成エンジンモジュールが必要となる。音声合成エン
ジンは、プログラムや、ＤＳＰを使用して実現可能であ
る。音声認識及び音声合成を用いるインタフェースは、
ハンズフリーで使用でき、両手がふさがっている状況で
も必要な情報を得ることが可能となる。

【０１０２】（変更例２）本実施例には、駅施設情報の
アクセスを例にしたが、駅施設に限定されるものではな
く、旅行情報、株価、本、パソコンのパーツ、料理レシ
ピ、医療情報、テレビ番組、ニュース、地図、中古車、
不動産、オークションなど他の多くの分野にも容易に適
用可能である。

【０１０３】（変更例３）検索エンジンと呼ばれるＷｅ
ｂページにアクセスすることも考えられる。

【０１０４】一例としては、入力されたキーワードとＡ
ＮＤの論理演算を組み合わせて検索式を作り、検索サー
ビスを提供するＷｅｂページにアクセスし、検索結果を
取得して提示する。

【０１０５】あるいは、ラティス解析を行うことによ
り、ＡＮＤ，ＯＲ，ＮＯＴなどの論理式を組み合わせて
検索することも可能である。

【０１０６】（変更例４）本実施例では、音声認識手段
を自装置に有する方式を説明したが、音声認識手段をサ
ーバクライアント方式で構成する方法も可能である。

【０１０７】この場合、自装置の通信手段６を通じてサ
ーバである他の情報処理装置とコネクションを確立し、
入力された音声信号をデジタル化したデータそのもの、
あるいは特徴データに変換した後のデータをサーバに送
信し、認識結果を受信することにより実現する。

【０１０８】以上のように、変更したい条件のみ発話す
ることで、前記情報を提供するＷｅｂページに一度でア
クセスが可能となり、従来の方法と比較して大幅に手順
や時間の短縮が実現できる。

【０１０９】第２の実施例本発明の第２の実施例を図９から図１１を用いて説明す
る。

【０１１０】第１の実施例と異なる点のみ説明するもの
とする。

【０１１１】また、本実施例の効果を示せるように第１
の実施例と同様の状況を想定するが、本説明では、サー
バから送信された情報（ステップ１２８）に複数の情報
が含まれている場合を仮定する。

【０１１２】例えば、「タクシー乗り場」のほかに「バ
ス乗り場」が含まれているものとする。

【０１１３】他の施設に関する情報も含んでいても、本
実施例の説明には影響しないので、ここでは施設の数を
２つとする。

【０１１４】ステップ１２１から１２８は、第１の実施
例のステップ１０１から１０８と同様である。

【０１１５】１．ステップ１２９関連情報選択ステップでは、受信した文章を、ＴＡＧを
元に解析し、利用者に必要な情報のみ選択する。

【０１１６】図１０は選択した文字情報の例を示す。

【０１１７】入力データの分類ステップ（ステップ１２
３）で得られた、施設を示す情報である「タクシー乗り
場」をキーにして、図１０に示す文字情報から、関連す
る情報のみを選択する。

【０１１８】２．ステップ１３０画面表示ステップでは、選択したデータを元に図１１に
示す表示用文字データを作成し、表示手段３に出力す
る。

【０１１９】本例では「京浜東北」線を利用者は指示し
ているが、そのまま解釈すると前記当件数が０件となっ
てしまう。そのような応答は、利用者の立場で考えると
不便なものである。ゆえに前記当するものがない場合、
次候補を提示する様にプログラムを作成しておく。もち
ろん選択したデータに、京浜東北線に係る情報がある場
合は、施設同様に（ステップ１２３）で取得した表示デ
ータ「京浜東北」を手がかりに、前記当するデータのみ
選択すれば良い。

【０１２０】以上説明した方法により、利用者の望む情
報のみ表示することで、スクロークなどの手間を省くこ
とが可能となり、小型の情報処理装置、例えば、時計、
携帯電話、カードなどでの利用が可能となる。

【０１２１】第３の実施例本発明の第３の実施例を図１２のフローチャートを用い
て説明する。

【０１２２】第１の実施例と異なる点のみ説明するもの
とする。

【０１２３】また、本実施例の効果を示せるように第１
の実施例と同様の状況を想定するが、本実施例では、必
要な情報に複数回のアクセスが必要なものと仮定する。

【０１２４】つまり、Ｗｅｂページの中に選択肢がアン
カーとして提示されており、アンカーを順番に選択して
いくことにより、必要なＷｅｂページにアクセスできる
ものと仮定する。ここではサービスの例として、路線
名、駅名、施設名を順番に選択して、次々にＷｅｂペー
ジを更新するサーバを対象とする。

【０１２５】１．ステップ１３１から１３５ステップ１３１からステップ１３５を通じて、検索に必
要なキーワードはメモリに記録されているものとする。
第３の実施例では図５に示すコードデータは使用せず、
認識結果をもとに、表示データと種別データを対にして
一時的にメモリに記録しておく。

【０１２６】２．ステップ１３６また、指示手段５や音声入力手段７を通じてタスクは、
すでに指定されているものとする。タスクに対応したＷ
ｅｂページのＵＲＬは、予めタスクと対応させて記憶手
段３に記憶させておき、それを検索することにより取得
する。

【０１２７】３．ステップ１３７取得したＵＲＬを用いてＷｅｂページアクセス命令を送
信する。

【０１２８】４．ステップ１３８次に通信手段６を通じてＨＴＭＬ文章を受信する。

【０１２９】５．ステップ１３９ＨＴＭＬ文章が、目的の文章かどうか判定する。

【０１３０】終了判定は、予め検索に必要なキーワード
をスタックに格納しておき、キーワードを用いてアクセ
ス命令を作成する毎に、スタックから前記キーワードを
削除していき、残りのキーワードを計数することで実現
できる。

【０１３１】６．ステップ１４０受信終了でない場合は、ＨＴＭＬ文章解析ステップに進
み、受信したＨＴＭＬ文章を、ＴＡＧを手がかりにアン
カーとリンク先識別子（ＵＲＬ）に分類し、その対応表
を作成する。最初の路線名を選択するＷｅｂページの場
合は、路線名を示すアンカーと路線に対応した駅を選択
するＷｅｂページのＵＲＬが対になったデータが作成さ
れる。

【０１３２】７．ステップ１３６から１４０の繰り返し次にスタックを検査し、種別が路線である情報、この例
では「京浜東北」を取得し、ステップ１４０で作成した
アンカーとリンク先識別子テーブルを検索し、京浜東北
線の駅を指定するＷｅｂページへのＵＲＬを取得できる
（ステップ１３６）。

【０１３３】以下同様にスタックのキーワードがなくな
るまでステップ１３６からステップ１４０を繰り返すこ
とで所望の情報を含むＷｅｂページにアクセスできる。
前記ページ取得後は、ＴＡＧを解析して画面データを作
成し表示手段に出力する（ステップ１４１）。

【０１３４】以上説明した方法により、所望のＷｅｂペ
ージへ順番にアクセスする必要がある場合でも。最初に
利用者がキーワードを音声で入力することで容易に所望
の情報を取得することが可能である。

【０１３５】もちろんラティス解析や音声合成や関連情
報選択ステップとの併用により、第１の実施例や第２の
実施例で述べた効果を得ることが可能となる。

【０１３６】第４の実施例本発明の第４の実施例を、図１３と図１４を用いて説明
する。

【０１３７】第１、２，３の実施例と異なる点のみ説明
するものとする。また、本実施例の効果を示せるように
第１の実施例と同様の状況を想定する。

【０１３８】図１４は表示方法の一例である。

【０１３９】図１４の左側に示す表示領域２０は、入力
されたデータの種別を示す。この例では、上から順に、
タスクの種類、路線名、駅名、施設名を示している。ス
ロット２１はデータ入力領域である。

【０１４０】なお、右側最上部はタスク名を示してお
り、利用者が入力すべき情報でないため、他のスロット
と異なる方式で表示している。

【０１４１】１．ステップ１５１から１５６ステップ１５１からステップ１５６は、入力された音声
データと関連する情報をメモリに記憶する。

【０１４２】ここで、結果分類ステップ（ステップ１５
３）は、認識結果に基づき対応表を調べ、入力されたデ
ータを分類する。

【０１４３】結果表示ステップ（ステップ１５４）は、
分類結果に基づきその種別に対応したスロットに表示デ
ータを提示する。

【０１４４】これにより利用者は、入力に対するシステ
ムからのフィードバックを得ることが可能となり、認識
エンジンが認識エラーを起こした場合でも、再度発話す
ることにより、スロットのデータを更新することが可能
となる。

【０１４５】以下のステップ１５７から１６１は、第２
の実施例のステップ１２６から１３０と同様である。

【０１４６】以上により利用者は入力に対してフィード
バックが得られ、間違って認識された場合には、利用者
は再度発話することにより訂正することができるので、
スロットを指定する必要がなく利便性は向上する。

【０１４７】また、この方式では銀行のＡＴＭのように
システム主導ではなく、利用者が任意のスロットを選択
でき、利用者主導の対話が可能となる。

【０１４８】さらに、情報検索後に、メモリに記録され
ている前回の入力データをスロットに表示することによ
り、異なる条件で再度アクセスする場合に、利用者は変
更すべき条件を容易に確認することができる。

【０１４９】第５の実施例本発明の第５の実施例を説明する。

【０１５０】第１の実施例から第４の実施例まで、キー
ワードの入力手段として、音声認識手段のみ使用してい
るが、本実施例は、状況認識手段や、他の認識手段の結
果をそのまま、あるいは、演算を施しキーワードを作成
する。

【０１５１】本実施例は、図１に示す情報処理装置に、
状況認識手段や１つ以上の認識用入力手段をバス９に付
加して実現する。

【０１５２】状況認識手段としては、ＧＰＳ，バーコー
ドリーダー、無線ＴＡＧ、赤外線通信、無線通信、有線
通信などが利用できる。

【０１５３】認識用入力手段としては、カメラ、磁気セ
ンサ、加速度センサ、圧力センサ、ペンタブレット、節
電位測定装置などが利用できる。認識用入力手段は、物
理的に計測可能な信号に、予め決められた演算を行い、
記憶手段３に記録されている辞書データと比較し、検索
用のコードデータや制御用命令に変換する。

【０１５４】ＧＰＳを利用し緯度経度情報を入手する。

【０１５５】このデータをそのまま、あるいはデータベ
ースをアクセスすることで地名や建造物、会社名に変換
することで、場所や対象物に関するキーワードを得るこ
とができる。これにより現在地や対象物に関する情報を
入力しなくてもよい。

【０１５６】また、博物館がＷｅｂサーバと同様のサー
バを有して、各展示物の情報を提供をする場合がある。

【０１５７】利用者が、目の前の展示物を指定する場
合、バーコードリーダを展示物のバーコードに近づけ、
バーコードの値を対象物の識別コードとして用いること
で、容易に対象物を特定することが可能となる。

【０１５８】あるいは赤外線送受信部を対象に向け、識
別用データを得る。無線の有効範囲に立ち入ると、コネ
クションを設定する方法なども利用できる。

【０１５９】このような動作にあわせ、利用者は、音声
認識手段で「製作年代」と発話することで、上記のコー
ドと製作年代を示すコードを合わせて、サーバにＵＲＬ
を送信することで、利用者は容易に目の前の展示物の製
作年代に関しての情報をえることが可能となる。

【０１６０】さらに、利用者が、対象物の名前を知らな
い場合や、説明プレートの漢字が読めない場合などキー
ワードの発話ができないような状況でも、利用者は関連
情報を取得可能となる。

【０１６１】画像認識、ジェスチャ認識、手書き文字認
識、節電位認識などを併用することにより、どうしても
音声認識が成功しない場合でも、所望のキーワードを入
力することが可能となる。

【０１６２】以上説明したように、状況認識手段や、他
の認識手段との併用により、音声認識で明示的にキーワ
ードを入力しなくても、あるいは入力できないような状
況でも、検索用のキーワードが準備でき、それゆえ利用
者のキーワード入力に係る負荷をさらに低減したインタ
フェースの提供が可能となる。

【０１６３】

【発明の効果】本発明によれば、利用者は複数のキーワ
ードの発話、あるいは文章を発話するだけで、ハイパー
テキスト方式によってサーバから提供される複数の表示
単位から構成される集合情報から、利用者が必要とする
情報を検索する場合に，大幅に手間とアクセスまでの遅
延時間を減少させることが可能となる。

【０１６４】利用者の望む情報のみ表示することで、ス
クロールなどの手間を省くことが可能となり、小型の情
報処理装置での利便性が良くなる。

【０１６５】利用者主導での入力方式を提供することに
より利便性を向上しつつ、入力時の手間を削減してい
る。

【０１６６】音声以外の認識手段と組み合わせること
で、入力の手間の削減や音声入力ができない場合でも所
望の情報にアクセス可能となる。

【図面の簡単な説明】

【図１】本発明の第１の実施例を実現する情報処理装置
のブロック図である。

【図２】サーバアクセス用の識別子の図である。

【図３】識別子の詳細説明図である。

【図４】第１の実施例に係るフローチャートである。

【図５】認識結果と属性の対応を示す図である。

【図６】識別子作成用のテンプレートを示す図である。

【図７】第１の実施例の変更例に係るフローチャートで
ある。

【図８】自然対話の例文とワードスポットによるキーワ
ード認識を示す図である。

【図９】第２の実施例に係るフローチャートである。

【図１０】サーバから取得した情報を示す図である。

【図１１】応答文を示す図である。

【図１２】第３の実施例に係るフローチャートである。

【図１３】第４の実施例に係るフローチャートである。

【図１４】キーワード入力用の画面を示す図である。

【符号の説明】

１……演算手段２……表示手段３……記憶手段４……キーボード５……指示手段６……通信手段７……音声入力手段８……サーバ９……バス１０…ＵＲＬ１１…サーバＵＲＬ１２…路線コード１３…駅コード１４…施設コード２０…スロットの種別２１…スロットへの入力

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ１０Ｌ 15/18 Ｇ１０Ｌ 3/00 Ｅ 15/24 ５３１Ｗ５３７Ｊ５７１ＱＦターム(参考） 5B075 KK07 ND20 PP07 PP12 PP30 PQ02 PQ42 QP10 UU40 5B082 GA08 GC04 5D015 AA04 BB01 HH03 HH06 HH13 HH16 LL01 LL05 LL06 LL09 LL12 5D045 AA04 AB01 AB04 AB26

Claims

【特許請求の範囲】

【請求項１】電気通信回線を通じて、ハイパーテキスト
方式によってサーバから提供される複数の表示単位から
構成される集合情報から、利用者が必要とする情報を検
索する方法であって、前記利用者が前記必要とする情報に関して発声した音声
の内容を認識する音声認識ステップと、前記音声認識ステップにおいて認識した認識結果を所定
の条件に基づいて分類する認識結果分類ステップと、前記認識結果分類ステップにより分類した１つ以上の認
識結果を利用して、前記集合情報から、前記必要とする
情報を検索するためのアクセス命令を作成するアクセス
命令作成ステップと、前記アクセス命令作成ステップにおいて作成したアクセ
ス命令を、前記電気通信回線を通じて前記サーバへ送信
する送信ステップと、前記検索した情報を、前記電気通信回線を通じて前記サ
ーバから受信する受信ステップと、前記受信ステップにおいて受信した情報の一部または全
体を出力する出力ステップと、を有することを特徴とする情報検索方法。
【請求項２】前記受信ステップにおいて受信した情報か
ら、前記認識結果に関連する情報を選択する関連情報選
択ステップを有することを特徴とする請求項１記載の情
報検索方法。
【請求項３】前記アクセス命令作成ステップは、前記認識結果分類ステップにより認識した１つ以上の認
識結果を利用して複数のアクセス命令を作成することを
特徴とする請求項１記載の情報検索方法。
【請求項４】前記認識結果分類ステップにより分類した
認識結果を、その分類に対応させた状態で前記利用者に
表示する表示ステップを有することを特徴とする請求項
１、２、３記載の情報検索方法。
【請求項５】前記利用者の状況を認識する状況認識ステ
ップを有し、前記アクセス命令作成ステップは、前記認識結果分類ステップにより分類した前記１つ以上
の音声に基づく認識結果と、前記状況認識ステップにお
いて認識した１つ以上の状況に基づく認識結果を利用し
て前記アクセス命令を作成することを特徴とする請求項
１記載の情報検索方法。
【請求項６】前記状況認識ステップで認識する利用者の
状況以外の他の状態を認識する認識入力ステップと、前記アクセス命令作成ステップは、前記認識結果分類ステップにより分類した前記１つ以上
の音声に基づく認識結果と、前記認識入力ステップにお
いて認識した他の状態に基づく認識結果を利用して前記
アクセス命令を作成することを特徴とする請求項５に記
載の情報検索方法。
【請求項７】電気通信回線を通じて、ハイパーテキスト
方式によってサーバから提供される複数の表示単位から
構成される集合情報から、利用者が必要とする情報を検
索する方法を実現するためのプログラムを記録した記録
媒体であって、前記利用者が前記必要とする情報に関して発声した音声
の内容を認識する音声認識機能と、前記音声認識機能において認識した認識結果を所定の条
件に基づいて分類する認識結果分類機能と、前記認識結果分類機能により分類した１つ以上の認識結
果を利用して、前記集合情報から、前記必要とする情報
を検索するためのアクセス命令を作成するアクセス命令
作成機能と、前記アクセス命令作成機能において作成したアクセス命
令を、前記電気通信回線を通じて前記サーバへ送信する
送信機能と、前記検索した情報を、前記電気通信回線を通じて前記サ
ーバから受信する受信機能と、前記受信機能において受信した情報の一部または全体を
出力する出力機能と、を実現するプログラムを記録したことを特徴とする情報
検索方法の記録媒体。
【請求項８】電気通信回線を通じて、ハイパーテキスト
方式によってサーバから提供される複数の表示単位から
構成される集合情報から、利用者が必要とする情報を検
索する装置であって、前記利用者が前記必要とする情報に関して発声した音声
の内容を認識する音声認識手段と、前記音声認識手段において認識した認識結果を所定の条
件に基づいて分類する認識結果分類手段と、前記認識結果分類手段により分類した１つ以上の認識結
果を利用して、前記集合情報から、前記必要とする情報
を検索するためのアクセス命令を作成するアクセス命令
作成手段と、前記アクセス命令作成手段において作成したアクセス命
令を、前記電気通信回線を通じて前記サーバへ送信する
送信手段と、前記検索した情報を、前記電気通信回線を通じて前記サ
ーバから受信する受信手段と、前記受信手段において受信した情報の一部または全体を
出力する出力手段と、を有することを特徴とする情報検索装置。