JP2003108581A - 対話型情報検索装置および対話型情報検索方法 - Google Patents

対話型情報検索装置および対話型情報検索方法

Info

Publication number
JP2003108581A
JP2003108581A JP2001297575A JP2001297575A JP2003108581A JP 2003108581 A JP2003108581 A JP 2003108581A JP 2001297575 A JP2001297575 A JP 2001297575A JP 2001297575 A JP2001297575 A JP 2001297575A JP 2003108581 A JP2003108581 A JP 2003108581A
Authority
JP
Japan
Prior art keywords
unit
user
utterance
input
dialogue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001297575A
Other languages
English (en)
Other versions
JP4162074B2 (ja
Inventor
Keisuke Watanabe
圭輔 渡邉
Tadashi Suzuki
鈴木  忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2001297575A priority Critical patent/JP4162074B2/ja
Publication of JP2003108581A publication Critical patent/JP2003108581A/ja
Application granted granted Critical
Publication of JP4162074B2 publication Critical patent/JP4162074B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 利用者が円滑に入力を行えない状況において
利用者が常に一定時間待たされることなく対話が円滑に
継続でき、装置が勝手に利用者の代行を行わずとも利用
者の必要な情報を検索できる対話型情報検索装置および
方法を提供する。 【解決手段】 装置が応答を提示し終えた時刻から、次
に装置に音声が入力されるまでの入力間隔を入力間隔計
測部7が計測して出力し、入力間隔が閾値を越えた場合
に、対話主導権切り替え部9がシステム主導対話管理部
3を動作させるように動作切り替え指令を出力するた
め、利用者が円滑に入力を行えない状況が生じた場合、
それ以降システムが対話の主導権を取り、利用者が常に
一定時間待たされることなく対話が円滑に継続され、さ
らに装置が勝手に利用者の代行を行わずとも利用者が必
要な情報を検索できる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、利用者が装置と
のインタラクションにより必要な情報を得るための対話
型情報検索方法および対話型情報検索方法に関するもの
である。
【0002】
【従来の技術】近年、利用者がシステムと対話を行って
データベースから必要な情報を検索しする対話型マンマ
シンインタフェースの重要性が高まっている。対話は利
用者とシステムが交互に発話することで進行するが、利
用者が、次に入力すべき内容を決めかねている、システ
ムの状態が分らず何が入力できるか分らないなどの場合
に、システムの応答に対して次の入力を行えず、対話が
ストップしてしまうという問題がある。
【0003】従来、システムの応答に対して利用者が反
応できず対話が円滑に進まない状況に対処するために、
利用者に対し操作のガイドを提示したり利用者になり代
わって対話を継続する方法が提案されている。
【0004】例えば図46は、特開2000−4803
8号公報に示された従来のこの種の装置である自然言語
対話システムの構成図である。図において、111は入
力部、112は出力部、113は対話シナリオ、114
は現状態データ、115は入力待ちタイマ、116は代
理入力リスト、117は代行対話部、118は対話制御
部である。
【0005】このような自然言語対話システムにおいて
は、入力部111が利用者からの自然言語入力を受付
け、出力部112がシステム側の出力データを出力す
る。対話シナリオ113には、状態ID、出力データ、
入力可能データ、入力可能データに対応する状態IDに
より対話全体のシナリオを記述し、現状態データ114
には対話シナリオ中の現在の位置を格納する。入力待ち
タイマ115が、利用者に情報提示した後で利用者の入
力を一定時間待ち、その時間内に入力がない場合にタイ
ムアウト信号を代行対話部117に出力する。代行対話
部117はタイムアウト信号が入力されると、利用者に
なり代って対話を制御するための入力文を発行して対話
制御部118に入力する。代理入力リスト116には、
利用者が無反応の時に利用者になり代って入力するデー
タを、対話シナリオの各状態に対応させて格納する。
【0006】このように構成された自然言語対話システ
ムにおいては、システム側の応答に対し利用者が対応で
きず無反応になってしまった場合に、システムが利用者
に成り代り対話を代行するため、円滑に対話を継続する
ことが可能となる。
【0007】
【発明が解決しようとする課題】しかしながら、上記の
ような従来のシステムでは、利用者が円滑に入力を行え
ない状況が何度か続いても、入力待ちタイマにより常に
一定時間待たないと代行対話部が動作しないため、利用
者は常に一定時間待たされ利便性が低いという問題があ
った。
【0008】また、利用者が円滑に入力を行えない状況
において、代理入力リストに予め規定した入力により代
行対話部が利用者になり代って勝手に対話を進行させて
しまうため、対話は継続するが必ずしも利用者が欲しい
情報が得られないという問題があった。
【0009】この発明は、上述のような課題を解決する
ためになされたもので、利用者が円滑に入力を行えない
状況において、利用者が常に一定時間待たされることな
く対話が円滑に継続でき、装置が勝手に利用者の代行を
行わずとも利用者の必要な情報を検索できる対話型情報
検索装置および対話型情報検索方法を得ることを目的と
する。
【0010】
【課題を解決するための手段】上記の目的に鑑み、この
発明は、装置に入力された利用者の音声を認識して認識
結果を出力する音声認識部と、前記音声認識部より入力
される音声認識結果から情報検索要求を生成して出力
し、後述する情報検索部より入力される検索結果から利
用者への応答内容を生成して出力するユーザ主導対話管
理部と、前記音声認識部より入力される音声認識結果か
ら情報検索要求を生成して出力し、後述する情報検索部
より入力される検索結果から利用者への応答内容を生成
して出力し、後述する質問内容生成知識記憶部と後述す
る対話文脈記憶部を参照して利用者への質問内容を生成
して出力するシステム主導対話管理部と、前記システム
主導対話管理部において利用者への質問内容を生成する
ための質問内容生成知識を記憶する前記質問内容生成知
識記憶部と、前記音声認識結果と前記検索結果と前記応
答内容と前記質問内容とを記憶する前記対話文脈記憶部
と、前記ユーザ主導対話管理部あるいは前記システム主
導対話管理部より入力される情報検索要求に対して情報
検索を行って検索結果を出力する前記情報検索部と、前
記ユーザ主導対話管理部あるいは前記システム主導対話
管理部より入力される応答内容と質問内容を利用者へ提
示する応答提示部と、前記応答提示部が応答を提示した
時刻から、装置に音声が入力される時刻までの入力間隔
を計測して出力する入力間隔計測部と、前記入力間隔に
基づいて、前記ユーザ主導対話管理部と前記システム主
導対話管理部の動作切り替え指令を出力する対話主導権
切り替え部と、を備えることを特徴とする対話型情報検
索装置にある。
【0011】また、前記入力間隔計測部は、前記応答提
示部が応答を提示し終えた時刻から、装置に音声が入力
される時刻までの入力間隔を計測して出力し、前記対話
主導権切り替え部は、前記入力間隔が閾値を越えた場合
に、システム主導対話管理部を動作させるように動作切
り替え指令を出力する、ことを特徴とする。
【0012】また、前記対話主導権切り替え部は、前記
入力間隔が閾値を越えた場合に、一時的にシステム主導
対話管理部を動作するように動作切り替え指令を出力
し、かつ前記閾値を減少させることを特徴とする。
【0013】また、前記入力間隔を記憶する入力間隔記
憶部をさらに備え、前記対話主導権切り替え部は、前記
入力間隔記憶部を参照して、閾値を越える入力間隔が規
定回数以上生じた場合に、システム主導対話管理部を動
作させるように動作切り替え指令を出力する、ことを特
徴とする。
【0014】また、前記入力間隔計測部は、前記応答提
示部が応答を提示し終える前に装置に音声が入力された
場合に、前記応答提示部が応答を提示し始めた時刻か
ら、装置に音声が入力される時刻までの割り込み入力間
隔を計測して出力し、前記対話主導権切り替え部は、前
記割り込み入力間隔が閾値より短い場合に、ユーザ主導
対話管理部を動作させるように動作切り替え信号を出力
する、ことを特徴とする。
【0015】また、前記入力間隔記憶部は前記割り込み
入力間隔を記憶し、前記対話主導権切り替え部は、前記
入力間隔記憶部を参照して、閾値より短い割り込み入力
間隔が規定回数以上生じた場合に、ユーザ主導対話管理
部を動作させるように動作切り替え指令を出力する、こ
とを特徴とする。
【0016】また、ユーザ主導対話管理部に動作を切り
替えるための発話内容が登録されたユーザ主導発話辞書
をさらに備え、前記対話主導権切り替え部は、前記割り
込み入力間隔が入力された場合、前記音声認識部から入
力される音声認識結果が、前記ユーザ主導発話辞書に登
録された発話内容と一致する場合に、ユーザ主導対話管
理部を動作させるように動作切り替え指令を出力する、
ことを特徴とする。
【0017】また、前記入力間隔計測部は、前記応答提
示部が応答を提示し終える前に装置に音声が入力された
場合に、前記応答提示部に応答停止指令を出力し、前記
応答提示部は、応答停止指令が入力された場合に出力中
の応答提示処理を停止する、ことを特徴とする。
【0018】また、装置の動作に関して無意味な発話内
容が登録された無意味発話辞書と、前記無意味発話辞書
を参照して、前記音声認識部より入力される音声認識結
果が無意味発話か否かを検出する無意味発話検出部と、
をさらに備え、前記対話主導権切り替え部は、前記無意
味発話検出部が無意味発話を検出した場合に、システム
主導対話管理部を動作させるように動作切り替え指令を
出力する、ことを特徴とする。
【0019】また、前記無意発話の回数を記憶する無意
味発話回数記憶部をさらに備え、前記対話主導権切り替
え部は、前記無意味発話回数記憶部を参照し、無意味発
話回数が閾値を越えた場合に、システム主導対話管理部
を動作させるように動作切り替え指令を出力する、こと
を特徴とする。
【0020】また、前記対話文脈記憶部を参照して、前
記音声認識部より入力される音声認識結果が、直前に装
置が提示した応答内容あるいは質問内容の復唱か否かを
判定する復唱発話検出部をさらに備え、前記対話主導権
切り替え部は、前記復唱発話検出部が復唱発話を検出し
た場合に、一時的にユーザ主導対話管理部を動作させる
ように動作切り替え指令を出力する、ことを特徴とす
る。
【0021】また、前記システム主導対話管理部の生成
する質問内容に対して予測される利用者の発話内容を規
定した予測発話知識記憶部と、前記対話文脈記憶部と前
記予測発話知識記憶部を参照して、装置が利用者に質問
を提示した場合に、前記音声認識部より入力される音声
認識結果が装置の質問内容に対する予測発話であるか否
かを判定する予測発話判定部と、をさらに備え、前記対
話主導権切り替え部は、前記音声認識結果が前記予測発
話判定部において予測発話と判定されなかった場合に、
ユーザ主導対話管理部を動作させるように動作切り替え
指令を出力する、ことを特徴とする。
【0022】また、前記予測発話判定部で前記音声認識
結果が予測発話ではないと判定された回数を記憶する予
測外発話回数記憶部をさらに備え、前記対話主導権切り
替え部は、前記予測外発話回数記憶部が記憶している回
数が閾値を越えた場合に、ユーザ主導対話管理部を動作
させるように動作切り替え指令を出力する、ことを特徴
とする。
【0023】また、装置に入力された利用者の音声を認
識して認識結果を出力する音声認識工程と、前記音声認
識工程より入力される音声認識結果から情報検索要求を
生成して出力し、後述する情報検索工程より入力される
検索結果から利用者への応答内容を生成して出力するユ
ーザ主導対話管理工程と、前記音声認識工程より入力さ
れる音声認識結果から情報検索要求を生成して出力し、
後述する情報検索工程より入力される検索結果から利用
者への応答内容を生成して出力し、後述する質問内容生
成知識記憶工程と後述する対話文脈記憶工程を参照して
利用者への質問内容を生成して出力するシステム主導対
話管理工程と、前記システム主導対話管理工程において
利用者への質問内容を生成するための質問内容生成知識
を記憶する前記質問内容生成知識記憶工程と、前記音声
認識結果と前記検索結果と前記応答内容と前記質問内容
とを記憶する前記対話文脈記憶工程と、前記ユーザ主導
対話管理工程あるいは前記システム主導対話管理工程よ
り入力される情報検索要求に対して情報検索を行って検
索結果を出力する前記情報検索工程と、前記ユーザ主導
対話管理工程あるいは前記システム主導対話管理工程よ
り入力される応答内容と質問内容を利用者へ提示する応
答提示工程と、前記応答提示工程が応答を提示した時刻
から、装置に音声が入力される時刻までの入力間隔を計
測して出力する入力間隔計測工程と、前記入力間隔に基
づいて、前記ユーザ主導対話管理工程と前記システム主
導対話管理工程の動作切り替え指令を出力する対話主導
権切り替え工程と、を備えることを特徴とする対話型情
報検索方法にある。
【0024】また、前記入力間隔計測工程は、前記応答
提示工程が応答を提示し終えた時刻から、装置に音声が
入力される時刻までの入力間隔を計測して出力し、前記
対話主導権切り替え工程は、前記入力間隔が閾値を越え
た場合に、システム主導対話管理工程を動作させるよう
に動作切り替え指令を出力する、ことを特徴とする。
【0025】また、前記対話主導権切り替え工程は、前
記入力間隔が閾値を越えた場合に、一時的にシステム主
導対話管理工程を動作するように動作切り替え指令を出
力し、かつ前記閾値を減少させることを特徴とする。
【0026】また、前記入力間隔を記憶する入力間隔記
憶工程をさらに備え、前記対話主導権切り替え工程は、
前記入力間隔記憶工程を参照して、閾値を越える入力間
隔が規定回数以上生じた場合に、システム主導対話管理
工程を動作させるように動作切り替え指令を出力する、
ことを特徴とする。
【0027】また、前記入力間隔計測工程は、前記応答
提示工程が応答を提示し終える前に装置に音声が入力さ
れた場合に、前記応答提示工程が応答を提示し始めた時
刻から、装置に音声が入力される時刻までの割り込み入
力間隔を計測して出力し、前記対話主導権切り替え工程
は、前記割り込み入力間隔が閾値より短い場合に、ユー
ザ主導対話管理工程を動作させるように動作切り替え信
号を出力する、ことを特徴とする。
【0028】また、前記入力間隔記憶工程は前記割り込
み入力間隔を記憶し、前記対話主導権切り替え工程は、
前記入力間隔記憶工程を参照して、閾値より短い割り込
み入力間隔が規定回数以上生じた場合に、ユーザ主導対
話管理工程を動作させるように動作切り替え指令を出力
する、ことを特徴とする。
【0029】また、ユーザ主導対話管理工程に動作を切
り替えるための発話内容が登録されたユーザ主導発話辞
書をさらに備え、前記対話主導権切り替え工程は、前記
割り込み入力間隔が入力された場合、前記音声認識工程
から入力される音声認識結果が、前記ユーザ主導発話辞
書に登録された発話内容と一致する場合に、ユーザ主導
対話管理工程を動作させるように動作切り替え指令を出
力する、ことを特徴とする。
【0030】また、前記入力間隔計測工程は、前記応答
提示工程が応答を提示し終える前に装置に音声が入力さ
れた場合に、前記応答提示工程に応答停止指令を出力
し、前記応答提示工程は、応答停止指令が入力された場
合に出力中の応答提示処理を停止する、ことを特徴とす
る。
【0031】また、装置の動作に関して無意味な発話内
容が登録された無意味発話辞書と、前記無意味発話辞書
を参照して、前記音声認識工程より入力される音声認識
結果が無意味発話か否かを検出する無意味発話検出工程
と、をさらに備え、前記対話主導権切り替え工程は、前
記無意味発話検出工程が無意味発話を検出した場合に、
システム主導対話管理工程を動作させるように動作切り
替え指令を出力する、ことを特徴とする。
【0032】また、前記無意発話の回数を記憶する無意
味発話回数記憶工程をさらに備え、前記対話主導権切り
替え工程は、前記無意味発話回数記憶工程を参照し、無
意味発話回数が閾値を越えた場合に、システム主導対話
管理工程を動作させるように動作切り替え指令を出力す
る、ことを特徴とする
【0033】また、前記対話文脈記憶工程を参照して、
前記音声認識工程より入力される音声認識結果が、直前
に装置が提示した応答内容あるいは質問内容の復唱か否
かを判定する復唱発話検出工程をさらに備え、前記対話
主導権切り替え工程は、前記復唱発話検出工程が復唱発
話を検出した場合に、一時的にユーザ主導対話管理工程
を動作させるように動作切り替え指令を出力する、こと
を特徴とする。
【0034】また、前記システム主導対話管理工程の生
成する質問内容に対して予測される利用者の発話内容を
規定した予測発話知識記憶工程と、前記対話文脈記憶工
程と前記予測発話知識記憶工程を参照して、装置が利用
者に質問を提示した場合に、前記音声認識工程より入力
される音声認識結果が装置の質問内容に対する予測発話
であるか否かを判定する予測発話判定工程と、をさらに
備え、前記対話主導権切り替え工程は、前記音声認識結
果が前記予測発話判定工程において予測発話と判定され
なかった場合に、ユーザ主導対話管理工程を動作させる
ように動作切り替え指令を出力する、ことを特徴とす
る。
【0035】また、前記予測発話判定工程で前記音声認
識結果が予測発話ではないと判定された回数を記憶する
予測外発話回数記憶工程をさらに備え、前記対話主導権
切り替え工程は、前記予測外発話回数記憶工程が記憶し
ている回数が閾値を越えた場合に、ユーザ主導対話管理
工程を動作させるように動作切り替え指令を出力する、
ことを特徴とする。
【0036】
【発明の実施の形態】以下この発明を各実施の形態に従
って説明する。 実施の形態1.図1はこの発明の実施の形態1による対
話型情報検索装置の構成図を示すものである。図1にお
いて、1は装置に入力された利用者の音声を認識して認
識結果を出力する音声認識部、2は音声認識部1より入
力される音声認識結果から情報検索要求を生成して出力
し、後述する情報検索部6より入力される検索結果から
利用者への応答内容を生成して出力するユーザ主導対話
管理部、3は音声認識部1より入力される音声認識結果
から情報検索要求を生成して出力し、後述する情報検索
部6より入力される検索結果から利用者への応答内容を
生成して出力し、後述する対話文脈記憶部5を参照して
利用者への質問内容を生成して出力するシステム主導対
話管理部である。
【0037】4はシステム主導対話管理部3において利
用者への質問内容を生成するための質問内容生成知識を
記憶する質問内容生成知識記憶部、5は前記音声認識結
果と前記検索結果と前記応答内容と前記質問内容とを記
憶する対話文脈記憶部、6はユーザ主導対話管理部2あ
るいはシステム主導対話管理部3より入力される情報検
索要求に対して情報検索を行って検索結果を出力する情
報検索部である。
【0038】8はユーザ主導対話管理部2あるいはシス
テム主導対話管理部3より入力される応答内容と質問内
容を利用者へ提示する応答提示部、7は応答提示部8が
応答を提示した時刻から、装置に音声が入力される時刻
までの入力間隔を計測して出力する入力間隔計測部、9
は前記入力間隔に基づいて、ユーザ主導対話管理部2と
システム主導対話管理部3の動作切り替え指令を出力す
る対話主導権切り替え部である。
【0039】以下、本発明を電話による宿泊施設情報検
索装置に用いた場合について具体的な動作説明を行う。
電話による宿泊施設情報検索装置とは、利用者が検索サ
ービスに電話を掛け、場所、金額などの条件を入力して
希望の宿泊施設を検索するものである。図2に示す装置
と利用者の対話例について、入力間隔の閾値が5秒で、
対話開始時点ではユーザ主導対話管理部2が動作してい
る場合について説明する。
【0040】なお、本実施の形態は、本発明を電話によ
る宿泊施設情報検索装置に用いた場合について説明した
ものであるが、本発明は、電話による宿泊施設情報検索
装置のみならず、鉄道時刻表検索装置、フライトスケジ
ュール検索装置、住宅情報検索装置、株価情報検索装置
など他の対話型情報検索装置に用いることが可能であ
る。
【0041】利用者が電話を掛けると、装置は「はい、
こちらは宿泊施設検索サービスです」という発話SYS
11を出力して対話を開始する。入力間隔計測部7は発
話SYS11の出力が完了した時刻10時34分25秒
からの経過時間を計測し、対話主導権切り替え部9に出
力する。利用者が時刻10時34分28秒に「横浜駅の
近くで探してるんですが」と発話USR12を行うと、
利用者の発話が音声認識部1と入力間隔計測部7に入力
される。入力間隔計測部7は発話USR12が入力され
ると経過時間の計測を完了し、入力間隔計測部7から出
力される経過時間は3秒で停止する。この入力間隔は閾
値の5秒を越えないため対話主導権切り替え部9は切り
替え動作を行わず、ユーザ主導対話管理部2が引き続き
動作する。
【0042】音声認識部1に利用者の発話USR12が
入力されると音声認識が行われ、図3に示す認識結果が
ユーザ主導対話管理部2に入力される。図3において、
「検索要求」は入力発話の文意、「{場所=横浜駅近
く}」は、検索動作に必要なパラメータを表す。
【0043】ユーザ主導対話管理部2は音声認識結果が
入力されると、例えばSQLによる検索式を生成して情
報検索部6に出力する。情報検索部6は入力された検索
式を用いてデータベース(特に図示せず)から情報を検索
し、例えば図4に示すような10件の宿泊施設名を検索
結果としてユーザ主導対話管理部2に出力する。
【0044】図4の検索結果が入力されるとユーザ主導
対話管理部2は図5に示す応答内容を生成する。応答提
示部8は、入力された応答内容を音声合成により「その
条件に合うのは横浜ベイシェラトン、横浜東急ホテルな
ど10件です。」という発話SYS13にして利用者に
提示する。
【0045】入力間隔計測部7は、発話SYS13の出
力が完了した時刻10時34分39秒からの経過時間を
計測して対話主導権切り替え部9に出力する。時刻10
時34分44秒を過ぎても利用者が次の入力を行わない
と、入力間隔計測部7より出力される経過時間が5秒以
上となり、入力間隔の閾値を越えるため、対話主導権切
り替え部9はユーザ主導対話管理部2からシステム主導
対話管理部3へ動作を切り替える。
【0046】図6は、質問内容生成知識記憶部4に記憶
された質問内容生成知識の一例を示すもので、情報検索
部6で指定できる条件の一覧が質問内容生成知識として
保持されている。システム主導対話管理部3は、図6の
質問内容生成知識と、対話文脈記憶部5に記憶された図
7に示す対話文脈とを参照して、例えば利用者がまだ入
力していない検索条件「予算」についての図8に示す質
問内容を生成して応答提示部8に出力する。応答提示部
8は質問内容を音声合成により「予算のご希望はありま
すか」という発話SYS14にして利用者に提示する。
【0047】利用者が「一万円くらいです」と発話US
R15を入力すると、音声認識部1により音声認識が行
われ、図9に示す認識結果がシステム主導対話管理部3
に入力される。システム主導対話管理部3は音声認識結
果に基づいて、検索式を生成して情報検索部6に出力
し、情報検索部6から例えば図10に示すような検索結
果がシステム主導対話管理部3に入力される。
【0048】図10に示す検索結果が入力されるとシス
テム主導対話管理部3は、図12に示す応答内容を生成
して応答提示部8に出力する。さらにシステム主導対話
管理部3は、対話文脈記憶部5に記憶された図11に示
す対話文脈を参照して、例えば利用者がまだ入力してい
ない検索条件「客室タイプ」についての質問内容として
図13に示す質問内容を生成して応答提示部8に出力す
る。応答提示部8は入力された応答内容と質問内容を音
声合成により「その条件に合うのはヨコハマビーサイド
ホテル、ホテルサンポートなどの5件ございます。」
「客室タイプのご希望はありますか」という発話SYS
16およびSYS17を利用者に提示する。
【0049】以上の動作により、装置が応答を提示し終
えた時刻から、次に装置に音声が入力されるまでの入力
間隔を入力間隔計測部7が計測して出力し、入力間隔が
閾値を越えた場合に、対話主導権切り替え部9がシステ
ム主導対話管理部3を動作させるように動作切り替え指
令を出力するため、利用者が円滑に入力を行えない状況
が生じた場合、それ以降装置が対話の主導権を取り、利
用者が常に一定時間待たされることなく対話が円滑に継
続され、さらに装置が勝手に利用者の代行を行わずとも
利用者が必要な情報を検索することが可能となる。
【0050】なお、本実施の形態では本発明を対話型情
報検索装置として実現する例について説明したが、各機
能ブロックと同等の機能を持つソフトウエアで構成し、
計算機読み取り可能なソフトウエア記録媒体として、任
意の計算機で実行できるようにしてもよい。以下同様。
【0051】実施の形態2.実施の形態2は、上述の実
施の形態1とは図1の対話主導権切り替え部9が異なる
ものであり、他は実施の形態1と同一である。従って、
基本的には図1の構成を有しているため、図1を参照す
ることとする。以下、本実施の形態における対話主導権
切り替え部9について説明する。
【0052】図14に示す装置と利用者の対話例につい
て、入力間隔の閾値の初期値が4秒で、対話主導権切り
替え部9は閾値を半分に減少させ、対話開始時点ではユ
ーザ主導対話管理部2が動作している場合について説明
する。
【0053】利用者が電話を掛けると、装置は「はい、
こちらは宿泊施設検索サービスです」という応答を出力
して対話を開始する。その後、発話SYS23までは実
施の形態1と同様に動作を行い対話が進行する。
【0054】発話SYS23が出力された後、入力間隔
計測部7は時刻10時34分42秒からの経過時間を計
測して対話主導権切り替え部9に出力する。時刻10時
34分46秒を過ぎても利用者が次の入力を行わない
と、入力間隔計測部7より出力される経過時間が4秒以
上となり、入力間隔の閾値を越えるため、対話主導権切
り替え部9はユーザ主導対話管理部2からシステム主導
対話管理部3へ一時的に動作を切り替える。さらに入力
間隔の閾値を4秒の半分である2秒に再設定する。
【0055】システム主導対話管理部3は、図6の質問
内容生成知識と、対話文脈記憶部5に記憶された図15
に示す対話文脈とを参照して、例えば利用者がまだ入力
していない検索条件「場所」についての質問内容を生成
して応答提示部8に出力する。応答提示部8は質問内容
を音声合成により発話SYS24を利用者に提示する。
その後、発話SYS26までは実施の形態1と同様に動
作して対話が進行する。発話SYS26が出力される
と、対話主導権切り替え部9はシステム主導対話管理部
3の一時的な動作から、ユーザ主導対話管理部2へ動作
を切り替える。
【0056】発話SYS26が出力された後、入力間隔
計測部7は時刻10時34分59秒からの経過時間を計
測して対話主導権切り替え部9に出力する。時刻10時
35分01秒を過ぎても利用者が次の入力を行わない
と、入力間隔計測部7より出力される経過時間が2秒以
上となり、入力間隔の閾値を越えるため、対話主導権切
り替え部9はユーザ主導対話管理部2からシステム主導
対話管理部3へ一時的に動作を切り替える。さらに入力
間隔の閾値を2秒の半分である1秒に再設定する。
【0057】システム主導対話管理部3は、図6の質問
内容生成知識と、対話文脈記憶部5に記憶された図16
に示す対話文脈とを参照して、例えば利用者がまだ入力
していない検索条件「予算」についての質問内容を生成
して応答提示部8に出力する。応答提示部8は質問内容
を音声合成により発話SYS27を利用者に提示する。
【0058】以上の動作により、装置が応答を提示し終
えた時刻から、次に装置に音声が入力されるまでの入力
間隔を入力間隔計測部7が計測して出力し、入力間隔が
閾値を越えた場合に、前記対話主導権切り替え部9が一
時的にシステム主導対話管理部3を動作するように動作
切り替え指令を出力し、さらに閾値を減少させるため、
基本的に利用者が主導権を持って対話を進めるが、利用
者が円滑に入力を行えない状況が生じた場合、一時的に
装置が対話の主導権を取って対話を円滑に継続し、さら
にそのような状況が繰り返し生じる場合に、より迅速に
装置が主導権を取って対話を円滑に継続することが可能
となる。
【0059】実施の形態3.図17はこの発明の実施の
形態3による対話型情報検索装置の構成図を示すもので
ある。実施の形態3は、上述の実施の形態1とは入力間
隔記憶部10と対話主導権切り替え部9が異なるもので
あり、他は実施の形態1と同一である。従って、本実施
の形態における入力間隔記憶部10と対話主導権切り替
え部9の動作を、図18に示す装置と利用者の対話例に
ついて、入力間隔の閾値が3秒、閾値を越える入力間隔
の規定回数が2回、対話開始時点ではユーザ主導対話管
理部2が動作している場合について説明する。
【0060】利用者が電話を掛けると、装置は「はい、
こちらは宿泊施設検索サービスです」という応答を出力
して対話を開始する。入力間隔計測部7は応答の出力が
完了した時刻10時34分25秒からの経過時間を計測
し、対話主導権切り替え部9に出力する。利用者の発話
USR32が時刻10時34分30秒に入力されると、
入力間隔計測部7は経過時間の計測を完了し、入力間隔
5秒が入力間隔記憶部10に出力され、図19に示すよ
うに入力間隔記憶部10に記憶される。
【0061】入力間隔が閾値の3秒を越える入力間隔は
1回であり、閾値を越える入力間隔の規定回数である2
回を越えないので、対話主導権切り替え部9は切り替え
動作を行わず、ユーザ主導対話管理部2が引き続き動作
する。以後、装置の発話SYS35までは同様に動作を
行って対話を進める。装置の発話SYS35が出力され
た時点で、入力間隔記憶部10に記憶された入力間隔は
図20のようになっている。
【0062】発話SYS35が出力された後、入力間隔
計測部7は時刻10時34分51秒からの経過時間を計
測して出力する。時刻10時34分54秒を過ぎても利
用者が次の入力を行わないと、入力間隔計測部7より出
力される経過時間が3秒以上となり、さらに図20に示
す入力間隔記憶部10に記憶された入力間隔より、閾値
3秒を越える入力間隔が2回を越えるため、対話主導権
切り替え部9はユーザ主導対話管理部2からシステム主
導対話管理部3へ動作を切り替える。
【0063】システム主導対話管理部3は、図6の質問
内容生成知識と、対話文脈記憶部5に記憶された図21
に示す対話文脈とを参照して、例えば利用者がまだ入力
していない検索条件「場所」についての質問内容を生成
して応答提示部8に出力する。応答提示部8は質問内容
を音声合成により発話SYS36を利用者に提示する。
【0064】以上の動作により、装置が応答を提示し終
えた時刻から、次に装置に音声が入力されるまでの入力
間隔を入力間隔計測部7が計測して出力し、入力間隔計
測部7が計測した入力間隔を入力間隔記憶部10が記憶
し、閾値を越える入力間隔が規定回数以上生じた場合
に、対話主導権切り替え部9がシステム主導対話管理部
3を動作させるように動作切り替え指令を出力するた
め、基本的に利用者が主導権を持って対話を進めるが、
利用者が円滑に入力を行えない状況が規定回数以上生じ
た場合、装置が対話の主導権を取って対話を円滑に継続
することが可能となる。
【0065】実施の形態4.図22はこの発明の実施の
形態4による対話型情報検索装置の構成図を示すもので
ある。実施の形態4は、実施の形態1とは入力間隔計測
部7と対話主導権切り替え部9が異なるものであり、他
は実施の形態1と同一である。従って、本実施の形態に
おける入力間隔計測部7と対話主導権切り替え部9の動
作を、図23に示す装置と利用者の対話例について、割
り込み入力間隔の閾値が2秒で、対話開始時点ではシス
テム主導対話管理部3が動作している場合を例に説明す
る。
【0066】利用者が電話を掛けると、装置は「はい、
こちらは宿泊施設検索サービスです」という応答を出力
して対話を開始する。対話文脈記憶部5にはまだ何も記
憶されていないため、システム主導対話管理部3は、図
6の質問内容生成知識を参照して、検索条件「場所」に
ついての質問内容を生成して応答提示部8に出力する。
応答提示部8は質問内容を音声合成により発話SYS4
2を利用者に提示する。その後、装置の発話SYS45
の出力を開始する時点までは、実施の形態1と同様に動
作して対話を進める。
【0067】応答提示部8が時刻10時34分38秒に
発話SYS45の出力を開始すると、入力間隔計測部7
は出力開始時刻から利用者の音声が入力されるまでの経
過時間の計測を開始する。応答提示部8が発話SYS4
5を全て出力し終わるのは10時34分41秒(図23
の発話SYS45の括弧内の時刻)であるが、ここで利
用者が次の発話USR46を、装置の発話SYS45が
出力が完了していない時刻10時34分39秒に行った
とする。この場合、入力間隔計測部7は発話SYS45
の開始から発話USR46の入力までの経過時間1秒
を、割り込み入力間隔として対話主導権切り替え部9に
出力し、さらに応答停止指令を応答提示部8に出力す
る。対話主導権切り替え部9は、入力された割り込み入
力間隔が1秒であり閾値より短いため、ユーザ主導対話
管理部2を動作させるように動作切り替え信号を出力す
る。また、応答提示部8は応答停止指令を10時34分
39秒に受け取ると、発話SYS45の提示処理を停止
する。このため、発話SYS45の括弧内の応答は利用
者には提示されない。
【0068】利用者の発話USR46が入力されると、
ユーザ主導対話管理部2は実施の形態1と同様に動作し
て発話SYS47を出力し、利用者の発話が入力される
のを待つ。利用者は発話USR48を入力し、装置は実
施の形態1と同様に動作して対話を継続する。
【0069】以上の動作により、応答提示部8が応答を
提示し終える前に装置に音声が入力された場合に、入力
間隔計測部7は応答提示部8が応答を提示し始めた時刻
から、装置に音声が入力される時刻までの割り込み入力
間隔を計測して出力し、さらに応答提示部8へ応答停止
指令を出力し、応答停止指令が入力された場合に応答提
示部8は出力中の応答提示処理を停止し、割り込み入力
間隔が閾値より短い場合に、対話主導権切り替え部9が
ユーザ主導対話管理部2を動作させるように動作切り替
え信号を出力するため、装置に入力したい検索条件を利
用者が明確に持っている状況において、装置からの質問
やガイダンスなどを遮って利用者の要求を入力すること
ができ、その後も利用者が主導権を取って円滑に対話を
継続することが可能となる。
【0070】実施の形態5.図24はこの発明の実施の
形態5による対話型情報検索装置の構成図を示すのであ
る。実施の形態5は、実施の形態4と入力間隔記憶部1
0と対話主導権切り替え部9が異なるものであり、他は
実施の形態4と同一である。従って、本実施の形態にお
ける入力間隔記憶部10と対話主導権切り替え部9の動
作を、図25に示す装置と利用者の対話例について、割
り込み入力間隔の閾値が2秒、閾値より短い割り込み入
力間隔の規定回数を1回、対話開始時点ではシステム主
導対話管理部3が動作している場合を例に説明する。
【0071】利用者が電話を掛けると、装置は発話SY
S51を出力して対話を開始する。入力間隔計測部7は
発話SYS51の出力開始時刻から利用者の音声が入力
されるまでの経過時間の計測を開始する。応答提示部8
が発話SYS51を全て出力し終わるのは10時34分
25秒(図25の発話SYS51の括弧内の時刻)であ
るが、ここで利用者が発話USR52を、装置の発話S
YS51の出力が完了していない時刻10時34分23
秒に行ったとする。この場合、入力間隔計測部7は発話
SYS51の開始から発話USR52が入力されるまで
の経過時間1秒を、割り込み入力間隔として対話主導権
切り替え部9および入力間隔記憶部10に出力し、応答
停止指令を応答提示部8に出力する。割り込み入力間隔
は図26に示すように入力間隔記憶部10に記憶され
る。
【0072】応答提示部8は応答停止指令を10時34
分23秒に受け取ると、発話SYS51の提示処理を停
止する。このため、発話SYS51の括弧内の応答は利
用者には提示されない。
【0073】利用者の発話USR52に対しては実施の
形態1と同様に動作して応答提示部8が発話SYS53
を利用者に提示する。さらに、システム主導対話管理部
3は、図7の対話文脈と図6の質問内容生成知識を参照
して、検索条件「予算」についての質問内容を生成して
応答提示部8に出力する。応答提示部8は発話SYS5
4を利用者に提示する。
【0074】応答提示部8が時刻10時34分34秒に
発話SYS54の出力を開始すると、入力間隔計測部7
は出力開始時刻から利用者の音声が入力されるまでの経
過時間の計測を開始する。応答提示部8が発話SYS5
4を全て出力し終わるのは10時34分37秒(図25
の発話SYS54の括弧内の時刻)であるが、ここで利
用者が次の発話USR55を、装置の発話SYS54が
出力が完了していない時刻10時34分35秒に行った
とする。この場合、割り込み入力間隔として1秒を対話
主導権切り替え部9に出力し、さらに応答停止指令を応
答提示部8に出力する。割り込み入力間隔1秒は閾値よ
り短く、また、閾値より短い割り込み入力間隔が入力間
隔記憶部10に1回記憶されているので、閾値より短い
割り込み入力間隔が規定回数1回を越える。このため、
対話主導権切り替え部9は、ユーザ主導対話管理部2を
動作させるように動作切り替え信号を出力する。また、
応答提示部8は応答停止指令を10時34分35秒に受
け取ると、発話SYS54の提示処理を停止する。この
ため、発話SYS54の括弧内の応答は利用者には提示
されない。
【0075】利用者の発話USR55が入力されると、
ユーザ主導対話管理部2は実施の形態1と同様に動作し
て発話SYS56を出力し、利用者の発話が入力される
のを待つ。利用者は発話USR57を入力し、装置は実
施の形態1と同様に動作して対話を継続する。
【0076】以上の動作により、応答提示部8が応答を
提示し終える前に装置に音声が入力された場合に、入力
間隔計測部7は応答提示部8が応答を提示し始めた時刻
から、装置に音声が入力される時刻までの割り込み入力
間隔を計測して出力し、さらに応答提示部8へ応答停止
指令を出力し、入力間隔計測部7が計測した割り込み入
力間隔を入力間隔記憶部10が記憶し、応答停止指令が
入力された場合に応答提示部8は出力中の応答提示処理
を停止し、閾値より短い割り込み入力間隔が規定回数以
上生じた場合に、対話主導権切り替え部9がユーザ主導
対話管理部2を動作させるように動作切り替え信号を出
力するため、装置に入力したい検索条件を利用者が明確
に持っている状況において、装置からの質問やガイダン
スなどを遮って利用者の要求を入力することができ、そ
の後も利用者が主導権を取って円滑に対話を継続するこ
とが可能となる。
【0077】実施の形態6.図27はこの発明の実施の
形態6による対話型情報検索装置の構成図を示すもので
ある。実施の形態6は、実施の形態5と対話主導権切り
替え部9の機能と、新たにユーザ主導発話辞書11を備
える点が異なり、他は実施の形態5と同一である。従っ
て、本実施の形態における対話主導権切り替え部9の動
作を、図28に示す装置と利用者の対話例について、対
話開始時点ではシステム主導対話管理部3が動作してお
り、ユーザ主導発話辞書11の内容が図29に示す場合
を例に説明する。
【0078】利用者が電話を掛けると、装置は発話SY
S61を出力して対話を開始する。利用者がSYS61
の出力が完了する前の時刻10時34分23秒に発話U
SR62を入力すると、入力間隔計測部7は実施の形態
5と同様に動作して、割り込み入力間隔として1秒を、
対話主導権切り替え部9に出力し、応答停止指令を応答
提示部8に出力する。応答提示部8は応答停止指令を1
0時34分23秒に受け取ると、発話SYS61の提示
処理を停止し、発話SYS61の括弧内の応答は利用者
には提示されない。
【0079】音声認識部1は利用者の発話USR62が
入力されると音声認識を行い、認識結果として「発話停
止要求」を出力する。対話主導権切り替え部9は、入力
間隔計測部7から割り込み入力間隔が入力されると、音
声認識結果がユーザ主導発話辞書11に登録されている
か否かの判定を行う。認識結果「発話停止要求」は図2
9に示すユーザ主導発話辞書11に登録されているの
で、対話主導権切り替え部9は一時的にユーザ主導対話
管理部2を起動させるように動作切り替え命令を出力す
る。
【0080】利用者の発話USR63が入力されると、
システム主導対話管理部3、情報検索部6、応答提示部
8は実施の形態1と同様に動作して、装置の発話SYS
64を利用者にに提示する。
【0081】以上の動作により、応答提示部8が応答を
提示し終える前に装置に音声が入力された場合に、入力
間隔計測部7は応答提示部8が応答を提示し始めた時刻
から、装置に音声が入力される時刻までの割り込み入力
間隔を計測して出力し、さらに応答提示部8へ応答停止
指令を出力し、ユーザ主導発話辞書11にユーザ主導対
話管理部2に動作を切り替えるための発話を登録してお
き、対話主導権切り替え部9は、割り込み入力間隔が入
力された場合、音声認識部1から入力される音声認識結
果が、ユーザ主導発話辞書11に登録されたユーザ主導
発話と一致する場合に、一時的にユーザ主導対話管理部
2を動作させるように動作切り替え指令を出力するた
め、装置に入力したい検索条件を利用者が明確に持って
いる状況において、装置からの質問やガイダンスなどを
明示的に遮って、利用者が対話の主導権を取ることがで
き、円滑に対話を継続することが可能となる。
【0082】実施の形態7.図30はこの発明の実施の
形態7による対話型情報検索装置の構成図を示すもので
ある。実施の形態7は、実施の形態1と対話主導権切り
替え部9の機能と、新たに無意味発話辞書13および無
意味発話検出部12を備える点が異なり、他は実施の形
態1と同一である。従って、本実施の形態における対話
主導権切り替え部9と無意味発話検出部12の動作を、
図31に示す装置と利用者の対話例について、無意味発
話辞書13の内容が図32に示すもので、対話開始時点
でユーザ主導対話管理部2が動作している場合を例に説
明する。
【0083】利用者が電話を掛けると、装置は発話SY
S71を出力して対話を開始する。利用者が発話USR
72を入力すると、音声認識部1は音声認識を行い認識
結果として「不要語」を出力する。
【0084】無意味発話検出部12は、音声認識結果
「不要語」が入力されると図32に示す無意味発話辞書
13を参照して、音声認識結果「不要語」が無意味発話
であると判定する。
【0085】無意味発話検出部12により無意味発話が
検出されると、対話主導権切り替え部9はシステム主導
対話管理部3を動作させるように動作切り替え指令を出
力する。以後、実施の形態1と同様に動作して対話を継
続する。
【0086】以上の動作により、装置の動作に関して無
意味な発話を無意味発話辞書13に登録しておき、無意
味発話検出部12が、無意味発話辞書13を参照して音
声認識結果が無意味発話か否かを検出し、無意味発話が
検出された場合に、対話主導権切り替え部9がシステム
主導対話管理部3を動作させるように動作切り替え指令
を出力するため、利用者が円滑に入力を行えなえず装置
の動作に無意味な入力をした場合に、装置が対話の主導
権を取って円滑に対話を継続することが可能となる。
【0087】実施の形態8.図33はこの発明の実施の
形態8による対話型情報検索装置の構成図を示すもので
ある。実施の形態8は、実施の形態7と対話主導権切り
替え部9の機能と、新たに無意味発話回数記憶部14を
備える点が異なり、他は実施の形態7と同一である。従
って、本実施の形態における対話主導権切り替え部9と
無意味発話回数記憶部14の動作を、図34に示す装置
と利用者の対話例について、無意味発話辞書13の内容
が図32に示すもの、無意味発話回数の閾値が2回、対
話開始時点でユーザ主導対話管理部2が動作している場
合を例に説明する。
【0088】利用者が電話を掛けると、装置は発話SY
S81を出力して対話を開始する。利用者が発話USR
82を入力すると、音声認識部1は音声認識を行い認識
結果として「不要語」を出力する。無意味発話検出部1
2は、音声認識結果「不要語」が入力されると図32に
示す無意味発話辞書13を参照して、音声認識結果「不
要語」が無意味発話であると判定し、無意味発話回数記
憶部14に1が記憶される。利用者の発話USR82に
対しては、実施の形態3と同様に動作して応答提示部8
により装置の発話SYS83が提示される。
【0089】利用者が発話USR84を入力すると、音
声認識部1は音声認識結果として「検索要求{NUL
L}」を出力する。無意味発話検出部12は、図32に
示す無意味発話辞書13を参照して、音声認識結果「検
索要求{NULL}」が無意味発話であると判定し、無
意味発話回数記憶部14に保持された無意味発話の回数
は2に更新される。利用者の発話USR84に対して
は、実施の形態2と同様に動作して応答提示部8により
装置の発話SYS85が提示される。
【0090】次に利用者が発話USR86を入力する
と、装置は前述の発話USR82の場合と同様に動作し
て、無意味発話回数記憶部14に保持された無意味発話
の回数は3に更新される。応答提示部8は装置の発話S
YS87を提示する。
【0091】無意味発話回数記憶部14に保持された回
数が3に更新されると、閾値2を越えるため、対話主導
権切り替え部9はシステム主導対話管理部3を動作させ
るように動作切り替え指令を出力する。以後、装置は実
施の形態3と同様に動作して発話SYS88を利用者に
提示する。
【0092】以上の動作により、装置の動作に関して無
意味な発話を無意味発話辞書13に登録しておき、無意
味発話検出部12が、無意味発話辞書13を参照して音
声認識結果が無意味発話か否かを検出し、無意味発話回
数記憶部14が無意発話の回数を記憶し、無意味発話の
回数が閾値を越えた場合に、対話主導権切り替え部9が
システム主導対話管理部3を動作させるように動作切り
替え指令を出力するため、利用者が円滑に入力を行えな
えず装置の動作に無意味な入力を繰り返した場合に、装
置が対話の主導権を取って円滑に対話を継続することが
可能となる。
【0093】実施の形態9.図35はこの発明の実施の
形態9による対話型情報検索装置の構成図を示すもので
ある。実施の形態9は、実施の形態4に対して、対話主
導権切り替え部9の機能と、新たに復唱発話検出部15
を備える点が異なり、他は実施の形態4と同一である。
従って、本実施の形態における対話主導権切り替え部9
と復唱発話検出部15の動作を、図36に示す装置と利
用者の対話例について、対話開始時点でシステム主導対
話管理部3が動作している場合を例に説明する。
【0094】利用者が電話を掛けると、装置は発話SY
S91を出力して対話を開始する。その後、装置は実施
の形態4と同様に動作して発話SYS92を利用者に提
示する。発話SYS92を出力し終わった時点での対話
文脈記憶部5に保持された対話文脈は図37に示すもの
となっている。
【0095】次に利用者の発話USR93が入力される
と、音声認識部1は音声認識結果として「条件名宣言
{条件=場所}」を出力する。音声認識結果が入力され
ると、復唱発話検出部15は図37に示す対話文脈を参
照して、入力された音声認識結果のパラメータ部分が、
直前に装置が提示した質問発話「条件質問{条件=場
所}」のパラメータ部分と一致するため、利用者の発話
USR93が装置の発話SYS92の復唱であると判定
する。
【0096】復唱発話検出部15により復唱発話が検出
されると、対話主導権切り替え部9は一時的にユーザ主
導対話管理部2を動作させるように動作切り替え指令を
出力する。装置は実施の形態4と同様に動作して、発話
SYS94を出力して利用者の入力を待つ。利用者が発
話USR95を入力すると実施の形態4と同様に動作し
て、発話SYS96およびSYS97を利用者に提示す
る。
【0097】以上の動作により、復唱発話検出部15
が、対話文脈記憶部5を参照して、音声認識結果が装置
の提示した発話内容の復唱か否かを判定し、復唱発話検
出部15が復唱発話を検出した場合に、対話主導権切り
替え部9が一時的にユーザ主導対話管理部2を動作させ
るように動作切り替え指令を出力するため、利用者が装
置の応答に対して思考している状況において、一時的に
利用者に対話の主導権を渡して入力を待つことで、円滑
に対話を継続することが可能となる。
【0098】実施の形態10.図38はこの発明の実施
の形態10による対話型情報検索装置の構成図を示すも
のである。実施の形態10は、実施の形態4に対して、
対話主導権切り替え部9の機能と、新たに予測発話知識
記憶部16と予測発話判定部17を備える点が異なり、
他は実施の形態4と同一である。従って、本実施の形態
における対話主導権切り替え部9と予測発話判定部17
の動作を、図39に示す装置と利用者の対話例につい
て、対話開始時点でシステム主導対話管理部3が動作し
ている場合を例に説明する。
【0099】図40は予測発話知識記憶部16に規定さ
れた知識の一例を示すもので、装置の質問内容に対して
予測される利用者の発話が表として規定されている。例
えば、装置の質問「条件質問{条件=場所}」に対して
予測される利用者の発話は「条件指定{場所=*}」あ
るいは「検索要求{場所=*}」であることが規定され
ている。表中の「*」は任意の値と一致することを意味
する。
【0100】利用者が電話を掛けると、装置は発話SY
S101を出力して対話を開始する。装置は実施の形態
4と同様に動作して発話SYS102を提示する。この
時点において、対話文脈記憶部5に保持された対話文脈
は図41に示すものとなっている。
【0101】利用者が発話USR103を入力すると、
音声認識部1は音声認識結果として「条件指定{場所=
横浜駅近く}」を出力する。予測発話判定部17は音声
認識結果が入力されると、図40に示す予測発話知識記
憶部16と図41に示す対話文脈を参照して、入力され
た音声認識結果「条件指定{場所=横浜駅近く}」が装
置の質問発話「条件質問{条件=場所}」に対して予測
される発話であると判定する。したがって、対話主導権
切り替え部9は動作を行わず、システム主導対話管理部
3の動作が継続する。システム主導対話管理部3は、利
用者の発話USR103に対し、実施の形態4と同様に
動作を行い、発話SYS104およびSYS105を利
用者に提示する。この時点で対話文脈記憶部5に保持さ
れた対話文脈は、図42に示すものとなる。
【0102】次に利用者の発話USR106が入力され
ると、音声認識部1は音声認識結果として「条件指定
{客室タイプ=シングル}」を出力する。予測発話判定
部17は音声認識結果が入力されると、図40に示す予
測発話知識記憶部16と図42に示す対話文脈を参照し
て、入力された音声認識結果「条件指定{客室タイプ=
シングル}」が装置の質問発話「条件質問{条件=予
算}」に対して予測される発話ではないと判定する。し
たがって、対話主導権切り替え部9は、ユーザ主導対話
管理部2を動作させるように動作切り替え指令を出力す
る。
【0103】利用者の発話USR106が入力される
と、ユーザ主導対話管理部2、情報検索部6、応答提示
部8が実施の形態4と同様に動作して、装置の発話SY
S107を出力し、利用者の発話を待つ。利用者の発話
USR108が入力されると、装置は実施の形態4と同
様に動作して、発話SYS109を提示する。
【0104】以上の動作により、システム主導対話管理
部3の生成する質問内容に対して予測される利用者の発
話内容を規定した予測発話知識と対話文脈を参照して、
予測発話判定部17が、音声認識結果が装置の質問内容
に対する予測発話であるか否かを判定し、音声認識結果
が予測発話と判定されなかった場合に、対話主導権切り
替え部9がユーザ主導対話管理部2を動作させるように
動作切り替え指令を出力するため、装置から質問された
検索条件以外の条件を利用者が明確に持っている状況に
おいて、利用者が主導権を取って円滑に対話を継続する
ことが可能となる。
【0105】実施の形態11.図43はこの発明の実施
の形態11による対話型情報検索装置の構成図を示すも
のである。実施の形態11は、実施の形態10に対し
て、対話主導権切り替え部9の機能と、新たに予測外発
話回数記憶部18を備える点が異なり、他は実施の形態
10と同一である。従って、本実施の形態における対話
主導権切り替え部9と予測外発話回数記憶部18の動作
を、図44に示す装置と利用者の対話例について、図4
0の予測発話知識記憶部16を用いて、予測外発話回数
の閾値が1回の場合で、対話開始時点でシステム主導対
話管理部3が動作している場合を例に説明する。
【0106】利用者が電話を掛けると、装置は発話SY
S111を出力して対話を開始する。発話SYS115
までは、装置は実施の形態10と同様に動作する。発話
SYS115が提示された時点において、対話文脈記憶
部5に保持された対話文脈は図42に示すものとなって
いる。
【0107】利用者の発話USR116が入力される
と、予測発話判定部17は実施の形態10と同様に動作
して、入力された音声認識結果「条件指定{客室タイプ
=シングル}」が装置の質問発話「条件質問{条件=予
算}」に対して予測される発話ではないと判定し、予測
外発話回数記憶部18に記憶された回数を1に更新す
る。予測外発話回数の閾値1回を越えないため対話主導
権切り替え部9は動作を行わない。
【0108】利用者の発話USR116に対して、シス
テム主導対話管理部3、情報検索部6、応答提示部8は
実施の形態4と同様に動作して、発話SYS117およ
びSYS118を出力する。この時点での対話文脈は図
45に示すものとなっている。
【0109】利用者の発話USR119が入力される
と、予測発話判定部17は実施の形態10と同様に動作
して、入力された音声認識結果「条件指定{客室タイプ
=シングル}」が装置の質問発話「条件質問{条件=予
算}」に対して予測される発話ではないと判定し、予測
外発話回数記憶部18に記憶された回数を2に更新す
る。予測外発話回数が閾値の1を越えるので、対話主導
権切り替え部9はユーザ主導対話管理部2を動作させる
ように動作切り替え指令を出力する。
【0110】利用者の発話USR119に対して、ユー
ザ主導対話管理部2、情報検索部6、応答提示部8は実
施の形態1と同様に動作して発話SYS120を出力
し、利用者の発話を待つ。
【0111】以上の動作により、予測外発話回数記憶部
18が音声認識結果が予測発話ではないと判定された回
数を記憶し、予測外発話回数が閾値を越えた場合に、対
話主導権切り替え部9がユーザ主導対話管理部2を動作
させるように動作切り替え指令を出力するため、装置か
ら質問された検索条件以外の条件を利用者が明確に持っ
ており、装置からの質問が利用者が入力したい条件と異
なることが繰り返され、対話が円滑に進まない状況にお
いて、利用者が主導権を取って円滑に対話を継続するこ
とが可能となる。
【0112】
【発明の効果】以上のようにこの発明によれば、装置に
入力された利用者の音声を認識して認識結果を出力する
音声認識部と、前記音声認識部より入力される音声認識
結果から情報検索要求を生成して出力し、後述する情報
検索部より入力される検索結果から利用者への応答内容
を生成して出力するユーザ主導対話管理部と、前記音声
認識部より入力される音声認識結果から情報検索要求を
生成して出力し、後述する情報検索部より入力される検
索結果から利用者への応答内容を生成して出力し、後述
する質問内容生成知識記憶部と後述する対話文脈記憶部
を参照して利用者への質問内容を生成して出力するシス
テム主導対話管理部と、前記システム主導対話管理部に
おいて利用者への質問内容を生成するための質問内容生
成知識を記憶する前記質問内容生成知識記憶部と、前記
音声認識結果と前記検索結果と前記応答内容と前記質問
内容とを記憶する前記対話文脈記憶部と、前記ユーザ主
導対話管理部あるいは前記システム主導対話管理部より
入力される情報検索要求に対して情報検索を行って検索
結果を出力する前記情報検索部と、前記ユーザ主導対話
管理部あるいは前記システム主導対話管理部より入力さ
れる応答内容と質問内容を利用者へ提示する応答提示部
と、前記応答提示部が応答を提示した時刻から、装置に
音声が入力される時刻までの入力間隔を計測して出力す
る入力間隔計測部と、前記入力間隔に基づいて、前記ユ
ーザ主導対話管理部と前記システム主導対話管理部の動
作切り替え指令を出力する対話主導権切り替え部と、を
備えることを特徴とする対話型情報検索装置およびこれ
に基づく対話型情報検索方法としたので、入力間隔に基
づいて、ユーザ主導対話管理部とシステム主導対話管理
部の動作切り替え指令を出力するするため、利用者が円
滑に入力を行えない状況が生じた場合、それ以降装置が
対話の主導権を取り、利用者が常に一定時間待たされる
ことなく対話が円滑に継続され、さらに装置が勝手に利
用者の代行を行わずとも利用者が必要な情報を検索でき
ることが可能となる。
【0113】また、前記入力間隔計測部は、前記応答提
示部が応答を提示し終えた時刻から、装置に音声が入力
される時刻までの入力間隔を計測して出力し、前記対話
主導権切り替え部は、前記入力間隔が閾値を越えた場合
に、システム主導対話管理部を動作させるように動作切
り替え指令を出力するようにしたので、入力間隔が閾値
を越えた場合に、システム主導対話管理部を動作させる
ように動作切り替え指令を出力するため、利用者が円滑
に入力を行えない状況が生じた場合、それ以降装置が対
話の主導権を取り、利用者が常に一定時間待たされるこ
となく対話が円滑に継続され、さらに装置が勝手に利用
者の代行を行わずとも利用者が必要な情報を検索できる
ことが可能となる。
【0114】また、前記対話主導権切り替え部は、前記
入力間隔が閾値を越えた場合に、一時的にシステム主導
対話管理部を動作するように動作切り替え指令を出力
し、かつ前記閾値を減少させることを特徴としたので、
装置が応答を提示し終えた時刻から、次に装置に音声が
入力されるまでの入力間隔を入力間隔計測部が計測して
出力し、入力間隔が閾値を越えた場合に、前記対話主導
権切り替え部が一時的にシステム主導対話管理部を動作
するように動作切り替え指令を出力し、さらに閾値を減
少させるため、基本的に利用者が主導権を持って対話を
進めるが、利用者が円滑に入力を行えない状況が生じた
場合、一時的に装置が対話の主導権を取って対話を円滑
に継続し、さらにそのような状況が繰り返し生じる場合
に、より迅速に装置が主導権を取って対話を円滑に継続
することが可能となる。
【0115】また、前記入力間隔を記憶する入力間隔記
憶部をさらに備え、前記対話主導権切り替え部は、前記
入力間隔記憶部を参照して、閾値を越える入力間隔が規
定回数以上生じた場合に、システム主導対話管理部を動
作させるように動作切り替え指令を出力する、ことを特
徴としたので、装置が応答を提示し終えた時刻から、次
に装置に音声が入力されるまでの入力間隔を入力間隔計
測部が計測して出力し、入力間隔計測部が計測した入力
間隔を入力間隔記憶部が記憶し、閾値を越える入力間隔
が規定回数以上生じた場合に、対話主導権切り替え部が
システム主導対話管理部を動作させるように動作切り替
え指令を出力するため、基本的に利用者が主導権を持っ
て対話を進めるが、利用者が円滑に入力を行えない状況
が規定回数以上生じた場合、装置が対話の主導権を取っ
て対話を円滑に継続することが可能となる。
【0116】また、前記入力間隔計測部は、前記応答提
示部が応答を提示し終える前に装置に音声が入力された
場合に、前記応答提示部が応答を提示し始めた時刻か
ら、装置に音声が入力される時刻までの割り込み入力間
隔を計測して出力し、前記対話主導権切り替え部は、前
記割り込み入力間隔が閾値より短い場合に、ユーザ主導
対話管理部を動作させるように動作切り替え信号を出力
する、ことを特徴としたので、応答提示部が応答を提示
し終える前に装置に音声が入力された場合に、入力間隔
計測部は応答提示部が応答を提示し始めた時刻から、装
置に音声が入力される時刻までの割り込み入力間隔を計
測して出力し、さらに応答提示部へ応答停止指令を出力
し、応答停止指令が入力された場合に応答提示部は出力
中の応答提示処理を停止し、割り込み入力間隔が閾値よ
り短い場合に、対話主導権切り替え部がユーザ主導対話
管理部を動作させるように動作切り替え信号を出力する
ため、装置に入力したい検索条件を利用者が明確に持っ
ている状況において、装置からの質問やガイダンスなど
を遮って利用者の要求を入力することができ、その後も
利用者が主導権を取って円滑に対話を継続することが可
能となる。
【0117】また、前記入力間隔記憶部は前記割り込み
入力間隔を記憶し、前記対話主導権切り替え部は、前記
入力間隔記憶部を参照して、閾値より短い割り込み入力
間隔が規定回数以上生じた場合に、ユーザ主導対話管理
部を動作させるように動作切り替え指令を出力する、こ
とを特徴としたので、応答提示部が応答を提示し終える
前に装置に音声が入力された場合に、入力間隔計測部は
応答提示部が応答を提示し始めた時刻から、装置に音声
が入力される時刻までの割り込み入力間隔を計測して出
力し、さらに応答提示部へ応答停止指令を出力し、入力
間隔計測部が計測した割り込み入力間隔を入力間隔記憶
部が記憶し、応答停止指令が入力された場合に応答提示
部は出力中の応答提示処理を停止し、閾値より短い割り
込み入力間隔が規定回数以上生じた場合に、対話主導権
切り替え部がユーザ主導対話管理部を動作させるように
動作切り替え信号を出力するため、装置に入力したい検
索条件を利用者が明確に持っている状況において、装置
からの質問やガイダンスなどを遮って利用者の要求を入
力することができ、その後も利用者が主導権を取って円
滑に対話を継続することが可能となる。
【0118】また、ユーザ主導対話管理部に動作を切り
替えるための発話内容が登録されたユーザ主導発話辞書
をさらに備え、前記対話主導権切り替え部は、前記割り
込み入力間隔が入力された場合、前記音声認識部から入
力される音声認識結果が、前記ユーザ主導発話辞書に登
録された発話内容と一致する場合に、ユーザ主導対話管
理部を動作させるように動作切り替え指令を出力する、
ことを特徴としたので、応答提示部が応答を提示し終え
る前に装置に音声が入力された場合に、入力間隔計測部
は応答提示部が応答を提示し始めた時刻から、装置に音
声が入力される時刻までの割り込み入力間隔を計測して
出力し、さらにユーザ主導発話辞書にユーザ主導対話管
理部に動作を切り替えるための発話を登録しておき、対
話主導権切り替え部は、割り込み入力間隔が入力された
場合、音声認識部から入力される音声認識結果が、ユー
ザ主導発話辞書に登録されたユーザ主導発話と一致する
場合に、一時的にユーザ主導対話管理部を動作させるよ
うに動作切り替え指令を出力するため、装置に入力した
い検索条件を利用者が明確に持っている状況において、
装置からの質問やガイダンスなどを明示的に遮って、利
用者が対話の主導権を取ることができ、円滑に対話を継
続することが可能となる。
【0119】また、前記入力間隔計測部は、前記応答提
示部が応答を提示し終える前に装置に音声が入力された
場合に、前記応答提示部に応答停止指令を出力し、前記
応答提示部は、応答停止指令が入力された場合に出力中
の応答提示処理を停止する、ことを特徴としたので、応
答提示部が応答を提示し終える前に装置に音声が入力さ
れた場合に、入力間隔計測部は応答提示部が応答を提示
し始めた時刻から、装置に音声が入力される時刻までの
割り込み入力間隔を計測して出力し、さらに応答提示部
へ応答停止指令を出力し、ユーザ主導発話辞書にユーザ
主導対話管理部に動作を切り替えるための発話を登録し
ておき、対話主導権切り替え部は、割り込み入力間隔が
入力された場合、音声認識部から入力される音声認識結
果が、ユーザ主導発話辞書に登録されたユーザ主導発話
と一致する場合に、一時的にユーザ主導対話管理部を動
作させるように動作切り替え指令を出力するため、装置
に入力したい検索条件を利用者が明確に持っている状況
において、装置からの質問やガイダンスなどを明示的に
遮って、利用者が対話の主導権を取ることができ、円滑
に対話を継続することが可能となる。
【0120】また、装置の動作に関して無意味な発話内
容が登録された無意味発話辞書と、前記無意味発話辞書
を参照して、前記音声認識部より入力される音声認識結
果が無意味発話か否かを検出する無意味発話検出部と、
をさらに備え、前記対話主導権切り替え部は、前記無意
味発話検出部が無意味発話を検出した場合に、システム
主導対話管理部を動作させるように動作切り替え指令を
出力する、ことを特徴としたので、装置の動作に関して
無意味な発話を無意味発話辞書に登録しておき、無意味
発話検出部が、無意味発話辞書を参照して音声認識結果
が無意味発話か否かを検出し、無意味発話が検出された
場合に、対話主導権切り替え部がシステム主導対話管理
部を動作させるように動作切り替え指令を出力するた
め、利用者が円滑に入力を行えなえず装置の動作に無意
味な入力をした場合に、装置が対話の主導権を取って円
滑に対話を継続することが可能となる。
【0121】また、前記無意発話の回数を記憶する無意
味発話回数記憶部をさらに備え、前記対話主導権切り替
え部は、前記無意味発話回数記憶部を参照し、無意味発
話回数が閾値を越えた場合に、システム主導対話管理部
を動作させるように動作切り替え指令を出力する、こと
を特徴としたので、装置の動作に関して無意味な発話を
無意味発話辞書に登録しておき、無意味発話検出部が、
無意味発話辞書を参照して音声認識結果が無意味発話か
否かを検出し、無意味発話回数記憶部が無意発話の回数
を記憶し、無意味発話の回数が閾値を越えた場合に、対
話主導権切り替え部がシステム主導対話管理部を動作さ
せるように動作切り替え指令を出力するため、利用者が
円滑に入力を行えなえず装置の動作に無意味な入力を繰
り返した場合に、装置が対話の主導権を取って円滑に対
話を継続することが可能となる。
【0122】また、前記対話文脈記憶部を参照して、前
記音声認識部より入力される音声認識結果が、直前に装
置が提示した応答内容あるいは質問内容の復唱か否かを
判定する復唱発話検出部をさらに備え、前記対話主導権
切り替え部は、前記復唱発話検出部が復唱発話を検出し
た場合に、一時的にユーザ主導対話管理部を動作させる
ように動作切り替え指令を出力する、ことを特徴とした
ので、復唱発話検出部が、対話文脈記憶部を参照して、
音声認識結果が装置の提示した発話内容の復唱か否かを
判定し、復唱発話検出部が復唱発話を検出した場合に、
対話主導権切り替え部が一時的にユーザ主導対話管理部
を動作させるように動作切り替え指令を出力するため、
利用者が装置の応答に対して思考している状況におい
て、一時的に利用者に対話の主導権を渡して入力を待つ
ことで、円滑に対話を継続することが可能となる。
【0123】また、前記システム主導対話管理部の生成
する質問内容に対して予測される利用者の発話内容を規
定した予測発話知識記憶部と、前記対話文脈記憶部と前
記予測発話知識記憶部を参照して、装置が利用者に質問
を提示した場合に、前記音声認識部より入力される音声
認識結果が装置の質問内容に対する予測発話であるか否
かを判定する予測発話判定部と、をさらに備え、前記対
話主導権切り替え部は、前記音声認識結果が前記予測発
話判定部において予測発話と判定されなかった場合に、
ユーザ主導対話管理部を動作させるように動作切り替え
指令を出力する、ことを特徴としたので、システム主導
対話管理部の生成する質問内容に対して予測される利用
者の発話内容を規定した予測発話知識と対話文脈を参照
して、予測発話判定部が、音声認識結果が装置の質問内
容に対する予測発話であるか否かを判定し、音声認識結
果が予測発話と判定されなかった場合に、対話主導権切
り替え部がユーザ主導対話管理部を動作させるように動
作切り替え指令を出力するため、装置から質問された検
索条件以外の条件を利用者が明確に持っている状況にお
いて、利用者が主導権を取って円滑に対話を継続するこ
とが可能となる。
【0124】また、前記予測発話判定部で前記音声認識
結果が予測発話ではないと判定された回数を記憶する予
測外発話回数記憶部をさらに備え、前記対話主導権切り
替え部は、前記予測外発話回数記憶部が記憶している回
数が閾値を越えた場合に、ユーザ主導対話管理部を動作
させるように動作切り替え指令を出力する、ことを特徴
としたので、予測外発話回数記憶部が音声認識結果が予
測発話ではないと判定された回数を記憶し、予測外発話
回数が閾値を越えた場合に、対話主導権切り替え部がユ
ーザ主導対話管理部を動作させるように動作切り替え指
令を出力するため、装置から質問された検索条件以外の
条件を利用者が明確に持っており、装置からの質問が利
用者が入力したい条件と異なることが繰り返され、対話
が円滑に進まない状況において、利用者が主導権を取っ
て円滑に対話を継続することが可能となる。
【図面の簡単な説明】
【図1】 この発明の実施の形態1による対話型情報検
索装置の構成図である。
【図2】 この発明の実施の形態1による対話型情報検
索装置と利用者の対話例を示す図である。
【図3】 この発明の実施の形態1による対話型情報検
索装置の動作を説明するための図である。
【図4】 この発明の実施の形態1による対話型情報検
索装置の動作を説明するための図である。
【図5】 この発明の実施の形態1による対話型情報検
索装置の動作を説明するための図である。
【図6】 この発明の実施の形態1による対話型情報検
索装置の動作を説明するための図である。
【図7】 この発明の実施の形態1による対話型情報検
索装置の動作を説明するための図である。
【図8】 この発明の実施の形態1による対話型情報検
索装置の動作を説明するための図である。
【図9】 この発明の実施の形態1による対話型情報検
索装置の動作を説明するための図である。
【図10】 この発明の実施の形態1による対話型情報
検索装置の動作を説明するための図である。
【図11】 この発明の実施の形態1による対話型情報
検索装置の動作を説明するための図である。
【図12】 この発明の実施の形態1による対話型情報
検索装置の動作を説明するための図である。
【図13】 この発明の実施の形態1による対話型情報
検索装置の動作を説明するための図である。
【図14】 この発明の実施の形態2による対話型情報
検索装置と利用者の対話例を示す図である。
【図15】 この発明の実施の形態2による対話型情報
検索装置の動作を説明するための図である。
【図16】 この発明の実施の形態2による対話型情報
検索装置の動作を説明するための図である。
【図17】 この発明の実施の形態3による対話型情報
検索装置の構成図である。
【図18】 この発明の実施の形態3による対話型情報
検索装置と利用者の対話例を示す図である。
【図19】 この発明の実施の形態3による対話型情報
検索装置の動作を説明するための図である。
【図20】 この発明の実施の形態3による対話型情報
検索装置の動作を説明するための図である。
【図21】 この発明の実施の形態3による対話型情報
検索装置の動作を説明するための図である。
【図22】 この発明の実施の形態4による対話型情報
検索装置の構成図である。
【図23】 この発明の実施の形態4による対話型情報
検索装置と利用者の対話例を示す図である。
【図24】 この発明の実施の形態5による対話型情報
検索装置の構成図である。
【図25】 この発明の実施の形態5による対話型情報
検索装置と利用者の対話例を示す図である。
【図26】 この発明の実施の形態5による対話型情報
検索装置の動作を説明するための図である。
【図27】 この発明の実施の形態6による対話型情報
検索装置の構成図である。
【図28】 この発明の実施の形態6による対話型情報
検索装置と利用者の対話例を示す図である。
【図29】 この発明の実施の形態6による対話型情報
検索装置の動作を説明するための図である。
【図30】 この発明の実施の形態7による対話型情報
検索装置の構成図である。
【図31】 この発明の実施の形態7による対話型情報
検索装置と利用者の対話例を示す図である。
【図32】 この発明の実施の形態7による対話型情報
検索装置の動作を説明するための図である。
【図33】 この発明の実施の形態8による対話型情報
検索装置の構成図である。
【図34】 この発明の実施の形態8による対話型情報
検索装置と利用者の対話例を示す図である。
【図35】 この発明の実施の形態9による対話型情報
検索装置の構成図である。
【図36】 この発明の実施の形態9による対話型情報
検索装置と利用者の対話例を示す図である。
【図37】 この発明の実施の形態9による対話型情報
検索装置の動作を説明するための図である。
【図38】 この発明の実施の形態10による対話型情
報検索装置の構成図である。
【図39】 この発明の実施の形態10による対話型情
報検索装置と利用者の対話例を示す図である。
【図40】 この発明の実施の形態10による対話型情
報検索装置の動作を説明するための図である。
【図41】 この発明の実施の形態10による対話型情
報検索装置の動作を説明するための図である。
【図42】 この発明の実施の形態10による対話型情
報検索装置の動作を説明するための図である。
【図43】 この発明の実施の形態11による対話型情
報検索装置の構成図である。
【図44】 この発明の実施の形態11による対話型情
報検索装置と利用者の対話例を示す図である。
【図45】 この発明の実施の形態11による対話型情
報検索装置の動作を説明するための図である。
【図46】 従来のこの種の装置である自然言語対話シ
ステムの構成図である。
【符号の説明】
1 音声認識部、2 ユーザ主導対話管理部、3 シス
テム主導対話管理部、4 質問内容生成知識記憶部、5
対話文脈記憶部、6 情報検索部、7 入力間隔計測
部、8 応答提示部、9 対話主導権切り替え部、10
入力間隔記憶部、11 ユーザ主導発話辞書、12
無意味発話検出部、13 無意味発話辞書、14 無意
味発話回数記憶部、15 復唱発話検出部、16 予測
発話知識記憶部、17 予測発話判定部、18 予測外
発話回数記憶部。

Claims (26)

    【特許請求の範囲】
  1. 【請求項1】 装置に入力された利用者の音声を認識し
    て認識結果を出力する音声認識部と、 前記音声認識部より入力される音声認識結果から情報検
    索要求を生成して出力し、後述する情報検索部より入力
    される検索結果から利用者への応答内容を生成して出力
    するユーザ主導対話管理部と、 前記音声認識部より入力される音声認識結果から情報検
    索要求を生成して出力し、後述する情報検索部より入力
    される検索結果から利用者への応答内容を生成して出力
    し、後述する質問内容生成知識記憶部と後述する対話文
    脈記憶部を参照して利用者への質問内容を生成して出力
    するシステム主導対話管理部と、 前記システム主導対話管理部において利用者への質問内
    容を生成するための質問内容生成知識を記憶する前記質
    問内容生成知識記憶部と、 前記音声認識結果と前記検索結果と前記応答内容と前記
    質問内容とを記憶する前記対話文脈記憶部と、 前記ユーザ主導対話管理部あるいは前記システム主導対
    話管理部より入力される情報検索要求に対して情報検索
    を行って検索結果を出力する前記情報検索部と、 前記ユーザ主導対話管理部あるいは前記システム主導対
    話管理部より入力される応答内容と質問内容を利用者へ
    提示する応答提示部と、 前記応答提示部が応答を提示した時刻から、装置に音声
    が入力される時刻までの入力間隔を計測して出力する入
    力間隔計測部と、 前記入力間隔に基づいて、前記ユーザ主導対話管理部と
    前記システム主導対話管理部の動作切り替え指令を出力
    する対話主導権切り替え部と、 を備えることを特徴とする対話型情報検索装置。
  2. 【請求項2】 前記入力間隔計測部は、前記応答提示部
    が応答を提示し終えた時刻から、装置に音声が入力され
    る時刻までの入力間隔を計測して出力し、 前記対話主導権切り替え部は、前記入力間隔が閾値を越
    えた場合に、システム主導対話管理部を動作させるよう
    に動作切り替え指令を出力する、 ことを特徴とする請求項1に記載の対話型情報検索装
    置。
  3. 【請求項3】 前記対話主導権切り替え部は、前記入力
    間隔が閾値を越えた場合に、一時的にシステム主導対話
    管理部を動作するように動作切り替え指令を出力し、か
    つ前記閾値を減少させることを特徴とする請求項2に記
    載の対話型情報検索装置。
  4. 【請求項4】 前記入力間隔を記憶する入力間隔記憶部
    をさらに備え、 前記対話主導権切り替え部は、前記入力間隔記憶部を参
    照して、閾値を越える入力間隔が規定回数以上生じた場
    合に、システム主導対話管理部を動作させるように動作
    切り替え指令を出力する、 ことを特徴とする請求項2記載の対話型情報検索装置。
  5. 【請求項5】 前記入力間隔計測部は、前記応答提示部
    が応答を提示し終える前に装置に音声が入力された場合
    に、前記応答提示部が応答を提示し始めた時刻から、装
    置に音声が入力される時刻までの割り込み入力間隔を計
    測して出力し、 前記対話主導権切り替え部は、前記割り込み入力間隔が
    閾値より短い場合に、ユーザ主導対話管理部を動作させ
    るように動作切り替え信号を出力する、 ことを特徴とする請求項1ないし4のいずれかに記載の
    対話型情報検索装置。
  6. 【請求項6】 前記入力間隔記憶部は前記割り込み入力
    間隔を記憶し、 前記対話主導権切り替え部は、前記入力間隔記憶部を参
    照して、閾値より短い割り込み入力間隔が規定回数以上
    生じた場合に、ユーザ主導対話管理部を動作させるよう
    に動作切り替え指令を出力する、 ことを特徴とする請求項5に記載の対話型情報検索装
    置。
  7. 【請求項7】 ユーザ主導対話管理部に動作を切り替え
    るための発話内容が登録されたユーザ主導発話辞書をさ
    らに備え、 前記対話主導権切り替え部は、前記割り込み入力間隔が
    入力された場合、前記音声認識部から入力される音声認
    識結果が、前記ユーザ主導発話辞書に登録された発話内
    容と一致する場合に、ユーザ主導対話管理部を動作させ
    るように動作切り替え指令を出力する、 ことを特徴とする請求項5に記載の対話型情報検索装
    置。
  8. 【請求項8】 前記入力間隔計測部は、前記応答提示部
    が応答を提示し終える前に装置に音声が入力された場合
    に、前記応答提示部に応答停止指令を出力し、 前記応答提示部は、応答停止指令が入力された場合に出
    力中の応答提示処理を停止する、 ことを特徴とする請求項5ないし7のいずれかに記載の
    対話型情報検索装置。
  9. 【請求項9】 装置の動作に関して無意味な発話内容が
    登録された無意味発話辞書と、前記無意味発話辞書を参
    照して、前記音声認識部より入力される音声認識結果が
    無意味発話か否かを検出する無意味発話検出部と、をさ
    らに備え、 前記対話主導権切り替え部は、前記無意味発話検出部が
    無意味発話を検出した場合に、システム主導対話管理部
    を動作させるように動作切り替え指令を出力する、 ことを特徴とする請求項1ないし8のいずれかに記載の
    対話型情報検索装置。
  10. 【請求項10】 前記無意発話の回数を記憶する無意味
    発話回数記憶部をさらに備え、 前記対話主導権切り替え部は、前記無意味発話回数記憶
    部を参照し、無意味発話回数が閾値を越えた場合に、シ
    ステム主導対話管理部を動作させるように動作切り替え
    指令を出力する、 ことを特徴とする請求項9に記載の対話型情報検索装
    置。
  11. 【請求項11】 前記対話文脈記憶部を参照して、前記
    音声認識部より入力される音声認識結果が、直前に装置
    が提示した応答内容あるいは質問内容の復唱か否かを判
    定する復唱発話検出部をさらに備え、 前記対話主導権切り替え部は、前記復唱発話検出部が復
    唱発話を検出した場合に、一時的にユーザ主導対話管理
    部を動作させるように動作切り替え指令を出力する、 ことを特徴とする請求項1ないし10のいずれかに記載
    の対話型情報検索装置。
  12. 【請求項12】 前記システム主導対話管理部の生成す
    る質問内容に対して予測される利用者の発話内容を規定
    した予測発話知識記憶部と、前記対話文脈記憶部と前記
    予測発話知識記憶部を参照して、装置が利用者に質問を
    提示した場合に、前記音声認識部より入力される音声認
    識結果が装置の質問内容に対する予測発話であるか否か
    を判定する予測発話判定部と、をさらに備え、 前記対話主導権切り替え部は、前記音声認識結果が前記
    予測発話判定部において予測発話と判定されなかった場
    合に、ユーザ主導対話管理部を動作させるように動作切
    り替え指令を出力する、 ことを特徴とする請求項1ないし11のいずれかに記載
    の対話型情報検索装置。
  13. 【請求項13】 前記予測発話判定部で前記音声認識結
    果が予測発話ではないと判定された回数を記憶する予測
    外発話回数記憶部をさらに備え、 前記対話主導権切り替え部は、前記予測外発話回数記憶
    部が記憶している回数が閾値を越えた場合に、ユーザ主
    導対話管理部を動作させるように動作切り替え指令を出
    力する、 ことを特徴とする請求項12に記載の対話型情報検索装
    置。
  14. 【請求項14】 装置に入力された利用者の音声を認識
    して認識結果を出力する音声認識工程と、 前記音声認識工程より入力される音声認識結果から情報
    検索要求を生成して出力し、後述する情報検索工程より
    入力される検索結果から利用者への応答内容を生成して
    出力するユーザ主導対話管理工程と、 前記音声認識工程より入力される音声認識結果から情報
    検索要求を生成して出力し、後述する情報検索工程より
    入力される検索結果から利用者への応答内容を生成して
    出力し、後述する質問内容生成知識記憶工程と後述する
    対話文脈記憶工程を参照して利用者への質問内容を生成
    して出力するシステム主導対話管理工程と、 前記システム主導対話管理工程において利用者への質問
    内容を生成するための質問内容生成知識を記憶する前記
    質問内容生成知識記憶工程と、 前記音声認識結果と前記検索結果と前記応答内容と前記
    質問内容とを記憶する前記対話文脈記憶工程と、 前記ユーザ主導対話管理工程あるいは前記システム主導
    対話管理工程より入力される情報検索要求に対して情報
    検索を行って検索結果を出力する前記情報検索工程と、 前記ユーザ主導対話管理工程あるいは前記システム主導
    対話管理工程より入力される応答内容と質問内容を利用
    者へ提示する応答提示工程と、 前記応答提示工程が応答を提示した時刻から、装置に音
    声が入力される時刻までの入力間隔を計測して出力する
    入力間隔計測工程と、 前記入力間隔に基づいて、前記ユーザ主導対話管理工程
    と前記システム主導対話管理工程の動作切り替え指令を
    出力する対話主導権切り替え工程と、 を備えることを特徴とする対話型情報検索方法。
  15. 【請求項15】 前記入力間隔計測工程は、前記応答提
    示工程が応答を提示し終えた時刻から、装置に音声が入
    力される時刻までの入力間隔を計測して出力し、 前記対話主導権切り替え工程は、前記入力間隔が閾値を
    越えた場合に、システム主導対話管理工程を動作させる
    ように動作切り替え指令を出力する、 ことを特徴とする請求項14に記載の対話型情報検索方
    法。
  16. 【請求項16】 前記対話主導権切り替え工程は、前記
    入力間隔が閾値を越えた場合に、一時的にシステム主導
    対話管理工程を動作するように動作切り替え指令を出力
    し、かつ前記閾値を減少させることを特徴とする請求項
    15に記載の対話型情報検索方法。
  17. 【請求項17】 前記入力間隔を記憶する入力間隔記憶
    工程をさらに備え、 前記対話主導権切り替え工程は、前記入力間隔記憶工程
    を参照して、閾値を越える入力間隔が規定回数以上生じ
    た場合に、システム主導対話管理工程を動作させるよう
    に動作切り替え指令を出力する、 ことを特徴とする請求項15に記載の対話型情報検索方
    法。
  18. 【請求項18】 前記入力間隔計測工程は、前記応答提
    示工程が応答を提示し終える前に装置に音声が入力され
    た場合に、前記応答提示工程が応答を提示し始めた時刻
    から、装置に音声が入力される時刻までの割り込み入力
    間隔を計測して出力し、 前記対話主導権切り替え工程は、前記割り込み入力間隔
    が閾値より短い場合に、ユーザ主導対話管理工程を動作
    させるように動作切り替え信号を出力する、 ことを特徴とする請求項14ないし17のいずれかに記
    載の対話型情報検索方法。
  19. 【請求項19】 前記入力間隔記憶工程は前記割り込み
    入力間隔を記憶し、 前記対話主導権切り替え工程は、前記入力間隔記憶工程
    を参照して、閾値より短い割り込み入力間隔が規定回数
    以上生じた場合に、ユーザ主導対話管理工程を動作させ
    るように動作切り替え指令を出力する、 ことを特徴とする請求項18に記載の対話型情報検索方
    法。
  20. 【請求項20】 ユーザ主導対話管理工程に動作を切り
    替えるための発話内容が登録されたユーザ主導発話辞書
    をさらに備え、 前記対話主導権切り替え工程は、前記割り込み入力間隔
    が入力された場合、前記音声認識工程から入力される音
    声認識結果が、前記ユーザ主導発話辞書に登録された発
    話内容と一致する場合に、ユーザ主導対話管理工程を動
    作させるように動作切り替え指令を出力する、 ことを特徴とする請求項18に記載の対話型情報検索方
    法。
  21. 【請求項21】 前記入力間隔計測工程は、前記応答提
    示工程が応答を提示し終える前に装置に音声が入力され
    た場合に、前記応答提示工程に応答停止指令を出力し、 前記応答提示工程は、応答停止指令が入力された場合に
    出力中の応答提示処理を停止する、 ことを特徴とする請求項18ないし20のいずれかに記
    載の対話型情報検索方法。
  22. 【請求項22】 装置の動作に関して無意味な発話内容
    が登録された無意味発話辞書と、前記無意味発話辞書を
    参照して、前記音声認識工程より入力される音声認識結
    果が無意味発話か否かを検出する無意味発話検出工程
    と、をさらに備え、 前記対話主導権切り替え工程は、前記無意味発話検出工
    程が無意味発話を検出した場合に、システム主導対話管
    理工程を動作させるように動作切り替え指令を出力す
    る、 ことを特徴とする請求項14ないし21のいずれかに記
    載の対話型情報検索方法。
  23. 【請求項23】 前記無意発話の回数を記憶する無意味
    発話回数記憶工程をさらに備え、 前記対話主導権切り替え工程は、前記無意味発話回数記
    憶工程を参照し、無意味発話回数が閾値を越えた場合
    に、システム主導対話管理工程を動作させるように動作
    切り替え指令を出力する、 ことを特徴とする請求項22に記載の対話型情報検索方
    法。
  24. 【請求項24】 前記対話文脈記憶工程を参照して、前
    記音声認識工程より入力される音声認識結果が、直前に
    装置が提示した応答内容あるいは質問内容の復唱か否か
    を判定する復唱発話検出工程をさらに備え、 前記対話主導権切り替え工程は、前記復唱発話検出工程
    が復唱発話を検出した場合に、一時的にユーザ主導対話
    管理工程を動作させるように動作切り替え指令を出力す
    る、 ことを特徴とする請求項14ないし23のいずれかに記
    載の対話型情報検索方法。
  25. 【請求項25】 前記システム主導対話管理工程の生成
    する質問内容に対して予測される利用者の発話内容を規
    定した予測発話知識記憶工程と、前記対話文脈記憶工程
    と前記予測発話知識記憶工程を参照して、装置が利用者
    に質問を提示した場合に、前記音声認識工程より入力さ
    れる音声認識結果が装置の質問内容に対する予測発話で
    あるか否かを判定する予測発話判定工程と、をさらに備
    え、 前記対話主導権切り替え工程は、前記音声認識結果が前
    記予測発話判定工程において予測発話と判定されなかっ
    た場合に、ユーザ主導対話管理工程を動作させるように
    動作切り替え指令を出力する、 ことを特徴とする請求項14ないし24のいずれかに記
    載の対話型情報検索方法。
  26. 【請求項26】 前記予測発話判定工程で前記音声認識
    結果が予測発話ではないと判定された回数を記憶する予
    測外発話回数記憶工程をさらに備え、 前記対話主導権切り替え工程は、前記予測外発話回数記
    憶工程が記憶している回数が閾値を越えた場合に、ユー
    ザ主導対話管理工程を動作させるように動作切り替え指
    令を出力する、 ことを特徴とする請求項25に記載の対話型情報検索方
    法。
JP2001297575A 2001-09-27 2001-09-27 対話型情報検索装置 Expired - Fee Related JP4162074B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001297575A JP4162074B2 (ja) 2001-09-27 2001-09-27 対話型情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001297575A JP4162074B2 (ja) 2001-09-27 2001-09-27 対話型情報検索装置

Publications (2)

Publication Number Publication Date
JP2003108581A true JP2003108581A (ja) 2003-04-11
JP4162074B2 JP4162074B2 (ja) 2008-10-08

Family

ID=19118622

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001297575A Expired - Fee Related JP4162074B2 (ja) 2001-09-27 2001-09-27 対話型情報検索装置

Country Status (1)

Country Link
JP (1) JP4162074B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009198614A (ja) * 2008-02-19 2009-09-03 Toyota Central R&D Labs Inc 対話装置及びプログラム
JP2010151941A (ja) * 2008-12-24 2010-07-08 Toyota Central R&D Labs Inc 音声応答装置、及びプログラム
JP2010237286A (ja) * 2009-03-30 2010-10-21 Denso Corp 音声認識システム
US8571874B2 (en) 2009-09-25 2013-10-29 Kabushiki Kaisha Toshiba Speech interactive apparatus and computer program product using output prompts and user responses
KR20170061923A (ko) * 2015-11-27 2017-06-07 삼성전자주식회사 질의 응답 처리 방법 및 이를 지원하는 전자 장치
EP3327592A1 (en) 2016-11-25 2018-05-30 Panasonic Intellectual Property Management Co., Ltd. Information processing method, information processing apparatus, and non-transitory recording medium
CN108694941A (zh) * 2017-04-07 2018-10-23 联想(新加坡)私人有限公司 用于交互式会话的方法、信息处理装置及产品
JP2020091655A (ja) * 2018-12-05 2020-06-11 富士通株式会社 対話制御プログラム、対話制御システム、及び対話制御方法
JP2021096293A (ja) * 2019-12-13 2021-06-24 Necプラットフォームズ株式会社 案内システム、案内システムの制御方法、およびプログラム
CN113362815A (zh) * 2021-06-24 2021-09-07 达闼机器人有限公司 语音交互方法、***、电子设备及存储介质
CN113643684A (zh) * 2021-07-21 2021-11-12 广东电力信息科技有限公司 语音合成方法、装置、电子设备及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102436018B1 (ko) 2018-01-23 2022-08-24 삼성전자주식회사 전자 장치 및 그 제어 방법

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009198614A (ja) * 2008-02-19 2009-09-03 Toyota Central R&D Labs Inc 対話装置及びプログラム
JP2010151941A (ja) * 2008-12-24 2010-07-08 Toyota Central R&D Labs Inc 音声応答装置、及びプログラム
JP2010237286A (ja) * 2009-03-30 2010-10-21 Denso Corp 音声認識システム
US8571874B2 (en) 2009-09-25 2013-10-29 Kabushiki Kaisha Toshiba Speech interactive apparatus and computer program product using output prompts and user responses
KR20170061923A (ko) * 2015-11-27 2017-06-07 삼성전자주식회사 질의 응답 처리 방법 및 이를 지원하는 전자 장치
KR102558437B1 (ko) * 2015-11-27 2023-07-24 삼성전자주식회사 질의 응답 처리 방법 및 이를 지원하는 전자 장치
US11093537B2 (en) 2016-11-25 2021-08-17 Panasonic Intellectual Property Management Co., Ltd. Information processing method, information processing apparatus, and non-transitory recording medium
EP3327592A1 (en) 2016-11-25 2018-05-30 Panasonic Intellectual Property Management Co., Ltd. Information processing method, information processing apparatus, and non-transitory recording medium
CN108109616A (zh) * 2016-11-25 2018-06-01 松下知识产权经营株式会社 信息处理方法、信息处理装置以及程序
CN108694941A (zh) * 2017-04-07 2018-10-23 联想(新加坡)私人有限公司 用于交互式会话的方法、信息处理装置及产品
JP2020091655A (ja) * 2018-12-05 2020-06-11 富士通株式会社 対話制御プログラム、対話制御システム、及び対話制御方法
JP7211050B2 (ja) 2018-12-05 2023-01-24 富士通株式会社 対話制御プログラム、対話制御システム、及び対話制御方法
JP7132206B2 (ja) 2019-12-13 2022-09-06 Necプラットフォームズ株式会社 案内システム、案内システムの制御方法、およびプログラム
JP2021096293A (ja) * 2019-12-13 2021-06-24 Necプラットフォームズ株式会社 案内システム、案内システムの制御方法、およびプログラム
CN113362815A (zh) * 2021-06-24 2021-09-07 达闼机器人有限公司 语音交互方法、***、电子设备及存储介质
CN113643684A (zh) * 2021-07-21 2021-11-12 广东电力信息科技有限公司 语音合成方法、装置、电子设备及存储介质
CN113643684B (zh) * 2021-07-21 2024-02-27 广东电力信息科技有限公司 语音合成方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
JP4162074B2 (ja) 2008-10-08

Similar Documents

Publication Publication Date Title
US11739641B1 (en) Method for processing the output of a speech recognizer
JP3662780B2 (ja) 自然言語を用いた対話システム
US9466293B1 (en) Speech interface system and method for control and interaction with applications on a computing system
US6308157B1 (en) Method and apparatus for providing an event-based “What-Can-I-Say?” window
US6748361B1 (en) Personal speech assistant supporting a dialog manager
US7827035B2 (en) Speech recognition system and method
EP1521239B1 (en) Multi-modal input form with dictionary and grammar
JP3212618B2 (ja) 対話処理装置
US7024363B1 (en) Methods and apparatus for contingent transfer and execution of spoken language interfaces
US20020123894A1 (en) Processing speech recognition errors in an embedded speech recognition system
US6591236B2 (en) Method and system for determining available and alternative speech commands
US6745165B2 (en) Method and apparatus for recognizing from here to here voice command structures in a finite grammar speech recognition system
JP2003108581A (ja) 対話型情報検索装置および対話型情報検索方法
JP5263875B2 (ja) 発話入力の音声認識のためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム
WO2018034169A1 (ja) 対話制御装置および方法
US10978074B1 (en) Method for processing the output of a speech recognizer
JPH08166866A (ja) 対話型インターフェースを具備した編集支援システム
US7433823B1 (en) Speech input disambiguation computing system
JP2006208486A (ja) 音声入力装置
JP2015052743A (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
US20020094512A1 (en) Computer controlled speech word recognition display dictionary providing user selection to clarify indefinite detection of speech words
JP7465124B2 (ja) 音声処理システム、音声処理方法、及び音声処理プログラム
JP2000020092A (ja) ディクテーション装置及びディクテーションプログラムを記録した記録媒体
US11450325B1 (en) Natural language processing
JP4223841B2 (ja) 音声対話システム及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080415

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080606

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080715

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080716

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110801

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4162074

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110801

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120801

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120801

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130801

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees