WO2016104193A1

WO2016104193A1 - 対応決定装置、音声対話システム、対応決定装置の制御方法、および音声対話装置

Info

Publication number: WO2016104193A1
Application number: PCT/JP2015/084825
Authority: WO
Inventors: 彰則横濱; 誠悟伊藤; 田中　宏明
Original assignee: シャープ株式会社
Priority date: 2014-12-26
Filing date: 2015-12-11
Publication date: 2016-06-30
Also published as: JPWO2016104193A1

Abstract

　多様な表現の発話に対し、発話者の意図に応じた対応を速やかに特定する。音声対話装置（１）は、利用者の発話を解析して生成された該利用者の意図を示す意図検索子を生成する意図検索子生成部（２５）と、意図検索子と対応記述子とが対応付けられた対応記述子検索テーブル（４２）を参照して、意図検索子生成部（２５）により生成された意図検索子に対応する対応記述子を特定する対応記述子検索部（２９）とを備えている。

Description

対応決定装置、音声対話システム、対応決定装置の制御方法、および音声対話装置

　本発明は、利用者と音声で対話する音声対話装置に関し、より詳細には、利用者の発話に応じて音声対話装置の対応を決定する対応決定装置等に関する。

　昨今の音声認識技術の進歩に伴い、スマートフォンなど情報機器端末だけでなく、様々な電子機器に音声対話システムが用いられている。例えば、ＥＬＩＺＡ型対話システムでは、予め定められた単語や言い回しなどをキーワードとし、該キーワードとそれに対する応答内容とを対応付けて記録しておくことにより、そのキーワードを含む発話に対して応答することを可能にしている。また、例えば下記の特許文献１および２には、会話の状況に応じた応答を行う対話装置が記載されている。

日本国公開特許公報「特開２０１１‐６５５８２号（２０１１年３月３１日公開）」日本国公開特許公報「特開２００１‐３５７０５３号（２００１年１２月２６日公開）」

　ここで、利用者との円滑なインタラクションを実現するためには、利用者の意図を正しく理解すること、および利用者の意図に基づいた対応を、人間同士のコミュニケーションの一般的な速度と同等程度（数百ｍｓ以内）に実行することが求められる。

　しかしながら、ＥＬＩＺＡ型対話システムでは、基本的に利用者の意図を考慮することなく応答内容を決定しているため、利用者の意図に応じた対応とならないことが多いという問題がある。また、ＥＬＩＺＡ型対話システムでは、予め登録されたキーワード以外には応答できないため、多様な表現の発話に対して応答するためには、多数のキーワードを記録させておく必要があり、これにより応答速度が遅延するという問題もある。

　一方、特許文献１および２の技術では、利用者の意図に応じた対応が可能となるが、対応を決定するための処理が煩雑であり、高い処理能力を有するＣＰＵ（Central Processing Unit）を用いなければ、快適なタイミングでの対話を実現することが難しい。

　本発明は、上記の問題点に鑑みてなされたものであって、その目的は、多様な表現の発話に対し、発話者の意図に応じた対応を速やかに特定することのできる対応決定装置等を提供することにある。

　上記の課題を解決するために、本発明の一態様に係る対応決定装置は、利用者と音声対話を行う音声対話装置が該利用者の発話に応じて行う対応を決定する対応決定装置であって、上記発話を解析して生成された上記利用者の意図を示す意図検索子を取得する意図検索子取得部と、上記意図検索子と上記音声対話装置の対応を示す対応記述子とが対応付けられた対応記述子検索情報を参照して、上記意図検索子取得部により取得された意図検索子に対応する対応記述子を特定する対応記述子検索部と、を備えている。

　また、本発明の一態様に係る音声対話システムは、上記の課題を解決するために、音声対話装置にて利用者と音声対話を行う音声対話システムであって、上記利用者の意図を示す意図検索子と、上記音声対話装置の対応を示す対応記述子とが対応付けられた対応記述子検索情報を参照して、上記利用者の発話を解析して生成された意図検索子に対応する対応記述子を特定する対応決定装置を含み、上記音声対話装置は、上記利用者の上記発話に対し、上記対応決定装置が特定した上記対応記述子の示す対応を実行する。

　そして、本発明の一態様に係る対応決定装置の制御方法は、上記の課題を解決するために、利用者と音声対話を行う音声対話装置が該利用者の発話に応じて行う対応を決定する対応決定装置の制御方法であって、上記発話を解析して生成された上記利用者の意図を示す意図検索子を取得する意図検索子取得ステップと、上記意図検索子と上記音声対話装置の対応を示す対応記述子とが対応付けられた対応記述子検索情報を参照して、上記意図検索子取得ステップにて取得された意図検索子に対応する対応記述子を特定する対応記述子検索ステップと、を含む。

　また、本発明の一態様に係る音声対話装置は、上記の課題を解決するために、利用者と音声対話を行う音声対話装置であって、上記利用者の意図を示す意図検索子と、上記音声対話装置の対応を示す対応記述子とが対応付けられた対応記述子検索情報を参照して特定された、上記利用者の発話を解析して生成された意図検索子に対応する対応記述子を、外部機器から取得する対応記述子取得部と、上記対応記述子取得部が取得した上記対応記述子が示す対応を実行する対応制御部と、を備えている。

　本発明の上記各態様によれば、多様な表現の発話に対し、発話者の意図に応じた対応を速やかに特定することができる。

本発明の一実施形態に係る音声対話装置の要部構成の一例を示すブロック図である。本発明の一実施形態に係る音声対話システムを概略的に示す図である。上記音声対話装置が備える切替部の処理の一例を示す表である。上記音声対話装置が備える情報取得部の要部構成の一例を示すブロック図である。上記音声対話装置が備える意図テーブルの一例を示す図である。上記音声対話装置が備える対応記述子検索テーブルの一例を示す図である。上記音声対話装置が備える隣接ペアテーブルの一例を示す図である。上記音声対話装置による意図検索子の生成処理の流れを示すシーケンス図である。意図検索子に応じた処理を実行する処理の一例を示すフローチャートである。対応記述子取得処理の一例を示すフローチャートである。意図対話と隣接ペア対話の切り替え処理の一例を示す図である。対応記述子の示す対応の実行制御処理の一例を示すフローチャートである。利用者を玄関で検出という事象の発生を検出して意図検索子を生成する処理の一例を示すフローチャートである。実施形態３に係る音声対話システムを概略的に示す図である。

　〔実施形態１〕
　本発明の実施形態について、図１～図１２に基づいて説明すれば以下のとおりである。

　（音声対話装置の概要）　図１は、本発明の一実施形態に係る音声対話装置１の要部構成の一例を示すブロック図である。音声対話装置１は、利用者と音声対話を行う装置であり、また、該利用者の発話に応じて行う対応を決定する対応決定装置でもある。図示のように、音声対話装置１は、集音部１０、通信部１１、撮像部１２、バッテリー１３、制御部１４、記憶部１５、音波出力部１６、および駆動部１７を備えている。

　集音部１０は、利用者が発する声を集音し、集音した声を電子的な波のデータ（音声データ）に変換し、この音声データを制御部１４の音声認識部２０に送る。また、通信部１１は、音声対話装置１が外部の装置と通信するためのものである。そして、撮像部１２は、音声対話装置１の外部を撮像する撮像装置であり、撮像した画像データは情報取得部２１に送られる。また、バッテリー１３は、音声対話装置１に電力を供給する蓄電池である。音声対話装置１は、バッテリーから供給される電力により動作可能となっている。

　制御部１４は、音声対話装置１の各部を統括して制御するものであり、制御部１４の詳細は後述する。また、記憶部１５は、音声対話装置１にて使用される各種データを記憶する記憶装置である。具体的には、記憶部１５には、隣接ペアテーブル（リンク情報）４０、意図テーブル４１、および対応記述子検索テーブル（対応記述子検索情報）４２が格納されている。各テーブルの詳細については、図５～７にて後述する。

　音波出力部１６は、音波を出力する出力装置であり、例えばスピーカであってもよい。また、駆動部１７は、音声対話装置１を駆動する駆動装置であり、例えばステッピングモータを含んでいてもよい。

　（制御部１４の要部構成）　次に、制御部１４の詳細について説明する。図１に示すように、制御部１４は、音声認識部２０、情報取得部（事象検出部）２１、切替部２２、隣接ペア対話部、意図対話部、対応制御部（タイミング制御部）３０、対応文出力制御部３１、音声合成部３２、および対応行動制御部３３を備えている。

　音声認識部２０は、集音部１０から送られた音声データをテキストデータに変換し、変換したテキストデータを切替部２２に送る。音声認識部２０としては、例えばＡＳＲ（Auto Speech Recognition）装置を適用することもできる。

　情報取得部２１は、通信部１１、撮像部１２、およびバッテリー１３から各種情報を取得して、取得した情報から所定の事象が発生したことを検出し、該事象の発生を切替部２２に通知する。なお、情報取得部２１の詳細については、実施形態２で説明する。

　切替部２２は、音声対話装置１により行われる利用者との対話を、隣接ペア対話部を用いた対話（以下、隣接ペア対話と呼ぶ）と、意図対話部を用いた対話（以下、意図対話と呼ぶ）とで切り替える。切替部２２による処理の詳細については図３にて後述する。

　対応制御部３０は、隣接ペア対話部、意図対話部、および切替部２２からの通知に応じて、音声対話装置１の対応を制御する。例えば、意図対話部から通知される情報が、発話内容を示す対応文である場合、対応制御部３０は、対応文を対応文出力制御部３１に通知する。また、意図対話部から通知される情報が、利用者に対する行動を示す対応行動である場合、対応制御部３０は、対応行動を対応行動制御部３３に通知する。そして、対応制御部３０は、連続して発話がなされた場合に、先の発話に対する対応を停止または中止する処理を行う。さらに、対応制御部３０は、音声対話装置１の対応の実行タイミングを制御するタイミング制御部としても機能する。

　対応文出力制御部３１は、対応制御部３０から通知される対応文を音声合成部３２に送信して音声データに変換させ、これにより得られた音声データを音波出力部１６に出力させる。なお、対応文の音声データを取得できる場合には、対応文出力制御部３１は、その音声データを図示しない再生部で再生して、音波出力部１６から出力してもよい。また、音声データは、音声対話装置１の記憶部１５に格納しておいてもよいし、外部機器から取得してもよい。

　音声合成部３２は、上記の通り、入力された対応文（テキストデータ）を音声データ（例えばＰＣＭ：Pulse Code Modulationデータ）に変換する。音声合成部３２としては、例えばＴＴＳ（Text To Speech）装置を適用することもできる。

　対応行動制御部３３は、対応制御部３０の命令に従い、駆動部１７を駆動して音声対話装置１に対応行動を実行させる。なお、対応行動の内容によっては、音声対話装置１に対応行動を実行させるために、駆動部１７以外を制御してもよい。例えば、対応行動に音声出力が含まれている場合、対応文出力制御部３１を制御して音声出力させてもよいし、対応文出力制御部３１を介さずに音声合成部３２または音波出力部１６を制御して音声出力させてもよい。

　（意図対話部）　意図対話部は、利用者の意図に応じた対応を決定するものであり、図１に示すように、意図検索子生成部（意図検索子取得部）２５、形態素解析部２６、係り受け解析部２７、対応記述子解析部２８、および対応記述子検索部（対応記述子取得部）２９を備えている。

　意図検索子生成部２５は、音声認識部２０が生成した文字列（テキストデータ）を、切替部２２を介して受信し、そのテキストデータから利用者の意図を示す意図検索子を生成する。具体的には、意図検索子生成部２５は、受信したテキストデータを形態素解析部２６に出力して形態素解析させ、その結果である形態素解析情報を取得する。続いて、意図検索子生成部２５は、この形態素解析情報を係り受け解析部２７に出力して、係り受けを解析させ、その結果である分節情報と係り受け情報を取得する。そして、意図検索子生成部２５は、意図テーブル４１と分節情報から利用者の意図を特定すると共に、係り受け情報から意図の対象となる語句を特定し、これらの意図および対象を示す情報を含む意図検索子を生成する。また、意図検索子生成部２５は、外部機器から意図検索子を取得する機能も備えている。

　形態素解析部２６は、意図検索子生成部２５から入力されたテキストデータを形態素に分解し、品詞を振る。そして、形態素解析部２６は、分解した形態素およびその品詞を示す形態素情報を意図検索子生成部２５に出力する。

　係り受け解析部２７は、意図検索子生成部２５から入力された形態素情報の示す形態素がどのような分節（述部と文末表現の組み合わせ）を構成しているかを解析し、また各分節間の係り受けを解析する。そして、係り受け解析部２７は、上記解析の結果として、分節を示す分節情報と、係り受けの関係になっている分節を示す係り受け情報を意図検索子生成部２５に出力する。なお、意図検索子生成部２５、形態素解析部２６および係り受け解析部２７に係る一連の処理例については、図８にて後述する。

　対応記述子検索部２９は、対応記述子検索テーブル４２を参照して、意図検索子生成部２５から入力された意図検索子に対応付けられた対応記述子を検索し、特定する。なお、対応記述子とは、音声対話装置１が実行する対応を示す情報である。対応記述子解析部２８は、対応記述子検索部２９から通知された対応記述子を解析し、該対応記述子の解析結果を対応制御部３０に出力する。なお、対応記述子解析部２８および対応記述子検索部２９の詳細な処理については、図９にて後述する。

　（隣接ペア対話部）　隣接ペア対話部は、隣接ペアテーブル４０を参照した利用者との対話である隣接ペア対話における利用者への対応を決定するものであり、話題管理部（リンク応答部）２３、および話題取得部（リンク応答部）２４を備えている。

　話題管理部２３は、隣接ペア対話における音声対話装置１の応答内容を決定する。具体的には、話題管理部２３は、切替部２２からの通知に応じた対応文を話題取得部２４から取得して切替部２２に返す。これにより、当該対応文が音声対話装置１から音声出力される。

　話題取得部２４は、話題管理部２３からの要求に応じた対応文を隣接ペアテーブル４０から取得して話題管理部２３に返す。なお、隣接ペア対話の詳細については、図７および図１１にて後述する。

　（音声対話システム１００の概略）　音声対話装置１は、単体でも利用者との対話が可能であるが、各種サーバと通信することによって、その機能を拡張することができる。ここでは、音声対話装置１と各種サーバを含む音声対話システム１００について、図２に基づいて説明する。

　図２は、音声対話システム１００を概略的に示す図である。音声対話システム１００には、音声対話装置１、音声認識装置２、意図検索子生成装置３、対応記述子検索装置（外部機器、対応決定装置）４、話題取得装置５、音声データ提供装置６、対応行動情報提供装置７、および情報提供装置８が含まれる。

　音声認識装置２は、音声対話装置１が備えている音声認識部２０と同様に、音声データをテキストデータに変換する機能を有していると共に、外部の装置（ここでは音声対話装置１）と通信する機能を備えている。このため、音声対話装置１の音声認識部２０は、音声認識に失敗した場合、その音声データを、通信部１１を介して音声認識装置２に送信して音声認識させ、その結果であるテキストデータを受信することができる。

　意図検索子生成装置３は、音声対話装置１が備えている意図検索子生成部２５と同様に、テキストデータから意図検索子を生成する機能を有していると共に、外部の装置（ここでは音声対話装置１）と通信する機能を備えている。このため、音声対話装置１の意図検索子生成部２５は、意図検索子が生成できないテキストデータがあった場合、そのテキストデータを、通信部１１を介して意図検索子生成装置３に送信し、その意図検索子を生成させ、生成された意図検索子を受信することができる。

　対応記述子検索装置４は、音声対話装置１が備えている対応記述子検索部２９と同様に、意図検索子に対応付けられた対応記述子を特定する機能を有していると共に、外部の装置（ここでは音声対話装置１）と通信する機能を備えている。このため、音声対話装置１の対応記述子検索部２９は、対応記述子が検出できない意図検索子があった場合、その意図検索子を、通信部１１を介して対応記述子検索装置４に送信し、これに対応する対応記述子を検出させ、検出された対応記述子を受信することができる。

　話題取得装置５は、音声対話装置１が備えている話題取得部２４と同様に、隣接ペア対話の対応文を取得する機能を有していると共に、外部の装置（ここでは音声対話装置１）と通信する機能を備えている。このため、音声対話装置１の話題取得部２４は、話題管理部２３から要求された対応文を検出できなかった場合、その要求を、通信部１１を介して話題取得装置５に送信し、その要求に応じた対応文を検出させ、検出された対応文を受信することができる。

　音声データ提供装置６は、音声対話装置１が備えている音声合成部３２と同様に、テキストデータを音声データに変換する機能を有していると共に、外部の装置（ここでは音声対話装置１）と通信する機能を備えている。このため、音声対話装置１の対応文出力制御部３１は、音声合成部３２に音声データを生成させる代わりに、通信部１１を介して音声データ提供装置６にテキストデータを送信して音声データに変換させ、これを受信して音波出力部１６に出力させることができる。この場合、音声対話装置１は、音声合成部３２の代わりに、受信した音声データ（例えばＷＡＶ形式のデータ）を再生する再生部を備えていればよい。

　対応行動情報提供装置７は、音声対話装置１の対応行動制御部３３の要求に従って、音声対話装置１に情報を送信する。例えば、対応行動制御部３３が実行する対応行動が、日食の画像を取得するというものであれば、対応行動制御部３３は、対応行動情報提供装置７に日食の画像の送信を要求する。そして、対応行動情報提供装置７は、この要求に従って、インターネット等のネットワーク上で日食の画像を検索し、取得して、対応行動制御部３３に送信し、対応行動制御部３３はこれを利用者宛に送信する。

　情報提供装置８は、音声対話装置１の情報取得部２１と通信して、例えばインターネット等のネットワークに関する所定の情報（ネットワーク情報）を情報取得部２１に送信する。詳細は実施形態２で説明するが、情報提供装置８は、例えば所定のウェブページを取得し、その内容が前回取得したときから更新されていた場合に、その旨を情報取得部２１に通知する。

　（切替部の詳細）　次に、切替部２２の詳細を図３に基づいて説明する。図３は、切替部２２の処理の一例を示す表である。図示のように、切替部２２は、切替部２２に情報を入力した入力元と、その入力の直前の状況（一回前の状況）とに応じた処理を行う。

　具体的には、音声認識部２０から文字列（音声認識結果のテキストデータ）が入力された場合、直前に音声対話が行われていなければ、入力されたテキストデータを意図対話部に出力する。一方、直前に隣接ペア対話が行われていれば、テキストデータの出力先は話題管理部２３とする。

　また、入力元が情報取得部２１である場合、切替部２２は、直前の状況および入力の内容にかかわらず、情報取得部２１からの入力を意図検索子生成部２５に出力する。

　そして、入力元が話題管理部２３である場合、直前の状況は考慮しないが、入力の内容に応じた処理を行う。具体的には、切替部２２は、話題管理部２３から隣接ペア対話を終了する旨の入力（ＥＮＤ）あった場合には、他の処理部への出力は行わない。例えば、利用者との対話が途切れたときに、話題管理部２３からＥＮＤが入力される。なお、同図には示していないが、この場合、切替部２２は意図対話への切り替えを行う。

　一方、話題管理部２３から、隣接ペア対話にない文字がある旨の入力があった場合、入力されたテキストデータ（隣接ペア対話にない文字を含むテキストデータ）を意図対話部の意図検索子生成部２５に出力する。例えば、挨拶（おはよう等）の対話の後に、「昨日の野球の試合結果を教えて」のような、フレームの異なる（隣接ペア対話の枠を超えた）発話がなされたときに、このような処理がなされる。なお、同図には示していないが、この場合にも、切替部２２は意図対話への切り替えを行う。

　また、話題管理部２３から「隣接ペア対話を開始できない」ことを示すエラー情報を受信した場合に、直前に隣接ペア対話にて発話がなされていれば、切替部２２は、その発話と同一の発話を実行するように隣接ペア対話部の話題管理部２３に指示する。なお、話題管理部２３は、隣接ペア対話にて発話させた後の利用者の返答が、隣接ペアテーブル４０に含まれる想定応答と部分一致した場合に、上記のエラー情報を切替部２２に送信する。

　これにより、例えば、隣接ペア対話にて音声対話装置１が「今日はほんとうに暑いですね」と発話した後の利用者の発話が「そんなこと・・・」であった場合に、再度「元気ですか？」と発話させることができる。なお、上記「・・・」の部分は、音声認識されなかった、あるいは集音部１０で取得されなかった部分である。

　次に、対応制御部３０から隣接ペアを使うことを指示する入力があった場合、切替部２２は、直前の状況にかかわらず、隣接ペア対話部の話題管理部２３に対し、隣接ペア対話を実行させる命令を出力する。例えば、生成された意図検索子に対応付けられた対応記述子に隣接ペアＩＤが含まれている場合にこのような処理が行われる。

　なお、対応制御部３０は、意図対話を行う場合（対応記述子解析部２８から隣接ペアＩＤを含まない対応記述子を受信した場合）にも、切替部２２に通知を行い、切替部２２は意図対話が行われたことを記憶してもよい。この場合、切替部２２は、次に音声認識部２０からテキストデータを受信したときに、そのテキストデータを意図対話部の意図検索子生成部２５に出力する。

　（意図テーブル）　続いて、利用者の発話内容を示すテキストデータから、該利用者の意図を特定するための意図テーブル４１の詳細を図５に基づいて説明する。図５は、意図テーブル４１の一例を示す図である。

　図示のように、意図テーブル４１は、動詞、形容詞、連体詞、または名詞（動詞と形容詞については活用形も含む）と、その語尾（助動詞については活用形も含む）との組み合わせに対し、意図を示す情報が対応付けられた情報である。よって、意図テーブル４１を参照することにより、述部と文末表現の組み合わせから、意図を特定することができる。なお、意図テーブル４１では、語尾の一般的な意味（文法的な意味）を意図としてもよい。例えば、「動詞＋語尾」の組み合わせが「食べ（動詞連用形）＋たい（助動詞基本形：たい）」であれば、図５に示す意図テーブル４１から、意図は「希望」と特定される。

　（対応記述子検索テーブル）　続いて、意図検索子に対応する対応記述子を特定するための対応記述子検索テーブル４２の詳細を図６に基づいて説明する。図６は、対応記述子検索テーブル４２の一例を示す図である。図示のように、対応記述子検索テーブル４２は、意図検索子と対応記述子とが対応付けられた情報である。そして、意図検索子には、表層、意図、および対象という３つの要素が含まれており、対応記述子には、対応文、対応行動、および隣接ペアＩＤという３つの要素が含まれている。

　同図の＃１に示すように、意図検索子が「表層：食べる、意図：希望」には、対応文「ｓｐｅａｋ：もうちょっと我慢して」を要素とする対応記述子が対応付けられている。このため、利用者の発話から生成される意図検索子が、「表層：食べる、意図：希望」である場合、音声対話装置１は、対応文「もうちょっと我慢して」を発話する。

　なお、同図の♯３の例のように、対応文としてＵＲＬ（Uniform Resource Locator）等のアクセス先を示す情報を記述してもよい。この場合、この情報が示すアクセス先にアクセスすることにより、音声対話装置１に所定の内容の発話を行わせることができる。なお、アクセス先に格納する情報は、図示の例のように音声データのファイルであってもよいし、発話内容を示すテキストデータ等の情報であってもよいが、よりデータ容量の大きい音声データをネットワーク上から取得することが好ましい。これにより、音声対話装置１の記憶容量が比較的少ない場合でも、多様な音声データによる利用者への応答が可能になる。

　また、同図の♯２の意図検索子は、表層と意図に加えて「対象」の要素を含んでいる。この「対象」としては、当該意図検索子の意図に関連する語句が記録されており、そして、このような意図検索子には、その「対象」に応じた対応記述子が対応付けられている。これにより、「対象」に特化した対応が実現される。

　例えば、利用者が「何か食べたいな」と発話した場合、「表層：食べる、意図：希望」の意図検索子が生成されるので、図６の対応記述子検索テーブル４２を参照することにより、「もうちょっと我慢して」という対象を限定しない発話がなされる。これに対し、利用者が「カレーが食べたい」と発話した場合、「表層：食べる、意図：希望、対象：カレー」の意図検索子が生成される。これにより、図６の対応記述子検索テーブル４２を参照することにより、「カレーでもナンでも食べればいいじゃない」という、対象をカレーに特化した発話がなされる。

　なお、「対象」を考慮しなくとも、利用者の意図に沿った対応は可能である。このため、生成された意図検索子に「対象」が含まれている場合であっても、対応記述子検索テーブル４２にその「対象」は含まれないが、「表層」と「意図」は一致する意図検索子があれば、その意図検索子に対応付けられた対応記述子を取得してもよい。

　また、図６の＃４の対応記述子には、対応文に加えて、対応行動が要素として含まれている。このような対応記述子が実行対象となった場合には、音声対話装置１は対応文の発話を行うと共に、対応行動を実行する。

　対応行動は、所定の行動が実行されるような記述となっていればよく、その記述態様は特に限定されないが、例えば対応行動の識別子であるラベル名と、行動の内容と、行動の手順とを含む記述としてもよい。図示の例では、ラベル名が挨拶の対応行動について、まず、ステッピングモータを３０度回転させ、次に、その状態で１０秒待機し、最後にステッピングモータを３０度逆回転させるという行動が規定されている。

　なお、この対応行動は、音声対話装置１の外観が人型であり、駆動部１７が音声対話装置１の腰部に設けられたステッピングモータである場合を想定したものである。つまり、上記の対応行動を実行した場合、直立状態の音声対話装置１が、ステッピングモータの３０度回転により、その上半身が前傾した状態となり、その後、ステッピングモータの３０度逆回転により直立状態に戻ることになる。これが、利用者には、音声対話装置１がお辞儀をしているように見える。

　このような対応記述子を参照することにより、意図検索子が「表層：帰宅、意図：現在、対象：利用者」である場合に、音声対話装置１に「ご主人様おかえりなさい」を発話させると共に、対応行動（挨拶）を実行させることができる。

　同様に、＃１０の対応記述子にも対応行動（ラベル名：画像取得）が含まれている。「画像取得」は、対応行動に発話が含まれている点と、途中経過に応じて行動が分岐する点で上記「挨拶」と相違している。

　具体的には、「画像取得」では、まず意図検索子の「対象」（＃１０の例では「日食」）をキーワードとして画像検索を行う。なお、画像検索は、対応行動制御部３３が実行してもよいし、外部機器（例えば図２の対応行動情報提供装置７）に実行させてもよい。

　そして、所定時間（図示の例では２０００ｍｓ）以内に画像を取得できる場合には、音声対話装置１に「画像が取得出来ました」と発話させると共に、取得された画像を電子メールで利用者に送信する。なお、送信先のアドレスは予め登録しておけばよい。さらに、この後、ステッピングモータを３０度回転させ、１０秒待機し、ステッピングモータを３０度逆回転させ、これにより「画像取得」は終了する。

　一方、所定時間（図示の例では２０００ｍｓ）以内に画像を取得できない場合には、音声対話装置１に「画像が取得出来ませんでした」と発話させた後、ステッピングモータを３０度回転させ、１０秒待機し、ステッピングモータを３０度逆回転させ、これにより「画像取得」は終了する。

　また、図６の＃９の対応記述子には、隣接ペアＩＤが要素として含まれている。このように、実行する対応記述子に隣接ペアＩＤが含まれる場合、その隣接ペアＩＤが示す対話文が発話され、隣接ペア対話が行われる。なお、隣接ペアＩＤおよび隣接ペア対話の詳細は後述する。

　（隣接ペアテーブル）　続いて、隣接ペアテーブル４０と隣接ペア対話について図７に基づいて説明する。図７は、隣接ペアテーブル４０の一例を示す図である。図示の隣接ペアテーブル４０は、音声対話装置１の発話内容と、該発話に対する利用者の応答として想定される想定応答と、該想定応答に対する音声対話装置１の発話内容（具体的には隣接ペアＩＤ）とが対応付けられたテーブルである。また、音声対話装置１の発話内容には、それぞれ固有の隣接ペアＩＤが付されている。

　隣接ペアＩＤを含む対応記述子が実行される場合、隣接ペアテーブル４０を参照して、その隣接ペアＩＤの発話内容が特定される。例えば、図６の＃９の対応記述子には、隣接ペアＩＤ＝１が含まれているので、図７の隣接ペアテーブル４０を参照した場合、「今日はほんとうに暑いですね」と発話することが決定される。

　また、上述のように、隣接ペアテーブル４０では、１つの発話内容に対して想定応答が対応付けられており、各想定応答に対して隣接ペアＩＤが対応付けられている。よって、隣接ペアテーブル４０に基づく発話が行われた後、利用者が想定応答を行った場合には、隣接ペアテーブル４０を参照することによって、速やかに次の発話内容を特定することができる。

　例えば、音声対話装置１に「今日はほんとうに暑いですね」と発話させた後、利用者が「そんなことないぞ」と発話した場合、隣接ＩＤ２の発話内容、すなわち「でも２５度超えてますよ」が特定される。このように、隣接ペアテーブル４０を参照することにより、利用者の発話が想定応答の範囲内であれば、その発話に対して速やかに応答することができる。

　なお、１つの発話内容に対応付ける想定応答の数は特に限定されず、１つであってもよいし、３つ以上であってもよい。また、各想定応答に表現のバリエーションが含まれていてもよい。例えば、「そんなことないぞ」に加えて、「そうでもない」や「暑くない」等、「今日はほんとうに暑いですね」の発話に対する否定的な発話内容を想定応答に含めておいてもよい。

　（意図検索子の生成処理）　図８は、図１に示す音声対話装置１による意図検索子の生成処理の流れを示すシーケンス図である。図８に示すように、音声認識部２０は、入力された音声データをテキストデータに変換し、切替部２２に出力する。

　切替部２２は、音声認識部２０からテキストデータが入力されると、その直前に対話を行ったか否かを確認する。ここで、直前に対話が行われていない場合、切替部２２は、意図検索子生成部２５に音声認識部２０から入力されたテキストデータを出力する。なお、同図には示していないが、直前に隣接ペア対話が行われている場合には、切替部２２は、そのことを記憶しており、この記憶に基づいて、テキストデータを隣接ペア対話部に出力する（図３に示す表の「入力元」が音声認識部であるカラムを参照）。

　次に、意図検索子生成部２５は、切替部２２から入力されたテキストデータの文字列を形態素解析部２６に出力する。ここで、入力されたテキストデータが複数の文で構成されている場合には、意図検索子生成部２５は、最後の文の文字列を形態素解析部２６に出力する。例えば、切替部２２からのテキストデータが「いやぁ、さっき起きたばかりだよ。今日、ご飯が食べたい」である場合、「だよ。」と「今日」の間が文の切れ目であると判定して、「今日、ご飯が食べたい」を出力する。

　そして、形態素解析部２６は、意図検索子生成部２５から入力された文字列を形態素に分解し、品詞を振る。例えば、入力された文字列が「今日、ご飯が食べたい」であれば、「今日（名詞）／、（記号）／ご飯（名詞）／が（助詞）／食べ（動詞）／たい（助動詞）」のように分解して品詞を振る。そして、形態素解析部２６は、分解した形態素およびその品詞を示す形態素情報を意図検索子生成部２５に出力し、意図検索子生成部２５はこの形態素情報を係り受け解析部２７に出力する。

　次に、係り受け解析部２７は、意図検索子生成部２５から入力された形態素情報の示す形態素を分節に分ける。そして、係り受け解析部２７は、文末部分の分節の述部と文末表現との組み合わせを示す分節情報を意図検索子生成部２５に出力する。例えば、上記の例では述部「食べ（動詞）」と文末表現「たい（助動詞）」との組み合わせを示す分節情報が生成される。

　また、「対象」の特定を含む意図検索子（図６の♯２参照）を生成する場合、係り受け解析部２７は、分節間の係り受けを示す係り受け情報を生成する。例えば、上記の例では、「ご飯が」と「食べたい」の組み合わせを示す係り受け情報が生成される。そして、意図検索子生成部２５は、係り受け解析部２７から入力された分節情報（述部と文末表現の組み合わせ）と係り受け情報を取得する。

　次に、意図検索子生成部２５は、意図テーブル４１を参照して、取得した述部および文末表現に対応付けられた意図を特定する。例えば、「食べ（動詞）」と「たい（助動詞）」との組み合わせであれば、図５の意図テーブル４１から、意図は「希望」と特定される。

　続いて、意図検索子生成部２５は、述部を基本形（終止形）にした表層、および意図を含む意図検索子を生成する（意図検索子取得ステップ）。例えば、上記の例では、表層が「食べる」、意図が「希望」の意図検索子が生成される。そして、意図検索子生成部２５は、生成した意図検索子を、対応記述子検索部２９に出力する。なお、係り受け情報も取得している場合には、該係り受け情報を参照して、意図の特定に用いた分節に係る分節（またはそれに含まれる名詞）を「対象」として特定して、これを意図検索子に含めてもよい。

　以上のようにして、利用者の発話内容を示すテキストデータから利用者の意図を示す意図検索子が生成される。例えば、利用者の発話が「カレーは辛かった」である場合、そのテキストデータが｛カレー（名詞）／は（助詞）／辛かっ（形容詞の連用形）／た（助動詞の基本形）｝のように形態素に分解されて品詞が振られる。そして、図５に示す意図テーブル４１から、形容詞の連用形と助動詞基本形（終止形）「た」の組み合わせは「事実、過去」と特定されるから、この場合に生成される意図検索子は、〔辛い｜事実、過去〕となる。なお、対象を含めて〔辛い｜事実、過去∥カレー〕としてもよい。

　また、例えば、利用者の発話が「年収は同じだ」である場合、｛年収（名詞）／は（助詞）／同じ（連体詞）／だ（助動詞）｝のように形態素に分解されて品詞が振られる。そして、図５に示す意図テーブル４１から意図を特定して、〔同じ｜事実〕の意図検索子が生成される。この場合も、対象を含めて〔同じ｜事実∥年収〕としてもよい。

　さらに、例えば、利用者の発話が「それはオッケーだね」である場合、｛それ（代名詞）／は（助詞）／オッケー（名詞）／だ（助動詞）／ね（助詞）｝のように形態素に分解されて品詞が振られる。そして、図５に示す意図テーブル４１から意図を特定して、〔オッケー｜事実、確認〕の意図検索子が生成される。この場合も、対象を含めて〔オッケー｜事実、確認∥それ〕としてもよい。

　また、例えば、利用者の発話が「街は静かだ」である場合、｛街（名詞）／は（助詞）／静か（形容動詞）／だ（助動詞）｝のように形態素に分解されて品詞が振られる。そして、図５に示す意図テーブル４１から意図を特定して、〔静か｜事実〕の意図検索子が生成される。この場合も、対象を含めて〔静か｜事実∥街〕としてもよい。

　（ローカルで対応記述子を取得）　図９は、意図検索子に応じた処理を実行する処理の一例を示すフローチャートである。対応記述子検索部２９は、記憶部１５に保存されている対応記述子検索テーブル４２（図６）を参照して、意図検索子生成部２５から入力された意図検索子に対応付けられた対応記述子を検索する（Ｓ１、対応記述子検索ステップ）。

　ここで、意図検索子生成部２５から入力された意図検索子に対応付けられた対応記述子を検出した場合（Ｓ２にてＹＥＳ）、対応記述子検索部２９は、検出した対応記述子を対応記述子解析部２８に通知する。一方、対応記述子が検出されなかった（Ｓ２にてＮＯ）場合、外部機器（具体的には図２の対応記述子検索装置４）から対応記述子を取得する処理を実行する（Ｓ３）。Ｓ３の詳細については、図１０を参照して後述する。

　次に、対応記述子解析部２８は、対応記述子検索部２９から通知された対応記述子に「対応文」が含まれているか否かを判定する（Ｓ４）。ここで、「対応文」が含まれていないと判定した場合（Ｓ４にてＮＯ）、Ｓ６の処理に移行する。一方、「対応文」が含まれていると判定した場合（Ｓ４にてＹＥＳ）、対応記述子解析部２８は、当該対応文を対応制御部３０に通知する。続いて、対応制御部３０は、通知された対応文を対応文出力制御部３１に通知して、これを出力するように命令する。そして、対応文出力制御部３１は、この命令に従って上記対応文を音声合成部３２で音声データに変換し、音波出力部１６からこの音声データを出力させる（Ｓ５）。

　Ｓ６では、対応記述子解析部２８は、対応記述子に「対応行動」が含まれているか否かを判定する。ここで、「対応行動」が含まれていないと判定した場合（Ｓ６にてＮＯ）、Ｓ８の処理に移行する。一方、「対応行動」が含まれていると判定した場合（Ｓ６にてＹＥＳ）、対応記述子解析部２８は、当該対応行動を対応制御部３０に通知する。続いて、対応制御部３０は、通知された対応行動を対応行動制御部３３に通知して、これを実行するように命令する。そして、対応行動制御部３３は、この命令に従って駆動部１７を制御し、上記対応行動を音声対話装置１に実行させる（Ｓ７）。

　Ｓ８では、対応記述子解析部２８は、対応記述子に「隣接ペアＩＤ」が含まれているか否かを判定する。ここで、「隣接ペアＩＤ」が含まれていないと判定した場合（Ｓ８にてＮＯ）、対応記述子解析部２８は処理を終了する。一方、「隣接ペアＩＤ」が含まれていると判定した場合（Ｓ８にてＹＥＳ）、対応記述子解析部２８は、当該隣接ペアＩＤを対応制御部３０に通知する。続いて、対応制御部３０は、通知された隣接ペアＩＤを切替部２２に通知して、これを使用するように命令する。そして、切替部２２は、この命令に従って話題管理部２３に上記隣接ペアＩＤを通知し、これを登録させる（Ｓ９）。これにより、隣接ペア対話が開始される。なお、隣接ペア対話の詳細については、図１１にて後述する。

　なお、上記の例では、対応記述子が検出されなかった場合（Ｓ２でＮＯ）に、対応記述子取得処理（Ｓ３）を行い、対応記述子検索装置４から対応記述子を取得しているが、Ｓ１の検索処理と並行して、対応記述子取得処理（Ｓ３）を行ってもよい。この場合、対応記述子検索部２９は、意図検索子生成部２５から意図検索子が入力されると、通信部１１を介して該意図検索子を対応記述子検索装置４に送信すると共に、記憶部１５に保存されている対応記述子検索テーブル４２を参照して対応記述子を検索する。そして、対応記述子検索部２９は、対応記述子検索装置４から対応記述子を受信した場合にはそれを用い、受信しなかった場合には対応記述子検索テーブル４２から検出した対応記述子を用いてもよい。

　これにより、対応記述子検索テーブル４２には登録されていない対応記述子を速やかに取得することができる。なお、対応記述子検索装置４からの対応記述子の受信待ち受け時間が長くなりすぎると、利用者への応答が遅延するので、所定時間（例えば８００ｍｓ）以内に受信しなければ、対応記述子検索テーブル４２から検出した対応記述子を用いるようにしてもよい。

　例えば、対応記述子検索テーブル４２には、〔述部｜意図〕が〔食べる｜希望〕の意図検索子は登録されているが、〔述部｜意図∥対象〕が〔食べる｜希望∥カレー〕の意図検索子は登録されていない場合を考える。この場合に、利用者が「カレー食べたい」と発話すると、所定時間以内に対応記述子検索装置４から対応記述子が帰って来れば、これを用いた対応（例えば「カレーでもナンでも食べればいいじゃない」の発話）がなされる。一方、所定時間以内に対応記述子検索装置４から対応記述子が帰って来なければ、対応記述子検索テーブル４２に基づく対応（例えば「もうちょっと我慢して」の発話）がなされる。

　（ローカルに対応記述子がない場合、サーバで対応記述子を取得）　図９のＳ３で行われる対応記述子取得処理について図１０に基づいて説明する。図１０は、対応記述子取得処理の一例を示すフローチャートである。記憶部１５に保存されている対応記述子検索テーブル４２から、対応記述子を検出することができなかった対応記述子検索部２９は、は、通信部１１を介して、対応記述子検索装置４（図２参照）にアクセスする（Ｓ２０）。具体的には、対応記述子検索部２９は、意図検索子を対応記述子検索装置４に送信して、該意図検索子に対応する対応記述子の有無を通知するように要求する。

　そして、対応記述子検索部２９は、対応記述子検索装置４からの応答を待ち受ける（Ｓ２１）。ここで、対応記述子検索装置４から対応記述子がない旨の応答を受信した、あるいは対応記述子検索装置４からの応答がない状態で所定時間が経過した場合、対応記述子検索部２９は、対応記述子検索装置４にも対応記述子がないと判定する（Ｓ２１にてＮＯ）。この場合、対応記述子検索部２９は、対応を中止して（Ｓ２２）、対応記述子取得処理を終了する。一方、対応記述子検索装置４から対応記述子がある旨の応答を受信した場合（Ｓ２１にてＹＥＳ）、対応記述子検索部２９は、対応記述子検索装置４に対し、隣接ペアの有無を通知するように要求してその応答を待ち受ける（Ｓ２３）。

　ここで、対応記述子検索装置４から隣接ペアはない旨の応答を受信した、あるいは応答がない状態で所定時間が経過した場合、対応記述子検索部２９は、対応記述子検索装置４から対応記述子を取得して（Ｓ２４）、対応記述子取得処理を終了する。一方、対応記述子検索装置４から隣接ペアがある旨の応答を受信した場合（Ｓ２３でＹＥＳ）、対応記述子検索部２９は、対応記述子検索装置４から隣接ペアを取得する（Ｓ２５）。

　なお、ここで取得する隣接ペアとは、対応記述子検索装置４に送信した意図検索子の示す意図に応じた内容で隣接ペア対話を行うために必要な情報であり、少なくとも隣接ペア対話の対応文を１つ含んでいればよい。ただし、１つの対応文のみでは、利用者の次の発話に対する対応文を決定する際に、再度、対応記述子検索装置４にアクセスする必要が生じる。このため、対応文、想定応答、および想定応答に対する対応文を少なくともセットで含む情報を隣接ペアとして送信することが好ましく、音声対話装置１の記憶容量に余裕があれば、図７に示すような隣接ペアテーブルの全体を隣接ペアとして送信してもよい。

　そして、対応記述子検索部２９は、取得した隣接ペアを、対応記述子解析部２８、対応制御部３０、切替部２２、および話題管理部２３を介して話題取得部２４に送信し、記憶部１５に保存させ（Ｓ２６）、これにより対応記述子取得処理を終了する。

　（意図対話と隣接ペア対話の切り替え）　次に、意図対話と隣接ペア対話の切り替えについて図１１に基づいて説明する。図１１は、意図対話と隣接ペア対話の切り替え処理の一例を示す図である。切替部２２は、対応制御部３０から隣接ペアＩＤの通知を受けると、該隣接ペアＩＤを話題管理部２３に通知して登録させる（図９のＳ９）と共に、隣接ペア対話に切り替える（Ｓ４０）。

　そして、話題管理部２３は、登録した隣接ペアＩＤを話題取得部２４に通知し、話題取得部２４は、隣接ペアテーブル４０を参照して、通知された隣接ペアＩＤに対応する発話内容を特定する（Ｓ４１）。例えば、隣接ペアＩＤ＝１が通知された場合、図７の隣接ペアテーブル４０を参照すれば、＃１の「今日はほんとうに暑いですね」が、発話内容として特定される。

　なお、話題取得部２４は、当該隣接ペアＩＤを含む隣接ペアテーブル４０をＲＡＭ（Random Access Memory）等の一時保存部に保存しておいてもよい。これにより、話題管理部２３は、該隣接ペアテーブル４０を用いた隣接ペア対話が継続している間は、話題取得部２４を介することなく、一時保存部を参照して迅速に応答内容を決定することができる。

　続いて、話題取得部２４は、特定した発話内容を話題管理部２３に通知し、話題管理部２３はこれを対応制御部３０に通知する。そして、対応制御部３０は、通知された発話内容を対応文出力制御部３１に通知して、これを出力するように命令する（Ｓ４２）。これにより、対応文出力制御部３１および音声合成部３２により、音波出力部１６から上記発話内容の音声データが出力される。

　また、隣接ペア対話に切り替えた切替部２２は、利用者の応答、具体的には利用者の応答発話を音声認識して得たテキストデータを音声認識部２０から受信するのを待ち受ける（Ｓ４３）。そして、隣接ペア対話に切り替えた状態で、利用者の応答があった（音声認識部２０からテキストデータを受信した）と判定した場合（Ｓ４３にてＹＥＳ）、切替部２２は、受信したテキストデータを話題管理部２３に転送する。

　次に、話題管理部２３は、上記テキストデータに隣接ペアの対応文があるか判定する（Ｓ４４）。具体的には、話題管理部２３は、転送された上記テキストデータをさらに話題取得部２４に転送して、該テキストデータに応じた対応文を特定するよう指示する。そして、この指示に応じて話題取得部２４から対応文が通知されたときに、隣接ペアの対応文があると判定し、通知されなかったときには隣接ペアの対応文がないと判定する。例えば、図７の隣接ペアテーブル４０を用いる場合に、音声対話装置１の「今日はほんとうに暑いですね」に対する利用者の応答が「そんなことないぞ」であった場合、隣接ＩＤ＝２の対応文「でも２５度超えてますよ」があると判定される。

　なお、一時保存部に隣接ペアテーブル４０を保存している場合、話題管理部２３がテキストデータを解析して、該テキストデータに応じた対応文が隣接ペアテーブル４０に含まれているか否かを判定してもよい。

　ここで、隣接ペアの対応文があると判定した場合（Ｓ４４にてＹＥＳ）、処理はＳ４１に戻り、話題管理部２３は、当該対応文を利用者に対する発話内容と特定する。つまり、ユーザの応答内容が、隣接ペアテーブル４０に登録されている場合には、隣接ペア対話が継続される。一方、隣接ペアの対応文がないと判定した場合（Ｓ４４にてＮＯ）、話題管理部２３は、その旨を切替部２２に通知すると共に、上記テキストデータを切替部２２に返す。

　この通知を受けた切替部２２は、意図対話への切り替えを行い（Ｓ４５）、処理は終了する。なお、意図対話への切り替え後、切替部２２は、上記テキストデータを意図検索子生成部２５に送信し、図８および図９に示した処理により、利用者の意図に応じた対応が実行される。

　以上のように、会話の状況に応じて隣接ペア対話に切り替えることにより、全ての対話を意図対話とする場合と比べて情報処理量を削減することができ、これにより、タイミングよく音声対話を行うことが可能になる。特に、コンテキストベースの音声対話では、利用者からの発話に対する応答をタイミングよく行い、利用者が安心して利用できるようにすることが望ましいので、この切り替えは有効である。また、会話の状況に応じて意図対話に切り替えることにより、対話におけるフレーム変化にも対応できる。

　（対応制御部３０の処理）　図９のフローチャートでは、対応記述子が検出されると、逐次対応文の出力や対応行動の実行を行う例を示したが、利用者とのより自然な対話のため、これらの対応の実行に関する制御を行ってもよい。これについて、図１２に基づいて説明する。図１２は、音声対話装置１が対応記述子の示す対応の実行制御処理の一例を示すフローチャートである。なお、このフローチャートの処理は、図９のＳ２にてＹＥＳと判定された後、Ｓ４の処理を実行する前に行われる。

　なお、この制御には、主に２つの特徴点がある。その１点目は、音声対話装置１が利用者の発話に応じた対応を実行する前に、該利用者により新たな発話が行われた場合に、その対応を停止または中止する点である。そして、２点目は、利用者の発話に間が生じたときには、対応記述子に応じた対応の実行を待機する点である。

　この２点目の処理を可能にするために、意図検索子生成部２５は、利用者の発話に「間」が生じたときに、述部と意図の要素が空の意図検索子（以下、単に空の意図検索子と呼ぶ）を生成する。例えば、利用者が「いやー、ほんと寒いよね・・・うーん、なにか温かいもの食べたいな」などと、「間」（・・・）を空けて発話した場合を考える。この場合、「いやー、ほんと寒いよね」のテキストデータが受信された後、「うーん、なにか温かいもの食べたいな」のテキストデータが受信されるまでに時間間隔が生じる。そこで、意図検索子生成部２５は、テキストデータが受信された後、テキストデータの受信が確認できない期間が所定時間以上継続したと判定した場合に、空の意図検索子を生成する。

　なお、意図検索子生成部２５は、テキストデータが受信された後、次のテキストデータが受信されたときに、これらの受信タイミングが所定時間以上であれば、空の意図検索子を生成してもよい。また、空の意図検索子は、音声対話装置１と利用者との対話において、利用者の話したい内容（意図）が含まれていないときに生成すればよく、利用者の発話がない期間の検出時に限られず、他の契機で生成してもよい。例えば、「いやー」や「うーん」等の感動詞（感嘆詞、間投詞とも言う）が発話されたときや、音声認識できないような不明瞭な発話がなされたときにも、空の意図検索子を生成してもよい。

　空の意図検索子は、通常の意図検索子と同様に、対応記述子検索部２９に送られる。そして、対応記述子検索部２９は、空の意図検索子を受信した場合には、対応内容の要素が空の対応記述子（以下、単に空の対応記述子と呼ぶ）を生成して、これを対応記述子解析部２８を介して対応制御部３０に送信する。

　このように、対応記述子には、空の対応記述子と通常の対応記述子（対応内容の要素が含まれた対応記述子）とがあるため、対応制御部３０は、まず、対応記述子解析部２８から受信した対応記述子が空の対応記述子であるか否かを判定する（Ｓ６０）。ここで、空の対応記述子であると判定した場合（Ｓ６０にてＹＥＳ）、対応制御部３０は、先に実行が予定された対応記述子があるか否かを判定する（Ｓ６１）。

　そして、先に実行が予定された対応記述子がある場合（Ｓ６１にてＹＥＳ）、対応制御部３０は、先に実行が予定された対応記述子の実行タイミングを遅らせる（Ｓ６２）。例えば、対応記述子の実行タイミングをタイマーで管理している場合、対応制御部３０は、そのタイマーのタイムアウト時間（対応記述子の実行タイミング）を所定時間（例えば５００ｍｓ）だけ増加させてもよい。この後、処理は図９のＳ４に進み、遅らされたタイミングにて、先に実行が予定された対応記述子の示す対応が実行される。

　また、Ｓ６０において、対応記述子が空ではないと判定した場合（Ｓ６０にてＮＯ）にも、対応制御部３０は、先に実行が予定された対応記述子があるか否かを判定する（Ｓ６３）。ここで、先に実行が予定された対応記述子がないと判定した場合（Ｓ６３でＮＯ）、対応制御部３０はＳ６５の処理に進む。一方、先に実行が予定された対応記述子があると判定した場合（Ｓ６３にてＹＥＳ）、対応制御部３０は、先の対応記述子の実行中止命令を、対応文出力制御部３１および対応行動制御部３３に送信し（Ｓ６４）、Ｓ６５の処理に進む。

　Ｓ６５では、対応制御部３０は、Ｓ６０で空ではないと判定した対応記述子を実行予定とする。また、対応制御部３０は、Ｓ６５にて実行予定とした対応記述子の実行タイミングを遅らせる（Ｓ６６）。例えば、対応制御部３０は、タイマーのタイムアウト時間（対応記述子の実行タイミング）を所定時間（例えば５００ｍｓ）に設定してもよい。そして、対応制御部３０は、Ｓ６５で実行予定とした対応記述子の示す対応の実行タイミングとなるのを待ち受ける（Ｓ６７）。

　この後、実行タイミングになったと判定した場合（Ｓ６７にてＹＥＳ）対応制御部３０は、実行タイミングとなった対応に中止命令が出されていないか確認する（Ｓ６８）。そして、中止命令が出されていれば（Ｓ６８にてＹＥＳ）、対応制御部３０は、該対応の実行を中止して（Ｓ６９）処理を終了する。一方、中止命令が出されていなければ（Ｓ６８にてＮＯ）、処理は図９のＳ４に進み、当該対応が実行される。

　例えば、利用者が「いやー、ほんと寒いよね・・・うーん、なにか温かいもの食べたいな」と発話した場合、まず、「いやー、ほんと寒いよね」に対応する対応記述子が生成される。そして、次に「・・・」に対応する空の対応記述子が生成され、さらに「うーん、なにか温かいもの食べたいな」に対応する対応記述子が生成される。

　よって、「いやー、ほんと寒いよね」に対応する対応記述子が実行予定とされた（Ｓ６５）後、空の対応記述子によってこの実行タイミングが遅らされる（Ｓ６２）。そして、遅らされた実行タイミングまでに「うーん、なにか温かいもの食べたいな」に対応する対応記述子が取得されれば、「いやー、ほんと寒いよね」に対応する対応記述子の対応は中止される（Ｓ６４）。その後、「うーん、なにか温かいもの食べたいな」に対応する対応記述子の対応が実行予定とされる（Ｓ６５）。

　このように、利用者の発話の「間」に合わせて、対応の実行を遅らせることにより、利用者の発話を妨げることなく、自然なタイミングで音声対話装置１に応答させることが可能になる。また、連続して行われた利用者の各発話のうち、最後の発話に対する応答のみが行われるので、利用者の発話を途中で遮ることを防ぐことができる。

　なお、利用者の複数の発話のうち、先の発話に対する応答を実行させてもよいし、応答内容に応じて実行の可否を決定してもよい。例えば、隣接ペアＩＤが含まれている応答記述子を優先する構成としても構わない。また、連続して複数の発話がなされたときには、「もう少しゆっくり話して下さい」等の利用者の再度の発話を促すメッセージや、「続けて話されると答えられないよ」等の応答が難しいことを伝えるメッセージを発話させてもよい。

　また、上記の例では、利用者の発話に「間」が生じたときに空の意図検索子を生成することによって、利用者の発話に対する対応の実行タイミングを遅らせているが、この例に限られない。例えば、空の意図検索子の生成を省略して空の対応記述子を生成してもよいし、これらの何れも生成せずに対応の実行タイミングを制御してもよい。空の意図検索子の生成を省略して、空の対応記述子を生成する場合、対応記述子検索部２９は、意図検索子生成部２５から意図検索子を受信した後、次の意図検索子の受信までの期間が所定時間以上であれば、空の対応記述子を生成すればよい。また、何れの生成も省略する場合には、対応制御部３０が、対応記述子解析部２８から対応の実行指示を受信した後、次の指示の受信までの期間が所定時間以上であれば、先の指示の実行を中止すればよい。

　〔実施形態２〕
　本発明の他の実施形態について、図４および図１３に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、前記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。

　実施形態２では、利用者の発話以外の所定の事象の発生が検出された場合に、音声対話装置１が、利用者に対して能動的に対応する例を説明する。所定の事象とは、利用者に関連した事象であれば特に限定されないが、ここでは、音声対話装置１のバッテリー残量が少ないという事象、所定のウェブページが更新されたという事象、利用者を玄関で検出したという事象である例を説明する。

　（情報取得部２１の要部構成）　図４は、図１に示した音声対話装置１が備える情報取得部２１の要部構成の一例を示すブロック図である。図４に示すように、情報取得部２１は、人物画像判別部５０、ユーザ判別部５１、位置情報取得部５２、外部情報マルチプレクサ５３、ネット情報取得部５４、ネット情報マルチプレクサ５５、残量検知部５６、および内部情報マルチプレクサ５７を備えている。

　人物画像判別部５０は、撮像部１２が撮像した画像に人物が撮像されていることを判別する。ユーザ判別部５１は、人物画像判別部５０が判別した人物が、所定の利用者であることを判別する。位置情報取得部５２は、人物画像判別部５０が判別した人物がいる位置を示す情報を取得する。外部情報マルチプレクサ５３は、ユーザ判別部５１および位置情報取得部５２から通知される情報に基づいて、利用者を玄関で検出したという事象（所定の事象）が発生したことを検出し、その旨を切替部２２に通知する。

　ネット情報取得部５４は、通信部１１を介して所定のウェブページを取得する。なお、取得するウェブページは、利用者が予め登録したウェブページ等の利用者が更新状況を把握したいウェブページである。ネット情報マルチプレクサ５５は、ネット情報取得部５４が取得したウェブページが、前回取得したときから更新されていた場合に、ウェブページが更新されたという事象（所定の事象）が発生したと判定し、その旨を切替部２２に通知する。

　残量検知部５６は、バッテリー１３の残量を検知し、検知した残量を内部情報マルチプレクサ５７に通知する。また、内部情報マルチプレクサ５７は、通知された残量が所定値以下であれば、図示しないタイマー（水晶によるクロック情報を出力するものであってもよい）による時間の計測を開始し、そのタイマーによって、残量が所定値以下の状態が所定時間以上継続している事象（所定の事象）を検出する。そして、該事象を検出したときには、その旨を切替部２２に通知する。

　（マルチプレクサの処理例）　ここで、利用者を玄関で検出という事象の発生を検出して意図検索子を生成する処理を図１３に基づいて説明する。図１３は、利用者を玄関で検出という事象の発生を検出して意図検索子を生成する処理の一例を示すフローチャートである。

　人物画像判別部５０は、撮像部１２から取得した撮像画像に人物が含まれていると判別する（Ｓ８０）と、その撮像画像をユーザ判別部５１に送信する。そして、ユーザ判別部５１は、受信した撮像画像中の人物が、所定の利用者であるか判定し（Ｓ８１）、所定の利用者であると判定する（Ｓ８１にてＹＥＳ）と、その旨を外部情報マルチプレクサ５３に通知する。

　この通知を受信した外部情報マルチプレクサ５３は、位置情報取得部５２が取得した位置が所定の位置（この例では玄関）であるか否かを判定する（Ｓ８２）。そして、所定の位置であると判定した場合（Ｓ８２にてＹＥＳ）、外部情報マルチプレクサ５３は、玄関で利用者を検出したという事象の発生を切替部２２に通知する。なお、Ｓ８１で所定の利用者ではない（Ｓ８１にてＮＯ）と判定された場合や、Ｓ８２で所定の位置ではない（Ｓ８２にてＮＯ）と判定された場合には、Ｓ８３には進まずに処理を終了する。

　次に、上記の通知を受信した切替部２２は、意図検索子生成部２５に上記事象の発生を通知し、この通知を受信した意図検索子生成部２５は、当該事象に対応する予め定められた意図検索子を生成し（Ｓ８３）、対応記述子検索部２９に送信する。具体的には、表層を「帰宅」、意図を「現在」、対象を「利用者」とする意図検索子を生成し、送信する。これにより、図６の対応記述子検索テーブル４２から「ご主人様おかえりなさい」の対応文と、「挨拶」の対応行動が特定され、音声対話装置１は、「ご主人様おかえりなさい」と音声出力しながら、「挨拶」の対応行動を実行する。

　なお、他の事象の発生が検出された場合の意図検索子の生成も同様である。例えば、ウェブページの更新が通知された場合には、意図検索子生成部２５は、表層を「変わった」、意図を「事実」、対象を「ホームページ」とする意図検索子を生成する。また、バッテリー１３の残量が所定値以下の状態が所定時間以上継続している事象の発生を通知された場合には、意図検索子生成部２５は、表層を「なくなる」、意図を「事実、未来」、対象を「電池」とする意図検索子を生成する。

　無論、意図検索子の生成対象とする事象は、利用者に対する発話の契機となるような事象であればよく、上記の例に限られない。例えば、撮像部１２が撮像した利用者以外の画像や、集音部１０が取得した利用者の発話以外の音から検出される所定の事象を設定してもよい。この他にも、インターネットやラジオ、テレビ等から取得した情報で検出される所定の事象を設定してもよい。また、音声対話装置１または他の装置がセンサー（加速度センサー、角加速度センサー、温湿度センサー等）を備えている場合には、該センサーから取得した情報で検出される所定の事象を設定してもよい。さらに、上記のような情報を複数種類取得し、取得した各情報を用いて所定の演算を行うことによって算出した値から、所定の事象の発生を検出しても構わない。これにより、利用者自身の状況、利用者の周囲の状況、あるいは利用者が関心のある情報等に応じた、音声対話装置１からの自発的な発話や動作が可能になる。

　〔実施形態３〕
　本発明の他の実施形態について、図１４に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、前記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。本実施形態では、ネットワーク上の対応決定装置８０を利用して上記実施形態の音声対話装置１と同様の機能を実現する例を説明する。

　（音声対話システム２００の概要）　図１４は、本実施形態に係る音声対話システム２００を概略的に示す図である。音声対話システム２００は、音声対話装置（例えばロボット）７０と、対応決定装置８０とを含む構成である。音声対話装置７０は、音声対話装置１と比べて、音声認識部２０、意図検索子生成部２５、および対応記述子検索部２９を備えていない点と、切替部２２が実行する処理の内容が異なっている点で相違している。

　対応決定装置８０は、利用者の発話に対する対応を決定する装置であり、対応決定装置８０の各部を統括して制御する制御部８１と、対応決定装置８０が外部の装置（ここでは音声対話装置７０）と通信するための通信部８２を備えている。また、制御部８１には、音声認識部２０、意図検索子生成部２５、対応記述子検索部２９、話題取得部２４、および応答制御部８３が含まれている。なお、同図では省略しているが、意図検索子生成部２５には、形態素解析部２６および係り受け解析部２７が接続されており、図示しない記憶部には、隣接ペアテーブル４０、意図テーブル４１、および対応記述子検索テーブル４２が格納されている。

　応答制御部８３は、利用者の発話の音声データを受信して、該発話に対する応答を決定する。応答制御部８３の具体的な処理内容は下記の通りである。

　（応答制御部８３の処理）　図１４に示すように、音声対話装置７０は、利用者の発話を含む音声データを送信するので、応答制御部８３は、通信部８２を介してこれを受信する。次に、応答制御部８３は、受信した音声データを音声認識部２０に送信して音声認識させ、音声認識部２０から音声認識結果のテキストデータを取得する。続いて、応答制御部８３は、取得したテキストデータを意図検索子生成部２５に送信して、該テキストデータから意図検索子を生成させ、生成された意図検索子を取得する。そして、応答制御部８３は、取得した意図検索子を対応記述子検索部２９に送信して、該意図検索子に対応する対応記述子を特定させ、特定された対応記述子を取得する。

　ここで、取得した対応記述子に隣接ペアＩＤが含まれている場合には、その隣接ペアＩＤを話題取得部２４に送信して、該隣接ペアＩＤに対応する隣接ペアを特定させ、特定された隣接ペアを取得する。なお、取得する隣接ペアは、少なくともその隣接ペアＩＤの対応文を含むものであればよいが、その隣接ペアＩＤにリンクされた各情報を含む隣接ペアテーブル４０全体を取得することが好ましい。

　そして、応答制御部８３は、取得した対応記述子または隣接ペアを、通信部８２を介して音声対話装置７０に送信する。なお、隣接ペアを送信した場合には、利用者の次の発話に対して速やかに隣接ペアの対応文を返すことができるように、応答制御部８３は、隣接ペアを送信したこと、および送信した隣接ペアの内容を記憶しておくことが望ましい。

　この後、利用者がさらに発話したときには、上記と同様に音声対話装置７０から音声データを受信し、応答制御部８３は、この音声データを音声認識部２０に送信してテキストデータを取得する。このとき、隣接ペアを送信したことを記憶していなければ、上記と同様の処理となるが、記憶していれば、応答制御部８３は、取得したテキストデータを話題取得部２４に送信して、該テキストデータに対応する対応文の有無を確認する。

　そして、対応文があることが確認されると、応答制御部８３は、当該対応文の隣接ペアＩＤを音声対話装置７０に送信する。なお、先に送信した隣接ペアに、当該隣接ペアＩＤの対応文が含まれていない場合には、その対応文も含めて送信する。例えば、図７の隣接ペアテーブルの♯１～♯３までのデータを隣接ペアとして送信済みの場合に、ＩＤ＝４またはＩＤ＝５を発話させる場合には、♯４または♯５のデータも送信する。無論、♯４と♯５の両方のデータを送信してもよい。

　一方、対応文がないことが確認されると、応答制御部８３は、テキストデータを意図検索子生成部２５に送信する。この後は、上述した通り、意図検索子が生成されて意図対話が行われる。

　（切替部２２の処理）　次に、音声対話装置７０の切替部２２について説明する。上述のように、音声対話装置７０は、音声認識処理を自装置内では行わない。このため、音声対話装置７０は、集音部１０で音声データを取得すると、取得した音声データを対応決定装置８０に送信する。そして、その応答として、対応記述子または隣接ペアを受信する。

　ここで、対応記述子を受信した場合には、切替部２２は、対応記述子解析部２８（図１参照）にその対応記述子を送信する。つまり、本実施形態の切替部２２は、利用者の発話を解析して生成された意図検索子に対応する対応記述子を、外部機器（対応決定装置８０）から取得する対応記述子取得部として機能する。この後は、実施形態１で説明したように、対応制御部３０によって、この対応記述子が示す対応が実行される。

　一方、隣接ペアを受信した場合には、切替部２２は、受信した隣接ペアを話題管理部２３（図１参照）に送信する。この後は、実施形態１で説明したように、この隣接ペアに応じた対応が行われる。なお、受信した情報が隣接ペアＩＤのみであれば、音声対話装置７０の記憶部１５に格納されている隣接ペアテーブル４０から対応文が特定され、隣接ペアテーブル（全体または一部）を受信した場合には、受信した隣接ペアテーブルを用いて対応文が特定される。

　（システム構成のバリエーション）　上記では、音声対話装置１の一部機能をサーバ（対応決定装置８０）に持たせた音声対話システム２００について説明したが、サーバに持たせる機能はこの例に限られない。例えば、音声認識部２０は音声対話装置に残し、意図検索子生成部２５の機能をサーバに持たせた音声対話システムも本発明の範疇に含まれる。この構成では、音声対話装置は、意図検索子を生成する代わりに、サーバから意図検索子を取得することになるので、意図検索子生成部２５の代わりに意図検索子取得部を備えていればよい。

　また、対応制御部３０、対応文出力制御部３１、および対応行動制御部３３の機能をサーバに持たせてもよい。この他、音声認識部２０と対応記述子検索部２９の機能をサーバに持たせ、意図検索子生成部２５、対応制御部３０、対応文出力制御部３１、および対応行動制御部３３の機能を音声対話装置に残す構成等も可能である。このように、各機能をサーバと音声対話装置とに適宜振り分けた音声対話システムであっても、音声対話装置１と同様の機能を実現できる。また、サーバは機能毎に個別に設けてもよいし、複数の機能を１つのサーバに搭載してもよい。

　〔ソフトウェアによる実現例〕
　音声対話装置１および対応決定装置８０の制御ブロック（特に制御部１４および８１の各ブロック）は、集積回路（ＩＣチップ）等に形成された論理回路（ハードウェア）によって実現してもよいし、ＣＰＵ（Central Processing Unit）を用いてソフトウェアによって実現してもよい。

　後者の場合、音声対話装置１および対応決定装置８０は、各機能を実現するソフトウェアであるプログラムの命令を実行するＣＰＵ、上記プログラムおよび各種データがコンピュータ（またはＣＰＵ）で読み取り可能に記録されたＲＯＭ（Read Only Memory）または記憶装置（これらを「記録媒体」と称する）、上記プログラムを展開するＲＡＭ（RandomAccess Memory）などを備えている。そして、コンピュータ（またはＣＰＵ）が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体（通信ネットワークや放送波等）を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。

　〔まとめ〕
　本発明の態様１に係る対応決定装置（音声対話装置１、対応決定装置８０）は、利用者と音声対話を行う音声対話装置（１）が該利用者の発話に応じて行う対応を決定する対応決定装置であって、上記発話を解析して生成された該利用者の意図を示す意図検索子を取得する意図検索子取得部（意図検索子生成部２５）と、上記意図検索子と、上記音声対話装置の対応を示す対応記述子とが対応付けられた対応記述子検索情報（対応記述子検索テーブル４２）を参照して、上記意図検索子取得部により取得された意図検索子に対応する対応記述子を特定する対応記述子検索部（対応記述子検索部２９）と、を備えている。

　上記の構成によれば、利用者の意図を示す意図検索子を取得し、該意図検索子に対応した対応記述子を特定するので、利用者の意図に応じた対応を音声対話装置に実行させることができる。また、上記意図検索子は、利用者の意図を示す検索子であるから、利用者の発話した文言をそのまま検索子として用いる場合と比べて、利用者の多様な表現をカバーしやすい。例えば、利用者の意図が同じであれば、敬語や方言などにより発話された文言自体が変化したとしても、それらの発話を１つの意図検索子で表すことができる。よって、利用者の発話する文言とその対応とを対応付けたデータベースを用いる場合と比べて、対応記述子を検索するために必要な処理量を低減することができる。

　したがって、上記の構成によれば、多様な表現の発話に対し、その意図に応じた対応を速やかに特定することができる。なお、意図検索子は、対応決定装置が生成してもよいし、外部機器から取得してもよい。また、対応記述子の示す対応は、音声対話装置が利用者に向けて実行するものであればよく、利用者向けの発話であってもよいし、それ以外の動作であってもよい。

　本発明の態様２に係る対応決定装置は、上記態様１において、上記対応記述子検索情報の上記意図検索子には、当該意図検索子の示す意図に関連する語句（対象）が含まれており、上記対応記述子検索部は、上記意図検索子取得部が取得した意図検索子に、上記利用者の発話から抽出された語句が含まれる場合、当該語句を含む意図検索子に対応付けられた上記対応記述子を特定してもよい。

　上記の構成によれば、利用者が特定の語句を発話した場合に、その利用者の意図に対応し、かつその語句にも対応する対応記述子が特定される。よって、利用者の意図に対応し、かつ特定の語句にも対応する対応を音声対話装置に実行させることができる。

　本発明の態様３に係る対応決定装置は、上記態様１または２において、所定の事象の発生を検出する事象検出部（情報取得部２１）を備え、上記意図検索子取得部は、上記事象検出部が上記所定の事象の発生を検出した場合に、当該事象に応じた意図検索子を取得してもよい。

　上記の構成によれば、所定の事象の発生時における利用者の意図に応じた対応を決定することができる。よって、利用者が発話していない場合であっても、音声対話装置から主体的に利用者に話しかける等の能動的な対話が実現可能となる。なお、所定の事象は、音声対話装置が対応を行う契機として適当なものであればよい。例えば、音声対話装置がバッテリーで駆動するものであれば、そのバッテリー残量が少ない状態となっていることを上記所定の事象の発生として検出してもよい。

　本発明の態様４に係る対応決定装置は、上記態様１から３のいずれかにおいて、上記意図検索子取得部により取得された意図検索子に対応する対応記述子を外部機器から取得する対応記述子取得部（対応記述子検索部２９）を備えていてもよい。

　上記の構成によれば、取得された意図検索子に対応する対応記述子を外部機器から取得するので、対応決定装置内で適切な対応記述子を検出できない場合であっても、外部機器から取得した対応記述子を用いて音声対話装置に対応を実行させることができる。また、対応決定装置内で対応記述子を検出できた場合であっても、外部機器からより適切な対応記述子を取得できた場合には、外部機器から取得した対応記述子を用いて、音声対話装置により適切な対応を実行させることができる。

　本発明の態様５に係る対応決定装置は、上記態様１から４のいずれかにおいて、上記対応記述子検索部が特定した上記対応記述子の示す対応が実行される前に、上記利用者により新たな発話が行われた場合に、上記対応の実行を停止または中止する対応制御部（３０）を備えていてもよい。

　上記の構成によれば、音声対話装置が利用者の発話に応じた対応を実行する前に、該利用者により新たな発話が行われた場合に、上記対応の実行を停止または中止する。よって、利用者が連続して発話する場合に、音声対話装置の対応が利用者の発話を妨げたり、音声対話装置に不自然な対応をさせたりすることを防ぐことができる。

　本発明の態様６に係る対応決定装置は、上記態様１から５のいずれかにおいて、上記発話後の上記利用者が上記意図検索子の生成対象となる内容の発話を行っていない場合に、上記対応記述子検索部が特定した上記対応記述子の示す対応の実行タイミングを遅らせるタイミング制御部（対応制御部３０）を備えていてもよい。

　上記の構成によれば、発話後の利用者が意図検索子の生成対象となる内容の発話を行っていない場合に、対応の実行を遅らせることにより、利用者の次の発話を妨げることなく、自然なタイミングで音声対話装置に応答させることが可能になる。

　なお、「意図検索子の生成対象となる内容の発話を行っていない場合」には、利用者が何ら発話していない場合の他、「ええと」や「うーん」等の感動詞が発話された場合のように、利用者の特定の意図が反映されていない発話が行われた場合も含まれる。よって、上記の構成は、利用者の意図を含む発話の後に「間」が生じたときに、その発話に対する対応の実行タイミングを遅らせる構成であるとも言える。

　本発明の態様７に係る対応決定装置は、上記態様１から６のいずれかにおいて、上記音声対話装置の所定の発話に対する利用者の応答として想定される発話内容（想定発話）と、該発話内容に対する上記音声対話装置の応答内容とが対応付けられたリンク情報（隣接ペアテーブル４０）を参照して、上記音声対話装置が上記所定の発話を行った後の上記音声対話装置の対応を決定するリンク応答部（話題管理部２３、話題取得部２４）を備えていてもよい。

　上記の構成によれば、音声対話装置が所定の発話を行ったときには、意図検索子を生成することなく、リンク情報を用いてさらに速やかに対応を決定することができる。このように、意図検索子を用いた対応の決定と、リンク情報を用いた対応の決定とを併用することにより、利用者の意図を汲んだ対応を実現しつつ、状況に応じてリンク情報で対応を決定して、対応決定のために必要な処理の負荷を減らすことができる。

　本発明の態様８に係る音声対話システム（１００、２００）は、音声対話装置（１、７０）にて利用者と音声対話を行う音声対話システムであって、上記利用者の意図を示す意図検索子と、上記音声対話装置の対応を示す対応記述子とが対応付けられた対応記述子検索情報（対応記述子検索テーブル４２）を参照して、上記利用者の発話を解析して生成された意図検索子に対応する対応記述子を特定する対応決定装置（音声対話装置１、対応決定装置８０）を含み、上記音声対話装置は、上記利用者の上記発話に対し、上記対応決定装置が特定した上記対応記述子の示す対応を実行する。よって、上記態様１と同様の効果を奏する。

　本発明の態様９に係る対応決定装置の制御方法は、利用者と音声対話を行う音声対話装置（１）が該利用者の発話に応じて行う対応を決定する対応決定装置の制御方法であって、上記発話を解析して生成された上記利用者の意図を示す意図検索子を取得する意図検索子取得ステップと、上記意図検索子と上記音声対話装置の対応を示す対応記述子とが対応付けられた対応記述子検索情報（対応記述子検索テーブル４２）を参照して、上記意図検索子取得ステップにて取得された意図検索子に対応する対応記述子を特定する対応記述子検索ステップと、を含む。よって、上記態様１と同様の効果を奏する。

　本発明の態様１０に係る音声対話装置（１）は、上記対応決定装置を備え、利用者の発話に対し、該対応決定装置が決定した対応を実行する。よって、上記態様１と同様の効果を奏する。

　本発明の態様１１に係る音声対話装置（７０）は、利用者と音声対話を行う音声対話装置であって、上記利用者の意図を示す意図検索子と、上記音声対話装置の対応を示す対応記述子とが対応付けられた対応記述子検索情報（対応記述子検索テーブル４２）を参照して特定された、上記利用者の発話を解析して生成された意図検索子に対応する対応記述子を、外部機器から取得する対応記述子取得部と、上記対応記述子取得部が取得した上記対応記述子が示す対応を実行する対応制御部と、を備えている。よって、上記態様１と同様の効果を奏する。

　本発明の各態様に係る対応決定装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記対応決定装置が備える各部（ソフトウェア要素）として動作させることにより上記対応決定装置をコンピュータにて実現させる対応決定装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。

　本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。

　本発明は、利用者と音声対話を行う音声対話装置に利用することができる。

　　１　音声対話装置（対応決定装置）
　　４　対応記述子検索装置（外部機器、対応決定装置）
　７０　音声対話装置
　８０　対応決定装置
　２１　情報取得部（事象検出部）
　２３　話題管理部（リンク応答部）
　２４　話題取得部（リンク応答部）
　２５　意図検索子生成部（意図検索子取得部）
　２９　対応記述子検索部（対応記述子取得部）
　３０　対応制御部（タイミング制御部）
　４０　隣接ペアテーブル（リンク情報）
　４２　対応記述子検索テーブル（対応記述子検索情報）
１００、２００　音声対話システム

Claims

　利用者と音声対話を行う音声対話装置が該利用者の発話に応じて行う対応を決定する対応決定装置であって、
　上記発話を解析して生成された上記利用者の意図を示す意図検索子を取得する意図検索子取得部と、
　上記意図検索子と上記音声対話装置の対応を示す対応記述子とが対応付けられた対応記述子検索情報を参照して、上記意図検索子取得部により取得された意図検索子に対応する対応記述子を特定する対応記述子検索部と、を備えていることを特徴とする対応決定装置。
　上記対応記述子検索情報の上記意図検索子には、当該意図検索子の示す意図に関連する語句が含まれており、
　上記対応記述子検索部は、上記意図検索子取得部が取得した意図検索子に、上記利用者の発話から抽出された語句が含まれる場合、当該語句を含む意図検索子に対応付けられた上記対応記述子を特定することを特徴とする請求項１に記載の対応決定装置。
　所定の事象の発生を検出する事象検出部を備え、
　上記意図検索子取得部は、上記事象検出部が上記所定の事象の発生を検出した場合に、当該事象に応じた意図検索子を取得することを特徴とする請求項１または２に記載の対応決定装置。
　上記意図検索子取得部により取得された意図検索子に対応する対応記述子を外部機器から取得する対応記述子取得部を備えていることを特徴とする請求項１から３のいずれか１項に記載の対応決定装置。
　上記対応記述子検索部が特定した上記対応記述子の示す対応が実行される前に、上記利用者により新たな発話が行われた場合に、上記対応の実行を停止または中止する対応制御部を備えていることを特徴とする請求項１から４のいずれか１項に記載の対応決定装置。
　上記発話後の上記利用者が上記意図検索子の生成対象となる内容の発話を行っていない場合に、上記対応記述子検索部が特定した上記対応記述子の示す対応の実行タイミングを遅らせるタイミング制御部を備えていることを特徴とする請求項１から５のいずれか１項に記載の対応決定装置。
　上記音声対話装置の所定の発話に対する利用者の応答として想定される発話内容と、該発話内容に対する上記音声対話装置の応答内容とが対応付けられたリンク情報を参照して、上記音声対話装置が上記所定の発話を行った後の上記音声対話装置の対応を決定するリンク応答部を備えていることを特徴とする請求項１から６のいずれか１項に記載の対応決定装置。
　音声対話装置にて利用者と音声対話を行う音声対話システムであって、
　上記利用者の意図を示す意図検索子と、上記音声対話装置の対応を示す対応記述子とが対応付けられた対応記述子検索情報を参照して、上記利用者の発話を解析して生成された意図検索子に対応する対応記述子を特定する対応決定装置を含み、
　上記音声対話装置は、上記利用者の上記発話に対し、上記対応決定装置が特定した上記対応記述子の示す対応を実行する、ことを特徴とする音声対話システム。
　利用者と音声対話を行う音声対話装置が該利用者の発話に応じて行う対応を決定する対応決定装置の制御方法であって、
　上記発話を解析して生成された上記利用者の意図を示す意図検索子を取得する意図検索子取得ステップと、
　上記意図検索子と上記音声対話装置の対応を示す対応記述子とが対応付けられた対応記述子検索情報を参照して、上記意図検索子取得ステップにて取得された意図検索子に対応する対応記述子を特定する対応記述子検索ステップと、を含むことを特徴とする対応決定装置の制御方法。
　請求項１から７のいずれか一項に記載の対応決定装置を備え、利用者の発話に対し、該対応決定装置が決定した対応を実行することを特徴とする音声対話装置。
　利用者と音声対話を行う音声対話装置であって、
　上記利用者の意図を示す意図検索子と、上記音声対話装置の対応を示す対応記述子とが対応付けられた対応記述子検索情報を参照して特定された、上記利用者の発話を解析して生成された意図検索子に対応する対応記述子を、外部機器から取得する対応記述子取得部と、
　上記対応記述子取得部が取得した上記対応記述子が示す対応を実行する対応制御部と、を備えていることを特徴とする音声対話装置。