JP4370410B2

JP4370410B2 - 対話システム、対話ロボット、プログラム及び記録媒体

Info

Publication number: JP4370410B2
Application number: JP2006510592A
Authority: JP
Inventors: 博唯上田
Original assignee: National Institute of Information and Communications Technology
Current assignee: National Institute of Information and Communications Technology
Priority date: 2004-03-08
Filing date: 2004-03-08
Publication date: 2009-11-25
Anticipated expiration: 2024-03-08
Also published as: JPWO2005086051A1; WO2005086051A1

Description

本発明は、ユーザの生活を支援するためにアプライアンスを自律的に制御する生活支援ロボットシステムと協働して、ユーザと音声による対話を行う対話ロボット、および、前記生活支援ロボットシステムおよび前記対話ロボットを備える対話システムに関する。

ユビキタスな環境を背景にして、ユーザの居住空間などに設置されて自律的にユーザの生活を支援する生活支援ロボットシステムが実現されている。ユビキタスな環境を前提にした生活支援ロボットシステムは、ユーザが特に意識して操作する必要がないアンコンシャス型のシステムであることが多い。
アンコンシャス型の生活支援ロボットシステムは、快適な環境の維持やユーザの活動支援のために、各種のセンサ情報にもとづいて環境やユーザの行動を推論し、ネットワークで接続されたアプライアンス（通信機能を備えた家電機器）、情報端末装置などを制御してサービスを提供するものである。
例えば、生活支援ロボットシステムは、センサ情報をもとにユーザの動作・姿勢、部屋の状況を分析してユーザがリラックスした状態であると推論すると、アプライアンスの一つであるオーディオシステムによってユーザの嗜好にあった音楽を流したり、または、エアコンによって室内の温湿度を維持して、ユーザがこれらのアプライアンスを意識的に操作することなく快適な生活環境を実現できるようにする。
アンコンシャス型の生活支援ロボットシステムは、ユーザがアプライアンスを意識的に操作する必要がない点で便利である。しかし、生活支援ロボットシステムが自律的制御によって提供しているサービスが、常に、ユーザに受け入れられるとは限らないという事態が生ずることが予想される。
生活支援ロボットシステムが生活全般の支援を図るようになり、提供するサービスがより高度化・多機能化し、アプライアンスの動作原理も複雑化してくると考えられる。そのため、生活支援ロボットシステムの自律的制御だけでは、ユーザ個々の要求に対応しきれなくなる可能性がある。
また、アンコンシャスであること、すなわちユーザに意識的な操作を要求しないという生活支援ロボットシステムの仕組みは、システムの存在を認識しにくいものにするため、ユーザに気味悪さを感じさせる原因にもなりうる。
例えば、生活支援ロボットシステムが自律的に実行するサービスが、あるユーザにとって快適であっても、別のユーザにとっては不快なものとなるような状況や、実行されたサービスが、ユーザにとってはかえって迷惑であると考えるような状況などが生じることが予想される。このような場合に、ユーザは、違うサービスを実行してもらいたいと考えたり、サービス実行の理由を知りたいという要求があるので、生活支援ロボットシステムは、このような不満や疑問を解消する必要がある。
さらに、生活支援ロボットシステムが蓄積している情報以外の事柄についても、ユーザが知りたい場合がある。例えば、ユーザ自らがアプライアンスを操作したい場合に、アプライアンスそれぞれの高度化した機能を十分に使いこなすように操作できないような状況が生じることも予想される。このような場合に、ユーザは、生活支援ロボットシステムではカバーしていないような詳細な情報を知りたいと考えるので、対話ロボットにおいて、このような情報の提供をする必要がある。
このように、アンコンシャス型の生活支援ロボットシステムは、様々な状況にも柔軟に対応できるような普遍的なユーザインタフェースとして、高度な状況対応処理能力を備え、かつユーザに親近感を抱かせるような対話システムを備える必要がある。
本発明は、かかる必要性に鑑みてなされたものであり、その目的は、生活支援ロボットシステムのユーザインタフェースとして、ユーザの曖昧な要求をより正確に受け取ってシステムの制御に反映させ、またシステムの制御状況をより的確に理解してもらえるように、ユーザにとって有用なサービスや情報を提供できるような対話ロボット、および前記対話ロボットを用いた対話システムを実現することである。

本発明は、上記の目的を達成するために、生活支援ロボットシステムと対話ロボットとが協働する、高度な状況対応能力を備えた対話システムを実現するものである。また、対話システムのユーザインタフェースを、ユーザが実体として認識できるビジブル型の対話ロボットによって実現することによりユーザフレンドリーなインタフェースを実現するものである。
本発明は、ユーザの生活を支援するためにサービスを実行するアプライアンスを自律的に制御する生活支援ロボットシステムと、前記生活支援ロボットシステムと協働して対話ロボットの音声によりユーザと対話する対話システムである。
対話システムを構成する前記生活支援ロボットシステムは、１）所定の空間内で計測されたセンサ情報をもとに前記空間内の環境とユーザの行動とを推論してアプライアンスを制御する推論システムと、２）前記推論システムによる推論結果である環境情報および行動情報を蓄積する分散環境行動データベースとを備える。
また、前記対話ロボットは、１）概念同士の関連の度合いを記述する連想情報を蓄積する対話戦略データベースと、２）当該対話ロボット内で生成されたロボット発話データを音声データに変換して発話する音声合成手段と、３）ユーザの音声データの内容を認識してユーザ発話データに変換する音声認識手段と、４）前記分散環境行動データベースから前記環境情報および行動情報を取得して状況記憶手段に格納する状況情報取得手段と、５）前記環境情報および行動情報からユーザの状況を解析し、前記状況にもとづいて前記ユーザに提供するサービスを選択し、前記連想情報にもとづいて前記状況と関連する概念を特定し、前記概念を示す言語表現を用いてロボット発話データを生成する処理と、前記ロボット発話データに対するユーザ発話データの文脈を推論し、前記連想情報を参照して前記ユーザ発話データの文脈が前記ロボット発話データの文脈と概念的に関連しているか否かを判定する処理とを行う対話制御手段と、６）前記対話制御手段により前記ユーザ発話データの文脈が前記ロボット発話データの文脈と関連すると判定された場合に、前記サービスの実行要求を前記生活支援ロボットシステムもしくは前記アプライアンスへ送信する実行要求手段とを備える。
対話ロボットは、対話ロボットが、ユーザの会話に参加したり問いかけたりして、ユーザを自己の対話に引き込むために、「連想しりとり」行動仮説にもとづいて対話を生成する処理に用いる連想情報を蓄積する対話戦略データベースを備える。また、対話ロボットは、状況情報取得手段により、前記生活支援ロボットシステムの分散環境行動データベースから前記環境情報および行動情報を取得して状況記憶手段に格納する。
対話ロボットの対話制御手段では、前記環境情報および行動情報からユーザの状況を解析し、前記状況にもとづいて前記ユーザに提供するサービスを選択する。また、前記対話戦略データベースの連想情報にもとづいて前記状況と関連する概念を特定し、前記概念を示す言語表現を用いてロボット発話データを生成する。そして、音声合成手段により、生成されたロボット発話データを音声データに変換して発話する。
その後、音声認識手段により、ユーザの音声データの内容を認識してユーザ発話データに変換する。対話制御手段では、前記ロボット発話データに対するユーザ発話データの文脈を推論し、前記連想情報を参照して前記ユーザ発話データの文脈が前記ロボット発話データの文脈と概念的に関連しているか否かを判定する。そして、前記ユーザ発話データの文脈が前記ロボット発話データの文脈と関連すると判定した場合に、前記サービスの実行要求を前記生活支援ロボットシステムもしくは前記アプライアンスへ送信する。
これにより、対話システムでは、対話ロボットにより、ユーザの状況にもとづいて選択したサービスをユーザに認知させ提供するための音声による問いかけを行い、ユーザの応答がロボットとの対話への引き込みとなっている場合に、サービスの実行要求を生活支援ロボットシステムもしくはアプライアンスに送信することにより、潜在していたサービスをユーザに提供できるようになる。
または、対話ロボットは、音声認識手段により、ユーザの音声データの内容を認識してユーザ発話データに変換する。そして、対話制御手段では、前記ユーザ発話データの文脈を解析し、前記環境情報および行動情報から状況を解析し、前記ユーザ発話データの文脈および状況にもとづいてユーザに提供するサービスを選択し、前記連想情報にもとづいて前記ユーザ発話データの文脈と関連する概念を特定し、前記概念を示す言語表現を用いてロボット発話データを生成する。そして、音声合成手段により、生成されたロボット発話データを音声データに変換して発話する。
その後、音声認識手段により、ロボット発話データに対するユーザの音声データの内容を認識してユーザ発話データに変換する。そして、対話制御手段では、前記ロボット発話データに対する新たなユーザ発話データの文脈を推論し、前記連想情報を参照して前記新たなユーザ発話データの文脈が前記ロボット発話データの文脈と概念的に関連しているか否かを判定する。前記新たなユーザ発話データの文脈が前記ロボット発話データの文脈と概念的に関連していると判定した場合に、前記サービスの実行要求を前記生活支援ロボットシステムもしくは前記アプライアンスへ送信する。
これにより、対話システムでは、対話ロボットにより、ユーザの会話の文脈やユーザの状況にもとづいて選択したサービスをユーザに提供するために、音声によりユーザの会話へ割り込み、ユーザの応答がロボットとの対話への引き込みとなっている場合に、サービスの実行要求を生活支援ロボットシステムもしくはアプライアンスへ送信することにより、曖昧であったサービスをユーザに提供できるようになる。
さらに、対話システムの対話ロボットは、上記の構成をとる場合に、アプライアンスまたは前記アプライアンスで実行されるサービスに関する知識情報を蓄積する知識データベースを備え、前記対話制御手段は、前記ユーザ発話データの文脈が前記ロボット発話データの文脈と関連すると判定した場合に、前記知識データベースから前記選択されたサービスに関する知識情報を抽出し、前記抽出した知識情報を用いてロボット発話データを生成する。
さらに、対話システムの対話ロボットは、上記の構成をとる場合に、所定の通信プロトコルによりネットワーク上の他の情報提供サーバから前記選択されたサービスに関する知識情報を取得し、前記知識データベースに蓄積する知識情報取得手段を備える。
これにより、サービスの提供に関連して、そのサービスやサービスを実行するアプライアンスに関する知識情報をユーザに提供できるようになる。
また、対話システムの対話ロボットは、対話制御手段で選択されたサービスとして、他の対話ロボットと、所定の通信プロトコルにより、ユーザの状況や選択されたサービスに関する情報を送受信するロボット間通信手段を備える。
これにより、対話ロボット同士が連携して、ユーザにサービスを提供できるようになる。
このように、アンコンシャス型の生活支援ロボットシステムの自律的な制御についてユーザが疑問や不満などを感じるような状況が生じている場合に、ビジブル型の対話ロボットは、ユーザの会話から、そのような疑問・不満を認識してユーザに問いかけることにより、生活支援ロボットシステムから制御の理由を得てユーザに説明することができる。ユーザは、生活支援ロボットシステムの自律動作に特有の不気味さや不満を解消することができる。
また、ユーザが曖昧な要求や潜在的な要求を持っている場合に、対話ロボットは、ユーザとの対話を進めて、潜在的な要求に生活支援ロボットシステムが対応できることをユーザに気がつかせることができる。さらには、ユーザの曖昧な要求を具体化して、生活支援ロボットシステムにサービス実行を依頼することができる。これにより、ユーザ生活支援ロボットシステムは、より柔軟で高度なサービス制御を実現することができる。
特に、本発明によれば、アンコンシャス型の生活支援ロボットシステムとユーザとの対話を、ユーザが実体として認識できるビジブル型の対話ロボットを通じて行うことにより、ユーザが違和感を感じない自然なインタフェースを実現することができる。
さらには、本発明によれば、生活支援ロボットシステムを共有する家族などの複数のユーザが、対話ロボットと同時に対話することが可能である。ビジブル型の対話ロボットを媒介としてユーザ同士が話題を共有することになり、生活支援ロボットシステムに対する個々のユーザの孤立感を解消する一助になる。

第１図は、本発明の対話システムの実施例における構成を示す図である。
第２図は、生活支援ロボットシステムおよび対話ロボットの構成例を示す図である。
第３図は、分散環境行動データベースの構成例を示す図である。
第４図は、ユーザの会話からサービスを選択する場合の対話ロボットの処理の流れの一例を示す図である。
第５図は、ユーザの状況からサービスを選択する場合の対話ロボットの処理の流れの一例を示す図である。
第６図は、ユーザの会話からサービスに関連する知識情報を提供する場合の対話ロボットの処理の流れの一例を示す図である。

以下、本発明の実施例を説明する。
第１図は、本発明の対話システムの構成例を示す図である。本実施例において、対話システムは、複数のユーザ３（３ａ、３ｂ、３ｃ）で構成される一家族の住宅（居住空間）に適用されたアンコンシャス型の生活支援ロボットシステム（以下、ロボットシステムとする）１と、ビジブル型の対話ロボット２で構成される。
ロボットシステム１は、ユビキタス環境を利用して、居住空間全体をモニタリングして、通信機能を持つ家電機器（アプライアンス）４によるサービスを実行して、自律的にユーザ３の生活を支援する。
対話ロボット２は、ユーザ３の居住空間内に設置される。対話ロボット２は、自律的に移動できる機能を備えて、ユーザ３の居住空間内を自由に移動できるように構成されてもよい。
また、対話ロボット２は、システムとしての実体は一つであるが、同一構成の処理手段を備えた複数の筐体を持つようにしてもよい。筐体は、例えば卓上に設置可能な程度の大きさとする。対話ロボット２が複数の筐体を持つ場合には、居住空間内の各部屋に設置された対話ロボット２のうち音声データを検出した筐体における処理手段が対話ロボット２としての処理動作を開始する。処理が継続している最中に、対話相手となるユーザが移動したり、離れた場所にいるユーザとの対話が必要となった場合には、対話相手と最も近い場所に設定された筐体の処理手段が処理を引き継ぐことにより、一つの処理動作の流れを複数筐体によって連携できるようにする。
本発明の対話システムは、アンコンシャス型の生活支援ロボットシステム１とビジブル型の対話ロボット２との分散協働を図るものである。このような分散協働は、いわば母親と子供との関係のメタファに例えることができる。
アンコンシャス型の生活支援ロボットシステム１が組み込まれたユーザの生活空間全体を「母親メタファ」とする。すなわち、いつも家の中にいて家族を見守り、必要なときにはどこからともなく現れて、さりげなく家族を支援してくれる存在に例える。そして、ユーザ３との対話を受け持つ対話ロボット２を、「子供メタファ」とする。対話ロボット２を、一般的な社会常識を持つには至らないが、家庭のような小さな生活環境を共有する特定のユーザの嗜好やユーザ同士の関係をある程度理解することができ、家族（ユーザ）からかまわれたいと欲し、また興味を持つ事柄については高度な知識を獲得しうるような存在に例える。
子供メタファの対話ロボット２は、母親メタファの生活支援ロボットシステム１と連携して、ユーザ３にとっても母親のような存在である生活支援ロボットシステム１とユーザとの関係を円滑にするために、家族間に積極的に参加して、母親の存在を身近に感じさせるような、いわば「末っ子」の役割を担うと考えられる。
対話ロボット２の音声によるヒューマンインタフェースの自然さは、音声認識における自然言語処理能力にもとづいている。しかし、音声認識能力が、ユーザ３と対話を自然に続けていくのに十分でない場合がある。したがって、ユーザ３が、対話ロボット２の対話能力が劣っていることをしっかりとしたメンタルモデルとして理解できるようにする必要がある。そこで、認知科学、教育心理学、発達心理学での分野での知見をおおいに参考にして、対話ロボット２の対話能力に３歳児程度の能力というアフォーダンスを付与する。そのために、対話制御において「連想しりとり」行動仮説を採用した。
「連想しりとり」とは、対話において、発話文の文脈と概念的に関連する別の概念を示す言語表現を用いて応答し、さらにこの応答文に対する応答文（発話文）の文脈と概念的に関連する別の概念を示す言語表現を用いて応答するという行為を連続していく行動仮説である。
すなわち、大人の会話の中から自分の知識に合致する言葉を捉えて、その会話に割り込もうとする幼児の行動は日常的に観察されるものである。このとき、幼児は、精一杯の連想や推論を働かせつつ、自分の知識の中から話題を提供して、大人を自分の話題に引き込もうとする。そして、大人の反応が自分の提供した話題を受けた内容となっているとき、いわば、連想的な意味でのしりとりとなっているとき、話題の引き込みに成功したと判断して、自分の知識を提供することにより、その話題を継続していく。
本例では、対話ロボット２のアフォーダンスを３歳児程度であると位置づけて対話制御する一方で、ユーザ３に対して提供する情報として、例えばアプライアンス４のマニュアル情報、サービスに関する詳細情報などの専門的な情報を提供できるようにする。対話ロボット２は、ユーザの居住空間の状況に関する状況情報、知識データベースの知識情報、外部の情報サーバなどから取得する情報などを蓄積し、ユーザの対話の主題に応じて、ユーザ３が気がつかなかった状況や、アプライアンス４についての専門的な知識を提供することが可能となる。これにより、対話ロボット２のアフォーダンスとして、いわゆる「おたく」的な存在が形成される。
これらにより、対話ロボット２は、「親しみやすく、役に立つ存在」であるというイメージをユーザ３に与えやすくする。
第２図は、生活支援ロボットシステム１および対話ロボット２の構成例を示す図である。
ロボットシステム１は、推論システム１１、センサ１２、分散環境行動データベース１３、イベント検出装置１５、サービス履歴データベース１７などによって構成されている。
推論システム１１は、知識データベースを備え、イベント検出装置１５がイベントを検出すると、分散環境行動データベース１３からコンテキストを取得して、居住空間内の環境、ユーザ３の動作、ユーザ３同士の相互作用（インタラクション）、ユーザ３と物との相互作用などを分析し、分析結果からユーザの行動を推論し、結論に従って実行するサービスを決定して、該当するアプライアンス４を制御する処理システムである。推論システム１１における分析結果や推論結果は、分散環境行動データベース１３に随時蓄積される。
センサ１２は、通信機能を備えて、ユーザ３の居住空間内の種々のデータを計測・収集し、収集したセンサ情報を分散環境行動データベース１３に送信する処理手段である。センサ１２は、例えば、ＴＶカメラ、マイク、床センサ、ＲＦＩＤタグ用モニタ、アプライアンス４の内部センサなどである。
センサ情報は、例えば、画像データ、音声データ、圧力遷移データ、ＩＤタグデータなどのデータである。ユーザ３が所有する物や居住空間に存在する物には、非接触型電波方式認識用の識別情報が格納されたＩＤタグ、例えばＲＦＩＤ（ＲａｄｉｏＦｒｅｑｕｅｎｃｙＩｄｅｎｔｉｆｉｃａｔｉｏｎ）タグが付与されているとする。
分散環境行動データベース１３は、センサ１２から取得したセンサ情報、推論システム１１で分析もしくは推論された結果を蓄積し管理するデータベースシステムである。
第３図に、分散環境行動データベース１３の構成例を示す。
分散環境行動データベース１３は、分散センサ情報データベース１３１、分散環境情報データベース１３２、分散動作情報データベース１３３、分散行動情報データベース１３４、人−物インタラクションデータベース１３５、人−人インタラクションデータベース１３６、固有情報データベース１３７などのデータベースシステムによって構成される。
分散センサ情報データベース１３１は、所定の時刻や契機ごとにセンサ１２から送信された各種のセンサ情報を蓄積するデータベースである。
分散環境情報データベース１３２は、物の位置、姿勢、居住空間の温湿度、アプライアンス４の内部状態などの環境情報を蓄積するデータベースである。
例えば、ユーザ３ｘが勉強机に向かって本を読んでいる場合に、センサ１２で計測されたセンサ情報（時刻、ＩＤデータ、位置、画像データ、圧力データ、サービス実行部の内部センサ情報など）が推論システム１１で分析され、以下のような環境情報が生成されて蓄積される。
「時刻、本のＩＤデータ、位置、状態（手に持たれている状態）、
時刻、勉強机の電灯のＩＤデータ、位置、状態（点灯中）、
時刻、勉強机の椅子のＩＤデータ、位置、状態（使用中）、…。」
分散動作情報データベース１３３は、ユーザ３の位置、姿勢などを示す動作情報を蓄積するデータベースである。例えば、上記の例の場合に、センサ情報が推論システム１１で分析され、以下のような動作情報が蓄積される。
「時刻、ユーザ３ｘのＩＤデータ、位置、姿勢（座位）、…」。
人−物インタラクションデータベース１３５は、人−物インタラクション情報を蓄積するデータベースである。人−物インタラクション情報は、相互作用が生じているユーザと物との組み合わせを示す情報である。例えば、上記の例の場合に、推論システム１１で環境情報および動作情報が分析され、以下のような人−物インタラクション情報が蓄積される。
「人−物インタラクション０００１：ユーザ３ｘ、本、勉強机、勉強机の椅子、電灯、…。」
人−人インタラクションデータベース１３６は、人−人インタラクション情報を蓄積するデータベースである。人−人インタラクション情報は、インタラクションが生じているユーザ同士の組み合わせを示す情報である。例えば、ユーザ３ａ（父親）とユーザ３ｂ（娘）がソファに座って一緒にテレビを見ているとする。推論システム１１で二人の動作情報（位置や姿勢など）から相互作用が分析されて、以下のような人−人インタラクション情報が蓄積される。
「人−人インタラクション００１１：ユーザ３ａ、ユーザ３ｂ」。
分散行動情報データベース１３４は、ユーザ３の行動を示す行動情報を蓄積するデータベースである。例えば、上記のユーザ３ｘの例の場合に、推論システム１１で環境情報、動作情報、人−物インタラクション情報、人−人インタラクション情報などから行動情報が推論され、以下のような行動情報が蓄積される。
「ユーザ３ｘ：読書中、勉強中、…」。
固有情報データベース１３７は、ユーザ３ごとの属性を示す固有情報を蓄積するデータベースである。固有情報は、ユーザ３の身体的特徴、性別などの他、推論システム１１によって推論された特性などの情報を含む。推論システム１１では、センサ１２で取得された、対話ロボット２とユーザ３との対話の音声データから、ユーザ３の対話の傾向などを推論し、推論結果は固有情報として蓄積される。
イベント検出装置１５は、分散環境行動データベース１３の情報の更新や、対話ロボット２からのサービス実行要求を検出すると、推論システム１１にイベント検出を通知する処理装置である。
アプライアンス４は、データ送受信機能を備えて、推論システム１１からの制御により、もしくはユーザ自身の操作により、所定のサービスを実行する家電機器である。
サービス履歴データベース１７は、推論システム１１によって実行されたサービスの履歴情報を蓄積するデータベースである。推論システム１１は、推論処理においてサービス履歴データベース１７の情報も参照する。
分散環境行動データベース１３、サービス履歴データベース１７、状況情報取得部２５、および状況記憶部２６をまとめて分散環境行動データベース１３−１として構成することもできる。
なお、ロボットシステム１の推論システム１１、分散環境行動データベース１３、イベント検出装置１５、サービス履歴データベース１７は、既知の処理手段もしくは装置を用いて実施することが可能である。
対話ロボット２は、音声認識部２１、音声合成部２２、対話制御部２３、対話戦略データベース２４、状況情報取得部２５、状況記憶部２６、知識情報取得部２７、知識データベース２８、実行要求部２９、ロボット間通信部２１０などで構成されている。
音声認識部２１は、ユーザ３が発話した音声データを入力し、入力した音声データの内容を認識してユーザ発話データ（発話文データ）に変換する処理手段である。
音声合成部２２は、対話制御部２３によって生成されたロボット発話データ（ユーザの会話に対する応答文データ、ユーザへの問いかけのための発話文データなど）を音声データに変換して発話する処理手段である。
対話制御部２３は、状況記憶部２６に格納された情報から環境やユーザ３の状況を解析し、解析した状況にもとづいてユーザ３に提供するサービスを選択し、対話戦略データベース２４の連想情報にもとづいてユーザの状況と関連する概念を特定し、その概念を示す言語表現を用いてロボット発話データを生成する処理と、生成したロボット発話データに対してユーザが応答したユーザ発話データ（応答文データ）の文脈を推論し、対話戦略データベース２４の連想情報を参照してユーザ発話データの文脈がロボット発話データの文脈と概念的に関連しているか否かを判定する処理とを行う処理手段である。
また、対話制御部２３は、ユーザ発話データの文脈とロボット発話データの文脈とが関連すると判定した場合に、知識データベース２８から、選択したサービスに関する知識情報を抽出し、抽出した知識情報を用いてロボット発話データを生成する。
対話戦略データベース２４は、対話ロボット２がユーザ３との対話を推論してユーザ３を自己の対話へ引き込むための応答を「連想しりとり」により生成するための連想情報を、蓄積するデータベースである。
連想情報は、対話の文脈から抽出される主題となる概念について、概念同士の関連の度合いを記述する情報である。連想情報は、前記概念同士の同義性、類義性、または共起性の度合いを示す情報を用いている。連想情報は、対話ロボット２に設定されるアフォーダンスを考慮して付与される。例えば、対話ロボット２に、”３歳児”のアフォーダンスを設定する場合には、３歳児の推論や連想の能力に対応させた概念モデルにもとづいて概念および連想情報を定義する。
状況情報取得部２５は、分散環境行動データベース１３から、環境情報、動作情報、行動情報、固有情報などの情報を取得し、状況記憶部２６に格納する処理手段である。
知識情報取得部２７は、所定の通信プロトコル、例えばＴＣＰ／ＩＰなどによりネットワーク８上の情報サーバ９から選択されたサービスに関する知識情報を取得し、知識データベース２８に蓄積する処理手段である。これにより、ロボットシステム１で蓄積された情報以外に、ネットワーク８上に存在する大量かつ多様な情報にアクセスすることが可能となり、ユーザ３に専門的な情報や最新の情報などを提供することができる。知識データベース２８には、例えば、アプライアンス４またはアプライアンス４で実行されるサービスに関連する情報が蓄積される。
知識データベース２８は、アプライアンス４またはアプライアンス４で実行されるサービスに関する知識情報、例えば、アプライアンスのマニュアル情報などを蓄積するデータベースである。
実行要求部２９は、対話制御部２３が選択したサービス実行要求をロボットシステム１へ送信する処理手段である。また、実行要求部２９は、アプライアンス４へ直接サービス実行要求を送信してもよい。
ロボット間通信部２１０は、対話制御部２３で選択されたサービスとして、ロボットシステム１以外のロボットシステム１’と協働する別の対話ロボット２’と、所定の通信プロトコルにより、ユーザ３の状況や選択されたサービスに関する情報を送受信する処理手段である。
本例では、対話ロボット２の音声認識部２１、音声合成部２２、対話制御部２３は、擬人化音声対話エージェントツールキット（ＧａｌａｔｅａＴｏｏｌｋｉｔ）により実現する（例えば、ｈｔｔｐ：／／ｈｉｌ．ｔ．ｕ−ｔｏｋｙｏ．ａｃ．ｊｐ／〜ｇａｌａｔｅａ／ｇａｌａｔｅａ−ｊｐ．ｈｔｍｌ、Ｐｒｅｎｄｉｎｇｅｒ，Ｈｅｌｍｕｔ；Ｉｓｈｉｚｕｋａ，Ｍｉｔｓｕｒｕ（Ｅｄｓ．）；”Ｌｉｆｅ−ＬｉｋｅＣｈａｒａｃｔｅｒｓＴｏｏｌｓ，ＡｆｆｅｃｔｉｖｅＦｕｎｃｔｉｏｎｓ，ａｎｄＡｐｐｌｉｃａｔｉｏｎｓＳｅｒｉｅｓ：ＣｏｇｎｉｔｉｖｅＴｅｃｈｎｏｌｏｇｉｅｓ”；ｐｐ．１８７−２１３；２００４；ＩＳＢＮ：３−５４０−００８６７−５参照）。
以下、本発明の処理の流れを、いくつかの場合に分けて説明する。
〔ユーザの会話からサービスを提案する場合〕
第４図は、ユーザの会話からサービスを選択する場合の対話ロボットの処理の流れを示す図である。対話ロボット２は、ユーザ３同士の会話を検出し、適切なサービスを提案する場合は、以下のような処理を行う。
ステップＳ１：音声データ認識処理
対話ロボット２の音声認識部２１により、ユーザ３同士の会話を検出してユーザの発話を入力し、その音声データを認識してユーザ発話データに変換する。
ステップＳ２：状況情報取得処理
並行して、状況情報取得部２５では、分散環境行動データベース１３から所定の状況情報を取得して状況記憶部２６に格納する。
ステップＳ３：対話・状況推論処理
対話制御部２３では、ユーザ発話データ（ユーザの会話）を解析して文脈を推論する。そして、ユーザ発話データの文脈および状況情報をもとにユーザの状況を推論し、実行可能なサービスの中から最適なサービスを選択する。さらに、対話戦略データベース２４の連想情報を参照して、ユーザ発話データの文脈から連想される概念を抽出し、この概念を示す言語表現を用いてロボット発話データ（対話ロボットの応答）を作成する。
ステップＳ４：音声合成処理
そして、音声合成部２２により、ロボット発話データを音声合成して、ユーザ３に応答する。
ステップＳ５：音声データ認識処理
音声認識部２１で、ステップＳ４で発話した応答に対するユーザ３の音声データを入すると、この音声データを音声認識して、新たなユーザ発話データ（ユーザの新たな発話）に変換する。
ステップＳ６：対話引き込み判定処理
対話制御部２３では、新たなユーザ発話データの文脈を推論し、ユーザ３を対話に引き込むことができたか否かを判定する。対話引き込みの判定では、新たなユーザ発話データの文脈が、抽出した概念の連想情報の範囲内である場合、またはロボット発話データ（応答）に対する承諾である場合に、対話引き込みに成功したと判定する。そして、実行するサービスが特定されていれば、ステップＳ７の処理へ進み、実行するサービスが特定されていなければ、応答文データを作成して（ステップＳ６−２）、ステップＳ４の処理へ進む。
また、新たなユーザ発話データの文脈が抽出した概念の連想情報の範囲外である場合、またはロボット発話データ（応答）に対する不承諾である場合に、対話引き込みに失敗したと判定する。この場合、連想情報を参照して別の概念を抽出し、新しい連想によって話題を修正し（ステップＳ６−１）、修正した話題を示す言語表現を用いて応答文データを生成し（ステップＳ６−２）、ステップＳ４の処理へ進む。
なお、対話制御部２３では、音声認識部２１から、所定時間内に応答文データを受け取らなかった場合に、対話引き込みに失敗したと判定する。
ステップＳ７：サービス実行処理
実行要求部２９では、選択されたサービスの実行要求をロボットシステム１に送信する。または、該当するアプライアンス４へ直接送信する。
〔ユーザの状況からサービスを提案する場合〕
第５図は、ユーザの状況からサービスを選択する場合の対話ロボットの処理の流れを示す図である。対話ロボット２は、ロボットシステム１から取得したユーザ３の状況にもとづいて適切なサービスを選択する場合は、以下のような処理を行う。
ステップＳ１１：対話ロボット２の状況情報取得部２５では、分散環境行動データベース１３から所定の状況情報を取得して状況記憶部２６に格納する。
ステップＳ１２：対話制御部２３では、状況記憶部２６の状況情報からユーザ３の状況を解析し、実行可能なサービスの中から最適なサービスを選択する。さらに、対話戦略データベース２４の連想情報を参照して、ユーザ３の状況から連想される概念を抽出し、この概念を示す言語表現を用いてロボット発話データ（対話ロボットの問いかけ）を作成する。
ステップＳ１３：そして、音声合成部２２により、ロボット発話データを音声合成して、ユーザ３に発話する。
ステップＳ１４：音声認識部２１では、ロボット発話データに対するユーザ３の応答の音声データを入力し、その音声データを認識してユーザ発話データ（ユーザの応答）に変換する。
ステップＳ１５：対話制御部２３では、ユーザの応答の文脈を推論し、ユーザ３の対話引き込みに成功したかどうかを判定する。対話引き込みに成功したと判定した場合には、実行するサービスが特定されていればステップＳ１６の処理へ進み、実行するサービスが未特定であれば応答文データを作成して（ステップＳ１５−２）、ステップＳ１３の処理へ進む。一方、対話引き込みに失敗した場合には、新しい連想によって話題を修正し（ステップＳ１５−１）、応答文データを作成して（ステップＳ１５−２）、ステップＳ１３の処理へ進む。
ステップＳ１６：そして、対話引き込みに成功した場合には、実行要求部２９により、選択されたサービスの実行要求をロボットシステム１または該当するアプライアンス４へ送信する。
〔ユーザの会話から情報を提供する場合〕
第６図は、ユーザの会話からサービスに関連する知識情報を提供する場合の対話ロボットの処理の流れを示す図である。
ステップＳ２１：対話ロボット２は、音声認識部２１により、ユーザ３同士の会話を検出してユーザの発話の音声データを入力し、その音声データを認識してユーザ発話データ（ユーザの会話）に変換する。
ステップＳ２２：並行して、状況情報取得部２５では、分散環境行動データベース１３から所定の状況情報を取得して状況記憶部２６に格納する。
ステップＳ２３：対話制御部２３では、状況情報からユーザ３の状況およびユーザ３の会話の文脈をそれぞれ解析する。そして、ユーザ３の会話の文脈および状況をもとに実行可能なサービスの中から最適なサービスを選択する。さらに、対話戦略データベース２４の連想情報を参照して、ユーザ３の会話の文脈から連想される概念を抽出し、この概念を示す言語表現を用いてロボット発話データ（ロボットの応答）を作成する。
ステップＳ２４：音声合成部２２により、ロボット発話データを音声合成して、ユーザ３に応答する。
ステップＳ２５：音声認識部２１で、ステップＳ２４で発話した応答に対するユーザ３の音声データを入力し、音声データを音声認識して、新たなユーザ発話データ（ユーザの応答）に変換する。
ステップＳ２６：対話制御部２３では、新たなユーザの応答の文脈を推論し、ユーザ３の対話引き込みに成功したかどうかを判定する。対話引き込みに成功したと判定した場合には、実行するサービスが特定されていればステップＳ２７の処理へ進み、実行するサービスが未特定であれば応答文データを作成して（ステップＳ２６−２）、ステップＳ２４の処理へ進む。一方、対話引き込みに失敗した場合には、新しい連想によって話題を修正し（ステップＳ２６−１）、応答文データを作成して（ステップＳ２６−２）、ステップＳ２４の処理へ進む。
ステップＳ２７：そして、対話引き込みに成功した場合には、対話制御部２３では、知識データベース２８から選択したサービスに関連する知識情報を抽出する。
ステップＳ２８：さらに、対話制御部２３は、抽出した知識情報を用いてロボット発話データ（知識情報の提供）を生成する。
ステップＳ２９：音声合成部２２では、ロボット発話データを音声合成して発話する。なお、音声合成部２２では、直接、抽出された知識情報を音声データに変換して発話するようにしてもよい。
以上で説明した処理例は、いずれかの処理を組み合わせて処理されてもよい。また、各処理例において、対話制御部２３は、実行要求部２９によりサービスの実行要求を送信する前に、実行するサービスの許否を問い合わせるロボット発話データを生成し、ユーザに問い合わせるようにしてもよい。
また、サービスの実行や知識情報の提供において、別のロボットシステム１’と協働する対話ロボット２’との連携が必要となった場合には、ロボット間通信部２１０では、ユーザ３の状況や選択されたサービスに関する情報の送受信を行う。
以下、本発明の具体例を説明する。
第１の具体例では、第１図に示すように、ユーザ３ａ（父親）とユーザ３ｂ（娘）とが居間（ｒｏｏｍ１）で会話をしているとする。
対話ロボット２の音声認識部２１では、居間でユーザ同士（父親と娘）が、以下のような会話している音声を入力し、音声データを音声認識して発話文データに変換する。
父親の発話：「コトシノハンシンハ、…。」
娘の発話：「…カツ…。」
また、状況情報取得部２５は、分散環境行動データベース１３から、固有情報、環境情報、行動情報などの所定の情報を取得して状況記憶部２６に格納する。
対話制御部２３は、これらの情報により、ユーザ３ａ（父親）とユーザ３ｂ（娘）が居間（ｒｏｏｍ１）でくつろいで会話している状況、ユーザ３ｃ（母親）が台所（ｒｏｏｍ２）で後片付け中である状況などがわかる。
また、対話制御部２３は、音声認識されたユーザの発話文データの文脈を推論する。発話文データに含まれる＜ハンシン、カツ＞が＜阪神、勝つ＞であると分析し、会話の主題の概念が＜野球＞であると推論する。そして、対話戦略データベース２４の連想情報を参照して、概念＜野球＞、関連の度合いが強い概念＜プロ野球＞を特定する。そして、ユーザ３の会話の文脈や状況から、＜電子テレビ番組表から野球中継番組抽出＞、＜野球中継番組があればテレビをつける＞というサービスを選択する。
また、特定した概念を表す言語表現（例えば、野球）を用いて、ロボット発話データ「野球の話？」を生成する。音声合成部２２では、このデータを音声合成して発話する。これにより、対話ロボット２は、「野球の話？」と問いかけて、父親と娘の会話に参加する。
音声認識部２１は、引き続きロボット発話データに対するユーザの発話があるかどうかを検出する。ユーザが発話していれば、その音声データを認識して新たなユーザ発話データに変換する。対話制御部２３は、例えば、新たなユーザの発話が「プロ野球よ。」であれば、その文脈は連想される範囲内であるとして、ユーザ３を対話に引き込むことに成功したと判断する。また、新たなユーザの発話が「そうだよ。」であれば、その文脈が肯定的な返事であるとして、対話の引き込みに成功したと判断する。
一方、新たなユーザの発話が「デパートよ。」であれば、その文脈は連想される範囲内ではなく、肯定的な返事のいずれでもないので、対話への引き込みに失敗したと判断する。そして、対話制御部２３は、対話の引き込みに成功したと判断した場合には、選択したサービスを実行する。ここでは、知識データベース２８で電子テレビ番組表を検索する。
ここで、知識データベース２８に電子テレビ番組表が蓄積されていなければ、知識情報取得部２７は、電子テレビ番組表を提供する情報サーバ９のＵＲＬを知識データベース２８から取得し、ネットワーク８を通じて情報サーバ９から電子テレビ番組表を取得し、知識データベース２８に蓄積する。
対話制御部２３は、知識データベース２８に蓄積されたテレビ番組表から野球中継番組の情報を抽出し、例えば、「阪神−中日戦」試合の中継番組が現在放送中であることがわかるとする。対話制御部２３は、この野球中継番組の情報（知識情報）から、新たなロボット発話データ「今、阪神と中日の試合をやっているよ。」を生成する。
また、対話制御部２３は、状況記憶部２６に格納された情報から、ユーザ３ｃ（母親）が阪神のファンであるという固有情報を抽出する。この固有情報（状況情報）から、新たなロボット発話データ「お母さんも好きだよね。」を生成する。
さらに、実行要求部２９では、選択されたサービスの実行要求をロボットシステム１へ送信する。ロボットシステム１のイベント検出装置１５では、対話ロボット２からのサービス実行要求を検出して、推論システム１１へ通知する。
第２の具体例では、ユーザ３ｃ（母親）が、食事の後片付け中にアプライアンス４の一つである食器洗い機が作動せずに困っている状況であるとする。
台所（ｒｏｏｍ２）の対話ロボット２の状況情報取得部２５は、分散環境行動データベース１３から所定の情報を取得し、状況記憶部２６に格納する。
対話制御部２３は、状況記憶部２６に格納された情報から、状況を解析し、＜故障原因を調べて通知する＞というサービスを選択する。
また、対話戦略データベース２４を参照して、状況から連想される言語表現を用いてロボット発話データ「食器洗い機が、変なの？」を生成し、音声合成部２２により音声合成して問いかける。
その後に、対話ロボット２の音声認識部２１で、ロボットとの問いかけに対する応答「どうしてかしら。」を入力すると、対話制御部２３では、母親の応答の文脈から、対話引き込みに成功したと判定し、選択したサービスを実行する。
すなわち、対話制御部２３は、状況記憶部２６の環境情報から食器洗い機の状態を取得する。知識情報取得部２７は、知識データベース２８から該当するアプライアンス（食器洗い機）４の製造元の情報サーバ９のＵＲＬを取得し、その製造元の情報サーバ９から、食器洗い機の状態をキーに故障原因に関する情報を取得する。対話制御部２３は、故障原因に関する情報（知識情報）をもとにロボット発話データ「故障の原因がわかったよ。…」を作成し、音声合成部２２での音声合成により発話する。
第３の具体例では、別の居住空間で別の生活支援ロボットシステム１’および対話ロボット２’が設定されているとする。
対話ロボット２は、ユーザ３ｘ（結婚して独立した娘）との対話から、娘がユーザ３ｙ（母親）の助言を必要としている状況であると推論し、サービス＜母親のテレビ電話を娘へつなぐ＞を選択したとする。対話ロボット２の対話制御部２３で、対話引き込みが成功したと判定すると、ロボット間通信部２１０は、対話ロボット２’のロボット間通信部２１０’へサービス実行要求を送信する。
対話ロボット２’は、ユーザ３ｙ（母親）へ、ロボット発話データ「○○さんが、連絡を待ってるよ。」と発話して、アプライアンス（テレビ電話）４に、ユーザ３ｘの電話番号と通話指示を送信する。
以上の説明のように、本発明は、対話ロボット２が、ユーザ同士の会話やユーザの状況を「連想しりとり」行動仮説にもとづいて推論してユーザと対話を進めることにより、ロボットシステム１で提供できるサービスであってユーザが気がついていなかったサービスや関連する知識情報を、ユーザの状況に応じて提供することができる。
本発明の対話ロボット２は、コンピュータによって読み取られインストールされて実行されるプログラムとして実現することも可能である。本発明を実現するプログラムは、コンピュータが読み取り可能な記録媒体に格納することができ、これらの記録媒体に記録して提供され、または、通信インタフェースを介して種々の通信網を利用した送受信により提供される。

本発明は、ユビキタス環境を前提として自律的に人間の生活を支援する生活支援ロボットシステムにおける、高度な状況対応能力を備えたユーザインタフェース機能を実現する対話システムに適している。

Claims

ユーザの生活を支援するためにサービスを実行するアプライアンスを自律的に制御する生活支援ロボットシステムと、前記生活支援ロボットシステムと協働して対話ロボットの音声によりユーザと対話する対話システムであって、
前記生活支援ロボットシステムは、
所定の空間内で計測されたセンサ情報をもとに前記空間内の環境とユーザの行動とを推論してアプライアンスを制御する推論システムと、
前記推論システムによる推論結果である環境情報および行動情報を蓄積する分散環境行動データベースとを備え、
前記対話ロボットは、
概念同士の関連の度合いを記述する連想情報を蓄積する対話戦略データベースと、
当該対話ロボット内で生成されたロボット発話データを音声データに変換して発話する音声合成手段と、
ユーザの音声データの内容を認識してユーザ発話データに変換する音声認識手段と、
前記分散環境行動データベースから前記環境情報および行動情報を取得して状況記憶手段に格納する状況情報取得手段と、
前記環境情報および行動情報からユーザの状況を解析し、前記状況にもとづいて前記ユーザに提供するサービスを選択し、前記連想情報にもとづいて前記状況と関連する概念を特定し、前記概念を示す言語表現を用いてロボット発話データを生成する処理と、前記ロボット発話データに対するユーザ発話データの文脈を推論し、前記連想情報を参照して前記ユーザ発話データの文脈が前記ロボット発話データの文脈と概念的に関連しているか否かを判定する処理とを行う対話制御手段と、
前記対話制御手段により前記ユーザ発話データの文脈が前記ロボット発話データの文脈と関連すると判定された場合に、前記サービスの実行要求を前記生活支援ロボットシステムもしくは前記アプライアンスへ送信する実行要求手段とを備える
ことを特徴とする対話システム。
前記対話ロボットは、
前記生活支援ロボットシステムと独立した実体的な装置として構成される
ことを特徴とする請求の範囲第１項に記載の対話システム。
前記対話ロボットは、
前記選択されたサービスとして、他の対話ロボットと、所定の通信プロトコルにより、前記ユーザの状況または前記選択されたサービスに関する情報を送受信するロボット間通信手段を備える
ことを特徴とする請求の範囲第１項に記載の対話システム。
前記対話ロボットは、
アプライアンスまたは前記アプライアンスで実行されるサービスに関する知識情報を蓄積する知識データベースを備え、
前記対話制御手段は、前記ユーザ発話データの文脈が前記ロボット発話データの文脈と関連すると判定した場合に、前記知識データベースから前記選択されたサービスに関する知識情報を抽出し、前記抽出した知識情報を用いてロボット発話データを生成する
ことを特徴とする請求の範囲第１項に記載の対話システム。
前記対話ロボットは、
所定の通信プロトコルによりネットワーク上の他の情報提供サーバから前記選択されたサービスに関する知識情報を取得し、前記知識データベースに蓄積する知識情報取得手段を備える
ことを特徴とする請求の範囲第４項に記載の対話システム。
ユーザの生活を支援するためにサービスを実行するアプライアンスを自律的に制御する生活支援ロボットシステムと、前記生活支援ロボットシステムと協働して対話ロボットの音声によりユーザと対話する対話システムであって、
前記生活支援ロボットシステムは、
所定の空間内で計測されたセンサ情報をもとに前記空間内の環境とユーザの行動とを推論してアプライアンスを制御する推論システムと、
前記推論システムによる推論結果である環境情報および行動情報を蓄積する分散環境行動データベースとを備え、
前記対話ロボットは、
概念同士の関連の度合いを記述する連想情報を蓄積する対話戦略データベースと、
当該対話ロボット内で生成されたロボット発話データを音声データに変換して発話する音声合成手段と、
ユーザの音声データの内容を認識してユーザ発話データに変換する音声認識手段と、
前記分散環境行動データベースから前記環境情報および行動情報を取得して状況記憶手段に格納する状況情報取得手段と、
前記ユーザ発話データの文脈を解析し、前記環境情報および行動情報から状況を解析し、前記ユーザ発話データの文脈および状況にもとづいてユーザに提供するサービスを選択し、前記連想情報にもとづいて前記ユーザ発話データの文脈と関連する概念を特定し、前記概念を示す言語表現を用いてロボット発話データを生成する処理と、前記ロボット発話データに対する新たなユーザ発話データの文脈を推論し、前記連想情報を参照して前記新たなユーザ発話データの文脈が前記ロボット発話データの文脈と概念的に関連しているか否かを判定する処理とを行う対話制御手段と、
前記対話制御手段により前記新たなユーザ発話データの文脈が前記ロボット発話データの文脈と関連すると判定された場合に、前記サービスの実行要求を前記生活支援ロボットシステムもしくは前記アプライアンスへ送信する実行要求手段とを備える
ことを特徴とする対話システム。
前記対話ロボットは、
前記生活支援ロボットシステムと独立した実体的な装置として構成される
ことを特徴とする請求の範囲第６項に記載の対話システム。
前記対話ロボットは、
前記選択されたサービスとして、他の対話ロボットと、所定の通信プロトコルにより、前記ユーザの状況または前記選択されたサービスに関する情報を送受信するロボット間通信手段を備える
ことを特徴とする請求の範囲第６項に記載の対話システム。
前記対話ロボットは、
アプライアンスまたは前記アプライアンスで実行されるサービスに関する情報を蓄積する知識データベースを備え、
前記対話制御手段は、前記新たなユーザ発話データの文脈が前記ロボット発話データの文脈と関連すると判定した場合に、前記知識データベースから前記選択されたサービスに関する知識情報を抽出し、前記抽出した知識情報を用いてロボット発話データを生成する
ことを特徴とする請求の範囲第６項に記載の対話システム。
前記対話ロボットは、
所定の通信プロトコルによりネットワーク上の他の情報提供サーバから前記選択されたサービスに関する知識情報を取得し、前記知識データベースに蓄積する知識情報取得手段を備える
ことを特徴とする請求の範囲第９項に記載の対話システム。
ユーザの生活を支援するためにサービスを実行するアプライアンスを自律的に制御する生活支援ロボットシステムと協働して、ユーザと音声により対話を行う対話ロボットであって、
概念同士の関連の度合いを記述する連想情報を蓄積する対話戦略データベースと、
当該対話ロボット内で生成されたロボット発話データを音声データに変換して発話する音声合成手段と、
ユーザの音声データの内容を認識してユーザ発話データに変換する音声認識手段と、
生活支援ロボットシステムにおいて所定の空間内で計測されたセンサ情報から推論された環境情報および行動情報を蓄積する分散環境行動データベースから、前記環境情報および行動情報を取得して状況記憶手段に格納する状況情報取得手段と、
前記環境情報および行動情報からユーザの状況を解析し、前記状況にもとづいて前記ユーザに提供するサービスを選択し、前記連想情報にもとづいて前記状況と関連する概念を特定し、前記概念を示す言語表現を用いてロボット発話データを生成する処理と、前記ロボット発話データに対するユーザ発話データの文脈を推論し、前記連想情報を参照して前記ユーザ発話データの文脈が前記ロボット発話データの文脈と概念的に関連しているか否かを判定する処理とを行う対話制御手段と、
前記対話制御手段により前記ユーザ発話データの文脈が前記ロボット発話データの文脈と関連すると判定された場合に、前記サービスの実行要求を前記生活支援ロボットシステムもしくは前記アプライアンスへ送信する実行要求手段とを備える
ことを特徴とする対話ロボット。
前記選択されたサービスとして、他の対話ロボットと、所定の通信プロトコルにより、前記ユーザの状況または前記選択されたサービスに関する情報を送受信するロボット間通信手段を備える
ことを特徴とする請求の範囲第１１項に記載の対話ロボット。
アプライアンスまたは前記アプライアンスで実行されるサービスに関する知識情報を蓄積する知識データベースを備え、
前記対話制御手段は、前記ユーザ発話データの文脈が前記ロボット発話データの文脈と関連すると判定した場合に、前記知識データベースから前記選択されたサービスに関する知識情報を抽出し、前記抽出した知識情報を用いてロボット発話データを生成する
ことを特徴とする請求の範囲第１１項に記載の対話ロボット。
所定の通信プロトコルによりネットワーク上の他の情報提供サーバから前記選択されたサービスに関する知識情報を取得し、前記知識データベースに蓄積する知識情報取得手段を備える
ことを特徴とする請求の範囲第１３項に記載の対話ロボット。
ユーザの生活を支援するためにサービスを実行するアプライアンスを自律的に制御する生活支援ロボットシステムと協働して、ユーザと音声により対話を行う対話ロボットであって、
概念同士の関連の度合いを記述する連想情報を蓄積する対話戦略データベースと、
当該対話ロボット内で生成されたロボット発話データを音声データに変換して発話する音声合成手段と、
ユーザの音声データの内容を認識してユーザ発話データに変換する音声認識手段と、
生活支援ロボットシステムにおいて所定の空間内で計測されたセンサ情報から推論された環境情報および行動情報を蓄積する分散環境行動データベースから、前記環境情報および行動情報を取得して状況記憶手段に格納する状況情報取得手段と、
前記ユーザ発話データの文脈を解析し、前記環境情報および行動情報から状況を解析し、前記ユーザ発話データの文脈および状況にもとづいてユーザに提供するサービスを選択し、前記連想情報にもとづいて前記ユーザ発話データの文脈と関連する概念を特定し、前記概念を示す言語表現を用いてロボット発話データを生成する処理と、前記ロボット発話データに対する新たなユーザ発話データの文脈を推論し、前記連想情報を参照して前記新たなユーザ発話データの文脈が前記ロボット発話データの文脈と概念的に関連しているか否かを判定する処理とを行う対話制御手段と、
前記対話制御手段により前記新たなユーザ発話データの文脈が前記ロボット発話データの文脈と関連すると判定された場合に、前記サービスの実行要求を前記生活支援ロボットシステムもしくは前記アプライアンスへ送信する実行要求手段とを備える
ことを特徴とする対話ロボット。
前記選択されたサービスとして、他の対話ロボットと、所定の通信プロトコルにより、前記ユーザの状況または前記選択されたサービスに関する情報を送受信するロボット間通信手段を備える
ことを特徴とする請求の範囲第１５項に記載の対話ロボット。
アプライアンスまたは前記アプライアンスで実行されるサービスに関する情報を蓄積する知識データベースを備え、
前記対話制御手段は、前記新たなユーザ発話データの文脈が前記ロボット発話データの文脈と関連すると判定した場合に、前記知識データベースから前記選択されたサービスに関する知識情報を抽出し、前記抽出した知識情報を用いてロボット発話データを生成する
ことを特徴とする請求の範囲第１５項に記載の対話ロボット。
所定の通信プロトコルによりネットワーク上の他の情報提供サーバから前記選択されたサービスに関する知識情報を取得し、前記知識データベースに蓄積する知識情報取得手段を備える
ことを特徴とする請求の範囲第１７項に記載の対話ロボット。
請求の範囲第１１項に記載の対話ロボットとして、コンピュータを機能させるための対話ロボットプログラム。
請求の範囲第１５項に記載の対話ロボットとして、コンピュータを機能させるための対話ロボットプログラム。
請求の範囲第１９項に記載の対話ロボットプログラムを格納した、コンピュータが読み取り可能な記録媒体。
請求の範囲第２０項に記載の対話ロボットプログラムを格納した、コンピュータが読み取り可能な記録媒体。