WO2019054009A1

WO2019054009A1 - 情報処理装置、情報処理方法、およびプログラム

Info

Publication number: WO2019054009A1
Application number: PCT/JP2018/024544
Authority: WO
Inventors: 早紀横山
Original assignee: ソニー株式会社
Priority date: 2017-09-15
Filing date: 2018-06-28
Publication date: 2019-03-21

Abstract

【課題】より柔軟かつ効果的な情報提示を実現する。【解決手段】ユーザに対する情報提示において出力文の出力を制御する出力制御部、を備え、前記出力制御部は、前記出力文の出力に際し取得された出力コンテキストに基づいて、前記出力文に係る出力表現を動的に制御する、報処理装置が提供される。また、プロセッサが、ユーザに対する情報提示において出力文の出力を制御すること、を含み、前記制御することは、前記出力文の出力に際し取得された出力コンテキストに基づいて、前記出力文に係る出力表現を動的に制御すること、をさらに含む、情報処理方法が提供される。

Description

情報処理装置、情報処理方法、およびプログラム

　本開示は、情報処理装置、情報処理方法、およびプログラムに関する。

　近年、ユーザに対し音声や視覚情報を用いて情報提示を行う種々の装置が普及している。また、上記のような情報提示に係るユーザの利便性を向上させる技術も開発されている。例えば、特許文献１には、ユーザの注視状態などに基づいて情報の提示レベルを選択する技術が開示されている。

特開２０１１－２５３３７５号公報

　しかし、特許文献１に記載の技術は、注視状態などに基づいて予め定められた提示レベルの選択を行うに留まっている。一方、情報提示の有益性は、注視状態のほかにも種々の要因により左右することが想定される。また上記の要因に応じた多様な出力表現が求められる。

　そこで、本開示では、より柔軟かつ効果的な情報提示を実現することが可能な、新規かつ改良された情報処理装置、情報処理方法、およびプログラムを提案する。

　本開示によれば、ユーザに対する情報提示において出力文の出力を制御する出力制御部、を備え、前記出力制御部は、前記出力文の出力に際し取得された出力コンテキストに基づいて、前記出力文に係る出力表現を動的に制御する、情報処理装置が提供される。

　また、本開示によれば、プロセッサが、ユーザに対する情報提示において出力文の出力を制御すること、を含み、前記制御することは、前記出力文の出力に際し取得された出力コンテキストに基づいて、前記出力文に係る出力表現を動的に制御すること、をさらに含む、情報処理方法が提供される。

　また、本開示によれば、コンピュータを、ユーザに対する情報提示において出力文の出力を制御する出力制御部、を備え、前記出力制御部は、前記出力文の出力に際し取得された出力コンテキストに基づいて、前記出力文に係る出力表現を動的に制御する、情報処理装置、として機能させるためのプログラムが提供される。

　以上説明したように本開示によれば、より柔軟かつ効果的な情報提示を実現することが可能となる。

　なお、上記の効果は必ずしも限定的なものではなく、上記の効果とともに、または上記の効果に代えて、本明細書に示されたいずれかの効果、または本明細書から把握され得る他の効果が奏されてもよい。

本開示の一実施形態に係る出力制御の概要について説明するための図である。同実施形態に係る情報処理システムの構成例を示すブロック図である。同実施形態に係る情報処理端末の機能構成例を示すブロック図である。同実施形態に係る情報処理サーバの機能構成例を示すブロック図である。同実施形態に係る他のユーザの状態を含む出力コンテキストに基づく出力制御の一例を示す図である。同実施形態に係る過去の出力文の情報を含む出力コンテキストに基づく出力制御の一例を示す図である。同実施形態に係る他のアプリケーションから取得した情報を含む出力コンテキストに基づく出力制御の一例を示す図である。同実施形態に係る出力ニュアンスの制御について説明するための図である。同実施形態に係る出力ニュアンスの制御について説明するための図である。同実施形態に係る依頼ユーザに関連する出力コンテキストに基く出力制御について説明するための図である。同実施形態に係る対象ユーザに係る出力コンテキストに基く出力制御について説明するための図である。同実施形態に係る出力コンテキストの変化に基づく出力制御について説明するための図である。同実施形態に係る出力コンテキストの変化に基づく出力制御について説明するための図である。同実施形態に係る複数のユーザの出力コンテキストに基づく出力制御について説明するための図である。同実施形態に係る複数のユーザの出力コンテキストに基づく出力制御について説明するための図である。同実施形態に係る情報処理サーバによる出力制御の流れを示すフローチャートである。本開示の一実施形態に係るハードウェア構成例を示す図である。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　なお、説明は以下の順序で行うものとする。
　１．実施形態
　　１．１．概要
　　１．２．システム構成例
　　１．３．情報処理端末１０の機能構成例
　　１．４．情報処理サーバ２０の機能構成例
　　１．５．出力制御の詳細
　　１．６．出力制御の流れ
　２．ハードウェア構成例
　３．まとめ

　＜１．実施形態＞
　＜＜１．１．概要＞＞
　近年、ユーザに対し情報提示を行う種々の装置が普及している。上記のような装置には、例えば、音声発話や視覚情報を用いてユーザに情報を提示するエージェント装置が挙げられる。エージェント装置は、例えば、ニュースやメッセージの出力、ユーザの問い合わせに対する応答などを、音声発話や視覚情報の表示などにより行うことができる。

　また、情報提示に係るユーザの利便性を向上させるための技術も多く開発されている。例えば、上述した特許文献１に記載の技術では、ユーザの注視状態に応じて提示する情報のレベル（情報量、モーダル）を制御することで、ユーザにとってより知覚の容易い情報提示を行うことができる。

　しかし、提示する情報の有益性は、注視状態のほかにも種々の要因により左右されることが想定される。上記の要因には、例えば、ユーザの属性、行動や感情などの状態、嗜好や特性、周囲環境の状態などが挙げられる。

　例えば、ユーザが画面を注視している場合であっても、ユーザの状態や嗜好によっては、簡潔な出力文を出力した方がよい場合が考えられる。また、より優れた情報提示を実現するためには、情報量のほか、情報の質や表現などを状況に応じて動的に変化させることが求められる。

　本開示の一実施形態に係る情報処理装置、情報処理方法、およびプログラムは、上記の点に着目して発想されたものであり、より柔軟かつ効果的な情報提示を実現することを可能とする。このために、本実施形態に係る情報処理方法を実現する情報処理装置は、ユーザに対する出力文の出力に際し取得された出力コンテキストに基づいて、当該出力文に係る出力表現を動的に制御すること、を特徴の一つとする。

　ここで、上記の出力コンテキストとは、出力文を出力する際の種々の状況を指す。本実施形態に係る出力コンテキストには、例えば、ユーザの属性、嗜好、特性、行動、状態、スケジュールなどを示すユーザコンテキストや、周囲環境の状態を示す環境コンテキストが含まれる。

　図１は、本実施形態に係る出力制御の概要について説明するための図である。図１の上部には、予定の問い合わせに係るユーザ発話ＵＯ１ａを行うユーザＵ１と、ユーザ発話ＵＯ１ａに対する応答を音声発話ＳＯ１ａにより実行する情報処理端末１０が示されている。

　図１の上部には、ユーザＵ１が比較的時間に余裕の状態である場合の一例が示されている。この際、本実施形態に係る情報処理端末１０は、情報処理サーバ２０による制御に基づいて、予定を詳細に説明する音声発話ＳＯ１ａを出力することができる。

　一方、図１の下部には、ユーザＵ１が急いでいる状態、すなわち時間に余裕がない状態である場合の一例が示されている。この際、本実施形態に係る情報処理端末１０は、情報処理サーバ２０による制御に基づいて、ユーザ発話ＵＯ１ａを行ったユーザに対し、予定を簡潔に説明する音声発話ＳＯ１ｂを出力することができる。また、情報処理端末１０は、情報の完全性を保つために、詳細な予定情報を例えばユーザＵ１が所持するスマートフォンなどに転送することも可能である。

　このように、本実施形態に係る情報処理端末１０および情報処理サーバ２０によれば、同一のユーザによる同一の問い合わせに対しても、状況に応じたより効果的な出力文の提示を行うことが可能となる。

　なお、図１に示す一例の場合、本実施形態に係る情報処理サーバ２０は、例えば、情報処理端末１０が撮像した画像情報に基づいて、ユーザＵ１が急いでいることを検出してもよい。また、情報処理サーバ２０は、情報処理サーバ２０が収集したユーザ発話ＵＯ１ａに関する音情報を解析することで、ユーザＵ１が急いでいることを検出してもよい。

　また、本実施形態に係る情報処理サーバ２０は、例えば、ユーザが登録した予定の情報に基づいて、ユーザＵ１が急ぐべき状態であることを判定し、予定を簡潔に説明する音声発話ＳＯ１ｂを情報処理端末１０に出力させることもできる。

　この場合、情報処理サーバ２０は、必ずしもユーザ発話ＵＯ１ａに対する応答として音声発話ＳＯ１ｂを出力させなくてもよい。例えば、登録された予定が差し迫っており、かつユーザＵ１が移動の素振りを見せない場合、情報処理サーバ２０は、自発的に音声発話ＳＯ１ｂを情報処理端末１０に出力させることも可能である。この際、情報処理サーバ２０は、音声発話ＳＯ１ｂを、「忘れてませんか？」、や「急いで！」、などの文言を付加した出力文とすることで、ユーザＵ１に対し注意を促してもよい。このように、本実施形態に係る情報処理サーバ２０によれば、出力コンテキストに基づいて出力文の出力表現を動的に制御することで、より自然で効果の高い情報提示を実現することができる。

　＜＜１．２．システム構成例＞＞
　次に、本実施形態に係る情報処理システムの構成例について説明する。図２は、本実施形態に係る情報処理システムの構成例を示すブロック図である。図２を参照すると、本実施形態に係る情報処理システムは、情報処理端末１０、情報処理サーバ２０、およびセンサ装置３０を備える。また、情報処理端末１０と情報処理サーバ２０、情報処理サーバ２０とセンサ装置３０は、ネットワーク４０を介して互いに通信が行えるように接続される。

　（情報処理端末１０）
　本実施形態に係る情報処理端末１０は、情報処理サーバ２０による制御に基づいて、ユーザに対し音声や視覚情報を用いた情報提示を行う情報処理装置である。本実施形態に係る情報処理端末１０は、情報処理サーバ２０が出力コンテキストに基づいて動的に決定した出力文と出力表現に基づいて上記の情報提示を行うことを特徴の一つとする。

　本実施形態に係る情報処理端末１０は、音声や視覚情報を出力する機能を有する種々の装置として実現され得る。本実施形態に係る情報処理端末１０は、例えば、携帯電話、スマートフォン、タブレット、ウェアラブル装置、汎用コンピュータ、据え置き型または自律移動型の専用装置などであってもよい。

　また、本実施形態に係る情報処理端末１０は、ユーザや周囲環境に係る種々の情報を収集する機能を有する。情報処理端末１０は、例えば、ユーザの発話を含む音情報、ユーザや周囲を撮像した画像情報、その他の種々のセンサ情報を収集し、情報処理サーバ２０に送信する。

　（情報処理サーバ２０）
　本実施形態に係る情報処理サーバ２０は、ユーザに対する情報提示において出力文の出力を制御する機能を有する情報処理装置である。この際、本実施形態に係る情報処理サーバ２０は、出力文の出力に際し取得した出力コンテキストに基づいて、当該出力文に係る出力表現を動的に制御することを特徴の一つとする。

　本実施形態に係る情報処理サーバ２０は、情報処理端末１０やセンサ装置３０が収集した音情報、画像情報、センサ情報などに基づいて出力コンテキストを取得し、出力文の出力表現を制御することができる。

　（センサ装置３０）
　本実施形態に係るセンサ装置３０は、情報処理サーバ２０による出力コンテキストの取得に用いられる音情報、画像情報、センサ情報を収集する機能を有する。本実施形態に係るセンサ装置３０は、上記の機能を有する種々の装置として実現される。センサ装置３０は、例えば、家電機器、ゲーム機器、オフィス機器などであってもよい。

　（ネットワーク４０）
　ネットワーク４０は、情報処理端末１０と情報処理サーバ２０、情報処理サーバ２０とセンサ装置を接続する機能を有する。ネットワーク４０は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ｅｔｈｅｒｎｅｔ（登録商標）を含む各種のＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、ＷＡＮ（Ｗｉｄｅ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）などを含んでもよい。また、ネットワーク４０は、ＩＰ－ＶＰＮ（Ｉｎｔｅｒｎｅｔ　Ｐｒｏｔｏｃｏｌ－Ｖｉｒｔｕａｌ　Ｐｒｉｖａｔｅ　Ｎｅｔｗｏｒｋ）などの専用回線網を含んでもよい。また、ネットワーク４０は、Ｗｉ－Ｆｉ（登録商標）、Ｂｌｕｅｔｏｏｔｈ（登録商標）など無線通信網を含んでもよい。

　以上、本実施形態に係る情報処理システムの構成例について説明した。なお、図２を用いて説明した上記の構成はあくまで一例であり、本実施形態に係る情報処理システムの構成は係る例に限定されない。例えば、本実施形態に係る情報処理端末１０および情報処理サーバ２０が有する機能は、単一の装置により実現されてもよい。また、本実施形態に係る情報処理システムは、必ずしもセンサ装置３０を備えなくてもよい。本実施形態に係る情報処理システムの構成は、仕様や運用に応じて柔軟に変形可能である。

　＜＜１．３．情報処理端末１０の機能構成例＞＞
　次に、本実施形態に係る情報処理端末１０の機能構成例について説明する。図３は、本実施形態に係る情報処理端末１０の機能構成例を示すブロック図である。図３を参照すると、本実施形態に係る情報処理端末１０は、表示部１１０、音声出力部１２０、音声入力部１３０、撮像部１４０、センサ部１５０、制御部１６０、およびサーバ通信部１７０を備える。

　（表示部１１０）
　本実施形態に係る表示部１１０は、画像やテキストなどの視覚情報を出力する機能を有する。本実施形態に係る表示部１１０は、例えば、情報処理サーバ２０による制御に基づいて、出力文に対応するテキストや出力文を含む画像を表示する。

　このために、本実施形態に係る表示部１１０は、視覚情報を提示する表示デバイスなどを備える。上記の表示デバイスには、例えば、液晶ディスプレイ（ＬＣＤ：Ｌｉｑｕｉｄ　Ｃｒｙｓｔａｌ　Ｄｉｓｐｌａｙ）装置、ＯＬＥＤ（Ｏｒｇａｎｉｃ　Ｌｉｇｈｔ　Ｅｍｉｔｔｉｎｇ　Ｄｉｏｄｅ）装置、タッチパネルなどが挙げられる。また、本実施形態に係る表示部１１０は、プロジェクション機能により視覚情報を出力してもよい。

　（音声出力部１２０）
　本実施形態に係る音声出力部１２０は、音声発話を含む種々の音を出力する機能を有する。本実施形態に係る音声出力部１２０は、例えば、情報処理サーバ２０による制御に基づいて、出力部に対応する音声発話を出力する。このために、本実施形態に係る音声出力部１２０は、スピーカやアンプなどの音声出力装置を備える。

　（音声入力部１３０）
　本実施形態に係る音声入力部１３０は、ユーザによる発話や、情報処理端末１０の周囲で発生する周囲音などの音情報を収集する機能を有する。音声入力部１３０が収集する音情報は、情報処理サーバ２０による音声認識や周囲環境の認識などに用いられる。本実施形態に係る音声入力部１３０は、音情報を収集するためのマイクロフォンを備える。

　（撮像部１４０）
　本実施形態に係る撮像部１４０は、ユーザや周囲環境の画像を撮像する機能を有する。撮像部１４０が撮像した画像情報は、情報処理サーバ２０によるユーザの行動認識や状態認識、周囲環境の認識に用いられる。本実施形態に係る撮像部１４０は、画像を撮像することが可能な撮像装置を備える。なお、上記の画像には、静止画像のほか動画像が含まれる。
　（センサ部１５０）
　本実施形態に係るセンサ部１５０は、周囲環境やユーザの行動、状態に関する種々のセンサ情報を収集する機能を有する。センサ部１５０が収集したセンサ情報は、情報処理サーバ２０による周囲環境の認識やユーザの行動認識、状態認識に用いられる。センサ部１５０は、例えば、赤外線センサを含む光センサ、加速度センサ、ジャイロセンサ、地磁気センサ、熱センサ、振動センサ、ＧＮＳＳ（Ｇｌｏｂａｌ　Ｎａｖｉｇａｔｉｏｎ　Ｓａｔｅｌｌｉｔｅ　Ｓｙｓｔｅｍ）信号受信装置などを備える。

　（制御部１６０）
　本実施形態に係る制御部１６０は、情報処理端末１０が備える各構成を制御する機能を有する。制御部１６０は、例えば、各構成の起動や停止を制御する。また、制御部１６０は、情報処理サーバ２０により生成される制御信号を表示部１１０や音声出力部１２０に入力する。また、本実施形態に係る制御部１６０は、後述する情報処理サーバ２０の出力制御部２５０と同等の機能を有してもよい。

　（サーバ通信部１７０）
　本実施形態に係るサーバ通信部１７０は、ネットワーク４０を介して情報処理サーバ２０との情報通信を行う機能を有する。具体的には、サーバ通信部１７０は、音声入力部１３０が収集した音情報や、撮像部１４０が撮像した画像情報、センサ部１５０が収集したセンサ情報を情報処理サーバ２０に送信する。また、サーバ通信部１７０は、情報処理サーバ２０から出力文に係る制御信号などを受信する。

　以上、本実施形態に係る情報処理端末１０の機能構成例について説明した。なお、図３を用いて説明した上記の構成はあくまで一例であり、本実施形態に係る情報処理端末１０の機能構成は係る例に限定されない。例えば、本実施形態に係る情報処理端末１０は、図３に示す構成のすべてを必ずしも備えなくてもよい。例えば、情報処理端末１０は、表示部１１０やセンサ部１５０などを備えない構成をとることもできる。また、上述したように、本実施形態に係る制御部１６０は、情報処理サーバ２０の出力制御部２５０と同等の機能を有してもよい。本実施形態に係る情報処理端末１０の機能構成は、仕様や運用に応じて柔軟に変形可能である。

　＜＜１．４．情報処理サーバ２０の機能構成例＞＞
　次に、本実施形態に係る情報処理サーバ２０の機能構成例について詳細に説明する。図４は、本実施形態に係る情報処理サーバ２０の機能構成例を示すブロック図である。図４を参照すると、本実施形態に係る情報処理サーバ２０は、ユーザ認識部２１０、環境認識部２２０、音声認識部２３０、コンテキスト取得部２４０、出力制御部２５０、ユーザ情報蓄積部２６０、パラメータ蓄積部２７０、および通信部２８０を備える。

　（ユーザ認識部２１０）
　本実施形態に係るユーザ認識部２１０は、ユーザに係る種々の認識を行う機能を有する。例えば、ユーザ認識部２１０は、情報処理端末１０やセンサ装置３０が収集したユーザの発話や画像と、ユーザ情報蓄積部２６０に予め記憶されるユーザの音声特徴や画像とを比較することでユーザの認識を行うことができる。

　また、ユーザ認識部２１０は、情報処理端末１０やセンサ装置３０が収集した音情報、画像情報、センサ情報に基づいて、ユーザの行動や状態を認識することができる。ユーザ認識部２１０は、例えば、収集された画像情報やセンサ情報に基づいて、ユーザの移動や行動を認識する。ユーザ認識部２１０は、情報処理端末１０が収集した加速度情報や角速度情報に基づいてユーザがジョギングを行っていることなどを認識することができる。また、ユーザ認識部２１０は、ゲーム機器であるセンサ装置３０から送信される稼働状況に基づいて、ユーザがゲームを行っていることを認識してもよい。

　また、ユーザ認識部２１０は、例えば、画像情報や音情報などに基づいて、ユーザに係る種々の状態を認識する。ユーザ認識部２１０は、例えば、収集された画像情報に基づいて、ユーザの視線や表情、感情などを認識してもよい。

　（環境認識部２２０）
　本実施形態に係る環境認識部２２０は、情報処理端末１０やセンサ装置３０が収集した音情報、画像情報、センサ情報に基づいて、周囲環境に係る種々の認識を行う機能を有する。環境認識部２２０は、例えば、情報処理端末１０が収集した音情報に基づいて、周囲の騒音レベルを認識してもよいし、画像情報やセンサ情報に基づいてユーザ以外の第三者が周囲に存在することを認識してもよい。

　また、環境認識部２２０は、画像情報やセンサ情報に基づいて、ユーザが位置する場所の特性を推定することも可能である。環境認識部２２０は、例えば、ユーザが電車に乗っていることや、人通りの多い繁華街に居ることなどを推定してもよい。

　（音声認識部２３０）
　本実施形態に係る音声認識部２３０は、情報処理端末１０が収集した音情報に基づいてユーザの発話を認識する機能を有する。具体的には、本実施形態に係る音声認識部２３０は、ユーザによる発話が行われた区間を検出する音声区間検出機能、音情報をテキストに変換する音声認識機能、変換後のテキストからユーザの発話意図を解析する意図解析機能を有する。

　また、本実施形態に係る音声認識部２３０は、ユーザの発話スタイルを検出する。ここで、上記の発話スタイルは、例えば、発話の長さ、大きさ、スピード、語気、口調などの情報を含む。また、発話スタイルには、例えば、情報処理端末１０による音声発話の出力後にユーザが発話を行うまでに要した時間、ユーザが音声発話に対して割り込み（バージイン）を行った、などの情報が含まれてもよい。

　（コンテキスト取得部２４０）
　本実施形態に係るコンテキスト取得部２４０は、ユーザ認識部２１０、環境認識部２２０、および音声認識部２３０による各種の認識の結果に基づいて出力コンテキストを取得する機能を有する。本実施形態に係るコンテキスト取得部２４０は、ユーザや周囲の状態、入力されたユーザの発話などに基づいて、出力文の出力に係る状況、すなわち出力コンテキストを動的に取得することができる。

　また、本実施形態に係るコンテキスト取得部２４０は、上記の認識結果のほか、他のアプリケーションから取得した情報に基づいて、出力コンテキストを取得してよい。コンテキスト取得部２４０は、例えば、ユーザの予定情報や、ユーザの移動経路における渋滞情報などを各アプリケーションから取得し、総合的に出力コンテキストを取得することができる。

　さらには、本実施形態に係るコンテキスト取得部２４０は、ユーザ情報蓄積部２６０に蓄積されるユーザの状態に関する過去の履歴や、習慣、特性などを加味して出力コンテキストを取得してよい。例えば、同一の行動であっても、ユーザによっては、意図や意味が異なる場合も想定される。一例としては、あるユーザが不安を感じているときに行う行動（癖、表情）は、別のユーザにとっては怒りを感じているときに行う行動である可能性もある。このため、本実施形態に係るコンテキスト取得部２４０がユーザごとに過去の履歴や習慣を加味して総合的に出力コンテキストを取得することで、より精度の高い状況の推定を行うことが可能となる。

　（出力制御部２５０）
　本実施形態に係る出力制御部２５０は、ユーザに対する情報提示において出力文の出力を制御する機能を有する。この際、本実施形態に係る出力制御部２５０は、出力文の出力に際しコンテキスト取得部２４０が取得した出力コンテキストに基づいて、出力文に係る出力表現を動的に制御することを特徴の一つとする。

　ここで、上記の出力表現は、例えば、出力文の文章内容を含んでよい。すなわち、本実施形態に係る出力制御部２５０は、コンテキスト取得部２４０が取得した出力コンテキストに基づいて、出力文の文章内容を動的に変化させてよい。本実施形態に係る出力制御部２５０が有する上記の機能によれば、状況に応じて出力文の内容自体を動的に変更することができ、ユーザに対しより価値の高い情報提示を実現することが可能となる。

　また、上記の出力表現は、文章内容のほか、出力文に係る出力態様、出力ニュアンス、出力動作などを含む。すなわち、本実施形態に係る出力制御部２５０は、コンテキスト取得部２４０が取得した出力コンテキストに基づいて、出力文に係る出力態様、出力ニュアンス、出力動作を動的に変更することができる。

　ここで、上記の出力態様とは、出力文の出力に係る聴覚的または視覚的な表現を指す。出力文を音声発話により出力させる場合、出力制御部２５０は、例えば、音声発話の声質、大きさ、韻律、出力タイミング、効果などの制御を行うことができる。なお、上記の韻律には、音のリズム、強弱、長短などが含まれる。また、出力文を視覚情報により出力させる場合、出力制御部２５０は、例えば、出力文のフォント、大きさ、色、文字装飾、配置、アニメーションなどを制御することができる。本実施形態に係る出力制御部２５０が有する上記の機能によれば、状況に応じて出力文に係る聴覚的または視覚的表現を変化させることで、より効果的な情報提示を実現することが可能となる。

　また、上記の出力ニュアンスとは、出力文が含む意図をユーザに伝えるための種々の表現を指す。例えば、人間同士による会話の場合、発話に係る文章内容がまったく同一である場合でも、表情や間などにより発話のニュアンスが異なる場合が多く見受けられる。このため、本実施形態に係る出力制御部２５０は、出力コンテキストに基づいて出力文に係る出力ニュアンスを制御することで、より表現力の高い情報提示を実現することが可能である。なお、出力ニュアンスの制御は、出力態様や出力動作の制御に伴い実現されてもよい。

　また、上記の出力動作とは、出力文の出力に係る情報処理端末１０の物理的動作を指す。例えば、情報処理端末１０が人間や動物を模したロボットである場合、出力動作には、四肢などのパーツの動き、視線やまばたきなどを含む表情などが含まれてよい。また、出力動作には、例えば、光や振動を用いた種々の物理的動作が含まれる。本実施形態に係る出力制御部２５０が有する上記の機能によれば、情報処理端末１０に状況に応じた適切な出力動作を行わせることが可能となる。また、出力制御部２５０は、視覚情報として表示させるキャラクターなどの出力動作を制御してもよい。

　（ユーザ情報蓄積部２６０）
　本実施形態に係るユーザ情報蓄積部２６０は、ユーザに係る種々の情報を記憶する。ユーザ情報蓄積部２６０は、例えば、ユーザの年齢や性別などの基本情報、ユーザの画像や音声、嗜好、特性などを記憶してよい。また、ユーザ情報蓄積部２６０は、出力コンテキストの過去履歴をユーザごとに記憶する。

　（パラメータ蓄積部２７０）
　本実施形態に係るパラメータ蓄積部２７０は、出力制御部２５０が生成した出力文および当該出力文に係る出力表現と出力コンテキストとを関連付けて履歴を記憶する。すなわち、本実施形態に係るパラメータ蓄積部２７０は、状況ごとに応じた出力文の出力ルールを記憶するといえる。

　（通信部２８０）
　本実施形態に係る通信部２８０は、ネットワーク４０を介して情報処理端末１０およびセンサ装置３０との情報通信を行う機能を有する。具体的には、通信部２８０は、情報処理端末１０やセンサ装置３０から音情報、画像情報、センサ情報を受信する。また、通信部２８０は、出力文の出力に係る制御信号を情報処理端末１０に送信する。

　以上、本実施形態に係る情報処理サーバ２０の機能構成例について説明した。なお、図４を用いて説明した上記の機能構成はあくまで一例であり、本実施形態に係る情報処理サーバ２０の機能構成は係る例に限定されない。例えば、情報処理サーバ２０は、必ずしも図４に示す構成のすべてを備えなくてもよい。ユーザ認識部２１０、環境認識部２２０、音声認識部２３０、コンテキスト取得部２４０、ユーザ情報蓄積部２６０、およびパラメータ蓄積部２７０は、情報処理サーバ２０とは異なる別の装置に備えることも可能である。本実施形態に係る情報処理サーバ２０の機能構成は、仕様や運用に応じて柔軟に変形可能である。

　＜＜１．５．出力制御の詳細＞＞
　次に、本実施形態に係る出力制御部２５０による出力文の出力制御について具体例を挙げながら詳細に説明する。図１では、出力制御部２５０が、情報処理端末１０との対話を行うユーザの状態を含む出力コンテキストに基づいて出力文の出力表現を制御する場合の一例を説明した。一方、本実施形態に係る出力制御部２５０は、情報処理端末１０と対話を行うユーザとは異なるユーザの状態を含む出力コンテキストに基づいて、出力文の出力表現を制御してもよい。

　図５は、本実施形態に係る他のユーザの状態を含む出力コンテキストに基づく出力制御の一例を示す図である。図５には、ユーザＵ１が周囲に存在する状態でユーザＵ２が情報処理端末１０との対話を行っている状況が示されている。なお、図５の上段にはユーザＵ１が通常の状態である場合の一例が、図５の下段にはユーザＵ１が外出を前に焦っている状態である場合の一例がそれぞれ示されている。

　この際、本実施形態に係る出力制御部２５０は、コンテキスト取得部２４０が取得したユーザＵ１の状態を含む出力コンテキストに基づいて、異なる出力制御を行うことができる。例えば、図５の上段に示す一例の場合、出力制御部２５０は、出力コンテキストがユーザＵ１が通常の状態であることを示すことから、ユーザＵ２の問い合わせに係るユーザ発話ＵＯ５ａに対し、回答となる出力文を音声発話ＳＯ５ａとして出力させている。なお、この際、出力制御部２５０は、ユーザＵ２の年齢や知識レベルに応じて出力文の質や量、口調などを変化させることができる。

　一方、図５の下段に示す一例の場合、出力制御部２５０は、出力コンテキストがユーザＵ１が焦っている状態であることを示すことから、ユーザ発話ＵＯ５ａに対する回答ではなく、外出の準備を促す出力文を音声発話ＳＯ５ｂとして出力させている。このように、本実施形態に係る出力制御部２５０は、情報処理端末１０との対話を行うユーザＵ２の状態のみではなく、ユーザＵ２の周囲に存在するユーザＵ１の状態に基づいて、出力文の出力表現を動的に変更することができる。

　また、図５に示す一例のように、本実施形態に係る出力制御部２５０は、ユーザの問い合わせに対する応答を必ずしも優先しなくてよい。出力制御部２５０は、出力コンテキストに応じてより価値の高いと推測される出力文を情報処理端末１０に出力させることで、ユーザの意図しないニーズに対応した効果的な情報提示を実現することが可能である。

　また、本実施形態に係る出力制御部２５０は、ユーザの状態のほか、過去の出力文の履歴情報や、他のアプリケーションから取得した情報を含む出力コンテキストに基づいて、出力文の出力表現を制御してもよい。

　図６Ａは、本実施形態に係る出力文の過去履歴を含む出力コンテキストに基づく出力制御の一例を示す図である。図６Ａには、おすすめの学習コースを問うユーザ発話ＵＯ６ａを行うユーザＵ３と、ユーザ発話ＵＯ６ａに対する応答として音声発話ＳＯ６ａを出力する情報処理端末１０が示されている。

　この際、出力制御部２５０は、出力コンテキストが過去に初級クラスを推薦する出力文を出力したことを示すことや、現在のユーザＵ３の学習レベルが前回の出力時よりも向上していることを示すことに基づいて、中級クラスを推薦する出力文を情報処理端末１０に出力させることができる。

　また、図６Ｂは、他のアプリケーションから取得した情報を含む出力コンテキストに基づく出力制御の一例を示す図である。図６Ｂには、天気の問い合わせに係るユーザ発話ＵＯ６ｂを行うユーザＵ３と、ユーザ発話ＵＯ６ｂに対する応答である音声発話ＳＯ６ｂを出力する情報処理端末１０が示されている。また、図６Ｂに示す一例の場合、コンテキスト取得部２４０は、スケジューラアプリケーションから取得した予定情報を含む出力コンテキストを取得している。

　この際、出力制御部２５０は、出力コンテキストがユーザＵ３に出張の予定があることを示すことから、現在地の天気に加え出張先の天気情報を含む出力文を情報処理端末１０に出力させてよい。このように、本実施形態に係る出力制御部２５０によれば、出力コンテキストが示す種々の状況に応じて出力文の出力表現を柔軟に変更することができ、より価値の高い情報提示を実現することが可能となる。

　なお、図６Ａおよび図６Ｂでは、出力コンテキストに基づいて出力制御部２５０が主に出力文の文章内容を変更する場合について述べたが、本実施形態に係る出力表現の制御は係る例に限定されない。例えば、本実施形態に係る出力制御部２５０は、文章内容を変更することなく出力文の出力ニュアンスを変化させることもできる。

　図７Ａおよび図７Ｂは、本実施形態に係る出力ニュアンスの制御について説明するための図である。図７Ａには、ユーザＵ１の機嫌に係る問い合わせであるユーザ発話ＵＯ７ａを行うユーザＵ３と、ユーザ発話ＵＯ７ａに対する応答である音声発話ＳＯ７ａを出力する情報処理端末１０が示されている。出力制御部２５０は、遠隔地にいるユーザＵ１にユーザ発話ＵＯ７ａに係る問い合わせを仲介しユーザＵ１から回答を得ることで、当該回答に対応する出力文を音声発話ＳＯ７ａとして情報処理端末１０に出力させることができる。

　また、この際、出力制御部２５０は、ユーザＵ１の状態に係る視覚情報ＳＶ７ａを音声発話ＳＯ７ａと共に情報処理端末１０に出力させてもよい。出力制御部２５０は、例えば、ユーザＵ１の状態を撮像した画像や、ユーザＵ１のアバターＡＵ１を視覚情報ＳＶ７ａとして情報処理端末１０に出力させることができる。

　図７Ａに示す一例の場合、出力制御部２５０は、ユーザＵ１の画像情報を含む出力コンテキストが、ユーザＵ１に怒った様子がないことを示すことから、ユーザＵ１から得た「まったく怒っていない」という回答を、肯定的な出力表現で出力させてよい。

　一方、図７Ｂには、ユーザＵ１が怒った表情で図７Ａとまったく同一の回答を行った場合の一例が示している。この際、出力制御部２５０は、ユーザＵ１の画像情報が含む出力コンテキストが、ユーザＵ１が怒った表情であることを示すことから、ユーザＵ１が怒っていることを示唆する出力ニュアンスで、音声発話ＳＯ７ｂを情報処理端末１０に出力させている。

　この際、出力制御部２５０は、例えば、音声発話ＳＯ７ａとまったく同一の文章内容を保ちながら、音声発話ＳＯ７ｂに係る抑揚や間を変更することで、上記の示唆を表現することができる。このように、本実施形態に係る出力制御部２５０は、文章内容を変更することなく出力文の出力ニュアンスを柔軟に変化させることも可能である。本実施形態に係る出力制御部２５０が有する上記の機能によれば、出力コンテキストに基づくより多彩な表現を実現することが可能となる。

　なお、上記では主に、問い合わせなどの依頼を行うユーザと情報提示を享受するユーザとが同一である場合の例を中心に説明した。一方、本実施形態に係る情報提示の制御は係る例に限定されない。本実施形態に係る出力制御部２５０は、依頼ユーザによる依頼に基づいて、当該依頼ユーザとは異なる対象ユーザに対する情報提示を制御してもよい。

　この際、本実施形態に係る出力制御部２５０は、例えば、依頼ユーザに係る出力コンテキストに基づいて、出力文の出力表現を動的に制御することができる。図８は、依頼ユーザに係る出力コンテキストに基く出力制御について説明するための図である。

　図８には、遠隔地にいる依頼ユーザであるユーザＵ１が対象ユーザであるユーザＵ２に対するメッセージの仲介を依頼した場合の出力制御の一例が示されている。この際、本実施形態に係る出力制御部２５０は、依頼ユーザであるユーザＵ１に係る出力コンテキストに基づいて、出力文の文章内容を含む出力表現を動的に変化させることが可能である。

　例えば、図８に示す一例の場合、依頼ユーザであるユーザＵ１は、帰宅時間と帰宅後の予定を対象ユーザであるユーザＵ２に伝えるためのユーザ発話ＵＯ８ａを行っている。この場合、本実施形態に係る出力制御部２５０は、例えば、ユーザＵ２に対する出力文の出力時におけるユーザＵ１の実際の状態に基づいて、出力文の出力表現を変化させてよい。

　図８に示す一例の場合、出力制御部２５０は、ユーザＵ１の状態を含む出力コンテキストが、ユーザＵ１が多忙となったことを示すことから、ユーザＵ１の状況の変化を反映させた出力文を音声発話ＳＯ８ａとして情報処理端末１０に出力させている。

　このように、本実施形態に係る出力制御部２５０によれば、単純に依頼ユーザのメッセージを対象ユーザに伝えるのではなく、出力時における依頼ユーザの実際の状態を加味した出力文を生成することで、より付加価値の高い情報提示を実現することが可能となる。

　また、本実施形態に係る出力制御部２５０は、対象ユーザに係る出力コンテキストに基づいて、出力文の出力表現を動的に制御してもよい。図９は、対象ユーザに係る出力コンテキストに基く出力制御について説明するための図である。

　図９には、遠隔地にいる依頼ユーザであるユーザＵ１が対象ユーザであるユーザＵ２に対するメッセージの仲介を依頼した場合の出力制御の一例が示されている。この際、本実施形態に係る出力制御部２５０は、対象ユーザであるユーザＵ２に係る出力コンテキストに基づいて、出力文の文章内容を含む出力表現を動的に変化させることが可能である。

　例えば、図９に示す一例の場合、依頼ユーザであるユーザＵ１は、対象ユーザであるユーザＵ２の行動を指示するためのユーザ発話ＵＯ９ａを行っている。具体的には、ユーザ発話ＵＯ９ａは、宿題が終わるまではおやつを食べてはいけないことをユーザＵ２に指示する内容である。この場合、本実施形態に係る出力制御部２５０は、例えば、ユーザＵ２に対する出力文の出力時におけるユーザＵ２の実際の状態に基づいて、出力文の出力表現を変化させてよい。

　図９に示す一例の場合、出力制御部２５０は、ユーザＵ２の状態を含む出力コンテキストが、ユーザＵ１が既に宿題を終えたことを示すことから、当該行動の終了を反映させた出力文を音声発話ＳＯ９ａとして情報処理端末１０に出力させている。具体的には、出力制御部２５０は、宿題を終えたことを褒め、おやつを食べてよい旨の音声発話ＳＯ９ａを情報処理端末１０に行わせている。

　このように、本実施形態に係る出力制御部２５０によれば、出力時における対象ユーザの実際の状態を加味した出力文を生成することで、例えば、対象ユーザにとってより肯定的な情報提示を行うことができ、依頼ユーザおよび対象ユーザの双方に価値を提供することが可能となる。

　また、本実施形態に係る出力制御部２５０は、時間経過に伴う出力コンテキストの変化に基づいて、出力文の出力表現を動的に制御してもよい。本実施形態に係る出力制御部２５０は、例えば、出力文の出力に係るトリガー発生時と当該出力文の出力時とにおける出力コンテキストの変化に基づいて、出力表現を動的に制御することができる。

　ここで、上記のトリガーとは、出力文の出力のきっかけとなる事象を指す。本実施形態に係るトリガーは、例えば、ユーザからの問い合わせなどの依頼であってよい。出力制御部２５０は、例えば、ユーザからの依頼をトリガーとして、当該依頼に対する応答となる出力文を情報処理端末１０に出力させることが可能である。

　図１０および図１１は、本実施形態に係る出力コンテキストの変化に基づく出力制御について説明するための図である。例えば、図１１には、書類とお土産の持参に係るリマインドを依頼するユーザ発話ＵＯ１０ａを行うユーザＵ３と、当該依頼に対応する出力文を音声発話ＳＯ１０ａとして出力する情報処理端末１０が示されている。

　この際、本実施形態に係る出力制御部２５０は、ユーザ発話ＵＯ１０ａの検出時、すなわちトリガー発生時と、音声発話ＳＯ１０ａの出力時における出力コンテキストの変化に基づいて、出力文の文章内容を含む出力表現を変化させることができる。例えば、出力制御部２５０は、トリガー発生時と出力文の出力時におけるユーザＵ３の所持物の変化に基づいて、出力文の文章内容を変化させてもよい。

　図１０に示す一例の場合、出力制御部２５０は、トリガー発生時にユーザＵ３が所持していなかった書類を出力時にユーザＵ３が所持していることに基づいて、リマインドに係る出力文の文章内容を変化させた音声発話ＳＯ１０ａを情報処理端末１０に出力させている。

　また、図１１には、操作手順に関する説明を依頼するためのユーザ発話ＵＯ１１ａを行うユーザＵ３と、当該依頼に対応する出力文を出力する情報処理端末１０が示されている。

　例えば、図１１の上段に示す一例の場合、出力制御部２５０は、予め設定された入力手順のすべてを省略することなく音声発話ＳＯ１１ａとして情報処理端末１０に出力させている。図１１に示す一例の場合、操作手順は、ホームページへのアクセス、ユーザ名入力によるログイン、メニューの選択、から構成される。

　一方、図１１の下段には、ユーザＵ３がホームページへのアクセス後、説明を待たずに自主的にログイン処理を完了させた場合の一例が示されている。この際、本実施形態に係る出力制御部２５０は、トリガー発生時からの出力コンテキストの変化、すなわちログイン処理の完了に基づいて、当該ログイン処理に係る説明を省略した出力文を音声発話ＳＯ１１ｂとして出力させている。

　このように、本実施形態に係る出力制御部２５０は、出力文の少なくとも一部の内容に影響する出力コンテキストの変化に基づいて、当該出力文の出力表現を動的に変化させることができる。

　より具体的には、本実施形態に係る出力制御部２５０は、トリガー発生時から出力時までの間におけるユーザによる所定行動の進捗に基づいて、出力文の出力表現を動的に変化させてよい。例えば、出力制御部２５０は、ユーザによる上記所定行動の完了が検出されたことに基づいて、出力文の出力表現を動的に変化させることができる。ここで、上記の所定行動は、出力文の少なくとも一部に対応する行動であってよい。

　このように、本実施形態に係る出力制御部２５０によれば、時間経過に伴う出力コンテキストの変化に応じて出力文を柔軟に変化させることができ、より効率的かつ価値の高い情報提示を実現することが可能となる。

　また、本実施形態に係る出力制御部２５０は、複数のユーザに係る出力コンテキストに基づいて、出力文の出力表現を動的に制御してもよい。図１２および図１３は、複数のユーザに係る出力コンテキストに基づく出力制御について説明するための図である。

　図１２には、レストランの問い合わせに係るユーザ発話ＳＯ１２ａを行うユーザＵ２およびＵ３と、当該問い合わせに対する回答を音声発話ＳＯ１２ａにより出力する情報処理端末１０とが示されている。

　なお、図１２には、ユーザＵ２がダイエット中であり、またユーザＵ３が昼食にステーキを食べた場合の一例が示されている。この際、本実施形態に係る出力制御部２５０は、複数のユーザ、すなわちユーザＵ２およびＵ３の利益の総和が増大するように、出力文の出力表現を動的に制御してもよい。

　具体的には、本実施形態に出力制御部２５０は、出力コンテキストが上記の状況を示すことに基づいて、ダイエット中のユーザＵ２にとって適するとともに、ユーザＵ３が昼食にとった食事とは趣の異なる和食を推薦する出力文を音声発話ＳＯ１２ａとして出力させている。

　このように、本実施形態に係る出力制御部２５０によれば、ユーザＵ２およびＵ３の双方にとって価値のあると推定される情報提示を行うことができ、複数のユーザが存在する場合であっても、より多くのユーザに対し利益生の高い情報を提供することが可能となる。

　また、図１３には、特定のレストランの込み具合を問うユーザ発話ＵＯ１３ａを行うユーザＵ１、ユーザＵ３、およびにユーザ発話ＵＯ１３ａ対する回答を音声発話ＳＯ１３ａにより出力する情報処理端末１０とが示されている。

　なお、図１３には、上記特定のレストランが比較的混んでいる状況であり、またユーザＵ３には一時間後に会議の予定がある場合の一例が示されている。この際、本実施形態に係る出力制御部２５０は、複数のユーザ、すなわちユーザＵ２およびＵ３の損失の総和が低減するように、出力文の出力表現を動的に制御してもよい。

　具体的には、出力制御部２５０は、出力コンテキストが上記の状況を示すことに基づいて、より近隣のすいているレストランを推薦する出力文を音声発話ＳＯ１３ａとして情報処理端末１０に出力させている。この際、出力制御部２５０は、例えば、情報提示に係る過去履歴に基づいて以前にユーザＵ１が利用したことがあり高評価であったレストランを推薦してもよい。

　このように、本実施形態に係る出力制御部２５０によれば、ユーザＵ２およびＵ３の双方の損失を防ぐ情報提示を行うことができ、複数のユーザが存在する場合であっても、より多くのユーザに対し利益生の高い情報を提供することが可能となる。

　なお、本実施形態に係るコンテキスト取得部２４０は、例えば、スケジューラアプリケーション、メッセージアプリケーション、ＳＮＳなどから取得した情報に基づいて、上述したようなダイエット状況、食事内容、スケジュールなどを出力コンテキストに含めることができる。

　＜＜１．６．出力制御の流れ＞＞
　次に、本実施形態に係る情報処理サーバ２０による出力文の出力制御の流れについて詳細に説明する。図１４は、本実施形態に係る情報処理サーバ２０による出力制御の流れを示すフローチャートである。

　図１４を参照すると、まず、情報処理端末１０の通信部２８０が情報処理端末１０やセンサ装置３０などから収集情報を受信する（Ｓ１１０１）。ここで、上記の収集情報には、音情報、画像情報、その他のセンサ情報が含まれる。

　次に、出力制御部２５０が音声認識部２３０による認識結果などに基づいて、出力部の出力に係るトリガーを検出する（Ｓ１１０２）。

　次に、コンテキスト取得部２４０がステップＳ１１０２におけるトリガー検出に基づいて、トリガー発生時の出力コンテキストを取得する（Ｓ１１０３）。

　また、コンテキスト取得部２４０は、出力制御部２５０による制御に基づいて、出力文の出力時における出力コンテキストを取得する（Ｓ１１０４）。

　次に、出力制御部２５０が、ステップＳ１１０３およびＳ１１０４においてコンテキスト取得部２４０が取得した出力コンテキストに基づいて、出力文の出力制御を実行する（Ｓ１１０５）。

　＜２．ハードウェア構成例＞
　次に、本開示の一実施形態に係る情報処理端末１０および情報処理サーバ２０に共通するハードウェア構成例について説明する。図１５は、本開示の一実施形態に係る情報処理端末１０および情報処理サーバ２０のハードウェア構成例を示すブロック図である。図１５を参照すると、情報処理端末１０および情報処理サーバ２０は、例えば、ＣＰＵ８７１と、ＲＯＭ８７２と、ＲＡＭ８７３と、ホストバス８７４と、ブリッジ８７５と、外部バス８７６と、インターフェース８７７と、入力装置８７８と、出力装置８７９と、ストレージ８８０と、ドライブ８８１と、接続ポート８８２と、通信装置８８３と、を有する。なお、ここで示すハードウェア構成は一例であり、構成要素の一部が省略されてもよい。また、ここで示される構成要素以外の構成要素をさらに含んでもよい。

　（ＣＰＵ８７１）
　ＣＰＵ８７１は、例えば、演算処理装置又は制御装置として機能し、ＲＯＭ８７２、ＲＡＭ８７３、ストレージ８８０、又はリムーバブル記録媒体９０１に記録された各種プログラムに基づいて各構成要素の動作全般又はその一部を制御する。

　（ＲＯＭ８７２、ＲＡＭ８７３）
　ＲＯＭ８７２は、ＣＰＵ８７１に読み込まれるプログラムや演算に用いるデータ等を格納する手段である。ＲＡＭ８７３には、例えば、ＣＰＵ８７１に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータ等が一時的又は永続的に格納される。

　（ホストバス８７４、ブリッジ８７５、外部バス８７６、インターフェース８７７）
　ＣＰＵ８７１、ＲＯＭ８７２、ＲＡＭ８７３は、例えば、高速なデータ伝送が可能なホストバス８７４を介して相互に接続される。一方、ホストバス８７４は、例えば、ブリッジ８７５を介して比較的データ伝送速度が低速な外部バス８７６に接続される。また、外部バス８７６は、インターフェース８７７を介して種々の構成要素と接続される。

　（入力装置８７８）
　入力装置８７８には、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ、及びレバー等が用いられる。さらに、入力装置８７８としては、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラ（以下、リモコン）が用いられることもある。また、入力装置８７８には、マイクロフォンなどの音声入力装置が含まれる。

　（出力装置８７９）
　出力装置８７９は、例えば、ＣＲＴ（Ｃａｔｈｏｄｅ　Ｒａｙ　Ｔｕｂｅ）、ＬＣＤ、又は有機ＥＬ等のディスプレイ装置、スピーカ、ヘッドホン等のオーディオ出力装置、プリンタ、携帯電話、又はファクシミリ等、取得した情報を利用者に対して視覚的又は聴覚的に通知することが可能な装置である。また、本開示に係る出力装置８７９は、触覚刺激を出力することが可能な種々の振動デバイスを含む。

　（ストレージ８８０）
　ストレージ８８０は、各種のデータを格納するための装置である。ストレージ８８０としては、例えば、ハードディスクドライブ（ＨＤＤ）等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス、又は光磁気記憶デバイス等が用いられる。

　（ドライブ８８１）
　ドライブ８８１は、例えば、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体９０１に記録された情報を読み出し、又はリムーバブル記録媒体９０１に情報を書き込む装置である。

　（リムーバブル記録媒体９０１）
リムーバブル記録媒体９０１は、例えば、ＤＶＤメディア、Ｂｌｕ－ｒａｙ（登録商標）メディア、ＨＤ　ＤＶＤメディア、各種の半導体記憶メディア等である。もちろん、リムーバブル記録媒体９０１は、例えば、非接触型ＩＣチップを搭載したＩＣカード、又は電子機器等であってもよい。

　（接続ポート８８２）
　接続ポート８８２は、例えば、ＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）ポート、ＩＥＥＥ１３９４ポート、ＳＣＳＩ（Ｓｍａｌｌ　Ｃｏｍｐｕｔｅｒ　Ｓｙｓｔｅｍ　Ｉｎｔｅｒｆａｃｅ）、ＲＳ－２３２Ｃポート、又は光オーディオ端子等のような外部接続機器９０２を接続するためのポートである。

　（外部接続機器９０２）
　外部接続機器９０２は、例えば、プリンタ、携帯音楽プレーヤ、デジタルカメラ、デジタルビデオカメラ、又はＩＣレコーダ等である。

　（通信装置８８３）
　通信装置８８３は、ネットワークに接続するための通信デバイスであり、例えば、有線又は無線ＬＡＮ、Ｂｌｕｅｔｏｏｔｈ（登録商標）、又はＷＵＳＢ（Ｗｉｒｅｌｅｓｓ　ＵＳＢ）用の通信カード、光通信用のルータ、ＡＤＳＬ（Ａｓｙｍｍｅｔｒｉｃ　Ｄｉｇｉｔａｌ　Ｓｕｂｓｃｒｉｂｅｒ　Ｌｉｎｅ）用のルータ、又は各種通信用のモデム等である。

　＜３．まとめ＞
　以上説明したように、本開示の一実施形態に係る情報処理サーバ２０は、ユーザに対する情報提示において出力文の出力を制御する機能を有する。また、この際、情報処理サーバ２０は、出力文の出力に際し取得された出力コンテキストに基づいて、当該出力文に係る出力表現を動的に制御することを特徴の一つとする。係る構成によれば、より柔軟かつ効果的な情報提示を実現することが可能となる。

　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

　また、本明細書の情報処理サーバ２０の処理に係る各ステップは、必ずしもフローチャートに記載された順序に沿って時系列に処理される必要はない。例えば、情報処理サーバ２０の処理に係る各ステップは、フローチャートに記載された順序と異なる順序で処理されても、並列的に処理されてもよい。

　なお、以下のような構成も本開示の技術的範囲に属する。
（１）
　ユーザに対する情報提示において出力文の出力を制御する出力制御部、
　を備え、
　前記出力制御部は、前記出力文の出力に際し取得された出力コンテキストに基づいて、前記出力文に係る出力表現を動的に制御する、
情報処理装置。
（２）
　前記出力表現は、少なくとも前記出力文の文章内容を含み、
　前記出力制御部は、前記出力コンテキストに基づいて、前記出力文の文章内容を動的に変化させる、
前記（１）に記載の情報処理装置。
（３）
　前記出力表現は、前記出力文に係る出力態様、出力ニュアンス、または出力動作のうち少なくともいずれかを含み、
　前記出力制御部は、前記出力コンテキストに基づいて、前記出力態様、前記出力ニュアンス、または前記出力動作のうち少なくともいずれかを動的に変化させる、
前記（１）または（２）に記載の情報処理装置。
（４）
　前記出力制御部は、時間経過に伴う前記出力コンテキストの変化に基づいて、前記出力表現を動的に制御する、
前記（１）～（３）のいずれかに記載の情報処理装置。
（５）
　前記出力制御部は、前記出力文の出力に係るトリガー発生時と前記出力文の出力時とにおける前記出力コンテキストの変化に基づいて、前記出力表現を動的に制御する、
前記（１）～（４）のいずれかに記載の情報処理装置。
（６）
　前記出力制御部は、前記出力文の少なくとも一部の内容に影響する前記出力コンテキストの変化に基づいて、前記出力表現を動的に変化させる、
前記（５）に記載の情報処理装置。
（７）
　前記出力制御部は、前記トリガー発生時から前記出力時までの間におけるユーザによる所定行動の進捗に基づいて、前記出力表現を動的に変化させ、
　前記所定行動は、前記出力文の少なくとも一部に対応する行動である、
前記（５）または（６）に記載の情報処理装置。
（８）
　前記出力制御部は、前記所定行動の完了が検出されたことに基づいて、前記出力表現を動的に変化さる、
前記（７）に記載の情報処理装置。
（９）
　前記出力制御部は、依頼ユーザによる依頼に基づいて、対象ユーザに対する情報提示を制御する、
前記（１）～（８）のいずれかに記載の情報処理装置。
（１０）
　前記出力制御部は、前記依頼ユーザに係る前記出力コンテキストに基づいて、前記出力表現を動的に制御する、
前記（９）に記載の情報処理装置。
（１１）
　前記出力制御部は、前記対象ユーザに係る前記出力コンテキストに基づいて、前記出力表現を動的に制御する、
前記（９）または（１０）に記載の情報処理装置。
（１２）
　前記依頼ユーザと前記対象ユーザは、互いに遠隔地に位置する、
前記（９）～（１１）のいずれかに記載の情報処理装置。
（１３）
　前記出力制御部は、複数のユーザに係る出力コンテキストに基づいて、前記出力表現を動的に制御する、
前記（１）～（１２）のいずれかに記載の情報処理装置。
（１４）
　前記出力制御部は、複数のユーザに係る利益の総和が増大するよう、前記出力表現を動的に制御する、
前記（１３）に記載の情報処理装置。
（１５）
　前記出力制御部は、複数のユーザに係る損失の総和が低減するよう、前記出力表現を動的に制御する、
前記（１３）または（１４）に記載の情報処理装置。
（１６）
　前記出力制御部は、前記情報提示に係る過去履歴に基づいて、前記出力表現を動的に制御する、
前記（１）～（１５）のいずれかに記載の情報処理装置。
（１７）
　前記出力コンテキストは、ユーザの状態、行動、スケジュール、または環境の状態のうち少なくともいずれかに係る情報を含む、
前記（１）～（１６）のいずれかに記載の情報処理装置。
（１８）
　前記出力制御部は、前記出力文に係る音声発話の出力表現を動的に制御する、
前記（１）～（１７）のいずれかに記載の情報処理装置。
（１９）
　プロセッサが、ユーザに対する情報提示において出力文の出力を制御すること、
　を含み、
　前記制御することは、前記出力文の出力に際し取得された出力コンテキストに基づいて、前記出力文に係る出力表現を動的に制御すること、
　をさらに含む、
情報処理方法。
（２０）
　コンピュータを、
　ユーザに対する情報提示において出力文の出力を制御する出力制御部、
　を備え、
　前記出力制御部は、前記出力文の出力に際し取得された出力コンテキストに基づいて、前記出力文に係る出力表現を動的に制御する、
　情報処理装置、
として機能させるためのプログラム。

　１０　　　情報処理端末
　１１０　　表示部
　１２０　　音声出力部
　１３０　　音声入力部
　１４０　　撮像部
　１５０　　センサ部
　１６０　　制御部
　１７０　　サーバ通信部
　２０　　　情報処理サーバ
　２１０　　ユーザ認識部
　２２０　　環境認識部
　２３０　　音声認識部
　２４０　　コンテキスト取得部
　２５０　　出力制御部
　２６０　　ユーザ情報蓄積部
　２７０　　パラメータ蓄積部
　２８０　　通信部
　３０　　　センサ装置

Claims

　ユーザに対する情報提示において出力文の出力を制御する出力制御部、
　を備え、
　前記出力制御部は、前記出力文の出力に際し取得された出力コンテキストに基づいて、前記出力文に係る出力表現を動的に制御する、
情報処理装置。
　前記出力表現は、少なくとも前記出力文の文章内容を含み、
　前記出力制御部は、前記出力コンテキストに基づいて、前記出力文の文章内容を動的に変化させる、
請求項１に記載の情報処理装置。
　前記出力表現は、前記出力文に係る出力態様、出力ニュアンス、または出力動作のうち少なくともいずれかを含み、
　前記出力制御部は、前記出力コンテキストに基づいて、前記出力態様、前記出力ニュアンス、または前記出力動作のうち少なくともいずれかを動的に変化させる、
請求項１に記載の情報処理装置。
　前記出力制御部は、時間経過に伴う前記出力コンテキストの変化に基づいて、前記出力表現を動的に制御する、
請求項１に記載の情報処理装置。
　前記出力制御部は、前記出力文の出力に係るトリガー発生時と前記出力文の出力時とにおける前記出力コンテキストの変化に基づいて、前記出力表現を動的に制御する、
請求項１に記載の情報処理装置。
　前記出力制御部は、前記出力文の少なくとも一部の内容に影響する前記出力コンテキストの変化に基づいて、前記出力表現を動的に変化させる、
請求項５に記載の情報処理装置。
　前記出力制御部は、前記トリガー発生時から前記出力時までの間におけるユーザによる所定行動の進捗に基づいて、前記出力表現を動的に変化させ、
　前記所定行動は、前記出力文の少なくとも一部に対応する行動である、
請求項５に記載の情報処理装置。
　前記出力制御部は、前記所定行動の完了が検出されたことに基づいて、前記出力表現を動的に変化さる、
請求項７に記載の情報処理装置。
　前記出力制御部は、依頼ユーザによる依頼に基づいて、対象ユーザに対する情報提示を制御する、
請求項１に記載の情報処理装置。
　前記出力制御部は、前記依頼ユーザに係る前記出力コンテキストに基づいて、前記出力表現を動的に制御する、
請求項９に記載の情報処理装置。
　前記出力制御部は、前記対象ユーザに係る前記出力コンテキストに基づいて、前記出力表現を動的に制御する、
請求項９に記載の情報処理装置。
　前記依頼ユーザと前記対象ユーザは、互いに遠隔地に位置する、
請求項９に記載の情報処理装置。
　前記出力制御部は、複数のユーザに係る出力コンテキストに基づいて、前記出力表現を動的に制御する、
請求項１に記載の情報処理装置。
　前記出力制御部は、複数のユーザに係る利益の総和が増大するよう、前記出力表現を動的に制御する、
請求項１３に記載の情報処理装置。
　前記出力制御部は、複数のユーザに係る損失の総和が低減するよう、前記出力表現を動的に制御する、
請求項１３に記載の情報処理装置。
　前記出力制御部は、前記情報提示に係る過去履歴に基づいて、前記出力表現を動的に制御する、
請求項１に記載の情報処理装置。
　前記出力コンテキストは、ユーザの状態、行動、スケジュール、または環境の状態のうち少なくともいずれかに係る情報を含む、
請求項１に記載の情報処理装置。
　前記出力制御部は、前記出力文に係る音声発話の出力表現を動的に制御する、
請求項１に記載の情報処理装置。
　プロセッサが、ユーザに対する情報提示において出力文の出力を制御すること、
　を含み、
　前記制御することは、前記出力文の出力に際し取得された出力コンテキストに基づいて、前記出力文に係る出力表現を動的に制御すること、
　をさらに含む、
情報処理方法。
　コンピュータを、
　ユーザに対する情報提示において出力文の出力を制御する出力制御部、
　を備え、
　前記出力制御部は、前記出力文の出力に際し取得された出力コンテキストに基づいて、前記出力文に係る出力表現を動的に制御する、
　情報処理装置、
として機能させるためのプログラム。