WO2019069529A1

WO2019069529A1 - 情報処理装置、情報処理方法、および、プログラム

Info

Publication number: WO2019069529A1
Application number: PCT/JP2018/026381
Authority: WO
Inventors: 真一河野; 広岩瀬; 真里斎藤; 祐平滝
Original assignee: ソニー株式会社
Priority date: 2017-10-02
Filing date: 2018-07-12
Publication date: 2019-04-11
Also published as: US11996093B2; US20200279559A1

Abstract

【課題】ユーザの状態の推定に用いられるセンシング結果を適切に決定することが可能な、情報処理装置、情報処理方法、および、プログラムを提案する。【解決手段】複数の機器から受信された複数の第１のセンシング結果の中から、ユーザの状態の推定に用いられる一以上の第２のセンシング結果を所定の基準に基づいて決定する判断部と、前記一以上の第２のセンシング結果に基づいて情報の出力を制御する出力制御部と、を備える、情報処理装置。

Description

情報処理装置、情報処理方法、および、プログラム

　本開示は、情報処理装置、情報処理方法、および、プログラムに関する。

　従来、例えばＴＴＳ（Ｔｅｘｔ　Ｔｏ　Ｓｐｅｅｃｈ）などの音声の出力を制御する技術が各種提案されている。

　例えば、下記特許文献１には、機器が、検知した人や動作に応じて出力する音声を変更する技術が記載されている。

特開２０１６－３５６１４号公報

　しかしながら、特許文献１に記載の技術では、人の状態を推定するために用いられるセンシング結果を、複数の機器によるセンシング結果の中から選択することは考慮されていない。

　そこで、本開示では、ユーザの状態の推定に用いられるセンシング結果を適切に決定することが可能な、新規かつ改良された情報処理装置、情報処理方法、および、プログラムを提案する。

　本開示によれば、複数の機器から受信された複数の第１のセンシング結果の中から、ユーザの状態の推定に用いられる一以上の第２のセンシング結果を所定の基準に基づいて決定する判断部と、前記一以上の第２のセンシング結果に基づいて情報の出力を制御する出力制御部と、を備える、情報処理装置が提供される。

　また、本開示によれば、複数の機器から受信された複数の第１のセンシング結果の中から、ユーザの状態の推定に用いられる一以上の第２のセンシング結果を所定の基準に基づいて決定することと、前記一以上の第２のセンシング結果に基づいて情報の出力をプロセッサが制御することと、を含む、情報処理方法が提供される。

　また、本開示によれば、コンピュータを、複数の機器から受信された複数の第１のセンシング結果の中から、ユーザの状態の推定に用いられる一以上の第２のセンシング結果を所定の基準に基づいて決定する判断部と、前記一以上の第２のセンシング結果に基づいて情報の出力を制御する出力制御部、として機能させるためのプログラムが提供される。

　以上説明したように本開示によれば、ユーザの状態の推定に用いられるセンシング結果を適切に決定することができる。なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。

本開示の第１の実施形態に係る情報処理システムの構成例を示した説明図である。第１の実施形態に係る機器２０の構成例を示した機能ブロック図である。第１の実施形態に係る端末１０の構成例を示した機能ブロック図である。第１の実施形態の適用例を説明するための図である。第１の実施形態の適用例を説明するための図である。第１の実施形態の適用例を説明するための図である。センシング結果の提供要求のデータの構成例を示した図である。第１の実施形態の適用例を説明するための図である。第１の実施形態の適用例におけるセンシング結果の送信データの構成例を示した図である。第１の実施形態の適用例を説明するための図である。第１の実施形態の適用例を説明するための図である。第１の実施形態の適用例を説明するための図である。第１の実施形態の適用例における、ユーザからのフィードバックの対応関係データの構成例を示した図である。第１の実施形態に係る処理の流れの一部を示したシーケンス図である。第１の実施形態に係る処理の流れの一部を示したシーケンス図である。第１の実施形態に係る処理の流れの一部を示したシーケンス図である。第１の実施形態に係る「ユーザの状態の推定処理」の流れの一部を示したフローチャートである。第１の実施形態に係る「ユーザの状態の推定処理」の流れの一部を示したフローチャートである。第１の実施形態に係る「ユーザの状態の推定処理」の流れの一部を示したフローチャートである。ユーザの状態の推定の具体例を説明するための図である。ユーザの状態の推定の具体例を説明するための図である。ユーザの状態の推定の具体例を説明するための図である。ユーザの状態の推定の具体例を説明するための図である。本開示の第２の実施形態に係る情報処理システムの構成例を示した説明図である。第２の実施形態に係る端末１０の構成例を示した機能ブロック図である。第２の実施形態に係るサーバ７０の構成例を示した機能ブロック図である。第２の実施形態に係る処理の流れの一部を示したシーケンス図である。第２の実施形態に係る処理の流れの一部を示したシーケンス図である。各実施形態に共通する端末１０のハードウェア構成例を示した説明図である。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　また、本明細書及び図面において、実質的に同一の機能構成を有する複数の構成要素を、同一の符号の後に異なるアルファベットを付して区別する場合もある。例えば、実質的に同一の機能構成を有する複数の構成要素を、必要に応じて機器２０ａおよび機器２０ｂのように区別する。ただし、実質的に同一の機能構成を有する複数の構成要素の各々を特に区別する必要がない場合、同一符号のみを付する。例えば、機器２０ａおよび機器２０ｂを特に区別する必要が無い場合には、単に機器２０と称する。

　また、以下に示す項目順序に従って当該「発明を実施するための形態」を説明する。
　１．第１の実施形態
　２．第２の実施形態
　３．ハードウェア構成
　４．変形例

　本開示は、一例として「１．第１の実施形態」～「２．第２の実施形態」において詳細に説明するように、多様な形態で実施され得る。最初に、本開示の第１の実施形態について説明する。

＜＜１．第１の実施形態＞＞
　＜１－１．システム構成＞
　まず、第１の実施形態に係る情報処理システムの構成例について、図１を参照して説明する。図１に示すように、第１の実施形態に係る情報処理システムは、端末１０、および、複数の機器２０を有する。例えば、図１に示したように、端末１０、および、複数の機器２０は、所定の空間４（例えば、家やオフィスビルディングなどの施設、車、または、屋外の所定の敷地など）内に位置し得る。

　なお、図１では、端末１０、および、複数の機器２０が、（空間４内の）同一の部屋内に位置する例を示しているが、かかる例に限定されない。端末１０、および、複数の機器２０のうちの少なくとも一つとそれ以外とは、（空間４内の）互いに異なる部屋内に位置していてもよいし、または、（空間４内の）互いに異なるフロア内に位置していてもよい。

　｛１－１－１．端末１０｝
　端末１０は、本開示に係る情報処理装置の一例である。端末１０は、各種の情報（例えば、音声、映像、または、音楽など）を出力可能な装置である。例えば、端末１０は、所定のアプリケーションサービスにおける所定の通知情報に対応する音声を、空間４内に位置するユーザ２に対して出力する。または、端末１０は、所定のアプリケーションサービスにおける、ユーザ２との対話の音声を出力する。ここで、音声は、例えばＴＴＳなどの合成音声であってもよいし、録音された音声であってもよい。以下では、音声が合成音声である例を中心に説明を行う。

　この端末１０は、例えば、据え置き型の装置、または、携帯型の装置であり得る。一例として、端末１０は、汎用ＰＣ（Ｐｅｒｓｏｎａｌ　Ｃｏｍｐｕｔｅｒ）、テレビジョン受信機、録画機器、オーディオ機器（スピーカなど）、例えばスマートフォンなどの携帯電話、タブレット型端末、デジタルカメラ、携帯型音楽プレーヤ、または、ロボットであってもよい。以下では、端末１０が、例えば図１に示したような形状の、据え置き型の装置である例を中心として説明を行う。

　また、端末１０は、無線通信および／または有線通信により、空間４内に位置する複数の機器２０と通信可能である。

　｛１－１－２．機器２０｝
　機器２０は、空間４内に配置されていたり、または、（空間４内の）ユーザ２が所持している装置である。機器２０は、例えばＤＬＮＡ（登録商標）（Ｄｉｇｉｔａｌ　Ｌｉｖｉｎｇ　Ｎｅｔｗｏｒｋ　Ａｌｌｉａｎｃｅ）などの規格に沿って、他の機器２０や端末１０と相互接続され得る。また、機器２０は、例えばＯＳＣ（ＯｐｅｎＳｏｕｎｄ　Ｃｏｎｔｒｏｌ）などの通信プロトコルを用いて、例えば音声などの音のデータを他の機器２０や端末１０との間で送受信してもよい。

　図１では、機器２０の一例として、冷蔵庫２０ａ、スマートフォン２０ｂ、および、スマートウォッチ２０ｃを図示しているが、かかる例に限定されない。機器２０は、例えば、据え置き型の装置（例えば家電機器やＩＯＴ（Ｉｎｔｅｒｎｅｔ　ｏｆ　Ｔｈｉｎｇｓ）デバイスなど（冷蔵庫、電子レンジ、洗濯機、換気扇、固定電話、ルーター、汎用ＰＣ、テレビジョン受信機、録画機器、オーディオ機器、または、ロボットなど））、携帯型の装置（例えばスマートフォンなどの携帯電話、タブレット型端末、デジタルカメラ、または、携帯型音楽プレーヤなど）、または、装着型の装置（例えばアイウェア（ＨＭＤ（Ｈｅａｄ　Ｍｏｕｎｔｅｄ　Ｄｉｓｐｌａｙ）など）、スマートウォッチ、スマートバンド、ヘッドフォン、または、イヤフォンなど）であってもよい。

　｛１－１－３．課題の整理｝
　以上、第１の実施形態に係る情報処理システムの構成について説明した。ところで、ユーザ２は空間４内を自由に移動し得るので、端末１０が、ユーザ２に関してセンシングできない、または、センシングが困難な場合が生じ得る。このような場合、端末１０は、端末１０によるセンシング結果を用いるだけでは、ユーザ２に対する通知の音声などの情報を、ユーザ２の状態に適した態様で出力することが困難である。その結果、当該情報の内容がユーザ２に十分伝わらない恐れがある。

　そこで、上記事情を一着眼点にして、第１の実施形態に係る端末１０を創作するに至った。第１の実施形態に係る端末１０は、複数の機器２０から受信された複数のセンシング結果の中から、ユーザの状態の推定に用いられる一以上の選出センシング結果を所定の基準に基づいて決定し、そして、当該一以上の選出センシング結果に基づいて情報の出力を制御する。これにより、例えば端末１０がユーザ２に関してセンシングし難い状況であっても、ユーザの状態に適した態様で情報を出力することができる。ここで、選出センシング結果は、本開示における第２のセンシング結果の一例である。以下、第１の実施形態の内容についてさらに詳細に説明する。

　＜１－２．構成：機器２０＞
　次に、第１の実施形態に係る構成について説明する。図２は、第１の実施形態に係る機器２０の構成例を示した機能ブロック図である。図２に示すように、端末１０は、制御部２００、通信部２２０、センサ部２２２、および、記憶部２２４を有する。

　｛１－２－１．センサ部２２２｝
　センサ部２２２は、例えば、加速度センサ、方位センサ、距離センサ（例えばｔｉｍｅ　ｏｆ　ｆｌｉｇｈｔ方式のセンサ、または、ステレオカメラなど）、マイクロフォン、温度センサ、カメラ（イメージセンサ）、生体センサ、および、筋電センサのうちの少なくとも一つを含み得る。さらに、センサ部２２２は、例えばＧＰＳ（Ｇｌｏｂａｌ　Ｐｏｓｉｔｉｏｎｉｎｇ　Ｓｙｓｔｅｍ）やＧＬＯＮＡＳＳ（Ｇｌｏｂａｌ　Ｎａｖｉｇａｔｉｏｎ　Ｓａｔｅｌｌｉｔｅ　Ｓｙｓｔｅｍ）などの測位衛星から測位信号を受信する受信機を含み得る。

　センサ部２２２は、ユーザの状態に関してセンシングし得る。例えば、センサ部２２２は、ユーザの動きに関してセンシング（例えば撮像など）する。一例として、センサ部２２２は、ユーザの体全体の動きの速度、方向、および、距離などをセンシングしてもよい。または、センサ部２２２は、ユーザの頭部、手、または、首などの動きをセンシングしてもよい。または、センサ部２２２は、ユーザの顔（例えば表情など）をセンシングしてもよい。

　または、センサ部２２２は、ユーザのバイタル情報（例えば、手や足の発汗量、心拍数、呼吸数、または、脳波の乱れ具合など）をセンシングする。または、センサ部２２２は、ユーザの眼の状態（例えば、瞬きの頻度や回数、視線の動きや方向、瞳孔の開き具合など）をセンシングする。または、センサ部２２２は、ユーザが音を発した否か、および、ユーザが発した音の種類（例えば、言語音、非言語音（例えばうめき、咆哮、笑いなど）、鼻歌や歌声、または、非音声の音（例えば咳、くしゃみなど）など）をセンシングする。

　なお、センサ部２２２に含まれる個々のセンサは、常時センシングをしてもよいし、定期的にセンシングしてもよいし、または、特定の場合（例えば制御部２００からの指示があった場合など）にのみセンシングしてもよい。

　｛１－２－２．制御部２００｝
　制御部２００は、例えばＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）やＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）などの処理回路を含んで構成され得る。制御部２００は、端末１０の動作を統括的に制御する。例えば、制御部２００は、他の装置に対する情報の送信を制御する。詳細については後述するが、端末１０からセンシング結果の提供要求が受信された場合などに、制御部２００は、センサ部２２２によるセンシング結果を端末１０へ通信部２２０に送信させる。

　さらに、制御部２００は、センサ部２２２によるセンシング結果に基づいて、ユーザの状態に関する所定の認識を行ってもよい。例えば、制御部２００は、センサ部２２２によるセンシング結果（例えばユーザの全身の撮像画像など）に基づいて、ユーザのジェスチャ（例えば頭部のうなずき、手の振り、座っていること、立っていること、走っていること、歩いていること、じっとしていること、または、激しく動いていることなど）を認識可能であってもよい。また、制御部２００は、センサ部２２２によるセンシング結果（例えばユーザの顔の撮像画像など）に基づいて、ユーザの感情を認識可能であってもよい。例えば、制御部２００は、当該センシング結果に基づいて、ユーザの感情がポジティブな感情（喜びなど）であるか否か、または、ネガティブな感情（悲しみなど）であるか否かなどを認識してもよい。

　また、制御部２００は、センサ部２２２によるセンシング結果に基づいて、ユーザの集中度合いを認識可能であってもよい。また、制御部２００は、センサ部２２２によるセンシング結果に基づいて、ユーザのリラックス度合いを認識可能であってもよい。一例として、制御部２００は、まず、当該センシング結果に基づいて、ユーザが「休んでいる」か否かを認識する。そして、ユーザが「休んでいる」と認識された場合には、制御部２００は、ユーザのリラックス度合いが所定の閾値以上であると認識してもよい。一方、ユーザが「休んでいない」と認識された場合には、制御部２００は、ユーザのリラックス度合いが当該所定の閾値未満であると認識してもよい。

　｛１－２－３．通信部２２０｝
　通信部２２０は、例えば無線通信および／または有線通信により、他の装置との間で情報の送受信を行う。例えば、通信部２２０は、制御部２００の制御に従って、センサ部２２２に含まれる各種のセンサ（例えば全てのセンサなど）によるセンシング結果を端末１０へ送信する。また、通信部２２０は、センサ部２２２によるセンシング結果の提供要求や、後述する、ユーザの評価度を示す情報を端末１０から受信し得る。

　｛１－２－４．記憶部２２４｝
　記憶部２２４は、各種のデータや、各種のソフトウェアを記憶する。例えば、当該ユーザの評価度を示す情報が端末１０から受信される度に、記憶部２２４は、当該ユーザの評価度を示す情報を記憶する。

　＜１－３．構成：端末１０＞
　次に、第１の実施形態に係る端末１０の構成例について説明する。図３は、第１の実施形態に係る端末１０の構成例を示した機能ブロック図である。図３に示すように、端末１０は、制御部１００、通信部１２０、センサ部１２２、出力部１２４、および、記憶部１２６を有する。

　｛１－３－１．センサ部１２２｝
　センサ部１２２は、一以上のカメラ（イメージセンサ）、および、複数チャネル（例えば８ｃｈなど）のマイクロフォンを含み得る。例えば、当該複数チャンネルのマイクロフォンを有することにより、端末１０は、当該マイクロフォンによる収音結果に基づいて音源の位置を推定することが可能である。

　さらに、センサ部１２２は、例えば、加速度センサ、方位センサ、距離センサ（例えばｔｉｍｅ　ｏｆ　ｆｌｉｇｈｔ方式のセンサ、または、ステレオカメラなど）、温度センサ、生体センサ、および、筋電センサのうちの一以上を含んでもよい。さらに、センサ部１２２は、例えばＧＰＳやＧＬＯＮＡＳＳなどの測位衛星から測位信号を受信する受信機を含んでもよい。

　（１－３－１－１．ユーザに関するセンシング）
　センサ部１２２は、ユーザの状態（例えば、ユーザの動き、ユーザの眼の状態、および、ユーザが発した音の種類など）に関してセンシングし得る。なお、センサ部１２２による具体的なセンシングの内容の一部は、（前述した）機器２０のセンサ部１２２と同様であってもよい。

　（１－３－１－２．フィードバックのセンシング）
　図１１を参照して後述するように、出力部１２４による情報の出力に対してユーザがフィードバックの発話をした場合には、センサ部１２２（例えばマイクロフォン）は、さらに、当該フィードバックの発話をセンシングすることも可能である。例えば、ユーザに対する通知情報などの情報が出力部１２４により出力された後に、当該情報の出力に対して当該ユーザがフィードバックの発話をし得る。この場合、センサ部１２２は、当該フィードバックの発話をセンシングし得る。これにより、端末１０は、当該センシング結果に基づいて、上記の情報の出力に対するユーザの評価度を特定することができる。

　あるいは、ユーザは、当該情報の出力に対して、（発話する代わりに）所定の通信端末を用いて、当該情報の出力に対するフィードバックの情報を端末１０へ送信し得る。この場合、後述する通信部１２０が、当該フィードバックの情報を受信し得る。

　なお、センサ部１２２に含まれる個々のセンサは、常時センシングをしてもよいし、定期的にセンシングしてもよいし、または、特定の場合（例えば制御部１００からの指示があった場合など）にのみセンシングしてもよい。

　｛１－３－２．制御部１００｝
　制御部１００は、例えば、後述するＣＰＵ１５０やＧＰＵなどの処理回路を含んで構成され得る。制御部１００は、端末１０の動作を統括的に制御する。また、図３に示すように、制御部１００は、判断部１０２、ユーザ状態推定部１０４、出力制御部１０６、および、送信制御部１０８を有する。

　例えば、制御部１００は、センサ部１２２によるセンシング結果に基づいて、ユーザの状態に関する所定の認識（例えば、ジェスチャ認識や感情認識など）を行ってもよい。なお、制御部１００による具体的な認識の内容の一部は、（前述した）機器２０の制御部２００と同様であってもよい。

　｛１－３－３．判断部１０２｝
　判断部１０２は、複数の機器２０から受信された複数のセンシング結果の中から、ユーザの状態の推定に用いられる一以上の選出センシング結果を所定の基準に基づいて決定する。例えば、判断部１０２は、複数のセンシング種類の各々に関して、複数の機器２０から受信された複数のセンシング結果の中から、当該センシング種類に対応するセンシング結果を当該所定の基準に基づいてそれぞれ選択することにより、当該一以上の選出センシング結果を決定する。ここで、当該複数のセンシング種類の各々は、各センサの種類と対応し得る。例えば、当該複数のセンシング種類は、撮像、収音、加速度のセンシング、または、心拍数のセンシングなどを含んでもよい。

　または、判断部１０２は、複数の機器２０から受信された複数のセンシング結果およびセンサ部１２２によるセンシング結果の中から、当該所定の基準に基づいて当該一以上の選出センシング結果を決定することも可能である。例えば、判断部１０２は、当該複数のセンシング種類の各々に関して、センサ部１２２による当該センシング種類に対応する、当該ユーザに関するセンシングの可否、または、センサ部１２２による当該センシング種類に対応する、当該ユーザに関するセンシング結果の精度と、当該所定の基準とに基づいて、当該複数の機器２０から受信された複数のセンシング結果およびセンサ部１２２によるセンシング結果の中から、当該センシング種類に対応するセンシング結果を当該所定の基準に基づいてそれぞれ選択することにより、当該一以上の選出センシング結果を決定してもよい。

　一例として、判断部１０２は、当該複数のセンシング種類の各々に関して、センサ部１２２による当該センシング種類に対応する、当該ユーザに関するセンシングが不可能と判定された場合、および、センサ部１２２による当該センシング種類に対応する、当該ユーザに関するセンシング結果の精度が所定の閾値よりも低い場合には、判断部１０２は、当該複数の機器２０から受信された複数のセンシング結果のみの中から、当該センシング種類に対応するセンシング結果を当該所定の基準に基づいてそれぞれ選択してもよい。つまり、この場合、センサ部１２２による当該センシング種類に対応するセンシング結果は、当該一以上の選出センシング結果として選択されない。

　例えば、センサ部１２２のカメラにより撮像された画像に該当のユーザが全く写っていない場合、または、当該ユーザの体の一部しか写っていない場合には、判断部１０２は、画像に関しては、当該複数の機器２０から受信された複数の画像のうちのいずれか一以上を当該所定の基準に基づいて選択してもよい。または、センサ部１２２のマイクロフォンによる収音結果において該当のユーザが発した音の音量が所定の閾値以下である場合には、判断部１０２は、音に関しては、当該複数の機器２０から受信された複数の収音結果のうちのいずれか一以上を当該所定の基準に基づいて選択してもよい。

　（１－３－３－１．所定の基準）
　‐第１の基準
　以下では、上記の判断部１０２の機能（選出センシング結果の決定）についてさらに詳細に説明する。上記の所定の基準は、複数の機器２０の各々とユーザとの距離（以下、第１の基準と称する場合もある）を含み得る。例えば、判断部１０２は、当該複数のセンシング種類の各々に関して、複数の機器２０のうち、ユーザに最も近い機器２０による当該センシング種類に対応するセンシング結果を、当該複数の機器２０から受信された複数のセンシング結果の中からそれぞれ選択することにより、当該一以上の選出センシング結果を決定してもよい。

　‐第２の基準
　また、上記の所定の基準は、複数の機器２０の各々の性能情報（以下、第２の基準と称する場合もある）を含み得る。例えば、判断部１０２は、当該複数のセンシング種類の各々に関して、複数の機器２０のうち、当該センシング種類に関するセンシングの性能がより高い機器２０による当該センシング種類に対応するセンシング結果を、当該複数の機器２０から受信された複数のセンシング結果の中からそれぞれ選択してもよい。一例として、画像に関しては、複数の機器２０のうち、カメラの画素数が最も高い機器２０により撮像された画像を、当該複数の機器２０から受信された複数の画像の中から選択してもよい。

　‐第３の基準
　また、上記の所定の基準は、複数の機器２０の各々の製造元の信頼度（以下、第３の基準と称する場合もある）を含み得る。例えば、判断部１０２は、当該複数のセンシング種類の各々に関して、複数の機器２０のうち、製造元（例えばメーカーや製造国など）の信頼度がより高い機器２０による当該センシング種類に対応するセンシング結果を、当該複数の機器２０から受信された複数のセンシング結果の中からそれぞれ選択してもよい。

　なお、各製造元の信頼度は予め登録され得る。例えば、各製造元の信頼度は、記憶部１２６に予め記憶されていてもよいし、または、端末１０が、例えば所定のネットワーク（インターネットなど）を介して通信可能な外部の装置（図示省略）に記憶されていてもよい。

　‐第４の基準
　また、上記の所定の基準は、複数の機器２０の各々に関連付けられているユーザの評価度（以下、第４の基準と称する場合もある）を含み得る。例えば、判断部１０２は、当該複数のセンシング種類の各々に関して、複数の機器２０の各々に関連付けて記憶されているユーザの評価度がより高い機器２０による、当該センシング種類に対応するセンシング結果を、当該複数の機器２０から受信された複数のセンシング結果の中からそれぞれ選択してもよい。

　‐組み合わせ
　なお、上記の所定の基準は、複数の種類の基準の組み合わせであってもよい。例えば、当該組み合わせは、前述した４種類の基準のうちのいずれか２以上の組み合わせであってもよいし、または、当該４種類の基準を含む５種類以上の基準の組み合わせであってもよい。これらの場合、判断部１０２は、当該複数のセンシング種類の各々に関して、当該複数の種類の基準の組み合わせと、当該複数の種類の基準の各々に関連付けられている優先順位とに基づいて、当該センシング種類に対応するセンシング結果を、当該複数の機器２０から受信された複数のセンシング結果の中からそれぞれ選択してもよい。

　例えば、優先順位が高い順が、第１の基準（機器２０とユーザとの距離）、第２の基準（機器２０の性能情報）、第３の基準（機器２０の製造元の信頼度）、および、第４の基準（機器２０に対するユーザの評価度の履歴）であるように、当該４種類の基準の各々の優先度が定められていてもよい。一例として、当該４種類の基準の各々に関して、優先度がより高い基準ほど、より大きい重み（係数）が設定されていてもよい。この場合、判断部１０２は、センシング種類ごとに、まず、当該複数の機器２０から受信された複数のセンシング結果の各々に関して、当該４種類の基準の各々に基づいて当該センシング結果が評価された値（評価値）と、当該４種類の基準の各々に設定されている重みとを用いて重み付け和を算出する。そして、センシング種類ごとに、判断部１０２は、当該複数のセンシング結果の中で、算出された重みづけ和が最も高いセンシング結果をそれぞれ選択することにより、当該一以上の選出センシング結果を決定してもよい。

　（１－３－３－２．変形例）
　変形例として、当該４種類の基準の各々の優先順位は、センシング種類ごとに別々に定められていてもよい。例えば、音声や加速度のセンシングに関しては優先順位が最も高い基準は第１の基準であり、かつ、画像のセンシング（カメラ）に関しては、優先順位が最も高い基準は第２の基準であるように定められていてもよい。

　別の変形例として、判断部１０２は、カメラ（画像のセンシング）に関しては、例えば第１の基準（機器２０とユーザとの距離）に依存せずに、ユーザの顔が写っている撮像画像を、ユーザの顔が写っていない撮像画像よりも（当該選出センシング結果として）優先的に選択してもよい。この選択例によれば、端末１０は、当該撮像画像に基づいてユーザの表情をより精度高く認識可能になり得る。従って、ユーザの感情の推定精度が向上し得る。

　別の変形例として、判断部１０２は、音に関しては、収音されたユーザの発話の音が直接音であるか、または、間接音（反射音など）であるかの判定結果に基づいて、当該複数の機器２０から受信された複数のセンシング結果の中から一以上を（当該選出センシング結果として）選択してもよい。例えば、判断部１０２は、ユーザの発話の音が直接音として収音された収音結果を、（ユーザの発話の音が）間接音として収音された収音結果よりも（当該選出センシング結果として）優先的に選択してもよい。

　｛１－３－４．ユーザ状態推定部１０４｝
　（１－３－４－１．ユーザの状態の推定）
　ユーザ状態推定部１０４は、判断部１０２により決定された一以上の選出センシング結果を用いて、ユーザの状態を推定する。例えば、予め複数の種類の所定の状態が定義され得る。この場合、ユーザ状態推定部１０４は、当該一以上の選出センシング結果と、所定の判定基準とに基づいて、ユーザの状態が当該複数の種類の所定の状態のうちのいずれであるかを推定し得る。ここで、当該所定の判定基準は、例えば、ユーザが活発状態であるか否かの判定結果、ユーザが発した音の種類の判定結果、ユーザが休んでいるか否かの判定結果、および、ユーザの集中度合いの判定結果などを含み得る。

　ここで、当該複数の種類の所定の状態は、例えば、「強調して通知すべき状態」、「後で通知すべき状態」、および、「通常状態」の３種類である。「強調して通知すべき状態」は、通常の設定よりも強調してユーザに対して情報を通知すべき状態（換言すれば、ユーザを盛り上げるべき状態）であり得る。「後で通知すべき状態」は、ユーザに対して現在は情報を出力せず、かつ、所定の時間経過後に当該情報を通知すべき状態（換言すれば、ユーザをそっとしておくべき状態）であり得る。「通常状態」は、通常の設定で、ユーザに対して情報を通知すべき状態であり得る。なお、具体的な推定例について、例えば「１－７節」において後述する。

　（１－３－４－２．所定の判定基準に関する判定）
　なお、ユーザ状態推定部１０４は、さらに、上記の所定の判定基準に対応する判定を行うことも可能である。例えば、ユーザ状態推定部１０４は、当該一以上の選出センシング結果を用いて、ユーザが活発状態であるか否かを判定する。一例として、ユーザ状態推定部１０４は、まず、当該一以上の選出センシング結果を用いて、ユーザの体のうち動いている部分を認識し得る。そして、体のうち動いている部分が大きい場合には、ユーザ状態推定部１０４は、当該ユーザが活発状態であると判定する。また、体のうち動いている部分が小さい場合には、ユーザ状態推定部１０４は、当該ユーザが不活発状態であると判定する。

　さらに、ユーザ状態推定部１０４は、当該一以上の選出センシング結果（例えば収音結果など）を用いて、ユーザが音を発したか否かを判定し、かつ、ユーザが発した音の種類を判定し得る。例えば、ユーザ状態推定部１０４は、ユーザが発した音の種類が、言語音、鼻歌・歌声、非言語音、および、非音声のうちのいずれであるかを判定する。

　さらに、ユーザ状態推定部１０４は、当該一以上の選出センシング結果を用いて、ユーザが休んでいるか否かを判定し得る。例えば、ユーザ状態推定部１０４は、まず、当該一以上の選出センシング結果を用いて、ユーザのリラックス度合いを判定する。そして、リラックス度合いが所定の閾値以上であると判定された場合には、ユーザ状態推定部１０４は、当該ユーザが「休んでいる」と判定する。また、リラックス度合いが当該所定の閾値未満であると判定された場合には、ユーザ状態推定部１０４は、当該ユーザが「休んでいない」と判定する。

　また、ユーザ状態推定部１０４は、当該一以上の選出センシング結果（例えば顔の撮像画像など）を用いて、ユーザの集中度合いを判定し得る。例えば、ユーザ状態推定部１０４は、まず、当該一以上の選出センシング結果を用いて、当該ユーザの瞬き数を判定する。そして、当該ユーザの瞬き数が所定の閾値以上である場合には、ユーザ状態推定部１０４は、当該ユーザが集中していないと判定する。また、当該ユーザの瞬き数が当該所定の閾値未満である場合には、ユーザ状態推定部１０４は、当該ユーザが集中していないと判定する。

　｛１－３－５．出力制御部１０６｝
　出力制御部１０６は、後述する出力部１２４による情報（例えば映像、音声、音楽など）の出力を制御する。例えば、出力制御部１０６は、ユーザ状態推定部１０４により推定されたユーザの状態に基づいて、例えば当該ユーザに対する通知情報などの情報を出力部１２４に出力させる。

　一例として、出力制御部１０６は、当該ユーザに対する通知情報に対応する音声（以下では、「通知の音声」と称する場合がある）を、ユーザ状態推定部１０４により推定されたユーザの状態に対応する出力態様で出力部１２４に出力させる。さらに、出力制御部１０６は、ユーザ状態推定部１０４により推定されたユーザの状態に基づいて、当該通知情報の通知タイミングを決定し、かつ、当該通知情報に対応する音声を当該通知タイミングに出力部１２４に出力させてもよい。

　（１－３－５－１．制御例１）
　例えば、ユーザ状態推定部１０４により、ユーザの状態が「強調して通知すべき状態」であると推定されたとする。この場合、出力制御部１０６は、（通常の話者から）例えばテンション高く話す話者やＤＪ調の話者などに、話者を変更してもよい。または、出力制御部１０６は、予め当該ユーザにより登録されている、当該ユーザの好みの話者に通常の話者から変更してもよい。さらに、出力制御部１０６は、変更後の話者に応じて、音声の文言を変更してもよい。

　さらに、この場合、出力制御部１０６は、当該ユーザに対する通知の音声を例えばユーザの動きの切り替わりのタイミングに出力させるなど、当該音声の出力タイミングを変更してもよい。さらに、出力制御部１０６は、例えばピッチを高くするなど声質を（通常の設定から）変更してもよいし、話速を（通常の設定よりも）速くしてもよいし、または、音声の音量を（通常の設定よりも）大きくしてもよい。さらに、出力制御部１０６は、当該通知の音声に対して、他のＴＴＳ用のコンテンツ（例えば当該通知に影響しないＴＴＳ用のコンテンツなど）を付加し、そして、付加後のコンテンツを出力部１２４に出力させてもよい。

　（１－３－５－２．制御例２）
　別の例として、ユーザ状態推定部１０４により、ユーザの状態が「後で通知すべき状態」であると推定されたとする。この場合、出力制御部１０６は、ユーザに対する通知情報に関連付けられている通知タイミングには当該通知情報を出力させず、かつ、当該通知タイミングから所定の時間経過後に当該通知情報を出力部１２４に出力させてもよい。例えば、現在時刻が、ユーザに対する通知情報に関連付けられている通知タイミングになった際には、出力制御部１０６は、まず、例えばおっとり話す話者やカウンセラー調の話者などに、（通常の話者から）話者を変更し、かつ、例えば「お知らせがあるけど後にしましょう」などの、通知情報の存在を知らせるためのＴＴＳだけを出力部１２４に出力させる。そして、当該通知タイミングから所定の時間経過後（あるいは、ユーザ状態推定部１０４により新たに推定されたユーザの状態が「後で通知すべき状態」以外に変化したタイミング）に、出力制御部１０６は、当該通知情報に対応する音声を出力部１２４に出力させる。

　｛１－３－６．送信制御部１０８｝
　送信制御部１０８は、他の装置に対する各種の情報の送信を制御する。例えば、送信制御部１０８は、センシング結果の提供要求を空間４内の複数の機器２０（例えば全ての機器２０）へ通信部１２０に送信させる。さらに、出力部１２４により情報が出力された後に当該情報の出力に関してユーザからフィードバックが得られた場合には、送信制御部１０８は、当該フィードバックに対応するユーザの評価度を示す情報を複数の機器２０へ通信部１２０に送信させる。例えば、送信制御部１０８は、上記の一以上の選出センシング結果の各々をセンシングした個々の機器２０に対してのみ、当該ユーザの評価度を示す情報を通信部１２０に送信させてもよい。

　｛１－３－７．通信部１２０｝
　通信部１２０は、後述する通信装置１６６を含んで構成され得る。通信部１２０は、無線通信および／または有線通信により他の装置との間で情報の送受信を行う。例えば、通信部１２０は、センシング結果の提供要求やユーザの評価度を示す情報などを、送信制御部１０８の制御に従って複数の機器２０へ送信する。また、通信部１２０は、空間４内の複数の機器２０からセンシング結果を受信する。

　｛１－３－８．出力部１２４｝
　出力部１２４は、後述する出力装置１６２を含んで構成され得る。出力部１２４は、出力制御部１０６の制御に従って各種の情報（映像や音など）を出力する。出力部１２４は、音声出力部を有し得る。当該音声出力部は、例えばスピーカ、イヤフォン、または、ヘッドフォンなどを含んで構成される。当該音声出力部は、出力制御部１０６の制御に従って、音（音声や音楽など）を出力する。

　さらに、出力部１２４は、表示部を有し得る。当該表示部は、例えば、ＬＣＤ（Ｌｉｑｕｉｄ　Ｃｒｙｓｔａｌ　Ｄｉｓｐｌａｙ）、ＯＬＥＤ（Ｏｒｇａｎｉｃ　Ｌｉｇｈｔ　Ｅｍｉｔｔｉｎｇ　Ｄｉｏｄｅ）など）、または、プロジェクタなどを含んで構成される。当該表示部は、出力制御部１０６の制御に従って、映像を表示（投影など）する。

　｛１－３－９．記憶部１２６｝
　記憶部１２６は、後述するストレージ装置１６４を含んで構成され得る。記憶部１２６は、各種のデータや、各種のソフトウェアを記憶する。例えば、記憶部１２６は、通信部１２０またはセンサ部１２２により取得された、出力部１２４による情報の出力に関するユーザの評価度を示す情報と、判断部１０２により決定された一以上の選出センシング結果の各々をセンシングした個々の機器２０とを関連付けて記憶する。

　＜１－４．適用例＞
　以上、第１の実施形態の構成について説明した。次に、第１の実施形態に係る適用例について、図４～図１３を参照して説明する。図４は、本適用例を説明するための図である。

　｛１－４－１．情報の通知タイミングの到来前｝
　図４に示したように、本適用例では、ユーザ２、端末１０、複数の機器２０（例えば冷蔵庫２０ａ、スマートフォン２０ｂ、スマートウォッチ２０ｃ、および、テレビジョン受信機２０ｄなど）、および、複数の障害物３０（例えばキッチン３０ｄ、テーブル３０ｂ、および、壁３０ｃなど）が空間４内に位置していることを想定する。

　ここで、ユーザ２は、例えばネックストラップを用いて、スマートフォン２０ｂを首にかけている。また、ユーザ２は、スマートウォッチ２０ｃを腕に装着している。さらに、図４に示したように、ユーザ２は歌を歌っているものとする。

　また、冷蔵庫２０ａは、高感度マイクロフォン、高感度カメラ、および、ＧＰＳ受信機を内蔵している。例えば、冷蔵庫２０ａは、ユーザ２の音声を収音し、ユーザ２の全身を撮像し、かつ、冷蔵庫２０ａの位置情報をセンシングすることが可能である。スマートフォン２０ｂは、マイクロフォン、加速度センサ、および、ＧＰＳ受信機を内蔵している。例えば、スマートフォン２０ｂは、ユーザ２の音声を収音し、かつ、スマートフォン２０ｂの加速度および位置情報をセンシングすることが可能である。スマートウォッチ２０ｃは、カメラ、加速度センサ、および、ＧＰＳ受信機を内蔵している。例えば、スマートウォッチ２０ｃは、スマートウォッチ２０ｃの周辺（ユーザ２の身体の一部を含む）を撮像し、かつ、スマートフォン２０ｂの加速度および位置情報をセンシングすることが可能である。

　図５は、図４に示した状況における、端末１０のセンサ部１２２によるセンシング可能な範囲を示した図である。図５に示したように、センサ部１２２のカメラの画角内４０ａにユーザ２は位置していない。このため、当該カメラにより撮像される画像にはユーザ２が写り得ない。従って、端末１０は、当該カメラによる撮像画像を用いて、ユーザ２の動きを認識することはできない。

　また、図５に示したように、センサ部１２２のマイクロフォンが収音可能な範囲４０ｂからユーザ２は離れて位置しており、かつ、収音可能な範囲４０ｂとユーザ２との間には、一定の高さを有する障害物３０ｃ（壁および引き戸）が位置している。このため、当該マイクロフォンは、ユーザ２の音声をほとんど収音できない。

　｛１－４－２．情報の通知タイミングの到来時｝
　図４（および図５）に示した状況において、ユーザ２に対する所定の通知情報の通知タイミングが到来したとする。前述したように、図４に示した状況では、端末１０は、ユーザの状態の推定に利用可能なセンシング結果をほとんど取得できていない。そこで、ユーザの状態の推定に利用可能なセンシング結果を収集するために、図６に示したように、端末１０の送信制御部１０８は、空間４内の全ての機器２０へセンシング結果の提供要求を通信部１２０に送信させる。

　図７は、センシング結果の提供要求のデータの構成例（提供要求データ５０）を示した図である。図７に示したように、提供要求データ５０は、例えば、トランザクションＩＤ５００、送信元５０２、および、送信先５０４を含む。ここで、送信元５０２には、端末１０の識別情報が格納される。送信先５０４には、各機器２０（図７に示した例では冷蔵庫２０ａ）の識別情報が格納される。

　｛１－４－３．センシング結果の送信｝
　その後、センシング結果の提供要求が各機器２０に受信される。この場合、図８に示したように、各機器２０は、センサ部２２２によるセンシング結果（例えば当該提供要求の受信時におけるセンシング結果など）を端末１０へ送信する。

　図９は、各機器２０によるセンシング結果の送信データの構成例（センシング結果の送信データ５２）を示した図である。図９に示したように、センシング結果の送信データ５２は、例えば、トランザクションＩＤ５２０、送信元５２２、送信先５２４、センシング開始日時５２６、センシング終了日時５２８、および、センサ情報５３０を含む。ここで、送信元５２２には、各機器２０（図９に示した例では冷蔵庫２０ａ）の識別情報が格納される。送信先５２４には、端末１０の識別情報が格納される。センシング開始日時５２６には、該当のセンシング結果のセンシング開始日時が記録される。センシング終了日時５２８には、該当のセンシング結果のセンシング終了日時が記録される。このようにセンシング開始日時およびセンシング終了日時が記録されることにより、該当のセンシング結果のセンシング区間が特定可能になる。

　また、図９に示したように、センサ情報５３０は、センサＩＤ５３００、センサ種類５３０２、ベンダー５３０４、感度５３０６、位置情報５３０８、過去の評価５３１０、および、センシング結果５３２０を含む。なお、図９では、センサ情報５３０に一種類のセンシング結果（具体的には、収音結果）のデータだけが記録されている例を示しているが、かかる例に限定されず、例えば該当の機器２０（図９に示した例では冷蔵庫２０ａ）が有する全てのセンサの各々によるセンシング結果のデータが記録されていてもよい。

　ここで、センサＩＤ５３００には、該当の機器２０が有する個々のセンサに割り当てられているＩＤが記録される。センサ種類５３０２には、該当のＩＤのセンサの種類が記録される。ベンダー５３０４には、該当のＩＤのセンサ（または該当の機器）のメーカーが記録される。感度５３０６には、該当のＩＤのセンサの感度などの性能情報が記録される。位置情報５３０８には、例えばＧＰＳ受信機などにより取得された該当の機器（または該当のＩＤのセンサ）の位置情報が記録される。

　過去の評価５３１０には、該当のＩＤのセンサに対応するユーザの評価の履歴情報が格納される。より詳細には、過去の評価５３１０には、端末１０が、該当のＩＤのセンサによるセンシング結果を選出センシング結果として選択し、かつ、当該センシング結果に基づいてユーザに対して情報を出力した際の、当該情報の出力に関して当該ユーザから取得された評価の履歴情報が格納され得る。図９に示したように、過去の評価５３１０は、平均値５３１２、および、ｐｏｓｉｔｉｖｅ回数５３１４を含む。平均値５３１２には、該当のＩＤのセンサに対応する、過去にユーザから得られた評価の度合いの平均値が記録される。ｐｏｓｉｔｉｖｅ回数５３１４には、該当のＩＤのセンサに対応する、過去にユーザからポジティブな評価（回答）が得られた回数が記録される。

　また、センシング結果５３２０には、該当のＩＤのセンサによるセンシング結果に関連する情報が記録される。図９に示したように、該当のＩＤのセンサが「マイクロフォン」である場合、センシング結果５３２０は、例えば、種類５３２２、平均ボリューム５３２４、平均ピッチ５３２６、および、感情種類５３２８を含む。ここで、種類５３２２には、該当のＩＤのセンサによりセンシングされた情報の種類（例えば音、画像、加速度など）が記録される。感情種類５３２８には、該当のＩＤのセンサによるセンシング結果に基づいてユーザ２の感情を該当の機器２０が認識可能であった場合に当該認識結果（例えば、感情の種類など）が記録される。

　｛１－４－４．選出センシング結果の決定｝
　その後、端末１０の判断部１０２は、複数のセンシング種類の各々に関して、複数の機器２０から受信された複数のセンシング結果の中から、当該センシング種類に対応するセンシング結果を上記所定の基準に基づいてそれぞれ選択することにより、一以上の選出センシング結果を決定する。

　例えば、音のセンシング（収音）に関しては、機器２０の性能情報（第２の基準）よりも、機器２０とユーザ２との距離（第１の基準）の方が優先順位が高く定められているとする。図４～図８に示した例では、スマートフォン２０ｂよりも冷蔵庫２０ａの方がマイクロフォンの性能は高い。一方で、冷蔵庫２０ａよりもスマートフォン２０ｂの方がユーザ２に近い。そこで、判断部１０２は、収音に関しては、（冷蔵庫２０ａによるセンシング結果ではなく）スマートフォン２０ｂによるセンシング結果を選出センシング結果として選択する。

　また、画像のセンシング（撮像）に関しては、機器２０とユーザとの距離（第１の基準）よりも、機器２０の性能情報（第２の基準）の方が優先順位が高く定められているとする。図４～図８に示した例では、冷蔵庫２０ａよりもスマートウォッチ２０ｃの方がユーザ２に近い。一方で、スマートウォッチ２０ｃが内蔵するカメラよりも、冷蔵庫２０ａが内蔵するカメラの方が解像度が高い。さらに、スマートウォッチ２０ｃのカメラの画角内に収まっているユーザ２の体の範囲よりも、冷蔵庫２０ａのカメラの画角内に収まっているユーザ２の体の範囲の方が大きい。そこで、判断部１０２は、撮像に関しては、（スマートウォッチ２０ｃによるセンシング結果ではなく）冷蔵庫２０ａによるセンシング結果を選出センシング結果として選択する。

　なお、端末１０は、各機器２０とユーザ２との距離を特定するために、複数の機器２０によるセンシング結果を複合的に用いることが可能である。例えば、端末１０は、まず、冷蔵庫２０ａのカメラにより撮影された（ユーザ２の全身が写っている）画像に基づいて、ユーザ２がスマートフォン２０ｂを携帯していることや、ユーザ２がスマートウォッチ２０ｃを装着していることを認識する。次に、端末１０は、例えば、スマートフォン２０ｂによりセンシングされた位置情報、または、スマートウォッチ２０ｃによりセンシングされた位置情報とユーザ２の位置情報とを同一とみなすことにより、ユーザ２の位置情報を特定する。そして、端末１０は、他の機器２０（例えば冷蔵庫２０ａやテレビジョン受信機２０ｄ）によりセンシングされた位置情報と、特定されたユーザ２の位置情報との差分を算出することにより、当該他の機器２０とユーザ２との距離を特定する。あるいは、端末１０は、公知の空間エレクトロニクスに関する技術を用いて、空間４内の個々の機器２０とユーザ２との距離を特定してもよい。

　｛１－４－５．ＴＴＳの出力設定の決定｝
　その後、端末１０のユーザ状態推定部１０４は、判断部１０２により決定された複数の選出センシング結果を用いてユーザ２の状態を推定する。ここでは、ユーザ２の状態が「強調して通知すべき状態」であると推定されたとする。

　そして、出力制御部１０６は、推定されたユーザの状態に基づいて、ユーザ２に対する通知情報の出力設定を決定する。例えば、端末１０は、スマートフォン２０ｂから受信された、音のセンシング結果に基づいて、ユーザ２が歌を歌っていることを認識し得る。そこで、出力制御部１０６は、まず、ユーザに対する通知の音声を出力する前に、通常よりも大きい音量のサウンドフィードバックを出力部１２４に出力させることを決定する。さらに、出力制御部１０６は、当該通知の音声のピッチが通常よりも高くなり、当該音声の速度（話速）が通常よりも速くなり、かつ、当該音声の音量が通常よりも大きくなるように、当該音声の出力設定を決定する。

　また、端末１０は、冷蔵庫２０ａから受信された撮像画像に基づいて、ユーザが動いていることを認識し得る。そこで、出力制御部１０６は、当該通知の音声の出力タイミングを、ユーザの動きが小さくなったタイミングに決定する。さらに、端末１０は、例えば冷蔵庫２０ａから受信された撮像画像に基づいて、ユーザがスマートフォン２０ｂを装着していることを認識し得る。そこで、出力制御部１０６は、スマートフォン２０ｂから受信された位置情報のセンシング結果が示す位置へ指向性を持たせて当該通知の音声を出力部１２４に出力させることを決定する。

　｛１－４－６．ＴＴＳの出力｝
　その後、図１０に示したように、出力制御部１０６は、決定した出力設定に基づいて、例えば「今日の夜は雲一つない夜空となります。・・・」のような当該通知の音声６０を出力部１２４に出力させる。

　｛１－４－７．ユーザからのフィードバックの取得・記録｝
　その後、図１１に示したように、当該通知の音声６０の出力に対して、ユーザ２が例えば肯定的なフィードバックの発話６２をしたとする。この場合、端末１０のセンサ部１２２は、フィードバックの発話６２を収音し得る。あるいは、いずれかの機器２０（例えばスマートフォン２０ｂなど）が発話６２を収音し、そして、当該収音結果を端末１０へ送信してもよい。

　その後、端末１０の制御部１００は、センサ部１２２による収音結果、または、いずれかの機器２０から受信された収音結果に対して音声認識をし、当該音声認識の結果に対して自然言語処理を行い、そして、当該処理結果に対して意図理解を行う。そして、制御部１００は、当該通知の音声６０の出力に対してユーザが肯定的な評価を示したか否か、および、評価の度合いを、当該意図理解の結果に基づいて判定する。

　図１１に示した例では、制御部１００は、ユーザが肯定的な評価をしたと判定し、そして、当該判定結果に基づいて、ユーザの評価度を示す情報を生成（決定）する。さらに、制御部１００は、当該ユーザの評価度を示す情報と、判断部１０２により決定された複数の選出センシング結果の各々をセンシングした個々の機器２０（冷蔵庫２０ａおよびスマートフォン２０ｂ）とを関連付けて記憶部１２６に格納する。より具体的には、制御部１００は、当該ユーザの評価度を示す情報と、当該複数の選出センシング結果のうち画像をセンシングした機器２０が冷蔵庫２０ａであることと、当該複数の選出センシング結果のうち音声をセンシングした機器２０がスマートフォン２０ｂであることとを関連付けて記憶部１２６に格納する。

　さらに、図１２に示したように、端末１０の送信制御部１０８は、当該ユーザの評価度を示す情報と、当該複数の選出センシング結果の各々をセンシングした個々の機器２０の識別情報との対応関係を示すデータ５４（以下、「フィードバックの対応関係データ５４」と称する場合もある）を全ての機器２０へ通信部１２０に送信させる。あるいは、送信制御部１０８は、当該複数の選出センシング結果の各々をセンシングした個々の機器２０に対してのみ、当該ユーザの評価度を示す情報を通信部１２０に送信させてもよい。これらの例によれば、当該ユーザの評価度を示す情報を例えば端末１０が全て記憶する代わりに、複数の機器２０に分散して記憶させることができる。

　図１３は、フィードバックの対応関係データ５４の構成例を示した図である。図１３に示したように、フィードバックの対応関係データ５４は、例えば、トランザクションＩＤ５４０、送信元５４２、および、フィードバック内容５４４を含む。ここで、送信元５４２には、端末１０の識別情報が格納される。図１３に示したように、フィードバック内容５４４は、例えば、機器５４４０、センサＩＤ５４４２、種類５４４４、および、評価度５４４６を含む。機器５４４０には、当該複数の選出センシング結果の各々をセンシングした個々の機器２０（図１３に示した例では冷蔵庫２０ａおよびスマートフォン２０ｂ）の識別情報が記録される。センサＩＤ５４４２には、該当の機器２０がセンシングした当該選出センシング結果に対応するセンサの種類の識別番号（連番）が記録される。種類５４４４には、該当のＩＤのセンサの種類（例えばマイクロフォンなど）が記録される。評価度５４４６には、当該ユーザの評価度を示す情報が記録される。図１３に示した例では、当該ユーザが肯定的な評価をしたこと、および、当該肯定的な評価の度合いが「５」であることを示している。

　＜１－５．処理の流れ＞
　以上、第１の実施形態の構成について説明した。次に、第１の実施形態に係る処理の流れの一例について、図１４～図１９を参照して説明する。

　｛１－５－１．処理の全体の流れ｝
　図１４は、第１の実施形態に係る処理の流れの一部を示したシーケンス図である。図１４に示したように、まず、端末１０の制御部１００は、ユーザに対して所定の時間内に通知すべき通知情報の有無を確認する（Ｓ１０１）。当該所定の時間内に通知すべき通知情報が存在しない間は（Ｓ１０１：Ｎｏ）、制御部１００は、Ｓ１０１の処理を繰り返す。

　一方、当該所定の時間内に通知すべき通知情報が存在する場合には（Ｓ１０１：Ｙｅｓ）、まず、制御部１００は、センサ部１２２による当該ユーザに関する現在のセンシング結果をセンサ部１２２から取得する（Ｓ１０３）。

　続いて、通信部１２０は、送信制御部１０８の制御に従って、センシング結果の提供要求を空間４内の複数の機器２０へ送信する（Ｓ１０５）。

　その後、各機器２０のセンサ部２２２は、当該ユーザに関してセンシングする（Ｓ１０７）。さらに、各機器２０の制御部２００は、Ｓ１０７におけるセンシング結果に基づいてユーザの状態に関して認識し得る。例えば、制御部２００は、Ｓ１０７におけるセンシング結果に基づいて、ユーザのジェスチャ、ユーザの感情、ユーザの集中度合い、または、ユーザのリラックス度合いなどを認識してもよい（Ｓ１０９）。

　その後、各機器２０は、Ｓ１０７におけるセンシング結果およびＳ１０９における認識結果を端末１０へ送信する（Ｓ１１１）。

　ここで、図１５を参照して、Ｓ１１１より後の処理の流れについて説明する。図１５に示したように、Ｓ１１１の後、端末１０の判断部１０２は、Ｓ１１１において各機器２０から受信されたセンシング結果と、Ｓ１０３におけるセンサ部１２２によるセンシング結果との中から、ユーザの状態の推定に用いられる一以上の選出センシング結果を所定の基準に基づいて決定する（Ｓ１２１）。

　続いて、端末１０は、後述する「ユーザの状態の推定処理」を行う（Ｓ１２３）。

　続いて、端末１０の出力制御部１０６は、Ｓ１０１で取得された通知情報に対応する音声（例えばＴＴＳ）の出力設定を、Ｓ１２３で推定されたユーザの状態に基づいて決定する（Ｓ１２５）。そして、出力制御部１０６は、当該通知情報に対応する音声を、Ｓ１２５で決定された出力設定に基づいて出力部１２４に出力させる（Ｓ１２７）。

　ここで、図１６を参照して、Ｓ１２７より後の処理の流れについて説明する。図１６に示したように、端末１０の制御部１００は、Ｓ１２７における音声の出力に関する該当のユーザのフィードバックが、例えばセンサ部１２２によりセンシングされること、または、通信部１２０により受信されることにより取得されるまで待機する（Ｓ１４１：Ｎｏ）。なお、該当のユーザからフィードバックが得られないまま所定の時間が経過した場合には、当該処理は終了し得る。

　一方、該当のユーザのフィードバックが取得された場合には（Ｓ１４１：Ｙｅｓ）、制御部１００は、当該フィードバックに対して各種の認識処理（例えば音声認識や意図理解など）を行うことにより、当該フィードバックに対応するユーザの評価度を判定する。次に、制御部１００は、当該判定結果に基づいて、当該ユーザの評価度を示す情報を生成する。そして、制御部１００は、当該ユーザの評価度を示す情報と、Ｓ１２１で決定された一以上の選出センシング結果の各々をセンシングした個々の機器２０とを関連付けて記憶部１２６に格納する（Ｓ１４３）。

　続いて、通信部１２０は、送信制御部１０８の制御に従って、当該評価度を示す情報を空間４内の複数の機器２０へ送信する。例えば、通信部１２０は、当該一以上の選出センシング結果の各々をセンシングした個々の機器２０に対してのみ当該評価度を示す情報を送信してもよい（Ｓ１４５）。

　その後、各機器２０は、受信された当該評価度を示す情報を記憶する（Ｓ１４７）。

　｛１－５－２．ユーザの状態の推定処理｝
　ここで、図１７～図１９を参照して、Ｓ１２３における「ユーザの状態の推定処理」の流れの一例について説明する。図１７に示したように、まず、端末１０のユーザ状態推定部１０４は、Ｓ１２１で決定された一以上の選出センシング結果の各々に基づいて、該当のユーザが活発状態であるか否かを判定する（Ｓ２０１）。

　当該ユーザが活発状態であると判定された場合には（Ｓ２０１：Ｙｅｓ）、次に、ユーザ状態推定部１０４は、当該一以上の選出センシング結果の中に、当該ユーザが発した音のセンシング結果が含まれているか否かを判定する（Ｓ２０３）。当該ユーザが発した音のセンシング結果が含まれている場合には（Ｓ２０３：Ｙｅｓ）、次に、ユーザ状態推定部１０４は、当該ユーザが発した音の種類を当該音のセンシング結果を用いて判定する（Ｓ２０５）。当該ユーザが発した音の種類が「言語音」であると判定された場合には、ユーザ状態推定部１０４は、当該ユーザの状態を「後で通知すべき状態」（以下では、「状態Ｂ」と称する）と推定する（Ｓ２０７）。一方、当該ユーザが発した音の種類が「言語音」以外の音（具体的には、鼻歌、歌声、非言語音、または、非音声）であると判定された場合には、ユーザ状態推定部１０４は、当該ユーザの状態を「強調して通知すべき状態」（以下では、「状態Ａ」と称する）と推定する（Ｓ２０９）。

　一方、Ｓ２０３において、当該一以上の選出センシング結果の中に、当該ユーザが発した音のセンシング結果が含まれていないと判定された場合には（Ｓ２０３：Ｎｏ）、ユーザ状態推定部１０４は、当該ユーザの状態を「状態Ａ」と推定する（Ｓ２０９）。

　ここで、図１８を参照して、Ｓ２０１において当該ユーザが活発状態ではない（つまり、不活発状態である）と判定された場合（Ｓ２０１：Ｎｏ）における処理の流れについて説明する。図１８に示したように、まず、ユーザ状態推定部１０４は、当該一以上の選出センシング結果の中に、当該ユーザが発した音のセンシング結果が含まれているか否かを判定する（Ｓ２１１）。当該一以上の選出センシング結果の中に、当該ユーザが発した音のセンシング結果が含まれていないと判定された場合には（Ｓ２１１：Ｎｏ）、ユーザ状態推定部１０４は、当該ユーザの状態を「通常状態」（以下では、「状態Ｃ」と称する）と推定する（Ｓ２１３）。

　一方、当該一以上の選出センシング結果の中に、当該ユーザが発した音のセンシング結果が含まれている場合には（Ｓ２１１：Ｙｅｓ）、次に、ユーザ状態推定部１０４は、当該ユーザが発した音の種類を当該音のセンシング結果を用いて判定する（Ｓ２１５）。当該ユーザが発した音の種類が「言語音」であると判定された場合には、ユーザ状態推定部１０４は、当該ユーザの状態を「状態Ｂ」と推定する（Ｓ２１７）。

　一方、当該ユーザが発した音の種類が「鼻歌」または「歌声」であると判定された場合には、次に、ユーザ状態推定部１０４は、当該一以上の選出センシング結果の中に、当該ユーザのバイタル情報のセンシング結果が含まれているか否かを判定する（Ｓ２１９）。当該一以上の選出センシング結果の中に、当該ユーザのバイタル情報のセンシング結果が含まれていない場合には（Ｓ２１９：Ｎｏ）、ユーザ状態推定部１０４は、当該ユーザの状態を「状態Ａ」と推定する（Ｓ２２３）。

　一方、当該一以上の選出センシング結果の中に、当該ユーザのバイタル情報のセンシング結果が含まれている場合には（Ｓ２１９：Ｙｅｓ）、ユーザ状態推定部１０４は、次に、当該ユーザのバイタル情報のセンシング結果を用いて、当該ユーザが「休んでいる」か否かを判定する（Ｓ２２１）。当該ユーザが「休んでいる」と判定された場合には（Ｓ２２１：Ｙｅｓ）、ユーザ状態推定部１０４は、当該ユーザの状態を「状態Ａ」と推定する（Ｓ２２３）。

　一方、当該ユーザが「休んでいない」と判定された場合には（Ｓ２２１：Ｎｏ）、次に、ユーザ状態推定部１０４は、当該一以上の選出センシング結果の中に、当該ユーザの視線のセンシング結果が含まれているか否かを判定する（Ｓ２２５）。当該一以上の選出センシング結果の中に、当該ユーザの視線のセンシング結果が含まれていない場合には（Ｓ２２５：Ｎｏ）、ユーザ状態推定部１０４は、当該ユーザの状態を「状態Ｃ」と推定する（Ｓ２３１）。

　一方、当該一以上の選出センシング結果の中に、当該ユーザの視線のセンシング結果が含まれている場合には（Ｓ２２５：Ｙｅｓ）、次に、ユーザ状態推定部１０４は、当該ユーザの視線のセンシング結果を用いて、当該ユーザが「集中している」か否かを判定する（Ｓ２２７）。当該ユーザが「集中している」と判定された場合には（Ｓ２２７：Ｙｅｓ）、ユーザ状態推定部１０４は、当該ユーザの状態を「状態Ｂ」と推定する（Ｓ２２９）。

　一方、当該ユーザが「集中していない」と判定された場合には（Ｓ２２７：Ｎｏ）、ユーザ状態推定部１０４は、当該ユーザの状態を「状態Ｃ」と推定する（Ｓ２３１）。

　ここで、図１９を参照して、Ｓ２１５において、当該ユーザが発した音の種類が「非言語音」または「非音声」であると判定された場合における処理の流れについて説明する。図１９に示したように、Ｓ２１５において、当該ユーザが発した音の種類が「非言語音」であると判定された場合には、まず、ユーザ状態推定部１０４は、当該一以上の選出センシング結果の中に、当該ユーザのバイタル情報のセンシング結果が含まれているか否かを判定する（Ｓ２４３）。当該一以上の選出センシング結果の中に、当該ユーザのバイタル情報のセンシング結果が含まれていない場合には（Ｓ２４３：Ｎｏ）、ユーザ状態推定部１０４は、当該ユーザの状態を「状態Ｃ」と推定する（Ｓ２５３）。

　一方、当該一以上の選出センシング結果の中に、当該ユーザのバイタル情報のセンシング結果が含まれている場合には（Ｓ２４３：Ｙｅｓ）、ユーザ状態推定部１０４は、次に、当該ユーザのバイタル情報のセンシング結果を用いて、当該ユーザが「休んでいる」か否かを判定する（Ｓ２４５）。当該ユーザが「休んでいる」と判定された場合には（Ｓ２４５：Ｙｅｓ）、ユーザ状態推定部１０４は、当該ユーザの状態を「状態Ｃ」と推定する（Ｓ２５３）。

　一方、当該ユーザが「休んでいない」と判定された場合には（Ｓ２４５：Ｎｏ）、次に、ユーザ状態推定部１０４は、当該一以上の選出センシング結果の中に、当該ユーザの視線のセンシング結果が含まれているか否かを判定する（Ｓ２４７）。当該一以上の選出センシング結果の中に、当該ユーザの視線のセンシング結果が含まれていない場合には（Ｓ２４７：Ｎｏ）、ユーザ状態推定部１０４は、当該ユーザの状態を「状態Ｃ」と推定する（Ｓ２５３）。

　一方、当該一以上の選出センシング結果の中に、当該ユーザの視線のセンシング結果が含まれている場合には（Ｓ２４７：Ｙｅｓ）、次に、ユーザ状態推定部１０４は、当該ユーザの視線のセンシング結果を用いて、当該ユーザが「集中している」か否かを判定する（Ｓ２４９）。当該ユーザが「集中している」と判定された場合には（Ｓ２４９：Ｙｅｓ）、ユーザ状態推定部１０４は、当該ユーザの状態を「状態Ｂ」と推定する（Ｓ２５１）。一方、当該ユーザが「集中していない」と判定された場合には（Ｓ２４９：Ｎｏ）、ユーザ状態推定部１０４は、当該ユーザの状態を「状態Ｃ」と推定する（Ｓ２５３）。

　一方、Ｓ２１５において、当該ユーザが発した音の種類が「非音声」であると判定された場合には、まず、ユーザ状態推定部１０４は、当該一以上の選出センシング結果の中に、当該ユーザのバイタル情報のセンシング結果が含まれているか否かを判定する（Ｓ２６１）。当該一以上の選出センシング結果の中に、当該ユーザのバイタル情報のセンシング結果が含まれていない場合には（Ｓ２６１：Ｎｏ）、ユーザ状態推定部１０４は、当該ユーザの状態を「状態Ｂ」と推定する（Ｓ２６７）。

　一方、当該一以上の選出センシング結果の中に、当該ユーザのバイタル情報のセンシング結果が含まれている場合には（Ｓ２６１：Ｙｅｓ）、ユーザ状態推定部１０４は、次に、当該ユーザのバイタル情報のセンシング結果を用いて、当該ユーザが「休んでいる」か否かを判定する（Ｓ２６３）。当該ユーザが「休んでいる」と判定された場合には（Ｓ２６３：Ｙｅｓ）、ユーザ状態推定部１０４は、当該ユーザの状態を「状態Ａ」と推定する（Ｓ２６５）。

　一方、当該ユーザが「休んでいない」と判定された場合には（Ｓ２６３：Ｎｏ）、ユーザ状態推定部１０４は、当該ユーザの状態を「状態Ｂ」と推定する（Ｓ２６７）。

　＜１－６．効果＞
　以上説明したように、第１の実施形態に係る端末１０は、複数の機器２０から受信された複数のセンシング結果の中から、ユーザの状態の推定に用いられる一以上の選出センシング結果を所定の基準に基づいて決定し、そして、当該一以上の選出センシング結果に基づいて情報の出力を制御する。このため、ユーザの状態の推定に用いられるセンシング結果を適切に決定することができる。その結果、ユーザの状態の推定の精度を向上させることができる。これにより、ユーザに対して情報を出力する際に、ユーザの状態により適した態様で情報を出力することができる。

　例えば、端末１０による当該ユーザに関するセンシングが不可能、または、困難である場合に、端末１０は、複数の機器２０から受信された、当該ユーザに関する複数のセンシング結果の中から当該一以上の選出センシング結果を当該所定の基準に基づいて決定することが可能である。このため、例えば端末１０がユーザ２に関してセンシングし難い状況であっても、ユーザの状態に適した出力設定で、例えば当該ユーザに対する通知の音声などの情報を出力することができる。その結果、当該情報の内容が当該ユーザに十分伝達され得る。

　＜１－７．具体例＞
　次に、前述したユーザ状態推定部１０４によるユーザの状態の推定の具体例について、「１－７－１．具体例１」～「１－７－４．具体例４」において説明する。

　｛１－７－１．具体例１｝
　まず、図２０を参照して、具体例１について説明する。図２０に示したように、具体例１では、ユーザ２は、スマートフォン２０ｂを所持（例えばポケットに入れているなど）しながら、空間４内を行ったり来たりしていることを想定する。例えば、ユーザ２は、空間４内で掃除をしている。また、ユーザ２は、鼻歌を歌っていることを想定する。スマートフォン２０ｂは、加速度センサ、および、マイクロフォンを内蔵しているものとする。

　図２０に示した例では、端末１０は、まず、スマートフォン２０ｂの加速度センサによる加速度のセンシング結果、および、マイクロフォンによる収音結果をスマートフォン２０ｂから受信する。次に、端末１０は、受信された加速度のセンシング結果に基づいて、ユーザが大きく動いていることを認識し、そして、当該認識結果に基づいて、ユーザ２が活発状態であると認識する。さらに、端末１０は、受信された収音結果に基づいて、ユーザが鼻歌を歌っていることを認識する。そして、端末１０は、ユーザ２が活発状態であり、かつ、鼻歌を歌っていることに基づいて、ユーザ２が「状態Ａ（＝強調して通知すべき状態）」であると推定する。

　｛１－７－２．具体例２｝
　次に、図２１を参照して、具体例２について説明する。図２１に示したように、具体例２では、ユーザ２は、冷蔵庫２０ａの中を見ながら、例えば「あれ？買ったはずのプリンが無いなあ。」のような独り言を言っていることを想定する。冷蔵庫２０ａは、カメラ、および、マイクロフォンを内蔵しているものとする。

　図２１に示した例では、端末１０は、冷蔵庫２０ａのカメラによる撮像画像およびマイクロフォンによる収音結果を冷蔵庫２０ａから受信する。次に、端末１０は、受信された撮像画像に基づいて、ユーザ２がほとんど動いていないことを認識し、そして、当該認識結果に基づいて、ユーザ２が不活発状態であると認識する。さらに、端末１０は、受信された収音結果に基づいて、ユーザ２が言語音を発していることを認識する。そして、端末１０は、ユーザ２が不活発状態であり、かつ、言語音を発していることに基づいて、ユーザ２が「状態Ｂ（＝後で通知すべき状態）」であると推定する。

　｛１－７－３．具体例３｝
　次に、図２２を参照して、具体例３について説明する。図２２に示したように、具体例３では、ユーザ２は、アイウェア２０ｅを装着した状態でソファに座っていることを想定する。また、ユーザ２は、アイウェア２０ｅによるＡＲ（Ａｕｇｍｅｎｔｅｄ　Ｒｅａｌｉｔｙ）コンテンツの視聴に集中しており、かつ、楽しんでいる。例えば、ユーザ２は、興奮して、笑っている。アイウェア２０ｅは、加速度センサ、脳波センサ、マイクロフォン、および、視線センサを内蔵しているものとする。

　図２１に示した例では、端末１０は、アイウェア２０ｅの加速度センサによる加速度のセンシング結果、脳波センサによる脳波のセンシング結果、マイクロフォンによる収音結果、および、視線センサによる視線のセンシング結果をアイウェア２０ｅから受信する。次に、端末１０は、受信された加速度のセンシング結果に基づいて、ユーザ２がほとんど動いていないことを認識し、そして、当該認識結果に基づいて、ユーザ２が不活発状態であると認識する。さらに、端末１０は、受信された収音結果に基づいて、ユーザが非言語音（笑い声など）を発していることを認識する。さらに、端末１０は、受信された脳波のセンシング結果に基づいて、脳波が活発化していることを認識し、そして、当該認識結果に基づいて、ユーザ２が「休んでいない」ことを認識する。さらに、端末１０は、受信された視線のセンシング結果に基づいて、ユーザ２の瞬きの頻度が小さいことを認識し、そして、当該認識結果に基づいて、ユーザ２の集中度合いが所定の閾値以上であることを認識する。そして、端末１０は、ユーザ２が不活発状態であり、非言語音を発しており、かつ、「休まずに集中している」ことに基づいて、ユーザ２が「状態Ｂ」であると推定する。

　｛１－７－４．具体例４｝
　次に、図２３を参照して、具体例４について説明する。図２３に示したように、具体例４では、ユーザ２は、オープンイヤーデバイス２０ｆ（例えば、イヤフォン型の装置、または、首掛け型のスピーカなど）を装着した状態でオフィスの廊下４を歩きながら、例えば「うー。うーーー。」などと嘆いていることを想定する。オープンイヤーデバイス２０ｆは、加速度センサ、および、マイクロフォンを内蔵しているものとする。また、オープンイヤーデバイス２０ｆは、音声出力部を有し得る。

　図２３に示した例では、端末１０は、オープンイヤーデバイス２０ｆの加速センサによる加速度のセンシング結果、および、マイクロフォンによる収音結果をオープンイヤーデバイス２０ｆから受信する。次に、端末１０は、受信された加速度のセンシング結果に基づいて、ユーザ２が大きく動いていることを認識し、そして、当該認識結果に基づいて、ユーザ２が活発状態であると認識する。さらに、端末１０は、受信された収音結果に基づいて、ユーザ２が非言語音（嘆き声など）を発していることを認識する。そして、端末１０は、ユーザ２が活発状態であり、かつ、非言語音を発していることに基づいて、ユーザ２が「状態Ａ」であると推定する。

＜＜２．第２の実施形態＞＞
　以上、第１の実施形態に説明した。次に、第２の実施形態に説明する。後述するように、第２の実施形態によれば、サーバ７０が、空間４内の複数の機器２０から端末１０が受信した複数のセンシング結果の中から、（ユーザの状態の推定に用いられる）一以上の選出センシング結果を上記所定の基準に基づいて決定することが可能である。以下、第２の実施形態の内容について順次詳細に説明を行う。以下では、第１の実施形態と異なる内容についてのみ説明を行うこととし、同一の内容については説明を省略する。

　＜２－１．システム構成＞
　まず、第２の実施形態に係る情報処理システムの構成例について、図２４を参照して説明する。図２４に示すように、第２の実施形態に係る情報処理システムは、図１に示した第１の実施形態と比較して、通信網２２、および、サーバ７０をさらに有する。

　｛２－１－１．通信網２２｝
　通信網２２は、通信網２２に接続されている装置から送信される情報の有線、または無線の伝送路である。例えば、通信網２２は、電話回線網、インターネット、衛星通信網などの公衆回線網や、Ｅｔｈｅｒｎｅｔ（登録商標）を含む各種のＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、ＷＡＮ（Ｗｉｄｅ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）などを含んでもよい。また、通信網２２は、ＩＰ－ＶＰＮ（Ｉｎｔｅｒｎｅｔ　Ｐｒｏｔｏｃｏｌ－Ｖｉｒｔｕａｌ　Ｐｒｉｖａｔｅ　Ｎｅｔｗｏｒｋ）などの専用回線網を含んでもよい。

　｛２－１－２．サーバ７０｝
　サーバ７０は、本開示に係る情報処理装置の一例である。サーバ７０は、通信網２２を介して、端末１０に対して各種の情報（例えば、音声、映像、または、音楽など）の出力を制御する。例えば、サーバ７０は、所定のアプリケーションサービスにおける所定の通知情報に対応する音声を端末１０に出力させる。または、サーバ７０は、所定のアプリケーションサービスにおけるユーザ２との対話の音声を端末１０に出力させてもよい。

　＜２－２．構成：端末１０＞
　以上、第２の実施形態に係る情報処理システムの構成について説明した。次に、第２の実施形態に係る構成について説明する。図２５は、第２の実施形態に係る端末１０の構成例を示した機能ブロック図である。図２５に示すように、端末１０は、図３に示した第１の実施形態と比較して、判断部１０２、および、ユーザ状態推定部１０４を有しない。以下では、第１の実施形態と異なる機能を有する構成要素についてのみ説明を行う。

　｛２－２－１．出力制御部１０６｝
　第２の実施形態に係る出力制御部１０６は、サーバ７０から受信された制御情報に基づいて、出力部１２４に対して各種の情報（例えば、音声（ＴＴＳなど）、映像、または、音楽など）の出力を制御する。例えば、出力制御部１０６は、サーバ７０から受信された制御情報が指定する種類の情報を、当該制御情報が指定するタイミングに出力部１２４に出力させる。

　または、出力制御部１０６は、例えばサーバ７０から受信された映像や音声自体や、サーバ７０から受信された情報（例えばユーザに対する通知情報など）に対応する音声などを、サーバ７０から受信された制御情報に基づいて出力部１２４に出力させてもよい。

　＜２－３．構成：サーバ７０＞
　次に、第２の実施形態に係るサーバ７０の構成例について説明する。図２６は、第２の実施形態に係るサーバ７０の構成例を示した機能ブロック図である。図２６に示すように、サーバ７０は、制御部７００、通信部７２０、および、記憶部７２２を有する。

　｛２－３－１．制御部７００｝
　制御部７００は、例えば、後述するＣＰＵ１５０やＧＰＵなどの処理回路を含んで構成され得る。制御部７００は、サーバ７０の動作を統括的に制御する。また、図２６に示すように、制御部７００は、判断部７０２、ユーザ状態推定部７０４、出力制御部７０６、および、送信制御部７０８を有する。

　｛２－３－２．判断部７０２｝
　判断部７０２は、端末１０を介して受信された、空間４内の複数の機器２０による複数のセンシング結果および端末１０によるセンシング結果の中から、（前述した）一以上の選出センシング結果を上記所定の基準に基づいて決定する。または、判断部７０２は、端末１０を介して受信された、当該複数の機器２０による複数のセンシング結果のみの中から、当該一以上の選出センシング結果を上記所定の基準に基づいて決定してもよい。

　なお、判断部７０２による具体的な判断の内容に関しては、第１の実施形態に係る判断部１０２と概略同様である。

　｛２－３－３．ユーザ状態推定部７０４｝
　ユーザ状態推定部７０４は、判断部７０２により決定された一以上の選出センシング結果を用いてユーザ（例えば、対象のユーザ）の状態を推定する。なお、ユーザ状態推定部７０４による具体的な推定の内容に関しては、第１の実施形態に係るユーザ状態推定部１０４と概略同様である。

　｛２－３－４．出力制御部７０６｝
　出力制御部７０６は、端末１０による情報の出力を制御する。例えば、出力制御部７０６は、まず、ユーザ状態推定部７０４により推定されたユーザの状態に基づいて、例えば当該ユーザに対する通知情報などの情報を端末１０に出力させるための制御情報を生成する。そして、出力制御部７０６は、生成した制御情報を端末１０へ通信部７２０に送信させる。

　なお、出力制御部７０６による具体的な出力制御の一部の内容に関しては、第１の実施形態に係る出力制御部１０６と概略同様であり得る。

　｛２－３－５．送信制御部７０８｝
　送信制御部７０８は、他の装置に対する各種の情報の送信を制御する。例えば、送信制御部７０８は、端末１０により情報が出力された後に当該情報の出力に関してユーザから得られた評価度を示す情報を、空間４内の複数の機器２０へ通信部１２０に送信させてもよい。または、送信制御部７０８は、当該評価度を示す情報を当該複数の機器２０へ送信させるための制御情報を生成し、そして、当該制御情報を端末１０へ通信部７２０に送信させてもよい。

　｛２－３－６．通信部７２０｝
　通信部７２０は、例えば、後述する通信装置１６６を含んで構成され得る。通信部７２０は、例えば通信網２２を介して、他の装置との間で情報の送受信を行う。

　｛２－３－７．記憶部７２２｝
　記憶部７２２は、例えば、後述するストレージ装置１６４を含んで構成され得る。記憶部７２２は、各種のデータや、各種のソフトウェアを記憶する。

　＜２－４．処理の流れ＞
　以上、第２の実施形態の構成について説明した。次に、第２の実施形態に係る処理の流れの一例について、図２７および図２８を参照して説明する。

　図２７は、第２の実施形態に係る処理の流れの一部を示したシーケンス図である。図２７に示したように、まず、サーバ７０の制御部７００は、ユーザに対して所定の時間内に通知すべき通知情報の有無を確認する（Ｓ３０１）。当該所定の時間内に通知すべき通知情報が存在しない間は（Ｓ３０１：Ｎｏ）、制御部７００は、Ｓ３０１の処理を繰り返す。

　一方、当該所定の時間内に通知すべき通知情報が存在する場合には（Ｓ３０１：Ｙｅｓ）、通信部７２０は、送信制御部７０８の制御に従って、当該通知情報の存在を示す情報を端末１０へ送信する。ここで、当該通知情報の存在を示す情報は、例えば、通知対象のユーザの識別情報を含んでもよい（Ｓ３０３）。

　その後、端末１０は、該当ユーザに関してセンシングをする（Ｓ３０５）。そして、端末１０は、当該センシング結果をサーバ７０へ送信する（Ｓ３０７）。

　なお、図２７に示したＳ３０９～Ｓ３１５の処理は、（図１４に示した）第１の実施形態におけるＳ１０５～Ｓ１１１と同様である。

　Ｓ３１５の後、端末１０は、Ｓ３１５において、例えば全ての機器２０から受信されたセンシング結果等をサーバ７０へ送信する（Ｓ３１７）。

　ここで、図２８を参照して、Ｓ３１７より後の処理の流れについて説明する。図２８に示したように、Ｓ３１７の後、サーバ７０の判断部７０２は、Ｓ３０７で受信された端末１０によるセンシング結果と、Ｓ３１７で受信された各機器２０によるセンシング結果との中から、ユーザの状態の推定に用いられる一以上の選出センシング結果を所定の基準に基づいて決定する（Ｓ３２１）。

　続いて、サーバ７０のユーザ状態推定部７０４は、「ユーザの状態の推定処理」を行う（Ｓ３２３）。なお、Ｓ３２３の処理の内容は、図１７～図１９に示した第１の実施形態におけるＳ１２３の処理と概略同一であってもよい。

　続いて、サーバ７０の出力制御部７０６は、Ｓ３０１で取得された通知情報に対応する音声の出力設定を、Ｓ３２３で推定されたユーザの状態に基づいて決定する（Ｓ３２５）。

　続いて、出力制御部７０６は、当該通知情報に対応する音声を、Ｓ３２５で決定された出力設定で出力させるための制御情報を生成する（Ｓ３２７）。そして、通信部７２０は、出力制御部７０６の制御に従って、Ｓ３２７で生成された制御情報を端末１０へ送信する（Ｓ３２９）。

　その後、端末１０の出力制御部１０６は、Ｓ３２９で受信された制御情報に従って、当該通知情報に対応する音声を出力部１２４に出力させる（Ｓ３３１）。

　なお、Ｓ３３１より後の処理は、（図１６に示した）第１の実施形態におけるＳ１４１～Ｓ１４７と概略同様である。

　＜２－５．効果＞
　以上説明したように、第２の実施形態に係るサーバ７０は、空間４内の複数の機器２０から端末１０を介して受信された複数のセンシング結果の中から、ユーザの状態の推定に用いられる一以上の選出センシング結果を上記所定の基準に基づいて決定し、そして、当該一以上の選出センシング結果に基づいて、情報を端末１０に出力させる。これにより、「１－６節」で述べた第１の実施形態と概略同様の効果が得られる。

　＜２－６．変形例＞
　｛２－６－１．変形例１｝
　第２の実施形態は前述した例に限定されない。例えば、図２４では、サーバ７０が一台だけ図示されているが、かかる例に限定されず、複数台のコンピュータが協同して動作することにより、サーバ７０の機能が実現されてもよい。

　｛２－６－２．変形例２｝
　別の変形例として、前述した制御部７００と同様の機能を有し、かつ、例えば通信網２２を介して端末１０と通信可能な他の装置が、サーバ７０の代わりに、端末１０に対して情報の出力を制御してもよい。つまり、当該他の装置は、上記の一以上の選出センシング結果を決定し、そして、当該一以上の選出センシング結果に基づいて情報を端末１０に出力させてもよい。一例として、当該他の装置は、汎用ＰＣ、タブレット型端末、ゲーム機、スマートフォンなどの携帯電話、携帯型音楽プレーヤ、スピーカ、プロジェクタ、ウェアラブルデバイス（例えばアイウェアやスマートウォッチなど）、車載装置（カーナビゲーション装置など）、または、ロボット（例えばヒューマノイド型ロボットやドローンなど）であってもよい。さらに、この場合、サーバ７０は必ずしも設置されなくてもよい。

＜＜３．ハードウェア構成＞＞
　次に、各実施形態に共通する端末１０のハードウェア構成例について、図２９を参照して説明する。図２９に示すように、端末１０は、ＣＰＵ１５０、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）１５２、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）１５４、バス１５６、インターフェース１５８、入力装置１６０、出力装置１６２、ストレージ装置１６４、および、通信装置１６６を備える。

　ＣＰＵ１５０は、演算処理装置および制御装置として機能し、各種プログラムに従って端末１０内の動作全般を制御する。また、ＣＰＵ１５０は、端末１０において制御部１００の機能を実現する。なお、ＣＰＵ１５０は、マイクロプロセッサなどのプロセッサにより構成される。

　ＲＯＭ１５２は、ＣＰＵ１５０が使用するプログラムや演算パラメータなどの制御用データなどを記憶する。

　ＲＡＭ１５４は、例えば、ＣＰＵ１５０により実行されるプログラムや、使用中のデータなどを一時的に記憶する。

　バス１５６は、ＣＰＵバスなどから構成される。このバス１５６は、ＣＰＵ１５０、ＲＯＭ１５２、および、ＲＡＭ１５４を相互に接続する。

　インターフェース１５８は、入力装置１６０、出力装置１６２、ストレージ装置１６４、および、通信装置１６６を、バス１５６と接続する。

　入力装置１６０は、例えばタッチパネル、ボタン、スイッチ、レバー、マイクロフォンなどユーザが情報を入力するための入力手段、および、ユーザによる入力に基づいて入力信号を生成し、ＣＰＵ１５０に出力する入力制御回路などから構成される。

　出力装置１６２は、例えばＬＣＤやＯＬＥＤなどのディスプレイ、または、プロジェクタなどの表示装置を含む。また、出力装置１６２は、スピーカなどの音声出力装置を含む。

　ストレージ装置１６４は、記憶部１２６として機能する、データ格納用の装置である。ストレージ装置１６４は、例えば、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置、または、記憶媒体に記録されたデータを削除する削除装置などを含む。

　通信装置１６６は、例えば通信網２２などに接続するための通信デバイス（例えばネットワークカードなど）等で構成された通信インターフェースである。また、通信装置１６６は、無線ＬＡＮ対応通信装置、ＬＴＥ（Ｌｏｎｇ　Ｔｅｒｍ　Ｅｖｏｌｕｔｉｏｎ）対応通信装置、または有線による通信を行うワイヤー通信装置であってもよい。この通信装置１６６は、通信部１２０として機能する。

＜＜４．変形例＞＞
　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示はかかる例に限定されない。本開示の属する技術の分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　＜４－１．変形例１＞
　例えば、ユーザに対する通知情報を出力する場面において、空間４内に複数のユーザが存在する場合には、端末１０（またはサーバ７０）は、空間４内の複数の機器２０から受信された複数のセンシング結果の中から、当該通知情報の通知対象のユーザの状態のみの推定に用いられるセンシング結果を、当該一以上の選出センシング結果として上記所定の基準に基づいて決定してもよい。例えば、空間４内の各ユーザの顔画像が端末１０（またはサーバ７０）に予め登録され得る。そして、端末１０（またはサーバ７０）は、空間４内の複数のユーザの中から、複数の機器２０により撮像された一以上のユーザの顔の撮像画像と、予め登録されている当該通知対象のユーザの顔画像とを比較することにより、当該通知対象のユーザに対応するセンシング結果を当該複数のセンシング結果の中から選択してもよい。

　さらに、端末１０（またはサーバ７０）は、決定された当該一以上の選出センシング結果に基づいて当該通知対象のユーザの状態のみを推定し、そして、推定結果に基づいて当該通知情報を出力部１２４に出力させてもよい。

　＜４－２．変形例２＞
　前述した各実施形態の処理の流れにおける各ステップは、必ずしも記載された順序に沿って処理されなくてもよい。例えば、各ステップは、適宜順序が変更されて処理されてもよい。また、各ステップは、時系列的に処理される代わりに、一部並列的に又は個別的に処理されてもよい。また、記載されたステップのうちの一部が省略されたり、または、別のステップがさらに追加されてもよい。

　また、前述した各実施形態によれば、ＣＰＵ１５０、ＲＯＭ１５２、およびＲＡＭ１５４などのハードウェアを、第１の実施形態に係る端末１０および／または第２の実施形態に係るサーバ７０の各構成と同等の機能を発揮させるためのコンピュータプログラムも提供可能である。また、当該コンピュータプログラムが記録された記憶媒体も提供される。

　また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

　なお、以下のような構成も本開示の技術的範囲に属する。
（１）
　複数の機器から受信された複数の第１のセンシング結果の中から、ユーザの状態の推定に用いられる一以上の第２のセンシング結果を所定の基準に基づいて決定する判断部と、
　前記一以上の第２のセンシング結果に基づいて情報の出力を制御する出力制御部と、
を備える、情報処理装置。
（２）
　前記出力制御部は、前記一以上の第２のセンシング結果を用いて推定された前記ユーザの状態に基づいて、前記情報の出力を制御する、前記（１）に記載の情報処理装置。
（３）
　前記一以上の第２のセンシング結果は、複数のセンシング種類の各々に関するセンシング結果を含み、
　前記判断部は、前記複数のセンシング種類の各々に関して、前記複数の第１のセンシング結果の中から、当該センシング種類に対応するセンシング結果を前記所定の基準に基づいてそれぞれ選択することにより、前記一以上の第２のセンシング結果を決定する、前記（２）に記載の情報処理装置。
（４）
　前記所定の基準は、前記複数の機器の各々と前記ユーザとの距離、前記複数の機器の各々の性能情報、前記複数の機器の各々の製造元の信頼度、および、前記複数の機器の各々に関連付けられているユーザの評価度のうちの少なくとも一つを含む、前記（３）に記載の情報処理装置。
（５）
　前記判断部は、前記複数のセンシング種類の各々に関して、前記複数の機器のうち、前記ユーザのより近くに位置する前記機器による当該センシング種類に対応するセンシング結果を前記複数の第１のセンシング結果の中からそれぞれ選択する、前記（４）に記載の情報処理装置。
（６）
　前記判断部は、前記複数のセンシング種類の各々に関して、前記複数の機器のうち、当該センシング種類に関するセンシングの性能がより高い前記機器による当該センシング種類に対応するセンシング結果を前記複数の第１のセンシング結果の中からそれぞれ選択する、前記（５）に記載の情報処理装置。
（７）
　前記判断部は、前記複数のセンシング種類の各々に関して、前記複数の機器のうち、製造元の信頼度がより高い前記機器による当該センシング種類に対応するセンシング結果を前記複数の第１のセンシング結果の中からそれぞれ選択する、前記（５）または（６）に記載の情報処理装置。
（８）
　前記判断部は、前記複数のセンシング種類の各々に関して、前記複数の機器の各々に関連付けて記憶されているユーザの評価度がより高い前記機器による、当該センシング種類に対応するセンシング結果を前記複数の第１のセンシング結果の中からそれぞれ選択する、前記（５）～（７）のいずれか一項に記載の情報処理装置。
（９）
　前記判断部は、前記複数のセンシング種類の各々に関して、前記複数の第１のセンシング結果の中から、当該センシング種類に対応するセンシング結果を、前記複数の機器の各々と前記ユーザとの距離、前記複数の機器の各々の性能情報、前記複数の機器の各々の製造元の信頼度、および、前記複数の機器の各々に関連付けられているユーザの評価度に基づいてそれぞれ選択することにより、前記一以上の第２のセンシング結果を決定する、前記（４）～（８）のいずれか一項に記載の情報処理装置。
（１０）
　前記複数のセンシング種類は、音のセンシングを含み、
　前記判断部は、ユーザの発話の音が直接音としてセンシングされたセンシング結果を、前記ユーザの発話の音が間接音としてセンシングされたセンシング結果よりも優先して前記複数の第１のセンシング結果の中から選択することにより、前記一以上の第２のセンシング結果を決定する、前記（４）～（９）のいずれか一項に記載の情報処理装置。
（１１）
　前記出力制御部は、前記一以上の第２のセンシング結果を用いて推定された前記ユーザの状態に対応する出力態様で、前記情報を出力部に出力させる、前記（４）～（１０）のいずれか一項に記載の情報処理装置。
（１２）
　前記情報は、前記ユーザに対する通知情報であり、
　前記出力制御部は、前記一以上の第２のセンシング結果を用いて推定された前記ユーザの状態に対応する出力態様で、前記ユーザに対する通知情報に対応する音声を前記出力部に出力させる、前記（１１）に記載の情報処理装置。
（１３）
　前記出力制御部は、前記一以上の第２のセンシング結果を用いて推定された前記ユーザの状態に基づいて、前記ユーザに対する通知情報の通知タイミングを決定し、かつ、
　決定した通知タイミングに、前記ユーザに対する通知情報に対応する音声を前記出力部に出力させる、前記（１２）に記載の情報処理装置。
（１４）
　前記出力部により前記情報が出力された後に前記情報の出力に関して前記ユーザから得られた評価度を示す情報と、前記一以上の第２のセンシング結果の各々をセンシングした前記機器とを関連付けて記憶する記憶部をさらに備える、前記（１１）～（１３）のいずれか一項に記載の情報処理装置。
（１５）
　前記出力部により前記情報が出力された後に前記情報の出力に関して前記ユーザから得られた評価度を示す情報を、前記一以上の第２のセンシング結果の各々をセンシングした前記機器へ通信部に送信させる送信制御部をさらに備える、前記（１１）～（１４）のいずれか一項に記載の情報処理装置。
（１６）
　前記通信部と、
　前記一以上の第２のセンシング結果を用いて前記ユーザの状態を推定するユーザ状態推定部と、をさらに備え、
　前記通信部は、前記複数の機器から前記複数の第１のセンシング結果を受信する、前記（１５）に記載の情報処理装置。
（１７）
　前記複数のセンシング種類のうちの一以上の各々に関してセンシングするセンサ部をさらに備え、
　前記判断部は、前記複数のセンシング種類の各々に関して、前記複数の第１のセンシング結果および前記センサ部によるセンシング結果の中から、当該センシング種類に対応する、前記ユーザに関するセンシング結果を前記所定の基準に基づいてそれぞれ選択することにより、前記一以上の第２のセンシング結果を決定する、前記（１１）～（１６）のいずれか一項に記載の情報処理装置。
（１８）
　前記複数のセンシング種類の各々に関して、前記センサ部による当該センシング種類に対応する、前記ユーザに関するセンシングが不可能と判定された場合、または、前記センサ部による当該センシング種類に対応する、前記ユーザに関するセンシング結果の精度が所定の閾値よりも低い場合には、前記判断部は、前記複数の第１のセンシング結果の中から、当該センシング種類に対応するセンシング結果を前記所定の基準に基づいてそれぞれ選択する、前記（１７）に記載の情報処理装置。
（１９）
　複数の機器から受信された複数の第１のセンシング結果の中から、ユーザの状態の推定に用いられる一以上の第２のセンシング結果を所定の基準に基づいて決定することと、
　前記一以上の第２のセンシング結果に基づいて情報の出力をプロセッサが制御することと、
を含む、情報処理方法。
（２０）
　コンピュータを、
　複数の機器から受信された複数の第１のセンシング結果の中から、ユーザの状態の推定に用いられる一以上の第２のセンシング結果を所定の基準に基づいて決定する判断部と、
　前記一以上の第２のセンシング結果に基づいて情報の出力を制御する出力制御部、
として機能させるためのプログラム。

１０　端末
２０　機器
２２　通信網
７０　サーバ
１００、２００、７００　制御部
１０２、７０２　判断部
１０４、７０４　ユーザ状態推定部
１０６、７０６　出力制御部
１０８、７０８　送信制御部
１２０、２２０、７２０　通信部
１２２、２２２　センサ部
１２４　出力部
１２６、２２４、７２２　記憶部

Claims

　複数の機器から受信された複数の第１のセンシング結果の中から、ユーザの状態の推定に用いられる一以上の第２のセンシング結果を所定の基準に基づいて決定する判断部と、
　前記一以上の第２のセンシング結果に基づいて情報の出力を制御する出力制御部と、
を備える、情報処理装置。
　前記出力制御部は、前記一以上の第２のセンシング結果を用いて推定された前記ユーザの状態に基づいて、前記情報の出力を制御する、請求項１に記載の情報処理装置。
　前記一以上の第２のセンシング結果は、複数のセンシング種類の各々に関するセンシング結果を含み、
　前記判断部は、前記複数のセンシング種類の各々に関して、前記複数の第１のセンシング結果の中から、当該センシング種類に対応するセンシング結果を前記所定の基準に基づいてそれぞれ選択することにより、前記一以上の第２のセンシング結果を決定する、請求項２に記載の情報処理装置。
　前記所定の基準は、前記複数の機器の各々と前記ユーザとの距離、前記複数の機器の各々の性能情報、前記複数の機器の各々の製造元の信頼度、および、前記複数の機器の各々に関連付けられているユーザの評価度のうちの少なくとも一つを含む、請求項３に記載の情報処理装置。
　前記判断部は、前記複数のセンシング種類の各々に関して、前記複数の機器のうち、前記ユーザのより近くに位置する前記機器による当該センシング種類に対応するセンシング結果を前記複数の第１のセンシング結果の中からそれぞれ選択する、請求項４に記載の情報処理装置。
　前記判断部は、前記複数のセンシング種類の各々に関して、前記複数の機器のうち、当該センシング種類に関するセンシングの性能がより高い前記機器による当該センシング種類に対応するセンシング結果を前記複数の第１のセンシング結果の中からそれぞれ選択する、請求項５に記載の情報処理装置。
　前記判断部は、前記複数のセンシング種類の各々に関して、前記複数の機器のうち、製造元の信頼度がより高い前記機器による当該センシング種類に対応するセンシング結果を前記複数の第１のセンシング結果の中からそれぞれ選択する、請求項５に記載の情報処理装置。
　前記判断部は、前記複数のセンシング種類の各々に関して、前記複数の機器の各々に関連付けて記憶されているユーザの評価度がより高い前記機器による、当該センシング種類に対応するセンシング結果を前記複数の第１のセンシング結果の中からそれぞれ選択する、請求項５に記載の情報処理装置。
　前記判断部は、前記複数のセンシング種類の各々に関して、前記複数の第１のセンシング結果の中から、当該センシング種類に対応するセンシング結果を、前記複数の機器の各々と前記ユーザとの距離、前記複数の機器の各々の性能情報、前記複数の機器の各々の製造元の信頼度、および、前記複数の機器の各々に関連付けられているユーザの評価度に基づいてそれぞれ選択することにより、前記一以上の第２のセンシング結果を決定する、請求項４に記載の情報処理装置。
　前記複数のセンシング種類は、音のセンシングを含み、
　前記判断部は、ユーザの発話の音が直接音としてセンシングされたセンシング結果を、前記ユーザの発話の音が間接音としてセンシングされたセンシング結果よりも優先して前記複数の第１のセンシング結果の中から選択することにより、前記一以上の第２のセンシング結果を決定する、請求項４に記載の情報処理装置。
　前記出力制御部は、前記一以上の第２のセンシング結果を用いて推定された前記ユーザの状態に対応する出力態様で、前記情報を出力部に出力させる、請求項４に記載の情報処理装置。
　前記情報は、前記ユーザに対する通知情報であり、
　前記出力制御部は、前記一以上の第２のセンシング結果を用いて推定された前記ユーザの状態に対応する出力態様で、前記ユーザに対する通知情報に対応する音声を前記出力部に出力させる、請求項１１に記載の情報処理装置。
　前記出力制御部は、前記一以上の第２のセンシング結果を用いて推定された前記ユーザの状態に基づいて、前記ユーザに対する通知情報の通知タイミングを決定し、かつ、
　決定した通知タイミングに、前記ユーザに対する通知情報に対応する音声を前記出力部に出力させる、請求項１２に記載の情報処理装置。
　前記出力部により前記情報が出力された後に前記情報の出力に関して前記ユーザから得られた評価度を示す情報と、前記一以上の第２のセンシング結果の各々をセンシングした前記機器とを関連付けて記憶する記憶部をさらに備える、請求項１１に記載の情報処理装置。
　前記出力部により前記情報が出力された後に前記情報の出力に関して前記ユーザから得られた評価度を示す情報を、前記一以上の第２のセンシング結果の各々をセンシングした前記機器へ通信部に送信させる送信制御部をさらに備える、請求項１１に記載の情報処理装置。
　前記通信部と、
　前記一以上の第２のセンシング結果を用いて前記ユーザの状態を推定するユーザ状態推定部と、をさらに備え、
　前記通信部は、前記複数の機器から前記複数の第１のセンシング結果を受信する、請求項１５に記載の情報処理装置。
　前記複数のセンシング種類のうちの一以上の各々に関してセンシングするセンサ部をさらに備え、
　前記判断部は、前記複数のセンシング種類の各々に関して、前記複数の第１のセンシング結果および前記センサ部によるセンシング結果の中から、当該センシング種類に対応する、前記ユーザに関するセンシング結果を前記所定の基準に基づいてそれぞれ選択することにより、前記一以上の第２のセンシング結果を決定する、請求項１１に記載の情報処理装置。
　前記複数のセンシング種類の各々に関して、前記センサ部による当該センシング種類に対応する、前記ユーザに関するセンシングが不可能と判定された場合、または、前記センサ部による当該センシング種類に対応する、前記ユーザに関するセンシング結果の精度が所定の閾値よりも低い場合には、前記判断部は、前記複数の第１のセンシング結果の中から、当該センシング種類に対応するセンシング結果を前記所定の基準に基づいてそれぞれ選択する、請求項１７に記載の情報処理装置。
　複数の機器から受信された複数の第１のセンシング結果の中から、ユーザの状態の推定に用いられる一以上の第２のセンシング結果を所定の基準に基づいて決定することと、
　前記一以上の第２のセンシング結果に基づいて情報の出力をプロセッサが制御することと、
を含む、情報処理方法。
　コンピュータを、
　複数の機器から受信された複数の第１のセンシング結果の中から、ユーザの状態の推定に用いられる一以上の第２のセンシング結果を所定の基準に基づいて決定する判断部と、
　前記一以上の第２のセンシング結果に基づいて情報の出力を制御する出力制御部、
として機能させるためのプログラム。