JP2020154994A

JP2020154994A - エージェントシステム、エージェントサーバ、エージェントサーバの制御方法、およびプログラム

Info

Publication number: JP2020154994A
Application number: JP2019054880A
Authority: JP
Inventors: 本田　裕; Yutaka Honda; 裕本田; 俊克倉持; Toshikatsu Kuramochi; 裕介大井; Yusuke Oi; 基嗣久保田; Mototsugu Kubota
Original assignee: Honda Motor Co Ltd
Current assignee: Honda Motor Co Ltd
Priority date: 2019-03-22
Filing date: 2019-03-22
Publication date: 2020-09-24
Also published as: US11518398B2; US20200317215A1; CN111731320B; CN111731320A

Abstract

【課題】エージェント機能をユーザに判別させ易くすることができるエージェントシステム、エージェントサーバ、エージェントサーバの制御方法、およびプログラムを提供すること。【解決手段】実施形態に係るエージェントシステムは、異なる複数の物体に搭載され、それぞれがユーザの発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部と、前記複数のエージェント機能部のうち、前記複数の物体に同一種類のエージェント機能部が存在する場合に、前記同一種類のエージェント機能部のそれぞれに対応付けられた属性情報を前記同一種類のエージェント機能部による応答内容に含めて、前記ユーザの可搬型の携帯端末に提供する情報提供部と、を備えるエージェントシステム。【選択図】図４

Description

本発明は、エージェントシステム、エージェントサーバ、エージェントサーバの制御方法、およびプログラムに関する。

従来、車両の乗員と対話を行いながら、乗員の要求に応じた運転支援に関する情報や車両の制御、その他のアプリケーション等を提供するエージェント機能に関する技術が開示されている（例えば、特許文献１参照）。

特開２００６−３３５２３１号公報

近年では、複数のエージェント機能を車両等の物体に搭載することについて実用化が進められているが、あるユーザが、エージェント機能を搭載した物体を複数所有していた場合に、どの物体に搭載したエージェント機能からの情報提供であるかが判断できない場合があった。

本発明は、このような事情を考慮してなされたものであり、エージェント機能をユーザに判別させ易くすることができるエージェントシステム、エージェントサーバ、エージェントサーバの制御方法、およびプログラムを提供することを目的の一つとする。

この発明に係るエージェントシステム、エージェントサーバ、エージェントサーバの制御方法、およびプログラムは、以下の構成を採用した。
（１）：この発明の一態様に係るエージェントシステムは、異なる複数の物体に搭載され、それぞれがユーザの発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部と、前記複数のエージェント機能部のうち、前記複数の物体に同一種類のエージェント機能部が存在する場合に、前記同一種類のエージェント機能部のそれぞれに対応付けられた属性情報を前記同一種類のエージェント機能部による応答内容に含めて、前記ユーザの可搬型の携帯端末に提供する情報提供部と、を備えるエージェントシステムである。

（２）：上記（１）の態様において、前記複数の物体は、前記ユーザに対応付けられた車両を含むものである。

（３）：上記（２）の態様において、前記属性情報は、前記車両に関する情報を含むものである。

（４）：上記（２）または（３）の態様において、前記複数のエージェント機能部のうち、所定のエージェント機能部における前記応答の出力態様を設定する設定部を更に備えるものである。

（５）：上記（４）の態様において、前記所定のエージェント機能部は、前記車両の制御が可能なエージェント機能部である。

（６）：上記（４）または（５）の態様において、前記所定のエージェント機能部は、前記複数のエージェント機能部に含まれる他のエージェント機能部の応答内容を取得するものである。

（７）：上記（４）〜（６）のうち何れか一つの態様において、前記所定のエージェント機能部は、他のエージェント機能部から取得した応答内容を、前記他のエージェント機能部に代理して前記携帯端末に出力させるものである。

（８）：本発明の他の態様に係るエージェントサーバは、ユーザの発話に応じて、音声による応答を含むサービスを提供するエージェント機能部と、前記エージェント機能部が、前記ユーザに対応付けられた複数の物体に搭載され、前記複数の物体のそれぞれに搭載されたエージェント機能部が同一種類のエージェント機能部である場合に、前記同一種類のエージェント機能部のそれぞれに対応付けられた属性情報を前記同一種類のエージェント機能部による応答内容に含めて、前記ユーザの可搬型の携帯端末に提供する情報提供部と、を備えるエージェントサーバである。

（９）：本発明の他の態様に係るエージェントサーバの制御方法は、コンピュータが、エージェント機能部を起動させ、前記起動したエージェント機能部の機能として、ユーザの発話に応じて、応答を含むサービスを提供し、前記エージェント機能部が、前記ユーザに対応付けられた複数の物体に搭載され、前記複数の物体のそれぞれに搭載されたエージェント機能部が同一種類のエージェント機能部である場合に、前記同一種類のエージェント機能部のそれぞれに対応付けられた属性情報を前記同一種類のエージェント機能部による応答内容に含めて、前記ユーザの可搬型の携帯端末に提供する、エージェントサーバの制御方法である。
（１０）：本発明の他の態様に係るプログラムは、コンピュータが、エージェント機能部を起動させ、前記起動させたエージェント機能部の機能として、ユーザの発話に応じて、応答を含むサービスを提供させ、前記エージェント機能部が、前記ユーザに対応付けられた複数の物体に搭載され、前記複数の物体のそれぞれに搭載されたエージェント機能部が同一種類のエージェント機能部である場合に、前記同一種類のエージェント機能部のそれぞれに対応付けられた属性情報を前記同一種類のエージェント機能部による応答内容に含めて、前記ユーザの可搬型の携帯端末に提供させる、プログラムである。

上記（１）〜（１０）の態様によれば、エージェント機能をユーザに判別させ易くすることができる。

エージェント装置１００を含むエージェントシステム１の構成図である。第１実施形態に係るエージェント装置１００の構成と、車両Ｍに搭載された機器とを示す図である。表示・操作装置２０およびスピーカユニット３０の配置例を示す図である。第１実施形態に係るエージェントサーバ２００および携帯端末３００の構成と、エージェント装置１００の構成の一部とを示す図である。エージェント管理情報２６０の内容の一例を示す図である。エージェントの出力態様を設定するための画像ＩＭ１の一例を示す図である。携帯端末３００を介して情報提供される内容の一例を示す図である。第１実施形態に係るエージェントシステム１により実行される処理の流れの一例を示すフローチャートである。第２実施形態に係るエージェントサーバの構成の一例を示す図である。第２実施形態において、携帯端末３００から出力される情報の一例を示す図である。エージェントサーバ２００＃が他のエージェントサーバに代理応答させる処理の流れの一例を示すフローチャートである。他のエージェントサーバから受信した応答内容に基づいて、自己のエージェントが代理応答する処理の流れの一例を示すフローチャートである。

以下、図面を参照し、本発明のエージェントシステム、エージェントサーバ、エージェントサーバの制御方法、およびプログラムの実施形態について説明する。エージェント装置は、エージェントシステムの一部または全部を実現する装置である。以下では、エージェント装置の一例として、車両に搭載され、複数種類のエージェント機能を備えたエージェント装置について説明する。車両は、物体の一例である。エージェント機能とは、例えば、車両のユーザと対話をしながら、ユーザの発話の中に含まれる要求（コマンド）に基づく各種の情報提供を行ったり、ユーザのスケジュールを管理したり、ネットワークサービスを仲介したりする機能である。複数種類のエージェントは、それぞれに果たす機能、処理手順、制御、出力態様・内容がそれぞれ異なってもよい。また、エージェント機能の中には、車両内の機器（例えば運転制御や車体制御に関わる機器）の制御等を行う機能を有するものがあってよい。

エージェント機能は、例えば、ユーザの音声を認識する音声認識機能（音声をテキスト化する機能）に加え、自然言語処理機能（テキストの構造や意味を理解する機能）、対話管理機能、ネットワークを介して他装置を検索し、或いは自装置が保有する所定のデータベースを検索するネットワーク検索機能等を統合的に利用して実現される。これらの機能の一部または全部は、ＡＩ（Artificial Intelligence）技術によって実現されてよい。また、これらの機能を行うための構成の一部（特に、音声認識機能や自然言語処理解釈機能）は、車両Ｍの車載通信装置または車両Ｍに持ち込まれた汎用通信装置と通信可能なエージェントサーバ（外部装置）に搭載されてもよい。以下の説明では、構成の一部がエージェントサーバに搭載されており、エージェント装置とエージェントサーバが協働してエージェントシステムを実現することを前提とする。また、エージェント装置とエージェントサーバが協働して仮想的に出現させるサービス提供主体（サービス・エンティティ）をエージェントと称する。

＜全体構成＞
図１は、エージェント装置１００を含むエージェントシステム１の構成図である。エージェントシステム１は、例えば、ユーザＵ１に対応付けられた複数の車両ＭＡ、ＭＢ、…のそれぞれに搭載されるエージェント装置１００Ａ、１００Ｂ、…と、複数のエージェントサーバ２００−１、２００−２、２００−３、…と、ユーザＵ１に対応付けられた携帯端末３００とを備える。「ユーザＵ１に対応付けられる」とは、例えば、ユーザＵ１が所有する、ユーザＵ１が管理する、或いはユーザＵ１に割り当てられていることに相当する。また、上記において、符号の末尾のハイフン以下の数字は、エージェントを区別するための識別子であるものとする。何れのエージェントサーバであるかを区別しない場合、単にエージェントサーバ２００と称する場合があるものとし、他の構成についても同様とする。図１では３つのエージェントサーバ２００を示しているが、エージェントサーバ２００の数は２つであってもよいし、４つ以上であってもよい。それぞれのエージェントサーバ２００は、例えば、互いに異なるエージェントシステムの提供者が運営するものである。したがって、本実施形態におけるエージェントは、互いに異なる提供者により実現されるエージェントである。提供者としては、例えば、自動車メーカー、ネットワークサービス事業者、電子商取引事業者、携帯端末の販売者や製造者等が挙げられ、任意の主体（法人、団体、個人等）がエージェントシステムの提供者となり得る。

エージェント装置１００Ａ、１００Ｂ、…は、それぞれが異なる車両ＭＡ、ＭＢ、…に搭載されていることを除いてほぼ同様の機能を備えるため、何れのエージェント装置であるかを区別しない場合、単にエージェント装置１００と称する。また、車両についても何れの車両であるかを区別しない場合、単に車両Ｍと称する。また、図１では２つのエージェント装置１００を示しているが、エージェント装置の数は３つ以上でもよい。エージェント装置１００は、ネットワークＮＷを介してエージェントサーバ２００と通信する。また、エージェントサーバ２００は、ネットワークＮＷを介して携帯端末３００と通信する。また、エージェント装置１００は、ネットワークＮＷを介して携帯端末３００と通信してもよい。ネットワークＮＷは、例えば、インターネット、セルラー網、Ｗｉ−Ｆｉ網、ＷＡＮ（Wide Area Network）、ＬＡＮ（Local Area Network）、公衆回線、電話回線、無線基地局等のうち一部または全部を含む。ネットワークＮＷには、各種ウェブサーバ４００が接続されており、エージェント装置１００、エージェントサーバ２００、または携帯端末３００は、ネットワークＮＷを介して各種ウェブサーバ４００からウェブページを取得することができる。

エージェント装置１００は、ユーザＵ１と対話を行い、ユーザＵ１からの音声をエージェントサーバ２００に送信し、エージェントサーバ２００から得られた回答に基づく応答内容を、音声出力や画像表示の形でユーザＵ１に提供する。ここで、エージェント装置１００は、ユーザＵ１が車両内に存在する場合には、車両Ｍに搭載された表示部やスピーカユニットを用いて情報提供を行い、ユーザＵ１が車両Ｍに存在しない場合には、ユーザＵ１の携帯端末３００に情報提供を行ってもよい。また、エージェント装置１００は、ユーザからの要求に基づいて車両機器５０に対する制御等を行ってもよい。

＜第１実施形態＞
［車両］
図２は、第１実施形態に係るエージェント装置１００の構成と、車両Ｍに搭載された機器とを示す図である。車両Ｍには、例えば、一以上のマイク１０と、表示・操作装置２０と、スピーカユニット３０と、ナビゲーション装置４０と、車両機器５０と、車載通信装置６０と、乗員認識装置８０と、エージェント装置１００とが搭載される。また、スマートフォン等の汎用通信装置７０が車室内に持ち込まれ、通信装置として使用される場合がある。これらの装置は、ＣＡＮ（Controller Area Network）通信線等の多重通信線やシリアル通信線、無線通信網等によって互いに接続される。なお、図２に示す構成はあくまで一例であり、構成の一部が省略されてもよいし、更に別の構成が追加されてもよい。表示・操作装置２０と、スピーカユニット３０とを合わせたものが「出力部」の一例である。

マイク１０は、車室内で発せられた音を収集する音声入力部である。表示・操作装置２０は、画像を表示するとともに、入力操作を受付可能な装置（或いは装置群）である。表示・操作装置２０は、例えば、タッチパネルとして構成されたディスプレイ装置を含む。表示・操作装置２０は、更に、ＨＵＤ（Head Up Display）や機械式の入力装置を含んでもよい。スピーカユニット３０は、例えば、車室内の互いに異なる位置に配設された複数のスピーカ（音声出力部）を含む。表示・操作装置２０は、エージェント装置１００とナビゲーション装置４０とで共用されてもよい。これらの詳細については後述する。

ナビゲーション装置４０は、ナビＨＭＩ（Human Machine Interface）と、ＧＰＳ（Global Positioning System）等の位置測位装置と、地図情報を記憶した記憶装置と、経路探索等を行う制御装置（ナビゲーションコントローラ）とを備える。マイク１０、表示・操作装置２０、およびスピーカユニット３０のうち一部または全部がナビＨＭＩとして用いられてもよい。ナビゲーション装置４０は、位置測位装置によって特定された車両Ｍの位置から、ユーザによって入力された目的地まで移動するための経路（ナビ経路）を探索し、経路に沿って車両Ｍが走行できるように、ナビＨＭＩを用いて案内情報を出力する。経路探索機能は、ネットワークＮＷを介してアクセス可能なナビゲーションサーバにあってもよい。この場合、ナビゲーション装置４０は、ナビゲーションサーバから経路を取得して案内情報を出力する。なお、エージェント装置１００は、ナビゲーションコントローラを基盤として構築されてもよく、その場合、ナビゲーションコントローラとエージェント装置１００は、ハードウェア上は一体に構成される。

車両機器５０は、例えば、車両Ｍに搭載される機器である。車両機器５０は、例えば、エンジンや走行用モータ等の駆動力出力装置、エンジンの始動モータ、ドアロック装置、ドア開閉装置、窓、窓の開閉装置および窓の開閉制御装置、シート、シート位置の制御装置、ルームミラーおよびその角度位置制御装置、車両内外の照明装置およびその制御装置、ワイパーやデフォッガーおよびそれぞれの制御装置、方向指示灯およびその制御装置、空調装置、走行距離やタイヤの空気圧の情報や燃料の残量情報等の車両情報装置等を含む。

車載通信装置６０は、例えば、セルラー網やＷｉ−Ｆｉ網を利用してネットワークＮＷにアクセス可能な無線通信装置である。

乗員認識装置８０は、例えば、着座センサ、車室内カメラ、画像認識装置等を含む。着座センサは座席の下部に設けられた圧力センサ、シートベルトに取り付けられた張力センサ等を含む。車室内カメラは、車室内に設けられたＣＣＤ（Charge Coupled Device）カメラやＣＭＯＳ（Complementary Metal Oxide Semiconductor）カメラである。画像認識装置は、車室内カメラの画像を解析し、座席ごとの乗員（ユーザ）の有無、顔向き等を認識する。乗員認識装置８０による認識結果は、エージェント装置１００やエージェントされた２００に出力される。

図３は、表示・操作装置２０およびスピーカユニット３０の配置例を示す図である。表示・操作装置２０は、例えば、第１ディスプレイ２２と、第２ディスプレイ２４と、操作スイッチＡＳＳＹ２６とを含む。表示・操作装置２０は、更に、ＨＵＤ２８を含んでもよい。また、表示・操作装置２０は、更に、インストルメントパネルのうち運転席ＤＳに対面する部分に設けられるメーターディスプレイ２９を含んでもよい。第１ディスプレイ２２と、第２ディスプレイ２４と、ＨＵＤ２８と、メーターディスプレイ２９とを合わせたものが「表示部」の一例である。

車両Ｍには、例えば、ステアリングホイールＳＷが設けられた運転席ＤＳと、運転席ＤＳに対して車幅方向（図中Ｙ方向）に設けられた助手席ＡＳとが存在する。第１ディスプレイ２２は、インストルメントパネルにおける運転席ＤＳと助手席ＡＳとの中間辺りから、助手席ＡＳの左端部に対向する位置まで延在する横長形状のディスプレイ装置である。第２ディスプレイ２４は、運転席ＤＳと助手席ＡＳとの車幅方向に関する中間あたり、且つ第１ディスプレイの下方に設置されている。例えば、第１ディスプレイ２２と第２ディスプレイ２４は、共にタッチパネルとして構成され、表示部としてＬＣＤ（Liquid Crystal Display）や有機ＥＬ（Electroluminescence）、プラズマディスプレイ等を備えるものである。操作スイッチＡＳＳＹ２６は、ダイヤルスイッチやボタン式スイッチ等が集積されたものである。ＨＵＤ２８は、例えば、風景に重畳させて画像を視認させる装置であり、一例として、車両Ｍのフロントウインドシールドやコンバイナーに画像を含む光を投光することで、乗員に虚像を視認させる。メーターディスプレイ２９は、例えば、ＬＣＤや有機ＥＬ等であり、速度計や回転速度計等の計器類を表示する。表示・操作装置２０は、乗員によってなされた操作の内容をエージェント装置１００に出力する。上述した各表示部が表示する内容は、エージェント装置１００によって決定されてよい。

スピーカユニット３０は、例えば、スピーカ３０Ａ〜３０Ｆを含む。スピーカ３０Ａは、運転席ＤＳ側の窓柱（いわゆるＡピラー）に設置されている。スピーカ３０Ｂは、運転席ＤＳに近いドアの下部に設置されている。スピーカ３０Ｃは、助手席ＡＳ側の窓柱に設置されている。スピーカ３０Ｄは、助手席ＡＳに近いドアの下部に設置されている。スピーカ３０Ｅは、第２ディスプレイ２４の近傍に設置されている。スピーカ３０Ｆは、車室の天井（ルーフ）に設置されている。また、スピーカユニット３０は、右側後部座席や左側後部座席に近いドアの下部に設置されてもよい。

係る配置において、例えば、専らスピーカ３０Ａおよび３０Ｂに音を出力させた場合、音像は運転席ＤＳ付近に定位することになる。「音像が定位する」とは、例えば、乗員の左右の耳に伝達される音の大きさを調節することにより、乗員が感じる音源の空間的な位置を定めることである。また、専らスピーカ３０Ｃおよび３０Ｄに音を出力させた場合、音像は助手席ＡＳ付近に定位することになる。また、専らスピーカ３０Ｅに音を出力させた場合、音像は車室の前方付近に定位することになり、専らスピーカ３０Ｆに音を出力させた場合、音像は車室の上方付近に定位することになる。これに限らず、スピーカユニット３０は、ミキサーやアンプを用いて各スピーカの出力する音の配分を調整することで、車室内の任意の位置に音像を定位させることができる。

［エージェント装置］
図２に戻り、エージェント装置１００は、管理部１１０と、エージェント機能部１５０−１、１５０−２、１５０−３と、ペアリングアプリ実行部１６０と、記憶部１７０とを備える。管理部１１０は、例えば、音響処理部１１２と、エージェントごとＷＵ（Wake Up）判定部１１４と、エージェント設定部１１６と、出力制御部１２０と備える。以下、何れのエージェント機能部であるか区別しない場合、単にエージェント機能部１５０と称する。３つのエージェント機能部１５０を示しているのは、図１におけるエージェントサーバ２００の数に対応させた一例に過ぎず、エージェント機能部１５０の数は、２つであってもよいし、４つ以上であってもよい。図２に示すソフトウェア配置は、説明のために簡易に示しており、実際には、例えば、エージェント機能部１５０と車載通信装置６０の間に管理部１１０が介在してもよいように、任意に改変することができる。また、以下では、エージェント機能部１５０−１とエージェントサーバ２００−１が協働して出現させるエージェントを「エージェント１」、エージェント機能部１５０−２とエージェントサーバ２００−２が協働して出現させるエージェントを「エージェント２」、エージェント機能部１５０−３とエージェントサーバ２００−３が協働して出現させるエージェントを「エージェント３」と称する場合がある。

エージェント装置１００の各構成要素は、例えば、ＣＰＵ（Central Processing Unit）等のハードウェアプロセッサがプログラム（ソフトウェア）を実行することにより実現される。これらの構成要素のうち一部または全部は、ＬＳＩ（Large Scale Integration）やＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field-Programmable Gate Array）、ＧＰＵ（Graphics Processing Unit）等のハードウェア（回路部；circuitryを含む）によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めＨＤＤ（Hard Disk Drive）やフラッシュメモリ等の記憶装置（非一過性の記憶媒体を備える記憶装置）に格納されていてもよいし、ＤＶＤやＣＤ−ＲＯＭ等の着脱可能な記憶媒体（非一過性の記憶媒体）に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。

記憶部１７０は、上記の各種記憶装置により実現される。記憶部１７０には、各種データやプログラムが格納される。

管理部１１０は、ＯＳ（Operating System）やミドルウェア等のプログラムが実行されることで機能する。

管理部１１０の音響処理部１１２は、マイク１０から収集される音を受け付け、受け付けた音に対して、エージェントごとに予め設定されているウエイクアップワード（起動ワード）を認識するのに適した状態になるように音響処理を行う。音響処理とは、例えば、バンドパスフィルタ等のフィルタリングによるノイズ除去や音の増幅等である。また、音響処理部１１２は、音響処理された音声を、エージェントごとＷＵ判定部１１４や起動中のエージェント機能部に出力する。

エージェントごとＷＵ判定部１１４は、エージェント機能部１５０−１、１５０−２、１５０−３のそれぞれに対応して存在し、エージェントごとに予め定められているウエイクアップワードを認識する。エージェントごとＷＵ判定部１１４は、音響処理が行われた音声（音声ストリーム）から音声の意味を認識する。まず、エージェントごとＷＵ判定部１１４は、音声ストリームにおける音声波形の振幅と零交差に基づいて音声区間を検出する。エージェントごとＷＵ判定部１１４は、混合ガウス分布モデル（ＧＭＭ；Gaussian mixture model) に基づくフレーム単位の音声識別および非音声識別に基づく区間検出を行ってもよい。

次に、エージェントごとＷＵ判定部１１４は、検出した音声区間における音声をテキスト化し、文字情報とする。そして、エージェントごとＷＵ判定部１１４は、テキスト化した文字情報がウエイクアップワードに該当するか否かを判定する。ウエイクアップワードであると判定した場合、エージェントごとＷＵ判定部１１４は、対応するエージェント機能部１５０を起動させる。なお、エージェントごとＷＵ判定部１１４に相当する機能がエージェントサーバ２００に搭載されてもよい。この場合、管理部１１０は、音響処理部１１２によって音響処理が行われた音声ストリームをエージェントサーバ２００に送信し、エージェントサーバ２００がウエイクアップワードであると判定した場合、エージェントサーバ２００からの指示に従ってエージェント機能部１５０が起動する。なお、各エージェント機能部１５０は、常時起動しており且つウエイクアップワードの判定を自ら行うものであってよい。この場合、管理部１１０がエージェントごとＷＵ判定部１１４を備える必要はない。

また、エージェントごとＷＵ判定部１１４は、上述した手順と同様の手順で、発話された音声に含まれる終了ワードを認識した場合であり、且つ、終了ワードに対応するエージェントが起動している状態（以下、必要に応じて「起動中」と称する）である場合、起動しているエージェント機能部を停止（終了）させる。なお、起動中のエージェントは、音声の入力を所定時間以上受け付けなかった場合や、エージェントを終了させる所定の指示操作を受け付けた場合に、エージェントを停止させてもよい。

エージェント設定部１１６は、エージェントごとの応答時の出力態様を設定する。出力態様とは、例えば、後述するエージェント画像または疑似的にエージェント画像が発していると聴者（乗員）に認識させるための音声（以下、エージェント音声を称する）のうち、一方または双方である。エージェント設定部１１６は、複数のエージェント機能部１５０−１〜１５０−３のうち、所定のエージェント機能部に対応付けられたエージェント画像やエージェント音声のみを設定できるようにしてもよい。所定のエージェント機能部には、例えば、車両Ｍの制御が可能なエージェント機能部１５０−１が含まれる。「車両Ｍの制御が可能」とは、例えば、車両機器５０に対する制御や、ナビゲーション装置４０、表示・操作装置２０に対する制御が可能であることである。エージェント設定部１１６における設定内容の詳細については後述する。

出力制御部１２０は、管理部１１０またはエージェント機能部１５０からの指示に応じて表示部またはスピーカユニット３０に応答内容等の情報を出力させることで、乗員にサービス等の提供を行う。出力制御部１２０は、例えば、表示制御部１２２と、音声制御部１２４とを備える。

表示制御部１２２は、出力制御部１２０からの指示に応じて表示部の少なくとも一部の領域に画像を表示させる。以下では、エージェントに関する画像を第１ディスプレイ２２に表示させるものとして説明する。表示制御部１２２は、出力制御部１２０の制御により、エージェント画像を生成し、生成したエージェント画像を第１ディスプレイ２２に表示させる。エージェント画像は、例えば、車室内で乗員とのコミュニケーションを行う擬人化されたエージェントの画像である。また、エージェント画像は、例えば、乗員に対して話しかける態様の画像である。エージェント画像は、例えば、少なくとも観者（乗員）によって表情や顔向きが認識される程度の顔画像を含んでよい。例えば、エージェント画像は、顔領域の中に目や鼻に擬したパーツが表されており、顔領域の中のパーツの位置に基づいて表情や顔向きが認識されるものであってよい。また、エージェント画像は、立体的に感じられ、観者によって三次元空間における頭部画像を含むことでエージェントの顔向きが認識されたり、本体（胴体や手足）の画像を含むことで、エージェントの動作や振る舞い、姿勢等が認識されるものであってもよい。また、エージェント画像は、アニメーション画像であってもよい。例えば、表示制御部１２２は、乗員認識装置８０により認識された乗員の位置に近い表示領域にエージェント画像を表示させたり、乗員の位置に顔を向けたエージェント画像を生成して表示させてもよい。

音声制御部１２４は、出力制御部１２０からの指示に応じて、スピーカユニット３０に含まれるスピーカのうち一部または全部に音声を出力させる。音声制御部１２４は、複数のスピーカユニット３０を用いて、エージェント画像の表示位置に対応する位置にエージェント音声の音像を定位させる制御を行ってもよい。エージェント画像の表示位置に対応する位置とは、例えば、エージェント画像がエージェント音声を喋っていると乗員が感じると予測される位置であり、具体的には、エージェント画像の表示位置付近（例えば、２〜３［ｃｍ］以内）の位置である。

エージェント機能部１５０は、対応するエージェントサーバ２００と協働してエージェントを出現させ、車両の乗員の発話に応じて、音声による応答を含むサービスを提供する。エージェント機能部１５０には、車両Ｍ（例えば、車両機器５０）を制御する権限が付与されたものが含まれてよい。また、エージェント機能部１５０には、ペアリングアプリ実行部１６０を介して汎用通信装置７０と連携し、エージェントサーバ２００と通信するものがあってよい。例えば、エージェント機能部１５０−１には、車両Ｍ（例えば、車両機器５０）を制御する権限が付与されている。エージェント機能部１５０−１は、車載通信装置６０を介してエージェントサーバ２００−１と通信する。エージェント機能部１５０−２は、車載通信装置６０を介してエージェントサーバ２００−２と通信する。エージェント機能部１５０−３は、ペアリングアプリ実行部１６０を介して汎用通信装置７０と連携し、エージェントサーバ２００−３と通信する。

ペアリングアプリ実行部１６０は、例えば、Ｂｌｕｅｔｏｏｔｈ（登録商標）によって汎用通信装置７０とペアリングを行い、エージェント機能部１５０−３と汎用通信装置７０とを接続させる。なお、エージェント機能部１５０−３は、ＵＳＢ（Universal Serial Bus）等を利用した有線通信によって汎用通信装置７０に接続されるようにしてもよい。

［エージェントサーバおよび携帯端末］
図４は、第１実施形態に係るエージェントサーバ２００および携帯端末３００の構成と、エージェント装置１００の構成の一部とを示す図である。以下、エージェントサーバ２００および携帯端末３００の構成とともに、車両ＭＡおよび車両ＭＢのそれぞれに搭載される同一種類のエージェントに対応するエージェント機能部等の動作について説明する。以下、同一種類のエージェントの一例としてエージェント１を用いることとし、エージェント装置１００Ａおよび１００Ｂのそれぞれの構成部の符号には、「Ａ」または「Ｂ」の文字を付与して、それぞれの構成を識別するものとする。また、以下では、ネットワークＮＷを用いた物理的な通信についての説明を省略する。また、以下では、主にエージェント装置１００Ａおよびエージェントサーバ２００−１の動作を中心として説明する。

エージェントサーバ２００−１は、サーバ側通信部２１０を備える。サーバ側通信部２１０は、例えば、ＮＩＣ（Network Interface Card）等のネットワークインターフェースである。更に、エージェントサーバ２００−１は、例えば、音声認識部２２０と、自然言語処理部２２２と、対話管理部２２４と、ネットワーク検索部２２６と、応答内容生成部２２８と、情報提供部２３０と、記憶部２５０とを備える。これらの構成要素は、例えば、ＣＰＵ等のハードウェアプロセッサがプログラム（ソフトウェア）を実行することにより実現される。これらの構成要素のうち一部または全部は、ＬＳＩやＡＳＩＣ、ＦＰＧＡ、ＧＰＵ等のハードウェア（回路部；circuitryを含む）によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めＨＤＤやフラッシュメモリ等の記憶装置（非一過性の記憶媒体を備える記憶装置）に格納されていてもよいし、ＤＶＤやＣＤ−ＲＯＭ等の着脱可能な記憶媒体（非一過性の記憶媒体）に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。音声認識部２２０と、自然言語処理部２２２とを合わせたものが「認識部」の一例である。

記憶部２５０は、上記の各種記憶装置により実現される。記憶部２５０には、例えば、辞書ＤＢ（データベース）２５２、パーソナルプロファイル２５４、知識ベースＤＢ２５６、応答規則ＤＢ２５８、エージェント管理情報２６０等のデータやプログラムが格納される。

エージェント装置１００において、エージェント機能部１５０Ａ−１は、例えば、音響処理部１１２等から入力される音声ストリーム、或いは圧縮や符号化等の処理を行った音声ストリームを、エージェントサーバ２００−１に送信する。エージェント機能部１５０Ａ−１は、ローカル処理（エージェントサーバ２００−１を介さない処理）が可能なコマンド（要求内容）が認識できた場合には、コマンドで要求された処理を実行してもよい。ローカル処理が可能なコマンドとは、例えば、エージェント装置１００Ａのそれぞれが備える記憶部１７０Ａを参照することで応答可能なコマンドである。より具体的には、ローカル処理が可能なコマンドとは、例えば、記憶部１７０Ａ内に存在する電話帳データから特定者の名前を検索し、合致した名前に対応付けられた電話番号に電話をかける（相手を呼び出す）コマンドである。したがって、エージェント機能部１５０Ａ−１は、エージェントサーバ２００−１が備える機能の一部を有してもよい。

音声ストリームを取得すると、音声認識部２２０が音声認識を行ってテキスト化された文字情報を出力し、自然言語処理部２２２が文字情報に対して辞書ＤＢ２５２を参照しながら意味解釈を行う。辞書ＤＢ２５２は、例えば、文字情報に対して抽象化された意味情報が対応付けられたものである。辞書ＤＢ２５２は、同義語や類義語の一覧情報を含んでもよい。音声認識部２２０の処理と、自然言語処理部２２２の処理は、段階が明確に分かれるものではなく、自然言語処理部２２２の処理結果を受けて音声認識部２２０が認識結果を修正する等、相互に影響し合って行われてよい。

自然言語処理部２２２は、例えば、認識結果として、「今日の天気は」、「天気はどうですか」等の意味が認識された場合、標準文字情報「今日の天気」に置き換えたコマンドを生成する。これにより、リクエストの音声に文字揺らぎがあった場合にも要求にあった対話をし易くすることができる。また、自然言語処理部２２２は、例えば、確率を利用した機械学習処理等の人工知能処理を用いて文字情報の意味を認識したり、認識結果に基づくコマンドを生成してもよい。

対話管理部２２４は、入力されたコマンドに基づいて、パーソナルプロファイル２５４や知識ベースＤＢ２５６、応答規則ＤＢ２５８を参照しながら車両Ｍの乗員に対する応答内容（例えば、乗員への発話内容や出力部から出力する画像、音声）を決定する。パーソナルプロファイル２５４は、ユーザ（乗員）ごとに保存されているユーザの個人情報、趣味嗜好、過去の対話の履歴等を含む。ユーザの個人情報には、例えば、ユーザの携帯端末３００と通信を行うためのアドレス情報等が含まれる。知識ベースＤＢ２５６は、物事の関係性を規定した情報である。応答規則ＤＢ２５８は、コマンドに対してエージェントが行うべき動作（回答や機器制御の内容等）を規定した情報である。

また、対話管理部２２４は、音声ストリームから得られる特徴情報を用いて、パーソナルプロファイル２５４と照合を行うことで、ユーザを特定してもよい。この場合、パーソナルプロファイル２５４には、例えば、音声の特徴情報に、個人情報が対応付けられている。音声の特徴情報とは、例えば、声の高さ、イントネーション、リズム（音の高低のパターン）等の喋り方の特徴や、メル周波数ケプストラム係数（Mel Frequency Cepstrum Coefficients）等による特徴量に関する情報である。音声の特徴情報は、例えば、ユーザの初期登録時に所定の単語や文章等をユーザに発声させ、発声させた音声を認識することで得られる情報である。

対話管理部２２４は、コマンドが、ネットワークＮＷを介して検索可能な情報を要求するものである場合、ネットワーク検索部２２６に検索を行わせる。ネットワーク検索部２２６は、ネットワークＮＷを介して各種ウェブサーバ４００にアクセスし、所望の情報を取得する。「ネットワークＮＷを介して検索可能な情報」とは、例えば、車両Ｍの周辺にあるレストランの一般ユーザによる評価結果であったり、その日の車両Ｍの位置に応じた天気予報であったりする。

応答内容生成部２２８は、対話管理部２２４により決定された発話の内容が車両Ｍの乗員に伝わるように、応答内容を生成し、生成した応答内容をエージェント装置１００に送信する。応答内容には、例えば、乗員に提供する応答文や各制御対象機器に対する制御コマンド等が含まれる。また、応答内容生成部２２８は、乗員認識装置８０による認識結果をエージェント装置１００から取得し、取得した認識結果によりコマンドを含む発話を行った乗員がパーソナルプロファイル２５４に登録された乗員であることが特定されている場合に、乗員の名前を呼んだり、乗員の話し方に似せた話し方にした応答内容を生成してもよい。

情報提供部２３０は、応答内容生成部２２８により生成された応答内容に対し、記憶部２５０に記憶されたエージェント管理情報２６０を参照し、エージェントの出力態様に対応する応答内容を生成する。図５は、エージェント管理情報２６０の内容の一例を示す図である。エージェント管理情報２６０には、例えば、ユーザを識別する識別情報であるユーザＩＤおよび車両Ｍを識別する識別情報である車両ＩＤに、属性情報、およびエージェント設定情報が対応付けられている。属性情報とは、例えば、ユーザに対応付けられた複数の車両のそれぞれに搭載された同一種類のエージェントを識別するための識別情報である。属性情報には、例えば、車名やナンバープレートに記載された自動車登録番号が含まれる。また、属性情報は、ユーザが複数の車両のうち何れかの車両を特定できる情報であればよく、具体的は、自動車メーカー、車体の色情報や形状情報、購入時期等の情報が含まれてもよい。エージェント設定情報には、例えば、エージェント設定部１１６で設定されたエージェント画像情報およびエージェント音声情報が含まれる。

例えば、情報提供部２３０は、エージェント機能部１５０Ａ−１から音声と共に送信されたユーザＩＤおよび車両ＩＤを用いて、記憶部２５０に記憶されたエージェント管理情報２６０を参照し、ユーザＩＤおよび車両ＩＤに対応付けられたエージェント設定情報を取得する。そして、情報提供部２３０は、エージェント設定情報のエージェント画像およびエージェント音声に対応させた応答内容を生成し、生成した応答内容を、音声を送信したエージェント機能部１５０Ａ−１に送信する。

エージェント機能部１５０Ａ−１は、エージェントサーバ２００−１から応答内容を取得すると、音声合成等を行って音声を出力するように音声制御部１２４に指示する。また、エージェント機能部１５０Ａ−１は、音声出力に合わせてエージェント画像を生成し、生成したエージェント画像や応答結果に含まれる画像等を表示するように表示制御部１２２に指示する。このようにして、仮想的に出現したエージェントが車両Ｍの乗員に応答するエージェント機能が実現される。

また、情報提供部２３０は、例えば、エージェント機能部１５０−１から取得したユーザＵ１に提供する情報であって、乗員認識装置８０からの認識結果により車両ＭＡ、ＭＢにユーザＵ１が乗車していない場合に、パーソナルプロファイル２５４に記憶された個人情報から携帯端末３００のアドレス情報を取得し、取得したアドレス情報に基づいて携帯端末３００に応答内容を出力する。ユーザＵ１に提供する情報とは、例えば、車両に関する情報やユーザＵ１との対話によって予約されていた情報等のユーザＵ１に早期に通知すべきであると推定される情報である。携帯端末３００に情報提供を行う場合における情報提供部２３０の機能の詳細については後述する。

エージェントサーバ２００−１は、車両ＭＡに搭載されたエージェント装置１００Ａが備えるエージェント機能部１５０Ａ−１と、車両ＭＢに搭載されたエージェント装置１００Ｂが備えるエージェント機能部１５０Ｂ−１とのそれぞれに対して上述した機能を実行する。

［携帯端末］
携帯端末３００は、例えば、エージェント機能が搭載されていない可搬型の端末装置である。携帯端末３００は、例えば、スマートフォンやタブレット端末、ウェアラブル端末である。携帯端末３００は、例えば、端末側通信部３１０と、端末側マイク３２０と、端末側表示・操作装置３３０と、端末側スピーカ３４０と、端末側音響処理部３５０と、端末側出力制御部３６０とを備える。これらの構成要素は、例えば、ＣＰＵ等のハードウェアプロセッサがプログラム（ソフトウェア）を実行することにより実現される。これらの構成要素のうち一部または全部は、ＬＳＩやＡＳＩＣ、ＦＰＧＡ、ＧＰＵ等のハードウェア（回路部；circuitryを含む）によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めＨＤＤやフラッシュメモリ等の記憶装置（非一過性の記憶媒体を備える記憶装置）に格納されていてもよいし、ＤＶＤやＣＤ−ＲＯＭ等の着脱可能な記憶媒体（非一過性の記憶媒体）に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。

端末側通信部３１０は、ネットワークＮＷを介してエージェントサーバ２００や他の外部装置と通信を行う。端末側マイク３２０は、ユーザＵ１が発した音を収集する音声入力部である。端末側表示・操作装置３３０は、画像を表示するとともに、入力操作を受付可能な装置である。端末側表示・操作装置３３０は、例えば、タッチパネルとして構成されたディスプレイ装置を含む。端末側表示・操作装置３３０は、表示部としてＬＣＤや有機ＥＬ、プラズマディスプレイ等を備え、操作部として各種ボタンや画面上にＧＵＩ（Graphical User Interface）スイッチを備える。端末側スピーカ３４０は、音声を出力する音声出力部である。

端末側音響処理部３５０は、端末側マイク３２０から収集される音を受け付け、受け付けた音に対して、エージェントサーバ２００−１側での音声認識が可能となるような音響処理を行う。端末側音響処理部３５０は、音響処理された音声を、端末側通信部３１０を介してエージェントサーバ２００−１に送信する。

端末側出力制御部３６０は、エージェントサーバ２００−１から入力された応答内容に基づいて、端末側表示・操作装置３３０の表示部または端末側スピーカ３４０に情報を出力させる。端末側出力制御部３６０は、例えば、表示制御部３６２と、音声制御部３６４とを備える。表示制御部３６２は、端末側出力制御部３６０からの指示に応じて表示部の少なくとも一部の表示領域にエージェント画像等の各種画像を表示させる。音声制御部３６４は、端末側出力制御部３６０からの指示に応じて、端末側スピーカ３４０にエージェント音声等の各種音声を出力させる。

［エージェント設定部の機能］
以下、エージェント設定部１１６の機能について具体的に説明する。エージェント設定部１１６は、例えば、表示・操作装置２０へのユーザ操作によりエージェントの設定指示を受け付けた場合、またはユーザが最初にエージェントを使用する場合に、エージェントの出力態様を設定するための画像を表示制御部１２２に生成させ、生成させた画像をエージェント設定画面として表示・操作装置２０の表示部に出力させる。

図６は、エージェントの出力態様を設定するための画像ＩＭ１の一例を示す図である。なお、画像ＩＭ１に表示される内容やレイアウト等については、これに限定されるものではない。画像ＩＭ１には、例えば、エージェント選択領域Ａ１１と、エージェント画像選択領域Ａ１２と、音声選択領域Ａ１３と、ＧＵＩスイッチ選択領域Ａ１４とが含まれる。なお、画像ＩＭ１には、上述した領域に加えて、ユーザのＩＤや車両ＩＤ、車両の色、形状を設定する設定領域や属性情報を設定する設定領域、エージェントの名称を設定する設定領域等が含まれてもよい。

エージェント選択領域Ａ１１には、例えば、ユーザＵ１が、出力態様を設定するエージェントを選択するための情報が表示される。例えば、エージェント１〜エージェント３のうち、エージェント１およびエージェント２が設定可能であり、エージェント３が設定不可能である場合、エージェント選択領域Ａ１１には、エージェント１およびエージェント２の選択肢のみが表示される。なお、エージェントの出力態様の設定（変更）が可能なエージェントには、車両Ｍの制御が可能なエージェント（ここでは、エージェント１）が含まれる。エージェント１は、車両の制御が行えるという特殊性から、他のエージェントよりも車両Ｍとの関連性が高いため、車両に関する情報を携帯端末３００に通知する場合に、エージェント１を使用する頻度が高いことが予測される。したがって、エージェント１の出力態様を車両ごとに変更可能とすることで、ユーザＵ１に対し、携帯端末３００に出力される情報から車両を判別させ易くすることができる。また、図６の例において、エージェント選択領域Ａ１１には、プルダウンメニュー（ドロップダウンメニュー）が表示されているが、これに代えて、リストボックスやラジオボタン等のＧＵＩを用いてエージェントが選択可能に表示されてもよい。

エージェント画像選択領域Ａ１２には、例えば、予め決められた一以上のエージェント画像が表示される。図６の例において、エージェント画像選択領域Ａ１２には、エージェント画像ＥＩ１〜ＥＩ３（Character Ａ〜Ｃ）が表示されている。ユーザＵ１は、エージェント画像ＥＩ１〜ＥＩ３のうち何れかの画像の表示領域をタッチすることで、エージェント画像が選択される。図６の例において、エージェント画像選択領域Ａ１２には、エージェント画像ＥＩ１が選択された状態が示されている。

音声選択領域Ａ１３には、例えば、予め決められた一以上のエージェント音声が表示される。エージェント音声には、例えば、合成音声や、声優や著名人、タレント等の実際の人物の音声等を識別する情報が含まれる。図６の例において、音声選択領域Ａ１３には、プルダウンメニュー（ドロップダウンメニュー）が表示されているが、これに代えて、リストボックスやラジオボタン等のＧＵＩを用いてエージェント音声が選択可能に表示されてもよい。

ＧＵＩスイッチ選択領域Ａ１４には、ユーザ選択可能な各種ＧＵＩボタンが表示される。図６の例において、ＧＵＩスイッチ選択領域Ａ１４には、例えば、各領域Ａ１１〜Ａ１３で選択した内容での設定を許可する設定許可ボタン（ＯＫボタン）ＩＣ１と、設定を許可しないキャンセルボタンＩＣ２とが含まれる。ユーザＵ１が、設定許可ボタンＩＣ１を選択した場合、各領域Ａ１１〜Ａ１３で選択された内容でエージェントの出力態様が設定される。この場合、エージェント設定部１１６は、設定情報を、予め決められた（または設定された）ユーザＩＤ、車両ＩＤ、および属性情報等と対応付けて、エージェント選択領域Ａ１１で選択したエージェントに対応するエージェントサーバ２００に送信する。図６の例では、エージェント１が選択されているため、設定情報（エージェント画像「ｃｈａｒａｃｔｅｒＡ」、エージェント音声「ＶｏｉｃｅＡ」）は、ユーザＵ１のユーザＩＤ（例えば、「Ｕ１」）、車両ＭＡの車両ＩＤ（例えば、「Ｖ００１」）、属性情報（例えば、車名「ＡＡＡ」）と共に、エージェントサーバ２００−１に送信される。エージェントサーバ２００−１は、エージェント設定部１１６により送信された情報を、エージェント管理情報２６０として記憶部２５０に記憶させる。

なお、エージェント設定部１１６は、例えば、ユーザＩＤに対応付けて設定された出力態様（エージェント画像、エージェント音声）が、同一車両の他のエージェントの出力態様と重複する場合に、その設定情報の登録を中止し、異なる内容で再度設定するようにユーザＵ１に通知してもよい。これにより、同一車両に搭載された複数のエージェントの区別が付きにくくなることを抑制することができる。また、エージェント設定部１１６は、すでに登録されている他の車両の同一種類のエージェントの出力態様と重複する場合にも、同様に再度設定するような制御を行ってもよい。

また、キャンセルボタンＩＣ２が選択された場合、エージェント設定部１１６は、画像ＩＭ１によって設定された内容をクリアにする。なお、上述の例では、エージェント画像およびエージェント音声の設定を行う例について説明したが、例えば、エージェント画像またはエージェント音声の何れか一方を設定する画像を表示して、表示された内容に対する設定を行ってもよい。

［情報提供部の機能］
次に、情報提供部２３０の機能について具体的に説明する。なお、以下では、情報提供部２３０の機能に関連する応答内容生成部２２８の機能についても説明する。応答内容生成部２２８は、例えば、エージェント機能部１５０Ａ−１からユーザに提供する情報として、車両ＭＡに関する情報が入力された場合に、車両ＭＡに関する情報をユーザＵ１に通知する応答内容を生成する。「車両に関する情報」には、例えば、車両Ｍの窓やドアの開閉状態、燃料やバッテリの状態（例えば、残量）、ライトや室内照明のオン・オフ状態、または乗員認識装置８０による認識結果のうち、少なくとも一つが含まれる。

ここで、例えば、エージェントサーバ２００−１は、車両ＭＡのエージェント機能部１５０Ａ−１から「後部座席の窓が開いている」という情報を取得したとする。また、エージェントサーバ２００−１は、車両ＭＡ、ＭＢに搭載された乗員認識装置８０Ａ、８０Ｂの認識結果により、車両ＭＡ、ＭＢに乗員が存在しないという情報を取得しているものとする。

この場合、情報提供部２３０は、ユーザＵ１の携帯端末３００に車両ＭＡに関する情報を出力させる。この場合、情報提供部２３０は、記憶部２５０に記憶されたエージェント管理情報２６０から、ユーザＩＤおよび車両ＩＤに対応する属性情報を取得し、取得した属性情報を含む応答内容を生成する。図５の例において、ユーザＵ１のユーザＩＤが「Ｕ１」であり、車両ＭＡの車両ＩＤが「Ｖ００１」である場合、応答内容生成部２２８は、出力態様がエージェント画像「ｃｈａｒａｃｔｅｒＡ」、エージェント音声「ＶｏｉｃｅＡ」の応答内容を生成すると共に、属性情報（例えば、車名「ＡＡＡ」）の情報を含めた応答内容を生成し、生成した応答内容を携帯端末３００に送信する。

端末側出力制御部３６０は、エージェントサーバ２００−１により送信された応答内容に対応する画像を端末側表示・操作装置３３０の表示部に出力したり、応答内容に対応する音声を端末側スピーカ３４０により出力させる。

図７は、携帯端末３００を介して情報提供される内容の一例を示す図である。図７の例では、表示制御部３６２により生成されて端末側表示・操作装置３３０の表示部に表示される画像ＩＭ２と、端末側スピーカ３４０により出力される音声の例を示している。画像ＩＭ２には、例えば、文字情報表示領域Ａ２１と、エージェント表示領域Ａ２２とが含まれる。文字情報表示領域Ａ２１には、例えば、ユーザＵ１と対話を行うエージェントに関する情報が表示される。図７の例において、文字情報表示領域Ａ２１には、「「ＡＡＡ」のエージェント１が対話中」という文字情報が表示されている。

エージェント表示領域Ａ２２には、例えば、対話中のエージェントに対応付けられたエージェント画像やエージェントの応答内容が表示される。図７の例において、エージェント表示領域Ａ２２には、ユーザＵ１および車両ＭＡのエージェント１に対応付けられたエージェント画像ＥＩ１が表示されている。この場合、エージェント画像ＥＩ１は、車両ごとに設定されたエージェント設定情報のエージェント画像が表示される。また、エージェント表示領域Ａ２２には、応答内容に対応する文字情報として、「後部座席の窓が開いています。閉めますか？」という文字情報が表示される。また、音声制御部３６４は、応答内容に対応する音声として「「ＡＡＡ」のエージェント１です。「ＡＡＡ」の後部座席の窓が開いています。閉めますか？」といった音声を生成し、生成した音声を出力させる。この場合、音声は、ユーザＵ１および車両ＭＡに対応付けられたエージェント音声で出力される。このように、画像に表示される文字情報やエージェント画像、エージェント音声によって、エージェント自身が、どの車両のエージェントであるかをユーザＵ１に伝えることで、対話しているエージェントをユーザＵ１に判別させ易くすることができる。

また、携帯端末３００に上述した図７に示すような情報提供がなされた後、ユーザＵ１が「閉めて」と発話した場合、端末側マイク３２０により取得された上記の発話の音声に対する音響処理が行われ、音響処理された音声が端末側通信部３１０からエージェントサーバ２００−１に送信される。エージェントサーバ２００−１は、携帯端末３００から受信した音声に対する音声認識を行い、認識結果に基づく応答として、車両ＭＡの後部座席の窓を閉めるコマンド等を生成し、生成したコマンドをサーバ側通信部２１０からエージェント機能部１５０Ａ−１に送信する。エージェント機能部１５０Ａ−１は、受信したコマンドに従って車両機器５０を制御し、後部座席の窓を閉める制御を実行する。これにより、ユーザＵ１は、特定した車両に適切な指示を行うことができる。

[処理フロー]
図８は、第１実施形態に係るエージェントシステム１により実行される処理の流れの一例を示すフローチャートである。なお、以下では、ユーザＵ１が、同一種類のエージェント機能を備える複数のエージェント装置１００Ａ、１００Ｂがそれぞれ搭載された二台の車両ＭＡ、ＭＢと、携帯端末３００を所有しているものとする。また、以下では、主に、車両ＭＡのエージェントからの情報提供を携帯端末３００に行う処理を中心に説明するものとする。また、以下では、既にエージェント設定部１１６により車両ごとに各エージェントのエージェント画像およびエージェント音声が設定されているものとする。また、以下の処理は、所定のタイミングまたは周期で繰り返し実行されるものとする。

図８の例において、まず、エージェント機能部１５０は、ユーザＵ１への応答を行うか否かを判定する（ステップＳ１００）。応答とは、対話中ではなく単に情報提供を行う場合も含む。ユーザＵ１への応答を行うと判定された場合、応答内容生成部２２８は、情報提供の内容に基づいて、エージェント設定情報（エージェント画像、エージェント音声）に対応する出力態様の応答内容を生成する（ステップＳ１０２）。次に、情報提供部２３０は、生成した応答内容をユーザＵ１の携帯端末３００に送信するか否かを判定する（ステップＳ１０４）。例えば、車両ＭＡまたはＭＢにユーザＵ１が乗車していない場合、情報提供部２３０は、応答内容を携帯端末３００に送信すると判定する。

応答内容を携帯端末３００に送信すると判定された場合、情報提供部２３０は、エージェントの属性情報を含む応答内容を生成し（ステップＳ１０６）、生成した応答内容を携帯端末３００に送信する（ステップＳ１０８）。この結果、携帯端末３００からは、エージェントの属性情報を含む応答内容が出力されることになり、どの車両のエージェントからの情報提供であるかをユーザＵ１に判別させ易くすることができる。

また、ステップＳ１０４の処理において、携帯端末３００に送信しないと判定された場合、情報提供部２３０は、応答内容生成部２２８により生成された応答内容を、乗員が乗車している車両に送信する（ステップＳ１１０）。なお、ユーザＵ１への応答が車両ＭＡのエージェントから提供された情報であり、ユーザＵ１が車両ＭＢ（他の車両）に乗車している場合には、他の車両ＭＢの同一種類のエージェントの出力態様で応答内容を出力してもよく、属性情報を含む応答内容を生成し、生成した応答内容を出力してもよい。これにより、本フローチャートの処理は、終了する。また、ステップＳ１００の処理において、ユーザへの応答を行わないと判定された場合、本フローチャートの処理は終了する。

上述した第１実施形態に係るエージェントシステム１によれば、ユーザが複数のエージェント機能が搭載された複数の車両を所有する場合に、エージェントからの情報提供に、エージェントの属性情報を付与させることで、どの車両に搭載されたエージェントであるかをユーザに区別させ易くすることができる。また、第１実施形態に係るエージェントシステム１によれば、携帯端末３００にエージェント機能が搭載されていない場合であっても車両側のエージェントと連携させた対話を実現することができる。

＜第２実施形態＞
次に、第２実施形態に係るエージェントシステムについて説明する。例えば、物体に搭載されるエージェントによっては、エージェント提供者ごとに決められた制約や権限等により、エージェント画像やエージェントの音声が変更できない場合がある。この状況において、携帯端末３００への情報提供を行う場合、複数の物体に搭載される同一種類のエージェントの出力態様が同じになるため、どの物体のエージェントであるかが区別しきれない場合があり得る。したがって、第２実施形態では、エージェント画像やエージェント音声が車両ごとに区別可能に設定されていないエージェントからの情報を提供する場合に、その物体に搭載された他のエージェントであって、エージェント画像やエージェント音声が設定されているエージェント（代理応答エージェント）が代わりに情報提供を行う。なお、第２実施形態のエージェントシステムは、第１実施形態のエージェントシステム１と比較して、エージェントサーバの構成のみが異なる。したがって、以下では、主にエージェントサーバの機能を中心に説明する。また、以下の説明において、第１実施形態の構成と同様の構成については、同一の名称および符号を付するものとし、具体的な説明は省略するものとする。

図９は、第２実施形態に係るエージェントサーバの構成の一例を示す図である。図９の例では、一例として車両ＭＡに搭載された複数の異なるエージェント１〜３に対応付けられたエージェント機能部１５０Ａ−１〜１５０Ａ−３およびエージェントサーバ２００＃−１〜２００＃−３を示すものとする。エージェントサーバ２００＃−１〜２００＃−３は、それぞれが実行可能な機能やデータベース等で相違はあるものの、大まかな処理は同様であるため、以下ではエージェントサーバ２００＃−１を用いて説明するものとする。

エージェントサーバ２００＃−１は、例えば、第１実施形態に係るエージェントサーバ２００と比較して、情報提供部２３０に代えて情報提供部２３０＃を備える点で相違する。したがって、以下では、主に情報提供部２３０＃を中心として説明する。情報提供部２３０＃は、情報提供部２３０と同様の機能を備えるのに加え、応答内容を携帯端末３００に出力する場合であって、且つ、エージェント管理情報２６０に、車両ごとのエージェント設定情報がない場合に、同一車両に搭載された他のエージェントであって、且つ、車両ごとのエージェント設定情報が存在するエージェントに、応答内容を代理出力させる。

具体的には、エージェントサーバ２００＃−１の情報提供部２３０＃は、応答内容を携帯端末３００に出力する場合であって、且つ、エージェント管理情報２６０に、車両ごとのエージェント設定情報がない場合に、他のエージェントサーバ（例えば、エージェントサーバ２００＃−２、２００＃−３）にユーザＩＤおよび車両ＩＤを送信して代理応答の可否に関する問い合わせを行う。

他のエージェントサーバ２００＃−２、２００＃−３の情報提供部２３０＃は、受信したユーザＩＤおよび車両ＩＤを用いて、自己のエージェント管理情報２６０を参照し、合致するエージェント管理情報が存在する場合に、代理応答が可能であると判定し、合致するエージェント管理情報が存在しない場合に、代理応答が不可能であると判定する。なお、代理応答の可否判定については、上述の例に代えて（または加えて）、ユーザが予め設定した可否フラグに基づいて可否判定を行ってもよく、携帯端末３００に送信できるか否かに基づいて可否判定を行ってもよく、その他の条件により可否判定を行ってもよい。他のエージェントサーバ２００＃−２、２００＃−３の情報提供部２３０＃は、問い合わせ結果をエージェントサーバ２００＃−１に送信する。

エージェントサーバ２００＃−１の情報提供部２３０＃は、他のエージェントサーバ２００＃−２、２００＃−３のうち、代理応答の許可があったエージェントサーバに応答内容を送信し、送信先のエージェントサーバに対応付けられたエージェントに携帯端末３００への応答内容の出力を実行させる。なお、複数のエージェントサーバから応答許可があった場合、情報提供部２３０＃は、最初に応答許可を送信したエージェントサーバまたは予め決められた優先度の高いエージェントサーバに応答内容を送信する。なお、情報提供部２３０＃は、他のエージェントサーバに上述の問い合わせを行わずに、強制的に特定のエージェントサーバに応答内容を送信して代理出力させてもよい。

エージェントサーバ２００＃−１から応答内容を受信したエージェントサーバの情報提供部２３０＃は、応答内容にエージェントの属性情報やエージェント種別等を付与した応答内容を自己のエージェントの出力態様で携帯端末３００に出力させる。

図１０は、第２実施形態において、携帯端末３００から出力される情報の一例を示す図である。図１０には、携帯端末３００の端末側表示・操作装置３３０の表示部に表示される画像ＩＭ３の一例が示されている。また、図１０の例では、エージェント３のエージェントサーバ２００＃−３により生成された応答内容をエージェントサーバ２００＃−１に対応付けられたエージェント１が提供する場面を示している。画像ＩＭ３には、例えば、文字情報表示領域Ａ３１と、エージェント表示領域Ａ３２とが含まれる。文字情報表示領域Ａ３１には、現在対話中のエージェントに関する情報が表示される。図１０の例において、文字情報表示領域Ａ３１には、「「ＡＡＡ」のエージェント１が対話中」という文字情報が表示されている。

エージェント表示領域Ａ３２には、例えば、対話中のエージェント画像や応答結果（提供される情報）が表示される。図１０の例において、エージェント表示領域Ａ３２には、応答内容をエージェント３に代わってユーザＵ１に通知しているエージェント１に対応するエージェント画像ＥＩ１と、エージェント３が生成した応答結果として「本日１５：００ ○○に出かける。」という文字情報とが表示されている。なお、この場面において出力される応答結果には、属性情報を含む自己のエージェントに関する情報と、応答内容を生成したエージェントに関する情報と、エージェントが生成した応答内容とが含まれる。図１０の例において、エージェント表示領域Ａ３２には、応答結果の音声情報として、「「ＡＡＡ」のエージェント１です。」および「エージェント３より本日１５時から○○に出かける予定についての連絡が入っています。」という音声が出力されている。

なお、第２実施形態において、代理応答エージェントは、所定エージェントのみが行うことができるように設定されていてもよい。この場合、所定のエージェントとは、例えば、エージェントの出力態様を設定可能なエージェントである。また、所定のエージェントには、車両Ｍの制御が可能なエージェント（ここでは、エージェント１）が含まれる。また、エージェント１は、例えば、他のエージェントよりも代理応答を行う優先度が高くされたり、強制的に代理応答を行う特定のエージェントに選択される。車両Ｍとの関連性が高いエージェント１に代理応答させることで、どの車両から提供された情報であるかをユーザに判別させ易くすることができる。

[処理フロー]
以下、第２実施形態に係るエージェントシステムにより実行される処理の流れについて説明する。なお、第２実施形態に係るエージェントシステムにより実行される処理は、例えば、エージェントサーバ２００＃の情報提供部２３０＃が他のエージェントサーバに代理応答させる処理と、他のエージェントサーバから受信した応答内容に基づいて、自己のエージェントが代理応答する処理とに大別されるため、それぞれを分けて説明する。

図１１は、エージェントサーバ２００＃が他のエージェントサーバに代理応答させる処理の流れの一例を示すフローチャートである。図１１にフローチャートは、上述した図８に示す第１実施形態におけるフローチャートと比較して、ステップＳ１２０〜Ｓ１２８の処理が追加されている点で相違する。したがって、以下では、主にステップＳ１２０〜Ｓ１２８の処理を中心に説明する。ステップＳ１００の処理において、ユーザへの情報提供を行うと判定された場合、情報提供部２３０＃は、エージェント管理情報２６０にユーザＩＤおよび車両ＩＤに対応するエージェント設定情報が存在するか否かを判定する（ステップＳ１２０）。エージェント設定情報が存在すると判定された場合、ステップＳ１０２〜Ｓ１１０の処理を実行する。

また、エージェント設定情報が存在しないと判定された場合、応答内容生成部２２８は、応答内容を生成する（ステップＳ１２２）。次に、情報提供部２３０＃は、同一車両に搭載された他のエージェント（より具体的には、他のエージェントサーバ）に代理応答の可否を問い合わせる（ステップＳ１２４）。次に、情報提供部２３０＃は、ステップＳ１２４に対する問い合わせ結果から代理応答エージェントが存在するか否かを判定する（ステップＳ１２６）。代理応答エージェントが存在しない場合、ステップＳ１０４〜Ｓ１１０の処理を実行する。また、代理応答エージェントが存在する場合、情報提供部２３０＃は、代理応答エージェントに応答内容を送信する（ステップＳ１２８）。

図１２は、他のエージェントサーバから受信した応答内容に基づいて、自己のエージェントが代理応答する処理の流れの一例を示すフローチャートである。図１２の例において、情報提供部２３０＃は、他のエージェントサーバから代理応答の可否の問い合わせを受け付けたか否かを判定する（ステップＳ２００）。代理応答の可否の問い合わせを受け付けた場合、情報提供部２３０＃は、問い合わせ情報として取得したユーザＩＤおよび車両ＩＤとに基づいて、エージェント管理情報２６０を参照し、ユーザＩＤおよび車両ＩＤに対応するエージェント設定情報が存在するか否かを判定する（ステップＳ２０２）。

エージェント設定情報が存在する場合、情報提供部２３０＃は、代理応答が可能であると判断し、代理応答が可能であることを問い合わせのあったエージェントサーバに通知する（ステップＳ２０４）。次に、情報提供部２３０＃は、代理応答が可能であることを通知したエージェントサーバから応答内容を受信したか否かを判定する（ステップＳ２０６）。応答内容を受信したと判定された場合、情報提供部２３０＃は、受信した応答内容をユーザＵ１の携帯端末３００に送信するか否かを判定する（ステップＳ２０８）。応答内容を携帯端末３００に送信すると判定された場合、情報提供部２３０＃は、エージェントの属性情報および応答内容を生成したエージェント種別を含む応答内容を生成し（ステップＳ２１０）、生成した応答内容を携帯端末３００に送信する（ステップＳ２１２）。この結果、携帯端末３００により出力される提供情報には、エージェントの属性情報やエージェント種別も含まれることになり、車両およびエージェントをユーザＵ１に判別させ易くすることができる。

また、ステップＳ２０８の処理において、携帯端末３００に送信しないと判定された場合、情報提供部２３０＃は、応答内容生成部２２８により生成された応答内容を、乗員が乗車している車両に送信する（ステップＳ２１４）。また、ステップＳ０２の処理において、エージェント設定情報が存在しないと判定された場合、情報提供部２３０＃は、代理応答が不可能であることを問い合わせのあったエージェントサーバに通知する（ステップＳ２１６）。これにより、本フローチャートの処理は、終了する。また、ステップＳ２００の処理において、代理応答の可否の問い合わせを受け付けていないと判定された場合、またはステップＳ２０６の処理において、応答内容を受信していないと判定された場合、本フローチャートの処理は終了する。

上述した第２実施形態に係るエージェントシステムによれば、第１実施形態におけるエージェントシステムと同様の効果を奏する他、ユーザが所有する複数の車両に搭載されたエージェントに対する出力態様の設定状況に応じて、同一車両の他のエージェントに代理応答させることで、ユーザに、どの車両に搭載されたどのエージェントからの情報であるかを区別させ易くすることができる。

上述した第１実施形態および第２実施形態のそれぞれは、他の実施形態の一部または全部を組み合わせてもよい。また、エージェント装置１００の機能のうち一部または全部は、エージェントサーバ２００（２００＃）に含まれていてもよい。また、エージェントサーバ２００（２００＃）の機能のうち一部または全部は、エージェント装置１００に含まれていてもよい。つまり、エージェント装置１００およびエージェントサーバ２００（２００＃）における機能の切り分けは、各装置の構成要素、エージェントサーバ２００（２００＃）やエージェントシステムの規模等によって適宜変更されてよい。また、エージェント装置１００およびエージェントサーバ２００（２００＃）における機能の切り分けは、車両Ｍごとに設定されてもよい。

また、第１実施形態および第２実施形態における物体の一例として車両を用いて説明したが、車両に代えて（または加えて）、例えば、自宅や会社等の特定の地点に設置された端末装置や、車両以外の出力部を備えた移動体（例えば、船舶、飛行機、ドローン、自動二輪車）であってもよい。また、上述の実施形態の携帯端末３００は、エージェント機能を搭載していない携帯端末として説明したが、これに限定されるものではなく、携帯端末３００に一以上のエージェント機能が搭載されていてもよい。この場合、携帯端末３００には、上述したエージェント機能部１５０と同様の機能が搭載され、エージェントサーバ２００等を介して、上述したエージェントと同様の機能が実現される。

以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。

１…エージェントシステム、１０…マイク、２０…表示・操作装置、３０…スピーカユニット、４０…ナビゲーション装置、５０…車両機器、６０…車載通信装置、７０…汎用通信装置、８０…乗員認識装置、１００…エージェント装置、１１０…管理部、１１２…音響処理部、１１４…エージェントごとＷＵ判定部、１１６…エージェント設定部、１２０…出力制御部、１２２、３６２…表示制御部、１２４、３６４…音声制御部、１５０…エージェント機能部、１６０…ペアリングアプリ実行部、１７０、２５０…記憶部、２００…エージェントサーバ、２１０…サーバ側通信部、２２０…音声認識部、２２２…自然言語処理部、２２４…対話管理部、２２６…ネットワーク検索部、２２８…応答内容生成部、２３０、２３０＃…情報提供部、３００…携帯端末、３１０…端末側通信部、３２０…端末側マイク、３３０…端末側表示・操作装置、３４０…端末側スピーカ、３５０…端末側音響処理部、３６０…端末側出力制御部、４００…各種ウェブサーバ

Claims

異なる複数の物体に搭載され、それぞれがユーザの発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部と、
前記複数のエージェント機能部のうち、前記複数の物体に同一種類のエージェント機能部が存在する場合に、前記同一種類のエージェント機能部のそれぞれに対応付けられた属性情報を前記同一種類のエージェント機能部による応答内容に含めて、前記ユーザの可搬型の携帯端末に提供する情報提供部と、
を備えるエージェントシステム。
前記複数の物体は、前記ユーザに対応付けられた車両を含む、
請求項１に記載のエージェントシステム。
前記属性情報は、前記車両に関する情報を含む、
請求項２に記載のエージェントシステム。
前記複数のエージェント機能部のうち、所定のエージェント機能部における前記応答の出力態様を設定する設定部を更に備える、
請求項２または３に記載のエージェントシステム。
前記所定のエージェント機能部は、前記車両の制御が可能なエージェント機能部である、
請求項４に記載のエージェントシステム。
前記所定のエージェント機能部は、前記複数のエージェント機能部に含まれる他のエージェント機能部の応答内容を取得する、
請求項４または５に記載のエージェントシステム。
前記所定のエージェント機能部は、他のエージェント機能部から取得した応答内容を、前記他のエージェント機能部に代理して前記携帯端末に出力させる、
請求項４から６のうち何れか１項に記載のエージェントシステム。
ユーザの発話に応じて、音声による応答を含むサービスを提供するエージェント機能部と、
前記エージェント機能部が、前記ユーザに対応付けられた複数の物体に搭載され、前記複数の物体のそれぞれに搭載されたエージェント機能部が同一種類のエージェント機能部である場合に、前記同一種類のエージェント機能部のそれぞれに対応付けられた属性情報を前記同一種類のエージェント機能部による応答内容に含めて、前記ユーザの可搬型の携帯端末に提供する情報提供部と、
を備えるエージェントサーバ。
コンピュータが、
エージェント機能部を起動させ、
前記起動したエージェント機能部の機能として、ユーザの発話に応じて、応答を含むサービスを提供し、
前記エージェント機能部が、前記ユーザに対応付けられた複数の物体に搭載され、前記複数の物体のそれぞれに搭載されたエージェント機能部が同一種類のエージェント機能部である場合に、前記同一種類のエージェント機能部のそれぞれに対応付けられた属性情報を前記同一種類のエージェント機能部による応答内容に含めて、前記ユーザの可搬型の携帯端末に提供する、
エージェントサーバの制御方法。
コンピュータが、
エージェント機能部を起動させ、
前記起動させたエージェント機能部の機能として、ユーザの発話に応じて、応答を含むサービスを提供させ、
前記エージェント機能部が、前記ユーザに対応付けられた複数の物体に搭載され、前記複数の物体のそれぞれに搭載されたエージェント機能部が同一種類のエージェント機能部である場合に、前記同一種類のエージェント機能部のそれぞれに対応付けられた属性情報を前記同一種類のエージェント機能部による応答内容に含めて、前記ユーザの可搬型の携帯端末に提供させる、
プログラム。