JP2020142758A - エージェント装置、エージェント装置の制御方法、およびプログラム - Google Patents

エージェント装置、エージェント装置の制御方法、およびプログラム Download PDF

Info

Publication number
JP2020142758A
JP2020142758A JP2019042903A JP2019042903A JP2020142758A JP 2020142758 A JP2020142758 A JP 2020142758A JP 2019042903 A JP2019042903 A JP 2019042903A JP 2019042903 A JP2019042903 A JP 2019042903A JP 2020142758 A JP2020142758 A JP 2020142758A
Authority
JP
Japan
Prior art keywords
agent
communication
control unit
unit
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019042903A
Other languages
English (en)
Inventor
善史 我妻
Yoshifumi Wagatsuma
善史 我妻
賢吾 内木
Kengo Uchiki
賢吾 内木
裕貴 中山
Yuki Nakayama
裕貴 中山
佐和子 古屋
Sawako Furuya
佐和子 古屋
俊克 倉持
Toshikatsu Kuramochi
俊克 倉持
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2019042903A priority Critical patent/JP2020142758A/ja
Publication of JP2020142758A publication Critical patent/JP2020142758A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】利用者に、より安心してエージェント機能を利用させることができるエージェント装置、エージェント装置の制御方法、およびプログラムを提供すること。【解決手段】実施形態のエージェント装置は、利用者の発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部と、前記複数のエージェント機能部を、ネットワークに接続可能にする通信制御部と、前記複数のエージェント機能部の起動状態を制御する制御部と、を備え、前記起動制御部は、前記通信制御部による通信状態に基づいて、前記複数のエージェント機能部のうち、前記利用者が利用可能なエージェント機能部を決定する。【選択図】図2

Description

本発明は、エージェント装置、エージェント装置の制御方法、およびプログラムに関する。
従来、車両の乗員と対話を行いながら、乗員の要求に応じた運転支援に関する情報や車両の制御、その他のアプリケーション等を提供するエージェント機能に関する技術が開示されている(例えば、特許文献1参照)。
特開2006−335231号公報
エージェント機能による情報は、少なくとも一部が無線通信によって車両とネットワークとの間で送受信される。しかしながら、複数のエージェント機能を同時に使用する場合には通信量が多くなるため、通信状態によっては必要な機能が実行されない場合があり、ユーザが安心してエージェント機能を利用することができない場合があった。
本発明は、このような事情を考慮してなされたものであり、利用者に、より安心してエージェント機能を利用させることができるエージェント装置、エージェント装置の制御方法、およびプログラムを提供することを目的の一つとする。
この発明に係るエージェント装置、エージェント装置の制御方法、およびプログラムは、以下の構成を採用した。
(1):この発明の一態様に係るエージェント装置は、利用者の発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部と、前記複数のエージェント機能部を、ネットワークに接続可能にする通信制御部と、前記複数のエージェント機能部の起動状態を制御する起動制御部と、を備え、前記起動制御部は、前記通信制御部による通信状態に基づいて、前記複数のエージェント機能部のうち、前記利用者が利用可能なエージェント機能部を決定する、エージェント装置である。
(2):上記(1)の態様において、前記通信制御部は、第1の通信モードまたは、前記第1の通信モードよりも通信条件の悪い第2の通信モードを含む通信モードにより前記ネットワークに接続可能にし、前記起動制御部は、前記通信制御部により前記第1の通信モードから前記第2の通信モードに切り替わる場合に、前記第1の通信モードで前記利用者が利用可能な複数のエージェント機能部のうち、少なくとも一つのエージェント機能部の利用を抑制するものである。
(3):上記(1)または(2)の態様において、前記通信制御部は、前記利用者が搭乗する移動体に搭載された通信部を制御するものである。
(4):上記(1)〜(3)のうち何れか一つの態様において、前記複数のエージェント機能部には、前記利用者が搭乗する移動体を制御するエージェント機能部が含まれるものである。
(5):上記(4)の態様において、前記起動制御部は、前記通信制御部により第1の通信モードから前記第1の通信モードよりも通信条件の悪い第2の通信モードに通信が切り替わる場合に、前記移動体を制御するエージェント機能部の利用を抑制しないものである。
(6):本発明の他の態様に係るエージェント装置の制御方法は、エージェント装置が、利用者の発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部を起動させ、前記複数のエージェント機能部を通信制御部によりネットワークに接続可能にし、前記複数のエージェント機能部の起動状態を制御し、前記通信制御部による通信状態に基づいて、前記複数のエージェント機能部のうち、前記利用者が利用可能なエージェント機能部を決定する、エージェント装置の制御方法である。
(7):本発明の他の態様に係るプログラムは、エージェント装置に、利用者の発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部を起動させ、前記複数のエージェント機能部を通信制御部によりネットワークに接続可能にさせ、前記複数のエージェント機能部の起動状態を制御させ、前記通信制御部による通信状態に基づいて、前記複数のエージェント機能部のうち、前記利用者が利用可能なエージェント機能部を決定させる、プログラムである。
上記(1)〜(7)の態様によれば、利用者に、より安心してエージェント機能を利用させることができる。
エージェント装置100を含むエージェントシステム1の構成図である。 実施形態に係るエージェント装置100の構成と、車両Mに搭載された機器とを示す図である。 表示・操作装置20の配置例を示す図である。 スピーカユニット30の配置例を示す図である。 実施形態に係るエージェントサーバ200の構成と、エージェント装置100の構成の一部とを示す図である。 通信モードデータ172の内容の一例を示す図である。 通信制限情報を含む通信モードデータ172Aの内容の一例を示す図である。 モード別エージェント情報174の内容の一例を示す図である。 機能DB178の内容の一例を示す図である。 利用可能なエージェントを乗員に設定させる場面について説明するための図である。 抑制する機能を乗員に設定させる場面について説明するための図である。 通信モードAで通信を行う場面において乗員に提供される内容を説明するための図である。 通信モードBで通信を行う場面において乗員に提供される内容を説明するための図である。 エージェント装置100により実行される処理の流れの一例を示すフローチャートである。 他の通信モードに切り替えが行われた場合に、起動制御部118により実行される処理の流れの一例を示す図である。
以下、図面を参照し、本発明のエージェント装置、エージェント装置の制御方法、およびプログラムの実施形態について説明する。エージェント装置は、エージェントシステムの一部または全部を実現する装置である。以下では、エージェント装置の一例として、乗員(利用者の一例)が搭乗する車両(以下、車両M)に搭載され、複数種類のエージェント機能を備えたエージェント装置について説明する。車両Mは、「移動体」の一例である。本発明の適用上、必ずしもエージェント装置が複数種類のエージェント機能を有している必要はなく、またエージェント装置は、スマートフォン等の可搬型端末装置であってもよいが、以下の説明では、車両に搭載された複数種類のエージェント機能を備えたエージェント装置を前提とする。エージェント機能とは、例えば、車両Mの乗員と対話をしながら、乗員の発話の中に含まれる要求(コマンド)に基づく各種の情報提供や各種機器制御を行ったり、ネットワークサービスを仲介したりする機能である。複数種類のエージェントは、それぞれに果たす機能、処理手順、制御、出力態様・内容がそれぞれ異なってもよい。また、エージェント機能の中には、車両内の機器(例えば運転制御や車体制御に関わる機器)の制御等を行う機能を有するものがあってよい。
エージェント機能は、例えば、乗員の音声を認識する音声認識機能(音声をテキスト化する機能)に加え、自然言語処理機能(テキストの構造や意味を理解する機能)、対話管理機能、ネットワークを介して他装置を検索し、或いは自装置が保有する所定のデータベースを検索するネットワーク検索機能等を統合的に利用して実現される。これらの機能の一部または全部は、AI(Artificial Intelligence)技術によって実現されてよい。また、これらの機能を行うための構成の一部(特に、音声認識機能や自然言語処理解釈機能)は、車両Mの車載通信装置または車両Mに持ち込まれた汎用通信装置と通信可能なエージェントサーバ(外部装置)に搭載されてもよい。以下の説明では、構成の一部がエージェントサーバに搭載されており、エージェント装置とエージェントサーバが協働してエージェントシステムを実現することを前提とする。また、エージェント装置とエージェントサーバが協働して仮想的に出現させるサービス提供主体(サービス・エンティティ)をエージェントと称する。
<全体構成>
図1は、エージェント装置100を含むエージェントシステム1の構成図である。エージェントシステム1は、例えば、エージェント装置100と、複数のエージェントサーバ200−1、200−2、200−3、…とを備える。符号の末尾のハイフン以下数字は、エージェントを区別するための識別子であるものとする。何れのエージェントサーバであるかを区別しない場合、単にエージェントサーバ200と称する場合がある。図1では3つのエージェントサーバ200を示しているが、エージェントサーバ200の数は2つであってもよいし、4つ以上であってもよい。それぞれのエージェントサーバ200は、互いに異なるエージェントシステムの提供者が運営するものである。したがって、本実施形態におけるエージェントは、互いに異なる提供者により実現されるエージェントである。提供者としては、例えば、自動車メーカー、ネットワークサービス事業者、電子商取引事業者、携帯端末の販売者や製造者等が挙げられ、任意の主体(法人、団体、個人等)がエージェントシステムの提供者となり得る。
エージェント装置100は、ネットワークNWを介してエージェントサーバ200と通信する。ネットワークNWは、例えば、インターネット、セルラー網、Wi−Fi網、WAN(Wide Area Network)、LAN(Local Area Network)、公衆回線、電話回線、無線基地局等のうち一部または全部を含む。ネットワークNWには、各種ウェブサーバ300が接続されており、エージェントサーバ200またはエージェント装置100は、ネットワークNWを介して各種ウェブサーバ300からウェブページを取得することができる。
エージェント装置100は、車両Mの乗員と対話を行い、乗員からの音声をエージェントサーバ200に送信し、エージェントサーバ200から得られた回答を、音声出力や画像表示の形で乗員に提示する。
[車両]
図2は、実施形態に係るエージェント装置100の構成と、車両Mに搭載された機器とを示す図である。車両Mには、例えば、一以上のマイク10と、表示・操作装置20と、スピーカユニット30と、ナビゲーション装置40と、車両機器50と、車載通信装置60と、乗員認識装置80と、エージェント装置100とが搭載される。車載通信装置60は、「通信部」の一例である。また、スマートフォン等の汎用通信装置70が車室内に持ち込まれ、通信装置として使用される場合がある。これらの装置は、CAN(Controller Area Network)通信線等の多重通信線やシリアル通信線、無線通信網等によって互いに接続される。なお、図2に示す構成はあくまで一例であり、構成の一部が省略されてもよいし、更に別の構成が追加されてもよい。表示・操作装置20とスピーカユニット30のうち少なくとも一方は、「出力部」の一例である。
マイク10は、車室内で発せられた音を収集する収音部である。表示・操作装置20は、画像を表示するとともに、入力操作を受付可能な装置(或いは装置群)である。表示・操作装置20は、例えば、タッチパネルとして構成されたディスプレイ装置を含む。表示・操作装置20は、更に、HUD(Head Up Display)や機械式の入力装置を含んでもよい。スピーカユニット30は、例えば、車室内の互いに異なる位置に配設された複数のスピーカ(音出力部)を含む。表示・操作装置20は、エージェント装置100とナビゲーション装置40とで共用されてもよい。これらの詳細については後述する。
ナビゲーション装置40は、ナビHMI(Human Machine Interface)と、GPS(Global Positioning System)等の位置測位装置と、地図情報を記憶した記憶装置と、経路探索等を行う制御装置(ナビゲーションコントローラ)とを備える。マイク10、表示・操作装置20、およびスピーカユニット30のうち一部または全部がナビHMIとして用いられてもよい。ナビゲーション装置40は、位置測位装置によって特定された車両Mの位置から、乗員によって入力された目的地まで移動するための経路(ナビ経路)を探索し、経路に沿って車両Mが走行できるように、ナビHMIを用いて案内情報を出力する。経路探索機能は、ネットワークNWを介してアクセス可能なナビゲーションサーバにあってもよい。この場合、ナビゲーション装置40は、ナビゲーションサーバから経路を取得して案内情報を出力する。なお、エージェント装置100は、ナビゲーションコントローラを基盤として構築されてもよく、その場合、ナビゲーションコントローラとエージェント装置100は、ハードウェア上は一体に構成される。
車両機器50は、例えば、エンジンや走行用モータ等の駆動力出力装置、エンジンの始動モータ、ドアロック装置、ドア開閉装置、窓、窓の開閉装置および窓の開閉制御装置、シート、シート位置の制御装置、ルームミラーおよびその角度位置制御装置、車両内外の照明装置およびその制御装置、ワイパーやデフォッガーおよびそれぞれの制御装置、方向指示灯およびその制御装置、空調装置、走行距離やタイヤの空気圧の情報や燃料の残量情報等の車両情報装置等を含む。
車載通信装置60は、例えば、セルラー網やWi−Fi網を利用してネットワークNWにアクセス可能な無線通信装置である。
乗員認識装置80は、例えば、着座センサ、車室内カメラ、画像認識装置等を含む。着座センサは、座席の下部に設けられた圧力センサ、シートベルトに取り付けられた張力センサ等を含む。車室内カメラは、車室内に設けられたCCD(Charge Coupled Device)カメラやCMOS(Complementary Metal Oxide Semiconductor)カメラである。画像認識装置は、車室内カメラの画像を解析し、座席ごとの乗員の有無、顔向き等を認識する。
図3は、表示・操作装置20の配置例を示す図である。表示・操作装置20は、例えば、第1ディスプレイ22と、第2ディスプレイ24と、操作スイッチASSY26とを含む。表示・操作装置20は、更に、HUD28を含んでもよい。また、表示・操作装置20は、更に、インストルメントパネルのうち運転席DSに対面する部分に設けられるメーターディスプレイ29を含んでもよい。第1ディスプレイ22と、第2ディスプレイ24と、HUD28と、メーターディスプレイ29とを合わせたものは、「表示部」の一例である。
車両Mには、例えば、ステアリングホイールSWが設けられた運転席DSと、運転席DSに対して車幅方向(図中Y方向)に設けられた助手席ASとが存在する。第1ディスプレイ22は、インストルメントパネルにおける運転席DSと助手席ASとの中間辺りから、助手席ASの左端部に対向する位置まで延在する横長形状のディスプレイ装置である。第2ディスプレイ24は、運転席DSと助手席ASとの車幅方向に関する中間あたり、且つ第1ディスプレイの下方に設置されている。例えば、第1ディスプレイ22と第2ディスプレイ24は、共にタッチパネルとして構成され、表示部としてLCD(Liquid Crystal Display)や有機EL(Electroluminescence)、プラズマディスプレイ等を備えるものである。操作スイッチASSY26は、ダイヤルスイッチやボタン式スイッチ等が集積されたものである。HUD28は、例えば、風景に重畳させて画像を視認させる装置であり、一例として、車両Mのフロントウインドシールドやコンバイナーに画像を含む光を投光することで、乗員に虚像を視認させる。メーターディスプレイ29は、例えば、LCDや有機EL等であり、速度計や回転速度計等の計器類を表示する。表示・操作装置20は、乗員によってなされた操作の内容をエージェント装置100に出力する。上述した各表示部が表示する内容は、エージェント装置100によって決定されてよい。
図4は、スピーカユニット30の配置例を示す図である。スピーカユニット30は、例えば、スピーカ30A〜30Hを含む。スピーカ30Aは、運転席DS側の窓柱(いわゆるAピラー)に設置されている。スピーカ30Bは、運転席DSに近いドアの下部に設置されている。スピーカ30Cは、助手席AS側の窓柱に設置されている。スピーカ30Dは、助手席ASに近いドアの下部に設置されている。スピーカ30Eは、右側後部座席BS1側に近いドアの下部に設置されている。スピーカ30Fは、左側後部座席BS2側に近いドアの下部に設置されている。スピーカ30Gは、第2ディスプレイ24の近傍に設置されている。スピーカ30Hは、車室の天井(ルーフ)に設置されている。
係る配置において、例えば、専らスピーカ30Aおよび30Bに音を出力させた場合、音像は運転席DS付近に定位することになる。「音像が定位する」とは、例えば、乗員の左右の耳に伝達される音の大きさを調節することにより、乗員が感じる音源の空間的な位置を定めることである。また、専らスピーカ30Cおよび30Dに音を出力させた場合、音像は助手席AS付近に定位することになる。また、専らスピーカ30Eに音を出力させた場合、音像は車室の前方付近に定位することになり、専らスピーカ30Fに音を出力させた場合、音像は車室の上方付近に定位することになる。また、専らスピーカ30Gに音を出力させた場合、音像は車室の前方付近に定位することになり、専らスピーカ30Hに音を出力させた場合、音像は車室の上方付近に定位することになる。これに限らず、スピーカユニット30は、ミキサーやアンプを用いて各スピーカの出力する音の配分を調整することで、車室内の任意の位置に音像を定位させることができる。
[エージェント装置]
図2に戻り、エージェント装置100は、管理部110と、エージェント機能部150−1、150−2、150−3と、ペアリングアプリ実行部160と、記憶部170とを備える。管理部110は、例えば、音響処理部112と、エージェントごとWU(Wake Up)判定部114と、通信制御部116と、起動制御部118と、出力制御部120と備える。以下、何れのエージェント機能部であるか区別しない場合、単にエージェント機能部150と称する。3つのエージェント機能部150を示しているのは、図1におけるエージェントサーバ200の数に対応させた一例に過ぎず、エージェント機能部150の数は、2つであってもよいし、4つ以上であってもよい。図2に示すソフトウェア配置は説明のために簡易に示しており、実際には、例えば、エージェント機能部150と車載通信装置60の間に管理部110が介在してもよいように、任意に改変することができる。また、以下では、エージェント機能部150−1とエージェントサーバ200−1が協働して出現させるエージェントを「エージェント1」、エージェント機能部150−2とエージェントサーバ200−2が協働して出現させるエージェントを「エージェント2」、エージェント機能部150−3とエージェントサーバ200−3が協働して出現させるエージェントを「エージェント3」と称する場合がある。
エージェント装置100の各構成要素は、例えば、CPU(Central Processing Unit)等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDD(Hard Disk Drive)やフラッシュメモリ等の記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD−ROM等の着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。
記憶部170は、上記の各種記憶装置により実現される。記憶部170には、例えば、通信モードデータ172、モード別エージェント情報174、機能DB176等のデータやプログラムが格納される。なお、通信モードデータ172、モード別エージェント情報174、および機能DB176は、外部の記憶部に記憶されてもよい。通信モードデータ172、モード別エージェント情報174、および機能DB176の詳細については後述する。
管理部110は、OS(Operating System)やミドルウェア等のプログラムが実行されることで機能する。
管理部110の音響処理部112は、マイク10から収集される音を受け付け、受け付けた音に対して、エージェントごとに予め設定されているウエイクアップワードを認識するのに適した状態になるように音響処理を行う。ウエイクアップワードとは、例えば、対象のエージェントを起動させるためのワード(単語)やフレーズ等である。ウエイクアップワードは、単体のエージェントを起動させるものでもよく、複数のエージェントを起動させるものでもよい。音響処理とは、例えば、バンドパスフィルタ等のフィルタリングによるノイズ除去や音の増幅等である。また、音響処理部112は、音響処理された音声を、エージェントごとWU判定部114や起動中のエージェント機能部に出力する。
エージェントごとWU判定部114は、エージェント機能部150−1、150−2、150−3のそれぞれに対応して存在し、エージェントごとに予め定められているウエイクアップワードを認識する。エージェントごとWU判定部114は、音響処理が行われた音声(音声ストリーム)から音声の意味を認識する。まず、エージェントごとWU判定部114は、音声ストリームにおける音声波形の振幅と零交差に基づいて音声区間を検出する。エージェントごとWU判定部114は、混合ガウス分布モデル(GMM;Gaussian mixture model) に基づくフレーム単位の音声識別および非音声識別に基づく区間検出を行ってもよい。
次に、エージェントごとWU判定部114は、検出した音声区間における音声をテキスト化し、文字情報とする。そして、エージェントごとWU判定部114は、テキスト化した文字情報がウエイクアップワードに該当するか否かを判定する。ウエイクアップワードであると判定した場合、エージェントごとWU判定部114は、ウエイクアップワードに対応するエージェント機能部150を起動させる指示を起動制御部118に出力する。なお、エージェントごとWU判定部114に相当する機能が、エージェントサーバ200に搭載されてもよい。この場合、管理部110は、音響処理部112によって音響処理が行われた音声ストリームをエージェントサーバ200に送信し、エージェントサーバ200がウエイクアップワードであると判定した場合、エージェントサーバ200からの指示に従ってエージェント機能部150が起動する。また、各エージェント機能部150は、常時起動しており且つウエイクアップワードの判定を自ら行うものであってよい。この場合、管理部110がエージェントごとWU判定部114を備える必要はない。
また、エージェントごとWU判定部114は、上述した手順と同様の手順で、発話された音声に含まれる終了ワードを認識した場合であり、且つ、終了ワードに対応するエージェントが起動している状態(以下、必要に応じて「起動中」と称する)である場合、起動中のエージェント機能部を終了(停止)させる指示を起動制御部118に出力する。なお、エージェントの起動および終了は、例えば、表示・操作装置20から所定の操作を受け付けることによって実行されてもよいが、以下では、音声による起動および停止の例を説明する。また、起動中のエージェントは、音声の入力を所定時間以上受け付けなかった場合に停止させてもよい。
通信制御部116は、エージェント機能部150を、ネットワークに接続可能にするための制御を行う。例えば、通信制御部116は、エージェント機能部150がネットワークを介して外部装置(例えば、エージェントサーバ200)と通信を行う場合の通信状態や通信モードの切り替え等を制御する。通信制御部116の機能の詳細については後述する。
起動制御部118は、エージェント機能部150の起動状態を制御する。例えば、エージェントごとWU判定部114による指示(判定結果)に基づいて、エージェント機能部150を起動させたり、停止させる制御を行う。また、起動制御部118は、通信制御部116により制御される通信状態に基づいて、車両Mに搭載された複数のエージェント機能部150のうち、利用者が利用可能なエージェント機能部を決定する。起動制御部118の機能の詳細については後述する。
出力制御部120は、管理部110またはエージェント機能部150からの指示に応じて表示部またはスピーカユニット30に応答結果等の情報を出力させることで、乗員にサービス等の提供を行う。出力制御部120は、例えば、表示制御部122と、音声制御部124とを備える。
表示制御部122は、出力制御部120からの指示に応じて表示部の所定の領域に画像を表示させる。表示制御部122は、出力制御部120の制御により、例えば、車室内で乗員とのコミュニケーションを行う擬人化されたエージェントの画像(以下、エージェント画像と称する)を生成し、生成したエージェント画像を第1ディスプレイ22に表示させる。エージェント画像は、例えば、乗員に対して話しかける態様の画像である。エージェント画像は、例えば、少なくとも観者(乗員)によって表情や顔向きが認識される程度の顔画像を含んでよい。例えば、エージェント画像は、顔領域の中に目や鼻に擬したパーツが表されており、顔領域の中のパーツの位置に基づいて表情や顔向きが認識されるものであってよい。また、エージェント画像は、立体的に感じられ、観者によって三次元空間における頭部画像を含むことでエージェントの顔向きが認識されたり、本体(胴体や手足)の画像を含むことで、エージェントの動作や振る舞い、姿勢等が認識されるものであってもよい。また、エージェント画像は、アニメーション画像であってもよい。例えば、表示制御部122は、乗員認識装置80により認識された乗員の位置に近い表示領域にエージェント画像を表示させたり、乗員の位置に顔を向けたエージェント画像を生成して表示させてもよい。
音声制御部124は、出力制御部120からの指示に応じて、スピーカユニット30に含まれるスピーカのうち一部または全部に音声を出力させる。音声制御部124は、複数のスピーカユニット30を用いて、エージェント画像の表示位置に対応する位置にエージェント音声の音像を定位させる制御を行ってもよい。エージェント画像の表示位置に対応する位置とは、例えば、エージェント画像がエージェント音声を喋っていると乗員が感じると予測される位置であり、具体的には、エージェント画像の表示位置付近(例えば、2〜3[cm]以内)の位置である。
エージェント機能部150は、対応するエージェントサーバ200と協働してエージェントを出現させ、車両の乗員の発話に応じて、音声による応答を含むサービスを提供する。エージェント機能部150には、車両M(例えば、車両機器50)を制御する権限が付与されたものが含まれてよい。また、エージェント機能部150には、ペアリングアプリ実行部160を介して汎用通信装置70と連携し、エージェントサーバ200と通信するものがあってよい。例えば、エージェント機能部150−1には、車両M(例えば、車両機器50)を制御する権限が付与されている。エージェント機能部150−1は、車載通信装置60を介してエージェントサーバ200−1と通信する。エージェント機能部150−2は、車載通信装置60を介してエージェントサーバ200−2と通信する。エージェント機能部150−3は、ペアリングアプリ実行部160を介して汎用通信装置70と連携し、エージェントサーバ200−3と通信する。
これらの複数のエージェント機能部150には、法律や条例、エージェントを提供する事業者同士の契約などに応じて、車載機器を制御する権限が割り振られる。例えば、エージェント機能部150−1には、車両機器50を制御する権限が付与され、エージェント機能部150−2およびエージェント機能部150−3には、車両機器50を制御する権限が付与されていない。すなわち、エージェント機能部150−1は、少なくとも車両機器50の制御を含むサービスをエージェント1として提供し、エージェント機能部150−2およびエージェント機能部150−3は、少なくとも車両機器50の制御を含まないサービスをエージェント2やエージェント3として提供する。
ペアリングアプリ実行部160は、例えば、Bluetooth(登録商標)によって汎用通信装置70とペアリングを行い、エージェント機能部150−3と汎用通信装置70とを接続させる。なお、エージェント機能部150−3は、USB(Universal Serial Bus)等を利用した有線通信によって汎用通信装置70に接続されるようにしてもよい。
エージェント機能部150−1〜150−3は、起動制御部118による起動指示に基づいて起動し、乗員の発話に対して、エージェントサーバ200−1〜200−3等を介して乗員の発話の音声に含まれる要求に対する応答内容を生成し、生成した応答内容を出力制御部120に出力する。また、エージェント機能部150−1〜150−3は、エージェントサーバ200−1〜200−3と通信を行う場合には、通信制御部116により決定された通信モードに基づいて通信を行う。また、エージェント機能部150−1〜150−3は、起動制御部118による制御に基づいて、エージェントを停止させたり、実行可能な複数の機能のうち、少なくとも一部の機能の実行を抑制する。
[エージェントサーバ]
図5は、実施形態に係るエージェントサーバ200の構成と、エージェント装置100の構成の一部とを示す図である。以下、エージェントサーバ200の構成とともに、エージェント機能部150等の動作について説明する。ここでは、エージェント装置100からネットワークNWまでの物理的な通信についての説明を省略する。また、以下では、主にエージェント機能部150−1およびエージェントサーバ200−1を中心として説明するが、他のエージェント機能部やエージェントサーバの組についても、それぞれで実行可能な機能やデータベース等で相違はあるものの、ほぼ同様の流れで処理が実行される。
エージェントサーバ200−1は、通信部210を備える。通信部210は、例えば、NIC(Network Interface Card)等のネットワークインターフェースである。更に、エージェントサーバ200−1は、例えば、音声認識部220と、自然言語処理部222と、対話管理部224と、ネットワーク検索部226と、応答文生成部228と、記憶部250とを備える。これらの構成要素は、例えば、CPU等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPU等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDDやフラッシュメモリ等の記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD−ROM等の着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。音声認識部220と、自然言語処理部222とを合わせたものは、「認識部」の一例である。
記憶部250は、上記の各種記憶装置により実現される。記憶部250には、例えば、辞書DB252、パーソナルプロファイル254、知識ベースDB256、応答規則DB258等のデータやプログラムが格納される。
エージェント装置100において、エージェント機能部150−1は、例えば、音響処理部112等から入力される音声ストリーム、或いは圧縮や符号化等の処理を行った音声ストリームを、エージェントサーバ200−1に送信する。エージェント機能部150−1は、ローカル処理(エージェントサーバ200−1を介さない処理)が可能なコマンド(要求内容)が認識できた場合には、コマンドで要求された処理を実行してもよい。ローカル処理が可能なコマンドとは、例えば、エージェント装置100が備える記憶部170を参照することで応答可能なコマンドである。より具体的には、ローカル処理が可能なコマンドとは、例えば、記憶部170内に存在する電話帳データ(不図示)から特定者の名前を検索し、合致した名前に対応付けられた電話番号に電話をかける(相手を呼び出す)コマンドである。したがって、エージェント機能部150−1は、エージェントサーバ200−1が備える機能の一部を有してもよい。
音声ストリームを取得すると、音声認識部220が音声認識を行ってテキスト化された文字情報を出力し、自然言語処理部222が文字情報に対して辞書DB252を参照しながら意味解釈を行う。辞書DB252は、例えば、文字情報に対して抽象化された意味情報が対応付けられたものである。辞書DB252は、例えば、機能辞書252Aと汎用辞書252Bを含む。機能辞書252Aは、エージェントサーバ200−1がエージェント機能部150−1と協働して実現するエージェント1が提供する機能をカバーするための辞書である。例えば、エージェント1が車載エアコンを制御する機能を提供する場合、機能辞書252Aには、「エアコン」、「空調」、「つける」、「消す」、「温度」、「上げる」、「下げる」、「内気」、「外気」等の単語が、動詞、目的語等の単語種別、および抽象化された意味と対応付けられて登録されている。また、機能辞書252Aには、同時に使用可能であることを示す単語間リンク情報が含まれてよい。汎用辞書252Bは、エージェント1の提供する機能に限らず、一般的な物事の事象を抽象化された意味と対応付けた辞書である。機能辞書252Aと汎用辞書252Bのそれぞれは、同義語や類義語の一覧情報を含んでもよい。機能辞書252Aと汎用辞書252Bとは、複数の言語のそれぞれに対応して用意されてよく、その場合、音声認識部220および自然言語処理部222は、予め設定されている言語設定に応じた機能辞書252Aおよび汎用辞書252B、並びに文法情報(不図示)を使用する。音声認識部220の処理と、自然言語処理部222の処理は、段階が明確に分かれるものではなく、自然言語処理部222の処理結果を受けて音声認識部220が認識結果を修正する等、相互に影響し合って行われてよい。
自然言語処理部222は、音声認識部220による認識結果に基づく意味解析の一つとして、音声に含まれる要求に対応するために必要な機能に関する情報(以下、必要機能と称する)を取得する。例えば、認識結果として、「自宅のエアコンをつけて」の意味が認識された場合、自然言語処理部222は、辞書DB252等を参照し、必要機能として「家庭機器制御」という機能種別を取得する。そして、自然言語処理部222は、取得した必要機能をエージェント機能部150−1に出力し、必要機能に対する実行可否の判定結果を取得する。自然言語処理部222は、必要機能が実行可能である場合に、要求に対応できるものとして、認識された意味に含まれるコマンドを生成する。
例えば、自然言語処理部222は、認識結果として、「今日の天気は」、「天気はどうですか」等の意味が認識された場合に、標準文字情報「今日の天気」に置き換えたコマンドを生成する。これにより、リクエストの音声に文字揺らぎがあった場合にも要求にあった対話をし易くすることができる。また、自然言語処理部222は、例えば、確率を利用した機械学習処理等の人工知能処理を用いて文字情報の意味を認識したり、認識結果に基づくコマンドを生成してもよい。
対話管理部224は、入力されたコマンドに基づいて、パーソナルプロファイル254や知識ベースDB256、応答規則DB258を参照しながら車両Mの乗員に対する応答内容(例えば、乗員への発話内容や出力部から出力する画像、音声)を決定する。パーソナルプロファイル254は、乗員ごとに保存されている乗員の個人情報、趣味嗜好、過去の対話の履歴等を含む。知識ベースDB256は、物事の関係性を規定した情報である。応答規則DB258は、コマンドに対してエージェントが行うべき動作(回答や機器制御の内容等)を規定した情報である。
また、対話管理部224は、音声ストリームから得られる特徴情報を用いて、パーソナルプロファイル254と照合を行うことで、乗員を特定してもよい。この場合、パーソナルプロファイル254には、例えば、音声の特徴情報に、個人情報が対応付けられている。音声の特徴情報とは、例えば、声の高さ、イントネーション、リズム(音の高低のパターン)等の喋り方の特徴や、メル周波数ケプストラム係数(Mel Frequency Cepstrum Coefficients)等による特徴量に関する情報である。音声の特徴情報は、例えば、乗員の初期登録時に所定の単語や文章等を乗員に発声させ、発声させた音声を認識することで得られる情報である。
対話管理部224は、コマンドが、ネットワークNWを介して検索可能な情報を要求するものである場合、ネットワーク検索部226に検索を行わせる。ネットワーク検索部226は、ネットワークNWを介して各種ウェブサーバ300にアクセスし、所望の情報を取得する。「ネットワークNWを介して検索可能な情報」とは、例えば、車両Mの周辺にあるレストランの一般ユーザによる評価結果であったり、その日の車両Mの位置に応じた天気予報であったりする。
応答文生成部228は、対話管理部224により決定された発話の内容が車両Mの乗員に伝わるように、応答文を生成し、生成した応答文(応答内容)をエージェント装置100に送信する。また、応答文生成部228は、乗員認識装置80による認識結果をエージェント装置100から取得し、取得した認識結果によりコマンドを含む発話を行った乗員がパーソナルプロファイル254に登録された乗員であることが特定されている場合に、乗員の名前を呼んだり、乗員の話し方に似せた話し方にした応答文を生成してもよい。
エージェント機能部150は、応答文を取得すると、音声合成を行って音声を出力するように音声制御部124に指示する。また、エージェント機能部150は、音声出力に合わせてエージェント画像を生成し、生成したエージェント画像や応答内容に含まれる画像等を表示するように表示制御部122に指示する。このようにして、仮想的に出現したエージェントが車両Mの乗員に応答するエージェント機能が実現される。
[通信制御部の機能]
以下、通信制御部116の機能の詳細について説明する。通信制御部116は、例えば、通信状態や通信に係る契約その他の規約等の通信態様に基づいて、複数の通信モードのうち、何れかの通信モードに決定して通信を行う。通信モードとは、例えば、エージェント装置100が車載通信装置60を用いてネットワークに接続して外部と通信を行う際の通信条件を区別するものである。通信モードに関する情報は、例えば、通信モードデータ172として記憶部170に記憶される。
図6は、通信モードデータ172の内容の一例を示す図である。図6に示す通信モードデータ172は、通信モードを識別する識別情報としてのモードIDに、通信条件が対応付けられている。モードIDは、例えば、車両Mまたは乗員と、通信事業者とで契約される通信プランによって区別されてもよく、一つの通信プランの中で設定される複数の通信条件によって区別されてもよい。
通信条件には、例えば、上限通信量、通信速度、SN比、スループット等が含まれる。上限通信量は、例えば、1ヶ月あたりの上限通信量や3日間あたりの上限通信量など、複数の通信上限に関する項目を含んでいてもよい。実施形態では、例えば、通信可能なデータ量が多いほど通信条件が良い。また、通信速度が速いほど、SN比が大きいほど、またはスループットが高いほど通信条件が良い通信モードである。通信条件は、通信量や通信速度、SN比、スループット等の項目ごとに数値化した値や、数値化した値の合計値、平均値、数値に対応付けられた通信品質(良し悪し)の度合によって表現されてもよい。また、図6には、モードAとモードBの二つの通信モードが示されているが、3以上の通信モードが設定されてよい。なお、以下では、モードAを「第1の通信モード」の一例とし、モードBを第1の通信モードよりも通信条件の悪い「第2の通信モード」の一例として説明する。
また、通信モードデータ172は、モードIDごとに通信制限情報が対応付けられていてもよい。図7は、通信制限情報を含む通信モードデータ172Aの内容の一例を示す図である。通信制限情報には、エージェント機能部150が外部と通信を行う場合に制限されるデータの種類やエージェントの機能に関する情報が含まれる。図7の例において、モードIDがモードAである場合には無制限であり、モードIDがモードBである場合には、POI(Point Of Interest)情報を受信せず、経路検索機能や店舗検索機能を行わないといった送受信されるデータ量を抑制するための制限情報が格納されている。この場合、モードBは、モードAに比してエージェント利用時の通信量を節約することができる「節約通信モード」の一例である。なお、通信モードデータは、モードIDに通信条件と通信制限情報との両方が対応付けられていてもよい。また、通信モードは、エージェントごとに設定されていてもよい。これにより、各エージェントの機能や出力態様を通信量に応じて制御させることができる。
通信制御部116は、通信モードデータ172に含まれる複数の通信モードのうち、乗員により設定された通信モード、またはエージェントの利用時に自動的に初期設定される通信モードに基づいて、車載通信装置60による外部との通信を実行させる。また、通信制御部116は、例えば、乗員による操作や通信状態に基づいて、通信モードの切り替えを行ってもよい。この場合の通信状態とは、例えば、現在の通信モードの通信量が上限通信量を越えた場合等である。また、通信制御部は、例えば、乗員認識装置80により認識される乗員に基づいて通信モードの切り替えを行ってもよい。この場合、通信制御部116は、例えば、運転者だけが車両Mに搭乗している場合と、複数の乗員が搭乗している場合とで通信モードの切り替えを行ってもよい。
[起動制御部の機能]
以下、起動制御部118の機能の詳細について説明する。起動制御部118は、エージェントごとWU判定部114により乗員の音声にウエイクアップワードが含まれる場合に、エージェント機能部150−1〜150−3のうち、ウエイクアップワードに対応付けられた少なくとも一つのエージェント機能部に関する情報を取得する。また、起動制御部118は、通信制御部116の制御により実行される通信モードに基づいて、記憶部170に記憶されたモード別エージェント情報174を参照し、利用可能なエージェント機能部に合致するエージェント機能部150を起動させる。
図8は、モード別エージェント情報174の内容の一例を示す図である。モード別エージェント情報174は、モードIDに、利用可能エージェント情報が対応付けられている。利用可能エージェント情報とは、その通信モードにおいて、利用可能なエージェントに関する情報である。起動制御部118は、通信制御部116の制御により実行される通信モードのモードIDを用いて、モード別エージェント情報174のモードIDを参照し、合致するモードIDに対応付けられた利用可能エージェント情報を取得する。そして、起動制御部118は、ウエイクアップワードにより起動指示がなされたエージェントの情報と、通信モードに基づきモード別エージェント情報174から取得した利用可能エージェント情報とに基づいて、合致するエージェントを乗員が利用可能なエージェントとして決定し、決定したエージェントのエージェント機能部を起動させる。
また、起動制御部118は、エージェントの起動状態を管理し、通信制御部116による通信モードの切り替えがあった場合に、切り替え後の通信モードのモードIDを用いて、モード別エージェント情報174のモードIDを参照し、合致するモードIDに対応付けられた利用可能エージェント情報を取得する。そして、起動制御部118は、取得した利用可能エージェント情報に基づいて、起動中のエージェントごとに、起動を継続させるか、または起動を抑制するかを決定する。
ここで、二つの具体的な場面における起動制御部118の処理について説明する。
<第1の場面>
第1の場面では、例えば、現在の通信モード(モードID)がモードAであり、ウエイクアップワードによりエージェント1およびエージェント2が起動中であるものとする。また、通信制御部116の制御により、通信モードがモードAからモードBに切り替わったとする。この場面において、起動制御部118は、モード別エージェント情報174を参照し、モードBに対応付けられた利用可能エージェント情報としてエージェント1を取得する。そして、起動制御部118は、エージェント1の起動を継続させ、エージェント2を終了させる制御を行う。
<第2の場面>
第2の場面では、例えば、ウエイクアップワードによりエージェント1〜3の起動指示がなされたが、現在の通信モードがモードBであるため、起動中のエージェントがエージェント1のみとなっているものとする。また、通信制御部116の制御により通信モードがモードBからモードAに切り替わったとする。この場面において、起動制御部118は、モード別エージェント情報174を参照し、モードAに対応付けられた利用可能エージェント情報としてエージェント1〜3を取得する。そして、起動制御部118は、エージェント1の他に、エージェント2およびエージェント3を起動させる。なお、起動制御部118は、エージェント2およびエージェント3を起動させるのに代えて、エージェント2およびエージェント3が起動可能になったことを乗員に通知するように出力制御部120に制御させてもよい。この場合、起動制御部118は、エージェント2やエージェント3を含むエージェントを起動させるウエイクアップワードがエージェントごと判定部114により判定された場合に、起動可能エージェント情報に基づき対象のエージェントを起動させる。
なお、モード別エージェント情報174に含まれる利用可能エージェント情報は、例えば、通信モードごとに起動制御部118によって設定される。この場合、起動制御部118は、例えば、通信モードごとの通信条件に基づいて利用可能なエージェントを設定する。例えば、エージェントには、エージェントサーバ200等と通信を行わずに発話に含まれる要求に対する機能を実行できるエージェントや、エージェントサーバ200等と通信を行わないと発話に含まれる要求に対する機能を実行できないエージェントが含まれる。したがって、起動制御部118は、例えば、通信条件の良い通信モードで通信を行う場合には、車両Mに搭載された全てのエージェントを利用可能なエージェントとして設定し、通信条件の悪い通信モードで通信を行う場合には、エージェントサーバ200等と通信を行わずに発話に含まれる要求に対する機能を実行できるエージェントのみを利用可能なエージェントとして設定する。
また、起動制御部118は、記憶部170に記憶された機能DB178を参照し、通信モードごとに利用可能エージェント情報の設定を行ってもよい。図9は、機能DB178の内容の一例を示す図である。機能DB178は、例えば、エージェントを識別する識別情報であるエージェントIDに、実行可否情報が対応付けられている。実行可否情報には、例えば、機能種別に対応付けられた機能が実行可能であるか否かを示す情報が各エージェントに対応付けられている。図9の例では、機能種別として、車両機器制御、音楽再生、経路案内、店舗検索が示されているが、機能の数および種類については、これに限定されない。また、図9の例では、エージェントが実行可能な機能に「1」が格納され、実現不可能な機能に「0」が格納されているが、可否を識別可能な他の情報を用いてもよい。これらの情報は、例えば、起動制御部118が、各エージェント機能部150−1〜150−3に対して、所定のタイミングや所定周期で、上述した各機能に対する実行可否の問い合わせを行い、問い合わせ結果として得られた機能情報を用いて機能DB178を生成または更新する。所定のタイミングとは、例えば、搭載されたエージェントのソフトウェアがアップグレードされたタイミングや、新たなエージェントが追加または削除されたタイミング等である。また、起動制御部118は、上述の問い合わせを行わずに、エージェント機能部150から機能情報に関する情報を受け付けた場合に、受け付けた情報に基づいて、機能DB178を更新してもよい。
起動制御部118は、通信モードごとの通信条件と、実行可否情報とに基づいて、利用可能エージェント情報の設定を行う。例えば、起動制御部118は、通信条件の良い通信モードで通信を行う場合には、車両Mの搭載された全てのエージェントを利用可能に設定する。また、通信条件が悪い通信モードで通信を行う場合には、車両Mに搭載された全てのエージェントのうち、少なくとも一つのエージェントの利用を抑制する。
また、起動制御部118は、車両制御機能を備えるエージェント1については、通信モード(通信条件の良し悪し)に関係なく、乗員の利用を抑制しない(常に利用可能となる)ように設定を行ってもよい。これにより、どの通信モードに切り替わった場合であっても車両Mを制御する機能を継続させることができる。そのため、乗員に、より安心してエージェント機能を利用させることができる。
また、起動制御部118は、エージェントが実行可能な機能ごとに抑制する機能を設定してもよい。図9の例では、エージェント1が実行可能な機能として「車両機器制御」、「音楽再生」、「経路案内」、「店舗検索」が設定されている。この場合、起動制御部118は、通信モードAから通信モードBに切り替わる場合には、「経路案内」および「店舗検索」の機能を抑制する制御を行い、「車両機器制御」、「音楽再生」の機能を利用可能にする。このように、利用可能なエージェントだけでなく、エージェントごとの機能も設定することで、より詳細に通信量の調整を行うことができる。
なお、上述した利用可能エージェント情報は、起動制御部118によって自動的に設定されることに代えて(または加えて)、乗員の操作により設定されてもよい。この場合、表示制御部122は、例えば、通信モードごとにエージェントの設定を行う画面を生成し、生成した設定画面を表示・操作装置20の表示装置に出力させる。
図10は、利用可能なエージェントを乗員に設定させる場面について説明するための図である。図10の例では、表示制御部122により表示部の所定の領域に表示される画像IM1が示されている。画像IM1に表示される内容やレイアウト等については、これに限定されるものではない。以下、画像IM1は、例えば、出力制御部120等からの指示に基づいて表示制御部122により生成され、第1ディスプレイ22(表示部の一例)の所定の領域に表示されるものとする。上述の内容は、以降の画像の説明についても同様とする。
出力制御部120は、例えば、エージェントを最初に利用する前の初期設定時または乗員によるエージェントの設定指示の操作がなされた場合に、表示制御部122に画像IM1を生成させ、生成させた画像IM1を第1ディスプレイ22に表示させる。画像IM1には、例えば、文字情報表示領域A11と、エージェント選択領域A12と、項目選択領域A13とが含まれる。文字情報表示領域A11には、例えば、通信モードに関する情報と、通信モードに対応付けて実行可能なエージェントを限定することを示す情報が表示される。利用可能なエージェントとは、例えば乗員が起動させることが可能なエージェントである。図10の例において、文字情報表示領域A11には、「通信モードBにおいて使用するエージェントを選択してください。」という文字情報が表示されている。
エージェント選択領域A12には、利用可能なエージェントに対応付けられたエージェント画像が表示される。また、エージェント選択領域A12には、エージェント画像以外の識別情報が表示されてもよい。図10の例において、エージェント選択領域A12には、エージェント1〜3に対応付けられたエージェント画像EI1〜EI3と、それぞれのエージェントを識別する識別情報(エージェント1〜3)が表示されている。これにより、乗員は、選択することが可能なエージェントの数や種類を容易に把握することができる。
項目選択領域A13には、乗員が選択可能なGUI(Graphical User Interface)スイッチが表示される。図10の例において、項目選択領域A13には、選択した内容を許可して画像IM1の表示を終了させるGUIスイッチIC11と、選択した内容をキャンセルして画像IM1の表示を終了させるGUIスイッチIC12とが表示されている。
乗員は、エージェント選択領域A12に表示されたエージェント画像EI1〜EI3のうち少なくとも一つの表示位置をタッチすることで、通信モードに対するエージェントを選択し、その後にGUIスイッチIC11を選択することで、通信モードに対するエージェントが決定される。表示制御部122は、通信制御部116によって切り替え可能な通信モードごとに、上述した図10に示す画像IM1と同様の画像を表示させて各モードにおける設定を乗員に行わせる。また、表示制御部122は、エージェントの抑制(制限)が必要な通信モードの場合にのみ、上述した設定画面を表示させ乗員に設定を行わせてもよい。
また、表示制御部122は、通信モードごとに利用可能なエージェントの選択に加えて、エージェントが実行可能な複数の機能のうち、抑制する機能を乗員に選択させることができる設定画面を表示させてもよい。図11は、抑制する機能を乗員に設定させる場面について説明するための図である。図11の例では、表示制御部122により第1ディスプレイ22の所定の領域に表示される画像IM2が示されている。画像IM2には、例えば、文字情報表示領域A21と、機能選択領域A22と、項目選択領域A23とが含まれる。文字情報表示領域A21には、例えば、エージェントおよび通信モードに関する情報と、抑制する機能を選択させることを乗員に促す情報が表示される。図11の例において、文字情報表示領域A11には、「エージェント1が通信モードBの場合に抑制する機能を選択してください。」という文字情報が表示されている。
機能選択領域A22には、指定されたエージェントに対応付けられた機能を選択するためのGUIスイッチが表示される。図11の例において、機能選択領域A22には、エージェント1に対して乗員が選択可能な機能(音楽再生、経路案内、店舗検索)に対応付けられたGUIスイッチIC21〜IC23が表示されている。また、機能選択領域A22には、そのエージェントが備えておく必要性が高い機能であって、抑制する機能として選択することができない機能に関する情報が表示されてもよい。図11の例において、機能選択領域A22には、車両機器制御を選択することができないことを示す情報が表示されている。
項目選択領域A23には、選択した内容を許可して画像IM2の表示を終了させるGUIスイッチIC24と、選択した内容をキャンセルして画像IM2の表示を終了させるGUIスイッチIC25とが表示されている。
例えば、乗員は、機能選択領域A22に表示されたGUIスイッチIC21〜IC23のうち、少なくとも一つを選択し、GUIスイッチIC24を選択することで、エージェントに対して実行可能な機能を設定することができる。表示制御部122は、通信制御部116によってエージェントごとおよび通信モードごとに、上述した図11に示す画像IM2と同様の画像を表示させて各モードにおける設定を乗員に行わせてもよい。
図12は、通信モードAで通信を行う場面において乗員に提供される内容を説明するための図である。図12の例では、通信モードがモードA(通信条件の良い通信モード)において、乗員Pから、車両Mに搭載された全てのエージェント1〜3を起動させるウエイクアップワード(例えば、「おーい!みんな!」)を受け付けた場合に、車両Mの表示部に表示される画像IM3を示している。
画像IM3には、例えば、文字情報表示領域A31と、エージェント表示領域A32とが含まれる。文字情報表示領域A31には、例えば、利用可能なエージェントの数や種類に関する情報と現在の通信モードに関する情報が表示される。図12の例において、文字情報表示領域A31には、「3つのエージェントが使用可能です」という文字情報と、「通信モード:モードA」という文字情報とが表示されている。
エージェント表示領域A32には、通信モードに基づいて利用可能なエージェントに対応付けられたエージェント画像が表示される。図12の例において、エージェント表示領域A32には、エージェント1〜3に対応付けられたエージェント画像EI1〜EI3と、それぞれのエージェントを識別する識別情報(エージェント1〜3)とが表示されている。
図13は、通信モードBで通信を行う場面において乗員に提供される内容を説明するための図である。図13の例では、通信モードがモードB(通信条件の悪い通信モード)において、乗員Pから車両Mに搭載された全てのエージェントを起動させるウエイクアップワード(例えば、「おーい!みんな!」)を受け付けた場合に、車両Mの表示部に表示される画像IM4を示している。
画像IM4には、例えば、文字情報表示領域A41と、エージェント表示領域A42とが含まれる。文字情報表示領域A41には、例えば、利用可能なエージェントの数や種類に関する情報と現在の通信モードに関する情報が表示される。図13の例において、文字情報表示領域A41には、「1つのエージェントが利用可能です」という文字情報と、「通信モード:モードB」という文字情報とが表示されている。
エージェント表示領域A42には、通信モードに基づいて利用可能なエージェントに対応付けられたエージェント画像が表示される。また、起動制御部118は、エージェント画像EI1を表示させることに加えて、エージェント1において利用が制限されている機能に関する情報を表示させてもよい。図13の例において、エージェント表示領域A42には、エージェント1に対応付けられたエージェント画像EI1と、エージェント1を識別する識別情報と、利用が制限されている機能(1.経路案内、2.店舗情報)が表示されている。
図12および図13に示す画像を乗員Pに提供することで、通信モードに関する情報や通信モードによって利用が制限されている(利用可能な)エージェントやエージェントの機能に関する情報を、より正確に把握することができる。また、乗員は、通信モードによってエージェントやエージェントの機能が制限されていることを把握できるため、それに応じた要求を発話することができたり、応答結果の内容(品質)を、ある程度予測することができる。そのため、より安心してエージェント機能を利用させることができる。
[処理フロー]
図14は、エージェント装置100により実行される処理の流れの一例を示すフローチャートである。本フローチャートの処理は、例えば、所定周期或いは所定のタイミングで繰り返し実行されてよい。また、図14の例では、エージェント装置100により実行される処理のうち、主にウエイクアップワードにより所定のエージェントを起動して、乗員の発話に含まれる要求に応答する処理について説明するものとし、エージェント装置100と協働して実行されるエージェントサーバ200の処理を含めて説明するものとする。また、図14の例では、マイク10等により入力された音声に対する音響処理が実行された後の処理を示すものとする。
まず、エージェントごとWU判定部114は、ウエイクアップワードを受け付けたか否かを判定する(ステップS100)。ウエイクアップワードを受け付けたと判定された場合、起動制御部118は、通信制御部116により制御されている現在の通信モードを取得する(S102)。次に、起動制御部118は、ウエイクアップワードと通信モードとに基づいて乗員が利用可能なエージェントを選択する(ステップS104)。ステップS104の処理において、起動制御部118は、例えば、ウエイクアップワードに基づいて起動指示のあったエージェントのうち、通信モードに対応して利用可能なエージェントを選択する。次に、起動制御部118は、選択したエージェントを起動させる(ステップS106)。
次に、起動したエージェント(エージェント機能部150)は、乗員による発話の音声受け付ける(ステップS108)。次に、音声認識部220は、受け付けた音声の認識を行い、音声をテキスト化する(ステップS110)。次に、自然言語処理部222は、テキスト化された文字情報に対する自然言語処理を実行し、文字情報の意味解析を行う(ステップS112)。次に、応答文生成部228は、意味解析結果に基づいて対話管理部224やネットワーク検索部226により実行された処理結果に基づいて、乗員の発話に含まれる要求に対応する応答結果を生成する(ステップS114)。エージェント機能部150は、応答結果を出力部に出力させる(ステップS116)。これにより、本フローチャートの処理は、終了する。また、ステップS100の処理において、ウエイクアップワードを受け付けていないと判定された場合、本フローチャートの処理を終了する。
図15は、他の通信モードに切り替えが行われた場合に、起動制御部118により実行される処理の流れの一例を示す図である。図15の例では、現在の通信モードにおいて、車載に搭載された全てのエージェントが起動している状態から、通信条件の悪い通信モードに切り替わった場合の処理について説明するものとする。図15の例において、起動制御部118は、通信制御部116により現在の通信モードから他の通信モードに切り替えられたか否かを判定する(ステップS200)。他の通信モードに切り替えられたと判定された場合、起動制御部118は、モード別エージェント情報174を参照し、切り替えた通信モードで乗員が利用可能なエージェントを取得する(ステップS202)。次に、起動制御部118は、実行中のエージェントに対して切り替えた通信モードにおいて、利用可能なエージェント以外のエージェントの起動を抑制する(ステップS204)。この場合、起動制御部118は、利用が抑制されるエージェントを終了させる制御を行う。これにより、本フローチャートの処理は、終了する。また、ステップS200の処理において、他の通信モードに切り替えられていないと判定された場合、本フローチャートの処理は、終了する。
なお、上述した図15の処理では、通信条件の良い通信モードから通信条件の悪い通信モードに切り替えたときの起動制御について説明したが、通信条件の悪い通信モードから通信条件の良い通信モードに切り替えた場合、起動制御部118は、利用可能なエージェント数を増加させる制御を行ってもよい。また、上述した図14および図15の処理において、エージェント装置100は、利用可能なエージェントを起動させたり、利用可能なエージェント以外のエージェントの起動を抑制することに代えて(または加えて)、エージェントが実行可能な複数の機能のうち少なくとも一つの機能を選択的に実行させたり、機能を抑制させてもよい。
上述した実施形態のエージェント装置100によれば、乗員の発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部150と、複数のエージェント機能部150を、ネットワークに接続可能にする通信制御部116と、複数のエージェント機能部150の起動状態を制御する起動制御部118と、を備え、起動制御部118は、通信制御部による通信状態に基づいて、複数のエージェント機能部150のうち、乗員が利用可能なエージェント機能部を決定することにより、利用者に、より安心してエージェント機能を利用させることができる。また、実施形態によれば、通信モード等の通信状態によって利用可能なエージェントやエージェントの機能を調整することで、契約した通信モードに上限通信量が設定されている場合や従量制の課金を行うサービスを利用する場合であっても、利用者に、より安心してエージェント機能を利用させることができる。
[変形例]
以下、変形例について説明する。上述の実施形態では、通信モードの切り替えが行われたタイミングで利用するエージェント(利用を抑制するエージェント)を決定したが、これに加えて、通信モードが切り替わることが事前に予測された場合に、上述した利用可能なエージェントを決定する処理を行ってもよい。この場合、起動制御部118は、例えば、通信モードごとの通信量を記憶部170に記憶しておき、利用中の通信モードの通信量と通信モードごとに予め決められた上限通信量との誤差が閾値以内である場合に、通信モードが切り替わると予測する。また、起動制御部118は、記憶部170に記憶された地図情報またはエージェントから取得した地図情報等から道路状況を取得し、取得した道路状況に基づいて、通信モードが切り替わることを予測してもよい。
また、他の変形例として、通信制御部116は、通信条件の良い通信モード(第1の通信モード)から他の通信モードに切り替える場合に、車外の通信部(例えば、汎用通信装置70に搭載された通信部)を介して通信を行う通信モード(第3の通信モード)に切り替えてもよい。これにより、車両Mに搭載された車載通信装置60を用いた通信条件の悪い通信モード(第2の通信モード)に切り替えるよりも通信条件の良い状態でエージェントの機能を実行できる可能性を高めることができる。また、通信制御部116は、第2の通信モードと第3の通信モードの通信条件を比較し、良い方の通信モードを選択して切り替えてもよい。
また、他の変形例として、通信制御部116は、通信条件が良い通信モードでの通信によって得られた過去の応答結果(応答履歴)を記憶部170に記憶しておいてもよい。この場合、エージェント機能部150は、音声の意味解析結果に基づく応答を行う場合に、応答履歴を参照し、参照した応答履歴の中に意味解析結果に含まれる要求に対応する応答結果が含まれる場合に、その応答結果を出力してもよい。これにより、エージェントサーバ200から応答結果を受信する通信を行う必要がないため、通信量を節約することができる。また、通信制御部116は、通信条件の悪い通信モードに切り替わることが予測された場合には、記憶部170に記憶される応答履歴の記憶領域(バッファ領域)を、通信条件が良い場合の記憶領域(標準の記憶領域)よりも大きくしてもよい。これにより、多くの応答履歴を記憶しておくことができ、応答履歴の情報を利用できる確率を高めることができる。
また、他の変形例として、通信制御部116は、車両Mの周辺に、無料でネットワークに接続可能な外部施設(例えば、フリーWiFiスポット)が存在する場合に、外部施設に接続した通信モード(第4の通信モード)で通信を行ってもよい。これにより、乗員や車両Mに対応付けて契約した通信モードを使用せずに、エージェントを利用することができるため、契約した通信モードの通信量を節約することができる。なお、エージェント機能部150は、車両Mに目的地が設定されている場合には、設定された目的地に対する経路を乗員にレコメンドする場合に、上述した外部施設を多く通って目的地に到着する経路をレコメンドしてもよい。
また、他の変形例として、エージェント機能部150は、店舗検索機能を実行する場合に、通信モードに基づいて、検索結果の数を調整してもよい。例えば、通信条件が良い通信モードで通信を行っている場合には、1つの検索キーワードに対して最大で10個の検索結果をエージェントサーバ200から取得し、通信条件が悪い通信モードで通信を行っている場合には、1つの検索キーワードに対して最大3個の検索結果をエージェントサーバ200から取得する。なお、上述した個数がこれに限定されるものではなく、個数に代えてデータ量を用いてもよい。これにより、エージェントにより実行される機能を維持したまま、通信量を節約することができる。
また、上述の実施形態では、移動体の一例として車両Mを用いたが、例えば、船舶や飛行物体等の他の移動体であってもよい。また、エージェント装置100の機能のうち一部または全部は、エージェントサーバ200に含まれていてもよい。また、エージェントサーバ200の機能のうち一部または全部は、エージェント装置100に含まれていてもよい。つまり、エージェント装置100およびエージェントサーバ200における機能の切り分けは、各装置の構成要素、エージェントサーバ200やエージェントシステム1の規模等によって適宜変更されてよい。また、エージェント装置100およびエージェントサーバ200における機能の切り分けは、車両Mごとまたはエージェントに設定されてもよい。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
1…エージェントシステム、10…マイク、20…表示・操作装置、30…スピーカユニット、40…ナビゲーション装置、50…車両機器、60…車載通信装置、70…汎用通信装置、80…乗員認識装置、100…エージェント装置、110…管理部、112…音響処理部、114…エージェントごとWU判定部、116…通信制御部、118…起動制御部、120…出力制御部、122…表示制御部、124…音声制御部、150…エージェント機能部、160…ペアリングアプリ実行部、170、250…記憶部、200…エージェントサーバ、210…通信部、220…音声認識部、222…自然言語処理部、224…対話管理部、226…ネットワーク検索部、228…応答文生成部、300…各種ウェブサーバ、M…車両

Claims (7)

  1. 利用者の発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部と、
    前記複数のエージェント機能部を、ネットワークに接続可能にする通信制御部と、
    前記複数のエージェント機能部の起動状態を制御する起動制御部と、を備え、
    前記起動制御部は、前記通信制御部による通信状態に基づいて、前記複数のエージェント機能部のうち、前記利用者が利用可能なエージェント機能部を決定する、
    エージェント装置。
  2. 前記通信制御部は、第1の通信モードまたは、前記第1の通信モードよりも通信条件の悪い第2の通信モードを含む通信モードにより前記ネットワークに接続可能にし、
    前記起動制御部は、前記通信制御部により前記第1の通信モードから前記第2の通信モードに切り替わる場合に、前記第1の通信モードで前記利用者が利用可能な複数のエージェント機能部のうち、少なくとも一つのエージェント機能部の利用を抑制する、
    請求項1に記載のエージェント装置。
  3. 前記通信制御部は、前記利用者が搭乗する移動体に搭載された通信部を制御する、
    請求項1または2に記載のエージェント装置。
  4. 前記複数のエージェント機能部には、前記利用者が搭乗する移動体を制御するエージェント機能部が含まれる、
    請求項1から3のうち何れか1項に記載のエージェント装置。
  5. 前記起動制御部は、前記通信制御部により第1の通信モードから前記第1の通信モードよりも通信条件の悪い第2の通信モードに通信が切り替わる場合に、前記移動体を制御するエージェント機能部の利用を抑制しない、
    請求項4に記載のエージェント装置。
  6. エージェント装置が、
    利用者の発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部を起動させ、
    前記複数のエージェント機能部を通信制御部によりネットワークに接続可能にし、
    前記複数のエージェント機能部の起動状態を制御し、
    前記通信制御部による通信状態に基づいて、前記複数のエージェント機能部のうち、前記利用者が利用可能なエージェント機能部を決定する、
    エージェント装置の制御方法。
  7. エージェント装置に、
    利用者の発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部を起動させ、
    前記複数のエージェント機能部を通信制御部によりネットワークに接続可能にさせ、
    前記複数のエージェント機能部の起動状態を制御させ、
    前記通信制御部による通信状態に基づいて、前記複数のエージェント機能部のうち、前記利用者が利用可能なエージェント機能部を決定させる、
    プログラム。
JP2019042903A 2019-03-08 2019-03-08 エージェント装置、エージェント装置の制御方法、およびプログラム Pending JP2020142758A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019042903A JP2020142758A (ja) 2019-03-08 2019-03-08 エージェント装置、エージェント装置の制御方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019042903A JP2020142758A (ja) 2019-03-08 2019-03-08 エージェント装置、エージェント装置の制御方法、およびプログラム

Publications (1)

Publication Number Publication Date
JP2020142758A true JP2020142758A (ja) 2020-09-10

Family

ID=72353066

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019042903A Pending JP2020142758A (ja) 2019-03-08 2019-03-08 エージェント装置、エージェント装置の制御方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP2020142758A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021182191A (ja) * 2020-05-18 2021-11-25 トヨタ自動車株式会社 エージェント制御装置、エージェント制御方法及びエージェント制御プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021182191A (ja) * 2020-05-18 2021-11-25 トヨタ自動車株式会社 エージェント制御装置、エージェント制御方法及びエージェント制御プログラム
JP7226393B2 (ja) 2020-05-18 2023-02-21 トヨタ自動車株式会社 エージェント制御装置、エージェント制御方法及びエージェント制御プログラム

Similar Documents

Publication Publication Date Title
JP7340940B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP7239366B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020144274A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
CN111746435B (zh) 信息提供装置、信息提供方法及存储介质
US20200317055A1 (en) Agent device, agent device control method, and storage medium
JP7222757B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020144264A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020131805A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020142758A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
US20200320997A1 (en) Agent apparatus, agent apparatus control method, and storage medium
US11797261B2 (en) On-vehicle device, method of controlling on-vehicle device, and storage medium
US11518398B2 (en) Agent system, agent server, method of controlling agent server, and storage medium
US11437035B2 (en) Agent device, method for controlling agent device, and storage medium
US11542744B2 (en) Agent device, agent device control method, and storage medium
JP7175221B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020160133A (ja) エージェントシステム、エージェントシステムの制御方法、およびプログラム
JP2020152298A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020157853A (ja) 車載エージェントシステム、車載エージェントシステムの制御方法、およびプログラム
JP7280074B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
US11355114B2 (en) Agent apparatus, agent apparatus control method, and storage medium
JP7297483B2 (ja) エージェントシステム、サーバ装置、エージェントシステムの制御方法、およびプログラム
JP2020160132A (ja) エージェント装置、エージェント装置の制御方法、プログラム、エージェントサーバ、およびエージェントサーバの制御方法
JP2020135110A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020157854A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム