JP7429194B2

JP7429194B2 - 対話装置及び対話プログラム

Info

Publication number: JP7429194B2
Application number: JP2020558161A
Authority: JP
Inventors: 祐貴田中; 貴吉川
Original assignee: NTT Docomo Inc
Current assignee: NTT Docomo Inc
Priority date: 2018-11-22
Filing date: 2019-10-15
Publication date: 2024-02-07
Anticipated expiration: 2039-10-15
Also published as: JPWO2020105317A1; WO2020105317A1

Description

本発明は、対話装置及び対話プログラムに関する。

家電機器を含むいわゆるＩｏＴ（ＩｎｔｅｒｎｅｔｏｆＴｈｉｎｇｓ）デバイス等のデバイスを、発話により操作及び制御する技術が知られている。このような技術では、ユーザによる発話の音声認識及び形態素解析等により指示の内容が判断され、制御情報が出力される。特許文献１には、家電機器を管理するサーバが、各家電機器に対応する操作画面を端末装置に提供する技術が記載されている。

特開２００２－１８６０５７号公報

ユーザの発話によりデバイスの制御を実施するシステムにおいて、制御対象の機器に関する情報及び発話内容に関する選択肢等が示されない状況では、ユーザがどのような発話をすべきかを認識するのは困難である。デバイスを制御するための発話内容として予め記憶されたシナリオに基づいて、ユーザに発話内容を案内する技術が存在するが、そのような技術であっても、予め記憶されたシナリオに基づいて案内するので、制御対象のデバイスの変更及びユーザの状況の変化等に応じて柔軟且つ動的に発話内容を提示することはできない。

特許文献１に記載された技術では、家電機器を操作するための操作画面が示されるにすぎず、ユーザの発話を支援するものではない。また、この操作画面は、予め記憶されたものであるので、状況に応じて表示内容を動的に変更させることはできない。

そこで、本発明は、上記問題点に鑑みてなされたものであり、ユーザの発話によりデバイスを制御する技術において、制御対象のデバイスの状態及びユーザに応じて、好適な発話内容を案内することにより、利便性の向上を図ることを目的とする。

上記課題を解決するために、本発明の一形態に係る対話装置は、デバイスを制御する制御情報を生成するための、音声またはテキストからなるユーザ発話を受け付ける対話装置であって、デバイスの動作状態を示すデバイス状態情報を取得するデバイス状態取得部と、デバイスの制御指示を表し少なくとも一以上の語句または文を含む指示フレーズと、当該デバイスの動作状態と、を関連付けている語彙情報を参照して、デバイス状態情報に示されるデバイスの動作状態に関連付けられている一以上の指示フレーズを抽出するフレーズ抽出部と、フレーズ抽出部により抽出された指示フレーズに基づいて、デバイスを制御するための発話文を生成する生成部と、生成部により生成された発話文をユーザに対して提示する提示部と、を備える。

上記課題を解決するために、本発明の一形態に係る対話プログラムは、コンピュータを、デバイスを制御する制御情報を生成するための、音声またはテキストからなるユーザ発話を受け付ける対話装置として機能させるための対話プログラムであって、デバイスの動作状態を示すデバイス状態情報を取得するデバイス状態取得機能と、デバイスの制御指示を表し少なくとも一以上の語句または文を含む指示フレーズと、当該デバイスの動作状態と、を関連付けている語彙情報を参照して、デバイス状態情報に示されるデバイスの動作状態に関連付けられている一以上の指示フレーズを抽出するフレーズ抽出機能と、フレーズ抽出機能により抽出された指示フレーズに基づいて、デバイスを制御するための発話文を生成する生成機能と、生成機能により生成された発話文をユーザに対して提示する提示機能と、を実現させる。

上記の形態によれば、デバイスの動作状態が取得され、取得されたデバイスの動作状態に関連付けられた指示フレーズに基づいて発話文が生成されるので、デバイスの動作状態に応じた好適な発話文をユーザに提示できる。ユーザは、提示された発話文を発話することにより、デバイスの動作状態に応じて適切な制御を実施できるので、利便性の向上が図られる。また、ユーザに対して提示される発話文が、デバイス状態情報に基づいて限定されることとなるので、発話文の提示にかかる処理負荷及び通信量が削減される。

上記課題を解決するために、本発明の一形態に係る対話装置は、デバイスを制御する制御情報を生成するための、音声またはテキストからなるユーザ発話を受け付ける対話装置であって、ユーザ発話の発話元のユーザを識別するユーザ識別情報を取得するユーザ情報取得部と、ユーザ情報取得部により取得されたユーザ識別情報により識別されるユーザの属性情報であって、デバイスの制御状態に関するユーザの好みを示す情報を含む、属性情報を取得するユーザ属性取得部と、デバイスの制御指示を表し少なくとも一以上の語句または文を含む指示フレーズと、当該デバイスに関するユーザの好みの制御状態と、を関連付けている語彙情報を参照して、属性情報により示されるユーザの好みの制御状態に関連付けられている一以上の指示フレーズを抽出するフレーズ抽出部と、フレーズ抽出部により抽出された指示フレーズに基づいて、デバイスを制御するための発話文を生成する生成部と、生成部により生成された発話文をユーザに対して提示する提示部と、を備える。

上記課題を解決するために、本発明の一形態に係る対話プログラムは、コンピュータを、デバイスを制御する制御情報を生成するための、音声またはテキストからなるユーザ発話を受け付ける対話装置として機能させるための対話プログラムであって、ユーザ発話の発話元のユーザを識別するユーザ識別情報を取得するユーザ情報取得機能と、ユーザ情報取得機能により取得されたユーザ識別情報により識別されるユーザの属性情報であって、デバイスの制御状態に関するユーザの好みを示す情報を含む、属性情報を取得するユーザ属性取得機能と、デバイスの制御指示を表し少なくとも一以上の語句または文を含む指示フレーズと、当該デバイスに関するユーザの好みの制御状態と、を関連付けている語彙情報を参照して、属性情報により示されるユーザの好みの制御状態に関連付けられている一以上の指示フレーズを抽出するフレーズ抽出機能と、フレーズ抽出機能により抽出された指示フレーズに基づいて、デバイスを制御するための発話文を生成する生成機能と、生成機能により生成された発話文をユーザに対して提示する提示機能と、を実現させる。

上記の形態によれば、ユーザ発話の発話元のユーザの、デバイスの制御状態に関する好みを示す属性情報が取得され、当該ユーザの好みに関連付けられた指示フレーズが抽出されるので、ユーザにとって好適なデバイスの制御が実施される可能性が高い発話文を提示できる。このように提示された発話文をユーザが発話することにより、ユーザが好む動作状態にデバイスが制御されるので、利便性の向上が図られる。また、ユーザに対して提示される発話文が、ユーザの属性情報に基づいて限定されることとなるので、発話文の提示にかかる処理負荷及び通信量が削減される。

ユーザの発話によりデバイスを制御する技術において、制御対象のデバイスの状態及びユーザに応じて、好適な発話内容を案内することにより、利便性の向上を図ることが可能となる。

本実施形態に係る対話装置を含む対話システムの装置構成を示す図である。本実施形態に係る対話装置の機能的構成を示す機能ブロック図である。対話装置のハードブロック図である。設定情報記憶部の構成及び記憶されているデータの例を示す図である。デバイス状態情報の例を示す図である。ユーザの属性情報の例を示す図である。語彙情報記憶部の構成及び記憶されているデータの例を示す図である。発話文が表示されたユーザの端末の画面例を示す図である。本実施形態の対話方法の処理内容を示すフローチャートである。本実施形態の対話方法の処理内容を示すフローチャートである。対話プログラムの構成を示す図である。

本発明に係る対話装置及び対話プログラムの実施形態について図面を参照して説明する。なお、可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。

図１は、本実施形態に係る対話システムの装置構成を示す図である。対話システム１は、対話装置１０、外部システム３０及び端末５０を含む。対話装置１０と端末５０とは、互いに通信可能である。また、対話装置１０と外部システム３０とは互いに通信可能である。

対話装置１０は、デバイスを制御する制御情報を生成するための、音声またはテキストからなるユーザ発話を受け付ける装置である。また、対話装置１０は、外部システム３０が管理するデバイスを操作するために、制御情報を外部システム３０に送信してもよい。対話装置１０は、例えば、サーバ等のコンピュータにより構成されるが、対話装置１０を構成する装置は限定されない。

外部システム３０は、家電機器等を含むいわゆるＩｏＴ（ＩｎｔｅｒｎｅｔｏｆＴｈｉｎｇｓ）デバイス等のデバイスを管理するデバイス管理システムを構成する。外部システム３０は、複数のデバイスとそれぞれの通信規格に従った通信をすることが可能である。

外部システム３０は、各デバイスを制御するためのインターフェースを構成しうる設定情報をデバイス毎に有しており、設定情報の利用及び参照により、対話装置１０から受信した制御情報に基づいて、管理下にあるデバイスのいずれかを制御できる。

外部システム３０は、設定情報記憶部３１及びデバイス状態管理部３２を含むことができる。設定情報記憶部３１は、制御対象のデバイスの設定情報を記憶している記憶手段である。設定情報は、デバイスの制御のために利用及び参照される情報である。設定情報の詳細については後述する。なお、図１に示す例では、設定情報記憶部３１は、外部システム３０内に構成されているが、このような構成には限定されず、外部システム３０からアクセス可能であれば、外部システム３０外に構成されてもよい。

デバイス状態管理部３２は、外部システム３０が管理しているデバイスの動作状態を示すデバイス状態情報を管理する。具体的には、デバイス状態管理部３２は、デバイス状態情報を取得及び記憶することができる。デバイス状態情報については、後に詳述する。

端末５０は、発話によるデバイスの制御において、ユーザとのインターフェースを構成する装置であって、例えば、据置型又は携帯型のパーソナルコンピュータ、高機能携帯電話機（スマートフォン）等により構成されるが、端末５０を構成する装置は限定されず、例えば携帯電話機、携帯情報端末（ＰＤＡ）などの携帯端末でもよい。

端末５０は、ユーザに発せられた音声のデータをユーザ発話として対話装置に送信できる。また、端末５０は、ユーザの音声を音声認識処理によりテキスト化したデータをユーザ発話として対話装置１０に送信してもよい。

また、端末５０は、後述されるように、対話装置１０から送信された発話文をユーザに対して提示できる。具体的には、端末５０は、発話文を示すテキストをディスプレイに表示することにより、発話文をユーザに提示する。また、端末５０は、発話文を示すテキストが関連付けられ指示操作が可能な操作オブジェクトをディスプレイに表示してもよい。操作オブジェクトは、ユーザによる操作が可能なボタンの態様で表示されてもよい。表示された操作オブジェクトに対する操作が受け付けられた場合には、端末５０は、操作オブジェクトが操作された旨の情報、操作オブジェクトに関連付けられた発話文のテキストデータまたは音声データを、ユーザ発話として対話装置１０に送信してもよい。

図２は、本実施形態に係る対話装置１０の機能的構成を示す図である。図２に示すように、対話装置１０は、外部システム情報取得部１１、ユーザ情報取得部１２、デバイス抽出部１３、ユーザ属性取得部１４、フレーズ抽出部１５、生成部１６、提示部１７、発話受付部１８及び制御指示送信部１９を含む。外部システム情報取得部１１は、設定情報取得部１１Ａ及びデバイス状態取得部１１Ｂを含む。また、対話装置１０は、語彙情報記憶部２０及びユーザ属性記憶部２１を含む。対話装置１０に含まれる各機能部は、複数の装置に分散されて構成されても良いし、例えば、一部の機能部が端末５０に構成されてもよい。

なお、図２に示したブロック図は、機能単位のブロックを示している。これらの機能ブロック（構成部）は、ハードウェア及び／又はソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は特に限定されない。すなわち、各機能ブロックは、物理的及び／又は論理的に結合した１つの装置により実現されてもよいし、物理的及び／又は論理的に分離した２つ以上の装置を直接的及び／又は間接的に(例えば、有線及び／又は無線)で接続し、これら複数の装置により実現されてもよい。

機能には、判断、決定、判定、計算、算出、処理、導出、調査、探索、確認、受信、送信、出力、アクセス、解決、選択、選定、確立、比較、想定、期待、見做し、報知（broadcasting）、通知（notifying）、通信（communicating）、転送（forwarding）、構成（configuring）、再構成（reconfiguring）、割り当て（allocating、mapping）、割り振り（assigning）などがあるが、これらに限られない。たとえば、送信を機能させる機能ブロック（構成部）は、送信部（transmitting unit）や送信機（transmitter）と呼称される。いずれも、上述したとおり、実現方法は特に限定されない。

例えば、本発明の一実施の形態における対話装置１０は、コンピュータとして機能してもよい。図３は、本実施形態に係る対話装置１０のハードウェア構成の一例を示す図である。対話装置１０は、物理的には、プロセッサ１００１、メモリ１００２、ストレージ１００３、通信装置１００４、入力装置１００５、出力装置１００６、バス１００７などを含むコンピュータ装置として構成されてもよい。

なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。対話装置１０のハードウェア構成は、図３に示した各装置を１つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。

対話装置１０における各機能は、プロセッサ１００１、メモリ１００２などのハードウェア上に所定のソフトウェア（プログラム）を読み込ませることで、プロセッサ１００１が演算を行い、通信装置１００４による通信や、メモリ１００２及びストレージ１００３におけるデータの読み出し及び／又は書き込みを制御することで実現される。

プロセッサ１００１は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ１００１は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置（ＣＰＵ：Central Processing Unit）で構成されてもよい。また、プロセッサ１００１は、ＧＰＵ（Graphics Processing Unit）を含んで構成されてもよい。例えば、図２に示した各機能部１１～１９などは、プロセッサ１００１で実現されてもよい。

また、プロセッサ１００１は、プログラム（プログラムコード）、ソフトウェアモジュールやデータを、ストレージ１００３及び／又は通信装置１００４からメモリ１００２に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態で説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、対話装置１０の各機能部１１～１９は、メモリ１００２に格納され、プロセッサ１００１で動作する制御プログラムによって実現されてもよい。上述の各種処理は、１つのプロセッサ１００１で実行される旨を説明してきたが、２以上のプロセッサ１００１により同時又は逐次に実行されてもよい。プロセッサ１００１は、１以上のチップで実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。

メモリ１００２は、コンピュータ読み取り可能な記録媒体であり、例えば、ＲＯＭ（Read Only Memory）、ＥＰＲＯＭ（Erasable Programmable ＲＯＭ）、ＥＥＰＲＯＭ（Electrically Erasable Programmable ＲＯＭ）、ＲＡＭ（Random Access Memory）などの少なくとも１つで構成されてもよい。メモリ１００２は、レジスタ、キャッシュ、メインメモリ（主記憶装置）などと呼ばれてもよい。メモリ１００２は、本発明の一実施の形態に係る対話方法を実施するために実行可能なプログラム（プログラムコード）、ソフトウェアモジュールなどを保存することができる。

ストレージ１００３は、コンピュータ読み取り可能な記録媒体であり、例えば、ＣＤ－ＲＯＭ（Compact Disc ＲＯＭ）などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Ｂｌｕ－ｒａｙ（登録商標）ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー（登録商標）ディスク、磁気ストリップなどの少なくとも１つで構成されてもよい。ストレージ１００３は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ１００２及び／又はストレージ１００３を含むデータベース、サーバその他の適切な媒体であってもよい。

通信装置１００４は、有線及び／又は無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア（送受信デバイス）であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。

入力装置１００５は、外部からの入力を受け付ける入力デバイス（例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど）である。出力装置１００６は、外部への出力を実施する出力デバイス（例えば、ディスプレイ、スピーカー、LEDランプなど）である。なお、入力装置１００５及び出力装置１００６は、一体となった構成（例えば、タッチパネル）であってもよい。

また、プロセッサ１００１やメモリ１００２などの各装置は、情報を通信するためのバス１００７で接続される。バス１００７は、単一のバスで構成されてもよいし、装置間で異なるバスで構成されてもよい。

また、対話装置１０は、マイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ：Digital Signal Processor）、ＡＳＩＣ（Application Specific Integrated Circuit）、ＰＬＤ（Programmable Logic Device）、ＦＰＧＡ（Field Programmable Gate Array）などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ１００１は、これらのハードウェアの少なくとも１つで実装されてもよい。

再び図２を参照して、対話装置１０の各機能部について説明する。外部システム情報取得部１１は、外部システム３０から種々の情報を取得する。具体的には、外部システム情報取得部１１は、設定情報取得部１１Ａ及びデバイス状態取得部１１Ｂを含み、設定情報及びデバイス状態情報を取得する。

設定情報取得部１１Ａは、設定情報を取得する。具体的には、設定情報取得部１１Ａは、外部システム３０の設定情報記憶部３１から設定情報を取得する。設定情報は、各デバイスの属性を含みデバイスの制御のために参照される。

図４は、設定情報記憶部３１の構成及び記憶されているデータの例を示す情報である。図４に示すように、設定情報記憶部３１は、デバイスを識別するデバイスＩＤに関連付けて、各種の属性を設定情報として記憶している。図４に示す例では、設定情報記憶部３１は、デバイスＩＤごとに、当該デバイスのカテゴリを示すデバイス、ニックネーム及びグループ等の設定情報を記憶している。

ニックネームは、当該デバイスに対してユーザにより設定される名称であって、発話文において、当該デバイスを指し示すための名称である。図４に示す例では、各デバイスがそれぞれ一のニックネームが設定されているが、一のデバイスに対して、複数のユーザのそれぞれにより固有のニックネームが設定されてもよい。ニックネームの設定は、ユーザからみて、各デバイスがそれぞれにユニークに識別されればよい。グループは、当該デバイスが設けられた所在位置を示す情報であることができる。また、グループは、複数のデバイスをグルーピングするためのその他の情報であってもよい。

例えば、設定情報記憶部３１は、デバイスＩＤ「１」に関連付けて、デバイス「ＴＶ」、ニックネーム「お父さんのＴＶ」及びグループ「リビング」等の設定情報を記憶している。

設定情報取得部１１Ａは、ユーザ発話を受け付ける待機状態の所定のタイミングにおいて、所定の分量の設定情報を一括で取得してもよい。また、設定情報取得部１１Ａは、後に詳述されるデバイス抽出部１３及びフレーズ抽出部１５等において設定情報が参照されるタイミングにおいて、その都度に必要な設定情報を取得してもよい。

デバイス状態取得部１１Ｂは、デバイス状態情報を取得する。デバイス状態情報は、外部システム３０が管理しているデバイスの動作状態を示す情報である。デバイス状態情報は、例えば、外部システム３０のデバイス状態管理部３２により管理されている。デバイス状態管理部３２は、管理下の各デバイスの動作状態を取得し記憶している。デバイス状態管理部３２は、記憶しているデバイスの動作状態を示す情報を、デバイス状態情報として対話装置１０に提供する。

デバイス状態取得部１１Ｂは、デバイス状態管理部３２からデバイス状態情報を取得できる。図５は、デバイス状態情報の例を示す図である。図５に示すように、デバイス状態情報は、デバイスを識別するデバイスＩＤごとに、デバイスのカテゴリ及びデバイス動作状態を含む。例えば、デバイスＩＤ「１」のデバイスのカテゴリは「ＴＶ」であり、デバイス動作状態は「電源：ＯＮ、チャンネル：４、音量レベル：１８」である。

ユーザ情報取得部１２は、ユーザ発話の発話元のユーザを識別するユーザ識別情報を取得する。具体的には、ユーザ情報取得部１２は、ユーザの端末５０からユーザ識別情報を取得できる。ユーザ情報取得部１２は、例えば、アカウント認証等の処理のために端末５０から対話装置１０に送信されるユーザ識別情報を取得できる。

また、ユーザ情報取得部１２は、ユーザの位置を示す位置情報をユーザの情報の一部として取得してもよい。具体的には、ユーザ情報取得部１２は、例えば、ユーザの端末５０が備えるＧＰＳ装置（図示せず）等により取得された位置情報を取得する。ユーザ情報取得部１２は、本実施形態の対話システム１が適用される空間に設けられた人感センサ（図示せず）により検出された検出情報に基づいて、ユーザの位置情報を取得してもよい。また、端末５０が移動無線通信端末である場合には、ユーザ情報取得部１２は、端末５０の在圏情報を位置情報として取得してもよい。ユーザ情報取得部１２は、その他の周知の手法によりユーザの位置情報を取得してもよい。

デバイス抽出部１３は、例えばユーザ情報取得部１２によりユーザの位置情報が取得された場合には、指示フレーズの抽出及び発話文の生成に先立って制御対象のデバイスを絞り込むために、設定情報を参照して、ユーザ情報取得部１２により取得された位置情報に関連付けられたデバイスを抽出してもよい。なお、デバイス抽出部１３は、本実施形態において必須の構成要素ではなく、デバイスの抽出処理も必須ではない。

上記のとおり、設定情報は、デバイスと当該デバイスの所在位置を示すグループとの関連付けを含むので、デバイス抽出部１３は、設定情報を参照することにより、ユーザの所在位置に所在するデバイスを抽出できる。例えば、ユーザ情報取得部１２により取得された位置情報により、ユーザの所在位置がリビングであることが示される場合には、デバイス抽出部１３は、図４に示される設定情報を参照して、「リビング」に関連付けられたデバイスであるデバイスＩＤ「１」の「ＴＶ」、デバイスＩＤ「２」の「ライト」、デバイスＩＤ「３」の「ライト」及びデバイスＩＤ「５」の「エアコン」を抽出する。

ユーザ属性取得部１４は、ユーザ情報取得部１２により取得されたユーザ識別情報により識別されるユーザの属性情報を取得する。ユーザの属性情報は、デバイスの制御状態に関するユーザの好みを示す情報を含み、例えば、本実施形態では、ユーザ属性記憶部２１に記憶されている。ユーザ属性取得部１４は、ユーザ属性記憶部２１から、ユーザの属性情報を取得する。

図６は、ユーザ属性記憶部２１に記憶されている属性情報の構成及び記憶されているデータの例を示す図である。図６に示すように、ユーザ属性記憶部２１は、ユーザを識別するユーザＩＤ（ユーザ識別情報）及びユーザ名に関連付けて、温度、湿度、明るさ、音量レベル及びテレビのチャンネル等の属性情報を記憶している。

属性情報のうちの温度及び湿度は、例えば、エアコンの制御のための指示フレーズの抽出に際して参照される。また、属性情報のうちの明るさは、ライト（照明装置）の制御のための指示フレーズの抽出に際して参照される。また、属性情報のうちの音量レベル及びテレビのチャンネルは、テレビの制御のための指示フレーズの抽出に際して参照される。

例えば、ユーザＩＤ「０００１」により識別されるユーザである「ｆａｔｈｅｒ」には、温度「２２℃－２５℃」、湿度「３０％－５０％」、明るさ「５００－１０００ｌｕｘ」、音量レベル「３０－３５」及びテレビのチャンネル「１，２，４，７」が、デバイスの制御状態に関する好みを示す属性情報として関連付けられている。

フレーズ抽出部１５は、語彙情報を参照して、デバイス状態情報に示されるデバイスの動作状態に関連付けられている一以上の指示フレーズを抽出する。語彙情報は、各デバイスと、当該デバイスの制御指示を表し少なくとも一以上の語句または文を含む指示フレーズとを関連付けている情報である。フレーズ抽出部１５は、語彙情報記憶部２０に記憶されている語彙情報を参照して指示フレーズを抽出する。

図７は、語彙情報記憶部２０の構成及び記憶されているデータの例を示す図である。図７に示されるように、語彙情報記憶部２０は、デバイスの種別を示すデバイスカテゴリに少なくとも指示フレーズを関連付けた語彙情報を記憶している。語彙情報は、デバイスカテゴリに関連付けて、制御内容、設定項目をさらに含んでもよい。制御内容は、関連付けられている指示フレーズの発話により達せられる目的であって、デバイスに対して実施される制御の内容を示す。設定項目は、例えば制御内容がデバイスのパラメータの変更に関するものである場合等において、指示フレーズに対してオプションとして付加される、パラメータの変更幅等に関する語句である。

図７に示されるように、語彙情報の各指示フレーズには、デバイス動作状態が関連付けられている。例えば、ＴＶをＯＮの状態に制御する必要があるのは、電源がＯＦＦの状態のときであることに鑑みて、デバイス「ＴＶ」を制御内容「ＯＮ」に制御するための指示フレーズ「つけて」には、デバイス動作状態「電源：ＯＦＦ」が関連付けられている。

また、エアコンの設定温度を上げる制御を実施する必要があるのは、設定温度が低い場合であることに鑑みて、デバイス「エアコン」を制御内容「設定温度を上げる」に制御するための指示フレーズ「温度を上げて」には、デバイス動作状態「電源：ＯＮａｎｄ設定温度：２５度以下」，「電源：ＯＮａｎｄ設定温度：２３度以下」が関連付けられている。

図５に示すように、デバイス状態情報は、デバイスが動作中（例えば、「電源：ＯＮ」）または非動作中（例えば、「電源：ＯＦＦ」）であることを示す情報を含むことができる。このような場合に、フレーズ抽出部１５は、デバイスが動作中である場合には、デバイスを非動作状態に制御するための指示フレーズを抽出し、デバイスが非動作中である場合には、デバイスを動作状態に制御するための指示フレーズを抽出することができる。

具体的には、デバイス状態取得部１１Ｂにより、図５に示されるようなデバイス状態情報「デバイスＩＤ「１」、デバイス「ＴＶ」、デバイス動作状態「電源：ＯＮ、・・・」が取得された場合に、フレーズ抽出部１５は、語彙情報（図７参照）を参照して、デバイス動作状態「電源：ＯＮ」に関連付けられており、デバイス「ＴＶ］を制御内容「ＯＦＦ」に制御するための指示フレーズ「けして」を抽出する。

また、例えば、デバイス状態取得部１１Ｂにより、図５に示されるようなデバイス状態情報「デバイスＩＤ「２」、デバイス「ライト」、デバイス動作状態「電源：ＯＦＦ、・・・」が取得された場合に、フレーズ抽出部１５は、語彙情報（図７参照）を参照して、デバイス動作状態「電源：ＯＦＦ」に関連付けられており、デバイス「ライト］を制御内容「ＯＮ」に制御するための指示フレーズ「つけて」を抽出する。

また、図５に示すように、デバイス状態情報は、デバイスの動作に関する所定のパラメータを含むことができる。具体的には、例えば、デバイスＩＤ「１」及びデバイス「ＴＶ」のデバイス状態情報は、チャンネル「４」及び音量レベル「１８」のようなＴＶの動作に関するパラメータをデバイス状態情報として含む。また、例えば、デバイスＩＤ「５」及びデバイス「エアコン」のデバイス状態情報は、設定温度「２４度」及び設定湿度「５０％」のようなエアコンの動作に関するパラメータをデバイス状態情報として含む。

このような場合に、フレーズ抽出部１５は、デバイス状態情報に含まれるパラメータが第１の範囲に含まれる場合には、当該デバイスのパラメータを、第１の範囲とは異なる第２の範囲に制御するための指示フレーズを抽出することができる。

具体的には、デバイス状態取得部１１Ｂにより、図５に示されるようなデバイス状態情報「デバイスＩＤ「５」、デバイス「エアコン」、デバイス動作状態「設定温度：２４度、・・・」が取得された場合に、フレーズ抽出部１５は、語彙情報（図７参照）を参照して、デバイス動作状態「設定温度：２５度以下」に関連付けられており、デバイス「エアコン］を制御内容「設定温度を上げる」に制御するための指示フレーズ「温度を上げて」を抽出する。即ち、デバイス動作状態における設定温度が２５度未満の範囲（第１の範囲）に含まれるので、設定温度を２５度以上の範囲（第２の範囲）に制御するために、このような指示フレーズが抽出される。

なお、この指示フレーズの抽出に際して、デバイス動作状態における「設定温度：２４度」は、指示フレーズ「温度を上げて」に関連付けられている２つの設定項目「少し」及び「２度」のそれぞれに関連付けられたデバイス動作状態のうちの、「少し」に関連付けられたデバイス動作状態に該当するので、設定項目に設定されたオプションのフレーズ「少し」がさらに抽出されてもよい。

また、フレーズ抽出部１５は、語彙情報を参照して、ユーザの属性情報により示される当該ユーザの好みの制御状態に関連付けられている一以上の指示フレーズを抽出してもよい。

図７に示されるように、語彙情報は、各指示フレーズに関連付けられたユーザ属性を含む。例えば、エアコンの設定温度を上げる制御を実施する必要があるのは、ユーザが高い設定温度を好む場合であることに鑑みて、デバイス「エアコン」に対して制御内容「設定温度を上げる」を実施するための指示フレーズ「温度を上げて」には、高い温度のユーザ属性「２６度以上」が関連付けられている。

例えば、ユーザ情報取得部１２によりユーザＩＤ「０００１」が取得され、ユーザ属性取得部１４によりユーザＩＤ「０００１」に関連付けられたユーザ属性「ユーザ名：ｆａｔｈｅｒ、温度：２２－２５度、・・・」が取得された場合に、フレーズ抽出部１５は、語彙情報を参照して、ユーザ属性「温度２５度以下」に関連付けられており、デバイス「エアコン］を制御内容「温度を下げる」に制御するための指示フレーズ「温度を下げて」を抽出する。

また、例えば、ユーザ情報取得部１２によりユーザＩＤ「０００２」が取得され、ユーザ属性取得部１４によりユーザＩＤ「０００２」に関連付けられたユーザ属性「ユーザ名：ｍｏｔｈｅｒ、温度：２６－２８度、・・・」が取得された場合に、フレーズ抽出部１５は、語彙情報を参照して、ユーザ属性「温度２６度以上」に関連付けられており、デバイス「エアコン］を制御内容「温度を上げる」に制御するための指示フレーズ「温度を上げて」を抽出する。

また、フレーズ抽出部１５は、語彙情報を参照して、デバイス状態情報に示されるデバイスの動作状態及びユーザの属性情報により示される当該ユーザの好みの制御状態に関連付けられている一以上の指示フレーズを抽出してもよい。

例えば、ユーザ情報取得部１２によりユーザＩＤ「０００３」が取得され、ユーザ属性取得部１４によりユーザＩＤ「０００３」に関連付けられたユーザ属性「ユーザ名：ｄａｕｇｈｔｅｒ、・・・、音量レベル：１０－２０、・・・」が取得され、デバイス状態取得部１１Ｂにより、デバイス状態情報「デバイスＩＤ「１」、デバイス「ＴＶ」、デバイス動作状態「電源：ＯＮ、・・・、音量レベル：１８」が取得された場合に、フレーズ抽出部１５は、語彙情報を参照して、デバイスカテゴリ「ＴＶ」に関連付けられた指示フレーズのうち、ユーザ属性「音量レベル：２０以下」及びデバイス動作状態「電源：ＯＮａｎｄ音量レベル：１５以上」に関連付けられた指示フレーズ「音量を下げて」及びオプションとしての設定項目「少し」を抽出する。

また、デバイス抽出部１３により、ユーザの所在位置に所在するデバイスが抽出されている場合には、フレーズ抽出部１５は、語彙情報を参照して、デバイス抽出部１３により抽出されたデバイスに関連付けられている一以上の指示フレーズを抽出することとしてもよい。フレーズ抽出部１５は、例えば、デバイス抽出部により抽出されたデバイスが「ＴＶ」である場合に、デバイスカテゴリ「ＴＶ」に関連付けられた指示フレーズである「つけて」、「けして」、「音量を上げて」、「音量を下げて」及び「チャンネルを変えて」を語彙情報から抽出する。

生成部１６は、フレーズ抽出部１５により抽出された指示フレーズに基づいて、デバイスを制御するための発話文を生成する。具体的には、生成部１６は、フレーズ抽出部１５により抽出された指示フレーズを発話文として生成してもよい。

また、生成部１６は、フレーズ抽出部１５により抽出された指示フレーズに関連付けられたデバイスカテゴリを、制御対象を示す語句として指示フレーズに付加して、発話文を生成してもよい。例えば、フレーズ抽出部１５によりデバイス「ＴＶ」の制御内容「ＯＮ」に対応する指示フレーズ「つけて」が抽出された場合には、生成部１６は、その制御対象を示す「ＴＶ」及び助詞を指示フレーズ「つけて」に付加して、発話文「ＴＶをつけて」を生成してもよい。

また、生成部１６は、フレーズ抽出部１５により抽出された指示フレーズ及び指示フレーズの制御対象のデバイスのニックネームに基づいて、発話文を生成してもよい。例えば、フレーズ抽出部１５によりデバイス「ＴＶ」の制御内容「ＯＮ」に対応する指示フレーズ「つけて」が抽出された場合には、生成部１６は、その制御対象である「ＴＶ」のニックネーム「お父さんのＴＶ」及び助詞を指示フレーズ「つけて」に付加して、発話文「お父さんのＴＶをつけて」を生成してもよい。

また、生成部１６は、フレーズ抽出部１５により抽出された指示フレーズがデバイスのパラメータの変更を目的とするものである場合に、その変更幅を示す語句を指示フレーズに付加して、発話文を生成してもよい。例えば、フレーズ抽出部１５により、デバイス「エアコン」の制御内容「設定温度を上げる」に対応する指示フレーズ「温度を上げて」が抽出された場合には、生成部１６は、エアコンのパラメータである温度の変更幅を示す語句として設定項目に記憶されている「少し」，「２度」という語句を指示フレーズに付加して、発話文「温度を少し上げて」，「温度を２度上げて」を生成してもよい。なお、デバイス動作状態等に応じて、これら２つの発話文のうちのいずれかが生成されてもよい。

提示部１７は、生成部１６により生成された発話文をユーザに対して提示する。具体的には、提示部１７は、発話文を示すテキスト情報をユーザの端末５０に送信し、発話文を示すテキストを端末５０のディスプレイに表示させる。

図８は、発話文が表示されたユーザの端末５０の画面例を示す図である。図８に示されるように、端末５０のディスプレイＤは、発話文を示すテキストｂ１「リビングのエアコンの温度を２度下げて」，テキストｂ２「お父さんのＴＶをつけて」を含む。このように、生成された発話文を示すテキストがユーザの端末５０において提示されることにより、ユーザはその発話文を発することができる。

また、提示部１７は、発話文を示すテキストが関連付けられ指示操作可能な操作オブジェクトをユーザの端末５０に表示させてもよい。この場合には、提示部１７は、図８の画面例において、テキストｂ１及びテキストｂ２のそれぞれを、ユーザにより指示操作可能なボタン等の操作オブジェクトとして構成して、ディスプレイＤに表示させる。提示部１７が、このような操作オブジェクトを端末５０に表示させる場合には、対話装置１０は、ユーザの端末５０において操作オブジェクトが操作された場合に、テキストの内容の音声からなるユーザ発話を受け付けた場合と同様のデバイスの制御情報を生成する。

発話受付部１８は、ユーザの発話をユーザ発話として受け付ける。具体的には、発話受付部１８は、発話文を提示されたユーザが端末５０に対して発した発話を表す音声またはテキストを、端末５０を介して、ユーザ発話として受け付ける。

また、発話文が関連付けられたボタン等の操作オブジェクトが端末５０において提示され、操作オブジェクトに対する指示操作が端末５０において受け付けられた場合には、発話受付部１８は、操作オブジェクトが操作された旨の情報をユーザ発話として受け付ける。

制御指示送信部１９は、ユーザ発話に基づいて、外部システム３０により管理されているデバイスを制御するための制御情報を送信する。具体的には、発話受付部１８により音声データからなるユーザ発話が受け付けられた場合には、制御指示送信部１９は、ユーザ発話に対して、音声認識処理、形態素解析及び所定の解析処理を実施することにより、デバイスを制御するための制御情報を生成し、生成した制御情報を外部システム３０に送信する。なお、ユーザ発話がテキストデータとして受け付けられた場合には、音声認識処理は不要である。

操作オブジェクトが操作された旨の情報がユーザ発話として受け付けられた場合には、制御指示送信部１９は、当該操作オブジェクトに関連付けられた発話文のテキストデータがユーザ発話として受け付けられたものとみなして、そのテキストデータに対する形態素解析及び所定の解析処理を実施することにより、デバイスを制御するための制御情報を生成する。

次に、図９を参照して、対話装置１０における処理内容を説明する。図９は、本実施形態の対話方法の処理内容を示すフローチャートである。

ステップＳ１において、ユーザ情報取得部１２は、ユーザ発話の発話元のユーザを識別するユーザ識別情報を取得する。そして、対話装置１０は、ユーザ発話の受付待機状態に制御される。具体的には、発話受付部１８が、ユーザ発話の受付待機状態に制御される。

ステップＳ２において、設定情報取得部１１Ａは、外部システム３０の設定情報記憶部３１から設定情報を取得する。

ステップＳ３において、デバイス状態取得部１１Ｂは、デバイス状態管理部３２からデバイス状態情報を取得する。ステップＳ４において、デバイス状態取得部１１Ｂは、デバイス状態情報の取得に成功したか否かを判定する。デバイス状態情報の取得に成功したと判定された場合には、処理はステップＳ５に進む。一方、デバイス状態情報の取得に成功したと判定されなかった場合には、処理はステップＳ６に進む。

ステップＳ５において、フレーズ抽出部１５は、語彙情報を参照して、デバイス状態情報に示されるデバイスの動作状態に関連付けられている一以上の指示フレーズを抽出する。

一方、ステップＳ６では、フレーズ抽出部１５は、デバイスの動作状態に依存しないで、指示フレーズを抽出する。具体的には、フレーズ抽出部１５は、例えば、語彙情報からランダムに指示フレーズを抽出してもよい。また、フレーズ抽出部１５は、例えば、指示フレーズの抽出の履歴を参照して、直近に受け付けられた指示フレーズ、抽出回数が多い指示フレーズ等を抽出してもよい。

ステップＳ７において、生成部１６は、ステップＳ５またはステップＳ６においてフレーズ抽出部１５により抽出された指示フレーズに基づいて、デバイスを制御するための発話文を生成する。

ステップＳ８において、提示部１７は、生成部１６により生成された発話文をユーザに対して提示する。具体的には、提示部１７は、発話文を示すテキスト情報をユーザの端末５０に送信し、発話文を示すテキストを端末５０のディスプレイに表示させる。

次に、図１０を参照して、対話装置１０における処理内容の他の例を説明する。図１０は、本実施形態の対話方法の処理内容を示すフローチャートである。図９に示した処理ではデバイス状態情報が用いられるのに対して、図１０に示す処理では、ユーザの属性情報が用いられる。

ステップＳ１１において、ユーザ情報取得部１２は、ユーザ発話の発話元のユーザを識別するユーザ識別情報を取得する。そして、対話装置１０は、ユーザ発話の受付待機状態に制御される。具体的には、発話受付部１８が、ユーザ発話の受付待機状態に制御される。

ステップＳ１２において、設定情報取得部１１Ａは、外部システム３０の設定情報記憶部３１から設定情報を取得する。

ステップＳ１３において、ユーザ属性取得部１４は、ユーザ情報取得部１２により取得されたユーザ識別情報により識別されるユーザの属性情報を取得する。ステップＳ１４において、ユーザ属性取得部１４は、ユーザの属性情報の取得に成功したか否かを判定する。ユーザの属性情報の取得に成功したと判定された場合には、処理はステップＳ１５に進む。一方、ユーザの属性情報の取得に成功したと判定されなかった場合には、処理はステップＳ１６に進む。

ステップＳ１５において、フレーズ抽出部１５は、語彙情報を参照して、ユーザの属性情報に示される当該ユーザの好みのデバイスの制御状態に関連付けられている一以上の指示フレーズを抽出する。

一方、ステップＳ１６では、フレーズ抽出部１５は、ユーザの属性情報に依存しないで、指示フレーズを抽出する。具体的には、フレーズ抽出部１５は、例えば、語彙情報からランダムに指示フレーズを抽出してもよい。また、フレーズ抽出部１５は、例えば、指示フレーズの抽出の履歴を参照して、直近に受け付けられた指示フレーズ、抽出回数が多い指示フレーズ等を抽出してもよい。

ステップＳ１７において、生成部１６は、ステップＳ１５またはステップＳ１６においてフレーズ抽出部１５により抽出された指示フレーズに基づいて、デバイスを制御するための発話文を生成する。

ステップＳ１８において、提示部１７は、生成部１６により生成された発話文をユーザに対して提示する。具体的には、提示部１７は、発話文を示すテキスト情報をユーザの端末５０に送信し、発話文を示すテキストを端末５０のディスプレイに表示させる。

次に、コンピュータを、本実施形態の対話装置１０として機能させるための対話プログラムについて説明する。図１１は、対話プログラムＰ１の構成を示す図である。

対話プログラムＰ１は、対話装置１０における対話処理を統括的に制御するメインモジュールｍ１０、外部システム情報取得モジュールｍ１１、ユーザ情報取得モジュールｍ１２、デバイス抽出モジュールｍ１３、ユーザ属性取得モジュールｍ１４、フレーズ抽出モジュールｍ１５、生成モジュールｍ１６、提示モジュールｍ１７、発話受付モジュールｍ１８及び制御指示送信モジュールｍ１９を含む。外部システム情報取得モジュールｍ１１は、設定情報取得モジュールｍ１１Ａ及びデバイス状態取得モジュールｍ１１Ｂを含む。

そして、各モジュールｍ１１～ｍ１９，ｍ１１Ａ，ｍ１１Ｂにより、対話装置１０における外部システム情報取得部１１、ユーザ情報取得部１２、デバイス抽出部１３、ユーザ属性取得部１４、フレーズ抽出部１５、生成部１６、提示部１７、発話受付部１８及び制御指示送信部１９並びに設定情報取得部１１Ａ及びデバイス状態取得部１１Ｂのための各機能が実現される。なお、対話プログラムＰ１は、通信回線等の伝送媒体を介して伝送される態様であってもよいし、図１１に示されるように、記録媒体Ｍ１に記憶される態様であってもよい。

以上説明した本実施形態の対話装置１０では、デバイスの動作状態が取得され、取得されたデバイスの動作状態に関連付けられた指示フレーズに基づいて発話文が生成されるので、デバイスの動作状態に応じた好適な発話文をユーザに提示できる。ユーザは、提示された発話文を発話することにより、デバイスの動作状態に応じて適切な制御を実施できるので、利便性の向上が図られる。また、ユーザに対して提示される発話文が、デバイス状態情報に基づいて限定されることとなるので、発話文の提示にかかる処理負荷及び通信量が削減される。

また、本実施形態の対話装置１０では、ユーザ発話の発話元のユーザの、デバイスの制御状態に関する好みを示す属性情報が取得され、当該ユーザの好みに関連付けられた指示フレーズが抽出されるので、ユーザにとって好適なデバイスの制御が実施される可能性が高い発話文を提示できる。このように提示された発話文をユーザが発話することにより、ユーザが好む動作状態にデバイスが制御されるので、利便性の向上が図られる。また、ユーザに対して提示される発話文が、ユーザの属性情報に基づいて限定されることとなるので、発話文の提示にかかる処理負荷及び通信量が削減される。

また、別の形態に係る対話装置では、デバイスの動作状態を示すデバイス状態情報を取得するデバイス状態取得部、をさらに備え、語彙情報は、指示フレーズにデバイスの動作状態をさらに関連付けており、フレーズ抽出部は、語彙情報を参照して、デバイス状態情報に示されるデバイスの動作状態及び属性情報により示されるユーザの好みの制御状態に関連付けられている一以上の指示フレーズを抽出することとしてもよい。

上記形態によれば、ユーザの属性情報に加えてデバイスの動作状態が取得され、属性情報に示されるユーザの好み及びデバイスの動作状態に関連付けられた指示フレーズに基づいて発話文が生成されるので、好適な発話文をユーザに提示できる。

また、別の形態に係る対話装置では、デバイス状態情報は、デバイスが動作中または非動作中であることを示す情報を含み、フレーズ抽出部は、デバイスが動作中である場合には、デバイスを非動作状態に制御するための指示フレーズを抽出し、デバイスが非動作中である場合には、デバイスを動作状態に制御するための指示フレーズを抽出することとしてもよい。

上記形態によれば、デバイスが動作中である場合にデバイスを非動作状態に制御するための発話文がユーザに提示され、デバイスが非動作中である場合にデバイスを動作状態に制御するための発話文がユーザに提示される。即ち、デバイスの現在の動作状態とは異なる動作状態に制御するための発話文がユーザに提示される。従って、対象のデバイスに対して、ユーザが所望する可能性が高い制御を実現するための発話文を提示することが可能となる。

また、別の形態に係る対話装置では、デバイス状態情報は、デバイスの動作に関する所定のパラメータを含み、フレーズ抽出部は、デバイス状態情報に含まれるパラメータが第１の範囲に含まれる場合には、デバイスのパラメータを、第１の範囲とは異なる第２の範囲に制御するための指示フレーズを抽出することとしてもよい。

上記形態によれば、デバイスの動作に関する所定のパラメータが第１の範囲に含まれる場合には、当該パラメータを第２の範囲に制御するための発話文がユーザに提示される。即ち、現在のパラメータ値とは異なるパラメータ値によりデバイスを制御するための発話文がユーザに提示される。従って、対象のデバイスに対して、ユーザが所望する可能性が高い制御を実現するための発話文を提示することが可能となる。

また、別の形態に係る対話装置では、各デバイスと、当該デバイスのニックネームとを関連付けている設定情報を取得する設定情報取得部、をさらに備え、生成部は、フレーズ抽出部により抽出された指示フレーズ及び指示フレーズの制御対象のデバイスのニックネームに基づいて、発話文を生成することとしてもよい。

上記形態によれば、制御対象のデバイスに対して設定されたニックネームを含む発話文が生成される。これにより、ユーザにとって、提示された発話文における制御対象のデバイスの認識が容易となる。

また、別の形態に係る対話装置では、提示部は、発話文を示すテキストをユーザの端末に表示させることとしてもよい。

上記形態によれば、生成された発話文を示すテキストがユーザの端末において提示されるので、ユーザはその発話文を発することができる。

また、別の形態に係る対話装置では、提示部は、発話文を示すテキストが関連付けられ指示操作可能な操作オブジェクトをユーザの端末に表示させ、対話装置は、ユーザの端末において操作オブジェクトが操作された場合に、テキストの内容の音声からなるユーザ発話を受け付けた場合と同様のデバイスの制御情報を生成することとしてもよい。

上記形態によれば、生成された発話文を示すテキストが関連付けられた操作オブジェクトがユーザ端末において表示され、その操作オブジェクトが操作されることにより、当該発話文の内容が音声により発せられた場合と同様の制御情報が生成されるので、ユーザは所望する制御の指示を容易に実施できる。

以上、本実施形態について詳細に説明したが、当業者にとっては、本実施形態が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本実施形態は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本実施形態に対して何ら制限的な意味を有するものではない。

本開示で説明した各態様／実施形態は、ＬＴＥ（Long Term Evolution）、ＬＴＥ－Ａ（LTE-Advanced）、ＳＵＰＥＲ３Ｇ、ＩＭＴ－Ａｄｖａｎｃｅｄ、４Ｇ、５Ｇ、ＦＲＡ（Future Radio Access）、Ｗ－ＣＤＭＡ（登録商標）、ＧＳＭ（登録商標）、ＣＤＭＡ２０００、ＵＭＢ（Ultra Mobile Broadband）、ＩＥＥＥ８０２．１１（Ｗｉ－Ｆｉ）、ＩＥＥＥ８０２．１６（ＷｉＭＡＸ）、ＩＥＥＥ８０２．２０、ＵＷＢ（Ultra-WideBand）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、その他の適切なシステムを利用するシステム及び／又はこれらに基づいて拡張された次世代システムに適用されてもよい。

本開示で説明した各態様／実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。

情報等は、上位レイヤ(または下位レイヤ)から下位レイヤ(または上位レイヤ)へ出力され得る。複数のネットワークノードを介して入出力されてもよい。

入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルで管理してもよい。入出力される情報等は、上書き、更新、または追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。

判定は、１ビットで表される値（０か１か）によって行われてもよいし、真偽値（Boolean：trueまたはfalse）によって行われてもよいし、数値の比較（例えば、所定の値との比較）によって行われてもよい。

本開示で説明した各態様／実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知（例えば、「Ｘであること」の通知）は、明示的に行うものに限られず、暗黙的（例えば、当該所定の情報の通知を行わない）ことによって行われてもよい。

ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。

また、ソフトウェア、命令などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア及びデジタル加入者回線（ＤＳＬ）などの有線技術及び／又は赤外線、無線及びマイクロ波などの無線技術を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び／又は無線技術は、伝送媒体の定義内に含まれる。

本開示で説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。

なお、本開示で説明した用語及び／又は本明細書の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。

本開示で使用する「システム」および「ネットワーク」という用語は、互換的に使用される。

また、本開示で説明した情報、パラメータなどは、絶対値で表されてもよいし、所定の値からの相対値で表されてもよいし、対応する別の情報で表されてもよい。

本開示で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up、search、inquiry)（例えば、テーブル、データベース又は別のデータ構造での探索）、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)（例えば、情報を受信すること）、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)（例えば、メモリ中のデータにアクセスすること）した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。また、「判断（決定）」は、「想定する（assuming）」、「期待する（expecting）」、「みなす（considering）」などで読み替えられてもよい。

本開示で使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。

本開示で「第１の」、「第２の」などの呼称を使用した場合においては、その要素へのいかなる参照も、それらの要素の量または順序を全般的に限定するものではない。これらの呼称は、２つ以上の要素間を区別する便利な方法として本明細書で使用され得る。したがって、第１および第２の要素への参照は、２つの要素のみがそこで採用され得ること、または何らかの形で第１の要素が第２の要素に先行しなければならないことを意味しない。

「含む（include）」、「含んでいる（including）」、およびそれらの変形が、本明細書あるいは特許請求の範囲で使用されている限り、これら用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本明細書あるいは特許請求の範囲において使用されている用語「または（or）」は、排他的論理和ではないことが意図される。

本開示において、文脈または技術的に明らかに1つのみしか存在しない装置である場合以外は、複数の装置をも含むものとする。

本開示の全体において、文脈から明らかに単数を示したものではなければ、複数のものを含むものとする。

１…対話システム、１０…対話装置、１１…外部システム情報取得部、１１Ａ…設定情報取得部、１１Ｂ…デバイス状態取得部、１２…ユーザ情報取得部、１３…デバイス抽出部、１４…ユーザ属性取得部、１５…フレーズ抽出部、１６…生成部、１７…提示部、１８…発話受付部、１９…制御指示送信部、２０…語彙情報記憶部、２１…ユーザ属性記憶部、３０…外部システム、３１…設定情報記憶部、３２…デバイス状態管理部、５０…端末、Ｍ１…記録媒体、ｍ１０…メインモジュール、ｍ１１…外部システム情報取得モジュール、ｍ１１Ａ…設定情報取得モジュール、ｍ１１Ｂ…デバイス状態取得モジュール、ｍ１２…ユーザ情報取得モジュール、ｍ１３…デバイス抽出モジュール、ｍ１４…ユーザ属性取得モジュール、ｍ１５…フレーズ抽出モジュール、ｍ１６…生成モジュール、ｍ１７…提示モジュール、ｍ１８…発話受付モジュール、ｍ１９…制御指示送信モジュール、Ｐ１…対話プログラム。

Claims

デバイスを制御する制御情報を生成するための、音声またはテキストからなるユーザ発話を受け付ける対話装置であって、
前記デバイスの動作状態を示すデバイス状態情報を取得するデバイス状態取得部と、
前記デバイスの制御指示を表し少なくとも一以上の語句または文を含む指示フレーズと、当該デバイスの動作状態と、を関連付けている語彙情報を参照して、前記デバイス状態情報に示されるデバイスの動作状態に関連付けられている一以上の指示フレーズを抽出するフレーズ抽出部と、
前記フレーズ抽出部により抽出された前記指示フレーズに基づいて、前記デバイスを制御するための発話文を生成する生成部と、
前記生成部により生成された前記発話文を前記ユーザに対して提示する提示部と、を備え、
前記デバイス状態情報は、前記デバイスの動作に関する所定のパラメータを含み、
前記フレーズ抽出部は、前記デバイス状態情報に含まれる前記パラメータが第１の範囲に含まれる場合には、前記デバイスのパラメータを、前記第１の範囲とは異なる第２の範囲に制御するための指示フレーズを抽出する、
対話装置。
デバイスを制御する制御情報を生成するための、音声またはテキストからなるユーザ発話を受け付ける対話装置であって、
前記ユーザ発話の発話元のユーザを識別するユーザ識別情報を取得するユーザ情報取得部と、
前記ユーザ情報取得部により取得されたユーザ識別情報により識別されるユーザの属性情報であって、前記デバイスの制御状態に関するユーザの好みを示す情報を含む、属性情報を取得するユーザ属性取得部と、
前記デバイスの動作状態を示すデバイス状態情報を取得するデバイス状態取得部と、
前記デバイスの制御指示を表し少なくとも一以上の語句または文を含む指示フレーズと、当該デバイスに関するユーザの好みの制御状態と、を関連付けている語彙情報を参照して、前記属性情報により示される前記ユーザの好みの制御状態に関連付けられている一以上の指示フレーズを抽出するフレーズ抽出部と、
前記フレーズ抽出部により抽出された前記指示フレーズに基づいて、前記デバイスを制御するための発話文を生成する生成部と、
前記生成部により生成された前記発話文を前記ユーザに対して提示する提示部と、を備え、
前記語彙情報は、前記指示フレーズに前記デバイスの動作状態をさらに関連付けており、
前記フレーズ抽出部は、前記語彙情報を参照して、前記デバイス状態情報に示されるデバイスの動作状態及び前記属性情報により示される前記ユーザの好みの制御状態に関連付けられている一以上の前記指示フレーズを抽出し、
前記デバイス状態情報は、前記デバイスの動作に関する所定のパラメータを含み、
前記フレーズ抽出部は、前記デバイス状態情報に含まれる前記パラメータが第１の範囲に含まれる場合には、前記デバイスのパラメータを、前記第１の範囲とは異なる第２の範囲に制御するための指示フレーズを抽出する、
対話装置。