JP6929960B2

JP6929960B2 - 情報処理装置及び情報処理方法

Info

Publication number: JP6929960B2
Application number: JP2019555315A
Authority: JP
Inventors: 公亮角野; 優樹斉藤; 陽平大野; 雄一朗瀬川
Original assignee: NTT Docomo Inc
Current assignee: NTT Docomo Inc
Priority date: 2017-11-24
Filing date: 2018-11-20
Publication date: 2021-09-01
Anticipated expiration: 2038-11-20
Also published as: WO2019103007A1; US11755652B2; US20210248189A1; JPWO2019103007A1

Description

本発明は、音声に応じた処理を行うための技術に関する。

近年の音声認識技術の向上に伴い、ユーザが発話して音声で指示を行うと、その指示に従って各種の処理を行うというサービスが普及している。例えば特許文献１には、フロントエンド装置が、連携先システムへの音声データの入力と並行して、キー入力やマウスによるキーワードの入力を受け付け、音声データに含まれるキーワードを特定する仕組みが開示されている。

国際公開第ＷＯ０８／１５０００３号

このようにユーザが音声によって所望の処理を指示する場合において、特にこの種のサービスに慣れてないユーザにとってはどのようにして音声で指示を行えばよいかを分からず、戸惑うことがある。一方、音声による指示に応じた処理を行う対話処理装置側においては、そのようなユーザに対する案内を逐一用意することが負担になることが予想される。そこで、本発明は、対話処理装置の利用に関する案内を簡便に生成してユーザに提示することを目的とする。

上記課題を解決するため、本発明は、ユーザ端末に入力された発話に応じた入力データと、当該入力データに応じた処理を行う１以上の対話処理装置からの応答データを取得する取得部と、取得された前記入力データ及び前記応答データに基づいて、当該対話処理装置の利用に関してユーザに案内する案内情報を生成する生成部と、前記生成部によって生成された案内情報を前記ユーザ端末に出力する出力部とを備える情報処理装置を提供する。

前記生成部は、前記入力データと当該入力データに応答する前記応答データとをそれぞれ類型化した結果に基づいて、前記案内情報を生成するようにしてもよい。

前記生成部は、前記入力データに応答する前記応答データ群のうち、エラーに関する応答データに基づいて、前記案内情報を生成するようにしてもよい。

前記生成部は、エラーに関する応答データと所定の類似関係があり且つエラーに関する応答データがない入力データに基づいて前記案内情報を生成するようにしてもよい。

前記生成部は、エラーに関する応答データが出力される前記入力データのうち、当該エラーに関する応答データが閾値以上である場合に、当該エラーに関する応答データに基づいて前記案内情報を生成するようにしてもよい。

前記生成部は、前記入力データと当該入力データに応答する前記応答データとの組を１回の対話回数としたときに、前記ユーザ端末に発話が入力されてから前記対話処理装置が処理を行うまでの対話回数に基づいて、前記案内情報を生成するようにしてもよい。

前記生成部は、前記ユーザ端末を使用するユーザ又は当該ユーザが属するグループ単位で前記案内情報を生成し、前記出力部は、前記ユーザ端末を使用するユーザ又は当該ユーザが属するグループに応じた案内情報を当該ユーザ端末に出力するようにしてもよい。

前記出力部は、前記案内情報の内容に応じて当該案内情報を表示するか又は音声出力するかを指定して、当該案内情報を前記ユーザ端末に出力するようにしてもよい。

前記出力部は、前記案内情報を出力する必要があるか否かを判断し、前記案内情報を出力する必要がある場合には、当該案内情報を前記ユーザ端末に出力するようにしてもよい。

また、本発明は、ユーザ端末に入力された発話に応じた入力データと、当該入力データに応じた処理を行う１以上の対話処理装置からの応答データを取得するステップと、取得された前記入力データ及び前記応答データに基づいて、当該対話処理装置の利用に関してユーザに案内する案内情報を生成するステップと、前記生成された案内情報を前記ユーザ端末に出力するステップとを含む情報処理方法を提供する。

本発明によれば、対話処理装置の利用に関する案内を簡便に生成してユーザに提示することができる。

本発明の一実施形態にかかる対話処理システムの全体構成を示す図である。同実施形態にかかる中継装置のハードウェア構成を示す図である。同中継装置の機能構成を示す図である。同中継装置の処理を示すフローチャートである。同中継装置の処理を示すフローチャートである。

１・・・中継装置、１０１・・・制御部、１０２・・・通信部、１０３・・・記憶部、１１・・・取得部、１２・・・生成部、１３・・・出力部、２・・・ユーザ端末、３ａ，３ｂ・・・対話処理装置、４・・・通信網。

［構成］
図１は、本発明の一実施形態に係る対話処理システムの全体構成を示すブロック図である。この対話処理システムは、本発明に係る情報処理装置の一形態である中継装置１と、発話者であるユーザが利用するユーザ端末２と、ユーザが発話した音声を認識してその認識結果に応じた処理（以下、対話処理機能という）を行う対話処理装置３ａ，３ｂと、これら中継装置１、ユーザ端末２及び対話処理装置３ａ，３ｂを通信可能に接続する通信網４とを備えている。ユーザ端末２は例えばスマートホンやタブレット等の携帯可能なコンピュータであってもよいし、ユーザの自宅等に設置された据え置き型のコンピュータであってもよい。通信網４は移動通信網又は固定通信網を含んでおり、例えばユーザ端末２は無線で移動通信網に接続可能である。対話処理装置３ａ，３ｂは図では２つある場合を例示しているが、この例に限らず、１以上であればよい。また、ユーザ端末２は１つに限らず、複数であってもよい。なお、以下において、対話処理装置３ａ，３ｂを総称するときは、対話処理装置３という。

対話処理装置３ａ，３ｂは、それぞれ異なる事業者によって運営管理されるコンピュータである。例えば、対話処理装置３ａは、ユーザがピザの宅配を音声で指示することが可能な装置であり、対話処理装置３ｂは、ユーザが日用品や雑貨の注文を音声で指示することが可能な装置である。それぞれの対話処理装置３ａ，３ｂにおいては、ユーザが音声で指示を入力するときの規則（以下、入力規則という）が決まっている。例えば対話処理装置３ａにおいては、宅配可能なピザの名称が決まっているし、対話処理装置３ｂにおいては、注文可能な日用品の商品名が決まっているから、これらのピザの名称や商品名を正しく発話して対話処理装置３ａ，３ｂに入力する、ということが、ここでの入力規則に相当する。

中継装置１は、ユーザ端末２と対話処理装置３ａ，３ｂとの間のデータ授受を中継する、いわゆるプラットフォームとして機能するコンピュータである。中継装置１は、これらユーザ端末２と対話処理装置３ａ，３ｂとの間のデータの入出力に基づいて、これら対話処理装置３ａ，３ｂの利用に関してユーザに案内する案内情報を生成してユーザに提示する。この案内情報はそれぞれの対話処理装置３ａ，３ｂに対する入力規則に従うものとなるから、案内情報の内容は対話処理装置３ａ，３ｂごとに異なる。

図２は、中継装置１のハードウェア構成を示すブロック図である。中継装置１は、制御部１０１と、通信部１０２と、記憶部１０３とを備えている。制御部１０１は、ＣＰＵ（Central Processing Unit）などの演算装置と、ＲＯＭ（Read Only Memory）及びＲＡＭ（Random Access Memory）などの記憶装置とを備えている。ＣＰＵは、ＲＡＭをワークエリアとして用いてＲＯＭや記憶部１０３に記憶されたプログラムを実行することによって、中継装置１の各部の動作を制御する。

通信部１０２は、有線及び／又は無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア（送受信デバイス）であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。通信部１０２は、通信網４に接続されている。

記憶部１０３は、コンピュータ読み取り可能な記録媒体であり、例えば、ＣＤ−ＲＯＭ（Compact Disc ＲＯＭ）などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク（例えば、コンパクトディスク、デジタル多用途ディスク、Ｂｌｕ−ｒａｙ（登録商標）ディスク）、スマートカード、フラッシュメモリ（例えば、カード、スティック、キードライブ）、フロッピー（登録商標）ディスク、磁気ストリップなどの少なくとも１つで構成されてもよい。記憶部１０３は、補助記憶装置と呼ばれてもよい。記憶部１０３は、制御部１０１が用いるデータ群やプログラム群を記憶している。

図３は、中継装置１の機能構成を示すブロック図である。図３において、取得部１１及び出力部１３は主に中継装置１の通信部１０２によって実現され、生成部１２は主に中継装置１の制御部１０１及び記憶部１０３によって実現される。

ユーザ端末２にはマイクが実装されており、このマイクによりユーザが発話した音声が収音され、その発話に応じた入力データが生成されて通信網４を介して中継装置１に送信される。この入力データは、ユーザ端末２において、発話された音声を示す音声データが文字を示すテキストデータに変換されたデータであってもよいし、発話された音声を示す音声データそのもの（或いはユーザ端末２において音声データに対して何らかの音声処理が施されたデータ）であってもよい。中継装置１の取得部１１は、このようにしてユーザ端末２に入力された入力データを通信網４経由で取得する一方、この入力データに応答する対話処理装置３からの応答データを通信網４経由で取得する。この応答データは、上述した入力データと同様に、テキストデータであってもよいし、音声データであってもよい。

生成部１２は、取得された入力データ及び応答データに基づいて、対話処理装置の利用に関してユーザに案内する案内情報を生成する。具体的には、生成部１２は、入力データと当該入力データに応答する応答データとをそれぞれ類型化した結果に基づいて案内情報を生成する。ここでいう類型化とは、音声による指示に応じた処理或いはその指示によって実現される機能がどのような種類のものであるかという観点でタイプ分けすることであり、例えば「注文タイプ」、「情報提供タイプ」、「家電制御タイプ」等があるが、詳しくは後述する。

出力部１３は、生成部１２によって生成された案内情報をユーザ端末２に出力する。また、出力部１３は、対話処理装置３に対する入力データを対話処理装置３に出力する。ここで、前述したように入力データが音声データからテキストデータに変換されたデータである場合、出力部１３は、対話処理装置３に対する入力データをテキストデータに変換し、変換後のテキストデータを対話処理装置３に出力する。また、出力部１３は、対話処理装置３からの応答データを通信網４経由でユーザ端末２に出力する。この応答データはテキストデータであってもよいし音声データであってもよい。ユーザ端末２にはスピーカが実装されており、このスピーカから案内情報又は応答データに応じた音声が放音される。

［動作］
次に、図４、５を参照して本実施形態の動作を説明する。まず、中継装置１による案内情報の生成動作について説明する。ユーザが対話処理機能を起動するために予め決められたキーワードを発話すると、ユーザ端末２がこの発話を収音して対話処理機能が起動される。次に、ユーザは、いずれかの対話処理装置３を指定して処理を指示する発話を行う。中継装置１の取得部１１は、ユーザ端末２に入力された発話に応じた入力データを通信網４経由で取得して記憶する。出力部１３は、この入力データを通信網４経由で対話処理装置３に出力する（ステップＳ１）。これに応じて、対話処理装置３から応答データが送信されてくるので、取得部１１は、対話処理装置３から送信されてくる応答データを通信網４経由で取得して記憶する。出力部１３は、この応答データを通信網４経由でユーザ端末２に出力する（ステップＳ２）。生成部１２は、上記ステップＳ１，Ｓ２において記憶された入力データ及び応答データに基づいて、対話処理装置３の利用に関してユーザに案内する案内情報を生成する（ステップＳ３）。

ここで案内情報の一例について説明する。前述したように、入力データおよび応答データの類型化には、例えば注文タイプ、情報提供タイプ、家電制御タイプ等がある。まず、注文タイプについては、例えばユーザの発話音声（以下、ユーザ発話という）が「ＸＸピザください」であり、対話処理装置３からの発話音声の応答データ（以下、装置発話という）が「注文を受け付けました」であったとする。このとき、生成部１２は、これらの遣り取りについて、例えば形態素解析、構文解析、意味解析、文脈解析等を含む自然言語解析を行って、ユーザが商品又はサービスの注文を行うと対話処理装置３がその注文を受け付けて処理するという、注文タイプであると判断する。この場合の案内情報としては、「この対処処理機能では○○を注文できます」とか、「この対処処理機能では○○をお買いものできます」といったフォーマットに基づいた案内情報が考えられる。ここで、「○○」には、上記の自然言語解析で特定した商品又はサービスのカテゴリ名（例えばピザ）という単語が入る。

次に、情報提供タイプについては、例えばユーザ発話が「いま何時？」であり、これに応答する装置発話が「３時２６分です」であった場合、生成部１２は、これらの遣り取りについて自然言語解析を行って、ユーザ発話が疑問文又は情報提供を求める命令文であり、これに対して装置発話が回答を返すという、情報提供タイプであると判断する。この場合の案内情報としては、「この対処処理機能ではあなたの質問に答えてくれます」といったフォーマットに基づいた案内情報が考えられる。

より具体的には、例えばユーザ発話が「今日のおすすめは？」であり、装置発話が「○○ピザです。」であった場合、生成部１２は、これらの遣り取りについて自然言語解析を行って、対話処理装置３がユーザに対してリコメンドすることが可能な情報提供タイプであると判断する。この場合の案内情報としては、「この対処処理機能ではおすすめの○○を教えてくれます」といったフォーマットに基づいた案内情報が考えられる。ここで、「○○」には、上記の自然言語解析で特定した商品又はサービスのカテゴリ名（例えばピザ）という単語が入る。

さらに、ユーザ発話が「〇〇について教えて」であり、装置発話が「〇〇について調べました」であった場合、つまり「教えて」といったユーザ発話に対して装置発話により回答を行っている場合には、生成部１２は、これらの遣り取りについて自然言語解析を行って、対話処理装置３が情報検索可能な情報提供タイプであると判断する。この場合の案内情報としては、「この対話処理機能では△△（あなたの知りたいこと）について教えて”というと、答えを返してくれます」といったフォーマットに基づいた案内情報が考えられる。

次に、家電制御タイプについては、例えばユーザ発話が「トイレの電気つけて」であり、装置発話が「電気をつけました」であった場合、生成部１２は、これらの遣り取りについて自然言語解析を行って、ユーザ発話が制御の指示に相当し、装置発話がその指示に対する完了の回答に相当するという、家電制御タイプであると判断する。この場合の案内情報としては、「この対話処理機能では○○を制御できます」といったフォーマットに基づいた案内情報が考えられる。ここで、「○○」には、上記の自然言語解析で特定した制御対象の名称やそのカテゴリ名（例えば電灯や家電）という単語が入る。

中継装置１の取得部１１が入力データ及び応答データを取得するたびに、上記の案内情報の生成乃至更新に関する処理が実行される。その結果、生成乃至更新された案内情報が対話処理装置３の識別情報及びユーザ端末２の識別情報と対応付けて生成部１２に記憶される。

次に、中継装置１による案内情報の提供動作について説明する。ユーザが対話処理機能を起動するために予め決められたキーワードを発話すると、ユーザ端末２がこの発話を収音して対話処理機能が起動される。次に、ユーザは、いずれかの対話処理装置３を指定する。この指定は例えば「ピザの宅配」とか「日用品の通販」といった音声での指定であったり、ユーザ端末２に表示された対話処理装置３からのリストからの選択操作であったりする。中継装置１の取得部１１は、ユーザ端末２において指定された対話処理装置３の識別情報を取得する。これに応じて、出力部１３は指定された対話処理装置３に対応する案内情報を出力する必要があるか否かを判断する（ステップＳ１１）。ここで、出力部１３は、その対話処理装置３についての案内情報が生成部１２に記憶されていなかったり、ユーザが閾値以上の回数だけその対話処理装置３を利用したことがある場合には、案内情報を出力する必要がないと判断するし、案内情報が生成部１２に記憶されているとかユーザが閾値未満の回数しか対話処理装置３を利用したことがない場合には、案内情報を出力する必要があると判断する。

出力部１３は、案内情報を出力する必要があれば（ステップＳ１１；ＹＥＳ）、案内情報を生成部１２から読み出して（ステップＳ１２）、通信網４経由でユーザ端末２に出力する（ステップＳ１３）。ユーザ端末２のスピーカからこの案内情報に応じた音声が放音される。ユーザはこの案内情報を聞くことで、対話処理装置３の使い方を知ることができる。

以上説明した実施形態によれば、対話処理装置３の利用に関する案内を簡便に生成してユーザに提示することができる。

［変形例］
上述した実施形態は次のような変形が可能である。また、以下の変形例を互いに組み合わせて実施してもよい。
［変形例１］
案内情報を生成する方法は実施形態の例に限定されない。例えば生成部１２は、ユーザの入力データに応答する応答データ群のうち、エラーに関する応答データに基づいて、案内情報を生成するようにしてもよい。具体的には、ユーザの入力データを対話処理装置３が認識することができなかったり、その入力データに対応する処理が存在しなかったりするような場合に、対話処理装置３は、例えば「もう一度言ってください」、「よくわかりませんでした」、「理解できませんでした」等の、ユーザにより指定された処理ができないことを意味するエラー応答を行う。このような場合、生成部１２は、エラー応答が出力される直前のユーザの入力データを対話処理装置３毎に収集しておく。そして、生成部１２は、エラー応答が出力される直前のユーザの入力データを列挙した後で、「これらの音声入力にはこの対話処理装置は対応していません」というようなメッセージを含む案内情報を生成する。この場合、生成部１２は、エラー応答が出力されるユーザの入力データのうち、エラー応答が頻出するもの（閾値以上のエラー応答が出力される場合）に限定して案内情報を生成してもよい。

また、生成部１２は、エラー応答が出力されるユーザの入力データ（例：プルコギ）と類似するものであって且つエラー応答が出力されないユーザの入力データ（例：プルコギピザ）を抽出し、「“プルコギピザ”を注文したいときは“プルコギ”ではなく“プルコギピザ”と言ってください」というような、前者を後者に言い換えて発話することを促す案内情報を生成するようにしてもよい。つまり、生成部１２は、エラーに関する応答と所定の類似関係があり且つエラーに関する応答データが応答されない入力データに基づいて案内情報を生成する。

また、エラー応答が出力されるユーザの入力データに応じてユーザの意図しない処理が選択される場合がある。この場合は、ユーザは発話を中止するという行動をとるので、生成部１２はそのことを記録しておく。例えば、対話処理装置３が装置発話「現在地周辺のレストラン１２０件を調べました。予算で絞込み可能です」を出力した後に、ユーザが「費用は３０００円」と発話しても絞り込み検索が行われないようになっているがユーザ「３０００円」と発話すると絞り込み検索が行われるような場合には、このような発話に関する注意事項（例えば「絞込み条件となる予算額のみを発話してください」）を含む案内情報を生成する。

実施形態において、生成部１２は案内情報を生成する場合に、その案内情報を提供するユーザ（第１のユーザ）の発話履歴に基づいて案内情報を生成していたが、これに限らず、生成部１２は、その案内情報を提供するユーザ（第１のユーザ）以外のユーザ（第２のユーザ）の発話履歴に基づいて案内情報を生成してもよい。例えば、第２のユーザのユーザ発話が「ＸＸピザください」であり、対話処理装置３からの発話音声の装置発話が「注文を受け付けました」であった場合、生成部１２は、これらの遣り取りについて、例えば形態素解析、構文解析、意味解析、文脈解析等を含む自然言語解析を行って、ユーザが商品又はサービスの注文を行うと対話処理装置３がその注文を受け付けて処理するという、注文タイプであると判断する。この場合において、上記第２のユーザではない第１のユーザに対する案内情報としては、「この対処処理機能では○○を注文できます」とか、「この対処処理機能では○○をお買いものできます」といったフォーマットに基づいた案内情報が考えられる。注文タイプに限らず、情報提供タイプや家電制御タイプ等のその他のケースにおいても同様である。このように、他のユーザの発話に応じた入力データとそれに応答する応答データの組を用いて案内情報を生成してもよい場合には、そのような生成方法を用いてもよい。

［変形例２］
生成部１２は、入力データと当該入力データに応答する応答データとの組を１回の対話回数としたときに、ユーザ端末２に入力データが入力されてから対話処理装置３が処理を行うまでの対話回数に基づいて案内情報を生成するようにしてもよい。具体的には、生成部１２は、ユーザ端末２に入力データが入力されてから各対話処理装置３について処理完了までの対話回数を記録しておき、それを案内情報として提供する。例えば生成部１２は、商品特定（ピザ名特定）→オプション特定（ピザ以外のサブメニュー特定）→お届け先入力→決済情報入力→確認、といった対話の流れにおいて対話回数を記録しておき、その対話回数を案内する案内情報を生成する。お届け先や決済情報が既に登録されている場合には、そのときの対話回数も記録しておき、その対話回数を案内する案内情報を生成するようにしてもよい。

［変形例３］
案内情報の生成は、ユーザ又はユーザグループ単位の生成であってもよい。ここでいうユーザグループとは、例えばオフィスの組織や家族といったグループである。この場合、ユーザ端末２は自装置の識別情報及び自装置のユーザが属するユーザグループの識別情報を伴ってデータ通信を行う。この場合、生成部１２は、ユーザ端末２を使用するユーザ単位又は当該ユーザが属するグループ単位で案内情報を生成し、出力部１３は、ユーザ端末２を使用するユーザ又は当該ユーザが属するグループに応じた案内情報を当該ユーザ端末２に出力する。

［変形例４］
出力部１３は、案内情報の内容に応じて当該案内情報を表示するか又は音声出力するかを指定して、当該案内情報をユーザ端末２に出力するようにしてもよい。出力部１３は、例えば案内情報の情報量が多い場合や、画像で示したほうが分かりやすい場合には、その案内情報を表示するよう指定してユーザ端末２に出力する。一方、出力部１３は、例えばユーザ端末２が高速で移動中の場合（車両による移動中と推測される場合）には、その案内情報を音声出力するよう指定してユーザ端末２に出力する。

［変形例５］
案内情報の出力タイミングは図５の例に限らず、いつでもよい。出力部１３は、例えば、最初のユーザ発話及び装置発話が完了した後に案内情報を出力してもよい。

［変形例６］
生成部１２は、どの対話処理装置３が入力データの入力先となる対話処理装置３に相当するかを学習してもよい。具体的には、まず初期段階では、ユーザがいずれかの対話処理装置３を指定して所望の処理を指示する発話を行うが、このときのユーザの入力データと指定された対話処理装置３との対応関係を学習する。例えばユーザの入力データが「ミックスピザください」「チーズピザください」「ミックスチーズピザください」等のように「ピザ」という単語が含まれている場合には、対話処理装置３ａが指定されるという対応関係をユーザ端末２毎に学習する。つまり、生成部１２は、取得された入力データ及び応答データに基づいて、複数の対話処理装置３のうち、当該入力データの入力先となる対話処理装置３を学習する。このようにすれば、ユーザがこのシステムを利用していく期間が長くなるにつれて上記の学習が進み、最終的には、ユーザが対話処理装置３を指定しなくても、ユーザ発話がそのユーザの所望する対話処理装置３に届けられることになる。

［そのほかの変形例］
上記実施の形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック（構成部）は、ハードウェア及び／又はソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は特に限定されない。すなわち、各機能ブロックは、物理的及び／又は論理的に結合した１つの装置により実現されてもよいし、物理的及び／又は論理的に分離した２つ以上の装置を直接的及び／又は間接的に（例えば、有線及び／又は無線）で接続し、これら複数の装置により実現されてもよい。
例えば、中継装置１は、図３の機能の全てを一体に備えた単一装置によっても実現可能であるし、これらの機能を複数の装置に分散して備えたシステムによって実現されてもよい。
例えば対話処理装置３の機能の少なくとも一部の機能を中継装置１が備えていてもよい。また、中継装置１は、対話処理装置３とは異なる専用の対話機能（例えば対話処理装置３に対するユーザとの対話しシーケンスに移行する前段階でユーザと対話する機能）を有していてもよい。

本明細書で説明した各態様／実施形態は、ＬＴＥ（Long Term Evolution）、ＬＴＥ−Ａ（LTE-Advanced）、ＳＵＰＥＲ３Ｇ、ＩＭＴ−Ａｄｖａｎｃｅｄ、４Ｇ、５Ｇ、ＦＲＡ（Future Radio Access）、Ｗ−ＣＤＭＡ（登録商標）、ＧＳＭ（登録商標）、ＣＤＭＡ２０００、ＵＭＢ（Ultra Mobile Broadband）、ＩＥＥＥ８０２．１１（Ｗｉ−Ｆｉ）、ＩＥＥＥ８０２．１６（ＷｉＭＡＸ）、ＩＥＥＥ８０２．２０、ＵＷＢ（Ultra-WideBand）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、その他の適切なシステムを利用するシステム及び／又はこれらに基づいて拡張された次世代システムに適用されてもよい。

本明細書で説明した各態様／実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。
本明細書で説明した各態様／実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知（例えば、「Ｘであること」の通知）は、明示的に行うものに限られず、暗黙的（例えば、当該所定の情報の通知を行わない）ことによって行われてもよい。

本明細書で使用する「システム」及び「ネットワーク」という用語は、互換的に使用される。

本明細書で使用する「判定（determining）」、「決定（determining）」という用語は、多種多様な動作を包含する場合がある。「判定」、「決定」は、例えば、判定（judging）、計算（calculating）、算出（computing）、処理（processing）、導出（deriving）、調査（investigating）、探索（looking up）（例えば、テーブル、データベース又は別のデータ構造での探索）、確認（ascertaining）した事を「判定」「決定」したとみなす事などを含み得る。また、「判定」、「決定」は、受信（receiving）（例えば、情報を受信すること）、送信（transmitting）（例えば、情報を送信すること）、入力（input）、出力（output）、アクセス（accessing）（例えば、メモリ中のデータにアクセスすること）した事を「判定」「決定」したとみなす事などを含み得る。また、「判定」、「決定」は、解決（resolving）、選択（selecting）、選定（choosing）、確立（establishing）、比較（comparing）などした事を「判定」「決定」したとみなす事を含み得る。つまり、「判定」「決定」は、何らかの動作を「判定」「決定」したとみなす事を含み得る。

本発明は、情報処理装置である中継装置１が行う情報処理方法や、コンピュータを情報処理装置である中継装置１として機能させるためのプログラムといった形態でも実施が可能である。かかるプログラムは、光ディスク等の記録媒体に記録した形態で提供されたり、インターネット等のネットワークを介して、コンピュータにダウンロードさせ、これをインストールして利用可能にするなどの形態で提供されたりすることが可能である。

以上、本発明について詳細に説明したが、当業者にとっては、本発明が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本発明は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本発明に対して何ら制限的な意味を有するものではない。

Claims

ユーザ端末に入力された発話に応じた入力データと、当該入力データに応じた処理を行う１以上の対話処理装置からの応答データを取得する取得部と、
前記入力データと、前記入力データに応答する前記応答データとをそれぞれ類型化した結果に基づいて、当該対話処理装置の利用に関してユーザに案内する案内情報を生成する生成部と、
前記生成部によって生成された案内情報を前記ユーザ端末に出力する出力部と
を備えることを特徴とする情報処理装置。
前記生成部は、前記ユーザ端末を使用するユーザ又は当該ユーザが属するグループ単位で前記案内情報を生成し、
前記出力部は、前記ユーザ端末を使用するユーザ又は当該ユーザが属するグループに応じた案内情報を当該ユーザ端末に出力する
ことを特徴とする請求項１に記載の情報処理装置。
前記出力部は、前記案内情報の内容に応じて当該案内情報を表示するか又は音声出力するかを指定して、当該案内情報を前記ユーザ端末に出力する
ことを特徴とする請求項１または２に記載の情報処理装置。
前記出力部は、前記案内情報を出力する必要があるか否かを判断し、前記案内情報を出力する必要がある場合には、当該案内情報を前記ユーザ端末に出力する
ことを特徴とする請求項１〜３のいずれか１項に記載の情報処理装置。
ユーザ端末に入力された発話に応じた入力データと、当該入力データに応じた処理を行う１以上の対話処理装置からの応答データを取得するステップと、
前記入力データと、前記入力データに応答する前記応答データとをそれぞれ類型化した結果に基づいて、当該対話処理装置の利用に関してユーザに案内する案内情報を生成するステップと、
前記生成された案内情報を前記ユーザ端末に出力するステップと
を含む情報処理方法。