JP2019050554A

JP2019050554A - 音声サービスを提供するための方法および装置

Info

Publication number: JP2019050554A
Application number: JP2018128465A
Authority: JP
Inventors: ジェンリャンチョウ; Jianliang Zhou; グアンハオシェン; Guanghao Shen; ルイシァンウー; Ruisheng Wu
Original assignee: Baidu Online Network Technology Beijing Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd
Priority date: 2017-07-05
Filing date: 2018-07-05
Publication date: 2019-03-28
Anticipated expiration: 2038-07-05
Also published as: US11360737B2; JP6582100B2; CN107342083A; CN107342083B; US20190012138A1

Abstract

【課題】音声サービスの効率を改善するため方法および装置を提供する。【解決手段】デバイスによって送信された要求情報を受信するステップを含む。要求情報は、デバイスが要求情報を送信するときに発生する第１のイベントを示すためのものである第１のイベント情報および音声情報を含む。第１のイベント情報は、ユーザに音声情報の入力を示す音声入力イベント情報を含む。第１のイベント情報及び音声情報に基づいて上記デバイスの操作指示を含む応答情報を生成し、操作コマンドが示す操作は、対象となるデバイスに対して実行される。【選択図】図２

Description

本願は、コンピュータ技術の分野、特に人工知能の分野に関し、特に、音声サービスを提供するための方法および装置に関する。

コンピュータ技術の発展とネットワークデータの継続的な蓄積により、人工知能技術は急速に発展している。人工知能の分野では、音声認識、自然言語処理および機械学習技術を統合した知能音声サービスがますます広く用いられている。

しかし、既存の音声サービス方法は、効率が低いという問題がある。

本願の目的は、音声サービスを提供するための改善された方法および装置を提案して、背景技術の項で述べた技術的問題を解決することにある。

第一の局面として、本願の実施形態は、音声サービスを提供するための方法を提供する。上記方法は、デバイスによって送信された要求情報を受信するステップであって、上記要求情報は、第１のイベント情報及び音声情報を含み、上記第１のイベント情報は、上記要求情報を送信するとき上記デバイスに発生される第１のイベントを示すためのものであり、上記第１のイベント情報は、ユーザに音声情報の入力を示す音声入力イベント情報を含む、ステップと、上記第１のイベント情報と上記音声情報とに基づいて、操作コマンドを含む、上記デバイスを対象とする応答情報を生成するステップと、対象となるデバイスが上記操作コマンドによって指示される操作を実行するように、対象となるデバイスに上記応答情報を送信するステップと、を含む。

一部の実施形態において、上記デバイスによって送信された要求情報を受信するステップの前に、上記方法は、デバイスにより送信された応答チャネルの構築要求を受信するステップであって、上記応答チャネルの構築要求は、応答情報を端末デバイスに返すチャネルの構築を要求するとともに、構築された上記応答チャネルを接続状態に維持するために用いられる、ステップと、デバイスにより送信された第２のイベント情報及び第２の状態情報を受信するステップであって、上記第２のイベント情報は、上記応答チャネルの構築要求を送信するときデバイスに発生される上記第２のイベントを示すためのものであり、上記第２の状態情報は、上記第２のイベントの状態を示すためのものである、ステップと、をさらに含む。

一部の実施形態において、デバイスによって送信された要求情報を受信するステップの前に、上記方法は、デバイスによって送信された機能インターフェースのリストを受信するステップであって、上記機能インターフェースのリストは、音声入力インターフェース、音声出力インターフェース、スピーカ制御インターフェース、音声プレイ制御インターフェース、アラームインターフェース、および画面表示インターフェースのうちの少なくとも１つの操作インターフェースの識別子を含む、ステップと、機能インターフェースのリストを記憶するデバイスと、機能インターフェースのリストを送信するデバイスのデバイス識別子とを対応付ける、ステップと、をさらに含む。

一部の実施形態において、上記第１のイベント情報と上記音声情報とに基づいて、操作コマンドを含む、上記デバイスを対象とする応答情報を生成するステップの前に、上記方法は、デバイスによって送信された状態レポートメッセージを受信するステップであって、上記状態レポートメッセージは第３のイベント情報と第３の状態情報とを含み、上記第３のイベント情報は、デバイスが状態レポートメッセージを送信するときに発生される第３のイベントを示すためのものであり、上記第３の状態情報は、第３のイベントの状態を示すためのものである、ステップと、をさらに含む。

一部の実施形態において、上記要求情報は、上記第１のイベントの状態を示すための第１の状態情報をさらに含み、上記第１のイベント情報と上記音声情報とに基づいて、操作コマンドを含む、上記デバイスを対象とする応答情報を生成するステップは、音声情報を分析して、対象となるデバイスを決定するステップと、上記第１のイベント情報、上記第２のイベント情報及び上記第３のイベント情報のうちの少なくとも１つに基づいて、上記対象となるデバイスの現在のイベント情報及び上記現在のイベント情報に対応する現在の状態情報を決定するステップと、対象となるデバイスの現在のイベント情報、現在の状態情報、機能インターフェースのリストおよび上記音声情報に基づいて、上記応答情報を生成する、ステップと、をさらに含む。

一部の実施形態において、上記応答情報は、再生待ち音声情報をさらに含み、上記操作コマンドは、上記再生待ち音声情報を再生する音声再生コマンドを含み、対象となるデバイスが操作コマンドによって指示される操作を実行するように、対象となるデバイスに上記応答情報を送信するステップは、対象となるデバイスが音声再生コマンドに従って音声出力インターフェースを呼び出して、再生待ち音声情報を再生するように、上記再生待ち音声情報及び上記音声再生コマンドを対象となるデバイスに送信する、ステップを含む。

一部の実施形態において、上記応答情報は、表示待ちビュー情報をさらに含み、上記操作コマンドは、上記表示待ちビューをレンダリングするためのビューレンダリングコマンドをさらに含み、ビュー情報は、画像、ウェブページ及びビデオのうちの少なくとも１つを含み、対象となるデバイスが操作コマンドによって指示される操作を実行するように、対象となるデバイスに上記応答情報を送信するステップは、対象となるデバイスが上記表示待ちビュー情報と上記ビューレンダリングコマンドとに従って、画面表示インターフェースを呼び出して、上記表示待ちビュー情報をレンダリングして表示するように、上記表示待ちビュー情報と上記ビューレンダリングコマンドとを対象となるデバイスに送信する、ステップをさらに含む。

第二の局面として、本願の実施形態は、音声サービスを提供するための装置を提供する。上記装置は、デバイスによって送信された要求情報を受信する第１の受信部であって、上記要求情報は、第１のイベント情報及び音声情報を含み、上記第１のイベント情報は、上記要求情報を送信するとき上記デバイスに発生される第１のイベントを示すためのものであり、上記第１のイベント情報は、ユーザに音声情報の入力を示す音声入力イベント情報を含む、第１の受信部と、上記第１のイベント情報と上記音声情報とに基づいて、操作コマンドを含む、上記デバイスを対象とする応答情報を生成する生成部と、対象となるデバイスが操作コマンドによって指示される操作を実行するように、対象となるデバイスに上記応答情報を送信する送信部と、を含む。

一部の実施形態において、上記装置は、デバイスにより送信された応答チャネルの構築要求を受信する第２の受信部であって、上記応答チャネルの構築要求は、応答情報を端末デバイスに返すチャネルの構築を要求するとともに、構築された上記応答チャネルを接続状態に維持するために用いられる、第２の受信部と、デバイスにより送信された第２のイベント情報及び第２の状態情報を受信する第３の受信部であって、上記第２のイベント情報は、上記応答チャネルの構築要求を送信するときデバイスに発生される上記第２のイベントを示すためのものであり、上記第２の状態情報は、上記第２のイベントの状態を示すためのものである、第３の受信部と、をさらに含む。

一部の実施形態において、上記装置は、デバイスによって送信された機能インターフェースのリストを受信する第４の受信部であって、上記機能インターフェースのリストは、音声入力インターフェース、音声出力インターフェース、スピーカ制御インターフェース、音声プレイ制御インターフェース、アラームインターフェース、および画面表示インターフェースのうちの少なくとも１つの操作インターフェースの識別子を含む、第４の受信部と、機能インターフェースのリストを記憶するデバイスと、機能インターフェースのリストを送信するデバイスのデバイス識別子とを対応付ける、記憶部と、をさらに含む。

一部の実施形態において、上記装置は、デバイスによって送信された状態レポートメッセージを受信する第５の受信部であって、上記状態レポートメッセージは第３のイベント情報と第３の状態情報とを含み、上記第３のイベント情報は、デバイスが状態レポートメッセージを送信するときに発生される第３のイベントを示すためのものであり、上記第３の状態情報は、第３のイベントの状態を示すためのものである、第５の受信部、をさらに含む。

一部の実施形態において、上記装置は、上記要求情報は、上記第１のイベントの状態を示すための第１の状態情報をさらに含み、上記生成部は、音声情報を分析して、対象となるデバイスを決定する装置と、上記第１のイベント情報、上記第２のイベント情報及び上記第３のイベント情報のうちの少なくとも１つに基づいて、上記対象となるデバイスの現在のイベント情報及び上記現在のイベント情報に対応する現在の状態情報を決定する装置と、対象となるデバイスの現在のイベント情報、現在の状態情報、機能インターフェースのリストおよび上記音声情報に基づいて、上記応答情報を生成する、装置と、をさらに含む。

一部の実施形態において、上記応答情報は、再生待ち音声情報をさらに含み、上記操作コマンドは、上記再生待ち音声情報を再生する音声再生コマンドを含み、上記送信部は、対象となるデバイスが音声再生コマンドに従って音声出力インターフェースを呼び出して、再生待ち音声情報を再生するように、上記再生待ち音声情報及び上記音声再生コマンドを対象となるデバイスに送信する。

一部の実施形態において、上記応答情報は、表示待ちビュー情報をさらに含み、上記操作コマンドは、上記表示待ちビューをレンダリングするためのビューレンダリングコマンドをさらに含み、ビュー情報は、画像、ウェブページ及びビデオのうちの少なくとも１つを含み、上記送信部は、対象となるデバイスが上記表示待ちビュー情報と上記ビューレンダリングコマンドとに従って、画面表示インターフェースを呼び出して、上記表示待ちビュー情報をレンダリングして表示するように、上記表示待ちビュー情報と上記ビューレンダリングコマンドとを対象となるデバイスに送信する。

第三の局面として、本願の実施形態は、１つまたは複数のプロセッサと、１つまたは複数のプログラムを記憶する記憶装置と、１つまたは複数のプログラムが１つまたは複数のプロセッサによって実行されると、１つまたは複数のプロセッサが第一の局面に記載の方法を実施するようにする、サーバを提供する。

第四の局面として、本願の実施形態は、コンピュータプログラムが格納され、当該コンピュータプログラムがプロセッサによって実行されると、第一の局面に記載の方法を実施する、コンピュータ可読記憶媒体を提供する。

本願の実施形態により提供される音声サービスを提供するための方法及装置によると、サーバに音声情報を送信するとともに、第一のイベント情報を送信することにより、イベント情報に対応する機能をクイックスタートし、またはイベント情報に対応する応答情報を生成することを、サーバが容易に行うことができ、音声サービスを提供する効率を高めることができる。

本願の他の特徴、目的および利点は、以下の図面を参照して行われた非限定的な実施形態の詳細な説明を読むことにより、より明らかになる。

図１は、本願が適用される例示的なシステムアーキテクチャ図である。図２は、本願に係る音声サービスを提供するための方法の一実施形態のフローチャートである。図３は、本願に係る音声サービスを提供するための方法の応用シナリオの概略図である。図４は、本願に係る音声サービスを提供するための方法の他の実施形態を示すフローチャートである。図５は、本願に係る音声サービスを提供するための装置の一実施形態の概略構成図である。図６は、本実施形態を実現するのに適するサーバのコンピュータシステムの概略構成図である。

以下、図面及び実施形態を参照しながら本発明をより詳細に説明する。理解すべきことは、ここで説明する具体的な実施形態は、当該発明を説明するものに過ぎず、当該発明を限定するものではない。ただし、説明の便宜上、図面には発明に関連する部分のみが示されている。

なお、衝突しない場合、本実施形態及び実施形態における特徴を相互に組み合せてもよい。以下、図面及び実施形態を参照しながら本願を詳細に説明する。

図１は、本願に係る音声サービスを提供するための方法または音声サービスを提供するための装置の実施形態が適用される例示的なシステムアーキテクチャ図を示している。

図１に示すように、システムアーキテクチャ１００は、端末１０１、デバイス１０２、１０３、ネットワーク１０４、及びサーバ１０５を備えてもよい。ネットワーク１０４は、端末１０１とサーバ１０５との間に通信リンクを提供するための媒体、及びデバイス１０２、１０３とサーバ１０５との間に通信リンクを提供するための媒体として用いられる。ネットワーク１０４は、様々な接続タイプ、例えば有線、無線通信リンク又は光ファイバーケーブル等を含んでもよい。

ユーザ１１０は、端末１０１を使用してネットワーク１０４を介してサーバ１０５とインタラクションすることにより、メッセージなどを送受信することができる。端末１０１には、サーバ１０５とインタラクションできるアプリケーション、例えばウェブブラウザアプリケーション、音声サービスクライアントアプリケーションなどがインストールされてもよい。端末１０１は、ディスプレーを有する様々な電子デバイス、例えば、スマートフォン、タブレットコンピュータ、デスクトップコンピュータであってもよいが、これらに限定されない。

デバイス１０２、１０３は、ネットワーク１０４を介してサーバ１０５とインタラクションすることにより、メッセージなどを送受信することもできる。デバイス１０２、１０３は、音声入力インターフェースおよび音声出力インターフェースを有する電子デバイス、例えば、マイクロホンを備えたスピーカであってもよい。

サーバ１０５は、様々なサービスを提供するサーバ、例えば端末１０１に表示されたウェブページコンテンツをサポートし、デバイス１０２、１０３が行う音声出力操作を制御する音声サーバであってもよい。音声サーバは、デバイス１０２、１０３への音声サービス操作のために、ユーザ１１０が端末１０１を介して送信した要求を処理し、デバイス１０２、１０３に処理結果（例えば、音声データおよび音声出力インターフェースの制御コマンド）を送信する。デバイス１０２、１０３は、ネットワーク１０４を介して、サーバ１０５によって送信された音声データおよび制御コマンドを受信して、対応する操作を実行することにより、デバイス１０２、１０３が音声サーバ１０５により提供された音声サービスにアクセスすることを実現する。

なお、本実施形態に係る音声サービスを提供するための方法は一般的にサーバ１０５により実行され、これに応じて、音声サービスを提供するための装置は一般的にサーバ１０５に設置される。

理解すべきことは、図１における端末、デバイス、ネットワーク及びサーバの数は例示的なものに過ぎない。必要に応じて、端末装置、ネットワーク及びサーバの数を任意に加減してもよい。たとえば、サーバは、異なるプロセスでデプロイされた複数のサーバを含む、クラスター化されたサーバであってもよい。

続いて、図２を参照すると、図２には、本願に係る音声サービスを提供するための方法の一実施形態のフローチャート２００が示されている。上記音声サービスを提供するための方法は、以下のステップを含む。

ステップ２０１において、デバイスにより送信された要求情報を受信する。

本実施形態では、音声サービスを提供する方法が実行される電子デバイス（例えば、図１に示すサーバ）は、デバイスによって送信された要求情報を受信することができる。

本実施形態では、要求情報は、第１のイベント情報および音声情報を含んでもよい。ここで、第１のイベント情報は、上記要求情報を送信するときにデバイスに発生される第１のイベントを送信するために用いられる。

本実施形態では、第１のイベント情報は、音声入力イベント情報を含み、音声入力イベント情報は、ユーザが音声情報を入力したイベントを示すためのものである。

説明すべきことは、デバイスのイベント情報は、デバイスおよびサーバによって事前に合意されたことでもよい。デバイスが実現できる機能は、複数の機能タイプに分かれる。各機能タイプは、一種のイベントタイプに対応される。デバイスによってサーバに送信されたイベント情報は、サーバがイベント情報に従って、オープンすべき機能を迅速に位置決めを行い、イベント情報に対応する操作コマンドを生成するようにする。

例えば、サーバは、音声入力イベント情報を受信したことに応答して、音声認識機能をオープンすることができる。サーバは、ボリューム変更イベントを受信したことに応答して、ボリューム調整操作コマンドを生成するように位置決めを行うことができる。

本実施形態の一部の実現形態では、上記要求情報は、第１の状態情報をさらに含み、第１の状態情報は、第１のイベントの状態を示すためのものである。

一例として、イベントの進捗状況を分類し、そのイベントの可能な存在状態を示す状態情報を予め設定することができる。

本実施形態の一部の実現形態では、デバイスが実現可能な機能に対して機能インターフェースを設定し、機能インターフェースに対して機能インターフェースに対応する操作コマンドを設定し、対応する操作コマンドを利用して機能インターフェースを呼び出して操作を実行することができる。

説明すべきことは、異なるデバイスが実現できる機能は相違するかもしれないので、異なるデバイスの機能インターフェースは異なる可能性がある。

本実施形態の一部の実現形態では、デバイスがサーバとの通信接続を構築した後、デバイスはサーバに機能インターフェースリストを送信することができる。サーバは、機能インターフェースリストと、機能インターフェースリストを送信したデバイスのデバイス識別子とを対応付けて格納することができる。

本実施形態の一部の実現形態では、機能インターフェースのリストは、音声入力インターフェース、音声出力インターフェース、スピーカ制御インターフェース、音声プレイ制御インターフェース、アラームインターフェース、および画面表示インターフェースのうちの少なくとも１つの操作インターフェースの識別子を含むことができる。

本実施形態の一部の実現形態では、デバイスの機能タイプに従って、当該機能タイプに対応するイベント情報、状態情報、コマンド情報、および機能インターフェース情報をパッケージングしてもよい。各機能タイプのパッケージング結果を１つのインストールパッケージとする。デバイスは、このインストールパッケージをインストールすることだけで、サーバと通信でき、サーバに音声サービスを要求することができる。

一例として、デバイスは、サーバによって送信されたコマンドをインストールパッケージ内のコマンド情報と比較し、対応する機能インターフェースを呼び出すことができる。

本実施形態の一部の実現形態では、インストールパッケージには、メッセージフォーマット及びメッセージ転送プロトコルを定義してもよい。メッセージフォーマット及びメッセージ転送プロトコルもサーバと予め合意されたものであってもよい。

一例として、イベントタイプは、音声入力タイプ、音声出力タイプ、スピーカ制御タイプ、音声再生タイプ、再生制御タイプ、アラームタイプなどを含んでもよい。音声入力機能、音声出力機能、スピーカ制御機能、音声再生機能、再生制御機能、アラーム機能などにそれぞれ対応している。

一例として、各イベントタイプは、複数の具体的イベント情報を含んでもよい。音声入力タイプは、音声入力イベント情報を含んでもよい。音声出力タイプは、音声放送開始イベント情報及び音声放送終了イベント情報を含んでもよい。スピーカ制御タイプは、音量変更イベント情報およびミュートスイッチイベント情報を含んでもよい。音声再生タイプは、音声再生開始イベント情報、音声再生終了イベント情報、音声再生終了直前イベント情報、音声再生エラーイベント情報、及び音声再生停止イベント情報を含んでもよい。放送制御タイプは、「再生」ボタンクリックイベント情報、「ポーズ」ボタンクリックイベント情報、「前の曲」ボタンクリックイベント情報、「次の曲」ボタンクリックイベントなどを含んでもよい。アラームの種類は、アラーム設定成功イベント情報、アラーム設定失敗イベント情報、アラーム削除成功イベント情報、アラーム削除失敗イベント情報、アラーム開始イベント情報、アラーム完成イベント情報、及びアラーム停止イベント情報を含むことができる。

一例として、音声出力の種類のイベント情報に対応する状態情報は、放送中情報であってもよいし、放送終了情報であってもよい。スピーカ制御タイプのイベント情報に対応する状態情報は、ミュート有無情報であってもよいし、音量値情報であってもよい。音声再生種別のイベント情報に対応する状態情報は、再生中情報、再生停止情報、再生完了情報であってもよい。アラームタイプのイベント情報に対応する状態情報は、現在のアラーム数情報、現在のアラームイベント情報などであってもよい。

ステップ２０２において、第１のイベント情報および音声情報に基づいて、操作コマンドを含む、デバイスを対象とする応答情報を生成する。

本実施形態では、音声サービスを提供する方法が実行される電子デバイス（例えば、図１に示すサーバ）は、第１のイベント情報と音声情報とに基づいて、操作コマンドを含む、デバイスを対象とする応答情報を生成する。

本実施形態において、サーバは、音声入力イベント情報を受信して、音声認識機能をオープンすることができる。そして、音声認識機能により上記音声情報に対して解析して、ユーザの意図を識別し、対応する応答情報を生成する。説明すべきことは、音声情報を解析してユーザの意図を分析する方法は、当業者ならば従来技術によって実施され得るので、ここでは説明しない。

本実施形態の一部の実施形態では、対象となるデバイスは、要求情報を送信するデバイスであってもよく、また、他のデバイスであってもよい。例として、ユーザが携帯電話で音声メッセージとして「ステレオをオンにする」を入力する場合、音声メッセージによって対象となるデバイスは、携帯電話とバインディング関係を有するステレオである。

ステップ２０３において、対象となるデバイスに応答情報を送信する。

本実施形態では、音声サービスを提供する方法が実行される電子デバイス（例えば、図１に示すサーバ）は、対象となるデバイスに応答情報を送信することができる。ここで、対象となるデバイスは、上記操作コマンドに示される操作を行うことができる。

本実施形態の一部の実施形態では、応答情報は、再生待ち音声情報をさらに含み、上記操作コマンドは、上記再生待ち音声情報を再生する音声再生コマンドを含む。従って、ステップ２０３は、対象となるデバイスが音声再生コマンドに従って音声出力インターフェースを呼び出して、再生待ち音声情報を再生するように、再生待ち音声情報及び上記音声再生コマンドを、対象となるデバイスに送信する、ことを含んでもよい。

本実施形態の一部の実施形態において、応答情報は、表示待ちビュー情報をさらに含み、操作コマンドは、表示待ちビューをレンダリングする(描く)ためのビューレンダリングコマンドをさらに含み、ビュー情報は、画像、ウェブページ及びビデオのうちの少なくとも１つを含む。したがって、ステップ２０３は、対象となるデバイスが表示待ちビュー情報とビューレンダリングコマンドとに従って、画面表示インターフェースを呼び出して、表示待ちビュー情報をレンダリングして表示するように、表示待ちビュー情報とビューレンダリングコマンドとを、対象となるデバイスに送信する、ステップをさらに含んでもよい。

次に、図３を参照すると、図３には、本実施形態に係る音声サービスを提供するための方法の適用シナリオの概略図である。図３の適用シナリオでは、図３に示すように、あるシナリオにおいて、ユーザＣがデバイスＡで操作することにより、音声サービスをオープンする。デバイスＡは、ユーザの操作の検出に応答して、ステップ３０１において音声サーバＢに要求情報を送信し、デバイスＡのために対象音声サービスを提供することを要求する。ここで、要求情報は、第１のイベント情報及び音声情報を含み、上記第１のイベント情報は、上記要求情報を送信するときデバイスに発生される第１のイベントを示すためのものであり、上記第１のイベント情報は、ユーザに音声情報の入力を示す音声入力イベント情報を含む。音声サーバＢは、ステップ３０２において、要求情報を処理して、操作コマンドを含む、上記デバイスを対象とする応答情報を生成し、ステップ３０３において、操作コマンドによって指示される操作をデバイスＡが実行するように、デバイスＡに上記応答情報を送信する。

本願の上記実施形態の方法によると、サーバに音声情報を送信するとともに、第一のイベント情報を送信することにより、サーバは、イベント情報に対応する機能をクイックスタートし、またはイベント情報に対応する応答情報を生成することができ、音声サービスを提供する効率を高める。

次に、図４を参照する。図４には、音声サービスを提供するための方法の別の実施形態のフローチャート４００が示されている。音声サービス方法を提供するためのプロセス４００は、以下のステップを含む。

ステップ４０１において、デバイスによって送信された応答チャネルの構築要求を受信する。
本実施形態では、音声サービスの提供方法が実行される電子デバイス（例えば、図１に示すサーバ）は、デバイスから送信された応答チャンネル構築要求を受信することができる。ここで、応答チャネルの構築要求は、応答情報を端末デバイスに返すチャネルの構築を要求するとともに、構築された応答チャネルを接続状態に維持するために用いられる。

本実施形態の一部の実施形態では、ステップ４０１は、デバイスとサービスとが物理的接続を構築する、ことを含んでもよい。物理的接続内にデータフローを作成し、接続要求を送信する。このデータフローは、サーバがメッセージをデバイスに送信するためのチャネルとしてのダウンリンクメッセージチャネルである。デバイス側がイベント情報を報告する必要がある場合、物理接続内に新しいデータフローを作成して、要求イベントの報告要求を送信し、要求または応答が終了した後にデータフローを閉じる。所定時間毎に、新しいストリームを作成し、接続維持要求を送信することができ、この要求は、サーバとデバイスとを接続することを要求するデバイスの要求である。

ステップ４０２において、デバイスによって送信された第２のイベント情報および第２の状態情報を受信する。

本実施形態では、音声サービスの提供方法が実行される電子デバイス（例えば、図１に示すサーバ）は、デバイスによって送信された第２のイベント情報および第２の状態情報を受信することができる。ここで、第２のイベント情報は、応答チャネルの構築要求を送信するときにデバイスに発生される第２のイベントを示すためのものであり、第２の状態情報は、第２のイベントの状態を示すためのものである。

本実施形態において、上記サーバは、デバイスによって送信された機能インターフェースのリストを受信することができる。ここで、上記機能インターフェースのリストは、音声入力インターフェース、音声出力インターフェース、スピーカ制御インターフェース、音声プレイ制御インターフェース、アラームインターフェース、および画面表示インターフェースのうちの少なくとも１つの操作インターフェースの識別子を含み、機能インターフェースのリストを記憶するデバイスと、機能インターフェースのリストを送信するデバイスのデバイス識別子とを対応付ける。

ステップ４０３において、デバイスによって送信された要求情報を受信する。

本実施態様の一部の実施形態において、電子デバイスは、デバイスによって送信された状態レポートメッセージを受信することができ、状態レポートメッセージは第３のイベント情報と第３の状態情報とを含み、第３のイベント情報は、デバイスが状態レポートメッセージを送信するときに発生される第３のイベントを示すためのものであり、第３の状態情報は、第３のイベントの状態を示すためのものである。

本実施形態の一部の実現形態では、デバイスによって送信される要求情報は、デバイス識別子、アクセストークンなどを含んでもよい。アクセストークンは、サーバ事前にデバイスに送信したアクセス許可クレデンシャルである。

ステップ４０４において、音声情報を解析して、対象となるデバイスを決定する。

本実施形態では、音声サービスを提供する方法が実行される電子デバイス（例えば、図１に示されるサーバ）は、音声情報を解析して、対象となるデバイスを決定することができる。

ステップ４０５において、第一のイベント情報、第２のイベント情報、及び第三のイベント情報の少なくとも一項に基づいて、対象となるデバイスの現在のイベント情報と、現在のイベント情報に対応する現在の状態情報とを決定する。

本実施形態において、音声サービスを提供する方法が実行される電子デバイス（例えば、図１に示されるサーバ）は、第一のイベント情報、第２のイベント情報、及び第三のイベント情報の少なくとも一項に基づいて、対象となるデバイスの現在のイベント情報と、現在のイベント情報に対応する現在の状態情報とを決定することができる。

ここで、第１のイベント、第２のイベント及び第３のイベントの発生順序により、最終に発生したイベントを、対象となるデバイスの現在イベントとする。

ステップ４０６において、対象となるデバイスの現在のイベント情報、現在の状態情報、機能インターフェースのリストおよび上記音声情報に基づいて、上記応答情報を生成する。

本実施形態では、音声サービスを提供する方法が実行される電子デバイス（例えば、図１に示されるサーバ）は、対象となるデバイスの現在のイベント情報、現在の状態情報、機能インターフェースのリストおよび上記音声情報に基づいて、上記応答情報を生成することができる。

一例として、ユーザの音声情報が「ステレオの音を増やす」であれば、ステレオからサーバに送信された複数のボリューム変更イベントと音量値変更状態とから、現在のステレオの音量値を決定して、ステレオのスピーカ制御インターフェースを呼び出して音量値を調整する操作コマンドを生成する。

説明すべきことは、デバイス側の機能インターフェースリストにより、デバイス側が有する機能を正確に知ることができる。現在のイベント情報、現在の状態情報にもとづいて、音声サービスにより生成可能な操作コマンドとデバイス側の現在の発生イベントとのコンフリクトによる音声サービスの応答遅れを回避することができる。

ステップ４０７において、対象となるデバイスに応答情報を送信する。

本実施形態では、音声サービスを提供する方法が実行される電子デバイス（例えば、図１に示されるサーバ）は、操作コマンドによって指示される操作を対象となるデバイスが実行するように、対象となるデバイスに応答情報を送信する。

図４から分かるように、図２に対応する実施形態と比較して、本実施形態に係る音声サービスを提供する方法プロセス４００は、対象となるデバイスを決定するステップと、対象となるデバイスの現在のイベント情報及び状態情報に基づいて応答情報を生成するステップとをアウトスタンディングした。これにより、本実施形態によると、音声サービスの精度およびインタラクティブ効率を改善することができる。

次に、図５を参照すると、図５に示すように、上述した各図に示された方法の実現として、本願は、音声サービスを提供するための装置の実施形態を提供する。当該装置は、図２に示された実施形態と対応し、様々な電子デバイスに具体的に適用される。

図５に示すように、本実施形態に係る音声サービスを提供するための装置５００は、第１の受信部５０１と、生成部５０２と、送信部５０３とを備える。ここで、第１の受信部５０１はデバイスによって送信された要求情報を受信し、上記要求情報は第１のイベント情報及び音声情報を含み、上記第１のイベント情報は、上記要求情報を送信するとき上記デバイスに発生される第１のイベントを示すためのものであり、第１のイベント情報は、ユーザに音声情報の入力を示す音声入力イベント情報を含み、生成部５０２は、上記第１のイベント情報と上記音声情報とに基づいて、操作コマンドを含む、上記デバイスを対象とする応答情報を生成し、送信部５０３は、対象となるデバイスが操作コマンドによって指示される操作を実行するように、対象となるデバイスに上記応答情報を送信する。

本実施形態では、第１の受信部５０１は、生成部５０２、および送信処理部５０３の具体的処理及び特定の技術的効果は、それぞれ、図２のステップ２０１、２０２および２０３の関連する説明を参照することができ、ここでその詳細を省略する。

本実施形態の一部の実施形態では、デバイスにより送信された応答チャネルの構築要求を受信する第２の受信部であって、上記装置５００は、上記応答チャネルの構築要求は、応答情報を端末デバイスに返すチャネルの構築を要求するとともに、構築された上記応答チャネルを接続状態に維持するために用いられる、第２の受信部（図示せず）と、デバイスにより送信された第２のイベント情報及び第２の状態情報を受信する第３の受信部であって、上記第２のイベント情報は、上記応答チャネルの構築要求を送信するときデバイスに発生される上記第２のイベントを示すためのものであり、上記第２の状態情報は、上記第２のイベントの状態を示すためのものである、第３の受信部（図示せず）と、をさらに含む。

本実施態様の幾つかの実施方法では、上記装置５００は、デバイスによって送信された機能インターフェースのリストを受信する第４の受信部であって、上記機能インターフェースのリストは、音声入力インターフェース、音声出力インターフェース、スピーカ制御インターフェース、音声プレイ制御インターフェース、アラームインターフェース、および画面表示インターフェースのうちの少なくとも１つの操作インターフェースの識別子を含む、第４の受信部（図示せず）と、機能インターフェースのリストを記憶するデバイスと、機能インターフェースのリストを送信するデバイスのデバイス識別子とを対応付ける、記憶部（図示せず）と、をさらに含む。

本実施形態の一部の実施形態では、上記装置５００は、デバイスによって送信された状態レポートメッセージを受信する第５の受信部であって、上記状態レポートメッセージは第３のイベント情報と第３の状態情報とを含み、上記第３のイベント情報は、デバイスが状態レポートメッセージを送信するときに発生される第３のイベントを示すためのものであり、上記第３の状態情報は、第３のイベントの状態を示すためのものである、第５の受信部（図示せず）をさらに含む。

本実施形態の一部の実施形態では、上記要求情報は、上記第１のイベントの状態を示すための第１の状態情報をさらに含み、上記生成部５０２は、音声情報を分析して、対象となるデバイスを決定するデバイスと、上記第１のイベント情報、上記第２のイベント情報及び上記第３のイベント情報のうちの少なくとも１つに基づいて、上記対象となるデバイスの現在のイベント情報及び上記現在のイベント情報に対応する現在の状態情報を決定するデバイスと、対象となるデバイスの現在のイベント情報、現在の状態情報、機能インターフェースのリストおよび上記音声情報に基づいて、上記応答情報を生成する、デバイスと、をさらに含む。

本実施形態の一部の実施形態では、上記応答情報は、再生待ち音声情報をさらに含み、上記操作コマンドは、上記再生待ち音声情報を再生する音声再生コマンドを含み、上記送信部５０３は、対象となるデバイスが音声再生コマンドに従って音声出力インターフェースを呼び出して、再生待ち音声情報を再生するように、上記再生待ち音声情報及び上記音声再生コマンドを対象となるデバイスに送信する。

本実施形態の一部の実施形態では、上記応答情報は、表示待ちビュー情報をさらに含み、上記操作コマンドは、上記表示待ちビューをレンダリングするためのビューレンダリングコマンドをさらに含み、ビュー情報は、画像、ウェブページ及びビデオのうちの少なくとも１つを含み、上記送信部５０３は、対象となるデバイスが上記表示待ちビュー情報と上記ビューレンダリングコマンドとに従って、画面表示インターフェースを呼び出して、上記表示待ちビュー情報をレンダリングして表示するように、上記表示待ちビュー情報と上記ビューレンダリングコマンドとを対象となるデバイスに送信する。

なお、本実施形態において、音声サービスを提供するための装置における各部の実現される具体的処理及び技術的効果は、他の実施形態の説明を参照することができ、ここでその詳細を省略する

以下、本発明の実施形態を実現するためのサーバに適用されるコンピュータシステム６００を示す構造模式図である図６を参照する。

図６に示すように、コンピュータシステム６００は、読み出し専用メモリ（ＲＯＭ）６０２に記憶されているプログラム又は記憶部６０８からランダムアクセスメモリ（ＲＡＭ）６０３にロードされたプログラムに基づいて様々な適当な動作および処理を実行することができる中央処理装置（ＣＰＵ）６０１を備える。ＲＡＭ６０３には、システム６００の操作に必要な様々なプログラムおよびデータがさらに記憶されている。ＣＰＵ６０１、ＲＯＭ６０２およびＲＡＭ６０３は、バス６０４を介して互いに接続されている。入力／出力（Ｉ／Ｏ）インターフェース６０５もバス６０４に接続されている。

キーボード、マウスなどを含む入力部６０６、陰極線管（ＣＲＴ）、液晶ディスプレイ（ＬＣＤ）など、およびスピーカなどを含む出力部６０７、ハードディスクなどを含む記憶部６０８、およびＬＡＮカード、モデムなどを含むネットワークインターフェースカードの通信部６０９は、Ｉ／Ｏインターフェース６０５に接続されている。通信部６０９は、例えばインターネットのようなネットワークを介して通信処理を実行する。ドライバ６１０は、必要に応じてＩ／Ｏインターフェース６０５に接続される。リムーバブルメディア６１１は、例えば、マグネチックディスク、光ディスク、光磁気ディスク、半導体メモリなどのようなものであり、必要に応じてドライバ６１０に取り付けられ、したがって、ドライバ６１０から読み出されたコンピュータプログラムが必要に応じて記憶部６０８にインストールされる。

特に、本発明の実施形態によれば、上記のフローチャートを参照しながら記載されたプロセスは、コンピュータのソフトウェアプログラムとして実現されてもよい。例えば、本発明の実施形態は、コンピュータプログラム製品を含み、当該コンピュータプログラム製品は、機械可読媒体に有形に具現化されるコンピュータプログラムを含み、上記コンピュータプログラムは、フローチャートで示される方法を実行するためのプログラムコードを含む。このような実施形態では、当該コンピュータプログラムは、通信部６０９を介してネットワークからダウンロードされてインストールされてもよく、および／またはリムーバブルメディア６１１からインストールされてもよい。当該コンピュータプログラムは、中央処理ユニット（ＣＰＵ）６０１により実行される場合に、本願の方法に限定される上記機能を実行する。

なお、本願のコンピュータ読取可能な媒体は、コンピュータ読取可能な信号媒体、コンピュータ読取可能な記憶媒体、或いは上記両者の任意の組合わせであっても良い。コンピュータ読取可能な記憶媒体は、例えば電気、磁気、光、電磁気、赤外線、半導体のシステム、サーバ又は部品、或いはこれらの任意の組み合わせであっても良いが、それらに限定されない。コンピュータ読取可能な記憶媒体についてのより具体的な例は、一つ又は複数の導線を含む電気的な接続、携帯可能なコンピュータ磁気ディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読取専用メモリ（ＲＯＭ）、消去可能なプログラミング読取専用メモリ（ＥＰＲＯＭ又はフラッシュ）、光ファイバ、携帯可能なコンパクト磁気ディスク読取専用メモリ（ＣＤ−ＲＯＭ）、光学記憶素子、磁気記憶素子、或いは上記任意の適当の組み合わせを含むが、それらに限定されない。本願において、コンピュータ読取可能な記憶媒体は、プログラムを含むか記憶する任意の有形の媒体であっても良い。当該プログラムは、コマンドによりシステム、サーバ又は部品の使用を実行し、或いはそれらに組合わせて使用されても良い。本願において、コンピュータ読取可能な信号媒体は、ベースバンドに伝送され或いはキャリアの一部として伝送され、コンピュータ読取可能なプログラムコードがロードされるデータ信号を含んでも良い。このような伝送されるデータ信号は、各種類の形式を採用しても良く、電磁気信号、光信号又は上記任意の適当の組合わせを含むが、それらに限定されない。コンピュータ読取可能な信号媒体は、コンピュータ読取可能な記憶媒体以外の任意のコンピュータ読取可能な媒体であっても良い。当該コンピュータ読取可能な媒体は、コマンドによりシステム、サーバ又は部品の使用を実行し又はそれらと組合わせて使用されるプログラムを送信し、伝播し又は伝送することができる。コンピュータ読取可能な媒体に含まれるプログラムコードは、任意の適当の媒体で伝送されても良く、無線、電線、光ケーブル、ＲＦなど、或いは上記任意の適当の組み合わせを含むが、それらに限定されない。

図面におけるフローチャートおよびブロック図は、本発明の各実施形態に係るシステム、方法およびコンピュータプログラム製品により実現可能なアーキテクチャ、機能及び操作を示す。ここで、フローチャートまたはブロック図における各枠は、１つのモジュール、プログラムセグメント、またはコードの一部を代表してもよく、上記モジュール、プログラムセグメント、またはコードの一部は、規定された論理機能を達成するための１つ以上の実行可能な命令を含む。なお、いくつかの代替実施態様として、枠に示された機能は、図面に示された順番で実行されなくてもよい。例えば、連続して示された２つの枠は、関連する機能に応じて、実際にほぼ並行に実行されてもよく、逆の順番で実行されてもよい。なお、ブロック図および／またはフローチャートにおける各枠と、ブロック図および／またはフローチャートにおける枠の組合せは、規定された機能または操作を実行する、ハードウェアに基づく専用システムで実現されてもよく、あるいは、専用ハードウェアとコンピュータの命令との組合せで実行されてもよい。

本発明の実施形態に記載されたユニットまたはモジュールは、ソフトウェアで実現されてもよく、ハードウェアで実現されてもよい。記載されたユニットは、プロセッサに設定されてもよく、例えば、「第１の受信部、生成部と送信部を含むプロセッサである」として記載されてもよい。その中でも、これらのユニットまたはモジュールの名称は、ある場合において当該ユニットその自体を限定するものではなく、例えば、第１の受信部は、「デバイスによって送信された要求情報を受信するユニット」として記載されてもよい。

一方、本発明は、コンピュータ可読記憶媒体をさらに提供し、当該コンピュータ可読記憶媒体は、上記実施形態の上記装置に含まれるコンピュータ可読記憶媒体であってもよく、独立に存在して端末に組み立てられていないコンピュータ可読記憶媒体であってもよい。上記コンピュータ可読記憶媒体は、１つ以上のプログラムが記憶され、上記１つ以上のプログラムが上記装置により実行時、当該装置は、デバイスによって送信された要求情報を受信し、ここで、上記要求情報は、第１のイベント情報及び音声情報を含み、上記第１のイベント情報は、上記要求情報を送信するとき上記デバイスに発生される第１のイベントを示すためのものであり、上記第１のイベント情報は、ユーザに音声情報の入力を示す音声入力イベント情報を含む。そして、当該装置は、上記第１のイベント情報と上記音声情報とに基づいて、操作コマンドを含む、上記デバイスを対象とする応答情報を生成し、対象となるデバイスが上記操作コマンドによって指示される操作を実行するように、対象となるデバイスに上記応答情報を送信する。

以上の記載は、本発明の好ましい実施形態、および使用された技術的原理の説明に過ぎない。本発明に係る特許請求の範囲が、上記した技術的特徴の特定な組合せからなる技術案に限定されることではなく、本発明の趣旨を逸脱しない範囲で、上記の技術的特徴または同等の特徴の任意の組合せからなる他の技術案も含むべきであることを、当業者は理解すべきである。例えば、上記の特徴と、本発明に開示された類似の機能を持っている技術的特徴（これらに限定されていない）とを互いに置き換えてなる技術案が挙げられる。

Claims

音声サービスを提供するための方法であって、
前記方法は、
デバイスによって送信された要求情報を受信するステップであって、前記要求情報は、第１のイベント情報及び音声情報を含み、前記第１のイベント情報は、前記要求情報を送信するとき前記デバイスに発生される第１のイベントを示すためのものであり、前記第１のイベント情報は、ユーザに音声情報の入力を示す音声入力イベント情報を含む、ステップと、
前記第１のイベント情報と前記音声情報とに基づいて、操作コマンドを含む、前記デバイスを対象とする応答情報を生成するステップと、
対象となるデバイスが前記操作コマンドによって指示される操作を実行するように、対象となるデバイスに前記応答情報を送信するステップと、を含む、
ことを特徴とする音声サービスを提供するための方法。
前記デバイスによって送信された要求情報を受信するステップの前に、
前記方法は、
デバイスにより送信された応答チャネルの構築要求を受信するステップであって、前記応答チャネルの構築要求は、応答情報を端末デバイスに返すチャネルの構築を要求するとともに、構築された前記応答チャネルを接続状態に維持するために用いられる、ステップと、
デバイスにより送信された第２のイベント情報及び第２の状態情報を受信するステップであって、前記第２のイベント情報は、前記応答チャネルの構築要求を送信するときデバイスに発生される前記第２のイベントを示すためのものであり、前記第２の状態情報は、前記第２のイベントの状態を示すためのものである、ステップと、をさらに含む、
ことを特徴とする請求項１に記載の音声サービスを提供するための方法。
デバイスによって送信された要求情報を受信するステップの前に、
前記方法は、
デバイスによって送信された機能インターフェースのリストを受信するステップであって、前記機能インターフェースのリストは、音声入力インターフェース、音声出力インターフェース、スピーカ制御インターフェース、音声プレイ制御インターフェース、アラームインターフェース、および画面表示インターフェースのうちの少なくとも１つの操作インターフェースの識別子を含む、ステップと、
機能インターフェースのリストを記憶するデバイスと、機能インターフェースのリストを送信するデバイスのデバイス識別子とを対応付ける、ステップと、をさらに含む、
ことを特徴とする請求項２に記載の音声サービスを提供するための方法。
前記第１のイベント情報と前記音声情報とに基づいて、操作コマンドを含む、前記デバイスを対象とする応答情報を生成するステップの前に、
前記方法は、
デバイスによって送信された状態レポートメッセージを受信するステップであって、前記状態レポートメッセージは、第３のイベント情報と第３の状態情報とを含み、前記第３のイベント情報は、デバイスが状態レポートメッセージを送信するときに発生される第３のイベントを示すためのものであり、前記第３の状態情報は、第３のイベントの状態を示すためのものである、ステップと、をさらに含む、
ことを特徴とする請求項３に記載の音声サービスを提供するための方法。
前記要求情報は、前記第１のイベントの状態を示すための第１の状態情報をさらに含み、
前記第１のイベント情報と前記音声情報とに基づいて、操作コマンドを含む、前記デバイスを対象とする応答情報を生成するステップは、
音声情報を分析して、対象となるデバイスを決定するステップと、
前記第１のイベント情報、前記第２のイベント情報及び前記第３のイベント情報のうちの少なくとも１つに基づいて、前記対象となるデバイスの現在のイベント情報及び前記現在のイベント情報に対応する現在の状態情報を決定するステップと、
対象となるデバイスの現在のイベント情報、現在の状態情報、機能インターフェースのリストおよび前記音声情報に基づいて、前記応答情報を生成する、ステップと、をさらに含む、
ことを特徴とする請求項４に記載の音声サービスを提供するための方法。
前記応答情報は、再生待ち音声情報をさらに含み、
前記操作コマンドは、前記再生待ち音声情報を再生する音声再生コマンドを含み、
対象となるデバイスが前記操作コマンドによって指示される操作を実行するように、対象となるデバイスに前記応答情報を送信するステップは、
対象となるデバイスが音声再生コマンドに従って音声出力インターフェースを呼び出して、再生待ち音声情報を再生するように、前記再生待ち音声情報及び前記音声再生コマンドを対象となるデバイスに送信する、ステップを含む、
ことを特徴とする請求項１乃至請求項５のいずれかに記載の音声サービスを提供するための方法。
前記応答情報は、表示待ちビュー情報をさらに含み、
前記操作コマンドは、前記表示待ちビューをレンダリングするためのビューレンダリングコマンドをさらに含み、
ビュー情報は、画像、ウェブページ及びビデオのうちの少なくとも１つを含み、
対象となるデバイスが前記操作コマンドによって指示される操作を実行するように、対象となるデバイスに前記応答情報を送信するステップは、
対象となるデバイスが前記表示待ちビュー情報と前記ビューレンダリングコマンドとに従って、画面表示インターフェースを呼び出して、前記表示待ちビュー情報をレンダリングして表示するように、前記表示待ちビュー情報と前記ビューレンダリングコマンドとを対象となるデバイスに送信する、ステップをさらに含む、
ことを特徴とする請求項６に記載の音声サービスを提供するための方法。
音声サービスを提供するための装置であって、
前記装置は、
デバイスによって送信された要求情報を受信する第１の受信部であって、前記要求情報は、第１のイベント情報及び音声情報を含み、前記第１のイベント情報は、前記要求情報を送信するとき前記デバイスに発生される第１のイベントを示すためのものであり、前記第１のイベント情報は、ユーザに音声情報の入力を示す音声入力イベント情報を含む、第１の受信部と、
前記第１のイベント情報と前記音声情報とに基づいて、操作コマンドを含む、前記デバイスを対象とする応答情報を生成する生成部と、
対象となるデバイスが前記操作コマンドによって指示される操作を実行するように、対象となるデバイスに前記応答情報を送信する送信部と、を含む、
ことを特徴とする音声サービスを提供するための装置。
前記デバイスにより送信された応答チャネルの構築要求を受信する第２の受信部であって、前記応答チャネルの構築要求は、応答情報を端末デバイスに返すチャネルの構築を要求するとともに、構築された前記応答チャネルを接続状態に維持するために用いられる、第２の受信部と、
デバイスにより送信された第２のイベント情報及び第２の状態情報を受信する第３の受信部であって、前記第２のイベント情報は、前記応答チャネルの構築要求を送信するときデバイスに発生される前記第２のイベントを示すためのものであり、前記第２の状態情報は、前記第２のイベントの状態を示すためのものである、第３の受信部と、をさらに含む、
ことを特徴とする請求項８に記載の音声サービスを提供するためのデバイス装置。
デバイスによって送信された機能インターフェースのリストを受信する第４の受信部であって、前記機能インターフェースのリストは、音声入力インターフェース、音声出力インターフェース、スピーカ制御インターフェース、音声プレイ制御インターフェース、アラームインターフェース、および画面表示インターフェースのうちの少なくとも１つの操作インターフェースの識別子を含む、第４の受信部と、
機能インターフェースのリストを記憶するデバイスと、機能インターフェースのリストを送信するデバイスのデバイス識別子とを対応付ける、記憶部と、をさらに含む、
ことを特徴とする請求項９に記載の音声サービスを提供するための装置。
デバイスによって送信された状態レポートメッセージを受信する第５の受信部であって、前記状態レポートメッセージは、第３のイベント情報と第３の状態情報とを含み、前記第３のイベント情報は、デバイスが状態レポートメッセージを送信するときに発生される第３のイベントを示すためのものであり、前記第３の状態情報は、第３のイベントの状態を示すためのものである、第５の受信部、をさらに含む、
ことを特徴とする請求項１０に記載の音声サービスを提供するための装置。
前記要求情報は、前記第１のイベントの状態を示すための第１の状態情報をさらに含み、
前記生成部は、
音声情報を分析して、対象となるデバイスを決定する装置と、
前記第１のイベント情報、前記第２のイベント情報及び前記第３のイベント情報のうちの少なくとも１つに基づいて、前記対象となるデバイスの現在のイベント情報及び前記現在のイベント情報に対応する現在の状態情報を決定する装置と、
対象となるデバイスの現在のイベント情報、現在の状態情報、機能インターフェースのリストおよび前記音声情報に基づいて、前記応答情報を生成する、装置と、をさらに含む、
ことを特徴とする請求項１１に記載の音声サービスを提供するためのデバイス装置。
前記応答情報は、再生待ち音声情報をさらに含み、
前記操作コマンドは、前記再生待ち音声情報を再生する音声再生コマンドを含み、
前記送信部は、
対象となるデバイスが音声再生コマンドに従って音声出力インターフェースを呼び出して、再生待ち音声情報を再生するように、前記再生待ち音声情報及び前記音声再生コマンドを対象となるデバイスに送信する、
ことを特徴とする請求項８乃至請求項１２のいずれかに記載の音声サービスを提供するための装置。
前記応答情報は、表示待ちビュー情報をさらに含み、
前記操作コマンドは、前記表示待ちビューをレンダリングするためのビューレンダリングコマンドをさらに含み、
ビュー情報は、画像、ウェブページ及びビデオのうちの少なくとも１つを含み、
前記送信部は、
対象となるデバイスが前記表示待ちビュー情報と前記ビューレンダリングコマンドとに従って、画面表示インターフェースを呼び出して、前記表示待ちビュー情報をレンダリングして表示するように、前記表示待ちビュー情報と前記ビューレンダリングコマンドとを対象となるデバイスに送信する、
ことを特徴とする請求項１３に記載の音声サービスを提供するためのデバイス。
１つまたは複数のプロセッサと、
１つまたは複数のプログラムを記憶する記憶装置と、
１つまたは複数のプログラムが１つまたは複数のプロセッサによって実行されると、１つまたは複数のプロセッサが請求項１乃至請求項７のいずれかに記載の方法を実施するようにする、サーバ。
コンピュータプログラムが格納され、
当該コンピュータプログラムがプロセッサによって実行されると、請求項１乃至請求項７のいずれか一項に記載の方法を実施する、コンピュータ可読記憶媒体。
プロセッサにより実行されると、請求項１-７の何れか一つに記載の方法を実現させる、ことを特徴とするコンピュータプログラム。