以下、本技術の実施の形態について図面を参照しながら説明する。ただし、本技術は以下の実施の形態のみに限定されるものではない。なお、説明は以下の順序で行う。
<1.実施の形態>
[1−1.端末装置の構成]
[1−2.コンテンツ再生装置の構成]
[1−3.端末装置とコンテンツ再生装置間における処理]
<2.変形例>
<1.第1の実施の形態>
[1−1.端末装置の構成]
図1は本実施の形態における端末装置100の構成を示すブロック図である。端末装置100は、特許請求の範囲における第2の装置の一例である。端末装置100は、データバス101を備え、このデータバス101には、制御部102、ネットワークインターフェース103、信号処理部104、入力部105、表示部106、通信部107、記憶部108、アプリケーションプロセッサ110が接続されている。
制御部102は、例えば、CPU(Central Processing Unit)、RAM(Random Access Memory)およびROM(Read Only Memory)などから構成されている。ROMには、CPUにより読み込まれて動作されるプログラムなどが記憶されている。RAMは、CPUのワークメモリとして用いられる。CPUは、ROMに記憶されたプログラムに従い様々な処理を実行することによって、端末装置100の各部および全体の制御を行う。
ネットワークインターフェース103は、例えば、所定のプロトコルに基づいて外部基地局などとの間でデータの送受信を行うものである。通信方式は無線LAN(Local Area Network)、Wi−Fi(Wireless Fidelity)、3G回線を用いた通信など、どのような方式でもよい。ネットワークインターフェース103による通信により、端末装置100はインターネット接続、他者との通話などを行うことが可能となる。
信号処理部104は、変復調器、AD/DA変換器、音声コーデック(図示せず。)などを備えている。信号処理部104の変復調器で、送信する音声信号を変調し、あるいは受信した信号を復調する。送信する信号は、AD/DA変換器でデジタル信号に変換され、受信した信号はAD/DA変換器でアナログ信号に変換される。そして信号処理部104には、音声を出力するスピーカ111と、音声を入力するマイクロホン112とが接続されている。
入力部105は、ユーザが端末装置100に対して各種入力を行うための入力手段である。例えば、ボタン、タッチパネル、スイッチなどにより構成されている。また、入力部105は、表示部106と一体に構成されたタッチスクリーンとして構成してもよい。入力部105に対してユーザによる入力操作がなされると、その入力に対応した制御信号が生成されて制御部102に出力される。そして、制御部102によりその制御信号に対応した演算処理や制御が行われる。
表示部106は、例えば、LCD(Liquid Crystal Display)、PDP(Plasma Display Panel)、有機EL(Electro Luminescence)パネルなどにより構成された表示手段である。表示部106には、端末装置100の各種操作のメニューを表示するホーム画面、楽曲リスト、再生中の楽曲情報(アーティスト名、曲名など)、動画コンテンツ、画像コンテンツなどが表示される。
通信部107は、Bluetooth、USB接続などの方法により端末装置100との通信を行うための通信モジュールである。通信部107における通信方法としては、無線通信であるBluetooth、有線通信であるUSBによる通信などがある。Bluetooth通信を行うBluetoothモジュールは、Bluetooth方式の近距離無線通信によるデータの送受信が可能なモジュールである。Bluetoothモジュールによって、外部Bluetooth機器であるコンテンツ再生装置とのデータのやり取りが行われる。
Bluetoothモジュールは、アンテナ、信号処理部(図示せず。)などを備える。例えば外部のBluetooth機器であるコンテンツ再生装置200に音声データを送信する場合等、Bluetoothモジュールは、信号処理部によって送信する音声データに所定の信号処理を施し、その音声データを内蔵するアンテナを介してコンテンツ再生装置200に送信する。また、コンテンツ再生装置200に音声データを送信する場合等、Bluetoothモジュールは、コンテンツ再生装置から送信された音声データを内蔵するアンテナで受信し、内蔵する信号処理部104に供給する。そして、信号処理部において音声データに所定の信号処理を施すことによって音声信号を生成する。これにより、端末装置100で再生した音声データをコンテンツ再生装置200から出力すること、および、コンテンツ再生装置200で再生した音声データを端末装置100から出力することができる。
通信部107における通信方式として有線通信であるUSBを用いる場合には、USBケーブルによってコンテンツ再生装置200と端末装置100とが接続される。音声データはUSBケーブルを介して端末装置100からコンテンツ再生装置200に供給される。
よって、本実施の形態においては、端末装置100とコンテンツ再生装置200とを接続し、端末装置100が保存する楽曲データを再生し、その楽曲が音声としてコンテンツ再生装置200から出力されるようにすることもできる。
ただし、接続方法はいずれの方法であってもよい。また、Bluetooth、USB以外にも任意のデータ通信が可能な接続方法であればどのようなものを採用してもよい。また、通信方式は、端末装置100の機種、OS(Operation System)の種類などに基づいて適宜選択するとよい。
記憶部108は、例えば、HDD、フラッシュメモリなどの大容量記憶媒体から構成されており、端末装置100によって再生される楽曲などのコンテンツデータなどを保存するものである。楽曲データは、WAV(RIFF waveform Audio Format)、またはMP3(MPEG Audio Layer-3)、AAC(Advanced Audio Coding)などの方式で音声圧縮された状態で記憶部108に記憶される。また、楽曲のアーティスト名、アルバム名、曲名、総再生時間、再生時間情報などを含む楽曲情報も楽曲データのメタデータとして記憶部108に保存されている。楽曲情報は例えば、CDDB(Compact Disc Data Base)を利用することにより取得することができる。また、ユーザが任意に設定できるようにしてもよい。
音声認識部109は、例えば、CPU、ROM、RAMなどから構成され、通信部107から供給された音声データに基づいて言語認識を行い、音声信号に含まれる言葉を単語単位で認識してキーワードを抽出する。なお、音声認識の手法は種々提案されているため、音声認識部109は、いずれかの手法を利用して音声認識処理を行うとよい。
音声認識の手法としては、例えば、学習用データから音声の特徴を蓄積し、その特徴と供給された音声とを比較してキーワードを抽出する手法、隠れマルコフモデル(HMM:Hidden Markov Model)を用いた手法などがある。音声認識部109は、抽出したキーワードを例えば、テキストデータなどの所定の形式のデータとしてアプリケーションプロセッサ110に供給する。
アプリケーションプロセッサ110は、例えば、CPU、ROM、RAMなどから構成され、端末装置100にインストールされた各種アプリケーションを実行する処理部である。アプリケーションとしては、例えば、音楽再生、動画再生、地図、天気、ナビゲーション、ゲーム、インターネットブラウザ、動画共有サイト利用、計算機などの様々な種類がある。
本技術は、端末装置100にインストールされる情報処理アプリケーションがアプリケーションプロセッサ110に実行されることにより実現される。アプリケーションプロセッサ110は情報処理アプリケーションを実行することにより、情報取得部121、共有情報生成部122、送信制御部123、表示制御部124、アプリケーション実行部125として機能する。情報処理アプリケーションの実行により実現される各機能が特許請求の範囲における情報処理装置に相当する。
情報取得部121は、コンテンツ再生装置200が有するコンテンツソースからのコンテンツを出力するアプリケーション(特許請求の範囲における第1の装置が有するアプリケーションに相当する)を示す情報(第1のアプリケーション情報)を通信部107を介してコンテンツ再生装置200から取得する。コンテンツソースとしてはインターネットラジオ、USBなどにより接続された外部ストレージ、ディスク媒体を再生するディスク媒体モジュールなどがある。
また、情報取得部121は、端末装置100が有するアプリケーションの中から、ユーザがコンテンツ再生装置200と端末装置100とにおいて共有させるために選択したアプリケーションを示す情報(第2のアプリケーション情報)を取得する。
さらに、情報取得部121は、コンテンツ再生装置200において行われたアプリケーションの選択操作の内容を示す情報(操作情報)を通信部107を介して受信する。操作情報の詳細については後述する。
共有情報生成部122は、情報取得部121により取得した第1のアプリケーション情報と第2のアプリケーション情報とを共存させることによって共有情報を生成する。共有情報は、端末装置100において用いられるとともに、通信制御部102による制御のもと通信部107を介してコンテンツ再生装置200に送信される。このように、共有情報は、コンテンツ再生装置200と端末装置100間で共有されるものである。
共有情報は例えば、図2に示されるように、第1のアプリケーション情報と第2のアプリケーション情報に示されるアプリケーションが順序付けられたリスト形式の情報である。この順序は、端末装置100およびコンテンツ再生装置の表示部106におけるアプリケーションを示すアイコンの表示順序に対応している。
なお、本技術においては、Bluetoothを用いて通信を行う場合には、シリアルポートプロファイルを用いて端末装置100とコンテンツ再生装置200間で第1のアプリケーション情報、共有情報、操作情報などの送受信が行われる。また、コンテンツ再生装置200と端末装置100との接続にUSBを用いる場合には、iAPを用いて第1のアプリケーション情報、共有情報、操作情報などの送受信が行われる。
シリアルポートプロファイル、iAPでは任意の情報の送受信が可能であるため、それらを利用することにより、本技術に用いられる上述した各種情報の送受信を行うことができる。ただし、上述した各種情報を送受信することが出来る方法であれば、他の方法を用いてもよい。また、Bluetooth、USB以外にも任意のデータ通信が可能な接続方法であればどのようなものを採用してもよい。
表示制御部124は、共有情報に基づいて、コンテンツ再生装置200のコンテンツソース用アプリケーション(コンテンツソース内のコンテンツを再生するアプリケーション)と、ユーザが選択した端末装置100のアプリケーションとを示すアイコンを表示部106に表示する制御を行うものである。また、表示制御部124は、音声認識部109から供給されたキーワードに基づいてアプリケーション実行部125が起動/動作させたアプリケーションに対応した表示制御を行う。
アプリケーション実行部125は、音声認識部109から供給されたキーワードに基づいて端末装置100にインストールされたアプリケーションを起動し、さらにそのアプリケーションを動作させる。キーワードに基づきアプリケーションを起動、動作させる方法としては、例えば、予めアプリケーションの起動および動作と、それに対応したキーワードをテーブルとして保持しておく。そして、音声認識部109からキーワードが供給されると、アプリケーションプロセッサ110はそのテーブルを参照して、キーワードに対応するアプリケーションまたは動作を検索する。そして、キーワードに対応するアプリケーションまたは動作が存在する場合にはそのアプリケーションの起動または動作を実行する。
例えば、入力されたキーワードがアプリケーション名である場合にはアプリケーションを起動する。そして、例えば、ナビゲーションアプリケーションが起動している状態で、地名がキーワードで入力された場合には、その地名までのルートを検索してナビゲーション開始する。また、動画共有サイト利用アプリケーションが起動している状態で、キーワードが入力された場合には、アプリケーションにそのキーワードで動画検索行い、検索結果の提示、動画再生、動画停止、早送り、巻戻しなどを行う。アプリケーション実行部125は入力されたキーワードに基づいてこのような処理を行う。
なお、上述の方法以外にも、供給されたキーワードに基づいて、それに対応するアプリケーションの起動、動作を実行することが出来る方法であればどのような方法を採用してもよい。
なお、情報処理アプリケーションは予め端末装置100にインストールした状態でユーザに提供するようにしてもよいし、ユーザが自ら端末装置100にインストールするようにしてもよい。情報処理アプリケーションは、例えば、インターネット上のアプリケーション販売サイト、アプリケーションダウンロードサービスを介して提供または販売される。また、情報処理アプリケーションが記録された光ディスクや半導体メモリなどの可搬型記録媒体によって提供または販売されてもよい。
スピーカ111は音声を出力するための音声出力手段であり、信号処理部104により所定の処理が施された音声信号などを音声として出力する。これによりユーザは通話音声、端末装置100に保存された音声データなどを聴取することができる。また、マイクロホン112は通話、音声による指示入力などのために音声を端末装置100に入力するためのものである。マイクロホン112から入力された音声は信号処理部104によって所定の処理が施される。
以上のようにして端末装置100が構成されている。端末装置100としては、携帯電話機、スマートフォン、携帯音楽プレーヤ、タブレット端末などがある。また、図示はしないが、端末装置100には撮像部と画像処理部などからなるカメラ機能、ラジオ機能などが設けられていてもよい。
図3は、端末装置100の外観構成の一例を示す図である。図3においては、端末装置100の表示部106および、入力部105としてのタッチスクリーンおよび入力部105としてのボタンが示されている。
端末装置100の表示部106には共有情報で示されたアプリケーションを示す複数のアイコン131、131、・・が表示されている。本実施の形態では、コンテンツ再生装置のコンテンツソースと端末装置100においてユーザにより選択されたアプリケーションを示すアイコンが表示されることとなる。
ユーザは、表示部106に表示されたアイコン131に指を接触させる、または入力部105としてのボタンを押圧することにより、アプリケーションを選択する。アプリケーションが選択されると、例えば、図4Aの状態から図4Bの状態へと、選択されたアプリケーションを示す太枠状のカーソル132が移動する。その後、例えば、選択したアプリケーションのアイコン131に再度入力を行うなどによりアプリケーション決定入力を行うと、選択されたアプリケーションが起動する。
ここで、端末装置100におけるページ送り操作について説明する。図4Aは、端末装置100の表示部106においてアプリケーションを示す複数のアイコン131が表示されている1ページ目を示すものである。1ページ目が表示されている図4Aの状態において、タッチスクリーンに対する入力などにより画面を横方向にスライドさせる。そうすると、図4Bに示されるように、1ページ目がスライド方向に流れて消えていくと同時に、2ページ目が表示部106の端からスライドして現れてくる遷移状態となる。そして、その遷移状態を経て、2ページ目のスライド動作が完了すると図4Cに示されるように2ページ目全体が表示部106に表示される。2ページ目に表示されるアイコン131は1ページ目に表示されたものとは異なっている。この一連の表示部106のおける表示の遷移を「ページ送り」と称し、それを行うための入力操作を「ページ送り操作」と称する。
なお、図4の説明は1ページ目から2ページ目への遷移を例にして説明したが、2ページ目から3ページ目、3ページ目から4ページ目、2ページ目から1ページ目なども同様にページ送りが可能である。端末装置100においてはインストールされるアプリケーションの数によってページ数が異なる。アプリケーションの数が多い場合にはそれに伴いページ数も増えていく。
通常、携帯電話機、スマートフォン、タブレット端末などにおけるアプリケーションのアイコン表示は縦5×横4、縦4×横4などの配置で行われるのが通常である。しかし、本実施の形態において表示制御部124は、図4に示されるように例えば縦2×横2など、よりアイコンが大きく表示されるように表示制御を行うようにしてもよい。これにより、端末装置100における入力操作が容易となる。
なお、図4に示される端末装置100の外観構成、表示部106における表示態様、入力部105としてのボタンの配置はあくまで一例であり、それらは図4に示されるものに限られるものではない。
[1−2.コンテンツ再生装置の構成]
図5は、本技術の実施の形態におけるコンテンツ再生装置200の構成を示すブロック図である。コンテンツ再生装置200は特許請求の範囲における第1の装置の一例である。コンテンツ再生装置200はいわゆる据え置き型の装置であり、据え置き型の装置としては例えば、車両内でコンテンツを再生するカーオーディオ装置、主に家庭内で用いられるドックスピーカなどがある。
コンテンツ再生装置200は、制御部201、ラジオ用アンテナ202、チューナ203、ディスク媒体モジュール204、電子ボリューム205、アンプ部206、スピーカ207、リモートコントローラ受光部208、入力部209、通信部210、表示部211、USB端子212、フラッシュROM213、マイクロホン214、サウンドDSP(Digital Signal Processing)215、アプリケーションプロセッサ216とから構成されている。
制御部201は例えば、CPU、RAMおよびROMなどから構成されている。ROMには、CPUにより読み込まれて動作されるプログラムなどが記憶されている。RAMは、CPUのワークメモリとして用いられる。CPUは、ROMに記憶されたプログラムに従い様々な処理を実行することによって、コンテンツ再生装置200の各部および全体の制御を行う。
ラジオ用アンテナ202は、ラジオ放送電波を受信するためのアンテナであり、チューナ203に接続されている。チューナ203は、ラジオ用アンテナ202により受信されたラジオ放送信号の復調やアナログ/デジタル変換、符号化されているデータの復号等の処理などを行い、ラジオ音声データを復元する。ラジオ音声データは制御部201の制御のもと電子ボリューム205、アンプ部206を介してスピーカ207へ送られ、スピーカ207により音声として出力される。
ディスク媒体モジュール204は、ディスク状記録媒体に書込まれているオーディオ信号を読出し、読出したオーディオ信号に対して所定の信号処理を施して音声信号を取得するディスク再生装置である。得られた音声信号は、制御部201の制御のもと電子ボリューム205、アンプ部206を介してスピーカ207へ送られ、スピーカ207により音声として出力される。なお、ディスク状記録媒体としてはCD(Compact Disc)、DVD(Digital Versatile Disc)、BD(Blu-ray Disc)などがある。
電子ボリューム205は、制御部201の制御に基づき、ラジオチューナ203、ディスク媒体モジュール204、通信部210、USB端子212などから供給された音声信号を増幅して音量を調整する。音量が調整された音声信号は、アンプ部206に供給される。アンプ部206は、電子ボリューム205から供給された音声信号を所定に増幅し、スピーカ207に供給する。スピーカ207は、アンプ部206から供給された音声信号を外部に音声として出力する音声出力手段である。
リモートコントローラ受光部208は、ユーザの操作によりコンテンツ再生装置200付属のリモートコントローラ300から送信されたコントロール信号を受信して制御部201に出力する。
入力部209は、ユーザがコンテンツ再生装置200への各種入力操作を行うための入力手段である。入力部209は例えば、ボタン、タッチパネル、スイッチなどにより構成されている。また、入力部209は、表示部211と一体に構成されたタッチスクリーンとして構成してもよい。入力部209に対してユーザによる入力がなされると、その入力に対応した制御信号が生成されて制御部201に出力される。そして、制御部201によりその制御信号に対応した演算処理や制御が行われる。
本実施の形態においては、ユーザは、入力部209に対して、アプリケーション選択操作および、選択したアプリケーションを起動するための決定操作などを行うことが可能である。
表示部211は、例えば、LCD、PDP、有機ELパネルなどにより構成された表示手段である。表示部211には、コンテンツ再生装置200の各種操作のメニューを表示するホーム画面、楽曲リスト、再生中の楽曲情報(アーティスト名、曲名など)などが表示される。さらに、コンテンツ再生装置200が動画コンテンツ、画像コンテンツなどにも対応している場合にはそれらも表示される。
さらに、入力部209と表示部211によりタッチスクリーンが構成される場合には、表示部211には入力部209としてのソフトボタン、音量調整、コンテンツ選択などの個々の操作画面などのユーザインターフェース画像も表示される。
通信部210は、端末装置100との通信を行うものである。通信部210の構成は端末装置におけるものと同様である。通信部210で受信した端末装置からの音声データはサウンドDSP215に供給される。
また、通信方式としてBluetoothを用いる場合、シリアルポートプロファイルを用いて、コンテンツ再生装置200と端末装置100間で、第1のアプリケーション情報、共有情報、操作情報などの送受信を行われる。また、コンテンツ再生装置200と端末装置100との接続にUSBを用いる場合には、iAPを用いて第1のアプリケーション情報、共有情報、操作情報などの任意の情報の送受信が可能となる。
ただし、接続方法はいずれの方法であってもよい。また、Bluetooth、USB以外にも任意のデータ通信が可能な接続方法であればどのようなものを採用してもよい。
USB端子212は、コンテンツ再生装置200に外部装置、外部記録媒体などを接続するためのUSB規格に準拠した接続端子である。USB端子212には例えば、音声データは格納する外部HDD(Hard Disc Drive)、USBメモリなどの外部ストレージが接続される。外部ストレージに格納された音声データは制御部201による制御のもと電子ボリューム205、アンプ部206を介してスピーカ207へ送られ、スピーカ207により音声として出力される。
フラッシュROM213は不揮発性メモリであり、Bluetooth機器に関する情報である機器情報やラジオ放送の周波数情報といった各種のデータが格納される。そして、格納された機器情報や周波数情報が制御部201からの要求に応じて読出され、制御部201に供給される。
マイクロホン214は、ユーザが発した音声を取得するものであり、マイクロホン214に入力された声は音声信号に変換され、アプリケーションプロセッサ216に供給される。音声信号はアプリケーションプロセッサ216によりサウンドDSP215に供給される。
サウンドDSP215は、通信部210としてのBluetoothモジュールなどから供給された音声データに対して所定の音声信号処理を施して電子ボリューム205に供給する。音声信号は電子ボリューム205、アンプ部206を介して最終的に音声としてスピーカ207から出力される。
また、サウンドDSP215は、マイクロホン214からの音声信号に対して、ノイズキャンセリング処理を施す。ノイズキャンセリングの手法は種々提案されているため、任意の手法を利用してノイズキャンセリング処理を行うとよい。ノイズキャンセリングの手法としては、例えば、マイクロホン214で取得した騒音、環境音とは逆の位相の音波成分を発生させて互いを消し合うことにより、ユーザの声以外のノイズを低減させる方法などがある。
アプリケーションプロセッサ216は、端末装置における情報処理アプリケーションの動作に対応してコンテンツ再生装置200側で所定の処理を行うものである。アプリケーションプロセッサ216は、所定のアプリケーションを実行することにより情報取得部217、および表示制御部218として機能する。
情報取得部217は、端末装置100から送信された共有情報を通信部210を介して取得する。また、情報取得部217は、端末装置100においてユーザにより行われたアプリケーションの選択操作を示す情報(操作情報)を通信部210を介して取得する。
表示制御部218は、情報取得部217により取得した共有情報に基づいて、表示部211における表示制御を行うものである。また、アプリケーションの選択を示すカーソルなどの表示制御も行う。さらに、操作情報に基づいた表示部211における表示の更新処理も行う。これら表示制御の詳細については後述する。
本実施の形態においては、コンテンツ再生装置200には、チューナ、USB接続されており音声データを蓄えた外部ストレージ、ディスク媒体モジュールの3つのコンテンツソースを有している。ただし、コンテンツソースの数および種類はそれに限られるものではない。1つのコンテンツソースを備えていてもよいし、より多くのコンテンツソースを備えていてもよい。
図6は、コンテンツ再生装置200のフロントパネルの外観構成の一例を示す図である。図6においては、コンテンツ再生装置200のフロントパネルに設けられた入力部209および表示部211が示されている。
コンテンツ再生装置200の表示部211には共有情報で示されたアプリケーションを示す複数のアイコン231、231、・・が表示されている。本実施の形態では、コンテンツ再生装置200のコンテンツソースと端末装置100においてユーザにより選択されたアプリケーションを示すアイコンが表示されることとなる。
図6に示す例においては、ユーザにより選択されたアプリケーションは表示部211の略中央において表示されることとなる。図6においてはUSBが選択されている。そして、ユーザが異なるアプリケーションを選択すると、図6Aに示される状態からアイコンが横に移動し、図6Bに示す状態となる。図6Bにおいては、表示部211の略中央には次に選択されたMUSICのアイコンが表示される。なお、「USB」とは、USB端子212に接続された外部ストレージに保存された音声データを再生するアプリケーションを示すアイコンである。また、「MUSIC」はディスク媒体モジュールの音声データを再生するアプリケーションを示すアイコンである。
なお、図6に示されるコンテンツ再生装置200の外観構成、表示部211における表示態様はあくまで一例であり、それらは図6に示されるものに限られるものではない。例えば、コンテンツ再生装置200における表示も端末装置における表示と同様に、アイコンを一列ではなく、複数列に並べて表示してもよい。
[1−3.端末装置とコンテンツ再生装置間における処理]
次に、上述した端末装置100とコンテンツ再生装置200間における処理について説明する。
本技術においては、第1の装置であるコンテンツ再生装置200の表示部211と、第2の装置である端末装置100の表示部106に、共有するアプリケーションを示すアイコンが表示される。また、いずれか一方の装置においてアプリケーションの選択操作を行うと、それに連動して他方の装置において、同一のアプリケーションを選択する動作が行われる。
よって、例えば、端末装置100におけるアプリケーションをコンテンツ再生装置200に対する入力で選択することが可能となる。そして、アプリケーション選択後、一方の装置においてアプリケーション決定操作を行うと、そのアプリケーションを備える他方の装置においてアプリケーション決定がなされてそのアプリケーションが起動することなる。よって、一方の装置に対する操作で、他方の装置におけるアプリケーションの選択および起動が可能となる。
また、コンテンツ再生装置200のマイクロホン214に対して音声入力を行うと、その音声が端末装置100に送信され、端末装置100において音声認識およびその音声認識により抽出されたキーワードによりアプリケーションの起動/動作が行われる。よって、ユーザは、端末装置100に触れることなく端末装置100におけるアプリケーションを利用することができる。
図7はコンテンツ再生装置200と端末装置100間の情報の受け渡しの説明するための概念図である。図8はコンテンツ再生装置200と端末装置100間における処理を示すシーケンス図である。図9は、コンテンツ再生装置200と端末装置100においてアプリケーションの選択が同期している状態を示す図である。
まず、処理の前提として、図7に示されるように、端末装置100には例えば、ゲーム、天気、MAPなどの複数のアプリケーションがインストールされている。また、上述したように情報処理アプリケーションもインストールされているものとする。
そして、事前に、図7中(1)に示されるように、ユーザは端末装置100にインストールされているアプリケーションの中からコンテンツ再生装置200と共有するアプリケーションを選択しており、情報取得部121は、その選択されたアプリケーションの情報(第2のアプリケーション情報)を取得しているものとする。
また、コンテンツ再生装置200は、1または複数のコンテンツソースを備える。図5および図7に示されるように本実施の形態においては、コンテンツ再生装置200はラジオチューナ、USB接続され、音声データを蓄えた外部ストレージ、ディスク媒体モジュールの3つのコンテンツソースを有している。ただし、コンテンツソースの数および種類はそれに限られるものではない。
まず、ステップS1で、コンテンツ再生装置200と端末装置100との接続が行われる。接続は上述したように双方の通信部においてBluetooth、USB接続などの方法により行われる。Bluetoothで接続された場合にはシリアルポートプロファイルを利用してコンテンツ再生装置200と端末装置100間の情報の送受信が行われる。USBにより接続された場合にはiAPを利用してコンテンツ再生装置200と端末装置100間の情報の送受信が行われる。
コンテンツ再生装置200と端末装置100との接続が確立した場合、次にステップS2で、端末装置100からコンテンツ再生装置200に対して接続完了通知が送信される。なお、図8に示される処理とは逆に、端末装置100からコンテンツ再生装置200に対して接続がなされ、コンテンツ再生装置200から端末装置100へ接続完了通知がなされるようにしてもよい。
次にステップS3で、図7中(2)に示されるように、コンテンツ再生装置200から端末装置100に対して、コンテンツ再生装置200が備えるコンテンツソース再生用アプリケーションの種類を示す情報(第1のアプリケーション情報)が送信される。図7においては、コンテンツ再生装置200がチューナ、USB接続された外部ストレージ、ディスク媒体モジュールの3つのコンテンツソースを有していることを示す情報がコンテンツ再生装置200に送信される。
次にステップS4で、端末装置100の共有情報生成部122は、ユーザにより選択された第2のアプリケーション情報と、第1のアプリケーション情報とをまとめて、双方の装置のアプリケーション情報を共存させることにより共有情報を生成する。共有情報は、図4を参照して上述したように、アプリケーションの種別が順序付けられたリスト形式のものである。共有情報にはコンテンツ再生装置200のアプリケーションと端末装置100とアプリケーションの両方が含まれている。
次にステップS5で、図4中の(3)に示されるように、端末装置100の送信制御部123の制御のもと、端末装置100からコンテンツ再生装置200に対して共有情報が送信される。この共有情報によってコンテンツ再生装置200と端末装置100とは互いのアプリケーションの情報を共有する。そして、ステップS6で、端末装置100の表示制御部124は共有情報に基づいた表示処理を行う。これにより、図9A上段に示されるように、端末装置100の表示部106においてコンテンツ再生装置200におけるコンテンツソースと、端末装置100においてユーザが選択したアプリケーションとを示すアイコンが表示される。
また、ステップS7においても同様に、コンテンツ再生装置200の表示制御部218は、共有情報に基づいた表示処理を行う。これにより、図9B上段に示されるように、コンテンツ再生装置200の表示部211においてコンテンツ再生装置200におけるコンテンツソースと、端末装置100においてユーザが選択したアプリケーションとを示すアイコンが表示される。
なお、図8のシーケンス図においては端末装置100における表示制御の後にコンテンツ再生装置200における表示制御が行われるように記載されているが、順序はそれに限られず、双方の表示制御はほぼ同時に行われるのが望ましい。
次にステップS8で、コンテンツ再生装置200は共有情報に示されるアプリケーションの中の1番目のアプリケーションを選択状態にする。選択状態とは、例えば、カーソルの移動によってアプリケーションの選択を行う場合にはそのカーソルを一番目のアプリケーションに合わせることである。そして、ステップ9で端末装置100側の情報取得部121は、コンテンツ再生装置200の操作情報を取得する。なお、ステップS9で取得される操作情報は、共有情報で示されるアプリケーションの中の1番目に位置するアプリケーションが選択されたことを示す情報である。
次にステップS10で、端末装置100の表示制御部124は、操作情報に基づいて端末装置100の表示部106における表示を更新する。なお、この場合、表示制御部124は、共有情報において一番目に位置するアプリケーションが選択されたことを示す表示となるように表示制御を行う。例えば、アプリケーション選択用カーソルを1番目のアプリケーションに合わせるなどである。
以上、ステップS10までの処理により、コンテンツ再生装置200と端末装置100とが互いにコンテンツ再生装置200のソースと、端末装置100のアプリケーションを共有した同期状態となる。
次にステップS11で、コンテンツ再生装置200は、音声認識モードへの遷移を指示するユーザからの入力操作を受け付ける。この入力はコンテンツ再生装置200の入力部209に対して行われる。音声認識モードへの遷移を指示する入力操作を受け付けると、次にステップS12で、コンテンツ再生装置200から端末装置100に対して、音声認識モードへの遷移の要求が行われる。
次にステップS13で、端末装置100は、コンテンツ再生装置200からの要求に従い音声認識モードに遷移する。端末装置100が音声認識モードに遷移すると、音声認識部109がオンとなる。さらに、音声認識部109に対する音声入力のソースをマイクロホン112から通信部107に切り替える。これにより、マイクロホン112に入力される音声ではなく、通信部107を介してコンテンツ再生装置200から入力される音声によって端末装置100が操作可能となる。よって、コンテンツ再生装置200が端末装置100の音声入力源として機能することとなる。
次にステップS14で、端末装置100はコンテンツ再生装置200に対して音声認識モードに遷移したことの通知を行う。そして、ステップS15で、音声認識モードに遷移したことの通知を受けたコンテンツ再生装置200は、音声取得モードに遷移して、マイクロホン214をオンにして音声取得を開始する。この状態で、ユーザは、コンテンツ再生装置200のマイクロホン214に対して起動したいアプリケーション名、キーワードなどを声で入力する。
コンテンツ再生装置200のマイクロホン214でユーザからの音声を取得すると、サウンドDSP215により音声信号に対してノイズキャンセリング処理が施される。そして、ステップS16でコンテンツ再生装置200は、通信部210を介してその音声信号を端末装置100に送信する。
次にステップS17で、端末装置100の音声認識部109は音声信号に対して音声認識処理を行ってキーワードを抽出する。その抽出結果を示すキーワード情報は、アプリケーションプロセッサ110に供給される。そしてステップS18で、アプリケーションプロセッサ110のアプリケーション実行部125は、供給されたキーワードに対応するアプリケーションを起動する。
また、アプリケーション実行部125は、アプリケーションの起動後に音声認識部109からキーワードが供給されると、そのキーワードに対応したアプリケーションの動作を実行する。キーワードに基づきアプリケーション動作させる方法としては、上述したように、例えば、予め、アプリケーションの動作と対応したキーワードをテーブルとして保持しておき、そのテーブルを参照することにより、キーワードに対応する動作を実行する。
例えば、ナビゲーション用アプリケーションの場合、「ナビゲーション」と音声入力してアプリケーションを起動させた後、「東京駅」と目的地を示すキーワードを音声入力する。そうすると、ナビゲーション用アプリケーションがユーザの現在地から東京駅までのナビゲーションを開始する。
なお、音声入力によりアプリケーションの起動とアプリケーションの動作を指示する場合、「ナビゲーション、東京駅」と、アプリケーションの起動を指示するキーワードと、アプリケーションの動作を指示するキーワードとを連続で入力できるようにしてもよい。
また、ユーザが使用するアプリケーションがすでに起動している場合には、アプリケーションを起動させるための音声入力は行わずに、アプリケーションに実行して欲しい動作のみを音声入力すればよい。
例えば、ラジオアプリケーションが既に起動している場合、「FM79.5」などのラジオ局を示すキーワードを音声入力すれば、ラジオアプリケーションが「FM79.5MHz」にチューニングする。
また、動画共有サイト用アプリケーションが起動している場合には「ビートルズ」などの検索対象となるキーワードを音声入力すれば、動画共有サイト用アプリケーションが「ビートルズ」について検索を行い、検索結果を提示し、動画の再生を行う。
このように、本技術によれば、コンテンツ再生装置200に対して音声入力を行うことにより端末装置100のアプリケーションを起動、動作させることができる。例えば、例えばユーザが車両で運転中である場合、ユーザは、スマートフォンなどの端末装置100を操作することはできない。しかし、コンテンツ再生装置200がカーオーディオ装置である場合、本技術を用いることによって、ユーザが車両で運転中であっても、コンテンツ再生装置200に対する音声入力により端末装置100を操作することができる。
また、端末装置100に送信する音声信号に対してノイズキャンセリング処理を施すことにより、車内などの騒音環境下であっても、端末装置100の音声認識率を落とすことなく使用することが可能となる。
スマートフォンなどの端末装置を所有しているユーザにとっては、音声認識用モジュールを備える高価なオーディオ機器を購入することなく、比較的低価格なオーディオ機器で音声認識機能を利用することができる。
さらに、アプリケーションを起動させるための音声入力は行わずに、アプリケーションに実行して欲しい動作を示すキーワードのみを音声入力することにより、アプリケーションの起動とキーワードに基づく処理を行うようにしてもよい。詳しくは、キーワードが音声入力されると、そのキーワードに対応した動作を実行するのに最適なアプリケーションを端末装置が判断して、自動でアプリケーションを起動した後にキーワードに基づく動作を実行するようにする。
なお、上述のように、端末装置100とコンテンツ再生装置200とは、互いの有するアプリケーションについての情報を共有している。そこで、ステップS10において、共有情報および選択情報に基づいて表示更新を行ったのと同様にして、端末装置100の表示制御部124は、キーワードにより起動されたアプリケーションを示す情報を表示部106に表示するようにするとよい。さらに、コンテンツ再生装置200の表示制御部218は、端末装置100において起動したアプリケーションを表示部211に表示するようにするとよい。これにより、ユーザは、端末装置100の表示部106を目視することにより、起動しているアプリケーションを確認することができる。
また、端末装置100とコンテンツ再生装置200は、互いの有するアプリケーションについての情報を共有している。したがって、端末装置100とコンテンツ再生装置200は互いが有するアプリケーションを把握しており、図9に示されるように、端末装置100とコンテンツ再生装置200の両方において互いのアプリケーションが表示される。よって、端末装置100の入力部105に対する入力操作に応じて、端末装置100からコンテンツ再生装置200に操作情報を送信することにより、端末装置100に対する操作でコンテンツ再生装置200のアプリケーションを起動、動作させるようにしてもよい。また、コンテンツ再生装置200に対して入力された音声を端末装置100に送信し、端末装置100のアプリケーションプロセッサ110が入力された音声に応じた処理を行い、コンテンツ再生装置200に対してアプリケーションの起動、動作の指示を行うようにしてもよい。これにより、端末装置100とコンテンツ再生装置200とでアプリケーションの起動および動作がシームレスなものとなり、ユーザは装置のいずれかの装置であるかを意識することなくアプリケーションを使用することが可能となる。
車両の運転中は携帯電話機、スマートフォンなどの端末装置100を操作することは法律により禁止されている。そこで、コンテンツ再生装置200を車両におけるカーオーディオシステムとして利用し、コンテンツ再生装置200に対する音声入力で端末装置100のアプリケーションを起動/動作させるようにする。これにより、端末装置100、コンテンツ再生装置200を直接操作しなくても端末装置100におけるアプリケーションの起動/動作が可能となる。
<6.変形例>
以上、本技術の一実施の形態について具体的に説明したが、本技術は、上述の実施形態に限定されるものではなく、本技術の技術的思想に基づく各種の変形が可能である。
実施の形態では第1の装置をコンテンツ再生装置200とし、第2の装置を端末装置100としたが、具体的な装置はそれに限られるものではない。双方向通信を行うことができる装置であればどのようなものにも適用することができる。例えば、第1の装置、第2の装置共に携帯電話機、スマートフォン、タブレット端末などの端末装置100であってもよい。また、一方の装置がテレビジョン受像機であり、他方の装置が端末装置100であるという組み合わせでもよい。