WO2018074262A1

WO2018074262A1 - 通信装置および通信方法、並びにプログラム

Info

Publication number: WO2018074262A1
Application number: PCT/JP2017/036453
Authority: WO
Inventors: 雅人赤尾; 祐介阪井; 穎陸
Original assignee: ソニー株式会社
Priority date: 2016-10-20
Filing date: 2017-10-06
Publication date: 2018-04-26

Abstract

本開示は、より円滑なコミュニケーションを行うことができるようにする通信装置および通信方法、並びにプログラムに関する。注目対象検出部は、ユーザが指示した注目対象を検出し、出力操作部は、注目対象の位置に従って、ユーザの通信相手となる他のユーザに注目対象を認識させる出力操作を行う際の出力モードを、リモートモード、ローカルモード、およびローカルブラインドモードのいずれかに切り替える。本技術は、例えば、カメラおよびディスプレイを利用してコミュニケーションを行うコミュニケーションシステムに適用できる。

Description

通信装置および通信方法、並びにプログラム

　本開示は、通信装置および通信方法、並びにプログラムに関し、特に、より円滑なコミュニケーションを行うことができるようにした通信装置および通信方法、並びにプログラムに関する。

　従来、テレビ会議システムなどのコミュニケーションシステムでは、例えば、遠隔地にいるユーザどうしが、ディスプレイに表示される相手側のユーザとコミュニケーションを行うことができる通信装置が利用される。このようなコミュニケーションにおいて、例えば、一方のユーザが、他方のユーザ側にある注目対象を指示するような場合に、その注目対象を他方のユーザに認識させることにより、より良好な意思疎通を行うことができる。

　そこで、特許文献１では、例えば、一方のユーザが、他方のユーザ側にある資料などを指差したときに、その資料の位置検出を行い、他方のユーザ側にあるレーザポインタを動かして資料にレーザを照射するテレビ会議装置が提案されている。

特開平９－２３７１５４号公報

　しかしながら、特許文献１における提案では、一方のユーザが見えている映像内にあるものしか注目対象とすることができず、例えば、映像内にあって死角となる位置にある注目対象や、映像外にある注目対象などを指示することは想定されていない。そのため、そのような様々な注目対象に対する指示を認識させることによる円滑なコミュニケーションを実現することは困難であった。

　本開示は、このような状況に鑑みてなされたものであり、より円滑なコミュニケーションを行うことができるようにするものである。

　本開示の一側面の通信装置は、ユーザが指示した注目対象を検出する注目対象検出部と、前記注目対象の位置に従って、前記ユーザの通信相手となる他のユーザに前記注目対象を認識させる出力操作を行う際の出力モードを切り替える出力操作部とを備える。

　本開示の一側面の通信方法またはプログラムは、ユーザが指示した注目対象を検出し、前記注目対象の位置に従って、前記ユーザの通信相手となる他のユーザに前記注目対象を認識させる出力操作を行う際の出力モードを切り替えるステップを含む。

　本開示の一側面においては、ユーザが指示した注目対象が検出され、その注目対象の位置に従って、ユーザの通信相手となる他のユーザに注目対象を認識させる出力操作を行う際の出力モードが切り替えられる。

　本開示の一側面によれば、より円滑なコミュニケーションを行うことができる。

本技術を適用したコミュニケーションシステムの一実施の形態の構成例を示すブロック図である。注目対象の位置に従った出力操作の出力モードについて説明する図である。通常モードについて説明する図である。リモートモードにおける第１の出力操作について説明する図である。リモートモードにおける第２の出力操作について説明する図である。リモートモードにおける第３の出力操作について説明する図である。リモートモードにおける第４の出力操作について説明する図である。リモートモードにおける第５の出力操作について説明する図である。リモートモードにおける第６の出力操作について説明する図である。コミュニケーションシステムの変形例を示すブロック図である。リモートモードにおける第７の出力操作について説明する図である。複数のユーザとのコミュニケーションの例を説明する図である。リモートモードにおける第８の出力操作について説明する図である。リモートモードにおける第９の出力操作について説明する図である。ローカルモードにおいて、注目対象がカメラの画角内にある例を説明する図である。ローカルモードにおける出力操作の第１の例を説明する図である。ローカルモードにおける出力操作の第２の例を説明する図である。ローカルブラインドモードにおける出力操作の例を説明する図である。通信処理を説明するフローチャートである。コミュニケーション処理を説明するフローチャートである。本技術を適用したコンピュータの一実施の形態の構成例を示すブロック図である。

　以下、本技術を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。

　＜コミュニケーションシステムの構成例＞

　図１は、本技術を適用したコミュニケーションシステムの一実施の形態の構成例を示すブロック図である。

　図１に示されているコミュニケーションシステム１１は、２台の通信端末１２Ａおよび通信端末１２Ｂが通信を行うように構成されており、通信端末１２Ａおよび通信端末１２Ｂのユーザを互いに通信相手としてコミュニケーションが行われる。なお、コミュニケーションシステム１１は、２台以上の通信端末１２が通信を行うような構成としてもよい。

　通信端末１２Ａは、入力装置２１Ａ、トリガ検出部２２Ａ、注目対象検出部２３Ａ、出力操作部２４Ａ、送信装置２５Ａ、受信装置２６Ａ、および出力装置２７Ａを備えて構成される。なお、通信端末１２Ｂは、通信端末１２Ａと同一のブロックを備えて構成されており、以下の説明では、通信端末１２Ｂの構成については省略する。

　入力装置２１Ａには、CCD（Charge Coupled Device）やCMOS（Complementary Metal Oxide Semiconductor）イメージセンサなどを用いた撮影装置（例えば、図２のカメラ３１または図１６のウェアラブルカメラ３３）を使用することができる。そして、入力装置２１Ａは、通信端末１２Ａを利用してコミュニケーションを行うユーザ（話者）を被写体として撮影することにより得られる映像信号の通信端末１２Ａへの入力を行う。また、入力装置２１Ａとして、例えば、赤外線などを利用して被写体のデプスを検出するデプスセンサを使用する場合、入力装置２１Ａは、被写体の奥行きを示すデプス情報の入力を行い、そのデプス情報から求められるユーザの動作に基づいた処理が行われる。

　なお、入力装置２１Ａにより通信端末１２Ａに入力されるデプス情報は、例えば、映像信号に関する各種の情報からなるメタ情報に含めることができる。また、このメタ情報には、例えば、図１１を参照して後述するようなリモートコントローラに対する操作により入力される操作コマンドや、図示しない操作手段に対する操作により入力される操作コマンド（トリガ信号をオンにするコマンド）などを含めることができる。そして、通信端末１２Ａは、入力装置２１Ａにより入力されるメタ情報（ローカル）と、入力装置２１Ｂから送信されてくるメタ情報（リモート）とに基づいて処理を行うことができる。

　トリガ検出部２２Ａは、入力装置２１Ａから入力される映像信号に対して画像認識技術を使用することで、映像に映されているユーザの動作を認識し、ユーザが指差し動作を行ったか否かを示すトリガ信号を注目対象検出部２３Ａに供給する。例えば、トリガ検出部２２Ａは、ユーザの動作を認識した結果、ユーザが指差し動作を行ったことを検出したタイミングで、注目対象検出部２３Ａに供給するトリガ信号の出力をオフからオンに切り替える。また、トリガ検出部２２Ａは、ユーザが指差し動作を終了したことを検出したタイミングで、注目対象検出部２３Ａに供給するトリガ信号の出力をオンからオフに切り替える。

　注目対象検出部２３Ａは、トリガ検出部２２Ａから供給されるトリガ信号がオンとなっている間、入力装置２１Ａから入力される映像信号に対して画像認識技術を使用することで、映像に映されているユーザの手の形状を認識し、ユーザが指差した方向を特定する。これにより、注目対象検出部２３Ａは、ユーザが指差した方向の延長線上にあるもの（人物や物体など）を注目対象として検出し、注目対象の位置を指示する対象位置情報を出力操作部２４Ａに供給する。

　出力操作部２４Ａは、注目対象検出部２３Ａから供給される対象位置情報に基づいて、通信相手となる通信端末１２Ｂのユーザに注目対象を認識させるための出力操作を行う際の出力モードを切り替える処理を行う。例えば、出力操作部２４Ａは、注目対象の位置に従って、図２を参照して後述するように、リモートモード、ローカルモード、およびローカルブラインドモードのいずれかを出力モードとして選択する。そして、出力操作部２４Ａは、リモートモード、ローカルモード、およびローカルブラインドモードのいずれかを示す出力モード情報を、対象位置情報とともに送信装置２５Ａに供給する。

　また、出力操作部２４Ａは、受信装置２６Ａから供給されるメタ情報（リモート）に含まれている通信端末１２Ｂ側の出力モード情報および対象位置情報に基づいて、通信端末１２Ａのユーザに、通信端末１２Ｂにおいて検出された注目対象を認識させるための出力操作を行う。例えば、出力操作部２４Ａは、通信端末１２Ｂから送信されてきた出力モード情報に従って出力モードを切り替え、通信端末１２Ｂから送信されてきた対象位置情報により指示される注目対象の位置を特定する出力操作を行った映像信号を、出力装置２７Ａに供給する。即ち、出力操作部２４Ａは、例えば、後述する図４のポイントマークＰを表示させるような映像操作（映像加工、映像編集、映像切り替えなど）を行うことができる。

　送信装置２５Ａは、入力装置２１Ａから入力される映像信号と、出力操作部２４Ａから供給される出力モード情報および対象位置情報を少なくとも含むメタ情報（ローカル）とを、通信端末１２Ｂに送信する。なお、通信端末１２Ａおよび通信端末１２Ｂの間で送受信されるメタ情報は、出力モード情報および対象位置情報の他、例えば、デプス情報や、３Ｄモデル情報、タイムスタンプなどを含むことができる。

　受信装置２６Ａは、通信端末１２Ｂから送信されてくる映像信号およびメタ情報を受信する。そして、受信装置２６Ａは、通信端末１２Ｂから送信されてきた映像信号を、出力操作部２４Ａを介して出力装置２７Ａに供給するとともに、通信端末１２Ｂから送信されてきたメタ情報（リモート）に含まれている出力モード情報および対象位置情報を出力操作部２４Ａに供給する。なお、送信装置２５Ａおよび受信装置２６Ａは、具体的には、H.320/H.323などの通信プロトコルに対応する通信機能を備え、映像符号化（H.26x）、音声符号化（G.7xx）（ITU-T勧告）などを行うことができる。

　出力装置２７Ａには、例えば、映像を表示する表示装置（例えば、図２のディスプレイ３２やプロジェクタなど）を使用することができる。出力装置２７Ａは、通信端末１２Ｂから送信されてきた映像信号に基づいた映像を表示するとともに、出力操作部２４Ａによる出力操作に従って、通信端末１２Ｂにおいて検出された注目対象を通信端末１２Ａのユーザに認識させる表示を行う。

　このようにコミュニケーションシステム１１は構成されており、例えば、通信端末１２Ａのユーザが指差し動作を行うと、注目対象の位置に従って出力モードが切り替えられて、通信端末１２Ｂのユーザに注目対象を認識させるための出力操作が行われる。同様に、通信端末１２Ｂのユーザが指差し動作を行うと、注目対象の位置に従って出力モードが切り替えられて、通信端末１２Ａのユーザに注目対象を認識させるための出力操作が行われる。従って、コミュニケーションシステム１１を利用することで、互いのユーザは、相手側のユーザが指差した注目対象を容易に認識することができ、より円滑なコミュニケーションを行うことができる。

　なお、通信端末１２Ａおよび通信端末１２Ｂの区別をする必要がない場合、単に通信端末１２と称し、通信端末１２を構成する各ブロックについても同様に称する。

　＜出力モードの例＞

　図２を参照して、注目対象検出部２３により検出される注目対象の位置に従った出力操作部２４による出力操作の出力モードについて説明する。

　図２では、入力装置２１として使用されるカメラ３１が、出力装置２７として使用されるディスプレイ３２の上辺の中央に設置されている構成例が示されている。カメラ３１は、ディスプレイ３２を向いているユーザの正面から、そのユーザを撮影するのに用いられ、図２に示されている破線は、カメラ３１の画角を表している。

　例えば、ユーザは、ディスプレイ３２の正面に向かって、ディスプレイ３２に映し出される通信相手とコミュニケーションを行うことができる。このとき、ユーザが、任意のものを対象として指差し動作を行うと、注目対象検出部２３は、ユーザが指差した注目対象を検出し、出力操作部２４は、注目対象の位置に従った出力モードに切り替えて出力操作を行う。

　例えば、出力操作部２４は、注目対象検出部２３から供給される注目対象の対象位置情報が、ディスプレイ３２に映されている映像内を示している場合、出力操作の出力モードをリモートモードに切り替える。また、注目対象検出部２３は、注目対象検出部２３から供給される注目対象の対象位置情報が、ディスプレイ３２に映されている映像外であって、かつ、カメラ３１により撮影可能な画角内を示している場合、出力操作の出力モードをローカルモードに切り替える。また、注目対象検出部２３は、注目対象検出部２３から供給される注目対象の対象位置情報が、ディスプレイ３２に映されている映像外であって、かつ、カメラ３１により撮影可能な画角外を示している場合、出力操作の出力モードをローカルブラインドモードに切り替える。

　そして、出力操作部２４は、例えば、リモートモード、ローカルモード、およびローカルブラインドモードのいずれかを示す出力モード情報を送信装置２５に供給し、対象位置情報とともに送信させる。

　一方、出力操作部２４には、受信装置２６が受信した出力モード情報および対象位置情報が供給される。そして、出力操作部２４は、その出力モード情報に従って、リモートモード、ローカルモード、およびローカルブラインドモードのいずれかに出力モードを切り替えて、その対象位置情報に基づいて、ユーザに注目対象を認識させる出力操作を行うことができる。なお、出力操作部２４により出力操作が行われていない状態を、以下適宜、通常モードと称する。

　＜通常モード＞

　図３を参照して、通常モードについて説明する。

　図３では、通信端末１２Ａを１人のユーザＡが利用して通信を行い、通信端末１２Ｂを３人のユーザＢ１乃至Ｂ３が利用して通信を行っている例を示している。

　図３のＡには、通信端末１２Ａ側において、ディスプレイ３２Ａに向かうユーザＡを後ろ側から見た状態が示されており、ディスプレイ３２Ａには、通信端末１２Ｂのカメラ３１Ｂにより撮影されたユーザＢ１乃至Ｂ３の映像が表示される。

　図３のＢには、通信端末１２Ｂ側において、ディスプレイ３２Ｂに向かうユーザＢ１乃至Ｂ３を後ろ側から見た状態が示されおり、ディスプレイ３２Ｂには、通信端末１２Ａのカメラ３１Ａにより撮影されたユーザＡの映像が表示される。

　このように、通常モードでは、ユーザが指差し動作を行っていない状態で、それぞれ互いのディスプレイ３２に表示される通信相手と通常のコミュニケーションを行うことができる。

　＜リモートモード＞

　図４乃至図１４を参照して、リモートモードにおいて注目対象を認識させる出力操作について説明する。

　図４には、リモートモードにおける第１の出力操作として、注目対象を指示するマークを重畳表示する例が示されている。

　図４のＡに示すように、通信端末１２Ａ側において、ユーザＡが、ディスプレイ３２Ａに表示されているユーザＢ１に対して指差しを行うと、注目対象検出部２３Ａは、ディスプレイ３２Ａに映されている映像内のユーザＢ１を注目対象として特定する。そして、注目対象検出部２３Ａは、ユーザＢ１の位置を示す対象位置情報を出力操作部２４Ａに供給する。

　これにより、出力操作部２４Ａは、対象位置情報に従って、リモートモードを出力モードとして選択し、リモートモードを示す出力モード情報を、対象位置情報とともに送信装置２５Ａに供給する。従って、送信装置２５Ａは、出力モード情報および対象位置情報を少なくとも含むメタ情報を、カメラ３１ＡがユーザＡを撮影することにより得られる映像信号とともに通信端末１２Ｂに送信する。

　一方、通信端末１２Ｂ側において、出力操作部２４Ｂは、通信端末１２Ａから送信されてきた出力モード情報に従って、出力モードをリモートモードに切り替える。また、出力操作部２４Ｂは、通信端末１２Ａから送信されてきた対象位置情報に基づいて、ユーザＢ１が注目対象であることを特定する。

　そして、リモートモードにおける第１の出力操作では、出力操作部２４Ｂは、カメラ３１ＢがユーザＢ１乃至Ｂ３を撮影した映像に映されているユーザＢ１にポイントマークＰを重畳させる映像加工を行い、その映像を出力装置２７Ｂに供給する。これにより、出力装置２７Ｂは、通信端末１２Ａから送信されてきたユーザＡが映された映像に対して、出力操作部２４Ｂにより映像加工が行われた映像がピクチャインピクチャ形式で表示されるような出力を行う。

　従って、図４のＢに示すように、ディスプレイ３２Ｂでは、通信端末１２Ａから送信されてきたユーザＡの映像が画面の全体に表示され、ポイントマークＰがユーザＢ１に重畳されたユーザＢ１乃至Ｂ３の映像が、例えば、画面の右下に表示される。このとき、ユーザＢ１乃至Ｂ３の映像は、ディスプレイ３２Ａに向かって映像を見ているユーザＡと同じ位置関係となるように、例えば、カメラ３１Ｂの出力から反転されて表示される。なお、ポイントマークＰは、例えば、赤色などの目立つような色で表示したり、注意を引くような点滅表示したりすることができる。また、ポイントマークＰとして任意の形状を使用してもよい。

　このように、リモートモードにおける第１の出力操作では、カメラ３１により撮影された映像に映されている注目対象にポイントマークＰを重畳させ、ピクチャインピクチャ形式でディスプレイ３２に表示することにより、注目対象を認識させることができる。

　図５には、リモートモードにおける第２の出力操作として、注目対象を切り出した映像をピクチャインピクチャ形式で表示する例が示されている。

　図５のＡに示すように、通信端末１２Ａ側において、ユーザＡが、ディスプレイ３２Ａに表示されているユーザＢ１に対して指差しを行うと、図４を参照して上述したように、通信端末１２Ｂ側において、出力モードがリモートモードに切り替えられる。

　そして、リモートモードにおける第２の出力操作では、出力操作部２４Ｂは、カメラ３１ＢがユーザＢ１乃至Ｂ３を撮影した映像から、注目対象であるユーザＢ１が映されている領域を切り出す映像加工を行い、その映像を出力装置２７Ｂに供給する。これにより、出力装置２７Ｂは、通信端末１２Ａから送信されてきたユーザＡが映された映像に対して、出力操作部２４Ｂにより映像加工が行われた映像が、ユーザＡの指先の近傍においてピクチャインピクチャ形式で表示されるような出力を行う。

　従って、図５のＢに示すように、ディスプレイ３２Ｂでは、通信端末１２Ａから送信されてきたユーザＡの映像が画面の全体に表示され、出力操作部２４ＢによりユーザＢ１が切り出された映像が、ユーザＡの指先の近傍に表示される。

　このように、リモートモードにおける第２の出力操作では、カメラ３１により撮影された映像から注目対象を切り出してピクチャインピクチャ形式でディスプレイ３２に表示することにより、注目対象を認識させることができる。

　図６には、リモートモードにおける第３の出力操作として、通信相手側の出力映像の手の位置に合わせて注目対象を透過表示する例が示されている。

　図６のＡに示すように、通信端末１２Ａ側において、ユーザＡが、ディスプレイ３２Ａに表示されているユーザＢ１に対して指差しを行うと、図４を参照して上述したように、通信端末１２Ｂ側において、出力モードがリモートモードに切り替えられる。

　そして、リモートモードにおける第３の出力操作では、出力操作部２４Ｂは、カメラ３１ＢがユーザＢ１乃至Ｂ３を撮影した映像に映されているユーザＢ１が、ユーザＡの指先に重なる位置で透過表示されるように指示し、その映像を出力装置２７Ｂに供給する。これにより、出力装置２７Ｂは、通信端末１２Ａから送信されてきたユーザＡが映された映像に重畳して、ユーザＢ１がユーザＡの指先に重なる位置となるように、出力操作部２４Ｂから供給される映像が透過表示されるような出力を行う。

　従って、図６のＢに示すように、ディスプレイ３２Ｂでは、通信端末１２Ａから送信されてきたユーザＡの映像が画面の全体に表示され、ユーザＡの指先にユーザＢ１が重なるような位置でユーザＢ１乃至Ｂ３の映像が透過表示（図６の例では破線で表示）される。このとき、ユーザＢ１乃至Ｂ３の映像は、ディスプレイ３２Ａに向かって映像を見ているユーザＡと同じ位置関係となるように、例えば、カメラ３１Ｂの出力から反転されて表示される。

　このように、リモートモードにおける第３の出力操作では、カメラ３１により撮影された映像に映されている注目対象をディスプレイ３２に透過表示することにより、注目対象を認識させることができる。

　図７には、リモートモードにおける第４の出力操作として、通信相手側の出力映像の手の位置に合わせた注目対象の表示を所定間隔で切り替える例が示されている。

　図７のＡに示すように、通信端末１２Ａ側において、ユーザＡが、ディスプレイ３２Ａに表示されているユーザＢ１に対して指差しを行うと、図４を参照して上述したように、通信端末１２Ｂ側において、出力モードがリモートモードに切り替えられる。

　そして、リモートモードにおける第４の出力操作では、出力操作部２４Ｂは、カメラ３１ＢがユーザＢ１乃至Ｂ３を撮影した映像に映されているユーザＢ１が、ユーザＡの指先に重なる位置で時間切り替え表示されるように指示し、その映像を出力装置２７Ｂに供給する。これにより、出力装置２７Ｂは、通信端末１２Ａから送信されてきたユーザＡが映された映像に重畳して、ユーザＢ１がユーザＡの指先に重なる位置となるように、出力操作部２４Ｂから供給される映像が時間切り替え表示されるような出力を行う。

　従って、図７のＢに示すように、ディスプレイ３２Ｂでは、通信端末１２Ａから送信されてきたユーザＡの映像が画面の全体に表示され、ユーザＡの指先にユーザＢ１が重なるような位置でユーザＢ１乃至Ｂ３の映像が時間切り替え表示される。即ち、所定の時間間隔で、図６のＢの左側に示されているような表示状態と、図６のＢの右側に示されているような非表示状態とが交互に行われる。

　このように、リモートモードにおける第４の出力操作では、カメラ３１により撮影された映像に映されている注目対象をディスプレイ３２に時間切り替え表示することにより、注目対象を認識させることができる。

　図８には、リモートモードにおける第５の出力操作として、注目対象を指示するマークを重畳表示する例が示されている。

　図８のＡに示すように、通信端末１２Ａ側において、ユーザＡが、ディスプレイ３２Ａに表示されているユーザＢ１に対して指差しを行うと、図４を参照して上述したように、通信端末１２Ｂ側において、出力モードがリモートモードに切り替えられる。

　そして、リモートモードにおける第５の出力操作では、出力操作部２４Ｂは、カメラ３１ＢがユーザＢ１乃至Ｂ３を撮影した映像に映されているユーザＢ１にポイントマークＰを重畳させる映像加工を行い、その映像を出力装置２７Ｂに供給する。これにより、出力装置２７Ｂは、出力操作部２４Ｂにより映像加工が行われた映像が全画面に表示されるような出力を行う。

　従って、図８のＢに示すように、ディスプレイ３２Ｂでは、ポイントマークＰがユーザＢ１に重畳されたユーザＢ１乃至Ｂ３の映像が画面の全体に表示される。このとき、ユーザＢ１乃至Ｂ３の映像は、ディスプレイ３２Ａに向かって映像を見ているユーザＡと同じ位置関係となるように、例えば、カメラ３１Ｂの出力から反転されて表示される。なお、ポイントマークＰは、例えば、赤色などの目立つような色で表示したり、注意を引くような点滅表示したりすることができる。また、ポイントマークＰとして任意の形状を使用してもよい。

　このように、リモートモードにおける第５の出力操作では、カメラ３１により撮影された映像に映されている注目対象にポイントマークＰを重畳させてディスプレイ３２に表示することにより、注目対象を認識させることができる。

　ところで、カメラ３１Ｂにより撮影された映像にポイントマークＰを重畳させてディスプレイ３２Ｂに表示させるためには、例えば、カメラ３１Ｂにより撮影された映像を入力装置２１Ａに送信し、出力操作部２４ＡにおいてポイントマークＰを重畳させる映像加工を行った後、入力装置２１Ｂに送り返すような方法が考えられる。このように、ユーザＡにより指差された注目対象に対してポイントマークＰを重畳させる処理を入力装置２１Ａ側で行うことで、ユーザＡが指差したタイミングに一致するように（少ないタイムラグで）ポイントマークＰを表示させることができる。しかしながら、このような方法では、映像信号の符号化および復号により遅延が発生することや、伝送量が増大することなどが懸念される。

　そこで、例えば、入力装置２１Ａでは、送信装置２５Ａは、トリガ検出部２２Ａがトリガ信号をオンにしたタイミングで、ディスプレイ３２Ａに表示されていた映像のタイムスタンプをメタ情報に含めて送信することができる。また、入力装置２１Ｂでは、カメラ３１Ｂにより撮影された映像を一定期間だけ保存しておくことができる。

　これにより、ポイントマークＰを重畳させた映像を送り返すことなく、出力操作部２４Ｂが、タイムスタンプに従った映像が表示されるタイミングでポイントマークＰを重畳させる映像加工を行うことができる。従って、ユーザＡが指差したタイミングに一致するように（少ないタイムラグで）ポイントマークＰを表示させることができる。これにより、映像信号の符号化および復号による遅延の発生を回避することができ、伝送量の減少を図ることができる。

　図９には、リモートモードにおける第６の出力操作として、カメラ３１の画角を調整した後に、注目対象を指示するマークを重畳表示する例が示されている。また、図１０には、リモートモードにおける第６の出力操作を実行するためのコミュニケーションシステム１１の変形例が示されている。

　図９のＡの左側に示すように、通信端末１２Ａ側では、ユーザＡは、ディスプレイ３２Ａの枠（即ち、カメラ３１Ｂの画角の境界近辺）に対して指差しを行うと、注目対象検出部２３Ａは、ディスプレイ３２Ａに対して指差された枠の外側に注目対象があると推定する。そして、注目対象検出部２３Ａは、推定した注目対象がカメラ３１Ｂの画角内に映されるように、カメラ３１Ｂの画角の調整を指示する画角調整コマンドを、送信装置２５Ａを介して通信端末１２Ｂに送信させる。これに応じて、送信装置２５Ａは、画角調整コマンドをメタ情報に含めて送信することができる。

　そして、通信端末１２Ｂでは、図１０に示すように、受信装置２６Ｂが受信したメタ情報に含まれている画角調整コマンドが、入力装置２１に供給される。従って、例えば、カメラ３１Ｂが備える機械制御によって撮影画角を調整するパンまたはチルト（首振り）機構により、画角調整コマンドに基づいて、カメラ３１Ｂの撮影画角を調整することができる。なお、通信端末１２Ａにおいても同様に、通信端末１２Ｂから送信される画角調整コマンドに基づいて、カメラ３１Ａの撮影画角を調整することができる。

　これに応じて、図９のＢの左側に破線で示すように設定されていたカメラ３１Ｂの画角が、注目対象検出部２３Ａからの画角調整コマンドに従って、図９のＢの右側に破線で示すように調整される。そして、画角外にあった物体Ｃがカメラ３１Ｂにより映されるようになり、その映像が通信端末１２Ａに送信される。

　従って、図９のＡの右側に示すように、ディスプレイ３２Ａに物体Ｃが表示され、ユーザＡは、物体Ｃに対して指差しを行う。そして、注目対象検出部２３Ａは、ディスプレイ３２Ａに映されている映像内の物体Ｃを注目対象として特定して、物体Ｃの位置を示す対象位置情報を出力操作部２４Ａに供給する。

　一方、通信端末１２Ｂ側において、出力操作部２４Ｂは、通信端末１２Ａから送信されてきた出力モード情報に従って、出力モードをリモートモードに切り替える。また、出力操作部２４Ｂは、通信端末１２Ａから送信されてきた対象位置情報に基づいて、物体Ｃが注目対象であることを特定する。

　そして、リモートモードにおける第６の出力操作では、出力操作部２４Ｂは、カメラ３１Ｂが撮影した映像に映されている物体ＣにポイントマークＰを重畳させる映像加工を行い、その映像を出力装置２７Ｂに供給する。これにより、出力装置２７Ｂは、出力操作部２４Ｂにより映像加工が行われた映像が全画面に表示されるような出力を行う。

　従って、図９のＢの右側に示すように、ディスプレイ３２Ｂでは、ポイントマークＰが物体Ｃに重畳された映像が画面の全体に表示される。このとき、カメラ３１Ｂにより撮影された映像は、ディスプレイ３２Ａに向かって映像を見ているユーザＡと同じ位置関係となるように、例えば、カメラ３１Ｂの出力から反転されて表示される。なお、ポイントマークＰは、例えば、赤色などの目立つような色で表示したり、注意を引くような点滅表示したりすることができる。また、ポイントマークＰとして任意の形状を使用してもよい。なお、カメラ３１Ｂの画角は、パンまたはチルトを行うことにより調整する他、例えば、ズームアウトすることにより画角を広げたり、広角映像のクロップ位置を変更したりすることにより調整することができる。

　このように、リモートモードにおける第６の出力操作では、カメラ３１の画角を調整して注目対象が映された状態とした後に、カメラ３１により撮影された映像に映されている注目対象にポイントマークＰを重畳させてディスプレイ３２に表示することにより、注目対象を認識させることができる。

　図１１には、リモートモードにおける第７の出力操作として、指差し動作を行うユーザの向きを調整して表示する例が示されている。

　図１１のＡに示すように、通信端末１２Ａ側において、ユーザＡが、ディスプレイ３２Ａに表示されているユーザＢ１に対して指差しを行うと、図４を参照して上述したように、通信端末１２Ｂ側において、出力モードがリモートモードに切り替えられる。

　そして、リモートモードにおける第７の出力操作では、図４の第１の出力操作と同様に、ディスプレイ３２Ｂでは、図１１のＢに示すように、ポイントマークＰがユーザＢ１に重畳されたユーザＢ１乃至Ｂ３の映像が、ピクチャインピクチャ形式で表示される。

　このとき、例えば、カメラ３１Ａおよびディスプレイ３２Ａの位置関係などによって、ディスプレイ３２Ａに映されているユーザＢ１を指差しているユーザＡをカメラ３１Ａにより撮影した映像をディスプレイ３２Ｂに表示したときに、映像内のユーザＡが指差した方向が、ユーザＢ１に向かっていないことがある。そこで、例えば、通信端末１２Ａが、ユーザＡが立体的に表されるように３Ｄモデル化した３Ｄモデル情報をメタ情報に含めて送信することで、通信端末１２Ｂ側において、ユーザＡの向きを調整して表示することができる。

　即ち、図１１のＢの左側に示すように、ディスプレイ３２Ｂに表示されているユーザＡが指差す方向がユーザＢ１に向かっていない場合、リモートコントローラなどを利用してユーザＡの向きを変更させることができる。即ち、３Ｄモデル情報に従ってレンダリングされたユーザＡに対する操作を行って、図１１のＢの右側に示すように、ディスプレイ３２Ｂに表示されるユーザＡが指差す方向がユーザＢ１に向かうように、ユーザＡの向きを調整して表示することができる。このように、ユーザＡが指差す方向がユーザＢ１に向かうようにすることで、ユーザＡが映されている映像を見るだけで、ユーザＢ１が指差されていることを直観的に認識することができる。

　なお、例えば、カメラ３１Ｂにより撮影された映像に基づいてユーザＢ１の位置を認識し、自動的に、ユーザＡが指差す方向がユーザＢ１に向かうような調整を行って表示するようにしてもよい。

　このように、リモートモードにおける第７の出力操作では、ディスプレイ３２に表示されるユーザの向きを調整することにより、より直観的に注目対象を認識させることができる。

　ここで、図１２乃至図１４を参照して、複数のユーザが、それぞれの通信端末１２を利用してコミュニケーションを行う場合のリモートモードの出力操作について説明する。

　例えば、図１２に示すように、ユーザＡが、４人のユーザＢ１乃至Ｂ４を対象としてコミュニケーションを行う場合、図１２のＡに示すように、ディスプレイ３２Ａを４分割して、ユーザＢ１乃至Ｂ４それぞれが映された映像が表示される。また、図１２のＢに示すように、ユーザＢ１乃至Ｂ４それぞれのディスプレイ３２Ｂ－１乃至ディスプレイ３２Ｂ－４には、ユーザＡが映された映像が表示される。

　このような状態でコミュニケーションを行うときに、図１２のＡに示すように、ユーザＡが、ディスプレイ３２Ａに映されているユーザＢ１を指差したとする。この場合、図１２のＢに示すように、ディスプレイ３２Ｂ－１乃至３２Ｂ－４には、ユーザＢ１乃至Ｂ４全員をそれぞれ指差しているようなユーザＡが映されることになり、その映像だけでは、ユーザＡがユーザＢ１を指差していることを認識するのは困難である。

　そこで、ユーザＡが、４人のユーザＢ１乃至Ｂ４を対象としてコミュニケーションを行う場合、図１３または図１４に示すようなリモートモードにおける出力操作が行われる。

　図１３には、リモートモードにおける第８の出力操作として、複数のユーザのうちの、注目対象のユーザのみにマークを表示する例が示されている。

　図１３のＡに示すように、通信端末１２Ａ側において、ユーザＡが、ディスプレイ３２Ａに表示されているユーザＢ１に対して指差しを行うと、図４を参照して上述したように、通信端末１２Ｂ側において、出力モードがリモートモードに切り替えられる。

　そして、リモートモードにおける第８の出力操作では、出力操作部２４Ａは、ユーザＢ１の通信端末１２Ｂに対して送信するメタ情報にのみ、複数のユーザの中で注目対象として指示されたことを示す指示情報を含めて、そのメタ情報を送信させる。一方、ユーザＢ２乃至Ｂ４の通信端末１２Ｂに対して送信するメタ情報には、指示情報は含まれない。

　これにより、ユーザＢ１の通信端末１２Ｂの出力操作部２４Ｂは、注目対象として指示されたことを示す指示情報に従って、ディスプレイ３２Ｂ－１の画面の全体を囲うような枠マークＱを表示するように出力操作を行うことができる。

　従って、図１３のＢに示すように、ユーザＢ１のディスプレイ３２Ｂ－１では、画面の全体を囲うような枠マークＱが表示される一方、ユーザＢ１以外のユーザＢ２乃至Ｂ４のディスプレイ３２Ｂ－２乃至３２Ｂ－４では、枠マークＱの表示は行われない。これにより、ユーザＢ１は、ユーザＡにより指差されたことを認識することができるとともに、ユーザＢ２乃至Ｂ４は、ユーザＡにより指差されていないことを認識することができる。

　このように、リモートモードにおける第８の出力操作では、複数のユーザのうち、注目対象とされたユーザにのみマークを表示することにより、注目対象を認識させることができる。

　図１４には、リモートモードにおける第９の出力操作として、複数のユーザのうちの、注目対象のユーザのみが指差されているように、指差し動作を行うユーザの向きを調整して表示する例が示されている。

　図１４のＡに示すように、通信端末１２Ａ側において、ユーザＡが、ディスプレイ３２Ａに表示されているユーザＢ１に対して指差しを行うと、図４を参照して上述したように、通信端末１２Ｂ側において、出力モードがリモートモードに切り替えられる。

　そして、リモートモードにおける第９の出力操作では、出力操作部２４Ａは、ユーザＢ１の通信端末１２Ｂに対して送信するメタ情報にのみ、複数のユーザの中で注目対象として指示されたことを示す指示情報を含めて、そのメタ情報を送信させる。一方、ユーザＢ２乃至Ｂ４の通信端末１２Ｂに対して送信するメタ情報には、指示情報は含まれない。また、このとき、通信端末１２Ａは、ユーザＢ１乃至Ｂ４それぞれの通信端末１２Ｂに対して、ユーザＡが立体的に表されるように３Ｄモデル化した３Ｄモデル情報をメタ情報に含めて送信する。

　これにより、ユーザＢ１の通信端末１２Ｂの出力操作部２４Ｂは、注目対象として指示されたことを示す指示情報に従って、ディスプレイ３２Ｂ－１に表示されるユーザＡが指差す方向がユーザＢ１に向かうように、ユーザＡの向きを調整して表示するように出力操作を行うことができる。一方、ユーザＢ２乃至Ｂ４それぞれの通信端末１２Ｂの出力操作部２４Ｂは、ディスプレイ３２Ｂ－２乃至３２Ｂ－４に表示されるユーザＡが指差す方向が、それぞれユーザＢ２乃至Ｂ４に向かわないように、ユーザＡの向きを調整して表示するように出力操作を行う。

　従って、図１４のＢに示すように、ユーザＢ１のディスプレイ３２Ｂ－１のみ、ユーザＡが指差す方向がユーザＢ１に向かうように、ユーザＡの向きを調整して表示することができる。一方、ユーザＢ２乃至Ｂ４のディスプレイ３２Ｂ－２乃至３２Ｂ－４では、ユーザＡが指差す方向が、それぞれユーザＢ２乃至Ｂ４以外となるように、ユーザＡの向きを調整して表示することができる。これにより、ユーザＢ１は、ユーザＡにより指差されたことを認識することができるとともに、ユーザＢ２乃至Ｂ４は、ユーザＡにより指差されていないことを認識することができる。

　このように、リモートモードにおける第９の出力操作では、複数のユーザのうち、注目対象とされたユーザのみが指差されるように、ユーザの向きを調整して表示することにより、注目対象を認識させることができる。

　以上のように、リモートモードでは、ディスプレイ３２Ｂに表示される映像に対する映像操作（例えば、ポイントマークＰを重畳させる映像加工や、透過表示、時間切り替え表示、ユーザＡの向きの調整など）を行わせる出力操作が行われる。これにより、通信端末１２ＡのユーザＡにより指差された注目対象を、通信端末１２ＢのユーザＢに認識させることができ、ユーザＡおよびユーザＢは、互いに円滑なコミュニケーションを行うことができる。

　＜ローカルモード＞

　図１５乃至図１７を参照して、ローカルモードにおいて注目対象を認識させる出力操作について説明する。

　例えば、図１５に示すように、ローカルモードの場合、ユーザＡが指差した注目対象である物体Ｃは、ディスプレイ３２Ａを向いているユーザＡの正面からユーザＡを撮影するカメラ３１Ａの画角内にある。このため、通常モードと同様に、カメラ３１ＡがユーザＡとともに物体Ｃを撮影した映像をディスプレイ３２Ｂに映すだけで、物体Ｃを注目対象としてユーザＢ１乃至Ｂ３に認識させることができる。

　これに対し、ユーザＡが指差した注目対象が、カメラ３１Ａの画角内にあったとしても、カメラ３１Ａの死角となる状況がある。そこで、出力操作部２４Ａは、ユーザＡが指差した注目対象がカメラ３１Ａの死角となっていると判断した場合、出力モードをローカルモードに切り替えて、図１６および図１７を参照して説明するような出力操作を行う。

　ここで、ローカルモードにおいて、注目対象がカメラ３１Ａの死角となっている場合には、ユーザＡの視線に応じた方向の映像を撮影可能な、例えば、眼鏡型のデバイスとしてユーザＡが装着するウェアラブルカメラ３３も入力装置２１Ａとして使用される。

　図１６には、ローカルモードにおける出力操作の第１の例が示されている。

　図１６のＡに示すように、通信端末１２Ａ側において、ユーザＡが、ディスプレイ３２Ａに映されている映像外であって、かつ、カメラ３１Ａにより撮影可能な画角内にあるタブレットＴの表示画面に対して指差し動作を行うと、注目対象検出部２３Ａは、タブレットＴの表示画面を注目対象として特定する。そして、注目対象検出部２３Ａは、タブレットＴの位置を示す対象位置情報を出力操作部２４Ａに供給する。

　これにより、出力操作部２４Ａは、対象位置情報に従って、ローカルモードを出力モードとして選択し、ローカルモードを示す出力モード情報を送信装置２５Ａに供給する。このとき、出力操作部２４Ａは、タブレットＴの表示画面がユーザＡ側を向いていて、タブレットＴの表示画面がカメラ３１Ａの死角となっていることを認識する。これに従い、出力操作部２４Ａは、対象位置情報に基づいて、ウェアラブルカメラ３３により撮影された映像に映されているタブレットＴの表示画面にポイントマークＰを重畳させる映像加工を行って、その映像を送信装置２５Ａに供給して送信させる。

　一方、通信端末１２Ｂ側において、出力操作部２４Ｂは、通信端末１２Ａから送信されてきた出力モード情報に従って、出力モードをローカルモードに切り替え、出力装置２７Ｂは、通信端末１２Ａから送信されてきた映像を表示する。

　従って、図１６のＢに示すように、ディスプレイ３２Ｂには、ウェアラブルカメラ３３により撮影された映像に映されているタブレットＴの表示画面にポイントマークＰを重畳した映像が画面の全体に表示される。このとき、ディスプレイ３２Ｂ内に表示されるディスプレイ３２Ａに映されているユーザＢ１乃至Ｂ３の映像は、ユーザＡが見たままとなっている。なお、ポイントマークＰは、例えば、赤色などの目立つような色で表示したり、注意を引くような点滅表示したりすることができる。また、ポイントマークＰとして任意の形状を使用してもよい。

　このように、ローカルモードにおける出力操作では、ウェアラブルカメラ３３により撮影された映像に映されている注目対象にポイントマークＰを重畳させてディスプレイ３２に表示することにより、注目対象を認識させることができる。

　図１７には、ローカルモードにおける出力操作の第２の例が示されている。

　図１７のＡに示すように、通信端末１２Ａ側において、ユーザＡが、ディスプレイ３２Ａに映されている映像外であって、かつ、カメラ３１Ａにより撮影可能な画角内にある物体Ｃ１に対して指差し動作を行うと、注目対象検出部２３Ａは、物体Ｃ１を注目対象として特定する。そして、注目対象検出部２３Ａは、物体Ｃ１の位置を示す対象位置情報を出力操作部２４Ａに供給する。

　これにより、出力操作部２４Ａは、対象位置情報に従って、ローカルモードを出力モードとして選択し、ローカルモードを示す出力モード情報を送信装置２５Ａに供給する。このとき、出力操作部２４Ａは、２つの物体Ｃ１および物体Ｃ２がユーザＡによってカメラ３１Ａに対して隠れた位置にあって、物体Ｃ１がカメラ３１Ａの死角となっていることを認識する。これに従い、出力操作部２４Ａは、対象位置情報に基づいて、ウェアラブルカメラ３３により撮影された映像に映されている物体Ｃ１にポイントマークＰを重畳させる映像加工を行って、その映像を送信装置２５Ａに供給して送信させる。

　従って、図１７のＢに示すように、ディスプレイ３２Ｂには、ウェアラブルカメラ３３により撮影された映像に映されている２つの物体Ｃ１および物体Ｃ２のうち、注目対象である物体Ｃ１にポイントマークＰを重畳した映像が画面の全体に表示される。なお、ポイントマークＰは、例えば、赤色などの目立つような色で表示したり、注意を引くような点滅表示したりすることができる。また、ポイントマークＰとして任意の形状を使用してもよい。

　以上のように、ローカルモードでは、カメラ３１以外のウェアラブルカメラ３３により撮影された映像に映されている注目対象に対してポイントマークＰを重畳させる出力操作が行われる。これにより、通信端末１２ＡのユーザＡにより指差された注目対象を、通信端末１２ＢのユーザＢに認識させることができ、ユーザＡおよびユーザＢは、互いに円滑なコミュニケーションを行うことができる。

　なお、ローカルモードでは、注目対象がカメラ３１Ａの死角となっていることが認識されたとき、ウェアラブルカメラ３３を使用する他、例えば、ユーザＡが居る部屋に設置されている他のカメラを使用してもよい。この場合、カメラ３１Ａ以外のカメラにより撮影された映像に映されている注目対象にポイントマークＰを重畳するような映像加工が行われて、その映像がディスプレイ３２Ｂに表示される。

　＜ローカルブラインドモード＞

　図１８を参照して、ローカルブラインドモードにおいて注目対象を認識させる出力操作について説明する。

　ローカルブラインドモードでは、図１６および図１７と同様に、ウェアラブルカメラ３３が入力装置２１Ａとして使用される。

　図１８のＡに示すように、通信端末１２Ａ側において、ユーザＡが、ディスプレイ３２Ａに映されている映像外であって、かつ、カメラ３１Ａにより撮影可能な画角外となる所定箇所に対して指差し動作を行うと、注目対象検出部２３Ａは、その所定箇所を注目対象として特定する。そして、注目対象検出部２３Ａは、注目対象を示す対象位置情報を出力操作部２４Ａに供給する。

　これにより、出力操作部２４Ａは、対象位置情報に従って、ローカルブラインドモードを出力モードとして選択し、ローカルブラインドモードを示す出力モード情報を送信装置２５Ａに供給する。このとき、出力操作部２４Ａは、注目対象がカメラ３１Ａの死角となっていることを認識する。これに従い、出力操作部２４Ａは、対象位置情報に基づいて、ウェアラブルカメラ３３により撮影された映像に映されている注目対象にポイントマークＰを重畳させる映像加工を行って、その映像を送信装置２５Ａに供給して送信させる。

　一方、通信端末１２Ｂ側において、出力操作部２４Ｂは、通信端末１２Ａから送信されてきた出力モード情報に従って、出力モードをローカルブラインドモードに切り替え、出力装置２７Ｂは、通信端末１２Ａから送信されてきた映像を表示する。

　従って、図１８のＢに示すように、ディスプレイ３２Ｂには、ウェアラブルカメラ３３により撮影された映像に映されている注目対象にポイントマークＰを重畳した映像が画面の全体に表示される。このとき、ディスプレイ３２Ｂ内に表示されるディスプレイ３２Ａに映されているユーザＢ１乃至Ｂ３の映像は、ユーザＡが見たままとなっている。なお、ポイントマークＰは、例えば、赤色などの目立つような色で表示したり、注意を引くような点滅表示したりすることができる。また、ポイントマークＰとして任意の形状を使用してもよい。

　以上のように、ローカルブラインドモードでは、カメラ３１以外のウェアラブルカメラ３３により撮影された映像に映されている注目対象に対してポイントマークＰを重畳させる出力操作が行われる。これにより、通信端末１２ＡのユーザＡにより指差された注目対象を、通信端末１２ＢのユーザＢに認識させることができ、ユーザＡおよびユーザＢは、互いに円滑なコミュニケーションを行うことができる。

　なお、ローカルブラインドモードでは、注目対象がカメラ３１Ａの死角となっていることが認識されたとき、ウェアラブルカメラ３３を使用する他、例えば、ユーザＡが居る部屋に設置されている他のカメラを使用してもよい。この場合、カメラ３１Ａ以外のカメラにより撮影された映像に映されている注目対象にポイントマークＰを重畳するような映像加工が行われて、その映像がディスプレイ３２Ｂに表示される。

　＜通信処理およびコミュニケーション処理＞

　図１９は、コミュニケーションシステム１１における通信処理を説明するフローチャートである。

　ステップＳ１１において、通信端末１２Ａおよび通信端末１２Ｂは、ネットワークを介して互いに通信の接続を確立する通信接続処理を行う。

　ステップＳ１２において、通信端末１２Ａおよび通信端末１２Ｂは、コミュニケーション処理を開始するためのコミュニケーション準備処理として、通信端末１２Ａおよび通信端末１２Ｂそれぞれの端末情報を交換する。例えば、通信端末１２Ａおよび通信端末１２Ｂは、ディスプレイ３２のサイズおよびカメラ３１の仕様（画角や配置など）を、端末情報として交換する。

　ステップＳ１３において、通信端末１２Ａおよび通信端末１２Ｂそれぞれのディスプレイ３２に、互いに相手側のカメラ３１で撮影された映像が表示され、コミュニケーション処理（図２０のフローチャート参照）が行われる。

　ステップＳ１４において、通信端末１２Ａおよび通信端末１２Ｂは、コミュニケーション処理を終了するか否かを判定し、コミュニケーション処理を終了すると判定されるまでステップＳ１３のコミュニケーション処理が継続して行われる。

　例えば、通信端末１２Ａおよび通信端末１２Ｂそれぞれのユーザが、コミュニケーション処理の終了を指示する操作を行うと、ステップＳ１４において、コミュニケーション処理を終了すると判定され、処理はステップＳ１５に進む。

　ステップＳ１５において、通信端末１２Ａおよび通信端末１２Ｂは、互いに通信を遮断する通信遮断処理を行った後、通信処理は終了される。

　以上のように、通信端末１２Ａおよび通信端末１２Ｂは、コミュニケーション準備処理で端末情報を交換することで、コミュニケーション処理において、注目対象を正確に認識させるように出力操作を行うことができる。

　図２０は、図１９のステップＳ１３において行われるコミュニケーション処理を説明するフローチャートである。なお、図２０では、通信端末１２Ａ側において行われるコミュニケーション処理について説明するが、通信端末１２Ｂ側においても同様のコミュニケーション処理が行われる。

　ステップＳ２１において、トリガ検出部２２Ａは、入力装置２１Ａから入力される映像信号から、ユーザＡが指差し動作を行ったか否かを判定する。

　ステップＳ２１において、トリガ検出部２２Ａが、ユーザＡが指差し動作を行っていないと判定した場合、処理はステップＳ２２に進む。

　ステップＳ２２において、トリガ検出部２２Ａは、注目対象検出部２３Ａに供給するトリガ信号の出力をオフにする。このトリガ信号に従って、注目対象検出部２３Ａは、注目対象を検出する処理を行わずに、出力操作部２４Ａに対する対象位置情報の供給を停止する。

　ステップＳ２３において、出力操作部２４Ａは、注目対象検出部２３Ａから対象位置情報の供給が停止しているのに従い、出力モードを通常モードに切り替える。

　一方、ステップＳ２１において、トリガ検出部２２Ａが、ユーザＡが指差し動作を行ったと判定した場合、処理はステップＳ２４に進む。

　ステップＳ２４において、トリガ検出部２２Ａは、注目対象検出部２３Ａに供給するトリガ信号の出力をオンにする。このトリガ信号に従って、注目対象検出部２３Ａは、入力装置２１Ａから入力される映像信号から注目対象を検出する処理を行い、注目対象の位置を示す対象位置情報を出力操作部２４Ａに供給する。

　ステップＳ２５において、出力操作部２４Ａは、ステップＳ２４で注目対象検出部２３Ａから供給される対象位置情報に基づいて、リモートモード、ローカルモード、およびローカルブラインドモードのいずれを、出力モードとして選択するかを判定する。

　ステップＳ２５において、出力操作部２４Ａが、リモートモードを出力モードとして選択したと判定した場合、処理はステップＳ２６に進む。

　ステップＳ２６において、出力操作部２４Ａは、リモートモードを示す出力モード情報を、ステップＳ２４で注目対象検出部２３Ａから供給された対象位置情報とともに送信装置２５Ａに供給する。これに従い、送信装置２５Ａは、入力装置２１Ａから入力される映像信号とともに、リモートモードを示す出力モード情報と対象位置情報とを少なくとも含むメタ情報を、通信端末１２Ｂに送信する。

　一方、ステップＳ２５において、出力操作部２４Ａが、ローカルモードを出力モードとして選択したと判定した場合、処理はステップＳ２７に進む。

　ステップＳ２７において、出力操作部２４Ａは、ローカルモードを示す出力モード情報を、ステップＳ２４で注目対象検出部２３Ａから供給された対象位置情報とともに送信装置２５Ａに供給する。これに従い、送信装置２５Ａは、入力装置２１Ａから入力される映像信号とともに、ローカルモードを示す出力モード情報と対象位置情報とを少なくとも含むメタ情報を、通信端末１２Ｂに送信する。

　一方、ステップＳ２５において、出力操作部２４Ａが、ローカルブラインドモードを出力モードとして選択したと判定した場合、処理はステップＳ２８に進む。

　ステップＳ２８において、出力操作部２４Ａは、ローカルブラインドモードを示す出力モード情報を、ステップＳ２４で注目対象検出部２３Ａから供給された対象位置情報とともに送信装置２５Ａに供給する。これに従い、送信装置２５Ａは、入力装置２１Ａから入力される映像信号とともに、ローカルブラインドモードを示す出力モード情報と対象位置情報とを少なくとも含むメタ情報を、通信端末１２Ｂに送信する。

　ステップＳ２３、ステップＳ２６、ステップＳ２７、またはステップＳ２８の処理後、処理はステップＳ２９に進み、受信装置２６Ａは、通信端末１２Ｂから映像信号とともに送信されてくるメタ情報に含まれている出力モード情報を受信したか否かを判定する。

　ステップＳ２９において、受信装置２６Ａが出力モード情報を受信していないと判定した場合、処理はステップＳ３０に進む。

　ステップＳ３０において、出力操作部２４Ａは、受信装置２６Ａが出力モード情報を受信していないのに従い、出力モードを通常モードに切り替える。

　一方、ステップＳ２９において、受信装置２６Ａが出力モード情報を受信したと判定した場合、受信装置２６Ａは、メタ情報に含まれている出力モード情報および対象位置情報を出力操作部２４Ａに供給し、処理はステップＳ３１に進む。

　ステップＳ３１において、出力操作部２４Ａは、受信装置２６Ａから供給される出力モード情報が、出力モードとして、リモートモード、ローカルモード、およびローカルブラインドモードのいずれを示しているかを判定する。

　ステップＳ３１において、出力操作部２４Ａが、出力モード情報がリモートモードを示していると判定した場合、処理はステップＳ３２に進む。

　ステップＳ３２において、出力操作部２４Ａは、出力モード情報に従って、通信端末１２ＡのユーザＢに注目対象を認識させる出力操作の出力モードを、リモートモードに切り替える。

　ステップＳ３３において、出力操作部２４Ａは、受信装置２６Ａから出力モード情報とともに供給される対象位置情報に基づいて、図４乃至図１４を参照して上述したようなリモートモードで出力操作を行う。

　一方、ステップＳ３１において、出力操作部２４Ａが、出力モード情報がローカルモードを示していると判定した場合、処理はステップＳ３４に進む。

　ステップＳ３４において、出力操作部２４Ａは、出力モード情報に従って、通信端末１２ＡのユーザＢに注目対象を認識させる出力操作の出力モードを、ローカルモードに切り替える。

　ステップＳ３５において、出力操作部２４Ａは、受信装置２６Ａから出力モード情報とともに供給される対象位置情報に基づいて、図１６および図１７を参照して上述したようなローカルモードで出力操作を行う。

　一方、ステップＳ３１において、出力操作部２４Ａが、出力モード情報がローカルブラインドモードを示していると判定した場合、処理はステップＳ３６に進む。

　ステップＳ３６において、出力操作部２４Ａは、出力モード情報に従って、通信端末１２ＡのユーザＢに注目対象を認識させる出力操作の出力モードを、ローカルブラインドモードに切り替える。

　ステップＳ３７において、出力操作部２４Ａは、受信装置２６Ａから出力モード情報とともに供給される対象位置情報に基づいて、図１８を参照して上述したようなローカルブラインドモードで出力操作を行う。

　そして、ステップＳ３０、ステップＳ３３、ステップＳ３５、またはステップＳ３７の処理後、処理は図１９のステップＳ１４に戻り、上述したようにコミュニケーション処理を終了すると判定されるまで継続してコミュニケーション処理が行われる。

　以上のように、コミュニケーションシステム１１は、注目対象の位置に従って、その注目対象を認識させる出力操作を行う際の出力モードを切り替えることができるので、注目対象の位置に応じた適切な出力操作を行うことができる。これにより、互いのユーザは、相手側のユーザが指差した注目対象を容易に認識することができ、より円滑なコミュニケーションを行うことができる。

　なお、本実施の形態では、ユーザが注目対象を指差す動作を例に説明を行ったが、指差しに限定されない。例えば、注目対象検出部２３は、ユーザが手を広げたことを検出したとき、その手の近傍に注目対象があるとして、ユーザの手の位置の近傍にあるものを注目対象として検出することができる。または、注目対象検出部２３は、ユーザの視線を検出し、その視線の先にあるものを注目対象として検出することができる。

　さらに、通信端末１２では、入力装置２１Ａとして音声を入力するマイクロホンを使用することができる。この場合、トリガ検出部２２は、マイクロホンから入力されるユーザの音声から、音声認識技術を使用して、特定のフレーズ（例えば、「見て」や「ご覧下さい」、「注目」など）を認識する。そして、トリガ検出部２２は、特定のフレーズを認識したタイミングでトリガ信号をオンにする。これにより、注目対象検出部２３Ａは、そのタイミングでユーザが指差したり、視線を向けたりしているものを注目対象として検出することができる。

　また、例えば、コミュニケーションシステム１１を利用したコミュニケーションでプレゼンテーションソフトが使用されているときに、トリガ検出部２２Ａは、途中でスライドショーを閉じたタイミングでトリガ信号をオンにしてもよい。さらに、トリガ検出部２２Ａは、通信端末１２に予め用意された所定の操作手段（ボタンなど）に対する操作が行われたタイミングでトリガ信号をオンにしてもよい。

　なお、本実施の形態においては、指差し動作を行ったユーザ側の通信端末１２において注目対象を検出する処理を行って、出力モードを切り替える処理を行った後、出力モード情報を含むメタ情報を送信する構成について説明を行っている。これに対し、例えば、指差し動作を行ったユーザ側の通信端末１２のカメラ３１で撮影された映像を送信し、その映像を受信した通信端末１２において注目対象を検出する処理を行って、出力モードを切り替える処理を行うようにしてもよい。この場合、その映像を受信した通信端末１２において、受信装置２６からトリガ検出部２２に映像を供給して、トリガを検出する処理も行うことができる。なお、送信側の通信端末１２においてトリガを検出する処理を行う場合、受信装置２６からトリガ検出部２２に映像を供給するように構成する必要はない。

　また、コミュニケーションシステム１１では、これらの各処理について、通信端末１２Ａおよび通信端末１２Ｂのどちらかで全てを行う他、それぞれで一部を分担して行うように構成してもよい。

　また、通信端末１２では、出力装置２７Ａとして音声を出力するスピーカを使用することができる。この場合、例えば、映像に映されている物体を認識する物体認識処理により認識された物体の名称などを、スピーカから音声で出力することができる。

　なお、上述のフローチャートを参照して説明した各処理は、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいは個別に実行される処理（例えば、並列処理あるいはオブジェクトによる処理）も含むものである。また、プログラムは、１のCPUにより処理されるものであっても良いし、複数のCPUによって分散処理されるものであっても良い。

　また、上述した一連の処理（通信方法）は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラムが記録されたプログラム記録媒体からインストールされる。

　図２１は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

　コンピュータにおいて、CPU（Central Processing Unit）１０１，ROM（Read Only Memory）１０２，RAM（Random Access Memory）１０３は、バス１０４により相互に接続されている。

　バス１０４には、さらに、入出力インタフェース１０５が接続されている。入出力インタフェース１０５には、キーボード、マウス、マイクロホンなどよりなる入力部１０６、ディスプレイ、スピーカなどよりなる出力部１０７、ハードディスクや不揮発性のメモリなどよりなる記憶部１０８、ネットワークインタフェースなどよりなる通信部１０９、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア１１１を駆動するドライブ１１０が接続されている。

　以上のように構成されるコンピュータでは、CPU１０１が、例えば、記憶部１０８に記憶されているプログラムを、入出力インタフェース１０５及びバス１０４を介して、RAM１０３にロードして実行することにより、上述した一連の処理が行われる。

　コンピュータ（CPU１０１）が実行するプログラムは、例えば、磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等）、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア１１１に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。

　そして、プログラムは、リムーバブルメディア１１１をドライブ１１０に装着することにより、入出力インタフェース１０５を介して、記憶部１０８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部１０９で受信し、記憶部１０８にインストールすることができる。その他、プログラムは、ROM１０２や記憶部１０８に、あらかじめインストールしておくことができる。

　なお、本技術は以下のような構成も取ることができる。
（１）
　ユーザが指示した注目対象を検出する注目対象検出部と、
　前記注目対象の位置に従って、前記ユーザの通信相手となる他のユーザに前記注目対象を認識させる出力操作を行う際の出力モードを切り替える出力操作部と
　を備える通信装置。
（２）
　前記ユーザが前記注目対象を指示する動作を行ったか否かを検出し、その動作が行われたタイミングを示すトリガ信号を前記注目対象検出部に供給するトリガ検出部
　をさらに備え、
　前記注目対象検出部は、前記トリガ信号により前記ユーザが前記注目対象を指示する動作を行ったことが示されると、前記ユーザの動作に基づいて前記注目対象を検出する処理を行う
　上記（１）に記載の通信装置。
（３）
　前記出力操作部は、前記注目対象の位置が、前記他のユーザ側の映像を表示する表示装置の映像内である場合、前記出力モードを、前記他のユーザ側の前記表示装置に表示される映像に対する所定の映像操作を行わせる出力操作を行うリモートモードに切り替える処理を行い、前記注目対象の位置を示す対象位置情報とともに、前記リモートモードを示す出力モード情報を送信させる
　上記（１）または（２）に記載の通信装置。
（４）
　前記出力操作部は、前記他のユーザ側から前記リモートモードを示す出力モード情報と前記対象位置情報とが送信されてきた場合、前記リモートモードで前記対象位置情報に基づいて、前記他のユーザが指示した前記注目対象を前記ユーザに認識させる出力操作を行う
　上記（３）に記載の通信装置。
（５）
　前記出力操作部は、前記注目対象の位置が、前記他のユーザ側の映像を表示する表示装置の映像外であって、かつ、前記表示装置を向いている前記ユーザの正面から前記ユーザを撮影する撮影装置の画角内である場合、前記出力モードを、前記撮影装置以外の他の撮影装置により撮影された映像に映されている前記注目対象に対する所定の映像操作を行わせる出力操作を行うローカルモードに切り替える処理を行い、前記他の撮影装置により撮影された映像とともに、前記ローカルモードを示す出力モード情報を送信させる
　上記（１）から（４）までのいずれかに記載の通信装置。
（６）
　前記出力操作部は、前記他のユーザ側から前記ローカルモードを示す出力モード情報と前記他の撮影装置により撮影された映像とが送信されてきた場合、前記ローカルモードで前記注目対象に対して所定のマークを重畳させる映像加工が行われた前記映像により、前記他のユーザが指示した前記注目対象を前記ユーザに認識させる出力操作を行う
　上記（５）に記載の通信装置。
（７）
　前記出力操作部は、前記注目対象の位置が、前記他のユーザ側の映像を表示する表示装置の映像外であって、かつ、前記表示装置を向いている前記ユーザの正面から前記ユーザを撮影する撮影装置の画角外である場合、前記出力モードを、前記撮影装置以外の他の撮影装置により撮影された映像に映されている前記注目対象に対する所定の映像操作を行わせるローカルブラインドモードに切り替える処理を行い、前記他の撮影装置により撮影された映像とともに、前記ローカルブラインドモードを示す出力モード情報を送信させる
　上記（１）から（６）までのいずれかに記載の通信装置。
（８）
　前記出力操作部は、前記他のユーザ側から前記ローカルブラインドモードを示す出力モード情報と前記他の撮影装置により撮影された映像とが送信されてきた場合、前記ローカルブラインドモードで前記注目対象に対して所定のマークを重畳させる映像加工が行われた前記映像により、前記他のユーザが指示した前記注目対象を前記ユーザに認識させる出力操作を行う
　上記（７）に記載の通信装置。
（９）
　前記出力操作部は、前記リモートモードにおいて、前記他のユーザ側の前記表示装置に前記他のユーザ側の映像を表示させ、その表示させた前記映像に映されている前記注目対象に対して所定のマークを重畳表示させる映像加工を行う
　上記（３）に記載の通信装置。
（１０）
　前記出力操作部は、前記リモートモードにおいて、前記他のユーザ側の映像において前記注目対象が写されている領域を切り出す映像加工を行い、前記他のユーザ側の前記表示装置に表示されている前記ユーザに対する所定箇所に前記切り出した映像を表示させる出力操作を行う
　上記（３）に記載の通信装置。
（１１）
　前記出力操作部は、前記リモートモードにおいて、前記他のユーザ側の前記表示装置に表示されている前記ユーザに重畳して前記他のユーザ側の映像を透過表示させ、その透過表示させた前記映像に映されている前記注目対象を、前記ユーザに対する所定箇所に配置させる映像加工を行う
　上記（３）に記載の通信装置。
（１２）
　前記出力操作部は、前記リモートモードにおいて、前記他のユーザ側の前記表示装置に表示されている前記ユーザに重畳して前前記他のユーザ側の映像を時間切り替え表示させ、その時間切り替え表示させた前記映像に映されている前記注目対象を、前記ユーザに対する所定箇所に配置させる映像加工を行う
　上記（３）に記載の通信装置。
（１３）
　前記出力操作部は、前記リモートモードにおいて、前記ユーザが前記注目対象を指示したタイミングを示す情報を、前記出力モード情報および前記対象位置情報とともに送信する
　上記（３）に記載の通信装置。
（１４）
　前記出力操作部は、前記リモートモードにおいて、前記他のユーザ側の撮影装置の画角を調整して、前記注目対象が映された状態とした後に、前記他のユーザ側の撮影装置により撮影される映像に映されている前記注目対象に対して所定のマークを重畳表示させる映像加工を行う
　上記（３）に記載の通信装置。
（１５）
　前記出力操作部は、前記リモートモードにおいて、前記ユーザが前記注目対象を指示している方向が、前記他のユーザ側の前記注目対象に向かうように、前記他のユーザの前記表示装置に表示される前記ユーザの向きを調整させる
　上記（３）に記載の通信装置。
（１６）
　前記出力操作部は、前記ローカルモードにおいて、前記撮影装置の画角内である前記注目対象の前記ユーザにより指示された箇所が前記ユーザ側を向いているとき、前記他の撮影装置により撮影された映像において、その個所に対してマークを重畳させる映像加工を行う
　上記（５）に記載の通信装置。
（１７）
　前記出力操作部は、前記ローカルモードにおいて、前記撮影装置の画角内である前記注目対象が前記撮影装置に対して隠れた位置にあるとき、前記他の撮影装置により撮影された映像において、前記注目対象に対してマークを重畳させる映像加工を行う
　上記（５）に記載の通信装置。
（１８）
　前記注目対象検出部は、前記ユーザが前記注目対象に対して指差し動作をしたときに、前記ユーザが指差した方向の延長線上にあるものを注目対象として検出する
　上記（１）から（１７）までのいずれかに記載の通信装置。
（１９）
　ユーザが指示した注目対象を検出し、
　前記注目対象の位置に従って、前記ユーザの通信相手となる他のユーザに前記注目対象を認識させる出力操作を行う際の出力モードを切り替える
　ステップを含む通信方法。
（２０）
　ユーザが指示した注目対象を検出し、
　前記注目対象の位置に従って、前記ユーザの通信相手となる他のユーザに前記注目対象を認識させる出力操作を行う際の出力モードを切り替える
　ステップを含む通信処理をコンピュータに実行させるプログラム。

　なお、本実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。

　１１　コミュニケーションシステム，　１２　通信端末，　２１　入力装置，　２２　トリガ検出部，　２３　注目対象検出部，　２４　出力操作部，　２５　送信装置，　２６　受信装置，　２７　出力装置，　３１　カメラ，　３２　ディスプレイ，　３３　ウェアラブルカメラ

Claims

　ユーザが指示した注目対象を検出する注目対象検出部と、
　前記注目対象の位置に従って、前記ユーザの通信相手となる他のユーザに前記注目対象を認識させる出力操作を行う際の出力モードを切り替える出力操作部と
　を備える通信装置。
　前記ユーザが前記注目対象を指示する動作を行ったか否かを検出し、その動作が行われたタイミングを示すトリガ信号を前記注目対象検出部に供給するトリガ検出部
　をさらに備え、
　前記注目対象検出部は、前記トリガ信号により前記ユーザが前記注目対象を指示する動作を行ったことが示されると、前記ユーザの動作に基づいて前記注目対象を検出する処理を行う
　請求項１に記載の通信装置。
　前記出力操作部は、前記注目対象の位置が、前記他のユーザ側の映像を表示する表示装置の映像内である場合、前記出力モードを、前記他のユーザ側の前記表示装置に表示される映像に対する所定の映像操作を行わせる出力操作を行うリモートモードに切り替える処理を行い、前記注目対象の位置を示す対象位置情報とともに、前記リモートモードを示す出力モード情報を送信させる
　請求項１に記載の通信装置。
　前記出力操作部は、前記他のユーザ側から前記リモートモードを示す出力モード情報と前記対象位置情報とが送信されてきた場合、前記リモートモードで前記対象位置情報に基づいて、前記他のユーザが指示した前記注目対象を前記ユーザに認識させる出力操作を行う
　請求項３に記載の通信装置。
　前記出力操作部は、前記注目対象の位置が、前記他のユーザ側の映像を表示する表示装置の映像外であって、かつ、前記表示装置を向いている前記ユーザの正面から前記ユーザを撮影する撮影装置の画角内である場合、前記出力モードを、前記撮影装置以外の他の撮影装置により撮影された映像に映されている前記注目対象に対する所定の映像操作を行わせる出力操作を行うローカルモードに切り替える処理を行い、前記他の撮影装置により撮影された映像とともに、前記ローカルモードを示す出力モード情報を送信させる
　請求項１に記載の通信装置。
　前記出力操作部は、前記他のユーザ側から前記ローカルモードを示す出力モード情報と前記他の撮影装置により撮影された映像とが送信されてきた場合、前記ローカルモードで前記注目対象に対して所定のマークを重畳させる映像加工が行われた前記映像により、前記他のユーザが指示した前記注目対象を前記ユーザに認識させる出力操作を行う
　請求項５に記載の通信装置。
　前記出力操作部は、前記注目対象の位置が、前記他のユーザ側の映像を表示する表示装置の映像外であって、かつ、前記表示装置を向いている前記ユーザの正面から前記ユーザを撮影する撮影装置の画角外である場合、前記出力モードを、前記撮影装置以外の他の撮影装置により撮影された映像に映されている前記注目対象に対する所定の映像操作を行わせるローカルブラインドモードに切り替える処理を行い、前記他の撮影装置により撮影された映像とともに、前記ローカルブラインドモードを示す出力モード情報を送信させる
　請求項１に記載の通信装置。
　前記出力操作部は、前記他のユーザ側から前記ローカルブラインドモードを示す出力モード情報と前記他の撮影装置により撮影された映像とが送信されてきた場合、前記ローカルブラインドモードで前記注目対象に対して所定のマークを重畳させる映像加工が行われた前記映像により、前記他のユーザが指示した前記注目対象を前記ユーザに認識させる出力操作を行う
　請求項７に記載の通信装置。
　前記出力操作部は、前記リモートモードにおいて、前記他のユーザ側の前記表示装置に前記他のユーザ側の映像を表示させ、その表示させた前記映像に映されている前記注目対象に対して所定のマークを重畳表示させる映像加工を行う
　請求項３に記載の通信装置。
　前記出力操作部は、前記リモートモードにおいて、前記他のユーザ側の映像において前記注目対象が写されている領域を切り出す映像加工を行い、前記他のユーザ側の前記表示装置に表示されている前記ユーザに対する所定箇所に前記切り出した映像を表示させる出力操作を行う
　請求項３に記載の通信装置。
　前記出力操作部は、前記リモートモードにおいて、前記他のユーザ側の前記表示装置に表示されている前記ユーザに重畳して前記他のユーザ側の映像を透過表示させ、その透過表示させた前記映像に映されている前記注目対象を、前記ユーザに対する所定箇所に配置させる映像加工を行う
　請求項３に記載の通信装置。
　前記出力操作部は、前記リモートモードにおいて、前記他のユーザ側の前記表示装置に表示されている前記ユーザに重畳して前前記他のユーザ側の映像を時間切り替え表示させ、その時間切り替え表示させた前記映像に映されている前記注目対象を、前記ユーザに対する所定箇所に配置させる映像加工を行う
　請求項３に記載の通信装置。
　前記出力操作部は、前記リモートモードにおいて、前記ユーザが前記注目対象を指示したタイミングを示す情報を、前記出力モード情報および前記対象位置情報とともに送信する
　請求項３に記載の通信装置。
　前記出力操作部は、前記リモートモードにおいて、前記他のユーザ側の撮影装置の画角を調整して、前記注目対象が映された状態とした後に、前記他のユーザ側の撮影装置により撮影される映像に映されている前記注目対象に対して所定のマークを重畳表示させる映像加工を行う
　請求項３に記載の通信装置。
　前記出力操作部は、前記リモートモードにおいて、前記ユーザが前記注目対象を指示している方向が、前記他のユーザ側の前記注目対象に向かうように、前記他のユーザの前記表示装置に表示される前記ユーザの向きを調整させる
　請求項３に記載の通信装置。
　前記出力操作部は、前記ローカルモードにおいて、前記撮影装置の画角内である前記注目対象の前記ユーザにより指示された箇所が前記ユーザ側を向いているとき、前記他の撮影装置により撮影された映像において、その個所に対してマークを重畳させる映像加工を行う
　請求項５に記載の通信装置。
　前記出力操作部は、前記ローカルモードにおいて、前記撮影装置の画角内である前記注目対象が前記撮影装置に対して隠れた位置にあるとき、前記他の撮影装置により撮影された映像において、前記注目対象に対してマークを重畳させる映像加工を行う
　請求項５に記載の通信装置。
　前記注目対象検出部は、前記ユーザが前記注目対象に対して指差し動作をしたときに、前記ユーザが指差した方向の延長線上にあるものを注目対象として検出する
　請求項１に記載の通信装置。
　ユーザが指示した注目対象を検出し、
　前記注目対象の位置に従って、前記ユーザの通信相手となる他のユーザに前記注目対象を認識させる出力操作を行う際の出力モードを切り替える
　ステップを含む通信方法。
　ユーザが指示した注目対象を検出し、
　前記注目対象の位置に従って、前記ユーザの通信相手となる他のユーザに前記注目対象を認識させる出力操作を行う際の出力モードを切り替える
　ステップを含む通信処理をコンピュータに実行させるプログラム。