JP2024044908A - 方法、プログラム、及び端末装置 - Google Patents

方法、プログラム、及び端末装置 Download PDF

Info

Publication number
JP2024044908A
JP2024044908A JP2022150732A JP2022150732A JP2024044908A JP 2024044908 A JP2024044908 A JP 2024044908A JP 2022150732 A JP2022150732 A JP 2022150732A JP 2022150732 A JP2022150732 A JP 2022150732A JP 2024044908 A JP2024044908 A JP 2024044908A
Authority
JP
Japan
Prior art keywords
user
gaze
screen
dialogue
objects
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022150732A
Other languages
English (en)
Inventor
航 加来
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2022150732A priority Critical patent/JP2024044908A/ja
Priority to US18/465,608 priority patent/US20240094812A1/en
Priority to CN202311207692.2A priority patent/CN117749978A/zh
Publication of JP2024044908A publication Critical patent/JP2024044908A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/157Conference systems defining a virtual conference space and using avatars or agents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/013Eye tracking input arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】通信回線を用いて遠隔対話サービスを提供する技術を改善する。【解決手段】遠隔対話サービスを提供するサーバ20と通信する端末装置10が実行する方法であって、自装置のユーザの各対話相手である他のユーザの顔を示す第1オブジェクトを含む複数のオブジェクトを画面に表示すること、ユーザが注視している画面上のオブジェクトをユーザの注視オブジェクトとして検出すること、ユーザの注視オブジェクトを示す情報をサーバ20へ送信すること、各対話相手の注視オブジェクトを示す情報をサーバ20から受信すること、画面において、各対話相手の視線が注視オブジェクトに向けられるという第1条件、及び各対話相手の視線上に注視オブジェクト以外のオブジェクトが存在しないという第2条件を満たすように、各第1オブジェクトの向き及び複数のオブジェクトの配置を制御することを含む。【選択図】図1

Description

本開示は、方法、プログラム、及び端末装置に関する。
従来、通信回線を用いて遠隔対話サービスを提供する技術が知られている。例えば特許文献1には、複数のユーザが互いに相手の映像を見ながら通話することが可能な通話システムにおいて、画面に表示されるユーザをカメラ目線に修正又は変更することが開示されている。
特許第6849133号
通信回線を用いて遠隔対話サービスを提供する技術には改善の余地がある。
かかる事情に鑑みてなされた本開示の目的は、通信回線を用いて遠隔対話サービスを提供する技術を改善することにある。
本開示の一実施形態に係る方法は、
遠隔対話サービスを提供するサーバと通信する端末装置が実行する方法であって、
自装置のユーザの各対話相手である他のユーザの顔を示す第1オブジェクトを含む複数のオブジェクトを画面に表示すること、
前記ユーザが注視している前記画面上のオブジェクトを前記ユーザの注視オブジェクトとして検出すること、
前記ユーザの注視オブジェクトを示す情報を前記サーバへ送信すること、
前記各対話相手の注視オブジェクトを示す情報を前記サーバから受信すること、
前記画面において、前記各対話相手の視線が注視オブジェクトに向けられるという第1条件、及び前記各対話相手の視線上に注視オブジェクト以外のオブジェクトが存在しないという第2条件を満たすように、各前記第1オブジェクトの向き及び前記複数のオブジェクトの配置を制御することを含む。
本開示の一実施形態に係るプログラムは、
遠隔対話サービスを提供するサーバと通信する端末装置に、
自装置のユーザの各対話相手である他のユーザの顔を示す第1オブジェクトを含む複数のオブジェクトを画面に表示すること、
前記ユーザが注視している前記画面上のオブジェクトを前記ユーザの注視オブジェクトとして検出すること、
前記ユーザの注視オブジェクトを示す情報を前記サーバへ送信すること、
前記各対話相手の注視オブジェクトを示す情報を前記サーバから受信すること、
前記画面において、前記各対話相手の視線が注視オブジェクトに向けられるという第1条件、及び前記各対話相手の視線上に注視オブジェクト以外のオブジェクトが存在しないという第2条件を満たすように、各前記第1オブジェクトの向き及び前記複数のオブジェクトの配置を制御することを実行させる。
本開示の一実施形態に係る端末装置は、
遠隔対話サービスを提供するサーバと通信する通信部と、画面を表示する表示部と、自装置のユーザの顔の画像を生成するカメラ部と、制御部と、を備える端末装置であって、
前記制御部は、
前記ユーザの各対話相手である他のユーザの顔を示す第1オブジェクトを含む複数のオブジェクトを画面に表示させ、
前記画像に基づき前記ユーザが注視していると判定された前記画面上のオブジェクトを前記ユーザの注視オブジェクトとして検出し、
前記ユーザの注視オブジェクトを示す情報を前記サーバへ送信し、
前記各対話相手の注視オブジェクトを示す情報を前記サーバから受信し、
前記画面において、前記各対話相手の視線が注視オブジェクトに向けられるという第1条件、及び前記各対話相手の視線上に注視オブジェクト以外のオブジェクトが存在しないという第2条件を満たすように、各前記第1オブジェクトの向き及び前記複数のオブジェクトの配置を制御する。
本開示の一実施形態によれば、通信回線を用いて遠隔対話サービスを提供する技術が改善される。
本開示の一実施形態に係るシステムの概略構成を示すブロック図である。 端末装置に表示される画面の第1例を示す図である。 端末装置の概略構成を示すブロック図である。 サーバの概略構成を示すブロック図である。 システムの第1動作を示すシーケンス図である。 システムの第2動作を示すシーケンス図である。 端末装置に表示される画面の第2例を示す図である。
以下、本開示の実施形態について説明する。
(実施形態の概要)
図1を参照して、本開示の実施形態に係るシステム1の概要について説明する。システム1は、複数の端末装置10と、サーバ20と、を備える。各端末装置10とサーバ20は、例えばインターネット及び移動体通信網等を含む通信回線30を介して通信可能である。
端末装置10は、例えばPC(Personal Computer)、スマートフォン、又はタブレット端末等のコンピュータである。サーバ20は、1つ又は互いに通信可能な複数のコンピュータを含んで構成される。サーバ20は、通信回線30を用いて遠隔対話サービスを提供する。本実施形態では、ユーザは、自身の端末装置10を用いて、1人以上の対話相手との遠隔対話を行うことができる。本実施形態では、ユーザの端末装置10は、各対話相手の顔を示すオブジェクト(以下、「第1オブジェクト」ともいう。)を画面に表示しながら遠隔対話を実行する。本実施形態では、第1オブジェクトは、対話相手の顔の可視光画像及び深度画像を用いてリアルタイムに生成される3Dオブジェクトであって、対話相手の実際の動きに連動して表示される。しかしながら、第1オブジェクトは当該例に限られず、例えばキャラクター等のアバターの3Dオブジェクトであってもよい。或いは第1オブジェクトは、対話相手又はキャラクタの画像を含む2Dオブジェクトであってもよい。
なお第1オブジェクトに加えて、第1オブジェクトとは異なる1つ以上の第2オブジェクトが画面に表示されてもよい。第2オブジェクトは、例えばテキスト及び画像の少なくとも一方を含む3Dオブジェクト又は2Dオブジェクトであるが、これらに限られない。一例において、遠隔対話サービスを利用した遠隔会議における共有資料等が第2オブジェクトとして画面に表示されてもよい。
まず、本実施形態の概要について説明し、詳細については後述する。端末装置10は、自装置のユーザの各対話相手である他のユーザの顔を示す第1オブジェクトを含む複数のオブジェクトを画面に表示し、ユーザが注視している画面上のオブジェクトを、ユーザの注視オブジェクトとして検出する。端末装置10は、ユーザの注視オブジェクトを示す情報をサーバ20へ送信するとともに、各対話相手の注視オブジェクトを示す情報をサーバ20から受信する。そして端末装置10は、当該画面において、各対話相手の視線が注視オブジェクトに向けられるという第1条件、及び各対話相手の視線上に注視オブジェクト以外のオブジェクトが存在しないという第2条件を満たすように、各第1オブジェクトの向き及び複数のオブジェクトの配置を制御する。
図2を参照して、上述した第1条件及び第2条件に基づく制御について説明する。図2は、3人の対話相手A~Cと遠隔対話するユーザの端末装置10の画面を示す。当該画面には、対話相手A~Cの顔をそれぞれ示す3つの第1オブジェクトが表示されている。以下の説明において、「対話相手の第1オブジェクト」を単に「対話相手」ともいう。ここでは、対話相手A及びBそれぞれの注視オブジェクトは、対話相手Cの顔を示す第1オブジェクトであるものとする。換言すると、対話相手A及びBのそれぞれは、自身の端末装置10の画面に表示されている対話相手Cを注視しているものとする。
ユーザの端末装置10は、上述した第1条件を満たすように(例えば、対話相手A及びBそれぞれの視線が対話相手Cに向けられるように)、例えば画面上の対話相手A及びBの向きを制御する。ここで、対話相手Bが画面上の位置Pに存在する場合、対話相手Aの視線上に対話相手Bが存在することになる。かかる場合、端末装置10のユーザは、対話相手Aが対話相手B及びCのいずれを注視しているのか一見して認識することができない。これに対して本実施形態では、端末装置10は、上述した第2条件を更に満たすように(例えば、対話相手Aの視線上に対話相手C以外のオブジェクトが存在しなくなるように)、例えば対話相手Bを位置Pから下方の位置Qに移動させて、対話相手Aの視線上から対話相手Bを外す。かかる場合、端末装置10のユーザは、対話相手Aが対話相手Bではなく対話相手Cを注視していると一見して認識することができる。このように、本実施形態によれば、ユーザが各対話相手の注視オブジェクトを画面から一見して認識可能となる点で、通信回線を用いて遠隔対話サービスを提供する技術が改善される。
次に、システム1が備える各構成要素について詳細に説明する。
(端末装置の構成)
図3に示すように、端末装置10は、通信部11と、表示部12と、カメラ部13と、記憶部14と、制御部15と、を備える。
通信部11は、通信回線30に接続する1つ以上の通信インタフェースを含む。当該通信インタフェースは、例えば4G(4th Generation)及び5G(5th Generation)等の移動体通信規格、有線LAN(Local Area Network)規格、又は無線LAN規格に対応するが、これらに限られず任意の通信規格に対応してもよい。
表示部12は、1つ以上のディスプレイを含む。また表示部12は、外部のディスプレイを接続可能なインタフェースを含んでもよい。
カメラ部13は、1組以上の可視光カメラ及び深度カメラを含む。またカメラ部13は、外部の可視光カメラ及び深度カメラを接続可能なインタフェースを含んでもよい。各組の可視光カメラ及び深度カメラは、端末装置10を使用するユーザの顔を所定の方向から撮影可能となるように設けられる。本実施形態では、カメラ部13は、端末装置10の画面を視認するユーザの顔を正面から撮影可能な1組の可視光カメラ及び深度カメラを少なくとも含む。可視光カメラ及び深度カメラから得られた可視光画像及び深度画像は、ユーザの顔を示す第1オブジェクトを生成するために用いられる。以下、可視光カメラ及び深度カメラから得られる可視光画像及び深度画像を「カメラ画像」ともいう。
記憶部14は、1つ以上のメモリを含む。メモリは、例えば半導体メモリ、磁気メモリ、又は光メモリ等であるが、これらに限られない。記憶部14に含まれる各メモリは、例えば主記憶装置、補助記憶装置、又はキャッシュメモリとして機能してもよい。記憶部14は、端末装置10の動作に用いられる任意の情報を記憶する。例えば、記憶部14は、システムプログラム及びアプリケーションプログラム等を記憶してもよい。
制御部15は、1つ以上のプロセッサ、1つ以上のプログラマブル回路、1つ以上の専用回路、又はこれらの組合せを含む。プロセッサは、例えばCPU(Central Processing Unit)若しくはGPU(Graphics Processing Unit)等の汎用プロセッサ、又は特定の処理に特化した専用プロセッサであるがこれらに限られない。プログラマブル回路は、例えばFPGA(Field-Programmable Gate Array)であるがこれに限られない。専用回路は、例えばASIC(Application Specific Integrated Circuit)であるがこれに限られない。制御部15は、端末装置10全体の動作を制御する。
(サーバの構成)
図4に示すように、サーバ20は、通信部21と、記憶部22と、制御部23と、を備える。
通信部21は、通信回線30に接続する1つ以上の通信インタフェースを含む。当該通信インタフェースは、例えば移動体通信規格、有線LAN規格、又は無線LAN規格に対応するが、これらに限られず任意の通信規格に対応してもよい。
記憶部22は、1つ以上のメモリを含む。記憶部22に含まれる各メモリは、例えば主記憶装置、補助記憶装置、又はキャッシュメモリとして機能してもよい。記憶部22は、サーバ20の動作に用いられる任意の情報を記憶する。例えば、記憶部22は、システムプログラム、アプリケーションプログラム、組み込みソフトウェア、及びデータベース等を記憶してもよい。
制御部23は、1つ以上のプロセッサ、1つ以上のプログラマブル回路、1つ以上の専用回路、又はこれらの組合せを含む。制御部23は、サーバ20全体の動作を制御する。
(システムの動作)
図5を参照して、システム1の第1動作について説明する。概略として第1動作は、端末装置10の画面に表示する各第1オブジェクトを生成する動作であって、遠隔対話の実行中に所定のフレームレートで繰り返し実行される。ここでは、ユーザが3人の対話相手A~Cと遠隔対話を行う場面における、当該ユーザの端末装置10とサーバ20の動作について説明する。各対話相手の端末装置10の動作については、当該ユーザの端末装置10と同様であるため、説明は省略する。
ステップS100:端末装置10の制御部15は、カメラ部13を用いてユーザのカメラ画像を生成し、通信部11を介してサーバ20へ送信する。
上述したようにカメラ画像は、カメラ部13に含まれる少なくとも1組の可視光カメラ及び深度カメラによって生成された可視光画像及び深度画像である。ここでは、ユーザの顔を正面から撮影した1組の可視光画像及び深度画像を少なくとも含むカメラ画像が生成されるものとする。
ステップS101:サーバ20の制御部23は、ユーザの各対話相手の端末装置10から受信した各対話相手のカメラ画像に基づいて第1オブジェクト情報を生成し、通信部21を介してユーザの端末装置10へ送信する。
第1オブジェクト情報は、ユーザの端末装置10の画面に表示する各第1オブジェクトの生成に用いられる任意の情報を含む。例えば、第1オブジェクト情報は、各対話相手のカメラ画像そのものを含んでもよく、各対話相手のカメラ画像から人物に相当する部分のみをトリミングしたデータを含んでもよい。
なお制御部23は、例えば遠隔対話の何れかの参加者(ここでは、ユーザ又は対話相手A~Cの何れか)の端末装置10から、例えば遠隔対話中の共有資料としてテキスト及び/又は画像を事前に受信した場合、第1オブジェクト情報に加えて第2オブジェクト情報を生成し、ユーザの端末装置10へ送信してもよい。第2オブジェクト情報はユーザの端末装置10の画面に表示する第2オブジェクトの生成に用いられる任意の情報(例えば、共有資料として受信したテキスト及び/又は画像)を含む。
ステップS102:端末装置10の制御部15は、サーバ20から受信した第1オブジェクト情報に基づいて各対話相手の顔を示す第1オブジェクトを生成し、表示部12の画面に表示する。また制御部15は、サーバ20から第2オブジェクト情報を受信した場合、第1オブジェクトに加えて第2オブジェクトも生成し、表示部12の画面に表示する。
具体的には、制御部15は、第1オブジェクト情報に各対話相手のカメラ画像そのものが含まれる場合、各対話相手のカメラ画像から人物に相当する部分のみをトリミングする。制御部15は、各対話相手の深度画像から対話相手の顔の形状を示す3Dモデルを生成し、可視光画像を当該3Dモデルにテクスチャマッピングすることによって、各対話相手の顔を示す第1オブジェクトを生成する。そして制御部15は、生成した各第1オブジェクトを表示部12の画面に表示する。また制御部15は、第2オブジェクト情報に含まれるテキスト及び/又は画像を示す第2オブジェクトを生成し、表示部12の画面に表示する。
図6を参照して、システム1の第2動作について説明する。概略として第2動作は、端末装置10の画面上の各オブジェクトの向き及び配置を制御する動作であって、遠隔対話の実行中に、上述した第1動作と並行して実行される。ここでは、ユーザが3人の対話相手A~Cと遠隔対話を行う場面における、当該ユーザの端末装置10とサーバ20の動作について説明する。各対話相手の端末装置10の動作については、当該ユーザの端末装置10と同様であるため、説明は省略する。
ステップS200:端末装置10の制御部15は、ユーザが注視している画面上のオブジェクトを、当該ユーザの注視オブジェクトとして検出する。
具体的には、制御部15は、上述した第1動作のステップS100で生成された、ユーザの顔のカメラ画像に基づいて、ユーザの視線を検出する。視線の検出には、任意の手法が採用可能である。例えば、制御部15は、特徴点抽出又はパターンマッチング等の画像認識によって、カメラ画像に含まれる可視光画像上のユーザの顔の向き並びに眼及び瞳の位置を検出してもよい。
そして制御部15は、検出された顔の向き並びに眼及び瞳の位置に基づいてユーザの視線を検出する。なお、検出される視線は3次元ベクトルで示されてもよい。続いて制御部15は、ユーザの視線が向けられている画面上のオブジェクトを特定し、当該オブジェクトをユーザの注視オブジェクトとして検出する。ここで制御部15は、ユーザが画面上のオブジェクトを注視している状態が所定時間継続すると、当該オブジェクトをユーザの注視オブジェクトとして検出してもよい。かかる構成によれば、例えばユーザが注視しているオブジェクトから一瞬だけ視線をずらした場合に、当該オブジェクトが注視オブジェクトではなくなってしまったり、注視オブジェクトが頻繁に切り替わったりするという不都合の発生が低減される。
ステップS201:制御部15は、ユーザの注視オブジェクトを示す情報を、通信部11を介してサーバ20へ送信する。
ステップS202:サーバ20の制御部23は、ユーザの各対話相手の端末装置10から受信した各対話相手の注視オブジェクトを示す情報を、通信部21を介してユーザの端末装置10へ送信する。
ステップS203:端末装置10の制御部15は、表示部12の画面において、第1条件及び第2条件を満たすように、画面上の各第1オブジェクトの向き及び複数のオブジェクトの配置を制御する。
ここで第1条件は、上述したように、各対話相手の視線が注視オブジェクトに向けられるという条件である。例えば、3人の対話相手A~Cのうち、対話相手A及びBそれぞれの注視オブジェクトが対話相手Cの第1オブジェクトであり、対話相手Cの注視オブジェクトがユーザの第1オブジェクトであるものとする。かかる場合、制御部15は、第1条件を満たすために、対話相手A及びBそれぞれの視線が対話相手Cに向けられ、且つ対話相手Cの視線がユーザ(具体的には、画面正面)に向けられるように、画面上の対話相手A~Cそれぞれの第1オブジェクトの向きを制御する。
第2条件は、上述したように、各対話相手の視線上に注視オブジェクト以外のオブジェクトが存在しないという条件である。例えば図2に示す画面において、対話相手Bが位置Pに存在している場合、対話相手Aの視線上には、注視オブジェクトである対話相手C以外のオブジェクト(ここでは、対話相手B)が存在している。かかる場合、制御部15は、第2条件を満たすために、例えば対話相手Bを位置Pから下方の位置Qに移動させて対話相手Aの視線上から対話相手Bを外すように、画面上の複数のオブジェクトの配置を制御する。
なお、制御部15は、画面上の複数のオブジェクトの配置を制御する際、上述した第1条件及び第2条件に加えて、画面上の複数のオブジェクトの配置変更に伴う総移動量に関する第3条件を満たすように、複数のオブジェクトの配置を制御してもよい。例えば、第3条件は、配置変更に伴う画面上の複数のオブジェクトの総移動量を最小とするという条件であってもよい。かかる構成によれば、配置変更の際、例えばユーザの注視オブジェクトが比較的大きく動いてしまい視認性が低下するという不都合の発生が低減される。なおオブジェクトの移動量は、例えば画面上の移動量であってもよい。或いは、遠隔対話中に表示される画面が、各オブジェクトが配置された3次元仮想空間を示す画面である場合、オブジェクトの移動量は、当該仮想空間内の移動量であってもよい。例えば図7に示す画面は、対話相手A~Cの第1オブジェクトが配置された3次元仮想空間を示す画面であって、図2に示す画面とは異なり対話相手Bが画面奥方向に移動されている。
以上述べたように、本実施形態に係る端末装置10は、自装置のユーザの各対話相手である他のユーザの顔を示す第1オブジェクトを含む複数のオブジェクトを画面に表示し、ユーザが注視している画面上のオブジェクトを、ユーザの注視オブジェクトとして検出する。端末装置10は、ユーザの注視オブジェクトを示す情報をサーバ20へ送信するとともに、各対話相手の注視オブジェクトを示す情報をサーバ20から受信する。そして端末装置10は、当該画面において、各対話相手の視線が注視オブジェクトに向けられるという第1条件、及び各対話相手の視線上に注視オブジェクト以外のオブジェクトが存在しないという第2条件を満たすように、各第1オブジェクトの向き及び複数のオブジェクトの配置を制御する。
かかる構成によれば、ユーザの端末装置10の画面上で、各対話相手の視線が遮られることなく注視オブジェクトに向けられる。このため、ユーザが各対話相手の注視オブジェクトを画面から一見して認識可能となる点で、通信回線を用いて遠隔対話サービスを提供する技術が改善される。
本開示を諸図面及び実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形及び改変を行ってもよいことに注意されたい。したがって、これらの変形及び改変は本開示の範囲に含まれることに留意されたい。例えば、各構成部又は各ステップ等に含まれる機能等は論理的に矛盾しないように再配置可能であり、複数の構成部又はステップ等を1つに組み合わせたり、或いは分割したりすることが可能である。
例えば、上述した実施形態において、端末装置10又はサーバ20の構成及び動作を、互いに通信可能な複数のコンピュータに分散させた実施形態も可能である。また例えば、端末装置10及びサーバ20の一方が実行する一部の処理を他方が実行する実施形態も可能である。例えば、上述した実施形態では端末装置10の画面に表示するオブジェクトを生成する処理(ステップS102)、及び端末装置10の画面上の各第1オブジェクトの向き及び複数のオブジェクトの配置を制御する処理(ステップS203)を端末装置10が実行するが、サーバ20が当該処理を実行し、処理結果を端末装置10へ送信してもよい。
また、例えば汎用のコンピュータを、上述した実施形態に係る端末装置10又はサーバ20として機能させる実施形態も可能である。具体的には、上述した実施形態に係る端末装置10又はサーバ20の各機能を実現する処理内容を記述したプログラムを、汎用のコンピュータのメモリに格納し、プロセッサによって当該プログラムを読み出して実行させる。したがって、本開示は、プロセッサが実行可能なプログラム、又は当該プログラムを記憶する非一時的なコンピュータ可読媒体としても実現可能である。
以下に本開示の実施形態の一部について例示する。しかしながら、本開示の実施形態はこれらに限定されない点に留意されたい。
[付記1]
遠隔対話サービスを提供するサーバと通信する端末装置が実行する方法であって、
自装置のユーザの各対話相手である他のユーザの顔を示す第1オブジェクトを含む複数のオブジェクトを画面に表示すること、
前記ユーザが注視している前記画面上のオブジェクトを前記ユーザの注視オブジェクトとして検出すること、
前記ユーザの注視オブジェクトを示す情報を前記サーバへ送信すること、
前記各対話相手の注視オブジェクトを示す情報を前記サーバから受信すること、
前記画面において、前記各対話相手の視線が注視オブジェクトに向けられるという第1条件、及び前記各対話相手の視線上に注視オブジェクト以外のオブジェクトが存在しないという第2条件を満たすように、各前記第1オブジェクトの向き及び前記複数のオブジェクトの配置を制御すること
を含む、方法。
[付記2]
付記1に記載の方法であって、
前記端末装置は、前記複数のオブジェクトの配置を制御する際、前記第1条件、前記第2条件、及び前記複数のオブジェクトの配置変更に伴う総移動量に関する第3条件を満たすように、前記複数のオブジェクトの配置を制御する、方法。
[付記3]
付記2に記載の方法であって、
前記第3条件は、配置変更に伴う前記複数のオブジェクトの総移動量を最小とする条件である、方法。
[付記4]
付記1から3の何れか一項に記載の方法であって、
前記端末装置は、前記ユーザの注視オブジェクトを検出する際、前記ユーザが前記画面上のオブジェクトを注視している状態が所定時間継続すると、前記オブジェクトを前記ユーザの注視オブジェクトとして検出する、方法。
[付記5]
付記1から4の何れか一項に記載の方法であって、
前記複数のオブジェクトは、前記各対話相手である他のユーザの顔を示す前記第1オブジェクトと、テキスト及び画像の少なくとも一方を示す第2オブジェクトと、を含む、方法。
[付記6]
遠隔対話サービスを提供するサーバと通信する端末装置に、
自装置のユーザの各対話相手である他のユーザの顔を示す第1オブジェクトを含む複数のオブジェクトを画面に表示すること、
前記ユーザが注視している前記画面上のオブジェクトを前記ユーザの注視オブジェクトとして検出すること、
前記ユーザの注視オブジェクトを示す情報を前記サーバへ送信すること、
前記各対話相手の注視オブジェクトを示す情報を前記サーバから受信すること、
前記画面において、前記各対話相手の視線が注視オブジェクトに向けられるという第1条件、及び前記各対話相手の視線上に注視オブジェクト以外のオブジェクトが存在しないという第2条件を満たすように、各前記第1オブジェクトの向き及び前記複数のオブジェクトの配置を制御すること
を実行させる、プログラム。
[付記7]
遠隔対話サービスを提供するサーバと通信する通信部と、画面を表示する表示部と、自装置のユーザの顔の画像を生成するカメラ部と、制御部と、を備える端末装置であって、
前記制御部は、
前記ユーザの各対話相手である他のユーザの顔を示す第1オブジェクトを含む複数のオブジェクトを画面に表示させ、
前記画像に基づき前記ユーザが注視していると判定された前記画面上のオブジェクトを前記ユーザの注視オブジェクトとして検出し、
前記ユーザの注視オブジェクトを示す情報を前記サーバへ送信し、
前記各対話相手の注視オブジェクトを示す情報を前記サーバから受信し、
前記画面において、前記各対話相手の視線が注視オブジェクトに向けられるという第1条件、及び前記各対話相手の視線上に注視オブジェクト以外のオブジェクトが存在しないという第2条件を満たすように、各前記第1オブジェクトの向き及び前記複数のオブジェクトの配置を制御する、端末装置。
1 システム
10 端末装置
11 通信部
12 表示部
13 カメラ部
14 記憶部
15 制御部
20 サーバ
21 通信部
22 記憶部
23 制御部
30 通信回線

Claims (7)

  1. 遠隔対話サービスを提供するサーバと通信する端末装置が実行する方法であって、
    自装置のユーザの各対話相手である他のユーザの顔を示す第1オブジェクトを含む複数のオブジェクトを画面に表示すること、
    前記ユーザが注視している前記画面上のオブジェクトを前記ユーザの注視オブジェクトとして検出すること、
    前記ユーザの注視オブジェクトを示す情報を前記サーバへ送信すること、
    前記各対話相手の注視オブジェクトを示す情報を前記サーバから受信すること、
    前記画面において、前記各対話相手の視線が注視オブジェクトに向けられるという第1条件、及び前記各対話相手の視線上に注視オブジェクト以外のオブジェクトが存在しないという第2条件を満たすように、各前記第1オブジェクトの向き及び前記複数のオブジェクトの配置を制御すること
    を含む、方法。
  2. 請求項1に記載の方法であって、
    前記端末装置は、前記複数のオブジェクトの配置を制御する際、前記第1条件、前記第2条件、及び前記複数のオブジェクトの配置変更に伴う総移動量に関する第3条件を満たすように、前記複数のオブジェクトの配置を制御する、方法。
  3. 請求項2に記載の方法であって、
    前記第3条件は、配置変更に伴う前記複数のオブジェクトの総移動量を最小とする条件である、方法。
  4. 請求項1から3の何れか一項に記載の方法であって、
    前記端末装置は、前記ユーザの注視オブジェクトを検出する際、前記ユーザが前記画面上のオブジェクトを注視している状態が所定時間継続すると、前記オブジェクトを前記ユーザの注視オブジェクトとして検出する、方法。
  5. 請求項1から3の何れか一項に記載の方法であって、
    前記複数のオブジェクトは、前記各対話相手である他のユーザの顔を示す前記第1オブジェクトと、テキスト及び画像の少なくとも一方を示す第2オブジェクトと、を含む、方法。
  6. 遠隔対話サービスを提供するサーバと通信する端末装置に、
    自装置のユーザの各対話相手である他のユーザの顔を示す第1オブジェクトを含む複数のオブジェクトを画面に表示すること、
    前記ユーザが注視している前記画面上のオブジェクトを前記ユーザの注視オブジェクトとして検出すること、
    前記ユーザの注視オブジェクトを示す情報を前記サーバへ送信すること、
    前記各対話相手の注視オブジェクトを示す情報を前記サーバから受信すること、
    前記画面において、前記各対話相手の視線が注視オブジェクトに向けられるという第1条件、及び前記各対話相手の視線上に注視オブジェクト以外のオブジェクトが存在しないという第2条件を満たすように、各前記第1オブジェクトの向き及び前記複数のオブジェクトの配置を制御すること
    を実行させる、プログラム。
  7. 遠隔対話サービスを提供するサーバと通信する通信部と、画面を表示する表示部と、自装置のユーザの顔の画像を生成するカメラ部と、制御部と、を備える端末装置であって、
    前記制御部は、
    前記ユーザの各対話相手である他のユーザの顔を示す第1オブジェクトを含む複数のオブジェクトを画面に表示させ、
    前記画像に基づき前記ユーザが注視していると判定された前記画面上のオブジェクトを前記ユーザの注視オブジェクトとして検出し、
    前記ユーザの注視オブジェクトを示す情報を前記サーバへ送信し、
    前記各対話相手の注視オブジェクトを示す情報を前記サーバから受信し、
    前記画面において、前記各対話相手の視線が注視オブジェクトに向けられるという第1条件、及び前記各対話相手の視線上に注視オブジェクト以外のオブジェクトが存在しないという第2条件を満たすように、各前記第1オブジェクトの向き及び前記複数のオブジェクトの配置を制御する、端末装置。
JP2022150732A 2022-09-21 2022-09-21 方法、プログラム、及び端末装置 Pending JP2024044908A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2022150732A JP2024044908A (ja) 2022-09-21 2022-09-21 方法、プログラム、及び端末装置
US18/465,608 US20240094812A1 (en) 2022-09-21 2023-09-12 Method, non-transitory computer readable medium, and terminal apparatus
CN202311207692.2A CN117749978A (zh) 2022-09-21 2023-09-19 方法、非瞬时性计算机可读介质以及终端装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022150732A JP2024044908A (ja) 2022-09-21 2022-09-21 方法、プログラム、及び端末装置

Publications (1)

Publication Number Publication Date
JP2024044908A true JP2024044908A (ja) 2024-04-02

Family

ID=90245031

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022150732A Pending JP2024044908A (ja) 2022-09-21 2022-09-21 方法、プログラム、及び端末装置

Country Status (3)

Country Link
US (1) US20240094812A1 (ja)
JP (1) JP2024044908A (ja)
CN (1) CN117749978A (ja)

Also Published As

Publication number Publication date
US20240094812A1 (en) 2024-03-21
CN117749978A (zh) 2024-03-22

Similar Documents

Publication Publication Date Title
US20220375124A1 (en) Systems and methods for video communication using a virtual camera
US11651576B2 (en) Sharing virtual content in a mixed reality scene
US12003890B2 (en) Environment for remote communication
CN109496293B (zh) 扩展内容显示方法、装置、***及存储介质
US11776197B2 (en) Method and apparatus for displaying personalized face of three-dimensional character, device, and storage medium
CN110637274B (zh) 信息处理设备、信息处理方法以及程序
JP2024044908A (ja) 方法、プログラム、及び端末装置
JP7257986B2 (ja) コンテンツ配信装置、コンテンツ配信プログラム、コンテンツ配信方法、コンテンツ表示装置、コンテンツ表示プログラムおよびコンテンツ表示方法
JP2024095387A (ja) 端末装置及び端末装置の動作方法
US20240202944A1 (en) Aligning scanned environments for multi-user communication sessions
US20240220010A1 (en) Terminal apparatus and method of operating terminal apparatus
EP3185103A1 (en) A gazed virtual object identification determination module, a system for implementing gaze translucency, and a related method
US20240121359A1 (en) Terminal apparatus
US20240127769A1 (en) Terminal apparatus
US20230196680A1 (en) Terminal apparatus, medium, and method of operating terminal apparatus
JP2024055599A (ja) 端末装置
JPWO2017098999A1 (ja) 情報処理装置、情報処理システム、情報処理装置の制御方法、及び、コンピュータープログラム
JP2024095389A (ja) 端末装置
JP2024095393A (ja) 制御装置
CN116893764A (zh) 终端装置、终端装置的动作方法及非暂时性计算机可读取介质
JP2023015074A (ja) コンピュータプログラム、サーバ装置、端末装置、システム及び方法
CN115469944A (zh) 一种界面展示方法、界面展示装置及存储介质
JP2019164614A (ja) アバター制御プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240305