JP7508586B2 - 没入型テレカンファレンスおよびテレプレゼンスのためのマルチグルーピングの方法、装置、およびコンピュータプログラム - Google Patents

没入型テレカンファレンスおよびテレプレゼンスのためのマルチグルーピングの方法、装置、およびコンピュータプログラム Download PDF

Info

Publication number
JP7508586B2
JP7508586B2 JP2022566437A JP2022566437A JP7508586B2 JP 7508586 B2 JP7508586 B2 JP 7508586B2 JP 2022566437 A JP2022566437 A JP 2022566437A JP 2022566437 A JP2022566437 A JP 2022566437A JP 7508586 B2 JP7508586 B2 JP 7508586B2
Authority
JP
Japan
Prior art keywords
media
client device
video
grouping
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022566437A
Other languages
English (en)
Other versions
JP2023529285A (ja
Inventor
ロヒト・アビシェーク
イーラジ・ソダガー
Original Assignee
テンセント・アメリカ・エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テンセント・アメリカ・エルエルシー filed Critical テンセント・アメリカ・エルエルシー
Publication of JP2023529285A publication Critical patent/JP2023529285A/ja
Application granted granted Critical
Publication of JP7508586B2 publication Critical patent/JP7508586B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • H04L51/10Multimedia information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • H04L12/1822Conducting the conference, e.g. admission, detection, selection or grouping of participants, correlating users to one or more conference sessions, prioritising transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • H04L12/1827Network arrangements for conference optimisation or adaptation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1101Session protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1101Session protocols
    • H04L65/1104Session initiation protocol [SIP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/54Presence management, e.g. monitoring or registration for receipt of user log-on information, or the connection status of the users
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Description

関連出願の相互参照
本出願は、2022年5月10日に出願された米国特許出願第17/741,351号「MULTIPLE GROUPING FOR IMMERSIVE TELECONFERENCING AND TELEPRESENCE」に対する優先権の利益を主張し、この出願は、2021年5月11日に出願された米国仮出願第63/187,346号「Multiple Grouping of 360 Video for Immersive Teleconferencing and Telepresence for Remote Terminals」に対する優先権の利益を主張する。先行出願の開示は、その全体が参照により本明細書に組み込まれる。
本開示は、ビデオカンファレンスおよびテレプレゼンスに概して関する実施形態を説明する。
本明細書において提供される背景技術の説明は、本開示の文脈を大まかに提示することを目的としている。本明細書に記名された発明者の仕事は、その仕事がこの背景技術セクションに記載されている程度まで、ならびにさもなければ出願時に従来技術として適格ではない可能性がある説明の態様は、本開示に対する従来技術として、明示的にも黙示的にも認められていない。
ビデオカンファレンスシステムによって、2つ以上の遠隔地で、ユーザが、ビデオストリーム、オーディオストリーム、またはその両方等のメディアストリームを介してお互いにインタラクティブに通信することが可能になる。いくつかのビデオカンファレンスシステムによって、ユーザが、画像、テキスト、ビデオ、アプリケーション等のようなデジタル文書を交換することも可能になる。
本開示の態様は、ビデオカンファレンスおよび/またはテレプレゼンスのための方法および装置を提供する。いくつかの例では、ビデオカンファレンス/テレプレゼンスは、複数のクライアントデバイス、ユーザデバイス、およびメディア制御デバイス(例えば、サーバデバイス)によって実行し得る。例えば、第1のクライアントデバイスは、第2のクライアントデバイスからのオーバーレイメディアの、第1のクライアントデバイスの没入型メディアとのグルーピングを制限するグルーピング制御を決定し、グルーピング制御を示すグルーピング制御信号を送信してメディア制御デバイスに通知する。さらに、第1のクライアントデバイスは、没入型メディアを含む1つ以上のメディアをメディア制御デバイスに提供する。メディア制御デバイスは、第1のクライアントデバイスから受信したグルーピング制御信号に基づいて、複数の没入型メディアストリームをシングルグループまたはマルチグループにグルーピングし得る。
いくつかの例では、没入型メディアは、全方位ビデオ、360度ビデオ、および広角ビデオの少なくとも1つを含む。
いくつかの例では、第1のクライアントデバイスは、グルーピング制御を示す属性フィールドを有するセッション記述プロトコル(SDP)メッセージを送信する。一例では、第1のクライアントデバイスは、第2のクライアントデバイスからのオーバーレイメディアの、第1のクライアントデバイスの没入型メディアとのグルーピングの不許可を示す属性フィールドを有するSDPメッセージを送信する。例えば、属性フィールドは、「a=no_other_overlays」の形式である。
別の例では、第1のクライアントデバイスは、第2のクライアントデバイスからのオーバーレイメディアの、第1のクライアントデバイスの没入型メディアとのグルーピングの許可を示す属性フィールドを有するSDPメッセージを送信する。例えば、属性フィールドは「a=other_overlays」の形式である。
別の例では、第1のクライアントデバイスは、第1のクライアントデバイスの没入型メディアとグルーピングすることが許可されたメディアタイプを示す属性フィールドを有するSDPメッセージを送信する。例えば、属性フィールドは、「a=allowed_content」の形式である。いくつかの例では、メディアタイプは、双方向ビデオ、画像、およびスライドの少なくとも1つを含む。
いくつかの例では、第1のクライアントデバイスは、第2のクライアントデバイスからのオーバーレイメディアの、第1のクライアントデバイスの没入型メディアとのグルーピングの許可を示す第1の属性フィールドと、許可されるメディアタイプを示す第2の属性フィールドとを有するSDPメッセージを送信する。
本開示の態様は、ビデオカンファレンスのためにコンピュータによって実行されたときに、コンピュータにビデオカンファレンス/テレプレゼンスのための方法を実行させる命令を格納する非一時的コンピュータ可読媒体も提供する。
開示された主題のさらなる特徴、性質、および様々な利点は、以下の詳細な説明および添付の図面からより明らかにされるだろう。
本開示のいくつかの例によるビデオカンファレンスシステムを示す図である。 本開示のいくつかの例による別のビデオカンファレンスシステムを示す図である。 本開示のいくつかの例による別のビデオカンファレンスシステムを示す図である。 1つ以上のメディアグループに対応する属性フィールドのいくつかの例を示す図である。 1つ以上のメディアグループに対応する属性フィールドのいくつかの例を示す図である。 1つ以上のメディアグループに対応する属性フィールドのいくつかの例を示す図である。 1つ以上のメディアグループに対応する属性フィールドのいくつかの例を示す図である。 1つ以上のメディアグループに対応する属性フィールドのいくつかの例を示す図である。 1つ以上のメディアグループに対応する属性フィールドの例を示す図である。 1つ以上のメディアグループに対応する属性フィールドの例を示す図である。 1つ以上のメディアグループに対応する属性フィールドの例を示す図である。 1つ以上のメディアグループに対応する属性フィールドの例を示す図である。 1つ以上のメディアグループに対応する属性フィールドのいくつかの例を示す図である。 1つ以上のメディアグループに対応する属性フィールドのいくつかの例を示す図である。 1つ以上のメディアグループに対応する属性フィールドのいくつかの例を示す図である。 1つ以上のメディアグループに対応する属性フィールドのいくつかの例を示す図である。 1つ以上のメディアグループに対応する属性フィールドのいくつかの例を示す図である。 本開示のいくつかの例による、プロセスの概要を示すフローチャートである。 本開示のいくつかの例による、プロセスの概要を示すフローチャートである。 一実施形態による、コンピュータシステムの概略図である。
本開示の態様は、テレカンファレンスおよび/またはテレプレゼンスのためのオーバーレイを有する没入型ビデオの複数のグルーピングをシグナリングするための技術を提供する。
いくつかの例では、テレカンファレンスはビデオカンファレンスであり得、ビデオカンファレンスの参加者は、ビデオおよびオーディオを含み得るメディアストリームを介して通信し得る。テレプレゼンスは、1つのタイプのビデオカンファレンス技術で、顔を合わせたインタラクションに可能な限り似せるように、より高いレベルの音声およびビデオ品質を提供する。本開示の説明では、ビデオカンファレンスは、テレカンファレンスおよびテレプレゼンスを含むために使用され、本開示において開示される技術は、テレカンファレンスおよびテレプレゼンスにおいて使用され得る。
図1および図2は、いくつかの例におけるいくつかのビデオカンファレンスシステムを示す。
図1は、ビデオカンファレンスシステム(100)を示す。ビデオカンファレンスシステム(100)は、サブシステム(110)と、ユーザデバイス(120)および(130)等の複数のユーザデバイスとを含む。サブシステム(110)は、会議室Aのような場所に設置される。概して、サブシステム(110)は、ユーザデバイス(120)および(130)よりも比較的高い帯域幅を有するように構成され、ビデオカンファレンスセッション(ビデオカンファレンスコールとも呼ばれる)のホストサービスを提供し得る。サブシステム(110)は、会議室Aのユーザまたは参加者がビデオカンファレンスセッションに参加することを可能にし得、ユーザデバイス(120)のユーザB、およびユーザデバイス(130)のユーザC等の一部のリモートユーザが遠隔地からビデオカンファレンスセッションに参加することを可能にし得る。いくつかの例では、サブシステム(110)とユーザデバイス(120)および(130)とは、ビデオカンファレンスセッションにおいて端末と呼ばれる。
いくつかの実施形態では、サブシステム(110)は、会議室として適切な様々なオーディオ、ビデオおよび制御コンポーネントを含む。様々なオーディオ、ビデオ、および制御コンポーネントは、デバイスに統合し得、または適切な通信技術を介して互いに結合された分散されたコンポーネントであり得る。いくつかの例では、サブシステム(110)は、魚眼カメラ、全方位カメラ等の、比較的広い視野を有する広角カメラ(111)を含む。例えば、全方位カメラは、ほぼ球全体をカバーする視野を持つように構成され得、全方位カメラによって撮影されたビデオは、全方位ビデオまたは360度ビデオと呼ばれ得る。
さらに、いくつかの例では、サブシステム(110)は、ほぼいかなる方向からの音波も取り込み得る全方位(無指向性とも呼ばれる)マイクロフォン等のマイクロフォン(112)を含む。サブシステム(110)は、会議室Aの中のユーザが会議室A以外の場所のユーザのビデオおよびオーディオに対応するマルチメディアを再生することを可能にするために、表示画面(114)、スピーカデバイス等を含み得る。一例では、スピーカデバイスは、マイクロフォン(112)と統合され得、または別個のコンポーネント(図示せず)であり得る。
いくつかの例では、サブシステム(110)はコントローラ(113)を含む。図1では、コントローラ(113)としてラップトップコンピューティングデバイスが示されているが、デスクトップコンピュータ、タブレットコンピュータ等のような他の適切なデバイスは、コントローラ(113)として使用され得る。また、一例では、コントローラ(113)は、サブシステム(110)における他のコンポーネントと統合され得る。
コントローラ(113)は、サブシステム(110)の様々な制御機能を実行するように構成され得る。例えば、コントローラ(113)を使用して、ビデオカンファレンスセッションを開始し、サブシステム(110)とユーザデバイス(120)および(130)との間の通信を管理し得る。一例では、コントローラ(113)は、(例えば、カメラ(111)およびマイクロフォン(112)によって取り込まれる)会議室Aで取り込まれたビデオおよび/またはオーディオをエンコーディングして、ビデオおよび/またはオーディオを搬送するためのメディアストリームを生成し、メディアストリームをユーザデバイス(120)および(130)に送信させ得る。
さらに、いくつかの例では、コントローラ(113)は、ビデオカンファレンスシステム(100)(例えば、ユーザデバイス(120)および(130))におけるユーザデバイスの各々から、それぞれのユーザデバイスで取り込まれたオーディオおよび/またはビデオを搬送するメディアストリームを受信し得る。コントローラ(113)は、受信されたメディアストリームをビデオカンファレンスシステム(100)における他のユーザデバイスにアドレス指定して送信し得る。例えば、コントローラ(113)は、ユーザデバイス(120)からメディアストリームを受信し、ユーザデバイス(130)にメディアストリームをアドレス指定して送信し得、ユーザデバイス(130)から別のメディアストリームを受信し、他のメディアストリームをアドレス指定してユーザデバイス(120)に送信し得る。
さらに、いくつかの例では、コントローラ(113)は、オーディオ、ビデオミキシングパラメータ等のような適切なビデオカンファレンスパラメータを決定し、ビデオカンファレンスパラメータをユーザデバイス(120)および(130)に送信し得る。
いくつかの例では、コントローラ(113)は、表示画面(114)、ラップトップコンピューティングデバイスの画面等の画面上にユーザインタフェースを表示させて、会議室Aにおけるユーザ入力を容易にし得る。
ユーザデバイス(120)および(130)の各々は、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、ウェアラブルデバイス、ハンドヘルドデバイス、スマートフォン、モバイル型デバイス、埋め込み型デバイス、ゲームコンソール、ゲームデバイス、パーソナルデータアシスタント(PDA)、テレコミュニケーションデバイス、全地球測位システム(「GPS」)デバイス、仮想現実(「VR」)デバイス、拡張現実(AR)デバイス、埋め込みコンピューティングデバイス、自動車コンピュータ、ネットワーク対応テレビ、モノのインターネット(「IoT」)デバイス、ワークステーション、メディアプレーヤ、パーソナルビデオレコーダ(PVR)、セットトップボックス、カメラ、コンピューティングデバイス、アプライアンス、または他の種類のコンピューティングデバイスに組み込むための統合コンポーネント(例えば、周辺デバイス)等の、任意の適切なビデオカンファレンス対応機器であり得る。
図1の例では、ユーザデバイス(120)は、ユーザB等のユーザがビデオカンファレンスセッションに参加することを可能にするためのウェアラブルマルチメディアコンポーネントを含む。例えば、ユーザデバイス(120)は、ユーザBの頭部に装着可能なヘッドマウントディスプレイ(HMD)を含む。HMDは、ビデオを再生するためにユーザBの1つまたは2つの目の前にディスプレイ光学系を含み得る。別の例では、ユーザデバイス(120)は、ユーザBによって装着され得るヘッドセット(図示せず)を含む。ヘッドセットは、ユーザの声を取り込むためのマイクロフォンを含み、オーディオ音声を出力するための1つまたは2つのイヤピースを含み得る。ユーザデバイス(120)はまた、メディアストリームを送信および/または受信し得る適切な通信コンポーネント(図示せず)を含む。
図1の例では、ユーザデバイス(130)は、ユーザCのようなユーザがビデオカンファレンスセッションに参加することを許可するために、通信コンポーネント、イメージングコンポーネント、オーディオコンポーネント等を一緒に統合するスマートフォン等のモバイルデバイスであり得る。
図1の例では、サブシステム(110)、ユーザデバイス(120)、およびユーザデバイス(130)は、ネットワーク(101)とインタフェースし得る適切な通信コンポーネント(図示せず)を含む。通信コンポーネントは、ネットワーク(101)等のネットワークを介して通信および/またはデータを送信および受信するための、1つ以上のネットワークインタフェースコントローラまたは他のタイプのトランシーバ回路を含んでもよい。
ネットワーク(101)は、例えば、インターネットのようなパブリックネットワーク、組織および/またはパーソナルイントラネットのようなプライベートネットワーク、またはプライベートおよびパブリックネットワークのいくつかの組み合わせを含んでもよい。ネットワーク(108)はまた、ローカルエリアネットワーク(LAN)、広域ネットワーク(WAN)、衛星ネットワーク、ケーブルネットワーク、Wi-Fiネットワーク、WiMAXネットワーク、移動体通信ネットワーク(例えば、3G、4G、5G等)、またはそれらの任意の組み合わせを含むがこれらに限定されない任意のタイプの有線および/または無線ネットワークを含んでもよい。ネットワーク(101)は、インターネットプロトコル(「IP」)、伝送制御プロトコル(「TCP」)、ユーザデータグラムプロトコル(「UDP」)、または他のタイプのプロトコル等のパケットベースおよび/またはデータグラムベースのプロトコルを含む通信プロトコルを利用してもよい。さらに、ネットワーク(101)はまた、スイッチ、ルータ、ゲートウェイ、アクセスポイント、ファイアウォール、基地局、リピータ、バックボーンデバイス等の、ネットワーク通信を容易にし、および/またはネットワークのためのハードウェア基盤を形成するいくつかのデバイスを含んでもよい。いくつかの例では、ネットワーク(101)は、無線アクセスポイント(「WAP」)等の無線ネットワークへの接続を可能にするデバイスをさらに含んでもよい。
図1の例では、サブシステム(110)は、ピアツーピア技術を使用してビデオカンファレンスセッションをホストし得る。例えば、ユーザデバイス(120)がビデオカンファレンスセッションを結合した後、ユーザデバイス(120)は、(例えば、サブシステム(110)のIPアドレスを使用して)パケットを適切にアドレス指定してサブシステム(110)に送信し得、サブシステム(110)は、(例えば、ユーザデバイス(120)のIPアドレスを使用して)パケットを適切にアドレス指定してユーザデバイス(120)に送信し得る。パケットは、メディアストリーム、確認応答、制御パラメータ等の様々な情報およびデータを搬送し得る。
いくつかの例では、ビデオカンファレンスシステム(100)は、没入型ビデオカンファレンスのビデオカンファレンスセッションを提供し得る。例えば、ビデオカンファレンスセッションの間、サブシステム(110)は、全方位カメラおよび/または全方位マイクロフォンを使用して全方位ビデオ/オーディオ等の没入型メディアを生成するように構成されている。一例では、ユーザデバイス(120)におけるHMDは、ユーザBの頭部の動きを検出し、その頭部の動きに基づいてユーザBのビューポートの向きを決定し得る。ユーザデバイス(120)は、ユーザBのビューポートの向きをサブシステム(110)に送信し得、サブシステム(110)は、ユーザBのビューポートの向きに基づいて調整されたビデオストリーム(ユーザBのビューポートの向きに基づいて調整されたビデオを搬送するメディアストリーム)、ユーザBのビューポートの向きに基づいて調整されたオーディオストリーム(ユーザBのビューポートの向きに基づいて調整されたビデオを搬送するメディアストリーム)等のビューポート依存ストリームを、ユーザデバイス(120)で再生するためにユーザデバイス(120)に送信し得る。
別の例では、ユーザCは、ユーザデバイス(130)を使用して、(例えば、スマートフォンのタッチスクリーンを使用して)ユーザCのビューポートの向きを入力し得る。ユーザデバイス(130)は、ユーザCのビューポートの向きをサブシステム(110)に送信し得、サブシステム(110)は、ユーザCのビューポートの向きに基づいて調整されたビデオストリーム(ユーザCのビューポートの向きに基づいて調整されたビデオを搬送するメディアストリーム)、ユーザCのビューポートの向きに基づいて調整されたオーディオストリーム(ユーザCのビューポートの向きに基づいて調整されたオーディオを搬送するメディアストリーム)等のビューポート依存ストリームを、ユーザデバイス(130)で再生するためにユーザデバイス(130)に送信し得る。
ビデオカンファレンスセッションの間、ユーザBおよび/またはユーザCのビューポートの向きは変化し得ることに留意されたい。ビューポートの向きの変更は、サブシステム(110)に通知され得、サブシステム(110)は、ユーザデバイス(120)およびユーザデバイス(130)にそれぞれ送信されるそれぞれのビューポート依存ストリームにおけるビューポートの向きを調整し得る。
説明を容易にするために、没入型メディアを使用して、全方位ビデオ、全方位オーディオ等の広角メディアを参照し、広角メディアに基づいて生成されるビューポート依存メディアを参照する。本開示では、360度ビデオ、360度オーディオ等の360度メディアを使用してビデオカンファレンスの技術を説明し、360度より小さい角度の没入型メディアでビデオカンファレンスの技術を使用し得ることに留意されたい。
図2は、本開示のいくつかの例による別のビデオカンファレンスシステム(200)を示す。ビデオカンファレンスシステム(200)は、ネットワークベースメディア処理サーバ(240)と、会議室A~会議室Zにそれぞれ設置されたサブシステム(210A)~(210Z)等の複数のサブシステムと、ユーザデバイス(220)および(230)等の複数のユーザデバイスとを含む。ネットワークベースメディア処理サーバ(240)は、ビデオカンファレンスセッションを設定し、サブシステム(210A)~(210Z)と、ユーザデバイス(220)および(230)等のユーザデバイスがビデオカンファレンスセッションに参加できるようにし得るので、会議室A~Zにおけるユーザ、ユーザデバイス(220)のユーザB、およびユーザデバイス(230)のユーザC等のユーザがビデオカンファレンスセッションに参加し得る。
いくつかの例では、サブシステム(210A)~(210Z)とユーザデバイス(220)および(230)とは、ビデオカンファレンスセッションにおいて端末と呼ばれ、ネットワークベースメディア処理サーバ(240)は、ビデオカンファレンスセッションにおいて端末をブリッジし得る。いくつかの例では、ネットワークベースメディア処理サーバ(240)は、メディア対応ネットワーク要素と呼ばれる。ネットワークベースメディア処理サーバ(240)は、メディアリソース機能(MRF)を実行し得、メディア制御ユニット(MCU)としてメディア制御機能を実行し得る。いくつかの例では、ビデオカンファレンスセッションにおいて没入型メディアをネットワークベースメディア処理サーバ(240)に送信するビデオカンファレンスシステム(200)内の端末は、リモート端末(ITT4RT)送信機(Tx)クライアント、またはリモート送信機もしくは送信機クライアントのための没入型テレカンファレンスおよびテレプレゼンスと呼ばれる。そして、ビデオカンファレンスセッションにおいてネットワークベースメディア処理サーバ(240)から没入型メディア(例えば、メディアストリームは没入型メディアに基づいて生成される)に関連するメディアストリームを受信するビデオカンファレンスシステム(200)における端末は、リモート端末(ITT4RT)受信機(Rx)クライアント、またはリモート受信機、または受信機クライアントのための没入型ビデオカンファレンスおよびテレプレゼンスと呼ばれる。端末が、ビデオカンファレンスセッションにおいてITT4RT Rxクライアントおよび/またはITT4RT Txクライアントであってもよいことに留意されたい。
いくつかの実施形態では、サブシステム(210A)~(210Z)の各々は、前述のサブシステム(110)と同様に動作する。さらに、サブシステム(210A)~(210Z)の各々は、サブシステム(110)で使用されるものと同一または同等のあるコンポーネントを利用する。これらのコンポーネントの説明は上で提供されており、ここではわかりやすくするために省略される。なお、サブシステム(210A)~(210Z)が互いに異なる構成であり得ることに留意されたい。
ユーザデバイス(220)および(230)は、前述のユーザデバイス(120)および(130)と同様に構成され、ネットワーク(201)は、ネットワーク(101)と同様に構成されている。これらのコンポーネントの説明は上で提供されており、ここではわかりやすくするために省略される。
いくつかの例では、ネットワークベースメディア処理サーバ(240)は、ビデオカンファレンスセッションを開始し得る。例えば、サブシステム(210A)~(210Z)のうちの1つと、ユーザデバイス(220)および(230)は、ネットワークベースメディア処理サーバ(240)にアクセスして、ビデオカンファレンスセッションを開始し得る。サブシステム(210A)~(210Z)と、ユーザデバイス(220)および(230)とは、ビデオカンファレンスセッションに参加し得る。さらに、ネットワークベースメディア処理サーバ(240)は、ビデオカンファレンスセッションにおいて端末をブリッジするためのメディア関連機能を提供するように構成されている。例えば、サブシステム(210A)~(210Z)は、ビデオおよびオーディオ等のそれぞれのメディア情報を搬送するパケットをそれぞれアドレス指定し、ネットワークベースメディア処理サーバ(240)に送信し得る。いくつかの例では、ネットワークベースメディア処理サーバ(240)に送信されるメディア情報は、ビューポートに依存しないことに留意されたい。例えば、サブシステム(210A)~(210Z)は、360度ビデオ全体等のそれぞれのビデオをネットワークベースメディア処理サーバ(240)に送信し得る。さらに、ネットワークベースメディア処理サーバ(240)は、ユーザデバイス(220)および(230)からビューポートの向きを受信し、メディアを調整するためのメディア処理を実行し、調整されたメディア情報をそれぞれのユーザデバイスに送信し得る。
一例では、ユーザデバイス(220)がビデオカンファレンスセッションを結合した後、ユーザデバイス(220)は、パケットをアドレス指定し、ネットワークベースメディア処理サーバ(240)にパケットを送信し得、ネットワークベースメディア処理サーバ(240)は、パケットをアドレス指定し、ユーザデバイス(220)にパケットを送信し得る。パケットは、メディアストリーム、制御パラメータ等の任意の適切な情報/データを含み得る。一例では、ユーザBは、会議室におけるサブシステムからビデオを視聴するために、ユーザデバイス(220)を使用して会議室を選択し得る。例えば、ユーザBは、会議室Aに設置されたサブシステム(210A)から取り込まれたビデオを視聴するために、ユーザデバイス(220)を使用して会議室Aを選択し得、また、ユーザデバイス(220)におけるHMDは、ユーザBの頭部の動きを検出し、その頭部の動きに基づいてユーザBのビューポートの向きを決定し得る。ユーザデバイス(220)は、会議室Aの選択およびユーザBのビューポートの向きをネットワークベースメディア処理サーバ(240)に送信し得、ネットワークベースメディア処理サーバ(240)は、サブシステム(210A)から送信されたメディアを処理し、ユーザBのビューポートの向きに基づいて調整されたビデオストリーム、ユーザBのビューポートの向きに基づいて調整されたオーディオストリーム等のビューポート依存ストリームを、ユーザデバイス(220)で再生するためにユーザデバイス(220)に送信し得る。いくつかの例では、ユーザデバイス(220)が会議室Aを選択したとき、ユーザデバイス(220)、サブシステム(210A)、およびネットワークベースメディア処理サーバ(240)は、セッション記述プロトコル(SDP)に基づいて互いに通信し得る。
別の例では、ユーザデバイス(230)がビデオカンファレンスセッションを結合した後、ユーザデバイス(230)は、パケットをアドレス指定し、ネットワークベースメディア処理サーバ(240)にパケットを送信し得、ネットワークベースメディア処理サーバ(240)は、パケットをアドレス指定し、ユーザデバイス(230)にパケットを送信し得る。パケットは、メディアストリーム、制御パラメータ等の任意の適切な情報/データを含み得る。いくつかの例では、ネットワークベースメディア処理サーバ(240)は、調整されたメディア情報をユーザデバイス(230)に送信し得る。例えば、ユーザCは、ユーザデバイス(230)を使用して、(例えば、スマートフォンのタッチスクリーンを使用して)会議室Z等の会議室の選択と、ユーザCのビューポートの向きとを入力し得る。ユーザデバイス(230)は、会議室Zの選択情報、およびユーザCのビューポートの向きをネットワークベースメディア処理サーバ(240)に送信し得、ネットワークベースメディア処理サーバ(240)は、サブシステム(210Z)から送信されたメディアを処理し、ユーザCのビューポートの向きに基づいて調整されたビデオストリーム、ユーザCのビューポートの向きに基づいて調整されたオーディオストリーム等のビューポート依存ストリームを、ユーザデバイス(230)で再生するためにユーザデバイス(230)に送信し得る。いくつかの例では、ユーザデバイス(230)が会議室Zを選択したとき、ユーザデバイス(230)、サブシステム(210Z)、およびネットワークベースメディア処理サーバ(240)は、セッション記述プロトコル(SDP)に基づいて互いに通信し得る。
ビデオカンファレンスセッションの間、ユーザ(例えば、ユーザB、ユーザC)のビューポートの向きが変化してもよいことに留意されたい。例えば、ユーザBのビューポートの向きの変更は、ユーザBによってネットワークベースメディア処理サーバ(240)に通知され得、ネットワークベースメディア処理サーバ(240)は、それに応じてユーザデバイス(220)に送られるビューポート依存ストリームにおいてビューポートの向きを調整し得る。
説明を容易にするために、没入型メディアを使用して、全方位ビデオ、全方位オーディオ等の広角メディアを参照し、広角メディアに基づいて生成されるビューポート依存メディアを参照する。本開示では、360度ビデオ、360度オーディオ等の360度メディアを使用してビデオカンファレンスの技術を説明し、360度より小さい角度の没入型メディアに対してビデオカンファレンスの技術が使用され得ることに留意されたい。
会議室の選択は、ビデオカンファレンスセッションの間に変更され得ることに留意されたい。一例では、ユーザデバイス(220)、ユーザデバイス(230)等のユーザデバイスは、アクティブスピーカに基づいて、ある会議室から別の会議室への切り替えをトリガし得る。例えば、会議室Aにいるアクティブな発言者に応じて、ユーザデバイス(230)は、会議室の選択を会議室Aに切り替えることを決定し、会議室Aの選択をネットワークベースメディア処理サーバ(240)に送り得る。その後、ネットワークベースメディア処理サーバ(240)は、サブシステム(210A)から送信されたメディアを処理し、ユーザCのビューポートの向きに基づいて調整されたビデオストリーム、ユーザCのビューポートの向きに基づいて調整されたオーディオストリーム等のビューポート依存ストリームをユーザデバイス(230)で再生するためにユーザデバイス(230)に送信し得る。
いくつかの例では、ネットワークベースメディア処理サーバ(240)は、アクティブなユーザがいないいずれかの会議室からのビデオストリームの受信を一時停止し得る。例えば、ネットワークベースメディア処理サーバ(240)が、会議室Zにアクティブなユーザがまったくいないと決定すると、その後、ネットワークベースメディア処理サーバ(240)は、サブシステム(210Z)のビデオストリームの受信を一時停止し得る。
いくつかの例では、ネットワークベースメディア処理サーバ(240)は、分散されたコンピューティングリソースを含み得、ネットワーク(201)を介して、サブシステム(210A)~(210Z)ならびにユーザデバイス(220)および(230)と通信し得る。いくつかの例では、ネットワークベースメディア処理サーバ(240)は、1つ以上のビデオカンファレンスセッションの態様を管理することを任されている独立したシステムであってもよい。
様々な例では、ネットワークベースメディア処理サーバ(240)は、リソースを共有し、負荷を均衡させ、性能を向上させ、フェイルオーバのサポートまたは冗長性を提供し、または他の目的のために、クラスタまたは他のグルーピングされた構成で動作する1つ以上のコンピューティングデバイスを含んでもよい。例えば、ネットワークベースメディア処理サーバ(240)は、従来のサーバタイプのデバイス、デスクトップコンピュータタイプのデバイス、および/またはモバイルタイプのデバイス等の多様なクラスのデバイスに属してもよい。したがって、単一のタイプのデバイス、すなわちサーバタイプのデバイスとして図示されているが、ネットワークベースメディア処理サーバ(240)は、多種多様なデバイスタイプを含んでもよく、特定のタイプのデバイスに限定されない。ネットワークベースメディア処理サーバ(240)は、サーバコンピュータ、デスクトップコンピュータ、ウェブサーバコンピュータ、パーソナルコンピュータ、モバイルコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、または任意の他の種類のコンピューティングデバイスを表してもよいが、これらに限定されない。
本開示の一態様によれば、ネットワークベースメディア処理サーバ(240)は、ユーザデバイス(220)、ユーザデバイス(230)等の端末における処理負担を軽減するために、特定のメディア機能を実行し得る。例えば、ユーザデバイス(220)および/またはユーザデバイス(230)は、制限されたメディア処理能力を有してもよいか、または複数のビデオストリームをエンコーディングおよびレンダリングすることが困難であってもよく、ネットワークベースメディア処理サーバ(240)は、オーディオおよびビデオストリームのデコーディング/エンコーディング等のメディア処理を実行して、ユーザデバイス(220)および(230)におけるメディア処理をオフロードし得る。いくつかの例では、ユーザデバイス(220)および(230)はバッテリ駆動デバイスであり、メディア処理がユーザデバイス(220)および(230)からネットワークベースメディア処理サーバ(240)にオフロードされたとき、ユーザデバイス(220)および(230)のバッテリ寿命が増加され得る。
異なるソースからのメディアストリームが、処理および混合され得る。国際標準化機構(ISO)23090-2において等のいくつかの例では、オーバーレイは、第1のメディア上でレンダリングされる第2のメディアとして定義され得る。本開示の一態様によれば、没入型ビデオカンファレンスのビデオカンファレンスセッションに対して、追加のメディアコンテンツ(例えば、ビデオおよび/またはオーディオ、静止画像、プレゼンテーションスライド等)が、没入型メディアコンテンツ上にオーバーレイされ得る。追加のメディア(または、メディアコンテンツ)は、没入型メディア(または、没入型メディアコンテンツ)に対するオーバーレイメディア(または、オーバーレイメディアコンテンツ、または略してオーバーレイ)と呼ばれ得る。例えば、オーバーレイコンテンツは、全方位ビデオ上でレンダリングされたビジュアル/オーディオメディアの一部であり得る。
図2を参照すると、いくつかの例では、複数またはすべてのサブシステム(210A)~(210Z)は、没入型メディアおよびオーバーレイコンテンツをネットワークベースメディア処理サーバ(240)にそれぞれ送信し得る。したがって、ネットワークベースメディア処理サーバ(240)で利用可能な異なるソースからの複数の没入型メディアおよび関連するオーバーレイコンテンツが存在する場合がある。いくつかの実施形態では、ネットワークベースメディア処理サーバ(240)は、例えば、セッション記述プロトコル(SDP)メッセージを使用して、ビデオカンファレンスセッションにおいてメディアコンテンツを受信する端末に、複数の没入型メディアおよび関連するオーバーレイコンテンツの可用性を通知し得る。例えば、ネットワークベースメディア処理サーバ(240)は、SDPオファーメッセージを使用して、メディアコンテンツの利用可能性を通知し得る。
いくつかの例では、SDPが使用され、ビデオカンファレンスセッション等のマルチメディアセッションの参加者にセッション記述メタデータを提供するための標準表現を提供する。SDPメッセージは、マルチメディアセッションのためのセッションレベルのセッション記述を含み、マルチメディアセッションにおけるメディアのためのメディアレベルでのいくつかのメディア記述を含み得る。各メディア記述は、「m=」フィールドで開始し得、次の「m=」フィールドによってまたはセッション記述の最後によってのいずれかで終了する。「m=」フィールドには、次のような複数のサブフィールドが含まれ得る。
m=<media><port>...
ここで、<media>が、「オーディオ」、「ビデオ」、「テキスト」等のメディアタイプに対するサブフィールドであり、<port>が、メディアストリームが送信されるトランスポートポートのサブフィールドである。
さらに、マルチメディアセッションおよび/またはメディアは、属性フィールドを使用して定義された属性を有し得る。いくつかの例では、属性フィールドは以下の2つの形式を持ち得る:
a=<attribute>
a=<attribute>:<value>
第1の形式は、属性がバイナリ値を持つフラグである場合に使用され得、第2の形式は、非バイナリ値を属性に割り当てるために使用され得る。
いくつかの例では、ネットワークベースメディア処理サーバ(240)は、それぞれ異なるソースから複数の没入型メディア(例えば、複数の360度ビデオ)を受信し、受信機クライアント等の参加者に複数の没入型メディアの利用可能性を通知するSDPメッセージを生成し得る。いくつかの例では、ソースの1つ、例えば、会議室はデフォルトの会議室であり、他の会議室は代替的な会議室であり得る。一例では、SDPメッセージは、複数の没入型メディアのための複数の「m=」フィールドをそれぞれ含み、複数の没入型メディアのための属性フィールドを含み得る。
一例では、SDPメッセージは、デフォルトの会議室からの360度ビデオに対する以下の「m=」フィールドおよび属性フィールドを含み得る。
m=video
a=3gpp_360video
a=content:main
別の例では、SDPメッセージは、代替的な会議室からの360度ビデオに対する以下の「m=」フィールドおよび属性フィールドを含み得る。
m=video
a=3gpp_360video
a=content:alt
別の例では、SDPメッセージは、他の遠隔参加者(例えば、ユーザデバイス)からの360度ビデオに対して、「content」属性なしに、以下の「m=」フィールドおよび属性フィールドを含み得る。
m=video
a=3gpp_360video
本開示の一態様によれば、オーバーレイは、グループ属性を使用してSDPメッセージに含まれ得る。いくつかの実施形態では、itt4rt_group属性と呼ばれる属性は、没入型メディアにオーバーレイ情報を提供するためにSDPにおいて使用される。itt4rt_group属性は、例えば、メディアに対応するメディア識別子(mid)のリストの形式で、メディアのグループを含む。例えば、itt4rt_group属性の中のmidのリストは、没入型メディア(例えば、360度メディア)と関連付けられた少なくとも1つのmidと、対応するメディア記述の中のmid属性によって定義されたオーバーレイと関連付けられた少なくとも1つのmidとを含み得る。
本開示の一態様によれば、ネットワークベースメディア処理サーバ(240)がそれぞれ異なるソースから複数の没入型メディア(例えば、複数の360度ビデオ)を受信したとき、ネットワークベースメディア処理サーバ(240)は、リモート参加者に通知するSDPメッセージ(SDPオファーとも呼ばれる)を生成し得、SDPメッセージは、itt4rt_group属性を使用して定義されたマルチグループを含み得る。いくつかの例では、各グループは、没入型メディア(例えば、360度メディア)と関連付けられた1つのmidと、オーバーレイとして2Dメディア(例えば、2Dビデオメディア)と関連付けられた1つ以上の他のmidとを含み得る。一例では、2Dメディアは、グループ内で指定された没入型メディアのソース以外のソースから提供され得る。別の例では、2Dメディアは、グループ内で指定された没入型メディアソースと同じソースから提供され得る。
本開示のいくつかの態様は、遠隔端末(ITT4RT)のための没入型テレカンファレンスおよびテレプレゼンスのための没入型メディア(例えば、360度ビデオ)のマルチグループをサポートするための制御技術を提供する。いくつかの実施形態では、制御技術を使用して、異なる没入型メディア(例えば、異なる360度ビデオ)およびオーバーレイを含むマルチグループに、例えば、MRF/MCU機能を有するネットワークベースメディア処理サーバ(240)からリモート受信機またはITT4RT-Rxクライアントに通知する。
本開示の一態様によれば、グルーピング制御信号は、没入型メディアのITT4RT-Txクライアント、サブシステム(210A)~(210Z)、ユーザデバイス(220)および(230)等のような没入型メディアのソースデバイスから、ネットワークベースメディア処理サーバ(240)等のネットワークベースメディア処理サーバに提供され、他のソースからのオーバーレイが没入型メディアとグルーピングされ得るか否かを示し得る。いくつかの例では、グルーピング制御信号は、SDPメッセージにおける属性パラメータとして提供され得る。
いくつかの例では、属性パラメータ「a=other_overlays」は、リモート受信機クライアントにメディアサービスを提供するネットワークベースメディア処理サーバ(例えば、MRF/MCU)において、単一または複数のitt4rt_groupにメディアストリームをグルーピングするために、送信機クライアントからのSDPにおいて使用される。
いくつかの例では、属性パラメータ「a=no_other_overlays」は、リモート受信機クライアントにメディアサービスを提供するネットワークベースメディア処理サーバ(例えば、MRF/MCU)において、単一または複数のitt4rt_groupにメディアストリームをグルーピングするために、送信機クライアントからのSDPにおいて使用される。
いくつかの例では、属性aパラメータ「a=allowed_content」は、リモート受信機クライアントにメディアサービスを提供するネットワークベースメディア処理サーバ(例えば、MRF/MCU)において、単一または複数のitt4rt_group内のメディアストリームをグルーピングするために、送信機クライアントからのSDPにおいて使用される。
いくつかの実施形態では、図2に示すもののように、全方位カメラを備えた複数の会議室がテレカンファレンス中であり、MRF/MCUの機能を有するネットワークベースメディア処理サーバ(240)は、メディアコンテンツをITT4RT-Rxクライアントに再配布するための中心点となり得る。ITT4RT-Txクライアントが360度ビデオおよびオーバーレイを含むメディアストリームをシグナリングするとき、ITT4RT-Txクライアントは、ネットワークベースメディア処理サーバ(240)へのSDPメッセージにおいて、「a=other_overlays」、「a=no_other_overlays」、「a=allowed_content」等のグルーピング制御信号を含む。このグルーピング制御信号は、ネットワークベースメディア処理サーバ(240)が、そのITT4RT-Txクライアントからのメディアストリームを他のITT4RT-Txクライアントからのメディアストリームとグルーピングすることを許可されているか否かを示す。
ネットワークベースメディア処理サーバ(240)は、ITT4RT-Txクライアントからグルーピング制御信号および他の適切なメディア情報を受信し、グルーピング制御信号に基づいてitt4rt_groupグループ等のグループを形成する。
一実施形態では、すべてのITT4RT-Txクライアントは、他のITT4RT-Txクライアントからのオーバーレイを許可し、ネットワークベースメディア処理サーバ(240)は、ITT4RT-Txクライアントからのすべてのメディアを単一のitt4rt_groupグループにグルーピングし、単一のitt4rt_groupグループをITT4RT-Rxクライアントに通知してもよい。
一実施形態では、1つ以上のITT4RT-Txクライアントが他のITT4RT-Txクライアントからのオーバーレイを許可しないとき、ネットワークベースメディア処理サーバ(240)は、1つ以上のITT4RT-Txクライアントからのメディアのためにそれぞれ別個のitt4rt_groupグループを形成してもよい。さらに、ネットワークベースメディア処理サーバ(240)は、他のITT4RT-Txからのオーバーレイを許可するITT4RT-Txクライアントのすべてのメディアを単一のitt4rt_groupグループにグルーピングしてもよい。
一例では、「a=other_overlays」がITT4RT-TxクライアントからのSDPにあるとき、他のITT4RT-Txクライアントからのオーバーレイが許可される。ITT4RT-TxクライアントからのSDPに「a=other_overlays」がないとき、他のITT4RT-Txからのオーバーレイは許可されない。別の例では、「a=no_other_overlays」がITT4RT-TxクライアントからのSDPにあるとき、他のITT4RT-Txクライアントからのオーバーレイは許可されない(または許可されない)。ITT4RT-TxクライアントからのSDPに「a=no_other_overlays」がない場合は、他のITT4RT-Txからのオーバーレイが許可される。
いくつかの例では、(例えば、没入型ビデオではない)2Dビデオを送信するITT4RT-Txクライアントに対して、2Dビデオへのオーバーレイが許可され、グルーピング制御信号を送信する必要がない。いくつかの例では、グルーピング制御信号は、ITT4RT-Txクライアントが没入型ビデオ(例えば、360度ビデオ)を送信しているときにシグナリングされる。
図3は、本開示のいくつかの態様によるいくつかの具体例を例示するためのビデオカンファレンスシステム(300)を示す。ビデオカンファレンスシステム(300)は、ネットワークベースメディア処理サーバ(340)と、会議室A~会議室Cにそれぞれ設置されたサブシステム(310A)~(310C)と、ユーザデバイス(320)とを含む。ネットワークベースメディア処理サーバ(340)は、ネットワークベースメディア処理サーバ(240)と同様に動作し、ネットワークベースメディア処理サーバ(240)において使用されるコンポーネントと同一または同等のコンポーネントを利用する。ユーザデバイス(320)は、ユーザデバイス(220)と同様に動作する。
図3の例では、サブシステム(310A)は、360A(メディア識別子は中間360Aである)と呼ばれる360度ビデオを生成する全方位カメラを含む。サブシステム(310A)はまた、OA1(メディア識別子は中間OA1である)およびOA2(メディア識別子は中間OA2である)と呼ばれるオーバーレイを生成する。サブシステム(310B)は、360B(メディア識別子は中間360Bである)と呼ばれる360度ビデオを生成する全方位カメラを含む。サブシステム(310B)はまた、OB1(メディア識別子は中間OB1である)およびOB2(メディア識別子は中間OB2である)と呼ばれるオーバーレイを生成する。サブシステム(310C)は、360C(メディア識別子は中間360Cである)と呼ばれる360度ビデオを生成する全方位カメラを含む。サブシステム(310C)は、OC1(メディア識別子はmid-OC1)およびOC2(メディア識別子はmid-OC2)と呼ばれるオーバーレイも生成する。
いくつかの例では、サブシステム(310A)は、360度ビデオ360AとオーバーレイOA1およびOA2とをネットワークベースメディア処理サーバ(340)に送信する。サブシステム(310B)は、360度ビデオ360BとオーバーレイOB1およびOB2とをネットワークベースメディア処理サーバ(340)に送信する。サブシステム(310C)は、360度ビデオ360CとオーバーレイOC1およびOC2とをネットワークベースメディア処理サーバ(340)に送信する。サブシステム(310A)、(310B)、および(310C)はまた、グルーピング制御信号をネットワークベースメディア処理サーバ(340)に提供する。サブシステム(310A)からのグルーピング制御信号は、サブシステム(310B)およびサブシステム(310C)からのオーバーレイが360度ビデオ360Aでグルーピングされ得るか否かを示す。サブシステム(310B)からのグルーピング制御信号は、サブシステム(310A)およびサブシステム(310C)からのオーバーレイが360度ビデオ360Bでグルーピングされ得るか否かを示す。サブシステム(310C)からのグルーピング制御信号は、サブシステム(310A)およびサブシステム(310B)からのオーバーレイが360度ビデオ360Cでグルーピングされ得るか否かを示す。
いくつかの例では、サブシステム(310A)からのグルーピング制御信号は、360度ビデオ360Aと共に、サブシステム(310B)およびサブシステム(310C)等の他のソースからのオーバーレイのグルーピングの許可を示す。サブシステム(310B)からのグルーピング制御信号は、サブシステム(310A)およびサブシステム(310C)等の他のソースからのオーバーレイを360度ビデオ360Bでグルーピングすることの許可を示す。サブシステム(310C)からのグルーピング制御信号は、サブシステム(310A)およびサブシステム(310B)等の他のソースからのオーバーレイを360度ビデオ360Cとグルーピングすることの許可を示し、その後、ネットワークベースメディア処理サーバ(340)は、360度ビデオおよび異なるサブシステムからのオーバーレイを混合し得る。
一例では、ネットワークベースメディア処理サーバ(340)は、単一のitt4rt_groupを形成し得、ITT4RT-Rxクライアント(例えば、ユーザデバイス(320))へのSDPメッセージ(SDPオファーとも呼ばれる)に属性フィールドを含む。例えば、属性フィールドは以下のように表示される。a=itt4rt_group:<mid-360A><mid-OA1><mid-OA2>;<mid-360B><mid-OB1><mid-OB2>;<mid-360C><mid-OC1><mid-OC2>
一例では、ネットワークベースメディア処理サーバ(340)は、異なるサブシステムからの360度ビデオおよびオーバーレイを混合する1つ以上のitt4rt_groupグループを形成し得る。一例では、ネットワークベースメディア処理サーバ(340)は、ITT4RT-Rxクライアント(例えば、ユーザデバイス(320))へのSDPメッセージ(SDPオファーとも呼ばれる)における1つ以上のitt4rt_groupグループに対応する属性フィールドを含む。
図4A~図4Eは、1つ以上のitt4rt_groupグループに対応する属性フィールドのいくつかの例を示す。
いくつかの例では、1つ以上のサブシステムは、他のソースからのオーバーレイのグルーピングを許可しない。例えば、サブシステムを有する会議室の中の発表者は、他のソースからのオーバーレイが発表者のプレゼンテーションを妨害することを望まないので、他のソースからのオーバーレイを不許可にするようにサブシステムを構成し得る。
いくつかの例では、サブシステム(310A)からのグルーピング制御信号は、360度ビデオ360Aと共に、サブシステム(310B)およびサブシステム(310C)等の他のソースからのオーバーレイのグルーピングの不許可を示す。サブシステム(310B)からのグルーピング制御信号は、サブシステム(310A)およびサブシステム(310C)等の他のソースからのオーバーレイを360度ビデオ360Bでグルーピングすることの許可を示す。サブシステム(310C)からのグルーピング制御信号は、サブシステム(310A)およびサブシステム(310B)等の他のソースからのオーバーレイを360度ビデオ360Cとグルーピングすることの許可を示し、その後、ネットワークベースメディア処理サーバ(340)は、360度ビデオおよび異なるサブシステムからのオーバーレイを混合し得る。
一例では、ネットワークベースメディア処理サーバ(340)は、サブシステム(310A)からの360度ビデオおよびオーバーレイを含む別個のitt4rt_groupグループと、混合可能な他の360度ビデオおよびオーバーレイを含む別のitt4rt_groupグループとを形成し得る。例えば、ネットワークベースメディア処理サーバ(340)は、ITT4RT-Rxクライアント(例えば、ユーザデバイス(320))へのSDPメッセージ(SDPオファーとも呼ばれる)におけるitt4rt_groupグループに対応する属性フィールドを含む。例えば、属性フィールドは以下のように表示される。
a=itt4rt_group:<mid-360A><mid-OA1><mid-OA2>
a=itt4rt_group:<mid-360B><mid-OB1><mid-OB2>;<mid-360C><mid-OC1><mid-OC2>
別の例では、ネットワークベースメディア処理サーバ(340)は、サブシステム(310A)からの360度ビデオおよびオーバーレイを含む別個のitt4rt_groupグループと、混合され得る他の360度ビデオおよびオーバーレイを含む1つ以上のitt4rt_groupグループとを形成し得る。例えば、ネットワークベースメディア処理サーバ(340)は、ITT4RT-Rxクライアント(例えば、ユーザデバイス(320))へのSDPメッセージ(SDPオファーとも呼ばれる)におけるitt4rt_groupグループに対応する属性フィールドを含む。
図5A~図5Dは、1つ以上のitt4rt_groupグループに対応する属性フィールドのいくつかの例を示す。
本開示の一態様によれば、ユーザデバイス(320)等のITT4RT-RxクライアントがSDPオファーを受信したとき、ユーザデバイス(320)は、SDPメッセージ(SDPアンサーとも呼ばれる)をネットワークベースメディア処理サーバ(340)に送信し得、SDPアンサーは、SDPオファー内のitt4rt_groupグループから選択された1つのitt4rt_groupグループを示す。
本開示の一態様によれば、グルーピング制御信号は、コンテンツに基づき得る。いくつかの実施形態では、属性フィールド「a=allowed_content」を、ITT4RT-Txクライアント(例えば、図3のサブシステム(310A)、(310B)、および(310C)のうちの1つ)からネットワークベースメディア処理サーバ(例えば、ネットワークベースメディア処理サーバ(340))へのSDPメッセージに含め得る。属性フィールドには、混合されることが許可されているコンテンツを示す値が割り当てられる。一例では、値は2Dビデオを示す。別の例では、値は画像を示す。別の例では、値はスライドを示す。
例えば、サブシステム(310A)は、360度ビデオ360Aと、オーバーレイOA1(2Dビデオ)およびOA2(画像)とをネットワークベースメディア処理サーバ(340)に送信する。サブシステム(310B)は、360度ビデオ360Bと、オーバーレイOB1(2Dビデオ)およびOB2(スライド)とをネットワークベースメディア処理サーバ(340)に送信する。サブシステム(310C)は、360度ビデオ360Cと、オーバーレイOC1(画像)およびOC2(スライド)とをネットワークベースメディア処理サーバ(340)に送信する。サブシステム(310A)、(310B)、および(310C)はまた、グルーピング制御信号をネットワークベースメディア処理サーバ(340)に提供する。サブシステム(310A)からのグルーピング制御信号は、サブシステム(310B)およびサブシステム(310C)からのオーバーレイが360度ビデオ360Aでグルーピングされ得るか否か、およびグルーピングが許可されてもよいオーバーレイコンテンツを示す。サブシステム(310B)からのグルーピング制御信号は、サブシステム(310A)およびサブシステム(310C)からのオーバーレイが360度ビデオ360Bでグルーピングされ得るか否か、およびグルーピングが許可されてもよいオーバーレイコンテンツを示す。サブシステム(310C)からのグルーピング制御信号は、サブシステム(310A)およびサブシステム(310B)からのオーバーレイが360度ビデオ360Cでグルーピングされ得るか否か、およびグルーピングが許可されてもよいオーバーレイコンテンツを示す。
いくつかの例では、サブシステム(310A)からのグルーピング制御信号は、サブシステム(310B)およびサブシステム(310C)等の他のソースからのオーバーレイを360度ビデオ360Aでグルーピングすることの許可を示し、許可されるオーバーレイコンテンツは、ビデオであり、例えば、サブシステム(310A)からネットワークベースメディア処理サーバ(340)へのSDPメッセージにおける以下の属性フィールドを使用する。
a=other_overlay
a=allowed_content:video
サブシステム(310B)からのグルーピング制御信号は、360度ビデオ360Bを用いて、サブシステム(310A)およびサブシステム(310C)等の他のソースからのオーバーレイのグルーピングの許可を示し、許可されるオーバーレイコンテンツは、画像であり、例えば、サブシステム(310B)からネットワークベースメディア処理サーバ(340)へのSDPメッセージにおける以下の属性フィールドを使用する。
a=other_overlay
a=allowed_content:image
サブシステム(310C)からのグルーピング制御信号は、サブシステム(310A)およびサブシステム(310B)等の他のソースからのオーバーレイを360度ビデオ360Cとグルーピングすることの許可を示し、許可されるオーバーレイコンテンツは、スライドであり、例えば、サブシステム(310C)からネットワークベースメディア処理サーバ(340)へのSDPメッセージにおける以下の属性フィールドを使用する。
a=other_overlay
a=allowed_content:slides
その後、ネットワークベースメディア処理サーバ(340)は、許可されたオーバーレイコンテンツに従って、異なるサブシステムからの360度ビデオおよびオーバーレイを混合して、1つ以上のitt4rt_groupグループを形成し得る。例えば、ネットワークベースメディア処理サーバ(340)は、ITT4RT-Rxクライアント(例えば、ユーザデバイス(320))へのSDPメッセージ(SDPオファーとも呼ばれる)内の1つ以上のitt4rt_groupグループに対応する属性フィールドを含む。
図6A~図6Eは、1つ以上のitt4rt_groupグループに対応する属性フィールドのいくつかの例を示す。
本開示の一態様によれば、ユーザデバイス(320)等のITT4RT-RxクライアントがSDPオファーを受信したとき、ユーザデバイス(320)は、SDPメッセージ(SDPアンサーとも呼ばれる)をネットワークベースメディア処理サーバ(340)に送信し得、SDPアンサーは、SDPオファーにおける1つ以上のitt4rt_groupグループから選択された1つのitt4rt_groupグループを示す。
図7は、本開示の一実施形態によるプロセス(700)の概要を示すフローチャートを示す。いくつかの実施形態では、プロセス(700)は、サブシステム(110)、(210A)~(210Z)、(310A)~(310C)等の処理回路のような、ビデオカンファレンスにおいて没入型メディアコンテンツを提供する第1のクライアントデバイスにおける処理回路によって実行され得る。いくつかの実施形態では、プロセス(700)はソフトウェア命令で実装されるので、処理回路がソフトウェア命令を実行したとき、処理回路はこのプロセス(700)を実行する。プロセスは(S701)で開始され、(S710)に進む。
(S710)で、第1のクライアントデバイスは、第2のクライアントデバイスからのオーバーレイメディアの、第1のクライアントデバイスの没入型メディアとのグルーピングを制限するグルーピング制御を決定する。一例では、第1のクライアントデバイスは、ユーザ入力に基づいてグルーピング制御を決定する。別の例では、第1のクライアントデバイスは、第1のクライアントデバイスにおける構成に基づいてグルーピング制御を決定する。
没入型メディアは、全方位ビデオ、360度ビデオ、および広角ビデオ等の任意の適切な没入型メディアであり得る。
(S720)で、第1のクライアントデバイスは、グルーピング制御を示すグルーピング制御信号を送信してメディア制御デバイスに通知する。
いくつかの例では、第1のクライアントデバイスは、グルーピング制御を示す属性フィールドを有するセッション記述プロトコル(SDP)メッセージを送信する。
一例では、第1のクライアントデバイスは、第2のクライアントデバイスからのオーバーレイメディアの、第1のクライアントデバイスの没入型メディアとのグルーピングの不許可を示す属性フィールドを有するSDPメッセージを送信する。例えば、属性フィールドは、「a=no_other_overlays」の形式である。
別の例では、第1のクライアントデバイスは、第2のクライアントデバイスからのオーバーレイメディアの、第1のクライアントデバイスの没入型メディアとのグルーピングの許可を示す属性フィールドを有するSDPメッセージを送信する。例えば、属性フィールドは「a=other_overlays」の形式である。
別の例では、第1のクライアントデバイスは、第1のクライアントデバイスの没入型メディアとグルーピングすることが許可されたメディアタイプを示す属性フィールドを有するSDPメッセージを送信する。例えば、属性フィールドは、「a=allowed_content」の形式である。メディアタイプは、2Dビデオ、画像、またはスライドであり得る。
いくつかの例では、第1のクライアントデバイスは、第2のクライアントデバイスからのオーバーレイメディアの、第1のクライアントデバイスの没入型メディアとのグルーピングの許可を示す第1の属性フィールドと、許可されるメディアタイプを示す第2の属性フィールドとを有するSDPメッセージを送信し得る。
(S730)で、第1のクライアントデバイスは、没入型メディアを含む1つ以上のメディアをメディア制御デバイスに提供する。1つ以上のメディアはまた、第1のクライアントデバイスからのオーバーレイメディアを含み得る。
その後、プロセスは(S799)に進み、終了する。
プロセス(700)は適切に適合され得る。プロセス(700)のステップは、修正および/または省略され得る。追加のステップが追加され得る。任意の適切な実装の順序が使用され得る。
図8は、本開示の一実施形態によるプロセス(800)の概要を示すフローチャートを示す。様々な実施形態では、プロセス(800)は、ネットワークベースメディア処理サーバ(240)、ネットワークベースメディア処理サーバ(340)等のような、ビデオカンファレンスのためのネットワークベースメディア処理のメディア制御デバイスにおける処理回路によって実行され得る。いくつかの実施形態では、プロセス(800)はソフトウェア命令において実装されるので、処理回路がソフトウェア命令を実行するときに処理回路がプロセス(800)を実行する。プロセスは(S801)で開始され、(S810)に進む。
(S810)で、メディア制御デバイスは、没入型メディアをメディア制御デバイスに提供する第1のクライアントデバイスからグルーピング制御信号を受信し、グルーピング制御信号は、第2のクライアントデバイスからのオーバーレイメディアの、第1のクライアントデバイスの没入型メディアとのグルーピングを制限するグルーピング制御を示す。
没入型メディアは、全方位ビデオ、360度ビデオ、および広角ビデオ等の任意の適切な没入型メディアであり得る。
いくつかの例では、メディア制御デバイスは、グルーピング制御を示す属性フィールドを有するセッション記述プロトコル(SDP)メッセージを受信する。
一例では、メディア制御デバイスは、第2のクライアントデバイスからのオーバーレイメディアの、第1のクライアントデバイスの没入型メディアとのグルーピングの不許可を示す属性フィールドを有するSDPメッセージを受信する。例えば、属性フィールドは、「a=no_other_overlays」の形式である。
別の例では、メディア制御デバイスは、第2のクライアントデバイスからのオーバーレイメディアの、第1のクライアントデバイスの没入型メディアとのグルーピングの許可を示す属性フィールドを有するSDPメッセージを受信する。例えば、属性フィールドは「a=other_overlays」の形式である。
別の例では、メディア制御デバイスは、第1のクライアントデバイスの没入型メディアとグルーピングされることが許可されるメディアタイプを示す属性フィールドを有するSDPメッセージを受信する。例えば、属性フィールドは、「a=allowed_content」の形式である。メディアタイプは、2Dビデオ、画像、またはスライドであり得る。
いくつかの例では、メディア制御デバイスは、第2のクライアントデバイスからのオーバーレイメディアの、第1のクライアントデバイスの没入型メディアとのグルーピングの許可を示す第1の属性フィールドと、許可されるメディアタイプを示す第2の属性フィールドとを有するSDPメッセージを受信する。
(S820)で、メディア制御デバイスは、グルーピング制御信号に基づいて、第2のクライアントデバイスからのオーバーレイメディアを有する/有さない第1のクライアントデバイスからの没入型メディアを含むグループを決定する。
一例では、グルーピング制御信号が、第2のクライアントデバイスからのオーバーレイメディアの、第1のクライアントデバイスの没入型メディアとのグルーピングの不許可を示すとき、メディア制御デバイスは、第1のクライアントデバイスからの没入型メディアを含むグループを形成し、そのグループは、第1のクライアントデバイスからのオーバーレイを含んでもよいが、そのグループは、他のクライアントデバイスからのオーバーレイを含まない。
一例では、グルーピング制御信号が、第2のクライアントデバイスからのオーバーレイメディアの、第1のクライアントデバイスの没入型メディアとのグルーピングの許可を示すとき、メディア制御デバイスは、第1のクライアントデバイスからの没入型メディアと、第2のクライアントデバイスからのオーバーレイメディアとを含むグループを形成し得る。
一例では、グルーピング制御信号は、没入型メディアとグルーピングされる許可されたメディアタイプを示す。その後、第2のクライアントデバイスからのオーバーレイメディアが許可されたメディアタイプのものであるとき、メディア制御デバイスは、第1のクライアントデバイスの没入型メディアと第2のクライアントデバイスからのオーバーレイメディアとを含むグループを形成し得る。第2のクライアントデバイスからのオーバーレイメディアが許可されたメディアタイプのものでないとき、第2のクライアントデバイスからのオーバーレイメディアは、第1のクライアントデバイスからの没入型メディアとグルーピングされ得ない。
(S830)で、メディア制御デバイスは、グループをビデオカンファレンスの1人以上の参加者に提供する。一例では、メディア制御デバイスは、itt4rt_groupグループ等の1つ以上のグループを定義する属性フィールドを有するSDPオファーを1つ以上の参加者(例えば、ユーザデバイス(320)、ユーザデバイス(220)、ユーザデバイス(230)、サブシステム(210A)~(210Z)の一部、サブシステム(310A)~(310C)の一部等)に送信し得る。
その後、プロセスは(S899)に進んで終了する。
プロセス(800)は適切に適合させ得る。プロセス(800)におけるステップは修正および/または省略され得る。追加のステップが追加され得る。任意の適切な実装の順序が使用され得る。
前述の技術は、コンピュータ可読命令を使用し、かつ1つ以上のコンピュータ可読媒体に物理的に格納されたコンピュータソフトウェアとして実装され得る。例えば、図9は、開示された主題の特定の実施形態を実装するのに適切なコンピュータシステム(900)を示す。
コンピュータソフトウェアは、1つ以上のコンピュータ中央処理装置(CPU)、グラフィック処理装置(GPU)等による、直接、または解釈、マイクロコード実行等を介して実行してもよい命令を含むコードを作成するために、アセンブル、コンパイル、リンク、または同様のメカニズムを受けてもよい任意の適切な機械語またはコンピュータ言語を使用してコーディングされ得る。
命令は、例えば、パーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲーム機、モノのインターネットデバイス等を含む、様々なタイプのコンピュータまたはそのコンポーネントで実行され得る。
コンピュータシステム(900)について図9に示されたコンポーネントは、本質的に例示的なものであり、本開示の実施形態を実装するコンピュータソフトウェアの使用範囲または機能に関するいかなる制限も示唆するものではない。コンポーネントの構成は、コンピュータシステム(900)の例示的な実施形態に示されたコンポーネントのいずれか1つまたは組み合わせに関するいかなる依存関係または要件も有すると解釈されるべきでない。
コンピュータシステム(900)は、特定のヒューマンインタフェース入力デバイスを含んでもよい。そのようなヒューマンインタフェース入力デバイスは、例えば、触覚入力(例えば、キーストローク、スワイプ、データグローブの動き)、オーディオ入力(例えば、声、拍手)、視覚入力(例えば、ジェスチャ)、嗅覚入力(図示せず)を介して、1人以上の人間のユーザによる入力に応答してもよい。ヒューマンインタフェースデバイスはまた、音声(例えば、発話、音楽、周囲音)、画像(例えば、走査画像、静止画カメラで取得される写真画像)、ビデオ(例えば、二次元ビデオ、立体ビデオを含む三次元ビデオ)等の人による意識的な入力に必ずしも直接関連しない、特定のメディアを取り込むことにさらに使用され得る。
入力ヒューマンインタフェースデバイスは、キーボード(901)、マウス(902)、トラックパッド(903)、タッチ画面(910)、データグローブ(図示せず)、ジョイスティック(905)、マイクロフォン(906)、スキャナ(907)、カメラ(908)の1つ以上(示されているものから1つずつだけ)を含んでもよい。
コンピュータシステム(900)はまた、特定のヒューマンインタフェース出力デバイスを含んでもよい。このようなヒューマンインタフェース出力デバイスは、例えば、触覚出力、音、光、および嗅覚/味覚を通じて1人以上の人間のユーザの感覚を刺激するものであってもよい。このようなヒューマンインタフェース出力デバイスは、触覚出力デバイス(例えば、タッチ画面(910)、データグローブ(図示せず)、またはジョイスティック(905)による触覚フィードバック、ただし、入力デバイスを担わない触覚フィードバックデバイスも存在し得る)、音声出力デバイス(例えば、スピーカ(909)、ヘッドホン(図示せず))、視覚出力デバイス(例えば、CRT画面、LCD画面、プラズマ画面、OLED画面を含む画面(910)等であり、それぞれタッチ画面入力機能を有するもの、または有していないもの、それぞれ触覚フィードバック機能を有するもの、または有していないものがある。これらうちのいくつかが、そのうちのいくつかは、立体画像出力、バーチャルリアリティグラス(図示せず)、ホログラフィックディスプレイ、発煙タンク(図示せず)のような手段を介して2次元の視覚出力、または三次元以上の出力を出力することが可能であってもよい)、およびプリンタ(図示せず)を含んでもよい。
コンピュータシステム(900)はまた、CD/DVDまたは同様のメディア(921)を有するCD/DVD ROM/RW(920)を含む光学メディア、サムドライブ(922)、リムーバブルハードドライブまたはソリッドステートドライブ(923)、テープおよびフロッピーディスク等のレガシー磁気メディア(図示せず)、セキュリティドングル等の特殊なROM/ASIC/PLDベースのデバイス(図示せず)等の、人間がアクセス可能な格納デバイスおよびそれらに関連付けられたメディアを含み得る。
当業者であれば、本明細書で開示されている主題に関連して使用される「コンピュータ可読媒体」という用語は、伝送媒体、搬送波、または他の一時的な信号を包含しないことも理解するであろう。
コンピュータシステム(900)は、1つ以上の通信ネットワーク(955)に対するインタフェース(954)も含み得る。ネットワークは例えば、無線ネットワーク、有線ネットワーク、光学ネットワークであり得る。ネットワークはさらに、ローカル、広域、メトロポリタン、車両および産業用、リアルタイム、遅延耐性等であり得る。ネットワークの例には、Ethernet等のローカルエリアネットワーク、無線LAN、GSM、3G、4G、5G、LTE等を含む移動体ネットワーク、ケーブルテレビ、衛星テレビ、および地上波テレビを含むテレビの有線または無線広域デジタルネットワーク、CANBusを含む車両用および産業用等が含まれる。特定のネットワークは、(例えば、コンピュータシステム(900)のUSBポート等の)特定の汎用データポートまたは周辺バス(949)に取り付けられる外部ネットワークインタフェースアダプタが必要である。他のものは、一般的には、以下で説明されているようにシステムバスに取り付けられることによってコンピュータシステム(900)のコアに統合される(例えば、EthernetインタフェースがPCコンピュータシステムに統合され、または、移動体ネットワークインタフェースがスマートフォンコンピュータシステムに統合される)。これらのネットワークのいずれを使用しても、コンピュータシステム(900)は他のエンティティと通信し得る。このような通信は、例えば、ローカルもしくは広域デジタルネットワークを使用して、他のコンピュータシステムに対して、一方向、受信専用(例えば、テレビ放送)、一方向送信専用(例えば、CANbusデバイスから特定のCANbusデバイス)、または双方向であり得る。特定のプロトコルおよびプロトコルスタックは、前述のようなこれらのネットワークおよびネットワークインタフェースの各々の上で使用し得る。
前述のヒューマンインタフェースデバイス、人間による取扱いが可能な格納デバイス、およびネットワークインタフェースが、コンピュータシステム(900)のコア(940)に取り付けられ得る。
コア(940)は、1つ以上の中央処理装置(CPU)(941)、グラフィック処理装置(GPU)(942)、フィールドプログラマブルゲートエリア(FPGA)(943)の形態の専用のプログラム可能な処理ユニット、特定のタスクに用いるハードウェアアクセラレータ(944)、グラフィックアダプタ(950)等を含み得る。これらのデバイスは、読出し専用メモリ(ROM)(945)、ランダムアクセスメモリ(946)、内部のユーザによる取扱いが不能なハードドライブ、SSD等の内部大容量ストレージ(947)と共に、システムバス(948)を通じて接続されてもよい。いくつかのコンピュータシステムでは、システムバス(948)は、追加のCPU、GPU等による拡張を可能にするために、1つ以上の物理プラグの形態でアクセス可能であり得る。周辺デバイスは、コアのシステムバス(948)に直接取り付け、または周辺バス(949)を通じて取り付け得る。一例では、画面(910)は、グラフィックアダプタ(950)に接続され得る。周辺バスのためのアーキテクチャは、PCI、USB等を含む。
CPU(941)、GPU(942)、FPGA(943)、およびアクセラレータ(944)は、組み合わせて前述のコンピュータコードを構成し得る特定の命令を実行し得る。そのコンピュータコードは、ROM(945)またはRAM(946)に格納され得る。移行データはまた、RAM(946)に格納され得、一方で、永続データは、例えば内部大容量ストレージ(947)に格納され得る。メモリデバイスのいずれかに対する高速の格納および検索は、1つ以上のCPU(941)、GPU(942)、大容量ストレージ(947)、ROM(945)、RAM(946)等と密接に関連付けられ得るキャッシュメモリを使用して可能にし得る。
コンピュータ可読媒体は、様々なコンピュータ実装動作を実行するためのコンピュータコードをその上に有し得る。メディアおよびコンピュータコードは、本開示の目的のために特別に設計され構築されたものであり得、またはコンピュータソフトウェアの分野の当業者によく知られ、かつ当業者が利用可能な種類のものであり得る。
限定ではなく例として、アーキテクチャ有するコンピュータシステム(900)、および特にコア(940)は、(CPU、GPU、FPGA、アクセラレータ等を含む)プロセッサが、1つ以上の有形のコンピュータ可読媒体において実施されたソフトウェアを実行した結果として機能を提供し得る。そのようなコンピュータ可読媒体は、前述のようなユーザアクセス可能な大容量ストレージ、ならびにコア内部大容量ストレージ(947)またはROM(945)等の非一時的な性質のものであるコア(940)の特定のストレージと関連付けられた媒体であり得る。本開示の様々な実施形態を実装するソフトウェアは、そのようなデバイスに格納され、コア(940)によって実行され得る。コンピュータ可読媒体は、特定のニーズに従って、1つ以上のメモリデバイスまたはチップを含み得る。ソフトウェアは、コア(940)、および具体的にはその中の(CPU、GPU、FPGA等を含む)プロセッサに、RAM(946)に格納されたデータ構造を定義すること、およびソフトウェアによって定義されたプロセスに従ってそのようなデータ構造を修正することを含む、本明細書で説明された特定のプロセス、または特定のプロセスの特定の部分を実行させ得る。追加または代替として、コンピュータシステムは、本明細書で説明する特定のプロセスまたは特定のプロセスの特定の部分を実行するために、ソフトウェアの代わりに、またはソフトウェアと一緒に動作し得る回路(例えば、アクセラレータ(944))における、配線された、または別の方法で具現化されたロジックの結果として、機能を提供し得る。適切な箇所では、ソフトウェアへの言及はロジックを包含し得、その逆も同様である。適切な箇所では、コンピュータ可読媒体への言及は、実行のためのソフトウェアを格納する回路(例えば、集積回路(IC))、実行のためのロジックを具現化する回路、またはこれらの両方を包含し得る。本開示は、ハードウェアおよびソフトウェアの任意の適切な組み合わせを包含する。
本開示は、いくつかの例示的な実施形態を説明してきたが、本開示の範囲内にある変更、置換、および様々な代替の同等物が存在する。したがって、当業者は、本明細書で明示的に示されていないまたは説明されていないが、本開示の原理を具現化するので、その趣旨および範囲内にある多くのシステムおよび方法を考案することができることが理解されるであろう。
100、200、300 ビデオカンファレンスシステム
101、108、201 ネットワーク
110、210A~210Z、310A~310C サブシステム
111 広角カメラ
112、906 マイクロフォン
113 コントローラ
114 表示画面
120、130、220、230 ユーザデバイス
240 ネットワークベースメディア処理サーバ
320 ユーザデバイス
340 ネットワークベースメディア処理サーバ
360A~360C 360度ビデオ
700、800 プロセス
900 コンピュータシステム
901 キーボード
902 マウス
903 トラックパッド
905 ジョイスティック
907 スキャナ
908 カメラ
909 スピーカ
910 タッチ画面
921 メディア
922 サムドライブ
923 ソリッドステートドライブ
940 コア
943 フィールドプログラマブルゲートエリア
944 ハードウェアアクセラレータ
944 アクセラレータ
945 読出し専用メモリROM
945 ROM
946 ランダムアクセスメモリ
947 コア内部大容量ストレージ
948 システムバス
949 周辺バス
950 グラフィックアダプタ
954 インタフェース
955 通信ネットワーク

Claims (13)

  1. ビデオカンファレンスのための方法であって、
    前記ビデオカンファレンスの第1のクライアントデバイスによって、第2のクライアントデバイスからのオーバーレイメディアの、前記第1のクライアントデバイスの没入型メディアとのグルーピングを制限するグルーピング制御を決定するステップと、
    前記第1のクライアントデバイスによって、前記グルーピング制御を示すグルーピング制御信号を送信してメディア制御デバイスに他のクライアントデバイスからのオーバーレイが許可されるかどうかを通知するステップと、
    前記第1のクライアントデバイスによって、前記没入型メディアを含む1つ以上のメディアストリームを前記メディア制御デバイスに提供するステップ
    前記メディア制御デバイスによって、前記第1のクライアントデバイスを含む複数のクライアントデバイスから受信した前記グルーピング制御信号に基づいて、前記第1のクライアントデバイスを含む複数のクライアントデバイスから提供された複数のディアストリームをシングルグループまたはマルチグループにグルーピングする、ステップと
    前記メディア制御デバイスによってグルーピングされたメディアストリームを、前記第1のクライアントデバイスによって受信するステップと
    を含む、方法。
  2. 前記没入型メディアが、全方位ビデオ、360度ビデオ、および広角ビデオのうちの少なくとも1つを備える、請求項1に記載の方法。
  3. 前記グルーピング制御を示す前記グルーピング制御信号を送信して前記メディア制御デバイスに通知する前記ステップが、
    前記グルーピング制御を示す属性フィールドを有するセッション記述プロトコル(SDP)メッセージを送信するステップ
    をさらに含む、請求項1に記載の方法。
  4. 前記グルーピング制御を示す前記属性フィールドを有する前記SDPメッセージを送信する前記ステップが、
    前記第2のクライアントデバイスからの前記オーバーレイメディアの、前記第1のクライアントデバイスの前記没入型メディアとの、グルーピングの不許可を示す前記属性フィールドを有する前記SDPメッセージを送信するステップ
    をさらに含む、請求項3に記載の方法。
  5. 前記属性フィールドが、「a=no_other_overlays」または「a=other_overlays」の形式である、請求項4に記載の方法。
  6. 前記グルーピング制御を示す前記属性フィールドを有する前記SDPメッセージを送信する前記ステップが、
    前記第2のクライアントデバイスからの前記オーバーレイメディアの、前記第1のクライアントデバイスの前記没入型メディアとの、グルーピングの許可を示す前記属性フィールドを有する前記SDPメッセージを送信するステップ
    をさらに含む、請求項3に記載の方法。
  7. 前記メディア制御デバイスが、前記シングルグループまたはマルチグループにグルーピングされたメディアストリームを、遠隔端末(ITT4RT)受信機(Rx)クライアントのための遠隔没入型テレカンファレンスおよびテレプレゼンスに提供する、請求項1に記載の方法。
  8. 前記グルーピング制御を示す前記属性フィールドを有する前記SDPメッセージを送信する前記ステップが、
    前記第1のクライアントデバイスの前記没入型メディアとグルーピングすることが許可されているメディアタイプを示す前記属性フィールドを有する前記SDPメッセージを送信するステップ
    をさらに含む、請求項3に記載の方法。
  9. 前記属性フィールドが、「a=allowed_content」の形式である、請求項8に記載の方法。
  10. 前記メディアタイプが、双方向ビデオ、画像、およびスライドのうちの少なくとも1つを含む、請求項8に記載の方法。
  11. 前記グルーピング制御を示す前記属性フィールドを有する前記SDPメッセージを送信する前記ステップが、
    前記第2のクライアントデバイスからの前記オーバーレイメディアの、前記第1のクライアントデバイスの前記没入型メディアとのグルーピングの許可を示す第1の属性フィールドと、許可されるメディアタイプを示す第2の属性フィールドとを有する前記SDPメッセージを送信するステップ
    をさらに含む、請求項3に記載の方法。
  12. ビデオカンファレンスのための装置であって、
    請求項1から11のいずれか一項に記載の方法を行うように構成された処理回路を備える、装置。
  13. コンピュータに、請求項1から11のいずれか一項に記載の方法を実行させるためのコンピュータプログラム。
JP2022566437A 2021-05-11 2022-05-11 没入型テレカンファレンスおよびテレプレゼンスのためのマルチグルーピングの方法、装置、およびコンピュータプログラム Active JP7508586B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202163187346P 2021-05-11 2021-05-11
US63/187,346 2021-05-11
US17/741,351 US11943073B2 (en) 2021-05-11 2022-05-10 Multiple grouping for immersive teleconferencing and telepresence
US17/741,351 2022-05-10
PCT/US2022/072246 WO2022241429A1 (en) 2021-05-11 2022-05-11 Multiple grouping for immersive teleconferencing and telepresence

Publications (2)

Publication Number Publication Date
JP2023529285A JP2023529285A (ja) 2023-07-10
JP7508586B2 true JP7508586B2 (ja) 2024-07-01

Family

ID=83998163

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022566437A Active JP7508586B2 (ja) 2021-05-11 2022-05-11 没入型テレカンファレンスおよびテレプレゼンスのためのマルチグルーピングの方法、装置、およびコンピュータプログラム

Country Status (6)

Country Link
US (1) US11943073B2 (ja)
EP (1) EP4128745A4 (ja)
JP (1) JP7508586B2 (ja)
KR (1) KR20230006495A (ja)
CN (1) CN115606170A (ja)
WO (1) WO2022241429A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11979244B2 (en) * 2021-09-30 2024-05-07 Snap Inc. Configuring 360-degree video within a virtual conferencing system
US20240054688A1 (en) * 2022-08-11 2024-02-15 Qualcomm Incorporated Enhanced Dual Video Call with Augmented Reality Stream

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210029326A1 (en) 2019-10-15 2021-01-28 Intel Corporation Session description protocol (sdp) based signaling of camera calibration parameters

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8446454B2 (en) 2007-05-21 2013-05-21 Polycom, Inc. Dynamic adaption of a continuous presence videoconferencing layout based on video content
US20100014825A1 (en) * 2008-07-18 2010-01-21 Porto Technology, Llc Use of a secondary device to overlay disassociated media elements onto video content
EP2730073B1 (en) * 2011-07-07 2019-09-04 Telefonaktiebolaget LM Ericsson (publ) Media stream grouping in multimedia communication networks
US8752113B1 (en) * 2013-03-15 2014-06-10 Wowza Media Systems, LLC Insertion of graphic overlays into a stream
KR20180097017A (ko) 2017-02-22 2018-08-30 한국전자통신연구원 몰입도 증강을 위한 영상회의 장치 및 방법
US10455259B2 (en) * 2017-08-23 2019-10-22 Intel Corporation Enhanced text rendering and readability in images
US11102549B2 (en) * 2017-09-27 2021-08-24 Wurl Inc. Selective video overlay
US11651752B2 (en) * 2018-06-01 2023-05-16 Nokia Technologies Oy Method and apparatus for signaling user interactions on overlay and grouping overlays to background for omnidirectional content
US11528312B2 (en) 2019-06-25 2022-12-13 Apple Inc. Immersive teleconferencing and telepresence
KR20220073851A (ko) * 2019-10-14 2022-06-03 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 몰입형 뷰포트 종속 다자간 비디오 통신
EP4140145A4 (en) * 2020-04-22 2024-04-24 Nokia Technologies Oy SESSION DESCRIPTION FOR COMMUNICATION SESSION
WO2022211476A1 (en) * 2021-03-30 2022-10-06 Samsung Electronics Co., Ltd. Method and apparatus for supporting teleconferencing and telepresence containing multiple 360 degree videos

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210029326A1 (en) 2019-10-15 2021-01-28 Intel Corporation Session description protocol (sdp) based signaling of camera calibration parameters

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Nokia Corporation (ITT4RT Rapporteur),ITT4RT Permanent Document - Requirements, Working Assumptions and Potential Solutions[online],3GPP TSG SA WG4 #113-e S4-210540,[検索日 2023.11.13], インターネット<URL:https://www.3gpp.org/ftp/tsg_sa/WG4_CODEC/TSGS4_113-e/Docs/S4-210540.zip>,2021年04月22日,PP.10-12,29,42-43

Also Published As

Publication number Publication date
JP2023529285A (ja) 2023-07-10
KR20230006495A (ko) 2023-01-10
WO2022241429A1 (en) 2022-11-17
US20220368550A1 (en) 2022-11-17
US11943073B2 (en) 2024-03-26
CN115606170A (zh) 2023-01-13
EP4128745A1 (en) 2023-02-08
EP4128745A4 (en) 2023-10-25

Similar Documents

Publication Publication Date Title
US11914922B2 (en) Audio mixing for teleconferencing
JP7508586B2 (ja) 没入型テレカンファレンスおよびテレプレゼンスのためのマルチグルーピングの方法、装置、およびコンピュータプログラム
JP7411791B2 (ja) リモート端末の没入型遠隔会議及びテレプレセンスのためのオーバーレイ処理のパラメータ
JP7518195B2 (ja) テレコンファレンス及びリモートターミナル用のテレプレゼンスのための複数のオーディオミキシングゲインをシグナリングするための技術
JP7399549B2 (ja) リモート端末向けの遠隔会議およびテレプレゼンスにおいてオーディオミキシングゲインをシグナリングする手法
US12044845B2 (en) Towards subsiding motion sickness for viewport sharing for teleconferencing and telepresence for remote terminals
JP7419529B2 (ja) 遠隔端末のための没入型テレカンファレンス及びテレプレゼンスのインタラクティブオーバーレイ処理
JP2024512904A (ja) Rtcpフィードバックを使用したリモート端末のためのテレコンファレンス及びリモートターミナルのためのテレプレゼンスのための複数のオーディオミキシングゲインをシグナリングするための技術

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221031

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221031

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240520

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240619

R150 Certificate of patent or registration of utility model

Ref document number: 7508586

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150