JP2019516297A - ビューを意識した360度ビデオストリーミング - Google Patents

ビューを意識した360度ビデオストリーミング Download PDF

Info

Publication number
JP2019516297A
JP2019516297A JP2018552799A JP2018552799A JP2019516297A JP 2019516297 A JP2019516297 A JP 2019516297A JP 2018552799 A JP2018552799 A JP 2018552799A JP 2018552799 A JP2018552799 A JP 2018552799A JP 2019516297 A JP2019516297 A JP 2019516297A
Authority
JP
Japan
Prior art keywords
video
view
updated
active areas
stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018552799A
Other languages
English (en)
Other versions
JP6741784B2 (ja
Inventor
チョウ,チャンイン
Original Assignee
ヴィズビット インコーポレイテッド
ヴィズビット インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ヴィズビット インコーポレイテッド, ヴィズビット インコーポレイテッド filed Critical ヴィズビット インコーポレイテッド
Publication of JP2019516297A publication Critical patent/JP2019516297A/ja
Application granted granted Critical
Publication of JP6741784B2 publication Critical patent/JP6741784B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/122Improving the 3D impression of stereoscopic images by modifying image signal contents, e.g. by filtering or adding monoscopic depth cues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/012Head tracking input arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/139Format conversion, e.g. of frame-rate or size
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/275Image signal generators from 3D object models, e.g. computer-generated stereoscopic image signals
    • H04N13/279Image signal generators from 3D object models, e.g. computer-generated stereoscopic image signals the virtual viewpoint locations being selected by the viewers or determined by tracking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/21805Source of audio or video content, e.g. local disk arrays enabling multiple viewpoints, e.g. using a plurality of cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/816Monomedia components thereof involving special video data, e.g 3D video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Computer Graphics (AREA)
  • Information Transfer Between Computers (AREA)
  • Software Systems (AREA)
  • Geometry (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本開示は、仮想現実及び拡張現実のコンテンツ内で使用され得る360°ビデオストリームを配信するシステム及び方法に関する。つまり、360°ビデオストリームを複数のビデオストリームに分割することができ、その各ストリームはビューボリューム又はビュー球体の一部に対応する。加えて、元の360°ビデオストリームを低解像度の360°ビデオストリームにダウンサンプリングすることができる。利用者の所与のビュー角度について複数のビデオストリームの1つ又は複数をアクティブストリームと見なし、データのダウンロードのためにユーザインタフェース又はディスプレイに接続することができる。かかるシナリオでは、ユーザインタフェースが利用者のビュー角度に対応する少なくとも1つの高解像度のビデオストリーム並びに低解像度の360°ビデオストリームに接続され得る。

Description

関連出願の相互参照
本願は、参照によりその内容を本明細書に援用する、2016年4月8日に出願された米国仮特許出願第62/320,451号の本出願である。
背景
360°ビデオ(又は球体ビデオ)は仮想現実(VR)及び拡張現実(AR)向けの没入環境を提供する用途を含め、多くの用途のための重要なメディア形式である。360°ビデオを見る人は任意の角度で、及びことによると小さい視野(FOV)内でビデオを見ることができる。従って、くっきりと見えるために360°ビデオは通常のビデオよりもはるかに高い解像度を必要とし得る。かかるシナリオでは、360°ビデオストリームが従来のビデオストリームよりもはるかに高いビットレートを必要とし得る。例えば典型的な1080pビデオは約1MBpsのビットレート(又は1分のビデオに対して60MBのファイルサイズ)を有し得るが、同じビュー解像度の360°ビデオは約10MBps以上のビットレート(又は1分のビデオに対して600MBのファイルサイズ)を含み得る。ビュー解像度は見る人が所与の時点に観察し得るビデオフレームの解像度を含み得る。
360°ビデオのビットレートは既存の消費者レベルの無線ネットワーク内のデータ転送レートを上回り得る。その結果、360°ビデオは事前にダウンロードされ且つ/又はストリーミングのために強引にダウンサンプリングされる場合があり、かかる操作は一部の用途に関して許容し難くはないにせよ不所望であり得る。
利用者のビューに基づいて360°ビデオの一部をストリーミングする、ビューを意識したストリーミング方法はビデオテレプレゼンス用途に使用されてきたが、ストリーミングサーバ内の著しい計算コストを伴う。ビューを意識したストリーミングは360°ビデオストリーミングにも適用されてきたが、サーバにおける著しい追加の記憶コストを伴う。
概要
一態様ではシステムを提供する。このシステムは、ディスプレイ、センサ、通信インタフェース、及びコントローラを含む。コントローラはメモリ及び少なくとも1個のプロセッサを含む。少なくとも1個のプロセッサは、動作を実行するためにメモリ内に記憶される命令を実行するように構成される。動作は、ビューボリューム内のビュー方向を示す情報をセンサから受信することを含む。ビュー方向は視野に対応する。動作は、ビュー方向に基づいてビューボリューム内の複数のビュー可能領域から複数のアクティブ領域を決定することも含む。動作は、通信インタフェースを介して、複数のアクティブ領域に対応する複数のビデオストリームに接続することをまた更に含む。動作は、複数のアクティブ領域に対応する第1のビデオ情報を複数のビデオストリームを介して受信することを追加で含む。動作は、360°の視野に対応する第2のビデオ情報を受信することを含む。第1のビデオ情報は第2のビデオ情報よりも高い解像度を有する。動作は、複数のアクティブ領域内で第1のビデオ情報に基づいて且つ複数のアクティブ領域の外側のビューボリュームの領域内で第2のビデオ情報に基づいて360°ビデオをレンダリングすることも含む。また更に、動作は視野に対応する360°ビデオの少なくとも一部をディスプレイによって表示することを含む。
一態様ではシステムを提供する。このシステムは、通信インタフェース及びコントローラを含む。コントローラはメモリ及び少なくとも1個のプロセッサを含む。少なくとも1個のプロセッサは、動作を実行するためにメモリ内に記憶される命令を実行するように構成される。動作は、360°ビデオストリームを複数のリージョナルストリーム(regional stream)に分割することを含む。動作は、360°ビデオストリームをダウンサンプリングして低解像度の360°ビデオストリームを提供し、通信インタフェースを介して要求を受信することも含む。要求は少なくとも1つのアクティブ領域を含む。動作は、通信インタフェースを介して、少なくとも1つのアクティブ領域に対応する少なくとも1つのリージョナルストリームを提供することをまた更に含む。動作は、通信インタフェースを介して、低解像度の360°ビデオストリームを提供することも含む。
一態様では方法を提供する。この方法は、ビューボリューム内のビュー方向を示す情報をセンサから受信することを含む。ビュー方向は視野に対応する。この方法は、ビュー方向に基づいてビューボリューム内の複数のビュー可能領域から複数のアクティブ領域を決定することも含む。この方法は、通信インタフェースを介して、複数のアクティブ領域に対応する複数のビデオストリームに接続することを追加で含む。この方法は、複数のアクティブ領域に対応する第1のビデオ情報を複数のビデオストリームを介して受信することをまた更に含む。この方法は、360°の視野に対応する第2のビデオ情報を受信することを含む。第1のビデオ情報は第2のビデオ情報よりも高い解像度を有する。この方法は、複数のアクティブ領域内で第1のビデオ情報に基づいて且つ複数のアクティブ領域の外側のビューボリュームの領域内で第2のビデオ情報に基づいて360°ビデオをレンダリングすることを更に含む。この方法は、視野に対応する360°ビデオの少なくとも一部をディスプレイによって表示することを追加で含む。
一態様ではシステムを提供する。このシステムは、本明細書に記載の他のそれぞれの態様の動作を実行するための様々な手段を含む。
以下の詳細な説明を必要に応じて添付図面を参照して読むことにより、これらの並びに他の実施形態、態様、利点、及び代替策が当業者に明らかになる。更に、この概要並びに本明細書で示す他の説明及び図面は実施形態を例として示すことを意図するに過ぎず、そのため数多くの改変が可能であることを理解すべきである。例えば特許請求の範囲に記載の実施形態の範囲内にとどめながら、構造上の要素及びプロセスのステップを再配置し、組み合わせ、分散し、なくし、又は他のやり方で変えることができる。
実施形態の一例によるビュー球体を示す。 実施形態の一例による、世界の正距円筒図法による投影を示す。 実施形態の一例による、正距円筒図法による投影の複数の領域を示す。 実施形態の一例による立方体マップを示す。 実施形態の一例によるタイル状ビデオストリームを示す。 実施形態の一例による概略的な通信図である。 実施形態の一例による、トンネル接続を示す概略的な通信図である。 実施形態の一例による、タイル及びトランスポーテーションセグメントを示す概略的なビデオ細分図である。 実施形態の一例による、複数の細分されたビデオストリームを示す概略図である。
詳細な説明
本明細書では方法、装置、及びシステムの例について説明する。本明細書では「例」及び「例示的」という用語は「例、実例、又は例証である」ことを意味するように使用されることを理解すべきである。「例」又は「例示的」として本明細書に記載する如何なる実施形態又は特徴も、必ずしも他の実施形態又は特徴よりも好ましい又は有利であると解釈すべきではない。本明細書で提示する主題の範囲から逸脱することなしに他の実施形態も利用することができ、他の変更も加えることができる。
従って、本明細書に記載の実施形態の例は限定的であることは意図しない。本明細書で概して説明し図中に示す本開示の態様は、その全てが本明細書で予期される多岐にわたる異なる構成で配置され、置換され、組み合わせられ、分けられ、設計され得る。
更に、別段の定めがない限り、図面のそれぞれの中で示す特徴を互いに組み合わせて使用することができる。従って、図示の全ての特徴が各実施形態に必要ではないという理解の下で、図面は1つ又は複数の全体的な実施形態のコンポーネントの態様として広く捉えられるべきである。
I.概略
本開示は、利用者が見ている可能性があるビューボリューム又はビュー球体の一部をストリーミングするためのシステム及び方法に関する。実施形態の一例では、ビューを意識したストリーミングのシステム及び方法がストリーミングサーバ内の著しい追加の記憶コスト又は計算コストなしに、360°ビデオをストリーミングするための帯域幅要件を減らし得る。
II.実施形態の例
A.ストリーミングクライアント装置の動作
図1Aは、実施形態の一例によるビュー球体100を示す。図1Aに示すように、かかるシナリオではビュー球体100がn個の領域に分割されている。実施形態の一例では、隣接する領域間で重複が殆ど又は全くない場合がある。領域は矩形であり得るが、他の形状又は様々な形状の組み合わせが可能である。代替的実施形態では、ビューボリュームが球体以外の形状を含み得る。例えばビューボリュームは、円筒、正方形、角錐、又は別の種類のビューボリュームを含み得る。
実施形態の一例では、様々な異なる投影の種類に基づいて、(例えば360度カメラ又は360度コンテンツを見る人に対する)ビュー球体が二次元で投影され得る。例えば、正距円筒図法による投影は球体のビューを矩形画像へと歪めるための一般的な方法である。図1Bは、実施形態の一例による世界の正距円筒図法による投影110を示す。
同様のやり方で、正距円筒図法による投影を使用して360度ビデオ内の各フレームを2D画像として表すことができる。一実施形態では、この正距円筒図法による提示を複数の領域に分割することができる。この分割は様々なやり方で行うことができる。例えば地図を同一の矩形へと均等に分割することができる。つまり、360度ビデオフレームの正距円筒図法による提示をほぼ同一の面積を有する矩形領域へと分割することができる。図1Bでは正距円筒図法による投影を示すが、他の種類の投影も予期される。例えば、横メルカトル、メルカトル、ランバート等の投影が本明細書で可能であり予期される。或いは、擬円筒図法、方位図法、又は円錐図法も考えられる可能性である。
加えて又は或いは、各領域が同一の又は同様のビデオ情報量を含むように、(投影の種類に関係なく)360度のビュー球体を複数の領域に分割することができる。更に、領域間の相関を減らし又は最小化するためにそれらの領域を分割することができる。
例えば多くの360度ビデオにおいて、上部の視野は相対的に低い情報密度を含み得る広い面積の青空を含む。かかるシナリオでは、地平線に近い視野が多くの詳細を含み得る。そのため同様のビデオ情報量を含むようにビュー球体を分割する場合、より少ない(例えばより広い面積を有する)領域が上部の視野(又は情報密度が低い他の領域)に配置され得る。それに対して、地平線沿いの視野は(そのより高い情報密度に基づいて)更に狭い面積の領域へと分割することができる。
図1Cは、実施形態の一例による、360度ビデオフレームの正距円筒図法による投影の複数の領域120を示す。図1Cに示すように、上部の視野は相対的に広い面積の領域(例えば領域122)へと分割することができる。更に、地平線近くの視野は相対的に狭い面積の領域(例えば領域124)へと分割することができる。
図1Cでは特定の複数の領域120を示すが、360度ビデオフレームを分割する他の様々なやり方が可能であり予期されることが理解されよう。実施形態の一例では、各領域内のほぼ「等しい情報」を実現するために、投影した360度ビデオフレームを領域分割プロセスにかけることができる。例えば、ビデオのフレームごとにエントロピマップ(又は画素若しくは画素領域ごとの情報に基づく別の種類のマップ)を計算することができる。所与のビデオセグメント又はクリップのエントロピマップを画素ごとに平均することができる。この平均化プロセスは、所与のビデオセグメント又はクリップにわたる平均エントロピの二次元マップ:E(x,y)をもたらし得る。できる限り等しい画素情報の総量を有する複数の領域へとE(x,y)を分割するために、様々なアルゴリズム(リニアプログラミング、ダイナミックプログラミング、又は他の数値最適化アルゴリズム)を使用することができる。つまり、所与のビデオセグメント又はクリップのエントロピマップに基づき、同様の画素情報量を有する領域を作成するように領域の分割を行うことができる。この脈絡において本明細書で使用するとき、「同様の画素情報量」は各リージョナルストリームがほぼ同じ帯域幅要件(例えば1%又は5%の範囲内)を有することを含み得る。加えて又は或いは、「同様の画素情報量」はメモリサイズがほぼ同じである(例えばここでも1%又は5%の範囲内)リージョナルストリームを含み得る。そのため、リージョナル360度ビデオストリームをより効率的に扱うことができる。
一実施形態では、元の球体内でほぼ同じ領域を占める可能性がある複数の領域に矩形マップを分割することを提案する。それにより各領域がストリーミング中に同様のデータ量を運び、従ってストリームの質を改善する可能性が高い。この分割の一例を以下に示すが、他の領域のサイズ及び/又はマップ分割プロセスを含む実施形態も予期される。
図2は、実施形態の一例による立方体マップ200を示す。図2に示すように、360°ビューは立方体マップ200として表現することもできる。つまり、360°ビューを6個のビューに分割することができ、立方体マップ200の側面ごとに1つのビューがある。更に、一例として立方体の各面を複数のタイルへと更に細分することができる。実施形態の一例では、H、H、H、...Hと名付けることができるn個のリージョナルストリームへと元の360°ビデオストリームを分割することができる。加えて、システム及び方法は元の360°ビデオストリームを低解像度の360°ストリームLにダウンサンプリングすることを含み得る。
かかるシナリオでは、複数のビデオ及び音声ストリームをストリーミングクライアントに提供することができる。ストリーミングクライアントは、スマートフォン上のアプリケーション、モバイルVRヘッドセット(例えばSamsung Gear VR)、テザーVRヘッドセット(例えばOculus Rift)、又は別の種類の計算装置若しくはディスプレイ装置を含み得る。
実施形態の一例では、システム又は方法がビュー方向に関する情報を受信することを含み得る。例えば、ビュー方向はVRヘッドセット上のセンサによって提供され得る。利用者の所与のビュー角度について、コントローラが少なくともそのビュー方向に対応する視野を対象範囲に含むm≦nであるm個の領域を決定し得る。例えば図2では矢印202が現在のビュー角度を示す。実施形態の一例では、現在のビュー角度に近いアクティブ領域(例えば領域a、b、c、d、e、f、g、h、及びi)を利用者のビュー角度に対応する領域として識別することができる。これらのアクティブ領域204のストリームは「アクティブストリーム」と呼ぶことができる。対照的に、利用者のビュー角度から離れて位置する領域は「非アクティブ領域」206を含み得る。
一例として、クライアント装置(例えばVRヘッドセット)は1つ又は複数のサーバにアクティブストリームを要求することができる。かかるシナリオでは、クライアント装置が高解像度のアクティブストリームH、H、H、H、H、H、H、H、及びH、並びに低解像度のストリームLを要求し、それに接続することができる。サーバは、それに応答してアクティブストリーム(例えばアクティブ領域204に対応するビデオストリーム)及び低解像度のストリームLに関連するデータを提供することができる。従ってクライアント装置は、ビュー方向に対応するアクティブ領域に関係する高解像度のビデオデータ並びにビュー球体全体に対応する低解像度のビデオデータの両方をダウンロードすることができる。実施形態の一例では、ビュー方向に関係なく少なくともビュー球体全体の低解像度のビデオの表示を提供するために、ストリームL(例えば低解像度のビデオストリーム)が常に接続され得ることを指摘しておく。
本明細書に記載のシステム及び方法は、ストリームLのデータを使用してビュー可能な360°ビデオをレンダリングすることを含み得る。更に、レンダリングは高解像度画素の「モザイク」を含むことができ、モザイクはビュー球体に沿ってその対応する領域に従って方向付けられた隣接するアクティブストリームをステッチすることによって形成され得る。実施形態の一例では、全てのレンダリングが時間の点で同期される。同期は1つ又は複数のタイムスタンプ又は別の種類のフレーム同期に基づいて実現することができる。
実施形態の一例では、ビュー方向の変化を検出することができる。つまり、クライアント装置(例えばVRヘッドセット)の角度は例えば見る人が自分の頭部を回転させ又は他のやり方で動かすことによって変わり得る。かかるビュー方向の変化が検出されると、更新されたビュー方向に基づいて1組の更新されたアクティブ領域が決定され得る。例えば図2に示すように、タイル「b」を中心とするようにビュー角度が移動する場合、アクティブ領域はb、k、l、c、d、a、h、i、及びjになる。ビュー方向の他の種類の変化も可能であり本明細書で予期される。
一実施形態では、低解像度の360°ビデオ及び対応するサウンドトラックが常に利用可能であり得ることを確実にするために、サウンドトラック(例えば音声ストリーム)を常に接続された低解像度のビデオストリームLと組み合わせることができる。
別の実施形態では、サウンドトラックを別個のストリームを介して配信することができる。このストリームは常に接続されていても良く、その音声データはビデオデータと同期され、ビデオ画像と同期してレンダリング(再生)される。
B.ネットワークレイテンシ及び運動予測
一部のシナリオでは、高解像度のビデオがまだ利用可能ではない状態でビュー方向が新たなビュー領域に変わる場合がある。つまり、高解像度のビデオがビデオストリームを介してダウンロードされる前にヘッドセットが新たなビュー方向に動く場合がある。かかるシナリオでは、ヘッドセットのディスプレイが持続ストリームLからの低解像度のビデオを一時的に表示することができ、そのデータは予めバッファに入れることができる。ストリームLはクライアントに常に優先的に接続され得る。レイテンシは、利用者が最初のビュー角度から離れるときとヘッドセットにおいて適切な高解像度のビデオストリームが表示されているときとの間の期間として考えることができる。レイテンシが閾値を上回るようになる場合、高解像度のビデオストリームが同期するのを待つ間、低解像度のビデオストリームを見る人に提示することができる。このレイテンシ期間の間、見る人はストリームLからの低解像度のフレームしか見ることができない。
一部の実施形態では、1つ又は複数の高解像度のビデオストリームが中断し、遅れ、又は破損する場合がある。かかるシナリオでは、1つ又は複数の高解像度のビデオストリームが回復するまでクライアント装置がストリームLから低解像度のビデオを提供することができる。
加えて又は或いは、運動予測を使用してレイテンシを減らすことができる。例えば、クライアント装置の速度V及び/又は加速度Aを提供するようにセンサを構成することができる。V及びAから、Vt+0.5tであるように時間t内の角度変化を予測することができる。そのため、クライアント装置は対応するビデオストリームを事前に要求し、そのビデオストリームに事前に接続することができる。ビュー方向の複雑な軌道(例えば振動や他の種類の周期運動又は反復運動に基づく動き)を予測するために更に複雑な運動予測を使用することができる。他の実施形態では、ビデオコンテンツ自体に基づいて運動予測を行うことができる。例えばビデオコンテンツがテニスの試合を含む場合、見る人がテニスボールの飛ぶ方向を追いたい可能性があるという想定の下、運動予測アルゴリズムがビデオコンテンツ内のテニスボールの位置に基づいてビデオストリームを提供し得る。
実施形態の一例では、アクティブストリームが視野よりも幅広い領域を対象範囲に含む場合がある。かかるシナリオでは、視野が引き続き過去のアクティブ領域内にある限り、隣接する新たなアクティブ領域がロードされている間、利用者は高解像度のコンテンツを見ることができる。しかし、ビュー方向が短期間のうちに大きく変わる場合は利用者に(ストリームLからの)低解像度のビデオコンテンツを提供することができる。言い換えれば、アクティブ領域を視野よりも大きくすることによってダウンロードレイテンシを減らすことができる。
一部の実施形態では、視野と比べたアクティブ領域の全体的なサイズが例えば要求されたビデオストリームの平均レイテンシに応じて変わり得る。そのためクライアント装置は、アクティブ領域のストリーム間を移動するとき表示品質と低レイテンシとのバランスをとる目的で視野に対するアクティブ領域のサイズ及び/又はアクティブ領域の解像度を動的に調節することができる。
別の実施形態では、ビュー方向が変わる可能性がより高い方向にアクティブストリームが(視野に対して)より幅広であり得る。例えば見る人がビュー方向を垂直にパンするよりも水平にパンする可能性がより高い(例えば砂浜からサーファーを見る)シナリオでは、アクティブ領域を垂直よりも水平に幅広とすることができる。
本明細書に記載の通り、アクティブストリームは複数の解像度を有し得る。例えば最も高い相対的解像度を有するとしてビュー方向に最も近いアクティブ領域を指定することができる。かかるシナリオでは、ビュー方向の軸から外向きに進み、他のアクティブ領域が中程度の方向を有し得る。また更に、全体的なアクティブ領域の最も外側の広がりの周囲にあるアクティブ領域は最も低い相対的解像度を有し得る。従って利用者が自分のビュー方向を変えるとき、その利用者は解像度が急に低下するのではなく、徐々に低下することに気付き得る。
C.ビデオのトランスコーディング及びストリーミング
図3は、実施形態の一例によるタイル状ビデオストリーム300を示す。例えば図3に示すように、ストリーミングクライアントは複数のストリーミングソースと柔軟な数の接続を維持することができる。この設計では、元のビデオストリーム302が多くのリージョナルビデオストリーム304に分割されており、それらのリージョナルビデオストリーム304は様々なビットレート及びダウンサンプリングされた球体ストリーム306、Lを含み得る。そのため、クライアント装置はどのビデオストリームに接続するのか及びいつ接続するのかを決定することができる。図3に示すように、最初に元のビデオストリーミングをn個のリージョナルストリーム304又はタイルに分割する。その後、任意の特定の時間においてクライアントは1つ又は複数のリージョナルストリーム304に接続することに決めることができる。1つ又は複数のリージョナルストリーム304からの受信情報に基づき、クライアント装置はストリームされたタイルをレンダリングし、リージョナルストリーム304の少なくとも一部を利用者に表示することができる。更に、ダウンサンプリングされた球体ストリーム306を利用者に対してレンダリングし、リージョナルストリーム304と並行して、及び/又は例えば高レイテンシのネットワーク条件や不十分な帯域幅を理由に必要に応じて提供することができる。
図4は、実施形態の一例による概略的な通信図400である。図4に示すように、クライアント420は固定数のUDP、TCP/IP、又はHTTP接続430を1つ又は複数のストリーミングサーバ410と維持することができる。ビュー方向が変わる又は更新される場合、新たな接続を初期設定することなしに既存のネットワーク接続430を再利用するように新たなリージョナルビデオストリーム402及び/又はダウンサンプリングされた球体ストリーム404をルーティングすることができる。この形態は効率を改善することができる、ネットワーク接続を初期設定する時間及びネットワークレイテンシを減らし又はなくすになる。
図5は、実施形態の一例による、トンネル接続を示す概略的な通信図500である。この実施形態では、クライアント装置520がストリーミングサーバ510と単一のトンネルTCP/IP接続530を維持することができる。そのため、リージョナルビデオストリーム502及び低解像度のビデオストリームL504との接続がトンネル530内に含まれ得る。例えば、リージョナルストリーム502及び低解像度のストリーム504からのパケットを単一のトンネリングされた接続530へと統合するようにサーバ510上のプロキシ512を構成することができる。
図6は、実施形態の一例による、タイル及びトランスポーテーションセグメントを示す概略的なビデオ細分図600である。この実施形態では、クライアントはビデオストリーミングサーバと1つのストリーミング接続だけを維持するように構成され得る。そのため本システム及び方法の下、ストリーミングサーバは複数のビデオストリーム及び/又は音声ストリームに関する情報を含む多重化ストリームを提供することができる。トランスコーディングのステップは以下の通り進み得る。
図6に示すように、最初に元のストリーム602をm個のリージョナルストリーム604又はタイルビデオに分割する。各リージョナルストリーム604は、固定長(例えば500ミリ秒から2秒の間)のトランスポーテーション(又はトランスポート)セグメント606(TS)に更に細分することができる。各TS606はイントラ符号化画像(例えばIフレーム)で始まることができ、予測フレーム(例えばPフレーム)又はIフレームで終わり得る。そのため、各トランスポートセグメント606は他のトランスポートセグメントからの情報なしに復号することができる。
実施形態の一例では、各TS606が固定数のフレームを含み得る。例えば、トランスポートセグメントは168個の個々のビデオフレームを含み得る。加えて又は或いは、一部の又は全てのトランスポートセグメントが音声フレームを含んでも良い。
図7は、実施形態の一例による、複数の細分されたビデオストリームを示す概略図700である。ビュー方向又はビュー角度ごとに、メディアインデックスファイルを作成することができる。メディアインデックスファイルは、図7に示すように多重化ビデオストリーム内で情報がどのように配置されるのかに関する情報を含み得る。非限定的な例として、3つのアクティブ領域1、2、及び3が、それぞれ1秒の長さであるトランスポートセグメント702、704、及び706を提供し得る。つまり1秒単位で3つのアクティブ領域それぞれからの3つのTS702、704、及び706がクライアントにストリーミングされる。この実施形態の一例では、各ビュー角度が1組の異なるアクティブ領域を有する。図7に示すように、例えば球体がN個の不連続なビュー角度を有すると想定すると、マスタインデックスファイルはN個のメディアインデックスファイルの連結を含み得る。例えばHTTP Live Streamingプロトコルでは、マスタインデックスファイルが「マスタプレイリスト」と呼ばれ、メディアインデックスファイルが「メディアプレイリスト」と呼ばれる。
図7では、全てのTSセグメントが重複又は冗長性なしに合計して元のストリーミングになることに留意されたい。そのようなやり方で複数のタイルビューを組み合わせることによって様々なアクティブ領域を提供し、トランスコーディングに著しい追加の記憶域が必要ではないように、タイルの組み合わせがインデックスファイルによって定められる。
クライアント側では、受信するビデオフレームごとにクライアントはフレームのタイル#及びビデオ内の再生時間を以下の等式からタイムスタンプ(T)によって復号することができる。
T=(ν×Tν)+(χ×Tχ)+(c×T)+(f×T
但しvはビューインデックスであり、xは1つのリージョナルストリーミング内のチャンクインデックスであり、cはタイルインデックスであり、fはTSセグメント内のフレームインデックスであり、T=ビデオ長であり(パディングはTの乗数(multiplier)である)、T=xチャンクの持続時間(図7では3秒)であり、Tc=チャンクの持続時間(例えば1秒)であり、T=フレームの持続時間である。
加えて、T、T、T、Tはトランスコーディング時に知られており、以下の関係を有する:
Tv=Tx合計チャンク#
Tx=Tcアクティブビュー#
Tc=TfTS内の合計フレーム#
Tf=各フレーム内に符号化され、概してフレームごとに一定である。
従って、クライアントはフレームタイムスタンプ(T)からv、x、c、及びfを一意に導出することができる。
実施形態の一例では、見る人が自分のビュー角度を変えるときビューインデックスvが変わる。上記のTの方程式から、更新されたビュー角度(ビューインデックス)について新たなタイムスタンプTを見つけることができる。かかるシナリオでは、更新されたタイムスタンプに基づいてサーバが新たなTSをストリームすることをクライアントが要求することができる。このシステム及び方法を使用し、クライアントは受信する全てのフレームを正しい画面位置にレンダリングすることができる。
図中に示す特定の構成は限定と見なすべきではない。他の実施形態は、所与の図中に示す各要素を更に多く又は少なく含み得ることを理解すべきである。更に、図示の要素の一部は組み合わせる又は省略することができる。また更に、例示的実施形態は図中に示されていない要素を含み得る。
情報を処理することを表すステップ又はブロックは、本明細書に記載した方法又は技法の特定の論理機能を実行するように構成され得る回路に対応することができる。或いは又は加えて、情報を処理することを表すステップ又はブロックはプログラムコード(関連データを含む)のモジュール、セグメント、又は一部に対応し得る。プログラムコードは、本方法又は技法内の特定の論理機能又はアクションを実装するためのプロセッサによって実行可能な1つ又は複数の命令を含み得る。プログラムコード及び/又は関連データは、ディスク、ハードドライブ、又は他の記憶媒体を含む記憶装置等の任意の種類のコンピュータ可読媒体上に記憶され得る。
コンピュータ可読媒体は、レジスタメモリ、プロセッサキャッシュ、ランダムアクセスメモリ(RAM)のように短期間にわたってデータを記憶するコンピュータ可読媒体等の非一時的コンピュータ可読媒体も含み得る。コンピュータ可読媒体は、プログラムコード及び/又はデータを長期間にわたって記憶する非一時的コンピュータ可読媒体も含み得る。従ってコンピュータ可読媒体は、例えば読取専用メモリ(ROM)、光又は磁気ディスク、コンパクトディスク読取専用メモリ(CD−ROM)のような二次的又は永続的な長期記憶域を含み得る。コンピュータ可読媒体は他の任意の揮発性又は不揮発性記憶システムとすることもできる。コンピュータ可読媒体は例えばコンピュータ可読記憶媒体又は有形の記憶装置と考えることができる。
様々な例及び実施形態を開示してきたが、他の例及び実施形態が当業者に明らかになる。開示した様々な例及び実施形態は例示目的であり、限定であることは意図せず、真の範囲は添付の特許請求の範囲によって示す。

Claims (20)

  1. システムであって、
    ディスプレイと、
    センサと、
    通信インタフェースと、
    メモリ及び少なくとも1個のプロセッサを含むコントローラと、
    ビューボリューム内のビュー方向を示す情報を前記センサから受信することであって、前記ビュー方向は視野に対応する、受信すること、
    前記ビュー方向に基づいて前記ビューボリューム内の複数のビュー可能領域から複数のアクティブ領域を決定すること、
    前記通信インタフェースを介して、前記複数のアクティブ領域に対応する複数のビデオストリームに接続すること、
    前記複数のアクティブ領域に対応する第1のビデオ情報を前記複数のビデオストリームを介して受信すること、
    360°の視野に対応する第2のビデオ情報を受信することであって、前記第1のビデオ情報は前記第2のビデオ情報よりも高い解像度を有する、受信すること、
    前記複数のアクティブ領域内で前記第1のビデオ情報に基づいて且つ前記複数のアクティブ領域の外側の前記ビューボリュームの領域内で前記第2のビデオ情報に基づいて360°ビデオをレンダリングすること、及び
    前記視野に対応する前記360°ビデオの少なくとも一部を前記ディスプレイによって表示すること
    を含む動作を行うために前記メモリ内に記憶され、前記少なくとも1個のプロセッサによって実行可能なプログラム命令と
    を含む、システム。
  2. 前記動作が、
    更新されたビュー方向を示す情報を前記センサから受信することであって、前記更新されたビュー方向は更新された視野に対応する、受信すること、
    前記更新されたビュー方向に基づいて前記ビューボリューム内の複数のビュー可能領域から複数の更新されたアクティブ領域を決定すること、
    前記複数の更新されたアクティブ領域に対応しない少なくとも1つのビデオストリームを切断すること、
    前記通信インタフェースを介して、前記複数の更新されたアクティブ領域に対応する複数の更新されたビデオストリームに接続すること、
    前記複数の更新されたアクティブ領域に対応する更新されたビデオ情報を前記複数の更新されたビデオストリームを介して受信すること、
    前記複数の更新されたアクティブ領域内で前記更新されたビデオ情報に基づいて且つ前記複数の更新されたアクティブ領域の外側の前記ビューボリュームの領域内で前記第2のビデオ情報に基づいて、更新された360°ビデオをレンダリングすること、及び
    前記更新された視野に対応する前記更新された360°ビデオの少なくとも一部を前記ディスプレイによって表示すること
    を更に含む、請求項1に記載のシステム。
  3. 請求項1に記載のシステムであって、
    前記動作が、
    前記システムの動きを示す情報を前記センサから受信すること、及び
    前記システムの前記動きに基づいて予測される変化率又は予測される動きを決定することであって、前記複数のアクティブ領域を決定することが前記予測される変化率又は予測される動きに更に基づく、決定すること
    を更に含む、システム。
  4. 前記複数のアクティブ領域が前記視野よりも前記ビューボリュームの大きい部分を含む、請求項1に記載のシステム。
  5. 前記第1のビデオ情報及び前記第2のビデオ情報を表示することが時間の点で同期される、請求項1に記載のシステム。
  6. 前記動作が、
    前記通信インタフェースを介して、少なくとも1つの音声ストリームに接続すること、
    前記少なくとも1つの音声ストリームを介してサウンドトラックを受信すること、及び
    前記第1のビデオ情報及び前記第2のビデオ情報と同期して前記サウンドトラックを再生すること
    を更に含む、請求項1に記載のシステム。
  7. 少なくとも前記ディスプレイ及びセンサが仮想現実ヘッドセットに組み込まれる、請求項1に記載のシステム。
  8. 前記複数のビデオストリームに接続することが少なくとも1つのUDP、TCP/IP、又はHTTP接続によって少なくとも1つのストリーミングサーバに接続することを含む、請求項1に記載のシステム。
  9. 前記複数のビデオストリームに接続することが1つのトンネルUDP、TCP/IP、又はHTTP接続によってストリーミングサーバに接続することを含む、請求項1に記載のシステム。
  10. 前記複数のビデオストリームに接続することが多重化ネットワーク接続によってストリーミングサーバに接続することを含み、前記多重化ネットワーク接続は前記第1のビデオ情報からの固定長のトランスポーテーションセグメントを通信するように構成されるネットワーク接続を含む、請求項1に記載のシステム。
  11. システムであって、
    通信インタフェースと、
    メモリ及び少なくとも1個のプロセッサを含むコントローラと、
    360°ビデオストリームを複数のリージョナルストリームに分割すること、
    前記360°ビデオストリームをダウンサンプリングして低解像度の360°ビデオストリームを提供すること、
    前記通信インタフェースを介して要求を受信することであって、前記要求は少なくとも1つのアクティブ領域を含む、受信すること、
    前記通信インタフェースを介して、前記少なくとも1つのアクティブ領域に対応する少なくとも1つのリージョナルストリームを提供すること、及び
    前記通信インタフェースを介して、前記低解像度の360°ビデオストリームを提供すること
    を含む動作を行うために前記メモリ内に記憶され、前記少なくとも1個のプロセッサによって実行可能なプログラム命令と
    を含む、システム。
  12. 前記動作が、前記通信インタフェースを介して、少なくとも1つの音声ストリームを提供することであって、前記通信インタフェースは少なくとも1つのクライアント装置との少なくとも1つのネットワーク接続又は少なくとも1つのクライアント装置との少なくとも1つのトンネルTCP接続のうちの少なくとも1つを含む、提供することを更に含む、請求項11に記載のシステム。
  13. 前記360°ビデオストリームを前記複数のリージョナルストリームに分割することが、
    前記360°ビデオストリームの少なくとも一部のフレームごとにエントロピマップを計算すること、
    平均エントロピマップを提供するために前記360°ビデオストリームの一部分に対応する前記エントロピマップを画素ごとに平均することであって、前記平均エントロピマップは平均画素情報を示す、平均すること、及び
    前記平均エントロピマップを複数の領域に分割することであって、各領域は同様の画素情報量を有し、前記複数のリージョナルストリームは前記複数の領域に対応する、分割すること
    を含む、請求項11に記載のシステム。
  14. 前記平均エントロピマップを複数の領域に分割することが、リニアプログラミング、ダイナミックプログラミング、又は少なくとも1つの数値最適化アルゴリズムのうちの少なくとも1つを使用して行われる、請求項13に記載のシステム。
  15. 前記通信インタフェースが少なくとも1つのクライアント装置との多重化ネットワーク接続を含み、前記少なくとも1つのリージョナルストリームを提供することが、前記低解像度の360°ビデオストリームからの固定長のトランスポーテーションセグメント及び前記少なくとも1つのアクティブ領域に対応する前記少なくとも1つのリージョナルストリームを提供することを含む、請求項11に記載のシステム。
  16. 方法であって、
    ビューボリューム内のビュー方向を示す情報をセンサから受信することであって、前記ビュー方向は視野に対応する、受信すること、
    前記ビュー方向に基づいて前記ビューボリューム内の複数のビュー可能領域から複数のアクティブ領域を決定すること、
    通信インタフェースを介して、前記複数のアクティブ領域に対応する複数のビデオストリームに接続すること、
    前記複数のアクティブ領域に対応する第1のビデオ情報を前記複数のビデオストリームを介して受信すること、
    360°の視野に対応する第2のビデオ情報を受信することであって、前記第1のビデオ情報は前記第2のビデオ情報よりも高い解像度を有する、受信すること、
    前記複数のアクティブ領域内で前記第1のビデオ情報に基づいて且つ前記複数のアクティブ領域の外側の前記ビューボリュームの領域内で前記第2のビデオ情報に基づいて360°ビデオをレンダリングすること、及び
    前記視野に対応する前記360°ビデオの少なくとも一部をディスプレイによって表示すること
    を含む、方法。
  17. 更新されたビュー方向を示す情報を前記センサから受信することであって、前記更新されたビュー方向は更新された視野に対応する、受信すること、
    前記更新されたビュー方向に基づいて前記ビューボリューム内の複数のビュー可能領域から複数の更新されたアクティブ領域を決定すること、
    前記複数の更新されたアクティブ領域に対応しない少なくとも1つのビデオストリームを切断すること、
    前記通信インタフェースを介して、前記複数の更新されたアクティブ領域に対応する複数の更新されたビデオストリームに接続すること、
    前記複数の更新されたアクティブ領域に対応する更新されたビデオ情報を前記複数の更新されたビデオストリームを介して受信すること、
    前記複数の更新されたアクティブ領域内で前記更新されたビデオ情報に基づいて且つ前記複数の更新されたアクティブ領域の外側の前記ビューボリュームの領域内で前記第2のビデオ情報に基づいて、更新された360°ビデオをレンダリングすること、及び
    前記更新された視野に対応する前記更新された360°ビデオの少なくとも一部を前記ディスプレイによって表示すること
    を更に含む、請求項16に記載の方法。
  18. 前記通信インタフェースを介して、少なくとも1つの音声ストリームに接続すること、
    前記少なくとも1つの音声ストリームを介してサウンドトラックを受信すること、及び
    前記第1のビデオ情報及び前記第2のビデオ情報と同期して前記サウンドトラックを再生すること
    を更に含む、請求項16に記載の方法。
  19. 前記複数のビデオストリームに接続することが、1つのトンネルTCP又はHTTP接続によってストリーミングサーバに接続することを含む、請求項16に記載の方法。
  20. 前記複数のビデオストリームに接続することが多重化ネットワーク接続によってストリーミングサーバに接続することを含み、前記多重化ネットワーク接続は前記第1のビデオ情報からの固定長のトランスポーテーションセグメントを通信するように構成される、請求項16に記載の方法。
JP2018552799A 2016-04-08 2017-04-07 ビューを意識した360度ビデオストリーミング Expired - Fee Related JP6741784B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662320451P 2016-04-08 2016-04-08
US62/320,451 2016-04-08
PCT/US2017/026514 WO2017177090A1 (en) 2016-04-08 2017-04-07 View-aware 360 degree video streaming

Publications (2)

Publication Number Publication Date
JP2019516297A true JP2019516297A (ja) 2019-06-13
JP6741784B2 JP6741784B2 (ja) 2020-08-19

Family

ID=59998838

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018552799A Expired - Fee Related JP6741784B2 (ja) 2016-04-08 2017-04-07 ビューを意識した360度ビデオストリーミング

Country Status (5)

Country Link
US (1) US9986221B2 (ja)
EP (1) EP3440843A4 (ja)
JP (1) JP6741784B2 (ja)
CN (1) CN109891906B (ja)
WO (1) WO2017177090A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020519094A (ja) * 2017-04-28 2020-06-25 華為技術有限公司Huawei Technologies Co.,Ltd. ビデオ再生方法、デバイス、およびシステム

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018064502A1 (en) * 2016-09-30 2018-04-05 Visbit Inc. View-optimized light field image and video streaming
US10425643B2 (en) 2017-02-04 2019-09-24 OrbViu Inc. Method and system for view optimization of a 360 degrees video
US10687050B2 (en) * 2017-03-10 2020-06-16 Qualcomm Incorporated Methods and systems of reducing latency in communication of image data between devices
CN107396081B (zh) * 2017-06-19 2019-04-12 深圳市铂岩科技有限公司 针对全景视频的优化编码方法及装置
WO2019194571A1 (en) * 2018-04-05 2019-10-10 Lg Electronics Inc. Method for transmitting 360-degree video, method for receiving 360-degree video, apparatus for transmitting 360-degree video, and apparatus for receiving 360-degree video
US11140373B2 (en) 2018-04-05 2021-10-05 Lg Electronics Inc. Method for transmitting 360-degree video, method for receiving 360-degree video, apparatus for transmitting 360-degree video, and apparatus for receiving 360-degree video
US10812828B2 (en) 2018-04-10 2020-10-20 At&T Intellectual Property I, L.P. System and method for segmenting immersive video
WO2019199024A1 (ko) * 2018-04-10 2019-10-17 엘지전자 주식회사 360 영상 데이터의 서브픽처 기반 처리 방법 및 그 장치
US10735765B2 (en) * 2018-06-07 2020-08-04 Hong Kong Applied Science and Technology Research Institute Company, Limited Modified pseudo-cylindrical mapping of spherical video using linear interpolation of empty areas for compression of streamed images
JP2020005038A (ja) * 2018-06-25 2020-01-09 キヤノン株式会社 送信装置、送信方法、受信装置、受信方法、及び、プログラム
US10699154B2 (en) 2018-08-08 2020-06-30 At&T Intellectual Property I, L.P. Optimizing 360-degree video streaming with video content analysis
US10735778B2 (en) 2018-08-23 2020-08-04 At&T Intellectual Property I, L.P. Proxy assisted panoramic video streaming at mobile edge
US11032590B2 (en) 2018-08-31 2021-06-08 At&T Intellectual Property I, L.P. Methods, devices, and systems for providing panoramic video content to a mobile device from an edge server
US10826964B2 (en) 2018-09-05 2020-11-03 At&T Intellectual Property I, L.P. Priority-based tile transmission system and method for panoramic video streaming
KR102192433B1 (ko) * 2018-12-28 2020-12-17 포항공과대학교 산학협력단 360도 영상의 수평 수직 보정을 위한 장치 및 방법
US10970519B2 (en) 2019-04-16 2021-04-06 At&T Intellectual Property I, L.P. Validating objects in volumetric video presentations
US11074697B2 (en) 2019-04-16 2021-07-27 At&T Intellectual Property I, L.P. Selecting viewpoints for rendering in volumetric video presentations
US11012675B2 (en) 2019-04-16 2021-05-18 At&T Intellectual Property I, L.P. Automatic selection of viewpoint characteristics and trajectories in volumetric video presentations
US11153492B2 (en) 2019-04-16 2021-10-19 At&T Intellectual Property I, L.P. Selecting spectator viewpoints in volumetric video presentations of live events
CN111131805A (zh) * 2019-12-31 2020-05-08 歌尔股份有限公司 图像处理方法、装置和可读存储介质
CN113473126B (zh) 2020-03-31 2023-03-17 阿里巴巴集团控股有限公司 视频流的处理方法、装置、电子设备及计算机可读介质
CN115604523A (zh) * 2021-06-28 2023-01-13 中兴通讯股份有限公司(Cn) 自由视角视频场景的处理方法、客户端及服务器

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013543332A (ja) * 2010-02-02 2013-11-28 ファーウェイ テクノロジーズ カンパニー リミテッド オンライン・メディア・プレビュー用システム及び方法
JP2014502072A (ja) * 2010-10-22 2014-01-23 アルカテル−ルーセント 監視ビデオルータ
WO2014080879A1 (ja) * 2012-11-26 2014-05-30 ソニー株式会社 送信装置、送信方法、受信装置、受信方法および受信表示方法
JP2014116922A (ja) * 2012-11-19 2014-06-26 Nippon Telegr & Teleph Corp <Ntt> 映像再生装置及び映像配信装置
JP2014176017A (ja) * 2013-03-12 2014-09-22 Nippon Telegr & Teleph Corp <Ntt> 映像再生装置、映像配信装置、映像再生方法及び映像配信方法
JP2014222894A (ja) * 2010-10-19 2014-11-27 オトイ、インコーポレイテッド ステートレス圧縮を利用したコンポジットビデオ画像をストリーミングする方法、プログラムおよび装置
JP2015097343A (ja) * 2013-11-15 2015-05-21 日本電信電話株式会社 映像配信システム、映像配信装置及び映像配信プログラム
WO2015184416A1 (en) * 2014-05-29 2015-12-03 Nextvr Inc. Methods and apparatus for delivering content and/or playing back content
WO2016010668A1 (en) * 2014-07-14 2016-01-21 Sony Computer Entertainment Inc. System and method for use in playing back panorama video content

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6567086B1 (en) * 2000-07-25 2003-05-20 Enroute, Inc. Immersive video system using multiple video streams
JP2004072694A (ja) * 2002-08-09 2004-03-04 Sony Corp 情報提供システムおよび方法、情報提供装置および方法、記録媒体、並びにプログラム
US7778326B1 (en) * 2003-12-23 2010-08-17 At&T Intellectual Property Ii, L.P. System and method for dynamically determining multimedia transmission based on communication bandwidth
CN103167284B (zh) * 2011-12-19 2017-08-11 中国电信股份有限公司 一种基于画面超分辨率的视频流传输方法及***
US8990843B2 (en) * 2012-10-26 2015-03-24 Mobitv, Inc. Eye tracking based defocusing
US9699437B2 (en) * 2014-03-03 2017-07-04 Nextvr Inc. Methods and apparatus for streaming content
US9635077B2 (en) * 2014-03-14 2017-04-25 Adobe Systems Incorporated Low latency live video streaming
US20150286719A1 (en) * 2014-04-03 2015-10-08 Sony Corporation Recognizing and registering faces in video
WO2016050283A1 (en) * 2014-09-30 2016-04-07 Telefonaktiebolaget L M Ericsson (Publ) Reduced bit rate immersive video
US20160150212A1 (en) 2014-11-26 2016-05-26 Sony Corporation Live selective adaptive bandwidth
US9979885B2 (en) * 2015-02-09 2018-05-22 Steven Christopher Sparks Apparatus and method for capture of 360° panoramic video image and simultaneous assembly of 360° panoramic zoetropic video image
GB2536025B (en) * 2015-03-05 2021-03-03 Nokia Technologies Oy Video streaming method
JP6501904B2 (ja) 2015-05-27 2019-04-17 グーグル エルエルシー 球面ビデオのストリーミング
US20160353146A1 (en) 2015-05-27 2016-12-01 Google Inc. Method and apparatus to reduce spherical video bandwidth to user headset
WO2017044795A1 (en) 2015-09-10 2017-03-16 Google Inc. Playing spherical video on a limited bandwidth connection
US9858706B2 (en) 2015-09-22 2018-01-02 Facebook, Inc. Systems and methods for content streaming
US10152080B2 (en) * 2015-09-23 2018-12-11 Adobe Systems Incorporated Power efficient multimedia content streaming based on media segment duration

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013543332A (ja) * 2010-02-02 2013-11-28 ファーウェイ テクノロジーズ カンパニー リミテッド オンライン・メディア・プレビュー用システム及び方法
JP2014222894A (ja) * 2010-10-19 2014-11-27 オトイ、インコーポレイテッド ステートレス圧縮を利用したコンポジットビデオ画像をストリーミングする方法、プログラムおよび装置
JP2014502072A (ja) * 2010-10-22 2014-01-23 アルカテル−ルーセント 監視ビデオルータ
JP2014116922A (ja) * 2012-11-19 2014-06-26 Nippon Telegr & Teleph Corp <Ntt> 映像再生装置及び映像配信装置
WO2014080879A1 (ja) * 2012-11-26 2014-05-30 ソニー株式会社 送信装置、送信方法、受信装置、受信方法および受信表示方法
JP2014176017A (ja) * 2013-03-12 2014-09-22 Nippon Telegr & Teleph Corp <Ntt> 映像再生装置、映像配信装置、映像再生方法及び映像配信方法
JP2015097343A (ja) * 2013-11-15 2015-05-21 日本電信電話株式会社 映像配信システム、映像配信装置及び映像配信プログラム
WO2015184416A1 (en) * 2014-05-29 2015-12-03 Nextvr Inc. Methods and apparatus for delivering content and/or playing back content
WO2016010668A1 (en) * 2014-07-14 2016-01-21 Sony Computer Entertainment Inc. System and method for use in playing back panorama video content

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020519094A (ja) * 2017-04-28 2020-06-25 華為技術有限公司Huawei Technologies Co.,Ltd. ビデオ再生方法、デバイス、およびシステム
US11159848B2 (en) 2017-04-28 2021-10-26 Huawei Technologies Co., Ltd. Video playing method, device, and system
JP7110234B2 (ja) 2017-04-28 2022-08-01 華為技術有限公司 ビデオ再生方法、デバイス、およびシステム

Also Published As

Publication number Publication date
CN109891906A (zh) 2019-06-14
US9986221B2 (en) 2018-05-29
JP6741784B2 (ja) 2020-08-19
WO2017177090A1 (en) 2017-10-12
CN109891906B (zh) 2021-10-15
EP3440843A4 (en) 2019-08-28
EP3440843A1 (en) 2019-02-13
US20170294049A1 (en) 2017-10-12

Similar Documents

Publication Publication Date Title
JP6741784B2 (ja) ビューを意識した360度ビデオストリーミング
KR102013403B1 (ko) 구면 영상 스트리밍
JP7029562B2 (ja) コンテンツを提供及び表示するための装置及び方法
EP3459252B1 (en) Method and apparatus for spatial enhanced adaptive bitrate live streaming for 360 degree video playback
CN111355954B (zh) 为视频播放器装置处理视频数据
US20180310010A1 (en) Method and apparatus for delivery of streamed panoramic images
WO2018050606A1 (en) Streaming virtual reality video
GB2572996A (en) Processing video patches for three-dimensional content
JP7218826B2 (ja) 再生装置および画像生成方法
WO2018126702A1 (zh) 一种应用于虚拟现实技术的流媒体的传输方法和客户端
JP7177034B2 (ja) レガシー及び没入型レンダリングデバイスのために没入型ビデオをフォーマットする方法、装置、及びストリーム
WO2022057187A1 (en) Method and system for seamless switching of multiple video streams at playback end
Podborski et al. Virtual reality and DASH
KR20210019017A (ko) 컨텐츠의 처리 방법 및 장치
KR20190129865A (ko) 정보 처리 장치 및 정보 처리 방법, 그리고 프로그램
US10841490B2 (en) Processing method and processing system for video data
JP7144452B2 (ja) 画像処理装置およびシステム
EP3635958B1 (en) Image processing device and system
KR20220054283A (ko) 3d 장면을 송신 및 렌더링하기 위한 방법들, 패치들을 생성하기 위한 방법, 및 대응하는 디바이스들 및 컴퓨터 프로그램들
KR102499900B1 (ko) 고해상도 영상의 스트리밍을 위한 영상 전송 장치와 영상 재생 장치 및 그 동작 방법
WO2023184467A1 (en) Method and system of video processing with low latency bitstream distribution
WO2023194648A1 (en) A method, an apparatus and a computer program product for media streaming of immersive media
JP2024083340A (ja) 遠隔端末用の没入型テレビ会議及びテレプレゼンスのためのビットストリーム構造

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200622

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200722

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200727

R150 Certificate of patent or registration of utility model

Ref document number: 6741784

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees