JP7467646B2 - 3次元コンテンツ処理方法および装置 - Google Patents
3次元コンテンツ処理方法および装置 Download PDFInfo
- Publication number
- JP7467646B2 JP7467646B2 JP2022546010A JP2022546010A JP7467646B2 JP 7467646 B2 JP7467646 B2 JP 7467646B2 JP 2022546010 A JP2022546010 A JP 2022546010A JP 2022546010 A JP2022546010 A JP 2022546010A JP 7467646 B2 JP7467646 B2 JP 7467646B2
- Authority
- JP
- Japan
- Prior art keywords
- bitstream
- lod
- track
- data
- detail
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title description 2
- 238000000034 method Methods 0.000 claims description 134
- 238000005538 encapsulation Methods 0.000 claims description 52
- 238000012545 processing Methods 0.000 claims description 23
- 238000009877 rendering Methods 0.000 claims description 11
- 239000000523 sample Substances 0.000 description 116
- 101100287577 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gpe-1 gene Proteins 0.000 description 16
- 101150030514 GPC1 gene Proteins 0.000 description 14
- 238000004590 computer program Methods 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 10
- 230000000007 visual effect Effects 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 208000013057 hereditary mucoepithelial dysplasia Diseases 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- AWSBQWZZLBPUQH-UHFFFAOYSA-N mdat Chemical compound C1=C2CC(N)CCC2=CC2=C1OCO2 AWSBQWZZLBPUQH-UHFFFAOYSA-N 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000013074 reference sample Substances 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/001—Model-based coding, e.g. wire frame
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/40—Tree coding, e.g. quadtree, octree
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/1883—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/33—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234327—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
- H04N21/2362—Generation or processing of Service Information [SI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/434—Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
- H04N21/4345—Extraction or processing of SI, e.g. extracting service information from an MPEG stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8146—Monomedia components thereof involving graphical data, e.g. 3D object, 2D graphics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/816—Monomedia components thereof involving special video data, e.g 3D video
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/85406—Content authoring involving a specific file format, e.g. MP4 format
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Graphics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Generation (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Surgical Instruments (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Television Signal Processing For Recording (AREA)
Description
本発明はさらに、例えば、以下を提供する。
(項目1)
3次元コンテンツを処理する方法であって、前記方法は、
1つの幾何学形状サブビットストリームおよび1つ以上の属性サブビットストリームとして表された3次元(3D)コンテンツを含むビットストリームの詳細のレベル(LoD)情報を解析することと、
前記LoD情報に基づいて、所望の詳細のレベルに対応する前記幾何学形状サブビットストリームおよび前記1つ以上の属性サブビットストリームのうちの少なくとも一部をデコードすることによって、デコードされた情報を生成することと、
前記デコードされた情報を使用して、少なくとも前記所望の詳細のレベルに対応する3次元場面を再構築することと
を含み、
前記ビットストリームは、前記3Dコンテンツの複数の詳細のレベルに従って編成されたフォーマットに準拠している、方法。
(項目2)
前記LoD情報を解析することは、
前記ビットストリームが空間スケーラビリティサブビットストリームを備えているかどうかを決定すること、
複数の詳細のレベルを含む前記ビットストリームにおける第1の構文構造を識別すること、
第2の構文構造、サブサンプル構造、サンプルエントリ、または記述子を使用して、前記LoD情報を識別すること、または、
前記所望の詳細のレベルまたは全部のレベルの組に対応するコンテンツの位置を特定すること
を含む、項目1に記載の方法。
(項目3)
前記ビットストリームにおけるサンプルエントリタイプフィールドを使用して、前記ビットストリームが空間スケーラビリティ機能性をサポートするかどうかを決定することと、前記構造を識別することとを含む、項目2に記載の方法。
(項目4)
複数の詳細のレベルを伴う前記ビットストリームの前記構造は、
全部のレベルの組の前記ビットストリームがサブサンプル構造を伴う1つのトラック内で搬送される構造と、
各レベルの前記ビットストリームがエクストラクタを伴う1つのトラックにある構造と、
1つ以上のレベルの前記ビットストリームがより低いレベルからの冗長データを伴う1つのトラックにある構造と
を備えている、項目3に記載の方法。
(項目5)
前記デコードすることは、前記所望の詳細のレベルに対応する3Dコンテンツを含む1つ以上のサブサンプルをデコードすることを含む、項目1に記載の方法。
(項目6)
前記デコードすることは、詳細の全てのレベルに対応する3Dコンテンツを含むサブサンプルに関する全ての幾何学形状サブビットストリームをデコードすることを含む、項目1に記載の方法。
(項目7)
前記サブサンプル構造は、前記LoD情報を表すcodec_specific_parametersフィールド拡張子を備えている、項目2に記載の方法。
(項目8)
前記LoD情報を表す前記codec_specific_parametersフィールド拡張子は、以下の構文要素:ペイロードタイプ、リフティングスケーラビリティを示すフラグ、幾何学形状データユニットのみが含まれるかどうかを示すフラグ、属性データユニットのみが含まれるかどうかを示すフラグ、または属性ペイロードのうちの1つ以上を含む、項目7に記載の方法。
(項目9)
前記サンプルエントリにおけるLoD値を使用して、前記ビットストリームのLoDの値を識別することを含む、項目2に記載の方法。
(項目10)
前記デコードすることは、
前記所望の詳細のレベルに対応するトラックにおける前記ビットストリームの第1の部分をデコードすることと、
前記所望の詳細のレベルより低い詳細のレベルを伴う1つ以上の他のトラックにおける前記ビットストリームの第2の部分を識別し、デコードすることと
を含む、項目1に記載の方法。
(項目11)
エクストラクタおよび第1のトラック参照タイプを使用して、前記所望のレベルより低い詳細のレベルを伴う前記他のトラックを識別することと、
前記エクストラクタを使用して、前記他のトラックに対応するデータを識別することと
を含む、項目10に記載の方法。
(項目12)
前記エクストラクタは、
トラック参照タイプに基づいてトラックを1つ以上の他のトラックにリンクする情報を搬送する1つ以上のコンストラクタと、
データを前記参照されるトラックから抽出するための1つ以上の命令と
を含む、項目11に記載の方法。
(項目13)
第1のトラックグループタイプを使用して、全部の詳細のレベルに対応するサブストリームを含む1つ以上のトラックを識別することと、
全部の詳細のレベルに対応する前記1つ以上のトラックにおけるデータをデコードすることと
を含む、項目1に記載の方法。
(項目14)
単一トラックにおける前記所望の詳細のレベルおよび1つ以上のより低いレベルに対応する前記ビットストリームのうちの一部をデコードすることを含む、項目1に記載の方法。
(項目15)
単一トラックにおける全部の詳細のレベルに対応する前記ビットストリームをデコードすることを含む、項目1に記載の方法。
(項目16)
LoD記述子を使用して、適合組が空間スケーラビリティ機能性をサポートするかどうかを決定することを含む、項目2に記載の方法。
(項目17)
前記LoD記述子におけるLoD値を使用して、前記適合組におけるLoDを識別することを含む、項目16に記載の方法。
(項目18)
単一適合組からの前記所望のLoDおよび1つ以上のより低いレベルに対応する前記ビットストリームのうちの一部をデコードすること、または、
1つの適合組における前記所望のLoDおよび他の適合組におけるより低いレベルを伴うデータに対応する前記ビットストリームのうちの一部を識別し、デコードすること
を含む、項目1に記載の方法。
(項目19)
全部トラックidを使用して、全部の詳細のレベルに対応するデータを含む1つ以上の適合組を識別することと、
詳細の全てのレベルに対応する1つ以上の適合組において、全部のデータをデコードすることと
を含む、項目1に記載の方法。
(項目20)
前記LoD記述子は、その属性が詳細のレベル情報を規定する構文要素、より低いレベルトラックへの依存を示す構文要素、前記ビットストリームにおける最小の詳細のレベル、前記ビットストリームにおける最大の詳細のレベル、または前記全部トラックidの識別子を示す構文要素のうちの1つ以上を備えている、項目16-19に記載の方法。
(項目21)
前記所望のLoDに対応する前記ビットストリームのうちの一部が、単一トラックカプセル化または複数トラックカプセル化を伴う前記所望のLoDに対応するデータを含む、項目1-20に記載の方法。
(項目22)
前記単一トラックカプセル化は、同じトラックにカプセル化された前記1つの幾何学形状ビットストリームと前記1つ以上の属性ビットストリームとを備えている、項目21に記載の方法。
(項目23)
前記複数トラックカプセル化は、別個のトラックにカプセル化された前記1つの幾何学形状ビットストリームと前記1つ以上の属性ビットストリームとを備えている、項目20に記載の方法。
(項目24)
前記3次元場面を再構築することは、
前記3Dコンテンツにおける各点の空間位置および1つ以上の属性値を再構築すること、または、
前記3Dコンテンツにおける各点の空間位置および属性値を再構築し、ユーザの視認位置およびビューポートに従って、3D場面をレンダリングすること
を含む、項目1に記載の方法。
(項目25)
3次元コンテンツをエンコードする方法であって、前記方法は、
3次元(3D)コンテンツを1つ以上の詳細のレベル(LoD)に従って編成された幾何学形状サブビットストリームおよび1つ以上の属性サブビットストリームを備えているビットストリームにエンコードすることと、
前記1つ以上のLoDと、前記幾何学形状サブビットストリームと、前記1つ以上の属性ビットストリームとの間の対応を示すLoD情報を前記ビットストリームに含むことと
を含む、方法。
(項目26)
前記ビットストリーム内に、空間スケーラビリティビットストリームの存在の指示をエンコードすることと、
複数の詳細のレベルを含む前記ビットストリームに第1の構文構造を含むことと、
第2の構文構造を使用して、サブサンプル構造、サンプルエントリ、または前記ビットストリームに含まれるLoDベースのコンテンツを示す記述子を含むことと
をさらに含む、項目25に記載の方法。
(項目27)
前記ビットストリームにサンプルエントリタイプフィールドを含むことをさらに含み、前記サンプルエントリタイプフィールドは、ビットストリームが空間スケーラビリティ機能性をサポートするかどうかを決定すること、および前記構造を識別することを可能にする、項目26に記載の方法。
(項目28)
複数の詳細のレベルを伴う前記ビットストリームの前記構造は、
全部のレベルの組の前記ビットストリームがサブサンプル構造を伴う1つのトラック内で搬送される構造と、
各レベルの前記ビットストリームがエクストラクタを伴う1つのトラックにある構造と、
1つ以上のレベルの前記ビットストリームがより低いレベルからの冗長データを伴う1つのトラックにある構造と
を備えている、項目27に記載の方法。
(項目29)
前記サブサンプル構造は、前記LoD情報を表すcodec_specific_parametersフィールド拡張子を備えている、項目26に記載の方法。
(項目30)
前記LoD情報を表す前記codec_specific_parametersフィールド拡張子は、以下の構文要素:ペイロードタイプ、リフティングスケーラビリティを示すフラグ、幾何学形状データユニットのみが含まれるかどうかを示すフラグ、属性データユニットのみが含まれるかどうかを示すフラグ、または属性ペイロードのうちの1つ以上を含む、項目29に記載の方法。
(項目31)
前記ビットストリームに、前記ビットストリームのLoDの値を識別する前記サンプルエントリにおけるLoD値を含むことを含む、項目26に記載の方法。
(項目32)
前記ビットストリームに、エクストラクタと第1のトラック参照タイプとを含むことを含み、前記第1のトラック参照タイプは、前記所望の詳細のレベルより低い詳細のレベルを伴う他のトラックおよび前記他のトラックに対応するデータを識別する、項目31に記載の方法。
(項目33)
前記エクストラクタは、
トラック参照タイプに基づいてトラックを1つ以上の他のトラックにリンクする情報を搬送する1つ以上のコンストラクタと、
データを前記参照されるトラックから抽出するための1つ以上の命令と
を含む、項目32に記載の方法。
(項目34)
前記ビットストリームに、第1のトラックグループタイプを含むことを含み、前記第1のトラックグループタイプは、全部の詳細のレベルに対応するサブストリームを含む1つ以上のトラックを識別する、項目25に記載の方法。
(項目35)
適合組が空間スケーラビリティ機能性をサポートするかどうかを示すLoD記述子を含むことを含む、項目26に記載の方法。
(項目36)
前記LoD記述子は、前記適合組におけるLoDを識別するLoD値を含む、項目35に記載の方法。
(項目37)
前記所望のLoDに対応する前記ビットストリームのうちの一部が、単一トラックカプセル化または複数トラックカプセル化を伴う前記所望のLoDに対応するデータを含む、項目25-26に記載の方法。
(項目38)
前記単一トラックカプセル化は、同じトラックにカプセル化された前記1つの幾何学形状ビットストリームと前記1つ以上の属性ビットストリームとを備えている、項目37に記載の方法。
(項目39)
前記複数トラックカプセル化は、別個のトラックにカプセル化された前記1つの幾何学形状ビットストリームと前記1つ以上の属性ビットストリームとを備えている、項目37に記載の方法。
(項目40)
項目1-39のうちのいずれか1つ以上に記載される方法を実装するように構成されたプロセッサを備えている3次元コンテンツ処理装置。
(項目41)
コンピュータ読み取り可能な媒体上に記憶されたプログラムコードを備えているコンピュータプログラム製品であって、前記プログラムコードは、プロセッサによって実行されると、項目1-39のうちのいずれか1つ以上に記載される方法を前記プロセッサに実装させる、コンピュータプログラム製品。
本書に説明されるそのような技法は、エンコーダ実施形態が適切に構造化されたビットストリームを発生させることを可能にし、適切に構造化されたビットストリームは、所望のLoD(例えば、視認者によって、または車両ナビゲーションアプリケーション等の別のアプリによって規定されるようなLoD)に従って、エンコーディングされた3D場面の再構築のために必要とされるデータのみを選択するために、デコーダによって容易に解析されることが可能である。
unsigned int(8) PayloadType;
if (PayloadType == 2) { // geometry payload
bit(8) reserved = 0;
unsigned int(1) lifting_scalability_enabled_flag;
if (lifting_scalability_enabled_flag) {
unsigned int(1) is_geometry_data_unit_header;
if(!is_geometry_data_unit_header)
unsigned int(14) lod;
else
bit(14) reserved = 0;
}
}
else if (PayloadType == 4) { // attribute payload
unsigned int(8) AttrIdx;
unsigned int(1) lifting_scalability_enabled_flag;
if (lifting_scalability_enabled_flag) {
unsigned int(1) is_attribute_data_unit_header;
if(!is_attribute_data_unit_header)
unsigned int(14) lod;
else
bit(14) reserved = 0;
}
}
else
bit(24) reserved = 0;
unsigned int(8) PayloadType;
if (PayloadType == 2) { // geometry payload
unsigned int(1) lifting_scalability_enabled_flag;
if (lifting_scalability_enabled_flag) {
unsigned int(1) geometry_data_unit_header_exist;
unsigned int(14) lod;
}
else
bit() reserved;
}
else if (PayloadType == 4) { // attribute payload
unsigned int(8) AttrIdx;
unsigned int(1) lifting_scalability_enabled_flag;
if (lifting_scalability_enabled_flag) {
unsigned int(1) attribute_data_unit_header_exist;
unsigned int(14) lod;
}
else
bit(14) reserved = 0;
}
}
else
bit(24) reserved = 0;
unsigned int(8) GPCC_sub_type;
if (PayloadType == 2) { // geometry payload
unsigned int(14) lod;
}
else if (PayloadType == 5) { // attribute payload
unsigned int(8) AttrIdx;
unsigned int(14) lod;
}
else
bit(24) reserved = 0;
コンテナ: SampleDescriptionBox
必須: 「gpe1」、「gpeg」、「gpc1」、「gpcg」、「gpea」、「gpcl」、「gpes」、「gpcs」、「gpei」、および「gpci」サンプルエントリのうちの1つは、必須である。
数量: 1つ以上のサンプルエントリが、存在し得る。
aligned(8) class GPCCSampleEntry()
extends VolumetricVisualSampleEntry (’gpea’) {
GPCCConfigurationBox config; //mandatory
unsigned int(16) lod;
}
コンテナ: SampleDescriptionBox
必須: 「gpe1」、「gpeg」、「gpc1」、「gpcg」、「gpcl」、「gpes」、「gpcs」、「gpei」、および「gpci」サンプルエントリのうちの1つは、必須である。
数量: 1つ以上のサンプルエントリが、存在し得る。
aligned(8) class GPCCSampleEntry()
extends VolumetricVisualSampleEntry (’gpe1’) {
GPCCConfigurationBox config; //mandatory
unsigned int(1) lifting_scalability_enabled_flag;
if (lifting_scalability_enabled_flag)
unsigned int(15) lod;
else
bit(15) reserved = 0;
}
コンテナ: SampleDescriptionBox
必須: 「gpe1」、「gpeg」、「gpc1」、「gpcg」、「gpea」、「gpcl」、「gpes」、「gpcs」、「gpei」、および「gpci」サンプルエントリのうちの1つは、必須である。
数量: 1つ以上のサンプルエントリが、存在し得る。
aligned(8) class GPCCSampleEntry()
extends VolumetricVisualSampleEntry (’gpcl’) {
GPCCConfigurationBox config; //mandatory
GPCCComponentTypeBox type;
unsigned int(16) lod;
}
コンテナ: SampleDescriptionBox
必須: 「gpe1」、「gpeg」、「gpc1」、「gpcg」、「gpea」、「gpcl」、「gpes」、「gpcs」、「gpei」、および「gpci」サンプルエントリのうちの1つは、必須である。
数量: 1つ以上のサンプルエントリが、存在し得る。
aligned(8) class GPCCSampleEntry()
extends VolumetricVisualSampleEntry (’gpc1’) {
GPCCConfigurationBox config; //mandatory
GPCCComponentTypeBox type;
unsigned int(1) lifting_scalability_enabled_flag;
if (lifting_scalability_enabled_flag)
unsigned int(15) lod;
else
bit(15) reserved = 0;
}
class aligned(8) Extractor () {
unsigned int(16) constructor_count;
for(i = 0; i < constructor_count; i++ ){
unsigned int(8) track_ref_index;
signed int(8) sample_offset;
unsigned int(32) data_offset;
unsigned int(32) data_length;
}
}
コンテナ: SampleDescriptionBox
必須: 「gpe1」、「gpeg」、「gpc1」、「gpcg」、「gpea」、「gpcl」、「gpes」、「gpcs」、「gpei」、および「gpci」サンプルエントリのうちの1つは、必須である。
数量: 1つ以上のサンプルエントリが、存在し得る。
aligned(8) class GPCCSampleEntry()
extends VolumetricVisualSampleEntry (’gpes’) {
GPCCConfigurationBox config; //mandatory
unsigned int(16) lod;
}
aligned(8) class ScalableGroupBox extends TrackGroupTypeBox(’cptg’) {
unsigned int(16) lod_num;
for(i = 0; i < lod_num; i++ ){
unsigned int(8) entry_id;
unsigned int(16) lod;
}
}
lod_numは、全部の組の点群の詳細のレベルの最大値を示す。
entry_idは、レベルのエントリ点のtrack_id、すなわち、幾何学形状データを伴うトラックを示す。
lodは、entry_idに等しいtrack_idを伴うトラックの詳細のレベルの値を示す。
コンテナ: SampleDescriptionBox
必須: 「gpe1」、「gpeg」、「gpc1」、「gpcg」、「gpea」、「gpcl」、「gpes」、「gpcs」、「gpei」、および「gpci」サンプルエントリのうちの1つは、必須である。
数量: 1つ以上のサンプルエントリが、存在し得る。
aligned(8) class GPCCSampleEntry()
extends VolumetricVisualSampleEntry (’gpcs’) {
GPCCConfigurationBox config; //mandatory
GPCCComponentTypeBox type;
unsigned int(16) lod;
}
aligned(8) class ScalableGroupBox extends TrackGroupTypeBox(’cptg’) {
unsigned int(16) lod_num;
for(i = 0; i < lod_num; i++ ){
unsigned int(8) entry_id;
unsigned int(16) lod;
}
}
コンテナ: SampleDescriptionBox
必須: 「gpe1」、「gpeg」、「gpc1」、「gpcg」、「gpea」、「gpcl」、「gpes」、「gpcs」、「gpei」、および「gpci」サンプルエントリのうちの1つは、必須である。
数量: 1つ以上のサンプルエントリが、存在し得る。
aligned(8)classGPCCSampleEntry()
extendsVolumetricVisualSampleEntry(’gpei’){
GPCCConfigurationBoxconfig;//mandatory
unsignedint(16)lod;
}
コンテナ: SampleDescriptionBox
必須: 「gpe1」、「gpeg」、「gpc1」、「gpcg」、「gpea」、「gpcl」、「gpes」、「gpcs」、「gpei」、および「gpci」サンプルエントリのうちの1つは、必須である。
数量: 1つ以上のサンプルエントリが、存在し得る。
aligned(8) class GPCCSampleEntry()
extends VolumetricVisualSampleEntry (’gpci’) {
GPCCConfigurationBox config; //mandatory
GPCCComponentTypeBox type;
unsigned int(16) lod;
}
Claims (11)
- 3次元コンテンツを処理する方法であって、前記方法は、
1つの幾何学形状サブビットストリームおよび1つ以上の属性サブビットストリームとして表された3次元(3D)コンテンツを含むビットストリームの詳細のレベル(LoD)情報を解析することであって、前記LoD情報を解析することは、複数の詳細のレベルを含む前記ビットストリームにおける第1の構文構造を識別することを含む、ことと、
前記LoD情報に基づいて、所望の詳細のレベルに対応する前記幾何学形状サブビットストリームおよび前記1つ以上の属性サブビットストリームのうちの少なくとも一部をデコードすることによって、デコードされた情報を生成することと、
前記デコードされた情報を使用して、少なくとも前記所望の詳細のレベルに対応する3次元場面を再構築することであって、前記ビットストリームは、前記3Dコンテンツの複数の詳細のレベルに従って編成されたフォーマットに準拠している、ことと、
前記ビットストリームにおけるサンプルエントリタイプフィールドを使用して、前記ビットストリームが空間スケーラビリティ機能性をサポートするかどうかを決定することと、前記第1の構文構造を識別することと
を含み、
複数の詳細のレベルを伴う前記ビットストリームの前記第1の構文構造は、
全部のレベルの組の前記ビットストリームがサブサンプル構造を伴う1つのトラック内で搬送される第1の構造と、
前記1つのトラック内の各レベルの前記ビットストリームを伴うエクストラクタを含む第2の構造と、
より低いレベルからの冗長データを伴う前記1つのトラック内の1つ以上のレベルの前記ビットストリームを含む第3の構造と
を備えている、方法。 - 前記LoD情報を解析することは、
前記ビットストリームが空間スケーラビリティサブビットストリームを備えているかどうかを決定すること、
第2の構文構造、サブサンプル構造、サンプルエントリ、または、記述子を使用して、前記LoD情報を識別すること、または、
前記所望の詳細のレベルまたは全部のレベルの組に対応するコンテンツの位置を特定すること
を含む、請求項1に記載の方法。 - 前記サブサンプル構造は、前記LoD情報を表すcodec_specific_parametersフィールド拡張子を備えている、請求項2に記載の方法。
- 前記方法は、前記サンプルエントリにおけるLoD値を使用して、前記ビットストリームのLoDの値を識別することを含む、請求項2に記載の方法。
- 前記方法は、
第1のトラックグループタイプを使用して、全部の詳細のレベルに対応するサブストリームを含む1つ以上のトラックを識別することと、
全部の詳細のレベルに対応する前記1つ以上のトラックにおけるデータをデコードすることと
を含む、請求項1に記載の方法。 - 前記方法は、単一トラックにおける前記所望の詳細のレベルおよび1つ以上のより低いレベルに対応する前記ビットストリームのうちの一部をデコードすることを含む、請求項1に記載の方法。
- 前記所望のLoDに対応する前記ビットストリームのうちの一部が、単一トラックカプセル化を伴う前記所望のLoDに対応するデータを含み、
前記単一トラックカプセル化は、同じトラックにカプセル化された1つの幾何学形状ビットストリームと1つ以上の属性ビットストリームとを備えている、請求項1に記載の方法。 - 前記所望のLoDに対応する前記ビットストリームのうちの一部が、複数トラックカプセル化を伴う前記所望のLoDに対応するデータを含み、
前記複数トラックカプセル化は、別個のトラックにカプセル化された1つの幾何学形状ビットストリームと1つ以上の属性ビットストリームとを備えている、請求項1に記載の方法。 - 前記3次元場面を再構築することは、
前記3Dコンテンツにおける各点の空間位置および1つ以上の属性値を再構築すること、または、
前記3Dコンテンツにおける各点の空間位置および属性値を再構築し、ユーザの視認位置およびビューポートに従って、3D場面をレンダリングすること
を含む、請求項1に記載の方法。 - 請求項1~9のうちのいずれか1項に記載の方法を実装するように構成されているプロセッサを備えている3次元コンテンツ処理装置。
- プログラムコードが記憶されているコンピュータ読み取り可能な記憶媒体であって、前記プログラムコードは、プロセッサによって実行されると、請求項1~9のうちのいずれか1項に記載の方法を実装することを前記プロセッサに行わせる、コンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2020/098010 WO2021258325A1 (en) | 2020-06-24 | 2020-06-24 | Three-dimensional content processing methods and apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023517463A JP2023517463A (ja) | 2023-04-26 |
JP7467646B2 true JP7467646B2 (ja) | 2024-04-15 |
Family
ID=79282763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022546010A Active JP7467646B2 (ja) | 2020-06-24 | 2020-06-24 | 3次元コンテンツ処理方法および装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20220366611A1 (ja) |
EP (1) | EP4085421A4 (ja) |
JP (1) | JP7467646B2 (ja) |
KR (1) | KR20220123280A (ja) |
CN (1) | CN115039132A (ja) |
CA (1) | CA3169708A1 (ja) |
WO (1) | WO2021258325A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230276053A1 (en) * | 2020-06-22 | 2023-08-31 | Interdigital Patent Holdings, Inc. | Adaptive streaming of geometry-based point clouds |
WO2022054744A1 (ja) * | 2020-09-08 | 2022-03-17 | ソニーグループ株式会社 | 情報処理装置および方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002507799A (ja) | 1998-03-17 | 2002-03-12 | ピクサル アニメーション スタディオ | コンピューターアニメーションの確率的な詳細レベル |
JP2013038775A (ja) | 2011-08-10 | 2013-02-21 | Seiko Epson Corp | 高速反射屈折式ライトフィールドレンダリングのための光線画像モデル化 |
WO2019078000A1 (ja) | 2017-10-16 | 2019-04-25 | ソニー株式会社 | 情報処理装置および方法 |
WO2020060813A1 (en) | 2018-09-18 | 2020-03-26 | Vid Scale, Inc. | Methods and apparatus for point cloud compression bitstream format |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9396586B2 (en) * | 2014-03-14 | 2016-07-19 | Matterport, Inc. | Processing and/or transmitting 3D data |
US10909725B2 (en) * | 2017-09-18 | 2021-02-02 | Apple Inc. | Point cloud compression |
CN113016184B (zh) * | 2018-09-14 | 2023-07-07 | 华为技术有限公司 | 点云译码中属性支持的改进 |
WO2020072665A1 (en) * | 2018-10-02 | 2020-04-09 | Futurewei Technologies, Inc. | Hierarchical tree attribute coding in point cloud coding |
WO2020123469A1 (en) * | 2018-12-11 | 2020-06-18 | Futurewei Technologies, Inc. | Hierarchical tree attribute coding by median points in point cloud coding |
-
2020
- 2020-06-24 EP EP20942278.1A patent/EP4085421A4/en active Pending
- 2020-06-24 KR KR1020227026548A patent/KR20220123280A/ko active Search and Examination
- 2020-06-24 CN CN202080093961.5A patent/CN115039132A/zh active Pending
- 2020-06-24 WO PCT/CN2020/098010 patent/WO2021258325A1/en unknown
- 2020-06-24 CA CA3169708A patent/CA3169708A1/en active Pending
- 2020-06-24 JP JP2022546010A patent/JP7467646B2/ja active Active
-
2022
- 2022-07-29 US US17/816,102 patent/US20220366611A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002507799A (ja) | 1998-03-17 | 2002-03-12 | ピクサル アニメーション スタディオ | コンピューターアニメーションの確率的な詳細レベル |
JP2013038775A (ja) | 2011-08-10 | 2013-02-21 | Seiko Epson Corp | 高速反射屈折式ライトフィールドレンダリングのための光線画像モデル化 |
WO2019078000A1 (ja) | 2017-10-16 | 2019-04-25 | ソニー株式会社 | 情報処理装置および方法 |
WO2020060813A1 (en) | 2018-09-18 | 2020-03-26 | Vid Scale, Inc. | Methods and apparatus for point cloud compression bitstream format |
Also Published As
Publication number | Publication date |
---|---|
KR20220123280A (ko) | 2022-09-06 |
US20220366611A1 (en) | 2022-11-17 |
CN115039132A (zh) | 2022-09-09 |
WO2021258325A1 (en) | 2021-12-30 |
JP2023517463A (ja) | 2023-04-26 |
CA3169708A1 (en) | 2021-12-30 |
EP4085421A4 (en) | 2023-01-18 |
EP4085421A1 (en) | 2022-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI712313B (zh) | 感興趣區之發信號之系統及方法 | |
JP6743059B2 (ja) | カプセル化されたビットストリームからメディアデータ及びメタデータを取得するための、動作基点ディスクリプタを動的に設置可能な方法、デバイス及びコンピュータプログラム | |
US11765407B2 (en) | Method, device, and computer program for transmitting media content | |
KR102559862B1 (ko) | 미디어 콘텐츠 전송을 위한 방법, 디바이스, 및 컴퓨터 프로그램 | |
US11638066B2 (en) | Method, device and computer program for encapsulating media data into a media file | |
US20220366611A1 (en) | Three-dimensional content processing methods and apparatus | |
WO2021093153A1 (en) | Point cloud data processing | |
GB2509953A (en) | Displaying a Region of Interest in a Video Stream by Providing Links Between Encapsulated Video Streams | |
CN111034203A (zh) | 处理具有动态逐区封装的全向媒体 | |
US11477489B2 (en) | Apparatus, a method and a computer program for video coding and decoding | |
US20220360819A1 (en) | Volumetric media process methods and apparatus | |
EP4085642A1 (en) | Method for real time texture adaptation | |
JP7467647B2 (ja) | ボリュメトリックメディア処理方法および装置 | |
CN115396647A (zh) | 一种沉浸媒体的数据处理方法、装置、设备及存储介质 | |
US11553258B2 (en) | Apparatus, a method and a computer program for video coding and decoding | |
KR20220160646A (ko) | 미디어 파일 캡슐화 방법, 미디어 파일 캡슐화 해제 방법 및 관련 디바이스 | |
US12034982B2 (en) | Volumetric media process methods and apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220921 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220921 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231023 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231101 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240318 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240403 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7467646 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |