CN114125505B - 针对交互式客户端的全景视频的广播流 - Google Patents
针对交互式客户端的全景视频的广播流 Download PDFInfo
- Publication number
- CN114125505B CN114125505B CN202111445923.4A CN202111445923A CN114125505B CN 114125505 B CN114125505 B CN 114125505B CN 202111445923 A CN202111445923 A CN 202111445923A CN 114125505 B CN114125505 B CN 114125505B
- Authority
- CN
- China
- Prior art keywords
- stream
- spatial
- video
- data
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000002452 interceptive effect Effects 0.000 title description 5
- 238000012545 processing Methods 0.000 claims abstract description 28
- 238000000034 method Methods 0.000 claims description 64
- 230000006978 adaptation Effects 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 19
- 230000011664 signaling Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 11
- 238000013507 mapping Methods 0.000 claims description 4
- 239000000872 buffer Substances 0.000 description 20
- 230000004048 modification Effects 0.000 description 14
- 238000012986 modification Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 239000012634 fragment Substances 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 8
- 238000000605 extraction Methods 0.000 description 7
- 238000001824 photoionisation detection Methods 0.000 description 7
- 238000007792 addition Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000000153 supplemental effect Effects 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- FMYKJLXRRQTBOR-UBFHEZILSA-N (2s)-2-acetamido-4-methyl-n-[4-methyl-1-oxo-1-[[(2s)-1-oxohexan-2-yl]amino]pentan-2-yl]pentanamide Chemical group CCCC[C@@H](C=O)NC(=O)C(CC(C)C)NC(=O)[C@H](CC(C)C)NC(C)=O FMYKJLXRRQTBOR-UBFHEZILSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Abstract
为了发送包括高于解码器可以解码的分辨率的全景视频,在发射器侧,将编码视频流的视频图像的不同空间段或不同空间段组的编码数据封包到单独子流中,以获得单独子流组。在接收器侧,从该单独子流组中,提取单独子流的适当子集(即,仅一部分)并将其组合为包含编码数据的数据流,所述编码数据分别编码视频流的视频图像的空间段或序列空间段组的适当子集(即,仅一部分)。因此,解码数据流的解码器可以仅解码视频流的视频图像的子区域,该子区域由数据流中包含的编码数据中编码的空间段或空间段组来限定。还描述了允许以允许在接收侧更容易处理的方式发送仅与原始图像的段相关的子流或部分数据流的概念。
Description
本申请是申请人为弗劳恩霍夫应用研究促进协会、申请日为2017年3月28日、申请号为201780046872.3、发明名称为“针对交互式客户端的全景视频的广播流”的分案申请。
技术领域
实施例涉及流复用器。另外的实施例涉及流解复用器。另外的实施例涉及视频流。一些实施例涉及针对交互式客户端的全景视频的广播流。
背景技术
感兴趣区域(RoI)流,即,交互式全景流,正变得越来越流行。这种流媒体服务背后的想法是在非常宽的角度和高分辨率视频内进行导航,从而在接收器侧仅显示整个视频的一部分,即,RoI。
通常,整个全景视频以非常高的分辨率编码,例如,16K,并且不能被原样发送到接收器,因为它不能被现有例如4K的硬件解码。
发明内容
因此,根据本申请的第一方面,本发明的目的是提供一种概念,其使得即使全景视频包括高于解码器能够解码的分辨率,也允许将全景视频发送到解码器。
该目的通过第一方面的独立权利要求解决。
第一方面的实施例提供了一种包括接收接口和数据流形成器的流复用器。接收接口被配置为接收视频流的视频图像的至少两个不同空间段或不同序列空间段组中的每一个的编码数据。数据流形成器被配置为将至少两个不同空间段或不同序列空间段组中的每一个的编码数据封包到单独子流中,并在输出处提供单独子流。
实施例提供了一种包括数据流形成器和输出接口的流解复用器。数据流形成器被配置为从单独子流组中选择性地提取至少两个单独子流,所述至少两个单独子流包含编码视频流的视频图像的不同空间段或不同序列空间段组的编码数据,其中数据流形成器被配置为将所述至少两个单独子流组合为包含编码视频流的视频图像的不同空间段或不同序列空间段组的编码数据的数据流。
在实施例中,为了发送包括高于解码器可以解码的分辨率的全景视频,在发射器侧,编码视频流的视频图像的不同空间段或不同空间段组的编码数据被封包到单独子流中,以获得单独子流组。在接收器侧,从该单独子流组中,提取单独子流的适当子集(即,仅一部分)并将其组合为包含分别编码视频流的视频图像的空间段或序列空间段组的适当子集(即,仅一部分)的编码数据的数据流。因此,解码数据流的解码器可以仅解码视频流的视频图像的子区域,该子区域由数据流中包含的编码数据中编码的空间段或空间段组来限定。
另外的实施例提供了一种用于流复用的方法,该方法包括:
-接收视频流的视频图像的至少两个不同空间段或不同序列空间段组中的每一个的编码数据;以及
-将所述至少两个不同空间段中的每一个的编码数据封包到单独子流中。
另外的实施例提供了一种用于流解复用的方法,该方法包括:
-从单独子流组中选择性地提取至少两个单独子流,所述至少两个单独子流包含编码视频流的视频图像的不同空间段或不同序列空间段组的编码数据;以及
-将所述至少两个单独子流组合为包含编码视频流的视频图像的不同空间段或不同序列空间段组的编码数据的数据流。
另外的实施例提供了一种编码器,该编码器被配置为通过编码视频流的视频图像的至少两个不同空间段或不同序列空间段组来编码视频流的视频图像,使得编码数据包括至少两个切片。编码器可以被配置为提供指示是否满足编码约束的信令信息。当去除至少两个切片的至少一个切片头,同时关于编码顺序维持至少两个切片的第一切片的切片头并且使用第一切片头级联至少两个切片或至少两个切片的适当子集产生符合标准的数据流时,满足编码约束。
另外的实施例提供一组单独子流,其中单独子流中的每个包含编码视频流的视频图像的不同空间段或不同序列空间段组的编码数据。
有利的实施方式在从属权利要求中解决。
实施例提供了用于编码视频流的发射器。发射器包括编码阶段和流复用器。编码阶段被配置为对视频流的视频图像的至少两个不同空间段或不同序列空间段组进行编码,以获得至少两个不同空间段或不同序列空间段组中的每一个的编码数据。流复用器包括接收接口,该接收接口被配置为接收视频流的视频图像的至少两个不同空间段或不同序列空间段组中的每一个的编码数据。此外,流复用器包括数据流形成器,该数据流形成器被配置为将至少两个不同空间段中的每一个的编码数据封包到单独子流中,并在输出处提供单独子流。
在实施例中,发射器的编码阶段可以被配置为在空间段中构造视频流的视频图像并且单独编码空间段或序列(关于编码顺序排序)空间段组以获得空间段或序列空间段组中的每一个的编码数据。发射器的数据流形成器可以被配置为将空间段或序列空间段组中的每一个的编码数据封包到单独子流中,并在发射器输出处提供单独子流。
例如,发射器的编码阶段可以被配置为编码第一空间段或第一组序列空间段以获得第一编码数据,并且编码第二空间段或第二组序列空间段以获得第二编码数据。发射器的数据流形成器可以被配置为在第一子流或第一组子流中封包第一编码数据,并且在第二子流或第二组子流中封包第二编码数据。
在实施例中,发射器的编码阶段可以被配置为接收多个视频流,每个视频流包含视频图像的图像段,即,包含在多个视频流中的图像段一起形成视频图像。因此,编码阶段可以被配置为在空间段中构造视频流的视频图像,使得每个空间段或空间段组与视频流中的一个对应。
在实施例中,可以发射、广播或多播单独子流或单独子流组。
在实施例中,编码阶段可以被配置为单独编码至少两个不同空间段,使得至少两个不同空间段或不同序列空间段组中的每一个的编码数据是自身可解码的。例如,编码阶段可以被配置为使得在不同空间段之间不共享信息。换句话说,编码阶段可以被配置为对视频流进行编码,使得以这样的方式约束帧间预测,即,使得不从先前视频图像的不同空间段预测视频图像的空间段。
在实施例中,发射器的编码阶段可以被配置为对视频流的视频图像的至少两个不同空间段或不同序列空间段组进行编码,使得至少两个不同空间段或不同序列空间段组中的每一个的编码数据包括至少一个切片,其中发射器的数据流形成器可以被配置为将每个切片封包在一个单独子流中。
例如,发射器的编码阶段可以被配置为对每个空间段进行编码,使得每个空间段的编码数据包括一个切片,即,每个空间段一个切片。此外,发射器的编码阶段可以被配置为对每个空间段进行编码,使得每个空间段的编码数据包括两个或更多个切片,即,每个空间段两个或更多个切片。此外,发射器的编码阶段可以被配置为对每个序列空间段组进行编码,使得每个序列空间段组的编码数据包括一个切片,即,每组序列空间段(例如,两个或更多个空间段)一个切片。此外,发射器的编码阶段可以被配置为对每组序列空间段进行编码,使得每组序列空间段的编码数据包括两个或更多个切片,即,每组序列空间段(例如,两个或更多个空间段)两个或更多个切片,诸如每个空间段一个切片、每个空间段两个或更多个切片等。
在实施例中,发射器的数据流形成器可以被配置为将每个切片封包在一个单独子流中而没有切片头。例如,发射器的数据流形成器可以被配置为在将切片封包在单独子流中之前从切片中去除切片头。
在实施例中,数据流形成器可以被配置为提供包括合适的切片头和所需参数集的另外的单独流(或者多于一个,例如,不同的图像大小)。例如,合适的切片头可以包含引用新图像大小的参数集。
在实施例中,发射器的数据流形成器可以被配置为生成子流描述符,该子流描述符向每个单独子流指派唯一的子流标识。
例如,数据流形成器可以被配置为提供单独子流组,单独子流组包括单独子流和子流描述符,例如,包括子流描述符的节目映射表(例如,在节目映射表中,子流描述符可以被指派给每个子流,即,每个子流一个子流描述符)。子流描述符可以用于基于唯一的子流标识在单独子流组中找到单独子流。
在实施例中,发射器的数据流形成器可以被配置为生成用信号通知属于视频流的视频图像的子区域的子流标识的图案的子区域描述符,或者换句话说,对于至子区域的视频流的视频图像的至少一个空间细分中的每一个,用信号通知用于每个子区域的一个子流标识集合。
例如,数据流形成器可以被配置为提供一组单独子流,该组单独子流包括单独子流和子区域描述符,例如,包括子区域描述符的节目映射表。子区域描述符描述哪些子流包含编码空间段或序列空间段组的编码数据,这些空间段或序列空间段组一起形成视频流的视频图像的有效子区域(例如,连续子区域)。子区域描述符可以用于识别属于视频流的视频图像的合适子区域的子流的适当子集。
在实施例中,发射器的编码阶段可以被配置为将至少两个不同空间段或不同序列空间段组的编码数据组合到一个切片。发射器的数据流形成器可以被配置为在切片部分中的空间段边界处分割一个切片或一个切片的比特流,并且将每个切片部分封包在一个子流中。
在实施例中,可以以每个视频图像一个切片将至少两个不同空间段或不同序列空间段组编码到视频流中。因此,数据流形成器可以被配置为对于每个视频图像,将在其中编码有区块(tile)中的相应一个区块或区块组的切片的一部分封包到单独子流中,而对于至少两个区块或区块组中的至少一个没有切片的切片头。
例如,可以通过编码阶段对至少两个不同空间段或不同序列空间段组进行熵编码。因此,编码阶段可以被配置为对至少两个不同空间段或不同序列空间段组进行熵编码,使得至少两个不同空间段或不同序列空间段组中的每一个是自身可解码的,即,使得在至少两个不同空间段或不同序列空间段组与视频流的先前视频图像的其它至少两个不同空间段或不同序列空间段组之间不共享编码信息。换句话说,编码阶段可以被配置为在编码不同空间段中或不同空间段组的每一个之后重新初始化不同空间段或不同空间段组的熵编码。
在实施例中,发射器可以被配置为用信号通知流类型。
例如,第一流类型可以用信号通知根据在子区域描述符中找到的信息聚合单独子流产生符合标准的数据流。
例如,第二流类型可以用信号通知根据在子区域描述符中找到的信息聚合单独子流产生需要被修改或进一步处理的数据流,以获得符合标准的数据流的版本。
在实施例中,发射器的数据流形成器可以被配置为提供包括单独子流的传输流。传输流可以是例如MPEG-2传输流。
在实施例中,子流可以是基本流。根据替代实施例,多个子流可以通过一个基本流被共同传送。
在实施例中,视频流的视频图像的空间段可以是区块。例如,视频流的视频图像的空间段可以是HEVC区块。
在实施例中,发射器的编码阶段可以是符合标准的编码阶段。例如,发射器的编码阶段可以是符合HEVC(HEVC=高效视频编码)标准的编码阶段。
在实施例中,流复用器可以被配置为用信号通知两种流类型中的至少一种。第一流类型可以用信号通知与至子区域的视频流的视频图像的至少一个空间细分中的一个对应的单独子流的适当子集的组合产生符合标准的数据流。第二流类型用信号通知与至子区域的视频流的视频图像的至少一个空间细分中的一个对应的单独子流的适当子集的组合产生需要被进一步处理的数据流(例如,是否必须添加或修改头信息,或者是否必须调整参数集),以获得符合标准的数据流的版本。
在实施例中,对视频流的视频图像的至少两个不同空间段或不同序列空间段组进行编码,使得编码数据包括至少两个切片。因此,编码数据可以包括指示是否满足编码约束的信令信息,或者其中数据流形成器被配置为确定是否满足编码约束。当去除至少两个切片的至少一个切片头,同时关于编码顺序维持至少两个切片的第一切片的切片头并且使用第一切片头级联至少两个切片或至少两个切片的适当子集产生符合标准的数据流时,满足编码约束。流复用器可以被配置为根据编码约束用信号通知两种流类型中的至少一种(例如,如果满足编码约束则用信号通知第一流类型和/或否则用信号通知第二流类型)。此外,复用器可以被配置为即使满足编码约束,但是必须调整参数集以便获得符合标准的数据流时,也用信号通知第二流类型。
其它实施例提供接收器。接收器包括流解复用器和解码阶段。流解复用器包括数据流形成器和输出接口。数据流形成器被配置为从单独子流组中选择性地提取至少两个单独子流,所述至少两个单独子流包含编码视频流的视频图像的不同空间段或不同序列空间段组的编码数据,其中数据流形成器被配置为将至少两个单独子流组合为包含编码视频流的视频图像的不同空间段或不同序列空间段组的编码数据的数据流。输出接口被配置为提供数据流。解码阶段被配置为对包含在数据流中的编码数据进行解码,以获得视频流的视频图像的至少两个不同空间段。
在实施例中,解码数据流的解码阶段可以仅解码视频流的视频图像的子区域,该子区域由数据流中包含的编码数据中编码的空间段或空间段组来限定。
在实施例中,接收器可以被配置为例如从上述发射器接收单独子流组,单独子流组包括单独子流。单独子流中的每一个可以包括编码视频流的视频图像被构造在其中的、多个空间段中的空间段或序列空间段组的编码数据。
在实施例中,接收器的数据流形成器可以被配置为从单独子流组中选择性地提取单独子流的适当子集,单独子流的适当子集包含编码视频流的视频图像的空间段或序列空间段组的适当子集的编码数据。接收器的数据流形成器可以被配置为将从单独子流组中提取出的单独子流组合为包含编码视频流的视频图像的空间段或不同序列空间段组的适当子集的编码数据的新数据流。接收器的解码阶段可以被配置为对包含在数据流中的编码数据进行解码,以获得视频流的视频图像的空间段或序列空间段组的适当子集。
例如,接收器的数据流形成器可以被配置为仅选择性地提取包含在单独子流组中的多个单独子流中的一部分,并将从中提取的单独子流组合为新数据流。由于从单独子流组中提取的单独子流仅包含视频流的视频图像被构造在其中的空间段的一部分,因此从单独子流组中提取的单独子流组合成的新数据流也包含仅编码视频流的视频图像被构造在其中的空间段的一部分的编码数据。
在实施例中,接收器的解码阶段可以被配置为对仅包含在多个单独子流的提取子集中包含的编码数据的数据流进行解码,从而解码视频流的视频图像的子区域,视频图像的子区域小于视频图像,并且子区域由在多个单独基本流的提取子集中包含的编码数据中编码的空间段来限定。
在实施例中,接收器的数据流形成器可以被配置为从单独子流组中提取子区域描述符,子区域描述符用信号通知属于视频流的视频图像的子区域的子流标识的图案,其中数据流形成器可以被配置为使用子区域描述符选择要从单独子流组中提取的子流的子集。
例如,接收器的数据流形成器可以被配置为从单独子流组中提取子区域描述符,例如,包括子区域描述符的节目映射表。子区域描述符描述哪些子流包含编码空间段或序列空间段组的编码数据,这些空间段或序列空间段组一起形成视频流的视频图像的有效子区域(例如,连续子区域)。基于子区域描述符,接收器的数据流形成器可以选择属于视频流的视频图像的合适子区域的、用于提取的子流的适当子集。
在实施例中,接收器的数据流形成器可以被配置为从单独子流组中提取子流标识符,该子流标识符向每个单独子流指派唯一的子流标识,其中数据流形成器可以被配置为使用子流描述符定位(localize)要从单独子流组中提取的子流的子集。
例如,接收器的数据流形成器可以被配置为从单独子流组中提取子流描述符,例如,包括子流描述符的节目映射表。基于向每个单独子流指派唯一子流标识的子流描述符,接收器的数据流形成器可以在单独子流组中识别(例如,找到或定位)单独子流。根据替代实施例,适配字段(adaptation field)中的描述符用于识别属于某个子流的数据包。
在一些实施例中,接收器可以包括数据流处理器127。数据流处理器可以被配置为如果由数据流形成器122提供的数据流126不符合标准,即,不能由解码阶段124解码,则进一步处理数据流126,以获得数据流126的处理版本126'(即,符合标准的版本)。如果需要进一步处理,则发射器100可以在流类型中用信号通知。
例如,第一流类型可以用信号通知根据在子区域描述符中找到的信息聚合单独子流产生符合标准的数据流。因此,如果用信号通知第一流类型,则不需要进一步处理数据流126,即,可以绕过数据流处理器127,并且解码阶段124可以直接解码由数据流形成器122提供的数据流126。第二流类型可以用信号通知根据在子区域描述符中找到的信息聚合单独子流产生需要被修改或进一步处理的数据流,以获得符合标准的数据流的版本。因此,如果用信号通知第一流类型,则需要进一步处理数据流126,即,在这种情况下,数据流处理器127可以进一步处理数据流126以获得数据流126的处理版本126'(即,符合标准的版本)。
在实施例中,流解复用器可以被配置为从至少两种流类型中识别用信号通知的单独子流组的流类型。第一流类型可以指示与至子区域的视频流的视频图像的至少一个空间细分中的一个对应的单独子流的适当子集的组合产生符合标准的数据流。第二流类型指示与至子区域的视频流的视频图像的至少一个空间细分中的一个对应的单独子流的适当子集的组合产生需要进一步处理的数据流,以获得符合标准的数据流的版本。流解复用器可以包括数据流处理器,该数据流处理器被配置为使用包含在单独子流组中的至少一个子流中的处理信息来进一步处理数据流,以获得数据流的符合标准的版本。
在实施例中,单独子流组可以是传输流。传输流可以是例如MPEG-2传输流。
在实施例中,子流可以是基本流。
在实施例中,视频流的视频图像的空间段可以是区块。例如,视频流的视频图像的空间段可以是HEVC区块。
在实施例中,接收器的数据流形成器可以被配置为将从单独子流组中提取出的单独子流组合为符合标准的数据流。数据流可以是例如符合HEVC标准的数据流。
在实施例中,接收器的解码阶段可以是符合标准的解码阶段。例如,接收器的解码阶段可以是符合HEVC标准的解码阶段。
在实施例中,由发射器的编码阶段提供的编码数据形成编码视频流。
在实施例中,编码视频流包括使用至少两个切片编码视频流的视频图像的至少两个不同空间段或不同序列空间段组的编码数据。编码视频流包括指示是否满足编码约束的信令信息,其中当去除至少两个切片的至少一个切片头,同时关于编码顺序维持至少两个切片的第一切片的切片头并且使用第一切片头级联至少两个切片或至少两个切片的适当子集产生符合标准的数据流时,满足编码约束。
例如,信令信息可以指示视频图像的第一切片和所有其它切片的切片头的语法元素的值在去除除第一切片的切片头之外的所有切片头并且级联数据产生符合标准的编码视频流的程度上是类似的。
在实施例中,信令信息以视频可用性信息或补充增强信息中的标记的形式存在于编码视频数据流中。
在实施例中,编码视频流(例如,由编码阶段提供)可以包括每个视频图像的多于一个切片(例如,每个空间段一个具有相应切片头的切片)和指示不同空间段满足编码约束的信令信息,诸如,使用相同的参考结构或切片类型,即,相应切片头的语法元素是相似的(例如,切片类型),其方式是仅需要第一切片头并且如果该单个切片头与对应于多于一个空间段的任何数量的切片有效载荷数据级联;所得到的流是符合的视频流,前提是只要适当的参数集被前置到流之前(即,只要参数集例如被修改)。换句话说,如果存在信令信息,则可以剥离除第一切片之外的所有切片头,并且在没有它们的切片头的情况下级联第一切片和所有其它切片产生符合标准的编码视频流。在HEVC的情况下,上述约束的信令信息可以以视频可用性信息(VUI)或补充增强信息(SEI)中的标记的形式存在于编码视频流中。
根据本申请的第二方面,本发明的目的是提供一种概念,其允许以允许在接收侧更容易处理的方式发送仅与原始图像的段相关的子流或部分数据流。
该目的通过第二方面的独立权利要求解决。
根据第二方面,以允许在接收侧更容易处理的方式发送仅与原始图像的段相关的子流或部分数据流通过以下来实现:向形成被参数化以便编码第一图像的自包含数据流的第一集合的一个或多个NAL单元添加第二集合的一个或多个NAL单元,第一集合的NAL单元是从第一集合的一个或多个NAL单元类型中选择的,第二集合的一个或多个NAL单元中的每一个是第二集合的一个或多个预定NAL单元类型中的一个,与第一集合不相交,并且被确定为导致传统(legacy)解码器忽略相应的NAL单元。因此,通过对传统解码器透明地呈现部分数据流的原始版本的部分,可以保留该部分,该部分在从部分数据流重建特定段时会干扰传统解码器,但无论如何对这些原始部分感兴趣的处理装置可以推导它们。
附图说明
本文参考附图描述本发明的实施例。
图1示出了根据实施例的发射器的示意性框图;
图2示出了根据实施例的接收器的示意性框图;
图3示出了以多个区块构造的视频流的视频图像的说明性视图,以及由多个区块的适当子集限定的视频图像的子区域的说明性视图;
图4示出了传输流解复用器的示意性框图;
图5示出了以多个区块构造的视频流的视频图像的说明性视图,以及当作为单独基本流发送时形成符合的比特流的单个区块和区块组合的说明性视图;
图6示出了以多个区块构造的视频流的视频图像的说明性视图,以及由多个区块的适当子集限定的视频图像的子区域以及用于该子区域的区块的偏移图案的说明性视图;
图7示出了根据实施例的用于流复用的方法的流程图;
图8示出了根据实施例的用于流解复用的方法的流程图;
图9示出了图示图像或视频被编码成为数据流的示意图,该图像或视频在空间上被划分成两个段,使得产生两个片段,每个片段一个段,准备复用到段特定的部分数据流上;
图10图示了根据实施例的图9的片段的NAL单元结构,以便图示妨碍将其中一个片段切掉直接作为自包含的段特定的数据流的情况;
图11a和11b图示了通过修改参数集NAL单元和/或切片NAL单元从图10中的对应片段导出的自包含的段特定的数据流;
图12示出了流格式化器及其操作模式的示意性框图,在该操作模式下,流格式化器将图9的数据流分布到两个部分数据流上,每个段一个,其中一个部分数据流准备好由传统解码器进行处理,用于将对应的段重建为自包含的图像,这通过将特定NAL单元添加/***到图11a和11b中所绘出的修改后的部分数据流中来实现;
图13示出了处理装置及其操作模式的示意性框图,在该操作模式下,处理装置再次使用对传统解码器透明的***的特殊NAL单元从图12的部分数据流重建自包含数据流302';
图14示出了图12的特殊类型的添加的NAL单元的示例,即,其携带关于传统解码器隐藏的隐藏NAL单元;
图15图示了示出根据图12添加的第二类型的NAL单元的机制的示意图,这些NAL单元形成隐藏指令以忽略对应数据流中的后续NAL单元,该隐藏指令被传统解码器忽略;以及
图16示出了图示流格式化器的场景的示意图,该流格式化器以类似于图12的方式将数据流分布到部分数据流上,即,其中一个被转换为准备好由传统解码器处理的自包含数据流,用于从中将对应的段重建为自包含图像;附加地准备部分数据流,其方式是使得如由指令所指示的那样级联该部分数据流,该指令是通过***的并假定由于是不允许的NAL单元类型而被传统解码器忽略的特定NAL单元用信号通知的;还产生符合传统的数据流,该数据流可能经过传统解码器的解码以重建整个图像;这里,使用形成隐藏指令的NAL单元来忽略后续NAL单元的一部分;以及
图17示出了比图16更详细地图示通过部分跳过在图16的实施例中使用的NAL单元用信号通知的修改和指令机制的示意图。
具有相同或等同功能的一个或多个相同或等同元素在以下描述中由相同或等同的附图标记表示。
具体实施方式
在以下描述中,阐述了许多细节以提供对本发明实施例的更彻底的解释。但是,对于本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下实践本发明的实施例。在其它情况下,众所周知的结构和设备以框图形式示出而不是详细示出,以避免模糊本发明的实施例。此外,除非另外特别说明,否则下文描述的不同实施例的特征可以彼此组合。
虽然在以下描述和对应附图中,发射器和接收器、包括编码阶段和流复用器的发射器、以及包括流解复用器和解码阶段的接收器作为示例被讨论和示出并仅用于说明的目的,但是应该指出,本发明的实施例分别涉及流复用器和流解复用器。即,当实践本发明的实施例时,可以省略编码阶段和解码阶段。
图1示出了根据本发明实施例的发射器100的示意性框图。发射器100包括流复用器103和编码阶段104。编码阶段104被配置为编码视频流102的视频图像110的至少两个不同空间段108或不同序列(subsequent)空间段108组以获得至少两个不同空间段108或不同组的序列空间段108中的每一个的编码数据112。流复用器103包括接收接口105和数据流形成器106。接收接口105被配置为接收编码在编码数据中的视频流的视频图像的至少两个不同空间段或不同组的序列空间段中的每一个的编码数据。数据流形成器106被配置为将至少两个不同空间段108或不同组的序列空间段中的每一个的编码数据112封包到单独子流114中,并且在发射器输出处提供单独子流。
发射器100的编码阶段104可以被配置为以空间段108构造视频流的视频图像110。例如,编码阶段104可以被配置为以N×M个空间段108构造视频流的视频图像110。N可以是描述视频流102的视频图像110被构造在其中的列的数量的自然数。M可以是描述视频流102的视频图像110被构造在其中的行的数量的自然数。因此,N和M中的一个可以大于或等于2,其中N和M中的另一个可以大于或等于1。
如图1中的示例所示,编码阶段104可以被配置为以四列(N=4)和三行(M=3),即,以十二个空间段108构造视频流102的视频图像110。
发射器100的编码阶段104可以被配置为对第一空间区段(例如,空间段108_1,1)或第一组连续空间段(例如,空间段108_1,1和108_1,2)进行编码以获得第一编码数据(例如,编码数据112_1),并且对第二空间段(例如,空间段108_1,2)或第二组连续空间段(例如,空间段108_1,3和108_1,4)进行编码以获得第二编码数据(例如,编码数据112_2)。发射器的数据流形成器可以被配置为将第一编码数据封包在第一子流(例如,子流114_1)或第一组子流(例如,子流114_1和114_2)中,并且将第二编码数据(例如,编码数据112_2)封包在第二子流(例如,第二子流114_2)或第二组子流中。
如图1中的示例所示,发射器100的编码阶段104可以被配置为单独编码每个空间段108,以获得每个空间段108的编码数据,其中发射器100的数据流形成器106可以被配置为将每个编码数据112封包在一个单独子流114中,即,每个空间段一个编码数据和每个编码数据一个子流。但是,发射器100的编码阶段104也可以被配置为单独编码序列空间段组,以获得每个序列空间段组的编码数据,即,每个序列空间段组(即,两个或更多个序列空间段)一个编码数据。此外,发射器100的数据流形成器106还可以被配置为将每个编码数据112封包在多于一个单独子流中,即,每个编码数据一组单独子流(即,两个或更多个单独子流)。
发射器100的数据流形成器106可以被配置为(在其输出处)提供包括单独子流114的单独子流组116。
可以发射、广播或多播单独子流或单独子流组。
图2示出了根据实施例的接收器120的示意性框图。接收器120包括流解复用器121和解码阶段。流解复用器包括数据流形成器122和输出接口123。数据流形成器122被配置为从单独子流组116中选择性地提取至少两个单独子流114,所述至少两个单独子流114包含视频流102的视频图像110的不同空间段108或不同组的序列空间段108的编码数据,其中数据流形成器122被配置为将至少两个单独子流114组合为包含编码视频流102的视频图像110的不同空间段108或不同组的序列空间段108的编码数据的数据流126。输出接口123被配置为提供数据流126。解码阶段124被配置为解码包含在数据流126中的编码数据,以获得视频流102的视频图像110的至少两个不同空间段108或不同组的序列空间段108。
通过解码数据流126,解码阶段124可以仅解码视频流的视频图像的子区域109,子区域109由数据流中包含的编码数据中编码的空间段或空间段组限定,例如108_1,1和108_1,2。
单独子流组116可以包括多个单独子流114,每个单独子流编码视频流的视频图像被构造在其中的多个空间段的不同空间段或不同组的序列空间段。例如,视频流的视频图像110可以在N×M个空间段108中构造。N可以是描述视频流102的视频图像110被构造在其中的列的数量的自然数。M可以是描述视频流102的视频图像110被构造在其中的行的数量的自然数。因此,N和M中的一个可以大于或等于2,其中N和M中的另一个可以大于或等于1。
接收器120的数据流形成器122可以被配置为从单独子流组116中选择性地提取单独子流的适当子集(例如,子流114_1和114_2),单独子流的适当子集包含编码视频流102的视频图像110的空间段的适当子集(例如,空间段108_1,1和108_1,2)或序列空间段组(例如,第一组序列空间段108_1,1和108_1,2和第二组序列空间段108_1,3和108_1,4)的编码数据。接收器120的数据流形成器122可以被配置为将从单独子流组116中提取出的单独子流(例如,子流114_1和114_2)组合为新数据流126,该新数据流126包含编码视频流102的视频图像110的空间段的适当子集(例如,空间段108_1,1和108_1,2)或序列空间段组(例如,第一组序列空间段108_1,1和108_1,2和第二组序列空间段108_1,3和108_1,4)的编码数据。
接收器120的解码阶段124可以被配置为对包含在数据流126中的编码数据进行解码,以获得视频流102的视频图像110的空间段的适当子集(例如,空间段108_1,1和108_1,2)或序列空间段组(例如,第一组序列空间段108_1,1和108_1,2和第二组序列空间段108_1,3和108_1,4),即,由数据流126中包含的编码数据中编码的空间段或空间段组限定的视频流的视频图像110的子区域109。
如图2中的示例所示,由图1中所示的发射器100提供的单独子流组116包括十二个单独子流114_1至114_12。单独子流114_1至114_12的每个包含编码视频流102的视频图像110被构造在其中的十二个空间段108中的一个的编码数据,即,每个编码数据一个空间段和每个子流一个编码数据。数据流形成器122可以被配置为仅提取十二个单独子流114_1至114_12中的第一单独子流114_1和第二单独子流114_2。第一单独子流114_1包括编码视频流的视频图像110的第一空间段108_1,1的编码数据,其中第二单独子流114_2包括编码视频流的视频图像110的第二空间段108_1,2的编码数据。此外,数据流形成器122可以被配置为组合第一单独子流114_1和第二单独子流114_2,以获得新数据流126,新数据流包含编码视频流的视频图像的第一空间段108_1,1和第二空间段108_1,2的编码数据。因此,通过解码新数据流126,解码阶段获得视频流的视频图像的第一空间段108_1,1和第二空间段108_1,2,即,仅由数据流126中包含的编码数据中编码的第一空间段108_1,1和第二空间段108_1,2限定的视频流的视频图像110的子区域109。
在一些实施例中,接收器120可以包括数据流处理器127。数据流处理器可以被配置为,如果由数据流形成器122提供的数据流126不符合标准,即,不可由解码阶段124解码,则进一步处理数据流126,以获得数据流126的处理版本126'(即,符合标准的版本)。如果需要进一步处理,则可以由发射器100以流类型进行信号通知。第一流类型可以表示或指示根据子区域描述符中找到的信息聚合单独子流产生符合标准的数据流。因此,如果用信号通知第一流类型,则不需要进一步处理数据流126,即,可以绕过数据流处理器127,并且解码阶段124可以直接解码由数据流形成器122提供的数据流126。第二流类型可以表示或指示根据子区域描述符中找到的信息聚合单独子流产生的数据流需要被修改或进一步处理,以获得符合标准的版本的数据流。因此,如果用信号通知第二流类型,则需要进一步处理数据流126,即,在这种情况下,数据流处理器127可以进一步处理数据流126以获得数据流126的处理版本126'(即,符合标准的版本)。数据流处理器127可以使用包含在数据流126中的附加信息,例如,包含在子流组的子流114s和114p中的一个中的附加信息,来执行附加处理。子流114s可以包含一个或多个切片头,其中子流114p可以包含一个或多个参数集。如果子流组包含子流114s和114p,则数据流形成器122也可以提取这些子流。
换句话说,数据流126可能需要附加处理,以便被形成为符合标准的数据流,该符合标准的数据流可以由解码阶段124如通过流类型所指示的那样被正确解码,即,在流类型(例如,如下所述的第一新流类型和第二新流类型)中指示是否需要进一步处理。该处理包括使用附加信息,该附加信息或者由编码阶段104放入到编码数据112中或者由数据流形成器106放入到子流114的一个中,并且随后被包含在数据流126中。通过使用附加信息,数据流处理器127具体调整数据流126中的编码参数(例如,参数集)和切片头,以反映待由123输出的116的实际子集,即,例如,在图像大小方面与112不同的数据流。
在以下描述中,示例性地假设编码阶段是HEVC编码阶段并且解码阶段是HEVC解码阶段。但是,以下描述也分别适用于其它编码和解码阶段。
此外,在以下描述中,示例性地假设单独子流组是传输流(例如,MPEG-2传输流),其中单独子流组的单独子流是基本流。
可以使用“区块(tile)”概念生成HEVC比特流,其破坏图像内预测依赖性(包括熵解码依赖性)。由编码器为每个这样的区块生成的数据可以被单独处理,例如,可以由一个处理器/核心处理。如果使用区块,则整个视频被构造为N×M个区块的矩形图案。可选地,每个区块可以被包括在不同切片中,或者许多区块可以被包括在同一切片中。可以以在不同区块之间不共享信息的方式配置编码器。对于某些用例,比如,呈现从大的全景中获取的较小窗口(即,感兴趣区域(RoI)),仅需要解码区块的子集。特别地,HEVC比特流可以以这样的方式编码,即,使得帧间预测以图像的区块不从先前图像的不同区块预测的方式被约束。
在本文中,允许解码区块或区块的子集的比特流的一部分被称为子流。子流可以包括切片头,该切片头指示完整全景内的区块的原始位置。为了使用现有的硬件解码器,可以通过在解码之前调整指示区块位置的数据将这种子流转换成符合HEVC标准的比特流。另外,当将子流转换为新的比特流126或126'时,也可以调整对切片头中的图像参数集(pps_id)的参考。因此,通过间接参考序列参数集,可以调整诸如图像大小的参数,并且产生符合HEVC标准的比特流。
如果包括所有区块的编码数据的整个比特流经由广播信道被发送到接收器,则能够解码较小RoI的接收器可能无法处理与完整全景对应的大量数据。存在用于广播的不同传输协议,其中MPEG-2传输流(TS)被广泛使用。在MPEG-2***标准中,TS被指定为具有固定长度的数据包序列,其携带用于识别复用流中的不同ES的PID(数据包标识符)。PID 0用于携带PAT(节目关联表),其通过指示每个PMT的PID指向一个或多个PMT(节目映射表)。在PMT内,节目映射部分用于表示属于节目的ES的属性。但是,对于所有ES的描述,这些部分限于1021个字节,这通常包括视频并且可能包括多个音频流或字幕信息,因此子流和子区域信息必须非常紧凑。
MPEG-2TS当前提供用于在包含完整全景的基本流(ES)中发送的HEVC编码视频比特流的信令。但是,包括在TS中的信令指示解码整个比特流所需的配置文件/层/级别以及解码器的能力是否不足以解码具有如此高级别的比特流,非常可能的是,如果目标显示器分辨率远小于整个全景,接收器将不会开始解码。
在实施例中,比特流可以被分割成单独ES,客户端可以从单独ES中选择解码RoI所需的子集。在后面描述在适配字段中使用描述符的替代选项,其中一个ES传送多于一个子流。在任何情况下,这种子流的子集被称为子区域。在这种情况下,当前MPEG-2TS标准不提供用信令来告诉解码器子区域符合哪个级别。接收器也不能找出需要组合哪些ES集合以便解码特定子区域。可以使用不同的子区域大小,即,子区域集合可以由某个数量的行和列组成,而另一个子区域集合可以由不同数量的行和列组成。下文将它们称为不同的子区域布局。
图3示出了以多个区块108构造的视频流的视频图像110的说明性视图,以及由多个区块108的适当子集限定的视频图像110的子区域109的说明性视图。从多个区块108,可以聚集适当子集以获得视频图像的子区域109。举例来说,图3中所示的视频图像110被构造成N=6列和M=5行(或排),即,以NxM=30个区块。每个区块108的位置可以通过索引h和v来描述,其中h描述行并且v描述列。从这30个区块中可以聚集9个区块并形成视频图像的子区域109。
在实施例中,流发送器可以生成作为单独ES被包括在TS116中的子流114。在ES内部,每个编码图像可以被封装在PES(封包化基本流)数据包中。存在生成子流的若干选项。
例如,根据第一选项,发射器100可以每个子流(即,一个区块108或固定组的序列区块108)生成一个切片,并将每个切片的切片数据封包到PES数据包中,从而建立每个子流的单独ES。
根据第二选项,发射器100可以每个子流生成一个切片,并且流复用器103可以在将每个切片的切片数据封包到PES数据包中之前剥离所有切片头,从而建立每个子流114的单独ES。此外,发射器100可以生成另外的单独子流114s,例如,单独ES,其提供合适的切片头,当该切片头与切片数据组合时,产生符合HEVC的比特流。
根据第三选项,发射器100可以仅生成包含所有区块的一个切片并且在区块边界处分割比特流。构成子流的数据部分可以被封包到PES数据包中,从而建立每个子流的单独ES。此外,发射器100可以生成另外的单独子流114s,例如,单独ES,其提供合适的切片头,当该切片头与切片数据组合时,产生符合HEVC的比特流。
根据第四选项,发射器100可以每个子流生成一个切片并且引入信令信息(例如,以VUI(视频可用性信息)或SEI(补充增强信息)中的标志的形式),该信令信息指示允许去除除第一切片之外所有切片的切片头的约束,并且流复用器103基于对该信令信息的解析在将每个切片的切片数据封包到PES数据包中之前剥离所有切片头,从而建立每个子流114的单独ES。此外,发射器100可以生成另外的单独子流114s,例如,单独ES,其提供合适的切片头,当该切片头与切片数据组合时,产生符合HEVC的比特流。
在第二和第四选项中,流复用器(103)可以将每个视频图像(每个DTS(解码时间戳))的单个切片头添加到另外的流114s,即,可以存在另外的流中的PES数据包包含单个切片头的约束,使得解复用器可以容易地重新布置PES数据包而不必检测视频图像边界。
在第一选项中,发射器100还可以生成单独子流114s,例如,单独ES,其提供由一个或多个参数集或适当信息组成的附加数据,诸如包含参数集和补充信息和关于它们与子区域的关联的信息的语法构造,以导出参数集,当该参数集与切片数据组合时,允许执行由数据流处理器127执行的提取处理,其然后产生符合的比特流。
在第二、第三和第四选项中,发射器100还可以在相同的单独子流114,例如,单独ES中包括一个或多个附加参数集,或生成附加的单独子流114p,例如,包括(仅)这些参数集的单独ES。
在第一种情况下,由向后兼容(左上)区块108_1,1和可选地一起形成矩形区域的序列区块组成的子流114可以使用HEVC流类型和HEVC标准中指定的用于HEVC的传统描述符。
第一新流类型可以表示ES包含子流。该第一新流类型表示根据如下所述的子区域描述符中找到的信息的ES的聚合产生符合的比特流。
此外,第二新流类型可以表示ES包含子流。该第二新流类型表示根据如下所述的子区域描述符中找到的信息的ES的聚合产生在被解码之前需要由如下所指定的处理进行修改的比特流。
该信息可以足以允许在TS解复用器(TSDemux)中从合适子流集合聚合子区域,如将从下面图4的讨论中更清楚可见的。
图4示出了根据实施例的传输流解复用器121的示意性框图。传输流解复用器121可以被配置为使用三个缓冲区140、142和144的链来重建每个基本流114。在每个链中,第一缓冲区140“TB”(即,传输缓冲区)可以被配置为如果传输数据包的PID与针对某个ES在PMT中找到的值匹配,则存储该传输数据包。仅对于视频流存在的第二缓冲区142“MB”(即,复用缓冲区)可以被配置为通过剥离TS数据包头来聚集序列TS数据包的有效载荷,从而建立PES数据包。第三缓冲区144“SB”(子流缓冲区)可以被配置为聚集ES数据。在实施例中,第三缓冲区144中的数据可以属于某个子流114,并且可以聚集多个子流缓冲区的数据以形成子区域的编码表示。哪一组ES需要以哪种顺序被聚合通过下面指定的描述符中传送的信息发信号通知,该描述符在那个节目的PMT中找到。
详细地说,下面指定的描述符是扩展MPEG-2***标准中指定的描述符集。描述符的类型和长度由头字节提供,这些字节未在以下语法表中示出。
随后描述子流信令。
对于包含子流的每个ES(即,区块或固定组的序列区块),新限定的子流描述符向该子流指派SubstreamID(子流标识)。它可选地包含形成子区域所需的附加SubstreamID或通过在子区域描述符中找到的偏移阵列来指示这些附加SubstreamID的图案的索引。
以下语法(语法No.1)可以用于子流描述符:
子流描述符可以以三个不同版本被使用,每个版本都用信号通知SubstreamID:
根据第一版本,如果它的大小只有一个字节(排除了前面的头字节),它表示PatternReference的0值(参考如下所述的子区域描述符中的SubstreamOffset[k][0][i])。
根据第二版本,如果ReferenceFlag被设置为“1”,则它指定用于计算附加SubstreamID的图案的索引(索引0除外)。
根据第三版本,如果ReferenceFlag被设置为“0”,则它直接指定附加SubstreamID。
可以在子区域描述符中找到值SubstreamCountMinus1。
图5示出了以多个区块108构造的视频流的视频图像110的说明性视图,以及当作为单独基本流发送时形成符合的比特流的单个区块和区块组合的说明性视图。如图5所示,单个区块或固定集合的序列区块(即,关于编码顺序的序列)可以作为单独基本流被发送,其中i是substreamID。此外,如图5所示,当作为单独基本流发送时,第一区块可以形成符合的比特流,整个全景可以形成符合的比特流,第一和第二区块可以形成符合的比特流,区块1到N可以形成符合的比特流,区块1到2N可以形成符合的比特流,区块1到Z=NxM可以形成符合的比特流。
因此,N可以在字段SubstreamIDsPerLine中的子区域描述符中用信号通知,其中Z可以在字段TotalSubstreamIDs中的子区域描述符中用信号通知。
随后,描述子区域信令。
一个新限定的子区域描述符可以与整个节目相关联。子区域描述符可以用信号通知属于子区域109的SubstreamID的图案。它可以用信号通知不同的布局,布局例如由不同数量的子流114组成,并且指示每个图案的级别。LevelFullPanorama的值可以指示整个全景的级别。
以下语法可以用于子区域描述符:
这种语法可以以以下方式通过标志SubstreamMarkingFlag扩展,该标志用信号通知子流标记的两个选项之一:
a)每个子流与个别基本流相关联,并且通过经由PMT中的SubstreamDescriptors的映射来识别子流,如上文已经讨论过的;
b)多个子流在共同的基本流中传输,并且通过在携带PES数据包的开始的传输数据包的适配字段中找到的af_substream_descript来识别子流,该替代方案将在下面更详细地讨论。
然后以下语法可以用于子区域描述符:
因此,N1可以是可以从整个全景中选择的、通过l进行索引的不同子区域布局的数量。它的值可以由描述符大小隐含给出。PictureSizeHor[l]和PictureSizeVert[l]可以指示以像素为单位测量的水平和垂直子区域维度。
图6示出了以多个区块108构造的视频流的视频图像110的说明性视图,以及由多个区块108的适当子集限定的视频图像110的子区域109以及该子区域的区块的偏移图案的说明性视图。图6中所示的视频图像110被构造成N=6列并且M=5行(或排),即以NxM=30个区块,其中从30个区块可以聚集9个区块并形成视频图像110的子区域109。
对于图6中所示的示例,3x3子流的子区域的偏移图案可以由以下阵列来指示:
SubstreamOffset[0]:1
SubstreamOffset[1]:2
SubstreamOffset[2]:N
SubstreamOffset[3]:N+1
SubstreamOffset[4]:N+2
SubstreamOffset[5]:2N
SubstreamOffset[6]:2N+1
SubstreamOffset[7]:2N+2
类似地,2x2子流的子区域的偏移图案可以由以下阵列来指示:
SubstreamOffset[0]:1
SubstreamOffset[1]:N
SubstreamOffset[2]:N+1
随后描述子区域组装。
存取子区域的过程或方法可以包括在接收器侧基于级别指示或子区域维度从子区域描述符中选择合适的子区域大小的第一步骤。该选择隐含地产生值l。
此外,存取子区域的过程或方法可以包括基于SubstreamID选择包含待被显示的区域的左上子流(读取所有子流描述符)的ES的步骤。
此外,存取子区域的过程或方法可以包括检查适用的子流描述符是否提供PatternReference的步骤。利用该PatternReference,它选择适用的SubstreamOffset值:
SubstreamOffset[k][PatternReference][l]
其中,0<k<SubstreamCountMinus1[l]
此外,存取子区域的过程或方法可以包括如果不存在PatternReference则将对索引的引用默认为0的步骤,这意味着描述符大小等于1。
可能存在不适合形成子区域的左上子流的ES,例如,因为该ES位于全景的右边缘或底边缘。这可以通过大于PatternCount[l]-1的PatternReference值来发信号通知,这意味着没有指派SubstreamOffset值。
此外,存取子区域的过程或方法可以包括如下步骤:如果满足所述条件,则对于具有指示SubstreamID等于SubstreamIDx的子流描述符的ESx的每个PES数据包执行以下操作:
-如果PreambleCount[l]>0:则在具有相同ES的DTS的PES数据包之前加上指示SubstreamID等于PreambleSubstreamID[j][l]的子流描述符。组装的比特流中的PES数据包的顺序通过增加索引j的值来给出。
-如果SubstreamCountMinus1[l]>0:则在解码之前,在具有相同ES的DTS的PES数据包之前加上在ESx resp.SubstreamIDx+SubstreamOffset[k][j]的子流描述符中给出的指示SubstreamID等于AdditionalSubstreamID[l]的子流描述符(SubstreamOffset阵列在子区域描述符中找到,其中j由ESx的子流描述符中的PatternReference的值给出,并且k的范围是从0到SubstreamCountMinus1[l])。
组装的比特流中的PES数据包的顺序通过增加SubstreamID的值来给出,这也对应于增加索引k的值。
图7示出了根据实施例的用于流复用的方法200的流程图。方法200包括接收视频流的视频图像的至少两个不同空间段或不同组的序列空间段中的每一个的编码数据的步骤202。此外,方法200包括将至少两个不同空间段中的每一个的编码数据封包到单独子流中的步骤204。
图8示出了用于流解复用的方法220的流程图。方法220包括从单独子流组中选择性地提取至少两个单独子流的步骤222,所述至少两个单独子流包含编码视频流的视频图像的不同空间段或不同组的序列空间段的编码数据。此外,该方法包括将至少两个单独子流组合为包含编码视频流的视频图像的不同空间段或不同组的序列空间段的编码数据的数据流的步骤224。
简要总结以上内容,已经描述了流解复用器121,其包括数据流形成器122,数据流形成器122被配置为从单独子流组116中选择性地提取至少两个单独子流,所述至少两个单独子流114包含编码图像110的不同空间段108或不同组的序列空间段108的编码数据。编码数据源自视频流102或者是视频流102的。它们是通过流复用器103中的流复用从其获得的。数据流形成器122被配置为将至少两个单独子流114组合为数据流126,数据流126包含编码提取出的至少两个单独子流114的视频流102的视频图像110的不同空间段108或不同组的序列空间段108的编码数据。数据流126在流解复用器121的输出接口123处提供。
如上所述,单独子流组116由包括TS数据包的广播传输流组成。单独子流组116包括多个单独子流114,这些单独子流114包含编码视频流102的不同空间段108或不同组的序列空间段108的编码数据。在上述示例中,每个单独子流与图像区块相关。节目映射表也由单独子流组116组成。流解复用器121可以被配置为针对多个单独子流114中的每一个从节目映射表得出流标识符并且使用上述示例中被称为SubstreamID的相应流标识符在广播传输流中区分多个单独子流114中的每一个。例如,流解复用器121从在广播传输流中的数据包标识符零的数据包内传送的节目关联表中得出预定的数据包标识符,并从具有预定数据包标识符的广播传输流的数据包中得出节目映射表。即,PMT可以在TS数据包内传送,该TS数据包的数据包ID等于在感兴趣的节目(即,全景内容)的PAT中指示的预定数据包ID。根据上述实施例,每个子流114被包含在单独基本流中,即,在相互不同的数据包ID的TS数据包内。在这种情况下,节目映射表唯一地将例如每个流标识符与相应的数据包标识符相关联,并且流解复用器121被配置为从具有与相应的单独子流的流标识符相关联的数据包标识符的广播传输流的数据包中解包多个单独子流114中的每一个。在这种情况下,子流114的子流标识符和数据包标识符是准同义词,只要在PMT中存在其之间的双射映射即可。在下文中,描述了一种替代方案,其中使用经由一个基本流的TS数据包的数据包头中的适配字段标记子流114的NAL单元的概念将子流114复用到基本流中。特别地,包含子流114的一个或多个NAL单元的任何PES数据包的开始落入其有效载荷部分中的一个基本流的TS数据包的数据包头被提供有适配字段,该适配字段又被提供有相应的一个或多个NAL单元所属的子流的子流ID。稍后,将示出该适配字段还包括与子流描述符相关的信息。根据该替代方案,流解复用器121被配置为从具有节目映射表中指示的数据包标识符的广播传输流的数据包中解包NAL单元序列,并且取决于具有节目映射表中指示的数据包标识符的广播传输流的数据包的适配字段中指示的子流ID,将该NAL单元序列的每个NAL单元与多个单独子流中的一个相关联。
此外,如上所述,流解复用器121可以被配置为从节目映射表中读取关于分别将视频和视频图像110空间细分成段108的信息,并且通过使用从空间细分的段到流标识符的映射从空间细分固有地得出多个单独子流114的流标识符。图5示出了一个示例,其中流解复用器121被配置为从节目映射表中读取关于将视频空间细分到段的信息,并且得出多个单独子流114的流标识符,使得多个单独子流114的流标识符沿着光栅扫描对空间细分内的段进行排序。代替如图5所示的逐行运行的光栅扫描,可以使用对段的任何其它优秀的指派,诸如用于段之间的关联的逐列运行的光栅扫描,并且流标识符和/或数据包ID可以以其它方式实现。
流解复用器121可以被配置为从节目映射表中读取,或者根据下面进一步描述的刚才提到的备选方案,从携带单独子流组116的数据包的适配字段中读取,其示例在上面列出并将在下面给出的子流描述符。每个子流描述符可以通过与一个单独子流相关联的子流ID来索引多个单独子流114中的一个,并且包括关于多个单独子流114中的哪一个或多个单独子流114与所索引的单独子流一起形成可作为至少两个单独子流114从单独子流组116中提取的子区域109的编码表示的信息,子区域109由连同索引的单独子流形成编码表示126的一个或多个单独子流的空间段108或序列空间段108组组成。流解复用器121还可以被配置为从节目映射表中读取关于子区域描述符的信息,子区域描述符指示视频到子区域109的在上述示例中使用索引l进行索引的一个或多个空间细分。对于每个这样的细分,每个子区域109是一个或多个单独子流114的一组空间段108或序列空间段108组。每个视频到子区域109的空间细分,子区域描述符可以指示子区域109的大小,诸如使用参数PictureSizeHor[l]和PictureSizeVert[l]。此外,可以用信号通知编码级别。因此,从单独子流组116中选择性地提取出的至少两个单独子流可以一起包含编码形成视频的一个或多个空间细分中的一个的子区域的一个的不同空间段108或不同组的序列空间段108的编码数据。
子流描述符中的一个或多个(在上面的示例中,ReferenceFlag=1的那些)可以包含关于多个单独子流中的哪一个或多个单独子流要连同索引的单独子流被提取作为来自单独子流组116的至少两个单独子流114的信息,以参考索引的形式,诸如到流标识符偏移的集合的列表(诸如通过将PatternReference用作j=PatternReference来指向其中的列表SubstreamOffset[...][j][l])中的PatternReference,并且每个细分存在由l索引的一个这样的列表。每个流标识符偏移SubstreamOffset[k][j][l]指示相对于索引的单独子流的流标识符SubstreamID的偏移,即,所引用的子流具有等于子流描述符所属的子流的SubstreamID加上SubstreamOffset[k][j][l]的子流ID。
替代地或附加地,子流描述符中的一个或多个(在上面的示例中,ReferenceFlag=0的那些)可以包含关于多个单独子流中的哪一个或多个单独子流要连同索引的单独子流被提取作为来自单独子流组116的至少两个单独子流114的信息,以流标识符偏移的集合的形式,例如AdditionalSubstreamID[i],每个指示相对于索引的单独子流的流标识符的偏移,即,通过在子流描述符中显式地用信号通知的偏移。
组106内的一个或多个子流可以包括从多个单独子流114中的任何一个中剥离的或专用于修改或替代多个单独子流114中的任何一个的切片头和/或参数集的切片头和/或参数集。无论子流114的切片头和/或参数集是否包含在额外子流中,修改或替代切片头和/或参数集以实现用于由解码器124解码的符合标准的数据流126'可以由流解复用器121的数据流处理器127执行。
现在更详细地描述刚才提到的为每个区块花费单独ES的替代方案。在依赖于接收器处的解复用器结构的现有实现的情况下,所描述的替代方案可能是有利的,这样的实现预先为潜在被解码的所有ES分配缓冲区。因此,这样的实现会高估缓冲区要求,从而损害上面提出的解决方案实施例的一些益处。在这种情况下,在同一ES内发送多个区块并将子流标识符指派给该ES内的数据部分,使得高级解复用器121可以在ES被存储在基本流缓冲区中之前从ES中去除不需要的数据部分可能是有益的。在这种情况下,TSDemux 121仍然使用如图4所示的三个缓冲区链重建每个基本流。在每个链中,如果传输(TS)数据包的PID匹配在某个ES的PMT中找到的值,则第一个缓冲区“TB”(即,传输缓冲区)存储该传输(TS)数据包。除了评估每个TS数据包头中包括的PID之外,它还解析适配字段,该适配字段可选地在TS数据包头之后。
来自ISO/IEC 13818-1的适配字段语法如下所示:
在适配字段中携带子流描述符的新语法可能如下所示:
新标志识别携带子流描述符的af_substream_descriptor。在适配字段内,每当TS数据包有效载荷包含PES数据包的开始时,发送根据语法No.1的Substream_descriptor。多路复用缓冲区“MB”通过剥离TS数据包头和适配字段来聚集具有相同PID的序列TS数据包的有效载荷,从而建立PES数据包。如果Substream_descriptor指示解码子区域不需要的SubstreamID,则解复用器121丢弃整个PES数据包,而具有与子区域匹配的SubstreamID的PES数据包被存储在子流缓冲区“SB”中。
除了使用Substream_descriptor的子流识别之外,如上所述,在与节目相关联的PMT中发送子区域描述符。根据上面的示例使用Substream_descriptor中的可选信息:
·可以用信号通知图案,该图案指示一组偏移值,这些偏移值被添加到描述符中存在的SubstreamID的值,从而产生补充期望子区域的附加子流ID;
·可替代地,可以在一直延伸到描述符的末尾的for循环中直接或显式地指示附加SubstreamID的阵列,描述符的长度由包括在Substream_descriptor之前的适配字段中的长度值af_descr_length指示。
整个提取出的比特流126可以被转发到数据流处理器127,数据流处理器127在将输出比特流126'转发到解码阶段124之前去除不需要的数据并进一步处理比特流126,以便在解码器的编码图像缓冲区中存储子区域的符合标准的比特流。在这种情况下,可以省略Subregion_descriptor语法的一些字段,或者可以使用以下简化语法来指示解码子区域所需的级别以及生成的水平和垂直子区域维度:
N1可以是由l索引的、可以从整个全景中选择的不同子区域布局的数量。它的值可以由描述符大小隐含给出。如果该描述符存在于PMT中,则强制要求在所有随机接入点中存在MCTS提取信息集SEI消息。SubstreamMarkingFlag的值(其在上述语法示例中的存在是可选的)或Subregion_level_descriptor的存在指示af_substream_descriptor用于识别子流。在这种情况下,客户端可以将SB的缓冲区大小调整为由Level[l]指示的CPB缓冲区大小。
本申请的以下描述涉及用于流复用、流解复用、图像和/或视频编码和解码以及对应数据流的任务的实施例,这些任务不一定涉及关于从广播传输流执行哪个流提取向接收器侧提供选择或改变视频的图像区域内的子区域的机会。但是,下面描述的实施例涉及本申请的一个方面,该方面可组合,或者可以与上述实施例结合使用。因此,在随后描述的实施例的描述的最后,存在关于随后描述的实施例如何可以有利地用于实现上述实施例的概述。
特别地,下面描述的实施例试图面对图9中概述的问题。图9示出了图像300。该图像300被编码成数据流302。但是,该编码已经以使得图像的不同段304被单独或彼此独立地编码到数据流302中的方式完成,即,其中抑制不同段之间的帧间编码依赖性。
图9还图示了图像的段304被顺序编码到数据流302中的可能性,即,使得每个段304被编码到数据流302的相应连续片段306中。例如,图像300使用某个编码顺序308被编码到数据流302中,该编码顺序308以使得一个接一个地遍历段304,从而在继续遍历编码顺序308中的下一个段之前完全遍历一个段的方式遍历图像300。
在图9中,仅示出了两个段3041和3042以及对应的两个片段3061和3062,但是段的数量自然地可以高于2。
如先前所述,图像300可以是视频的图像并且以刚刚关于图像300描述的相同方式,视频310的另外图像可以被编码到数据流302中,其中这些另外图像以关于图像300描述的相同方式被细分到段304中,并且关于不同图像之间的编码依赖性也可以遵循段间编码依赖性的抑制,使得诸如图像300的段3042的每个段可以以取决于另一个图像的对应的,即并置的段,而不是另一个图像的另一个段的方式被编码到其对应片段3062中。属于一个图像的片段306将形成数据流302的连续部分312,其可以被称为存取单元,并且它们不与属于视频310的其它图像的片段的部分交织。
图10更详细地图示了将图像300编码到数据流302中。特别地,图10示出了图像300被编码到其中的数据流302的对应部分,即,由片段3061和3062的级联组成的存取单元312。图10图示了数据流由图10中用矩形314表示的一系列NAL单元组成。可以存在不同类型的NAL单元。例如,图10中的NAL单元314已经被编码到与相应NAL单元314是其一部分的片段306对应的段304中的对应切片中。每个段304的这种切片NAL单元的数量可以是包括一或大于一的任何数量。两个切片中的子划分遵循上述编码顺序308。此外,图10通过标有阴影的方框314图示了NAL单元,该NAL单元在其有效载荷部分中包含参数集316而不是具有编码到其中的对应段304的对应切片的切片数据。诸如参数集316的参数集用于减轻或减少将图像300的编码参数化到数据流中的参数的传输量。特别地,切片NAL单元314可以引用或甚至指向这样的参数集316,如图10中的虚线箭头所示,以便采用这样的参数集316中的参数。即,例如,切片NAL单元中可能存在指向包含在参数集NAL单元中的参数集316的一个或多个指针。
如图10所示,参数集NAL单元可以冗余地或重复地散布在切片NAL单元之间,例如,为了针对NAL单元损耗增加数据流的电阻率等,但自然地,由片段3061和3062的切片NAL单元引用的参数集316应该由至少一个参数集NAL单元构成,该参数集NAL单元在引用的切片NAL单元前面,并且因此,图10描绘了在存取单元312的NAL单元序列的最外左侧处的这样的参数集NAL单元。
这里应该提到的是,先前和随后关于图9和10描述的许多细节仅仅是为了说明当试图仅将数据流302的一部分馈送至解码器以便使该解码器恢复视频310或图像300的某个段时可能发生的问题。虽然这些细节有助于理解本文所述实施例的基本思想,但应该清楚的是,这些细节仅仅是说明性的,因为下文描述的实施例不应受到这些细节的限制。
在任何情况下,可能阻止为了使解码器成功解码与片段306对应的段304而将仅一个片段306成功馈送至解码器的情况的一个示例可以是参数集316内与图像300的大小相关的参数。例如,这样的参数可以明确指示图像300的大小,并且由于每个段304的大小小于作为整体的图像300的大小,仅接收某个图像300被编码在其中的多个片段306的片段而没有任何修改的解码器将被参数集316内的这样的参数损坏。应该提到的是,刚刚从原始数据流302中切除而没有任何修改的某个片段304甚至可能缺少任何参数集NAL单元,因此根本缺少有效数据流的必要组成部分,即,参数集。特别地,作为最低限度,数据流302仅在存取单元的开始处需要参数集NAL单元,或者更确切地说,在参考其的切片NAL单元之前需要参数集NAL单元。因此,虽然第一片段3061需要具有参数集NAL单元,但是对于编码顺序中的所有后续片段3062不是这种情况。
可能附加地或替代地存在可能妨碍从数据流302中成功切除片段306并导致成功解码该片段的对应段的情况的其它示例。现在仅讨论一个这样的另外的示例。特别地,每个切片NAL单元可以包括切片地址,该切片地址表示其在图像区域内的位置,该位置是相应切片NAL单元所属的数据流所在的位置。该参数也在以下描述中讨论。
如果考虑上述情况,则图9的数据流302可以仅在以下情况被转变成与段304之一相关的数据流:1)从数据流302中切除与该段对应的片段306,2)修改参数集NAL单元中携带的参数集316中刚刚提到的图像敏感的至少一个参数,或者甚至新***这样的适配参数集NAL单元,以及3)如果需要,修改存储在切除片段的切片NAL单元中的切片地址,其中每当感兴趣的段304不是所有段304中的编码顺序中的第一段时,切片地址的修改是必要的,例如,切片地址是沿着上述编码顺序308测量的,因此,对于其,与整个图像300相关的切片地址和仅与相应切片的段相关的切片地址一致。
因此,图11a图示了提取和修改图10的片段3061的结果,以便产生自包含,即,正确参数化的分段数据流,即,仅仅关于和编码第一段3041的数据流。如通过虚线所指示的,其示出了从整个数据流312的片段3061到数据流320的对应部分的修改,即,与编码到片段3061中的段所位于的图像300相关的、仅影响参数集NAL单元的存取单元。图11b图示了关于段3042的对应提取和修改的结果。这里,自包含的分段数据流320包括数据流302的片段3062作为与图像300有关的存取单元,但是已经进行了附加的修改。例如,除了修改参数集316的至少一个参数之外,就自包含的分段数据流320而言,数据流302的片段3062内的参数集NAL单元已经朝着片段3062的开始处移位,并且就切片地址而言,切片NAL单元已被修改。与此相比,在图11a的情况下,就编码顺序308的第一段3041而言,切片NAL单元保持不变,因为切片地址一致。
以关于图11a和11b所示的方式修改数据流302的片段306导致信息丢失。特别地,修改后的参数和/或切片地址对于自包含数据流320的接收器不再可见或已知。因此,如果可以在不干扰接收解码器成功解码相应的自包含数据流320的情况下避免该信息丢失,那么将是有利的。
图12示出了根据本申请实施例的流格式化器,该流格式化器能够实现两个任务:首先,图12的流格式化器322能够将入站数据流302解复用为多个部分数据流324,每个部分数据流与对应的段304相关。即,部分数据流324的数量对应于段304的数量,并且对应的索引用于这些引用数量,因为关于片段306的情况也是如此。例如,部分数据流324可以根据上面关于图1至8讨论的概念的一个,即,例如,通过对每个部分数据流324使用一个ES进行广播。
流格式化器322将数据流302内的片段306分布到对应的部分数据流324上。但是,其次,流格式化器322将部分数据流324的至少一个转换成正确参数化的自包含数据流,以便通过传统解码器关于与相应部分数据流相关联的段304成功可解码。在图12中,这是关于第一段,即,关于第一部分数据流3241来图示的。因此,流格式化器322使片段3061内的NAL单元314经受上面关于图11a所讨论的修改,从而由数据流302的片段3061内的NAL单元314获取数据流3241内的NAL单元314'。注意的是,并非所有NAL单元都必须被修改。关于与诸如段3042的任何其它段有关的部分数据流3242可以进行相同类型的修改,但是这里不再进一步讨论。
但是,作为附加任务,流格式化器322将特定NAL单元类型的NAL单元326添加到部分数据流3241的NAL单元314'。后者新添加的NAL单元326具有从NAL单元类型集合中选出的NAL单元类型,该NAL单元类型集合与NAL单元314和314'所属的NAL单元类型集合不相交。特别地,当NAL单元314和314'的NAL单元类型是被传统解码器理解和处理的类型时,NAL单元326是预期被传统解码器忽略或丢弃的类型,因为它们例如是保留类型,留作将来使用。因此,传统解码器忽略NAL单元326。但是,通过这些NAL单元326,流格式化器322能够向第二类型的解码器(即,非传统解码器)发信号通知对NAL单元314'执行某些修改。特别地,如下面进一步讨论的,NAL单元326中的一个,诸如具有图12中所示的B的NAL单元,可以指示被参数化用于编码作为独立图像的段3041的参数集NAL单元的紧接着的后续NAL单元314'将与该BNAL单元326一起被丢弃或忽略。附加地或可选地,由流格式化器322新添加的一个A NAL单元326可以在其有效载荷部分中携带与数据流302的图像300相关的原始参数集NAL单元,并且可以向非传统解码器发信号通知其有效载荷部分中携带的NAL单元将被***以代替其自身或作为其自身的替代。例如,这样的A NAL单元326可以跟随或接着部分数据流3241内的片段3061的开始处的修改后的参数集NAL单元314',以便在片段3061内的切片NAL单元开始之前“更新”参数集316,使得非传统解码器仅初步地在A NAL单元326之前使用NAL单元314来设置参数集316中的参数,随后根据存储在ANAL单元326的有效载荷部分中的正确参数集NAL单元来正确地设置参数。
总而言之,接收部分数据流3241的传统解码器接收将段3041编码到其中作为自包含图像的自包含数据流,并且该传统解码器不会被新添加的NAL单元326破坏。如示出用于处理入站数据流的装置340的图13中所示的两个部分数据流的更复杂的接收能够在一个步骤中,或者通过重建自包含的整个数据流302'重建整个视频或图像,自包含的整个数据流302'再次从部分数据流324中形成编码等效的数据流302并将部分数据流324馈送到能够处理图像300的图像大小的传统解码器。最小任务可以是通过遵循由***的NAL单元326指示的指令将自包含部分数据流3241转换为反向参数化部分数据流334。此外,仅原始部分数据流324的子集可以由装置340输出,该子集关于原始图像300中的提取部分。装置可以执行或不执行部分数据流3241内的NAL单元314'的切片地址的任何切片地址反向适配,以便再次与整体图像300相关。
应当注意的是,流格式化器322从数据流302中提取部分数据流3241并使其呈现为由传统解码器可解码的自包含数据流,但是仍然携带原始的未修改的参数数据的能力在不导出(一个或多个)其它部分数据流3242的情况下可能是有用的。因此,仅仅从数据流302中生成部分数据流3241将是数据流生成器的任务,这也形成本申请的实施例。再次,所有陈述在另一个方向也是有效的,即,如果仅生成部分数据流3242,所有陈述也是有效的。
在上述实施例中,流复用器103可以关于一个或多于一个子流114与图12的流格式化器322相同地操作。在图12中,流格式化器322可以替代地或附加地关于诸如部分数据流3242的任何其它部分数据流执行NAL单元326的修改加上添加。再次,部分数据流的数量可以大于2。在接收器侧,接收如此处理的部分数据流3241的任何流形成器,诸如非传统解码器或流解复用器,诸如流解复用器121,可以除了其他任务之外,执行遵循由NAL单元326限定的指令的任务,从而产生部分数据流,当与原始数据流302的其它片段级联时,该部分数据流至少关于参数集316是正确的。例如,如果片段3241和3242的级联必须作为整体被解码,那么仅仅切片NAL单元内的切片地址可能必须被修改。
不言而喻,例如,可以在单独基本流内传送部分数据流324。即,它们可以被封包到传输流数据包中,即,对于部分数据流324的一个,一个数据包ID的数据包,以及对于另一个部分数据流324,另一个数据包ID的数据包。在传输流内多路传输部分数据流324的其它方式已经在上面被讨论,并且可以关于符合传统的部分数据流的传输进行重用。
在下文中,类型B的NAL单元326被示例性地呈现并且被称为跳过NAL单元,而类型A的NAL单元326使用被称为隐藏NAL单元的语法来图示。
因此,图9至12涉及其中至少两个ES用于完整全景的传输的示例性情况。ES中的一个是诸如3241的子流,其表示子区域3041的编码视频,并且该子流本身是符合标准的流,并且如果传统解码器能够解码该子流的级别,那么该子流可以由传统解码器解码。
与在不同ES中传输的至少一个其它子流3242的组合被发送到诸如127的数据流处理器用于进一步处理,这可以导致提取不同子区域的符合的比特流。在这种情况下,在数据流处理器127的输入处针对其正常功能所必需的一些数据部分,诸如为整个全景提供信息的参数集316,会防止传统解码器解码旨在被这样的传统设备解码的子区域。为了解决这个问题,使得这些数据部分对于传统解码器不可见,而高级设备可以处理它们。
解码器将视频比特流处理为数据单元序列,在HEVC编码的情况下,数据单元由所谓的“NAL单元”表示。NAL单元的大小由指示每个NAL单元的开始的起始码隐含地指示。在起始码之后,每个NAL单元以包含关于NAL单元类型的信息的头开始。如果解码器不识别NAL单元头中指示的类型,则它忽略该NAL单元。一些NAL单元类型值被保留,并且指示被保留的类型的NAL单元将被所有符合标准的解码器忽略。
为了使NAL单元对于传统解码器不可见,具有原始NAL单元类型字段的头被前置有具有保留值的头。高级处理器识别该类型值并实现不同的处理,即,***被恢复并且原始NAL单元被处理。两个保留的NAL单元类型值用于形成两个不同的伪NAL单元。如果高级处理器遇到第一种类型,则恢复***。如果遇到第二种类型,则从比特流中去除伪NAL单元和紧随其后的NAL单元。
ISO/IEC 23008-2中的NAL单元语法:
隐藏NAL单元首部的新语法:
hiding_nal_unit_type被设置为50,它是在ISO/IEC 23008-2中被标记为“未指定(unspecified)”的NAL单元类型。
nuh_layer_id和nuh_temporal_id_plus1从原始NAL单元头复制。
跳过NAL单元的新语法:
skipping_nal_unit_type被设置为51,它是在ISO/IEC 23008-2中被标记为“未指定”的NAL单元类型。
nuh_layer_id和nuh_temporal_id_plus1从原始NAL单元头复制。
在图14中通过从顶部到底部的过渡所示的隐藏过程中,单个NAL单元由隐藏NAL单元头与原始NAL单元一起形成。在组合的NAL单元之前只有一个起始码。
图14中通过从底部到顶部的过渡所示的取消隐藏过程仅去除隐藏NAL单元头,其位于起始码和原始NAL单元之间。
允许高级解码器跳过原始NAL单元的过程要求将跳过NAL单元在原始NAL单元之前***到比特流中,这意味着存在两个NAL单元,每个NAL单元前置有起始码。在图15中通过从顶部到底部的过渡图示了跳过,并且在图15中通过从底部到顶部的过渡图示了准备(***)。
根据现在描述的有利替代方案,允许通过***的NAL单元326用信号通知不是整体跳过NAL单元,而是仅跳过其一部分。原则上,有两个选项:或者后面NAL单元被全部跳过。该指令仅由根据上述示例的跳过NAL单元326用信号通知。根据替代方案,仅跳过任何后续NAL单元的一部分。后者在多个基本流被组合并且NAL单元的跳过部分被基本流中置于流的前面包含部分跳过的NAL单元的信息代替的情况下是有用的。这将在下面更详细地解释。在此情况下,可以通过以下方式适配上述语法示例:
这里,bytes_to_skip指示后面NAL单元的要跳过的字节数。如果此值被设置为零,则跳过整个后面NAL单元。
关于图16更详细地描述了该替代方案。图16示出了流格式化器322和该流格式化器322接收数据流302的场景,数据流302具有编码在其中的图像300或视频,其中图像300被如上所述的分割成空间段3041和3042,即,以使得能够关于空间段提取部分数据流的方式。与所有上述实施例一样,段的数量并不重要,甚至可能被增加。
为了便于理解关于图16讨论的变型,预先假设将图像300编码到数据流302中是以以下方式进行,其中对于每个段3041和3042仅跨越一个切片NAL单元,并且与图像300相关并且由片段3061和3062组成的存取单元在开始时仅包含一个参数集NAL单元314。图像300的数据流300中的三个产生的NAL单元被编号为#1、#2和#3,其中NAL单元#1领先并且是参数集NAL单元。因此,它通过阴影区别于NAL单元#2和#3。NAL单元#2和#3是切片NAL单元。NAL单元#2是与段3041相关的片段3061内的NAL单元314,并且NAL单元#3是与空间段3042相关的片段3062内的NAL单元314。它是片段3062内唯一的NAL单元。
流格式化器322寻求将数据流302拆分成两个部分数据流3241和3242,前者与空间段3041相关,并且后者与空间段3042相关,其中部分数据流3242呈现为自包含数据流,其可通过传统解码器相对于空间段3042被解码为自包含图像区域,而部分数据流3241不是,如在图12的讨论中的情况那样。如从图12的讨论中可以清楚看到的,流格式化器322处理与将片段3062转换成自包含数据流相关联的两个问题;即,1)片段3062还没有任何参数集NAL单元,以及2)片段3062包含切片NAL单元;即,NAL单元314#3,其切片头400包含错误的切片地址,即,它包含寻址段3042的开始相对于图像300的整个图像区域的切片地址,诸如,例如,关于图像300的左上角,而不是相对于表示用于低预算传统解码器的部分数据流3242的自包含图像区域的空间段3042的切片地址。因此,流格式化器322在将片段3062传送到部分数据流3242上时将适当设计的参数集NAL单元314'添加到片段3062。流格式化器322将该参数集NAL单元314'布置在片段3062的切片NAL单元314'的前面;即,切片NAL单元#3的前面,该切片NAL单元#3与数据流302中的对应切片NAL单元314#3关于其切片头不同。为了图示切片头中的差异,切片NAL单元#3的切片头以非阴影线示出,并且使用关于其包含在数据流302中的版本的附图标记400来指示,并且就其部分数据流3242中的修改版本而言使用交叉影线和使用附图标记402来指示。但是,除此之外,流格式化器322在参数集NAL单元314'之前加有类型B的跳过NAL单元326,使得参数集NAL单元314'将被馈入有部分数据流3042的处理装置或数据流形成器340跳过。但是,除此之外,流格式化器322将类型C的切片NAL单元326置于切片NAL单元314'#3之前。即,类型C的该部分跳过NAL单元326也是关于传统解码器不允许的NAL单元类型。但是,被设计为正确解释类型C的NAL单元326的数据流形成器或处理装置340将由该NAL单元传送的指令解释为后继切片NAL单元314'的部分402将被切掉或忽略的程度。从以下描述中将清楚该“丢失”头的组成。但是,首先,图16图示了如果低预算传统解码器500被馈送有部分数据流3242时将会发生什么。特别地,该低预算传统解码器500将由于类型B和C的NAL单元是不允许的NAL单元类型而忽略或丢弃这些NAL单元326,使得仅保留NAL单元314',如上面关于图11b所讨论的,这导致形状和内容与段3042一致的图像的正确且自包含的解码。。
但是,附加地,流格式化器322在流片段3061的末尾添加切片NAL单元#3的切片头的以前版本400,片段3061已经由流格式化器322分发到部分数据流3241,以便在其中不加任何修正地采用。这又意味着部分数据流3241作为与图像300的时间戳相关的存取单元在其中具有“不完整片段”;即,对应片段3061内的NAL单元314的精确副本,后面是后续片段3062的唯一NAL单元的不完整前导部分;即,其以前的切片头400。其重要性如下。
特别地,当数据流形成器340接收到部分数据流3241和3242两者时,数据流形成器340关于自包含数据流3242执行由特殊NAL单元326指示的动作,并且然后级联部分数据流3241和3242'。但是,该级联加指令执行的结果是数据流302',其中与图像300的时刻相关的NAL单元是原始数据流302的三个NAL单元314的精确副本。因此,接收数据流302'的高端传统解码器502将从中解码其中包括空间段3041和3042两者的整个图像300。
关于图16讨论的由NAL单元类型C 326引起的代码修改指令关于图17更详细地示出。特别地,这里示出了类型C的NAL单元326可以指示要从后继NAL单元314'切除的部分;即,部分510可能使用指示在相应部分数据流3242内待从后继NAL单元314'切除的部分的长度指示来指示,诸如从相应后继NAL单元314'的开始进行测量,而不是诸如为了更容易理解如前面关于图16所描述的那样通过指示NAL单元头402将被切除在语义上确定要切除的部分。自然地,可以替代地通过任何其它方式实现指示要切除哪个部分。例如,在类型C的NAL单元326中指示的长度指示可以通过长度指示指示要被切除的部分,即,部分510,由长度指示指示的长度要从相对于C型的NAL单元326的前一个NAL单元的末端来测量,或者可以使用任何其它指示规定。
因此,关于图9至17的描述揭示了已经使得被自包含的数据流,即,图12中的3241和图16中的3242。它由NAL单元序列组成。NAL单元序列包括第一集合的一个或多个NAL单元314',其形成被参数化以便编码第一图像的自包含数据流,第一集合的NAL单元314'从第一集合的一个或多个NAL单元类型中选择。此外,NAL单元序列包括第二集合的一个或多个NAL单元326,每个NAL单元326是第二集合的一个或多个预定NAL单元类型中的一个,与第一集合不相交,并且被确定为导致传统解码器忽略相应的NAL单元。第二集合的一个或多个NAL单元326可以散布在NAL单元序列中或者布置在NAL单元序列内,使得对于第二集合的每个NAL单元326,通过从NAL单元序列中丢弃第一集合的紧接在后的NAL单元330或其部分402以及第二集合的相应NAL单元326和/或将在第二集合的相应NAL单元326的有效载荷部分中携带的第一NAL单元类型中的一个的NAL单元332***到NAL单元序列中以代替第二集合的相应NAL单元,NAL单元序列被转换为NAL单元的转换序列334,其除了包含在第一集合的一个或多个NAL单元中的一个或多个中的切片地址之外,形成更大自包含数据流的片段3061,该更大自包含数据流在其中编码有由多个空间段3041,2组成的图像300,多个空间段3041,2的预定的一个3041是第一图像。可通过将NAL单元的转换序列334与一个或多个其它NAL单元序列3242级联,对于更大的自包含数据流,片段3061是可修改的,一个或多个其它NAL单元序列3242在其中编码有除预定空间段之外的图像的每个空间段3042,并且除了包含在第一集合的一个或多个NAL单元中的一个或多个中的切片地址之外,NAL单元的转换序列334被参数化以便在与一个或多个其它NAL单元序列级联时编码图像内的预定空间段3041。如关于图16所示,预定空间段可以是不同于编码顺序308中的第一空间段的其它空间段。第二集合的一个或多个NAL单元326可以包括第二集合的预定NAL单元,其在第一集合的第一NAL单元330之前,第一集合的第一NAL单元330包括携带由第一集合的至少一个第二NAL单元引用的第一参数集的有效载荷部分,预定NAL单元326指示第一NAL单元330或其部分402,将从NAL单元序列中与预定NAL单元一起被丢弃。第二集合的一个或多个NAL单元可以包括第二集合的预定NAL单元326,其在第一集合的第一NAL单元之后,第一集合的第一NAL单元包括携带由第一集合的至少一个第二NAL单元引用的第一参数集的有效载荷部分,预定NAL单元326具有携带第一NAL单元类型中的一个的第三NAL单元332的有效载荷部分,第三NAL单元包括携带第二参数集的有效载荷部分,该第二参数集在第三NAL单元332被***到NAL单元序列中以代替预定的NAL单元326时替换第一参数集。在第二集合的一个或多个NAL单元326中的预定一个指示仅去除后续NAL单元314'的一部分402的情况下,同样可以可选地指示该部分402的长度。替代物,即,不完整的切片片段,可以由流格式化器附加在另一个片段306,但是替代地,可以使用携带部分替代物的隐藏NAL单元并且以在部分跳过NAL单元之前的方式布置。部分跳过的后续NAL单元可以是切片NAL单元,其包括携带切片数据的有效载荷部分,切片数据包括至少部分地被要跳过的部分402覆盖的切片头,接着是在其中编码有该切片NAL单元的的对应切片的切片有效载荷数据。不完整切片片段和要丢弃的部分至少包括切片头的切片地址,由不完整切片片段包括的切片地址相对于图像的周长来限定,并且由要丢弃的部分包括的切片地址相对于预定空间段3042的周长来限定,诸如在相对于编码顺序308从其开始的左上角的两种情况下。
上面已经在图12中描述了用于从第二数据流302生成第一数据流3241的装置322。在输出不止一个部分数据流3241的情况下,它可以是流分离器。第二数据流在其中编码有由多个空间段3041,2组成的图像300,其中第二数据流由NAL单元序列组成,NAL单元序列包括参数化以便编码预定空间段3041的第一集合的一个或多个NAL单元314,第一集合的NAL单元从第一集合的一个或多个NAL单元类型中选择,其中该装置被配置为从第二数据流302中切除第一集合的一个或多个NAL单元314,以便将其采用到第一数据流3241中;重新参数化第一集合的一个或多个NAL单元,以便将预定空间段编码为自包含图像;将第二集合的一个或多个NAL单元326***到第一数据流中,第二集合的每个NAL单元326是第二集合的一个或多个预定NAL单元类型中的一个,与第一集合不相交,并且被确定为导致传统解码器忽略相应的NAL单元326。装置322可以被配置为相对于第一集合的一个或多个NAL单元布置第二集合的一个或多个NAL单元,即,将第二集合散布到第一集合的一个或多个NAL单元中,和/或将第二集合前置到第一集合的一个或多个NAL单元之前和/或附加到第一集合的一个或多个NAL单元之后,使得第二集合的每个NAL单元规定从NAL单元序列中丢弃第一集合的紧接在后的NAL单元330以及第二集合的相应NAL单元,和/或规定将第二集合的相应NAL单元的有效载荷部分中携带的第一NAL单元类型中的一个的隐藏NAL单元332***到NAL单元序列中以代替第二集合的相应NAL单元。紧接在后的NAL单元例如是参数集NAL单元,和/或隐藏的NAL单元是如包含在第二数据流中的参数集NAL单元。
已经关于图13描述了用于处理诸如3241的数据流的装置340。如果输出诸如图像300的图像内容而不是数据流302',或者其一个或多个片段的集合,诸如,例如,仅从部分数据流3241导出的片段334,则装置340可以被扩展到解码器。装置340接收由NAL单元序列组成的数据流3241,NAL单元序列包括第一集合的一个或多个NAL单元314',其形成参数化以便编码第一图像的自包含数据流,第一集合的NAL单元从第一集合的一个或多个NAL单元类型中选择,并且NAL单元序列包括第二集合的一个或多个NAL单元326,其中的每一个是第二集合的一个或多个预定NAL单元类型中的一个,与第一集合不相交,其中第二集合的一个或多个NAL单元被布置在NAL单元序列中或散布在NAL单元序列中。装置通过检查每个NAL单元中指示NAL单元类型的NAL单元类型语法元素来区分该第二类型的每个NAL单元与第一类型的一个或多个NAL单元的集合。如果该语法元素具有第一组值内的值,则它被指定第一NAL单元类型的NAL单元,并且如果该语法元素具有第二组值内的值,则它被指定第二NAL单元类型的NAL单元。可以区分不同类型的NAL单元326(第二类型)。这可以通过NAL单元类型语法元素来完成,即,通过如上所述指派给这些不同的NAL单元326诸如类型A、B和C,保留的NAL单元类型中的不同NAL单元类型(NAL单元类型语法元素的第二组值)。但是,后者之间的区分也可以通过每个***的NAL单元326的有效载荷部分中的语法元素来完成。NAL单元类型语法元素还将切片NAL单元与参数集NAL单元区分开,即,它们具有第一组值中的不同值的NAL单元类型语法元素。对于第二集合的预定NAL单元326,装置340从NAL单元序列中丢弃第一集合的紧接在后的NAL单元330或其部分402以及第二集合的相应NAL单元。对于一个NAL单元326,装置340可以整体丢弃随后的NAL单元切片,而对于另一个,仅仅丢弃部分402。但是,装置也可以仅处理这些选项中的任一个。部分402可以通过相应NAL单元326的有效载荷部分中的长度指示来指示,或者部分402由340来确定,否则诸如通过解析来确定。部分402例如是后续NAL单元的切片头。附加地或替代地,装置可以对于第二集合的另一个预定NAL单元326,从NAL单元序列中丢弃第一集合的紧接在后的NAL单元330或其部分402以及第二集合的相应NAL单元,并且将在第二集合的相应NAL单元的有效载荷部分中携带的第一NAL单元类型中的一个的NAL单元332***到NAL单元序列中,以代替第二集合的相应NAL单元。附加地或替代地,装置可以对于第二集合的甚至另一个预定NAL单元326,将第二集合的相应NAL单元的有效载荷部分中携带的第一NAL单元类型中的一个的NAL单元332***到NAL单元序列中以代替第二集合的相应NAL单元。装置340可以被配置为将通过丢弃和/或***获得的NAL单元的转换序列(其中潜在地修改第一集合的一个或多个NAL单元中的一个或多个中包含的切片地址)与一个或多个其它NAL单元序列3242级联,该一个或多个其它NAL单元序列在其中编码有除预定空间段之外的更大图像的每个空间段。级联沿着编码顺序对NAL单元序列进行排序,使得NAL单元序列内的切片NAL单元中的切片地址单调增加。该级联连同通过NAL单元326指示的指令的执行产生数据流302',其等于数据流302或者是其等效物,即,它的解码产生具有作为其空间段之一的预定空间部分的图像300。如果任何自包含的部分数据流将被馈送到传统解码器,则由于NAL单元326的丢弃,将产生对应空间段的解码。
关于图12和16,应当注意的是,其中示出的流格式化器322可以被拆分成两个连续的实体,即,一个仅执行将所有部分数据流的NAL单元从一个公共流分布到相应部分数据流上的任务,即,解复用或流分发的任务,并且连接到前者的上游的另一个执行上述剩余任务。至少一些任务甚至可以由生成原始NAL单元314的编码器执行。
虽然已经在装置的上下文中描述了一些方面,但是显然这些方面也表示对应方法的描述,其中方框或设备对应于方法步骤或方法步骤的特征。类似地,在方法步骤的上下文中描述的方面也表示对应装置的对应方框或项目或特征的描述。方法步骤中的一些或全部可以由(或使用)硬件装置执行,例如微处理器、可编程计算机或电子电路。在一些实施例中,最重要的方法步骤中的一个或多个可以由这样的装置执行。
取决于某些实现要求,本发明的实施例可以用硬件或软件实现。可以使用数字存储介质来执行该实现,例如软盘、DVD、蓝光、CD、ROM、PROM、EPROM、EEPROM或FLASH存储器,其具有存储在其上、与可编程计算机***协作(或能够协作),使得执行相应的方法的电子可读控制信号。因此,数字存储介质可以是计算机可读的。
根据本发明的一些实施例包括具有电子可读控制信号的数据载体,这些电子可读控制信号能够与可编程计算机***协作,使得执行本文所述的方法之一。
通常,本发明的实施例可以被实现为具有程序代码的计算机程序产品,该程序代码可操作用于在计算机程序产品在计算机上运行时执行这些方法之一。程序代码可以例如被存储在机器可读载体上。
其它实施例包括用于执行存储在机器可读载体上的本文所述方法之一的计算机程序。
换句话说,本发明方法的实施例因此是具有程序代码的计算机程序,当计算机程序在计算机上运行时,该程序代码用于执行本文所述的方法之一。
因此,本发明方法的另一个实施例是数据载体(或数字存储介质,或计算机可读介质),其包括记录在其上的用于执行本文所述方法之一的计算机程序。数据载体、数字存储介质或记录介质通常是有形的和/或非瞬态的。
因此,本发明方法的另一个实施例是表示用于执行本文所述方法之一的计算机程序的数据流或信号序列。数据流或信号序列可以例如被配置为经由数据通信连接,例如经由互联网传输。
另一个实施例包括处理部件,例如计算机或可编程逻辑设备,其被配置为或适于执行本文所述的方法之一。
另一个实施例包括计算机,该计算机具有安装在其上用于执行本文所述方法之一的计算机程序。
根据本发明的另一个实施例包括一种装置或***,其被配置为将用于执行本文所述方法之一的计算机程序传送(例如,电子地或光学地)到接收器。接收器可以是例如计算机、移动设备、存储器设备等。该装置或***可以例如包括用于将计算机程序传送到接收器的文件服务器。
在一些实施例中,可编程逻辑器件(例如现场可编程门阵列)可以用于执行本文所述方法的一些或全部功能。在一些实施例中,现场可编程门阵列可以与微处理器协作,以便执行本文描述的方法之一。通常,该方法优选地由任何硬件装置执行。
上述实施例仅用于说明本发明的原理。应该理解的是,本文所述的布置和细节的修改和变型对于本领域技术人员而言将是显而易见的。因此,旨在仅受即将到来的专利权利要求的范围的限制,而不受通过本文实施例的描述和解释所呈现的具体细节的限制。
Claims (31)
1.一种流复用器(103),包括:
接收接口(105),用于接收视频流(102)的视频图像(110)的至少两个不同空间段(108)或不同序列空间段(108)组中的每一个被编码在其中的编码数据;以及
数据流形成器(106),被配置为将所述至少两个不同空间段(108)或不同序列空间段(108)组中的每一个的编码数据封包到单独基本流(114)中,并在输出处提供单独基本流(114);
其中所述视频流的视频图像的至少两个不同空间段或不同序列空间段组被编码,使得对于每个视频图像,编码数据包括至少一个切片;
其中数据流形成器被配置为将每个空间段或空间段组的一个或多个切片封包到一个单独基本流中;
其中数据流形成器被配置为,对于空间段或序列空间段组的至少一个的切片,
将空间段或序列空间段组的至少一个的切片封包到单独基本流中;
提供另外的单独基本流,所述另外的单独基本流包括关于其图像位置或图像大小的相对于空间段或序列空间段组的至少一个的切片修改后的合适切片头。
2.如权利要求1所述的流复用器(103),其中所述至少两个不同空间段(108)或不同序列空间段(108)组被编码,使得包含在相应的单独基本流(114)中的所述至少两个不同空间段(108)或不同序列空间段(108)组的每一个的编码数据仅引用包含在相同单独基本流中的编码数据。
3.如权利要求1所述的流复用器(103),其中数据流形成器(106)被配置为将空间段(108)或序列空间段(108)组的至少一个的切片以去除其切片头的方式封包到单独基本流(114)中;
其中数据流形成器(106)被配置为提供另外的单独流,具有用于视频流(102)的视频图像(110)的至少一个空间细分中的每一个至子区域(109)的参数集。
4.如权利要求1所述的流复用器(103),其中至少两个不同的空间段(108)或不同序列空间段(108)组以每个视频图像一个切片被编码到视频流中;
其中数据流形成器(106)被配置为对于每个视频图像(110)将其中编码有空间段(108)或空间段(108)组中的相应一个的切片的一部分封包到单独基本流(114)中,对于至少两个空间段(108)或空间段(108)组的至少一个,没有切片的切片头。
5.如权利要求4所述的流复用器(103),其中数据流形成器(106)被配置为提供另外的单独流,所述另外的单独流包括关于其图像位置或图像大小的相对于去除的切片头修改后的切片头或其修改版本。
6.如权利要求4所述的流复用器(103),其中数据流形成器(106)被配置为提供另外的单独流,具有用于视频流(102)的视频图像(110)的至少一个空间细分中的每一个至子区域(109)的参数集。
7.如权利要求1所述的流复用器(103),其中数据流形成器(106)被配置为在同一个另外的单独基本流中提供参数集和切片头或其修改版本。
8.如权利要求1所述的流复用器(103),其中数据流形成器(106)被配置为在描述符中用信号通知另外的基本流的存在。
9.如权利要求1所述的流复用器(103),其中数据流形成器(106)被配置为生成基本流描述符,所述基本流描述符向单独基本流(114)中的每一个指派唯一的基本流标识。
10.如权利要求9所述的流复用器(103),其中数据流形成器(106)被配置为生成子区域描述符,所述子区域描述符对于至子区域(109)的视频流(102)的视频图像(110)的至少一个空间细分中的每一个,用信号通知每个子区域(109)的一组基本流标识。
11.如权利要求1所述的流复用器(103),其中流复用器(103)被配置为用信号通知两种流类型中的至少一种;
其中第一流类型用信号通知与至子区域(109)的视频流(102)的视频图像(110)的至少一个空间细分中的一个对应的单独基本流(114)的适当子集的组合产生符合标准的数据流;
其中第二流类型用信号通知与至子区域(109)的视频流(102)的视频图像(110)的至少一个空间细分中的一个对应的单独基本流(114)的适当子集的组合产生需要被进一步处理的数据流,以获得符合标准的版本的数据流。
12.如权利要求11所述的流复用器(103),其中视频流(102)的视频图像(110)的至少两个不同空间段(108)或不同序列空间段(108)组被编码,使得编码数据包括至少两个切片;
其中编码数据包括指示是否满足编码约束的信令信息,或者其中数据流形成器被配置为确定是否满足编码约束;
其中当去除至少两个切片的至少一个切片头,同时关于编码顺序维持至少两个切片的第一切片的切片头并且使用第一切片头级联至少两个切片或至少两个切片的合适子集产生符合标准的数据流时,满足编码约束;
其中流复用器被配置为取决于编码约束的满足而用信号通知两种流类型中的至少一种。
13.一种流解复用器(121),包括:
数据流形成器(122),被配置为从单独基本流组(116)中选择性地提取至少两个单独基本流(114),所述至少两个单独基本流(114)包含编码视频流(102)的视频图像(110)的不同空间段(108)或不同序列空间段(108)组的编码数据,其中数据流形成器(122)被配置为将至少两个单独基本流(114)组合成包含编码视频流(102)的视频图像(110)的不同空间段(108)或不同序列空间段(108)组的编码数据的数据流(126),其中所述视频流的视频图像的不同空间段或不同序列空间段组被编码,使得对于每个空间段或空间段组,编码数据包括至少一个切片,其中每个空间段或空间段组的一个或多个切片封包到一个单独基本流中,其中将空间段或序列空间段组的至少一个的切片封包到单独基本流中,其中另外的单独基本流包括关于其图像位置或图像大小的相对于空间段或序列空间段组的至少一个的切片修改后的合适切片头;以及
输出接口(123),被配置为提供数据流(126);
其中所述数据流形成器被配置为将至少两个单独基本流组合成符合HEVC标准的数据流,
其中所述数据流形成器被配置为基于另外的单独基本流中包括的合适切片头,修改至少两个单独基本流的头信息或者将头信息添加到至少两个单独基本流,以获得符合HEVC标准的数据流。
14.如权利要求13所述的流解复用器(121),其中所述单独基本流组(116)包括多个单独基本流(114),单独基本流(114)包含编码视频流(102)的视频图像(110)的不同空间段(108)或不同序列空间段(108)组的编码数据;
其中数据流形成器(122)被配置为选择性地提取单独基本流组(116)的多个单独基本流(114)的子集。
15.如权利要求14所述的流解复用器(121),其中数据流形成器(122)被配置为从单独基本流组(116)中提取对于至子区域(109)的视频流的视频图像(110)的至少一个空间细分中的每一个用信号通知每个子区域(109)的一组基本流标识的子区域描述符,其中数据流形成器(122)被配置为使用子区域描述符选择待从单独基本流组(116)中提取的基本流(114)的子集。
16.如权利要求15所述的流解复用器(121),其中数据流形成器(122)被配置为从单独基本流组(116)提取基本流标识符,所述基本流标识符向单独基本流(114)中的每一个指派唯一的基本流标识,其中数据流形成器(122)被配置为使用基本流描述符来定位待从单独基本流组(116)中提取的基本流(114)的子集。
17.如权利要求13所述的流解复用器(121),其中流解复用器(121)被配置为识别至少两种流类型中的至少一种;
其中第一流类型指示与至子区域(109)的视频流(102)的视频图像(110)的至少一个空间细分中的一个对应的单独基本流(114)的适当子集的组合产生符合标准的数据流;
其中第二流类型指示与至子区域(109)的视频流(102)的视频图像(110)的至少一个空间细分中的一个对应的单独基本流(114)的适当子集的组合产生需要被进一步处理的数据流,以获得符合标准的版本的数据流;
其中流解复用器(121)包括数据流处理器(127),数据流处理器(127)被配置为使用包含在单独基本流组的至少一个基本流(114s,114p)中的处理信息根据识别出的流类型进一步处理数据流(126),以获得符合标准的数据流的版本(126')。
18.如权利要求13所述的流解复用器(121),其中
单独基本流组(116)包括在广播传输流中并且包括:
多个单独基本流(114),单独基本流(114)包含编码视频流(102)的不同空间段(108)或不同序列空间段(108)组的编码数据;以及
节目映射表;以及
流解复用器(121)被配置为针对多个单独基本流(114)中的每一个从节目映射表得出流标识符,并且使用相应的流标识符来区分广播传输流中的多个单独基本流(114)中的每一个。
19.如权利要求18所述的流解复用器(121),其中流解复用器(121)被配置为从在广播传输流中的数据包标识符零的数据包内传送的节目关联表中得出预定的数据包标识符,并从具有预定数据包标识符的广播传输流的数据包中得出节目映射表。
20.如权利要求18所述的流解复用器(121),其中
节目映射表唯一地将每个流标识符与相应的数据包标识符相关联,并且流解复用器被配置为从具有与相应单独基本流的流标识符相关联的数据包标识符的广播传输流的数据包中解包多个单独基本流中的每一个,或者
流解复用器被配置为从具有节目映射表中指示的数据包标识符的广播传输流的数据包中解包NAL单元序列,并且根据广播传输流的数据包的适配字段中指示的流标识符将每个NAL单元与多个单独基本流中的一个相关联。
21.如权利要求18所述的流解复用器(121),其中流解复用器(121)被配置为从节目映射表中读取关于将视频空间细分成段的信息并且通过使用从空间细分的段到流标识符的映射而从空间细分固有地得出多个单独基本流(114)的流标识符。
22.如权利要求18所述的流解复用器(121),其中流解复用器(121)被配置为从节目映射表中读取关于将视频空间细分成段的信息并且得出多个单独基本流(114)的流标识符,使得多个单独基本流(114)的流标识符沿着光栅扫描对空间细分内的段进行排序。
23.如权利要求18所述的流解复用器(121),其中流解复用器(121)被配置为从节目映射表或携带单独基本流组(116)的数据包的适配字段中读取基本流描述符,每个基本流描述符通过一个单独基本流的流标识符对多个单独基本流中的一个进行索引,并且包括关于多个单独基本流中的哪一个或多个单独基本流连同索引的单独基本流形成作为至少两个单独基本流(114)从单独基本流组(116)中可提取的子区域的编码表示的信息,子区域由形成编码表示的与索引的单独基本流一起的、一个或多个单独基本流的空间段(108)或序列空间段组组成。
24.如权利要求23所述的流解复用器(121),其中流解复用器(121)被配置为从节目映射表中读取关于子区域描述符的信息,子区域描述符指示使得每个子区域是一个或多个单独基本流的空间段(108)的集合或序列空间段组的视频到子区域的一个或多个空间细分,以及在至子区域(109)的视频每个空间细分下子区域的大小,其中从单独基本流组(116)中选择性地提取的至少两个单独基本流一起包含编码形成视频的一个或多个空间细分中的一个的子区域的一个的不同空间段(108)或不同序列空间段(108)组的编码数据。
25.如权利要求23所述的流解复用器(121),其中基本流描述符中的一个或多个以到流标识符偏移的集合的列表的参考索引的形式包含关于多个单独基本流中的哪一个或多个单独基本流连同索引的单独基本流待被提取作为来自单独基本流组(116)中的至少两个单独基本流(114)的信息,每个流标识符偏移指示相对于索引的单独基本流的流标识符的偏移。
26.如权利要求22所述的流解复用器(121),其中基本流描述符中的一个或多个以流标识符偏移的集合的形式包含关于多个单独基本流中的哪一个或多个单独基本流连同索引的单独基本流待被提取作为来自单独基本流组(116)的至少两个单独基本流(114)的信息,每个流标识符偏移指示相对于索引的单独基本流的流标识符的偏移。
27.如权利要求13所述的流解复用器(121),其中
单独基本流组(116)还包括一个或多个基本流,所述一个或多个基本流包括从所述多个单独基本流(114)剥离的或专用于修改或替换多个单独基本流(114)的切片头和/或参数集的切片头和/或参数集。
28.如权利要求13所述的流解复用器(121),其中
单独基本流组(116)包括一个或多个单独基本流的子组,
每个编码相应的空间段(108)或相应的序列空间段(108)组,
每个包括NAL单元序列,以及
所述NAL单元序列由以下组成:
第一集合的一个或多个NAL单元,形成表示相应基本流的相应空间段(108)或相应序列空间段(108)组的数据流的符合标准的版本。
29.一种用于流复用的方法(200),所述方法包括:
接收(202)视频流(102)的视频图像(110)的至少两个不同空间段(108)或不同序列空间段(108)组中的每一个的编码数据;以及
将至少两个不同空间段(108)或不同空间段(108)组中的每一个的编码数据封包(204)到单独基本流中,其中所述视频流的视频图像的至少两个不同空间段或不同序列空间段组被编码,使得对于每个空间段或空间段组,编码数据包括至少一个切片,其中每个空间段或空间段组的一个或多个切片封包到一个单独基本流中,
其中将空间段或序列空间段组的至少一个的切片封包到单独基本流中,并且方法还包括:
提供另外的单独流,所述另外的单独流包括关于其图像位置或图像大小的相对于空间段或序列空间段组的至少一个的切片修改后的合适切片头。
30.一种用于流解复用的方法(220),所述方法包括:
从单独基本流组(116)中选择性地提取(222)至少两个单独基本流(114),至少两个单独基本流(114)包含编码视频流(102)的视频图像(110)的不同空间段(108)或不同序列空间段(108)组的编码数据,其中所述视频流的视频图像的不同空间段或不同序列空间段组被编码,使得对于每个空间段或空间段组,编码数据包括至少一个切片,其中每个空间段或空间段组的一个或多个切片封包到一个单独基本流中,其中将空间段或序列空间段组的至少一个的切片封包到单独基本流中,其中另外的单独基本流包括关于其图像位置或图像大小的相对于空间段或序列空间段组的至少一个的切片修改后的合适切片头;以及
将至少两个单独基本流(114)组合(224)成包含编码视频流(102)的视频图像(110)的不同空间段(108)或不同序列空间段(108)组的编码数据的数据流(126),其中将至少两个单独基本流组合成符合HEVC标准的数据流,其中基于另外的单独基本流中包括的合适切片头,修改至少两个单独基本流的头信息或者将头信息添加到至少两个单独基本流,以获得符合HEVC标准的数据流。
31.一种计算机程序产品,用于当由处理器执行时实现如权利要求29或30所述的方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16171579.2 | 2016-05-26 | ||
EP16171579 | 2016-05-26 | ||
CN201780046872.3A CN109565611B (zh) | 2016-05-26 | 2017-03-28 | 针对交互式客户端的全景视频的广播流 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780046872.3A Division CN109565611B (zh) | 2016-05-26 | 2017-03-28 | 针对交互式客户端的全景视频的广播流 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114125505A CN114125505A (zh) | 2022-03-01 |
CN114125505B true CN114125505B (zh) | 2024-06-28 |
Family
ID=
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3214600A1 (en) * | 2012-06-29 | 2014-01-03 | Ge Video Compression, Llc | Video data stream concept |
CN104081781A (zh) * | 2012-01-20 | 2014-10-01 | 弗兰霍菲尔运输应用研究公司 | 许可平行处理的编码构思、传送解多工器及视频比特流 |
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104081781A (zh) * | 2012-01-20 | 2014-10-01 | 弗兰霍菲尔运输应用研究公司 | 许可平行处理的编码构思、传送解多工器及视频比特流 |
CA3214600A1 (en) * | 2012-06-29 | 2014-01-03 | Ge Video Compression, Llc | Video data stream concept |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109565611B (zh) | 针对交互式客户端的全景视频的广播流 | |
CN105830450B (zh) | 发送方法、接收方法、发送装置以及接收装置 | |
JP6440083B2 (ja) | 送信方法、受信方法、送信装置及び受信装置 | |
JP7200329B2 (ja) | 送信方法、受信方法、送信装置及び受信装置 | |
JP2016063534A (ja) | 送信装置、受信装置、送信方法及び受信方法 | |
CN106576187B (zh) | 发送方法、接收方法、发送装置以及接收装置 | |
CN114125505B (zh) | 针对交互式客户端的全景视频的广播流 | |
CN114125503B (zh) | 针对交互式客户端的全景视频的广播流 | |
JP7257646B2 (ja) | 送信方法、受信方法、送信装置及び受信装置 | |
JP7238066B2 (ja) | 送信方法、受信方法、送信装置及び受信装置 | |
WO2016021153A1 (ja) | 送信方法、受信方法、送信装置及び受信装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |