CN103828358A - 具有对称图片分辨率和质量的帧兼容全分辨率立体3d视频递送 - Google Patents
具有对称图片分辨率和质量的帧兼容全分辨率立体3d视频递送 Download PDFInfo
- Publication number
- CN103828358A CN103828358A CN201280047461.3A CN201280047461A CN103828358A CN 103828358 A CN103828358 A CN 103828358A CN 201280047461 A CN201280047461 A CN 201280047461A CN 103828358 A CN103828358 A CN 103828358A
- Authority
- CN
- China
- Prior art keywords
- picture frame
- multiplexing
- frame
- input
- spatial frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/161—Encoding, multiplexing or demultiplexing different image signal components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/194—Transmission of image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
高分辨率3D图像可以被编码成采用基础层(BL)视频信号和增强层(EL)视频信号的第一复用图像帧和第二复用图像帧。第一复用图像帧可以包括用于双眼的水平高分辨率图像数据,而第二复用图像帧可以包括用于双眼的垂直高分辨率图像数据。用于3D图像的经编码对称分辨率图像数据可以被分发至用于3D图像处理和呈现的宽泛种类的装置。接收装置可以从第一复用图像帧或第二复用图像帧之一来重构缩减分辨率3D图像。接收装置还可以通过从第一复用图像帧和第二复用图像帧两者组合高分辨率图像数据,来重构高分辨率3D图像。
Description
相关申请的交叉引用
本申请要求2011年9月29日提交的美国临时专利申请No.61/541,005和2012年1月04日提交的美国临时专利申请No.61/583,081的优先权,其全部内容通过引用而并入于此。
技术领域
本发明总体上涉及图像数据。更具体地,本发明的示例实施例涉及用于立体3D图像的图像数据。
背景技术
用于3D内容递送的帧兼容半分辨率(FCHR)解决方案遭受劣化的空间分辨率,因为半分辨率3D内容仅包含从全分辨率3D图像帧子采样(subsample)的半分辨率图像帧。
在某些技术下,帧兼容全分辨率(FCFR)解决方案可以被用于通过经由基础层发送半分辨率3D图像帧并且经由增强层发送补充半分辨率3D图像帧来生成全分辨率3D图像帧。半分辨率3D图像帧和补充半分辨率3D图像帧可以由接收装置组合成全分辨率的3D图像帧。
然而,这些技术执行低通滤波,以减小/去除半分辨率图像帧中的混叠(aliasing)。由于图像帧中的高频内容通过低通滤波被去除,因而,下游装置不可能恢复高空间频率内容中的全部精细细节和纹理。虽然全分辨率3D图像帧仍可能被构造,但3D图像帧中的像素将由于低通滤波而不可逆地改变,并且不能被用于再现这些3D图像帧所源自的原始3D内容中的原始分辨率和清晰度。
在本部分中描述的方法是可以推行的方法,但不一定是先前已经设想或推行的方法。因此,除非另外加以表明,否则,不应假定本部分中描述的任何方法仅由于它们被包括在本部分中而被认为是现有技术。类似的是,参照一个或多个方法确立的问题不应基于本部分而假定已经在任何现有技术中被认识到,除非另外加以表明。
附图说明
本发明在附图的图中通过示例而非限制的方式进行了例示,并且其中,相同标号指示相似部件,并且其中:
图1A例示了根据本发明一实施例的、保持存在于输入视频序列中的高空间频率内容的多层视频编码器;
图1B例示了根据一实施例的、接收具有高空间频率内容的输入视频信号的多层视频解码器;
图1C例示了根据一实施例的基础层视频解码器;
图2、图3和图4例示了根据一些示例实施例的解复用器的不同构造;
图5例示了一些示例实施例中的复用格式;
图6A和图6B例示了一些示例实施例中的、以上下和并排格式形成图像部分的一个视角的交织内容;
图7例示了一些示例实施例中的、用于携带交织内容的复用格式;
图8A例示了根据本发明一实施例的多层视频编码器;
图8B示出了根据一实施例的多层视频解码器;
图9例示了根据一些示例实施例的解复用器;
图10A和图10B例示了一些示例实施例中的处理流程;
图11例示了根据本发明一示例实施例的、其上可以实现在此描述的计算机或计算装置的示例硬件平台;
图12A和图12B例示了根据本发明一实施例的、FCFR多层视频编码器和FCFR多层视频解码器;
图13A和图13B例示了用于重构全分辨率信号的示例实施例;
图14例示了根据本发明一实施例的、用于生成增强层的编码处理流程;以及
图15例示了根据本发明一实施例的、解码器RPU中的用于生成载波图像信号的滤波处理流程。
具体实施方式
在此描述了涉及3D视频编码的示例实施例。在下面的描述中,出于说明的目的,阐述了许多具体细节,以便提供对本发明的详尽理解。然而,应当清楚,本发明可以在没有这些具体细节的情况下实践。在其它情况下,公知结构和装置未按详尽细节进行描述,以便避免不必要地遮蔽、混淆或模糊本发明。
在此根据下列提纲对示例实施例进行描述:
1、一般概述
2、多层化视频递送
3、解复用器
4、采样格式
5、交织视频应用
6、残留图像编码
7、示例处理流程
8、利用载波信号的残留图像编码
9、实现机构-硬件概述
10、等同、扩展、另选例以及其他
1、一般概述
本概述给出对本发明一示例实施例的一些方面的基本描述。应注意到,本概述不是该示例实施例的各方面的广泛或详尽摘要。而且,应注意到,本概述不是旨在被理解为标识出该示例实施例的任何特定显著方面或元素,也不被理解为描绘该示例实施例的任何具体范围或本发明的任何一般范围。本概述仅以节略和简化格式给出涉及该示例实施例的一些概念,而且应当被理解为仅仅是针对后续示例实施例的更详细描述的概念性序言。
视频数据当前主要通过网络连接来接收,例如,从基于因特网的内容提供方。然而,分配给计算装置上的诸如3D显示应用的显示应用的比特率是受限的。
为支持最广泛的可能种类的3D图像呈现装置,3D图像内容可以作为具有缩减分辨率的帧兼容3D图像帧(或图片)来递送。如所讨论的,3D图像帧可以从全分辨率3D图像帧子采样成缩减分辨率3D图像帧;全分辨率3D图像帧中的高空间频率内容可以通过低通滤波器来去除,以防止子采样图像帧中的混叠。
实施例包括编码并向下游装置提供对称高分辨率3D图像数据。在一些示例实施例中,具有沿水平方向的缩减分辨率和沿垂直方向的全分辨率的第一复用3D图像帧在基础层和增强层中的一个中提供给接收装置,而具有沿垂直方向的缩减分辨率和沿水平方向的全分辨率的第二复用3D图像帧在基础层和增强层中的另一个中提供给接收装置。增强层中的左眼(LE)和右眼(RE)图像数据可以通过接收装置与基础层中的LE和RE图像数据相组合,以重构对称全分辨率LE和RE图像帧。第一复用3D图像帧和第二复用3D图像帧中的一者或两者可以是支持缩减分辨率(低于全分辨率,例如,半分辨率)3D视频应用的兼容帧。
在此描述的编解码器实现技术可以被配置成包括层间预测能力,以充分利用基础层中的复用3D图像帧与输入图像帧之间的统计冗余。增强层中的复用3D图像帧可以(有可能仅仅)携带残留或差分图像数据,而不是携带大量的LE和RE图像数据且不利用不同层的图像数据中的统计冗余。在增强层中提供的残留或差分图像数据使得下游装置能够通过在基础层中的帧兼容复用3D图像帧之上加入该残留或差分图像数据,来构造对称全分辨率LE和RE图像帧。
在一些示例实施例中,编解码器可以被配置成包括如在ITU-T建议H.264和ISO/IEC14496-10中描述的那样来使用的视图间预测能力。在一些示例实施例中,RPU(参考处理单元)可以被用于改进层间预测的效率以用于压缩增强层。
在一些实施例中,基础层和增强层两者中包括补充高空间频率内容的复用3D图像帧可以被发送到高端3D显示器和/或呈现在高端3D显示器上以供观看。另外,这些复用3D图像帧中的一个(例如,帧兼容复用3D图像帧)可以被发送到相对低端3D显示器和/或呈现在相对低端3D显示器上以供观看。
在一些示例实施例中,其它应用所需的数据也可以包括在一个或多个增强层中。在一些示例实施例中,多种多样的特征(如根据可从位于San Francisco,California的Dolby Laboratories购买到的FCFR技术所提供的)可以被如在此描述的基础层和增强层所支持。
在此所描述的技术提供了用于在保持对多种相对低端视频播放器的向后兼容性的同时实现对称高分辨率和高图片质量的解决方案。实施在此描述的技术的显示***能够比实施其它FCFR方案的其它显示***获得更好的重构3D图片的图片质量。特别地,在此描述的显示***与其它显示***相比,能够保留更多高频并且再现具有更多细节的更清晰图片。
在此描述的技术可以被用于减小带宽或比特率使用,并且保持具有缩减分辨率的帧兼容3D图像数据,其支持各种电视机、显示器以及其它图像呈现装置。
另外,针对交织3D内容的选项还可以在这里描述的技术下实施。该选项例如可以被用于承载诸如体育节目的3D广播应用。
在一些实施例中,与没有利用在此描述的技术的其它方法相比,一些可用***组件的重用、改动以及改进允许相对低成本的实现。
在一些示例实施例中,在此描述的机构形成了媒体处理***的一部分,媒体处理***包括但不限于:手持式装置、游戏机、电视机、膝上型计算机、上网本计算机、平板计算机、蜂窝无线电话、电子书阅读器、销售终端点、台式计算机、计算机工作站、计算机信息亭、或各种其它种类的终端以及媒体处理单元。
本领域技术人员将容易地明白针对在此描述的优选实施例和一般原理以及特征的各种修改。由此,本公开不是旨在限制到所示实施例,而是符合与在此描述的原理和特征一致的最广泛范围。
2、多层化视频递送
图1A例示了根据本发明一实施例的、保持存在于输入视频序列中的高空间频率内容的多层视频编码器(100)。图1B例示了根据该示例实施例的、对应于图1A所示多层视频编码器(100)的多层视频解码器(150)。
在一示例实施例中,多层视频编码器(100)被配置成对输入3D视频序列进行编码。该输入3D视频序列由3D输入图像的序列构成。该3D图像序列中的一3D输入图像包括包含高空间频率内容的全分辨率3D图像数据。如在此使用的,术语“全分辨率”可以指一图像帧中的独立可设置像素的总数目最大所支持的空间分辨率。3D输入图像中的全分辨率3D图像数据可以由多层视频编码器(100)初始地解码成输入LE图像帧(102-L)和输入RE图像帧(120-R),这两者都包含高空间频率内容。
在一示例实施例中,多层视频编码器(100)中的一个或多个滤波和子采样机构(例如,104-H和104-V)基于输入LE和RE图像帧(102-L和102-R),生成沿垂直和水平方向中的一个方向滤波而沿垂直和水平方向中的另一个方向不滤波的LE和RE图像数据。
例如,滤波和子采样机构(104-H)可以被配置成,从输入LE和RE图像帧(102-L和102-R)沿水平方向过滤高空间频率内容,并且将已沿水平方向滤波的LE和RE图像帧(102-L和102-R)水平子采样成对应的LE和RE部分。复用器(106-H)可以被配置成,按并排格式将LE和RE部分组合在3D复用图像帧(108-H)中。
类似的是,滤波和子采样机构(104-V)可以被配置成,从输入LE和RE图像帧(102-L和102-R)沿垂直方向过滤高空间频率内容,并且将已沿垂直方向滤波的LE和RE图像帧(102-L和102-R)垂直子采样成对应的LE和RE部分。复用器(106-V)可以被配置成,按上下格式将LE和RE部分组合成3D复用图像帧(108-V)。
对LE和RE图像帧(102-L和102-R)的滤波可以沿水平和垂直方向中的一个方向从输入LE和RE图像帧(102-L和102-R)中去除高空间频率内容的全部或大部分。滤波可以利用滤波和子采样机构(例如,104-H和104-V)中的一个或多个低通滤波器(LPF)来执行。在一示例实施例中,在此描述的滤波沿水平和垂直方向中的一个方向去除或基本上抑制输入图像中超过与多层视频解码器(例如,150)所支持的空间分辨率的一部分(例如,一半或另一分数)相对应的阈值频率的任何空间频率内容。
如在此使用的,术语沿一空间方向(水平或垂直)的“高空间频率内容”可以指存在于输入3D视频序列中的沿该空间方向的高空间频率图像细节。如果沿该空间方向去除高空间频率内容已经发生,则下游装置将不能够利用已沿该空间方向滤波的图像数据来再现高分辨率图像细节。
如在此使用的,在滤波和子采样机构(104-H或104-V)中的子采样器可以被配置成,保留与其中已经过滤/去除高空间频率内容的方向正交的方向上的高空间频率内容。例如,滤波和子采样机构(104-H)中的子采样器可以被配置成,沿其中已经去除高空间频率内容的相同水平方向子采样(例如,每隔一列保持),并且避免沿垂直方向的子采样。类似的是,滤波和子采样机构(104-V)中的子采样器可以被配置成,沿其中已经去除高空间频率内容的相同垂直方向子采样(例如,每隔一行保持),并且避免沿水平方向的子采样。
复用3D图像帧(108-H和108-V中的一个)包括用于左眼的(例如,下采样的)图像数据部分和用于右眼的(例如,下采样的)图像数据部分。复用3D图像帧可以沿水平和垂直方向中的一个由下游装置解码成具有缩减分辨率(例如,半分辨率)的LE图像帧和RE图像帧。具有缩减分辨率的这种经解码的LE和RE图像帧可以上采样以包括与全分辨率图像相同数量的像素,但是比不是通过上采样操作获得的全分辨率图像具有更模糊的外观。
在一示例实施例中,复用3D图像帧(108-H)包括LE和RE图像数据部分,其中每一个都包括全分辨率图像帧中的总像素数的缩减数量(例如,一半、低于一半、或比总数少的另一数量),其中,LE和RE图像数据部分包括沿垂直方向的高空间频率内容,而另一复用3D图像帧(108-V)包括补充LE和RE图像数据部分,其中每一个都包括全分辨率图像帧中的总像素数的缩减数量(例如,一半、低于一半、或比总数少的另一数量),其中,该补充LE和RE图像数据部分包括沿水平方向的高空间频率内容。LE和RE图像数据部分可以按并排格式、上下格式、五点形格式、棋盘格式、交织格式、前述格式的组合、或另一复用格式而在复用3D图像帧(例如,108-H和108-V中的一个)内复用。
一个或多个增强层可以被用于携带第一复用3D图像帧(例如,108-H和108-V中的一个),该第一复用3D图像帧可以在基础层中与第二复用3D图像帧(例如,108-H和108-V中的另一个)相组合。在此描述的多层视频解码器(例如,150)可以被配置成,基于第一和第二复用3D图像帧(例如,108-H和108-V),生成在垂直和水平方向上都具有高空间分辨率内容的图像帧。
在一示例实施例中,BL编码器(110)至少部分地基于第一复用3D图像帧(例如,108-H),生成要在基础层帧兼容视频流(BL FC视频流112-1)中携带的基础层视频信号,而EL编码器(116)至少部分地基于第二复用3D图像帧(例如,108-V),生成要在增强层帧兼容视频流(ELFC视频流112-3)中携带的增强层视频信号。BL编码器(110)和EL编码器(116)中的一者或两者可以利用多种编解码器(如H.264/AVC、VP8、VC-1和/或其它)中的一种或多种来实现。
在此描述的增强层视频信号可以利用混合视频编码方法(例如,通过视频编解码器(如VC-1、H.264/AVC和/或其它)实现的方法)来生成。复用3D图像帧108-V中的图像数据可以根据同一图像帧中的相邻采样而被预测(利用帧内预测),或者根据来自属于同一层且被缓冲作为预测参考图像帧缓冲器内的运动补偿预测参考的、过去已解码的图像帧的采样而被预测(帧间预测)。层间预测还可以至少部分地基于来自其它层(例如,基础层等)的已解码的信息。
另外和/或可选地,多层视频编码器(100)可以包括用于执行涉及预测的操作的参考处理单元(RPU,114)。通过参考处理单元(114)执行的预测可以被用于减小多层视频解码器(150)中在构造复用3D图像帧时的冗余数据和开销。该RPU(114)可以接收并使用来自BL编码器110的BL图像数据和其它预测相关信息,并且通过帧内或帧间预测生成预测参考图像帧。
在使用这种预测的那些示例实施例中,EL编码器(116)至少部分地基于第二复用3D图像帧(108-V)和预测参考图像帧,来生成预测参考图像帧与第二复用3D图像帧108-V之间的复用3D图像残留或差分,并将该图像残留存储在要在EL FC视频流(112-3)中携带的增强层视频信号中。而且,基于该预测和编码处理,RPU(114)可以生成编码信息,该编码信息可以利用RPU流(112-2)作为元数据发送至解码器。
图1B例示了根据一实施例的接收输入视频信号的多层视频解码器(150),其中,来自原始视频序列(其可以是如结合图1A讨论的输入视频序列)的、沿两个正交方向的高空间频率内容已经分别保留在增强层和基础层中所携带的互补图像数据中。在一示例实施例中,输入视频信号在多个层(或多个比特流)中被接收。如在此使用的,术语“多层”或“多个层”可以指携带(各输入视频信号)彼此之间具有一个或多个逻辑依赖关系的输入视频信号的两个或更多个比特流。
在一示例实施例中,该多层视频解码器(150)被配置成将BL FC视频流(图1B的112-1)、EL RPU流(图1B的112-2)、以及EL FC视频流(图1B的112-3)中的一个或多个输入视频信号解码成(全分辨率)3D输出图像的序列。通过多层视频解码器(150)解码的3D输出图像序列中的3D输出图像包括用于双眼的高空间分辨率内容,因为已经沿水平和垂直方向两者保留了输入视频信号所源自的原始视频序列中的高空间频率内容。
在一示例实施例中,BL解码器(152)至少部分地基于从BL FC视频流(图1B的112-1)接收的BL视频信号,生成第一复用3D图像帧(158-H),而EL解码器(156)至少部分地基于从EL FC视频流(图1B的112-3)接收的EL视频信号,生成第二复用3D图像帧(158-V)。BL解码器(152)和EL解码器(156)中的一者或两者可以利用多种编解码器(如H.264/AVC、VP8、VC-1和/或其它)中的一种或多种来实现。
在使用预测的实施例中,解码器侧的RPU(154)至少部分地基于从EL RPU流(图1B的112-2)接收的参考视频信号和/或来自BL解码器(152)的BL图像数据,生成预测参考图像帧。而且,EL解码器(156)至少部分地基于EL FC视频流(图1B的112-3)中的EL视频信号和来自RPU(154)的预测参考图像帧,生成第二复用3D图像帧(158-V)。
多层视频解码器(150)可以组合在一个或多个增强层(例如,ELRPU流112-2和EL FC视频流112-3)中接收的补充图像数据和在基础层(例如,BL FC视频流112-1)中接收的图像数据,以生成包括沿垂直和水平方向两者的高空间频率内容的全分辨率LE和RE输出图像帧(例如,162-L和162-R)。例如,解复用器(DeMux,160)可以被配置成,将复用3D图像帧(158-H和158-V)解复用成具有高空间频率内容的LE和RE输出图像帧(162-L和162-R)。虽然这些复用3D图像帧(158-H和158-V)皆包括用于左眼和右眼两者的图像数据,但LE和RE输出图像帧(162-L和162-R)中的每一个都仅用于左眼和右眼中的一个。第一复用3D图像帧(158-H)中的第一LE图像数据部分可以与第二复用3D图像帧(158-V)中的第二LE图像数据部分相组合,以形成包括沿垂直方向和水平方向两者的高空间频率内容的LE输出图像(162-L)。类似的是,第一复用3D图像帧(158-H)中的第一RE图像数据部分可以与第二复用3D图像帧(158-V)中的第二RE图像数据部分相组合,以形成包括沿垂直方向和水平方向两者的高空间频率内容的RE输出图像(162-R)。
全分辨率LE和RE输出图像帧(162-L和162-R)(这两者包括沿垂直方向和水平方向两者的高空间频率内容)可以通过显示装置(其例如可以包括多层视频解码器150)被呈现,以展现全分辨率输出3D图像。呈现全分辨率LE和RE输出图像帧可以(但不限于)采用帧顺序方式。因为高空间频率内容已经保留在通过多层视频解码器(150)接收的视频信号中,所以该全分辨率输出3D图像包含可能存在于原始3D图像(其可以是图1A的3D输入图像之一)中的高空间频率图像细节。
图1C例示了根据一实施例的、接收从原始视频序列(其可以是如结合图1A讨论的输入视频序列)生成的一个或多个输入视频信号的基础层视频解码器(150-1)。在一示例实施例中,该基础层视频解码器(150-1)被配置成将从基础层接收的BL输入视频信号(图1C的BL FC视频流112-1)解码成3D输出图像的序列,无论其它层中的视频信号是否可能存在或不存在于通过解码器接收的物理信号中。在一示例实施例中,基础层视频解码器(150-1)被配置成忽略除了BL FC视频流(112-1)以外的其它流中任何视频信号的存在。
通过基础层视频解码器(150-1)生成的3D输出图像序列中的3D输出图像不包括全分辨率3D图像数据,因为输入视频信号所源自的原始视频信号中的沿垂直和水平方向之一的高空间频率内容已经在基础层视频信号中被过滤/去除并且不能由基础层视频解码器(150-1)恢复。
在一示例实施例中,BL解码器(图1C的152)至少部分地基于BL FC视频流(图1C的112-1)中的BL输入视频信号,生成复用3D图像帧(例如,图1C的158-H)。BL解码器(图1C的152)可以利用多种编解码器(如H.264/AVC、VP8、VC-1和/或其它)中的一种或多种来实现。
在一示例实施例中,上采样单元(170)将复用3D图像帧(158-H)解复用和/或分离成两个图像数据部分。当复用3D图像帧(158-H)包括用于左眼和右眼两者的复用的已滤波图像数据时,这些图像数据部分包括已滤波LE图像数据部分和已滤波RE图像数据部分,其中每一个都具有低于全分辨率的缩减分辨率。在一示例实施例中,上采样单元(170)上采样(例如,沿水平方向扩展)已滤波LE图像数据部分,以形成上采样LE已滤波输出图像帧(172-L)。类似的是,上采样单元(170)上采样(例如,沿水平方向扩展)已滤波RE图像数据部分,以形成上采样RE已滤波输出图像帧(172-R)。尽管上采样LE和RE已滤波图像帧(172-L和172-R)皆可以包括与全分辨率图像帧相同数量的像素,但是与不是通过上采样操作获得的全分辨率LE和RE图像帧(图1B的162-L和162-R)所构成的3D图像相比,所呈现的具有上采样LE和RE已滤波图像帧(172-L和172-R)的3D图像具有更模糊的外观。另外,上采样LE和RE已滤波图像帧(172-L和172-R)不具有在BL视频信号(其例如可以从图1A的112-1导出)的编码处理中去除的高空间频率图像细节。
低于全分辨率的上采样LE和RE已滤波图像帧(172-L和172-R)可以通过显示装置(其例如可以包括基础层视频解码器150-1)呈现,以展现输出3D图像。呈现上采样LE和RE已滤波图像帧(172-L和172-R)可以但不限于采用帧顺序方式。
3、解复用器
图2、图3和图4例示了根据一些示例实施例的、图1B的解复用器160的不同构造。解复用器(160-1到160-5)皆可以被配置成,接受从第一复用3D图像帧(例如,158-H)解码/导出的第一LE部分(202-L)和从第二复用3D图像帧(例如,158-V)解码/导出的第二LE部分(204-L)。第一LE部分(202-L)可以包括沿垂直和水平方向中的一个(例如,垂直方向)的高空间频率内容,而第二LE部分(204-L)可以包括沿垂直和水平方向中的另一个(同一示例中为水平方向)的高空间频率内容。
解复用器(160-1到160-5)皆可以被配置成,处理并组合第一LE部分(202-L)和第二LE部分(204-L),以生成包括沿垂直和水平方向两者的高空间频率内容的全分辨率LE图像帧(162-L)。
与解复用器(160-1到160-5)中的每一个相似的解复用器可以被配置成,接受从第一复用3D图像帧(158-H)解码/导出的第一RE部分和从第二复用3D图像帧(158-V)解码/导出的第二RE部分。第一RE部分可以包括沿垂直方向的高空间频率内容,而第二RE部分可以包括沿水平方向的高空间频率内容。该解复用器可以被配置成,处理并组合第一RE部分和第二RE部分,以生成包括沿垂直和水平方向两者的高空间频率内容的全分辨率RE图像帧(图1B的162-R)。
如图2所示,解复用器(160-1)中的上采样器(206-H)可以被配置成,沿水平方向上采样第一LE部分(202-L),以创建第一LE图像帧(208-H)。类似的是,解复用器(160-1)中的上采样器206-V可以被配置成,沿垂直方向上采样第二LE部分(204-L),以创建第二LE图像帧(208-V)。
第一低通滤波器(210-1)和第一高通滤波器(210-2)可以被应用至第一LE图像帧(208-H),以产生第一低通LE图像帧(212-1)和第一高通LE图像帧(212-2)。类似的是,第二低通滤波器(214-1)和第二高通滤波器(214-2)可以被应用至第二LE图像帧(208-V),以产生第二低通LE图像帧(216-1)和第二高通LE图像帧(216-2)。
解复用器(160-1)中的平均单元(218)可以被配置成,接受第一低通LE图像帧(212-1)和第二低通LE图像帧(216-1)作为输入,并且针对第一低通LE图像帧(212-1)和第二低通LE图像帧(216-1)应用平均操作,以生成低通平均LE图像帧。
解复用器(160-1)中的加法器(220)可以被配置成,接受第一高通LE图像帧(212-2)、第二高通LE图像帧(216-2)以及低通平均LE图像帧作为输入,并且针对第一高通LE图像帧(212-2)、第二高通LE图像帧(216-2)以及低通平均LE图像帧应用加法操作,以生成包括沿垂直和水平方向两者的高空间频率内容的全分辨率LE图像帧(162-L)。
在一些实施例中,例如,出于抗混叠目的,已经由多层视频编码器(例如,图1A的100)应用了低通滤波。图2的解复用器(160-1)可以根据如图3A和图3B例示的一些实施例来简化。在这些实施例中,可以通过消除可以在图2的复用器160-1中使用的低通滤波器(例如,210-1和214-1)和平均单元(218)来减小解码复杂性。
如图3A所示,解复用器(160-2)中的上采样器(206-H)可以被配置成,沿水平方向上采样第一LE部分(202-L),以创建包括沿垂直方向的高空间频率内容的LE图像帧(208-H)。
保留沿水平方向的高空间频率内容的高通滤波器(214-2)可以被应用至第二LE部分(202-L),以产生高通LE部分。解复用器(160-2)中的上采样器206-V可以被配置成,沿垂直方向上采样高通LE部分,以创建包括沿水平方向的高空间频率内容的高通LE图像帧(216-2)。
解复用器(160-2)中的加法器(222)可以被配置成,接受高通LE图像帧(216-2)和LE图像帧(208-H)作为输入,并且针对高通LE图像帧(216-2)和LE图像帧(208-H)应用加法操作,以生成包括沿垂直和水平方向两者的高空间频率内容的全分辨率LE图像帧(162-L)。
在一些实施例中,代替使用如图3A所示的解复用器(160-2)来导出全分辨率LE图像帧(例如,162-L),可以使用如图3B所示的解复用器(160-3)。在图3B中,解复用器(160-3)中的上采样器(206-V)可以被配置成,沿垂直方向上采样第二LE部分(204-L),以创建包括沿水平方向的高空间频率内容的LE图像帧(208-V)。
保留沿垂直方向的高空间频率内容的高通滤波器(210-2)可以被应用至第一LE部分(202-L),以产生高通LE部分。解复用器(160-3)中的上采样器206-H可以被配置成,沿水平方向上采样高通LE部分,以创建包括沿垂直方向的高空间频率内容的高通LE图像帧(212-2)。
解复用器(160-3)中的加法器(222)可以被配置成,接受高通LE图像帧(212-2)和LE图像帧(208-V)作为输入,并且针对高通LE图像帧(212-2)和LE图像帧(208-V)应用加法操作,以生成包括沿垂直和水平方向两者的高空间频率内容的全分辨率LE图像帧(162-L)。
在一些实施例中,代替使用如图3A和图3B所示的解复用器(160-2或160-3)中的高通滤波器(例如,图3A的214-2或图3B的210-2)来导出全分辨率LE图像帧(例如,162-L),可以使用如图4A所示的减法操作。与高通滤波操作形成对比,诸如402的减法操作可以需要更少的计算复杂性。
仅出于例示的目的,第一LE部分(202-L)可以从BL视频信号解码,而第二LE部分(204-L)可以从EL视频信号解码。如图4A所示,参考LE部分404(其可以具有与第二LE部分(204-L)相同的空间尺度)可以在层间预测处理期间,由RPU406(其例如可以是图1B的154)基于第一LE部分(202-L)来生成。在一些实施例中,包括沿垂直方向的低通滤波器(408)(其去除沿垂直方向的高空间频率内容)、垂直子采样器(410;其例如可以每隔一行保持)、以及水平上采样器(412)的处理路径或子路径可以被用于生成参考LE部分404。
减法操作(402)可以被配置成,接受参考LE部分404(其除了由上游的多层视频编码器(例如,图1A的100)去除的沿水平方向的高空间频率内容以外,还沿垂直方向去除了高空间频率内容)和第二LE部分(204-L)作为输入,并且从第二LE部分(204-L)中减去参考LE部分404,以生成包括仅沿水平方向的高空间频率内容的高通LE部分。在一些实施例中,在此描述的高通LE部分可以等同于由图3A的高通滤波器(214-2)生成的高通LE部分。
与图3A的解复用器(160-2)相似,图4A的解复用器(160-4)可以包括上采样器206-V,其可以被配置成沿垂直方向上采样高通LE部分,以创建包括沿水平方向的高空间频率内容的高通LE图像帧(216-2)。
解复用器(160-4)中的加法器(222)可以被配置成,接受高通LE图像帧(216-2)和LE图像帧(208-H)(由水平上采样器206-H从第一LE部分202-L生成)作为输入,并且针对高通LE图像帧(216-2)和LE图像帧(208-H)应用加法操作,以生成包括沿垂直和水平方向两者的高空间频率内容的全分辨率LE图像帧(162-L)。
如图4B所示,参考LE部分424(其可以具有与第一LE部分(202-L)相同的空间尺度)可以在层间预测处理期间,由RPU426(其例如可以是图1B的154)基于第二LE部分(204-L)来生成。在一些实施例中,包括沿垂直方向的低通滤波器(428(其去除沿垂直方向的高空间频率内容)、垂直子采样器(430;其例如可以每隔一行保持)、以及水平上采样器(432))的处理路径或子路径可以被用于生成参考LE部分404。
解复用器(160-5)中的减法操作(422)可以被配置成,接受参考LE部分424(其除了由上游的多层视频编码器(例如,图1A的100)去除的沿垂直方向的高空间频率内容以外,还沿水平方向去除了高空间频率内容)和第一LE部分(202-L)作为输入,并且从第一LE部分(202-L)中减去参考LE部分424,以生成包括仅沿垂直方向的高空间频率内容的高通LE部分。在一些实施例中,在此描述的高通LE部分可以等同于由图3B的高通滤波器(210-2)生成的高通LE部分。
与图3B的解复用器(160-3)相似,图4B的解复用器(160-5)可以包括上采样器206-H,其可以被配置成沿水平方向上采样高通LE部分,以创建包括沿垂直方向的高空间频率内容的高通LE图像帧(212-2)。
解复用器(160-5)中的加法器(222)可以被配置成,接受高通LE图像帧(212-2)和LE图像帧(208-V)(由垂直上采样器206-V从第二LE部分204-L生成)作为输入,并且针对高通LE图像帧(212-2)和LE图像帧(208-V)应用加法操作,以生成包括沿垂直和水平方向两者的高空间频率内容的全分辨率LE图像帧(162-L)。
4、采样格式
图5例示了一些示例实施例中的复用格式。如所示,LE图像帧(例如,102-L或由其导出的LE图像)和RE图像帧(例如,102-R或由其导出的RE图像)可以包括针对3D图像帧中的多个像素(ai、bi、ci、di等,其中i可以是正整数)的LE和RE像素值。在一些实施例中,诸如图1A的复用图像帧108-H的并排复用图像帧可以使用多种并排复用格式(108-H-1、108-H-2、108-H-3,或其它并排复用格式)中的任一种,以容纳从LE和RE图像帧(102-L和102-R)水平子采样的图像数据。在一些实施例中,诸如图1A的复用图像帧108-V的上下复用图像帧可以使用多种上下复用格式(108-V-1、108-V-2、108-V-3,或其它上下复用格式)中的任一种,以容纳从LE和RE图像帧(102-L和102-R)垂直子采样的图像数据。
诸如图1的106-H或106-V的复用器可以基于一个或多个因素(例如,与复用器所采用的子采样方法有关)从多种复用格式中进行复用格式的一个或多个选择,并且可以向多层视频解码器(例如,图1B的150)通知对复用格式的选择,作为例如利用RPU流112-2的元数据。多层视频解码器(150)中的RPU单元(例如,图4A的406或图4B的426)可以基于与从BL视频信号解码的复用3D图像帧(例如,对应于图1A的108-H)来构造层间参考帧或图像部分(例如,图4A的404或图4B的424),其中考虑了在生成被编码在BL和EL层两者中的复用3D图像帧(108-H和108-V)(差分或非差分)时,上游多层视频编码器所使用的所采用子采样方法。
5、交织视频应用
图6A例示了一些示例实施例中的、按上下格式形成图像部分(606)的同一视角(左眼或右眼)的交织内容(602)。在图6A中,该交织内容(602)可以首先解复用成等于t的第一时间的(例如1080i的)上场(topfield)(604-T)和等于t+1的第二时间的(例如1080i的)下场(bottom field)(604-B)。在图6A中,上场(604-T)和下场(604-B)中的每一个都可以垂直地滤波并垂直地子采样成第一半场(608-1)(例如,在垂直方向上具有全空间分辨率的一半或不到一半或者具有低于全空间分辨率的另一分辨率)和第二半场(608-2)(例如,在垂直方向上具有全空间分辨率的一半或不到一半或者具有低于全空间分辨率的另一分辨率)。而且,在图6A中,第一半场(608-1)和第二半场(608-2)可以被交织成第一交织图像帧中的上或下场(606)。
图6B例示了一些示例实施例中的、按并排格式形成图像部分(626)的同一视角(左眼或右眼)的交织内容(602)。在一些实施例中,该交织内容(602)在水平滤波和水平子采样并接着交织成图像部分(626)之前不需要被解复用成两个分离的场。相反的是,该交织内容(602)可以被直接水平滤波和水平子采样成图像部分(626)。图6B所示操作可以针对LE和RE视角中的每一个来执行,并且可以构建滤波和采样机构(104-H)的一半。
图6A和图6B中描述的操作可以被应用至左眼和右眼视角中的每一个,由此,形成具有上下格式的第一交织图像帧(如图6A中部分所示),和具有并排格式的第二交织图像帧(如图6B中部分所示)。第一交织帧和第二交织帧中的一个交织帧可以被携带在BL视频信号中,而另一(差分或者非差分编码的)交织帧可以被携带在EL视频信号中。结果,第一交织图像帧和第二交织图像帧中的一个(例如,本示例中的第一交织图像帧)携带沿水平方向的高空间频率内容,而第一交织图像帧和第二交织图像帧中的另一个(例如,本示例中的第二交织图像帧)携带沿垂直方向的高空间频率内容。
图7例示了一些示例实施例中的、用于携带交织内容的复用格式。如图6A和图6B所示,沿水平或垂直方向的低通滤波和子采样可以针对交织内容以场为基础。左图像场(708-L)和右图像场(708-R)可以分别对应于交织内容的LE和RE视角达等于t的时间。左图像场(708-L)和右图像场(708-R)之一的像素值可以在如图6B所示地应用水平滤波和水平子采样时,被用于填充如图7所示的多种复用(或子采样)格式(708-H-1、708-H-2、708-H-3等)中的任一种的左侧或右侧。类似的是,左图像场(708-L)和右图像场(708-R)之一的像素值可以在如图6A所示地应用垂直滤波和水平子采样时,被用于填充如图7所示的多种复用(或子采样)格式(708-V-1、708-V-2、708-V-3等)中的任一种的上侧或下侧。在一些实施例中,LE和RE视角两者的并且对应于等于t的第一时间和等于t+1的第二时间两者的所有图像场中的子采样图像数据以应用至交织内容的上下格式存在。
6、残留图像编码
图8A例示了根据本发明一实施例的、保持存在于输入视频序列中的高空间频率内容的多层视频编码器(100-1)。图8B示出了根据该示例实施例的、对应于图8A所示多层视频编码器(100-1)的多层视频解码器(150-2)。
在一示例实施例中,多层视频编码器(100-1)被配置成编码由3D输入图像的序列构成的输入3D视频序列。该3D图像序列中的一3D输入图像包括包含高空间频率内容的全分辨率3D图像数据。3D输入图像中的全分辨率3D图像数据可以由多层视频编码器(100)初始地解码成输入LE图像帧(102-L)和输入RE图像帧(120-R),这两者都包含高空间频率内容。
在一示例实施例中,多层视频编码器(100)中的第一滤波和子采样机构(例如,104-H)基于输入LE和RE图像帧(102-L和102-R),生成沿垂直或水平方向中的一个方向滤波而沿垂直或水平方向中的另一个方向不滤波的LE和RE图像数据。出于例示的目的,该第一滤波和子采样机构可以是图8A的104-H,其被配置成,从输入LE和RE图像帧(102-L和102-R)沿水平方向过滤高空间频率内容,并且将已沿水平方向滤波的LE和RE图像帧(102-L和102-R)水平子采样成对应的LE和RE部分。复用器(106-H)可以被配置成,按并排格式将LE和RE部分组合在3D复用图像帧(108-H)中。
在一些实施例中,代替通过EL处理子路径(包括滤波、子采样、复用以及压缩成EL视频信号)来处理LE和RE图像帧(102-L和102-R),LE和RE残留图像帧(806-L和806-R)可以通过EL处理子路径来处理。如图8A所示,RPU(114)可以被配置成,基于BL编码器(110)所提供的复用3D图像帧(108-H)来生成LE和RE参考图像部分。来自RPU(114)的LE和RE参考图像部分可以沿与BL处理子路径的子采样方向相同的方向进行上采样。例如,如果包括水平滤波、水平子采样、并排复用以及BL编码的BL处理子路径沿水平方向执行输入LE和RE图像帧(102-L和102-R)的子采样,则RPU(114)生成的LE和RE参考图像部分皆可以沿水平方向上采样,以形成上采样LE图像帧(804-L)和上采样RE图像帧(804-R)。
加法操作(810-L)可以被配置成,接受上采样LE图像帧804-L(其已经通过BL处理子路径沿水平方向去除了高空间频率内容)的补充和输入LE图像帧(102-L)作为输入,并且将输入LE图像帧(102-L)与上采样LE图像帧804-L的补充相加,以生成包括仅沿水平方向的高空间频率内容的LE残留图像帧(806-L)。加法操作(810-R)可以被配置成,接受上采样RE图像帧804-R(其已经通过BL处理子路径沿水平方向去除了高空间频率内容)的补充和输入RE图像帧(102-R)作为输入,并且将输入RE图像帧(102-R)与上采样RE图像帧804-R的补充相加,以生成包括仅沿水平方向的高空间频率内容的RE残留图像帧(806-R)。
第二滤波和子采样机构可以是图8A的104-V,其被配置成,将LE和RE残留图像帧(806-L和806-R)垂直子采样成对应的LE和RE残留部分。另外并且可选地,该第二滤波和子采样机构可以包括垂直滤波器,其被配置成,例如在上述针对LE和RE残留图像帧(806-L和806-R)的子采样操作之前,垂直地滤波LE和RE残留图像帧(806-L和806-R)。复用器(106-V)可以被配置成,按上下格式将LE和RE残留部分组合在3D复用图像帧(808-V)中。
在一示例实施例中,BL编码器(110)至少部分地基于第一复用3D图像帧(例如,108-H),生成要在基础层帧兼容视频流(BL FC视频流112-1)中携带的基础层视频信号,而EL编码器(116)至少部分地基于第二复用3D图像帧(例如,808-V),生成要在增强层帧兼容视频流(ELFC视频流112-3)中携带的增强层视频信号。BL编码器(110)和EL编码器(116)中的一者或两者可以利用多种编解码器(如H.264/AVC、VP8、VC-1和/或其它)中的一种或多种来实现。
图8B例示了根据一实施例的接收输入视频信号的多层视频解码器(150-2),其中,来自原始视频序列(其可以是如结合图8A讨论的输入视频序列)的、沿两个正交方向的高空间频率内容已经分别保留在增强层和基础层中所携带的互补图像数据中。
在一示例实施例中,该多层视频解码器(150-2)被配置成将BL FC视频流(图8B的112-1)、EL RPU流(图8B的112-2)、以及EL FC视频流(图8B的112-3)中的一个或多个输入视频信号解码成3D输出图像的序列。通过多层视频解码器(150-2)解码的3D输出图像序列中的3D输出图像包括用于双眼的高空间频率内容,因为已经沿水平和垂直方向两者保留了输入视频信号所源自的原始视频序列中的高空间频率内容。
在一示例实施例中,BL解码器(152)至少部分地基于从BL FC视频流(图8B的112-1)接收的BL视频信号,生成第一复用3D图像帧(158-H),而EL解码器(156)至少部分地基于从EL FC视频流(图8B的112-3)接收的EL视频信号,生成第二复用3D图像帧(858-V)。BL解码器(152)和EL解码器(156)中的一者或两者可以利用多种编解码器(如H.264/AVC、VP8、VC-1和/或其它)中的一种或多种来实现。
在一些实施例中,EL解码器(156)至少部分地基于EL FC视频流(图8B的112-3)中的EL视频信号而不需要来自RPU(154)的预测参考图像帧,来生成第二复用3D图像帧(858-V)。
多层视频解码器(150-2)可以组合在一个或多个增强层(例如,EL FC视频流112-3)中接收的残留图像数据和在基础层(例如,BL FC视频流112-1)中接收的图像数据,以生成包括沿垂直和水平方向两者的高空间频率内容的全分辨率LE和RE输出图像帧(例如,162-L和162-R)。例如,解复用器(DeMux,160)可以被配置成,将复用3D图像帧(158-H和858-V)解复用成具有高空间频率内容的LE和RE输出图像帧(162-L和162-R)。虽然这些复用3D图像帧(158-H和858-V)皆包括用于左眼和右眼两者的图像数据,但LE和RE输出图像帧(162-L和162-R)中的每一个都仅用于左眼和右眼中的一个。第一复用3D图像帧(158-H)中的第一LE图像数据部分可以与第二复用3D图像帧(158-V)中的第二LE图像数据部分相组合,以形成包括沿垂直方向和水平方向两者的高空间频率内容的LE输出图像(162-L)。类似的是,第一复用3D图像帧(158-H)中的第一RE图像数据部分可以与第二复用3D图像帧(158-V)中的第二RE图像数据部分相组合,以形成包括沿垂直方向和水平方向两者的高空间频率内容的RE输出图像(162-R)。
全分辨率LE和RE输出图像帧(162-L和162-R)(这两者包括沿垂直方向和水平方向两者的高空间频率内容)可以通过显示装置(其例如可以包括多层视频解码器150)被呈现,以展现全分辨率输出3D图像。呈现全分辨率LE和RE输出图像帧可以(但不限于)采用帧顺序方式。因为高空间频率内容已经保留在通过多层视频解码器(150)接收的视频信号中,所以该全分辨率输出3D图像包含可能存在于原始3D图像(其可以是图8A的3D输入图像之一)中的高空间频率图像细节。
在图8A和图8B所示的实施例中,不需要层间预测。与在其它实施例(例如,如图1A和图所示)中相比,在这些实施例中通过多层视频解码器解码BL和EL图像数据可以更大程度上独立地执行。结果,与图2到图4所示那些相比,可以在诸如图8B的150-2的多层视频解码器中使用更简单的解复用器(例如,图9的160-6)。
应注意到,残留图像数据在渐进视频应用中可以利用如图5所示的任何子采样格式并且在交织视频应用中可以利用如图7所示的任何子采样格式而被子采样。在此描述的PRU信号可以被用于向下游视频解码器通知由上游多层视频编码器编码的BL和EL图像数据的选定子采样格式。
7、示例处理流程
图10A例示了根据本发明一实施例的示例处理流程。在一些示例实施例中,一个或多个计算装置或硬件组件可以执行该处理流程。在框1002中,多层视频编码器(例如,100)接收输入3D图像,该输入3D图像包括左眼(LE)输入图像帧和右眼(RE)输入图像帧。
在框1004中,多层视频编码器(100)基于LE输入图像帧和RE输入图像帧,生成包括沿水平方向的第一高空间频率内容和沿垂直方向的第一缩减分辨率内容的第一复用图像帧。
在框1006中,多层视频编码器(100)基于LE输入图像帧和RE输入图像帧,生成包括沿垂直方向的第二高空间频率内容和沿水平方向的第二缩减分辨率内容的第二复用图像帧。
在框1008中,多层视频编码器(100)编码并输出第一复用图像帧和第二复用图像帧,以表示输入3D图像。
在一实施例中,该3D输入图像是3D输入图像序列中的第一3D输入图像,其中该3D输入图像序列包括具有第二LE输入图像帧和第二LE输入图像帧的不同的第二3D输入图像。该多层视频编码器(100)还被配置成执行:基于第二LE输入图像帧和第二RE输入图像帧,生成包括沿水平方向的第三高空间频率内容和沿垂直方向的第三缩减分辨率内容的第三复用图像帧;基于第二LE输入图像帧和第二输入图像帧,生成包括沿垂直方向的第四高空间频率内容和沿水平方向的第四缩减分辨率内容的第四复用图像帧;以及编码并输出第三复用图像帧和第四复用图像帧,以表示第二输入3D图像。
在一实施例中,第一复用图像帧包括第一LE图像数据部分和第一RE图像数据部分。该第一LE图像数据部分和第一RE图像数据部分沿水平方向和垂直方向都具有相同的空间分辨率。第二复用图像帧包括第二LE图像数据部分和第二RE图像数据部分。该第二LE图像数据部分和第二RE图像数据部分沿水平方向和垂直方向都具有相同的空间分辨率。在一实施例中,第一LE图像数据部分和第一RE图像数据部分中的每一个表示整个图像帧的一个子采样版本(例如,全分辨率的一半、低于一半、或另一缩减数量);第一复用图像帧采用并排格式来携带第一LE图像数据部分和第一RE图像数据部分。第二LE图像数据部分和第二RE图像数据部分中的每一个表示整个图像帧的一个子采样版本(例如,全分辨率的一半、低于一半、或另一缩减数量);第二复用图像帧采用上下格式来携带第二LE图像数据部分和第二RE图像数据部分。
在一实施例中,第一复用图像帧采用保留沿水平方向的高空间频率内容的第一复用格式。第二复用图像帧采用保留沿垂直方向的高空间频率内容的第二复用格式。
在一实施例中,第一复用图像帧或第二复用图像帧中的一个在多个比特流中的基础层比特流中输出,而第一复用图像帧或第二复用图像帧中的另一个在所述多个比特流中的增强层比特流中输出。
在一实施例中,多层视频编码器(100)还被配置成执行:至少部分地基于第一复用图像帧生成预测参考图像数据;并且基于该预测参考图像数据与第二输入图像帧之间的差分来编码增强层视频信号。
在一实施例中,多层视频编码器(100)还被配置成执行:在生成第一复用图像帧时,向第一输入图像帧和第二输入图像帧应用沿第二方向的一个或多个第一操作,包括(a)空间频率滤波操作或(b)空间子采样操作中的至少一个,其中,所述一个或多个第一操作去除沿第二方向的高空间频率内容而保留沿第一方向的高空间频率内容;以及,在生成第二复用图像帧时,向第一输入图像帧和第二输入图像帧应用沿第一方向的一个或多个第二操作,包括(a)空间频率滤波操作或(b)空间子采样操作中的至少一个,其中,所述一个或多个第二操作去除沿第一方向的高空间频率内容而保留沿第二方向的高空间频率内容。
在一实施例中,第一复用图像帧或第二复用图像帧中的一个包括残留图像数据,该残留图像数据通过从根据LE输入图像帧和RE输入图像帧导出的输入图像数据中减去基于第一复用图像帧或第二复用图像帧中的另一个所生成的参考图像数据而生成。
在一实施例中,多层视频编码器(100)还被配置成将利用一个或多个输入视频信号表示、接收、发送、或存储的一个或多个3D输入图像转换成利用一个或多个输出视频信号表示、接收、发送、或存储的一个或多个3D输出图像。
在一实施例中,输入3D图像包括按以下之一编码的图像数据:高动态范围(HDR)图像格式、与电影艺术和科学学院(AMPAS)的学院颜色编码规范(ACES)标准相关联的RGB颜色空间、数字院线联盟的P3颜色空间标准、参考输入媒介度量/参考输出媒介度量(RIMM/ROMM)标准、sRGB颜色空间、与国际电信联盟(ITU)的BT.709推荐标准相关联的RGB颜色空间等。
图10B例示了根据本发明一示例实施例的另一示例处理流程。在一些示例实施例中,一个或多个计算装置可以执行该处理流程。在框1052中,多层视频解码器(例如,150)接收由第一复用图像帧和第二复用图像帧表示的3D图像,该第一复用图像帧包括沿水平方向的第一高空间频率内容和沿垂直方向的第一缩减分辨率内容,而第二复用图像帧包括沿垂直方向的第二高空间频率内容和沿水平方向的第二缩减分辨率内容。
在框1054中,多层视频编码器(150)基于第一复用图像帧和第二复用图像帧,生成左眼(LE)图像帧和右眼(RE)图像帧,该LE图像帧包括沿水平方向和垂直方向两者的LE高空间频率内容,而该RE图像帧包括沿水平方向和垂直方向两者的RE高空间频率内容。
在框1056中,多层视频解码器(150)通过呈现LE图像帧和RE图像帧来呈现3D图像。
在一实施例中,该3D图像是3D图像序列中的第一3D图像,其中该3D图像序列包括具有第三复用图像帧和第四复用图像帧的不同的第二3D图像,该第三复用图像帧包括沿水平方向的第三高空间频率内容和沿垂直方向的第三缩减分辨率内容,而该第四复用图像帧包括沿垂直方向的第四高空间频率内容和沿水平方向的第四缩减分辨率内容。在一实施例中,多层视频解码器(150)还被配置成执行:生成第二LE图像帧和第二RE图像帧,该第二LE图像帧包括沿水平方向和垂直方向两者的高空间频率内容,并且该第二LE图像帧包括沿水平方向和垂直方向两者的高空间频率内容;以及,通过呈现第二LE图像帧和第二RE图像帧来呈现第二3D图像。
在一实施例中,该第一复用图像帧或第二复用图像帧中的至少一个包括LE图像数据部分和RE图像数据部分。该LE图像数据部分和RE图像数据部分具有相同的空间分辨率。在一实施例中,该LE图像数据部分和RE图像数据部分中的每一个表示整个图像帧的一个子采样版本(例如,全分辨率的一半、低于一半、或另一减小数量)。该LE图像数据部分和RE图像数据部分按并排格式或上下格式之一形成单个图像帧。
在一实施例中,从多个比特流中的基础层比特流解码第一复用图像帧或第二复用图像帧中的一个,而从所述多个比特流中的增强层比特流解码第一复用图像帧或第二复用图像帧中的另一个。
在一实施例中,多层视频解码器(150)还被配置成执行:至少部分地基于该第一复用图像帧或第二复用图像帧中的一个,生成预测参考图像数据;并且基于根据增强层(EL)视频信号和该预测参考图像数据解码的EL数据,生成LE图像帧或RE图像帧中的一个。
在一实施例中,多层视频解码器(150)还被配置成执行:在生成LE图像帧时应用一个或多个第一操作,包括(a)空间频率滤波操作或(b)解复用操作中的至少一个,其中,所述一个或多个第一操作将水平方向和垂直方向两者的、从第一复用图像帧和第二复用图像帧导出的LE高空间频率内容组合成LE图像帧;并且,在生成RE图像帧时应用一个或多个第二操作,包括(a)空间频率滤波操作或(b)解复用操作中的至少一个,其中,所述一个或多个第二操作将水平方向和垂直方向两者的、从第一复用图像帧和第二复用图像帧导出的RE高空间频率内容组合成RE图像帧。
在一实施例中,所述一个或多个第一操作和所述一个或多个第二操作至少包括高通滤波操作。
在一实施例中,所述一个或多个第一操作和所述一个或多个第二操作包括代替至少一个高通滤波操作的处理子路径。该处理子路径包括至少一个减法操作而不包括高通滤波操作。
在一实施例中,第一复用图像帧或第二复用图像帧中的一个包括残留图像数据。多层视频解码器(150)还被配置成执行:解码并处理增强层图像数据,而不从第一复用图像帧或第二复用图像帧中的另一个生成预测参考数据。
在一实施例中,多层视频解码器(150)还被配置成处理利用一个或多个输入视频信号表示、接收、发送、或存储的一个或多个3D图像。
在一实施例中,3D图像包括按以下中的一种编码的图像数据:高动态范围(HDR)图像格式、与电影艺术和科学学院(AMPAS)的学院颜色编码规范(ACES)标准相关联的RGB颜色空间、数字院线联盟的P3颜色空间标准、参考输入媒介度量/参考输出媒介度量(RIMM/ROMM)标准、sRGB颜色空间、与国际电信联盟(ITU)的BT.709推荐标准相关联的RGB颜色空间等。
在不同示例实施例中,编码器、解码器、***等执行如所描述的前述方法中的任何方法或一部分。
8、利用载波信号的残留图像编码
如图8A所描绘的,在一个实施例中,增强层(EL)流112-3包括被复用为上下(TaB)帧(808-V)的图像残留(例如,806-L和806-R)。代替直接编码这些残留信号(例如,通过利用EL编码器116),可以通过组合残留信号与“载波”图像信号以形成新的EL信号,来实现改进的压缩。利用这种载波信号的目的是,使增强层看起来更像自然的视频信号,其中,诸如H.264/AVC编解码器的现有视频编解码器(如在“ISO/IEC14496-10:Information technology-coding of audio-visual objects-Part10:Advanced Video Coding”中描述的)针对这样的视频信号被优化。图12A描绘了这种实施例的示例。图12A例示了根据在增强层中利用载波图像信号的实施例的示例FCFR编码器。如图12A所描绘的,基础层的处理跟随稍早讨论的处理步骤,例如图8A中所绘的处理步骤。在步骤1205中,左视图(102-L)和右视图(102-R)信号被下采样并被复用,以例如按并排(SbS)格式生成复用半分辨率帧。步骤1205表示图8A中描绘的步骤104-H和106-H的简化表示。在复用之后,接着将BL信号1207利用基础层编码器1210(例如,H.264/AVC编码器)压缩,以生成压缩BL流1240-1。
BL信号1207(或者另选地,经解码的BL信号1212)可以被用于利用水平上采样804再生左视图和右视图的全分辨率(FR)版本(左FR和右FR)。接着,将原始视图(102-L和102-R)和重构视图相减(例如,在810中),以生成残留806-L和806-R。复用器1215以与在基础层中使用的帧格式(例如,SbS)正交的帧格式(例如,TaB)来复用这些残留,以生成残留信号808-V。接下来,残留808-V与载波信号1222相加,以生成EL信号1237。载波信号1222可以响应于SbS BL1207信号,利用载波RPU1220来生成。载波RPU可以执行水平上采样和垂直下采样两者,以生成与残留信号(例如,808V)的格式和分辨率匹配的载波TaB信号1222。在一实施例中(参见图15),垂直下采样在水平上采样之前执行。在另一实施例中,载波信号可以响应于BL流的解码版本(例如,经解码的BL信号1212)来生成。在另一实施例中,在基础层采用TaB格式而增强层采用SbS格式时,可以应用类似处理(参见图14)。与载波RPU1220和编解码器RPU1225有关的处理可以通过同一处理器或不同处理器来执行。
为保持原始残留(808-V)的完整性,在一实施例中,可以减小载波信号的范围,例如,将每一像素除以一常数,例如2。这种除法处理可以与载波RPU中的滤波处理相组合。在另一实施例中,当残留808-V非常小时,载波信号可以针对其全部像素具有固定像素值,例如,128。在另一实施例中,载波信号的值可以基于残留信号的性质而适应性地限定。可以利用元数据(例如,作为RPU数据流的一部分)向解码器通知这种决策。
在一个实施例中,EL信号1237利用如在H.264(AVC)规范中规定的多视图编码(MVC)来压缩,以生成编码或压缩EL流1240-2。因为BL信号1207和EL信号1237不具有相同的复用格式,所以可以采用参考处理单元(RPU)1225,以将经解码的SbS BL信号1212转换成可以被MVC编码器1230用作参考的TaB信号(1227)。该TaB图片(1227)是新生成的视图间预测参考图片,并且被***到参考图片列表中,以编码EL图片。为进一步改进编码效率,编解码器RPU1225可以应用附加的分区、处理以及滤波,以匹配从BL信号至EL输入信号的视图间参考图片,如A.Tourapis等人于2010年6月30日提交的PCT申请PCT/US2010/040545中描述的,其全部内容且通过引用而并入于此。对于在RPU中使用的滤波和分区的选择可以随多个分辨率级别而改变,例如,片段、图片、图片组(GOP)、场景、或序列级。在一编码器上,编码EL和BL流(1240)可以与RPU数据(例如,1240-3)和要发送至解码器的其它辅助数据(未示出)复用。
图12B例示了根据本发明一示例实施例的解码示例处理流程。在接收器处,将传入流解复用,以生成编码BL流(1240-1)、编码EL流(1240-2)、以及RPU数据(例如,1240-3)。BL解码器1250对应于BL编码器1210。在一个实施例中,BL解码器1250是AVC解码器。BL解码器1250将生成经解码的(例如,SbS)BL图像1252。
因为编码EL流1240-2是利用来自EL信号1237和经解码BL信号1212两者的参考帧来编码的,所以相同处理同样在解码器上匹配。利用RPU数据1240-3,编解码器RPU1255可以生成要被MVC解码器1260使用的信号1257。信号1257包括预测增强层信号,其可以被用作用于MVC解码器1260的附加的参考帧序列,以生成经解码的EL信号1262。
在解压缩BL和EL流之后,解码器需要按全分辨率重构左视图和右视图。图13A描绘了要被称为“差分”方法的这种方法的一个示例实施例。基础层中缺失的垂直或水平频率可以被构造为增强层(1262)和载波信号1302的逐像素差分。载波信号1302可以利用经解码BL信号1252和采用与编码器载波RPU(1220)的处理匹配的处理的解码器RPU(例如,1255)来重构。图15描绘了这种处理的示例。接着,将残留信号1317上采样(例如,在1320中)并且按逐像素相加方式与上采样帧兼容(FC)重构基础层(FC-L和FC-R)合并,以重构全分辨率(FR)左视图和右视图(FR-LR和FR-RE)。在一个实施例中,为减小复杂性,可以重用来自编解码器RPU1255的输出,因为编解码器RPU和载波RPU往往共享相同滤波器。对于在编解码器RPU中采用一个分区和一个滤波器时的情况,两个RPU应用完全相同的处理。
如图13A所描绘的,传统接收器仍可以通过针对BL信号1252执行适当的上采样来解码半分辨率的帧兼容视图的对(FC-L和FC-R)。
图13B描绘了用于重构全分辨率信号的另一示例实施例,该方法被称为“高通方法”。在该方法下,经解码TaB EL信号1262首先通过水平高通滤波器1330处理。这种滤波器去除EL信号中的载波信号的低频分量,由此生成无载波残留信号(例如,808-V)。高通滤波器的输出被垂直上采样(1320)以生成残留信号1322-L和1322-R,这些残留信号被加到水平上采样的重构帧兼容层(FC-L和FC-R)上,以生成原始视图的全分辨率估计(例如,FR-RE和FR-LE)。
在一实施例中,如果源视频是交织的,则上场和下场在垂直滤波期间独立地处理(例如,下采样或上采样)。接着,将这些场合并(例如,通过线交织)以创建帧。如果使用AVC编码器,则该交织信号可以按帧编码模式或场编码模式来编码。编解码器RPU还应被指令,是将来自BL的视图间参考图片作为帧还是作为场来处理。在AVC编码中,不存在对托管(mandated)比特流中的编码序列的扫描类型的指示,因为其在解码范围之外。补充增强信号(SEI)消息中可能有某些信息,但解码不需要SEI消息。在一个实施例中,提出高级语法来指示RPU应当应用帧处理还是场处理。在一个实施例中,如果是交织信号,则无论图片是怎样编码的,RPU可以总是将该图片作为分离的场来处理。在另一实施例中,RPU可以遵循BL信号是怎样编码的。因此,如果BL信号被编码为场,则RPU应用场处理,否则,其应用帧处理。
本发明的实施例包括多种多样的滤波器,其可以被分类为:多路复用(或复用)滤波器、RPU滤波器、以及多路分解(解复用)滤波器。在设计复用滤波器时,目的是尽可能多地保持来自原始滤波器的信息但不导致混叠。对于下采样来说,复用滤波器可以被设计成,在频谱中点具有非常平坦的通带响应和强衰减,其中,信号在下采样期间被折叠,以避免混叠。在一实施例中,(按Matlab表示法)这种滤波器的示例具有如下系数:
[30,-4,-61,-21,83,71,-102,-178,116638,904,
638,116,-178,-102,71,83,-21,-61,-4,30]/211
在设计RPU时,下采样滤波器和上采样滤波器应当具有非常低的截止频率,因为载波图像中的高频不被用于重构,并且具有这样的低通信号将会帮助增加EL信号的编码效率。RPU下采样和上采样滤波器还应当具有尽可能低的阶次,因为这些精确滤波器在解码器中被用于实时解码。这种滤波器的示例在表7中描绘。
在解码期间,可以应用与在编解码器RPU中使用的上采样滤波器相同的解复用滤波器。对于重构的高通方法来说(例如,图13B),高通滤波器(1330)应当是复用下采样滤波器和解复用上采样滤波器的组合频率响应的互补。典型地,这种滤波器的阶次较高,其可能不适于某些实时解码器应用。还可以以低得多的滤波器阶次得到具有类似通带特性、但具有更低阻带衰减的高通滤波器,使得它们更好地适于实时解码器应用。这种滤波器的示例在表8中描绘。
一些实现对于EL流来说可以具有非常低的比特流需求。在一个实施例中,为改进低比特率下的编码质量,可以从EL流中去除所有色度信息。在一个示例中,可以将EL信号中的色度值设置为恒定值,例如,128。对应地,通过编解码器RPU处理的视图间参考图片的颜色分量需要按相同方式配置。在另一实施例中,可以仅选择并发送在EL信号中具有最多高频的输入信号的那些区域,并且使剩余区域变灰色,例如,通过将它们设置为恒定值(例如,128)。这些区域的位置和尺寸可以从编码器利用元数据(例如通过RPU数据流)通知解码器。
在图12A中,残留信号808-V直接与载波信号1222相加,以生成EL1237。在另一实施例中,可以在将残留信号与载波相加之前,向残留信号应用线性或非线性量化方法。
迄今为止讨论的示例实施例旨在解决恢复缺失的水平或垂直频率的问题。在一实施例中,可以采用附加的增强层来恢复附加的频率,诸如对角的。例如,输入信号(102-L和102-R)可以跨对角方向被下采样。该信息(或基于该对角信息的另一残留信号)可以被发送至解码器,作为第二增强层(EL2)。解码器可以合并BL、EL和EL2信号,以生成FCFR信号。在另一实施例中,代替利用单独的EL2流来编码对角信息,可以在EL信号中的色度通道中编码亮度对角信息。在这种实现中,亮度将按全分辨率来编码,但色度将按半分辨率来编码。
8.2语法示例
8.3诸如H.264的编码标准通常仅定义编码比特流和解码处理的语法。这部分给出了针对H.264中的新FCFR简档或支持本发明方法的其它压缩标准的所提议语法。
第一部分被称作RPU首部,rpu_header(),并且包括在信号传输期间很可能不会改变的静态信息。
第二部分被称作RPU数据净荷,rpu_data_payload(),并且包括可能更频繁更新的动态信息。RPU数据净荷向解码器告知在被用于预测之前将被用于更新视图间参考图片的滤波器。
该语法可以按片段级、图片级、GOP级、场景级、或序列级发送。其可以被包括在NAL单元首部、序列参数集(SPS)及其扩展、SubSPS、图片参数集(PPS)、片段首部、SEI消息、或新NAL单元等处。在一示例实施例中,RPU语法仅在序列级被更新。为了向后兼容,如表1所示,还定义了针对用于MFC的编码片段扩展的新NAL单元,slice_layer_extension_rbsp()。在我们的示例中,在表2中被标记为简档134的新简档被分配用于利用正交复用(OM)的FCFR3D***的实施例。
所提议语法的附加示例在表2、表3以及表4中描绘,其中,用Courier字体描绘了针对现有H.264/A VC规范的所提议的增加。在这个示例中,所提议的RPU语法在序列级调用,并且其被添加在序列参数集MVC扩展中。
RPU数据首部语义
rpu_type规定针对RPU信号的预测类型目的。如果不存在,则其值被假定为0。
rpu_format规定在给定rpu_type时的预测处理格式,其将在处理视频数据时使用,以供预测和/或最终重构。如果不存在,则其值被假定为0。表5描绘了rpu_type和rpu_format值的示例。
default_grid_position表明view0和view1网格位置信息是否应当被显式通知。如果default_grid_position被设为1,或者不存在,则默认值按如下方式获取:
view0_grid_position_x和在H.264规范中的帧封装排列SEI消息语义部分中定义的frame0_grid_position_x相同。
view0_grid_position_y和在H.264规范中的帧封装排列SEI消息语义部分中定义的frame0_grid_position_y相同。
View1_grid_position_x和在H.264规范中的帧封装排列SEI消息语义部分中定义的frame1_grid_position_x相同。
View1_grid_position_y和在H.264规范中的帧封装排列SEI消息语义部分中定义的frame1_grid_position_y相同。
interlace_processing_flag表明参考处理是否将以帧或场为基础来应用。如果其被设为零,则处理将在帧域进行。如果该标志被设为1,则处理应针对每一个场分别执行。
disable_part_symmetry_flag(当存在时)表明是限制还是不限制针对属于不同视图的空间并置分区的滤波器选择。如果该标志未设置,则任一视图中的两个并置分区利用相同RPU滤波器来处理,以导出增强层预测。因此,一半的滤波器被通知。如果该标志被设置,则针对经处理图片中的每一个分区通知一个滤波器。如果不存在,则所有分区使用相同滤波方法(NULL)。如果rpu_format被设为SBS并且PicWidthInMbs=1,或者如果rpu_format被配置成OU或TAB并且PicHeightInMapUnits等于1,则该标志被限制成等于1。如果不存在,则该标志的值将被设为1。
num_x_partitions_minusl表明被用于在滤波期间沿水平维度细分经处理图片的分区数。其可以取任何非负整数值。如果不存在,则num_x_partitions_minusl的值被设成等于0。num_x_partitions_minus1的值处于0与Clip3(0,15,(PicWidthInMbs>>1)-1)之间,其中,PicWidthInMbs在H.264规范中规定。
num_y_partitions_minusl表明被用于在滤波期间沿垂直维度细分经处理图片的分区数。其可以取任何非负整数值。如果不存在,则num_y_partitions_minus1的值被设成等于0。num_y_partitions_minusl的值处于0与Clip3(0,7,(PicHeightInMapUnits>>1)-1)之间,其中,PicHeightInMapUnits在H.264规范中规定。
RPU数据净荷语义
separate_component_filtering_flag表明是否针对每一个颜色空间分量发送分别的滤波器还是针对所有分量使用单个滤波器。如果该标志被设为零,则针对每一个滤波器抽头系数如下设置:filter_idx[y][x][1]=filter_idx[y][x][2]=filter_idx[y][x][0]。
filter_idx_down[y][x][cmp]包含对应于下采样处理滤波器的索引(index),其中该下采样处理滤波器要被用于与颜色分量cmp相对应的、具有垂直坐标y和水平坐标x的分区。该索引可以取任何非负值,分别对应于唯一的处理滤波器或方案。
filter_idx_up[y][x][cmp]包含对应于上采样处理滤波器的索引,其中该上采样处理滤波器要被用于与颜色分量cmp相对应的、具有垂直坐标y和水平坐标x的分区。该索引可以取任何非负值,分别对应于唯一的处理滤波器或方案。
表6示出了提供filter_idx方法的***的示例。滤波器的示例在表7中示出。用于下采样和上采样的“F2”滤波器没有滤波系数。其简单地将载波信号设置成恒定值(例如,128)。
图14描绘了用于生成EL信号(1237)的示例处理流程。图14的右半部分描绘了其中基础层按并排(SbS)格式编码从而EL层按上下(TaB)格式编码的情况。该右半部分中的处理流程匹配如图12A所描绘的处理流程。图14的左半部分描绘了其中基础层按上下(TaB)格式编码(1405)而增强层按SbS格式编码(1415)的情况。TaB复用步骤1405可以跟随图1中的步骤104-V和106-V中描绘的处理,而SbS复用1415可以跟随图1中的步骤104-H和106-H中描绘的处理。
假定前面描述的语法,图15描绘了在解码FCFR流以生成载波信号1302期间,RPU中的示例处理的实施例。例如利用载波RPU1220,也可以应用类似处理以在编码器中生成载波信号1222。如图15中描绘,该处理针对输入序列的所有分区和所有颜色分量操作。该数据流可以相同,而不管BL信号是按SbS格式还是按TaB格式复用;然而,滤波取向取决于基础层的格式。该处理还假定下采样先于上采样;然而,在另一实施例中,上采样可以先于下采样。
利用RPU数据流(例如,1240-3)和滤波器标识查找表(例如,表6),在步骤1510中,RPU识别要被用下采样经解码BL信号的下采样滤波器。如果其是F0或F1滤波器(1515-1),则其继续进行以执行下采样(1520-1)。如果其是F2滤波器,则其简单地生成载波信号,其中所有像素值被设置成常数(例如,128)(1520-2)。如果BL层按SbS格式编码,则下采样(1520)沿垂直方向执行。如果BL层按TaB格式编码,则下采样(1520)沿水平方向执行。
在下采样(1520)之后,两个原始半部分(或视图)被解复用,并接着以正交取向再次复用,例如,从SbS至TaB或者从TaB至SbS,以形成与残留信号的复用格式匹配的中间结果。接着,将该中间信号上采样,以使最终载波信号与残留信号的分辨率匹配。如果上采样滤波器是F0或F1(1525-1),则该中间结果被上采样,以生成最终载波信号1237。如果其是F2滤波器,则其生成载波信号,其中所有像素值被设置成固定值(例如,128)(1530-2)。如果BL层按SbS格式编码,则上采样(1530)沿水平方向执行。如果BL层按TaB格式编码,则上采样(1530)沿垂直方向执行。如果解码器未识别出任何滤波器,则该处理终止,并且可以生成出错消息(1540)。
表1:NAL单元类型、语法元素种类、以及NAL单元类型类别
表2:序列参数集MVC扩展语法
表3:RPU数据首部语法
表4:RPU数据净荷语法
表5:RPU格式
rpu_type | Rpu_format | Rpu_format_name | RPU格式 |
0 | 0 | SbS | OM-FCFR并排 |
0 | 1 | OU | OM-FCFR上下 |
1-63 | 1-63 | 2-63 | 保留 |
表6:下采样和上采样filter_idx
表7:RPU隐式滤波器定义
表8:OM_FCFR重构滤波器
9、实现机构-硬件概述
根据一个实施例,在此描述的技术通过一个或多个专用计算装置来实现。这些专用计算装置可以硬布线以执行这些技术,或者可以包括诸如一个或多个专用集成电路(ASIC)或永久性地编程成执行这些技术的现场可编程门阵列(FPGA)的数字电子装置,或者可以包括被编程成依据固件、存储器、其它存储设备、或组合中的程序指令来执行这些技术的一个或多个通用硬件处理器。这种专用计算装置还可以将定制硬布线逻辑、ASIC、或FPGA与定制编程相组合以实现这些技术。这些专用计算装置可以是台式计算机***、便携式计算机***、手持式装置、连网装置、或包含硬布线和/或程序逻辑以实现这些技术的任何其它装置。
例如,图11是例示可以实现本发明一示例实施例的计算机***1100的框图。计算机***1100包括用于传送信息的总线1102或其它通信机构,和与总线1102耦接以处理信息的硬件处理器1104。硬件处理器1104例如可以是通用微处理器。
计算机***1100还包括耦接至总线1102的、用于存储信息和要通过处理器1104执行的指令的主存储器1106,如随机存取存储器(RAM)或其它动态存储装置。主存储器1106还可以被用于在执行要通过处理器1104执行的指令期间,存储临时变量或其它中间信息。这种指令当存储在处理器1104可访问的非暂时存储介质中时,使计算机***110成为被定制化成执行这些指令中指定的操作的专用机器。
计算机***1100还包括用于存储静态信息和用于处理器1104的指令的只读存储器(ROM)1108或耦接至总线1102的其它静态存储装置。存储装置1110(如磁盘或光盘)被设置并耦接至总线1102,以存储信息和指令。
计算机***1100可以经由总线1102耦接至诸如液晶显示器的显示器1112,以向计算机用户显示信息。输入装置1114(包括字母数字键和其它键)耦接至总线1102,以向处理器1104传送信息和命令选择。另一类型的用户输入装置是游标控制器1116,如鼠标、轨迹球、或游标方向键,以向处理器1104传送方向信息和命令选择,并且用于控制显示器1112上的游标移动。该输入装置典型地具有沿两个轴的两个自由度,第一轴(例如,x)和第二轴(例如,y),其允许该装置指定平面中的位置。
计算机***1100可以利用定制化硬布线逻辑、一个或多个ASIC或FPGA、固件和/或程序逻辑来实现在此描述的技术,这些定制化硬布线逻辑、一个或多个ASIC或FPGA、固件和/或程序逻辑与该计算机***组合以使得计算机***1100作为专用机器或者将其编程为专用机器。根据一个实施例,在此的技术响应于处理器1104执行包含在主存储器1106中的一个或多个指令的一个或多个序列而通过计算机***1100来执行。这些指令可以从另一存储介质(如存储装置1110)读取到主存储器1106中。执行包含在主存储器1106中的指令序列使处理器1104执行在此描述的处理步骤。在另选实施例中,硬布线电路可以代替软件指令或与软件指令组合地使用。
在此使用的术语“存储介质”指存储数据和/或使机器按特定方式操作的指令的任何非暂时介质。这种存储介质可以包括非易失性介质和/或易失性介质。非易失性介质例如包括光学或磁盘,诸如存储装置1110。易失性介质包括动态存储器,诸如主存储器1106。存储介质的常见形式例如包括:软盘、柔性盘、硬盘、固态驱动器、磁带、或任何其它磁数据存储介质、CD-ROM、任何其它光学数据存储介质、具有孔图案的任何物理介质、RAM、PROM、以及EPROM、FLASH-EPROM、NVRAM、任何其它存储器芯片或存储盒。
存储介质不同于传输介质但可以结合传输介质使用。传输介质参与在存储介质之间传递信息。例如,传输介质包括同轴线缆、铜导线以及光纤,包括具有总线1102的导线。传输介质还可以采取声波或光波的形式,诸如在无线电波和红外数据通信期间生成的那些。
各种形式的介质可以涉及向处理器1104运送一个或多个指令的一个或多个序列以供执行。例如,这些指令可以初始地在远程计算机的磁盘或固态驱动器上携带。远程计算机可以将这些指令加载到其动态存储器中并且利用调制解调器通过电话线路发送这些指令。计算机***1100本地的调制解调器可以接收电话线路上的数据并且使用红外发送器将这些数据转换成红外信号。红外检测器可以接收以红外信号携带的数据,并且恰当的电路可以在总线1102上发出数据。总线1102向主存储器1106运送数据,据此,处理器1104检索并执行指令。主存储器1106接收的指令可以可选地在通过处理器1104执行之前或之后存储在存储装置1110上。
计算机***1100还包括耦接至总线1102的通信接口1118。通信接口1118向耦接至连接至本地网络1122的网络链路1120提供双向数据通信。例如,通信接口1118可以是综合服务数字网络(ISDN)卡、有线调制解调器、卫星调制解调器、或者用于向对应类型电话线路提供数据通信连接的调制解调器。作为另一示例,通信接口1118可以是用于向兼容局域网(LAN)提供数据通信连接的局域网(LAN)卡。无线链路也可以实现。在任何这种实现中,通信接口1118发送和接收携带表示各类信息的数字数据流的电、电磁或光学信号。
网络链路1120典型地通过一个或多个网络向其它数据装置提供数据通信。例如,网络链路1120可以通过本地网络1122向主机计算机1124或者向由因特网服务提供商(ISP)1126操作的数据设备提供连接。ISP1126又通过环球分组数据通信网络(现在通称为“因特网”1128)提供数据通信服务。本地网络1122和因特网1128都使用携带数字数据流的电、电磁或光学信号。通过不同网络的信号和在网络链路1120上且经由通信接口1118(其向和从计算机***1100运送数字数据)的信号是传输介质的示例形式。
计算机***1100可以通过网络、网络链路1120以及通信接口1118发送消息和接收数据(包括程序代码)。在因特网示例中,服务器1130可能通过因特网1128、ISP1126、本地网络1122以及通信接口1118发送用于应用程序的所请求的代码。
所接收的代码可以在其被接收时通过处理器1104来执行、和/或存储在存储装置1100或其它非易失性存储设备中,以供以后执行。
10、等同、扩展、另选例以及其他
在前述说明书中,本发明的示例实施例已经参照可以随不同实现而改变的许多具体细节进行了描述。由此,本发明并且本发明的申请人意欲的发明的单独且排它的指标是从本申请产生的一组权利要求,其采用权利要求所发布的具体形式,包括任何随后的修改。在此针对包含在这些权利要求中的术语明确地阐述的任何定义应约束在权利要求中使用的这种术语的含义。因此,权利要求中未明确陈述的限制、要素、特性、特征、优点或属性无论如何都不应限制权利要求的范围。本说明书和附图因此按例示性意义而非限制性意义来考虑。
Claims (35)
1.一种方法,包括:
接收输入3D图像,该输入3D图像包括左眼(LE)输入图像帧和右眼(RE)输入图像帧;
基于LE输入图像帧和RE输入图像帧,生成包括沿垂直方向的第一高空间频率内容和沿水平方向的第一缩减分辨率内容的第一复用图像帧;
基于LE输入图像帧和RE输入图像帧,生成包括沿水平方向的第二高空间频率内容和沿垂直方向的第二缩减分辨率内容的第二复用图像帧;以及
编码并输出第一复用图像帧和第二复用图像帧,以表示所述输入3D图像。
2.根据权利要求1所述的方法,其中,所述3D输入图像是3D输入图像序列中的第一3D输入图像,该3D输入图像序列包括具有第二LE输入图像帧和第二LE输入图像帧的不同的第二3D输入图像;并且,所述方法还包括:
基于第二LE输入图像帧和第二RE输入图像帧,生成包括沿垂直方向的第三高空间频率内容和沿水平方向的第三缩减分辨率内容的第三复用图像帧;
基于第二LE输入图像帧和第二输入图像帧,生成包括沿水平方向的第四高空间频率内容和沿垂直方向的第四缩减分辨率内容的第四复用图像帧;以及
编码并输出第三复用图像帧和第四复用图像帧,以表示所述第二输入3D图像。
3.根据权利要求1所述的方法,其中,第一复用图像帧包括第一LE图像数据部分和第一RE图像数据部分;其中,第一LE图像数据部分和第一RE图像数据部分沿水平方向和垂直方向都具有相同的空间分辨率;其中,第二复用图像帧包括第二LE图像数据部分和第二RE图像数据部分;并且其中,第二LE图像数据部分和第二RE图像数据部分沿水平方向和垂直方向都具有相同的空间分辨率。
4.根据权利要求3所述的方法,其中,第一LE图像数据部分和第一RE图像数据部分中的每一个表示全分辨率图像帧的一个子采样版本;其中,第一复用图像帧采用并排(SbS)格式来携带第一LE图像数据部分和第一RE图像数据部分;其中,第二LE图像数据部分和第二RE图像数据部分中的每一个表示全分辨率图像帧的一个子采样版本;并且其中,第二复用图像帧采用上下(TaB)格式来携带第二LE图像数据部分和第二RE图像数据部分。
5.根据权利要求1所述的方法,其中,第一复用图像帧采用保留沿垂直方向的高空间频率内容的第一复用格式,并且其中,第二复用图像帧采用保留沿水平方向的高空间频率内容的第二复用格式。
6.根据权利要求1所述的方法,其中,第一复用图像帧或第二复用图像帧中的一个在多个比特流中的基础层比特流中输出,而第一复用图像帧或第二复用图像帧中的另一个在所述多个比特流中的增强层比特流中输出。
7.根据权利要求1所述的方法,还包括:
至少部分地基于第一复用图像帧,生成预测参考图像数据;以及
基于该预测参考图像数据与所述输入3D图像之间的差分来编码增强层视频信号。
8.根据权利要求1所述的方法,还包括:
在生成第一复用图像帧时,向第一输入图像帧和第二输入图像帧应用沿第二方向的一个或多个第一操作,包括(a)空间频率滤波操作或(b)空间子采样操作中的至少一个,其中,所述一个或多个第一操作去除沿第二方向的高空间频率内容而保留沿第一方向的高空间频率内容;以及
在生成第二复用图像帧时,向第一输入图像帧和第二输入图像帧应用沿第一方向的一个或多个第二操作,包括(a)空间频率滤波操作或(b)空间子采样操作中的至少一个,其中,所述一个或多个第二操作去除沿第一方向的高空间频率内容而保留沿第二方向的高空间频率内容。
9.根据权利要求1所述的方法,其中,第一复用图像帧或第二复用图像帧中的一个包括残留图像数据,其中,该残留图像数据通过从根据LE输入图像帧和RE输入图像帧导出的输入图像数据中减去基于第一复用图像帧或第二复用图像帧中的另一个所生成的参考图像数据而生成。
10.根据权利要求1所述的方法,还包括:将利用一个或多个输入视频信号表示、接收、发送、或存储的一个或多个3D输入图像转换成利用一个或多个输出视频信号表示、接收、发送、或存储的一个或多个3D输出图像。
11.根据权利要求1所述的方法,其中,所述输入3D图像包括按以下之一编码的图像数据:高动态范围(HDR)图像格式、与电影艺术和科学学院(AMPAS)的学院颜色编码规范(ACES)标准相关联的RGB颜色空间、数字院线联盟的P3颜色空间标准、参考输入媒介度量/参考输出媒介度量(RIMM/ROMM)标准、sRGB颜色空间、或与国际电信联盟(ITU)的BT.709推荐标准相关联的RGB颜色空间。
12.一种方法,包括:
接收由第一复用图像帧和第二复用图像帧表示的3D图像,该第一复用图像帧包括沿垂直方向的第一高空间频率内容和沿水平方向的第一缩减分辨率内容,而该第二复用图像帧包括沿水平方向的第二高空间频率内容和沿垂直方向的第二缩减分辨率内容;
基于该第一复用图像帧和第二复用图像帧,生成左眼(LE)图像帧和右眼(RE)图像帧,该LE图像帧包括沿水平方向和垂直方向两者的LE高空间频率内容,而该RE图像帧包括沿水平方向和垂直方向两者的RE高空间频率内容;以及
通过呈现该LE图像帧和RE图像帧来呈现所述3D图像。
13.根据权利要求12所述的方法,其中,该3D图像是3D图像序列中的第一3D图像,该3D图像序列包括具有第三复用图像帧和第四复用图像帧的不同的第二3D图像,该第三复用图像帧包括沿垂直方向的第三高空间频率内容和沿水平方向的第三缩减分辨率内容,而该第四复用图像帧包括沿水平方向的第四高空间频率内容和沿垂直方向的第四缩减分辨率内容;并且,所述方法还包括:
生成第二LE图像帧和第二RE图像帧,该第二LE图像帧包括沿水平方向和垂直方向两者的高空间频率内容,并且该第二LE图像帧包括沿水平方向和垂直方向两者的高空间频率内容;以及
通过呈现该第二LE图像帧和第二RE图像帧来呈现所述第二3D图像。
14.根据权利要求12所述的方法,其中,第一复用图像帧或第二复用图像帧中的至少一个包括LE图像数据部分和RE图像数据部分;并且其中,该LE图像数据部分和RE图像数据部分具有相同的空间分辨率。
15.根据权利要求14所述的方法,其中,LE图像数据部分和RE图像数据部分中的每一个表示全分辨率图像帧的一个子采样版本;并且其中,LE图像数据部分和RE图像数据部分按并排格式或上下格式之一形成单个图像帧。
16.根据权利要求12所述的方法,其中,从多个比特流中的基础层比特流解码第一复用图像帧或第二复用图像帧中的一个,而从所述多个比特流中的增强层比特流解码第一复用图像帧或第二复用图像帧中的另一个。
17.根据权利要求12所述的方法,还包括:
至少部分地基于第一复用图像帧或第二复用图像帧中的一个,生成预测参考图像数据;并且
基于从增强层(EL)视频信号和该预测参考图像数据解码的EL数据,生成LE图像帧或RE图像帧中的一个。
18.根据权利要求12所述的方法,还包括:
在生成LE图像帧时应用一个或多个第一操作,包括(a)空间频率滤波操作或(b)解复用操作中的至少一个,其中,所述一个或多个第一操作将水平方向和垂直方向两者的、从第一复用图像帧和第二复用图像帧导出的LE高空间频率内容组合成LE图像帧;并且
在生成RE图像帧时应用一个或多个第二操作,包括(a)空间频率滤波操作或(b)解复用操作中的至少一个,其中,所述一个或多个第二操作将水平方向和垂直方向两者的、从第一复用图像帧和第二复用图像帧导出的RE高空间频率内容组合成RE图像帧。
19.根据权利要求18所述的方法,其中,所述一个或多个第一操作和所述一个或多个第二操作至少包括高通滤波操作。
20.根据权利要求18所述的方法,其中,所述一个或多个第一操作和所述一个或多个第二操作包括代替至少一个高通滤波操作的处理子路径;并且其中,该处理子路径包括至少一个减法操作而不包括高通滤波操作。
21.根据权利要求12所述的方法,其中,第一复用图像帧或第二复用图像帧中的一个包括残留图像数据;并且,所述方法还包括:
解码并处理增强层图像数据,而不从第一复用图像帧或第二复用图像帧中的另一个生成预测参考数据。
22.根据权利要求12所述的方法,还包括:处理利用一个或多个输入视频信号表示、接收、发送、或存储的一个或多个3D图像。
23.根据权利要求12所述的方法,其中,所述3D图像包括按以下之一编码的图像数据:高动态范围(HDR)图像格式、与电影艺术和科学学院(AMPAS)的学院颜色编码规范(ACES)标准相关联的RGB颜色空间、数字院线联盟的P3颜色空间标准、参考输入媒介度量/参考输出媒介度量(RIMM/ROMM)标准、sRGB颜色空间、或与国际电信联盟(ITU)的BT.709推荐标准相关联的RGB颜色空间。
24.一种执行根据权利要求1-11所述方法中的任一者的编码器。
25.一种执行根据权利要求12-23所述方法中的任一者的解码器。
26.一种执行根据权利要求1-23所述方法中的任一者的***。
27.一种***,包括:
编码器,该编码器被配置成,
接收输入3D图像,该输入3D图像包括左眼(LE)输入图像帧和右眼(RE)输入图像帧;
基于LE输入图像帧和RE输入图像帧,生成包括沿垂直方向的第一高空间频率内容和沿水平方向的第一缩减分辨率内容的第一复用图像帧;
基于LE输入图像帧和RE输入图像帧,生成包括沿水平方向的第二高空间频率内容和沿垂直方向的第二缩减分辨率内容的第二复用图像帧;以及
编码并输出第一复用图像帧和第二复用图像帧,以表示所述输入3D图像;
解码器,该解码器被配置成:
接收多个视频比特流中的第一复用图像帧和第二复用图像帧;
基于该第一复用图像帧和第二复用图像帧,生成左眼(LE)图像帧和右眼(RE)图像帧,该LE图像帧包括沿水平方向和垂直方向两者的LE高空间频率内容,而该RE图像帧包括沿水平方向和垂直方向两者的RE高空间频率内容;以及
呈现LE图像帧和RE图像帧。
28.一种用于编码3D帧兼容全分辨率(FCFR)图像的方法,该方法包括:
接收输入3D图像,该输入3D图像包括左眼(LE)输入图像帧和右眼(RE)输入图像帧;
基于LE输入图像帧和RE输入图像帧,生成包括沿第一方向的第一高空间频率内容和沿第二方向的第一缩减分辨率内容的第一复用图像帧,第二方向正交于第一方向;
基于第一复用图像帧生成参考图像数据和载波图像数据;
从所述输入3D图像中减去该参考图像数据,以生成残留图像数据;
基于该残留图像数据和载波图像数据,生成包括沿第二方向的第二高空间频率内容和沿第一方向的第二缩减空间频率内容的第二复用图像帧;以及
编码并输出第一复用图像帧和第二复用图像帧,以表示所述输入3D图像。
29.根据权利要求28所述的方法,其中,生成载波图像数据包括:
沿基础层图像帧的第一方向应用第一空间滤波,以下采样该基础层图像帧并且生成中间图像,该基础层图像至少部分地基于第一复用图像帧;以及
沿第二方向向该中间图像应用第二空间滤波,以上采样该中间图像来生成所述载波图像数据,其中,第二方向正交于第一方向。
30.根据权利要求28所述的方法,其中,所有载波图像数据包括具有相同固定值的像素值。
31.一种用于解码按FCFR格式编码的3D信号的方法,该方法包括:
接收由第一复用图像帧和第二复用图像帧表示的3D图像,该第一复用图像帧包括沿第一空间方向的第一高空间频率内容和沿第二空间方向的第一缩减分辨率内容,而该第二复用图像帧包括沿第二空间方向的第二高空间频率内容和沿第一空间方向的第二缩减分辨率内容,其中,第二空间方向正交于第一空间方向;
基于该第一复用图像,生成图像帧的帧兼容对(FC-L,FC-R),包括沿第一空间方向的高空间频率内容和沿第二空间方向的缩减空间频率内容;以及
基于该第一复用图像和第二复用图像帧,生成帧的全分辨率对(FR-LE,FR-RE),包括沿第一空间方向和第二空间方向两者的高空间频率内容。
32.根据权利要求31所述的方法,其中,第二复用图像帧包括与载波图像帧组合的残留图像帧。
33.根据权利要求32所述的方法,还包括:
基于第一复用图像帧生成载波图像帧;以及
从第二复用图像帧帧减去该载波图像帧,以生成残留图像帧。
34.根据权利要求32所述的方法,还包括:沿第二复用图像帧的第二空间方向应用高通滤波,以生成所述残留图像帧。
35.一种存储软件指令的非暂时性计算机可读介质,其在由一个或多个处理器执行时,使得执行如根据权利要求1-23或28-34所述方法中的任一个的步骤。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161541005P | 2011-09-29 | 2011-09-29 | |
US61/541,005 | 2011-09-29 | ||
US201261583081P | 2012-01-04 | 2012-01-04 | |
US61/583,081 | 2012-01-04 | ||
PCT/US2012/057610 WO2013049383A1 (en) | 2011-09-29 | 2012-09-27 | Frame-compatible full resolution stereoscopic 3d video delivery with symmetric picture resolution and quality |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103828358A true CN103828358A (zh) | 2014-05-28 |
CN103828358B CN103828358B (zh) | 2016-05-18 |
Family
ID=47003282
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280047461.3A Active CN103828358B (zh) | 2011-09-29 | 2012-09-27 | 具有对称图片分辨率和质量的帧兼容全分辨率立体3d视频递送 |
Country Status (8)
Country | Link |
---|---|
US (1) | US10097820B2 (zh) |
EP (1) | EP2761874B1 (zh) |
JP (1) | JP5926387B2 (zh) |
CN (1) | CN103828358B (zh) |
AR (1) | AR088081A1 (zh) |
HK (1) | HK1194572A1 (zh) |
TW (1) | TWI595770B (zh) |
WO (1) | WO2013049383A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108769681A (zh) * | 2018-06-20 | 2018-11-06 | 腾讯科技(深圳)有限公司 | 视频编码、解码方法、装置、计算机设备和存储介质 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2801193B1 (en) | 2012-01-04 | 2016-10-26 | Dolby Laboratories Licensing Corporation | Dual-layer backwards-compatible progressive video delivery |
US9357197B2 (en) | 2012-05-24 | 2016-05-31 | Dolby Laboratories Licensing Corporation | Multi-layer backwards-compatible video delivery for enhanced dynamic range and enhanced resolution formats |
CN102835040B (zh) * | 2012-06-11 | 2015-01-07 | 华为技术有限公司 | 微波mimo***中接收信号的均衡方法和均衡器 |
WO2014170819A1 (en) * | 2013-04-15 | 2014-10-23 | Luca Rossato | Hybrid backward-compatible signal encoding and decoding |
EP3242487B1 (en) * | 2014-12-29 | 2021-10-13 | Sony Group Corporation | Transmitting device, transmitting method, receiving device and receiving method |
KR20170075349A (ko) * | 2015-12-23 | 2017-07-03 | 한국전자통신연구원 | 멀티 뷰를 가진 다중영상 송수신 장치 및 다중영상 다중화 방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101444102A (zh) * | 2006-03-27 | 2009-05-27 | 诺基亚公司 | 在可伸缩视频编码中的图像分隔符 |
CN101795418A (zh) * | 2009-01-15 | 2010-08-04 | 美国博通公司 | 一种实现无线通信的方法和*** |
US20110074922A1 (en) * | 2009-09-30 | 2011-03-31 | Xuemin Chen | Method and system for 3d video coding using svc spatial scalability |
Family Cites Families (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5416510A (en) | 1991-08-28 | 1995-05-16 | Stereographics Corporation | Camera controller for stereoscopic video system |
US5404167A (en) * | 1993-03-12 | 1995-04-04 | At&T Corp. | Subband color video coding using a reduced motion information subband |
US6141446A (en) * | 1994-09-21 | 2000-10-31 | Ricoh Company, Ltd. | Compression and decompression system with reversible wavelets and lossy reconstruction |
US6229927B1 (en) * | 1994-09-21 | 2001-05-08 | Ricoh Company, Ltd. | Reversible embedded wavelet system implementation |
US6549666B1 (en) * | 1994-09-21 | 2003-04-15 | Ricoh Company, Ltd | Reversible embedded wavelet system implementation |
EP0709809B1 (en) * | 1994-10-28 | 2002-01-23 | Oki Electric Industry Company, Limited | Image encoding and decoding method and apparatus using edge synthesis and inverse wavelet transform |
JP3534465B2 (ja) * | 1994-12-28 | 2004-06-07 | パイオニア株式会社 | サブバンド符号化方法 |
US5612735A (en) | 1995-05-26 | 1997-03-18 | Luncent Technologies Inc. | Digital 3D/stereoscopic video compression technique utilizing two disparity estimates |
US6674911B1 (en) * | 1995-09-14 | 2004-01-06 | William A. Pearlman | N-dimensional data compression using set partitioning in hierarchical trees |
DE69739536D1 (de) * | 1996-11-06 | 2009-09-24 | Panasonic Corp | Methode zur Bilddekodierung mit Kodes variabler Länge |
US6057884A (en) | 1997-06-05 | 2000-05-02 | General Instrument Corporation | Temporal and spatial scaleable coding for video object planes |
US6959120B1 (en) * | 2000-10-27 | 2005-10-25 | Microsoft Corporation | Rebinning methods and arrangements for use in compressing image-based rendering (IBR) data |
KR100454194B1 (ko) | 2001-12-28 | 2004-10-26 | 한국전자통신연구원 | 다중 디스플레이 방식을 지원하는 양안식 동영상 부호화/복호화 장치 및 그 방법 |
JP4104895B2 (ja) * | 2002-04-25 | 2008-06-18 | シャープ株式会社 | 立体画像符号化装置および立体画像復号装置 |
CN1849828A (zh) * | 2003-07-09 | 2006-10-18 | 日本电气株式会社 | 运动图像编码方法、运动图像解码方法、运动图像编码装置、运动图像解码装置和计算机程序 |
AU2003295998A1 (en) * | 2003-12-01 | 2005-08-12 | Ess Technology, Inc. | Optimized structure for digital separation of composite video signals |
KR100834748B1 (ko) * | 2004-01-19 | 2008-06-05 | 삼성전자주식회사 | 스케일러블 비디오 스트림 재생 방법 및 장치 |
US8374238B2 (en) | 2004-07-13 | 2013-02-12 | Microsoft Corporation | Spatial scalability in 3D sub-band decoding of SDMCTF-encoded video |
US7515759B2 (en) | 2004-07-14 | 2009-04-07 | Sharp Laboratories Of America, Inc. | 3D video coding using sub-sequences |
US7262767B2 (en) * | 2004-09-21 | 2007-08-28 | Victor Company Of Japan, Limited | Pseudo 3D image creation device, pseudo 3D image creation method, and pseudo 3D image display system |
JP4489605B2 (ja) * | 2005-01-19 | 2010-06-23 | 株式会社メガチップス | 圧縮符号化装置、圧縮符号化方法およびプログラム |
FR2889017A1 (fr) | 2005-07-19 | 2007-01-26 | France Telecom | Procedes de filtrage, de transmission et de reception de flux video scalables, signal, programmes, serveur, noeud intermediaire et terminal correspondants |
US7916960B2 (en) * | 2005-09-06 | 2011-03-29 | Megachips Corporation | Compression encoder, compression encoding method and program |
EP1946563A2 (en) | 2005-10-19 | 2008-07-23 | Thomson Licensing | Multi-view video coding using scalable video coding |
EP1977395B1 (en) | 2006-01-27 | 2018-10-24 | Imax Corporation | Methods and systems for digitally re-mastering of 2d and 3d motion pictures for exhibition with enhanced visual quality |
EP2051499B1 (en) * | 2006-07-13 | 2015-09-09 | NEC Corporation | Wavelet-based image encoding and decoding device and encoding method and decoding method |
MY162861A (en) | 2007-09-24 | 2017-07-31 | Koninl Philips Electronics Nv | Method and system for encoding a video data signal, encoded video data signal, method and system for decoding a video data signal |
CN101420609B (zh) | 2007-10-24 | 2010-08-25 | 华为终端有限公司 | 视频编码、解码方法及视频编码器、解码器 |
KR101580516B1 (ko) | 2008-04-07 | 2015-12-28 | 엘지전자 주식회사 | 방송 신호 수신 방법 및 방송 신호 수신 장치 |
KR20110039537A (ko) | 2008-07-21 | 2011-04-19 | 톰슨 라이센싱 | 3d 비디오 신호들을 위한 멀티 표준 코딩 장치 |
CN102257818B (zh) | 2008-10-17 | 2014-10-29 | 诺基亚公司 | 3d视频编码中运动向量的共享 |
KR101597987B1 (ko) * | 2009-03-03 | 2016-03-08 | 삼성전자주식회사 | 계층 독립적 잔차 영상 다계층 부호화 장치 및 방법 |
CN102356638A (zh) | 2009-03-16 | 2012-02-15 | Lg电子株式会社 | 显示三维图像数据的方法和处理三维图像数据的设备 |
EP2420068A4 (en) * | 2009-04-13 | 2012-08-08 | Reald Inc | ENCRYPTION, DECOMPOSITION AND DISTRIBUTION OF STEREOSCOPIC VIDEO CONTENT WITH REINFORCED RESOLUTION |
US9078008B2 (en) | 2009-04-20 | 2015-07-07 | Dolby Laboratories Licensing Corporation | Adaptive inter-layer interpolation filters for multi-layered video delivery |
CA2758903C (en) * | 2009-04-27 | 2016-10-11 | Lg Electronics Inc. | Broadcast receiver and 3d video data processing method thereof |
US8639046B2 (en) * | 2009-05-04 | 2014-01-28 | Mamigo Inc | Method and system for scalable multi-user interactive visualization |
CN102474603B (zh) | 2009-07-04 | 2015-04-22 | 杜比实验室特许公司 | 帧兼容三维传输中全分辨率图形、菜单和字幕的支持 |
US9774882B2 (en) * | 2009-07-04 | 2017-09-26 | Dolby Laboratories Licensing Corporation | Encoding and decoding architectures for format compatible 3D video delivery |
KR20110007928A (ko) | 2009-07-17 | 2011-01-25 | 삼성전자주식회사 | 다시점 영상 부호화 및 복호화 방법과 장치 |
US8537200B2 (en) * | 2009-10-23 | 2013-09-17 | Qualcomm Incorporated | Depth map generation techniques for conversion of 2D video data to 3D video data |
US9014276B2 (en) | 2009-12-04 | 2015-04-21 | Broadcom Corporation | Method and system for 3D video coding using SVC temporal and spatial scalabilities |
US8520020B2 (en) * | 2009-12-14 | 2013-08-27 | Canon Kabushiki Kaisha | Stereoscopic color management |
CN102726046B (zh) | 2010-01-27 | 2015-09-09 | 杜比实验室特许公司 | 用于图像和视频编解码中的参考处理的方法和*** |
EP2532162B1 (en) | 2010-02-01 | 2017-08-30 | Dolby Laboratories Licensing Corporation | Filtering for image and video enhancement using asymmetric samples |
EP3923571B1 (en) | 2010-07-21 | 2023-07-19 | Dolby Laboratories Licensing Corporation | Systems and methods for multi-layered frame-compatible video delivery |
US20120236115A1 (en) | 2011-03-14 | 2012-09-20 | Qualcomm Incorporated | Post-filtering in full resolution frame-compatible stereoscopic video coding |
CN103814572B (zh) | 2011-09-16 | 2017-02-22 | 杜比实验室特许公司 | 帧兼容的全分辨率立体3d压缩和解压缩 |
JP5735181B2 (ja) | 2011-09-29 | 2015-06-17 | ドルビー ラボラトリーズ ライセンシング コーポレイション | デュアルレイヤフレームコンパチブルフル解像度立体3dビデオ配信 |
-
2012
- 2012-09-26 TW TW101135323A patent/TWI595770B/zh active
- 2012-09-27 JP JP2014533327A patent/JP5926387B2/ja active Active
- 2012-09-27 EP EP12769865.2A patent/EP2761874B1/en active Active
- 2012-09-27 AR ARP120103596A patent/AR088081A1/es active IP Right Grant
- 2012-09-27 CN CN201280047461.3A patent/CN103828358B/zh active Active
- 2012-09-27 US US14/348,263 patent/US10097820B2/en active Active
- 2012-09-27 WO PCT/US2012/057610 patent/WO2013049383A1/en active Application Filing
-
2014
- 2014-07-25 HK HK14107598.5A patent/HK1194572A1/zh unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101444102A (zh) * | 2006-03-27 | 2009-05-27 | 诺基亚公司 | 在可伸缩视频编码中的图像分隔符 |
CN101795418A (zh) * | 2009-01-15 | 2010-08-04 | 美国博通公司 | 一种实现无线通信的方法和*** |
US20110074922A1 (en) * | 2009-09-30 | 2011-03-31 | Xuemin Chen | Method and system for 3d video coding using svc spatial scalability |
Non-Patent Citations (1)
Title |
---|
ANTHONY VETRO ET AL: "3D-TV Content Storage and Transmission", 《IEEE TRANSACTIONS ON BROADCASTING》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108769681A (zh) * | 2018-06-20 | 2018-11-06 | 腾讯科技(深圳)有限公司 | 视频编码、解码方法、装置、计算机设备和存储介质 |
US11206405B2 (en) | 2018-06-20 | 2021-12-21 | Tencent Technology (Shenzhen) Company Limited | Video encoding method and apparatus, video decoding method and apparatus, computer device, and storage medium |
CN108769681B (zh) * | 2018-06-20 | 2022-06-10 | 腾讯科技(深圳)有限公司 | 视频编码、解码方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
TWI595770B (zh) | 2017-08-11 |
JP5926387B2 (ja) | 2016-05-25 |
US20140286397A1 (en) | 2014-09-25 |
HK1194572A1 (zh) | 2014-10-17 |
US10097820B2 (en) | 2018-10-09 |
AR088081A1 (es) | 2014-05-07 |
JP2014529271A (ja) | 2014-10-30 |
CN103828358B (zh) | 2016-05-18 |
TW201330588A (zh) | 2013-07-16 |
WO2013049383A1 (en) | 2013-04-04 |
EP2761874A1 (en) | 2014-08-06 |
EP2761874B1 (en) | 2020-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2201784B1 (en) | Method and device for processing a depth-map | |
US10165251B2 (en) | Frame compatible depth map delivery formats for stereoscopic and auto-stereoscopic displays | |
EP2667610B1 (en) | Multi-layer backwards-compatible video delivery for enhanced dynamic range and enhanced resolution formats | |
EP2591609B1 (en) | Method and apparatus for multi-layered image and video coding using reference processing signals | |
CN103828358A (zh) | 具有对称图片分辨率和质量的帧兼容全分辨率立体3d视频递送 | |
EP2761877B1 (en) | Dual-layer frame-compatible full-resolution stereoscopic 3d video delivery | |
US9473788B2 (en) | Frame-compatible full resolution stereoscopic 3D compression and decompression | |
CN105847781A (zh) | 用于多层帧兼容视频传输的解码方法 | |
KR20110113752A (ko) | 비디오 코딩을 위한 프레임 패킹 | |
US9344702B2 (en) | Encoder, decoder, bit-stream, method of encoding, method of decoding an image pair corresponding with two views of a multi-view signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1194572 Country of ref document: HK |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1194572 Country of ref document: HK |