CN104685887A - 于视频译码中发信用于操作点的层识别符 - Google Patents

于视频译码中发信用于操作点的层识别符 Download PDF

Info

Publication number
CN104685887A
CN104685887A CN201380049934.8A CN201380049934A CN104685887A CN 104685887 A CN104685887 A CN 104685887A CN 201380049934 A CN201380049934 A CN 201380049934A CN 104685887 A CN104685887 A CN 104685887A
Authority
CN
China
Prior art keywords
operating point
group
bit stream
video
vps
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380049934.8A
Other languages
English (en)
Other versions
CN104685887B (zh
Inventor
王益魁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN104685887A publication Critical patent/CN104685887A/zh
Application granted granted Critical
Publication of CN104685887B publication Critical patent/CN104685887B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本文中所描述的技术涉及在视频译码中译码用于操作点的层识别符。在一个实例中,提供一种解码视频数据的方法。所述方法包括解码在符合型位流内的视频参数集VPS中指示具有第一组内容的第一操作点的语法元素。所述方法进一步包括如果在所述符合型位流内的所述VPS中存在指示具有所述第一操作点的第二组内容的假想参考解码器HRD参数信息的语法元素,解码所述语法元素,其中所述符合型位流不包含所述VPS中针对第二操作点而重复所述第一组内容或所述第二组内容中的至少一者的语法元素,且其中解码语法元素包括仅解码符合型位流内的指示所述第一操作点和所述HRD参数信息的所述语法元素。

Description

于视频译码中发信用于操作点的层识别符
此申请案主张2012年9月28日申请的美国临时申请案第61/707,486号和2012年10月1日申请的美国临时申请案第61/708,404号的优先权,所述申请案的全部内容以引用的方式并入本文中。
技术领域
本发明大体上涉及处理视频数据,且更明确地说,涉及处理视频数据中所使用的操作点。
背景技术
数字视频能力可并入到广泛范围的装置中,所述装置包含数字电视、数字直播***、无线广播***、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子书阅读器、数码相机、数码记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的“智能型电话”、视频电传会议装置、视频流式传输装置,和其类似者。数字视频装置实施视频译码技术,例如在由MPEG-2、MPEG-4、ITU-TH.263、ITU-T H.264/MPEG-4第10部分先进视频译码(AVC)所定义的标准、目前正在发展的高效率视频译码(HEVC)标准和这些标准的扩展中所描述的视频译码技术。视频装置可通过实施这些视频译码技术来更有效地发射、接收、编码、解码和/或存储数字视频信息。
视频译码技术包含空间(图片内)预测和/或时间(图片间)预测以减少或去除视频序列中固有的冗余。对于基于块的视频译码来说,可将视频切片(例如,视频帧或视频帧的一部分)分割成视频块,所述视频块也可被称作树型块、译码单元(CU)和/或译码节点。使用相对于同一图片中的相邻块中的参考样本的空间预测来编码图片的帧内译码(I)切片中的视频块。图片的帧间译码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。可将图片称作帧,且可将参考图片称作参考帧。
空间预测或时间预测导致译码用于块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。根据指向形成预测性块的参考样本的块的运动向量和指示经译码块与预测性块之间的差的残余数据来编码帧间译码块。根据帧内译码模式和残余数据来编码帧内译码块。为进行进一步压缩,可将残余数据从像素域变换到变换域,从而产生残余变换系数,可接着量化所述残余变换系数。可扫描最初布置成二维阵列的经量化的变换系数以便产生变换系数的一维向量,且可应用熵译码以达成甚至更多压缩。
发明内容
一般来说,本发明描述用于在视频译码中发信用于操作点的层识别符的技术。所述技术通过不许在符合型位流内的视频参数集(VPS)中针对所述操作点或关于所述操作点的假想参考解码器(HRD)参数信息中的至少一者来译码重复内容而提供发信与所述操作点相关联的信息的经改善效率。根据所述技术,符合型位流可不包含VPS中将与第一操作点相关联的一组层识别符重复以作为第二操作点的内容的语法元素。另外,根据所述技术,符合型位流可不包含VPS中将与第一操作点的HRD参数信息相关联的一组HRD参数重复以作为第二操作点的内容的语法元素。以此方式,所述组层识别符和所述组HRD参数为VPS中的第一操作点独有。
在一个实例中,本发明中所描述的技术涉及一种用于解码视频数据的方法。所述方法包含解码在符合型位流内的视频参数集(VPS)中的语法元素,所述语法元素指示具有第一组内容的第一操作点。所述方法进一步包含解码(如果存在)在符合型位流内的VPS中的语法元素,所述语法元素指示具有第一操作点的第二组内容的假想参考解码器(HRD)参数信息,其中所述符合型位流不包含VPS中针对第二操作点而重复第一组内容或第二组内容中的至少一者的语法元素,且其中解码语法元素包括仅解码符合型位流内的指示第一操作点和HRD参数信息的语法元素。
在另一实例中,本发明中所描述的技术涉及一种用于编码视频数据的方法。所述方法包含编码在符合型位流内的VPS中的语法元素,所述语法元素指示具有第一组内容的第一操作点。所述方法进一步包含编码在符合型位流内的VPS中的语法元素,所述语法元素指示具有第一操作点的第二组内容的HRD参数信息,其中所述符合型位流不包含VPS中针对第二操作点而重复第一组内容或第二组内容中的至少一者的语法元素,且其中编码语法元素包括仅编码来自符合型位流的指示第一操作点和HRD参数信息的语法元素。
在另一实例中,本发明中所描述的技术涉及一种视频译码装置。所述视频译码装置经配置以译码在符合型位流内的VPS中的语法元素,所述语法元素指示具有第一组内容的第一操作点。所述视频译码装置进一步经配置以译码(如果存在)在符合型位流内的VPS中的语法元素,所述语法元素指示具有第一操作点的第二组内容的HRD参数信息,其中所述符合型位流不包含VPS中针对第二操作点而重复第一组内容或第二组内容中的至少一者的语法元素,且其中所述视频译码器经配置以仅译码符合型位流内的指示第一操作点和HRD参数信息的语法元素。
在又一实例中,本文中所描述的技术涉及一种计算机可读存储媒体。所述计算机可读存储媒体具有存储于其上的指令,所述指令在执行时使用于译码视频数据的装置的处理器译码在符合型位流内的VPS中的语法元素,所述语法元素指示具有第一组内容的第一操作点。所述指令在执行时进一步使所述处理器译码(如果存在)在符合型位流内的VPS中的语法元素,所述语法元素指示具有第一操作点的第二组内容的HRD参数信息,其中所述符合型位流不包含VPS中针对第二操作点而重复第一组内容或第二组内容中的至少一者的语法元素,且其中所述处理器经配置以仅译码符合型位流内的指示第一操作点和HRD参数信息的语法元素。
本文中所描述的技术也包含视频译码装置的实例,所述视频译码装置包含用于译码在符合型位流内的VPS中的语法元素的装置,所述语法元素指示具有第一组内容的第一操作点。所述视频译码装置进一步包含用于译码(如果存在)在符合型位流内的VPS中的语法元素的装置,所述语法元素指示具有第一操作点的第二组内容的HRD参数信息,其中所述符合型位流不包含VPS中针对第二操作点而重复第一组内容或第二组内容中的至少一者的语法元素,且其中所述视频译码装置经配置以仅译码符合型位流内的指示第一操作点和HRD参数信息的语法元素。
一或多个实例的细节陈述于随附图式和以下描述中。其它特征、目标和优势将从所述描述和所述图式以及从权利要求书显而易见。
附图说明
图1为说明可利用本发明中所描述的技术的实例视频编码和解码***的框图。
图2为说明可实施本发明中所描述的技术的实例视频编码器的框图。
图3为说明可实施本发明中所描述的技术的实例视频解码器的框图。
图4为说明形成网络的部分的一组实例装置的框图。
图5为说明根据本发明中所描述的技术的用于解码视频数据中所使用的操作点的实例方法的流程图。
图6为说明根据本发明中所描述的技术的用于编码视频数据中所使用的操作点的实例方法的流程图。
具体实施方式
一般来说,本发明描述用于在视频译码中发信用于操作点的层识别符的技术。操作点指可从为时间可缩放和/或具有多个层或视图的原始位流提取的子位流。可基于识别位流的操作点的层识别符和时间子层识别符的值而从位流来提取子位流。发信在位流内的视频参数集(VPS)中的操作点。对于所述操作点中的每一者来说,操作点语法结构指定用以识别位流中属于给定操作点的子位流的网络抽象层(NAL)单元的一组层识别符。以此方式,可基于构成所述给定操作点的子位流的NAL单元的层识别符而从原始位流来提取所述NAL单元。
在一些状况下,可存在关于所述操作点中的一或多者的假想参考解码器(HRD)参数。在此状况下,发信在VPS中的HRD参数信息。对于具有HRD参数的一或多个操作点中的每一者来说,HRD参数语法结构指定一组HRD参数,所述组HRD参数定义用以检查给定操作点的子位流的符合性的HRD。
本发明中所描述的技术包含不许在符合型位流内的VPS中针对操作点或与操作点相关联的HRD参数信息中的至少一者而重复内容。符合型位流可包含VPS中指示具有第一组内容的第一操作点的语法元素,所述第一组内容可包含用于第一操作点的一组层识别符。符合型位流也可包含VPS中指示具有第二组内容的HRD参数信息的语法元素,所述第二组内容可包含用于第一操作点的一组HRD参数。符合型位流可不包含VPS中针对第二操作点而重复第一组内容或第二组内容中的至少一者的语法元素。
根据所述技术,视频编码器经配置以仅编码符合型位流且视频解码器经配置以仅解码符合型位流。在一个实例中,在符合型位流中不许发信用于一个VPS中的不同操作点的若干组重复的层识别符。在另一实例中,在符合型位流中不许发信用于一个VPS中的不同操作点的HDP参数信息中的若干组重复的HRD参数。以此方式,一组给定的层识别符和一组给定的HRD参数为VPS中的第一操作点独有。作为另一实例,所述技术包含译码位流的HRD参数,其中HRD参数语法结构的每一复本包含不同内容。
本发明的技术改善用于发信符合型位流中的操作点的层识别符的效率。例如,所述技术可经由在符合型位流内的单一VPS中针对操作点和与操作点相关联的HRD参数信息仅译码若干组唯一的内容且不许针对单一VPS中的不同操作点而译码重复的内容来改善效率。
视频译码标准包含ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IECMPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual和ITU-T H.264(也被称作ISO/IECMPEG-4 AVC)。视频译码标准进一步包含ITU-T H.264的可缩放视频译码(SVC)和多视图视频译码(MVC)扩展。
另外,存在一种正由ITU-T视频译码专家群(VCEG)和ISO/IEC运动图片专家群(MPEG)的视频译码联合协作小组(JCT-VC)开发的新颖视频译码标准(即高效率视频译码(HEVC))。HEVC的新近工作草案(WD)为工作草案8,且在下文中被称作HEVC WD8(布罗斯等人的高效率视频译码(HEVC)文字规范草案8,2012年7月,斯德哥尔摩,可从2013年5月14日起从http://phenix.int-evry.fr/ict/doc_end_user/documents/10_Stockholm/wg11/JCTVC-J1003-v8.zip获得)。虽然本发明中所描述的技术是关于HEVC标准加以描述,但本发明的方面并不限于此且可扩展到其它视频译码标准以及专有视频译码技术。
图1为说明可利用本发明中所描述的技术的实例视频编码和解码***10的框图。如图1中所示,***10包含源装置12,所述源装置12产生待由目的地装置14在更迟的时间解码的经编码视频数据。源装置12和目的地装置14可包括广泛范围的装置中的任一者,所述装置包含桌上型计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能型”电话的电话手持机、所谓的“智能型”板、电视、摄影机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置或其类似者。在一些状况下,可装备源装置12和目的地装置14以用于达成无线通信。
在图1的实例中,源装置12包含视频源18、视频编码器20和输出接口22。目的地装置14包含输入接口28、视频解码器30和显示装置32。在其它实例中,源装置12和目的地装置14可包含其它组件和布置。例如,源装置12可从外部视频源18(例如,外部摄影机)接收视频数据。同样地,目的地装置14可与外部显示装置建立接口连接,而非包含集成式显示装置。
图1的所说明的***10仅为一个实例。可由任何数字视频编码和/或解码装置来执行本发明的技术。虽然通常由视频编码装置或视频解码装置来执行所述技术,但也可由视频编码器/解码器(通常称作“CODEC”)来执行所述技术。此外,也可由视频预处理器来执行本发明的技术。源装置12和目的地装置14仅仅为这些译码装置的实例,在所述译码装置中,源装置12产生用于传输到目的地装置14的经译码视频数据。在一些实例中,装置12、14可以实质上对称方式进行操作,使得装置12、14中的每一者包含视频编码和解码组件。因此,***10可支持视频装置12、14之间的单向或双向视频传输,例如,用于视频流式传输、视频播放、视频广播或视频电话。
源装置12的视频源18可包含例如摄像机的视频俘获装置、含有先前俘获的视频的视频封存档,和/或用以从视频内容提供者接收视频的视频馈入接口。作为进一步的替代例,视频源18可产生基于计算机图形的数据,作为源视频、或直播视频、经封存视频和计算机产生的视频的组合。在一些状况下,如果视频源18为摄像机,那么源装置12和目的装置14可形成所谓的摄影机电话或视频电话。然而,如上文所提及,本发明中所描述的技术可一般适用于视频译码,且可应用于无线和/或有线应用。
在每一状况下,可由视频编码器20来编码经俘获、经预先俘获或经计算机产生的视频。经编码视频数据可经由源装置12的输出接口22而直接传输到目的地装置14。经编码视频数据也可(或替代地)存储到存储装置上以供稍后由目的地装置14或其它装置存取,以用于解码和/或播放。
链路16可包含:暂时性媒体,例如无线广播或有线网络传输;或存储媒体(即,非暂时性存储媒体),例如硬盘、随身碟、压缩光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器可从源装置12接收经编码视频数据且(例如)经由网络传输将所述经编码视频数据提供到目的地装置14。类似地,媒体生产设施(例如,光盘压印设施)的计算装置可从源装置12接收经编码视频数据且产生含有所述经编码视频数据的光盘。因此,在各种实例中,可将链路16理解为包含各种形式的一或多个计算机可读媒体。链路16可包括能够将经编码视频数据从源装置12移到目的地装置14的任何类型的媒体或装置。在一个实例中,链路16可包括用以使源装置12能够实时将经编码视频数据直接传输到目的地装置14的通信媒体。可根据通信标准(例如,无线通信协议)来调制经编码视频数据,且将经编码视频数据传输到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如,射频(RF)频谱或一或多个物理传输线。通信媒体可形成基于封包的网络(例如,局域网、广域网或例如因特网的全域网络)的部分。通信媒体可包含路由器、交换器、基站,或可用以促进从源装置12到目的地装置14的通信的任何其它装备。
目的地装置14的输入接口28从链路16接收信息,所述链路16可为计算机可读媒体。来自链路16的信息可包含由视频编码器20定义的语法信息(其也由视频解码器30使用),所述语法信息包含描述块和其它经译码单元(例如,GOP)的特性和/或处理的语法元素。显示装置32可与目的地装置14集成或位于目的地装置14外部。显示装置32向用户显示经解码视频数据,且可包括例如以下各者的多种显示装置中的任一者:阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
替代地,经编码数据可从输出接口22输出到存储装置34。类似地,可由输入接口从存储装置34来存取经编码数据。存储装置34可包含多种分散式或本端存取的数据存储媒体(例如,硬盘、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器,或用于存储经编码视频数据的任何其它合适数字存储媒体)中的任一者。在进一步的实例中,存储装置34可对应于可保持由源装置12产生的经编码视频的文件服务器或另一中间存储装置。目的地装置14可经由流式传输或下载从存储装置34存取所存储的视频数据。文件服务器可为能够存储经编码视频数据且将彼经编码视频数据传输到目的地装置14的任何类型的服务器。实例文件服务器包含网页服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置或本端磁盘机。目的地装置14可经由任何标准数据连接(包含因特网连接)来存取经编码视频数据。此数据连接可包含适合于存取存储于文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、缆线调制解调器,等等),或两者的组合。经编码视频数据从存储装置34的传输可为流式传输传输、下载传输或两者的组合。
本发明的技术未必限于无线应用或设定。所述技术可应用于支持多种多媒体应用(例如,(例如)经由因特网的空中电视广播、有线电视传输、***传输、流式传输视频传输)中的任一者的视频译码、供存储于数据存储媒体上的数字视频的编码、存储于数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,***10可经配置成支持单向或双向视频传输以支持例如视频流式传输、视频播放、视频广播和/或视频电话的应用。
视频编码器20和视频解码器30可根据视频译码标准(例如,目前正在开发的HEVC标准)来操作,且可遵照HEVC测试模型(HM)。替代地,视频编码器20和视频解码器30可根据例如ITU-T H.264标准或者被称作MPEG-4第10部分(先进视频译码(AVC)的其它专有或工业标准或这些标准的扩展来操作。然而,本发明的技术并不限于任何特定译码标准。视频译码标准的其它实例包含MPEG-2和ITU-T H.263。在一些方面中,视频编码器20和视频解码器30可各自与音频编码器和解码器集成,且可包含适当的MUX-DEMUX单元或其它硬件和软件,以处置共同数据流或单独数据流中的音频与视频两者的编码。如果适用,那么MUX-DEMUX单元可遵照ITU H.223多路复用器协议或例如用户数据报协议(UDP)的其它协议。
ITU-T H.264/MPEG-4(AVC)标准由ITU-T视频译码专家群(VCEG)连同ISO/IEC动画专家群(MPEG)一起阐明为被称作联合视频小组(JVT)的集体合作的产品。在一些方面中,本发明中所描述的技术可应用于通常遵照H.264标准的装置。H.264标准由ITU-T研究小组在日期为2005年3月描述于ITU-T推荐H.264(用于一般视听服务的先进视频译码)中,其在本文中可被称作H.264标准或H.264规范或H.264/AVC标准或规范。联合视频小组(JVT)继续致力于对H.264/MPEG-4AVC的扩展。
视频编码器20和视频解码器30各自可经实施为多种合适编码器或解码器电路(例如,一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑电路、软件、硬件、固件或其任何组合)中的任一者。当所述技术部分地在软件中实施时,装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中,且在硬件中使用一或多个处理器来执行所述指令以执行本发明的技术。视频编码器20和视频解码器30中的每一者可被包含于一或多个编码器或解码器中,其中任一者可集成为相应装置中的组合式编码器/解码器(CODEC)的部分。包含视频编码器20和/或视频解码器30的装置可包括集成电路、微处理器和/或无线通信装置(例如,蜂窝式电话)。
JCT-VC正致力于HEVC标准的发展。HEVC标准化努力是基于视频译码装置的演进模型,其被称作HEVC测试模型(HM)。HM设想视频译码装置相对于根据(例如)ITU-TH.264/AVC的现有装置的若干额外能力。例如,H.264提供九个帧内预测编码模式,而HM可提供多达三十三个帧内预测编码模式。
一般来说,HM的工作模型描述视频帧或图片可分成包含亮度样本与色度样本两者的树型块或最大译码单元(LCU)序列。位流内的语法数据可定义LCU的大小,LCU就像素的数目来说为最大译码单元。切片包含按译码次序的数个连续树型块。可将视频帧或图片分割成一或多个切片。每一树型块可根据四分树而***成若干译码单元(CU)。一般来说,四分树数据结构中每CU包含一个节点,其中根节点对应于树型块。如果将CU***成四个子CU,那么对应于所述CU的节点包含四个叶节点,所述四个叶节点中的每一者对应于所述子CU中的一者。
所述四分树数据结构中的每一节点可提供针对所述对应CU的语法数据。例如,所述四分树中的节点可包含***旗标,所述***旗标指示是否将对应于所述节点的CU***成子CU。可递回地定义用于CU的语法元素,且所述语法元素可视CU是否***成子CU而定。如果CU未经进一步***,那么其被称作叶CU。在本发明中,即使不存在原始叶CU的明显***,叶CU的四个子CU也将被称作叶CU。例如,如果16×16大小的CU未经进一步***,那么四个8×8子CU也将被称作叶CU,尽管所述16×16CU从未经***。
除了CU不具有大小区别的外,CU的意义类似于H.264标准的宏块的意义。例如,树型块可***成四个子代节点(也被称作子CU),且每一子代节点可又为父代节点并***成另外四个子代节点。被称作四分树的叶节点的最终的未经***子代节点包括译码节点,所述译码节点也被称作叶CU。与经译码位流相关联的语法数据可定义可***树型块的最大次数(其被称作最大CU深度),且也可定义译码节点的最小大小。因此,位流也可定义最小译码单元(SCU)。本发明使用术语“块”来指在HEVC的情况中的CU、PU或TU中的任一者,或在其它标准的情况中的类似数据结构(例如,在H.264/AVC中的宏块和其子块)。
CU包含译码节点和与所述译码节点相关联的若干预测单元(PU)和变换单元(TU)。CU的大小对应于译码节点的大小,且形状必须为正方形。CU的大小的范围可从8×8像素直到具有最大64×64像素或大于64×64像素的树型块的大小。每一CU可含有一或多个PU和一或多个TU。与CU相关联的语法数据可描述(例如)CU到一或多个PU的分割。分割模式可视CU是经跳过或直接模式编码、经帧内预测模式编码抑或经帧间预测模式编码而不同。PU的形状可分割成非正方形。与CU相关联的语法数据也可描述(例如)CU根据四分树到一或多个TU的分割。TU的形状可为正方形或非正方形(例如,矩形)。
HEVC标准允许根据TU的变换,所述变换对于不同CU可不同。通常基于针对经分割LCU所定义的给定CU内的PU的大小而设定TU大小,虽然并非总是如此状况。TU通常具有与PU相同的大小或小于PU。在一些实例中,可使用被称作“残余四分树”(RQT)的四分树结构而将对应于CU的残余样本再分为更小的单元。RQT的叶节点可被称作变换单元(TU)。可变换与TU相关联的像素差值以产生可加以量化的变换系数。
叶CU可包含一或多个预测单元(PU)。一般来说,PU表示对应于对应的CU的全部或一部分的空间区域,且可包含用于检索PU的参考样本的数据。此外,PU包含与预测有关的数据。例如,当PU经帧内模式编码时,用于PU的数据可包含于残余四分树(RQT)中,所述残余四分树(RQT)可包含描述用于对应于PU的TU的帧内预测模式的数据。作为另一实例,当PU经帧间模式编码时,PU可包含定义所述PU的一或多个运动向量的数据。定义PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量所指向的参考图片,和/或运动向量的参考图片列表(例如,列表0、列表1或列表C)。
具有一或多个PU的叶CU也可包含一或多个变换单元(TU)。可使用RQT(也被称作TU四分树结构)来指定变换单元,如上文所论述。例如,***旗标可指示叶CU是否***成四个变换单元。接着,每一变换单元可进一步***成另外的子TU。当TU不进一步***时,其可被称作叶TU。通常,对于帧内译码来说,属于叶CU的所有叶TU共享相同帧内预测模式。即,通常应用相同帧内预测模式来计算叶CU的所有TU的预测值。对于帧内译码来说,视频编码器可将使用帧内预测模式的每一叶TU的残余值计算为在CU的对应于所述TU的部分与原始块之间的差。TU未必限于PU的大小。因此,TU可能大于或小于PU。对于帧内译码来说,PU可与用于同一CU的对应的叶TU共置。在一些实例中,叶TU的最大大小可对应于对应的叶CU的大小。
此外,叶CU的TU也可与被称作残余四分树(RQT)的相应四分树数据结构相关联。即,叶CU可包含指示如何将叶CU分割成TU的四分树。TU四分树的根节点通常对应于叶CU,而CU四分树的根节点通常对应于树型块(或LCU)。RQT的未经***的TU被称作叶TU。一般来说,除非另有指示,否则本发明分别使用术语CU和TU来指叶CU和叶TU。
视频序列通常包含一系列视频帧或图片。图片群组(GOP)通常包括一系列视频图片中的一或多者。GOP可在GOP的标头、图片中的一或多者的标头中或在别处包含描述包含于GOP中的图片数目的语法数据。图片的每一切片可包含描述所述相应切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块进行操作,以便编码视频数据。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小,且可根据指定的译码标准而在大小方面不同。
作为实例,HM支持以各种PU大小进行预测。假定特定CU的大小为2N×2N,那么HM支持以2N×2N或N×N的PU大小进行帧内预测,和以2N×2N、2N×N、N×2N或N×N的对称PU大小进行帧间预测。HM也支持以2N×nU、2N×nD、nL×2N和nR×2N的PU大小进行帧间预测的不对称分割。在不对称分割中,CU的一个方向未分割,而另一方向那么分割成25%和75%。CU的对应于25%分割的部分由“n”继之以“上”、“下”、“左”或“右”的指示来指示。因此,例如,“2N×nU”指在水平方向上以顶部2N×0.5NPU和底部2N×1.5N PU分割的2N×2N CU。
在本发明中,“N×N”与“N乘N”可互换地使用以指视频块在垂直维度与水平维度方面的像素尺寸,例如,16×16像素或16乘16像素。一般来说,16×16块在垂直方向上将具有16个像素(y=16)且在水平方向上将具有16个像素(x=16)。同样地,N×N块通常在垂直方向上具有N个像素,且在水平方向上具有N个像素,其中N表示非负整数值。可按行和列来布置块中的像素。此外,块未必需要在水平方向上与在垂直方向上具有相同数目个像素。例如,块可包括N×M个像素,其中M未必等于N。
在使用CU的PU进行帧内预测或帧间预测译码之后,视频编码器20可计算CU的TU的残余数据。所述PU可包括描述一种在空间域(也称作像素域)中产生预测性像素数据的方法或模式的语法数据且所述TU可包括在将变换(例如,离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换)应用于残余视频数据之后在变换域中的系数。残余数据可对应于未经编码图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形成包含CU的残余数据的TU,且接着变换所述TU以产生CU的变换系数。
在产生变换系数的任何变换之后,视频编码器20可执行变换系数的量化。量化通常指如下的过程:将变换系数量化以可能地减少用以表示所述系数的数据的量,从而提供进一步压缩。所述量化过程可减少与所述系数中的一些或所有相关联的位深度。例如,可在量化期间将n位值降值舍位到m位值,其中n大于m。
在量化之后,视频编码器可扫描变换系数,从而从包含经量化的变换系数的二维矩阵产生一维向量。扫描可经设计成将较高能量(和因此较低频率)系数置于阵列前部且将较低能量(和因此较高频率)系数置于阵列后部。在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化的变换系数,以产生可经熵编码的串列化向量。在其它实例中,视频编码器20可执行自适应性扫描。在扫描经量化的变换系数以形成一维向量之后,视频编码器20可(例如)根据上下文自适应性可变长度译码(CAVLC)、上下文自适应性二进制算术译码(CABAC)、基于语法的上下文自适应性二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法而熵编码所述一维向量。视频编码器20也可熵编码与经编码视频数据相关联的语法元素以供视频解码器30用于解码视频数据。
为执行CABAC,视频编码器20可将上下文模型内的上下文指派给待传输的符号。所述上下文可能关于(例如)符号的相邻值是否为非零。为执行CAVLC,视频编码器20可针对待传输的符号选择可变长度码。可将VLC中的码字构建成使得相对较短码对应于更有可能的符号,而较长码对应于较不可能的符号。以此方式,使用VLC可达成位节省(与(例如)针对待传输的每一符号使用等长度码字相比较)。概率确定可基于指派给符号的上下文而进行。
视频编码器20可进一步将语法数据(例如,基于块的语法数据、基于帧的语法数据,和基于GOP的语法数据)发送到视频解码器30(例如,在帧标头、块标头、切片标头或GOP标头中)。GOP语法数据可描述相应GOP中的帧的数目,且帧语法数据可指示用以编码对应帧的编码/预测模式。
HEVC WD8也允许借助于“简档”和“层级”来约定语法的有限数目的子集。HEVCWD8经设计成在其用于广泛范围的应用、位速率、分辨率、质量和服务的意义上为通用的。其中,应用应涵盖数字存储媒体、电视广播和实时通信。在创建HEVC WD8的过程中,已考虑了来自典型应用的各种要求,已开发了必需的算法元素,且已将这些集成到单一语法中。因此,HEVC WD8将促进在不同应用当中的视频数据互换。然而,考虑到实施HEVC WD8的完整语法的实践性,简档和层级提供用于语法的有限数目的子集的装置。
将“简档”定义为由HEVC WD8指定的完整位流语法的子集。在由给定简档的语法强加的界限内,仍有可能视由位流中的语法元素所取的值而定而需要在编码器和解码器的性能方面非常大的变化。例如,经解码图片的指定大小可需要在编码器和解码器的性能方面非常大的变化。在许多应用中,实施能够处理特定简档内的语法的所有假设性使用的解码器当前既不实际也不经济。
为处理此问题,在每一简档内指定“层”和“层级”。层的层级是强加于位流中的语法元素的值的一组指定的约束。这些约束可为对值的简单限制。替代地,其可采取对值的算术组合的约束的形式(例如,图片宽度乘以图片高度乘以每秒被解码的图片的数目)。针对较低层所指定的层级比针对较高层所指定的层级更受约束。针对所有简档来定义一组相同层级,其中每一层级的定义的大多数方面跨越不同简档而为共同的。在指定的约束内,个别实施方案可支持每一所支持的简档的不同层级。在不同上下文中,层级是在调整之前变换系数的值。在HEVC WD8的附录A中更详细地描述简档和层级。
遵照HEVC WD8的经译码视频内容使用共同语法。为达成完整语法的子集,将发信表示稍后出现于位流中的语法元素的存在或缺乏的旗标、参数和其它语法元素包含于位流中。
HEVC WD8将子层定义为时间可缩放位流的时间可缩放层,其由具有TemporalId变量的特定值的视频译码层(VCL)网络抽象层(NAL)单元和相关联的非VCL NAL单元组成。HEVC WD8进一步将子层表示定义为位流的子集,其由特定子层和较低子层的NAL单元组成。
HEVC WD8的子条款10.1描述位流子集和用以产生子位流的提取过程。一般来说,HEVC WD8描述基于识别位流的操作点的层识别符和时间子层识别符的值而从位流来提取子位流
操作点是通过子位流提取过程的操作而从另一位流产生的位流,其中所述另一位流、目标最高TemporalId和目标层识别符列表作为输入。由一组nuh_reserved_zero_6bits值(表示为OpLayerIdSet)和TemporalId值(表示为OpTid)来识别操作点,且经导出作为子位流提取过程的输出的相关联的位流子集(如HEVC WD8中指定,其中OpTid和OpLayerIdSet作为输入)可独立解码。如果操作点的目标最高TemporalId等于在与目标层识别列表相关联的层集合中的TemporalId的最大值,那么所述操作点与所述层集合相同。否则,所述操作点为所述层集合的子集。
子位流提取过程为指定过程,通过所述过程可从位流去除位流中不属于目标集合(通过目标最高TemporalId和目标层识别符列表layerIdListTarget确定)的NAL单元,其中所述输出子位流由位流中属于目标集合的NAL单元组成。到子位流提取过程的输入是变量tIdTarget和列表targetDecLayerIdSet。子位流提取过程的输出是子位流。所述子位流是通过从位流去除其中TemporalId大于tIdTarget或nuh_reserved_zero_6bits不在targetDecLayerIdSet中的值当中的所有NAL单元而导出。
被包含于在HEVC WD8的子条款10.1中所指定的子位流提取过程的输出中的任何子位流遵照HEVC WD8,其中tIdTarget等于在0到6(包含0和6)的范围中的任何值且其中targetDecLayerIdSet含有值0。遵照HEVC WD8的位流可含有一或多个经译码切片NAL单元,其中nuh_reserved_zero_6bits等于0且TemporalId等于0。
当前HEVC设计具有以下缺点。首先,允许经译码视频序列的时间子集发信一组简档空间、层、兼容简档和关于简档的约束,其不同于完整经译码视频序列的以上各者。然而,对于时间子集来说使用不同简档空间毫无意义,且不存在其中对于时间子集来说具有不同于完整经译码视频序列的其它值(例如层、兼容简档和关于简档的约束)将为有利的举的明显用例。
第二,当前,每一操作点(除第一者的外)的一组nuh_reserved_zero_6bits值(即,层ID)是通过显式地发信被包含于待解码的经译码视频序列中的层ID中的每一者来发信的。然而,在大多数可扩充性译码情况中,层依赖关系是线性的,且仅目标层ID的发信将为足够的。此外,对于非线性层依赖关系(所述非线性层依赖关系对于其中发信多个层ID的多视图译码情况来说是典型的)来说,可差分地来译码层ID。差分地译码层ID简单且有效率,其类似于(例如)短期参考图片集合发信中的图片次序计数(POC)值的译码。最后,其被允许发信若干组重复的层ID。
第三,当前HEVC设计也具有缺点,因为其被允许具有拥有相同内容的重复hrd_parameters()语法结构。
本发明中包含以下技术以解决以上缺点。首先,从profile_tier_level()语法结构去除用于发信时间子层的简档空间、层、兼容简档和关于简档的约束的语法元素。因此,节约了不必用于时间子层的那些语法元素上的位。
第二,定义简单操作点模式,对于所述简单操作点模式来说,仅需要发信nuh_reserved_zero_6bits(即,层ID)的一个值。操作点的发信经改变以使得能够用简单操作点模式来仅发信操作点的nuh_reserved_zero_6bits的一个值。当发信nuh_reserved_zero_6bits(即,层ID)的多个值时,所述值被差分地译码。发信操作点的此方法对于具有线性层依赖性的任何可扩充性译码、多视图和/或3DV(3维视频)译码情况更有效率。此外,根据本发明的技术,在一个VPS内,不许针对VPS中的不同操作点所发信的若干组重复的层ID。以此方式,一组给定的层识别符为VPS中的给定操作点独有。
第三,根据本发明的技术,不许译码于与VPS中的操作点相关联的hrd_parameters()语法结构中的若干组重复的HRD参数。以此方式,在与给定操作点相关联的HRD参数信息中的一组给定的HRD参数为VPS中的所述给定操作点独有。
例如,视频编码器20编码在符合型位流内的VPS中的语法元素。所述语法元素指示具有第一组内容的第一操作点。视频编码器20进一步编码在符合型位流内的VPS中的语法元素,所述语法元素指示具有第一操作点的第二组内容的HRD参数信息。所述符合型位流不包含VPS中针对第二操作点而重复第一组内容或第二组内容中的至少一者的语法元素。因此,视频编码器20编码具有唯一内容(例如若干组不同的层ID)的每一操作点。作为进一步的实例,视频编码器20可编码位流的HRD参数,其中HRD参数语法结构的每一复本包含不同内容。
类似地,根据本发明中所描述的技术,视频解码器30解码在符合型位流内的VPS中的语法元素。所述语法元素指示具有第一组内容的第一操作点。在一些实例中,视频解码器30从视频编码器20接收经编码的符合型位流。视频解码器30进一步解码(如果存在)在符合型位流内的VPS中的语法元素,所述语法元素指示具有第一操作点的第二组内容的HRD参数信息。所述符合型位流不包含VPS中针对第二操作点而重复第一组内容或第二组内容中的至少一者的语法元素。因此,视频解码器30解码具有唯一内容(例如若干组不同的层ID)的每一操作点。作为进一步的实例,视频解码器30可解码位流的HRD参数,其中HRD参数语法结构的每一复本包含不同内容。在额外的实例中,第二组内容包括用于第一操作点的一组HRD参数,所述组HRD参数定义用以检查第一操作点的子位流的符合性的HRD。
指示第一操作点的语法元素可包含在符合型位流内的VPS中的operation_point()语法结构。进一步,指示HRD参数信息的语法元素可包括在符合型位流内的VPS中的hrd_parameters()语法结构。
在以上实例中,符合型位流可不包含VPS中针对第二操作点而重复第一组内容的语法元素,所述第一组内容为VPS中的第一操作点独有。进一步,符合型位流可不包含VPS中针对第二操作点而重复具有第二组内容的HRD参数信息的语法元素,所述第二组内容为VPS中的第一操作点独有。
在一些实例中,视频编码器20可进一步指示是否将简单操作点模式用于位流的多个操作点中的每一者。当将简单操作点模式用于所述操作点中的特定者时,视频编码器20可仅编码所述特定操作点的一个目标层识别符。作为另一实例,视频编码器20可编码位流的简档空间、层、兼容简档和/或关于简档的约束,但不编码位流的时间子层的单独简档空间、层、兼容简档或关于简档的约束。
同样地,视频解码器30可接收是否将简单操作点模式用于位流的多个操作点中的每一者的指示。当将简单操作点模式用于操作点中的特定者时,视频解码器30可仅解码所述特定操作点的一个目标层识别符。作为另一实例,视频解码器30可解码位流的简档空间、层、兼容简档和/或关于简档的约束,但不解码位流的时间子层的单独简档空间、层、兼容简档或关于简档的约束。
图2为说明可实施本发明中所描述的技术的视频编码器20的实例的框图。视频编码器20可执行视频切片内的视频块的帧内译码和帧间译码。帧内译码依赖于空间预测以减少或去除给定视频帧或图片内的视频中的空间冗余。帧间译码依赖于时间预测以减少或去除视频序列的邻近帧或图片内的视频中的时间冗余。帧内模式(I模式)可指若干基于空间的译码模式中的任一者。帧间模式(例如,单向预测(P模式)或双向预测(B模式))可指若干基于时间的译码模式中的任一者。
如图2中所示,视频编码器20接收待编码的视频帧内的当前视频块。在图2的实例中,视频编码器20包含模式选择单元40、参考帧存储器64、求和器50、变换处理单元52、量化单元54和熵译码单元56。模式选择单元40又包含运动补偿单元44、运动估计单元42、帧内预测处理单元46和分割单元48。为达成视频块重构建,视频编码器20也包含反量化单元58、反变换处理单元60和求和器62。也可包含解块滤波器以对块边界滤波从而从重构建的视频去除方块效应伪影。如果需要,解块滤波器将通常对求和器62的输出进行滤波。除解块滤波器的外,也可使用额外滤波器(回路内或回路后)。为简洁起见未展示这些滤波器,但这些滤波器在需要时可对求和器50的输出进行滤波(作为回路内滤波器)。
在编码过程期间,视频编码器20接收待译码的视频帧或切片。可将所述帧或切片分成多个视频块。运动估计单元42和运动补偿单元44相对于一或多个参考帧中的一或多个块来执行经接收视频块的帧间预测性译码,以提供时间预测。帧内预测处理单元46可替代地相对于在与待译码块相同的帧或切片中的一或多个相邻块来执行经接收视频块的帧内预测性译码以提供空间预测。视频编码器20可执行多个译码遍次(例如)以选择用于视频数据的每一块的适当译码模式。
此外,分割单元48可基于先前译码遍次中的先前分割方案的评估而将视频数据的块分割成若干子块。例如,分割单元48可最初将帧或切片分割成LCU,且基于位率-失真分析(例如,位率-失真优化)来将所述LCU中的每一者分割成子CU。模式选择单元40可进一步产生指示LCU到子CU的分割的四分树数据结构。四分树的叶节点CU可包含一或多个PU和一或多个TU。
模式选择单元40可选择译码模式(帧内或帧间)中的一者(例如,基于误差结果),且将所得的经帧内或帧间译码块提供到求和器50以产生残余块数据且提供到求和器62以重构建供用作参考帧的经编码块。模式选择单元40也将例如运动向量、帧内模式指示符、分割信息和其它此类语法信息的语法元素提供到熵译码单元56。
运动估计单元42和运动补偿单元44可高度集成,但为概念目的而单独加以说明。由运动估计单元42执行的运动估计为产生运动向量的过程,所述运动向量估计视频块的运动。例如,运动向量可指示在当前视频帧或图片内的视频块的PU相对于在参考帧(或其它经译码单元)内的预测性块(其关于在所述当前帧(或其它经译码单元)内正被译码的当前块)的位移。预测性块为被发现在像素差方面紧密地匹配待译码块的块,所述像素差可由绝对差和(SAD)、平方差和(SSD)或其它差度量予以确定。在一些实例中,视频编码器20可计算存储于参考帧存储器64中的参考图片的次整数像素位置的值。例如,视频编码器20可内插所述参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可执行相对于全像素位置和分数像素位置的运动搜索,且以分数像素精度输出运动向量。
运动估计单元42通过比较帧间译码切片中的视频块的PU的位置与参考图片的预测性块的位置来计算所述PU的运动向量。所述参考图片可选自第一参考图片列表(列表0)或第二参考图片列表(列表1),所述列表0或所述列表1中的每一者识别存储于参考帧存储器64中的一或多个参考图片。运动估计单元42将所计算的运动向量发送到熵译码单元56和运动补偿单元44。
由运动补偿单元44执行的运动补偿可涉及到基于由运动估计单元42所确定的运动向量来提取或产生所述预测性块。再次,在一些实例中,运动估计单元42和运动补偿单元44可在功能上集成。一接收到当前视频块的PU的运动向量,运动补偿单元44就可将运动向量所指向的预测性块定位于参考图片列表中的一者中。求和器50通过从正被译码的当前视频块的像素值减去预测性块的像素值来形成残余视频块,从而形成像素差值,如下文所论述。一般来说,运动估计单元42执行相对于亮度分量的运动估计,且运动补偿单元44将基于所述亮度分量所计算的运动向量用于色度分量与亮度分量两者。模式选择单元40也可产生与视频块和视频切片相关联的语法元素以供视频解码器30用于解码视频切片的视频块。
如上文所描述,作为由运动估计单元42和运动补偿单元44执行的帧间预测的替代例,帧内预测处理单元46可帧内预测当前块。明确地说,帧内预测处理单元46可确定待用以编码当前块的帧内预测模式。在一些实例中,帧内预测处理单元46可(例如)在单独编码遍次期间使用各种帧内预测模式来编码当前块,且帧内预测处理单元46(或在一些实例中,模式选择单元40)可从经测试的模式选择将使用的适当帧内预测模式。
例如,帧内预测处理单元46可使用针对各种经测试的帧内预测模式的位率-失真分析来计算位率-失真值,且在经测试的模式当中选择具有最佳位率-失真特性的帧内预测模式。位率-失真分析通常确定经编码块与原始未经编码块之间的失真(或误差)的量以及用以产生经编码块的位速率(即,位数目),所述原始未经编码块经编码以产生所述经编码块。帧内预测处理单元46可从失真和位率计算各种经编码块的比率以确定哪一帧内预测模式展现块的最佳位率-失真值。
在针对块选择帧内预测模式之后,帧内预测处理单元46可将指示对于所述块所选择的帧内预测模式的信息提供到熵译码单元56。熵译码单元56可编码指示所述所选择的帧内预测模式的信息。视频编码器20可在所传输的位流配置数据中包含各种块的编码上下文的定义和待用于所述上下文中的每一者的最有可能的帧内预测模式、帧内预测模式索引表和经修改的帧内预测模式索引表的指示,所述位流配置数据可包含多个帧内预测模式索引表和多个经修改的帧内预测模式索引表(也被称作码字映射表)。
视频编码器20通过从正被译码的原始视频块减去来自模式选择单元40的预测数据而形成残余视频块。求和器50表示执行此减法运算的一或多个组件。变换处理单元52将例如离散余弦变换(DCT)或概念上类似的变换的变换应用于残余块,从而产生包括残余变换系数值的视频块。变换处理单元52可执行概念上类似于DCT的其它变换。也可使用小波变换、整数变换、子频带变换或其它类型的变换。在任何状况下,变换处理单元52将变换应用于残余块,从而产生残余变换系数的块。所述变换可将残余信息从像素值域转换到变换域(例如,频域)。变换处理单元52可将所得变换系数发送到量化单元54。
量化单元54量化变换系数以进一步减小位速率。所述量化过程可减小与所述系数中的一些或所有相关联的位深度。可通过调整量化参数来修改量化程度。在一些实例中,量化单元54可接着执行包含经量化的变换系数的矩阵的扫描。替代地,熵译码单元56可执行扫描。
在量化之后,熵译码单元56熵译码经量化的变换系数。例如,熵译码单元56可执行上下文自适应性可变长度译码(CAVLC)、上下文自适应性二进制算术译码(CABAC)、基于语法的上下文自适应性二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵译码技术。在基于上下文的熵译码的状况下,上下文可基于相邻块。在通过熵译码单元56进行的熵译码之后,可将经编码位流传输到另一装置(例如,视频解码器30)或经封存以供稍后传输或检索。
反量化单元58和反变换处理单元60分别应用反量化和反变换以在像素域中重构建残余块(例如)以供稍后用作参考块。运动补偿单元44可通过将所述残余块添加到参考帧存储器64的帧中的一者的预测性块来计算参考块。运动补偿单元44也可将一或多个内插滤波器应用于所述经重构建的残余块以计算供用于运动估计的次整数像素值。求和器62将所述经重构建的残余块添加到由运动补偿单元44产生的经运动补偿的预测块以产生供存储于参考帧存储器64中的经重构建的视频块。所述经重构建的视频块可由运动估计单元42和运动补偿单元44用作参考块以帧间译码在后续视频帧中的块。
图2的视频编码器20表示经配置以实施本文中所描述的技术中的一或多者的视频编码器的实例。视频编码器20发信在与位流相关联的视频参数集(VPS)中的操作点。操作点指可从为时间可缩放和/或具有多个层或视图的原始位流提取的子位流。在HEVC中,可由一组nuh_reserved_zero_6bits值(表示为OpLayerIdSet)和一TemporalId值(表示为OpTid)来识别操作点。作为实例,原始位流可包含处于不同空间分辨率的三个层或视图和处于不同帧速率的两个时间可缩放层。在此实例中,原始位流包含六个操作点,其中三个空间分辨率中的每一者在任一帧速率下是可用的。
对于视频编码器20在与位流相关联的VPS中发信的操作点中的每一者来说,操作点语法结构指定用以识别位流中属于一给定操作点的子位流的网络抽象层(NAL)单元的一组层识别符(ID)。以此方式,构成给定操作点的子位流的NAL单元可基于所述NAL单元的层识别符而从原始位流来提取。
在一些状况下,视频编码器20可进一步编码关于操作点中的一或多者的假想参考解码器(HRD)参数。在此状况下,视频编码器20发信VPS中的HRD参数信息。对于具有HRD参数的一或多个操作点中的每一者来说,HRD参数语法结构指定一组HRD参数,所述组HRD参数定义用以检查给定操作点的子位流的符合性的HRD。
常规地,视频译码标准允许位流包含待针对VPS中的操作点加以发信的若干组重复的层识别符。此意谓两个或两个以上的操作点可具有一组相同的层识别符且因此识别待构成操作点的子位流的相同NAL单元。以此方式,多个操作点可参考位流的相同内容。类似地,视频译码标准允许位流包含待针对VPS中的操作点加以发信的若干组重复的HRD参数。此意谓两组或两组以上的HRD参数可具有相同内容且因此定义用以检查相关操作点的子位流的符合性的两个相同HRD。在两种状况下,发信是多余的且存在对位的无效使用。
本发明的技术通过不许在符合型位流内的VPS中针对操作点抑或关于操作点的HRD参数来发信重复的内容而改善发信与操作点相关联的信息的效率。根据本发明的技术,视频编码器20可编码在符合型位流内的VPS中的语法元素,所述语法元素指示具有第一组内容的第一操作点。视频编码器20也可编码(如果存在)在符合型位流内的VPS中的语法元素,所述语法元素指示具有第一操作点的第二组内容的HRD参数信息。符合型位流不包含VPS中针对第二操作点而重复第一组内容或第二组内容中的至少一者的语法元素,且视频编码器20经配置以仅编码符合型位流。如上文所描述,第一组内容可包括用于第一操作点的一组层识别符,且第二组内容可包括用于第一操作点的一组HRD参数。
在一个实例中,视频编码器20将仅编码符合型位流使得在编码在位流内的VPS中的语法元素(指示具有第一组层识别符的第一操作点)之后,视频编码器20不编码VPS中针对第二操作点而重复第一组层识别符的语法元素。本发明的技术已不许针对在符合型位流内的相同VPS中的操作点而重复若干组层识别符。第一组层识别符必须为VPS中的第一操作点独有或位流将为非符合型。即,例如,非符合型位流可含有用于第一操作点的第一组层识别符且也含有用于第二操作点的第二组层识别符,其中所述第二组包含与所述第一组相同的层识别符。因此,视频编码器20不应编码在符合型位流的VPS中针对第一操作点和第二操作点而重复若干组层识别符的语法元素。
在另一实例中,可存在第一操作点的HRD参数。在此状况下,在编码在位流内的VPS中指示具有第一操作点的第一组HRD参数的HRD参数信息的语法元素之后,视频编码器20不编码VPS中针对第二操作点而重复第一组HRD参数的语法元素。本发明的技术已不许针对在符合型位流内的相同VPS中的操作点而重复若干组HRD参数。第一组HRD参数必须为VPS中的第一操作点独有或位流将为非符合型。因此,视频编码器20不应编码在符合型位流的VPS中针对第一操作点和第二操作点而重复若干组HRD参数的语法元素。
在另一实例中,视频编码器20可指示是否将简单操作点模式用于位流的多个操作点中的每一者,且当将简单操作点模式用于所述操作点中的特定者时仅编码所述特定操作点的一个目标层识别符。简单操作点模式为对于每一操作点来说OpLayerIdSet包含且仅包含nuh_reserved_zero_6bits的特定值和nuh_reserved_zero_6bits的所有其它值(小于nuh_reserved_zero_6bits的所述特定值)的模式。在一些实例中,当视频编码器20编码经发信的nuh_reserved_zero_6bits(即,层ID)的多个值时,视频编码器20差分地编码所述值。因此,操作点的发信对于达成具有线性层依赖性的任何可扩充性译码、多视图、和/或3DV译码情况来说更为有效率。如上文所描述,视频编码器20不编码在一个VPS内的一组重复的层ID。
作为另一实例,视频编码器20可编码位流的简档空间、层、兼容简档和/或关于简档的约束,但不编码位流的时间子层的单独简档空间、层、兼容简档或关于简档的约束。如上文所描述,视频编码器20可编码位流的HRD参数,其中HRD参数语法结构的每一复本包含不同内容。
视频编码器20可利用以下语法和语义。表1中如下定义一实例视频参数集原始字节序列有效负载(RBSP)。
表1:视频参数集RBSP语法和语义
等于1的旗标vps_simple_op_mode_flag[i]指定简单操作点模式正用于第i个operation_point_layer_ids()语法结构。当vps_simple_op_mode_flag[i]等于0时,所述旗标指定简单操作点模式并非正用于第i个operation_point()语法结构。
语法结构hrd_parameters(i,vps_max_sub_layers_minus1)和hrd_parameters(j,vps_max_sub_layers_minus1)的任何两个例子不应具有相同内容,其中i不等于j。因此,视频编码器20编码仅包含唯一HRD参数的语法结构。
表2提供实例简档、层和层级语法和语义。
表2:简档、层和层级语法和语义
当ProfilePresentFlag等于1时,等于1的旗标sub_layer_profile_present_flag[i]指定对于具有等于i的TemporalId的子层表示来说简档信息存在于profile_tier_level()语法结构中。等于0的旗标sub_layer_profile_present_flag[i]指定对于具有等于i的TemporalId的子层表示来说简档信息不存在于profile_tier_level()语法结构中。当不存在时,推断sub_layer_profile_present_flag[i]的值等于0。
等于1的旗标sub_layer_level_present_flag[i]指定对于具有等于i的TemporalId的子层表示来说层级信息存在于profile_tier_level()语法结构中。等于0的旗标sub_layer_level_present_flag[i]指定对于具有等于i的TemporalId的子层表示来说层级信息不存在于profile_tier_level()语法结构中。
语法元素sub_layer_profile_idc[i]和sub_layer_level_idc[i]分别具有与general_profile_idc和general_level_idc相同的语义,但是应用于具有等于i的TemporalId的子层表示。
例如,视频编码器20可编码等于1的sub_layer_profile_present_flag[i]以指示对于具有等于i的TemporalId的子层表示来说简档信息存在于profile_tier_level()语法结构中。视频编码器20可不发信用于profile_tier_level()语法结构中的时间子层的简档空间、层、兼容简档和关于简档的约束的发信的语法元素。
表3提供实例操作点语法和语义。
表3:操作点语法和语义
operation_point(opIdx)语法结构指定被包含于应用有视频参数集中的opIdx-thhrd_parameters()语法结构的操作点的OpLayerIdSet中的一组nuh_reserved_zero_6bits值。
当vps_simple_op_mode_flag[opIdx]等于0时,语法元素op_first_present_layer_id[opIdx]指定被包含于应用有视频参数集中的opIdx-thhrd_parameters()语法结构的操作点的OpLayerIdSet中的nuh_reserved_zero_6bits的第一(即,第0)值。当vps_simple_op_mode_flag[opIdx]等于1时,op_first_present_layer_id[opIdx]指定被包含于应用有视频参数集中的opIdx-th hrd_parameters()语法结构的操作点的OpLayerIdSet中的nuh_reserved_zero_6bits的最大值。
当vps_simple_op_mode_flag[opIdx]等于0时,语法元素op_num_layer_id_values_minus1[opIdx]加1指定被包含于应用有视频参数集中的opIdx-thhrd_parameters()语法结构的操作点的OpLayerIdSet中的nuh_reserved_zero_6bits值的数目。op_num_layer_id_values_minus1[opIdx]的值应小于或等于63。
当vps_simple_op_mode_flag[opIdx]等于0时,op_layer_id_delta_minus1[opIdx][i]加1指定被包含于应用有视频参数集中的第opIdx个hrd_parameters()语法结构的操作点的OpLayerIdSet中的nuh_reserved_zero_6bits的第i值与nuh_reserved_zero_6bits的第(i-1)值之间的差。op_layer_id_delta_minus1[opIdx][i]的值应在0到63(包含0和63)的范围中。
如下获得变量NumOpLayerIdsMinus1[opIdx]。
推断NumOpLayerIdsMinus1[0]等于0。
对于在0到NumOpLayerIdsMinus1[opIdx](包含0和NumOpLayerIdsMinus1[opIdx])的范围中的i来说,如下获得变量OpLayerId[opIdx][i]。
推断OpLayerId[0][0]的值等于0。
当i不等于j且i与j两者在0到NumOpLayerIdsMinus1[opIdx](包含0和NumOpLayerIdsMinus1[opIdx])的范围中时,无OpLayerId[opIdx][i]的值应等于OpLayerId[opIdx][j]。
任何两组OpLayerId[opIdx1]和OpLayerId[opIdx2](其中opIdx1不等于opIdx2)不应包含若干组相同的nuh_reserved_zero_6bits值。
对于在0到NumOpLayerIdsMinus1[opIdx](包含0和NumOpLayerIdsMinus1[opIdx])的范围中的i来说,应用有视频参数集中的opIdx-thhrd_parameters()语法结构的操作点的OpLayerIdSet经设定以包含且仅包含等于OpLayerId[opIdx][i]的nuh_reserved_zero_6bits值。
因此,视频编码器20可使用本文中所描述的技术来编码在符合型位流内的VPS中的语法元素,所述语法元素指示具有第一组内容的第一操作点。符合型位流不包含VPS中针对第二操作点而重复第一组内容或第二组内容中的至少一者的语法元素,且其中视频解码器经配置以仅解码符合型位流。例如,视频编码器20编码符合型位流使得其不包含VPS中针对第二操作点而重复第一组内容的语法元素,所述第一组内容为VPS中的第一操作点独有。
表4提供替代性实例操作点语法和语义。
表4:替代性操作点语法和语义
operation_point(opIdx)语法结构指定被包含于应用有视频参数集中的opIdx-thhrd_parameters()语法结构的操作点的OpLayerIdSet中的一组nuh_reserved_zero_6bits值。
语法元素op_num_layer_id_values_minus1[opIdx]加1指定被包含于应用有视频参数集中的opIdx-th hrd_parameters()语法结构的操作点的OpLayerIdSet中的nuh_reserved_zero_6bits值的数目。op_num_layer_id_values_minus1[opIdx]的值应小于或等于63。当不存在时,推断op_num_layer_id_values_minus1[opIdx]的值等于0。
在遵照本文中所描述的技术的位流中,op_num_layer_id_values_minus1[opIdx]应等于0。虽然在一些实例中要求op_num_layer_id_values_minus1[opIdx]的值等于0,但视频解码器(例如视频解码器30)应允许其它值出现在op_num_layer_id_values_minus1[opIdx]语法中。
语法元素op_layer_id[opIdx][i]指定被包含于应用有视频参数集中的第opIdx个hrd_parameters()语法结构的操作点的OpLayerIdSet中的nuh_reserved_zero_6bits的第i值。
如下获得变量NumOpLayerIdsMinus1[opIdx]。
推断NumOpLayerIdsMinus1[0]等于0。
对于在0到NumOpLayerIdsMinus1[opIdx](包含0和NumOpLayerIdsMinus1[opIdx])的范围中的i来说,如下获得变量OpLayerId[opIdx][i]。
for(i=0;i<=NumOpLayerIdsMinus1[opIdx];i++)
OpLayerId[opIdx][i]=vps_simple_op_mode_flag[opIdx]?i:
op_layer_id[opIdx][i]
推断OpLayerId[0][0]的值等于0。
当i不等于j且i与j两者在0到NumOpLayerIdsMinus1[opIdx](包含0和NumOpLayerIdsMinus1[opIdx])的范围中时,无OpLayerId[opIdx][i]的值应等于OpLayerId[opIdx][j]。
任何两组OpLayerId[opIdx1]和OpLayerId[opIdx2](其中opIdx1不等于opIdx2)不应包含若干组相同的nuh_reserved_zero_6bits值。
对于在0到NumOpLayerIdsMinus1[opIdx](包含0和NumOpLayerIdsMinus1[opIdx])的范围中的i来说,应用有视频参数集中的第opIdx个hrd_parameters()语法结构的操作点的OpLayerIdSet经设定以包含且仅包含等于OpLayerId[opIdx][i]的nuh_reserved_zero_6bits值。
因此,根据本文中所描述的技术,视频编码器20可指示是否将简单操作点模式用于位流的多个操作点中的每一者。当将简单操作点模式用于所述操作点中的特定者时,视频编码器20可仅编码所述特定操作点的一个目标层识别符。作为另一实例,视频编码器20可编码位流的简档空间、层、兼容简档和/或关于简档的约束,但不编码位流的时间子层的单独简档空间、层、兼容简档或关于简档的约束。作为进一步的实例,视频编码器20可编码位流的HRD参数,其中HRD参数语法结构的每一复本包含不同内容。
图3为说明可实施本发明中所描述的技术的视频解码器30的实例的框图。在图3的实例中,视频解码器30包含熵解码单元70、运动补偿单元72、帧内预测处理单元74、反量化单元76、反变换处理单元78、参考帧存储器82和求和器80。在一些实例中,视频解码器30可执行通常与关于视频编码器20(如图2中所示)所描述的编码遍次互反的解码遍次。
在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频切片的视频块和相关联的语法元素的经编码视频位流。视频解码器30可从网络实体29接收经编码视频位流。网络实体29可(例如)为服务器、媒体感知网络元件(MANE)、视频编辑器/拼接器,或经配置以实施上文所描述的技术中的一或多者的其它此装置。网络实体29可包含经配置以执行本发明的技术的外部装置。如上文所描述,在网络实体29将经编码视频位流传输到视频解码器30之前,可由网络实体29来实施本发明中所描述的技术中的一些技术。在一些视频解码***中,网络实体29和视频解码器30可为单独装置的部分,而在其它例子中,可由包括视频解码器30的相同装置来执行关于网络实体29所描述的功能性。
视频解码器30的熵解码单元70熵解码所述位流以产生经量化系数、运动向量或帧内预测模式指示符和其它语法元素。熵解码单元70将运动向量和其它语法元素转递到运动补偿单元72。视频解码器30可在视频切片层级和/或视频块层级下接收语法元素。
当视频切片经译码为帧内译码(I)切片时,帧内预测处理单元74可基于所发信的帧内预测模式和来自当前帧或图片的先前经解码块的数据来产生当前视频切片的视频块的预测数据。当视频帧经译码为帧间译码(即,B、P或GPB)切片时,运动补偿单元72基于从熵解码单元70接收的运动向量和其它语法元素而产生用于当前视频切片的视频块的预测性块。所述预测性块可从参考图片列表中的一者内的参考图片中的一者产生。视频解码器30可基于存储于参考帧存储器82中的参考图片使用默认构建技术来构建参考帧列表(列表0和列表1)。
运动补偿单元72通过剖析运动向量和其它语法元素来确定当前视频切片的视频块的预测信息,且使用所述预测信息以产生正被解码的当前视频块的预测性块。例如,运动补偿单元72使用所接收的语法元素中的一些语法元素来确定用以译码视频切片的视频块的预测模式(例如,帧内预测或帧间预测)、帧间预测切片类型(例如,B切片或P切片)、用于切片的参考图片列表中的一或多者的构建信息、用于切片的每一经帧间编码视频块的运动向量、用于切片的每一经帧间译码视频块的帧间预测状态和其它信息,以解码当前视频切片中的视频块。
运动补偿单元72也可基于内插滤波器来执行内插。运动补偿单元72可使用如由视频编码器20在视频块的编码期间使用的内插滤波器,以计算参考块的次整数像素的内插值。在此状况下,运动补偿单元72可从所接收的语法元素确定由视频编码器20使用的内插滤波器且使用所述内插滤波器来产生预测性块。
反量化单元76反量化(即,解量化)提供于位流中且由熵解码单元70解码的经量化的变换系数。反量化过程可包含使用由视频解码器30针对视频切片中的每一视频块所计算的量化参数QPY以确定量化的程度,且同样地确定应加以应用的反量化的程度。反变换处理单元78将反变换(例如,反DCT、反整数变换或概念上类似的反变换过程)应用于变换系数以便在像素域中产生残余块。
在运动补偿单元72基于运动向量和其它语法元素而产生用于当前视频块的预测性块之后,视频解码器30通过合计来自反变换处理单元78的残余块和通过运动补偿单元72所产生的对应的预测性块来形成经解码视频块。求和器90表示执行此求和运算的一或多个组件。如果需要,也可应用解块滤波器来对经解码块滤波以便去除方块效应伪影。其它回路滤波器(译码回路中或译码回路后)也可用以使像素转变平滑,或以其它方式改善视频质量。给定帧或图片中的经解码视频块接着被存储于参考帧存储器82中,所述参考帧存储器82存储用于后续的运动补偿的参考图片。参考帧存储器82也存储供稍后在显示装置(例如图1的显示装置32)上呈现的经解码视频。
图3的视频解码器30表示经配置以实施本文中所描述的技术中的一或多者的视频解码器的实例。本发明的技术通过不许在符合型位流内的VPS中针对操作点抑或关于操作点的HRD参数来发信重复的内容而改善发信与操作点相关联的信息的效率。根据本发明的技术,视频解码器30可解码在符合型位流内的VPS中的语法元素,所述语法元素指示具有第一组内容的第一操作点。另外,视频解码器30可解码(如果存在)在符合型位流内的VPS中的语法元素,所述语法元素指示具有第一操作点的第二组内容的HRD参数信息。符合型位流不包含VPS中针对第二操作点而重复第一组内容或第二组内容中的至少一者的语法元素,且视频解码器30经配置以仅解码符合型位流。如上文所描述,第一组内容可包括用于第一操作点的一组层识别符且第二组内容可包括用于第一操作点的一组HRD参数。
在一个实例中,在解码在位流内的VPS中的语法元素(其指示具有第一组层识别符的第一操作点)之后,视频解码器30将仅在位流为不包含VPS中针对第二操作点而重复第一组层识别符的语法元素的符合型位流的情况下才继续解码。本发明的技术已不许针对在符合型位流内的相同VPS中的操作点来重复若干组层识别符。第一组层识别符必须为VPS中的第一操作点独有或位流将为非符合型。视频解码器30仅解码在符合型位流的VPS中的不包含用于第一操作点和第二操作点的若干组重复的层识别符的语法元素。在视频解码器30接收到非符合型位流的状况下,视频解码器30可进入故障条件且舍弃整个位流。
在另一实例中,可存在第一操作点的HRD参数。在此状况下,在译码在位流内的VPS中的语法元素(指示具有第一操作点的第一组HRD参数的HRD参数信息)之后,视频解码器30将仅在位流为不包含VPS中针对第二操作点而重复第一组HRD参数的语法元素的符合型位流的情况下才继续解码。本发明的技术已不许针对符合型位流内的相同VPS中的操作点来重复若干组HRD参数。第一组HRD参数必须为VPS中的第一操作点独有或位流将为非符合型。视频解码器30仅解码在符合型位流的VPS中的不包含用于第一操作点和第二操作点的若干组重复的HRD参数的语法元素。在视频解码器30接收到非符合型位流的状况下,视频解码器30可进入故障条件且舍弃整个位流。
作为另一实例,视频解码器30可接收到是否将简单操作点模式用于位流的多个操作点中的每一者的指示。当将简单操作点模式用于所述操作点中的特定者时,视频解码器30可仅解码所述特定操作点的一个目标层识别符。作为另一实例,视频解码器30可解码位流的简档空间、层、兼容简档和/或关于简档的约束,但不解码位流的时间子层的单独简档空间、层、兼容简档或关于简档的约束。如上文所描述,视频解码器30可解码位流的HRD参数,其中HRD参数语法结构的每一复本包含不同内容。
图4为说明形成网络100的部分的一组实例装置的框图。在此实例中,网络100包含路由装置104A、104B(路由装置104)和转码装置106。路由装置104和转码装置106希望表示可形成网络100的部分的少量装置。其它网络装置(例如,交换器、集线器、网关、防火墙、桥接器和其它这些装置)也可包含于网络100内。此外,可沿服务器装置102与客户端装置108之间的网络路径来提供额外网络装置。在一些实例中,服务器装置102可对应于源装置12(图1),而客户端装置108可对应于目的地装置14(图1)。
一般来说,路由装置104实施一或多个路由协议以经由网络100来交换网络数据。在一些实例中,路由装置104可经配置以执行代理或高速缓存操作。因此,在一些实例中,可将路由装置104称作代理装置。一般来说,路由装置104执行路由协议以经由网络100来发现路径。通过执行这些路由协议,路由装置104B可发现从其自身经由路由装置104A到服务器装置102的网络路径。
可由例如路由装置104和转码装置106的网络装置来实施本发明的技术,但也可通过客户端装置108来实施本发明的技术。以此方式,路由装置104、转码装置106和客户端装置108表示经配置以执行本发明的技术(包含在本发明的权利要求书部分中所叙述的技术)的装置的实例。此外,图1的装置和图2中所示的编码器与图3中所示的解码器也为可经配置以执行本发明的技术(包含在本发明的权利要求书部分中所叙述的技术)的示范性装置。
如本发明中所描述,“视频译码器”可用以通常指视频编码装置与视频解码装置两者。另外,“视频译码”可指视频编码或视频解码。
图5为说明根据本发明中所描述的技术的解码视频数据的实例方法200的流程图。例如,可由经配置以处理视频数据的任何装置、***或设备(例如图1或3的视频解码器30)来执行方法200。
方法200包含解码在符合型位流内的视频参数集(VPS)中的语法元素,所述语法元素指示具有第一组内容的第一操作点(202)。例如,视频解码器30可解码在符合型位流内的VPS中的语法元素,所述语法元素指示具有第一组内容的第一操作点。在一些实例中,指示第一操作点的语法元素在符合型位流内的VPS中具有operation_point()语法结构。
方法200进一步包含解码在符合型位流内的VPS中的语法元素,所述语法元素指示具有第一操作点的第二组内容的假想参考解码器(HRD)参数信息(204)。根据本发明的技术,符合型位流不包含VPS中针对第二操作点而重复第一组内容或第二组内容中的至少一者的语法元素。例如,视频解码器30解码(如果存在)在符合型位流内的VPS中的语法元素,所述语法元素指示具有第一操作点的第二组内容的HRD参数信息。视频解码器30经配置以仅解码符合型位流,且符合型位流不包含VPS中针对第二操作点而重复第一组内容或第二组内容中的至少一者的语法元素。在一些实例中,指示HRD参数信息的语法元素在符合型位流内的VPS中具有hrd_parameters()语法结构。在一些实例中,解码语法元素包含仅解码符合型位流内的指示第一操作点和HRD参数信息的语法元素。
方法200进一步包含基于经解码的语法元素来解码符合型位流中的视频数据(206)。例如,视频解码器30至少部分地基于指示具有第一组内容的第一操作点的语法元素来解码符合型位流中的视频数据。视频解码器30进一步至少部分地基于指示具有第一操作点的第二组内容的HRD参数信息的语法元素(如果存在)来解码符合型位流中的视频数据。
在一些实例中,第一组内容包括用于第一操作点的一组层识别符,所述组层识别符识别符合型位流的属于第一操作点的子位流的一或多个网络抽象层(NAL)单元。在一些实例中,第二组内容包括第一操作点的一组HRD参数,所述组HRD参数定义用以检查第一操作点的子位流的符合性的HRD。在其它实例中,符合型位流不包含VPS中针对第二操作点而重复第一组内容的语法元素,所述第一组内容为VPS中的第一操作点独有。在进一步的实例中,符合型位流不包含VPS中针对第二操作点而重复具有第二组内容的HRD参数信息的语法元素,所述第二组内容为VPS中的第一操作点独有。
在一些实例中,当用于第一操作点的一组层识别符包含两个或两个以上的层识别符时,方法200进一步包括差分地解码所述两个或两个以上的层识别符。即,当用于第一操作点的一组层识别符包含两个或两个以上的层识别符时,视频解码器30差分地解码所述两个或两个以上的层识别符。
在另一实例中,方法200可包含解码符合型位流内的语法元素,所述语法元素指示简单操作点模式是否正用于第一操作点和第二操作点。当将简单操作点模式用于第一操作点和第二操作点中的特定者时,方法200可包含仅解码所述特定操作点的目标层识别符。在一个实例中,视频解码器30解码符合型位流内的一或多个语法元素,所述一或多个语法元素指示简单操作点模式是否正用于第一操作点和第二操作点。当将简单操作点模式用于第一操作点和第二操作点中的特定者时,视频解码器30仅解码所述特定操作点的目标层识别符。在一些实例中,由所述目标层识别符和指示符合型位流的时间子层的时间识别符来识别所述特定操作点。
方法200可进一步包含基于未将简单操作点模式用于第一操作点的指示来显式地解码用于第一操作点的一组层识别符中的每一层识别符。例如,视频解码器30基于未将简单操作点模式用于第一操作点的指示来解码用于第一操作点的一组层识别符中的层识别符。方法200可进一步包含当未将简单操作点模式用于所述操作点中的一特定者时差分地解码所述特定操作点的多个目标层识别符。例如,当未将简单操作点模式用于操作点中的特定者时(例如,当vsp_simple_op_mode_flag[i]不存在于VPS中或等于零时),视频解码器30差分地解码所述特定操作点的多个目标层识别符。
在一些实例中,方法200进一步包含解码指示符合型位流的整个经解码视频序列的简档空间、层、兼容简档和关于简档的约束中的一或多者的语法元素,其中符合型位流不包含指示经解码视频序列的一或多个时间子层的简档空间、层、兼容简档和关于简档的约束中的一或多者的语法元素。例如,视频解码器30解码指示符合型位流的整个经解码视频序列的简档空间、层、兼容简档和关于简档的约束中的一或多者的语法元素。符合型位流不包含指示经解码视频序列的一或多个时间子层的简档空间、层、兼容简档和关于简档的约束中的一或多者的语法元素。
语法元素可指示时间子层的简档空间、层、兼容简档和关于简档的约束中的一或多者从符合型位流内的VPS中的profile_tier_level()语法结构去除。在一些实例中,方法200进一步包含解码指示是否存在符合型位流的时间子层中的每一者的简档信息的一或多个语法元素。当存在所述时间子层中的特定者的简档信息时,方法200可进一步包含解码所述特定时间子层的简档信息。例如,视频解码器30解码指示是否存在符合型位流的时间子层中的每一者的简档信息的一或多个语法元素,且当存在所述时间子层中的特定者的简档信息时,视频解码器30解码所述特定时间子层的简档信息。
类似地,方法200进一步包含解码指示是否存在位流的时间子层中的每一者的层级信息的一或多个语法元素。当存在所述时间子层中的特定者的层级信息时,方法200进一步包含解码所述特定时间子层的层级信息。例如,视频解码器30解码指示是否存在位流的时间子层中的每一者的层级信息的一或多个语法元素,且当存在所述时间子层中的特定者的层级信息时,视频解码器30解码所述特定时间子层的层级信息。在一些实例中,由时间识别符来识别符合型位流的时间子层。
图6为说明根据本发明中所描述的技术的编码视频数据的实例方法300的流程图。可由经配置以处理视频数据的任何装置、***或设备(例如图1和2的视频编码器20)来执行方法300。
方法300包含编码在符合型位流内的视频参数集(VPS)中的语法元素,所述语法元素指示具有第一组内容的第一操作点(302)。例如,视频编码器20可编码在符合型位流内的VPS中的语法元素,所述语法元素指示具有第一组内容的第一操作点。在一些实例中,指示第一操作点的语法元素在符合型位流内的VPS中具有operation_point()语法结构。
方法300进一步包含编码在符合型位流内的VPS中的语法元素,所述语法元素指示具有第一操作点的第二组内容的假想参考解码器(HRD)参数信息(204)。根据本发明的技术,符合型位流不包含VPS中针对第二操作点而重复第一组内容或第二组内容中的至少一者的语法元素。例如,视频编码器20编码(如果存在)在符合型位流内的VPS中的语法元素,所述语法元素指示具有第一操作点的第二组内容的HRD参数信息。视频编码器20经配置以仅编码符合型位流,且符合型位流不包含VPS中针对第二操作点而重复第一组内容或第二组内容中的至少一者的语法元素。在一些实例中,指示HRD参数信息的语法元素在符合型位流内的VPS中具有hrd_parameters()语法结构。
方法300进一步包含基于经编码语法元素来编码符合型位流中的视频数据(306)。例如,视频编码器20至少部分地基于指示具有第一组内容的第一操作点的语法元素来编码符合型位流中的视频数据。视频编码器20进一步至少部分地基于指示具有第一操作点的第二组内容的HRD参数信息的语法元素来编码符合型位流中的视频数据。
在一些实例中,第一组内容包括用于第一操作点的一组层识别符,所述组层识别符识别符合型位流的属于第一操作点的子位流的一或多个网络抽象层(NAL)单元。在一些实例中,第二组内容包括第一操作点的一组HRD参数,所述组HRD参数定义用以检查第一操作点的子位流的符合性的HRD。在其它实例中,符合型位流不包含VPS中针对第二操作点而重复第一组内容的语法元素,所述第一组内容为VPS中的第一操作点独有。在进一步的实例中,符合型位流不包含VPS中针对第二操作点而重复具有第二组内容的HRD参数信息的语法元素,所述第二组内容为VPS中的第一操作点独有。
在一些实例中,当用于第一操作点的一组层识别符包含两个或两个以上的层识别符时,方法300进一步包括差分地编码所述两个或两个以上的层识别符。即,当用于第一操作点的一组层识别符包含两个或两个以上的层识别符时,视频编码器20差分地编码所述两个或两个以上的层识别符。
在另一实例中,方法300可包含编码符合型位流内的一或多个语法元素,所述一或多个语法元素指示简单操作点模式是否正用于第一操作点和第二操作点。当将简单操作点模式用于第一操作点和第二操作点中的特定者时,方法300可包含仅编码所述特定操作点的目标层识别符。在一个实例中,视频编码器20编码符合型位流内的一或多个语法元素,所述一或多个语法元素指示简单操作点模式是否正用于第一操作点和第二操作点。当将简单操作点模式用于第一操作点和第二操作点中的特定者时,视频编码器20仅编码所述特定操作点的目标层识别符。在一些实例中,由所述目标层识别符和指示符合型位流的时间子层的时间识别符来识别所述特定操作点。
方法300可进一步包含基于未将简单操作点模式用于第一操作点的指示来显式地编码用于第一操作点的一组层识别符中的每一层识别符。例如,视频编码器20基于未将简单操作点模式用于第一操作点的指示来编码用于第一操作点的一组层识别符中的层识别符。方法300可进一步包含当未将简单操作点模式用于所述操作点中的一特定者时差分地编码所述特定操作点的多个目标层识别符。例如,当未将简单操作点模式用于操作点中的特定者时(例如,当vsp_simple_op_mode_flag[i]不存在于VPS中或等于零时),视频编码器20差分地编码所述特定操作点的多个目标层识别符。
在一些实例中,方法300进一步包含编码指示符合型位流的整个经编码视频序列的简档空间、层、兼容简档和关于简档的约束中的一或多者的语法元素,其中符合型位流不包含指示经编码视频序列的一或多个时间子层的简档空间、层、兼容简档和关于简档的约束中的一或多者的语法元素。例如,视频编码器20编码指示符合型位流的整个经编码视频序列的简档空间、层、兼容简档和关于简档的约束中的一或多者的语法元素。符合型位流不包含指示经解码视频序列的一或多个时间子层的简档空间、层、兼容简档和关于简档的约束中的一或多者的语法元素。
语法元素可指示时间子层的简档空间、层、兼容简档和简档相关约束中的一或多者从符合型位流内的VPS中的profile_tier_level()语法结构去除。在一些实例中,方法300进一步包含编码指示是否存在符合型位流的时间子层中的每一者的简档信息的一或多个语法元素。当存在所述时间子层中的特定者的简档信息时,方法300可进一步包含编码所述特定时间子层的简档信息。例如,视频编码器20编码指示是否存在符合型位流的时间子层中的每一者的简档信息的一或多个语法元素,且当存在所述时间子层中的特定者的简档信息时,视频编码器20编码所述特定时间子层的简档信息。
类似地,方法300进一步包含编码指示是否存在位流的时间子层中的每一者的层级信息的一或多个语法元素。当存在所述时间子层中的特定者的层级信息时,方法300进一步包含编码所述特定时间子层的层级信息。例如,视频编码器20编码指示是否存在位流的时间子层中的每一者的层级信息的一或多个语法元素,且当存在所述时间子层中的特定者的层级信息时,视频编码器20编码所述特定时间子层的层级信息。在一些实例中,通过时间识别符来识别符合型位流的时间子层。
应认识到,取决于实例,本文中所描述的技术中的任一者的某些动作或事件可以不同序列执行、可增添、合并或完全省略(例如,对于实践所述技术来说并非所有所描述的动作或事件都是必要的)。此外,在某些实例中,可(例如)经由多线程处理、中断处理或多个处理器同时而非顺序地执行动作或事件。
在一或多个实例中,可以硬件、软件、固件或其任何组合来实施所描述的功能。如果以软件实施,那么所述功能可作为一或多个指令或代码而存储于计算机可读媒体上或经由计算机可读媒体进行传输,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体(其对应于例如数据存储媒体的有形媒体)或通信媒体,通信媒体包含(例如)根据通信协议促进计算机程序从一处传送到另一处的任何媒体。以此方式,计算机可读媒体通常可对应于:(1)非暂时性的有形计算机可读存储媒体;或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索指令、代码和/或数据结构以用于实施本发明中所描述的技术的任何可用媒体。计算机程序产品可包含计算机可读媒体。
通过实例而非限制,这些计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器,或可用以存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。又,可将任何连接恰当地称为计算机可读媒体。例如,如果使用同轴电缆、光缆、双绞线、数字用户线(DSL)或无线技术(例如,红外线、无线电和微波)而从网站、服务器或其它远端源传输指令,那么将同轴电缆、光缆、双绞线、DSL或无线技术(例如,红外线、无线电和微波)包含于媒体的定义中。然而,应理解,计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它暂时性媒体,而实情是针对非暂时性有形存储媒体。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字影音光盘(DVD)、软盘和蓝光光盘,其中磁盘通常以磁性方式再生数据,而光盘通过激光以光学方式再生数据。以上各物的组合也应包含于计算机可读媒体的范围内。
可由例如以下各者的一或多个处理器来执行指令:一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路。因此,如本文中所使用,术语“处理器”可指上述结构或适于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,可将本文中所描述的功能性提供于经配置以用于编码和解码的专用硬件和/或软件模块内,或并入于组合式编码解码器中。又,可将所述技术完全实施于一或多个电路或逻辑元件中。
可将本发明的技术实施于广泛多种装置或设备中,所述装置或设备包含无线手持机、集成电路(IC)或一组IC(例如,芯片组)。在本发明中描述各种组件、模块或单元以强调经配置以执行所揭示的技术的装置的功能方面,但未必要求由不同硬件单元来实现。而是,如上文所描述,可将各种单元组合于编码解码器硬件单元中,或由互操作性硬件单元(包含如上文所描述的一或多个处理器)的集合且结合合适的软件和/或固件来提供所述单元。
已描述各种实例。这些和其它实例在以下权利要求书的范围内。

Claims (51)

1.一种解码视频数据的方法,所述方法包括:
解码在符合型位流内的视频参数集VPS中指示具有第一组内容的第一操作点的语法元素;以及
如果在所述符合型位流内的所述VPS中存在指示具有所述第一操作点的第二组内容的假想参考解码器HRD参数信息的语法元素,那么解码所述语法元素,
其中所述符合型位流不包含所述VPS中针对第二操作点而重复所述第一组内容或所述第二组内容中的至少一者的语法元素,且其中解码语法元素包括仅解码符合型位流内的指示所述第一操作点和所述HRD参数信息的所述语法元素。
2.根据权利要求1所述的方法,其中所述符合型位流不包含所述VPS中针对所述第二操作点而重复所述第一组内容的语法元素,所述第一组内容为所述VPS中的所述第一操作点独有。
3.根据权利要求1所述的方法,其中所述符合型位流不包含所述VPS中针对所述第二操作点而重复具有所述第二组内容的所述HRD参数信息的语法元素,所述第二组内容为所述VPS中的所述第一操作点独有。
4.根据权利要求1所述的方法,其中所述第一组内容包括用于所述第一操作点的一组层识别符,所述组层识别符识别所述符合型位流的属于所述第一操作点的子位流的一或多个网络抽象层NAL单元。
5.根据权利要求4所述的方法,其中用于所述第一操作点的所述组层识别符包含两个或两个以上的层识别符,所述方法进一步包括差分地解码所述两个或两个以上的层识别符。
6.根据权利要求4所述的方法,其进一步包括解码所述符合型位流内指示简单操作点模式是否正用于所述第一操作点的一或多个语法元素。
7.根据权利要求6所述的方法,其进一步包括基于将所述简单操作点模式用于所述第一操作点的所述指示而仅解码用于所述第一操作点的所述组层识别符中的目标层识别符,其中所述第一操作点由所述目标层识别符和指示所述符合型位流的时间子层的时间识别符来识别。
8.根据权利要求6所述的方法,其进一步包括基于未将所述简单操作点模式用于所述第一操作点的所述指示来显式地解码用于所述第一操作点的所述组层识别符中的每一层识别符。
9.根据权利要求1所述的方法,其中指示所述第一操作点的所述语法元素包括在所述符合型位流内的所述VPS中的operation_point()语法结构。
10.根据权利要求1所述的方法,其中所述第二组内容包括用于所述第一操作点的一组HRD参数,所述组HRD参数定义用以检查所述第一操作点的子位流的符合性的HRD。
11.根据权利要求1所述的方法,其中指示所述HRD参数信息的所述语法元素包括在所述符合型位流内的所述VPS中的hrd_parameters()语法结构。
12.根据权利要求1所述的方法,其进一步包括解码指示所述符合型位流的完整经译码视频序列的简档空间、层、兼容简档和关于简档的约束中的一或多者的语法元素,其中所述符合型位流不包含指示所述经译码视频序列的一或多个时间子层的简档空间、层、兼容简档和关于简档的约束中的一或多者的语法元素。
13.根据权利要求12所述的方法,其中指示所述时间子层的简档空间、层、兼容简档和关于简档的约束中的一或多者的所述语法元素是从所述符合型位流内的所述VPS中的profile_tier_level()语法结构去除。
14.一种编码视频数据的方法,所述方法包括:
编码在符合型位流内的视频参数集VPS中指示具有第一组内容的第一操作点的语法元素;以及
编码在所述符合型位流内的所述VPS中指示具有所述第一操作点的第二组内容的假想参考解码器HRD参数信息的语法元素,
其中所述符合型位流不包含所述VPS中针对第二操作点而重复所述第一组内容或所述第二组内容中的至少一者的语法元素,且其中编码语法元素包括仅编码来自符合型位流的指示所述第一操作点和所述HRD参数信息的所述语法元素。
15.根据权利要求14所述的方法,其中所述符合型位流不包含所述VPS中针对所述第二操作点而重复所述第一组内容的语法元素,所述第一组内容为所述VPS中的所述第一操作点独有。
16.根据权利要求14所述的方法,其中所述符合型位流不包含所述VPS中针对所述第二操作点而重复具有所述第二组内容的所述HRD参数信息的语法元素,所述第二组内容为所述VPS中的所述第一操作点独有。
17.根据权利要求14所述的方法,其中所述第一组内容包括用于所述第一操作点的一组层识别符,所述组层识别符识别所述符合型位流的属于所述第一操作点的子位流的一或多个网络抽象层NAL单元。
18.根据权利要求17所述的方法,其中用于所述第一操作点的所述组层识别符包含两个或两个以上的层识别符,所述方法进一步包括差分地编码所述两个或两个以上的层识别符。
19.根据权利要求17所述的方法,其进一步包括:
编码所述符合型位流内指示简单操作点模式是否正用于所述第一操作点的一或多个语法元素。
20.根据权利要求19所述的方法,其进一步包括基于将所述简单操作点模式用于所述第一操作点的所述指示而仅编码用于所述第一操作点的所述组层识别符中的目标层识别符,其中所述第一操作点由所述目标层识别符和指示所述符合型位流的时间子层的时间识别符来识别。
21.根据权利要求20所述的方法,其进一步包括基于未将所述简单操作点模式用于所述第一操作点的所述指示来显式地编码用于所述第一操作点的所述组层识别符中的每一层识别符。
22.根据权利要求14所述的方法,其中指示所述第一操作点的所述语法元素包括在所述符合型位流内的所述VPS中的operation_point()语法结构。
23.根据权利要求14所述的方法,其中所述第二组内容包括用于所述第一操作点的一组HRD参数,所述组HRD参数定义用以检查所述第一操作点的子位流的符合性的HRD。
24.根据权利要求14所述的方法,其中指示所述HRD参数信息的所述语法元素包括在所述符合型位流内的所述VPS中的hrd_parameters()语法结构。
25.根据权利要求14所述的方法,其进一步包括编码指示所述符合型位流的完整经译码视频序列的简档空间、层、兼容简档和关于简档的约束中的一或多者的语法元素,其中所述符合型位流不包含指示所述经译码视频序列的一或多个时间子层的简档空间、层、兼容简档和关于简档的约束中的一或多者的语法元素。
26.根据权利要求25所述的方法,其中指示所述时间子层的简档空间、层、兼容简档和关于简档的约束中的一或多者的所述语法元素是从所述符合型位流内的所述VPS中的一profile_tier_level()语法结构去除。
27.一种包括视频译码器的视频译码装置,所述视频译码器经配置以:
译码在符合型位流内的视频参数集VPS中指示具有第一组内容的第一操作点的语法元素;以及
如果在所述符合型位流内的所述VPS中存在指示具有所述第一操作点的第二组内容的假想参考解码器HRD参数信息的语法元素,那么译码所述语法元素,
其中所述符合型位流不包含所述VPS中针对第二操作点而重复所述第一组内容或所述第二组内容中的至少一者的语法元素,且其中所述视频译码器经配置以仅译码符合型位流内的指示所述第一操作点和所述HRD参数信息的所述语法元素。
28.根据权利要求27所述的视频译码装置,其中所述符合型位流不包含所述VPS中针对所述第二操作点而重复所述第一组内容的语法元素,所述第一组内容为所述VPS中的所述第一操作点独有。
29.根据权利要求27所述的视频译码装置,其中所述符合型位流不包含所述VPS中针对所述第二操作点而重复具有所述第二组内容的所述HRD参数信息的语法元素,所述第二组内容为所述VPS中的所述第一操作点独有。
30.根据权利要求27所述的视频译码装置,其中所述第一组内容包括用于所述第一操作点的一组层识别符,所述组层识别符识别所述符合型位流的属于所述第一操作点的子位流的一或多个网络抽象层NAL单元。
31.根据权利要求30所述的视频译码装置,其中用于所述第一操作点的所述组层识别符包含两个或两个以上的层识别符,所述视频译码器进一步经配置以差分地译码所述两个或两个以上的层识别符。
32.根据权利要求30所述的视频译码装置,所述视频译码器进一步经配置以译码所述符合型位流内指示简单操作点模式是否正用于所述第一操作点的一或多个语法元素。
33.根据权利要求32所述的视频译码装置,所述视频译码器进一步经配置以基于将所述简单操作点模式用于所述第一操作点的所述指示而仅译码用于所述第一操作点的所述组层识别符中的目标层识别符,其中所述第一操作点由所述目标层识别符和指示所述符合型位流的时间子层的时间识别符来识别。
34.根据权利要求32所述的视频译码装置,所述视频译码器进一步经配置以基于未将所述简单操作点模式用于所述第一操作点的所述指示来显式地译码用于所述第一操作点的所述组层识别符中的每一层识别符。
35.根据权利要求27所述的视频译码装置,其中指示所述第一操作点的所述语法元素包括在所述符合型位流内的所述VPS中的operation_point()语法结构。
36.根据权利要求27所述的视频译码装置,其中所述第二组内容包括用于所述第一操作点的一组HRD参数,所述组HRD参数定义用以检查所述第一操作点的子位流的符合性的HRD。
37.根据权利要求27所述的视频译码装置,其中指示所述HRD参数信息的所述语法元素包括在所述符合型位流内的所述VPS中的hrd_parameters()语法结构。
38.根据权利要求27所述的视频译码装置,所述视频译码器进一步经配置以译码指示所述符合型位流的完整经译码视频序列的简档空间、层、兼容简档和关于简档的约束中的一或多者的语法元素,其中所述符合型位流不包含指示所述经译码视频序列的一或多个时间子层的简档空间、层、兼容简档和关于简档的约束中的一或多者的语法元素。
39.根据权利要求38所述的视频译码装置,其中指示所述时间子层的简档空间、层、兼容简档和关于简档的约束中的一或多者的所述语法元素是从所述符合型位流内的所述VPS中的profile_tier_level()语法结构去除。
40.根据权利要求27所述的视频译码装置,其中所述视频译码器包括视频解码器,所述视频解码器经配置以:解码所述VPS中指示所述第一操作点的所述语法元素;如果所述VPS中存在指示HRD参数信息的语法元素,那么解码所述语法元素;以及基于所述经解码的语法元素来解码所述符合型位流中的视频数据。
41.根据权利要求27所述的视频译码装置,其中所述视频译码器包括视频编码器,所述视频编码器经配置以:编码所述VPS中指示所述第一操作点的所述语法元素;如果所述VPS中存在指示HRD参数信息的语法元素,那么编码所述语法元素;以及基于所述经解码的语法元素来编码所述符合型位流中的视频数据。
42.一种具有存储于其上的指令的计算机可读存储媒体,所述指令在执行时使用于译码视频数据的装置的处理器执行以下步骤:
译码在符合型位流内的视频参数集VPS中指示具有第一组内容的第一操作点的语法元素;以及
如果在所述符合型位流内的所述VPS中存在指示具有所述第一操作点的第二组内容的假想参考解码器HRD参数信息的语法元素,那么译码所述语法元素,
其中所述符合型位流不包含所述VPS中针对第二操作点而重复所述第一组内容或所述第二组内容中的至少一者的语法元素,且其中所述处理器经配置以仅译码符合型位流内的指示所述第一操作点和所述HRD参数信息的所述语法元素。
43.根据权利要求42所述的计算机可读存储媒体,其中所述符合型位流不包含所述VPS中针对所述第二操作点而重复所述第一组内容的语法元素,所述第一组内容为所述VPS中的所述第一操作点独有。
44.根据权利要求42所述的计算机可读存储媒体,其中所述符合型位流不包含所述VPS中针对所述第二操作点而重复具有所述第二组内容的所述HRD参数信息的语法元素,所述第二组内容为所述VPS中的所述第一操作点独有。
45.根据权利要求42所述的计算机可读存储媒体,其中所述第一组内容包括用于所述第一操作点的一组层识别符,所述组层识别符识别所述符合型位流的属于所述第一操作点的子位流的一或多个网络抽象层NAL单元。
46.根据权利要求42所述的计算机可读存储媒体,其中所述第二组内容包括用于所述第一操作点的一组HRD参数,所述组HRD参数定义用以检查所述第一操作点的子位流的符合性的HRD。
47.一种视频译码装置,其包括:
用于译码在符合型位流内的视频参数集VPS中指示具有第一组内容的第一操作点的语法元素的装置;以及
用于在所述符合型位流内的所述VPS中存在指示具有所述第一操作点的第二组内容的假想参考解码器HRD参数信息的语法元素的情况下译码所述语法元素的装置,
其中所述符合型位流不包含所述VPS中针对第二操作点而重复所述第一组内容或所述第二组内容中的至少一者的语法元素,且其中所述译码装置经配置以仅译码符合型位流内的指示所述第一操作点和所述HRD参数信息的所述语法元素。
48.根据权利要求47所述的视频译码装置,其中所述符合型位流不包含所述VPS中针对所述第二操作点而重复所述第一组内容的语法元素,所述第一组内容为所述VPS中的所述第一操作点独有。
49.根据权利要求47所述的视频译码装置,其中所述符合型位流不包含所述VPS中针对所述第二操作点而重复具有所述第二组内容的所述HRD参数信息的语法元素,所述第二组内容为所述VPS中的所述第一操作点独有。
50.根据权利要求47所述的视频译码装置,其中所述第一组内容包括用于所述第一操作点的一组层识别符,所述组层识别符识别所述符合型位流的属于所述第一操作点的子位流的一或多个网络抽象层NAL单元。
51.根据权利要求47所述的视频译码装置,其中所述第二组内容包括用于所述第一操作点的一组HRD参数,所述组HRD参数定义用以检查所述第一操作点的子位流的符合性的HRD。
CN201380049934.8A 2012-09-28 2013-09-11 于视频译码中发信用于操作点的层识别符 Active CN104685887B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201261707486P 2012-09-28 2012-09-28
US61/707,486 2012-09-28
US201261708404P 2012-10-01 2012-10-01
US61/708,404 2012-10-01
US13/953,525 2013-07-29
US13/953,525 US9432664B2 (en) 2012-09-28 2013-07-29 Signaling layer identifiers for operation points in video coding
PCT/US2013/059274 WO2014052013A1 (en) 2012-09-28 2013-09-11 Signaling layer identifiers for operation points in video coding

Publications (2)

Publication Number Publication Date
CN104685887A true CN104685887A (zh) 2015-06-03
CN104685887B CN104685887B (zh) 2018-06-01

Family

ID=50385157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380049934.8A Active CN104685887B (zh) 2012-09-28 2013-09-11 于视频译码中发信用于操作点的层识别符

Country Status (18)

Country Link
US (2) US9432664B2 (zh)
EP (1) EP2901679A1 (zh)
JP (1) JP6174152B2 (zh)
KR (1) KR102148548B1 (zh)
CN (1) CN104685887B (zh)
AR (1) AR093770A1 (zh)
AU (1) AU2013324090B2 (zh)
BR (1) BR112015006839B1 (zh)
CA (1) CA2884422C (zh)
HK (1) HK1209936A1 (zh)
IL (1) IL237917A (zh)
MY (1) MY171651A (zh)
PH (1) PH12015500614A1 (zh)
RU (1) RU2635892C2 (zh)
SG (1) SG11201501640UA (zh)
TW (1) TWI527460B (zh)
WO (1) WO2014052013A1 (zh)
ZA (1) ZA201502306B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI558183B (zh) 2012-07-09 2016-11-11 Vid衡器股份有限公司 功率知覺視訊解碼及串流
US9432664B2 (en) 2012-09-28 2016-08-30 Qualcomm Incorporated Signaling layer identifiers for operation points in video coding
US10116966B2 (en) * 2012-09-28 2018-10-30 Sharp Kabushiki Kaisha Image decoding device
US9936196B2 (en) * 2012-10-30 2018-04-03 Qualcomm Incorporated Target output layers in video coding
EP2947879B1 (en) * 2013-01-17 2018-11-07 Samsung Electronics Co., Ltd. Method for decoding video on basis of decoder setting
GB2513303B (en) * 2013-04-16 2017-06-07 Canon Kk Method and device for partitioning an image
GB2524726B (en) * 2014-03-25 2018-05-23 Canon Kk Image data encapsulation with tile support
US9402083B2 (en) * 2014-04-24 2016-07-26 Vidyo, Inc. Signaling conformance points using profile space
EP2958328A1 (en) * 2014-06-20 2015-12-23 Thomson Licensing Method and device for signaling in a bitstream a picture/video format of an LDR picture and a picture/video format of a decoded HDR picture obtained from said LDR picture and an illumination picture
US20160021375A1 (en) * 2014-07-16 2016-01-21 Qualcomm Incorporated Transport stream for carriage of video coding extensions
US10708611B2 (en) 2015-09-04 2020-07-07 Sharp Kabushiki Kaisha Systems and methods for signaling of video parameters and information associated with caption services
JP2022510120A (ja) * 2018-12-07 2022-01-26 インターデジタル ヴイシー ホールディングス, インコーポレイテッド コード化ツールの組み合わせおよび制限の管理
CN114868158A (zh) 2019-12-26 2022-08-05 字节跳动有限公司 层级视频中的解码图片缓冲区参数的信令通知
JP7431330B2 (ja) 2019-12-26 2024-02-14 バイトダンス インコーポレイテッド ビデオコーディングにおけるプロファイル、層及びレイヤの指示
KR20220121804A (ko) 2019-12-27 2022-09-01 바이트댄스 아이엔씨 파라미터 세트들에서의 서브픽처 시그널링
WO2021142363A1 (en) 2020-01-09 2021-07-15 Bytedance Inc. Decoding order of different sei messages
WO2022139260A1 (ko) * 2020-12-21 2022-06-30 엘지전자 주식회사 미디어 파일을 생성하고 처리하는 방법 및 장치
WO2022164024A1 (ko) * 2021-01-26 2022-08-04 엘지전자 주식회사 미디어 파일 처리 방법 및 그 장치

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060165298A1 (en) * 2005-01-21 2006-07-27 Kabushiki Kaisha Toshiba Moving picture encoder, decoder, and method for generating coded stream
CN101395921A (zh) * 2006-11-17 2009-03-25 Lg电子株式会社 用于解码/编码视频信号的方法及装置
TW201123909A (en) * 2009-06-30 2011-07-01 Qualcomm Inc Video coding based on first order prediction and pre-defined second order prediction mode
CN102461167A (zh) * 2009-06-12 2012-05-16 高通股份有限公司 Mpeg-2***上的多视图视频译码
CN102598688A (zh) * 2009-10-28 2012-07-18 高通股份有限公司 流式传输经编码视频数据

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004066635A1 (ja) 2003-01-17 2004-08-05 Matsushita Electric Industrial Co., Ltd. 動画像符号化方法および動画像復号化方法
AU2006233279C1 (en) 2005-04-13 2011-01-27 Nokia Technologies Oy Method, device and system for effectively coding and decoding of video data
KR20080006609A (ko) * 2005-04-13 2008-01-16 노키아 코포레이션 스케일링가능성 정보의 코딩, 저장, 및 시그널링
KR100896290B1 (ko) 2006-11-17 2009-05-07 엘지전자 주식회사 비디오 신호의 디코딩/인코딩 방법 및 장치
EP3518547B1 (en) * 2007-04-12 2021-10-06 InterDigital VC Holdings, Inc. Methods and apparatus for video usability information (vui) for scalable video coding (svc)
JP5026584B2 (ja) * 2007-04-18 2012-09-12 トムソン ライセンシング 符号化システム
CN102217308B (zh) * 2008-11-13 2014-10-22 汤姆森特许公司 使用画面组合并和位分配的多线程视频编码
US8780999B2 (en) 2009-06-12 2014-07-15 Qualcomm Incorporated Assembling multiview video coding sub-BITSTREAMS in MPEG-2 systems
CN101924944B (zh) * 2009-06-15 2013-06-05 华为技术有限公司 可伸缩视频编码操作点选择方法、信息提供方法及设备
US8948241B2 (en) * 2009-08-07 2015-02-03 Qualcomm Incorporated Signaling characteristics of an MVC operation point
US8976871B2 (en) 2009-09-16 2015-03-10 Qualcomm Incorporated Media extractor tracks for file format track selection
CN102714715B (zh) 2009-09-22 2016-01-20 高通股份有限公司 用于文件格式轨迹选择的媒体提取器轨迹
CN103416056A (zh) * 2011-03-10 2013-11-27 维德约股份有限公司 视频编码中的参数集维持
US9521418B2 (en) 2011-07-22 2016-12-13 Qualcomm Incorporated Slice header three-dimensional video extension for slice header prediction
EP2868092A4 (en) * 2012-07-02 2016-05-04 Nokia Technologies Oy METHOD AND DEVICE FOR VIDEO CODING
US9432664B2 (en) 2012-09-28 2016-08-30 Qualcomm Incorporated Signaling layer identifiers for operation points in video coding

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060165298A1 (en) * 2005-01-21 2006-07-27 Kabushiki Kaisha Toshiba Moving picture encoder, decoder, and method for generating coded stream
CN101395921A (zh) * 2006-11-17 2009-03-25 Lg电子株式会社 用于解码/编码视频信号的方法及装置
CN102461167A (zh) * 2009-06-12 2012-05-16 高通股份有限公司 Mpeg-2***上的多视图视频译码
TW201123909A (en) * 2009-06-30 2011-07-01 Qualcomm Inc Video coding based on first order prediction and pre-defined second order prediction mode
CN102598688A (zh) * 2009-10-28 2012-07-18 高通股份有限公司 流式传输经编码视频数据

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
YING CHEN ET AL: "AHG10: Video parameter set for HEVC extensions", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 10TH MEETING:STOCKHOLM,SE》 *
YING CHEN: "3D-HLS:Video parameter set for 3D-HEVC", 《JOINT COLLABORATIVE TEAM ON 3D VIDEO CODING EXTENSION DEVELOPMENT OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 1ST MEETING》 *
YING CHEN: "AHG10: Video parameter set HEVC base specification", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 10TH MEETING》 *

Also Published As

Publication number Publication date
BR112015006839A2 (pt) 2017-07-04
MY171651A (en) 2019-10-22
TWI527460B (zh) 2016-03-21
PH12015500614B1 (en) 2015-05-11
KR20150063099A (ko) 2015-06-08
US20140092955A1 (en) 2014-04-03
AR093770A1 (es) 2015-06-24
BR112015006839B1 (pt) 2023-12-19
US9973782B2 (en) 2018-05-15
JP6174152B2 (ja) 2017-08-02
ZA201502306B (en) 2017-01-25
RU2015115902A (ru) 2016-11-20
AU2013324090A1 (en) 2015-04-09
JP2015531567A (ja) 2015-11-02
HK1209936A1 (zh) 2016-04-08
CA2884422C (en) 2018-03-20
US20160316227A1 (en) 2016-10-27
PH12015500614A1 (en) 2015-05-11
KR102148548B1 (ko) 2020-08-26
US9432664B2 (en) 2016-08-30
TW201424403A (zh) 2014-06-16
IL237917A (en) 2017-06-29
SG11201501640UA (en) 2015-04-29
CA2884422A1 (en) 2014-04-03
CN104685887B (zh) 2018-06-01
WO2014052013A1 (en) 2014-04-03
AU2013324090B2 (en) 2017-07-06
EP2901679A1 (en) 2015-08-05
RU2635892C2 (ru) 2017-11-16

Similar Documents

Publication Publication Date Title
CN104685887A (zh) 于视频译码中发信用于操作点的层识别符
CN104823449B (zh) 在视频译码中用信号表示关注区和逐渐解码刷新
CN104471942B (zh) 重新使用参数集用于视频译码
CN106464919B (zh) 用于编码和解码具有视频数据的多层位流的方法和装置
CN105284113B (zh) 分量间滤波
CN103190147B (zh) 用于视频译码的语法元素的联合译码方法及设备
CN104488267B (zh) 用于译码视频的方法和装置
CN105493507B (zh) 用于帧内块复制的残余预测
CN104396257B (zh) 在视频译码中长期参考图片的随机存取和发信
CN104704843B (zh) 视频性质的指示
CN104584557B (zh) 对视频数据进行编码、解码的方法、装置以及计算机可读介质
CN105409219A (zh) 高效率视频译码扩展中的目标输出层的选择
CN104737537A (zh) 用于可缩放视频译码的加权预测模式
CN103959785A (zh) 在视频译码中用于色度分量的变换单位分割
CN105432085A (zh) 对多层视频译码的层间预测信令的优化
CN104685875A (zh) 用于视频译码中的4:2:2样本格式的帧内译码
CN104221374A (zh) 在视频译码中分群经旁路译码语法元素
CN106464917A (zh) 用信号表示用于位流分区的hrd参数
CN104412591A (zh) 用于差域帧内预测的帧内模式扩展
CN107105295A (zh) 用于高效视频译码(hevc)和扩展的视频参数集
CN104380747A (zh) 视频译码中的参数集更新
CN104221381A (zh) 用于视频译码的波前并行处理
CN104704833A (zh) 多视图或3维视频译码中的高级视图间残差预测
CN105379272B (zh) 在vps中用信号通知位速率信息及图片速率信息
CN104718752A (zh) 在可缩放视频译码中减少取样相位信息的发信

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1209936

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant