CN107660341A - 切片级帧内块复制及其它视频译码改进 - Google Patents

切片级帧内块复制及其它视频译码改进 Download PDF

Info

Publication number
CN107660341A
CN107660341A CN201680029870.9A CN201680029870A CN107660341A CN 107660341 A CN107660341 A CN 107660341A CN 201680029870 A CN201680029870 A CN 201680029870A CN 107660341 A CN107660341 A CN 107660341A
Authority
CN
China
Prior art keywords
section
reference picture
ibc
video data
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680029870.9A
Other languages
English (en)
Other versions
CN107660341B (zh
Inventor
瓦迪姆·谢廖金
克里希纳坎斯·拉帕卡
谢成郑
拉詹·拉克斯曼·乔希
王业奎
庞超
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN107660341A publication Critical patent/CN107660341A/zh
Application granted granted Critical
Publication of CN107660341B publication Critical patent/CN107660341B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/521Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Abstract

本发明揭示一种用于解码视频数据的装置,其包含:存储器,其经配置以存储所述视频数据;以及一或多个处理器,其经配置以:接收所述视频数据的切片;解析帧内块复制IBC语法元素以确定IBC模式经启用用于所述切片;解析与所述切片相关联的切片类型语法元素以确定所述切片为I切片;以及通过使用帧内预测译码模式解码所述切片的所有块而将所述切片解码为I切片。

Description

切片级帧内块复制及其它视频译码改进
本申请案主张2015年5月29日申请的美国临时专利申请案第62/168,396号的权益,所述申请案的全部内容特此以引用的方式并入。
技术领域
本发明涉及视频译码。
背景技术
数字视频能力可并入到广泛范围的装置中,所述装置包含数字电视、数字直播***、无线广播***、个人数字助理(PDA)、手提或台式计算机、平板计算机、电子书阅读器、数字摄影机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏机、蜂窝式或卫星无线电电话、所谓的“智能电话”、视频电话会议装置、视频流装置及其类似者。数字视频装置实施视频压缩技术,例如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分高级视频译码(AVC)、ITU-T H.265定义的标准、高效率视频译码(HEVC)标准及这些标准的扩展中所描述的技术。视频装置可通过实施这些视频压缩技术更有效地传输、接收、编码、解码及/或存储数字视频信息。
视频压缩技术执行空间(图片内)预测及/或时间(图片间)预测来减少或移除视频序列中固有的冗余。对于基于块的视频译码,可将视频切片(即,视频帧或视频帧的一部分)分割为视频块(其还可被称作树块)、译码单元(CU)及/或译码节点。图片的经帧内译码(I)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测来编码。图片的经帧间译码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间或时间预测产生用于待译码块的预测性块。残余数据表示待译码原始块与预测性块之间的像素差。经帧间译码块是根据指向形成预测性块的参考样本的块的运动向量及指示经译码块与预测性块之间的差异的残余数据经编码。经帧内译码块是根据帧内译码模式与残余数据经编码。为进行进一步压缩,可将残余数据从像素域变换到变换域,从而致使残余变换系数,可接着量化所述残余变换系数。可扫描最初配置成二维阵列的经量化变换系数以便产生变换系数的一维向量,且可应用熵译码以达成甚至更大程度的压缩。
发明内容
本发明描述可改进现有视频译码技术,且更确切地说,可改进现有帧内块复制(IBC)相关视频译码技术的技术。在一些译码情景中,本发明的技术可通过例如实现切片级上的IBC实现对IBC的使用的较精细控制。
在一个实例中,一种用于解码视频数据的方法包含:接收视频数据的切片;解析帧内块复制(IBC)语法元素以确定IBC模式经启用用于所述切片;解析与所述切片相关联的切片类型语法元素以确定所述切片为I切片;以及将所述切片解码为I切片,其中将所述切片解码为I切片包括使用至少一个帧内预测译码模式解码所述切片的所有块。
在另一实例中,一种用于解码视频数据的装置包含:存储器,其经配置以存储视频数据;以及一或多个处理器,其经配置以执行以下操作:接收视频数据的切片;解析帧内块复制(IBC)语法元素以确定IBC模式经启用用于所述切片;解析与所述切片相关联的切片类型语法元素以确定所述切片为I切片;以及将所述切片解码为I切片,其中为将所述切片解码为I切片,所述一或多个处理器经配置以使用至少一个帧内预测译码模式解码所述切片的所有块。
在另一实例中,提供一种用于解码视频数据的装置,所述装置包括:用于接收视频数据的切片的装置;用于解析帧内块复制(IBC)语法元素以确定IBC模式经启用用于所述切片的装置;用于解析与所述切片相关联的切片类型语法元素以确定所述切片为I切片的装置;以及用于将所述切片解码为I切片的装置,其中用于将所述切片解码为I切片的装置包括用于使用至少一个帧内预测译码模式解码所述切片的所有块的装置。
在另一实例中,一种计算机可读存储媒体存储当由一或多个处理器执行时致使所述一或多个处理器执行以下操作的指令:接收视频数据的切片;解析帧内块复制(IBC)语法元素以确定IBC模式经启用用于所述切片;解析与所述切片相关联的切片类型语法元素以确定所述切片为I切片;以及将所述切片解码为I切片,其中为将所述切片解码为I切片,所述一或多个处理器使用至少一个帧内预测译码模式解码所述切片的所有块。
在附图及以下描述中阐明本发明的一或多个实例的细节。其它特征、目标及优势从描述、图式及权利要求书将是显而易见的。
附图说明
图1为说明可利用本发明中所描述的技术的实例视频编码及解码***的框图。
图2为说明根据本发明的技术用于预测当前图片内的当前视频数据块的当前图片内的实例预测性视频数据块的概念图。
图3为说明可实施本发明中所描述的技术的实例视频编码器的框图。
图4为说明可实施本发明中所描述的技术的实例视频解码器的框图。
图5为展示根据本发明的技术的编码视频数据的方法的流程图。
图6为展示根据本发明的技术的解码视频数据的方法的流程图。
图7为展示根据本发明的技术的解码视频数据的方法的流程图。
具体实施方式
视频序列通常表示为图片序列。通常,基于块的译码技术用以译码个别图片中的每一者。也就是说,将每一图片划分成块,且个别地译码所述块中的每一者。译码视频数据块通常涉及形成块的预测值及译码残余值,所述残余值表示原始块与预测值之间的差。特定地,原始视频数据块包含像素值矩阵,且预测值包含预测像素值矩阵。残余值对应于原始块的像素值与经预测像素值之间的逐像素差,以使得残余值与经预测值加起来接近于原始值。
用于视频数据块的预测技术通常分类为帧内预测及帧间预测。帧内预测或空间预测通常涉及从为与被预测块相同的图片中的先前经译码块的部分的相邻像素值预测块。帧内预测或时间预测通常涉及从经先前经译码图片(例如,帧或切片)的像素值预测块。
很多应用(例如远程桌面、远程游戏、无线显示器、车用信息娱乐、云计算等)在日常生活中逐渐普及。这些应用中的视频内容通常为固有内容、文本、人工图形及其它内容的组合。在文本及人工图形区中,重复图案(例如字符、图标、符号等)常常存在。
从同一图片内的预测性视频数据块帧内预测视频数据块(其可被称为帧内块复制(缩写为IntraBC或IBC),且有时还称作帧内运动补偿(IntraMC或IMC))为可使得视频译码器能够移除冗余并改进帧内译码效率的技术。在典型帧内预测译码中,视频译码器(例如,视频编码器及视频解码器)使用在同一图片中的当前视频数据块正上方或正下方或与所述当前块正好水平地成一条线的先前经重构建视频数据块来预测所述当前视频块。换句话说,如果图片或视频数据的帧强加于2-D栅格,则每一视频数据块占据x值及y值的唯一范围。因此,一些视频译码器可基于同一图片中仅共享同一组x值(即,与当前视频块垂直地成一条线)或同一组y值(即,与当前视频块水平地成一条线)的经先前译码视频数据块而预测当前视频数据块。
视频译码器从同一帧或图片中未必在当前视频数据块正上方或正左边(或在正右边或正下方)的先前经重构建视频数据块预测当前视频块可为有利的。通过在预测性集合中包含更多视频块,视频译码器可达成对当前视频块的更准确预测,借此增加译码效率。
大体来说,本发明描述用于译码视频数据的技术,所述技术包含从同一图片内的预测性视频数据块帧内预测视频数据块的模式,其可被称为IBC模式。本发明的IBC技术可包含识别用于当前视频数据块的预测性视频数据块。举例来说,预测性视频数据块可对应于与当前视频数据块在同一图片内的经重构建视频数据块。预测性视频数据块可来自图片内的预期区内。预期区还可被称作IBC预测区。举例来说,预期区可对应于在当前视频数据块上方、右上方、左上方及/或左边的区。预测性视频数据块不限于在当前视频块正上方或正左方,且因此用以识别相对于当前块的预测性块的向量未必是一维向量。替代地,为了识别或确定预测性视频数据块,视频译码器可译码界定包含相对于当前视频数据块的水平位移分量及垂直位移分量的二维向量的一或多个语法元素。二维向量可被称为块向量、偏移向量或运动向量,且可例如用以识别相对于当前块的左上方拐角的预测性块。
本发明描述可改进现有视频译码技术,且更确切地说,可改进现有IBC相关视频译码技术的技术。在一些译码情景中,本发明的技术可通过例如实现切片级上的IBC实现对IBC的使用的较精细控制。所提出技术可与任何位深度、色度取样格式及/或例如此类一起使用。
如本文所使用,术语“视频译码器”大体上是指视频编码器及视频解码器两者。在本发明中,术语“视频译码”或“译码”可大体上是指视频编码或视频解码。因此,除非另外说明,否则应假设,参考译码所描述的技术可由视频编码器或视频解码器执行。在本申请案的一些部分中,可参考视频解码或参考视频解码器来描述某些技术。然而,不应假设此类技术不适用于视频编码或不可由视频编码器执行。举例来说,此类技术可作为确定如何编码视频数据的部分而执行,或可作为视频编码器中的视频解码回路的部分而执行。
如本发明中所使用,术语当前块是指当前正被译码的块,与已经译码或尚未译码的块相对。类似地,当前译码单元、预测单元或变换单元是指当前正被译码的译码单元、预测单元或变换单元。
图1为说明可利用本发明中所描述的技术的实例视频编码及解码***10的框图。如图1中所展示,***10包含源装置12,其产生稍后由目的地装置14解码的经编码视频数据。源装置12及目的地装置14可包括广泛范围的装置中的任一者,包含台式计算机、笔记型(即,手提)计算机、平板计算机、机顶盒、电话手机(例如,所谓的“智能”电话)、所谓的“智能”平板、电视、摄影机、显示装置、数字媒体播放器、视频游戏机、视频流装置或其类似者。在一些情况下,源装置12及目的地装置14可经装备以用于无线通信。
目的地装置14可经由链路16接收待解码的经编码视频数据。链路16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一个实例中,链路16可包括使源装置12能够即时将经编码视频数据直接传输到目的地装置14的通信媒体。可根据通信标准(例如,无线通信协议)调制经编码视频数据,且将其传输到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一或多个物理传输线。通信媒体可形成基于分组的网络(例如局域网、广域网或全球网络,例如因特网)的部分。通信媒体可包含路由器、交换器、基站或任何其它可适用于有助于从源装置12到目的地装置14的通信的设备。
替代地,可将经编码数据从输出接口22输出到存储装置26。类似地,可通过输入接口从存储装置26存取经编码数据。存储装置26可包含各种分布式或本机存取式数据存储媒体(例如,硬盘、蓝光光盘、DVD、CD-ROM、闪存存储器、易失性或非易失性存储器,或用于存储经编码视频数据的任何其它合适数字存储媒体)中的任一者。在另一实例中,存储装置26可对应于可保持由源装置12产生的经编码视频的文件服务器或另一中间存储装置。目的地装置14可经由流式传输或下载而从存储装置26存取所存储的视频数据。文件服务器可为能够存储经编码视频数据并将所述经编码视频数据传输到目的地装置14的任何类型的服务器。实例文件服务器包含网页服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置及本机磁盘驱动器。目的地装置14可经由任何标准数据连接(包含因特网连接)而存取经编码的视频数据。此数据连接可包含适合于存取存储于文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器,等等),或两者的组合。经编码视频数据从存储装置26的传输可为流式传输、下载传输或两者的组合。
本发明的技术不必限于无线应用或设置。所述技术可适用于支持多种多媒体应用(例如,(例如)经由因特网的空中电视广播、有线电视传输、***传输、流式视频传输)中的任一者的视频译码、供存储于数据存储媒体上的数字视频的编码、存储于数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,***10可经配置以支持单向或双向视频传输以支持例如视频流式传输、视频播放、视频广播及/或视频电话的应用。
在图1的实例中,源装置12包含视频源18、视频编码器20及输出接口22。在一些情况下,输出接口22可包含调制器/解调器(调制解调器)及/或传输器。在源装置12中,视频源18可包含例如视频俘获装置(例如,视频摄影机)、含有先前所俘获视频的视频文件库、用以从视频内容提供者接收视频的视频馈入接口及/或用于产生作为源视频的计算机图形数据的计算机图形***或这些源的组合的源。作为一个实例,如果视频源18为视频摄影机,那么源装置12及目的地装置14可形成所谓的摄影机电话或视频电话。然而,本发明中所描述的技术可大体上适用于视频译码,且可应用于无线及/或有线应用。
经俘获、预先俘获或计算机产生的视频可由视频编码器20编码。可经由源装置12的输出接口22将经编码视频数据直接传输到目的地装置14。经编码视频数据还可(或替代地)存储到存储装置26上以稍后由目的地装置14或其它装置存取,以进行解码及/或播放。
目的地装置14包含输入接口28、视频解码器30及显示装置32。在一些情况下,输入接口28可包含接收器及/或调制解调器。目的地装置14的输入接口28经由链路16接收经编码视频数据。经由链路16传达或在存储装置26上所提供的经编码视频数据可包含由视频编码器20所产生的多种语法元素,其供例如视频解码器30的视频解码器在解码所述视频数据时使用。这些语法元素可与在通信媒体上传输、存储于存储媒体上或存储于文件服务器上的经编码视频数据包含在一起。
显示装置32可与目的地装置14集成或在目的地装置14的外部。在一些实例中,目的地装置14可包含集成式显示装置且还可经配置以与外部显示装置以接口连接。在其它实例中,目的地装置14可为显示装置。一般来说,显示装置32向用户显示经解码视频数据,且可包括多种显示装置中的任一者,例如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20及视频解码器30可根据例如最近定案的高效率视频译码(HEVC)标准的视频压缩标准操作。替代地,视频编码器20及视频解码器30可根据其它专有或行业标准(例如,ITU-T H.264标准,或者被称作MPEG-4,第10部分,高级视频译码(AVC))或此类标准的扩展而操作。然而,本发明的技术不限于任何特定译码标准。视频压缩标准的其它实例包含MPEG-2及ITU-T H.263。
对HEVC的各种扩展(例如,用于3D、多视图、可调式及屏幕内容的扩展)当前在开发中。另外,对HEVC的范围扩展(即,HEVC RExt)还正由JCT-VC开发。范围扩展的最近工作草案(WD)(下文中被称作RExt WD7)可从http://phenix.int-evry.fr/jct/doc_end_user/documents/17_Valencia/wg11/JCTVC-Q1005-v4.zip获得。
在本发明中,如在JCTVC-Q1003中的HEVC规范文本常常被称作HEVC版本1。本发明的技术可利用HEVC术语,以易于解释。然而,不应假设本发明的技术限于HEVC,且实际上,明确地预期本发明的技术可实施于HEVC之后续标准中,后续标准包含HEVC的扩展以及下一代标准。
尽管图1中未展示,但在一些方面中,视频编码器20及视频解码器30可各自与音频编码器及解码器集成,且可包含适当MUX-DEMUX单元或其它硬件及软件以处置共同数据流或单独数据流中的音频及视频两者的编码。如果适用,那么在一些实例中,MUX-DEMUX单元可符合ITU H.223多路复用器协议或其它协议(例如,用户数据报协议(UDP))。
视频编码器20及视频解码器30各自可实施为各种适合的编码器电路中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当所述技术部分以软件实施时,装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中,且在硬件中使用一或多个处理器执行指令以执行本发明的技术。视频编码器20及视频解码器30中的每一者可包含于一或多个编码器或解码器中,编码器或解码器中的任一者可集成为相应装置中的组合式编码器/解码器(编码解码器)的部分。
如上文介绍,JCT-VC最近已定案HEVC标准ITU-TH.265的开发。HEVC根据(例如)ITU-T H.264/AVC实现视频译码装置相对于现有装置的若干额外能力。举例来说,尽管H.264提供九个帧内预测编码模式,但HEVC支持多达三十五个帧内预测编码模式。
在HEVC及其它视频译码规范中,视频序列通常包含一系列图片。图片还可被称作“帧”。图片可包含三个样本阵列,表示为SL、SCb及SCr。SL为明度样本的二维阵列(即,块)。SCb为Cb彩度样本的二维阵列。SCr为Cr彩度样本的二维阵列。彩度(chrominance)样本还可在本文中被称作“色度(chroma)”样本。在其它情况下,图片可为单色的,且可仅包含明度样本阵列。
为了产生图片的经编码表示,视频编码器20可产生译码树单元(CTU)的集合。CTU中的每一者可包括亮度样本的译码树块、色度样本的两个对应译码树块及用以译码所述译码树块的样本的语法结构。在单色图片或具有三个单独色彩平面的图片中,CTU可包括单一译码树块及用以译码所述译码树块的样本的语法结构。译码树块可为N×N样本块。CTU还可被称作“树块”或“最大译码单元”(LCU)。HEVC的CTU可大致类似于例如H.264/AVC的其它标准的巨集块。然而,CTU未必限于特定大小,且可包含一或多个译码单元(CU)。切片可包含以光栅扫描次序连续定序的整数数目个CTU。
为产生经译码CTU,视频编码器20可对CTU的译码树块递归地执行四分树分割,以将译码树块划分成译码块,因此命名为“译码树单元”。译码块可为N×N样本块。CU可包括具有亮度样本阵列、Cb样本阵列及Cr样本阵列的图片的明度样本译码块,及两个对应的色度样本译码块,及用于译码所述译码块的样本的语法结构。在单色图片或具有三个单独色彩平面的图片中,CU可包括单一译码块及用于译码所述译码块的样本的语法结构。
视频编码器20可将CU的译码块分割为一或多个预测块。预测块为供应用相同预测的样本的矩形(即,正方形或非正方形)块。CU的预测单元(PU)可包括明度样本预测块、两个对应的色度样本预测块及用于预测所述预测块的语法结构。在单色图片或具有三个单独色彩平面的图片中,PU可包括单一预测块及用以预测所述预测块的语法结构。视频编码器20可产生用于CU的每一PU的明度预测块、Cb预测块及Cr预测块的预测性明度、预测性Cb块及预测性Cr块。
视频编码器20可使用帧内预测或帧间预测来产生PU的预测性块。如果视频编码器20使用帧内预测产生PU的预测性块,那么视频编码器20可基于与PU相关联的图片的经解码样本产生PU的预测性块。如果视频编码器20使用帧间预测来产生PU的预测性块,那么视频编码器20可基于不同于与PU相关联的图片的一或多个图片的经解码样本而产生PU的预测性块。
在视频编码器20产生CU的一或多个PU的预测性明度块、预测性Cb块及预测性Cr块之后,视频编码器20可产生CU的明度残余块。CU的明度残余块中的每一样本指示CU的预测性明度块中的一者中的明度样本与CU的原始明度译码块中的对应样本之间的差异。另外,视频编码器20可产生CU的Cb残余块。CU的Cb残余块中的每一样本可指示CU的预测性Cb块中的一者中的Cb样本与CU的原始Cb译码块中的对应样本之间的差异。视频编码器20还可产生CU的Cr残余块。CU的Cr残余块中的每一样本可指示CU的预测性Cr块的一者中的Cr样本与CU的原始Cr译码块中的对应样本之间的差异。
此外,视频编码器20可使用四分树分割以将CU的明度残余块、Cb残余块及Cr残余块分解为一或多个明度变换块、Cb变换块及Cr变换块。变换块为供应用相同变换的矩形(即,正方形或非正方形)样本块。CU的变换单元(TU)可包括明度样本的变换块、两个对应的色度样本变换块及用于变换所述变换块样本的语法结构。因此,CU的每一TU可与明度变换块、Cb变换块及Cr变换块相关联。与TU相关联的明度变换块可为CU的明度残余块的子块。Cb变换块可为CU的Cb残余块的子块。Cr变换块可为CU的Cr残余块的子块。在单色图片或具有三个单独色彩平面的图片中,TU可包括单一变换块及用于变换所述变换块的样本的语法结构。
视频编码器20可将一或多个变换应用于TU的明度变换块,以产生TU的明度系数块。系数块可为变换系数的二维阵列。变换系数可为标量。视频编码器20可将一或多个变换应用到TU的Cb变换块,以产生TU的Cb系数块。视频编码器20可将一或多个变换应用到TU的Cr变换块,以产生TU的Cr系数块。
在产生系数块(例如,明度系数块、Cb系数块或Cr系数块)之后,视频编码器20可量化系数块。量化大体上是指量化变换系数以可能减少用以表示变换系数的数据的量从而提供进一步压缩的程序。在视频编码器20量化系数块之后,视频编码器20可熵编码指示经量化变换系数的语法元素。举例来说,视频编码器20可对指示经量化变换系数的语法元素执行上下文自适应二进位算术译码(CABAC)。
视频编码器20可输出包含形成对经译码图片及相关联数据的表示的位序列的位流。位流可包括NAL单元序列。NAL单元为含有对NAL单元中的数据类型的指示的语法结构及含有呈视需要穿插有模拟阻止位的RBSP形式的数据的位组。NAL单元中的每一者包含NAL单元标头且包封RBSP。NAL单元标头可包含指示NAL单元类型代码的语法元素。通过NAL单元的NAL单元标头指定的NAL单元类型代码指示NAL单元的类型。RBSP可为含有包封于NAL单元内的整数数目个位组的语法结构。在一些情况下,RBSP包含零个位。
不同类型的NAL单元可包封不同类型的RBSP。举例来说,第一类型的NAL单元可包封用于PPS的RBSP,第二类型的NAL单元可包封用于经译码切片的RBSP,第三类型的NAL单元可包封用于SEI消息的RBSP等。包封用于视频译码数据的RBSP(与用于参数集及SEI消息的RBSP相对)的NAL单元可被称作VCL NAL单元。
视频解码器30可接收由视频编码器20产生的位流。此外,视频解码器30可解析位流以从所述位流获得语法元素。视频解码器30可至少部分基于从位流获得的语法元素而重构建视频数据的图片。重构建视频数据的程序可大体上与由视频编码器20执行的程序互逆。另外,视频解码器30可反量化与当前CU的TU相关联的系数块。视频解码器30可对系数块执行反变换,以重构建与当前CU的TU相关联的变换块。视频解码器30可通过将当前CU的PU的预测性块的样本添加到当前CU的TU的变换块的对应样本,来重构建当前CU的译码块。视频解码器30可通过重构建图片的每一CU的译码块,来重构建图片。
最近,请求用于例如文本及运动图形的屏幕内容材料的新译码工具的调查,且已提出改进屏幕内容的译码效率的技术。由于有迹象表明在一些译码情景中,可通过新颖的专用译码工具,使用屏幕内容的特性获得译码效率的显著改进,因此发布以包含用于屏幕内容译码(SCC)的特定工具的高效率视频译码(HEVC)标准的可能在开发中的未来扩展为目标的提案(CfP)。在MPEG文献N14174中描述此CfP的使用情况及要求。在第17次JCT-VC会议期间,建立了SCC测试模型(SCM)。SCC的最近工作草案(WD)可从http://phenix.int-evry.fr/jct/doc_end_user/documents/20_Geneva/wg11/JCTVC-T1005-v2.zip获得。
在当前SCC中,IBC发信通过将当前图片添加到参考图片列表而与帧间预测发信统一。在解码当前切片之前,视频解码器30将当前图片标记为长期参考图片。接着,在对当前图片的解码完成之后,当前图片转换回到短期参考图片。除IBC模式的运动向量需要为整数运动向量的差异外,发信及译码方法(包含合并/AMVP发信、AMVP推导及MVD译码)与帧间情况相同。IBC块可通过检查对应参考图片而与常规帧间块区分。如果仅当前图片用作参考图片,那么当前块为IBC块。否则,当前块为帧间块。SPS级语法元素curr_pic_as_ref_enabled_flag可用于指示当前图片的已经译码部分是否可作为参考图片用于译码当前图片的块。换句话说,视频解码器30可接收语法元素curr_pic_as_ref_enabled_flag,且响应于语法元素curr_pic_as_ref_enabled_flag等于1,视频解码器30可使用IBC解码与SPS相关联的切片的一些块。
图2为说明根据本发明用于根据用于从同一图片内的视频数据的预测性块对视频数据块的帧内预测的模式(例如,根据本发明的技术根据IBC模式)预测当前图片103内的当前视频数据块102的实例技术的概念图。图2说明当前图片103内的预测性视频块104。视频译码器(例如,视频编码器20及/或视频解码器30)可使用预测性视频块104根据本发明的技术根据IBC模式预测当前视频块102。
视频编码器20从先前经重构建视频数据块的集合选择预测性视频块104用于预测当前视频块102。视频编码器20通过反量化及反变换也包含于经编码视频位流中的视频数据且将所得残余块与用以预测经重构建视频数据块的预测性块求和而重构建视频数据块。在图2的实例中,图片103内的预期区108(其还可被称作“预期区域”或“光栅区域”)包含先前经重构建的视频块的集合。视频编码器20可以多种方式界定图片103内的预期区108,如下文更详细描述。视频编码器20可根据基于预期区108内的各种视频块对预测及译码当前视频块102的相对效率及准确度的分析而从预期区108中的视频块当中选择预测性视频块104以预测当前视频块102。
视频编码器20确定表示预测性视频块104相对于当前视频块102的位置或位移的二维向量106。二维块向量106包含水平位移分量112及垂直位移分量110,其分别表示预测性视频块104相对于当前视频块102的水平及垂直位移。视频编码器20可包含经编码视频位流中的识别或界定二维块向量106(例如,界定水平位移分量112及垂直位移分量110)的一或多个语法元素。视频解码器30可解码所述一或多个语法元素以确定二维块向量106,且使用经确定向量来识别用于当前视频块102的预测性视频块104。
在一些实例中,二维块向量106的空间分辨率可为整数像素分辨率,例如被约束为具有整数像素分辨率。在这些实例中,水平位移分量112及垂直位移分量110的空间分辨率可为整数像素分辨率。在这些实例中,视频编码器20及视频解码器30无需内插预测性视频块104的像素值以确定用于当前视频块102的预测符。
在其它实例中,水平位移分量112及垂直位移分量110中的一者或两者的分辨率可为子像素。举例来说,分量110及分量112中的一者可具有整数像素分辨率,而另一者具有子像素分辨率。在一些实例中,水平位移分量112及垂直位移分量110两者的分辨率都可为子像素,但水平位移分量112及垂直位移分量110可具有不同分辨率。
在一些实例中,视频译码器(例如,视频编码器20及/或视频解码器30)基于特定级调适水平位移分量112及垂直位移分量110的分辨率,例如块级、切片级或图切片级调适。举例来说,视频编码器20可在切片级(例如在切片标头中)用信号发出一旗标,所述旗标指示水平位移分量112及垂直位移分量110的分辨率为整数像素分辨率抑或不为整数像素分辨率。如果旗标指示水平位移分量112及垂直位移分量110的分辨率不为整数像素分辨率,那么视频解码器30可推断分辨率是子像素分辨率。在一些实例中,可传输针对每一切片或其它视频数据单元的一或多个语法元素(其不一定是旗标),以指示水平位移分量112及/或垂直位移分量110的共同或个别分辨率。
在另外其它实例中,替代旗标或语法元素,视频编码器20可基于分辨率上下文信息而设置,且视频解码器30可从分辨率上下文信息推断水平位移分量112及/或垂直位移分量110的分辨率。分辨率上下文信息可包含例如包含当前视频块102的图片或图片序列的色彩空间(例如YUV、RGB等)、特定色彩格式(例如4:4:4、4:2:2、4:2:0等)、帧大小、帧速率或量化参数(QP)。在至少一些实例中,视频译码器可基于与经先前译码帧或图片相关的信息确定水平位移分量112及/或垂直位移分量110的分辨率。以此方式,水平位移分量112的分辨率及垂直位移分量110的分辨率可经预定义或发信,可从其它旁侧信息(例如,分辨率上下文信息)推断,或可基于已经译码的帧。
当前视频块102可为CU,或CU的PU。在一些实例中,视频译码器(例如,视频编码器20及/或视频解码器30)可将根据IBC预测的CU分成若干PU。在这些实例中,视频译码器可确定CU的PU中的每一者的相应(例如,不同)二维向量106。举例来说,视频译码器可将2N×2NCU分为两个2N×N PU、两个N×2N PU,或四个N×N PU。作为其它实例,视频译码器可将2N×2N CU分为((N/2)×N+(3N/2)×N)PU、((3N/2)×N+(N/2)×N)PU、(N×(N/2)+N×(3N/2))PU、(N×(3N/2)+N×(N/2))PU、四个(N/2)×2N PU或四个2N×(N/2)PU。在一些实例中,视频译码器可使用2N×2N PU预测2N×2N CU。
当前视频块102可为明度视频块,或对应于明度视频块的色度视频块。在一些实例中,视频编码器20可仅将界定明度视频块的二维向量106的一或多个语法元素编码到经编码视频位流中。在这些实例中,视频解码器30可基于针对明度块发信的二维向量推导出对应于所述明度块的一或多个色度块中的每一者的二维向量106。
取决于色彩格式(例如色彩取样格式或色度取样格式),视频译码器可相对于明度视频块降取样对应色度视频块。色彩格式4:4:4不包含降取样,这意味着色度块在水平及垂直方向中包含与明度块相同数目的样本。色彩格式4:2:2意味着色度在水平方向中降取样,以使得在水平方向中存在为相对于明度块的一半的色度块的样本。色彩格式4:2:0意味着色度在水平及垂直方向中降取样,以使得在水平及垂直方向中存在为相对于明度块的一半的色度块的样本。
在其中视频译码器基于对应明度块的向量106确定色度视频块的向量106的实例中,视频译码器可需要修改明度向量。举例来说,如果明度向量106具有整数分辨率,其中水平位移分量112及/或垂直位移分量110为奇数数目个像素,且色彩格式为4:2:2或4:2:0,那么经转换明度向量可不指向对应色度块中的整数像素位置。在这些实例中,视频译码器可按比例缩放明度向量以用作色度向量以预测对应色度块。在一些实例中,视频编码器20可界定预期区108,或按比例缩放经转换向量,以使得用于预测色度块的经转换明度向量106可不指向未经重构建的或经回路内滤波的预测性色度块。在本发明中,如果未明确提及色度块的向量的按比例缩放,那么不应假设未发生此按比例缩放。即使本发明中所描述的实例中未明确描述,色度块的向量的按比例缩放也可发生(但可不是每种情况下都必需的)。
本发明描述用于启用IBC的I切片的技术。在HEVC的SCC扩展的当前草案文本规范中,当IBC经启用时(例如,当语法元素curr_pic_as_ref_enabled_flag等于1时)不可使用I切片。特定地,当curr_pic_as_ref_enabled_flag等于1时,slice_type语法元素的值不可等于2,其中slice_type值0、1及2分别对应于B切片、P切片及I切片。这提供一些可能的缺点。举例来说,常规经帧内译码切片(在不使用任一图片(包含当前图片)用于参考的情况下译码)可不经由slice_type语法元素发信,这可在一些情景中用以例如如下文所描述节省一些发信额外负担。
本发明描述即使当IBC经启用时仍允许I切片使用的技术。当IBC经启用时允许I切片使用在一些实例中可即使当curr_pic_as_ref_enabled_flag等于1(指示IBC经启用)时仍允许slice_type语法元素的值等于2(指示给定切片的译码类型为I切片)。在此情况下,I切片为常规经帧内译码切片,其在不使用任一图片(包含当前图片)用于参考的情况下被译码,且使用用于所有经译码块的正常帧内预测模式而被译码。换句话说,不使用帧间预测或IBC译码常规I切片的块,且用于常规I切片的唯一译码模式为帧内模式。
举例来说,视频编码器20可经配置以通过经配置以将视频数据的切片编码为I切片并产生具有用以指示IBC模式经启用用于所述切片的值的IBC语法元素(例如curr_pic_as_ref_enabled_flag)而实施此功能性。视频编码器20可另外产生切片类型语法元素(例如slice_type)并将所述语法元素设置为指示切片为I切片的值。举例来说,视频编码器20可包含在SPS中的IBC语法元素及/或包含在切片标头中的切片类型语法元素。
举例来说,视频解码器30可经配置以通过经配置以接收视频数据的切片并解析IBC语法元素(例如curr_pic_as_ref_enabled_flag)以确定IBC模式经启用用于所述切片而实施此功能性。举例来说,如果视频解码器30确定curr_pic_as_ref_enabled_flag的值等于1,那么视频解码器30可确定IBC模式经启用,而如果curr_pic_as_ref_enabled_flag等于0,那么视频解码器30可确定IBC模式被禁用。视频解码器30还可解析与切片相关联的切片类型语法元素以确定切片为I切片且待解码为I切片。为将切片解码为I切片,视频解码器30可仅使用帧内预测且在不使用帧间预测模式且不使用IBC模式情况下解码切片的块。
替代地,本发明提出引入另一切片类型。举例来说,IBC切片可用于指示在除了当前图片不需具有任何其它参考图片情况下使用IBC模式。换句话说,对于IBC切片,视频译码器可使用帧内模式或IBC模式而不使用帧间模式来译码IBC切片的块。在此实例中,语法元素slice_type的值可等于0、1、2或3,其中新允许值3指定IBC切片。如下文在表1中所示,其它值的语义可保持不变。当slice_type设置成IBC切片时,可避免用于P及B切片的帧间模式的某一发信。举例来说,如果视频解码器30确定切片为IBC切片,那么例如cu_skip_flag语法元素、CU标头中的pred_mode_flag语法元素、切片标头中的参考图片管理信息及其它此类信息的信息不需要包含于经编码视频数据的位流中。
表1
根据上文介绍的技术,视频解码器30可经配置以接收视频数据的切片并解析与视频数据的切片相关联的切片类型语法元素。响应于切片类型语法元素具有指示切片为IBC切片的值(例如slice_type等于3),那么视频解码器30可将切片解码为IBC切片,其可包含使用IBC模式解码切片的一些块及/或使用帧内模式解码切片的一些块。视频解码器30可将其它切片解码为I切片(例如slice_type等于2)、P切片(slice_type等于1)或B切片(slice_type等于0)。解码其它切片类型可涉及接收尚未被接收以用于经解码为IBC切片的切片的一些不同语法元素,且同样地,解码IBC切片可涉及接收尚未被接收以用于其它切片的一些不同语法元素。
本发明还描述用于切片级IBC控制旗标的技术。使用现有技术,是否启用IBC仅由SPS旗标curr_pic_as_ref_enabled_flag控制(即,基于SPS旗标curr_pic_as_ref_enabled_flag而确定IBC的启用)。允许例如在切片级对IBC的较精细控制可具有若干可能益处。作为一个实例,切片级IBC控制可指定当前切片内的块是否可使用当前图片作为参考。IBC模式可在回路内滤波之前需要对样本的额外存储。当在切片级禁用IBC时,智能解码器可避免存储这些额外样本,借此减少平均带宽及平均功率使用。作为另一实例,切片级IBC控制允许切片不使用IBC以具有更多分配到时间参考图片的参考索引,其允许更多权重在加权预测中发信以用于在某些情景中潜在地改进译码效率。
现将更详细地描述用于实现切片级IBC控制的技术。视频编码器20可在IBC经启用(例如curr_pic_as_ref_enabled_flag等于1)时在切片标头中发信切片级IBC控制旗标(例如slice_curr_pic_as_ref_enabled_flag)。另外,视频解码器30可在未发信情况下推断(即,在不接收显式发信的情况下确定)slice_curr_pic_as_ref_enabled_flag的值等于0。切片级控制旗标可经发信仅用于P切片及B切片且被推断具有用于I切片的0值。举例来说,此切片级IBC旗标可指示当前图片是否作为参考图片用于预测切片的块。在其它实施方案中,切片级IBC旗标可指示当前图片是否添加到当前图片的参考图片列表中以用于自参考,在此情况下,当前图片可供作为参考图片用于预测切片的块,但对于一些切片,当前图片可实际上不用于预测。另外,如果禁用slice_curr_pic_as_ref_enabled_flag(即,所述值经显式地发信为等于0或经推断等于0),那么视频解码器30不将IBC模式用于所述特定切片,且可启用I切片类型发信(如上文关于启用用于IBC的I切片所描述)。
slice_curr_pic_as_ref_enabled_flag语法元素的语义可为如下:
slice_curr_pic_as_ref_enabled_flag等于1指定当解码当前切片时,当前图片可包含于当前图片的参考图片列表中。slice_curr_pic_as_ref_enabled_flag等于0指定当解码当前切片时,当前图片从未包含于当前图片的参考图片列表中。当不存在时,推断slice_curr_pic_as_ref_enabled_flag的值等于0。
大体来说,slice_curr_pic_as_ref_enabled_flag可在切片标头层级之下的语法结构、语义及解码过程中(例如,在参考图片列表构造、DPB管理等中)替换在slice_curr_pic_as_ref_enabled_flag之后的切片标头语法中的curr_pic_as_ref_enabled_flag。语法元素curr_pic_as_ref_enabled_flag可视为用于slice_curr_pic_as_ref_enabled_flag发信的门控旗标。举例来说,可基于切片级控制旗标slice_curr_pic_as_ref_enabled_flag推导出NumPicTotalCurr的值。
另外,以下条件可适用(当不应用如上文所描述的用于启用I切片的技术时):
-在当前图片为BLA或CRA图片时,NumPicTotalCurr的值应等于slice_curr_pic_ref_enabled_flag。
在另一替代例中,视频解码器30可经配置以在无显式发信的情况下推导出slice_curr_pic_as_ref_enabled_flag的值。作为推导的部分,视频解码器30可检查参考图片列表RefPicList0及RefPicList1多达切片标头中发信的参考图片的最大数目(例如分别针对RefPicList0及RefPicList1的num_ref_idx_l0_active_minus1及num_ref_idx_l1_active_minus1),且如果无参考图片等于当前图片,那么视频解码器30可推导出slice_curr_pic_as_ref_enabled_flag为0。否则,视频解码器30可推导出slice_curr_pic_as_ref_enabled_flag等于1。举例来说,可在解码过程及其它相关使用中使用所推导出的旗标而非经发信切片级IBC旗标。
为实施上文所描述的切片级IBC控制旗标,视频解码器30可经配置以接收视频数据的切片并解析切片级语法元素(例如slice_curr_pic_as_ref_enabled_flag)以确定IBC模式经启用用于所述切片。视频解码器30可经配置以构建用于视频数据的切片的参考图片列表,且包含于参考图片列表中的图片的数目可取决于切片级语法元素指示IBC是经启用还是经禁用。视频解码器30可解析切片级语法元素以确定IBC模式经启用用于所述切片,响应于确定所述切片为P切片或B切片中的一者而执行IBC模式。对于经确定为I切片的切片,视频解码器30可推断切片级语法元素的值以指示IBC模式被禁用。视频解码器30可构建用于视频数据的切片的参考图片列表,且响应于指示IBC模式经启用的切片级语法元素,将含有所述切片的图片添加到参考图片列表。
本发明还描述对切片级IBC控制旗标及slice_type的使用的可能约束条件。下文介绍的约束条件或方面中的任一者可独立地或结合此章节或本发明中的其它章节中的其它约束条件中的一或多者而应用。
在一些实例中,位流符合性可具有以下要求:
●当仅currPic可供用于参考时,slice_curr_pic_as_ref_enabled_flag的值对于P切片及B切片不应等于0。
●当nal_unit_type具有在BLA_W_LP到RSV_IRAP_VCL23范围内的值(包含性(即,图片为IRAP图片))时,slice_curr_pic_as_ref_enabled_flag的值对于P切片及B切片不应等于0。RefPicList0应含有仅指当前图片的一或多个条目。
●替代地,当仅currPic可供用于参考(即,当DPB含有仅一个为当前图片的参考图片时)且值被推断时,slice_curr_pic_as_ref_enabled_flag不应经发信用于P切片及B切片。
现将论述解码过程的改变。解码过程可如所示以带下划线的文本改变。所示变化可单独地或联合地应用。
在当前图片中的至少一个切片具有等于1的slice_curr_pic_as_ref_enabled_flag时,DPB中的图片存储缓冲器经分配用于当前图片,且当前图片标记为“用于长期参考”。
条项8.4、8.5、8.6及8.7中的程序指定使用所有语法结构层中的语法元素的解码程序。位流符合性的要求是图片的经译码切片应含有用于图片的每一译码树单元的切片分段数据,以使得图片成切片的划分、切片成切片分段的划分及切片分段成译码树单元的划分各自形成图片的分割。当在当前图片中的至少一个切片具有等于1的slice_curr_pic_as_ref_enabled_flag时,在回路内滤波之前的当前图片的经解码样本值经存储到经分配用于当前图片的图片存储缓冲器中。
注解2-当在当前图片中的至少一个切片具有等于1的slice_curr_pic_as_ref_enabled_flag时,一个额外图片存储缓冲器(未视为DPB的部分)需要用于存储在回圈内滤波之后的当前图片的样本值。
本发明还描述共置图片约束条件。在当前WD中,存在当前图片不可用作共置图片的约束条件。此约束条件的原因为如果共置图片为当前图片,那么将不存在仍经指派用于待用于运动预测的共置块的运动场。
举例来说,可通过在处理当前图片之前初始化当前图片的运动场而移除此约束条件。举例来说,当前图片可经初始化具有帧内译码的所有块,这意谓不存在运动场信息。替代地,运动场可经初始化具有默认运动场,其中默认运动场为编码器及解码器两者所已知,例如,在与RefPicList0或RefPicList1或两者相关联的至少一个帧间方向中为零运动(具有零参考索引的零运动向量)。另外,经指派给切片的默认运动场可取决于切片类型。举例来说,对于I切片,所述切片中的所有块经初始化具有帧内模式,对于P切片,RefPicList0相关运动场经设置成零运动,对于B切片,在与RefPicList0及RefPicList1相关联的两个方向中指派零运动。
另外,上文所提及的约束条件(当前图片不可用作共置图片)是呈编码器约束条件或位流约束条件的形式指定,所述约束条件可被一些编码器违反,使得位流可能被破坏。
本发明描述用于通过例如修改语法以使得不满足约束条件的语法元素的值不可在位流中发信而使此约束条件更严格的技术。
首先,TMVP使得在切片仅具有当前图片作为参考图片的情况下在切片标头中发信的旗标必须被禁用,这是由于当前图片不可用作共置图片。可存在一个以上参考图片,其中所有参考图片都可为当前图片。
替代地,TMVP使得可在用于切片的参考图片的数目(例如,num_ref_idx_l0_active_minus1及num_ref_idx_l1_active_minus1)的发信之后移动及放置旗标发信,且可执行检查以确定所有参考图片是否都为当前图片。如果所有参考图片都为当前图片,那么TMVP使得旗标不被发信且经推导出为被禁用(即,等于0)。
在另一替代例中,并不是推导出所有参考图片是否为当前图片,而是可在切片标头中发信旗标以指示此情况。
另外,对于collocated_ref_idx的发信,指向当前图片的参考索引可排除被collocated_ref_idx参考,且collocated_ref_idx的值减少了指向存在于所要共置图片之前的当前参考图片的参考索引的数目。以类似方式,在解析之后,所解析的collocated_ref_idx增加了指向在经发信collocated_ref_idx之前的当前参考图片的参考索引的数目。
根据一个实例,假设RefPicList={Pic0,Curr,Pic1,Curr,Pic2}。
为使Pic0为共置图片,发信collocated_ref_idx=0。
为使Pic1为共置图片,发信collocated_ref_idx=1,且collocated_ref_idx递增1,从而使collocated_ref_idx等于2。
为使Pic2为共置图片,发信collocated_ref_idx=2,且collocated_ref_idx递增2,从而使collocated_ref_idx等于4。
举例来说,假设所要collocated_ref_idx等于N,编码部分可被实施为以下伪码。
举例来说,解码部分可被实施为以下伪码,其中collocated_ref_idx为待更新的经解析值。
在所提供实例中,collocated_ref_idx不可能等于当前图片(Curr),这是因为解码器将递增collocated_ref_idx的值,因此使得当前图片不可能为共置图片。
另外,发信collocated_ref_idx所根据的条件可经修改以排除collocated_ref_idx可仅具有一个值的情况。在此情况下,可计数包含于RefPicList0及RefPiclList1中的参考图片的数目(本文中表示为numCurrRef0及numCurrRef1),且参考图片的数目(例如num_ref_idx_l0_active_minus1及num_ref_idx_l1_active_minus1)可减少了等于RefPicList0及RefPicList1的当前图片的参考索引的数目。参考索引的此经修改数目可替代切片标头中的参考索引的发信数目用于解码过程,例如用于发信collocated_ref_idx中。
举例来说,实施方案可实现如下。
仅当可能的共置索引的数目大于1时发信共置参考索引,例如
其中带下划线的部分经添加到当前草案文本规范顶部。
实例:RefPicList0={Curr,Pic0,Curr}
发信num_ref_idx_l0_active_minus1等于2,且numCurrRef0等于2(由于参考图片列表中存在2个当前参考图片)。
num_ref_idx_l0_active_minus1-numCurrRef0等于0,且collocated_ref_idx并不被发信,但被推断等于0,然而,真实值为1(零索引指向当前图片)。
在推断为0之后,使用上文所描述的共置索引修改
其将产生等于1的collocated_ref_idx,这是由于归因于第一参考图片等于参考图片列表中的当前图片而发生增量一。
在此实例中,与当前草案文本规范相比较(在其中collocated_ref_idx被发信),节省了collocated_ref_idx发信,但需要collocated_ref_idx等于1。本文中关于共置图片约束条件及共置参考索引发信所描述的任何技术可独立地或以任何组合使用。
本发明还描述用于基于现有参考图片的数目禁用列表修改的技术。在当前WD中,可在NumPicTotalCurr>1且lists_modification_present_flag=1时调用ref_pic_list_modification程序。本发明提出当num_ref_idx_l0_active_minus1=0(即,可用于解码切片的参考图片列表0的最大参考索引等于0)且上文关于切片级IBC控制旗标所描述的切片级IBC控制旗标等于1时,列表修改信息是冗余的且可被推断。换句话说,在一些实施方案中,当IBC模式经启用而不需列表修改程序时,当前图片可始终被添加到参考图片列表。
本发明描述在num_ref_idx_l0_active_minus1=0且slice_curr_pic_as_ref_enabled_flag=1时不发信列表修改信息的技术。列表修改程序可经推断以包含作为RefPicList0中的第一条目的curPic。换句话说,在一些实施方案中,当IBC模式经启用而不需列表修改程序时,当前图片可始终被添加到参考图片列表。
举例来说,如果视频编码器20确定IBC经启用用于IBC切片,那么用于切片的参考图片列表中的唯一参考图片为包含所述切片的当前图片。因此,响应于确定用于视频数据的切片的参考图片列表中的参考图片的数目等于一个且响应于IBC模式经启用用于所述切片,视频编码器20可经配置以禁用参考图片列表修改且不将用于所述切片的参考图片列表修改信息包含于经编码位流中。类似地,视频解码器30可经配置以接收指示用于视频数据的切片的参考图片列表中的参考图片的数目的语法元素(例如num_ref_idx_l0_active_minus1),且响应于所述语法元素指示用于视频数据的切片的参考图片列表中的参考图片的数目等于一个(例如num_ref_idx_l0_active_minus1等于0)及响应于IBC模式经启用用于所述切片(例如slice_curr_pic_as_ref_enabled_flag=1及/或curr_pic_as_ref_enabled_flag=1),视频解码器30可禁用参考图片列表修改。举例来说,视频解码器30可通过在不接收参考图片列表修改信息情况下构建参考图片列表而禁用参考图片列表修改。在一个实例中,禁用参考图片列表修改可意谓与参考图片列表修改信息相关联的信息(例如,语法元素)未在位流中发信,因此潜在地改进压缩并减少解码器侧复杂度。
尽管已关于RefPicList0描述上文的实例,但应了解,上述技术也同样适用于RefPicList1。
在第一实例实施方案中,当num_ref_idx_l0_active_minus1=0(即,可用于解码切片的参考图片列表0的最大参考索引等于1)且如在当前草案规范中的SPS级IBC控制旗标(curr_pic_as_ref_enabled_flag)等于1时,可不发信列表修改。列表修改程序经推断以包含作为RefPicList0中的第一条目的curPic。
上述内容还可扩展到RefPicList1。
本发明还描述用于将回路内滤波实施为后处理的技术。换句话说,如在一些译码情景中经应用为回路内滤波器的滤波器可在其它译码情景中应用为回路后滤波器。当使用IBC模式时,不滤波用于IBC预测的当前图片的参考样本。换句话说,例如解块滤波器及SAO的回路内滤波器可不应用于IBC参考样本。然而,回路内滤波又可应用于规律预测的经重构建的样本。这些技术可出于多个原因改进总体译码效率及装置性能。作为一个实例,滤波可不为用于图形内容的良好预测符,且因此与滤波相关联的计算复杂度可向某些类型视频内容提供最小益处或无益处。作为另一实例,归因于存储当前图片的未经滤波及经滤波样本(用于IBC及规律帧间模式)的需要,回路内滤波可增加用于写入及读取样本的带宽并增加所需存储容量。
在一个实例中,视频解码器30可仅当图片被输出或显示时应用回路内滤波器且将与参考图片相关联的未经滤波像素用于IBC及规律帧间模式两者。对于此实例,视频解码器30可经配置以使用IBC模式重构建视频数据块并输出包含所述块的图片,其中所输出图片中的块是使用一或多个回路滤波器经滤波。然而,视频解码器30可将具有块的未经滤波版本的图片存储为用于将来块的参考图片。
这可减少带宽,这是由于仅未经滤波像素需要被存储且其可通过保持可通过滤波器移除的细节使对图形内容的预测更好。然而,回路内滤波器又可应用于经输出用于显示的图片。
IBC控制旗标或新的旗标可用以推导出回路内滤波器是应用作后滤波器还是应用于输出图片的滤波器。举例来说,视频解码器30可经配置以响应于确定IBC模式经启用而接收指示回路滤波器操作是回路内还是回路后应用的语法元素。另外,新的旗标可在IBC模式处于使用中时发信。举例来说,此旗标可在不存在于位流中时经推导出为等于0。
在另一实例中,IBC模式可在经滤波图像可用时使用经滤波样本(例如,经解块滤波、经SAO滤波或经ALF滤波)。对于滤波器,可能需要在正被滤波的块外部的一些像素,但所述像素不可用。当这些外部像素可用(即,已经重构建)时,那么经滤波像素可用于IBC模式中的预测。如果滤波所需要的至少一个像素不可用,那么未经滤波样本用于IBC预测。在此情况下,可减少带宽,这是由于待存储用于IBC预测的未经滤波像素的数量减少。替代地,IBC可仅参考经滤波样本;在此情况下,未经滤波样本(例如,需要尚未经重构建的至少一个像素的样本)可不需要经存储用于IBC预测。可(例如)通过用以推导出预测块的MV不应包含这些样本的编码器或位流约束条件实现此限制。
在以上实例中,对于待与IBC预测一起使用的经滤波或未经滤波像素的检查可为复杂的,这是由于相邻CU可用于预测。为简化推导程序,含有当前块的当前CTU的未经滤波样本可用于IBC预测,且位于当前CTU外部的经滤波样本(如果可用)用于IBC预测。在此情况下,与未经滤波像素的存储相关联的带宽可减少,这是由于当前CTU样本可存储于高速缓冲存储器中且不需要存储于编码器20或解码器30的外部存储器中。
可引入旗标以指示是否在用于IBC预测的经滤波样本或未经滤波样本之间应用选择。此旗标可在IBC模式被使用时发信且经推导为在不存在于位流中的情况下被禁用。
替代地,指示在用于IBC预测的经滤波样本或未经滤波样本之间的选择的发信可依据延迟(以CTU、切片、图块为单位)。举例来说,在延迟值之前从块的IBC预测可仅使用经滤波样本且在延迟值之后可使用未经滤波样本。上文的实例中所描述的方面可独立地或以与其它所描述方法的任一组合的方式使用。
本发明描述可引起带宽减少的技术。对于IBC模式的现有实施方案,视频解码器不滤波预测样本;因此,如果IBC经启用,那么除经滤波样本以外,额外的未经滤波样本也需要被存储,致使如果使用IBC模式,那么存储带宽至少加倍。
根据本发明的技术,为了减少由未经滤波样本引起的带宽增加,视频解码器30可存储经滤波样本与未经滤波样本之间的差,而非存储未经滤波样本。由于滤波器操作(例如,解块、SAO)仅致使小的值改变,因此经滤波样本与未经滤波样本之间的差可不需要完整位深度用于存储,这可有助于减少存储与IBC模式一起使用的经滤波及未经滤波样本两者所需要的存储带宽。此外,可应用一些压缩方案(其在一个实例中可为无损压缩,如从相邻者的预测及可变长度译码)以进一步减少带宽及存储空间。在此实施方案中,视频解码器30可经配置以对视频数据的经重构建块执行回路滤波操作以产生经滤波的经重构建块,存储指示经滤波的经重构建块与所述经重构建的块之间的差的差值,并至少部分地基于所存储的差值预测块。
本发明还描述用于将滤波应用于预测样本的技术。如在上述章节中所提及,在IBC模式的当前设计中,预测样本为当前图片的未经滤波的经重构建样本(预先SAO或解块)。除发送到显示器的经滤波样本以外还需要存储这些未经滤波样本。在此章节中,提出一些方法以避免对于未经滤波样本的额外存储的需要。
根据本发明的第一技术,视频译码器(例如,视频编码器20或视频解码器30)可将SAO及解块应用于预测样本而非经重构建样本。下文提供实例实施方案。实例实施方案比较当前设计与在本发明中提出的设计的一个实例。
当前设计:最后重构建=滤波(预测+残余)
所提出设计:最后重构建=滤波(预测)+残余。
其中,
滤波:表示程序SAO及解块中的任一者或两者
预测:表示未经滤波预测样本。
关于上文所描述的第一技术,视频译码器可将SAO及解块应用于任何模式(例如,帧间、IBC、帧内)的预测样本。根据第二技术,视频译码器可应用上文描述用于将SAO及解块应用于IBC模式的预测样本的技术。除JCTVC-T0045中描述的技术以外还可应用此技术。在T0045中,禁用滤波用于可作为参考用于IBC的CTU。此可引入客观及主观质量降级。因此,本发明引入用于仅将滤波应用于IBC模式的预测样本的技术。
现将描述实例实施。本发明描述用于将SAO及解块应用于预测样本而非IBC模式的经重构建样本的技术。另外,如果CTU用作IBC的参考区域,那么可在位流中发信旗标,在此情况下,所述旗标切断用于彼CTU的回路内后处理(解块及SAO),因此避免额外存储。
当前设计:
最后重构建=滤波(预测+残余)
所提出设计:
用于IBC模式的最后重构建=滤波(预测)+残余。
用于非IBC模式的最后重构建=滤波(预测+残余)
其中,
滤波:表示程序SAO及解块中的任一者或两者
预测:表示未经滤波的预测样本。
作为如上文所描述将滤波应用于预测样本的一部分,视频解码器30可经配置以确定用于视频数据块的预测块,滤波所述预测块以产生经滤波预测块,及将残余数据添加到经滤波预测块以产生重构建的块。为滤波预测块,视频解码器30可执行SAO滤波、解块滤波或ALF滤波中的一或多者。视频解码器30可响应于正使用IBC模式译码视频数据块而滤波预测块以产生经滤波预测块。对于以除IBC模式以外的译码模式译码的第二视频数据块,视频解码器30可将残余数据添加到第二块的第二预测块以产生第二经重构建块并滤波所述第二经重构建块。
图3为说明可实施本发明中所描述的技术的实例视频编码器20的框图。视频编码器20可执行对视频切片内的视频块的帧内译码及帧间译码。帧内译码依赖于空间预测以减少或移除给定视频帧或图片内的视频中的空间冗余。帧间译码依赖于时间预测以减少或移除视频序列的相邻帧或图片内的视频中的时间冗余。帧内模式(I模式)可指代若干基于空间的压缩模式中的任一者。帧间模式(例如,单向预测(P模式)或双向预测(B模式))可指若干基于时间的压缩模式中的任一者。
在图3的实例中,视频编码器20包含视频数据存储器33、分割单元35、预测处理单元41、求和器50、变换处理单元52、量化单元54、熵编码单元56。预测处理单元41包含运动估计单元(MEU)42、运动补偿单元(MCU)44、帧内预测处理单元46及IBC单元48。尽管为了易于解释在图3中单独地展示,但应理解,MEU 42、MCU 44、帧内预测处理单元46及IBC单元48可实际上经高度集成。对于视频块重构建,视频编码器20还包含反量化单元58、反变换处理单元60、求和器62、滤波器单元64及经解码图片缓冲器(DPB)66。
如图3中所展示,视频编码器20接收视频数据并将所接收的视频数据存储于视频数据存储器33中。视频数据存储器33可存储待由视频编码器20的组件编码的视频数据。可例如从视频源18获得存储于视频数据存储器33中的视频数据。DPB 66可为存储参考视频数据以用于由视频编码器20编码视频数据(例如在帧内或帧间译码模式中)的参考图片存储器。视频数据存储器33及DPB 66可由例如动态随机存取存储器(DRAM)(包含同步DRAM(SDRAM))、磁阻式RAM(MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置的各种存储器装置中的任一者形成。视频数据存储器33及DPB 66可由同一存储器装置或单独存储器装置提供。在各种实例中,视频数据存储器33可与视频编码器20的其它组件在芯片上,或相对于所述组件在芯片外。
分割单元35从视频数据存储器33取得视频数据并结合预测处理单元41将视频数据分割成视频块。此分割还可包含分割成切片、图块或其它较大单元,以及例如根据LCU及CU的四分树结构的视频块分割。尽管出于实例的目的单独地展示,但分割单元35及预测处理单元41可高度集成,且分割单元35及预测处理单元41两者可执行确定如何分割视频的图片的程序的方面。视频编码器20大体上说明编码待编码视频切片内的视频块的组件。可将切片划分为多个视频块(且可能划分为被称作图块的视频块集合)。预测处理单元41可基于误差结果(例如,译码速率及失真度)选择用于当前视频块的多个可能译码模式中的一者,例如多个帧内译码模式中的一者或多个帧间译码模式中的一者。预测处理单元41可将所得经帧内或帧间译码块提供到求和器50以产生残余块数据并提供到求和器62以重构建经编码块以用作参考图片。
预测处理单元41内的帧内预测处理单元46可执行当前视频块相对于与待译码的当前块在相同帧或切片中的一或多个相邻块的帧内预测性译码,以提供空间压缩。预测处理单元41内的运动估计单元42及运动补偿单元44执行当前视频块相对于一或多个参考图片中的一或多个预测性块的帧间预测性译码,以提供时间压缩。由运动估计单元42执行的运动估计为产生运动向量的程序,所述运动向量估计视频块的运动。举例来说,运动向量可指示当前视频帧或图片内的视频块的PU相对于参考图片内的预测性块的位移。
预测性块为被发现就像素差来说紧密地匹配待译码的视频块的PU的块,所述像素差可由绝对差和(SAD)、平方差和(SSD)或其它差度量确定。在一些实例中,视频编码器20可计算存储于DPB 66中的参考图片的子整数像素位置的值。举例来说,视频编码器20可内插所述参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可执行关于全像素位置及分数像素位置的运动搜索且输出具有分数像素精确度的运动向量。
运动估计单元42通过比较PU的位置与参考图片的预测性块的位置而计算经帧间译码切片中的视频块的PU的运动向量。参考图片可选自第一参考图片列表(列表0)或第二参考图片列表(列表1),其中的每一者识别存储于DPB 66中的一或多个参考图片。运动估计单元42将所计算的运动向量发送到熵编码单元56及运动补偿单元44。
由运动补偿单元44执行的运动补偿可涉及基于通过运动估计确定的运动向量提取或产生预测性块,可能执行内插以达成子像素精确度。在接收到当前视频块的PU的运动向量之后,运动补偿单元44可在参考图片列表中的一者中定位运动向量所指向的预测性块。视频编码器20通过从正被译码的当前视频块的像素值减去预测性块的像素值来形成残余视频块,从而形成像素差值。像素差值形成用于块的残余数据,且可包含明度及色度差分量两者。求和器50表示执行此减法运算的一或多个组件。运动补偿单元44还可产生与视频块及视频切片相关联的语法元素以供视频解码器30在解码视频切片的视频块时使用。
在一些实例中,IBC单元48可以类似于上文关于运动估计单元42及运动补偿单元44描述的方式的方式产生二维向量且提取预测性块,但其中预测性块与当前块在同一图片或帧中。在其它实例中,IBC单元48可使用运动估计单元42及运动补偿单元44以完整或部分地执行根据本文中所描述的技术的IBC预测的此类功能。在任一情况下,对于IBC,预测性块可为被发现就像素差来说紧密地匹配待译码块的块,所述像素差可由SAD、SSD或其它差度量确定,且对块的识别可包含对子整数像素位置的值的计算。
在预测处理单元41经由帧内预测、帧间预测或IBC产生用于当前视频块的预测性块之后,视频编码器20通过从当前视频块减去预测性块而形成残余视频块。残余块中的残余视频数据可包含于一或多个TU中且被应用于变换处理单元52。变换处理单元52使用例如离散余弦变换(DCT)或概念上类似的变换的变换将残余视频数据变换成残余变换系数。变换处理单元52可将残余视频数据从像素域转换到变换域(例如,频域)。
变换处理单元52可将所得变换系数发送到量化单元54。量化单元54量化变换系数以进一步减少位速率。量化处理可减少与一些或所有系数相关联的位深度。可通过调整量化参数来修改量化程度。在一些实例中,量化单元54可接着执行对包含经量化变换系数的矩阵的扫描。替代性地,熵编码单元56可执行扫描。
在量化之后,熵编码单元56熵编码经量化变换系数。举例来说,熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进位算术译码(CABAC)、基于语法的上下文自适应二进位算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法或技术。在通过熵编码单元56的熵编码之后,经编码位流可被传输到视频解码器30,或经存档以供视频解码器30稍后传输或取得。熵编码单元56还可熵编码正被译码的当前视频切片的运动向量及其它语法元素。
反量化单元58及反变换处理单元60分别应用反量化及反变换以重构建像素域中的残余块以供稍后用作参考图片的参考块。运动补偿单元44可通过将残余块添加到参考图片列表中的一者内的参考图片中的一者的预测性块来计算参考块。运动补偿单元44还可将一或多个内插滤波器应用于经重构建残余块,以计算子整数像素值以用于运动估计。求和器62将经重构建残余块添加到由运动补偿单元44产生的经运动补偿预测块以产生经重构建块。
滤波器单元64对经重构建块(例如,求和器62的输出)进行滤波且将经滤波的经重构建块存储于DPB 66中用作参考块。参考块可由运动估计单元42及运动补偿单元44用作参考块以对后续视频帧或图片中的块进行帧间预测。滤波器单元64可应用解块滤波、样本自适应偏移(SAO)滤波、自适应回路滤波(ALF)或其它类型的回路滤波中的一或多者。滤波器单元64可应用解块滤波以过滤块边界以从经重构建视频移除块效应伪影,且可应用其它类型的滤波以改进总体译码质量。还可使用额外回路滤波器(回路内或回路后)。
视频编码器20表示可执行本发明的技术的视频编码器的一个但非唯一实例。视频编码器20(例如IBC单元48)可例如将视频数据的切片编码为I切片。视频编码器20可(例如)针对经译码视频序列执行若干译码遍次并确定将切片译码为I切片提供所需译码特性,例如所需速率失真折衷。对于切片,视频编码器20(例如IBC单元48及熵编码单元56)还可产生IBC语法元素以指示IBC模式经启用用于切片。对于切片,视频编码器20(例如IBC单元48)可使用IBC模式编码切片的至少一个块,且视频编码器20(例如帧内预测处理单元46)可使用帧内模式编码切片的至少一个块。视频编码器20(例如熵编码单元56)可包含SPS中的IBC语法元素。响应于确定用于视频数据的切片的参考图片列表中的参考图片的数目等于一个且响应于IBC模式经启用用于所述切片,视频编码器20(例如预测处理单元41)可禁用参考图片列表修改。作为禁用参考图片列表修改的部分,视频编码器20可使所述切片的参考图片列表修改信息不包含在经编码位流中。
图4为说明可实施本发明中所描述的技术的实例视频解码器30的框图。在图4的实例中,视频解码器30包含视频数据存储器78、熵解码单元80、预测处理单元81、反量化单元86、反变换处理单元88、求和器90、滤波器单元92及DPB 94。预测处理单元81包含运动补偿单元82、帧内预测处理单元84及IBC单元85。在一些实例中,视频解码器30可执行通常可逆于关于从图3的视频编码器20所描述的编码遍次的解码遍次。
在解码程序期间,视频解码器30从视频编码器20接收表示经编码视频切片的视频块及相关联的语法元素的经编码视频位流。视频解码器30将所接收的经编码视频位流存储于视频数据存储器78中。视频数据存储器78可存储待由视频解码器30的组件解码的视频数据,例如经编码视频位流。存储于视频数据存储器78中的视频数据可(例如)经由链路16从存储装置26或从本机视频源(例如摄影机)或通过存取物理数据存储媒体获得。视频数据存储器78可形成存储来自经编码视频位流的经编码视频数据的经译码图片缓冲器(CPB)。DPB94可为存储用于(例如)通过视频解码器30以帧内或帧间译码模式解码视频数据的参考视频数据的参考图片存储器。视频数据存储器78及DPB 94可由多种存储器装置中的任一者形成,所述存储器装置例如DRAM、SDRAM、MRAM、RRAM或其它类型的存储器装置。视频数据存储器78及DPB 94可由同一存储器装置或单独存储器装置提供。在各种实例中,视频数据存储器78可与视频解码器30的其它组件在芯片上,或相对于所述组件在芯片外。
视频解码器30的熵解码单元80熵解码存储于视频数据存储器78中的视频数据以产生经量化系数、运动向量及其它语法元素。熵解码单元80将运动向量及其它语法元素转递到预测处理单元81。视频解码器30可接收视频切片级及/或视频块级的语法元素。
当视频切片经译码为经帧内译码(I)切片时,预测处理单元81的帧内预测处理单元84可基于来自当前帧或图片的先前经解码块的所经发信帧内预测模式及数据来产生用于当前视频切片的视频块的预测数据。当视频帧经译码为经帧间译码时,预测处理单元81的运动补偿单元82基于运动向量及从熵解码单元80接收的其它语法元素产生用于当前视频切片的视频块的预测性块。预测性块可从参考图片列表中的一者内的参考图片中的一者产生。视频解码器30可基于存储于DPB 94中的参考图片使用默认构建技术来构建参考帧列表,列表0及列表1。
运动补偿单元82及/或IBC单元85通过解析运动向量及其它语法元素确定用于当前视频切片的视频块的预测信息,并使用预测信息产生用于正被解码的当前视频块的预测性块。举例来说,运动补偿单元82使用所接收的语法元素中的一些语法元素确定用以译码视频切片的视频块的预测模式(例如,帧内或帧间预测或IBC)、用于切片的参考图片列表中的一或多者的构建信息、用于切片的每一经帧间编码视频块的运动向量、用于切片的每一经帧间译码视频块的帧间预测状态,以及用以解码当前视频切片中的视频块的其它信息。
运动补偿单元82及/或IBC单元85还可基于内插滤波器执行内插。运动补偿单元82及/或IBC单元85可使用如由视频编码器20在视频块的编码期间使用的内插滤波器,计算参考块的子整数像素的内插值。在此情况下,运动补偿单元82及/或IBC单元85可从所接收的语法元素确定由视频编码器20使用的内插滤波器,并使用所述内插滤波器以产生预测性块。
反量化单元86反量化(即,解量化)位流中所提供并由熵解码单元80解码的经量化变换系数。反量化程序可包含使用由视频编码器20针对视频切片中的每一视频块计算的量化参数,以确定量化程度及同样地应被应用的反量化程度。反变换处理单元88将反变换(例如,反DCT、反整数变换或概念上类似的反变换程序)应用于变换系数以便在像素域中产生残余块。
在预测处理单元使用例如帧内或帧间预测产生当前视频块的预测性块后,视频解码器30通过将来自反变换处理单元88的残余块与由运动补偿单元82产生的对应预测性块求和而形成经重构建的视频块。求和器90表示执行此求和运算的所述一或多个组件。滤波器单元92使用(例如)解块滤波、SAO滤波、ALF滤波或其它类型的滤波中的一或多者对经重构建视频块进行滤波。还可使用其它回路滤波器(在译码回路中抑或在译码回路之后)以使像素转变平滑,或以其它方式改进视频质量。给定帧或图片中的经解码视频块接着存储于DPB 94中,所述DPB存储用于后续运动补偿的参考图片。DPB 94可为额外存储器的部分或与其分离,所述额外存储器存储用于稍后呈现于显示装置(例如图1的显示装置32)上的经解码视频。
视频解码器30表示可执行本发明的技术的视频解码器的一个但非唯一实例。视频解码器30(例如视频数据存储器78及熵解码单元80)可接收视频数据的切片。视频解码器30(例如熵解码单元80及预测处理单元81)可解析IBC语法元素以确定IBC模式经启用用于所述切片。视频解码器30(例如熵解码单元80及预测处理单元81)可解析与所述切片相关联的切片类型语法元素以确定所述切片为I切片。视频解码器30(例如,帧内预测处理单元84及IBC单元85)可将切片解码为I切片。为将切片解码为I切片,视频解码器30可仅使用帧内预测且不使用帧间预测模式或IBC模式来解码切片的块。视频解码器30(例如熵解码单元80)可接收SPS中的IBC语法元素。为执行用于切片的至少一个块的IBC,视频解码器30(例如IBC单元85)可使用包括所述切片的当前图片作为参考图片。
视频解码器30(例如预测处理单元及DPB 94)可例如构建用于视频数据的切片的参考图片列表。包含于参考图片列表中的图片的数目可取决于正被启用的IBC。视频解码器30(例如预测处理单元81)可构建用于视频数据的切片的参考图片列表。响应于IBC模式经启用,视频解码器30(例如预测处理单元及DPB 94)可将含有切片的图片添加到参考图片列表。
视频解码器30(例如熵解码单元80及预测处理单元81)可接收指示用于视频数据的切片的参考图片列表中的参考图片的数目的语法元素。响应于语法元素指示用于视频数据的切片的参考图片列表中的参考图片的数目等于一个且响应于IBC模式经启用用于所述切片,视频解码器30(例如预测处理单元及DPB 94)可构建用于视频数据的切片的参考图片列表,所述视频数据包含作为参考图片列表中的第一条目的包括所述切片的当前图片。
视频解码器30(例如熵解码单元80及预测处理单元81)可接收指示用于视频数据的切片的参考图片列表中的参考图片的数目的语法元素。响应于语法元素指示用于视频数据的切片的参考图片列表中的参考图片的数目等于一个且响应于IBC模式经启用用于所述切片,视频解码器30(例如预测处理单元81)可禁用参考图片列表修改。作为禁用参考图片列表修改的部分,视频解码器30(例如预测处理单元81)可构建参考图片列表而不需接收参考图片列表修改信息。
图5为展示根据本发明的技术的编码视频数据的方法的流程图。将参考一般性视频编码器描述图5。在图5的实例中,视频编码器将视频数据的切片编码为I切片(150)。对于所述切片,视频编码器还产生IBC语法元素以指示IBC模式经启用用于所述切片(152)。对于所述切片,视频编码器可使用IBC模式编码所述切片的至少一个块且还可使用帧内模式编码所述切片的至少一个块。视频编码器可产生IBC语法元素以用于包含于与所述切片相关联的SPS中。响应于确定用于视频数据的切片的参考图片列表中的参考图片的数目等于一个且响应于IBC模式经启用用于所述切片,视频编码器可禁用参考图片列表修改。作为禁用参考图片列表修改的部分,视频编码器可使所述切片的参考图片列表修改信息不包含在经编码位流中。
图6为展示根据本发明的技术的编码视频数据的方法的流程图。将参考一般性视频解码器描述图6。一般性视频解码器可例如对应于视频解码器30,但本发明的技术不限于任何特定类型的视频解码器。视频解码器接收视频数据的切片(160)。视频解码器解析IBC语法元素以确定IBC模式经启用用于所述切片(162)。视频解码器解析与切片相关联的切片类型语法元素以确定切片为I切片(164)。视频解码器将切片解码为I切片(166)。为将切片解码为I切片,视频解码器可例如使用帧内预测译码模式解码切片的所有块。视频解码器可接收SPS中的IBC语法元素。为将切片解码为I切片,视频解码器仅使用帧内预测解码切片的块。换句话说,为将切片解码为I切片,视频解码器在不使用帧间预测模式且不使用IBC模式的情况下解码切片的块。
IBC语法元素可例如为上文所描述的curr_pic_as_ref_enabled_flag,且为了解析IBC语法元素以确定IBC模式经启用用于切片,视频解码器可确定curr_pic_as_ref_enabled_flag的值等于1。切片类型语法元素可例如为上文所描述的slice_type语法元素,且为了解析与切片相关联的切片类型语法元素以确定切片为I切片,视频解码器可确定slice_type语法元素的值等于2。
根据图6的实例,视频解码器还可接收视频数据的第二切片,接收指示用于视频数据的第二切片的参考图片列表中的参考图片的数目的语法元素,并响应于语法元素指示用于视频数据的第二切片的参考图片列表中的参考图片的数目等于一个且响应于IBC模式经启用用于所述第二切片,视频解码器可构建用于包含包括所述第二切片的当前图片的视频数据的所述切片的参考图片列表。在另一实例中,视频解码器可接收视频数据的第二切片,构建用于视频数据的第二切片的参考图片列表,并响应于IBC模式经启用,将含有第二切片的图片添加到参考图片列表。
图7为展示根据本发明的技术的编码视频数据的方法的流程图。将参考一般性视频解码器描述图7。图7的技术可结合图6的技术使用或可独立地使用。一般性视频解码器可例如对应于视频解码器30,但本发明的技术不限于任何特定类型的视频解码器。视频解码器接收视频数据的切片(170)。视频解码器接收指示用于视频数据的切片的参考图片列表中的参考图片的数目的语法元素(172)。响应于语法元素指示用于视频数据的切片的参考图片列表中的参考图片的数目等于一个且响应于IBC模式经启用用于第二切片,视频解码器禁用用于所述第二切片的参考图片列表的参考图片列表修改(174)。为禁用参考图片列表修改,视频解码器可例如在不接收参考图片列表修改信息的情况下构建参考图片列表,并将包括所述切片的当前图片添加于参考图片列表中作为第一条目。
在一或多个实例中,所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件实施,那么所述功能可作为一或多个指令或代码而在计算机可读媒体上存储或传输,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,其对应于有形媒体(例如数据存储媒体),或包含有助于将计算机程序从一处传送到另一处(例如,根据通信协议)的任何媒体的通信媒体。以此方式,计算机可读媒体通常可对应于(1)为非暂时性的有形计算机可读存储媒体,或(2)通信媒体,例如信号或载波。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以取得用于实施本发明中所描述的技术的指令、代码及/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
通过实例而非限制,这些计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储器、磁盘存储器或其它磁性存储装置、闪存存储器或可用于存储呈指令或数据结构形式的所要程序码且可由计算机存取的任何其它媒体。另外,任何连接被恰当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光缆、双绞线、数字用户线(DSL)或无线技术(例如红外线、无线电及微波)从网站、服务器或其它远程源传输指令,那么所述同轴电缆、光缆、双绞线、DSL或无线技术(例如红外线、无线电及微波)包含于媒体的定义中。然而,应理解,计算机可读存储媒体及数据存储媒体不包含连接、载波、信号或其它暂时性媒体,而是实际上针对非暂时性有形存储媒体。如本文中所使用,磁盘及光盘包含光盘(CD)、激光光盘、光学光盘、数字影音光盘(DVD)、软性磁盘及蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘使用激光以光学方式再现数据。以上的组合也应包含于计算机可读媒体的范围内。
指令可由一或多个处理器执行,包含固定功能及/或可程序化处理电路,例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可提供于经配置用于编码及解码的专用硬件及/或软件模块内,或并入于组合式编码解码器中。此外,所述技术可完全实施于一或多个电路或逻辑元件中。
本发明的技术可以多种装置或设备实施,所述装置或设备包含无线手机、集成电路(IC)或IC集合(例如,芯片集)。本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但未必要求由不同硬件单元来实现。确切来说,如上文所描述,可将各种单元组合于编码解码器硬件单元中,或通过互操作性硬件单元(包含如上文所描述的一或多个处理器)的集合结合合适的软件及/或固件来提供所述单元。
已描述各种实例。这些及其它实例在所附权利要求书的范围内。

Claims (30)

1.一种用于解码视频数据的方法,所述方法包括:
接收所述视频数据的切片;
解析帧内块复制IBC语法元素以确定IBC模式经启用用于所述切片;
解析与所述切片相关联的切片类型语法元素以确定所述切片为I切片;以及
将所述切片解码为I切片,其中将所述切片解码为I切片包括使用至少一个帧内预测译码模式解码所述切片的所有块。
2.根据权利要求1所述的方法,其进一步包括:
接收在序列参数集SPS中的所述IBC语法元素。
3.根据权利要求1所述的方法,其中将所述切片解码为I切片包括仅使用帧内预测解码所述切片的块。
4.根据权利要求1所述的方法,其中将所述切片解码为I切片包括在不使用帧间预测模式且不使用所述IBC模式的情况下解码所述切片的块。
5.根据权利要求1所述的方法,其中所述IBC语法元素包括curr_pic_as_ref_enabled_flag语法元素,且其中解析所述IBC语法元素以确定所述IBC模式经启用用于所述切片包括确定所述curr_pic_as_ref_enabled_flag语法元素的值等于1。
6.根据权利要求1所述的方法,其中所述切片类型语法元素包括slice_type语法元素,且其中解析与所述切片相关联的所述切片类型语法元素以确定所述切片为I切片包括确定所述slice_type语法元素的值等于2。
7.根据权利要求1所述的方法,其进一步包括:
接收所述视频数据的第二切片;
接收指示用于所述视频数据的所述第二切片的参考图片列表中的参考图片的数目的语法元素;
响应于所述语法元素指示用于所述视频数据的所述第二切片的所述参考图片列表中的参考图片的所述数目等于一个且响应于所述IBC模式经启用用于所述第二切片,禁用用于所述第二切片的所述参考图片列表的参考图片列表修改。
8.根据权利要求7所述的方法,其中禁用参考图片列表修改包括:
在不接收参考图片列表修改信息情况下构建所述参考图片列表;以及
将包括所述第二切片的当前图片添加于所述参考图片列表中作为第一条目。
9.根据权利要求1所述的方法,其进一步包括:
接收所述视频数据的第二切片;
接收指示用于所述视频数据的所述第二切片的参考图片列表中的参考图片的数目的语法元素;
响应于所述语法元素指示用于所述视频数据的所述第二切片的所述参考图片列表中的参考图片的所述数目等于一个且响应于所述IBC模式经启用用于所述第二切片,构建用于包含包括所述第二切片的当前图片的所述视频数据的所述切片的参考图片列表。
10.根据权利要求1所述的方法,其进一步包括:
接收所述视频数据的第二切片;
构建用于所述视频数据的所述第二切片的参考图片列表;以及
响应于IBC模式经启用,将含有所述第二切片的图片添加到所述参考图片列表。
11.一种用于解码视频数据的装置,所述装置包括:
存储器,其经配置以存储所述视频数据;以及
一或多个处理器,其经配置以:
接收所述视频数据的切片;
解析帧内块复制IBC语法元素以确定IBC模式经启用用于所述切片;
解析与所述切片相关联的切片类型语法元素以确定所述切片为I切片;以及
将所述切片解码为I切片,其中为将所述切片解码为I切片,所述一或多个处理器经配置以使用至少一个帧内预测译码模式解码所述切片的所有块。
12.根据权利要求11所述的装置,其中所述一或多个处理器经进一步配置以:
接收在序列参数集SPS中的所述IBC语法元素。
13.根据权利要求11所述的装置,其中为将所述切片解码为I切片,所述一或多个处理器经进一步配置以仅使用帧内预测解码所述切片的块。
14.根据权利要求11所述的装置,其中为将所述切片解码为I切片,所述一或多个处理器经进一步配置以在不使用帧间预测模式且不使用所述IBC模式的情况下解码所述切片的块。
15.根据权利要求11所述的装置,其中所述IBC语法元素包括curr_pic_as_ref_enabled_flag语法元素,且其中为解析所述IBC语法元素以确定所述IBC模式经启用用于所述切片,所述一或多个处理器经进一步配置以确定所述curr_pic_as_ref_enabled_flag语法元素的值等于1。
16.根据权利要求11所述的装置,其中所述切片类型语法元素包括slice_type语法元素,
且其中为解析与所述切片相关联的所述切片类型语法元素以确定所述切片为I切片,所述一或多个处理器经进一步配置以确定所述slice_type语法元素的值等于2。
17.根据权利要求11所述的装置,其中所述一或多个处理器经进一步配置以:
接收所述视频数据的第二切片;
接收指示用于所述视频数据的所述第二切片的参考图片列表中的参考图片的数目的语法元素;
响应于所述语法元素指示用于所述视频数据的所述第二切片的所述参考图片列表中的参考图片的所述数目等于一个且响应于所述IBC模式经启用用于所述第二切片,禁用用于所述第二切片的所述参考图片列表的参考图片列表修改。
18.根据权利要求17所述的装置,其中为禁用参考图片列表修改,所述一或多个处理器经进一步配置以:
在不接收参考图片列表修改信息的情况下构建所述参考图片列表;以及
将包括所述第二切片的当前图片添加于所述参考图片列表中作为第一条目。
19.根据权利要求11所述的装置,其中所述一或多个处理器经进一步配置以:
接收所述视频数据的第二切片;
接收指示用于所述视频数据的所述第二切片的参考图片列表中的参考图片的数目的语法元素;
响应于所述语法元素指示用于所述视频数据的所述第二切片的所述参考图片列表中的参考图片的所述数目等于一个且响应于所述IBC模式经启用用于所述第二切片,构建用于包含包括所述第二切片的当前图片的所述视频数据的所述切片的参考图片列表。
20.根据权利要求11所述的装置,其中所述一或多个处理器经进一步配置以:
接收所述视频数据的第二切片;
构建用于所述视频数据的所述第二切片的参考图片列表;以及
响应于IBC模式经启用,将含有所述第二切片的图片添加到所述参考图片列表。
21.根据权利要求11所述的装置,其中所述装置包括以下各者中的至少一者:
集成电路;
微处理器;或
无线通信装置,其包括经配置以接收经编码视频数据的接收器。
22.一种用于解码视频数据的装置,所述装置包括:
用于接收所述视频数据的切片的装置;
用于解析帧内块复制IBC语法元素以确定IBC模式经启用用于所述切片的装置;
用于解析与所述切片相关联的切片类型语法元素以确定所述切片为I切片的装置;以及
用于将所述切片解码为I切片的装置,其中用于将所述切片解码为I切片的所述装置包括用于使用至少一个帧内预测译码模式解码所述切片的所有块的装置。
23.根据权利要求22所述的装置,其中用于将所述切片解码为I切片的所述装置包括用于在不使用帧间预测模式且不使用所述IBC模式的情况下解码所述切片的块的装置。
24.根据权利要求22所述的装置,其中所述IBC语法元素包括curr_pic_as_ref_enabled_flag语法元素,且其中用于解析所述IBC语法元素以确定所述IBC模式经启用用于所述切片的所述装置包括用于确定所述curr_pic_as_ref_enabled_flag语法元素的值等于1的装置。
25.根据权利要求22所述的装置,其中所述切片类型语法元素包括slice_type语法元素,且其中用于解析与所述切片相关联的所述切片类型语法元素以确定所述切片为I切片的所述装置包括用于确定所述slice_type语法元素的值等于2的装置。
26.根据权利要求27的装置,其进一步包括:
用于接收所述视频数据的第二切片的装置;
用于接收指示用于所述视频数据的所述第二切片的参考图片列表中的参考图片的数目的语法元素的装置;
用于响应于所述语法元素指示用于所述视频数据的所述第二切片的所述参考图片列表中的参考图片的所述数目等于一个且响应于所述IBC模式经启用用于所述第二切片,构建用于包含包括所述第二切片的当前图片的所述视频数据的所述切片的参考图片列表的装置。
27.一种存储指令的计算机可读存储媒体,所述指令在由一或多个处理器执行时致使所述一或多个处理器:
接收所述视频数据的切片;
解析帧内块复制IBC语法元素以确定IBC模式经启用用于所述切片;
解析与所述切片相关联的切片类型语法元素以确定所述切片为I切片;以及
将所述切片解码为I切片,其中为将所述切片解码为I切片,所述一或多个处理器使用至少一个帧内预测译码模式解码所述切片的所有块。
28.根据权利要求27所述的计算机可读存储媒体,其中为将所述切片解码为I切片,所述指令致使所述一或多个处理器在不使用帧间预测模式且不使用所述IBC模式的情况下解码所述切片的块。
29.根据权利要求27所述的计算机可读存储媒体,其中所述IBC语法元素包括curr_pic_as_ref_enabled_flag语法元素,且其中为解析所述IBC语法元素以确定所述IBC模式经启用用于所述切片,所述指令致使所述一或多个处理器确定所述curr_pic_as_ref_enabled_flag语法元素的值等于1。
30.根据权利要求27所述的计算机可读存储媒体,其存储另外的指令,所述指令致使所述一或多个处理器:
接收所述视频数据的第二切片;
接收指示用于所述视频数据的所述第二切片的参考图片列表中的参考图片的数目的语法元素;以及
响应于所述语法元素指示用于所述视频数据的所述第二切片的所述参考图片列表中的参考图片的所述数目等于一个且响应于所述IBC模式经启用用于所述第二切片,构建用于包含包括所述第二切片的当前图片的所述视频数据的所述切片的参考图片列表。
CN201680029870.9A 2015-05-29 2016-05-20 用于解码视频数据的方法、装置和设备及存储媒体 Active CN107660341B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562168396P 2015-05-29 2015-05-29
US62/168,396 2015-05-29
US15/158,741 2016-05-19
US15/158,741 US10638140B2 (en) 2015-05-29 2016-05-19 Slice level intra block copy and other video coding improvements
PCT/US2016/033553 WO2016196043A1 (en) 2015-05-29 2016-05-20 Slice level intra block copy and other video coding improvements

Publications (2)

Publication Number Publication Date
CN107660341A true CN107660341A (zh) 2018-02-02
CN107660341B CN107660341B (zh) 2020-08-18

Family

ID=57397716

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680029870.9A Active CN107660341B (zh) 2015-05-29 2016-05-20 用于解码视频数据的方法、装置和设备及存储媒体

Country Status (20)

Country Link
US (1) US10638140B2 (zh)
EP (1) EP3304908B1 (zh)
JP (1) JP6716611B2 (zh)
KR (1) KR102310752B1 (zh)
CN (1) CN107660341B (zh)
AR (1) AR106864A1 (zh)
AU (1) AU2016270043A1 (zh)
BR (1) BR112017025634A2 (zh)
CA (1) CA2983886A1 (zh)
CL (1) CL2017002954A1 (zh)
CO (1) CO2017011983A2 (zh)
ES (1) ES2845673T3 (zh)
MX (1) MX2017014657A (zh)
PH (1) PH12017501987A1 (zh)
RU (1) RU2017140987A (zh)
SA (1) SA517390407B1 (zh)
SG (1) SG11201708683WA (zh)
TW (1) TWI705694B (zh)
WO (1) WO2016196043A1 (zh)
ZA (1) ZA201708069B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109743576A (zh) * 2018-12-28 2019-05-10 杭州海康威视数字技术股份有限公司 编码方法、解码方法及装置
WO2020038450A1 (zh) * 2018-08-23 2020-02-27 中兴通讯股份有限公司 带宽调整方法、装置、通信设备及计算机可读存储介质
CN112703734A (zh) * 2018-09-14 2021-04-23 Vid拓展公司 用于灵活网格区域的方法和装置
CN113170196A (zh) * 2018-10-08 2021-07-23 Sk电信有限公司 使用当前画面参考模式的预测方法及其图像解码装置
CN113348668A (zh) * 2019-01-15 2021-09-03 腾讯美国有限责任公司 在帧内块补偿中利用整数偏移进行块矢量预测的方法和装置
CN113366849A (zh) * 2019-02-01 2021-09-07 腾讯美国有限责任公司 视频编解码的方法和装置

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105659602B (zh) 2013-10-14 2019-10-08 微软技术许可有限责任公司 用于视频和图像编码的帧内块复制预测模式的编码器侧选项
RU2654129C2 (ru) 2013-10-14 2018-05-16 МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи Функциональные возможности режима внутреннего предсказания с блочным копированием для кодирования и декодирования видео и изображений
US10116933B2 (en) * 2013-10-14 2018-10-30 Mediatek Inc. Method of lossless mode signaling for video system with lossless and lossy coding
US10469863B2 (en) 2014-01-03 2019-11-05 Microsoft Technology Licensing, Llc Block vector prediction in video and image coding/decoding
US11284103B2 (en) 2014-01-17 2022-03-22 Microsoft Technology Licensing, Llc Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning
CN105493505B (zh) 2014-06-19 2019-08-06 微软技术许可有限责任公司 统一的帧内块复制和帧间预测模式
AU2014408228B2 (en) 2014-09-30 2019-09-19 Microsoft Technology Licensing, Llc Rules for intra-picture prediction modes when wavefront parallel processing is enabled
AU2016269362A1 (en) * 2015-05-28 2017-12-07 Hfi Innovation Inc. Method and apparatus for using a current picture as a reference picture
CN107925773B (zh) * 2015-06-11 2022-06-07 杜比实验室特许公司 使用自适应去块滤波编码和解码图像的方法及其装置
US10542258B2 (en) * 2016-01-25 2020-01-21 Google Llc Tile copying for video compression
FR3062010A1 (fr) 2017-07-05 2018-07-20 Orange Procedes et dispositifs de codage et de decodage d'un flux de donnees representatif d'une sequence d'images
FR3068558A1 (fr) 2017-07-05 2019-01-04 Orange Procede de codage et decodage d'images,dispositif de codage et decodage et programmes d'ordinateur correspondants
FR3068557A1 (fr) 2017-07-05 2019-01-04 Orange Procede de codage et decodage d'images,dispositif de codage et decodage et programmes d'ordinateur correspondants
GB2575121B (en) * 2018-06-29 2022-12-28 Imagination Tech Ltd Guaranteed data compression
US10798376B2 (en) * 2018-07-17 2020-10-06 Tencent America LLC Method and apparatus for video coding
BR112021002483A2 (pt) 2018-08-17 2021-07-27 Huawei Technologies Co., Ltd. gerenciamento de imagens de referência em codificação de vídeo
US10848782B2 (en) 2018-09-21 2020-11-24 Tencent America LLC Method and apparatus for video coding
JP7450611B2 (ja) * 2018-10-02 2024-03-15 インターデジタル ヴイシー ホールディングス, インコーポレイテッド 一般化された双予測および重み付き予測
WO2020076034A1 (ko) * 2018-10-08 2020-04-16 에스케이텔레콤 주식회사 현재 픽처 참조 모드를 이용한 예측 방법 및 영상 복호화 장치
WO2020086317A1 (en) * 2018-10-23 2020-04-30 Tencent America Llc. Method and apparatus for video coding
CN113170099B (zh) 2018-11-29 2024-03-29 北京字节跳动网络技术有限公司 块内拷贝模式和帧间预测工具之间的交互
BR112021010326A2 (pt) * 2018-11-30 2021-08-24 Sharp Kabushiki Kaisha Método de decodificar dados de vídeo, método de codificar dados de vídeo e dispositivo para decodificar dados de vídeo
US11240516B2 (en) 2019-03-20 2022-02-01 Tencent America LLC Coding mode signaling for small blocks
WO2020197264A1 (ko) * 2019-03-25 2020-10-01 엘지전자 주식회사 비디오 신호를 처리하기 위한 방법 및 장치
US11109041B2 (en) * 2019-05-16 2021-08-31 Tencent America LLC Method and apparatus for video coding
US11134275B2 (en) * 2019-06-04 2021-09-28 Tencent America LLC Method and apparatus for performing primary transform based on filtering of blocks
US11553197B2 (en) * 2019-08-05 2023-01-10 Tencent America LLC Method and apparatus for intra picture block compensation
WO2021047542A1 (en) * 2019-09-09 2021-03-18 Beijing Bytedance Network Technology Co., Ltd. Recursive splitting of video coding blocks
MX2022002916A (es) 2019-09-19 2022-04-06 Beijing Bytedance Network Tech Co Ltd Derivacion de posiciones de muestra de referencia en codificacion de video.
EP4018659A4 (en) 2019-09-19 2022-11-30 Beijing Bytedance Network Technology Co., Ltd. SCALE WINDOW IN VIDEO CODING
JP7391199B2 (ja) 2019-10-05 2023-12-04 北京字節跳動網絡技術有限公司 映像コーディングツールのレベルベースシグナリング
WO2021068956A1 (en) 2019-10-12 2021-04-15 Beijing Bytedance Network Technology Co., Ltd. Prediction type signaling in video coding
KR20220073740A (ko) 2019-10-13 2022-06-03 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 레퍼런스 픽처 리샘플링 및 비디오 코딩 툴 사이의 상호 작용
WO2021091252A1 (ko) * 2019-11-05 2021-05-14 엘지전자 주식회사 영상/비디오 코딩을 위한 영상 정보 처리 방법 및 장치
KR20220113379A (ko) 2019-12-27 2022-08-12 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 비디오 픽처 헤더의 슬라이스 유형의 시그널링
US11930208B2 (en) 2020-01-10 2024-03-12 Tencent America LLC Method and apparatus for signaling skip mode flag
US20230103405A1 (en) * 2021-10-04 2023-04-06 Tencent America LLC Method and apparatus for intra block copy prediction with sample padding

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103299621A (zh) * 2010-11-17 2013-09-11 高通股份有限公司 用于视频译码中的一般化p/b帧的参考图片列表构造
CN104539949A (zh) * 2014-12-12 2015-04-22 北方工业大学 Hevc屏幕编码中基于边缘方向的快速分块

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE602004031432D1 (de) 2003-08-29 2011-03-31 Quanta Services Houston Verfahren zum ziehen und spleissen von stromführenden leitern
EP1962513A1 (en) * 2007-02-26 2008-08-27 Vestel Elektronik Sanayi ve Ticaret A.S. Methods and apparatus for processing of a digital image
HRP20231180T1 (hr) 2011-06-30 2024-01-05 Microsoft Technology Licensing, Llc Smanjenje latencije u kodiranju i dekodiranju videozapisa
PT3576412T (pt) * 2011-11-08 2021-11-26 Nokia Technologies Oy Tratamento de gravuras de referência
US9503715B2 (en) 2013-08-30 2016-11-22 Qualcomm Incorporated Constrained intra prediction in video coding
KR20150026927A (ko) * 2013-09-03 2015-03-11 주식회사 케이티 스케일러블 비디오 신호 인코딩/디코딩 방법 및 장치
CN105493505B (zh) 2014-06-19 2019-08-06 微软技术许可有限责任公司 统一的帧内块复制和帧间预测模式
EP3198875B1 (en) * 2014-11-06 2021-04-21 MediaTek Inc. Method for palette predictor update

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103299621A (zh) * 2010-11-17 2013-09-11 高通股份有限公司 用于视频译码中的一般化p/b帧的参考图片列表构造
CN104539949A (zh) * 2014-12-12 2015-04-22 北方工业大学 Hevc屏幕编码中基于边缘方向的快速分块

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BIN LI: "Non-SCCE1: Unification of intra BC and inter modes", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11》 *
GARY J. SULLIVAN等: "Overview of the High Efficiency Video Coding (HEVC) Standard", 《IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020038450A1 (zh) * 2018-08-23 2020-02-27 中兴通讯股份有限公司 带宽调整方法、装置、通信设备及计算机可读存储介质
CN112703734A (zh) * 2018-09-14 2021-04-23 Vid拓展公司 用于灵活网格区域的方法和装置
US11838542B2 (en) 2018-10-08 2023-12-05 Sk Telecom Co., Ltd. Prediction method using current picture referencing mode, and video decoding device therefor
CN113170196A (zh) * 2018-10-08 2021-07-23 Sk电信有限公司 使用当前画面参考模式的预测方法及其图像解码装置
US11838545B2 (en) 2018-10-08 2023-12-05 Sk Telecom Co., Ltd. Prediction method using current picture referencing mode, and video decoding device therefor
US11838543B2 (en) 2018-10-08 2023-12-05 Sk Telecom Co., Ltd. Prediction method using current picture referencing mode, and video decoding device therefor
US11838544B2 (en) 2018-10-08 2023-12-05 Sk Telecom Co., Ltd. Prediction method using current picture referencing mode, and video decoding device therefor
CN109819264A (zh) * 2018-12-28 2019-05-28 杭州海康威视数字技术股份有限公司 编码方法、解码方法及装置
CN109743576A (zh) * 2018-12-28 2019-05-10 杭州海康威视数字技术股份有限公司 编码方法、解码方法及装置
CN113348668A (zh) * 2019-01-15 2021-09-03 腾讯美国有限责任公司 在帧内块补偿中利用整数偏移进行块矢量预测的方法和装置
CN113348668B (zh) * 2019-01-15 2024-06-07 腾讯美国有限责任公司 一种视频解码方法、装置及存储介质
CN113366849A (zh) * 2019-02-01 2021-09-07 腾讯美国有限责任公司 视频编解码的方法和装置
US11418777B2 (en) 2019-02-01 2022-08-16 Tencent America LLC Method and apparatus for video coding
CN113366849B (zh) * 2019-02-01 2022-08-26 腾讯美国有限责任公司 视频编解码的方法和装置

Also Published As

Publication number Publication date
US20160353117A1 (en) 2016-12-01
RU2017140987A (ru) 2019-07-02
WO2016196043A1 (en) 2016-12-08
PH12017501987A1 (en) 2018-03-26
AR106864A1 (es) 2018-02-28
JP2018520581A (ja) 2018-07-26
JP6716611B2 (ja) 2020-07-01
TW201711461A (zh) 2017-03-16
CO2017011983A2 (es) 2017-11-30
AU2016270043A1 (en) 2017-11-16
SG11201708683WA (en) 2017-12-28
MX2017014657A (es) 2018-01-24
CA2983886A1 (en) 2016-12-08
ES2845673T3 (es) 2021-07-27
BR112017025634A2 (pt) 2018-08-07
SA517390407B1 (ar) 2020-09-21
EP3304908B1 (en) 2020-10-28
KR102310752B1 (ko) 2021-10-07
US10638140B2 (en) 2020-04-28
EP3304908A1 (en) 2018-04-11
TWI705694B (zh) 2020-09-21
CL2017002954A1 (es) 2018-05-18
ZA201708069B (en) 2020-01-29
CN107660341B (zh) 2020-08-18
KR20180013918A (ko) 2018-02-07

Similar Documents

Publication Publication Date Title
CN107660341A (zh) 切片级帧内块复制及其它视频译码改进
CN106576171B (zh) 一种对视频数据进行编码、解码的方法以及装置
CN106797466B (zh) 一种处理视频数据的方法及装置
CN106464919B (zh) 用于编码和解码具有视频数据的多层位流的方法和装置
CN105493507B (zh) 用于帧内块复制的残余预测
CN105474645B (zh) 对视频数据进行解码的方法、对视频数据进行编码的方法、视频解码装置及视频编码装置
CN104205829B (zh) 合并信令及环路滤波器开/关信令
CN106105201B (zh) 使用像素距离的解块滤波
CN110169064A (zh) 具有减低复杂性的视频译码中的双边滤波器
CN110100439A (zh) 用于视频译码的帧内预测技术
CN109691102A (zh) 跨分量滤波器
CN107592972A (zh) 用于视频数据中特定图片内的帧间译码的搜索区域确定
CN104412599B (zh) 对视频译码发信长期参考图片
CN104429076B (zh) 用于可缩放视频译码和3d视频译码的一般化残差预测
CN107409218A (zh) 使用块分割的快速视频编码方法
JP2017535175A (ja) 並列処理のためのイントラブロックコピー予測制限
CN107211151A (zh) 用于视频译码的跨组件预测剪裁及自适应性色彩变换
CN106664425A (zh) 视频译码中的跨分量预测
CN105723707A (zh) 用于视频译码的色彩残差预测
CN106464904A (zh) 用于视频译码的帧内块复制块向量信令
CN105247867A (zh) 用于不同层间预测类型的参考图片的独立重新采样及选择
CN105284113A (zh) 分量间滤波
CN103563378A (zh) 存储器高效的上下文建模
CN105532007A (zh) 在视频译码中用于非亮度分量的自适应解块滤波
CN104641652A (zh) 用于视频译码的帧封装立体三维(3d)视频数据的指示

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1244135

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant