CN107113437A - 应用多偏移方案的视频编码方法和设备以及视频解码方法和设备 - Google Patents

应用多偏移方案的视频编码方法和设备以及视频解码方法和设备 Download PDF

Info

Publication number
CN107113437A
CN107113437A CN201580069778.0A CN201580069778A CN107113437A CN 107113437 A CN107113437 A CN 107113437A CN 201580069778 A CN201580069778 A CN 201580069778A CN 107113437 A CN107113437 A CN 107113437A
Authority
CN
China
Prior art keywords
offset
current block
current
skew
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201580069778.0A
Other languages
English (en)
Inventor
崔棋镐
亚力山大·阿尔申
埃琳娜·阿尔申纳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN107113437A publication Critical patent/CN107113437A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/439Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using cascaded computational arrangements for performing a single operation, e.g. filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

公开了一种视频解码方法,包括:当第一偏移方法应用于包括当前块的当前条带时,将基于当前块的第一偏移参数的偏移施加至当前块;当第一偏移方法应用于当前条带时,确定是否将第二偏移方法应用于当前条带;当第二偏移方法应用于当前条带时,确定当前块的第二偏移参数;以及将基于第二偏移参数的偏移施加至施加了基于第一偏移参数的偏移的当前块,其中,第一偏移参数和第二偏移参数包括当前块的偏移值。

Description

应用多偏移方案的视频编码方法和设备以及视频解码方法和 设备
技术领域
本公开涉及应用多偏移方法的视频编码方法和设备以及视频解码方法和设备。
背景技术
随着开发和供应用于播放和存储高分辨率或高质量视频内容的硬件,针对用于将高分辨率或高质量视频内容有效编码或解码的视频编解码器的需求逐渐增长。在传统的视频编解码器中,基于具有预定尺寸的编码单元来根据有限编码方法对视频进行编码。
经由频率转换将空间域的图像数据转换成频域的系数。在视频编解码器中,将图像分割成具有预定尺寸的块,在每个块上执行离散余弦变换(DCT),并且以块为单位对频率系数进行编码,从而快速计算频率转换。与空间域的图像数据相比,频域的系数容易压缩。具体而言,由于根据视频编解码器的帧间预测或帧内预测的预测误差来表达空间域的图像像素值,因此,当在预测误差上执行频率转换时,可以将大量的数据转换成0。通过使用视频编解码器,可以通过用小尺寸的数据替换连续重复生成的数据来减少数据量。
具体而言,可以应用将与自适应确定的偏移对应的重建像素值应用于样本的方法,从而结合视频编码和解码操作将原始图像与重建图像之间的误差最小化。
发明内容
技术问题
公开了应用多偏移方法以改善重建图像的质量的视频编码方法和设备以及视频解码方法和设备。通过使用多偏移方法可以去除在重建图像中发生的各个方向上的边缘振荡效应(Ringing Artifact),并且可以减小当应用单偏移方法时可增大的重建图像的误差。
显然,本公开的技术问题不限于此,并且从以下描述中,本领域普通技术人员将明白其他技术问题。
视频解码方法包括:当第一偏移方法应用于包括当前块的当前条带时,将基于当前块的第一偏移参数的偏移施加至当前块;当第一偏移方法应用于当前条带时,确定是否将第二偏移方法应用于当前条带;当第二偏移方法应用于当前条带时,确定当前块的第二偏移参数;以及将基于第二偏移参数的偏移施加至施加了基于第一偏移参数的偏移的当前块,其中,第一偏移参数和第二偏移参数包括当前块的偏移值。
附图说明
图1A和图1B分别是根据本公开的实施方式的视频编码设备的框图和应用多偏移方法的视频编码方法的流程图。
图2A和图2B分别是根据本公开的实施方式的视频解码设备的框图和应用多偏移方法的视频解码方法的流程图。
图3是根据本公开的另一实施方式的视频解码设备的框图。
图4A到图4C是用于说明根据本公开的实施方式的边缘类型样本自适应偏移(SAO)技术的示意图。
图5是用于描述根据本公开的实施方式的带类型SAO技术的示意图。
图6A和图6B是用于说明根据本公开的实施方式的应用多偏移方法的方法的示意图。
图7是示出根据本公开的各种实施方式的与条带的多偏移方法有关的多项使用信息的句构元素的表。
图8A到图8C是示出根据本公开的各种实施方式的当前块的句构元素的表。
图9是示出根据本公开的实施方式的表明当前块的偏移类型的多项信息的句构元素的表。
图10A和图10B是示出根据本公开的各种实施方式的表明当前块的多偏移方法的偏移分类的多项信息的句构元素的表。
图11是用于说明根据本公开的实施方式的使用合并模式来应用多偏移方法的方法的表。
图12是根据本公开的实施方式的基于具有树形结构的编码单元的视频编码设备的框图。
图13是根据本公开的实施方式的基于具有树形结构的编码单元的视频解码设备的框图。
图14是用于描述根据本公开的实施方式的编码单元的概念的示意图。
图15是根据本公开的实施方式的基于编码单元的图像编码器的框图。
图16是根据本公开的实施方式的基于编码单元的图像解码器的框图。
图17是示出根据本公开的实施方式的根据深度的编码单元和分区的示意图。
图18是用于描述根据本公开的实施方式的编码单元与变换单元之间的关系的示意图。
图19示出根据本公开的实施方式的多项编码信息。
图20是根据本公开的实施方式的根据深度的较深编码单元的示意图。
图21、图22和图23是用于描述根据本公开的实施方式的编码单元、预测单元与变换单元之间的关系的示意图。
图24是用于描述根据表1的编码模式信息的编码单元、预测单元与变换单元之间的关系的示意图。
图25是根据实施方式的存储有程序的盘片的物理结构的示意图。
图26是用于通过使用盘片来记录和读取程序的盘片驱动器的示意图。
图27是用于提供内容分发服务的内容供应***的整体结构的示意图。
图28和图29示出根据实施方式的应用本公开的视频编码方法和视频解码方法的移动电话的外部结构和内部结构。
图30示出根据实施方式的采用通信***的数字广播***。
图31是示出根据实施方式的使用视频编码设备和视频解码设备的云计算***的网络结构的示意图。
实施本发明的最佳方式
根据本公开的一方面,视频解码方法包括:当第一偏移方法应用于包括当前块的当前条带时,将基于当前块的第一偏移参数的偏移施加至当前块;当第一偏移方法应用于当前条带时,确定是否将第二偏移方法应用于当前条带;当第二偏移方法应用于当前条带时,确定当前块的第二偏移参数;以及将基于第二偏移参数的偏移施加至施加了基于第一偏移参数的偏移的当前块,其中,第一偏移参数和第二偏移参数包括当前块的偏移值。
确定是否将第二偏移方法应用于当前条带包括:基于从比特流中获取的与当前条带有关的第二偏移使用信息来确定是否将第二偏移方法应用于当前条带。
确定是否将第二偏移方法应用于当前条带包括:通过与是否将第一偏移方法应用于当前条带的相同方式来确定是否将第二偏移方法应用于当前条带。
当前块的第一偏移参数和当前块的第二偏移参数包括与当前块有关的偏移使用信息、偏移类型、偏移分类和偏移值中的至少一项。
确定当前块的第二偏移参数包括:基于当前块的第一偏移参数来确定当前块的第二偏移参数。
视频解码方法还包括:通过从比特流中获取与当前块有关的第一偏移使用信息来确定是否将第一偏移方法应用于当前块。
确定当前块的第二偏移参数包括:在与当前块有关的第一偏移使用信息表明第一偏移方法应用于当前块时,从比特流中获取与当前块有关的第二偏移使用信息。
当前块的第二偏移方法的偏移类型确定为与当前块的第一偏移方法的偏移类型不同。
当前块的第一偏移参数和当前块的第二偏移参数包括同时表明当前块的偏移类型和偏移分类的信息。
视频解码方法还包括:获取第一偏移合并信息和第二偏移合并信息,第一偏移合并信息和第二偏移合并信息分别表明是否使用当前块的相邻块的第一偏移参数和第二偏移参数来确定当前块的第一偏移参数和第二偏移参数;根据第一偏移合并信息,基于相邻块的第一偏移参数来确定当前块的第一偏移参数;以及根据第二偏移合并信息,基于相邻块的第二偏移参数来确定当前块的第二偏移参数。
根据本公开的另一方面,视频编码方法包括:当第一偏移方法应用于包括当前块的当前条带时,将基于当前块的第一偏移参数的偏移施加至当前块;当第一偏移方法应用于当前条带时,确定是否将第二偏移方法应用于当前条带;当第二偏移方法应用于当前条带时,确定当前块的第二偏移参数;以及生成比特流,比特流包括:表明是否将第一偏移方法应用于当前条带的第一偏移使用信息;表明是否将第二偏移方法应用于当前条带的第二偏移使用信息;以及第一偏移参数和第二偏移参数,其中,第一偏移参数和第二偏移参数包括当前块的偏移值。
确定是否将第二偏移方法应用于当前条带包括:基于是否将第二偏移方法应用于当前条带的先前条带中包括的块来确定是否将第二偏移方法应用于当前条带。
确定是否将第二偏移方法应用于当前条带包括:通过与是否将第一偏移方法应用于当前条带的相同方式来确定是否将第二偏移方法应用于当前条带。
当前块的第一偏移参数和当前块的第二偏移参数包括与当前块有关的偏移使用信息、偏移类型、偏移分类和偏移值中的至少一项。
确定当前块的第二偏移参数包括:基于当前块的第一偏移参数来确定当前块的第二偏移参数。
确定当前块的第二偏移参数包括:当第二偏移方法应用于当前条带时,确定与当前块有关的第二偏移使用信息。
确定当前块的第二偏移参数包括:当第一偏移方法应用于当前块时,确定与当前块有关的第二偏移使用信息。
当前块的第二偏移方法的偏移类型确定为与当前块的第一偏移方法的偏移类型不同。
当前块的第一偏移参数和当前块的第二偏移参数包括同时表明当前块的偏移类型和偏移分类的信息。
根据本公开的另一方面,视频解码设备包括:第一偏移方法解码器,第一偏移方法解码器配置成:当第一偏移方法应用于包括当前块的当前条带时,将基于当前块的第一偏移参数的偏移施加至当前块;以及第二偏移方法解码器,第二偏移方法解码器配置成:当第一偏移方法应用于当前条带时,确定是否将第二偏移方法应用于当前条带;当第二偏移方法应用于当前条带时,确定当前块的第二偏移参数;以及将基于第二偏移参数的偏移施加至施加了基于第一偏移参数的偏移的当前块,其中,第一偏移参数和第二偏移参数包括当前块的偏移值。
根据本公开的另一方面,视频编码设备包括:第一偏移方法编码器,第一偏移方法编码器配置成:当第一偏移方法应用于包括当前块的当前条带时,将基于当前块的第一偏移参数的偏移施加至当前块;第二偏移方法编码器,第二偏移方法编码器配置成:当第一偏移方法应用于当前条带时,确定是否将第二偏移方法应用于当前条带;以及当第二偏移方法应用于当前条带时,确定当前块的第二偏移参数;以及比特流生成器,比特流生成器配置成生成比特流,比特流包括:表明是否将第一偏移方法应用于当前条带的第一偏移使用信息;表明是否将第二偏移方法应用于当前条带的第二偏移使用信息;以及第一偏移参数和第二偏移参数,其中,第一偏移参数和第二偏移参数包括当前块的偏移值。
具体实施方式
在下文中,详细描述制造和使用本公开的方法。本说明书中描述的术语“单元”、“模块”等是指处理至少一个功能或操作的单元,并且可以在硬件或软件中实施或者可以在硬件和软件的组合中实施。
本发明的原理的“实施方式(an embodiment/embodiments)”并不是指本说明书中的本公开的原理的至少一个实施方式中包括的实施方式所描述的具体特征、结构、特性等。因此,在本说明书的各个地方出现的术语“在一个实施方式中”或“在实施方式中”未必表明所有相同的实施方式。
首先,参考图1到图11公开根据实施方式的应用多偏移方法的视频编码方法和视频解码方法。提供通过应用多样本自适应偏移(SAO)来对预测误差进行编码的可伸缩视频编码方法和设备的各种实施方式。此外,参考图12到图31公开根据各种实施方式的基于具有树形结构的编码单元的根据视频编码方法和视频解码方法中的像素分类来使用多偏移方法的实施方式。
在下文中,“图像”可以指代视频的移动图像或静态图像,或者视频本身。
在下文中,“样本”指的是分配到图像的采样位置并且将进行处理的数据。例如,空间域的图像中的块的像素值或残差可以是样本。
在下文中,“当前块”可以指的是将被编码或解码的图像的块。
首先,参考图1A到图10公开应用多偏移方法的视频编码方法和视频解码方法。
参考图1A和图2A,在视频编码设备10与视频解码设备20之间样本被信号化。换言之,视频编码设备10可以对视频样本进行编码并且可以将视频样本作为比特流的类型进行传输,并且视频解码设备20可以从接收的比特流中解析并重建视频样本。
根据实施方式的视频编码设备10和视频解码设备20将偏移参数信号化,以通过依据基于像素分类而确定的偏移调整重建的像素来最小化原始像素与重建的像素之间的误差。偏移值作为视频编码设备10与视频解码设备20之间的偏移参数进行编码、传输和接收,随后从偏移参数中解码。
因此,根据实施方式的视频解码设备20可以通过对接收的比特流进行解码来生成每个图像块的重建像素、可以依据从比特流中重建的偏移值来调整重建像素,因而可以从原始图像中生成具有最小化误差的重建图像。
就这点而言,根据实施方式的视频编码设备10和视频解码设备20可以将多偏移参数信号化,以应用多偏移方法。
在下文中,将参考图1A和图1B详细描述应用多偏移方法的视频编码设备10的操作,并且将参考图2A和图2B详细描述应用多偏移方法的视频解码设备20的操作。
图1A和图1B分别是根据本公开的实施方式的视频编码设备10的框图和应用多偏移方法的视频编码方法的流程图。
参考图1A,根据实施方式的视频编码设备10可以包括第一偏移方法编码器12、第二偏移方法编码器14和比特流生成器16。
根据实施方式的视频编码设备10接收视频的图像输入(例如,条带)、将每个图像分割成块、并且对每个块进行编码。块的形状可以是正方形或矩形,或者可以是任意几何形状。块并不限于具有统一尺寸的数据单元。根据实施方式的块可以是最大编码单元(LCU)或具有树形结构的编码单元之中的编码单元(CU)。下文将参考图12到图31描述基于具有树形结构的编码单元的视频编码和解码方法。
根据实施方式的视频编码设备10可以将每个输入图像分割成块(诸如,LCU),并且可以将通过在每个块的样本上执行预测、变换和熵编码而生成的所得数据作为比特流输出。块的样本可以是块中包括的像素的像素值数据。
根据实施方式的视频编码设备10可以对图片的块单独进行编码。例如,视频编码设备10可以基于从当前LCU中分割并且具有树形结构的编码单元对当前LCU进行编码。
为了对当前LCU进行编码,根据实施方式的视频编码设备10可以通过在当前LCU中包括的并且具有树形结构的编码单元中的每个编码单元上执行帧内预测、帧间预测、变换和量化来对样本进行编码。
接下来,根据实施方式的视频编码设备10可以通过在具有树形结构的编码单元中的每个编码单元上执行反量化、逆变换和帧间预测或运动补偿来重建当前LCU中包括的编码样本,从而对编码单元进行解码。
此外,根据实施方式的视频编码设备10可以执行去块化,从而相对于所重建的当前块的样本来减少块边界中的图像质量的降低,并且可以施加偏移,从而相对于执行了去块化的当前块来最小化原始像素与重建像素之间的误差。
就这点而言,根据实施方式的视频编码设备10可以应用多偏移方法,从而最小化原始像素和重建像素的各个方向上的误差和各种类型的误差,并且防止出现由施加偏移造成的误差。多偏移方法可以指的是通过使用不同的偏移参数对当前块的样本施加多次偏移。
例如,根据实施方式的视频编码设备10可以通过将基于第一偏移方法的偏移和基于第二偏移方法的偏移顺序施加至当前块来施加两次偏移。因此,在当前块的两个方向上出现误差时,根据实施方式的视频编码设备10可以最小化所有误差,并且可以基于第二偏移方法来解决通过施加基于第一偏移方法的偏移而可造成的误差。
此外,视频编码设备10(但不限于此)可以应用使用了三个或更多偏移方法的多偏移方法。
偏移参数可以包括与当前块有关的偏移使用信息、当前块的偏移类型、偏移分类和偏移值。例如,视频编码设备10可将基于第一偏移参数的偏移施加至重建的当前块,并且可以将基于第二偏移参数的偏移施加至施加过基于第一偏移参数的偏移的当前块。
具体而言,根据实施方式的第一偏移方法编码器12可以确定是否将第一偏移方法应用于包括所重建的当前块的当前图像,并且当第一偏移方法应用于当前图像时,可以确定第一偏移参数。例如,当前图像可以指的是视频的当前条带。
根据实施方式的第一偏移方法编码器12可以确定是否将第一偏移方法应用于当前条带的每个颜色分量。例如,第一偏移方法编码器12可以确定是否针对YCrCb彩色图像的亮度样本(Y分量)以及第一色度样本和第二色度样本(Cr和Cb分量)来应用第一偏移方法。
根据实施方式的第一偏移方法编码器12可以参考是否将第一偏移方法应用于当前条带的先前编码的条带来确定是否将第一偏移方法应用于当前条带。例如,当先前条带中包括的块之中的应用了第一偏移方法的块的比例大于预定值时,第一偏移方法编码器12可以确定第一偏移方法应用于当前条带。
第一偏移方法编码器12可以确定表明是否将第一偏移方法应用于当前条带的第一偏移使用信息。第一偏移使用信息可以被包括在条带标头中。
如果确定将第一偏移方法应用于当前条带,那么根据实施方式的第一偏移方法编码器12可以确定是否将第一偏移方法应用于当前条带的块之中的当前块。如果将第一偏移方法应用于当前块,那么第一偏移方法编码器12可以确定当前块的第一偏移参数。第一偏移参数可以包括与当前块有关的第一偏移使用信息、当前块的第一偏移类型、第一偏移分类和第一偏移值。
同时,如果确定第一偏移方法没有应用于当前条带,那么根据实施方式的第一偏移方法编码器12可以不确定当前块的第一偏移参数。
根据实施方式的第一偏移方法编码器12可以针对当前块的每个颜色分量来确定第一偏移参数。例如,第一偏移方法编码器12可以针对YCrCb彩色图像的亮度样本(Y分量)以及第一色度样本和第二色度样本(Cr和Cb分量)来确定第一偏移参数。
与当前块有关的第一偏移使用信息可以是表明是否将第一偏移方法应用于当前块的信息。换言之,如果确定第一偏移方法应用于当前条带,那么可以单独确定是否将第一偏移方法应用于当前条带中包括的块。
当前块的第一偏移类型可以包括边缘偏移(EO)、带偏移(BO)等。根据当前块的像素值的分类方法,可以确定是否适于根据EO或BO来将当前块的像素进行分类。
至于EO,根据实施方式的偏移分类可以表明在重建的像素与它们的相邻像素之间形成的边缘的方向。根据实施方式的边缘分类的偏移分类可以表明0°、90°、45°或135°的边缘方向。此外,至于BO,不同于EO的分类信息,可以对表明作为重建的像素的像素值所属的区段的带的信息进行编码。
当根据实施方式的第一偏移类型是EO时,可以根据重建的像素与它们的相邻像素之间形成的边缘的方向和形状来确定重建的像素与原始像素之间的偏移值。
此外,当根据实施方式的第一偏移类型是BO时,在通过划分当前块的重建像素的像素值的总范围而获取的多个带之中,可以确定属于每个带的重建像素与原始像素之间的偏移值。根据情况,可以通过均匀或不均匀地划分像素值的总范围来获取带。
因此,根据实施方式的第一偏移方法编码器12可以基于当前块的像素值的空间特性来确定表明EO或BO的当前块的第一偏移类型。
此外,根据实施方式的第一偏移方法编码器12可以根据当前块的第一偏移类型来确定重建的像素中的每个像素的第一偏移分类。在下文中,随后将参考图4和图5提供偏移参数的更详细描述。
根据实施方式的第一偏移方法编码器12可以根据编码效率和率失真(RD)代价来确定最合适的第一偏移参数。
此外,当确定第一偏移方法应用于当前块时,根据实施方式的第一偏移方法编码器12可以应用针对重建的当前块而确定的基于第一偏移参数的偏移。
同时,根据实施方式的第一偏移方法编码器12可以基于所确定的当前块的第一偏移参数与周边块的第一偏移参数之间的差异来确定是否使用周边块的第一偏移参数来确定当前块的第一偏移参数。是否使用周边块的第一偏移参数可以由第一偏移合并信息表示。
根据实施方式的周边块可以是与当前块相邻的左侧块或上部块。
根据实施方式的第二偏移方法编码器14可以确定应用了基于第一偏移参数的偏移的当前条带的第二偏移方法,并且可以在第二偏移方法应用于当前条带时确定第二偏移参数。
根据实施方式的第二偏移方法编码器14可以确定是否将第二偏移方法应用于当前条带的每个颜色分量。例如,第二偏移方法编码器14可以针对YCrCb彩色图像的亮度样本(Y分量)以及第一色度样本和第二色度样本(Cr和Cb分量)来确定第二偏移参数。
第二偏移方法编码器14可基于第一偏移方法是否应用于当前条带来确定是否将第二偏移方法应用于当前条带。
具体而言,当第一偏移方法没有应用于当前条带时,根据实施方式的第二偏移方法编码器14可以确定第二偏移方法不应用于当前条带。
此外,当第一偏移方法应用于当前条带时,根据实施方式的第二偏移方法编码器14可以参考是否将第二偏移方法应用于当前条带的先前编码条带来确定是否将第二偏移方法应用于当前条带。例如,在先前条带中包括的块之中的应用了第二偏移方法的块的比例大于预定值时,第二偏移方法编码器14可以确定将第二偏移方法应用于当前条带。在先前条带中包括的块之中的应用了第二偏移方法的块的比例小于预定值时,第二偏移方法编码器14可以确定不将第二偏移方法应用于当前条带。
或者,当第一偏移方法应用于当前条带时,第二偏移方法编码器14可以确定第二偏移方法应用于当前条带。
或者,根据实施方式的第二偏移方法编码器14可以确定是否将第二偏移方法应用于当前条带中包括的块,随后基于是否将第二偏移方法应用于当前条带中包括的块来确定是否将第二偏移方法应用于当前条带。例如,根据实施方式的第二偏移方法编码器14可以根据编码效率和率失真(RD)代价、基于当前条带中包括的块中的每个块的第二偏移参数来确定将第二偏移方法应用于当前条带是否合适,从而确定是否将第二偏移方法应用于当前条带。
根据实施方式的第二偏移方法编码器14可以确定与当前条带有关的、表明是否将第二偏移方法应用于当前条带的第二偏移使用信息。第二偏移使用信息可以被包括在条带标头中。
如果确定第二偏移方法应用于当前条带,那么根据实施方式的第二偏移方法编码器14可以确定用于应用第二偏移方法的当前块的第二偏移参数。第二偏移参数可以包括下列至少之一:与当前块有关的第二偏移使用信息、当前块的第二偏移类型、第二偏移分类和第二偏移值。如果确定第二偏移方法没有应用于当前条带,那么根据实施方式的第二偏移方法编码器14可以不确定当前块的第二偏移参数。
根据实施方式的第二偏移方法编码器14可以针对当前块的每个颜色分量来确定第二偏移参数。例如,第二偏移方法编码器14可以针对YCrCb彩色图像的亮度样本(Y分量)以及第一色度样本和第二色度样本(Cr和Cb分量)来确定第二偏移参数。
根据实施方式的第二偏移方法编码器14可以基于当前块的第一偏移参数来确定当前块的第二偏移参数。
具体而言,根据实施方式的第二偏移方法编码器14可以基于与当前块有关的第一偏移使用信息来确定与当前块有关的第二偏移使用信息。例如,当第一偏移使用信息表明第一偏移方法没有应用于当前块时,第二偏移方法编码器14可以不确定第二偏移使用信息,并且可以不将第二偏移方法应用于当前块。当第一偏移使用信息表明第一偏移方法应用于当前块时,第二偏移方法编码器14可以确定是否将第二偏移方法应用于当前块,并且可以确定第二偏移使用信息。
此外,根据实施方式的第二偏移方法编码器14可以基于当前块的第一偏移类型和第一偏移分类来确定当前块的第二偏移类型和第二偏移分类。
例如,根据实施方式的第二偏移方法编码器14可以不同地确定当前块的第二偏移类型和第一偏移类型。在当前块的第一偏移类型是带类型时,第二偏移方法编码器14可以将当前块的第二偏移类型确定为边缘类型。
或者,根据实施方式的第二偏移方法编码器14可以不同地确定当前块的第二偏移分类和第一偏移分类。在当前块的第一偏移类型是EO的0°时,第二偏移方法编码器14可以将当前块的第二偏移分类确定为90°、45°和135°中的一个。
根据实施方式的第二偏移方法编码器14可以根据编码效率和RD代价在除先前确定的第一偏移类型之外的偏移类型之中确定第二偏移类型。此外,根据实施方式的第二偏移方法编码器14可以根据编码效率和RD代价在除先前确定的第一偏移分类之外的偏移分类之中确定第二偏移分类。
同时,根据实施方式的第二偏移方法编码器14可以基于所确定的当前块的第二偏移参数与周边块的第二偏移参数之间的差异来确定是否使用周边块的第二偏移参数来确定当前块的第二偏移参数。是否使用周边块的第二偏移参数可以表示为第二偏移合并信息。
根据实施方式的周边块可以是与当前块相邻的左侧块或上部块。
根据实施方式的比特流生成器16可以对与当前条带有关的、表明是否将所确定的第一偏移方法应用于当前条带的第一偏移使用信息执行熵编码。
根据实施方式的与当前条带有关的第一偏移使用信息可以根据熵编码方法分类成将由基于上下文的熵编码进行编码的参数和在旁路模式下进行熵编码的参数。
基于上下文的熵编码方法可以包括一系列的操作,诸如,用于将诸如与当前条带有关的第一偏移使用信息等符号变换成比特流的二进制化,以及在比特流上执行基于上下文的算术编码。上下文自适应二进制编码(CABAC)广泛用作基于上下文的算术编码方法的示例。根据基于上下文的算术编码和解码,符号比特流的每个比特可以被视作上下文的二进数(bin),并且每个比特位置可以映射到二进数索引。比特流的长度(即,二进数的长度)可以根据符号值的尺寸而改变。针对基于上下文的算术编码和解码,需要对符号执行基于上下文的概率建模。
需要在下列假设下执行基于上下文的概率建模:当前符号的编码比特是基于先前编码的符号在概率上预测的。针对基于上下文的概率建模,需要新更新符号比特流的每个比特位置的上下文,即,每个二进数索引。此处,概率建模指的是分析每个二进数中生成0或1的概率的过程。通过将分析新块的符号的每个比特的概率的结果反映到上下文来更新上下文的过程可以在每个块中重复。如果上述概率建模重复,那么可以确定每个二进数与概率匹配的概率模型。
因此,参考基于上下文的概率模型,可以相对于当前符号的二进制化比特流的每个比特来执行选择和输出与当前上下文对应的代码的操作,从而执行基于上下文的熵编码。
针对符号的每个二进数确定基于上下文的概率模型从而基于上下文进行熵编码的操作需要大量的计算和时间。另一方面,旁路模式下的熵编码包括使用概率模型的熵编码操作,而不考虑符号的上下文。
此外,根据实施方式的比特流生成器16可以按照与对第一偏移使用信息执行熵编码相同的方式对与当前条带有关的第二偏移使用信息执行熵编码,第二偏移使用信息表明是否将所确定的第二偏移方法应用于当前条带。就这点而言,只有在第一偏移方法应用于当前条带时,比特流生成器16才可以对与当前条带有关的第二偏移使用信息执行熵编码。
根据实施方式的比特流生成器16可以对所确定的当前块的第一偏移参数和第二偏移参数执行熵编码。
根据实施方式的比特流生成器16可以对所确定的与当前块有关的第一偏移合并信息和第二偏移合并信息执行熵编码。
根据实施方式的比特流生成器16可以生成包括与执行熵编码有关的信息的比特流,并且将比特流传输到图2A的视频解码设备20。
参考图1B,在操作11中,根据实施方式的视频编码设备10可以确定是否将第一偏移方法应用于包括当前块的当前条带。
例如,根据实施方式的视频编码设备10可以参考是否将第一偏移方法应用于当前条带的先前编码的条带来确定是否将第一偏移方法应用于当前条带。例如,当先前条带中包括的块之中的应用了第一偏移方法的块的比例大于预定值时,视频编码设备10可以确定将第一偏移方法应用于当前条带。
如果确定第一偏移方法没有应用于当前条带,那么视频编码设备10可以不确定当前块的第一偏移参数。
如果确定第一偏移方法应用于当前条带,那么视频编码设备10可以确定当前块的第一偏移参数,并且将基于所确定的第一偏移方法的偏移应用于当前块。具体而言,视频编码设备10可以根据编码效率和RD代价来确定与当前块有关的表明是否将第一偏移方法应用于当前块的第一偏移使用信息、当前块的第一偏移类型、第一偏移分类和第一偏移值。
此外,当第一偏移类型是EO时,根据实施方式的视频编码设备10可以不确定第一偏移值的编码信息。将参考图4A和图4B详细描述第一偏移值的预测。
此外,根据实施方式的视频编码设备10可以基于所确定的当前块的第一偏移参数来确定与当前块有关的第一偏移合并信息。
在操作13中,当第一偏移方法应用于当前条带时,根据实施方式的视频编码设备10可以确定是否将第二偏移方法应用于当前条带。
根据实施方式的视频编码设备10可以基于是否将第一偏移方法应用于当前条带来确定是否将第二偏移方法应用于当前条带。
根据实施方式的视频编码设备10可以参考是否将第二偏移方法应用于当前条带的先前编码的条带来确定是否将第二偏移方法应用于当前条带。例如,当先前条带中包括的块之中的应用了第二偏移方法的块的比例大于预定值时,视频编码设备10可以确定将第二偏移方法应用于当前条带。当先前条带中包括的块之中的应用了第二偏移方法的块的比例小于预定值时,视频编码设备10可以确定不将第二偏移方法应用于当前条带。
或者,当第一偏移方法应用于当前条带时,根据实施方式的视频编码设备10可以确定将第二偏移方法应用于当前条带。
此外,当确定第一偏移方法没有应用于当前条带时,根据实施方式的视频编码设备10可以不确定是否将第二偏移方法应用于当前条带。
在操作15中,当第二偏移方法应用于当前条带时,根据实施方式的视频编码设备10可以确定当前块的第二偏移参数。根据实施方式的视频编码设备10可以确定下列至少之一:与当前块有关的表明是否将第二偏移方法应用于当前块的第二偏移使用信息、当前块的第二偏移类型、第二偏移分类和第二偏移值。
具体而言,根据实施方式的视频编码设备10可以基于当前块的第一偏移参数来确定当前块的第二偏移参数。
根据实施方式的视频编码设备10可以基于与当前块有关的第一偏移使用信息来确定与当前块有关的第二偏移使用信息。例如,当第一偏移使用信息表明第一偏移方法没有应用于当前块时,视频编码设备10可以不确定第二偏移使用信息,并且可以不将第二偏移方法应用于当前块。当第一偏移使用信息表明第一偏移方法应用于当前块时,视频编码设备10可以确定是否将第二偏移方法应用于当前块,并且可以确定第二偏移使用信息。
此外,根据实施方式的视频编码设备10可以基于当前块的第一偏移类型和第一偏移分类来确定当前块的第二偏移类型和第二偏移分类。
例如,根据实施方式的视频编码设备10可以不同地确定当前块的第二偏移类型和第一偏移类型。或者,根据实施方式的视频编码设备10可以不同地确定当前块的第二偏移分类和第一偏移分类。
换言之,根据实施方式的视频编码设备10可以根据编码效率和RD代价在除先前确定的第一偏移类型之外的偏移类型之中确定第二偏移类型。此外,视频编码设备10可以在除先前确定的第一偏移分类之外的偏移分类中确定第二偏移分类。
此外,在当前块的第二偏移类型是带类型时,根据实施方式的视频编码设备10还可以将表明第二偏移值是否为0的零值信息确定为第二偏移值,并且如果第二偏移值不是0,那么还可以将表明第一偏移值是正数还是负数的编码信息确定为第二偏移参数。如果第二偏移值是0,那么根据实施方式的视频编码设备10可以只将零值信息确定为第二偏移值。
此外,在当前块的第二偏移类型是边缘类型时,根据实施方式的视频编码设备10可以不必确定第二偏移值的编码信息。
此外,根据实施方式的视频编码设备10可以基于所确定的当前块的第二偏移参数来确定与当前块有关的第二偏移合并信息。
在操作17中,根据实施方式的视频编码设备10可以生成包括下列至少之一的比特流:与当前条带有关的表明是否将第一偏移方法应用于当前条带的第一偏移使用信息、与当前条带有关的表明是否将第二偏移方法应用于当前条带的第二偏移使用信息以及当前块的第一偏移参数和第二偏移参数。
根据实施方式的视频编码设备10可以包括用于共同控制第一偏移方法编码器12、第二偏移方法编码器14和比特流生成器16的中央处理器(未示出)。或者,第一偏移方法编码器12、第二偏移方法编码器14和比特流生成器16可以通过它们的单独处理器(未示出)驱动,所述单独处理器协作地操作以控制视频编码设备10。或者,视频编码设备10外部的外部处理器(未示出)可以控制第一偏移方法编码器12、第二偏移方法编码器14和比特流生成器16。
根据实施方式的视频编码设备10可以包括用于存储第一偏移方法编码器12、第二偏移方法编码器14和比特流生成器16的输入数据和输出数据的一个或多个数据存储设备(未示出)。视频编码设备10可以包括用于管理数据存储设备的数据输入和数据输出的存储器控制器(未示出)。
为了执行包括变换在内的视频编码操作并且为了输出视频编码操作的结果,视频编码设备10可以与内部或外部视频编码处理器协同操作。视频编码设备10的内部视频编码处理器可以是用于执行视频编码操作的独立处理器。此外,视频编码设备10、中央处理单元或图形处理单元可以包括用来执行基础视频编码操作的视频编码处理器模块。
图2A和图2B分别是根据本公开的实施方式的视频解码设备20的框图和应用多偏移方法的视频解码方法的流程图。
参考图2A,根据实施方式的视频解码设备20可以包括第一偏移方法解码器22和第二偏移方法解码器24。
根据实施方式的视频解码设备20可以接收比特流,所述比特流包括视频的编码数据。视频解码设备20可以对接收的比特流中的编码视频样本进行解析,并且可以对每个图像块执行熵解码、反量化、逆变换、预测和运动补偿,从而生成重建的像素,进而可以生成重建的图像。
此外,根据实施方式的视频解码设备20可以接收用于施加原始像素与重建的像素之间的差值的多偏移方法的偏移参数,并且可以最小化原始图像与重建的图像之间的误差。视频解码设备20可以接收视频的每个LCU的编码数据,并且可以基于从LCU中分割且具有树形结构的编码单元来重建LCU。
具体而言,根据实施方式的视频解码设备20可以从所接收的比特流的条带标头中解析出表明是否将多偏移方法应用于当前条带的信息。例如,视频解码设备20可以解析下列至少之一:与当前条带有关的第一偏移信息和与当前条带有关的第二偏移信息。根据实施方式的视频解码设备20可以针对当前条带的每个颜色分量来解析与当前条带有关的第一偏移信息和与当前条带有关的第二偏移信息。
此外,根据实施方式的视频解码设备20可以根据是否将多偏移方法应用于包括当前块的当前条带而从所接收的比特流的条带标头中解析出下列至少之一:当前块的第一偏移参数和当前块第二偏移参数。根据实施方式的视频解码设备20可以针对当前条带的每个颜色分量来解析与当前条带有关的第一偏移参数和第二偏移参数。
此外,根据实施方式的视频解码设备20可以解析与当前块有关的第一偏移合并信息和第二偏移合并信息,并且如果第一偏移合并信息表明周边块的第一偏移参数可用,则可以不解析当前块的第一偏移参数。如果第二偏移合并信息表明周边块的第二偏移参数可用,那么根据实施方式的视频解码设备20可以不解析当前块的第二偏移参数。
根据实施方式的视频解码设备20可以将根据第一偏移方法的偏移施加至所重建的当前块。第一偏移方法解码器22可以预先确定是否将根据第一偏移方法的偏移施加至所重建的当前块。
具体而言,根据实施方式的第一偏移方法解码器22可以基于从比特流中获取的与当前条带有关的第一偏移使用信息来确定是否将第一偏移方法应用于包括当前块的当前条带。
根据实施方式的第一偏移方法解码器22可以确定是否将第一偏移方法应用于当前条带的每个颜色分量。例如,第一偏移方法解码器22可以获取与当前条带有关的、针对YCrCb彩色图像的亮度样本(Y分量)以及第一色度样本和第二色度样本(Cr和Cb分量)的第一偏移使用信息,并且可以确定是否应用第一偏移方法。
如果确定第一偏移方法应用于包括当前块的当前条带,那么根据实施方式的第一偏移方法解码器22可以将从比特流中获取的当前块的基于第一偏移参数的偏移施加至所重建的当前块。根据实施方式的第一偏移方法解码器22可以获取当前块的第一偏移参数以用于当前块的每个颜色分量,并且可以将基于第一偏移参数的偏移施加至每个颜色分量。
此外,根据实施方式的第一偏移方法解码器22可以参考从比特流中获取的与当前块有关的第一合并信息,基于周边块的第一偏移参数来确定当前块的第一偏移参数。
根据实施方式的第二偏移方法解码器24可以将根据第二偏移方法的偏移施加至施加了根据第一偏移方法的偏移的当前块。第二偏移方法解码器24可以预先确定是否将根据第二偏移方法的偏移施加至当前块。
具体而言,根据实施方式的第二偏移方法解码器24可以基于从比特流中获取的与当前条带有关的第一偏移使用信息来确定是否将第二偏移方法应用于包括当前块的当前条带。
例如,在与当前条带有关的第一偏移使用信息表明第一偏移方法没有应用于当前条带时,根据实施方式的第二偏移方法解码器24可以不解析与当前条带有关的第二偏移使用信息,并且可以不将第二偏移方法应用于当前条带。
此外,在与当前条带有关的第一偏移使用信息表明将第一偏移方法应用于当前条带时,根据实施方式的第二偏移方法解码器24可以解析与当前条带有关的第二偏移使用信息,并且可以确定是否将第二偏移方法应用于当前条带。
或者,在与当前条带有关的第一偏移使用信息表明第一偏移方法应用于当前条带时,根据实施方式的第二偏移方法解码器24可以不解析与当前条带有关的第二偏移使用信息,并且可以将第二偏移方法应用于当前条带。
根据实施方式的第一偏移方法解码器22可以确定是否针对当前条带的每个颜色分量来应用第一偏移方法。例如,在与当前条带有关的第二偏移使用信息被解析时,第一偏移方法解码器22可以获取针对YCrCb彩色图像的亮度样本(Y分量)以及第一色度样本和第二色度样本(Cr和Cb分量)的与当前条带有关的第二偏移使用信息,并且可以确定是否应用第二偏移方法。
如果确定第二偏移方法应用于包括当前块的当前条带,那么根据实施方式的第二偏移方法解码器24可以获取当前块的第二偏移参数。根据实施方式的第二偏移方法解码器24可以获取针对当前块的每个颜色分量的当前条带的第二偏移参数,并且可以将基于第一偏移参数的偏移施加至每个颜色分量。
具体而言,根据实施方式的第二偏移方法解码器24可以从比特流中解析当前块的第二偏移参数。就这点而言,第二偏移方法解码器24可以基于当前块的第一偏移参数来解析第二偏移参数。例如,在第一偏移参数之中的与当前块有关的第一偏移使用信息表明第一偏移方法应用于当前块时,根据实施方式的第二偏移方法解码器24可以解析与当前块有关的第二偏移使用信息。在第一偏移参数之中的与当前条带有关的第一偏移使用信息表明第一偏移方法没有应用于当前块时,根据实施方式的第二偏移方法解码器24可以不解析与当前块有关的第二偏移使用信息,并且可以不将第二偏移方法应用于当前块。
根据实施方式的第二偏移方法解码器24可以从比特流中解析当前块的第二偏移参数中的一些,并且可以基于当前块的第一偏移参数来确定其他参数。
例如,根据实施方式的第二偏移方法解码器24可以不从比特流中解析当前块的第二偏移类型,而是可以参考第一偏移类型来确定第二偏移类型。例如,根据实施方式的第二偏移方法解码器24可以不同地确定当前块的第二偏移类型和第一偏移类型。在当前块的第一偏移类型是带类型时,第二偏移方法解码器24可以将当前块的第二偏移类型确定为边缘类型。
此外,根据实施方式的第二偏移方法解码器24可以参考从比特流中获取的与当前块有关的第二合并信息,基于周边块的第二偏移参数来确定当前块的第二偏移参数。
如果确定了当前块的第二偏移参数,那么根据实施方式的第二偏移方法解码器24可以将基于第二偏移参数的偏移施加至施加了基于第一偏移参数的偏移的当前块。
第一偏移方法和第二偏移方法顺序地应用于所重建的当前块,从而最小化当前块的原始像素和重建的像素的各个方向上的误差以及各种类型的误差。
参考图2B,在操作21中,根据实施方式的视频解码设备20可以确定是否将第一偏移方法应用于包括当前块的当前条带。
例如,根据实施方式的视频解码设备20可以基于从比特流中获取的与当前条带有关的第一偏移使用信息来确定是否将第一偏移方法应用于当前条带。在与当前条带有关的第一偏移使用信息表明第一偏移方法应用于当前条带时,视频解码设备20可以从比特流中获取当前块的第一偏移参数。
根据实施方式的当前块的第一偏移参数可以包括与当前块有关的第一偏移使用信息、当前块的第一偏移类型、第一偏移分类和第一偏移值。此外,当前块的第一偏移参数还可以包括表明第一偏移值是正数还是负数的编码信息等。
根据实施方式的视频解码设备20可以将基于所获取的当前块的第一偏移参数的偏移施加至所重建的当前块。
此外,根据实施方式的视频解码设备20可以参考从比特流中获取的与当前块有关的第一合并信息,基于周边块的第一偏移参数来确定当前块的第一偏移参数。
在操作23中,当第一偏移方法应用于当前条带时,根据实施方式的视频解码设备20可以确定是否将第二偏移方法应用于当前条带。
具体而言,在与当前条带有关的第一偏移使用信息表明将第一偏移方法应用于当前条带时,根据实施方式的视频解码设备20可以从比特流中获取与当前条带有关的第二偏移使用信息。视频解码设备20可以基于与当前条带有关的第二偏移使用信息来确定是否将第二偏移方法应用于当前条带。
此外,在与当前条带有关的第一偏移使用信息表明第一偏移方法没有应用于当前条带时,根据实施方式的视频解码设备20可以不获取与当前条带有关的第二偏移使用信息,并且可以不将第二偏移方法应用于当前条带。
此外,在与当前条带有关的第一偏移使用信息表明第一偏移方法应用于当前条带时,根据实施方式的视频解码设备20可以基于与当前条带有关的第一偏移使用信息将第二偏移方法应用于当前条带。
在操作25中,当第二偏移方法应用于当前条带时,根据实施方式的视频解码设备20可以确定当前块的第二偏移参数。
在与当前条带有关的第二偏移使用信息表明第二偏移方法应用于当前条带时,根据实施方式的视频解码设备20可以从比特流中获取当前块的第二偏移参数。
根据实施方式的视频解码设备20可以基于当前块的第一偏移参数来获取第二偏移参数。
例如,在第一偏移参数之中的与当前条带有关的第一偏移使用信息表明第一偏移方法应用于当前条带时,根据实施方式的视频解码设备20可以获取与当前块有关的第二偏移使用信息。在第一偏移参数之中的与当前条带有关的第一偏移使用信息表明第一偏移方法没有应用于当前条带时,根据实施方式的视频解码设备20可以不获取与当前块有关的第二偏移使用信息,并且可以不将第二偏移方法应用于当前条带。
根据实施方式的当前块的第二偏移参数可以包括下列至少之一:与当前块有关的第二偏移使用信息、当前块的第二偏移类型、第二偏移分类和第二偏移值。此外,当前块的第二偏移参数还可以包括表明第二偏移值是正数还是负数的编码信息。
根据实施方式的视频解码设备20可以从比特流中获取当前块的第二偏移参数中的一些,并且可以基于当前块的第一偏移参数来确定其他参数。
例如,根据实施方式的视频解码设备20可以不从比特流中获取当前块的第二偏移参数,并且可以参考第一偏移类型来确定第二偏移参数。例如,根据实施方式的视频解码设备20可以不同地确定当前块的第二偏移类型和第一偏移类型。在当前块的第一偏移类型是带类型时,视频解码设备20可以将当前块的第二偏移类型确定为边缘类型。
此外,根据实施方式的视频解码设备20可以参考从比特流中获取的与当前块有关的第二合并信息,基于周边块的第二偏移参数来确定当前块的第二偏移参数。
在操作27中,根据实施方式的视频解码设备20可以将基于第二偏移参数的偏移施加至施加了基于第一偏移参数的偏移的当前块。
根据实施方式的视频解码设备20可以将第一偏移方法和第二偏移方法顺序地应用于所重建的当前块,从而最小化当前块的原始像素和重建的像素的各个方向上的误差以及各种类型的误差。
现在将参考图3详细描述使用样本自适应偏移(SAO)技术的视频解码方法。图3是根据本公开的实施方式的视频解码设备30的框图。
视频解码设备30包括熵解码器31、反量化器32、逆变换器33、重建器34、帧内预测器35、参考图片缓冲器36、运动补偿器37、去块化滤波器38和偏移施加器39。
视频解码设备30可以接收包括编码视频数据的比特流。熵解码器31可以从比特流中解析帧内模式信息、帧间模式信息、偏移信息和残差。
根据实施方式的偏移信息可以包括例如偏移参数。
由熵解码器31提取的残差可以是经量化的变换系数。因此,反量化器32可以对残差执行反量化以重建变换系数,并且逆变换器33可以对重建的系数执行逆变换以重建空间域的残差值。
为了预测和重建空间域的残差值,可以执行帧内预测或运动补偿。
如果帧内模式信息由熵解码器31提取,那么帧内预测器35可以通过使用帧内模式信息来确定与当前样本空间相邻的样本之中将被重建当前样本参考的参考样本。可以在重建器34先前重建的样本之中选择参考样本。重建器34可以通过使用基于帧内模式信息确定的参考样本和由逆变换器33重建的残差值来重建当前样本。
如果帧间模式信息由熵解码器31提取,那么运动补偿器37可以通过使用帧间模式信息来确定在当前图片之前重建的图片之中将被重建当前图片的当前样本参考的参考图片。帧间模式信息可以包括运动矢量、参考索引等。通过使用参考索引,在当前图片之前重建并且存储在参考图片缓冲器36中的图片之中,可以确定将用来对当前样本执行运动补偿的参考图片。通过使用运动矢量,可以确定将用来对当前块执行运动补偿的参考图片的参考块。重建器34可以通过使用基于帧间模式信息确定的参考块和由逆变换器33重建的残差值来重建当前样本。
重建器34可以重建样本并且可以输出重建的像素。重建器34可以基于具有树形结构的编码单元来生成每个LCU的重建的像素。
去块化滤波器38可以执行滤波以减小设置在LCU或者具有树形结构的编码单元中的每个编码单元的边缘区域的像素的块化现象。
此外,偏移施加器39可以根据SAO技术来调整当前块(例如,每个LCU的重建的像素)的偏移。SAO技术可以包括多偏移方法。
偏移施加器39可以从所提取的偏移信息中确定当前块的偏移参数,例如,偏移类型、偏移分类和偏移值。
就这点而言,根据实施方式的视频解码设备30可以使用多偏移方法。例如,偏移施加器39可以将具有不同偏移信息的第一偏移方法和第二偏移方法顺序地施加至当前块以施加偏移。
由熵解码器31从偏移信息中提取偏移参数的操作可以对应于图2的视频解码设备20的解析操作,并且偏移施加器39的操作可以对应于视频解码设备20的第一偏移方法解码器22和第二偏移方法解码器24的操作。
偏移施加器39可以从偏移值中确定当前块的重建的像素的偏移值的符号和差值。偏移施加器39可以通过将重建的像素的像素值增大或减小所确定的差值来减小重建的像素与原始像素之间的误差。
包括由偏移施加器39施加偏移的重建像素的图片可以存储在参考图片缓冲器36中。因此,通过根据SAO操作使用具有重建的样本与原始像素之间的最小化误差的参考图片,可以对下一图片执行运动补偿。
根据SAO操作,基于重建的像素与原始像素之间的差值,可以确定包括重建的像素的像素组的偏移。至于SAO操作,现在将详细描述用于将重建的像素分类到像素组中的实施方式。
根据SAO操作,像素可以基于(i)重建的像素的边缘类型或(ii)重建的像素的带类型进行分类。可以通过使用偏移类型来限定基于边缘类型还是带类型对像素进行分类。
现在将详细描述根据SAO操作的基于边缘类型对像素进行分类的实施方式。
在确定了当前块的边缘类型偏移时,可以确定当前块中包括的重建的像素中的每个像素的偏移分类。换言之,通过将当前重建的像素的像素值与相邻像素的像素值进行比较,可以限定当前重建的像素的偏移分类。现在将参考图4A到图4C描述确定边缘类型偏移分类的示例。
图4A到图4C是用于说明根据本公开的实施方式的边缘类型样本SAO技术的示意图。
参考图4A,根据实施方式,索引0、1、2和3可以顺序地分配到边缘类型偏移分类41、42、43和44。
根据实施方式的边缘类型的边缘分类可表明由邻近当前重建的像素X0的两个相邻像素形成的一维边缘的方向。例如,根据实施方式的边缘分类可以表明0°、90°、45°或135°的边缘方向。
索引为0的边缘分类41表明在当前重建的像素X0与两个水平相邻像素X1和X2之间形成边缘的情况。索引为1的边缘分类42表明在当前重建的像素X0与两个竖直相邻像素X3和X4之间形成边缘的情况。索引为2的边缘分类43表明在当前重建的像素X0与两个135°对角线相邻像素X5和X8之间形成边缘的情况。索引为3的边缘分类44表明在当前重建的像素X0与两个45°对角线相邻像素X6和X7之间形成边缘的情况。
因此,通过分析当前块中包括的重建的像素的边缘方向并且因而确定当前块中的强边缘方向,可以确定当前块的边缘分类。
相对于每个边缘分类,可以根据当前块的当前像素的边缘形状来分类出类别。现在将参考图4B和图4C来描述根据边缘形状的类别的示例。
图4B和图4C分别是根据本公开的实施方式的示出边缘类型的类别的表和图。
根据实施方式的边缘类型类别可以表明当前块的当前像素是否对应于凹边缘的局部谷、设置在凹边缘的局部谷周围的弯角处的像素、凸边缘的局部峰,或者设置在凸边缘的局部峰周围的弯角处的像素。例如,边缘类型类别可以包括根据上述边缘类型的四个类别。
图4B示例性地示出用于确定边缘的类别的条件。图4C示例性地示出重建的像素与相邻像素之间的边缘形状以及它们的像素值c、a和b。
c表明当前块的重建的像素的索引,并且a和b表明根据边缘方向的当前重建像素的两侧的邻近像素的索引。Xa、Xb和Xc分别表明索引为a、b和c的重建的像素的像素值。在图4C中,x轴表明当前重建的像素和当前重建的像素的两侧的相邻像素的索引,并且y轴表明样本的像素值。
类别1表明当前样本对应于凹边缘的最低点(即,局部谷)的情况(Xc<Xa&&Xc<Xb)。如图4C的类别1的图表所示,如果相邻像素a与b之间的当前重建的像素c对应于凹边缘的最低点,那么可以将当前重建的像素分类为类别1。
类别2表明当前样本设置在凹边缘的最低点周围的弯角(即,凹形拐角)处的情况(Xc<Xa&&Xc==Xb||Xc==Xa&&Xc<Xb)。如图表52所示,如果相邻像素a与b之间的当前重建的像素c设置在凹边缘的向下曲线的端点处(Xc<Xa&&Xc==Xb),或者如图表53所示,如果当前重建的像素c设置在凹边缘的向上曲线的起点处(Xc==Xa&&Xc<Xb),那么当前重建的像素可以分类为类别2。
类别3表明当前样本设置在凸边缘的最高点周围的弯角(即,凸形拐角)处的情况(Xc>Xa&&Xc==Xb||Xc==Xa&&Xc>Xb)。如图表54所示,如果相邻像素a与b之间的当前重建的像素c设置在凸边缘的向下曲线的起点处(Xc==Xa&&Xc>Xb),或者如图表55所示,如果当前重建的像素c设置在凸边缘的向上曲线的端点处(Xc>Xa&&Xc==Xb),那么当前重建的像素可以分类为类别3。
类别4表明当前样本对应于凸边缘的最高点(即,局部峰)的情况(Xc>Xa&&Xc>Xb)。如图表56所示,如果相邻像素a与b之间的当前重建的像素c对应于凸边缘的最高点,那么可以将当前重建的像素分类为类别4。
如果当前重建的像素不满足类别1、2、3和4的条件中的任一个,那么当前重建的像素不对应于边缘,因而被分类为类别0,并且类别0的偏移不需要编码。
根据本公开的实施方式,针对与相同类别对应的重建的像素,可以将重建的像素与原始像素之间的差值的平均值确定为当前类别的偏移。此外,可以确定所有类别的偏移。
如果通过使用正偏移值来调整重建的像素值,那么类别1和2的凹边缘可以平滑,但可以因负偏移值而锐化。类别3和4的凸边缘可以因负偏移值而平滑,并且可以因正偏移值而锐化。
视频编码设备10可不允许边缘的锐化效应。此处,类别1和2的凹边缘需要正偏移值,并且类别3和4的凸边缘需要负偏移值。在这种情况下,如果边缘的类别已知,那么可以确定偏移值的符号。因此,视频编码设备10可以不传输偏移值的符号,而是可以只传输偏移值的绝对值。此外,视频解码设备20可以不接收偏移值的符号,而是可以只接收偏移值的绝对值。
因此,视频编码设备10可以根据当前边缘分类的类别对偏移值进行编码和传输,并且视频解码设备20可以依据所接收的偏移值来调整类别的重建的像素。
例如,如果边缘类型的偏移值被确定为0,那么视频编码设备10可以只传输与当前块有关的表明不向当前块施加偏移的偏移使用信息。
例如,如果边缘类型的偏移值不是0,那么视频编码设备10可以传输偏移绝对值作为偏移值。视频编码设备10不需要传输偏移值的符号。
视频解码设备20可以从所接收的偏移值中读取与当前块有关的偏移使用信息,并且如果偏移值不是0,则可以读取偏移绝对值。可以基于重建的像素与相邻像素之间的边缘类型,根据边缘类别来预测偏移值的符号。
因此,根据实施方式的视频编码设备10可以相对于边缘方向根据边缘形状来确定像素的类别,并且可以将用于每个类别的像素之间的平均误差值确定为偏移值。视频编码设备10可以对表示边缘类型的偏移类型信息、表示边缘方向的偏移分类信息以及偏移值进行编码和传输。
根据实施方式的视频解码设备20可以接收偏移类型信息、偏移分类信息和偏移值。视频解码设备20可以根据偏移类型信息和偏移分类信息来确定当前块的边缘方向。视频解码设备20可以根据重建的像素中的每个像素的边缘方向来确定与边缘形状对应的类别,并且可以在所接收的偏移值之中确定与类别对应的偏移值。视频解码设备20可以依据偏移值来调整重建的像素的像素值,从而最小化原始图像与重建的图像之间的误差。
现在将参考图5详细描述根据实施方式的根据SAO技术而基于带类型对像素分类的实施方式。
图5是用于描述根据本公开的实施方式的带类型SAO技术的示意图。
如果确定根据偏移类型依据重建的像素的带类型对当前块的像素进行分类,那么视频解码设备20可以将重建的像素分类成具有类似值的带。视频解码设备20可以通过使用从比特流中获取的偏移参数以带为单位来施加偏移值,从而减小原始图像与重建的图像之间的误差。
具体而言,当前块的重建的像素的每个像素值可以属于多个带中的一个。例如,像素值可以根据p比特采样而具有从最小值(Min)0到最大值(Max)2^(p-1)的总范围。如果像素值的总范围(Min,Max)被分成K个周期,那么像素值的每个周期被称为带。如果Bk表示第k个带的最大值,那么可以分出带[B0,B1-1]、[B1,B2-1]、[B2,B3-1]、……以及[Bk-1,Bk]。如果当前重建的像素的像素值Rec(x,y)属于带[Bk-1,Bk],那么可以将当前带确定为k。带可以均匀或不均匀地划分。
例如,参考图5,如果将像素值分类成相等的8比特像素带,那么可以将像素值分成32个带。更具体地,可以将它们分类成带[0,7]、[8,15]、……、[240,247]以及[248,255]。
在根据带类型分类的多个带之中,可以确定重建的像素的每个像素值所属的带。此外,可以确定每个带中的表明原始像素与重建的像素之间的误差的平均值的偏移值。就这点而言,可以不针对所有带来确定偏移值,但可以确定当前LCU中包括的像素之中的属于每个带的像素的数量,并且可以针对具有很多像素的带来确定相邻带的偏移值。
例如,参考图5,可以针对当前块的每个带基于样本数59来确定带组57,并且可以确定所确定的带组57中包括的带的偏移值。例如,带组57可以包括32个带之中的当前块的大多数样本所属的4个带,并且可以用将带组57中包括的4个带中的每个带的偏移值信号化,但本实施方式不限于此。可以通过使用最小化RD代价的各种方法来确定带中的一些,并且在RD代价较小时,可以将所确定的带中的一些确定为用于最终调整重建的像素值的带。
因此,视频编码设备10和视频解码设备20可以编码和收发与根据当前块的偏移类型分类的带中的每个带对应的偏移,并且可以将偏移施加至重建的像素。
因此,根据带类型,视频编码设备10和视频解码设备20可以根据像素值所属的带对重建的像素进行分类,可以将偏移确定为属于相同带的重建的像素的平均误差值,并且可以依据偏移来调整重建的像素,从而将原始图像与重建的图像之间的误差最小化。
当确定根据带类型的偏移时,视频编码设备10和视频解码设备20可以根据带位置将重建的像素分类成类别。例如,如果像素值的总范围被分成K个带,那么可以根据表示第k个带的带索引k将类别加索引。类别的数量可以被确定为与带的数量对应。
然而,为了减少数据,视频编码设备10和视频解码设备20可以限制用来确定偏移的类别的数量。例如,可以将与在带索引增加的方向上具有预定开始位置的带起连续预定数量的带分配到类别,并且可以只确定每个类别的偏移。
例如,参考图5,如果索引为12的带88~95被确定为开始带时,从开始带算起的四个带(即,索引为12、13、14和15的带)可以分别分配到类别1、2、3和4。因此,可以将索引为12的带中包括的重建的像素与原始像素之间的平均误差确定为类别1的偏移O1。同样,可以将索引为13的带96~103中包括的重建的像素与原始像素之间的平均误差确定为类别2的偏移O2,可以将索引为14的带104~111中包括的重建的像素与原始像素之间的平均误差确定为类别3的偏移O3,并且可以将索引为15的带112~119中包括的重建的像素与原始像素之间的平均误差确定为类别4的偏移O4。
在这种情况下,需要与带范围的开始位置(即,左侧带的位置)有关的信息来确定分配到类别的带的位置。因此,视频编码设备10可以对表明左侧带的位置的左起点信息进行编码和传输,以作为偏移分类。
例如,参考图5,可以对表明带组57的左侧开始带88~95的信息P1进行编码和传输。
视频编码设备10可以根据类别对表示带类型的偏移类型、偏移分类和偏移值进行编码和传输。
例如,参考图5,视频编码设备10可以针对带组57的每个带对表明偏移值58的信息O1、O2、O3和O4进行编码和传输。根据实施方式的视频解码设备20可以接收根据类别的偏移类型、偏移分类和偏移值。如果所接收的偏移类型是带类型,那么视频解码设备20可以从偏移分类中读取带开始位置。视频解码设备20可以在从开始带算起的四个带之中确定重建的像素所属的带,可以确定根据类别的偏移之中的分配到当前带的偏移值,并且可以将偏移值施加至重建的像素。
图6A和图6B是用于说明根据本公开的实施方式的应用多偏移方法的方法的示意图。
参考图6A,当前块60包括多个重建的像素。例如,重建的当前块60可以包括值为128、100、128、110、90、98、110、100和100的重建的像素。
就这点而言,根据实施方式的应用多偏移方法的视频解码设备20可以通过将SAO技术应用于当前块60来减小重建的像素值的误差。例如,视频解码设备20可以将根据第一偏移方法的偏移施加至当前块60。
具体而言,根据实施方式的视频解码设备20可以将边缘类型的第一偏移方法应用于当前块60。参考图6A,当前块60的行61的边缘方向可以是水平方向。换言之,在行61的当前重建的像素X0与两个水平相邻像素X1和X2之间形成边缘。此外,当前重建的像素X0的像素值是90,并且相邻像素X1和X2的像素值分别是110和98,因此可以将当前重建的像素X0的偏移类别确定为类别1。
因此,根据实施方式的视频解码设备20可以将类别1的偏移值施加至当前块60的当前重建的像素X0。例如,类别1的偏移值可以是7。在施加了根据第一偏移方法的偏移的当前块62中,当前重建的像素X0的像素值可以是97。此外,类别1的偏移值和类别2的偏移值也可以分别施加至当前重建的像素X0的上部重建像素和下部重建像素。
就这点而言,关于应用了第一偏移方法的当前块62的像素值,可以由第一偏移方法来调整列63的像素值,因此可以减小误差。然而,应用第一偏移方法的当前块62仍可以具有边缘类型或带类型的误差。或者,当前块62的一些像素可以具有通过应用第一偏移方法而造成的更大误差。
因此,根据实施方式的视频解码设备20可以将第二偏移方法应用于应用了第一偏移方法的当前块62。例如,第二偏移方法可以以不同于第一偏移方法的偏移类型的带类型应用,并且即使应用了与第一偏移方法的偏移类型相同的边缘类型,也可以在不同于第一偏移方法的偏移分类的方向上应用于偏移分类。此外,第二偏移方法可以由不同于第一偏移方法的偏移值的偏移值进行应用。
参考图6B,应用了第一偏移方法的当前块62的列63可以包括竖直方向上的误差。因此,根据实施方式的视频解码设备20可以在应用第一偏移方法的当前块62的竖直方向上施加边缘类型的基于第二偏移方法的偏移,从而减小误差。
具体而言,参考图6B,在当前块62的当前重建的像素X0与两个竖直相邻像素X3和X4之间形成边缘。此外,应用第一偏移方法的当前块62的当前重建的像素X0的像素值是97,并且相邻像素X3和X4的像素值分别是107和102,因此可以将当前重建的像素X0的偏移类别确定为类别1。
因此,根据实施方式的视频解码设备20可以将类别1的偏移值施加至应用了第一偏移方法当前块62的当前重建的像素X0。根据实施方式的第二偏移方法的类别1的偏移值可以不同于第一偏移方法的类别1的偏移值。例如,第二偏移方法的类别1的偏移值可以是5。在施加了根据第二偏移方法的偏移的当前块64中,当前重建的像素X0的像素值可以是102。
此外,类别2的偏移值和类别1的偏移值也可以分别施加至当前重建的像素X0的左侧重建像素和右侧重建像素。
根据实施方式的视频解码设备20可以将根据第一偏移方法的偏移和根据第二偏移方法的偏移顺序地施加至当前块64,从而减小像素值之间的误差。
图7是示出根据本公开的实施方式的与条带的多偏移方法有关的多项使用信息的句构元素的表。
根据实施方式的视频解码设备20可以从比特流中获取表明是否将多偏移方法应用于当前条带的多项信息,从而确定是否应用多偏移方法。
参考表明根据实施方式的表示多偏移方法的多项信息的表70,视频解码设备20可以从比特流中获取下列信息中的至少之一:与当前条带有关的表明是否将第一偏移方法应用于当前条带的第一偏移使用信息1st_slice_sao_flag,以及与当前条带有关的表明是否将第二偏移方法应用于当前条带的第二偏移使用信息2nd_slice_sao_flag。
例如,作为条带单元中的句构元素,与当前条带有关的第一偏移使用信息1st_slice_sao_flag和与当前条带有关的第二偏移使用信息2nd_slice_sao_flag可以被包括在条带标头中并且接收在视频解码设备20中。根据实施方式的视频解码设备20可以对所接收的比特流执行熵编码,从而获取下列信息中的至少之一:与当前条带有关的第一偏移使用信息1st_slice_sao_flag和与当前条带有关的第二偏移使用信息2nd_slice_sao_flag。
具体而言,根据实施方式的视频解码设备20可以预先从比特流中获取与当前条带有关的第一偏移使用信息1st_slice_sao_flag。例如,根据实施方式的与当前条带有关的第一偏移使用信息1st_slice_sao_flag可以是1比特。当所获取的与当前条带有关的第一偏移使用信息1st_slice_sao_flag是0时,根据实施方式的视频解码设备20可以不将基于第一偏移方法的偏移施加至当前条带,并且当所获取的与当前条带有关的第一偏移使用信息1st_slice_sao_flag是1时,可以将基于第一偏移方法的偏移施加至当前条带。
此外,当所获取的与当前条带有关的第一偏移使用信息1st_slice_sao_flag是0时,根据实施方式的视频解码设备20可以不获取与当前条带有关的第二偏移使用信息2nd_slice_sao_flag,并且可以确定第一偏移方法和第二偏移方法都不应用于当前条带。
此外,当所获取的与当前条带有关的第一偏移使用信息1st_slice_sao_flag是1时,根据实施方式的视频解码设备20可以确定第一偏移方法应用于当前条带,并且可以另外获取与当前条带有关的第二偏移使用信息2nd_slice_sao_flag。
根据实施方式的与当前条带有关的第二偏移使用信息2nd_slice_sao_flag可以是1比特。当所获取的与当前条带有关的第二偏移使用信息2nd_slice_sao_flag是0时,根据实施方式的视频解码设备20可以不将基于第二偏移方法的偏移施加至当前条带,并且当所获取的与当前条带有关的第二偏移使用信息2nd_slice_sao_flag是1时,可以将基于第二偏移方法的偏移施加至当前条带。
针对当前条带的每个分量,可以获取根据实施方式的与当前条带有关的第一偏移使用信息1st_slice_sao_flag和与当前条带有关的第二偏移使用信息2nd_slice_sao_flag。例如,可以针对YCrCb彩色图像的亮度样本(Y分量)以及第一色度样本和第二色度样本(Cr和Cb分量)来获取和使用与当前条带有关的第一偏移使用信息1st_slice_sao_flag和与当前条带有关的第二偏移使用信息2nd_slice_sao_flag。
参考表明根据另一实施方式的表示多偏移方法的多项信息的表71,视频解码设备20可以只获取与当前条带有关的表明是否将第一偏移方法应用于当前条带的第一偏移使用信息1st_slice_sao_flag,从而确定是否应用第一偏移方法和第二偏移方法。
具体而言,视频解码设备20可以基于1比特的、与当前条带有关的第一偏移使用信息来确定是否应用第一偏移方法和第二偏移方法。
例如,在与当前条带有关的第一偏移使用信息1st_slice_sao_flag是0时,根据实施方式的视频解码设备20可以确定基于第一偏移方法的偏移和基于第二偏移方法的偏移都不施加至当前条带。
此外,当与当前条带有关的第一偏移使用信息1st_slice_sao_flag是1时,根据实施方式的视频解码设备20可以确定基于第一偏移方法的偏移和基于第二偏移方法的偏移都施加至当前条带。换言之,除只将第一偏移方法应用于当前块的情况之外,根据实施方式的视频解码设备20可以只通过使用1比特来确定是否应用多偏移,从而增加编码效率。
图8A到图8C是示出根据本公开的各种实施方式的当前块的句构元素的表。
根据各种实施方式的视频解码设备20可以从比特流中获取表明是否将多偏移方法应用于当前块的多项信息,从而确定是否应用多偏移方法。
参考图8A的表80,根据实施方式的视频解码设备20可以从比特流中获取与当前块有关的表明是否将第一偏移方法应用于当前块的第一偏移使用信息1st_cb_sao_flag和与当前块有关的表明是否将第二偏移方法应用于当前块的第二偏移使用信息2nd_cb_sao_flag。例如,作为块单元中的句构元素,与当前块有关的第一偏移使用信息1st_cb_sao_flag和与当前块有关的第二偏移使用信息2nd_cb_sao_flag可以由根据实施方式的视频解码设备20通过对所接收的比特流执行熵编码来获取。
当与包括当前块的当前条带有关的第一偏移使用信息是1时,根据实施方式的视频解码设备20可以获取与当前块有关的第一偏移使用信息1st_cb_sao_flag。此外,当与包括当前块的当前条带有关的第二偏移使用信息是1时,根据实施方式的视频解码设备20可以获取与当前块有关的第二偏移使用信息2nd_cb_sao_flag。
此外,根据实施方式的视频解码设备20可以预先从比特流中获取与当前块有关的第一偏移使用信息1st_cb_sao_flag。例如,根据实施方式的与当前块有关的第一偏移使用信息1st_cb_sao_flag可以是1比特。当所获取的与当前块有关的第一偏移使用信息1st_cb_sao是0时,根据实施方式的视频解码设备20可以不将基于第一偏移方法的偏移施加至当前块,并且当所获取的与当前块有关的第一偏移使用信息1st_cb_sao是1时,可以将基于第一偏移方法的偏移施加至当前块。
此外,当所获取的与当前块有关的第一偏移使用信息1st_cb_sao_flag是0时,根据实施方式的视频解码设备20可以不获取与当前块有关的第二偏移使用信息2nd_cb_sao_flag,并且可以确定第一偏移方法和第二偏移方法都不应用于当前块。
此外,当所获取的与当前块有关的第一偏移使用信息1st_cb_sao_flag是1时,根据实施方式的视频解码设备20可以确定第一偏移方法应用于当前块,并且可以另外获取与当前块有关的第二偏移使用信息2nd_cb_sao_flag。
根据实施方式的与当前块有关的第二偏移使用信息2nd_cb_sao_flag可以是1比特。当所获取的与当前块有关的第二偏移使用信息2nd_cb_sao_flag是0时,根据实施方式的视频解码设备20可以不将基于第二偏移方法的偏移施加至当前块,并且当所获取的与当前块有关的第二偏移使用信息2nd_cb_sao_flag是1时,可以将基于第二偏移方法的偏移施加至当前块。
针对当前条带的每个分量,可以获取根据实施方式的与当前块有关的第一偏移使用信息1st_cb_sao_flag和与当前块有关的第二偏移使用信息2nd_cb_sao_flag。例如,可以针对YCrCb彩色图像的亮度样本(Y分量)以及第一色度样本和第二色度样本(Cr和Cb分量)来获取和使用与当前块有关的第一偏移使用信息1st_cb_sao_flag和与当前块有关的第二偏移使用信息2nd_cb_sao_flag。
此外,参考图8B的表82,根据实施方式的视频解码设备20可以从比特流中获取表明当前块的偏移类型的多项信息,从而确定是否应用多偏移方法。
具体而言,根据实施方式的视频解码设备20可以获取表明当前块的第一偏移方法的偏移类型的信息1st_sao_type_idx和表明当前块的第二偏移方法的偏移类型的信息2nd_sao_type_idx。例如,作为块单元中的句构元素,与当前块有关的第一偏移类型信息1st_sao_type_idx和与当前块有关的第二偏移类型信息2nd_sao_type_idx可以由根据实施方式的视频解码设备20通过对所接收的比特流执行熵解码来获取。
例如,根据实施方式的与当前块有关的第一偏移类型信息1st_sao_type_idx和与当前块有关的第二偏移类型信息2nd_sao_type_idx可以是1比特的信息,并且可以在它们为0时表明带类型,而在它们为1时表明边缘类型。
针对当前条带的每个分量,可以获取根据实施方式的与当前块有关的第一偏移类型信息1st_sao_type_idx和与当前块有关的第二偏移类型信息2nd_sao_type_idx。例如,可以针对YCrCb彩色图像的亮度样本(Y分量)以及第一色度样本和第二色度样本(Cr和Cb分量)来获取和使用与当前块有关的第一偏移类型信息1st_sao_type_idx和与当前块有关的第二偏移类型信息2nd_sao_type_idx。
参考图8B的表84,根据另一实施方式的视频解码设备20可以只获取与当前块有关的第一偏移使用信息,从而确定第一偏移类型和第二偏移类型。
具体而言,视频解码设备20可以基于与当前块有关的第一偏移使用信息来确定第一偏移类型和第二偏移类型。
根据实施方式的视频解码设备20可以不直接获取第二偏移类型信息,而是可以基于第一偏移类型信息来确定第一偏移方法的偏移类型。例如,当与当前块有关的第一偏移使用信息是0时,根据实施方式的视频解码设备20可以将当前块的第一偏移类型确定为带类型并且将当前块的第二偏移类型确定为边缘类型。
此外,当与当前块有关的第一偏移类型信息是1时,根据实施方式的视频解码设备20可以将当前块的第一偏移类型确定为边缘类型并且将当前块的第二偏移类型确定为带类型。
图9是示出根据本公开的实施方式的表明当前块的偏移类型的多项信息的句构元素的表。
参考表90,根据实施方式的视频解码设备20可以从比特流中获取表明当前块的偏移类型的多项信息。
具体而言,根据实施方式的视频解码设备20可以获取下列信息中的至少之一:表明当前块的第一偏移方法的偏移类型的信息1st_sao_type_idx和表明当前块的第二偏移方法的偏移类型的信息2nd_sao_type_idx。例如,作为块单元中的句构元素,与当前块有关的第一偏移类型信息1st_sao_type_idx和与当前块有关的第二偏移类型信息2nd_sao_type_idx可以由根据实施方式的视频解码设备20通过对所接收的比特流执行熵解码来获取。
参考表90,根据实施方式的与当前块有关的第一偏移类型信息可以包括与当前块有关的第一偏移使用信息。例如,第一偏移类型信息可以包括表明是否将第一偏移方法应用于当前块的第一比特和表明当前块的第一偏移方法的偏移类型的第二比特。例如,偏移类型可以是边缘类型或带类型。
因此,根据实施方式的视频解码设备20可以获取第一偏移类型信息的第一比特,从而确定是否将第一偏移方法应用于当前块,并且当第一比特是1时,可以获取第一偏移类型信息的第二比特,从而确定当前块的第一偏移类型。当第一偏移类型信息的第一比特是0时,视频解码设备20可以不获取第一偏移类型信息的第二比特。
此外,当第一偏移类型信息的第一比特是1时,根据实施方式的视频解码设备20可以获取与当前块有关的第二偏移类型信息。视频解码设备20可以获取第二偏移类型信息的第一比特,从而确定是否将第二偏移方法应用于当前块,并且当第一比特是1时,可以获取第二偏移类型信息的第二比特,从而确定当前块的第二偏移类型。当第二偏移类型信息的第一比特是0时,视频解码设备20可以不获取第二偏移类型信息的第二比特。
针对当前条带的每个分量,可以获取根据实施方式的与当前块有关的第一偏移类型信息和第二偏移类型信息。例如,针对YCrCb彩色图像的亮度样本(Y分量)以及第一色度样本和第二色度样本(Cr和Cb分量),可以获取和使用与当前块有关的第一偏移类型信息和第二偏移类型信息。
图10A和图10B是示出根据本公开的各种实施方式的表明当前块的多偏移方法的偏移分类的多项信息的句构元素的表。
参考图10A的表1000,根据实施方式的视频解码设备20可以获取表明当前块的偏移分类的多项信息,并且可以确定多偏移方法的偏移分类。
具体而言,根据实施方式的视频解码设备20可以获取表明当前块的第一偏移方法的偏移分类的信息1st_sao_eo_class和表明当前块的第二偏移方法的偏移分类的信息2nd_sao_eo_class。例如,作为块单元中的句构元素,与当前块有关的第一偏移分类信息1st_sao_eo_class和与当前块有关的第二偏移分类信息2nd_sao_eo_class可以由根据实施方式的视频解码设备20通过对所接收的比特流执行熵解码来获取。
例如,根据实施方式的与当前块有关的第一偏移分类信息1st_sao_eo_class和与当前块有关的第二偏移分类信息2nd_sao_eo_class可以是2比特的信息,并且可以表明边缘类型的水平方向、竖直方向、135°对角线方向和45°对角线方向中的一个的分类。
针对当前条带的每个分量,可以获取根据实施方式的与当前块有关的第一偏移分类信息和第二偏移分类信息。例如,针对YCrCb彩色图像的亮度样本(Y分量)以及第一色度样本和第二色度样本(Cr和Cb分量),可以获取和使用与当前块有关的第一偏移分类信息和第二偏移分类信息。
此外,在带类型的情况下,根据实施方式的与当前块有关的第一偏移分类信息和第二偏移分类信息可以包括表明左侧带的位置的5比特的左起点信息,从而变确定带范围。
或者,参考图10B的表1001,可以示出根据另一实施方式的表明当前块的偏移分类的多项信息。例如,根据另一实施方式的视频解码设备20可以包括与当前块有关的第一偏移分类信息1st_sao_class和与当前块有关的第二偏移分类信息2nd_sao_class。与当前块有关的第一偏移分类信息1st_sao_class可以是表明第一偏移方法的偏移类型和偏移分类的信息。此外,与当前块有关的第二偏移分类信息2nd_sao_class可以是表明第二偏移方法的偏移类型和偏移分类的信息。
例如,与当前块有关的第一偏移分类信息可以是3比特的信息,并且可以是表明下列中的一项的信息:带偏移类型、水平方向的边缘偏移类型、竖直方向的边缘偏移类型、135°对角线方向的边缘偏移类型和45°对角线方向的边缘偏移类型。例如,在与当前块有关的第一偏移分类信息是0、1、2、3和4时,可以针对0、1、2、3和4中的每个将带偏移类型、水平方向的边缘偏移类型、竖直方向的边缘偏移类型、135°对角线方向的边缘偏移类型和45°对角线方向的边缘偏移类型加索引。视频解码设备20可以参考与当前块有关的第一偏移分类信息来确定第一偏移方法的偏移类型和偏移分类。
此外,与当前块有关的第二偏移分类信息可以是表明下列中的一项的信息:带偏移类型、水平方向的边缘偏移类型、竖直方向的边缘偏移类型、135°对角线方向的边缘偏移类型和45°对角线方向的边缘偏移类型,除与当前块有关的第一偏移分类信息所表明的偏移分类之外。
例如,在与当前块有关的第一偏移分类信息表明带偏移时,与当前块有关的第二偏移分类信息可以是将下列中的一项加索引的2比特的信息:水平方向的边缘偏移类型、竖直方向的边缘偏移类型、135°对角线方向的边缘偏移类型和45°对角线方向的边缘偏移类型。因此,与当前块有关的第一偏移分类信息和第二偏移分类信息可以具有不同的索引。
例如,与当前块有关的第二偏移分类信息可以将偏移分类顺序地加索引为0、1、2和3,除带偏移类型、水平方向的边缘偏移类型、竖直方向的边缘偏移类型、135°对角线方向的边缘偏移类型和45°对角线方向的边缘偏移类型之中的第一偏移方法的偏移分类之外。换言之,与当前块有关的第一偏移分类信息和第二偏移分类信息可以表明不同的偏移分类,但它们具有相同值。
根据另一实施方式的视频解码设备20可以通过使用与当前块有关的3比特的第一偏移分类信息和与当前块有关的2比特的第二偏移分类信息来确定当前块的第一偏移类型和第二偏移分类以及当前块的第二偏移类型和第二偏移分类。
图11是用于说明根据本公开的实施方式的使用合并模式来应用多偏移方法的方法的表。
根据实施方式的视频解码设备20可以基于相邻块的第一偏移参数和第二偏移参数来确定当前块的第一偏移参数和第二偏移参数。根据实施方式的当前块的相邻块可以是当前块的左侧块或上部块。
例如,根据实施方式的视频解码设备20可以获取与当前块有关的第一偏移合并信息1st_sao_merge_flag和与当前块有关的第二偏移合并信息2nd_sao_merge_flag,并且可以确定是否基于相邻块的第一偏移参数和第二偏移参数来确定当前块的第一偏移参数和第二偏移参数。
根据实施方式的与当前块有关的第一偏移合并信息1st_sao_merge_flag和与当前块有关的第二偏移合并信息2nd_sao_merge_flag可以是块单元中的句构元素,并且分别可以表明是否基于相邻块的第一偏移参数来确定当前块的第一偏移参数以及是否基于相邻块的第二偏移参数来确定当前块的第二偏移参数。根据实施方式的视频解码设备20可以通过对所接收的比特流执行熵解码来获取第一和/或第二偏移参数。
例如,在与包括当前块的当前条带有关的第一偏移使用信息表明第一偏移方法应用于当前条带时,根据实施方式的视频解码设备20可以从比特流中获取与当前块有关的第一偏移合并信息。
当第一偏移合并信息是1时,根据实施方式的视频解码设备20可以基于当前块的左侧块或上部块的第一偏移参数来确定当前块的第一偏移参数。
此外,当第一偏移合并信息是0时,根据实施方式的视频解码设备20可以从比特流中确定当前块的第一偏移参数。
此外,根据实施方式的视频解码设备20可以分别获取表明是否参考当前块的左侧块的第一偏移合并信息的合并信息以及表明是否参考当前块的上部块的第一偏移合并信息的合并信息。例如,视频解码设备20可以预先获取表明是否参考当前块的左侧块的第一偏移合并信息的合并信息,并且当确定不参考左侧块的第一偏移合并信息时,可以获取表明是否参考当前块的上部块的第一偏移合并信息的合并信息。
此外,当确定第二偏移方法应用于当前条带时,视频解码设备20可以参考与当前条带有关的第一偏移使用信息或与当前条带有关的第二偏移使用信息来获取与当前块有关的第二偏移合并信息。
当第二偏移合并信息是1时,根据实施方式的视频解码设备20可以基于当前块的左侧块或上部块的第二偏移参数来确定当前块的第二偏移参数。
此外,当第二偏移合并信息是0时,根据实施方式的视频解码设备20可以从比特流中获取当前块的第二偏移参数,或者可以基于第一偏移参数来确定当前块的第二偏移参数。
此外,根据实施方式的视频解码设备20可以分别获取表明是否参考当前块的左侧块的第二偏移合并信息的合并信息以及表明是否参考当前块的上部块的第二偏移合并信息的合并信息。例如,视频解码设备20可以预先获取表明是否参考当前块的左侧块的第二偏移合并信息的合并信息,并且当确定不参考左侧块的第二偏移合并信息时,可以获取表明是否参考当前块的上部块的第二偏移合并信息的合并信息。
因此,根据各种实施方式的视频编码设备10以及视频解码设备20和30可以应用多偏移方法(例如第一偏移方法和第二偏移方法)以重建当前块,从而最小化各个方向和各种类型的误差并且减小意外误差。
在根据各种实施方式的视频编码设备10以及视频解码设备20和30中,视频数据可以分割成LCU,每个LCU可以基于具有树形结构的编码单元进行编码和解码,并且每个LCU可以根据像素分类来确定偏移值。在下文中,将参考图12到图31描述基于具有树形结构的编码单元和变换单元的视频编码方法、视频编码设备、视频解码方法和视频解码设备。
图12是根据本公开的实施方式的基于具有树形结构的编码单元的视频编码设备100的框图。
根据实施方式的基于根据树形结构的编码单元的、涉及视频预测的视频编码设备100包括最大编码单元分割器110、编码单元确定器120和输出单元130。在下文中,为便于描述,基于根据树形结构的编码单元的、涉及视频预测的视频编码设备100将简称为“视频编码设备100”。
最大编码单元分割器110可以基于最大编码单元来分割当前图片,所述最大编码单元是具有图像的当前图片的最大尺寸的编码单元。如果当前图片大于最大编码单元,那么当前图片的图像数据可以被分割成至少一个最大编码单元。根据实施方式的最大编码单元可以是具有32×32、64×64、128×128、256×256等尺寸的数据单元,其中,数据单元的形状是具有2的幂次方的宽度和长度的正方形。图像数据可以输出到编码单元确定器120,以用于至少一个LCU。
根据实施方式的编码单元的特征可以是最大尺寸和深度。深度表示编码单元从最大编码单元进行空间分割的次数,并且随着深度加深,根据深度的较深编码单元可以从最大编码单元分割到最小编码单元。最大编码单元的深度是最浅深度,并且最小编码单元的深度是最深深度。由于对应于每个深度的编码单元的尺寸随着最大编码单元的深度加深而减小,因此,对应于较浅深度的编码单元可以包括对应于较深深度的多个编码单元。
如上文所述,当前图片的图像数据根据编码单元的最大尺寸分割成最大编码单元,并且每个最大编码单元可以包括根据深度分割的较深编码单元。由于根据实施方式的最大编码单元根据深度进行分割,因此,最大编码单元中包括的空间域的图像数据可以根据深度进行分层分类。
限制最大编码单元的高度和宽度进行分层分割的总次数的编码单元的最大深度和最大尺寸可以预先确定。
编码单元确定器120对通过根据深度分割最大编码单元的区域而获得的至少一个分割区域进行编码,并且根据至少一个分割区域确定输出最终编码的图像数据的深度。换言之,通过根据当前图片的最大编码单元对根据深度的较深编码单元中的图像数据进行编码并且选择具有最小编码误差的深度,编码单元确定器120确定编码深度。根据最大编码单元确定的编码深度和图像数据输出到输出单元130。
最大编码单元中的图像数据基于与等于或小于最大深度的至少一个深度对应的较深编码单元进行编码,并且对图像数据进行编码的结果基于每个较深编码单元进行比较。在比较较深编码单元的编码误差之后,可以选择具有最小编码误差的深度。针对每个最大编码单元,可以选择至少一个编码深度。
随着编码单元根据深度进行分层分割,并且随着编码单元的数量增加,最大编码单元的尺寸被分割。此外,即使编码单元对应于一个最大编码单元中的相同深度,也要通过分别测量每个编码单元的图像数据的编码误差来确定是否将对应于相同深度的编码单元中的每个编码单元分割到较深深度。因此,即使在图像数据被包括在一个最大编码单元中时,编码误差也可以根据一个最大编码单元中的区域而不同,因此,编码深度可以根据图像数据中的区域而不同。因此,在一个最大编码单元中可以确定一个或多个编码深度,并且最大编码单元的图像数据可以根据至少一个编码深度的编码单元划分。
因此,根据实施方式的编码单元确定器120可以确定最大编码单元中包括的具有树形结构的编码单元。根据实施方式的“具有树形结构的编码单元”包括在最大编码单元包括的所有较深编码之中的、与确定为编码深度的深度对应的编码单元。编码深度的编码单元可以根据最大编码单元的相同区域中的深度来分层确定,并且可以在不同区域中独立确定。同样,当前区域中的编码深度可以独立于另一区域中的编码深度进行确定。
根据实施方式的最大深度是与从最大编码单元到最小编码单元的分割次数相关的索引。根据实施方式的第一最大深度可以表示从最大编码单元到最小编码单元的总分割次数。根据实施方式的第二最大深度可以表示从最大编码单元到最小编码单元的深度等级的总数。例如,当最大编码单元的深度为0时,最大编码单元被分割一次的编码单元的深度可以设置为1,并且最大编码单元被分割两次的编码单元的深度可以设置为2。在这种情况下,如果最小编码单元是最大编码单元被分割四次的编码单元,那么存在深度0、1、2、3和4的深度等级,因此,第一最大深度可以设置为4,并且第二最大深度可以设置为5。
预测编码和变换可以根据最大编码单元来执行。预测编码和变换也根据最大编码单元基于根据等于或小于最大深度的深度的较深编码单元来执行。
由于每当最大编码单元根据深度进行分割时较深编码单元的数量都增加,因此,在随着深度加深而生成的所有较深编码单元上执行包括预测编码和变换在内的编码。为便于描述,现在将基于当前深度的编码单元,在最大编码单元中描述预测编码和变换。
根据实施方式的视频编码设备100可以不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码,执行诸如预测编码、变换和熵编码的操作,并且同时,可以将相同的数据单元用于所有操作或者将不同的数据单元用于每个操作。
例如,视频编码设备100不仅可以选择用于对图像数据进行编码的编码单元,而且可以选择不同于编码单元的数据单元,从而对编码单元中的图像数据执行预测编码。
为了在最大编码单元中执行预测编码,可以基于根据实施方式的对应于编码深度的编码单元(即,基于不再分割成对应于较深深度的编码单元的编码单元)执行预测编码。在下文中,不再进行分割并且成为用于预测编码的基础单元的编码单元现在将被称为“预测单元”。通过分割预测单元而获得的分区可以包括预测单元和通过分割预测单元的高度和宽度中的至少之一而获得的数据单元。分区是编码单元的预测单元被分割的数据单元,并且预测单元可以是与编码单元具有相同尺寸的分区。
例如,当2N×2N(其中N是正整数)的编码单元不再分割并且成为2N×2N的预测单元时,分区的尺寸可以是2N×2N、2N×N、N×2N或N×N。分区模式的示例可以包括通过对称地分割预测单元的高度或宽度而获得的对称分区,并且可以选择性地包括通过不对称地分割预测单元的高度或宽度(诸如1:n或n:1)而获得的分区、通过几何分割预测单元而获得的分区以及具有任意类型的分区。
预测单元的预测模式可以是帧内模式、帧间模式和跳跃模式中的至少之一。例如,帧内模式和帧间模式可以在2N×2N、2N×N、N×2N或N×N的分区上执行。此外,跳跃模式可以只在2N×2N的分区上执行。编码在编码单元中的一个预测单元上独立执行,从而可以选择具有最小编码误差的预测模式。
根据实施方式的视频编码设备100也可以不仅基于用于对图像数据进行编码的编码单元而且基于不同于编码单元的数据单元而对编码单元中的图像数据执行变换。为了在编码单元中执行变换,可以基于具有小于或等于编码单元的尺寸的变换单元来执行变换。例如,变换单元可以包括用于帧内模式的数据单元和用于帧间模式的变换单元。
编码单元中的变换单元可以按与根据树形结构的编码单元的类似方式递归地分割成更小尺寸的区域,因此,编码单元的残差数据可以根据具有树形结构的变换单元依据变换深度进行划分。
表明通过分割编码单元的高度和宽度来达到变换单元的分割次数的变换深度也可以在变换单元中设置。例如,在2N×2N的当前编码单元中,当变换单元的尺寸是2N×2N时变换深度可以为0,当变换单元的尺寸是N×N时变换深度可以为1,以及当变换单元的尺寸是N/2×N/2时变换深度可以为2。换言之,具有树形结构的变换单元可以根据变换深度进行设置。
根据编码深度的编码信息不仅需要与编码深度有关的信息,而且需要与预测编码和变换相关的信息。因此,编码单元确定器120不仅确定具有最小编码误差的编码深度,而且确定将预测单元分割成分区的分区模式、根据预测单元的预测模式以及用于变换的变换单元的尺寸。
下文将参考图7到图19详细描述根据实施方式的最大编码单元中的根据树形结构的编码单元以及确定预测单元/分区和变换单元的方法。
编码单元确定器120可以通过使用基于拉格朗日乘子的率失真优化来测量根据深度的较深编码单元的编码误差。
输出单元130以比特流的形式输出基于由编码单元确定器120确定的至少一个编码深度进行编码的最大编码单元的图像数据以及根据深度的编码模式信息。
通过对图像的残差数据进行编码可以获得编码的图像数据。
根据深度的编码模式信息可以包括编码深度信息、与预测单元的分区模式有关的信息、与预测模式有关的信息以及与变换单元的尺寸有关的信息。
编码深度信息可以通过使用根据深度的分割信息进行限定,从而表明是否在较深深度而非当前深度的编码单元上执行编码。如果当前编码单元的当前深度是编码深度,那么将当前编码单元编码到当前深度的编码单元,因此,当前深度的分割信息可以限定为不将当前编码单元分割到较深深度。相反,如果当前编码单元的当前深度不是该深度,那么必须在较深深度的编码单元上执行编码,因此,当前深度的分割信息可以定义为将当前编码单元分割到较深深度的编码单元。
如果当前深度不是编码深度,那么在分割成较深深度的编码单元的编码单元上执行编码。由于较深深度的至少一个编码单元存在于当前深度的一个编码单元中,因此,在较深深度的每个编码单元上重复执行编码,因而可以针对具有相同深度的编码单元递归地执行编码。
由于针对一个最大编码单元确定具有树形结构的编码单元并且针对编码深度的编码单元确定编码深度信息,因此,可以针对一个最大编码单元确定至少一项编码深度信息。此外,最大编码单元的图像数据的编码深度可以根据位置而不同,这是因为图像数据根据深度进行分层分割,因此,可以针对图像数据来设置编码深度和编码深度信息。
因此,根据实施方式的输出单元130可以将与对应编码深度和编码模式有关的编码信息分配到最大编码单元中包括的编码单元、预测单元和最小单元中的至少之一。
根据实施方式的最小单元是通过将构成最深编码深度的最小编码单元分割成4个而获得的正方形数据单元。或者,根据实施方式的最小单元可以是可被包括在最大编码单元所包括的所有编码单元、预测单元、分区单元和变换单元中的最大正方形数据单元。
例如,由输出单元130输出的编码信息可以分类成根据较深编码单元的编码信息和根据预测单元的编码信息。根据较深编码单元的编码信息可以包括与预测模式有关的信息和与分区的尺寸有关的信息。根据预测单元的编码信息可以包括与帧间模式的估计方向有关的信息、与帧间模式的参考图像索引有关的信息、与运动矢量有关的信息、与帧内模式的色度样本有关的信息以及与帧内模式的内插法有关的信息。
与根据图片、条带或GOP定义的编码单元的最大尺寸有关的信息以及与最大深度的有关信息可以***到比特流的标头、序列参数集或图片参数集中。
与当前视频准许的变换单元的最大尺寸的有关信息以及与变换单元的最小尺寸有关的信息也可以通过比特流的标头、序列参数集或图片参数集输出。输出单元130可以对与上述偏移调整技术有关的偏移参数进行编码并输出。
根据视频编码设备100的最简单实施方式,较深编码单元可以是通过将较浅深度的编码单元(上一层的编码单元)的高度或宽度一分为二所得到的编码单元。换言之,在当前深度的编码单元的尺寸是2N×2N时,较深深度的编码单元的尺寸是N×N。此外,具有2N×2N尺寸的当前深度的编码单元可以包括最大4个较深深度的编码单元。
因此,通过基于最大编码单元的尺寸和考虑到当前图片的特征而确定的最大深度来确定每个最大编码单元的具有最佳形状和最佳尺寸的编码单元,视频编码设备100可以形成具有树形结构的编码单元。此外,由于可以通过使用各种预测模式和变换中的任一个在每个最大编码单元上执行编码,因此,可以根据各种图像尺寸的编码单元的特征来确定最佳编码模式。
因此,如果具有高分辨率或大数据量的图像在传统宏块中编码,那么每个图片的宏块数量过度增加。因此,针对每个宏块生成的压缩信息的数量增加,因而难以传输压缩的信息并且数据压缩效率降低。然而,通过使用根据实施方式的视频编码设备,图像压缩效率可以增加,这是因为在考虑图像的特征同时调整编码单元,同时考虑图像的尺寸而增大编码单元的最大尺寸。
图12的视频编码设备100可执行上文参考图1A描述的视频编码设备10的操作。
编码单元确定器120可以执行偏移编码设备10的偏移参数确定器14的操作。可以相对于每个LCU来确定偏移类型、根据类别的偏移值和偏移分类。
输出单元130可以执行偏移参数编码器16的操作。可以输出相对于每个LCU确定的偏移参数。最初可以输出表明是否将当前LCU的相邻LCU的偏移参数用作当前偏移参数的偏移合并信息。作为偏移类型,可以输出关闭类型、边缘类型或带类型。偏移值可以按照零值信息、符号信息和其他偏移值的顺序输出。相对于边缘类型,可以不输出偏移值的符号信息。
在当前LCU的偏移合并信息允许采用相邻LCU的偏移参数时,可以不输出当前LCU的偏移类型和偏移值。
图13是根据本公开的实施方式的基于根据树形结构的编码单元的视频解码设备200的框图。
根据实施方式的基于根据树形结构的编码单元的视频解码设备200包括接收器210、图像数据与编码信息提取器220以及图像数据解码器230。为便于描述,根据实施方式的基于根据树形结构的编码单元的视频解码设备200将简称为“视频解码设备200”。
根据实施方式,用于视频解码设备200的解码操作的各种术语(诸如,编码单元、深度、预测单元、变换单元和各种类型的编码模式信息)的定义与参考图12和视频编码设备100描述的那些定义相同。
接收器210接收并解析编码视频的比特流。图像数据与编码信息提取器220从解析的比特流中提取用于每个编码单元的编码图像数据,其中编码单元具有根据每个最大编码单元的树形结构,并且将提取的图像数据输出到图像数据解码器230。图像数据与编码信息提取器220可以从与当前图片有关的标头、序列参数集或图片参数集中提取与当前图片的编码单元的最大尺寸有关的信息。
此外,图像数据与编码信息提取器220针对根据每个最大编码单元的具有树形结构的编码单元从解析的比特流中提取编码深度和编码模式信息。提取的编码深度和编码模式信息输出到图像数据解码器230。换言之,比特流中的图像数据分割成最大编码单元,使得图像数据解码器230针对每个最大编码单元将图像数据解码。
根据最大编码单元的编码深度和编码模式信息可以针对至少一项编码深度信息进行设置,并且编码模式信息可以包括与对应编码单元的分区模式有关的信息、与预测模式有关的信息以及与变换单元的尺寸有关的信息。此外,根据深度的分割信息可以被提取为与编码深度有关的信息。
由图像数据与编码信息提取器220提取的根据每个最大编码单元的编码深度和编码模式信息是被确定当诸如根据实施方式的视频编码设备100等编码器根据每个最大编码单元针对根据深度的每个较深编码单元重复执行编码时会生成最小编码误差的编码深度和编码模式信息。因此,视频解码设备200可以通过根据生成最小编码误差的编码模式对数据进行解码来重建图像。
由于与编码深度和编码模式信息有关的编码信息可以分配到对应编码单元、预测单元和最小单元之中的预定数据单元,因此,图像数据与编码信息提取器220可以根据预定数据单元提取编码深度和编码模式信息。如果对应最大编码单元的编码深度和编码模式信息根据预定数据单元进行记录,那么可以推断,被分配相同编码深度和相同编码模式信息的预定数据单元就是相同最大编码单元中包括的数据单元。
图像数据解码器230可以通过基于根据最大编码单元的编码深度和编码模式信息将每个最大编码单元中的图像数据解码来重建当前图片。换言之,图像数据解码器230可以基于与每个最大编码单元中包括的具有树形结构的编码单元之中的、每个编码单元的分区模式、预测模式和变换单元有关的读取信息对图像数据进行解码。解码过程可以包括预测和逆变换,所述预测包括帧内预测和运动补偿。
基于与根据编码深度的编码单元的预测单元的分区模式和预测类型有关的信息,图像数据解码器230可以根据每个编码单元的分区和预测模式来执行帧内预测或运动补偿。
此外,图像数据解码器230可以读取与用于每个编码单元的根据树形结构的变换单元有关的信息,从而基于每个编码单元的变换单元来执行逆变换,从而针对每个最大编码单元进行逆变换。经由逆变换,可以重建编码单元的空间区域的像素值。
图像数据解码器230可以通过使用根据深度的分割信息来确定当前最大编码单元的编码深度。如果分割信息表明图像数据不再以当前深度分割,那么当前深度就是编码深度。因此,图像数据解码器230可以通过使用与预测单元的分区模式、预测类型和变换单元的尺寸有关的信息来对当前最大编码单元中的编码数据进行解码。
换言之,通过观察分配给编码单元、预测单元和最小单元之中的预定数据单元的编码信息集,可以收集含有包括相同分割信息的编码信息的数据单元,并且可以将收集的数据单元视作将由图像数据解码器230以相同编码模式解码的一个数据单元。因此,可以通过获取与用于每个编码单元的编码模式有关的信息来对当前编码单元进行解码。
此外,图13的视频解码设备200可执行上文参考图2A描述的视频解码设备20的操作。
图像数据与编码信息提取器220和接收器210可以执行视频解码设备20的偏移参数提取器22的操作。图像数据解码器230可以执行偏移调整器26的偏移确定器24的操作。
当图像数据与编码信息提取器220只从比特流中解析偏移合并信息而不从比特流中解析当前LCU的偏移参数时,图像数据与编码信息提取器220可以按与相邻偏移参数中的至少一个参数相同的方式来重建当前偏移参数。相邻偏移参数之中的将被参考的参数可以基于偏移合并信息进行确定。如果图像数据与编码信息提取器220基于从比特流中解析的当前LCU的偏移合并信息而确定相邻偏移参数和当前偏移参数不同,那么可以从比特流中解析并重建当前LCU的当前偏移参数。
图像数据与编码信息提取器220可以从比特流中解析每个LCU的偏移参数。可以从偏移参数中确定偏移类型、根据类别的偏移值和偏移分类。在当前LCU的偏移类型是关闭类型时,可以结束在当前LCU上的偏移调整操作。当偏移类型是边缘类型时,可以基于表明重建的每个像素的边缘方向的边缘分类和表明边缘形状的类别从所接收的偏移中选择当前偏移值。当偏移类型是带类型时,可以确定重建的每个像素的带,并且可以从偏移值中选择与当前带对应的偏移值。
图像数据解码器230可以生成重建的像素,所述重建的像素能够通过依据对应的偏移值调整重建的像素的像素值来最小化原始像素与重建的像素之间的误差。每个LCU的重建的像素的偏移可以基于所解析的偏移参数进行调整。
因此,视频解码设备200可以获取与在针对每个最大编码单元递归地执行编码时生成最小编码误差的至少一个编码单元有关的信息,并且可以使用该信息来对当前图片进行解码。换言之,可以对确定是每个最大编码单元中的最佳编码单元的、具有树形结构的编码单元进行解码。
因此,即使图像具有高分辨率或具有过大的数据量,图像仍可以通过使用编码单元的尺寸和编码模式来高效解码和重建,所述编码单元的尺寸和编码模式是通过使用从编码器接收的最佳编码模式信息根据图像的特征而自适应地确定的。
图14是用于描述根据本公开的实施方式的编码单元的概念的示意图。
编码单元的尺寸可以由宽度×高度来表示,并且可以是64×64、32×32、16×16和8×8。64×64的编码单元可以分割成64×64、64×32、32×64或32×32的分区,并且32×32的编码单元可以分割成32×32、32×16、16×32或16×16的分区,16×16的编码单元可以分割成16×16、16×8、8×16或8×8的分区,以及8×8的编码单元可以分割成8×8、8×4、4×8或4×4的分区。
在视频数据310中,分辨率是1920×1080,编码单元的最大尺寸是64,并且最大深度是2。在视频数据320中,分辨率是1920×1080,编码单元的最大尺寸是64,并且最大深度是3。在视频数据330中,分辨率是352×288,编码单元的最大尺寸是16,并且最大深度是1。图14所示的最大深度是指从最大编码单元到最小编码单元的总分割次数。
如果分辨率较高或数据量较大,那么编码单元的最大尺寸可以较大,从而不仅增加编码效率,而且准确反映图像的特征。因此,分辨率比视频数据330高的视频数据310和320的编码单元的最大尺寸可以是64。
由于视频数据310的最大深度是2,因此,视频数据315的编码单元310可以包括长轴尺寸为64的最大编码单元,以及长轴尺寸为32和16的编码单元,这是因为通过将最大编码单元分割两次,深度加深两个层。由于视频数据330的最大深度是1,因此,视频数据330的编码单元335可以包括长轴尺寸为16的最大编码单元,以及长轴尺寸为8的编码单元,这是因为通过将最大编码单元分割一次,深度加深一层。
由于视频数据320的最大深度是3,因此,视频数据325的编码单元320可以包括长轴尺寸为64的最大编码单元,以及长轴尺寸为32、16和8的编码单元,这是因为通过将最大编码单元分割三次,深度加深3个层。随着深度加深,可以准确地表达详细信息。
图15是根据本公开的实施方式的基于编码单元的图像编码器400的框图。
图像编码器400执行视频编码设备100的编码单元确定器120的操作,以对图像数据进行编码。换言之,帧内预测器410在当前帧405之中以帧内模式对编码单元执行帧内预测,并且运动估算器420和运动补偿器425通过使用当前帧405和参考帧495在当前帧405之中以帧间模式对编码单元分别执行帧间估算和运动补偿。
从帧内预测器410、运动估算器420和运动补偿器425输出的数据通过数据变换器430和量化器440作为经量化的变换系数输出。经量化的变换系数通过反量化器460和逆变换器470而被重建为空间域中的数据,并且空间域中的重建数据在经过去块化滤波器480和偏移调整器490进行后处理之后作为参考帧495输出。经量化的变换系数可以通过熵编码器450作为比特流455输出。
为了将图像编码器400应用于视频编码设备100,图像编码器400的所有元件(即,帧内预测器410、运动估算器420、运动补偿器425、变换器430、量化器440、熵编码器450、反量化器460、逆变换器470、去块化滤波器480和偏移调整器490)在考虑每个LCU的最大深度的同时基于具有树形结构的编码单元之中的每个编码单元来执行操作。
具体而言,帧内预测器410、运动估算器420和运动补偿器425在考虑当前LCU的最大尺寸和最大深度的同时确定具有树形结构的编码单元之中的每个编码单元的分区和预测模式,并且变换器430确定具有树形结构的编码单元之中的每个编码单元中的变换单元的尺寸。
图像编码器400可以根据参考帧495的每个LCU的边缘类型(或带类型)将像素分类,可以确定边缘方向(或带开始位置),并且可以确定每个类别中包括的重建像素的平均误差值。针对每个LCU,可以对偏移使用信息、偏移合并信息和偏移参数进行编码并且信号化。
图16是根据本公开的实施方式的基于编码单元的图像解码器500的框图。
解析器510从比特流505中解析将要解码的编码图像数据和与解码所需的编码有关的信息。编码图像数据通过熵解码器520和反量化器530而作为反量化数据输出,并且反量化数据通过逆变换器540而被重建成空间域的图像数据。
帧内预测器550相对于空间域中的图像数据在帧内模式下对编码单元执行帧内预测,并且运动补偿器560通过使用参考帧585在帧间模式下对编码单元执行运动补偿。
经过帧内预测器550和运动补偿器560的空间域中的图像数据可以在经过去块化滤波器570和偏移调整器580后处理之后作为重建的帧595输出。此外,经过去块化滤波器570和偏移调整器580后处理的图像数据可以作为参考帧585输出。
为了在视频解码设备200的图像数据解码器230中对图像数据进行解码,图像解码器500可以执行在解析器510之后执行的操作。
为了将图像解码器500应用于视频解码设备200,图像解码器500的所有元件(即,解析器510、熵解码器520、反量化器530、逆变换器540、帧内预测器550、运动补偿器560、去块化滤波器570和偏移调整器580)针对每个LCU基于具有树形结构的编码单元来执行操作。
具体而言,帧内预测器550和运动补偿器560针对具有树形结构的编码单元中的每个基于分区和预测模式来执行操作,并且逆变换器540针对每个编码单元基于变换单元的尺寸来执行操作。
图像解码器500可以从比特流中提取每个LCU的偏移使用信息、偏移合并信息和偏移参数。与相邻LCU的偏移参数相同的当前偏移参数可以基于当前LCU的偏移合并信息进行重建。通过使用当前LCU的偏移参数之中的偏移类型和偏移值,可以根据边缘类型或带类型依据对应于类别的偏移值来调整重建的帧595的LCU的重建像素中的每个像素。
图17是示出根据本公开的实施方式的根据深度的编码单元和分区的示意图。
根据实施方式的视频编码设备100和根据实施方式的视频解码设备200使用分层编码单元,从而考虑图像的特征。编码单元的最大高度、最大宽度和最大深度可以根据图像的特征而自适应地确定,或者可以根据用户需要而不同地设置。根据深度的较深编码单元的尺寸可以根据编码单元的预定最大尺寸进行确定。
在根据实施方式的编码单元的分层结构600中,编码单元的最大高度和最大宽度均是64,并且最大深度是3。就这点而言,最大深度是指编码单元从最大编码单元分割到最小编码单元的总次数。由于深度沿着编码单元的分层结构600的竖直轴加深,因此,较深编码单元的高度和宽度均被分割。此外,沿着分层结构600的水平轴示出作为每个较深编码单元的预测编码的基础的预测单元和分区。
换言之,编码单元610是分层结构600中的最大编码单元,其中深度为0并且尺寸(即,高度乘宽度)为64×64。深度沿着竖直轴加深,而且存在尺寸为32×32且深度为1的编码单元620、尺寸为16×16且深度为2的编码单元630,以及尺寸为8×8且深度为3的编码单元640。尺寸为4×4且深度为3的编码单元640是最小编码单元。
编码单元的预测单元和分区根据每个深度沿着水平轴布置。换言之,如果尺寸为64×64且深度为0的编码单元610是预测单元,那么预测单元可以分割成尺寸为64×64的编码单元610中包括的分区,即,尺寸为64×64的分区610、尺寸为64×32的分区612、尺寸为32×64的分区614,或者尺寸为32×32的分区616。
同样,尺寸为32×32且深度为1的编码单元620的预测单元可以分割成尺寸为32×32的编码单元620中包括的分区,即,尺寸为32×32的分区620、尺寸为32×16的分区622、尺寸为16×32的分区624以及尺寸为16×16的分区626。
同样,尺寸为16×16且深度为2的编码单元630的预测单元可以分割成尺寸为16×16的编码单元630中包括的分区,即,编码单元630中包括的尺寸为16×16的分区、尺寸为16×8的分区632、尺寸为8×16的分区634以及尺寸为8×8的分区636。
同样,尺寸为8×8且深度为3的编码单元640的预测单元可以分割成尺寸为8×8的编码单元640中包括的分区,即,编码单元640中包括的尺寸为8×8的分区640、尺寸为8×4的分区642、尺寸为4×8的分区644以及尺寸为4×4的分区646。
为了确定最大编码单元610的深度,根据各种实施方式的视频编码设备100的编码单元确定器120针对最大编码单元610中包括的与每个深度对应的编码单元来执行编码。
包括相同范围和相同尺寸的数据的、根据深度的较深编码单元的数量随着深度加深而增加。例如,需要四个对应于深度2的编码单元来覆盖一个对应于深度1的编码单元中包括的数据。因此,为了将根据深度的相同数据的编码结果进行比较,对应于深度1的编码单元和对应于深度2的四个编码单元均被编码。
为了针对深度之中的当前深度执行编码,可以通过沿着分层结构600的水平轴、针对与当前深度对应的编码单元中的每个预测单元执行编码,为当前深度选择最小编码误差。或者,随着深度沿着分层结构600的竖直轴加深,可以通过针对每个深度执行编码,根据深度来比较最小编码误差而搜索出最小编码误差。最大编码单元610中具有最小编码误差的深度和分区可以被选作最大编码单元610的深度和分区模式。
图18是用于描述根据本公开的实施方式的编码单元与变换单元之间的关系的示意图。
根据实施方式的视频编码设备100或根据实施方式的视频解码设备200根据每个最大编码单元的、尺寸小于或等于最大编码单元的编码单元对图像进行编码或解码。在编码期间用于变换的变换单元的尺寸可以基于不大于对应编码单元的数据单元进行选择。
例如,在视频编码设备100或视频解码设备200中,当编码单元710的尺寸是64×64时,可以通过使用尺寸为32×32的变换单元720来执行变换。
此外,可以通过对尺寸为32×32、16×16、8×8和4×4(都小于64×64)的变换单元中的每个变换单元执行变换而对尺寸为64×64的编码单元710的数据进行编码,并且随后可以选择具有最小编码误差的变换单元。
图19示出根据本公开的实施方式的多项编码信息。
根据实施方式的视频编码设备100的输出单元130可以针对与编码深度对应的每个编码单元来编码并传输与分区模式有关的信息800、与预测模式有关的信息810和与变换单元的尺寸有关的信息820,以作为编码模式信息。
信息800表明与通过分割当前编码单元的预测单元而获得的分区的类型有关的信息,其中分区是用于对当前编码单元进行预测编码的数据单元。例如,尺寸为2N×2N的当前编码单元CU_0可以分割成下列分区中的任一个:尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808。在这种情况下,与当前编码单元有关的分区模式信息800设置成表明下列分区中的一个:尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808。
预测模式信息810表明每个分区的预测模式。例如,预测模式信息810可以表明在由分区模式信息800表明的分区上执行的预测编码的模式,即,帧内模式812、帧间模式814或跳跃模式816。
变换单元尺寸信息820表示在当前编码单元上执行变换时将依据的变换单元。例如,所述变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或者第二帧内变换单元828。
根据实施方式的视频解码设备200的图像数据与编码信息提取器210可以提取并使用分区模式信息800、预测模式信息810和变换单元尺寸信息820,以根据每个较深编码单元进行解码。
图20是根据本公开的实施方式的根据深度的较深编码单元的示意图。
分割信息可以用来表明深度的变化。分割信息表明当前深度的编码单元是否分割成较深深度的编码单元。
用于对深度为0且尺寸为2N_0×2N_0的编码单元900进行预测编码的预测单元910可以包括下列分区模式的分区:尺寸为2N_0×2N_0的分区模式912、尺寸为2N_0×N_0的分区模式914、尺寸为N_0×2N_0的分区模式916和尺寸为N_0×N_0的分区模式918。只示出通过对称地分割预测单元而获得的分区模式912、914、916和918,但如上文所述,分区模式不限于此,并且可以包括不对称分区、具有预定形状的分区和具有几何形状的分区。
根据每个分区模式,必须在尺寸为2N_0×2N_0的一个分区、尺寸为2N_0×N_0的两个分区、尺寸为N_0×2N_0的两个分区和尺寸为N_0×N_0的四个分区上重复执行预测编码。可以在尺寸为2N_0×2N_0、N_0×2N_0、2N_0×N_0和N_0×N_0的分区上执行帧内模式和帧间模式的预测编码。只在尺寸为2N_0×2N_0的分区上执行跳跃模式的预测编码。
如果尺寸为2N_0×2N_0的分区模式912、尺寸为2N_0×N_0的分区模式914和尺寸为N_0×2N_0的分区模式916中的一个分区模式的编码误差是最小的,那么预测单元910可以不分割到较深深度。
如果尺寸为N_0×N_0的分区模式918的编码误差是最小的,那么深度从0变成1并且执行分割(操作920),并且在深度为2且尺寸为N_0×N_0的分区模式的编码单元930上重复执行编码,从而搜索最小编码误差。
用于对深度为1且尺寸为2N_1×2N_1(=N_0×N_0)的编码单元930进行预测编码的预测单元940可以包括:尺寸为2N_1×2N_1的分区模式942、尺寸为2N_1×N_1的分区模式944、尺寸为N_1×2N_1的分区模式946和尺寸为N_1×N_1的分区模式948。
如果尺寸为N_1×N_1的分区模式948的编码误差是最小的,那么深度从1变成2并且执行分割(在操作950中),并且在深度为2且尺寸为N_2×N_2的编码单元960上重复执行编码,从而搜索最小编码误差。
当最大深度为d时,可以执行根据每个深度的分割操作,直到深度变成d-1,并且可以对分割信息进行编码,直到深度是0到d-2中的一个。换言之,当在对应于深度d-2的编码单元进行分割之后执行编码直到深度为d-1(在操作970中)时,用于对深度为d-1且尺寸为2N_(d-1)×2N_(d-1)的编码单元980进行预测编码的预测单元990可以包括下列分区模式的分区:尺寸为2N_(d-1)×2N_(d-1)的分区模式992、尺寸为2N_(d-1)×N_(d-1)的分区模式994、尺寸为N_(d-1)×2N_(d-1)的分区模式996和尺寸为N_(d-1)×N_(d-1)的分区模式998。
可以在分区模式之中的尺寸为2N_(d-1)×2N_(d-1)的一个分区、尺寸为2N_(d-1)×N_(d-1)的两个分区、尺寸为N_(d-1)×2N_(d-1)的两个分区、尺寸为N_(d-1)×N_(d-1)的四个分区上执行预测编码,以搜索具有最小编码误差的分区模式。
即使在尺寸为N_(d-1)×N_(d-1)的分区模式998具有最小编码误差时,由于最大深度为d,因此,深度为d-1的编码单元CU_(d-1)不再分割到较深深度,并且构成当前最大编码单元900的编码单元的编码深度被确定为d-1,而且当前最大编码单元900的分区模式可以被确定为N_(d-1)×N_(d-1)。此外,由于最大深度为d,因此,不设置深度为d-1的编码单元952的分割信息。
数据单元999可以是当前最大编码单元的“最小单元”。根据实施方式的最小单元可以是通过将具有最深深度的最小编码单元分割成4个而获得的正方形数据单元。通过重复执行编码,根据实施方式的视频编码设备100可以通过比较根据编码单元900的深度的编码误差来选择具有最小编码误差的深度从而确定编码深度,并且将对应的分区模式和预测模式设置为编码深度的编码模式。
因此,在所有的深度0、1、……、d-1、d中比较根据深度的最小编码误差,并且可以将具有最小编码误差的深度确定为编码深度。编码深度、预测单元的分区模式和预测模式可以作为编码模式信息而被编码和传输。此外,由于编码单元从深度0分割到编码深度,因此,只有编码深度的分割信息设置为0,而除编码深度之外的深度的分割信息设置为1。
根据实施方式的视频解码设备200的图像数据与编码信息提取器220可以提取并使用与编码单元900有关的编码深度和预测单元信息,从而对编码单元912进行解码。根据实施方式的视频解码设备200可以通过使用根据深度的分割信息而将分割信息为“0”的深度确定为编码深度,并且可以将与对应深度有关的编码模式信息用于解码。
图21、图22和图23是用于描述根据本公开的实施方式的编码单元、预测单元与变换单元之间的关系的示意图。
编码单元1010是最大编码单元中的由视频编码设备100确定的、根据深度的较深编码单元。预测单元1060是根据编码深度的编码单元1010中的每个的预测单元的分区,并且变换单元1070是根据编码深度的编码单元中的每个的变换单元。
当编码单元1010中的最大编码单元的深度为0时,编码单元1012和1054的深度为1,编码单元1014、1016、1018、1028、1050和1052的深度为2,编码单元1020、1022、1024、1026、1030、1032和1048的深度为3,并且编码单元1040、1042、1044和1046的深度为4。
在预测单元1060中,通过分割编码单元获得一些编码单元1014、1016、1022、1032、1048、1050、1052和1054。换言之,分区1014、1022、1050和1054是尺寸为2N×N的分区模式,分区1016、1048和1052是尺寸为N×2N的分区模式,并且分区1032是尺寸为N×N的分区模式。编码单元1010的预测单元和分区小于或等于每个编码单元。
在小于编码单元1052的数据单元中,对变换单元1070中的编码单元1052的图像数据执行变换或逆变换。此外,变换单元1070中的编码单元1014、1016、1022、1032、1048、1050和1052是在尺寸和形状方面不同于预测单元1060中的数据单元的数据单元。换言之,根据实施方式的视频编码设备100和视频解码设备200可以对相同编码单元中的各个数据单元执行帧内预测/运动估算/运动补偿/以及变换/逆变换。
因此,对最大编码单元的每个区域中具有分层结构的编码单元中的每个递归地执行编码,从而确定最佳编码单元,因而可以获得具有递归树形结构的编码单元。编码信息可以包括与编码单元有关的分割信息、分区模式信息、预测模式信息,以及变换单元尺寸信息。下表1示出可以由根据实施方式的视频编码设备100和视频解码设备200设置的编码信息。
表1
因此,根据实施方式的视频编码设备100的输出单元130可以输出与具有树形结构的编码单元有关的编码信息,并且根据实施方式的视频解码设备200的图像数据与编码信息提取器220可以从接收的比特流中提取与具有树形结构的编码单元有关的编码信息。
分割信息表明当前编码单元是否分割成较深深度的编码单元。如果当前深度d的分割信息为0,那么当前编码单元不再分割到较深深度所在的深度是编码深度,因此,可以针对编码深度来限定分区模式信息、预测模式信息和变换单元尺寸信息。如果当前编码单元必须根据分割信息进一步分割,那么必须在较深深度的四个分割编码单元上独立地执行编码。
预测模式可以是帧内模式、帧间模式和跳跃模式中的一种。帧内模式和帧间模式可以限定于所有分区模式,而跳跃模式只限定于尺寸为2N×2N的分区模式。
分区模式信息可以表明通过对称地分割预测单元的高度或宽度而获得的尺寸为2N×2N、2N×N、N×2N和N×N的对称分区模式,以及通过不对称地分割预测单元的高度或宽度而获得的尺寸为2N×nU、2N×nD、nL×2N和nR×2N的不对称分区模式。尺寸为2N×nU和2N×nD的不对称分区模式可以分别通过以1:3和3:1分割预测单元的高度来获得,并且尺寸为nL×2N和nR×2N的不对称分区模式可以分别通过以1:3和3:1分割预测单元的宽度来获得。
变换单元的尺寸可以设置为在帧内模式下有两个类型并且在帧间模式下有两个类型。换言之,如果变换单元的分割信息为0,那么变换单元的尺寸可以是2N×2N,也就是当前编码单元的尺寸。如果变换单元的分割信息为1,那么可以通过分割当前编码单元来获得变换单元。此外,如果尺寸为2N×2N的当前编码单元的分区模式是对称分区模式,那么变换单元的尺寸可以是N×N,并且如果当前编码单元的分区模式是不对称分区模式,那么变换单元的尺寸可以是N/2×N/2。
根据实施方式的与具有树形结构的编码单元有关的编码信息可以分配到与编码深度对应的编码单元、预测单元和最小单元中的至少之一。与编码深度对应的编码单元可以包括含有相同编码信息的预测单元和最小单元中的至少之一。
因此,通过比较相邻数据单元的编码信息来确定相邻数据单元是否包括在对应于编码深度的相同编码单元中。此外,通过使用数据单元的编码信息来确定对应于编码深度的编码单元,因此可以推断出最大编码单元中的编码深度的分布。
因此,如果基于相邻数据单元来预测当前编码单元,那么可以直接参考并使用与当前编码单元相邻的较深编码单元中的数据单元的编码信息。
或者,如果当前编码单元基于相邻编码单元进行预测编码,那么通过使用相邻较深编码单元的编码信息来搜索与当前编码单元相邻的数据单元,并且可以推断出所搜索的相邻编码单元。
图24是用于描述根据表1的编码模式信息的编码单元、预测单元与变换单元之间的关系的示意图。
最大编码单元1300包括编码单元1302、1304、1306、1312、1314、1316、以及具有编码深度的1318。此处,由于编码单元1318是具有深度的编码单元,因此,分割信息可以设置为0。尺寸为2N×2N的编码单元1318的分区模式信息可以设置为包括下列的分区模式中的一个:2N×2N 1322、2N×N 1324、N×2N 1326、N×N 1328、2N×nU 1332、2N×nD 1334、nL×2N 1336和nR×2N 1338。
变换单元分割信息(TU尺寸标记)是一种变换索引,并且与变换索引对应的变换单元的尺寸可以根据编码单元的预测单元类型或分区模式而改变。
例如,当分区模式信息设置为对称分区模式2N×2N 1322、2N×N 1324、N×2N1326和N×N 1328中的一项时,如果变换单元分割信息为0,那么设置尺寸为2N×2N的变换单元1342,并且如果变换单元分割信息为1,那么可以设置尺寸为N×N的变换单元1344。
当分区模式信息设置为不对称分区模式2N×nU 1332、2N×nD 1334、nL×2N 1336和nR×2N 1338中的一个时,如果变换单元分割信息(TU尺寸标记)为0,那么可以设置尺寸为2N×2N的变换单元1352,并且如果变换单元分割信息为1,那么可以设置尺寸为N/2×N/2的变换单元1354。
上文参考图24描述的变换单元分割信息(TU尺寸标记)是值为0或1的标记,但根据实施方式的变换单元分割信息不限于具有1比特的标记,并且变换单元可以分层地分割,而同时变换单元分割信息根据设置以0、1、2、3等的方式增长。变换单元的分割信息(TU尺寸标记)是变换索引的示例。
在这种情况下,实际使用的变换单元的尺寸可以通过使用根据实施方式的变换单元分割信息以及变换单元的最大尺寸和变换单元的最小尺寸一起来表示。根据实施方式的视频编码设备100可以对最大变换单元尺寸信息、最小变换单元尺寸信息和最大变换单元分割信息进行编码。对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记进行编码的结果可以***到SPS。根据实施方式的视频解码设备200可以通过使用最大变换单元尺寸信息、最小变换单元尺寸信息和最大变换单元分割信息来对视频进行解码。
例如,(a)如果当前编码单元的尺寸是64×64并且最大变换单元尺寸是32×32,那么(a-1)变换单元的尺寸在TU尺寸标记为0时可以是32×32,(a-2)在TU尺寸标记为1时可以是16×16,以及(a-3)在TU尺寸标记为2时可以是8×8。
作为另一示例,(b)如果当前编码单元的尺寸是32×32并且最小变换单元尺寸是32×32,那么(b-1)变换单元的尺寸在TU尺寸标记为0时可以是32×32。此处,由于变换单元的尺寸不可小于32×32,因此,TU尺寸标记无法设置成除了0之外的值。
作为另一示例,(c)如果当前编码单元的尺寸是64×64并且最大TU尺寸标记是1,那么TU尺寸标记可以是0或1。此处,TU尺寸标记无法设置成除了0或1之外的值。
因此,如果将最大TU尺寸标记定义为“MaxTransformSizeIndex”,将最小变换单元尺寸定义为“MinTransformSize”,并且当TU尺寸标记为0时变换单元尺寸为“RootTuSize”,那么可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”可以由等式(1)定义:
CurrMinTuSize
=max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex))...(1)
与可以在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”相比,TU尺寸标记为0时的变换单元尺寸“RootTuSize”可表示可以在***中选择的最大变换单元尺寸。在等式(1)中,“RootTuSize/(2^MaxTransformSizeIndex)”表示在TU尺寸标记为0时变换单元尺寸“RootTuSize”被分割对应于最大TU尺寸标记的次数时的变换单元尺寸,并且“MinTransformSize”表示最小变换尺寸。因此,“RootTuSize/(2^MaxTransformSizeIndex)”和“MinTransformSize”之中的较小值可以是可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”。
根据实施方式的最大变换单元尺寸RootTuSize可以根据预测模式的类型而改变。
例如,如果当前预测模式是帧间模式,那么“RootTuSize”可以通过使用下列等式(2)来确定。在等式(2)中,“MaxTransformSize”表示最大变换单元尺寸,并且“PUSize”表示当前预测单元尺寸。
RootTuSize=min(MaxTransformSize,PUSize).........(2)
换言之,如果当前预测模式是帧间模式,那么在TU尺寸标记为0时,变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前预测单元尺寸之中的较小值。
如果当前分区单元的预测模式是帧内模式,那么“RootTuSize”可以通过使用下列等式(3)来确定。在等式(3)中,“PartitionSize”表示当前分区单元的尺寸。
RootTuSize=min(MaxTransformSize,PartitionSize)...........(3)
换言之,如果当前预测模式是帧内模式,那么在TU尺寸标记为0时,变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前分区单元的尺寸之中的较小值。
然而,根据分区单元中的预测模式的类型而改变的当前最大变换单元尺寸“RootTuSize”仅仅是实施方式,并且用于确定当前最大变换单元尺寸的因素不限于此。
根据上文参考图12到图24描述的基于树形结构的编码单元的视频编码方法,空间域的图像数据在树形结构的编码单元的每个中进行编码,并且空间域的图像数据按基于树形结构的编码单元根据视频解码方法在每个最大编码单元上执行解码的方式进行重建,从而可以重建由图片和图片序列形成的视频。重建的视频可以由播放设备播放、存储在存储介质中,或通过网络进行传输。
此外,可以相对于每个图片、每个条带、每个LCU、具有树形结构的每个编码单元、编码单元中的每个预测单元或者编码单元中的每个变换单元来对SAO参数进行信号化。例如,可以通过使用基于所接收的SAO参数而重建的偏移值来调整每个LCU的重建的像素的像素值,因此可以在原始块与LCU之间重建具有最小化误差的LCU。
根据本公开的实施方式可以编写为计算机程序,并且可以在使用非暂时性计算机可读记录介质执行程序的通用数字计算机中实施。非暂时性计算机可读记录介质的示例包括磁存储介质(例如,ROM、软盘、硬盘等)和光记录介质(例如,CD-ROM或DVD)。
虽然已参考本公开的实施方式特别展示并描述了本公开,但本领域普通技术人员将理解,在不脱离所附权利要求的精神和范围的情况下,可以对形式和细节做出各种改变。实施方式应仅被视作描述,而不是用于限制的目的。因此,本公开的范围并不由详细描述限定,而是由所附权利要求限定,并且该范围内的所有差异都将被解释为包括在本公开中。
为便于描述,上文参考图1A到图24描述的根据样本偏移的操作的视频编码方法将被称为“根据本公开的视频编码方法”。此外,上文参考图1A到图20描述的根据样本偏移的操作的视频解码方法将被称为“根据本公开的视频解码方法”。
此外,上文参考图1A到图24描述的视频编码设备(包括视频编码设备10、视频编码设备100或图像编码器400)将被称为“根据本公开的视频编码设备”。此外,上文参考图2A到图24描述的视频解码设备(包括视频解码设备20、视频解码设备200或图像解码器500)将被称为“根据本公开的视频解码设备”。
现在将详细描述根据实施方式的存储程序的非暂时性计算机可读记录介质,诸如,盘片26000。
图20示出根据实施方式的存储有程序的盘片26000的物理结构。盘片26000作为一种存储介质,其可以是硬盘驱动器、紧密式只读存储器(CD-ROM)盘、蓝光光盘或数字多功能盘(DVD)。盘片26000包括多个同心盘道Tr,所述同心盘道各自在盘片26000的圆周方向上分成特定数量的扇区Se。在盘片26000的特定区域中,可以分配并存储执行上述量化参数确定方法、视频编码方法和视频解码方法的程序。
现在将参考图26描述使用存储介质实现的计算机***,所述存储介质存储用于执行上述视频编码方法和视频解码方法的程序。
图26示出通过使用盘片26000来记录和读取程序的盘片驱动器26800。计算机***26700可以经由盘片驱动器26800在盘片26000中存储用于执行本公开的视频编码方法和视频解码方法中的至少之一的程序。为了在计算机***26700中运行存储在盘片26000中的程序,可以从盘片26000中读取程序并且通过使用盘片驱动器26800将它传输到计算机***26700。
执行本公开的视频编码方法和视频解码方法中的至少之一的程序不仅可以存储在图25和图26所示的盘片26000中,还可以存储在存储卡、ROM盒式磁带或固态驱动器(SSD)中。
下文将描述应用上文所述的视频编码方法和视频解码方法的***。
图27示出用于提供内容分发服务的内容供应***11000的整体结构。通信***的服务区域分成预定尺寸的小区,并且无线基站11700、11800、11900和12000分别安装在这些小区中。
内容供应***11000包括多个独立装置。例如,诸如计算机12100、个人数字助理(PDA)12200、摄像机12300和移动电话12500等多个独立装置经由互联网服务提供商11200、通信网络11400以及无线基站11700、11800、11900和12000连接到互联网11100。
然而,内容供应***11000不限于如图28所示的配置,并且装置可以选择性地连接到该***。多个独立装置可以直接连接到通信网络11400,而不经过无线基站11700、11800、11900和12000。
摄像机12300是能够拍摄视频图像的成像装置,例如,数字摄像机。移动电话12500可以采用例如个人数字通信(PDC)、码分多址(CDMA)、宽带码分多址(W-CDMA)、全球移动通信***(GSM)以及个人手持式电话***(PHS)等各种协议中的至少一个通信方法。
摄像机12300可以经由无线基站11900和通信网络11400连接到流式服务器11300。流式服务器11300允许经由摄像机12300从用户接收的内容经过实时广播进行流传输。从摄像机12300接收的内容可以由摄像机12300或流式服务器11300进行编码。由摄像机12300拍摄的视频数据可以经由计算机12100传输到流式服务器11300。
由相机12600拍摄的视频数据也可以经由计算机12100传输到流式服务器11300。诸如数字相机等相机12600是能够拍摄静态图像和视频图像的成像装置。由相机12600拍摄的视频数据可以使用相机12600或计算机12100进行编码。对视频执行编码和解码的软件可以存储在可由计算机12100访问的非暂时性计算机可读记录介质中,例如,CD-ROM盘、软盘、硬盘驱动器、SSD或存储卡。
如果视频数据由内置在移动电话12500的相机拍摄,那么可以从移动电话12500中接收视频数据。
视频数据也可以由安装在摄像机12300、移动电话12500或相机12600中的大规模集成电路(LSI)***进行编码。
内容供应***11000可以对用户使用摄像机12300、相机12600、移动电话12500或另一成像装置记录的内容数据(例如,在音乐会期间记录的内容)进行编码,并且可以将编码的内容数据传输到流式服务器11300。流式服务器11300可以采用流内容类型将编码的内容数据传输到请求内容数据的其他客户端。
客户端是能够对编码的内容数据进行解码的装置,例如,计算机12100、PDA12200、摄像机12300或移动电话12500。因此,内容供应***11000允许客户端接收和播放编码的内容数据。此外,内容供应***11000允许客户端接收编码的内容数据,并且实时解码和播放编码的内容数据,从而实现个人播放。
本公开的视频编码设备和视频解码设备可以应用于内容供应***11000中包括的多个独立装置的编码操作和解码操作。
现在将参考图28和图29详细地描述根据实施方式的内容供应***11000中包括的移动电话12500。
图28示出根据实施方式的应用视频编码方法和视频解码方法的移动电话12500的外部结构。移动电话12500可以是智能电话,它的功能不受限制并且其大量的功能可以改变或扩展。
移动电话12500包括外部天线12510,经由该外部天线,射频(RF)信号可以与图21的无线基站12000进行交换。移动电话12500还包括显示屏12520,所述显示屏12520用于显示由相机12530拍摄的图像或经由天线12510接收并解码的图像,例如,液晶显示器(LCD)或有机发光二极管(OLED)屏。移动电话12500包括操作面板12540,所述操作面板12540包括控制按钮和触摸面板。如果显示屏12520是触摸屏,那么操作面板12540还包括显示屏12520的触摸感应面板。移动电话12500包括用于输出语音和声音的扬声器12580或另一类型的声音输出单元,以及用于输入语音和声音的麦克风12550或另一类型的声音输入单元。移动电话12500还包括相机12530,诸如,电荷耦合装置(CCD)相机,以拍摄视频或静态图像。移动电话12500还可以包括:存储介质12570,该存储介质12570用于存储编码/解码的数据,例如,由相机12530拍摄、经由电子邮件接收或根据各种方式获取的视频或静态图像;以及槽12560,存储介质12570经由该槽12560装载到移动电话12500中。存储介质12570可以是闪存,例如,安全数字(SD)卡或者包括在塑料盒中的电可擦除可编程只读存储器(EEPROM)。
图29示出移动电话12500的内部结构。为了***地控制包括显示屏12520和操作面板12540的移动电话12500的部分,电源电路12700、操作输入控制器12640、图像编码器12720、相机接口12630、LCD控制器12620、图像解码器12690、多路复用器/多路分解器12680、记录/读取单元12670、调制/解调单元12660以及声音处理器12650经由同步总线12730连接到中央处理器12710。
如果用户操作电源按钮并从“关机”状态设置到“开机”状态,那么电源电路12700将电力从电池组供应到移动电话12500的所有部分,从而在操作模式下设置移动电话12500。
中央控制器12710包括中央处理单元(CPU)、ROM和RAM。
在移动电话12500将通信数据传输到外部时,移动电话12500在中央控制器12710的控制下生成数字信号。例如,声音处理器12650可以生成数字声音信号,图像编码器12720可以生成数字图像信号,并且消息的文本数据可以经由操作面板12540和操作输入控制器12640生成。当数字信号在中央控制器12710的控制下传输到调制/解调单元12660时,调制/解调单元12660对数字信号的频带进行调制,并且通信电路12610在频带经调制的数字声音信号上执行数模转换(DAC)和频率转换。从通信电路12610输出的传输信号可以经由天线12510传输到语音通信基站或无线基站12000。
例如,当移动电话12500处于对话模式时,经由麦克风12550获取的声音信号在中央控制器12710的控制下被声音处理器12650转换成数字声音信号。所生成的数字声音信号可以通过调制/解调单元12660和通信电路12610转换成传输信号,并且可以经由天线12510进行传输。
当文本消息(例如,电子邮件)在数据通信模式下传输时,文本消息的文本数据经由操作面板12540输入,并且经由操作输入控制器12640传输到中央控制器12610。在中央控制器12610的控制下,文本数据经由调制/解调单元12660和通信电路12610变换成传输信号,并且经由天线12510传输到无线基站12000。
为了在数据通信模式期间传输图像数据,经由相机接口12630将相机12530拍摄的图像数据提供到图像编码器12720。由相机12530拍摄的图像数据可以经由相机接口12630和LCD控制器12620直接显示在显示屏12520上。
图像编码器12720的结构可以对应于上文所述的视频编码设备100的结构。图像编码器12720可以根据上文所述的视频编码方法将从相机12530接收的图像数据转换成压缩且编码的图像数据,并且随后可以将编码的图像数据输出到多路复用器/多路分解器12680。在相机12530的记录操作期间,通过使用移动电话12500的麦克风12550而获得的声音信号可以经由声音处理器12650变换成数字声音数据,并且数字声音数据可以传输到多路复用器/多路分解器12680。
多路复用器/多路分解器12680将从图像编码器12720接收的编码图像数据与从声音处理器12650接收的声音数据多路复用。多路复用数据的结果可以经由调制/解调单元12660和通信单元12610转换成传输信号,并且随后可以经由天线12510传输。
当移动电话12500接收来自外部的通信数据时,在经由天线12510接收的信号上执行频率恢复和模数转换(ADC),以将该信号转换成数字信号。调制/解调单元12660对数字信号的频带进行调制。根据数字信号的类型,频带经过调制的数字信号传输到视频解码单元12690、声音处理器12650或LCD控制器12620。
在对话模式期间,移动电话12500将经由天线12510接收的信号放大,并且通过在放大的信号上执行频率转换和ADC来获取数字声音信号。在中央控制器12710的控制下,接收的数字声音信号经由调制/解调单元12660和声音处理器12650转换成模拟声音信号,并且模拟声音信号经由扬声器12580输出。
当在数据通信模式期间时,接收在互联网网站访问的视频文件的数据,经由调制/解调单元12660将经由天线12510从无线基站12000接收的信号作为多路复用数据输出,并且将多路复用数据传输到多路复用器/多路分解器12680。
为了对经由天线12510接收的多路复用的数据进行解码,多路复用器/多路分解器12680将多路复用的数据多路分解成编码视频数据流和编码音频数据流。经由同步总线12730,编码视频数据流和编码音频数据流分别被提供到视频解码器12690和声音处理器12650。
图像解码器12690的结构可以对应于上文所述的视频解码设备200的结构。通过使用本公开的上述视频解码方法,图像解码器12690可以对编码的视频数据进行解码,从而生成重建的视频数据,并且随后可以经由LCD控制器12620将重建的视频数据提供到显示屏12520。
因此,在互联网网站访问的视频文件的数据可以显示在显示屏12520上。同时,声音处理器12650可以将音频数据转换成模拟声音信号,并且将模拟声音信号提供到扬声器12580。因此,在互联网网站访问的视频文件中含有的音频数据也可以经由麦克风12580而播放。
移动电话12500或另一类型的通信终端可以是包括本公开的视频编码设备和视频解码设备的收发终端,可以是只包括本公开的视频编码设备的发送终端,或者可以是只包括本公开的视频解码设备的接收终端。
根据本公开的通信***不限于上文参考图28描述的通信***。例如,图30示出根据实施方式的采用通信***的数字广播***。图30的数字广播***可以通过使用本公开的视频编码设备和视频解码设备来接收经由卫星或地面网络传输的数字广播。
更具体地,广播站12890通过使用无线电波而将视频数据流传输到通信卫星或广播卫星12900。广播卫星12200传输广播信号,并且广播信号经由***12860传输到卫星广播接收器。在每个家庭中,编码的视频流可以由TV接收器12810、机顶盒12870或另一装置解码并播放。
当本公开的视频解码设备实施于播放设备12830中时,播放设备12830可以对记录在存储介质12820(诸如,磁盘或存储卡)上的编码视频流进行解析和解码,以重建数字信号。因此,重建的视频信号可以例如在显示器12840上播放。
在连接到用于卫星/地面广播的天线12860或用于接收电缆电视(TV)广播的电缆天线12850的机顶盒12870中,可以安装本公开的视频解码设备。从机顶盒12870输出的数据也可以在TV显示器12880上播放。
作为另一示例,本公开的视频解码设备可以安装在TV接收器12810中,而不是机顶盒12870中。
具有适当天线12920的汽车12910可以接收从卫星12900或无线基站11700传输的信号。解码的视频可以在安装于汽车12920中的车载导航***12930的显示屏上播放。
视频信号可以由本公开的视频编码设备进行编码,并且随后可以记录并存储到存储介质中。更具体地,图像信号可以由DVD记录器存储在DVD光盘12960中,或者可以由硬盘记录器12950存储在硬盘中。作为另一示例,视频信号可以存储在SD卡12970中。如果硬盘记录器12950包括根据实施方式的视频解码设备,那么记录在DVD光盘12960、SD卡12970或另一存储介质上的视频信号可以在TV显示器12880上播放。
车载导航***12930可以不包括图30的相机12530、相机接口12630和图像编码器12720。例如,计算机12100和TV接收器12810可以不包括图30的相机12530、相机接口12630和图像编码器12720。
图31示出根据本公开的实施方式的使用视频编码设备和视频解码设备的云计算***的网络结构。
云计算***可以包括云计算服务器14000、用户数据库(DB)14100、多个计算资源14200,以及用户终端。
响应于来自用户终端的请求,云计算***经由数据通信网络(例如,互联网)来提供多个计算资源14200的按需外包服务。在云计算环境下,通过使用虚拟化技术将位于物理上不同位置的数据中心处的计算资源相结合,服务提供商为用户提供所需的服务。服务用户不必将计算资源(例如,应用程序、存储设备、操作***(OS)和安全应用)安装到他/她自己的终端中以进行使用,而是可以在所需的时间点从通过虚拟化技术生成的虚拟空间中的服务之中选择并使用所需服务。
指定服务用户的用户终端经由包括互联网和移动远程通信网络的数据通信网络连接到云计算服务器14000。从云计算服务器14000可以对用户终端提供云计算服务,具体地如视频播放服务。用户终端可以是能够连接到互联网的各种类型的电子装置,例如,台式PC 14300、智能TV 14400、智能电话14500、笔记本电脑14600、便携式多媒体播放器(PMP)14700、平板PC 14800等。
云计算服务器14000可以将分布在云网络中的多个计算资源14200进行组合,并且将组合的结果提供到用户终端。多个计算资源14200可以包括各种数据服务,并且可以包括从用户终端上传的数据。如上文所述,云计算服务器14000可以通过根据虚拟化技术将分布在不同区域中的视频数据库进行组合来将所需的服务提供到用户终端。
与订阅云计算服务的用户有关的用户信息存储在用户数据库14100中。用户信息可以包括用户的登录信息、地址、名字和个人信用信息。用户信息还可以包括视频的索引。此处,索引可以包括已经播放的视频列表、正在播放的视频列表、过去播放的视频的暂停点等。
存储在用户数据库14100中的与视频有关的信息可以在用户装置之间共享。例如,当响应于来自笔记本电脑14600的请求而将视频服务提供到笔记本电脑14600时,视频服务的播放历史便存储在用户数据库14100中。当从智能电话14500接收播放该视频服务的请求时,云计算服务器14000基于用户数据库14100来搜索并播放该视频服务。当智能电话14500接收来自云计算服务器14000的视频数据流时,通过对视频数据流进行解码来播放视频的过程类似于上文参考图28描述的移动电话12500的操作。
云计算服务器14000可以参考存储在用户数据库14100中的所需视频服务的播放历史。例如,云计算服务器14000接收来自用户终端的播放存储在用户数据库14100中的视频的请求。如果这个视频已在播放,那么由云计算服务器14000执行的流传输这个视频的方法可以根据用户终端的请求而改变,即,根据从视频的开头还是暂停点开始播放该视频。例如,如果用户终端请求从开头开始播放该视频,那么云计算服务器14000将从第一帧开始的视频的流数据传输到用户终端。如果用户终端请求从暂停点开始播放该视频,那么云计算服务器14000将从对应于暂停点的帧开始的视频的流数据传输到用户终端。
此处,用户终端可以包括如上文参考图1A到图24描述的本公开的视频解码设备。作为另一示例,用户终端可以包括如上文参考图1A到图24描述的本公开的视频编码设备。或者,用户终端可以包括如上文参考图1A到图24描述的本公开的视频解码设备和视频编码设备两者。
上文参考图25到图31描述了上文参考图1A到图24描述的本公开的视频编码方法、视频解码方法、视频编码设备和视频解码设备的各种应用。然而,上文描述的关于将参考图1A到图24的视频编码方法和视频解码方法存储在存储介质中的方法或者在装置中实施视频编码设备和视频解码设备的方法的实施方式不限于上文参考图25到图31描述的实施方式。
虽然已参考本公开的实施方式具体示出并描述了本公开,但本领域普通技术人员将理解,在不脱离所附权利要求的精神和范围的情况下,可以对本公开作出各种形式和细节方面的改变。因此,本公开的范围并不由本公开的具体描述限定,而是由所附权利要求限定。因此,本公开的范围并不由本公开的详细描述限定,而是由所附权利要求限定,并且该范围内的所有差异都将被理解为包括在本公开中。

Claims (21)

1.视频解码方法,包括:
当第一偏移方法应用于包括当前块的当前条带时,将基于所述当前块的第一偏移参数的偏移施加至所述当前块;
当所述第一偏移方法应用于所述当前条带时,确定是否将第二偏移方法应用于所述当前条带;
当所述第二偏移方法应用于所述当前条带时,确定所述当前块的第二偏移参数;以及
将基于所述第二偏移参数的偏移施加至施加了基于所述第一偏移参数的偏移的当前块,
其中,所述第一偏移参数和所述第二偏移参数包括所述当前块的偏移值。
2.根据权利要求1所述的视频解码方法,其中,确定是否将所述第二偏移方法应用于所述当前条带包括:基于从比特流中获取的与所述当前条带有关的第二偏移使用信息来确定是否将所述第二偏移方法应用于所述当前条带。
3.根据权利要求1所述的视频解码方法,其中,确定是否将所述第二偏移方法应用于所述当前条带包括:通过与是否将所述第一偏移方法应用于所述当前条带的相同方式来确定是否将所述第二偏移方法应用于所述当前条带。
4.根据权利要求1所述的视频解码方法,其中,所述当前块的第一偏移参数和所述当前块的第二偏移参数包括与所述当前块有关的偏移使用信息、偏移类型、偏移分类和偏移值中的至少一项。
5.根据权利要求1所述的视频解码方法,其中,确定所述当前块的第二偏移参数包括:基于所述当前块的第一偏移参数来确定所述当前块的第二偏移参数。
6.根据权利要求1所述的视频解码方法,还包括:通过从比特流中获取与所述当前块有关的第一偏移使用信息来确定是否将所述第一偏移方法应用于所述当前块。
7.根据权利要求6所述的视频解码方法,其中,确定所述当前块的第二偏移参数包括:在与所述当前块有关的第一偏移使用信息表明所述第一偏移方法应用于所述当前块时,从比特流中获取与所述当前块有关的第二偏移使用信息。
8.根据权利要求1所述的视频解码方法,其中,所述当前块的第二偏移方法的偏移类型确定为与所述当前块的第一偏移方法的偏移类型不同。
9.根据权利要求1所述的视频解码方法,其中,所述当前块的第一偏移参数和所述当前块的第二偏移参数包括同时表明所述当前块的偏移类型和偏移分类的信息。
10.根据权利要求1所述的视频解码方法,还包括:
获取第一偏移合并信息和第二偏移合并信息,所述第一偏移合并信息和所述第二偏移合并信息分别表明是否使用所述当前块的相邻块的第一偏移参数和第二偏移参数来确定所述当前块的第一偏移参数和第二偏移参数;
根据所述第一偏移合并信息,基于所述相邻块的第一偏移参数来确定所述当前块的第一偏移参数;以及
根据所述第二偏移合并信息,基于所述相邻块的第二偏移参数来确定所述当前块的第二偏移参数。
11.视频编码方法,包括:
当第一偏移方法应用于包括当前块的当前条带时,将基于所述当前块的第一偏移参数的偏移施加至所述当前块;
当所述第一偏移方法应用于所述当前条带时,确定是否将第二偏移方法应用于所述当前条带;
当所述第二偏移方法应用于所述当前条带时,确定所述当前块的第二偏移参数;以及
生成比特流,所述比特流包括:表明是否将所述第一偏移方法应用于所述当前条带的第一偏移使用信息;表明是否将所述第二偏移方法应用于所述当前条带的第二偏移使用信息;以及所述第一偏移参数和所述第二偏移参数,其中,所述第一偏移参数和所述第二偏移参数包括所述当前块的偏移值。
12.根据权利要求11所述的视频编码方法,其中,确定是否将所述第二偏移方法应用于所述当前条带包括:基于是否将所述第二偏移方法应用于所述当前条带的先前条带中包括的块来确定是否将所述第二偏移方法应用于所述当前条带。
13.根据权利要求11所述的视频编码方法,其中,确定是否将所述第二偏移方法应用于所述当前条带包括:通过与是否将所述第一偏移方法应用于所述当前条带的相同方式来确定是否将所述第二偏移方法应用于所述当前条带。
14.根据权利要求11所述的视频编码方法,其中,所述当前块的第一偏移参数和所述当前块的第二偏移参数包括与所述当前块有关的偏移使用信息、偏移类型、偏移分类和偏移值中的至少一项。
15.根据权利要求11所述的视频编码方法,其中,确定所述当前块的第二偏移参数包括:基于所述当前块的第一偏移参数来确定所述当前块的第二偏移参数。
16.根据权利要求11所述的视频编码方法,其中,确定所述当前块的第二偏移参数包括:当所述第二偏移方法应用于所述当前条带时,确定与所述当前块有关的第二偏移使用信息。
17.根据权利要求11所述的视频编码方法,其中,确定所述当前块的第二偏移参数包括:当所述第一偏移方法应用于所述当前块时,确定与所述当前块有关的第二偏移使用信息。
18.根据权利要求11所述的视频编码方法,其中,所述当前块的第二偏移方法的偏移类型确定为与所述当前块的第一偏移方法的偏移类型不同。
19.根据权利要求11所述的视频编码方法,其中,所述当前块的第一偏移参数和所述当前块的第二偏移参数包括同时表明所述当前块的偏移类型和偏移分类的信息。
20.视频解码设备,包括:
第一偏移方法解码器,所述第一偏移方法解码器配置成:当第一偏移方法应用于包括当前块的当前条带时,将基于所述当前块的第一偏移参数的偏移施加至所述当前块;以及
第二偏移方法解码器,所述第二偏移方法解码器配置成:当所述第一偏移方法应用于所述当前条带时,确定是否将第二偏移方法应用于所述当前条带;当所述第二偏移方法应用于所述当前条带时,确定所述当前块的第二偏移参数;以及将基于所述第二偏移参数的偏移施加至施加了基于所述第一偏移参数的偏移的当前块,
其中,所述第一偏移参数和所述第二偏移参数包括所述当前块的偏移值。
21.视频编码设备,包括:
第一偏移方法编码器,所述第一偏移方法编码器配置成:当第一偏移方法应用于包括当前块的当前条带时,将基于所述当前块的第一偏移参数的偏移施加至所述当前块;
第二偏移方法编码器,所述第二偏移方法编码器配置成:当所述第一偏移方法应用于所述当前条带时,确定是否将第二偏移方法应用于所述当前条带;以及当所述第二偏移方法应用于所述当前条带时,确定所述当前块的第二偏移参数;以及
比特流生成器,所述比特流生成器配置成生成比特流,所述比特流包括:表明是否将所述第一偏移方法应用于所述当前条带的第一偏移使用信息;表明是否将所述第二偏移方法应用于所述当前条带的第二偏移使用信息;以及所述第一偏移参数和所述第二偏移参数,其中,所述第一偏移参数和所述第二偏移参数包括所述当前块的偏移值。
CN201580069778.0A 2014-10-31 2015-09-24 应用多偏移方案的视频编码方法和设备以及视频解码方法和设备 Withdrawn CN107113437A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462073327P 2014-10-31 2014-10-31
US62/073,327 2014-10-31
PCT/KR2015/010062 WO2016068493A1 (ko) 2014-10-31 2015-09-24 다중 오프셋 방식을 적용하는 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치

Publications (1)

Publication Number Publication Date
CN107113437A true CN107113437A (zh) 2017-08-29

Family

ID=55857778

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580069778.0A Withdrawn CN107113437A (zh) 2014-10-31 2015-09-24 应用多偏移方案的视频编码方法和设备以及视频解码方法和设备

Country Status (5)

Country Link
US (1) US20170318289A1 (zh)
EP (1) EP3203738A4 (zh)
KR (1) KR20170078671A (zh)
CN (1) CN107113437A (zh)
WO (1) WO2016068493A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107707915A (zh) * 2017-09-30 2018-02-16 上海兆芯集成电路有限公司 采样点自适应偏移滤波的控制方法及其影像处理***

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9294770B2 (en) 2011-06-24 2016-03-22 Lg Electronics Inc. Image information encoding and decoding method
US10721467B2 (en) * 2015-05-05 2020-07-21 Lg Electronics Inc. Method and device for processing coding unit in image coding system

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013177975A1 (en) * 2012-05-29 2013-12-05 Mediatek Inc. Method and apparatus for coding of sample adaptive offset information
US20140177704A1 (en) * 2012-12-21 2014-06-26 Qualcomm Incorporated Multi-type parallelized sample adaptive offset in video coding

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130034566A (ko) * 2011-09-28 2013-04-05 한국전자통신연구원 제한된 오프셋 보상 및 루프 필터를 기반으로 하는 영상 부호화 및 복호화 방법 및 그 장치
KR101364085B1 (ko) * 2012-02-28 2014-02-21 전자부품연구원 비디오 압축 시스템의 sao 처리 장치 및 그 방법
KR102166335B1 (ko) * 2013-04-19 2020-10-15 삼성전자주식회사 Sao 파라미터를 시그널링하는 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013177975A1 (en) * 2012-05-29 2013-12-05 Mediatek Inc. Method and apparatus for coding of sample adaptive offset information
US20140177704A1 (en) * 2012-12-21 2014-06-26 Qualcomm Incorporated Multi-type parallelized sample adaptive offset in video coding

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107707915A (zh) * 2017-09-30 2018-02-16 上海兆芯集成电路有限公司 采样点自适应偏移滤波的控制方法及其影像处理***

Also Published As

Publication number Publication date
WO2016068493A1 (ko) 2016-05-06
KR20170078671A (ko) 2017-07-07
EP3203738A4 (en) 2017-10-04
US20170318289A1 (en) 2017-11-02
EP3203738A1 (en) 2017-08-09

Similar Documents

Publication Publication Date Title
CN104902272B (zh) 视频解码设备
CN104641640B (zh) 用于用信号传输sao参数的视频编码方法和视频编码设备以及视频解码方法和视频解码设备
CN105325004B (zh) 基于用信号传输样点自适应偏移参数的视频编码方法和设备以及视频解码方法和设备
CN104869415B (zh) 视频解码方法
CN106716997A (zh) 使用环路内滤波器参数预测的视频编码方法和设备以及相应视频解码方法和设备
CN105027568B (zh) 用于对条带段进行熵编码的方法及其设备以及用于对条带段进行熵解码的方法及其设备
CN107005713A (zh) 施加边缘类型偏移的视频编码方法和设备以及视频解码方法和设备
CN105144713B (zh) 用于解码器设置的对视频进行编码的方法及其装置以及基于解码器设置对视频进行解码的方法及其装置
CN104205834A (zh) 用于对每个空间子区域进行视频编码的方法和设备以及用于对每个空间子区域进行视频解码的方法和设备
CN105308966A (zh) 视频编码方法及其设备以及视频解码方法及其设备
CN106464908A (zh) 用于传输深度图像的预测模式以供层间视频编码和解码的方法和装置
CN106664413A (zh) 用于补偿亮度差的层间视频编码方法和装置以及视频解码方法和装置
CN105340274A (zh) 深度图编码方法及其设备以及深度图解码方法及其设备
CN105993174A (zh) 用于用信号传送sao参数的视频编码方法和设备以及视频解码方法和设备
CN106576175A (zh) 多视点图像编码/解码方法和装置
CN106664415A (zh) 使用深度块的多层视频编码方法和多层视频解码方法
CN107113437A (zh) 应用多偏移方案的视频编码方法和设备以及视频解码方法和设备
CN106717005A (zh) 根据参考频率控制参考图像数据的视频编码/解码方法和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20170829

WW01 Invention patent application withdrawn after publication