CN105049864A - 根据像素分类使用偏移调整的视频解码方法及其设备 - Google Patents

根据像素分类使用偏移调整的视频解码方法及其设备 Download PDF

Info

Publication number
CN105049864A
CN105049864A CN201510218541.6A CN201510218541A CN105049864A CN 105049864 A CN105049864 A CN 105049864A CN 201510218541 A CN201510218541 A CN 201510218541A CN 105049864 A CN105049864 A CN 105049864A
Authority
CN
China
Prior art keywords
unit
coding unit
coding
offset
depth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510218541.6A
Other languages
English (en)
Inventor
艾琳娜·阿尔辛娜
亚历山大·阿尔辛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN105049864A publication Critical patent/CN105049864A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/422Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation for representing the structure of the pattern or shape of an object therefor
    • G06V10/424Syntactic representation, e.g. by using alphabets or grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/435Computation of moments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • G06V10/7515Shifting the patterns to accommodate for positional errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/993Evaluation of the quality of the acquired pattern
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Discrete Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供了一种根据像素分类使用偏移调整的视频解码方法及其设备。所述视频解码方法包括:从接收的比特流解析指示视频的多个块之中的当前块和至少一个邻近块的偏移参数是否彼此相同的偏移合并信息;基于偏移合并信息恢复当前块的偏移参数之中的偏移类型和偏移值;基于当前块的指示偏移类型的边缘类型或像素值带类型来确定恢复的像素的边缘分类或像素值带;以及从恢复的偏移值确定与恢复的像素的边缘分类或像素值带相应的偏移值并根据确定的偏移值调整恢复的像素的像素值。

Description

根据像素分类使用偏移调整的视频解码方法及其设备
本申请是申请日为2012年06月27日,申请号为“201280042637.6”,标题为“根据像素分类使用偏移调整的视频编码方法及其设备、视频解码方法及其设备”的发明专利申请的分案申请。
技术领域
本发明涉及被执行用于使原始图像和恢复的图像之间的误差最小化的视频编码和视频解码。
背景技术
随着用于再现和存储高分辨率或高质量的视频内容的硬件正被开发和供应,对于用于对高分辨率或高质量的视频内容进行有效编码或解码的视频编解码器的需求正在增长。在传统的视频编解码器中,根据基于具有预定尺寸的宏块的有限编码方法对视频进行编码。
通过使用频率变换,空间域的图像数据被变换为频域的系数。视频编解码器将图像划分为具有预定尺寸的块,对每个块执行离散余弦变换(DCT),并以块为单位对频率系数进行编码以执行频率变换的快速算术运算。与空间域的图像数据相比,频域的系数是可易于压缩的类型。具体地讲,空间域的图像像素值通过视频编解码器的帧间预测或帧内预测被表现为预测误差,因此,如果对预测误差执行频率变换,数据可被变换到0。视频编解码器用具有小尺寸的数据替换连续重复出现的数据,从而减少数据量。
发明内容
技术问题
本发明提供一种用于产生相对于原始图像具有最小误差的恢复的图像的视频编码方法和设备以及视频解码方法和设备。
解决方案
根据本发明的一方面,提供了一种视频解码方法,包括:从接收的比特流解析指示视频的多个块之中的当前块和至少一个邻近块的偏移参数是否彼此相同的偏移合并信息;基于所述偏移合并信息恢复当前块的偏移参数之中的偏移类型和偏移值;基于当前块的指示偏移类型的边缘类型或像素值带类型(bandtype)来确定当前块的恢复的像素的边缘分类或像素值带;以及从恢复的偏移值确定与恢复的像素的边缘分类或像素值带相应的偏移值并根据确定的偏移值调整恢复的像素的像素值。
有益效果
在视频编码和视频解码期间,根据图像特征(诸如边缘类型)对像素分类,通过使用相同组中具有相同特征的像素之间的平均误差值来确定偏移,并针对所述偏移调整恢复的像素,因此可使原始图像和恢复的图像之间的误差最小化。
附图说明
图1是根据本发明的实施例的视频编码设备的框图;
图2是根据本发明的实施例的视频解码设备的框图;
图3是根据本发明的实施例的用于像素分类的边缘类型和长度的表;
图4是示出根据本发明的实施例的偏移值编码处理的流程图;
图5是根据本发明的实施例的用于合并偏移参数的候选参考块的示图;
图6是示出根据本发明的实施例的视频编码方法的流程图;
图7是示出根据本发明的实施例的视频解码方法的流程图;
图8是根据本发明的实施例的基于具有树结构的编码单元的视频编码设备的框图;
图9是根据本发明的实施例的基于具有树结构的编码单元的视频解码设备的框图;
图10是用于描述根据本发明的实施例的编码单元的概念的示图;
图11是根据本发明的实施例的基于编码单元的图像编码器的框图;
图12是根据本发明的实施例的基于编码单元的图像解码器的框图;
图13是示出根据本发明的实施例的根据深度的较深层编码单元和分区(partition)的示图;
图14是用于描述根据本发明的实施例的编码单元和变换单元之间的关系的示图;
图15是用于描述根据本发明的实施例的与编码深度相应的编码单元的编码信息的示图;
图16是根据本发明的实施例的根据深度的较深层编码单元的示图;
图17至图19是用于描述根据本发明的实施例的编码单元、预测单元和变换单元之间的关系的示图;
图20是用于描述根据表1的编码模式信息的编码单元、预测单元或分区、和变换单元之间的关系的示图。
最佳模式
根据本发明的一方面,提供了一种视频解码方法,包括:从接收的比特流解析指示视频的多个块之中的当前块和至少一个邻近块的偏移参数是否彼此相同的偏移合并信息;基于偏移合并信息恢复当前块的偏移参数之中的偏移类型和偏移值;基于当前块的指示偏移类型的边缘类型或像素值带类型(bandtype)来确定当前块的恢复的像素的边缘分类或像素值带;以及从恢复的偏移值确定与恢复的像素的边缘分类或像素值带相应的偏移值并根据确定的偏移值调整恢复的像素的像素值。
具体实施方式
以下将参照图1至图6描述根据实施例的通过根据像素分类调整偏移而执行的视频编码方法和视频解码方法。此外,以下将参照像素偏移的类型或像素带(band)以及图20来描述根据实施例的基于具有树结构的编码单元的视频编码方法和视频解码方法根据像素分类使用偏移调整的实施例。在下文中,“图像”可指视频的静止图像、视频的运动图像(即,视频本身)。
首先,现在将参照下面的图1至图7描述根据实施例的通过根据像素分类调整偏移而执行的视频编码方法和视频解码方法。
图1是根据本发明的实施例的视频编码设备10的框图。
根据实施例的视频编码设备10包括偏移确定单元12和偏移参数编码单元14。
根据实施例的视频编码设备10接收视频的图像,将每个图像划分为块并针对每个块对图像进行编码。块类型可以是正方形或矩形,并且可以是任意的几何形状。块类型不限于具有均一的尺寸的数据单元。根据实施例的块可以是最大编码单元、按照树结构的编码单元之中的编码单元等。稍后将参照图8至图20描述基于按照树结构的编码单元的视频编码方法和视频解码方法。
根据实施例的视频编码设备10可针对每个图像块执行帧内预测、帧间预测、变换和量化,产生采样,对所述采样执行熵编码,并在比特流中输出所述采样。
根据实施例的视频编码设备10可对指示原始图像的像素(原始像素)和恢复的图像的像素(恢复的像素)之间的差值的偏移值进行编码,以使原始像素和恢复的像素之间的误差最小化。
根据实施例的视频编码设备10可对每个预定的数据单元(诸如画面、条带、块等)确定偏移值。包括偏移值和偏移类型的偏移参数可针对每个预定数据单元而被编码。
根据实施例的偏移确定单元12确定当前块的边缘类型或像素值带类型(bandtype)。偏移确定单元12可根据当前块的像素特征确定是否适合于基于所述边缘类型或所述像素值带类型来对当前块的像素进行分类。
根据实施例的边缘类型可指示由恢复的像素和邻近像素形成的边缘的方向和尺寸。此外,在当前块的像素值的总范围带被划分为预定数量的带时,根据实施例的像素值带类型可指示像素值的带的总数量、每个带的范围等。
在根据边缘类型确定当前块的偏移值的情况下,根据实施例的偏移确定单元12可确定属于每个恢复的像素的边缘分类。根据实施例的边缘分类指示当前恢复的像素是否是边缘的像素。例如,边缘分类可指示当前恢复的像素是边缘的极值点、是组成边缘的边缘像素、还是不是组成边缘的像素等。
在根据边缘类型确定当前块的偏移值的情况下,根据实施例的偏移确定单元12可将当前恢复的像素的像素值与邻近像素的像素值进行比较,并确定指示当前恢复的像素是否是边缘像素的边缘分类,其中,所述邻近像素根据边缘的方向和尺寸而被布置为邻近于当前恢复的像素。
在根据像素值带类型来确定当前块的偏移值的情况下,根据实施例的偏移确定单元12可确定属于每个恢复的像素的像素值带。根据实施例的像素值带指示多个像素值带之中的当前恢复的像素的像素值所属的像素值带。可根据相等的像素值范围来划分多个像素值带。此外,可根据不等的像素值范围来划分多个像素值带。也就是说,偏移确定单元12可在多个像素值带之中确定指示当前恢复的像素的像素值所属的像素值范围的像素值带。
根据实施例的偏移确定单元12通过使用包括在与恢复的像素相同的边缘分类或相同像素值带中的原始像素和恢复的像素之间的差值,确定与恢复的像素的边缘分类或像素值带相应的偏移值。
根据实施例的偏移确定单元12可将包括在与当前边缘分类相同的边缘分类或与当前像素值带相同的像素值带中的原始像素和恢复的像素之间的差值的平均(即,恢复的像素的平均误差)确定为与当前边缘分类或当前像素值带相应的偏移值。
偏移确定单元12可针对当前块中的每个恢复的像素确定边缘分类或像素值带。因此,偏移确定单元12可确定与块的每个边缘分类相应的每个偏移值。此外,偏移确定单元12可确定与块的每个像素值带相应的每个偏移值。
根据实施例的偏移参数编码单元14可对每个块的偏移类型和偏移值进行编码。根据实施例的偏移类型指示每个块的边缘类型或每个块的像素值带类型。
每个块的偏移参数可包括每个块的偏移类型和偏移值。如果偏移类型是边缘类型,则偏移参数可包括与每个边缘分类相应的偏移值。此外,如果偏移类型是像素值带类型,则偏移参数可包括与每个像素值带相应的偏移值。也就是说,偏移参数编码单元14可针对每个块对偏移参数进行编码。
根据实施例的偏移参数编码单元14可基于当前块和至少一个邻近块的偏移参数的同一性,对指示是否对当前块的偏移参数进行编码的当前块的偏移合并信息进行编码。
如果当前块的左侧块和右侧块的偏移参数中的至少一个与当前块的偏移参数相同,则根据实施例的偏移参数编码单元14可对除了当前块的偏移参数以外的偏移合并信息进行编码。
如果当前块的左侧块和右侧块的偏移参数与当前块的偏移参数不同,则根据实施例的偏移参数编码单元14可对当前块的偏移合并信息和偏移参数进行编码。
如果邻近块的偏移参数的部分信息与当前块的偏移参数相同,则根据实施例的偏移参数编码单元14可对一比特的偏移合并信息进行编码,并仅对除了与当前块的偏移参数相同的邻近块的偏移参数的部分信息以外的当前块的偏移参数的信息进行编码。例如,如果当前块与邻近块在偏移值上相同,则可针对当前块对一比特的偏移合并信息和偏移类型进行编码。
根据实施例的偏移参数编码单元14可对邻近块的偏移值与当前偏移之间的差信息进行编码。
如果偏移为0,则根据实施例的偏移参数编码单元14可对除所述偏移以外的偏移参数进行编码。
根据实施例的偏移参数编码单元14可通过参考其他颜色分量的偏移参数来对当前块的亮度分量和色度分量之中的至少一个颜色分量进行预测和编码。例如,通过共享或相互参考偏移参数来对亮度分量和色度分量的偏移参数进行预测和编码。作为另一示例,通过共享或相互参考偏移参数来对第一色度分量和第二色度分量的偏移参数进行预测和编码。
根据实施例的视频编码设备10可包括总体控制偏移确定单元12和偏移参数编码单元14的中央处理器(未示出)。可选择地,偏移确定单元12和偏移参数编码单元14可通过它们各自的交互操作的处理器(未示出)进行操作,因此视频编码设备10可进行总体操作。可选择地,偏移确定单元12和偏移参数编码单元14可通过根据实施例的视频编码设备10的外部处理器(未示出)的控制来控制。
根据实施例的视频编码设备10可包括存储偏移确定单元12和偏移参数编码单元14的输入和输出数据的至少一个数据存储单元(未示出)。视频编码设备10可包括控制数据存储单元(未示出)的数据输入和输出的存储器控制单元(未示出)。
根据实施例的视频编码设备10可与安装在其中的内部视频编码处理器或外部视频编码处理器连同进行操作以输出视频编码结果,从而执行包括变换的视频编码操作。根据实施例的视频编码设备10的内部视频编码处理器可包括单独的处理器,以及视频编码设备10、中央操作设备或图形操作设备可包括视频编码处理模块来实现基本视频编码操作。
图2是根据本发明的实施例的视频解码设备20的框图。
根据实施例的视频解码设备20包括偏移参数解析单元22和偏移调整单元24。
根据实施例的视频解码设备20接收包括编码的视频数据的比特流。视频解码设备20可从接收的比特流解析编码的视频采样,对每个图像块执行熵编码、反量化、逆变换以及预测和运动补偿,产生恢复的像素,并产生所得的恢复的图像。此外,根据实施例的视频解码设备20可接收指示原始像素和恢复的像素之间的差值的偏移值,以使原始图像和恢复的图像之间的误差最小化。
根据实施例的偏移参数解析单元22可从比特流解析指示视频的多个块之中的当前块和至少一个邻近块的偏移参数是否彼此相同的偏移合并信息。
根据实施例的偏移参数解析单元22可基于当前块的偏移合并信息恢复当前块的偏移参数之中的偏移类型和偏移值。
例如,如果基于当前块的偏移合并信息,当前块和至少一个邻近块的偏移参数彼此不同,则偏移参数解析单元22可从比特流解析并恢复当前块的偏移参数。然而,如果基于当前块的偏移合并信息,当前块和至少一个邻近块的偏移参数彼此相同,则偏移参数解析单元22可通过使用所述至少一个邻近块的偏移参数信息来恢复当前块的偏移参数,而无需从比特流对当前块的偏移参数进行解析。
根据实施例的偏移调整单元24可基于当前块的指示当前块的偏移类型的边缘类型或像素值带类型,确定恢复的像素的边缘分类或像素值带。
根据实施例的偏移调整单元24可从当前块的偏移值确定与恢复的像素的边缘分类或像素值带相应的偏移值。偏移调整单元24可按偏移调整恢复的像素的像素值。
根据实施例的偏移调整单元24可为当前块的每个恢复的像素确定边缘分类或像素值带。因此,偏移调整单元24可在恢复的偏移值之中确定与所确定的针对每个恢复的像素的边缘分类或像素值带相应的偏移值,并按偏移调整每个恢复的像素。
如果当前块的偏移类型是边缘类型,则根据实施例的偏移调整单元24可将当前块像素的像素值与当前恢复的像素的根据边缘方向和边缘尺寸而布置的邻近像素的像素值进行比较,并确定当前恢复的像素的边缘分类。因此,偏移调整单元24可在偏移值之中确定与当前恢复的像素的边缘分类相应的偏移值。偏移调整单元24可计算包括在与当前边缘分类相同的边缘分类中的恢复的像素与原始像素之间的差值的平均,并将所述平均确定为与当前恢复的像素相应的偏移。
如果当前块的偏移类型是像素值带类型,则根据实施例的偏移调整单元24可在多个带之中确定当前恢复的像素的像素值所属的像素值带。因此,偏移调整单元24可在恢复的偏移值之中确定与当前恢复的像素的像素值带相应的偏移值。由偏移调整单元24从恢复的偏移值选择的偏移值可以是包括在与当前像素值带相同的像素值带中的恢复的像素与原始像素之间的差值的平均。
关于偏移参数解析单元22的更详细的描述,如果基于偏移合并信息,当前块的左侧块和右侧块的偏移参数中的至少一个与当前块的偏移参数相同,则当前块的偏移参数可被恢复为与当前块的左侧块和右侧块的偏移参数中的所述至少一个相同。可基于偏移合并信息在邻近块之中确定具有将被参考的偏移参数的块。
此外,如果基于偏移合并信息,当前块的左侧块和右侧块的偏移参数与当前块的偏移参数不同,则偏移参数解析单元22可从比特流解析并恢复当前块的偏移参数。
此外,如果从比特流解析出的一比特的偏移合并信息指示邻近块的偏移参数的部分信息与当前块的偏移参数相同,则偏移参数调整单元22可通过使用邻近块的偏移参数的所述部分信息,恢复当前块的偏移参数的部分信息。当前块的偏移参数的剩余信息可从比特流解析和恢复。
此外,偏移参数解析单元22可从比特流解析并恢复偏移值的差值。在这种情况下,偏移参数调整单元22可对邻近块的偏移值与当前块的偏移值之间的差信息进行组合,并预测和恢复当前块的偏移值。
此外,如果偏移参数不包括至少一个偏移值,则偏移参数解析单元22可将偏移值恢复为0。
根据实施例的偏移参数解析单元22可通过相互参考颜色分量的偏移参数来预测并恢复当前块的亮度分量和色度分量之中的至少一个颜色分量的偏移参数。例如,可通过共享或参考偏移参数来恢复亮度分量和色度分量的偏移参数。作为另一示例,可通过共享或参考偏移参数来预测并恢复第一色度分量和第二色度分量的偏移参数。
根据实施例的视频解码设备20可包括对偏移参数解析单元22和偏移调整单元24进行总体控制的中央处理器(未示出)。可选择地,偏移参数解析单元22和偏移调整单元24可通过它们各自的交互操作的处理器(未示出)来进行操作,因此,视频解码设备20可进行总体操作。可选择地,偏移参数解析单元22和偏移调整单元24可通过根据实施例的视频解码设备20的外部处理器(未示出)的控制来控制。
根据实施例的视频解码设备20可包括存储偏移参数解析单元22和偏移调整单元24的输入和输出数据的至少一个数据存储单元(未示出)。视频解码设备20可包括控制所述数据存储单元(未示出)的数据输入和输出的存储器控制单元(未示出)。
根据实施例的视频解码设备20可与安装在其中的内部视频解码处理器或外部视频解码处理器连同操作以通过视频解码恢复视频,从而执行视频解码操作。根据实施例的视频解码设备20的内部视频解码处理器可包括单独的处理器,以及视频解码设备20、中央操作设备或图形操作设备可包括视频解码处理模块来实现基本视频解码操作。
根据实施例的视频编码设备10和视频解码设备20使用采样点自适应偏移(SAO)以使原始像素和恢复的像素之间的误差最小化。通过使用根据实施例的SAO,视频编码设备10将每个图像块的像素分类为预定像素组,将每个像素分配到相应的像素组,并对指示包括在相同像素组中的恢复的像素和原始像素之间的误差的平均值的偏移值进行编码。
在视频编码设备10和视频解码设备20之间对采样进行编码和发送。也就是说,视频编码设备10可对采样进行编码,并将编码的采样作为比特流类型进行发送,视频解码设备20可从接收的比特流解析采样并恢复采样。根据实施例的视频编码设备10和视频解码设备20根据通过像素分类确定的偏移值来调整恢复的像素值并对偏移参数进行编码/解码,以使原始像素和恢复的像素之间的误差最小化。在视频编码设备10和视频解码设备20之间执行包括将偏移值编码、发送、接收和解码为偏移参数的信号传输。
因此,通过使用根据实施例的SAO,视频解码设备20可对接收的比特流进行解码,针对每个图像块产生恢复的像素,从比特流恢复偏移值并按相应的偏移调整恢复的像素,从而产生相对于原始图像具有最小误差的恢复的图像。
在下文中,现在将描述根据实施例的针对SAO将像素分类为像素组的实施例。通过使用根据实施例的SAO,可(i)根据组成恢复的像素的边缘类型或(ii)根据恢复的像素的像素值带类型对像素进行分类。可通过根据实施例的偏移类型来定义是根据边缘类型还是根据像素值带类型来对像素进行分类。
现在将描述通过使用根据实施例的SAO,根据边缘类型对像素进行分类的实施例。
可根据针对当前块确定的当前边缘类型来确定包括在当前块中的每个恢复的像素的边缘分类。也就是说,可通过将当前恢复的像素和邻近像素的像素值进行比较来定义当前恢复的像素的边缘分类。
例如,可根据下面的<处理1>来确定边缘分类。
<处理1>
Class=0;
fori,j∈Ω
ifRec(i,j)<Rec(x,y)thenClass++
ifRec(i,j)<Rec(x,y)thenClass--
当前恢复的像素Rec(x,y)的x和y分别表示水平坐标和垂直坐标。与当前恢复的像素Rec(x,y)邻近的邻近像素Rec(i,j)的i和j分别表示水平坐标和垂直坐标。Ω表示布置有邻近像素Rec(i,j)的空间范围,其中,所述邻近像素Rec(i,j)是当前恢复的像素Rec(x,y)的比较目标。也就是说,根据上面的<处理1>,可根据邻近像素Rec(i,j)的数量确定当前恢复的像素Rec(x,y)的边缘分类Class。在布置在预定空间范围中的邻近像素Rec(i,j)之中,边缘分类Class可根据具有比当前恢复的像素Rec(x,y)更大的像素值的邻近像素Rec(i,j)的数量而增加,并且边缘分类Class可根据具有比当前恢复的像素Rec(x,y)更小的像素值的邻近像素Rec(i,j)的数量而减少。
布置有邻近像素Rec(i,j)的<邻近像素空间范围Ω>可以以如下表示的方式来定义。
<最大邻近像素范围>
(i,j)∈Ω,but(i,j)≠(x,y)
x-M≤i≤x+M,&y-M≤j≤y+M
M表示从当前恢复的像素Rec(x,y)到邻近像素Rec(i,j)的最大水平和垂直距离。因此,最大邻近像素范围可包括布置在当前恢复的像素Rec(x,y)周围的邻近像素的最大数量(4M^2+4M)。在这种情况下,边缘分类Class可在从处于最小值的-(4M^2+4M)到处于最大值的(4M^2+4M)的范围内。边缘分类Class的中心值可指示当前恢复的像素Rec(x,y)是除边缘像素以外的布置在边缘周围的像素。邻近像素空间范围Ω内的邻近像素Rec(i,j)的数量可根据边缘类型而增加或减少。M可以是1以使运算量最小。
例如,在边缘类型是垂直类型的情况下,可将当前恢复的像素Rec(x,y)与沿水平方向布置的邻近像素Rec(i,j)在像素值上进行比较。也就是说,垂直边缘的邻近像素空间范围Ω可以以如下表示的方式来确定。
<垂直边缘的邻近像素空间范围Ω>
(i,j)∈Ω,but(i,j)≠(x,y)
x-M≤i≤x+M,&j=y
可根据边缘类型(诸如垂直边缘、水平边缘、对角线边缘)、由邻近像素空间范围Ω内的像素形成的严格最大值和严格最小值来确定邻近像素空间范围Ω的类型和尺寸。边缘分类值指示像素是被包括在边缘中还是被布置在边缘周围。因此,可确定用于根据边缘类型和边缘分类的组合校正组成边缘的像素值的偏移,因此可根据边缘类型和边缘分类的组合来定义像素组。
包括在邻近像素空间范围Ω中的邻近像素的数量可根据边缘类型来确定。可在邻近像素的数量的范围内确定边缘分类值。因此,视频编码设备10和视频解码设备20可对当前边缘类型的每个边缘分类的相应偏移值进行编码并发送和接收所述相应偏移值,并且根据所述偏移值调整恢复的像素。在下文中,根据预定边缘类型的边缘分类的系数被称为将被编码并被发送到视频解码设备20的偏移值的长度。
在用于边缘类型和边缘分类的预定组合的偏移值(即,针对当前边缘类型的边缘分类N的偏移值)被预先确定为0的情况下,不需要对所述偏移值进行编码并将其发送到视频解码设备20。在这种情况下,针对边缘类型和边缘分类的预定组合的长度可被减小。
因此,视频编码设备10和视频解码设备20可根据图像特征(诸如边缘类型)对像素进行分类,将具有相同特征的像素之间的平均误差值确定为偏移,并根据所述偏移调整恢复的像素,从而使原始图像和恢复的图像之间的误差最小化。
图3是根据本发明的实施例的用于像素分类的边缘类型31、32、33、34、35和36以及长度的表。
索引5、4、0、1、2和3可被依次分配给边缘类型31、32、33、34、35和36。边缘类型31、32、33、34、35和36的出现率越高,可被分配给边缘类型31、32、33、34、35和36的索引5、4、0、、1、2和3越小。可通过针对索引5的边缘类型31对当前恢复的像素X0的像素值和与当前恢复的像素X0邻近的八个邻近像素X1、X2、X3、X4、X5、X6、X7和X8的像素值进行比较来确定当前恢复的像素X0的边缘分类。在这种情况下,分配给当前恢复的像素X0的边缘分类的数量为17,因此长度可被确定为17。
如上所述,通过针对索引4的边缘类型32对当前恢复的像素X0的当前恢复的像素值和与当前恢复的像素X0水平和垂直邻近的四个邻近像素X1、X2、X3和X4进行比较,边缘分类的数量被确定为9,因此长度可被确定为9。
此外,通过针对索引0的边缘类型33对当前恢复的像素X0的当前恢复的像素值和与当前恢复的像素X0水平邻近的两个邻近像素X1和X2进行比较,边缘分类的数量被确定为5,因此长度可被确定为5。
此外,通过针对索引1的边缘类型34对当前恢复的像素X0的当前恢复的像素值和与当前恢复的像素X0水平邻近的两个邻近像素X3和X4进行比较,边缘分类的数量被确定为5,因此长度可被确定为5。
此外,通过针对索引2的边缘类型35对当前恢复的像素X0的当前恢复的像素值和与当前恢复的像素X0邻近的两个邻近像素X5和X8进行比较,边缘分类的数量被确定为5,因此长度可被确定为5。
此外,通过针对索引3的边缘类型36对当前恢复的像素X0的当前恢复的像素值和与当前恢复的像素X0沿45°的对角线方向邻近的两个邻近像素X6和X7进行比较,边缘分类的数量被确定为5,因此长度可被确定为5。
例如,在边缘类型是如索引0的边缘类型33的垂直边缘的情况下,当前恢复的像素X0的像素值和与当前恢复的像素X0水平邻近的两个邻近像素X1和X2的像素值被比较,可根据下面的<处理2>来确定当前恢复的像素X0的边缘分类Class。
<处理2>
(1)IF(X0>X1andX0<X2)thenClass=2
(2)IF(X0>X1andX1==X2)or(X0==X1andX1>X2)thenClass=1;
(3)IF(X0==X1andX1==X2)or(X0==X1andX1==X2)thenClass=0;
(4)IF(X0<X1andX1==X2)or(X0==X1andX1<X2)thenClass=-1;
(5)IF(X0<X1andX0<X2)thenClass=-2;
根据上面的<处理2>,在当前恢复的像素X0分别是(1)边缘的局部最大点、(2)块边缘的像素、(3)边缘以外的像素、(4)凹形边缘的像素、和(5)边缘的局部最小点的情况下,相应的边缘分类可被确定。在边缘分类值是0的情况下,由于偏移值很可能是0,因此可不对恢复的像素的边缘分类进行编码。
接下来,现在将描述根据实施例的通过使用SAO根据像素值带类型对像素进行分类的实施例。
恢复的像素的像素值可属于根据实施例的像素值带之一。例如,像素值的最小值Min和最大值Max可具有根据p比特的采样的总范围0、……、2^(p-1)。像素值范围(Min,Max)可被划分为K个像素值带。在BK表示第k像素值带的最大值的情况下,第k像素值带可被划分为[B0,B1-1]、[B1,B2-1]、[B2,B3-1]、...、[BK-1,BK]。在当前恢复的像素Rec(x,y)的像素值属于[BK-1,BK]的情况下,当前像素值带可被确定为k。
像素值带可被划分为相等类型或不等类型。这样的像素值带类型可考虑实际最小值Min和最大值Max来确定。在这种情况下,像素值带的划分参考可在视频编码设备10和视频解码设备20之间被编码并被发送或者被接收并被解码。在像素值带根据像素值的理论值{0,...,2p-1}被划分的情况下,像素值带类型可在不必被编码的情况下被确定。这样的像素值带类型可被定义为偏移类型。
可在根据像素值带类型分类的多个像素值带之中确定针对每个恢复的像素的每个像素值所属的像素值带。此外,可针对每个像素值带确定指示原始像素和恢复的像素之间的误差的平均的偏移值。
因此,视频编码设备10和视频解码设备20可对根据当前像素值带类型而分类的像素值带中的每一个的相应偏移值进行编码以及发送和接收,并根据所述偏移调整恢复的像素。此外,偏移值的长度可与像素值带的数量相应。视频编码设备10可对所述长度进行编码并将所述长度发送到视频解码设备20。
在用于边缘类型和边缘分类的预定组合的偏移值(即,针对当前像素值带类型的第k像素值带的偏移值)被预先确定为0的情况下,不需要对所述偏移值进行编码并将其发送到视频解码设备20。在这种情况下,针对边缘类型和边缘分类的预定组合的长度可被减小。
例如,在像素值分类类型是8比特的相等带的情况下,像素值可被划分为32个像素值带。更具体地讲,像素值可被划分为像素值带[0,7]、[8,15]、...、[240,247]、[248,255]。在这种情况下,长度为32。
在像素值带的总数量(即,长度)是2的幂的情况下,用于基于根据实施例的像素值带类型对像素进行分类的运算量可被最小化。
因此,视频编码设备10和视频解码设备20可根据图像特征(诸如像素值带类型)来对像素进行分类,将具有相同特征的像素之间的平均误差值确定为偏移,并根据所述偏移调整恢复的像素,从而使原始图像和恢复的图像之间的误差最小化。
根据实施例的视频编码设备10和视频解码设备20可针对每个预定区域确定偏移类型和偏移值。视频编码设备10可针对包括在预定区域中的每个像素确定原始像素值与恢复的像素值之间的误差,并将像素误差的平均确定为偏移值。对于提示操作,视频编码设备10和视频解码设备20可确定并且发送或接收每个块的偏移值。
可根据每个块的图像特征确定偏移类型。例如,包括垂直边缘、水平边缘、对角线边缘等的块优选用于根据边缘类型对像素值进行分类并确定用于边缘值的校正的偏移值。在块不是边缘块的情况下,可根据带分类优选地确定偏移值。因此,视频编码设备10和视频解码设备20可发送或接收每个块的偏移类型。
根据实施例的偏移参数可包括偏移类型、偏移值、长度和偏移分类。所述长度可根据偏移类型来确定。根据实施例的视频编码设备10和视频解码设备20可确定与偏移类型相应的偏移分类。
因此,根据实施例的视频编码设备10可对偏移参数的偏移类型和偏移值进行编码并将其发送到视频解码设备20。视频解码设备20可接收偏移类型和偏移值并基于偏移类型确定长度和偏移分类。此外,视频解码设备20可从接收的偏移值选择与所述长度或偏移分类相应的偏移值,并根据该偏移值调整恢复的像素。
根据实施例的视频编码设备10可根据偏移类型的出现率来确定偏移类型的索引,以对偏移类型进行编码。例如,多个偏移类型之中的特定索引的偏移类型的出现率越高,所述索引的码字可被编码得越短。
视频编码设备10和视频解码设备20可具有根据边缘类型和像素值带类型而可从包括像素分类的偏移类型之中选择的偏移类型的索引的以下示例:
(i)在SAO未被使用的情况下,偏移类型是-1;
(ii)在沿垂直方向包括三个像素的边缘类型的情况下,偏移类型是0;
(iii)在沿水平方向包括三个像素的边缘类型的情况下,偏移类型是1;
(iv)在沿135°的对角线方向包括三个像素的边缘类型的情况下,偏移类型是2;
(v)在沿45°的对角线方向包括三个像素的边缘类型的情况下,偏移类型是3;
(vi)像素值带类型的偏移类型是4。
在(ii)偏移类型是0的情况下,边缘分类可被编码为{-2,-1,1,2}。边缘类型0可不被编码,因此长度可以是4。在(vi)偏移类型是4的情况下,像素值带的数量为32,因此长度可以是32。
图4是示出根据本发明的实施例的偏移值编码处理的流程图。
将被编码和解码的偏移值很可能为0以在本发明的实施例的视频编码设备10和视频解码设备20之间进行发送和接收。除0以外的偏移值具有正符号(positivesign)或负符号(negativesign)。因此,根据实施例的视频编码设备10确定当前偏移值是否为0(操作41),如果当前偏移值不为0,则确定当前偏移值是否大于0(操作42)。如果当前偏移值大于0,则对符号(sign)比特“0”进行编码(操作44)。如果当前偏移值不大于0,则对符号比特“1”进行编码(操作43)。在符号比特被编码之后,通过对通过将偏移值(Offset)的绝对值减小1而获得的值进行一元二进制编码产生的比特率可被进一步编码(操作45)。如果当前偏移值为“0”,则视频编码设备10可对当前偏移值“0”进行最终编码(操作46),并对偏移值进行完全编码。
视频解码设备20可接收偏移值,确定偏移值是否为0,如果偏移值不为0,则对符号比特和通过将偏移值的绝对值减小1而获得的值进行解析,并恢复当前偏移值。
根据实施例的偏移参数可针对每个块而被确定并被发送和接收。例如,视频编码设备10和视频解码设备20可针对每个画面或每个条带确定以及发送和接收偏移参数。可选择地,视频编码设备10和视频解码设备20可针对树结构的每个编码单元或最大编码单元确定以及发送和接收偏移参数。稍后将参照图8至图20更详细地描述根据实施例的基于包括最大编码单元的树结构的编码单元的视频编码/解码操作和树结构的编码单元。
每个块的偏移类型和/或偏移值在相邻块之间很可能相同。在当前块的偏移参数与邻近块的偏移参数进行比较并与其相同的情况下,根据实施例的视频编码设备10可将当前块和邻近块的偏移参数合并为一个偏移参数并对其进行编码。如果邻近块的偏移参数被首先编码,则当前块的偏移参数可不被编码,但是当前块的偏移合并信息可被编码。
根据实施例的视频解码设备20可在从接收的比特流解析偏移参数之前首先对偏移合并信息进行解析并确定偏移参数是否被解析。视频解码设备20可基于当前块的偏移合并信息确定在邻近块的偏移参数中是否存在与当前块具有相同偏移参数的块。
例如,如果基于当前块的偏移合并信息,确定在邻近块的偏移参数中存在与当前块具有相同偏移参数的块,则视频解码设备20可不对当前块的偏移参数进行解析,而是可将当前块的偏移参数恢复为与邻近块的恢复的偏移参数相同。此外,可基于偏移合并信息在邻近块之中确定具有将被参考的偏移参数的邻近块。
例如,在基于当前块的偏移合并信息,邻近块的偏移参数与当前块的偏移参数不同的情况下,视频解码设备20可从比特流解析并恢复当前块的偏移参数。
图5是根据本发明的实施例的用于合并偏移参数的候选参考块的示图。
根据实施例的视频编码设备10可从在当前块之前恢复的邻近块之中确定作为当前块50的偏移参数的参考目标的邻近块的候选列表。视频编码设备10可将候选列表的邻近块与当前块50的偏移参数进行比较。
根据实施例的候选列表可包括布置在当前帧57中的与当前块50相同的邻近块。更具体地,左侧块51、上侧块52、左上侧块53和右上侧块54可被包括在候选列表中。
根据另一实施例的视频编码设备10可参考包括在先于当前帧57恢复的邻近帧58和59中的块55和56的偏移参数。包括在邻近帧58和59中的块55和56可以是布置在时间上在当前帧57之前的帧58和在当前帧57之后的帧59中的块,并且在空间上与当前块50处于相同的区域。在这种情况下,候选列表可包括当前帧57中包括的邻近块51、52、53和54以及邻近帧58和59中包括的块55和56。
因此,根据实施例的视频编码设备10可根据预定参考顺序将包括在候选列表中的邻近块的偏移参数与当前块50的偏移参数进行比较。例如,可根据左侧块51、上侧块52、左上侧块53、右上侧块54、在前块55和后续块56的参考顺序将邻近块的偏移参数与当前块50的偏移参数进行比较。被比较的邻近块之中的与当前块50具有相同偏移参数的邻近块可被确定为参考块。
视频编码设备10和视频解码设备20可基于相同的候选列表预测并参考相邻块之间的偏移参数,并对其进行编码和发送或者是对其进行接收和解码。根据实施例的视频解码设备20可基于偏移合并信息从候选列表确定与当前块50具有相同偏移参数的邻近块,并且参考相应邻近块的偏移参数来恢复具有与所述相应邻近块的偏移参数相同的值的当前块50的偏移参数。
例如,假设使用包括左侧块51和上侧块52的候选列表。根据实施例的偏移参数编码单元14可将指示左侧块51的偏移参数与当前块50的偏移参数是否相同的左偏移合并信息以及指示上侧块52的偏移参数与当前块50的偏移参数是否相同的上偏移合并信息编码为偏移合并信息。在这种情况下,当前块50可与左侧块51进行比较以确定它们的偏移参数是否彼此相同,然后当前块50可与上侧块52进行比较以确定它们的偏移参数是否彼此相同。可根据比较结果确定偏移合并信息。
如果左侧块51和上侧块52的至少一个偏移参数与当前块50的偏移参数相同,则偏移参数编码单元14可对相应的左偏移合并信息和上偏移合并信息进行编码,但可不对当前块50的偏移参数进行编码。
如果左侧块51和上侧块52的偏移参数与当前块50的偏移参数不同,则偏移参数编码单元14可对相应的左偏移合并信息和上偏移合并信息以及当前块的偏移参数进行编码。
如果左侧块51和上侧块52的偏移参数与当前块50的偏移参数不同,则根据实施例的偏移参数编码单元14可对当前块50的偏移合并信息和偏移参数进行编码。
作为另一示例,如果邻近块的偏移参数的部分信息与当前块50的偏移参数相同,则根据实施例的偏移参数编码单元14可对一比特的偏移合并信息以及除了邻近块的偏移参数的所述相同部分信息以外的当前偏移参数的剩余信息进行编码。例如,如果当前块50和邻近块在偏移值上彼此相同,则可为当前块50对一比特的偏移合并信息以及偏移类型值进行编码。
根据实施例的视频编码设备10和视频解码设备20可对当前块50和邻近块之间的偏移类型和偏移值进行比较,如果存在与当前块50具有相同偏移类型和偏移值的邻近块,则可发送和接收偏移合并信息。
作为另一示例,在当前块50和邻近块的偏移参数之中对偏移类型进行比较,如果存在与当前块50具有相同偏移类型的邻近块,则可发送和接收相应邻近块的偏移类型的合并信息。
作为另一示例,在当前块50和邻近块的偏移参数之中对偏移值进行比较,如果存在与当前块50具有相同偏移值的邻近块,则可发送和接收相应邻近块的偏移值的合并信息。
如果相邻块在长度上相同但相邻块之间的偏移类型不同,则相邻块的偏移值可能相似。例如,相邻块很可能组成由图像指示的对象之中的相同对象区域。因此,尽管当前块50的作为垂直边缘的边缘类型与邻近块的作为对角线边缘的边缘类型不同,但是当前块50和邻近块的像素可组成相同的对象区域。因此,当前块50的偏移值和邻近块的偏移值可能趋于相似。因此,针对当前块50的邻近块的候选列表可包括仅具有相同长度的边缘类型的邻近块。
根据实施例的视频编码设备10和视频解码设备20可通过在具有相同长度的块之间参考邻近块的偏移参数来预测当前块50的偏移参数。
在对偏移参数执行预测编码的情况下,视频编码设备10和视频解码设备20可用信号传输包括可被参考的邻近块的预测候选列表,以对偏移参数执行预测编码。可选择地,与当前块50最相邻的块的偏移参数总是被参考,因此包括在预测候选列表中的最相邻的块可既不被发送也不被接收。
根据实施例的包括当前块50的最相邻的块的预测候选列表可在(ii)当前块50之前恢复的并具有相同长度的候选块之中(i)包括按参考顺序排列的候选块,(iii)而不包括具有相同偏移参数的候选块。预测候选列表的第一排位候选块可以是最相邻的块。例如,如果预测候选列表包括布置在距当前块50相同距离处的左侧块51和上侧块52,则比上侧块52具有更小的从当前块50访问所必要的运算量的左侧块51可以是最相邻的块。
在确定了预测候选列表之后,可通过参考最相邻的块的偏移值对当前块50的偏移值执行预测编码。当前块50的偏移值与最相邻的块的偏移值之间的差值可被编码并且被发送或接收。
Offset[i]-Offset_prediction[i],O≤i≤Length-1
也就是说,根据<偏移预测值>,在当前块50和具有相同长度Length的最相邻的块之间,当前块50的偏移值Offset[i]与最相邻的块的偏移值Offset_prediction[i]之间的差值Offset[i]-Offset_prediction[i]可针对每个边缘分类i(或每个像素值带)被编码并且被发送或接收。每当边缘分类i(或像素值带)改变时,针对相应边缘分类(或相应像素值带)的预测差值可被发送或接收。
根据实施例的视频编码设备10和视频解码设备20可对偏移参数有限地执行合并编码或预测编码。例如,为了根据像素值带类型对当前块50的偏移参数进行编码,尽管两个邻近块具有相同的长度(即,相同数量的像素值带),但邻近块的最大值和最小值与当前块50的最大值和最小值不同,因此如果像素值的总体范围在邻近块和当前块50之间不同,则邻近块的偏移参数和当前块50的偏移参数根据像素值带类型没有关系。因此,如果邻近块和当前块50在偏移类型的特征上不同,则视频编码设备10和视频解码设备20不会优选地对相邻块之间的偏移参数进行合并并执行预测编码。
根据实施例的视频编码设备10和视频解码设备20可对针对每个颜色分量的偏移参数执行预测编码。
例如,SAO可被应用于YUV颜色格式的亮度块和色度块两者。Y分量的亮度块的偏移类型和/或偏移值可与U分量和V分量的色度块的偏移类型和/或偏移值非常相似。
例如,视频编码设备10和视频解码设备20将与当前色度块处于相同位置的亮度块添加到当前色度块的候选列表,因此可通过参考亮度块的偏移参数来预测当前色度块的偏移参数。最高优先级可被分配给包括在候选列表中的块的参考列表之中的亮度块。
作为另一示例,视频编码设备10和视频解码设备20可基于亮度分量和色度分量的偏移参数之间的预定关系对偏移参数进行编码。一般而言,色度块比亮度块更平,并且色度块的根据最大值和最小值的偏移值的绝对值、边缘分类和像素值带比亮度块的根据最大值和最小值的偏移值的绝对值、边缘分类和像素值带更小。
以下的<色度偏移预测等式>解释在基于亮度块的偏移值确定色度块的偏移值的情况下执行色度块的偏移值的预测编码的实施例。
<色度偏移预测等式>
Value_to_be_encoded[i]=Offset[i]-F(Offset_prediction[i]);
whereinF(x)=A*x+B;
在这点上,i表示长度范围内的当前边缘分类(像素值带)并且基于色度块所参考的亮度块的偏移值Offset_prediction[i]而确定的色度块的预测值F(Offset_prediction[i])和偏移值Offset[i]之间的误差值Value_to_be_encoded[i]可在视频编码设备10和视频解码设备20之间被发送和接收。
在F(x)中,A和B表示亮度块和色度块之间的相关性参数。相关性参数A和B可针对U分量和Y分量被单独设置。可选择地,U分量和Y分量可共享相关性参数A和B。
根据实施例的视频编码设备10和视频解码设备20可对相关性参数A和B进行编码和发送、或者接收和解码,以基于颜色分量之间的相关性对亮度块和色度块之间的偏移值执行预测编码。相关性参数A和B可被预先固定为根据实施例的预定值。根据实施例的相关性参数A和B可针对每个预定数据单元(诸如块、画面、条带、视频序列等)来确定,并且可在被包括在针对每个块、画面参数集(PPS)、条带头和序列参数集(SPS)的参数中之后被发送或接收。
图6是示出根据本发明的实施例的视频编码方法的流程图。
在操作61,根据视频的多个块之中的当前块的边缘类型的边缘分类可被确定或者根据像素值带类型的像素值带可被确定。
在根据边缘类型确定当前块的偏移的情况下,可通过将当前恢复的像素和邻近像素的像素值进行比较来确定指示当前恢复的像素是否是当前恢复的像素的根据边缘方向和边缘尺寸布置的邻近像素之中的极值点的边缘分类。
此外,在根据恢复的像素的像素值带类型确定当前块的偏移的情况下,可在多个带之中确定指示当前恢复的像素的像素值所属的像素值范围的像素值带。
在操作63,通过使用包括在当前边缘分类或像素值带中的恢复的像素和原始像素之间的差值来确定与当前边缘分类或像素值带相应的偏移。包括在相同边缘分类或相同像素值带中的恢复的像素和原始像素之间的差值的平均值可被确定为偏移值。
在操作65,每个块的偏移参数被编码。偏移参数可包括相应块的偏移类型、相应块的偏移值、相应块的长度以及相应块的边缘分类和像素值带。
每个块的偏移类型指示相应块的边缘类型或像素值带类型。根据每个块的边缘类型将每个块的恢复的像素分类为多个边缘分类,并且针对每个边缘分类确定每个偏移值,因此确定与多个边缘分类相应的多个偏移值。可选择地,根据每个块的边缘类型将每个块的恢复的像素分类为多个像素值带,并且针对每个像素值带确定每个偏移值,因此确定与多个像素值带相应的多个偏移值。根据每个块的边缘类型或每个块的像素值带确定长度。因此,可对每个块的偏移参数之中的仅偏移类型和偏移值进行编码。
可基于当前块和至少一个邻近块的偏移参数之间的同一性对当前块的偏移合并信息进行编码。偏移合并信息可指示当前块的偏移参数是否被编码。也就是说,如果邻近块包括具有与当前块的偏移参数相同的偏移参数的块,则仅当前块的偏移合并信息可被编码,当前块的偏移参数可不被编码。
可通过对邻近块的偏移参数和当前块的偏移参数执行预测来对邻近块的偏移参数和当前块的偏移参数之间的差信息进行编码。可通过参考亮度块和色度块彼此的偏移参数来对当前块的亮度块和色度块之中的至少一个颜色分量执行预测编码。
图7是示出根据本发明的实施例的视频解码方法的流程图。
在操作71,从接收的比特流解析指示视频的多个块之中的当前块和至少一个邻近块的偏移参数是否彼此相同的偏移合并信息。
在操作73,基于偏移合并信息恢复当前块的偏移参数之中的偏移类型和偏移值。
在操作75,基于指示偏移类型的当前块的边缘类型或当前块的像素值带类型来确定恢复的像素的边缘分类或恢复的像素的像素值带。在操作77,从偏移值确定与恢复的像素的边缘分类或恢复的像素的像素值带相应的偏移值,并根据确定的偏移值调整恢复的像素的像素值。
在操作75中当前块的偏移类型是边缘类型的情况下,可通过将当前恢复的像素和当前恢复的像素的根据边缘方向和边缘尺寸布置的邻近像素的像素值进行比较来确定当前恢复的像素的边缘分类。在这种情况下,在操作77,可从接收的偏移值选择与当前恢复的像素的边缘分类相应的偏移。
此外,在操作75中当前块的偏移类型是像素值带类型的情况下,可确定当前恢复的像素的像素值带,并且在操作77,可从偏移值选择与当前恢复的像素的像素值带相应的偏移。
如果基于操作71中的偏移合并信息,当前块的左侧块和上侧块的至少一个偏移参数与当前块的偏移参数相同,则当前块的偏移参数可被恢复为与当前块的左侧块和上侧块的所述至少一个偏移参数相同。此外,如果基于偏移合并信息,当前块的左侧块和上侧块的至少一个偏移参数与当前块的偏移参数不同,则可从接收的比特流解析当前块的偏移参数,并可恢复当前块的偏移参数。
如果在操作71从比特流解析出偏移值的差值,则可通过对偏移值之间的差值信息和邻近块的偏移信息进行组合来对当前块的偏移值执行预测恢复。
通过在操作71参考当前块的亮度分量和色度分量彼此的偏移参数来对当前块的亮度分量和色度分量之中的至少一个颜色分量执行预测恢复。
因此,根据实施例的使用SAO的视频编码设备10和视频解码设备20根据图像特征(诸如图像块的边缘类型或图像块的像素值带类型)对像素值进行分类,对作为具有相同特征的分类的像素值之间的平均误差值的偏移值进行编码和发送或者进行接收和解码,并根据所述偏移值对在恢复的像素之中的非预期的像素值进行调整,从而使原始图像和恢复的图像之间的误差最小化。
根据实施例的视频编码设备10和视频解码设备20可对从视频数据划分为树结构的编码单元的块进行划分,并如上所述针对每个最大编码单元或每个编码单元根据像素分类确定偏移设置。以下将参照图7至图20描述根据实施例的基于具有树结构的编码单元和变换单元的视频编码方法和设备以及视频解码方法和设备。
图8是根据本发明的实施例的基于具有树结构的编码单元的视频编码设备100的框图。
根据实施例的涉及基于具有树结构的编码单元的视频预测的视频编码设备100包括最大编码单元划分器110、编码单元确定器120和输出单元130。为便于描述,根据实施例的涉及基于具有树结构的编码单元的视频预测的视频编码设备100在下文中将被称为“视频编码设备100”。
最大编码单元划分器110可基于针对图像的当前画面的最大编码单元来划分当前画面。如果当前画面大于最大编码单元,则当前画面的图像数据可被划分为至少一个最大编码单元。根据本发明的实施例的最大编码单元可以是尺寸为32×32、64×64、128×128、256×256等的数据单元,其中,数据单元的形状是具有2的若干次方的宽度和长度的正方形。图像数据可根据至少一个最大编码单元被输出到编码单元确定器120。
根据本发明的实施例的编码单元可由最大尺寸和深度来表征。深度表示编码单元从最大编码单元空间划分编码单元的次数,并且随着深度加深,根据深度的较深层编码单元可从最大编码单元划分为最小编码单元。最大编码单元的深度是最高深度,最小编码单元的深度是最低深度。由于随着最大编码单元的深度加深,与每个深度相应的编码单元的尺寸减小,因此,与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。
如上所述,当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单元,并且每个最大编码单元可包括根据深度被划分的较深层编码单元。由于根据本发明的实施例的最大编码单元根据深度被划分,因此包括在最大编码单元中的空间域的图像数据可根据深度被分层地分类。
可预先确定编码单元的最大深度和最大尺寸,其中,编码单元的最大深度和最大尺寸限制最大编码单元的高度和宽度被分层地划分的总次数。
编码单元确定器120对通过根据深度划分最大编码单元的区域而获得的至少一个划分区域进行编码,并根据所述至少一个划分区域确定用于输出最终编码的图像数据的深度。换句话说,编码单元确定器120通过根据当前画面的最大编码单元对根据深度的较深层编码单元中的图像数据进行编码并选择具有最小编码误差的深度,来确定编码深度。因此,与确定的编码深度相应的编码单元的编码图像数据被最终输出。此外,与编码深度相应的编码单元可被视为被编码的编码单元。确定的编码深度和根据确定的编码深度的编码图像数据被输出到输出单元130。
基于与等于或小于最大深度的至少一个深度相应的较深层编码单元对最大编码单元中的图像数据进行编码,并且基于每个较深层编码单元比较对图像数据进行编码的结果。在对较深层编码单元的编码误差进行比较之后,可选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。
随着编码单元根据深度被分层地划分,并且随着编码单元的数量增加,最大编码单元的尺寸被划分。另外,即使在一个最大编码单元中多个编码单元相应于相同深度,也通过分别测量每个编码单元的图像数据的编码误差来确定是否将与相同深度相应的编码单元中的每个编码单元划分至更低深度。因此,即使当图像数据被包括在一个最大编码单元中时,图像数据也根据多个深度被划分为多个区域,在一个最大编码单元中编码误差可根据区域而不同,因此编码深度可根据图像数据中的区域而不同。因此,在一个最大编码单元中可确定一个或多个编码深度,并且可根据至少一个编码深度的编码单元来划分最大编码单元的图像数据。
因此,编码单元确定器120可确定包括在当前最大编码单元中的具有树结构的编码单元。根据本发明的实施例的“具有树结构的编码单元”包括最大编码单元中所包括的所有较深层编码单元中的与确定为编码深度的深度相应的编码单元。在最大编码单元的相同区域中,编码深度的编码单元可根据深度被分层地确定,在不同的区域中,该编码深度的编码单元可被独立地确定。类似地,当前区域中的编码深度可独立于另一区域中的编码深度被独立确定。
根据本发明的实施例的最大深度是与从最大编码单元到最小编码单元进行划分的次数相关的索引。根据本发明的实施例的第一最大深度可表示从最大编码单元到最小编码单元进行划分的总次数。根据本发明的实施例的第二最大深度可表示从最大编码单元到最小编码单元的深度级的总数。例如,当最大编码单元的深度是0时,最大编码单元被划分一次的编码单元的深度可被设置为1,并且最大编码单元被划分两次的编码单元的深度可被设置为2。这里,如果最小编码单元是最大编码单元被划分四次的编码单元,则存在深度为0、1、2、3和4的5个深度级,因此,第一最大深度可被设置为4,第二最大深度可被设置为5。
可根据最大编码单元执行预测编码和变换。还可根据最大编码单元,基于根据等于最大深度的深度或小于最大深度的多个深度的较深层编码单元来执行预测编码和变换。可根据正交变换或整数变换的方法来执行变换。
由于每当最大编码单元根据深度被划分时,较深层编码单元的数量增加,因此对随着深度的加深而产生的所有的较深层编码单元执行包括预测编码和变换的编码。为了便于描述,现在将基于最大编码单元中的当前深度的编码单元来描述预测编码和变换。
视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码,执行多个操作(诸如,预测编码、变换和熵编码),此时,可针对所有操作使用相同的数据单元,或者可针对每个操作使用不同的数据单元。
例如,视频编码设备100不仅可选择用于对图像数据进行编码的编码单元,还可选择与该编码单元不同的数据单元,以便对编码单元中的图像数据执行预测编码。
为了在最大编码单元中执行预测编码,可基于与编码深度相应的编码单元(即,基于不再被划分为与更低深度相应的多个编码单元的编码单元)执行预测编码。在下文中,不再被划分并且变为用于预测编码的基本单元的编码单元现在将被称为“预测单元”。通过划分预测单元而获得的分区可包括:通过划分预测单元的高度和宽度中的至少一个而获得的预测单元或数据单元。分区是从编码单元的预测单元划分的数据单元,预测单元可以是与编码单元具有相同尺寸的分区。
例如,当2N×2N(其中,N是正整数)的编码单元不再被划分并且变为2N×2N的预测单元时,分区的尺寸可以是2N×2N、2N×N、N×2N或N×N。分区类型的示例包括通过对预测单元的高度或宽度进行对称划分而获得的对称分区、通过对预测单元的高度或宽度进行不对称划分(诸如,1:n或n:1)而获得的分区、通过对预测单元进行几何划分而获得的分区以及具有任意形状的分区。
预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个。例如,可对2N×2N、2N×N、N×2N或N×N的分区执行帧内模式或帧间模式。另外,可仅对2N×2N的分区执行跳过模式。对编码单元中的一个预测单元独立地执行编码,从而选择具有最小编码误差的预测模式。
视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与该编码单元不同的数据单元,对编码单元中的图像数据执行变换。
为了在编码单元中执行变换,可基于具有小于或等于编码单元的尺寸的数据单元来执行变换。例如,数据单元可包括用于帧内模式的数据单元以及用于帧间模式的变换单元。
还可在变换单元中设置指示通过对编码单元的高度和宽度进行划分以达到变换单元而进行划分的次数的变换深度。例如,在2N×2N的当前编码单元中,当变换单元的尺寸也是2N×2N时,变换深度可以是0,在当前编码单元的高度和宽度中的每一个被划分为相等的两部分,总共被划分为4^1个变换单元并且因此变换单元的尺寸是N×N时,变换深度可以是1,在当前编码单元的高度和宽度中的每一个被划分为相等的四部分,总共被划分为4^2个变换单元并且因此变换单元的尺寸是N/2×N/2时,变换深度可以是2。例如,可根据分层树结构设置变换单元,其中,在所述分层树结构中,更高变换深度的变换单元根据变换深度的分层特性被划分为四个更低变换深度的变换单元。
与编码单元类似,编码单元中的变换单元可被递归地划分为更小尺寸的区域,使得变换单元可以以区域为单位被独立地确定。因此,可根据变换深度,根据具有树结构的变换对编码单元中的残差数据进行划分。
根据与编码深度相应的编码单元的编码信息不仅需要关于编码深度的信息,还需要与预测编码和变换相关的信息。因此,编码单元确定器120不仅确定具有最小编码误差的编码深度,还确定预测单元中的分区类型、根据预测单元的预测模式以及用于变换的变换单元的尺寸。
稍后将参照图7至图19来详细地描述根据本发明的实施例确定最大编码单元中的根据树结构的编码单元、预测单元、分区以及变换单元的方法。
编码单元确定器120可通过使用基于拉格朗日乘子(Lagrangianmultiplier)的率失真优化来测量根据深度的较深层编码单元的编码误差。
输出单元130在比特流中输出最大编码单元的图像数据以及关于根据编码深度的编码模式的信息,其中,所述图像数据基于由编码单元确定器120确定的至少一个编码深度被编码。
可通过对图像的残差数据进行编码来获得编码的图像数据。
关于根据编码深度的编码模式的信息可包括关于编码深度的信息、关于预测单元中的分区类型的信息、预测模式以及变换单元的尺寸。
可通过使用根据深度的划分信息来定义关于编码深度的信息,所述划分信息指示是否针对更低深度而非当前深度的编码单元来执行编码。如果当前编码单元的当前深度是编码深度,则当前编码单元中的图像数据被编码和输出,因此划分信息可被定义为不将当前编码单元划分为更低深度。可选择地,如果当前编码单元的当前深度不是编码深度,则对更低深度的编码单元执行编码,因此划分信息可被定义为划分当前编码单元以获得更低深度的编码单元。
如果当前深度不是编码深度,则对被划分为更低深度的编码单元的编码单元执行编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中,因此对更低深度的每个编码单元重复地执行编码,因而可对具有相同深度的编码单元递归地执行编码。
由于针对一个最大编码单元确定具有树结构的编码单元,并且针对编码深度的编码单元确定关于至少一个编码模式的信息,因此可针对一个最大编码单元确定关于至少一个编码模式的信息。另外,由于图像数据根据深度被分层地划分,因此最大编码单元的图像数据的编码深度可根据位置而不同,因而可对图像数据设置关于编码深度以及编码模式的信息。
因此,输出单元130可将关于相应编码深度和编码模式的编码信息分配给包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。
根据本发明的实施例的最小单元是通过将组成最低深度的最小编码单元划分为4份而获得的矩形数据单元。可选择地,最小单元可以是可被可包括在最大编码单元中所包括的所有编码单元、预测单元、分区单元和变换单元中的最大矩形数据单元。
例如,通过输出单元130输出的编码信息可被分类为根据编码单元的编码信息以及根据预测单元的编码信息。根据编码单元的编码信息可包括关于预测模式的信息以及关于分区的尺寸的信息。根据预测单元的编码信息可包括关于以下内容的信息:帧间模式的估计方向、帧间模式的参考图像索引、运动矢量、帧内模式的色度分量以及帧内模式的插值方法。此外,关于根据画面、条带或GOP定义的编码单元的最大尺寸的信息以及关于最大深度的信息可被***到比特流的头、序列参数集或画面参数集。
此外,关于针对当前视频允许的变换单元的最大尺寸的信息以及关于所述变换单元的最小尺寸的信息可通过比特流的头、序列参数集或画面参数集被输出。输出单元130可对与参照图1至图6描述的预测相关的参考信息、双向预测信息、包括四个条带类型的条带类型信息等进行编码和输出。
在视频编码设备100中,较深层编码单元可以是通过将作为上一层的更高深度的编码单元的高度或宽度除以二而获得的编码单元。换句话说,在当前深度的编码单元的尺寸是2N×2N时,更低深度的编码单元的尺寸是N×N。另外,尺寸为2N×2N的当前深度的编码单元可包括最多4个更低深度的编码单元。
因此,视频编码设备100可通过基于考虑当前画面的特性所确定的最大编码单元的尺寸和最大深度,针对每个最大编码单元确定具有最佳形状和最佳尺寸的编码单元,来形成具有树结构的编码单元。另外,由于通过使用各种预测模式和变换中的任意一个对每个最大编码单元执行编码,因此可考虑各种图像尺寸的编码单元的特征来确定最佳编码模式。
因此,如果在传统的宏块中对具有高分辨率或大数据量的图像进行编码,则每个画面的宏块的数量过度增加。因此,针对每个宏块产生的压缩信息的条数增加,因此难以发送压缩信息并且数据压缩效率降低。然而,通过使用视频编码设备100,由于在考虑图像的尺寸的同时增加编码单元的最大尺寸,同时在考虑图像的特征的同时调整编码单元,因此图像压缩效率会增加。
图8的视频编码设备100可执行以上参照图1描述的视频编码设备10的操作。
编码单元确定器120可执行视频编码设备10的偏移确定单元12的操作。编码单元确定器120可通过根据针对每个最大编码单元的边缘类型对像素值进行分类来确定针对每个边缘分类的偏移值,或者通过根据像素值带类型对像素值进行分类来确定针对每个像素值带的偏移值。每个像素组(诸如边缘分类或像素值带)的偏移值可以是包括在相应像素组中的恢复的像素和原始像素之间的平均误差值。作为另一示例,可针对每个预定数据单元(诸如编码单元、预测单元和变换单元)确定边缘分类和偏移值或者是像素值带和偏移值。
输出单元130可对针对每个最大编码单元确定的偏移参数之中的偏移类型和偏移值进行编码。在针对每个预定数据单元(诸如编码单元、预测单元和变换单元)确定偏移参数的情况下,偏移类型和偏移值可被编码为相应数据单元的参数。
输出单元130可通过参考邻近最大编码单元的邻近偏移参数来对当前最大编码单元的当前偏移参数执行预测编码。如果邻近偏移参数中的至少一个与当前偏移参数相同,则输出单元130可在不对当前偏移参数进行编码的情况下对针对当前最大编码单元的偏移合并信息进行编码。如果邻近偏移参数与当前偏移参数彼此不同,则输出单元130可对针对当前最大编码单元的偏移合并信息和当前偏移参数进行编码。
图9是根据本发明的实施例的基于具有树结构的编码单元的视频解码设备200的框图。
根据实施例的涉及基于具有树结构的编码单元的视频预测的视频解码设备200包括接收器210、图像数据和编码信息提取器220以及图像数据解码器230。为了便于描述,根据实施例的涉及基于具有树结构的编码单元的视频预测的视频解码设备200在下文中将被称为“视频解码设备200”。
用于视频解码设备200的各种操作的各种术语(诸如,编码单元、深度、预测单元、变换单元和关于各种编码模式的信息)的定义与以上参照图7和视频编码设备100描述的那些定义相同。
接收器210接收编码视频的比特流并对其进行解析。图像数据和编码信息提取器220从解析的比特流提取用于每个编码单元的编码图像数据,并且将提取的图像数据输出到图像数据解码器230,其中,编码单元具有根据每个最大编码单元的树结构。图像数据和编码信息提取器220可从关于当前画面的头或SPS提取关于当前画面的编码单元的最大尺寸的信息。
另外,图像数据和编码信息提取器220从解析的比特流针对根据每个最大编码单元的具有树结构的编码单元提取关于编码深度和编码模式的信息。提取的关于编码深度和编码模式的信息被输出到图像数据解码器230。换句话说,比特流中的图像数据被划分为最大编码单元,从而图像数据解码器230针对每个最大编码单元对图像数据进行解码。
可针对关于与编码深度相应的至少一个编码单元的信息来设置关于根据最大编码单元的编码深度和编码模式的信息,并且关于编码模式的信息可包括关于以下内容的信息:与编码深度相应的相应编码单元的分区类型、预测模式以及变换单元的尺寸。另外,根据深度的划分信息可被提取为关于编码深度的信息。
由图像数据和编码信息提取器220提取的关于根据每个最大编码单元的编码深度和编码模式的信息是关于这样的编码深度和编码模式的信息:所述编码深度和编码模式被确定用于当编码器(诸如,视频编码设备100)根据每个最大编码单元针对根据深度的每个较深层编码单元重复执行编码时产生最小编码误差。因此,视频解码设备200可通过根据产生最小编码误差的编码深度和编码模式对图像数据进行解码来恢复图像。
由于关于编码深度和编码模式的编码信息可被分配给相应编码单元、预测单元以及最小单元中的预定数据单元,因此,图像数据和编码信息提取器220可根据预定数据单元提取关于编码深度和编码模式的信息。被分配相同的关于编码深度和编码模式的信息的预定数据单元可被推断为是包括在相同的最大编码单元中的数据单元。
图像数据解码器230通过基于关于根据最大编码单元的编码深度和编码模式的信息对每个最大编码单元中的图像数据进行解码来恢复当前画面。换句话说,图像数据解码器230可基于提取的关于包括在每个最大编码单元中的具有树结构的编码单元中的每个编码单元的分区类型、预测模式和变换单元的信息来对编码图像数据进行解码。解码处理可包括预测(所述预测包括帧内预测和运动补偿)和反变换。可根据反正交变换或反整数变换来执行反变换。
图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的分区类型以及预测模式的信息,根据每个编码单元的分区和预测模式来执行帧内预测或运动补偿。
另外,图像数据解码器230可基于关于根据编码深度的编码单元的变换单元的尺寸的信息,根据编码单元中的每个变换单元执行反变换,以便根据最大编码单元执行反变换。
图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的至少一个编码深度。如果划分信息指示图像数据在当前深度中不再被划分,则当前深度是编码深度。因此,图像数据解码器230可通过使用针对与编码深度相应的每个编码单元的关于预测单元的分区类型、预测模式以及变换单元的尺寸的信息,来对与当前最大编码单元中的每个编码深度相应的至少一个编码单元的编码数据进行解码,并输出当前最大编码单元的图像数据。
换句话说,可通过观察针对编码单元、预测单元和最小单元之中的预定数据单元分配的编码信息集,来聚集包含包括相同划分信息的编码信息的数据单元,收集的数据单元可被认为是将由图像数据解码器230以相同的编码模式进行解码的一个数据单元。可通过获得关于如上所述确定的编码单元的编码模式的信息来执行当前解码单元中的解码。
此外,图9的视频解码设备200可执行以上参照图2描述的视频解码设备20的操作。
接收器210和图像数据和编码信息提取器220可执行视频解码设备20的偏移参数解析单元22的操作。图像数据解码器230可执行视频解码设备20的偏移调整单元24的操作。
图像数据和编码信息提取器220可在仅从比特流解析出偏移合并信息而不使用针对当前最大编码单元的偏移参数的情况下,将当前偏移参数恢复为与邻近偏移参数中的至少一个相同。邻近偏移参数之中的将被参考的参数可基于偏移合并信息来确定。如果基于从比特流解析出的针对当前最大编码单元的偏移合并信息,邻近偏移参数和当前偏移参数被确定为彼此不同,则图像数据和编码信息提取器220可从比特流解析并恢复针对当前最大编码单元的当前偏移参数。
图像数据和编码信息提取器220可通过参考邻近最大编码单元的邻近偏移参数来对当前最大编码单元中的当前偏移参数执行预测恢复。
图像数据解码器230可从比特流解析针对每个最大编码单元的偏移参数。可从恢复的偏移参数确定当前最大编码单元的偏移类型是边缘类型还是像素值带类型。如果当前最大编码单元的偏移类型是边缘类型,则可确定针对每个恢复的像素的边缘分类,并且可从偏移参数中的偏移值选择与每个恢复的像素的边缘分类相应的偏移值。如果当前最大编码单元的偏移类型是像素值带类型,则可从在偏移参数中解析和包括的偏移值选择与每个恢复的像素的像素值带相应的偏移值。
图像数据解码器230可通过按照与每个恢复的像素相应的偏移值调整相应恢复的像素值调整来产生相对于原始像素具有最小误差的恢复的像素。作为另一示例,在针对每个预定数据单元(诸如编码单元、预测单元和变换单元)解析出偏移参数的情况下,可针对每个相应的数据单元恢复与每个边缘分类相应的偏移值,或者可恢复与每个像素值相应的偏移值。
总之,视频解码设备200可获得关于当针对每个最大编码单元递归执行编码时产生最小编码误差的至少一个编码单元的信息,并可使用所述信息来对当前画面进行解码。换句话说,可对每个最大编码单元中被确定为最佳编码单元的具有树结构的编码单元进行解码。此外,考虑分辨率和图像数据量来确定编码单元的最大尺寸。
因此,即使图像数据具有高分辨率和大数据量,也可通过使用从编码器接收的关于最佳编码模式的信息,通过使用根据图像数据的特征自适应地确定的编码单元的尺寸和编码模式来有效地对图像数据进行解码和恢复。
图10是用于描述根据本发明的实施例的编码单元的概念的示图。
编码单元的尺寸可按照宽度×高度来表示,并可以是64×64、32×32、16×16和8×8。64×64的编码单元可被划分为64×64、64×32、32×64或32×32的分区,32×32的编码单元可被划分为32×32、32×16、16×32或16×16的分区,16×16的编码单元可被划分为16×16、16×8、8×16或8×8的分区,8×8的编码单元可被划分为8×8、8×4、4×8或4×4的分区。
在视频数据310中,分辨率是1920×1080,编码单元的最大尺寸是64,并且最大深度是2。在视频数据320中,分辨率是1920×1080,编码单元的最大尺寸是64,并且最大深度是3。在视频数据330中,分辨率是352×288,编码单元的最大尺寸是16,并且最大深度是1。图10中示出的最大深度表示从最大编码单元到最小编码单元的划分总数。
如果分辨率高或者数据量大,则编码单元的最大尺寸可以较大以便不仅提高编码效率还准确地反映图像的特征。因此,分辨率比视频数据330更高的视频数据310和视频数据320的编码单元的最大尺寸可以是64。
由于视频数据310的最大深度是2,因此由于通过划分最大编码单元两次深度被加深到两层,视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元以及长轴尺寸为32和16的编码单元。同时,由于视频数据330的最大深度是1,因此由于通过划分最大编码单元一次深度被加深到一层,视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元以及长轴尺寸为8的编码单元。
由于视频数据320的最大深度是3,因此由于通过划分最大编码单元三次深度被加深到3层,视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元以及长轴尺寸为32、16和8的编码单元。随着深度的加深,可精确地表示详细的信息。
图11是根据本发明的实施例的基于编码单元的图像编码器400的框图。
图像编码器400执行视频编码设备100的编码单元确定器120的操作以对图像数据进行编码。换句话说,帧内预测器410对当前帧405之中的帧内模式下的编码单元执行帧内预测,运动估计器420和运动补偿器425通过使用当前帧405和参考帧495对当前帧405之中的帧间模式下的编码单元执行帧间估计和运动补偿。
从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430和量化器440被输出为量化的变换系数。量化的变换系数通过反量化器460和反变换器470被恢复为空间域中的数据,并且恢复的空间域中的数据在通过去块单元480和环路滤波单元490被后处理之后被输出为参考帧495。量化的变换系数可通过熵编码器450被输出为比特流455。
为了使图像编码器400被应用到视频编码设备100中,图像编码器400的所有元件(即,帧内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器450、反量化器460、反变换器470、去块单元480和环路滤波单元490)在考虑每个最大编码单元的最大深度的同时,基于具有树结构的编码单元之中的每个编码单元执行操作。
具体地讲,帧内预测器410、运动估计器420和运动补偿器425在考虑当前最大编码单元的最大尺寸和最大深度的同时,确定具有树结构的编码单元之中的每个编码单元的分区和预测模式,并且变换器430确定具有树结构的编码单元之中的每个编码单元中的变换单元的尺寸。
图像编码器400可根据针对参考帧495的每个最大编码单元的边缘类型(或像素值带)对像素进行分类,确定每个恢复的像素的边缘分类(或像素值带),并确定属于每个边缘分类(或每个像素值带)的恢复的像素的平均误差值。针对每个最大编码单元的偏移类型和偏移值可被编码和发送或者被接收和解码
图12是根据本发明的实施例的基于编码单元的图像解码器500的框图。
解析器510从比特流505解析将被解码的编码图像数据以及解码所需的关于编码的信息。编码的图像数据通过熵解码器520和反量化器530被输出为反量化的数据,反量化的数据通过反变换器540被恢复为空间域中的图像数据。
帧内预测器550针对空间域中的图像数据对帧内模式下的编码单元执行帧内预测,运动补偿器560通过使用参考帧585对帧间模式下的编码单元执行运动补偿。
经过帧内预测器550和运动补偿器560的空间域中的图像数据可在通过去块单元570和环路滤波单元580被后处理之后被输出为恢复的帧595。另外,经过去块单元570和环路滤波单元580被后处理的图像数据可被输出为参考帧585。
为了对视频解码设备200的图像数据解码器230中的图像数据进行解码,图像解码器500可执行在解析器510之后执行的操作。
为了使图像解码器500被应用到视频解码设备200中,图像解码器500的所有元件(即,解析器510、熵解码器520、反量化器530、反变换器540、帧内预测器550、运动补偿器560、去块单元570和环路滤波单元580)基于每个最大编码单元的具有树结构的编码单元执行操作。
具体地讲,帧内预测器550和运动补偿器560基于针对每个具有树结构的编码单元的分区和预测模式执行操作,并且反变换器540基于针对每个编码单元的变换单元的尺寸执行操作。
图像解码器500可从比特流提取最大编码单元的偏移参数,并通过使用包括在偏移参数中的偏移类型和偏移值,按照与相应的边缘分类或像素值带相应的偏移值调整恢复的帧595的每个最大编码单元的每个恢复的像素。
图13是示出根据本发明的实施例的根据深度的较深层编码单元和分区的示图。
视频编码设备100和视频解码设备200使用分层的编码单元以考虑图像的特征。编码单元的最大高度、最大宽度和最大深度可根据图像的特征被自适应地确定,或者可由用户不同地设置。根据深度的较深层编码单元的尺寸可根据编码单元的预定最大尺寸被确定。
在根据本发明的实施例的编码单元的分层结构600中,编码单元的最大高度和最大宽度都是64,并且最大深度是4。由于深度沿着分层结构600的纵轴加深,因此较深层编码单元的高度和宽度都被划分。另外,作为用于每个较深层编码单元的预测编码的基础的预测单元和分区沿分层结构600的横轴被显示。
换句话说,编码单元610是分层结构600中的最大编码单元,其中,深度是0,尺寸(即,高度乘宽度)是64×64。深度沿纵轴加深,并且存在尺寸为32×32且深度为1的编码单元620、尺寸为16×16且深度为2的编码单元630、尺寸为8×8且深度为3的编码单元640以及尺寸为4×4且深度为4的编码单元650。尺寸为4×4且深度为4的编码单元650是最小编码单元。
编码单元的预测单元和分区根据每个深度沿横轴排列。换句话说,如果尺寸为64×64且深度为0的编码单元610是预测单元,则该预测单元可被划分为包括在编码器610中的分区(即,尺寸为64×64的分区610、尺寸为64×32的分区612、尺寸为32×64的分区614、或者尺寸为32×32的分区616)。
类似地,尺寸为32×32且深度为1的编码单元620的预测单元可被划分为包括在编码单元620中的分区(即,尺寸为32×32的分区620、尺寸为32×16的分区622、尺寸为16×32的分区624以及尺寸为16×16的分区626)。
类似地,尺寸为16×16且深度为2的编码单元630的预测单元可被划分为包括在编码单元630中的分区(即,包括在编码单元630中的尺寸为16×16的分区、尺寸为16×8的分区632、尺寸为8×16的分区634以及尺寸为8×8的分区636)。
类似地,尺寸为8×8且深度为3的编码单元640的预测单元可被划分为包括在编码单元640中的分区(即,包括在编码单元640中的尺寸为8×8的分区、尺寸为8×4的分区642、尺寸为4×8的分区644以及尺寸为4×4的分区646)。
尺寸为4×4且深度为4的编码单元650是最小编码单元以及最低深度的编码单元。编码单元650的预测单元仅被分配给尺寸为4×4的分区。
为了确定构成最大编码单元610的编码单元的至少一个编码深度,视频编码设备100的编码单元确定器120对包括在最大编码单元610中的与每个深度相应的编码单元执行编码。
随着深度加深,包括相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量增加。例如,需要四个与深度2相应的编码单元以覆盖包括在一个与深度1相应的编码单元中的数据。因此,为了根据深度对相同数据的多个编码结果进行比较,与深度1相应的编码单元以及与深度2相应的四个编码单元都被编码。
为了针对多个深度中的当前深度执行编码,通过沿分层结构600的横轴,对与当前深度相应的编码单元中的每个预测单元执行编码来针对当前深度选择最小编码误差。可选择地,随着深度沿分层结构600的纵轴加深,可通过针对每个深度执行编码,通过根据深度比较最小编码误差来搜索最小编码误差。编码单元610中的具有最小编码误差的深度和分区可被选为编码单元610的编码深度和分区类型。
图14是用于描述根据本发明的实施例的编码单元710和变换单元720之间的关系的示图。
视频编码设备100或视频解码设备200针对每个最大编码单元根据尺寸小于或等于最大编码单元的编码单元来对图像进行编码或解码。可基于不大于相应编码单元的数据单元来选择在编码期间用于变换的变换单元的尺寸。
例如,在视频编码设备100或视频解码设备200中,如果编码单元710的尺寸是64×64,则可通过使用尺寸为32×32的变换单元720来执行变换。
另外,可通过对小于64×64的尺寸为32×32、16×16、8×8和4×4的每个变换单元执行变换,来对尺寸为64×64的编码单元710的数据进行编码,并且随后可选择具有最小编码误差的变换单元。
图15是用于描述根据本发明的实施例的与编码深度相应的编码单元的编码信息的示图。
视频编码设备100的输出单元130可对关于分区类型的信息800、关于预测模式的信息810以及关于与编码深度相应的每个编码单元的变换单元的尺寸的信息820进行编码和发送,作为关于编码模式的信息。
信息800指示关于通过划分当前编码单元的预测单元而获得的分区的形状的信息,其中,所述分区是用于对当前编码单元进行预测编码的数据单元。例如,尺寸为2N×2N的当前编码单元CU_0可被划分为如下分区中的任何一个:尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808。这里,关于分区类型的信息800被设置为指示尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808中的一个。
信息810指示每个分区的预测模式。例如,信息810可指示对由信息800指示的分区执行的预测编码的模式(即,帧内模式812、帧间模式814或跳过模式816)。
信息820指示当对当前编码单元执行变换时所基于的变换单元。例如,变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧间变换单元828。
视频解码设备200的图像数据和编码信息提取器210可根据每个较深层编码单元来提取并使用用于解码的信息800、810和820。
图16是根据本发明的实施例的根据深度的较深层编码单元的示图。
划分信息可用于指示深度的改变。划分信息指示当前深度的编码单元是否被划分为更低深度的编码单元。
用于对深度为0且尺寸为2N_0×2N_0的编码单元900进行预测编码的预测单元910可包括如下分区类型的分区:尺寸为2N_0×2N_0的分区类型912、尺寸为2N_0×N_0的分区类型914、尺寸为N_0×2N_0的分区类型916以及尺寸为N_0×N_0的分区类型918。图16仅示出通过对预测单元910进行对称划分而获得的分区类型912至918,但是分区类型不限于此,预测单元910的分区可包括不对称分区、具有预定形状的分区以及具有几何形状的分区。
根据每个分区类型对如下分区重复地执行预测编码:尺寸为2N_0×2N_0的一个分区、尺寸为2N_0×N_0的两个分区、尺寸为N_0×2N_0的两个分区以及尺寸为N_0×N_0的四个分区。可对尺寸为2N_0×2N_0、N_0×2N_0、2N_0×N_0以及N_0×N_0的分区执行帧内模式和帧间模式下的预测编码。仅对尺寸为2N_0×2N_0的分区执行跳过模式下的预测编码。
对包括在分区类型912至918中进行的预测编码的编码的误差进行比较,并在所述分区类型之中确定最小编码误差。如果在分区类型912至916之一中的编码误差最小,则预测单元910可不被划分为更低深度。
如果在分区类型918中的编码误差最小,则在操作920,深度从0改变为1以划分分区类型918,并且对深度为2且尺寸为N_0×N_0的编码单元930重复地执行编码以搜索最小编码误差。
用于对深度为1且尺寸为2N_1×2N_1(=N_0×N_0)的编码单元930进行预测编码的预测单元940可包括如下分区类型的分区:尺寸为2N_1×2N_1的分区类型942、尺寸为2N_1×N_1的分区类型944、尺寸为N_1×2N_1的分区类型946以及尺寸为N_1×N_1的分区类型948。
如果在分区类型948中编码误差最小,则在操作950,深度从1改变为2以划分分区类型948,并且对深度为2且尺寸为N_2×N_2的编码单元960重复地执行编码以搜索最小编码误差。
当最大深度是d时,根据每个深度的划分操作可被执行直到深度变为d-1时为止,并且划分信息可被编码直到深度是0至d-2之一时为止。换句话说,当执行编码直到在操作970与深度d-2相应的编码单元被划分之后深度是d-1时,用于对深度为d-1且尺寸为2N_(d-1)×2N_(d-1)的编码单元980进行预测编码的预测单元990可包括如下分区类型的分区:尺寸为2N_(d-1)×2N_(d-1)的分区类型992、尺寸为2N_(d-1)×N_(d-1)的分区类型994、尺寸为N_(d-1)×2N_(d-1)的分区类型996以及尺寸为N_(d-1)×N_(d-1)的分区类型998。
可对分区类型992至998中的如下分区重复地执行预测编码以搜索具有最小编码误差的分区类型:尺寸为2N_(d-1)×2N_(d-1)的一个分区、尺寸为2N_(d-1)×N_(d-1)的两个分区、尺寸为N_(d-1)×2N_(d-1)的两个分区、尺寸为N_(d-1)×N_(d-1)的四个分区。
即使在分区类型998具有最小编码误差时,由于最大深度是d,因此深度为d-1的编码单元CU_(d-1)不再被划分到更低深度,并且构成当前最大编码单元900的编码单元的编码深度被确定为d-1且当前最大编码单元900的分区类型可被确定为N_(d-1)×N_(d-1)。另外,由于最大深度是d并且具有最低深度d-1的最小编码单元980不再被划分到更低深度,因此最小编码单元980的划分信息不被设置。
数据单元999可以是当前最大编码单元的“最小单元”。根据本发明的实施例的最小单元可以是通过将最小编码单元980划分为4份而获得的矩形数据单元。通过重复地执行编码,视频编码设备100可通过比较根据编码单元900的多个深度的多个编码误差来选择具有最小编码误差的深度以确定编码深度,并且将相应分区类型以及预测模式设置为编码深度的编码模式。
这样,根据深度的最小编码误差在所有的深度1至d中被比较,并且具有最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型以及预测模式可被编码并作为关于编码模式的信息被发送。另外,由于编码单元从深度0被划分到编码深度,因此仅编码深度的划分信息被设置为0,除了编码深度之外的深度的划分信息被设置为1。
视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元900的编码深度以及预测单元的信息以对分区912进行解码。视频解码设备200可通过使用根据深度的划分信息来将划分信息是0的深度确定为编码深度,并且使用关于相应深度的编码模式的信息用于解码。
图17至图19是用于描述根据本发明的实施例的编码单元1010、预测单元1060和变换单元1070之间的关系的示图。
编码单元1010是最大编码单元中的与由视频编码设备100确定的编码深度相应的具有树结构的编码单元。预测单元1060是每个编码单元1010的预测单元的分区,变换单元1070是每个编码单元1010的变换单元。
当在编码单元1010中最大编码单元的深度是0时,编码单元1012和1054的深度是1,编码单元1014、1016、1018、1028、1050和1052的深度是2,编码单元1020、1022、1024、1026、1030、1032和1048的深度是3,编码单元1040、1042、1044和1046的深度是4。
在预测单元1060中,通过划分编码单元1010中的多个编码单元而获得一些编码单元1014、1016、1022、1032、1048、1050、1052和1054。换句话说,编码单元1014、1022、1050和1054中的分区类型的尺寸为2N×N,编码单元1016、1048和1052中的分区类型的尺寸为N×2N,编码单元1032的分区类型的尺寸为N×N。编码单元1010的预测单元和分区小于或等于每个编码单元。
以小于编码单元1052的数据单元对变换单元1070中的编码单元1052的图像数据执行变换或反变换。另外,变换单元1070中的编码单元1014、1016、1022、1032、1048、1050和1052在尺寸和形状上与预测单元1060中的编码单元1014、1016、1022、1032、1048、1050、1052不同。换句话说,视频编码设备100和视频解码设备200可对相同编码单元中的数据单元独立地执行帧内预测、运动估计、运动补偿、变换和反变换。
因此,对最大编码单元的每个区域中的具有分层结构的每个编码单元递归地执行编码,以确定最佳编码单元,因此可获得具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区类型的信息、关于预测模式的信息以及关于变换单元的尺寸的信息。表1显示可由视频编码设备100和视频解码设备200设置的编码信息。
表1
视频编码设备100的输出单元130可输出关于具有树结构的编码单元的编码信息,并且视频解码设备200的图像数据和编码信息提取器220可从接收的比特流提取关于具有树结构的编码单元的编码信息。
划分信息指示当前编码单元是否被划分为更低深度的编码单元。如果当前深度d的划分信息是0,则当前编码单元不再被划分为更低深度的深度是编码深度,因此可针对编码深度定义关于分区类型、预测模式以及变换单元的尺寸的信息。如果当前编码单元根据划分信息被进一步划分,则对更低深度的四个划分编码单元独立地执行编码。
预测模式可以是帧内模式、帧间模式和跳过模式中的一个。可在所有分区类型中定义帧内模式和帧间模式,并且可仅在尺寸为2N×2N的分区类型中定义跳过模式。
关于分区类型的信息可指示通过对称地划分预测单元的高度或宽度而获得的尺寸为2N×2N、2N×N、N×2N和N×N的对称分区类型、以及通过不对称地划分预测单元的高度或宽度而获得的尺寸为2N×nU、2N×nD、nL×2N和nR×2N的不对称分区类型。可通过以1:3和3:1划分预测单元的高度来分别获得尺寸为2N×nU和2N×nD的不对称分区类型,可通过以1:3和3:1划分预测单元的宽度来分别获得尺寸为nL×2N和nR×2N的不对称分区类型。
变换单元的尺寸可被设置为帧内模式中的两种类型以及帧间模式中的两种类型。换句话说,如果变换单元的划分信息是0,则变换单元的尺寸可以是作为当前编码单元的尺寸的2N×2N。如果变换单元的划分信息是1,则可通过划分当前编码单元来获得变换单元。另外,如果尺寸为2N×2N的当前编码单元的分区类型是对称分区类型,则变换单元的尺寸可以是N×N,如果当前编码单元的分区类型是不对称分区类型,则变换单元的尺寸可以是N/2×N/2。
关于具有树结构的编码单元的编码信息可包括与编码深度相应的编码单元、预测单元以及最小单元中的至少一个。与编码深度相应的编码单元可包括:包含相同编码信息的预测单元和最小单元中的至少一个。
因此,通过对邻近数据单元的编码信息进行比较,来确定邻近数据单元是否被包括在与编码深度相应的相同编码单元中。另外,通过使用数据单元的编码信息来确定与编码深度相应的相应编码单元,因此最大编码单元中的编码深度的分布可被确定。
因此,如果基于邻近数据单元的编码信息预测当前编码单元,则与当前编码单元邻近的较深层编码单元中的数据单元的编码信息可被直接参考和使用。
可选择地,如果基于邻近数据单元的编码信息来预测当前编码单元,则使用数据单元的编码信息来搜索与当前编码单元邻近的数据单元,并且搜索到的邻近编码单元可被参考以用于预测当前编码单元。
图20是用于描述根据表1的编码模式信息的编码单元、预测单元或分区、和变换单元之间的关系的示图。
最大编码单元1300包括多个编码深度的编码单元1302、1304、1306、1312、1314、1316和1318。这里,由于编码单元1318是编码深度的编码单元,因此划分信息可被设置为0。关于尺寸为2N×2N的编码单元1318的分区类型的信息可被设置为以下分区类型之一:尺寸为2N×2N的分区类型1322、尺寸为2N×N的分区类型1324、尺寸为N×2N的分区类型1326、尺寸为N×N的分区类型1328、尺寸为2N×nU的分区类型1332、尺寸为2N×nD的分区类型1334、尺寸为nL×2N的分区类型1336和尺寸为nR×2N的分区类型1338。
变换单元的划分信息(TU尺寸标记)是一种变换索引。与变换索引相应的变换单元的尺寸可根据预测单元类型或编码单元的分区类型而改变。
当分区类型被设置为对称(即,分区类型1322、1324、1326或1328)时,如果变换单元的划分信息(TU尺寸标记)为0,则设置尺寸为2N×2N的变换单元1342,如果TU尺寸标记为1,则设置尺寸为N×N的变换单元1344。
当分区类型被设置为不对称(即,分区类型1332、1334、1336或1338)时,如果TU尺寸标记为0,则设置尺寸为2N×2N的变换单元1352,如果TU尺寸标记为1,则设置尺寸为N/2×N/2的变换单元1354。
参照图20,上述TU尺寸标记是具有值0或1的标记,但TU尺寸标记不限于1比特,在TU尺寸标记从0增加的同时,变换单元可被分层划分具有树结构。变换单元的划分信息(TU尺寸标记)可用作变换索引的实施例。
在这种情况下,根据本发明的实施例,实际使用的变换单元的尺寸可通过使用变换单元的TU尺寸标记连同变换单元的最大尺寸和最小尺寸来表示。根据本发明的实施例,视频编码设备100能够对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记进行编码。对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记进行编码的结果可被***SPS。根据本发明的实施例,视频解码设备200可通过使用最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记来对视频进行解码。
例如,如果当前编码单元的尺寸是64×64并且最大变换单元尺寸是32×32,则当TU尺寸标记为0时,变换单元的尺寸可以是32×32;当TU尺寸标记为1时,变换单元的尺寸可以是16×16;当TU尺寸标记为2时,变换单元的尺寸可以是8×8。
作为另一示例,如果当前编码单元的尺寸是32×32并且最小变换单元尺寸是32×32,则当TU尺寸标记为0时,则变换单元的尺寸可以是32×32。这里,由于变换单元的尺寸不能够小于32×32,因此TU尺寸标记不可被设置为除0以外的值。
作为另一示例,如果当前编码单元的尺寸是64×64并且最大TU尺寸标记为1,则TU尺寸标记可以是0或1。这里,TU尺寸标记不可被设置为除0或1以外的值。
因此,如果定义最大TU尺寸标记为“MaxTransformSizeIndex”,最小变换单元尺寸为“MinTransformSize”,并且在TU尺寸标记为0时的变换单元尺寸为“RootTuSize”,则可通过等式(1)来定义在当前编码单元中可确定的当前最小变换单元尺寸“CurrMinTuSize”:
CurrMinTuSize=max(MinTransformSize,RootTuSize/(2∧MaxTransformSizeIndex))……(1)
与在当前编码单元中可确定的当前最小变换单元尺寸“CurrMinTuSize”相比,当TU尺寸标记为0时的变换单元尺寸“RootTuSize”可指示可在***中选择的最大变换单元尺寸。在等式(1)中,“RootTuSize/(2∧MaxTransformSizeIndex)”表示在当TU尺寸标记为0时的变换单元尺寸“RootTuSize”被划分与最大TU尺寸标记相应的次数时的变换单元尺寸,并且“MinTransformSize”表示最小变换尺寸。因此,“RootTuSize/(2^MaxTransformSizeIndex)”和“MinTransformSize”之中的较小值可以是可在当前编码单元中被确定的当前最小变换单元尺寸“CurrMinTuSize”。
根据本发明的实施例,最大变换单元尺寸RootTuSize可根据预测模式的类型而改变。
例如,如果当前预测模式是帧间模式,则可通过使用以下的等式(2)来确定“RootTuSize”。在等式(2)中,“MaxTransformSize”表示最大变换单元尺寸,“PUSize”表示当前预测单元尺寸。
RootTuSize=min(MaxTransformSize,PUSize).........(2)
也就是说,如果当前预测模式是帧间模式,则当TU尺寸标记为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前预测单元尺寸之中的较小值。
如果当前分区单元的预测模式是帧内模式,则可通过使用以下的等式(3)来确定“RootTuSize”。在等式(3)中,“PartitionSize”表示当前分区单元的尺寸。
RootTuSize=min(MaxTransformSize,PartitionSize)……(3)
也就是说,如果当前预测模式是帧内模式,则当TU尺寸标记为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前分区单元的尺寸之中的较小的值。
然而,根据分区单元的预测模式的类型而改变的当前最大变换单元尺寸“RootTuSize”仅仅是示例,本发明不限于此。
根据以上参照图8至图20描述的基于树结构的编码单元的视频编码方法,可针对每个树结构的编码单元对空间域的图像数据进行编码,并且可在根据基于树结构的编码单元的视频解码方法对每个最大编码单元执行解码时恢复空间域的图像数据,因此包括画面和画面序列的视频可被恢复。恢复的视频可被再现设备再现,被存储在存储介质中或者通过网络被发送。
此外,可针对每个画面、每个条带或每个最大编码单元,或者针对每个树结构的编码单元,或者针对编码单元的预测单元,或者针对编码单元的变换单元对偏移参数进行编码和发送或者接收和解码。例如,通过基于针对每个最大编码单元接收的偏移参数使用恢复的偏移值来调整最大编码单元的恢复的像素值,因此,针对原始块具有最小误差的恢复的块可被恢复。
本发明的实施例可被编写为计算机程序并可被实现在使用计算机可读记录介质执行程序的通用数字计算机中。计算机可读记录介质的示例包括:磁存储介质(例如,ROM、软盘、硬盘等)和光学记录介质(例如,CD-ROM或DVD)。
尽管已经参照本发明的优选实施例具体显示和描述了本发明,但是本领域的普通技术人员将理解,在不脱离权利要求所限定的本发明的精神和范围的情况下,可以在此进行形式和细节上的各种改变。优选实施例应被视为仅是描述性的意义,而不是为了限制的目的。因此,本发明的范围不由本发明的详细描述来限定,而是由权利要求来限定,所述范围内的所有差别将被解释为包括在本发明中。

Claims (2)

1.一种视频解码设备,包括:
处理器,被配置为从比特流解析偏移合并信息,其中,偏移合并信息指示当前块的偏移参数是否根据邻近块的偏移参数来确定,
其中,当偏移合并信息指示当前块的偏移参数根据邻近块的偏移参数来确定时,处理器被配置为使用邻近块的偏移参数来确定当前块的偏移参数;
其中,当偏移合并信息指示当前块的偏移参数不根据邻近块的偏移参数来确定时,处理器被配置为从比特流获取偏移类型信息和偏移值,并通过使用偏移值和偏移符号对当前块的采样进行补偿。
2.如权利要求1所述的设备,其中,当偏移合并信息指示当前块的偏移参数根据邻近块的偏移参数来确定时,不从比特流解析当前块的偏移参数。
CN201510218541.6A 2011-06-28 2012-06-27 根据像素分类使用偏移调整的视频解码方法及其设备 Pending CN105049864A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161502018P 2011-06-28 2011-06-28
US61/502,018 2011-06-28
CN201280042637.6A CN103959776A (zh) 2011-06-28 2012-06-27 根据像素分类使用偏移调整的视频编码方法及其设备、视频解码方法及其设备

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201280042637.6A Division CN103959776A (zh) 2011-06-28 2012-06-27 根据像素分类使用偏移调整的视频编码方法及其设备、视频解码方法及其设备

Publications (1)

Publication Number Publication Date
CN105049864A true CN105049864A (zh) 2015-11-11

Family

ID=47424664

Family Applications (6)

Application Number Title Priority Date Filing Date
CN201510220064.7A Pending CN104980758A (zh) 2011-06-28 2012-06-27 根据像素分类使用偏移调整的视频解码方法及其设备
CN201510218541.6A Pending CN105049864A (zh) 2011-06-28 2012-06-27 根据像素分类使用偏移调整的视频解码方法及其设备
CN201510218544.XA Pending CN104994393A (zh) 2011-06-28 2012-06-27 根据像素分类使用偏移调整的视频解码方法及其设备
CN201280042637.6A Pending CN103959776A (zh) 2011-06-28 2012-06-27 根据像素分类使用偏移调整的视频编码方法及其设备、视频解码方法及其设备
CN201510218779.9A Pending CN104980757A (zh) 2011-06-28 2012-06-27 根据像素分类使用偏移调整的视频解码方法及其设备
CN201510217348.0A Pending CN104980756A (zh) 2011-06-28 2012-06-27 根据像素分类使用偏移调整的视频解码方法及其设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201510220064.7A Pending CN104980758A (zh) 2011-06-28 2012-06-27 根据像素分类使用偏移调整的视频解码方法及其设备

Family Applications After (4)

Application Number Title Priority Date Filing Date
CN201510218544.XA Pending CN104994393A (zh) 2011-06-28 2012-06-27 根据像素分类使用偏移调整的视频解码方法及其设备
CN201280042637.6A Pending CN103959776A (zh) 2011-06-28 2012-06-27 根据像素分类使用偏移调整的视频编码方法及其设备、视频解码方法及其设备
CN201510218779.9A Pending CN104980757A (zh) 2011-06-28 2012-06-27 根据像素分类使用偏移调整的视频解码方法及其设备
CN201510217348.0A Pending CN104980756A (zh) 2011-06-28 2012-06-27 根据像素分类使用偏移调整的视频解码方法及其设备

Country Status (16)

Country Link
US (7) US9426482B2 (zh)
EP (3) EP2728865A4 (zh)
JP (6) JP5964422B2 (zh)
KR (6) KR101457398B1 (zh)
CN (6) CN104980758A (zh)
AU (3) AU2012276452B2 (zh)
BR (5) BR122021004576B1 (zh)
CA (2) CA3016913C (zh)
MX (4) MX338669B (zh)
MY (3) MY193771A (zh)
PH (4) PH12017501636A1 (zh)
RU (3) RU2632139C1 (zh)
SG (4) SG10201408715UA (zh)
TW (5) TWI549492B (zh)
WO (1) WO2013002554A2 (zh)
ZA (1) ZA201400649B (zh)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9378560B2 (en) * 2011-06-17 2016-06-28 Advanced Micro Devices, Inc. Real time on-chip texture decompression using shader processors
WO2013001794A1 (ja) 2011-06-27 2013-01-03 パナソニック株式会社 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及び画像符号化復号装置
MX338669B (es) 2011-06-28 2016-04-27 Samsung Electronics Co Ltd Metodo de codificacion de video que utiliza ajustes de desplazamiento de conformidad con clasificacion de pixel y aparato para ello, metodo de decodificacion de video y aparato para ello.
JP5907367B2 (ja) 2011-06-28 2016-04-26 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
MX2014000159A (es) 2011-07-02 2014-02-19 Samsung Electronics Co Ltd Metodo y aparato para la codificacion de video, y metodo y aparato para la decodificacion de video acompañada por inter prediccion utilizando imagen co-localizada.
GB201119206D0 (en) * 2011-11-07 2011-12-21 Canon Kk Method and device for providing compensation offsets for a set of reconstructed samples of an image
US9253482B2 (en) * 2011-11-08 2016-02-02 Texas Insturments Incorporated Method and apparatus for sample adaptive offset without sign coding
US9277194B2 (en) 2011-11-08 2016-03-01 Texas Instruments Incorporated Method and apparatus for image and video coding using hierarchical sample adaptive band offset
JP5893754B2 (ja) 2011-12-22 2016-03-23 サムスン エレクトロニクス カンパニー リミテッド 最大符号化単位別ピクセル分類によるオフセット調整を利用するビデオ符号化方法及びその装置、並びにビデオ復号化方法及びその装置
CA3001027A1 (en) * 2012-01-19 2013-07-25 Mitsubishi Electric Corporation Image decoding and encoding with selectable exclusion of filtering for a block within a largest coding block
TWI632805B (zh) * 2012-06-11 2018-08-11 三星電子股份有限公司 視訊解碼方法、視訊編碼方法、視訊解碼裝置、視訊編碼裝置以及非暫態的電腦可讀取儲存媒體
US9635360B2 (en) * 2012-08-01 2017-04-25 Mediatek Inc. Method and apparatus for video processing incorporating deblocking and sample adaptive offset
WO2014052731A2 (en) 2012-09-28 2014-04-03 Vid Scale, Inc. Cross-plane filtering for chroma signal enhancement in video coding
WO2014054897A1 (ko) * 2012-10-05 2014-04-10 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
IN2013MU01146A (zh) * 2013-03-26 2015-04-24 Tektronix Inc
JP6473078B2 (ja) * 2013-04-05 2019-02-20 シャープ株式会社 画像復号装置
CN110072106B (zh) * 2013-12-13 2022-06-07 北京三星通信技术研究有限公司 视频编解码中像素处理的方法和装置
JP6253406B2 (ja) * 2013-12-27 2017-12-27 キヤノン株式会社 画像符号化装置、撮像装置、画像符号化方法、及びプログラム
US9756340B2 (en) 2014-02-03 2017-09-05 Mitsubishi Electric Corporation Video encoding device and video encoding method
WO2016119746A1 (zh) * 2015-01-29 2016-08-04 同济大学 图像编码方法及装置、图像解码方法及装置
US10609377B2 (en) 2015-05-12 2020-03-31 Samsung Electronics Co., Ltd. Image encoding method and device for sample value compensation and image decoding method and device for sample value compensation
CN107836116B (zh) * 2015-07-08 2021-08-06 交互数字麦迪逊专利控股公司 用于使用交叉平面滤波的增强色度编码的方法和装置
JP6094838B2 (ja) * 2015-08-31 2017-03-15 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
KR102423880B1 (ko) 2015-10-06 2022-07-21 삼성전자주식회사 인코더의 작동방법과 상기 인코더를 포함하는 시스템 온 칩의 작동 방법
US10477247B2 (en) 2015-11-18 2019-11-12 Electronics And Telecommunications Research Institute Method for decoding video using in-loop filter, and device therefor
EP3454557A1 (en) 2016-05-02 2019-03-13 Sony Corporation Image processing device, and image processing method
KR101981687B1 (ko) * 2016-05-04 2019-05-24 한국항공대학교산학협력단 오프셋 정보 부호화 및 복호화 방법 및 장치
CN106130562B (zh) * 2016-06-15 2019-09-06 中国石油集团渤海钻探工程有限公司 一种随钻测井数据实时压缩方法及解压缩方法
JP6229030B2 (ja) * 2016-10-06 2017-11-08 株式会社三共 遊技機
EP3570543A4 (en) 2017-01-12 2019-12-25 Sony Corporation IMAGE PROCESSING DEVICE AND IMAGE PROCESSING METHOD
JP6341304B2 (ja) * 2017-02-14 2018-06-13 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
EP3471413A1 (en) * 2017-10-10 2019-04-17 Thomson Licensing Encoding and decoding methods and corresponding devices
KR102570087B1 (ko) 2018-03-27 2023-08-25 (주)휴맥스 모션 보상을 이용하는 비디오 신호 처리 방법 및 장치
TWI678107B (zh) 2018-05-16 2019-11-21 香港商京鷹科技股份有限公司 影像傳輸方法及其系統與影像傳送端裝置
US11317099B2 (en) 2018-10-05 2022-04-26 Tencent America LLC Method and apparatus for signaling an offset in video coding for intra block copy and/or inter prediction
CN113709484B (zh) * 2020-03-26 2022-12-23 杭州海康威视数字技术股份有限公司 解码方法、编码方法、装置、设备及机器可读存储介质
WO2021247881A1 (en) * 2020-06-03 2021-12-09 Beijing Dajia Internet Information Technology Co., Ltd. Chroma coding enhancement in the prediction from multiple cross-components (pmc) mode

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1863315A (zh) * 2002-04-18 2006-11-15 株式会社东芝 运动图像编码/解码方法和装置

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4661862A (en) * 1984-04-27 1987-04-28 Rca Corporation Differential PCM video transmission system employing horizontally offset five pixel groups and delta signals having plural non-linear encoding functions
US4971407A (en) 1989-08-09 1990-11-20 Unisys Corp. Two stage run and string data compressor providing doubly compressed output
US6043838A (en) * 1997-11-07 2000-03-28 General Instrument Corporation View offset estimation for stereoscopic video coding
US6418166B1 (en) * 1998-11-30 2002-07-09 Microsoft Corporation Motion estimation and block matching pattern
US20020122595A1 (en) 1999-06-04 2002-09-05 Rikk Crill Apparatus and method for radial and angular or rotational analysis of images for shape content and matching
FI116819B (fi) 2000-01-21 2006-02-28 Nokia Corp Menetelmä kuvien lähettämiseksi ja kuvakooderi
EP1407615A1 (en) 2001-07-10 2004-04-14 Koninklijke Philips Electronics N.V. Method and device for generating a scalable coded video signal from a non-scalable coded video signal
JP2003230147A (ja) * 2002-02-01 2003-08-15 Matsushita Electric Ind Co Ltd 映像信号符号化装置およびその方法
US8406301B2 (en) 2002-07-15 2013-03-26 Thomson Licensing Adaptive weighting of reference pictures in video encoding
KR20060109247A (ko) * 2005-04-13 2006-10-19 엘지전자 주식회사 베이스 레이어 픽처를 이용하는 영상신호의 엔코딩/디코딩방법 및 장치
US7680342B2 (en) * 2004-08-16 2010-03-16 Fotonation Vision Limited Indoor/outdoor classification in digital images
US20050047504A1 (en) 2003-09-03 2005-03-03 Sung Chih-Ta Star Data stream encoding method and apparatus for digital video compression
NO319629B1 (no) 2003-11-28 2005-09-05 Tandberg Telecom As Fremgangsmate for korrigering av interpolerte pikselverdier
US7400681B2 (en) 2003-11-28 2008-07-15 Scientific-Atlanta, Inc. Low-complexity motion vector prediction for video codec with two lists of reference pictures
US7233164B2 (en) * 2003-12-17 2007-06-19 Rambus Inc. Offset cancellation in a multi-level signaling system
US20050232497A1 (en) * 2004-04-15 2005-10-20 Microsoft Corporation High-fidelity transcoding
JP2006032999A (ja) 2004-07-12 2006-02-02 Sharp Corp 画像復号装置及び画像復号方法
CN101977329B (zh) * 2004-07-29 2012-10-03 微软公司 使用线光值和其它图像处理改进的图像处理
US8472699B2 (en) * 2006-11-22 2013-06-25 Board Of Trustees Of The Leland Stanford Junior University Arrangement and method for three-dimensional depth image construction
US8068673B2 (en) 2006-12-01 2011-11-29 Beihang University Rapid and high precision centroiding method and system for spots image
EP2130374A4 (en) 2007-03-23 2011-03-02 Lg Electronics Inc METHOD AND ARRANGEMENT FOR DECODING / CODING A VIDEO SIGNAL
US7983496B2 (en) 2007-06-26 2011-07-19 Mitsubishi Electric Research Laboratories, Inc. Inverse tone mapping for bit-depth scalable image coding adapted to variable block sizes
WO2009110160A1 (ja) 2008-03-07 2009-09-11 株式会社 東芝 動画像符号化/復号化方法及び装置
US9078007B2 (en) * 2008-10-03 2015-07-07 Qualcomm Incorporated Digital video coding with interpolation filters and offsets
TWI386068B (zh) 2008-10-22 2013-02-11 Nippon Telegraph & Telephone 解塊處理方法、解塊處理裝置、解塊處理程式及記錄該程式之可由電腦讀取之記錄媒體
KR101700358B1 (ko) 2009-12-09 2017-01-26 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
US9094658B2 (en) * 2010-05-10 2015-07-28 Mediatek Inc. Method and apparatus of adaptive loop filtering
US9055305B2 (en) * 2011-01-09 2015-06-09 Mediatek Inc. Apparatus and method of sample adaptive offset for video coding
US8861617B2 (en) 2010-10-05 2014-10-14 Mediatek Inc Method and apparatus of region-based adaptive loop filtering
WO2012092841A1 (en) * 2011-01-03 2012-07-12 Mediatek Inc. Method of filter-unit based in-loop filtering
US9161041B2 (en) * 2011-01-09 2015-10-13 Mediatek Inc. Apparatus and method of efficient sample adaptive offset
CN103404137B (zh) * 2011-01-09 2016-10-19 寰发股份有限公司 有效的样本自适应补偿的方法和装置
EP2700230A4 (en) 2011-04-21 2014-08-06 Mediatek Inc METHOD AND APPARATUS FOR ENHANCED LOOP FILTERING
US9008170B2 (en) 2011-05-10 2015-04-14 Qualcomm Incorporated Offset type and coefficients signaling method for sample adaptive offset
WO2012155553A1 (en) 2011-05-16 2012-11-22 Mediatek Inc. Apparatus and method of sample adaptive offset for luma and chroma components
US20120294353A1 (en) * 2011-05-16 2012-11-22 Mediatek Inc. Apparatus and Method of Sample Adaptive Offset for Luma and Chroma Components
AU2012267007B2 (en) * 2011-06-10 2016-03-17 Mediatek Inc. Method and apparatus of scalable video coding
EP2719181A4 (en) 2011-06-10 2015-04-15 Mediatek Inc METHOD AND APPARATUS FOR SCALABLE VIDEO CODING
DK2725797T3 (da) 2011-06-23 2019-01-02 Huawei Tech Co Ltd Offset dekoderanordning, offset koderanordning, billedfilteranordning og datastruktur
MX338669B (es) 2011-06-28 2016-04-27 Samsung Electronics Co Ltd Metodo de codificacion de video que utiliza ajustes de desplazamiento de conformidad con clasificacion de pixel y aparato para ello, metodo de decodificacion de video y aparato para ello.

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1863315A (zh) * 2002-04-18 2006-11-15 株式会社东芝 运动图像编码/解码方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHIH-MING FU 等: "CE8 Subset3: Picture Quadtree Adaptive Offset", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11》 *
CHING-YEH CHEN 等: "CE8 Subset2: A Joint Proposal on Improving the Adaptive Loop Filter in TMuC0.9 by MediaTek, Qualcomm, and Toshiba", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11》 *

Also Published As

Publication number Publication date
KR20150041772A (ko) 2015-04-17
KR20150039143A (ko) 2015-04-09
EP2849444A2 (en) 2015-03-18
JP2016197890A (ja) 2016-11-24
CA2840583C (en) 2018-10-23
JP2015128334A (ja) 2015-07-09
MX338669B (es) 2016-04-27
PH12017501636B1 (en) 2018-04-23
PH12017501633A1 (en) 2018-04-23
US20160337656A1 (en) 2016-11-17
RU2663331C1 (ru) 2018-08-03
US9426482B2 (en) 2016-08-23
BR122021004578B1 (pt) 2022-07-26
EP2849444A3 (en) 2015-06-24
KR20140146559A (ko) 2014-12-26
SG10201408726QA (en) 2015-02-27
US20150163516A1 (en) 2015-06-11
PH12017501635A1 (en) 2018-04-23
TWI615022B (zh) 2018-02-11
JP2015164331A (ja) 2015-09-10
TW201640901A (zh) 2016-11-16
SG10201408716TA (en) 2015-02-27
US10542273B2 (en) 2020-01-21
US20180324450A1 (en) 2018-11-08
KR101457398B1 (ko) 2014-11-04
TW201739259A (zh) 2017-11-01
PH12017501634B1 (en) 2018-04-23
CN104994393A (zh) 2015-10-21
JP5964422B2 (ja) 2016-08-03
WO2013002554A3 (ko) 2013-04-11
KR20130002284A (ko) 2013-01-07
CN103959776A (zh) 2014-07-30
KR101603688B1 (ko) 2016-03-15
WO2013002554A2 (ko) 2013-01-03
BR112013033701B1 (pt) 2022-08-02
TW201813402A (zh) 2018-04-01
RU2014102576A (ru) 2015-08-10
KR101906506B1 (ko) 2018-12-07
JP2015128333A (ja) 2015-07-09
EP2728865A4 (en) 2016-03-16
SG10201408715UA (en) 2015-02-27
KR101603678B1 (ko) 2016-03-15
JP2015128332A (ja) 2015-07-09
KR20150039144A (ko) 2015-04-09
CN104980758A (zh) 2015-10-14
JP5965021B2 (ja) 2016-08-03
RU2632139C1 (ru) 2017-10-02
BR112013033701A2 (pt) 2019-04-09
MX337235B (es) 2016-02-18
TW201537967A (zh) 2015-10-01
BR122021004576B1 (pt) 2022-07-26
AU2012276452B2 (en) 2016-03-31
TWI669955B (zh) 2019-08-21
EP2887669A1 (en) 2015-06-24
JP5965022B2 (ja) 2016-08-03
AU2012276452A1 (en) 2014-01-30
MX338670B (es) 2016-04-27
KR101603685B1 (ko) 2016-03-15
MX2014000046A (es) 2014-02-17
AU2016204005B2 (en) 2018-01-18
US9462288B2 (en) 2016-10-04
CN104980756A (zh) 2015-10-14
US20150163502A1 (en) 2015-06-11
TWI549492B (zh) 2016-09-11
MY193771A (en) 2022-10-27
TW201309030A (zh) 2013-02-16
JP5964480B2 (ja) 2016-08-03
ZA201400649B (en) 2014-11-26
MY193778A (en) 2022-10-27
AU2018202603A1 (en) 2018-05-10
KR20140075657A (ko) 2014-06-19
US9438921B2 (en) 2016-09-06
JP5964479B2 (ja) 2016-08-03
KR101603690B1 (ko) 2016-03-15
CN104980757A (zh) 2015-10-14
US9426483B2 (en) 2016-08-23
CA2840583A1 (en) 2013-01-03
AU2016204005A1 (en) 2016-07-07
SG10201408720TA (en) 2015-01-29
US20150131742A1 (en) 2015-05-14
BR122021004574B1 (pt) 2022-07-26
US9438922B2 (en) 2016-09-06
US10038911B2 (en) 2018-07-31
JP6181246B2 (ja) 2017-08-16
MY192854A (en) 2022-09-13
BR122021004575B1 (pt) 2022-07-26
PH12017501634A1 (en) 2018-04-23
US20140192891A1 (en) 2014-07-10
TWI521970B (zh) 2016-02-11
PH12017501633B1 (en) 2018-04-23
RU2581553C2 (ru) 2016-04-20
PH12017501636A1 (en) 2018-04-23
US20150139335A1 (en) 2015-05-21
CA3016913C (en) 2020-03-10
CA3016913A1 (en) 2013-01-03
PH12017501635B1 (en) 2018-04-23
EP2728865A2 (en) 2014-05-07
TWI601418B (zh) 2017-10-01
AU2018202603B2 (en) 2019-07-18
JP2014523183A (ja) 2014-09-08

Similar Documents

Publication Publication Date Title
CN105049864A (zh) 根据像素分类使用偏移调整的视频解码方法及其设备
CN103220520B (zh) 用于对视频进行解码的方法
CN102939753B (zh) 用于通过根据像素组补偿像素值来对视频进行解码的方法和设备
CN102474614B (zh) 基于分层编码块样式信息的视频编码方法和设备以及视频解码方法和设备
CN104796719A (zh) 对视频进行解码的方法和设备
CN105357541A (zh) 对视频进行解码的方法和设备
CN104883574A (zh) 对视频进行编码和解码的方法和设备
CN104980745A (zh) 通过使用去块滤波对视频进行解码的方法和设备
CN104780382A (zh) 用于对视频进行解码的方法和设备
CN104811711A (zh) 视频的编码方法和装置及视频的解码方法和装置
CN104094600A (zh) 用于包括量化参数预测的基于分层数据单元的视频编码和解码的方法和设备
CN104796698A (zh) 对视频编码的方法和设备以及对视频解码的方法和设备
CN104041052A (zh) 确定用于变换系数级别熵编码和熵解码的上下文模型的方法和设备
CN103416062A (zh) 能够执行双向预测和单向预测的视频预测方法及其装置、视频编码方法及其装置以及视频解码方法及其装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20151111

WD01 Invention patent application deemed withdrawn after publication