CN103238334A - 图像帧内预测方法和设备 - Google Patents

图像帧内预测方法和设备 Download PDF

Info

Publication number
CN103238334A
CN103238334A CN2011800582740A CN201180058274A CN103238334A CN 103238334 A CN103238334 A CN 103238334A CN 2011800582740 A CN2011800582740 A CN 2011800582740A CN 201180058274 A CN201180058274 A CN 201180058274A CN 103238334 A CN103238334 A CN 103238334A
Authority
CN
China
Prior art keywords
depth
unit
coding unit
coding
rec
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011800582740A
Other languages
English (en)
Inventor
陈建乐
范迪姆·谢廖金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN103238334A publication Critical patent/CN103238334A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/825Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only the luminance and chrominance signals being recorded in separate channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N11/00Colour television systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N11/00Colour television systems
    • H04N11/06Transmission systems characterised by the manner in which the individual colour picture signal components are combined
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N11/00Colour television systems
    • H04N11/24High-definition television systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N11/00Colour television systems
    • H04N11/24High-definition television systems
    • H04N11/26High-definition television systems involving two-channel transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N11/00Colour television systems
    • H04N11/24High-definition television systems
    • H04N11/28High-definition television systems involving bandwidth reduction, e.g. subsampling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/87Regeneration of colour television signals
    • H04N9/873Regeneration of colour television signals for restoring the colour component sequence of the reproduced chrominance signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种图像帧内预测方法和设备。根据本发明的实施例的帧内预测方法包括如下步骤:基于将被帧内预测的色度块的恢复的邻近像素和亮度像素的恢复的邻近像素,获得表示所述色度块和亮度块之间的相关性的参数;通过使用所述参数从亮度块预测色度块。此外,根据本发明的实施例,获得所述参数的步骤可包括:通过对所述色度块的恢复的邻近像素和所述亮度块的恢复的邻近像素执行预定操作来获得所述参数,所述预定操作可包括改变所述参数的比特深度以防止比特溢出的发生的缩放处理。

Description

图像帧内预测方法和设备
技术领域
本发明的一个或多个方面涉及对图像进行编码和解码,更具体地说,涉及一种用于基于色度信号和先前恢复的亮度信号之间的相关性来从先前恢复的亮度信号预测色度信号的帧内预测方法和设备。
背景技术
在图像编码方法(诸如MPEG-1、MPEG-2、MPEG-4 H.264/MPEG-4高级视频编码(AVC)等)中,将图像划分为均具有预定尺寸的块来对图像进行编码。随后,通过使用帧间预测或帧内预测来对每个块进行预测编码。
从原始块中减去通过执行帧间预测或帧内预测而产生的预测块来产生残差块,残差块经过离散余弦变换、量化和熵编码来产生比特流。
在现有技术的图像编码方法或解码方法中,使用亮度分量和色度分量来表示单个像素,独立地对亮度分量和色度分量进行编码或解码。
发明内容
技术问题
本发明的一个或多个方面提供了一种用于基于色度信号和亮度信号之间的相关性来从亮度信号预测色度信号的方法和设备。
本发明的一个或多个方面还提供了用于在维持数据的精确性的同时防止发生比特溢出的预测方法和设备。
技术方案
根据本发明的一方面,获得表示恢复的色度信号和恢复的亮度信号之间的相关性的参数,并且使用所述参数来从恢复的亮度信号预测色度信号。可通过执行预定操作来获得所述参数。所述预定操作可包括改变所述参数的比特深度的自适应缩放处理以减小查找表的尺寸并防止发生溢出。
有益效果
根据本发明的实施例,可基于亮度信号和色度信号之间的相关性来提高预测的效率。
此外,可在不必执行除法操作的情况下获得定义亮度信号和色度信号之间的线性相关性的参数,从而减少了预测的计算量并提高了计算速度。
此外,可在维持数据的精确性的同时防止在获得参数期间发生比特溢出。
附图说明
图1是根据示例性实施例的视频编码设备的框图。
图2是根据示例性实施例的视频解码设备的框图。
图3是用于描述根据示例性实施例的编码单元的概念的示图。
图4是根据示例性实施例的基于编码单元的图像编码器的框图。
图5是根据示例性实施例的基于编码单元的图像解码器的框图。
图6是示出根据示例性实施例的根据深度的较深层编码单元以及分区的示图。
图7是用于描述根据示例性实施例的编码单元和变换单元之间的关系的示图。
图8是用于描述根据示例性实施例的与编码深度相应的编码单元的编码信息的示图。
图9是根据示例性实施例的根据深度的较深层编码单元的示图。
图10、图11和图12是用于描述根据示例性实施例的编码单元、预测单元和变换单元之间的关系的示图。
图13是用于描述根据表1的编码模式信息的编码单元、预测单元或分区以及变换单元之间的关系的示图。
图14是根据本发明的实施例的帧内预测设备的框图。
图15a至图15c是示出彩色格式的参考示图。
图16a和图16b是均示出根据彩色格式的亮度块和色度块的参考示图。
图17是示出根据本发明的实施例的对亮度信号进行下采样的处理的参考示图。
图18a和图18b是示出根据本发明的实施例的获得表示亮度信号和色度信号之间的相关性的参数的处理和预测色度信号的处理的参考示图。
图19示出根据本发明的实施例的获得近似值A2’的处理。
图20是示出根据本发明的实施例的查找表的参考示图。
图21是示出根据本发明的实施例的帧内预测方法的流程图。
最佳实施方式
根据本发明的一方面,提供了一种对图像进行帧内预测的方法,所述方法包括:基于将被帧内预测的色度块的恢复的邻近像素和与所述色度块相应的亮度像素的恢复的邻近像素,获得表示所述色度块和亮度块之间的相关性的参数;通过使用所述参数来从所述亮度块预测所述色度块。获得所述参数的步骤包括:对所述色度块的恢复的邻近像素和所述亮度块的恢复的邻近像素执行预定操作。预定操作包括改变所述参数的比特深度以减小查找表的尺寸并防止溢出的发生的自适应缩放处理。
根据本发明的另一方面,提供了一种对图像进行帧内预测的设备,所述设备包括:参数获得单元,基于将被帧内预测的色度块的恢复的邻近像素和与所述色度块相应的亮度像素的恢复的邻近像素,获得表示所述色度块和亮度块之间的相关性的参数;预测执行单元,通过使用所述参数来从所述亮度块预测所述色度块。参数获得单元通过对所述色度块的恢复的邻近像素和所述亮度块的恢复的邻近像素执行预定操作来获得所述参数。参数获得单元还执行改变所述参数的比特深度以减小查找表的尺寸并防止溢出的发生的自适应缩放处理。
具体实施方式
现在将参照附图更充分地描述本发明,在附图中示出本发明的示例性实施例。
图1是根据本发明的实施例的视频编码设备100的框图。
视频编码设备100包括最大编码单元划分器110、编码单元确定器120和输出单元130。
最大编码单元划分器110可基于图像的当前画面的最大编码单元对当前画面进行划分。如果当前画面大于最大编码单元,则当前画面的图像数据可被划分为至少一个最大编码单元。根据本发明的实施例的最大编码单元可以是尺寸为32×32、64×64、128×128、256×256等的数据单元,其中,数据单元的形状是宽度和高度为2的幂次方并大于8的正方形。图像数据可根据所述至少一个最大编码单元被输出到编码单元确定器120。
根据本发明的实施例的编码单元可由最大尺寸以及深度来表征。深度表示编码单元从最大编码单元被空间划分的次数,并且随着深度加深,根据深度的较深层编码单元可从最大编码单元被划分为最小编码单元。最大编码单元的深度是最上层深度,最小编码单元的深度是最下层深度。由于与每个深度相应的编码单元的尺寸随着最大编码单元的深度加深而减小,因此,与上层深度相应的编码单元可包括多个与下层深度相应的编码单元。
如上所述,当前画面的图像数据根据编码单元的最大尺寸而被划分为最大编码单元,所述最大编码单元中的每一个可包括根据深度被划分的较深层编码单元。由于根据本发明的实施例的最大编码单元根据深度被划分,因此包括在最大编码单元中的空间域的图像数据可根据深度被分层划分。
可预先确定编码单元的最大深度和最大尺寸,所述最大深度和最大尺寸限定最大编码单元的高度和宽度被分层划分的总次数。
编码单元确定器120根据深度对通过划分最大编码单元的区域而获得的至少一个划分的区域进行编码,并根据所述至少一个划分的区域确定用于输出最终编码的图像数据的深度。换句话说,编码单元确定器120通过根据当前画面的最大编码单元按照根据深度的较深层编码单元对图像数据进行编码,并选择具有最小编码误差的深度,来确定编码深度。因此,与确定的编码深度相应的编码单元的编码图像数据被最终输出。此外,与编码深度相应的编码单元可被视为被编码的编码单元。
确定的编码深度和根据确定的编码深度的编码图像数据被输出到输出单元130。
基于与等于或低于最大深度的至少一个深度相应的较深层编码单元对最大编码单元中的图像数据进行编码,并基于较深层编码单元中的每一个来比较对图像数据进行编码的结果。在比较较深层编码单元的编码误差之后,可选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。
随着编码单元根据深度而被分层划分,并且随着编码单元的数量增加,最大编码单元的尺寸被划分。此外,即使在一个最大编码单元中编码单元相应于相同深度,也通过分别测量每个编码单元的图像数据的编码误差来确定是否将与相同深度相应的编码单元中的每一个划分到下层深度。因此,即使当图像数据被包括在一个最大编码单元中时,在所述一个最大编码单元中,图像数据根据深度被划分为区域,编码误差也可根据区域而不同,因此,编码深度可根据图像数据中的区域而不同。因此,在一个最大编码单元中可确定一个或多个编码深度,并可根据至少一个编码深度的编码单元来划分最大编码单元的图像数据。
因此,编码单元确定器120可确定包括在最大编码单元中的具有树结构的编码单元。根据本发明的实施例的“具有树结构的编码单元”包括有在最大编码单元中包括的所有较深层编码单元中与被确定为编码深度的深度相应的编码单元。在最大编码单元的相同区域中,编码深度的编码单元可根据深度被分层确定,在不同的区域中,编码深度的编码单元可被独立地确定。类似地,当前区域中的编码深度可独立于另一区域中的编码深度被确定。
根据本发明的实施例的最大深度是关于从最大编码单元到最小编码单元的划分次数的索引。根据本发明的实施例的第一最大深度可表示从最大编码单元到最小编码单元的总划分次数。根据本发明的实施例的第二最大深度可表示从最大编码单元到最小编码单元的深度级的总数。例如,当最大编码单元的深度为0时,最大编码单元被划分一次的编码单元的深度可被设置为1,最大编码单元被划分两次的编码单元的深度可被设置为2。这里,如果最小编码单元是最大编码单元被划分四次的编码单元,则存在深度0、1、2、3和4这5个深度级,因此,第一最大深度可被设置为4,第二最大深度可被设置为5。
可根据最大编码单元执行预测编码和变换。还可根据最大编码单元,基于根据等于最大深度的深度或小于最大深度的深度的较深层编码单元来执行预测编码和变换。
由于每当最大编码单元根据深度被划分时较深层编码单元的数量增加,因此可针对随着深度加深而产生的所有较深层编码单元执行包括预测编码和变换的编码。为了便于描述,现在将基于最大编码单元中的当前深度的编码单元来描述预测编码和变换。
视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码,执行诸如预测编码、变换和熵编码的操作,此时,可针对所有操作使用相同的数据单元,或者可针对每个操作使用不同的数据单元。
例如,视频编码设备100不仅可选择用于对图像数据进行编码的编码单元,还可选择与编码单元不同的数据单元,以便对编码单元中的图像数据执行预测编码。
为了在最大编码单元中执行预测编码,可基于与编码深度相应的编码单元(即,基于不再被划分为与下层深度相应的编码单元的编码单元)执行预测编码。以下,现将不再被划分并且变成用于预测编码的基本单元的编码单元称为“预测单元”。通过对预测单元进行划分所获得的分区(partition)可包括预测单元或通过对预测单元的高度和宽度中的至少一个进行划分所获得的数据单元。
例如,当2N×2N(其中,N是正整数)的编码单元不再被划分,并且变成2N×2N的预测单元时,分区的尺寸可以是2N×2N、2N×N、N×2N或N×N。分区类型的示例包括通过对预测单元的高度或宽度进行对称划分所获得的对称分区、通过对预测单元的高度或宽度进行不对称划分(诸如1:n或n:1)所获得的分区、通过对预测单元进行几何划分所获得的分区以及具有任意形状的分区。
预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个。例如,可针对2N×2N、2N×N、N×2N或N×N的分区执行帧内模式或帧间模式。此外,可仅针对2N×2N的分区执行跳过模式。针对编码单元中的一个预测单元独立地执行编码,从而选择具有最小编码误差的预测模式。
视频编码设备100还可不仅基于用于对图像数据进行编码的编码单元,还基于不同于编码单元的数据单元,对编码单元中的图像数据执行变换。
为了在编码单元中执行变换,可基于具有小于或等于编码单元的尺寸的数据单元来执行变换。例如,用于变换的数据单元可包括用于帧内模式的数据单元和用于帧间模式的数据单元。
下面将用作变换的基础的数据单元称为变换单元。与编码单元类似,编码单元中的变换单元可被递归地划分为更小尺寸的区域,从而编码单元中的残差数据可基于根据变换深度的具有树结构的变换单元被划分。
还可在变换单元中设置变换深度,所述变换深度指示通过对编码单元的高度和宽度进行划分来实现变换单元的划分次数。例如,在2N×2N的当前编码单元中,当变换单元的尺寸也为2N×2N时,变换深度可以是0,当当前编码单元的高度和宽度中的每个被划分为二等分,总共被划分为4个变换单元,变换单元的尺寸是N×N时,变换深度可以是1,当当前编码单元的高度和宽度中的每个被划分为四等分,总共被划分为42个变换单元,变换单元的尺寸是N/2×N/2时,变换深度可以是2。例如,可根据分层树结构设置变换单元,其中,根据变换深度的分层特性,上层变换深度的变换单元被划分为下层变换深度的四个变换单元。
与编码单元相似,编码单元中的变换单元可被递归地划分为更小尺寸的区域,从而可以以区域为单位独立地确定变换单元。因此,可基于变换深度,根据具有树结构的变换来划分编码单元中的残差数据。
根据与编码深度相应的编码单元的编码信息不仅需要关于编码深度的信息,还需要关于与预测编码和变换有关的信息的信息。因此,编码单元确定器120不仅确定具有最小编码误差的编码深度,还确定预测单元中的分区类型、根据预测单元的预测模式和用于变换的变换单元的尺寸。
稍后将参照图3至图12详细描述根据本发明的实施例的最大编码单元中的根据树结构的编码单元以及确定分区的方法。
编码单元确定器120可通过使用基于拉格朗日乘子的率失真优化来测量根据深度的较深层编码单元的编码误差。
输出单元130在比特流中输出最大编码单元的图像数据以及关于根据编码深度的编码模式的信息,其中,所述图像数据基于由编码单元确定器120确定的至少一个编码深度被编码。
可通过对图像的残差数据进行编码来获得编码图像数据。
关于根据编码深度的编码模式的信息可包括关于编码深度的信息、关于预测单元中的分区类型的信息、预测模式以及变换单元的尺寸。
可通过使用根据深度的划分信息来定义关于编码深度的信息,所述根据深度的划分信息指示是否针对下层深度而不是当前深度的编码单元来执行编码。如果当前编码单元的当前深度是编码深度,则当前编码单元中的图像数据被编码并被输出,因此划分信息可被定义为不将当前编码单元划分到下层深度。可选地,如果当前编码单元的当前深度不是编码深度,则针对下层深度的编码单元来执行编码,因此,划分信息可被定义为划分当前编码单元以获得下层深度的编码单元。
如果当前深度不是编码深度,则针对被划分为下层深度的编码单元的编码单元来执行编码。由于在当前深度的一个编码单元中存在下层深度的至少一个编码单元,因此针对下层深度的每个编码单元重复执行编码,因此,可针对具有相同深度的编码单元递归地执行编码。
由于针对一个最大编码单元确定具有树结构的编码单元,并且针对编码深度的编码单元确定关于至少一个编码模式的信息,因此,可针对一个最大编码单元确定关于至少一个编码模式的信息。此外,由于图像数据根据深度被分层划分,因此,最大编码单元的图像数据的编码深度可根据位置而不同,因此,可针对图像数据设置关于编码深度和编码模式的信息。
因此,输出单元130可将关于相应的编码深度和编码模式的编码信息分配给包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。
根据本发明的实施例的最小单元是通过将构成最低深度的最小编码单元划分4次所获得的矩形数据单元。可选地,最小单元可以是可包括在最大编码单元中所包括的所有编码单元、预测单元、分区单元和变换单元中的最大矩形数据单元。
例如,通过输出单元130输出的编码信息可被分为根据编码单元的编码信息和根据预测单元的编码信息。根据编码单元的编码信息可包括关于预测模式的信息和关于分区尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息和关于帧内模式的插值方法的信息。此外,关于根据画面、条带或GOP定义的编码单元的最大尺寸的信息以及关于最大深度的信息可被***比特流的头中。
在视频编码设备100中,较深层编码单元可以是通过将作为上一层的上层深度的编码单元的高度或宽度划分两次所获得的编码单元。换句话说,当当前深度的编码单元的尺寸为2N×2N时,下层深度的编码单元的尺寸是N×N。此外,尺寸为2N×2N的当前深度的编码单元可最多包括下层深度的4个编码单元。
因此,视频编码设备100可通过基于考虑当前画面的特性所确定的最大编码单元的尺寸和最大深度,针对每个最大编码单元确定具有最佳形状和最佳尺寸的编码单元,来形成具有树结构的编码单元。此外,由于可通过使用各种预测模式和变换中的任何一个来针对每个最大编码单元执行编码,因此可考虑各种图像尺寸的编码单元的特性来确定最佳编码模式。
因此,当以传统的宏块对具有高分辨率或大数据量的图像进行编码时,每个像素所需的宏块数量过度增加。因此,针对每个宏块产生的压缩信息量也增加,因此发送压缩信息的负载将增加,并且数据压缩效率将降低。然而,视频编码设备100可考虑图像尺寸而增加编码单元的最大尺寸,并且可考虑图像特性而调整编码单元,从而图像压缩效率可提高。
图2是根据本发明的实施例的视频解码设备200的框图。
根据本发明的实施例的视频解码设备200包括接收器210、图像数据和编码信息提取器220以及图像数据解码器230。用于视频解码设备200的各种操作的各种术语(诸如编码单元、深度、预测单元、变换单元和关于各种编码模式的信息)的定义与参照图1和视频编码设备100描述的那些术语相同。
接收器210接收并解析编码视频的比特流。图像数据和编码信息提取器220从解析的比特流提取每个编码单元的编码图像数据,并将提取的图像数据输出到图像数据解码器230,其中,编码单元具有根据每个最大编码单元的树结构。图像数据和编码信息提取器220可从关于当前画面的头或SPS提取关于当前画面的编码单元的最大尺寸的信息。
此外,图像数据和编码信息提取器220从解析的比特流,提取关于编码单元的编码深度和编码模式的信息,其中,编码单元具有根据每个最大编码单元的树结构。提取的关于编码深度和编码模式的信息被输出到图像数据解码器230。换句话说,比特流中的图像数据被划分为最大编码单元,从而图像数据解码器230对每个最大编码单元的图像数据进行解码。
可针对关于与编码深度相应的至少一个编码单元的信息,来设置关于根据最大编码单元的编码深度和编码模式的信息,并且关于编码模式的信息可包括关于与编码深度相应的相应编码单元的分区类型的信息、关于预测模式的信息和变换单元的尺寸。此外,根据深度的划分信息可被提取作为关于编码深度的信息。
由图像数据和编码信息提取器220提取的关于根据每个最大编码单元的编码深度和编码模式的信息是关于如下编码深度和编码模式的信息,其中,所述编码深度和编码模式被确定为用于当编码器(诸如视频编码设备100)根据每个最大编码单元对每个根据深度的较深层编码单元重复执行编码时产生最小编码误差。因此,视频解码设备200可通过根据产生最小编码误差的编码深度和编码模式对图像数据进行解码来恢复图像。
由于关于编码深度和编码模式的编码信息可被分配给相应编码单元、预测单元和最小单元中的预定数据单元,因此图像数据和编码信息提取器220可根据预定数据单元提取关于编码深度和编码模式的信息。被分配关于编码深度和编码模式的相同信息的预定数据单元可被推断为包括在相同最大编码单元中的数据单元。
图像数据解码器230通过基于关于根据最大编码单元的编码深度和编码模式的信息对每个最大编码单元中的图像数据进行解码,来恢复当前画面。换句话说,图像数据解码器230可基于提取的关于包括在每个最大编码单元中的具有树结构的编码单元中的每个编码单元的分区类型、预测模式和变换单元的信息,来对编码图像数据进行解码。解码处理可包括预测(包括帧内预测和运动补偿)和反变换。
图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的分区类型和预测模式的信息,根据每个编码单元的分区和预测模式执行帧内预测或运动补偿。
此外,图像数据解码器230可基于关于根据编码深度的编码单元的变换单元的尺寸的信息,根据编码单元中的每个变换单元执行反变换,从而根据最大编码单元执行反变换。
图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的至少一个编码深度。如果划分信息指示图像数据在当前深度下不再被划分,则当前深度是编码深度。因此,图像数据解码器230可通过使用与编码深度相应的每个编码单元的关于预测单元的分区类型、预测模式和变换单元尺寸的信息,对当前最大编码单元中与每个编码深度相应的至少一个编码单元的编码数据进行解码。
换句话说,可通过观察为编码单元、预测单元和最小单元中的预定数据单元分配的编码信息集来收集包括编码信息(包括相同划分信息)的数据单元,收集的数据单元可被视为将由图像数据解码器230以相同的编码模式进行解码的一个数据单元。
视频解码设备200可获得关于当针对每个最大编码单元递归执行编码时产生最小编码误差的至少一个编码单元的信息,并可使用所述信息来对当前画面进行解码。换句话说,可对每个最大编码单元中被确定为最佳编码单元的具有树结构的编码单元进行解码。
因此,即使图像数据对应于具有高分辨率和过大数据量的图像,视频解码设备200也可通过使用从编码器接收的关于最佳编码模式的信息,根据编码单元的尺寸和编码模式来有效地对所述图像数据进行解码和恢复,其中,根据图像的特性来自适应地确定所述编码单元的尺寸和所述编码模式。
现在将参照图3至图13描述根据本发明的实施例的确定具有树结构的编码单元、预测单元和变换单元的方法。
图3是用于描述根据本发明的实施例的分层编码单元的概念的示图。
编码单元的尺寸可被表示为宽度×高度,可以是64×64、32×32、16×16和8×8。64×64的编码单元可被划分为64×64、64×32、32×64或32×32的分区,32×32的编码单元可被划分为32×32、32×16、16×32或16×16的分区,16×16的编码单元可被划分为16×16、16×8、8×16或8×8的分区,8×8的编码单元可被划分为8×8、8×4、4×8或4×4的分区。
在视频数据310中,分辨率为1920×1080,编码单元的最大尺寸为64,最大深度为2。在视频数据320中,分辨率为1920×1080,编码单元的最大尺寸为64,最大深度为3。在视频数据330中,分辨率为352×288,编码单元的最大尺寸为16,最大深度为1。图3的最大深度指示从最大编码单元到最小解码单元的总划分次数。
如果分辨率高或数据量大,则编码单元的最大尺寸可较大,从而不仅提高了编码效率还精确地反映出图像的特性。因此,分辨率高于视频数据330的视频数据310和视频数据320的编码单元的最大尺寸可以是64。
由于视频数据310的最大深度是2,因此,由于通过将最大编码单元划分两次,深度被加深两层,因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元以及长轴尺寸为32和16的编码单元。同时,由于视频数据330的最大深度是1,因此,由于通过将最大编码单元划分一次,深度被加深一层,因此视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元以及长轴尺寸为8的编码单元。
由于视频数据320的最大深度为3,因此,由于通过将最大编码单元划分三次,深度被加深3层,因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元以及长轴尺寸为32、16和8的编码单元。随着深度加深,可精确地表达详细信息。
图4是根据本发明的实施例的基于编码单元的图像编码器400的框图。
图像编码器400执行视频编码设备100的编码单元确定器120的操作以对图像数据进行编码。换句话说,帧内预测器410对当前帧405中的帧内模式下的编码单元执行帧内预测,运动估计器420和运动补偿器425通过使用当前帧405和参考帧495,对当前帧405中的帧间模式下的编码单元执行帧间估计和运动补偿。
从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430和量化器440被输出作为量化的变换系数。量化的变换系数通过反量化器460和反变换器470被恢复为空间域中的数据,恢复的空间域中的数据在通过去块单元480和环路滤波单元490进行后处理之后被输出为参考帧495。量化的变换系数可通过熵编码器450被输出为比特流455。
为了将图像编码器400应用在视频编码设备100中,图像编码器400的所有元件(即,帧内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器450、反量化器460、反变换器470、去块单元480和环路滤波单元490)在考虑每个最大编码单元的最大深度的同时,基于具有树结构的编码单元中的每个编码单元来执行操作。
具体地,帧内预测器410、运动估计器420和运动补偿器425在考虑当前最大编码单元的最大尺寸和最大深度的同时确定具有树结构的编码单元中的每个编码单元的分区和预测模式,变换器430确定具有树结构的编码单元中的每个编码单元中的变换单元的尺寸。
图5是根据本发明的实施例的基于编码单元的图像解码器500的框图。
解析器510从比特流505解析将被解码的编码图像数据以及解码所需的关于编码的信息。编码图像数据通过熵解码器520和反量化器530被输出为反量化的数据,反量化的数据通过反变换器540被恢复为空间域中的图像数据。
帧内预测器550针对空间域中的图像数据,对帧内模式下的编码单元执行帧内预测,运动补偿器560通过使用参考帧585对帧间模式下的编码单元执行运动补偿。
通过帧内预测器550和运动补偿器560的空间域中的图像数据可在通过去块单元570和环路滤波单元580进行后处理之后被输出为恢复的帧595。此外,通过去块单元570和环路滤波单元580进行后处理的图像数据可被输出为参考帧585。
为了在视频解码设备200的图像数据解码器230中对图像数据进行解码,图像解码器500可执行在解析器510之后执行的操作。
为了将图像解码器500应用在视频解码设备200中,图像解码器500的所有元件(即,解析器510、熵解码器520、反量化器530、反变换器540、帧内预测器550、运动补偿器560、去块单元570和环路滤波单元580)针对每个最大编码单元基于具有树结构的编码单元执行操作。
具体地,帧内预测器550和运动补偿器560基于具有树结构的编码单元中的每个编码单元的分区和预测模式执行操作,反变换器540基于每个编码单元的变换单元的尺寸执行操作。
图6是示出根据本发明的实施例的根据深度的较深层编码单元以及分区的示图。
视频编码设备100和视频解码设备200使用分层编码单元以考虑图像的特性。可根据图像的特性适应地确定编码单元的最大高度、最大宽度和最大深度,或可由用户不同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。
在根据本发明的实施例的编码单元的分层结构600中,编码单元的最大高度和最大宽度均为64,最大深度为4。由于深度沿分层结构600的纵轴加深,因此较深层编码单元的高度和宽度均被划分。此外,沿分层结构600的横轴示出作为用于每个较深层编码单元的预测编码的基础的预测单元和分区。
换句话说,编码单元610是分层结构600中的最大编码单元,其中,深度为0,尺寸(即,高度乘宽度)为64×64。深度沿纵轴加深,存在尺寸为32×32且深度为1的编码单元620、尺寸为16×16且深度为2的编码单元630、尺寸为8×8且深度为3的编码单元640以及尺寸为4×4且深度为4的编码单元650。尺寸为4×4且深度为4的编码单元650是最小编码单元。
编码单元的预测单元和分区根据每个深度沿横轴排列。换句话说,如果尺寸为64×64且深度为0的编码单元610是预测单元,则预测单元可被划分为包括在编码单元610中的分区,即,尺寸为64×64的分区610、尺寸为64×32的分区612、尺寸为32×64的分区614或尺寸为32×32的分区616。
类似地,尺寸为32×32且深度为1的编码单元620的预测单元可被划分为包括在编码单元620中的分区,即,尺寸为32×32的分区620、尺寸为32×16的分区622、尺寸为16×32的分区624和尺寸为16×16的分区626。
类似地,尺寸为16×16且深度为2的编码单元630的预测单元可被划分为包括在编码单元630中的分区,即,包括在编码单元630中的尺寸为16×16的分区630、尺寸为16×8的分区632、尺寸为8×16的分区634和尺寸为8×8的分区636。
类似地,尺寸为8×8且深度为3的编码单元640的预测单元可被划分为包括在编码单元640中的分区,即,包括在编码单元640中的尺寸为8×8的分区640、尺寸为8×4的分区642、尺寸为4×8的分区644和尺寸为4×4的分区646。
尺寸为4×4且深度为4的编码单元650是最小编码单元和最下层深度的编码单元。编码单元650的预测单元仅被分配给尺寸为4×4的分区。
为了确定组成最大编码单元610的编码单元的至少一个编码深度,视频编码设备100的编码单元确定器120针对包括在最大编码单元610中的与每个深度相应的编码单元执行编码。
随着深度加深,以相同范围和相同尺寸包括数据的根据深度的较深层编码单元的数量增加。例如,需要四个与深度2相应的编码单元,以覆盖包括在一个与深度1相应的编码单元中的数据。因此,为了比较相同数据根据深度的编码结果,与深度1相应的编码单元和四个与深度2相应的编码单元各自被编码。
为了针对多个深度中的当前深度执行编码,可通过沿分层结构600的横轴,针对与当前深度相应的编码单元中的每个预测单元执行编码,来针对当前深度选择最小编码误差。可选地,可通过随着深度沿分层结构600的纵轴加深针对每个深度执行编码来比较根据深度的最小编码误差,从而搜索最小编码误差。在编码单元610中具有最小编码误差的深度和分区可被选为编码单元610的编码深度和分区类型。
图7是用于描述根据本发明的实施例的编码单元710和变换单元720之间的关系的示图。
视频编码设备100或200针对每个最大编码单元,根据具有小于或等于最大编码单元的尺寸的编码单元来对图像进行编码或解码。可基于不大于相应编码单元的数据单元来选择在编码期间用于变换的变换单元的尺寸。
例如,在视频编码设备100或200中,如果编码单元710的尺寸是64×64,则可通过使用尺寸为32×32的变换单元720来执行变换。
此外,可通过对小于64×64的尺寸为32×32、16×16、8×8和4×4的变换单元中的每一个执行变换,来对尺寸为64×64的编码单元710的数据进行编码,随后可选择具有最小编码误差的变换单元。
图8是用于描述根据本发明的实施例的与编码深度相应的编码单元的编码信息的示图。
视频编码设备100的输出单元130可对与编码深度相应的每个编码单元的关于分区类型的信息800、关于预测模式的信息810和关于变换单元的尺寸的信息820进行编码和发送,以作为关于编码模式的信息。
信息800指示关于通过对当前编码单元的预测单元进行划分而获得的分区的形状的信息,其中,所述分区是用于对当前编码单元进行预测编码的数据单元。例如,尺寸为2N×2N的当前编码单元CU_0可被划分为尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806和尺寸为N×N的分区808中的任意一个。这里,关于分区类型的信息800被设置为指示尺寸为2N×N的分区804、尺寸为N×2N的分区806和尺寸为N×N的尺寸的分区808之一。
信息810指示每个分区的预测模式。例如,信息810可指示对由信息800指示的分区执行的预测编码的模式,即,帧内模式812、帧间模式814或跳过模式816。
信息820指示当对当前编码单元执行变换时所基于的变换单元。例如,变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧内变换单元828。
视频解码设备200的图像数据和编码信息提取器220可根据每个较深层编码单元提取和使用用于解码的信息800、810和820。
图9是根据本发明的实施例的根据深度的较深层编码单元的示图。
划分信息可被用于指示深度的改变。划分信息指示当前深度的编码单元是否被划分为下层深度的编码单元。
用于对深度为0且尺寸为2N_0×2N_0的编码单元900进行预测编码的预测单元910可包括以下分区类型的分区:尺寸为2N_0×2N_0的分区类型912、尺寸为2N_0×N_0的分区类型914、尺寸为N_0×2N_0的分区类型916、尺寸为N_0×N_0的分区类型918。图16仅示出通过对预测单元910进行对称划分而获得的分区类型912至918,但分区类型不限于此,预测单元910的分区可包括不对称分区、具有预定形状的分区和具有几何形状的分区。
根据每个分区类型,对一个尺寸为2N_0×2N_0的分区、两个尺寸为2N_0×N_0的分区、两个尺寸为N_0×2N_0的分区和四个尺寸为N_0×N_0的分区重复执行预测编码。可对尺寸为2N_0×2N_0、N_0×2N_0、2N_0×N_0和N_0×N_0的分区执行帧内模式和帧间模式下的预测编码。仅对尺寸为2N_0×2N_0的分区执行跳过模式下的预测编码。
对在分区类型912至918中的包括预测编码的编码的误差进行比较,在所述分区类型中确定最小编码误差。如果在分区类型912至916之一中编码误差最小,则预测单元910可不被划分到下层深度。
如果在分区类型918中编码误差最小,则深度从0改变到1以在操作920对分区类型918进行划分,并对深度为2且尺寸为N_0×N_0的编码单元930重复执行编码,以搜索最小编码误差。
用于对深度为1且尺寸为2N_1×2N_1(=N_0×N_0)的编码单元930进行预测编码的预测单元940可包括以下分区类型的分区:尺寸为2N_1×2N_1的分区类型942、尺寸为2N_1×N_1的分区类型944、尺寸为N_1×2N_1的分区类型946、尺寸为N_1×N_1的分区类型948。
如果在分区类型948中编码误差最小,则深度从1改变到2以在操作950对分区类型948进行划分,并对深度为2且尺寸为N_2×N_2的编码单元960重复执行编码,以搜索最小编码误差。
当最大深度为d时,可执行根据每个深度的划分操作,直到深度变为d-1,并且划分信息可被编码,直到深度为0到d-2中的一个。换句话说,当编码被执行直到在操作970与深度d-2相应的编码单元被划分之后深度为d-1时,用于对深度为d-1且尺寸为2N_(d-1)×2N_(d-1)的编码单元980进行预测编码的预测单元990可包括以下分区类型的分区:尺寸为2N_(d-1)×2N_(d-1)的分区类型992、尺寸为2N_(d-1)×N_(d-1)的分区类型994、尺寸为N_(d-1)×2N_(d-1)的分区类型996、尺寸为N_(d-1)×N_(d-1)的分区类型998。
可在分区类型992至998中对一个尺寸为2N_(d-1)×2N_(d-1)的分区、两个尺寸为2N_(d-1)×N_(d-1)的分区、两个尺寸为N_(d-1)×2N_(d-1)的分区、四个尺寸为N_(d-1)×N_(d-1)的分区重复执行预测编码,以搜索具有最小编码误差的分区类型。
即使当分区类型998具有最小编码误差时,由于最大深度为d,因此深度为d-1的编码单元CU_(d-1)也不再被划分到下层深度,用于组成当前最大编码单元900的编码单元的编码深度被确定为d-1,当前最大编码单元900的分区类型可被确定为N_(d-1)×N_(d-1)。此外,由于最大深度为d并且具有最下层深度d-1的最小编码单元980不再被划分到下层深度,因此不设置最小编码单元980的划分信息。
数据单元999可以为当前最大编码单元的“最小单元”。根据本发明的实施例的最小单元可以是通过将最小编码单元980划分4次而获得的正方形数据单元。通过重复执行编码,视频编码设备100可通过比较根据编码单元900的深度的编码误差来选择具有最小编码误差的深度以确定编码深度,并将相应的分区类型和预测模式设置为编码深度的编码模式。
这样,在1至d的所有深度中比较根据深度的最小编码误差,具有最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型和预测模式可作为关于编码模式的信息被编码和发送。此外,由于编码单元从深度0被划分到编码深度,因此仅编码深度的划分信息被设置为0,除了编码深度之外的深度的划分信息被设置为1。
视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元900的编码深度和预测单元的信息以对分区912进行解码。视频解码设备200可通过使用根据深度的划分信息将划分信息为0的深度确定为编码深度,并使用关于相应深度的编码模式的信息以进行解码。
图10、图11和图12是用于描述根据本发明的实施例的编码单元1010、预测单元1060和变换单元1070之间的关系的示图。
编码单元1010是最大编码单元中与由视频编码设备100确定的编码深度相应的具有树结构的编码单元。预测单元1060是编码单元1010中的每一个的预测单元的分区,变换单元1070是编码单元1010中的每一个的变换单元。
当编码单元1010中的最大编码单元的深度是0时,编码单元1012和1054的深度是1,编码单元1014、1016、1018、1028、1050和1052的深度是2,编码单元1020、1022、1024、1026、1030、1032和1048的深度是3,编码单元1040、1042、1044和1046的深度是4。
在预测单元1060中,通过对编码单元1010中的编码单元进行划分来获得某些编码单元1014、1016、1022、1032、1048、1050、1052和1054。换句话说,编码单元1014、1022、1050和1054中的分区类型具有2N×N的尺寸,编码单元1016、1048和1052中的分区类型具有N×2N的尺寸,编码单元1032的分区类型具有N×N的尺寸。编码单元1010的预测单元和分区小于或等于每个编码单元。
对小于编码单元1052的数据单元中的变换单元1070中的编码单元1052的图像数据执行变换或反变换。此外,变换单元1070中的编码单元1014、1016、1022、1032、1048、1050和1052在尺寸和形状方面与预测单元1060中的编码单元1014、1016、1022、1032、1048、1050和1052不同。换句话说,视频编码设备100和视频解码设备200可对相同编码单元中的数据单元分别执行帧内预测、运动估计、运动补偿、变换和反变换。
因此,对最大编码单元的每个区域中具有分层结构的编码单元中的每一个递归地执行编码,以确定最佳编码单元,从而可获得具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。表1示出可由视频编码设备100和视频解码设备200设置的编码信息。
表1
Figure BDA00003292443600181
视频编码设备100的输出单元130可输出关于具有树结构的编码单元的编码信息,视频解码设备200的图像数据和编码信息提取器220可从接收的比特流提取关于具有树结构的编码单元的编码信息。
划分信息指示当前编码单元是否被划分为下层深度的编码单元。如果当前深度d的划分信息为0,则当前编码单元不再被划分到下层深度的深度是编码深度,因此可针对编码深度定义关于分区类型、预测模式和变换单元的尺寸的信息。如果当前编码单元根据划分信息被进一步划分,则对下层深度的四个划分的编码单元独立地执行编码。
预测模式可以是帧内模式、帧间模式和跳过模式中的一个。可在所有分区类型中定义帧内模式和帧间模式,仅在尺寸为2N×2N的分区类型中定义跳过模式。
关于分区类型的信息可指示通过对预测单元的高度或宽度进行对称划分而获得的尺寸为2N×2N、2N×N、N×2N和N×N的对称分区类型,以及通过对预测单元的高度或宽度进行不对称划分而获得的尺寸为2N×nU、2N×nD、nL×2N和nR×2N的不对称分区类型。可通过按照1:3和3:1对预测单元的高度进行划分来分别获得尺寸为2N×nU和2N×nD的不对称分区类型,可通过按照1:3和3:1对预测单元的宽度进行划分来分别获得尺寸为nL×2N和nR×2N的不对称分区类型。
变换单元的尺寸可被设置为帧内模式下的两种类型和帧间模式下的两种类型。换句话说,如果变换单元的划分信息是0,则变换单元的尺寸可以是2N×2N,这是当前编码单元的尺寸。如果变换单元的划分信息是1,则可通过对当前编码单元进行划分来获得变换单元。此外,如果尺寸为2N×2N的当前编码单元的分区类型是对称分区类型,则变换单元的尺寸可以是N×N,如果当前编码单元的分区类型是不对称分区类型,则变换单元的尺寸可以是N/2×N/2。
关于具有树结构的编码单元的编码信息可包括与编码深度相应的编码单元、预测单元和最小单元中的至少一个。与编码深度相应的编码单元可包括:包括相同编码信息的预测单元和最小单元中的至少一个。
因此,通过比较邻近数据单元的编码信息来确定邻近数据单元是否包括在与编码深度相应的相同编码单元中。此外,通过使用数据单元的编码信息来确定与编码深度相应的相应编码单元,从而可确定最大编码单元中的编码深度的分布。
因此,如果基于邻近数据单元的编码信息来预测当前编码单元,则可直接参考和使用与当前编码单元邻近的较深层编码单元中的数据单元的编码信息。
可选地,如果基于邻近数据单元的编码信息来预测当前编码单元,则使用数据单元的编码信息来搜索与当前编码单元邻近的数据单元,并且可参考搜索到的邻近编码单元来预测当前编码单元。
图13是用于描述根据表1的编码模式信息的编码单元、预测单元或分区、变换单元之间的关系的示图。
最大编码单元1300包括多个编码深度的编码单元1302、1304、1306、1312、1314、1316和1318。这里,由于编码单元1318是编码深度的编码单元,因此划分信息可被设置为0。关于尺寸为2N×2N的编码单元1318的分区类型的信息可被设置为以下分区类型之一:尺寸为2N×2N的分区类型1322、尺寸为2N×N的分区类型1324、尺寸为N×2N的分区类型1326、尺寸为N×N的分区类型1328、尺寸为2N×nU的分区类型1332、尺寸为2N×nD的分区类型1334、尺寸为nL×2N的分区类型1336和尺寸为nR×2N的分区类型1338。
当分区类型被设置为对称(即,分区类型1322、1324、1326或1328)时,如果变换单元的划分信息(TU尺寸标记)为0,则设置尺寸为2N×2N的变换单元1342,如果TU尺寸标记为1,则设置尺寸为N×N的变换单元1344。
当分区类型被设置为不对称(即,分区类型1332、1334、1336或1338)时,如果TU尺寸标记为0,则设置尺寸为2N×2N的变换单元1352,如果TU尺寸标记为1,则设置尺寸为N/2×N/2的变换单元1354。
现在将详细描述在图4的编码设备400中执行的预测处理以及在图5的解码设备400中执行的预测处理。根据本发明的实施例的预测处理可作为新的帧内预测模式由图4的帧内预测器410和图5的帧内预测器550执行。以下,预测单元将被称为块。
通常,每个像素需要至少三个彩色分量来显示彩***信号中的颜色。存在彩色空间的各种示例,诸如,RGB彩色空间,其中,使用三个像素值来表示彩***信号的每个样点,所述三个像素值中的每个像素值表示红(R)、绿(G)和蓝(B)之间的相对比例;YCbCr彩色空间和YUV彩色空间,其中,基于人类视觉***(HVS)对亮度分量更敏感的事实,使用亮度和色度分量来表示彩***信号。通常,在视频编码/解码方法中,通地将视频信号划分为这样的多个彩色分量来执行编码和解码。很可能在包括这样的多个彩色分量的视频信号中的同一个像素的彩色分量之间存在预定相关性。例如,属于同一个块的相应像素的亮度分量Y和色度分量Cb和Cr的值可表现出相似的模式。
因此,根据本发明的实施例的帧内预测设备帧内预测设备基于在当前色度块被处理之前恢复的邻近亮度像素和恢复的邻近色度像素,获得表示亮度信号和色度信号之间的线性相关性的参数,随后通过使用所述参数从先前恢复的亮度块产生当前色度块的预测值。具体地,根据本发明的实施例,可通过执行移位、乘法、加法和减法运算以及访问查找表,而不必执行增加对***的硬件负载的除法运算,来有效地获得亮度信号和色度信号之间的线性相关性。此外,根据本发明的实施例,可将执行用于获得参数的操作所需要的值预先存储在查找表中,并可基于查找表获得所述参数,从而减少计算量。以下,将针对从亮度分量预测相应色度分量的像素值的处理来描述本发明。然而,将对本领域的普通技术人员明显的时,本发明不限于YCbCr彩色空间,并可应用到其它各种彩色空间,例如,RGB彩色空间。
图14是根据本发明的实施例的帧内预测设备1400的框图。参照图14,帧内预测设备1400包括采样单元1410、参数获得单元1420和预测执行单元1430。
如果亮度块大于与所述亮度块相应的色度块,则采样单元1410对恢复的亮度块的像素及其邻近像素进行下采样,来使得亮度信号的尺寸和色度信号的尺寸彼此相等。
参数获得单元1420基于恢复的色度块的邻近像素和恢复的与色度块相应的亮度块的邻近像素,获得表示色度块和亮度块的相关性的参数。具体地,参数获得单元1420可执行改变参数的比特深度的缩放处理以改变查找表的尺寸(将在下面被描述)并防止当执行用于获得参数的操作时发生溢出。将在下面详细描述参数获得单元1420的操作。
预测执行单元1430通过使用所述参数从恢复的与色度像素相应的亮度像素预测色度像素。
图15a至图15c是示出均包括多个彩色分量的彩色格式的参考示图。图16a和图16b是均示出根据彩色格式的亮度块和色度块的参数示图。
在图15a的4:2:0的彩色格式、图15b的4:2:2的彩色格式和图15c的4:4:4的彩色格式中,每个数值指示在水平方向上执行的采样的相对比例。例如,在4:4:4的彩色格式中,对于四个Y像素1530,存在四个Cb像素和四个Cr像素。参照图16a,在4:4:4的彩色格式中,当Y亮度块的尺寸是2N×2M时,与Y亮度块相应的Cb和Cr色度块的尺寸也均为2N×2M。这里,“N”和“M”表示整数。在4:2:2的彩色格式中,色度分量Cb和Cr在水平方向上的分辨率与亮度分量Y的分辨率相同,而在垂直方向上的分辨率是亮度分量的分辨率的一半。换句话说,在4:2:2的彩色格式中,在水平方向上,对于四个亮度像素1510,存在两个Cb像素和两个Cr像素。在4:2:0的彩色格式中,色度分量Cb和Cr在水平方向和垂直方向上的分辨率都是亮度分量Y的分辨率的一半。换句话说,色度分量Cb和Cr中的每一个的像素数量是亮度分量Y的像素数量的1/4倍。如图16b所示,在4:2:0的彩色格式中,亮度块Y的尺寸为2N×2M,而与亮度块Y相应的色度块Cb和Cr的尺寸均为N×M,即,在水平方向和垂直方向上均是亮度块Y的尺寸的一半。
因此,如果如在4:2:2的彩色格式或4:2:0的彩色格式中亮度块Y大于色度块Cb和Cr,则采样单元1410可对恢复的亮度块及其邻近像素进行下采样,从而亮度信号和色度信号可以以1:1匹配。
图17是示出根据本发明的实施例的对亮度像素进行下采样的处理的参考示图。参照图17,如果亮度块1710和色度块1720的尺寸分别为2nS×2nS和nS×nS,则图14的采样单元1410以1/2的比例对亮度块1710及其邻近像素进行下采样。这里,“nS”表示正整数。具体地,采样单元1410基于下面的等式(1)和等式(2)来对恢复的亮度信号Rec_L进行下采样以产生下采样的亮度信号Rec_L’(x,y)。
根据等式(1),可根据色度样点的相对位置对当前块中存在的亮度像素和与当前块的左侧邻近的亮度像素进行精确的下采样。
Rec_L′(x,y)=(Rec_L(2x,2y)+Rec_L(2x,2y+1))>>1  (1)
其中,x=-1,…,nS-1,并且y=0,…,nS-1。
根据等式(2),在根据本发明的实施例的帧内预测方法中,仅通过使用当前块的第一上侧线中的像素来对与当前块的上侧邻近的亮度像素进行下采样,来将亮度像素的缓冲线的数量从二减少到一。
Rec_L′(x,y)=(Rec_L(2xx1,2y+1)+2*Rec_L(2x,2y+1)+Rec_L(2x+1,2y+1)+2)>>2  (2)
其中,x=-1,…,nS-1,并且y=-1。
如果在等式(2)中表示的低通滤波被跳过,则可使用等式REC_L'(x,y)=Rec_L(2x,2y+1)(x=0,...,nS-1,y=-1)来代替等式(2)。
假设在位置(x,y)的像素中,“x”的值为-1的像素是与当前块的左侧邻近的邻近像素,“y”的值为-1的像素是与当前块的上侧邻近的邻近像素。此外,假设在nS×nS的块中存在的像素中,最左上像素和最右下像素的坐标分别为(0,0)和(nS-1,nS-1)。
仅当使用4:2:2彩色格式或4:2:0彩色格式时,使用根据等式(1)或等式(2)被下采样的亮度信号Rec_L’(x,y)。如果使用4:4:4彩色格式,则可直接使用恢复的亮度信号Rec_L(x,y)来预测色度信号,并可跳过下采样处理。
在4:4:4彩色格式的情况下,U信号和V信号具有远低于Y信号的频带。因此,可对恢复的亮度信号另外执行低通滤波而不是下采样滤波来提高预测的效率。
图18a和图18b是示出根据本发明的实施例的获得表示亮度信号和色度信号之间的相关性的参数的处理和预测色度信号的处理的参考示图。
如上所述,在相应的亮度和色度像素之间存在相关性(例如,线性相关性)。参照图18a和图18b,如果在先前恢复的亮度块1820上的位置(x,y)的像素是Rec_L'(x,y),则图14的预测执行单元1430可基于亮度信号和色度信号之间的线性相关性,获得在色度块1810上的位置(x,y)的预测像素Pred_c(x,y)(如等式(3)所示)。
Pred_c(x,y)=a·Rec_L′(x,y)+b  (3)
其中,“a”指示表示权重的参数,“b”指示表示偏移的参数。可通过执行使用色度块1810的邻近像素Rec_c(i)1811和1812以及亮度块1821的邻近像素Rec_L'(i)1821和1822的操作,来计算参数a和b的值,如等式(4)和等式(5)所示。这里,i=0,…,2nS-1。
a = I · Σ i = 0 I - 1 Rec _ c ( i ) · Rec _ L ′ ( i ) - Σ i = 0 I - 1 Rec _ c ( i ) · Σ i = 0 I - 1 Rec _ L ′ ( i ) I · Σ i = 0 I - 1 Rec _ L ′ ( i ) · Re c _ L ′ ( i ) - ( Σ i = 0 I - 1 Rec _ L ′ ( i ) ) 2 = A 1 A 2 - - - ( 4 )
b = Σ i = 0 I - 1 Rec _ c ( i ) - a · Σ i = 0 I - 1 Rec _ L ′ ( i ) I - - - ( 5 )
其中,“I”表示与色度块1810或亮度块1820的上侧或左侧邻近的邻近像素的数量。参照图18a和图18b,如色度块1810和亮度块1820的尺寸均为nS×nS,则邻近像素的数量I是2nS。虽然图18a和图18b示出与当前块的上侧和左侧邻近的像素被用作邻近像素以获得参数a和b的情况,但是当在当前块被处理之前与当前块的右侧或下侧邻近的邻近像素已被恢复时,与当前块的右侧和下侧邻近的像素也可被用作邻近像素。邻近像素的数量I可以是2的幂次方,从而可执行移位运算来代替乘法或除法运算。通常,由于表示块尺寸的nS是2的幂次方,因此邻近像素的数量I也是2的幂次方。
可使用浮点运算以根据等式(4)来精确地计算参数a。然而,如果参数a是浮点数,则当使用等式(4)时应该执行浮点除法,从而增加了计算的复杂度。因此,为了防止比特溢出并且简化计算,图14的参数获得单元1420可通过根据作为等式(4)和等式(5)的修改的整数计算算法对参数a和b进行缩放来计算参数a’和b’。
具体地,为了避免浮点运算,代替根据等式(4)的参数a,如下定义参数a’,其中,参数a’是通过与na比特一样多地进行放大并进行四舍五入而获得的整数:
a &prime; = a &CenterDot; ( 1 < < n a ) = A 1 A 2 &CenterDot; ( 1 < < n a ) - - - ( 6 )
根据等式(6),通过执行左移位运算(<<)将参数a(浮点数)放大并四舍五入为参数a’(整数)。可考虑数据的精确性和计算的复杂度来设置na比特。例如,“na”可以是“13”。还可通过使用等式(6)的参数a’将参数b(根据等式(5)的浮点数)四舍五入为参数b’(整数)。如果使用修改的参数a’和b’,则可如下改变等式(3):
Pred_c(x,y)=(a′·Rec_L′(x,y)>>na)+b′  (7)
在等式(6)中表示的“A1/A2”应该被计算以基于等式(6)计算参数a’。可将通过将除了预定数量的高位比特之外的包括在A1和A2中的比特改变为“0”而获得的近似值A1’和A2’来分别代表值A1和A2。具体地说,可如下表示通过将除了值A1中包括的前nA1比特之外的比特改变为“0”而获得的近似值A1’和通过将除了值B1中包括的前nA2比特之外的比特改变为“0”而获得的近似值B1’:
A 1 &prime; = [ A 1 > > r A 1 ] &CenterDot; 2 r A 1 - - - ( 8 )
A 2 &prime; = [ A 2 > > r A 2 ] &CenterDot; 2 r A 2 - - - ( 9 )
在等式(8)中,“[]”表示floor运算,即,选择小于包括在[]中的值的最大整数的运算,rA1=max(bdepth(A1)-nA1,0)并且rA2=max(bdepth(A2)-nA2,0)。这里,“bdepth(A1)”和“bdepth(A2)”分别表示值A1的比特深度和值A2的比特深度。考虑防止比特溢出的发生以及当执行乘法运算时获得的比特的数量,来设置“nA1”。例如,“nA1”可以是“15”。“nA2”与将在下面描述的查找表的尺寸有关。例如,当查找表基于64个变量时,“nA2”可以是“6”。
图19示出根据本发明的实施例的获得近似值A2’的处理。参照图19,假设值A2具有比特深度27,并且总比特深度为“32”。如果nA2=6,则rA2=max(27-6,0)=21。此外,[A2>>21]可被计算为提取六个高位比特1910,例如,A2的值“101011”。如果计算[A2>>21]的结果被乘以2rA2(即,2rA2),则除了这六个高位比特之外的其余21个比特为“0”,从而获得近似值A2’。
当等式(8)和等式(9)被替换为等式(6)时,如下获得等式(10):
a &prime; &ap; [ A 1 > > r A 1 ] &CenterDot; 2 r A 1 [ A 2 > > r A 2 ] &CenterDot; 2 r A 2 &CenterDot; 2 n a = 2 n table &CenterDot; [ A 1 > > r A 1 ] &CenterDot; 2 r A 1 + n a [ A 2 > > r A 2 ] &CenterDot; 2 r A 2 + n table &ap; [ 2 n table A 2 > > r A 2 ] &CenterDot; [ A 1 > > r A 1 ] &CenterDot; 2 r A 1 + n a - ( r A 2 + n table ) - - - ( 10 )
其中,可考虑数据的精确性和计算的复杂度来确定“ntable”。例如,ntable可被设置为“15”。
在等式(10)中,
Figure BDA00003292443600261
包括除法运算。为了避免除法运算,计算
Figure BDA00003292443600262
的结果可被代替地存储在查找表中。因此,可基于查找表,根据等式(10)计算参数a’。如果如上使用查找表,则可通过仅使用根据等式(10)的乘法运算和移位运算而不必执行除法运算来计算参数a’。
图20是示出根据本发明的实施例的查找表的参考示图。
如果nA2=6,则
Figure BDA00003292443600263
的情况的数量等于值A2的六个高位比特的情况的数量。换句话说,2^(nA2)=2^6,并且可基于包括总共64个元素的查找表来确定
Figure BDA00003292443600264
。因此,图14的参数获得单元1420可基于查找表获得值
Figure BDA00003292443600265
,其中,查找表存储与如图20所示的64个变量相应的
Figure BDA00003292443600266
的各种可能的值,参数a2的六个高位比特可具有所述各种可能的值。在获得值
Figure BDA00003292443600267
之后,参数获得单元1420可基于等式(10),通过仅使用乘法运算和移位运算来计算参数a’。
此外,参数获得单元1420可如下通过使用计算的参数a’来计算参数b’:
b &prime; = &Sigma; i = 0 I - 1 Rec _ c ( i ) - ( a &prime; &CenterDot; ( &Sigma; i = 0 I - 1 Rec _ L &prime; ( i ) ) > > n a ) I - - - ( 11 )
当在等式(11)中表示的邻近像素的数量“I”是2的幂次方时,可不必执行除法运算来执行基于等式(11)的参数b’的计算。如果由于与当前像素的左上侧或右上侧邻近的像素被用作不同于图18A和图18B中的邻近像素,因此邻近像素的数量“I”不是2的幂次方,则“1/I”可被存储在查找表中,可通过将等式(11)中的分子乘以存储在查找表中的“1/I”来计算参数b’。
基于等式(10)的参数a’可被缩减,从而可在预定比特范围内执行包括在等式(7)中的乘法运算。例如,如果使用16个比特来执行等式(7)中的乘法运算,则参数a’被缩减在[-2-15,215-1]的范围内。如果na是“13”,则参数a的实际值被限制在[-4,4)的范围内,从而防止误差的放大。
当基于等式(10)计算参数a’时,参数获得单元1420可不将“na”确定为常数,并可将“na”确定为适应于值A1和A2,从而减少舍入误差。例如,可如下获得na
na=rA2+ntable-rA1    (12)
当等式(12)被代入等式(10)时,如下获得等式(13):
a &prime; &ap; [ 2 n table A 2 > > r A 2 ] &CenterDot; [ A 1 > > r A 1 ] - - - ( 13 )
参数a’的比特深度可被调整为将参数a’保持为预定比特。例如,如果用于将参数a’的比特深度调整为将参数a’的比特深度保持为多个比特a_bits的变量bitAdjust被表示为等式:bitAdjust=max(0,bdepth(abs(a'))-(a_bits-1)),则参数获得单元1420通过使用等式:a'=a'>>bitAdjust来减少参数a’的比特深度。a_bits的值可被设置为“7”或“8”,从而参数a’可被保持为少于8个比特。如果在等式(14)中表示的“na”代替等式(12)中的“na”被应用到等式(7),则可减少当在预定比特范围内保持参数a’的同时参数a’被四舍五入时发生的误差。
na=rA2+ntable-rA1-bitAdjust    (14)
如上所述,参数获得单元1420可基于等式(10)或等式(11)获得定义亮度信号和色度信号之间的相关性的参数a’和b’。在获得参数a’和b’之后,图14的预测执行单元1430基于等式(7)从恢复的与色度像素相应的亮度像素产生色度像素的预测值。
同时,可如下表示等式(4):
a = A 1 A 2 = I &CenterDot; CL - C &CenterDot; L I &CenterDot; LL - L &CenterDot; L - - - ( 15 )
可如下计算等式(15)中表示的“CL”、“C”、“L”和“LL”:
CL = &Sigma; i = 0 I - 1 Rec _ c ( i ) &CenterDot; Rec _ L &prime; ( i ) C = &Sigma; i = 0 I - 1 Rec _ c ( i ) LL = &Sigma; i = 0 I - 1 Rec _ L &prime; ( i ) &CenterDot; Rec _ L &prime; ( i ) L = &Sigma; i = 0 I - 1 Rec _ L &prime; ( i ) - - - ( 16 )
为了防止当根据等式(15)计算参数a时发生比特溢出,参数获得单元1420执行缩小以减少“CL”、“C”、“L”和“LL”中的每个的比特的数量。
例如,如果例如样点Rec_L'(i)和Rec_c(i)的比特的数量均被定义为“ns”,则可如下计算值A1和A2的每个值的最大比特数bitsmax
bitsmax=(ns+bdepth(I))·2+1   (17)
为了将最大比特数bitsmax保持为预定A比特,值A1和A2的每个值的比特深度可减少多个比特,减少的比特数大于A比特的数量。这里,“A”表示整数。例如,如果A=32,则可如下定义比特调整参数bitAdjustA
bitAdjustA=max(bitsmax-22,0)    (18)
参数获得单元1420如下基于等式18来对值A1和A2进行缩放:
A1=I·[CL>>bitAdjustA]-[L>>bitAdjustA/2]·[C>>bitAdjustA/2]
A2=I·[LL>>bitAdjustA]-[L>>bitAdjustA/2][L>>bitAdjustA/2]   (19)
如果邻近像素的数量I是2的幂次方,则比特调整参数bitAdjustA可如下被重新定义为比特调整参数bitAdjust2A
bitAdjust2A=(bitAdjustA+1)/2   (20)
在计算值A1和A2之前,参数获得单元1420可如下通过使用比特调整参数bitAdjust2A来对“CL”、“C”、“LL”、“L”和“I”进行缩小:
CL=[CL>>bitAdjust2A]
C=[C>>bitAdjust2A]
LL=[LL>>bitAdjust2A]
L=[L>>bitAdjust2A]
I=[I>>bitAdjust2A]
                     (21)
如上所述,根据本发明的实施例,为了防止比特溢出的发生,参数获得单元1420可通过考虑值A1和A2的范围并根据等式(21)对用于计算值A1和A2的“CL”、“C”、“LL”、“L”和“I”进行缩小,减少值A和B的比特深度。
根据本发明的另一实施例,参数获得单元1420如下基于值nS和样点Rec_C(i)的比特深度BitDepthC来计算参数k3,其中,值nS定义图18A和图18B的色度块1810和亮度块1820的尺寸:
k3=Max(0,BitDepthC+log2(nS)-14)    (22)
为了防止在值A1和A2的计算期间发生比特溢出,参数获得单元1420如下对“CL”、“C”、“LL”和“L”进行缩小:
CL=CL>>k3
C=C>>k3
LL=LL>>k3
L=L>>k3    (23)
此外,参数获得单元1420如下基于参数k3和值nS来获得参数k2:
k2=log2((1*nS)>>k3)    (24)
此外,参数获得单元1420可如下通过使用根据等式(23)进行缩小的“CL”、“C”、“LL”和“L”和根据等式(24)的参数k2来获得值A1和A2:
A1=(LC<<k2)-L*C
A2=(LL<<k2)-L*L    (25)
参数获得单元1420可如下通过对值A1和A2进行缩小来计算A1’和A2’,从而可在预定比特范围内表示值A1和A2:A1′=A1>>Max(0,log2(abs(A1))-14)
A2′=abs(A2>>Max(0,log2(abs(A2))-5))    (26)
在如上获得值A1’和A2’之后,参数获得单元1420通过使用以下的算法获得定义亮度信号和色度信号之间的线性相关性的权重a和偏移b:
{
k1=Max(0,log2(abs(A2)-5-Max(0,log2(abs(A1)-14+2;
a=A2'<1?0:Clip3(-215,215-1,A1'*lmDiv+1<<(k1-1)>>k1;
a=a>>Max(0,log2(abs(a))-6;
k=13-Max(0,log2(abs(a))-6;
b=(L-((a*C)>>k1+1<<(k2-1))>>k2;
}
在上面的算法中,可以以这样的方式确定所有常数:可使用7比特数量来表示权重a,并且“lmDiv”表示基于根据等式(25)的值A2’确定的值。
根据本发明的另一实施例,当根据上面的算法确定权重a和偏移b时,预测执行单元1430如下获得与恢复的亮度信号Rec_L'(x,y)相应的色度信号的预测值Pred_C(x,y):
Pred_C(x,y)=(a·Rec_L′(x,y))>>k)+b   (27)
预测执行单元1430可考虑色度信号的比特深度,根据等式(27)对色度信号的预测值Pred_C(x,y)进行缩减,从而预测值Pred_C(x,y)可落入色度信号可具有的值的范围内。
图21是示出根据本发明的实施例的帧内预测方法的流程图。参照图14和图21,在操作2110,如果色度块和亮度块的尺寸不同,则采样单元1410通过对恢复的亮度块及其邻近像素进行采样来对亮度信号执行采样,从而色度信号和亮度信号的强度可彼此相等。如描述的,可在亮度信号和色度信号的强度彼此不相等的4:2:0或4:2:2的彩色格式中执行采样,并且可在4:4:4的彩色格式中跳过采样。
在操作2120,参数获得单元1420基于将被帧内预测的色度块的恢复的邻近像素以及与所述色度块相应的亮度块的恢复的邻近像素,来获得表示色度块和亮度块之间的相关性的参数。如上所述,参数获得单元1420可基于色度块的恢复的邻近像素和亮度块的恢复的邻近像素,根据等式(4)和等式(5)来计算权重a和偏移b。具体地说,参数获得单元1420可改变权重a和偏移b的比特深度以增加数据的精确度并防止在计算期间发生比特溢出。此外,参数获得单元1420可对用于计算权重a和偏移b的变量或代替所述变量的近似值,从而可通过仅使用乘法、减法和移位运算而不必执行除法运算来计算权重a和偏移b。
在操作2130,预测执行单元1430基于所述参数从亮度块预测色度块。如上所述,预测执行单元1430可根据等式(3)从恢复的亮度信号预测相应色度信号。可选地,预测执行单元1430可通过根据等式(7)对权重a和偏移b进行放大以执行整数运算而非浮点运算,来预测色度块。
本发明可被实现为在计算机可读介质中的计算可读代码。这里,计算可读介质可以是任何能够存储由计算机***读取的数据的记录设备,例如,只读存储器(ROM)、随机存取存储器(RAM)、光盘(CD)-ROM、磁带、软盘、光学数据存储装置等。计算机可读介质可分布在通过网络互联的计算机***中,本发明可被存储并执行为分布式***中的计算机可读代码。
虽然已参照本发明的示例性实施例具体示出并描述了本发明,但是本领域的普通技术人员将理解,在不脱离由权利要求限定的本发明的精神和范围的情况下可对此进行形式和细节上的各种改变。

Claims (15)

1.一种对图像进行帧内预测的方法,所述方法包括:
基于将被帧内预测的色度块的恢复的邻近像素和与所述色度块相应的亮度像素的恢复的邻近像素,获得表示所述色度块和亮度块之间的相关性的参数;
通过使用所述参数来从所述亮度块预测所述色度块;
其中,获得所述参数的步骤包括:对所述色度块的恢复的邻近像素和所述亮度块的恢复的邻近像素执行预定操作,
其中,预定操作包括改变所述参数的比特深度以减小查找表的尺寸并防止溢出的发生的自适应缩放处理。
2.如权利要求1所述的方法,其中,所述参数包括定义所述亮度块的恢复的像素和与所述亮度块的恢复的像素相应的色度块的像素之间的线性相关性的权重和偏移。
3.如权利要求2所述的方法,其中,如果在亮度块上的位置(x,y)存在的恢复的像素是Rec_L'(x,y),在色度块上的位置(x,y)存在的恢复的像素是Pred_C(x,y),权重是a,偏移是b,则通过Pred_C(x,y)=a×Rec_L'(x,y)+b来定义相关性。
4.如权利要求3所述的方法,其中,如果亮度块的I个恢复的邻近像素是Rec_L'(i),色度块的I个恢复的邻近像素是Rec_C(i),则通过下面的等式确定权重a:
a = I &CenterDot; &Sigma; i = 0 I - 1 Rec _ c ( i ) &CenterDot; Rec _ L &prime; ( i ) - &Sigma; i = 0 I - 1 Rec _ c ( i ) &CenterDot; &Sigma; i = 0 I - 1 Rec _ L &prime; ( i ) I &CenterDot; &Sigma; i = 0 I - 1 Rec _ L &prime; ( i ) &CenterDot; Rec _ L &prime; ( i ) - ( &Sigma; i = 0 I - 1 Rec _ L &prime; ( i ) ) 2 = A 1 A 2 ,
其中,“i”表示范围从“0”到(I-1)的整数。
5.如权利要求4所述的方法,其中,通过下面的等式确定偏移b:
b = &Sigma; i = 0 I - 1 Rec _ c ( i ) - a &CenterDot; &Sigma; i = 0 I - 1 Rec _ L &prime; ( i ) I .
6.如权利要求4所述的方法,还包括:
通过使用预定数量的高位比特分别逼近值A1和A2来计算估计值A1’和A2’;
基于估计值A1’和A2’,通过将权重a放大预定na比特来计算整数a’。
7.如权利要求6的方法,其中,如果nA1表示从值A1提取的高位比特的数量,nA2表示从值A2提取的高位比特的数量,rA1=max(bdepth(A1)-nA1,0),rA2=max(bdepth(A2)-nA2,0),bdepth(A1)表示值A1的比特深度,bdepth(A2)表示值A2的比特深度,ntable表示预定常数,则通过
Figure FDA00003292443500021
确定估计值A1’,
通过
Figure FDA00003292443500022
确定估计值A2’,通过 a &prime; &ap; [ 2 n table A 2 > > r A 2 ] &CenterDot; [ A 1 > > r A 1 ] &CenterDot; 2 r A 1 + n a - ( r A 2 + n table ) 确定整数a’。
8.如权利要求7所述方法,其中,从预定查找表获得计算
Figure FDA00003292443500024
的结果。
9.如权利要求4所述的方法,其中,基于通过分别将在下面的等式中定义的CL、C、LL和L缩小预定比特而获得的值,计算权重a:
CL = &Sigma; i = 0 I - 1 Rec _ c ( i ) &CenterDot; Rec _ L &prime; ( i ) C = &Sigma; i = 0 I - 1 Rec _ c ( i ) LL = &Sigma; i = 0 I - 1 Rec _ L &prime; ( i ) &CenterDot; Rec _ L &prime; ( i ) L = &Sigma; i = 0 I - 1 Rec _ L &prime; ( i ) .
10.如权利要求9所述的方法,其中,如果色度块的尺寸是nS×nS,色度像素的比特深度是BitDepthC,则通过将CL、C、LL和L缩小通过下面的等式定义的k3比特来减少CL、C、LL和L的比特深度:
k3=Max(0,BitDepthC+log2(nS)-14),
其中,nS表示正整数。
11.如权利要求10所述的方法,如果k2是通过k2=log2((2*ns)>>k3)定义 A 1 = ( LC < < k 2 ) - L * C A 2 = ( LL < < k 2 ) - L * L . 包括:通过下面的等式计算值A1和A2:
12.如权利要求11所述的方法,还包括:通过基于值A1和A2的绝对值分别将值A1和A2缩小预定比特来计算估计值A1’和A2’,
其中,通过下面的算法确定权重a和偏移b:
{
k1=Max(0,log2(abs(A2)-5-Max(0,log2(abs(A1)-14+2;
a=A2'<1?0:Clip3(-215,215-1,A1'*lmDiv+1<<(k1-1)>>k1;
a=a>>Max(0,log2(abs(a))-6;
k=13-Max(0,log2(abs(a))-6;
b=(L-((a*C)>>k1+1<<(k2-1))>>k2;
}。
13.如权利要求3所述的方法,其中,预测色度块的步骤:根据下面的等式,通过使用由将权重a放大预定na比特而获得的整数a’和由对偏移b进行四舍五入而获得的整数b’,对在色度块上的位置(x,y)的预测值Pred_C(x,y)进行预测:
Pred_c(x,y)=(a′·Rec_L′(x,y)>>na)+b′。
14.如权利要求13所述的方法,还包括:将预测值Pred_C(x,y)缩减到在色度块的像素的值的范围内。
15.如权利要求1所述的方法,如果色度块和亮度块的尺寸不同,则对恢复的亮度块及其邻近像素进行采样,以使色度信号的尺寸和亮度信号的尺寸彼此相等。
CN2011800582740A 2010-10-01 2011-09-30 图像帧内预测方法和设备 Pending CN103238334A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US38875910P 2010-10-01 2010-10-01
US61/388,759 2010-10-01
PCT/KR2011/007280 WO2012044126A2 (ko) 2010-10-01 2011-09-30 영상의 인트라 예측 방법 및 장치

Publications (1)

Publication Number Publication Date
CN103238334A true CN103238334A (zh) 2013-08-07

Family

ID=45893704

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011800582740A Pending CN103238334A (zh) 2010-10-01 2011-09-30 图像帧内预测方法和设备

Country Status (11)

Country Link
US (1) US9661337B2 (zh)
EP (1) EP2624568A4 (zh)
JP (1) JP2013542667A (zh)
CN (1) CN103238334A (zh)
AU (1) AU2011308105A1 (zh)
BR (1) BR112013007782A2 (zh)
CA (1) CA2813191A1 (zh)
MX (1) MX2013003679A (zh)
RU (1) RU2013120307A (zh)
SG (2) SG10201401182TA (zh)
WO (1) WO2012044126A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107852512A (zh) * 2015-06-07 2018-03-27 夏普株式会社 基于亮度转换函数或视频色彩分量值的优化视频编码的***及方法
CN111327903A (zh) * 2018-12-13 2020-06-23 华为技术有限公司 色度块的预测方法和装置
CN113812159A (zh) * 2019-05-14 2021-12-17 北京字节跳动网络技术有限公司 视频编解码中的缩放方法

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2933424T3 (es) 2011-03-06 2023-02-08 Lg Electronics Inc Método de predicción intra para bloques de crominancia
JP5890520B2 (ja) * 2011-06-28 2016-03-22 サムスン エレクトロニクス カンパニー リミテッド 画像の輝度成分を用いて画像の色差成分を予測する方法及び予測装置
GB2495941B (en) * 2011-10-25 2015-07-08 Canon Kk Method and apparatus for processing components of an image
WO2013155662A1 (en) 2012-04-16 2013-10-24 Mediatek Singapore Pte. Ltd. Methods and apparatuses of simplification for intra chroma lm mode
WO2014051080A1 (ja) * 2012-09-28 2014-04-03 三菱電機株式会社 カラー動画像符号化装置、カラー動画像復号装置、カラー動画像符号化方法及びカラー動画像復号方法
CN109379600B (zh) * 2013-03-29 2023-04-11 Jvc 建伍株式会社 图像解码装置以及图像解码方法
KR101530774B1 (ko) * 2013-09-30 2015-06-22 연세대학교 산학협력단 영상 부호화 및 복호화 방법, 장치 및 시스템
KR101530782B1 (ko) 2013-12-03 2015-06-22 연세대학교 산학협력단 영상 부호화 및 복호화 방법, 장치 및 시스템
WO2015139203A1 (en) * 2014-03-18 2015-09-24 Mediatek Singapore Pte. Ltd. Dlt signaling in 3d video coding
US10484712B2 (en) * 2016-06-08 2019-11-19 Qualcomm Incorporated Implicit coding of reference line index used in intra prediction
WO2018131838A1 (ko) * 2017-01-11 2018-07-19 엘지전자 주식회사 영상 코딩 시스템에서 인트라 예측에 따른 영상 디코딩 방법 및 장치
CN117176958A (zh) * 2017-11-28 2023-12-05 Lx 半导体科技有限公司 图像编码/解码方法、图像数据的传输方法和存储介质
CN113273213A (zh) * 2018-12-31 2021-08-17 韩国电子通信研究院 图像编码/解码方法和设备以及存储比特流的记录介质
US11863754B2 (en) 2019-05-15 2024-01-02 Hyundai Motor Company Method and for reconstructing chroma block and video decoding apparatus

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101099295A (zh) * 2004-03-09 2008-01-02 汤姆森许可贸易公司 自适应比特恢复装置
US20080056355A1 (en) * 2006-08-30 2008-03-06 Jiun-In Guo Method for reducing computational complexity of video compression standard

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6757429B2 (en) 2001-02-21 2004-06-29 Boly Media Communications Inc. Method of compressing digital images
BRPI0304545B1 (pt) 2002-01-14 2018-07-03 Nokia Technologies Oy Método de codificação das imagens em uma seqüência de vídeo digital para fornecer os dados de vídeo codificados, codificador de vídeo, método de decodificação dos dados indicativos de uma sequência de vídeo digital, decodificador de vídeo, e, sistema de codificação de vídeo
CN1232126C (zh) * 2002-09-30 2005-12-14 三星电子株式会社 图像编码方法和装置以及图像解码方法和装置
US7136533B2 (en) 2002-12-19 2006-11-14 Hewlett-Packard Development Company, L.P. Color image compression with adaptive prediction
US7646815B2 (en) 2003-07-15 2010-01-12 Lsi Corporation Intra estimation chroma mode 0 sub-block dependent prediction
US7317839B2 (en) * 2003-09-07 2008-01-08 Microsoft Corporation Chroma motion vector derivation for interlaced forward-predicted fields
KR101246915B1 (ko) * 2005-04-18 2013-03-25 삼성전자주식회사 동영상 부호화 또는 복호화 방법 및 장치
US20060291565A1 (en) * 2005-06-22 2006-12-28 Chen Eddie Y System and method for performing video block prediction
KR20070077609A (ko) 2006-01-24 2007-07-27 삼성전자주식회사 인트라 예측 모드 결정 방법 및 장치
KR101257942B1 (ko) * 2008-04-23 2013-04-23 고려대학교 산학협력단 광역 역광보정 영상처리에서의 전처리 방법 및 장치
KR101601840B1 (ko) 2009-02-23 2016-03-22 에스케이 텔레콤주식회사 채널 상관 관계를 이용한 영상 부호화/복호화 장치 및 방법과 그를 위한 컴퓨터로 읽을 수 있는 기록매체
JP5818800B2 (ja) * 2009-10-05 2015-11-18 トムソン ライセンシングThomson Licensing 符号化方法及び復号化方法
KR101503269B1 (ko) * 2010-04-05 2015-03-17 삼성전자주식회사 영상 부호화 단위에 대한 인트라 예측 모드 결정 방법 및 장치, 및 영상 복호화 단위에 대한 인트라 예측 모드 결정 방법 및 장치
CN105611304B (zh) * 2010-04-09 2019-06-11 Lg电子株式会社 处理视频数据的方法和装置
KR101530782B1 (ko) * 2013-12-03 2015-06-22 연세대학교 산학협력단 영상 부호화 및 복호화 방법, 장치 및 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101099295A (zh) * 2004-03-09 2008-01-02 汤姆森许可贸易公司 自适应比特恢复装置
US20080056355A1 (en) * 2006-08-30 2008-03-06 Jiun-In Guo Method for reducing computational complexity of video compression standard

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JUNGSUN KIM: "New intra chroma prediction using channel correlation", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107852512A (zh) * 2015-06-07 2018-03-27 夏普株式会社 基于亮度转换函数或视频色彩分量值的优化视频编码的***及方法
CN111327903A (zh) * 2018-12-13 2020-06-23 华为技术有限公司 色度块的预测方法和装置
CN111327903B (zh) * 2018-12-13 2023-05-16 华为技术有限公司 色度块的预测方法和装置
CN113812159A (zh) * 2019-05-14 2021-12-17 北京字节跳动网络技术有限公司 视频编解码中的缩放方法

Also Published As

Publication number Publication date
SG189184A1 (en) 2013-05-31
RU2013120307A (ru) 2014-11-20
US20130182761A1 (en) 2013-07-18
BR112013007782A2 (pt) 2016-06-07
SG10201401182TA (en) 2014-07-30
AU2011308105A1 (en) 2013-05-02
EP2624568A4 (en) 2014-10-15
JP2013542667A (ja) 2013-11-21
WO2012044126A2 (ko) 2012-04-05
EP2624568A2 (en) 2013-08-07
CA2813191A1 (en) 2012-04-05
WO2012044126A3 (ko) 2012-05-31
MX2013003679A (es) 2013-08-12
US9661337B2 (en) 2017-05-23

Similar Documents

Publication Publication Date Title
CN103238334A (zh) 图像帧内预测方法和设备
CN103782596A (zh) 使用图像的亮度分量的对图像的色度分量的预测方法和设备
CN102474599B (zh) 用于对图像进行编码的方法和设备,用于对编码图像进行解码的方法和设备
CN102934443B (zh) 用于对视频进行编码和解码的方法和设备
CN102484704B (zh) 对视频编码的方法和设备以及对视频解码的方法和设备
CN103765901A (zh) 用于使用帧内预测进行图像编码和解码的方法和设备
CN102934446A (zh) 确定图像编码单元和图像解码单元的帧内预测模式
CN103392341A (zh) 用于对图像预测单元的帧内预测模式进行编码的方法和装置,以及用于对图像预测单元的帧内预测模式进行解码的方法和装置
CN102474609B (zh) 对图像编码的方法和设备及对图像解码的方法和设备
CN102934444A (zh) 用于对视频进行编码的方法和设备以及用于对视频进行解码的方法和设备
CN102474615B (zh) 使用自适应环路滤波的视频编码和解码方法以及视频编码和解码装置
CN103188496B (zh) 基于运动矢量分布预测的快速运动估计视频编码方法
CN102939753A (zh) 用于通过根据像素组补偿像素值来对视频进行编码的方法和设备以及用于通过根据像素组补偿像素值来对视频进行解码的方法和设备
CN104980745A (zh) 通过使用去块滤波对视频进行解码的方法和设备
CN103248895B (zh) 一种用于hevc帧内编码的快速模式估计方法
CN103220522A (zh) 对视频编码的方法和设备及对视频解码的方法和设备
CN104094600A (zh) 用于包括量化参数预测的基于分层数据单元的视频编码和解码的方法和设备
CN101507277A (zh) 图像编码/解码方法和设备
CN104322067A (zh) 基于树结构的编码单元对可伸缩视频进行编码的方法和装置以及基于树结构的编码单元对可伸缩视频进行解码的方法和装置
CN103119935A (zh) 图像插值方法和设备
CN107318016A (zh) 一种基于零块分布的hevc帧间预测模式快速判定方法
CN102934445B (zh) 基于分段对图像编码和解码的方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130807