CN103703780A - 运动图像解码方法及图像编码方法 - Google Patents

运动图像解码方法及图像编码方法 Download PDF

Info

Publication number
CN103703780A
CN103703780A CN201180072475.6A CN201180072475A CN103703780A CN 103703780 A CN103703780 A CN 103703780A CN 201180072475 A CN201180072475 A CN 201180072475A CN 103703780 A CN103703780 A CN 103703780A
Authority
CN
China
Prior art keywords
coding units
mentioned
predicted picture
prediction
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201180072475.6A
Other languages
English (en)
Other versions
CN103703780B (zh
Inventor
横山彻
村上智一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to CN201611010982.8A priority Critical patent/CN107071406B/zh
Publication of CN103703780A publication Critical patent/CN103703780A/zh
Application granted granted Critical
Publication of CN103703780B publication Critical patent/CN103703780B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

为了降低伴随着作为编码单位的块的扩大·缩小的图像编码的压缩率,可以使用以比编码对象的宏块尺寸大的尺寸所预测的预测图像的一部分来作为编码对象的宏块的预测图像。

Description

运动图像解码方法及图像编码方法
技术领域
本发明涉及运动图像信号的编码技术。
背景技术
在以ITU-T H.264为代表的运动图像编码方式中,将画面整体划分为16像素×16像素的称之为宏块的编码单位而进行编码。
在H.264中,对于编码对象的宏块,使用周边的像素及前后的图片(picture)决定对象宏块内的像素值的预测值,将编码对象像素与预测值的预测误差进行熵编码。
在上述宏块内的像素值的预测时,根据宏块内的图案,可以按照宏块选择根据周边像素预测的帧内预测、和根据前后的图片(picture)的像素预测的帧间预测。此外,可以分割为比16像素×16像素小的预测块而进行预测。
例如如图2所示,在H.264的帧内预测中,将16像素×16像素的宏块分割为16个4像素×4像素的预测块、对各个预测块以图2的索引0到8表示的9种朝向来复制周边像素,从而能够预测预测块内的像素。此外,如图3所示,通过不将宏块分割、而用16像素×16像素的预测块以该图中由索引0到3表示的4种朝向复制周边像素,能够预测预测块内的像素。
此外,关于H.264的帧间预测也同样,可以在宏块内分割为更小的预测块而对各个预测块设定运动矢量。例如如图4所示,在预测从过去的图片(picture)的运动的情况下,可以分割为16像素×16像素、16像素×8像素、8像素×16像素、8像素×8像素(在此情况下,可以再将各个预测块分割为8像素×4像素、4像素×8像素、4像素×4像素)的预测块,对这里的预测块分别设定不同的运动矢量。
通过如上述那样将宏块的内部分割为预测块、分别进行预测,当宏块内有不同的图案的边界时等,预测精度提高,带来压缩率的提高。
但是,在以H.264为代表的以往技术中,宏块的尺寸都限定为16像素×16像素,不能以比其大的单位或小的单位进行预测。
此外,由于帧内预测还是帧间预测的选择仅能够以宏块单位设定,所以仅能够以比16像素×16像素小的单位进行选择。
鉴于这样的问题,专利文献1能够将16像素×16像素的块按照4叉树构造(日文:4分木構造)分割为8像素×8像素、4像素×4像素、2像素×2像素的某种,能够根据这些块尺寸变更预测模式(专利文献1)。
在先技术文献
专利文献
专利文献1:特表2007-503784
发明的概要
发明所要解决的技术课题
在专利文献1所记载的运动图像编码技术中,在将编码单位块分割的情况下,进行以分割后的宏块为编码单位的预测处理。因此,如果根据4叉树构造的分割宏块的个数增加,则相应地预测信息的代码量增大,压缩率下降。
发明内容
本发明是鉴于这样的状况而做出的,目的是提供一种削减用来记述宏块的预测信息的信息量的技术。
解决课题所采用的技术手段
在说明达到上述目的的手段之前,进行用语的定义。在本说明书中,为了与以往技术(H264AVC等)的宏块区别而将能够进行预测模式的选择的块尺寸可变的块记作CU(Coding Unit,编码单元)。
作为用来达成上述课题的技术手段,通过以下这样达成:在编码侧对某个编码对象的CU进行预测处理时,能够选择是原样使用比编码对象CU大的上位的CU(以下记作母CU)的预测图像的一部分、还是对该编码对象CU分别进行预测处理。
并且,通过以下这样达成:将表示选择哪种的标志信息保存到编码流中,在解码侧,通过读取标志信息,在对某个编码对象的CU进行预测处理时,选择是原样使用比编码对象CU大的上位的CU(以下记作母CU)的预测图像的一部分、还是对该编码对象CU分别进行预测处理。
例如,在以往技术中,在将编码对象CU分割为CU1~CU4、但仅CU1预测误差较小、CU2~4的预测精度较低的情况下,使用CU的预测结果生成CU的预测图像,将作为CU的预测图像的一部分、相当于CU1的区域的图像抽取作为预测图像。通过这样,由于不再需要对于编码对象CU2~4的预测处理的信息,所以能够削减信息量。
在以往的技术中,在进行使用编码对象CU的编码的情况下,由于没有生成母CU的编码数据,所以即使是编码对象CU只要仅1个另外预测就可以的图像,也以各个CU单位进行预测。但是,如果如上述那样使用上位的CU的预测图像的一部分,则能够削减记述CU的预测处理的信息量,使压缩率提高。
发明效果
根据本发明,在预测单位块的尺寸有多个、采用可变的CU的图像编码·解码方法中,通过削减记述CU的预测处理的信息量,能够使压缩率提高。
附图说明
图1是表示实施例1的图像编码装置的概略结构的图。
图2是用来说明以往技术的帧内预测处理的一例的图。
图3是用来说明以往技术的帧内预测处理的一例的图。
图4是用来说明以往技术的帧间预测处理的一例的图。
图5是用来说明CU分割的概念的图。
图6是用来说明4叉树构造的CU分割的一例的图。
图7是用来说明以往技术的CU分割的编码流内的句法的一例的图。
图8是用来说明本发明为有效的一例的图。
图9是用来说明实施例1的CU分割的一例的图。
图10是用来说明实施例1的CU分割的编码流内的句法的一例的图。
图11是用来说明实施例1的CU分割时的预测图像的合成的一例的图。
图12是用来说明实施例1的CU分割时的预测图像的合成的另一例的图。
图13是在实施例1的CU分割时的预测图像的合成处理中、用来说明帧内预测时的处理的图。
图14是表示实施例1的预测模式决定部的概略结构的图。
图15是表示实施例1的图像解码装置的概略结构的图。
图16是表示实施例1的预测选择部的概略结构的图。
具体实施方式
本发明当进行伴随着编码单位块(以下记作CU,Coding Unit)的扩大或缩小的编码时,通过将分割后的CU的预测处理使用分割前的母CU的预测图像,从而省略分割后的CU的预测处理,由此削减预测信息量。
以下,参照附图对实施例进行说明。但是,应注意本实施例不过是用来实现本发明的一例,不是限定本发明的技术范围的。此外,在各图中对于共通的结构赋予相同的标号。
实施例1
<图像编码装置的构成>
图1是表示实施例1的图像编码装置的概略结构的图。
在图1中,图像编码装置具有:CU分割部100,用于决定CU尺寸;差分器102,用于生成预测图像保存部107中所保存的预测图像与输入图像114的预测差分图像;变换部102,将上述预测差分图像进行DCT等的正交变换;量化部103,将变换后的信号量化;以及可变长编码部104,将量化后的信号编码,该图像编码装置将编码流115输出。
本实施例的运动图像编码装置为了生成上述预测图像而具有两套预测处理***。第1***是基于帧间预测的,为了得到用于下个输入图像的参照图像,具有:逆量化部109,用于将由量化部103输出的量化信号逆量化;逆变换部108,将逆量化信号逆变换而得到预测差分图像;加法器111,将逆变换后的预测差分图像与来自预测图像保存部107的预测图像相加;以及解块处理部112,得到从相加后的图像除去块噪声后的参照图像。并且,具有保存得到的参照图像的参照图像保存部113、以及进行参照图像与输入图像114之间的运动预测的帧间预测部106。第2***是基于帧内预测的,具有根据输入图像114进行画面内预测的帧内预测部105。
预测模式决定部110的处理在后面叙述,使用上述两套预测处理***,即,使用来自帧间预测部106的帧间预测图像及来自帧内预测部105的画面内预测图像,决定被推测为预测效率最高的预测处理。这里,作为预测效率的指标,可以举出例如预测误差能量等,但作为其他指标,也可以考虑与附近的CU的预测方式(画面间预测还是画面内预测)的类似性等而选择预测图像(即预测方式)。
将用所决定的预测方法得到的预测图像保存到预测图像保存部113中,用于生成与输入图像114的预测差分图像。另外,将关于由预测模式决定部110选择的预测模式(即,帧间预测还是帧内预测、以及各自的情况下的预测单位块的尺寸)的信息向可变长编码部104发送,保存到编码流115的一部分中。
在本实施例中,在由预测模式决定部110决定的预测处理方面具有特征,但在预测处理的决定时,由于CU的分割模式是相关联的,所以以下对CU分割部的处理内容进行说明。
<CU分割部的处理内容(编码侧)>
以下,参照附图,对CU分割部100的处理内容详细地说明。
图5是说明CU的概念的图。在本实施例中,将与以往技术的宏块对应的编码处理单位块记作CU(Coding Unit)。在本实施例中对于CU假定以下这样的性质。但是,本实施例的应用并不限定于本假定。
(1)CU是正方形
(2)CU的最大尺寸和最小尺寸记载在编码流中、或被作为规格定义
(3)通过4叉树构造从最大CU到子CU分割层级地4分割
在图5中,将最大尺寸的CU记作LCU(Largest Coding Unit,最大编码单元),将其尺寸(LCU的纵或横向的像素数)记作LCU size。另外,在本实施例中,LCU size设想为2的幂乘,但并不将本实施例的应用限定于2的幂乘。
如图5所示,将一个图片用LCU单位分割。将连续的LCU的集合定义为片段(slice)。该概念相当于以往技术的宏块。将各个LCU通过4叉树构造层级地4分割。
图6是表示由4叉树构造构成的CU分割的一例的图。如该图所示,LCU被分割为4个CU0、CU1、CU2、CU3。CU0不分割而最终确定为CU。CU1被4分割为CU10、CU11、CU12、CU13,CU2被4分割为CU20、CU21、CU22、CU23,CU3被4分割为CU30、CU31、CU32、CU33。在它们之中,CU11再被4分割为CU110、CU111、CU112、CU113,CU12被4分割为CU120、CU121、CU122、CU123,CU30被4分割为CU300、CU301、CU302、CU303,这些以外的CU最终被确定为CU。这样,从LCU层级地4分割,能够进行分割直到CU的尺寸成为最小尺寸。另外,在本说明书中,将分割CU1得到的CU10、CU11、CU12、CU13记作CU1的子CU。相反,将CU1记作CU10、CU11、CU12、CU13的母CU。
另外,所谓CU,是表示编码单位的,严格地讲是按照该CU进行预测处理和变换处理的,但在本说明书中记作母CU的情况下,附记为对于该CU根据需要而仅进行预测处理,不进行变换处理。
在上述4叉树构造的情况下,在最大尺寸/最小尺寸的比是2^N(2的N次幂)的情况下,通过如以往技术那样将是否将各个CU分割的标志用1bit表述,能够表述分割模式。
使用图7说明以往技术的CU的编码流的句法的一例。在该图中,函数coding_unit()表示(x0,y0)的像素位置及currCUSize的尺寸的CU的编码句法。另外,PicWidth是图片宽(像素数),PicHeight是图片高(像素数),MinCUSize是CU的最小尺寸。
split_flag是对于现CU、表示是将CU4分割(1)还是否(0)的1位的标志(L700)。
在split_flag是1的情况下,将现CU进行4分割。在此情况下,分割CU的尺寸splitCUSize为现CU的尺寸currCUSize的1/2,使横向的分割位置x1和纵向的分割位置y1分别设为x1=x0+splitCUSize,y1=y0+splitCUSize(L702)。并且,将4个分割CU(CU0~CU3)通过将coding_unit()递归地调用而保存(L703~L706)。在各个4个分割CU中也同样,通过split_flag指定是否进一步进行分割。这样的递归调用仅限于CU尺寸为MinCUSize以上时进行。
假如在split_flag是0的情况下,该CU确定为编码单位,保存作为编码的主要的处理的预测处理的信息(函数prediction_unit())(L707)、和预测误差的正交变换信息(函数transform_unit())(L708)。在本说明书中,关于正交变换处理,由于与本发明不直接相关,所以省略。
作为L707的预测处理的信息(prediction_unit()),例如保存上述是帧内预测还是帧间预测的识别码、是帧内预测的情况下表示其预测方向的信息(参照图2及图3)、是帧间预测的情况下CU内部的分割信息及运动矢量信息(参照图4)等。但是,在本发明中,并不限定于预测处理的方法及其信息的内容。
使CU的分割越细,能够以越细的尺寸进行预测处理,但由于需要相当于分割的CU数的预测信息,所以代码量增加。
所以,在本实施例中,通过在预测模式决定部110中具备母CU预测部1400,实现CU分割数增加时的预测信息的信息量削减。以下,对预测模式决定部110的处理内容进行说明。
<预测模式决定部的处理内容>
接着,对实施例1的预测模式决定部110的处理内容进行说明。
(1)处理整体的概要
图14是预测模式决定部110的结构图。
预测模式决定部110具有母CU预测部1400和预测成本比较部1401。关于母CU预测部1400如后述那样,将编码对象CU的母CU的预测图像保存,计算将现CU的预测处理用母CU的预测图像的一部分置换时的预测成本。
预测成本比较部1401将多个CU尺寸的多个帧内预测处理、帧间预测图像及来自上述母CU预测部1400的预测成本进行比较,决定预测成本为最小的预测处理,将通过该预测处理得到的预测图像保存至预测图像保存部107。另外,在本发明中预测成本的计算方法没有限定,例如也可以通过输入图像114与预测图像的绝对差的总和与预测信息所需要的总比特量的加权和等来定义。根据该定义,预测图像越接近于输入图像,进而预测信息所需要的比特量越少,则为编码效率越高的预测处理。
(2)母CU预测部的详细情况
在母CU预测部1400中,预先生成、保存编码对象CU的母CU的预测图像,计算将编码对象CU的预测处理用该母CU的预测图像的一部分置换的情况下的预测成本。关于这样的通过母CU的预测图像的置换为有效那样的场景,使用图8进行说明。
如图8所示,设想某个编码对象图片的编码对象的LCU(X)和其之前的图片的某个区域Y的背景大致同样、仅在其内部中有运动的物体那样的情况。在此情况下,作为LCU(X)的预测处理,如果以背景整体的预测处理和内部的有运动的物体部分来区分预测处理,则可推测为进行精度较高的预测。所以,只要将该LCU(X)分割为背景的CU和运动物体的CU、对各个CU指定各自的预测处理就可以。
但是,在上述那样的通过4叉树构造进行的CU分割的情况下,根据运动物体的LCU内的位置,分割CU的数量增加,结果有预测信息增加的情况。关于这样的情况,使用图9进行说明。
如图9中(A)所示,在LCU的中心附近的位置有运动的物体的情况下,考虑进行分割以使背景和物体部包含在不同的CU中。首先,通过将图9(A)的LCU分割1次,制作图9(B)那样的4个CU(1~4)。在图9(B)中,由于在该CU(1)~CU(4)中,都较多地包含物体和背景两者,所以将CU(1)~CU(4)分别分割。由此,分别从CU(1)制作CU(A~D),从CU(2)制作CU(E~H),从CU(3)制作CU(I~L),并且从CU(3)制作CU(M~P)。这16个CU中,CU(D)、CU(G)、CU(J)、CU(M)依然较多地包含物体和背景两者,所以将它们进一步分割。由此,分别从CU(D)制作CU(D1~D4),从CU(G)制作CU(G1~G4),从CU(J)制作CU(J1~J4),从CU(M)制作CU(M1~M4)(图9(D))。在这些当中,在CU(D4)、CU(G3)、CU(J2)、CU(M1)中仅较多地包含物体,在其以外的CU中仅较多地包含背景。由此,通过在CU(D4)、CU(G3)、CU(J2)、CU(M1)中进行考虑到物体的运动的预测处理、在其以外的CU中进行考虑到背景部分的运动的预测处理,可以考虑能够实现精度较高的预测处理。
但是,如果如上述那样细致地进行CU的分割,则如图9(D)那样需要对24个CU全部保存预测处理的信息,使预测处理信息增加。
所以,在实施例1的预测模式决定部110中,不是对各个CU全部必定保存预测处理的信息,而是能够选择是将由其母CU的预测处理预先得到的预测图像作为预测结果、还是以单独的CU进行预测处理。
在母CU预测部1400中,计算上述中的前者、即选择了通过母CU的预测图像的置换的情况下的预测成本,将该预测成本结果向预测成本比较部1401传递。在预测成本比较部1401中,将上述后者的通常的预测处理即通常的帧间预测或帧内预测的预测成本、与前者的来自母CU预测部1400的预测成本比较,选择预测成本较小的预测处理。
以下,说明实施例1的编码流的CU的句法的一例。
(3)CU的句法的一例
使用图10,说明实施例1的编码流的CU的句法的一例。
作为与以往的CU的句法(图7)不同的特征是,在split_flag=1的情况、即将现CU分割为4个子CU的情况下,具有1位的parent_pred_unit_flag,指定是保存现CU的尺寸下的预测处理的信息(1)还是否(0)(L1000),当parent_pred_unit_flag==1时,保存预测处理信息(该图中,parent_prediction_unit()函数)(L1001)。
此外,在split_flag==0的情况下,即不分割现CU而用现尺寸确定,在作为编码对象的CU的情况下,具有1位的parent_pred_flag,指定是用母CU的预测图像、即通过由parent_prediction_unit指定的预测处理所得到的预测图像的一部分来置换(1),还是进行别的预测处理(0)(L1002)。
当parent_pred_flag==0时,prediction_unit()函数中保存别的预测处理的信息。
当parent_pred_flag==1时,将母CU的预测图像中的、与编码对象CU的位置相对应的位置的图像作为编码对象CU的预测图像。现CU中的预测处理的信息不再需要。因而,parent_pred_flag==1那样的CU越多,越能够期待信息量的削减。
以下,使用图11,说明预测模式决定部110内的处理和CU句法的具体例。
CU的分割样式与图9(D)为同样。在母CU预测部1400中,首先如图11所示,以LCU尺寸决定预测处理。该预测处理的决定方法在本发明中没有限定,例如只要计算由多个进行了帧内预测或帧间预测的结果的预测图像与输入图像114的差分和用于记述预测处理的预测信息的位量的加权和等所定义的成本值,并决定使成本值为最小那样的预测处理就可以。将通过该预测处理得到的预测图像作为母CU的预测图像保存到母CU预测部1400内。并且在LCU的句法中,设为parent_pred_unit_flag=1,将所决定的预测处理的信息保存至parent_prediction_unit()。
在与图9(D)同样地将LCU分割所得到的全部的CU中,判断是否使用该母CU(LCU)的预测图像作为预测结果。在本发明中,不限定该判断处理,但作为一例,只要将在以母CU的预测图像为预测结果的情况下的预测成本、与单独进行帧内预测的情况或进行帧间预测的情况下的多个预测处理的预测成本值在预测成本比较部1401中比较,选择预测成本值较小的预测处理就可以。
假设通过这样的预测处理的选择处理,决定了
(1)使用母CU的预测图像作为预测结果的CU:
CU(A)、CU(B)、CU(C)、CU(D1)、CU(D2)、CU(D3)、CU(E)、CU(F)、CU(G1)、CU(G2)、CU(G4)、CU(H)、CU(I)、CU(J1)、CU(J3)、CU(J4)、CU(M2)、CU(M3)、CU(M4)、CU(N)、CU(O)、CU(P)
(2)进行别的预测处理的CU:
CU(D4)、CU(G3)、CU(J2)、CU(M1)。
在此情况下,对于(1)的CU,设为parent_pred_flag=1,在母CU预测部1400中,根据母CU(LCU)的预测图像,将与各个CU的位置对应的部位的预测图像作为各个CU的预测图像。
对于(2)的CU,设为parent_pred_flag=0,对于各个CU将预测处理的信息保存至parent_prediction_unit()。
通过以上,与以往技术相比,能够削减对于(1)的CU的预测处理的信息量,所以能够期待压缩率的提高。
此外,在实施例中,母CU并不一定限定于一个。如图12所示,在LCU和CU(D)(图9(C)中的“D”,即相当于CU(D1)~CU(D3)的母CU)的两个中被指定为parent_pred_unit_flag=1、其预测处理被保存在parent_prediction_unit()中的情况下,根据LCU和CU(D)的包含关系,LCU的预测图像的、仅被覆盖了相当于CU(D)的位置的部位的结果成为母CU的预测图像。并且,对于上述(1)的CU采用该母CU的预测图像(参照图12)。
在图12那样的情况下,与图11的情况相比,作为预测处理的信息量增加了相当于CU(D)的parent_prediction_unit()的信息量。但是,由于能够对CU(D)的部位,与LCU独立地选择更高精度的预测处理,所以预测精度提高,预测差分信息减少,从而能够期待压缩率的提高。
在本实施例中,可以指定是对各个CU独立地进行预测处理、还是原样使用母CU的预测图像,并不是限定子CU的预测处理与母CU的预测处理的方式的组合,可以采用帧间预测和帧内预测的任意的组合。此外,在帧间预测中,可以采用仅将在时间上靠前的图片作为参照图片的前方预测、或使用在时间上靠前和靠后的图片的双向预测等各种各样的预测方法。
但是,如图13所示,在CU(D)中进行帧内预测的情况下,在还使用CU(D)周边的已编码图像周围的已编码图像(解块处理前)那样的情况下,需要完成周围的CU(A)、CU(B)、CU(C)的编码处理(但是,是解块处理前)。
通过以上,在本实施例的图像编码装置的预测模式决定部110中,对于某个CU的预测处理,能够选择是使用其母CU的预测图像、还是进行别的预测处理,仅在进行别的预测处理时将预测处理信息保存至编码流。由此,通过削减CU的预测信息量,能够实现压缩率的提高。
<图像解码装置的构成>
图15是表示实施例的图像解码装置的概略结构的图。在图15中,图像解码装置以编码流1500为输入,具有:将编码流1500解码的可变长解码部1501;基于由可变长解码部1501所得到的CU尺寸信息将CU分割的CU分割部1502;对上述CU中的变换量化的预测误差图像进行逆量化的逆量化部1503;对得到的变换后的预测误差图像进行逆变换的逆变换部1504;将保存在预测图像保存部1508中的预测图像与从逆变换部1504输出的预测误差图像相加的加法器1505;以及对相加结果的图像进行解块处理的解块处理部1506;并将输出图像1512输出。
本实施例的运动图像解码装置为了生成上述预测图像而具有两套预测处理***。第一***是基于帧内预测的,具有使用以CU单位依次保存的已解码CU的图像信号(解块处理前)进行帧内预测的帧内预测部1507。第二***是基于帧间预测的,具有:将输出图像保存的参照图像保存部1510;以及使用保存在参照图像保存部1510中的参照图像和由可变长解码部1501解码后的运动矢量来进行运动补偿而得到帧间预测图像的帧间预测部1511。在预测选择部1509中,按照由可变长解码部1501解码后的CU的预测处理信息来生成预测图像,并保存至预测图像保存部1508。
<预测选择部(解码侧)的处理内容>
以下,参照附图对图像解码侧的预测选择部1509的处理内容进行说明。
图16是表示预测选择部1509的内部结构的图。预测切换部1601基于由可变长解码部1501解码后的各CU的预测处理信息来切换预测处理而生成预测图像,将该预测图像保存至预测图像保存部1508。
作为CU的预测处理信息的具体例,可以举出图10中的parent_pred_unit_flag、parent_prediction_unit()、parent_pred_flag、prediction_unit()的信息。图10中的编码流的句法的意思和对应于这些句法的母CU预测部1600的处理内容、与编码装置的母CU预测部1400是同样的,所以省略说明。
通过以上,在本实施例的图像解码装置的预测选择部1509中,可以按照编码流的CU的预测处理信息,使用母CU的预测图像作为编码对象CU的预测结果。由此,能够削减编码流中的编码对象CU的预测处理信息,所以能够实现压缩率的提高。
如以上这样,根据本发明,可以选择是使用其母CU的预测图像、还是进行别的预测处理来作为编码对象CU的预测处理。假如在选择了使用母CU的预测图像的情况下,通过图像编码装置不发送编码对象CU的预测处理信息、在图像解码装置中进行同样的母CU的预测处理,从而能够生成编码对象CU的预测图像,能够削减预测处理的信息量。
另外,本发明也可以通过实现实施例的功能的软件的程序代码来实现。在此情况下,将记录有程序代码的存储媒体提供给***或装置,该***或装置的计算机(或CPU、MPU)将保存在存储媒体中的程序代码读出。在此情况下,从存储媒体读出的程序代码自身实现上述实施例的功能,该程序代码自身及存储它的存储媒体构成本发明。作为用来供给这样的程序代码的存储媒体,可以使用例如软盘、CD-ROM,DVD-ROM、硬盘、光盘、光磁盘、CD-R、磁带、非易失性的存储卡、ROM等。
此外,也可以是,基于程序代码的指示,在计算机上工作的OS(操作***)等进行实际的处理的一部分或全部,通过该处理实现上述实施方式的功能。进而,也可以是,在将从存储媒体读出的程序代码写入到计算机上的存储器中之后,基于其程序代码的指示,计算机的CPU等进行实际的处理的一部分或全部,通过该处理来实现上述实施方式的功能。
此外,也可以是,通过将实现实施方式的功能的软件的程序代码经由网络发送,将其保存到***或装置的硬盘或存储器等的存储机构或CD-RW、CD-R等的存储媒体中,在使用时该***或装置的计算机(或CPU、MPU)将保存在该存储机构或该存储媒体中的程序代码读出并执行。
附图符号的说明
100CU 分割部;
110 预测模式决定部;
105 帧内预测部;
106 帧间预测部;
102 变换部;
103 量化部;
104 可变长编码部;
1400 母CU预测部;
1401 预测成本比较部;
1501 可变长解码部;
1502 CU分割部;
1503 逆量化部;
1504 逆变换部;
1507 帧内预测部;
1511 帧间预测部;
1509 预测选择部;
1600 母CU预测部;
1601 预测切换部。

Claims (6)

1.一种运动图像解码方法,用于下述运动图像解码装置,该运动图像解码装置对输入的编码流进行可变长解码,并以编码单位进行逆量化、逆变换而成为预测差分图像,将上述预测差分图像与上述预测图像相加而输出运动图像,该运动图像解码方法的特征在于,
在上述解码的编码流是以第1编码单位以及上位的第2编码单位这两者的编码单位来编码的编码流的情况下,上述第2编码单位比上述第1编码单位尺寸更大且包含上述第1编码单位,
生成以上述第1编码单位生成的预测图像和以第2编码单位生成的预测图像,
使用以上述第2编码单位生成的预测图像的一部分作为上述第1编码单位的预测图像。
2.如权利要求1所述的运动图像解码方法,其特征在于,
选择是使用以上述第1编码单位生成的预测图像的一部分、还是生成按照上述第2编码单位的预测图像这两者中的任一者来作为上述第2编码单位的预测图像。
3.如权利要求1所述的运动图像解码方法,其特征在于,
从上述编码流取出表示是否生成上述第2编码单位的预测图像的标志信息,
在上述标志信息表示生成上述第2编码单位的预测图像的情况下生成上述第2编码单位的预测图像,将以上述第2编码单位生成的预测图像的一部分作为上述第1编码单位的预测图像。
4.一种运动图像编码方法,将输入图像分割为编码单位,生成编码单位内部的预测图像,取与预测图像的差分,将预测差分图像变换、量化、可变长编码,输出编码流,该运动图像编码方法的特征在于,
生成上述第1编码单位的预测图像、以及上位的第2编码单位的预测图像,该第2编码单位比上述第1编码单位尺寸更大且包含上述第1编码单位,
使用以上述第2编码单位生成的预测图像的一部分作为上述第1编码单位的预测图像。
5.如权利要求1所述的运动图像编码方法,其特征在于,
选择是将上述第2编码单位的一部分作为上述第1编码单位、还是按照上述第1编码单位另外生成预测图像这两者中的任一者。
6.如权利要求5所述的运动图像编码方法,其特征在于,
将表示是否生成上述第2编码单位的预测图像的标志信息保存至编码流,
在上述标志信息表示生成上述第2编码单位的预测图像的情况下,将用来生成上述第2编码单位的预测图像的信息保存至编码流。
CN201180072475.6A 2011-07-22 2011-07-22 运动图像解码方法及图像编码方法 Active CN103703780B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611010982.8A CN107071406B (zh) 2011-07-22 2011-07-22 运动图像解码方法和编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2011/004129 WO2013014693A1 (ja) 2011-07-22 2011-07-22 動画像復号化方法及び画像符号化方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201611010982.8A Division CN107071406B (zh) 2011-07-22 2011-07-22 运动图像解码方法和编码方法

Publications (2)

Publication Number Publication Date
CN103703780A true CN103703780A (zh) 2014-04-02
CN103703780B CN103703780B (zh) 2016-12-07

Family

ID=47600592

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201611010982.8A Active CN107071406B (zh) 2011-07-22 2011-07-22 运动图像解码方法和编码方法
CN201180072475.6A Active CN103703780B (zh) 2011-07-22 2011-07-22 运动图像解码方法及图像编码方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201611010982.8A Active CN107071406B (zh) 2011-07-22 2011-07-22 运动图像解码方法和编码方法

Country Status (5)

Country Link
US (1) US20140169465A1 (zh)
EP (1) EP2736254B1 (zh)
JP (1) JP5677576B2 (zh)
CN (2) CN107071406B (zh)
WO (1) WO2013014693A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104410858A (zh) * 2014-11-18 2015-03-11 深圳市云宙多媒体技术有限公司 一种帧内预测块划分方法和***
JP5957513B2 (ja) * 2014-12-16 2016-07-27 株式会社日立製作所 動画像復号化方法
US10432966B2 (en) * 2015-04-13 2019-10-01 Mediatek Inc. Methods of constrained intra block copy for reducing worst case bandwidth in video coding
JP2019514308A (ja) * 2016-05-10 2019-05-30 サムスン エレクトロニクス カンパニー リミテッド 映像を符号化/復号する方法及びその装置
US11265544B2 (en) * 2018-09-18 2022-03-01 Sony Corporation Apparatus and method for image compression based on optimal sequential encoding scheme

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5748247A (en) * 1996-04-08 1998-05-05 Tektronix, Inc. Refinement of block motion vectors to achieve a dense motion field
JPH10150664A (ja) * 1996-11-19 1998-06-02 Mitsubishi Electric Corp 映像信号符号化装置および復号化装置
US6633611B2 (en) * 1997-04-24 2003-10-14 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for region-based moving image encoding and decoding
JP3782332B2 (ja) * 2001-09-28 2006-06-07 株式会社東芝 動きベクトル検出方法及び装置
HUP0301368A3 (en) 2003-05-20 2005-09-28 Amt Advanced Multimedia Techno Method and equipment for compressing motion picture data
JP4213646B2 (ja) * 2003-12-26 2009-01-21 株式会社エヌ・ティ・ティ・ドコモ 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法、及び画像復号プログラム。
JP2006129326A (ja) * 2004-11-01 2006-05-18 Shibasoku:Kk 動きベクトル検出装置
JP4438949B2 (ja) * 2004-12-21 2010-03-24 カシオ計算機株式会社 動き補償予測符号化装置、動き補償予測符号化方法及びプログラム
WO2007010690A1 (ja) * 2005-07-22 2007-01-25 Mitsubishi Electric Corporation 画像符号化装置、画像復号装置、および画像符号化方法、画像復号方法、画像符号化プログラム、画像復号プログラム、ならびに画像符号化プログラムを記録したコンピュータ読み取り可能な記録媒体、画像復号プログラムを記録したコンピュータ読み取り可能な記録媒体
JP4734168B2 (ja) * 2006-05-09 2011-07-27 株式会社東芝 画像復号化装置及び画像復号化方法
GB2443667A (en) * 2006-11-10 2008-05-14 Tandberg Television Asa Obtaining a motion vector for a partition of a macroblock in block-based motion estimation
JP2009094828A (ja) * 2007-10-10 2009-04-30 Hitachi Ltd 画像符号化装置及び画像符号化方法、画像復号化装置及び画像復号化方法
JP2009111691A (ja) * 2007-10-30 2009-05-21 Hitachi Ltd 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法
JP4977094B2 (ja) * 2008-06-25 2012-07-18 株式会社東芝 画像符号化方法
KR101517768B1 (ko) * 2008-07-02 2015-05-06 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
US8503527B2 (en) * 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
EP2357842A1 (en) * 2008-12-09 2011-08-17 Sony Corporation Image processing device and method
KR101457894B1 (ko) * 2009-10-28 2014-11-05 삼성전자주식회사 영상 부호화 방법 및 장치, 복호화 방법 및 장치
KR20120129944A (ko) * 2010-02-10 2012-11-28 엘지전자 주식회사 비디오 신호의 처리 방법 및 장치
TWI666882B (zh) * 2010-04-13 2019-07-21 美商Ge影像壓縮有限公司 在樣本陣列多元樹細分中之繼承技術
US9661338B2 (en) * 2010-07-09 2017-05-23 Qualcomm Incorporated Coding syntax elements for adaptive scans of transform coefficients for video coding
US10440373B2 (en) * 2011-07-12 2019-10-08 Texas Instruments Incorporated Method and apparatus for coding unit partitioning

Also Published As

Publication number Publication date
CN107071406B (zh) 2020-06-30
JP5677576B2 (ja) 2015-02-25
CN103703780B (zh) 2016-12-07
EP2736254A4 (en) 2015-04-15
US20140169465A1 (en) 2014-06-19
WO2013014693A1 (ja) 2013-01-31
EP2736254A1 (en) 2014-05-28
CN107071406A (zh) 2017-08-18
JPWO2013014693A1 (ja) 2015-02-23
EP2736254B1 (en) 2018-07-04

Similar Documents

Publication Publication Date Title
CN109309838B (zh) 用于视频编码的***和方法
JP5686499B2 (ja) 画像予測符号化装置、方法及びプログラム、画像予測復号装置、方法及びプログラム、並びに、符号化・復号システム及び方法
WO2014054267A1 (ja) 画像符号化装置及び画像符号化方法
US9247252B2 (en) Image decoding device
KR20110066109A (ko) 트리 구조를 이용한 부호화/복호화 방법 및 장치
CN103891278A (zh) 图像编码以及解码方法、装置、程序
JP2010502102A (ja) 低減された解像度の分割の方法及び装置
CN103747256A (zh) 图像预测编码装置、图像预测解码装置、图像预测编码方法
US20140105284A1 (en) Method and apparatus for coding/decoding through high-speed coding unit mode decision
JP7311635B2 (ja) コーデック方法、デバイス及びその機器
TW201342919A (zh) 資料編碼及解碼
CN101779463A (zh) 用于处理图像的方法以及相应的电子设备
CN103703780A (zh) 运动图像解码方法及图像编码方法
KR20150024857A (ko) 적어도 하나의 제2 이미지 성분의 기준 블록에 대하여 제1 이미지 성분의 현재 블록을 인코딩하는 방법, 인코딩 장치 및 대응하는 컴퓨터 프로그램
TWI738167B (zh) 圖像編碼及解碼技術
JP7242571B2 (ja) 画像をエンコーディング及びデコーディングする方法、エンコーディング及びデコーディング装置、並びに、対応するコンピュータプログラム
KR20200128577A (ko) 인트라 예측 장치, 화상 부호화 장치, 화상 복호 장치 및 프로그램
KR101377529B1 (ko) 적응적 움직임 벡터 부호화/복호화를 이용한 영상 부호화/복호화 방법 및 장치
JP2015211386A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
EP3565252A1 (en) Encoding device, decoding device and program
TWI517673B (zh) Dynamic image predictive coding device, dynamic image predictive coding method, dynamic image predictive coding program, dynamic image prediction decoding device, dynamic image prediction decoding method and dynamic image prediction decoding program
KR20100044333A (ko) 동영상 부호화 장치 및 이를 위한 영상 신호의 2차원 정렬 변환 장치 및 방법, 및 이를 위한 기록 매체
JP5370899B2 (ja) 動画像復号化方法及び動画像復号化装置
JP5957513B2 (ja) 動画像復号化方法
JP2016195326A (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化用コンピュータプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant