CN102047665B - 运动图像编码方法以及运动图像解码方法 - Google Patents

运动图像编码方法以及运动图像解码方法 Download PDF

Info

Publication number
CN102047665B
CN102047665B CN2009801290831A CN200980129083A CN102047665B CN 102047665 B CN102047665 B CN 102047665B CN 2009801290831 A CN2009801290831 A CN 2009801290831A CN 200980129083 A CN200980129083 A CN 200980129083A CN 102047665 B CN102047665 B CN 102047665B
Authority
CN
China
Prior art keywords
mentioned
vector
predicted vector
median
piece
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2009801290831A
Other languages
English (en)
Other versions
CN102047665A (zh
Inventor
高桥昌史
山口宗明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maxell Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of CN102047665A publication Critical patent/CN102047665A/zh
Application granted granted Critical
Publication of CN102047665B publication Critical patent/CN102047665B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/10Interfaces, programming languages or software development kits, e.g. for simulating neural networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及减少运动向量的编码量而提高压缩效率的运动图像编码/解码技术。在运动图像的解码处理中,根据作为解码对象块的周围块的已经被解码了的块群中的多个运动向量中的规定的运动向量间的差的大小,切换上述预测向量的计算方式,并将所计算出的预测向量与从编码流中解码了的差分向量相加而计算出运动向量,并使用所计算出的运动向量进行画面间预测处理。

Description

运动图像编码方法以及运动图像解码方法
技术领域
本发明涉及对运动图像进行编码的运动图像编码技术以及对运动图像进行解码的运动图像解码技术。
背景技术
作为将大容量的运动图像信息数字数据化而记录、传输的方法,制定有MPEG(Moving Picture Experts Group:运动图像专家组)方式等编码方式,并作为MPEG-1规格、MPEG-2规格、MPEG-4规格、H.264/AVC(Advanced Video Coding:进阶视频编码)规格等成为国际标准的编码方式。这些方式作为数字卫星广播、DVD、便携电话、数码照相机等中的编码方式而被采用,当前利用范围越来越广泛,成为身边的技术。
在这些规格中,通过利用完成了编码处理的图像信息以块为单位对编码对象图像进行预测,对与原图像的预测差分进行编码,从而去除运动图像所具有的冗长性,减小编码量。特别是,在参考与对象图像不同的图像的画面间预测中,通过从参考图像中搜索与编码对象块的相关性高的块,能够进行高精度的预测。但是,在这种情况下,除了预测差分之外,还需要将块搜索的结果作为运动向量而编码,产生编码量的开销。
在H.264/AVC规格中,为了减小上述运动向量的编码量,导入对运动向量的预测技术。即、在对运动向量进行编码时,利用位于对象块周围的完成编码的块来预测对象块的运动向量,对预测向量与运动向量的差分(差分向量)进行可变长度编码。
发明内容
但是,基于以往的H.264/AVC规格的运动向量的预测精度不充分,依然有运动向量需要很多编码量的问题。
本发明的目的在于,减少运动向量的编码量而提高压缩效率。
本发明的运动图像编码方法以及运动图像解码方法构成为例如权利要求所记载的那样。
根据本发明,能够减少运动向量的编码量而提高压缩效率。
附图说明
图1是本发明的实施例1中的运动图像编码装置的框图。
图2是本发明的实施例1中的运动图像编码装置的画面间预测部的框图。
图3是本发明的实施例1中的运动图像解码装置的框图。
图4是本发明的实施例1中的运动图像解码装置的画面间预测部的框图。
图5是在H.264/AVC规格中所使用的画面间预测的概念性说明图。
图6是与在H.264/AVC规格中所使用的运动向量的预测技术有关的概念性说明图。
图7是本发明的实施例1中的运动向量的预测技术的一例的概念性说明图。
图8是本发明的实施例1中的运动向量的预测技术的一例的概念性说明图。
图9是本发明的实施例1中的预测向量的编码方法的一例的说明图。
图10是在本发明的实施例1中的运动向量的预测技术所使用的阈值的一例的说明图。
图11是本发明的实施例1中的编码表切换技术的一例的概念性说明图。
图12是本发明的实施例1中的编码表切换技术的一例的概念性说明图。
图13是本发明的实施例1中的编码表的一例的说明图。
图14是本发明的实施例1中的编码表的一例的说明图。
图15是与本发明的实施例2中的运动向量的预测技术有关的概念性说明图。
图16是本发明的实施例1中的运动图像编码方法的流程图。
图17是本发明的实施例1中的运动图像编码方法中的差分向量计算处理的流程图。
图18是本发明的实施例1中的运动图像解码方法的流程图。
图19是本发明的实施例1中的运动图像解码方法中的运动向量计算处理的流程图。
具体实施方式
以下,参考附图对本发明的实施例进行说明。
图5概念性地示出关于基于H.264/AVC规格的画面间预测处理的动作。在H.264/AVC规格中,对编码对象图像按照光栅扫描的顺序进行基于块单位的编码。在进行画面间预测时,将包含在与编码对象图像(503)相同的影像(501)中的完成编码的图像的解码图像作为参考图像(502),从参考图像中搜索与对象图像中的对象块(504)的关联性高的块(预测图像)(505)。此时,除了作为两块的差分而计算出的预测差分之外,还将两块的座标值的差分作为运动向量(506)而进行编码。另一方面,在解码时,进行与上述相反的步骤即可,通过将解码了的预测差分加到参考图像中的块(预测图像)(505)上,能够得到解码图像。
在H.264/AVC规格中,为了降低在以上所说明了的基于运动向量的编码量的开销,导入了针对运动向量的预测技术。即、在对运动向量进行编码时,利用位于对象块的周围的完成编码的块来预测对象块的运动向量,并对预测向量与运动向量的差分(差分向量)进行编码。此时,因为差分向量的大小统计性地大致集中到0,所以通过对此进行可变长度编码能够削减编码量。图6是概念性地示出计算预测向量的方法的图。将邻接在对象块(601)的左侧、上侧、右上侧的完成编码的块分别设为块A(602)、块B(603)、块C(604),将各块中的运动向量设为MVA、MVB、MVC。
此时,在H.264/AVC规格中,预测向量作为MVA、MVB、MVC的中央值而计算出。即,使用针对作为自变量而被指定的向量的各分量返回中央值的函数Median,如(605)那样地计算出预测向量PMV。另外,作为对象块的运动向量MV与预测向量PMV(预测向量)的差分(606)而计算出差分向量DMV,然后,对DMV(差分向量)进行可变长度编码。在进行解码时只要进行与上述相反的步骤即可,通过将解码出来的DMV(差分向量)加到通过与上述相同的步骤计算出来的PMV(预测向量)上,对运动向量MV进行解码。
如以上那样,在H.264/AVC规格中,通过导入针对运动向量的预测技术,能够大幅度地削减运动向量所需要的编码量。但是,在多个运动物体接近的情况下、在运动物体的边界部分存在于对象区域的近傍的情况下等难以正确地预测运动向量的情况下,基于H.264/AVC规格的运动向量的预测精度是不充分的,运动向量依然需要很多的编码量。作为其原因可以考虑以下情况。即、在如上述那样的运动复杂的状况下,对象区域的近傍的运动向量的相关性显著降低,成为预测向量的候补的向量间的差增大。因此,如果错误地选择了预测向量,则与选择了正确的预测向量的情况相比差分向量增大,其结果是,编码量也显著增大。
在本发明的一个实施方式中,根据成为预测向量的候补的向量值的分布来切换预测向量的确定方法。在候补向量的分布范围狭窄的情况下,判断为错误地选择预测向量的风险小,实施如以往那样的预测方法。另一方面,在候补向量的分布范围宽的情况下,追加表示将哪个候补向量作为预测向量利用的比特(以下称为附加比特)而指定将差分向量最小化的候补向量。
此时,如果进一步根据候补向量值的分布而动态地切换成为预测向量的候补的向量的种类,则能够抑制由于附加比特导致的编码量的增加。由此,能够在抑制编码量的增加的同时提高对运动向量的预测精度。
另外,一般在运动复杂的状况下,运动向量的预测精度降低,所以即使选择了最优的预测向量,差分向量也不会减小。因此,为了削减编码量,对于在运动不复杂的情况和运动复杂的情况,改变差分向量的编码方法是有效的。
例如,在参考文献1中,根据对象块的周围区域中的运动向量的方差的大小来判定运动是否复杂,并基于该判定结果来切换对差分向量进行编码时的可变长度编码表。根据该方法,能够粗略地判定运动是否复杂,但是不能进行反应图像的性质的编码表的精细切换。另外,因为基于该方法的编码表的切换是基于对象块的周围区域中的运动向量的,所以在对象区域的运动与周围区域不同的情况下,不能恰当地选择编码表。
在本发明的一个实施方式中,在基于上述的附加比特的最佳向量的选择方法中,通过调查选择了哪个候补向量,能够详细地推定对象区域中的运动的性质,通过基于该推定信息而切换编码表,能够进行更详细的编码表的切换,其结果是能够进一步削减编码量。
[参考文献1]日本特开2006-271001号公报
以下,对本发明的运动向量的编码步骤以及解码步骤进行阐述。其中,预测向量PMV(预测向量)的计算步骤在编码侧与解码侧相同,在编码侧进行计算出运动向量MV与PMV(预测向量)的差分DMV而对此进行编码的处理。与此相对,在解码侧进行在所解码了的DMV(差分向量)上加上PMV(预测向量)而对运动向量MV进行解码的处理。
实施例1
图7概念性地示出根据本实施例的预测向量计算方法的一例。在此,将成为预测向量的候补的向量设为分别邻接对象块的左侧、上侧、右上侧的块A、块B、块C这3种。此时,将各块中的运动向量设为MVA、MVB、MVC。
首先,对运动向量MVA、MVB、MVC的x、y各分量进行排列,利用阈值Thre1调查其分布,划分为CASE1~CASE4的4种情况。在本图中,箭头方向是运动向量的各分量的值增大的方向。由此,用X符号表示的MVA、MVB、MVC的x、y各分量中越位于箭头方向的是最大值,越位于与箭头方向相反方向的是最小值。另外,位于两者之间的是中间值。
在此,如果将所有的值的间隔设为比Thre1还小(CASE1),则不论选择哪个值都不会在差分向量的大小上产生大的差值,所以,与H.264/AVC规格同样地,将候补值的中央值(a)选择为预测向量PMV。此时,不会发生附加比特。在这种情况下,特别地,即使不是中央值,例如平均值、最大值、最小值等,使用什么样的计算方法选择预测向量都可以,例如也可以利用在对象块的右上方邻接的块、处于与在时间上为前一帧中的对象块相同位置的块等、块A、块B、块C以外的块中的运动向量来确定预测向量。
另一方面,当候补值中最大的值与中央值的差为Thre1以上、且中央值与最小值的差比Thre1小的情况下(CASE2),例如,在作为预测向量选择最小值为最佳的情况下,即使选择了中央值,在差分向量的大小上也不会产生大的差值,但是,如果在应该选择中央值的情况下选择了最大值,则差分向量的大小显著增大。因此,在这种情况下,将预测值的选择项设为最大值(b)和中央值(c)这2种,将其中的差分向量变得更小的一方作为预测向量PMV选择,并通过1比特的信息来表现。在解码侧,根据该1比特的信息确定预测向量,通过相加到差分向量上而对运动向量进行解码。
同样地,如果最小值与中央值的差为Thre1以上、中央值与最大值的差比Thre1小(CASE3),则将中央值(d)与最小值(e)中的差分向量变得更小的一方选择为预测向量PMV,并追加1比特的信息。
另外,如果所有的值的间隔都为Thre1以上(CASE4),则从最大值(f)、中央值(g)、最小值(h)这3种类的候补值中选择差分向量变得最小的作为预测向量PMV,并附加1比特或2比特的信息。
上述预测向量的选择项的设定方法不特别限定。例如,因为在上述的例子中在CASE4中将选择项数量设为3,所以存在追加比特需要2比特的情况,但是,例如通过将选择项限定为MVA、MVB这2种,能够将追加比特总是抑制为1比特。
根据以上的方法,能够仅在预测精度降低的可能性高的情况下,通过附加最低限的附加比特量来表现预测向量,能够在抑制编码量的增加的同时提高运动向量的预测精度。
另外,在上述的方法中,如果与利用图8说明的方法合用,则能进一步提高预测精度。在此,利用设定为比Thre1还大的值的其它阈值Thre2,除了CASE1~CASE4之外,还划分CASE5~CASE7的3种情况。
即、在CASE2中,如果b与c的差在Thre2以上(CASE5),则在选择项中追加b与c的中间值(i),从b、c和i中选择差分向量变得最小的作为预测向量PMV,并追加1比特或2比特的信息。
同样地,在CASE3中,如果d与e的差为Thre2以上(CASE6),则在选择项中追加d与e的中间值(j),从d、e和j中选择差分向量变得最小的作为预测向量PMV,并追加1比特或2比特的信息。
另外,在CASE4中,如果f与g的差、以及g与h的差为Thre2以上(CASE7),则在选择项中追加f与g的中间值(k)和g与h的中间值(i),从f、g、h、k和i中选择差分向量变得最小的作为预测向量PMV,并附加2比特或3比特的信息。
如上述那样,在候补值的间隔大的情况下,差分向量增大的可能性高,所以,通过在新的选择项中加入它们的中间值,能够使预测更容易准确,因为预测向量与真实向量的差分变小,所以能够削减编码量。
在上述的例子中,在新的选择项中追加有2种候补值的中间值,但是,例如使用多个候补值的加权平均等,只要是使用候补值的计算方法,利用哪种方法都可以。另外,预测向量的选择项的追加方法不特别限定。此外,在上述的例中将利用图7说明的方法和利用图8说明的方法组合利用,但是也可以分别单独利用。
图9示出上述预测向量的编码方法。在此,作为选择项的数为2、3、5的代表例,示出分别在CASE2、CASE4、CASE5中对各自的值进行编码时的可变长度编码表。其中,该表为一个例子,对编码表的制作方法不作特别限定。
另外,对阈值Thre1和Thre2的设定方法也不作特别限定。也可以分别为固定值,但是,例如如图10所示的那样,根据量化参数等来确定则会更有效。在该例子中,以量化参数的值越大这些阈值越大的方式进行设定。这是因为,由于如果量化参数变大则比特速率变小,由附加比特造成的影响变大,所以通过将这些阈值增大,使附加比特难以发生,是有效的。
另外,在本发明的一个实施的方式中,通过根据候补向量的选择信息切换差分向量的编码方法,实现进一步削减编码量。图11示出根据候补向量的选择信息推定图像的性质的方法。例如,可知在对象块中对预测向量进行编码/解码时,在选择了候补向量的分量a、c、d中的任意一个的情况下,对象区域中的运动向量与周围向量类似,能够推定对象区域存在于大的物体的内侧。另外,可知在选择了候补向量的分量b、e中的某一个的情况下,在对象区域的周围存在2种运动,能够推定为对象区域存在于大的物体的边界部分。另一方面,当选择了候补向量的分量f、g、h、i、j、k、l中的任意一个的情况下,对象区域的周围中的运动向量的相关性降低,例如能够推定为对象区域存在于如小物体大量集中那样的无相关性的区域。
图12示出根据如上述那样的图像性质的推定信息(候补向量的选择信息)而切换差分向量的可变长度编码表的方法。一般,在运动复杂的状况下运动向量的预测精度降低。在上述例子中,按照“物体的内部区域”、“物体的边界区域”、“无相关性区域”的顺序,预测精度降低,差分向量变大(1201)。在本发明中,准备多个的可变长度编码表(表格A(1202)、表格B(1203)、表格C(1204)),并根据其性质进行切换(1205)。例如在表格A中,使用在差分向量的值小的期间编码长度短,但如果差分值变大则编码长度也急剧地变长那样的表格。另一方面,在表格C中,使用在差分向量的值小的期间编码长度长,但即使差分值变大编码长度的增加也比较平缓的那样的表格。另外,在表格B中,使用具有表格A和表格C的中间的性质那样的表格。
此时,在推定为物体的内部区域的情况下(在对预测向量进行编码/解码时选择了候补向量的分量a、c、d中的任意一个的情况下),利用在差分值小的情况下有利的表格A对差分向量进行编码。另一方面,当推定为无相关性区域的情况下(在对预测向量进行编码/解码时,选择了候补向量的分量f、g、h、i、j、k、l中的任意一个的情况下),利用在差分值大的情况下有利的表格C。另外,在推定为物体的边界区域的情况下(在对预测向量进行编码/解码时选择了候补向量的分量b、e中的任意一个的情况下),利用具有它们的中间的性质的表格B。根据上述的方法,能够进行考虑了对象图像的性质的精密的编码表的切换,能够大幅度地消减差分向量中需要的编码量。
可变长度编码表无论利用什么样的都可以,但是,如果利用例如图13所示的表格A(1301)、表格B(1302)、表格C(1303)则更有效。
这样,既可以预先将表格A、表格B、表格C分别定义为固定表格,但如果例如如图14那样地,预先准备多个表格(表格1~表格5)(1402),并根据某些参数而动态地选择表格则更有效。在此,将分配给表格A、表格B、表格C的表格号码的组合定义为表格组合(a~c)(1401),根据在对象图像的紧前面编码/解码了的帧中的附加比特的累计(PrevAddBits)值来切换所利用的表格组合(1403)。这是因为,在对象帧的运动激烈的情况下,如果将表格A、表格B、表格C的编码长度的偏差增大,则特别地能够提高编码量的削减效果,所以,基于反映前帧中的运动的大小的参数(PrevAddBits)来切换表格。在此,为了进行切换的判定,设定有常数的阈值(Thre3、Thre4),但是对判定方法不作特别限定。另外,在上述例子中,作为用于进行切换的参数而利用PrevAddBit,但是只要是例如运动向量的平均值、方差值、预测误差的统计量等反应帧内的运动量的参数,利用什么样的参数都可以。
图1示出本实施例中的运动图像编码装置的一例子。运动图像编码装置具有:保持所输入的原图像(101)的输入图像存储器(102);将输入图像分割成小区域的块分割部(103);以块为单位进行画面内预测的画面内预测部(105);根据由运动搜索部(104)所检测出的运动量以块为单位进行画面间预测的画面间预测部(106);确定与图像的性质相符的预测编码手段(预测方法以及块尺寸)的模式选择部(107);用于生成预测差分的减法部(108);对预测差分进行编码的频率变换部(109)以及量化部(110);用于进行基于符号的发生概率的编码的可变长度编码部(111);用于对进行了一次编码的预测差分进行解码的逆量化处理部(112)以及逆频率变换部(113);用于使用所解码的预测差分生成解码图像的加法部(114);以及用于保持解码图像以在后面的预测中活用的参考图像存储器(115)。
输入图像存储器(102)从原图像(101)中将一幅图像作为编码对象图像而保持,并通过块分割部(103)将其分割为细小的块,并传送到运动搜索部(104)、画面内预测部(105)、以及画面间预测部(106)。在运动搜索部(104)中,使用存储在参考图像存储器(115)中的完成解码的图像来计算该块的运动量,并将运动向量传送到画面间预测部(106)。在画面内预测部(105)以及画面间预测部(106)中以某个大小的块单位执行画面内预测处理以及画面间预测处理,由模式选择部(107)选择某个最佳的预测方法。接下来,在减法部(108)中生成基于最佳的预测编码手段的预测差分,并传送到频率变换部(109)。在频率变换部(109)以及量化处理部(110)中,以所指定的大小的块单位对传送来的预测差分分别进行DCT(Discrete Cosine Transformation:离散余弦变换)等频率变换以及量化处理,并传送到可变长度编码处理部(111)以及逆量化处理部(112)。进而,在可变长度编码处理部(111)中,根据符号的发生概率,对利用频率变换系数表示的预测差分信息、例如在进行画面内预测时所利用的预测方向、在进行画面间预测时利用的运动向量等解码所需的信息进行可变长度编码而生成编码流。在可变长度编码处理部(111)中的可变长度编码处理中,进行例如图9、图11、图12、图13、图14所示的可变长度编码表以及其切换处理。另外,在逆量化处理部(112)以及逆频率变换部(113)中,对量化后的频率变换系数分别实施逆量化以及IDCT(Inverse DCT:逆DCT)等逆频率变换,取得预测差分而传送到加法部(114)。接着,通过加法部(114)生成解码图像而存储到参考图像存储器(115)中。
图2针对画面间预测部(106)的详细情况示出其一个例子。画面间预测部具有:用于存储已编码区域的运动向量的运动向量存储用存储器(201);利用已编码区域的运动向量计算预测向量的预测向量计算部(202);计算运动向量与预测向量的差而计算差分向量的减法器(203);生成预测图像的预测图像生成部(204);根据预测向量的选择信息而选择最佳的可变长度编码表的编码表切换部(205)。
预测向量计算部(202)根据存储在运动向量存储用存储器(201)中的已编码区域的运动向量计算对象块的预测向量。该预测向量的计算处理如利用图7以及图8所说明的那样。在减法器(203)中,计算由运动搜索部(104)所计算出的运动向量与预测向量的差分,从而计算差分向量(207)。另外,在编码表切换部(205)中,选择最佳的可变长度编码表而输出其编码表号码(206),并传送到可变长度编码部(111)。在预测图像生成部(204)中根据运动向量和参考图像生成预测图像(208)。而且,将运动向量存储到运动向量存储用存储器(201)中。
图3示出本实施例中的运动图像解码装置的一个例子。运动图像解码装置具有:对由例如图1所示的运动图像编码装置生成的编码流(301)进行可变长度编码的相反步骤的可变长度解码部(302);用于对预测差分进行解码的逆量化处理部(303)以及逆频率变换部(304);进行画面间预测的画面间预测部(305);进行画面内预测的画面内预测部(306);用于取得解码图像的加法部(307);以及用于暂时存储解码图像的参考图像存储器(308)。
在可变长度解码部(302)中,对编码流(301)进行可变长度解码,取得预测差分的频率变换系数分量、块尺寸、运动向量等预测处理中所需的信息。
在此,在该可变长度解码处理中,可变长度解码部(302)从后述的画面间预测部(305)的运动向量存储用存储器(401)取得已解码了的周围块的运动向量,进行图7~图8所示的候补向量的排列。在此,计算各候补向量间的差,判别候补向量的分布状况(CASE1~CASE7)。根据该分布状况(CASE1~CASE7)的判别结果,选择图9的可变长度编码表。使用图9的编码表来判别表示包含在编码流中的附加比特的选择项。使用该附加比特所表示的选择项,选择图12、图13、图14所示的可变长度编码表。进而,使用该选择的可变长度编码表进行差分向量的可变长度解码处理。
接下来,将前者的预测差分信息传送到逆量化处理部(303),将后者的预测处理所需的信息传送到画面间预测部(305)或画面内预测部(306)。然后,在逆量化处理部(303)以及逆频率变换部(304)中,对预测差分信息分别实施逆量化和逆频率变换而进行解码。然后,在画面间预测部(305)或画面内预测部(306)中,根据从可变长度解码部(302)传送来的信息参考参考图像存储器(308)而执行预测处理,由加法部(307)生成解码图像并将解码图像保存到参考图像存储器(308)中。
图4针对画面间预测部(305)的详细情况示出其一例子。画面间预测部具有:用于存储已解码区域的运动向量的运动向量存储用存储器(401);利用已解码区域的运动向量计算预测向量的预测向量计算部(402);计算差分向量与预测向量的和从而计算运动向量的加法器(403);以及生成预测图像的预测图像生成部(404)。
预测向量计算部(402)根据存储在运动向量存储用存储器(401)中的已解码区域的运动向量计算对象块的预测向量。该预测向量的计算处理如在图7、图8中所说明的那样。在加法部(403)中,计算由可变长度解码部所解码了的差分向量与预测向量的和,从而对运动向量进行解码。而且,将所解码了的运动向量存储到运动向量存储用存储器(401)中,另一方面,在预测图像生成部(404)中根据运动向量和参考图像生成预测图像(405)。
图16示出本实施例中的1帧的编码处理步骤。首先,对存在于成为编码对象的帧内的所有的块(1601)进行以下的处理。即、针对该块,对所有编码模式(预测方法与块尺寸的组合)(1602)执行一次预测。在此,根据预测的方法(1603)进行画面内预测(1604)或者画面间预测(1605),进行预测差分(差分图像)的计算。另外,在进行画面间预测时,除了预测差分(差分图像)之外还对运动向量进行编码。在此,根据由图7以及图8示出的方法所计算出的PMV(预测向量)来计算DMV(差分向量)(1606)。接下来,对预测差分进行频率变换处理(1607)、量化处理(1608)。进而,进行使用图9、图11、图12、图13、图14所示的可变长度编码表以及其切换处理的可变长度编码处理(1609),计算各编码模式的图像质量偏差和编码量。如果针对所有的编码模式都结束了以上的处理,则根据以上的结果选择编码效率最好的模式(1610)。另外,在从多个编码模式中选择编码效率最高的模式时,通过利用例如RD-Optimization方式,能够进行效率好的编码,其中RD-Optimization方式是根据图像质量偏差与编码量的关系来确定最佳的编码模式。关于RD-Optimization方式的详细情况,参考参考文献2。
[参考文献2]G.Sullivan and T.Wiegand:“Rate-DistortionOptimization for Video Compression”,IEEE Signal ProcessingMagazine,vol.15,no.6,pp.74-90,1998.
接下来,针对所选择的编码模式,对量化完成的频率变换系数实施逆量化处理(1611)和逆频率变换处理(1612)从而对预测差分进行解码,生成解码图像并保存到参考图像存储器(1613)。如果针对所有的块都完成了以上的处理,则结束1帧图像的编码(1614)。
图17示出图16中的DMV(差分向量)计算处理(1606)的详细的处理步骤。首先,对对象块的周围块中的向量(候补向量)进行排列(1701)。在此,在本实施例所说的“排列”是指,计算多个候补向量的规定方向的分量的值中的哪个候补向量的值为最大值、中央值、最小值,从而分别确定最大值向量、中央值向量、最小值向量。以下所记载的“排列”都是相同的意思。接下来,调查多个候补向量的规定方向的分量的值中是否有Thre1以上的间隔(1702)。如果没有Thre1以上的间隔,则和以往方式同样地,进行基于候补向量的中央值的PMV(预测向量)计算(1703)。另一方面,如果存在Thre1以上的间隔,则继续调查是否有Thre2以上的间隔(1704)。如果没有Thre2以上的间隔,则从成为选择项的候补值中选择将差分向量最小化的候补值作为PMV(预测向量)(1705),将选择信息作为附加比特而追加(1706)。另一方面,如果存在Thre2以上的间隔,则计算候补值的中间值而生成进一步的预测值的选择项(1707)。然后,从成为选择项的候补值中选择将差分向量最小化的候补值作为PMV(预测向量)(1705),并将选择信息作为附加比特追加(1706)。在通过以上的方法计算了PMV(预测向量)之后,计算运动向量MV与PMV(预测向量)的差分而作为DMV(差分向量)(1710),并根据PMV(预测向量)的选择状况选择DMV(差分向量)的编码表(1710)。如果以上的处理结束了,则DMV(差分向量)计算结束(1711)。另外,上述处理中的预测向量的计算处理是与图7以及图8所示的预测向量的计算处理对应的处理。
图18示出本实施例中的1帧的解码处理步骤。首先,对1帧内的所有块进行以下的处理(1801)。即、对输入流实施可变长度解码处理,并进行预测差分的频率变换系数分量、差分向量的解码(1802)。
在此,在该可变长度解码处理中,取得已解码了的周围块的运动向量,进行图7~图8所示的候补向量的排列。在此,计算各候补向量间的差,并判别候补向量的分布状况(CASE1~CASE7)。基于该分布状况(CASE1~CASE7)的判别结果,选择图9的可变长度编码表。使用图9的编码表判别包含在编码流中的附加比特表示的选择项。使用该附加比特所表示的选择项选择图12、图13、图14所示的可变长度编码表。进而,使用该所选择的可变长度编码表进行差分向量的可变长度解码处理。
接下来,对在可变长度解码处理中所取得的预测差分的频率变换系数分量实施逆量化处理(1803)以及逆频率变换处理(1804),从而对预测差分(差分图像)进行解码。然后,根据预测的方法(1805)进行画面内预测处理(1806)以及画面间预测处理(1808)。另外,在进行画面间预测时,首先通过画面间预测处理进行运动向量MV的解码。差分向量DMV先在可变长度解码处理(1802)中解码,在此,将通过图7~图8所示的方法所计算出的PMV(预测向量)和差分向量DMV相加,计算MV(1807)。使用所计算的MV进行画面间预测处理(1808)。如果对帧中的所有块都结束了以上的处理,则1帧图像的解码结束(1809)。
图19示出图18中的MV计算(1807)的详细的处理步骤。首选,对对象块的周围块中的向量(候补向量)进行排列(1901),调查这些值中是否有Thre1以上的间隔(1902)。如果没有Thre1以上的间隔,则和以往方式同样地,进行基于候补向量的中央值的PMV(预测向量)的计算(1903)。另一方面,如果有Thre1以上的间隔,则继续调查是否有Thre2以上的间隔(1904)。如果没有Thre2以上的间隔,则读入附加比特而确定作为PMV(预测向量)所选择的值,对PMV(预测向量)进行解码(1905)。另一方面,如果有Thre2以上的间隔,则计算候补值的中间值而生成进一步的预测值的选择项(1906),然后读入附加比特而确定作为PMV(预测向量)所选择的值,从而对PMV(预测向量)进行解码(1907)。在通过以上的方法计算了PMV(预测向量)之后,计算PMV(预测向量)与差分向量DMV的和而作为MV(1908),并结束MV计算(1909)。
在本实施例中,以块为单位进行了预测向量的计算,但是也可以以除此以外的例如从图像的背景分离了的对象单位计算。另外,作为频率变换的一个例子而列举了DCT,但是只要是DST(Discrete SineTransformation:离散正弦变换)、WT(Wavelet Transformation:小波变换)、DFT(Discrete Fourier Transformation:离散傅立叶变换)、KLT(Karhunen-Loeve Transformation:卡洛变换)等、在像素间相关性除去中所利用的正交变换,则什么样的变换都可以,特别是也可以不实施频率变换而对预测差分本身进行编码。另外,也可以不特别地进行可变长度编码。
另外,在实施例1中,对作为对象块中的预测向量的候补值而利用3种周围向量的例子进行了说明,但是对候补值的数量不作特别限定。即也可以将多于3种的周围向量作为候补。
利用以上说明的本发明的实施例1中的运动图像编码装置、运动图像编码方法、运动图像解码装置以及运动图像解码方法,能够实现减小运动向量的编码量而提高压缩效率的运动图像编码方法以及运动图像解码方法。
实施例2
接下来,对本发明的实施例2进行说明。
在实施例1中,设成为预测向量的候补的向量的数量为3。与此相对,在实施例2中,作为更简单的方法,将该数量设为2。
实施例2的运动图像编码装置与图1、图2所示的实施例1的运动图像编码装置相比,仅预测向量PMV的计算方法不同。因此,关于其它的结构、动作的详细情况,由于已经进行过说明,所以省略说明。
另外,实施例2的运动图像解码装置与图3、图4所示的实施例1的运动图像解码装置相比,仅预测向量PMV的计算方法不同。因此,关于其它的结构、动作的详细情况,由于已经进行过说明,所以省略说明。
另外,实施例2的运动图像编码方法与图16所示的实施例1的运动图像编码方法相比,仅差分向量DMV的计算方法不同。因此,关于其它的结构、动作的详细情况,由于已经进行过说明,所以省略说明。
另外,实施例2的运动图像解码方法与图18所示的实施例1的运动图像解码方法相比,仅运动向量MV的计算方法不同。因此,关于其它的结构、动作的详细情况,由于已经进行过说明,所以省略说明。
以下、利用图15对实施例2中的预测向量PMV的计算方法进行说明。图15概念性地示出本实施例中的预测向量PMV的计算方法的一个例子。在此,将成为预测向量的候补的向量设为分别在对象块的左侧、上侧邻接的块A、块B这2种。此时,将各块中的运动向量设为MVA、MVB。其中,在计算预测向量时,也可以利用例如邻接对象块的右上的块C(运动向量MVC)等其它的块。
首先,分别对运动向量MVA、MVB的x、y各分量进行比较,如果其差为阈值Thre1以下,则认为不论选择哪个值都不会在差分向量的大小上产生大的差值,所以与H.264/AVC规格同样地,将MVA、MVB的中央值选择为预测向量PMV(1501)。此时,不会发生附加比特。在这种情况下,特别即使不是中央值,例如平均值、最大值、最小值等,什么样的计算方法都可以,例如也可以利用在对象块的右上方邻接的块、在与时间上处于前1帧中的对象块相同位置的块等、块A、块B以外的块中的运动向量。
另一方面,如果其差在Thred1与Thred2之间,则将预测值的选择项设为MVA和MVB这2种,将其中的差分向量变得更小的一方选择为预测向量PMV而附加1比特的信息。另外,如果其差为Thred2以上,则将预测值的选择项设为MVA、MVB、(MVA+MVB)/2这3种,将其中差分向量变为最小的选择为预测向量PMV而附加1比特或2比特的信息。
在实施例2的运动图像编码装置以及运动图像编码方法中,根据通过画面间预测计算的运动向量MV与如上述那样地计算的预测向量PMV的差,计算差分向量DMV而进行运动图像编码处理。
在实施例2的运动图像解码装置以及运动图像解码方法中,在所计算的预测向量PMV上加上从编码流中解码的差分向量DMV而计算出运动向量MV,进行画面间预测处理,进行运动图像解码处理。
在本实施例中,以块为单位进行了预测向量的计算,但也可以以除此以外的例如从图像的背景分离的对象为单位进行计算。另外,作为频率变换的一个例子而列举有DCT,但是只要是DST(Discrete SineTransformation:离散正弦变换)、WT(Wavelet Transformation:小波变换)、DFT(Discrete Fourier Transformation:离散傅立叶变换)、KLT(Karhunen-Loeve Transformation:卡洛变换)等、在像素间相关性除去中所利用的正交变换,则什么样的方法都可以,特别是也可以不实施频率变换而对预测差分本身进行编码。另外,也可以不特别地进行可变长度编码。
利用以上说明的本发明的实施例2中的运动图像编码装置、运动图像编码方法、运动图像解码装置以及运动图像解码方法,除了实施例1的效果之外,还能够进一步简化处理而降低处理量。
(符号说明)
102...输入图像存储器、103...块分割部、104...运动搜索部、105...画面内预测部、106...画面间预测部、107...模式选择部、108...减法部、109...频率变换部、110...量化处理部、111...可变长度编码部、112...逆量化处理部、113...逆频率变换部、114...加法部、115...参考图像存储器、302...可变长度解码部、303...逆量化处理部、304...逆频率变换部、305...画面间预测部、306...画面内预测部、307...加法部、308...参考图像存储器。

Claims (14)

1.一种运动图像解码方法,其特征在于,包括:
预测向量计算步骤;
运动向量计算步骤,将在上述预测向量计算步骤中计算出的预测向量和从编码流中解码出的差分向量相加,而计算出运动向量;以及
画面间预测处理步骤,使用在上述运动向量计算步骤中计算出的运动向量进行画面间预测处理,
在上述预测向量计算步骤中,根据作为解码对象块的周边块的已经被解码了的块群的多个运动向量中的规定运动向量间的差的大小来切换上述预测向量的计算方式。
2.根据权利要求1所述的运动图像解码方法,其特征在于,
在上述预测向量计算步骤中,根据在作为解码对象块的周边块的已经被解码了的块群的多个运动向量的关于规定方向的多个分量的值中,最大值与中央值之差的大小或者最小值与中央值之差的大小和规定的阈值的比较结果来切换上述预测向量的计算方式。
3.根据权利要求1所述的运动图像解码方法,其特征在于,
在上述预测向量计算步骤中,上述预测向量计算方式是:选择在作为解码对象块的周边块的已经被解码了的块群的多个运动向量的关于规定方向的多个分量的值中、包括最大值、最小值或者中央值的多个候补值中的某一个的值,作为关于上述规定方向的预测向量分量而计算出来。
4.根据权利要求3所述的运动图像解码方法,其特征在于,
在上述预测向量计算步骤中,根据在作为解码对象块的周边块的已经被解码了的块群的多个运动向量的关于规定方向的多个分量的值中的、最大值与中央值之差的大小或者最小值与中央值之差的大小和规定的阈值的比较结果来变更上述多个候补值的数量。
5.根据权利要求3所述的运动图像解码方法,其特征在于,
在上述预测向量计算步骤中,当上述最大值与上述中央值之差的大小或者上述最小值与上述中央值之差的大小比规定的阈值还大的情况下,在上述多个候补值中包括:以上述最大值和上述中央值为变量的函数值、或者以上述最小值和上述中央值为变量的函数值。
6.根据权利要求3所述的运动图像解码方法,其特征在于,
在上述预测向量计算步骤中,根据编码流中所包含的表示将哪个候补向量作为预测向量来利用的附加比特来进行选择上述多个候补值中的某一个的值的处理。
7.根据权利要求1所述的运动图像解码方法,其特征在于,
在上述预测向量计算步骤之前还包括对编码流进行可变长度解码处理的可变长度解码步骤,
在上述可变长度解码步骤中,取得已经被解码了的多个周边块的运动向量,根据多个周边块的运动向量的分布和编码流中包含的表示将哪个候补向量作为预测向量来利用的附加比特,从多个可变长度编码表中选择一个可变长度编码表,使用该选择的可变长度编码表进行差分向量的解码。
8.一种运动图像编码方法,其特征在于,包括:
画面间预测处理步骤,进行画面间预测处理;
预测向量计算步骤,进行预测向量的计算;以及
差分向量计算步骤,计算在上述画面间预测处理步骤中计算出的运动向量与在上述预测向量计算步骤中计算出的预测向量的差分向量,
在上述预测向量计算步骤中,根据在作为编码对象块的周边块的已经被编码了的块群的多个运动向量中的规定运动向量间的差的大小切换上述预测向量的计算方式。
9.根据权利要求8所述的运动图像编码方法,其特征在于,
在上述预测向量计算步骤中,根据在作为编码对象块的周边块的已经被编码了的块群的多个运动向量的关于规定方向的多个分量的值中,最大值与中央值之差的大小或者最小值与中央值之差的大小和规定的阈值的比较结果来切换上述预测向量的计算方式。
10.根据权利要求8所述的运动图像编码方法,其特征在于,
在上述预测向量计算步骤中,上述预测向量计算方式是:选择在作为编码对象块的周边块的已经被编码了的块群的多个运动向量的关于规定方向的多个分量的值中、包括最大值、最小值或者中央值的多个候补值中的某一个的值,作为关于上述规定方向的预测向量分量而计算出来。
11.根据权利要求10所述的运动图像编码方法,其特征在于,
在上述预测向量计算步骤中,根据在作为编码对象块的周边块的已经被编码了的块群的多个运动向量的关于规定方向的多个分量的值中的、最大值与中央值之差的大小或者最小值与中央值之差的大小和规定的阈值的比较结果来变更上述多个候补值的数。
12.根据权利要求10所述的运动图像编码方法,其特征在于,
在上述预测向量计算步骤中,当上述最大值与上述中央值之差的大小或者上述最小值与上述中央值之差的大小比规定的阈值还大的情况下,在上述多个候补值中包括:以上述最大值和上述中央值为变量的函数值、或者以上述最小值和上述中央值为变量的函数值。
13.根据权利要求10所述的运动图像编码方法,其特征在于,
在上述预测向量计算步骤中,根据上述多个候补值的选择的结果,变更包含于编码流中、且表示表示将哪个候补向量作为预测向量来利用的附加比特的比特数。
14.根据权利要求10所述的运动图像编码方法,其特征在于,
还包括对在上述差分向量计算步骤中计算出的差分向量进行可变长度编码的可变长度编码步骤,
在上述可变长度编码步骤中,根据上述多个候补值的选择结果来变更在可变长度编码处理中所使用的编码表。
CN2009801290831A 2008-09-29 2009-06-02 运动图像编码方法以及运动图像解码方法 Active CN102047665B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2008249515A JP5422168B2 (ja) 2008-09-29 2008-09-29 動画像符号化方法および動画像復号化方法
JP2008-249515 2008-09-29
PCT/JP2009/002460 WO2010035370A1 (ja) 2008-09-29 2009-06-02 動画像符号化方法および動画像復号化方法

Publications (2)

Publication Number Publication Date
CN102047665A CN102047665A (zh) 2011-05-04
CN102047665B true CN102047665B (zh) 2013-03-27

Family

ID=42059386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801290831A Active CN102047665B (zh) 2008-09-29 2009-06-02 运动图像编码方法以及运动图像解码方法

Country Status (6)

Country Link
US (7) US8693546B2 (zh)
EP (3) EP4024866A1 (zh)
JP (1) JP5422168B2 (zh)
CN (1) CN102047665B (zh)
PL (1) PL3370423T3 (zh)
WO (1) WO2010035370A1 (zh)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101768207B1 (ko) * 2010-01-19 2017-08-16 삼성전자주식회사 축소된 예측 움직임 벡터의 후보들에 기초해 움직임 벡터를 부호화, 복호화하는 방법 및 장치
JP6523494B2 (ja) * 2010-01-19 2019-06-05 サムスン エレクトロニクス カンパニー リミテッド 縮小された予測動きベクトルの候補に基づいて、動きベクトルを符号化/復号化する方法及び装置
WO2012077928A1 (ko) * 2010-12-07 2012-06-14 한국전자통신연구원 초고해상도 영상을 부호화하는 장치 및 방법, 그리고 복호화 장치 및 방법
WO2011121942A1 (ja) * 2010-03-31 2011-10-06 株式会社Jvcケンウッド 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム、ならびに動画像復号装置、動画像復号方法及び動画像復号プログラム
MX2012010863A (es) 2010-04-01 2012-10-15 Sony Corp Dispositivo y metodo de procesamiento de imagenes.
JP2011223176A (ja) * 2010-04-06 2011-11-04 Sony Corp 画像処理装置および方法
JP5368631B2 (ja) 2010-04-08 2013-12-18 株式会社東芝 画像符号化方法、装置、及びプログラム
ES2907203T3 (es) 2010-04-13 2022-04-22 Ge Video Compression Llc Codificación de vídeo que usa subdivisiones multiárbol de imágenes
CN102939750B (zh) 2010-04-13 2016-07-06 Ge视频压缩有限责任公司 跨平面预测
JP5718453B2 (ja) 2010-04-13 2015-05-13 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 復号化方法
CN106454370B (zh) 2010-04-13 2019-11-01 Ge视频压缩有限责任公司 解码器、重建数组的方法、编码器、编码方法及数据流
WO2012008040A1 (ja) * 2010-07-15 2012-01-19 株式会社 東芝 画像符号化方法及び画像復号化方法
CN102131069B (zh) * 2010-11-25 2013-01-23 华为技术有限公司 视频呼叫方法、***、终端及移动交换中心
GB2487200A (en) * 2011-01-12 2012-07-18 Canon Kk Video encoding and decoding with improved error resilience
JP2012151576A (ja) 2011-01-18 2012-08-09 Hitachi Ltd 画像符号化方法、画像符号化装置、画像復号方法及び画像復号装置
CA2825730C (en) 2011-02-10 2018-01-16 Panasonic Corporation Moving picture coding method, moving picture coding apparatus, moving picture decoding method, moving picture decoding apparatus, and moving picture coding and decoding apparatus
US20120268551A1 (en) * 2011-04-19 2012-10-25 Ben Wu Image Interaction Device, Interactive Image Operating System, and Interactive Image Operating Method thereof
JP2013012905A (ja) * 2011-06-29 2013-01-17 Sony Corp 画像処理装置および方法
KR101809881B1 (ko) * 2011-09-28 2017-12-15 가부시키가이샤 제이브이씨 켄우드 동영상 디코딩 장치, 동영상 디코딩 방법 및 동영상 디코딩 프로그램을 저장한 기록매체
MX346561B (es) 2012-07-02 2017-03-24 Samsung Electronics Co Ltd Metodo y aparato para predecir un vector de movimiento para la codificacion de video o decodificacion de video.
US10063887B2 (en) * 2013-10-18 2018-08-28 Lg Electronics Inc. Video decoding apparatus and method for decoding multi-view video
JP5750191B2 (ja) * 2014-10-15 2015-07-15 日立マクセル株式会社 画像復号化方法
JP5911982B2 (ja) * 2015-02-12 2016-04-27 日立マクセル株式会社 画像復号化方法
EP3349458A4 (en) * 2015-11-24 2018-10-24 Samsung Electronics Co., Ltd. Encoding sequence encoding method and device thereof, and decoding method and device thereof
KR20170096088A (ko) * 2016-02-15 2017-08-23 삼성전자주식회사 영상처리장치, 영상처리방법 및 이를 기록한 기록매체
JP5951915B2 (ja) * 2016-03-30 2016-07-13 日立マクセル株式会社 画像復号化方法
JP5946980B1 (ja) * 2016-03-30 2016-07-06 日立マクセル株式会社 画像復号化方法
JP6181242B2 (ja) * 2016-06-08 2017-08-16 日立マクセル株式会社 画像復号化方法
US10855986B2 (en) * 2018-05-29 2020-12-01 Qualcomm Incorporated Bandwidth compression for neural network systems
CN111131829B (zh) * 2018-10-31 2021-12-24 联发科技股份有限公司 视频编码装置及方法
US10666985B1 (en) * 2018-11-18 2020-05-26 Sony Corporation Sub-block based entropy coding for image coding
US10841617B2 (en) 2018-11-27 2020-11-17 Semiconductor Components Industries, Llc Methods and apparatus for successive intra block prediction
WO2020114404A1 (en) 2018-12-03 2020-06-11 Beijing Bytedance Network Technology Co., Ltd. Pruning method in different prediction mode
JP7499854B2 (ja) * 2019-12-30 2024-06-14 鴻穎創新有限公司 ビデオデータをコーディングするデバイス及び方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6020933A (en) * 1997-09-30 2000-02-01 Daewoo Electronics Co., Ltd. Method and apparatus for encoding a motion vector
CN1507751A (zh) * 2002-01-18 2004-06-23 株式会社东芝 视频编码方法和装置以及视频解码方法和装置
CN1550110A (zh) * 2002-01-24 2004-11-24 ������������ʽ���� 运动图像的编码方法、解码方法、编码装置及解码装置

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0533195A2 (en) 1991-09-20 1993-03-24 Sony Corporation Picture signal encoding and/or decoding apparatus
JPH05227522A (ja) * 1991-09-20 1993-09-03 Sony Corp 画像符号化装置および画像復号化装置
JPH10224800A (ja) * 1997-02-07 1998-08-21 Matsushita Electric Ind Co Ltd 動きベクトル符号化方法および復号化方法
US7206346B2 (en) * 1997-06-25 2007-04-17 Nippon Telegraph And Telephone Corporation Motion vector predictive encoding method, motion vector decoding method, predictive encoding apparatus and decoding apparatus, and storage media storing motion vector predictive encoding and decoding programs
KR100252342B1 (ko) * 1997-08-12 2000-04-15 전주범 움직임 벡터 부호화 방법 및 그 장치
KR100249223B1 (ko) * 1997-09-12 2000-03-15 구자홍 엠팩(mpeg)-4의움직임벡터코딩방법
JP4142180B2 (ja) 1998-10-29 2008-08-27 富士通株式会社 動きベクトル符号化装置および復号装置
KR100739281B1 (ko) * 2000-02-21 2007-07-12 주식회사 팬택앤큐리텔 움직임 추정 방법 및 장치
US7184399B2 (en) 2001-12-28 2007-02-27 Intel Corporation Method for handling completion packets with a non-successful completion status
KR100774296B1 (ko) * 2002-07-16 2007-11-08 삼성전자주식회사 움직임 벡터 부호화 방법, 복호화 방법 및 그 장치
US7978769B2 (en) * 2003-06-30 2011-07-12 Ntt Docomo, Inc. Method and apparatus for coding motion information
US8913660B2 (en) * 2005-04-14 2014-12-16 Fastvdo, Llc Device and method for fast block-matching motion estimation in video encoders
JP2007043651A (ja) * 2005-07-05 2007-02-15 Ntt Docomo Inc 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
US8488889B2 (en) * 2005-07-22 2013-07-16 Mitsubishi Electric Corporation Image encoder and image decoder, image encoding method and image decoding method, image encoding program and image decoding program, and computer readable recording medium recorded with image encoding program and computer readable recording medium recorded with image decoding program
JP4184389B2 (ja) 2006-06-02 2008-11-19 富士通株式会社 動きベクトル復号装置および復号方法
JP5025286B2 (ja) * 2007-02-28 2012-09-12 シャープ株式会社 符号化装置及び復号装置
US8908765B2 (en) * 2007-11-15 2014-12-09 General Instrument Corporation Method and apparatus for performing motion estimation
KR101228020B1 (ko) * 2007-12-05 2013-01-30 삼성전자주식회사 사이드 매칭을 이용한 영상의 부호화 방법 및 장치, 그복호화 방법 및 장치
KR101279573B1 (ko) * 2008-10-31 2013-06-27 에스케이텔레콤 주식회사 움직임 벡터 부호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
US8462849B2 (en) * 2008-12-23 2013-06-11 General Instrument Corporation Reference picture selection for sub-pixel motion estimation
KR101590511B1 (ko) * 2009-01-23 2016-02-02 에스케이텔레콤 주식회사 움직임 벡터 부호화/복호화 장치 및 방법과 그를 이용한 영상 부호화/복호화 장치 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6020933A (en) * 1997-09-30 2000-02-01 Daewoo Electronics Co., Ltd. Method and apparatus for encoding a motion vector
CN1507751A (zh) * 2002-01-18 2004-06-23 株式会社东芝 视频编码方法和装置以及视频解码方法和装置
CN1550110A (zh) * 2002-01-24 2004-11-24 ������������ʽ���� 运动图像的编码方法、解码方法、编码装置及解码装置

Also Published As

Publication number Publication date
US9854265B2 (en) 2017-12-26
US20210176487A1 (en) 2021-06-10
PL3370423T3 (pl) 2022-03-21
EP3370423B1 (en) 2021-11-17
US10097856B2 (en) 2018-10-09
US11109054B2 (en) 2021-08-31
US9131218B2 (en) 2015-09-08
US8693546B2 (en) 2014-04-08
US20110142133A1 (en) 2011-06-16
EP2343902A4 (en) 2013-08-14
JP2010081465A (ja) 2010-04-08
US20180084273A1 (en) 2018-03-22
EP3370423A1 (en) 2018-09-05
EP2343902A1 (en) 2011-07-13
EP2343902B1 (en) 2018-05-09
EP4024866A1 (en) 2022-07-06
CN102047665A (zh) 2011-05-04
US20150373365A1 (en) 2015-12-24
EP3370423B8 (en) 2021-12-22
US20190391754A1 (en) 2019-12-26
US20140146888A1 (en) 2014-05-29
JP5422168B2 (ja) 2014-02-19
US10448045B2 (en) 2019-10-15
US11496764B2 (en) 2022-11-08
WO2010035370A1 (ja) 2010-04-01
US20180376163A1 (en) 2018-12-27

Similar Documents

Publication Publication Date Title
CN102047665B (zh) 运动图像编码方法以及运动图像解码方法
RU2597521C1 (ru) Способ и устройство для кодирования/декодирования вектора движения
CN108134939B (zh) 一种运动估计方法及装置
KR20200015734A (ko) 다중 참조 예측을 위한 움직임 벡터 개선
US20100091846A1 (en) Image prediction/encoding device, image prediction/encoding method, image prediction/encoding program, image prediction/decoding device, image prediction/decoding method, and image prediction decoding program
CN102823250A (zh) 图像编码装置、图像解码装置、图像编码方法以及图像解码方法
KR20130126698A (ko) 영상 부호화 장치, 영상 부호화 방법 및 영상 부호화 프로그램
CN108401185B (zh) 参考帧选择方法、视频转码方法、电子设备和存储介质
CN103430543A (zh) 重构和编码图像块的方法
US11528485B2 (en) Encoding apparatus and program
JP5788952B2 (ja) 動画像復号化方法
US9521417B2 (en) Video encoding device using predicted motion vector for blocks of different size
CN113422951B (zh) 一种解码、编码方法、装置及其设备
JP5890933B1 (ja) 動画像復号化方法
CN110365987B (zh) 一种运动矢量确定方法、装置及其设备
JP5887020B1 (ja) 動画像復号化方法
JP2008072608A (ja) 画像符号化装置及び画像符号化方法
JP5864023B2 (ja) 予測ベクトルの算出方法
JP5864022B2 (ja) 動画像復号化方法
JP2016136741A (ja) 動画像復号化方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: HITACHI MAXELL LTD.

Free format text: FORMER OWNER: HITACHI,LTD.

Effective date: 20150331

TR01 Transfer of patent right

Effective date of registration: 20150331

Address after: Osaka

Patentee after: HITACHI MAXELL, Ltd.

Address before: Tokyo, Japan

Patentee before: Hitachi, Ltd.

TR01 Transfer of patent right

Effective date of registration: 20171219

Address after: Kyoto Japan

Patentee after: MAXELL, Ltd.

Address before: Osaka

Patentee before: Hitachi Maxell, Ltd.

TR01 Transfer of patent right
CP01 Change in the name or title of a patent holder

Address after: Kyoto Japan

Patentee after: MAXELL, Ltd.

Address before: Kyoto Japan

Patentee before: MAXELL HOLDINGS, Ltd.

CP01 Change in the name or title of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20220614

Address after: Kyoto Japan

Patentee after: MAXELL HOLDINGS, Ltd.

Address before: Kyoto, Japan

Patentee before: MAXELL, Ltd.

TR01 Transfer of patent right