CN103813172B - 视讯译码装置及存储器分配方法 - Google Patents

视讯译码装置及存储器分配方法 Download PDF

Info

Publication number
CN103813172B
CN103813172B CN201410047255.3A CN201410047255A CN103813172B CN 103813172 B CN103813172 B CN 103813172B CN 201410047255 A CN201410047255 A CN 201410047255A CN 103813172 B CN103813172 B CN 103813172B
Authority
CN
China
Prior art keywords
motion vector
memory
macroblock
memory size
maximum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410047255.3A
Other languages
English (en)
Other versions
CN103813172A (zh
Inventor
张永昌
王智鸣
李坤傧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MediaTek Inc
Original Assignee
MediaTek Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MediaTek Inc filed Critical MediaTek Inc
Publication of CN103813172A publication Critical patent/CN103813172A/zh
Application granted granted Critical
Publication of CN103813172B publication Critical patent/CN103813172B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种视讯译码装置及存储器分配方法,其中存储器分配方法包括接收视讯比特流;取得与该视讯比特流有关的一组限制条件,其中该组限制条件包括目标分辨率级别及图像中两连续宏模块所需存储的运动矢量个数的最大值;以及根据该目标分辨率级别,分配具有第一存储器大小的第一存储器,用以存储一张图像中的与多个宏模块有关的运动矢量信息,其中该第一存储器大小小于第二存储器大小,该第二存储器大小根据该所需存储的运动矢量个数的该最大值所计算出的。利用本发明,能够减少所需存储的运动矢量信息,因此可使用较少的存储空间与传输带宽。

Description

视讯译码装置及存储器分配方法
技术领域
本发明有关于视讯译码领域,特别是关于存储器分配方法,以及使用该方法的视讯译码装置,用以减少存储运动矢量信息时的存储器需求。
背景技术
随着消费者对多媒体娱乐信息以及更高显示质量的需求增加,对于视讯内容的处理、传送及存储资源等需求,如存储容量及带宽等也随之增加。许多标准已经建立,例如ITU-T H.264视讯编译码标准,用以确保视讯内容的显示质量,同时在压缩及解压缩效率方面也有相当多的进步。
ITU-T H.264标准为基于块的(block-based)视讯编译码标准,用以提供强化的视讯内容压缩比,同时不需大幅牺牲视讯质量。对于H.264标准来说,采用帧内(intra-frame)与帧间(inter-frame)的预测模式(prediction mode),用以减低当前图像的空间相关性(spatial correlations),以及在连续视讯图像中时间上的冗余(temporalredundancies)。在帧间预测模式中,有一种模式称为直接预测模式(direct predictionmode),直接预测模式使用其他视讯图像的运动矢量信息,用以产生符合标准的压缩比特流。
虽然ITU-T H.264标准指定了符合标准的压缩比特流的格式及解压缩的方法,仍然有些许自由空间可增进存储器的存储容量及传输带宽。举例来说,由于更高的显示质量会有更高的分辨率及更快的帧速率(frame rate),保持先前视讯图像的运动矢量信息用于后续视讯图像的译码反而会消耗更多的存储空间及传输带宽,同时也会降低译码效率。
因此,需要一种可以让视讯译码装置根据压缩比特流的语法信息(syntaxinformation)用以减低不必要的运动矢量信息的译码技术。
发明内容
有鉴于此,本发明提供一种视讯译码装置及存储器分配方法以解决上述问题。
本发明另提供一种存储器分配方法,用以存储运动矢量信息,包括:接收视讯比特流;取得与该视讯比特流有关的一组限制条件,其中该组限制条件包括目标分辨率级别及图像中两连续宏模块所需存储的运动矢量个数的最大值;以及根据该目标分辨率级别,分配具有第一存储器大小的第一存储器,用以存储一张图像中的与多个宏模块有关的运动矢量信息,其中该第一存储器大小小于第二存储器大小,该第二存储器大小根据该所需存储的运动矢量个数的该最大值所计算出的。
本发明另提供一种视讯译码装置,包括:比特流解析器,用以接收视讯比特流,并取得与该视讯比特流有关的一组限制条件,其中该组限制条件包括目标分辨率级别及用以存储图像中连续两个宏模块的运动矢量个数的最大值;存储器;以及计算单元,根据该目标分辨率级别,分配具有第一存储器大小的第一存储器,用以存储与图像中多个宏模块有关的运动矢量信息,其中该第一存储器大小小于第二存储器大小,该第二存储器大小是根据该所需存储的运动矢量个数的该最大值所计算出的。
利用本发明,能够减少所需存储的运动矢量信息,因此可使用较少的存储空间与传输带宽。
附图说明
图1所示为本发明一实施例的视讯译码装置的功能方块图。
图2所示为视讯比特流中一图像的宏模块示意图。
图3所示为本发明实施例的具有直接预测模式宏模块的B型切片示意图。
图4所示为本发明一实施例中目标分辨率级别与直接8x8判断标志间的关系列表。
图5所示为本发明之一实施例中存储运动矢量信息的方法流程图。
图6所示为本发明一实施例中存储运动矢量信息的方法流程图。
图7所示为本发明一实施例中各个级别的限制表。
图8所示为本发明一实施例的存储运动矢量信息的存储器分配方法流程图。
具体实施方式
本发明所揭露的内容提供许多不同的实施例,用以实行许多实施例的不同特征。以下指定例子的组件及排列方式的描述是为了简化揭露本发明。此仅为实施例,并非用以限制本发明。
图1所示为本发明一实施例的视讯译码装置10的功能方块图。
如图1所示,视讯译码装置10包括比特流解析器(parser)102、计算单元104以及存储器106。比特流解析器102用以接收符合ITU-T H.264标准的视讯比特流108。更进一步,比特流解析器102取得与视讯比特流108有关的一组限制条件(a set of constraints),如序列参数集(sequence parameter set,SPS)。该序列参数集标示了视讯比特流108的编码信息,例如是编码模式(encoding mode)、级别(如目标分辨率级别)或是配置文件(profile),但不限于此。该组限制条件定义于视讯比特流108的头文件信息。
图2所示为视讯比特流108中一图像的宏模块20的示意图。参考图1及图2,计算单元104耦接于比特流解析器102,用以计算与宏模块20有关的运动矢量信息。一般而言,在每个宏模块中可以有不同分割的组合及子分区宏模块(sub-macroblock partitions)。举例来说,如图2所示的宏模块20分割成16个4x4子分区宏模块,例如202A、202B、202C...202N、202O以及202P,但不限于此。在本发明的实施例中,宏模块20亦可分割成2个16x8子分区宏模块、2个8x16子分区宏模块、4个8x8子分区宏模块、8个8x4子分区宏模块或是8个4x8子分区宏模块。
除此之外,宏模块根据H.264标准,可区分为帧内预测宏模块(intra-frameprediction macroblock)及帧间预测宏模块(inter-frame prediction macroblock)。帧内预测宏模块不用参考先前译码的图像即可进行编码。相对地,帧间预测宏模块则需要参考先前译码的参考图像进行编码。称为直接预测模式的帧间预测模式,用以对图像中的宏模块进行编码/译码,该宏模块没有运动矢量信息在比特流中进行传输。更精确地来说,在直接预测模式的图像中宏模块使用与其他图像的同一位置宏模块(co-locatedmacroblock)的运动矢量信息来进行编码/译码。
更进一步,根据ITU-T H.264标准,双向预测切片(bi-direction predictionslice;亦可称为B型切片)的特征是同时具有帧内预测宏模块及帧间预测宏模块,帧内预测宏模块的编码不需参考先前的图像,而帧间预测宏模块的编码需要参考先前的基准图像,用以增进编码效率。举例来说,帧间预测宏模块可区分成基准图像列表(list)0的预测模式宏模块、基准图像列表1的预测模式宏模块、双向预测模式宏模块以及直接预测模式宏模块,但不限于此。在直接预测模式中,与B型切片中一当前宏模块(current macroblock)有关的运动矢量信息,可以由基准图像列表1中一相邻图像的同一位置宏模块有关的运动矢量信息推导而得。对于帧内宏模块来说,并无运动矢量信息由基准图像列表1中一相邻图像的同一位置宏模块推导而得。因此,此方法对于减低用于运动矢量信息的存储器大小及带宽相当有利。减低存储运动矢量信息所需存储空间的过程将会在下面详述。
图3所示为本发明实施例之一具有直接预测模式宏模块的B型切片的示意图。参考图1及图3,直接预测模式宏模块608处于视讯比特流108中图像602的一B型切片中,直接预测模式宏模块608可通过分别指向不同的基准图像604及606的两个运动矢量预测,基准图像604及606被指派至不同的基准图列表(基准图像列表0及基准图像列表1)。两个运动矢量的运算过程如下:
其中代表宏模块610的运动矢量,宏模块610位于基准图像列表1的基准图像606中并为对应于直接预测模式宏模块608的同一位置的宏模块;tb代表图像602与基准图像604之间的距离,td代表基准图像604与基准图像606之间的距离。
于本发明此实施例中,宏模块610用以计算两个运动矢量亦即计算与直接预测模式宏模块608有关的运动矢量信息。因此,当基准图像列表1中的基准图像606经过译码,根据基准图像列表0与基准图像列表1中的基准图像606,可进一步丢弃与宏模块610有关且不必要的运动矢量信息。
在运算过程中,ITU-T H.264标准指定了运动矢量信息使用在不同的级别指数(level indication)及配置文件时的限制。更明确地来说,该组限制条件可在视讯比特流108中加入多个语法要件(syntax element),用以使用在视讯译码装置10。根据图3所示实施例,该组限制条件包括直接8x8判断标志(direct8x8inference flag),该标志代表了视讯比特流108中宏模块的运动矢量分割(motion vector segmentation)。在本发明的实施例中,当一张图像的直接8x8判断标志设定为1时,代表对于后续图像的直接预测宏模块而言,该图像中与某些4x4子分区宏模块有关的运动矢量信息是可以被丢弃并且不用存储在存储器106中。当一张图像的直接8x8判断标志设定为0时,代表该图像中与所有的4x4子分区宏模块有关的运动矢量信息皆需要存储在存储器106中。
在本发明此实施例中,该直接8x8判断标志可用以代表与宏模块20有关的运动矢量分割与运动矢量信息。从细部来看,当该直接8x8判断标志被设定为0时,与16个4x4子分区宏模块202A至202P有关的所有运动矢量信息可被依序存储至存储器106中,用以在视讯译码装置10做后续使用。相对地,当该直接8x8判断标志被设定为1时,只存储与8个4x4子分区宏模块有关的运动矢量信息至存储器106。也就是说,在宏模块20中,只有与4x4子分区宏模块202A、202D、202E、202H、202I、202L、202M以及202P有关的运动矢量信息才会被存储。因此,所需的存储器的存储空间得以减少,同时亦可增加可使用的传输带宽。在本发明的一实施例中,当该直接8x8判断标志被设定为1时,只有与4x4子分区宏模块202A、202D、202E、202H、202I、202L、202M以及202P有关的运动矢量信息才会被存储至存储器106。因此,当直接8x8判断标志被设定为1时,因为运动矢量信息减少,所以会使用较少的存储空间与传输带宽。
在本发明的一实施例中,根据与该直接8x8判断标志有关的信息,例如图像的目标分辨率级别(target resolution level),与宏模块610有关的不必要的运动矢量信息亦可丢弃。图4所示为本发明一实施例中目标分辨率级别与直接8x8判断标志间的关系列表30。如图4所示,当用以显示目标分辨率级别的级别指数(level indication)大于或等于ITU-TH.264标准所定义的级别3时,该直接8x8判断标志会被设定为1。相对地,当级别指数小于ITU-T H.264标准所定义的级别3时,该直接8x8判断标志不会被设定为1,反而会被标示为“-”,用以代表无相关的限制。因此,在本发明之一实施例中,该直接8x8判断标志是否设定为1系取决于级别指数。在本发明此实施例中,计算单元104决定级别指数是否大于或等于ITU-T H.264标准定义的级别3。这是因为级别指数相对为高时,对于视讯比特流108来说,可只存储如图2中所示的8个4x4子分区宏模块202A、202D、202E、202H、202I、202L、202M以及202P有关的运动矢量信息。因此,当级别指数超过一预定级别时,因为运动矢量信息减少,所以会使用较少的存储空间与传输带宽。
图5所示为本发明之一实施例中存储运动矢量信息的方法流程图。
参考图1、图2以及图3,比特流解析器102接收符合ITU-T H.264标准的视讯比特流108(步骤S502)。接着,比特流解析器102取得一组限制条件,该组限制条件具有与视讯比特流108有关的多个语法组件(syntax elements)(步骤S504)。需要注意的是,该组限制条件定义于视讯比特流108的头文件信息中,并具有与该直接8x8判断标志有关的信息。在本发明的一实施例中,该信息可为直接8x8判断标志本身及/或级别指数,但不限于此。
更进一步,计算单元104计算与当前宏模块(例如图2所示的宏模块20)有关的运动矢量信息(步骤S506)。接着,计算单元104根据与该直接8x8判断标志有关的信息,选择性地存储所计算出来的全部运动矢量信息或是其中一部份(步骤S508)。
在本发明的一实施例中,接着可决定是否可取得该直接8x8判断标志。综上所述,该直接8x8判断标志可表示如图2所示宏模块20的运动矢量分割。当可取得该直接8x8判断标志时,可更进一步决定该直接8x8判断标志的数值是否等于1(或设定为1)。
在本发明的一实施例中,若该直接8x8判断标志等于1,计算单元104只取得并存储视讯比特流108中与8个4x4子分区宏模块202A、202D、202E、202H、202I、202L、202M以及202P有关的运动矢量信息至存储器106。否则,计算单元104必须存储与全部16个4x4子分区宏模块202A至202P有关的运动矢量信息至存储器106。因此,当直接8x8判断标志被设定为1时,因为运动矢量信息减少,所以会使用较少的存储空间与传输带宽。
根据本发明的另一实施例,计算单元104当无法取得直接8x8判断标志时,可进一步决定由该组限制条件中取得的级别指数是否超过一预定级别,例如ITU-T H.264标准中定义的级别3。同样地,当级别指数超过该预定级别时,计算单元104只存储视讯比特流108中8个4x4子分区宏模块202A、202D、202E、202H、202I、202L、202M以及202P有关的运动矢量信息至存储器106。否则,计算单元104会存储与全部16个4x4子分区宏模块202A至202P有关的运动矢量信息至存储器106。因此,当级别指数超过一预定级别时,因为运动矢量信息减少,所以会使用较少的存储空间与传输带宽。
本发明更提供另一存储运动矢量信息的方法,该方法使用更少的存储空间与传输带宽。图6所示为本发明一实施例的存储运动矢量信息的方法流程图。
如图1、图3及图6所示,比特流解析器102接收符合ITU-T H.264标准的视讯比特流108(步骤S602)。由上所述,可得知视讯比特流108包括图像602及基准图像606,图像602包括具有直接预测模式宏模块608的B型切片,基准图像606包括与直接预测模式宏模块608有关的宏模块610。
再来,计算单元104计算与当前宏模块(例如图3所示基准图像606中的宏模块610)有关的运动矢量信息(步骤S604)。举例来说,运动矢量信息具有指向(referring to)指定基准图像列表0或基准图像列表1的运动矢量数据。接着,决定是否可取得基准图像606中的宏模块610所指定的基准图像列表0或基准图像列表1。也就是说,计算单元104决定基准图像606中的宏模块610是否具有指向指定基准图像列表0或基准图像列表1的运动矢量数据(步骤S606)。
根据本发明之一实施例,假设宏模块610处于帧内模式下,则宏模块610为帧内模式宏模块。在此实施例中,位置相对宏模块610不具有指向指定基准图像列表0和基准图像列表1的运动矢量数据。因此,与宏模块610有关的运动矢量信息会被设定为0,并存储至存储器106中(步骤S608)。
接着,决定宏模块610是否具有指向所指定的基准图像列表0的运动矢量数据(步骤S610)。
当宏模块610具有指向指定基准图像列表0的运动矢量数据时,计算单元104不管指向所指定的基准图像列表1的运动矢量数据,只存储指向所指定的基准图像列表0的运动矢量数据至存储器106(步骤612)。否则计算单元104存储指向所指定的基准图像列表1的运动矢量数据至存储器106(步骤614)。因此,与直接预测模式宏模块608有关的运动矢量信息根据存储在存储器106中与宏模块610有关的运动矢量数据进行计算。根据上述本发明之实施例,在步骤S612及S614,只有指向基准图像列表0或基准图像列表1的一半运动矢量数据需要存储。因此,因为运动矢量数据减少,所以会使用较少的存储空间与传输带宽。本领域任何普通技术人员可依据本发明精神轻易完成改变或均等性安排均属于本发明所主张的保护范围。举例来说,如图6所示的存储运动矢量信息的方法可修改为先决定宏模块610是否具有指向指定的基准图像列表0的运动矢量数据,若相对宏模块610不具有参考至基准图像列表0的运动矢量数据,则接着再决定相对宏模块610是否具有指向指定的基准图像列表1的运动矢量数据。否则,计算单元104决定宏模块610不具有指向基准图像列表0及基准图像列表1的运动矢量数据。因此,相关的步骤S608、S612及S614根据上述的决定结果,用以进行操作。本领域技术人员可在阅读上述段落之后理解如何操作本发明的步骤,为了简洁,更进一步的叙述在此省略。
在本发明之一实施例中,如图6所示的存储运动矢量信息的方法可以与图5的方法结合,用以进一步减少内存使用空间及传输带宽。在此实施例中,在步骤S606之前,比特流解析器102取出一组限制条件,该组限制条件具有与视讯比特流108有关的多个语法组件。需要注意的是,该组限制条件定义于视讯比特流108的头文件信息中,并具有与该直接8x8判断标志有关的信息。举例来说,该信息可为直接8x8判断标志本身及/或级别指数,但不限于此。
当可取得该直接8x8判断标志时,计算单元104更进一步决定该直接8x8判断标志的数值是否等于1。在步骤S608、S610或S614,若该直接8x8判断标志等于1,计算单元104所存储的运动矢量数据只与视讯比特流108中8个4x4子分区宏模块202A、202D、202E、202H、202I、202L、202M以及202P有关。否则在步骤S608、S610或S614中,计算单元104所存储的运动矢量数据与全部16个4x4子分区宏模块202A至202P有关。因此,当该直接8x8判断标志等于1时,由于运动矢量数据更少,存储空间及传输带宽可进一步减少。
根据本发明的另一实施例,当由该组限制条件可取得级别指数时,计算单元104更进一步决定该级别指数是否超过一预定级别,例如ITU-T H.264标准中定义的级别3。在步骤S608、S610或S614,若级别指数超过该预定级别,计算单元104所存储的运动矢量数据只与视讯比特流108中8个4x4子分区宏模块202A、202D、202E、202H、202I、202L、202M以及202P有关。否则,计算单元104所存储的运动矢量数据与全部16个4x4子分区宏模块202A至202P有关。因此,当级别指数超过预定级别时,由于运动矢量信息减少,存储空间及传输带宽可更进一步减少。
本发明上述实施例用于说明级别指数可用以减少所需的内存存储空间。如图7所示,除了级别指数之外,ITU-T H.264标准亦提供其他限制,特别用以减少存储空间。亦即用以存储运动矢量信息所需的存储器的存储空间可预先分配至存储器106中,该存储器分配根据级别指数或是其他可取得的语法组件。
图7所示为本发明实施例中各个级别的限制表40。在图4中标示“-”的字段代表没有相关的限制。
如图7所示,在限制表40中所指定MaxMvsPer2Mb的语法组件用以表示视讯比特流108中一图像内两个连续宏模块所需的运动矢量个数的最大值。举例来说,假设图2中的宏模块20及其周围宏模块(未画于图上)被分别分割成16个4x4子分区宏模块,且各个分子区宏模块有其自己的运动矢量信息。当MaxMvsPer2MB的语法组件设定为32时,表示一图像中需要存储的两个连续宏模块的运动矢量个数的最大值为32。当MaxMvsPer2MB的语法组件设定为16时,表示一图像中需要存储的两个连续宏模块的运动矢量个数的最大值为16。明显地,当MaxMvsPer2MB的语法组件设定为16时,并非必需分配内存用以存储各个宏模块的32个运动矢量信息。有鉴于此,计算单元104可根据MaxMvsPer2MB的语法组件来分配不同的存储器大小用以存储运动矢量信息。因此,需要的存储空间实质上减少了,同时亦增加了可使用的传输带宽。
更进一步,如图7所示的限制表40,当图像的目标分辨率级别大于3时,MaxMvsPer2MB的语法组件设定为16,且当图像的目标分辨率级别等于3时,MaxMvsPer2MB的语法组件设定为32。除此之外,当级别指数小于ITU-TH.264标准所定义的级别3时,MaxMvsPer2MB的语法组件系被标示为“-”而不设定为16或32,用以表示无相关限制。因此,在一些实施例中,MaxMvsPer2MB的语法组件是否设定为16亦可由级别指数来决定。在此实施例中,计算单元104决定级别指数是否大于预定级别,例如ITU-T H.264标准定义的级别3。这是因为相对高的级别指数可让各个宏模块有关的运动矢量信息所需的存储空间减少。因此,当级别指数超过预定级别时,由于运动矢量信息减少,存储空间及传输带宽可更进一步减少。减少存储运动矢量信息所需空间及分配相关存储器的存储空间的过程将会在下面详述。
图8所示为本发明一实施例的存储运动矢量信息的存储器分配方法流程图。
参考图1及图8,在开始进行存储器分配方法前,比特流解析器102先接收符合ITU-T H.264标准的视讯比特流108(步骤S802)。同样地,比特流解析器102接着取得一组限制条件,该组限制条件具有与视讯比特流108有关的多个语法组件(步骤S804)。需要注意的是该组限制条件定义于视讯比特流108的头文件信息中。同样应该注意的是该存储器分配方法适用于视讯比特流108的各种型式文件,除了扩充形式档(extended profile)。
接着,计算单元104决定该组限制条件的级别指数是否大于预定级别,例如图7所示于ITU-T H.264标准中定义的级别3(步骤S806)。根据本发明的一实施例,若级别指数小于或等于3,计算单元104分配第一存储器,用以存储每个宏模块的16个运动矢量信息(步骤S808)。假设一图像具有小于3的目标分辨率级别,且宏模块的总数为1620。接着,计算单元104计算第一存储器大小,用以存储一图像中连续两个宏模块的32个运动矢量信息。若每个运动矢量有4字节(bytes)大小,则此实施例之第一存储器大小为(1620/2)*32*4=103680字节。因此,计算单元104分配103680字节至第一存储器,用以存储图像中的运动矢量信息。
相对地,若级别指数大于3,计算单元104分配第二存储器,用以存储每连续两个宏模块的16个运动矢量信息以便后续使用(步骤S810)。举例来说,假设一图像具有一高于3的目标分辨率级别,且其具有的宏模块总数为8160。计算单元104接着计算第二存储器大小,用以存储一张图像中每连续两个宏模块的16个运动矢量的信息。举例来说,第二存储器大小可为(8160/2)*16*4=261120字节。因此,计算单元104分配261120字节的第二存储器,用以存储一张图像中的运动矢量信息。
若仍然使用传统方法分配每连续两个宏模块32个运动矢量的第二存储器,则存储器需要分配1044480字节(第三存储器大小),用以存储一张图像中的运动矢量信息。亦即该第三存储器大小为第二存储器大小的4倍。然而,在存储器中有783360字节是非必要的,因为当MaxMvsPer2Mb的语法组件设定为16时,每连续两个宏模块最多只会有16个运动矢量。因此,与传统方法比较,在步骤S810中使用每连续两个宏模块的16个运动矢量用以分配第二存储器大小,可节省四分之三的存储空间。所以当级别指数大于3时,因为运动矢量信息的减少,也同时会使用更少的存储空间及传输带宽。
由上述本发明的实施例,可得知当直接8x8判断标志设定为1时,不会存储宏模块中的16个4x4子分区宏模块的所有运动矢量信息,而只存储宏模块中的8个4x4子分区宏模块的运动矢量信息至存储器106中。明显地,当直接8x8判断标志设定为1时,不需要用每个宏模块的16个运动矢量信息用以分配存储器。有鉴于此,计算单元14可根据直接8x8判断标志分配不同的存储器大小至存储器,用以存储运动矢量信息。所以所需的存储空间实际上减少了,同时可使用的传输带宽也随之增加。
如图4的关系列表30所示,当图像的目标分辨率级别大于ITU-T H.264标准所定义的级别3,直接8x8判断标志则被设定为1。相对地,当图像的目标分辨率级别小于3,直接8x8判断标志不会被设定为1,反而会被标示为“-”,用以代表无相关的限制。因此,在一些实施例中,级别指数(目标分辨率级别)亦可决定直接8x8判断标志是否设定为1。在此实施例中,计算单元104决定级别指数是否超过预定级别,例如ITU-T H.264标准定义的级别3。这是因为相对高的级别可让每个宏模块有关的运动矢量信息所需的存储空间减少一半。所以当级别指数超过预定级别时,因为运动矢量信息减少,也会使用更少的存储空间及传输带宽。
以上所述仅为本发明的优选实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (8)

1.一种存储器分配方法,用以存储运动矢量信息,其特征在于,包括:
接收视讯比特流;
取得与该视讯比特流有关的一组限制条件,其中该组限制条件包括目标分辨率级别及图像中两连续宏模块所需存储的运动矢量个数的最大值;以及
根据该目标分辨率级别,分配具有第一存储器大小的第一存储器,用以存储一张图像中的与多个宏模块有关的运动矢量信息,其中该第一存储器大小小于第二存储器大小,该第二存储器大小根据该所需存储的运动矢量个数的该最大值所计算出的。
2.如权利要求1所述的存储器分配方法,其特征在于,当该目标分辨率级别高于3时分配具有该第一存储器大小的该第一存储器,该第一存储器大小根据该所需存储的运动矢量个数的该最大值的一半所计算出。
3.如权利要求2所述的存储器分配方法,其特征在于,该第一存储器大小是根据一张图像中的宏模块总数与该所需存储的运动矢量个数的该最大值的一半所计算出的,并且该第二存储器大小是根据该宏模块总数与该所需存储的运动矢量个数的该最大值所计算出的。
4.如权利要求2所述的存储器分配方法,其特征在于,还包括于该目标分辨率级别小于或等于3时,分配第二存储器,该第二存储器具有该第二存储器大小,用以存储与该多个宏模块有关的该运动矢量信息。
5.一种视讯译码装置,其特征在于,包括:
比特流解析器,用以接收视讯比特流,并取得与该视讯比特流有关的一组限制条件,其中该组限制条件包括目标分辨率级别及用以存储图像中连续两个宏模块的运动矢量个数的最大值;
存储器;以及
计算单元,根据该目标分辨率级别,分配具有第一存储器大小的第一存储器,用以存储与图像中多个宏模块有关的运动矢量信息,其中该第一存储器大小小于第二存储器大小,该第二存储器大小是根据所需存储的运动矢量个数的该最大值所计算出的。
6.如权利要求5所述的视讯译码装置,其特征在于,当该目标分辨率级别高于3时分配具有该第一存储器大小的该第一存储器,并且该第一存储器大小由该计算单元根据所需存储的运动矢量个数的该最大值的一半所计算出。
7.如权利要求6所述的视讯译码装置,其特征在于,该第一存储器大小根据一张图像中的宏模块总数与所需存储的运动矢量个数的该最大值的一半所计算出,并且该第二存储器大小是根据该宏模块总数与该所需存储的运动矢量个数的该最大值所计算出的。
8.如权利要求6所述的视讯译码装置,其特征在于,当该目标分辨率级别小于或等于3时,该计算单元分配一第二存储器,该第二存储器具有该第二存储器大小,用以存储与该多个宏模块有关的该运动矢量信息。
CN201410047255.3A 2009-11-11 2010-11-04 视讯译码装置及存储器分配方法 Active CN103813172B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US26005309P 2009-11-11 2009-11-11
US61/260,053 2009-11-11
US12/900,269 2010-10-07
US12/900,269 US8594200B2 (en) 2009-11-11 2010-10-07 Method of storing motion vector information and video decoding apparatus
CN201010531599.3A CN102065290B (zh) 2009-11-11 2010-11-04 视讯译码装置、存储运动矢量信息的方法及存储器分配方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201010531599.3A Division CN102065290B (zh) 2009-11-11 2010-11-04 视讯译码装置、存储运动矢量信息的方法及存储器分配方法

Publications (2)

Publication Number Publication Date
CN103813172A CN103813172A (zh) 2014-05-21
CN103813172B true CN103813172B (zh) 2017-03-01

Family

ID=43974151

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201410047255.3A Active CN103813172B (zh) 2009-11-11 2010-11-04 视讯译码装置及存储器分配方法
CN201010531599.3A Active CN102065290B (zh) 2009-11-11 2010-11-04 视讯译码装置、存储运动矢量信息的方法及存储器分配方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201010531599.3A Active CN102065290B (zh) 2009-11-11 2010-11-04 视讯译码装置、存储运动矢量信息的方法及存储器分配方法

Country Status (3)

Country Link
US (2) US8594200B2 (zh)
CN (2) CN103813172B (zh)
TW (1) TWI410138B (zh)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102282803B1 (ko) 2010-04-13 2021-07-28 지이 비디오 컴프레션, 엘엘씨 평면 간 예측
KR102145722B1 (ko) 2010-04-13 2020-08-20 지이 비디오 컴프레션, 엘엘씨 샘플 영역 병합
DK3301648T3 (da) 2010-04-13 2020-04-06 Ge Video Compression Llc Nedarvning i samplearraymultitræsunderinddeling
CN106231336B (zh) 2010-04-13 2020-06-12 Ge视频压缩有限责任公司 解码器、解码方法、编码器以及编码方法
US8527689B2 (en) * 2010-10-28 2013-09-03 Lsi Corporation Multi-destination direct memory access transfer
CN103797795B (zh) * 2011-07-01 2017-07-28 谷歌技术控股有限责任公司 用于运动矢量预测的方法和设备
TW201306568A (zh) 2011-07-20 2013-02-01 Novatek Microelectronics Corp 移動估測方法
US9185428B2 (en) 2011-11-04 2015-11-10 Google Technology Holdings LLC Motion vector scaling for non-uniform motion vector grid
US9392235B2 (en) 2011-11-18 2016-07-12 Google Technology Holdings LLC Explicit way for signaling a collocated reference picture for video coding
CN103959774B (zh) * 2011-11-18 2017-11-24 谷歌技术控股有限责任公司 用于高效视频编码的运动信息的有效存储
US9350992B2 (en) 2011-11-18 2016-05-24 Google Technology Holdings LLC Explicit way for signaling a collocated picture for high efficiency video coding
WO2013078248A1 (en) 2011-11-21 2013-05-30 General Instrument Corporation Implicit determination and combined implicit and explicit determination of collocated picture for temporal prediction
BR112014015790A2 (pt) 2011-12-26 2018-05-22 Motorola Mobility Llc determinação implícita de figura colocalizada para predição temporal
CN107257482A (zh) * 2012-02-07 2017-10-17 松下知识产权经营株式会社 图像处理装置、图像处理方法、程序以及集成电路
US9210425B2 (en) 2012-04-11 2015-12-08 Google Technology Holdings LLC Signaling of temporal motion vector predictor (MVP) flag for temporal prediction
US9549177B2 (en) 2012-04-11 2017-01-17 Google Technology Holdings LLC Evaluation of signaling of collocated reference picture for temporal prediction
US9172970B1 (en) 2012-05-29 2015-10-27 Google Inc. Inter frame candidate selection for a video encoder
US11317101B2 (en) 2012-06-12 2022-04-26 Google Inc. Inter frame candidate selection for a video encoder
US9319681B2 (en) 2012-07-18 2016-04-19 Google Technology Holdings LLC Signaling of temporal motion vector predictor (MVP) enable flag
US9485515B2 (en) 2013-08-23 2016-11-01 Google Inc. Video coding using reference motion vectors
US9503746B2 (en) 2012-10-08 2016-11-22 Google Inc. Determine reference motion vectors
EP2966868B1 (en) * 2012-10-09 2018-07-18 HFI Innovation Inc. Method for motion information prediction and inheritance in video coding
WO2015062002A1 (en) * 2013-10-31 2015-05-07 Mediatek Singapore Pte. Ltd. Methods for sub-pu level prediction
US9330101B2 (en) * 2013-12-18 2016-05-03 Microsoft Technology Licensing, Llc Using constraints on media file formats to improve performance
CN104954796B (zh) 2014-03-28 2019-06-11 联咏科技股份有限公司 视频处理装置与其视频处理电路
JP6566864B2 (ja) * 2015-12-28 2019-08-28 Kddi株式会社 ビットストリーム変換装置、ビットストリーム変換方法、配信システム及びコンピュータ可読記録媒体
MX2020009056A (es) * 2018-03-01 2020-12-03 Arris Entpr Llc Sistema y método de almacenamiento de información de movimiento para codificación y señalizacion de video.
CN113498609B (zh) * 2018-12-31 2023-06-20 北京达佳互联信息技术有限公司 用于视频编解码的依赖图片分辨率的配置
WO2020140244A1 (zh) * 2019-01-03 2020-07-09 北京大学 一种视频图像处理方法、设备及存储介质
WO2021160176A1 (en) 2020-02-14 2021-08-19 Beijing Bytedance Network Technology Co., Ltd. Use of general constraint flags in video bitstreams

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1487748A (zh) * 2002-10-04 2004-04-07 Lg������ʽ���� B图像的直接模式运动矢量计算方法
CN1859545A (zh) * 2005-05-06 2006-11-08 联发科技股份有限公司 数字视讯处理装置及方法
CN101394559A (zh) * 2007-09-21 2009-03-25 扬智科技股份有限公司 动态图像处理方法、译码方法及其装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6011587A (en) * 1996-03-07 2000-01-04 Kokusai Denshin Denwa Kabushiki Kaisha Packet video bitrate conversion system
US7154952B2 (en) * 2002-07-19 2006-12-26 Microsoft Corporation Timestamp-independent motion vector prediction for predictive (P) and bidirectionally predictive (B) pictures
US7813429B2 (en) * 2002-08-13 2010-10-12 Lsi Corporation System and method for segmentation of macroblocks
US7020200B2 (en) * 2002-08-13 2006-03-28 Lsi Logic Corporation System and method for direct motion vector prediction in bi-predictive video frames and fields
US7499493B2 (en) 2003-06-20 2009-03-03 Lsi Corporation Dual block motion vector storage in compressed form
JP4289126B2 (ja) * 2003-11-04 2009-07-01 ソニー株式会社 データ処理装置およびその方法と符号化装置
US7346111B2 (en) * 2003-12-10 2008-03-18 Lsi Logic Corporation Co-located motion vector storage
JP2005348093A (ja) * 2004-06-03 2005-12-15 Sony Corp 画像処理装置、そのプログラムおよびその方法
US8155191B2 (en) * 2004-11-04 2012-04-10 Thomson Licensing Method and apparatus for fast mode decision of B-frames in a video encoder
KR100727989B1 (ko) * 2005-10-01 2007-06-14 삼성전자주식회사 동영상 부호화시의 인터 모드 결정 방법 및 장치
CN101375594B (zh) * 2006-01-12 2011-09-07 Lg电子株式会社 处理多视图视频
US8270492B2 (en) * 2006-05-12 2012-09-18 Panasonic Corporation Moving picture decoding device
CN101702963A (zh) * 2007-03-15 2010-05-05 诺基亚公司 用于为视频编码中的空间可伸缩性提供改进的残差预测的***和方法
JP2010135864A (ja) * 2007-03-29 2010-06-17 Toshiba Corp 画像符号化方法及び装置並びに画像復号化方法及び装置
CN101119493B (zh) * 2007-08-30 2010-12-01 威盛电子股份有限公司 区块式数字编码图像的译码方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1487748A (zh) * 2002-10-04 2004-04-07 Lg������ʽ���� B图像的直接模式运动矢量计算方法
CN1859545A (zh) * 2005-05-06 2006-11-08 联发科技股份有限公司 数字视讯处理装置及方法
CN101394559A (zh) * 2007-09-21 2009-03-25 扬智科技股份有限公司 动态图像处理方法、译码方法及其装置

Also Published As

Publication number Publication date
US20130223512A1 (en) 2013-08-29
TWI410138B (zh) 2013-09-21
CN102065290A (zh) 2011-05-18
US8594200B2 (en) 2013-11-26
TW201117620A (en) 2011-05-16
US20110110428A1 (en) 2011-05-12
CN103813172A (zh) 2014-05-21
CN102065290B (zh) 2014-03-19
US8599924B2 (en) 2013-12-03

Similar Documents

Publication Publication Date Title
CN103813172B (zh) 视讯译码装置及存储器分配方法
CN102893604B (zh) 用于视频的数据压缩
CA2702525C (en) Video scalable encoding method and decoding method and apparatuses therefor
CN100496129C (zh) 基于h.264多路视频转码复用的方法
CN102656890B (zh) 用于视频编码的方法和设备
CN102025995B (zh) 一种可伸缩视频编码的空间增强层快速模式选择方法
CN102231835B (zh) 图像解码装置及方法
CN101193305B (zh) 用于视频编解码芯片中帧内预测的数据存储和交换方法
CN105900425A (zh) 表示经编码的比特流中的运动向量
CN101208954B (zh) 具有可变压缩比和用于存储及检索参考帧数据的缓冲器的视频解码器以及视频解码方法
CN105900419B (zh) 屏幕内容数据的视频编码
CN100471275C (zh) 用于h.264/avc编码器的运动估计方法
CN101375593A (zh) 处理多视图视频
CN103402093A (zh) 执行帧间预测的视频解码装置
CN101232615A (zh) 用于在视频编码中随机存取和逐步更新图像的方法
KR20060109279A (ko) 영상 신호의 스케일러블 인코딩 및 디코딩 방법
FI3937497T3 (fi) Liikevektoriennustajavalinta
CN101529921A (zh) 无显式信令的局部照明和色彩补偿
CN102217315A (zh) 用于画面组的并行多线程视频编码的i帧去闪烁
CN102088603A (zh) 用于视频编码器的熵编码器及其实现方法
CN102148990B (zh) 一种运动矢量预测装置和方法
TW199257B (zh)
CN108235035A (zh) 视频编码方法和设备以及视频解码方法和设备
CN101945277B (zh) 处理多视图视频
CN100571401C (zh) 确定参考帧的方法及其装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant