CN1764280A - 基于多层在视频编码器中有效压缩运动矢量的方法和装置 - Google Patents
基于多层在视频编码器中有效压缩运动矢量的方法和装置 Download PDFInfo
- Publication number
- CN1764280A CN1764280A CNA2005101138931A CN200510113893A CN1764280A CN 1764280 A CN1764280 A CN 1764280A CN A2005101138931 A CNA2005101138931 A CN A2005101138931A CN 200510113893 A CN200510113893 A CN 200510113893A CN 1764280 A CN1764280 A CN 1764280A
- Authority
- CN
- China
- Prior art keywords
- frame
- motion vector
- enhancement layer
- basic
- basic frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/31—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
提供了一种方法和装置,其通过在使用多层的视频编码方法中、从基本层中的运动矢量有效预测增强层中的运动矢量,来提高运动矢量的压缩效率。该方法包括:从输入帧中获得具有第一帧速率的基本层帧中的运动矢量;从输入帧中获得具有第二帧速率的第一增强层帧中的运动矢量,该第二帧速率比第一帧速率大;如果在与第一增强层帧相同的时间位置处不存在基本层帧,则通过参考紧接在与第一增强层帧相同的时间位置之前和之后而存在的基本层帧中的至少一个帧的运动矢量,来产生预测运动矢量;以及对第一增强层帧中的运动矢量和所产生的预测运动矢量之间的差、以及所获得的基本层中的运动矢量进行编码。
Description
技术领域
本发明涉及一种视频压缩方法,并特别涉及这样的方法和装置,其在使用多层结构的视频编码方法中,通过从基本层中的运动矢量有效预测增强层中的运动矢量,来提高运动矢量的压缩效率。
背景技术
随着包括因特网的信息通信技术的发展,视频通信以及文本和语音通信急剧增加。传统的文本通信不能满足用户的各种需求,因此,可以提供诸如文本、画面和音乐的各种类型信息的多媒体服务增加了。然而,由于多媒体数据量通常较大,因此多媒体数据需要具有大容量的存储介质以及宽传输带宽。因此,对于传送包括文本、视频和音频的多媒体数据,压缩编码方法是必不可少的。
数据压缩的基本原理是消除数据冗余。通过消除在图像中重复相同颜色或对象的空间冗余、在运动图像中的相邻帧之间变化很小或者在音频中重复相同声音的时间冗余、或者考虑人类视觉及其有限的高频感知力的智力可视冗余(mental visual redundancy),可以压缩数据。在通常的视频编码中,时间冗余是通过基于运动估计和补偿的运动补偿来消除的,而空间冗余是通过变换编码来消除的。
为了传送在消除数据冗余之后产生的多媒体,传输媒介是必需的。传输性能根据传输媒介而不同。目前使用的传输媒介具有各种传输速率。例如,超高速通信网络每秒可以传送几十兆比特的数据,而移动通信网络具有每秒384千比特的传输速率。因此,为了支持具有各种速度的传输媒介、或者以适于传输环境的数据速率来传送多媒体,诸如小波视频编码和分频段(subband)视频编码的具有可伸缩性(scalability)的数据编码方法可适合于多媒体环境。
可伸缩性是指解码器部件或预解码器部件根据诸如比特率、错误率、***资源等的条件对单个压缩比特流进行部分解码的能力。解码器或预解码器将通过可伸缩编码而编码的比特流的仅仅一部分解压缩,并重放这一部分,以将其恢复为具有不同视频质量/分辨率等级或帧速率的多媒体序列。
图1是典型的可伸缩视频编码***的示意图。首先,编码器50将输入视频51编码,从而产生比特流52。预解码器60可以通过根据诸如比特率、分辨率或帧速率并且与解码器70的通信环境或解码器70的机械性能相关的提取条件,不同地截取从编码器50接收的比特流52,来提取不同的比特流53。典型地,预解码器60被实现为被包括在视频流服务器中,所述视频流服务器在可变网络环境下向最终用户提供可变的视频流。
解码器70从所提取的比特流53重建输出视频54。根据提取条件进行的比特流提取可以由解码器70来代替预解码器60执行、或者可以由预解码器60和解码器70二者来执行。
用于可伸缩视频编码的MPEG-4(运动画面专家组4)部分13标准化正处于发展中。具体地说,人们正付出很多的努力来实现基于多层结构的可伸缩性。例如,比特流可以由多个层、即具有不同分辨率(QCIF、CIF和2CIF)或帧速率的基本层以及第一和第二增强层组成。
与把视频编码为单个层一样,当把视频编码为多个层时,获得所述多个层的每一个的运动矢量(MV)以消除时间冗余。可以为每层单独搜索运动矢量MV(前一方法),或者将通过对一层的运动矢量搜索而获得的运动矢量用于另一层(不经上采样/下采样或者在上采样/下采样之后)(后一方法)。前一方法具有获得精确运动矢量的优点,但是承受了由于为每层产生的运动矢量而导致的开销。因此,有效减少每层的运动矢量之间的冗余是一项非常有挑战性的任务。
图2示出了使用多层结构的可伸缩视频编解码示例。参考图2,基本层具有四分之一公共中间格式(QCIF)分辨率和15Hz的帧速率,第一增强层具有公共中间格式(CIF)分辨率和30Hz的帧速率,而第二增强层具有标准清晰度(SD)分辨率和60Hz的帧速率。例如,为了获得CIF和0.5Mbps的流,可以截取CIF_30Hz_0.7M的增强层比特流,以满足0.5M的比特率。以这一方式,可以实现空间、时间和SNR可伸缩性。因为如图2所示、由于运动矢量数量的增加而导致出现了为单层比特流产生的开销大约两倍的开销,因此从基本层进行运动预测非常重要。当然,由于运动矢量仅用于通过参考相邻帧而被编码的内帧,因此它不会被用于未参考相邻帧而被编码的内帧。
如图2所示,具有相同时间位置的各层中的帧10、20和30可被估计为具有相似的图像,从而具有相似的运动矢量。因此,目前使用的用于有效表示运动矢量的方法之一包括:从较低层的运动矢量预测当前层的运动矢量,并对预测值和实际运动矢量之间的差进行编码。
图3是解释用于使用运动预测来有效表示运动矢量的传统方法的图。参考图3,通常,将具有与当前层相同的时间位置的较低层中的运动矢量用作用于当前层运动矢量的预测运动矢量。
编码器以预定的精度获得基本层、第一增强层和第二增强层的运动矢量MV0、MV1和MV2,并使用运动矢量MV0、MV1和MV2来进行时间变换,以消除各层中的时间冗余。然而,编码器将基本层运动矢量MV0、第一增强层运动矢量分量D1和第二增强层运动矢量分量D2发送给预解码器(或视频流服务器)。预解码器可以向解码器传送仅基本层运动矢量、基本层运动矢量和第一增强层运动矢量分量D1、或者基本层运动矢量、第一增强层运动矢量分量D1和第二增强层运动矢量分量D2,以适应网络状况。
然后,解码器使用所接收的数据来重建合适的层的运动矢量。例如,当解码器接收到基本层运动矢量和第一增强层运动矢量分量D1时,将第一增强层运动矢量分量D1加到基本层运动矢量MV0上,以便重建第一增强层运动矢量MV1。使用重建的运动矢量MV1来重建第一增强层的特征(texture)数据。
然而,在如图2所示当前层具有与较低层不同的帧速率时,具有与当前帧相同的时间位置的较低层的帧可能不存在。例如,由于在帧40下面的层的帧不存在,因此不能进行通过较低层运动矢量进行的运动预测。也就是说,由于不能预测帧40中的运动矢量,因此第一增强层中的运动矢量被低效地表示为冗余运动矢量。
发明内容
本发明提供一种用于根据基本层中的运动矢量有效预测增强层中的运动矢量的方法。
本发明还提供一种即使在与当前层的帧相同的时间位置处不存在较低层的帧也有效预测运动矢量的方法。
根据本发明的一个方面,提供一种用于有效地压缩多层运动矢量的方法,该方法包括:(a)从输入帧中获得具有第一帧速率的基本层帧中的运动矢量,(b)从输入帧中获得具有第二帧速率的第一增强层帧中的运动矢量,该第二帧速率比第一帧速率大,(c)如果在与第一增强层帧相同的时间位置处不存在基本层帧,则通过参考紧接在与第一增强层帧相同的时间位置之前和之后而存在的基本层帧中的至少一个帧的运动矢量,来产生预测运动矢量,以及(d)对第一增强层帧中的运动矢量和所产生的预测运动矢量之间的差、以及所获得的基本层中的运动矢量进行编码。
根据本发明的另一方面,提供一种用于有效地对多层运动矢量进行编码的方法,该方法包括:(a)从输入帧中获得具有第一帧速率的基本层帧中的运动矢量,(b)从输入帧中获得具有第二帧速率的第一增强层帧中的运动矢量,该第二帧速率比第一帧速率大,(c)如果在与第一增强层帧相同的时间位置处不存在基本层帧,则通过参考紧接在与第一增强层帧相同的时间位置之前和之后而存在的基本层帧中的至少一个帧的运动矢量,来产生预测运动矢量,(d)使用基本层帧的运动矢量来对基本层帧的特征数据进行有损编码,(e)对第一增强层帧中的运动矢量和所产生的预测运动矢量之间的差、以及所获得的基本层中的运动矢量进行编码,以及(f)对第一增强层帧中的运动矢量和所产生的预测运动矢量之间的差、基本层帧中的运动矢量、步骤(d)的有损编码结果以及步骤(e)的有损编码结果进行无损编码。
根据本发明的另一方面,提供了一种多层视频编码方法,包括:(a)从输入帧中获得具有第一帧速率的基本层帧中的运动矢量,(b)如果在与第一增强层帧相同的时间位置处不存在基本层帧,则通过参考紧接在与第一增强层帧相同的时间位置之前和之后而存在的基本层帧中的至少一个帧的运动矢量,来产生运动矢量,(c)使用基本层帧的运动矢量来对基本层帧的特征数据进行有损编码,(d)使用第一增强层帧的运动矢量来对第一增强层帧的特征数据进行有损编码,以及(e)对基本层帧中的运动矢量、步骤(c)的有损编码结果以及步骤(d)的有损编码结果进行无损编码。
根据本发明的另一方面,提供一种多层视频解码方法,包括:(a)从输入比特流中提取基本层数据和增强层数据,(b)如果在与第一增强层帧相同的时间位置处不存在基本层帧,则通过参考紧接在与第一增强层帧相同的时间位置之前和之后而存在的基本层帧中的至少一个帧的运动矢量,来产生第一增强层帧的运动矢量,(c)使用所产生的预测运动矢量来重建增强层的运动矢量,以及(d)使用重建的增强层的运动矢量,从增强层的特征数据重建视频序列。
根据本发明的另一方面,提供一种多层视频解码方法,包括:(a)从输入比特流中提取基本层数据和增强层数据,(b)如果在与增强层帧相同的时间位置处不存在基本层帧,则通过参考紧接在与增强层帧相同的时间位置之前和之后而存在的基本层帧中的至少一个帧,来重建增强层帧中的运动矢量,以及(c)使用重建的增强层的运动矢量,从增强层的特征数据重建视频序列。
附图说明
通过参考附图详细描述本发明的优选实施例,本发明的以上和其它特征及优点将变得更加清楚,在附图中:
图1示出一般的可伸缩视频编码***的整体配置;
图2是使用多层结构的视频编码的图;
图3是解释用于使用运动预测来有效地表示运动矢量的传统方法的图;
图4是解释根据本发明实施例的使用运动预测来有效地表示运动矢量的方法的图;
图5是解释本发明的思想的示意图;
图6是根据本发明示例实施例的视频编码器的方框图;
图7是解释本发明示例实施例的运动矢量估计单元的详细操作的流程图;
图8图示前一个和下一个帧的运动场的示例;
图9是解释本发明示例实施例的滤波处理的图;
图10是解释当基本层的分辨率和增强层的分辨率彼此不同时、获得滤波后的运动矢量的本发明示例实施例的方法的图;以及
图11是根据本发明实施例的视频解码器的方框图。
具体实施方式
现在将参考附图更充分地描述本发明,在附图中示出了本发明的示例实施例。通过参考对示例实施例和附图的以下详细描述,将更容易地理解本发明的优点和特征以及实现它们的方法。然而,本发明可以用很多不同的形式来实施,而不应被解释为限于在此阐述的实施例。更确切地说,提供这些实施例,使得本公开将详尽且完整,并将向本领域技术人员充分传达本发明的思想,并且,本发明将仅仅受到所附权利要求的限定。在本说明书中,相同的附图标记表示相同的元件。
运动预测进行得越精确,由于运动矢量而导致的开销就变得越少。与将较低层中的运动矢量即MV0和MV1用作估计运动矢量MV1p和MV2p的情况不同,在采用更精确的运动估计方法的情况中,如图4所示,运动矢量MV0和MV1显示出与矢量11和13相同的运动效果。也就是说,与传送当前层中的运动矢量和当前层的较低层中的运动矢量之间的差值12、以及第二增强层中的运动矢量和当前层中的运动矢量之间的差值14的传统技术不同,在将估计运动矢量MV1p和MV2p用于更精确的运动估计的情况下,仅仅必须存储较小的值D1和D2。因此,可以减少运动矢量所需的比特量,并且将对应于所减少的比特量的比特分配给特征,从而提高画面质量等级。
为了实现这一点,第一,应当仅通过读取较低层的运动信息而没有其它信息来进行产生估计运动矢量MV1p和MV2p的处理。第二,应当把所参考的运动矢量设置为基本上接近当前层中的运动矢量。
图5是解释本发明的基本思想的示意图。在此示例中,假设当前层Ln具有CIF分辨率和30Hz的帧速率,而较低层Ln-1具有QCIF分辨率和15Hz的帧速率。
在本发明中,如果在与当前层的帧相同的时间位置处存在基本层帧,则通过参考该基本层帧中的运动矢量来产生预测运动矢量。另一方面,如果不存在对应于当前层帧的基本层帧,则使用位置最接近该时间位置的基本层帧的至少一个中的运动矢量来产生预测运动矢量。参考图5,分别根据具有与当前层帧A0和A2相同的时间位置的较低层帧B0和B2中的运动矢量,预测当前层帧A0和A2中的运动矢量。这里,“所预测的运动”的含义基本上是正被产生的预测运动矢量。
另一方面,使用最接近该时间位置的帧B0和B2中的运动矢量,产生在相同时间位置处不具有对应的较低层帧的帧A1的预测运动矢量。为了实现这一点,对帧B0和B2中的运动矢量进行插值,以产生与帧A1相同的时间位置处的虚拟运动矢量(虚拟帧B1中的运动矢量),并使用该虚拟运动矢量来预测帧A1的运动矢量。
例如,假设当前层的帧A1使用当前层帧A0和A2作为参考帧来进行双向预测,则正向和反向运动矢量可以分别使用较低层帧B0和B2来进行有效预测。
如果较低层帧B0具有反向运动矢量(将B2作为参考帧),则较低层帧B0的反向运动矢量的所参考(refer)的距离是当前层运动矢量的距离的两倍。因此,当考虑所参考的距离和方向时,可以通过将帧B0的反向运动矢量乘以-1/2来计算帧A1的正向运动矢量的预测运动矢量。此外,可以通过将帧B0的反向运动矢量乘以1/2来计算帧A1的反向运动矢量的预测运动矢量。为了减小计算误差,还可以将通过对帧B0的反向运动矢量和所计算的帧A1的正向运动矢量求和而获得的值用作帧A1的反向运动矢量的预测运动矢量。
同时,如果较低层的帧B2具有正向运动矢量(将B0作为参考帧),则较低层帧B2的正向运动矢量的所参考的距离是当前层运动矢量的距离的两倍。因此,当考虑所参考的距离和方向时,可以通过将帧B2的正向运动矢量乘以1/2来计算帧A1的正向运动矢量的预测运动矢量。此外,可以通过将帧B2的正向运动矢量乘以-1/2来计算帧A1的反向运动矢量的预测运动矢量。为了减小计算误差,还可以将通过从所计算的帧A1的正向运动矢量中减去帧B2的正向运动矢量而获得的值用作帧A1的反向运动矢量的预测运动矢量。
图6是根据本发明实施例的视频编码器100的方框图。尽管图6示出使用一个基本层和一个增强层,但是本领域技术人员将容易地明白:当使用两个或更多层时,可以在较低层和较高层之间应用本发明。
参考图6,视频编码器10包括:下采样单元110;运动估计单元121、131;有损编码器125、135;运动矢量估计单元140和熵编码器150。
下采样单元110将输入视频下采样为适合于每层的分辨率和帧速率。当如图5所示使用QCIF@15Hz的基本层和CIF@30Hz的增强层时,将原始输入视频下采样为CIF和QCIF分辨率,并随后将其下采样为15Hz和30Hz的帧速率。对分辨率进行下采样可以使用MPEG下采样单元或小波下采样器来进行。对帧速率进行下采样可以使用帧跳跃或帧插值来进行。
如上所述,对本领域技术人员来说,显然,增强层不同时具有比基本层更高的分辨率和更高的帧速率,而是具有比基本层高的分辨率和与基本层相同的帧速率、或者与基本层相同的分辨率和比基本层高的帧速率。
运动估计单元121对基本层帧进行运动估计,以获得基本层帧中的运动矢量。运动估计是寻找与当前帧中的块最接近的块、即具有最小误差的块的过程。在运动估计中可以使用各种技术,包括固定大小块匹配和分级可变大小块匹配(HVSBM)。以相同的方式,运动估计单元131对增强层的帧进行运动估计,以便获得增强层帧中的运动矢量。以这一方式获得基本层帧和增强层帧中的运动矢量,以便使用虚拟运动矢量来预测增强层帧中的运动矢量。
运动矢量预测单元140使用基本层帧中的运动矢量来产生增强层帧中的预测运动矢量,并获得所得到的运动矢量和增强层帧中的预测运动矢量之间的差(以下称为“运动矢量分量”)。
现在将参考图7更详细地描述由运动矢量预测单元140进行的操作。首先,在步骤S10确定在与增强层中的当前帧相同的时间位置处是否存在基本层帧。如果存在(步骤S10中的是),则在步骤S20,对与当前帧具有空间相关性的基本层帧中的运动矢量进行滤波。作为结果,产生与当前帧中的一个运动矢量相对应的滤波后的运动矢量。步骤S20将在下面参考图9和10来进行描述。
在步骤S30,确定增强层和基本层的分辨率是否相同。如果相同(步骤S30中的是),则在步骤S40中,将当前帧中的运动矢量和由滤波产生的运动矢量相减。这是因为在相同分辨率的情况下,由滤波产生的运动矢量对应预测运动矢量。如果不相同(步骤S30中的否),则在步骤S45,以增强层的分辨率对由滤波产生的运动矢量进行上采样。例如,如果增强层的分辨率是基本层分辨率的两倍,则术语“采样”意思是将由滤波产生的运动矢量放大两倍。在此情况下,上采样后的运动矢量是预测运动矢量。因此,在步骤S50,获得当前帧和上采样后的运动矢量之间的差。
同时,如果在步骤S10确定在与增强层中的当前帧相同的时间位置处不存在基本层帧(步骤S10中的否),则在步骤S55和S60中,对位置紧接在该时间位置之前和之后的基本层帧(即,该时间位置之前和之后的最近的帧)中的运动矢量进行滤波。例如,在图5中,位置紧接在与当前帧A1相同的时间位置之前和之后的帧是B0和B2。换句话说,在步骤S55,在紧接在该时间位置之前而存在的帧例如B0中的运动矢量中,对与当前帧中的运动矢量具有空间相关性的运动矢量进行滤波,以产生滤波后的运动矢量。然后,在步骤S60,在紧接在该时间位置之后而存在的帧例如B2中的运动矢量中,对与当前帧中的运动矢量具有空间相关性的运动矢量进行滤波,以产生滤波后的运动矢量。这一滤波处理与步骤S20中的滤波处理相似,其将在后面在图9和10中描述。
接下来,使用在步骤S55的滤波之后产生的滤波后的运动矢量、以及在步骤S60的滤波之后产生的滤波后的运动矢量,对当前帧和该时间位置处的“虚拟运动矢量”进行插值。可用的插值示例包括简单的平均方法、双线性插值、双三次插值等。如果距紧接在该时间位置之前和之后而存在的帧的距离不同,则与图5不同的是,优选地进行插值,使得增大插值加权因子,以便与距离成反比。如上所述,如果所述距离不同,则可以只使用距当前帧最近的一个帧。
与上述简单插值方法不同的是,考虑到运动矢量场的特性,可以确定紧接着的前一个帧和下一个帧的加权因子。如图8所示,显示了紧接着的前一个帧和下一个帧中的运动矢量(白色块部分是运动矢量被跳过的部分),具有与当前帧中的某个运动矢量相同的空间位置的块是块61和块62。在紧接着的前一个帧的情况中,块61附近的块中的运动矢量(可放大或缩小转换)基本上与块61的运动矢量相同。另一方面,在紧接着的下一个帧的情况中,块62附近的块中的运动矢量大部分与块62的运动矢量不同。因此,当产生当前帧的运动矢量的预测运动矢量时,为了更精确的运动估计而优选地增大紧接着的前一个帧中的运动矢量的加权因子。也就是说,计算块61的运动矢量与块61附近的每个运动矢量之间的差的和,并且计算块62的运动矢量和块62附近的每个运动矢量之间的差的和。每个帧中的运动矢量的加权因子与所述差的和数成反比。由于解码器侧从编码器侧接收运动矢量,因此可以按照与编码器侧相同的方式来计算加权因子,而无需从编码器侧告知这种信息。
接下来,如果增强层的分辨率和基本层的分辨率相同(步骤S70中的是),则所内插的虚拟运动矢量是预测运动矢量。因此,为了有效压缩运动矢量,在步骤S75,对当前帧中的运动矢量和虚拟运动矢量进行减法。减法结果成为增强层中的运动矢量分量。
另一方面,如果增强层的分辨率与基本层的分辨率不相同(步骤S70中的否),则在步骤S80将所内插的虚拟运动矢量上采样为与增强层中的运动矢量一样大。如上所述,由于上采样后的运动矢量是预测运动矢量,因此在步骤S85对当前帧中的运动矢量和上采样后的运动矢量进行减法。
图9是用于解释滤波处理的图。这里,“滤波”是指使用增强层帧的运动矢量和与该增强层帧具有空间相关性的运动矢量来获得滤波后的运动矢量的过程。这里,具有“空间相关性”的位置是指“直接对应的位置”(第一实施例)、或者直接对应的位置和包括从该位置起扩大的附近位置的区域(第二实施例)。
将首先描述第一实施例。参照图9,如果增强层的分辨率和基本层的分辨率相同,则与运动矢量65具有空间相关性(即,位置直接对应位置矢量65)的运动矢量是运动矢量63。在此情况下,运动矢量63是“滤波后的运动矢量”。
如果增强层的分辨率和基本层的分辨率不相同,则与运动矢量65具有空间相关性(即,位置直接对应运动矢量65)的运动矢量是运动矢量64。在此情况下,运动矢量64是“滤波后的运动矢量”。当然,运动矢量64与运动矢量66、67和68以及运动矢量65均具有空间相关性。
接下来,将描述第二实施例,其中,不仅考虑位置直接对应某个运动矢量的运动矢量、还考虑其附近的运动矢量来进行滤波。在此情况下,在这里使用的术语“具有空间相关性的位置”意欲包含直接对应的位置和包括其附近的区域。以这种方式扩大该区域的原因是运动矢量具有空间相似性,并且考虑相邻的运动矢量可有利于运动预测。
如果增强层的分辨率和基本层的分辨率相同,如图9所示,而运动矢量63直接对应运动矢量65,则不仅考虑运动矢量63还考虑运动矢量63附近的运动矢量来进行滤波。例如,假设运动矢量63的“附近”是指运动矢量63周围的8个运动矢量,则可以通过包括运动矢量63的9个运动矢量的线性组合来获得滤波后的运动矢量。在此情况下,对运动矢量63施加相对较大的系数(即,较大的加权因子),而对相邻的运动矢量施加相对较小的系数。显然,根据旁边或边缘的位置,可以将不同的加权因子施加到相邻的运动矢量。为了使用多个运动矢量获得滤波后的运动矢量,可以使用中值滤波器、双三次滤波器、二次滤波器或其它滤波器。
同时,如果增强层的分辨率和基本层的分辨率不相同,而运动矢量64直接对应运动矢量65,则不仅考虑运动矢量64还考虑运动矢量64附近的运动矢量来进行滤波。在增强层的分辨率和基本层的分辨率不相同的情况下,将参考图10描述获得滤波后的运动矢量的过程。
首先,假设基本层中的块对应第一增强层中的4个固定块。例如,块f对应由块f5、f6、f7和f8组成的区域。为了应用预定的插值方法以获得参考运动矢量,有必要在基本层中确定具有空间相关性的区域范围,并随后确定该区域范围内的运动矢量的加权因子。
例如,块f5的运动矢量与块b、e和f具有高空间相关性。由于块f5占据了对应于块f的区域的四分之一,因此可以预测:块f5相当大地与基本层中的块b、块e和块f空间相关。
如上所述,在确定了具有空间相关性的区域范围之后,对存在于该区域中的运动矢量进行滤波。在此情况下,优选的是,块f的加权因子大于块b或块e的加权因子。此外,可以使用各种滤波器,例如中值滤波器、双三次滤波器或二次滤波器。可用的插值示例包括简单的平均方法、双线性插值、双三次插值等。
可替换地,不仅块b、块e和块f,而且块a均可被包括在参考块的范围内。此外,可以将不同的加权因子分配给各个块,例如,将25%分配给块b,将25%分配给块e,将10%分配给块a,或者将40%分配给块f。可替换地,可以将参考块的区域设置为不仅包括紧邻的块,还包括间隔的块。本领域技术人员将认识到,可以按照与在本申请中具体讨论的方式不同的方式来实现本发明。如果基本层的分辨率与增强层的分辨率不同,则滤波后的运动矢量的比例(scale)与增强层的运动矢量比例不同。这是因为滤波后的运动矢量仅使用基本层中的运动矢量来进行滤波。在本发明中,以单独的方式进行上采样。
尽管在本发明的第二实施例中使用了固定块,但是可以使用可变的块来充分地实现根据空间相关性程度的适当滤波。
再次参考图6,有损编码器125使用从运动估计单元121获得的运动矢量来对基本层帧进行无损编码。有损编码器125可以包括时间变换单元122、空间变换单元123和量化单元124。
时间变换单元122使用从运动估计单元121获得的运动矢量、以及位置在时间上与当前帧不同的帧,创建预测帧并对当前帧和预测帧进行减法,从而减少时间冗余。作为结果,产生剩余的帧。当然,如果在不参考另一帧的情况下对当前帧进行编码,也就是说,如果当前帧是内帧,则它不需要运动矢量,并且跳过使用预测帧的时间变换处理。在时间变换处理中,为了支持时间可伸缩性,可以使用MCTF(运动补偿时间滤波)或UMCTF(非强制MCTF)。
空间变换单元123对由时间变换单元122产生的剩余的帧、或者原始输入帧进行空间变换,并产生变换系数。对于空间变换,可以使用DCT(离散余弦变换)、小波变换等。在采用DCT的情况中,变换系数是DCT系数,而在采用小波变换的情况中,变换系数是小波系数。
量化单元124对由空间变换单元123产生的变换系数进行量化。量化是指这样的过程:将由任意实数值表示的DCT系数分为预定间隔、以便将其表示为离散值,并将这些离散值与来自预定量化表的索引相匹配。
另一方面,有损编码器135使用由运动估计单元131获得的增强层帧中的运动矢量对增强层帧进行有损编码。有损编码器135包括时间变换单元132、空间变换单元133和量化单元134。由于除了有损编码器135对增强层帧进行有损编码以外,它进行与有损编码器125相同的操作,因此将不会给出对其的详细解释。
熵编码器150对由量化单元124和134获得的基本层和增强层的量化系数、由运动估计单元121产生的基本层的基本层运动矢量、以及由运动矢量估计单元140产生的增强层运动矢量分量无损编码(或熵编码)为输出比特流。诸如霍夫曼(Huffman)编码、算术编码和可变长度编码的各种编码方案均可用于无损编码。
尽管图6示出用于基本层的有损解码器135和用于增强层的有损解码器135是相分离的,但对本领域技术人员来说,显然可以使用单个有损解码器来处理基本层和增强层二者。
图11是根据本发明实施例的视频解码器200的方框图。
参考图11,视频解码器200包括熵解码器210、有损解码器225、235、以及运动矢量重建单元240。
熵解码器210进行熵编码的逆操作,并从输入比特流中提取基本层帧中的运动矢量、增强层帧的运动矢量分量、以及来自基本层帧和增强层帧的特征数据。
运动矢量重建单元240使用基本层中的运动矢量和增强层帧中的运动矢量分量来重建增强层中的运动矢量,现在将对此更详细地进行描述。运动矢量重建处理包括:如果在与第一增强层帧相同的时间位置处存在基本层帧,则通过参考该基本层帧中的运动矢量来产生预测运动矢量,如果不存在,则通过参考紧接在该时间位置之前和之后而存在的基本层帧中的至少一个帧中的运动矢量,来产生预测运动矢量,并且,通过将所产生的预测运动矢量和增强层的运动矢量分量相加来重建增强层中的运动矢量。
如图7所示,除了解码器200对预测运动矢量和当前帧(增强层帧)的运动矢量分量执行加法步骤而与编码器100不同以外,运动矢量重建处理与运动矢量估计处理基本相同(参见图7),执行步骤S40、S50、S75和S85均为对预测运动矢量和当前帧中的运动矢量的减法步骤。然而,产生预测运动矢量的方法是相同的,并且将不会给出对其的重复解释。
有损解码器235执行有损编码器(图6的135)的逆操作,以便使用重建的增强层帧中的运动矢量来从增强层帧的特征数据重建视频序列。有损解码器235包括逆量化单元231、逆空间变换单元232和逆时间变换单元233。
逆量化单元231对从增强层帧提取的特征数据进行逆量化。逆量化是这样的处理:使用在量化处理期间采用的量化表,根据在量化处理期间创建的对应量化索引来重建值。
逆空间变换单元232对逆量化结果进行逆空间变换。逆空间变换是由编码器100中的空间变换单元133进行的空间变换的逆操作。逆DCT和逆小波变换均处于可用于逆空间变换的技术之中。
逆时间变换单元233对逆空间变换结果执行时间变换单元132的逆操作,以便重建视频序列。更具体地说,逆时间变换单元233使用由运动矢量重建单元240重建的运动矢量来产生预测帧,并将该预测帧加到逆空间变换结果上,以便重建视频序列。当然,在编码器处没有被时间变换的内帧也不需要进行逆时间变换。
编码器100可以在编码期间使用基本层来消除增强层特征中的冗余。在此情况中,由于解码器200重建基本层帧、并使用重建的基本层帧和从熵解码器210接收的增强层帧中的特征数据来重建增强层帧,因此使用用于基本层的有损解码器225。
在此情况下,逆时间变换单元233使用重建的增强层帧中的运动矢量,来从增强层帧中的特征数据(逆空间变换结果)和重建的基本层帧重建视频序列。
尽管图11示出用于基本层的有损解码器225与用于增强层的有损解码器235相分离,但对本领域技术人员来说,显然可以使用单个有损解码器来处理基本层和增强层二者。
已经基于在每层中获得的运动矢量描述了更有效的运动矢量压缩和传送方法。在另一实施例中,在从多层之一获得运动矢量并对其进行上/下采样之后,如果有必要,可以将上/下采样后的运动矢量用作另一层中的运动矢量。在此情况下,可以节省运动矢量,增强层中的运动矢量精度可能劣化。
在此情况下,视频编码处理包括:从输入帧中获得具有第一帧速率的基本层帧中的运动矢量;获得具有比第一帧速率大的第二帧速率的增强层帧中的运动矢量;使用基本层帧中的运动矢量对基本层帧的特征数据进行有损编码;使用第一增强层帧中的运动矢量对第一增强层帧的特征数据进行有损编码;以及对基本层帧中的运动矢量和有损编码结果进行无损编码。
这里,获得增强层帧中的运动矢量包括:(1)如果在与增强层帧相同的时间位置处存在基本层帧,则通过参考该基本层帧中的运动矢量,产生增强层帧中的运动矢量,以及(2)如果不存在,则通过参考紧接在该时间位置之前和之后而存在的基本层帧中的至少一个中的运动矢量,产生增强层帧中的运动矢量。
步骤(1)包括:使用预定的滤波器,对与增强层帧中的运动矢量具有空间相关性的基本层帧中的运动矢量进行滤波,并且如果基本层帧的分辨率与增强层帧的分辨率不相同,则对由该滤波产生的运动矢量进行上采样,使得该运动矢量变得与增强层的运动矢量相同。将所得的运动矢量用作增强层中的运动矢量,而不是用作预测运动矢量。
步骤(2)包括:如果在与增强层帧相同的时间位置处存在基本层帧,则通过参考紧接在该时间位置之前和之后而存在的基本层帧中的运动矢量,内插基本层帧中的虚拟运动矢量,并且如果基本层帧的分辨率与增强层帧的分辨率不相同,则对内插的虚拟运动矢量进行上采样,使得它与增强层中的运动矢量一样大。将所得的运动矢量用作增强层中的运动矢量,而不是用作预测运动矢量。
滤波处理、上采样处理和内插处理与上面所述相同,并且将不会给出对其的详细解释。
现在将描述根据本发明实施例的视频解码方法,其中,在如上所述从多层之一中获得运动矢量并对其进行上/下采样之后,使用上/下采样后的运动矢量作为另一层中的运动矢量。
该视频解码处理包括:从输入帧提取基本层帧中的运动矢量和增强层帧的特征数据;使用所提取的基本层帧中的运动矢量重建增强层帧中的运动矢量;以及从基本层帧的特征数据和第一增强层帧的特征数据重建视频序列。
重建增强层中的运动矢量包括:如果在与增强层帧相同的时间位置处存在基本层帧,则通过参考该基本层帧来重建增强层帧中的运动矢量,而如果不存在,则通过参考紧接在该时间位置之前和之后而存在的基本层中的至少一个帧中的运动矢量,重建增强层帧中的运动矢量。
如上所述,仅使用基本层中的运动矢量而进行的增强层帧中的运动矢量重建处理与使用基本层中的运动矢量来产生增强层帧中的运动矢量的运动矢量编码处理基本相同。
尽管作为示例而在一个基本层和一个增强层的情况下描述了上述实施例,但对于本领域技术人员来说,显然可以针对多层而容易地实现本发明。如果所述多层由基本层、第一增强层和第二增强层组成,则也可以将用于基本层和第一增强层的算法应用于第一增强层和第二增强层。
如图6和11所示的每个相应分量可以是、但不限于执行某些任务的软件或硬件组件,例如现场可编程门阵列(FPGA)或者特定用途集成电路(ASIC)。可以有利地将模块配置为存在于可寻址存储介质上,并且将其配置为在一个或多个处理器上执行。因此,作为示例,模块可包括:诸如软件组件、面向对象的软件组件、类组件和任务组件的组件、进程、函数、属性、过程、子例程、程序代码的段、驱动程序、固件、微码、电路、数据、数据库、数据结构、表、数组和变量。可以将在这些组件和模块中提供的功能性合并到较少的组件和模块中,或者将其进一步分离为另外的组件和模块。此外,可以实现这些组件和模块,使得它们运行通信***中的一台或多台计算机。
根据本发明,可以提高多层运动矢量的压缩效率。
此外,可以提高被分段为具有相同比特率的多个层的图像的质量。
尽管参考本发明的示例实施例具体示出和描述了本发明,但是本领域普通技术人员应当理解:在不背离由所附权利要求限定的本发明的精神和范围的情况下,可以在其中进行各种形式和细节的改变。因此,应当理解,仅仅是从说明的意义上而提供上述实施例,而不应将其解释为对本发明的范围施加任何限制。
Claims (21)
1.一种用于有效压缩多层运动矢量的方法,该方法包括:
(a)从输入帧中获得具有第一帧速率的基本层帧中的运动矢量;
(b)从输入帧中获得具有第二帧速率的第一增强层帧中的运动矢量,该第二帧速率比第一帧速率大;
(c)如果在与第一增强层帧相同的时间位置处不存在基本层帧,则通过参考紧接在与第一增强层帧相同的时间位置之前和之后而存在的基本层帧中的至少一个帧的运动矢量,来产生预测运动矢量;以及
(d)对第一增强层帧中的运动矢量和所产生的预测运动矢量之间的差、以及所获得的基本层中的运动矢量进行编码。
2.如权利要求1所述的方法,其中,操作(c)包括:
(c1)如果在与第一增强层帧相同的时间位置处存在基本层帧,则通过参考该基本层帧中的运动矢量来产生预测运动矢量。
3.如权利要求2所述的方法,还包括:
(e)从输入帧中获得具有第三帧速率的第二增强层帧中的运动矢量,该第三帧速率比第一帧速率大;
(f)产生第二增强层帧的预测运动矢量,包括:(f1)如果在与第二增强层帧相同的时间位置处存在第一增强层帧,则通过参考该第一增强层帧中的运动矢量来产生预测运动矢量,(f2)如果不存在,则通过参考紧接在与第二增强层帧相同的时间位置之前和之后而存在的第一增强层帧中的至少一个帧中的运动矢量,来产生第二增强层帧的预测运动矢量;以及
(g)对第二增强层帧中的运动矢量和所产生的第二增强层帧中的预测运动矢量之间的差进行编码。
4.如权利要求2所述的方法,其中,操作(c1)包括:
(c11)使用预定的滤波器,对与第一增强层帧中的运动矢量具有空间相关性的基本层帧中的运动矢量进行滤波;以及
(c12)如果基本层帧的分辨率与第一增强层帧的分辨率不相同,则对由滤波得到的运动矢量进行上采样,使得该运动矢量变得与第一增强层中的运动矢量一样大。
5.如权利要求4所述的方法,其中,根据空间相关性,利用分配给各个运动矢量的不同加权因子来进行滤波。
6.如权利要求1所述的方法,其中,操作(c)包括:
(c21)通过参考紧接在所述时间位置之前和之后而存在的基本层帧中的运动矢量,内插基本层帧中的虚拟运动矢量;以及
(c22)如果基本层帧的分辨率与第一增强层的分辨率不相同,则通过将所内插的虚拟运动矢量上采样为与第一增强层中的运动矢量一样大,来产生预测运动矢量。
7.如权利要求6所述的方法,其中,操作(c21)包括:通过在紧接在所述时间位置之前和之后而存在的基本层帧中分配具有较大的运动矢量一致性的基本层帧的高参考比,内插基本层帧中的虚拟运动矢量。
8.如权利要求6所述的方法,其中,操作(c21)包括:
(c211)在紧接在与增强层帧相同的时间位置之前而存在的基本层帧中的运动矢量中,使用预定的滤波器对与该增强层帧中的运动矢量具有空间相关性的基本层帧中的运动矢量进行滤波;
(c212)在紧接在与增强层帧相同的时间位置之后而存在的基本层帧中的运动矢量中,使用预定的滤波器对与该增强层帧中的运动矢量具有空间相关性的基本层帧中的运动矢量进行滤波;以及
(c213)通过将预定算法应用于操作(c211)和(c212)的滤波结果,内插虚拟运动矢量。
9.一种用于有效地对多层运动矢量进行编码的方法,该方法包括:
(a)从输入帧中获得具有第一帧速率的基本层帧中的运动矢量;
(b)从输入帧中获得具有第二帧速率的第一增强层帧中的运动矢量,该第二帧速率比第一帧速率大;
(c)如果在与第一增强层帧相同的时间位置处不存在基本层帧,则通过参考紧接在与第一增强层帧相同的时间位置之前和之后而存在的基本层帧中的至少一个帧的运动矢量,来产生预测运动矢量;
(d)使用基本层帧的运动矢量来对基本层帧的特征数据进行有损编码;
(e)对第一增强层帧中的运动矢量和所产生的预测运动矢量之间的差、以及所获得的基本层中的运动矢量进行编码;以及
(f)对第一增强层帧中的运动矢量和所产生的预测运动矢量之间的差、基本层帧中的运动矢量、操作(d)的有损编码结果以及操作(e)的有损编码结果进行无损编码。
10.如权利要求9所述的方法,其中,操作(c)包括:
(c1)如果在与第一增强层帧相同的时间位置处存在基本层帧,则通过参考该基本层帧中的运动矢量来产生预测运动矢量。
11.一种多层视频编码方法,包括:
(a)从输入帧中获得具有第一帧速率的基本层帧中的运动矢量;
(b)如果在与第一增强层帧相同的时间位置处不存在基本层帧,则通过参考紧接在与第一增强层帧相同的时间位置之前和之后而存在的基本层帧中的至少一个帧的运动矢量,来产生运动矢量;
(c)使用基本层帧的运动矢量来对基本层帧的特征数据进行有损编码;
(d)使用第一增强层帧的运动矢量来对第一增强层帧的特征数据进行有损编码;以及
(e)对基本层帧中的运动矢量、操作(c)的有损编码结果以及操作(d)的有损编码结果进行无损编码。
12.一种多层视频解码方法,包括:
(a)从输入比特流中提取基本层数据和增强层数据;
(b)如果在与第一增强层帧相同的时间位置处不存在基本层帧,则通过参考紧接在与第一增强层帧相同的时间位置之前和之后而存在的基本层帧中的至少一个帧的运动矢量,来产生第一增强层帧的运动矢量;
(c)使用所产生的预测运动矢量来重建增强层的运动矢量;以及
(d)使用重建的增强层的运动矢量,从增强层的特征数据重建视频序列。
13.如权利要求12所述的方法,其中,操作(b)包括:
(b1)如果在与增强层帧相同的时间位置处存在基本层帧,则通过参考该基本层帧的运动矢量来产生预测运动矢量。
14.如权利要求13所述的方法,其中,操作(b1)包括:
(b11)使用预定的滤波器,对与增强层帧中的运动矢量具有空间相关性的基本层帧中的运动矢量进行滤波;以及
(b12)如果基本层帧的分辨率与第一增强层帧的分辨率不相同,则通过将由滤波所产生的运动矢量上采样为与增强层中的运动矢量一样大,产生预测运动矢量。
15.如权利要求12所述的方法,其中,根据空间相关性,利用分配给各个运动矢量的不同加权因子来进行滤波。
16.如权利要求12所述的方法,其中,操作(b)包括:
(b21)通过参考紧接在与第一增强层帧相同的时间位置之前和之后而存在的基本层帧中的运动矢量,内插基本层帧的虚拟运动矢量;以及
(b22)如果基本层帧的分辨率与第一增强层的分辨率不相同,则通过将所内插的虚拟运动矢量上采样为与增强层中的运动矢量一样大,来产生预测运动矢量。
17.如权利要求16所述的方法,其中,操作(b21)包括:通过在紧接在所述时间位置之前和之后而存在的基本层帧中分配具有较大的运动矢量一致性的基本层帧的高参考比,内插基本层帧中的虚拟运动矢量。
18.如权利要求16所述的方法,其中,操作(b21)包括:
(b211)在紧接在与增强层帧相同的时间位置之前而存在的基本层帧中的运动矢量中,使用预定的滤波器对与该增强层帧中的运动矢量具有空间相关性的基本层帧中的运动矢量进行滤波;
(b212)在紧接在与增强层帧相同的时间位置之后而存在的基本层帧中的运动矢量中,使用预定的滤波器对与该增强层帧中的运动矢量具有空间相关性的基本层帧中的运动矢量进行滤波;以及
(b213)通过将预定算法应用于操作(b211)和(b212)的滤波结果来内插虚拟运动矢量。
19.一种多层视频解码方法,包括:
(a)从输入比特流中提取基本层数据和增强层数据;
(b)如果在与增强层帧相同的时间位置处不存在基本层帧,则通过参考紧接在与增强层帧相同的时间位置之前和之后而存在的基本层帧中的至少一个帧,来重建增强层帧中的运动矢量,以及
(c)使用重建的增强层的运动矢量,从增强层的特征数据重建视频序列。
20.如权利要求19所述的方法,其中,操作(b)包括:如果在与增强层帧相同的时间位置处存在基本层帧,则通过参考该基本层帧来重建增强层的运动矢量。
21.一种在其上记录了计算机可读程序的记录介质,该程序用于执行权利要求1的方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US62032804P | 2004-10-21 | 2004-10-21 | |
US60/620,328 | 2004-10-21 | ||
KR1020040103059A KR100664929B1 (ko) | 2004-10-21 | 2004-12-08 | 다 계층 기반의 비디오 코더에서 모션 벡터를 효율적으로압축하는 방법 및 장치 |
KR103059/04 | 2004-12-08 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1764280A true CN1764280A (zh) | 2006-04-26 |
CN1764280B CN1764280B (zh) | 2010-09-08 |
Family
ID=36748182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2005101138931A Expired - Fee Related CN1764280B (zh) | 2004-10-21 | 2005-10-21 | 基于多层在视频编码器中有效压缩运动矢量的方法和装置 |
Country Status (3)
Country | Link |
---|---|
US (3) | US7889793B2 (zh) |
KR (1) | KR100664929B1 (zh) |
CN (1) | CN1764280B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8155181B2 (en) | 2006-04-11 | 2012-04-10 | Samsung Electronics Co., Ltd. | Multilayer-based video encoding method and apparatus thereof |
CN103650494A (zh) * | 2011-07-14 | 2014-03-19 | 索尼公司 | 图像处理装置及图像处理方法 |
CN103716629A (zh) * | 2012-09-29 | 2014-04-09 | 华为技术有限公司 | 用于图像处理的方法、装置编码器和解码器 |
CN104170388A (zh) * | 2011-11-10 | 2014-11-26 | 卢卡·罗萨托 | 分层的信号质量层级中的运动映射图和其它辅助映射图的向上采样和向下采样 |
CN104620581A (zh) * | 2012-05-14 | 2015-05-13 | 卢卡·罗萨托 | 分层时间层级中的基于时间的和/或多维信号的解码和重构 |
CN104756498A (zh) * | 2012-09-21 | 2015-07-01 | 英特尔公司 | 跨层运动向量预测 |
CN101755458B (zh) * | 2006-07-11 | 2016-02-10 | 诺基亚技术有限公司 | 可缩放视频编码方法和装置以及可缩放视频解码方法和装置 |
CN108156463A (zh) * | 2012-08-29 | 2018-06-12 | Vid拓展公司 | 用于可分级视频编码的运动矢量预测的方法和装置 |
CN108347612A (zh) * | 2018-01-30 | 2018-07-31 | 东华大学 | 一种基于视觉注意机制的监控视频压缩与重构方法 |
CN108366268A (zh) * | 2011-11-07 | 2018-08-03 | 佳能株式会社 | 编码设备 |
CN108540809A (zh) * | 2012-10-09 | 2018-09-14 | 英迪股份有限公司 | 用于多层视频的解码装置、编码装置及层间预测方法 |
CN110446072A (zh) * | 2019-08-14 | 2019-11-12 | 咪咕视讯科技有限公司 | 视频流切换方法、电子设备和存储介质 |
CN114424552A (zh) * | 2019-09-29 | 2022-04-29 | 华为技术有限公司 | 一种低延迟信源信道联合编码方法及相关设备 |
Families Citing this family (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100664929B1 (ko) | 2004-10-21 | 2007-01-04 | 삼성전자주식회사 | 다 계층 기반의 비디오 코더에서 모션 벡터를 효율적으로압축하는 방법 및 장치 |
KR100703745B1 (ko) * | 2005-01-21 | 2007-04-05 | 삼성전자주식회사 | 비동기 프레임을 효율적으로 예측하는 비디오 코딩 방법 및장치 |
KR100714689B1 (ko) * | 2005-01-21 | 2007-05-04 | 삼성전자주식회사 | 다 계층 구조 기반의 스케일러블 비디오 코딩 및 디코딩방법, 이를 위한 장치 |
KR100703746B1 (ko) * | 2005-01-21 | 2007-04-05 | 삼성전자주식회사 | 비동기 프레임을 효율적으로 예측하는 비디오 코딩 방법 및장치 |
KR100704626B1 (ko) * | 2005-02-07 | 2007-04-09 | 삼성전자주식회사 | 다 계층 기반의 모션 벡터를 압축하는 방법 및 장치 |
WO2006107281A1 (en) * | 2005-04-08 | 2006-10-12 | Agency For Science, Technology And Research | Method for encoding at least one digital picture, encoder, computer program product |
KR100825743B1 (ko) * | 2005-11-15 | 2008-04-29 | 한국전자통신연구원 | 실시간으로 비트스트림의 공간 해상도를 변환할 수 있는스케일러블 비디오 코딩 방법 및 그 방법을 이용한 코덱 |
EP1809041A1 (en) * | 2006-01-11 | 2007-07-18 | Mitsubishi Electric Information Technology Centre Europe B.V. | Error concealement for scalable video coding |
KR101353689B1 (ko) | 2006-03-27 | 2014-01-21 | 파나소닉 주식회사 | 화상 부호화 장치 및 화상 복호화 장치 |
KR100759722B1 (ko) * | 2006-05-12 | 2007-09-20 | 경희대학교 산학협력단 | 영상 프레임의 크기에 따라 계층 간의 영상 프레임들을서로 다른 예측 구조로 움직임 보상을 수행하는 h.264기반 스케일러블 부호화 방법 |
JP5134001B2 (ja) * | 2006-10-18 | 2013-01-30 | アップル インコーポレイテッド | 下層のフィルタリングを備えたスケーラブルビデオ符号化 |
US8548056B2 (en) * | 2007-01-08 | 2013-10-01 | Qualcomm Incorporated | Extended inter-layer coding for spatial scability |
US8199812B2 (en) * | 2007-01-09 | 2012-06-12 | Qualcomm Incorporated | Adaptive upsampling for scalable video coding |
JP5098081B2 (ja) * | 2007-07-19 | 2012-12-12 | オリンパス株式会社 | 画像処理方法および画像処理装置 |
FR2920632A1 (fr) * | 2007-08-31 | 2009-03-06 | Canon Kk | Procede et dispositif de decodage de sequences video avec masquage d'erreurs |
JP2009089356A (ja) * | 2007-09-10 | 2009-04-23 | Fujifilm Corp | 画像処理装置、画像処理方法、およびプログラム |
US8126054B2 (en) * | 2008-01-09 | 2012-02-28 | Motorola Mobility, Inc. | Method and apparatus for highly scalable intraframe video coding |
EP2146343A1 (en) * | 2008-07-16 | 2010-01-20 | Deutsche Thomson OHG | Method and apparatus for synchronizing highly compressed enhancement layer data |
WO2010014760A1 (en) * | 2008-08-01 | 2010-02-04 | Zoran Corporation | Video encoder with an integrated temporal filter for denoising |
US8325796B2 (en) * | 2008-09-11 | 2012-12-04 | Google Inc. | System and method for video coding using adaptive segmentation |
US20100208795A1 (en) * | 2009-02-19 | 2010-08-19 | Motorola, Inc. | Reducing aliasing in spatial scalable video coding |
US9774882B2 (en) | 2009-07-04 | 2017-09-26 | Dolby Laboratories Licensing Corporation | Encoding and decoding architectures for format compatible 3D video delivery |
WO2011087963A1 (en) | 2010-01-15 | 2011-07-21 | Dolby Laboratories Licensing Corporation | Edge enhancement for temporal scaling with metadata |
KR101665567B1 (ko) * | 2010-05-20 | 2016-10-12 | 삼성전자주식회사 | 3차원 뎁스 영상 시간 보간 방법 및 장치 |
US10104391B2 (en) | 2010-10-01 | 2018-10-16 | Dolby International Ab | System for nested entropy encoding |
US20120082228A1 (en) * | 2010-10-01 | 2012-04-05 | Yeping Su | Nested entropy encoding |
US20130222539A1 (en) * | 2010-10-08 | 2013-08-29 | Dolby Laboratories Licensing Corporation | Scalable frame compatible multiview encoding and decoding methods |
US20120189060A1 (en) * | 2011-01-20 | 2012-07-26 | Industry-Academic Cooperation Foundation, Yonsei University | Apparatus and method for encoding and decoding motion information and disparity information |
US9154799B2 (en) | 2011-04-07 | 2015-10-06 | Google Inc. | Encoding and decoding motion via image segmentation |
JP2013005077A (ja) * | 2011-06-14 | 2013-01-07 | Sony Corp | 画像処理装置および方法 |
US8467363B2 (en) | 2011-08-17 | 2013-06-18 | CBF Networks, Inc. | Intelligent backhaul radio and antenna system |
US8422540B1 (en) | 2012-06-21 | 2013-04-16 | CBF Networks, Inc. | Intelligent backhaul radio with zero division duplexing |
US8571309B2 (en) * | 2011-11-15 | 2013-10-29 | At&T Intellectual Property I, L.P. | System and method of image upsampling |
US20130188718A1 (en) * | 2012-01-20 | 2013-07-25 | Qualcomm Incorporated | Motion prediction in svc without including a temporally neighboring block motion vector in a candidate list |
US9262670B2 (en) | 2012-02-10 | 2016-02-16 | Google Inc. | Adaptive region of interest |
GB2505643B (en) * | 2012-08-30 | 2016-07-13 | Canon Kk | Method and device for determining prediction information for encoding or decoding at least part of an image |
WO2013137588A1 (ko) * | 2012-03-12 | 2013-09-19 | 엘지전자 주식회사 | 스케일러블 비디오 디코딩/인코딩 방법 및 이를 이용한 디코딩/인코딩 장치 |
GB2501517A (en) * | 2012-04-27 | 2013-10-30 | Canon Kk | Scalable Encoding and Decoding of a Digital Image |
US10154177B2 (en) * | 2012-10-04 | 2018-12-11 | Cognex Corporation | Symbology reader with multi-core processor |
US10085017B2 (en) * | 2012-11-29 | 2018-09-25 | Advanced Micro Devices, Inc. | Bandwidth saving architecture for scalable video coding spatial mode |
US9357211B2 (en) * | 2012-12-28 | 2016-05-31 | Qualcomm Incorporated | Device and method for scalable and multiview/3D coding of video information |
CN103237213B (zh) * | 2013-04-08 | 2016-03-30 | 华为技术有限公司 | 视频编码方法和视频解码方法及相关装置 |
US9392272B1 (en) | 2014-06-02 | 2016-07-12 | Google Inc. | Video coding using adaptive source variance based partitioning |
FR3023036A1 (fr) * | 2014-06-27 | 2016-01-01 | Orange | Re-echantillonnage par interpolation d'un signal audio pour un codage / decodage a bas retard |
US9578324B1 (en) | 2014-06-27 | 2017-02-21 | Google Inc. | Video coding using statistical-based spatially differentiated partitioning |
US10134110B1 (en) * | 2015-04-01 | 2018-11-20 | Pixelworks, Inc. | Temporal stability for single frame super resolution |
JP6048564B2 (ja) * | 2015-10-29 | 2016-12-21 | ソニー株式会社 | 画像処理装置及び画像処理方法 |
US10798396B2 (en) | 2015-12-08 | 2020-10-06 | Samsung Display Co., Ltd. | System and method for temporal differencing with variable complexity |
JP6265249B2 (ja) * | 2016-11-22 | 2018-01-24 | ソニー株式会社 | 画像処理装置及び画像処理方法 |
CN112995663B (zh) * | 2019-12-02 | 2022-09-23 | 华为技术有限公司 | 视频编码的方法、视频解码的方法及相应装置 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9102220D0 (en) * | 1991-02-01 | 1991-03-20 | British Telecomm | Method and apparatus for decoding video signals |
JP3788823B2 (ja) * | 1995-10-27 | 2006-06-21 | 株式会社東芝 | 動画像符号化装置および動画像復号化装置 |
JP3263807B2 (ja) * | 1996-09-09 | 2002-03-11 | ソニー株式会社 | 画像符号化装置および画像符号化方法 |
US6148026A (en) | 1997-01-08 | 2000-11-14 | At&T Corp. | Mesh node coding to enable object based functionalities within a motion compensated transform video coder |
JP2000209580A (ja) | 1999-01-13 | 2000-07-28 | Canon Inc | 画像処理装置およびその方法 |
JP2003518882A (ja) * | 1999-12-28 | 2003-06-10 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Snrスケーラブルビデオ符号化方法及び対応する復号化方法 |
US6510177B1 (en) | 2000-03-24 | 2003-01-21 | Microsoft Corporation | System and method for layered video coding enhancement |
US6940905B2 (en) | 2000-09-22 | 2005-09-06 | Koninklijke Philips Electronics N.V. | Double-loop motion-compensation fine granular scalability |
US6907070B2 (en) | 2000-12-15 | 2005-06-14 | Microsoft Corporation | Drifting reduction and macroblock-based control in progressive fine granularity scalable video coding |
US6873655B2 (en) * | 2001-01-09 | 2005-03-29 | Thomson Licensing A.A. | Codec system and method for spatially scalable video data |
US20020118743A1 (en) * | 2001-02-28 | 2002-08-29 | Hong Jiang | Method, apparatus and system for multiple-layer scalable video coding |
JP2005506815A (ja) * | 2001-10-26 | 2005-03-03 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 空間拡張可能圧縮のための方法及び装置 |
US6996173B2 (en) * | 2002-01-25 | 2006-02-07 | Microsoft Corporation | Seamless switching of scalable video bitstreams |
US7397858B2 (en) * | 2002-05-29 | 2008-07-08 | Innovation Management Sciences, Llc | Maintaining a plurality of codebooks related to a video signal |
US7062096B2 (en) * | 2002-07-29 | 2006-06-13 | Matsushita Electric Industrial Co., Ltd. | Apparatus and method for performing bitplane coding with reordering in a fine granularity scalability coding system |
US7072394B2 (en) * | 2002-08-27 | 2006-07-04 | National Chiao Tung University | Architecture and method for fine granularity scalable video coding |
CN1771735A (zh) | 2002-12-17 | 2006-05-10 | 皇家飞利浦电子股份有限公司 | 编码用于网关的低成本多描述的视频流的方法 |
US7194035B2 (en) | 2003-01-08 | 2007-03-20 | Apple Computer, Inc. | Method and apparatus for improved coding mode selection |
EP1597919A1 (en) | 2003-02-17 | 2005-11-23 | Koninklijke Philips Electronics N.V. | Video coding |
EP1455534A1 (en) * | 2003-03-03 | 2004-09-08 | Thomson Licensing S.A. | Scalable encoding and decoding of interlaced digital video data |
US7860161B2 (en) * | 2003-12-15 | 2010-12-28 | Microsoft Corporation | Enhancement layer transcoding of fine-granular scalable video bitstreams |
US20050195896A1 (en) * | 2004-03-08 | 2005-09-08 | National Chiao Tung University | Architecture for stack robust fine granularity scalability |
US20050201468A1 (en) * | 2004-03-11 | 2005-09-15 | National Chiao Tung University | Method and apparatus for interframe wavelet video coding |
KR100587561B1 (ko) * | 2004-04-08 | 2006-06-08 | 삼성전자주식회사 | 모션 스케일러빌리티를 구현하는 방법 및 장치 |
US20060012719A1 (en) * | 2004-07-12 | 2006-01-19 | Nokia Corporation | System and method for motion prediction in scalable video coding |
KR100664929B1 (ko) * | 2004-10-21 | 2007-01-04 | 삼성전자주식회사 | 다 계층 기반의 비디오 코더에서 모션 벡터를 효율적으로압축하는 방법 및 장치 |
-
2004
- 2004-12-08 KR KR1020040103059A patent/KR100664929B1/ko not_active IP Right Cessation
-
2005
- 2005-10-20 US US11/254,051 patent/US7889793B2/en not_active Expired - Fee Related
- 2005-10-21 CN CN2005101138931A patent/CN1764280B/zh not_active Expired - Fee Related
-
2011
- 2011-01-13 US US13/005,990 patent/US8116578B2/en not_active Expired - Fee Related
-
2012
- 2012-01-23 US US13/355,619 patent/US8520962B2/en not_active Expired - Fee Related
Cited By (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101467461B (zh) * | 2006-04-11 | 2012-11-28 | 三星电子株式会社 | 基于多层的视频编码方法及其装置 |
US8155181B2 (en) | 2006-04-11 | 2012-04-10 | Samsung Electronics Co., Ltd. | Multilayer-based video encoding method and apparatus thereof |
CN101755458B (zh) * | 2006-07-11 | 2016-02-10 | 诺基亚技术有限公司 | 可缩放视频编码方法和装置以及可缩放视频解码方法和装置 |
US10623761B2 (en) | 2011-07-14 | 2020-04-14 | Sony Corporation | Image processing apparatus and image processing method |
US9749625B2 (en) | 2011-07-14 | 2017-08-29 | Sony Corporation | Image processing apparatus and image processing method utilizing a correlation of motion between layers for encoding an image |
CN103650494A (zh) * | 2011-07-14 | 2014-03-19 | 索尼公司 | 图像处理装置及图像处理方法 |
CN103650494B (zh) * | 2011-07-14 | 2017-11-24 | 索尼公司 | 图像处理装置及图像处理方法 |
CN108366268A (zh) * | 2011-11-07 | 2018-08-03 | 佳能株式会社 | 编码设备 |
CN108366268B (zh) * | 2011-11-07 | 2021-10-08 | 佳能株式会社 | 编码设备 |
CN108366267B (zh) * | 2011-11-07 | 2021-10-08 | 佳能株式会社 | 编码设备 |
CN108600764B (zh) * | 2011-11-07 | 2021-10-22 | 佳能株式会社 | 编码设备 |
CN108600763B (zh) * | 2011-11-07 | 2021-10-22 | 佳能株式会社 | 编码设备 |
CN108366267A (zh) * | 2011-11-07 | 2018-08-03 | 佳能株式会社 | 编码设备 |
CN108600763A (zh) * | 2011-11-07 | 2018-09-28 | 佳能株式会社 | 编码设备 |
CN108600764A (zh) * | 2011-11-07 | 2018-09-28 | 佳能株式会社 | 编码设备 |
CN104170388B (zh) * | 2011-11-10 | 2019-01-25 | 卢卡·罗萨托 | 分层的信号质量层级中的运动映射图和其它辅助映射图的向上采样和向下采样 |
US9967568B2 (en) | 2011-11-10 | 2018-05-08 | V-Nova International Limited | Upsampling and downsampling of motion maps and other auxiliary maps in a tiered signal quality hierarchy |
CN104170388A (zh) * | 2011-11-10 | 2014-11-26 | 卢卡·罗萨托 | 分层的信号质量层级中的运动映射图和其它辅助映射图的向上采样和向下采样 |
CN104620581A (zh) * | 2012-05-14 | 2015-05-13 | 卢卡·罗萨托 | 分层时间层级中的基于时间的和/或多维信号的解码和重构 |
CN108156463A (zh) * | 2012-08-29 | 2018-06-12 | Vid拓展公司 | 用于可分级视频编码的运动矢量预测的方法和装置 |
US11343519B2 (en) | 2012-08-29 | 2022-05-24 | Vid Scale. Inc. | Method and apparatus of motion vector prediction for scalable video coding |
CN108156463B (zh) * | 2012-08-29 | 2022-07-01 | Vid拓展公司 | 用于可分级视频编码的运动矢量预测的方法和装置 |
CN104756498A (zh) * | 2012-09-21 | 2015-07-01 | 英特尔公司 | 跨层运动向量预测 |
CN103716629B (zh) * | 2012-09-29 | 2017-02-22 | 华为技术有限公司 | 用于图像处理的方法、装置、编码器和解码器 |
CN103716629A (zh) * | 2012-09-29 | 2014-04-09 | 华为技术有限公司 | 用于图像处理的方法、装置编码器和解码器 |
CN108540809A (zh) * | 2012-10-09 | 2018-09-14 | 英迪股份有限公司 | 用于多层视频的解码装置、编码装置及层间预测方法 |
CN108347612B (zh) * | 2018-01-30 | 2020-09-15 | 东华大学 | 一种基于视觉注意机制的监控视频压缩与重构方法 |
CN108347612A (zh) * | 2018-01-30 | 2018-07-31 | 东华大学 | 一种基于视觉注意机制的监控视频压缩与重构方法 |
CN110446072B (zh) * | 2019-08-14 | 2021-11-23 | 咪咕视讯科技有限公司 | 视频流切换方法、电子设备和存储介质 |
CN110446072A (zh) * | 2019-08-14 | 2019-11-12 | 咪咕视讯科技有限公司 | 视频流切换方法、电子设备和存储介质 |
CN114424552A (zh) * | 2019-09-29 | 2022-04-29 | 华为技术有限公司 | 一种低延迟信源信道联合编码方法及相关设备 |
Also Published As
Publication number | Publication date |
---|---|
KR20060035542A (ko) | 2006-04-26 |
KR100664929B1 (ko) | 2007-01-04 |
US20060088101A1 (en) | 2006-04-27 |
US8116578B2 (en) | 2012-02-14 |
US20120189061A1 (en) | 2012-07-26 |
US20110110432A1 (en) | 2011-05-12 |
US7889793B2 (en) | 2011-02-15 |
CN1764280B (zh) | 2010-09-08 |
US8520962B2 (en) | 2013-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1764280A (zh) | 基于多层在视频编码器中有效压缩运动矢量的方法和装置 | |
KR100746007B1 (ko) | 엔트로피 코딩의 컨텍스트 모델을 적응적으로 선택하는방법 및 비디오 디코더 | |
JP5014989B2 (ja) | 基礎階層を利用するフレーム圧縮方法、ビデオコーディング方法、フレーム復元方法、ビデオデコーディング方法、ビデオエンコーダ、ビデオデコーダ、および記録媒体 | |
JP4891234B2 (ja) | グリッド動き推定/補償を用いたスケーラブルビデオ符号化 | |
KR100703748B1 (ko) | 다 계층 기반의 비디오 프레임을 효율적으로 예측하는 방법및 그 방법을 이용한 비디오 코딩 방법 및 장치 | |
KR100679031B1 (ko) | 다 계층 기반의 비디오 인코딩 방법, 디코딩 방법 및 상기방법을 이용한 장치 | |
AU2006201490B2 (en) | Method and apparatus for adaptively selecting context model for entropy coding | |
JP4837047B2 (ja) | ビデオ信号をグループ別にエンコーディングおよびデコーディングする方法および装置 | |
JP2009532979A (ja) | 加重平均合を用いてfgs階層をエンコーディングおよびデコーディングする方法および装置 | |
EP1659797A2 (en) | Method and apparatus for compressing motion vectors in video coder based on multi-layer | |
CN1943244A (zh) | 视频编码中的帧间预测方法、视频编码器、视频解码方法和视频解码器 | |
KR20010075232A (ko) | 비디오 시퀀스의 압축을 위한 인코딩 방법 | |
JP2006304307A5 (zh) | ||
CN1961582A (zh) | 在多层结构中有效压缩运动向量的方法和装置 | |
CN101069433A (zh) | 使用离散余弦变换上采样编码/解码多层视频的方法和装置 | |
CN1722831A (zh) | 对包括基本层的比特流预解码和解码的方法和设备 | |
JP2004201315A (ja) | 空間スケーラブルな動きベクトルを用いたウェーブレット理論に基づく多重解像度映像表示 | |
JP2009533938A (ja) | 多階層基盤のビデオエンコーディング方法および装置 | |
JP2007150432A (ja) | 動画像符号化/復号化方法および装置 | |
EP1741297A1 (en) | Method and apparatus for implementing motion scalability | |
KR100834757B1 (ko) | 엔트로피 부호화 효율을 향상시키는 방법 및 그 방법을이용한 비디오 인코더 및 비디오 디코더 | |
Spiteri et al. | Scalable video coding with multi-layer motion vector palettes | |
EP1839441A2 (en) | Fine granularity scalable video encoding and decoding method and apparatus capable of controlling deblocking | |
WO2006080663A1 (en) | Method and apparatus for effectively encoding multi-layered motion vectors | |
WO2006098586A1 (en) | Video encoding/decoding method and apparatus using motion prediction between temporal levels |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20100908 Termination date: 20191021 |
|
CF01 | Termination of patent right due to non-payment of annual fee |