WO2022061563A1

WO2022061563A1 - 视频编码方法、装置及计算机可读存储介质

Info

Publication number: WO2022061563A1
Application number: PCT/CN2020/117038
Authority: WO
Inventors: 王悦名; 郑萧桢
Original assignee: 深圳市大疆创新科技有限公司
Priority date: 2020-09-23
Filing date: 2020-09-23
Publication date: 2022-03-31

Abstract

一种视频编码方法、装置及计算机可读存储介质，所述方法包括：根据帧内预测的M种预测模式，利用当前待编码图像块的相邻图像块的参考像素生成所述当前待编码图像块在所述M种预测模块下分别对应的M个预测图像块；M为自然数（S101）；基于所述当前待编码图像块分别与所述M个预测图像块的差异，获取M个残差块（S102）；根据所述M个残差块分别获取所述M种预测模块对应的编码代价，并从所述M种预测模式中确定所述编码代价最小的目标预测模式（S103）；获取所述目标预测模式对应的残差块的部分频率系数（S104）；根据所述目标预测模式对应的预测图像块和所述部分频率系数生成所述当前待编码图像块的参考像素，供下一个待编码图像块使用（S105）。该方法能够提高预测结果的准确性。

Description

视频编码方法、装置及计算机可读存储介质

技术领域

本申请涉及图像编码技术领域，具体而言，涉及一种视频编码方法、装置及计算机可读存储介质。

背景技术

视频的压缩编码技术是视频传输中的关键技术之一，通过高效的视频压缩技术将视频进行大幅度的压缩，可以有效的降低对网络传输带宽的需求。

目前，在视频编码过程中，通常使用帧内预测方法来消除图像的空间冗余度，使用帧间预测方法来消除时间冗余度。具体而言，帧内预测方法是指利用视频空间域的相关性，使用当前图像已编码的像素预测当前像素，以达到去除视频空域冗余的目的，然后将预测残差作为后续编码图像块的输入，进行下一步编码处理。

现有视频编码标准中将图像(或者说图片)划分成多个图像块来进行编码，这些图像块的处理取决于它们的尺寸、空间位置和编码器指定的编码模式。其中，使用帧内预测方法对当前待编码图像块进行编码时，需要依赖当前待编码图像相邻的已编码图像块来产生预测值，比如在自上而下且自左向右的预测方向上，所述当前待编码图像依赖于其左侧和上方相邻的已编码图像块，因此在计算每个待编码图像块(除位于图像边界处的待编码图像块外)的预测值时都必须等待其左侧及上方的图像块先编码完成后才能进行，因此存在很强的依赖性可能会导致编码延迟。

特别是在具备多个流水级的芯片(或者说硬件编码器)中进行视频编码时，各流水级并行进行不同的编码步骤，则可以并行处理多个待编码图像块，从而提高编码效率。但由于当前待编码图像块对相邻图像块的重建像素存在很强的依赖性，可能其中一个流水级在处理当前待编码图像块需要用到相邻图像块的重建像素时，另一个流水级正在处理该相邻图像块，此时相邻图像块的重建像素还未生成，使得芯片无法实现并行化，导致最终实现的芯片处理速度及编码效率不足。对此，相关技术的做法是采用相邻图像块的原始像素替代重建像素来处理，但这显然会导致预测结果的不准确。

发明内容

有鉴于此，本申请的目的之一是提供一种视频编码方法、装置及计算机可读存储介质。

第一方面，本申请实施例提供了一种视频编码方法，包括：

根据帧内预测的M种预测模式，利用当前待编码图像块的相邻图像块的参考像素生成所述当前待编码图像块在所述M种预测模块下分别对应的M个预测图像块；M为自然数；

基于所述当前待编码图像块分别与所述M个预测图像块的差异，获取M个残差块；

根据所述M个残差块分别获取所述M种预测模块对应的编码代价，并从所述M种预测模式中确定所述编码代价最小的目标预测模式；

获取所述目标预测模式对应的残差块的部分频率系数；

根据所述目标预测模式对应的预测图像块和所述部分频率系数生成所述当前待编码图像块的参考像素，供下一个待编码图像块使用。

第二方面，本申请实施例提供了一种视频编码装置，包括一个或多个处理器，单独的或共同的工作，所述处理器包括多个流水级；以及用于存储可执行指令的存储器；

所述处理器在执行所述可执行指令时，在其中一个流水级中执行以下步骤：

获取所述目标预测模式对应的残差块的部分频率系数；

第三方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机指令，该指令被处理器执行时实现第一方面所述的方法。

本申请实施例所提供的一种视频编码方法、装置及计算机可读存储介质，能够提高预测结果的准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一个实施例提供的一种视频通信***的示意图；

图2是本申请一个实施例提供的一种视频编码过程的示意图；

图3是本申请一个实施例提供的多个流水级并行处理的示意图；

图4是本申请一个实施例提供的一种视频编码方法的流程示意图；

图5、图6是本申请一个实施例提供的图像块划分的示意图；

图7、图8A以及图8B是本申请一个实施例提供的残差块划分的示意图；

图9是本申请一个实施例提供的另一种视频编码方法的流程示意图；

图10是本申请一个实施例提供的一种视频编码装置的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例中的视频编码方法应用于多媒体信息的压缩编码过程，多媒体信息包括视频、静态图像、动态图像等。本申请中以视频通信为例进行介绍，图1为典型的视频通信***示意图，如图1所示：发送端100包括视频采集装置101、视频编码装置102和发送装置103，视频采集装置101将采集到的视频发送至视频编码装置102中进行图像信息的压缩编码，然后通过发送装置103发送出去。接收端200包括接收装置201、视频显示装置203和视频解码装置202，接收装置201接收发送端100发送的压缩的视频数据，视频解码装置202对接收的视频数据进行解码恢复出图像，并将解码出来的图像显示在视频显示装置203上。本申请实施例中的视频编码方法主要应用于视频通信***中的视频编码装置上，使用帧内预测方法对多媒体信息进行压缩编码，达到去除视频空域冗余的目的。

以下，对视频编码进行简要说明。一般来说，视频编码过程包括预测、变换、量化和熵编码等步骤，图2示出了一种编码流程图。其中预测包括帧内预测和帧间预测两种类型，其目的在于利用预测块信息来去除当前待编码图像的冗余信息。

视频内的每一帧都可以看成是一幅独立的图像，图像中会存在一定的空间冗余，比如经常在图像或视频背景中出现的天空区域，其内部像素之间就极为相似，这样的区域为图像或视频的编码提供了很大的压缩空间。帧内预测就是用来去除每一帧内部的空间冗余。帧内预测利用本帧图像的信息获得预测块数据，其过程包括将待编码图像划分成若干个待编码图像块；然后，针对每个待编码图像块，利用待编码图像块相邻的已编码图像块来生成当前待编码图像块的预测块。

为了保持视频播放的连贯性，使人眼感觉不到帧与帧之间的停顿，一般视频都会采用25帧/秒以上的帧采样率。也就是说，在时间上两个连续帧之间的时间间隔将小于1/25＝0.04秒。当视频中运动物体的速度不致过快时，相邻两帧之间的相关度就会非常高，因此，会形成帧与帧之间的时间冗余。帧间预测就是用来去除帧与帧之间的时间冗余；帧间预测利用参考帧的信息获得预测块数据，其过程包括将待编码图像划分成若干个待编码图像块；然后，针对每个待编码图像块，在参考帧中搜索与当前待编码图像块最匹配的图像块作为预测块，预测块与当前待编码图像块的相对位移即为运动矢量；所述参考帧可以是与待编码图像相邻的已编码图像。

在编码中仅使用帧内预测模式的图像帧被称为I帧，同时使用帧内预测及帧间预测的图像帧被称为P或B帧。使用帧内预测或帧间预测获得预测块后，将该待编码图像块与预侧块的相应像素值相减得到残差块。

变换是将残差块从时域变换到频域上，进而能够在频域上对残差块进行进一步分析，可以使用变换矩阵对残差块进行变换。残差块的变换通常采用二维变换，即在编码端将残差块中的残差值分别与一个NxN的变换矩阵及其转置矩阵相乘，相乘之后得到的是变换系数。

视频内容来源于现实世界，不能确保其包含的全部信息都能被人眼感知，故可以针对人眼感知光信号的特性对视频做适当的精简，以去除其中的视觉冗余。量化就是用来去除基于人眼的视觉冗余；其中，经变换后得到的变换系数经量化参数量化后可得到量化系数，经量化过程可以进一步提高编码效率。

一般来说，显示世界中的信号，尤其是视频中的各种参量信号，在其对应信号控件中的取值不会遵循单一的均匀分布，而通常会在一个或几个特殊点取极大值或极小值，在这过程中的冗余即为统计冗余。熵编码就是用来去除这种统计冗余，将量化后的系数进行熵编码，通过为概率较大的取值点分配较短码字，为概率较小的取值点分配较长码字的途径来提高压缩效率，去除统计冗余。

最后将熵编码得到的码流及进行编码后的编码模式信息，如帧内预测模式、运动矢量信息等，进行存储或发送到解码端。另外，量化后的系数通过反量化和反变换过程获取重建残差块，然后重建残差块与对应的预测块相加得到重建帧，重建帧经过环路滤波之后，作为其他待编码图像的参考帧使用，以便其他待编码图像进行帧间预测。

在图像的解码端，首先获得熵编码码流后进行熵解码，得到相应的残差块，根据解码得到的运动矢量或帧内预测等信息获取对应的预测块，根据预测块与残差块得到当前待编码图像块中各像素点的重建值。

为了提高处理速度和资源利用率，在硬件编码器中进行视频编码处理时，通常会划分多个流水级，相应的会将视频编码处理过程拆分成多个步骤，每个流水级并行处理不同的步骤，一般来说，视频编码处理过程包括预测、变换、量化、反变换、反量化、熵编码和环路滤波等步骤，其中，预测步骤又分为帧内预测和帧间预测步骤。在进行帧内预测时，由于高效率视频编码标准的帧内预测算法进行计算每个尺寸的待编码图像块的预测模式时，均依赖于其左侧及上方的已编码图像块用于产生预测块，计算每个待编码图像块(除位于图像边界处的待编码图像块外)的预测块前都必须等待其左侧及上方的图像块先编码完成。由于待编码图像块对相邻编码图像块的重建像素存在很强的依赖性，硬件编码器实现该算法时无法在帧内预测算法内部实现并行化，导致最终实现的硬件编码器处理速度及效率不足。

在一个例子中，请参阅图3，图3为一个硬件编码器的流水级划分的示意图，流水级一共分为5级，分别为整像素搜索、分像素搜索、帧内预测、模式决策、以及熵编码和滤波，其中，整像素搜索流水级和分像素搜索流水级进行的是有关帧间搜索的步骤，帧内预测流水级进行的是有关帧内搜索的步骤，模式决策流水级是对帧间搜索和帧内搜索得到的一种或多种模式进行变换、量化、反变换、反量化的步骤；其中，在帧内预测流水级中进行首次预测模式判别，遍历所有的预测模式以选出最可能预测模式集，具体来说，会遍历所有的预测模式得到采用每种预测模式下的残差块数据，根据残差块数据来获取每种预测模式对应的编码代价，将编码代价最小的几个预测模式作为最可能预测集；在模式决策流水级中进行进一步地预测模式判别，遍历所述最可能预测模式集中的预测模式以选出最优帧内预测模式。各流水级并行处理，在图3所示的例子中：

在T1时刻，第N个待编码图像块在整像素搜索流水级中进行整像素搜索处理；N为整数。

在T2时刻，第N+1个待编码图像块在整像素搜索流水级中进行整像素搜索处理，第N个待编码图像块在分像素搜索流水级中进行分像素搜索处理。

在T3时刻，第N+2个待编码图像块在整像素搜索流水级中进行整像素搜索处理，第N+1个待编码图像块在分像素搜索流水级中进行分像素搜索处理，第N个待编码图像块在帧内预测流水级中进行帧内预测处理。

在T4时刻，第N+3个待编码图像块在整像素搜索流水级中进行整像素搜索处理，第N+2个待编码图像块在分像素搜索流水级中进行分像素搜索处理，第N+1个待编码图像块在帧内预测流水级中进行帧内预测处理，第N个待编码图像块在模式决策流水级中进行模式决策处理。

在T5时刻，第N+4个待编码图像块在整像素搜索流水级中进行整像素搜索处理，第N+3个待编码图像块在分像素搜索流水级中进行分像素搜索处理，第N+2个待编码图像块在帧内预测流水级中进行帧内预测处理，第N+1个待编码图像块在模式决策流水级中进行模式决策处理，第N个待编码图像块在熵编码和滤波流水级中进行熵编码和滤波处理。

可见，在T4时刻，当第N+1个待编码图像块在帧内预测流水级中进行帧内预测处理，需要用到第N个待编码图像块的预测块，而第N个待编码图像块在模式决策流水级中进行模式决策处理，此时还无法得到第N个待编码图像块的预测块，则所述第N+1个待编码图像块无法继续处理，需要等待第N个待编码图像块的预测块，使得硬件编码器在实现帧内预测时无法在内部实现并行化，导致最终实现的硬件编码器的处理速度及效率不足。当然，可以理解的是，以上流水级的划分仅为举例说明，可根据实际需要划分不同的流水级，本实施例对此不做任何限制。

另外，为了实现并行化处理的过程，相关技术中，当第N+1个待编码图像块在帧内预测流水级中进行帧内预测处理时，由于还无法得到第N个待编码图像块的预测块，因此会采用第N个待编码图像块的原始像素来进行首次预测模式判别过程，但这显然会导致预测结果的不准确性。

基于此，本申请实施例提供了一种视频编码方法，本申请实施例的视频编码方法可应用于包括多个流水级的芯片上，所述芯片可安装于视频编码装置(或者说硬件编码器)上，由所述视频编码装置使用所述流水级进行视频编码处理，其中，本申请实施例的视频编码方法可在其中一个流水级中执行，比如在图3示例性划分的流水级中，可在帧内预测流水级中进行。或者，本申请实施例的视频编码方法也可以在软件编码器上执行，本申请实施例对此不做任何限制。

本申请实施例提供的视频编码方法，可以在其中一个流水级中生成当前待编码图像的参考像素，比如在帧内预测流水级中进行，这样在视频编码装置的多流水级并行作业过程中，当第N个待编码图像块在帧内预测流水级中进行首次预测模式判别时，以及利用本申请实施例提供的视频编码方法生成第N个待编码图像块的参考像素之后，所述第N个待编码图像块进入下一个流水级，比如进入模式决策流水级，此时第N+1个待编码图像块进入帧内预测流水级进行处理，由于第N个待编码图像块在帧内预测流水级中生成了第N个待编码图像块的参考像素，则第N+1个待编码图像块在帧内预测流水级中进行首次预测模式判别时，可以直接利用第N个待编码图像块的参考像素进行模式判别，无需等待所述第N个待编码图像块在模式决策流水级中生成的预测块，从而保证帧内预测流水级的并行处理过程，有利于提高编码效率；而且，相对于使用相邻图像块的原始像素进行预测模式判别，使用相邻图像块的参考像素(利用本申请实施例的视频编码方法生成)来进行预测模式判别，获取的预测结果更为准确。

以下对利用本申请的视频编码方法生成所述当前编码图像块的参考像素的过程进行具体说明：请参阅图4，图4为本申请实施例提供的一种视频编码方法的流程示意图，所述方法可应用于视频编码装置上，所述方法包括：

在步骤S101中，根据帧内预测的M种预测模式，利用当前待编码图像块的相邻图像块的参考像素生成所述当前待编码图像块在所述M种预测模块下分别对应的M个预测图像块；M为自然数。

在步骤S102中，基于所述当前待编码图像块分别与所述M个预测图像块的差异，获取M个残差块。

在步骤S103中，根据所述M个残差块分别获取所述M种预测模块对应的编码代价，并从所述M种预测模式中确定所述编码代价最小的目标预测模式。

在步骤S104中，获取所述目标预测模式对应的残差块的部分频率系数。

在步骤S105中，根据所述目标预测模式对应的预测图像块和所述部分频率系数生成所述当前待编码图像块的参考像素，供下一个待编码图像块使用。在一个实施方式中，所述根据所述目标预测模式对应的预测图像块和所述部分频率系数生成所述当前待编码图像块的参考像素，包括：将获取到的DC系数直接用于生成所述当前待编码图像块的参考像素；或者将获取到的DC系数进行量化和反量化处理，并且将已量化和反量化的DC系数生成所述当前待编码图像块的参考像素。例如，可以根据所述目标预测模式对应的预测块和所述已量化和反量化的DC系数，生成所述当前待编码图像块的参考像素。或者，可以根据所述目标预测模式对应的预测块和所述获取到的DC系数(即，未经过量化和反量化处理的DC系数)，生成所述当前待编码图像块的参考像素。

对于步骤S101，所述待编码图像块是指要进行帧内预测的预测单元。在进行预测环节时使用的基本编码单元为预测单元(Prediction Unit，以下简称为PU)，所有和预测相关的操作都是以PU为单位的。例如：帧内预测的方向、帧间预测的运动矢量差和参考帧索引、运动矢量预测、运动估计以及运动补偿都是基于PU进行处理的。可以理解的是，在实际应用过程中，不同的视频压缩标准，其划分的待编码图像块的大小也有所不同，其命名可能也有所不同，可依据实际应用场景进行具体设置，本申请实施例对此不做任何限制。本领域技术人员可知，当编码采用其他标准时，本申请所记载的技术方案对于类似技术问题同样适用。

所述当前待编码图像块为被划分为L×L个图像块的图像中的其中一个，L为自然数，作为视频编码的一个示例，基本编码单位是尺寸为64x64的待编码图像块，帧内预测编码模式下进一步可能划分为1个64x64的待编码图像块或4个32x32的待编码图像块，或者16个16x16的待编码图像块，或者64个8x8的待编码图像块，或者256个4x4的待编码图像块或者若干不同尺寸的待编码图像块相结合。在一个例子中，请参阅图5，图5是表示64x64的待编码图像块的划分的一例的示意图。左侧尺寸为64x64的待编码图像块在编码后最终划分为1个32x32的已编码图像块、10个16x16的已编码图像块、7个8x8的已编码图像块及4个4x4的已编码图像块。

在一实施例中，所述M种预测模块可以为帧内预测对应的所有预测模式或者部分预测模式，比如在HEVC(HighEfficiency Video Coding，一种视频压缩标准)中的帧内预测模式包括33种角度模式、DC模式和Planar模式。在对每个待编码图像块进行帧内预测时，所述M种预测模块可以指这35种预测模式，即分别利用待编码图像块相邻的已编码图像块按照35个预测模式对应的计算公式算出35个候选的预测像素块，之后再根据最优化原则从35个预测模式中选出最优的预测模式。或者，根据实际应用场景，考虑进行35种预测模式的模式判别对硬件资源和时间的消耗很大，因此，所述M种预测模式可以是这35种预测模式中的部分预测模式，比如可以从中选择出10种、15种或者20种预测模式；或者可以将帧内预测的全部预测模式分成至少2组，所述M种预测模式为其中1组对应的所有预测模式；当然，本申请对于具体的选择过程不做任何限制，可依据实际应用场景进行具体选择。

在一实施例中，所述M种预测模式可以包括帧内预测的亮度分量预测模式和/或色度分量预测模式(和/或表示两者或者两者之一)。在本实施例中，可以只对待编码图像块的色度块采用本申请实施例的视频编码方法，或者也可以只对待编码图像块的亮度块采用本申请实施例的视频编码方法，或者还可以对待编码图像块的色度块和亮度块均采用本申请实施例的视频编码方法，本申请实施例对此不做任何限制，可依据实际应用场景进行具体选择。

进一步地，所述M种预测模式可以包括帧内预测的所有亮度分量预测模式或者部分亮度分量预测模式，和/或，所有色度分量预测模式或者部分色度分量预测模式。可依据实际应用场景进行具体选择。

在一实施例中，在确定帧内预测的M种预测模式之后，所述视频编码装置利用当前待编码图像块的相邻图像块的参考像素以及各个预测模式对应的计算公式，来生成所述当前待编码图像块在各种预测模式下对应的预测图像块；其中，所述当前待编码图像块的相邻图像块的参考像素是指利用本申请实施例的视频编码方法所生成的像素。

其中，待编码图像块的尺寸可依据实际应用场景进行具体划分。请参阅图6，图6中示出3个图像块，分别为图像块10、图像块20和图像块30，进一步地，图像块还可以进一步进行划分，以图像块20为例，图像块20进一步划分为子图像块21、子图像块22、子图像块23和子图像块24。

在一个例子中，图像块10为已编码图像块，图像块20和图像块30为待编码图像块，所述当前待编码图像块是图像块20，所述当前待编码图像块的相邻图像块为图像块10，所述图像块10的参考像素为利用本申请实施例的视频编码方法所生成的像素，然后图像块20作为当前待编码图像块，可以通过本申请实施例的视频编码方法，利用相邻图像块(包括图像块10)的参考像素生成图像块20的参考像素，供下一个待编码图像块(即图像块30)使用。

在一个例子中，子图像块21为已编码图像块，子图像块22、子图像块23和子图像块24为待编码图像块，如果当前待编码图像块是子图像块22，所述当前待编码图像块的相邻图像块为子图像块21，所述子图像块21的参考像素为利用本申请实施例的视频编码方法所生成的像素，然后子图像块22作为当前待编码图像块，可以通过本申请实施例的视频编码方法，利用相邻图像块(包括子图像块21)的参考像素生成子图像块22的参考像素，供下一个待编码图像块(即子图像块23)使用。

接着，在步骤S102中，在获取所述当前待编码图像块的M个预测图像块之后，所述视频编码装置基于所述当前待编码图像块分别与所述M个预测图像块的差异，获取M个残差块；具体来说，所述M个残差块分别为所述M个预测图像块分别和所述当前待编码图像块相减的结果，所述残差块上的各个位置上的残差值为所述当前待编码图像块相应位置上的原始像素值和所述预测图像块相应位置上的预测像素值相减的结果。

在获取所述M个残差块之后，在步骤S103中，所述视频编码装置根据所述M个残差块分别获取所述M种预测模块对应的编码代价，并从所述M种预测模式中确定所述编码代价最小的一个作为目标预测模式。本实施例中，选择编码代价最小的一个作为目标预测模式，有利于获取准确的预测结果，从而提高编码效率。

在一个例子中，所述编码代价包括但不限于以下至少一项：率失真优化(Rate DistortionOptimized,RDO)、绝对误差(Sum of Absolute Difference，SAD)、变换后的绝对误差和(Sum of Absolute Transformed Difference，SATD)、平均平方误差(MSE)、差值的平方和(sum of squared difference，SSD)、平均绝对差值(MAE)或者编码比特数。

进一步地，在步骤S104中，在确定所述目标预测模式之后，所述视频编码装置获取所述目标预测模式对应的残差块的部分频率系数，其中，所述部分频率系数可以是所述残差块对应的DC系数，或者所述部分频率系数也可以是所述残差块对应的DC系数和部分AC系数。

其中，这里需要强调的是，依据本申请实施例的视频编码方法获取的当前待编码图像块的参考像素并不等同于所述当前待编码图像块的预测块对应的最终的重建像素，这里结合图3进行说明：正因为所述当前待编码图像块的预测块对应的最终的重建像素是在模式决策流水级中获取的，其获取时间过长。与此同时，下一个待编码图像块在帧内预测流水级中需要用到所述当前待编码图像块的预测块对应的重建像素，但所述当前待编码图像块的预测块对应的重建像素还未获取到，从而造成无法并行化处理的问题，基于此，可以利用本申请的视频编码方法先在帧内预测流水级中生成所述当前待编码图像块的参考像素(例如，估计的重建像素)，以避免耗费过多的编码资源以及编码时长。所述当前待编码图像块的参考像素优于所述当前待编码图像块的原始像素，但次于所述当前待编码图像块的预测块对应的最终的重建像素，从另一个角度讲，所述当前待编码图像块的参考像素(例如，估计的重建像素)的获取时长也小于所述当前待编码图像块的预测块对应的最终的重建像素的获取时长，从而避免耗费过多的编码资源，也能使下一个待编码图像块无需等待当前待编码图像块的参考像素的生成，从而有利于提高编码效率。

基于此，在一种实现方式中，考虑到如果将所述残差块从时域变换到频域上获取变换系数，可能需要耗费过长的编码时间。为了进一步减少编码时长，考虑到DC系数包括了残差块中的大部分信息，则所述视频编码装置可以在时域上获取所述目标预测模式对应的残差块的DC系数，无需将所述残差块变换(例如，通过离散正弦变换和/或离散余弦变换)到频域上去获取所述DC系数；具体而言，在时域上，所述视频编码装置统计所述目标预测模式对应的残差块中所有残差值之和、以及残差值个数，并通过两者的比值获取DC系数。本实施例中无需进行变换步骤，可以直接在时域上获取所述DC系数，从而有效减少变换的处理时长，有利于提高编码效率。

在另一种实现方式中，所述视频编码装置也可以将所述残差块从时域变换到频域上，从而在频域上获取所述残差块的DC系数和部分AC系数。本实施例中，相对于只获取DC系数，获取DC系数和部分AC系数得到的信息更多，从而使得后续生成的所述当前待编码图像块的参考像素在辅助下一个待编码图像块进行预测模式判别时更为准确。

可以理解的是，在实际应用场景中，可以根据实际需要选择要获取的系数，如果想要尽可能短的编码时长，可以选择在时域上获取所述目标预测模式对应的残差块的DC系数；如果想要预测结果更为准确，可以选择在频域上获取所述目标预测模式对应的残差块的DC系数和部分AC系数，本申请实施例对此不做任何限制。最后，在步骤S105中，所述视频编码装置根据所述目标预测模式对应的预测图像块和所述部分频率系数生成所述当前待编码图像块的参考像素，所述当前待编码图像块的参考像素可供下一个待编码图像块使用。本实施例中，下一个待编码图像块无需等待所述当前待编码图像块的预测块，有利于保证多个流水级的并行化处理过程的正常运行，且下一个待编码图像块使用所述当前待编码图像块的参考像素进行预测模式判别，有利于提高预测结果的准确性。

其中，待编码图像块的尺寸可依据实际应用场景进行具体划分。在一个例子中，请参阅图6，当图像块20为当前待编码图像块时，下一个待编码图像块为图像块30；当图像块21为当前待编码图像块时，下一个待编码图像块为图像块22。

在一种实现方式中，在只获取所述目标预测模式对应的残差块的DC系数的情况下，所述视频编码装置根据所述目标预测模式对应的预测图像块和所述DC系数，生成所述当前待编码图像块的参考像素；所述DC系数可直接用于生成所述当前待编码图像块的参考像素，也可以对DC系数进行量化和反量化处理，再用处理后的DC系数生成所述当前待编码图像块的参考像素。具体而言，所述视频编码装置可以将所述预测图像块上的各个像素的像素值加上未经过量化和反量化处理、或经过量化和反量化处理后的DC系数，从而得到所述当前待编码图像块的参考像素。根据本发明的一实施方式，根据所述目标预测模式对应的预测块和所述DC系数，生成所述当前待编码图像块的参考像素包括：仅将所述目标预测模式对应的预测块上的各像素的像素值分别加上所述未经过量化和反量化处理、或经过量化和反量化处理后的DC系数的系数值，得到多个估计的重建像素的多个重建像素值；以及将所述多个估计的重建像素，作为所述当前待编码图像块的参考像素。本实施例中，由于无需经过变换步骤，能够有效缩短编码时长，提高编码效率。

在另一种实现方式中，在获取了所述目标预测模式对应的残差块的DC系数和部分AC系数的情况下，所述视频编码装置根据所述目标预测模式对应的预测块、所述DC系数和部分AC系数，生成所述当前待编码图像块的参考像素。本实施例中，由于获取了DC系数和部分AC系数，即获取到更多的信息，从而能够进一步提高预测结果的准确性。

在一实施例中，为了获取更为准确的预测结果，在获取所述目标预测模式对应的残差块的部分频率系数时，可以将所述目标预测模式对应的残差块划分为至少两个子残差块，并分别获取所述至少两个子残差块的DC系数，本实施例中，综合考虑到通常邻近像素之间的差别不会太大，将所述残差块划分为更小的块分别计算DC系数，有利于提高获取的各个子残差块的DC系数的准确性。

进一步地，在获取所述当前待编码图像块的参考像素时，可以将所述当前待编码块划分为与所述至少两个子残差块一一对应的至少两个待编码子块；以及，将所述目标预测模式对应的预测图像块划分为与所述至少两个子残差块一一对应的至少两个子预测图像块，然后对于每一个待编码子块，根据相应的子预测图像块和相应的子残差块的DC系数生成所述待编码子块的参考像素；最后根据所有待编码子块的参考像素获得所述当前待编码图像块的参考像素。本实施例中，获取每一个待编码子块的参考像素的过程可以并行进行，从而有利于提高获取所述当前待编码图像块的参考像素的效率，进一步提高编码效率。

可以理解的是，本申请实施例对于所述残差块的划分不做任何限制，在一个例子中，请参阅图7，图7包括所述当前待编码图像块100、所述目标预测模式对应的预测图像块200和所述目标预测模式对应的残差块300，所述残差块300可被划分为2个子残差块，分别为子残差块301和子残差块302，则所述当前待编码图像块100可被划分为与两个子残差块一一对应的两个待编码子块，分别为待编码子块101和待编码子块102，所述目标预测模式对应的预测图像块200也可被划分为与两个子残差块一一对应的两个子预测图像块，分别为子预测图像块201和子预测图像块202，则待编码子块101的参考像素为子预测图像块201和子残差块301的DC系数相加的结果，待编码子块102的参考像素为子预测图像块202和子残差块302的DC系数相加的结果。其中，待编码子块101的参考像素和待编码子块102的参考像素可以并行获取，从而有利于提高获取所述当前待编码图像块的参考像素的效率，进一步提高编码效率。

或者，请参阅图8A以及8B，图8A中，所述残差块300也可以被划分成4个子残差块，图8B中，所述残差块300也可以被划分成6个子残差块，可依据实际应用场景进行具体划分，本实施例对此不做任何限制。

请参阅图9，为本申请根据一示例性实施例示出的另一种视频编码方法的流程示意图，所述方法可应用于所述视频编码装置上，所述方法包括：

在步骤S201中，根据帧内预测的M种预测模式，利用当前待编码图像块的相邻图像块的参考像素生成所述当前待编码图像块在所述M种预测模块下分别对应的M个预测图像块；M为自然数。与步骤S101类似，此处不再赘述。

在步骤S202中，基于所述当前待编码图像块分别与所述M个预测图像块的差异，获取M个残差块。与步骤S102类似，此处不再赘述。

在步骤S203中，根据所述M个残差块分别获取所述M种预测模块对应的编码代价，并从所述M种预测模式中确定所述编码代价最小的目标预测模式。与步骤S103类似，此处不再赘述。

在步骤S204中，获取所述目标预测模式对应的残差块的部分频率系数。与步骤S104类似，此处不再赘述。

在步骤S205中，将所述部分频率系数进行量化处理以及反量化处理，得到处理后的频率系数。

在步骤S206中，根据所述目标预测模式对应的预测块和处理后的频率系数生成所述当前待编码图像块的参考像素，供下一个待编码图像块使用。在一个实施方式中，所述根据所述目标预测模式对应的预测图像块和所述部分频率系数生成所述当前待编码图像块的参考像素，包括：将获取到的DC系数直接用于生成所述当前待编码图像块的参考像素；或者将获取到的DC系数进行量化和反量化处理，并且将已量化和反量化的DC系数生成所述当前待编码图像块的参考像素。例如，可以根据所述目标预测模式对应的预测块和所述已量化和反量化的DC系数，生成所述当前待编码图像块的参考像素。或者，可以根据所述目标预测模式对应的预测块和所述获取到的DC系数(即，未经过量化和反量化处理的DC系数)，生成所述当前待编码图像块的参考像素。

在本实施例中，在获取了所述目标预测模式对应的残差块的部分频率系数，将所述部分频率系数进行量化处理以及反量化处理，从而得到处理后的频率系数。本实施例中，通过量化处理过程，能够去除其中的视觉冗余，从而能够进一步提高预测结果的准确性。进一步地，所述视频编码装置在根据所述目标预测模式对应的预测块和处理后的频率系数生成的所述当前待编码图像块的参考像素，使得下一个待编码图像块在使用所述当前待编码图像块的参考像素进行帧内预测时，其预测结果更为准确。

在一种实现方式中，在只获取所述目标预测模式对应的残差块的DC系数的情况下，所述视频编码装置将所述DC系数进行量化处理以及反量化处理，从而去除其中的视觉冗余，从而能够进一步提高预测结果的准确性。需要说明的是，若DC系数为定点数，则需要在量化处理和反量化处理过程中考虑量化和反量化操作对DC系数的放大作用。

在另一种实现方式中，在获取了所述目标预测模式对应的残差块的DC系数和部分AC系数的情况下，所述视频编码装置将所述DC系数和部分AC系数进行量化处理以及反量化处理，从而去除其中的视觉冗余，从而能够进一步提高预测结果的准确性。

相应的，请参阅图10，本申请实施例还提供了一种视频编码装置30，包括一个或多个处理器31，单独的或共同的工作，所述处理器31包括多个流水级；以及用于存储可执行指令的存储器32。

所述处理器31在执行所述可执行指令时，在其中一个流水级中执行以下步骤：

获取所述目标预测模式对应的残差块的部分频率系数；

所述处理器31可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器32可以包括至少一种类型的存储介质，存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器32等等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器32(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等等。存储器32可以是所述视频编码装置30的内部存储单元，例如硬盘或内存。存储器32也可以是所述视频编码装置30的外部存储设备，例如所述视频编码装置30上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，存储器32还可以既包括所述视频编码装置30的内部存储单元也包括外部存储设备。存储器32用于存储计算机程序以及设备所需的其他程序和数据。存储器32还可以用于暂时地存储已经输出或者将要输出的数据。

在一实施例中，所述处理器31具体用于：在时域上获取所述目标预测模式对应的残差块的DC系数。

在一实施例中，所述处理器31具体用于：在时域上，统计所述目标预测模式对应的残差块中所有残差值之和、以及残差值个数，并通过两者的比值获取DC系数。

在一实施例中，所述处理器31具体用于：根据所述目标预测模式对应的预测块和所述DC系数，生成所述当前待编码图像块的参考像素。

在一实施例中，所述部分频率系数包括DC系数，或者DC系数和部分AC系数。

在一实施例中，所述处理器31还用于：将所述部分频率系数进行量化处理以及反量化处理，得到处理后的频率系数；根据所述目标预测模式对应的预测块和处理后的频率系数生成所述当前待编码图像块的参考像素。

在一实施例中，所述M个残差块分别为所述M个预测图像块分别和所述当前待编码图像块相减的结果。

在一实施例中，所述M种预测模块为帧内预测对应的所有预测模式或者部分预测模式。

在一实施例中，所述M种预测模式包括帧内预测的亮度分量预测模式和/或色度分量预测模式。

在一实施例中，所述编码代价包括以下至少一种：所述残差块的率失真优化、绝对误差、变换后的绝对误差和、平均平方误差(MSE)、差值的平方和、平均绝对差值或者编码比特数平方和或者绝对值和。

在一实施例中，所述处理器具体用于：将所述目标预测模式对应的残差块划分为至少两个子残差块，并分别获取所述至少两个子残差块的DC系数；将所述当前待编码块划分为与所述至少两个子残差块一一对应的至少两个待编码子块；以及，将所述目标预测模式对应的预测图像块划分为与所述至少两个子残差块一一对应的至少两个子预测图像块；对于每一个待编码子块，根据相应的子预测图像块和相应的子残差块的DC系数生成所述待编码子块的参考像素；根据所有待编码子块的参考像素获得所述当前待编码图像块的参考像素。

在一实施例中，所述当前待编码图像块为被划分为L×L个图像块的图像中的其中一个，L为自然数。

本申请实施例所提供的一种视频编码方法、装置及计算机可读存储介质，能够快速生成所述当前待编码图像块的参考像素供下一个待编码图像块使用，使得下一个待编码图像块无需等待相邻图像块的重建像素的生成，从而保证各流水级的并行处理过程，有利于提高编码效率；而且，相对于使用相邻图像块的原始像素进行预测，使用相邻图像块的参考像素来进行预测，获取的预测结果更为准确。

对于装置实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本申请实施例所提供的方法和装置进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

一种视频编码方法，其特征在于，包括：

根据帧内预测的M种预测模式，利用当前待编码图像块的相邻图像块的参考像素生成所述当前待编码图像块在所述M种预测模块下分别对应的M个预测图像块；M为自然数；

基于所述当前待编码图像块分别与所述M个预测图像块的差异，获取M个残差块；

根据所述M个残差块分别获取所述M种预测模块对应的编码代价，并从所述M种预测模式中确定所述编码代价最小的目标预测模式；

获取所述目标预测模式对应的残差块的部分频率系数；

根据所述目标预测模式对应的预测图像块和所述部分频率系数生成所述当前待编码图像块的参考像素，供下一个待编码图像块使用。
根据权利要求1所述的方法，其特征在于，所述获取所述目标预测模式对应的残差块的部分频率系数，仅包括：

在时域上获取所述目标预测模式对应的残差块的DC系数。
根据权利要求1所述的方法，其特征在于，所述获取所述目标预测模式对应的残差块的部分频率系数，仅包括：

在时域上，统计所述目标预测模式对应的残差块中所有残差值之和、以及残差值个数，并通过两者的比值获取DC系数。
根据权利要求2或3所述的方法，其特征在于，所述根据所述目标预测模式对应的预测图像块和所述部分频率系数生成所述当前待编码图像块的参考像素，包括：

将获取到的DC系数直接用于生成所述当前待编码图像块的参考像素；或者

将获取到的DC系数进行量化和反量化处理，并且将已量化和反量化的DC系数生成所述当前待编码图像块的参考像素。
根据权利要求4所述的方法，其特征在于，所述根据所述目标预测模式对应的预测图像块和所述部分频率系数生成所述当前待编码图像块的参考像素，包括：

根据所述目标预测模式对应的预测块和所述获取到的DC系数，生成所述当前待编码图像块的参考像素；或者

根据所述目标预测模式对应的预测块和所述已量化和反量化的DC系数，生成所述当前待编码图像块的参考像素。
根据权利要求5所述的方法，其特征在于，所述根据所述目标预测模式对应的预测块和所述DC系数，生成所述当前待编码图像块的参考像素，包括：

仅将所述目标预测模式对应的预测块上的各像素的像素值分别加上所述DC系数的系数值，得到多个估计的重建像素的多个重建像素值；以及

将所述多个估计的重建像素，作为所述当前待编码图像块的参考像素。
根据权利要求1所述的方法，其特征在于，所述部分频率系数包括DC系数，或者所述部分频率系数包括DC系数和部分AC系数。
根据权利要求1所述的方法，其特征在于，在所述根据所述目标预测模式对应的预测块和所述部分频率系数生成所述当前待编码图像块的参考块像素之前，还包括：

将所述部分频率系数进行量化处理以及反量化处理，得到处理后的频率系数；

所述根据所述目标预测模式对应的预测块和所述部分系数生成所述当前待编码图像块的参考像素，包括：

根据所述目标预测模式对应的预测块和处理后的频率系数生成所述当前待编码图像块的参考像素。
根据权利要求1所述的方法，其特征在于，所述M个残差块分别为所述M个预测图像块分别和所述当前待编码图像块相减的结果。
根据权利要求1所述的方法，其特征在于，所述M种预测模块为帧内预测对应的所有预测模式或者部分预测模式。
根据权利要求1所述的方法，其特征在于，所述M种预测模式包括帧内预测的亮度分量预测模式和/或色度分量预测模式。
根据权利要求1所述的方法，其特征在于，所述编码代价包括以下至少一种：率失真优化、绝对误差、变换后的绝对误差和、平均平方误差(MSE)、差值的平方和、平均绝对差值或者编码比特数。
根据权利要求1所述的方法，其特征在于，所述获取所述目标预测模式对应的残差块的部分频率系数，包括：

将所述目标预测模式对应的残差块划分为至少两个子残差块，并分别获取所述至少两个子残差块的DC系数；

所述根据所述目标预测模式对应的预测图像块和所述部分频率系数生成所述当前待编码图像块的参考像素，包括：

将所述当前待编码块划分为与所述至少两个子残差块一一对应的至少两个待编码子块；以及，将所述目标预测模式对应的预测图像块划分为与所述至少两个子残差块一一对应的至少两个子预测图像块；

对于每一个待编码子块，根据相应的子预测图像块和相应的子残差块的DC系数生成所述待编码子块的参考像素；

根据所有待编码子块的参考像素获得所述当前待编码图像块的参考像素。
根据权利要求1所述的方法，其特征在于，所述当前待编码图像块为被划分为L×L个图像块的图像中的其中一个，L为自然数。
根据权利要求1所述的方法，其特征在于，所述方法应用于包括多个流水级的芯片上；且所述方法在其中一个流水级中执行。
一种视频编码装置，其特征在于，包括一个或多个处理器，单独的或共同的工作，所述处理器包括多个流水级；以及用于存储可执行指令的存储器；

所述处理器在执行所述可执行指令时，在其中一个流水级中执行以下步骤：

根据帧内预测的M种预测模式，利用当前待编码图像块的相邻图像块的参考像素生成所述当前待编码图像块在所述M种预测模块下分别对应的M个预测图像块；M为自然数；

基于所述当前待编码图像块分别与所述M个预测图像块的差异，获取M个残差块；

根据所述M个残差块分别获取所述M种预测模块对应的编码代价，并从所述M种预测模式中确定所述编码代价最小的目标预测模式；

获取所述目标预测模式对应的残差块的部分频率系数；

根据所述目标预测模式对应的预测图像块和所述部分频率系数生成所述当前待编码图像块的参考像素，供下一个待编码图像块使用。
根据权利要求16所述的装置，其特征在于，所述处理器具体用于：在时域上获取所述目标预测模式对应的残差块的DC系数。
根据权利要求16所述的装置，其特征在于，所述处理器具体用于：在时域上，统计所述目标预测模式对应的残差块中所有残差值之和、以及残差值个数，并通过两者的比值获取DC系数。
根据权利要求17或18所述的装置，其特征在于，所述处理器具体用于：

将获取到的DC系数直接用于生成所述当前待编码图像块的参考像素；或者

将获取到的DC系数进行量化和反量化处理，并且将已量化和反量化的DC系数生成所述当前待编码图像块的参考像素。
根据权利要求19所述的装置，其特征在于，所述处理器具体用于：根据所述目标预测模式对应的预测块和所述获取到的DC系数，生成所述当前待编码图像块的参考像素；或者

根据所述目标预测模式对应的预测块和所述已量化和反量化的DC系数，生成所述当前待编码图像块的参考像素。
根据权利要求19所述的装置，其特征在于，所述处理器具体用于：

仅将所述目标预测模式对应的预测块上的各像素的像素值分别加上所述DC系数的系数值，得到多个估计的重建像素的多个重建像素值；以及

将所述多个估计的重建像素，作为所述当前待编码图像块的参考像素。
根据权利要求16所述的装置，其特征在于，所述部分频率系数包括DC系数，或者所述部分频率系数包括DC系数和部分AC系数。
根据权利要求16所述的装置，其特征在于，所述处理器还用于：将所述部分频率系数进行量化处理以及反量化处理，得到处理后的频率系数；根据所述目标预测模式对应的预测块和处理后的频率系数生成所述当前待编码图像块的参考像素。
根据权利要求16所述的装置，其特征在于，所述M个残差块分别为所述M个预测图像块分别和所述当前待编码图像块相减的结果。
根据权利要求16所述的装置，其特征在于，所述M种预测模块为帧内预测对应的所有预测模式或者部分预测模式。
根据权利要求16所述的装置，其特征在于，所述M种预测模式包括帧内预测的亮度分量预测模式和/或色度分量预测模式。
根据权利要求16所述的装置，其特征在于，所述编码代价包括以下至少一种：所述残差块的率失真优化、绝对误差、变换后的绝对误差和、平均平方误差(MSE)、差值的平方和、平均绝对差值或者编码比特数。
根据权利要求16所述的装置，其特征在于，所述处理器具体用于：

将所述目标预测模式对应的残差块划分为至少两个子残差块，并分别获取所述至少两个子残差块的DC系数；

将所述当前待编码块划分为与所述至少两个子残差块一一对应的至少两个待编码子块；以及，将所述目标预测模式对应的预测图像块划分为与所述至少两个子残差块一一对应的至少两个子预测图像块；

对于每一个待编码子块，根据相应的子预测图像块和相应的子残差块的DC系数生成所述待编码子块的参考像素；

根据所有待编码子块的参考像素获得所述当前待编码图像块的参考像素。
根据权利要求16所述的装置，其特征在于，所述当前待编码图像块为被划分为L×L个图像块的图像中的其中一个，L为自然数。
一种计算机可读存储介质，其特征在于，其上存储有计算机指令，该指令被处理器执行时实现权利要求1至15任意一项所述的方法。