WO2020019316A1

WO2020019316A1 - 帧内预测模式搜索方法及装置、视频编码方法及装置以及记录介质

Info

Publication number: WO2020019316A1
Application number: PCT/CN2018/097528
Authority: WO
Inventors: 缪泽翔; 郑萧桢; 李蔚然
Original assignee: 深圳市大疆创新科技有限公司
Priority date: 2018-07-27
Filing date: 2018-07-27
Publication date: 2020-01-30
Also published as: CN110419214A

Abstract

一种帧内预测模式搜索方法，包括：第1步骤，基于X个对象预测模式，利用当前编码块周边的相邻块的原始像素生成当前编码块在X个对象预测模式下的X个第1预测信号，并求出X个第1预测信号与编码块的原始像值的残差作为X个第1残差；第2步骤，根据第1残差通过第1代价计算方法计算出X个对象预测模式的第1代价，将对象预测模式中第1代价最小一侧的Y个对象预测模式作为中间预测模式；第3步骤，基于中间预测模式，利用相邻块的重建像素生成当前编码块在中间预测模式下的第2预测信号，并求出第2预测信号与当前编码块的原始像值的残差作为第2残差；和，第4步骤，根据第2残差通过第2代价计算方法计算出中间预测模式的第2代价，将中间预测模式中第2代价最小的预测模式作为搜索出的最终预测模式，其中，Y是小于X的自然数。

Description

帧内预测模式搜索方法及装置、视频编码方法及装置以及记录介质

技术领域

本发明实施例涉及视频编码领域，尤其涉及一种帧内预测模式搜索方法及装置、视频编码方法及装置以及记录介质。

背景技术

视觉信息是人类获取外界信息的最重要来源之一，但是摄像头采集所得未经压缩的原始视频数据占用的存储空间非常巨大，以分辨率为1920×1080、视频格式为yuv420(8bit)、帧率为30帧每秒、时长10分钟的视频为例，在无压缩的情况下存储该视频需要占用52.14G字节的存储空间。为了减少视频存储和传输所占用的带宽，需要对视频数据进行编码压缩处理。

然而在现有技术的编码压缩处理中，进行计算时每个尺寸的编码块均依赖于其左侧及上方的相邻像素重建值用于产生预测值，因此在计算每个编码块(除位于图像边界处的编码块外)的预测值时都必须等待其左侧及上方的编码块先编码完成后才能进行，因此存在很强的依赖性可能会导致编码延迟。

特别是在通过芯片进行编码压缩处理时，这一延迟导致的问题更加显著。具体来说，芯片实现算法时通常将算法步骤分成若干个流水级，每个流水级并行处理不同的数据，该做法可以提升处理速度和提高资源利用率。

然而，由于高效率视频编码标准的帧内预测算法进行计算每个尺寸编码块的预测模式时，如上所述，均依赖于其左侧及上方的相邻像素重建值用于产生预测值，计算每个编码块(除位于图像边界处的编码块外)的预测值前都必须等待其左侧及上方的编码块先编码完成。由于编码块对相邻编码块的重建像素存在很强的依赖性，芯片实现该算法时无法在帧内预测算法内部实现并行化，导致最终实现的芯片处理速度及效率不足。

发明内容

本发明正是针对上述问题提出的，提供一种视频编码方法、视频编码装置以及记录介质，有效降低预测值计算资源和时间开销并降低对相邻编码块的数据依赖性。由其是在以芯片进行编码的情况下，能够取得更为突出的技术效果。

本发明的第一方面的帧内预测模式搜索方法，包括：

第1步骤，基于X个对象预测模式，利用当前编码块周边的相邻块的原始像素生成所述当前编码块在所述X个对象预测模式下的X个第1预测信号，并求出所述X个第1预测信号与所述编码块的原始像值的残差作为X个第1残差；

第2步骤，根据所述第1残差通过第1代价计算方法计算出所述X个对象预测模式的第1代价，将所述对象预测模式中所述第1代价最小一侧的Y个对象预测模式作为中间预测模式；

第3步骤，基于所述中间预测模式，利用所述相邻块的重建像素生成所述当前编码块在所述中间预测模式下的第2预测信号，并求出所述第2预测信号与所述当前编码块的原始像值的残差作为第2残差；和，

第4步骤，根据所述第2残差通过第2代价计算方法计算出所述中间预测模式的第2代价，将所述中间预测模式中所述第2代价最小的预测模式作为搜索出的最终预测模式，

其中，Y是小于X的自然数。

本发明的第二方面的视频编码方法，包括：

使用上述的帧内预测模式搜索方法搜索出的最终预测模式对视频进行编码。

本发明的第三方面的帧内预测模式搜索装置，用于执行上述的帧内预测模式搜索的方法，其中，

包括：N-2流水级、N-1流水级和N流水级，

所述第1步骤和所述第2步骤由所述N-2流水级执行，

所述第3步骤由所述N-1流水级执行，

所述第4步骤由所述N流水级执行。

本发明的第四方面的帧内预测模式搜索装置，包括：存储器和处理器，其中，

所述存储器用于存储程序指令；

所述处理器，调用所述程序指令，当程序指令被执行时，用于执行以下操作：

第2步骤，根据所述第1残差通过第1代价计算方法计算出所述X个对象预测模式的第1代价，将所述对象预测模式中所述第1代价最小一例的Y个对象预测模式作为中间预测模式；

第3步骤，基于所述中间预测模式，利用所述相邻块的重建像素生成所述当前编码块在所述中间预测模式下的第2预测信号，并求出所述第2预测信号与所述当前编码块的原始像值的残差作为第2残差；和

其中，Y是小于X的自然数。

本发明的第五方面的视频编码装置，包括上述的帧内预测模式搜索装置。

本发明的第六方面的记录介质，存储有使计算机执行如上所述的帧内预测模式搜索方法的程序。

本发明的第七方面的记录介质，存储有使计算机执行如上所述的视频编码方法的程序。

根据本发明的一个实施例的方案，通过预分析当前编码块的纹理梯度信息减少时需要搜索的帧内预测模式数目降低预测值计算资源和时间开销，并结合使用相邻块的原始像素信息及重建像素信息降低对相邻编码块的依赖性。

例如，在包含35个预测模式的情况下，对每个编码块至少需进行35 次预测值计算下降至只需对每个编码块进行16次预测值计算，且通过在第一阶段使用相邻像素的原始像素值进行预测值计算，消除了依赖性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图进行简单介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1表示目前流行的混合编码框架结构。

图2表示帧内预测模式对应35个预测模式。

图3是表示64x64的编码块的划分的一例的示意图。

图4是表示本发明的帧内预测模式搜索方法的实施方式的流程图。

图5是对本发明的帧内预测模式搜索方法的具体例进行说明的框架流程图。

图6是对本发明的帧内预测模式搜索方法的具体例进行详细说明的的流程图。

图7是表示本发明的帧内预测模式搜索装置70的结构框图。

图8是用于说明由帧内预测模式搜索装置70进行的流水级处理的编码块示例的图

图9是用于基于图5所示的框架流程图说明由帧内预测模式搜索装置70进行的流水级处理的一例的时序图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，当组件被称为“固定于”另一个组件，它可以直接在另一个组件上或者也可以存在居中的组件。当一个组件被认为是“连接”另一个组件，它可以是直接连接到另一个组件或者可能同时存在居中组件。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。

以下，对视频编码进行简要说明。一般来说，视频编码过程包括预测、变换、量化和熵编码等步骤，图1表示目前流行的混合编码框架结构。其中预测包括帧内预测和帧间预测两种类型，其目的在于利用预测块信息去除当前待编码图像块的冗余信息。

帧内预测利用本帧图像的信息获得预测块数据，其过程包括将待编码图像块划分成若干个子图像块；然后，针对每个子图像块，利用图像块周边的邻近像素生成当前图像块的预测像素块。

帧间预测利用参考帧的信息获得预测块数据，其过程包括将待编码图像块划分成若干个子图像块；然后，针对每个子图像块，在参考图像中搜索与当前子图像块最匹配的图像块作为预测块。

在编码中仅使用帧内预测模式的图像帧被称为I帧，同时使用帧内预测及帧间预测的图像帧被称为P或B帧。使用帧内预测或帧间预测获得预测像素块后，将该子图像块与预测块的相应像素值相减得到残差。

残差可以使用变换矩阵去除图像块的残差的相关性，即去除图像块的冗余信息，以便提高编码效率，图像块中的数据块的变换通常采用二维变换，即在编码端将数据块的残差信息分别与一个NxN的变换矩阵及其转置矩阵相乘，相乘之后得到的是变换系数。变换系数经量化参数量化后可得到量化系数，最后将量化后的系数进行熵编码，最后将熵编码得到的比特流及进行编码后的编码模式信息，如帧内预测模式、运动矢量信息等，进行存储或发送到解码端。

在图像的解码端，首先获得熵编码比特流后进行熵解码，得到相应的残差，根据解码得到的运动矢量或帧内预测等信息图像块对应的预测图像块，根据预测图像块与图像块的残差得到当前子图像块中各像素点的重建值。

图2表示帧内预测模式对应的35个预测模式：包括33个方向模式及 DC和Planar模式。在每个图像块进行帧内预测时，分别利用块周围的相邻像素信息按照35个预测模式对应的计算公式算出35个候选的预测像素块，之后再根据最优化原则从35个预测模式中选出最优的预测模式。

作为视频编码的一例，基本编码单位是尺寸为64x64的编码块，帧内预测编码模式下进一步可能划分为1个64x64的编码块或4个32x32的编码块，或者16个16x16的编码块，或者64个8x8的编码块，或者256个4x4的编码块或者若干不同尺寸的块相结合。

图3是表示64x64的编码块的划分的一例的示意图。左侧尺寸为64x64的编码单元在编码后最终划分为1个32x32的编码块、10个16x16的编码块、7个8x8的编码块及4个4x4的编码块。为了得到最优的划分结构，在实际编码时需要首先对所有1+4+16+64+256＝341个可能的预测块生成预测像素块的结果，再依次决定最优的结构。由于每个可能的预测块都对应有35种可能的预测模式，因此在编码一个64x64的编码块时需要计算35x341＝11935次预测，该种方式对硬件资源及时间的消耗非常巨大。

作为本发明的一个实施方式，提出了一种帧内预测模式搜索方法，特别适于由芯片进行编码压缩处理。其中，包括：

流水级N-2：

基于X个对象预测模式，利用当前编码块周边的相邻块的原始像素生成所述当前编码块在所述X个对象预测模式下的X个第1预测信号，并求出所述X个第1预测信号与所述编码块的原始像值的残差作为X个对象预测模式第1残差；

根据所述第1残差通过第1代价计算方法计算出所述X个对象预测模式的第1代价，将所述对象预测模式中所述第1代价最小一例的Y个作为中间预测模式；

流水级N-1：

进一步对所述Y个中间预测模式与所述当前编码块的至少一个相邻块的最终预测模式进行综合处理来将所述中间预测模式调整为Z个，

基于所述中间预测模式，利用所述相邻块的重建像素生成所述当前编码块在所述中间预测模式下的第2预测信号，并求出所述第2预测信号与所述当前编码块的原始像值的残差作为第2残差；

流水级N：根据所述第2残差通过第2代价计算方法计算出所述中间预测模式的第2代价，将所述中间预测模式中所述第2代价最小的预测模式作为搜索出的最终预测模式。

其中，X，Y，Z是自然数，满足X＞Y且X＞Z。另外，优选Y≥Z，但并不限定于此。

下面结合附图，对本发明的一些实施方式作详细说明。在不冲突的情况下，下述的实施例及实施例中的特征可以相互组合。

【步骤S401】

基于X个对象预测模式，利用当前编码块周边的相邻块的原始像素生成所述当前编码块在所述X个对象预测模式下的X个第1预测信号，并求出所述X个第1预测信号与所述编码块的原始像值的残差作为X个第1残差。

对象预测模式，是指作为本发明的帧内预测模式搜索方法的搜索对象的预测模式。例如，如图2所示，X为35个预测模式，其中包括33个方向模式及DC和Planar模式。但并不限定于此，可以根据所应用的编码标准等适宜决定。

可选的，也可以不将编码标准中的全部预测模式作为对象预测模式，例如可以将帧内预测的全部预测模式(例如35个预测模式)分为至少2组，选择其中1组作为所述对象预测模式。

作为分组的依据，可以根据所述对象预测模式的对象预测模式的属性、例如方向或种类等的至少一个进行所述分组。每个所述分组中的预测模式的数量可以相同，也可以不同。各个分组中的预测模式可以包含其他分组中的预测模式，也可以不包含。以图2所示的35个预测模式为例，可以将全部的33个方向模式按照序号相邻的方式分成2、3、4、5、6、7等多个组。以分为3个组为例，具体如下：

第1组：2、3、4、5、6、7、8、9、10、11、12

第2组：13、14、15、16、17、18、19、20、21、22、23

第3组：24、25、26、27、28、29、30、31、32、33、34

另外，也可以按照各个组中的方向模式序号不连续的方式进行分组。以分为3个组为例，具体如下：

第1组：2、5、8、11、14、17、20、23、26、29、32

第2组：3、6、9、12、15、18、21、24、27、30、33

第3组：4、7、10、13、16、19、22、25、28、31、34

在所述预测模式包括方向模式、DC模式(模式1)和Planar模式(模式0)的情况下，可以进一步让每个分组都包括所述DC模式和/或Planar模式。

可选的，作为选择分组的依据，可以随机进行选择、或者根据当前编码块的各种特征指标来进行选择。例如，根据所述当前编码块在各个预测方向上的方向性指标来选择其中1组作为所述对象预测模式。

可选的，方向性指标是所述当前编码块在各个预测方向上的梯度信息(Gradient Information)。

可选的，将所述当前编码块分成多个区域，根据分组中的预测方向确定所述多个区域在所述预测方向上的梯度信息，选择梯度信息为最小值的1组预测模式作为所述对象预测模式。作为划分编码块的具体方式，例如可以将编码块以四宫格、九宫格等的方式从左至右、从右至左或从上至下、从下至上依次进行划分，也可以按照尽可能填满整个区域的方式随机划分区域。划分的各个区域可以彼此相邻、彼此相隔或者彼此重叠。

可选的，生成预测模式下的预测信号(第1预测信号)以及求出预测信号与原始像素的残差等，可以通过现有的或者各种视频编码标准中规定的算法进行。

可选的，所述编码块包含NxN个像素块，N是自然数，所述利用当前编码块周边的相邻块的原始像素生成所述当前编码块在所述X个对象预测模式下的第1预测信号，包括：由所述编码块的周围的像素块的参考像素生成当前编码块的预测信号。这里，所述编码块的周围的像素块，可以是与编码块中的各个像素块相邻的像素块，也可以是小于规定距离的像素块，可以根据需要进行设定。

【步骤S402】

根据所述第1残差通过第1代价计算方法计算出所述X个对象预测模式的第1代价，将所述对象预测模式中所述第1代价最小一例的Y个对象预测模式作为中间预测模式。其中，X，Y是自然数，满足X＞Y。

这里，作为第1代价计算方法，可以使用现有的任何能够计算预测模式的代价的方法，可以通过现有的或者各种视频编码标准中规定的算法进行。作为一例，可以将残差的平方和或绝对值和作为预测模式的代价。作为另外一例，根据对残差进行二维矩阵变换得到的变换系数和预测模式的比特数来计算预测模式的代价。作为二维矩阵变换的一例，可以是离散正弦/余弦变换，或者是哈达玛变换。

可选的，根据上述第1代价计算方法计算出的第1代价，从X个对象预测模式中选择Y个作为中间预测模式，其中Y可以为任何小于X的自然数。例如在X为35的情况下，可取2、3、4、5、6、10、15、20、25、30等。这里Y的取值可以是预先设定的数值，也可以是根据精度和/或效率等因素得到的数值，还可以是根据硬件条件等得到的数值。

【步骤S403】

基于所述中间预测模式，利用所述相邻块的重建像素生成所述当前编码块在所述中间预测模式下的第2预测信号，并求出所述第2预测信号与所述当前编码块的原始像值的残差作为第2残差。

这里，与第1预测信号的生成同样，对于生成某个预测模式下的预测信号(第2预测信号)以及求出预测信号与原始像素的残差等，可以通过现有的或者各种视频编码标准中规定的算法进行。

另外，虽然在上述的说明中，描述的是在第1预测信号的生成时使用相邻块的原始像素，在第2预测信号的生成时使用相邻块的重建像素，但这里的原始像素和重建像素，也包括通过填充而得到的像素。例如在生成所述第1预测信号和/或所述第2预测信号时，可以对相邻块中的至少一部分像素块进行填充(Padding)，将填充得到的像素作为所述原始像素和所述重建像素而用于生成所述第1预测信号和/或所述第2预测信号。作为填充的方式，可以使用复制相邻像素值、插值、***0值等各种方法。

作为一个具体例，进行所述填充的像素块，是在生成所述第2预测信号时无法获得重建像素的位置上的像素块。例如，对靠近视频图像边角位置而不实际并不存在的相邻块、或者因编码块的编码顺序等的原因在生成所述第2预测信号时尚未进行过编码而不存在重建像素的相邻块等。

【步骤S404】

根据所述第2残差通过第2代价计算方法计算出所述中间预测模式的第2代价，将所述中间预测模式中所述第2代价最小的预测模式作为搜索出的最终预测模式。

这里，作为第2代价计算方法，也可以使用现有的任何能够计算预测模式的代价的方法，可以通过现有的或者各种视频编码标准中规定的算法进行。作为一例，可以将残差的平方和或绝对值和作为预测模式的代价。作为另外一例，根据对残差进行二维矩阵变换得到的变换系数和预测模式的比特数来计算预测模式的代价。所述第2代价计算方法可以与所述第1代价计算方法相同或者不同。

再有，在上述的步骤S403中，可以进一步对中间预测模式进行调整。具体来说，可以对在将所述对象预测模式中所述第1代价最小一侧的Y个作为中间预测模式后，进一步对所述Y个中间预测模式与所述当前编码块的至少一个相邻块的最终预测模式进行综合处理来将所述中间预测模式调整为Z个，其中Z为自然数，满足X大于Z。优选所述Z个中间预测模式为5个中间预测模式。

这里的最终预测模式，可以是至少一个相邻块在帧间编码时使用的预测模式，具体可以是：通过本发明的帧内预测模式搜索方法搜索出的最终预测模式，也可以是例如通过各种视频编码标准中规定的标准算法得到的最终预测模式。

可选的，所述相邻块是临近所述当前编码块的编码块中的像素块，可以是与所述当前编码块相接的编码块中的像素块，也可以是不与所述当前编码块相接而位于其附近的编码块中的像素块。

可选的，所述综合处理中，可以将所述Y个中间预测模式中的至少一个预测模式与至少一个所述相邻块的最终预测模式一起作为所述中间预测模式。

可选的，优选舍弃所述Y个中间预测模式中、与所述相邻块的最终预测模式不同的至少一部分，而保留全部的所述相邻块的最终预测模式。作为一个方式，舍弃的所述Y个中间预测模式，是第1代价大的那些。换言之，保留的中间预测模式，是与所述相邻块的预测模式不同且所述第1代价最小的一个或多个预测模式。

所述综合处理中使用所述当前编码块的左侧、上侧以及左上侧这3个方向的所述相邻块中的至少一个的最终预测模式。

为了使得本发明的帧内预测模式搜索方法能够更好理解，以下使用图5，以使用本发明的具体例为例进行详细说明。

本具体例的整体技术框架如图5所示，分为大的3个阶段：

【S501】帧内模式预估(Intra mode estimate)

在该阶段，使用当前编码块的原始像素值从总共35个预测模式中筛选出11个预测模式，再通过当前编码块周围的相邻块的原始像素值产生预测值，并进一步通过对11个预测模式对应的预测残差分别进行哈达玛变换来筛选出代价最小的5个预测模式。

【S502】预测改进(Prediction refine)

在该阶段，将由邻近信息推导出的3个预测模式(Most Probable Modes)与S501中筛选得到的5个预测模式结合选出5个预测模式，并用周围的相邻块的重建像素值重新生成预测像素值。

【S503】最终模式选出(Final mode selection)

在该阶段，对在S502重新选出的5个预测模式对应的预测残差分别进行哈达玛变换进行筛选，得到代价最小的最终的预测模式。

S501帧内模式预估(Intra mode estimate)

本具体例的帧内模式预估阶段中，包括初步模式确定(Rough Mode Decision)S5011、第1预测(Predict1)S5012、第1哈达玛模式确定(Had Mode Decision1)S5013的阶段，以下对各个阶段进行具体说明。

S5011：初步模式确定

该阶段通过提取当前编码块原始像素值的梯度信息，从35个帧内预测模式(包括33个方向模式及DC和Planar模式)中筛选出11个预测模式。由于该阶段内不进行真正的预测值生成，故不会增加计算资源消耗。

首先将图2所示的35个帧内预测模式，针对预测方向中的0°、45°、90°及135°，将所述全部预测模式分为0°、45°、90°及135°所对应的4组，根据所述当前编码块在各个预测方向上的方向性指标来选择其中1组作为所述对象预测模式。

具体来说，按照预测方向分为0°、45°、90°及135°共4组，每组各11个模式，每组都包含模式0(DC模式)和模式1(Planar模式)，如式(3-1)～(3-4)所示。

0°＝{0，1，6，7，8，9，10，11，12，13，14} (3-1)

45°＝{0，1，2，3，4，5，30，31，32，33，34} (3-2)

90°＝{0，1，22，23，24，25，26，27，28，29，30} (3-3)

135°＝{0，1，14，15，16，17，18，19，20，21，22} (3-4)

上述的方向性指标，例如是所述当前编码块在各个预测方向上的梯度信息(Gradient Information)。作为一例，可以将所述当前编码块分成多个区域，根据分组中的预测方向确定所述多个区域在所述预测方向上的梯度信息，选择梯度信息为最小值的1组预测模式作为所述对象预测模式。

例如，首先对当前编码块划分子块。图6是表示本具体例中的子块的划分方式的一例的示意图。如图6所示，按照左上、右上、左下、右下、中心的顺序，将所述当前编码块分成5个大小相等的子块a、b、c、d、e。从当前编码块取出5个子块。接着，分别计算出子块a、b、c、d、e的均值。再用均值按式(3-5)～(3-8)求出对应方向组的梯度信息，选择对应GI1～GI4中值最小的一个模式集合中的11个预测模式(Index值)作为输出。

GI1＝|b-a|+|d-c|----0° (3-5)

GI2＝|c-e|+|e-b|----45° (3-6)

GI3＝|c-a|+|d-b|----90° (3-7)

GI4＝|d-e|+|e-a|----135° (3-8)

另外，虽然在本具体例中包含了初步模式确定阶段S5011，但并不限定于此，也可将其省略，直接将35个预测模式作为输入进入后述的第1预测S5012阶段。

S5012：第1预测(Predict1)

该阶段的作用是利用周边相邻块的原始像素生成11组(对应初步模式确定阶段输出的11个预测模式)当前编码块的预测信号。按照现有的视频编码标准，该环节的做法应当是用周边相邻块的重建像素生成35组预测信号，这将导致该环节需要等待重建像素的生成从而造成延迟。根据本发明的方案，可大大提高计算并行度及降低计算复杂度。

以包含NxN个像素块的编码块为例，在预测时由周围4*N+1个相邻块的参考像素生成当前编码块的预测信号，这里，N是自然数。图7是表示在将编码块设为4x4即N为4的情况下，第1预测中使用的相邻块的分布位置的一例的示意图。在该例中，由所述编码块的左侧、左上侧和上侧的4*N+1即17个像素块的参考像素生成当前编码块的预测信号。

第1预测的阶段中，由周围17个相邻块的参考像素生成当前编码块的预测信号。

Prediction _i，j＝f _m(NeighbourPixels)i，j＝0...N-1，m＝0...34(3-9)

式(3-9)描述了一个由相邻块参考像素生成预测像素的过程，式中f _m，m＝0...34表示可选的35种预测模式对应的35个不同预测算法，由周边相邻块的参考像素生成当前编码块预测信号的算法为现有的视频编码标准中规定算法，在此不展开叙述。

在得到11个预测模式对应的预测像素值后将其分别与当前编码块的原始像素值作差从而得到残差，求得11个预测模式对应的预测残差作为后续的第1哈达玛模式确定阶段的输入。

S5013：第1哈达玛模式确定(Had Mode Decision1)

该阶段以第1预测阶段S5012输出的11组残差为输入，对11组残差分别进行哈达玛变换，将变换系数的绝对值和与表示11个预测模式的比特数结合计算出对应预测模式的代价。表1表示35个模式对应的比特数的一例。

【表1】

Index	Rate
模式0	1bit
模式1	2bit
模式26	3bit
其他模式	5bit

如式(3-10)所示，式中λ为加权系数为按照现有的视频编码方法中的指定算法计算。

cost _i＝Sum(|Hadamard(Resi _i)|)+λ*Rate (3-10)

在计算得到11个代价后，从11个代价中选择最小的5个对应的预测模式作为输出。

另外，本具体例中虽然以哈达玛变换为例进行了说明，但并不限定于此，也可以是其他二维矩阵变换。

S502预测改进(Prediction refine)

本具体例的预测改进阶段中，包括综合处理(Combine)S5021、第2预测(Predict2)S5022的阶段，以下对各个阶段进行具体说明。

S5021：综合处理

该阶段对从相邻编码块获得的预测模式和帧内模式预估阶段得到的5个预测模式进行综合处理，将从相邻编码块获得的预测模式与帧内模式预估阶段选出的5个模式比较与结合，进一步得出5个预测模式。

这里，从相邻编码块获得的预测模式，可以是通过本发明的方法选出的预测模式，或者是按照现有的视频编码方法中的标准算法从相邻编码块推导出的3个预测模式(Most Probable Mode(MPM))。

作为综合处理的一个可选例，可以从帧内模式预估阶段选出的5个模式和从相邻编码块获得的3个预测模式共计8个模式中再选出5个模式：首先保留3个从相邻编码块获得的预测模式，再从5个帧内模式预估阶段选出的预测模式中选择与3个从相邻编码块获得的预测模式不相同、且代价最小的2个模式，将共计5个预测模式作为综合处理阶段的输出。

另外，虽然在本具体例中包含了综合处理阶段S5021，但并不限定于此，也可将其省略，直接将S5013阶段输出的5个预测模式作为输入进入后述的第2预测S5022阶段。

S5022：第2预测

该阶段的输入为综合处理S5021输出的5个预测模式，利用周边相邻块的重建像素生成5组当前编码块的预测信号。由周边相邻块的重建像素(参考像素)生成当前编码块预测信号的算法为现有的视频编码方法中的规定算法，在此不展开叙述。

在得到5个预测模式对应的预测像素值后将其分别与当前编码块的原始像素值作差，求得5个预测模式对应的预测残差作为后续最终模式选出阶段的输入。

S503最终模式选出(Final mode selection)

本具体例的最终模式选出阶段中，包括第2哈达玛模式确定(Had Mode Decision2)S5031，以下对各该阶段进行具体说明。

第2哈达玛模式确定

该阶段以第2预测阶段S5022输出的5组残差为输入，对5组残差分别进行哈达玛变换，将变换系数的绝对值和与表示5个预测模式的比特数结合计算出对应预测模式的代价。这里的代价计算，采用与第1哈达玛模式确定阶段S5013中的代价计算相同的方式。另外，也并不限定于此，也可采用不同于第1哈达玛模式确定阶段S5013的其他代价计算方式。

在计算得到5个代价后，从5个代价中选择代价最小的1个对应的预测模式作为最终选择的1个预测模式。在进行视频编码时，将该残差输出进入后续的变换量化及熵编码RDO等阶段。

图7是表示本发明的帧内预测模式搜索装置70的结构框图。本发明的帧内预测模式搜索装置70，例如可以是芯片，包括：N-2流水级701、 N-1流水级702和N流水级703。在用这样的帧内预测模式搜索装置70实现例如图4所示的帧内预测模式搜索方法时，步骤401和步骤402由N-2流水级执行，步骤403由N-1流水级执行，步骤404由N流水级执行。

在帧内预测模式搜索装置70中，N-2流水级701、N-1流水级702和N流水级703并行工作，使得N流水级703对由N-1流水级702处理过的编码块的处理、N-1流水级702对由N流水级701处理过的编码块的处理、和N-2流水级701对当前编码块的处理并行进行。以下进行具体说明。

图8是用于说明由帧内预测模式搜索装置70进行的流水级处理的编码块示例的图。为了便于说明，这里举例与图3的64x64的编码块同样的编码块。其中，对左上的4个编码块分别标注了0、1、2、3。

在N-2流水级701，进行与上述S501中的帧内模式预估(Intra mode estimate)同样的处理。

即在N-2流水级701中，使用当前编码块的原始像素值从总共35个预测模式中筛选出11个预测模式，再通过当前编码块周围的相邻块的原始像素值产生预测值，并进一步通过对11个预测模式对应的预测残差分别进行哈达玛变换来筛选出代价最小的5个预测模式。

在N-1流水级702，进行与上述S502中的预测改进(Prediction refine)同样的处理。

即在N-1流水级702中，将由邻近信息推导出的3个预测模式(Most Probable Modes)与N-2流水级701中筛选得到的5个预测模式结合选出5个预测模式，并用周围的相邻块的重建像素值重新生成预测像素值。

在N流水级703，进行与上述S503中的最终模式选出(Final mode selection)同样的处理。

在该阶段，对在N-1流水级702重新选出的5个预测模式对应的预测残差分别进行哈达玛变换进行筛选，得到代价最小的最终的预测模式。

具体来说，在初始时刻t0，由N-2流水级701对编码块0进行处理 (帧内模式预估S501)，此时，N-1流水级702和N流水级703为空闲。

接着，在时刻t1，N-2流水级701对新的编码块1进行处理(帧内模式预估S501)，N-1流水级702对从N-2流水级701取得的由N-2流水级701处理过的编码块0进行处理(预测改进S502)，此时，N流水级703为空闲。

再接下来，在时刻t2，N-2流水级701对新的编码块2进行处理(帧内模式预估S501)，N-1流水级702对从N-2流水级701取得的由N-2流水级701处理过的编码块1进行处理(预测改进S502)，N-2流水级703对从N-1流水级702取得的由N-1流水级702处理过的编码块0进行处理(最终模式选出S503)。

此后，各个流水级并行进行上述的S501～S503的处理，直到对所有的编码块完成处理。

通过采取分阶段帧内预测模式搜索算法，将原始像素引入帧内预测模式从而对搜索阶段解除关键依赖性，进而实现将整个帧内预测算法划分为三个流水级以提升并行度，从而如图9所示，从时刻t2开始，各个N-2～N的流水级701～703开始并行地对编码块进行处理，因此能够提高芯片处理速度以及效率。

另外，由于N-2流水级702不涉及任何数据依赖，因此作为本发明一个可选的方案，可将其拆分出来，例如预先处理图8中所有可能的编码块，将得到的结果存储起来待N-1流水级701取用。

在本发明所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质或存储器中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。上述描述的装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

一种帧内预测模式搜索方法，包括：

第1步骤，基于X个对象预测模式，利用当前编码块周边的相邻块的原始像素生成所述当前编码块在所述X个对象预测模式下的X个第1预测信号，并求出所述X个第1预测信号与所述编码块的原始像值的残差作为X个第1残差；

第2步骤，根据所述第1残差通过第1代价计算方法计算出所述X个对象预测模式的第1代价，将所述对象预测模式中所述第1代价最小一侧的Y个对象预测模式作为中间预测模式；

第3步骤，基于所述中间预测模式，利用所述相邻块的重建像素生成所述当前编码块在所述中间预测模式下的第2预测信号，并求出所述第2预测信号与所述当前编码块的原始像值的残差作为第2残差；和，

第4步骤，根据所述第2残差通过第2代价计算方法计算出所述中间预测模式的第2代价，将所述中间预测模式中所述第2代价最小的预测模式作为搜索出的最终预测模式，

其中，Y是小于X的自然数。
根据权利要求1所述的帧内预测模式搜索方法，其中，

在所述第3步骤中，进一步对所述第2步骤得到的所述Y个中间预测模式与所述当前编码块的至少一个相邻块的最终预测模式进行综合处理来将所述中间预测模式调整为Z个，

其中，Z是小于X的自然数。
根据权利要求2所述的帧内预测模式搜索方法，其中，

在所述第3步骤中，所述综合处理中使用所述当前编码块的左侧、上侧以及左上侧这3个方向的所述相邻块中的至少一个的最终预测模式。
根据权利要求2所述的帧内预测模式搜索方法，其中，

在所述第3步骤中，所述综合处理中将所述Y个中间预测模式中的至少一个预测模式与所述相邻块的最终预测模式一起作为所述中间预测模式。
根据权利要求4所述的帧内预测模式搜索方法，其中，

所述Y个中间预测模式中的至少一个预测模式，是与所述相邻块的最终预测模式不同且所述第1代价最小一侧的预测模式。
根据权利要求1所述的帧内预测模式搜索方法，其中，

所述X个对象预测模式为35个对象预测模式，所述Y个中间预测模式为5个中间预测模式。
根据权利要求2所述的帧内预测模式搜索方法，其中，

所述Z个中间预测模式为5个中间预测模式。
根据权利要求1所述的帧内预测模式搜索方法，其中，

在所述第1步骤中，将帧内预测的全部预测模式分为至少2组，选择其中1组作为所述对象预测模式。
根据权利要求8所述的帧内预测模式搜索方法，其中，

在所述第1步骤中，根据所述对象预测模式的方向或种类的至少一个进行所述分组。
根据权利要求9所述的帧内预测模式搜索方法，其中，

每个所述分组中的预测模式的数量相同。
根据权利要求8所述的帧内预测模式搜索方法，其中，

所述预测模式包括方向模式、DC模式和Planar模式，

每个分组都包括所述DC模式和/或Planar模式。
根据权利要求8所述的帧内预测模式搜索方法，其中，

在所述第1步骤中，随机或者根据当前编码块的特征指标来进行选择1组预测模式作为所述对象预测模式。
根据权利要求8所述的帧内预测模式搜索方法，其中，

在所述第1步骤中，针对预测方向中的0°、45°、90°及135°，将所述全部预测模式分为0°、45°、90°及135°所对应的4组，

根据所述当前编码块在各个预测方向上的方向性指标来选择其中1组作为所述对象预测模式。
根据权利要求13所述的帧内预测模式搜索方法，其中，

所述方向性指标是所述当前编码块在各个预测方向上的梯度信息。
根据权利要求14所述的帧内预测模式搜索方法，其中，

在所述第1步骤中，将所述当前编码块分成多个区域，根据分组中的预测方向确定所述多个区域在所述预测方向上的梯度信息，选择梯度信息为最小值的1组预测模式作为所述对象预测模式。
根据权利要求13所述的帧内预测模式搜索方法，其中，

在所述第1步骤中，将所述当前编码块按照左上、右上、左下、右下、中心的顺序，分成大小相等的5个子块a、b、c、d、e，分别计算出子块a、b、c、d、e的均值，再用均值按下式求出在0°、45°、90°及135°的梯度信息，

0°：GI1＝|b-a|+|d-c|

45°：GI2＝|c-e|+|e-b|

90°：GI3＝|c-a|+|d-b|

135°：GI4＝|d-e|+|e-a|

选择GI1～GI4中最小值对应的预测方向的1组预测模式作为所述对象预测模式。
根据权利要求1所述的帧内预测模式搜索方法，其中，

所述相邻块是临近所述当前编码块的编码块中的像素块。
根据权利要求1所述的帧内预测模式搜索方法，其中，

所述原始像素和所述重建像素，包括通过进行填充而得到的像素。
根据权利要求18所述的帧内预测模式搜索方法，其中，

进行所述填充的像素块，是在生成所述第2预测信号时无法获得重建像素的位置上的像素块。
根据权利要求1所述的帧内预测模式搜索方法，其中，

所述编码块包含NxN个像素块，N是自然数，

所述利用所述当前编码块周边的相邻块的原始像素生成所述当前编码块在所述X个对象预测模式下的第1预测信号，包括：由所述编码块的左侧、左上侧和上侧的4*N+1个像素块的参考像素生成当前编码块的预测信号。
根据权利要求1所述的帧内预测模式搜索方法，其中，

所述第1代价计算方法和/或所述第2代价计算方法中，将残差的平方和或绝对值和作为预测模式的代价。
根据权利要求1所述的帧内预测模式搜索方法，其中，

所述第1代价计算方法和/或所述第2代价计算方法中，根据对残差进行二维矩阵变换得到的变换系数和预测模式的比特数来计算预测模式的代价。
根据权利要求21所述的帧内预测模式搜索方法，其中，

所述二维矩阵变换是离散正弦/余弦变换。
根据权利要求21所述的帧内预测模式搜索方法，其中，

所述二维矩阵变换是哈达玛变换。
根据权利要求1所述的帧内预测模式搜索方法，其中，

所述第1代价计算方法与所述第2代价计算方法相同或者不同。
根据权利要求1所述的帧内预测模式搜索方法，其中，

所述帧内预测模式搜索方法由包括N-2流水级、N-1流水级和N流水级的芯片执行，

所述第1步骤和所述第2步骤由N-2流水级执行，

所述第3步骤由N-1流水级执行，

所述第4步骤由N流水级执行。
根据权利要求26所述的帧内预测模式搜索方法，其中，

所述N-2流水级对所有编码块进行预先处理，并将处理的结果存储起来供所述N-1流水级调用。
根据权利要求26所述的帧内预测模式搜索方法，其中，

所述N-2流水级、所述N-1流水级和所述N流水级并行工作，使得所述N流水级对由所述N-1流水级处理过的编码块的处理、所述N-1流水级对由所述N流水级处理过的编码块的处理、和所述N-2流水级对当前编码块的处理并行进行。
一种视频编码方法，包括：

使用权利要求1～28的任一项所述的帧内预测模式搜索方法搜索出的最终预测模式对视频进行编码。
一种帧内预测模式搜索装置，用于执行权利要求1～25的任一项所述的帧内预测模式搜索方法，其中，

包括：N-2流水级、N-1流水级和N流水级，

所述第1步骤和所述第2步骤由所述N-2流水级执行，

所述第3步骤由所述N-1流水级执行，

所述第4步骤由所述N流水级执行。
根据权利要求30所述的帧内预测模式搜索方法，其中，

所述N-2流水级对所有编码块进行预先处理，并将处理的结果存储起来供所述N-1流水级调用。
根据权利要求30所述的帧内预测模式搜索方法，其中，

所述N-2流水级、所述N-1流水级和所述N流水级并行工作，使得所述N流水级对由所述N-1流水级处理过的编码块的处理、所述N-1流水级对由所述N流水级处理过的编码块的处理、和所述N-2流水级对当前编码块的处理并行进行。
一种帧内预测模式搜索装置，包括：存储器和处理器，其中，

所述存储器用于存储程序指令；

所述处理器，调用所述程序指令，当程序指令被执行时，用于执行以下操作：

第1步骤，基于X个对象预测模式，利用当前编码块周边的相邻块的原始像素生成所述当前编码块在所述X个对象预测模式下的X个第1预测信号，并求出所述X个第1预测信号与所述编码块的原始像值的残差作为X个第1残差；

第2步骤，根据所述第1残差通过第1代价计算方法计算出所述X个对象预测模式的第1代价，将所述对象预测模式中所述第1代价最小一侧的Y个对象预测模式作为中间预测模式；

第3步骤，基于所述中间预测模式，利用所述相邻块的重建像素生成所述当前编码块在所述中间预测模式下的第2预测信号，并求出所述第2预测信号与所述当前编码块的原始像值的残差作为第2残差；和

第4步骤，根据所述第2残差通过第2代价计算方法计算出所述中间预测模式的第2代价，将所述中间预测模式中所述第2代价最小的预测模式作为搜索出的最终预测模式，

其中，Y是小于X的自然数。
根据权利要求33所述的帧内预测模式搜索装置，其中，

在所述第3步骤中，进一步对所述第2步骤得到的所述Y个中间预测模式与所述当前编码块的至少一个相邻块的最终预测模式进行综合处理来将所述中间预测模式调整为Z个，

其中，Z是小于X的自然数。
根据权利要求34所述的帧内预测模式搜索装置，其中，

在所述第3步骤中，所述综合处理中使用所述当前编码块的左侧、上侧以及左上侧这3个方向的所述相邻块中的至少一个的最终预测模式。
根据权利要求34所述的帧内预测模式搜索装置，其中，

在所述第3步骤中，所述综合处理中，将所述Y个中间预测模式中的至少一个预测模式与所述相邻块的最终预测模式一起作为所述中间预测模式。
根据权利要求36所述的帧内预测模式搜索装置，其中，

所述Y个中间预测模式中的至少一个预测模式，是与所述相邻块的最终预测模式不同且所述第1代价最小一侧的预测模式。
根据权利要求33所述的帧内预测模式搜索装置，其中，

所述X个对象预测模式为35个对象预测模式，所述Y个中间预测模式为5个中间预测模式。
根据权利要求34所述的帧内预测模式搜索装置，其中，

所述Z个中间预测模式为5个中间预测模式。
根据权利要求33所述的帧内预测模式搜索装置，其中，

在所述第1步骤中，将帧内预测的全部预测模式分为至少2组，选择其中1组作为所述对象预测模式。
根据权利要求40所述的帧内预测模式搜索装置，其中，

根据所述对象预测模式的方向或种类的至少一个进行所述分组。
根据权利要求41所述的帧内预测模式搜索装置，其中，

每个所述分组中的预测模式的数量相同。
根据权利要求40所述的帧内预测模式搜索装置，其中，

所述预测模式包括方向模式、DC模式和Planar模式，

每个分组都包括所述DC模式和/或Planar模式。
根据权利要求40所述的帧内预测模式搜索装置，其中，

在所述第1步骤中，随机或者根据当前编码块的特征指标来进行选择1组预测模式作为所述对象预测模式。
根据权利要求40所述的帧内预测模式搜索装置，其中，

在所述第1步骤中，针对预测方向中的0°、45°、90°及135°，将所述全部预测模式分为0°、45°、90°及135°所对应的4组，

根据所述当前编码块在各个预测方向上的方向性指标来选择其中1组作为所述对象预测模式。
根据权利要求45所述的帧内预测模式搜索装置，其中，

所述方向性指标是所述当前编码块在各个预测方向上的梯度信息。
根据权利要求46所述的帧内预测模式搜索装置，其中，

在所述第1步骤中，将所述当前编码块分成多个区域，根据分组中的预测方向确定所述多个区域在所述预测方向上的梯度信息，选择梯度信息为最小值的1组预测模式作为所述对象预测模式。
根据权利要求45所述的帧内预测模式搜索装置，其中，

在所述第1步骤中，将所述当前编码块按照左上、右上、左下、右下、中心的顺序，分成大小相等的5个子块a、b、c、d、e，分别计算出子块a、b、c、d、e的均值，再用均值按下式求出在0°、45°、90°及135°的梯度信息，

0°：GI1＝|b-a|+|d-c|

45°：GI2＝|c-e|+|e-b|

90°：GI3＝|c-a|+|d-b|

135°：GI4＝|d-e|+|e-a|

选择GI1～GI4中最小值对应的预测方向的1组预测模式作为所述对象预测模式。
根据权利要求33所述的帧内预测模式搜索装置，其中，

所述相邻块是临近所述当前编码块的编码块中的像素块。
根据权利要求33所述的帧内预测模式搜索装置，其中，

所述原始像素和所述重建像素，包括通过进行填充而得到的像素。
根据权利要求50所述的帧内预测模式搜索装置，其中，

进行所述填充的像素块，是在生成所述第2预测信号时无法获得重建像素的位置上的像素块。
根据权利要求33所述的帧内预测模式搜索装置，其中，

所述编码块包含NxN个像素块，N是自然数，

所述利用所述当前编码块周边的相邻块的原始像素生成所述当前编码块在所述X个对象预测模式下的第1预测信号，包括：由所述编码块的左侧、左上侧和上侧的4*N+1个像素块的参考像素生成当前编码块的预测信号。
根据权利要求33所述的帧内预测模式搜索装置，其中，

所述第1代价计算方法和/或所述第2代价计算方法中，将残差的平方和或绝对值和作为预测模式的代价。
根据权利要求33所述的帧内预测模式搜索装置，其中，

所述第1代价计算方法和/或所述第2代价计算方法中，根据对残差进行二维矩阵变换得到的变换系数和预测模式的比特数来计算预测模式的代价。
根据权利要求53所述的帧内预测模式搜索装置，其中，

所述二维矩阵变换是离散正弦/余弦变换。
根据权利要求53所述的帧内预测模式搜索装置，其中，

所述二维矩阵变换是哈达玛变换。
根据权利要求33所述的帧内预测模式搜索装置，其中，

所述第1代价计算方法与所述第2代价计算方法相同或者不同。
一种视频编码装置，包括权利要求30～57的任一项所述的帧内预测模式搜索装置。
一种记录介质，存储有使计算机执行如权利要求1～28所述的帧内预测模式搜索方法的程序。
一种记录介质，存储有使计算机执行如权利要求29所述的视频编码方法的程序。