WO2018014301A1

WO2018014301A1 - 视频编码方法及装置

Info

Publication number: WO2018014301A1
Application number: PCT/CN2016/090884
Authority: WO
Inventors: 张金雷; 邹天玱; 王妙锋; 石中博; 王世通; 薛东; 罗巍
Original assignee: 华为技术有限公司
Priority date: 2016-07-21
Filing date: 2016-07-21
Publication date: 2018-01-25
Also published as: CN108028938A

Abstract

本发明实施例涉及视频编码方法及装置。该方法包括：对当前预测模式的预测残差进行离散余弦变换，得到变换系数；对变换系数进行量化，得到量化系数；对量化系数进行反量化，得到反量化系数；根据变换系数和反量化系数之差得到所述当前预测模式的失真值。根据当前预测模式的码率值和失真值得到当前预测模式代价值；选取多种预测模式中代价值最小的预测模式为最优预测模式；对最优预测模式的反量化系数进行反离散余弦变换，得到重建残差。本发明实施例根据变换系数和反量化系数之差得到失真值，只需对最优预测模式进行一次反变换得到重建残差。本发明实施例具有低复杂度、低功耗的优势，且可靠性高。

Description

视频编码方法及装置

技术领域

本发明涉及图像处理技术领域，尤其涉及一种视频编码方法及装置。

背景技术

数字视频压缩格式H.264标准和高效率视频编码(High Efficiency Video Coding，简称HEVC)标准是目前使用的两种视频编码方案，其中，HEVC标准又可称为H.265标准。

图1为现有技术视频编码框架图。在H.264和HEVC标准中，采用的整体编码框架都是预测、变换、量化、熵编码。预测是为了压缩图像。其中，预测部分是通过去除视频内容的空间相关性和时间相关性为当前编码图像获得预测值，以及得到原始图像与预测图像的残差。对残差进行变换量化。对预测残差的量化系数(quantized coefficients)以及预测模式等信息进行熵编码形成码流输出。

其中，预测模式可分为帧间预测和帧内预测，帧间预测为利用时间上相邻的前一帧预测下一帧图像，帧内预测模式为利用当前帧内空间相关性预测当前帧图像。帧间预测模式可利用视频相邻帧信息预测，压缩率更高。帧内预测模式的压缩率较帧间预测模式低，但可去除当前帧内部的相邻块的空间冗余度。

预测的准确性对编码性能起到了决定性的作用。在编码过程中，每种预测类型下都有多种预测模式，每种预测模式具有不同的预测值和预测残差，每种预测模式熵编码后的码率(rate，简称R)和重建视频后的失真(distortion，简称D)不同。通过率失真优化(Rate Distortion Optimization，简称RDO)计算每种模式的代价，选取代价函数最小的模式为最优模式。RDO利用R和 D两个量设计代价函数计算每种预测模式的代价值J，如公式(1)所示：

J＝D+λR (1)

现有技术输出最优预测模式的编码数据，并保存最优预测模式的重建残差和重建视频。现有技术对预测残差进行变换、量化、反量化和反变换操作得到重建残差，根据预测残差和重建残差之差得到失真D。其中，预测残差为空域数据，变换操作将空域数据转换为频域数据。故现有技术又称为空域失真计算方法。

现有技术需要对每种预测模式的预测残差进行变换、量化、反量化及反变换，才能选出最优预测模式。现有技术复杂度高，其中，变换和反变换的复杂度随着变换大小成指数增长，HEVC标准的变换大小相比H.264增大，同时，HEVC标准中的预测模式的数目也相比于H.264标准成倍增长，因此，现有技术会导致HEVC标准的复杂度剧增。

现有技术在硬件实现中，变换和反变换是功耗较高的模块，现有技术对每种预测模式的预测残差都进行变换和反变换，功耗过高。

发明内容

本发明实施例涉及一种视频编码方法及装置，解决现有技术复杂度高，硬件实现功耗大的问题。

第一方面，本发明实施例提供了一种视频编码方法，该方法包括：对当前预测模式的预测残差进行离散余弦变换，得到变换系数，其中，预测图像为根据帧间预测模式或帧内预测模式预测得到，帧间预测模式为利用时间上相邻的前一帧图像预测下一帧图像，帧内预测模式为利用当前帧内空间相关性预测当前帧图像。对变换系数进行量化，得到量化系数。对量化系数进行反量化，得到反量化系数。根据变换系数和反量化系数之差得到当前预测模式的失真值。根据当前预测模式的码率值和失真值得到当前预测模式代价值。选取多种预测模式中代价值最小的预测模式为最优预测模式。对最优预测模式的反量化系数进行反离散余弦变换，得到重建残差。

具体地，离散余弦变换将空域数据转换成频域数据。变换系数和反量化系数属于频域数据。本发明实施例采用频域失真估算方法，相比现有空域失真计算方法，无需对每种预测模式进行离散余弦变换和反离散余弦变换，即可计算失真，进一步选取最优预测模式。复杂度低、功耗低。

在一种可能的设计中，根据当前预测模式的码率值和失真值得到当前预测模式代价值，包括：根据当前预测模式的码率值和失真值通过率失真优化函数计算当前预测模式代价值，率失真优化函数用于权衡码率值和失真值。

在一种可能的设计中，对当前预测模式的预测残差进行离散余弦变换，得到变换系数，包括：通过离散余弦变换矩阵对当前预测模式的预测残差进行离散余弦变换，得到变换系数，离散余弦变换矩阵正交可逆。

具体地，本发明实施例提供的方法可以应用到HEVC/H.265标准。

在一种可能的设计中，对当前预测模式的预测残差进行离散余弦变换，得到变换系数，包括：通过整数离散余弦变换矩阵对当前预测模式的预测残差进行整数离散余弦变换，得到整数离散余弦变换系数，整数离散余弦变换矩阵非正交可逆；对整数离散余弦变换系数进行点乘，得到变换系数。

具体地，本发明实施例提供的方法可以应用到H.264标准。

第二方面，本发明实施例提供了一种视频编码失真估算装置，该装置包括：离散余弦变换单元，用于对当前预测模式的预测残差进行离散余弦变换，得到变换系数，其中，预测残差为原始图像与预测图像的像素值之差，预测图像为根据帧间预测模式或帧内预测模式预测得到，帧间预测模式为利用时间上相邻的前一帧图像预测下一帧图像，帧内预测模式为利用当前帧内空间相关性预测当前帧图像。量化单元，用于对变换系数进行量化，得到量化系数。反量化单元，用于对量化系数进行反量化，得到反量化系数。失真值计算单元，用于根据变换系数和反量化系数之差得到当前预测模式的失真值。代价值计算单元，用于根据当前预测模式的码率值和失真值得到当前预测模式代价值。最优预测模式选取单元，用于选取多种预测模式中代价值最小的预测模式为最优预测模式。重建残差单元，用于对最优预测模式的反量化系数进行反离散余弦变换，得到重建残差。

具体地，预测模式包括多种，每种预测模式的预测图像不同，对当前预测模式的量化系数进行熵编码，得到熵编码信息，根据熵编码信息确定码率值，其中，当前预测模式为多种预测模式中的任一种。

在一种可能的设计中，代价值计算单元具体用于：根据当前预测模式的码率值和失真值通过率失真优化函数计算当前预测模式代价值，率失真优化函数用于权衡码率值和失真值。

在一种可能的设计中，离散余弦变换单元具体用于：通过离散余弦变换矩阵对当前预测模式的预测残差进行离散余弦变换，得到变换系数，离散余弦变换矩阵正交可逆。

在一种可能的设计中，离散余弦变换单元具体用于：通过整数离散余弦变换矩阵对当前预测模式的预测残差进行整数离散余弦变换，得到整数离散余弦变换系数，整数离散余弦变换矩阵非正交可逆；对整数离散余弦变换系数进行点乘，得到变换系数。

第三方面，本发明实施例提供了一种视频编码失真估算装置，该装置包括：

存储器，用于存储程序指令。处理器，用于根据存储器中存储的程序指令执行以下操作：对当前预测模式的预测残差进行离散余弦变换，得到变换系数；其中，预测残差为原始图像与预测图像的像素值之差，预测图像为根据帧间预测模式或帧内预测模式预测得到，帧间预测模式为利用时间上相邻的前一帧图像预测下一帧图像，帧内预测模式为利用当前帧内空间相关性预测当前帧图像。对变换系数进行量化，得到量化系数。对量化系数进行反量化，得到反量化系数。根据变换系数和反量化系数之差得到当前预测模式的失真值。根据当前预测模式的码率值和失真值得到当前预测模式代价值。选取多种预测模式中代价值最小的预测模式为最优预测模式。对最优预测模式的反量化系数进行反离散余弦变换，得到重建残差。

在一种可能的设计中，处理器执行根据当前预测模式的码率值和失真值得到当前预测模式代价值，包括：根据当前预测模式的码率值和失真值通过率失真优化函数计算当前预测模式代价值，率失真优化函数用于权衡码率值和失真值。

在一种可能的设计中，处理器执行对当前预测模式的预测残差进行离散余弦变换，得到变换系数，包括：通过离散余弦变换矩阵对当前预测模式的预测残差进行离散余弦变换，得到变换系数，离散余弦变换矩阵正交可逆。

在一种可能的设计中，处理器执行对当前预测模式的预测残差进行离散余弦变换，得到变换系数，包括：通过整数离散余弦变换矩阵对当前预测模式的预测残差进行整数离散余弦变换，得到整数离散余弦变换系数，整数离散余弦变换矩阵非正交可逆。对整数离散余弦变换系数进行点乘，得到变换系数。

第四方面，本发明实施例提供了一种计算机存储介质，用于存储有程序，程序执行的步骤包括上述第一方面的步骤。

本发明实施例提供一种视频编码方法及装置，利用频域失真计算法得到失真值，并根据率失真优化函数选出最有预测模式，对最优预测模式的反量化系数进行一次反变换得到重建残差。相比现有技术，需要每种预测模式的预测残差进行变换、量化、反量化和反变换计算每种预测模式的失真值以及得到重建残差，本发明实施例具有低复杂度、低功耗的优势，且可靠性高。

附图说明

图1为现有技术视频编码框架图；

图2为本发明实施例提供的一种视频编码方法流程示意图；

图3为本发明实施例提供的又一种视频编码方法流程示意图；

图4为现有技术视频编码方法实现流程图；

图5为本发明实施例提供的视频编码方法实现流程图；

图6为本发明实施例提供的一种采用本发明的失真估算方法计算得到的失真与现有技术计算得到的失真的对比示意图；

图7为本发明实施例提供的又一种采用本发明的失真估算方法计算得到的失真与现有技术计算得到的失真的对比示意图；

图8为本发明实施例提供的一种视频编码失真估算装置结构示意图；

图9为本发明实施例提供的又一种视频编码失真估算装置结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，通常，在视频编码中，变换操作通常为离散余弦变换(Discrete Cosine Transformation，简称DCT)。

可以理解的是，本申请中涉及的变换系数、量化系数、反量化系数其英文分别为：transform coefficients、quantized coefficients、dequantized coefficients。以下不再重复说明。

图2为本发明实施例提供的一种视频编码方法流程示意图，参照图2，该方法包括：

步骤201，对当前预测模式的预测残差进行DCT变换，得到变换系数，其中，该预测残差为原始图像与预测图像的像素值之差，预测图像为根据原始图像的空间相关性和时间相关性按照当前预测模式预测得到。

其中，预测图像为根据帧间预测模式或帧内预测模式预测得到，帧间预测模式为利用时间上相邻的前一帧图像预测下一帧图像，帧内预测模式为利用当前帧内空间相关性预测当前帧图像。

具体地，通过DCT变换矩阵对当前预测模式的预测残差进行DCT变换，得到变换系数，该DCT变换矩阵正交可逆。

具体地，通过整数DCT变换矩阵对当前预测模式的预测残差进行整数DCT变换，得到整数DCT变换系数，该整数DCT变换矩阵非正交可逆；对整数DCT系数进行点乘，得到变换系数。

需要说明的是，预测残差为空域数据。DCT变换将空域数据转换为频域数据。量化对数据进行压缩。视频编码失真由量化操作引入，DCT变换属于无损变换。以下以变换大小为4×4为例，说明本发明实施例提供的视频编码方法适用于HEVC标准和H.264标准。

第一方面，对于HEVC标准，DCT变换包括以下步骤：

步骤201a，为实现DCT变换，先对整数DCT变换矩阵A进行精度提升，对A中的每个矩阵元素同乘以128(2⁷)，并对每个矩阵元素近似取整，得到DCT变换矩阵C：

其中，

步骤201b，设预测残差为X，通过DCT变换矩阵C对预测残差X进行DCT变换，得到变换系数Y，如公式(2)：

Y＝(CXC^T)＞＞9 (2)

其中，公式(2)表明通过DCT变换矩阵C对预测残差X进行运算，并右移9位，即除以2⁹。

具体地，X为空域数据，Y为频域数据。

步骤201c，由于DCT变换矩阵C为正交可逆矩阵，因此，对Y进行反变换是无损的，如公式(3)：

Y′＝(C^-1(Y＜＜9)(C^-1)^T)＝X (3)

可以理解的是，根据公式(2)和公式(3)，在HEVC标准中，DCT变换为无损变换，整个编码过程不会由于变换引入误差，同时，由于编码的流程为：预测、变换、量化和熵编码。故在HEVC标准中，只有量化引入了误差，因此HEVC可以利用量化前的变换系数和反量化后的反量化系数估算失真D。

第二方面，对于H.264标准，DCT变换包括整数DCT变换和点乘。

整数DCT变换又可命名为核变换，其整数DCT变换矩阵C_f为：

可以理解的是，在H.264标准中，整数DCT变换矩阵C_f是非正交可逆的。

需要说明的是，本领域技术人员可知，H.264标准中，将编码方法实际应用到硬件模块时，变换模块包括核变换，量化模块包括点乘和量化。根据整数DCT变换矩阵C_f非正交可逆可知，若在H.264标准中，直接采用核变换后的核变换系数作为变换系数，无法满足公式(2)和公式(3)所述的无损变换。故需要将点乘归到变换模块，核变换和点乘为完整的DCT变换。故，H.264标准同样可以利用量化前的变换系数和反量化后的反量化系数估算失真D。

可以理解的是，这里对核变换系数进行点乘后的点乘系数为步骤201中所述的变换系数。

可以理解的是，本发明实施例中提及的核变换等同整数DCT变换，本发明实施例中提及的点乘系数等同变换系数。其命名根据实际进行的运算而定，并不用于限定各运算步骤。

可以理解的是，本发明实施例中提及的变换均为DCT变换的简称。

需要说明的是，本发明实施例仅以变换大小4×4为例，说明本发明实施例提供的视频编码方法适用于HEVC标准和H.264标准，对于其他变换大小的视频编码，本发明实施例同样适用。

步骤202，对所述变换系数进行量化，得到量化系数。

具体地，变换系数属于频域数据，量化压缩后的量化系数还属于频域数据。

步骤203，对所述量化系数进行反量化，得到反量化系数。

具体地，反量化是为了解压缩。进一步利用量化前的变换系数和反量化后的反量化系数估算失真。

步骤204，根据所述变换系数和所述反量化系数之差估算所述当前预测模式的失真值。

具体地，对量化系数进行反量化操作，得到相应的反量化系数Q′，直接利用该反量化系数Q′与量化前的变换系数T的误差估算视频编码失真D′。具体计算方法如公式(4)所示：

其中，blocksize表示当前块的大小，(i,j)表示当前块的坐标值。

需要说明的是，反DCT变换将频域数据转换成空域数据。现有技术利用预测残差和重建残差两个空域数据计算编码失真。本发明实施例利用变换系数和反量化系数两个频域数据估算失真。因此，本发明实施例中提供的失真计算方法又称为频域失真估算法。

步骤205，根据当前预测模式的码率值和失真值得到当前预测模式代价值。

根据当前预测模式的码率值和失真值通过如公式(1)所述的率失真优化函数计算当前预测模式代价值，率失真优化函数用于权衡码率值和失真值。

步骤206，选取多种预测模式中代价值最小的预测模式为最优预测模式。

步骤207，对最优预测模式的反量化系数进行反离散余弦变换，得到重建残差。

本发明实施例，采用频域失真计算法，相比于现有空域失真计算法，本发明无需对每种预测模式都进行反变换操作即可估算每种预测模式的失真。本发明只对最优预测模式进行一次反离散余弦变换，得到重建残差并保存。另外，将最优预测模式下的预测图像与重建残差之和保存为重建视频。本发明大大降低了视频编码复杂度和功耗。

图3为本发明实施例提供的又一种视频编码方法流程示意图，参照图3，该方法包括：

采用图2所示的频域失真估算方法，通过频域误差得到每种预测模式的失真值D。

具体地，对当前预测模式的量化系数进行熵编码，得到熵编码信息，根据熵编码信息确定码率值R，其中，当前预测模式为多种预测模式中的任一种。根据当前预测模式的码率值R和失真值D得到当前预测模式代价值。

具体地，通过率失真优化函数计算每种预测模式的代价值J。率失真优化函数用于权衡码率值R和失真值D。

需要说明的是，预测模式包括多种，每种预测模式的预测图像不同，因此，每种预测模式的预测残差X不同。因此，每种预测模式的码率值R和失真值D不同，则每种预测模式的代价值J不同。

具体地，选取多种预测模式中代价值J最小的预测模式为最优预测模式；对最优预测模式的反量化系数进行反DCT变换，得到重建残差。

具体地，重建残差与最优预测模式的预测值相加组成重建视频。

具体地，对最优预测模式的模式信息和量化系数熵编码并输出。

本发明实施例，仅需对最优预测模式进行反变换操作得到重建残差和重建视频。本发明实施例采用频域失真估算法，无需对每种预测模式进行DCT变换和反DCT变换即可得到失真，本发明实施例仅需对最优预测模式进行一次反DCT变换，得到重建残差，具有低功耗低复杂度的优势。

图4和图5分别为现有技术和本发明实施例提供的视频编码方法实现流程图。图4和图5分别仅以5种预测模式并行实现的情况为例，以说明本发明和现有技术的区别。

如图4所示，现有技术需对每种预测模式的预测残差进行变换、量化、反量化、反变换操作，得到每种预测模式的重建残差。对每种预测模式获得的预测值与原始值之间的残差进行变换、量化，对获得的量化系数进行熵编码以获得当前块的编码比特数(码率)R，同时，对量化系数进行反量化反变换，以获得解码(重建)残差，利用反变换后重建残差与变换前的预测残差求平方和得到失真D，具体计算方法如公式(5)所示：

其中，P_org(i,j)表示原始块对应位置(i,j)处的像素值，p_rec(i,j)表示重建块对应位置(i,j)处的像素值，p_pred(i,j)表示预测块对应位置(i,j)处的像素值。

根据预测残差和重建残差计算每种预测模式的失真值D。如图4中的D₁₁—D₁₅所示。并利用R和D按照公式(1)计算得到当前模式下的率失真代价。

本发明主要涉及到预测过程中的率失真优化技术选择最优预测模式获得最优预测值。尤其涉及到率失真优化技术中的失真D的获取。

如图5所示，码率R的获取方式与图4现有技术所示方案一致。在本发明中，对量化系数进行反量化操作，得到相应的反量化系数Q′，直接利用该反量化系数Q′与量化前的变换系数T的误差估算D，如图5中的D₂₁—D₂₅所示。具体计算方法如公式(3)所示。

本发明实施例通过设计频域的失真估计算法来取代原来利用空域的失真计算方法，以使得编码端无需对所有预测模式进行反变换操作，仅仅需要对选择出的最优模式进行完整的编码策略。本发明实施例提供的视频编码方法具有低复杂度、低功耗的优势。

以下通过图6和图7提供的采用本发明的失真估算方法计算得到的失真与现有技术计算得到的失真的对比示意图，说明本发明实施例提供的频域失真估算方法的可靠性。本发明实施例在对一帧视频分块处理后通过采用现有技术精确计算D和采用本发明的频域失真估算方法所得D进行对比。具体如下：

图6为本发明实施例提供的一种采用本发明的失真估算方法计算得到的失真与现有技术计算得到的失真的对比示意图。参照图6，该图为H.264标准中，由于图像分辨率为1920×1080，按分块4×4进行处理，选取其中一些视频块的失真值进行对比，以说明本发明实施例。

如图6所示，每个点的横坐标表示采用H.264标准中的现有空域失真计算方法得到的当前块的D值，其纵坐标表示采用本发明实施例提供的频域失真估算方法得到的当前块的D′值。

图7为本发明实施例提供的又一种采用本发明的失真估算方法计算得到的失真与现有技术计算得到的失真的对比示意图。

如图7所示，每个点的横坐标表示采用HEVC标准中的现有空域失真计算方法得到的当前块的D值，其纵坐标表示采用本发明实施例提供的频域失真估算方法得到的当前块的D′值。

具体地，根据图6或图7中的选取的视频块点可见，图6或图7中点基本都在直线y＝x附近，表示采用本发明实施例提供的空域失真估算方法与现有空域失真计算方法两种失真计算方法得到的失真值D基本都相近。由此可见，本发明实施例提供的频域失真估算方法与现有技术计算的失真值非常接近。

需要说明的是，图6和图7中示意出了部分视频块的失真值计算对比，本发明实施例经过大量的计算以及示图结果表明，采用本发明实施例提供的失真估算方法和现有技术对任一视频块的失真计算，均满足图6和图7所示的规律。在此不予赘述。故本发明实施例提供的频域失真估算方法，其可靠性较高。

可以理解的是，对比图6和图7可知，本发明实施例提供的频域失真估算法得到的失真值与HEVC标准的计算结果较H.264标准的计算结果更接近。由于HEVC标准相比H.264更复杂，进一步验证，本发明实施例提供的失真估算方法可以很好的应用到变换大小以及预测模式更多的HEVC标准中。

本发明实施例通过设计频域的失真估计算法来取代原来利用空域的失真计算方法，以使得编码端无需对所有预测模式进行反变换操作，仅仅需要对选择出的最优模式进行完整的编码策略，且采用本发明实施例估算的失真值非常接近采用现有空域失真计算方法得到的失真值。因此，本发明实施例具有低复杂度、低功耗的优势，且可靠性高。

图8为本发明实施例提供的一种视频编码装置结构示意图；参照图8，该装置包括：

离散余弦变换单元801，用于对当前预测模式的预测残差进行离散余弦变换，得到变换系数，其中，预测残差为原始图像与预测图像的像素值残差，预测图像为根据原始图像的空间相关性和时间相关性按照当前预测模式预测得到。

具体地，预测图像为根据帧间预测模式或帧内预测模式预测得到，所述帧间预测模式为利用时间上相邻的前一帧图像预测下一帧图像，所述帧内预测模式为利用当前帧内空间相关性预测当前帧图像。

具体地，离散余弦变换单元801具体用于：在HEVC标准下，通过离散余弦变换矩阵对当前预测模式的预测残差进行离散余弦变换，得到变换系数。离散余弦变换矩阵正交可逆。或，在H.264标准下，通过整数离散余弦变换矩阵对当前预测模式的预测残差进行整数离散余弦变换，得到整数离散余弦变换系数，整数离散余弦变换矩阵非正交可逆。对整数离散余弦变换系数进行点乘，得到变换系数。

量化单元802，用于对变换系数进行量化，得到量化系数。

反量化单元803，用于对量化系数进行反量化，得到反量化系数。

失真值计算单元804，用于根据变换系数和反量化系数之差估算当前预测模式的失真值。

代价值计算单元805，用于根据当前预测模式的码率值和失真值得到当前预测模式代价值。

具体地，代价值计算单元805具体用于：对当前预测模式的量化系数进行熵编码，得到熵编码信息，根据熵编码信息确定码率值，其中，当前预测模式为多种预测模式中的任一种。根据当前预测模式的码率值和失真值通过率失真优化函数计算当前预测模式代价值，率失真优化函数用于权衡码率值和失真值。

最优预测模式选取单元806，用于选取多种预测模式中代价值最小的预测模式为最优预测模式。

重建残差单元807，用于对最优预测模式的反量化系数进行反离散余弦变换，得到重建残差。

具体各单元的工作流程可参见上述方法实施例的介绍，在此不予赘述。

可以理解的是，801—807各单元等是为了实现上述方法实施例的功能，其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，本发明能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

本发明实施例可以根据上述方法实施例对801—807等进行功能模块的划分，例如，可以对应各个功能划分各个功能模块，也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。需要说明的是，本发明实施例中对模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

图9为本发明实施例提供的又一种视频编码装置结构示意图，如图9所示，包括：网卡901、存储器902、处理器903和总线904。

具体地，网卡901配置多个通信接口，终端通过通信接口采集或者接收视频，进行视频编解码。存储器902用于存储程序指令。网卡901、存储器902和处理器903通过总线904通信。

在一个示例中，处理器903，用于根据存储器902中存储的程序指令执行以下操作：对当前预测模式的预测残差进行离散余弦变换，得到变换系数。其中，预测残差为原始图像与预测图像的像素值之差，预测图像为根据帧间预测模式或帧内预测模式预测得到，帧间预测模式为利用时间上相邻的前一帧图像预测下一帧图像，帧内预测模式为利用当前帧内空间相关性预测当前帧图像。对变换系数进行量化，得到量化系数。对量化系数进行反量化，得到反量化系数。根据变换系数和反量化系数之差得到所述当前预测模式的失真值。根据所述当前预测模式的码率值和失真值得到当前预测模式代价值。选取多种预测模式中代价值最小的预测模式为最优预测模式。对最优预测模式的反量化系数进行反离散余弦变换，得到重建残差。

存储器902可以是一个存储装置，也可以是多个存储元件的统称，且用于存储运行会议服务器所需的程序以及数据等信息。且存储器902可以包括随机存取存储器(Random Access Memory，简称RAM)、闪存、只读存储器(Read Only Memory，简称ROM)、可擦除可编程只读存储器(Erasable Programmable ROM，简称EPROM)、电可擦可编程只读存储器(Electrically EPROM，简称EEPROM)、寄存器、硬盘、移动硬盘、只读光盘(CD-ROM)、闪存(Flash)或者本领域熟知的任何其它形式的存储介质等中的一个或多个存储介质的组合。

处理器903可以是CPU，通用处理器，DSP，专用集成电路(Application-Specific Integrated Circuit，简称ASIC)，现场可编程门阵列(Field Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本发明公开内容所描述的各种示例性的逻辑方框，单元和电路。所述处理器也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等等。

总线904可以是工业标准体系结构(Industry Standard Architecture，简称ISA)总线、外部设备互连(Peripheral Component，简称PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture，简称EISA)总线等。该总线904可以分为地址总线、数据总线、控制总线等。为便于表示，图9中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

在一个示例中，处理器903根据当前预测模式的码率值和失真值通过率失真优化函数计算当前预测模式代价值，率失真优化函数用于权衡码率值和失真值。

在一个示例中，处理器903执行所述对当前预测模式的预测残差进行离散余弦变换，得到变换系数，包括：

通过离散余弦变换矩阵对当前预测模式的预测残差进行离散余弦变换，得到变换系数。其中，离散余弦变换矩阵正交可逆。或，通过整数离散余弦变换矩阵对当前预测模式的预测残差进行整数离散余弦变换，得到整数离散余弦变换系数。其中，整数离散余弦变换矩阵非正交可逆。对整数离散余弦变换系数进行点乘，得到变换系数。

进一步，总线904可用于连接图8中的各单元。处理器903可用于执行801—807各单元的功能，处理器902可用于存储801—807各单元的数据。

本发明实施例提供的视频编码方法及装置，采用频域失真估算方法，相比现有空域失真计算方法具有低复杂度、低功耗的优势，且可靠性高。

专业人员应该还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令处理器完成，所述的程序可以存储于计算机可读存储介质中，所述存储介质是非短暂性(英文：non-transitory)介质，例如随机存取存储器，只读存储器，快闪存储器，硬盘，固态硬盘，磁带(英文：magnetic tape)，软盘(英文：floppy disk)，光盘(英文：optical disc)及其任意组合。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

一种视频编码方法，其特征在于，所述方法包括：

对当前预测模式的预测残差进行离散余弦变换，得到变换系数，其中，所述预测残差为原始图像与预测图像的像素值之差，所述预测图像为根据帧间预测模式或帧内预测模式预测得到，所述帧间预测模式为利用时间上相邻的前一帧图像预测下一帧图像，所述帧内预测模式为利用当前帧内空间相关性预测当前帧图像；

对所述变换系数进行量化，得到量化系数；

对所述量化系数进行反量化，得到反量化系数；

根据所述变换系数和所述反量化系数之差得到所述当前预测模式的失真值；

根据所述当前预测模式的码率值和失真值得到所述当前预测模式代价值；

选取所述多种预测模式中代价值最小的预测模式为最优预测模式；

对所述最优预测模式的反量化系数进行反离散余弦变换，得到重建残差。
如权利要求1所述的方法，其特征在于，所述根据所述当前预测模式的码率值和失真值得到所述当前预测模式代价值，包括：

根据所述当前预测模式的码率值和失真值通过率失真优化函数计算所述当前预测模式代价值，所述率失真优化函数用于权衡所述码率值和所述失真值。
如权利要求1所述的方法，其特征在于，所述对当前预测模式的预测残差进行离散余弦变换，得到变换系数，包括：

通过离散余弦变换矩阵对所述当前预测模式的预测残差进行离散余弦变换，得到所述变换系数，所述离散余弦变换矩阵正交可逆。
如权利要求1所述的方法，其特征在于，所述对当前预测模式的预测残差进行离散余弦变换，得到变换系数，包括：

通过整数离散余弦变换矩阵对所述当前预测模式的预测残差进行整数离散余弦变换，得到整数离散余弦变换系数，所述整数离散余弦变换矩阵非正交可逆；

对所述整数离散余弦变换系数进行点乘，得到所述变换系数。
一种视频编码装置，其特征在于，所述装置包括：

离散余弦变换单元，用于对当前预测模式的预测残差进行离散余弦变换，得到变换系数；其中，所述预测残差为原始图像与预测图像的像素值之差，所述预测图像为根据帧间预测模式或帧内预测模式预测得到，所述帧间预测模式为利用时间上相邻的前一帧图像预测下一帧图像，所述帧内预测模式为利用当前帧内空间相关性预测当前帧图像；

量化单元，用于对所述变换系数进行量化，得到量化系数；

反量化单元，用于对所述量化系数进行反量化，得到反量化系数；

失真值计算单元，用于根据所述变换系数和所述反量化系数之差得到所述当前预测模式的失真值；

代价值计算单元，用于根据所述当前预测模式的码率值和失真值得到所述当前预测模式代价值；

最优预测模式选取单元，用于选取所述多种预测模式中代价值最小的预测模式为最优预测模式；

重建残差单元，用于对所述最优预测模式的反量化系数进行反离散余弦变换，得到重建残差。
如权利要求5所述的装置，其特征在于，所述代价值计算单元具体用于：

根据所述当前预测模式的码率值和失真值通过率失真优化函数计算所述当前预测模式代价值，所述率失真优化函数用于权衡所述码率值和所述失真值。
如权利要求5所述的装置，其特征在于，所述离散余弦变换单元具体用于：

通过离散余弦变换矩阵对所述当前预测模式的预测残差进行离散余弦变换，得到所述变换系数，所述离散余弦变换矩阵正交可逆。
如权利要求5所述的装置，其特征在于，所述离散余弦变换单元具体用于：

通过整数离散余弦变换矩阵对所述当前预测模式的预测残差进行整数离散余弦变换，得到整数离散余弦变换系数，所述整数离散余弦变换矩阵非正交可逆；

对所述整数离散余弦变换系数进行点乘，得到所述变换系数。
一种视频编码装置，其特征在于，所述装置包括：

存储器，用于存储程序指令；

处理器，用于根据所述存储器中存储的程序指令执行以下操作：

对当前预测模式的预测残差进行离散余弦变换，得到变换系数；其中，所述预测残差为原始图像与预测图像的像素值之差，所述预测图像为根据帧间预测模式或帧内预测模式预测得到，所述帧间预测模式为利用时间上相邻的前一帧图像预测下一帧图像，所述帧内预测模式为利用当前帧内空间相关性预测当前帧图像；

对所述变换系数进行量化，得到量化系数；

对所述量化系数进行反量化，得到反量化系数；

根据所述变换系数和所述反量化系数之差得到所述当前预测模式的失真值；

根据所述当前预测模式的码率值和失真值得到所述当前预测模式代价值；

选取所述多种预测模式中代价值最小的预测模式为最优预测模式；

对所述最优预测模式的反量化系数进行反离散余弦变换，得到重建残差。
如权利要求9所述的装置，其特征在于，所述处理器执行所述根据所述当前预测模式的码率值和失真值得到所述当前预测模式代价值，包括：

根据所述当前预测模式的码率值和失真值通过率失真优化函数计算所述当前预测模式代价值，所述率失真优化函数用于权衡所述码率值和所述失真值。
如权利要求9所述的装置，其特征在于，所述处理器执行所述对当前预测模式的预测残差进行离散余弦变换，得到变换系数，包括：

通过离散余弦变换矩阵对所述当前预测模式的预测残差进行离散余弦变换，得到所述变换系数，所述离散余弦变换矩阵正交可逆。
如权利要求9所述的装置，其特征在于，所述处理器执行所述对当前预测模式的预测残差进行离散余弦变换，得到变换系数，包括：

通过整数离散余弦变换矩阵对所述当前预测模式的预测残差进行整数离散余弦变换，得到整数离散余弦变换系数，所述整数离散余弦变换矩阵非正交可逆；

对所述整数离散余弦变换系数进行点乘，得到所述变换系数。
一种计算机存储介质，其特征在于，所述计算机存储介质存储有程序，所述程序执行的步骤包括如权利要求1—4中任一项所述的步骤。