CN1564602A

CN1564602A - 视频编码的整数变换矩阵选择方法及相关的整数变换方法

Info

Publication number: CN1564602A
Application number: CNA2004100128571A
Authority: CN
Inventors: 朱光喜; 田晓华; 王曜; 刘文予; 喻莉
Original assignee: Huazhong University of Science and Technology
Current assignee: Huazhong University of Science and Technology
Priority date: 2004-03-18
Filing date: 2004-03-18
Publication date: 2005-01-12
Anticipated expiration: 2024-03-18
Also published as: KR100636225B1; KR20060043435A; CN100433837C

Abstract

本发明属于图象处理技术，特别涉及视频编解码器中图像数据压缩的整数变换，针对当前我国将要制定的第一个音视频编码标准(AVS)采用8乘8整数类DCT变换，提出了一种整数变换的变换基选择方法，综合评价变换基的去相关效率和能量集中率两项指标及变换基变换动态范围和计算复杂度，并通过此方法提出两组性能优异的8乘8整数变换基(5，6，4，1)和(4，5，3，1)，并得到基于这两组基的整数变换快速算法。

Description

视频编码的整数变换矩阵选择方法及相关的整数变换方法

技术领域

本发明属于图象处理技术，特别涉及视频编解码器中图像数据压缩的整数变换。主要包括整数变换的变换基(变换矩阵)的选择方法和基于选定变换基的块变换的实现方法。

背景技术

现有的国际视频标准如H.264、运动图象专家组MPEG-4中，视频信号被按层次划分为序列、帧、条带、宏块、块；最小的处理单元为块。在编码端，通过帧内预测或帧间预测，得到块的预测残差并作块变换，将能量集中到少数几个系数中；再通过量化、扫描、游程编码和熵编码，将图像数据压缩并写入编码码流。在解码端则过程相反，从码流中提取出熵编码的块变换系数，通过反量化和反变换，恢复出块的预测残差，结合预测信息，最终恢复出块的视频数据。在编解码流程中，变换模块是视频压缩的基础，变换性能直接影响编解码器的综合性能。

早期的国际标准如MPEG-1、H.261采用离散余弦变换DCT。DCT自从1974年提出后，在图像和视频编码领域得到了广泛的应用，其变换性能在所有次优变换中非常显著，能极大地去除图像元素在变换域中的相关性，为高效率的图像压缩奠定了基础。但由于DCT的变换矩阵是用浮点数表示，浮点运算量较大，占用较多***资源。为了提高变换效率，又发展出用定点计算或者较大的整型变换逼近浮点运算DCT，由于存在精度误差，即使没有经过量化，反变换后也不能完全恢复图像数据，也就是编码的可逆性不强。整数变换的产生，同时解决了计算精度和编码效率的问题，其特点是用整数变换矩阵代替DCT的浮点数变换矩阵，这样变换过程完全是整数运算，不存在精度误差，保证了编码的可逆性；同时整数乘法可用加减法和位移代替，因此变换过程可以完全通过加减法和位移实现，运算量大幅度降低。最新的国际标准H.264/MPEG-4 Part 10就采用整数变换，并取得了非常好的变换效果。近年来，在图像和视频处理领域有不少针对整数变换的研究，已有的关于整数变换的国外专利主要有：

1.U.S.Patent No.5999957A“Lossless Transform System For Digital Signals”；该专利通过对DCT变换矩阵的每一行乘以固定数值，再取整近似，将变换矩阵系数变为整数以实现可逆变换。该变换矩阵推导过程没有考虑变换的正交性，不能保证整数变换是正交变换，从而影响到变换性能。而且量化过程有多次乘除法，计算复杂。快速变换算法中有多次乘法，影响变换效率。

2.WO 01/08001A1“Integer Cosine Transform Using Integer Operations”；

3.U.S.Patent No.20020111979A1“Integer Transform Matrix For PictureCoding”；该专利给出一种整数变换矩阵变换性能的评价方法，主要通过比较与DCT变换矩阵的近似程度，该方法保证变换的正交性。专利给出了4乘4、8乘8、16乘16三种情况下理论上最好的变换矩阵。该方法也没有考虑计算复杂度对变换性能的影响，而且为了保证每一行或列的矢量范式相同，所选出的变换矩阵的性能并不是最接近DCT的。

4.U.S.Patent No.2003/0093452A1“Video Block Transform”；该专利给出基于H.26L的4乘4块的正交和非正交形式的整数变换、反变换矩阵，宏块直流系数变换矩阵和正交变换对应的量化步长。该专利的变换矩阵尺度与本发明不同，小尺度的变换矩阵不适合高清晰度电视等应用。

8乘8离散余弦可以用以下公式表示：

其中

C (0) = 1 / \sqrt{2},

C(w)＝1，(w＝1，…，7)。用矩阵的形式可以表示为：Y＝P₀XP₀ ^T，其中X为8乘8像素预测残差矩阵，Y为变换后的矩阵。

P_{0} = [\begin{matrix} a & a & a & a & a & a & a & a \\ b & d & e & g & - g & - e & - d & - b \\ c & f & - f & - c & - c & - f & f & c \\ d & - g & - b & - e & e & b & g & - d \\ a & - a & - a & a & a & - a & - a & a \\ e & - b & g & d & - d & - g & b & - e \\ f & - c & c & - f & - f & c & - c & f \\ g & - e & d & - b & b & - d & e & - g \end{matrix}],

其中

a = \frac{1}{2 \sqrt{2}}

b = \frac{1}{2} \cos (\frac{π}{16})

c = \frac{1}{2} \cos (\frac{2 π}{16})

d = \frac{1}{2} \cos (\frac{3 π}{16})

e = \frac{1}{2} \cos (\frac{5 π}{16})

f = \frac{1}{2} \cos (\frac{6 π}{16})

s = \frac{1}{2} \cos (\frac{7 π}{16})

根据国际标准H.264对4×4DCT变换的改写过程，可以改写8×8变换如下：从P₀的每一行提出一个公共系数，得到向量V₈＝[a，m，f，m，a，m，f，m]，其中m为矩阵P₀的偶数行提出的公共系数，m的取值为不大于k4的正数。则变换矩阵改写为：

P_{1} = [\begin{matrix} 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 \\ k 1 & k 2 & k 3 & k 4 & - k 4 & - k 3 & - k 2 & - k 1 \\ k 5 & 1 & - 1 & - k 5 & - k 5 & - 1 & 1 & k 5 \\ k 2 & - k 4 & - k 1 & - k 3 & k 3 & k 1 & k 4 & - k 2 \\ 1 & - 1 & - 1 & 1 & 1 & - 1 & - 1 & 1 \\ k 3 & - k 1 & k 4 & k 2 & - k 2 & - k 4 & k 1 & - k 3 \\ 1 & - k 5 & k 5 & - 1 & - 1 & k 5 & - k 5 & 1 \\ k 4 & - k 3 & k 2 & - k 1 & k 1 & - k 2 & k 3 & - k 4 \end{matrix}],

k1＝b/mk2＝d/m其中k3＝e/mk4＝g/mk5＝c/f令矩阵E₈＝V₈ ^TV₈，是8乘8矩阵，则变换进一步改写为：

Y＝P₁XP₁ ^TE₈ (2)

其中表示两个矩阵的叉乘(即相同位置的元素对应相乘)。对于(2)式可以将与矩阵E₈的叉乘运算和量化操作放到一起，使变换得到简化。因此变换的重点在于P₁XP₁ ^T的计算，其中X是8×8的像素预测残差矩阵，为整形数据。如果P₁中的变量k1，k2，k3，k4，k5都为整数，则整个变换将全部转化为整数运算。所以下面的工作就需要确定k1，k2，k3，k4，k5等五个参数的选值。本发明通过大量实验证明，当选定k1，k2，k3，k4后，k5取2时的变换性能最好，Cham在他的文章(Development of Integer Cosine Transform by the Principle of DyadicSymmetry.IEE Proceedings，1989，136(4)：276-288)也提出了相似的结论。因而本发明将k5固定取值为2，仅研究其余四个参数的选择，并定义(k1，k2，k3，k4)为整数变换的变换基。对应的变换矩阵P为

P = [\begin{matrix} 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 \\ k 1 & k 2 & k 3 & k 4 & - k 4 & - k 3 & - k 4 & - k 1 \\ 2 & 1 & - 1 & - 2 & - 2 & - 1 & 1 & 2 \\ k 2 & - k 4 & - k 1 & - k 3 & k 3 & k 1 & k 4 & - k 2 \\ 1 & - 1 & - 1 & 1 & 1 & - 1 & - 1 & 1 \\ k 3 & - k 1 & k 4 & k 2 & - k 2 & - k 4 & k 1 & - k 3 \\ 1 & - 2 & 2 & - 1 & - 1 & 2 & - 2 & 1 \\ k 4 & - k 3 & k 2 & - k 1 & k 1 & - k 2 & k 3 & - k 4 \end{matrix}]

发明内容

本发明提出了一种视频编码的整数变换矩阵选择方法及相关的整数变换方法，针对当前我国将要制定的第一个音视频编码标准(AVS)采用8乘8整数类DCT变换，提出了一种整数变换的变换基选择方法，综合评价变换基的去相关效率和能量集中率两项指标及变换基变换动态范围和计算复杂度，并通过此方法提出两组性能优异的8乘8整数变换基(5，6，4，1)和(4，5，3，1)，并得到基于这两组基的整数变换快速算法。

变换基的选择主要基于以下几项原则：

原则1：变换正交性。正交变换的特性保证变换仅仅是对坐标系的旋转，而图像的能量维持不变。为了保证变换的正交性，公式(2)中的P必须满足下式条件：

P·P^T＝Diag (3)

其中Diag为对角阵，即其非主对角线元素为零。量化过程再通过调整量化矩阵，使变换满足正交性。

原则2：能量集中性。DCT交换的目的在于去除元素之间的相关性，使变换后的能量尽可能集中在少数系数上，以便提高量化后熵编码的压缩效率。整数变换基的选择同样也需要遵循这一原则。

原则3：快速变换算法简单性。要求变换基数值不能太大，快速算法的计算次数尽可能少。

本发明的一种视频编码的整数变换矩阵选择方法，依次包括如下步骤：

(1)首先搜索在一定范围内满足正交条件的所有整数变换基，对于8乘8整数变换矩阵P，定义变换基为(k1，k2，k3，k4)，

P = [\begin{matrix} 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 \\ k 1 & k 2 & k 3 & k 4 & - k 4 & - k 3 & - k 2 & - k 1 \\ 2 & 1 & - 1 & - 2 & - 2 & - 1 & 1 & 2 \\ k 2 & - k 4 & - k 1 & - k 3 & k 3 & k 1 & k 4 & - k 2 \\ 1 & - 1 & - 1 & 1 & 1 & - 1 & - 1 & 1 \\ k 3 & - k 1 & k 4 & k 2 & - k 2 & - k 4 & k 1 & - k 3 \\ 1 & - 2 & 2 & - 1 & - 1 & 2 & - 2 & 1 \\ k 4 & - k 3 & k 2 & - k 1 & k 1 & - k 2 & k 3 & - k 4 \end{matrix}]

变换基系数k1、k2、k3、k4的取值范围为k1、k2、k3∈[1，10]，k4∈[1，4]，得到所有满足P·P^T＝Diag的整数正交变换基；

(2)建立输入图像残差数据在互相关系数ρ取0.75、0.8、0.85、0.9、0.95时的协方差矩阵COV(X_v)，

设长度为8的图像残差数据一维向量为X_v＝[x₁，x₂，...x₈]，由一阶马尔科夫模型建立X_v元素的协方差矩阵COV(X_v)，COV(X_v)_(i，j)＝ρ^|i-j|(0≤i，j≤7)，其中ρ为X_v相邻元素的互相关系数(ρ≤1)，

(3)通过变换基对应的变换矩阵P，得到变换域的协方差矩阵COV(Y_v)，

变换基(k1，k2，k3，k4)对应的变换矩阵P，归一化，即P每一行元素除以该行向量的长度，得到正交矩阵P_u。对X_v作正交变换Y_v＝P_uX_v，Y_v的协方差矩阵为：

COV(Y_v)＝P_u·COV(X_v)·P_u ^T (4)

(4)通过(2)、(3)计算各组变换基在互相关系数ρ取0.75、0.8、0.85、0.9、0.95时的能量集中率η_E值和去相关效率η_C值，

定义能量集中率η_E为：

η_{E} = \frac{1}{\sqrt[8]{Π_{i = l}^{8} COV (Y_{v})_{(i, j)}}} - - - (5)

去相关效率η_c为：

η_{c} = 1 - \frac{\underset{j &NotEqual; k}{Σ} | COV (Y_{v})_{(j, k)} |}{\underset{j &NotEqual; k}{Σ} | COV {(X_{v})}_{(j, k)} |} - - - (6)

(5)计算各个变换基在指定的互相关系数ρ下的能量集中率η_E值和去相关效率η_C归一化的结果，同一个ρ下，第i个变换基能量集中率η_E的归一化结果为：

{Eval}_{E (i)} = \frac{η_{E (i)} - Min (η_{E (j)})}{Max (η_{E (j)}) - Min (η_{E (j)})} - - - (7)

第i个变换基去相关效率η_C的归一化结果为：

{Eval}_{c (i)} = \frac{η_{c (i)} - Min (η_{c (j)})}{Max (η_{c (j)}) - Min (η_{c (j)})} - - - (8)

(6)通过加权求和，得到每组基在各个互相关系数ρ下能量集中率η_E值、去相关效率ηC综合的评价结果Eval_E、、、Eval_C，5点ρ对应的权重分别为1/15、2/15、3/15、4/15、5/15；

(7)通过对Eval_C和Eval_E这两项指标加权求和，得到变换基性能的综合评价值Eval，Eval_C和Eval_E对应的权重分别为0.4、0.6。

所述的视频编码的整数变换矩阵选择方法，其进一步特征在于得到变换基性能的综合评价值Eval后，增加对变换基(k1，k2，k3，k4)的计算复杂度的评价步骤：首先选择综合评价值Eval较高的变换基；如果Eval差距小于0.02，在实时性要求较高的应用中优先考虑计算复杂度有明显优势即加减法和位移次数少的变换基。

本发明的一种视频编码的整数变换方法，在编码端，通过帧内预测或帧间预测，得到块的预测残差并作块变换，将能量集中到少数几个系数中；再通过量化、扫描、游程编码和熵编码，将图像数据压缩并写入编码码流；在解码端则从码流中提取出熵编码的块变换系数，通过反量化和反变换，恢复出块的预测残差，结合预测信息，恢复出块的视频数据；其特征在于：

(1)视频编码中8乘8整数变换采用的变换矩阵P由前述视频编码的整数变换矩阵选择方法得到，如下式：

P = [\begin{matrix} 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 \\ 5 & 6 & 4 & 1 & - 1 & - 4 & - 6 & - 5 \\ 2 & 1 & - 1 & - 2 & - 2 & - 1 & 1 & 2 \\ 6 & - 1 & - 5 & - 4 & 4 & 5 & 1 & - 6 \\ 1 & - 1 & - 1 & 1 & 1 & - 1 & - 1 & 1 \\ 4 & - 5 & 1 & 6 & - 6 & - 1 & 5 & - 4 \\ 1 & - 2 & 2 & - 1 & - 1 & 2 & - 2 & 1 \\ 1 & - 4 & 6 & - 5 & 5 & - 6 & 4 & - 1 \end{matrix}]

相应的整数变换基为(5，6，4，1)；

(2)正变换，对8乘8的图像残差数据块做整数变换，形如Y＝PXP^T，变换的基本单元是形如y＝Px的8点一维变换，其中x＝[x0，x1，x2，x3，x4，x5，x6，x7]^T，输出的y＝[y0，y1，y2，y3，y4，y5，y6，y7]^T，计算过程如下：

A.a0＝x0-x7，a1＝x1-x6，a2＝x2-x5，a3＝x3-x4，a4＝x0+x7，a5＝x1+x6，a6＝x2+x5，a7＝x3+x4；

B.b0＝a4+a7，b1＝a5+a6，b2＝a4-a7，b3＝a5-a6；

C.y0＝b0+b1，y4＝b0-b1，y2＝b2<<1+b3，y6＝b2-b3<<1；

再完成相当计算下式的计算步骤：

[\begin{matrix} y 1 \\ y 3 \\ y 5 \\ y 7 \end{matrix}] = [\begin{matrix} k 1 & k 2 & k 3 & k 4 \\ k 2 & - k 4 & - k 1 & - k 3 \\ k 3 & - k 1 & k 4 & k 2 \\ k 4 & - k 3 & k 2 & - k 1 \end{matrix}] = [\begin{matrix} a 0 \\ a 1 \\ a 2 \\ a 3 \end{matrix}],

D.c0＝a0<<2+a0+a3；c1＝a2-a1-a1<<2；c2＝a1+a2+a2<<2；c3＝a3<<2+a3-a0；

E.y1＝c0-c1+c2；y3＝c0-c2-c3；y5＝c0+c1+c3；y7＝c1+c2-c3；

(3)反变换，令一维变换基本单元为x＝P^Ty。其中y＝[y0，y1，y2，y3，y4，y5，y6，y7]^T，x＝[x0，x1，x2，x3，x4，x5，x6，x7]^T.一维反变换为：

A.m0＝y0+y4；m1＝y0-y4；m2＝y2<<1+y6；m3＝y2-y6<<1；

B.b0＝m0+m2；b1＝m1+m3；b2＝m1-m3；b3＝m0-m2；

C.计算下式的4乘4矩阵乘法：

[\begin{matrix} a 0 \\ a 1 \\ a 2 \\ a 3 \end{matrix}] = [\begin{matrix} k 1 & k 2 & k 3 & k 4 \\ k 2 & - k 4 & - k 1 & - k 3 \\ k 3 & - k 1 & k 4 & k 2 \\ k 4 & - k 3 & k 2 & - k 1 \end{matrix}] [\begin{matrix} y 1 \\ y 3 \\ y 5 \\ y 7 \end{matrix}]

计算过程与正变换的4乘4矩阵乘法完全相同，只是输入输出数据向量交换；

D.x0＝a0+b0；x1＝a1+b1；x2＝a2+b2；x3＝a3+b3；

x7＝-a0+b0；x6＝-a1+b1；x5＝-a2+b2；x4＝-a3+b3；

其中“<<”表示向左位移运算，其优先级高于加减法，“a<<b”表示a向左位移b位。

本发明的又一种视频编码的整数变换方法，在编码端，通过帧内预测或帧间预测，得到块的预测残差并作块变换，将能量集中到少数几个系数中；再通过量化、扫描、游程编码和熵编码，将图像数据压缩并写入编码码流；在解码端则从码流中提取出熵编码的块变换系数，通过反量化和反变换，恢复出块的预测残差，结合预测信息，恢复出块的视频数据；其特征在于：

(1)视频编码中8乘8整数变换采用的变换矩阵P由前述视频编码的整数变换矩阵选择方法得到，也可以如下式：

[\begin{matrix} 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 \\ 4 & 5 & 3 & 1 & - 1 & - 3 & - 5 & - 4 \\ 2 & 1 & - 1 & - 2 & - 2 & - 1 & 1 & 2 \\ 5 & - 1 & - 4 & - 3 & 3 & 4 & 1 & - 5 \\ 1 & - 1 & - 1 & 1 & 1 & - 1 & - 1 & 1 \\ 3 & - 4 & 1 & 5 & - 5 & - 1 & 4 & - 3 \\ 1 & - 2 & 2 & - 1 & - 1 & 2 & - 2 & 1 \\ 1 & - 3 & 5 & - 4 & 4 & - 5 & 3 & - 1 \end{matrix}]

相应的整数变换基为(4，5，3，1)；

(2)正变换，对8乘8的图像残差数据块做整数变换，形如Y＝PXP^T，变换的基本单元是形如y＝Px的8点一维变换，其中x＝[x0，x1，x2，x3，x4，x5，x6，x7]^T，输出的y＝[y0，y1，y2，y3，y4，y5，y6，y7]^T。计算过程如下：

A.a0＝x0-x7，a1＝x1-x6，a2＝x2-x5，a3＝x3-x4，a4＝x0+x7，a5＝x1+x6，a6＝x2+x5，

a7＝x3+x4；

B.b0＝a4+a7，b1＝a5+a6，b2＝a4-a7，b3＝a5-a6；

C.y0＝b0+b1，y4＝b0-b1，y2＝b2<<1+b3，y6＝b2-b3<<1；

再完成相当计算下式的计算步骤：

[\begin{matrix} y 1 \\ y 3 \\ y 5 \\ y 7 \end{matrix}] = [\begin{matrix} k 1 & k 2 & k 3 & k 4 \\ k 2 & - k 4 & - k 1 & - k 3 \\ k 3 & - k 1 & k 4 & k 2 \\ k 4 & - k 3 & k 2 & - k 1 \end{matrix}] [\begin{matrix} a 0 \\ a 1 \\ a 2 \\ a 3 \end{matrix}],

D.c0＝a0<<2+a3；c1＝a2-a1<<2；c2＝a1+a2<<2；c3＝a3<<2-a0；

E.y1＝c0-c1+c2；y3＝c0-c2-c3；y5＝c0+c1+c3；y7＝c1+c2-c3；

(3)反变换：

令一维变换基本单元为x＝P^Ty。其中y＝[y0，y1，y2，y3，y4，y5，y6，y7]^T，

x＝[x0，x1，x2，x3，x4，x5，x6，x7]^T.一维反变换为：

A.m0＝y0+y4；m1＝y0-y4；m2＝y2<<1+y6；m3＝y2-y6<<1；

B.b0＝m0+m2；b1＝m1+m3；b2＝m1-m3；b3＝m0-m2；

C.计算下式的4乘4矩阵乘法：

[\begin{matrix} a 0 \\ a 1 \\ a 2 \\ a 3 \end{matrix}] = [\begin{matrix} k 1 & k 2 & k 3 & k 4 \\ k 2 & - k 4 & - k 1 & - k 3 \\ k 3 & - k 1 & k 4 & k 2 \\ k 4 & - k 3 & k 2 & - k 1 \end{matrix}] [\begin{matrix} y 1 \\ y 3 \\ y 5 \\ y 7 \end{matrix}]

快速算法的计算过程与正变换的4乘4矩阵乘法完全相同，只是输入输出数据向量交换；

D.x0＝a0+b0；x1＝a1+b1；x2＝a2+b2；x3＝a3+b3；

x7＝-a0+b0；x6＝-a1+b1；x5＝-a2+b2；x4＝-a3+b3；

本发明提出了一种整数变换基性能的综合评价方法，并依据这一方法筛选出几组性能较好的变换基，并给出两组变换基的快速变换方法。高清晰度视频测试序列的实测结果证明本法明优选的几组变换基的性能优于JVT的ABT 8乘8变换，其中(10，9，6，2)的变换性能最好，(4，5，3，1)的计算复杂度最低，(5，6，4，1)的性能介于两者之间。相对于ABT 8乘8变换，这3组基在变换性能和计算复杂度等两方面都具有一定优势。所选变换基的实测性能也验证了本发明变换基选择方法的准确性和可行性，该方法不仅仅适用于整数变换矩阵，还可用于对各类变换矩阵的性能评估，对于变换矩阵的选择具有很强的指导意义。

说明书附图

图1：变换基评价流程框图。

图2：变换基(5，6，4，1)正变换快速算法。

图3：变换基(5，6，4，1)反变换快速算法。

图4：变换基(4，5，3，1)正变换快速算法。

图5：变换基(4，5，3，1)反变换快速算法。

具体实施方式

(一)变换基的选择

变换基的评价流程如图1所示。

各类图像残差数据的互相关系数ρ主要分布在0.75～0.95之间，通过计算ρ为0.75、0.8、0.85、0.9、0.95五点的每个变换基对应的能量集中率η_E，再将同一ρ下各个基的η_E归一化。对同一变换基在不同互相关系数ρ下η_E归一化结果加权求和，得到该组基能量集中率的综合评价值Eval_E，其中权重是根据不同ρ的概率大小决定。本发明中取五点ρ对应的权重依次为1/15、2/15、3/15、4/15、5/15。同理得到变换基的去相关效率η_c的综合评价结果Eval_C。

最后通过对Eval_E和Eval_C加权求和得到变换基能量集中率和去相关效率的综合评价值Eval。考虑到能量集中率直接影响变换后的压缩性能，权重略大，本发明中定义能量集中率和去相关效率评价值的权重分别为：0.6、0.4。

当综合评价值Eval接近时，计算复杂度低的变换基的性能更好。

下表中列出了变换基的取值范围为k1、k2、k3∈[1，10]，k4∈[1，4]时，5组基的η_E和η_c综合评价值、完成一次一维8点变换所需要的加法和位移次数(正反变换的远算次数相同)。

k1、k2、k3、 η_E和η_c综合

加法次数+/-位移次数<<

k4 评价值

10，9，6，2 0.9859 36 10

5，6，4，1 0.8579 32 6

6，6，3，2 0.8441 36 10

6，7，5，1 0.8409 32 10

4，5，3，1 0.8249 28 6

(10，9，6，2)和(6，6，3，2)在有关文献中已被提出。(5，6，4，1)的去相关效率和能量集中率的综合评价值仅次于(10，9，6，2)，而且计算复杂度较小，(4，5，3，1)的综合评价值略低于(6，6，3，2)，但计算复杂度优势最明显。实际的视频序列测试结果表明(5，6，4，1)、(4，5，3，1)、(6，7，5，1)的率失真性能优于(6，6，3，2)，与(10，9，6，2)很接近。(二)8×8整数变换快速算法的实现

图2-图5中x0、x1、x2、x3、x4、x5、x6、x7表示整数变换的一维正变换的输入八点数值，同时是反变换的八点输出数值；y0、y1、y2、y3、y4、y5、y6、y7为正变换的八点输出数值，同时是反变换的八点输出数值。数据处理方向从左向右，相交于一圆点的两线表示两数据相加，三线表示三个数据相加。方形表示数据乘一个系数，其中“-”表示取负值，“2”表示乘2，即左移一位，“4”表示乘4，即左移两位。

1.正变换

对8x8的图像残差数据块做整数变换，变换的基本单元是形如y＝Px的8点一维变换，设x＝[x0，x1，x2，x3，x4，x5，x6，x7]^T，输出的y＝[y0，y1，y2，y3，y4，y5，y6，y7]^T。计算过程如下：

首先计算用各个不同变换矩阵P作变换时，相同的计算步骤：

(1)a0＝x0-x7，a1＝x1-x6，a2＝x2-x5，a3＝x3-x4，a4＝x0+x7，a5＝x1+x6，a6＝x2+x5，a7＝x3+x4；

(2)b0＝a4+a7，b1＝a5+a6，b2＝a4-a7，b3＝a5-a6；

(3)y0＝b0+b1，y4＝b0-b1，y2＝b2<<1+b3，y6＝b2-b3<<1；

相同部分计算需要加减法16次，位移2次。

再计算不同的计算步骤，该部分相当于计算下式：

[\begin{matrix} y 1 \\ y 3 \\ y 5 \\ y 7 \end{matrix}] = [\begin{matrix} k 1 & k 2 & k 3 & k 4 \\ k 2 & - k 4 & - k 1 & - k 3 \\ k 3 & - k 1 & k 4 & k 2 \\ k 4 & - k 3 & k 2 & - k 1 \end{matrix}] [\begin{matrix} a 0 \\ a 1 \\ a 2 \\ a 3 \end{matrix}],

对于变换基(5，6，4，1)计算步骤为：

(1)c0＝a0<<2+a0+a3；c1＝a2-a1-a1<<2；c2＝a1+a2+a2<<2；c3＝a3<<2+a3-a0；

(2)y1＝c0-c1+c2；y3＝c0-c2-c3；y5＝c0+c1+c3；y7＝c1+c2-c3；

共需要16次加减法和4次位移。

对于变换基(4，5，3，1)计算步骤为：

(1)c0＝a0<<2+a3；c1＝a2-a1<<2；c2＝a1+a2<<2；c3＝a3<<2-a0；

(2)y1＝c0-c1+c2；y3＝c0-c2-c3；y5＝c0+c1+c3；y7＝c1+c2-c3；

共需要12次加减法和4次位移。

因此对于变换基(5，6，4，1)完成一次y＝Px运算，共用32次加减法和6次位移；变换基(4，5，3，1)共用28次加减法和6次位移。完成一次8×8块的整数变换的运算量是上述单元计算量的16倍。(5，6，4，1)正变换的快速算法如图2所示，(4，5，3，1)正变换的快速算法如图4所示。

2.反变换

令一维变换基本单元为x＝P^Ty。

其中y＝[y0，y1，y2，y3，y4，y5，y6，y7]^T，x＝[x0，x1，x2，x3，x4，x5，x6，x7]^T.下述过程为一次x＝P^Ty运算。

(1)m0＝y0+y4；m1＝y0-y4；m2＝y2<<1+y6；m3＝y2-y6<<1；

(2)b0＝m0+m2；b1＝m1+m3；b2＝m1-m3；b3＝m0-m2；

(3)计算下式的4乘4矩阵乘法：

[\begin{matrix} a 0 \\ a 1 \\ a 2 \\ a 3 \end{matrix}] = [\begin{matrix} k 1 & k 2 & k 3 & k 4 \\ k 2 & - k 4 & - k 1 & - k 3 \\ k 3 & - k 1 & k 4 & k 2 \\ k 4 & - k 3 & k 2 & - k 1 \end{matrix}] [\begin{matrix} y 1 \\ y 3 \\ y 5 \\ y 7 \end{matrix}]

计算式和正变换中4×4矩阵乘法完全相同，算法一样，只是输入输出数据向量交换。计算量相同。对于变换基(5，6，4，1)需要16次加减法和4次位移；

对于变换基(4，5，3，1)需要12次加减法和4次位移。

(4)x0＝a0+b0；x1＝a1+b1；x2＝a2+b2；x3＝a3+b3；

x7＝-a0+b0；x6＝-a1+b1；x5＝-a2+b2；x4＝-a3+b3；

其中“<<”表示向左位移运算，其优先级高于加减法，“a<<b”表示a向左位移b位，不同变换基公共部分计算量为：加减法16次，位移2次。因此对于变换基(5，6，4，1)完成一次x＝P^Ty运算，共用32次加减法和6次位移；变换基(4，5，3，1)共用28次加减法和6次位移。(5，6，4，1)反变换的快速算法如图3所示，(4，5，3，1)反变换的快速算法如图5所示。完成一次8乘8块的整数变换反变换的运算量是上述单元计算量的16倍。

Claims

1.一种视频编码的整数变换矩阵选择方法，依次包括如下步骤：

P = [\begin{matrix} 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 \\ k 1 & k 2 & k 3 & k 4 & - k 4 & - k 3 & - k 2 & - k 1 \\ 2 & 1 & - 1 & - 2 & - 2 & - 1 & 1 & 2 \\ k 2 & - k 4 & - k 1 & - k 3 & k 3 & k 1 & k 4 & - k 2 \\ 1 & - 1 & - 1 & 1 & 1 & - 1 & - 1 & 1 \\ k 3 & - k 1 & k 4 & k 2 & - k 2 & - k 4 & k 1 & - k 3 \\ 1 & - 2 & 2 & - 1 & - 1 & 2 & - 2 & 1 \\ k 4 & - k 3 & k 2 & - k 1 & k 1 & - k 2 & k 3 & - k 4 \end{matrix}]

变换基系数k1、k2、k3、k4的取值范围为k1、k2、k3∈[1，10]，k4∈[1，4]，得到所有满足P·P^T＝Diag的整数正交变换基，其中Diag为对角阵；

设长度为8的图像残差数据一维向量为X_V＝[x₁，x₂，…x₈]，由一阶马尔科夫模型建立X_V元素的协方差矩阵COV(X_v)，COV(X_v)_(i，j)＝ρ^|i-j|(0≤i，j≤7)，其中ρ为X_V相邻元素的互相关系数(ρ≤1)；

COV (Y_{v}) = P_{u} \cdot COV (X_{v}) \cdot {P_{u}}^{T}

定义能量集中率η_E为：

η_{E} = \frac{1}{\sqrt[8]{Π_{i = 1}^{8} COV {(Y_{v})}_{(i, i)}}}

去相关效率η_c为：

η_{c} = 1 - \frac{\underset{j &NotEqual; k}{Σ} | COV {(Y_{v})}_{(j, k)} |}{\underset{j &NotEqual; k}{Σ} | COV {(X_{v})}_{(j, k)} |}

{Eval}_{E (i)} = \frac{η_{E (i)} - Min (η_{E (j)})}{Max (η_{E (j)}) - Min (η_{E (j)})}

第i个变换基去相关效率η_C的归一化结果为：

{Eval}_{c (i)} = \frac{η_{c (i)} - Min (η_{c (j)})}{Max (η_{c (j)}) - Min (η_{c (j)})}

(6)通过加权求和，得到每组基在各个互相关系数ρ下能量集中率η_E值、去相关效率η_C综合的评价结果Eval_E、、、Eval_C，5点ρ对应的权重分别为1/15、2/15、3/15、4/15、5/15；

2.如权利要求1所述的视频编码的整数变换矩阵选择方法，其特征在于得到变换基性能的综合评价值Eval后，增加对变换基(k1，k2，k3，k4)的计算复杂度的评价步骤：首先选择综合评价值Eval较高的变换基；如果Eval差距小于0.02，在实时性要求较高的应用中优先考虑计算复杂度有明显优势即加减法和位移次数少的变换基。

3.一种视频编码的整数变换方法，在编码端，通过帧内预测或帧间预测，得到块的预测残差并作块变换，将能量集中到少数几个系数中；再通过量化、扫描、游程编码和熵编码，将图像数据压缩并写入编码码流；在解码端则从码流中提取出熵编码的块变换系数，通过反量化和反变换，恢复出块的预测残差，结合预测信息，恢复出块的视频数据；其特征在于：

(1)视频编码中8乘8整数变换采用的变换矩阵P由权利要求1或2所述视频编码的整数变换矩阵选择方法得到，如下式：

P = [\begin{matrix} 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 \\ 5 & 6 & 4 & 1 & - 1 & - 4 & - 6 & - 5 \\ 2 & 1 & - 1 & - 2 & - 2 & - 1 & 1 & 2 \\ 6 & - 1 & - 5 & - 4 & 4 & 5 & 1 & - 6 \\ 1 & - 1 & - 1 & 1 & 1 & - 1 & - 1 & 1 \\ 4 & - 5 & 1 & 6 & - 6 & - 1 & 5 & - 4 \\ 1 & - 2 & 2 & - 1 & - 1 & 2 & - 2 & 1 \\ 1 & - 4 & 6 & - 5 & 5 & - 6 & 4 & - 1 \end{matrix}]

相应的整数变换基为(5，6，4，1)；

B.b0＝a4+a7，b1＝a5+a6，b2＝a4-a7，b3＝a5-a6；

C.y0＝b0+b1，y4＝b0-b1，y2＝b2＜＜1+b3，y6＝b2-b3＜＜1；

再完成相当计算下式的计算步骤：

[\begin{matrix} y 1 \\ y 3 \\ y 5 \\ y 7 \end{matrix}] = [\begin{matrix} k 1 & k 2 & k 3 & k 4 \\ k 2 & - k 4 & - k 1 & - k 3 \\ k 3 & - k 1 & k 4 & k 2 \\ k 4 & - k 3 & k 2 & - k 1 \end{matrix}] [\begin{matrix} a 0 \\ a 1 \\ a 2 \\ a 3 \end{matrix}],

D.c0＝a0＜＜2+a0+a3；c1＝a2-a1-a1＜＜2；c2＝a1+a2+a2＜＜2；c3＝a3＜＜2+a3-a0；

E.y1＝c0-c1+c2；y3＝c0-c2-c3；y5＝c0+c1+c3；y7＝c1+c2-c3；

(3)反变换：

令一维变换基本单元为x＝Py，其中y＝[y0，y1，y2，y3，y4，y5，y6，y7]^T，x＝[x0，x1，x2，x3，x4，x5，x6，x7]^T。一维反变换为：

A.m0＝y0+y4；m1＝y0-y4；m2＝y2＜＜1+y6；m3＝y2-y6＜＜1；

B.b0＝m0+m2；b1＝m1+m3；b2＝m1-m3；b3＝m0-m2；

C.计算下式的4乘4矩阵乘法：

[\begin{matrix} a 0 \\ a 1 \\ a 2 \\ a 3 \end{matrix}] = [\begin{matrix} k 1 & k 2 & k 3 & k 4 \\ k 2 & - k 4 & - k 1 & - k 3 \\ k 3 & - k 1 & k 4 & k 2 \\ k 4 & - k 3 & k 2 & - k 1 \end{matrix}] [\begin{matrix} y 1 \\ y 3 \\ y 5 \\ y 7 \end{matrix}]

D.x0＝a0+b0；x1＝a1+b1；x2＝a2+b2；x3＝a3+b3；

x7＝-a0+b0；x6＝-a1+b1；x5＝-a2+b2；x4＝-a3+b3；

其中“＜＜”表示向左位移运算，其优先级高于加减法，如“a＜＜b”表示a向左位移b位。

4.一种视频编码的整数变换方法，在编码端，通过帧内预测或帧间预测，得到块的预测残差并作块变换，将能量集中到少数几个系数中；再通过量化、扫描、游程编码和熵编码，将图像数据压缩并写入编码码流；在解码端则从码流中提取出熵编码的块变换系数，通过反量化和反变换，恢复出块的预测残差，结合预测信息，恢复出块的视频数据；其特征在于：

[\begin{matrix} 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 \\ 4 & 5 & 3 & 1 & - 1 & - 3 & - 5 & - 4 \\ 2 & 1 & - 1 & - 2 & - 2 & - 1 & 1 & 2 \\ 5 & - 1 & - 4 & - 3 & 3 & 4 & 1 & - 5 \\ 1 & - 1 & - 1 & 1 & 1 & - 1 & - 1 & 1 \\ 3 & - 4 & 1 & 5 & - 5 & - 1 & 4 & - 3 \\ 1 & - 2 & 2 & - 1 & - 1 & 2 & - 2 & 1 \\ 1 & - 3 & 5 & - 4 & 4 & - 5 & 3 & - 1 \end{matrix}]

相应的整数变换基为(4，5，3，1)；

B.b0＝a4+a7，b1＝a5+a6，b2＝a4-a7，b3＝a5-a6；

C.y0＝b0+b1，y4＝b0-b1，y2＝b2＜＜1+b3，y6＝b2-b3＜＜1；再完成相当计算下式的计算步骤：

[\begin{matrix} y 1 \\ y 3 \\ y 5 \\ y 7 \end{matrix}] = [\begin{matrix} k 1 & k 2 & k 3 & k 4 \\ k 2 & - k 4 & - k 1 & - k 3 \\ k 3 & - k 1 & k 4 & k 2 \\ k 4 & - k 3 & k 2 & - k 1 \end{matrix}] [\begin{matrix} a 0 \\ a 1 \\ a 2 \\ a 3 \end{matrix}],

D.c0＝a0＜＜2+a3；c1＝a2-a1＜＜2；c2＝a1+a2＜＜2；c3＝a3＜＜2-a0；

E.y1＝c0-c1+c2；y3＝c0-c2-c3；y5＝c0+c1+c3；y7＝c1+c2-c3；

(3)反变换：

令一维变换基本单元为x＝Py，其中y＝[y0，y1，y2，y3，y4，y5，y6，y7]^T，x＝[x0，x1，x2，x3，x4，x5，x6，x7]^T，一维反变换为：

A.m0＝y0+y4；m1＝y0-y4；m2＝y2＜＜1+y6；m3＝y2-y6＜＜1；

B.b0＝m0+m2；b1＝m1+m3；b2＝m1-m3；b3＝m0-m2；

C.计算下式的4乘4矩阵乘法：

[\begin{matrix} a 0 \\ a 1 \\ a 2 \\ a 3 \end{matrix}] = [\begin{matrix} k 1 & k 2 & k 3 & k 4 \\ k 2 & - k 4 & - k 1 & - k 3 \\ k 3 & - k 1 & k 4 & k 2 \\ k 4 & - k 3 & k 2 & - k 1 \end{matrix}] [\begin{matrix} y 1 \\ y 3 \\ y 5 \\ y 7 \end{matrix}]

快速算法的计算过程与正变换的4乘4矩阵乘法完全相同，只是输入输出数据向量交换。

D.x0＝a0+b0；x1＝a1+b1；x2＝a2+b2；x3＝a3+b3；

x7＝-a0+b0；x6＝-a1+b1；x5＝-a2+b2；x4＝-a3+b3；