CN101159867A

CN101159867A - 一种基于片的自适应码率控制方法

Info

Publication number: CN101159867A
Application number: CN 200710067915
Authority: CN
Inventors: 宋旭东; 杜武平
Original assignee: INFOWARELAB (HANGZHOU) INFORMATION TECHNOLOGIES Inc
Current assignee: Hangzhou Sequoia United Communication Technology Co., Ltd.
Priority date: 2007-03-31
Filing date: 2007-03-31
Publication date: 2008-04-09
Anticipated expiration: 2027-03-31
Also published as: CN101159867B

Abstract

一种基于片的自适应码率控制方法，包括以下步骤：(1)将输入视频序列分成图像组，图像组为一组时间上连续的图像序列，根据H.264基本框架的定义，每个图像组图像组呈IPPP结构，其中I帧是指帧内编码的图像，P帧是指支持前向预测的图像，定义i和j分别表示第i个图像组和第i个图像组的第j帧；(2)控制编码器使用一个量化系数(Quantization Parameter，QP)的初始值来编码第i个图像组的首个I帧和首个P帧，初始的量化系数值通过目标码率分配到单位象素的比特数来计算；(3)通过动态量化系数QP_i ^k(j)编码第i个图像组的第j帧，每一个片确定动态量化系数QP_i ^k(j)。本发明降低算法复杂度，又能在给定的目标码率控制范围内获得较高的视频质量。

Description

一种基于片的自适应码率控制方法

技术领域

本发明涉及一种基于片的自适应码率控制方法。

背景技术

Ramchandran等提出一个拉格朗日乘数的码率控制算法，这个算法要求对每个量化器生成率失真曲线，它的复杂度非常大不适合实时应用；应用独立的量化器位分配到MPEG视频编码器”1994年IEEE图像处理学报第3卷533到545页。(K.Ramchandrain，A.Qrtega，and M.Vetterli，“Bit allocationfor dependent quantization with applications to multiresolution and MPEG videocoders，”IEEE Trans.Image Processing，vol.3，pp.533-545，1994。

另一份文献，1997年2月《IEEE电路***和视频技术学报》，P246～250，“率失真模型码率控制算法“(作者：T.Chiang and Y.-Q.Zhang)公开一个二次方程式的率失真模型码率控制算法，这个算法要求使用最小均方算法求解模型参数，该算法复杂度较大。

2003年3月泰国JVT会议中，Li等人提出一个自适应基本单元的码率控制算法，这个算法是基于Chiang的二次方程式的率失真模型码率控制算法并做一些改进，同样该算法复杂度较大。

发明内容

为了克服已有的码率控制算法的算法复杂度较大的不足，本发明提供一种降低算法复杂度，又能在给定的目标码率控制范围内获得较高的视频质量的基于片的自适应码率控制方法。

本发明解决其技术问题所采用的技术方案是：

一种基于片的自适应码率控制方法，所述的控制算法包括以下步骤：

(1)、将输入视频序列分成图像组，图像组为一组时间上连续的图像序列，根据H.264基本框架的定义，每个图像组呈IPPP结构，其中I帧是指帧内编码的图像，P帧是指支持前向预测的图像，定义i和j分别表示第i个图像组和第i个图像组的第j帧；

(2)、控制编码器使用一个量化系数(Quantization Parameter，QP)的初始值来编码第i个图像组的首个I帧和首个P帧，初始的量化系数值通过目标码率分配到单位象素的比特数来计算；

(3)、通过动态量化系数QP_i ^k(j)编码第i个图像组的第j帧，每一个片的动态量化系数QP_i ^k(j)的确定过程为：

(3.1)、当第i个图像组的第j-1帧被编码后，在图像组中剩余的目标比特总数(Remaining Bits，RB)用以下公式(1)表示：

RB_i(j)＝RB_i(j-1)-AB_i(j-1) j＝2，3，...，N_i (1)

其中，AB_i(j-1)表示已编码的第j-1帧比特数；

对于一个图像组中的第1帧，它的目标比特数由下式(2)计算：

{RB}_{i} (1) = \frac{RS}{FR} \times N_{i} - {VB}_{i} (1) - - - (2)

其中，RS表示目标码率，N_i为第i个图像组总的帧数，FR表示帧率；

第J帧的虚拟缓冲区充盈度(Virtual Buffer，VB)，由下式(3)表示：

{VB}_{i} (j) = {VB}_{i} (j - 1) + {AB}_{i} (j - 1) - \frac{RS}{FR}, j = 2,3, . . ., N_{i} - - - (3)

设第1个图像组中第1帧的虚拟缓冲区冲盈度VB₁(1)为0，第i个图像组中的第1帧虚拟缓冲区充盈度等于上一个图像组最后一帧的的虚拟缓冲区充盈度，即VB_i(1)＝VB_i-1(N_i-1)；

(3.2)、第i个图像组中第j个P帧的目标比特数(Target Bits，TB)是由要编码的剩余总比特数、目标缓冲区等级(Target Buffer Level，TBL)、帧率、有效的网络带宽、真实的缓冲区充盈度以及先前已编码的I帧和P帧的真实比特数来决定，它可以由下式(4)表示：

{TB}_{i} (j) = 0.5 \times \frac{{RB}_{i} (j)}{N_{r, p}} + 0.5 \times (\frac{RS}{FR} + 0.5 \times ({TBL}_{i} (j) - {VB}_{i} (j))) - - - (4)

其中，N_r，p表示剩余P帧的帧数；TBL_i(j)计算公式如下(5)：

{TBL}_{i} (j) = {TBL}_{i} (j - 1) - \frac{{VB}_{i} (2)}{N_{i, p} - 1} - - - (5)

其中，N_i，p表示第i个图像组包含的P帧总数；

(3.3)、第i个图像组中第j帧的某个片的目标比特数(Slice Target Bits，Slice TB)是由每一个片的复杂程度来估算，由下式(6)计算获得：

Slice_{TB}_{i}^{k} (j) = \frac{J_{\cos t}^{k}}{J_{\cos t}} {TB}_{i} (j) - - - (6)

其中，J_costk表示编码当前帧的拉格朗日代价，表示为(7)：

J_{\cos t} = Σ_{k = 1}^{M} J_{\cos t}^{k} - - - (7)

其中，J_cost ^k表示编码当前片K的拉格朗日率失真代价，M是指当前帧的片总数；

J_cost ^k由一个线性滤波器计算前面的帧得到，其算式为(8)：

J_{\cos t}^{k} = \frac{1}{L} Σ_{n = 1}^{L} {COST}^{k} (j - n) - - - (8)

其中，L表示窗口长度，率失真代价COST^k(j-n)表达式为(9)：

COST^k(j-n)＝SATD^k+λ×R^k (9)

式中，SATD^k表示第K片经过哈德曼变化的预测残差绝对值总和，R^k是指片K的比特数，λ为拉格朗日乘数因子；

(3.4)、每一个片的量化参数计算公式表示如下(10)：

{QP}_{i}^{k} (j) = β \times \frac{X_{i}^{k} (j)}{Slice_{TB}_{i}^{k} (j)} - - - (10)

其中，β特别因子，X_i ^k(j)的表达式为(11)：

X_{i}^{k} (j) = {QP}_{i}^{k} (j - 1) \times {AB}_{i}^{k} (j - 1) - - - (11) .

本发明的技术构思：本发明采用自适应的控制算法，它通过动态的调整编码参数(量化系数)来实现目标码率控制。该算法可以适用在不同网络的网络带宽条件。该算法已在标准的虚拟参考解码器上验证通过。

本发明的有益效果主要表现在：(1)、降低算法复杂度；(2)、能在给定的目标码率控制范围内获得较高的视频质量。

具体实施方式

下面对本发明作进一步描述。

(1)、将输入视频序列分成图像组图像组，图像组为一组时间上连续的图像序列，根据H.264基本框架的定义，每个图像组图像组呈IPPP结构，其中I帧是指帧内编码的图像，P帧是指支持前向预测的图像，定义i和j分别表示第i个图像组和第i个图像组的第j帧；

RB_i(j)＝RB_i(j-1)-AB_i(j-1) j＝2，3，...，N_i (1)

其中，AB_i(j-1)表示已编码的第j-1帧比特数；

对于一个图像组中的第1帧，它的目标比特数由下式(2)计算：

{RB}_{i} (1) = \frac{RS}{FR} \times N_{i} - {VB}_{i} (1) - - - (2)

第J帧的虚拟缓冲区充盈度(Virtual Buffer，VB)，由下式(3)表示：

{VB}_{i} (j) = {VB}_{i} (j - 1) + {AB}_{i} (j - 1) - \frac{RS}{FR}, j = 2,3, . . ., N_{i} - - - (3)

{TB}_{i} (j) = 0.5 \times \frac{{RB}_{i} (j)}{N_{r, p}} + 0.5 \times (\frac{RS}{FR} + 0.5 \times ({TBL}_{i} (j) - {VB}_{i} (j))) - - - (4)

其中，N_r，p表示剩余P帧的帧数；TBL_i(j)计算公式如下(5)：

{TBL}_{i} (j) = {TBL}_{i} (j - 1) - \frac{{VB}_{i} (2)}{N_{i, p} - 1} - - - (5)

其中，N_i，p表示第i个图像组包含的P帧总数；

Slice_{TB}_{i}^{k} (j) = \frac{J_{\cos t}^{k}}{J_{\cos t}} {TB}_{i} (j) - - - (6)

其中，J_cost表示编码当前帧的拉格朗日代价，表示为(7)：

J_{\cos t} = Σ_{k = 1}^{M} J_{\cos t}^{k} - - - (7)

J_cost ^k由一个线性滤波器计算前面的帧得到，其算式为(8)：

J_{\cos t}^{k} = \frac{1}{L} Σ_{n = 1}^{L} {COST}^{k} (j - n) - - - (8)

其中，L表示窗口长度，率失真代价COST^k(j-n)表达式为(9)：

COST^k(j-n)＝SATD^k+λ×R^k (9)

(3.4)、每一个片的量化参数计算公式表示如下(10)：

{QP}_{i}^{k} (j) = β \times \frac{X_{i}^{k} (j)}{Slice_{TB}_{i}^{k} (j)} - - - (10)

其中，β特别因子，X_i ^k(j)的表达式为(11)：

X_{i}^{k} (j) = {QP}_{i}^{k} (j - 1) \times {AB}_{i}^{k} (j - 1) - - - (11) .

本实施例中，给出一个自适应的控制算法，它通过动态的调整编码参数(量化系数)来实现目标码率控制。该算法可以适用在不同网络的网络带宽条件。该算法已在标准的虑拟参考解码器上验证通过，详细的算法在以下给出：

(1)、码率控制初始化

输入视频序列被分成图像组(Group of Picture，图像组)，它是指一组时间上连续的图像序列。根据H.264基本框架(Baseline Profile)的定义，每个图像组为IPPP....结构，其中I帧是指帧内编码的图像，P帧是指支持前向预测的图像。我们使用i和j分别表示第i个图像组和第i个图像组的第j帧。第一步，编码器使用一个量化系数(Quantization Parameter，QP)的初始值来编码第i个图像组的首个I帧和首个P帧。初始的量化系数值可以通过目标码率分配到单位象素的比特数来计算。

当第i个图像组的第j-1帧被编码后，在这个图像组中剩余的目标比特总数(Remaining Bits，RB)可以用以下公式(1)表示：

RB_i(j)＝RB_i(j-1)-AB_i(j-1) j＝2，3，...，N_i (1)

这里，AB_i(j-1)表示已编码的第j-1帧比特数。对于一个图像组中的第1帧，它的目标比特数由下式(2)计算：

{RB}_{i} (1) = \frac{RS}{FR} \times N_{i} - {VB}_{i} (1) - - - (2)

其中RS表示目标码率，N_i为第i个图像组总的帧数，FR表示帧率。第J帧的虚拟缓冲区充盈度(Fullness of virtual buffer，VB)可以由下式(3)表示：

{VB}_{i} (j) = {VB}_{i} (j - 1) + {AB}_{i} (j - 1) - \frac{RS}{FR}, j = 2,3, . . ., N_{i} - - - (3)

这里，设第1个图像组中第1帧的虚拟缓冲区冲盈度VB₁(1)为0，第i个图像组中的第1帧虚拟缓冲区充盈度等于上一个图像组最后一帧的的虚拟缓冲区充盈度，即VB_i(1)＝VB_i-1(N_i-1)。

(2)、P帧的目标比特数分配

第i个图像组中第j个P帧的目标比特数(Target Bits，TB)是由要编码的剩余总比特数、目标缓冲区等级(Target Buffer Level，TBL)、帧率、有效的网络带宽、真实的缓冲区充盈度以及先前已编码的I帧和P帧的真实比特数来决定。它可以由下式(4)表示：

{TB}_{i} (j) = 0.5 \times \frac{{RB}_{i} (j)}{N_{r, p}} + 0.5 \times (\frac{RS}{FR} + 0.5 \times ({TBL}_{i} (j) - {VB}_{i} (j))) - - - (4)

这里，N_r，p表示剩余P帧的帧数。TBL_i(j)计算公式(5)如下：

{TBL}_{i} (j) = {TBL}_{i} (j - 1) - \frac{{VB}_{i} (2)}{N_{i, p} - 1} - - - (5)

其中N_i，p表示第i个图像组包含的P帧总数。

(3)、每一个片的目标比特数分配

第i个图像组中第j帧的某个片的目标比特数(Slice Target Bits，Slice TB)是由每一个片的复杂程度来估算。它可以由下式(6)计算获得：

Slice_{TB}_{i}^{k} (j) = \frac{J_{\cos t}^{k}}{J_{\cos t}} {TB}_{i} (j) - - - (6)

这里J_cost表示编码当前帧的拉格朗日代价，表示为(7)：

J_{\cos t} = Σ_{k = 1}^{M} J_{\cos t}^{k} - - - (7)

其中J_cost ^k表示编码当前片K的拉格朗日率失真代价，M是指当前帧的片总数。

J_cost ^k可以由一个线性滤波器计算前面的帧得到，其算式为(8)：

J_{\cos t}^{k} = \frac{1}{L} Σ_{n = 1}^{L} {COST}^{k} (j - n) - - - (8)

这里L表示窗口长度。率失真代价COST^k(j-n)表达式为(9)：

COST^k(j-n)＝SATD^k+λ×R^k (9)

式中，SATD^k表示第K片经过哈德曼变化的预测残差绝对值总和。R^k是指片K的比特数。λ为拉格朗日乘数因子。

(4)、每片的量化参数计算：

片的量化参数计算公式表示如下(10)：：

{QP}_{i}^{k} (j) = β \times \frac{X_{i}^{k} (j)}{Slice_{TB}_{i}^{k} (j)} - - - (10)

这里，β特别因子。X_i ^k(j)的表达式为(11)：

X_{i}^{k} (j) = {QP}_{i}^{k} (j - 1) \times {AB}_{i}^{k} (j - 1) - - - (11) .

Claims

1.一种基于片的自适应码率控制方法，所述的控制算法包括以下步骤：

(1)将输入视频序列分成图像组，图像组为一组时间上连续的图像序列，根据H.264基本框架的定义，每个图像组呈IPPP结构，其中I帧是指帧内编码的图像，P帧是指支持前向预测的图像，定义i和j分别表示第i个图像组和第i个图像组的第j帧；

RB_i(j)＝RB_i(j-1)-AB_i(j-1)j＝2，3，...，Ni (1)

其中，AB_i(j-1)表示已编码的第j-1帧比特数；

对于一个图像组中的第1帧，它的目标比特数由下式(2)计算：

{RB}_{i} (1) = \frac{RS}{FR} \times N_{i} - {VB}_{i} (1) - - - (2)

第J帧的虚拟缓冲区充盈度(Virtual Buffer，VB)，由下式(3)表示：

{VB}_{i} (j) = {VB}_{i} (j - 1) + {AB}_{i} (j - 1) - \frac{RS}{FR}, j = 2,3, . . ., N_{i} - - - (3)

{TB}_{i} (j) = 0.5 \times \frac{{RB}_{i} (j)}{N_{r, p}} + 0.5 \times (\frac{RS}{FR} + 0.5 \times ({TBL}_{i} (j) - {VB}_{i} (j))) - - - (4)

其中，N_r，p表示剩余P帧的帧数；TBL_i(j)计算公式如下(5)：

{TBL}_{i} (j) = {TBL}_{i} (j - 1) - \frac{{VB}_{i} (2)}{N_{i, p} - 1} - - - (5)

其中，N_i，p表示第i个图像组包含的P帧总数；

(3.3)、第i个图像组中第j帧的某个片的目标比特数(Slice Target Bits，SliceTB)是由每一个片的复杂程度来估算，由下式(6)计算获得：

Slice_{TB}_{i}^{k} (j) = \frac{J_{\cos t}^{k}}{J_{\cos t}} {TB}_{i} (j) - - - (6)

其中，J_cost表示编码当前帧的拉格朗日代价，表示为(7)：

J_{\cos t} = Σ_{k = 1}^{M} J_{\cos t}^{k} - - - (7)

J_cost ^k由一个线性滤波器计算前面的帧得到，其算式为(8)：

J_{\cos t}^{k} = \frac{1}{L} Σ_{n = 1}^{L} {COST}^{k} (j - n) - - - (8)

其中，L表示窗口长度，率失真代价COST^k(j-n)表达式为(9)：

COST^k(j-n)＝SATD^k+λ×R^k (9)

(3.4)、每一个片的量化参数计算公式表示如下(10)：

Q P_{i}^{k} (j) = β \times \frac{X_{i}^{k} (j)}{Slice_{TB}_{i}^{k} (j)} - - - (10)

其中，β特别因子，X_i ^k(j)的表达式为(11)：

X_{i}^{k} (j) = {QP}_{i}^{k} (j - 1) \times {AB}_{i}^{k} (j - 1) - - - (11) .