CN104702961A

CN104702961A - 一种分布式视频编码中码率控制方法

Info

Publication number: CN104702961A
Application number: CN201510086215.4A
Authority: CN
Inventors: 张登银; 蔡睿
Original assignee: Nanjing Post and Telecommunication University
Current assignee: Nanjing Post and Telecommunication University; Nanjing University of Posts and Telecommunications
Priority date: 2015-02-17
Filing date: 2015-02-17
Publication date: 2015-06-10
Anticipated expiration: 2035-02-17
Also published as: CN104702961B

Abstract

本发明公开了一种分布式视频编码中建立相关噪声模型及估计模型参数的方法，该混合模型首先利用K-Mediods将残差系数分为小残差和大残差，利用改进的拉普拉斯分布描述小残差系数的分布，采用柯西分布描述大残差系数。该文提出的混合模型(Hybrid Distribution Correlation Noise Model，HDCNM)能较精确地描述WZ帧和边信息间的残差系数分布，从而有效地改善了变换域分布式视频编码的率失真性能，并减少***解码端计算复杂度。

Description

一种分布式视频编码中码率控制方法

技术领域

本发明涉及一种在分布式视频编码中码率控制方法，属于视频压缩领域。

背景技术

分布式视频编码(Distributed Video Coding，DVC)是基于20世纪70年代Slepian.Wolf以及Wyner.Ziv提出的信息理论而建立的，将编码器运算复杂度转移到解码器。其特点是编码简单、解码较复杂、压缩性能接近传统的编码方式、抗误码能力强，适用于无线网络中资源受限的视频编码设备等。

分布式视频编码中多使用Turbo码或者LDPC码这样的信道编码对WZ帧进行编码。虽然Turbo码和LDPC码都是能够接近理论界的信道编码方案，但有研究结果表明LDPC码的整体性能要好于Turbo码，对于运动剧烈的视频，LDPC方案抗误码率性能更好。在分布式视频编码中，原始WZ帧与相应边信息间相关噪声模型的准确度对编码效率有很大影响，相关噪声模型越准确，LDPC码成功解码需要的校验位就越少，一方面降低了码率，提高了压缩效率；另一方面，减少了LDPC码解码的计算量。所以，解码端对相关噪声的准确建模是分布式视频编码的一个关键技术。

由于子带级的拉普拉斯分布模型在计算复杂度和精确度上具有良好的折中得到了广泛认可，现今的DVC***大多采用拉普拉斯分布来描述原始WZ帧和边信息之间的噪声关系，近年来对相关噪声模型的研究主要在于如何获得更精确的拉普拉斯参数。但DVC***中的DCT残差系数统计分布并不完全符合拉普拉斯分布这个假设，而是具有更尖的峰值特性和更长的尾部，为适应残差系数的这两个特性，本文提出基于K-Medoids聚类的拉普拉斯-柯西混合相关噪声模型的建模方法。该混合模型利用K-Medoids将子带残差分为大残差系数和小残差系数，对小残差系数的分布使用拉普拉斯模型来描述，对大残差系数的分布使用柯西分布来描述，增加了模型的精度，从而提高了***的率失真性能。

发明内容

技术问题：针对变换域分布式视频编码中原始Wyner-Ziv(WZ)帧与相应边信息的残差系数存在大残差和小残差系数统计分布与传统的拉普拉斯分布存在一定偏差的问题。为了减少这种差异，提出一种基于K-Mediods的混合分布相关噪声模型及其参数估计算法。该混合模型利用改进的拉普拉斯分布描述小残差系数的分布，采用柯西分布描述大残差系数。本文提出的混合模型建模方法能较精确地描述WZ帧和边信息间的残差系数分布，从而有效地改善了变换域分布式视频编码的率失真性能，并减少***解码端计算复杂度。

技术方案：

1.一种分布式视频编码中相关噪声模型建模方法，其特征在于，该方法包含以下步骤：

1)对于当前解码子带b_k，每个系数和它与该子带残差均方的距离的绝对值组成一个2维特征向量，即子带b_k中第n个残差特征向量表示成其中

D_{b_{k}} (μ, v) = C_{R_{XY}}^{b_{x}} (μ, v) - E (C_{R_{XY}}^{b_{k}});

2)利用K-Medoids聚类算法将残差特征向量分成大残差类与小残差类；

3)使用改进的拉普拉斯分布描述小残差类，使用柯西分布描述大残差类。分别计算相应的分布参数，最终得到混合分布式相关噪声模型；

在步骤2)中，按照如下步骤进行K-Medoids聚类：

1)初始化聚类中心：选择开始的三个残差特征矢量作为初始聚类中心对应的类为S₁ ^(k)，S₂ ^(k)，S₃ ^(k)，令k＝0；

2)样本聚类：将待分类的特征向量集逐个按最小距离原则划分给三类中的某一类，即：如果

d_{ij}^{(k)} = \min_{j} [d_{ij}^{(k)}], (i = 1,2, . . ., N), j = (1,2,3),

则式中表示和类的中心的距离，上角标k表示迭代次数，这里的距离选择欧氏距离，于是产生新聚类

3)重新计算聚类中心：与K-Means不同，K-Means选择当前cluster中所有数据点的平均值为新的中心点，而在K-Medoids中，将从当前cluster中选取一个到其他所有(当前cluster中的)点的距离之和最小的点作为中心点；

4)判断终止条件：如果(j＝1,2,3)，则结束，得到3个聚类，DCT残差系数被分为三个集合S₁，S₂，S₃，否则，k＝k+1，转至2)。

在所述步骤3)中，计算拉普拉斯分布的参数以及柯西分布的参数的具体流程为：

聚类之后，计算三个残差系数集合S_j(j＝1,2,3)各自的方差，然后按从小到大的顺序，将其对应的残差系数集合分别记为S₁，S₂，S₃，其中S₁记为小系数集，而S₂，S₃则记为大系数集，S₁基本关于0对称，为了计算柯西分布的参数的方便，对S₁进行修正，记S₁的上界和下界的绝对值的最小值为TL，之后将用柯西分布来描述大残差系数集，而用拉普拉斯分布描述小残差系数集；

柯西分布可以表示为：

p (x) = \frac{1}{π} \frac{λ}{λ^{2} + {(x - μ)}^{2}}

其中λ是形状参数，μ是位置参数，因为视频压缩编码中残差系数基本关于0对称，所以令μ＝0。为了保持最后由拉普拉斯分布和柯西分布组合表示的概率密度还能满足那么对于柯西分布，得找到一个λ使得其概率密度在[-TL,TL]区间内的积分值等于拉普拉斯的概率密度在[-TL,TL]区间内的积分值，并且仍然能维持它的重尾特性。这样就能推导出λ。

令拉普拉斯概率密度在[-TL,TL]内的积分值为P_L(TL)，它可以按下式计算：

P_{L} (TL) = P (TL \leq x \leq TL) = {&Integral;}_{- TL}^{TL} \frac{α_{b_{k}}}{2} \exp (- α_{b_{k}} | x |) dx = C

其中按

α_{b_{k}} = \sqrt{2 / σ_{b_{k}}^{2}}, σ_{b_{k}}^{2} = E ({| C_{R_{XY}}^{b_{k}} |}^{2}) - E {(| C_{R_{XY}}^{b_{k}} |)}^{2}

计算。

令P_C(LH)表示柯西概率密度在[-TL,TL]内的积分值，按下式计算：

\begin{matrix} P_{C} (TL) = P (- TL \leq x \leq TL) = {&Integral;}_{- TL}^{TL} \frac{1}{π} \frac{λ}{λ^{2} + x^{2}} dx \\ = \frac{2}{π} \tan^{- 1} (\frac{TL}{λ}) = P_{L} (TL) = C \end{matrix}

这样就能得到：

λ = \frac{TL}{\tan (πC / 2)} .

利用下式计算属于S₁残差系数集合的拉普拉斯参数：

α_{1} = \sqrt{\frac{2}{σ_{1}^{2}}}

是S₁残差系数集合的方差。

最终可以这样来表示相关噪声模型：

p (C_{R_{XY}}^{b_{k}} (μ, &upsi;)) = \{\begin{matrix} \frac{α_{0}}{2} \exp (- α_{0} | C_{R_{XY}}^{b_{k}} (μ, &upsi;) |), C_{R_{XY}}^{b_{k}} (μ, &upsi;) &Element; S_{1} \\ \frac{1}{π} \frac{λ}{λ^{2} + {[C_{R_{XY}}^{b_{k}} (μ, &upsi;)]}^{2}}, C_{R_{XY}}^{b_{k}} (μ, &upsi;) &Element; S_{2}, S_{3} \end{matrix}

有益效果：本发明与现有技术相比，具有以下优点：

a)本发明方案提出了一种混合相关噪声模型建模方法，在该方法中，采用K-Medoids聚类算法来提高分类的准确性与鲁棒性。使用拉普拉斯分布描述小残差的分布，使用柯西分布描述大残差的分布。提高了相关噪声模型的准确性与自适应性能。

b)本文方法通过在解码端的改进，有效提高了DVC***的率失真性能。

附图说明

图1是现有的基于变换域的分布式视频编码框架图。

图2是本发明改进的视频编码框架图。

图3是本发明的混合相关噪声模型建模方法流程图。

具体实施方式

下面结合附图与具体实施方式对本发明作进一步详细描述。

图1是现有的基于变换域的分布式视频编码框架图，本发明提出了一种分布式视频编码中建立相关噪声模型及估计模型参数的方法，该混合模型首先利用K-Mediods将残差系数分为小残差和大残差，利用改进的拉普拉斯分布描述小残差系数的分布，采用柯西分布描述大残差系数。该文提出的混合模型(Hybrid Distribution CorrelationNoise Model，HDCNM)能较精确地描述WZ帧和边信息间的残差系数分布，从而有效地改善了变换域分布式视频编码的率失真性能，并减少***解码端计算复杂度。改进后的视频编码框架如图2所示。

下面给出本发明方法的具体实施例：

D_{b_{k}} (μ, v) = C_{R_{XY}}^{b_{x}} (μ, v) - E (C_{R_{XY}}^{b_{k}});

2)利用K-Medoids聚类算法将残差特征向量分成大残差类与小残差类

3)使用改进的拉普拉斯分布描述小残差类，使用柯西分布描述大残差类。分别计算相应的分布参数，最终得到混合分布式相关噪声模型。

在步骤2)中，按照如下步骤进行K-Medoids聚类：

d_{ij}^{(k)} = \min_{j} [d_{ij}^{(k)}], (i = 1,2, . . ., N), j = (1,2,3),

柯西分布可以表示为：

p (x) = \frac{1}{π} \frac{λ}{λ^{2} + {(x - μ)}^{2}}

P_{L} (TL) = P (TL \leq x \leq TL) = {&Integral;}_{- TL}^{TL} \frac{α_{b_{k}}}{2} \exp (- α_{b_{k}} | x |) dx = C

其中按

α_{b_{k}} = \sqrt{2 / σ_{b_{k}}^{2}}, σ_{b_{k}}^{2} = E ({| C_{R_{XY}}^{b_{k}} |}^{2}) - E {(| C_{R_{XY}}^{b_{k}} |)}^{2}

计算。

\begin{matrix} P_{C} (TL) = P (- TL \leq x \leq TL) = {&Integral;}_{- TL}^{TL} \frac{1}{π} \frac{λ}{λ^{2} + x^{2}} dx \\ = \frac{2}{π} \tan^{- 1} (\frac{TL}{λ}) = P_{L} (TL) = C \end{matrix}

这样就能得到：

λ = \frac{TL}{\tan (πC / 2)} .

利用下式计算属于S₁残差系数集合的拉普拉斯参数：

α_{1} = \sqrt{\frac{2}{σ_{1}^{2}}}

是S₁残差系数集合的方差。

最终可以这样来表示相关噪声模型：

p (C_{R_{XY}}^{b_{k}} (μ, &upsi;)) = \{\begin{matrix} \frac{α_{0}}{2} \exp (- α_{0} | C_{R_{XY}}^{b_{k}} (μ, &upsi;) |), C_{R_{XY}}^{b_{k}} (μ, &upsi;) &Element; S_{1} \\ \frac{1}{π} \frac{λ}{λ^{2} + {[C_{R_{XY}}^{b_{k}} (μ, &upsi;)]}^{2}}, C_{R_{XY}}^{b_{k}} (μ, &upsi;) &Element; S_{2}, S_{3} \end{matrix}

Claims

D_{b_{k}} (μ, v) = C_{R_{XY}}^{b_{k}} (μ, v) - E (C_{R_{XY}}^{b_{k}});

3)使用改进的拉普拉斯分布描述小残差类，使用柯西分布描述大残差类；分别计算相应的分布参数，最终得到混合分布式相关噪声模型。

2.根据权利要求1所述的一种分布式视频编码中码率控制方法，其特征在于，所述步骤2)中，按照如下步骤进行K-Medoids聚类：

1)初始化聚类中心：选择开始的三个残差特征矢量作为初始聚类中心对应的类为令k＝0；

2)样本聚类：将待分类的特征向量集逐个按最小距离原则划分给三类中的某一类，即：如果(i＝1,2,...,N),j＝(1,2,3)，则式中表示和类的中心的距离，上角标k表示迭代次数，这里的距离选择欧氏距离，于是产生新聚类

4)判断终止条件：如果(j＝1，2，3)，则结束，得到3个聚类，DCT残差系数被分为三个集合S₁，S₂，S₃，否则，k＝k+1，转至2)。

3.根据权利要求1或2所述的一种分布式视频编码中边信息改进方法，其特征在于，步骤3)中，计算拉普拉斯分布的参数以及柯西分布的参数的具体流程为：

柯西分布可以表示为：

p (x) = \frac{1}{π} \frac{λ}{λ^{2} + {(x - μ)}^{2}}

其中λ是形状参数，μ是位置参数，因为视频压缩编码中残差系数基本关于0对称，所以令μ＝0；为了保持最后由拉普拉斯分布和柯西分布组合表示的概率密度还能满足那么对于柯西分布，得找到一个λ使得其概率密度在[-TL,TL]区间内的积分值等于拉普拉斯的概率密度在[-TL,TL]区间内的积分值，并且仍然能维持它的重尾特性；这样就能推导出λ；

P_{L} (TL) = P (- TL \leq x \leq TL) = {&Integral;}_{- TL}^{TL} \frac{α_{b_{k}}}{2} \exp ({- α}_{b_{k}} | x |) dx = C

其中按

α_{b_{k}} = \sqrt{2 / σ_{b_{k}}^{2}}, σ_{b_{k}}^{2} = E ({| C_{R_{XY}}^{b_{k}} |}^{2}) - E {(| C_{R_{XY}}^{b_{k}} |)}^{2}

计算；

\begin{matrix} P_{C} (TL) = P (- TL \leq x \leq TL) = {&Integral;}_{- TL}^{TL} \frac{1}{π} \frac{λ}{λ^{2} + x^{2}} dx \\ = \frac{2}{π} \tan^{- 1} (\frac{TL}{λ}) = P_{L} (TL) = C \end{matrix}

这样就能得到：

λ = \frac{TL}{\tan (πC / 2)};

利用下式计算属于S₁残差系数集合的拉普拉斯参数：

α_{1} = \sqrt{\frac{2}{σ_{1}^{2}}}

是S₁残差系数集合的方差。

最终表示相关噪声模型：

p (C_{R_{XY}}^{b_{k}} (μ, &upsi;)) = \{\begin{matrix} \frac{α_{0}}{2} \exp ({- α}_{0} | C_{R_{XY}}^{b_{k}} (μ, &upsi;) |), C_{R_{XY}}^{b_{k}} (μ, &upsi;) &Element; S_{1} \\ \frac{1}{π} \frac{λ}{λ^{2} + {[C_{R_{XY}}^{b_{k}} (μ, &upsi;)]}^{2}}, C_{R_{XY}}^{b_{k}} (μ, &upsi;) &Element; S_{2}, S_{3} \end{matrix}