CN104702961A - 一种分布式视频编码中码率控制方法 - Google Patents
一种分布式视频编码中码率控制方法 Download PDFInfo
- Publication number
- CN104702961A CN104702961A CN201510086215.4A CN201510086215A CN104702961A CN 104702961 A CN104702961 A CN 104702961A CN 201510086215 A CN201510086215 A CN 201510086215A CN 104702961 A CN104702961 A CN 104702961A
- Authority
- CN
- China
- Prior art keywords
- residual error
- distribution
- cauchy
- lambda
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种分布式视频编码中建立相关噪声模型及估计模型参数的方法,该混合模型首先利用K-Mediods将残差系数分为小残差和大残差,利用改进的拉普拉斯分布描述小残差系数的分布,采用柯西分布描述大残差系数。该文提出的混合模型(Hybrid Distribution Correlation Noise Model,HDCNM)能较精确地描述WZ帧和边信息间的残差系数分布,从而有效地改善了变换域分布式视频编码的率失真性能,并减少***解码端计算复杂度。
Description
技术领域
本发明涉及一种在分布式视频编码中码率控制方法,属于视频压缩领域。
背景技术
分布式视频编码(Distributed Video Coding,DVC)是基于20世纪70年代Slepian.Wolf以及Wyner.Ziv提出的信息理论而建立的,将编码器运算复杂度转移到解码器。其特点是编码简单、解码较复杂、压缩性能接近传统的编码方式、抗误码能力强,适用于无线网络中资源受限的视频编码设备等。
分布式视频编码中多使用Turbo码或者LDPC码这样的信道编码对WZ帧进行编码。虽然Turbo码和LDPC码都是能够接近理论界的信道编码方案,但有研究结果表明LDPC码的整体性能要好于Turbo码,对于运动剧烈的视频,LDPC方案抗误码率性能更好。在分布式视频编码中,原始WZ帧与相应边信息间相关噪声模型的准确度对编码效率有很大影响,相关噪声模型越准确,LDPC码成功解码需要的校验位就越少,一方面降低了码率,提高了压缩效率;另一方面,减少了LDPC码解码的计算量。所以,解码端对相关噪声的准确建模是分布式视频编码的一个关键技术。
由于子带级的拉普拉斯分布模型在计算复杂度和精确度上具有良好的折中得到了广泛认可,现今的DVC***大多采用拉普拉斯分布来描述原始WZ帧和边信息之间的噪声关系,近年来对相关噪声模型的研究主要在于如何获得更精确的拉普拉斯参数。但DVC***中的DCT残差系数统计分布并不完全符合拉普拉斯分布这个假设,而是具有更尖的峰值特性和更长的尾部,为适应残差系数的这两个特性,本文提出基于K-Medoids聚类的拉普拉斯-柯西混合相关噪声模型的建模方法。该混合模型利用K-Medoids将子带残差分为大残差系数和小残差系数,对小残差系数的分布使用拉普拉斯模型来描述,对大残差系数的分布使用柯西分布来描述,增加了模型的精度,从而提高了***的率失真性能。
发明内容
技术问题:针对变换域分布式视频编码中原始Wyner-Ziv(WZ)帧与相应边信息的残差系数存在大残差和小残差系数统计分布与传统的拉普拉斯分布存在一定偏差的问题。为了减少这种差异,提出一种基于K-Mediods的混合分布相关噪声模型及其参数估计算法。该混合模型利用改进的拉普拉斯分布描述小残差系数的分布,采用柯西分布描述大残差系数。本文提出的混合模型建模方法能较精确地描述WZ帧和边信息间的残差系数分布,从而有效地改善了变换域分布式视频编码的率失真性能,并减少***解码端计算复杂度。
技术方案:
1.一种分布式视频编码中相关噪声模型建模方法,其特征在于,该方法包含以下步骤:
1)对于当前解码子带bk,每个系数和它与该子带残差均方的距离的绝对值组成一个2维特征向量,即子带bk中第n个残差特征向量表示成其中
2)利用K-Medoids聚类算法将残差特征向量分成大残差类与小残差类;
3)使用改进的拉普拉斯分布描述小残差类,使用柯西分布描述大残差类。分别计算相应的分布参数,最终得到混合分布式相关噪声模型;
在步骤2)中,按照如下步骤进行K-Medoids聚类:
1)初始化聚类中心:选择开始的三个残差特征矢量作为初始聚类中心 对应的类为S1 (k),S2 (k),S3 (k),令k=0;
2)样本聚类:将待分类的特征向量集逐个按最小距离原则划分给三类中的某一类,即:如果 则式中表示和类的中心的距离,上角标k表示迭代次数,这里的距离选择欧氏距离,于是产生新聚类
3)重新计算聚类中心:与K-Means不同,K-Means选择当前cluster中所有数据点的平均值为新的中心点,而在K-Medoids中,将从当前cluster中选取一个到其他所有(当前cluster中的)点的距离之和最小的点作为中心点;
4)判断终止条件:如果(j=1,2,3),则结束,得到3个聚类,DCT残差系数被分为三个集合S1,S2,S3,否则,k=k+1,转至2)。
在所述步骤3)中,计算拉普拉斯分布的参数以及柯西分布的参数的具体流程为:
聚类之后,计算三个残差系数集合Sj(j=1,2,3)各自的方差,然后按从小到大的顺序,将其对应的残差系数集合分别记为S1,S2,S3,其中S1记为小系数集,而S2,S3则记为大系数集,S1基本关于0对称,为了计算柯西分布的参数的方便,对S1进行修正,记S1的上界和下界的绝对值的最小值为TL,之后将用柯西分布来描述大残差系数集,而用拉普拉斯分布描述小残差系数集;
柯西分布可以表示为:
其中λ是形状参数,μ是位置参数,因为视频压缩编码中残差系数基本关于0对称,所以令μ=0。为了保持最后由拉普拉斯分布和柯西分布组合表示的概率密度还能满足那么对于柯西分布,得找到一个λ使得其概率密度在[-TL,TL]区间内的积分值等于拉普拉斯的概率密度在[-TL,TL]区间内的积分值,并且仍然能维持它的重尾特性。这样就能推导出λ。
令拉普拉斯概率密度在[-TL,TL]内的积分值为PL(TL),它可以按下式计算:
其中按 计算。
令PC(LH)表示柯西概率密度在[-TL,TL]内的积分值,按下式计算:
这样就能得到:
利用下式计算属于S1残差系数集合的拉普拉斯参数:
是S1残差系数集合的方差。
最终可以这样来表示相关噪声模型:
有益效果:本发明与现有技术相比,具有以下优点:
a)本发明方案提出了一种混合相关噪声模型建模方法,在该方法中,采用K-Medoids聚类算法来提高分类的准确性与鲁棒性。使用拉普拉斯分布描述小残差的分布,使用柯西分布描述大残差的分布。提高了相关噪声模型的准确性与自适应性能。
b)本文方法通过在解码端的改进,有效提高了DVC***的率失真性能。
附图说明
图1是现有的基于变换域的分布式视频编码框架图。
图2是本发明改进的视频编码框架图。
图3是本发明的混合相关噪声模型建模方法流程图。
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细描述。
图1是现有的基于变换域的分布式视频编码框架图,本发明提出了一种分布式视频编码中建立相关噪声模型及估计模型参数的方法,该混合模型首先利用K-Mediods将残差系数分为小残差和大残差,利用改进的拉普拉斯分布描述小残差系数的分布,采用柯西分布描述大残差系数。该文提出的混合模型(Hybrid Distribution CorrelationNoise Model,HDCNM)能较精确地描述WZ帧和边信息间的残差系数分布,从而有效地改善了变换域分布式视频编码的率失真性能,并减少***解码端计算复杂度。改进后的视频编码框架如图2所示。
下面给出本发明方法的具体实施例:
1)对于当前解码子带bk,每个系数和它与该子带残差均方的距离的绝对值组成一个2维特征向量,即子带bk中第n个残差特征向量表示成其中
2)利用K-Medoids聚类算法将残差特征向量分成大残差类与小残差类
3)使用改进的拉普拉斯分布描述小残差类,使用柯西分布描述大残差类。分别计算相应的分布参数,最终得到混合分布式相关噪声模型。
在步骤2)中,按照如下步骤进行K-Medoids聚类:
1)初始化聚类中心:选择开始的三个残差特征矢量作为初始聚类中心 对应的类为S1 (k),S2 (k),S3 (k),令k=0;
2)样本聚类:将待分类的特征向量集逐个按最小距离原则划分给三类中的某一类,即:如果 则式中表示和类的中心的距离,上角标k表示迭代次数,这里的距离选择欧氏距离,于是产生新聚类
3)重新计算聚类中心:与K-Means不同,K-Means选择当前cluster中所有数据点的平均值为新的中心点,而在K-Medoids中,将从当前cluster中选取一个到其他所有(当前cluster中的)点的距离之和最小的点作为中心点;
4)判断终止条件:如果(j=1,2,3),则结束,得到3个聚类,DCT残差系数被分为三个集合S1,S2,S3,否则,k=k+1,转至2)。
在所述步骤3)中,计算拉普拉斯分布的参数以及柯西分布的参数的具体流程为:
聚类之后,计算三个残差系数集合Sj(j=1,2,3)各自的方差,然后按从小到大的顺序,将其对应的残差系数集合分别记为S1,S2,S3,其中S1记为小系数集,而S2,S3则记为大系数集,S1基本关于0对称,为了计算柯西分布的参数的方便,对S1进行修正,记S1的上界和下界的绝对值的最小值为TL,之后将用柯西分布来描述大残差系数集,而用拉普拉斯分布描述小残差系数集;
柯西分布可以表示为:
其中λ是形状参数,μ是位置参数,因为视频压缩编码中残差系数基本关于0对称,所以令μ=0。为了保持最后由拉普拉斯分布和柯西分布组合表示的概率密度还能满足那么对于柯西分布,得找到一个λ使得其概率密度在[-TL,TL]区间内的积分值等于拉普拉斯的概率密度在[-TL,TL]区间内的积分值,并且仍然能维持它的重尾特性。这样就能推导出λ。
令拉普拉斯概率密度在[-TL,TL]内的积分值为PL(TL),它可以按下式计算:
其中按 计算。
令PC(LH)表示柯西概率密度在[-TL,TL]内的积分值,按下式计算:
这样就能得到:
利用下式计算属于S1残差系数集合的拉普拉斯参数:
是S1残差系数集合的方差。
最终可以这样来表示相关噪声模型:
Claims (3)
1.一种分布式视频编码中相关噪声模型建模方法,其特征在于,该方法包含以下步骤:
1)对于当前解码子带bk,每个系数和它与该子带残差均方的距离的绝对值组成一个2维特征向量,即子带bk中第n个残差特征向量表示成其中
2)利用K-Medoids聚类算法将残差特征向量分成大残差类与小残差类;
3)使用改进的拉普拉斯分布描述小残差类,使用柯西分布描述大残差类;分别计算相应的分布参数,最终得到混合分布式相关噪声模型。
2.根据权利要求1所述的一种分布式视频编码中码率控制方法,其特征在于,所述步骤2)中,按照如下步骤进行K-Medoids聚类:
1)初始化聚类中心:选择开始的三个残差特征矢量作为初始聚类中心 对应的类为令k=0;
2)样本聚类:将待分类的特征向量集逐个按最小距离原则划分给三类中的某一类,即:如果(i=1,2,...,N),j=(1,2,3),则式中表示和类的中心的距离,上角标k表示迭代次数,这里的距离选择欧氏距离,于是产生新聚类
3)重新计算聚类中心:与K-Means不同,K-Means选择当前cluster中所有数据点的平均值为新的中心点,而在K-Medoids中,将从当前cluster中选取一个到其他所有(当前cluster中的)点的距离之和最小的点作为中心点;
4)判断终止条件:如果(j=1,2,3),则结束,得到3个聚类,DCT残差系数被分为三个集合S1,S2,S3,否则,k=k+1,转至2)。
3.根据权利要求1或2所述的一种分布式视频编码中边信息改进方法,其特征在于,步骤3)中,计算拉普拉斯分布的参数以及柯西分布的参数的具体流程为:
聚类之后,计算三个残差系数集合Sj(j=1,2,3)各自的方差,然后按从小到大的顺序,将其对应的残差系数集合分别记为S1,S2,S3,其中S1记为小系数集,而S2,S3则记为大系数集,S1基本关于0对称,为了计算柯西分布的参数的方便,对S1进行修正,记S1的上界和下界的绝对值的最小值为TL,之后将用柯西分布来描述大残差系数集,而用拉普拉斯分布描述小残差系数集;
柯西分布可以表示为:
其中λ是形状参数,μ是位置参数,因为视频压缩编码中残差系数基本关于0对称,所以令μ=0;为了保持最后由拉普拉斯分布和柯西分布组合表示的概率密度还能满足那么对于柯西分布,得找到一个λ使得其概率密度在[-TL,TL]区间内的积分值等于拉普拉斯的概率密度在[-TL,TL]区间内的积分值,并且仍然能维持它的重尾特性;这样就能推导出λ;
令拉普拉斯概率密度在[-TL,TL]内的积分值为PL(TL),它可以按下式计算:
其中按 计算;
令PC(LH)表示柯西概率密度在[-TL,TL]内的积分值,按下式计算:
这样就能得到:
利用下式计算属于S1残差系数集合的拉普拉斯参数:
是S1残差系数集合的方差。
最终表示相关噪声模型:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510086215.4A CN104702961B (zh) | 2015-02-17 | 2015-02-17 | 一种分布式视频编码中码率控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510086215.4A CN104702961B (zh) | 2015-02-17 | 2015-02-17 | 一种分布式视频编码中码率控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104702961A true CN104702961A (zh) | 2015-06-10 |
CN104702961B CN104702961B (zh) | 2018-06-01 |
Family
ID=53349672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510086215.4A Active CN104702961B (zh) | 2015-02-17 | 2015-02-17 | 一种分布式视频编码中码率控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104702961B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105227954A (zh) * | 2015-09-30 | 2016-01-06 | 南京邮电大学 | 分布式视频编码中量化阶数自适应调整方法 |
CN107071447A (zh) * | 2017-04-06 | 2017-08-18 | 华南理工大学 | 一种dvc中基于二次边信息的相关噪声建模方法 |
CN108353193A (zh) * | 2015-08-19 | 2018-07-31 | Lg 电子株式会社 | 基于多个基于图的模型通过使用优化转换编码/解码视频信号的方法和设备 |
CN109934183A (zh) * | 2019-03-18 | 2019-06-25 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、检测设备及存储介质 |
CN110234011A (zh) * | 2019-04-19 | 2019-09-13 | 网宿科技股份有限公司 | 一种视频压缩方法及*** |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102724495A (zh) * | 2012-05-04 | 2012-10-10 | 西安电子科技大学 | 基于率失真的Wyner-Ziv帧量化方法 |
CN103561269A (zh) * | 2013-08-14 | 2014-02-05 | 广西大学 | 基于多概率分布的分布式视频编码相关噪声模型构造方法 |
-
2015
- 2015-02-17 CN CN201510086215.4A patent/CN104702961B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102724495A (zh) * | 2012-05-04 | 2012-10-10 | 西安电子科技大学 | 基于率失真的Wyner-Ziv帧量化方法 |
CN103561269A (zh) * | 2013-08-14 | 2014-02-05 | 广西大学 | 基于多概率分布的分布式视频编码相关噪声模型构造方法 |
Non-Patent Citations (3)
Title |
---|
VAN LUONG H ET AL.: "Side information and noise learning for distributed video coding", 《IEEE TRANSACTIONS ON IMAGE PROCESSING》 * |
杨春玲: "分布式视频编码中拉普拉斯_柯西混合分布相关噪声模型研究", 《电子与信息学报》 * |
谢小兰: "DCT域分布式视频编码中相关噪声模型研究", 《中国优秀硕士学位论文全文数据库信息科技辑,2014年第01期》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108353193A (zh) * | 2015-08-19 | 2018-07-31 | Lg 电子株式会社 | 基于多个基于图的模型通过使用优化转换编码/解码视频信号的方法和设备 |
CN108353193B (zh) * | 2015-08-19 | 2022-07-15 | Lg 电子株式会社 | 基于多个基于图的模型处理视频数据的方法和设备 |
US11394972B2 (en) | 2015-08-19 | 2022-07-19 | Lg Electronics Inc. | Method and device for encoding/decoding video signal by using optimized conversion based on multiple graph-based model |
CN105227954A (zh) * | 2015-09-30 | 2016-01-06 | 南京邮电大学 | 分布式视频编码中量化阶数自适应调整方法 |
CN107071447A (zh) * | 2017-04-06 | 2017-08-18 | 华南理工大学 | 一种dvc中基于二次边信息的相关噪声建模方法 |
CN107071447B (zh) * | 2017-04-06 | 2020-06-19 | 华南理工大学 | 一种dvc中基于二次边信息的相关噪声建模方法 |
CN109934183A (zh) * | 2019-03-18 | 2019-06-25 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、检测设备及存储介质 |
CN110234011A (zh) * | 2019-04-19 | 2019-09-13 | 网宿科技股份有限公司 | 一种视频压缩方法及*** |
CN110234011B (zh) * | 2019-04-19 | 2021-09-24 | 网宿科技股份有限公司 | 一种视频压缩方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN104702961B (zh) | 2018-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104702961A (zh) | 一种分布式视频编码中码率控制方法 | |
RU2464649C1 (ru) | Способ обработки звукового сигнала | |
CN101430881B (zh) | 一种编码、解码、编解码方法、编解码***以及相关装置 | |
CN103533458B (zh) | 一种视频水印的嵌入和提取方法 | |
CN102263951B (zh) | 一种快速的分形视频压缩与解压缩方法 | |
WO2010144497A3 (en) | Design trees for adaptive coding of images and videos using set partitioning in generalized hierarchical trees having directionality | |
CN111641832A (zh) | 编码方法、解码方法、装置、电子设备及存储介质 | |
US9014499B2 (en) | Distributed source coding using prediction modes obtained from side information | |
CN104023216A (zh) | 人脸视频压缩方法 | |
CN104244009B (zh) | 一种分布式视频编码中码率控制方法 | |
CN107079152A (zh) | 编码器、解码器、用于编码及解码的***及方法 | |
Gu et al. | Compression of human motion capture data using motion pattern indexing | |
CN102857760B (zh) | 一种无反馈的优化码率的分布式视频编解码方法及其*** | |
CN104853215A (zh) | 基于运动向量局部最优性保持的视频隐写方法 | |
CN117354523A (zh) | 一种频域特征感知学习的图像编码、解码、压缩方法 | |
Wu et al. | Arithmetic coding for image compression with adaptive weight-context classification | |
US20120215525A1 (en) | Method and apparatus for mixed dimensionality encoding and decoding | |
CN103826122A (zh) | 一种复杂度均衡的视频编码方法及其解码方法 | |
CN102307303A (zh) | 一种基于三进制表示的图像预测编码方法 | |
CN109089123B (zh) | 基于1比特矢量量化的压缩感知多描述编解码方法 | |
CN106331719A (zh) | 一种基于k‑l变换误差空间拆分的图像数据压缩方法 | |
CN107071447B (zh) | 一种dvc中基于二次边信息的相关噪声建模方法 | |
CN105578183B (zh) | 一种基于高斯混合模型的压缩传感视频编解码方法 | |
CN101668204A (zh) | 免疫克隆图像压缩方法 | |
CN104301729B (zh) | 一种无反馈分布式视频编码的码率控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |