CN111277839B

CN111277839B - 一种编码立方体投影格式的自适应qp调整方法

Info

Publication number: CN111277839B
Application number: CN202010154990.XA
Authority: CN
Inventors: 尹宝才; 李煜聪; 施云惠; 齐娜
Original assignee: Beijing University of Technology
Current assignee: Beijing University of Technology
Priority date: 2020-03-06
Filing date: 2020-03-06
Publication date: 2022-03-22
Anticipated expiration: 2040-03-06
Also published as: CN111277839A

Abstract

本发明涉及一种编码立方体投影格式的自适应QP调整方法，属于计算机编解码领域。本发明在传统编解码技术的基础上，针对立方体投影的像素分布特点，进行有针对性的改进。通过自适应QP调整，对同一帧内的不同区域采取适宜的方案，来实现对于立方体投影格式的优化。与传统编码方法统一QP相比，可以更加适配立方体投影格式，既提高了编码效率又节约了码率。

Description

一种编码立方体投影格式的自适应QP调整方法

技术领域

本方法是一种针对360°全景视频中立方体投影(CMP)格式的方法，属于计算机编解码领域。

背景技术

360°全景视频亦称为沉浸式视频,在同一位置改变观察方向,能够浏览四周全部场景。在景观展示、数字娱乐、视频会议、远程医疗和会诊、远程监控、机器人自动导航、军事对抗仿真与虚拟战场等领域得到了广泛应用。

360°全景视频应用主要包括采集、拼接、编码及传输和播放几个部分。360°全景视频采集需要多台摄像机同时完成,完成同步采集后,需要将多相机采集的视频进行拼接。由于不同角度下拍摄的图像并不在同一投影平面上,直接对重叠的图像无缝拼接会破坏景物视觉的一致性,所以需要先对图像进行投影变换, 再进行拼接。由于360度视频投影方式不同,投影变换过程中存在着图像失真, 分辨率要求较高,沿用传统视频编码技术压缩360°全景视频效果并不理想等问题，所以需要针对不同的投影格式进行相应的优化。

立方图投影(cubemap projection,CMP)是目前除球面投影(ERP)格式以外，应用最广泛的投影格式，所以对其进行有针对性性的改进有很重要的实际意义。立方体投影经由投影变换后，会采样不均匀，产生像素冗余问题。如图1灰度图所示，图片分为不同的灰度等级。灰度等级越高，所表示的编码有效像素越少，像素密度越低，如靠近上下边界地区和圆形中心地区，灰度等级较高，表示像素密度不足，会导致编码精确度降低；灰度等级越低，所表示的编码有效像素越多，像素密度越大，如圆形外部周边地区，像素密度较足，编码精度较好，但是像素密度过大在编码时也会产生浪费码率的问题。最接近1:1像素密度比率的部分存在于圆形区域外部，但是存在的部分较少。对于这个特性，传统的视频编解码方案不能进行有效的适配。

在编码器端，量化步长Q_step是控制量化的参数，可以调节编码压缩率以及重建图像的精度。如果Q_step较大，量化较粗，相应的编码长度较短，压缩率高，会损失较多的图像细节；如果Q_step较小，量化较细，相应的编码长度也比较长，图像细节损失较少。根据立方体投影像素分布特点来调节重建图像精度，进行动态优化可以提高编码效率。实际编码时，只需要控制量化步长的编号——量化参数 QP就行了。对立方体投影的同一帧进行有目的性的QP调整策略，使得相应位置获得合适的量化参数，可以在保证重建质量的前提下节省码率，以期达到整体最佳效果。

发明内容

本发明是在传统编解码技术的基础上，针对立方体投影的像素分布特点，进行有针对性的改进。通过自适应QP调整，对同一帧内的不同区域采取适宜的方案，来实现对于立方体投影格式的优化。

本发明的技术方案如图2所示。该方法针对立方体投影，把待编码的一帧分为3个区域。该序列的每一帧长为L，宽为W，其中，L＝2W。左下角点坐标为原点，把该帧划分为3个区域，其中第一区域为距上边界1/6W内以及距下边界1/6W 内的部分；第三区域为半径R＝1/4W，圆心位于支线L＝1/2W上的两个半圆以及三个圆形区域，两个半圆分别位于一帧图像的左右两端，三个圆形位于两个半圆之间；第二区域为其余部分。根据不同区域像素分布情况，进行针对性QP调整，从而有效的对立方体投影编码进行优化。本发明的特征在于该方法还依次包括下述步骤：

1：在编码阶段，对于待编码帧，获取第一个编码CTU中心像素的位置，判断其所处区域。

2：根据所在区域采用不同的QP调整方案调整该CTU的QP。

3：根据调整完成的QP来更新Lambda参数。

4：继续对该CTU编解码。

5：继续下一个CTU，直至本帧编码完成。

有益效果

与传统编码方法统一QP相比，本方法根据立方体投影像素密度分布特性，进行了具体的QP调整优化，可以更加适配立方体投影格式，既提高了编码效率又节约了码率。

附图说明

图1是立方体投影格式像素密度图

图2是本发明对立方体投影区域划分图

图3是本发明的流程图

具体实施方式

本发明实施可以在现行的国际标准编码框架，如H.265/HEVC，H.266/VVC等框架下实现。对于360°全景视频的立方体投影格式，在编码过程中进行有针对性的QP调整，具体实施方式如下：

1：设左下角点坐标为原点，对于待编码的帧，从第一个CTU开始，获取中心像素所在位置，作为参考位置。判断该参考位置所处区域。

2：根据所在区域进行不同的QP调整方案。如图2 所示，设基础设置QP为 QP₀，对于区域3，像素密度不足，但越远离各个圆心的像素密度越大，根据这一特点，设区域3的QP为QP₃：

QP₃＝QP₀-3log₂(2-X₃) (1)

其中

L₃为当前CTU中心像素位置距离最近圆心的长度，R为圆半径的长度。

对于区域1，越靠近中心像素密度越大，但是还是存在着不足的问题，根据这一特点。设区域1的QP为QP₁：

QP₁＝QP₀-2log₂(2-X₁) (2)

其中

对区域1的上半区域，L₃为当前CTU中心像素位置距直线

的长度；对区域1的下半区域，L₃为当前CTU中心像素位置距直线

的长度。

对于区域2，像素密度充足，根据这一特点，设区域2的QP为QP₂：

QP₂＝QP₀+3 (3)

3根据调整后的QP更新Lambda参数。更新Lambda参数有很多方法，HM与 VTM平台均提供了相应的函数，调用相关函数即可更新。

4继续对该CTU进行编码。

5编码完成该CTU之后，继续下一个CTU。

为了验证本发明的有效性，将本发明的算法结果与JVET专家组提供的原始VTM1.0平台进行结果比对，采取的测试序列均为JVET专家组提供的。采取S- PSNR-NN作为参考，计算出的BD-rate均有所增益。