CN102368824B

CN102368824B - 视频立体转换方法

Info

Publication number: CN102368824B
Application number: CN2011102762754A
Authority: CN
Inventors: 戴琼海; 杨铀
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2011-09-16
Filing date: 2011-09-16
Publication date: 2013-11-20
Anticipated expiration: 2031-09-16
Also published as: CN102368824A

Abstract

本发明提出一种视频立体转换方法，包括以下步骤：获取输入视频的视点数n及裸眼立体显示所需的视点数N，其中，n＜N；获取输入视频的每个视点的关键帧并计算其场景深度以获得输入视频的每个视点的关键帧的深度图；根据输入视频的每个视点的相邻两个关键帧及其对应的深度图，获取相邻两个关键帧之间的非关键帧的深度图，并重复该步骤获得输入视频的每个视点的所有非关键帧的深度图；根据输入视频的图像和输入视频的每个视点的深度图，绘制N-n视点的图像，并与输入视频的图像构成N视点图像；对N视点图像进行像素排列以获得适于裸眼立体显示设备的N视点图像。本发明的方法可快捷地将单视点平面、双目立体等视频实现裸眼3D立体显示，节约制作周期及成本。

Description

视频立体转换方法

技术领域

本发明涉及计算机视觉技术领域，特别涉及一种视频立体转换方法。

背景技术

随着3D立体显示技术的不断发展，立体电影、电视、移动设备等立体产品迅速普及，大众对立体视频的需求也越来越多。现有技术中的立体视频通过双目方式进行显示，观看过程中需要通过主动快门式、偏振式、红蓝式眼镜等将双目图像分别发送至人的左右两眼，从而形成立体视觉感知。这种方式需要用户佩戴眼镜，观看不便。

针对现有技术中需要佩戴眼镜观看3D视频的缺陷，现有技术采用裸眼3D立体显示设备显示。裸眼3D立体显示技术能够让用户无需佩戴辅助设备即可观看到视频所具有的立体效果，是未来家庭、广告、展示等场合中用于立体观看较为理想的方式。现有技术存在的问题是，在裸眼3D立体显示设备上进行立体显示，需要根据该显示设备所提供的观看视点数量N，向该设备同时输入等量视点N的视频信号源，导致裸眼3D立体显示设备的视频源获取困难。

现有技术中，采用开发具有N个视点的视频采集设备进行同步采集的方法为裸眼立体显示设备提供视频源，这种方法存在的问题是，一方面制作成本高、周期长，对采集设备及辅助控制设备的要求高，另一方面现有的大量视频资料，例如单视点平面节目源、双目立体节目源等在裸眼3D立体显示设备上难以显示。

发明内容

本发明的目的旨在至少解决上述技术缺陷之一。

为达到上述目的，本发明提出一种视频立体转换方法，包括以下步骤：S1：获取输入视频的视点数n；S2：获取裸眼立体显示所需的视点数N，其中，n＜N；S3：获取所述输入视频的每个视点的关键帧，计算所述输入视频的每个视点的关键帧的场景深度，获得所述输入视频的每个视点的关键帧的深度图；S4：根据所述输入视频的每个视点的相邻两个关键帧和所述相邻两个关键帧的深度图，获得所述相邻两个关键帧之间的非关键帧的深度图；S5：重复步骤S4，获得所述输入视频的每个视点的所有非关键帧的深度图；S6：根据所述输入视频的图像和所述输入视频的每个视点的深度图，绘制N-n视点的图像，并与所述输入视频的图像构成N视点图像；S7：对所述N视点图像进行像素排列以获得适于预定裸眼立体显示设备的N视点图像。

在本发明的一个实施例中，所述步骤S1进一步包括：S11：判断所述输入视频的文件个数；S12：如果所述输入视频的文件个数不为1，则所述输入视频的视点数n为所述文件个数；S13：如果所述输入视频的文件个数为1，则进一步判断所述文件的分段点数，所述输入视频的视点数n为所述文件的分段点数。

在本发明的一个实施例中，所述步骤S3进一步包括：如果所述输入视频的视点数n＝1，则获取所述视点的关键帧，计算所述视点的关键帧的场景深度以获得所述视点的关键帧的深度图；如果所述输入视频的视点数n＝2，则获取所述输入视频的每个视点的关键帧，并计算所述输入视频的视差，并根据所述视差与场景深度的转换关系，获得所述输入视频的每个视点的关键帧的深度图。

在本发明的一个实施例中，所述步骤S4进一步包括：S41：根据所述每个视点的相邻两个关键帧K_n和K_n+1，以及关键帧K_n对应的深度图DK_n和关键帧K_n+1对应的深度图DK_n+1，获得所述关键帧K_n和K_n+1之间的非关键帧F_i(i＝1，2，...，t)，其中t为非关键帧的个数；S42：计算K_n与F₁之间、F₁与F₂之间、...、F_t-1与F_t之间的光流图，并以所述光流图为基准将DK_n在非关键帧F_i(i＝1，2，...，t)中进行像素拷贝，获得非关键帧F_i(i＝1，2，...，t)的第一深度图

(i＝1，2，...，t)；S43：对所述第一深度图

(i＝1，2，...，t)进行中值滤波获得第三深度图

(i＝1，2，...，t)；S44：计算K_n+1与F_t之间、F_t与F_t-1之间、...、F₂与F₁之间的光流图，并以所述光流图为基准将DK_n+1在非关键帧F_i(i＝t，t-1，t-2，...，1)中进行像素拷贝，获得非关键帧F_i(i＝1，2，...，t)的第二深度图

(i＝1，2，...，t)；S45：对所述第二深度图(i＝1，2，...，t)进行中值滤波获得第四深度图

(i＝1，2，...，t)；S46：计算所述第三深度图

(i＝1，2，...，t)和所述第四深度图

(i＝1，2，...，t)中的对应像素点的求均值，获得非关键帧的深度图DF_i(i＝1，2，...，t)。

在本发明的一个实施例中，所述步骤S6进一步包括：如果所述输入视频的视点数n＝1，则获取所述视点的图像及其深度图，并按照预定期望视点位置进行像素点绘制；如果所述输入视频的视点数n＝2，则获取所述每个视点的图像及其深度图，并获得所述每个视点位置与预定的期望视点位置的距离DL和DR以及所述每个视点位置的距离D，所述期望视点位置点的像素值按照以下公式计算，

Pixel＝Pixel(L)*DR/D+Pixel(R)*DL/D，其中，Pixel(L)为与所述预定的期望视点位置距离DR对应视点的像素值，Pixel(R)为与所述预定的期望视点位置距离DL对应视点的像素值。

在本发明的一个实施例中，还包括：如果所述预定的期望视点位置的个数大于1，则根据所述预定的期望视点位置重复执行像素点绘制。

在本发明的一个实施例中，所述步骤S6还包括：如果所述输入视频的视点数n＞1，根据所述视频n视点的图像及所述视频的视差图，绘制N-n视点的图像，与所述n视点的图像构成所述裸眼立体显示的N视点图像。

根据本发明实施例的视频立体转换方法，至少具有以下有益效果：

(1)实现输入视频的适用于裸眼立体显示设备的多目视频转换，取得良好的裸眼立体观看效果。

(2)节约了裸眼3D立体显示技术的制作成本高，同时缩短制作周期。

(3)可方便地将现有的大量视频资料在裸眼3D立体显示设备上进行显示。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为本发明实施例的视频立体转换方法流程图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

图1为本发明实施例的视频立体转换方法流程图。如图1所示，根据本发明实施例的视频立体转换方法，包括以下步骤：

步骤S101：获取输入视频的视点数n。

其中，输入视频可包括单视点平面视频和双目立体视频。

具体地，可首先判断输入视频的文件个数。如果输入视频的文件个数不为1，则输入视频的视点数n为文件个数；如果输入视频的文件个数为1，则进一步判断文件的分段点数，输入视频的视点数n为文件的分段点数。

步骤S102：获取裸眼立体显示所需的视点数N，其中，n＜N。

其中，根据裸眼立体显示设备获取裸眼立体显示所需的视点数N。

步骤S103：获取输入视频的每个视点的关键帧，计算输入视频的每个视点的关键帧的场景深度，获得输入视频的每个视点的关键帧的深度图。

具体地，在本发明的一个实施例中，可通过如下的方法获得输入视频的每个视点的关键帧的深度图。

首先获取输入视频的每个视点的关键帧。

其中，获取输入视频的每个视点的关键帧的方法可参考专利ZL200810225050.4所述的方法，同时也可选择其他的选取算法，例如基于镜头边缘获取关键帧的方法、基于运动分析获取关键帧的方法、基于图像信息获取关键帧的方法和基于视频聚类获取关键帧的方法。

然后，根据输入视频的每个视点的关键帧计算其场景深度，获得输入视频的每个视点的关键帧的深度图。

具体地，如果输入视频的视点数n＝1，则根据获取到的视点关键帧，计算关键帧的场景深度以获得视点的关键帧的深度图，例如，可利用专利ZL200710117654.2所述的方法获得视点的关键帧的深度图，也可选择其他的方法。

如果输入视频的视点数n＝2，则根据获取到的每个视点的关键帧，计算输入视频的视差，再根据视差与场景深度的转换关系，获得输入视频的每个视点的关键帧的深度图。

其中，关键帧的视差计算可采用典型的立体匹配方法，也可选择其他的方法。

视差与场景深度均可用于描述场景的三维信息，视差与场景深度可相互转换的。

步骤S104：根据输入视频的每个视点的相邻两个关键帧和相邻两个关键帧的深度图，获取相邻两个关键帧之间的非关键帧的深度图。

具体地，首先根据每个视点的相邻两个关键帧K_n和K_n+1，以及关键帧K_n对应的深度图DK_n和关键帧K_n+1对应的深度图DK_n+1，获取关键帧K_n和K_n+1之间的非关键帧F_i(i＝1，2，...，t)，其中t为非关键帧的个数。

计算K_n与F₁之间、F₁与F₂之间、...、F_t-1与F_t之间的光流图，并以光流图为基准将DK_n在非关键帧F_i(i＝1，2，...，t)中进行像素拷贝，获取非关键帧F_i(i＝1，2，...，t)的第一深度图

(i＝1，2，...，t)。

对第一深度图(i＝1，2，...，t)进行中值滤波获取第三深度图

(i＝1，2，...，t)。

计算K_n+1与F_t之间、F_t与F_t-1之间、...、F₂与F₁之间的光流图，并以光流图为基准将DK_n+1在非关键帧F_i(i＝t，t-1，t-2，...，1)中进行像素拷贝，获取非关键帧F_i(i＝1，2，...，t)的第二深度图

(i＝1，2，...，t)。

对第二深度图

(i＝1，2，...，t)进行中值滤波获取第四深度图

(i＝1，2，...，t)。

其中，第三深度图

(i＝1，2，...，t)和第四深度图

(i＝1，2，...，t)的中值滤波方法相同。

计算第三深度图

(i＝1，2，...，t)和第四深度图

(i＝1，2，...，t)中的对应像素点的求均值，获取非关键帧的深度图DF_i(i＝1，2，...，t)。

步骤S105：重复步骤S104，获得输入视频的每个视点的所有非关键帧的深度图。

具体地，根据步骤S104所述的方法，计算输入视频所有两个相邻的关键帧之间的非关键帧的深度图，由此获得输入视频的每个视点的所有非关键帧的深度图。

步骤S106：根据输入视频的图像和输入视频的每个视点的深度图，绘制N-n视点的图像，并与输入视频的图像构成N视点图像。

具体地，如果输入视频的视点数n＝1，则获取视点的图像及其对应的深度图，并按照预定期望视点位置进行像素点绘制。

如果视频的视点数n＝2，则获取每个视点的图像及其对应的深度图，获得每个视点位置与预定的期望视点位置的距离DL和DR以及每个视点位置的距离D，期望视点位置点的像素值按照以下公式计算，

Pixel＝Pixel(L)*DR/D+Pixel(R)*DL/D，其中，Pixel(L)为与预定的期望视点位置距离DR对应视点的像素值，Pixel(R)为与预定的期望视点位置距离DL对应视点的像素值。

其中，如果预定期望视点位置的个数大于1，则根据预定的期望视点位置重复执行像素点绘制。

另外，如果输入视频的视点数n＞1，根据视频n视点的图像及视频的视差图，也可绘制N-n视点的图像，与n视点的图像构成裸眼立体显示的N视点图像。绘制方法与基于深度图的绘制方法相同。

步骤S107：对N视点图像进行像素排列以获得适于预定裸眼立体显示设备的N视点图像。

具体地，对N视点图像进行像素排列方法可采用专利CN200910088902.4所述的方法，也可采用其他方法。

根据本发明实施例的方法，至少具有以下有益效果：

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同限定。

Claims

1.一种视频立体转换方法，其特征在于，包括以下步骤：

S1：获取输入视频的视点数n；

S2：获取裸眼立体显示所需的视点数N，其中，n<N；

S3：获取所述输入视频的每个视点的关键帧，计算所述输入视频的每个视点的关键帧的场景深度，获得所述输入视频的每个视点的关键帧的深度图，具体包括：如果所述输入视频的视点数n=1，则获取所述视点的关键帧，计算所述视点的关键帧的场景深度以获得所述视点的关键帧的深度图；

如果所述输入视频的视点数n=2，则获取所述输入视频的每个视点的关键帧，并计算所述输入视频的视差，并根据所述视差与场景深度的转换关系，获得所述输入视频的每个视点的关键帧的深度图；

S4：根据所述输入视频的每个视点的相邻两个关键帧和所述相邻两个关键帧的深度图，获得所述相邻两个关键帧之间的非关键帧的深度图；

S5：重复步骤S4，获得所述输入视频的每个视点的所有非关键帧的深度图；

S6：根据所述输入视频的图像和所述输入视频的每个视点的深度图，绘制N-n视点的图像，并与所述输入视频的图像构成N视点图像；

S7：对所述N视点图像进行像素排列以获得适于预定裸眼立体显示设备的N视点图像。

2.根据权利要求1所述的视频立体转换方法，其特征在于，所述步骤S1进一步包括：

S11：判断所述输入视频的文件个数；

S12：如果所述输入视频的文件个数不为1，则所述输入视频的视点数n为所述文件个数；

S13：如果所述输入视频的文件个数为1，则进一步判断所述文件的分段点数，所述输入视频的视点数n为所述文件的分段点数。

3.根据权利要求1所述的视频立体转换方法，其特征在于，所述步骤S4进一步包括：

S41：根据所述每个视点的相邻两个关键帧K_n和K_n+1，以及关键帧K_n对应的深度图DK_n和关键帧K_n+1对应的深度图DK_n+1，获得所述关键帧K_n和K_n+1之间的非关键帧F_i(i=1,2,...,t)，其中t为非关键帧的个数；

S42：计算K_n与F₁之间、F₁与F₂之间、…、F_t-1与F_t之间的光流图，并以所述光流图为基准将DK_n在非关键帧F_i(i=1,2,...,t)中进行像素拷贝，获得非关键帧F_i(i=1,2,...,t)的第一深度图DF_i ⁽¹⁾(i=1,2,...,t)；

S43：对所述第一深度图DF_i ⁽¹⁾(i=1,2,...,t)进行中值滤波获得第三深度图DF_i ⁽¹⁰⁾(i=1,2,...,t)；

S44：计算K_n+1与F_t之间、F_t与F_t-1之间、…、F₂与F₁之间的光流图，并以所述光流图为基准将DK_n+1在非关键帧F_i(i=t,t-1,t-2,...,1)中进行像素拷贝，获得非关键帧F_i(i=1,2,...,t)的第二深度图DF_i ⁽²⁾(i=1,2,...,t)；

S45：对所述第二深度图DF_i ⁽²⁾(i=1,2,...,t)进行中值滤波获得第四深度图DF_i ⁽²⁰⁾(i=1,2,...,t)；

S46：计算所述第三深度图DF_i ⁽¹⁰⁾(i=1,2,...,t)和所述第四深度图DF_i ⁽²⁰⁾(i=1,2,...,t)中的对应像素点的求均值，获得非关键帧的深度图DF_i(i=1,2,...,t)。

4.根据权利要求1所述的视频立体转换方法，其特征在于，所述步骤S6进一步包括：

如果所述输入视频的视点数n=1，则获取所述视点的图像及其深度图，并按照预定期望视点位置进行像素点绘制；

如果所述输入视频的视点数n=2，则获取所述每个视点的图像及其深度图，并获得所述每个视点位置与预定的期望视点位置的距离DL和DR以及所述每个视点位置的距离D，所述期望视点位置点的像素值按照以下公式计算，

Pixel=Pixel(L)*DR/D+Pixel(R)*DL/D，

其中，Pixel(L)为与所述预定的期望视点位置距离DR对应视点的像素值，Pixel(R)为与所述预定的期望视点位置距离DL对应视点的像素值。

5.根据权利要求4所述的视频立体转换方法，其特征在于，还包括：

如果所述预定的期望视点位置的个数大于1，则根据所述预定的期望视点位置重复执行像素点绘制。

6.根据权利要求1所述的视频立体转换方法，其特征在于，所述步骤S6还包括：

如果所述输入视频的视点数n>1，根据所述视频n视点的图像及所述视频的视差图，绘制N-n视点的图像，与所述n视点的图像构成所述裸眼立体显示的N视点图像。