CN104506872A - 一种平面视频转立体视频的方法及装置 - Google Patents

一种平面视频转立体视频的方法及装置 Download PDF

Info

Publication number
CN104506872A
CN104506872A CN201410697508.1A CN201410697508A CN104506872A CN 104506872 A CN104506872 A CN 104506872A CN 201410697508 A CN201410697508 A CN 201410697508A CN 104506872 A CN104506872 A CN 104506872A
Authority
CN
China
Prior art keywords
video
module
depth map
depth
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410697508.1A
Other languages
English (en)
Other versions
CN104506872B (zh
Inventor
张新
柯家琪
廖智宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Youshu Technology Co., Ltd.
Original Assignee
SHENZHEN KAIAOSI TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN KAIAOSI TECHNOLOGY Co Ltd filed Critical SHENZHEN KAIAOSI TECHNOLOGY Co Ltd
Priority to CN201410697508.1A priority Critical patent/CN104506872B/zh
Publication of CN104506872A publication Critical patent/CN104506872A/zh
Application granted granted Critical
Publication of CN104506872B publication Critical patent/CN104506872B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/15Processing image signals for colour aspects of image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/111Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种平面视频转立体视频的方法及装置,所述方法包括对平面视频的每一帧图像执行以下步骤:S1、获取当前帧图像的深度图D:通过基于块匹配的运动估计获取第一深度图D1;通过边缘检测算法和霍夫变换算法,基于几何透视关系构建第二深度图D2;通过基于颜色信息的方法估算第三深度图D3;对D1、D2和D3执行深度融合得到深度图D;S2、基于DIBR算法,由参考图和深度图D生成多视点立体视图;S3、根据用户的立体视频格式要求,从多视点立体视图中选取至少部分所述左右眼视图执行立体渲染,以生成相应格式的彩色立体视频。本发明的方法生成的立体视频,不但立体效果佳,而且可以根据用户需求生成不同格式的立体视频。

Description

一种平面视频转立体视频的方法及装置
技术领域
本发明涉及一种平面视频转立体视频的方法及装置。
背景技术
平面视频转立体视频技术,又称2D转3D技术,是指将现有的平面视频使用必要的技术手段,充分挖掘平面视频中的深度信息,根据深度信息模拟多视点观察的虚拟场景,从而达到立体感知的效果。在立体视频技术中,通过双目立体视觉实现立体感知效果。双目立体视觉利用双目成像的原理,通过模拟双目感知成像,将左右两路图像或者视频使用特殊的手段分别投射的人的左右眼中,人的大脑会重构出图像或视频中的立体场景,达到立体感知效果。
立体图像作为一种新型的描述三维世界的方式,它不仅包含传统平面图像的关于场景的表面信息,而且还包含与场景具***置相关的三维立体信息,即深度信息。与传统的平面视频相比,立体视频能对客观世界的具体场景进行更加真实的反映。
通过立体视觉算法可以获得场景的深度图,深度图能够反映出平面图像对应场景的前后或远近的关系。通常在应用中,用8个位深的灰度图像来表示深度图。在深度图上某点的值为0,表示对应平面图像该点的图像位于相对深度范围内的最远处,深度图上某点的深度值为255,表示对应该位置点上的平面图像位于相对深度范围内的最近处,在0~255范围内的的其他值则表示某一个相对深度范围内的深度。
目前3D视频技术已经取得了较为长远的发展,市场上出现了从高端到低端的一系列立体视频采集设备。经过多年的技术积累,立体显示设备的价格也逐渐平民化,3D电视开始走进越来越多的普通家庭。然而近几年来3D产业繁荣的背后,存在高端立体采集设备昂贵,高质量立体片源短缺,人工3D视频制作成本高昂等难题,这些难题逐渐成为3D视频发展的瓶颈。
另外,市场上也存在基于多种显示原理的立体显示设备,如光栅式,快门式,偏振式等。通常快门式和偏振式显示设配需要佩戴特制的立体眼镜才能观看,光栅式的显示设备则不需要特制眼镜即能呈现立体场景,但是光栅式的立体显示设备所支持的立体视频格式有双目格式和多视点格式之分,而现有的立体视频处理装置往往仅能输出某一种格式的立体视频,并且输出的立体视频的立体效果较差,极大的限制了立体视频处理装置的使用范围。
发明内容
本发明的主要目的在于提出一种平面视频转立体视频的方法及装置,以解决现有的立体视频处理装置输出的立体视频格式单一且立体效果欠佳的技术问题。
本发明提出的平面视频转立体视频的方法如下:
一种平面视频转立体视频的方法,包括对平面视频的每一帧图像执行以下步骤:
S1、获取当前帧图像的深度图D:通过基于块匹配的运动估计获取第一深度图D1;通过边缘检测算法和霍夫变换算法提取当前帧图像中的消失点和消失线,根据图像深度与消失点和消失线之间的关系构建第二深度图D2;通过基于颜色信息的方法估算第三深度图D3;对所述第一深度图D1、所述第二深度图D2和所述第三深度图D3执行深度融合,以获取所述当前帧图像的深度图D;
S2、基于DIBR算法,由参考图和所述深度图D生成多视点立体视图,其中所述参考图为所述当前帧图像,所述多视点立体视图包括多对左右眼视图;
S3、根据用户的立体视频输出格式要求,从所述多视点立体视图中选取至少一对所述左右眼视图执行立体渲染,以生成相应格式的彩色立体视频。
上述平面视频转立体视频的方法,对每一帧图像采用不同的方法获取不同的深度图,再将这些以不同方法获得的深度图进行加权融合,得到每一帧图像的一个最终的深度图,再基于该最终的深度图以及该帧图像,采用DIBR算法生成多视点立体视图,执行立体渲染后生成立体视频。由于在本方案中对单帧图像通过不同方法求得多个深度图,再进行深度融合得到最终的深度图,基于该最终的深度图来执行后续的处理,因此最终得到的立体视频的立体效果佳,而且,由于得到的是多视点立体视图,可以从中挑选不同的视图对(一个视图对包括左眼图像和右眼图像),生成不同格式的立体视频,例如,挑选其中某一视点的一对立体视图,生成红蓝格式立体视频、双目格式立体视频或side-by-side格式立体视频;也可以挑选多对立体视图,生成多视点格式立体视频或行交织格式立体视频,用户可以根据其立体显示设备的显示原理进行立体渲染以得到的相应格式的立体视频,供不同显示原理的立体显示设备进行显示。
本发明提出的平面视频转立体视频的装置如下:
一种平面视频转立体视频的装置,包括控制模块、缓存模块、视频转换模块和立体渲染模块;所述缓存模块用于存储待处理的RGB视频以及处理的中间结果;所述视频转换模块分别与所述缓存模块、所述立体渲染模块连接,用于将所述待处理的RGB视频的平面图像转换为多视点立体视图,并将所述多视点立体视图输入至所述立体渲染模块,所述多视点立体视图包括多对左右眼视图;所述立体渲染模块用于根据用户的立体视频输出格式要求从所述多视点立体视图中选取至少一对的所述左右眼视图,并对选取的所述左右眼视图执行立体渲染,生成相应格式的彩色立体视频;所述控制模块分别与所述视频转换模块、所述立体渲染模块连接,用于根据用户要求对所述装置进行配置,所述用户要求包括所述立体视频输出格式要求。
本发明提供的上述平面视频转立体视频的装置相比现有技术,具有以下优点:可以根据用户对输出的立体视频格式要求,从多视点立体视图的多对左右眼视图中,进行不同的选择,将选择的立体视图进行立体渲染,生成相应格式的立体视频,本装置能够满足不同显示原理的立体显示设备,适用范围极为广泛。
附图说明
图1是本发明具体实施例提供的一种平面视频转立体视频的方法流程图;
图2是图1中的步骤40的具体流程图;
图3是边缘检测算法在FPGA中实现的原理图;
图4是霍夫变换算法在FPGA中实现的原理图;
图5是对深度图D进行双边滤波在FPGA中实现的原理图;
图6是本发明具体实施例提供的一种平面视频转立体视频的装置框图;
图7是图6中视频转换模块的一种具体实施例的工作原理框图;
图8是图6中视频输入模块的一种具体实施例的工作原理框图;
图9是图6中视频输出模块的一种具体实施例的工作原理框图;
图10是图6中缓存模块的一种具体实施例的工作原理框图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步说明。
本发明的具体实施方式提供一种平面视频转立体视频的方法,该方法以FPGA为核心处理器件,通过FPGA实现硬件设计,该方法包括对待处理视频(平面视频)中的每一帧图像执行以下步骤,可参考图1:
步骤10:开始
步骤21:通过基于块匹配的运动估计获取第一深度图D1
步骤22:通过边缘检测算法和霍夫变换算法提取当前帧图像中的消失点和消失线,根据图像深度与消失点和消失线之间的关系构建第二深度图D2
步骤23:通过基于颜色信息的方法估算第三深度图D3
步骤30:对第一深度图D1、第二深度图D2和第三深度图D3执行深度融合,得到所述当前帧图像的深度图D
步骤40:基于DIBR(Depth Image Based Rendering,基于深度图像的绘制)算法,由一幅参考图和一幅深度图D生成多视点立体视图,其中所述参考图为所述当前帧图像
步骤50:根据用户的立体视频格式要求,从所述多视点立体视图中选取至少部分视图执行立体渲染,以生成相应格式的彩色立体视频
需要说明,在上述的步骤中,步骤21、22和23是可以同时执行的。
对于步骤21,可以采用一种具体的算法FSBMA(全搜索块匹配算法),包括:假设对一当前帧图像I1执行该步骤21,则还需提取当前帧图像的前一帧图像I2作为参考帧,对当前帧和参考帧,采用基于块匹配的运动估计,计算第一运动矢量,根据当前帧图像I1和第一运动矢量得到预测帧图像Ipre;再以预测帧图像Ipre作为参考帧、所述前一帧图像I2作为当前帧,以前述的方法计算第二运动矢量,根据所述第二运动矢量得到所述当前帧图像I1的第一深度图D1,且第一深度图D1中每个点的灰度值为I1的前一帧图像I2中每个像素的运动矢量的模值。具体地,进行前述的运动估计求取运动矢量可以采用更适合硬件实现的平均绝度值准则(MAD)块匹配准则,即:
MAD = 1 N 2 Σ u = 0 N - 1 Σ v = 0 N - 1 | I 1 ( x , y ) - I 2 ( x + u , y + v ) | - - - ( 1 )
在上述公式(1)中,I1(x,y)为当前帧的像素灰度值,I2(x+u,y+v)为参考帧的像素灰度值,N为选择的宏块尺寸,(x,y)表示运动矢量(或称位移矢量),(u,v)表示宏块内的像素坐标。以公式(1)的方法分别求得前述的第一运动矢量和第二运动矢量。
对于步骤22,所述边缘检测算法使用sobel算子,分别为检测水平边缘的水平算子 - 1 0 1 - 2 0 2 - 1 0 1 以及检测垂直边缘的垂直算子 - 1 - 2 - 1 0 0 0 1 2 1 , 在FPGA中该边缘检测算法实现原理如图3所示,输入原始图像(即所述当前帧图像),采用上述的水平算子和垂直算子,分别执行水平(即横向)边缘检测和垂直(即纵向)边缘检测,再将横向边缘检测图像和纵向边缘检测图像进行梯度结合,进行门限处理,输出边缘检测图像。
所述霍夫变换算法使用极坐标方程表示直线,具体方程如下:
ρ=xcosθ+ysinθ,0≤θ<180        (2)
在上述公式(2)中,ρ表示原点到直线的垂线距离,θ为原点到直线的垂线与x轴方向的夹角,x为像素点相对原点的行坐标,y为像素点相对原点的列坐标。在FPGA中的具体实现原理如图4所示,将图3中得到的边缘检测图像作为霍夫变换算法的输入,根据图4的中的计算流程,输出直线参数,得到消失线,根据几何透视关系“消失线的交点为消失点,消失点为深度最大的点,图像深度沿消失线从最大变化到最小”,得到所述当前帧图像的第二深度图D2
对于步骤23,可以按照如下实现:对所述当前帧图像,计算每个像素的蓝色分量和红色分量的差值(记为第一差值),蓝色分量与绿色分量的差值(记为第二差值),然后将第一差值与第二差值做乘积计算,得到的结果作为第三深度图D3中对应像素的像素值,从而形成完整的第三深度图D3
在FPGA内采用硬件并行计算结构设计,在多个处理单元构成并行处理阵列来同时计算第一深度图D1、第二深度图D2和第三深度图D3,提高实时性。
对于步骤30,可以采用深度图加权融合,获得所需要的最终深度图D,具体实现方法如下:
对第一深度图D1、第二深度图D2和第三深度图D3执行深度图加权融合D=αD1+βD2+γD3,其中α+β+γ=1,并且根据不同的视频场景配置不同的α、β、γ值,如此,基于深度图D经后续处理生成的立体视频的图像清晰度高且立体效果好。例如,当前帧图像中人工场景较多时,加权系数配置为人工场景,即,0.5<α<1,0.2<β<0.5,0<γ<0.1,例如:α=0.6875,β=0.25,γ=0.0625;当前帧图像中自然场景较多时,加权系数配置为自然场景,即0.5<α<1,0<β<0.1,0.2<γ<0.5,例如:α=0.6875,β=0.0625,γ=0.25。
对于步骤40,采用基于深度图像的绘制(DIBR)算法,以所述当前帧图像作为DIBR算法所需的参考图,对深度图D进行双边滤波后作为该算法所需的深度图,从而,由一幅参考图和一幅深度图生成多视点立体视图。具体过程如下:同时参考图2,首先对深度图D进行如图5所示的双边滤波以获得较为平滑的深度图,双边滤波的公式如下,
BF [ I ] p = 1 W p Σ q ∈ S G σs ( | | p - q | | ) G σr ( | I p - I q | ) I q - - - ( 3 )
在上述公式(3)中,BF[I]p即为双边滤波后的深度图,Wp表示归一化参数(以将深度值换算到0~255之间),Gσs、Gσr表示以σs、σr为标准差的高斯函数,Ip、Iq分别表示深度图D的像素点p、像素点q的像素灰度值,S表示像素点p的邻域。如图7所示,输入深度图D,分别计算像素间相似程度的高斯权重指数|Ip-Iq|的和空间距离的高斯权重||p-q||,采用上述公式(3)进行双边滤波时使用负指数计算模块,在FPGA中用CORDIC(Coordinate Rotation DigitalComputer,坐标旋转数字计算)算法分别计算变量值的双曲余弦和双曲正弦,双曲余弦结果减去双曲正弦弦结果获得负指数函数计算结果。考虑到方便FPGA实现并兼顾转换出的立体视频的效果,本例中S取p的八邻域,σs取4、8、16、32中的其中一个,σr取0.5、0.25、0.125、0.0625中的其中一个。
经过上述双边滤波得到平滑的深度图BF[I]p后,基于所述当前帧图像(参考图)和所述深度图BF[I]p使用图像映射公式进行映射以生成多视点立体视图,可参考图2,所述图像映射公式如下:
x l = x c + t x 2 · f Z - - - ( 4 - 1 )
x r = x c - t x 2 · f Z - - - ( 4 - 2 )
在上述公式(4-1)和(4-2)中,xc表示参考图的像素点横坐标,xl表示左眼视图的像素点横坐标,xr表示右眼视图的像素点横坐标;tx表示左右眼视图的基线距离,改变tx即可改变左右眼视图的视差,f为左右眼视图虚拟摄像机焦距,本例中,取f=1,Z为对应像素处的深度值。通过改变基线距离tx,能够获得多对左右眼视图,从而形成所述多视点立体视图。而后可以利用均值滤波对所述多视点立体视图进行必要的空洞填充和修补。
对于步骤50,具体来说,例如可以是:加入用户需要得到红蓝格式或side-by-side格式的立体视频,则从多视点立体视图中选择一对左右眼视图,进行立体渲染即可;如果需要得到多视点立体视频或者行交织立体视频,则需要选取多对左右眼视图进行立体渲染。从而可以生成多种格式的彩色立体视频。
本发明的具体实施方式还提供一种平面视频转立体视频的装置,如图6所示,该装置主要是基于FPGA来构建各个工作模块,该装置包括控制模块、缓存模块、视频转换模块和立体渲染模块;所述缓存模块用于存储待处理的RGB视频以及处理的中间结果;所述视频转换模块分别与所述缓存模块、所述立体渲染模块连接,用于将所述待处理的RGB视频的平面图像转换为多视点立体视图,并将所述多视点立体视图输入至所述立体渲染模块,所述多视点立体视图包括多对左右眼视图;所述立体渲染模块用于根据用户的立体视频输出格式要求从所述多视点立体视图中选取相应的所述左右眼视图,并对选取的所述左右眼视图执行立体渲染,生成相应格式的彩色立体视频;所述控制模块分别与所述视频转换模块、所述立体渲染模块连接,用于根据用户要求对所述装置进行配置,所述用户要求包括所述立体视频输出格式要求。
参考图7,在一些具体的实施例中,所述视频转换模块可以包括第一深度估算模块、第二深度估算模块、第三深度估算模块、深度融合模块和多视点立体视图生成模块,所述第一深度估算模块、所述第二深度估算模块和所述第三深度估算模块均与所述缓存模块和所述深度融合模块连接。
所述第一深度估算模块用于对所述待处理的RGB视频的一当前帧图像执行基于块匹配的运动估计,以获得第一深度图D1,具体的实现方法参考前述方法的步骤21。
所述第二深度估算模块用于对所述当前帧图像执行几何透视关系估算,以获得第二深度图D2,具体的实现方式参考前述的步骤22以及图3、图4。
所述第三深度估算模块用于对所述当前帧图像执行基于颜色信息的估算,以获得第三深度图D3,具体的实现方式参考前述的步骤23。
所述深度融合模块用于对所述第一深度图D1、所述第二深度图D2和所述第三深度图D3执行深度图加权融合,以获得所述当前帧图像的深度图D,具体的实现方式参考前述的步骤30。
所述多视点立体视图生成模块用于基于所述深度图D和所述当前帧图像,生成所述多视点立体视图。如图7所示,经所述视频转换模块处理后生成多视点立体视图,再通过所述立体渲染模块,从多视点立体视图中挑选相应的左右眼视图进行立体渲染,可生成不同格式的立体视频,可参考前述提供的平面视频转立体视频的方法,在此不再赘述。
在一些具体的实施例中,参考图6,所述装置还可包括视频输入模块和视频输出模块:所述视频输入模块与所述缓存模块连接,用于向所述缓存模块输入所述待处理的RGB视频;所述视频输出模块与所述立体渲染模块连接,用于将所述彩色立体视频输出;所述控制模块包括数据配置模块和人机通信模块,其中,所述数据配置模块分别与所述视频转换模块、所述立体渲染模块、所述视频输入模块、所述视频输出模块、所述人机通信模块连接。更加优选地,所述人机通信模块包括人机接口和上位机通信模块,其中人机接口可以包括按键面板和遥控模块,用户可以通过按键面板、遥控模块或者上位机通信模块完成对所述装置的配置。
在更加优选的实施例中,参考图8,所述视频输入模块具体包括视频信号输入面板100、视频输入转换器群组300和输入信号选择器500,其中,所述输入信号选择器500与所述数据配置模块连接;参考图9,所述视频输出模块具体包括输出信号选择器200、视频输出转换器群组400和视频信号输出面板600,其中,所述输出信号选择器与所述数据配置模块连接;如图8和9所示,所述视频信号输入面板100和所述视频信号输出面板600均包括有多种视频接口,例如AV接口、BNC接口、VGA接口等多个接口,所述视频输入转换器群组300和所述视频输出转换器群组400均包括分别对应每种所述视频接口的多个转换器,例如AV转换器、BNC转换器、VGA转换器等;如图6、8和9所示,所述人机通信模块用于输入所述用户要求,所述数据配置模块根据所述用户要求分别对所述输入信号选择器500、所述信号输出选择器200、所述视频转换模块、所述立体渲染模块进行所述配置。举例:如果需要将来自BNC接口的平面视频转换为立体视频,并以AV接口形式输出进行播放,则用户从人机通信模块输入配置数据,使数据配置模块对输入信号选择器500进行配置,以从所述视频输入转换器群组300中选择BNC转换器,对BNC接口输入的平面视频进行转换,转换为所述视频转换模块通用的24bit RGB视频(平面),再输入至所述缓存模块或者同时输入缓存模块和视频转换模块,执行前述的平面视频转立体视频的方法,用户根据所用的立体显示设备,对立体渲染模块进行数据配置,以渲染出与其所用的立体显示设备匹配的格式(例如红蓝格式、多视点格式、side-by-side格式、行交织格式等)的彩色立体视频,用户再对输出信号选择器200进行数据配置,使输出信号选择器200从所述视频输出转换器群组400中选择AV转换器,将立体渲染模块输出的彩色立体视频转换成与AV接口匹配的立体视频,即可输出播放。
用户通过人机通信模块向数据配置模块输入数据以对所述装置进行配置可以包括多种配置,除前述描述之外,还可以选择所述视频场景(人工场景或自然场景)以调节立体转换的效果。其中数据配置模块即负责将用户输入的配置数据配置到相应的模块。
所述遥控模块例如包括无线遥控器和遥控信号接收模块,用户可以通过遥控模块进行数据配置,使用无线遥控器远距离地完成视频信号输入接口的配置,视频信号输出接口的配置,输出的立体视频格式的选择,立体视频转换效果的调节,视频场景转换模式的选择等操作。所述按键面板包括多个功能子按键,用户可通过相应的按键配置视频信号输入接口,配置视频信号输出接口,配置输出立体视频格式,调节立体视频转换效果等操作。
所述上位机通信模块可以以某种通信手段与PC上位机进行通信,通过上位机通信模块,可以将装置当前的状态信息传输到上位机,也可以在上位机上通过该模块完成对装置的配置。
所述缓存模块包括FPGA片内的存储控制模块和片外大容量SDRAM,参考图10,用于缓存前端模块(例如前述的视频输入模块)输入的24bit RGB数字视频信号以及转换算法的中间结果和最终结果等数据。所述存储控制模块使用FPGA片内RAM、FIFO控制模块、SDRAM控制模块构成异步大容量FIFO结构缓存。另外,通过所述存储控制模块内的SDRAM控制器实现对SDRAM的随机读写。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干等同替代或明显变型,而且性能或用途相同,都应当视为属于本发明的保护范围。

Claims (14)

1.一种平面视频转立体视频的方法,包括对平面视频的每一帧图像执行以下步骤:
S1、获取当前帧图像的深度图D:通过基于块匹配的运动估计获取第一深度图D1;通过边缘检测算法和霍夫变换算法提取当前帧图像中的消失点和消失线,根据图像深度与消失点和消失线之间的关系构建第二深度图D2;通过基于颜色信息的方法估算第三深度图D3;对所述第一深度图D1、所述第二深度图D2和所述第三深度图D3执行深度融合,以获取所述当前帧图像的深度图D;
S2、基于DIBR算法,由参考图和所述深度图D生成多视点立体视图,其中所述参考图为所述当前帧图像,所述多视点立体视图包括多对左右眼视图;
S3、根据用户的立体视频格式要求,从所述多视点立体视图中选取至少一对所述左右眼视图执行立体渲染,以生成相应格式的彩色立体视频。
2.如权利要求1所述的方法,其特征在于:所述步骤S1中获取所述第一深度图D1具体包括:提取缓存中的连续两帧图像分别为I1、I2,以I1作为当前帧、I2作为参考帧,其中I2为I1的前一帧,通过基于块匹配的运动估计,计算第一运动矢量,根据当前帧I1和所述第一运动矢量,得到预测帧Ipre;再以预测帧Ipre作为参考帧,I2作为当前帧,通过基于块匹配的运动估计,计算第二运动矢量,根据所述第二运动矢量,获得所述第一深度图D1,其中,所述第一深度图D1中每个点的灰度值为I2中的每个像素的运动矢量的模值。
3.如权利要求2所述的方法,其特征在于:在FPGA内采用并行算法进行所述运动估计的硬件结构设计,并在FPGA的多个处理单元内构成并行处理阵列以同时计算所述第一深度图D1、所述第二深度图D2和所述第三深度图D3
4.如权利要求1所述的方法,其特征在于:所述步骤S1中所述图像深度与消失点和消失线之间的关系为:消失线的交点为消失点,消失点为深度最大的点,图像深度沿消失线从最大变化到最小。
5.如权利要求1所述的方法,其特征在于:所述步骤S1中获取所述第三深度图像D3具体包括:计算所述当前帧图像中每个像素的蓝色分量与红色分量的第一差值、蓝色分量与绿色分量的第二差值,以所述第一差值与所述第二差值的乘积作为所述第三深度图的每个像素的像素值,从而获得所述第三深度图D3
6.如权利要求1所述的方法,其特征在于:所述步骤S1中进行所述深度融合以获取所述深度图D具体包括:对所述第一深度图D1、所述第二深度图D2和所述第三深度图D3执行深度图加权融合D=αD1+βD2+γD3,其中α+β+γ=1。
7.如权利要求6所述的方法,其特征在于:所述视频场景包括人工场景和自然场景,当视频场景为人工场景时,0.5<α<1,0.2<β<0.5,0<γ<0.1;当视频场景为自然场景时,0.5<α<1,0<β<0.1,0.2<γ<0.5。
8.如权利要求1所述的方法,其特征在于:所述步骤S2具体包括:
S21、对所述深度图D进行双边滤波;
S22、使用图像映射公式完成多视点图像的映射,生成所述多视点立体视图;
S23、对所述多视点立体视图进行空洞填充和修补。
9.一种平面视频转立体视频的装置,其特征在于:包括控制模块、缓存模块、视频转换模块和立体渲染模块;
所述缓存模块用于存储待处理的RGB视频以及处理的中间结果;
所述视频转换模块分别与所述缓存模块、所述立体渲染模块连接,用于将所述待处理的RGB视频的平面图像转换为多视点立体视图,并将所述多视点立体视图输入至所述立体渲染模块,所述多视点立体视图包括多对左右眼视图;
所述立体渲染模块用于根据用户的立体视频输出格式要求从所述多视点立体视图中选取至少一对所述左右眼视图,并对选取的所述左右眼视图执行立体渲染,生成相应格式的彩色立体视频;
所述控制模块分别与所述视频转换模块、所述立体渲染模块连接,用于根据用户要求对所述装置进行配置,所述用户要求包括所述立体视频输出格式要求。
10.如权利要求9所述的装置,其特征在于:所述视频转换模块包括第一深度估算模块、第二深度估算模块、第三深度估算模块、深度融合模块和多视点立体视图生成模块,所述第一深度估算模块、所述第二深度估算模块和所述第三深度估算模块均与所述缓存模块和所述深度融合模块连接;
所述第一深度估算模块用于对所述待处理的RGB视频的一当前帧图像执行基于块匹配的运动估计,以获得第一深度图D1,所述第二深度估算模块用于对所述当前帧图像执行几何透视关系估算,以获得第二深度图D2,所述第三深度估算模块用于对所述当前帧图像执行基于颜色信息的估算,以获得第三深度图D3
所述深度融合模块用于对所述第一深度图D1、所述第二深度图D2和所述第三深度图D3执行深度图加权融合,以获得所述当前帧图像的深度图D;
所述多视点立体视图生成模块用于基于所述深度图D和所述当前帧图像,生成所述多视点立体视图。
11.如权利要求9所述的装置,其特征在于:还包括视频输入模块和视频输出模块:所述视频输入模块与所述缓存模块连接,用于向所述缓存模块输入所述待处理的RGB视频;所述视频输出模块与所述立体渲染模块连接,用于将转换出的所述彩色立体视频输出;
所述控制模块包括数据配置模块和人机通信模块,其中,所述数据配置模块分别与所述视频转换模块、所述立体渲染模块、所述视频输入模块、所述视频输出模块、所述人机通信模块连接。
12.如权利要求11所述的装置,其特征在于:所述视频输入模块包括视频信号输入面板、视频输入转换器群组和输入信号选择器,其中,所述输入信号选择器与所述数据配置模块连接;
所述视频输出模块包括输出信号选择器、视频输出转换器群组和视频信号输出面板,其中,所述输出信号选择器与所述数据配置模块连接;
所述视频信号输入面板和所述视频信号输出面板均包括有多种视频接口,所述视频输入转换器群组和所述视频输出转换器群组均包括分别对应每种所述视频接口的多个转换器;
所述人机通信模块用于输入所述用户要求,所述数据配置模块根据所述用户要求分别对所述输入信号选择器、所述信号输出选择器、所述视频转换模块、所述立体渲染模块进行所述配置。
13.如权利要求12所述的装置,其特征在于:所述视频信号输入面板用于从多种视频接口接入平面视频;当所述视频信号输入面板的一特定视频接口处接入平面视频时,所述输入信号选择器根据所述用户要求从所述视频输入转换器群组的多个所述转换器中选择与所述特定视频接口对应的特定转换器,所述特定转换器用于将所述特定视频接口处输入的平面视频转换为所述待处理的RGB视频,并输出至所述缓存模块和所述视频转换模块;所述用户要求包括从所述人机通信模块输入的用于表征当前平面视频的输入接口的数据。
14.如权利要求12所述的装置,其特征在于:所述用户要求包括从所述人机通信模块输入的用于表征所述彩色立体视频需从某一特定视频接口输出的数据;所述输出信号选择器根据所述用户要求从所述视频输出转换器群组的多个所述转换器中选择与所述特定视频接口对应的特定转换器,所述特定转换器用于将来自所述立体渲染模块的所述彩色立体视频转换为与所述特定视频接口匹配的立体视频。
CN201410697508.1A 2014-11-26 2014-11-26 一种平面视频转立体视频的方法及装置 Active CN104506872B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410697508.1A CN104506872B (zh) 2014-11-26 2014-11-26 一种平面视频转立体视频的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410697508.1A CN104506872B (zh) 2014-11-26 2014-11-26 一种平面视频转立体视频的方法及装置

Publications (2)

Publication Number Publication Date
CN104506872A true CN104506872A (zh) 2015-04-08
CN104506872B CN104506872B (zh) 2017-09-29

Family

ID=52948579

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410697508.1A Active CN104506872B (zh) 2014-11-26 2014-11-26 一种平面视频转立体视频的方法及装置

Country Status (1)

Country Link
CN (1) CN104506872B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105611271A (zh) * 2015-12-18 2016-05-25 华中科技大学 一种实时立体图像生成***
CN106023299A (zh) * 2016-05-04 2016-10-12 上海玮舟微电子科技有限公司 一种基于深度图的虚拟视图绘制方法及***
CN106060522A (zh) * 2016-06-29 2016-10-26 努比亚技术有限公司 一种视频图像的处理装置及方法
CN106791770A (zh) * 2016-12-20 2017-05-31 南阳师范学院 一种适用于dibr预处理过程的深度图融合方法
CN111033570A (zh) * 2017-08-22 2020-04-17 高通股份有限公司 使用两个渲染计算装置从计算机图形渲染图像
CN111066322A (zh) * 2017-06-14 2020-04-24 华为技术有限公司 通过透视信息进行视频编码的帧内预测
CN112700485A (zh) * 2020-12-31 2021-04-23 重庆电子工程职业学院 图像深度信息提取方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101789123A (zh) * 2010-01-27 2010-07-28 中国科学院半导体研究所 一种创建基于单目机器视觉距离图的方法
CN102223553A (zh) * 2011-05-27 2011-10-19 山东大学 一种二维视频到三维视频的自动转换方法
CN102750711A (zh) * 2012-06-04 2012-10-24 清华大学 一种基于图像分割和运动估计的双目视频深度图求取方法
CN103220545A (zh) * 2013-04-28 2013-07-24 上海大学 一种立体视频实时深度估计***硬件实现方法
CN103248909A (zh) * 2013-05-21 2013-08-14 清华大学 平面视频转化为立体视频的方法及***
JP2013172214A (ja) * 2012-02-17 2013-09-02 Sony Corp 画像処理装置、および画像処理方法、並びにプログラム
CN104052990A (zh) * 2014-06-30 2014-09-17 山东大学 一种基于融合深度线索的全自动二维转三维方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101789123A (zh) * 2010-01-27 2010-07-28 中国科学院半导体研究所 一种创建基于单目机器视觉距离图的方法
CN102223553A (zh) * 2011-05-27 2011-10-19 山东大学 一种二维视频到三维视频的自动转换方法
JP2013172214A (ja) * 2012-02-17 2013-09-02 Sony Corp 画像処理装置、および画像処理方法、並びにプログラム
CN102750711A (zh) * 2012-06-04 2012-10-24 清华大学 一种基于图像分割和运动估计的双目视频深度图求取方法
CN103220545A (zh) * 2013-04-28 2013-07-24 上海大学 一种立体视频实时深度估计***硬件实现方法
CN103248909A (zh) * 2013-05-21 2013-08-14 清华大学 平面视频转化为立体视频的方法及***
CN104052990A (zh) * 2014-06-30 2014-09-17 山东大学 一种基于融合深度线索的全自动二维转三维方法和装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105611271A (zh) * 2015-12-18 2016-05-25 华中科技大学 一种实时立体图像生成***
CN106023299A (zh) * 2016-05-04 2016-10-12 上海玮舟微电子科技有限公司 一种基于深度图的虚拟视图绘制方法及***
CN106023299B (zh) * 2016-05-04 2019-01-04 上海玮舟微电子科技有限公司 一种基于深度图的虚拟视图绘制方法及***
CN106060522A (zh) * 2016-06-29 2016-10-26 努比亚技术有限公司 一种视频图像的处理装置及方法
CN106791770A (zh) * 2016-12-20 2017-05-31 南阳师范学院 一种适用于dibr预处理过程的深度图融合方法
CN111066322A (zh) * 2017-06-14 2020-04-24 华为技术有限公司 通过透视信息进行视频编码的帧内预测
US11240512B2 (en) 2017-06-14 2022-02-01 Huawei Technologies Co., Ltd. Intra-prediction for video coding using perspective information
CN111066322B (zh) * 2017-06-14 2022-08-26 华为技术有限公司 通过透视信息进行视频编码的帧内预测
CN111033570A (zh) * 2017-08-22 2020-04-17 高通股份有限公司 使用两个渲染计算装置从计算机图形渲染图像
CN111033570B (zh) * 2017-08-22 2023-10-20 高通股份有限公司 使用两个渲染计算装置从计算机图形渲染图像
CN112700485A (zh) * 2020-12-31 2021-04-23 重庆电子工程职业学院 图像深度信息提取方法
CN112700485B (zh) * 2020-12-31 2023-02-07 重庆电子工程职业学院 图像深度信息提取方法

Also Published As

Publication number Publication date
CN104506872B (zh) 2017-09-29

Similar Documents

Publication Publication Date Title
CN104506872A (zh) 一种平面视频转立体视频的方法及装置
JP6563453B2 (ja) 例示的な類似画像と関連した例示的な近似奥行きマップを用いた、入力画像に対する奥行きマップの生成
CN101902657B (zh) 一种基于深度图分层的虚拟多视点图像的生成方法
CN101771893B (zh) 一种基于视频序列背景建模的虚拟视点绘制方法
US9525858B2 (en) Depth or disparity map upscaling
CN102254348B (zh) 一种基于自适应视差估计的虚拟视点绘制方法
CN111047709B (zh) 一种双目视觉裸眼3d图像生成方法
CN103238337B (zh) 立体图像获取***及方法
WO2015161541A1 (zh) 一种针对多视点裸眼3d显示的并行同步缩放引擎及方法
CN101873509B (zh) 消除深度图序列背景和边缘抖动的方法
CN102905145B (zh) 立体影像***、影像产生方法、影像调整装置及其方法
CN103248909B (zh) 平面视频转化为立体视频的方法及***
CN103581650B (zh) 双目3d视频转多目3d视频的方法
CN102972038A (zh) 图像处理装置、图像处理方法、程序、集成电路
CN102368826A (zh) 双视点视频到多视点视频的实时自适应生成方法
CN101557534B (zh) 一种从视频相近帧中生成视差图的方法
CN101662695B (zh) 一种获取虚拟视图的方法和装置
CN103260032B (zh) 一种立体视频深度图序列的帧率提升方法
Bleyer et al. Temporally consistent disparity maps from uncalibrated stereo videos
CN104717514A (zh) 多视点图像渲染***及方法
CN103945206A (zh) 一种基于相似帧比较的立体图像合成***
US20140205023A1 (en) Auxiliary Information Map Upsampling
CN110149508A (zh) 一种基于一维集成成像***的阵列图生成及填补方法
CN102780900B (zh) 一种多人多视角立体显示器影像显示方法
CN102595167B (zh) 2d/3d视频转换中的深度归一化方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20190424

Address after: 310000 Room 702, 7th Floor, 15 Yinhu Innovation Center, No. 9 Fuxian Road, Yinhu Street, Fuyang District, Hangzhou City, Zhejiang Province

Patentee after: Hangzhou Youshu Technology Co., Ltd.

Address before: 518000 Shenzhen Nanshan District Shekou Street Park South Road Nanshan Internet Innovation and Creative Service Base A303

Patentee before: SHENZHEN KAIAOSI TECHNOLOGY CO., LTD.

TR01 Transfer of patent right