CN112509109A

CN112509109A - 一种基于神经网络模型的单视图光照估计方法

Info

Publication number: CN112509109A
Application number: CN202011434315.9A
Authority: CN
Inventors: 徐迪; 李臻; 毛文涛; 孙立
Original assignee: Shanghai Shadow Creator Information Technology Co Ltd
Current assignee: Shanghai Shadow Creator Information Technology Co Ltd
Priority date: 2020-12-10
Filing date: 2020-12-10
Publication date: 2021-03-16

Abstract

本发明公开的基于神经网络模型的单视图光照估计方法，涉及光照估计技术领域，通过使用平面检测神经网络模型对输入的二维图像中的各个平面进行标注，投射至三维空间内，生成三维点云，基于平面三维模型构建相应的能量方程，利用增强拉格朗日求解器迭代并优化该能量方程，得到平面三维模型表面的总体光照向量。利用第一自编码神经网络模型提取平面三维模型的光照深度特征；利用第二自编码网络模型提取目标虚拟物体的光照深度特征；利用生成对抗神经网络模型将平面三维模型的光照深度特征通过领域适应的形式迁移至目标虚拟物体上，得到虚拟物体对应的光照渲染效果，提高了光照结果的准确度及虚拟物体与真实物体融合的效果。

Description

一种基于神经网络模型的单视图光照估计方法

技术领域

本发明涉及光照估计技术技术领域，具体涉及一种基于神经网络模型的单视图光照估计方法。

背景技术

目前市面上的光照估计技术，均需要依靠单张二维图像去复原高动态全景图，而这类直接复原的方式具有极强的不适定性。即使由有监督学习的神经网络去实现，也因为训练数据的缺少而导致过拟合问题，从而导致在某些现实场景中得到的光照结果是错误的。

发明内容

为解决现有技术的不足，本发明实施例提供了一种基于神经网络模型的单视图光照估计方法，该方法包括以下步骤：

使用平面检测神经网络模型对输入的二维图像中的各个平面进行标注，得到所述二维图像对应的三维旋转平移矩阵；

从所述各个平面中选取面积最大的平面，根据所述三维旋转平移矩阵将所述二维图像的各个像素点投射至三维空间内，生成三维点云；

对所述三维点云做网格化处理，得到含有颜色信息的平面三维模型；

基于所述平面三维模型表面的明暗关系、各个像素点的法向量，以及光照分段平滑的特性，构建相应的能量方程；

利用增强拉格朗日求解器迭代并优化所述能量方程，得到所述平面三维模型表面的总体光照向量。

优选地，在得到所述平面三维模型表面的总体光照向量之后，所述方法还包括：

利用第一自编码神经网络模型提取所述平面三维模型的光照深度特征；

利用第二自编码网络模型提取目标虚拟物体的光照深度特征；

利用生成对抗神经网络模型将所述平面三维模型的光照深度特征通过领域适应的形式迁移至目标虚拟物体上。

优选地，在利用生成对抗神经网络模型将所述平面三维模型的光照深度特征通过领域适应的形式迁移至目标虚拟物体上之后，所述方法还包括：

将所述虚拟物体的光照深度特征为输入第一/二自编码神经网络模型，得到所述虚拟物体对应的光照渲染效果；

在所述二维图像中的任意位置上加入渲染后的虚拟物体，融合虚拟物体与所述二维图像。

优选地，所述第一自编码网络模型包括卷积层、转置层和全连接层。

优选地，所述第二自编码网络模型包括卷积层、转置层和全连接层。

本发明实施例提供的基于神经网络模型的单视图光照估计方法具有以下有益效果：

(1)通过采用生成对抗神经网络，将二维图像中真实的平面三维模型的光照效果迁移至目标虚拟物体上，实现了光照效果由真实平面到虚拟物体的迁移的效果；

(2)通过采用自编码神经网络对虚拟物体进行渲染，使其渲染结果表现出被真实二维图像中的光源所照亮的效果，能够提高虚拟物体与真实物体的融合效果。

具体实施方式

以下结合具体实施例对本发明作具体的介绍。

本发明实施例提供的基于神经网络模型的单视图光照估计方法，该方法包括以下步骤：

S101，使用平面检测神经网络模型对输入的二维图像中的各个平面进行标注，得到所述二维图像对应的三维旋转平移矩阵。

作为一个具体的实施例，该平面检测神经网络模型为PlaneRCNN神经网络模型。

S102，从所述各个平面中选取面积最大的平面，根据所述三维旋转平移矩阵将所述二维图像的各个像素点投射至三维空间内，生成三维点云。

S103，对所述三维点云做网格化处理，得到含有颜色信息的平面三维模型。

S104，基于所述平面三维模型表面的明暗关系、各个像素点的法向量，以及光照分段平滑的特性，构建相应的能量方程。

作为一个具体的实施例，该能量方程包括置信度、明暗关系、总变差、邻域平滑等损失函数。

S105，利用增强拉格朗日求解器迭代并优化所述能量方程，得到所述平面三维模型表面的总体光照向量。

可选地，在得到所述平面三维模型表面的总体光照向量之后，所述方法还包括：

其中，对抗神经网络模型的生成器由多个卷积层构成，对抗神经网络模型的判别器由图卷积层构成。

可选地，在利用生成对抗神经网络模型将所述平面三维模型的光照深度特征通过领域适应的形式迁移至目标虚拟物体上之后，所述方法还包括：

可选地，所述第一自编码网络模型包括卷积层、转置层和全连接层。

可选地，所述第二自编码网络模型包括卷积层、转置层和全连接层。

本发明实施例提供的基于神经网络模型的单视图光照估计方法，通过使用平面检测神经网络模型对输入的二维图像中的各个平面进行标注，得到二维图像对应的三维旋转平移矩阵，从各个平面中选取面积最大的平面，根据三维旋转平移矩阵将二维图像的各个像素点投射至三维空间内，生成三维点云，对该三维点云做网格化处理，得到含有颜色信息的平面三维模型，基于平面三维模型表面的明暗关系、各个像素点的法向量，以及光照分段平滑的特性，构建相应的能量方程，利用增强拉格朗日求解器迭代并优化该能量方程，得到平面三维模型表面的总体光照向量。利用第一自编码神经网络模型提取所述平面三维模型的光照深度特征；利用第二自编码网络模型提取目标虚拟物体的光照深度特征；利用生成对抗神经网络模型将所述平面三维模型的光照深度特征通过领域适应的形式迁移至目标虚拟物体上，得到所述虚拟物体对应的光照渲染效果，提高了光照结果的准确度及虚拟物体与真实物体的融合效果。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、***或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种基于神经网络模型的单视图光照估计方法，其特征在于，包括：

2.根据权利要求1所述的基于神经网络模型的单视图光照估计方法，其特征在于，在得到所述平面三维模型表面的总体光照向量之后，所述方法还包括：

3.根据权利要求2所述的基于神经网络模型的单视图光照估计方法，其特征在于，在利用生成对抗神经网络模型将所述平面三维模型的光照深度特征通过领域适应的形式迁移至目标虚拟物体上之后，所述方法还包括：

在所述二维图像中的任意位置上加入渲染后的虚拟物体，融合所述虚拟物体与所述二维图像。

4.根据权利要求2所述的基于神经网络模型的单视图光照估计方法，其特征在于，所述第一自编码网络模型包括卷积层、转置层和全连接层。

5.根据权利要求2所述的基于神经网络模型的单视图光照估计方法，其特征在于，所述第二自编码网络模型包括卷积层、转置层和全连接层。

6.一种计算机程序产品，其特征在于，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，使所述计算机执行如权利要求1-5所述的方法。

7.一种非暂态计算机可读存储介质，其特征在于，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行如权利要求1-5所述的方法。