CN113436335B

CN113436335B - 一种增量式多视图三维重建方法

Info

Publication number: CN113436335B
Application number: CN202110681635.2A
Authority: CN
Inventors: 金晶
Original assignee: Zhaoyuan State Owned Assets Management Co ltd
Current assignee: Zhaoyuan State Owned Assets Management Co ltd
Priority date: 2021-06-18
Filing date: 2021-06-18
Publication date: 2023-06-30
Anticipated expiration: 2041-06-18
Also published as: CN113436335A

Abstract

本发明提出了一种增量式多视图三维重建方法，首先，面向三维网格参数化的人体外形主成分分析，将人体形状参数转化为主成分系数；然后，针对人体三维外形预测设计损失函数，增加厚度变形、宽度变形和高度变形三个额外的输出单元，将人体外形网格的所有顶点平均误差作为损失函数，并将预测的人体外形和真实外形缩放到固定长度；最后，构造和训练网络回归模型，将人体二维轮廓和相机姿势输入编码器，对主成分系数、宽度变形、高度变形、厚度变形因子进行回归，应用逆主成分分析获得重构的人体三维外形；本发明简化了人工过程和配准过程，同时对于重建过程中无需考虑多视图的顺序和数量，适用范围广，使用方式简便。

Description

一种增量式多视图三维重建方法

技术领域

本发明属于人工智能技术领域的，具体地，涉及一种增量式多视图三维重建方法。

背景技术

传统的人体外形三维建模是通过测量人体不同部位的尺寸，采用几何方法进行参数拟合得到重建结果。随着人工智能技术的发展，基于深度学习方法可以通过图像重建解决人体三维建模问题。用于三维重建的卷积神经网络通常有一个编码器，该编码器将人体图像映射为特征向量，然后根据三维形状的表示方式将特征向量解码为所需的三维模型输出。常见的表示方式包括体素、网格和点云。

多视图三维重建可以克服自遮挡问题。基于卷积神经网络可以解决视图数量固定的情况的三维重建。当视图数量变化时需要使用长短期记忆神经网络框架，但如果输入视图的顺序发生改变，则输出不一致。

发明内容

本发明为了解决不同图像顺序、不同图像数量情况下的多视图三维模型重建问题，提出了一种增量式多视图三维重建方法，能够不受输入图像顺序的影响，并且可以推广到任意数量的视图。

本发明是通过以下方案实现的：

一种增量式多视图三维重建方法：

所述方法包括以下步骤：

步骤a：对图像进行人体二维轮廓处理，并将三维模型设计为标准网格结构；分析面向三维网格参数化的人体外形主成分；将人体形状参数转化为主成分系数；

步骤b：针对人体三维外形预测设计损失函数；将人体外形网格的所有顶点平均误差作为损失函数，并将预测的人体外形和真实外形缩放到固定长度；

步骤c：构造和训练网络回归模型，将人体二维轮廓和相机姿势输入编码器，应用逆主成分分析获得重构的人体三维外形。

进一步地，在步骤a中：

步骤a1：制作人体图像二维轮廓外形数据集；在各个角度对人体拍摄1000张以上照片，并将摄像头的外参标注到每个图像上，基于现有分割网络对图像进行人体二维轮廓处理；

步骤a2：设计人体三维模型标准网格；将人体三维模型设计为具有6980个顶点的标准网格，顶点坐标表示为P＝[p_xi p_yi p_zi]^T，其中p_xi、p_yi和p_zi分别表示人体厚度、宽度和高度方向的每个顶点位置，i＝1,…,6980；

步骤a3：分析人体外形变化的主成分系数；将主成分分析方法应用于人体二维轮廓数据集，得到描述人体外形变化的主成分系数C＝[c₀ c₁ c₂ c₃ c₄ c₅ c₆ c₇ c₈ c₉]^T，其中，c₀表示身高；c₁表示胸围；c₂表示臀围；c₃表示腹围；c₄表示侧面压缩拉伸；c₅表示肚子大但整体瘦；c₆表示肚子变大其他部位瘦小；c₇表示身体纵向挤压程度；c₈表示横宽；c₉表示肩宽。

进一步地，在步骤b中：

步骤b1：针对人体三维模型预测，增加厚度变形k_t，宽度变形k_w，高度变形k_h的输出单元；变形后顶点坐标表示为P’＝[k_tp_xi k_wp_yi k_hp_zi]^T；

步骤b2：将人体外形网格的所有顶点平均误差作为损失函数；

将人体三维外形预测损失函数Loss设为人体外形参数变化所带来的6980个顶点通过欧几里得距离d(·,·)描述的平均误差，

步骤b3：在计算人体三维外形损失函数过程中，将预测的人体外形和真实外形缩放到固定长度170cm。

进一步地，在步骤c中：

步骤c1：将人体二维轮廓和相机姿势输入编码器，计算一维特征向量；再将多视图生成的多个特征向量通过池化层组合成单个特征向量；

步骤c2：解码器对主成分系数C，厚度变形k_t，宽度变形k_w，高度变形k_h因子进行回归，线性激活函数应用于所有输出单元；

步骤c3：通过应用逆主成分分析，分别按厚度变形k_t，宽度变形k_w，高度变形k_h进行水平和垂直缩放顶点，并缩放到整个人体，获得重构的人体三维外形。

本发明有益效果

(1)本发明的方法针对人体外形，通过分析主成分模型中的采样形状来绘制人体三维轮廓；

(2)本发明基于深度网络提取人体轮廓和相机姿态数据来推断人体的参数特征和外形，能够处理任意数量的输入视图，而不受输入顺序的影响，实现增量式稠密网格重建；

(3)本发明基于多视图三维重建模型进行增量式重建，简化了人工过程和配准过程，同时对于重建过程中无需考虑多视图的顺序和数量，通过本方法重建，适用范围广，使用方式简便。

附图说明

图1为本发明的方法流程图。

具体实施方式

下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例；基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，一种增量式多视图三维重建方法：

所述方法包括以下步骤：

在步骤a中：

在步骤b中：

步骤b1：为了在人体三维外形预测中提供更大的灵活性，针对人体三维模型预测，增加厚度变形k_t，宽度变形k_w，高度变形k_h的输出单元；变形后顶点坐标表示为P’＝[k_tp_xik_wp_yi k_hp_zi]^T；

在步骤c中：

步骤c1：将人体二维轮廓和相机姿势输入编码器，计算一维特征向量；编码器复制的数量与视图的数量相同，再将多视图生成的多个特征向量通过池化层组合成单个特征向量；

步骤c2：解码器通过两个完全连通的层对主成分系数C，厚度变形k_t，宽度变形k_w，高度变形k_h因子进行回归，线性激活函数应用于所有输出单元；

以上对本发明所提出的一种增量式多视图三维重建方法，进行了详细介绍，对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种增量式多视图三维重建方法，其特征在于：

所述方法包括以下步骤：

在步骤a中：

步骤a3：分析人体外形变化的主成分系数；将主成分分析方法应用于人体二维轮廓数据集，得到描述人体外形变化的主成分系数C＝[c₀ c₁ c₂ c₃ c₄ c₅ c₆ c₇ c₈ c₉]^T，其中，c₀表示身高；c₁表示胸围；c₂表示臀围；c₃表示腹围；c₄表示侧面压缩拉伸；c₅表示肚子大但整体瘦；c₆表示肚子变大其他部位瘦小；c₇表示身体纵向挤压程度；c₈表示横宽；c₉表示肩宽；

2.根据权利要求1所述方法，其特征在于：在步骤b中：

3.根据权利要求2所述方法，其特征在于：在步骤c中：