CN117274344B - 真实材质纹理的模型训练方法、纹理合成及映射方法 - Google Patents

真实材质纹理的模型训练方法、纹理合成及映射方法 Download PDF

Info

Publication number
CN117274344B
CN117274344B CN202311558857.0A CN202311558857A CN117274344B CN 117274344 B CN117274344 B CN 117274344B CN 202311558857 A CN202311558857 A CN 202311558857A CN 117274344 B CN117274344 B CN 117274344B
Authority
CN
China
Prior art keywords
texture
real
basic shape
dimensional
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311558857.0A
Other languages
English (en)
Other versions
CN117274344A (zh
Inventor
方顺
张志恒
冯星
崔铭
吕艳娜
张亚男
胡梓楠
范佳佳
刘锦
刘熠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xuanguang Technology Co ltd
Original Assignee
Beijing Xuanguang Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xuanguang Technology Co ltd filed Critical Beijing Xuanguang Technology Co ltd
Priority to CN202311558857.0A priority Critical patent/CN117274344B/zh
Publication of CN117274344A publication Critical patent/CN117274344A/zh
Application granted granted Critical
Publication of CN117274344B publication Critical patent/CN117274344B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/0985Hyperparameter optimisation; Meta-learning; Learning-to-learn
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/04Texture mapping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/08Volume rendering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/10Geometric effects
    • G06T15/20Perspective computation
    • G06T15/205Image-based rendering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/50Lighting effects
    • G06T15/506Illumination models
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Graphics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Geometry (AREA)
  • Image Generation (AREA)

Abstract

本发明公开了一种真实材质纹理的模型训练方法、纹理合成及映射方法,包括获取三维模型,并对所述三维模型进行处理以分离出所述三维模型包含的基本形状和真实三维材质;对所述基本形状和真实三维材质进行处理,以确定真实三维材质上的采样点、所述采样点在所述基本形状上的投影点,以及预设的参数;基于预设的损失函数,利用所述采样点、所述投影点以及所述预设的参数,对预建立的神经网络模型进行训练。本申请通过神经网络模型能够实现在处理具有层次结构纹理时具有较好的效果,进而克服了相关技术无法较好处理具有层次结构的纹理,进而纹理的映射效果不佳的缺陷。

Description

真实材质纹理的模型训练方法、纹理合成及映射方法
技术领域
本申请涉及图像处理技术领域,尤其涉及一种真实材质纹理的模型训练方法、纹理合成及映射方法。
背景技术
相关技术中,对复杂结构的纹理建模效果较差,只能处理平滑映射到2D参数空间的纹理,对非封闭结构的纹理合成能力有限,无法较好处理具有层次结构的纹理,进而纹理的映射效果不佳。
发明内容
本申请提供一种真实材质纹理的模型训练方法、纹理合成及映射方法,以解决相关技术中存在的技术问题。
第一方面,本发明提供一种真实材质纹理的模型训练方法,包括获取三维模型,并对所述三维模型进行处理以分离出所述三维模型包含的基本形状和真实三维材质;对所述基本形状和真实三维材质进行处理,以确定真实三维材质上的采样点、所述采样点在所述基本形状上的投影点,以及预设的参数;基于预设的损失函数,利用所述采样点、所述投影点以及所述预设的参数,对预建立的神经网络模型进行训练。
可选地,对所述基本形状和真实三维材质进行处理,以确定真实三维材质上的采样点、所述采样点在所述基本形状上的投影点,以及预设的参数包括:基于相机射线确定所述真实三维材质上的采样点;将所述采样点沿着所述基本形状的法线投影到所述基本形状上,得到所述采样点对应的投影点;基于所述采样点和所述对应的投影点之间的距离,确定所述采样点对应的有符号距离场;基于所述投影点、所述基本形状的法线、所述有符号距离场确定局部切线空间表示。
可选地,所述神经网络模型包括多层感知网络;其中,所述多层感知网络的输入层为哈希映射层,所述投影点经过所述哈希映射层处理后得到潜在特征;
所述潜在特征、所述基本形状的法线、所述有符号距离场、以及所述局部切线空间表示被传输至所述多层感知网络中隐藏层的不同节点,并在隐藏层处理后,输出层输出预设物理属性参数,其中,所述预设物理属性参数包括采样点体密度、反射系数、俯仰角、方位角,以及基于所述俯仰角和所述方位角确定出的采样点的法线。
可选地,所述神经网络模型在得到所述预设属性参数后,基于所述预设属性参数进行渲染输出,得到所述采样点对应的颜色;其中,基于所述预设属性参数进行渲染输出,得到所述采样点对应的颜色包括:将所述反射系数、所述采样点的法线、所述基本形状的法线输入至球谐渲染器渲染,得到所述采样点对应的颜色。
可选地,所述神经网络模型还基于所述采样点体密度和所述采样点对应的颜色进行体渲染。
可选地,在对所述神经网络模型进行训练时,总损失函数为:
其中,所述为重建损失,是所述输出与输入的RGB的损失;为重建超参数;所述/>为聚类损失,用于保证相似材质纹理由相似的潜在特征表示;所述/>为聚类超参数;所述/>为失真损失,用于去除浮动伪影;所述/>为失真超参数;所述/>为法线损失,用于基于体密度的负梯度监督俯仰角和方位角;所述/>为法线超参数。
第二方面,本发明提供一种合成真实材质纹理的方法,包括:获取待处理的包含真实材质的三维模型,并对所述待处理的三维模型进行处理以分离出包含的基本形状和真实三维材质;提取面片并对所述面片进行处理,确定面片上采样点、所述面片采样点在所述基本形状上的投影点、以及预设参数;将所述面片上的采样点、所述面片采样点在所述基本形状上的投影点以及所述预设的参数输入至训练完成的所述神经网络模型中,以输出面片中每个采样点的颜色;基于面片匹配算法,对预测出的面片进行匹配,以生成材质纹理。
第三方面,本发明提供一种实现真实材质纹理映射的方法,包括基于材质纹理,在新形状表面直接构建纹理特征,并基于UV参数化的方式控制材质纹理在所述新形状表面的映射。
第四方面,本发明提供一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面任一实现方式所述的方法。
第五方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面提供的方法。
本发明公开了一种真实材质纹理的模型训练方法、纹理合成及映射方法,包括获取三维模型,并对所述三维模型进行处理以分离出所述三维模型包含的基本形状和真实三维材质;对所述基本形状和真实三维材质进行处理,以确定真实三维材质上的采样点、所述采样点在所述基本形状上的投影点,以及预设的参数;基于预设的损失函数,利用所述采样点、所述投影点以及所述预设的参数,对预建立的神经网络模型进行训练。本申请通过神经网络模型能够实现在处理具有层次结构纹理时具有较好的效果,进而克服了相关技术无法较好处理具有层次结构的纹理,进而纹理的映射效果不佳的缺陷。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请一种真实材质纹理的模型训练方法的流程图;
图2为本申请中基本形状提取示意图;
图3为本申请中采样点投影到基本形状的示意图;
图4为本申请中神经网络模型的结构示意图;
图5为本申请中真实材质纹理的合成方法流程图;
图6为本申请面片提取示意图;
图7为本申请提供的一种对应于图1的电子设备的示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图1对真实材质纹理的模型训练方法进行示例性说明。方法包括以下步骤:
步骤101:获取三维模型,并对所述三维模型进行处理以分离出所述三维模型包含的基本形状和真实三维材质。
在本实施例中,真实材质的纹理不仅仅是一张图片,其是具有一层立体结构,这层立体结构称为层次结构。在层次结构下面,是原来的基本形状,比如基本形状树干(其外层是树皮材质纹理)、基本形状木桶体(外层是木桶材质纹理)、基本形状地面(外层是大理石材质纹理)、基本形状香蕉体(外层是香蕉皮材质纹理)等基本形状。也即真实三维材质是由层次结构和三维纹理组成,其中三维纹理就是层次结构不同点的颜色,真实三维材质就是层次结构和三维纹理的统一。
可以获取不同三维模型作为训练样本,并对三维模型进行处理提取基本形状,分离出真实三维材质。参考图2,图2中从左到右的过程示例性示意除了基本形状的提取实现,第一个图为3D模型,其表面具有真实三维材质,可以通过使用COLMAP运用相机参数来估计密度场估计密度场;而后使用于NeRF的神经网络InstantNGP运用密度场,以及MarchingCubes算法,进行渲染和重建一个网格;在构建网格后可以通过ACD将上述网格转换为凸包结构;最后对网格重新网格化,将顶点均匀分布在表面,使得网络更光滑,这个网格成为基本形状。因此一个模型由真实三维材质和基本形状构成,真实三维材质由层次结构和材质纹理构成。
通过使用基于网格的神经隐式表示来分离形状和外观属性,实现了几何和纹理的编辑。相比于使用预测的有向距离场的方法,本方法能够更好地处理非封闭的层次结构,并学习纹理属性。
步骤102:对所述基本形状和真实三维材质进行处理,以确定真实三维材质上的采样点、所述采样点在所述基本形状上的投影点,以及预设的参数。
在本实施例中,通过参考图3,分离出了真实三维材质和基本形状,在此基础上,确定采样点,投影点以及预设参数,相机射线上有许多个采样点,本实施例采用与NeRF一样的采样策略,先通过少量采样点进行均匀采样,然后分别估算出每个采样点的体密度后,根据体密度的大小,在体密度大的地方增加采样点,以实现重要性采样。通过均匀采样和重要性采样,可以得到最终的采样点,比如示例出的图3中的4个黑色点。
在确定采样点后,可以确定对应的投影点,进而基于采样点和投影点确定预设的参数。
本实施例通过使用神经辐射场(NeRF)来捕捉、建模和合成具有层次结构的纹理。相比于传统方法的参数化纹理映射,本方法能够更好地处理具有复杂结构的纹理,并提供更准确的纹理建模能力。克服了相关技术中,通常使用基于参数化的纹理映射方法,这种方法对于具有复杂结构的纹理建模效果较差。传统方法往往只能处理平滑映射到2D参数空间的纹理,对非封闭结构的纹理合成能力有限,无法很好地处理具有层次结构的纹理。
作为本实施例一种可选的实现方式,对所述基本形状和真实三维材质进行处理,以确定真实三维材质上的采样点、所述采样点在所述基本形状上的投影点,以及预设的参数包括:基于相机射线确定所述真实三维材质上的采样点;将所述采样点沿着所述基本形状的法线投影到所述基本形状上,得到所述采样点对应的投影点;
基于所述采样点和所述对应的投影点之间的距离,确定所述采样点对应的有符号距离场;基于所述投影点、所述基本形状的法线、所述有符号距离场确定局部切线空间表示。
在本可选的实现方式中,任一采样点x投影到基本形状上的点为,而投影的方式是沿着基本形状法线方向来投影,其中法线要通过x点,参考图3中的法线n,所以为了确定/>点,需要先求出法线。
示例性地,可以通过点x在基本形状上确定8个最近点,使用KNN算法,计算相邻顶点的法线:/>,/>,其中/>,N=8,w=0.01,/>表示第k个临近点,/>表示临近顶点法线的加权平均值。为了提高鲁棒性,因为当x点距离基本形状较远时,/>第一项并不可靠,此时第二项起到主导作用。
进一步地,在得到法线后,通过法线与基本形状的交点,即沿法线的反方向,即方向来将x投影到基本形状上,可以得到投影点/>
进一步地,通过x点和的距离,求出x点的有符号距离场SDF为/>。基本形状上所有点的SDF值为0。
进一步地,参考图3,相机方向与基本形状的交点不在法线投影点,会导致点是不可微的,为了保证其是可微,可通过梯度下降算法估计法线,有助于基于物理渲染,并且可以通过坐标x反向传播梯度到相机参数,对相机姿态修改是重要的,可以提高重建质量。
示例性地,在构建基于法线的可微投影时,可以通过如下方式构建:
,/>,其中/>是单位矩阵。
本可选的实现方式中,通过结构提取,得到了基本形状上的投影点、基本形状法线/>、SDF值/>,以及局部切线空间表示,即/>,其中t、b、n分别为/>点的切线、副切线和法线,这些是固定的,可以预计算出来。上述参数也是神经网络的输入参数,神经网络的输出为体密度、着色参数、俯仰角和方位角。而网络最原始的输入跟NeRF一样,也是某个三维物体的多个视角的视图,然后每个用每个视图计算损失函数。
步骤103:基于预设的损失函数,利用所述采样点、所述投影点以及所述预设的参数,对预建立的神经网络模型进行训练。
在本实施例中,由前所述真实三维材质由层次结构和材质纹理构成,材质纹理为层次结构上每个点的颜色,不同颜色表示不同纹理,而通过透明度可以通过颜色把层次结构表现出来,因此通过求出相机射线上所有采样点的颜色,就可以得到层次结构和纹理。本实施通过神经网络模型对采样点的颜色实现预测。
作为本实施例一种可选的实现方式,所述神经网络模型包括多层感知网络;
其中,所述多层感知网络的输入层为哈希映射层,所述投影点经过所述哈希映射层处理后得到潜在特征;所述潜在特征、所述基本形状的法线、所述有符号距离场、以及所述局部切线空间表示被传输至所述多层感知网络中隐藏层的不同节点,并在隐藏层处理后,输出层输出预设物理属性参数,其中,所述预设物理属性参数包括采样点体密度、反射系数、俯仰角、方位角,以及基于所述俯仰角和所述方位角确定出的采样点的法线。
本可选的实现方式通过查找哈希表来快速获得图像潜在特征,并通过简单的MLPs就可以获得要得到的参数。
在本可选的实现方式中,参考图4,神经网络模型包括哈希映射层和多层感知器,哈希映射层的输入可以作为多层感知器的输入。哈希映射层中哈希表在训练过程中不断学习,初始值可以随机初始化或者通过截断的正泰分布进行初始化均可,而后随着损失函数的约束,逐步将哈希表中的值转化为真正有用的潜在特征,查表得到的潜在特征输入至隐藏层可以得到不同的参数。
在哈希映射时,以输入投影点为例,确定投影点相邻额度8个网格顶点,而后查找哈希表,来获得输入图像的潜在特征。优选地,可以通过查找两个哈希表,从而得到两个潜在特征,分别为为/>和/>
图像特征和SDF值/>输入到隐藏层第一个MLPs中,预测采样点的体密度。图像特征/>和SDF值/>输入到第二个MLPs中,预测反射系数,由于采用了Phong着色模型,因此反射系数包括了漫反射系数、镜面反射系数和光泽度。通过图像的潜在特征/>和x点的有符号距离场/>预测俯仰角/>,可以将图像特征/>和SDF值/>输入到第三个MLPs中,预测俯仰角,俯仰角是两个法线/>和/>的夹角,它是独立于局部切线空间的属性。方位角/>与局部切线空间的切线/>有关,可以将另一图像特征和SDF值/>输入到第四个MLPs中,预测方位角。通过俯仰角/>和方位角/>,可以计算出真实三维材质法线,即x点的法线/>。本实施例实现了将光照参数与材质颜色分离,克服了传统方法通常将光照和材质的表示混合在一起,难以对纹理进行灵活的渲染的问题。
本实施例克服了相关技术中,从头开始训练时往往难以收敛,需要高分辨率的网格和大量的训练数据,需要进行大量的计算和优化过程,导致计算复杂度较高,不适合实时渲染
作为本实施例一种可选的实现方式,所述神经网络模型在得到所述预设属性参数后,基于所述预设属性参数进行渲染输出,得到所述采样点对应的颜色;
其中,基于所述预设属性参数进行渲染输出,得到所述采样点对应的颜色包括:将所述反射系数、所述采样点的法线、所述基本形状的法线输入至球谐渲染器渲染,得到所述采样点对应的颜色。
在本可选的实现方式中,渲染输出可以包括两个部分,一个是球谐渲染,即用球面谐波来输出采样点颜色,另一个是体渲染,即用相机射线方向所有采样点的颜色,累加成屏幕的颜色。
球面谐波渲染器使用球面谐波函数来描述物体表面的形状和纹理,并将其渲染到屏幕上。它可以通过改变球面谐波函数的系数和阶数来实现不同的渲染效果。在实现时,首先定义球面谐波函数的系数,这些系数用于定义球面谐波函数的形状和振幅。其次,输入光照模型参数,采用Phong光照模型,用MLPs预测的反射系数、镜面反射系数/>和光泽度g对材质反射进行建模,并将这些光照模型参数输入到球谐渲染器中。之后输入真实三维材质和基本形状的各种参数,包括真实三维材质法线/>和基本形状法线/>。最后输出其他参数,包括相机的方向向量、光照的球面谐波函数等。最终通过球谐渲染器,输出预测的采样点颜色/>
在预测到采样点的颜色可以通过体渲染获得相机屏幕的颜色,从而跟视图RGB颜色计算损失。体渲染方式可以与NeRF相同,通过体渲染将所有采样点的颜色和体密度做乘积并累加,得到最终相机屏幕像素的颜色。每个视图所有采样点都做类似的处理。
作为本实施例一种可选的实现方式,在对所述神经网络模型进行训练时,总损失函数为:
其中,所述为重建损失,是所述输出与输入的材质纹理的RGB的损失;所述/>为聚类损失,用于保证相似材质纹理由相似的潜在特征表示;所述为失真损失,用于去除浮动伪影;所述/>为法线损失,用于基于体密度的负梯度监督俯仰角和方位角。
在本可选的实现方式中,相似材质纹理对应的潜在特征在训练过程中具有相似的优化目标(包括漫反射系数、镜面反射系数/>、光泽度g和俯仰角/>)。
引入了一个聚类损失来避免相似纹理的潜在特征落入不同最优解中,聚类损失,其中KL表示KL散度,P和Q是两个学生分布(也叫t分布),其中Q的分布的概率函数为/>,P分布的概率函数为,其中/>是学生分布的自由度,/>表示潜在特征,/>表示可训练的聚类中心。
对每个分辨率级别的哈希表,我们均采用聚类损失来优化哈希表中的嵌入特征。
失真损失是为了去除浮动伪影,
其中s为标准化的射线距离,w是NeRF中透射率的权重。
法线损失用于基于体密度的负梯度来监督两个角/>,其中/>表示体密度。
,/>
神经网络模型在训练后不仅仅训练了每个MLPs的权重参数,也把可学习的哈希表学习完成。
本实施例在NeRF基础上增加哈希表,能够加快预测速度;实现了将光照参数与材质颜色分离,通过改进的NeRF来处理具有层次的真实三维材质结构。神经网络可以估计出每个点的颜色,但没有形成材质纹理,因此需要纹理合成。材质纹理合成之后,还要进行纹理映射,这样就可以将材质纹理映射到任意形状上了。
本申请还提供了一种真实材质纹理的合成方法,参考图5,包括:
步骤501:获取待处理的包含真实材质的三维模型,并对所述待处理的三维模型进行处理以分离出包含的基本形状和真实三维材质:。
在本实施例中,基于前一实施例的方法将真实三维材质和基本形状分离出来,而后可通过神经网络基于基本形状来预测真实三维材质的结构和颜色。
步骤502:提取面片并对所述面片进行处理,确定面片上采样点、所述面片采样点在所述基本形状上的投影点、以及预设参数。
步骤503:将所述面片上的采样点、所述面片采样点在所述基本形状上的投影点以及所述预设的参数输入至训练完成的所述神经网络模型中,以输出面片中每个采样点的颜色。
在本实施例中,参考图6面片提取示意图,通过面片上的采样点求出基本形状的投影点,然后通过投影点从哈希表中查找到纹理的潜在特征,面板上存储的不是真实三维材质,不是纹理颜色,而是通过哈希表查找的潜在特征,面片上有无数采样点,每个采样点都要通过查哈希表得到潜在特征。采样方式可以通过泊松盘采样,使得面片上采样点分布比较均匀。从采样局部坐标空间到世界坐标空间的旋转矩阵记作,从基本形状的局部坐标空间到世界坐标空间的旋转矩阵记作/>。为了纹理映射,将每个面片的/>和/>存储起来。
步骤504:基于面片匹配算法,对预测出的面片进行匹配,以生成材质纹理。
在本实施例中,基于面片匹配算法即patch matching,将面片拼接在一起,形成一张存储潜在特征的大分辨率的材质纹理图。
本申请还提供了一种实现真实材质纹理映射的方法,包括基于材质纹理,在新形状表面直接构建纹理特征,并基于UV参数化的方式控制材质纹理在所述新形状表面的映射。
在实现材质纹理映射时,给定一个已知UV坐标的新形状,比如将榴莲的表皮映射至柚子形状上,要查询三维模型真实材质纹理上点x投影到新形状表面的投影点。通过的UV坐标在合成材质纹理上,通过双线性插值得到潜在特征/>。从三维模型的原始基本形状的局部图像面片到采样图像面片的残差变换为/>,它是通过合成/>纹理和合成/>纹理的最近邻插值得到。通过潜在特征/>和SDF值,网络可预测查询点x的外观和几何形状。通过新形状的切线空间,记为/>,来预测新形状的法线:/>
体密度和反射系数也是通过新形状的潜在特征和SDF值/>来预测。
将上述参数输入到网络中,就可以预测出采样点的颜色,然后通过体渲染,得到渲染出来的新视图,这个视图包含新形状,以及真实三维材质。示例性地,
本实施例通过在神经表示中显式表示纹理,并使用UV参数化来支持纹理的编辑和映射。相比于传统的2D参数化方法,本方法能够更好地处理具有层次结构的纹理,不再局限于平滑映射到2D参数空间的纹理,并提供更灵活的纹理编辑和映射能力。本方法通过将合成的纹理映射到给定的网格上,可以将纹理应用于任意形状的网格。
本申请还提供了一种计算机可读介质,该介质存储有计算机程序,计算机程序可用于执行上述图实施例中提供的基于方法。
本申请还提供了一种对应于实施例的电子设备的示意结构图。如图7所述,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所述的一种模型加载的方法。当然,除了软件实现方式之外,本申请并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机介质中。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (8)

1.一种真实材质纹理的模型训练方法,其特征在于,包括:
获取三维模型,并对所述三维模型进行处理以分离出所述三维模型包含的基本形状和真实三维材质,其中,真实三维材质是由层次结构和三维纹理组成,所述三维纹理为层次结构不同点的颜色;在所述层次结构下面的形状为基本形状;
对所述基本形状和真实三维材质进行处理,以确定真实三维材质上的采样点、所述采样点在所述基本形状上的投影点,以及预设的参数;
基于预设的损失函数,利用所述采样点、所述投影点以及所述预设的参数,对预建立的神经网络模型进行训练;
其中,对所述基本形状和真实三维材质进行处理,以确定真实三维材质上的采样点、所述采样点在所述基本形状上的投影点,以及预设的参数包括:基于相机射线确定所述真实三维材质上的采样点;将所述采样点沿着所述基本形状的法线投影到所述基本形状上,得到所述采样点对应的投影点;基于所述采样点和所述对应的投影点之间的距离,确定所述采样点对应的有符号距离场;基于所述投影点、所述基本形状的法线、所述有符号距离场确定局部切线空间表示;
所述神经网络模型包括多层感知网络;其中,所述多层感知网络的输入层为哈希映射层,所述投影点经过所述哈希映射层处理后得到潜在特征;所述潜在特征、所述基本形状的法线、所述有符号距离场、以及所述局部切线空间表示被传输至所述多层感知网络中隐藏层的不同节点,并在隐藏层处理后,输出层输出预设物理属性参数,其中,所述预设物理属性参数包括采样点体密度、反射系数、俯仰角、方位角,以及基于所述俯仰角和所述方位角确定出的采样点的法线。
2.根据权利要求1所述的真实材质纹理的模型训练方法,其特征在于,所述神经网络模型在得到所述预设属性参数后,基于所述预设属性参数进行渲染输出,得到所述采样点对应的颜色;
其中,基于所述预设属性参数进行渲染输出,得到所述采样点对应的颜色包括:将所述反射系数、所述采样点的法线、所述基本形状的法线输入至球谐渲染器渲染,得到所述采样点对应的颜色。
3.根据权利要求2所述的真实材质纹理的模型训练方法,其特征在于,所述神经网络模型还基于所述采样点体密度和所述采样点对应的颜色进行体渲染。
4.根据权利要求1所述的真实材质纹理的模型训练方法,其特征在于,在对所述神经网络模型进行训练时,总损失函数为:
其中,所述为重建损失,是输出与输入的RGB的损失;/>为重建超参数;所述/>为聚类损失,用于保证相似材质纹理由相似的潜在特征表示;所述为聚类超参数;所述/>为失真损失,用于去除浮动伪影;所述/>为失真超参数;所述/>为法线损失,用于基于体密度的负梯度监督俯仰角和方位角;所述为法线超参数。
5.一种基于权利要求1-4任一项所述方法合成真实材质纹理的方法,其特征在于,包括:
获取待处理的包含真实材质的三维模型,并对所述待处理的三维模型进行处理以分离出包含的基本形状和真实三维材质;
基于真实三维材质提取面片并对所述面片进行处理,确定面片上采样点、所述面片采样点在所述基本形状上的投影点、以及预设参数;
将所述面片上的采样点、所述面片采样点在所述基本形状上的投影点以及所述预设的参数输入至训练完成的所述神经网络模型中,以输出面片中每个采样点的颜色;
基于面片匹配算法,对预测出的面片进行匹配,以生成材质纹理。
6.一种基于权利要求5实现真实材质纹理映射的方法,其特征在于,包括:基于材质纹理,在新形状表面直接构建纹理特征,并基于UV参数化的方式控制材质纹理在所述新形状表面的映射。
7.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~4任一项所述的方法。
8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~4任一项所述的方法。
CN202311558857.0A 2023-11-22 2023-11-22 真实材质纹理的模型训练方法、纹理合成及映射方法 Active CN117274344B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311558857.0A CN117274344B (zh) 2023-11-22 2023-11-22 真实材质纹理的模型训练方法、纹理合成及映射方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311558857.0A CN117274344B (zh) 2023-11-22 2023-11-22 真实材质纹理的模型训练方法、纹理合成及映射方法

Publications (2)

Publication Number Publication Date
CN117274344A CN117274344A (zh) 2023-12-22
CN117274344B true CN117274344B (zh) 2024-02-06

Family

ID=89206730

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311558857.0A Active CN117274344B (zh) 2023-11-22 2023-11-22 真实材质纹理的模型训练方法、纹理合成及映射方法

Country Status (1)

Country Link
CN (1) CN117274344B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003202216A (ja) * 2002-01-08 2003-07-18 Canon Inc 三次元画像処理方法、三次元画像処理装置、三次元画像処理システムおよび三次元画像処理プログラム
JP2011013475A (ja) * 2009-07-02 2011-01-20 Dainippon Printing Co Ltd パターンデータ生成装置、異方性反射を有する媒体およびその製造方法
CN112132943A (zh) * 2020-08-26 2020-12-25 山东大学 一种面向3d打印的过程纹理合成***及方法
CN115512073A (zh) * 2022-09-19 2022-12-23 南京信息工程大学 基于可微分渲染下多阶段训练的三维纹理网格重建方法
CN115601511A (zh) * 2022-12-14 2023-01-13 深圳思谋信息科技有限公司(Cn) 三维重建方法、装置、计算机设备及计算机可读存储介质
CN116109757A (zh) * 2023-01-17 2023-05-12 中国科学技术大学 基于内蕴坐标的哈希编码的动态三维人体渲染合成方法
CN116246023A (zh) * 2023-03-03 2023-06-09 网易(杭州)网络有限公司 三维模型重建方法、装置、设备、存储介质及程序产品
CN116310215A (zh) * 2023-03-03 2023-06-23 网易(杭州)网络有限公司 数据处理方法、三维重建方法及其装置、设备和存储介质
CN116778063A (zh) * 2023-05-31 2023-09-19 南京邮电大学 一种基于特征纹理网格和哈希编码的快速虚拟视点合成方法及装置
CN116977522A (zh) * 2023-06-02 2023-10-31 腾讯科技(深圳)有限公司 三维模型的渲染方法、装置、计算机设备和存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2528655B (en) * 2014-07-24 2020-10-07 Advanced Risc Mach Ltd Graphics Processing Systems
JP6426968B2 (ja) * 2014-10-08 2018-11-21 キヤノン株式会社 情報処理装置およびその方法
WO2021042277A1 (zh) * 2019-09-03 2021-03-11 浙江大学 基于神经网络的三维物体法向量、几何及材质获取方法
DE102020215766A1 (de) * 2020-12-11 2022-06-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung eingetragener Verein Additive Fertigung auf Basis von Feldern von versatzbedingten, vorzeichenbehafteten Abständen
US20230260200A1 (en) * 2022-01-31 2023-08-17 Meta Platforms, Inc. Explicit Radiance Field Reconstruction from Scratch

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003202216A (ja) * 2002-01-08 2003-07-18 Canon Inc 三次元画像処理方法、三次元画像処理装置、三次元画像処理システムおよび三次元画像処理プログラム
JP2011013475A (ja) * 2009-07-02 2011-01-20 Dainippon Printing Co Ltd パターンデータ生成装置、異方性反射を有する媒体およびその製造方法
CN112132943A (zh) * 2020-08-26 2020-12-25 山东大学 一种面向3d打印的过程纹理合成***及方法
CN115512073A (zh) * 2022-09-19 2022-12-23 南京信息工程大学 基于可微分渲染下多阶段训练的三维纹理网格重建方法
CN115601511A (zh) * 2022-12-14 2023-01-13 深圳思谋信息科技有限公司(Cn) 三维重建方法、装置、计算机设备及计算机可读存储介质
CN116109757A (zh) * 2023-01-17 2023-05-12 中国科学技术大学 基于内蕴坐标的哈希编码的动态三维人体渲染合成方法
CN116246023A (zh) * 2023-03-03 2023-06-09 网易(杭州)网络有限公司 三维模型重建方法、装置、设备、存储介质及程序产品
CN116310215A (zh) * 2023-03-03 2023-06-23 网易(杭州)网络有限公司 数据处理方法、三维重建方法及其装置、设备和存储介质
CN116778063A (zh) * 2023-05-31 2023-09-19 南京邮电大学 一种基于特征纹理网格和哈希编码的快速虚拟视点合成方法及装置
CN116977522A (zh) * 2023-06-02 2023-10-31 腾讯科技(深圳)有限公司 三维模型的渲染方法、装置、计算机设备和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
IRON: Inverse Rendering by Optimizing Neural SDFs and Materials From Photometric Images;Kai Zhang et.al;《Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)》;5565-5574 *
点云的三维重建与纹理映射;康豆;《中国优秀硕士学位论文全文数据库 信息科技辑》;全文 *

Also Published As

Publication number Publication date
CN117274344A (zh) 2023-12-22

Similar Documents

Publication Publication Date Title
US11328472B2 (en) Watertight ray triangle intersection
US20240013471A1 (en) Query-specific behavioral modification of tree traversal
US11200725B2 (en) Method for continued bounding volume hierarchy traversal on intersection without shader intervention
US11295514B2 (en) Inverse rendering of a scene from a single image
US11734879B2 (en) Graphics processing using directional representations of lighting at probe positions within a scene
Rosu et al. Permutosdf: Fast multi-view reconstruction with implicit surfaces using permutohedral lattices
CN105378796B (zh) 可伸缩体积3d重构
Uchida et al. Noise-robust transparent visualization of large-scale point clouds acquired by laser scanning
US20230260200A1 (en) Explicit Radiance Field Reconstruction from Scratch
CN115439628A (zh) 通过拓扑采样进行接合点形状和外观优化
CN116664422A (zh) 图像高光处理方法、装置、电子设备及可读存储介质
Mubarik et al. Hardware acceleration of neural graphics
Chen et al. Circle: Convolutional implicit reconstruction and completion for large-scale indoor scene
CN117274344B (zh) 真实材质纹理的模型训练方法、纹理合成及映射方法
Chen et al. Manipulating, deforming and animating sampled object representations
CN115809696A (zh) 虚拟形象模型训练方法及装置
CN112907733A (zh) 重建三维模型的方法及装置和三维模型采集及重建***
CN116612244B (zh) 一种图像生成方法、装置、存储介质及电子设备
Liu et al. Improving RGB-D-based 3D reconstruction by combining voxels and points
CN117689822B (zh) 一种三维模型构建方法、装置、存储介质及电子设备
Li Differentiable Visual Computing: Challenges and Opportunities
CN116844212A (zh) 一种动态人脸图像对齐方法、装置、设备及可读存储介质
Boubekeur et al. Simod: Making freeform deformation size-insensitive
Asthana Neural representations for object capture and rendering
CN116977465A (zh) 基于神经辐射场的纹理采集与合成方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant