CN116109798A - 图像数据处理方法、装置、设备及介质 - Google Patents

图像数据处理方法、装置、设备及介质 Download PDF

Info

Publication number
CN116109798A
CN116109798A CN202310350889.5A CN202310350889A CN116109798A CN 116109798 A CN116109798 A CN 116109798A CN 202310350889 A CN202310350889 A CN 202310350889A CN 116109798 A CN116109798 A CN 116109798A
Authority
CN
China
Prior art keywords
target
image
training
texture
texture map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310350889.5A
Other languages
English (en)
Other versions
CN116109798B (zh
Inventor
李文娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202310350889.5A priority Critical patent/CN116109798B/zh
Publication of CN116109798A publication Critical patent/CN116109798A/zh
Application granted granted Critical
Publication of CN116109798B publication Critical patent/CN116109798B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/20Finite element generation, e.g. wire-frame surface description, tesselation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/04Texture mapping
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Graphics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本申请实施例公开了图像数据处理方法、装置、设备及介质,可应用于图像处理技术领域。其中方法包括:获取目标视点头像图像,基于初始三维面部形状确定目标三维头像网格;对目标视点头像图像进行图像展开处理得到第一目标纹理贴图;基于第一目标纹理贴图得到纹理编码特征,在获取到图像编码特征时,基于纹理编码特征与图像编码特征得到纹理图像拼接特征,对纹理图像拼接特征解码得到第二目标纹理贴图;基于目标三维头像网格和第二目标纹理贴图得到目标渲染头像图像,以生成三维头部模型。采用本申请实施例,能够基于虚拟对象的头像图像自动化重建虚拟对象的三维头部模型,提升渲染得到的三维头部模型的模型渲染效果。

Description

图像数据处理方法、装置、设备及介质
技术领域
本申请涉及图像处理技术领域,尤其涉及图像数据处理方法、装置、设备及介质。
背景技术
三维头像重建,是指基于单视图或多视图的头像图像进行重建得到头部部位的三维信息。三维头像重建技术可以应用于多种场景,如可以用于对游戏中的角色进行三维头像重建,以生成游戏角色的三维模型。目前,基于三维头像重建技术重建游戏角色的三维模型,通常是通过一些神经网络基于单视图或多视图的头部图像重建得到头部部位的三维信息,然后再获取纹理贴图,进而通过人为操作触发基于该三维信息和纹理贴图进行渲染得到游戏角色的三维模型。
发明人在实践中发现,在人为重建三维模型的过程中,需要消耗程序人员和美术人员大量的时间,以至于三维头部模型重建的效率低。另外,在通过直接获取到的纹理贴图来进行三维重建,若一旦获取到的纹理贴图的纹理质量较差,势必将导致降低渲染得到的三维模型的模型渲染效果。
发明内容
本申请实施例提供了一种图像数据处理方法、装置、设备及介质,能够基于虚拟对象的头像图像自动化重建虚拟对象的三维头部模型,另外,能够生成纹理质量更优的纹理贴图,进而可以提升渲染得到的三维头部模型的模型渲染效果。
本申请实施例一方面提供了一种图像数据处理方法,方法包括:
获取位于三维场景下的目标虚拟对象的头部部位对应的目标视点头像图像,在重构得到的目标视点头像图像的初始三维面部形状时,基于初始三维面部形状确定目标虚拟对象的头部部位在三维场景下的目标三维头像网格;
基于目标三维头像网格对目标视点头像图像进行图像展开处理,得到目标视点头像图像对应的第一目标纹理贴图;
对第一目标纹理贴图进行纹理编码处理,得到第一目标纹理贴图对应的纹理编码特征,在获取到目标视点头像图像的图像编码特征时,将纹理编码特征与图像编码特征进行特征拼接处理,得到用于进行纹理解码的纹理图像拼接特征,对纹理图像拼接特征进行纹理解码处理,得到第一目标纹理贴图对应的第二目标纹理贴图;第二目标纹理贴图的纹理质量优于第一目标纹理贴图的纹理质量;
基于目标三维头像网格和第二目标纹理贴图得到目标渲染头像图像,基于得到的目标渲染头像图像生成目标虚拟对象的头部部位在三维场景下的三维头部模型。
本申请实施例一方面提供了一种图像数据处理装置,装置包括:
网格生成模块,用于获取位于三维场景下的目标虚拟对象的头部部位对应的目标视点头像图像,在重构得到的目标视点头像图像的初始三维面部形状时,基于初始三维面部形状确定目标虚拟对象的头部部位在三维场景下的目标三维头像网格;
第一纹理生成模块,用于基于目标三维头像网格对目标视点头像图像进行图像展开处理,得到目标视点头像图像对应的第一目标纹理贴图;
第二纹理生成模块,用于对第一目标纹理贴图进行纹理编码处理,得到第一目标纹理贴图对应的纹理编码特征,在获取到目标视点头像图像的图像编码特征时,将纹理编码特征与图像编码特征进行特征拼接处理,得到用于进行纹理解码的纹理图像拼接特征,对纹理图像拼接特征进行纹理解码处理,得到第一目标纹理贴图对应的第二目标纹理贴图;第二目标纹理贴图的纹理质量优于第一目标纹理贴图的纹理质量;
渲染模块,用于基于目标三维头像网格和第二目标纹理贴图得到目标渲染头像图像,基于得到的目标渲染头像图像生成目标虚拟对象的头部部位在三维场景下的三维头部模型。
本申请实施例一方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,该计算机程序适于由处理器加载并执行,以使得具有该处理器的计算机设备执行本申请实施例提供的方法。
本申请实施例一方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例提供的方法。
在本申请实施例中,能够基于输入的头部图像(如目标视点头像图像)快速重建得到目标虚拟对象的头部部位在三维场景下的目标三维头像网格,然后可以通过对基于目标三维头像网格展开得到的第一目标纹理贴图进行编解码处理,得到纹理质量更优的纹理贴图(即第二目标纹理贴图),进而基于该目标三维头像网格和第二目标纹理贴图得到目标渲染头像图像,从而生成目标虚拟对象的三维头部模型。由此能够基于虚拟对象的头像图像自动化重建虚拟对象的三维头部模型。另外,由于本申请实施例能够生成纹理质量更优的纹理贴图,进而可以提升渲染得到的三维头部模型的模型渲染效果。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种图像数据处理方法的流程示意图一;
图2是本申请实施例提供的一种目标视点头像图像的效果示意图;
图3是本申请实施例提供的一种第一目标纹理贴图的效果示意图;
图4是本申请实施例提供的一种图像数据处理方法的流程示意图二;
图5是本申请实施例提供的一种三维头部模型的重构过程的流程示意图;
图6是本申请实施例提供的一种图像数据处理方法的流程示意图三;
图7是本申请实施例提供的一种初始建模网络的训练过程的流程示意图;
图8是本申请实施例提供的一种判别器的效果示意图;
图9是本申请实施例提供的一种图像数据处理方法的流程示意图四;
图10是本申请实施例提供的一种图像数据处理装置的结构示意图;
图11是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面对本申请实施例涉及的一些技术术语进行介绍:
网格(mesh):也称3D mesh,是计算机图形学中的基础单元。在计算机图形学中,网格是构成3D(3 Dimensions的简称,中文是指三维)对象的顶点,边和面的集合。网格可以用于定义一个3D对象的形状和轮廓,网格的主要属性内容包括顶点坐标、法线、纹理坐标等等。用于构成3D对象的这些网格通常由三角形、四边形或者其它的简单多边形组成。其中,最常用的是三角网格,三角网格通常需要存储三类信息:顶点、边和面。其中,顶点:每个三角网格都有三个顶点,各顶点都有可能和其他三角网格共享;边:连接两个顶点的边,每个三角网格有三条边;面:每个三角网格对应一个面,我们可以用顶点或边的列表来表示面。可以理解的是,任意多边形网格都能转换成三角网格。
3D重建:也称三维重建、三维重构,指对三维物体建立适合计算机表示和处理的数学模型,是在计算机环境下对其进行处理、操作和分析其性质的基础,也是在计算机中建立表达客观世界的虚拟现实的关键技术。目前,3D重建可以基于输入的二维图像重建得到二维图像中的物体的三维模型。
纹理贴图:也称UV贴图,是用于3D模型表面的平面表示。U和V是纹理贴图的坐标,纹理贴图定义了2D图片上每个点的3D位置的信息,简单的来说,就是将三维物体上的点映射到2维空间上,也就是可以为三维物体的三维网格中的网格顶点指定对应的纹理坐标。创建UV贴图的过程称为UV展开,UV展开主要用于将三维网格转换为至纹理空间(也称UV空间)进行表示,即可以为三维网格中的网格顶点确定对应的纹理坐标,该纹理坐标是在规格化的范围内表示的坐标,如U、V均属于[0,1]。纹理贴图中的纹理坐标它定义了纹理贴图上每个点的位置的信息,纹理贴图上这些点与3D模型是相互联系的,进而在进行3D模型的显示时可以基于纹理贴图确定3D网格中每个网格所对应的纹理,以得到具有纹理效果的模型渲染图像。可以理解的是,通过指定纹理坐标,可以映射到纹理贴图中的纹素(即纹理贴图中的像素)。例如一个256x256大小的二维纹理贴图,若指定纹理坐标为(0.5,1.0),则其对应的像素的坐标是(128,256),进而可以将对应的纹理坐标所对应的像素值(即表示颜色信息的值)映射到三维网格中,实现将纹理贴图贴到三维网格上。
虚拟对象:虚拟对象是指在一些应用场景中,如游戏应用能够提供的虚拟环境中出现的对象。例如,该虚拟对象可以为游戏应用中可以被用户操控的虚拟角色,也可以是游戏应用中的非玩家角色(NPC)等,此处不做限制。该虚拟环境可以是应用程序(如游戏应用)的客户端在终端上运行时显示(或提供)的场景,该虚拟环境是指营造出的供虚拟对象进行活动(如游戏竞技)的场景,如虚拟房屋、虚拟岛屿、虚拟地图等。该虚拟环境可以是对真实世界的仿真环境,也可以是半仿真半虚构的环境,还可以是纯虚构的环境,此处不做限制。在本申请实施例中,该虚拟环境可以是三维虚拟环境,该虚拟对象可以三维形式展示,该虚拟对象是基于一些3D建模技术创建的三维模型。每个虚拟对象在三维虚拟环境中具有自身的形状和体积,占据三维虚拟环境中的一部分空间。
本申请实施例提供一种图像数据处理方法,能够基于输入的头部图像(如目标视点头像图像)快速重建得到目标虚拟对象的头部部位在三维场景下的目标三维头像网格,然后可以通过对基于目标三维头像网格展开得到的第一目标纹理贴图进行编解码处理,得到纹理质量更优的纹理贴图(即第二目标纹理贴图),进而基于该目标三维头像网格和第二目标纹理贴图得到目标渲染头像图像,从而生成目标虚拟对象的三维头部模型。由此能够基于虚拟对象的头像图像自动化重建虚拟对象的三维头部模型。另外,由于本申请实施例能够生成纹理质量更优的纹理贴图,进而可以提升渲染得到的三维头部模型的模型渲染效果。
可以理解的是,本申请实施例可以应用于多种业务场景的三维场景中,如该业务场景可以为游戏场景或虚拟形象生成场景等等,此处不做限制。例如,此处以业务场景为游戏场景为例,游戏应用中可以包括多个虚拟对象的三维模型,但是其中可能存在部分虚拟对象的三维模型在游戏应用程序所提供的虚拟环境中的显示效果不合格,尤其是虚拟对象的头部部位的显示效果不合格,其原因可能是由于这些虚拟对象的头部的三维模型的建模或渲染效果较差,因此,可以对游戏应用中的一些显示效果不合格的虚拟对象的头部的三维模型进行重新建模,从而可以基于重新建模得到的虚拟对象的三维模型对原本的三维模型进行替换和调试。具体的,对一些显示效果较差的虚拟对象的三维模型进行重新建模,可以通过上述图像数据处理方案实现,也就是说,可以通过引擎开发者工具提取显示效果不合格的虚拟对象在目标视点下的头部图像,进而通过上述图像数据处理方案,基于头部图像重构得到对应的目标三维头像网格,并基于目标三维头像网格确定纹理质量优秀的纹理贴图(第二目标纹理贴图),也就是可以基于三维头像网格和第二目标纹理贴图确定重构得到的虚拟对象的头部部位的三维模型,并且可以渲染得到重构得到的虚拟对象的头部的三维模型的图像进行效果展示。
需要进行说明的是,本申请在收集用户的相关数据之前以及在收集用户的相关数据的过程中,都可以显示提示界面、弹窗或输出语音提示信息,该提示界面、弹窗或语音提示信息用于提示用户当前正在搜集其相关数据,使得本申请仅仅在获取到用户对该提示界面或者弹窗发出的确认操作后,才开始执行获取用户相关数据的相关步骤,否则(即未获取到用户对该提示界面或者弹窗发出的确认操作时),结束获取用户相关数据的相关步骤,即不获取用户的相关数据。换句话说,本申请所采集的所有用户数据都是在用户同意并授权的情况下进行采集的,且相关用户数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本申请的技术方案可运用在计算机设备中,该计算机设备可以为服务器,也可以为终端设备,还可以为进行图像数据处理的其他设备,此处不做限制。可选的。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端、飞行器、智能音箱、智能家电等。
可以理解,上述场景仅是作为示例,并不构成对于本申请实施例提供的技术方案的应用场景的限定,本申请的技术方案还可应用于其他场景。例如,本领域普通技术人员可知,随着***架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
进一步地,请参见图1,图1是本申请实施例提供的一种图像数据处理方法的流程示意图一。该方法可由上述计算机设备来执行。该方法至少可以包括以下步骤。
S101、获取位于三维场景下的目标虚拟对象的头部部位对应的目标视点头像图像,在重构得到的目标视点头像图像的初始三维面部形状时,基于初始三维面部形状确定目标虚拟对象的头部部位在三维场景下的目标三维头像网格。
可以理解的是,该三维场景可以为用于建立三维模型的场景,例如,可以对游戏应用中的虚拟对象的头部部位的三维模型进行重建。该目标虚拟对象可以为头部部位的三维模型待进行重建的虚拟对象。例如,虚拟对象可以为三维空间的三维游戏模型,虚拟对象可以包括多个部位,各个部位可以通过一定方式进行组合,如虚拟对象的部位可以包括身体部位、头部部位以及一些装饰物等等,此处不做限制。其中,目标虚拟对象的头部部位的三维模型可以称为三维头部模型。可以理解的是,在一些场景中,该目标虚拟对象可以为游戏应用中一些头部部位的三维模型的显示效果不合格的虚拟对象,进而可以获取该目标虚拟对象的头部部位在一定角度下的图像,以便于能够基于所获取的目标虚拟对象的头像图像,重建得到该目标虚拟对象的三维头部模型。
可以理解的是,该目标视点头像图像可以为对目标虚拟对象的头部部位在目标视点下获取到的图像。可以理解的是,在获取该目标视点头像图像时,目标虚拟对象的三维头部模型可以称为初始三维头部模型。该目标视点可以为获取该目标视点头像图像的摄像机所在位置,该目标视点可以为任一能够拍摄到目标虚拟对象的面部的视点,如可以从目标虚拟对象原本的三维模型的头部部位的正面、左侧30度或者右侧30度等方向上的视点进行拍摄得到目标视点头像图像,此处不做限制。可以理解的,通常来说,虚拟对象在头部部位可能还连接有一些装饰物,则所获取的目标视点头像图像中也可以包括这些装饰物,如该装饰物可以为帽子、头发等等,此处不做限制。可以理解的是,本申请实施例中,重构一个目标虚拟对象的三维头部模型可以仅需要一个头部图像(即目标视点头像图像),相较于其他需要基于多视图的头部图像进行三维重建的方法,本申请实施例能够更方便快捷地获取三维重建所需要的头部图像,有助于提升重建三维头部模型的效率。
例如,请参见图2,图2是本申请实施例提供的一种目标视点头像图像的效果示意图二。可以理解的是,目标虚拟对象的初始三维头部模型的三维网格以及头部部位所连接的其他装饰物的三维网格组合的三维网格可以如图2中的21a所示。可以理解的是,在获取到目标虚拟对象的纹理贴图后,可以将对应的纹理贴图贴到三维网格上并进行渲染,实现目标虚拟对象的头像表达,得到该目标虚拟对象的初始三维头部模型。进而可以在目标视点下,获取目标虚拟对象的头部部位的图像,得到目标视点头像图像,如图2中的22a所示,可以看到如图2中的22a所示的目标视点头像图像中可以包括目标虚拟对象的头部部位以及一些装饰物等等。
可以理解的是,该初始三维面部形状可以为用于表征对目标视点头像图像头像中的面部进行重构后在三维空间中的形状(也称shape)。基于目标视点头像图像重构得到初始三维面部形状,可以基于多种方式实现,如基于深度学习的方式确定初始三维面部形状,此处不做限制。根据获取初始三维面部形状的方式的不同,该初始三维面部形状可以采用对应的方式进行表示,如该初始三维面部形状可以表示为深度图(depth), 点云(pointcloud), 体素(voxel), 网格(mesh)等方式,此处不做限制。
可选的,该初始三维面部形状可以基于三维可变形头像模型(3D MorphableModel,简称3DMM)确定。采用三维可变形头像模型可以确定多个顶点的三维坐标信息,从而采用多个顶点的三维坐标信息对三维面部的形状进行表示,得到初始三维面部形状。
在一个实施例中,基于三维可变形头像模型重构得到的目标视点头像图像的初始三维面部形状可以包括:基于预训练好的三维面部系数回归器确定初始三维面部参数,该初始三维面部参数包括身份特征、表达特征、目标面部姿势系数、初始纹理系数、初始光照系数;基于初始三维面部参数中的身份特征、表达特征确定初始三维面部形状。
可以理解的是,该身份特征用于指示目标虚拟对象的身份,如目标虚拟对象的角色类型(如可以为按照性别、年龄、技能等划分的角色类型,此处不做限制),如身份特征可以表示为,其维度为80维。该表达特征用于指示目标视点头像图像中的面部表情,如表达特征可以表示为,其维度可以为64维。该目标面部姿势系数可以用于指示目标视点头像图像中的面部姿势,如目标面部姿势系数表示为P,其维度可以为6维。该初始纹理系数可以用于指示基于该预训练好的三维面部系数回归器确定的面部形状对应的纹理,如该初始纹理系数可以表示为,其维度可以为80维。该初始光照系数可以用于指示基于该预训练好的三维面部系数回归器确定的光照系数,该初始光照系数可以表示为l,其维度为27维。可以理解的是,该初始纹理系数和初始光照系数可能拟合效果并不好,后续可以基于其他方式确定重构得到的初始三维面部形状的纹理贴图和预测光照系数,以用于后续的模型渲染。该预训练好的三维面部系数回归器可以为神经网络模型,如可以为CNN模型(卷积神经网络模型),此处不做限制。
例如,基于初始三维面部参数中的身份特征、表达特征确定初始三维面部形状可以通过以下公式(公式1)进行表示:
公式1
其中,表示初始三维面部形状,是三维可变形头像模型对应的平均面部形状,是身份特征,是表达特征。该用于指示身份特征对应的PCA(主成分分析)基,也称第一主成分分析基;该用于指示表达特征对应的PCA(主成分分析)基,也称第二主成分分析基。
可以理解的是,上述确定初始三维面部形状的过程仅为一种可能的方式,该初始三维面部形状还可以表示为三维网格,如可以基于Pixel2Mesh模型(一种神经网络模型)确定用三维网格表示的初始三维面部形状。该初始三维面部形状还可以基于其他的一些方式确定基于点云、体素、深度图等方式进行表示初始三维面部形状,此处不做限制。
该目标三维头像网格可以为能够在业务场景中使用的头像的网格,如可以为能够直接在游戏环境中加载的三维头像网格,也称游戏mesh(网格)。可以理解的是,基于初始三维面部形状确定目标虚拟对象的头部部位在三维场景下的目标三维头像网格,可以基于初始三维面部形状确定初始三维面部网格,进而可以将初始三维面部网格传输到模板网格以进行头像转移,从而可以得到目标虚拟对象的头部部位的目标三维头像网格。
具体的,基于初始三维面部形状确定目标虚拟对象的头部部位在三维场景下的目标三维头像网格,可以包括以下步骤:基于初始三维面部形状确定初始三维面部网格,从初始三维面部网格中所包含的M个第一网格顶点中获取用于表征目标虚拟对象的头部部位的N个第一关键点;N为小于M的正整数;进一步的,获取模板网格,在模板网格中查找与N个第一关键点具有相同关键属性的N个第二关键点;一个第一关键点对应一个第二关键点;进一步的,将N个第一关键点和查找到的N个第二关键点,构成目标虚拟对象的头部部位的N个关键点对,在基于N个关键点对拟合得到与M个第一网格顶点相关联的偏移量函数时,基于偏移量函数确定初始三维面部网格中所包含的M个第一网格顶点对应的偏移量;进一步的,基于每个第一网格顶点对应的偏移量分别确定每个第一网格顶点对应的目标位置信息,将每个第一网格顶点对应的目标位置信息所指示的空间点确定为第二网格顶点,并基于M个第二网格顶点确定目标三维头像网格。
可以理解的是,该初始三维面部网格可以为基于初始三维面部形状确定的三维网格。该初始三维面部网格中的网格顶点可以称为第一网格顶点,该初始三维面部网格中可以包括M个第一网格顶点,M为正整数。该M个第一网格顶点中,可以包括N个关键属性分别对应的第一关键点,即有N个第一关键点。该关键属性可以用于指示面部的一些关键部位,如该关键属性可以为左眼角、右眼角、左嘴角、右嘴角、鼻尖等等,此处不做限制。可选的,该N的取值可以为68,即可以确定68个关键属性对应的第一关键点,即得到68个第一关键点。
可以理解的是,该初始三维面部网格可以根据初始三维面部形状的表示方式进行确定。例如,若该初始三维面部形状是通过上述的三维变形头像模型确定的多个顶点的坐标信息进行表示的,则基于初始三维面部形状确定初始三维面部网格可以为将初始三维面部形状中的顶点作为网格顶点,并确定初始三维面部网格,如可以基于Alpha形状(一种三维网格生成方法)、Ballpivoting(一种三维网格生成方法)或Poisson曲面重建(一种三维网格生成方法)等方式对初始三维面部形状进行处理得到初始三维面部网格,此处不做限制。又如,若该初始三维面部形状是通过一些神经网络确定的三维网格进行表示的,则可以直接可以将该初始三维面部形状所指示的三维网格的确定为初始三维面部网格。
可选的,初始三维面部网格中的M个第一网格顶点是基于目标视点头像图像的身份特征和第一主成分分析基、目标视点头像图像的表达特征和第二主成分分析基、以及平均面部形状生成的;身份特征用于指示目标虚拟对象的角色类型,表达特征用于指示目标视点头像图像对应的面部表情。
可以理解的是,基于目标视点头像图像的身份特征和第一主成分分析基、以及目标视点头像图像的表达特征和第二主成分分析基生成的M个第一网格顶点的方法可以参照上述描述,如参照公式1确定,此处不做赘述。
该模板网格可以为适配于业务场景下的虚拟环境的网格模板,例如在游戏场景下,该模板网格可以为适配于游戏环境的网格模板,也称游戏模板mesh(网格)。可以理解的是,该模板网格可以包括上述N个关键属性的对应的第二关键点。关键点对可以为具有相同关键属性的第一关键点和第二关键点形成的关键点对,也就是说,在初始三维面部网格和模板网格中,具有相同关键属性的第一关键点和第二关键点可以形成一个关键点对,进而可以形成N个关键点对。
该偏移量函数可以用于指示拟合得到的用于确定初始三维面部网格中的每个第一网格顶点的偏移量的函数。第一网格顶点的偏移量用于指示在进行头像转移时第一网格顶点的位置所需要改变的数量,可以理解的是,将每个第一网格顶点的位置信息(也称坐标信息)输入至偏移量函数中,则可以得到每个第一网格顶点对应的偏移量。可选的,该偏移量函数可以通过基于径向基函数的插值计算得到。
该目标位置信息即可以为基于对应的偏移量进行对第一网格顶点的位置信息(即初始位置信息)进行改变后的位置信息,从而改变后的第一网格顶点的目标位置信息所指示的空间点(即第二网格顶点)则可以为目标三维头像网格中的网格顶点。可以理解的是,目标三维头像网格中的每个网格顶点可以称为第二网格顶点,一个第一网格顶点可以对应一个第二网格顶点。
可选的,偏移量函数用于指示对K个径向基函数进行加权求和,每个径向基函数关联有对应的函数权重;那么,在基于N个关键点对拟合得到与M个第一网格顶点相关联的偏移量函数时,基于偏移量函数确定初始三维面部网格中所包含的M个第一网格顶点对应的偏移量,可以包括以下步骤:在M个第一网格顶点中获取第i个第一网格顶点,确定第i个第一网格顶点的初始位置信息;i为小于或者等于M的正整数;基于第i个第一网格顶点的初始位置信息和每个径向基函数,确定第i个第一网格顶点针对每个径向基函数的函数值;基于第i个第一网格顶点针对每个径向基函数的函数值和每个径向基函数对应的函数权重进行加权求和处理,将加权求和处理后所得到的和值作为第i个第一网格顶点对应的偏移量。
可以理解的是,该初始位置信息用于指示初始三维面部网格中的第一网格顶点的位置信息。可以理解的是,第i个第一网格顶点可以为M个第一网格顶点中的任一第一网格顶点。
径向基函数(Radial basis function,简称RBF)是一个函数空间的基函数,而这些基函数都是径向函数。所谓径向函数满足这样一个条件:对于围绕某个固定点C的等距的x,x的函数值相同。可以理解的是,K可以为小于或等于N的正整数。
例如,该K个径向基函数可以通过以下公式(公式2)进行表示:
公式2
其中,表示第j个径向基函数的表达式,表示径向基函数的中心点,表示输入函数的点x与径向基函数的中心点的距离(如欧氏距离)。可以理解的是,此处的点x可以为初始三维面部网格中的任一第一网格顶点,即可以为任一第一网格顶点的初始位置信息。
进一步的,偏移量函数可以通过以下公式(公式3)进行表示:
公式3
其中,x表示一个第一网格顶点的初始位置信息,表示一个第一网格顶点的偏移量,j表示第j个径向基函数,K表示径向基函数的总数;表示第j个径向基函数的函数权重,表示第j个径向基函数,表示第j个径向基函数的中心点的位置信息。
具体的,基于每个第一网格顶点对应的偏移量分别确定每个第一网格顶点对应的目标位置信息,可以包括以下步骤:在M个第一网格顶点中获取第i个第一网格顶点,确定第i个第一网格顶点的初始位置信息;i为小于或者等于M的正整数;基于第i个第一网格顶点的初始位置信息与第i个第一网格顶点的对应的偏移量的和,确定每个第一网格顶点对应的目标位置信息。
例如,目标位置信息可以通过以下公式(公式4)进行表示:
公式4
其中,表示第i个第一网格顶点的目标位置信息,表示第i个第一网格顶点的偏移量,表示第i个第一网格顶点的初始位置信息。
具体的,基于N个关键点对拟合得到与M个第一网格顶点相关联的偏移量函数,可以包括以下步骤:基于每个关键点对中的第一关键点和第二关键点之间的位置距离对初始三维面部网格和模板网格进行对齐处理,并在N个关键点对的位置距离的和最小化时将每个关键点对中的第一关键点和第二关键点之间的位置距离确定为目标位置距离;进一步的,基于每个关键点对的目标位置距离进行插值计算,确定K个径向基函数以及每个径向基函数对应的函数权重,并基于K个径向基函数以及每个径向基函数对应的函数权重确定与M个第一网格顶点相关联的偏移量函数。
可以理解的是,上述的对齐处理,就是相当于将每个关键点对所对应的位置距离最小化的过程,从而可以通过最小化模板网格和初始三维面部网格之间的关键点对的位置距离来解决线性最小二乘问题,以确定每个径向基函数的函数权重。可以理解的是,插值计算就相当于是基于一些已知的点所对应的函数值拟合得到一个平滑插值函数,以便于可以基于拟合得到的函数计算其他点的函数值,则此处的已知点即为上述的N个第一关键点,其对应的函数值可以为每个关键点对的目标距位置距离,从而可以通过插值计算得到K个径向基函数以及每个径向基函数对应的函数权重,也就是拟合得到上述的偏移量函数。
S102、基于目标三维头像网格对目标视点头像图像进行图像展开处理,得到目标视点头像图像对应的第一目标纹理贴图。
可以理解的是,该第一目标纹理贴图可以为基于目标三维头像网格展开得到的带有颜色信息的纹理贴图。可以理解的是,基于目标三维头像网格对目标视点头像图像进行图像展开处理,也就是,将目标三维头像网格展开到UV空间(纹理空间)得到目标三维头像网格对应的纹理贴图,并利用目标视点头像图像中的面部每个点的颜色信息确定纹理贴图中的每个点的颜色信息,得到第一目标纹理贴图。
可以理解的是,在将目标三维头像网格展开到UV空间时,目标三维头像网格中的每个第二网格顶点可以关联有对应的纹理坐标。另外,目标三维头像网格中的每个第二网格顶点对应初始三维面部网格中的一个第一网格顶点,即对应初始三维面部形状中的一个顶点。可选的,初始三维面部形状中的顶点可以与目标视点头像图像中的二维点存在映射关系,如可以通过黄金标准算法确定仿射矩阵进行表示,由此可以基于目标三维头像网格中的网格顶点与目标视点头像图像中的二维点存在的映射关系确定目标三维头像网格中的网格顶点对应的颜色信息,进而目标三维头像网格中的网格顶点对应的纹理坐标和目标三维头像网格中的网格顶点对应的颜色信息,确定每个纹理坐标所对应的像素的颜色信息,也就是实现基于目标三维头像网格对目标视点头像图像进行图像展开处理。可选的,在确定初始三维面部形状时,还可以确定初始三维面部形状中每个顶点对应的颜色信息,该颜色信息可以是基于目标视点头像图像提取到的纹理系数进行确定的,由此可以基于目标三维头像网格中的网格顶点对应的纹理坐标,确定每个纹理坐标所对应的像素的颜色信息,也就是实现基于目标三维头像网格对目标视点头像图像进行图像展开处理。
例如,请参见图3,图3是本申请实施例提供的一种第一目标纹理贴图的效果示意图。如图3所示,在确定了目标三维头像网格31a后,可以基于目标三维头像网格对目标视点头像图像32a进行图像展开处理,得到对应的第一目标纹理贴图33a。可以理解的是,第一目标纹理贴图33a中的网格画线仅用于表示与目标三维头像网格中的网格相对应,不代表实际纹理贴图中存在这些网格画线。
S103、对第一目标纹理贴图进行纹理编码处理,得到第一目标纹理贴图对应的纹理编码特征,在获取到目标视点头像图像的图像编码特征时,将纹理编码特征与图像编码特征进行特征拼接处理,得到用于进行纹理解码的纹理图像拼接特征,对纹理图像拼接特征进行纹理解码处理,得到第一目标纹理贴图对应的第二目标纹理贴图;第二目标纹理贴图的纹理质量优于第一目标纹理贴图的纹理质量。
可以理解的是,该纹理编码特征可以用于指示对第一目标纹理贴图进行纹理编码处理得到的特征。该纹理编码特征是基于目标建模网络中的目标纹理编码器所确定的,也就是说,目标纹理编码器可以用于对纹理贴图进行纹理编码处理。该目标建模网络可以为用于基于虚拟对象的头部图像进行建模的网络,该目标建模网络可以是基于训练数据对初始建模网格进行训练得到的。该目标纹理编码器可以是基于训练数据对初始建模网格进行训练得到目标建模网络时,基于初始建模网络中的初始纹理编码器确定的。
可选的,对第一目标纹理贴图进行纹理编码处理,得到第一目标纹理贴图对应的纹理编码特征,可以包括以下步骤:基于第一目标纹理贴图中每个像素的像素值,将第一目标纹理贴图转换到频域空间,得到第一目标纹理贴图对应的频域信息,并将第一目标纹理贴图对应的频域信息确定为第一目标纹理贴图对应的纹理编码特征。
其中,可以理解的是,频域空间可以为以频率为自变量的空间。纹理贴图的频域信息可以用于表征纹理贴图中图像强度(亮度/灰度)变化剧烈程度,对图像(如纹理贴图)而言,图像的边缘部分是突变部分,变化较快,因此反应在频域上是高频分量,图像平缓变化部分则为低频分量。可以理解的是,该第一目标纹理贴图属于颜色空间,也称空间域,就是指图像的本身,进而可以作用于颜色空间的像素将纹理贴图从颜色空间转换到频域空间。
例如,将第一目标纹理贴图转换到频域空间得到对应的频域信息的方法,可以通过以下公式(公式5)进行表示:
公式5
其中,表示第一目标纹理贴图的纹理频率,则表示第一目标纹理贴图转换到频域空间得到的频域信息。s表示纹理贴图中的像素索引,n表示纹理贴图的像素维度;表示像素索引为s的像素的像素值,表示基函数。由此可以实现将第一目标纹理贴图转换到频域空间,以确定第一目标纹理贴图的纹理编码特征。
该图像编码特征可以用于指示对目标视点头像图像进行图像编码处理得到的特征。该图像编码特征是基于目标建模网络中的目标图像编码器所确定的,也就是说,该目标图像编码器可以用于对头像图像进行图像编码处理。该目标纹理编码器可以是在基于训练数据对初始建模网格进行训练得到目标建模网络时,基于初始建模网络中的初始图像编码器确定的。可选的,该初始图像编码器可以为用于进行图像编码或提取的神经网络,此处不做限制。
该纹理图像拼接特征可以为基于纹理编码特征和图像编码特征进行特征拼接处理得到的特征。可选的,对纹理编码特征和图像编码特征进行拼接处理,可以理解为对纹理编码特征和图像编码特征进行加权,相当于实现了纹理与图像中的像素值(如RGB值)的效果融合。
该第二目标纹理贴图是对纹理图像拼接特征进行纹理解码处理得到的纹理贴图。第二目标纹理贴图是基于目标建模网络中的目标纹理解码器所确定的,也就是说,该目标纹理解码器可以用于对纹理图像拼接特征进行纹理解码处理。该目标纹理编码器可以是在基于训练数据对初始建模网格进行训练得到目标建模网络时,基于初始建模网络中的初始图像编码器确定的。可以理解的是,第二目标纹理贴图的纹理质量优于第一目标纹理贴图,该纹理质量可以体现在清晰度、平滑度、具有合理的阴影和高光、完整性等等维度,如可以通过一些性能分析工具确定纹理贴图的纹理质量。
可选的,纹理图像拼接特征是频域空间下的特征;那么,对纹理图像拼接特征进行纹理解码处理,得到第一目标纹理贴图对应的第二目标纹理贴图,可以包括以下步骤:获取用于进行纹理解码所需的解码带宽,基于解码带宽所指示的频率范围,在将纹理图像拼接特征从频域空间转换到颜色空间时,得到纹理图像拼接特征对应的颜色空间信息,并基于颜色空间信息确定第二目标纹理贴图。
可以理解的是,该解码带宽可以将纹理图像拼接特征从频域空间转换到颜色空间时所需要的频率范围。可以理解的是,对于一个图像(如纹理贴图)来说,图像的主要成分是低频信息,它形成了图像的基本灰度等级,对图像结构的决定作用较小;中频信息决定了图像的基本结构,形成了图像的主要边缘结构;高频信息形成了图像的边缘和细节,是在中频信息上对图像内容的进一步强化。图像的高频信息越多,图像的细节特征也就越多。若图像缺失的高频信息,则图像的图像边缘和轮廓的容易不清晰,但是若图像中的高频信息过多,则容易造成图像轮廓过于明显的情况,因此该解码带宽需要选择一个合适的数值,例如,该解码带宽可以为18,则该解码带宽所指示的频率范围为0-18,从而在保障生成的纹理图像中的纹理清晰,且轮廓不会过于明显,达到平滑图像的目的。
将纹理图像拼接特征从频域空间转换到颜色空间也就是相当于确定出每个像素对应的像素值,以得到第二目标纹理贴图。该颜色空间信息可以用于指示解码得到的纹理贴图的每个像素的颜色信息(如RGB值)。可以理解的是,由于纹理图像拼接特征对第一目标纹理贴图的在纹理上的特征和目标视点头像图像在颜色上的特征进行了效果融合,从而可以使得后续基于纹理图像拼接特征进行解码得到的纹理贴图在颜色表达上更好,可以使得解码得到的纹理贴图更精细化。
例如,对纹理图像拼接特征进行纹理解码处理,得到第二目标纹理贴图的方法,可以通过以下公式(公式6)进行表示:
公式6
其中,表示第二目标纹理贴图的颜色空间信息,表示上述解码带宽。表示纹理图像拼接特征,s表示纹理贴图中的像素索引,表示基函数。由此可以实现将纹理图像拼接特征转换到颜色空间,以确定第二目标纹理贴图。
可以理解的是,通过目标纹理编码器对第一目标纹理贴图进行纹理编码处理得到纹理编码特征,对纹理编码特征和图像编码特征进行特征拼接处理得到纹理图像的拼接特征,并通过目标纹理解码器对纹理图像拼接特征进行解码处理得到第二目标纹理贴图的整个网络,可以称为可微渲染网络,也可以称为纹理渲染网络,能够获取更为精细化的纹理贴图(即第二目标纹理贴图)以用于渲染得到目标渲染头像图像,生成三维头部模型。
S104、基于目标三维头像网格和第二目标纹理贴图得到目标渲染头像图像,基于得到的目标渲染头像图像生成目标虚拟对象的头部部位在三维场景下的三维头部模型。
该目标渲染头像图像可以为基于上述目标三维头像网格和第二目标纹理贴图渲染得到的图像。该目标渲染头像图像为在三维场景下基于目标视点头像图像得到的三维头部模型的图像,也就是重构得到的目标虚拟对象的三维头部模型在特定角度下的所展示的图像。可以理解的是,本申请实施例渲染得到目标渲染头像图像采用可微分渲染处理的方式进行渲染,可微分渲染可以是指基于渲染过程可微的渲染方法进行渲染。可以理解的是,采用可微分渲染是由于在训练得到目标建模网络的过程中,采用可微分渲染处理能够进行基于渲染得到的图像进行梯度的计算,以便于进行梯度反传至训练过程中需要进行参数更新的网络,如目标建模网络中的各个网络组件,如上述的目标图像编码器、目标纹理编码器、目标纹理解码器等。
该三维头部模型可以为基于上述的目标视点头像图像重构得到的头部部位的三维模型。可以理解的是,在三维场景下的三维头部模型是可以旋转的,基于上述目标三维头像网格和第二目标纹理贴图渲染可以得到不同视点角度下的图像,由此生成三维头部模型。可以理解的是,由于通过目标建模网络对基于目标视点头像图像展开得到的第一目标纹理贴图进行了纹理的精细化(即对第一目标纹理贴图进行编码处理以及对纹理图像拼接特征进行纹理解码处理),则相较于目标虚拟对象原本的头部部位的三维模型来说,重构得到的三维头部模型的模型渲染效果更好。
请参见图4,图4是本申请实施例提供的一种图像数据处理方法的流程示意图。该方法可由上述计算机设备来执行。该方法至少可以包括以下步骤。
S401、获取位于三维场景下的目标虚拟对象的头部部位对应的目标视点头像图像,在重构得到的目标视点头像图像的初始三维面部形状时,基于初始三维面部形状确定目标虚拟对象的头部部位在三维场景下的目标三维头像网格。
S402、基于目标三维头像网格对目标视点头像图像进行图像展开处理,得到目标视点头像图像对应的第一目标纹理贴图。
S403、对第一目标纹理贴图进行纹理编码处理,得到第一目标纹理贴图对应的纹理编码特征,在获取到目标视点头像图像的图像编码特征时,将纹理编码特征与图像编码特征进行特征拼接处理,得到用于进行纹理解码的纹理图像拼接特征,对纹理图像拼接特征进行纹理解码处理,得到第一目标纹理贴图对应的第二目标纹理贴图;第二目标纹理贴图的纹理质量优于第一目标纹理贴图的纹理质量。
步骤S401-S403可以参照上述步骤S101-S103的相关描述,此处不做赘述。
S404、基于目标建模网络中的目标光照回归器对图像编码特征进行光照预测处理,得到目标预测光照系数。
其中,可以理解的是,如上述,图像编码特征是基于目标建模网络中的目标图像编码器所确定的,纹理编码特征是基于目标建模网络中的目标纹理编码器所确定的,第二目标纹理贴图是基于目标建模网络中的目标纹理解码器所确定的。该目标建模网络中还可以包括目标光照回归器,该目标光照回归器可以用于对图像编码特征进行光照预测处理,得到目标预测光照系数。
该目标预测光照系数可以为基于图像编码特征中预测的光照信息。可以理解的是,目标预测光照系数是基于目标建模网络中的目标光照回归器所确定的,也就是说,该目标光照回归器可以用于基于图像编码特征进行光照预测处理得到预测光照系数。该目标光照回归器可以是在基于训练数据对初始建模网格进行训练得到目标建模网络时,基于初始建模网络中的初始光照回归器确定的。经过训练数据对初始建模网络的训练,通过目标光照回归器可以准确地确定目标预测光照系数,以便于在后续渲染过程中,可以基于该目标预测光照系数进行打光,渲染三维模型表面的明暗变化及其阴影投射,从而有效消除输入的目标视点头像图像中不需要的光照分量,降低光照对纹理的影响,使得渲染得到目标渲染头像图像中的脸部更平滑,颜色更逼真,即生成的三维头部模型的模型渲染效果更好。
S405、在获取到与初始三维面部形状相关联的目标面部姿势系数时,对目标三维头像网格、目标面部姿势系数、目标预测光照系数以及第二目标纹理贴图进行可微分渲染处理,得到目标渲染头像图像,基于得到的目标渲染头像图像生成目标虚拟对象的头部部位在三维场景下的三维头部模型。
可以理解的是,如上述,该目标面部姿势系数可以用于指示目标视点头像图像中的面部姿势,如该目标面部姿势参数表示为P,其维度可以为6维。可选的,该目标面部姿势系数可以通过上述的预训练好的三维面部系数回归器进行确定,此处不做赘述。
可以理解的是,该目标渲染头像图像可以为基于上述目标三维头像网格、目标面部姿势系数、目标预测光照系数以及第二目标纹理贴图渲染得到的图像。通过该面部姿势系数进行渲染,能够避免在生成的三维头部模型的表情出现漂移。通过目标预测光照系数进行渲染,能够使得渲染得到目标渲染头像图像中的脸部更平滑,颜色更逼真,即生成的三维头部模型的模型渲染效果更好。
该三维头部模型可以为基于上述的目标视点头像图像重构得到的头部部位的三维模型。可以理解的是,可以基于上述目标三维头像网格、目标面部姿势系数、目标预测光照系数以及第二目标纹理贴图渲染得到不同视点角度下的图像,由此生成三维头部模型。
可以理解的是,此处结合图示对重构目标虚拟对象的三维头部模型的过程进行阐述。请参见图5,图5是本申请实施例提供的一种三维头部模型的重构过程的流程示意图。首先,可以获取目标视点头像图像501,可以理解的是,该目标视点头像图像501可以为一些三维模型显示效果不合格的目标虚拟对象的头部部位的图像。进而可以基于目标视点头像图像重构得到初始三维面部形状502,如可以通过预训练好的三维面部系数回归器确定身份特征、表达特征,进而可以基于调用三维可变形头像模型基于身份特征和表达特征确定初始三维面部形状。进一步的,可以基于该初始三维面部形状确定初始三维面部网格503,然后对初始三维面部网格503进行头像转移,得到能够加载至业务场景的虚拟环境的目标三维头像网格504,具体可以通过初始三维面部网格与模板网格中的关键点对拟合得到偏移量函数,从而计算得到初始三维面部网格中每个网格顶点的偏移量,以得到初始三维面部网格中每个网格顶点的新的位置信息(即目标位置信息),进而得到目标三维头像网格。可以理解的是,在基于预训练好的三维面部系数回归器确定身份特征、表达特征时,还可以基于预训练好的三维面部系数回归器确定目标面部姿势系数505。可以理解的是,在得到目标三维头像网格504后,可以通过目标三维头像网格504对目标视点头像图像进行图像展开处理,得到第一目标纹理贴图506,具体的展开方式参照上述描述,此处不做赘述。
进一步的,将目标视点头像图像501和第一目标纹理贴图506输入至目标建模网络的507。该目标建模网络507中可以包括目标图像编码器5071、目标纹理编码器5074、目标光照回归器5073以及目标纹理解码器5077。具体的,通过目标图像编码器5071对目标视点头像图像501进行图像编码处理得到图像编码特征5072,然后将图像编码特征5072输入至目标光照回归器进行光照预测,得到目标预测光照系数508。并且,通过目标纹理编码器5074对第一目标纹理特征506进行纹理编码处理,得到纹理编码特征5075,然后将图像编码特征5072和纹理编码特征5075进行特征拼接处理,得到纹理图像拼接特征5076,进而可以通过目标纹理解码器5077对纹理图像拼接特征进行纹理解码处理,得到第二目标纹理贴图509,可以理解的是,第二目标纹理贴图509的纹理质量优于第一目标纹理贴图。
进一步的,可以将目标三维头像网格504、目标面部姿势系数505、基于目标建模网络中的目标光照回归器5073生成的目标预测光照系数508以及第二目标纹理贴图509输入至可微分渲染器510,得到目标渲染头像图像511。可以理解的是,该目标渲染头像图像可以为重构得到三维头部模型的图像。
在本申请实施例中,能够基于输入的头部图像(如目标视点头像图像)快速重建得到目标虚拟对象的头部部位在三维场景下的目标三维头像网格,然后可以通过对基于目标三维头像网格展开得到的第一目标纹理贴图进行编解码处理,得到纹理质量更优的纹理贴图(即第二目标纹理贴图),进而结合一些其他渲染处理需要的参数渲染得到目标渲染头像图像,从而生成目标虚拟对象的三维头部模型。由此能够基于虚拟对象的头像图像自动化重建虚拟对象的三维头部模型。另外,由于本申请实施例能够生成纹理质量更优的纹理贴图,进而可以提升渲染得到的三维头部模型的模型渲染效果。
请参见图6,图6是本申请实施例提供的一种图像数据处理方法的流程示意图三。该方法可由上述计算机设备来执行。该方法至少可以包括以下步骤。
S601、获取位于三维场景下的训练虚拟对象的头部部位对应的训练视点头像图像,在重构得到的训练视点头像图像的训练三维面部形状时,基于训练三维面部形状确定训练虚拟对象的头部部位在三维场景下的训练三维头像网格。
可以理解的是,该训练虚拟对象可以为用于获取训练视点头像图像的虚拟对象。例如,在一些场景中,该训练虚拟对象可以为游戏应用中的一些头部的三维模型的显示效果合格的虚拟对象。
可以理解的是,该训练视点头像图像可以为对训练虚拟对象的头部部位在训练视点下获取到的图像。该训练虚拟对象是基于头部的三维模型所构建。该训练视点可以为获取该训练视点头像图像的摄像机所在位置,该训练视点可以为任一能够拍摄的训练虚拟对象的面部的视点,如可以从训练虚拟对象原本的三维模型的头部部位的正面、左侧30度或者右侧30度等方向上的视点进行拍摄得到训练视点头像图像,此处不做限制。可以理解的,通常来说,虚拟对象在头部可能还连接有一些装饰物,则所获取的训练视点头像图像中也可以包括这些装饰物,如该装饰物可以为帽子、头发等等,此处不做限制。
可以理解的是,该训练三维面部形状可以为用于表征对训练视点头像图像头像中的面部进行重构后在三维空间中的形状(也称shape)。可以理解的是,该训练三维面部形状的获取方式,可以参照上述获取目标三维面部形状的相关描述,此处不做赘述。
该训练三维头像网格可以为能够在业务场景下的虚拟环境中使用的头像的网格,如可以为能够直接在游戏场景下的游戏环境中加载的三维头像网格,也称游戏mesh(网格)。可以理解的是,基于训练三维面部形状确定训练虚拟对象的头部部位在三维场景下的训练三维头像网格,可以基于训练三维面部形状确定训练三维面部网格,进而可以将训练三维面部网格传输到模板网格以进行头像转移,从而可以得到训练虚拟对象的头部部位的训练三维头像网格。可以理解的是,确定训练三维头像网格的方法,可以参照上述确定目标三维头像网格的相关描述,此处不做赘述。
S602、基于训练三维头像网格对训练视点头像图像进行图像展开处理,得到训练视点头像图像对应的第一训练纹理贴图。
可以理解的是,第一训练纹理贴图可以为基于训练三维头像网格展开得到的带有颜色信息的纹理贴图。可以理解的是,确定第一训练纹理贴图的方法可以参照上述确定第一目标纹理贴图的相关描述,此处不做赘述。
S603、基于初始建模网络中的初始纹理编码器对第一训练纹理贴图进行纹理编码处理,得到第一训练纹理贴图对应的训练纹理特征,在基于初始建模网络中的初始图像编码器获取到训练视点头像图像的训练图像特征时,将训练纹理特征与训练图像特征进行特征拼接处理,得到用于进行纹理解码的训练拼接特征,基于初始建模网络中的初始纹理解码器对训练拼接特征进行纹理解码处理,得到第一训练纹理贴图对应的第二训练纹理贴图。
可以理解的是,该初始建模网络可以为未训练完成的建模网络。可以理解的是,上述目标建模网络中可以包括目标图像编码器、目标光照回归器、目标纹理编码器、目标纹理解码器,则该目标建模网络中可以对应的包括初始图像编码器、初始光照回归器、初始纹理编码器、初始纹理解码器。
该训练纹理特征可以用于指示对第一训练纹理贴图进行纹理编码处理得到的特征。该训练纹理特征是基于初始建模网络中的初始纹理编码器所确定的。可以理解的是,确定训练纹理特征的方法可以参照上述确定纹理编码特征的相关描述,此处不做赘述。
该训练图像特征可以用于指示对训练视点头像图像进行图像编码处理得到的特征。该训练图像特征是基于初始建模网络中的初始图像编码器所确定的。可以理解的是,确定训练图像特征的方法可以参照上述确定的图像编码特征的相关描述,此处不做赘述。
该训练拼接特征可以为基于训练纹理特征和训练图像特征进行特征拼接处理得到的特征。可以理解的是,确定训练拼接特征的方法可以参照上述确定的纹理图像拼接特征的相关描述,此处不做赘述。
该第二训练纹理贴图是对训练拼接特征进行纹理解码处理得到的纹理贴图。第二训练纹理贴图是基于初始建模网络中的初始纹理解码器所确定的。可以理解的是,确定第二训练纹理贴图的方法可以参照上述的确定第二目标纹理贴图的相关描述,此处不做赘述。
S604、基于训练三维头像网格和第二训练纹理贴图得到训练渲染图像。
该训练面部姿势系数可以用于指示训练视点头像图像中的面部姿势。可以理解的是,该训练面部姿势系数可以参照上述目标面部姿势系数的相关描述,此处不做赘述。
该训练预测光照系数可以为基于训练图像特征中预测的光照信息。可以理解的是,训练预测光照系数是基于初始建模网络中的初始光照回归器所确定的。可以理解的是,该训练预测光照系数可以参照上述目标预测光照系数的相关描述,此处不做赘述。
该训练渲染图像可以为基于训练三维头像网格、训练面部姿势系数、训练预测光照系数以及第二训练纹理贴图进行渲染得到的图像。可以理解的是,上述训练视点头像图像中除了可以包括面部区域外,还可以包括一些在头部上的装饰物(如头发、帽子等装饰物),上述重构得到的训练三维头像网格和第二训练纹理贴图仅为头部部位的网格和纹理贴图,而不包括头部的装饰物的网格和纹理贴图,因此,该训练渲染图像可以为基于训练三维头像网格、训练面部姿势系数、训练预测光照系数以及第二训练纹理贴图进行可微分渲染得到头部的图像中的皮肤区域对训练视点头像图像中的皮肤区域的内容进行替换得到的图像,相当于是基于渲染得到的头部的图像与训练视点头像图像中非皮肤区域的部分进行组合得到该训练渲染图像,后续在进行训练视点头像图像与训练渲染图像之间的距离时,也是基于两个图像中的皮肤区域之间的距离进行计算的。
S605、获取第二训练纹理贴图对应的参考纹理贴图,并基于参考纹理贴图和第二训练纹理贴图、训练渲染图像和训练视点头像图像,对初始建模网络进行迭代训练,并将迭代训练后的初始建模网络作为目标建模网络。
可以理解的是,该参考纹理贴图可以为在对初始建模网络进行训练的过程中所需要与第二训练纹理贴图进行损失计算的纹理贴图。可以理解的是,在将迭代训练后的初始建模网络作为目标建模网络时,可以将初始建模网络中的初始图像编码器作为目标建模网络中的目标图像编码器,将初始建模网络中的初始纹理编码器作为目标建模网络中的目标纹理编码器,将初始建模网络中的初始纹理解码器作为目标建模网络中的目标纹理解码器,将初始建模网络中的初始光照回归器作为目标建模网络中的目标光照回归器。
可以理解的是,本申请实施例中,对初始建模网络进行训练可以是基于半监督学习的训练方式进行训练,以减少对训练数据的依赖。具体的,可以采用配对数据进行监督学习,采用未标记数据进行自监督学习。其中,基于配对数据进行监督学习的方式对初始建模网络进行训练的网络训练策略可以为第一训练策略,基于未标记数据进行自监督学习的方式对初始建模网络进行训练的网络训练策略可以为第二训练策略。可以理解的是,在采用不同训练策略对初始建模网络进行训练时,获取参考纹理贴图的方法可以不同。
可选的,获取第二训练纹理贴图对应的参考纹理贴图,可以包括以下步骤:获取初始建模网络对应的网络训练策略,在网络训练策略为第一训练策略时,从训练视点头像图像中提取出训练视点头像图像的皮肤区域,并计算训练视点头像图像的皮肤区域的平均颜色;进一步的,基于训练视点头像图像确定训练虚拟对象的头部部位在三维场景下的训练三维头像网格,并基于训练三维头像网格对训练视点头像图像进行图像展开处理,得到训练视点头像图像对应的初始纹理贴图;进一步的,获取模板纹理贴图,将平均颜色添加至模板纹理贴图,并对初始纹理贴图和添加了平均颜色的模板纹理贴图进行混合处理,得到混合纹理贴图;进一步的,对混合纹理贴图进行图像优化处理,得到训练视点头像图像的优化纹理贴图,将优化纹理贴图作为第一训练策略对应的参考纹理贴图。
可以理解的是,该网络训练策略可以为用于对初始建模网络进行训练的策略,如可以为上述的基于自监督学习的方式进行训练的策略,或者可以为上述的监督学习的方式进行训练的策略。该第一训练策略则可以为基于监督学习的方式进行训练的策略。可以理解的是,在网络训练策略为第一训练策略时,训练视点头像图像需要关联有配对的纹理贴图,以作为此处的参考纹理贴图。
可以理解的是,该皮肤区域可以用于指示训练视点头像图像中的皮肤对应的区域。该皮肤区域可以通过预训练的头像分割网络进行确定。可以理解的是,在确定的皮肤区域中可以包括多个像素,每个像素有对应的像素值(也称颜色信息),进而可以基于皮肤区域中的每个像素的像素值的平均值得到皮肤区域的平均颜色。
可以理解的是,该初始纹理贴图可以为基于训练 三维头像网格对训练视点头像图像进行图像展开处理得到的纹理贴图。可以理解的是,确定该初始纹理贴图方法可以参照上述获取第一目标纹理贴图的相关描述,此处不做赘述。
可以理解的是,该模板纹理贴图可以由于业务场景所对应的业务提供者(如游戏场景下的游戏开发者)提供,该模板纹理贴图可以有一些预设的模板纹理,以表现面部的皮肤质感。将平均颜色添加至模板纹理贴图,可以得到有具有该平均颜色和预设的模板纹理的纹理贴图。
可以理解的是,该混合纹理贴图可以为对初始纹理贴图和添加了平均颜色的模板纹理贴图进行混合处理得到纹理贴图。可以理解的是,对初始纹理贴图和添加了平均颜色的模板纹理贴图进行混合处理,可以采用泊松混合的方式进行混合。
可以理解的是,该优化纹理贴图可以为在混合纹理贴图的基础上进行有图像优化处理得到的纹理贴图。可以理解的是,对混合纹理贴图进行图像优化处理,可以使得纹理贴图的纹理质量更好,如可以使混合纹理贴图更加完整、清晰度更高、对比度更合适等等,此处不做显示。例如,可以对混合纹理贴图去除头发和眼镜等非皮肤区域,并尽可能使用对称性来修补遮挡区域。又如,可以对混合纹理贴图进行阴影和高光的修复。可以理解的是,由于人工可以控制生成纹理的质量,人工选择混合纹理贴图进行阴影和高光的修复的工作量很小,每个纹理贴图仅需要几分钟就可以完成细化,则可以通过人工的形式进行纹理贴图的阴影和高光的修复,或者也可以基于一些预训练好的纹理修复模型对混合纹理贴图进行修复,此处不做限制。
可以理解的是,通过上述方式,可以创建一个RGB纹理贴图集,RGB纹理贴图集中的优化纹理贴图可以与创建得到的该优化纹理贴图的训练视点头像图像组成配对数据,以便于基于得到的配对数据对初始建模网络进行监督训练。
可选的,获取第二训练纹理贴图对应的参考纹理贴图,可以包括以下步骤:获取初始建模网络对应的网络训练策略,在网络训练策略为第二训练策略时,将第一训练纹理贴图作为第二训练策略对应的参考纹理贴图。
可以理解的是,该第二训练策略则可以为基于自监督学习的方式进行训练的策略。可以理解的是,在网络训练策略为第二训练策略时,训练视点头像图像无需关联有配对的纹理贴图,而是可以直接基于训练视点头像图像的第一训练纹理贴图作为参考纹理贴图,在训练过程中使得第二训练纹理贴图可以与第一训练纹理贴图接近。
具体的,基于参考纹理贴图和第二训练纹理贴图、训练渲染图像和训练视点头像图像,对初始建模网络进行迭代训练,并将迭代训练后的初始建模网络作为目标建模网络,可以包括以下步骤:获取训练视点头像图像对应的皮肤区域掩码,基于皮肤区域掩码计算训练渲染图像和训练视点头像图像之间的图像距离,并基于图像距离确定第一参考信息;进一步的,计算参考纹理贴图和第二训练纹理贴图之间的纹理贴图距离,并基于纹理贴图距离确定第二参考信息;进一步的,基于第一参考信息和第二参考信息对初始建模网络进行迭代训练,并将迭代训练后的初始建模网络作为目标建模网络。
可以理解的是,该皮肤区域掩码可以用于指示训练视点头像图像的皮肤区域。可以理解的是,该皮肤区域掩码可以基于预训练好的头像分割网络进行确定。例如,将皮肤区域对应的值确定为1,非皮肤区域对应的值确定为0,由此得到皮肤区域掩码。
可以理解的是,该图像距离可以用于指示训练视点头像图像和训练渲染图像之间的距离。可以理解的是,由于是基于皮肤区域掩码确定的该图像距离,则该图像距离实质是训练视点头像图像中的皮肤区域与训练渲染图像中的皮肤区域的图像距离。该第一参考信息可以为基于训练视点头像图像和训练渲染图像确定的损失值。
例如,可以将第一参考信息定义为训练视点头像图像和训练渲染图像之间的像素级 L1 距离,则第一参考信息的确定方式可以通过以下公式(公式7)进行表示:
公式7
其中,I表示输入的训练视点头像图像,R表示渲染得到的训练渲染图像,表示训练视点头像图像与训练渲染图像之间的损失,即第一参考信息。e表示像素索引,E表示像素的数量,则表示训练视点头像图像中的第e个像素,表示训练渲染图像中的第e个像素。表示上述的皮肤区域掩码。
该纹理贴图距离可以用于指示参考纹理贴图和第二训练纹理贴图之间的距离。该第二参考信息可以为基于参考纹理贴图和第二训练纹理贴图确定的损失值。
例如,可以将第二参考信息定义为参考纹理贴图和第二训练纹理贴图之间的L1距离,则第二参考信息的确定方式可以通过以下公式(公式8)进行表示:
公式8
其中,F表示第二训练纹理贴图,G表示参考纹理贴图,则表示第二参考信息。q是像素索引,q的取值为0-Q,Q是纹理贴图的像素数量。
可以理解的是,在基于第一参考信息和第二参考信息对初始建模网络进行迭代训练的过程中,可以使得第一参考信息和第二参考信息的和逐渐减小,也就是相当于逐渐减小训练视点头像图像和训练渲染图像之间的图像距离,以及参考纹理贴图和第二训练纹理贴图之间的纹理贴图距离。
可以理解的是,进一步的,本申请实施例还可以在训练过程中使用对抗训练,从而提升训练得到的目标建模网络的网络效果。也就是在训练过程中引入了两个判别器,一个用于判别头像图像是否为真实图像,一个用于判别纹理贴图是否为真实纹理贴图。也就是可以训练判别器来判断输入的图像是真实数据(如训练视点头像图像或对训练视点头像图像进行图像展开处理得到的第一训练纹理贴图)还是虚假数据(即基于训练建模网络生成的训练渲染图像或第二训练纹理贴图),同时训练初始建模网络生成能够欺骗判别器的训练渲染图像。
具体的,基于第一参考信息和第二参考信息对初始建模网络进行迭代训练,并将迭代训练后的初始建模网络作为目标建模网络,可以包括以下步骤:将训练视点头像图像输入至第一判别器进行判别处理,得到用于指示训练视点头像图像为真实图像的第一概率,并将训练渲染图像输入至第一判别器进行判别处理,得到用于指示训练渲染图像为真实图像的第二概率;进一步的,基于第一概率和第二概率确定第三参考信息;进一步的,将参考纹理贴图输入至第二判别器进行判别处理,得到用于指示参考纹理贴图为真实纹理贴图的第三概率,并将第二训练纹理贴图输入至第二判别器进行判别处理,得到用于指示第二训练纹理贴图为真实纹理贴图的第四概率;进一步的,基于第三概率和第四概率确定第四参考信息;进一步的,基于第三参考信息和第四参考信息对第一判别器和第二判别器进行迭代训练,并基于第一参考信息、第二参考信息、第二概率和第四概率对初始建模网络进行迭代训练,得到目标建模网络。
该第一判别器可以为用于判断输入的头像图像是否为真实图像,即可以确定输入的头像图像为真实图像的概率。可以理解的是,该真实图像用于指示不是基于建模网络生成的图像头像,而是直接获取到的视点头像图像。
该第二判别器可以为用于判断输入的纹理贴图是否为真实纹理贴图,即可以确定纹理贴图为真实纹理贴图的概率。可以理解的是,该真实纹理贴图用于指示不是基于建模网络生成的纹理贴图,而是直接获取到的纹理贴图,如对训练视点头像图像展开得到的纹理贴图,优化纹理贴图等。
通过第一判别器和第二判别器进行对抗训练的目标函数可以通过以下公式(公式9)进行表示:
公式9
其中,表示目标函数。表示虚假数据为真实数据的概率,如可以为训练渲染图像为真实图像的概率(即第二概率),或者第二训练纹理贴图为真实纹理贴图的概率(即第四概率),则可以表示虚假数据为虚假数据的概率,即虚假数据不为真实数据的概率。表示真实数据为真实数据的概率,如可以为训练视点头像图像为真实图像的概率(如第一概率),或者参考纹理贴图为真实纹理贴图的概率(如第三概率)。其中,表示用于进行头像图像判别的第一判别器,表示用于进行纹理贴图判别的第二判别器。E[ ]表示对[ ]中的内容求期望,也称量化。
可以理解的是,基于第三参考信息和第四参考信息对第一判别器和第二判别器进行迭代训练,可以为基于第三参考信息和第四参考信息的和确定判别损失信息,该判别损失信息可以为对第一判别器和第二判别器进行训练的损失信息。可以理解的是,随着基于判别损失信息的对第一判别器和第二判别器的训练,可以使第三参考信息中的第一概率(即训练视点头像图像为真实图像的概率)逐渐增大,也就是训练视点头像图像为虚假数据的概率逐渐减小,第三参考信息中的第二概率(即训练渲染图像为真实图像的概率)逐渐减小,也就是训练渲染图像为虚假数据的概率逐渐增大;以及,可以使得第四参考信息中的第三概率(即参考纹理贴图为真实纹理贴图的概率)逐渐增大,也就是参考纹理贴图为虚假数据的概率逐渐减小,第四参考信息中的第四概率(即第二训练纹理贴图为真实图像的概率)逐渐减小,也就是第二训练纹理贴图为虚假数据的概率逐渐增大,从而使得判别器可以更准确地鉴别真实数据和虚假数据。
可以理解的是,基于第一参考信息、第二参考信息、第二概率和第四概率对初始建模网络进行迭代训练,得到目标建模网络,可以为基于第一参考信息、第二参考信息、第二概率和第四概率的和确定建模网络损失信息,该建模网络损失信息可以为初始建模网络进行训练的损失信息。可以理解的是,随着基于建模网络损失信息的对初始建模网络的训练,可以使第一参考信息和第二参考信息逐渐减小,即训练渲染图像和训练视点头像图像之间的距离减小,第二训练纹理贴图与参考纹理贴图之间的距离减小。另外,能够使得第二概率(即训练渲染图像为真实图像的概率)逐渐增大,也就是基于判别器得到的训练渲染图像为虚假数据的概率逐渐减小,并且,能够使得基于判别器得到的第四概率(第二训练纹理贴图为真实纹理贴图的概率)逐渐增大,也就是第二训练纹理贴图为虚假数据的概率逐渐减小,以达成生成的头像图像和纹理贴图能够迷惑判别器的目的。
可以理解的是,通过上述定义的损失函数,用于对第一判别器和第二判别器进行训练的最终的损失函数可以通过以下公式(公式10)进行表示:
公式10
其中,表示对判别器进行训练的损失函数,为相应的权重。表示将训练渲染图像R和训练视点头像图像R输入至第一判别器得到的概率通过上述公式9生成的损失值,表示将第二训练纹理贴图F和参考纹理贴图G输入至第二判别器得到的概率通过上述公式9生成的损失值。
可以理解的是,通过上述定义的损失函数,用于对初始建模网络进行训练的最终的损失函数可以通过以下公式(公式11)进行表示:
公式11
其中,表示对初始建模网络进行训练的损失函数,(如)是平衡不同损失项的相应权重。参照上述描述。表示将训练渲染图像R输入至第一判别器中得到的概率通过上述公式9生成的损失值。表示将第二训练纹理贴图F输入至第二判别器中得到的概率通过上述公式9生成的损失值。可以理解的是,随着训练的进行,为了对抗判别器,初始建模网络希望能生成迷惑判别器的头像图像或纹理贴图,也就是能够通过对初始建模网络进行训练,使得生成的训练渲染图像在输入判别器得到的用于指示训练渲染图像为虚假数据的概率越来越低(即判别器预测得到训练渲染图像为真实图像的概率越来越大),生成的第二训练纹理贴图在输入判别器得到的用于指示该第二训练纹理贴图为虚假数据的概率越来越低(即判别器预测得到第二训练纹理贴图为真实纹理贴图的概率越来越大)。
可以理解的是,在训练过程中,旨在解决问题,从而达成对上述训练目的,也就是说,可以在训练过程中使得建模网络能够生成基于判别器预测到的为真实数据的概率更高的训练渲染图像和第二训练纹理贴图,并可以使得判别器能够将真实数据判别为真实数据的概率更高,将虚假数据判别为虚假数据的概率更高,以此形成对抗。可以理解的是,需要在训练过程中进行优化的网络组件可以以端到端的方式进行训练,即可以对初始建模网络进行端到端的训练。在进行自监督学习的过程中,训练视点头像图像没有配对对应的优化纹理贴图,则在训练过程中简单地忽略该优化纹理贴图相关的损失项。
可以理解的是,在得到建模网络损失信息后,可以基于该建模网络损失信息计算梯度,由于本申请实施例采用可微分渲染方法渲染得到渲染头像图像,由此能够实现梯度的计算,并将该梯度反向传播到初始建模网络中每个需要进行参数更新的模块,如上述的初始图像编码器、初始纹理编码器、初始纹理解码器、初始光照回归器,从而完成对初始建模网络的训练。
此处结合图示,对初始建模网络的训练过程进行阐述,请参见图7,图7是本申请实施例提供的一种初始建模网络的训练过程的流程示意图。首先,可以获取训练视点头像图像701,例如701a所示的图像,可以理解的是,该训练视点头像图像701可以为一些三维模型显示效果合格的训练虚拟对象的头部部位的图像。进而可以基于训练视点头像图像重构得到训练三维面部形状702,如可以通过预训练好的三维面部系数回归器确定身份特征、表达特征,进而可以基于调用三维可变形头像模型基于身份特征和表达特征确定训练三维面部形状。进一步的,可以基于训练三维面部形状702确定训练三维面部网格703,然后对训练三维面部网格703进行头像转移,得到能够加载至业务场景下的虚拟环境(如游戏环境)的训练三维头像网格704,例如704a所示的三维头像网格,具体可以通过训练三维面部网格与模板网格中的关键点对拟合得到偏移量函数,从而计算得到训练三维面部网格中每个网格顶点的偏移量,以得到训练三维面部网格中每个网格顶点的新的位置信息(即训练位置信息),进而得到训练三维头像网格。可以理解的是,在基于预训练好的三维面部系数回归器确定身份特征、表达特征时,还可以基于该预训练好的三维面部系数回归器确定训练面部姿势系数705。可以理解的是,在得到训练三维头像网格704后,可以通过训练三维头像网格704对训练视点头像图像进行图像展开处理,得到第一训练纹理贴图706,例如706a所示的纹理贴图,具体的展开方式参照上述描述,此处不做赘述。
进一步的,将训练视点头像图像701和第一训练纹理贴图706输入至初始建模网络的707。该初始建模网络707中可以包括初始图像编码器7071、初始纹理编码器7074、初始光照回归器7073以及初始纹理解码器7077。具体的,通过初始图像编码器7071对训练视点头像图像701进行图像编码处理得到训练图像特征7072,然后将训练图像特征7072输入至初始光照回归器进行光照预测,得到训练预测光照系数708。并且,通过初始纹理编码器7074对第一训练纹理特征706进行纹理编码处理,得到训练纹理特征7075,然后将训练图像特征7072和训练纹理特征7075进行特征拼接处理,得到训练拼接特征7076,进而可以通过初始纹理解码器7077对训练拼接特征进行纹理解码处理,得到第二训练纹理贴图709,例如709a所示的纹理贴图。
进一步的,可以将训练三维头像网格704、训练面部姿势系数705、以及基于初始建模网络生成的训练预测光照系数708以及第二训练纹理贴图709输入至可微分渲染器710,得到训练渲染图像711,例如711a所示的图像。
进一步的,在确定了训练渲染纹理贴图后,可以进行确定用于对初始建模网络进行参数更新的损失信息。本申请实施例还引入了判别器,以进行对抗训练。参见图8,图8是本申请实施例提供的一种判别器的效果示意图。可以理解的是,如图8所示,可以将训练渲染图像801和训练视点头像图像802输入至第一判别器803,以判定输入的图像是否为真实图像804。可以将第二训练纹理贴图805和参考纹理贴图806输入至第二判别器807,以判定输入的纹理贴图是否为真实纹理贴图808。具体如何计算建模网络损失信息以及判别器损失信息可以参照上述描述,此处不做赘述。由此可以对初始建模网络的网络参数进行更新,使得初始建模网络能够生成精细化的纹理贴图,从而提升重建得到的三维模型的显示效果。
S606、获取位于三维场景下的目标虚拟对象的头部部位对应的目标视点头像图像,在重构得到的目标视点头像图像的初始三维面部形状时,基于初始三维面部形状确定目标虚拟对象的头部部位在三维场景下的目标三维头像网格。
S607、基于目标三维头像网格对目标视点头像图像进行图像展开处理,得到目标视点头像图像对应的第一目标纹理贴图。
S608、对第一目标纹理贴图进行纹理编码处理,得到第一目标纹理贴图对应的纹理编码特征,在获取到目标视点头像图像的图像编码特征时,将纹理编码特征与图像编码特征进行特征拼接处理,得到用于进行纹理解码的纹理图像拼接特征,对纹理图像拼接特征进行纹理解码处理,得到第一目标纹理贴图对应的第二目标纹理贴图;第二目标纹理贴图的纹理质量优于第一目标纹理贴图的纹理质量。
S609、基于目标三维头像网格和第二目标纹理贴图得到目标渲染头像图像,基于得到的目标渲染头像图像生成目标虚拟对象的头部部位在三维场景下的三维头部模型。
可以理解的是,步骤S606-步骤S609可以参照上述步骤S101-S104的相关描述,此处不做赘述。
在本申请实施例中,能够基于输入的头部图像(如目标视点头像图像)快速重建得到目标虚拟对象的头部部位在三维场景下的目标三维头像网格,然后可以通过对基于目标三维头像网格展开得到的第一目标纹理贴图进行编解码处理,得到纹理质量更优的纹理贴图(即第二目标纹理贴图),进而基于该目标三维头像网格和第二目标纹理贴图得到目标渲染头像图像,从而生成目标虚拟对象的三维头部模型。由此能够基于虚拟对象的头像图像自动化重建虚拟对象的三维头部模型。另外,由于本申请实施例能够生成纹理质量更优的纹理贴图,进而可以提升渲染得到的三维头部模型的模型渲染效果。
进一步的,此处结合业务场景对本申请提供的图像数据处理方法进行阐述。请参见图9,图9是本申请实施例提供的一种图像数据处理方法的流程示意图四。该方法可由上述计算机设备来执行。该方法至少可以包括以下步骤。
S901、获取位于三维场景下的目标虚拟对象的头部部位对应的目标视点头像图像,在重构得到的目标视点头像图像的初始三维面部形状时,基于初始三维面部形状确定目标虚拟对象的头部部位在三维场景下的目标三维头像网格。
可以理解的是,在业务场景为游戏场景时,该三维场景可以用于对虚拟对象所指示的游戏角色进行三维建模,即游戏场景下的虚拟对象具体可以为游戏角色。可以理解是,该目标虚拟对象可以为游戏应用中的一些头部部位的三维模型的建模不合格的虚拟对象,进而可以获取到目标虚拟对象的头部部位的目标视点头像图像,从而基于该目标视点头像图像重建目标虚拟对象的三维头部模型。
可以理解的是,在业务场景为游戏场景时,该目标三维头像网格可以为能够直接在游戏环境中使用的三维头像网格。具体的,可以基于初始三维面部形状确定初始三维面部网格,然后获取游戏模板网格,进而基于游戏模板网格对初始三维面部网格进行头像转移处理,得到该目标三维头像网格。
可以理解的是,在业务场景为虚拟形象生成场景时,该三维场景可以用于对虚拟形象进行三维建模。其中,虚拟形象是通过计算机图形学技术进行虚拟制作的形象,如可以为人物形象、拟人的形象、动物形象等等,此处不做限制,如一些虚拟形象主播、虚拟形象歌手等等。
可以理解的是,该目标虚拟对象可以为一些头部部位的三维模型的建模效果不合格的虚拟形象,进而可以获取到目标虚拟对象的头部部位的目标视点头像图像,从而基于该目标视点头像图像重建目标虚拟对象的三维头部模型,以实现对虚拟形象所对应的虚拟对象的建模渲染效果进行优化。
可以理解的是,在业务场景为虚拟形象生成场景时,该目标三维头像网格可以为能够直接在虚拟形象应用环境中使用的三维头像网格。具体的,可以基于初始三维面部形状确定初始三维面部网格,然后获取虚拟形象模板网格,进而基于虚拟形象模板网格对初始三维面部网格进行头像转移处理,得到该目标三维头像网格。
S902、基于目标三维头像网格对目标视点头像图像进行图像展开处理,得到目标视点头像图像对应的第一目标纹理贴图。
S903、对第一目标纹理贴图进行纹理编码处理,得到第一目标纹理贴图对应的纹理编码特征,在获取到目标视点头像图像的图像编码特征时,将纹理编码特征与图像编码特征进行特征拼接处理,得到用于进行纹理解码的纹理图像拼接特征,对纹理图像拼接特征进行纹理解码处理,得到第一目标纹理贴图对应的第二目标纹理贴图;第二目标纹理贴图的纹理质量优于第一目标纹理贴图的纹理质量。
S904、基于目标三维头像网格和第二目标纹理贴图得到目标渲染头像图像,基于得到的目标渲染头像图像生成目标虚拟对象的头部部位在三维场景下的三维头部模型。
可以理解的是,在对初始建模网络进行迭代训练以得到目标建模网络的过程中,所获取的训练视点头像图像可以根据业务场景所确定。例如,在业务场景为游戏场景时,可以获取游戏应用中的一些建模渲染效果合格的虚拟对象在一定视点下的头像图像作为训练视点头像图像。又如,在业务场景为虚拟形象生成场景时,可以获取虚拟形象生成场景下的一些建模渲染效果合格的虚拟对象在一定视点下的头像图像作为训练视点头像图像。由此可以通过训练视点头像图像对初始建模网络进行迭代训练,得到目标建模网络,使得目标建模网络能够得到更精细化的纹理贴,提升重建得到的三维头部模型的渲染效果。
进一步的,在重构得到的三维头部模型达到目标条件时,利用重构得到三维头部模型和目标虚拟对象的除头部部位的其他部位的三维模型构建新的虚拟对象,该新的虚拟对象的三维头部模型的模型渲染效果优于原本的目标虚拟对象的头部部位的三维模型的模型渲染效果。可以理解的是,该目标条件可以为用于指示利用重构得到三维头部模型与目标虚拟对象的其他部位的三维模型构建新的虚拟对象的条件。例如,该目标条件可以为该目标渲染头像图像的清晰度大于一定阈值,该目标渲染头像图像的清晰度大于一定阈值,就相当于是三维头部模型的纹理的质量达到需求。又如,该目标条件可以为目标渲染头像图像与目标视点头像图像之间的相似性大于一定阈值,就相当于是三维头部模型与初始三维头部模型的结构是相似的,避免重构得到的三维头部模型的形状与初始三维头部模型差距过大。或者还可以有其他的目标条件,此处不做赘述。
进一步的,重建得到的新的虚拟对象可以用于加载至业务场景的虚拟环境中,也就相当于是将得到的目标三维头像网格和第二目标纹理贴图加载至虚拟环境中。例如,在业务场景为游戏场景时,目标虚拟对象为目标角色的三维模型,则重建得到的新的虚拟对象可以替换目标虚拟对象的作为该目标角色加载至游戏环境中,从而为游戏玩家提供更生动的游戏模型,提升游戏体验。
又如,在业务场景为虚拟形象生成场景时,目标虚拟对象可以为目标虚拟形象的三维模型,则重建得到的新的虚拟对象可以替换目标虚拟对象的作为该虚拟形象加载至虚拟形象应用环境中,从而为用户提供更为逼真的虚拟形象。
请参见图10,图10是本申请实施例提供的一种图像数据处理装置的结构示意图。如图10所示,图像数据处理装置1可以是运行于计算机设备的一个计算机程序(包括程序代码),例如该图像数据处理装置1为一个应用软件;可以理解的是,该图像数据处理装置1可以用于执行本申请实施例提供的图像数据处理方法中的相应步骤。如图10所示,该图像数据处理装置1可以包括:网格生成模块11、第一纹理生成模块12、第二纹理生成模块13、渲染模块14;
网格生成模块11,用于获取位于三维场景下的目标虚拟对象的头部部位对应的目标视点头像图像,在重构得到的目标视点头像图像的初始三维面部形状时,基于初始三维面部形状确定目标虚拟对象的头部部位在三维场景下的目标三维头像网格;
第一纹理生成模块12,用于基于目标三维头像网格对目标视点头像图像进行图像展开处理,得到目标视点头像图像对应的第一目标纹理贴图;
第二纹理生成模块13,用于对第一目标纹理贴图进行纹理编码处理,得到第一目标纹理贴图对应的纹理编码特征,在获取到目标视点头像图像的图像编码特征时,将纹理编码特征与图像编码特征进行特征拼接处理,得到用于进行纹理解码的纹理图像拼接特征,对纹理图像拼接特征进行纹理解码处理,得到第一目标纹理贴图对应的第二目标纹理贴图;第二目标纹理贴图的纹理质量优于第一目标纹理贴图的纹理质量;
渲染模块14,用于基于目标三维头像网格和第二目标纹理贴图进行得到目标渲染头像图像,基于得到的目标渲染头像图像生成目标虚拟对象的头部部位在三维场景下的三维头部模型。
其中,图像编码特征是基于目标建模网络中的目标图像编码器所确定的,纹理编码特征是基于目标建模网络中的目标纹理编码器所确定的,第二目标纹理贴图是基于目标建模网络中的目标纹理解码器所确定的,目标预测光照系数是基于目标建模网络中的目标光照回归器所确定的;
图像数据处理装置1中还包括建模网络训练模块15,建模网络训练模块15包括:训练网格生成单元151、第一训练纹理单元152、第二训练纹理单元153、训练渲染单元154、训练单元155;
训练网格生成单元151,用于获取位于三维场景下的训练虚拟对象的头部部位对应的训练视点头像图像,在重构得到的训练视点头像图像的训练三维面部形状时,基于训练三维面部形状确定训练虚拟对象的头部部位在三维场景下的训练三维头像网格;
第一训练纹理单元152,用于基于训练三维头像网格对训练视点头像图像进行图像展开处理,得到训练视点头像图像对应的第一训练纹理贴图;
第二训练纹理单元153,用于基于初始建模网络中的初始纹理编码器对第一训练纹理贴图进行纹理编码处理,得到第一训练纹理贴图对应的训练纹理特征,在基于初始建模网络中的初始图像编码器获取到训练视点头像图像的训练图像特征时,将训练纹理特征与训练图像特征进行特征拼接处理,得到用于进行纹理解码的训练拼接特征,基于初始建模网络中的初始纹理解码器对训练拼接特征进行纹理解码处理,得到第一训练纹理贴图对应的第二训练纹理贴图;
训练渲染单元154,用于基于训练三维头像网格和第二训练纹理贴图得到训练渲染图像;
训练单元155,用于获取第二训练纹理贴图对应的参考纹理贴图,并基于参考纹理贴图和第二训练纹理贴图、训练渲染图像和训练视点头像图像,对初始建模网络进行迭代训练,并将迭代训练后的初始建模网络作为目标建模网络。
其中,训练单元155,还包括:参考纹理获取子单元1551;
参考纹理获取子单元1551,用于获取初始建模网络对应的网络训练策略,在网络训练策略为第一训练策略时,从训练视点头像图像中提取出训练视点头像图像的皮肤区域,并计算训练视点头像图像的皮肤区域的平均颜色;
参考纹理获取子单元1551,还用于基于训练视点头像图像确定训练虚拟对象的头部部位在三维场景下的训练三维头像网格,并基于训练三维头像网格对训练视点头像图像进行图像展开处理,得到训练视点头像图像对应的初始纹理贴图;
参考纹理获取子单元1551,还用于获取模板纹理贴图,将平均颜色添加至模板纹理贴图,并对初始纹理贴图和添加了平均颜色的模板纹理贴图进行混合处理,得到混合纹理贴图;
参考纹理获取子单元1551,还用于对混合纹理贴图进行图像优化处理,得到训练视点头像图像的优化纹理贴图,将优化纹理贴图作为第一训练策略对应的参考纹理贴图。
其中,参考纹理获取子单元1551,还用于:获取初始建模网络对应的网络训练策略,在网络训练策略为第二训练策略时,将第一训练纹理贴图作为第二训练策略对应的参考纹理贴图。
其中,训练单元155,还包括:参考信息获取子单元1552;
参考信息获取子单元1552,用于:
获取训练视点头像图像对应的皮肤区域掩码,基于皮肤区域掩码计算训练渲染图像和训练视点头像图像之间的图像距离,并基于图像距离确定第一参考信息;
计算参考纹理贴图和第二训练纹理贴图之间的纹理贴图距离,并基于纹理贴图距离确定第二参考信息;
基于第一参考信息和第二参考信息对初始建模网络进行迭代训练,并将迭代训练后的初始建模网络作为目标建模网络。
其中,参考信息获取子单元1552,还用于:
将训练视点头像图像输入至第一判别器进行判别处理,得到用于指示训练视点头像图像为真实图像的第一概率,并将训练渲染图像输入至第一判别器进行判别处理,得到用于指示训练渲染图像为真实图像的第二概率;
基于第一概率和第二概率确定第三参考信息;
将参考纹理贴图输入至第二判别器进行判别处理,得到用于指示参考纹理贴图为真实纹理贴图的第三概率,并将第二训练纹理贴图输入至第二判别器进行判别处理,得到用于指示第二训练纹理贴图为真实纹理贴图的第四概率;
基于第三概率和第四概率确定第四参考信息;
基于第三参考信息和第四参考信息对第一判别器和第二判别器进行迭代训练,并基于第一参考信息、第二参考信息、第二概率和第四概率对初始建模网络进行迭代训练,得到目标建模网络。
其中,图像编码特征是基于目标建模网络中的目标图像编码器所确定的,纹理编码特征是基于目标建模网络中的目标纹理编码器所确定的,第二目标纹理贴图是基于目标建模网络中的目标纹理解码器所确定的;
渲染模块14,还用于:
基于目标建模网络中的目标光照回归器对图像编码特征进行光照预测处理,得到目标预测光照系数;
在获取到与初始三维面部形状相关联的目标面部姿势系数时,对目标三维头像网格、目标面部姿势系数、目标预测光照系数以及第二目标纹理贴图进行可微分渲染处理,得到目标渲染头像图像。
其中,第二纹理生成模块13,可以包括:纹理编码单元131;
纹理编码单元131,用于基于第一目标纹理贴图中每个像素的像素值,将第一目标纹理贴图转换到频域空间,得到第一目标纹理贴图对应的频域信息,并将第一目标纹理贴图对应的频域信息确定为第一目标纹理贴图对应的纹理编码特征。
其中,第二纹理生成模块13,可以包括:纹理解码单元132;
纹理解码单元132,用于获取用于进行纹理解码所需的解码带宽,基于解码带宽所指示的频率范围,在将纹理图像拼接特征从频域空间转换到颜色空间时,得到纹理图像拼接特征对应的颜色空间信息,并基于颜色空间信息确定第二目标纹理贴图。
其中,网格生成模块11,包括:初始网格获取单元111、模板网格获取单元112、偏移计算单元113、转移单元114;
初始网格获取单元111,用于基于初始三维面部形状确定初始三维面部网格,从初始三维面部网格中所包含的M个第一网格顶点中获取用于表征目标虚拟对象的头部部位的N个第一关键点;N为小于M的正整数;
模板网格获取单元112,用于获取模板网格,在模板网格中查找与N个第一关键点具有相同关键属性的N个第二关键点;一个第一关键点对应一个第二关键点;
偏移计算单元113,用于将N个第一关键点和查找到的N个第二关键点,构成目标虚拟对象的头部部位的N个关键点对,在基于N个关键点对拟合得到与M个第一网格顶点相关联的偏移量函数时,基于偏移量函数确定初始三维面部网格中所包含的M个第一网格顶点对应的偏移量;
转移单元114,用于基于每个第一网格顶点对应的偏移量分别确定每个第一网格顶点对应的目标位置信息,将每个第一网格顶点对应的目标位置信息所指示的空间点确定为第二网格顶点,并基于M个第二网格顶点确定目标三维头像网格。
其中,偏移量函数用于指示对K个径向基函数进行加权求和,每个径向基函数关联有对应的函数权重;
偏移计算单元113,用于:
在M个第一网格顶点中获取第i个第一网格顶点,确定第i个第一网格顶点的初始位置信息;i为小于或者等于M的正整数;
基于第i个第一网格顶点的初始位置信息和每个径向基函数,确定第i个第一网格顶点针对每个径向基函数的函数值;
基于第i个第一网格顶点针对每个径向基函数的函数值和每个径向基函数对应的函数权重进行加权求和处理,将加权求和处理后所得到的和值作为第i个第一网格顶点对应的偏移量。
其中,转移单元114,用于:
在M个第一网格顶点中获取第i个第一网格顶点,确定第i个第一网格顶点的初始位置信息;i为小于或者等于M的正整数;
基于第i个第一网格顶点的初始位置信息与第i个第一网格顶点的对应的偏移量的和,确定每个第一网格顶点对应的目标位置信息。
其中,偏移计算单元113,用于:
基于每个关键点对中的第一关键点和第二关键点之间的位置距离对初始三维面部网格和模板网格进行对齐处理,并在N个关键点对的位置距离的和最小化时,将每个关键点对中的第一关键点和第二关键点之间的位置距离确定为目标位置距离;
基于每个关键点对的目标位置距离进行插值计算,确定K个径向基函数以及每个径向基函数对应的函数权重,并基于K个径向基函数以及每个径向基函数对应的函数权重确定与M个第一网格顶点相关联的偏移量函数。
其中,初始三维面部网格中的M个第一网格顶点是基于目标视点头像图像的身份特征和第一主成分分析基、目标视点头像图像的表达特征和第二主成分分析基、以及平均面部形状生成的;身份特征用于指示目标虚拟对象的角色类型,表达特征用于指示目标视点头像图像对应的面部表情。
请参见图11,图11是本申请实施例提供的一种计算机设备的结构示意图。如图11所示,该计算机设备1000可以包括:处理器1001,网络接口1004和存储器1005,此外,上述计算机设备1000还可以包括:用户接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图11所示,作为一种计算机可读存储介质的存储器1005中可以包括操作***、网络通信模块、用户接口模块以及设备控制应用程序。
在如图11所示的计算机设备1000中,网络接口1004可提供网络通讯功能;而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以执行前文任一个所对应实施例中对该数据处理方法的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介质,且计算机可读存储介质中存储有前文提及的数据处理装置1所执行的计算机程序,且计算机程序包括程序指令,当处理器执行程序指令时,能够执行前文实施例中对数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。
上述计算机可读存储介质可以是前述任一实施例提供的数据处理装置或者上述计算机设备的内部存储单元,例如计算机设备的硬盘或内存。该计算机可读存储介质也可以是该计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(smart media card,SMC),安全数字(secure digital,SD)卡,闪存卡(flash card)等。进一步地,该计算机可读存储介质还可以既包括该计算机设备的内部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该计算机设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
此外,这里需要指出的是:本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前文任一个所对应实施例提供的方法。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机程序产品或者计算机程序实施例中未披露的技术细节,请参照本申请方法实施例的描述。
本申请实施例的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、装置、产品或设备固有的其他步骤单元。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (17)

1.一种图像数据处理方法,其特征在于,所述方法包括:
获取位于三维场景下的目标虚拟对象的头部部位对应的目标视点头像图像,在重构得到的所述目标视点头像图像的初始三维面部形状时,基于所述初始三维面部形状确定所述目标虚拟对象的头部部位在所述三维场景下的目标三维头像网格;
基于所述目标三维头像网格对所述目标视点头像图像进行图像展开处理,得到所述目标视点头像图像对应的第一目标纹理贴图;
对所述第一目标纹理贴图进行纹理编码处理,得到所述第一目标纹理贴图对应的纹理编码特征,在获取到所述目标视点头像图像的图像编码特征时,将所述纹理编码特征与所述图像编码特征进行特征拼接处理,得到用于进行纹理解码的纹理图像拼接特征,对所述纹理图像拼接特征进行纹理解码处理,得到所述第一目标纹理贴图对应的第二目标纹理贴图;所述第二目标纹理贴图的纹理质量优于所述第一目标纹理贴图的纹理质量;
基于所述目标三维头像网格和所述第二目标纹理贴图得到目标渲染头像图像,基于得到的目标渲染头像图像生成所述目标虚拟对象的头部部位在所述三维场景下的三维头部模型。
2.根据权利要求1所述的方法,其特征在于,所述图像编码特征是基于目标建模网络中的目标图像编码器所确定的,所述纹理编码特征是基于所述目标建模网络中的目标纹理编码器所确定的,所述第二目标纹理贴图是基于所述目标建模网络中的目标纹理解码器所确定的;
所述方法还包括:
获取位于三维场景下的训练虚拟对象的头部部位对应的训练视点头像图像,在重构得到的所述训练视点头像图像的训练三维面部形状时,基于所述训练三维面部形状确定所述训练虚拟对象的头部部位在所述三维场景下的训练三维头像网格;
基于所述训练三维头像网格对所述训练视点头像图像进行图像展开处理,得到所述训练视点头像图像对应的第一训练纹理贴图;
基于初始建模网络中的初始纹理编码器对所述第一训练纹理贴图进行纹理编码处理,得到所述第一训练纹理贴图对应的训练纹理特征,在基于所述初始建模网络中的初始图像编码器获取到所述训练视点头像图像的训练图像特征时,将所述训练纹理特征与所述训练图像特征进行特征拼接处理,得到用于进行纹理解码的训练拼接特征,基于所述初始建模网络中的初始纹理解码器对所述训练拼接特征进行纹理解码处理,得到所述第一训练纹理贴图对应的第二训练纹理贴图;
基于所述训练三维头像网格和所述第二训练纹理贴图得到训练渲染图像;
获取所述第二训练纹理贴图对应的参考纹理贴图,并基于所述参考纹理贴图和所述第二训练纹理贴图、所述训练渲染图像和所述训练视点头像图像,对所述初始建模网络进行迭代训练,并将迭代训练后的初始建模网络作为所述目标建模网络。
3.根据权利要求2所述的方法,其特征在于,所述获取所述第二训练纹理贴图对应的参考纹理贴图,包括:
获取所述初始建模网络对应的网络训练策略,在所述网络训练策略为第一训练策略时,从所述训练视点头像图像中提取出所述训练视点头像图像的皮肤区域,并计算所述训练视点头像图像的皮肤区域的平均颜色;
基于所述训练视点头像图像确定所述训练虚拟对象的头部部位在所述三维场景下的训练三维头像网格,并基于所述训练三维头像网格对所述训练视点头像图像进行图像展开处理,得到所述训练视点头像图像对应的初始纹理贴图;
获取模板纹理贴图,将所述平均颜色添加至所述模板纹理贴图,并对所述初始纹理贴图和添加了平均颜色的模板纹理贴图进行混合处理,得到混合纹理贴图;
对所述混合纹理贴图进行图像优化处理,得到所述训练视点头像图像的优化纹理贴图,将所述优化纹理贴图作为所述第一训练策略对应的参考纹理贴图。
4.根据权利要求2所述的方法,其特征在于,所述获取所述第二训练纹理贴图对应的参考纹理贴图,包括:
获取所述初始建模网络对应的网络训练策略,在所述网络训练策略为第二训练策略时,将所述第一训练纹理贴图作为所述第二训练策略对应的参考纹理贴图。
5.根据权利要求2所述的方法,其特征在于,所述基于所述参考纹理贴图和所述第二训练纹理贴图、所述训练渲染图像和所述训练视点头像图像,对所述初始建模网络进行迭代训练,并将迭代训练后的初始建模网络作为所述目标建模网络,包括:
获取所述训练视点头像图像对应的皮肤区域掩码,基于所述皮肤区域掩码计算所述训练渲染图像和所述训练视点头像图像之间的图像距离,并基于所述图像距离确定第一参考信息;
计算所述参考纹理贴图和所述第二训练纹理贴图之间的纹理贴图距离,并基于所述纹理贴图距离确定第二参考信息;
基于所述第一参考信息和所述第二参考信息对所述初始建模网络进行迭代训练,并将迭代训练后的初始建模网络作为所述目标建模网络。
6.根据权利要求5所述的方法,其特征在于,所述基于所述第一参考信息和所述第二参考信息对所述初始建模网络进行迭代训练,并将迭代训练后的初始建模网络作为所述目标建模网络,包括:
将所述训练视点头像图像输入至第一判别器进行判别处理,得到用于指示所述训练视点头像图像为真实图像的第一概率,并将所述训练渲染图像输入至所述第一判别器进行判别处理,得到用于指示所述训练渲染图像为真实图像的第二概率;
基于所述第一概率和所述第二概率确定第三参考信息;
将所述参考纹理贴图输入至第二判别器进行判别处理,得到用于指示所述参考纹理贴图为真实纹理贴图的第三概率,并将所述第二训练纹理贴图输入至所述第二判别器进行判别处理,得到用于指示所述第二训练纹理贴图为真实纹理贴图的第四概率;
基于所述第三概率和所述第四概率确定第四参考信息;
基于所述第三参考信息和所述第四参考信息对所述第一判别器和所述第二判别器进行迭代训练,并基于所述第一参考信息、所述第二参考信息、所述第二概率和所述第四概率对所述初始建模网络进行迭代训练,得到所述目标建模网络。
7.根据权利要求1所述的方法,其特征在于,所述图像编码特征是基于目标建模网络中的目标图像编码器所确定的,所述纹理编码特征是基于所述目标建模网络中的目标纹理编码器所确定的,所述第二目标纹理贴图是基于所述目标建模网络中的目标纹理解码器所确定的;
所述基于所述目标三维头像网格和所述第二目标纹理贴图得到目标渲染头像图像,包括:
基于所述目标建模网络中的目标光照回归器对所述图像编码特征进行光照预测处理,得到目标预测光照系数;
在获取到与所述初始三维面部形状相关联的目标面部姿势系数时,对所述目标三维头像网格、所述目标面部姿势系数、所述目标预测光照系数以及所述第二目标纹理贴图进行可微分渲染处理,得到目标渲染头像图像。
8.根据权利要求1所述的方法,其特征在于,所述对所述第一目标纹理贴图进行纹理编码处理,得到所述第一目标纹理贴图对应的纹理编码特征,包括:
基于所述第一目标纹理贴图中每个像素的像素值,将所述第一目标纹理贴图转换到频域空间,得到所述第一目标纹理贴图对应的频域信息,并将所述第一目标纹理贴图对应的频域信息确定为所述第一目标纹理贴图对应的纹理编码特征。
9.根据权利要求1所述的方法,其特征在于,所述纹理图像拼接特征是频域空间下的特征;所述对所述纹理图像拼接特征进行纹理解码处理,得到所述第一目标纹理贴图对应的第二目标纹理贴图,包括:
获取用于进行纹理解码所需的解码带宽,基于所述解码带宽所指示的频率范围,在将所述纹理图像拼接特征从频域空间转换到颜色空间时,得到所述纹理图像拼接特征对应的颜色空间信息,并基于所述颜色空间信息确定所述第二目标纹理贴图。
10.根据权利要求1所述的方法,其特征在于,所述基于所述初始三维面部形状确定所述目标虚拟对象的头部部位在所述三维场景下的目标三维头像网格,包括:
基于所述初始三维面部形状确定初始三维面部网格,从所述初始三维面部网格中所包含的M个第一网格顶点中获取用于表征所述目标虚拟对象的头部部位的N个第一关键点;N为小于M的正整数;
获取模板网格,在所述模板网格中查找与所述N个第一关键点具有相同关键属性的N个第二关键点;一个第一关键点对应一个第二关键点;
将所述N个第一关键点和查找到的所述N个第二关键点,构成所述目标虚拟对象的头部部位的N个关键点对,在基于所述N个关键点对拟合得到与所述M个第一网格顶点相关联的偏移量函数时,基于所述偏移量函数确定所述初始三维面部网格中所包含的M个第一网格顶点对应的偏移量;
基于每个第一网格顶点对应的偏移量分别确定所述每个第一网格顶点对应的目标位置信息,将所述每个第一网格顶点对应的目标位置信息所指示的空间点确定为第二网格顶点,并基于M个第二网格顶点确定所述目标三维头像网格。
11.根据权利要求10所述的方法,其特征在于,所述偏移量函数用于指示对K个径向基函数进行加权求和,每个径向基函数关联有对应的函数权重;
所述在基于所述N个关键点对拟合得到与所述M个第一网格顶点相关联的偏移量函数时,基于所述偏移量函数确定所述初始三维面部网格中所包含的M个第一网格顶点对应的偏移量,包括:
在所述M个第一网格顶点中获取第i个第一网格顶点,确定所述第i个第一网格顶点的初始位置信息;i为小于或者等于M的正整数;
基于所述第i个第一网格顶点的初始位置信息和所述每个径向基函数,确定所述第i个第一网格顶点针对所述每个径向基函数的函数值;
基于所述第i个第一网格顶点针对所述每个径向基函数的函数值和所述每个径向基函数对应的函数权重进行加权求和处理,将加权求和处理后所得到的和值作为所述第i个第一网格顶点对应的偏移量。
12.根据权利要求10所述的方法,其特征在于,所述基于每个第一网格顶点对应的偏移量分别确定所述每个第一网格顶点对应的目标位置信息,包括:
在所述M个第一网格顶点中获取第i个第一网格顶点,确定所述第i个第一网格顶点的初始位置信息;i为小于或者等于M的正整数;
基于所述第i个第一网格顶点的初始位置信息与所述第i个第一网格顶点的对应的偏移量的和,确定所述每个第一网格顶点对应的目标位置信息。
13.根据权利要求10所述的方法,其特征在于,所述基于所述N个关键点对拟合得到与所述M个第一网格顶点相关联的偏移量函数,包括:
基于每个关键点对中的第一关键点和第二关键点之间的位置距离对所述初始三维面部网格和所述模板网格进行对齐处理,并在所述N个关键点对的位置距离的和最小化时,将所述每个关键点对中的第一关键点和第二关键点之间的位置距离确定为目标位置距离;
基于所述每个关键点对的目标位置距离进行插值计算,确定K个径向基函数以及每个径向基函数对应的函数权重,并基于所述K个径向基函数以及所述每个径向基函数对应的函数权重确定与所述M个第一网格顶点相关联的偏移量函数。
14.根据权利要求10所述的方法,其特征在于,所述初始三维面部网格中的所述M个第一网格顶点是基于所述目标视点头像图像的身份特征和第一主成分分析基、所述目标视点头像图像的表达特征和第二主成分分析基、以及平均面部形状生成的;所述身份特征用于指示所述目标虚拟对象的角色类型,所述表达特征用于指示所述目标视点头像图像对应的面部表情。
15.一种图像数据处理装置,其特征在于,所述装置包括:
网格生成模块,用于获取位于三维场景下的目标虚拟对象的头部部位对应的目标视点头像图像,在重构得到的所述目标视点头像图像的初始三维面部形状时,基于所述初始三维面部形状确定所述目标虚拟对象的头部部位在所述三维场景下的目标三维头像网格;
第一纹理生成模块,用于基于所述目标三维头像网格对所述目标视点头像图像进行图像展开处理,得到所述目标视点头像图像对应的第一目标纹理贴图;
第二纹理生成模块,用于对所述第一目标纹理贴图进行纹理编码处理,得到所述第一目标纹理贴图对应的纹理编码特征,在获取到所述目标视点头像图像的图像编码特征时,将所述纹理编码特征与所述图像编码特征进行特征拼接处理,得到用于进行纹理解码的纹理图像拼接特征,对所述纹理图像拼接特征进行纹理解码处理,得到所述第一目标纹理贴图对应的第二目标纹理贴图;所述第二目标纹理贴图的纹理质量优于所述第一目标纹理贴图的纹理质量;
渲染模块,用于基于所述目标三维头像网格和所述第二目标纹理贴图得到目标渲染头像图像,基于得到的目标渲染头像图像生成所述目标虚拟对象的头部部位在所述三维场景下的三维头部模型。
16.一种计算机设备,其特征在于,包括:处理器和存储器;
所述处理器与所述存储器相连,其中,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以使所述计算机设备执行权利要求1-14任一项所述的方法。
17.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,该计算机程序适于由处理器加载并执行,以使具有所述处理器的计算机设备执行权利要求1-14任一项所述的方法。
CN202310350889.5A 2023-04-04 2023-04-04 图像数据处理方法、装置、设备及介质 Active CN116109798B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310350889.5A CN116109798B (zh) 2023-04-04 2023-04-04 图像数据处理方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310350889.5A CN116109798B (zh) 2023-04-04 2023-04-04 图像数据处理方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN116109798A true CN116109798A (zh) 2023-05-12
CN116109798B CN116109798B (zh) 2023-06-09

Family

ID=86260042

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310350889.5A Active CN116109798B (zh) 2023-04-04 2023-04-04 图像数据处理方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN116109798B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116310046A (zh) * 2023-05-16 2023-06-23 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机及存储介质
CN116310659A (zh) * 2023-05-17 2023-06-23 中数元宇数字科技(上海)有限公司 训练数据集的生成方法及设备
CN116385619A (zh) * 2023-05-26 2023-07-04 腾讯科技(深圳)有限公司 对象模型渲染方法、装置、计算机设备和存储介质
CN116433852A (zh) * 2023-06-15 2023-07-14 腾讯科技(深圳)有限公司 数据处理方法、装置、设备及存储介质
CN116452703A (zh) * 2023-06-15 2023-07-18 深圳兔展智能科技有限公司 用户头像生成方法、装置、计算机设备及存储介质
CN116542846A (zh) * 2023-07-05 2023-08-04 深圳兔展智能科技有限公司 用户账号图标生成方法、装置、计算机设备及存储介质
CN116778065A (zh) * 2023-08-21 2023-09-19 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101131735A (zh) * 2006-08-21 2008-02-27 原相科技股份有限公司 点阵型图案的设计及其解码方法及其装置
KR20100090457A (ko) * 2009-02-06 2010-08-16 연세대학교 산학협력단 비강압적 3차원 얼굴 데이터 획득 시스템 및 그 방법
CN103153148A (zh) * 2010-10-11 2013-06-12 宝洁公司 用于目标表面的清洁头部
CN107705341A (zh) * 2016-08-08 2018-02-16 创奇思科研有限公司 用户表情头像生成的方法及其装置
CN108898650A (zh) * 2018-06-15 2018-11-27 Oppo广东移动通信有限公司 人形素材创建方法及相关装置
CN109816615A (zh) * 2019-03-06 2019-05-28 腾讯科技(深圳)有限公司 图像处理方法、装置、设备以及存储介质
CN111586408A (zh) * 2019-02-19 2020-08-25 诺基亚技术有限公司 用于跨通道残差编码和解码的量化参数得出
CN112669447A (zh) * 2020-12-30 2021-04-16 网易(杭州)网络有限公司 一种模型头像创建方法、装置、电子设备和存储介质
CN114600165A (zh) * 2019-09-17 2022-06-07 波士顿偏振测定公司 用于使用偏振提示表面建模的***和方法
CN115345980A (zh) * 2022-10-18 2022-11-15 北京百度网讯科技有限公司 个性化纹理贴图的生成方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101131735A (zh) * 2006-08-21 2008-02-27 原相科技股份有限公司 点阵型图案的设计及其解码方法及其装置
KR20100090457A (ko) * 2009-02-06 2010-08-16 연세대학교 산학협력단 비강압적 3차원 얼굴 데이터 획득 시스템 및 그 방법
CN103153148A (zh) * 2010-10-11 2013-06-12 宝洁公司 用于目标表面的清洁头部
CN107705341A (zh) * 2016-08-08 2018-02-16 创奇思科研有限公司 用户表情头像生成的方法及其装置
CN108898650A (zh) * 2018-06-15 2018-11-27 Oppo广东移动通信有限公司 人形素材创建方法及相关装置
CN111586408A (zh) * 2019-02-19 2020-08-25 诺基亚技术有限公司 用于跨通道残差编码和解码的量化参数得出
CN109816615A (zh) * 2019-03-06 2019-05-28 腾讯科技(深圳)有限公司 图像处理方法、装置、设备以及存储介质
CN114600165A (zh) * 2019-09-17 2022-06-07 波士顿偏振测定公司 用于使用偏振提示表面建模的***和方法
CN112669447A (zh) * 2020-12-30 2021-04-16 网易(杭州)网络有限公司 一种模型头像创建方法、装置、电子设备和存储介质
CN115345980A (zh) * 2022-10-18 2022-11-15 北京百度网讯科技有限公司 个性化纹理贴图的生成方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
冯静怡: "基于web的三维虚拟形象生成与控制方法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 5, pages 138 - 1331 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116310046A (zh) * 2023-05-16 2023-06-23 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机及存储介质
CN116310046B (zh) * 2023-05-16 2023-08-22 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机及存储介质
CN116310659B (zh) * 2023-05-17 2023-08-08 中数元宇数字科技(上海)有限公司 训练数据集的生成方法及设备
CN116310659A (zh) * 2023-05-17 2023-06-23 中数元宇数字科技(上海)有限公司 训练数据集的生成方法及设备
CN116385619A (zh) * 2023-05-26 2023-07-04 腾讯科技(深圳)有限公司 对象模型渲染方法、装置、计算机设备和存储介质
CN116385619B (zh) * 2023-05-26 2024-04-30 腾讯科技(深圳)有限公司 对象模型渲染方法、装置、计算机设备和存储介质
CN116433852A (zh) * 2023-06-15 2023-07-14 腾讯科技(深圳)有限公司 数据处理方法、装置、设备及存储介质
CN116433852B (zh) * 2023-06-15 2023-09-12 腾讯科技(深圳)有限公司 数据处理方法、装置、设备及存储介质
CN116452703B (zh) * 2023-06-15 2023-10-27 深圳兔展智能科技有限公司 用户头像生成方法、装置、计算机设备及存储介质
CN116452703A (zh) * 2023-06-15 2023-07-18 深圳兔展智能科技有限公司 用户头像生成方法、装置、计算机设备及存储介质
CN116542846A (zh) * 2023-07-05 2023-08-04 深圳兔展智能科技有限公司 用户账号图标生成方法、装置、计算机设备及存储介质
CN116542846B (zh) * 2023-07-05 2024-04-26 深圳兔展智能科技有限公司 用户账号图标生成方法、装置、计算机设备及存储介质
CN116778065A (zh) * 2023-08-21 2023-09-19 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机及存储介质
CN116778065B (zh) * 2023-08-21 2024-01-02 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机及存储介质

Also Published As

Publication number Publication date
CN116109798B (zh) 2023-06-09

Similar Documents

Publication Publication Date Title
CN116109798B (zh) 图像数据处理方法、装置、设备及介质
CN109255831B (zh) 基于多任务学习的单视图人脸三维重建及纹理生成的方法
CN109815893B (zh) 基于循环生成对抗网络的彩色人脸图像光照域归一化的方法
CN111488865B (zh) 图像优化方法、装置、计算机存储介质以及电子设备
CN113838176B (zh) 模型的训练方法、三维人脸图像生成方法及设备
WO2022205760A1 (zh) 三维人体重建方法、装置、设备及存储介质
CN111598998A (zh) 三维虚拟模型重建方法、装置、计算机设备和存储介质
CN110796593A (zh) 基于人工智能的图像处理方法、装置、介质及电子设备
CN112102480B (zh) 图像数据处理方法、装置、设备以及介质
CN112950769A (zh) 三维人体重建方法、装置、设备及存储介质
CN112581370A (zh) 人脸图像的超分辨率重建模型的训练及重建方法
WO2024103890A1 (zh) 模型构建方法、重建方法、装置、电子设备及非易失性可读存储介质
CN113808277A (zh) 一种图像处理方法及相关装置
CN115115805A (zh) 三维重建模型的训练方法、装置、设备及存储介质
CN115984447A (zh) 图像渲染方法、装置、设备和介质
CN117315211B (zh) 数字人合成及其模型训练方法、装置、设备及存储介质
CN116740261A (zh) 图像重建方法和装置、图像重建模型的训练方法和装置
CN116704084B (zh) 人脸动画生成网络的训练方法、人脸动画生成方法及装置
CN110751026B (zh) 视频处理方法及相关装置
WO2022252372A1 (zh) 一种图像处理方法、装置、设备及计算机可读存储介质
CN112785494B (zh) 一种三维模型构建方法、装置、电子设备和存储介质
CN114998514A (zh) 一种虚拟角色的生成方法及设备
WO2021197230A1 (zh) 三维头部模型的构建方法、装置、***及存储介质
CN116883524A (zh) 图像生成模型训练、图像生成方法、装置和计算机设备
CN117011449A (zh) 三维面部模型的重构方法和装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40086739

Country of ref document: HK