WO2024113290A1

WO2024113290A1 - 图像处理方法、装置、交互设备、电子设备和存储介质

Info

Publication number: WO2024113290A1
Application number: PCT/CN2022/135733
Authority: WO
Inventors: 马思研; 张�浩; 李鑫恺; 吕耀宇; 李言
Original assignee: 京东方科技集团股份有限公司
Priority date: 2022-12-01
Filing date: 2022-12-01
Publication date: 2024-06-06

Abstract

本公开提供了一种图像处理方法、装置、交互设备、电子设备、存储介质和计算机程序产品，涉及图像处理技术领域。该图像处理方法包括利用多个样本人脸图像，构建初始三维人脸模板；利用目标对象的人脸图像对初始三维人脸模板进行迭代优化，得到目标三维人脸模板；以及根据目标对象的当前时刻人脸图像与目标三维人脸模板的对应关系，确定目标对象的当前时刻人脸位姿。

Description

图像处理方法、装置、交互设备、电子设备和存储介质

技术领域

本公开涉及图像处理技术领域，尤其涉及一种图像处理方法、装置、交互设备、电子设备、存储介质和计算机程序产品。

背景技术

增强现实(Augmented Reality，AR)设备、虚拟现实(Virtual Reality，VR)设备和三维(three-dimensional，3D)屏交互设备通常需要实时获取用户的人脸相对位姿，根据人脸相对位姿调整显示效果从而为用户提供更逼真的体验效果。例如，裸眼3D屏可根据用户脸部、头部或瞳孔的实时位姿，调整屏幕内部光栅的开合情况，从而为用户呈现当前观看位姿下最好的裸眼3D观看效果。

目前，传统的位姿估计算法是基于刚体目标和固定模板进行位姿估计。但人脸图像为典型的非刚体目标，且每个人脸图像都存在个体差异。AR设备、VR设备或3D屏交互设备适用的用户范围广泛，因此传统的位姿估计算法难以针对不同用户获取准确的人脸位姿估计结果。

发明内容

本公开提供了一种显示面板的图像处理方法、装置、交互设备、电子设备、存储介质和计算机程序产品。

根据第一方面，本公开提供了一种图像处理方法，包括：利用多个样本人脸图像，构建初始三维人脸模板；利用目标对象的人脸图像对初始三维人脸模板进行迭代优化，得到目标三维人脸模板；以及根据目标对象的当前时刻人脸图像与目标三维人脸模板的对应关系，确定目标对象的当前时刻人脸位姿。

例如，述利用多个样本人脸图像，构建初始三维人脸模板，包括：分别从多个样本人脸图像的每个样本人脸图像中获取多个三维样本关键点；根据多个样本人脸图像的多个三维样本关键点，确定平均三维人脸模板；利用平均三维人脸模板，确定多个人脸样本图像的特征矩阵；以及根据迭代参数、平均三维人脸模板和特征矩阵，构建初始三维人脸模板。

例如，利用平均三维人脸模板，确定多个人脸样本图像的特征矩阵，包括：利用平均三维人脸模板，对多个样本人脸图像的多个三维样本关键点进行去中心化处理，得到协方差矩阵；计算协方差矩阵的多个特征值和与多个特征值对应的多个特征向量；根据多个特征值在协方差矩阵中对线性投影的贡献值，从多个特征向量中确定多个有效特征向量，多个有效特征向量对应的多个特征值的贡献值之和大于预设贡献值；以及根据多个有效特征向量，构建特征矩阵。

例如，利用目标对象的人脸图像对初始三维人脸模板进行迭代优化，得到目标三维人脸模板，包括：从目标对象的人脸图像中获取多个二维目标关键点；从初始三维人脸模板中确定多个三维关键点；将多个三维关键点投影为多个二维投影关键点；计算多个二维投影关键点与多个二维目标关键点的平均误差；以及根据平均误差，对初始三维人脸模板进行迭代优化，得到目标三维人脸模板。

例如，将多个三维关键点投影为多个二维投影关键点，包括：根据三维关键点的坐标值、缩放尺度、坐标系旋转矩阵和像素坐标系的中心点偏移向量，构建弱透视投影模型；以及通过弱透视投影模型，将多个三维关键点投影为多个二维投影关键点。

例如，弱透视投影模型包括根据以下公式来将多个三维关键点投影为多个二维投影关键点：

其中，x和y分别为二维投影关键点在像素坐标系的x轴和y轴的坐标值，X、Y和Z分别为三维关键点在目标对象所在坐标系的x轴、y轴和z轴的坐标值，为缩放尺度，

为目标对象所在坐标系相对于相机坐标系的旋转矩阵，t _x和t _y分别为像素坐标系原点相对于相机坐标系原点在x轴和y轴的偏移向量。

例如，根据平均误差，对初始三维人脸模板进行迭代优化，得到目标三维人脸模板，包括：根据弱透视投影模型和迭代参数，构建迭代模型；确定迭代模型与多个二维投影关键点之间的映射函数；计算映射函数的雅克比矩阵，得到迭代优化后的二维迭代关键点；根据二维迭代关键点和来自人脸图像的多个二维目标关键点，计算平均误差；在确定平均误差不满足收敛条件的情况下，沿着雅克比矩阵的下降梯度方向，对迭代模型的参数进行更新，得到更新后的迭代模型，并返回确定迭代模型与多个二维投影关键点之间的映射函数的操作；以及在确定平均误差满足收敛条件的情况下，确定迭代参数，并根据迭代参数构建目标三维人脸模板。

例如，映射函数包括以下公式：

其中，

为多个二维投影关键点的坐标值矩阵，

为迭代模型，scale为缩放尺度，R _x、R _y、R _z为目标对象所在坐标系相对于相机坐标系的旋转量，t _x和t _y分别为像素坐标系原点相对于相机坐标系原点在x轴和y轴的偏移向量，params为迭代参数。

例如，沿着雅克比矩阵的下降梯度方向，对迭代模型的参数进行更新，得到更新后的迭代模型包括：根据雅克比矩阵的下降梯度方向和平均误差，计算迭代模型的参数变化量；以及根据参数变化量，更新迭代模型的参数，得到更新后的迭代模型。

例如，根据参数变化量，更新迭代模型的参数，得到更新后的迭代模型包括根据以下公式更新迭代模型：

其中，

为更新后的迭代模型，

为更新前的迭代模型，delta为参数变化量。

例如，计算多个二维投影关键点与多个二维目标关键点的平均误差，包括：根据多个二维投影关键点和多个二维目标关键点，计算重投影误差；以及根据重投影误差，计算平均误差。

例如，根据重投影误差，计算平均误差包括根据以下公式计算平均误差：

其中，error为平均误差，proj _err为重投影误差，proj _err＝landmarks_2D-current_shape_2D，其中landmarks_2D为二维目标关键点的坐标值，current_shape_2D为二维投影关键点的坐标值。

例如，根据目标对象的当前时刻人脸图像与目标三维人脸模板的对应关系，确定目标对象的当前时刻人脸位姿包括：从目标三维人脸模板的多个三维关键点中确定目标对象的多个预设三维关键点，多个预设三维关键点处于目标坐标系，多个预设三维关键点与目标对象的当前人脸图像的多个指定二维关键点对应；根据来自相机的人脸图像所处的像素坐标系和目标坐标系之间的对应关系，确定相机坐标系与目标坐标系之间的变换矩阵；以及根据变换矩阵，将多个预设三维关键点转换成多个目标三维关键点，多个目标三维关键点处于相机坐标系；以及根据多个目标三维关键点，确定目标对象的当前时刻人脸位姿。

例如，根据人脸图像所处的像素坐标系和目标坐标系之间的对应关系，确定相机坐标系与目标坐标系之间的变换矩阵，包括根据以下公式确定变换矩阵：

其中，c为相机的尺度，x和y分别为二维投影关键点在像素坐标系的x轴和y轴的坐标值，X、Y和Z分别为预设三维关键点在目标坐标系的x轴、y轴和z轴的坐标值，K为相机内参矩阵，

为变换矩阵。

例如，从目标对象的人脸图像中获取多个二维目标关键点，包括：对人脸图像进行畸变校正，得到校正后人脸图像；利用关键点检测算法，从校正后人脸图像中确定多个二维目标关键点。

例如，对人脸图像进行畸变校正，得到校正后人脸图像，包括：

根据以下公式来对人脸图像进行畸变校正：

其中，x ₀和y ₀为人脸图像上的任意一坐标点在x轴和y轴的坐标值，x和y为校正后人脸图像上的任意一坐标点在x轴和y轴的坐标值，r为人脸图像的中心点与坐标点(x，y)的距离，k ₁、k ₂和k ₃为径向畸变系数，p ₁和p ₂为切向畸变系数。

根据第二方面，本公开提供了一种图像处理装置，包括：构建模块，用于利用多个样本人脸图像，构建初始三维人脸模板；迭代模块，用于利用目标对象的人脸图像对初始三维人脸模板进行迭代优化，得到目标三维人脸模板；以及确定模块，用于根据目标对象的当前时刻人脸图像与目标三维人脸模板的对应关系，确定目标对象的当前时刻人脸位姿。

根据第三方面，本公开提供了一种交互设备，包括：相机，用于获取目标对象的人脸图像；处理器，与相机电连接，用于：利用人脸图像对初始三维人脸模板进行迭代优化，得到目标三维人脸模板；利用目标三维人脸模板进行人脸位姿估计，得到目标对象的瞳孔坐标；以及根据瞳孔坐标，计算光栅开合序列；驱动电路，与处理器电连接，用于控制输出接口输出光栅开合序列；以及屏幕，与驱动电路电连接，用于根据光栅开合序列控制屏幕中光栅的开合。

根据第四方面，本公开提供了一种电子设备，包括：一个或多个处理器；存储器，用于存储一个或多个程序，其中，当一个或多个程序被一个或多个处理器执行时，使得一个或多个处理器实现本公开实施例所述的方法。

根据第五方面，本公开提供了一种计算机可读存储介质，其上存储有可执行指令，该指令被处理器执行时使处理器实现本公开实施例所述的方法。

根据第六方面，本公开提供了一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现本公开实施例所述的方法。

附图说明

图1示出了根据本公开实施例的图像处理方法的流程图；

图2A示出了根据本公开实施例的图像处理方法的应用场景图；

图2B示出了根据本公开实施例的图像处理方法的流程示意图；

图2C出了根据本公开实施例的人脸图像的关键点分布示意图；

图3示出了根据本公开实施例的构建初始三维人脸模板的流程图；

图4示出了根据本公开实施例的迭代初始三维人脸模板的流程图；

图5示出了根据本公开另一实施例的迭代初始三维人脸模板的流程图；

图6A示出了根据本公开实施例的确定目标对象的人脸位姿的流程图；

图6B示出了根据本公开实施例的目标坐标系到相机坐标系的变换示意图；

图7示出了根据本公开实施例的图像处理装置的结构框图；以及

图8示出了根据本公开实施例的适于实现图像处理方法的电子设备的方框图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整的描述。显然，所描述的实施例是本公开的一部分实施例，而不是全部。基于所描述的本公开实施例，本领域普通技术人员在无需创造性劳动的前提下获得的所有其他实施例都属于本公开保护的范围。应注意，贯穿附图，相同的元素由相同或相近的附图标记来表示。在以下描述中，一些具体实施例仅用于描述目的，而不应该理解为对本公开有任何限制，而只是本公开实施例的示例。在可能导致对本公开的理解造成混淆时，将省略常规结构或配置。应注意，图中各部件的形状和尺寸不反映真实大小和比例，而仅示意本公开实施例的内容。

除非另外定义，本公开实施例使用的技术术语或科学术语应当是本领域技术人员所理解的通常意义。本公开实施例中使用的“第一”、“第二”以及类似词语并不表示任何顺序、数量或重要性，而只是用于区分不同的组成部分。

在本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供、公开和应用等处理，均符合相关法律法规的规定，采取了必要保密措施，且不违背公序良俗。

在本公开的技术方案中，在获取或采集用户个人信息之前，均获取了用户的授权或同意。

下面，将参照附图详细描述根据本公开的各个实施例。需要注意的是，在附图中，将相同的附图标记赋予基本上具有相同或类似结构和功能的组成部分，并且将省略关于它们的重复描述。

图1示出了根据本公开实施例的图像处理方法的流程图。

如图1所示，根据本公开实施例的图像处理方法可以包括以下步骤S110～步骤S130。应注意，以下方法中各个步骤的序号仅作为该步骤的表示以便描述，而不应被看作表示该各个步骤的执行顺序。除非明确指出，否则该方法不需要完全按照所示顺序来执行。

在步骤S110，利用多个样本人脸图像，构建初始三维人脸模板。

例如，多个样本人脸图像可以为预先采集到的多个用户的人脸图像。例如，多个样本人脸图像可以来源于开源的大规模人脸对齐3D(Large Scale 3D Faces in-the-Wild，LS3D-W)数据集。多个样本人脸图像包括二维人脸图像和三维人脸图像。从多个样本人脸图像中可以获取位于样本人脸图像上的二维坐标点和三维坐标点。

在本公开实施例中，根据来自多个样本人脸数据的多个二维坐标点和三维坐标点，可以构建初始三维人脸模板。初始三维人脸模板可以为通用的三维人脸模板，用于表征人脸图像的平均特征。

在步骤S120，利用目标对象的人脸图像对初始三维人脸模板进行迭代优化，得到目标三维人脸模板。

例如，目标对象为适用头戴式显示设备(例如，AR或VR)或3D屏交互设备的用户。在头戴式显示设备或3D屏交互设备上设有相机。在获取用户同意或授权的情况下，头戴式显示设备或3D屏交互设备通过相机捕获用户的人脸图像。例如，相机可以为深度传感器(深度相机)、双目相机、单目相机和激光雷达等等。

例如，通过单目相机捕获用户的人脸图像，人脸图像为二维人脸图像。二维人脸图像描述了属于该用户的人脸特征。利用来自该二维人脸图像的人脸特征对初始三维人脸模板进行迭代优化，可以得到能够表征该用户人脸特征的目标三维人脸模板。

在步骤S130，根据目标对象的当前时刻人脸图像与目标三维人脸模板的对应关系，确定目标对象的当前时刻人脸位姿。

例如，目标对象的当前时刻人脸图像为可以为当前时刻相机拍摄的二维人脸图像。根据二维人脸图像与目标三维人脸模板中相同部分的对应关系，对目标对象的当前人脸位置进行估计。例如，根据目标对象的当前人脸图像中关于目标对象瞳孔部分的图像信息，在目标三维人脸模板中，对相应的瞳孔部分的位姿进行估计。

目标三维人脸模板确定的人脸位姿为用户所处的目标坐标系中的人脸位姿。头戴式显示设备或3D屏交互设备利用目标人脸模板对该用户进行人脸位姿估计，确定在相机所处的相机坐标系内人脸位姿。

例如，头戴式显示设备或3D屏交互设备可以根据相机坐标系内的人脸位姿数据确定用户当前的人脸位姿情况，例如面部朝向和面部表情的信息，并基于用户当前的人脸位姿情况为用户提供互动服务。

例如，头戴式显示设备或3D屏交互设备可以通过位姿估计算法，利用目标人脸模板进行人脸位姿估计。例如，位姿估计算法包括基于点云的3D目标检测、基于点云的模板匹配和基于单张图像的透视N点投影(Perspective-n-Points，PNP)位姿估计算法等。

例如，在相机坐标系内的人脸位姿中，确定人脸中瞳孔的实时位姿。3D屏交互设备可以瞳孔的实时位姿调整屏幕内部光栅的开合情况，为用户呈现当前观看位姿下最好的裸眼3D观看效果。

根据本公开实施例，利用用户的实时人脸图像，对初始为维人脸模板进行迭代优化，得到能够表征用户当前人脸位姿特征的目标三维人脸模板。通过目标三维人脸模板，可以准确地确定用户当前的人脸位姿，减小人脸位姿误差，从而为用户提供更好的3D视觉效果。

图2A示出了根据本公开实施例的图像处理方法的应用场景图。图2B示出了根据本公开实施例的图像处理方法的流程示意图。图2C出了根据本公开实施例的人脸图像的关键点分布示意图。

如图2A所示，用户210在观看3D屏交互设备220时，安装在3D屏交互设备220上的相机230捕获用户210的人脸图像。相机230捕获的人脸图像为二维人脸图像。相机230将二维人脸图像发送到3D屏交互设备230，由3D屏交互设备220根据二维人脸图像对初始三维人脸模型进行迭代优化，得到与用户210对应的目标三维人脸模板。3D屏交互设备220利用目标三维人脸模板对用户210进行人脸位姿估计，得到相机坐标系内的三维人脸位姿，并根据三维人脸位姿为用户210提供3D视觉服务。

结合图2B，图2B示出了例如3D屏交互设备220进行图像处理的示意图。

如图2B所示，3D屏交互设备220从相机210获取用户的二维人脸图像，由3D屏交互设备220的主板对二维人脸图像进行处理，得到相机坐标系内的三维人脸位姿。由基于相机坐标系内的三维人脸位姿向屏幕光栅出控制信号，控制屏幕光栅的开合情况。

例如，主板可以包括无线接入(Access Point，AP)主板。在主板中由处理器CPU执行处理操作。

例如，CPU对来自相机的二维人脸图像进行格式转换，由NV21格式图像转换为Mat格式图像。CPU对Mat格式图像进行畸变矫正，得到校正后人脸图像，再利用关键点检测算法，从校正后人脸图像中确定多个二维目标关键点。

由于位姿估计算法的解算原理建立在理想相机模型。在不存在畸变的相机模型下，进行位姿估计。通常相机会由于透镜不完全平行于图像屏幕产生的切向畸变，以及由于光线弯曲产生的径向畸变。

本公开提供一种图像畸变矫正的方法。

例如，根据以下式(1)来对人脸图像进行畸变校正：

x ₀和y ₀为校正前人脸图像上的任意一坐标点在像素坐标系的x轴和y轴的坐标值。x和y为校正后人脸图像上的任意一坐标点在像素坐标系的x轴和y轴的坐标值。像素坐标系为相机拍摄的二维人脸图像所处的坐标系。

r为人脸图像的中心点与坐标点(x，y)的距离，r ²＝x ²+y ²。人脸图像上距离中心点越远处的点畸变越大。

k ₁、k ₂和k ₃为径向畸变系数，p ₁和p ₂为切向畸变系数。例如，k ₁、k ₂、k ₃、p ₁和p ₂为相机的固定参数。本领域技术人员，可以根据本领域任何方式获取相机的固定参数。

在确定二维目标关键点时，CPU需要先对Mat格式图像进行人脸检测，以确定Mat格式图像中的人脸区域，再通过人脸关键点检测算法对人脸区域的图像进行关键点检测，得到多个二维目标关键点。

二维目标关键点的数量可以为5个关键点、21关键点、49关键点或68关键点。根据实际的检测需求，还可以选择其他数量的关键点，例如上万个关键点。例如，关键点分布在双眼、鼻尖、左右嘴角和眉毛等区域。多个关键点需要分布在多个平面内，使关键点可以更准确地描述人脸特征。

例如，更多的关键点可以提高位姿估计求解的结果的准确性，但也会增加检测和求解耗时。在本公开实施例中，采用68个人脸关键点，可以同时确保算法的实时性要求和精度要求。68个人脸关键点分布和顺序如图2C所示。

例如，人脸检测算法与关键点检测算法可以包括采用OpenCV库中的CascadeClassifier类和Facemark类实现。CascadeClassifier可以基于Haar、LBP和HOG等特征的级联分类器进行关键点检测。Facemark可以基于局部二值特征LBF和级联的随机森林全局线性回归进行关键点检测。人脸检测算法和关键点检测算法模块还可根据实际需求采用其他算法替换(更快或检测精度更高的算法)，本公开对人脸检测算法和关键点检测算法不做限定。

由于不同的人类个体(不同种族、年龄、性别等)的三维人脸关键点坐标存在明显差异，并且人脸为典型的非刚体目标，人脸关键点在目标坐标系下的三维坐标随时存在变化。因此在获得68个二维目标关键点后，CPU对在对初始三维人脸模板进行迭代优化，得到最优的目标三维人脸模板。目标三维人脸模板与用户当前的人脸特征的匹配效果最佳。

CPU可以根据目标三维人脸模板和PNP位姿估计算法对用户进行人脸位姿估计，得到人脸图像在相机坐标系下的三维人脸位姿，并根据相机坐标系下的位姿计算用户左右瞳孔的坐标。例如，三维人脸位姿可以由与68个二维目标关键点对应的68个三维关键点描述。

例如，如图2C所示，68个人脸关键点中不包含双眼瞳孔中心的位置。CPU计算人脸左眼眼周6个关键点(关键点36～41)的3D坐标的形心(均值)来确定用户左眼瞳孔在相机坐标系下的3D坐标P _l。CPU计算人脸右眼眼周6个关键点(关键点42～47)的3D坐标的形心来确定用户右眼瞳孔在相机坐标系下的坐标P _r。根据瞳孔坐标P _l、P _r和屏幕上的光栅排布计算出此时为用户呈现最佳裸眼3D效果的光栅开合序列。光栅开合序列可以包括一串由0和1组成的序列，0代表对应光栅关闭，1代表对应光栅打开。CPU将光栅开合序列传递给主板的整机驱动，由整机驱动控制主板的输出接口对应输出高低电平，控制屏幕中的光栅开合。例如输出接口可以为通用输入输出(General-purpose input/output，GPIO)接口。

图3示出了根据本公开实施例的构建初始三维人脸模板的流程图。

如图3所示，步骤S110利用多个样本人脸图像，构建初始三维人脸模板可以包括以下步骤S310～步骤S340。

在步骤S310，分别从多个样本人脸图像的每个样本人脸图像中获取多个三维样本关键点。

在步骤S320，根据多个样本人脸图像的多个三维样本关键点，确定平均三维人脸模板。

在步骤S330，利用平均三维人脸模板，确定多个人脸样本图像的特征矩阵。

在步骤S340，根据迭代参数、平均三维人脸模板和特征矩阵，构建初始三维人脸模板。

在本公开实施例中，可以将LS3D-W数据集作为平均人脸模型的数据来源，获取多个样本人脸图像。从每个样本人脸图像中分别获取68个三维样本关键点。需要说明的是，来自每个样本人脸图像的68个三维样本关键点的分布情况为相同的。例如，来自每个样本人脸图像的68个三维样本关键点中，人脸左眼眼周包括6个关键点(关键点36～41)，人脸右眼眼周包括6个关键点(关键点42～47)。

每个关键点包括该关键点位于目标坐标系的三个坐标值(X、Y和Z)。计算位于同一人脸图像位置的所有关键点的平均值，确定平均三维人脸模板mean_shape。平均三维人脸模板mean_shape包括68个平均关键点的三个坐标值，坐标单位可以为mm。

三维人脸模板mean_shape可以为一个维度为204*1的列向量[X0，X1，...，X67，Y0，Y1，...，Y67，Z0，Z1，...，Z67] ^T。其中X0、Y0和Z0分别为第一个平均关键点的坐标值。

在本公开实施例中，利用平均三维人脸模板，确定多个人脸样本图像的特征矩阵，包括：利用平均三维人脸模板，对多个样本人脸图像的多个三维样本关键点进行去中心化处理，得到协方差矩阵；计算协方差矩阵的多个特征值和与多个特征值对应的多个特征向量；根据多个特征值在协方差矩阵中线性投影的贡献值，从多个特征向量中确定多个有效特征向量，多个有效特征向量对应的多个特征值的贡献值之和大于预设贡献值；以及根据多个有效特征向量，构建特征矩阵。

例如，利用主成分分析算法(Principal component analysis algorithm，PCA)对LS3D-W数据集中的人脸关键点数据进行分析，以降低关键点数据的线性维度。例如通过线性投影，将高维的数据映射到低维的空间中，以此实现使用较少的数据维度，保留较多的原始数据点特性。

例如，对每个样本人脸图像的68个关键点与平均三维人脸模板mean_shape的68个平均关键点做差值计算，实现去中心化处理(去均值)。由去中心化后的每个样本人脸图像的68个关键点构建一个协方差矩阵，并求解该协方差矩阵的多个特征值和与特征值对应的特征向量。

协方差矩阵的每个特征值表示对线性投影的贡献值。从多个特征值中选择有效特征值。例如，根据特征值的大小顺序，计算数值位于前N个的特征值之和。在确定前N个特征值之和占全部特征值之和的比例大于等于99％的情况下，选择该N个特征值为有效特征值。预设贡献值可以为99％。本领域计数人员还可以根据实际的需求，设置其他贡献值。本公开对此不做限定。此时，记N＝num，选择前num个特征值为有效特征值，N为正整数。num表示三维人脸图像的204维特征的最小特征维度。由前num个特征值对应的特征向量为有效特征向量，num个有效特征向量组成特征矩阵pv，特征矩阵的维度为204*num。

在本公开实施例中，初始三维人脸模板current_shape_3D可以由式(2)表示：

current_shape_3D＝mean_shape+pv·params

params为迭代参数，通过迭代参数params表示不同时刻下，人脸图像的变化特征。

初始三维人脸模板current_shape_3D的维度为204*1。迭代参数params的维度为num*1。

图4示出了根据本公开实施例的迭代初始三维人脸模板的流程图。

如图4所示，步骤S120利用目标对象的人脸图像对初始三维人脸模板进行迭代优化，得到目标三维人脸模板可以包括以下步骤S410～步骤S440。

在步骤S410，从目标对象的人脸图像中获取多个二维目标关键点。

在步骤S420，从初始三维人脸模板中确定多个三维关键点。

在步骤S430，将多个三维关键点投影为多个二维投影关键点。

在步骤S440，计算多个二维投影关键点与多个二维目标关键点的平均误差。

在步骤S450，根据平均误差，对初始三维人脸模板进行迭代优化，得到目标三维人脸模板。

在本公开实施例中，二维目标关键点可以为从进行畸变校正后的人脸图像中获得。例如，从畸变校正后的人脸图像中获取68个二维目标关键点。从初始三维人脸模板中确定的多个三维关键点可以为未知的关键点。例如，三维关键点的坐标值可以为关于迭代参数params的函数(X，Y，Z)。

例如，来自初始三维人脸模板的多个三维关键点可以由式(3)表示：

current_shape_3D＝[X0 X1 ... X67 Y0 Y1 ... Y67 Z0 Z1 ... Z67] (3)

对式(3)进行变化得到维度为3*68的矩阵，由式(4)表示：

在本公开实施例中，将多个三维关键点投影为多个二维投影关键点，可以包括根据三维关键点的坐标值、缩放尺度、坐标系旋转矩阵和像素坐标系的中心点偏移向量，构建弱透视投影模型params global；以及通过弱透视投影模型，将多个三维关键点投影为多个二维投影关键点。

例如，弱透视投影模型可以由式(5)表示：

params_global＝[scale R _x R _y R _z t _x t _y] (5)

scale为缩放尺度，R _x为目标坐标系的x轴相对于相机坐标系的x轴的旋转量，R _y为目标坐标系的y轴相对于相机坐标系的y轴的旋转量，R _z为目标坐标系的z轴相对于相机坐标系的z轴的旋转量，t _x和t _y分别为像素坐标系原点相对于相机坐标系原点在x轴和y轴的偏移向量。

例如，像素坐标系的原点可以位于二维人脸图像的左上角，相机坐标系的原点位于相机光轴的中心。因此位于相机光轴上的坐标点，例如坐标点(0，0)在像素坐标系上的像素坐标为(t _x，t _y)。

在本公开实施例中，将来自初始三维人脸模板的多个三维关键点投影为多个二维投影关键点可以由式(6)表示：

例如，x和y分别为二维投影关键点在像素坐标系的x轴和y轴的坐标值。X、Y和Z分别为三维关键点在目标坐标系的x轴、y轴和z轴的坐标值。例如X、Y和Z可以为初始三维人脸模板的68个平均关键点的坐标值。

为目标坐标系相对于相机坐标系的旋转矩阵。

将式(4)代入式(6)，得到式(7)：

式(7)表示将来自初始三维人脸模板current_shape_3D的三维关键点投影至像素坐标系平面上，得到二维投影关键点矩阵current_shape_2D，二维投影关键点矩阵current_shape_2D维度为2*68。由于来自初始三维人脸模板current_shape_3D为关于迭代参数params的函数(X，Y，Z)，此时二维投影关键点矩阵current_shape_2D中的二维投影关键点也为关于迭代参数params的函数(x，y)。

例如，二维投影关键点矩阵current_shape_2D可以由式(8)表示：

例如，从畸变校正后的人脸图像中获取68个二维目标关键点构成的二维目标关键点矩阵landmarks_2D可以由式(9)表示：

在本公开实施例中，计算多个二维投影关键点与多个二维目标关键点的平均误差，包括根据多个二维投影关键点和来多个二维目标关键点，计算重投影误差；以及根据重投影误差，计算平均误差。

根据二维投影关键点矩阵current_shape_2D和二维目标关键点矩阵landmarks_2D计算多个二维投影关键点与多个二维目标关键点的重投影误差proj _err，可以由式(10)表示：

根据重投影误差proj _err，计算平均误差error由式(11)表示：

Error_X _i表示第i个二维投影关键点与第i个二维目标关键点矩阵在x轴的坐标值的重投影误差，Error_Y _i表示第i个二维投影关键点与第i个二维目标关键点矩阵在y轴的坐标值的重投影误差。此时，平均误差error为关于迭代参数params的函数。

在本公开实施例中，目标三维人脸模板的准确性可以由重投影误差衡量，而重投影误差与迭代参数params和弱透视投影模型params global的参数相关。通过不断的迭代优化，使error达到收敛条件时，迭代参数params为最优迭代参数，此时的目标三维人脸模板current_shape_3D为最优目标三维人脸模板。

图5示出了根据本公开另一实施例的迭代初始三维人脸模板的流程图。

如图5所示，步骤S450根据平均误差，对初始三维人脸模板进行迭代优化，得到目标三维人脸模板可以包括以下步骤S551～步骤S556。

在步骤S551，根据弱透视投影模型和迭代参数，构建迭代模型。

在步骤S552，确定迭代模型与多个二维投影关键点之间的映射函数。

在步骤S553，计算映射函数的雅克比矩阵，得到迭代优化后的二维迭代关键点。

在步骤S554，根据二维迭代关键点和来自人脸图像的多个二维目标关键点，计算平均误差。

在步骤S555，在确定平均误差不满足收敛条件的情况下，沿着雅克比矩阵的下降梯度方向，对迭代模型的参数进行更新，得到更新后的迭代模型，并返回步骤S552的操作。

在步骤S556，在确定平均误差满足收敛条件的情况下，确定迭代参数，并根据迭代参数构建目标三维人脸模板。

在本公开实施例中，映射函数可以由式(12)表示：

为关于弱透视投影模型和迭代参数的迭代模型。

为二维投影关键点的坐标值矩阵。current_shape_2D_x为68个二维投影关键点的x轴坐标值矩阵，current_shape_2D_y为68个二维投影关键点的y轴坐标值矩阵。

例如，

例如，通过雅克比矩阵J(Jacobi Matrix)对迭代模型进行迭代优化。在优化后的迭代模型中可以确定迭代优化后的二维迭代关键点。

例如，迭代模型的雅克比矩阵J的维度为136*(num+6)，对式(7)的等式右侧中的弱透视投影模型参数scale、R _x、R _y、R _z、t _x和t _y分别求偏导，以及对式(12)的等式右侧中的弱透视投影模型参数params求偏导，得到雅克比矩阵J。

雅克比矩阵J可以由式(13)～式(20)表示：

式(13)和式(14)构成雅克比矩阵J的第1列，式(15)和式(16)构成雅克比矩阵J的第2～4列，式(17)和式(18)构成雅克比矩阵J的第5和第6列，式(19)和式(20)构成雅克比矩阵J的第7～num+6列。

在式(19)和式(20)中，pv_X为特征矩阵pv的第1～68行，pv_Y为特征矩阵pv的第69～138行，pv_Z为特征矩阵pv的第139～204行，pv_X、pv_Y和pv_Z的维度都是68*num。

例如，在对迭代模型进行第一次迭代时，可以为弱透视投影模型参数设置初始值。例如R _x＝0，R _y＝0，R _z＝0。scale为平均三维人脸模板的尺寸和人脸检测算法模块中检测到的人脸区域的比值。t _x和t _y由二维人脸图像的平面上人脸区域的中心坐标决定，t _x和t _y初始值可以均为0。

计算每一次迭代优化后的重投影误差proj _err，可以根据每一次迭代优化后的重投影误差proj _err更新迭代模型。更新迭代模型包括：根据雅克比矩阵的下降梯度方向和平均误差，计算迭代模型的参数变化量；以及根据参数变化量，更新迭代模型的参数，得到更新后的迭代模型。

例如，在平均误差不满足收敛条件的情况下，根据梯度下降原理，确定雅克比矩阵J的移动方向(下降梯度方向)，并计算迭代模型的参数变化量。根据参数变化量更新迭代模型，并重新确定迭代模型与二维投影关键点的映射函数。

例如，计算迭代模型的参数变化量delta可以由式(21)表示：

delta＝0.75·J ^T·proj _err (21)

例如，更新迭代模型可以由式(22)表示：

其中，

为更新后的迭代模型，

为更新前的迭代模型。

例如，在计算每一次迭代优化后的重投影误差proj _err，根据重投影误差proj _err计算平均误差error。在确定平均误差error几乎不再发生变化的情况下，认为平均误差error收敛。

例如，在完成迭代优化后的平均投影误差current_error与完成上一次迭代优化后的平均投影误差last_error满足式(23)时，认为平均误差error收敛：

current_error＞0.999·last_error (23)

在确定平均误差满足收敛条件的情况下，确定迭代参数params’，并根据迭代参数params’构建目标三维人脸模板。目标三维人脸模板可以为current_shape_3D＝mean_shape+pv·params’。

图6A示出了根据本公开实施例的确定目标对象的人脸位姿的流程图。图6B示出了根据本公开实施例的目标坐标系到相机坐标系的变换示意图。

如图6A所示，步骤S130根据目标对象的当前时刻人脸图像与目标三维人脸模板的对应关系，确定目标对象的当前时刻人脸位姿可以包括以下步骤S610～步骤S640。

在步骤S610，从目标三维人脸模板的多个三维关键点中确定目标对象的多个预设三维关键点。

在步骤S620，根据来自相机的人脸图像所处的像素坐标系和目标坐标系之间的对应关系，确定相机坐标系与目标坐标系之间的变换矩阵。

在步骤S630，根据变换矩阵，将多个预设三维关键点转换成多个目标三维关键点，多个目标三维关键点处于相机坐标系。

在步骤S640，根据多个目标三维关键点，确定目标对象的当前时刻人脸位姿。

例如，多个预设三维关键点与目标对象的当前人脸图像的多个指定二维关键点对应。当前人脸图像的多个指定二维关键点可以位于需要进行人脸位姿估计的指定人脸区域。例如，多个指定二维关键点位于用户的眼周区域。根据位于眼周的多个指定二维关键点，在目标三维人脸模板的相应区域中，确定位于用户眼周的多个预设三维关键点。通过位于用户眼周的多个预设关键点确定用户瞳孔的位置。多个预设三维关键点处于目标坐标系。

通过PNP位姿估计算法可以将像素坐标系下的二维坐标与目标坐标系下的三维坐标一一对应，从而求解出目标坐标系W变换到相机坐标系C的变换矩阵

如图6B所示，通过变换矩阵将目标坐标系W的坐标原点OW变换为相机坐标系的坐标原点O _C，通过变换矩阵将目标坐标系W的坐标点P _i变换为相机坐标系的坐标原点p _i。

例如，相机坐标系与目标坐标系之间的变换矩阵可由式(24)确定：

其中，c为相机的尺度，x和y分别为二维投影关键点在像素坐标系的x轴和y轴的坐标值，X、Y和Z分别为预设三维关键点在目标坐标系的x轴、y轴和z轴的坐标值，K为相机内参矩阵。

根据变换矩阵的特性可以得知，变换矩阵包括3个轴(x轴、y轴和z轴)的旋转角度R _t和沿3个轴方向的平移量t。由于二维关键点包括68个关键点，因此可以68个关键点构建包括2*68＝136个方程的超定方程组。通过136个方程求解3个轴(x轴、y轴和z轴)的旋转角度R _t和沿3个轴方向的平移量t。

例如，通过公式x＝(A ^T·A) ^-1·A ^T·b包括136个方程的超定方程组。其中，

对超定方程组求解最小二乘解，以防止个别关键点检测错误或误差过大使得最终人脸的位置估计结果产生偏差。

本公开还提供了一种验证本公开目标三维人脸模板准确性的验证方法。

例如，在3D屏交互设备上固定安装深度传感器，通过matlab的Stereo Camera Calibrator工具箱或OpenCV库的stereoCalibrate函数等工具标定出深度传感器与3D屏交互设备的普通单目相机之间的变换矩阵T。

假设某时刻下，用户瞳孔在3D屏交互设备的相机坐标系中的3D坐标为[x，y，z] ^T，转置在深度传感器坐标系下的坐标为[x′，y′，z′] ^T。两者的变换关系为：

将深度传感器获取得到的瞳孔3D坐标作为真值，将根据本公开实施例确定的目标三维人脸模板确定的瞳孔3D坐标通过矩阵T转换为深度传感器坐标系下的3D坐标，并将转换后的3D坐标与真值对比，从而对本公开实施例确定的目标三维人脸模板的准确性进行验证。

验证结果表示，本公开实施例确定的目标三维人脸模板在不同观看距离上获取到的瞳孔3D坐标在x、y和z方向上误差均较小，且误差较为稳定。

误差可能由于深度传感器和相机之间变换矩阵的标定误差或人脸关键点检测误差引入。由于本公开实施例确定的目标三维人脸模板的误差较为稳定，可在实际使用过程中，通过增加固定偏置弥补误差。本公开实施例确定的目标三维人脸模板的准确性和稳定性都较为可靠，具有实用价值。

基于上述图像处理方法，本公开还提供了一种图像处理装置。以下将结合图7对该装置进行详细描述。

图7示出了根据本公开实施例的图像处理装置的结构框图。

如图7所示，该实施例的图像处理装置700包括构建模块710、迭代模块720和确定模块730。

构建模块710用于利用多个样本人脸图像，构建初始三维人脸模板。在一实施例中，构建模块710可以用于执行前文描述的操作S110，在此不再赘述。

迭代模块720用于利用目标对象的人脸图像对初始三维人脸模板进行迭代优化，得到目标三维人脸模板。在一实施例中，迭代模块720可以用于执行前文描述的操作S120，在此不再赘述。

确定模块730用于根据目标对象的当前时刻人脸图像与目标三维人脸模板的对应关系，确定目标对象的当前时刻人脸位姿。在一实施例中，确定模块730可以用于执行前文描述的操作S130，在此不再赘述。

根据本公开的实施例，构建模块710、迭代模块720和确定模块730中的任意多个模块可以合并在一个模块中实现，或者其中的任意一个模块可以被拆分成多个模块。或者，这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合，并在一个模块中实现。根据本公开的实施例，构建模块710、迭代模块720和确定模块730中的至少一个可以至少被部分地实现为硬件电路，例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC)，或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现，或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者，构建模块710、迭代模块720和确定模块730中的至少一个可以至少被部分地实现为计算机程序模块，当该计算机程序模块被运行时，可以执行相应的功能。

本公开还提供了一种交互设备，包括相机、处理器、驱动电路、输入/输出接口和屏幕。相机、处理器、驱动电路、输入/输出接口和屏幕依次电连接。

相机获取目标对象的人脸图像，并将人脸图像发送给处理器。

处理器利用人脸图像对初始三维人脸模板进行迭代优化，得到目标三维人脸模板。处理器再利用目标三维人脸模板进行人脸位姿估计，得到目标对象的瞳孔坐标。处理器可以根据瞳孔坐标，计算光栅开合序列。

驱动电路接收来自处理器的光栅开合序列，并控制输出接口输出光栅开合序列。

屏幕上设置由光栅阵列。屏幕根据光栅开合序列控制光栅阵列中光栅的开合。

在本公开实施例中，交互设备与本公开图2B所示的3D屏交互设备220类似。为了简明，本公开在此处不再赘述。

如图8示，根据本公开实施例的电子设备800包括处理器801，其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。处理器801例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如，专用集成电路(ASIC))等等。处理器801还可以包括用于缓存用途的板载存储器。处理器801可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。

在RAM 803中，存储有电子设备800操作所需的各种程序和数据。处理器801、ROM 802以及RAM 803通过总线804彼此相连。处理器801通过执行ROM 802和/或RAM 803中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意，所述程序也可以存储在除ROM 802和RAM 803以外的一个或多个存储器中。处理器801也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。

根据本公开的实施例，电子设备800还可以包括输入/输出(I/O)接口805，输入/输出(I/O)接口805也连接至总线804。电子设备800还可以包括连接至I/O接口805的以下部件中的一项或多项：包括键盘、鼠标等的输入部分806；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807；包括硬盘等的存储部分808；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器810上，以便于从其上读出的计算机程序根据需要被安装入存储部分808。

本公开还提供了一种计算机可读存储介质，该计算机可读存储介质可以是上述实施例中描述的设备/装置/***中所包含的；也可以是单独存在，而未装配入该设备/装置/***中。上述计算机可读存储介质承载有一个或者多个程序，当上述一个或者多个程序被执行时，实现根据本公开实施例的方法。

根据本公开的实施例，计算机可读存储介质可以是非易失性的计算机可读存储介质，例如可以包括但不限于：便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。例如，根据本公开的实施例，计算机可读存储介质可以包括上文描述的ROM 802和/或RAM 803和/或ROM 802和RAM 803以外的一个或多个存储器。

本公开的实施例还包括一种计算机程序产品，其包括计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机***中运行时，该程序代码用于使计算机***实现本公开实施例所提供的图像处理方法。

在该计算机程序被处理器801执行时执行本公开实施例的***/装置中限定的上述功能。根据本公开的实施例，上文描述的***、装置、模块、单元等可以通过计算机程序模块来实现。

在一种实施例中，该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中，该计算机程序也可以在网络介质上以信号的形式进行传输、分发，并通过通信部分809被下载和安装，和/或从可拆卸介质811被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输，包括但不限于：无线、有线等等，或者上述的任意合适的组合。

在这样的实施例中，该计算机程序可以通过通信部分809从网络上被下载和安装，和/或从可拆卸介质811被安装。在该计算机程序被处理器801执行时，执行本公开实施例的***中限定的上述功能。根据本公开的实施例，上文描述的***、设备、装置、模块、单元等可以通过计算机程序模块来实现。

根据本公开的实施例，可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码，具体地，可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java，C++，python，“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块子电路、程序段、或代码的一部分，上述子电路、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

本领域技术人员可以理解，本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合，即使这样的组合或结合没有明确记载于本公开中。特别地，在不脱离本公开精神和教导的情况下，本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。

以上对本公开的实施例进行了描述。但是，这些实施例仅仅是为了说明的目的，而并非为了限制本公开的范围。尽管在以上分别描述了各实施例，但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围，本领域技术人员可以做出多种替代和修改，这些替代和修改都应落在本公开的范围之内。

Claims

一种图像处理方法，包括：

利用多个样本人脸图像，构建初始三维人脸模板；

利用目标对象的人脸图像对所述初始三维人脸模板进行迭代优化，得到目标三维人脸模板；以及

根据所述目标对象的当前时刻人脸图像与所述目标三维人脸模板的对应关系，确定所述目标对象的当前时刻人脸位姿。
根据权利要求1所述的图像处理方法，其中，所述利用多个样本人脸图像，构建初始三维人脸模板，包括：

分别从多个样本人脸图像的每个样本人脸图像中获取多个三维样本关键点；

根据所述多个样本人脸图像的多个三维样本关键点，确定平均三维人脸模板；

利用所述平均三维人脸模板，确定所述多个人脸样本图像的特征矩阵；以及

根据迭代参数、所述平均三维人脸模板和所述特征矩阵，构建初始三维人脸模板。
根据权利要求2所述的图像处理方法，其中，所述利用所述平均三维人脸模板，确定所述多个人脸样本图像的特征矩阵，包括：

利用所述平均三维人脸模板，对所述多个样本人脸图像的多个三维样本关键点进行去中心化处理，得到协方差矩阵；

计算所述协方差矩阵的多个特征值和与所述多个特征值对应的多个特征向量；

根据所述多个特征值在所述协方差矩阵中对线性投影的贡献值，从所述多个特征向量中确定的多个有效特征向量，所述多个有效特征向量对应的多个特征值的贡献值之和大于预设贡献值；以及

根据所述多个有效特征向量，构建所述特征矩阵。
根据权利要求1所述的图像处理方法，其中，所述利用目标对象的人脸图像对所述初始三维人脸模板进行迭代优化，得到目标三维人脸模板，包括：

从所述目标对象的人脸图像中获取多个二维目标关键点；

从所述初始三维人脸模板中确定多个三维关键点；

将所述多个三维关键点投影为多个二维投影关键点；

计算所述多个二维投影关键点与所述多个二维目标关键点的平均误差；以及

根据所述平均误差，对所述初始三维人脸模板进行迭代优化，得到所述目标三维人脸模板。
根据权利要求4所述的图像处理方法，其中，所述将所述多个三维关键点投影为多个二维投影关键点，包括：

根据所述三维关键点的坐标值、缩放尺度、坐标系旋转矩阵和像素坐标系的中心点偏移向量，构建弱透视投影模型；以及

通过所述弱透视投影模型，将所述多个三维关键点投影为多个二维投影关键点。
根据权利要求5所述的图像处理方法，其中，所述弱透视投影模型包括根据以下公式来将所述多个三维关键点投影为多个二维投影关键点：

其中，x和y分别为二维投影关键点在像素坐标系的x轴和y轴的坐标值，X、Y和Z分别为三维关键点在目标对象所在坐标系的x轴、y轴和z轴的坐标值，scale为缩放尺度，
为目标对象所在坐标系相对于相机坐标系的旋转矩阵，t _x和t _y分别为所述像素坐标系原点相对于所述相机坐标系原点在x轴和y轴的偏移向量。
根据权利要求5所述的图像处理方法，其中，所述根据所述平均误差，对所述初始三维人脸模板进行迭代优化，得到目标三维人脸模板，包括：

根据所述弱透视投影模型和迭代参数，构建迭代模型；

确定所述迭代模型与多个二维投影关键点之间的映射函数；

计算所述映射函数的雅克比矩阵，得到迭代优化后的二维迭代关键点；

根据所述二维迭代关键点和来自所述人脸图像的多个二维目标关键点，计算平均误差；

在确定所述平均误差不满足收敛条件的情况下，沿着所述雅克比矩阵的下降梯度方向，对所述迭代模型的参数进行更新，得到更新后的迭代模型，并返回所述确定所述迭代模型与多个二维投影关键点之间的映射函数的操作；以及

在确定所述平均误差满足收敛条件的情况下，确定迭代参数，并根据所述迭代参数构建目标三维人脸模板。
根据权利要求7所述的图像处理方法，其中，所述映射函数包括以下公式：

其中，
为多个二维投影关键点的坐标值矩阵，
为迭代模型，scale为缩放尺度，R _x、R _y、R _z为目标对象所在坐标系相对于相机坐标系的旋转量，t _x和t _y分别为像素坐标系原点相对于所述相机坐标系原点在x轴和y轴的偏移向量，params为迭代参数。
根据权利要求7所述的图像处理方法，其中，所述沿着所述雅克比矩阵的下降梯度方向，对所述迭代模型的参数进行更新，得到更新后的迭代模型包括：

根据所述雅克比矩阵的下降梯度方向和所述平均误差，计算所述迭代模型的参数变化量；以及

根据所述参数变化量，更新所述迭代模型的参数，得到更新后的迭代模型。
根据权利要求9所述的图像处理方法，其中，所述根据所述参数变化量，更新所述迭代模型的参数，得到更新后的迭代模型包括根据以下公式更新迭代模型：

其中，
为更新后的迭代模型，
为更新前的迭代模型，delta为参数变化量。
根据权利要求4所述的图像处理方法，其中，所述计算所述多个二维投影关键点与所述多个二维目标关键点的平均误差，包括：

根据所述多个二维投影关键点和所述多个二维目标关键点，计算重投影误差；以及

根据所述重投影误差，计算平均误差。
根据权利要求11所述的图像处理方法，其中，所述根据所述重投影误差，计算平均误差包括根据以下公式计算平均误差：

其中，error为平均误差，proj _err为重投影误差，proj _err＝landmarks_2D-current_shape_2D，其中landmarks_2D为二维目标关键点的坐标值，current_shape_2D为二维投影关键点的坐标值。
根据权利要求1所述的图像处理方法，其中，所述根据所述目标对象的当前时刻人脸图像与所述目标三维人脸模板的对应关系，确定所述目标对象的当前时刻人脸位姿，包括：

从所述目标三维人脸模板的多个三维关键点中确定所述目标对象的多个预设三维关键点，所述多个预设三维关键点处于目标坐标系，所述多个预设三维关键点与所述目标对象的当前人脸图像的多个指定二维关键点对应；

根据来自相机的所述人脸图像所处的像素坐标系和所述目标坐标系之间的对应关系，确定相机坐标系与所述目标坐标系之间的变换矩阵；

根据所述变换矩阵，将所述多个预设三维关键点转换成多个目标三维关键点，所述多个目标三维关键点处于所述相机坐标系；以及

根据所述多个目标三维关键点，确定所述目标对象的当前时刻人脸位姿。
根据权利要求13所述的图像处理方法，其中，所述根据所述人脸图像所处的像素坐标系和所述目标坐标系之间的对应关系，确定相机坐标系与所述目标坐标系之间的变换矩阵，包括根据以下公式确定变换矩阵：

其中，c为所述相机的尺度，x和y分别为二维投影关键点在所述像素坐标系的x轴和y轴的坐标值，X、Y和Z分别为预设三维关键点在所述目标坐标系的x轴、y轴和z轴的坐标值，K为所述相机内参矩阵，
为变换矩阵。
根据权利要求4所述的图像处理方法，其中，所述从所述目标对象的人脸图像中获取多个二维目标关键点，包括：

对所述人脸图像进行畸变校正，得到校正后人脸图像；以及

利用关键点检测算法，从所述校正后人脸图像中确定多个二维目标关键点。
根据权利要求15所述的图像处理方法，其中，所述对所述人脸图像进行畸变校正，得到校正后人脸图像，包括：

根据以下公式来对所述人脸图像进行畸变校正：

其中，x ₀和y ₀为所述人脸图像上的任意一坐标点在x轴和y轴的坐标值，x和y为所述校正后人脸图像上的任意一坐标点在x轴和y轴的坐标值，r为所述人脸图像的中心点与坐标点(x，y)的距离，k ₁、k ₂和k ₃为径向畸变系数，p ₁和p ₂为切向畸变系数。
一种图像处理装置，包括：

构建模块，用于利用多个样本人脸图像，构建初始三维人脸模板；

迭代模块，用于利用目标对象的人脸图像对所述初始三维人脸模板进行迭代优化，得到目标三维人脸模板；以及

确定模块，用于根据所述目标对象的当前时刻人脸图像与所述目标三维人脸模板的对应关系，确定所述目标对象的当前时刻人脸位姿。
一种交互设备，包括：

相机，用于获取目标对象的人脸图像；

处理器，与所述相机电连接，用于：

利用所述人脸图像对初始三维人脸模板进行迭代优化，得到目标三维人脸模板；

利用所述目标三维人脸模板进行人脸位姿估计，得到所述目标对象的瞳孔坐标；以及

根据所述瞳孔坐标，计算光栅开合序列；

驱动电路，与所述处理器电连接，用于控制输出接口输出所述光栅开合序列；以及

屏幕，与所述驱动电路电连接，用于根据所述光栅开合序列控制屏幕中光栅的开合。
一种电子设备，包括：

一个或多个处理器；

存储器，用于存储一个或多个程序，

其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现权利要求1至16中任一项所述的方法。
一种计算机可读存储介质，其上存储有可执行指令，该指令被处理器执行时使处理器实现权利要求1至16中任一项所述的方法。
一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现权利要求1至16中任一项所述的方法。