WO2022247527A1

WO2022247527A1 - 驾驶员头部动作的确定方法、存储介质、电子装置

Info

Publication number: WO2022247527A1
Application number: PCT/CN2022/087552
Authority: WO
Inventors: 叶剑; 张铁监; 汪洋
Original assignee: 多伦科技股份有限公司
Priority date: 2021-05-28
Filing date: 2022-04-19
Publication date: 2022-12-01
Also published as: CN113239861A; CN113239861B

Abstract

一种驾驶员头部动作的确定方法、存储介质、电子装置，所述方法包括：对包含驾驶员头部姿态的图像数据进行预处理，得到连续帧图像（S102）；从连续帧图像中提取驾驶员头部姿态的移动特征（S104）；根据移动特征确定驾驶员头部姿态的偏航角（S106）；根据偏航角的大小确定所述驾驶员的头部动作（S108）。

Description

驾驶员头部动作的确定方法、存储介质、电子装置

技术领域

本申请涉及数据处理技术领域，具体而言，涉及一种驾驶员头部动作的确定方法、存储介质、电子装置。

背景技术

近年来驾驶员行为监控预警技术已成为智能交通领域研究的重点之一，不仅成为辅助安全驾驶的标配，也是机动车驾驶考试领域研究的重点。每年都会有大量的学员通过驾驶员专业技能的培训并最终通过考核拿到驾照。

现阶段的机动车驾驶员技能考试采用的是计算机评判和考官人工评判相结合的方式。目前仅实现了部分考试项目的计算机自动考核评分，还有部分考试项目仍需人工评判。如：在驾驶考试学员上车考试的过程中，需要考官人工评判学员有没有观看左右后视镜等。由于涉及到人工评判，导致机动车驾驶考试行业中会出现不公平、不公正的行为。

针对相关技术中，无法准确识别机动车驾驶员的头部姿态的问题，目前尚未有有效的解决办法。

发明内容

本申请实施例提供了一种驾驶员头部动作的确定方法、存储介质、电子装置，以至少解决相关技术中无法准确识别机动车驾驶员的头部姿态的问题。

在本申请的一个实施例中，提出了一种驾驶员头部动作的确定方法，包括：对包含驾驶员头部姿态的图像数据进行预处理，得到连续帧图像；从所述连续帧图像中提取所述驾驶员头部姿态的移动特征；根据所述移动特征确定所述驾驶员头部姿态的偏航角；根据所述偏航角的大小确定所述驾驶员的头部动作。

在一实施例中，在对包含驾驶员头部姿态的图像数据进行预处理之前，所述方法还包括：通过摄像头实时采集包含所述驾驶员头部姿态的所述图像数据；将所述图像数据上传至待处理队列。

在一实施例中，在对包含驾驶员头部姿态的图像数据进行预处理，得到连续帧图像之后，所述方法还包括：对所述连续帧图像进行归一化处理，使用目标检测算法对所述连续帧图像中的头部区域进行感兴趣区域的提取。

在一实施例中，所述从所述连续帧图像中提取所述驾驶员头部姿态的移动特征，包括：从所述感兴趣区域中提取所述驾驶员头部姿态的移动特征。

在一实施例中，所述根据所述移动特征确定所述驾驶员头部姿态的偏航角，包括：将包含所述感兴趣区域的图像缩放至预设尺寸；所述预设尺寸的图像输入头部姿态提取网络中，其中，所述头部姿态提取网络包括主干网络和附属网络；通过所述主干网络提取所述驾驶员头部姿态的移动特征，得到人脸关键点特征向量；根据所述人脸关键点特征向量，通过所述附属网络计算所述驾驶员头部姿态的偏航角。

在一实施例中，所述头部姿态提取网络的训练方法包括：根据所述人脸关键点特征向量建立二维UV位置映射图及其对应的UV纹理映射图，其中，所述UV纹理映射图中包含人脸UV纹理映射图和口罩UV纹理映射图；将所述人脸UV纹理映射图乘以所述口罩UV纹理映射图，得到目标UV纹理映射图；将所述目标UV纹理映射图进行重映射得到带有口罩的人脸图像；使用所述带有口罩的人脸图像训练所述头部姿态提取网络。

在一实施例中，所述头部姿态提取网络的训练方法还包括：根据所述主干网络和所述附属网络输出的特征，结合样本数据的标注真实值计算所述头部姿态提取网络的损失值；根据所述损失值优化所述头部姿态提取网络的训练参数。

在一实施例中，所述根据所述偏航角确定所述驾驶员的头部动作，包括：在所述偏航角大于或等于预设阈值时，确定所述驾驶员的头部发生转动动作，其中，所述转动动作包括以下至少之一：向左转动、向右转动、向下转动、向上转动。

在本申请的一个实施例中，还提出了一种计算机可读的存储介质，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

在本申请的一个实施例中，还提出了一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

通过本申请实施例提供的驾驶员头部动作的确定方法，对包含驾驶员头部姿态的图像数据进行预处理，得到连续帧图像；从连续帧图像中提取驾驶员头部姿态的移动特征；根据移动特征，通过神经网络模型确定驾驶员头部姿态的偏航角；根据偏航角的大小确定驾驶员的头部动作。解决了相关技术中无法准确识别机动车驾驶员的头部姿态的问题。通过本申请提供的方法，可以通过计算机进行机器识别驾驶员的头部动作，同时结合神经网络模型的深度学习和训练，可以使得识别过程更加精确。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例的一种可选的驾驶员头部动作的确定方法的流程图；

图2是根据本申请实施例的一种可选的驾驶员头部图像的移动特征的训练原理图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本申请。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

本申请实施例提供了一种驾驶员头部动作的确定方法。图1是根据本申请实施例的一种可选的驾驶员头部动作的确定方法的流程图，如图1所示，所述方法包括：

步骤S102，对包含驾驶员头部姿态的图像数据进行预处理，得到连续帧图像；

步骤S104，从连续帧图像中提取驾驶员头部姿态的移动特征；

步骤S106，根据移动特征确定驾驶员头部姿态的偏航角；

步骤S108，根据偏航角的大小确定驾驶员的头部动作。

通过上述方法，解决了相关技术中无法准确识别机动车驾驶员的头部姿态的问题。可以通过计算机进行机器识别驾驶员的头部动作，同时结合神经网络模型的深度学习和训练，可以使得识别过程更加精确，克服了驾驶员考试过程中采用人工评判带来的不足。

在一实施例中，在对包含驾驶员头部姿态的图像数据进行预处理之前，所述方法还包括：通过摄像头实时采集包含驾驶员头部姿态的图像数据；将图像数据上传至待处理队列。

需要说明的是，上述摄像头可以是安装在车辆内的视频RGB摄像头，主要是针对主驾驶位驾驶员的头部动作图像进行实时采集，并将采集到的图像数据传至队列中。

在一实施例中，在对包含驾驶员头部姿态的图像数据进行预处理，得到连续帧图像之后，所述方法还包括：对连续帧图像进行归一化处理，使用目标检测算法对连续帧图像中的头部区域进行感兴趣区域的提取。

在一实施例中，从连续帧图像中提取驾驶员头部姿态的移动特征，包括：从感兴趣区域中提取驾驶员头部姿态的移动特征。

在一实施例中，根据移动特征确定驾驶员头部姿态的偏航角，包括：将包含感兴趣区域的图像缩放至预设尺寸；预设尺寸的图像输入头部姿态提取网络中，其中，头部姿态提取网络包括主干网络和附属网络，通过所述主干网络提取驾驶员头部姿态的移动特征，得到人脸关键点特征向量；根据人脸关键点特征向量，通过附属网络计算驾驶员头部姿态的偏航角。

需要说明的是，本申请实施例中涉及的预设尺寸，可以是根据实践需要设置的任意尺寸，例如本申请实施例中以112*122的固定尺寸为例进行解释说明，该预设尺寸也可以设为114*144或其他任意尺寸，本申请实施例对此不做限定。

关于上述确定偏航角的过程，可以通过以下示例中所述的步骤实现。将感兴趣区域放缩到固定的112*122尺寸大小，将固定尺寸图片放入到头部姿态提取网络中，头部姿态提取网络具体为：设置两个主干网络，分别为主干网络1，backbone 1和主干网络2，backbone2。主干网络1采用resnet18的前6层网络用于提取图像特征；附属网络Auxiliary采用多层Conv+BN+Act算子融合，用于计算头部姿态的偏航角。主干网络backbone1连接的主干网络backbone2采用resenet18的后两层，其用于提取人脸关键点特征向量，本示例中人脸关键点特征向量为一维的1*136向量。采用18层的卷积神经网络结构resnet18可以使得计算量比较小，方便快速计算出驾驶员头部姿态的偏航角。人脸关键点特征向量也可以是二维或多维向量，本申请实施例对此不做限定。

根据上述得到的一维1*136人脸关键点特征向量得出二维2*68坐标，已知视频RGB摄像头的内在参数，(U，V，W)代表世界坐标系中的三维点的位置，R和t分别代表相对相机坐标系中的世界坐标系的旋转矩阵和平移向量，由公式(1)计算相机坐标系中点的坐标(X，Y，Z)；

公式(1)等价形式如下：

由上述等式可知，根据目标在三维世界坐标系中的14个点的坐标和对应投射到二维图像坐标系中的点集之间的变换关系矩阵进行求解得到旋转矩阵R和平移向量t，假设不存在径向畸变的情况下，图像坐标系中的任意一点p坐标(x，y)的计算为公式(3)：

式中，f _x，f _y分别为在x，y方向上的焦距长度；c _x，c _y分别为光学中心；s为缩放因子，采用直接线性变化方法进行求解得到驾驶员头部姿态的偏航角。

在一实施例中，头部姿态提取网络的训练方法包括：根据人脸关键点特征向量建立二维UV位置映射图及其对应的UV纹理映射图，其中，UV纹理映射图中包含人脸UV纹理映射图和口罩UV纹理映射图；将人脸UV纹理映射图乘以口罩UV纹理映射图，得到目标UV纹理映射图；将目标UV纹理映射图进行重映射得到带有口罩的人脸图像；使用带有口罩的人脸图像训练头部姿态提取网络。

在一实施例中，头部姿态提取网络的训练方法还包括：根据主干网络和附属网络输出的特征，结合样本数据的标注真实值计算头部姿态提取网络的损失值；根据损失值优化头部姿态提取网络的训练参数。头部姿态提取网络可以包括主干网络和附属网络，头部姿态提取网络是使用样本数据训练得到的卷积神经网络结构，样本数据包括样本图像以及样本图像中的头部姿态对应的偏航角。

进一步地，结合上述示例，在训练头部姿态提取网络的时候，可以结合口罩的纹理映射图进行训练，使得头部姿态提取网络可以识别戴口罩的驾驶员的头部动作。例如，可以输入68个人脸关键点信息进入三维人脸重建PRNet网络得到UV位置映射图和相应的UV纹理映射图；人脸UV纹理映射图乘以口罩的UV纹理映射图，以得到的新UV纹理映射图；将得到的新UV纹理映射图与人脸UV纹理映射图进行重映射来得到带有口罩的人脸图像，并将得到带有口罩的人脸图像加入头部姿态提取网络进行训练。

图2是根据本申请实施例的一种可选的驾驶员头部图像的移动特征的训练原理图，如图2所示，训练的过程中，在图像预处理部分，保证图像中人脸区域坐标和关键点坐标一致性变换下，加入旋转、仿射、颜色通道、颜色空间的变换。为了解决数据不平衡的问题，在计算头部姿态提取网络后根据样本的分布，对偏差较大的样本(groud truth)乘以惩罚项权重(weight)；最后根据主干网络backbone2及附属网络Auxiliary的特征结合样本关键点的标注真实值计算损失值(compute loss)。

在一实施例中，根据偏航角确定驾驶员的头部动作，包括：在偏航角大于或等于预设阈值时，确定驾驶员的头部发生转动动作，其中，转动动作包括以下至少之一：向左转动、向右转动、向下转动、向上转动。

向左转动时应用于驾驶员是否观察左后视镜的判断，向右转动时应用于驾驶员是否观察右后视镜判断，上述两种情况的偏航角阈值一般设置在20-30度，根据驾驶考试的实际环境设定；在判断驾驶员是否发生左右转头动作具体为：在规定时间内，偏航角的实际值是否大于或等于所设定的偏航角阈值，若是则认定为驾驶员发出转头动作；否则认定为驾驶员未发出转头动作。

示例中，驾驶考试车辆行驶前，判断驾驶员是否有发出观看左后视镜动作具体为：预先设定偏航角阈值为25度，且角度为正数表示向右，角度为负数表示向左；实时获取驾驶员头部姿态的偏航角信息，若偏航角为-25度，且考试车辆在5s时间内开始行驶，则认定为驾驶员已发出行驶前的观察左后视镜动作。

本申请实施例的方法通过采集驾驶员在驾驶考试过程中的视觉图像数据，对人脸数据标注68个关键点，对驾驶员头部视觉图像数据进行深度学习，抽取驾驶员头部姿态1*136特征向量，由该特征向量计算偏航角，进而通过连续帧图像来判别驾驶员头部动作。

本申请实施例的方法中通过网络训练过程，实现对数据进行增强，能够在驾驶过程中对驾驶人员的头部动作进行精准识别，有效地应用于驾驶考试各项目中并作为评判依据。此外，本申请实施例的方法中加入了口罩人脸数据进行训练，进一步地提高了检测识别精度，且易于实现。

可选地，在本实施例中，本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(Random Access Memory，RAM)、磁盘或光盘等。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在上述计算机可读取的存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在存储介质中，包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。

在本申请的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的客户端，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述仅是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

一种驾驶员头部动作的确定方法，其特征在于，包括：

对包含驾驶员头部姿态的图像数据进行预处理，得到连续帧图像；

从所述连续帧图像中提取所述驾驶员头部姿态的移动特征；

根据所述移动特征确定所述驾驶员头部姿态的偏航角；

根据所述偏航角的大小确定所述驾驶员的头部动作。
根据权利要求1所述的方法，其特征在于，在对包含驾驶员头部姿态的图像数据进行预处理之前，所述方法还包括：

通过摄像头实时采集包含所述驾驶员头部姿态的所述图像数据；

将所述图像数据上传至待处理队列。
根据权利要求1所述的方法，其特征在于，在对包含驾驶员头部姿态的图像数据进行预处理，得到连续帧图像之后，所述方法还包括：

对所述连续帧图像进行归一化处理，使用目标检测算法对所述连续帧图像中的头部区域进行感兴趣区域的提取。
根据权利要求3所述的方法，其特征在于，所述从所述连续帧图像中提取所述驾驶员头部姿态的移动特征，包括：

从所述感兴趣区域中提取所述驾驶员头部姿态的移动特征。
根据权利要求4所述的方法，其特征在于，所述根据所述移动特征确定所述驾驶员头部姿态的偏航角，包括：

将包含所述感兴趣区域的图像缩放至预设尺寸；

将所述预设尺寸的图像输入头部姿态提取网络中，其中，所述头部姿态提取网络包括主干网络和附属网络；

通过所述主干网络提取所述驾驶员头部姿态的移动特征，得到人脸关键点特征向量；

根据所述人脸关键点特征向量，通过所述附属网络计算所述驾驶员头部姿态的偏航角。
根据权利要求5所述的方法，其特征在于，所述头部姿态提取网络的训练方法包括：

根据所述人脸关键点特征向量建立二维UV位置映射图及其对应的UV纹理映射图，其中，所述UV纹理映射图中包含人脸UV纹理映射图和口罩UV纹理映射图；

将所述人脸UV纹理映射图乘以所述口罩UV纹理映射图，得到目标UV纹理映射图；

将所述目标UV纹理映射图进行重映射得到带有口罩的人脸图像；

使用所述带有口罩的人脸图像训练所述头部姿态提取网络。
根据权利要求6所述的方法，其特征在于，所述头部姿态提取网络的训练方法还包括：

根据所述主干网络和所述附属网络输出的特征，结合样本数据的标注真实值计算所述头部姿态提取网络的损失值；

根据所述损失值优化所述头部姿态提取网络的训练参数。
根据权利要求1至7任一项所述的方法，其特征在于，所述根据所述偏航角确定所述驾驶员的头部动作，包括：

在所述偏航角大于或等于预设阈值时，确定所述驾驶员的头部发生转动动作，其中，所述转动动作包括以下至少之一：向左转动、向右转动、向下转动、向上转动。
一种计算机可读的存储介质，其特征在于，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行权利要求1至8任一项中所述的方法。
一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行权利要求1至8任一项中所述的方法。