CN116758617B

CN116758617B - 一种低光照度场景下的校园学生签到方法和校园签到***

Info

Publication number: CN116758617B
Application number: CN202311027739.7A
Authority: CN
Inventors: 肖芸; 李武; 云贵全
Original assignee: Sichuan Information Technology College
Current assignee: Sichuan Information Technology College
Priority date: 2023-08-16
Filing date: 2023-08-16
Publication date: 2023-11-10
Anticipated expiration: 2043-08-16
Also published as: CN116758617A

Abstract

本发明提供了一种低光照度场景下的校园学生签到方法和校园签到***。签到方法包括以下步骤：利用自校准技术对校园人脸图像进行低光照度增强；利用转换器神经网络模型创建人脸签到编码器并对图像进行编码；利用梯度反转技术对编码器进行多尺度局部特征对齐和多尺度全局特征对齐；利用转换器神经网络模型创建解码器并实现低光照度检测头；使用无监督域自适应技术训练并保存模型，得到低光照度场景下的人脸签到结果。签到***包括处理单元、编码单元、对齐单元和识别单元，以实现上述签到方法。本发明可以通过无监督自适应有效地检测低照度图像中的对象，显著降低模型对样本的依赖性。能够对齐图像的整体属性，从而减少特征偏差。

Description

一种低光照度场景下的校园学生签到方法和校园签到***

技术领域

本发明涉及人脸识别签到技术领域，具体而言，涉及一种低光照度场景下的校园学生签到方法和校园签到***。

背景技术

人脸识别签到是计算机视觉的一项基础任务，广泛应用于人脸签到、自动驾驶和场景理解等工业场景。尽管弱光环境是日常活动不可或缺的一部分，但低光照环境对计算机视觉构成了重大挑战。通常，在夜间或者雾天期间获得的图像具有低对比度、低亮度、噪声和因光线不足而产生的模糊等特点。这样的图像直接降低了现有人脸签到模型的性能，导致了显著的检测误差。尽管人脸识别领域取得了重大突破，但现有的研究涉及明亮的图像，而不是弱光。因此，适用于低照度图像的校园人脸签到方法对于人工智能在校园中的应用至关重要。目前低照度场景下的人脸识别***主要有：（1）基于图像增强的检测方法。为了在夜间或阴天等不利条件下获得可靠的检测，必须满足低照度图像增强的要求。这种方法需要对低照度图像进行预处理，以提高亮度和对比度，然后检测增强的图像。（2）基于端到端检测的方法。这一类别使用监督学习来建立检测模型，并且需要大量带注释的训练数据，收集这些数据既昂贵又耗时。（3）基于无监督领域的自适应检测方法。使用标记的数据集作为源域，使用未标记的数据集中作为目标域，有助于模型在域或类别级别上学习域不变特征表示。在没有标签或标签很少的正常照明数据集的情况下，该方法可以将从正常照明数据学习的特征应用于低照明图像检测。

发明内容

本发明旨在至少解决现有技术中存在的以下技术问题之一：

（1）无法处理低光照度场景。在现有的校园人脸签到***中，在雾天、夜间获得的图像具有低对比度、低亮度、噪声和因光线不足而产生的模糊等特点。这样的图像直接降低了现有对象检测模型的性能，导致了显著的检测误差。

（2）图像全局特征损失。意味着具有正常照明的源域图像和具有低照明的目标域图像的分布可能无法使用对抗性损失在全局图像级别上精确匹配，因为这两个域具有不同的场景布局和对象组合。

（3）图像局部特征丢失。是指完全匹配局部特征，例如具有正常照明的源域图像和具有低照明的目标域图像的纹理和颜色，这可能会因为两个图像的类级语义的偏差而失败。在目前的大多数方法中，研究人员只关注使用局部或全局特征对齐。

为此，本发明第一方面提供了一种低光照度场景下的校园学生签到方法。

本发明第二方面提供了一种校园签到***。

本发明提供了一种低光照度场景下的校园学生签到方法，包括以下步骤：

S1、利用自校准技术对校园人脸图像进行低光照度增强；

S2、利用转换器神经网络模型创建人脸签到编码器并对图像进行编码；

S3、利用梯度反转技术对编码器进行多尺度局部特征对齐和多尺度全局特征对齐；

S4、利用转换器神经网络模型创建解码器并实现低光照度检测头；

S5、使用无监督域自适应技术训练并保存模型，得到低光照度场景下的人脸签到结果。

根据本发明上述技术方案的一种低光照度场景下的校园学生签到方法，还可以具有以下附加技术特征：

在上述技术方案中，步骤S1包括：

S11、建立低光照度人脸识别数据集，抽取至少部分低光照度人脸识别数据集中的数据作为源域数据集，将低光照度人脸识别数据集中的剩余数据作为目标域数据集；

S12、使用同态滤波模型对源域数据集中的图像进行微光图像增强，学习低照度图像和期望的清晰图像之间的照度关系，在图像增强的同时进行照度估计，并通过去除所估计的照度获取增强后的输出亮度，再根据同态滤波理论建立照度学习关系式；

S13、对照度关系进行自校准；首先，定义自校准模块，使微光图像增强过程中每个阶段收敛到同一个状态；将每个前一阶段的输入定义为低光观察，桥接每个阶段的输入；然后，引入自校准映射并将其添加到低光观察中，在每个阶段中的输入和第一阶段之间呈现照度差异；最后，形成自校准模型。

在上述技术方案中，步骤S1还包括：

S14、训练自校准模型；采用无监督学习来增强网络学习能力，其中，将保真度定义为自校准模型的总损失。

在上述技术方案中，步骤S2包括：

S21、创建人脸签到编码器；所述编码器是基于转换器神经网络的双向编码结构，所述编码器包括多头注意力和前馈神经网络；

S22、将源域数据集中的图像划分为多个图像块；

S23、将每个图像块输入至人脸签到编码器进行向量计算，获得人脸图像多头注意力向量，创建多头注意力矩阵计算人脸图像多头注意力向量的注意力得分；

S24、将注意力得分进行归一化处理，得到归一化处理后的注意力得分；

S25、将经过归一化处理后的注意力得分输入到前馈神经网络FFN中进行线性变换，得到低照度人脸图像的浅层人脸图像特征向量。

在上述技术方案中，步骤S3中，所述进行多尺度局部特征对齐包括：

S31、将低照度人脸图像的浅层人脸图像特征向量送入到梯度反转层GRL中，并使用对抗性学习策略来减少前向传播过程中多尺度局部特征对齐模块的损失，而在反向传播过程中，梯度反转层GRL将输入误差乘以负标量以增加多尺度局部特征对齐模块损失，从而减少源域数据集和目标域数据集的低级特征差异；

S32、将S31生成的特征图馈送到不同通道大小的多个卷积层中；

S33、将经S32处理的特征图输入到相应的领域分类层中，并使用最小二乘法训练多尺度局部特征对齐模块的损失函数，所述多尺度局部特征对齐模块的损失函数包括源域数据集的局部特征对准损失和目标域数据集的局部特征对准损失。

在上述技术方案中，步骤S3中，所述多尺度全局特征对齐包括

S34、将进行了多尺度局部特征对齐后的输出向量送入到梯度反转层GRL中，使用对抗性学习策略，其中梯度反转层GRL在前向传播期间最小化多尺度全局特征对齐模块的损失，并通过在后向传播期间将输入误差乘以负标量来最大化多尺度全局特征对齐模块损失，从而减少源域数据集和目标域数据集之间的低级特征差异；

S35、将S34生成的特征图馈送到不同通道大小的多个卷积层中；

S36、将经S35处理的特征图输入到领域分类层中，使得域分类器无法区分特征来自源域数据集还是目标域数据集，并使用最小二乘法训练多尺度全局特征对齐模块的损失函数，所述多尺度全局特征对齐模块的损失函数包括源域数据集的全局特征对准损失和目标域数据集的全局特征对准损失。

在上述技术方案中，步骤S4包括：

S41、创建人脸签到解码器；所述解码器是基于转换器神经网络的双向编码结构；所述解码器包括多头注意力和前馈神经网络；

S42、将步骤S3获取到的特征向量送入到解码器中；

S43、遍历解码器，实现人脸检测头网络；

S44、创建人脸签到检测头网络，通过训练全连接神经网络，得到权重向量和偏差项；根据检测网络的预测结果，利用交叉熵损失函数计算人脸识别效果损失估计。

在上述技术方案中，步骤S43包括：

S431、依次遍历每一个解码器层以获得注意力得分；

S432、创建多头注意力矩阵，多头注意力矩阵包括查询矩阵、键矩阵和值矩阵；

S433、根据多头注意力矩阵，计算注意力得分；

S434、将注意力得分进行归一化处理，得到归一化处理后的注意力得分；

S435、将归一化处理后的注意力得分输入到前馈神经网络中，通过前馈神经网络输出图像语义向量。

在上述技术方案中，步骤S5包括：

S51、无监督域自适应训练；首先，使用源域数据集对模型进行训练，训练完成后保存模型并设定为源域；然后，将模型的学习到的知识进行迁移到目标域数据集并设定为目标域；最后，使用目标域数据集对模型进行测试；

S52、识别人脸签到；利用全连接神经网络对步骤S51模型的输出向量进行分类与回归处理，得到人脸识别的检测结果。

本发明还提供了一种校园签到***，采用如上述技术方案中任一项所述的方法实现低光照度场景下的校园学生签到，包括：

处理单元, 利用自校准技术对校园人脸图像进行低光照度增强，建立校园人脸图像数据预处理模块；

编码单元，利用转换器神经网络模型创建人脸签到编码器并对图像进行编码，建立校园人脸编码单元；

对齐单元，利用梯度反转技术对编码器进行多尺度局部特征对齐和多尺度全局特征对齐，建立校园人脸对齐单元；

识别单元，利用转换器神经网络模型创建解码器并实现低光照度检测头，使用无监督域自适应技术训练并保存模型，得到低光照度场景下的人脸签到结果。

综上所述，由于采用了上述技术特征，本发明的有益效果是：

（1）本发明通过使用正常照明图像作为源域和使用低照明图像作为目标域来改进通用对象检测网络。本发明可以通过无监督自适应有效地检测低照度图像中的对象，显著降低模型对样本的依赖性。

（2）本发明开发了一种新的域自适应多尺度局部特征对齐模块和多尺度全局特征对齐模块，该模块对特征图执行多尺度局部特性对齐，以对齐特征图中的感知场，从而减少低水平特征偏差。对特征图进行多尺度全局（图像级）特征对齐，以对齐图像的整体属性，从而减少背景、场景和目标布局等特征偏差。

（3）基于与当前方法的综合评估和比较，本发明在低照度校园人脸签到中表现提高了其性能，证明了所提出的方法具有良好的泛化能力。

本发明的附加方面和优点将在下面的描述部分中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1为本发明一个实施例提供的一种低光照度场景下的校园学生签到方法的流程示意图；

图2为本发明一个实施例提供的一种校园签到***的结构框图。

其中，图1至图2中附图标记与部件名称之间的对应关系为：

210、处理单元；220、编码单元；230、对齐单元；240、识别单元。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其它不同于在此描述的方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

下面参照图1至图2来描述根据本发明一些实施例提供的一种低光照度场景下的校园学生签到方法和校园签到***。

本申请的一些实施例提供了一种低光照度场景下的校园学生签到方法。

如图1所示，本发明第一个实施例提出了一种低光照度场景下的校园学生签到方法，种低光照度场景下的校园学生签到方法，包括以下步骤：

S1、利用自校准技术对校园人脸图像进行低光照度增强；具体地，步骤S1包括：

S11、建立低光照度人脸识别数据集，抽取至少部分低光照度人脸识别数据集中的数据作为源域数据集，将低光照度人脸识别数据集中的剩余数据作为目标域数据集；在一个具体实施例中，抽取低照度人脸识别数据集中的前80%数据设定为源域数据集X_S; 然后，将低照度人脸识别数据集中剩余的20%数据抽取出来设定为目标域数据集X_T；最后，将目标域数据集X_T中的标签删除。

S12、使用同态滤波模型对源域数据集X_S中的图像进行微光图像增强，学习低照度图像和期望的清晰图像之间的照度关系，公式为：c，其中，a为期望的清晰图像，y为低照度图像，c为可调整光；然后，在图像增强的同时进行照度估计，并通过去除所估计的照度获取增强后的输出亮度，再根据同态滤波理论建立照度学习关系式；其中，引入一个参数θ来映射照度关系/>；则照度学习关系式F为：

其中，u^t表示第t阶段（t=0，…，T-1）的残差项，T为总阶段数，x^t表示第t阶段（t=0，…，T-1）的照度，y为低照度图像；其中，采用了权重共享机制，即在每个阶段中具有相同的架构H和权重θ。

S13、对照度关系进行自校准；首先，定义自校准模块，使微光图像增强过程中每个阶段收敛到同一个状态；将每个前一阶段的输入定义为低光观察，桥接每个阶段的输入；然后，引入自校准映射s和v，并将其添加到低光观察中，在每个阶段中的输入和第一阶段之间呈现照度差异，公式为：

其中，为生成的自校准模型；t≥1，z^t是每个阶段的清晰图像输入,v^t是每个阶段的转换输入，s^t是每个阶段的映射输入，K_θ是引入的参数化运算符，且可学习的参数。

最后，形成自校准模型，即转换为基本第t阶段的单位（t≥1）的照度学习关系式可以写成：

。

在一些实施例中，步骤S1还包括：

S14、训练自校准模型；考虑到现有训练方法的不准确性，采用无监督学习来增强网络学习能力，其中，将模型的总损失定义为L_f，L_f表示保真度，则有：

其中，d为预测的照度结果，e^t-1为校准的结果输出。

S2、利用转换器神经网络模型创建人脸签到编码器并对图像进行编码；具体地，步骤S2包括：

S21、创建人脸签到编码器；所述编码器是基于转换器神经网络的双向编码结构，在一个具体实施例中，编码器的数量为12个，每个所述编码器包括多头注意力和前馈神经网络；

S22、将源域数据集Xs中的图像划分为多个图像块；

S23、将每个图像块输入至人脸签到编码器进行向量计算，获得人脸图像多头注意力向量，创建多头注意力矩阵计算人脸图像多头注意力向量的注意力得分；计算方法如下：

multihead = Concat(head₁, …, head_h)×W_Q

其中，multihead表示图像多头注意力，Concat(•)表示图像注意力连接函数，head_i表示第i个图像注意力，h表示向量大小，W_Q表示权重向量，Q表示查询矩阵，Softmax(•)表示归一化函数，K^T表示转置后的键矩阵，V表示值矩阵；d_k表示键矩阵的维度。

S24、将注意力得分进行归一化处理，得到归一化处理后的注意力得分，方法为：

M=U+Sublayer(U)

其中，M表示经过残差连接后的注意力得分向量，U表示人脸图像注意力，Sublayer(•)表示残差连接。

S25、将经过归一化处理后的注意力得分向量M输入到前馈神经网络FFN中进行线性变换，得到低照度人脸图像的浅层人脸图像特征向量。具体地，采用以下公式：

FFN(M) = Max(0, W₁+b₁)×W₂+b₂

其中，Max(•)表示神经元的激活函数，0表示激活函数的梯度，W₁表示第1层的权重，W₂表示第2层的权重，b₁表示第一层待学习的参数，b₂表示第二层待学习的参数。

S3、利用梯度反转技术对编码器进行多尺度局部特征对齐和多尺度全局特征对齐；具体地，步骤S3中，所述进行多尺度局部特征对齐包括：

S31、将低照度人脸图像的浅层人脸图像特征向量送入到梯度反转层GRL中，并使用对抗性学习策略来最大限度地减少前向传播过程中多尺度局部特征对齐模块的损失，而在反向传播过程中，梯度反转层GRL将输入误差乘以负标量以最大限度地增加多尺度局部特征对齐模块损失，从而减少源域数据集和目标域数据集的低级特征差异；

S32、将S31生成的特征图馈送到不同通道大小的多个卷积层中，以提高特征提取网络获得的特征的域不变性；

S33、将经S32处理的特征图输入到相应的领域分类层DC中，并使用最小二乘法训练多尺度局部特征对齐模块的损失函数，所述多尺度局部特征对齐模块的损失函数包括源域数据集的局部特征对准损失和目标域数据集的局部特征对准损失。计算方法如下：

其中和/>是源域和目标域中的局部特征对齐损失，/>是源域输入的第i个图像，/>是目标域输入的第i个图像，/>是第j个多尺度局部特征提取器，/>是第j个多尺度域分类器层的输出，W和H分别是特征图的宽度和高度，w和h为代表特征图的宽度和高度取值的参数，/>和/>分别是正常照明图像的总数和低照明图像的总量。

步骤S3中，所述多尺度全局特征对齐包括

S36、将经S35处理的特征图输入到领域分类层DC中，使得域分类器无法区分特征来自源域数据集还是目标域数据集，从而提高生成网络的域不变性；并使用最小二乘法训练多尺度全局特征对齐模块的损失函数，所述多尺度全局特征对齐模块的损失函数包括源域数据集的全局特征对准损失和目标域数据集的全局特征对准损失：

其中，是源域输入的第i个图像，/>是目标域输入的第i个图像，/>是第j个多尺度全局特征提取器，/>是第j个多尺度域分类层的输出，/>和/>分别是正常照明图像的总数和低照明图像的总量。

S4、利用转换器神经网络模型创建解码器并实现低光照度检测头；具体地，步骤S4包括：

S41、创建人脸签到解码器；所述解码器是基于转换器神经网络的双向编码结构；在一个具体实施例中，解码器的数量为12个，每个所述解码器包括多头注意力和前馈神经网络；

S42、将步骤S3获取到的特征向量送入到解码器中；

S43、遍历解码器，实现人脸检测头网络；具体包括以下步骤：

S431、依次遍历每一个解码器层以获得注意力得分；

S432、创建多头注意力矩阵，多头注意力矩阵包括查询矩阵Q、键矩阵K和值矩阵V；

S433、根据多头注意力矩阵，计算注意力得分；

S44、创建人脸签到检测头网络，通过训练全连接神经网络，得到权重向量和偏差项/>；对于全连接神经网络第一层的输入向量g，输入神经元数为768，输出神经元数为2；根据检测网络的预测结果，利用交叉熵损失函数计算人脸识别效果损失估计。其中，计算过程中使用的全连接网络的前向传播函数P、全连接网络的损失函数L_f1的公式如下：

其中，f为网络激活函数；g为人脸样本；S为样本的个数；为第i个样本的损失；/>表示样本i的标签，正值为1，负值为0；/>表示样本i被预测为正值的概率；N为类别个数。

S5、使用无监督域自适应技术训练并保存模型，得到低光照度场景下的人脸签到结果。具体地，步骤S5包括：

S51、无监督域自适应训练；首先，使用源域数据集对模型进行训练，训练完成后保存模型并设定为源域；然后，将模型的学习到的知识进行迁移到目标域数据集并设定为目标域；最后，使用目标域数据集对模型进行测试；无监督域自适应训练的公式为：

其中，为模型的最终输出向量，/>为在源域数据集中学习到的知识，/>为在目标域数据集上学习到的知识。

S52、识别人脸签到；利用全连接神经网络对步骤S51模型的输出向量进行分类与回归处理，得到人脸识别的检测结果。人脸识别分类Y的公式为：

Y = f(K)×X+h

其中，f(•)为网络激活函数，K表示权重矩阵，X为人脸图像语义表示向量，h为待学习的模型参数。

本发明第二个实施例提出了一种校园签到***，如图2所示，采用如上述实施例所述的方法实现低光照度场景下的校园学生签到，包括：

处理单元210, 利用自校准技术对校园人脸图像进行低光照度增强，建立校园人脸图像数据预处理模块；

编码单元220，利用转换器神经网络模型创建人脸签到编码器并对图像进行编码，建立校园人脸编码单元；

对齐单元230，利用梯度反转技术对编码器进行多尺度局部特征对齐和多尺度全局特征对齐，建立校园人脸对齐单元；

识别单元240，利用转换器神经网络模型创建解码器并实现低光照度检测头，使用无监督域自适应技术训练并保存模型，得到低光照度场景下的人脸签到结果。

在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或实例。而且，描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种低光照度场景下的校园学生签到方法，其特征在于，包括以下步骤：

S1、利用自校准技术对校园人脸图像进行低光照度增强；

S5、使用无监督域自适应技术训练并保存模型，得到低光照度场景下的人脸签到结果；

其中，步骤S1包括：

S13、对照度关系进行自校准；首先，定义自校准模块，使微光图像增强过程中每个阶段收敛到同一个状态；将每个前一阶段的输入定义为低光观察，桥接每个阶段的输入；然后，引入自校准映射并将其添加到低光观察中，在每个阶段中的输入和第一阶段之间呈现照度差异；最后，形成自校准模型；

S14、训练自校准模型；采用无监督学习来增强网络学习能力，其中，将保真度定义为自校准模型的总损失；

步骤S2包括：

S22、将源域数据集中的图像划分为多个图像块；

S25、将经过归一化处理后的注意力得分输入到前馈神经网络FFN中进行线性变换，得到低照度人脸图像的浅层人脸图像特征向量；

步骤S4包括：

S42、将步骤S3获取到的特征向量送入到解码器中；

S43、遍历解码器，实现人脸检测头网络；

S44、创建人脸签到检测头网络，通过训练全连接神经网络，得到权重向量和偏差项；根据检测网络的预测结果，利用交叉熵损失函数计算人脸识别效果损失估计；

步骤S43包括：

S431、依次遍历每一个解码器层以获得注意力得分；

S433、根据多头注意力矩阵，计算注意力得分；

2.根据权利要求1所述的一种低光照度场景下的校园学生签到方法，其特征在于，步骤S3中，所述进行多尺度局部特征对齐包括：

3.根据权利要求2所述的一种低光照度场景下的校园学生签到方法，其特征在于，步骤S3中，所述多尺度全局特征对齐包括

4.根据权利要求3所述的一种低光照度场景下的校园学生签到方法，其特征在于，步骤S5包括：

5.一种校园签到***，其特征在于，采用如权利要求1至4中任一项所述的方法实现低光照度场景下的校园学生签到，包括：